停机、人员配备正在给数据中心带来巨大挑战

译文 精选
服务器 数据中心
Uptime Institute 最新发布的报告称,数据中心运营商正在努力提高 IT 基础设施的可靠性,防止关键人才被挖走,并保持领先于环境法规。

在Uptime Institute最近发布一项调研中显示,数据中心正在努力提高其物理基础设施的弹性,并在竞争激烈的劳动力市场中招聘熟练的员工,避免日益昂贵的停机现象出现。与此同时,即使数据中心正在面临迫在眉睫的可持续性问题,仍旧有很多企业并没有跟踪数据中心的关键指标。

服务器更新周期越来越长

根据 Uptime 的调研数据显示,服务器的使用寿命正在增加,并且通常超过供应商建议的三到五年。在 Uptime 的 2015 年调查中,34% 的受访者表示他们的服务器运行了五年或更长时间。到 2022 年,这一比例攀升至 52%。

Uptime 认为增加使用周期的原因有多种,半导体可用性、组件短缺导致价格上涨和交付时间增加等都是主要因素,此外,购买力较低的小型组织也通常被要求推迟不必要的升级。

新的 IT 硬件通常会提高数据中心的效率,但 Uptime 表明这些效率激励措施正在放缓,这一趋势也可能反映出服务器能效增长放缓。Uptime表示,代际变化,特别是在占市场大部分的英特尔驱动的服务器中,提供的性能和能源改进比以前低得多。当然,使用替代(基于AMD和ARM )处理器的更高效服务器的供应仍然有限。

数据中心中断成本攀升

虽然关于数据中心中断有一些明确的指标,但 Uptime 警告称,这些指标可能会被误解。

总体而言,Uptime 跟踪每个站点的中断数量稳步改善。到 2022 年,60% 的受访运营商表示他们在过去三年中发生过停电,低于 2021 年的 69% 和 2020 年的 78%。

根据 Uptime 的数据,从历史上看被视为严重/严重的中断约占所有中断的 20%,到 2022 年这一比例降至 14%。

尽管每个站点的停电次数较少且严重停电的频率较低,但全球停电的总数同比增长。从好的方面来说,中断频率的增长速度并没有全球数据中心足迹的增长那么快。根据 Uptime 的说法,虽然围绕中断的指标可能难以解释,但有一个趋势是明确的:中断变得越来越昂贵。特别是损失超过 100 万美元的停电数量正在增加。

当被问及最近一次停电的成本时,25% 的受访者表示,此次停电的直接和间接成本均超过 100 万美元,在 2021 年 15% 的受访者报告了数百万美元的停电。另外,2022 年 45% 的 受访者表示,他们最近的停机成本在 100,000 美元至 100 万美元之间,而 2021 年这一比例为 47%。

为什么停电的成本会增加?这可以归因于多种因素,包括通货膨胀、罚款、违反服务水平协议以及劳动力成本、召回和更换零件——但最大的单一原因是企业经济活动对数字服务和数字服务的依赖程度越来越高。数据中心中关键 IT 服务的损失通常会立即转化为业务中断和收入损失。

电力问题仍然是停电的主要原因

根据 Uptime 调研数据显示,现场电力问题仍然是导致大量站点中断的最大原因。2022 年44% 的受访者表示,电力是其组织最近一次有影响力的事件或中断的主要原因。

另一个最常见的原因是网络问题,占到了调研数据的 14% 。其他值得注意的原因包括冷却故障 (13%)、IT 系统问题 (13%) 以及 SaaS、托管和云提供商等第三方提供商的问题 (8%)。

无法在多个云中备份应用程序

企业对将云用于关键任务工作负载变得越来越有信心。2019 年,74% 的受访者表示他们不会将任务关键型工作负载置于公共云中。到 2022 年,这一比例降至 63%。与此同时,Uptime 报告称,对公有云提供的服务弹性有足够了解的受访者比例从 14% 上升到 21%。

Uptime 认为,组织越来越有信心将云用于任务关键型工作负载,部分原因是人们意识到提高了对运营弹性的可见性。

然而,其他数据表明云用户也存在一定的担心,主要问题是可用区。据 Uptime 称,可用区通常具有冗余电源和网络,云提供商建议用户将其工作负载分配到多个可用区,以防某个可用区出现中断。数据表明,企业并没有像他们应该做的那样努力。

当被问及如果主要云提供商在单个可用区遇到中断的潜在影响时,35% 的受访者表示这将导致严重的性能问题或停机,另有 49% 的受访者表示会出现轻微的性能问题或停机预期的。

不难发现,用户似乎对云可以处理关键任务工作负载更有信心,但超过三分之一的用户正在构建容易受到相对常见的可用区中断影响的应用程序。

数据中心人员配备问题恶化

据 Uptime 称,随着全球数据中心的数量和规模不断增长,职位空缺的数量也在增长。据估计,全球员工需求将从 2019 年的约 200 万全职员工中增长到 2025 年的近 230 万。其中一些数据中心工作属于新类别,需要专业技能。

报告显示,员工短缺影响了全球几乎所有数据中心的工作角色。在北美和西欧等成熟的数据中心市场,大部分现有劳动力正在老龄化,许多专业人士预计将在同一时间退休,从而导致数据中心的员工人数和经验都不足。

在 2022 年的调查中,53% 的数据中心运营商报告称,2022 年很难找到合格的员工,高于 2021 年的 47% 和 2018 年的 38%。此外,42% 的数据中心运营商报告称员工被雇佣的问题,在大多数情况下是被竞争对手雇佣的。与 2018 年的 17% 相比,这是一个显着的增长。

未能追踪环境数据

据 Uptime 称,大多数受访者表示他们报告了数据中心的整体电力使用和电力使用效率 (PUE),但许多人仍然没有跟踪关键的环境指标。例如,大多数数据中心运营商预计很快就会被要求报告碳排放,但许多人还没有准备好遵守。

在调查受访者中,63% 的人表示他们认为所在地区的当局将要求他们在未来五年内公开报告环境数据,但只有 37% 的人收集和报告碳排放数据(高于 2021 年的 33%),目前只有 39%报告他们的用水量(低于 2021 年的 51%)。Uptime 报告称,新的法律、标准和要求将迫使运营商解决这些差距,并在未来几年建立更严格的可持续性跟踪和报告实践。

备注:2022年全球数据中心调查包括来自 800 名数据中心所有者和运营商的回复,以及来自全球 700 名数据中心供应商、设计师和顾问的意见。

原文地址:https://www.networkworld.com/article/3674127/survey-outages-staffing-challenge-data-centers.html,作者:Ann Bednarz

责任编辑:张诚 来源: 51CTO
相关推荐

2022-09-01 15:47:55

数据中心备用电源

2022-08-08 15:03:21

数据中心COVID数字化转型

2022-08-29 11:05:31

2022-08-15 12:31:14

新华三

2010-08-05 16:42:33

数据中心停机成本

2021-11-25 11:43:32

2012-04-09 13:18:24

数据中心

2018-09-27 11:18:28

数据中心网络停机

2017-07-28 10:45:39

数据中心停机

2017-11-06 14:06:11

数据中心停机IT

2016-11-01 13:06:58

大数据数据中心

2013-03-14 10:19:51

数据中心升级停机数据中心

2020-09-11 09:00:58

数据中心电源停机

2019-07-01 14:36:33

数据中心技术人工智能

2017-07-20 11:12:34

数据中心电源设计调试

2009-06-17 17:06:22

数据中心运维管理游龙科技

2018-03-13 06:58:09

数据中心运维管理基础设施

2021-08-06 14:09:21

2010-09-02 10:17:52

数据中心UPS西门子

2020-01-02 14:38:00

数据泄露IT网络
点赞
收藏

51CTO技术栈公众号