数据中心可用性考量:四个9还是五个9?

译文
服务器 数据中心 服务器运维
要获得高可用性:无论正常运行时间是99.99%还是99.999%,其成本包括软件、硬件、人力和培训等方面。企业组织在考虑这些成本的同时要考虑非计划停机引起的损失,还要考虑安排计划停机的能力。

高可用性是IT行业一个无可回避的事实,但是对于许多企业组织来说,99.999%的正常运行时间并非必不可少。

一家企业组织是否需要99.999%的正常运行时间,这取决于从软件局限性到成本(包括财务成本或非财务成本)的多个因素。

Linux开发人员兼高可用性Linux项目的创始人Alan Robertson说:“要是关系到人的性命或者每分钟数百万美元的收入,99.999%才是你所需要的。”

考虑清楚高可用性的成本

要获得高可用性:无论正常运行时间是99.99%还是99.999%,其成本包括软件、硬件、人力和培训等方面。企业组织在考虑这些成本的同时要考虑非计划停机引起的损失,还要考虑安排计划停机的能力。即使是从事像股票市场这些涉及到数百万美元的金融行业公司,也很容易安排停机——只要停机不是安排在交易时段,Robertson如是说。

据数据中心设施供应商艾默生网络能源公司(Emerson Network Power)近期对41个数据中心所作的一项调查显示,非计划停机引起的最大损失来自业务中断和收入减少。调查表示,企业组织应对非计划停机的一系列举措也要耗费钱财,比如发现问题、解决问题以及让系统恢复运行。

在正常运行时间为99.99%的公司,公司每年预计遇到的停机时间为8.76个小时。如果每停机一小时就要遭受100万美元的损失,那么总共损失876万美元。但是如果该公司的正常运行时间为99.999%,那么每年停机时间不到1小时,总共损失不到100万美元。在荷兰工作的独立培训师兼顾问Sander van Vugt表示,在这种情况下,可能有必要不惜血本来延长正常运行时间。

Wayne Gateman是在《财富》15强医疗销售和软件领域一家公司供职的虚拟化地区协调员,他说:“对任何产品来说,都要折中考虑成本/价值(性价比)。停机时间会给你造成什么样的损失?你在停机时间能忍受多大的损失?停机的风险又有哪些?”

van Vugt表示,99.99%的正常运行时间应该适合像在线零售商或主机服务托管商这些以量见长的商家,还适合其他离线商家;对于这样的商家而言,连99.9%的正常运行时间应该都没问题。

力争99.999%的正常运行时间

但是在交通运输等一些行业,高可用性至关重要,不管为此要付出多大的成本。比如在荷兰,所有列车曾因交通枢纽位置的计算机故障而出现停运,成千上万的乘客因而动弹不得。

van Vugt说:“99.999%对这些行业来说必不可少。”

在这种情况下,企业组织可以借助容错服务器。Gateman表示,多道容错机制:服务器硬件本身、故障切换软件,以及划分物理设备、迫使故障切换以便升级的软件,使得容错服务器物有所值。

在改用容错Stratus服务器之前,Gateman所在的公司使用基于软件的故障切换机制,确保生产环境正常运行,但是软件故障切换机制并非总是按计划运行。

Gateman说:“软件总归是软件;有时候,软件并非总是发现得了故障,而硬件绝对会报告故障。而由于采用内置的冗余机制,这种故障一般不会拖累虚拟中心。”

他所在公司增添了第二台服务器,就为了确保万无一失。

责任编辑:路途 来源: 51CTO
相关推荐

2021-07-09 05:22:45

网络测试备份灾难恢复

2010-09-01 11:17:24

数据中心搬迁

2018-02-28 07:31:51

数据中心可用性IT设备

2023-11-13 10:00:09

数据中心服务器

2015-10-19 10:47:22

数据中心优化设计

2023-07-28 14:39:41

数据中心服务器

2018-01-24 07:05:20

数据中心高可用性数据

2018-06-22 09:28:22

数据中心可用性效率

2023-04-04 09:44:52

数据中心能源安全

2011-12-26 09:56:57

数据中心服务器宕机

2023-05-25 15:45:14

云计算高可用性灾难恢复

2009-01-03 15:20:08

ibmdwAIX

2016-12-13 12:15:20

数据中心大数据

2018-05-08 07:01:52

数据中心可用性可靠性

2018-12-07 10:16:18

数据中心Kubernetes服务器

2011-08-23 09:00:47

可用性五个九

2023-07-31 10:20:34

2021-12-13 09:11:41

数据中心IT网络

2018-12-12 11:11:20

系统可靠性可用性

2014-08-28 14:04:59

Windows 9微软
点赞
收藏

51CTO技术栈公众号