中国领先的IT技术网站
|
|

数据中心可用性考量:四个9还是五个9?

要获得高可用性:无论正常运行时间是99.99%还是99.999%,其成本包括软件、硬件、人力和培训等方面。企业组织在考虑这些成本的同时要考虑非计划停机引起的损失,还要考虑安排计划停机的能力。

作者:布加迪编译来源:51CTO|2012-10-08 13:40

Tech Neo技术沙龙 | 11月25号,九州云/ZStack与您一起探讨云时代网络边界管理实践


高可用性是IT行业一个无可回避的事实,但是对于许多企业组织来说,99.999%的正常运行时间并非必不可少。

一家企业组织是否需要99.999%的正常运行时间,这取决于从软件局限性到成本(包括财务成本或非财务成本)的多个因素。

Linux开发人员兼高可用性Linux项目的创始人Alan Robertson说:“要是关系到人的性命或者每分钟数百万美元的收入,99.999%才是你所需要的。”

考虑清楚高可用性的成本

要获得高可用性:无论正常运行时间是99.99%还是99.999%,其成本包括软件、硬件、人力和培训等方面。企业组织在考虑这些成本的同时要考虑非计划停机引起的损失,还要考虑安排计划停机的能力。即使是从事像股票市场这些涉及到数百万美元的金融行业公司,也很容易安排停机——只要停机不是安排在交易时段,Robertson如是说。

据数据中心设施供应商艾默生网络能源公司(Emerson Network Power)近期对41个数据中心所作的一项调查显示,非计划停机引起的最大损失来自业务中断和收入减少。调查表示,企业组织应对非计划停机的一系列举措也要耗费钱财,比如发现问题、解决问题以及让系统恢复运行。

在正常运行时间为99.99%的公司,公司每年预计遇到的停机时间为8.76个小时。如果每停机一小时就要遭受100万美元的损失,那么总共损失876万美元。但是如果该公司的正常运行时间为99.999%,那么每年停机时间不到1小时,总共损失不到100万美元。在荷兰工作的独立培训师兼顾问Sander van Vugt表示,在这种情况下,可能有必要不惜血本来延长正常运行时间。

Wayne Gateman是在《财富》15强医疗销售和软件领域一家公司供职的虚拟化地区协调员,他说:“对任何产品来说,都要折中考虑成本/价值(性价比)。停机时间会给你造成什么样的损失?你在停机时间能忍受多大的损失?停机的风险又有哪些?”

van Vugt表示,99.99%的正常运行时间应该适合像在线零售商或主机服务托管商这些以量见长的商家,还适合其他离线商家;对于这样的商家而言,连99.9%的正常运行时间应该都没问题。

力争99.999%的正常运行时间

但是在交通运输等一些行业,高可用性至关重要,不管为此要付出多大的成本。比如在荷兰,所有列车曾因交通枢纽位置的计算机故障而出现停运,成千上万的乘客因而动弹不得。

van Vugt说:“99.999%对这些行业来说必不可少。”

在这种情况下,企业组织可以借助容错服务器。Gateman表示,多道容错机制:服务器硬件本身、故障切换软件,以及划分物理设备、迫使故障切换以便升级的软件,使得容错服务器物有所值。

在改用容错Stratus服务器之前,Gateman所在的公司使用基于软件的故障切换机制,确保生产环境正常运行,但是软件故障切换机制并非总是按计划运行。

Gateman说:“软件总归是软件;有时候,软件并非总是发现得了故障,而硬件绝对会报告故障。而由于采用内置的冗余机制,这种故障一般不会拖累虚拟中心。”

他所在公司增添了第二台服务器,就为了确保万无一失。

【编辑推荐】

  1. 如何减少服务器迁移的宕机时间?
  2. 如何选择最适合的服务器托管供应商?
  3. 直流电是破解数据中心效率难题的灵丹妙药吗?
  4. 数据中心依然是能耗大户
  5. 数据中心建造前的先知:预测建模
【责任编辑:路途 TEL:(010)68476606】

点赞 0
分享:
大家都在看
猜你喜欢

视频课程+更多

热门职位+更多

读 书 +更多

跨越网络工程师必备训练

本书是根据全国计算机技术与软件专业资格(水平)考试“网络工程师级考试大纲”编写的考试辅导用书。全书主体按考试大纲的章节编排,分上、...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊
× CTO训练营(深圳站)