亚马逊云计算数据中心六月二度停机

服务器 数据中心
亚马逊位于弗吉尼亚地区的数据中心六月末发生了一起断电事件,影响到了其Web服务,包括Pinterest、Netflix还有Instagram,官方在表示这次事故主要是因为发电机故障。

亚马逊位于弗吉尼亚地区的数据中心六月末发生了一起断电事件,影响到了其Web服务,包括Pinterest、Netflix还有Instagram,官方在表示这次事故主要是因为发电机故障。

这是本地区六月发生的第二起因为发电机引起的事故。

North American Access Technologies的CTO Julius Neudorfer认为即使大部分情况是因为发电机,但是问题在不同数据中心具体不同。但是这些故障都意味着后备系统没有在故障模式中测试。

“显然他们没有从每个问题中寻找教训,似乎他们通常只是测试运行的设备,而没有注意测试的时候关注故障那一方面。”

亚马逊的AWS Service Event报告申明在6月29的电力风暴中,亚马逊东区十个数据中心中的两个被迫转移发电机电力。

其中一个数据中心故障转移没有成功,因为“每个发电机都发生了各自的故障,导致无法提供稳定电压。结果发电机不能承担负载(报告中的描述)”。因此服务器开始运行UPS。

亚马逊在稳定初级和后备的发电机,ups系统耗尽,服务器在晚上8:04开始失去电力。十分钟后后备发电机稳定了,UPS也重起了,这时能源又开始存储下来。整个设备在8:24电力回到正轨。

但是断电还没结束,EC2灾难恢复步骤中的瓶颈和Elastic Load Balancer控制仪表的故障使得部分受影响的客户无法上线,直到11:15至12点。

本月14日的故障首要原因是线缆问题,但是某个后备发电机的风扇也坏了。而这次故障中,第二个后备电源也坏了。

责任编辑:张玉 来源: TechTarget中国
相关推荐

2012-04-06 09:17:52

云计算数据中心

2018-06-15 09:48:20

云计算数据中心架构

2017-11-21 09:15:51

2017-11-21 11:03:32

2012-09-03 10:29:28

云计算数据中心

2012-01-09 11:16:31

2013-07-03 09:49:21

云计算数据中心

2013-08-22 09:50:47

2013-04-02 11:01:59

架构数据中心云计算

2011-11-21 09:45:52

施耐德云计算数据中心

2015-08-25 09:02:59

2014-12-03 15:20:40

云数据中心虚拟化技术多租户

2012-06-18 09:22:06

2018-04-03 13:15:01

2011-09-20 09:35:20

能源数据中心云计算

2009-08-11 14:12:06

微软云计算数据中心

2012-10-11 10:31:00

布线数据中心布线云计算数据中心布线

2013-04-02 11:01:04

数据中心管理云计算IT

2012-05-22 16:18:20

2013-08-01 09:51:44

施耐德电气关注云计算数据中心时代
点赞
收藏

51CTO技术栈公众号