数据中心里最危险的东西是什么?是人类自己。如果每个出口旁边都有一个EPO(emergency power off,紧急断电),那任何可能出错的工作人员都是定时炸弹。据报道,数据中心宕机的罪魁祸首大多数是人为错误,其中EPO最容易引发宕机,所以值得管理员思考。作为一个出口上的按钮,它的出现实在是个错误,很容易被心情差的雇员不小心就碰到。如果粗心和无知的电工破坏EPO的线路,也会导致宕机。有的EPO线路竟然被无意间随意布置,结果很快就不能用了,同样宕机会发生。很多EPO一开始装配就偏离了要求的准则。所以本技巧将为你讲述装配EPO开关时的必要准则,还会告诉你,在什么时候使用不当,会把EPO变成数据中心的引爆开关。
大型机电源和EPO的一段孽缘
如果EPO开关会给数据中心带来潜在危机,为什么我们还需要它?这与历史有关,而且这个历史已经转变成法律上的规定,但是现在,规定通常会被误用。
EPO的诞生源于大型机,因为它们使用大量电能,花费昂贵,可能会导致“死机损坏”而不是烧坏。所以电工安装了一个大的红色紧急关闭按钮,这样管理员就可以在必要的时候立刻按下,关闭整个房间的电源。现在的EPO做的也是这些事情。它能够立刻关掉数据中心所有的设备,不管是IT关键设备还是空调,不管是UPS还是电池。结果就导致计算机严重损坏。
而且也没有旁路(料想也不会有),只有一个小小的例外:就是对于关键计算设备,可能会允许有一个逐步有序的关闭过程。如果确实需要EPO(实际上需要的时候也不多),在出口旁边装上也是很容易的——只要你要求过,或者有关部门采取了2011年的标准(其准则提供了可供选择的方法,在本文稍后会提及),但是决定什么时候实行新准则的是当地委员会,对于大多数委员会来说,几年内是不会采纳最新的准则的。
美国国家电气规范和EPO的前世今生
装配EPO开关是美国国家电气规范(National Electrical Code,NEC)中645条款中要求的,该条款在1968年首次出现。条款的标题名为Information technology equipment,即信息技术设备,标题在数年间改变过好几次,以确认类似电话系统这样的设备,与传统数据处理设备一起安装在了机房。
现在的标题,和以前的标题例如“Data processing systems(数据处理系统)”、“Computer/data processing equipment(计算/数据处理设备)”,会让人觉得645条款中的标准约束了任何地方的计算机。事实上正好相反!美国国家电气规范的第六章(即645所在的章节)提到,适度修改大体的规则是允许的,这在第一章到第四章也有提及。这些大体的规则覆盖了专门的空间、特定的设备型号或者例外的情况。所以645条款是比较“宽容”的,它允许了你做出与平时规定要求相反的事,但是只有在你打算遵循其他规定时才能这样。其它的规定中,有一条要求在每个主要的出口安装一个“approved disconnecting means(允许的断开方法)”,也就是EPO,这个术语没有被NEC正式承认和使用。如果你不想这么做,不安装EPO开关是你的自由。
事实上,类似data center(数据中心)和computer room(机房)这样的术语也没被NEC承认。这不是说你非得遵从645条款的要求,管每个有IT设备的房间叫“信息技术设备房间”。你只有在这两种情况下才要遵守:
•如果你在活动地板下运行通风、电源或者布线。如果没有活动地板,或者不用于制冷,那从一开始645条款就不适用。这是为什么很多人鼓吹淘汰活动地板。以后我们会更深入探讨这一问题。
•如果你想从违反645条款一到四章的规则中获得好处。
违背条款包括以下情形:
•灵活的电源移动(插座没有在地板下关死)。
•在静压箱地板开洞,使用非高压通讯电缆。
•使用多种小UPS元件(小于等于750 VA)使得关键设备有序关闭,避免死机受损。
•特定接地选择。