当前,整个北半球又进入令人慵懒、燥热的夏季了。尽管此前曾有过太多关于企业数据中心如何更好的在夏季实施冷却散热的介绍文章。但目前仍然有许多中小型的企业组织似乎已经感觉到他们数据中心的冷却系统已然达到了其极限,有的甚至远远超出了他们所认为的极限水平。因此,这些企业真心的迫切需要寻求一切切实有效的方法,来针对其服务器实施更好的散热,或者考虑是否可以通过使用一些冷却散热方面的技巧来防止服务器的过热。
因此,虽然网上有太多关于新的ASHRAE数据处理环境散热和自然冷却指南的相关介绍帖子,但如果您企业的数据处理环境仅仅只是较小的数据中心站点或位于混合使用的建筑物中的服务器机房内,那么,在炎炎夏日,如若缺乏具有足够额外容量的大型专用冷却系统的话,则贵公司数据处理环境的冷却散热显然是无效的。由此,许多企业IT部门的员工们不得不被迫在大夏天再次挥汗如雨的工作的同时,还得不停的祈祷他们的关键业务服务器系统不会因超温运行停机而突然导致服务器系统崩溃。
以下,我们就将与广大读者朋友们共同讨论分享一些在企业数据中心实施冷却散热的小的技巧和建议,这些可能无法解决长远的问题,但我们希望能够足以帮助您企业数据中心安然的度过整个夏天。很多时候,当数据中心内部相关设备的实际热负荷没有严重超过冷却系统的实际容量时,优化气流可以有助于冷却散热情况的改善,直到安装新的或添加额外的冷却系统。
一、如果您企业数据中心的操作运营人员感觉操作环境太热,请先不要过度惊慌——那怕你看到冷通道都已经达到80°F了!的确,尽管80°F显然已经大大超出了你已经习惯的普通数据中心70°F到72°F的 “标准”环境温度范围(而你事实上很可能并不喜欢在这样的环境温度下工作),但是对于一般的服务器而言,可能并没有你所想象的那么糟糕。如果机架前方的***温度监测数值为80°F或更低,那么,您企业的数据处理环境仍然符合ASHRAE的***TC 9.9指南所“推荐”的温度范畴。即使进气温度稍高(高达90°F),但这其实仍然在A2所“允许”的指导操作环境温度范围内,这属于大多数现代服务器的50°F到95°F的操作范围内。
二、在服务器前方进行温度的测量。这是服务器吸取冷空气的地方,并且实际上该方法是唯一有效且最重要的测量方法。分别测量服务器机架前方的顶部、中部和底部的数值(假设您数据中心有一个热通道/冷通道隔离的布局)。服务器机架顶部的温度通常是***的。如果机架的底部区域较冷,并且您数据中心有开放的机架空间,那么不妨请尝试将服务器重新布置在靠近机架底部(或最冷区域)的位置。
三、请务必确保使用空白板(blanking panel)来阻挡机架前部的任何和所有开放但却未使用空间。这将有助于有效防止来自后部的热空气再循环到机架的前部。
四、不要担心机架后部的温度——即使其已经达到了100°F或更高的温度! (这其实并不罕见)不要将随机风扇安置到机架后部,以试图“冷却它们”,这只会导致更多的暖空气混入冷通道!
五、如果您数据中心操作运营环境有高架地板的话,请确保地板格栅或多孔砖将被恰当的安置在最热的机架前面。如有必要的话,可以考虑重新安置或更换不同的地板格栅,以使气流与热负荷相匹配。请格外小心不要将地板格栅安置得距离CRAC太靠近,否则会使冷的空气流“短路”回到CRAC中,并夺走操作环境空间/机架行的其余部分的足够的冷空气。
六、请为您企业数据处理环境空间机柜内的开口进行活动地板上的检查。如果不需要的话,地板上的电缆开口允许空气从高架活动地板通风系统中逸出,并且将可用的冷空气降低到冷通道中的地板通风口。通过使用空气密封容器刷型套环套件以便能够***限度地减少这个问题。
七、如果有可能的话,可以尝试重新分配,并均匀地将热负荷分散到每台服务器机架中,以避免或最小化“热点”。请记住,在移动服务器之前,务必检查服务器机架顶部,中部和底部的温度;然后仅仅只移动那些温度较高的服务器(此时务必再次基于机架前方的温度),将其重新安置到较冷的区域。然后使用空白板填补任何空隙。再次检查所有机架的温度,以确保您操作环境刚刚对于服务器的移动并未创建新的热区。
八、检查机架后部是否有阻塞排气气流的电缆。这将导致IT设备风扇过大的背压,并可能导致设备过热——即使机架前方有足够的冷空气。对于装满1U服务器的机架尤其如此,这些服务器具有大量长的电源线和网络布线。考虑购买较短(1至2英尺)的电源线,并更换大多数服务器附带的原始较长的OEM电源线。也可以使用最短的网络电缆。使用电缆管理以便整理机架后部,从而不会阻碍气流的流通。
九、如果您企业的数据处理操作运营环境有高架天花板管道冷却系统,那么请务必确保冷空气出口直接位于机架前部,并且返回管道位于热通道的上方。我已经观察到在某些数据中心站点,天花板通风口和返回位置的安置非常糟糕,致使操作环境很热,但冷却系统的容量又没有被超过,仅仅只是因为所有的冷空气都没有直接到达机架的前方或者热空气没有得到适当的提取。而最为重要的问题是:请务必确保机柜后部的热空气可以直接返回CRAC回路,而不会与冷空气混合。如果你数据中心操作环境空间有一个压力通风系统天花板,可以考虑使用它来捕获暖空气,然后从CRAC的顶部回风口添加一个管道箍进入天花板。一些基本的管道工作原理将对室内温度产生直接影响。事实上,回风越暖,CRAC的效率和实际冷却能力就越高。
十、只有在可以将热量排放到外部区域时,才考虑添加临时“滚入式”冷却装置。将排气管道安置到可回到CRAC的天花板上运行并不起作用。滚入的排热管必须排放到受控空间外的区域。
十一、当贵公司的数据处理操作环境空间未被使用时,切记关灯。这可以帮助您企业节省1%至3%的电力和热负荷,而在边际冷却的情况下,可以将温度降低1°至2°。
十二、检查是否有任何设备仍然插着接线板并通电,但不再处于生产状态。这是一种相当常见的情况,并且仅仅只需一个简单的动作就可以搞定,只需将其关闭即可!
总结
虽然当您企业数据处理操作环境空间的热负荷完全超过冷却系统的容量时没有真正能够使其快速修复的有效方案,但有时,仅仅通过改善气流就可以将整体的冷却散热效率提高5%至20%。这可能会让您企业数据中心度过炎炎夏天最热的日子,直到您企业可以升级您的冷却系统。无论如何,本文中所介绍的这些小建议会有助于降低你数据中心的能源成本,这总是一件好事。
提前规划,未雨绸缪。如果所有其他方法都失败了,请务必制定一套后备计划来关闭最不重要的系统,以便更为关键的服务器可以继续保持正常运行(例如电子邮件,财务等系统)。请务必确保将贵公司最为关键的系统安置在最凉爽、冷却散热效果***的区域。这比最关键的系统因过热发生意外关闭要好得多!
通过借鉴并遵照执行本文中所介绍的这些建议,相信您完全可以安心的在海滩上享受您的周末时光,而不必再担心您是否通过手机收到贵公司数据中心操作环境出现超高温的警告电子邮件通知了。