一、安全第一
每次进行电源维护时,切记生命和身体安全应胜过一切。当处理电源设备时,可能哪怕一个小小的操作失误也会造成严重伤害。因此,当处理UPS(或数据中心的任何电力系统)时,确保安全是首要考虑的问题:包括遵守设备制造商的建议,注重设施特殊的细节和标准的安全指引。如果对于UPS系统的某些方面不熟悉,或不知道如何对其进行维护,请找专业人士寻求帮助。即使了解数据中心的UPS系统,仍然有必要寻求相应的外界援助,以便在涉及到某些潜在问题时能有头脑冷静的人给予帮助,使其不会受压力困扰。
二、坚持定期维护
数据中心的预防性维修不应该成为工作人员心血来潮的事情,尤其是考虑到其潜在的停机时间成本。对于数据中心的UPS系统以及其他系统而言,应定期进行维护(以年、半年或任何时间框架为单位),并坚持贯彻这一维护计划。这包括一份书面的(纸质或电子版)备案清单,记录好下一次维护活动和上一次维护的具体时间。
三、做好详细记录
除了安排好定期的维护计划,数据中心也应该有一份详细的维修记录(例如, 清洗、修理或更换某些部件的记录),以及在在检查过程中,发现的相关设备的具体状况。而当工作人员需要向数据中心的管理人员汇报维护成本或每次停机时间所造成的成本损失时,进行成本跟踪也是非常有益的。一份详细的任务清单,如检查电池腐蚀情况,寻找过量扭矩的连接导线等,有助于维持一个有秩序的方法。而当在进行设备更换、不定期的维修、UPS故障排除规划时,所有这些文档都可以提供帮助。除了做好记录之外,请务必确保这些文档始终放在一个方便得到且大家都知道的位置。
四、执行定期检查
上述三点建议适用于数据中心的几乎任何一部分:无论怎样的数据中心环境,加强安全、调度维护和保持良好的记录都是很好的做法。然而,对于UPS系统,需要有工作人员定期进行某些任务(这些工作人员应该熟悉UPS操作的基本知识)。这些重要的UPS维护工作包括以下几个方面:
1、围绕UPS和电池(或其他能量存储)设备进行的障碍物和相关冷却设备方面的检查。
2、确保没有发生运行异常或UPS控制面板没有发出任何类似于过载或电池电量即将耗尽的警报。
3、注意查看电池腐蚀或其它缺陷的迹象。针对那些特定设备,咨询制造商的指导方针和建议。在某些情况下,应该严格履行设备制造商的维护建议。
五、认识到UPS组件发生运行失败是可能的
这似乎是显而易见的:任何具有有限故障概率的设备,最终都会发生运行失败的状况。有报告指出:“关键的UPS部件,如电池和电容器不可能始终保持正常使用状态。”所以,即使供电方提供了完美的动力,UPS机房是完全干净的,并且UPS设备是在适当的温度理想情况下运行的,相关组件仍然会发生运行失败的状况。正因为如此,才需要对UPS系统进行维护。
六、确保知道当需要相关服务或不定期的维护时,向谁求助
有时,在日常检查的过程中,就会发现某些问题,而这些问题不能等到下次维护的时候才解决。在发生这些情况的时候,需要确保知道联系谁能够帮助搞定,这样可以节省大量的时间和精力。这意味着数据中心必须确定一家或几家固定的服务提供商,在需要时提供帮助。这些供应商与提供定期维护的供应商可以是同一家,也可以不是同一家。
七、进行任务分配
“你是不是应该上周就进行检查?”“不,我觉得应该是你检查的。”为了避免这种责任不明晰的混乱,请务必确保安排合适的专门人员负责UPS维护任务。哪位工作人员需要负责每周检查设备?哪位工作人员负责联系服务供应商,安排年度维护计划(或者调整维护时间表)?特定的任务可能有不同的负责人,但是要确保知道谁负责UPS系统。
许多UPS维护事项最好留给那些熟悉UPS的人员。再次强调,安全是至关重要的:一个UPS系统中的电压的危险性可能出现人身伤亡,所以最好聘请专业人士进行,而不要冒险操作。预防性维护是数据中心的所有工作的关键,所以很多诀窍可以广泛地应用,但UPS系统需要特别关注,因为它在短期内需要稳定的电力以提供给IT设备。通过执行定期的维修计划,可以很容易地防止由于电池电量耗尽、电容器故障、或空气过滤器堵塞,甚至过时的固件焊接继电器造成的停机事件。工作人员只需要经过深思熟虑的执行上述几大步骤,采取预防性的维护程序,就可以帮助其数据中心免去许多麻烦。