每个有汽车的人都知道,定期更换机油和更换轮胎有助于汽车行驶更顺畅、寿命更长久,从而保护现有投入。同样,采取几个预防性措施也可以帮助数据中心的服务器运行更顺畅、寿命更长久。而更为重要的是,这些措施有助于防止服务器出现停运;在一些情况下,服务器停运很快就会导致蒙受巨额经济损失。
为了让你的服务器在***状况下运行,你需要保持合适的环境、积极主动地维护和监控,并且制定一项计划,那样万一服务器果真出现了故障,员工知道该怎么做。
保持良好适宜的机房环境
大型数据中心大多有先进的设备来监控数据中心的物理状况,但是许多比较小的公司其服务器机房并不是处在适当的温度或湿度范围,或者没有做到应有的干净。TERiX计算机服务公司的营销专员Joe Guenther指出:“系统在过热、过湿、灰尘过多的环境下也许仍可以运行,但是它们绝对达不到应有的使用寿命,而且较之于在建议的环境状况下运行,更容易受到环境条件的影响,因而频出故障。”
污染控制服务公司的数据中心服务部门经理Mark Gonsalves表示,数据中心应该排好每季度清洁一次的时间表,地板下面每年至少要打扫一次。他说:“环境越清洁,数据中心运行起来越顺畅。”他补充说,确保环境清洁意味着,没必要更换成本高昂的设备。他表示,要是你的数据中心环境特别脏,一些硬件制造商会宣布硬件保修无效。
积极主动 防患于未然
如果采用预防性维护和合适的监控软件,就可以避免或减少另外的许多服务器问题。SEI服务公司的产品支持经理Chad Peters说:“你可以在问题还没有出现之前及早发现。”
预防性维护主要包括三项工作:仔细检查错误日志,查找固件或软件的更新版,以及跑到机房去检查。Peters表示,他公司对错误日志每年检查一两次。他解释:“我们有没有哪个硬盘开始将错误记入日志?我们有没有哪只风扇的转速没有达到应有的水平?我们有没有哪块光纤网卡开始出现一些问题,一些错误被记入了日志?如果有的话,那么我们就能积极主动地更换,以免相应部件出现故障。”
你在检查错误日志时,正好也可以趁此机会,重新检查一下服务器上的固件和软件,确保没有漏掉任何重要的更新版。TERiX公司的销售和营销专员Larry Quinn说:“要清楚地了解你有什么样的系统,在上面运行的操作系统使用什么样的补丁版本。如果你在资产和补丁管理方面偷工减料,短期来看节省了费用,但是保证会增加长期费用。”
预防性维护还应该包括跑到数据中心去检查,确保所有线缆连接到位,确保空气流动管理设备仍然在原位,确保机房保持应有的清洁程度。
在下一次计划的预防性维护到来之前,你应该使用监控解决方案,以便服务器开始出现问题时,你能够***时间收到警报。现在市面上有种类繁多的复杂性和价格不一的解决方案,所以你需要做一番比较,找到最适合自己需要的那款解决方案。