对于金融而言,宕机意味金钱损失。据Qualix Group统计,银行宕机一分钟的代价是27万美元,通信运营商损失35万美元,证券业损失45万美元,制造业损失是42万美元,应该说,这些损失惊人。但与之相比,医疗行业人命关天,其损失是不能够用钱来衡量的。
在2009年国家《关于深化医药卫生体制改革的意见》,各级政府预计投入8500亿元用于医保、基本药物、基层医疗服务体系、公共服务均等化、公立医院改革共五项医改重点。在新一轮的医疗改革浪潮中,医疗系统信息化将成为创新制度的利器。
与金融、电信等信息化领先行业相比,医疗行业信息化在专业技术人员规模、信息化程度以及投资规模上都存在着比较大的差距。但是对于信息系统的高可靠性的要求,医疗行业不仅不低,甚至对可靠性的要求更高。笔者就有过这样的经历,在XX医院,为出生不仅婴儿化验黄疸,等待采血;但迟迟没有办法进行,原因在于诊室打印机不打印了,需要等待技术人员维护。化验原本与打印机没有直接关系,但是打印单据出不来,后续步骤无法进行,医护人员、患者都不得不等待。如果说这样的影响还是局部的,对于承担核心业务的服务器而言,如果宕机,所影响的就是整个医院。如果挂号、计费无法进行,所关乎的可是人命关天的大事情。
为提升医疗系统可靠性,很多医院采用了双机冗余方案。表面上看,双机解决了可靠性不高的问题。用上面例子看,如果该诊室,拥有一台备用的打印机,问题也就解决了。实际上,问题没有这么简单。对于医护人员来说,既是医护人员知道如何更换打印机,更换也是需要时间的。类似的,在服务器双机方案中进行切换也是需要时间的,而且更为重要的是,双机切换的成功率并不高,一旦切换失败,恢复系统就成为了一个难以量化的事情,运气好可以在10分钟,半个小时内恢复,运气不好,花费1天时间也有可能,甚至更长。
双机系统切换成功率不高,对此,信息技术人员心知肚明,虽有双机保护,但没人敢贸然拔掉“心跳线”(备机判别主机故障的一种方式),因为备用机很有可能起不来。既然如此,医疗行业为什么仍然采用双机方案,一来是约定俗成,二来的确比单机有更高的可靠性。与双机方案相比,容错服务器方案具有更高的可靠性。
从技术上原理看,双机只能够保护数据,并不够保持业务处理不中断,因为内存、I/O缓存中的数据没有实施保护,突遇故障时,这些数据就会丢失。备用机需要重建业务流程,期间就会产生业务中断。与之相比,容错方案不仅对处理器、磁盘进行保护,对内存、I/O都提供了实时保护,容错方案中,所有处理和步骤,全部按照时钟周期同步。当故障发生时,系统失去同步,进入单机工作状态,虽然可靠性有所降低,但业务并不会中断。待故障部件更换之后,系统自动恢复容错状态。由于故障部件更换支持热插拔,因此不会对于业务产生任何影响。容错方案是当之无愧的高可靠性方案。
容错系统在金融证券行业普遍采用,但其他行业使用较少的一个重要原因是价格,容错系统价格比较高。但随着x86处理器采用,容错系统价格的高门槛已经被打破,这就为其他需要高可靠性的行业应用创造了条件。对于行业来说,了解容错方案技术,冲破固有观念,就变得非常重要且迫切。对于医疗行业而言,容错方案其信息化的最佳选择。