在医疗行业,三甲医院在信息技术人员配备方面通常要好一些,人多一些,技术水平也好一些,这些用户在选择系统平台方案时,会倾向选择双机集群的方案,以彰显技术实力。因为 双机集群系统的维护,没有一定经验和技术实力,将会很难应对系统的突发事件。
集群是如何调度系统的?数据一致性是如何保证的等等,这些都是比较复杂的技术问题。选择双机集群系统也有一些好处:一是可供选择的服务器,其品牌和型号比较多,有IBM、HP、Dell等国际品牌,也有浪潮、曙光、联想等国产品牌;可以选择双路,也可以选择多路服务器,甚至是小型机集群。只要选择相同型号的两台服务器就可以构建集群系统。选择集群的另外一个好处就硬件初始购买成本比较低。
与集群相比,容错方案硬件购买成本相对较高,这也是有些用户没有选择容错的主要原因。但是容错方案的优势在于,容错是一台设备,操作系统、数据库等软件只需要一份授权;与之相比,集群需要购买两份授权。考虑到软件的价格不菲,从系统的角度,容错方案的总拥有成本低于双机集群。在一些特殊情况下,用户可以获得更低成本的软件授权,如此则容错的优势不易发挥。
与容错相比,双机集群的劣势在于可靠性相对不高。在实际工作中,经常有双机集群切换不成功的报道,其主要原因在于双机集群对维护要求比较高,要求双机系统环境保持一致,如果维护更不上,就容易导致切换失败。另外,双机集群属于软件容错方案,软件故障定位往往需要专业厂商的参与,其故障恢复往往需要比较长的时间。从技术上看,即便维护到位,系统切换也是需要一定时间,往往做不到系统的无缝切换。
与集群相比,容错具有更高的可靠性。容错服务器供应商,如Stratus,可提供远程监控服务,获取故障信息后就可以着手对其进行更换,由于这个过程中不需要停机,不影响业务的正常运行,因此用户甚至察觉不到。从技术上看,容错方案是将两台相同配置服务器,在“锁步技术(Lockstep)”控制下,在每一个时钟周期,同步进行计算,确保处理计算的正确性和准确性。但其中一任一功能部件,如处理器、内存、I/O等出现故障时,系统可及时对故障部件进行隔离,通知更换。在这个期间,系统虽然失去容错保障,进行单机工作状态,但仍然可以确保业务不间断运行。待故障部件更换之后,系统将恢复容错工作状态,此过程不需要任何停机,可以确保系统高可靠性。
由于容错方案是通过硬件设备实现的系统冗余,较之双机集群具有更高的可靠性,故障监控、故障定位、部件更换简单易行,因此非常容易管理。用户可以自行管理维护设备,也可以选择厂家的远程监控服务。对于三甲医院而言,容错方案同样是一个非常理想的选择。虽说三甲医院有相对充足人员和技术实力,也没有必要盲目消耗系统的日常维护管理上,选择更加具有可靠性保障的系统,将是一种更加明智的选择。对于技术实力稍弱的用户而言,针对高可靠性的需求,容错系统将是***合理的选择。