不少IT运维人员一直都充当着企业“救火队”的角色,业务一旦宕机,不管何时,也不管身在何地,都必须投入到抢修的阵营中去。毕竟企业的业务运转就是企业的命脉,对企业来说永远是第一位的,尤其在金融、电信等行业的关键性业务中,这一点表现得更为显著。可以毫不夸张地讲,宕机不仅是企业的“噩梦”,更是运维人员的“噩梦”。
无法预知的自然灾害随时可能发生;系统人员误操作造成数据丢失;手段频多的黑客、病毒攻击系统漏洞……可以说企业业务正在一个充满风险和威胁的世界里运行,因此,建立业务的恢复计划,最大限度地消除计划外停机,确保业务的连续性是每个企业所追求的,而选择一款高可靠性的服务器绝对是构建业务连续性系统的首要前提。
在企业关键性业务中,IBM Power平台一直是主力军,在很多7x24运行环境中都能见到它们的身影,有数据显示,2010年IBM Power平台占有中国Unix服务器市场56%的份额,远远领先于其他厂商。2011年3月,IBM正式推出了全新的Power基础架构云解决方案——Power Cloud Box,Power Cloud-Box将充分发挥Power Systems企业级应用平台创新性能,并结合IBM强大的系统软件及云实施服务“PowerCare计划”,帮助用户快速、轻松、切实地构建云基础架构平台,保障企业在云计算时代的业务发展。
IBM从三个技术层面实现Power服务器的高可用,来构建一个近乎不停顿的业务环境:
-按照大型机可用性理念设计的具有高RAS特性的系统硬件,以及最大限度减少计划内停机影响的动态分区迁移功能。
-被业界广泛证明的具有极高可靠性的AIX系统,以及之上最大限度减少计划内应用停顿的动态应用程序迁移功能。
-PowerHA 高可用性软件实现本地高可用集群以及远程容灾功能。
下面我们看看Power系统硬件、操作系统和Power系统软件这三个技术层面是如何打造Power服务器的高可用性的。
Power系统硬件给力高可用性
Power服务器硬件所具备的RAS特性及PowerVM动态分区迁移功能可以实现下列两项功能:
RAS(Reliability, Availability, Serviceability 高可靠性、高可用性、高可服务性)是最早用于IBM大型机的技术,IBM 致力于使每一个新系列的系统比前一代更加可靠。这就使得今天Power系统性能提升,以至于几乎没听说过有任何因为硬件问题导致的系统灾难。
PowerVM LPM (Live Partition Mobility 动态分区迁移)功能实现了将一台POWER6服务器上的分区实时地迁移到另外一台POWER6服务器上。它允许将正在运行的AIX和Linux分区,以及它们所承载的应用程序从一个物理服务器迁移到另一个物理服务器,而不会对基础服务产生任何影响这项迁移操作只需要花费几秒钟的时间即可完成,可以维护整个系统事务的完整性。
操作系统给力高可用性
AIX提供的一种全新的软件虚拟技术WPAR(工作负载分区),用于隔离用户和应用程序。WPAR是由软件创建的、AIX 映像中的虚拟化的操作系统环境。对于所承载的应用程序来说,每个工作负载分区都是一个安全的、隔离的环境。WPAR中的应用程序认为,它正执行于自己的、专门的AIX 实例中。
动态应用程序迁移是AIX 6.1的一项独特创新,是其WPAR策略的组成部分,它允移动工作负载,而不是整个分区。实际的目标WPAR可以是不同的服务器,但并不一定必须是不的服务器。它比较灵活,也可以在一些具备混合物理体系结构(Power5 和 Power6)的境中使用。它可以将应用程序从需要计划停机以便进行维护的系统中移动到别处。通过将工作负载从不堪重负的服务器移动到负载较轻的服务器,它还可以用于提高性能。而且,通过采用这种方式移动工作负载以允许物理服务器在非高峰期间进入睡眠状态,它还可以帮助节约电能。
Power系统软件给力高可用性
利用IBM PowerHA和Power HA/XD这两项系统软件,可以实现本地高可用集群以及远程容灾功:
IBM PowerHA for AIX是用于Power系列服务器上的高可靠集群软件,通过冗余配置,消除单点故障,保证整个系统连可用性和安全可靠性。HACMP是利用网络来侦测主机及网卡的状况,搭配AIX所提供的硬镜像等功能,在主机、网卡、硬盘控制卡、硬盘或网络发生故障时,自动切换到另一套备用件上重新工作;若是主机故障则切换至备份机上继续应用系统的运行。PowerHA for AIX 解决方案提供可靠的监控、故障检测和业务应用环境向备份资源的自动恢复,为核心数据业弹性奠定基础。
通过PowerHA/XD可以实施容灾解决方案。PowerHA/XD(Extended Distance)是PowerHA
or AIX的一个可选特性,可以提供GLVM(Geographic Logical Volume Manager)异步模式,并支持SVC Global Mirror。这两种选项都可以将应用切换到远程站点的备份资源,而不会影响生产应用环境中的性能。PowerHA/XD使用自身同步模式LVM AIX镜像技术, 通过与对于Enterprise Storage Server (ESS)、IBM System Storage DS6000和DS8000和SAN Volume Controller(SVC)Metro-Mirror对等机的园区级故障切换和对于IP连接对等机故障切换的透明集成,从而能够提供支持。当PowerHA for AIX检测到一个故障时,可以在一个远程冗余系统上将其重新启动,从而能够快速、自动地采取措施,恢复该应用。