追逐高可靠的脚步永不停歇——专访美国容错公司

原创
服务器
随着中国经济对信息化倚赖程度不断提高,如何为经济发展提供一个高度稳定可靠的信息化基础支撑平台已经变得非常迫切。对此,有很多选择,大型机、小型机和X86都是备选技术,特别对于云计算,业内也给予了厚望。但是在此,特别值得注意的是已经有近40年历史的容错技术,恰逢美国容错公司中国区总经理佘秀琍从香港来京,笔者有幸对她进行了专访。

 ——专访美国容错公司中国区总经理佘秀琍

51CTO传媒副总编常疆

随着中国经济对信息化倚赖程度不断提高,如何为经济发展提供一个高度稳定可靠的信息化基础支撑平台已经变得非常迫切。对此,有很多选择,大型机、小型机和X86都是备选技术,特别对于云计算,业内也给予了厚望。但是在此,特别值得注意的是已经有近40年历史的容错技术,恰逢美国容错公司中国区总经理佘秀琍从香港来京,笔者有幸对她进行了专访。

[[77061]]
51CTO专访美国容错公司中国区总经理佘秀琍

 

市场有利容错技术发挥

中国用户对信息化依赖逐步加深,也带来了对高可靠性的需求,容错技术逐步得到重视,其高可靠性特点有望得到发挥。

记者问:Stratus有30多年的发展历史,1990年Stratus就已经进入中国市场,作为容错领域的代表厂商,您怎么看目前的市场现状?

佘秀琍:从全球市场来看,对于容错技术需求仍然强劲,在美国,Stratus在金融、航空等很多领域,30多年来沉淀了一批忠实的客户,他们对系统可靠性要求非常高,我们给他们提供的机器,可靠性高达99.9999%,也就是6个9的水平,基本做到了全年365天高可靠运行。

Stratus公司长期专注在容错服务器这个领域,经历了这个领域的时代变迁。这样的一个产品,20年前很贵,因为它是构建在专属平台上的,虽然可以提供很高的可靠性,但价格不菲。大约13年前,Stratus开始对产品进行转型,从专属平台过渡到开放的平台,选择X86处理器和Windows系统进行支撑,如此就大大降低了成本,降低了容错服务器的门槛,在保障高可靠特性的同时,拉近了与用户的距离。

从中国市场来看,对容错服务器的需求与日俱增。以往,用户主要集中在银行、证券等少数领域,因为这些用户的业务应用对系统可靠性要求非常高,只有容错技术可以满足需求。此外,这些用户的业务对于信息化系统高度依赖,信息化程度非常高,容不得系统有任何闪失。系统可靠性是这些用户首要考虑的,然后才会是成本。

如今,中国用户对信息化依赖逐步加深,也带来了对高可靠性的需求,容错技术逐步得到重视,其高可靠性特点有望得到发挥。

高可靠性和成本

很多业务应用,如医院,首先考虑的人命关天,并不是系统的高性价比。以牺牲可靠性来换取性价比是没有意义的。

记者问:从用户的角度,永远要求系统高可靠低成本,这是一个可以协调的矛盾吗?   

佘秀琍:这是一个考虑问题的角度问题,对于很多业务应用,如医院,首先考虑的人命关天,并不是系统的高性价比。这些应用对高可靠性的需求是不打折的。以牺牲可靠性来换取性价比是没有意义的。

中国经济的发展,让中国更多与国外接轨,在这个过程中,用户对系统靠性的要求越来越高,这就给容错技术带来很多的机会。对于Stratus而言,在继续提供高可靠产品方案的同时,也考虑在不牺牲可靠性的前提下,尽可能降低用户的成本。Stratus从Unix平台,迁移到X86平台,主要的考虑就是降低成本,扩大受众规模。如今,Stratus所提供的ftServer容错服务器产品,全部基于X86平台,仍然可以提供99.9999%高可靠性。当然,我们仍然确保对老用户的技术支持,不会抛弃任何老用户。

容错技术市场定位

容错服务器是惟一提供99.999%以上,接近99.9999%的超高可靠性的产品,可以确保系统每年的宕机时间不会超过5分15秒。这也是容错服务器备受信赖的原因。

记者问:随着硬件制造水平的不断提升,产品可靠性提升明显,从x86到小型机、大型机,用户可选择的方案很多,因此应该如何为容错服务器来定位?

佘秀琍:硬件制造水平进步的确带来了产品可靠性的提升,从而减少了系统宕机的风险,与此同时也应该看到,对系统高可靠性追求依然没有停歇,无论是X86,还是小型机还是需要借助集群来提升系统的可靠性,此外,还可以通过软件的方法,分散风险,降低系统宕机影响范围。

对于小型机而言,仍然是一个很贵的产品。由于小型机单机可靠性超过X86,因此小型机双机方案优于X86双机,但其可靠性也只有99.99%,也就是4个9的水平,每年宕机时间不会超过53分钟,似乎是可以接受的数字。但需要注意的是,这只是代表机器出错的概率,并不是系统累计宕机的时间。这就可以解释为什么有些系统故障,动辄2~3小时无法恢复的原因。

如果双机方案切换时间为0,所谓无缝切换,那么系统累计宕机时间与系统可靠性是一致的,但现实的情况是,双机方案很难实现0时间切换。系统切换如果失败,那么系统恢复就需要借助备份等其他技术手段,系统恢复时间有时候难以预料。

验证双机无缝切换最简单的办法就拔掉心跳线,不敢拔,所谓双机无异于摆设。与之相比,容错技术可以进行任意热插拔,在容错方案中,不仅对处理器进行保护,同时对内存、I/O都进行冗余保护,当其中任意冗余部件出现故障时,故障部件被隔离,相应环节进入单机工作状态,失去容错保护,待热插拔更换故障部件之后,系统恢复容错,期间不会有任何宕机事故发生。

容错服务器是真正的无缝切换设备,99.999%以上,接近99.9999%的超高可靠性,可以确保系统每年的宕机时间不会超过5分15秒。这也是容错服务器备受信赖的原因。

云计算需要容错技术

云计算、虚拟化和容错技术并不对立。容错服务器的高可靠性恰恰是虚拟化理想的硬件平台。

记者问:您觉得虚拟化、云计算对于容错技术是否构成冲击呢?

佘秀琍:以虚拟化为基础的云计算应用首要解决了资源效率的问题,通过资源池化,把系统的能力充分发挥。因此虚拟化首先解决的是效率,并不是可靠性。与此同时,虚拟化也提供了热迁移技术,对提升可靠性带来一些帮助。但这种帮助并不能够用来针对意外风险,如物理设备宕机。如果物理设备意外宕机,内存、I/O中的临时数据都会丢失,在这种情况下,热迁移是没有办法进行的。

热迁移的价值在于应对计划内停机,例如需要对某物理设备进行维护升级,这时候就可以通过热迁移把应用迁移走,升级完毕再迁移回来,这从一定程度上提升了系统维护的安全性。热迁移的另外的一个价值在绿色节能的贡献上,可以通过某种策略,在计算的波谷期对虚拟机进行相对集中,然后关闭多余的计算能力,从而达到节省能源的目的。

云计算、虚拟化和容错技术并不对立。相反,虚拟化技术应用必然带来对物理设备可靠性的高度需求,容错服务器的高可靠性恰恰是虚拟化理想的硬件平台。

中国市场策略

我们也在考虑针对中国用户,提供完全本地化的服务,从而全面提高我们的服务水平,满足中国用户的需要。

记者问:从市场拓展角度,Stratus的策略是什么?

佘秀琍:对于用户来说,应用系统是由硬件和软件共同组成的,Stratus专注在硬件部分,为了更好地服务用户,我们策略是采取合作伙伴策略,与ISV、SI合作,共同为用户提供专业化服务。在全球,我们有很多的合作伙伴,很多合作伙伴国际性的公司,他们在全球,也包括中国市场开拓业务,这些合作伙伴给我们带来很多的订单。与此同时,我们也积极寻找本地的合作伙伴,一起为用户提供***质的服务。

对于ISV、SI来说,他们对于Stratus产品和技术非常了解,这些产品和技术可以给他们的软件产品提供最稳定的支撑,这意味着可以减少ISV和SI的支持服务成本。因为对于用户来说,如果采用其他方案,一旦出现宕机的事件,单纯依靠用户的技术实力往往解决不了问题,是需要ISV、SI来提供技术支持的。如果采用Stratus的硬件平台,可以彻底排除硬件因素,这就大大降低了技术服务的负担。ISV、SI可以集中精力解决由于软件带来的宕机问题,而这也是他们擅长的。因此,ISV、SI非常愿意与Stratus合作。

中国是Stratus最重要的市场,公司非常重视对中国市场的投入,我们在中国已经有20多年的发展历史,产品也非常适合中国市场发展的需要。2013年,我们将继续加大中国市场的投入,加强与合作伙伴的合作,提高合作伙伴的数量和质量。与此同时,我们也将加强对ISV、SI的培训和技术支持。在全球,我们针对Stratus产品提供7×24×365主动监管服务,及时发现硬件的潜在问题,主动更换硬件故障部件。在中国,考虑到中国用户的敏感性,我们会尊重用户意见,同时我们也在考虑针对中国用户,提供完全本地化的服务,从而全面提高我们的服务水平,满足中国用户的需要。

 

 

责任编辑:常疆 来源: 51CTO.com
相关推荐

2022-03-15 11:30:56

数据中心

2015-06-18 17:25:19

地铁华为

2023-03-20 10:50:29

2009-05-05 09:11:49

信息化劳动保障

2011-05-18 16:34:59

笔记本推荐

2017-04-21 15:04:03

存储存储芯片

2023-06-01 17:23:26

AI模型

2020-04-08 15:15:11

华为

2013-05-28 09:41:59

高可靠服务器容错技术

2015-08-05 15:59:02

powerOpenStack

2009-09-14 09:12:36

2011-05-25 19:31:07

Stratus信息化

2010-10-27 13:27:02

芯片制造厂

2009-03-13 16:45:38

2014-08-14 10:55:06

智能手机户外

2015-07-02 12:50:41

电子银行华为

2014-08-14 11:06:27

智能手机

2010-05-14 15:54:21

腾讯公司运维管理Avocent

2016-12-22 15:50:38

宽带数据网络
点赞
收藏

51CTO技术栈公众号