有没有不坏的服务器?

服务器
如果我们构建一个7×24×365稳定运行的系统,对于永续运行构成威胁的故障,一个是来自硬件,一是来自软件。无论硬件还是软件都会造成系统故障。从经验看,软件的故障率远远高于硬件。这是不是意味着硬件的高可靠性失去了意义呢?

 世界没有从来不坏的服务器,这是可以肯定的。

但对于业务应用而言,“Uptime”,“All the time”也就是系统的永续运行是最基本的需求。要求信息系统能够提供7×24×365的永不间断服务。如果用99.999%可靠性要求,一年累计的宕机时间不能够超过5分钟。业务对可靠性的近似苛刻要求也有其不得已的苦衷。根据统计,金融企业每次宕机损失平均为1000万美元,所造成的无形资产损失更是无法估量。

如何处理业务需求永续运行和服务器宕机之间的矛盾?有一点可以肯定,我们需要的不是永不宕机的服务器,而是永不宕机的系统。

如果我们构建一个7×24×365稳定运行的系统,对于永续运行构成威胁的故障,一个是来自硬件,一是来自软件。无论硬件还是软件都会造成系统故障。从经验看,软件的故障率远远高于硬件。这是不是意味着硬件的高可靠性失去了意义呢?

硬件的高可靠性并不因为软件高故障率而有所削弱。硬件的高可靠性不能够解决应用软件的故障。对此,专家指出,软件错误属于应用逻辑问题,硬件不能够修复逻辑的错误。解决软件故障需要通过软件升级和打补丁来解决,但这不意味着硬件高可靠性没有意义。在任何时候,我们都需要构建一个稳定可靠的硬件基础平台。硬件不可靠将直接导致系统崩溃。

我们没有一个永不宕机的服务器。为了保障系统不中断,很多用户采用了HA(高可用性)解决方案,通过双机冗余的方式来解决问题。目前,双机方案普遍被采用,但是非常遗憾,系统中断仍然时有发生。远的不说,亚马逊云计算宕机事件仍然历历在目。

专家指出,问题就出在双机方案。从根本上,设计双机冗余并能够解决系统不中断的问题。双机只保障了在系统发生故障时的,系统可以恢复运行的问题。至于恢复的时间,也就是解决了MTTR(平均修复时间)的问题。鉴于目前系统日益复杂,交易量和交易规模庞大,任何一个系统要想进行全面恢复,其MTTR一定不会断,5分钟基本是不可能的。

如果双机冗余的方案行不通,就只有继续在硬件层面需求答案。容错服务器就是惟一的答案。道理很简单,从处理器、内存、I/O通道,容错服务器都采用了双系统,通过锁步技术确保计算的可靠性和可信性。说白了,就是2个一样的系统计算同一个应用,当答案一致,就认为计算结果可信。否则推倒重来。以往,业内对容错服务器的认知多集中在可信计算上。但人们也忽略了,双系统对可靠性的贡献。双系统同时发生故障的概率非常低,当其中一个部件,例如CPU出现硬件故障时,容错服务器失去锁步,也就是失去可信计算的功能。但系统服务不会中断,管理人员拥有充裕的时间对故障部件进行更换,恢复可信计算。

双机冗余也是双系统,但与容错服务器最大的差别在于,容错的双系统是一个系统,运算处理同一个上层的应用。双机冗余在业务处理上,是两个单独的系统,分别处理应用。双机冗余依靠HA软件来判别故障。当一个系统产生故障时,双机冗余的系统,就会存在数据的不一致性。所以,双机冗余只能够恢复,而不能够保障业务不中断。容错与双机冗余不同,容错不存在应用软件不一致性,通过单系统承载应用,虽然降低了可信性,但却可以保障系统不中断。这也是为什么,容错可以提供超过99.999%可靠性的俄原因。

世界上没有不宕机的服务器,但有可能存在永续运行的系统。不存在悖论,容错就是答案。

但非常可惜,出于商业上的考虑,无论是操作系统、数据库,还是应用软件的商家都不会主动向用户推介容错方案,因为推广双机冗余方案,从硬件到软件,皆大欢喜。

看来,容错服务器只能是用户的选择!因为容错意味可靠,容错意味高效,也意味着真正可以节省大量的金钱!
 

责任编辑:常疆 来源: 51cto.com
相关推荐

2016-08-01 10:46:06

华为

2018-03-01 10:26:25

无服务器计算架构

2020-03-12 07:55:50

访问量飙升DDoS

2010-05-19 15:00:37

IIS服务器

2017-09-14 08:43:05

2010-05-21 11:50:54

IIS服务器

2009-08-26 09:29:47

服务器电源

2011-03-07 12:46:58

2015-05-29 13:22:10

Linux挂载运维

2017-11-10 08:58:49

Web服务器应用程序

2013-10-29 10:13:49

微服务器x86服务器x86

2014-09-22 09:52:06

2009-02-27 11:15:00

多线程服务器MTS专用服务器

2020-11-24 13:47:56

服务器

2014-04-03 11:44:29

企业云服务器物理服务器

2012-12-19 10:09:19

微服务器云服务器

2009-08-02 11:58:49

刀片服务器高计算密度机架式

2010-08-29 20:53:03

DHCP服务器

2011-03-29 15:30:20

Zabbix服务器

2018-02-23 15:18:22

云服务器独立服务器差异
点赞
收藏

51CTO技术栈公众号