“高计算密度、资源整合、易管理、低功耗”等是刀片服务器的天然优势,近两年,刀片服务器在国内外都取得了快速的发展,产品多样化与用户的广泛接受使得这个市场愈加繁荣。在经济环境不确定的今天,刀片更是成为服务器市场中增长速度最快的一种产品,在许多计算中心和数据中心都开始得到大面积采用。
本文回顾了刀片服务器自2000年诞生以来其产品技术不断发展变迁的历程。
回顾系列:
从POWER1到POWER7 IBM处理器20年简史
1998-2009 英特尔至强处理器的12个年头
2003-2009年 盘点AMD皓龙处理器历程
认识刀片服务器
在回顾刀片服务器的历史之前,首先让我们对这个与塔式、机架式或机柜式服务器都不一样的产品有一个全局性的认识。
刀片服务器其实是一种采用模块化设计的“精简版”服务器,为了尽量少占用机柜空间而进行了优化。整个刀片系统由刀片机箱和刀片设备组成。刀片机箱(enclosure/ chassis)可容纳多个刀片服务器,它同时提供了共享的电源、冷却、网络及各种互连和管理组件。当然,不同刀片厂商在刀片和机箱里面添加哪些组件,有着不一样的设计思想。
高密度是刀片最主要的优势之一。我们知道,在标准的高42U、宽19英寸的服务器机柜中,1U(高1.75英寸)规定了任何设备的最小尺寸,对于机架式设备的安装台数有着严格的限制,比如最多放24台1U的机架服务器。而刀片计算的主要优点就在于消除了这种限制,截至2009年,通过刀片系统,一个机柜可实现容纳128个独立服务器的超高密度!
戴尔的刀片服务器
1)服务器刀片
跟理论上的图灵机相比,一台现代意义上的计算机只需要几样东西:I/O用来读取命令和数据,同时传送***的计算结果;处理器用来执行这些命令,对数据进行计算处理;内存则用来存储中间结果。但实际上,到目前为止,要让计算机系统正常运转,还需要其他部件的支撑,如电源、硬盘、网络、人机交互设备(键盘、显示器、鼠标)等等,这些部件不仅占用空间,会产生热量,也增加了系统不稳定的因素。
刀片服务器的出现则在一定程度上作了修正,比如,有些部件实现了共享化(如电源),有些实现了虚拟化(如iSCSI存储可以通过IP实现远程控制),有些则完成被摒弃掉了(如串行接口)。在理论上,随着刀片服务器本身变得越来越简单,其体积会越来越小,制造成本也会越来越低。
惠普的计算刀片内部结构
2)刀片机箱
对于普通的服务器系统来说,机箱往往承担了一些非核心的计算服务,如电源、风扇等,其使用的组件也往往个头、发热量比较大,而且是每台计算机中都会配置相应的组件,利用率也不高。而对于刀片服务器系统而言,通过将这些组件集中在机箱里并供多个计算刀片共享,则可以大大提高共享部件的使用效率。当然,对于不同厂商来说,刀片机箱的规格也是大相径庭。
3)电源
由于刀片服务器需要工作在某个范围的直流电压中,但电力公司输送的却是交流电,而且电压高于计算机内部组件所需的电压,于是,为了实现交直流电和电压的转换,需要一个或多个PSU。同时,为了确保某一个电源的故障不影响计算机系统的运行,即便是入门级服务器也会配有冗余电源,而这也会进一步增加系统的体积和发热量。
一般而言,刀片机箱的电源是由所有刀片服务器共享的。它可以是刀片机箱中的一个电源模块,也可以是独立的专用PSU系统,为多个机箱供直流电。后者可以在保证电力的同时,减少PSU的数量。随着刀片服务器越来越普及,机架式的UPS也开始受到更多欢迎,甚至还有一些专门针对刀片服务器的UPS出现,如BladeUPS。
4)冷却散热
在刀片服务器的运行过程中,电气组件和机械组件都会生成热量,这些热量必须得到妥善处置,才能保证各组件正常工作。与大多数计算系统一样,绝大多数的刀片机箱都是通过风扇来散热。但在设计高性能计算机系统时有一个问题经常被低估,那就是系统生成的热量与风扇散热功能之间的矛盾。
一方面,由于刀片服务器在机箱中共享电源和冷却模块,这意味着它生成的热量不如传统服务器多。但另一方面,由于刀片服务器一般部署的密度更高,当机柜中的刀片服务器数量超过一半时,就开始需要更大的散热效果,对于早期的刀片为说,这点更加明显。实践证明,一个满配刀片的机柜比满配1U机架服务器的机柜需要更多的散热能力,毕竟前者可以在相同空间里装入128个刀片服务器,而后者只有42台机器。
于是,我们看到,一些比较新的刀片机箱为此采用了高速可调节风扇,可以根据系统要求来调控冷却效果,甚至有些还动用了液冷系统。
#p#
5)网络
刀片服务器中集成的网络接口速度越来越高,而且相当大部分还有更好的可扩展性,可以支持更快、更有弹性的网络,同时支持不同的介质,如铜缆和光纤。但这也使得刀片服务器在设计和制造时增加了成本,同时占用了一些空间,并导致系统复杂度的增加。一般来说,高速网络拓扑结构往往需要昂贵的集成电路和介质来实现,但实际上,大多数的计算机都很难充分利用到所有这些带宽。
刀片机箱提供了一条或多条与刀片相连接的网络总线,或者在一个地方单独提供这些端口(而不是在每个计算机机箱都提供一个端口),或者把这些端口合并成数量较少的端口,从而降低连接每个设备的成本。可用端口可能出现在机箱中,也可能出现在网络刀片中。从功能上来说,刀片机箱分两种网络模块:交换模块或直通模块。
6)存储
虽然计算机一般使用硬盘来存储操作系统、应用程序和数据,但这些内容未必要存储在本地。在企业计算环境,更多是连接到外部存储,连接方式如FireWire、SATA、E-SATA SCSI、DAS、光纤通道和iSCSI等。这些接口甚至不一定做在计算刀片上面,可以集中做在机箱里,或者通过其他专门的存储刀片来实现。由于现在的刀片还可以通过SAN来启动,所以甚至可以实现无盘刀片的设计,这种无盘刀片可以配置更多的内存容量或CPU,从而可以更好地满足内存密集型或计算密集型的应用。鉴于刀片存储的方式很多,因此,在选择刀片服务器时要对不同厂商的产品进行比较,根据自己的需要选择是否需要内部存储。
惠普的存储刀片服务器
7)一切刀片化
跟当年机架服务器一样,刀片服务器也提供了一种新的机箱标准。今天,不仅服务器可以做成刀片的样子,其他设备也同样可以,甚至惠普提出了“blade everything”的口号,于是我们看有刀片式的存储,也有刀片式的交换机、刀片式的路由器、刀片式的管理模块、刀片式工作站、刀片式PC等等。比如,对于那些特别强调本地存储的用户来说,就可以选购那种存储刀片安装到机箱中去,以扩大本地存储的容量。
8)应用
对于一些特定的应用场合,刀片服务器是非常适合的,比如WEB主机托管、集群计算等。由于单个刀片通常可以实现热插拔,维护扩容都比较方便,所以在这些场合中,通过增加更多的CPU、内存和I/O带宽,刀片服务器也可以随之处理更大、更多样的工作负载。
虽然在理论上,刀片服务器支持开放、跨厂商的解决方案,但实际上,到2009年为止,要想避免麻烦,你***还是从同一个厂商那里采购刀片及相应的管理工具。当然,随着刀片服务器技术的标准化进程,用户在市场上的选择也会越来越多,比如今年就已经有多家第三方软件厂商开始进入进个新兴的领域。
不过,刀片服务器并不能解决所有的计算问题。你可以把它们看成是一种产品化的服务器集群(server farm),同时借鉴了大型机的封装形式、冷却和电源技术。对于规模非常庞大的计算任务来说,一方面需要刀片服务器组成大型集群,但另一方面,由于刀片服务器的电源密度很高,所以对机房的散热、通风、空调都会带来全新的挑战。
在了解了刀片服务器的基本概念和构成之后,下面让我们一起来回顾刀片服务器的发展历史吧。
刀片的起源
早在上世纪70年代,当时8位微处理器推出后不久,开发人员就把整个微型计算机做到了板卡上面,然后安装在标准的19英寸机架中。在当时,这种架构主要是用来在工业过程控制领域充当小型机控制系统的替代品。早期的机型将程序存储在EPROM中,而且只局限于单一功能,可以执行小型的实时程序。
到了1981年,出现了VMEbus计算机总线标准,并得到了广泛应用。这一标准定义了一种新的计算机接口,即由机箱背板提供多个插槽,允许热插拔多个板卡级的计算机系统,从而提供计算、内存和I/O能力。随后,PICMG组织为当时新兴的PCI总线(CompactPCI)开发了一种机箱/刀片架构。这些基于机箱的板卡级的计算机都有一个共同特点,就是对外显现出来的是一个单一的系统。尽管在一个机箱里面,可能会包含多种计算组件,以满足不同级别的性能和可靠性要求,但总是有一个主控板,这个主控板负责协调整个系统的运行。
后来,PICMG组织允许在背板上的板卡之间使用标准的以太网连接,从而扩充了CompactPCI规范。2001年9月,PICMG 2.16 CompactPCI包交换背板规范得到了采用。这一规范***为装有多个服务器的机箱提供了开放式架构。随后,PICMG又制定了内容更全面、功能更丰富的AdvancedTCA规范,旨在满足电信行业对高可用性和高密度计算平台(产品寿命长达10年以上)的需要。尽管AdvancedTCA系统和板卡的售价通常高于刀片服务器,但AdvancedTCA供应商声称,较低的运营费用和总体拥有成本使得基于AdvancedTCA的解决方案对于构建下一代电信网络来说,都是一种经济高效的替代产品。
互联网数据中心是刀片服务器最早的用武之地。.com时代促使WEB主机托管之类的业务激增,进而带动容易安装,体积小的服务器的需求。而也在这个时代,诞生了***台刀片服务器。
高密度互联网数据中心:刀片服务器的用武之地
2000年,由于全球(尤其美国)主机托管业务持续成长,客户也逐渐无法满足于WEB托管的简单网站功用,因此ISP/IDC只好提出Dedicated Web Hosting(简称DHS)服务,过去是200个客户的网站共享一部服务器,之后变成一个客户网站一部,而机房空间有限,如何让每个客户都有一部独立的Web Server,只好将服务器的外型体积尽可能缩小,使的过去至少6U、7U高度的服务器,纷纷降至1U、2U的水平。不过1U、2U依然不够,ISP/ICP面对持续暴增的DHS申请,需要在原有机房与机柜上能装入更多的服务器,如此2001年由COMPAQ转投资的RLX公司提出了Server Blade,将每个服务器的体积更加缩小,约等同于一张适配卡大小,然后将Server Card插置到符合机架尺寸的机箱(Chassis)中运作,这样的模块设计其实已经在电信机房的设备或工控自动化的计算机(称为单板计算机,Single Board Computer)等领域中采用,刀片服务器只是将相同概念移植到ISP/IDC的机房中。
以最早发表的RLX Server Blade而言,一个刀片机箱为3U高度,可以插置24片刀片服务器,每一片即是一部独立服务器,一片服务器即是一个公司机构的Web Server,如此ISP/IDC便能提供比1U、2U更高密度的DHS。以3U为例,置放1U服务器(称为超薄服务器,Ultra Slim Server)只能放3部,但换成刀片服务器便可放24部,多出7倍数目,同样的机房空间可以多承接7倍的客户业务。 2005年,惠普公司收购了RLX公司。
#p#
刀片服务器发展的三个阶段
从2000年开始,刀片服务器象旋风一样席卷全球。回顾刀片式服务器的发展历史,我们可以将其分成三个阶段来看。
***个历史阶段(2000~2003年)是以“超高的计算密集性”为核心,如RLX Technologies公司的System 324刀片服务器,可以在标准42U机箱中集成324个CPU(标准是84个CPU)。但是为了支持如此高的计算密集度,设计者不得不在单个CPU的功耗和散热问题上做出很大的让步。所以早期采用的CPU都是性能相对较弱的低功耗的处理器,如PIII和Transmeta Crusoe。所以采用低功率处理器,单个刀片服务器性能相对较低是这个时期的另一个特点。对于简单的任务实现,这是个合适的实现方法。
最早的RLX刀片服务器
对于分层部署的数据中心而言,这种类型的刀片服务器适用于***层的应用,例如静态 Web 服务器、安全、网络服务和流媒体,因为这些应用可以简单而廉价地进行负荷均衡。但是对于高性能计算方面而言,由于采用性能相对较低的处理器,处理能力就显得不足了,而且还会带来很多相关问题。如果单个节点的性能越低,那么所需要的节点数目就越多;所要管理的节点数目也越多,对服务器管理软件提出更高要求;此外,根据使用的CPU个数付费的软件,比如,Windows操作系统,大型数据库软件,所要付出的软件费用也就越多,同样提高TCO。此外,即便做出了计算性能上的让步,在实际应用中,由于功耗和机房的散热情况,用户也很难拿到刀片系统提供商所承诺的计算密集度。
刀片服务器发展的第二个历史阶段
(2003~2006.5)是以IBM推出BladeCenter刀片式服务器为分水岭。这个时期的刀片服务器的主要特点是不再过分强调计算密集性,而是通过把计算密集性和单个刀片性能进行了一次权衡,在两者之中选择了一个合适的平衡点。
这个方案的结果就是在合理的提高计算密度的前提下,提高单个刀片服务器的性能,使单个刀片服务器具有通用机架式服务器的性能。同时在整个系统的集成性、可靠性、管理方面大大提高。高性能、相对较低密度的刀片服务器设计将有助于在公司数据中心的主流应用中更多地采用刀片服务器。这种设计能够提供传统机架服务器所具有的个体性能和处理能力,同时具有刀片服务器的成本优势、部署优势、可服务性优势和密度优势。这种刀片服务器适合于高性能 Web 服务器、专用的应用服务器、高性能计算(HPC)机群等等。
目前处于刀片服务器发展的第三个阶段(2006.6~至今)——多元化时代,以IBM推出BladeCentre H为标志,同期HP推出C-class,Sun推出Blade 8000 Modular System系统。这一时期的特征表现为:刀片服务器厂商增多,技术创新不断,产品定位有细分化趋势,没有统一的标准等。
又一个里程碑:IBM的BladeCenter H
在这一阶段,厂商基本上渐渐不再重视计算密度,而转向提高性能。比如电源,散热,背板带宽等方面都得到了重视。例如电源系统基本上在9KW以上,甚至SUN的电源***可以达到18KW,刀片开始支持四路,单刀片背板带宽超过20Gb等。同时开始细分市场和应用并兼顾了第二代产品的优势。
2006年是刀片服务器升级换代跨度***的一年,几乎各大厂商同时发布了各自新一代的产品,同时标准之争也愈演愈烈。IBM率先挑起了新一代刀片的升级风潮。在2月份,IBM推出了革命性的BladeCenter H,增加了紧凑型刀片服务器的带宽,***可将其网络传输数据容量提高 10 倍。同时,IBM还推出了基于Cell 宽带引擎(Cell BE)的刀片计算系统,专为那些需要密集计算能力和独特性能来应对大量图形处理和数字应用的公司而设计。6月底,DELL在PowerEdge 1855的基础上推出了PowerEdge 1955刀片服务器产品。7月,HP发布其历时三年研发的第三代产品——BladeSystem c-class刀片服务器,主要针对企业下一代数据中心而设计,具备虚拟连接(Virtual Connect)、能量智控(Thermal Logic)和洞察管理(Insight Control)等三项创新技术。8月,SUN推出了Blade 8000模块化系统(全球***款no-compromise(毫无折衷,即性能卓越的)刀片平台),摆脱了一年多来没有刀片服务器的尴尬。至此,这四大巨头均完成了各自刀片产品的升级换代。
HP潜心三年的力作——BladeSystem c-class刀片服务器
国内的浪潮和曙光也在2006年4月份推出了刀片新品。其中,浪潮推出了新一代4U12片的刀片服务器NX4120,***的特点是“低功耗”,NX4120的整机比普通刀片服务器节省50%左右的功耗。曙光推出的第二代7U10片的刀片服务器TC1600,则以“机群系统的整合与发展”为核心设计思想,不再以追求***密度为最终目标,而是追求系统的整体平衡性与扩展性。
但总体来看,国外厂商在刀片服务器领域已经远远地跑在了前面,而国内绝大多数厂商的产品均是OEM自国外或台湾厂家,自主创新能力堪忧。
个性十足的SUN刀片服务器
进入2007年,刀片开始呈现出不同的多元化发展态势。如在处理器上,除了采用Intel与AMD x86架构处理器外,Power 6、CELL、Itanium与UltraSPARC T1(Niagara)等更多高端RISC处理器进入刀片领域;4路多核高端刀片产品也纷纷问世。硬盘配置会更加灵活,用户除了可以选择配置2或4颗硬盘的产品外,还有无硬盘刀片服务器可选。另外,作为刀片服务器的扩充,刀片存储设备也开始受到关注,甚至我们可以在刀片机箱内构建SAN环境。
基于刀片服务器构建的中国最快超级计算机曙光5000
同时2007年也是刀片服务器走向中小企业用户的一年。我们看到,这一年中,包括IBM、HP、SUN在内的多家厂商都推出了针对中小企业用户的刀片服务器产品:SUN Blade 6000刀片模块系统(6月)、IBM BladeCenter S刀片模块系统(6月)、惠普 BladeSystem c3000机箱(9月),另外,以Intel为代表的第三股力量的出现,携宝德、浪潮、联想等本土厂商推出刀片式模块化服务器系统,进一步掀开刀片角逐SMB市场的大幕。
英特尔的模块化服务器
随着刀片的多元化发展,刀片服务器也越来越趋向于细分市场的应用。针对中小企业的刀片是一方面,另外更多的专用刀片方案也开始出现,如2008年IBM推出了其基于Power 6以及CELL处理器的刀片服务器,侧重高密度应用领域;惠普推出的"二合一"高密度刀片则主要针对了互联网应用;Dell推出了面向通用计算的M1000E,但其低功耗特性创造了***只有180W的纪录。
#p#
刀片服务器面临的标准问题
由于目前刀片服务器不存在任何工业标准,各家的刀片并不存在互插性,用户一旦选择了某家系统提供商的刀片服务器后,其它家的刀片服务器就比较难以进入。不光是刀片服务器,更多以刀片的为核心的网络交换机、存储交换机(SAN、NAS等)、防火墙和负载均衡模块等待都将更加依赖刀片系统提供商。这点对于用户而言,是一个不好的消息。
为此,IBM成立了一个BladeCenter联盟blade.org,该联盟主要由IBM与Intel构成和主导,联盟的基础为IBM eServer BladeCenter刀片服务器规范,与其它技术标准组织不同的是,BladeCenter联盟的主要工作目标不是建立一个由多家企业共同参与制定的中立的产品标准,而是专注于对IBM eServer BladeCenter服务器规范的推广与合作伙伴的培养。BladeCenter联盟是目前刀片服务器领域较有影响力的标准联盟,自IBM和Intel于2004年9月开放BladeCenter设计规范以来,已经有超过300多家公司宣布使用BladeCenter设计规范,超过350家技术和解决方案合作伙伴参加了BladeCenter联盟计划。目前这一联盟已经吸引了包括Nortel、Nokia、Cisco在内的国际知名厂商的支持。厂商基于BladeCenter联盟制定的设计规范,可以设计包括网络应用、存储、交换等类型的刀片,目前BladeCenter联盟不对外开发背板与控制部分的接口与规范。
标准之争的背后是利益之争
另外一类的做法是直接采用电信标准的ATCA标准,这样可以采用标准的ACTA架构平台,无需进行机箱,电源,交换等部件的设计工作。例如台湾的凌华科技推出过多款ATCA刀片服务器应用于电信领域,以及华为等。
在中国,国内的一家老牌服务器厂商曙光也正在倡议建立中国自己的刀片服务器标准。2006年8月18日,在信息产业部的支持下,高性能计算机标准工作委员会筹备组在京成立,包括中科院计算所、东方通、国家气象中心、微软中国、飞思卡尔半导体、AMD等等在内的25家国内外企业参与并成为创始单位。未来,高性能计算机标准工作委员会将下设7个子工作组,分别围绕刀片服务器、安全、知识产权、操作系统等领域开展工作,这7个子工作组分别由不同的企业来主导。工作组计划在2年内推出针对刀片服务器的***个标准,其余相关标准也将陆续出台。
但是,对于行业标准的制定,如果仅仅只有一家服务器厂商参与显然是不够的。联想、浪潮、宝德等国内主流厂商是跟着IBM的BladeCenter联盟后面走,还是积极参与到国产标准的制订中来,对国产刀片的发展有着重要的意义。
刀片式服务器的市场前景
2008年无论是在全球还是在国内市场,刀片服务器已经成为整体服务器市场中增长最快、最突出的细分领域,所有厂商的刀片式服务器销售量都达到了两位数的增长。目前在国内市场,刀片服务器在整体服务器市场所占的份额不超过5%,但是,随着国内数据中心建设的展开、企业级IT应用整合的进展,以及虚拟化技术逐渐得到部署,具有高度的部署密度、高集成化、高易用的优势的刀片服务器增长速度远远超过整体市场增长速度数倍以上。
2008年刀片服务器展开了更广泛的企业级应用市场,超出了传统的集中于网游和能源行业的应用范围,金融、电信、制造业等行业用户都已经有了刀片服务器的广泛应用。并且,当前***款刀片服务器还经过了重新设计而更加注重中小企业用户的需求,从而使刀片服务器市场能够向中小企业用户延伸。
来自IDC、GARTNER等各大调研机构的数据表明,刀片服务器已经成为服务器市场上的一个新的增长点。IDC数据显示,尽管刀片服务器在中国服务器市场的份额还只有5%左右,但其发展速度非常迅猛,2008年上半年中国刀片服务器市场总体出货量达到18,341台,销售额为5040万美元,比2007年上半年分别增长了61.9%和31.3%,同比增长速度远高于整体服务器市场的增速,成为服务器市场中***发展潜力的产品。
IDC预测今后两年,刀片服务器将保持每两年出货量翻一番的速度,到2010年达到接近30%的市场份额;预计2012年中国市场刀片服务器出货量将达到315,500台,年均复合增长率达62.1%,未来将保持稳步的增长。
Gartner在2008年年底曾发布一份对刀片服务器市场的五年预测报告。该报告认为当前刀片服务器是服务器市场发展最为迅速的部分,占据整个服务器出货量的10%。而在未来五年内刀片服务器将占据服务器市场出货量的20%。而刀片服务器在虚拟化、高性能计算、绿色节能方面的突出优势与无穷潜力必将在2009年达到一个新的高度,迎来另一个历史性拐点。
除了标准不统一之外,刀片服务器在快速增长的同时也面临着一些现实问题。一些老式的数据中心机房设计缺乏对能耗的前瞻性,因而供电系统很难满足高密度刀片服务器的功耗需求,而单纯为使用刀片服务器对现有供电线路进行改造又有些得不偿失,这些都严重阻碍了刀片服务器的进一步推广。同时,刀片服务器的渠道销售情况也不甚乐观,目前刀片服务器的销售模式仍是以厂商直销为主,多数渠道代理商还不适应刀片产品的销售环境。
不过,总体来说,IDC等分析机构对于刀片服务器市场仍然持乐观态度,毕竟高密度的部署是服务器未来发展的趋势,这一点已经开始被广大用户所接受,刀片服务器也因此逐渐在大型数据中心、高性能运算和网络游戏等领域被广泛采用。在2008年,电信运营商在升级3G网络时对刀片服务器进行的大量购买更是推动刀片服务器向更多行业发展的契机,使得刀片服务器逐渐变成各行业的通用产品。
此外,制约刀片服务器发展的几大瓶颈也被逐渐消除。比如,原来刀片服务器的高密度部署对电源和冷却方面的要求,对于国内几年前建的很多机房来说是难以解决的矛盾。而近几年来建设的大量数据中心则大多在能耗方面进行了前瞻性设计,并且很多旧的机房也开始引入国外先进的数据中心设计理念,对现有供电系统进行改造,使其成为了可以部署刀片服务器的环境。
【编辑推荐】