对于服务器来说,处理器当然是最重要的核心组件,它决定了服务器的更新换代与性能等级,所以观察服务器市场的变化与走向,就离不开对这一根基的关注。
前不久我们对英特尔将于2009年3月上市的,基于全新架构的Nehalem-EP处理器进行了展望,认为很值得期待,但我们也没有忘记在x86服务器 CPU市场中,并不是英特尔的独角戏,它顽强的竞争对手AMD仍然在这个市场中拥有着自己可观的支持者。而在2008年里,AMD推出了其第一代45nm 处理器"上海 "(Shanghai),虽然仍然属于第三代Opteron(晧龙)家族,但也有很多细微的变化,这无疑将使得2009年的服务器市场越发精彩。那么我们就来看看在新的一年中,英特尔与AMD将呈现出怎样的竞争态势。
AMD新军"上海":神秘与困惑并行
在 2008年的11月13日,AMD正式推出了其首款45nm Opteron处理器,但并没有以第四代Opteron自居,从中可以看出它与第三代Opteron仍然是一家人,也就预示着其在内部结构上并没有质的变化,而更多的是一种"量变"式的增强。不过,在AMD的介绍中,笔者倒是觉得有些困惑,也让这款处理器显得有些神秘。
首先,我们知道AMD 引以为荣的点对点处理器互联架构是其一大法宝,这个架构的基础就是AMD主导开发的开放式点对点总线技术 HyperTransport,简称HT。从早前的第三代65nm Opteron(即Barcelona,巴塞罗那)的介绍中,我们可以看出它就已经采用了3条HT总线的设计,而在这一点在"上海"身上并没有变化,可是在一些规格上却有了不同。
在 Barcelona的设计中,双路的2xxx中3条HT总线中有一条负责与另外的CPU互联,另外两条负责I/O处理,8xxx的3条HT都可用于CPU 的互联,每条HT总线的总位宽是16bit。根据AMD的计划,将会全面推行HT 3.0标准,那么以现有的规格计算,采用2GHz时钟的HT 3.0在16bit总位宽下的带宽正好是8GB/s,三条共24GB/s,与其宣传相符。也就是说,Barcelona用于CPU间互联的带宽为8GB /s,可是在Shanghai的新特性介绍中,我们看到的数值却远高于此。
英特尔Nehalem家族:后势可畏
相比较Shanghai的高调发布,英特尔在服务器市场上的新军Nehalem-EP则迟迟没有露面,只是先派出了桌面新锐Core i7亮相。可在笔者的眼中,Core i7所透露出来的杀气,让我们对Nehalem-EP不可小看。有关Nehalem-EP的介绍与分析,可参见早前笔者的专文,在此就不详细介绍了,在此我更多的想谈谈Nehalem-EP与Shanghai的对比。
相对于Shanghai较Barcelona的小步前进,Nehalem-EP相对其前辈Harpertown(即Xeon 5400)可以说有了质的变化。从Nehalem家族开始,AMD Opteron的两大优势(点对点互联及集成内存控制器)将彻底丧失,并反而取得了领先(QPI的带宽高于HT 3.0,和DDR3的带宽和能耗表现强于DDR2),因此虽然先行的只是桌面版的Core i7,但也足以让我们对Nehalem-EP充满期待。
在早前笔者的专文中,我们分析了Nehalem-EP相对于Harpertown的进步,并进行了比较,那么相对于Shanghai呢。
从对比中我们可以看出来,Nehalem-EP在规格上已经明显超越了Shanghai,而最重要的是我们前面说过,从Nehalem开始,英特尔也走上了点对点互联和集成内存控制器的发展道路,这对于Xeon家族未来的发展之重要性不言而喻。打个比方,传统的基于FSB的4路服务器,在布线上的难度就很大了,如果再上8路就基本不可想像,这也是为什么传统的8路服务器厂商基本上只选择Opteron的原因。而QPI的加入则让英特尔在这方面重新站在了与AMD相等的级别上。另外Nehalem架构的模块化设计理念,也将为Nehalem-EP后面的新品创造更为灵活的诞生环境。
借助QPI总线,未来的4路Nehalem服务器的设计也将非常简单明了
下面我们就来看看Nehalem-EP之后还有哪些新品将登陆服务器市场。
1、单路服务器CPU--Lynnfield/Havendale
Nehalem架构的一大亮点就是将CPU分成核心(Core)与非核心部分(Un-Core),前者就是CPU核,后者则包括了内存控制器、QPI总线以及想要加入的新功能组件,而GPU与PCI-E控制器就是Un-Core部分的下两个成员。由此,也将诞生新的处理器系列。
把QPI总线换成PCI-E和DMI(直接媒体接口)控制器就变成了Lynnfield(Clarksfield是面向移动市场版本)
在Clarksfield基础上,去掉两个CPU核换上一个GPU就成了Havendale(Auburndale是移动市场版本)
根据英特尔的"二路先行,一路其次,多路最后"的发展策略,在Nehalem-EP之后将要出现的就是单路服务器用的CPU,接替现有的Xeon 3xxx。在这个市场也将分为4核和双核两个领域。4核的代号就是Lynnfield,其与Nehalem-EP主要的不同就是将QPI总线换成PCI-E和DMI控制器,IMC也变成了双通道。双核的代号Havendale,将两个CPU核换成了GPU,实现了最高的集成化。可见Lynnfield与Havendale将会进一步简化单路服务器的设计,降低成本。预计两者会在2009年第二季度推出。
2、多路服务器CPU--Nehalem-EX(Beckton)
在Clarksfield之后,预计于2009年第三季度推出就是面向多路服务器市场的8核Nehalem,俗称Nehalem-EX,内部代号Beckton,它将接过Xeon 7xxx的市场并向更高端挺进。
现有Xeon 7xxx的接班人,Nehalem-EX的架构图,相较Nehalem-EP有了明显的扩展
Nehalem-EX在Nehalem-EP基础上,增加了4个CPU核、一条DDR3通道和一条QPI总线,可以说配置相当强悍,而4个 QPI总线也就意味着不仅仅可以用于4路服务器市场,通过专有的芯片组支持,Nehalem-EX也可以容易的进入8路服务器市场。
通过未来的Boxboro芯片组,Nehalem-EX处理器将很容易的通过QPI总线搭建8路服务器,在这个市场Opteron 8xxx称霸的历史也将从此结束
英特尔2009年处理器与相应配套平台,从中我们可以了解到更多的关于芯片组的信息
综上所述,我们可以发现Nehalem家族的后发之势的确令人生畏,AMD也将面临更大的压力。与之相比,Shanghai的实力也的确令人担忧,如何保住现有的市场份额将成为AMD首先面对的问题,而这其中最为敏感的就是价格因素,如果性能不如对手,价格又没有优势的话,Shanghai的处境就远没有它发布时那么风光了。
AMD给出的Shanghai新特性介绍,包括了45nm工艺带来的好处(比如更高的主频,更节能)、可支持DDR2-800(Barcelona只支持到DDR2-667)、可以更节能的智能预取、增强的快速虚拟化索引(RVI)以及更高的CPU间互联带宽,上图标注的17.6GB/s明显高于Barcelona的8GB/s
这点让笔者有些琢磨不透,而在上海的发布会上,我们也确定了其并没有在HT频率上做什么明显的手脚,仍然在HT 3.0的范围内。
AMD上海处理器高调亮相 45纳米服务器战略展开布局
很明显,Shanghai的HT总线传输频率为4.4GTs,相对于目前的4GTs(2GHz时钟频率)提升有限
那么我们的疑问来了,在4.4GTs的传输率下,如何达到17.6GB/s的总带宽呢?显然位宽是32bit,可Barcelona的设计是3 条各16bit的HT总线,每条最高8GB/s的带宽。如果Shanghai是在Barcelona的基础上改进而来,那么在总体的架构上就不可能很大的变动,但CPU间互联带宽提升如此之大,我们也就有足够的理由怀疑了。对此,笔者分析有两种可能:
1、AMD的介绍有些误导,17.6GB/s是指CPU的I/O总带宽而不是CPU间互联的带宽,如果这么考虑,那一切也就顺理成章了(两条HT总线,总位宽32bit,传统率为4.4GTs)。
2、Shanghai将两条HT用在CPU间的互联,只有一HT用在了I/O。
如果细分析,我认为,第二种可能性很小,因为Shanghai还有4路/8路的设计,但HT总共就3条,若是用两条HT来联接CPU显然是不合理的,所以笔者最终断定Shanghai的CPU互联带宽现在仍然是8GB/s,到2009年第二季度全面升级后将提升至8.8GB/s。
对比英特尔的Nehalem架构,我们就能看出来Opteron原先的HT优势在2009年面对前者的QPI总线(Nehalem-EP的 CPU间互联与I/O带宽均为25.6GB/s)时以处于下风,这主要体现在传输位宽小,传输频率低。当然,HT也是在进步的,在2008年7月23 日,HT组织发布了最新的HT 3.1标准,从中可以看出至于在频率上与QPI已经相当了,可是Opteron何时用上这个成果就很难说了,况且不改变传输位宽的话,未来的发展仍然被动。
HT总线的历代标准总览,最新的3.1标准2008年7月出台,不知何时用在Opteron处理器上
其次,另一个让比较迷惑的一点就是仍然采用DDR2内存,这在当前大谈绿色节能的背景下,显得有些不可思议。DDR2的接班人DDR3在节能方面有着更好的表现(工作电压降低了0.3V,理论能耗降低了16.7%),而且传输频率比DDR2要高出近一倍。如果说DDR3因为成本的原因不会在台式机市场过快的普及,但对于更注重能耗的移动和服务器市场,DDR3理应更受关注(当初DDR2内存也是率先在这两个市场普及的)。也许Shanghai是为了最大限度与现有市场兼容,历史上AMD也向来是稳扎稳打的,勇于挑起产业变化的是其竞争对手英特尔(如Rambus DRAM和FB-DIMM的采用,此次DDR3也走在了前面)。但我们可以注意到,在HT总线上,虽然AMD宣称Shanghai可以向下兼容,可是如果要想达到最佳的效果,还是必须要有新的支持4.4GTs的平台,那么为什么不能勇敢的采用DDR3呢?按照AMD的路线图,到2010年才会转向DDR3 平台,我甚至有些怀疑是不是AMD在技术开发能力上出现了什么问题?
总之,AMD长期以来最值得骄傲的两大优势--点对点传输总线与集成内存控制器,在Shanghai这一代将不复存在,反而将要开始追赶后来居上的对手,这的确让笔者有些感叹。
因此不得不说,Shanghai的发布在笔者的眼中有些神秘和困惑。当然相对于Barcelona的进步肯定是有的,主频与内存带宽的提升无疑对性能有直接的帮助,只是如果自己进步的步伐不如手快的话,那么就要相当小心了。 #p#
2009年:"至强"与"皓龙" 对对碰
说到价格,我们就不能不先看看双方的产品定位。AMD一方的Opteron有1/2/8三个系列,而英特尔在x86领域也有3/5/7三个系列,它们是一一对应的关系。我们先看看双方产品编号的含义:
英特尔至强(Xeon)家族产品的编号说明
AMD晧龙(Opteron)家族产品的编号说明
在AMD的眼中,就是Opteron 1xxx对战Xeon 3xxx,Opteron 2xxx对战Xeon 5xxx,Opteron 8xxx对战Xeon 7xxx,SE版本对应的是Xeon X版本,HE版本对应的则是Xeon L版本。我们可以通过下面这个表来明晰这种对阵形式。
AMD给出的产品布局图中,可以看出明确的对阵形势,而在这个表中已经有Shanghai的身影(Opteron型号的后两位的是7x或8x的即是),不过AMD在这里并没有把Xeon所有的产品放上去(点击放大)
我们上文也谈到了Shanghai所将面对的严峻形势,那么AMD将如何对Shanghai进行定位呢?从最新的定位体系中,我们就能看到AMD的用心。
Shanghai的CPU主频起点正好是Barcelona的主频高点,但在价位上Shanghai基本上与Barcelona之间有两档的重合区间,希望用前者迅速替换后者的意愿显而易见
我们能看出Opteron在整体上,这频较对手有比较大的差距,这也与英特尔已经采用45nm工艺1年多有关,相信Shanghai 日后会有更高主频的产品出现,而从目前的一些测试成绩来看,Shanghai最高型号与Xeon X系列的最高型号(X5492)应该能打成平手,从这点来说Shanghai的确不容易,因为主频相差了700MHz。所以,以目前的这个价格表来看,Shanghai的优势是比较明显的,不过如果Nehalem-EP(Xeon-5500)在2009年3月上市时的价格也像Shanghai对 Barcelona那样的"从中间嵌套",以Nehalem-EP的出色性能,Shanghai的价格压力将更大。
不过,以英特尔的个性,会不会这么慷慨还难讲,但是手握性能优势的Nehalem-EP无疑在价格策略上更为灵活,相较之下Shanghai在2009年还可能要继续紧缩银根。
未来展望:英特尔步步为营 AMD小心应战
英特尔与AMD的竞争已经不是一天两天了,更不会在一朝一夕间决出胜负。当年Pentium4的设计上的弯路虽然给了AMD很大机会,但也并没有让英特尔一蹶不振。现在也是如此,从酷睿的成功,到Nehalem的诞生,给英特尔处理器发展之路注入了越来越强大的动力,AMD作为先进理念的领导者在被后来者追上后,也并不会就此沉沦,双方的眼界早已扩展到3年之后,所以当我们看完2009年的对对碰后,不妨再看看更远的走势,也许并不完全靠谱,但至少能说明一个大概。
英特尔企业级处理器的发展路线图,在Nehalem之上的是安腾家族,本文并不涉及
从英特尔的发展路线图中,我们可以看到,在Nehalem之后将会出现32nm的Westmere,其内部架构将和Nehalem一样,而到了Sandy Bridge,则将迎来新的架构变革,这里最主要的变化将是AVX(高级向量扩展)指令集的加入,从此也将引出多核+向量计算的时代,也就是"众核"时代。当然,这其中少不了英特尔所谓的x86 GPU--Larrabee的功劳,英特尔未来在CPU核心的设计上也将更为灵活。
英特尔设想的未来CPU核心架构,可以有多种内核构成,通过大核与微核的灵活搭配,来分别应对重型的少线程任务或是轻型的多线程任务
与英特尔相对应的,AMD也提出了自己的发展路线,不约而同的选择了多核化发展,但在轻核方面谈得并不多。
AMD的服务器CPU发展路线图
Magny-Cours平台内存连接设想图,通过外接缓冲器的方式连接更多的DDR3-DIMM,不过这个方式在今年的Nehalem-EX平台上就将出现
在2009年下半年,我们将会看到AMD 6核的Istanbul,相信它的竞争对手就是Nehalem-EX,不过从现有已透露的规格上看,想要超越后者基本上没有希望,仍然采用DDR2平台甚至让人多少有些失望。所以我们的目光应该向2010年,步入DDR3平台的Magny-Cours和Sao-Paulo,当然我们也希望那时AMD给处理器配备的HT带宽可以赶上QPI。
最后我们可以用一个综合的发展路线图来表述一下双方的未来走向,在相应的时间点上将出现什么竞争态势也将一目了然。
以相同的时间轴制作的AMD与英特尔服务器CPU发展路线图,预计2011年AMD将跨入32nm时代,而从Sao-Paulo开始,AMD将把HT总线数量提升到4个,但愿那时的主频和位宽也能用相应的提升(点击放大)
总的来说,AMD的设想似乎更远,而英特尔的战略也很清晰,但2009年对于双方都将是重要的一年,尤其是对AMD而言。现在,英特尔的至强家族已经在市场上占据了强势地位,Nehalem的到来只会加分而不会减分,可相对于上一代产品,Shanghai的亮点实在有限,其后来者 Istanbul也不见得有多大起色。在与Nehalem家族的竞争中,Opteron也许只能更多的靠价格手段来维护自己的市场领地。但如果 Nehalem性能领先明显,对于成本并不太敏感的企业级市场,是否还会继续青睐Opteron就很难说了。
另一方面,AMD在2008年将半导体工厂分割独立,那么在2009年也将进入一个全新的发展阶段与环境,这种产品设计与制造分家状态的磨合期也将会对AMD的供货带来不确定因素。产品的发布不代表产品进入了市场,只有产品能稳定的批量供货,才能保证稳健的OEM关系,尤其是在性能可能不如对手时更为重要。这些对于原来拥有工厂的AMD就是一大挑战,那么在2009年这一因素就更不能忽视。而稳定的供货也只是保证市场份额的基础之一,还有很多方面会左右OEM客户的选择,比如价格、性能与节能表现等等。
不过,从另一个角度讲,AMD的风格向来以实用为主。现在它在CPU与GPU两条战线上争战,所处的地位和环境也都比较相似,这也许就是它的风格使然。在GPU市场,基本上是NVIDIA更喜欢在技术上拔尖,引领方向,在CPU市场,这一角色换成了英特尔。AMD推出的HD4xxx系列GPU就是实用主义的表现,在市场上也获得了良好的反馈,不过后继的发展潜力就不如对手的280/260家族。那么在CPU市场上呢?技术第一的头衔仍然由你英特尔掌握,我只要市场最大化就好了,所以我们看到了Opteron的一些保守做法。或许,市场也会接纳AMD的这种风格,就像GPU市场一样,可这里涉及到了性能、价格、周边配套组件、行业支持等多个方面,每个用户"务实"的角度也不尽相同,所以AMD的思路也会遇到很多不确定性因素的影响(HD4xxx的成功就是基于其与对手相差甚微的性能表现),而且越有惯性的东西,虽说改变不易,但当真开始朝相反的方向改变时,再变回来的难度也就同样巨大。对照现有的情况,我们不得不说Opteron的风光已经不在,并且在近期也无法迅速扭转这个局面,还剩多少用户在被惯性所驱使而坚守阵地?他们快倒戈了吗?相信 2009年里这个问题会一直悬在AMD的头上,而这个问题是否变得更为尖锐,就看2009年Nehalem服务器CPU家族的价格策略了。
对于2009年服务器CPU市场的具体竞争走向与结局,就让我们拭目以待吧。在为英特尔叫好的同时,我们也为AMD加油,因为我们希望客户们能在新的一年中买到更优秀与更实惠的服务器,相信这也是英特尔与AMD所希望看到的......
【编辑推荐】