再一次,继2003年抡起“大锤”推出首款皓龙处理器,以超前的 64位计算以及创新的直连架构、超传输总线、集成内存控制器设计,改变了x86处理器的发展方向与格局;时隔多年,
2011年11月14日, AMD宣布发布并立即上市两个全新系列处理器,AMD皓龙6200、4200系列处理器。此款以“推土机(Bulldozer)”为架构名称的皓龙采用了全新模块化制造工艺,是AMD皓龙推出以来***的架构设计更新,将以***16核心、高性价比的方式为云计算及虚拟化应用等做好准备。
AMD全球副总裁兼商用事业部总经理Paul Struhsaker表示:“我们的行业正处于一个新的接合点,虚拟化已经带来更加可靠的整合,而企业正寻求通过云计算实现更高的灵活性和效率。我们为此设计了全新的AMD皓龙处理器,最值得期待的新服务器产品和架构已经到来,新一代AMD皓龙处理器以最全面的产品线,带来性能、可扩展性和能效的***平衡。基于此,领先的OEM厂商可以为云计算、企业用户和高性能计算(HPC)客户提供一整套解决方案。”
模块化设计带来性价比双重提升
早在去年的时候关于推土机的消息就屡屡传来,而新一代架构的诸多特性则更加吸引眼球。2003年AMD***发布皓龙产品的时候,AMD是在业内首家在X86处理器引入集成内存控制器,也是在X86架构上***个引入64位计算CPU的厂商。多年以来,AMD的产品不断创新,“推土机”可以说是***一代具有创新意义的产品。
此次AMD将在服务器级市场推出代号分别为“Valencia(皓龙4200系列)”和“Interlagos(皓龙6200系列)”的推土机处理器产品,它们分别面向入门级双路和高端四路服务器。
新款皓龙处理器支持内存频率***达1600 MHz,最多4通道内存;每CPU最多支持12个内存插槽,每CPU最多支持384GB内存;作为业内唯一支持1.25伏超低电压内存的x86处理器,新款皓龙支持***四个x16 HyperTransport超传输总线技术(HT3)连接,每个连接***支持6.4GT/s。
以往市场中的AMD皓龙处理器采用的是“芯片多处理器”(Chip Multi Processing, 即CMP)设计,每个独立的核心运行一个线程,比如AMD双核、四核皓龙,采用的就是CMP设计;而SMT(Simultaneous Multi-Threading 同步多线程)是目前Intel处理器所采用技术,允许每个物理核心运行两个同步线程。其优点在于成本较低,可以根据当前的状况动态进行切换,如果一个线程处于停顿状态等待内存,另一个线程的指令则可以使用这个物理核心的所有执行单元,让物理核心利用的更加充分。采用SMT技术是允许两个或更多的线程共享相同的核心,并发执行,正如英特尔的Hyper-Threading。
相比之下,CMP通过“复制”物理核心来扩展处理器在多线程软件中的性能,在一些应用中,CMP的处理器性能确实会表现的更优秀。
而此次发布“推土机”架构的皓龙则采用了完全不同的多线程方式,即两颗核心为一组,分离的整数运算单元和共享的浮点运算单元。采用模块化设计的皓龙处理器在保持原有浮点性能优秀特点的同时,还大大的增强了整数运算能力。而这种设计更能够从生产方面大大节省晶体管的数量、降低核心面积和功耗,同时降低成本。
据AMD发布时的资料显示,采用了***皓龙6276处理器的双路超微服务器比相同配置的搭载“Nehalem”架构的双路至强5670同类服务器在LINPACK测试中FLOPS性能提升84%,当然这也和16个核心的巨大优势密不可分。此外,新款皓龙还夺的了2路服务器***TPCC 分数。
同样的模块化设计也带来了内存带宽上的巨大提升,而更多的核心也为“推土机”皓龙虚拟化方面的性能表现做好了准备,除此之外,更多的核心还降低了单位核心的能耗。
同样对比至强5600处理器,新皓龙内存带宽增加73%,使服务器可以管理更多虚拟机并应付更高的负载。AMD对51CTO记者表示,“推土机”皓龙***的优势是为云计算带来了更高效的经济性,每核心能耗降低一半,机房占用空间减少三分之二,平台价格***可下降三分之二,而模块化设计也能够让AMD能够在听取客户需求后更快的作出相应创新,让IT架构能够更快速度进行部署。
#p# 从服务器产品到应用优化的完整生态系统
“推土机”架构皓龙的发布,也直接带来了服务器厂商们的迅速跟进,在发布会现场,51CTO记者看到来自DELL、HP、曙光、超微带来总数超过二十款服务器机型,从高密度定制化系统、1U双路机架式、四路直至刀片的不同结构,可以满足用户的不同需求。此外Cray、IBM等厂商也会同时或在稍后时间陆续推出相应产品及解决方案。
与AMD新款皓龙发布几乎同一时间,惠普发布了5款采用新皓龙的服务器新品,更新的产品包括HP ProLiant BL465c G7、HP ProLiant BL685c G7、HP ProLiant DL385 G7、HP ProLiant DL585 G7和HP ProLiant DL165 G7。而采用AMD皓龙 6200系列处理器的HP ProLiant G7服务器拥有全球***等级的核心密度,可在每机架使用2048个内核(比传统产品多33%)以支持经常并行发生的高性能计算工作负载,性能较传统产品提高35%。新服务器还可提供全球最快的双插槽数据库引擎,吞吐量较前几代基于AMD皓龙™处理器的HP ProLiant服务器提高近40%。此外,全新HP ProLiant G7服务器还包括HP Integrated Lights-Out (iLO 3),这是一款服务器管理工具,支持远程监控以降低维护成本。另外,新的服务器还提供HP Virtual Connect,支持客户端将服务器和虚拟机轻松连接到任意网络,从而减少高达95%的IT无序扩张损失。
对于试图节省数据中心空间的客户来说,戴尔公司新推出的PowerEdge R815是个不错的选择,这款高密度的服务器产品可以在2U机柜厚度中提供四枚处理器。而戴尔 PowerEdge C6145 可在更小的空间内提供更高性能计算而构建,可提供卓越的性能,更高的虚拟化可扩展性(更低开销),并为云计算提供了更高的横向扩展经济性。戴尔公司的资料显示,PowerEdge C6145 借助共享基础设施(增加了服务器密度)和一组优化的特性集(将能耗降到***),在2U 的设计内安装了多达 128 个 AMD 6200 系列处理器核心,因此美国国家超级计算中心 (NCSA) 等客户在处理大规模并行应用时,与传统的 4 插槽服务器相比,成本降低了 2-3 倍。
在发布会现场,AMD还表示,在发布之前,新款皓龙处理器已经提供给多个用户的大规模应用测试,包括Facebook、微软等用户已经将皓龙6000+4000的组合应用在数据库、虚拟化乃至云计算的多个领域,其高密度、低功耗的特性也广为用户所认可。***发布的HPC TOP500中,“推土机”架构的皓龙处理器也有占有其中7个系统。
新款皓龙在提供全新架构与更多核心的同时,是否也为应用负载的优化做好准备?对于51CTO记者的问题,AMD高层表示一直在为此努力,新皓龙在发布前已经将产品提供给相关业务伙伴,所以对于已投入应用的系统,已经有优化的性能表现,如惠普公司所公布的数据显示,新款皓龙的指令集改进在HPC领域对加密等应用提升明显。在Linux等开源社区,AMD对于代码的贡献程度也排名在前15位。同时对于不同用户的需求,AMD会在内部对用户需求进行一系列的协作,以保证用户的使用效果。***,他还表示,AMD观察到用户对更多核处理器的接受时间正在变短。从双核到四核,平均下来用户花了六个月接受这一转变;而从六核到12核,用户只花了3个月接受改变。
单路与嵌入式市场
优秀的“推土机”架构不仅仅瞄准了双路、四路市场,AMD还宣布拓展其2012年产品路线图,增加AMD皓龙3000系列平台。该平台面向超高密度、超低能耗的单路网络主机/网络服务器以及微服务器市场。首颗处理器将为代号为“Zurich”(苏黎世)的4~8核CPU,预计将在2012年上半年发运,同样基于“Bulldozer”(推土机)核心,采用Socket AM3+ 接口。AMD皓龙3000系列平台为托管用户而设计,其客户需要专用的服务器,这些云计算和网络托管用户期望以更低价格的基础架构节省成本,但同时具备服务器部署的可靠性和安全性,以及服务器操作系统认证。
凭借开放特性,x86架构也在更多的计算领域体现出强劲的生命力,为此AMD也推出了专为高端嵌入式系统设计的嵌入式服务器处理器,应用于存储、通信和网络基础架构等方面。这些产品预计可适应嵌入式服务器市场对生命周期的需要。
对于近期风头正劲的ARM处理器是否会在同一市场产生竞争,AMD表示,经过多年的市场经验,新技术必须做到兼容过去,并面向未来,此外,服务器业界已经全面转向64位领域,没人愿意回到32位,除非ARM能够提供64位解决方案,否则很难在同一市场产生影响,但AMD也会保持对新技术的不断评估。
后记:开放市场的差异化的竞争之道
从2003年推出K7架构后,AMD走上了快速成长的道路,在开放的x86市场中带起一股技术与市场的革命风潮,AMD与英特尔的竞争当然也直接带给了用户最直接的价值,那就是越来越快速的处理器与越来越低的产品价格。
在开放的x86市场,如何结合产品并找寻自身的产品定位,AMD也许花了一些时间去探索。但从上一代产品开始,看起来AMD已经逐渐明确自身定位,那就是结合业界发展趋势,发展高性价产品,并通过完善整个生态系统布局为赢取云计算时代的市场而做好准备。作为一款最多高达16颗核心,并在密度与性价比有着良好表现的处理器,“推土机”皓龙似乎已经准备好了在云计算领域大显身手。