日前,AMD在北京举办了服务器媒体沟通会,AMD服务器产品市场总监John Fruehe先生出席了会议并回顾了AMD皓龙6000平台和4000平台产品,还介绍了AMD下一代处理器,代号为“Bulldozer”(推土机)的产品技术细节。
AMD服务器产品市场总监John Fruehe
AMD服务器产品线定位精确
刚刚过去的2月,AMD丰富了皓龙6100系列处理器的产品线,添加了5款新品,不但延续了AMD X86-64、直连架构、内置MC、HT总线等技术,还进一步增强了高性能低成本的优势,将单核采购成本和使用成本进一步降低。
AMD服务器产品线是围绕着两种重要处理器展开。首先是皓龙6000平台,主要用于高性能、可扩展的用户。例如高性能计算、数据库、虚拟化,这些应用都需要多核,一般是8-12个核。另一个处理器产品线就是皓龙4000平台,这主要是针对一些用户在IT基础设施、电子邮件等应用在成本和能耗方面的要求更为突出。这两种更细的产品线定位使得AMD皓龙产品更加有针对性,能够更好的以客户需求和实际市场发展为中心研发产品。
John Fruehe表示AMD一直以来在性能上表现优越,同时提供非常高的性价比,与英特尔产品相比较,性能更优,价格更低。因为产品性价比如此之高,4路系统在性能上高于英特尔两路系统,但价格更低。他举例表示,在价格相同的情况下,基于AMD平台的戴尔R815拥有4个处理器共48个内核,而友商平台的R710仅拥有2个处理器12个内核。相比之下,客户自然是愿意选择处理器内核众多的R815服务器。
另外,John Fruehe介绍AMD 皓龙6000和4000平台在市场反响良好,AMD在全球拥有众多OEM合作伙伴,他们为市场提供各种系统,其中有HP、戴尔、acer、IBM,以及中国本土厂商曙光。很多厂商都推出了基于AMD平台的高密度产品,例如:IBM X3755 M3,Cray针对更小规模执行的超级计算集群XE6m。戴尔也推出了史无前例的一款产品PowerEdge C6145,它是在2U机架空间,两个四路节点,可容纳多达8个12核AMD 皓龙6100系列处理器,即在2U机架空间内可以带来96核的计算能力。
关于Bulldozer的一些细节其实很早就已经有些曝光了,包括产品的架构图等等,而这次由AMD服务器产品市场总监John Fruehe先生进行讲解之后,更多的细节也浮现了出来。
推土机采用模块化架构设计
传统的双核心处理器产品中,无论是产品的外部还是内部结构,通常我们都能清晰的辨认出双核——两个各自独立的单核心单元。而在Bulldozer架构上,双核心处理器已经被完美的融合成了一个“真正的”双核心处理器,也叫Bulldozer模块:它具有2个整数调度器,每个整数调度器各控制一组4条直连L1的管线,其他部分则保持了共享设计。这样一组双核心成为一个独立的单元,这种经过优化的结构提升了核心密度。这样使得晶圆尺寸更小,从而容纳更多核。在整个架构中,为避免产生瓶颈,仍然维持整数预算调度器的独立性。在Bulldozer模块上,可以同时处理两套大指令集,而友商的做法是使用超线程技术,希望由一个核处理两个线程。John Fruehe用北京的交通做比喻,就像两辆车要同时并入一条车道,必然产生瓶颈。AMD的设计是为了实现最佳性能和最优的可扩展性。
Turbo Core技术首次登场
同时AMD还会推出一个新技术,叫做Turbo Core,Turbo Core技术主要是指对于一些没有完全消耗到最大程度的工作负载,去加快时钟速度。在多种不同工作负载上,使用了Turbo Core可以最大增加500MHz的性能。最重要的一点,Turbo Core加速指的是所有核的加速,和有些核加速技术明显不同,以往的核加速技术可能需要关闭一些核,只对部分核进行加速。采用Turbo Core技术,最多可以使所有核增速500MHz,如果再关闭一些核运转的情况下,加速将会超过500MHz。同时还对内存控制器进行了进一步优化,从而提高内存的吞吐量。
8年前AMD首家推出集成内存控制器,根据AMD在这一领域的经验和非常好的技术,又在这一代产品中全面提升了内存控制器的性能。首先对内存控制器在效率方面进行了针对性的重新设计和完善,因此实现30%的内存性能提升。在提升30%性能基础上,让内存支持1600MHz频率,可以获得额外20%的性能。两项加起来,可以实现内存控制器50%吞吐量提升。
可以同时支持AVX指令和SSE指令
John表示FLEX FP是AMD至今为止最有创新意义的浮点计算技术,每一个模块都有一个FLEX FP进行浮点运算。如果使用传统128位编码,意味着每个核会有单独的浮点运算单元。与友商相比,如果在128位编码前提下,AMD所执行的数量多一倍。如果是256位AVX编码,Bulldozer可以把两个浮点运算单元放在一起执行。所以在256位编码执行模式下,与友商比较,执行的数量是一样的。但是Bulldozer有一个非常大的优势,就是可以同时执行256位AVX指令和SSE指令。而友商就不能做到这点,他们只能在AVX或SSE中选择其一,这样的优势能够让Bulldozer在高性能计算、媒体编解码以及在一些技术型运算方面有更高的性能。
此外,John还谈到了Bulldozer平台的能耗问题,John拿台式机来做一个比方,在实际使用过程中CPU的能耗占到了约50%。这也就是AMD为什么花了这么长的时间去优化CPU能耗。能耗大小是由被通电晶体管数量决定的,它取决于执行一个普通指令(运算)需要让多少晶体管处于通电状态。在最大工作负载状态,正常应用状态和闲置状态下,Bulldozer都具有非常好的能耗表现。同时在各能耗单位上进行了优化,可以在各种单位下进行电源关闭。高性能运算能耗之所以高,主要是由于浮点运算,而一般应用运算主要是在执行单元消耗得最高。同时还有闲置状态下,AMD的技术可以做到对于那些完全用不着的核,把电源完全关闭。去年AMD产品有一个大转型,AMD推出了新插槽,2011年推出的推土机可以使用2010年的插槽。而友商为推出新平台,同时推出了新插槽,这也使得AMD更占优势。
最后,John透露了2011年Bulldozer的动态。Bulldozer架构的处理器将在2季度批量生产,并在2季度发布应用于台式机的基于Bulldozer架构的处理器产品。由于使用与现在服务器通用插槽,所以服务器伙伴可以立即使用新产品。