全新核加速技术 AMD“推土机”架构揭底

服务器
日前,AMD在北京举办了服务器媒体沟通会,AMD服务器产品市场总监John Fruehe先生出席了会议并回顾了AMD皓龙6000平台和4000平台产品,还介绍了AMD下一代处理器,代号为“Bulldozer”(推土机)的产品技术细节。

日前,AMD在北京举办了服务器媒体沟通会,AMD服务器产品市场总监John Fruehe先生出席了会议并回顾了AMD皓龙6000平台和4000平台产品,还介绍了AMD下一代处理器,代号为“Bulldozer”(推土机)的产品技术细节。

[[19781]] 

AMD服务器产品市场总监John Fruehe

AMD服务器产品线定位精确

刚刚过去的2月,AMD丰富了皓龙6100系列处理器的产品线,添加了5款新品,不但延续了AMD X86-64、直连架构、内置MC、HT总线等技术,还进一步增强了高性能低成本的优势,将单核采购成本和使用成本进一步降低。

AMD服务器产品线是围绕着两种重要处理器展开。首先是皓龙6000平台,主要用于高性能、可扩展的用户。例如高性能计算、数据库、虚拟化,这些应用都需要多核,一般是8-12个核。另一个处理器产品线就是皓龙4000平台,这主要是针对一些用户在IT基础设施、电子邮件等应用在成本和能耗方面的要求更为突出。这两种更细的产品线定位使得AMD皓龙产品更加有针对性,能够更好的以客户需求和实际市场发展为中心研发产品。

John Fruehe表示AMD一直以来在性能上表现优越,同时提供非常高的性价比,与英特尔产品相比较,性能更优,价格更低。因为产品性价比如此之高,4路系统在性能上高于英特尔两路系统,但价格更低。他举例表示,在价格相同的情况下,基于AMD平台的戴尔R815拥有4个处理器共48个内核,而友商平台的R710仅拥有2个处理器12个内核。相比之下,客户自然是愿意选择处理器内核众多的R815服务器。

另外,John Fruehe介绍AMD 皓龙6000和4000平台在市场反响良好,AMD在全球拥有众多OEM合作伙伴,他们为市场提供各种系统,其中有HP、戴尔、acer、IBM,以及中国本土厂商曙光。很多厂商都推出了基于AMD平台的高密度产品,例如:IBM X3755 M3,Cray针对更小规模执行的超级计算集群XE6m。戴尔也推出了史无前例的一款产品PowerEdge C6145,它是在2U机架空间,两个四路节点,可容纳多达8个12核AMD 皓龙6100系列处理器,即在2U机架空间内可以带来96核的计算能力。

关于Bulldozer的一些细节其实很早就已经有些曝光了,包括产品的架构图等等,而这次由AMD服务器产品市场总监John Fruehe先生进行讲解之后,更多的细节也浮现了出来。

推土机采用模块化架构设计

传统的双核心处理器产品中,无论是产品的外部还是内部结构,通常我们都能清晰的辨认出双核——两个各自独立的单核心单元。而在Bulldozer架构上,双核心处理器已经被完美的融合成了一个“真正的”双核心处理器,也叫Bulldozer模块:它具有2个整数调度器,每个整数调度器各控制一组4条直连L1的管线,其他部分则保持了共享设计。这样一组双核心成为一个独立的单元,这种经过优化的结构提升了核心密度。这样使得晶圆尺寸更小,从而容纳更多核。在整个架构中,为避免产生瓶颈,仍然维持整数预算调度器的独立性。在Bulldozer模块上,可以同时处理两套大指令集,而友商的做法是使用超线程技术,希望由一个核处理两个线程。John Fruehe用北京的交通做比喻,就像两辆车要同时并入一条车道,必然产生瓶颈。AMD的设计是为了实现最佳性能和最优的可扩展性。

Turbo Core技术首次登场

同时AMD还会推出一个新技术,叫做Turbo Core,Turbo Core技术主要是指对于一些没有完全消耗到最大程度的工作负载,去加快时钟速度。在多种不同工作负载上,使用了Turbo Core可以最大增加500MHz的性能。最重要的一点,Turbo Core加速指的是所有核的加速,和有些核加速技术明显不同,以往的核加速技术可能需要关闭一些核,只对部分核进行加速。采用Turbo Core技术,最多可以使所有核增速500MHz,如果再关闭一些核运转的情况下,加速将会超过500MHz。同时还对内存控制器进行了进一步优化,从而提高内存的吞吐量。

8年前AMD首家推出集成内存控制器,根据AMD在这一领域的经验和非常好的技术,又在这一代产品中全面提升了内存控制器的性能。首先对内存控制器在效率方面进行了针对性的重新设计和完善,因此实现30%的内存性能提升。在提升30%性能基础上,让内存支持1600MHz频率,可以获得额外20%的性能。两项加起来,可以实现内存控制器50%吞吐量提升。

可以同时支持AVX指令和SSE指令

John表示FLEX FP是AMD至今为止最有创新意义的浮点计算技术,每一个模块都有一个FLEX FP进行浮点运算。如果使用传统128位编码,意味着每个核会有单独的浮点运算单元。与友商相比,如果在128位编码前提下,AMD所执行的数量多一倍。如果是256位AVX编码,Bulldozer可以把两个浮点运算单元放在一起执行。所以在256位编码执行模式下,与友商比较,执行的数量是一样的。但是Bulldozer有一个非常大的优势,就是可以同时执行256位AVX指令和SSE指令。而友商就不能做到这点,他们只能在AVX或SSE中选择其一,这样的优势能够让Bulldozer在高性能计算、媒体编解码以及在一些技术型运算方面有更高的性能。

此外,John还谈到了Bulldozer平台的能耗问题,John拿台式机来做一个比方,在实际使用过程中CPU的能耗占到了约50%。这也就是AMD为什么花了这么长的时间去优化CPU能耗。能耗大小是由被通电晶体管数量决定的,它取决于执行一个普通指令(运算)需要让多少晶体管处于通电状态。在最大工作负载状态,正常应用状态和闲置状态下,Bulldozer都具有非常好的能耗表现。同时在各能耗单位上进行了优化,可以在各种单位下进行电源关闭。高性能运算能耗之所以高,主要是由于浮点运算,而一般应用运算主要是在执行单元消耗得最高。同时还有闲置状态下,AMD的技术可以做到对于那些完全用不着的核,把电源完全关闭。去年AMD产品有一个大转型,AMD推出了新插槽,2011年推出的推土机可以使用2010年的插槽。而友商为推出新平台,同时推出了新插槽,这也使得AMD更占优势。

最后,John透露了2011年Bulldozer的动态。Bulldozer架构的处理器将在2季度批量生产,并在2季度发布应用于台式机的基于Bulldozer架构的处理器产品。由于使用与现在服务器通用插槽,所以服务器伙伴可以立即使用新产品。

责任编辑:小明 来源: 51CTO.com
相关推荐

2009-12-02 13:32:38

AMD推土机架构

2010-10-25 10:43:13

AMD推土机

2010-11-09 10:47:26

AMD推土机Bulldozer

2010-08-04 10:16:46

AMD推土机性能

2011-04-08 15:27:14

推土机AMD

2009-12-02 11:03:29

AMD

2010-09-25 13:42:12

AMD推土机缓存

2012-09-11 10:26:11

AMD处理器架构Steamroller

2010-08-31 10:34:59

AMD推土机Turbo Core

2011-06-08 09:29:32

AMD推土机负面

2011-03-23 11:07:53

AMD推土机赞比西河

2011-01-21 10:28:00

AMD推土机Bulldozer

2011-03-14 10:47:47

AMD推土机

2011-03-03 09:16:35

AMD推土机

2011-09-08 09:27:36

AMD推土机HPC

2011-02-16 14:10:40

AMD推土机

2011-05-23 14:11:38

AMD推土机

2010-09-02 10:11:37

推土机大蛇

2011-12-26 09:35:23

AMD推土机TurboCore皓龙服务器

2011-03-09 10:27:19

AMD推土机Llano
点赞
收藏

51CTO技术栈公众号