AMD公司计划于今年(2009年)6月份推出6核心服务器CPU「Istanbul(伊斯坦布尔)」。根据了解Istanbul也将会成为AMD公司有史以来核心尺寸***的CPU,这也表示着AMD将更加注重于对服务器领域。同时AMD公司Istanbul之后的服务器平台和CPU更新的速度也在提升。
在Istanbul之后,2010年第1季度将会推出12和8核心的「Magny-Cours(manikuru)」以及平台「Maranello(maranero)」。这样将会从Magny-Cours+Maranello,system architecture向「Direct Connect Architecture(DCA)2.0」转移。
Magny-Cours就是在一个封装里装入2个CPU核心的一项MCM(Multi-Chip Module)技术的CPU。由于同时内置了2个6核心处理器核心,这样核心数量就达到了12个。而以前被称为「Sao-Paulo(圣保罗)」的8核心处理器将会统称为Magny-Cours。Magny-Cours包含有8核心和12核心处理器。因此8核心版产品同样也是MCM。
Istanbul的主要概要
K10核心尺寸推定
AMD CPU的转移图
考虑到了为了成品率的提高,还是会不得不将有缺陷的CPU核心和缓存关闭,这样推出8核心产品也就相当正常。由于生产8核心产品时成品率会急剧提高,同时在核心占据约50%以上的CPU核心和L3缓存都不会影响到实际的成品率。
据说Magny-Cours除了CPU核心数量将倍增之外,由于系统接口也会获得很大的扩张,性能也会大幅度增长。根据AMD的路线图显示,对于当前4核心45nmCPU「Shanghai(上海)」进行Magny-Cours后,整数运算和浮点运算的性能均会出现2.5倍 性能增长。然而与Shanghai相同平台的Istanbul,整数运算性能只增长了约1.7倍不到,而浮点运算性能则只增长了1.2倍左右。据推测Istanbul浮点运算性能增长不高主要是由于内存瓶颈。
通这Magny-Cours,CPU的新功能也将可以实现。比如虚拟化支援硬件机构的AMD-V和新版本的AMD-V 2.0,节能技术AMD-P将升级为AMD-P 2.0。不过平台和功能将会因为Istanbul的Magny-Cours而产生跳跃,不过实际的芯片的设计还是相同的。因此CPU厂商预先使用下一代CPU的功能进行试验也很平常。可以认为Istanbul功能全部被实现,那么Magny-Cours就会显得相当自然。
2009年和2010年的平台比较
面向服务器CPU的性能提升
AMD-V 和AMD-P
AMD-V 2.0和AMD-P 2.0概要
不过产生这个变化最重要的一点就是这将夫是AMD的服务器CPU今后的转折点。到现在为止,AMD服务器CPU插座数都是断开。比如4插座以上为Opteron 8000系,2插座为Opteron 2000系,1插座为Opteron 1000系。可是当Magny-Cours之后。会分为面向(Performance/Expandability市场的「Opteron 6000」系列,和面向(Power Efficiency/Value)市场的「Opteron 4000」系列。
如果用传统应用来区分的话,那么就是Opteron 6000系列面向的是数据库服务器等应用,而Web服务器则是Opteron 4000系列。另外两个系列产品所支持的插座数不同。高端的Opteron 6000支持2插座和4插座以上,后Opteron 4000则支持1插座和2插座。
市场的变化
从半导体芯片来看这个区分也是相当不错。因为MCM8~12核心的Magny-Cours高端Opteron 6000系列,而「Lisbon(里斯本)」Opteron 4000系列则为单一的4~6核心。总之简单得说就是拥有2个核心就是高端产品。
这里关键就是通过C32插座提供不同的选择方案。除了6核心Istanbul系列核心以外,4核心Shanghai核心同样也可以支持。C32内存通道为双通道,对于低成本的Shanghai支持也毫无问题。这样AMD将可以轻松得处理市场不同的消费需求。
●通过4通道内存获得50GB/s的内存带宽
AMD的平台与新的CPU区分也会进行对应。其中Opteron 6000系处理器为「Maranello」平台,支持G34插座。而Opteron 4000则与「San Marino(圣马力诺)」平台对应,「插座同样为C32。现在推出了双插座和四插座均能够支持的「Fiorano」平台,这个与桌面产品只支持相同Socket AM2有了不同。C32 San Marino在之前的AMD路线图上没有出现过,这次是***次公开。
Opteron 6000系列和4000系列处理器路线图
除了CPU插座数目上的不同以外,G34和C32***的差异就是内存接口。G34为4通道内存,而C32为双通道内存。两个插座都支持Registered DIMM(RDIMM)和Unbuffered DIMM(UDIMM) DDR3内存。这样G34以1通道为3DIMM计算总共为12个 DIMM,C32则为4个DIMM。
据说AMD在G34 Maranello平台除了CPU核心将会由4核心提升3倍达到12核心以外,内存通道也会提升2倍,带宽提升3.3倍,HyperTransport带宽提升1.9倍,缓存容量提或2.2倍。
Direct Connect Architecture 2.0
目前Shanghai的双通道DDR2-800的内存带宽***为12.8GB/sec。3.3倍的带宽就将会达到42.7GB/s。Maranello的内存通道为4通道,支持DDR3-1333。而DDR3-1600内存时带宽就可以达到51.2GB/sec。
Intel公司的8核心高端CPU「Nehalem-EX(Beckton:bekkuton)」基于FB-DIMM接口,支持DDR3 DIMM。因此在成本方面AMD有利。
顺便介绍一下的是由于Istanbul自己只支持双通道内存,而G34支持4通道内存,这当然是于MCM的双内核组成。因为为了支持每个核心的双通道内存接口,G34插座CPU就能够对4通道内存提供支持。G34明确表示是以MCMDual核心为前提的插座。
HyperTransport方面如果是G34插座的话,那么链接数就会从现在的3链接增加到4链接。目前Shanghai是HyperTransport 3,传输速率为4.4Gtps,每16/16(每个方面16-bit)单链接的频带是17.6GB/s。3链接成为52.8GB/sec。而4链接的G34频带可以提升1.9倍,那么就意味传输速率就是HyperTransport 3.1 6.4Gtps。这样带宽如果是1链接就为25.6GB/sec,4链接就共计102.4GB/sec。
G34平台
K10核心尺寸比较
G34 Maranello平台目标明了。就是在增强CPU性能的同时提升内存和I/O的带宽。2011年登场的「Bulldozer(bulldozer)」架构的Opteron 6000系列CPU「Interlagos(英特尔拉各斯)」Magny-Cours同样也是基于Maranello平台。随着CPU性能的提升,CPU核心数量的增强,必然会对内存带宽提出新要求。因此为AMD无论如何也要预先提升平台的带宽。
查阅AMD的性能预测的图的话,可以看到2008年Shanghai和2010年的Magny-Cours整数和浮点运算方面均增长了约2.5倍。并且如果变成Bulldozer世代的Interlogos的话,相对于Shanghai浮点运算性能将可提升4.2倍以上,整数运算将可提升3.6倍以上。下面这张在美国Web conference上展示的幻灯片上,Interlogos的性能预测可以清楚得看到,不过实际增长的数字没有明确。
通过海图可以看到,服务器CPU性能的提高将会按照一定比率持续进行。自推出***代Opteron处理器以来,整数和浮点运算性能都是以年平均1.6倍的速度在提升,这个速度今后也将会被继续的。当然这个数字是AMD公称的,在理想条件下实现的。如果说2.5GHz的4核心K10处理器性能为10,那么1.8GHz的单核心K8处理器的性能只能算1,约强10倍。可是这里重点并不是性能本身,而是性能提高的比率要大体上保持一定水平。AMD的服务器CPU以及台式电脑CPU的提高比率目前一直都维持了一定的提升比率。
因此AMD将一边提升CPU核心尺寸以及通过MCM提升CPU核心数量,同时让服务CPU与桌面CPU分化。因此对称的平台性能就变得十分重要。
2011年的CPU性能预测