在世人千呼万唤之下,IBM新一代的Power7处理器终于揭下了神秘的面纱,在2月8日美国纽约闪亮登场。而在其发布之前,人们对这款三年磨一剑的产品的关注已经到了爆棚的程度,而从已经发布的Power7的性能参数信息来看,IBM此次显然不会令人失望。
在当地时间周一的新闻发布会上,从IBM Power系统部门总经理Ross Mauri对Power7的详细介绍就可以看出,Power7处理器在内核数量,芯片设计,运算速度,工作性能等方面都有闪光之处。
IBM Power 7处理器模块
也许还在前不久,RISC架构的发展前景仍然令人疑惑。SPARC系列处理器由于SUN的经营不善而陷入发展的困境,销量持续下滑,已经被英特尔安腾处理器所超越,而另一被成为最成功RISC架构处理器的IBM Power系列处理器自从2007年Power6处理器的面世以来三年都很少有动作,而于此形成鲜明对照的是x86服务器却一直马不停蹄地不断前进。
但是,Power7处理器的登场却如同一道亮丽的曙光,把RISC架构服务器市场上的浓雾驱赶殆尽。随着雾气的慢慢褪去,人们发现Power7的王者之位仍然难易撼动。
八大特点 成就Power7新经典盛名
1.更精细的制程工艺
与之前的Power6处理器65nm的制程工艺相比,Power7采用了IBM研发的45nm SOI铜互联工艺制程,令Power7上的晶体管密度有所提高——567平方毫米的核面积上容纳了12亿只晶体管。值得注意的是,Power7与以往的Power处理器不同的是,这一次Power7是单晶片处理器,这是Power7的一大亮点。
2.更强劲的运算性能
IBM Power 7处理器芯片
Power7如此多的晶体管数量自然为其带来了更加强劲的性能,最多拥有8个计算核心,这与Intel即将发布的多路X86处理器Nehalem-EX相同。但是Power7的优势在于Power7具有4个同步多线程能力,也就是说,Power7同时能够进行32个线程处理;而与之相比Nehalem-EX仅具有16个线程的处理能力,显然是逊色了不少。另一方面,Power7的处理能力自然也不是双核心的Power6处理器所能比拟的。
3.更优越的存储技术
而除了运算部分,Power7的片上存储技术也是其独特之处,目前静态RAM存储器是一种被广泛使用的技术,几乎所有的处理器都将这种存储器作为片上存储器来使用,但规模庞大且成本高昂成为了该技术的致命伤。IBM避免了这种情况,其转而采用一种名为E-DRAM的技术,使得晶体管的总量、芯片面积都得以减小。IBM技术人员表示,Power7晶体管的总量保持在12亿个左右,如果将所有的缓存都通过静态RAM来完成,那么晶体管的数量肯定会超过20亿个。
4.更复杂的核心结构
IBM Power 7运算核心结构
除了多核心带来的运算性能优势之外,Power7的每个核心结构都非常复杂——每个核心都具有12个相对独立执行单元:两个整数单元、一个十进制整数单元、四个向量/标量扩展浮点单元、四个存取单元和一个条件寄存器/分支单元等。
5.更具特色的缓存设计
Power7处理器的缓存设计采用了三级缓存设计,其中一级缓存和二级缓存为每个运算核心所独立占有,其中一级缓存包括32KB的指令缓存和32KB数据缓存,二级缓存则有256KB的大小。与一级缓存和二级缓存不同,Power7的三级缓存属于共享缓存(共32M)并分为两个层次,其中有4MB的缓存因为拥有其他三级缓存1/5的延迟时间而可以被视作是特殊的缓存层,介于二级与三级缓存之间。
6.更出色的I/O性能
Power7处理器拥有出色的I/O性能,其集成有两个四通道的内存控制器,可以连接DDR3内存。Power7持续内存带宽100GB/s,SMP带宽360GB/s,整个芯片总带宽高达590GB/s。
7.更强大的性能
IBM Power 7晶圆
据IBM官方的消息,Power7处理器在性能上与Power6相比有大幅度的提升。比如整数型工作负荷(integer workloads)的对比应用测试证实每个核心都有着大约20%的性能提升,而从整个芯片上来看性能差达到四至五倍。
超强的浮点运算性能也是Power7的一大特点,其在设计上借鉴了 Cell处理器的优点而Cell处理器正是由于强大的浮点处理单元而被用来作为前世界***超算“走鹃”的协处理器的。
8.更优化的功耗性能
在功耗方面,IBM从竞争对手那里也借鉴了一些改善功耗性能的创新方法,全新的Power7处理器引入了两种低功耗模式,分别为小憩和休眠模式(nap and sleep)、动态频率和电压自调整。此外,turbo模式能够提升10%的性能,功耗封顶。从目前的消息来看,Power7处理器在各方面大幅度提高的前提下,其功耗却能够与当前的Power6保持在同一水平(100-190W)。
#p#
经典延续 Power系列处理器的发展历程
自1990年IBM推出***代Power处理器之后,Power家族辉煌家谱的序幕就已经拉开,此后,每一代的Power处理器都创造了令人惊叹的成就,一直站在处理器领域的***。
部分Power处理器的演进路线
1990年推出的***代Power处理器集成了 80万个晶体管,引入了8KB指令缓存(I-cache)和32 KB 或 64 KB数据缓存(D-cache),这款处理器强大的运算性能使得其被用作火星探险任务的重要处理器,这是对Power1***的肯定。
如果说火星探险的任务离我们遥远的距离让大多数人听起来都是很陌生,那么第二代Power处理器所做的事情估计大多数读者都会有很深刻的印象,1997年,装载有第二代Power处理器的IBM“深蓝”在***次人机对抗中击败了国际象棋冠军卡斯帕罗夫,这被为是计算机发展史上的里程碑。
举世瞩目的人机大战
而实际上,Power2处理器在1993年就已经推出,到1998年第三代Power处理器的发布一共服役5年,这款处理器每个芯片中集成了1500万个晶体管,并在芯片中新加了第二个浮点处理单元(FPU)和更多缓存。
1998年推出的第三代Power处理器在Power家族的发展中是一个值得特别关注的地方,这款处理器同样在每个芯片中集成了1500万个晶体管,与第二代Power处理器相比并没有什么提升,不过这一带的Power处理器最重要的改进并不在这里,而在于其采用的工艺和强大的64位运算能力。
虽然在一开始发布的时候第三代Power处理器并不是太吸引人,但随后的改进却使得他大放异彩,在1999年铜导线技术成熟之后,这项技术被迅速引进了Power系列处理器,而到了2000年,开始使用铜芯片和SOI绝缘硅技术,材质的改变为处理器主频的提升创造了条件,这使得其处理速度与前代产品相比有着大幅提升,同时,在这一带处理器上,IBM同样加大了缓存的容量。
如果说第三代Power是一个转折点,那这款2001年发布的Power4无疑就是一座里程碑,这款处理器是人类历史上***款双核心CPU,而在这之后,SUN在2004年才推出了***款双核的UltraSPARC IV处理器,而英特尔在05年才推出***款双核奔腾***版840处理器。可以说,Power4使得IBM在处理器技术上获得了数年的领先。
Power4处理器芯片结构
Power4处理器逻辑结构
Power4在制造工艺上采用了180纳米铜导线搭绝缘硅制造工艺,每个处理器都有 2 个 64 位的 1GHz+ 的PowerPC 核心,每个处理器都可以并行执行200条指令,初始型号主频为1.1和1.3GHz。Power4在芯片上加入了L3 缓存,通过fabric controller 控制L2和L3 之间以及单个处理器之间的信息流和数据交换。
Power 4多芯片模块
每个微处理芯片包含64KB L1指令缓存 , 一个 32 KB L1数据缓存,两个 fixed-point 执行单元 , 两个浮点执行单元, 两个 load/store 执行单元,一个分支执行单元 , 和一个执行单元来进行逻辑操作在一定条件下。在此之后,2002年11月,IBM推出的Power4+芯片由原来的Power4芯片的180纳米工艺技术升级到130纳米工艺技术。
Power 4有着1.74亿个晶体管,功率为125瓦特,***主频为1.3GHz,共享有1.44MB的二级缓存,其三级缓存却封装在芯片之外。Power4+晶体管的数量增至1.84亿个,二级缓存提升到1.5MB,同时,DDR内存控制器集成到芯片上的设计也是始于Power4+。
含有4个POWER5 die和4个36MB L3缓存的MCM(多芯片模块)
在Power 4和Power 4+的基础上,IBM于2004年4月推出了Power5处理器,Power5增加了并发多线程能力(SMT),每个核心可以同时运行两个线程。Power5芯片具有2.76亿个晶体管,比最初的Power4芯片(具有1.74亿个晶体管)多1亿个。 芯片面积为389平方毫米。而在此之后,IBM又推出了改进型的Power5+处理器,将制程工艺提升到了90纳米。
2007年7月推出的Power6芯片再一次将制程工艺提高到了65纳米,芯片采用双核心设计,拥有128KB L1缓存(其中64KB数据和64KB指令)。每个内核拥有一个4MB的“半共享”L2缓存,即该缓存虽然被分配给某个内核,但其余内核也可以快速地访问它。IBM重新设计了Power的指令流水线,希望能够***行业趋势,提升时钟频率而非不断地增加核心数量。
Power 6处理器
这种理念提升了每个处理核心的性能,降低了单位性能的软件成本,但却只要是针对某些按照系统或者插槽数量计费的软件,而按照核心数量计费的软件则无法享受到其福音。此外,采用65纳米工艺技术的Power6有着7.9亿个晶体管,每个处理核心独自享有4MB二级缓存,而且三级缓存却减少至32MB,却依然采用芯片外设计。这是为每个Power6核引入其他特性留下空间(包括十进制数字单元DMU、AltiVec适量处理单元、整点、浮点单元)。
Power 6处理器芯片结构
在此之后IBM于2008年10月推出了改进型的Power6+,该处理器与Power6相比变化不大,只是在主频及指令集上进行了提升,显然IBM将下一次大出风头的机会留给了Power7。
在某种程度上,Power7的设计是Power6和Power6+芯片的延续,但却青出于蓝而胜于蓝。Power7处理器采用了45纳米铜芯片绝缘硅工艺(copper/SOI),晶体管数量增长至12亿个。该核心支持乱序执行(out-of-order execution),并且和老一代Power芯片兼容。Power7每一个核心有着与Power6和Power6+处理器有同样容量的一级缓存(32KB)以及256KB的二级缓存。与Power6和Power6+不同的是,32MB的三级缓存植入在eDRAM中,尽管要比SRAM要慢,但是eDRAM更接近核心。此外,Power7还有着两个双通道DDR3内存控制器,能够带来单芯片每秒100GB的恒定带宽。
Power7晶圆局部
Power7芯片设计上的重大革新极大地影响了性能表现,采用“芯片上”设计的32MB三级缓存取代了之前的芯片外设计,这将极大地提升线程和核心数量。植入在eDRAM上的三级缓存如果改用SRAM的方式,那么晶体管的数量将会提升至20亿个左右。
据IBM Power Systems事业部全球战略和营销副总裁Scott Handy指出,eDRAM缓存存储1bit数据只需要占用一个晶体管,而同样情况下SRAM则需要占用六个晶体管。eDRAM的引入将Power7的性能提升了一倍,将三级缓存整合至芯片上可以降低了核心之间的延迟。此外三级缓存容量的减少可以提升核心的数量,每个核心线程也可增加了一倍。由此可见eDRAM的引入,将会是Power7处理器芯片与英特尔的Tukwila芯片相抗衡的有利工具。
Power7处理器芯片的与时具进还体现在引入了先进的技术——智能线程(Intelligent Threads),能够根据要求的情况来开启关闭虚拟指令集。此外Power7处理器及其主机还采用了一项名为“Active Memory Expansion ”技术,官方宣传通过压缩内存能够带来两倍于物理内存的内存容量。
#p#
全新IBM P系列服务器 更高性能应对更多应用
Power7处理器在内核数量,芯片设计,运算速度,工作性能等方面都有闪光之处。而以其为基础的Power7系统将以与时具进的强大阵容进军服务器领域,为服务器市场注入新鲜的血液。该系统是专门针对要求苛刻的新型应用而设计的。其应用设计的范围极其广泛——从智能电网到金融市场的实时分析,几乎都可以找到它的身影。这个“全能”的新兴系统囊括了许多独特的行业技术,以满足新兴应用和服务的特殊要求,以及数据实时分析时提供大量并发事务和数据的需要。
新的IBM P系列服务器
在Power7发布会上,IBM同时还推出了新的P系列服务器。这些高端服务器集成了最多256个IBM Power7处理器,提供了***强大的IBM Power系统的可扩展性和带宽速率,令企业能够拥有更加高效的配置模式,巩固更大规模的操作应用和基础设施建设。
Power 780系统
IBM Power 780
IBM旗舰级模块化服务器系统,每个节点(每台机箱)可以支持两个3.8GHz的 8核模块或4.1GHz 的4核模块。整个系统最多可拥有四个节点,总共可支持1TB的DDR3(1066MHz)或者2TB的DDR3(800MHz),24个SAS或固态硬盘位以及24个PCI-E 8x扩展槽。此外,仅有次服务器支持TurboCore技术。
Power 770系列
IBM Power 770
Power 770系统同样支持四个节点,每个节点可以支持两个3.8GHz的 8核模块或4.1GHz 的4核模块。除了不支持TurboCore技术,其余规格和Power 780类似。
Power 755系统
IBM Power 755
该系统是四路8核3.3GHz系统,***256GB内存,8个2.5寸硬盘位,两个PCI-X 2.0扩展槽和三个PCI-E x8扩展槽。
Power 750系列
IBM Power 750
该系统可配置为一到四路系统,使用4核3.3GHz或8核3.0-3.55GHz POWER7处理器,8GB到512GB内存。
位于莱斯大学数据中心的IBM Power 750系统
IBM表示,Power 750/755系统将于2月19日开始批量出货,高端的Power 770/780系统则会从3月16日开始出货。
#p#
Pow 0c07 er7强力应用——“蓝水” 下一代的全球超算之王
IBM曾经凭借着其“走鹃”超级计算机夺得世界***台超级计算机的称号,但是在不久前的一次排名,IBM的“走鹃”超级计算机不幸被超过,沦为第二。前几天刚发布的Power7芯片,将被用于美国伊利诺斯大学的超级计算机中,有望重新打造全球最快超级计算机,一雪前耻,峰值速度可达目前最快超级计算机的10倍。
虽然IBM的“蓝水”(Blue Waters)超级计算机项目并无法达到人工智能的境界,但是与HAL9000一样,同样具备在短时间内处理大量复杂运算的能力。这款Power7超级计算机将被放置于香槟分校的一栋特殊建筑里,其理论速度将达到10 petaflop,为目前最快超级计算机峰值速度的10倍(1 petaflop等于10的15幂次浮点运算,是超级计算机性能的重要指标)。
调试中的“蓝水”(Blue Waters)超级计算机
超级计算机实质上是为了处理复杂问题而将大量的微处理器组合起来的设备。前不久发布的IBM Power7处理器将成为IBM在该领域重整雄风的重要一步。尽管“走鹃”已经遭到时代的无情淘汰,但是仍然有可取之处。Power7处理器取其精华去其糟粕,将“走鹃”使用的一种芯片的功能被整合到Power7处理器之中。IBM的相关技术人员表示,Power7将旗舰Power芯片的设计与Cell处理器有效地融合在一起,尤其融合进了浮点运算方式。
这款超高速处理器的冷却方式也具有高度的环保意识,使用原本用于机房冷却和供电的设备,并与服务器、存储器和互联硬件安装在同一个机柜中。整个机柜全部都使用水冷的方式,直接用水来吸热,能够有效地实现节能的目的。
美国伊利诺斯大学为“蓝水”(Blue Waters)超级计算机新建的数据中心
从理论上讲,蓝水将拥有16384个Power 7芯片(“节点”),理论性能将达到16 petaflop。该产品最初的理论峰值速度至少也能够接近10 Petaflop。在实际软件应用中的“可持续”速度将达到1 Petaflop。
蓝水项目在节点间传输速度方面也有了突破性的进展。该系统中任何两个节点之间的峰值传输速度可达到192GB/s,在这种情况下,无论哪两个节点之间的指令延迟都不会超过1us。
这种性能对于大型企业和政府机构而言至关重要,包括波音、通用汽车和福特在内的许多企业都在大量使用这种系统。多数的碰撞测试如今也都是在这种设备上完成的。大量的天气预报也都要用到这种平台。许多政府主导的应用也都要依赖这种设备,例如如何适当处理核废料。
【编辑推荐】