高性能计算Top500榜单近日揭晓,受到了业界的高度关注。榜单中排行第一的是日本理化所的K计算机,计算速度达到了8 Pegaflop/s。于是很多人心中会存在着疑惑,Intel作为半导体芯片领域的领军者,为何时常与Top500冠军失之交臂?Intel高性能计算的葫芦里到底卖的是什么药?
就在榜单公布的第二日,Intel召开了媒体沟通会。会上,英特尔(中国)服务器平台产品经理张振宇、英特尔数据中心事业部亚太和中国区高性能计算/工作站方案架构师何万青博士就高性能计算领域的计划和产品与记者进行交流和讨论。
致力于满足不同HPC应用的需求
在本届HPC Top500榜单的系统中基于Intel平台有387个,Top10中有5个Intel的系统,比上期榜单增加了1个,Top30中有12个,较上期榜单增加1个,在Top 100系统中,几乎占了一半。在新增加的256套系统中有78.9%都是采用Intel的处理器,这其中超过50%的都是采用Intel Xeon 5600系列的处理器。Xeon 5500是榜单使用最多的处理器,一共有213套系统。Xeon 5600从去年发布到现在,增长很快,已经达到了168套系统。
张振宇谈道,“Pegaflop和LinPack只是衡量高性能计算系统的一个方面,我们更多地需要关注到用户的多样化需求。HPC客户往往面临着许多挑战,比如在构建一套系统时,如何满足性能成本比、性能能耗比、性能空间比等等。这需要根据应用的实际特征进行分析。不同的应用对于主频、内存、带宽或者是网络时延的需求不同,这决定了HPC发展的多样性。”
Intel基于HPC用户的不同需求,提出了全面的HPC解决方案,包括主流的至强5600系列(年底切换到Sandy Bridge);针对高度并行的应用即将推出MIC架构;针对大内存需求的应用和Shared Memory编程模式,推出了EX平台和基于Sandy Bridge平台上推出的EP、E5系列的四路平台。
#p# MIC:众核架构实现百亿亿次的神话
Intel MIC(Intel Many Integrated Core)架构是在已有的Xeon处理器产品基础上发展而来、专为超高性能计算而生的新架构。基于MIC架构的首款产品代号为“Knights Corner” ,计划采用22nm 3-D Tri-Gate三栅极晶体管工艺制造,计划2012年出品,届时,英特尔将用每秒百亿亿次的速度创造HPC的神话。
何万青博士介绍道,MIC的特点主要体现在三个方面:交付性能方面,在22nm的芯片上交付了50个以上的核心,为HPC用户带来了超强的性能。
计算密度方面,核心数量超过50个,支持高性能的向量和矩阵计算,如气象、石油等;在可编程性方面,不但支持至强的开发工具,包括编译器、数据库等,还支持以众核为主的架构,可以搭建一个基于MIC的集群,计划支持Red Hat和SUSE Linux。
MIC架构三个方面的特点:交付性能、计算密度、可编程性
MIC的高度并行计算能力是如何实现的?何万青博士介绍道,在至强上使用OpenIP的循环进行运算时,增加了一个制导语句(如下图蓝色部分所示),将循环分配到各个核上去,让每个核进行线程的运算。由于MIC并不是一个非常复杂的处理器合成的,需要一些支撑软件来实现应用的运行,只需要把应用载到MIC上去运算,就可以实现了。
Sandy Bridge:让HPC应用性能提升50%
Sandy Bridge将于今年年底发布亮产,最主要的是AVX扩展向量,理论上可以把浮点能力提高将近一倍。同时集成了PCIe(PCI Express),以往PCIe是接在南桥上,一共只有46个lane,现在每个Socket都有46 个Lane,I/O带宽将大大提升。每个Socket之间原来只有一个QPI,现在有两条QPI,可以只要,扩展成经济型的四路平台。对于一些内存容量要求较高,而又不希望太昂贵的情况下,可以使用这种EP的四路平台。
Intel内部测试表明,跟至强5600相比,应用的速度平均提升了50%左右,比如分子动力学提升了65%。
E7:Shared Memory编程模式
有一些应用不适合在Cluster上运行,而是适合小机的Shared Memory编程模式。但是,自从Nahalem 7500出现之后,为用户提供了更经济的解决方案。“很多应用也开始选择了E7的平台,如基因序列拼接、油藏模拟等等”,何万青介绍道。