在高性能计算领域,很多用户对于HPC方案的需求是相类似的,不管你是在制造、能源、生命科学行业,还是用HPC来进行财务金融分析、天气预报预测或数字内容创建。
不同的应用 相似的需求
虽然不同用户的高性能计算应用不一样,但却有着相似的需求。首先,最重要的一点就是,HPC用户对于计算性能的追求是永无止境的,因为我们总是希望在最短的时间里,对更大、更复杂的计算模型进行模拟、分析,并将计算结果通过可视化的方式呈现出来。然而,我们却不想因此增加对数据中心供电、散热或机房空间方面的投资。
其次,HPC用户总是希望计算性能可以马上获得,而尽可能不需要进行重新购买或开发软件。或者,即便需要花费精力和时间来针对一个新的架构进行软件并行化或优化,他们也希望今天的工作可以满足到未来的需求,投资可以得到一定的保护。
***还有一点就是,HPC用户希望尽可能简化集群的选型、配置和管理维护工作。对于小型或部门级用户来说,因为没有多余的IT人员,不希望HPC配置管理太难;而对于大型机构而言,同样也希望把时间和精力都尽可能用到创新上面去,而不是整天围着机器的管理维护转来转去。
2009年3月份英特尔***推出的至强5500系列处理器(代号Nehalem-EP)在满足HPC用户上述需求时将扮演关键的角色。首先,这一全新的架构能够帮助HPC用户更“智能”、更高效、更快速地实现性能提升;其次,Intel的“Cluster Ready”计划能够帮助各类企业简化新架构集群的选型、配置和管理工作;同时,英特尔还向用户提供一系列的软件开发工具,可以帮助用户进行性能调优,以使得用户今天围绕多核进行并行化、应用优化等方面的工作能够在未来的“众核”时代继续受益。
3倍的性能和带宽提升
其实,许多HPC用户从上一代架构或友商的架构向至强5500转换,就会立刻感受到新架构带来的巨大性能提升。而且用户很少、甚至不需要在软件开发方面做些什么。对此,英特尔内部的基准测试表明,跟前一代四核英特尔架构相比,至强5500在制造、建模、地震模型等方面可以获得超过3倍以上的性能提升。
这些性能的提升主要得益于英特尔至强5500的“智能”特性。比如,由于可以对内核、线程、缓存、接口、电源进行动态的管理,使得用户可以根据自己的需要来提高性能、降低能耗。另外,英特尔智能加速技术(Intel Turbo Boost Technology)可以通过提高处理器主频的办法来提高单线程应用的性能;而英特尔超线程技术(Intel Hyper-Threading Technology)可以让用户在每个处理内核上运行多个线程,从而实现总体应用性能的提升,重要的是,这只需要增加一点点功耗就行。
由于新架构的内存带宽也实现了大幅增加,这对于内存密集型应用来说是非常不错的。新架构集成了内存控制器,从而可以提供3通道直连DDR3内存。另外,英特尔快速通道互联技术(Intel QuickPath Technology)可以在处理器之间实现点对点高速传输,而I/O hub可以让每颗处理器快速地访问连接到其他处理器的内存。总的来说,跟上一代双路系统相比,这些变化使得内存带宽提高了3倍以上。
由于在提高处理器性能的同时也增加了内存带宽,这种新架构从而可以为用户提供一种均衡的平台。HPC用户还可以通过集成使用新的英特尔固态硬盘、和英特尔以太网服务器集群卡(Ethernet server cluster adapter)来进一步提高I/O的传输速率。这些新技术的使用最终带来的将不只是一部分代码的性能优化,而是HPC总体应用性能的持续“飞跃”。
无需增加功耗或占地面积
新的架构虽然提高了性能,但却帮助服务器系统减少了功耗和占地面积。由于每时钟周期内可以执行更多的指令,所以处理器可以比以往更快速地完成更多的工作。这一架构同时也提供了多种功耗状态(power states),能够在这些状态之间实现快速切换,比前一代架构的系统闲置功耗也要低不少,从而使得处理器可以更充分的使用电能。因此,至强5500是迄今为止IA架构中每瓦特性能***的一代平台。
同时,新架构也有助于减少HPC集群的体积,提高部署密度。由于在相同的机房空间里能够“堆叠”更多的服务器,这对于正打算更新数据中心的HPC用户来说是非常不错的选择。
软件也不能少
对于许多HPC用户来说,至强5500无须任何软件开发就能够“立马”获得性能的飞速提升。但是对于那些准备对这一架构或未来架构进行并行化或应用优化的用户或软件开发商而言,还是需要做一些事情的。
英特尔为此提供了全系列软件开发工具,包括线程分析工具、C++和Fortran编译器和其它性能调试工具套件、性能库及群集工具包等开发工具。这些工具可以帮助改善应用软件编程能力,减少开发、管理和维护HPC应用方案的时间,还能有效地增加应用的可移植性,允许用户在不同的集群系统之间转换代码。
比如,英特尔线程分析工具包括线程检查器、线程档案器和线程构建模块,使用这些线程工具可以加速并简化多线程应用程序的开发与维护。这些工具帮助快速找到并纠正线程错误,并能确定多线程软件中的性能瓶颈。而VTune性能分析器可通过图形用户界面轻松优化应用性能,而且无需重新编译。
总之,英特尔的软件开发工具还能帮助程序员不断扩展和优化性能。通过使用工具对某个应用进行正确的并行化之后,程序员能够为将来的平台做好充分的准备。也就是说,今天的投资在未来还能继续获得回报。
“Cluster Ready”简化HPC采购部署
另外,值得一提的是,英特尔在2007年6月还推出了Cluster Ready计划,对许多硬件厂商和软件厂商的产品进行兼容性认证,让用户在搭建集群方面不会那么费心。Intel Cluster Ready可以帮助用户在采购和使用新平台时更加简单——选购经过Intel Cluster Ready 认证的应用软件和集群系统,可以确保硬件平台和软件应用之间的互操作性,获得性能提升和稳定可靠的平台。
综上所述,只要人类想让碰撞试验的精度越来越高,想找到新的能源,想提高基因分析的效果,想加速商业分析,预测更大的气候模型或者创造更好的3D影像,HPC的发展就不会停步。而全新的英特尔至强5500系列处理器、英特尔的软件开发工具以及Intel Cluster Ready 集群认证计划,都是英特尔为了满足HPC用户需求而努力的结果。
【编辑推荐】