今年7月份, 2015国际超级计算机大会在德国法兰克福举行,会议期间公布了最新的全球超级计算机500强名单,其中,最令国人骄傲的当属国防科技大学研制的天河二号超级计算机,以每秒千万亿次的浮点运算速度33.86PFLOP/s第五次蝉联冠军。此外,有37套来自中国的HPC系统进入TOP500名单,排名全球第三。
从榜单可以看出,中国超级计算能力已经取得了巨大的进步,在过去几年步入了世界领先行列。如今中国不仅能够制造超级计算机,而且也可以设计以及研发并行计算和软件。高性能计算已经成为解决国家经济建设、社会发展、科技进步、国家安全一系列重大挑战性问题的重要手段,其已成为一个国家综合实力的象征。
我国的高性能计算进步巨大,软件领域还有很大的提升空间,通过算法优化等手段可以将硬件的系统发挥到极致,大大升高性能计算的能力。
实际上,自并行计算技术开始大规模投入实用后,其软件优化与硬件发展存在差异的问题就一直困扰着计算机领域学术界、产业界人士以及最终用户。为了让更多的软件代码实现改造,使之释放并行计算硬件平台的潜能,英特尔并行计算中心于2013年正式启动,至今已在全世界15个国家数十所大学和科研机构协作成立了超过 50个并行计算中心,与跨领域的开发者,科学家,技术专家等一起进行培训分享,技术交流,并针对至强融核(Xeon Phi)开发和优化了覆盖16个不同领域的超过80种应用软件,例如著名科学家斯蒂芬霍金教授所创建的的剑桥大学理论宇宙学研究中心(COSMOS),也得益于英特尔并行计算中心的英特尔架构计算平台的优化,加速了其相关科学研究的发展。
中国科学院作为中国最高研究学术机构,多年来不断推动关键应用及计算技术的现代化方面的突破。在今年4月份,英特尔中国首家英特尔并行计算中心(Intel Parallel Computing Centers,简称IPCC)落户中科院网络信息中心超级计算机中心。
中科院超算中心隶属于中国科学院计算机网络信息中心,同时也是中国国家网格运管中心、中国国家网格北方主节点、超级计算创新联盟挂靠单位及中国科学院超级计算环境总中心。其主要工作一部分是为用户提供超算服务,另一部分是和科研单位或者相关的科研机构合作开发高性能计算软件、算法等工作。多年来在诸如动车外形设计、大气所地球洋流模拟、国家天文台和紫金山天文台宇宙模拟工程、科学院可视化模拟计算工程中都发挥了巨大作用。
中国科学院超级计算中心主任助理王彦棡在近日接受媒体采访时介绍,中科院超算中心将IPCC的工作分为两部分。一部分是专门做刚性偏微分方程的求解器,这个求解器可以在大时间尺度下完成相场计算,而且计算结果基本保持一致。这个目前可以应用在如计算力学、材料科学、化学和生物科学等诸多领域。
因为IPCC主要支持的是各大机构的开源软件,因此他们的另一部分工作是针对开源软件做自己算法的开发,并注入到LAMMPS里面。最终代码会以API的形式放到LAMMPS当中去做开源。
王彦棡表示,从“十一五”到“十二五”期间所做的算法优化已经超过了140多级,涉及到所有的行业。经过这么多工作,中科院超算中心也产生了一系列的成果,如从2006年的时候就有第一个沙尘暴预报系统,在国际上唯一的稠密和稀疏特征的并行软件包,以及我国首个万核级并行气动数值计算软件等。
据悉,在英特尔并行计算中心获得成功的基础上,英特尔还将推出英特尔代码现代化开发者社区,旨在帮助HPC开发人员针对在当前和未来硬件上为实现最高性能进行编码。该计划面向超过400,000 HPC开发人员及合作伙伴,为全球开发人员提供各类工具、培训、知识和支持,并让他们能够联系并行计算和HPC领域的大量卓越专家寻求帮助。更广泛的社区将帮助开发者获得所需技能,从而释放英特尔硬件的全部潜能并支持下一个十年创新发现。
在最新的全球超算TOP500榜当中,英特尔至强处理器占据了主导地位,旗下的至强E5系列的SandyBridge、IvyBridge以及Haswell三代产品占据了榜单当中所有设备芯片数量的80%之多。不仅份额绝对领先,在性能上英特尔也有大幅提升,本次TOP500排行榜冠军天河2号登顶的背后就是由Intel的Xeon Phi加速卡来做支撑的。Xeon Phi是英特尔去年在国际超级计算机大会(ISC2014)上公布的多项全新强化技术,以巩固在高效能运算(High Performance Computing,HPC)的领先地位,包括Intel Xeon Phi 处理器(代号为 Knights Hill),以及针对 HPC环境进行最佳化的高速互连技术 Intel Omni-Path Architecture 的架构与效能细节。
在今年的2015年ISC国际超级计算机会议上,英特尔公布了更多Xeon Phi加速卡的架构细节,并公开演示Omini Path高速互联技术。据悉,目前Omini Path正由OEM系统厂商进行抽样,预计在正式发布时将得到超过100款交换机和服务器平台的支持,预计将于2015年末投入生产并开始发运。Omini Path架构的高级特性包括流量优化、数据包完整性保护和动态通道扩展等可支持网络链路层进行更精细控制,从而实现高弹性、高性能及优化的流量传输。