8月21日,以“以‘算’提‘质’,蓄能未来”为主题的2024年第六期联想新质媒体沙龙正式举办。现场,第十四届全国政协委员、中国科学院计算技术研究所研究员张云泉,联想中国基础设施业务群战略总监黄山,联想中国基础设施业务群服务器产品部总经理周韬围绕行业趋势和前沿技术做了分享,多名专家学者和媒体代表聚焦AI基础设施的创新与发展,深入交流了算力产业趋势和最佳实践,共同探讨未来的大模型时代算力发展新图景。
当前,AI技术发展日新月异,大模型百花齐放。通过推进智能算力的高质量发展,为AI发展赋能创新,聚力打造新质生产力已成为业内面临的首要问题。作为中国领先的智能基础设施提供商,面向AI基础设施,联想已构建了“一横五纵”的战略布局,通过联想万全异构智算平台,打造服务器、存储、数据网络、软件及超融合、边缘计算“五纵”产品能力,为客户提供高效稳定、绿色节能,且覆盖通用、AI、科学算力的全场景产品方案。
沙龙现场,周韬透露,首款搭载AMD最新处理器的联想问天WR5225 G3高性能机架式服务器即将正式发布,该产品发布不仅丰富了联想“一横五纵”的业务战略版图,也进一步满足了千行百业对于算力多样化、高性能、高扩展性的需求。
大模型催生算力全新需求算力经济普及需要“算力插座”
随着生成式AI的突飞猛进,算力越来越成为数字经济社会发展的重要底座。技术层面,超算、云计算、大数据、AI 的融合创新的发展,推动算力需求迅猛增长;实际应用层面,近三年来TOP100 的算力服务份额不断攀升。多方合力不断加码,推动中国算力发展快速步入全新阶段。
张云泉活动现场指出,当前背景下算力发展呈现几大趋势:
首先,算力服务异军突起,中国已进入算力经济时代。“算力中每投入1元,带动3-4元经济产出;算力发展指数每提高1点,GDP增长约1293亿元。” 张云泉指出,算力经济是数字经济衍生的一种新经济形态,其以计算为核心,已成为衡量一个地方数字经济发展程度的代表性指标和新旧动能转换的主要手段。
第十四届全国政协委员、中国科学院计算技术研究所研究员 张云泉
其次,超算与AI融合创新,智算中心列入新基建,大模型带来新的计算需求。他指出,“在2020-2026年的预测中,AI的算力需求将快速超过我们对基础算力的需求,算力需求主要来自于大模型、自动驾驶、短视频等场景。”
第三,GPT大模型崛起,AGI时代来临,催生模型作为服务MaaS商业模式。张云泉认为,模型作为服务兴起之后,对于传统的软件开发、服务部署都会有影响,此前的三层架构(IaaS、SaaS、PaaS)中间有可能加入MaaS层,并让其上下两层逐渐模糊化。“‘涟漪’需要多长时间才能被击穿,还需要耐心等待。”张云泉说。
此外,他还进一步指出,算力经济的普及需要类似电力插座一样的算力插座,如今大模型就扮演了算力插座的角色。未来也会出现类似发电厂的算力工厂,尤其是在新能源发达地区。
“一横五纵” 筑牢算力底座 助推新质生产力加速落地
算力经济趋势下,如何筑牢算力底座激发新质生产力成为重要的课题之一。
黄山分享了联想在算力领域的布局。他表示,联想首先拥有全面的算力布局,如横向提供完善的基础设施产品组合,包括服务器,存储,网络,超融合,边缘计算,可纳管CPU、GPU、DPU等异构算力芯片协同计算,统一管理通用计算、科学计算、智能计算等异构计算集群;纵向实现云边端算力协同,以智算领域为例,可以支持从云上训练、训推和推理,到边缘训推、推理再到端侧智能的全场景算力。其次,支持和协同中国AI核心技术生态的迅猛发展。第三,拥有全球领先的液冷技术。第四,开创了多元的算力部署和交付方式,如臻算服务的订阅式交付。第五,通过联想问天系列基础设施产品满足中国国内算力应用的需求特点,通过联想ThinkSystem国际产品助力中国用户在国际拓展业务。
联想中国基础设施业务群战略总监 黄山
面向AI新时代,联想在AI基础设施方面已经构建了“一横五纵”的战略布局。其中,“一横”是指联想万全异构智算平台,可以统一纳管异构算力,释放AI基础设施生产力。“五纵”包括服务器、存储、数据网络、软件及超融合、边缘计算,为客户提供覆盖算力全场景的基础设施产品组合。
黄山在现场详细介绍了联想万全异构智算平台。该平台融合了算力匹配魔方、GPU内核态虚拟化、集合通信算法库、AI高效断点续训技术、AI与HPC集群超级调度器五大创新技术,帮助客户轻松获得融合、稳定的AI基础设施,能够满足不同场景高效、稳定、多元的算力需求。
这一平台自4月份一经发布就获得大量关注,并迅速应用于各行各业场景中。如某高校科研场景中,联想万全异构资产平台统一管理HPC(高性能计算)资源池和AI资源池,并接入了通用计算资源池,形成统一的算力管理界面,实现资源的共享和融合调度,大幅提高了资源的使用效率,并简化用户的管理流程。
联想万全异构智算平台目前已经获得了北大生命科学学院、紫金云等众多行业客户的认可,比如即将助力西北地区最大的公共算力平台紫金云成功实现多元算力的异构纳管。它提供的HPC (高性能计算)和AI(人工智能)的统一管理和运营服务,不仅支撑了科学计算、工程计算等传统HPC的算力需求,也满足了大模型研发和探索的算力需求。
联想问天WR5225 G3服务器即将重磅发布,释放算力新动能
“中国算力市场无处不智能,AI已经进入日常生活的方方面面”,周韬在现场表示,过去几年,中国智能算力规模正以56%的复合增长率在迅猛增长,远远超过通用算力时代的摩尔定律。
联想中国基础设施业务群服务器产品部总经理 周韬
为进一步满足千行百业对于算力多样化、高性能、高扩展性的需求,周韬透露,首款搭载AMD最新处理器的联想问天WR5225 G3即将正式发布。该款全新的服务器秉承了联想服务器一以贯之的“三高一低”特性。
在高性能方面,借助全新的AMD EPYC第四代处理器,联想问天WR5225 G3单处理器核数实现了100%的增加,带来2.8倍的性能提升,并即将支持AMD下一代平台。
在高可靠性方面,“双子星”BMC去耦设计和“神盾”防过载系统等技术,将进一步帮助客户减少停机时间,并可实现无中断固件升级,为客户系统稳定持续运行保驾护航。
在高扩展性方面,联想问天WR5225 G3“百变互联” 模式可实现的灵活XGMI高速互联,以适应客户不同场景、不同使用周期的应用需求。同时DDR5内存以及PCIe Gen5的采用也为带宽带来了质的飞跃,加上12个PCIe插槽的设计,为客户提供了无与伦比的IO性能。
在低能耗方面,服务器可实现CPU、DIMM、VR、GPU的液冷全覆盖。其中,“百变精硅”内存液冷模组中,创新的软硅导热材料精确到了0.01毫米的厚度,恰到好处地保证了液冷模组与内存的充分接触和热传导效果,同时又确保在插拔安装过程中不会损伤内存。另外采用仿生技术设计的“羊角”EVAC散热器和“龙卷风”智能风道电源散热控制系统等技术的使用,进一步降低了整机的能耗,提升了能效比。
这一新品无疑为联想服务器阵营又添“一员大将”。事实上,联想服务器近几个季度增长迅猛,今年第一季度跃升至中国市场第三位,销售额同比、环比增速在前十厂商中均居第一。此外,联想服务器在众多垂直行业的表现更是可圈可点,实现了头部互联网企业的全面覆盖,在运营商市场斩获了多个大单,制造业市场份额已于2023年第三季度跃居前三,教育市场也以众多的HPC灯塔案例领跑第一阵营。
大模型浪潮扑面而来,算力带来的全新生产生活方式正加速转变,也呈现出以算力技术创新共筑新质生产力的生动图景。AI浪潮中,联想也将持续聚焦智能算力的高质量发展,为AI发展赋能,携手开启AI基础设施未来新篇章,释放AI时代高质量发展新动能。