Arm发布全新终端计算子系统:优化人工智能体验,构建最高性能的终端AI应用体验

原创
服务器 芯片
Arm公布了最新的终端计算子系统(CSS),其具备最新的 Armv9.2 CPU、Arm Immortalis™ GPU、基于3nm工艺生产就绪的 CPU 和 GPU 物理实现,以及最新的 CoreLink™ 系统互连和系统内存管理单元 (SMMU)。

软硬件技术的飞速发展正在将AI从数据中心/云端推向终端设备上。如今,在手机、电脑等设备上运行AI,已经成为未来趋势。Arm终端事业部产品管理副总裁 James McNiven在近期接受记者采访时指出,过去一年,人工智能 (AI) 技术给移动设备带来的改变令人赞叹。我们正见证 AI 从手机到笔记本电脑所取得的显著创新,并由此诞生了 AI 智能手机和 AI PC。

James McNiven表示,设备端 AI 再次重新定义了智能手机的“智能性”而 Arm 是这一切的基石。发布会上,Arm公布了最新的终端计算子系统(CSS),其具备最新的 Armv9.2 CPU、Arm Immortalis™ GPU、基于3nm工艺生产就绪的 CPU 和 GPU 物理实现,以及最新的 CoreLink™ 系统互连和系统内存管理单元 (SMMU)。

除此之外,为了使开发者能够以最高性能快速实现AI创新, Arm还推出了面向开发人员量身定制的Kleidi软件,其中包括面向AI工作负载的KleidiAI和面向计算机视觉应用的 KleidiCV。

性能大幅提升的CPU/GPU

从数据中心/云走向终端设备,边缘AI对终端设备的计算性能提出更高的要求。James McNiven认为,AI 时代正加速发展,复杂性随之不断提高,计算需求呈指数级增长。为此,Arm不断倾听合作伙伴的意见,持续将我们的产品及解决方案迭代更新,善用最新的工艺节点,并提供可为实现设备端 AI 奠定基础的平台。

据介绍,Arm 终端CSS 是迄今速度最快的 Arm 计算平台,数据显示,Arm终端 CSS 提升了 30% 以上的计算和图形性能,以应对要求苛刻的实际用例中的安卓工作负载,同时也提高了 59% 的 AI 推理速度,适用于更广泛的 AI/机器学习 (ML) 和计算视觉工作负载。

Arm 终端 CSS 的关键在于 Arm 目前性能最强、效率最高、功能最广泛的 CPU 集群,带来最佳的性能和能效。James McNiven强调,自2021 年推出了专为性能和 AI 而设计的 Armv9 架构性能方面得到了显著提升,其中包括:提高在矢量加速、机器学习 (ML) 等领域的计算能力;增强系统的安全性和稳健性;更重要的是,增加了面向 AI 的功能。

此次推出的全新Arm Cortex®-X925实现了 Cortex-X 系列推出以来最高的同比性能提升,该 CPU 利用了领先的三纳米工艺节点,在 3.8GHz 的时钟速率和最大缓存大小的条件下,与 2023 年旗舰智能手机的四纳米 SoC 相比,其单线程性能大幅提高 36%。而在 AI 性能方面,Cortex-X925 取得了 41% 性能提升,可显著提高如大语言模型 (LLM) 等设备端生成式 AI 的响应能力。

除此之外,全新的 Arm Cortex-A725 CPU 将对前沿性能的不懈追求与出色的效率相结合,该 CPU 将针对 AI 和手游用例的性能效率提高了 35%。这一改进也得益于更新后的 Arm Cortex-A520 CPU 和更新后的 DSU-120,使得采用最新 Armv9 CPU 集群的消费电子设备可提升能效和可扩展性。

除了性能提升之外,Arm也更加重视数据安全方面的能力。据了解,Arm 提供的内存标记扩展 (Memory Tagging Extension, MTE) 可帮助开发者在无需侵入式检测的情况下查找和修复代码中的错误,也可在实际操作环境下,用来减少安全漏洞被利用。目前,vivo X100 和 X100 Pro 以及 Google Pixel 8 旗舰设备现在都允许用户启用 MTE。

在提升CPU性能之外,Arm也特别重视GPU性能的提高。为此,Arm 发布了迄今为止性能最强、效率最高的GPU——Arm Immortalis-G925 GPU。数据显示,Arm Immortalis-G925 GPU在各款领先的手游应用中实现了 37% 的性能提升,并在多个 AI 和 ML 网络上提升了 34% 的性能。Immortalis-G925 面向旗舰智能手机市场,而包括 Arm Mali™-G725 和 Mali-G625 GPU 在内的全新高可扩展性 GPU 系列,则面向从高端手机到智能手表和 XR 可穿戴设备等广泛的消费电子设备市场。

“Immortalis-G925 是Arm第三代具备光线追踪技术的 GPU。随着该功能在市场上的推广,Arm一直致力于让开发者尽可能轻松地在移动设备上实现游戏主机级内容。” James McNiven表示,“我们与 Epic Games 合作,确保他们的桌面平台渲染器能够在我们的 GPU 上快速高效地运行。今年,我们将持续开展全球的开发者教育活动,以确保游戏开发者能够再现一些精彩示例内容。

为开发者量身定制的Kleidi

在上周的发布会,除了全新的CPU与GPU之外,Arm还为开发带来了量身定制的开发软件,即Kleidi

James McNiven告诉记者,“Kleidi”,在希腊语代表“钥匙”。它将有助于软件开发者无缝解锁 Arm CPU 上的最佳性能,其包括面向 AI 工作负载的 KleidiAI 和面向计算机视觉应用的 KleidiCV。

KleidiAI 是一套面向 AI 框架开发者的计算内核,使他们能够在各种设备上轻松获得 Arm CPU 上的最佳性能,并支持 Neon™、SVE2 和 SME2 等关键 Arm 架构功能。KleidiAI 与 PyTorch、Tensorflow、MediaPipe 等热门 AI 框架集成,旨在加速 Meta Llama 3、Phi-3 等关键模型的性能,并且还可前后兼容,以确保 Arm 在引入更多技术时依然能适用未来市场的需求。

计算机视觉与 AI 紧密相连,摄像头管线不仅仅运行神经网络,还能够运行传统的计算机视觉算法,并保证摄像头或社交媒体应用的顺畅运行。James McNiven表示,Arm将 KleidiCV 融入到常用的 OpenCV 库时,性能有了显著改进。今年,Arm还与 OpenCV.ai 合作,力求让安卓开发者可以更轻松地将 OpenCV 纳入到他们的项目中,并从 KleidiCV 带来的改进中受益。

“我们的最终目标,是让我们的合作伙伴以及我们的生态系统能够不断创新、实现差异化并更快地进入市场。Arm 终端 CSS 带来了 Armv9.2 的能效优势,凭借物理实现和持续的软件优化,它将彻底革新开发者和消费者的体验。” James McNiven表示,多年来,Arm进行了大量投资,旨在让人们能够全天候享受更加沉浸式的体验。但这一切都在发生改变,AI 还在向着另一个方向突破计算的极限,并创造出大量新的应用。


责任编辑:张诚 来源: 51CTO
相关推荐

2010-05-25 15:42:52

智能计算绿色高性能

2024-04-19 10:29:05

联想昭阳AI PC

2023-08-30 16:04:13

人工智能AI

2012-02-13 11:35:32

VDI网络带宽

2012-02-15 10:07:37

虚拟化VDI桌面虚拟化

2010-03-26 11:08:17

MeeGo系统

2022-05-16 10:41:40

GNOME 42Console控制台

2017-04-11 18:30:50

2018-10-25 10:39:41

新华三

2024-03-15 14:26:28

2018-04-24 10:10:38

医疗

2019-07-18 12:37:20

高性能计算云原生公共云

2020-10-09 09:58:51

客户体验人工智能IT

2017-11-17 08:57:00

AI智能机器学习

2021-02-05 08:00:00

人工智能机器人技术

2021-03-23 13:38:29

人工智能Facebook感知变化算子

2021-03-22 11:28:23

人工智能机器学习技术

2014-04-16 17:13:27

戴尔

2019-01-10 16:38:54

华为

2024-10-21 12:53:23

点赞
收藏

51CTO技术栈公众号