MLPerf v2.0测试成绩发布，NVIDIA Jetson AGX Orin领跑边缘AI-51CTO.COM

　　在数字时代的今天，利用人工智能技术加速业务创新已经成为企业的共识。随着AI技术的突飞猛进，数据量的爆炸式增长，数据结构的变化，对数据中心的算力提出了新的要求，这也成为NVIDIA Ampere 架构一经发布，就得到业界广泛关注与认可的关键原因。

　　作为当前全球最具影响力的AI计算基准评测组织，MLPerf基准测试成为检测算力的重要参考依据。MLPerf由图灵奖得主大卫·帕特森(David Patterson)联合谷歌、斯坦福、哈佛大学等单位共同成立，每年组织全球AI训练和AI推理性能测试并发榜。目前，MLPerf的覆盖了计算机视觉、自然语言处理、推荐系统、强化学习等工作负载和场景。

　　为了提升边缘计算的能力，在今年的GTC上NVIDIA全新发布了NVIDIA Jetson AGX Orin，以此提升边缘AI算力。根据NVIDIA公布的数据，NVIDIA Jetson AGX Orin在最新一轮行业推理基准测试中取得了不错的成线，成为边缘AI的标杆产品。

　　用算力推动边缘创新

　　在今年的NVIDIA GTC上，NVIDIA正式发布了NVIDIA® Jetson AGX Orin™ 开发者套件。这款性能强大、尺寸紧凑、且节能的 AI 超级计算机适用于先进的机器人、自主机器以及新一代嵌入式和边缘计算。

　　根据NVIDIA公布的数据，Jetson AGX Orin 每秒可进行 275 万亿次运算，处理能力比上一代产品 Jetson AGX Xavier 高出 8 倍以上，同时仍保持了手掌大小的尺寸以及引脚兼容性，而且价格相近。

　　据了解，这款套件包含 NVIDIA Ampere 架构 GPU、 Arm Cortex-A78AE CPU、新一代深度学习和视觉加速器、高速接口、更快的内存带宽以及多模态传感器支持，可以为多个并发 AI 应用程序提供支持。

　　在首次参加行业MLPerf基准测试时， NVIDIA Orin就创造了新的AI推理性能纪录，并在边缘提升每个加速器的性能。在边缘AI领域，NVIDIA Orin预生产版本在六项性能测试中的五项处于领先地位，其运行速度比上一代Jetson AGX Xavier快了5倍，能效平均提高了2倍。

　　在最新的MLPerf 2.0导入多资料流(Multi Stream)测试项目，测量边缘运算设备在多摄影机、多传感器场景的性能表现。根据最新MLPerf 2.0性能测试，Jetson AGX Orin的性能最高可达前代Jetson AGX Xavier的5倍，同时提供平均2倍的电力效率。

　　NVIDIA人工智能推理和云计算高级产品经理Dave Salvator表示， NVIDIA Orin拥有出色的性能表现，将进一步加快行业打造新一代机器人和边缘 AI 产品的速度，并推动产业的创新步伐。

　　据了解，NVIDIA Orin现已加入到用于机器人和自动化系统的NVIDIA Jetson AGX Orin开发者套件。包括亚马逊网络服务、约翰迪尔、小松、美敦力和微软Azure在内的6000多家客户使用NVIDIA Jetson平台进行AI推理或其他任务。中国最大的电动汽车制造商比亚迪近期宣布，他们将在其新一代自动驾驶电动汽车中使用内置Orin的DRIVE Hyperion架构。

　　此外，Orin同样也是NVIDIA Clara Holoscan医疗设备平台的关键组成部分，且该平台可供系统制造商和研究人员用来开发新一代AI仪器。

　　Dave Salvator表示，凭借JetPack SDK，Orin可以运行整个NVIDIA AI平台，这个软件堆栈已经在数据中心和云端得到了验证，并且获得了NVIDIA Jetson平台100万名开发者的支持。

　　端到端 AI 和 HPC 数据中心平台

　　除了用于边缘计算的Orin之外，NVIDIA还为数据中心提供了基于安培架构的产品：NVIDIA A100 Tensor Core GPU。

　　NVIDIA A100 Tensor Core GPU主要针对 AI、数据分析和 HPC 应用场景，由 NVIDIA Ampere 架构提供支持，提供 40GB 和 80GB 两种配置。作为 NVIDIA 数据中心平台的引擎，A100 的性能比上一代产品提升高达 20 倍，并可划分为七个 GPU 实例，以根据变化的需求进行动态调整。A100 80GB 将 GPU 内存增加了一倍，提供超快速的内存带宽(每秒超过 2TB)，可处理超大模型和非常庞大的数据集。

　　为了展示A100 GPU的性能，NVIDIA还通过数据表示现有的A100GPU的出色表现，在NVIDIA A100与 Qualcomm Cloud AI100 PCIe的对比测试中，各测试项目中A100的性能皆领先Cloud AI100 PCIe，尤其是在在特定项目中，NVIDIA A100甚至有105倍于处理器的AI运算性能。

　　目前来看，NVIDIA是唯一在所有MLPerf测试中都有提交成绩的公司，并通过测试成绩说明多执行实例GPU(Multi-Instance GPU，MIG)能在几乎不影响性能的前提下进行GPU的虚拟化，增加使用弹性。

　　Dave Salvator表示，通过这些测试成绩不难发现，全新的Jetson AGX Orin开发者工具包为边缘和机器人技术带来了新的人工智能功能，A100在1个GPU的情况之下提供了7个加速器，进一步简化部署和管理，同时优化利用和效用。

　　Dave Salvator强调，在Arm服务器下，NVIDIA的加速性能与x86不相上下，并在短短一年多的时间里，NVIDIA将人工智能软件的性能提高了50%，持续为人工智能提供全面的绩效领导力。