AI领域“奥运会”放榜，戴尔科技表现抢眼-51CTO.COM

全球AI领域的“奥运会”

近日放榜！

戴尔5款服务器

分别在各自类别的排名中拿下

“金牌”

做到这一点尤为不容易

因为今年的参与者和提交数量

分别是上一年的2倍和6倍

恭喜戴尔！

MLPerf™

AI性能基准测试

MLPerf™是由图灵奖得主大卫•帕特森于2018年联合顶尖学术机构发起成立，是目前最具权威性、影响力最广的国际AI性能基准测试，也是用户在采购AI系统时的重要参考依据。

MLPerf™ AI性能基准测试包含Training（训练）和Inference（推理）两大领域，分为封闭任务(Closed)赛道和开放任务(Open)赛道。

开放优化能力着重考察参测厂商的AI技术创新力，固定任务则因更公平地考察参测厂商的硬件系统和软件优化的能力，成为更具参考价值的AI性能基准测试。谁能够在这个测试中取得更多的领先，谁的AI能力就越突出。

在本轮MLPerf v2.0测试中，戴尔科技向各个类别提交了167份项结果，是封闭式数据中心类别里排名第二多的厂商。此外，只有戴尔提交了针对不同主机操作系统的结果。

在这里，恭喜我们的PowerEdge XE8545、PowerEdge R750xa、PowerEdge XE2420、PowerEdge XR12这四款服务器在MLPerf v2.0获得了优异表现！

多个类别排名第一

每加速卡性能，排名第一

与同样采用NVIDIA A100 GPU的其他系统相比，戴尔PowerEdge XE8545和PowerEdge R750xa在竞争中脱颖而出，测试结果涵盖图像分类、对象检测、语音到文本、医学成像、自然语言处理和推荐引擎等用例。

NVIDIA A100 GPU在深度学习领域广受欢迎。测试结果表明采用NVIDIA A100 GPU的戴尔PowerEdge XE8545和PowerEdge R750xa服务器在该领域的突出优势。

基于PCIe的服务器性能，排名第一

在基于PCIe的4-GPU服务器中，戴尔PowerEdge R750xa也在多个基准测试中（包括图像分类、对象检测、语音到文本、自然语言处理和推荐用例）脱颖而出，位列第一。

戴尔PowerEdge R750xa是久经盛名的PowerEdge R750服务器的GPU优化版，非常适合于AI、ML和DL工作负载。它支持4x300W双宽或6x75 W单宽加速卡，提供多达8个PCIe Gen4插槽，并支持多达8个NVMe SSD。

最低多流延迟，排名第一

戴尔PowerEdge XE8545服务器在图像分类和对象检测用例，使用NVIDIA 多实例 GPU (Multi Instance GPU, MIG)获得了最低多流（Multi-stream）延迟的第一名，显示出PowerEdge XE8545在边缘类别的强大优势。

戴尔PowerEdge XE8545是人工智能工作负载的强大动力引擎，这是一款双插槽4U机架服务器，最多包含128个第三代AMD霄龙处理器核心、四个NVIDIA A100 GPU以及NVIDIA vGPU软件所具备的优化性能。

此外，PowerEdge XE8545在多项基准测试（包括语音到文本、对象检测、自然语言处理和医学图像分割）中，还获得了系统性能第二名的结果。

T4推理结果第一

与其他使用NVIDIA T4 GPU的系统相比，戴尔PowerEdge XE2420服务器在图像分类、语音转文本和推荐用例取得了最高推理结果。

戴尔PowerEdge XE2420服务器是一款专业边缘服务器，专为环境要求苛刻的边缘应用如流分析、制造物流、5G蜂窝处理而设计。此外，该服务器支持高达2993MT/s的16x DDR4 RDIMM/LR-DIMM，非常适合低延迟和大存储边缘应用。

每瓦性能第一

在功耗方面，配备A2 GPU的戴尔PowerEdge XR12服务器的能耗数据，与同为A2 GPU的其他服务器相比，在ResNet 50、 RNNT、BERT和DLRM基准测试中的每瓦性能均排名第一。

戴尔PowerEdge XR12是一款坚固耐用、符合海事要求的2U服务器，适用于电信、军事、零售，以及其他注重能耗表现的环境。它是图像分类、物体检测、语音到文本、自然语言处理和推荐引擎的良好选择。

结语

感谢权威AI基准评测组织验证并确认了戴尔服务器在AI领域的出色表现。作为全球领先的IT端到端解决方案提供商，戴尔科技在AI领域深耕多年，积累了先进的技术和丰富的行业应用经验，能够与广大客户和合作伙伴一道，携手共进，加快AI应用落地，加速AI创新成果转化。

附：戴尔服务器在MLPerf Inference v2.0的基准测试结果

为了更紧密地匹配实际使用情况，MLPerf推理测试对数据中心类别有两个必需的场景：离线和服务器。离线场景意味着任务所需的所有数据都在本地可用。服务器场景在请求时以突发形式在线交付数据。

对于服务器场景，性能指标是每秒查询次数 (QPS)。对于离线场景，性能指标是每秒离线样本数。一般来说，吞吐量越高表示结果越好。在下图中，Y轴是指数比例轴，代表吞吐量，X轴代表被测系统 (SUT) 及其相应模型。

图1至图6分别展示各种SUT在ResNet 50、BERT、SSD、3dUnet、RNNT和DLRM模式下，服务器和离线场景的单卡性能：

图1：MLPerf Inference v2.0 ResNet

50 per card结果

图2：MLPerf Inference v2.0 BERT

默认和高精度per card结果

图 3：MLPerf Inference v2.0 SSD-ResNet

34 per card 结果

图 4：MLPerf Inference v2.0 3D U-Net

per card结果

图 5：MLPerf Inference v2.0 RNNT