全球AI领域的“奥运会”
近日放榜!
戴尔5款服务器
分别在各自类别的排名中拿下
“金牌”
做到这一点尤为不容易
因为今年的参与者和提交数量
分别是上一年的2倍和6倍
恭喜戴尔!
MLPerf™
AI性能基准测试
MLPerf™是由图灵奖得主大卫•帕特森于2018年联合顶尖学术机构发起成立,是目前最具权威性、影响力最广的国际AI性能基准测试,也是用户在采购AI系统时的重要参考依据。
MLPerf™ AI性能基准测试包含Training(训练)和Inference(推理)两大领域,分为封闭任务(Closed)赛道和开放任务(Open)赛道。
开放优化能力着重考察参测厂商的AI技术创新力,固定任务则因更公平地考察参测厂商的硬件系统和软件优化的能力,成为更具参考价值的AI性能基准测试。谁能够在这个测试中取得更多的领先,谁的AI能力就越突出。
在本轮MLPerf v2.0测试中,戴尔科技向各个类别提交了167份项结果,是封闭式数据中心类别里排名第二多的厂商。此外,只有戴尔提交了针对不同主机操作系统的结果。
在这里,恭喜我们的PowerEdge XE8545、PowerEdge R750xa、PowerEdge XE2420、PowerEdge XR12这四款服务器在MLPerf v2.0获得了优异表现!
多个类别排名第一
每加速卡性能,排名第一
与同样采用NVIDIA A100 GPU的其他系统相比,戴尔PowerEdge XE8545和PowerEdge R750xa在竞争中脱颖而出,测试结果涵盖图像分类、对象检测、语音到文本、医学成像、自然语言处理和推荐引擎等用例。
NVIDIA A100 GPU在深度学习领域广受欢迎。测试结果表明采用NVIDIA A100 GPU的戴尔PowerEdge XE8545和PowerEdge R750xa服务器在该领域的突出优势。
基于PCIe的服务器性能,排名第一
在基于PCIe的4-GPU服务器中,戴尔PowerEdge R750xa也在多个基准测试中(包括图像分类、对象检测、语音到文本、自然语言处理和推荐用例)脱颖而出,位列第一。
戴尔PowerEdge R750xa是久经盛名的PowerEdge R750服务器的GPU优化版,非常适合于AI、ML和DL工作负载。它支持4x300W双宽或6x75 W单宽加速卡,提供多达8个PCIe Gen4插槽,并支持多达8个NVMe SSD。
最低多流延迟,排名第一
戴尔PowerEdge XE8545服务器在图像分类和对象检测用例,使用NVIDIA 多实例 GPU (Multi Instance GPU, MIG)获得了最低多流(Multi-stream)延迟的第一名,显示出PowerEdge XE8545在边缘类别的强大优势。
戴尔PowerEdge XE8545是人工智能工作负载的强大动力引擎,这是一款双插槽4U机架服务器,最多包含128个第三代AMD霄龙处理器核心、四个NVIDIA A100 GPU以及NVIDIA vGPU软件所具备的优化性能。
此外,PowerEdge XE8545在多项基准测试(包括语音到文本、对象检测、自然语言处理和医学图像分割)中,还获得了系统性能第二名的结果。
T4推理结果第一
与其他使用NVIDIA T4 GPU的系统相比,戴尔PowerEdge XE2420服务器在图像分类、语音转文本和推荐用例取得了最高推理结果。
戴尔PowerEdge XE2420服务器是一款专业边缘服务器,专为环境要求苛刻的边缘应用如流分析、制造物流、5G蜂窝处理而设计。此外,该服务器支持高达2993MT/s的16x DDR4 RDIMM/LR-DIMM,非常适合低延迟和大存储边缘应用。
每瓦性能第一
在功耗方面,配备A2 GPU的戴尔PowerEdge XR12服务器的能耗数据,与同为A2 GPU的其他服务器相比,在ResNet 50、 RNNT、BERT和DLRM基准测试中的每瓦性能均排名第一。
戴尔PowerEdge XR12是一款坚固耐用、符合海事要求的2U服务器,适用于电信、军事、零售,以及其他注重能耗表现的环境。它是图像分类、物体检测、语音到文本、自然语言处理和推荐引擎的良好选择。
结语
感谢权威AI基准评测组织验证并确认了戴尔服务器在AI领域的出色表现。作为全球领先的IT端到端解决方案提供商,戴尔科技在AI领域深耕多年,积累了先进的技术和丰富的行业应用经验,能够与广大客户和合作伙伴一道,携手共进,加快AI应用落地,加速AI创新成果转化。
附:戴尔服务器在MLPerf Inference v2.0的基准测试结果
为了更紧密地匹配实际使用情况,MLPerf推理测试对数据中心类别有两个必需的场景:离线和服务器。离线场景意味着任务所需的所有数据都在本地可用。服务器场景在请求时以突发形式在线交付数据。
对于服务器场景,性能指标是每秒查询次数 (QPS)。对于离线场景,性能指标是每秒离线样本数。一般来说,吞吐量越高表示结果越好。在下图中,Y轴是指数比例轴,代表吞吐量,X轴代表被测系统 (SUT) 及其相应模型。
图1至图6分别展示各种SUT在ResNet 50、BERT、SSD、3dUnet、RNNT和DLRM模式下,服务器和离线场景的单卡性能:
图1:MLPerf Inference v2.0 ResNet
50 per card结果
图2:MLPerf Inference v2.0 BERT
默认和高精度per card结果
图 3:MLPerf Inference v2.0 SSD-ResNet
34 per card 结果
图 4:MLPerf Inference v2.0 3D U-Net
per card结果
图 5:MLPerf Inference v2.0 RNNT
per card结果
图 6:MLPerf Inference v2.0 DLRM
默认和高精度per card结果