从智慧交通、智慧金融、智能医疗到智能个人助理,自动驾驶,我们已经迈入无处不在的AI时代。在全民AI时代,人工智能在帮助我们提高工作效率,提升工作、生活体验的同时,也对算力提出了更高的要求。除了数据中心算力之外,如何提升终端算力,也成为人们关注的重点。
在AMD自适应与嵌入式计算事业部( AECG ) Versal产品营销总监Manuel Uhm看来,无处不在的AI为高度受限的系统带来更高要求的工作负载。在人工智能驱动的嵌入式系统中,数据的预处理,AI的推理阶段,以及后处理阶段,都需要在高性能嵌入式系统中进行加速,才能实现全系统的实时。
为了满足边缘终端不同阶段的计算需求,AMD推出了面向AI驱动型嵌入系统的第二代Versal AI Edge系列产品和面向经典嵌入式系统的第二代Versal Prime系列产品,不仅提供了更高的AI计算性能,而且更好地降低了功耗,更好地满足AI时代下的企业自适应计算需求。
AI为高度受限的系统带来更高要求的工作负载
众所周知,复杂的边缘场景下不但对计算系统的性能有着一定的需求,而且对设备的尺寸、耐热抗寒性、可靠性、电力供应和信息安全等也提出了更高的要求。随着AI时代的到来,大量的数据需要在终端设备上进行处理,这就对边缘系统提出了更高的要求。
Manuel Uhm表示,在人工智能驱动下,数据预处理、AI推理和后处理都需要在边缘设备上完成。
首先,在数据预处理阶段,只有能够实时准确地收集和处理雷达、激光雷达、摄像头等设备的收集的数据,才可以真正做到整个系统的实时处理。其次,在推理过程中,大都使用矢量处理器来完成。最后,在后处理阶段,一般使用高性能嵌入式CPU来完成。
Manuel Uhm强调,目前没有一类处理器能够针对三个阶段进行优化,只能依靠一系列不同的处理器,才能实现对三个阶段的优化。然而,在三个阶段中使用不同的处理器,需要在不同的芯片中转移数据,不但会增加时延,而且还会带来功耗的提升。因此,如果将这三个阶段集成到一个可编程逻辑SoC上,就能够克服以上挑战。实际上,这也是AMD推出了面向AI驱动型嵌入系统推出第二代Versal AI Edge系列产品的主要原因。
Manuel Uhm表示,可编程逻辑SoC能够更好地匹配各种传感器和各种类型的接口,强大的性能能够真正做到数据的实时处理,同时还可以保证低时延、稳定性,甚至可以在现场部署完成之后,能够更加方便的进行后期升级。
在第二代Versal自适应SoC上实现端到端加速
AMD本次发布的第二代Versal AI Edge系列产品,采用全球领先的可编程逻辑SoC,能够实现灵活的实时预处理传感器融合、数据调节,并支持新的硬图像/视频处理。
据介绍,第二代Versal自适应SoC采用了下一代AI引擎,在实现高效AI推理的同时,提供了高达3倍的每瓦TOPS。由于集成了更高性能的CPU,在后处理过程中实现了高达10 倍的标量计算能力。除此之外,第二代Versal自适应SoC还进一步增强了安全能力,支持ASIL D、SIL 3等。
Manuel Uhm通过智能驾驶、智慧城市和视频流处理三个场景的测试数据,详细介绍了第二代Versal自适应SoC的性能表现。在L2+/L3的自动驾驶场景下,在相近的功耗资源下,与上一代产品相比性能提升了4倍图像处理能力;在智慧城市场景中,与上一代产品相比,采用第二代Versal自适应SoC的设备体积缩小了30%,并支持2倍视频流,每路视频流占板面积更是缩小了65%;在视频流场景下,为多端口编码与流媒体提供了2倍视频处理能力,每路视频流占板面积缩小了35%。
在本次媒体沟通会上,Manuel Uhm还针对数据预处理、AI推理和后处理三个阶段,详细介绍了第二代Versal自适应SoC的优势。
在数据预处理阶段,第二代Versal自适应SoC能够支持图像传感器、摄像头、激光雷达等多种传感器,能够与任何传感器进行接口适配,满足各种应用场景下的需求,拥有非常好地灵活性。
在AI推理过程,第二代Versal AI Edge系列SoC在Dense情况下, MX6数据类型最高可以达到369 TFLOPS,INT8数据类型最高可以达到184 TOPS。如果采用稀疏度计算方式,性能能够实现翻倍。在采用AIE-ML v2情况下,第二Versal AI Edge系列SoC还能够进行一些数据信号的处理,例如FIR、FFT等等。
据Manuel Uhm介绍,为了帮助用户实现更加强大的AI引擎,AMD还提供了开源的软件开发工具包。借助Vitis AI,开发者可以使用他们原本非常熟悉的开源工具,例如PyTorch、TensorFlow等等,在Vitis当中去进行优化,进行推理。
在后处理阶段,第二代Versal AI Edge系列SoC能够为复杂的后处理提供高达10倍的标量算力,实现高达8倍的Arm Cortex-A78AE核心,每个核心最高频率高达2.2GHz,并且有高达200.3K的DMIPS算力。在控制功能的实时处理单元中,RPU可以实现高达10倍的Arm Cortex-R52核心,每个核心最高频率高达1.05 GHz,提供高达28.5K的DMIPS算力。
第二代Versal AI Edge系列产品在汽车行业率先应用
本次媒体采访,Manuel Uhm还详细介绍了第二代Versal AI Edge系列产品的案例及发售情况。
据了解,斯巴鲁已经在EyeSight视觉系统中使用第二代Versal AI Edge系列产品,用以支持碰撞前制动、车道偏离预警、自适应巡航控制和车道保持辅助。之所以选择第二代Versal AI Edge系列产品,原因在于斯巴鲁希望在下一代视觉系统的AI方面具备领先优势,这就要求确保它的低时延。由于第二代Versal AI Edge系列产品具备非常先进的数据类型支持,能够保持EyeSight视觉系统的高吞吐量以及高精度。
Manuel Uhm表示,凭借可编程逻辑的灵活性,斯巴鲁下一代EyeSight系统利用在可编程逻辑中实现的反馈IP,能够实时修改摄像头的传感器参数,实现2030年没有致命道路事故的安全目标。
关于产品的发布与上市时间,Manuel Uhm表示第二代的Versal AI Edge系列和第二代的Versal Prime系列产品芯片样片会于2025年上半年发布,评估套件和系统模块将于2025年年终推出,量产芯片将于2025年末面世。
“人工智能已经无处不在,很难预测5年之后发展到什么程度。AMD作为一家科技公司,我们始终深度参与AI方面的创新和发展,不断在无处不在的AI发展上,立在技术的前沿。”采访最后,Manuel Uhm如是说。