AI PC高性能芯片之争, Intel与AMD的最新AI处理器有何过人之处

原创
服务器 芯片
英特尔与AMD公布的英特尔酷睿Ultra(Lunar Lake)处理器和AMD锐龙AI 300系列处理器有何过人之处?本文将详细介绍!

PC智能化已经成为未来趋势,随着芯片和PC厂商快速入局,2024年将成为AI PC的元年。根据IDC预测, 2024年中国PC市场出货量中,AI PC占比将由2023年的8.1%攀升至55%,全新的本地部署AI体验将驱动消费者置换传统PC为AI PC。AI PC渗透率预计持续增长,在中国PC市场中新机的装配比例将在未来几年中快速攀升,至2027年达到85%,AI PC成为全球及中国PC市场复苏的重要驱动力。

众所周知,AI PC对算力芯片提出了更高的要求,微软的下一代操作系统对AI PC算力性能提出了新的标准,要求具备40 TOPS算力性能。英特尔和微软联手定义的AI PC提出必须满足三项基本条件:能够运行微软AI助理Copilot、配备微软Copilot实体键、内建神经处理单元(NPU)。

今年上半年,英特尔与AMD纷纷推出了面向AI PC的高性能算力产品 (CPU+GPU+NPU),以此来抢占先机,获取更多的市场份额。仅仅过去几个月的时间, 英特尔与AMD便再度公布了全新的产品规划:英特尔酷睿Ultra(Lunar Lake)处理器AMD锐龙AI 300系列处理器。那么,这两款即将上市的新产品在性能上有何过人之处?接下来,让我们一起看一下。

一)英特尔酷睿Ultra处理器(Lunar Lake)

英特尔全新发布的代号为Lunar Lake的酷睿Ultra处理器继续采用了上一代(Meteor Lake) SoC的设计,在一块芯片中集成了CPU、GPU、NPU计算模块。不同之处在于,Lunar Lake 没有采用自己的芯片制造工艺,而是用上了台积电N3B(第一代3nm工艺)和台积电N6两种工艺来打造。

根据英特尔提供的数据显示,由于采用了更加先进的工艺,Lunar Lake处理器的能效提升了约30%。

CPU方面, Lunar Lake掉了LP-E核设计,采用了新的4x4设计,配备了4个P核4个E核。同时Lunar Lake支持超线程,这就意味着线程数量和核心数量同样都是8

根据英特尔展示的数据,与Meteor Lake采用的LP-E核相比,Lunar Lake E核(Skymont)在同性能下的功耗只有前者的三分之一,同功耗下的单线程和多线程性能则有前者2倍和4 倍。同时,P核(Lion Cove)的IPC提高了14%。

除此之外,在 Windows 11「containment zones」的基础上,Lunar Lake可以通过线程指令使用异构调度策略,将工作负载(比如Copilot助手等应用)导向功耗更低的E核,来实现节省电量的目的;或者是导向性能更高的P核,实现更流畅运行。也就是说,Lunar Lake可以将特定任务细化到分配给不同策略的核心,做到更高匹配度和更高效率运行。

最后,Lunar Lake设计增强了分支预测、指令并行度和缓存带宽,使得处理器在处理多任务和计算密集型任务时有更好的表现。

GPU方面,Lunar Lake处理器采用了最新一代Xe2架构,不仅性能有了平均50%的提升,而且具有高度的可扩展性,既能够在即将推出的Arc显卡上使用,也可以集成在低功耗移动芯片使用。根据英特尔提供的数据,新的GPU能提供高达67TOPS的AI算力。

NPU方面,Lunar Lake处理器性能达到了48TOPS的AI性能,与上一代产品的增长了四倍以上。根据英特尔提供的数据显示,在异构计算下,NPU加上CPU提供的5TOPS算力,以及GPU提供的67TOPS算力,Lunar Lake处理器整体能够提供高达 120TOPS 的算力。

除此之外,为了提高数据传输速度,提升响应时间,Lunar Lake处理器首次将内存芯片直接焊在CPU芯片中,并提供有16GB和32GB(双通道)LPDDR5X两种配置,单芯片运行速度高达8533MT/s。传统的PCB嵌入式设计相比,PHY功耗降低了40%,面积节省了250平方毫米。

官方数据显示,Lunar Lake处理器计划将于今年秋季正式出货。

二)AMD 锐龙AI 300系列处理器

AMD全新一代处理器命名为“锐龙AI 300系列”,代号为“Strix Point”,同样采用了CPU+GPU+NPU的组合方式。不过,CPU采用了全新的Zen5架构,GPU采用升级版的RDNA3.5架构,NPU采用全新的XDNA2架构,AMD官方号称“面向下代AI PC/Copilot+ PC的世界一流处理器”。制造工艺方面,仍旧采用比较成熟的4纳米工艺制程。

与英特尔有所不同的地方在于,AMD已经公布了即将首发的产品型号,目前只有锐龙AI 9 HX 370和锐龙AI 9 365两款产品,均定位于高端。

作为旗舰产品,锐龙AI 9 HX 370CPU部分拥有12核心24线程,每个核心拥有1M的二级缓存1MB,总容量到12MB,三级缓存也增加到了24MB。主频方面,锐龙AI 9 HX 370的基准频率为2.0GHz,最高主频5.1GHz

GPU部分,AMD对架构进行了全新升级,命名为“Radeon 890M”CU单元数量从12个增至16个,2.9GHz。

NPU部分,锐龙AI 9 HX 370拥有50TOPS的算力,目前来看仍旧是当前性能最强的NPU

作为高端产品,锐龙AI 9 365采用了10核心20线程的设计,二级缓存10MB,三级缓存仍为24MB,基准频率2.0GHz最高频率达5.0GHz

与旗舰产品锐龙AI 9 HX 370相比,GPU部分进行了一定程度的精简,改名为Radeon 880M,CU单元降低为12个,但主频仍旧是频率2.9GHz。

不过,锐龙AI 9 365NPU算力与旗舰产品完全相同,仍旧提供50TOPS的算力。AMD公布了NPU带来的算力提升。据称,与上代产品相比,XDNA2 NPU的计算能力提升了多达5倍,多任务并行能力翻了一番,能效也提升了最多2倍。5倍的性能提升来自Llama 2 70亿参数大模型的响应速度,从启动到获得第一个token,锐龙AI 9 HX 370达到了上一代锐龙98940HS的5倍之多

我们从AMD官网公布信息看到,锐龙AI 300系列处理器支持操作系统包括 Windows 11 - 64-Bit Edition、RHEL x86 64-Bit和Ubuntu x86 64-Bit,没有将Windows 10列入其中,可以看出新的处理器已经不再支持Windows 10

据了解,两款AMD锐龙AI 300处理器将于今年7月正式上市。

写在最后:

AI PC对算力提出了更高的要求,CPU+GPU+NPU的组合已经成为提高AI PC算力的最佳方式。从英特尔和AMD公布的最新处理器来看,在算力上较前一代产品有了巨大的提升。英特尔更是将Lunar Lake处理器整体算力提升到120TOPS。虽然AMD没有公布整体算力数据,但从NPU能够提供50TOPS算力水平来看(英特尔Lunar Lake处理器的NPU算力为48TOPS),整体性能并不比英特尔差。当然,至于终端用户选择英特尔还是AMD的终端产品,处理器的性能仅仅是一个方面,这里不作具体探讨。

可以预见,有了性能更强的处理器之后, AI PC的性能也将会得到大幅度提升,各大模型厂商也将能够基于AI PC算力开发出更多的应用。

责任编辑:张诚 来源: 51CTO
相关推荐

2010-01-14 18:02:05

C++语言

2024-01-10 11:10:36

英伟达AI芯片

2015-11-27 14:05:03

ivvi

2017-11-07 08:25:36

处理器

2011-06-30 22:03:17

2012-08-01 13:10:01

微软Surface

2009-05-25 10:22:00

2018-07-23 10:22:36

AI芯片传统

2021-06-01 15:14:52

戴尔

2016-04-29 13:23:53

大数据公司

2017-11-09 11:22:32

2018-02-07 11:34:18

维谛

2017-07-11 14:01:07

AMD服务器处理器

2013-08-07 09:37:56

2019-07-16 09:01:18

图数据图计算费马科技

2021-11-09 10:23:28

机器学习人工智能计算机

2018-01-30 10:17:05

AI芯片处理器

2015-10-22 17:38:35

AMD处理器嵌入式

2013-03-08 09:46:34

Linux操作系统安全性

2022-06-30 09:32:46

人工智能AI机器学习
点赞
收藏

51CTO技术栈公众号