PC智能化已经成为未来趋势,随着芯片和PC厂商快速入局,2024年将成为AI PC的元年。根据IDC预测, 2024年中国PC市场出货量中,AI PC占比将由2023年的8.1%攀升至55%,全新的本地部署AI体验将驱动消费者置换传统PC为AI PC。AI PC渗透率预计持续增长,在中国PC市场中新机的装配比例将在未来几年中快速攀升,至2027年达到85%,AI PC成为全球及中国PC市场复苏的重要驱动力。
众所周知,AI PC对算力芯片提出了更高的要求,微软的下一代操作系统对AI PC算力性能提出了新的标准,要求具备40 TOPS的算力性能。英特尔和微软联手定义的AI PC提出必须满足三项基本条件:能够运行微软AI助理Copilot、配备微软Copilot实体键、内建神经处理单元(NPU)。
今年上半年,英特尔与AMD纷纷推出了面向AI PC的高性能算力产品 (CPU+GPU+NPU),以此来抢占先机,获取更多的市场份额。仅仅过去几个月的时间, 英特尔与AMD便再度公布了全新的产品规划:英特尔酷睿Ultra(Lunar Lake)处理器和AMD锐龙AI 300系列处理器。那么,这两款即将上市的新产品在性能上有何过人之处?接下来,让我们一起看一下。
一)英特尔酷睿Ultra处理器(Lunar Lake)
英特尔全新发布的代号为Lunar Lake的酷睿Ultra处理器继续采用了上一代(Meteor Lake) SoC的设计,即在一块芯片中集成了CPU、GPU、NPU计算模块。不同之处在于,Lunar Lake 并没有采用自己的芯片制造工艺,而是用上了台积电N3B(第一代3nm工艺)和台积电N6两种工艺来打造。
根据英特尔提供的数据显示,由于采用了更加先进的工艺,Lunar Lake处理器的能效提升了约30%。
CPU方面, Lunar Lake去掉了LP-E核设计,采用了新的4x4设计,配备了4个P核和4个E核。同时,Lunar Lake将不再支持超线程,这就意味着其线程数量和核心数量同样都是8核。
根据英特尔展示的数据,与Meteor Lake采用的LP-E核相比,Lunar Lake E核(Skymont)在同性能下的功耗只有前者的三分之一,同功耗下的单线程和多线程性能则有前者2倍和4 倍。同时,P核(Lion Cove)的IPC提高了14%。
除此之外,在 Windows 11「containment zones」的基础上,Lunar Lake可以通过线程指令使用异构调度策略,将工作负载(比如Copilot助手等应用)导向功耗更低的E核,来实现节省电量的目的;或者是导向性能更高的P核,实现更流畅地运行。也就是说,Lunar Lake可以将特定任务细化到分配给不同策略的核心,做到更高匹配度和更高效率地运行。
最后,Lunar Lake设计增强了分支预测、指令并行度和缓存带宽,使得处理器在处理多任务和计算密集型任务时有更好的表现。
GPU方面,Lunar Lake处理器采用了最新一代的Xe2架构,不仅性能有了平均50%的提升,而且还具有高度的可扩展性,既能够在即将推出的Arc显卡上使用,也可以集成在低功耗移动芯片上使用。根据英特尔提供的数据,新的GPU能够提供高达67TOPS的AI算力。
NPU方面,Lunar Lake处理器性能达到了48TOPS的AI性能,与上一代产品的增长了四倍以上。根据英特尔提供的数据显示,在异构计算下,NPU加上CPU提供的5TOPS算力,以及GPU提供的67TOPS算力,Lunar Lake处理器整体能够提供高达 120TOPS 的算力。
除此之外,为了提高数据传输速度,提升响应时间,Lunar Lake处理器首次将内存芯片直接焊在CPU芯片中,并提供有16GB和32GB(双通道)LPDDR5X两种配置,单芯片运行速度高达8533MT/s。与传统的PCB嵌入式设计相比,PHY功耗降低了40%,面积节省了250平方毫米。
官方数据显示,Lunar Lake处理器计划将于今年秋季正式出货。
二)AMD 锐龙AI 300系列处理器
AMD全新一代处理器命名为“锐龙AI 300系列”,代号为“Strix Point”,同样采用了CPU+GPU+NPU的组合方式。不过,CPU采用了全新的Zen5架构,GPU采用升级版的RDNA3.5架构,NPU采用全新的XDNA2架构,AMD官方号称“面向下代AI PC/Copilot+ PC的世界一流处理器”。制造工艺方面,仍旧采用比较成熟的4纳米工艺制程。
与英特尔有所不同的地方在于,AMD已经公布了即将首发的产品型号,目前只有锐龙AI 9 HX 370和锐龙AI 9 365两款产品,均定位于高端。
作为旗舰产品,锐龙AI 9 HX 370的CPU部分拥有12核心24线程,每个核心拥有1M的二级缓存1MB,总容量达到12MB,三级缓存也增加到了24MB。主频方面,锐龙AI 9 HX 370的基准频率为2.0GHz,最高主频5.1GHz。
GPU部分,AMD对架构进行了全新升级,命名为“Radeon 890M”,CU单元数量从12个增至16个,主频为2.9GHz。
NPU部分,锐龙AI 9 HX 370拥有50TOPS的算力,目前来看仍旧是当前性能最强的NPU。
作为高端产品,锐龙AI 9 365采用了10核心20线程的设计,二级缓存10MB,三级缓存仍为24MB,基准频率2.0GHz,最高频率达5.0GHz。
与旗舰产品锐龙AI 9 HX 370相比,GPU部分进行了一定程度的精简,改名为Radeon 880M,CU单元降低为12个,但主频仍旧是频率2.9GHz。
不过,锐龙AI 9 365的NPU算力与旗舰产品完全相同,仍旧提供50TOPS的算力。AMD公布了NPU带来的算力提升。据称,与上代产品相比,XDNA2 NPU的计算能力提升了多达5倍,多任务并行能力翻了一番,能效也提升了最多2倍。5倍的性能提升来自Llama 2 70亿参数大模型的响应速度,从启动到获得第一个token,锐龙AI 9 HX 370达到了上一代锐龙98940HS的5倍之多。
我们从AMD官网公布信息看到,锐龙AI 300系列处理器支持操作系统包括 Windows 11 - 64-Bit Edition、RHEL x86 64-Bit和Ubuntu x86 64-Bit,没有将Windows 10列入其中,可以看出新的处理器已经不再支持Windows 10。
据了解,两款AMD锐龙AI 300处理器将于今年7月正式上市。
写在最后:
AI PC对算力提出了更高的要求,CPU+GPU+NPU的组合已经成为提高AI PC算力的最佳方式。从英特尔和AMD公布的最新处理器来看,在算力上较前一代产品有了巨大的提升。英特尔更是将Lunar Lake处理器的整体算力提升到120TOPS。虽然AMD没有公布整体算力数据,但从NPU能够提供50TOPS算力水平来看(英特尔Lunar Lake处理器的NPU算力为48TOPS),整体性能并不比英特尔差。当然,至于终端用户选择英特尔还是AMD的终端产品,处理器的性能仅仅是一个方面,这里不作具体探讨。
可以预见,有了性能更强的处理器之后, AI PC的性能也将会得到大幅度提升,各大模型厂商也将能够基于AI PC算力开发出更多的应用。