撰稿 | 言征
出品 | 51CTO技术栈(微信号:blog51cto)
两个月前,在巴塞罗那的一场圆桌会议中,AMD高管们向外界透露一项惊人的变革消息。
AMD正在进行一项重大改变:重心将从硬件开发转向强调软件开发、API 和 AI 体验。
AMD执行副总裁兼首席商务官Phil Guido和计算和图形业务组高级副总裁兼总经理Jack Huynh没有拐弯抹角:
“AMD将软件工程团队规模扩大了三倍,并且全力以赴投入软件开发。”
1.49亿美元收购,3倍扩张研发团队
此前8月,我们报道了AMD豪掷49亿美元收购服务器制造商ZT的新闻,原因也是AMD亟需ZT的1100多名软件工程人员来为其接下来的发展战略来服务。AMD彼时只有500名左右的开发人员。从这一变化我们也可以看出一些端倪,硬件公司AMD不止满足于设计硬件了。
这一场“软件团队大扩张”,意味着AMD即将迎来一场员工的角色变革。
这不仅意味着引入更多人,更意味着接下来的人员工作内容的变动:“我们将组织中的一些最优秀的人才调动到这些团队中来提供支持。”当这一转型完成后,该公司将更接近于同行,比如英伟达、英特尔。
具体如何转变?AMD领导层回应说,过去他们“首先是硅,然后才考虑软件开发工具包、工具链,最后是ISV(软件开发公司)。”
“我们战略上的转变是首先与ISV交谈……了解开发者希望实现什么功能。”这是创建新处理器方式的根本性变化。
“过去的AMD只会追求速度和性能。之后,AMD将首先关注AI软件,我们(已经)知道如何造硅。”
从这些谈话可以看出:AMD相信他们现在已经拥有了完整的计算硬件堆栈,从 CPU 到 AI 加速器,到 GPU,到 FPGA,再到数据处理,甚至服务器架构。目前在接下来的AI时代的“芯片角逐战”拼图中,AMD只剩下一块:软件(及生态)。
2.架构二合一计算芯片置于游戏芯片之上
9月10日,Jack Huynh再次给外界一个意外的宣布:AMD将自家已有5年历史的图形架构RDNA、计算架构CDNA重新整合在一起,推出名为“UDNA”的全新GPU架构。
早在2019年,AMD大刀一挥,历史悠久的GCN GPU架构宣告终结,从此分为两条路线:RDNA架构面向图形与视频,也就是我们熟知的Radeon游戏显卡,而CDNA架构则面向AI、HPC,也就是Instinct计算卡,迄今都已经发展了三代。
但今时不同往日,游戏、计算重新回到了二合一。
Huynh解释道:(当时)分为两种架构是为了更好地各自优化,包括架构优化、开发优化,但现在统一架构对于开发者来说更轻松,不再需要做选择,尤其是当AMD的数据中心业务越做越大之时。
这也是AMD也与开发者进行了充分的交流的结果,开发者表示非常欢迎统一架构,减少了复杂性。
此外,Huynh承认,RDNA架构发展过程中犯了一些错误,比如内存一致性、缓存子系统的不断改变,每次都需要重新优化,以后不会继续这样了。
当Huynh并没有提及另一个重要的原因:市场收入的表现。近期财务报告显示,AMD目前一半的销售额都来自数据中心产品。
在一场有关UDNA的采访中,Huynh透露,此番动作也是想追赶英伟达自家通用CUDA平台的成功。因此,AMD推出新的架构,也是必然。
技术路线的改变背后则是两支研发队伍的整合。“这是一个从云侧到端侧的统一策略,两支队伍将合二为一,更加高效,或许会有一些曲折,但相信这是正确的方向。”
也许会有人问:难道未来的Radeon显卡、Instinct计算卡都会使用同样的芯片?是否会存在功能性上的冗余和浪费?
比如计算卡并不需要图形与视频功能,游戏卡也不需要太多的计算功能。
这一点Huynh并没有给出明确的答案。但从他透露的规划——接下来不仅会有RDNA 5、RDNA 6、RDNA 7,也会有UDNA 6、UDNA 7,至少已经规划好了未来三代,RDNA和UDNA至少还会同时存在。
这也不难理解,因为AMD的产品需要稳定、持续的优化,并保持完全的前后兼容性。
但三代以后会怎样?小编猜测,未来极有可能只剩下UDNA了。因为未来的GPU显卡将成为图形、视频和计算的综合体,正如同AI的未来将是多模态一般。
“要确保AMD做正确的事。”
3.死战CUDA?AMD野心的胜算
AMD 唯一的前沿领域是软件,而对于AI领域而言,便是CUDA。
正如前文所述,AMD把以消费者为中心的 RDNA 和以数据中心为中心的 CDNA 架构统一到一个名为 UDNA 的微架构中,这一招醉翁之意直指气候大成的CUDA生态。
合并架构的影响很大,AMD通过降低高端游戏显卡的优先级,就可以达成两件目的——
一来,AMD对内可以集中力量共同攻坚AMD版的“CUDA”软件,二来,原来游戏显卡和计算显卡的开发者群体迎来大合并,这无疑可以加速其开发者市场份额的增长。
野心的獠牙已经亮出,那么背后的实力允许吗?
英伟达的CUDA 生态系统已经根深蒂固,但并非无懈可击。
首先,AMD只是没有将软件当成其主要产品,并非完全忽视了软件。AMD暗暗留了一手:开源。通过GPUOpen和ROCm等举措,AMD保持其大部分软件基础为开源,这对软件开发人员来说是极好的资源,开发者绝对支持开源。
AMD完全可以借鉴开源的商业打法进一步抢占市场,比如开发出一种能让人们购买其硬件并给开发者带来收入的产品。
AMD当然也意识到了这一点,并希望“在我们的CPU和RDNA之间创建一个统一的架构,这将使我们能够简化软件的开发”。这看起来与英特尔的OneAPI类似,很有意义,但也将是一个具有挑战性的项目。
英伟达则在这方面有着天然优势,因为这家公司只有一种加速器——运行CUDA的GPU,这是一个所有开发者都可以学习的单一API,使英伟达能够在价格从200美元到30,000美元的硬件上解决大量的计算挑战。
其次,AMD同样也有一个英伟达不具备的优势。AMD拥有丰富的计算解决方案知识产权组合,从经典的CPU和GPU,到XDNA FPGA芯片(通过收购赛灵思获得)。现在,AMD只需要将这些组合在一起,展示一个统一的计算接口,使得在这些核心品类之间战略性地转移工作负载变得容易,从而最大限度地提高性能、成本效益或两者兼顾。
这样的能力,将使AMD能够向客户销售由CPU、GPU和专用FPGA(们)等组件组成的单一产品组合加速器系统——就像你购买iPhone,而不是分别购买屏幕、处理器、5G调制解调器和电池并自行组合一样。
4.追上英伟达,AMD需要3到5年
AMD正在考虑一个三到五年的时间框架,建立自己的软件生态系统。
围绕这个目标,我们看到了AMD的一些动作。比如,AMD豪掷49亿美元,大幅增加了其软件工程师的人数。
再比如,AMD还更新了加速硬件开发的计划:“我们打算每12个月推出一款新的[Radeon] Instinct产品”,这是一项艰巨的任务,但有助于更快地应对软件市场及其需求的变化。在CPU方面,AMD“现在专门设置了两个CPU团队,一个负责n+1(下一代),另一个负责n+2(两代之后)”。
还有,今天将游戏GPU、计算GPU统一合并为一种架构UDNA,亦是其中的一环。
那么回到当下,AMD到底怎么想的?采访中记者问道:游戏领域,AMD拥有领先地位,难道不会追求旗舰市场吗?Jack Huynh相当坦率:现在的目标是以较低的价格点建立规模和市场份额,而不是“山丘之王”旗舰 GPU,以量取胜。
“我们现在的首要任务是为 AMD 建立规模。因为现在没有规模,我就无法找到开发人员。如果我告诉开发者,'我只想争取 10% 的市场份额',他们只会说,'Jack,我祝你一切顺利,但我们必须与 Nvidia 合作。所以,我必须向他们展示一个计划,说,'嘿,我们可以通过这个策略获得 40% 的市场份额。然后他们说,'我现在和你在一起了,Jack’。现在,我将在 AMD 上进行优化。一旦我们得到它,那么我们就可以追求Top。”
5.写在最后
对于昨天的芯片的巨头而言,角逐的焦点更多是光栅化、光线追踪和带宽的竞争,然而接下来,生成式AI的爆火已经打乱了原来的布局,下一代的挑战不止在于硬件,还在于软件支持,在于软件开发者生态是否足够紧密。
AMD甚至认为,CPU和GPU之间永恒的拉锯战在未来会发生变化:“我们不能将AI视为像USB那样的复选框/花哨功能——AI有可能成为主角。”
有人士曾这样评价AMD和英伟达:
AMD 是一家硬件公司,它生产软件以支持其硬件;而 NVIDIA 是一家软件公司,设计硬件以加速其软件。
不过,这种“刻板印象”即将改变。AMD正在蓄势转向自己的软件生态。诚如圆桌上AMD发言人所说——
过去的AMD只会追求速度和性能,新的AMD将首先关注AI软件。