Key Points
3月的GTC大会彰显了英伟达的技术和业务扩张野心,6月COMPUTEX上的卖力推销,显示了黄仁勋在努力证明公司市值的增长神话并非泡沫;
按照每一枚H100售价4万美元计算,英伟达过去4个季度销售的H100数量约为164.5万枚。这个数字大约只相当于整体模型训练市场的1/4;
推理是个比训练高几个数量级的市场,然而这些市场中的不少份额还不属于英伟达,尤其是在端侧;
英伟达从未能将厚重的GPU塞进轻薄的笔记本中,但6月2日,它推出了面向AI PC市场的GeForce RTX芯片。
站在中国台北国际电脑展(COMPUTEX)舞台上的黄仁勋像个超级销售员。
他一会儿跑下台,把一块名为「Blackwell」的芯片搬到舞台上,介绍它如何通过NVLink交换器把两个裸晶(Die)连接在一起创造更大算力,说它是「世界上有史以来最复杂、性能最高的芯片」,能够支持兆级参数规模的生成式AI;一会儿,他又跑到舞台左边,站在一个货柜一样的东西旁,开始推荐一个叫「DGX Blackwell」的设备,它的算力更加庞大,甚至可以满足一家AI公司的需求,因为它通过NVSwitch连接了72个Blackwell芯片;之后,他来到舞台右边,那里已经为他准备好一个长方形铁架,他费劲地把它扛到舞台中央,宣布它就是那个能连接一切的「脊柱」,其中有5000条连接线,加起来有两英里长。他声称,如果把多台「DGX Blackwell」再连接起来,就能构成一个庞大的数据中心——黄仁勋称之为「AI工厂」。
黄仁勋展示AI芯片的「脊柱」。
黄仁勋6月2日的这场演讲长达两个小时,其中大部分内容都是在今年3月的英伟达GTC(GPU Technology Conference)大会上所讲一切的翻版,那场大会同样长达两个小时。当分析师还为英伟达的边界到底在哪而想破脑筋时——要知道这家公司的市值在过去一年已经疯涨了快2万亿美元——CEO黄仁勋用发布会告诉所有人:他全都要。
除了一再强调其数字孪生服务Omniverse在AI工厂中的价值,黄仁勋又一次介绍了Blackwell系列芯片、可以让开发者基于英伟达芯片开发和部署生成式AI助手的NIM(NVIDIA Inference Microservice)服务、专为「物理AI」(即机器人)开发的芯片Jetson Thor,以及可以充当机器人大脑的基础模型Project GR00T,它们使得英伟达的业务范围从数据中心、游戏和自动驾驶,横向扩展到了人形机器人这一新终端,还自下而上地从芯片层向上伸展到了云计算、大模型和应用服务等软件领域。
Blackwell是英伟达目前最新款的AI芯片,它以数学家、博弈论家、概率论家David Blackwell的名字命名,推理能力(即预测出下一个token的速度)号称是上一代Hopper芯片的30倍,能够更高效地训练像GPT-4那样的万亿级参数模型。黄仁勋不断举的一个例子就是:「训练一个1.8万亿参数的GPT模型,如果用Hopper做,可能需要8000个芯片,但如果你用Blackwell,只需要2000个就够了。」
不过,6月2日的这场演讲仍然有一些东西是全新的:其一,Blackwell已经是黄仁勋口中「世界上有史以来最强大的芯片」,但更强大的芯片发布已经排上了日程,两年后,即2026年,英伟达将发布下一代芯片Rubin。这个名字来自美国天文学家Vera Rubin,延续了英伟达以科学家命名芯片的传统。而在此之前,2025年,英伟达会推出Blackwell的加强版Blackwell Ultra,Rubin的加强版Rubin Ultra则计划在2027年发布。其二,便是AI PC。
黄仁勋与众多机器人站在一起。
如果说3月的GTC大会彰显了英伟达的技术和业务扩张野心,那么6月COMPUTEX上的卖力推销显示了黄仁勋在努力证明公司市值的增长神话并非泡沫。
从训练到推理,还有巨大算力未被满足
5月的最后一周,英伟达的股价再度飙升,总市值达到2.82万亿美元,成为全球市值排名第三的上市公司,仅次于微软(3.19万亿美元)和苹果(2.92万亿美元)。市值从1万亿增长到2万亿,英伟达仅用了9个月时,而从2万亿增至2.8万亿它用了不到3个月,照这种速度,其市值突破3万亿美元——超过苹果,只需要再增长7%就可以了。
这家市值坐着火箭飞升的公司在兑现利润方面也有火箭般的速度,但它能在规模上吃掉多少由生产式AI创造的市场还是个未知数。
我们对这个问题做了以下的简单计算:
首先在全球模型数量上,我们以GPT-3.5、GPT-4、即将推出的GPT-5、Midjourney和Sora作为行业内大语言模型、文生图模型、文生视频模型的标杆,并假设最终市场上会训练出100个GPT-3.5级别、50个GPT-4级别、10个GPT-5级别的大语言模型,和10个Midjourney级别的图像生成模型,以及20个Sora级别的视频生成模型。
按照「所需H100数量=(训练阶段每token浮点运算次数×训练数据集token数×模型参数量)÷(训练时间×H100峰值算力×H100利用率)」的公式粗略计算,要训练完上述规模和数量的大模型,全球需要消耗大约630万枚H100芯片。
而推理环节需要消耗的算力更高,弹性也更大——这种弹性主要来自于视频的生成,因为每生成一次视频产生的token量几乎是生成一次文字的token量的1000倍。以Sora为例,假如每人每月仅生成一条视频,同时假设市场上最终只有20个相似模型提供服务,并且市场上共有2亿用户在使用这种服务,那么市场需要的H100数量约为320万枚;但如果视频生成技术成熟以及普及到有数十亿人使用,并且每个用户每天都会用它生成视频,甚至不止生成一条,那相应的算力消耗会增加至少两个数量级。
保守地按照每人每月仅生成一条视频来算的话,全球在大模型推理方面的算力需求相当于1040万枚H100芯片,是模型训练的两倍。而如果视频生成技术和市场更成熟,推理需求的算力消耗会飙升到训练需求的数十倍甚至百倍。
根据市场跟踪公司Omdia的统计数据,截至2023年年底,英伟达H100的总出货量达到了120万枚。在截至2024年4月28日的4个季度里,英伟达通过数据中心业务(即AI芯片销售)获得的收入达到658亿美元。按照每一枚H100售价4万美元计算,英伟达过去4个季度销售的H100数量约为164.5万枚。这个数字大约只相当于整体模型训练市场(即假设全球训练出了100个GPT-3.5级别、50个GPT-4级别、10个GPT-5级别的大语言模型,和10个Midjourney级别的图像生成模型,以及20个Sora级别的视频生成模型)的1/4。这还仅仅只是模型训练的市场需求,推理是更大数量级、且尚未真正开启的市场。
然而这些市场中的不少份额还不属于英伟达,尤其是在端侧
如果按训练和推理来划分,英伟达也许可以相对稳定地吃掉大模型训练的市场,不过别忘记,像视频生成这样的推理市场占比更大——它与文字生成存在数量级上的算力差异。而视频生成如果要像短视频那样普及,就得能够进入个人电脑、智能手机等个人终端,而不能远远躲在云端。
英伟达已经在规划推出更多适用于端侧的芯片。3月GTC大会上发布的Jetson Thor机器人芯片可以视作这一战略的行动之一,按黄仁勋的说法,「未来一切运动的东西都将是机器人式的」。没有人怀疑人形机器人作为一种新型终端的增长前景,不过眼下最成熟的两个终端——个人电脑和智能手机,才是各大芯片厂商的竞争重点。
个人电脑和智能手机中的芯片霸主是英特尔和高通,过去,英伟达仅在对画面和算力要求更高的游戏电脑市场占据一席之地,而从未能将厚重的GPU塞进轻薄的笔记本中,更别说体积更小的智能手机。
6月2日的COMPUTEX舞台上,黄仁勋展示了他对进入个人电脑领域的兴趣,推出面向AI PC市场的GeForce RTX芯片,并预告华硕和微星电脑将推出基于RTX芯片的AI PC,配备微软不久前才上线的Copilot Plus功能。AI PC是一个规模在1亿台左右的大市场,相应的AI功能可能引发市场换机潮。
在一篇博文中,NVIDIA表示,「这些Windows 11 AI PC在可用时将获得Copilot+PC体验的免费更新。这表明微软可能还没准备好在AMD芯片上推出Recall和其他AI驱动的Windows功能,或者说6月18日推出的搭载Arm高通处理器的Windows硬件可能会有一段时间的独占期。」暗示在AI PC市场,Arm虽然会拥有先机,英伟达也不算落后,而首批搭载AMD处理器的Copilot Plus PC可能不会在发布时获得微软的人工智能功能。
一个会让它更舒适的新增市场是私有云
英伟达对云计算市场的争夺已经是公开的秘密。早在去年3月,英伟达就推出了一个名为「DGX Cloud」的云计算服务,其中搭载一度奇货可居的英伟达Hopper系列芯片(H100等)。英伟达称,这是一个价值3000亿美元的机会,不过要获得这个机会它需要与微软、Google、亚马逊等巨头的云计算服务直接竞争。
相较于「DGX Cloud」这样的公有云市场,英伟达还指出了一个叫「AI工厂」的增量市场,它更像是一种私有云,目标客户是富士康那样的高端制造业。3月的GTC大会和6月2日的COMPUTEX演讲中,黄仁勋一再举的例子是,对于富士康这样生产工艺复杂的公司,英伟达的数字孪生服务Omniverse可以快速帮助工厂建立相应的数字版,这些3D建模出来的数字工厂不仅记录了生产流程各个环节产生的数据,还能基于AI更好地理解这些数据、形成更好的算法。黄仁勋称,「在未来,每个公司、每个行业都会有AI工厂」。
去年10月,英伟达就与富士康签订了合建「AI工厂」的协议,6月2日的COMPUTEX演讲显示,更多制造业公司比如西门子等正准备加入其中。这些制造业公司过去10年来的重要业务之一,就是自建并向第三方客户输出「数字工厂」「无人工厂」之类的「智能制造」解决方案。借助「AI工厂」,英伟达也加入了这一链条,在这一市场,模型训练与推理的分野也没有端侧那么巨大,换句话说,这或许是个英伟达更擅长的市场。
当然,一切的前提都是GPT-5和Sora等模型能够取得如业界预想的成功。