如今的国内互联网圈,几乎到离开AI就不会做产品的地步。不过AI需要算力的支持,而算力则来源于英伟达H100/H20、华为昇腾910、 AMD MI210/M300等“算力卡”。作为AI时代的基石,为了更好地打造AI大模型,国内互联网厂商对于购买算力卡几乎就有了永无止境的诉求。
在国产算力卡产能不足、英伟达的高性能算力卡受到出口限制的情况下,偏偏一众国内大厂为了持续迭代自己的大模型,对于算力几乎就如同饕餮一般贪婪。这样一来,在算力供需失衡时,就有人开始炒作国内公司正大手笔购买英伟达专供中国市场的H20,并称这款性能只有H100五分之一的芯片在国内市场大卖。
那么问题就来了,国内厂商真的是在挥舞着钞票购买性能大幅度缩水的H20吗?截止本文发稿前,尚无明确证据表明H20的订单迎来了爆发式增长。而热炒英伟达H20大卖,则是从摩根士丹利的一篇报告中引申而来,在相关报告中摩根士丹利方面表示,英伟达特供中国市场的人工智能算力芯片H20,已经开始吸引包括百度、阿里巴巴、腾讯和字节跳动在内中国科技巨头的采购兴趣。
“采购兴趣”这个词本身就很暧昧,而摩根士丹利之所以会用如此模棱两可的表述,是因为它们的这份报告也是在半导体咨询公司SemiAnalysis相关报告的基础上得来。SemiAnalysis在这份付费报告中预测,英伟达方面今年有望交付超过100万颗H20芯片。毫无疑问这个数字十分惊人,与此前传言中的“客户正在观望”,以及“英伟达计划下调H20价格”的消息更是截然相反。
那么问题就来了,即便是最理想的情况,英伟达能在今年向客户交付100万颗H20芯片吗?开宗明义,这一预测大概率是过于高估市场需求了。众所周知,H20作为H100的阉割版,英伟达在美国出口管制政策下为中国市场定制的产品,其最高的理论性能可达296TFlops(每秒浮点运算次数),显存容量增大至96GB、带宽为4.0Tb/s,性能密度只有2.9。
反观英伟达目前在售的H100,它的算力则达到了1979TFlops,性能密度更是高达19.4。目前,H20的售价大约在1.1万-1.3万美元之间,而H100的价格综合马斯克等人的说法,单颗芯片的价格在3万美元左右。如果再算上水电成本,相比于H100,H20的性价比几乎是低到不忍直视。显而易见,能买到H100的欧美企业肯定不会去买H20,后者的目标受众几乎只有国内厂商。
但问题是如果英伟达真的能卖给国内厂商100万颗H20,就意味着我国算力中心总体在用机架规模会在2024年增长125%以上。据中国信通院的统计数据显示,截至2023年,全国在用算力中心机架总规模超过810万标准机架,算力总规模达230EFlops。作为算力单位,1EFlops=100万TFlops,100万颗H20的算力就是296EFlops。即使是在对AI大模型更狂热的2023年,国内算力中心总体在用机架规模也仅仅只增长了20%。
在互联网行业的寒冬中逆周期扩张并不是不行,但指望大厂能推动算力市场规模翻一番恐怕是不太现实的。更何况H20这张算力卡本身就属于老黄刀法精湛的代表,其最关键的问题是性能密度相比H100有着断崖式的下降,从而导致使用成本大幅度上涨,训练大模型效率更是非常糟糕。实际上,拥有大容量显存带宽、低性能密度、NVLINK的H20更适用于推理,而不是用于大模型的训练。
要知道,在去年美国出台算力出口限制之前,国内互联网厂商已经采购了大量的英伟达H100、A100、A800等算力卡,腾讯、阿里、百度、字节跳动等大厂,乃至其他中小厂商手中都有多个千卡算力集群,这也是“百模大战”能够迅速开打的原因。H100/A100的存量算力以及开足马力生产的华为昇腾910系列,也让H20作为算力卡使用时并不具备太多市场竞争力。
更为致命的是,经过了去年百模大战的洗礼,2024年几乎所有AI赛道的参与者都在迭代大模型这件事较为保守,暂时还看不到有哪家对其有迫切的需求。在这种情况下,相关厂商更不太可能顶着超低的性价比去大批量购买H20。考虑到头部厂商已经上线了文心一言、混元助手等面向消费端的AI产品,线上推理需求也十分巨大,因此H20看起来似乎可以用于推理用途。
可英伟达特供国内的算力卡不仅仅有H20,还有定位更低的PCIe L20和PCIe L2。如果用于推理,价格更便宜的L20、L2就已经能解决问题了。尽管比上不足、比下有余是H20的一大特征,但是在企业级市场恰恰就不存在什么所谓的“甜点卡”。
关于H20在国内市场大卖这件事是伪命题,其实还有一个侧面的证明途径,那就是通过闲鱼这样的二手交易平台。目前,闲鱼上一台英伟达H20 SXM整机的价格并没有出现大幅上涨的情况,反而稳定在100万-120万人民币区间横盘。所以无论是从何种角度来看,H20今年想要在国内大卖100万颗,似乎都不具备太多现实基础。
似乎只有一种可能会导致性能阉割、性价比低的H20在国内大卖,那就是OpenAI不仅提前到2024年发布GPT-5,而且GPT-5还达到了OpenAI创建的AI分级系统的第三级,即能够代表用户采取行动的人工智能代理的水平。就像ChatGPT让国内厂商大量购买A100、H100,更新更进步的GPT-5也能担此大任。可问题就来了,GPT-5真的有这个能力吗?
转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/903215.html