6月21日,美国财政部网站上公布了对华新的技术制裁方案文本。大意是限制对华半导体、AI、量子技术的投资和技术支持,该方案将在8月份开始执行,基本上是去年总统令的具象化措施。
随后,OpenAI公司也非常应景地宣布,将于7月9日起阻止“非支持国家”使用API接口,这意味着中国用户必须通过其他国家的服务器访问这些API接口。
消息一出,官媒不置一词,自媒体们有两种看法:一种认为对汽车企业搭建大模型没什么影响;另一种认为GPT服务关闭,意味着中国的AI大模型将被美国越落越远。顺便说一句,大模型就是一段计算机程序,构建了虚拟神经网络。刺激它就会有反应,和中学做的青蛙反射试验差不多。
果然社媒上只有极端看法才能吸引眼球。如果无影响是“零分”,对中国大模型的应用毁天灭地、彻底玩不转了,算100分。那么此事短期影响力是-10分,长期影响力可能在20分左右。
短期利好
先要澄清,OpenAI官方从未正式向中国用户提供服务。那么大家是如何通过API访问GPT的呢?C端用户通过“科学上网”,而任何正经的B端用户都不会公然使用GPT。注意,我们强调的是“用户”,而非GPT套壳服务商。
车企这种B端需求,做大模型应用,要么从基础层开始自己搭建;要么在服务商的平台上搭建;第三种是直接接入某个大模型。
车企能不能搞大模型,当然能,只要掏出足够的钱(特斯拉掏了10亿美元,还是在自由采购算力卡的情况下),组建上千人的团队,就可以试一试。
国内也有6、7家车企(主要是新势力)声称搞了大模型,他们的大模型基本上都是和文心一言类似,就是语义大模型,用来做智舱的。用于智驾的大模型,有企业搞了,但参数只有几十亿,应该算“中模型”。根据ChatGPT的经验,参数多到千亿级,就会出现“涌现”。什么叫“涌现”,就是模型的智商突然提升,规控算法转移到“轻算力端”(即车端),用于一些难以事先预测的长尾场景中,决策效果更加合理了,整个过程无须人工干预。因此,不应该对中模型寄予太大期望。
OpenAI一封堵,国内很多大模型供应商马上就邀请企业进驻。大家抢着做中国的OpenAI。短期看,利好国内资本向这些基础供应商投资。客户们也不做他想。和当初芯片采购时一样的,原来不想用国产,觉得质量没保障,现在必须用国产,因为进口没保障。这就是为什么短期反而是利好。
车企没必要从头搭建
事实上,车企如果不想投资那么大,可以借助基础算力服务商,开发一套中间件。中间件也是程序的组合,用于实现数据、操作系统和应用以及人机界面交互。这样一来,车企无须自己积累基础算力,节约资金、简化了开发过程,不会影响系统的可扩展性和维护性。
车企的强项是什么?数据。而大模型就需要数据填喂,才能生成规划算法。如果不愿意做原始数据提供者,那么可以自己“淘洗”。淘洗过程和选矿差不多:预处理、标注、仿真,裁剪。将这些有效数据喂到大模型输入端,就可以指望输出算法,即训练。然后将算法转移到车端,即“端到端”。
特斯拉宣称,标注和训练,都不用实际路采了。有了初期的一些路采数据后(比如千万公里级别的有效数据),大模型自己就会改变参数,在算力中心重建场景,自己制造一些长尾场景,自我训练。
有利于算力供应商
大算力中心的内生逻辑都是一样的。核大国进行多次实际核试验,采集到足够数据之后,就可以用算力来虚拟核爆。这就是为什么合法核武国家,不再进行核爆之后,核武技术仍在进步。
这样一来,汽车产业对大模型的需求,就转化为对算力的需求,其他问题车企自己可以解决。OpenAI不对中企服务(其实也没服务过),美国公司也无法投资和技术交流,这些措施天然有利于拥有基础算力的公司,比如华为、阿里、腾讯、百度这些拥有“算力底座”的公司。谁的算力底座雄厚,谁就有望对更多的B端客户服务,谁就能拿到更多数据,做出更应用效果更好的“端到端”算法,进而在智驾比拼中领先。
在美国不断加严的制裁条款下,英伟达能卖的阉割版算力卡,性价比已经不行了。年初老黄还跑北京和上海一趟,但没什么用。无论政府部门,还是企业,都对英伟达的供应承诺不屑一顾。不管华为的算力卡比英伟达的差多少,大家还是排队买华为的昇腾。
美国的禁令直接给华为带来400多亿元的订单,不要还不行,本来这些生意都是英伟达的。要论扶持华为的力度,美国财政部显然暂时落后于美国商务部。因为前者卡的是投资、智力和软件,后者卡的是硬件。华为现在也因此成了中国高制程芯片、基础算力硬件的唯一供应商。
长期比拼
参数和算法,中美两国都有大量的IT工程师。硬件和系统,美国领先;汽车领域的数据和应用,中国领先。毕竟,中国的路况复杂程度,是美国的10倍。长尾场景的生成量,也不是一个级别。
大家都发现,硬件替代相对容易,性能稍逊现在也认了,总好过花钱拿不到东西。美国先发现的大模型特性,建立起一整套系统,总结出一套方法论。但文生图片、文生视频,做来做去,都在文化消费上打转转,对于提升生产力、提升产品价值,没有太多办法。
就说车企应用。美国的大模型供应商,连个车企用户都找不到,特斯拉算是一个,人家自己干。哪像中国,大模型供应商能找到好几个车企用户。尽管有些用户拉大旗作虎皮,声称自己做的大模型,这也没关系,服务商可以闷声发大财。
有了客户,有了应用牵引,才能完成商业循环,这是市场真理。技术差距是可以通过投资和时间来弥补的,但市场和客户不能无中生有。
光伏是美国人发明的,最早的技术应用也是美国人做出来的。现在中国的光伏生产商吊打全世界。大模型会不会这么极端,大概率不会,但10年后中美谁领先,真不好说。大模型系统搭建出来之后,要有海量数据填喂,系统才能做出好的算法。
系统都有了,谁能进行更有效的训练?现在强调美国的算力更强、参数设置更合理,似乎逻辑有点问题。
另外,持续投入也是一个长期比拼。OpenAI万亿级参数的GPT4,大概用了英伟达两万多块A100算力卡,进行100天连续训练,算力利用率只有1/3。跑这一次,费用大概是6000万美元(大部分付了电费,固投不算)。这个过程中,模型参数要确保快速收敛(提升训练效率)
这就意味着,模型搭建起来之后,数据调度、提升算力利用率、优化模型是长期的烧钱过程。一旦实现“端到端”的自动化,人工需求就降下去了,系统就可以自己迭代优化了。
在AI领域,知识的扩散速度超乎我们想象,不存在容易遏制的“初期阶段”。在软件问题上,美国卡中国脖子更困难一些,毕竟不能直接往中国人脑袋里灌水。现在AI领域,只有中美在全方位竞争,其他国家大体上只能瞪着眼看,也包括智驾。
而对于汽车高阶智驾的应用,全世界都处于很早期的摸索阶段。有人认为可以通过大算力大参数大数据的结合,以自回归方式走向通用AI,通用AI自会替代人类解决一切问题(前提是人类自己也可以解决的问题),高阶智驾自会迎刃而解;另一种看法认为,车企需要再专用模型上不断投资,自己找到通往高阶智驾的大模型自训练、自强化的路径。
不管哪一种,长期投资、集中智力资源、在所有可能路径上试错,不断用商业循环强化投资效能,为王者道。总之,六边形战士才有望在“漫长的战斗”打赢。“一招鲜”在这个领域内是不存在的。这也是对美国软件长期制裁效果被看空的原因。
转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/810460.html