作者 |德新
以端到端为代表的新一代技术栈,可能会对智驾的迭代进程带来革命性的冲击。
自动驾驶中的「端到端」是指系统或者模型,直接从输入数据到输出结果提供完整的解决方案,而不需要传统分模块地处理,这样的结构使得自动驾驶系统更加简洁,模块间信息传递损失少,迭代更加高效。
端到端对「数据+算力+算法」这一黄金三角的要求大幅提高,决定了新一代的智驾技术是高门槛的。智驾的开发模式也将发生很大的变化,大部分开发工作将从现阶段车端为主,转移到以云端的开发为主。围绕云端的数据回传/数据处理、仿真验证、模型训练成为开发的关键。
端到端的技术迭代逻辑和资源需求,决定了头部公司与腰部公司的差距将加速拉大。马斯克甚至在最近提出,今年在云端训练和AI方面,投入达不到相当水平(100亿美金级)的公司,将无法竞争。
特斯拉是全球市场最早量产端到端的车企。而作为全球智驾应用最活跃的市场,中国的头部车企和供应商也在以惊人的速度布局端到端技术的量产。
从2023年UniAD(Unified Autonomous Driving)的论文正式提出端到端的构想,到2024年华为、小鹏、长城、极越等车企公布端到端技术栈的量产计划,这一技术趋势的落地推进速度远超人们最初的想象。
目前,即使在大模型已经取得突破性进展的自然语言处理领域,「大数据+大算力」驱动的算法增长曲线,依然非常陡峭。一些行业人士判断,在自动驾驶领域,端到端的大模型将带来更加突出的算法能力跃升。
在这代技术栈上,车企在「数据+算力+算法」的黄金三角上,要么成为像特斯拉一样全面强悍的六边形战士,要么需要找到强有力的搭档,组建搭建黄金三角的精英联盟。
如何建立高效的算力基础设施,如何通过大规模仿真加速技术验证过程,如何有效利用数据加速模型训练,成为新时期行业关注的技术焦点。
一、端到端,本届车展最大技术潮
4月28日,北京车展专业观众日的最后一天,特斯拉CEO马斯克的私人飞机飞抵首都机场。当晚新闻联播旋即公告:李强会见马斯克。
特斯拉实际上并没有作为参展方参与本届的北京车展,但马斯克的来访可能会创造本届最重要的一条技术新闻:特斯拉FSD入华渐近。
3月份,特斯拉向北美用户推送了FSD V12.3.1版,并且将FSD Beta版的名称改成了FSD Supervised。
相比于FSD V11,V12最大的变化就是将感知、规划、控制多合一成为端到端的网络。随着FSD向公众推送,其在北美各个城市惊艳的表现,也使整个产业界甚至发烧友的车主群体,对端到端的技术产生了浓厚的兴趣。
在本届车展上,多家车企/技术公司也公布了针对端到端的最新进展:
4月24日,华为车BU发布全新品牌乾崑。其中其智驾产品线,也就是过往大家熟悉的ADS发布新版本 ADS 3.0。ADS 3.0将架构进行了升级,感知变成一张GOD网络,决策与规划二合一成为PDP网络。ADS 3.0预计将在2025年下半年量产。
长城在这届北京车展上发布了魏牌蓝山智驾版,蓝山智驾版搭载了SEE一体化智驾大模型,这个大模型也是蓝山智驾版能实现无图全国都能开的重要基础。
小鹏在本届车展上主要宣布了软件系统的升级,从MPV车型X9开始,其智驾方案将升级为端到端大模型的架构,小鹏计划在下个月的AI Day上公布更多的细节。
NVIDIA官宣多家公司的合作,则披露了业界更多关于端到端的动向。
到目前为止,极氪、理想、小鹏、比亚迪以及极越已确定将采用NVIDIA DRIVE Thor平台,相比于上一代OrinX的计算平台,Thor最高有8倍的算力提升,达到近2000T。
Thor将支持包括端到端在内的大模型的部署,Thor的首批车型量产时间预计在2025年。
头部车企吹响端到端的号角,信号已十分明确。
二、车企军备赛:智驾差距急剧扩大
马斯克来华推动FSD落地,当晚他还发了一条推特揭示了FSD扩张背后的重要举措:特斯拉今年将在综合训练和推理人工智能方面投入约100亿美元,后者主要用于汽车。
马斯克还认为,「任何公司如果不能达到这一水平的支出,且不能高效地进行支出,就无法竞争。」
马斯克所指的竞争主要是指AI的竞赛。ChatGPT等大语言模型的案例,已经充分证明了大模型「大力出奇迹」的特点,即当训练的算力与数据突破一定规模时,通用大模型性能将有显著的提升。
首先,在算力规模上,各大厂商就会拉开非常直观的差距:
特斯拉很早就拥有整个行业最强的AI算力储备。一家顶级算力公司的高层近期透露,特斯拉作为美国算力储备排名第一的车企,其当前AI算力规模是第二名的4倍以上。
除了对外采购算力,特斯拉同时也在推进自研Dojo。2023年7月特斯拉成功部署了其第一个ExaPods,算力规模1.1 EFlops,特斯拉计划到2025年10月部署总规模100 EFlops的算力。
在国内,「N卡难求」的紧张局面已经持续了相当长一段时间。如何找到持续、稳定、可扩展的算力供给,让华为云这样的玩家在很短的时间内成为汽车厂商们关注的焦点对象。
在过去几年内,华为云凭借可持续拓展的AI算力,在汽车行业攻城略地。据说排名前30的车企中,有90%都选了华为云。
我们从ADS的云端算力,也可以一窥华为云算力的高速增长:2023年底,华为车BU公布ADS的云端算力规模为2.8 EFlops,华为预计到今年6月底,ADS的云端算力将达到3.5 EFlops,「规模超过行业第二名和第三名算力的总和」。
背靠华为云的算力支撑,ADS 3.0每天学习3000万公里的数据,每5天迭代一次。
特斯拉在美国拥有约300 - 400万辆车的用户车队,目前已经有十几EFlops的算力规模。最快的时候,FSD 8天内向用户推送了5个版本的更新。
算力和数据规模决定了未来自动驾驶系统的迭代能力。
端到端的技术架构,很大程度上会改变智驾系统的开发方式。NVIDIA汽车业务负责人新宙在本届车展前的小型媒体沟通会上表示:自动驾驶的开发方式会发生很大变化,大部分工作会集中到云端,仿真也会成为关键。
轻舟智航的CEO于骞在本届车展上,甚至提到:以模型为中心的开发方式,正在转变成以数据为中心的开发方式,以致于甚至在模型没有变化的情况下,仅仅通过数据规模、数据分布的提升就会大幅提高模型的表现。
在最强对手一路狂奔的情况下,所有希望布局在端到端上的车企,恐怕都需要思考:在端到端的技术趋势下,应该如何搭建更强大的「算力+数据+算法」的黄金三角。
三、黄金三角构建顶级端到端,从零再建几乎不可能
过去几年,不断有车企投身智驾的全栈自研。如今到了端到端大模型的智驾时代,车企要回答的问题更加棘手:
能不能买到足够多的算力?
有没有足够多的量产车辆采集到足够覆盖的全国性的数据?
如何从大量数据中获取珍贵的稀缺场景数据?
满足以上条件之后,智驾有没有合理的成本实现商业化?
最后回归到如何持续增加算力和数据的投入,实现技术商业持续向上的闭环。
如果无法回答这些问题,那这一切将止步于完成一个极其昂贵的大型demo。
无论从当前的算法能力进度、算力规模、数据量规模,特斯拉对于其他的公司尤其是传统车企,有不止一个数量级的压倒性优势。
有多名汽车行业高层以及接近特斯拉智驾研发的人士告诉我们,特斯拉的FSD研发团队规模要远远少于国内智驾第一梯队的公司。但特斯拉在过去多年时间里,在内部组建了一支与AI算法团队紧密合作的数据运营和数据工程团队,从而大幅提高数据筛选、标注以及训练的效果。
对端到端的开发流程,云服务商的价值会更加凸显,保障算力供给、提高数据处理能力、强化云端的仿真验证、加速模型训练并落地到车端发布,这些都是刚需。
以华为云为例,作为华为ADS背后的技术底座:
昇腾AI云服务是解决当前算力紧缺的少数选择。AI开发平台ModelArts,支持万卡大规模集群,支持单作业万卡、百PB级数据超大规模训练。
华为最高千亿级参数的盘古汽车大模型是支持算法开发与仿真验证的加速器。用盘古汽车大模型做自动驾驶数据处理、数据生成,可以做到万段CLIP分钟级理解,支持2D/2.5D/3D的自动标注。数据生成复杂场景,让自动驾驶系统学习新场景的周期从两周以上压缩到2天。
2024年,约有10多款车将搭载华为ADS,某种程度上ADS的应用规模也反向驱动华为云形成了更有强有力的对于端到端的支持。华为云可能是国内车企PK特斯拉的最佳选择之一。
即使不采用华为ADS的厂商,也可以从华为云的平台中,找到八爪鱼这样用于自动驾驶车辆研发、测试、部署全链路的工具。
此外,随着轻图方案的普及,自动驾驶数据安全性和合规性也是重要课题。华为云提供了「1+M+N」的基础设施布局,用汽车专区3分区的架构和7层防护建立全流程的合规解决方案。
如何缩小与头部车企的技术差距、加快开发流程,也是过去一年不少国内品牌选择拥抱华为技术体系的原因。
智能驾驶在国内经历了将近8年的发展之后,迎来了用户认知空前的繁荣阶段。长城、长安等多家车企的调研都显示,大约在2020年前后智驾在购车因素中的排名大约是第八位,到2023年末快速进入到第四位,是近年少数快速上升的车型产品属性。
在这次北京车展上,马斯克的来访也充分说明了特斯拉强烈推动FSD进入国内的意愿。来自供应链的消息显示,特斯拉正为FSD进入中国在数据、地图等多个领域展开紧锣密鼓的准备。
在不久前传闻特斯拉内部已经取消了代号Model Q的乘用车项目,同时宣布今年8月8日将发布全新的Robotaxi,全力押注高等级自动驾驶。
而随着端到端技术的到来,技术门槛大幅提高、技术迭代周期大幅缩短,这意味着对希望在智驾领域有所建树的车企,迈向端到端的决策和行动是紧迫的。