撰文 / 涂彦平
设计 / 赵昊然
来源 / Arstechnica,by Timothy B. Lee
特斯拉粉丝以及CEO埃隆·马斯克(Elon Musk)本人对特斯拉全自动驾驶(FSD)软件的前景感到兴奋。
Tesla在3月发布了其软件的重大升级版本12.3。随后,在4月,马斯克宣布特斯拉将于8月8日推出一款专用robotaxi(自动驾驶出租车)。5月8日,马斯克宣布新版本的FSD 12.4将在未来几天内推出,“每次干预的里程数将提高5到10倍”。
但我认为期待特斯拉在不久的将来推出无人驾驶出租车服务的粉丝们将会感到失望。
在3月底去旧金山的一次旅行中,我有机会尝试了特斯拉和谷歌Waymo的最新自动驾驶技术。
在特斯拉Model X的45分钟试驾过程中,我不得不两次干预以纠正FSD软件的错误。相比之下,我乘坐无人驾驶Waymo车辆两个多小时,没有发现任何错误。
因此,虽然Tesla的FSD 12.3版本看起来比之前的FSD版本有了重大改进,但它仍然落后于Waymo的技术。
不过,Waymo令人印象深刻的表现也带有星号。虽然在我乘坐的过程中没有人在驾驶,但Waymo有远程操作员,他们有时会为车辆提供指导(Waymo拒绝告诉我在我乘坐的过程中远程操作员是否介入,或者介入的频率)。特斯拉的FSD适用于所有道路类型,而Waymo的出租车则避开高速公路。
许多特斯拉粉丝将这些限制视为Waymo走向技术死胡同的迹象。他们认为特斯拉的FSD能够在所有城市和所有道路类型上运行,是一种更通用的技术,很快就会超越Waymo。
但这从根本上误解了情况。
在公共道路上安全驾驶无人驾驶车辆非常困难。由于驾驶座上没有人,一个错误就可能致命,尤其是在高速公路上。因此,Waymo于2020年在它能找到的最简单的环境——凤凰城郊区的住宅区街道——推出了无人驾驶服务,并随着对其技术的信心增强而逐步提高难度。
相比之下,特斯拉还没有开始无人驾驶测试,因为它的软件还没有准备好。目前,不需要地域限制和远程协助,因为方向盘后面总是有人。但我预测,当特斯拉开始无人驾驶转型时,它将意识到安全需要Waymo式的渐进推广。
所以,特斯拉并没有找到一种不同的、更好的方式将无人驾驶技术推向市场。Waymo只是太超前了,它正在应对特斯拉甚至还没有开始考虑的挑战。
Waymo在下国际象棋,而特斯拉还在下跳棋。
特斯拉落后Waymo几年
目前围绕特斯拉FSD的兴奋让我想起了2018年围绕Waymo的炒作。那一年年初,Waymo宣布将从捷豹购买2万辆I-Pace轿车,从菲亚特克莱斯勒购买6.2万辆Pacifica小型货车。
但Waymo在2018年12月推出的服务却令人失望。在大多数乘车过程中,方向盘后面仍然有安全驾驶员,而且仅限于一群精挑细选的乘客使用。
直到2020年10月,Waymo才终于在凤凰城地区推出了完全无人驾驶的出租车服务,并向公众开放。即便在那之后,Waymo的扩张速度也很缓慢。
Waymo于2023年开始在旧金山提供商业服务,目前正在向洛杉矶和奥斯汀扩张。如今,该公司的商业车队只有几百辆车,远远少于6年前计划购买的8.2万辆车。
出了什么问题?在2018年8月的一篇文章中,记者Amir Efrati报道了Waymo技术的局限性。Efrati写道,“Waymo货车在凤凰城地区的许多无保护左转和并入繁忙交通时都会遇到困难。”此外,“汽车很难将成群结队的人或骑自行车的人分开,尤其是购物中心附近或停车场的人。”。
Efrati的报道让Waymo在2018年的技术听起来比FSD 12.3差,但也差不了多少。FSD有时仍然难以在繁忙的交通中并线,也难以绕过成群的行人。
Waymo的技术在2018年之后稳步提升。2020年底,Waymo在凤凰城地区推出完全无人驾驶服务后,我采访了Joel Johnson。他是一名大学生,曾搭乘过几十次Waymo,并在YouTube上发布了一些搭乘视频。
“他们确实解决了像无保护左转这样的问题。”约翰逊在一段视频中说道,“随着时间的推移,情况肯定有所改善。”
在10月份的一段视频中,一辆Waymo汽车正驶过一个挤满行人的Costco停车场。它耐心地等待着,直到行人让开,然后自信地向前行驶。
“2020年3月,如此多的行人会导致刹车失灵。”Johnson在一份屏幕注释中写道,“到2019年7月,它就会完全放弃。再也不会了!”
我在3月份尝试过的FSD版本显然还没有准备好进行无人驾驶操作。例如,我必须进行干预,以防止Model X撞上塑料车道分隔线,而这是Waymo在2020年都不会犯的错误。因此,虽然FSD 12.3似乎优于Waymo 2018年左右的技术,但它不如Waymo 2020年底的技术。
Waymo依赖远程操作员
2018年的Waymo自动驾驶小型货车,可以看到车里坐着安全驾驶员。
早年,Waymo的所有测试都是由安全驾驶员完成的。当软件出现错误时,驾驶员会进行干预以防止撞车,然后仔细记录下事故经过。工程师们利用这些险情数据来改进Waymo的软件。
自动驾驶软件越好,这种测试策略的成本就越高。如果自动驾驶软件每行驶50英里就会出错一次,那么安全驾驶员在一个工作日内可能就会经历数次错误。但如果软件每行驶5000英里就出错一次,那么安全驾驶员可能要花费数周的时间,才能收到一份错误报告。
如果Waymo继续使用安全驾驶员进行测试,直到其软件被证明比人类驾驶员更安全为止,那它的成本将高得令人望而却步。因此,Waymo开始部署由远程操作员支持的无人驾驶汽车。
Waymo对其无人驾驶车辆进行了编程,使其默认行为变得极为谨慎。如果Waymo无人驾驶汽车没有百分之百的把握可以安全行驶,它就会减速停下,并请求远程协助。我们希望,随着时间的推移,软件的平均可信度会越来越高,车辆需要远程协助的次数也会越来越少。
Waymo表示,远程操作员从不直接驾驶车辆。相反,操作员会回答问题并给出提示,引导车辆朝正确的方向行驶。以下是Waymo提供给我的两个例子:
在一段视频中,一辆Waymo被一辆逆向行驶的大卡车挡住了去路。远程操作员让Waymo驶入右侧车道,给卡车留出通过空间。
在另一段视频中,一辆Waymo正在接近一个有多辆消防车的十字路口。Waymo向远程操作员提出了两个问题——“紧急车辆是否堵住了所有指示车道”和“道路是否封闭?”,这有助于它自信地通过现场。
这种策略在高速公路上会变得棘手。如果无人驾驶车辆请求帮助但没有得到及时响应,则需要停下来等待。但这很难在时速70英里的高速公路上做到。
因此,尽管Waymo已经在高速公路上测试了十多年的技术(有安全驾驶员),但Waymo的无人驾驶出租车还没有使用高速公路。这让Waymo的服务变得不那么有用。
今年3月,我第一次乘坐Waymo从旧金山市中心前往Bayview社区的麦当劳。对Waymo来说,这是一次28分钟的地面街道行程。Uber或Lyft司机走101高速,大约15分钟就能到达。
Waymo正在努力解决这个问题。今年1月,该公司开始在凤凰城地区的高速公路上测试无人驾驶。如果测试进展顺利,Waymo可能会在未来几个月内为其商业车队提供高速公路驾驶服务。
根据Waymo公布的统计数据,至少从安全角度来看,Waymo的谨慎做法效果显著。在Waymo最初的700万英里无人驾驶里程中,其车辆发生造成伤害的车祸的频率仅为同类人类驾驶员的四分之一。
特斯拉有更好的方法吗?
许多特斯拉粉丝认为Waymo当前服务的局限性——避开高速公路、依赖远
程操作员以及限制在几个大都市地区——证明Waymo的技术存在根本缺陷。
在去年的一条推文中,一位特斯拉支持者认为Waymo和通用汽车旗下的Cruise已经“开发的技术极其狭窄、非常脆弱,无法扩展”。
马斯克回答道:“是的,对当地条件来说非常脆弱,而且无法扩展。”
2024年4月15日,美国德克萨斯州奥斯汀,特斯拉Model Y停放在特斯拉经销店的停车场上。
这一论点的关键部分与神经网络有关。Waymo在15年前作为谷歌自动驾驶汽车项目起步,那时还没有出现2010年代的深度学习革命。其最早版本的软件可能使用的是手工编码的规则,而不是机器学习。一些特斯拉的支持者似乎认为Waymo仍在使用同样的过时技术
事实上,Waymo现在广泛使用神经网络。
例如,在2020年的这篇文章中,Waymo介绍了如何将神经网络用于其感知系统——用于识别和跟踪附近物体的软件。在2024年2月的演讲中,一位Waymo工程师解释了该公司如何使用Transformer(谷歌发明的大型语言模型背后的架构)来预测其他车辆的行动。
因此,Waymo十年前的软件堆栈可能很脆弱,但该公司并没有停滞不前。
造成自动驾驶困难的一大因素是驾驶员在现实世界中可能遇到的“长尾”异常情况。湿水泥。绑在汽车上的自行车。卡车后面的一棵树。一个坐在轮椅上的女人在追赶一只鸭子。
开发自动驾驶技术的公司需要进行数百万英里的测试,以尽可能多地发现这些“边缘情况”。而这正是特斯拉比Waymo更有优势的地方。
正如我们所看到的,Waymo必须为每英里的监督测试向安全驾驶员支付费用。相比之下,特斯拉已经说服成千上万的客户免费测试其完全自动驾驶软件。事实上,客户为此支付了数千美元!
这样,特斯拉就能获得实际上无限的数据。从理论上讲,更多的数据应该能让特斯拉有效识别其自动驾驶软件需要处理的边缘情况。更多的数据还能让特斯拉训练出更好的神经网络。
虽然获取更多的数据肯定是有帮助的,但这并不是灵丹妙药。一个问题是,特斯拉收集的数据是没有标签的。Waymo的安全驾驶员会记录每次脱离,以帮助识别Waymo软件中的缺陷,但特斯拉用户不太可能这样做。
另一个问题是,有些边缘情况比其他情况更难处理。
第一响应者问题
让我们以与警察和消防员的互动为例。去年,Waymo和通用汽车的Cruise就在这个问题上纠结了很久。我曾在9月份写过相关文章。
根据旧金山消防局的记录,几辆Waymo或Cruise车辆堵塞了狭窄的道路,迫使消防车绕道前往火场。自动驾驶汽车被困在消防作业区域附近,迫使消防员在放置软管和梯子时必须在它们周围工作。几辆自动驾驶汽车停在消防站前,将消防车困在里面。
问题并不在于这些车辆撞上了消防车(特斯拉过去也遇到过这样的问题)。而是它们太谨慎了,以至于被卡住。这就是为什么在Waymo和Cruise开始无人驾驶运营后,这些事件才变得令人担忧;安全驾驶员本可以在几秒钟的不作为后进行干预。这也是为什么这还没有成为特斯拉的一个问题:每辆特斯拉的方向盘后面都有一个人,如果FSD卡住了,他可以接手。
大多数时候,驾驶需要遵循简单、确定的规则:保持在车道中央、避免撞到其他道路使用者、遵守红绿灯和停车标志等等。
但是,在火灾或车祸现场穿行则要棘手得多。紧急情况会完全扰乱交通流,迫使驾驶员随机应变,创造新的交通模式。驾驶员往往需要细致入微地了解其他人的意图,这样才能避免妨碍他人。如果警察或消防员正在指挥交通,驾驶员就需要了解他们的手势。
总之,在火灾或车祸现场进行导航有时需要推理技能,这远远超出了当今人工智能系统的能力范围。因此,对于特斯拉的FSD来说,紧急场景至少在未来几年内仍可能是一个“corner case(边角案例)”,就像Waymo的软件一样。
2024年3月11日洛杉矶市中心的Waymo自动驾驶出租车内部。
意识到这一点后,Waymo通过多种方式对其软件进行了后备处理。Waymo车辆如果不确定该怎么做,可以请求Waymo远程操作员的指导。急救人员可以靠进车内与远程操作员对话,也可以跳进车内亲自驾驶。城市管理者可以设置地理围栏,让Waymo车辆远离紧急事件现场。Waymo还为凤凰城、旧金山和其他地方的数千名急救人员提供了如何与其车辆互动的培训。
这些努力似乎已见成效。《旧金山纪事报》(the San Francisco Chronicle)在今年2月的一篇报道中称,自8月份以来,消防队员提交的有关车辆行为不当的报告有所减少。部分原因是Cruise于10月份停止了在旧金山的运营。但Waymo的报告数量似乎也在下降。
如果特斯拉推出支持完全无人驾驶的FSD更新,我估计我们就会开始看到跟去年关于Waymo和Cruise的报道相同的故事:特斯拉车辆碾压水管、阻挡救护车、无视警察指令、干扰消防员梯子放置等。
考虑到其车队的规模,特斯拉可能会面临来自急救人员的反击,其规模远大于Waymo和Cruise去年在旧金山面临的反击。正如Waymo和Cruise发现的那样,警察和消防员拥有很大的政治影响力。
如果特斯拉真的想提供无人驾驶出租车服务,它将需要Waymo近年来一直在建设的基础设施和支持服务。这包括在车辆被困时进行干预的远程操作员,以及与当地政府合作的人员。相反,特斯拉一直在朝着相反的方向发展。The Information上个月报道,特斯拉正在解散其公共政策团队。
服务,而不仅仅是软件产品
今天的FSD是一种软件产品,但robotaxi服务不仅仅是软件。这里有一个简单的例子:如果特斯拉robotaxi爆胎了怎么办?
如果你正在开车,车胎爆了,那是你自己的问题。如果你乘坐的出租车爆胎了,那是司机的问题。但如果没有司机,谁来换轮胎呢?
特斯拉的设想是,人们购买一辆特斯拉,然后通过特斯拉运营的打车网络将其出租。因此,从理论上讲,特斯拉可以说爆胎是车主的问题。但这在实践中行不通。车主可能在开会,甚至在度假。在特斯拉试图联系车主的时候,把车搁置在路边几个小时,甚至可能还有乘客在车内,这种做法是不可接受的。
因此,如果特斯拉想涉足出租车行业,它就需要一批移动技术人员来救援受困的特斯拉汽车。这些技术人员可以是特斯拉的员工,也可以是独立承包商,但在公司开始在特定地区提供服务之前,这些安排必须到位。当FSD软件不可避免地卡住时,这些人也可以被派去救援特斯拉。
这意味着,特斯拉很可能希望逐步推出无人驾驶版的FSD,一次只在一个城市推出。出于其他原因,这也是合理的。特斯拉将有时间向当地官员介绍自己,并为当地警察和消防部门提供培训。虽然远程操作员和客户服务人员不一定是本地人,但分阶段推出也会给特斯拉留出时间招聘这些岗位的人员。
我希望大家现在能明白,为什么我不认为Waymo目前的服务限制——地域限制和使用远程操作员——特别糟糕。每项出租车服务都有地域限制,Waymo有充分的理由一个城市一个城市地推出服务。
一个痛苦的教训
我和很多特斯拉的粉丝聊过,所以我很清楚他们会怎么说:我低估了特斯拉自动驾驶技术的进步速度,因为特斯拉会投入更多的数据和计算能力来解决这个问题。
一些特斯拉的支持者喜欢引用著名的理查德·萨顿(Rich Sutton)的文章《一个痛苦的教训》(“The Bitter Lesson”)。萨顿认为,人工智能研究人员历来花费太多时间,试图用手工编码的方式,让人类找到解决计算机国际象棋或图像识别等问题的最佳方法。最终,人们通过在大量数据上训练的通用学习算法获得了更好的结果。
萨顿是在2019年写下这篇文章的。从那时起,大型语言模型的成功以惊人的方式证明了萨顿的洞察力。早期的人工智能研究人员试图理解自然语言的特性,然后将他们的见解编码到人工智能系统中。这些系统运行得不太好。效果好得多的是采用简单的Transformer架构,并将其扩展到数千亿个参数,从而创建出像GPT-4这样的LLMs。
马斯克打赌,在自动驾驶方面,这种动力也将对特斯拉有利。他将FSD的第12版描述为使用“端到端神经网络”。他正投资数十亿美元购买硬件,利用从特斯拉客户那里收集的大量数据来训练这些神经网络。如果你相信萨顿的论点,你可能会期待特斯拉能跳到Waymo的前面。
但我认为人们对萨顿的论点解读过多。萨顿的观点是,经过大量数据训练的大型神经网络往往比手工编码的人工智能系统表现更好。但这并不意味着,向任何特定的神经网络投入更多的数据和计算能力,就能实现任意高水平的性能。
LLMs就是一个很好的例子。LLMs会产生幻觉。它们无法完成简单的任务,如计算物体和读取模拟时钟。LLMs非常适合精度并不重要的应用,或者由人工在生成输出后进行检查的应用。但如果你需要非常高的精度,它们就不是一个好的选择。
自动驾驶系统确实需要非常高的精度。而拥有足够数据和计算能力的端到端神经网络是否一定能达到这一要求,这一点并不明显。
商科教授伊森·莫里克(Ethan Mollick)写过一篇关于“锯齿状边界”(jagged frontier)的文章:复杂的人工智能系统往往在某些任务上表现出色,但在另一些任务上却出人意料地糟糕。特斯拉可能非常擅长在高速公路、十字路口和交通环岛中导航,但在避开潮湿的水泥地或理解警察的手势方面却进展甚微。
Waymo会遇到“Just Walk Out”问题吗?
Waymo解决这个问题的方法是建立一个大部分自动化的系统,能够在需要时优雅地依靠人工辅助。
虽然从安全的角度来看,这种方法效果不错,但我开始怀疑它的经济性。如果Waymo的车辆不断要求远程指导,Waymo可能需要雇佣大量的远程操作员,以至于抵消了不需要司机带来的成本节约。
今年4月,亚马逊宣布从亚马逊生鲜杂货店移除其名为“Just Walk Out”的免结账技术。
位于加利福尼亚州惠提尔的Amazon Go商店采用“Just Walk Out”技术。
与Waymo一样,亚马逊在2018年也看好自己的技术。那一年,彭博社报道称,亚马逊计划基于Just Walk Out技术开设3000家Amazon Go便利店。
但这从未发生过,The Information的Theo Wayt的报道有助于解释原因。Wayt去年报道称,亚马逊的技术——与Waymo的技术一样——并不是完全自动化的。亚马逊在印度有1000多名工人手动验证客户的选择。Wayt说,在2022年中期,“Just Walk Out”每1000笔销售需要大约700个人工审核。
亚马逊的目标是将这一数字降低到每1000件商品20到50次人工审核,但该公司“屡屡未能实现”这一绩效目标。
Waymo会有类似的问题吗?我不知道。毫不奇怪的是,Waymo拒绝就远程干预的频率发表评论。
我最乐观的猜测是,这对Waymo来说不会是个严重的问题。在我3月份的乘坐过程中,Waymo的车辆行驶平稳,信心十足。如果它们一直在寻求远程指导,我估计会出现更多的犹豫和不稳定驾驶。
最后,Waymo的扩张似乎也相当迅速。5月早些时候,该公司宣布其每周服务量已从9个月前的每周1万次增至5万次。除非管理层有信心实现盈利,否则Waymo似乎不太可能发展得这么快。
无论如何,我不认为特斯拉发现了解决这个问题的更好方法。大型、复杂的神经网络往往擅长某些事情,但在其他方面却不尽如人意。然而,控制两吨重汽车的人工智能系统必须始终非常可靠。至少在未来几年内,只有在人类的支持下才能做到这一点。(原本作者Timothy B. Lee是报道科技政策和未来交通的资深记者,曾在Arstechnica任职。文中配图来自盖蒂图片社。)