“十八金刚”大阅兵, 中国机器人走到哪一步了?

观察者网2024-07-11 16:57:00  54

“人形机器人太卷了!”2024年世界人工智能大会的展厅里,时不时就会听到从业者这样的感叹。

大模型的概念才火了一年多,很多人便迫不及待地把目光投向了人形机器人,视之为通往AGI(通用人工智能)的必由之路。

去年的人工智能大会上,人形机器人还难觅踪影,但是到了今年,众多机器人企业已然占据了展会的半壁江山。展馆入口处“十八金刚”的集体亮相,更是吸引大量观众驻足。

不过,相比于外界热炒的“具身智能元年”,从业者的态度大都冷静得多。在多位专家看来,具身智能的训练难度,要远远大于大语言模型。而人形机器人的落地应用,目前也仍然局限于较为单纯的工业场景。

国产机器人本领如何?

除了数量极多之外,今年参展的国产机器人类型也相当多样,既有与真人身高相仿的双足机器人,也有侧重负重能力的外骨骼,以及轮式机器人、机器狗等。

这款极其逼真的人脸机器人,显然是为了克服“恐怖谷效应”。

在展厅内,不少机器人也现场进行了能力展示。但是平心而论,它们的运动能力相比于过去几年并没有质的提升。

来自宇树科技的这款机器狗,能够现场表现空翻等技巧,引发阵阵惊呼。

但我们在现场也看到,有些品牌的机器狗在面对稍微复杂的场景,例如上下台阶时,偶尔也会失误。

对于双足机器人来说,受限于运动能力,下台阶的步伐与真人存在明显差异。

经典的脚踢机器人环节,工作人员的力道也较为温柔。

客观来说,目前人形机器人与真人还有相当大的差距,很难说有什么实际的应用场景。即使早已名声在外的特斯拉“擎天柱”(Optimus)机器人,此次也只做了静态展示。

而真正体现出技术进步的,更多还是应用于工业场景的机械臂。

例如,穹彻智能的机器人,这几天给不少观众喂了黄瓜。

给黄瓜削皮、叠衣服,这些技能的关键在于机器人对于空间的理解和力度的拿捏。尤其是叠衣服,这件对于人来说平平无奇的小事,至今仍然是机器人面临的高难挑战。

由于衣服是柔性物体,尤其揉成一团之后相当于无数多个面的多面体,机器人能够面对随机场景,自主判断折叠的方向和力度,体现了深度学习技术的前沿进展。

穹彻智能CEO、上海交大计算机系的卢策吾教授,还展示了用这款机器人刮胡子的视频,令不少专业观众印象深刻。

银河通用机器人(GALBOT)也在现场演示了抓取任意形状物体的能力。据介绍,银河通用的机器人今年有望与美团合作,部署到无人药店等实际场景中。

物理世界的训练难题

让机器人学会刮胡子,意义有多大?答案取决于你对机器人抱有多大的期望。

从本质上来讲,这体现了机器人对于物理定律的掌握,这是当前大语言模型很难做到的。这也是为什么具身智能被视为通往AGI的必经之路。

卢策吾教授关于柔性抓取的论文,曾获得机器人领域的国际顶会RSS的最佳系统论文提名,这是中国团队历史上首次获得这一成绩。

可以说,刮胡子这件事已经代表了中国和全球机器人领域的领先水平。在工业场景,穹彻智能正与新希望、海天等企业合作,将类似能力用于食材加工。

但如果以AGI为标准,当下的机器人还差得很远。

与AGI的区别在于,像抓取、叠衣服、刮胡子这样的技能,被穹彻智能称为“原子技能”,而每一项原子技能都需要单独训练。

据穹彻智能现场工作人员介绍,一项原子技能的训练,需要先由人工借助VR技术,远程操作机械臂完成重复任务,积累一定数据后,机械臂才能通过深度学习获得泛化能力。

这意味着,每一项原子技能的训练,都要额外花费人力和时间。这显然算不上是通用智能。

目前,穹彻智能正致力于建立更大的原子技能库AnySkill。卢策吾教授指出,当统一模型具备20个通用技能时,可解锁200个商业化任务,100个通用技能则可以解锁10000个商业化任务。

但无论能掌握多少技能,只要技能还需要单独训练,AGI就无从谈起。

那么想要通过具身智能达到AGI,难度究竟有多大?

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/869468.html
0
最新回复(1)