“人形机器人太卷了!”2024年世界人工智能大会的展厅里,时不时就会听到从业者这样的感叹。
大模型的概念才火了一年多,很多人便迫不及待地把目光投向了人形机器人,视之为通往AGI(通用人工智能)的必由之路。
去年的人工智能大会上,人形机器人还难觅踪影,但是到了今年,众多机器人企业已然占据了展会的半壁江山。展馆入口处“十八金刚”的集体亮相,更是吸引大量观众驻足。
不过,相比于外界热炒的“具身智能元年”,从业者的态度大都冷静得多。在多位专家看来,具身智能的训练难度,要远远大于大语言模型。而人形机器人的落地应用,目前也仍然局限于较为单纯的工业场景。
国产机器人本领如何?
除了数量极多之外,今年参展的国产机器人类型也相当多样,既有与真人身高相仿的双足机器人,也有侧重负重能力的外骨骼,以及轮式机器人、机器狗等。
这款极其逼真的人脸机器人,显然是为了克服“恐怖谷效应”。
在展厅内,不少机器人也现场进行了能力展示。但是平心而论,它们的运动能力相比于过去几年并没有质的提升。
来自宇树科技的这款机器狗,能够现场表现空翻等技巧,引发阵阵惊呼。
但我们在现场也看到,有些品牌的机器狗在面对稍微复杂的场景,例如上下台阶时,偶尔也会失误。
对于双足机器人来说,受限于运动能力,下台阶的步伐与真人存在明显差异。
经典的脚踢机器人环节,工作人员的力道也较为温柔。
客观来说,目前人形机器人与真人还有相当大的差距,很难说有什么实际的应用场景。即使早已名声在外的特斯拉“擎天柱”(Optimus)机器人,此次也只做了静态展示。
而真正体现出技术进步的,更多还是应用于工业场景的机械臂。
例如,穹彻智能的机器人,这几天给不少观众喂了黄瓜。
给黄瓜削皮、叠衣服,这些技能的关键在于机器人对于空间的理解和力度的拿捏。尤其是叠衣服,这件对于人来说平平无奇的小事,至今仍然是机器人面临的高难挑战。
由于衣服是柔性物体,尤其揉成一团之后相当于无数多个面的多面体,机器人能够面对随机场景,自主判断折叠的方向和力度,体现了深度学习技术的前沿进展。
穹彻智能CEO、上海交大计算机系的卢策吾教授,还展示了用这款机器人刮胡子的视频,令不少专业观众印象深刻。
银河通用机器人(GALBOT)也在现场演示了抓取任意形状物体的能力。据介绍,银河通用的机器人今年有望与美团合作,部署到无人药店等实际场景中。
物理世界的训练难题
让机器人学会刮胡子,意义有多大?答案取决于你对机器人抱有多大的期望。
从本质上来讲,这体现了机器人对于物理定律的掌握,这是当前大语言模型很难做到的。这也是为什么具身智能被视为通往AGI的必经之路。
卢策吾教授关于柔性抓取的论文,曾获得机器人领域的国际顶会RSS的最佳系统论文提名,这是中国团队历史上首次获得这一成绩。
可以说,刮胡子这件事已经代表了中国和全球机器人领域的领先水平。在工业场景,穹彻智能正与新希望、海天等企业合作,将类似能力用于食材加工。
但如果以AGI为标准,当下的机器人还差得很远。
与AGI的区别在于,像抓取、叠衣服、刮胡子这样的技能,被穹彻智能称为“原子技能”,而每一项原子技能都需要单独训练。
据穹彻智能现场工作人员介绍,一项原子技能的训练,需要先由人工借助VR技术,远程操作机械臂完成重复任务,积累一定数据后,机械臂才能通过深度学习获得泛化能力。
这意味着,每一项原子技能的训练,都要额外花费人力和时间。这显然算不上是通用智能。
目前,穹彻智能正致力于建立更大的原子技能库AnySkill。卢策吾教授指出,当统一模型具备20个通用技能时,可解锁200个商业化任务,100个通用技能则可以解锁10000个商业化任务。
但无论能掌握多少技能,只要技能还需要单独训练,AGI就无从谈起。
那么想要通过具身智能达到AGI,难度究竟有多大?
转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/869468.html