比世界小,比人工智能大的“世界人工智能大会”
这几天,世界人工智能大会(WAIC)在上海举办。
说“世界”有点夸张。OpenAI没来,Claude没来。Genemi没来。Meta没来。Midjourney没来。好多都没来。不过微软来了。算是代表世界了吧。
说“人工智能”有些保守。除了人工智能,炒菜机器人来了,出版社来了,视频网站来了,笔记本电脑来了。好多都来了。但他们确实又都和人工智能有关系。算是广义人工智能吧。
世界人工智能大会,一个比世界“小”,比人工智能“大”的会。
但是,它依然是有意义的。
因为,它把散落网络各处的、质量参差的信息,筛选过滤完后,在你面前列好队。并且配备人讲解。等着你检阅。你只要花128元门票,就能用几个小时快速了解,你原来要研究几个星期的课题。
所以,我昨天专门去了现场。花了2个小时逛了三个展厅。时间很短。所以只有些模模糊糊的感受。
不一定对。你听听看。
感知层,正在悄悄生长、快速进步
我的第一个感触是:感知层可能会在角落里爆发。
在WAIC,我看到一家用“脑电”技术,做康复训练的创业公司。他们给患者的头上,戴一个脑电监测设备。这个设备可以“感知”你的意图。是想抬腿吗?抬不动?那腿部的设备,给一些助力。康复早期,给的力大一些;康复后期,给的力小一些。这样,逐步完成康复。
我还看到一家,做“触觉”的公司。人类拿铅球时,会握得很紧;拿鸡蛋时,会轻轻捏。人类可以根据物体,精准地用力。为什么?因为人类能感知到你用力时,带来的反作用力。然后随时调整力度。这就是“触觉”。有触觉,机器人才能拿捏任何物体。
检测脑电,获得触觉。这就是:感知。
当大模型如火如荼的时候,感知层,正在某个角落里悄悄生长、快速进步。因为,五感(视觉、听觉、味觉、嗅觉、触觉),是人类智能的“前提”。感知层,也是人工智能的前提。
感知层的进展,非常值得关注。
现在的人工智能,学习的都是人类“咀嚼”过的知识。但这些知识,一定有被吃完的时候。那时候,人工智能必须从这个真实世界,用摄像头,用收音器,用触觉、用一切感知手段,直接获取信息。
不太理解?
那你可能需要先了解一下,陆奇博士所提出来的“感知-思考-实现”思考框架。
“感知”的目的是获取信息,“思考”的目的是做出决策,“实现”的目的是采取行动
有一次,我去北京拜访奇绩创坛的陆奇博士。
陆奇是原微软全球执行副总裁,百度集团总裁,YCombinator中国首席执行官。在我心中,他是神一样的存在。但他受人尊敬,不是因为头衔的高度,而是因为思考的深度。
陆奇博士,和我分享了一个理解这个多变的世界的思考框架:感知-思考-实现。
“感知”的目的,是获取信息。“思考”的目的,是做出决策。“实现”的目的,是采取行动。就像人一样。看见苹果是“感知”,决定吃掉是“思考”,用手拿起“实现”。
科技每次对这三件事的跃升,就是新范式的新拐点。比如谷歌对感知(获取信息)的方式的跃升,OpenAI对思考(做出决策)的方式的跃升。
所以,真正的人工智能,必须有眼睛、有鼻子、有耳朵。真正的人工智能,必须有感知。然后,模型(思考)的价值,才会发挥到最大。
大模型军备竞赛的胜利者,也许是小模型
这次在WAIC,看到了很多国内大模型公司。百度的文心。阿里的通义。讯飞的火星。
从陆奇博士的思考框架去看,它们都是来解决“思考”这个问题的。
感知,可以用“敏锐不敏锐”来评价。思考,可以用“聪明不聪明”来评价。它们都很聪明。它们甚至是全才。上知天文,下知地理,通晓100国语言。还能陪你聊天,给你提供情绪价值。
但是,我们真的需要这么聪明的模型吗?你需要一个有9个博士头衔的人,帮你改劳务合同里的错别字吗?
在WAIC上,我看到了很多自称大模型的“小模型”。比如法律小模型(它们自称大模型)。医疗小模型(它们也自称大模型)。
它们用“少”数据(比如历史合同,过往病例vs.OpenAI的全网数据),训练“小”模型(几亿参数vs.OpenAI的1750亿参数),训练出一些专有模型。很便宜,但很有用。
这次看完WAIC,有种感觉。“大干快上,必须第一”的大模型军备竞赛,很快会退热。“小模型”,可能是未来商业化的主力军。为什么?
因为便宜好用啊,朋友。
在思考的模型世界,少量的全才(大模型),会和大量的专才(小模型),共存很长时间。
感知。思考。然后是实现。
时代的残酷与美妙
这次来WAIC,看到了很多机器人。雨后春笋一样。不由得感叹,时代的残酷与美妙。
就在几年前,我们还在为波士顿动力的机器人,能跑能跳,怎么都不摔跤而欢欣鼓舞。觉得这是机器人技术皇冠上的明珠。但突然一夜春雨之后,全球的科技公司,似乎都做出能跑能跳,怎么都不摔跤的机器人了。
为什么?因为科技树上的另一条技术路线,突然被点亮了。
以前的机器人,头脑简单,所以合适要研究如何让四肢发达。如何在智商很低的情况下,能跑能跳。但突然,大模型来了。突然,机器人变聪明了。以前用来训练弱智机器人跑跳的技术路线,就没必要了。怎么跑?怎么跳?不用教了。让大模型自己学啊。
这不是一家公司战胜另一家公司,是一条技术路线战胜另一条技术路线。就像今天,随便一家创业公司做的聊天机器人,都比苹果做了十几年的Siri,不知道聪明多少倍。
因为科技树被点亮,具身智能,空间计算,这些机器人方向的概念,越来越火。人工智能终于可以通过“感知”来理解世界,通过“实现”来改变世界了。
感知。思考。实现。
越看越觉得,这个世界的变化,超出所有人的认知。甚至应该超出参与创造这些变化的人。
那么,我们应该如何拥抱这些变化呢?
不要走在主航道的前面,而要走在它的下面,或者旁边
我有个朋友,很想拥抱人工智能。但怎么拥抱呢?他说,他发现和OpenAI对话时,只能打字,不能用语音。他说,那我做一个语音插件吧。这样,就能用语音和OpenAI聊天了。
我说,千万不要。OpenAI只是没腾出手来。等它腾出手来,它的下个版本,最多下下个版本,一定就有语音对话了。不要走在OpenAI的主航道上。你一定会被他的车轮碾死。
果然,GPT-4o,就自带了语音对话,即将推出实时对话。我朋友的这个项目,卒。
不走在主航道上,那应该走在哪里呢?应该走在它的下面。
这次在WAIC上,我看到一家创业公司,做“高质量数学数据”。什么意思?今天的大模型参加高考,文科超越了绝大多数人类,但数学一直考不好。为什么?
因为大模型的智力,来自高质量的数据。大模型的数据库里,一直缺乏优质的数学数据。吉米多维奇的数学分析习题集(噩梦啊),偏微分方程的解法,数学奥赛的证明。基于这些数据训练,大模型才会变得聪明。
于是,这家创业公司,就专门构建这样的数据集。然后,卖给大模型公司。你们淘金,我们卖铲子。
在WAIC上,我还看到一家创业公司,做“小脑平衡算法”。这么多公司要做机器人。机器人的核心之一,是不摔跤。怎么做到?这家公司,不做机器人,只做“不摔跤算法”。然后,把算法卖给机器人公司。他说,现在机器人18罗汉中,5家公司用的就是他们的算法和服务。
这就是,走在主航道的下面。做底层的底层,帮助坦克铺路。
有意思。
那什么是走在主航道旁边呢?
toB还是toC,是个问题
人工智能的第一桶金,到底在toB,还是在toC,是个争论不休的问题。
toB太难了,toC太卷了。
但是在这次的WAIC大会上,我还是看到了不少toB的案例。尤其是在视觉识别领域。
一家公司给我介绍,他们的AI“晶圆缺陷检测系统”。
以前,人们是怎么检测一张光滑如镜面的晶圆上,有没有缺陷呢?用眼睛。我的天啊,这要耗费多大的人力啊。现在,这家公司用人工智能来检测。他们把历史上晶圆的照片,做好标记,然后“喂”给人工智能,让它自己学习。突然,人工智能就具备了检测晶圆的能力了。用人工智能检测缺陷,比人要准确,还更便宜。
所以,toB到底有没有机会?当然有。
个人可能因为兴趣而买。企业一定因为效率而买。toB的企业,对效率更加敏感。人工智能的核心价值,就是提效。什么是提效?就是用20万,省下100万。这样的系统,一定是未来。
很多人觉得toB难做的原因之一,可能是想把兴趣卖给企业。
都是年轻人,都是年轻人,都是年轻人
WAIC的一楼,都是些大公司。个人觉得,属实没什么好看的。也可能是因为熟悉吧。很快就走完了。然后就到了2楼。二楼的Future100展区,真是好看。
Future100,就是未来的100家公司。今天,他们是创业公司。
看完之后,除了感受今天大家都在哪些方向尝试之外,更大的一个感受,就是:都是年轻人。
太年轻了。
一个小伙子,在大学里和导师一起做项目。做着做着,这个世界即将发生巨大的变化,再不休学就来不及了。然后,他就出来创业了。今天做得相当不错。
我和他聊完,甚至有些震撼。真有点硅谷的感觉了。
我们经常抱怨,说机会都被60后,70后,80后抓走了。90后,00后没机会了。但真的是这样吗?
60后抓住的,是下海的机会。70后抓住的,是房地产的机会。80后抓住的,是互联网的机会。那90后和00后呢?90后和00后的眼里,不应该盯着这些过去的机会。你们的机会在当下,在未来。人工智能,是所有60后、70后、80后这辈子都羡慕不来的机会。
满眼都是年轻人。真的,这个世界,依然充满希望。
要不要学编程?
要。不但要学编程,还要学数学。
刚刚高考结束。很多朋友问我,孩子应该报考什么专业。正好看完WAIC,说说我的看法。
有人说,未来人工智能会比人聪明,人唯一擅长的,就是创造力了。所以,应该学艺术。
学艺术很好。我没有问题啊。但如果你问我的话,我会建议你,在有可能的情况下,学数学和计算机。
有人说,以后人工智能都会自己编程了,还学编程有用吗?
这个逻辑有意思了。大部分中国人都会写字,那你学写字还有用吗?有些能力,是别人会你就不用会了的。但有些能力,是别人会,你更要会的。因为编程,就是一种“语言”,与人工智能这个物种沟通的语言。未来我们必须与另一个物种对话。学习编程,不是为了编程,而是为了理解这个物种。
编程和数学,看完WAIC之后,我更坚定了自己的这个想法。
没有人知道未来会发生什么变化。觉得创造力只属于人类,可能也只是一种自大。
那孩子学什么呢?
水面变化越快,就越要学底层的东西。因为底层的数学不会变。为什么不会?因为数学,不会就是不会。
未来,就在前方,但我却被困在了现在
回到WAIC,回到真实的世界,回到当下。
也许是因为“人工智能”大会的原因,这次WAIC,是刷脸入场。挺好。我买完票后,就去刷脸了。
但是,在通往刷脸机十几米的地方,有工作人员拦住了我。说要看购票记录。我说是别人帮我买的。他说,那就看付款短信也行。我说我真没有。我只带了脸。不是说刷脸吗?
他们说,那不行。万一你是黄牛呢。没有记录,我不能让你去刷脸。因为我不知道你是不是真买了票。我说,我刷了脸,不就知道我是不是买了票了吗?
我们就在那里“玩”了5分钟绕口令游戏。
未来,就在前方10米。但是,我却被困在了现在。
就10米。但看上去,却是很长的路要走。而我们前行的最大的阻力,居然是人类自己。
哎。继续努力吧。