从去年到今年,大模型行业展开了一场全面竞赛,许多大模型在参数和维度上都达到了「最强」的水平。
然而,对于大多数普通用户来说,要从排行榜和参数中直观感受到 AI 给工作和生活带来的实质性影响,其实是相当困难的。
那些发布会上的酷炫魔法,一句话生成 PPT、能实时识别多种媒介的多模态 AI、像科幻电影中的语音交互,是不是能成为我们生产力的一部分,才是 AI 应展现给普通人的底色。
今天智谱 AI Open Day 上,CEO 张鹏也指出,对未来的想象力只有化为现实的生产力才具有真正的革命性的意义。
智谱 AI CEO 张鹏
在智谱 AI Open Day,我们看到了与其他 AI 大模型发布活动截然不同的画风。
凭借「开箱即用」的 AI 智能体,年仅 1 岁小朋友办画展、记者转型心理咨询师,开启第二职业。
还有年仅 9 岁的小朋友,通过自己设计故事框架、不断提出问题,仅用时 1 个月就创作出的国内第一本少儿和 AI 合著图书——《AI 少年——火星生存大挑战》。
此外,我们还看到了智谱清言首位数字员工——工号 001 的 AI 罗永浩。他不仅可以直播带货,把「挖掘机」形状的房型夸出新的高度,还随时在清言智能体中心对外开放,意味着我们随时可以找他「谈谈心」。
说到数字「员工」,我产生了一个大胆的想法,是不是我也可以用智谱 AI 智能体协作产生的 WorkFlow——「清流」,组建一个 AI 内容公司呢?
用 AI 智能体组建一家内容创意公司
说干就干,既然要「创业」,就从我的老本行下手。
1. 内容创作
最近,英伟达 CEO 黄仁勋在演讲中介绍了公司的新产品和计划。我们首先利用 AI 技术搜索了相关内容。不得不说,AI 搜索得出的总结已经非常全面。
不过,作为这家人工智能公司的「创始人兼 CEO」,我显然不会轻言满足。因此,我叫来了几个专为撰写热门标题而设计的 AI 智能体,创作了一些吸引人的标题。
接着,我们可以根据具体需求对这些标题进行细致调整。
文章在标题的引导下整体质量还是很不错的。
这还不算完,为确保文章内容的准确性和逻辑性,我们还找来「校对专员」对文章进行细致地审核。
他们会帮助我们检查文章的多个方面,包括错别字、信息来源的准确性、表述的清晰度以及逻辑的严密性,还能提出有针对性的修改建议。
在文章质量得到保证后,智能体还能为我们提供更多关于这一事件的扩展问题,帮助我们深入了解相关背景和细节。
不得不说,这种直接在对话框输入「@」调出智能体的方式常常让我感觉好像是在公司群里面随时随地找到不同专长的同事,无需交代前文,这位被 @ 的「同事」就能根据「群里的消息」马上给我反馈,非常方便自然。
2. 活动策划方案生成 PPT
不久前,爱范儿主办的 inG 游戏艺术节取得了不错的反响,我也想试试看能不能用智能体工作流完成整个活动方案策划。
结果还不错,我还召集了多个不同的 AI 活动策划智能体,让它们共同提供优化建议。
这样做不仅减少了错误发生的可能性,还激发了更多的创意灵感。
在生成 PPT 后,我又喊来了 CogView AI 绘图智能体,一句话生成各个页面的所需图片。
值得一提的是,我并没有具体说明每页要求,但它仍然能根据此前生成的 PPT 内容,为每个章节生成相应图片。
即使我对想要的内容还只有模糊的概念,也可以通过慢慢调整来达到预期,满足各种刁钻要求。
3. 定制智能体和「找外援」
当然,我们还可以通过接入外部工具,带来更多功能。
在智谱的「智能体中心」中,我们可以看到各种各样的智能体,有的能帮你练习口语,有的则能在无聊的时候带来快乐。
点击「创建智能体」,不需要输入太多内容,就可以通过 AI 自动生成智能体的配置。
系统为我们自动生成了头像、能力描述,以及开场白和预设的问题等。模型能力默认勾选了联网、绘画和代码。
点击「工具市场」,我们就可以看到很多其他智能体使用到的工具,可以连接印象笔记、网易有道、WPS、飞书日历等工具。
虽然我创建的是「爆文编辑器」,但在添加「高德地图」栏下的三款工具后,却能拥有查询本地美食的能力。
我还把这个隐藏着「查询美食」功能的「爆文编辑器」发布到了「智能体中心」,感兴趣的朋友们不妨去试试,看它能不能把这个「爆文编辑器」当作地图软件来用。
成为 AI 时代的超级个体
正如我们前面体验到的,智能体的协作有甚至会比下一代基础模型更强,但基础模型同样决定着群体智能的上限。
事实上,智谱清言智能体背后的模型 GLM-4 在很多方面与 GPT 已经差距很小。
智谱 AI 今天最新推出的 GLM-4-9B 模型可以说是在各个方面更进一步,通用性能相比上一代提升 40%,超越 Llama 3 8b 模型,最高支持两百万字长文本,函数调用能力相较上一代提升了 40%,并且全面支持 AllTools 调用能力。
我们在前文中为大家展示了如何通过一个指令,让智能体自行理解意图,自动理解、规划复杂指令的功能,除了我们用到的让 CogView 理解上下文生图以外,还有代码模型 CodeGeeX、多模态大模型 GLM-4V 等等诸多工具,通过外接 API,实现智能体与日常生活的无缝对接。
如今已经有超过 30 万个智能体活跃在清言 APP 上供我们使用,这种使用 @ 将不同智能体串联在一起的方式,就是清言 flow,也就是我们前文体验到的流程。越来越走向应用侧的 GLM 大模型。
更小、更快、更便宜——或许也更接近 AGI
AI 写作工具创企 Lex 的创始人 Nathan Baschez 认为,
在 AI 时代,一种新型的创业公司形态正在诞生,其特点是:smaller、faster、cheaper and weirder(更小、更快、更便宜、更奇怪)。
实际上,在如今的 AI 创业浪潮中,我们已经看到了诸如 Midjourney、 Magnific AI 这些人数极少的明星公司,当 AI 智能体的工作流渗透到更多行业,这样的情况将会越来越多。
Sam Altman 、黄仁勋等业界大拿,也在不约而同预计 AGI 可能在几年内到来,而所谓人类智能水平的 AI,指的并不只是认知水平和理解能力和人类无异甚至更强,更是能像人类那样自我反馈和调整规划。
通过让 AI 智能体扮演不同角色,如创作者与评审者,它们能基于彼此的反馈迭代改进,这种分工明确的多智能体系统能显著提升工作效率与质量。
同时,集成工具扩展了系统的功能边界,增强了灵活性与适应性,使其能够随技术发展持续进化,满足更多场景需求。
在工作流进行的过程中,复杂的任务被拆解并分配给专精的智能体。这种细致的流程规划与任务划分,使每个智能体聚焦于其擅长的部分,减少出错几率,提高整体协作效率。
而处在工作流中的 AI 智能体们,既能独立承担任务,又能在必要时相互补位、协同作战,同时人类的介入可对智能体的工作进行微调,确保整个系统运行的准确性与高效性。
也是由这些特点,为 AI 智能体组成的工作流系统带来了更强的效率和整体的优化,使其成为很多人眼中 AI「未来的样子」,也使其成为当前 AI 时代越来越接近「贾维斯」的存在。
在哲学界有一个著名的模拟假说:我们所有的存在可能都是模拟的现实,例如计算机模拟。模拟中可以包含有意识的思维,这些意识可能知道也可能不知道自己生活在模拟中。
著名科幻电影《黑客帝国》就是围绕着这样一个虚拟世界的故事
我们在工作流中看到的,一群 AI 可以演绎出人类人们的协作过程,或许已经在某种程度上验证了这个假说,这会不会成为用 AI 制造硅基文明的开始呢?
或许我们现在体验的这些智能体工作流,站在 AGI 的平行时空里来看,就像数千年的古巴比伦的社会组织那样还处于非常早期的阶段。可尽管如此,却是通向 AGI 的必经之路。
智谱 AI CEO 张鹏认为,技术曲线的陡峭与让更多人享受到 AI 强大生产力之间还有非常大的差距,如何把强大的大模型能力真正用来帮助人们的工作、学习和生活,这其中其实还有很多的工作要去做。
转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/670304.html