谷歌两小时I/O大会提了“AI”121次, 发布了十余项更新及新品, 却“缺乏惊喜”

澎湃新闻2024-05-15 07:21:41 42

·本次开发者全程两个小时，谷歌CEO共提及“AI”121次，此次开发者大会，谷歌将搜索业务做了最彻底的AI改造，还更新升级了Gemini1.5Pro版本，同时推出Gemini1.5Flash轻量化小模型。此外，推出自称效果超过Sora的生成视频模型Veo。

北京时间5月15日凌晨，谷歌年度开发者I/O大会2024在美国加利福尼亚州山景城总部附近的海岸线圆形剧场召开。整场发布会由谷歌CEO桑达尔·皮查伊（SundarPichai）主持，全程历时两小时。

前一天，OpenAI刚发布GPT-4o和全新的ChatGPT，此次谷歌要在开发者大会上交出怎样的“AI”答卷外界充满了期待。

澎湃科技（www.thepaper.cn)注意到，整场开发者大会，桑达尔·皮查伊称，据Gemini统计，在整场发布会上他共提及“AI”121次，发布了十多项产品更新和新品，但外界评论称，和GPT-4o不到30分钟的发布会相比，“缺乏惊喜”。

谷歌年度开发者I/O大会现场

此次开发者大会，谷歌将搜索业务做了最彻底的AI改造，还更新升级了Gemini1.5Pro版本，同时推出Gemini1.5Flash轻量化小模型。

除此之外，谷歌推出自称效果超过Sora的生成视频模型Veo，另外还展示了与GPT-4o相似的语音视觉交互功能GeminiLive，同时，还更进一步推出了AI智能体ProjectAstra。

Gemini升级，更加轻量

当天大会上，谷歌宣布对Gemini模型进行更新，此前，谷歌推出的Gemini1.5Pro是一个中型多模态模型，上下文长度为100万tokens。

在此次开发者大会上，桑达尔·皮查伊宣布，将Gemini1.5Pro升级到200万tokens，并全面支持Workspace，同时Gemini1.5Pro将面向全球开发者开放。

升级后的Gemini1.5Pro，在多项公共基准测试中取得了显著改进，在多项图像和视频理解基准测试中也实现了最先进性能。此外Gemini1.5Pro还能够遵循越来越复杂和细微的指示，包括指定产品级行为的指示，如角色、格式和风格等。

用户可以通过GeminiAdvanced订阅服务体验最新的Gemini1.5Pro，当前支持超过150个国家的35种语言。

为了满足用户对低延迟和低成本的需求，此次发布会，谷歌宣布，发布轻量化模型Gemini1.5Flash。

Gemini1.5Flash

相较于Gemini1.5Pro，该版本的特点是响应速度更快、成本低至0.35美元每百万tokens。而Gemini1.5Pro则针对对高质量内容有需求的用户，收费为7美元每百万tokens。

尽管Gemini1.5Flash体积小巧，仍实现了100万个标记的长上下文窗口，开发人员还能注册尝试200万个标记，适用于摘要、聊天应用、图像和视频字幕、长文档和表格的数据提取等多种任务。

从今天起，超过200个国家的用户都可以在GoogleAIStudio和VertexAI中使用Gemini1.5Flash。

值得注意的是，此次大会，谷歌重磅宣布推出基于Gemini1.5Pro的GeminiAdvanced。升级后的GeminiAdvanced可以处理“多个大型文档，总计最多1500页，或汇总100封电子邮件。同时支持35多种语言和150多个国家及地区。

发布AI智能体ProjectAstra

“很久以来，我们都有一个梦想，希望打造一个通用的AIAgent（AI智能体），帮助人们的生活变得更方便。现在，我们多年磨一剑，推出ProjectAstra的通用AI智能体。”桑达尔·皮查伊在发布会上说。

大会现场，来自谷歌Deepmind的CEO杰米斯·哈萨比斯（DemisHassabis）上台，讲解和展示了ProjectAstra的原型运作视频。

在展示过程中，谷歌在演讲中展示了一个人拿着手机，将摄像头对准办公室的各个地方，并用语言与其交互：“当你看到有东西发出声音时，请告诉我。”在这段视频演示中，Astra能识别各种物体甚至代码，并实时与人类进行语音互动。

在展示环节，有用户对Astra突然提出一个此前没有涉及到的问题，“你记得我把眼镜放哪里了么？”

“你的眼镜在桌上苹果旁边。”Astra回答到。这一过程引起现场惊呼。

这表明，当摄像头扫过的时候，Astra曾“看”到过用户的眼镜，Astra以视觉的形式记录了下来。

发布视频生成模型Veo对抗Sora

此次发布会上，杰米斯·哈萨比斯宣布，谷歌正式发布一款全新的视频生成模型Veo，将成为Sora新的劲敌。

谷歌声称，Veo能够根据文本、图像创建超过60秒的高质量1080P视频，用户可以对光照、镜头语言、视频颜色风格等进行设定。此外，Veo还能够理解电影和视觉技术，例如延时拍摄的概念。

用户仅需写出文本提示即可生成视频，比如文本提示：“在宁静的山地平移镜头，相机慢慢露出白雪皑皑的山峰、花岗岩岩石和倒映天空的清澈湖泊。”“一艘宇宙飞船在浩瀚的太空中穿梭，星星划过，高速，科幻”。

根据谷歌公布的演示视频，Veo生成的小狗毛发十分细腻，走路动作、姿态也非常逼真。

搜索引擎升级，与Gemini结合

谷歌搜索负责人莉兹·里德（LizReid）在此次发布会上称，在过往的25年里，谷歌经历了许多技术变革，“我们不断重新构想和扩展Google搜索的功能。”

莉兹·里德宣布，如今，借助AI，谷歌搜索可以做的事情超出人们的想象。她表示，将Gemini的先进功能（包括多步推理、规划和多模态）与谷歌搜索系统结合在一起，推出AIOverviews。AIOverviews将首先在美国推出。通过AIOverviews，用户可以上传演示其要解决的问题的视频，然后启动搜索在论坛和互联网的其他区域以找到解决方案。

此外，用户也可以向定制的Gemini模型提出复杂的问题。甚至当用户不知道自己问什么的时候，Google也可以给用户推荐，给用户做头脑风暴。用户还可以直接与Gemini聊天，从整个收件箱中查找详细信息。

莉兹·里德称，“从回答、计划、需求定制到组织和视频搜索，Google都会替你完成，而你需要做的只有提问。”

在大会进行到中途，澎湃科技注意到，桑达尔·皮查伊低调宣布了谷歌的第六代张量处理单元(TPU)称为Trillium，将于今年晚些时候向其云客户提供。TPU可能不是谷歌当今众多人工智能更新中最华丽的，但它是其人工智能工作的重要组成部分。

据谷歌介绍，作为“迄今为止性能最强、能效最高的TPU”，Trillium宣称与TPUv5e相比，每个芯片的峰值计算性能提高了4.7倍。

值得关注的是谷歌此次也在安卓平台上推出一系列全新AI功能。谷歌表示，此前，"CircletoSearch"功能允许用户无需切换应用即可搜索，现在起它还可以作为学习伴侣，解答数学题、图表等复杂问题。目前这一功能已在超过1亿台安卓设备上提供，预计到年底这一数字将翻倍。

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益，请与本站联系，我们将及时更正、删除、谢谢。
https://www.414w.com/read/509701.html

随机主题

墨西哥一场总统竞选活动发生舞台倒塌事故数十人死伤难道不想看看房地产股票的业绩吗? 没有业绩涨上去, 也是空涨哦影后颜丙燕: 八冠荣耀下的单身传奇始祖鸟立大功, 萨洛蒙抄作业, 母公司亚玛芬中国业绩猛涨美锦能源下跌5.99%, 报5.49元/股 NBA巨星东契奇: 迈向历史最大顶薪合同之路中通客车“号令者”浮出水面, 暂停交易15日亚特兰大勇夺欧联杯冠军，并终结药厂不败神话，温格推行越位新规彩！彩！彩！荣耀magic6保时捷pk华为pura70ultra！乌克兰宣布参加巴黎奥运会。但对代表团提出了一个严苛的条件。赵明、姜海荣晒荣耀200系列实拍人像, 普通用户也能拍出专业感他演女人竟骗过所有人, 扮女人扮成他这样, 全世界找不到第二个阿维塔12的产品力怎么样? 能不能撑起40万的价格?赵云：常山龙胆，三国风云中的不朽传奇苏里南商业环境的特点和机遇都市车界|售价百万! 鸿蒙智行新品牌即将推出崔康熙两大嫡系夏窗驰援鲁能时间敲定, 能力已获认可, 值得期待今日信心场次: 荷甲乌德勒支延续主场不败神话新车公关传播效果4月榜: 新普拉多在一片倒彩中继续割韭菜?618保姆级购机攻略：照着这个清单买绝对错不了！沪深交易所出手打击“神预言”相关账户被限制交易15日

最新回复(0)