2016年,GoogleCEO桑达尔·皮查伊在I/O开发者大会上豪情满怀地向全世界宣布:
Google已经成为了搜索的代名词,Alphabet未来将成为一家AI优先的公司。
凭借在深度学习、自然语言处理等领域的深耕不辍,Google也的确在这场AI竞赛的起跑线上抢得先机。然而,ChatGPT的异军突起,让拉响“红色警报”的Google直接从和平时期转向了战时准备状态。
很多人乐观地预测,一夜消融的AI高山——Google,最晚到了来年冬天定能恢复昔日的巍峨,但迟来上演的却更多是少年屠龙的故事。
OpenAI“踩着”Google过河
如果说Google在摸着AI的石头过河,那么OpenAI在“踩着”Google过河。
在近期的GoogleCloudNext活动中,Google宣布最强大模型Gemini1.5Pro正式对外开放,其支持处理的最长音频约为11个小时,最长视频为1小时,让一众看客们都沸腾了起来。
有网友给Gemini1.5Pro上传了一个有史以来最具标志性的体育时刻合集,并让它识别视频中的运动,参与的团队/运动员、年份等,它都能给你安排得明明白白。
当人们还在沉浸在“把玩”Gemini1.5Pro时,针尖对麦芒的OpenAI宣布推出GPT-4Turbo的正式版本,不仅基础能力大更新,还自带读图功能,现在更是已经向所有ChatGPT付费用户开放。
一时间,本该是Google大杀器的Gemini1.5Pro又成了“明日黄花”,给人一种汪峰入职Google的感觉。
为什么说又呢?分不清有意还是无意,但这已经不是OpenAI第一次卡点狙击Google的新品了。
今年2月,Google推出攒了许久的终极AI大招——Gemini1.5Pro,其支持高达1M上下文,相比之下,GPT-4Turbo也仅支持128K上下文。
这一炸裂性的头条新闻同样维持不到几个小时。因为牌桌上的OpenAI不需要考虑出牌节奏,随手一掏,便是AI视频生成领域中的王炸——Sora。
长达一分钟的视频生成、多镜头的实时转换、出色稳定的画面生成以及世界模型理解能力等特点吸引了全世界的目光,也将Gemini1.5Pro溅起的水花狠狠地压了下去。
纵观以往OpenAI产品的发布节奏,我们可以发现,强大的议程设置能力无疑是绕不开的关键词。每一次重大产品的推出,OpenAI都恰如其分地抓住了市场的风向标。
此前有消息称,当Anthropic还在权衡Claude的安全性问题时,OpenAI已经果断靠ChatGPT抢占市场先发优势。而在Anthropic拿到亚马逊高达40亿美元的融资后,OpenAI再次发力语音和图像功能,用会看、听、说的ChatGPT反手给了Anthropic一巴掌。
这一切的背后,或许也与OpenAI创始人SamAltman的影响密不可分。早在YC担任掌门人的时候,他就展现出对媒体影响力的深刻理解和运用。
根据TheInformation创始人JessicaLessin的回忆,Altman尤其擅长与媒体记者打交道,并用精湛的沟通技巧赢得记者的信任。即便是在OpenAI的宫斗大戏期间,他也能够通过几条推文掌控舆论的走向,其影响力堪比网红界的马斯克。
而成为这种带有Altman特色策略的牺牲品,Google无疑是最不走运的那一个。为什么说这两次头条非常重要呢?这得从Google被OpenAI一直“压着打”的历史讲起。
回首这两年,在OpenAI的光环之下,Google的AI征途显得有些命运多舛。
2022年底,ChatGPT一夜之间照亮了整个AI界,起了个大早的Google却一筹莫展,皮查伊看着自己AI领域的“满朝文武”,恨不得要天天上演一场康熙怒斥群臣的戏码。
让月活破亿的ChatGPT“嚣张跋扈”许久之后,去年2月,Google仓促发起反攻,但依旧出师不利。搞混太阳系外行星第一张照片作者的Bard让看完发布会的观众直呼退钱,也让Google瞬间蒸发约2.75个京东的市值。
倘若GPT-3.5还能让Google看到一丝追赶的希望,那么GPT-4则直接断崖式压制了同行整整一年。
胜在这些年积累的技术底蕴,大船调转,AllInAI的Google在合并GoogleBrain和GoogleDeepmind之后,还真捣鼓出Bard“改头换脸”版的Gemini1.0模型。
其中超大杯GeminiUltra号称全面碾压GPT-4,但发布仅仅一天后,就被扒出刷爆全球互联网的演示视频存在造假,以至于Google自家员工反手就来个内鬼自爆,“这是不切实际的画面”。
直到Gemini1.5Pro的出现,无论是MoE架构的技术思路,还是实际的亲身体验,在一众网友的好评声中,其仿佛用能与GPT-4“掰手腕”的实力宣告AI最高的山又要回来了。
此外,1M上下文处理能力当时更是碾压同辈。Gemini1.5Pro既能瞬间掌握一门只有200人使用的冷门语言,也能一口气看懂一部44分钟的巴斯特·基顿的默片。
两次“头条”的失利,也让Google仿佛化身大闹天宫的孙悟空,尽管蹦跶得再欢,终究也翻不出佛祖OpenAI的手掌心。
值得一提的是,在主流产品上,两家公司对标得也比较全面。甭管实际效用如何,主打的就是一个你有我也得有。
你有ChatGPT,我有Bard(Gemini)
你有DALL·E3,我们有Imagen2
你有Sora,我有PPT上的Videopoet,甚至Imagen2也能文生视频
就连Google的老本行——搜索领域,OpenAI不光想取而代之,而且野心也更宏大。
前不久,Altman在接受Lexfridman的专访时指出,世界不需要多出一个翻版Google。
他在采访中的言外之意是,OpenAI要像Perplexity一样,用LLM+搜索重新定义搜索引擎的概念,并且还要寻找到一种不依赖广告的盈利方式。
最了解你的往往是你的敌人
近一年来,手握ChatGPT、Sora等先进AI工具的OpenAI成了整个AI行业的最强参照物。
从全球“千模大战”的大模型厂商中,随便拎几个大模型出来,什么“逼近GPT-4”,什么“全面对标GPT-4”之类词汇,都能引得众人哄笑起来,让整个AI圈充满了快活的空气。
英伟达高级科学家JimFan近日在社交平台X上称:“软件AI代理的核心优势并非其薄薄的包装层(例如Devin,SWE-Agent),而是底层的LLM。”
上到基准测试榜单,下到网友好评,短时间内能站稳脚跟、引领风骚的,基本就四大巨头——OpenAI、Anthropic、Google以及Meta。
AI的发展绕不开三大要素:算力、算法、数据。对比Anthropic,有钱有人有资源的Meta、以及Google显然更值得盯防。同时相较于Meta,Google与OpenAI之间的渊源其实也比想象中更深。
最了解你的人往往不是朋友,而是你的对手。
古龙在武侠小说《七种武器》中如是说道,这句话同样适用于OpenAI与Google之间的关系。
2017年春天,一篇名为“AttentionIsAllYouNeed”的学术论文,加速了生成式AI浪潮的到来。在GTC2024期间,论文作者与黄仁勋的对谈也成为了整个AI界的话题焦点。
鲜少有人知道的是,八位作者实则都有一个身份——Google的研究员。但Transformer架构的问世并未激起Google的足够重视,正如Altman所说:
当Transformer论文发表时,我想Google的任何人都没有意识到这意味着什么。
论文发表后不久,在时任OpenAI首席研究员IlyaSutskever的推进下,OpenAI成功分到生成式AI的第一杯羹。
如今,论文的8位作者都相继离开了Google,核心作者之一Kaiser也加入了OpenAI,并且还是名为“Q*”的新技术的发明者之一。这样的情况也发生在Sora身上,其背后的时空Patch技术同样被曝出是站在GoogleDeepmind的肩膀之上。
2024年,没有哪一家科技公司愿意在AI赛道掉队。火药味变重的OpenAI与Google之间的拉扯较量便是这股趋势的小小侧写。
据TheInformation爆料,Google联合创始人谢尔盖·布林亲自下场,打电话挽留即将转投OpenAI的员工。而OpenAI从Google挖人时,给出的承诺年薪将在500万美元至1000万美元之间。
此外,消息人士还透露,GoogleDeepmind的负责人Hassabis就曾抱怨Google的薪酬政策使他难以阻止研究人员跳槽到OpenAI。
当然,Google也并非被动挨打,前OpenAI前开发者关系负责人LoganKilpatrick近期便成功入职Google。在Gemini1.5Pro正式发布时,Kilpatrick也没少转发推文为其站台造势。
从融资背景上说,OpenAI与Google的较量其实更像是背后的微软在与Google在博弈。
放眼国外市面上的主流大模型,似乎都难逃被科技巨头收编的命运。
苹果这一年来,就没少买买买。亚马逊也不甘落后,选择大规模入资Anthropic,而手握OpenAI、MistralAI、InflectionAI等创企的微软则暂时在这些巨头较量中处于上风。
微软与Google这两位在搜索时代的恩怨情仇,也绵延至今日AI时代的较量。
在那个以搜索为王的年代,Google以其卓越的算法和用户体验,稳坐搜索引擎的霸主宝座,而微软的必应,却始终难以撼动Google的统治地位。
根据StatCounter公布的数据,截至2023年1月,Google在全球搜索引擎市场的份额高达92.9%,而必应仅有3.03%。这种巨大的市场份额差异,使得必应长期稳居“千年老二”。
只是这一次,当AI的曙光乍现,曾经在搜索引擎市场遭受过挫折的微软,似乎找到了扳回一局的希望。