OpenAI神秘模型惊艳网友, GPT-4.5/5内测版回归?

虎嗅APP2024-05-09 21:57:01  83

前段时间,一个名为gpt2-chatbot的神秘大模型一夜冒头,凭借媲美GPT-4的实力在整个AI圈赚足了眼球,甚至被认为是GPT-4.5/5的内测版。

连OpenAICEOSamAltman都忍不住下场蹭起了热度:“我确实对gpt2情有独钟。”

好奇的网友们蜂拥而至,结果由于人气太旺,很快该模型就被紧急下架,而最近这款模型再次上线,并且还带来了一款新的模型:

Im-a-good-gpt2-chatbot

Im-also-a-good-gpt2-chatbot

GPT-4.5/5的内测版?到底什么来头

新模型的诞生总能激起网友的狂欢,短短几天,网友已经将这两款模型玩出了花。

网友@kiieford给im-a-good-gpt2-chatbot出了个难题,让它创建一个对mp3文件做出反应的3D可视化网页,结果一次就成功了。

当网友让它分析一张直升机的符号照片时,Im-also-a-good-gpt2-chatbot如同庖丁解牛一般,光速拆解细节,“看图说话”的能力堪称一流。

在同一问题的对比上,这两位“选手”的表现可谓是各有千秋。

im-a-good-gpt2-chatbot不仅给出了详尽的解答,更是将游戏的机制和得分情况分析得头头是道。而im-also-a-good-gpt2-chatbot的回复简洁凝练,直击要点,虽然话不多,但每一句都是精华。

别看im-also-a-good-gpt2-chatbot在回答问题时惜字如金,做起事来却一点也不含糊。

当网友输入提示词:CodeFlappyBirdgameinPython,让其编写鸟飞类游戏代码时,配上几张精心挑选的Png照片,不一会儿,一个生动的游戏界面便大功告成。

当AI遇上中文问题,这两个模型的表现瞬间拉开差距。

im-a-good-gpt2-chatbot的回复展现了它对中文语境的深刻理解,面对“鲁迅打周树人”这样的调侃,它能指出其中的幽默之处。

而im-also-a-good-gpt2-chatbot则洋洋洒洒写了一大堆,强行上价值的回答仿佛在做阅读理解。

不过im-also-a-good-gpt2-chatbot在编程方面的表现也确实可圈可点。

网友@itsandrewgao要求其编写一个方格颜色随机变化的康威生命游戏代码,并且要显示每一代的活细胞数量时,虽说最初的结果不太理想,但在网友的再次要求下,它能够自行修复代码。

Reddit网友抛出了一个棘手的物理问题,此前连GPT-4Turbo也没能成功解答,而im-also-a-good-gpt2-chabot却给出了正确答案。

总想挖点猛料的网友向im-a-good-gpt2-chatbot发起了灵魂拷问,询问其是否为GPT-4.5时,其回复道:“我是一个基于GPT-4架构的优秀聊天机器人,特别是GPT-4.5变体。我所接受的训练数据包含直至2023年11月的信息。”

坏消息是Altman此前在哈佛大学演讲时曾明确否认gpt2-chatbot为GPT-4.5/5,但好消息是,这也意味着GPT-4.5/5的性能或许将远超我们的想象。

包括OpenAI首席运营官BradLightcap最近也放出豪言,当今的生成式AI在一年内就会变得“糟糕得可笑”,言语之间对即将到来的GPT-4.5/5充满了自信。

即便这两款模型并非是GPT-4.5/5,但或许也与OpenAI也脱离不了关系。

无论是几天前,Altman疑似发帖“剧透”:Im-also-a-good-gpt2-chatbot,还是网友@nanulled的最新发现,似乎都让这些模型出自OpenAI之手的猜测再添实锤。

OpenAI最近的大更新,是AI搜索

比起捉摸不透的两款新模型,OpenAI即将发布的AI搜索引擎其实更值得期待,这或许也会给晚些时候亮相的GPT-4.5/5作铺垫。

最近,据可靠爆料人@apples_jimmy透露,OpenAI将于北京时间5月10日发布AI搜索引擎。不过TheInformation提醒,OpenAI内部也还没完全确定发布日期,随时都有“跳票”的可能。

彭博社则爆料了这款即将发布的产品的一些使用情况。用户只需通过自然语言的方式提问,它就会翻遍维基百科条目和博客文章,给用户一个满意的答案。

它还支持用书面文字和图像来回答问题。比如你问它该如何更换门把手,不仅会有文字耐心告诉你一步步怎么做,还可能附上一个清晰的图表手把手教你。

目前访问OpenAI官网网址https://openai.com/,首先出现的便是官网的轮转页面“AskChatGPTAnything”,输入问题后,即可跳转至ChatGPT获知答案。

昨天国内也有博主@赛博禅心已经抢先体验了一波功能。

例如,在搜索5月7日苹果发布会的内容时,ChatGPT引用了4个高质量的网址信源,答案总结得井井有条。

但在搜比特币的价格时,它的回复不够实时,并且在其他问题上,中英文的回复也有点混淆。搜索服务的内核还是Bing,但响应速度比以前快了不少。

前阿里顶级AI科学家贾扬清则对ChatGPT的搜索功能赞不绝口。

在同样体验新功能后,他认为这项技术正在取代那些仅通过调用传统搜索并利用大型语言模型(LLM)来总结结果的简单工具。

他举例称,通过询问“今天Hackernews最受欢迎的帖子说了什么”这样的问题时,就能看出ChatGPT新搜索功能的独到之处。

Google会甩给你一堆链接,让你自己慢慢翻;Copilot努力了,但结果有些跑偏;Gemini会礼貌地教你一步步访问网址;Perplexity给不出足够的信息量,而ChatGPT呢,不仅真正访问了实际网址,还直接让答案触手可及。

传统搜索引擎虽然是信息检索的利器,但一串串杂乱无章的网址列表既费时又费力。在这个信息爆炸的时代,我们对搜索的期待早已超越了简单的“搜索”二字。

从Perplexity自称的“世界上首个答案引擎”就可以看出,AI时代下的我们,需要的只是一步即达的答案,而不是略显繁琐的“搜索”。

这是诸如Perplexity等工具得以在极短的时间内声名鹊起,甚至叫板Google的底气所在,同样也是ChatGPT碾压实力备受贾扬清青睐的原因所在。

实际上,没有人比OpenAI更懂怎么狙击竞争对手了,这次也不例外,瞄准的或许依然还是那个熟悉的“倒霉蛋”——Google。

今年2月,Google推出攒了许久的终极AI大招——Gemini1.5Pro,这一炸裂性的头条新闻溅起的水花,不到几个小时就被OpenAI的Sora狠狠压下。

而最近彭博社报道称,OpenAI目前正在组建新的搜索团队,平时也没少往Google家里“撬墙角”。

与此同时,OpenAI即将推出的AI搜索引擎也选了个好时机,有意无意地与下周二即将召开的GoogleI/O大会撞了个满怀,也让这场发布会尚未开始就平添了几分火药味。

不过,OpenAI的这些小动作似乎并未给GoogleCEO皮查伊造成太多压力。

昨天在接受彭博社的采访时,他还淡定回应:“我们不是第一家进行搜索、第一家提供电子邮件的公司,我们也不是第一家开发浏览器的公司。”

言外之意就是,别急,好戏还在后头。

每个人面临的挑战和机遇是:在一个存在大量合成内容的世界中,你如何了解什么是客观和真实的?我认为这将定义未来十年搜索的一部分。

当然,就像一夜横空出世的Sora将Runway、Pika打得毫无招架之力,当OpenAI与Google就AI搜索斗得天昏地暗,我更好奇的是,角落里的Perplexity能否不被这场风暴“殃及池鱼”。

而距离这个谜底的揭晓,或许已经剩下不到24个小时了。

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/464719.html
0
最新回复(0)