OpenAI o1具有“博士级”推理、数学和编码技能的新AI模型

冰蝶谈科啊2024-09-13 17:03:28  97

人工智能推理模型代号为草莓,现在正式命名为OpenAI o1。

OpenAI训练了这些模型,让它们在响应之前花更多的时间思考问题,就像一个人一样。

根据OpenAI的说法,这些模型可以通过复杂的任务进行推理,并解决比以前的科学、编码和数学模型更难的问题。

OpenAI表示,这些模型通过训练学会完善自己的思维过程,尝试不同的策略,并识别自己的错误。

在测试中,新模型在具有挑战性的基准物理、化学和生物学任务上的表现与博士生相似。该模型在数学和编码方面也表现出色。

在国际数学奥林匹克竞赛(IMO)的资格考试中,目前可用的GPT-4o仅正确解决了13%的问题,而OpenAI o1模型为83%。

GPT-4o作为早期的模型,它需要许多条件使触发ChatGPT的功能,比如浏览网页以获取信息以及上传文件和图像。

对于许多常见情况,GPT-4o很快就会学习到相应的数据知识。然而,对于复杂的推理任务却有一定的困难,因此,对于OpenAI o1来说,这是一个重大的进步,代表了人工智能能力的新水平。

鉴于此,OpenAI将计数器重置为1,并将此系列命名为OpenAI o1。

作为开发这些新模型的一部分,OpenAI还开发了一种新的安全培训方法,利用他们的推理能力来确保他们遵守安全和对齐指南。

通过对越狱模型进行用户测试来衡量安全性。在最难越狱的测试之一中,GPT-4o得分为22(0到100分),而o1预览版得分为84。

OpenAI表示,这些增强的推理能力对于解决科学、编码、数学和类似领域的复杂问题非常有用。

例如,o1可用于医疗保健研究人员注释细胞测序数据,物理学家生成量子光学所需的复杂数学公式,以及所有领域的开发人员构建和执行多步骤工作流程。

o1系列擅长准确生成和调试复杂代码。

为了向开发人员提供更高效的解决方案,OpenAI还发布了OpenAI o1-mini,这是一种更快、更便宜的推理模型,在编码方面特别有效。

作为一个较小的模型,o1 mini比o1预览版收费便宜80%,使其成为需要推理但不需要广泛知识的应用程序的强大、经济高效的模型。

从今天开始,ChatGPT Plus用户可以在ChatGPT中访问o1模型。

模型选择器允许您手动选择o1预览和o1-mini。在发布时,o1预览的每周速率限制为30条消息,o1 mini为50条消息。

OpenAI还致力于提高这些速率,并使ChatGPT能够自动为给定的提示选择正确的模型。

有资格使用API第5层的开发人员今天可以开始在API中使用这两个模型进行原型设计,速率限制为20 RPM。

这些模型的API目前不包括函数调用、流、对系统消息的支持和其他功能。

OpenAI还计划为所有ChatGPT Free用户提供o1 mini访问权限。

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/1223666.html
0
随机主题
沃尔沃德国发布新的Polestar工程限量版XC60 SUV和S60轿车春秋美女西施的神秘归宿辛芷蕾实力和运气并存,玩套圈一次套中大奖,抽签直接欧皇附体今年荔枝让人“高攀不起”? 整体减产, 妃子笑已经降价乌军7天阵亡近1万人, 俄军杀入恰索夫亚尔城内, 所到之处全炸平1957年毛主席去看望儿子,闲聊间毛岸青想到一事:爸爸你说怪不怪南海交锋, 外军4打2, 解放军战机遭火控雷达锁定, 现场惊心动魄英国防大臣宣称继续援乌6年,“拖垮俄罗斯”英国惊天丑闻曝光,美西方信用彻底崩塌!如果你现在连五千块都拿不出,一定要看这条视频《闯关东》: 看懂朱传武对朱家的报复, 才知鲜儿被他利用得有多狠辽宁三连冠! 500万大咖怒喷: 这是中国篮球的耻辱和悲哀前总监: 拜仁结构混乱始于8000万签卢卡斯, 现队中太多高薪平庸者小马科斯现身军校, 连放狠话, 终于对中国籍船员出手, 国防部正告开国大将陈赓有5个子女, 他们如今过得如何? 三个儿子是少将深蓝CEO称在电动化的浪潮下 硬派的燃油时代结束了《艾尔登法环 黄金树幽影》宣传视频来了, 交界地世界观拓展了!欧盟的建设在三月份按月下降了0.1%宝马“最美”轿跑, 软顶敞篷+无边框车门+水晶挡把, 还有混动系统闻名全国的计划生育先进县,如今却成老人县,花甲之年还在工作权威确认! “菜鸟主帅”将正式接手拜仁! 10球15助天才攻击手来投
最新回复(0)