阿里云发布通义千问2.5, 性能全面赶超GPT-4 Turbo

媒体训练营2024-05-09 11:07:31 119

媒体训练营讯，5月9日消息，阿里云正式发布通义千问2.5，模型性能全面赶超GPT-4 Turbo，成为地表最强中文大模型。同时，通义千问最新开源的1100亿参数模型在多个基准测评收获最佳成绩，超越Meta的Llama-3-70B，成为开源领域最强大模型。

相比通义千问2.1版本，通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%，中文能力更是持续领先业界。在权威基准OpenCompass上，通义千问2.5得分追平GPT-4 Turbo，是该基准首次录得国产大模型取得如此出色的成绩。

通义还发布了最新款开源模型，1100亿参数的Qwen1.5-110B，该模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型；在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上，Qwen1.5-110B冲上榜首，再度证明通义开源系列业界最强的竞争力。

通义的多模态模型和专有能力模型也具备业界顶尖影响力。通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越Gemini Ultra和GPT-4V，目前已在多家企业落地应用；通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的头名选手，还是国内用户规模第一的智能编码助手通义灵码的底座。

通义大模型问世一年多来，还发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力，企业客户和开发者可以通过API调用、模型下载等方式接入通义，个人用户可从通义APP、官网和小程序免费使用通义家族全栈服务。

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益，请与本站联系，我们将及时更正、删除、谢谢。
https://www.414w.com/read/453988.html

随机主题

所以你人生的第一台外设应该是？看不到武磊vs孙兴慜? 媒体人: 孙兴慜恐无法参加与中国队的比赛终结G1五连败! 独行侠自2021年以来首次赢下系列赛G1 中通客车“号令者”浮出水面, 暂停交易15日跌跌不休！“疫苗大王”，没了295亿舒淇宝格丽晚宴洞洞鞋穿出高级感梦幻西游：安东1093神器扇加盟夫子庙，曲阜冲2000万战神 700多能买到这么顶顶内存？阿斯加特联名华硕实测！五款车选谁毛病少? 星瑞、思域、凌度、艾瑞泽8、朗逸故障率横比长城回应4s店起火，理性看待，拒绝天团式解说 Faker喜提2个新皮肤! 姿态4连胜被终结, 小微笑怒喷MLXG: 没脑子 3950解禁之后a5还是这么能打？得了，预算不够的话还是选他把。迈从a5 “我来雄安了! ”全国35家80余位媒体代表走进雄安中国最长跨市“地铁”要来了你们觉得我这个车改成什么颜色比较适合？如果你们想洗车贴膜这些，这家店真的值得推荐 618不知道怎么入手数码产品? 这四款产品不容错过!两大集团应好好的反思为什么资金不来呢?好评如潮的3部韩国电影, 你若一部都没看过, 真的太可惜了森林狼大战独行侠! 李凯尔1分钟砍7分唐斯打铁麦克丹尼尔斯爆发两位老板组团买凯雷德V, 落地400万, 黑白双煞, 暴力美学淋漓尽致 12.99万? 奇瑞SUV“杀疯了”, 风云T9实车到店!

最新回复(0)