通义千问2.5版本发布: 超越GPT-4 Turbo, 成为当前最强中文大模型

中关村在线2024-05-09 11:07:00  94

阿里云正式发布了通义千问2.5版本,这款大模型的性能已经全面超越了GPT-4Turbo,并号称是当前最强的中文大模型。与此同时,通义千问最新的1100亿参数模型在多个基准测试中取得了最佳成绩,超过了Meta的Llama-3-70B,在开源领域成为了最强大的模型之一。

与之前的通义千问2.1版本相比,其理解能力、逻辑推理能力、指令遵循能力和代码处理能力分别提升了9%、16%、19%和10%。尤其值得一提的是,通义千问在中文理解方面持续领先业界,在权威基准OpenCompass上的得分已经追平了GPT-4Turbo,这是国产大模型首次取得如此出色的成绩。

除了通义千问2.5版本之外,阿里云还发布了一款最新开放源代码的大规模语言学习(MMLU)模型Qwen1.5-110B。该模型在多个基准测试中超过了Meta的Llama-3-70B模型,并在Huggingface推出的新一代开源大型语言学习排行榜OpenLLMLeaderboard上位列榜首。这证明了通义开源系列在业界拥有最高竞争力。

除此之外,通义还推出了多模态和专业能力模型。其中,视觉理解模型Qwen-VL-Max在多项多模态标准测试中超过了GeminiUltra和GPT-4V,并已在多家企业开始应用;而代码处理大模型CodeQwen1.5-7B则是Huggingface代码处理榜单中的佼佼者,并成为国内用户规模排名第一的智能编码助手通义灵码的基础。

自通义大模型问世以来,阿里云已经为其发展出了领先的文生图、智能编码、文档解析、音视频理解等能力。企业和开发者可以通过API调用、模型下载等方式接入通义服务,个人用户则可以从通义APP、官网和小程序免费使用通义全栈服务。

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/467707.html
0
最新回复(3)
  • 篮球关于科比2024-05-10 19:35
    引用3
    超越世界了吗
  • 真4味2024-05-10 12:23
    引用2
    还是希望可以出台业界公认的评价标准吧。评价标准也是进步的关键。
  • 机甲学学2024-05-09 18:55
    引用1
    哎,昨天是deepseek最强,前段时间是kimi最强,今天又是通义。。。。一个比一个能吹[敲打][敲打][敲打]