通义千问发布 Qwen1.5-110B 首款超 1000 亿参数模型

文浩Marvin2024-04-30 11:37:17 114

近日，通义千问发布了 Qwen1.5-110B 模型，这是 Qwen1.5 系列中的新成员，也是该系列中首个参数超过 1000 亿的模型。

该模型在基础模型评估中表现出色，可与 Meta-Llama3-70B 相媲美。在聊天模型评估（包括 MT-Bench 和 AlpacaEval 2.0）中也展现出了优异的性能。

Qwen1.5-110B 模型支持多语言，包括英语、中文、法语、西班牙语等，其上下文长度可达 32K 令牌。

该模型具有以下特性：

架构

：采用 Transformer 解码器架构，具有分组查询注意力（GQA）。

性能

：在标准评估和聊天模型评估中均表现卓越。

多语言支持

：支持多种语言，上下文长度可达 32K 令牌。根据官方公布的评测结果，Qwen1.5-110B 模型的评测结果略略超过 Llama-3-70B 和 Mixtral-8×22B。在综合理解（MMLU）、数学推理（GSM8K 和 MATH）方面，Qwen1.5-110B 模型的得分比 Llama-3-70B 略高一点点，是几个模型中最强的。而在复杂推理任务 ARC-C 上则略低于 Mixtral-8×22B 模型。在编程测试 HumanEval 得分上，Qwen1.5-110B 模型远超另几个模型，但在 MBPP 编程测试上则低于 Mixtral-8×22B 模型。

可以看出，Qwen1.5-110B 模型在性能和多语言支持方面都具有显著优势，为人工智能领域的发展带来了新的突破。这也让我们对未来的人工智能应用充满期待。

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益，请与本站联系，我们将及时更正、删除、谢谢。
https://www.414w.com/read/373119.html

随机主题

15万预算, 卡罗拉, 还是亚洲龙?迪拜土豪14米长巨型豪车，奥尼尔看了都摇头！德甲保级推送: 波鸿VS杜塞尔多夫, 不败金身再添一局, 德甲升降机名不虚传!真正厉害的人在这方面做得都很“绝”众星转发“台湾不是一个国家”, 蔡依林等人沉默: 台湾艺人都哑巴了?生涯第4冠, 36岁韩德君退役? 谁注意郭艾伦喊话, 大韩举动感人立陶宛严厉谴责俄罗斯重新划定海上边界声明: 这是在发起混合战争 900元的2060大雕，比4060ti大一圈，满载就60度？彭于晏自述拍戏真实经历！“涌潮”之动影未来, 浙传这场毕业作品展面向社会公开亮相泽连斯基更换乌克兰安全保障谈判代表团成员关羽自尽前无奈说了14个字, 刘备听后无地自容, 张飞听后欲哭无泪解读京东内部大调整, 严抓出勤, 取消微信非工作群等没有社媒的小因扎吉通过妻子账号告别张康阳: 谢谢你米体: 两位独立董事将辞职, 马洛塔&安东内洛有望留在国米董事会显卡的销售日期和出厂日期区别青发控股集团: 贸易创新为高水平开放助力英国官员: 英国不能承受在贸易问题上“冷落”中国的代价索尼X90L看大片优秀，玩游戏过瘾四部门: 优化外商投资环境, 继续缩减外资准入负面清单客户生病，投保的保险没有理赔，去客户家道个歉

最新回复(0)