360智脑7B参数大模型正式开源, 行业无需再“卷”长文本

猎云网2024-04-12 16:39:52 112

4月12日，三六零自研人工智能大模型360智脑7B参数模型正式开源，包括4K、32K、360K三种文本长度，现已上线Github开源社区（https://github.com/Qihoo360/360zhinao），在360K长度下，可支持50万字左右输入，三秒钟即可读完《三体》。经过与国内外同参数模型进行权威测评对比，该模型综合能力位居前三。除模型权重外，该模型的微调训练代码，推理代码等全套工具集也被一并开源，大模型相关开发者可做到“开箱即用”，大模型行业借此可正式告别“长文本内卷”。

目前，“长文本”已成为国产大模型技术突破点，受到行业普遍关注。据了解，360智脑此次开源的7B360k模型，为当前国产开源模型中文本长度最长。“定360K主要是为了讨个彩头”，此前，360集团创始人周鸿祎在与知名投资人朱啸虎的对谈中透露过该大模型的相关信息，并称自己相信开源的力量。

通过使用OpenCompass与国内外同参数模型进行对比，360智脑7B模型综合平均分可达到前三，在C-Eval、MMLU、HellaSwag、LAMBADA四个评测数据集上达到第一，充分反应出该模型在中英文知识和理解推理能力方面的能力。当前，百度“弱智吧”帖子中的问题已成为验证大模型智能性的重要参考，360智脑7B模型在相关评测中表现亮眼，侧面印证了该模型的逻辑推理能力。

360智脑7B与同级别参数大模型能力对比评测中位居前三

据了解，360智脑7B模型在技术实现上抛弃滑动窗口attention、跳跃attetion等有损压缩路线，采用的是超长文本的无损压缩技术。为了解决随着序列长度的增长，模型训练的复杂度平方增长的挑战，360智脑在训练长文本模型时采用了两阶段的方式进行，采用了ABF+继续预训练，以及有监督的微调加以解决，有效解决了长文本模型在训练长度和训练效率上的问题，实现了高效的长文本拓展方法。在训练效率提升之下，综合智能性多项指标测评，360智脑7B在同等参数规模的情况下拿到了国内最高分。此外，在英文原版360k大海捞针效果同样取得了98.27%的高分。

360智脑7B大模型LongBench长文本评测得分最高

相关人士称，360智脑7B等国产自研大模型的开源，使“长文本”成为大模型的标配，进而推动国内大模型的场景化落地，为大模型在应用层创新提供重要支撑。随着以360为代表的互联网大公司将自研大模型开源，中国大模型产业将获得进一步发展。

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益，请与本站联系，我们将及时更正、删除、谢谢。
https://www.414w.com/read/204006.html

随机主题

山东首富杀入新能源汽车领域, 魏桥集团誓要打造山东汽车品牌终结G1五连败! 独行侠自2021年以来首次赢下系列赛G1 新年创业加盟哪家强? 社区生鲜连锁品牌钱大妈有话说!多亏他们! 大桥被冲垮前61人安全转移迎接比糖果更甜的笑 6岁新疆女孩来浙修复唇腭裂什么时候买摩托车最划算?12.58万起售, 长城炮2.4T柴油版来了, 提供6MT/9AT可选成都: 6月起将对骑车看手机行为进行处罚无视美方停火敦促, 以色列空袭加沙, 80万难民被迫逃离美股三大指数集体收跌贵金属板块跌幅居前吞噬星空大改, 界中界血腥混战, 罗峰抱大腿, 雾大人杀疯了 1962年投资1000万美元，真实装备与军人协助拍摄，被封为二战电影封神之作！太巴适了哇, 成渝高速扩容重要节点迎喜讯, 改善沿途百姓出行条件 618不知道怎么入手数码产品? 这四款产品不容错过!世界女排联赛首周最佳阵容公布, 中国女排一入选球员出乎意料辽宁男篮客场胜新疆，大比分3比0 樱井政博: 为避免《大乱斗》浪费玩家时间, 曾移除游戏部分音效谢晖死活不换人! 王禹李申圆跑拉胯了贝里奇战犯级表现, 葛副总还是别上了蔡依林，王俊凯，再次同台五款好玩的动作角色扮演单机游戏哪些下载量高李彦宏: 中西方AI最大区别在应用, 抵达AGI时代还要十年以上

最新回复(0)