大模型领域,出现罕见一幕!
近日,斯坦福某AI团队(下称:斯坦福团队)被曝抄袭面壁智能开源成果,有“套壳”嫌疑:模型结构和代码“展现出惊人的相似度”。
针对此事,知乎CTO、面壁智能CEO李大海表示:我们对这件事深表遗憾!一方面感慨这也是一种受到国际团队认可的方式,另一方面也呼吁大家共建开放、合作、有信任的社区环境。
对于“抄袭”行为本身,面壁智能方面也给出了补充介绍。
李大海介绍到,“经过团队核实,除了社区网友列出的证据外,我们还发现Llama3V展现出和小钢炮一样的清华简识别能力,连做错的样例都一模一样,而这一训练数据尚未对外公开。这项工作是团队同学耗时数个月,从卷帙浩繁的清华简中一个字一个字扫描下来,并逐一进行数据标注,融合进模型中的。更加tricky的是,两个模型在高斯扰动验证后,在正确和错误表现方面都高度相似。”
事件始于5月29日,斯坦福团队发布Llama3V项目,并宣称500美元即可训练出一个多模态大模型,效果比肩GPT-4V、GeminiUltra、ClaudeOpus等。
凭借着低廉的价格、优秀的团队背景,上述模型发布的推文在X平台(推特)获得了较大关注。
大量关注下,随即被眼尖的网友发现,Llama3V项目与面壁智能最新发布的多模态模型MiniCPM-Llama3-V2.5“雷同”。
面对越来越多的抄袭“质疑”,斯坦福团队也从最初的“狡辩”,变成了“删库跑路”。至此,“抄袭”风波渐息。
转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/645773.html