近日,斯坦福大学AI团队发布一款多模态大模型Llama3-V,声称其性能超越GPT-4V等其它知名模型。
然而,该模型却被曝光抄袭了中国面壁智能公司已发布的MiniCPM-Llama3-V 2.5模型,两者在模型架构与代码方面完全相同。
话说,这么离谱的吗?
尽管斯坦福团队最初仅承认使用了对方的分词器并否认整体抄袭,但进一步的调查和公众质疑揭示了更多的相似性,包括在Hugging Face导入并重命名的代码,以及模型对特定文本识别能力的相同之处。
面对无法辩驳的证据和日益加剧的舆论压力,该团队最终删除了相关项目资料库,并下架了所有相关项目。同时,Llama3-V团队也终于向面壁智能道歉,不过后来,这条回应也删掉了。
面壁智能的CEO李大海对此在社交平台上表达了自己的看法,虽然他认为这也是一种获得国际认可的途径,但他更希望大家以更加积极的方式关注他所在的公司。李大海强调了建立开放、合作和信任的社区环境的重要性。
至此,这场风波最终以双方的理解和支持而告一段落。
转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/651487.html