斯坦福 AI 团队被曝抄袭中国开源大模型背后, 这些信息更值得关注

风云圈科学2024-06-09 15:41:38  60

听说了吗?斯坦福大学的AI团队最近可是闹了个大笑话!他们发布的“Llama3V”模型,原本想炫技一把,结果却被人发现跟中国一家公司的开源模型“MiniCPM-Llama3-V 2.5”长得一模一样,简直就是双胞胎啊!

这事儿在推特上可是炸开了锅,大家都在热议。斯坦福的团队赶紧出来解释,说他们只是用了对方的分词器,还坚称自己早就开始研究了。但网友们可不是那么好糊弄的,他们扒出了各种证据,说这“Llama3V”不仅是用了分词器,连架构、代码都一毛一样,简直就是赤裸裸的抄袭!也有网友认为,反向来看此事,是不是也能认为是一种变相的国际认可呢?

这下子,斯坦福的团队可真是颜面扫地了。大家纷纷指责他们不厚道,这么顶尖的大学怎么能做出这种事呢?这事儿也给我们提了个醒,知识产权可是大事儿啊!在AI这个领域里,大家都辛辛苦苦地研究、开发,成果可不能被轻易抄走了。

话说回来,斯坦福的这次抄袭事件也真是让人哭笑不得。他们原本想展示一下自己的实力,结果却弄巧成拙,成了大家嘲笑的对象。这简直是“偷鸡不成蚀把米”!甚至从另外一个角度可以做出这样的解释:一些有斯坦福大学和加州大学背景的草台班子,利用中美之间的信息差,抄袭了中国尖端研究团队的作品。

其实,自从ChatGPT闪亮登场以来,关于国内AI产业发展的讨论可谓是热火朝天。大家纷纷站队,分成了技术派和市场派。技术派的企业家们,总是以“相当于GPT-x.x”为标杆,拼命追赶甚至想超越美国的科技巨头。而市场派的PE/VC投资人们则觉得,OpenAI他们的突破已经足够说明问题了,咱们国内没必要在基础大模型上死磕,应该好好利用开源大模型,挖掘更多的应用场景。

这争论在过去一两年里还挺有道理的。但咱们中国现在可不一样了,有了足够的资源和基础,就像成年人一样,咱们可以不做选择,两条路一起走!

这不,技术派这边,月之暗面Kimi、幻方DeepSeek这些产品已经开始在美国崭露头角,引发了不小的关注。

而市场派这边,国内基于开源大模型的派生模型也是越来越牛,像MiniCPM-Llama3-V 2.5、Eurux-8x22B这些,都是基于强大的基础模型构建的,实力不容小觑。

可话说回来,无论是技术派还是市场派,未来都还有很长的路要走。技术派在实现了GPT-4o甚至GPT-5的技术能力后,如何培育开发工具链和应用生态,这可是个大挑战。而市场派的企业们,也得好好想想,开源大模型这顿免费午餐,能一直吃下去吗?

现在看来,开源大模型社区还挺和谐的,没受什么地缘因素的干扰。但长期依赖别人的基础模型,无异于把主动权拱手让人。更别提欧洲那边,特别是法国,在开源大模型原始创新上可是占据了重要位置。像Mixtral-8x22B这样的模型,就是法国初创企业Mistral AI的杰作。而Llama系列虽然名义上是Meta的,但开发团队主要在法国,人才和知识也主要在那儿流动。

斯坦福大学编制的《AI指数报告2024》也显示,在主要机器学习模型的“原产地”排名上,美、中、法已经占据前三。这格局啊,就像是一场“三国杀”,欧洲特别是法国的地位不容忽视。

所以如果国内AI产业继续奉行“拿来主义”,长期使用别人的基础模型,那可能会让欧洲在产业竞争中更加主动。毕竟除了基础模型,欧洲在高端算力上的便利性也远超咱们。

这事儿在某些方面来看,就像个警钟,提醒咱们国内AI产业界得好好努力了。随着国内AI大模型产业的迅速成长,对美国产业生态的“反作用力”也会越来越强。咱们得在多边博弈中稳中求进才行了。

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/693284.html
0
最新回复(0)