斯坦福抄袭清华,世界一流大学实锤。
近期 AI 圈子里又闹出了一条大新闻,《斯坦福团队抄袭中国 AI !》
估计刚刚看到这个标题,许多人就像世超一样被蒙蔽了双眼。啊?看到花眼了吗?
哪一个斯坦福?确定没有反对?
你猜怎么样,这真的是真的。 QS 前五名的那个美国斯坦福。
不要说国内网友,业界大佬也无法绷紧,大呼时代变了。
准确地说,应该是斯坦福的一个。本科生团队,抄了清华博士生创业企业商品,即商品面壁智能的开源模型:MiniCPM-Llama3-V 2.5 小钢炮。
事情要从 5 月 29 号谈起。
这一天有两种斯坦福印度年轻人,还有一位佛祖( Siddharth 悉达多 )同名,世界上最大的 ai 开源社区—— HuggingFace 他们的大模型已经在上面发布了。 Llama-3-V 。
看着他们光鲜亮丽实习简历,另一个特斯拉也是如此 SpaceX 不久,网友们就把这个号称叫做这个。 " 500 刀子可以练成比肩 GPT-4V 、 Gemini Ultra " 后起之秀,顶部 HuggingFace 首页,文章访问量也是如此超出 30 万。
一开始可能有人会想:我是大美利坚江山人才。看,本科生可以做出和大厂相比的成绩。什么是世界一流?~
不久,有些眼尖的业内人士发觉不对劲,你这东西怎么看? 21 号那个 MiniCPM 小钢炮差不多,不会是抄袭吧,为什么不标注来源??
之所以别人丁真一眼鉴定为抄袭,主要是因为它声称体积小、性能强、模态多,很难不让人把它和清华的特点联系起来。 MiniCPM 对比。
但他又声明自己是原创的,没引用别人 MiniCPM 。
然而,面对他人的指责,这个大学生团队仍然是嘴硬,说 MiniCPM 是引用了 LLaVA-UHD 是的,我们也引用了这一点,读书人的事,那可以叫抄袭吗?真的是这样吗?装傻的天才。
问题是 MiniCPM 和 LLaVA-UHD 原来的样子早就不一样了,但是你这个 Llama3-V 的长相跟 LLaVA-UHD 不能说完全一样,至少没有任何关系。,但是和别人的小钢炮就像一个妈生。
等待放在一起仔细一看,好家伙,模型结构就算是和别人一样,也算了,环境变量怎么也一模一样。
再次看看代码,除了加点格式化,改了几个变量名,其它都没有什么不同,甚至清华。专门界定的特殊字符,您的代码没有变化。
更加有趣的是,一些网民发现了运行。 Llama3-V 当时,斯坦福团队提供的权重文档(微调用神经网络的参数 )不能跑,但是如果把变量名改成变量名, MiniCPM-Llama3-V 2.5 的,便会顺滑启动。
都锤成这样了,印度老哥还是一直都是这样,咬死不认。
不久,收到消息的面壁智能官方也结局开锤,表示 Llama3-V 这个项目的作者并不完全理解 MiniCPM-Llama3-V 2.5 结构,甚至还有他们不理解自己的代码。。
也就是说,还挺阴阳的, " 你们抄都没抄懂啊。 "
此外,面壁团队还甩出了一个雷神之锤的证据, Llama3-V 实际上可以识别清华简!
清华简是清华校友捐赠的重要文物,这是埋藏于东汉时代的竹简躲过了秦始皇。焚书,包含古代《尚书》在内的保存、秦代史料、医学哲学等极为珍贵的原始档案,简而言之,就是上古版《永乐大典》。
事实上,清华简识别是 MiniCPM-Llama3-V 2.5 研发时内置的彩蛋,所有的训练识别数据,都是面壁智能与清华大学合作,一字一句地扫描,从未公开。斯坦福团队无法获得这些完全私有的数据,但两种模型都可以识别,甚至可以识别。犯错的地方都是一模一样的。
答,删库跑路!
它们立即被删除 HuggingFace 上的 Llama3-V 模型,并且表示: " 非常感谢那些在评论中指出与之前的研究相似之处的人。我们意识到我们的结构非常类似于 OpenBMB 的 MiniCPM-Llama3-V 2.5 ,在推进方面,他们比我们好抢先一步。对于作者的原始模型,我们已经删除了。 "
没有,太多啊,还要点脸吗?
接着,它们又是光速滑跪道歉甩锅三连,说我们兄弟俩只是宣传推广,代码都是外包给另一个南加州大学的哥哥做到了,冤枉啊!
但是事情已经闹大了,丢脸儿。官方斯坦福大学他们的人工智能实验室主任谷歌也很快结束了。 Deepmind 的研究员 Christopher David Manning 直接发文开喷, " 典型的不承认自己的错误! "
并对 MiniCPM 这个中国开源模型表示赞赏。
而且被复制的面壁智能创始人刘知远,对他们说:“三个队伍中的两个也只是斯坦福大学的本科生,如果未来还有很长的路要走,知道错误就改变,善莫大焉。"
面壁 CEO 李大海还幽默地回应: " 我们对此深感遗憾。一方面,我们感叹这也是国际团队认可的一种方式;另一方面,我们呼吁创造一个开放、合作和可靠的社区环境。 "
" 希望团队的良好工作能得到更多人的关注和认可,但是没有这样做。 "
话虽如此,但是这次的事情确实让大家注意到,国内的事情, AI 好像也不是刻板印象中那样了。
连头大佬, Hugging Face 负责人 Omar Sanseviero 也表示,
" 社区一直忽略了中国机器学习生态系统的工作。他们正在制作一些有趣的大语言模型、视觉模型、音频和扩散模型令人惊奇的事情。 "
还提到了鹅厂混元大模型,以及最近爆红的模型。 ChatTTS
以此为主角面壁智能而且,虽然各大厂商( 谷歌安卓上个月 15 ,过两天苹果 iOS18 )他们都在手机上布局大模型,但是经过这次事件,大家发现这家中国企业,在这条赛道上也是如此。十分出色。
MiniCPM 不但体积小,只使用 2.4B 数据量可以达到数倍于其模型能力,不仅支持安卓系统,而且支持安卓系统,支持鸿蒙,推理做题都不会让步。
视觉识别能力也相当不错,特别是中文图像场景下,表现比 ChatGPT-4V 更好。
此外,面壁官方今天中午仍在正式宣布,「小钢炮」MiniCPM 决定免费公开!对于学术研究完全开放,单位和个人只需填写问卷注册后允许商业使用。
什麽是格局啊~( 战术后仰 )
世超认为,网友的确应该也应该是这样,改变一些偏见。许多人以前都认为,国产产品 AI 都是套壳 ChatGPT , 这个不行,那个不行,谢谢 XXX 开源。
不过,正如刘知远所说,尽管在国际领先模式面前仍有差距,但是中国的大模式已经从以前开始了。 nobody ,成长为了 AI 领取的关键推动者之一。
对这两个年轻人来说,希望你们耗子尾汁,别再耍这样的小聪明了。
发文:纳西
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




