一则斯坦福大学Llama3-V团队抄袭清华系大模型的消息,近日引发热议。北京时间4日凌晨,该团队的两名成员在社交媒体上对这一学术不端行为公开致歉,并表示会将Llama3-V模型悉数撤下。
据悉,两人是斯坦福大学计算机科学专业的本科生,自称在团队中的角色是模型推广,而负责该项目代码编写的是毕业于南加利福尼亚大学Mustafa Aljadery。事发后,他们要求Mustafa提供原创性证明和训练代码,但未取得任何证据。
南都记者尝试联系率先发现清华系模型被套壳的网友,他表示只是做了一名开源社区工作者应该做的事。此次Llama3-V的抄袭行为,“相当于把可口可乐换成可日可乐就说是自己的项目”。
斯坦福大学AI团队发布模型被指抄袭
事情起源于5月29日,斯坦福大学AI团队发布Llama3-V开源模型,称它比当前开源SOTA视觉语言模型LLaVA的性能提高了10%-20%,不仅尺寸比GPT-4V小近99%,而且性能比肩GPT-4V、Gemini Ultra与Claude Opus。
更重要的是,该大模型的训练成本仅不到500美元。这一惊艳的成果,再加上3位作者出色的专业和技术研发背景,让Llama3-V一经发布就引发各方关注,并一度登上全球最大的开源大模型社区HuggingFace趋势榜第五位。
不过很快,质疑声便出现。6月2日下午,网友Magic Yang称发现了一个令人震惊的事实:Llama3-V项目中有大量疑似抄袭MiniCPM-Llama3-V 2.5的内容,同时晒出了多项涉嫌抄袭的证据。
比如在模型结构和配置文件上,二者高度雷同,只是变量名不同。Llama3-V的代码也几乎完全照抄MiniCPM-Llama3-V 2.5,仅做了一些重新格式化和变量重命名,包括但不限于图像切片、分词器、重采样器、数据加载等变量。
GitHub项目信息显示,MiniCPM-Llama3-V2.5共有8B个参数,整体性能超越GPT-4V-1106、GeminiPro、Qwen-VL-Max和Claude3等专有模型,配备了增强的OCR和指令跟踪能力,还可以支持英语、中文、法语等30多种语言的多模态对话。这款端测多模态开源模型,由清华大学自然语言处理实验室与面壁智能合作开发,于今年5月20日推出。
对话打假者:发现抄袭不难证实不易
南都记者尝试联系这位揭露Llama3-V涉嫌抄袭的网友MagicYang(知乎网名“社恐患者杨老师”),他向南都记者回顾了这场打假的过程。杨老师表示,最近正在帮助一名博士生做有关运动处方的项目,想选择一个质量较好的开源模型作为微调的基座。此前他曾测试了MiniCPM-Llama3-V2.5,因此对MiniCPM的模型架构和代码都相对熟悉。
后来他注意到,Llama3-V项目在HuggingFace上排名非常靠前,且获得了相关博主推荐,于是想进一步做测试。但在这过程中,他发现二者在模型架构和代码上存在高度相似的情况,就此询问了Llama3-V作者。结果对方避重就轻,并不正面回应,随后更是将质疑帖子删除,且隐藏了MiniCPM-Llama3-V2.5的项目主页。
这一系列的操作,令人生疑。6月2日下午,杨老师把所知的证据发到MiniCPM-V的Github项目主页,并提醒面壁智能团队关注。相关对话截图显示,Llama3-V项目作者最初否认抄袭,并称他们的项目开始时间更早,只是使用了MiniCPM-V2的分词器。
杨老师告诉南都记者,作为一个有大模型经验的开发者,发现(抄袭行为)不难,但要证实不易。此事最终一锤定音,还是因为面壁智能团队使用内部数据集“清华简”做了对比测试。
“连错的都一模一样”,确信是套壳
6月2日深夜,面壁智能团队证实了抄袭行为的存在。经核实,除了社区网友列出的证据外,还发现Llama3-V项目与MiniCP-Llama3-V 2.5一样,可以识别出“清华简”战国古文字,“不仅对的一模一样,连错的都一模一样”。
据面壁智能首席科学家、清华大学长聘副教授刘知远介绍,“清华简”的识别能力,是MiniCPM-Llama3-V2.5研发时内置了一个彩蛋。这是该团队花费数月从清华简逐字扫描,人工标注而来的数据集,并未公开,由此“已经比较确信Llama3-V是对MiniCPM-Llama3-V2.5套壳。”
针对此事,面壁智能CEO李大海也发文称,深表遗憾。“技术创新不易,好的成果希望被更多人关注和认可,但不是以这种方式。”李大海呼吁,大家共建开放、合作、有信任的社区环境。
刘知远也表示,人工智能的飞速发展离不开全球算法、数据与模型的开源共享,让人们始终可以站在SOTA(意为“最新技术”的最佳状态)的肩上持续前进。“开源共享的基石是对开源协议的遵守,对其他贡献者的信任,对前人成果的尊重和致敬,Llama3-V团队无疑严重破坏了这一点。”同时他提到,Llama3-V团队的3位作者中,有两位是斯坦福大学本科生,未来还有很长的路,“如果知错能改,善莫大焉”。
北京时间4日凌晨,卷入此次风波的两名斯坦福大学本科生在社交平台上解释,称该项目由3人发布,他们只在其中帮忙推广模型,负责代码编写的是MustafaAljadery。事发后,他们曾尝试联系Mustafa发布原创性声明,并提供训练代码,但到目前为止还未看到任何证据。在这份联合声明中,两人再次向原作者道歉,并称对未尽职尽责确保Llama3-V的独创性而感到失望,现已将所有对Llama3-V的引用都删除了。
被推为主要责任方的Mustafa,是团队中唯一的全职成员。其本硕毕业于南加利福尼亚大学,主攻深度学习和数学,是一名软件工程师。截至目前,Mustafa尚未发声。
两名作者的解释,尚不能平息质疑。斯坦福人工智能实验室主任Christopher David Manning公开发文谴责这一抄袭行为,称两人借口推脱,是拒不认错的表现。
面壁智能核心团队来自清华NLP实验室
此次被牵涉进抄袭风波中的面壁智能创立于2022年8月,团队的核心成员来自清华大学自然语言处理与社会人文计算实验室(THUNLP)——该实验室也撑起了去年大模型创业浪潮以来的“半壁江山”,跑出了生数科技、深言科技等人工智能企业和华为的“盘古大模型”。
今年4月,南都记者从面壁智能方面获悉,该公司已完成了新一轮数亿元融资,该轮次融资由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,而知乎作为战略股东持续跟投支持。据悉,该轮融资将用于人才引入、大模型底层算力与数据基础的建构以及推动大模型高效训练和应用落地。
后续进展
6月5日,面壁智能发布消息称,作为开源社区的贡献者和受益者,面壁智能,OpenBMB&清华NLP实验室认真讨论决定,将面壁“小钢炮”MiniCPM免费商用。即日起,MiniCPM和MiniCPM-V权重将对学术研究完全开放,并且企业、个人在填写问卷登记后亦允许商业使用,社区使用MiniCPM系列模型需要遵循Apache2.0和《MiniCPM模型社区许可协议》。
7月16日下午,2025湖北省人形机器人产业链对接会在第三届中国国际供应链促进博览会期间(简称“链博会”)举行
2025-07-18人形机器人,机器人,量产7月中旬,家居企业半年业绩预告密集披露。江山欧派、青龙管业、坚朗五金等公司相继发布净利润“由盈转亏”或亏损扩大的业绩预报。事实上,从业绩来看,诸多企业上半年业绩承压,净利润下滑甚至出现亏损,部分企业净利润下滑近七成
2025-07-18净利润,企业,行业继三家股份行获准筹建金融资产投资公司(即“AIC”)后,又一大行将携百亿资金入局——邮储银行拟出资100亿元发起设立中邮金融资产投资有限公司(暂定名,以下简称“中邮投资”),相关事项目前正待监管部门核准
2025-07-18金融资产投资,AIC,邮储银行筹划近2个月后,鸿铭股份(301105)重大资产重组终止。 7月17日晚,鸿铭股份公告终止筹划重大资产重组。 今年5月21日,公司公告,正在筹划以现金方式购买深圳市驰速自动化设备有限公司(以下简称“深圳驰速”)83%股权
2025-07-18公司,重大资产重组,鸿铭股份四度冲击资本市场的茶叶巨头八马茶业再次站在上市的十字路口。 7月17日,中国证监会国际合作司发布一则关于八马茶业股份有限公司(下称“八马茶业”)的《境外发行上市及境内未上市股份“全流通”备案通知书》
2025-07-18八马茶业,上市,备案|2025年7月18日星期五| NO.1 维立志博招股首日认购近179倍 7月17日,维立志博-B(HK02617)正式在港交所启动招股,招股截至7月22日,预计于7月25日在港交所挂牌上市
2025-07-18港交所,维立志博,公司当地时间7月17日,以色列总理内塔尼亚胡发布视频声明称,以色列将继续动用军事手段,执行其在叙利亚设定的两条“红线”
2025-07-18叙利亚,内塔尼亚胡,以色列寒武纪7月17日公告,调整2025年度向特定对象发行A股股票方案。调整后本次向特定对象发行股票募集资金总额不超过39.85亿元(含本数),扣除发行费用后的净额拟投资于面向大模型的芯片平台项目、面向大模型的软件平台项目及补充流动资金
2025-07-18寒武纪,股票,调整红星资本局7月17日消息,今日晚间,国内休闲食品龙头良品铺子(603719.SH)发布公告,宣布引入武汉国资——武汉金融控股(集团)有限公司旗下武汉长江国际贸易集团有限公司(下称"长江国贸")作为战略投资者,并成为公司未来新的控股股东
2025-07-18良品铺子,公司,国资人民财讯7月17日电,寒武纪(688256)7月17日晚间公告,调整2025年度向特定对象发行A股股票方案,调整后,本次向特定对象发行股票的股票数量不超过2091.75万股,募集资金总额不超过39.85亿元
2025-07-18寒武纪,股票,调整7月17日,零食巨头良品铺子(603719.SH,股价13.71元,市值54.98亿元)公告称,公司控股股东宁波汉意及其一致行动人良品投资与武汉长江国际贸易集团有限公司签署了股份转让协议
2025-07-18良品铺子,公司,国资7月17日晚,针对日前一些媒体刊载一篇题为《女律师十年体检未有“患癌风险”预警,确诊已是肾癌晚期》的文章,爱康集团发布情况说明
2025-07-18体检,爱康集团,爱康在“反内卷”的推动下,多晶硅期货再度爆发! 7月17日,多晶硅期货主力合约大涨7.49%,收盘报45700元/吨,创下该品种上市以来新高,市场看涨情绪高涨
2025-07-18主力合约,多晶硅,期货蓝鲸新闻7月17日讯(记者徐晓春)一个月前,陈珂如还在筹划通过上海元一成物科技有限公司(以下简称“元一成物”)入主金发拉比。一个月后,这笔控制权转让交易告吹
2025-07-18金发拉比,陈萍,陈珂每经AI快讯,7月17日,寒武纪(688256.SH)公告称,调整2025年度向特定对象发行A股股票方案
2025-07-18寒武纪,股票,调整中共住房和城乡建设部党组 召开理论学习中心组学习(扩大)会议 传达学习中央城市工作会议精神 7月17日,中共住房和城乡建设部党组召开理论学习中心组学习(扩大)会议,传达学习中央城市工作会议精神,研究住房城乡建设领域贯彻落实工作
2025-07-18城市,城市发展,工作7月17日晚间,聚光科技(300203.SZ)公告称,公司控股股东之一睿洋科技与中信证券的融资融券合约逾期违约,其所持公司部分股票预计将被中信证券强制平仓。被动减持数量不超过448.73万股公司股份,占公司总股本的1%
2025-07-18中信证券,聚光科技,公司金融反腐持续,两位银行人同日被查! 刘平燕曾被授予荣誉称号 据贵州省纪委监委派驻省农村信用社联合社纪检监察组、乌当区纪委监委7月17日消息:贵州省农村信用社联合社黔南审计中心原四级资深经理
2025-07-18贵州,中国工商银行,高亚林7月17日晚,贝因美(002570)公告称,控股股东浙江小贝大美控股有限公司(简称“小贝大美控股”)向金华市中级人民法院提出预重整申请。 这家持有贝因美12.28%股权的控股股东,其98.85%的持股已处于质押或冻结状态
2025-07-18贝因美,乳业,维维股份预亏依然是今年上半年房企业绩的主基调。 Wind数据显示,截至7月17日,A股已有67家房企发布2025年上半年业绩预告。其中,47家房企归母净利润出现不同程度的亏损,金地集团、华侨城、绿地控股等多家房企预计亏损额上限超过20亿元
2025-07-18房企,净利润,预计美国联合航空表示,空客A321XLR机型在2026年夏季之前不会投入机队
2025-07-18联合航空,A321,2026寒武纪(688256.SH)公告称,调整2025年度向特定对象发行A股股票方案
2025-07-18寒武纪,2025,芯片海伦钢琴(300329)7月17日晚公告称,公司实际控制人陈海伦、金海芬、陈朝峰正在筹划公司控制权变更相关事宜,可能导致公司控股股东及实际控制人发生变更。公司股票自7月18日开市起停牌,预计停牌时间不超过2个交易日
2025-07-18海伦钢琴,实际控制人,公司美股无人机概念走强,Palladyne AI涨超26%,Joby Aviation 涨超8%,Archer Aviation涨超6%
2025-07-18无人机,ArcherAviation,JobyAviation上证报中国证券网讯 7月17日晚,天宸股份发布2024年年度权益分派实施公告,公司拟以方案实施前的公司总股本686,677,113股为基数,每股派发现金红利0.015元(含税),共计派发现金红利10,300,156.70元
2025-07-18天宸股份,派发现金红利,股权登记日一款5块钱的大瓶汽水,能吸引国际巨头可口可乐、PE巨头KKR和资本市场接连“围观”,大窑汽水凭什么? 近期,饮料品牌大窑嘉宾饮品股份有限公司(以下简称“大窑汽水”)股权案再获新进展
2025-07-18KKR,大窑,饮料7月17日晚,有“国产奶粉第一股”之称的贝因美,其控股股东小贝大美控股(原“贝因美集团”)在遭遇持续债务危机后,迎来重大变化
2025-07-18公司,贝因美,小贝7月17日晚间,建设银行发布公告称,该行董事会于当日在北京以现场会议方式召开,同意聘任雷鸣担任副行长,待国家金融监督管理总局核准其任职资格后履职
2025-07-18建设银行,雷鸣,副行长大家好,今晚继续关注海外市场的表现。 美国上涨 多家科技巨头股价创新高 7月17日晚间,美股上涨,受到最新经济数据和一系列企业财报的提振
2025-07-18特朗普,鲍威尔,美联储中国人民银行定于2025年7月25日发行大运河金银纪念币一套。该套纪念币共9枚,其中金质纪念币1枚,银质纪念币8枚,均为中华人民共和国法定货币。 大运河金银纪念币正面图案均为中华人民共和国国徽,并刊国名、年号
2025-07-18纪念币,大运河,面额