一则斯坦福大学Llama3-V团队抄袭清华系大模型的消息,近日引发热议。北京时间4日凌晨,该团队的两名成员在社交媒体上对这一学术不端行为公开致歉,并表示会将Llama3-V模型悉数撤下。
据悉,两人是斯坦福大学计算机科学专业的本科生,自称在团队中的角色是模型推广,而负责该项目代码编写的是毕业于南加利福尼亚大学Mustafa Aljadery。事发后,他们要求Mustafa提供原创性证明和训练代码,但未取得任何证据。

南都记者尝试联系率先发现清华系模型被套壳的网友,他表示只是做了一名开源社区工作者应该做的事。此次Llama3-V的抄袭行为,“相当于把可口可乐换成可日可乐就说是自己的项目”。
斯坦福大学AI团队发布模型被指抄袭
事情起源于5月29日,斯坦福大学AI团队发布Llama3-V开源模型,称它比当前开源SOTA视觉语言模型LLaVA的性能提高了10%-20%,不仅尺寸比GPT-4V小近99%,而且性能比肩GPT-4V、Gemini Ultra与Claude Opus。
更重要的是,该大模型的训练成本仅不到500美元。这一惊艳的成果,再加上3位作者出色的专业和技术研发背景,让Llama3-V一经发布就引发各方关注,并一度登上全球最大的开源大模型社区HuggingFace趋势榜第五位。
不过很快,质疑声便出现。6月2日下午,网友Magic Yang称发现了一个令人震惊的事实:Llama3-V项目中有大量疑似抄袭MiniCPM-Llama3-V 2.5的内容,同时晒出了多项涉嫌抄袭的证据。
比如在模型结构和配置文件上,二者高度雷同,只是变量名不同。Llama3-V的代码也几乎完全照抄MiniCPM-Llama3-V 2.5,仅做了一些重新格式化和变量重命名,包括但不限于图像切片、分词器、重采样器、数据加载等变量。
GitHub项目信息显示,MiniCPM-Llama3-V2.5共有8B个参数,整体性能超越GPT-4V-1106、GeminiPro、Qwen-VL-Max和Claude3等专有模型,配备了增强的OCR和指令跟踪能力,还可以支持英语、中文、法语等30多种语言的多模态对话。这款端测多模态开源模型,由清华大学自然语言处理实验室与面壁智能合作开发,于今年5月20日推出。
对话打假者:发现抄袭不难证实不易
南都记者尝试联系这位揭露Llama3-V涉嫌抄袭的网友MagicYang(知乎网名“社恐患者杨老师”),他向南都记者回顾了这场打假的过程。杨老师表示,最近正在帮助一名博士生做有关运动处方的项目,想选择一个质量较好的开源模型作为微调的基座。此前他曾测试了MiniCPM-Llama3-V2.5,因此对MiniCPM的模型架构和代码都相对熟悉。
后来他注意到,Llama3-V项目在HuggingFace上排名非常靠前,且获得了相关博主推荐,于是想进一步做测试。但在这过程中,他发现二者在模型架构和代码上存在高度相似的情况,就此询问了Llama3-V作者。结果对方避重就轻,并不正面回应,随后更是将质疑帖子删除,且隐藏了MiniCPM-Llama3-V2.5的项目主页。
这一系列的操作,令人生疑。6月2日下午,杨老师把所知的证据发到MiniCPM-V的Github项目主页,并提醒面壁智能团队关注。相关对话截图显示,Llama3-V项目作者最初否认抄袭,并称他们的项目开始时间更早,只是使用了MiniCPM-V2的分词器。
杨老师告诉南都记者,作为一个有大模型经验的开发者,发现(抄袭行为)不难,但要证实不易。此事最终一锤定音,还是因为面壁智能团队使用内部数据集“清华简”做了对比测试。
“连错的都一模一样”,确信是套壳
6月2日深夜,面壁智能团队证实了抄袭行为的存在。经核实,除了社区网友列出的证据外,还发现Llama3-V项目与MiniCP-Llama3-V 2.5一样,可以识别出“清华简”战国古文字,“不仅对的一模一样,连错的都一模一样”。
据面壁智能首席科学家、清华大学长聘副教授刘知远介绍,“清华简”的识别能力,是MiniCPM-Llama3-V2.5研发时内置了一个彩蛋。这是该团队花费数月从清华简逐字扫描,人工标注而来的数据集,并未公开,由此“已经比较确信Llama3-V是对MiniCPM-Llama3-V2.5套壳。”
针对此事,面壁智能CEO李大海也发文称,深表遗憾。“技术创新不易,好的成果希望被更多人关注和认可,但不是以这种方式。”李大海呼吁,大家共建开放、合作、有信任的社区环境。
刘知远也表示,人工智能的飞速发展离不开全球算法、数据与模型的开源共享,让人们始终可以站在SOTA(意为“最新技术”的最佳状态)的肩上持续前进。“开源共享的基石是对开源协议的遵守,对其他贡献者的信任,对前人成果的尊重和致敬,Llama3-V团队无疑严重破坏了这一点。”同时他提到,Llama3-V团队的3位作者中,有两位是斯坦福大学本科生,未来还有很长的路,“如果知错能改,善莫大焉”。
北京时间4日凌晨,卷入此次风波的两名斯坦福大学本科生在社交平台上解释,称该项目由3人发布,他们只在其中帮忙推广模型,负责代码编写的是MustafaAljadery。事发后,他们曾尝试联系Mustafa发布原创性声明,并提供训练代码,但到目前为止还未看到任何证据。在这份联合声明中,两人再次向原作者道歉,并称对未尽职尽责确保Llama3-V的独创性而感到失望,现已将所有对Llama3-V的引用都删除了。
被推为主要责任方的Mustafa,是团队中唯一的全职成员。其本硕毕业于南加利福尼亚大学,主攻深度学习和数学,是一名软件工程师。截至目前,Mustafa尚未发声。
两名作者的解释,尚不能平息质疑。斯坦福人工智能实验室主任Christopher David Manning公开发文谴责这一抄袭行为,称两人借口推脱,是拒不认错的表现。
面壁智能核心团队来自清华NLP实验室
此次被牵涉进抄袭风波中的面壁智能创立于2022年8月,团队的核心成员来自清华大学自然语言处理与社会人文计算实验室(THUNLP)——该实验室也撑起了去年大模型创业浪潮以来的“半壁江山”,跑出了生数科技、深言科技等人工智能企业和华为的“盘古大模型”。
今年4月,南都记者从面壁智能方面获悉,该公司已完成了新一轮数亿元融资,该轮次融资由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,而知乎作为战略股东持续跟投支持。据悉,该轮融资将用于人才引入、大模型底层算力与数据基础的建构以及推动大模型高效训练和应用落地。
后续进展
6月5日,面壁智能发布消息称,作为开源社区的贡献者和受益者,面壁智能,OpenBMB&清华NLP实验室认真讨论决定,将面壁“小钢炮”MiniCPM免费商用。即日起,MiniCPM和MiniCPM-V权重将对学术研究完全开放,并且企业、个人在填写问卷登记后亦允许商业使用,社区使用MiniCPM系列模型需要遵循Apache2.0和《MiniCPM模型社区许可协议》。
10月27日,中国证监会主席吴清在2025金融街论坛年会上,作了“发挥投融资综合改革牵引作用推动”十五五“资本市场高质量发展”的主题演讲
2025-10-28吴清,更加,资本市场
据报道,派拉蒙天舞公司(Paramount Skydance)将于周三裁减约1000个岗位
2025-10-281000,公司,岗位
27日,中国证监会印发《合格境外投资者制度优化工作方案》(简称工作方案),以优化准入管理、便利投资运作等为着力点,力争用两年左右的时间,推动落实优化合格境外投资者制度机制的改革举措,着力提升合格境外投资者制度的适应性和吸引力
2025-10-28境外投资者,外资,合格
据报道,美国能源部长赖特与AMD(AMD.O)首席执行官苏姿丰表示,美国已与AMD达成一项价值10亿美元的合作协议,计划建造两台超级计算机,用于解决从核能到癌症治疗再到国家安全等重大科学问题
2025-10-28AMD,超级计算机,美国
最新消息显示,英伟达和德国电信(Deutsche Telekom AG)正准备在德国建设一座价值10亿欧元(约合11.6亿美元)的数据中心
2025-10-28英伟达,数据中心,德国电信
走进云南白药集团智慧工厂,车间内各个环节的工业机器人自动有序运转,每天最多可生产约160万支牙膏。云南白药智慧工厂占地113亩、建筑面积8.9万平方米,可年产4.5亿支牙膏等产品
2025-10-28云南白药,智慧工厂,云南白药集团
美东时间周一,美股三大指数集体收涨,均续创新高。截至收盘,纳指涨1.86%,标普500指数涨1.23%,道指涨0.71%。 有报道分析,上周公布的通胀数据低于预期,对华尔街而言,这可能为美联储继续降息铺平道路,以提振放缓的就业市场
2025-10-28高通,涨幅,AI芯片
衡量美元对六种主要货币的美元指数当天下跌0.17%,在汇市尾市收于98.782。 截至纽约汇市尾市,1欧元兑换1.1650美元,高于前一交易日的1.1626美元;1英镑兑换1.3338美元,高于前一交易日的1.3304美元
2025-10-28美元,交易日,兑换
10月27日,香港证监会发布新闻稿称,香港原讼法庭在香港证监会提出的法律程序中,向12名涉嫌操纵环球智能控股有限公司股份(00395.HK)的人士发出临时强制令
2025-10-28鼎益丰,香港证监会,股份
国际贵金属期货大幅收跌超3%。COMEX黄金期货跌3.4%,报3997美元/盎司;COMEX白银期货跌3.61%,报46.83美元/盎司
2025-10-28贵金属,国际,盎司
上证报中国证券网讯(记者刘一枫)2025年是中国(安徽)自由贸易试验区(以下简称“安徽自贸试验区”)揭牌运行5周年。10月27日,安徽省政府新闻办举办新闻发布会,介绍五年来安徽自贸试验区建设情况
2025-10-28安徽,自贸试验区,试验区
标普道琼斯指数公司宣布,车美仕(CARMAX)将取代美国康纳斯公司,入选标普小型股600指数
2025-10-28车美仕,公司,标普道琼斯指数
当地时间周一(10月27日),矿业公司Perpetua Resources在官网宣布,其与Agnico Eagle和摩根大通达成协议,拟通过股权投资筹集2.55亿美元
2025-10-28摩根大通,Perpetua,Resources
美股市场:美股三大指数10月27日收盘全线上涨,齐创历史新高
2025-10-28上涨,涨幅,美元
近日,宁波市统计局发布2025年前三季度宁波市经济运行情况。根据全省地区生产总值统一核算结果,前三季度宁波地区生产总值13492.9亿元,按不变价格计算,同比增长5.0%
2025-10-28旅游,宁波,城市
美国法官驳回了针对苹果公司因iPhone应用程序反垄断市场控制而提起的集体诉讼
2025-10-28苹果,iPhone,俄罗斯
周一(10月27日)纽约尾盘(周二北京时间04:59),离岸人民币(CNH)兑美元报7.1093元,较上周五纽约尾盘涨168点——创8月28日(当天涨337点)以来最大单日涨幅,日内整体交投于7.1254-7.1027元区间
2025-10-28离岸人民币,尾盘,纽约
|2025年10月28日星期二| NO.1 广东连续7年成为第一生育大省 “广东发布”微信公众号10月27日消息,国家统计局编著出版的《中国统计年鉴2025》公布了2024年31个省份的人口出生率、死亡率和自然增长率数据
2025-10-28广东,生育,低空经济
美股三大指数集体收涨,均续创新高。纳指涨1.86%,标普500指数涨1.23%,道指涨0.71%。高通涨超11%,创2024年7月以来新高;公司推出人工智能芯片,在数据中心市场与英伟达展开竞争
2025-10-28苹果,谷歌,英伟达
文远知行在港交所公告,在港上市拟发行88,250,000股股份(视乎超额配售权行使与否而定)。除非另行公告,发售价将不超过每股发售股份35港元
2025-10-28文远知行,上市,股份
皖通高速(600012.SH,0995.HK)近日公告称,拟通过非公开协议转让的方式,受让山东高速集团有限公司(简称“高速集团”)持有的山东高速(600350.SH)7%股份,交易价格为每股8.92元,对价总额约30.19亿元
2025-10-27皖通高速,山东高速,高速公路
7月28日,天津移动TPU智算中心正式点亮,单位算力成本大幅降低;9月26日,摩尔线程首发申请成功过会,公司AI芯片产品的研发进度及商业化进程有望加快;10月11日,中国移动宣称
2025-10-27算力,天津,芯片
一桩溢价率高达282.89%的22.18亿元现金收购案,从签约到终止仅用了一个多月时间。功率半导体龙头企业扬杰科技(300373.SZ)近日突然宣告终止收购东莞市贝特电子科技股份有限公司(简称“贝特电子”,“标的公司”)100%股权
2025-10-27贝特电子,扬杰科技,公司
受业务量增加、营运效率提升等因素提振,河南易成新能源股份有限公司(简称“易成新能”,300080.SZ)经营业绩继续改善
2025-10-27公司,本次,项目
韩国首尔近郊的一家大型购物中心内,一家中国企业的扫地机器人专柜前人头攒动,带有机械臂功能的石头科技品牌扫地机器人吸引路人驻足
2025-10-27韩国,机器人,产品
“随着政策调整,今年中国风电步入全面市场化发展新阶段,如何应对电价和消纳波动带来的投资收益不确定性,成为目前企业面临的挑战。”远景能源风机与装备产品平台副总裁黄虎近日在接受《经济参考报》记者采访时表示
2025-10-27风电,新能源,制氢
爱奇艺高品质视听认证“帧绮映画MAX”实现全新突破,首次将投影仪设备纳入认证范围,并与海信、极米等行业领先品牌达成合作
2025-10-27MAX,爱奇艺,认证
赛力斯集团预计11月4日在港上市交易,招股价格不超过每股131.5港元
2025-10-27赛力斯集团,上市交易,131.5
现货黄金跳空低开后,现重新站上4100美元/盎司,跌幅缩窄至0.3%,此前一度跌1%
2025-10-27跳空低开,现货黄金,4100
WTI原油开盘涨0.72%,报61.945美元/桶;布伦特原油涨0.62%,报65.604美元/桶
2025-10-27WTI原油,美元,61.945