一则斯坦福大学Llama3-V团队抄袭清华系大模型的消息,近日引发热议。北京时间4日凌晨,该团队的两名成员在社交媒体上对这一学术不端行为公开致歉,并表示会将Llama3-V模型悉数撤下。
据悉,两人是斯坦福大学计算机科学专业的本科生,自称在团队中的角色是模型推广,而负责该项目代码编写的是毕业于南加利福尼亚大学Mustafa Aljadery。事发后,他们要求Mustafa提供原创性证明和训练代码,但未取得任何证据。
南都记者尝试联系率先发现清华系模型被套壳的网友,他表示只是做了一名开源社区工作者应该做的事。此次Llama3-V的抄袭行为,“相当于把可口可乐换成可日可乐就说是自己的项目”。
斯坦福大学AI团队发布模型被指抄袭
事情起源于5月29日,斯坦福大学AI团队发布Llama3-V开源模型,称它比当前开源SOTA视觉语言模型LLaVA的性能提高了10%-20%,不仅尺寸比GPT-4V小近99%,而且性能比肩GPT-4V、Gemini Ultra与Claude Opus。
更重要的是,该大模型的训练成本仅不到500美元。这一惊艳的成果,再加上3位作者出色的专业和技术研发背景,让Llama3-V一经发布就引发各方关注,并一度登上全球最大的开源大模型社区HuggingFace趋势榜第五位。
不过很快,质疑声便出现。6月2日下午,网友Magic Yang称发现了一个令人震惊的事实:Llama3-V项目中有大量疑似抄袭MiniCPM-Llama3-V 2.5的内容,同时晒出了多项涉嫌抄袭的证据。
比如在模型结构和配置文件上,二者高度雷同,只是变量名不同。Llama3-V的代码也几乎完全照抄MiniCPM-Llama3-V 2.5,仅做了一些重新格式化和变量重命名,包括但不限于图像切片、分词器、重采样器、数据加载等变量。
GitHub项目信息显示,MiniCPM-Llama3-V2.5共有8B个参数,整体性能超越GPT-4V-1106、GeminiPro、Qwen-VL-Max和Claude3等专有模型,配备了增强的OCR和指令跟踪能力,还可以支持英语、中文、法语等30多种语言的多模态对话。这款端测多模态开源模型,由清华大学自然语言处理实验室与面壁智能合作开发,于今年5月20日推出。
对话打假者:发现抄袭不难证实不易
南都记者尝试联系这位揭露Llama3-V涉嫌抄袭的网友MagicYang(知乎网名“社恐患者杨老师”),他向南都记者回顾了这场打假的过程。杨老师表示,最近正在帮助一名博士生做有关运动处方的项目,想选择一个质量较好的开源模型作为微调的基座。此前他曾测试了MiniCPM-Llama3-V2.5,因此对MiniCPM的模型架构和代码都相对熟悉。
后来他注意到,Llama3-V项目在HuggingFace上排名非常靠前,且获得了相关博主推荐,于是想进一步做测试。但在这过程中,他发现二者在模型架构和代码上存在高度相似的情况,就此询问了Llama3-V作者。结果对方避重就轻,并不正面回应,随后更是将质疑帖子删除,且隐藏了MiniCPM-Llama3-V2.5的项目主页。
这一系列的操作,令人生疑。6月2日下午,杨老师把所知的证据发到MiniCPM-V的Github项目主页,并提醒面壁智能团队关注。相关对话截图显示,Llama3-V项目作者最初否认抄袭,并称他们的项目开始时间更早,只是使用了MiniCPM-V2的分词器。
杨老师告诉南都记者,作为一个有大模型经验的开发者,发现(抄袭行为)不难,但要证实不易。此事最终一锤定音,还是因为面壁智能团队使用内部数据集“清华简”做了对比测试。
“连错的都一模一样”,确信是套壳
6月2日深夜,面壁智能团队证实了抄袭行为的存在。经核实,除了社区网友列出的证据外,还发现Llama3-V项目与MiniCP-Llama3-V 2.5一样,可以识别出“清华简”战国古文字,“不仅对的一模一样,连错的都一模一样”。
据面壁智能首席科学家、清华大学长聘副教授刘知远介绍,“清华简”的识别能力,是MiniCPM-Llama3-V2.5研发时内置了一个彩蛋。这是该团队花费数月从清华简逐字扫描,人工标注而来的数据集,并未公开,由此“已经比较确信Llama3-V是对MiniCPM-Llama3-V2.5套壳。”
针对此事,面壁智能CEO李大海也发文称,深表遗憾。“技术创新不易,好的成果希望被更多人关注和认可,但不是以这种方式。”李大海呼吁,大家共建开放、合作、有信任的社区环境。
刘知远也表示,人工智能的飞速发展离不开全球算法、数据与模型的开源共享,让人们始终可以站在SOTA(意为“最新技术”的最佳状态)的肩上持续前进。“开源共享的基石是对开源协议的遵守,对其他贡献者的信任,对前人成果的尊重和致敬,Llama3-V团队无疑严重破坏了这一点。”同时他提到,Llama3-V团队的3位作者中,有两位是斯坦福大学本科生,未来还有很长的路,“如果知错能改,善莫大焉”。
北京时间4日凌晨,卷入此次风波的两名斯坦福大学本科生在社交平台上解释,称该项目由3人发布,他们只在其中帮忙推广模型,负责代码编写的是MustafaAljadery。事发后,他们曾尝试联系Mustafa发布原创性声明,并提供训练代码,但到目前为止还未看到任何证据。在这份联合声明中,两人再次向原作者道歉,并称对未尽职尽责确保Llama3-V的独创性而感到失望,现已将所有对Llama3-V的引用都删除了。
被推为主要责任方的Mustafa,是团队中唯一的全职成员。其本硕毕业于南加利福尼亚大学,主攻深度学习和数学,是一名软件工程师。截至目前,Mustafa尚未发声。
两名作者的解释,尚不能平息质疑。斯坦福人工智能实验室主任Christopher David Manning公开发文谴责这一抄袭行为,称两人借口推脱,是拒不认错的表现。
面壁智能核心团队来自清华NLP实验室
此次被牵涉进抄袭风波中的面壁智能创立于2022年8月,团队的核心成员来自清华大学自然语言处理与社会人文计算实验室(THUNLP)——该实验室也撑起了去年大模型创业浪潮以来的“半壁江山”,跑出了生数科技、深言科技等人工智能企业和华为的“盘古大模型”。
今年4月,南都记者从面壁智能方面获悉,该公司已完成了新一轮数亿元融资,该轮次融资由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,而知乎作为战略股东持续跟投支持。据悉,该轮融资将用于人才引入、大模型底层算力与数据基础的建构以及推动大模型高效训练和应用落地。
后续进展
6月5日,面壁智能发布消息称,作为开源社区的贡献者和受益者,面壁智能,OpenBMB&清华NLP实验室认真讨论决定,将面壁“小钢炮”MiniCPM免费商用。即日起,MiniCPM和MiniCPM-V权重将对学术研究完全开放,并且企业、个人在填写问卷登记后亦允许商业使用,社区使用MiniCPM系列模型需要遵循Apache2.0和《MiniCPM模型社区许可协议》。
【市场回顾】 美股三大指数集体收跌 美股三大指数16日全线走低
2025-09-17微软,英国,投资21世纪经济报道记者孔海丽北京报道 “兴哥(王兴)我很尊重,(王)莆中我也很赞赏,企业家不应该变成仇人,我们民营企业都简单点,不要把正常商业竞争变成个人恩怨
2025-09-17京东,政企业务,服务南方财经9月17日电,奇瑞汽车在港交所公告,拟发行约2.97亿股H股(视乎超额配股权行使与否而定),定价区间为27.75至30.75港元,拟于9月23日完成定价。预期股票将于9月25日在港交所开始交易
2025-09-17奇瑞汽车,定价,30.75“‘金九’(项目成交情况)有明显的回温,跟最近股市行情也有很大关联性”。近日上证指数经过持续上探,一度逼近3900点,创下近十年新高,深证成指盘中突破13000点,达到三年多来的最高水平。 部分在股市获利的资金,开始转向楼市
2025-09-17成交,广州,楼盘美国与印度的紧张贸易关系突传缓和信号。 据最新消息,美国与印度于当地时间9月16日在新德里重启新一轮双边贸易协议谈判。但印度方面对此持谨慎乐观态度,暗示需要采取更多措施来重塑两国关系。 在此之前,特朗普政府决定对印度进口产品征收50%关税
2025-09-17印度,贸易,美国据国新网发布,今起连续三天,国新办将举办三场重要发布会
2025-09-172025,高质量,十四五OpenAI发布GPT-5-Codex 当地时间9月15日,OpenAI推出新模型GPT-5-Codex,该模型在Codex CLI、IDE扩展、网页端、移动端以及GitHub代码审查中均可使用
2025-09-17人工智能,消费,产业Alphabet旗下无人驾驶技术公司Waymo宣布,已获得在旧金山国际机场开始测试其自动驾驶出租车(robotaxi)的许可。Waymo将与机场合作,分阶段推出其商业自动驾驶出租车服务
2025-09-17机场,无人驾驶,测试乘联分会崔东树:8月末全国乘用车行业库存316万辆、库存42天环比降4天 9月15日,乘联分会秘书长崔东树发文表示,2025年8月月末全国乘用车行业库存316万辆,较上月下降13万辆
2025-09-17鸿蒙,库存,现代汽车南财智讯9月17日电,奕东电子公告,控股股东、实际控制人的一致行动人王刚、奕孚投资、奕合投资、奕萃投资、奕宁投资计划自2025年10月16日至2026年1月15日
2025-09-17公司,股份,奕东电子南财智讯9月17日电,天地数码公告,持股5%以上的股东升华集团控股有限公司及其一致行动人钱小妹女士计划在未来三个月内(2025年10月16日至2026年1月15日)通过集中竞价交易和/或大宗交易的方式减持公司股份不超过447.33万股
2025-09-17公司,股份,减持南财智讯9月17日电,万向钱潮公告,公司股票在2025年9月15日、9月16日连续两个交易日内收盘价格涨幅偏离值累计达到20.01%,根据《深圳证券交易所交易规则》的规定,属于股票交易异常波动
2025-09-17公司,投资者,信息随着股指不断走高,部分投资者有了“恐高”情绪,转而开始关注低价股。其实低价股并不一定更安全,其业绩或者经营反而可能存在各种问题,投资者应警惕其中的投资风险。 除个别特殊行业以外,低价股之所以价格低,往往是因为它们的基本面存在一定的问题
2025-09-17低价股,退市,投资者南财智讯9月17日电,晶合集成公告,非独立董事朱才伟先生因公司治理结构调整,于2025年9月16日申请辞去非独立董事职务,但将继续担任公司董事会秘书、财务负责人、副总经理等职务。公司通过职工代表大会选举朱才伟先生为第二届董事会职工代表董事
2025-09-17朱才伟,晶合集成,非独立董事南方财经9月17日电,首程控股9月17日在港交所公告,近日,集团所属首程资本旗下公司(公司之全资附属公司)所管理的北京首大兴业股权投资中心(有限合伙)投资微分智飞(杭州)科技有限公司。本次投资是继2025年5月投资之后的追加投资
2025-09-17首程控股,智飞,投资南财智讯9月17日电,普冉股份公告,公司股票交易连续3个交易日内(2025年9月12日、2025年9月15日、2025年9月16日)收盘价格涨幅偏离值累计超过30%,属于股票交易异常波动情形
2025-09-17公司,投资者,信息在主营业务面临盈利压力的背景下,捷强装备(SZ300875,股价45.30元,市值45.23亿元)选择跨界并购,将目光投向了炙手可热的新材料领域
2025-09-17山东,捷强装备,公司南方财经9月17日电,羚邦集团9月17日在港交所公告,于2025年8月8日在日本成立一间新子公司Medialink Japan株式会社
2025-09-17知识产权,日本,子公司南财智讯9月17日电,万集科技公告,刘会喜计划在2025年10月16日至2026年1月15日期间,通过集中竞价或大宗交易方式减持公司股份不超过38.5873万股,占公司总股本的0.1810%。减持原因为个人自身资金需求
2025-09-17公司,万集科技,股份南财智讯9月17日电,中关村科技租赁(01601.HK)发布须予披露交易公告,公司与地上铁绿色科技(深圳)股份有限公司及其9家附属公司签订10份融资租赁协议
2025-09-17中关村科技租赁,交易,公司在智慧牧场里,每头奶牛都拥有一张“数字身份证”;智能工厂内,AI技术赋能自动化生产线,生产和管理效率不断提升;消费端上,新品智能洞察系统让企业与消费者更加了解彼此……在位于内蒙古呼和浩特市的伊利现代智慧健康谷,记者看到
2025-09-16伊利,AI,阿里云游戏概念板块指数日K线图张大伟制图 ◎记者徐蔚 9月15日,A股三大指数高开后走势出现分化,早盘新能源两大龙头股宁德时代和阳光电源创历史新高,带动创业板指盘中站上3100点
2025-09-16宁德时代,A股,储能宁德时代股价走势图张大伟制图 ◎记者王玉晴 9月15日,宁德时代A股股价盘中最高触及371.52元/股,一度超越2021年末的高点,引燃市场对“宁王回归”的关注
2025-09-16宁德时代,磷酸铁锂正极材料,龙蟠科技2016年,中国创新药行业仍以“快速跟进”(fast-follow)为主流,刚刚起步的和铂医药却反其道而行之,收购荷兰生物技术公司,搭建全人源抗体平台,将研发布局全球。 9年后的今天,这条“慢”路正迎来“快”的爆发
2025-09-16医药,王劲松,创新药证券时报记者叶玲珍 因筹划发行股份购买资产临时停牌后,新大正(002968)在9月15日盘后揭开收购事项面纱
2025-09-16新大正,公司,交易当地时间9月15日,委内瑞拉总统马杜罗在新闻发布会上表示,五周前,委内瑞拉遭到导弹舰艇、潜艇的威胁,面临被轰炸、入侵和占领的危机,美国对委内瑞拉的所作所为是侵略,而非单纯的局势紧张。这是美国对委司法与政治层面的侵略,完全基于借口和谎言
2025-09-16马杜罗,委内瑞拉,美国还得是深圳! 宝安签约量环比增长 67.6%,罗湖签约量环比增长 48.1%,龙岗签约量环比增长 40.0% 9 月 15 日,多个机构披露深圳 "95 新政 " 后的房地产成交数据
2025-09-16成交,二手房,成交量国家外汇管理局9月15日消息,国家外汇管理局日前发布《国家外汇管理局关于深化跨境投融资外汇管理改革有关事宜的通知》。通知包括深化跨境投资外汇管理改革、深化跨境融资外汇管理改革、优化资本项目收入支付便利化政策等三部分内容
2025-09-16购房,房地产,银行9月16日(星期二),今日报刊头条主要内容精华如下: 李成钢:中美就以合作方式妥善解决TikTok相关问题 减少投资障碍 促进有关经贸合作等达成了基本框架共识 中国商务部国际贸易谈判代表兼副部长李成钢15日说,过去两天
2025-09-16国家外汇管理局,外汇,管理大家好,今天是2025年9月16日星期二,欢迎来到今日投资机会! 投顾观点:关注连板
2025-09-16东方财富证券,关注,投顾