一则斯坦福大学Llama3-V团队抄袭清华系大模型的消息,近日引发热议。北京时间4日凌晨,该团队的两名成员在社交媒体上对这一学术不端行为公开致歉,并表示会将Llama3-V模型悉数撤下。
据悉,两人是斯坦福大学计算机科学专业的本科生,自称在团队中的角色是模型推广,而负责该项目代码编写的是毕业于南加利福尼亚大学Mustafa Aljadery。事发后,他们要求Mustafa提供原创性证明和训练代码,但未取得任何证据。
南都记者尝试联系率先发现清华系模型被套壳的网友,他表示只是做了一名开源社区工作者应该做的事。此次Llama3-V的抄袭行为,“相当于把可口可乐换成可日可乐就说是自己的项目”。
斯坦福大学AI团队发布模型被指抄袭
事情起源于5月29日,斯坦福大学AI团队发布Llama3-V开源模型,称它比当前开源SOTA视觉语言模型LLaVA的性能提高了10%-20%,不仅尺寸比GPT-4V小近99%,而且性能比肩GPT-4V、Gemini Ultra与Claude Opus。
更重要的是,该大模型的训练成本仅不到500美元。这一惊艳的成果,再加上3位作者出色的专业和技术研发背景,让Llama3-V一经发布就引发各方关注,并一度登上全球最大的开源大模型社区HuggingFace趋势榜第五位。
不过很快,质疑声便出现。6月2日下午,网友Magic Yang称发现了一个令人震惊的事实:Llama3-V项目中有大量疑似抄袭MiniCPM-Llama3-V 2.5的内容,同时晒出了多项涉嫌抄袭的证据。
比如在模型结构和配置文件上,二者高度雷同,只是变量名不同。Llama3-V的代码也几乎完全照抄MiniCPM-Llama3-V 2.5,仅做了一些重新格式化和变量重命名,包括但不限于图像切片、分词器、重采样器、数据加载等变量。
GitHub项目信息显示,MiniCPM-Llama3-V2.5共有8B个参数,整体性能超越GPT-4V-1106、GeminiPro、Qwen-VL-Max和Claude3等专有模型,配备了增强的OCR和指令跟踪能力,还可以支持英语、中文、法语等30多种语言的多模态对话。这款端测多模态开源模型,由清华大学自然语言处理实验室与面壁智能合作开发,于今年5月20日推出。
对话打假者:发现抄袭不难证实不易
南都记者尝试联系这位揭露Llama3-V涉嫌抄袭的网友MagicYang(知乎网名“社恐患者杨老师”),他向南都记者回顾了这场打假的过程。杨老师表示,最近正在帮助一名博士生做有关运动处方的项目,想选择一个质量较好的开源模型作为微调的基座。此前他曾测试了MiniCPM-Llama3-V2.5,因此对MiniCPM的模型架构和代码都相对熟悉。
后来他注意到,Llama3-V项目在HuggingFace上排名非常靠前,且获得了相关博主推荐,于是想进一步做测试。但在这过程中,他发现二者在模型架构和代码上存在高度相似的情况,就此询问了Llama3-V作者。结果对方避重就轻,并不正面回应,随后更是将质疑帖子删除,且隐藏了MiniCPM-Llama3-V2.5的项目主页。
这一系列的操作,令人生疑。6月2日下午,杨老师把所知的证据发到MiniCPM-V的Github项目主页,并提醒面壁智能团队关注。相关对话截图显示,Llama3-V项目作者最初否认抄袭,并称他们的项目开始时间更早,只是使用了MiniCPM-V2的分词器。
杨老师告诉南都记者,作为一个有大模型经验的开发者,发现(抄袭行为)不难,但要证实不易。此事最终一锤定音,还是因为面壁智能团队使用内部数据集“清华简”做了对比测试。
“连错的都一模一样”,确信是套壳
6月2日深夜,面壁智能团队证实了抄袭行为的存在。经核实,除了社区网友列出的证据外,还发现Llama3-V项目与MiniCP-Llama3-V 2.5一样,可以识别出“清华简”战国古文字,“不仅对的一模一样,连错的都一模一样”。
据面壁智能首席科学家、清华大学长聘副教授刘知远介绍,“清华简”的识别能力,是MiniCPM-Llama3-V2.5研发时内置了一个彩蛋。这是该团队花费数月从清华简逐字扫描,人工标注而来的数据集,并未公开,由此“已经比较确信Llama3-V是对MiniCPM-Llama3-V2.5套壳。”
针对此事,面壁智能CEO李大海也发文称,深表遗憾。“技术创新不易,好的成果希望被更多人关注和认可,但不是以这种方式。”李大海呼吁,大家共建开放、合作、有信任的社区环境。
刘知远也表示,人工智能的飞速发展离不开全球算法、数据与模型的开源共享,让人们始终可以站在SOTA(意为“最新技术”的最佳状态)的肩上持续前进。“开源共享的基石是对开源协议的遵守,对其他贡献者的信任,对前人成果的尊重和致敬,Llama3-V团队无疑严重破坏了这一点。”同时他提到,Llama3-V团队的3位作者中,有两位是斯坦福大学本科生,未来还有很长的路,“如果知错能改,善莫大焉”。
北京时间4日凌晨,卷入此次风波的两名斯坦福大学本科生在社交平台上解释,称该项目由3人发布,他们只在其中帮忙推广模型,负责代码编写的是MustafaAljadery。事发后,他们曾尝试联系Mustafa发布原创性声明,并提供训练代码,但到目前为止还未看到任何证据。在这份联合声明中,两人再次向原作者道歉,并称对未尽职尽责确保Llama3-V的独创性而感到失望,现已将所有对Llama3-V的引用都删除了。
被推为主要责任方的Mustafa,是团队中唯一的全职成员。其本硕毕业于南加利福尼亚大学,主攻深度学习和数学,是一名软件工程师。截至目前,Mustafa尚未发声。
两名作者的解释,尚不能平息质疑。斯坦福人工智能实验室主任Christopher David Manning公开发文谴责这一抄袭行为,称两人借口推脱,是拒不认错的表现。
面壁智能核心团队来自清华NLP实验室
此次被牵涉进抄袭风波中的面壁智能创立于2022年8月,团队的核心成员来自清华大学自然语言处理与社会人文计算实验室(THUNLP)——该实验室也撑起了去年大模型创业浪潮以来的“半壁江山”,跑出了生数科技、深言科技等人工智能企业和华为的“盘古大模型”。
今年4月,南都记者从面壁智能方面获悉,该公司已完成了新一轮数亿元融资,该轮次融资由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,而知乎作为战略股东持续跟投支持。据悉,该轮融资将用于人才引入、大模型底层算力与数据基础的建构以及推动大模型高效训练和应用落地。
后续进展
6月5日,面壁智能发布消息称,作为开源社区的贡献者和受益者,面壁智能,OpenBMB&清华NLP实验室认真讨论决定,将面壁“小钢炮”MiniCPM免费商用。即日起,MiniCPM和MiniCPM-V权重将对学术研究完全开放,并且企业、个人在填写问卷登记后亦允许商业使用,社区使用MiniCPM系列模型需要遵循Apache2.0和《MiniCPM模型社区许可协议》。
7月7日,知名充电宝品牌罗马仕进入为时半年停工停产的第一天。这场风暴始于前一日(7月6日)凌晨1点30分,一则突如其来的群通知:公司即日起停工6个月,仅保留处理产品召回的员工,其余全员停工
2025-07-08员工,公司,罗马钧崴电子7月7日晚间发布公告称,公司限售股份约346.63万股将于2025年7月10日解禁并上市流通,占公司总股本比例为1.3%
2025-07-08钧崴电子,346.63万,限售股据路透社报道,受去年夏天创纪录的高温天气影响,日本制作抹茶的原料茶碾茶今年减产,交易价格创新高。业内人士预计抹茶价格在创下新高后还会一路飙升。 碾茶是制作抹茶的原材料,它是一种初级蒸青茶,经粉碎加工后形成抹茶
2025-07-08抹茶,价格,日本必易微7月7日晚间发布公告称,截至本公告披露日,深圳市必易微电子股份有限公司股东苏州方广二期创业投资合伙企业(有限合伙)持有公司股份约714万股,占公司总股本的10.23%;股东苑成军持有公司股份约467万股,占公司总股本的6.69%
2025-07-08公司,投资者,市值管理7月7日,A股市场继续呈现分化态势,房地产等周期板块表现强势,而通信等科技板块则表现相对较弱,沪市跑赢深市。 全市场超3200只个股上涨,沪深两市全天成交额1.21万亿元,较上个交易日缩量2199亿元,显示市场交投活跃度有所下降
2025-07-08市场,反弹,短期每经AI快讯,有投资者在投资者互动平台提问:公司在互动平台有回复投资者,尚未开发固态钠离子电池材料,但此前已研发出钠电池正极材料,可用于固态钠离子电池,作为投资者建议公司管理层,目前钠电正极材料技术路线与固态电池材料技术路线存在关联性
2025-07-08钠电池,投资者,德创环保富创精密7月7日晚间发布公告称,公司第二届第十四次董事会会议于2025年7月7日在公司会议室以现场结合通讯方式召开。会议审议了《关于调整公司第二届董事会专门委员会委员的议案》等文件
2025-07-08富创精密,董事会会议,公司持续高温下,防暑祛暑药品成用户健康防护的必备物资。为助力用户健康度夏,美团买药在小暑当天上线了高温补贴活动
2025-07-08美团,外卖,京东每经AI快讯,有投资者在投资者互动平台提问:请问贵公司有GPMI电线生产技术或者量产GPMI电线没有? 通达股份(002560.SZ)7月7日在投资者互动平台表示,公司目前暂没有生产GPMI电线
2025-07-08通达股份,GPMI,投资者中欣氟材7月7日晚间发布公告称,本次以简易程序向特定对象发行股票相关事项已经公司2024年年度股东会授权公司董事会实施,并已经公司第六届董事会第二十次会议、第六届董事会第二十一次会议审议通过
2025-07-08中欣氟材,公司,董事会三木集团7月7日晚间发布业绩预告,预计2025年上半年归属于上市公司股东的净利润亏损1亿元~1.2亿元,同比由盈转亏。基本每股收益亏损0.2148元~0.2578元。上年同期基本每股收益盈利0.0159元
2025-07-08三木集团,亏损,净利润工业富联7月7日晚间发布业绩预告,预计公司2025年第二季度实现归属于母公司所有者的净利润约67.27亿元~69.27亿元,与上年同期相比,将上升约21.73亿元~23.73亿元
2025-07-08工业富联,公司,GPU兴业银锡7月7日晚间发布公告称,截至本公告披露日,股东兴业集团累计被冻结股份约3.63亿股
2025-07-08兴业银锡,兴业集团,3.63亿每经AI快讯,有投资者在投资者互动平台提问:董秘你好,请问贵公司供货小米汽车么? 超捷股份(301005.SZ)7月7日在投资者互动平台表示,公司为小米的合格供应商,间接供应快接插件和单向阀等产品
2025-07-08超捷股份,小米,供应商卓易信息7月7日晚间发布公告称,截至本公告披露日,江苏卓易信息科技股份有限公司员工持股平台宜兴中恒企业管理有限公司直接持有公司股份约394万股,占公司股份总数的3.25%。相关股份来源于公司首次公开发行前持有的股份及公司转增股份
2025-07-08公司,员工持股,股份中新社桔井7月7日电 (记者杨强)柬埔寨桔井湄公河特大桥合龙仪式当地时间7日在此间举行。该桥是中柬共建"一带一路"的最新成果。当地官员指出,这座大桥既是设施联通之桥,更是柬中民心相通的友谊之桥
2025-07-08湄公河,特大桥,柬埔寨每经AI快讯,有投资者在投资者互动平台提问:董秘您好,储能技术在能源行业的重要性日益凸显,为进一步了解贵司在储能领域的战略规划
2025-07-08储能,抽水蓄能,项目7月5日,离淘宝闪购7月2日启动500亿补贴仅仅三天:淘宝闪购官宣订单数超过8000万,其中非餐饮订单超过1300万,淘宝闪购日活跃用户已经超过2亿
2025-07-08闪购,订单,城市本报记者李静 一杯售价4元的冰鲜柠檬水,在去年一年间卖出超11亿杯,让蜜雪冰城股份有限公司(以下简称“蜜雪集团”)在竞争激烈的新茶饮市场脱颖而出,成为行业黑马
2025-07-08蜜雪集团,供应链,生产本报记者李昱丞 7月7日,深圳市道通科技股份有限公司(以下简称“道通科技”)发布2025年半年度业绩预告
2025-07-08道通科技,AI,智能充电根据最新公告,大华银行中国向富邦华一银行转让个人业务产品与服务已经完成
2025-07-08大华银行,富邦华一银行,中国7月7日晚间,特斯拉一度跌超8%。截至发稿,特斯拉报293.455美元/股,下跌近7%
2025-07-08马斯克,特朗普,美国在美上市韩国股票走低,韩国SK电信跌超7%,LG Display跌超6%
2025-07-08韩国SK电信,上市,韩国NO.1 “碳捕集第一股”首钢朗泽再次启动招股 7月7日,首钢朗泽(HK02553)刊发了补充招股章程。公司定于7月7日至10日招股,拟全球发售2015.98万股H股,每股发售价14.50~18.88港元,预期于7月15日正式挂牌上市
2025-07-08首钢朗泽,富卫集团,康耐特光学大家晚上好,继续关注美股的表现以及关税的最新消息。 美股下跌 7月7日晚间,美股三大指数下跌,道指持续跳水跌近400点,纳指、标普500指数跌幅均在0.7%左右。 消息面上,特朗普及高级内阁官员确认,关税将在8月1日生效,而不是7月9日
2025-07-08马斯克,特朗普,关税每经AI快讯,有投资者在投资者互动平台提问:中车时代电气IGBT制氢电源累计交付突破100台,如何理解该产品交付数量对公司的意义? 时代电气(688187.SH)7月7日在投资者互动平台表示,在IGBT制氢电源上
2025-07-08IGBT,时代电气,制氢近日,国家发展改革委、国家能源局等四部门联合印发《关于促进大功率充电设施科学规划建设的通知》,稳步构建布局合理、品质升级、技术先进的大功率充电基础设施体系,适时打造一批具有示范作用的大功率充电应用城市与高速走廊
2025-07-08充电设施,大功率,规划中核科技7月7日晚间发布公告称,公司第八届第十八次董事会会议于2025年7月7日在公司会议室以现场+视频表决形式召开。会议审议了《关于终止发行股份购买资产并募集配套资金暨关联交易事项的议案》等文件
2025-07-08中核科技,公司,募集配套资金棕榈股份7月7日晚间发布公告称,棕榈生态城镇发展股份有限公司监事会于2025年7月4日收到职工代表监事雷金友先生的书面辞职报告,雷金友先生因个人原因,申请辞去公司职工代表监事职务
2025-07-08雷金友,棕榈股份,棕榈生态城镇发展股份有限公司杭叉集团7月7日晚间发布公告称,杭叉集团股份有限公司子公司浙江杭叉智能科技有限公司拟以增资扩股方式收购关联方杭州昆霞投资管理合伙企业(有限合伙)、杭州巨星科技股份有限公司及其他转让方持有的浙江国自机器人技术股份有限公司99.23%股份
2025-07-08浙江国自机器人技术,杭叉集团,股份有限公司