不到500美元训练出超水平大模型？

2024-06-17 07:43:50 A+A-

一则斯坦福大学Llama3-V团队抄袭清华系大模型的消息，近日引发热议。北京时间4日凌晨，该团队的两名成员在社交媒体上对这一学术不端行为公开致歉，并表示会将Llama3-V模型悉数撤下。

据悉，两人是斯坦福大学计算机科学专业的本科生，自称在团队中的角色是模型推广，而负责该项目代码编写的是毕业于南加利福尼亚大学Mustafa Aljadery。事发后，他们要求Mustafa提供原创性证明和训练代码，但未取得任何证据。

不到500美元训练出超水平大模型？

南都记者尝试联系率先发现清华系模型被套壳的网友，他表示只是做了一名开源社区工作者应该做的事。此次Llama3-V的抄袭行为，“相当于把可口可乐换成可日可乐就说是自己的项目”。

斯坦福大学AI团队发布模型被指抄袭

事情起源于5月29日，斯坦福大学AI团队发布Llama3-V开源模型，称它比当前开源SOTA视觉语言模型LLaVA的性能提高了10%-20%，不仅尺寸比GPT-4V小近99%，而且性能比肩GPT-4V、Gemini Ultra与Claude Opus。

更重要的是，该大模型的训练成本仅不到500美元。这一惊艳的成果，再加上3位作者出色的专业和技术研发背景，让Llama3-V一经发布就引发各方关注，并一度登上全球最大的开源大模型社区HuggingFace趋势榜第五位。

不过很快，质疑声便出现。6月2日下午，网友Magic Yang称发现了一个令人震惊的事实：Llama3-V项目中有大量疑似抄袭MiniCPM-Llama3-V 2.5的内容，同时晒出了多项涉嫌抄袭的证据。

比如在模型结构和配置文件上，二者高度雷同，只是变量名不同。Llama3-V的代码也几乎完全照抄MiniCPM-Llama3-V 2.5，仅做了一些重新格式化和变量重命名，包括但不限于图像切片、分词器、重采样器、数据加载等变量。

GitHub项目信息显示，MiniCPM-Llama3-V2.5共有8B个参数，整体性能超越GPT-4V-1106、GeminiPro、Qwen-VL-Max和Claude3等专有模型，配备了增强的OCR和指令跟踪能力，还可以支持英语、中文、法语等30多种语言的多模态对话。这款端测多模态开源模型，由清华大学自然语言处理实验室与面壁智能合作开发，于今年5月20日推出。

对话打假者：发现抄袭不难证实不易

南都记者尝试联系这位揭露Llama3-V涉嫌抄袭的网友MagicYang(知乎网名“社恐患者杨老师”)，他向南都记者回顾了这场打假的过程。杨老师表示，最近正在帮助一名博士生做有关运动处方的项目，想选择一个质量较好的开源模型作为微调的基座。此前他曾测试了MiniCPM-Llama3-V2.5，因此对MiniCPM的模型架构和代码都相对熟悉。

后来他注意到，Llama3-V项目在HuggingFace上排名非常靠前，且获得了相关博主推荐，于是想进一步做测试。但在这过程中，他发现二者在模型架构和代码上存在高度相似的情况，就此询问了Llama3-V作者。结果对方避重就轻，并不正面回应，随后更是将质疑帖子删除，且隐藏了MiniCPM-Llama3-V2.5的项目主页。

这一系列的操作，令人生疑。6月2日下午，杨老师把所知的证据发到MiniCPM-V的Github项目主页，并提醒面壁智能团队关注。相关对话截图显示，Llama3-V项目作者最初否认抄袭，并称他们的项目开始时间更早，只是使用了MiniCPM-V2的分词器。

杨老师告诉南都记者，作为一个有大模型经验的开发者，发现(抄袭行为)不难，但要证实不易。此事最终一锤定音，还是因为面壁智能团队使用内部数据集“清华简”做了对比测试。

“连错的都一模一样”，确信是套壳

6月2日深夜，面壁智能团队证实了抄袭行为的存在。经核实，除了社区网友列出的证据外，还发现Llama3-V项目与MiniCP-Llama3-V 2.5一样，可以识别出“清华简”战国古文字，“不仅对的一模一样，连错的都一模一样”。

据面壁智能首席科学家、清华大学长聘副教授刘知远介绍，“清华简”的识别能力，是MiniCPM-Llama3-V2.5研发时内置了一个彩蛋。这是该团队花费数月从清华简逐字扫描，人工标注而来的数据集，并未公开，由此“已经比较确信Llama3-V是对MiniCPM-Llama3-V2.5套壳。”

针对此事，面壁智能CEO李大海也发文称，深表遗憾。“技术创新不易，好的成果希望被更多人关注和认可，但不是以这种方式。”李大海呼吁，大家共建开放、合作、有信任的社区环境。

刘知远也表示，人工智能的飞速发展离不开全球算法、数据与模型的开源共享，让人们始终可以站在SOTA(意为“最新技术”的最佳状态)的肩上持续前进。“开源共享的基石是对开源协议的遵守，对其他贡献者的信任，对前人成果的尊重和致敬，Llama3-V团队无疑严重破坏了这一点。”同时他提到，Llama3-V团队的3位作者中，有两位是斯坦福大学本科生，未来还有很长的路，“如果知错能改，善莫大焉”。

北京时间4日凌晨，卷入此次风波的两名斯坦福大学本科生在社交平台上解释，称该项目由3人发布，他们只在其中帮忙推广模型，负责代码编写的是MustafaAljadery。事发后，他们曾尝试联系Mustafa发布原创性声明，并提供训练代码，但到目前为止还未看到任何证据。在这份联合声明中，两人再次向原作者道歉，并称对未尽职尽责确保Llama3-V的独创性而感到失望，现已将所有对Llama3-V的引用都删除了。

被推为主要责任方的Mustafa，是团队中唯一的全职成员。其本硕毕业于南加利福尼亚大学，主攻深度学习和数学，是一名软件工程师。截至目前，Mustafa尚未发声。

两名作者的解释，尚不能平息质疑。斯坦福人工智能实验室主任Christopher David Manning公开发文谴责这一抄袭行为，称两人借口推脱，是拒不认错的表现。

　面壁智能核心团队来自清华NLP实验室

此次被牵涉进抄袭风波中的面壁智能创立于2022年8月，团队的核心成员来自清华大学自然语言处理与社会人文计算实验室(THUNLP)——该实验室也撑起了去年大模型创业浪潮以来的“半壁江山”，跑出了生数科技、深言科技等人工智能企业和华为的“盘古大模型”。

今年4月，南都记者从面壁智能方面获悉，该公司已完成了新一轮数亿元融资，该轮次融资由春华创投、华为哈勃领投，北京市人工智能产业投资基金等跟投，而知乎作为战略股东持续跟投支持。据悉，该轮融资将用于人才引入、大模型底层算力与数据基础的建构以及推动大模型高效训练和应用落地。

　后续进展

6月5日，面壁智能发布消息称，作为开源社区的贡献者和受益者，面壁智能，OpenBMB&清华NLP实验室认真讨论决定，将面壁“小钢炮”MiniCPM免费商用。即日起，MiniCPM和MiniCPM-V权重将对学术研究完全开放，并且企业、个人在填写问卷登记后亦允许商业使用，社区使用MiniCPM系列模型需要遵循Apache2.0和《MiniCPM模型社区许可协议》。

(责任编辑：卢其龙 CN070)

热点推送

股票投资亏损有保险兜底？中保协：“安我股保”涉嫌以虚假保险产品为载体非法经营金融业务

股票投资亏损了有保险来兜底？不实！近期，市场上出现一家名为“安我股保”的互联网平台（及相关APP账号），该平台宣称推出名为“安我股保”的所谓“股票投资保险产品”
2025-11-27保险，中信证券，保险产品
拼体系比生态贴用户江淮汽车迈入智电融合新阶段

正在举行的第二十三届广州国际汽车展览会，展现了全球汽车产业加速向电动化、智能化转型的浪潮
2025-11-27江淮汽车，华为，汽车产业
矿业巨头力拓欲削减战线出售硼资产价值或高达20亿美元

知情人士透露，力拓预计将在未来两周内启动其加州资产的出售程序，买家很可能是私募股权公司或化工企业
2025-11-27力拓，铁矿石，美国
注浆不足桩长缩水福建一水库大坝建设被指偷工减料

福建省永安抽水蓄能电站是国家抽水蓄能“十四五”重点项目，《经济参考报》记者在福建省永安市调查发现，该电站在建的下水库工程，被指在大坝施工中存在严重偷工减料问题
2025-11-27施工，设计，永安
新航线带来新机遇

初冬时节，在天津港欧亚国际集装箱码头，巨大的岸桥缓缓移动，将最后一批集装箱稳稳装上“长胜”轮。几乎同时，在不远处的天津港太平洋国际集装箱码头，“迭戈”轮正驶离泊位。一天之内，天津港的两条新航线相继启航
2025-11-27港口，京津冀，航线
从各地“账本”看经济发展韧性

近期，各地陆续公布前三季度财政收支情况。翻开“账本”，可以看到，财政收入增幅逐步回升，税收收入稳步增长，为保障重点领域支出提供了坚实基础，有效兜牢了民生底线。同时，财政政策更加积极、接续发力，推动新质生产力加速成长、消费市场活力持续激发
2025-11-27增长，收入，预算
推动制造业数字化、智能化转型浙江台州壮大实体经济根基

近日，浙江台州市本土企业杰克科技股份有限公司发布了AI缝纫机“艾图Ai 10”及人形机器人，展现出台州在高端装备领域的创新实力。近年来，台州市把发展经济的着力点放在实体经济上，积极推动制造业数字化、智能化转型，持续巩固壮大实体经济根基
2025-11-27台州，实体经济，台州市
六部门发文！事关促消费；万科债券疑将展期；俄回应“和平计划”丨每经早参

1 隔夜市场美股三大指数集体收涨，道琼斯指数涨0.67%，标普500指数涨0.69%，纳斯达克综合指数涨0.82%。大型科技股多数上涨，甲骨文涨超4%，AMD涨超3%，英伟达、特斯拉、奈飞、微软涨超1%
2025-11-27中国，特斯拉，理想汽车
东方财富财经早餐 11月27日周四

每日精选消费促进政策：工业和信息化部等六部门印发《关于增强消费品供需适配性进一步促进消费的实施方案》
2025-11-27美元，公司，基点
三个“50%”两个“倍增” 上海科创中心建设跑出加速度

上海国际科创中心建设正以一系列亮眼指标数据，为“十四五”圆满收官定下基调
2025-11-27上海，2026，煤炭
构筑幼发拉底河畔“电力方舟”

清晨的阳光倾泻在伊拉克纳杰夫燃机电厂高耸的发电机组上，金色的光影在钢结构外壁上流动，映照着一个个忙碌的身影。在中企承建的燃机电厂联合循环扩建项目施工现场，中伊员工密切配合，紧锣密鼓地开展各项建设工作，在幼发拉底河畔携手共筑“电力方舟”
2025-11-27电力，伊拉克，项目
科技中国行·走进ETF成份股从拓荆科技看科创板50投资价值

11月19日，《经济参考报》记者与数十名中小投资者共同走进科创板企业拓荆科技，实地进行调研，并与公司相关负责人进行近距离交流。此次活动旨在畅通上市公司与投资者的沟通渠道，加强投资者关系管理、展现上市公司投资价值
2025-11-27科创板，拓荆科技，公司
11月27日国内四大证券报纸、重要财经媒体头版头条内容精华摘要

11月27日(星期四)，今日报刊头条主要内容精华如下：六部门发文增强消费品供需适配性 2027年形成3个万亿级消费领域和10个千亿级消费热点工业和信息化部11月26日消息，日前，经国务院同意
2025-11-27万亿，消费，消费品
马自达电动化突围：在“快”市场展现“慢”功夫

第二十三届广州国际汽车展览会以22万平方米的展区规模，汇聚了全球汽车产业的最新成果。在当前新能源汽车普遍聚焦性能参数与智能配置的背景下，长安马自达展台呈现出独特的产品逻辑，为观察产业转型提供了新的视角
2025-11-27中国，马自达，市场
冲击更高销量零跑完善产品矩阵

广州国际车展期间，零跑汽车正式发布全新A平台首款车型——零跑A10。这不仅标志着零跑完成A、B、C、D四大产品系列矩阵的最后一块拼图，更意味着品牌实现了主流细分市场的全面覆盖，正式进入规模化与全球化并进的新阶段
2025-11-27续航，高通，芯片
锚定AI汽车赛力斯加力布局智能化

广州国际车展上，赛力斯正式发布了面向AI驱动的智慧电动汽车平台“魔方技术平台2.0”，旨在加速布局智能化，以应对未来汽车市场的激烈竞争。相较于行业常见的“功能叠加”式升级，魔方技术平台2.0的核心突破在于其底层逻辑的转变
2025-11-27赛力斯，回购股份，回购
奇瑞豪华越野品牌进军高端市场

第二十三届广州国际汽车展览会共展出93辆全球首发新车、1085辆展车，其中新能源车型占比高达58%，标志着中国汽车产业正式进入电动化、智能化竞争的深水区
2025-11-27车企，中国品牌，中国
领克蜕变：从配置竞争转向价值竞争

作为行业风向标，正在举行的第二十三届广州国际车展不仅是电动化、智能化成果的集中展示平台，更成为中国汽车产业从“规模引领”迈向“价值引领”的重要观察窗口
2025-11-27中国品牌，竞争，赛事
拟现金收购毕棚沟公司34.30%股权天府文旅着力夯实冰雪旅游战略布局

历经多次战略转型、盈利状况仍面临挑战的天府文旅（000558.SZ）近日发布公告称，拟与阿坝大九寨旅游集团有限公司（简称“大九旅”）共同参与理县毕棚沟景区运营项目，两家公司拟现金收购理县毕棚沟旅游开发有限公司（简称“毕棚沟公司”）部分股权
2025-11-27天府文旅，公司，旅游
AI时代的“石油”怎能光“采”不“炼”？上海发力“数据治理2.0”

如果说数据是数字经济时代的“石油”，那么对这种新型生产要素而言，重要的已不是“开采”，而是如何高效“提炼”和利用
2025-11-27数据，数据要素，数据产品
国际油价25日下跌

国际油价25日下跌。截至当天收盘，纽约商品交易所1月交货的轻质原油期货价格下跌89美分，收于每桶57.95美元，跌幅为1.51%；1月交货的伦敦布伦特原油期货价格下跌89美分，收于每桶62.48美元，跌幅为1.4%
2025-11-26下跌，国际油价，原油
美元指数25日下跌

衡量美元对六种主要货币的美元指数当天下跌0.48%，在汇市尾市收于99.664。截至纽约汇市尾市，1欧元兑换1.1584美元，高于前一交易日的1.1528美元；1英镑兑换1.3213美元，高于前一交易日的1.3109美元
2025-11-26美元，交易日，兑换
道指涨幅扩大至1.5% 标普500指数涨超1%

截至目前，道琼斯指数涨1.52%，标普500指数涨1.01%，纳斯达克综合指数涨0.77%
2025-11-26标普500指数，纳斯达克综合指数，道琼斯指数
道指收涨1.4% 英伟达跌超2%

美股三大指数集体收涨，道琼斯指数涨1.43%，标普500指数涨0.91%，纳斯达克综合指数涨0.67%。大型科技股走势分化，Meta涨超3%，谷歌、亚马逊涨超1%；AMD跌超4%，英伟达、奈飞跌超2%，甲骨文跌超1%
2025-11-26英伟达，公司，美元
早读｜美国的和平协议乌克兰原则同意 “还有一些细节要解决”

§今日关注乌克兰原则同意美国提出的和平协议美国多家媒体25日援引相关官员表态报道，乌克兰已原则同意美国提出的和平协议，但仍有一些条款需要讨论
2025-11-26乌克兰，美国，俄罗斯
中国人保创新科技保险产品服务体系为高水平科技自立自强筑牢风险屏障

作为重要的金融工具，科技保险在分散创新风险、促进成果转化等方面发挥着关键作用。中国人民保险集团股份有限公司（简称“中国人保”）通过持续创新产品、完善服务体系、优化风险解决方案，为高水平科技自立自强和新质生产力发展提供坚实保障
2025-11-26中国人保，知识产权，产品
11月26日国内四大证券报纸、重要财经媒体头版头条内容精华摘要

11月26日(星期三)，今日报刊头条主要内容精华如下：阿里财报出炉！AI收入连续九个季度三位数增长高管：“3800亿投入还是提少了” 11月25日晚，阿里巴巴发布的2026财年第二财季（2025年第三季度）财报显示
2025-11-26阿里，AI，阿里巴巴
汇率刷新逾1年来高位人民币与美元“双强”格局显现

波动加大的全球汇市里，人民币与美元“双强”格局成为一道特别的风景线。近日，美元指数震荡上行，攀升至100关口上方。同一时间，人民币对美元展现出较强韧性，刷新逾1年来高位，更对一篮子货币维持强势，接连创下7个月新高
2025-11-26人民币，人民币汇率，美元指数
道指涨超660点英伟达跌2.6%；神舟二十二号飞船发射圆满成功；华为新机发布 4699元起丨每经早参

1 外交部：中美元首通话氛围是积极、友好、建设性的 11月25日外交部例行记者会上，有记者提问：昨晚中国国家主席习近平同美国总统特朗普通了电话，请问这次通话是由中方主动提议还是应美方要求进行的？对此，外交部发言人毛宁表示
2025-11-2611，特朗普，英伟达
建设银行发布“善建智造”服务方案以金融之力赋能新型工业化高质量发展

制造业是国家经济命脉所系，是立国之本、强国之基。当前，我国正加快推进新型工业化，坚定不移把制造业和实体经济做强做优做大。党的二十届四中全会提出“坚持智能化、绿色化、融合化方向，加快建设制造强国”“构建以先进制造业为骨干的现代化产业体系”
2025-11-26徐工集团，新型工业化，企业