一则斯坦福大学Llama3-V团队抄袭清华系大模型的消息,近日引发热议。北京时间4日凌晨,该团队的两名成员在社交媒体上对这一学术不端行为公开致歉,并表示会将Llama3-V模型悉数撤下。
据悉,两人是斯坦福大学计算机科学专业的本科生,自称在团队中的角色是模型推广,而负责该项目代码编写的是毕业于南加利福尼亚大学Mustafa Aljadery。事发后,他们要求Mustafa提供原创性证明和训练代码,但未取得任何证据。
南都记者尝试联系率先发现清华系模型被套壳的网友,他表示只是做了一名开源社区工作者应该做的事。此次Llama3-V的抄袭行为,“相当于把可口可乐换成可日可乐就说是自己的项目”。
斯坦福大学AI团队发布模型被指抄袭
事情起源于5月29日,斯坦福大学AI团队发布Llama3-V开源模型,称它比当前开源SOTA视觉语言模型LLaVA的性能提高了10%-20%,不仅尺寸比GPT-4V小近99%,而且性能比肩GPT-4V、Gemini Ultra与Claude Opus。
更重要的是,该大模型的训练成本仅不到500美元。这一惊艳的成果,再加上3位作者出色的专业和技术研发背景,让Llama3-V一经发布就引发各方关注,并一度登上全球最大的开源大模型社区HuggingFace趋势榜第五位。
不过很快,质疑声便出现。6月2日下午,网友Magic Yang称发现了一个令人震惊的事实:Llama3-V项目中有大量疑似抄袭MiniCPM-Llama3-V 2.5的内容,同时晒出了多项涉嫌抄袭的证据。
比如在模型结构和配置文件上,二者高度雷同,只是变量名不同。Llama3-V的代码也几乎完全照抄MiniCPM-Llama3-V 2.5,仅做了一些重新格式化和变量重命名,包括但不限于图像切片、分词器、重采样器、数据加载等变量。
GitHub项目信息显示,MiniCPM-Llama3-V2.5共有8B个参数,整体性能超越GPT-4V-1106、GeminiPro、Qwen-VL-Max和Claude3等专有模型,配备了增强的OCR和指令跟踪能力,还可以支持英语、中文、法语等30多种语言的多模态对话。这款端测多模态开源模型,由清华大学自然语言处理实验室与面壁智能合作开发,于今年5月20日推出。
对话打假者:发现抄袭不难证实不易
南都记者尝试联系这位揭露Llama3-V涉嫌抄袭的网友MagicYang(知乎网名“社恐患者杨老师”),他向南都记者回顾了这场打假的过程。杨老师表示,最近正在帮助一名博士生做有关运动处方的项目,想选择一个质量较好的开源模型作为微调的基座。此前他曾测试了MiniCPM-Llama3-V2.5,因此对MiniCPM的模型架构和代码都相对熟悉。
后来他注意到,Llama3-V项目在HuggingFace上排名非常靠前,且获得了相关博主推荐,于是想进一步做测试。但在这过程中,他发现二者在模型架构和代码上存在高度相似的情况,就此询问了Llama3-V作者。结果对方避重就轻,并不正面回应,随后更是将质疑帖子删除,且隐藏了MiniCPM-Llama3-V2.5的项目主页。
这一系列的操作,令人生疑。6月2日下午,杨老师把所知的证据发到MiniCPM-V的Github项目主页,并提醒面壁智能团队关注。相关对话截图显示,Llama3-V项目作者最初否认抄袭,并称他们的项目开始时间更早,只是使用了MiniCPM-V2的分词器。
杨老师告诉南都记者,作为一个有大模型经验的开发者,发现(抄袭行为)不难,但要证实不易。此事最终一锤定音,还是因为面壁智能团队使用内部数据集“清华简”做了对比测试。
“连错的都一模一样”,确信是套壳
6月2日深夜,面壁智能团队证实了抄袭行为的存在。经核实,除了社区网友列出的证据外,还发现Llama3-V项目与MiniCP-Llama3-V 2.5一样,可以识别出“清华简”战国古文字,“不仅对的一模一样,连错的都一模一样”。
据面壁智能首席科学家、清华大学长聘副教授刘知远介绍,“清华简”的识别能力,是MiniCPM-Llama3-V2.5研发时内置了一个彩蛋。这是该团队花费数月从清华简逐字扫描,人工标注而来的数据集,并未公开,由此“已经比较确信Llama3-V是对MiniCPM-Llama3-V2.5套壳。”
针对此事,面壁智能CEO李大海也发文称,深表遗憾。“技术创新不易,好的成果希望被更多人关注和认可,但不是以这种方式。”李大海呼吁,大家共建开放、合作、有信任的社区环境。
刘知远也表示,人工智能的飞速发展离不开全球算法、数据与模型的开源共享,让人们始终可以站在SOTA(意为“最新技术”的最佳状态)的肩上持续前进。“开源共享的基石是对开源协议的遵守,对其他贡献者的信任,对前人成果的尊重和致敬,Llama3-V团队无疑严重破坏了这一点。”同时他提到,Llama3-V团队的3位作者中,有两位是斯坦福大学本科生,未来还有很长的路,“如果知错能改,善莫大焉”。
北京时间4日凌晨,卷入此次风波的两名斯坦福大学本科生在社交平台上解释,称该项目由3人发布,他们只在其中帮忙推广模型,负责代码编写的是MustafaAljadery。事发后,他们曾尝试联系Mustafa发布原创性声明,并提供训练代码,但到目前为止还未看到任何证据。在这份联合声明中,两人再次向原作者道歉,并称对未尽职尽责确保Llama3-V的独创性而感到失望,现已将所有对Llama3-V的引用都删除了。
被推为主要责任方的Mustafa,是团队中唯一的全职成员。其本硕毕业于南加利福尼亚大学,主攻深度学习和数学,是一名软件工程师。截至目前,Mustafa尚未发声。
两名作者的解释,尚不能平息质疑。斯坦福人工智能实验室主任Christopher David Manning公开发文谴责这一抄袭行为,称两人借口推脱,是拒不认错的表现。
面壁智能核心团队来自清华NLP实验室
此次被牵涉进抄袭风波中的面壁智能创立于2022年8月,团队的核心成员来自清华大学自然语言处理与社会人文计算实验室(THUNLP)——该实验室也撑起了去年大模型创业浪潮以来的“半壁江山”,跑出了生数科技、深言科技等人工智能企业和华为的“盘古大模型”。
今年4月,南都记者从面壁智能方面获悉,该公司已完成了新一轮数亿元融资,该轮次融资由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,而知乎作为战略股东持续跟投支持。据悉,该轮融资将用于人才引入、大模型底层算力与数据基础的建构以及推动大模型高效训练和应用落地。
后续进展
6月5日,面壁智能发布消息称,作为开源社区的贡献者和受益者,面壁智能,OpenBMB&清华NLP实验室认真讨论决定,将面壁“小钢炮”MiniCPM免费商用。即日起,MiniCPM和MiniCPM-V权重将对学术研究完全开放,并且企业、个人在填写问卷登记后亦允许商业使用,社区使用MiniCPM系列模型需要遵循Apache2.0和《MiniCPM模型社区许可协议》。
华安证券研报指出,今年以来补栏积极性疲弱,从官方数据看,Q2能繁母猪存栏量环比1季末小幅上升1.2%,7月、8月,能繁母猪存栏量环比分别增长0.07%和环比下降0.1%,即使8月出现了猪价阶段性高点,产能环比仍出现下滑
2024-09-27华安证券,温氏股份,生猪养殖9月27日,创业板指午后快速拉升涨幅扩大至11%,今日盘中最高涨幅为11.96%,截至收盘,创业板指报1885.49点,涨幅10%,成交额突破4000亿元。 据统计,创业板指今日涨幅创历史最高记录
2024-09-27创业板指,涨幅,深证成指今日恒指盘中再创阶段新高,其中新能源赛道股反弹愈发凶猛,多家行业龙头飙涨达两位数,吸引不少关注
2024-09-27新能源汽车,行业龙头,HK记者从淘宝官方了解到,今天(27日)开始,消费者通过淘宝购物时,可以使用微信支付。 微信支付方面表示,后续在淘宝使用微信支付的用户,也可在微信内查询支付凭证、用户账单等操作
2024-09-27微信支付,淘宝,支付重庆建工9月27日公告,公司与广东中交建工组建的联合体中标德阳光控项目地块2施工总承包工程,近日,联合体收到与发包人广州中交建工建设工程有限公司、德阳特斯联实业有限公司签订的该项目合同。 合同暂估总价(含税)约8亿元
2024-09-27工程,重庆建工,施工总承包A股、港股继续飙升!9月27日,A股三大股指集体高开高走,深证成指盘中涨超7%,创业板指盘中涨超11%,续创历史盘中最大涨幅。截至收盘,上证综指、深证成指、创业板指分别收涨2.89%、6.71%、10%
2024-09-27成交金额,成交额,药明康德南方财经9月27日电,天眼查App显示,近日,通威综合能源(珠海)有限公司成立,法定代表人为张霞,注册资本200万人民币,经营范围含太阳能发电技术服务、储能技术服务、光伏设备及元器件销售、新能源原动设备销售等
2024-09-27通威股份,通威新能源有限公司,综合2024年9月26日,新泉股份(603179.SH)披露了关于实际控制人之一部分股份质押的公告。公司实际控制人之一唐志华先生持有公司股份数量为5400.746万股,占公司总股本比例为11.08%
2024-09-27新泉股份,全资子公司,公司《科创板日报》9月27日讯(记者郑炳巽)医保基金使用监管出现新变化!监管对象将从医院和定点零售药店等机构向相关违规人员延伸,实行“驾照式记分”
2024-09-27医保支付,医药,医保南方财经9月27日电,日联科技公告称,公司拟开展“日联科技年产3000台套工业射线智能检测设备”项目,参与竞拍以挂牌方式取得无锡市新吴区44,447.5平方米(约66.74亩)土地使用权,并进行项目一期建设
2024-09-27日联科技,项目,投资健盛集团(SH 603558,收盘价:9.97元)9月27日晚间发布公告称,公司董事会近日收到公司副总裁李旭根先生提交的辞职报告。因个人原因,李旭根先生申请辞去公司副总裁职务,李旭根先生将不再担任公司任何职务
2024-09-27李旭根,健盛集团,公司至正股份(SH 603991,收盘价:49.16元)9月27日晚间发布公告称,公司第四届第九次董事会会议于2024年9月26日以现场结合通讯表决方式召开。审议了《关于聘任公司会计师事务所的议案》等。 截至发稿,至正股份市值为37亿元
2024-09-27至正股份,董事会会议,公司9月27日,Choice数据统计,今日共有11只个股股价创历史新高,主要分布在金融、房地产等行业,包括南京银行、中国国贸、百傲化学等
2024-09-27房地产,ETF,512200狮头股份(SH 600539,收盘价:4.37元)9月27日晚间发布公告称,公司2024年半年度业绩说明会定于2024年10月14日下午15:00-16:00,以上证路演中心网络互动的形式进行
2024-09-27狮头股份,业绩,公司长华集团公告,近日收到国际头部新能源车企关于新车型冲焊件、紧固件的定点通知书
2024-09-27长华集团,项目,定点日联科技(SH 688531,收盘价:44.89元)9月27日晚间发布关于对外投资设立全资子公司的公告
2024-09-27日联科技,项目,投资由中国科协、海南省人民政府和科学技术部共同主办的2024世界新能源汽车大会(WNEVC 2024)于9月27日在海南海口开幕
2024-09-27新能源汽车,科技,汽车e公司讯,日联科技(688531)9月27日晚间公告,公司拟开展“日联科技年产3000台套工业射线智能检测设备”项目,项目分两期建设,本次投资为项目一期,投资金额为7亿元(包含土地出让金)
2024-09-27日联科技,项目,智能检测设备立航科技(SH 603261,收盘价:27.18元)9月27日晚间发布公告称,公司第三届第一次董事会会议于2024年9月24日以现场和通讯表决方式召开。审议了《关于全资子公司增资扩股暨关联交易的议案》等
2024-09-27立航科技,董事会会议,航空皖维高新(SH 600063,收盘价:3.73元)9月27日晚间发布公告称,公司九届七次董事会会议于2024年9月27日在公司研发中心6楼百人会议室召开。审议了《关于召开公司2024年第二次临时股东大会的议案》等
2024-09-27皖维高新,2024,董事会会议双环传动(SZ 002472,收盘价:25.05元)9月27日晚间发布公告称,根据控股子公司浙江环驱科技有限公司的战略规划,为满足其孙公司三多乐(海防)传动科技有限公司业务拓展需要
2024-09-27双环传动,科技有限公司,增资苏州高新(SH 600736,收盘价:4.63元)9月27日发布公告称,2024年10月14日13点30分,公司将在江苏省苏州市高新区锦峰路199号锦峰国际商务广场A座19楼召开2024年第四次临时股东大会
2024-09-27苏州高新,2024,股东大会双环传动(SZ 002472,收盘价:25.05元)9月27日晚间发布公告称,鉴于任期已届满,公司原副总经理李水土先生不再担任公司副总经理职务,将继续在公司担任其他职务
2024-09-27双环传动,公司,董事南方财经9月27日电,重庆建工公告,公司与广东中交建工组建的联合体中标德阳光控项目地块2施工总承包工程,合同暂估总价(含税)约8亿元
2024-09-27工程,重庆建工,施工总承包人民网迪拜9月27日电 (记者管克江)中国家电企业海信在中东非洲地区的首个研发中心近日在迪拜开业
2024-09-27海信,阿联酋,合作9月26日,菲林格尔公告称,公司及实际控制人、副董事长丁福如,监事会主席范斌收到上海证监局行政监管措施决定书
2024-09-27菲林格尔,公司,关联交易中国海洋石油集团有限公司原党组副书记、董事、总经理李勇涉嫌受贿一案,由国家监察委员会调查终结,移送检察机关审查起诉。日前,最高人民检察院依法以涉嫌受贿罪对李勇作出逮捕决定。该案正在进一步办理中
2024-09-27李勇,中国海洋石油集团有限公司,最高人民检察院9月26日,朗科科技发布关于合资公司关停的公告。公告显示,韶关朗正数据半导体有限公司(以下简称“韶关朗正”)为朗科科技与正源芯半导体(深圳)有限公司(以下简称“正源芯”)于2022年12月设立的合资公司,主要从事存储芯片封装测试业务
2024-09-27公司,朗科科技,营业收入南方财经9月27日电,天眼查App显示,近日,南通广嘉医药有限公司成立,法定代表人为赵群,注册资本1.15亿人民币,经营范围含药品生产、医学研究和试验发展、制药专用设备制造等。股东信息显示,该公司由仟源医药(300254)全资持股
2024-09-27仟源医药,注册资本,1.15亿脱口秀“元老”罗永浩再刷屏。 在今日播出的喜剧之王·单口季节目中,罗永浩作为嘉宾上台演绎了一段脱口秀。他在分享中,告知观众已还完8.24亿元债务,还把8.24亿元人民币图片拼接在一起,直观展示给大家
2024-09-27罗永浩,锤子科技,债务