承认、道歉、删除！斯坦福AI团队抄袭中国大模型

5月29日，斯坦福一AI团队发布了一个名为Llama3-V的多模态大模型，宣称只需500美元就可训练出一个性能可与GPT4-V媲美的模型。但随后，该团队发布的模型被指抄袭，其与国内清华系大模型相似度极高。面壁智能CEO李大海和联合创始人刘知远先后发文回应，表示这是一种受到国际团队认可的方式，但希望大家共建开放、合作、有信任的社区环境。目前，该团队已公开道歉，并删除了相关库和官宣推文。

斯坦福AI团队抄袭，成员公开道歉

斯坦福大学AI团队在2024年5月29日发布了一个名为Llama3-V的多模态大模型，声称只需500美元就能训练出一个性能可与GPT4-V媲美的模型。Llama3-V不仅在社交媒体上迅速蹿红，还一度冲上了HuggingFace趋势榜首页。

承认、道歉、删除！斯坦福AI团队抄袭中国大模型-编程日记

图片来源：X

然而，一名细心且热心的网友发现，该团队发布的Llama3-V和国内大模型MiniCPM-Llama3-V 2.5有极高的相似度，后者是由国内大模型初创企业“面壁智能”和清华大学自然语言处理实验室联合推出的。

网友还在在面壁智能GitHub的项目下放出了一系列证据。

该网友表示，这两个模型的结构、代码、配置文件都一模一样，只有变量名被替换了。

承认、道歉、删除！斯坦福AI团队抄袭中国大模型-编程日记

两个模型的代码对比图片来源：GitHub

随后，面壁智能首席科学家、清华大学长聘副教授刘知远在知乎上回应，MiniCPM-Llama3-V 2.5在研发时内置了一个彩蛋，就是对“清华简”的识别能力，而Llama3-V模型居然也有一模一样的能力。

清华简是清华大学于2008年7月收藏的一批战国竹简，为战国中晚期文物。刘知远透露，识别清华简是MiniCPM-Llama3-V 2.5的一项实验功能，训练图像是最近从出土文物中扫描并标注，且尚未公开发布。

关键性证据这不就来了！

承认、道歉、删除！斯坦福AI团队抄袭中国大模型-编程日记

图片来源：知乎

而两个模型在识别的表现上，正确的结果上基本一致，错误的情况也颇为相似。

遭到大量质疑后，该斯坦福团队成员已删除他们在X上官宣模型的推文，并将该项目在Github和HuggingFace上的库一并删除。

承认、道歉、删除！斯坦福AI团队抄袭中国大模型-编程日记

图片来源：X

最新消息，4日，斯坦福Llama3-V团队的两位作者森德哈斯·沙玛（Siddharth Sharma）和阿克沙·加格（Aksh Garg）在社交平台上就这一学术不端行为向面壁MiniCPM团队正式道歉，并表示会将Llama3-V模型悉数撤下。

阿克沙表示，“首先，我们要向MiniCPM原作者道歉。我、森德哈斯·沙玛，以及穆斯塔法（Mustafa）一起发布了Llama3-V，穆斯塔法为这个项目编写了代码，但从昨天起就无法联系他。我与森德哈斯·沙玛主要负责帮助穆斯塔法进行模型推广。我们俩查看了最新的论文，以验证这项工作的新颖性，但并未被告知或意识到OpenBMB（清华团队支持发起的大规模预训练语言模型库与相关工具）之前的任何工作。我们向作者道歉，并对自己没有努力验证这项工作的原创性感到失望。我们对所发生的事情承担全部责任，并已撤下Llama3-V，再次致歉。”

此外，斯坦福人工智能实验室主任克里斯托弗·大卫·曼宁（Christopher David Manning）也发文谴责这一抄袭行为。

承认、道歉、删除！斯坦福AI团队抄袭中国大模型-编程日记

图片来源：X

面壁智能回应：“技术创新不易”“深表遗憾”

据第一财经报道，6月3日，面壁智能CEO李大海及其联合创始人刘知远相继公开发声，就他们公司的开源模型被斯坦福大学AI团队疑似抄袭的问题作出了回应。

李大海在声明中表达了对此事的深切遗憾，并指出，尽管从某种程度上看，这种模仿可以被视为他们的成果得到了国际团队的某种认可，但他更强调应该构建一个开放、协作且充满信任的技术社区环境。他进一步强调，他们希望团队的努力和优秀工作能够吸引更多人的关注和认可，但并非以这种被模仿甚至抄袭的方式。

承认、道歉、删除！斯坦福AI团队抄袭中国大模型-编程日记

图片来源：第一财经

面壁智能首席科学家、清华大学长聘副教授刘知远也表示，人工智能的飞速发展离不开全球算法、数据与模型的开源共享，让人们始终可以站在SOTA的肩上持续前进。面壁开源的MiniCPM-Llama3-V 2.5就用了最新的Llama3作为语言模型基座。而开源共享的基石是对开源协议的遵守，对其他贡献者的信任，对前人成果的尊重和致敬，Llama3-V团队无疑严重破坏了这一点。他们在受到质疑后已在Huggingface删库，该团队三人中的两位也只是斯坦福大学本科生，未来还有很长的路，如果知错能改，善莫大焉。

天眼查APP显示，北京面壁智能科技有限责任公司成立于2022年8月，法定代表人为曾国洋，董事长为李大海，注册资本约52.46万人民币，经营范围包括软件开发、人工智能基础软件开发、人工智能理论与算法软件开发、信息系统集成服务等。股东信息显示，该公司由北京清语启航科技中心（有限合伙）、曾国洋、李大海等共同持股。知识产权信息显示，该公司已申请了多项专利，如“基于人工智能自适应的NLP大模型分析系统”“深度学习模型统一应用方法、装置、服务器及存储介质”“基于人工智能的对话预测方法、装置及存储介质”，当前部分专利已获授权。此外，该公司还登记了“CPM模型能力展示平台”“面壁智能模力表格文本生成系统”等多个软件著作权。

面壁智能目前已完成两轮融资。去年4月，公司完成由知乎、智谱AI投资的数千万人民币天使轮融资；今年4月，公司宣布完成新一轮数亿元融资，由春华创投、华为哈勃领投，北京市人工智能产业投资基金等跟投，知乎作为战略股东持续跟投支持。

据其官网显示，面壁智能联合创始人、CEO李大海，硕士毕业于北京大学数学系，毕业后加入Google，成为Google中国创始员工之一，后在云云网任工程总监，在豌豆荚任搜索技术负责人，连续12年创业经验。2015年加入知乎，任知乎合伙人、CTO。

面壁智能联合创始人、首席科学家刘知远，是清华大学计算机系长聘副教授，智源青年科学家。主要研究方向为自然语言处理、知识图谱和社会计算。在人工智能领域著名国际期刊和会议发表相关论文200余篇，Google Scholar统计引用超过3.1万次。曾获教育部自然科学一等奖、中国中文信息学会钱伟长中文信息处理科学技术奖一等奖、入选国家青年人才计划、《麻省理工科技评论》中国区35岁以下科技创新35人榜单。

承认、道歉、删除！斯坦福AI团队抄袭中国大模型-编程日记

图片来源：面壁智能官网

每日经济新闻综合第一财经、公开消息

承认、道歉、删除！斯坦福AI团队抄袭中国大模型

AI PC纪元即将开启！英特尔Lunar Lake笔记本处理器高调登场

大裁员影响产品研发测试，理想汽车召回部分被裁员工

最新文章

债市行情火热，“债牛”会持续多久？

终止重大资产重组！这家A股公司，跨界新能源计划告吹！

挖金客：已在移动信息化业务板块开展AI机器人外呼业务

深圳：每年发放最高5000万元“语料券” 促进语料开放共享和交易推动数据要素市场建设

深圳：每年发放最高5000万元“语料券”，促进语料开放共享和交易，推动数据要素市场建设

深圳：每年发放最高1亿元“模型券”，降低人工智能模型应用成本

深圳：对科技重大专项和人工智能“揭榜挂帅”项目，给予最高3000万元资助

深圳：设立人工智能产业基金坚持“投早、投小、投长期、投硬科技”

深圳：每年投入最高3亿元，聚焦自动驾驶、人工智能芯片等重点领域

深圳：围绕先进制造业、现代服务业和科学研究等重点领域，每年投入最高1亿元

标签

关注我们么么哒！

承认、道歉、删除！斯坦福AI团队抄袭中国大模型

AI PC纪元即将开启！英特尔Lunar Lake笔记本处理器高调登场

大裁员影响产品研发测试，理想汽车召回部分被裁员工

猜你喜欢

深圳：每年发放最高1亿元“模型券”，降低人工智能模型应用成本

深圳：对科技重大专项和人工智能“揭榜挂帅”项目，给予最高3000万元资助

深圳：围绕先进制造业、现代服务业和科学研究等重点领域，每年投入最高1亿元

深圳：每年发放最高1亿元“模型券” 降低人工智能模型应用成本

深圳：支持人工智能产品应用 对销售量达到一定规模的年度爆款产品给予企业最高300万元奖励

“人工智能+”激发算力和存储行业需求

中国人民银行原副行长李东荣：新一代大模型技术成为银行业转型关键力量

台积电CEO承认密会马斯克，承诺“只要肯付钱，一定给芯片”

中科院预测：2024年中国AI框架新增市场中，昇思份额将达30%

30亿元！智谱完成新一轮融资 大模型“六小龙”年内累计吸金超200亿元

字节“显眼包”带火AI玩具 但公司称并不打算对外售卖

永信至诚：AI大模型安全测评“数字风洞”平台已接入抖音豆包大模型

最新文章

债市行情火热，“债牛”会持续多久？

标签

关注我们 么么哒！

关注我们的公众号

深圳：支持人工智能产品应用对销售量达到一定规模的年度爆款产品给予企业最高300万元奖励

30亿元！智谱完成新一轮融资大模型“六小龙”年内累计吸金超200亿元

字节“显眼包”带火AI玩具但公司称并不打算对外售卖

关注我们么么哒！