开源大模型的“ChatGPT时刻”来临！Meta发布最新AI大模型Llama 3.1，4050亿参数版本在多项测试中性能均优于GPT-4o

对于专注于构建专业人工智能（AI）模型的开发人员来说，他们面临的长期挑战是获取高质量的训练数据。较小的专家模型（参数规模在10亿~100亿）通常利用“蒸馏技术”，需要利用较大模型的输出来增强其训练数据集，然而，使用来自OpenAI等闭源巨头的此类数据受到严格限制，因此大大限制了商业应用。

而就在北京时间7月23日（周二）晚间，全球AI领域的开发人员期待已久的开源大模型“ChatGPT时刻”终于到来——Meta发布最新AI模型Llama 3.1，其中参数规模最大的是Llama 3.1-405B版本。

扎克伯格将Llama 3.1称为“艺术的起点”，将对标OpenAI和谷歌公司的大模型。测试数据显示，Meta Llama 3.1-405B在GSM8K等多项AI基准测试中超越了当下最先进的闭源模型OpenAI GPT-4o。这意味着，开源模型首次击败目前最先进的闭源大模型。

而且，Llama 3.1-405B的推出意味着开发人员可以自由使用其“蒸馏”输出来训练小众模型，从而大大加快专业领域的创新和部署周期。

开源社区的“里程碑”：Llama 3.1-405B在多项测试中超越GPT-4o

2024年4月，Meta推出开源大型语言模型Llama 3。其中，Llama 3-8B和Llama 3-70B为同等规模的大模型树立了新的基准，然而，在短短三个月内，随着AI的功能迭代，其他大模型很快将其超越。

在你追我赶的竞争环境下，Meta最新发布了AI模型Llama 3.1，一共有三款，分别是Llama 3.1-8B、Llama 3.1-70B和Llama 3.1-405B。其中，前两个是4月发布的Llama 3-8B和Llama 3-70B模型的更新版本。而Llama 3.1-405B版本拥有4050亿个参数，是Meta迄今为止最大的开源模型之一。

而在发布当天的凌晨（北京时间），“美国贴吧”reddit的LocalLLaMA子论坛泄露了即将推出的三款模型的早期基准测试结果。

泄露的数据表明，Meta Llama 3.1-405B在几个关键的AI基准测试中超越了OpenAI的GPT-4o。这对开源AI社区来说是一个重要的里程碑：开源模型首次击败目前最先进的闭源大模型。

而Meta团队研究科学家Aston Zhang在X上发布的内容，也印证了被泄露的测试数据。

开源大模型的“ChatGPT时刻”来临！Meta发布最新AI大模型Llama 3.1，4050亿参数版本在多项测试中性能均优于GPT-4o-编程日记

图片来源：X

具体来看，Meta Llama 3.1-405B 在IFEval、GSM8K、ARC Challenge和Nexus等多项测试中均优于GPT-4o。但是，它在多项MMLU测试和GPQA测试等方面却落后于 GPT-4o。另外，Llama 3.1的上下文窗口（context window）涵盖128000个标记，比以前的Llama模型更大，大约相当于一本50页书的长度。

开源大模型的“ChatGPT时刻”来临！Meta发布最新AI大模型Llama 3.1，4050亿参数版本在多项测试中性能均优于GPT-4o-编程日记

图片来源：X

但需要指出的是，值得注意的是，这些基准反映的是Llama 3.1基本模型的性能。这些模型的真正潜力可以通过指令调整来实现，而指令调整过程可以显著提高这些模型的能力。即将推出的Llama 3.1模型的指令调整版本预计会产生更好的结果。

Llama 4已于6月开始训练

尽管OpenAI即将推出的 GPT-5预计将具备先进的推理能力，可能会挑战Llama 3.1在大模型领域的潜在领导地位，但Llama 3.1对标GPT-4o的强劲表现仍然彰显了开源AI开发的力量和潜力。

要知道，对于专注于构建专业AI模型的开发人员来说，他们面临的长期挑战是获取高质量的训练数据。较小的专家模型（参数规模在10亿~100亿）通常利用“蒸馏技术”，需要利用较大模型的输出来增强其训练数据集，然而，使用来自OpenAI等闭源巨头的此类数据受到严格限制，因此大大限制了商业应用。

而Llama 3.1-405B的推出意味着开发人员可以自由使用其“蒸馏”输出来训练小众模型，从而大大加快专业领域的创新和部署周期。预计高性能、经过微调的模型的开发将激增，这些模型既强大又符合开源道德规范。

宾夕法尼亚大学沃顿商学院副教授伊桑·莫利克（Ethan Mollick）写道：“如果这些数据属实，那么可以说顶级AI模型将在本周开始免费向所有人开放。全球各地都可以使用相同的AI功能。这会很有趣。”

Llama 3.1-405B的开源，也证明开源模型与闭源模型的差距再次缩小了。

开源大模型的“ChatGPT时刻”来临！Meta发布最新AI大模型Llama 3.1，4050亿参数版本在多项测试中性能均优于GPT-4o-编程日记

图片来源：X

《每日经济新闻》记者还注意到，除了广受期待的Llama 3.1-405B外，外媒报道称，Llama 4已于6月开始训练，训练数据包括社交平台Facebook和Instagram用户的公开帖子。而在开始之前，Mate已经向数据隐私监管最严格的欧盟地区用户发送超过20亿条通知，提供了不同意把自己数据用于大模型训练的选项。

据悉，Llama 4将包含文本、图像、视频与音频模态，Meta计划将新模型应用在手机以及智能眼镜中。

开源大模型的“ChatGPT时刻”来临！Meta发布最新AI大模型Llama 3.1，4050亿参数版本在多项测试中性能均优于GPT-4o

马斯克启动“全球最强大AI训练集群” 背后隐藏内忧外患

抖音淘宝们“卷不动”低价了

最新文章

债市行情火热，“债牛”会持续多久？

终止重大资产重组！这家A股公司，跨界新能源计划告吹！

挖金客：已在移动信息化业务板块开展AI机器人外呼业务

深圳：每年发放最高5000万元“语料券” 促进语料开放共享和交易推动数据要素市场建设

深圳：每年发放最高5000万元“语料券”，促进语料开放共享和交易，推动数据要素市场建设

深圳：每年发放最高1亿元“模型券”，降低人工智能模型应用成本

深圳：对科技重大专项和人工智能“揭榜挂帅”项目，给予最高3000万元资助

深圳：设立人工智能产业基金坚持“投早、投小、投长期、投硬科技”

深圳：每年投入最高3亿元，聚焦自动驾驶、人工智能芯片等重点领域

深圳：围绕先进制造业、现代服务业和科学研究等重点领域，每年投入最高1亿元

标签

关注我们么么哒！

开源大模型的“ChatGPT时刻”来临！Meta发布最新AI大模型Llama 3.1，4050亿参数版本在多项测试中性能均优于GPT-4o

马斯克启动“全球最强大AI训练集群” 背后隐藏内忧外患

抖音淘宝们“卷不动”低价了

猜你喜欢

中国人民银行原副行长李东荣：新一代大模型技术成为银行业转型关键力量

中科院预测：2024年中国AI框架新增市场中，昇思份额将达30%

30亿元！智谱完成新一轮融资 大模型“六小龙”年内累计吸金超200亿元

字节“显眼包”带火AI玩具 但公司称并不打算对外售卖

永信至诚：AI大模型安全测评“数字风洞”平台已接入抖音豆包大模型

永信至诚：公司AI大模型安全测评“数字风洞”平台已接入抖音豆包大模型

华为昇思AI框架已支持超50个大模型，中国AI产业迎来新时代

对话上海交通大学上海高级金融学院副院长李峰：良好经济回报才能驱动金融机构持续运用大模型

无问芯穹发布首个端侧全模态理解开源模型

清华大学金融科技研究院副院长薛正华：希望更多“耐心资本”通过股权投资支持大模型研发初创企业

具身智能进入GPT-3倒计时，我们距离贾维斯时刻还有多远？｜对话自变量机器人CEO王潜

西部证券：具有视觉能力的多模态大模型将对视觉 SoC和存储带来新需求

最新文章

债市行情火热，“债牛”会持续多久？

标签

关注我们 么么哒！

关注我们的公众号

30亿元！智谱完成新一轮融资大模型“六小龙”年内累计吸金超200亿元

字节“显眼包”带火AI玩具但公司称并不打算对外售卖

关注我们么么哒！