中国银河维持计算机推荐评级：国产开源MoE模型DeepSeek-V2性能媲美GPT-4，大模型价格战拉开帷幕

每经AI快讯，中国银河05月13日发布研报称：维持计算机推荐（维持）评级。

事件：5月7日，知名私募巨头幻方量化旗下的AI公司DeepSeek发布全新第二代MoE大模型DeepSeek-V2。

性能直逼GPT-4Turbo，综合能力位于大模型第一梯队：DeepSeek-V2是一个参数为2360亿的MoE模型，每个token仅激活210亿参数，支持128K的上下文长度。1）纵向对比：对比去年11月发布的DeepSeek67B性能取得显著提升，训练成本节省了42.5%，KV缓存减少了93.3%，最大生成吞吐量提高到了5.76倍。2）横向对比：上下文长度对标GPT-4Turbo（128K）；中文综合能力（AlignBench）超越Llama3，在开源模型中表现最强，与文心4.0等闭源模型在评测中处于同一梯队，仅次于GPT-4Turbo；英文综合能力（MT-Bench）与最强的开源模型LLaMA3-70B处于同一梯队，超过MoE开源模型Mixtral8x22B。此外在知识、数学、推理、代码等方面也有出色的性能。

DeepSeek-V2训练计算量降低，推理能力表现高效：DeepSeek-V2训练数据集是由8.1Ttoken的高质量、多源预训练语料库组成，采用的Transformer架构中由一个注意力模块和一个前馈网络（FFN）组成，并且在注意力机制和FFN方面采用了创新架构：一方面设计了MLA（Multi-headLatentAttention）利用低秩键值联合压缩来消除推理时键值缓存的瓶颈，DeepSeek-V2消耗的显存（KVCache）只有同级别Dense模型的1/5-1/100，每token成本大幅降低；另一方面，FFN采用高性能MoE架构DeepSeekMoE，以经济的成本训练强大的模型。我们认为，DeepSeek-V2大幅提升训练效率，训练所需计算量约为GPT-4的1/20，但性能基本上相差无几，目前来看参数是影响大模型性能的关键因素之一，除此之外，架构优化能有效提升降低训练成本，提升训练效率，将成为另一个影响大模型性能的关键因素。

API价格降至约GPT-4Turbo百分之一，大模型价格战即将拉开帷幕，利好AI应用层快速渗透：目前DeepSeek-V2API定价为每百万token输入1元、输出2元（32K上下文），几乎低于所有市面上主流大模型价格，约为GPT-4Turbo的1/100。我们认为，DeepSeek-V2提升数据集质量及优化架构，成本大幅降低，在价格方面提升竞争力，大模型将逐渐进入价格战时期，AI应用将快速渗透。

风险提示：技术研发进度不及预期风险；供应链风险；政策推进不及预期风险；消费需求不及预期风险；行业竞争加剧风险。

每经头条（nbdtoutiao）——大手笔！接盘王健林的万达电影后，知名80后富豪又出手收购字节游戏资产！背后是腾讯？

(记者胡玲)

免责声明：本文内容与数据仅供参考，不构成投资建议，使用前请核实。据此操作，风险自担。

中国银河维持计算机推荐评级：国产开源MoE模型DeepSeek-V2性能媲美GPT-4，大模型价格战拉开帷幕

中汽协回应特斯拉通过数据安全测试：对国内外车企一视同仁

微软将在法国投资40亿欧元，大部分集中在AI领域

最新文章

红双喜新A款两全保险（分红型）

买外地保险（请保险高手指教）

国华人寿保险公司招聘会不会骗人啊？

我买的红双喜新C款两全保险(分红型)十年期限的,缴…

这样的保险在哪能买到

养老保险交了一年多,现在不想交了能退吗?

中国人寿保险退保

保险问题专业的进来

北京补充医疗保险，公司想给员工上，但不是很了…

重要疾病保险里的重要器官移植，如果我只是切除，…

标签

关注我们么么哒！

中国银河维持计算机推荐评级：国产开源MoE模型DeepSeek-V2性能媲美GPT-4，大模型价格战拉开帷幕

中汽协回应特斯拉通过数据安全测试：对国内外车企一视同仁

微软将在法国投资40亿欧元，大部分集中在AI领域

猜你喜欢

OpenAI向美国政府提交信函攻击DeepSeek 专家：毫无依据的污蔑和无理打压

新消费日报 | 2025年“3·15”晚会主题发布；极兔速递：全面接入DeepSeek大模型；华为笔记本或再无Windows可用……

极兔宣布接入DeepSeek 大模型将成改变快递竞争格局的关键变量？

中关村科金总裁喻友平：DeepSeek正开启大模型“垂类竞速”模式，企业要充分利用数据资产实现智能化转型

美国前常务副国务卿佐利克：DeepSeek将AI推向低成本，并引发国际竞争

华夏银行：我行已在行内部署了DeepSeek大模型

2025两会“人工智能+”成热点：北信源信源密信协同DeepSeek奔赴国产AI全球化新赛道

2025两会"人工智能+"成热点：北信源信源密信协同DeepSeek奔赴国产AI全球化新赛道

宝钢股份：已参与钢铁大模型和生成式助手的试点应用工作

AI创业进入“淘汰赛” MiniMax洽谈收购视频生成创企鹿影科技

湖北宜化与华为签署全面合作框架协议，双方将围绕人工智能大模型、智能工等领域建立全面合作

亿道信息：今年公司的AI眼镜产品方案已经升级迭代到第三个版本

最新文章

红双喜新A款两全保险（分红型）

标签

关注我们 么么哒！

关注我们的公众号

关注我们么么哒！