“端侧模型”能力大幅提升，面壁智能新品赶上GPT-3.5

界面新闻记者 | 伍洋宇
界面新闻编辑 | 文姝琪

9月5日，面壁智能发布了旗舰端侧模型“小钢炮”系列的MiniCPM 3.0基座模型。MiniCPM 3.0是一款4B大小的模型，在自然语言理解、知识、代码、数学等能力上可达到GPT-3.5水平，经过量化处理后内存为2.2GB。

MiniCPM 3.0强调了自身的长文本、Function Call（函数调用）与RAG（检索增强生成）三个模型功能。

长文本并不是一个稀缺技能，面壁智能的差异化在于，团队通过长本文分帧处理技术，打破了上下文长度的拓展限制。这使得在InfiniteBench大模型长文本能力的权威评测集中，MiniCPM 3.0的表现超过了GPT-4、KimiChat、Qwen2-70B。

Function Calling是智能体（Agent）应用的重要技能，它能够将用户模糊化的输入语义转换为机器可以精确理解执行的结构化指令，并让大模型连接外部工具和系统。公司表示，MiniCPM 3.0的Function calling性能目前已接近GPT-4o水平。

RAG技术是端侧模型加强检索与生成能力，尽可能减少大模型幻觉问题的重要手段。面壁智能为MiniCPM 3.0加入了MiniCPM-Embedding（检索模型）、MiniCPM-Reranker（重排序模型）和面向RAG场景的LoRA插件（生成模型）共三个外挂模型。

总体而言，面壁智能在MiniCPM 3.0上降低了参数并提升了性能。这是端侧模型生存突围的唯一路径。

与众多互联网大厂和创业公司抢入通用大模型领域不同，面壁智能从成立至今就把目标放在小尺寸大模型上，尤其以MiniCPM系列发力端侧模型，团队的技术目标一直在于如何提升模型的知识密度（即模型能力/参与计算的模型参数）。

相较于云端大模型，兼具小尺寸和强性能的端侧模型天然更适合智能硬件产品，因为后者有更高的计算效率、实时反馈、安全隐私等方面的要求。

“从技术角度来说，端到端的方案通常都是上限更高，而且能够带来更新体验的方案。”面壁智能CTO曹国洋表示。以机器人为例，端侧模型有机会带来传统技术所无法实现的通用能力，例如通过更长的上下文完成对人的情绪与意图的理解。

不过，以OpenAI为代表的大模型公司，也正在通过剪枝、量化等手段开发小尺寸模型，这是否意味着在可见的未来，通用大模型有可能会全面覆盖小尺寸模型的能力表现，以面壁智能为代表的端侧模型将成为前者的子集？

这个问题的本质是面壁智能在技术上的挑战。曹国洋解释道，从技术路线上来说，端侧模型与云端大模型有一部分是共通的，主要体现在模型的知识密度和能力上，但是面壁智能需要在一些技术上采取更适配端侧模型的路径，才有可能实现以小博大的目的。

不过，在真正落地端侧设备时，端侧模型的优势会得到显现。由于端侧设备对运算资源有极大限制，端侧模型会从模型的训练技巧、数据配比、数据精度等方面做大量工作，而云端大模型整体更注重效果和成本的平衡，大都采取MoE（Mixture of Experts）架构等技术以追求性价比，长期来看，如果仅采取剪枝等传统技术，云端模型难以持续大幅提升模型的知识密度。

当端侧模型的表现提升到足够好，面壁智能的下一步就是启动商业模式的尝试和挑战。

目前，面壁智能已经与MTK合作，为梧桐科技提供MiniCPM车载多模态大模型，迈入了智能座舱芯算一体的合作领域。

面壁智能CEO李大海表示，手机、PC、机器人和汽车是面壁智能目前很明确的四个落地方向。对于端侧模型与智能硬件相结合的量产节点，李大海推测是在明年。同时，他提到，今年年底可能就会有配备面壁智能端侧模型的产品上市，但暂未透露具体厂家和产品形态。

一个不可回避的问题是，当前，无论是苹果、三星还是华为等头部硬件厂商，都在打磨自有端侧大模型，并与自有产品做结合。面壁智能作为模型供应商，如何看待与这些终端厂商的竞争，以及更好服务其他厂商客户？

李大海认为，尽管终端厂商掌握场景，但并非所有厂商都有能力打造足够好的端侧模型，而今天的智能化竞争，无论在哪个产业都十分激烈。为了面向消费者达成更好的交付效果，厂商都在追求最好的端侧模型能力。从这个角度而言，面壁智能仍有机会通过与厂商的沟通协作获得更多收入和市场份额。

“端侧模型”能力大幅提升，面壁智能新品赶上GPT-3.5

2000美元一只“草莓”，OpenAI 新模型价格挑战用户底线？

欣旺达：第四代全固态电池预计2027年完成实验室样品制作

最新文章

挖金客：已在移动信息化业务板块开展AI机器人外呼业务

深圳：每年发放最高5000万元“语料券” 促进语料开放共享和交易推动数据要素市场建设

深圳：每年发放最高5000万元“语料券”，促进语料开放共享和交易，推动数据要素市场建设

深圳：每年发放最高1亿元“模型券”，降低人工智能模型应用成本

深圳：对科技重大专项和人工智能“揭榜挂帅”项目，给予最高3000万元资助

深圳：设立人工智能产业基金坚持“投早、投小、投长期、投硬科技”

深圳：每年投入最高3亿元，聚焦自动驾驶、人工智能芯片等重点领域

深圳：围绕先进制造业、现代服务业和科学研究等重点领域，每年投入最高1亿元

挖金客：已开展AI机器人外呼业务

深圳：每年发放最高1亿元“模型券” 降低人工智能模型应用成本

标签

关注我们么么哒！

“端侧模型”能力大幅提升，面壁智能新品赶上GPT-3.5

2000美元一只“草莓”，OpenAI 新模型价格挑战用户底线？

欣旺达：第四代全固态电池预计2027年完成实验室样品制作

猜你喜欢

挖金客：已在移动信息化业务板块开展AI机器人外呼业务

中国人民银行原副行长李东荣：新一代大模型技术成为银行业转型关键力量

台积电CEO承认密会马斯克，承诺“只要肯付钱，一定给芯片”

中科院预测：2024年中国AI框架新增市场中，昇思份额将达30%

30亿元！智谱完成新一轮融资 大模型“六小龙”年内累计吸金超200亿元

汉威科技：柔性传感器产品已送样给多家机器人整机厂商

字节“显眼包”带火AI玩具 但公司称并不打算对外售卖

永信至诚：AI大模型安全测评“数字风洞”平台已接入抖音豆包大模型

永信至诚：公司AI大模型安全测评“数字风洞”平台已接入抖音豆包大模型

机器人：公司在人工智能产业方向的相关布局工作在有序推进，尚处于研究阶段

汤姆猫：AI语音陪伴机器人将于12月月底前正式发售

华为昇思AI框架已支持超50个大模型，中国AI产业迎来新时代

最新文章

挖金客：已在移动信息化业务板块开展AI机器人外呼业务

标签

关注我们 么么哒！

关注我们的公众号

30亿元！智谱完成新一轮融资大模型“六小龙”年内累计吸金超200亿元

字节“显眼包”带火AI玩具但公司称并不打算对外售卖

关注我们么么哒！