智谱AI给大模型价格战再添一把火

界面新闻记者 | 伍洋宇
界面新闻编辑 | 宋佳楠

6月5日，智谱AI推出第四代GLM系列开源模型GLM-4-9B，并对清言App和MaaS大模型开放平台bigmodel.cn发布了一系列更新。

GLM-4-9B系列共包含四个版本，分别为基础版GLM-4-9B（8K）、对话版GLM-4-9B-Chat（128K）、超长上下文版GLM-4-9B-Chat-1M（1M）和多模态版GLM-4V-9B-Chat（8K）。其中，对话版模型支持多轮对话、网页浏览、代码执行、自定义工具调用等多个功能。

这款模型预训练数据量为10T，是ChatGLM3-6B模型的3倍以上。ChatGLM3为智谱AI的第三代对话预训练模型，ChatGLM3-6B则是其中的开源模型。性能方面，第四代模型中英文综合性能相比前代提升了40%，而上下文从128K扩展到了最高1M tokens（约为200万字）。此外，其多语言、多模态等能力也有所提升。

在国内大模型独角兽阵营中，智谱AI是少数走企业端路线的公司，并及时跟随DeepSeek的降价步伐，积极参与到DeepSeek掀起的大模型API价格战中。

GLM-4-9B发布后，智谱AI宣布再次降价，有意给大模型价格战再添一把火。

目前，其MaaS开放平台已全线接入新模型。其中，GLM-3-Turbo的接入价格从5元/百万Tokens降为1元/百万Tokens，GLM-4V（图生文）从100元/百万Tokens降为50元/百万Tokens，CogView3（文生图）则从0.25元/张降为0.1元/张。

企业权益相关的服务体系中，各类模型降价更为明显，最低价格逼近普通权益的60%。GLM-4-Air和GLM-3-Turbo最便宜可至0.6元/百万Tokens，GLM-4V（图生文）最低30元/百万Tokens，性能更强的GLM-4-0520最低为60元/百万Tokens，降幅达40%。

据智谱AI COO张帆介绍，当前企业客户除了要求模型性能和服务成本之外，对于私有化部署和业务场景的价值转化也有高期待。

对于模型性能和成本的需求，该公司现阶段主要是通过模型迭代和降价来实现。针对私有化部署，其MaaS平台上线了微调功能，允许企业客户利用自有数据对模型进行训练。

智谱AI还将目标瞄准了制造、大消费、汽车等领域。此外，团队在MaaS平台也嵌入了智能体API，为开发者群体提供AI工具。

清言App的进展则在于推出了多智能体协作系统“清言Flow”，强调多轮、多态的对话交互模式，而非单一智能体对话。智谱AI CEO张鹏透露，目前该App已经拥有超过30万个智能体活跃其中，日均Tokens调用量达到400亿次。

就创业公司而言，这算是一个不小的调用量。有媒体报道，字节跳动旗下“豆包”的日均处理量为1200亿Tokens，其涵盖网页和App端总体日活超200万。

不同于行业中普遍认为企业端市场规模天花板太低的论调，智谱AI仍然选择在此投入更多精力。当众多独角兽角逐用户端超级应用之时，这家公司想借降价分得更多企业市场蛋糕。

在张鹏看来，当前大模型的Scaling Law并未失效，AI技术的增长进入了一个全新的阶段。这意味着，大模型技术的创新依旧是突飞猛进的进行时，甚至还有速度越来越快的迹象。

不过，这条技术曲线的陡峭距离让更多人体会到AI“有用”还有很长的路要走，对未来的想象力只有化为现实的生产力才具有真正意义。