编者按:DeepSeek的爆火不仅掀起技术狂欢,更将中国大模型创业圈推入价值重估的十字路口。当行业开始追问“为什么大模型六小虎没有成为DeepSeek”时,更深层的行业洗牌暗流已然涌动。

在这场价值重估多维度发酵之际,《科创板日报》将推出系列报道,追踪国内外基础大模型、AI应用创业及投资的发展和变化,力求还原一个真实、全面且充满活力的大模型行业全景,为读者带来深度、专业且富有前瞻性的行业洞察。

《科创板日报》2月14日讯(记者 李明明)DeepSeek的爆火,引出了一个话题:中国的大模型创业圈会发生什么样的变化?

在技术层面,“为什么大模型六小虎没有成为DeepSeek”的质疑声尚未平息,开源生态带来的颠覆性效应已然显现。多位业内人士指出,由于开源框架大幅降低技术门槛,“快则1个月,慢则3个月,国内大模型应该都能具备甚至超越准DeepSeek-R1的水平。”

水木清华校友种子基金合伙人王学辉对《科创板日报》记者表示,DeepSeek实际上带来了AI平权,但技术追平后,更考验大模型企业的市场化销售、融资、资本运作能力,“比如A股上市的能力,这些也是核心能力。”

DeepSeek引发的基础大模型价值重估,正在深层扩散。

开源生态带来颠覆效应

“因为开源和低门槛,我们预测快则1个月,慢则3个月,国内大模型应该都能具备甚至超越准DeepSeek-R1的水平。“这是《科创板日报》记者和多位投资人、人工智能业内专家交流时,对方的普遍看法。

英诺天使基金合伙人、北京市前沿国际人工智能研究院理事长王晟告诉《科创板日报》记者,DeepSeek并非技术远超其他模型,其技术无本质创新,而是选择了降成本、重落地的路线,在技术上限提升困难时凸显优势,引发行业思路转变。

他表示,DeepSeek-R1是“一个很重要的时代的切换标志”。当下AI的上升曲线已经变缓,预训练的数据差不多用光了,大语言模型能力不容易再上升,只能转换思路转向以OpenAI的 o1和DeepSeek的 R1为代表的推理模型。整个行业从“对标OpenAI”的宏大叙事转向场景优先的实用主义。

英诺创新空间创始合伙人、清华校友总会互联网与新媒体专委会秘书长邓永强则告诉《科创板日报》记者,DeepSeek降低的是成本,而不是极大提升模型本身的性能,“就像小米的性价比要比苹果高,但不代表性能比后者优越。事实上,国内外目前就有不少模型要比DeepSeek性能强,比如OpenAI o3、阿里的通义千问。”

由此可见,DeepSeek没有发明新范式,但其重要意义在于帮助RL(强化学习)和test-time scaling(模型推理阶段规模化)这一新训练范式真正被大众熟知。

《科创板日报》记者注意到,对标OpenAI o1,DeepSeek-R1采用的是后训练模型,即test-time scaling(模型推理阶段规模化),而此类模型的Scaling Law才刚刚开始,还有着很大的上限。国内大模型厂商中同为强化学习等后训练方式的还有月之暗面kemik1.5、智谱GLM-Zero-Preview等,这些模型都于近期更新,且都注重推理和逻辑思考,擅长处理数理逻辑、代码和需要深度推理的复杂问题。

一位头部机构投资人告诉《科创板日报》记者,DeepSeek-R1用到的MoE技术,之前早有企业用到,技术上并无本质创新,后面很大概率有团队会做出超越DeepSeek的模型。

“预计国内某些大模型企业后续也会发布与DeepSeek技术路线相似的模型。但从用户量级和实际效果的角度,会不会像 DeepSeek如此成果显著、市场叫好、上线后表现如何,还有待观察。”

大模型“六小虎”三家留守AGI

DeepSeek的爆火无疑将导致大模型行业洗牌加速。事实上,大模型六小虎此前已经走向分化。

其中,零一万物是第一家公开大幅调整发展方向的基础大模型创业企业。李开复此前公开表示,零一万物已与阿里云成立 “产业大模型联合实验室”,零一万物大部分训练和 AI infra 团队会加入该实验室。这之后,零一万物将不再追求训练超级大模型。

就在今日,零一万物产业大模型传来最新动态:公司与苏州高新区联合成立的产业大模型基地正式授牌,基地将聚焦垂直产业,与中细软集团、创新奇智、倍漾量化等产业链企业,探索大模型技术的产业化路径。这意味着,零一万物对产业化探索的进一步深入。

此外,零一万物近日还宣布,公司研发的海外 AI 应用PopAi接入了DeepSeek-R1模型。

百川智能则在2024年明确了走向医疗的赛道。近期公司CEO王小川更是下场做起了VC投资人,聚焦AI、具身智能、医疗等技术领域。

MiniMax将业务重点转向了海外市场。其旗下的明星产品Talkie在2024年上半年成为美国下载量第四的人工智能应用。但12月中旬,Talkie被苹果应用商店下架。有知情人士对《科创板日报》记者表示,目前,海外监管正在加强对社交类APP的审查,“Talkie可能存在违反苹果公司相关政策或海外政府的监管政策。”

前述投资人对《科创板日报》记者分析,从业务方向上看,上述三家大模型“小虎”已经不再将重点放在基础模型的研发上,而是追求现有大模型技术在垂直领域的落地应用。“目前专注实现技术创新和追求AGI的可以说仅剩下智谱、月之暗面以及阶跃星辰。”

对于将如何应对DeepSeek的冲击,智谱方面对《科创板日报》记者表示,“在努力做Agent落地以及多模态发展。”

业务层面,智谱的To B定位明确,并跑在了行业领先的位置,同时也在加大对to C市场的开拓。1月23日,智谱正式上线GLM-PC。其是基于智谱多模态大模型CogAgent,为面向公众使用的电脑智能体。近日,三星宣布最新款旗舰手机Galaxy S25系列将搭载智谱的Agentic GLM技术。

上述投资人表示,一定程度上,智谱开源生态会受到DeepSeek低成本开源模型的直接冲击,“但智谱一直在做B端私有化部署,为大型国企定制解决方案,2024年商业化收入增速150%,B端的护城河还是较深的,而且B端用户是最具付费能力的。”

而月之暗面方面,《科创板日报》记者从知情人士处了解到,将继续攻坚先进技术,做好Kimi这个产品本身。

2月12日,OpenAI发布了关于推理模型在竞技编程中应用的研究论文报告,其中提到,DeepSeek-R1和Kimi k1.5通过独立研究显示,利用思维链学习(COT)方法,可显著提升模型在数学解题与编程挑战中的综合表现。

“在技术领域,实际上Kimi的闭源模型Kimi1.5受到业内认可,但由于闭源模型本身的限制,在舆论上可能被deepseek压制。”上述投资人进一步表示,“目前DeepSeek还只聚焦大语言模型,实际上并没有将业务拓展到多模态领域,而且其v3模型主要在数学和代码等能力方面比较突出,其他通用类文本生成、理解等方面效果还有提升空间。”

“六小虎”中最低调的阶跃星辰,则在近期发布了Step-1o Vision多模态理解大模型。据了解,Step-1o系列是阶跃星辰研发的端到端文本、视觉、语音三模态生成理解一体化模型。

上述投资人对记者表示,阶跃星辰一向低调,但背后有旷视联合创始人、CEO印奇以及原微软全球执行副总裁沈向洋的支持,同时还有上海国资扶持,技术上很有潜力,“但如何在技术和市场中寻求平衡,会不会成为政策导向型的样板工程,可以观察后续发展。大模型领域目前乾坤未定,尚未形成绝对的护城河,仍处于发展的早期阶段。”

泥藕资本投资总监舒轶夫对《科创板日报》记者总结,DeepSeek对包括“六小虎”在内的其他大模型的冲击是巨大的,各家都在采取不同的应对策略,主要包括:

一、加强技术创新,例如OpenAI推出o3-mini;二、开源,OpenAI开源了gpt-3.5,也承认了OpenAI的闭源策略可能存在缺陷;三、战略合作和并购,例如零一万物和阿里的合作。四、深耕特定领域或垂直方向,例如MiniMax的Talkie,或者如百川智能专注医疗教育等垂直行业;五、强化用户体验,包括长文本、多模态、硬件结合等。

王晟表示,其他大模型厂商可能会继续走向分化,“如果要继续卷基础大模型,还是需要更高的投入。虽然DeepSeek现在是做的比较好,但是如果往GPT5级别的大模型走,肯定还需要更多的算力。”OpenAI CEO山姆·奥特曼近期宣布,OpenAI将数月内推出GPT-5。

燧原科技高级总监何万青博士则告诉《科创板日报》记者,“AI大模型产业是一个生态环境,蓬勃发展郁郁葱葱才是最终目的,阳光、雨露、运气都可能让一棵大树如DeepSeek脱颖而出,但是更重要的难道不是整个森林的生态繁荣?这个市场容得下多家大模型企业,各家其实做的业务都有差异化。”

地方国资可能撑起大模型后续融资

除了技术路线和业务模式上的重构,大模型创业企业的资产价值也面临重估。大模型研发过去耗资巨大,DeepSeek带来的研发成本降低,或动摇是资本市场对大模型创业企业的估值。

水木创投合伙人张静告诉《科创板日报》记者,DeepSeek的出现对大模型企业的估值会产生较大影响,由于成本大幅下降,估值可能要下降,对后入局者会产生两种影响,一是竞争加剧,让后入局者更加困难;另一方面也可能促使一些具有独特技术的企业“轻松”入局,因为训练成本下降。

王晟对此则呈较为乐观的态度,他认为,此前大模型独角兽动辄数十亿的融资导致“血条较厚”,还可以撑一段时间。“另外,因为大模型代表最先进的AI能力输出,也代表新质生产力,所以地方政府对此非常看重,大模型及背后资金的竞争,在某种程度上,已经上升到了城市发展战略及产业规划之争,大模型独角兽所在城市和国资很大概率上还会继续支持。毕竟DeepSeek虽然很强,但是总部只能落在一个城市。”

值得一提的是,DeepSeek的现象级崛起也引发创投行业反思:此前投出大模型“六小虎”的创投机构为什么集体错过?

水木资本董事长唐劲草对《科创板日报》记者分析称,投资人集体错过DeepSeek的原因是多方面的:一方面,DeepSeek自身的低调、独立性以及资金充足、对商业化兴趣不大的态度使其未能吸引到足够的外部投资;另一方面,中国VC的偏好、市场对高估值项目的担忧以及外部环境的变化也对其融资造成了阻碍。这些因素共同导致了DeepSeek在早期阶段未能获得更多的投资支持。

抱持乐观主义的投资人、创业者,则已经将目光放到了DeepSeek带来的AI行业生态变化可能造就的AI应用爆发。

面壁智能CEO李大海告诉《科创板日报》记者,DeepSeek打破了算力垄断的神话,高效低成本路线,深耕原始创新释放巨大的势能,“DeepSeek出来后,其实我们的信心更强了,更笃定了我们的预判和方向。”据悉,面壁智能亦一直笃信开源的价值。

水木清华校友种子基金合伙人王学辉则表示,未来一定会产生各种AI应用,“但真正的超级应用,一开始一定会像当年的BAT、后来的抖音、拼多多一样,从看不见到看不起、看不懂最后追不上。”