《科创板日报》2月12日讯(记者 黄心怡)DeepSeek掀起的算力热潮还在持续。中国电信昨日宣布推出了息壤智算一体机-DeepSeek版,在硬件层面以华为昇腾芯片为基础,提供8卡、16卡、32卡等多种规格型号。此前,京东云也发布DeepSeek大模型一体机,支持华为昇腾、海光、寒武纪、摩尔线程、天数智芯等国产AI加速芯片。《科创板日报》了解到,华鲲振宇也推出了DeepSeek大模型一体机方案。

《科创板日报》在采访中获悉,目前DeepSeek大模型一体机分为推理一体机和训推一体机。DeepSeek推理一体机内置DeepSeek-R1 32B、70B、满血版671B等不同尺寸模型,价格在几十万到数百万不等,主要面向对数据安全、数据隐私较为敏感的企业用户。而训推一体机的售价更高,用于DeepSeek-R1 32B模型的预训练和微调的一体机价格就达到数百万。

有云技术人士认为,大模型一体机能否产生经济价值是关键。“大模型一体机主要是本地化部署,解决的是数据隐私问题。之前大模型一体机的经济价值不高,高投入影响了其落地,未来还是需要应用能有更大的发展。”

▍DeepSeek模型私有化部署需求激增

“服务器繁忙,请稍后再试。”这是近期DeepSeek用户经历的日常,需求井喷让DeepSeek始终处于满负荷算力运行状态。

《科创板日报》记者在采访中了解到,由于直接API调用的不稳定,很多企业已经开始探索较为简易的私有化部署,甚至利用几张英伟达4090 显卡来尝试部署DeepSeek-R1 32B到70B的模型,

我们一开始安装了70B 的模型,但是1张4090 24G显卡跑不动,后来重新装了32B的大模型。”有企业信息化部门的人士表示。

“我们也通过英伟达显卡部署了DeepSeek模型,把业务跑起来了。但100人左右并发速度明显降低,用于内部知识库没问题,如果是其他应用还是需要专业一体机。”另一位IT人士表示。

记者从多名云计算厂商相关人士处获悉,在DeepSeek爆火后,不少云厂商接到了大量的用户咨询。“企业用户会现在公有云上进行测试,与需求是否适配,再考虑私有云部署、一体机等形式。” 一家运营商云的销售人员向记者介绍。

优刻得相关负责人表示,DeepSeek开源模型适配完成并上线后,云上访问量和用量激增。除却GPU云主机外,配套的其他产品也有相应的增长,比如并行文件存储UPFS、UModelVerse模型服务平台、微调服务平台等。还陆续受理到基于DeepSeek开源模型私有化部署的需求,比如一体机化、专有云化、全面国产化等场景

▍数百万投资成本是一道坎

选择私有化部署的企业,往往对于数据安全有较高的要求,但大模型一体机的硬件投入动辄百万级别,这对于不少企业是一道门槛。

目前,中国电信息壤智算一体机-DeepSeek版分为训推一体机和推理一体机两大类型,有入门型、通用性、增强型不同配置,售价在几十万到数百万不等,最高满血版推理一体机优惠价近600万元,训推一体机则更高。《科创板日报》从知情人士处获悉,京东云的DeepSeek大模型一体机的售价也在几十万到几百万不等。

“我们肯定是用私有化部署,安全第一。不过目前大模型一体机的投入产出性价比不高,之前也是曾经尝试过,因投入产出的暂缓执行了。”一名大型企业信息化负责人表示。

不少IT业内人士认为,DeepSeek大模型最大的优势在于开源与低成本,通过国产芯片算力,实现AI大模型的应用,可以让中国在更多领域、更多行业快速落地AI应用,但仍需要应用能有更大发展,才能让市场发展起来。“决定AI在企业中应用深度和广度的并不是模型价格,而是如何将内部知识加载进去在应用层面广泛接入的问题。大模型一体机主要是本地化部署,解决数据隐私问题。而大模型要先有应用价值。之前大模型一体机的落地,就遇到经济价值不够高的问题。

谈及未来大模型一体的市场空间,一名运营商云相关负责人告诉《科创板日报》记者,如果是在医疗、教育等领域的工程化类的项目,智慧医疗、智慧教育、智慧农业,未来可能会把一体机部署在客户现场,接入相关行业场景的知识库。然后训练出与应用场景密切结合的AI模型,同时集成到应用环境当中,给B端的企业提供服务。”

▍国产算力能否支撑DeepSeek满血版大模型部署?

《科创板日报》注意到,DeepSeek大模型一体化方案不少采用了国产算力芯片。

中国电信息壤智算一体机-DeepSeek版,在硬件层面以华为昇腾芯片为基础,提供8卡、16卡、32卡等多种规格型号。联想集团与沐曦联合发布基于DeepSeek大模型的一体机解决方案,以“联想服务器/工作站+沐曦训推一体GPU+自主算法”为核心架构。

京东云的DeepSeek大模型一体机,支持华为昇腾、海光、寒武纪、摩尔线程、天数智芯等国产AI加速芯片。

优刻得相关负责人对《科创板日报》表示,已同多家国产芯片厂商完成了对DeepSeek满血版和蒸馏版开源模型的适配工作。“从测试用户结果来看,现在可以用起来了。后续优刻得也会继续同国产芯片公司合作,在能用的基础上要进行优化达到好用,通过使用量的扩大降低成本,实现便宜用,提升全国产的体验。”

该负责人也指出,由于DeepSeek开源并不久,故根据市场的使用惯性来看,英伟达的GPU卡仍为当前中大型AI公司的使用主流卡型。“后续我们也会继续同各类企业对接,提供满足市场需要的各类AI资源。”

一名AI基础设施业内人士告诉记者,主流国产芯片已基本实现对 DeepSeek 蒸馏版小模型的兼容支持,不过满血版V3 和 R1 拥有 6710 亿参数,这使得它们对硬件的要求大幅提升,需在推理的解码部分部署 320 个 GPU,以实现完全的专家并行。

“各家芯片企业都会开展DeepSeek满血版的适配,但是否真正能够在几百张卡上跑起来,并达到比较好的token速率和性价比,这是关键。后续各家芯片的比拼就要高下见分晓了。”