摩尔线程张建中：在AI战场，万卡已成最低标配

界面新闻记者 | 李彪
界面新闻编辑 | 宋佳楠

“在AI主战场，万卡是最低标配。”

随着Scaling Law（规模越大，性能越好）成为行业共识法则，国内百模大战仍在冲击更大的目标，摩尔线程CEO张建中作出了上述判断。

而参数量和数据量的不断增加，意味着对算力的需求也在增加。在此趋势下，国产厂商都在加紧建设更大规模的AI智能算力数据中心。去年发布并落地多个千卡（显卡，即GPU）智算中心集群后，GPU厂商摩尔线程近期又推出了首个万卡集群方案。

当前训练AI大模型离不开GPU，各公司拥有GPU的数量已经成为衡量算力规模的基本依据。相比OpenAI、谷歌、Meta等国际巨头成批采购几十万张英伟达显卡搭建数据中心集群，国内公司大多数还只能采购几千张，只有字节等少数头部厂商拥有上万张卡规模的算力集群。

卡的数量直接决定了训练一个大模型所用的时间。张建中提到，去年国内“百模大战”开打后，几乎每个月都有新的模型发布。而现在，一家AI大模型公司训练迭代一次大模型的时间已经缩短为两周，超过两周就跟不上同行的速度。

去年英伟达的H100以及后续的高端GPU对华出口遭禁后，国内一度出现严重的算力紧缺。张建中告诉界面新闻记者，从国际巨头计划采购英伟达显卡的订单变化来看，今年市场对算力的需求有增无减，万卡，甚至超万卡集群，是这一轮大模型竞赛的入场券。公司的目标是在国内市场“占位”，努力保证训练大模型时“有卡可用”。

今年也是行业广泛热议的大模型应用落地之年。除传统的ChatGPT聊天机器人外，像上半年爆火的Sora、国内对标Sora的快手“可灵”，以及更多的AI手机、智能驾驶端侧模型等，都在寻找落地场景。这背后都需要更多的算力支持。

在张建中看来，当下“Scaling Law”法则在AI大模型行业依然奏效，即为了追求更好的性能，规模做大的同时，算力需求也越来越大。

公开信息显示，2020年左右，OpenAI使用约1万块英伟达GPU来训练GPT-3.5模型，当时的模型参数量只有1750亿。到了2023年，OpenAI推出1.8万亿参数的GPT-4时，市场调研机构 SemiAnalysis估测其已经拥有近3万块英伟达GPU。

虽然GPT-5迟迟未面世，规模还是一个秘密，但外媒曝光了OpenAI与微软正在合作的“星际之门”计划。这是一个包含百万张GPU的超级数据中心，计划在2028年建成。

国内的AI算力市场也从去年开始不断扩容，全国各地掀起了智算中心“基建潮”。北京、上海、深圳、安徽、江苏五地，目前已公布未来几年内智能算力中心建设的具体方案，青岛、贵州、南昌等超过30个地方城市正渐次加入。

据行业自媒体“中国IDC圈”不完全统计，到2024年5月下旬，我国共建设有智算中心283座，其中已投产运营的达到89座，超过一半处于开工或在建状态。

界面新闻此前从多位行业人士处了解到，各地建设智算中心正处于“跑马圈地”的阶段。一方面，国内需要建设更多智算中心，将“盘子”做大，从而保证算力供应；另一方面，由于英伟达显卡遭禁，国产AI芯片的单卡性能与之相比存在较大差距，国产厂商普遍选择走集群化、规模化路线，将多个小型单点算力节点通过高速网络互连技术建成一整个超大规模的算力集群。也因此，落地的智算中心越建越大。

一家头部国产服务器厂商在一场活动上提到，去年国内建智算中心都以万卡为目标，今年整体需求水涨船高，开始以5万卡作为新的目标。眼下能够满足AI公司训练模型的GPU是市场上的硬通货，基本上是“谁有GPU，谁能建智算中心”。

但在张建中看来，智算中心从千卡到万卡，不只是简单的“堆卡”。规模变大的同时，难度也呈指数级倍增——既要实现智算中心扩容，也要兼顾质量。这对厂商而言是一项极其复杂的系统工程。

算力利用率与稳定性是行业衡量智算中心质量的两项重要指标。目前，摩尔线程的千卡智算中心的算力利用率已达到50%，未来推动万卡集群智算中心落地时，目标是达到60%的算力利用率，同时保证99%以上的稳定性。这与国际巨头已十分接近，但要达到领先仍存在较大挑战。

摩尔线程张建中：在AI战场，万卡已成最低标配

低空经济“起飞”，成熟场景“落地”，无人机上岗护林员｜一线

2024世界人工智能大会今日开幕

最新文章

美国太空探索技术公司：正与波兰政府合作寻找“猎鹰9”火箭残骸

小米将推出首款AIPC产品

蓝思科技称与灵伴科技合作为全球AI眼镜出货提供支撑

我国科研新成果：量子直接通信有望进入实际应用

快讯丨4.48万元起售！宏光MINIEV四门版正式上市

唯品会2024年GMV增长承压 2025年特卖电商如何转守为攻？

全球开发者先锋大会多款机器人亮相业界“顶流” 宇树科技携两款机器人参展

DeepSeek一体机、算力超市、智能硬件产业联盟……多项AI产业重磅合作在GDC官宣!

立昂技术(300603.SZ)：引领智能应用加速，释放DeepSeek大模型无限潜能

腾讯元宝超越豆包升至中国区免费APP下载排行榜第二仅次于DeepSeek

标签

关注我们么么哒！

摩尔线程张建中：在AI战场，万卡已成最低标配

低空经济“起飞”，成熟场景“落地”，无人机上岗护林员｜一线

2024世界人工智能大会今日开幕

猜你喜欢

Grok登顶苹果美区应用商店免费榜榜首；Figure AI人形机器人现支持语音指令丨全球科技早参

华尔街提前狂欢！拆分传言下英特尔股价暴涨

“一上午11个咨询！” DeepSeek再度带火算力市场 年后开工英伟达H系列需求涨

20万张GPU“烧出”地表最强 AI？马斯克的Grok 3超1400分登顶排行榜，OpenAI联合创始人：略强于 DeepSeek-R1

打着最强AI名号涨价！马斯克X平台订阅费仅隔两月翻了一倍

马斯克在直播中首次披露Grok 3的训练成本：20万块英伟达GPU

晶丰明源推出多相数字控制器和DrMOS 为NVIDIA显卡提供高性能供电解决方案

#清华团队突破算力难题：4090显卡单枪匹马就能跑“满血版”DeepSeek-R1！有用户称整套方案成本不到7万元，直降95%以上

清华团队突破算力难题：4090显卡单枪匹马就能跑“满血版”DeepSeek-R1！有用户称整套方案成本不到7万元，直降95%以上

戴尔接近达成协议向xAI出售人工智能服务器，价值逾50亿美元

戴尔接近达成协议向xAI出售人工智能服务器 价值逾50亿美元

4090显卡单枪匹马就能跑满血版DeepSeek-R1，清华团队突破大模型算力难题

最新文章

美国太空探索技术公司：正与波兰政府合作寻找“猎鹰9”火箭残骸

标签

关注我们 么么哒！

关注我们的公众号

“一上午11个咨询！” DeepSeek再度带火算力市场年后开工英伟达H系列需求涨

戴尔接近达成协议向xAI出售人工智能服务器价值逾50亿美元

关注我们么么哒！