英伟达财报前精准狙击？这家独角兽强势进军AI推理不用HBM做到世界最快

《科创板日报》8月28日讯（编辑朱凌）当地时间周三盘后，英伟达即将公布整个二级市场的最后一份重磅二季报，全球投资者因此高度紧张。而就在前一天（当地时间8月27日），美国人工智能处理器芯片独角兽Cerebras Systems基于其自己的芯片计算系统发布了号称世界上速度最快的AI推理服务，声称比使用英伟达H100 GPU构建的系统快十到二十倍。

目前，英伟达GPU在AI训练和推理两方面都占据着市场主导地位。Cerebras自2019年推出首款AI芯片以来，一直专注销售AI芯片和计算系统，致力于在AI训练领域挑战英伟达。

根据美国科技媒体The Information的报道，得益于AI推理服务，OpenAI今年收入预计将达到34亿美元。既然AI推理的蛋糕这么大，Cerebras联合创始人兼首席执行官安德鲁·费尔德曼表示，Cerebras也要在AI市场上占据一席之地。

Cerebras这次推出AI推理服务不仅开启了AI芯片和计算系统之外，基于使用量的第二收入曲线，更是发起了对英伟达的全面进攻。“从英伟达手中抢走足够让他们生气了的市场份额。”费尔德曼如是说。

又快又便宜

Cerebras的AI推理服务在速度和成本上均表现出显著优势。据费尔德曼介绍，以每秒可输出的token数量来衡量，Cerebras的AI推理速度是微软Azure、亚马逊AWS等云服务商运行的AI推理服务的20倍。

费尔德曼在发布会现场同时启动了Cerebras与亚马逊AWS的AI推理服务，Cerebras可以瞬间完成推理工作并输出，处理速度达到每秒1832个tokens，而AWS需要几秒钟才能完成输出，处理速度仅为每秒93个tokens。

费尔德曼称，更快的推理速度意味着，可以实现实时交互式语音回答，或通过调用多轮结果、更多外部来源、更长文档，从而获得更准确、更相关的回答，给AI推理带来质的飞跃。

除了速度优势外，Cerebras还有巨大的成本优势。费尔德曼表示，Cerebras的AI推理服务性价比是AWS等的100倍。以运行Meta的Llama 3.1 70B开源大型语言模型为例，该服务的价格为每个token仅需60美分，而一般云服务商提供的相同服务每个令牌价格为2.90美元。

目前最大GPU面积的56倍

Cerebras的AI推理服务又快又便宜的原因在于其WSE-3芯片的设计。这是Cerebras今年3月推出的第三代处理器芯片，它的尺寸巨大，几乎相当于一个12英寸半导体晶片的整个表面，或者说比一本书还要大，单体面积达到约462.25平方厘米。它是目前最大GPU面积的56倍。

英伟达财报前精准狙击？这家独角兽强势进军AI推理不用HBM做到世界最快-编程日记

WSE-3芯片没有像英伟达那样采用需要通过接口连接才能访问的独立高带宽存储器（HBM）。相反，它将内存直接内置在芯片中。

英伟达财报前精准狙击？这家独角兽强势进军AI推理不用HBM做到世界最快-编程日记

得益于芯片尺寸，WSE-3的片上存储器（On-chip memory）高达44G，几乎是英伟达H100的900倍，内存带宽是英伟达H100的7000倍。

费尔德曼表示，内存带宽是限制语言模型推理性能的根本因素。而Cerebras将逻辑和内存整合到一个巨型芯片中，拥有巨大的片上内存和极高的内存带宽，可以快速地处理数据并产生推理结果。“这是GPU不可能达到的速度。”

除了速度和成本优势外，WSE-3芯片还是AI训练和推理两面手，在处理各种AI任务时都具有卓越的性能。

根据计划，Cerebras将在多个地点建立AI推理数据中心，并将按请求次数对推理能力收费。同时，Cerebras还将向尝试向云服务商出售基于WSE-3的CS-3计算系统。

英伟达财报前精准狙击？这家独角兽强势进军AI推理不用HBM做到世界最快

中国信通院：7月国内市场手机出货量2420.4万部同比增长30.5%

机构：预计2024年苹果全球收入将首次突破4000亿美元

最新文章

债市行情火热，“债牛”会持续多久？

终止重大资产重组！这家A股公司，跨界新能源计划告吹！

挖金客：已在移动信息化业务板块开展AI机器人外呼业务

深圳：每年发放最高5000万元“语料券” 促进语料开放共享和交易推动数据要素市场建设

深圳：每年发放最高5000万元“语料券”，促进语料开放共享和交易，推动数据要素市场建设

深圳：每年发放最高1亿元“模型券”，降低人工智能模型应用成本

深圳：对科技重大专项和人工智能“揭榜挂帅”项目，给予最高3000万元资助

深圳：设立人工智能产业基金坚持“投早、投小、投长期、投硬科技”

深圳：每年投入最高3亿元，聚焦自动驾驶、人工智能芯片等重点领域

深圳：围绕先进制造业、现代服务业和科学研究等重点领域，每年投入最高1亿元

标签

关注我们么么哒！

英伟达财报前精准狙击？这家独角兽强势进军AI推理 不用HBM做到世界最快

中国信通院：7月国内市场手机出货量2420.4万部 同比增长30.5%

机构：预计2024年苹果全球收入将首次突破4000亿美元

猜你喜欢

对话XREAL创始人徐驰：不想盲目跟风爆火的AI眼镜，“跑对方向比抢跑更重要”

30亿元！智谱完成新一轮融资 大模型“六小龙”年内累计吸金超200亿元

AI端侧爆发 桌面机器人迎量产！产业链上市公司加码“抢鲜”

英伟达Blackwell游戏显卡进入发布倒计时 我们目前知道些什么？

泰凌微：发布基于TL721x及TL751x芯片的机器学习与人工智能发展平台TLEdgeAI-DK

泰凌微：公司发布基于TL721x及TL751x芯片的机器学习与人工智能发展平台TLEdgeAI-DK

国芯科技：服务器和云应用高性能量子安全芯片新产品内部测试成功

看好ASIC理由又多一个？算力战争下半场开启 AI推理时代或将至

OpenAI前首席科学家苏茨克维：具有推理能力的人工智能将难以预测

存储与封测业务多重突破，佰维存储受益AI浪潮大有可为

增速将超过GPU？ASIC成AI芯片“更优选择” 科技巨头扎堆布局

英特尔临时CEO承认：18A技术若不成功将可能分拆代工部门

最新文章

债市行情火热，“债牛”会持续多久？

标签

关注我们 么么哒！

关注我们的公众号

英伟达财报前精准狙击？这家独角兽强势进军AI推理不用HBM做到世界最快

中国信通院：7月国内市场手机出货量2420.4万部同比增长30.5%

30亿元！智谱完成新一轮融资大模型“六小龙”年内累计吸金超200亿元

AI端侧爆发桌面机器人迎量产！产业链上市公司加码“抢鲜”

英伟达Blackwell游戏显卡进入发布倒计时我们目前知道些什么？

关注我们么么哒！