清华系一公司加入AI战局，要帮大模型公司降低算力成本

界面新闻记者 | 佘晓晨
界面新闻编辑 | 宋佳楠

3月31日，清华系创业公司无问芯穹在上海发布了大模型开发与服务平台“无穹Infini-AI”，公司发起人汪玉携联创团队首次集体公开亮相。这是一家主要做大模型软硬件一体化计算加速解决方案的公司，成立不到一年，背后已有豪华阵容加持。

天眼查信息显示，上海无问芯穹智能科技有限公司去年5月才成立，12月时曾发生工商信息变更，新增多名股东，包括百度、腾讯和智谱AI。红杉中国、金沙江资本、徐汇资本和无限基金此前也入股了这家公司。

界面新闻了解到，无问芯穹的发起人汪玉是清华大学电子工程系长聘教授、系主任，长期从事智能芯片、高能效电路与系统研究，他的另一身份是AI芯片公司深鉴科技联合创始人。无问芯穹联合创始人兼CEO夏立雪曾任阿里云用户增长产品技术负责人，汪玉是其导师。

选择大模型算力成本优化的创业方向，和他们对于市场缺口的洞察及过往经验有关。

2022年底，大模型引发社会广泛关注后，夏立雪和汪玉认为，国内整体算力情况距离国际先进水平有明显差距，光靠芯片工艺提升或是多元芯片的迭代已远远不够，需要建立一个大模型生态系统，让不同模型能自动部署到不同硬件上，促使各种算力得到有效利用。

此外，无问芯穹联合创始人兼CTO颜深根为原商汤科技数据与计算平台部执行研究总监，帮助商汤搭建了两万片GPU的大规模高性能AI计算平台。联合创始人兼首席科学家戴国浩现任上海交通大学长聘教轨副教授，清源研究院人工智能设计自动化创新实验室负责人。

人工智能对算力资源的需求及高昂成本，是大模型落地的公认难题。这或许是前述入股者在光环之外，向无问芯穹抛出橄榄枝的重要原因之一。

市场咨询机构IDC和浪潮信息发布的数据显示，预计2022到2027年期间，中国智能算力规模年复合增长率达33.9%。中信证券研报指出，随着业界对超长文本的支持需求不断提升，预计硬件基础设施也将随之升级，以满足海量文本数据的存储和计算要求，因此持续看好AI算力层面的投资机会。

算力贵、算力少、不会用，这是目前大模型落地的三个关键难点。夏立雪指出，各个公司对于AI技术的掌握能力不一样，获取适合自己业务规模和需求的算力能力也不相通。此外，各家公司面临的共同难题是如何控制大模型的“性价比”。

例如，行业软件公司具有稳定的业务基础和一定的软件开发实力，但随着业务深入探索，他们需要与业务增长速度匹配的训练和推理资源。当应用场景突然出现爆款时，公司立刻需要弹性算力，这时遇到的难点就是灵活性和性价比——一个具有100万DAU（日活）的应用，每年要承担的成本达到千万级。

当下的大模型产业包含大模型公司、软件和应用公司及下游解决方案公司，而解决方案公司所做的就是控制算力成本。

无问芯穹处于模型和芯片之间的“中间层”。汪玉曾指出，我国AI大模型的发展在芯片和算法上存在挑战。在模型层和芯片层之间，如何做高效的部署，通过统一的中间层解决异构芯片的适配问题会是一条重要途径。该公司在努力做这样的中间层，在云端优化不同的算力，以此支撑更多不同的模型。

为解决大模型落地“最后一公里”的问题，近两年已有不少“中间层”公司的探索浮出水面，但方向不尽相同。

成立于2021年的潞晨科技，主要通过分布式AI开发和部署平台降低大模型落地成本。今年，潞晨科技旗下的国内开源团队Colossal-AI开源Sora复现架构方案Open-Sora，据称可降低46%复现成本。有头部AI和RPA（机器人流程自动化）背景的澜码科技则基于底层大语言模型制定⾃动化平台，协助企业实现人机交互。

近一年，无问芯穹主要在“优化”上进行逐步突破。2023年11月，其宣布了在英伟达GPU和AMD等芯片上取得的优化效果，据称取得了当时最好的计算加速效果，实现大模型任务2到4倍的推理速度提升。目前，无穹Infini-AI已支持20多个模型及10余种计算卡。

具体而言，该公司对大模型成本的优化包含算法创新、模型计算优化、平台优化和硬件推理优化四个方面。已有的落地案例是，同道猎聘在一个月前发布了AI驱动的数字人面试官等AI应用，其中部分应用使用了无问芯穹提供的弹性算力方案，在推理加速和成本上实现了进步。

发布平台的同时，无问芯穹宣布“无穹Infini-AI”自3月31日起正式开放全量注册，给所有实名注册的个人和企业用户提供百亿tokens（文本处理过程中的最小单位）免费配额。如何加速拓展商业化，将是这家新AI初创公司面临的重要节点。

不过这仅仅是开始。如今大模型行业已经“明星”云集，有了资本支持之后，在不同缺口着力的创业公司如何建立长久的商业模式，决定了谁能在淘汰赛中留到最后。

清华系一公司加入AI战局，要帮大模型公司降低算力成本

贾跃亭谈小米造车：对标、抄袭和浅层次的创新无法带来根本性的技术变革

微软据悉将“解绑”Teams与Office

最新文章

美国太空探索技术公司：正与波兰政府合作寻找“猎鹰9”火箭残骸

小米将推出首款AIPC产品

蓝思科技称与灵伴科技合作为全球AI眼镜出货提供支撑

我国科研新成果：量子直接通信有望进入实际应用

快讯丨4.48万元起售！宏光MINIEV四门版正式上市

唯品会2024年GMV增长承压 2025年特卖电商如何转守为攻？

全球开发者先锋大会多款机器人亮相业界“顶流” 宇树科技携两款机器人参展

DeepSeek一体机、算力超市、智能硬件产业联盟……多项AI产业重磅合作在GDC官宣!

立昂技术(300603.SZ)：引领智能应用加速，释放DeepSeek大模型无限潜能

腾讯元宝超越豆包升至中国区免费APP下载排行榜第二仅次于DeepSeek

标签

关注我们么么哒！

清华系一公司加入AI战局，要帮大模型公司降低算力成本

贾跃亭谈小米造车：对标、抄袭和浅层次的创新无法带来根本性的技术变革

微软据悉将“解绑”Teams与Office

猜你喜欢

立昂技术(300603.SZ)：引领智能应用加速，释放DeepSeek大模型无限潜能

600多人参加！ 主题为大模型赋能资管领域的iAMT研修班在沪举办

DeepSeek成GDC开幕式关键词，2025年或是智能体元年

招商积余接入DeepSeek大模型上线本地知识库应用

做全球最大人工智能孵化器！模速空间打造全国首个算力生态平台｜直击GDC

全国首个算力生态平台“模速空间算力生态超市”正式揭幕

大模型迈向“多模态”时代，“情绪化”成关键趋势 | 直击2025GDC

“六小虎”找新出路，阶跃星辰押注智能体

水滴公司与腾讯云战略合作升级，DeepSeek大模型落地保险场景再提速

阶跃星辰创始人、CEO姜大昕：预计今年3月开源公司自研的图生视频模型

腾讯企业微信新版本上线 灰度接入满血版DeepSeek-R1大模型

独家｜商汤首席科学家林达华：开源模型与顶尖闭源模型的差距正在迅速缩小

最新文章

美国太空探索技术公司：正与波兰政府合作寻找“猎鹰9”火箭残骸

标签

关注我们 么么哒！

关注我们的公众号

600多人参加！主题为大模型赋能资管领域的iAMT研修班在沪举办

腾讯企业微信新版本上线灰度接入满血版DeepSeek-R1大模型

关注我们么么哒！