12 月 13 日,在 AICon 全球人工智能开发与应用大会(AICon 北京 2024)上,英博数科 CTO 李小鹏正式对外发布全新「英博云」系列智能算力产品与服务,涵盖智算中心建设运维、GPU容器服务、先进算力实验室和产业孵化器四大板块,并在行业首提 “单位有效算力成本” 这一创新指标,推动智算行业向高效益、多样化的发展范式进阶。

英博云多款智算产品发布,首提「单位有效算力成本」新指标-编程日记

(英博云发布会现场,图片来源:英博云)

行业首提 “单位有效算力成本” 新指标

随着人工智能技术的广泛应用,智算行业正从规模化扩展迈向精益化运营,并呈现出三大关键发展趋势。一是全球通用大模型训练对算力需求持续攀升,集群规模从千卡级跃升至万卡乃至十万卡级,成为推动大模型技术进步的重要基石。二是垂直行业的AI应用迅猛发展,各行业对算力的需求更加分散且动态化。从科研、金融到娱乐、零售,各领域企业迫切需要灵活且弹性的算力支持,以满足多样化场景需求。三是在AI商业化加速的背景下,推理场景对算力的需求快速增长,逐渐超过训练算力需求,成为市场发展的核心驱动力。

英博云多款智算产品发布,首提「单位有效算力成本」新指标-编程日记

(高算力成本:制约大模型技术演进与应用繁荣,图片来源:英博云)

时至今日,算力行业依然缺少有效的成本效益评价体系,难以精准衡量实际算力利用水平,导致企业使用有效智能算力的成本过高。对此,英博数科创新性地提出了“单位有效算力成本”这一评价体系及计算公式,为行业提供了一套全新的标准化评估体系。与传统以装机算力、设备成本、机电成本和运维成本等固定支出为核心的评价体系不同,“单位有效算力成本”将评价重点从硬件投入转向实际效益——通过引入“卡可用率”、“卡利用率”和“模型算力利用率(MFU)”三大关键指标,这一创新体系能够精准衡量实际算力利用水平,有效规避了算力资源闲置、设备故障频发以及整体利用率低下等行业痛点导致的评估误差,提升算力效率和效益评价的准确性。

英博云多款智算产品发布,首提「单位有效算力成本」新指标-编程日记

(“单位有效算力成本”计算公式,图片来源:英博云)

李少鹏指出,“单位有效算力成本”不仅能够帮助企业优化成本效益,还为算力资源的高效配置提供了科学依据。

多款产品发布,智算产品新范式呈现

智算中心建设运维解决方案

针对通用大模型集中式、大规模训练的需求,英博云提供了高效益的智算中心建设运维解决方案。英博云具备多个智算中心交付经验,能够提供一整套标准化、模块化的建设方案。英博云自研的高性能并行存储解决方案、专业的硬件测评与检测体系以及细粒度的集群监控和自动化故障恢复体系,能够在提供高硬件稳定性集群的同时,提升集群的可用性。依托成熟的算力调度平台,英博云还支持通过容器化形式为长尾客户提供高效、弹性的算力服务,有效满足不同规模和需求的用户。针对通用大模型集中式、大规模训练的需求,英博云提供了高效益的智算中心建设运维解决方案。英博云具备多个智算中心交付经验,能够提供一整套标准化、模块化的建设方案。

英博云多款智算产品发布,首提「单位有效算力成本」新指标-编程日记

(英博云智算中心建设运维解决方案,图片来源:英博云)

英博数科智算中心建设运维解决方案目前已在京能项目落地。英博数科在智算中心建设运维方面拥有的独特优势,成为推动项目持续进展的核心力量。供应链方面整合资源与众多供应商合作保稳定,集群运维组网方面从选型到建设交付皆有高标准规范与专业保障,推动项目进展,未来有望更多智算中心项目落地助力产业发展。

GPU 容器服务

针对垂类大模型分散、临时、动态的弹性训练需求,英博云推出了赋能中小客户的GPU 容器服务。通过Vcluster形式,英博云提供GPU和CPU资源混合的弹性K8S集群服务,满足大模型并行训练的工程需求。与此同时,英博云支持SSH和Kubectl管理操作,为用户带来灵活便捷的体验。

英博云多款智算产品发布,首提「单位有效算力成本」新指标-编程日记

(英博云GPU容器服务架构图,图片来源:英博云)

秒级别的容器启停和计费粒度,企业级的并行存储服务,使其能够提升GPU资源使用效率、降低使用成本,并能支持容器数据持久化和模型数据的高速共享。加之英博云提供内网预定义场景镜像仓库、常用模型库、常用数据集等数据源服务,能够有效提高数据准备和环境配置效率。目前,英博云GPU容器服务已经开始服务清华大学、中国人民大学等高校科研机构及中小微企业。

先进算力实验室

先进算力实验室致力于成为业界顶尖的算力性能评测中心,实验室围绕硬件评测、软件评测以及行业服务展开工作,为企业算力基础设施的升级与优化提供前瞻先进、切实可行的建议,助力提升算力效率和业务表现。

英博云多款智算产品发布,首提「单位有效算力成本」新指标-编程日记

(英博云先进算力实验室,图片来源:英博云)

在硬件评测方面,对GPU、交换机、光模块、并行存储等进行严格测试,确保设备性能符合高标准;在软件评测方面,涵盖基座模型、训练框架、微调框架、推理框架等,为智能算力的优化提供全方位支持。通过提供行业标准制定和定制化服务,先进算力实验室助力企业在智能算力领域不断突破创新。实验室已经开展工业界主流 GPU 芯片的测试。

赋能AI产业链,共创智算未来

在智算领域持续创新发展的进程中,英博云积极探索多元化发展路径,产业孵化器进一步夯实了英博云在智算领域的生态布局。英博云产业孵化器集成算力、资金、技术、市场与生态优势,全方位赋能 AI 创业。提供强大算力支持,引入资金助力,资深技术团队指导,精准市场策略帮扶,构建生态促合作。此外,产业孵化器通过联合AI产业链上下游,探索算力组合投资新模式,挖掘AI产业潜在方向,赋能企业实现技术研发与业务扩展的双向突破,为 AI 创业与行业发展注入新活力与动力。

英博云多款智算产品发布,首提「单位有效算力成本」新指标-编程日记

(英博云发布会现场,图片来源:英博云)

英博云系列产品与服务的发布,为智能算力行业树立了全新标杆。通过创新的“单位有效算力成本” 指标,以及多样化的智算产品与服务,英博数科将助力企业在大模型研发与应用中实现更高效的资源配置和成本控制。此外,在此次大会期间,英博云全新产品精彩展示。产品创新的特性与可靠的性能,吸引了众多与会者驻足了解,赢得了他们的广泛关注。

英博云多款智算产品发布,首提「单位有效算力成本」新指标-编程日记

(英博云发布会现场,图片来源:英博云)

未来,英博数科将继续以“高效益、多样化” 为核心,深耕智算领域,巧妙施行低成本策略,精细化、精准化调配算力资源,携手更多企业共同探索 AI 时代的无限可能,为 AI 技术的研发与商业化应用注入强大动力,推动智能算力行业不断向前发展。