《科创板日报》4月30日讯(记者 敖瑾)由大语言模型催生的新一轮人工智能浪潮,在资本和行业领域都掀起了又一圈波澜。生成式AI概念成为了行业大咖躬身入局的创业热点,它在资本市场也成为了一时无两的新风口。

而更早一批打着人工智能标签进入市场的创业企业,在行业再度成为市场关注的热点之际,又经历了什么?

博瀚智能创始人郭玮在近日接受《科创板日报》记者采访时表示,公司总体而言受益于这轮人工智能2.0的浪潮,但与此同时也受到了负面影响。

“大模型代表了AI2.0时代非常重要的模型技术发展,但由于大模型的火热,大家的关注度更多地集中在算法本身,一定程度上忽略了各类模型在复杂场景中落地。因此,像博瀚智能这类以数据为中心,聚焦AI场景落地的企业,在这一波热潮中受到投资机构的关注度会低一些。”

博瀚智能成立于2019年,是一家聚焦于打造数据和模型管理体系平台的人工智能企业,业务核心在于依托平台基础设施,为不同垂直场景提供AI解决方案。

近期,博瀚智能宣布完成新一轮融资,投资方为海创汇。此前,公司已完成五轮融资,投资方包括力合科创、金浦投资、中信创投以及卓源亚洲等。

大模型热度带来拓宽应用场景机遇

郭玮告诉《科创板日报》记者,人工智能领域曾在2022年落入最低谷,“那时候很多公司恨不得把AI标签扒掉,人工智能可以说是企业的一个负面标签。”

情况在2023年发生转变。随着ChatGPT的火爆,整个人工智能行业发生了巨变,人工智能又成为了创业热点以及资本追逐的风口,社会大众对人工智能的认知也出现了前所未有的提升。

郭玮认为,尽管当前行业内外对大语言模型的关注,让以数据为中心聚焦AI应用的博瀚智能在资本层面的关注度不足,但大模型接下来的落地应用,将进一步拓宽以数据为中心这一技术路线的落地应用空间。

随着开源成为大模型领域的趋势,整个行业的侧重点会从模型体系本身,转移到模型的应用,尤其是对于基础模型相对稳定的语言类大模型LLM。而模型应用,又涉及到使用什么样的技术路线进行落地。”因此,郭玮认为,大模型的兴起,将给博瀚智能这样的以数据为中心的企业带来新的机遇。

郭玮表示,博瀚智能目前的数据服务及大模型落地服务,包含了为客户提供智能数据平台和LLMOps大模型平台两大方面,“最终目的是让客户实现人工智能更高效的落地。”其预期,明后两年大模型以及数据两大板块会为博瀚智能的营收带来提振。

《科创板日报》记者关注到,近年来已出现不少以数据为中心构建AI系统的创业企业。前百度首席科学家吴恩达成立的Landing AI也是其中之一。

据公开资料,Landing AI开发了一个计算机视觉平台LandingLens,它利用深度学习技术来帮助制造商进行机器视觉检测,发现产品缺陷;以数据为中心的方法,是该平台快速且易于使用的关键。

该公司在2021年完成数亿元融资,由工业物联网公司McRock Capital领投,英特尔投资、三星旗下的催化剂基金、投资公司Insight Partners和加拿大养老金计划投资委员会等跟投。

在平台工具软件之外,博瀚智能以工业质检作为目前公司AI商业化落地的突破口。郭玮表示,公司对于落地应用,有过一段不短时间的探索。最初,公司落地聚焦的是医疗领域。“一开始是用在皮肤科诊断方面,但最终落地仍然遇到了商业问题,其核心原因是在于,如何将AI辅助诊断与当前的医疗诊断流程和付费体系融合起来。”

其表示,在落地应用探索过程中,深圳清华大学研究院及包括力合科创等在内的投资方给予了很大的帮助,“除了产业链上下游的对接,力合科创从公司发展早期还提供了创业资金、办公场地、政府对接等赋能。”

据悉,当前,博瀚智能亦在新能源、汽车制造、与食品以及航天领域客户进行对接,进一步拓宽公司的落地场景。

数据为核心的人工智能可适应复杂场景应用

除了企业本身的变化,2019年就入局人工智能领域的郭玮,看到并经历了整个行业近年来的演进。他认为,整个人工智能领域,事实上在大趋势上都在进一步强调数据的重要性。

其介绍,在2021年之前,人工智能领域聚焦的重点突破在于如何提升深度学习网络的性能以及打造性能更加优异的模型,模型成为了AI发展、技术发展以及落地的技术瓶颈。因此,大量公司围绕着人工智能模型展开工作,如当时非常典型的AI四小龙就是以模型为中心的代表。

在以模型为中心的技术路线中,对企业最核心的价值和能力的衡量是以算法能力为基础的,而衡量的实施方式之一,便是让各企业团队基于固定的数据集开发模型,再去评估企业算法模型的优劣,例如各类AI算法大赛的排名等。

“这种价值评估方式,在人工智能发展过程中确实起到了很大的推进作用,大幅度推动了包括CNN、RNN、Transformer等技术的发展,产生了一批非常优秀的算法网络结构和模型,包括大模型。”

但在实施AI场景落地方面,通过调整模型结构、超参数等手段的模型为中心的技术路径有其局限性。

郭玮表示,在2021年之前,除了人脸识别、车牌识别等相对固定的场景外,以模型为中心的AI技术在很多场景中必须通过高度定制化的方式进行落地,难以实现横向高效拓展。这是因为当数据变化较少、场景变化较小时,开发好的模型可以快速实施应用;但当面临少见场景或快速变化的场景时,例如自动驾驶和工业质检等应用领域,仅依赖前期的训练数据以及当前模型本身的泛化能力,是难以满足需求场景中长尾数据以及变化数据带来的挑战。

“拿工业质检来讲,当中的缺陷类型不可能通过提前准备一个数据集的方式来收集,因为工业生产过程中的缺陷本来就是变化的、不可预测的,且很多生产缺陷出现的频率也很低。其次,工业领域也是一个变化很快的场景,即工厂生产产品种类也非常多,且产品更新迭代也很快。因此,很难通过提前采集数据的方式开发模型,然后落地到这一场景中。”

因此,以数据为中心的技术路线应运而生,以更好地将人工智能技术落地到包括工业制造和自动驾驶在内的复杂长尾场景。

郭玮介绍,以数据为中心的路线,本质上是前期开发完成了基础模型,然后通过高效的数据抓取手段,在场景中采集到核心数据并以之实现基础模型的快速迭代和能力的提升,在整个环节中,数据抓取和模型能力提升的效率是重点。“以模型为中心的路线,核心诉求是算法科学家,而以数据为中心,最大的诉求就变成了打造一个能够对数据和模型全生命周期进行自动化管理的工具体系。”

目前,博瀚智能基于其自研的数据为中心AI基础设施,构建了一系列适配国内外AI软硬件生态体系的AI开发平台产品体系,以及能够服务于工业制造和其他场景的解决方案,并正在行业头部生产制造企业、自动驾驶、智算中心等实现规模化商用落地。