在10月10日举办的vivo开发者大会上,AI成为了绝对的主角。

大会期间,vivo发布了全新AI战略——「蓝心智能」,以及全面升级的自研蓝心大模型矩阵、OriginOS 5、蓝河操作系统2,以及vivo在安全、人文、生态合作等方面的最新成果。

自ChatGPT引发的生成式AI风潮兴起之后,AI成为智能手机领域当下最炙手可热的概念。但在过去一年的时间里,由于行业技术尚未完全成熟、基础设施不健全等原因,市面上的AI手机大多还只停留在单一功能点创新的阶段,并没有出现令用户期待的颠覆式革新,AI手机的概念也在爆火后迎来沉寂。

行业沉寂之时,恰恰是参与者深度思考的好时机。手机厂商试图解答围绕端侧AI的核心问题:它到底能够做什么,以及应该实现怎样的目标?

蛰伏11个月之后,vivo带来了一张新答卷——将大模型技术与手机操作系统深度融合的蓝心智能。它以蓝心大模型为技术底座,能够理解用户的个人情景和偏好,通过更自然、更符合直觉的交互,来为用户提供个人化的专属服务。为此,vivo做了一系列系统重构的工作,也重新定义了人与设备、人与数字世界、人与物理世界的交互与连接。

vivo给AI手机打了个样-编程日记

从单点创新,到系统重构

提起AI手机,大部分用户可能会第一时间联想到文生图、路人消除、会议纪要等生成式AI相关功能。在ChatGPT 3.5时代,这些功能为用户提供了眼前一亮的体验,但绝不是对AI手机的全部定义。手机厂商意识到,大模型要真正在端侧发挥功效,最难且最核心的挑战,一定在于对系统的重构。

蓝心智能就是一次突破性的尝试。在OriginOS 5中,vivo对于AI手机的构想有了更全面的落地。vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围将vivo在过去11个月的努力总结成三件事:升级已有功能、构建公共能力并向第三方开放,以及构建具有执行能力、真正服务于人的智能体。

第一件事是用AI来升级现有的手机功能。以搜索为例,这是用户在手机上最常使用的功能之一。过去的搜索限定在特定APP的搜索框内,用户需要复制关键文字,再切入特定APP内进行操作,这种做法显然低效。

OriginOS 5内置的小V圈搜功能,采用了一种更符合直觉的人机沟通方式:通过长按导航条的形式将它呼出,直接用手指圈选手机上的图片、文件、文字等任意内容并向下拖拽,即可完成一次搜索。这还不仅仅是一次简单的搜索,也能够融合用户的个人数据来做下一步操作的意图识别,用更本地化的思维做主动的理解和思考。

vivo给AI手机打了个样-编程日记

于是,人与设备的交互开始变得更自然。Origin OS 5搭载的「原子岛」功能,将原有的通知功能结合了蓝心小V的意图识别能力,能够不断分析和判断用户当前需求,主动提供后续服务。用户可以通过一按一复制,或一按一拖拽的交互形式来布置任务;新升级的「小V建议」以桌面常驻组件的形式,根据用户所处的时间地点,不间断地为用户提供打车建议、登机口提醒、旅行城市攻略等。

改变了交互形式之后,vivo做的第二件事是重构数字服务体验,这不能只依靠vivo一家的力量。

过去用户需要下载不同的APP来满足不同的需求,但同时也带来了内存负担,且体验不够智能。vivo一边搭建好基础设施,一边将自有的AI能力向第三方合作伙伴开放,让用户在需要作业指导时,可以用教育智能体来进行在线辅导,有就医需求时,用医疗的智能体来帮助挂号。

第三件事也是最具挑战性的一件事,即真正让AI代替用户来执行部分操作。

OriginOS 5搭载了vivo自研的手机智能体「PhoneGPT」,这是一个可基于用户意图和习惯,实时自主拆解需求并主动规划路径的多模态助理。例如其中的「小V订座助手」功能,通过语音对话说出想要预订的餐厅类型、时间,和人数后,它可以自主跳转相关APP,找到符合需求的餐厅,识别餐厅电话并自动进行电话预约。

vivo给AI手机打了个样-编程日记

从理解订餐意图到完成电话预约,这是一个极其复杂的链路,它需要让PhoneGPT尽可能接近于人,像人一样会识别界面、会与餐厅交流。这是完全由vivo训练的大模型,在数十万应用投喂训练的之后,vivo把一个操作步骤的执行时间速度缩短到了2秒,而这仅仅是一个起点。随着PhoneGPT逐渐强大,相应的功能也会变得更加丰富。

做符合直觉、遵循常识的事

OriginOS 5是vivo对 AI 手机阶段性解答。事实上,AI手机到底应该怎么做,所有手机厂商都在摸着石头过河。

周围在接受采访时说道,做传统智能手机时,vivo总是要进行小半年的用户和市场调研,收集有效反馈来成为下一代产品的参考。但在真正考虑做AI之前,vivo花五个月时间做了用户和市场调研,却无法从用户身上得到任何有效的反馈。在全新的技术爆发面前,用户对自己的需求也没有任何感知。

这是抛给手机厂商的难题。在经历长达十年的智能手机高速增长时期之后,vivo们再度走回了「不舒适区」。

但vivo已经考虑好了要走的路。作为最早投入人工智能研发的手机厂商之一,早在2017年,vivo就启动了人工智能的研发,此后陆续组建了AI全球研究院、人工智能图谱研究院等机构。迄今,已经有数百人专注研发AI大模型,并且维持着千人以上的专业AI团队。

vivo给AI手机打了个样-编程日记

这为vivo带来了更丰富的认知和技术储备。在ChatGPT问世之前,vivo就已在2019年的开发者大会上系统阐述过对手机AI的思考。当时的vivo将下一代智能手机定义为“智慧手机”,自主人工智能品牌Jovi作为智慧手机的中枢系统,将消费者希想要的服务精准、按时、按需地送达,这种思路也恰好是如今蓝心智能的雏形。

在OriginOS 5中,“Jovi语音”与“蓝心小V”进行了深度的融合,升级后的蓝心小V智慧能力全面升级,为用户带来便捷的沟通方式、默契的服务推荐、温暖的共同记忆、贴身的时刻陪伴。

vivo一直以来都在强调的是,AI带来的体验应该是更自然的。从OriginOS 5的升级也不难看出这一点。例如小V圈搜功能的升级,是把指甲盖触碰屏幕的方式,换成了用手指来圈选屏幕,这两者看似区别不大,但本质上是为了让操作和交互更符合人的自然习惯和直觉。

vivo给AI手机打了个样-编程日记

vivo还是少有的在声音大模型领域保持重投入的手机厂商。在其最新发布的声音大模型中,手机已经能够实现各种口音的自然交互,包括粤语、四川话、东北话、河南话,甚至还有苗语。并且,手机和用户不再是干涩和机械的对话,而是带有人的气息的真实互动。

这是对手机语音交互的一次重塑,它让语音互动真正成为了人人易于使用的功能,把使用AI的门槛进一步放低,让AI服务于人,而不是人来适应AI。

就像iPhone打破诺基亚统治的市场那样,每当更符合自然和直觉的交互产生的时候,产品体验一定会带来巨大的变革。在周围看来,这才是手机厂商做大模型真正的意义所在——如果只做大模型,而想不出怎么用大模型,也就没有做大模型的必要。

“我很认同一句话,如果没有正确的认知,黄金就不是黄金,而是土。”周围说,对AI的重投入,为vivo带来的不仅仅是技术创新能力的跃迁,更重要的是认知的丰富与转变。某种程度上,这也是当下竞逐AI手机战场的厂商最稀缺的一种能力。

热度当前,回归本原

许多人将2024视为AI手机元年。主流手机厂商纷纷开始将AI作为最大的新品卖点之一,甚至有厂商宣布放弃传统智能手机研发,把所有资源投入到AI领域。业界期待AI成为手机行业下一个突破式创新,迎来自己的ChatGPT时刻。

AI的确已经必不可少,但无论技术如何前进,但消费者的本质需求并没有改变。多数用户对复杂的大模型参数并不了解,也不关心AI技术的发展,他们的需求非常简单直接:流畅、舒适、自然、高效。

vivo给AI手机打了个样-编程日记

这也正是vivo的目标。周围的观点是,vivo的目的从来不是颠覆手机行业。事实上,现有的行业技术成熟度,也还很难谈真正的颠覆。这的确是行业现状:自生成式AI火爆以来,它最被用户高频使用的功能,并不是新创造的场景,而是通过AI来赋能已有场景,让工作、学习和生活变得更加高效、简便。

AI手机同样如此。对手机厂商来说,目前更现实且有效的做法是,结合自身在AI领域的技术积累,利用手机厂商的端侧优势,对现有的能力进行不断优化、升级,做好连接,做更符合用户直觉和常识的事情,就是一种巨大的进步。例如,过去手机只能傻瓜式地遵循用户指令,现在已经可以主动感知场景、帮助用户做决策甚至执行操作。

避开锋芒与噱头,冷静、积极地面对技术浪潮的到来,这是vivo在AI时代的选择。这种选择离不开vivo的「本分」文化。本分文化强调保持平常心,即在面对困难、压力和诱惑时,能够抛开事物表面的干扰,回归事物的本原进行思考,坚持做正确的事,并力求把事情做正确。

什么是正确的事?vivo始终坚持的一条原则是坚持用户导向式创新。无论是重金投入的影像、自研芯片的创造性尝试,还是AI重构系统的决心,vivo的一切工作都围绕用户需求来开展,通过极致场景价值检验、耦合式创新点投入和底层技术创新支撑,逐步实现用户体验的跃级。

市场选择是最直观的。据Counterpoint、Canalys以及BCI三大行业分析机构发布的2023年度智能手机市场数据,vivo均位居全品牌第二、国产品牌第一。2024前三季度,vivo仍然位列国内市场首位,在vivo X100系列、vivo X Fold3等的带动下,vivo在高端市场的占比也有了明显提升。

在此起彼伏的科技公司AI大战中,vivo仍然是那个闷声做实事的角色。vivo的目标并不远大,但足够实际:“我们从来无意定义AI手机,但是我们希望用户用完能说,这个手机很AI。”