2024年下半年以来,生成式AI的行业焦点逐步从模型端向应用层转移。除了在搜索、教育等应用领域的进展之外,人工智能在硬件领域的突破,如AI手机,也成为备受瞩目的创新趋势。

在刚刚举行的2024 vivo开发者大会上,vivo正式发布“蓝心智能”全新AI战略,将大模型技术与手机操作系统深度融合,利用AI赋能OS,给用户带来更自然、更“懂我”、更普惠的智能体验。同时发布了全面升级的自研蓝心大模型矩阵、OriginOS 5、蓝河操作系统2,以及在安全、人文、生态合作等方面的最新成果。

大模型如何装进手机?揭秘vivo全新AI战略-编程日记

vivo副总裁、OS产品副总裁周围认为,真正的技术价值是要回到生活,回到用户本身,把体验做到极致。AI手机也要从这一思路出发。周围介绍,过去11个月,vivo在AI领域核心做了三件事,其一,用AI赋能传统的产品功能,使其变得更强大;其二,构建一系列系统的公共能力,不仅是自用,还要开放给行业第三方;其三,打造具有样板性的小智能体,让行业都来用。

大模型如何装进手机?揭秘vivo全新AI战略-编程日记

三个“重构” vivo发布“蓝心智能”战略

当前,国内厂商竞相推出搭载生成式AI技术的智能手机,各自的战略也有所区别。vivo对于AI手机的定义分三个方面:一是要完整地重构用户交互体验;二是重构整个数字世界,整合vivo自有技术和第三方的能力,积极拥抱智能体,同时要确保记忆功能和数据处理能力,保护用户的隐私和数据安全,让手机成为个人助理。三是真正帮助人们在生活工作中提高效率,解决痛点问题,来连接社会、管理自我。

从这三方面出发,vivo此次发布的AI战略“蓝心智能”,从3个方向上进行实践:重构人与设备的交互体验、重构人与数字世界的服务体验、重构人与物理世界的沟通体验。

当AI能力与OS系统进一步融合,交互体验应变得更自然、更符合直觉。vivo探索了更符合直觉的人机沟通方式,比如以圈选、拖放为代表的自然手势,和支持多种语言互译、更情感化的人机自然对话。

大模型如何装进手机?揭秘vivo全新AI战略-编程日记

在生成式人工智能的推动下,人类与数字世界的服务体验正迎来一次革命性的重构。vivo则致力于让智能更加个人化。首先,依托AI技术对手机的基础功能进行全面升级,让输入法、电话、笔记、扫描等15项刚需功能焕然一新,还构建了平台化的AI公共能力。其次,搭建连接服务的框架和平台,包括为开发者搭建的集合开发和分发于一体的智能体平台,以及针对轻量化和原子化的服务构建的完整的意图框架体系,让人找服务的同时,服务也主动匹配人的需求。第三,构建个人智能系统框架,让手机成为专属个人助理。

人工智能的触角不仅延伸至数字领域,更深刻地影响着我们所生活的物理世界。手机本质上链接的是物理世界的人与人。vivo利用多模态大模型,让手机成为视障人士的眼睛,帮助他们可以独自安全地走到更远的陌生的地方,去探索世界的美好。

端侧模型小而强大 多模态大模型首次亮相

基于全新的AI战略,vivo发布了新一代蓝心大模型矩阵,不仅升级语言大模型和端侧大模型能力,其自研的语音大模型、图像大模型以及多模态大模型也首次亮相。

大模型如何装进手机?揭秘vivo全新AI战略-编程日记

其中,千亿级蓝心大模型的云端能力,重点优化意图理解与分发、任务规划能力。相比去年,其整体能力提升30%,并在CMMLU和SuperCLUE的榜单上继续领跑国内第一梯队。

30亿参数的全新蓝心端侧大模型3B,在对话写作、摘要总结、信息抽取等能力上可以越级比肩行业7B-9B模型。相比蓝心7B模型,其性能提升300%,平衡模式下功耗优化46%,出词速度可以达80字/s,系统功耗仅450mA,内存仅占用1.4GB,打破了“模型小、能力强、功耗低“的不可能三角定律,实现了以小搏大的效果。

在SuperCLUE和南开大学端侧5B小模型综合能力评测中,蓝心大模型3B均排名第一,并且同时获得泰尔实验室端侧大模型综合能力认证以及AIIA安全防范能力认证。

此外,vivo还发布了自研蓝心语音大模型,可准确理解自然语义、感知情绪、模拟人声,并且支持中英日韩泰同声传译,以及超过15种语言互译。

大模型如何装进手机?揭秘vivo全新AI战略-编程日记

vivo副总裁、OS产品副总裁周围认为,一旦有更自然和更符合直觉的交互产生时,在产品体验上,就会带来巨大的突破和变革。

“例如vivo全新的语音大模型,已经能够听懂各种各样口音的人话了。而且还能说得出‘人话’,不像原来那种很机械的声音,是非常类似真人的带气息的声音。”

无论在学术界还是工业界,目前一大共识是多模态将会成为下一波发展趋势。当人类在数字世界进行交流,或者在物理世界里进行交互,传递的信息一定是多模态的。为此,vivo也发布了蓝心图像大模型和蓝心多模态大模型。

其中,蓝心图像大模型强化中国特色与东方美学的融合生成能力,是国内最懂中文语境的图像模型之一。蓝心多模态大模型则在今年升级了上下文理解和记忆能力,能够对手机屏幕更深度的理解,在视频流的实时对话上也更加流畅自然。

坚守“本分”文化 回归用户价值

根据Counterpoint的数据,在历经几年的销量下滑后,2024年上半年,中国智能手机市场迎来积极信号,销量同比增长4%,全年销量有望突破2.7亿部大关。

vivo在激烈的市场竞争中表现不俗。2024年上半年,vivo手机销量同比增长5%,高于行业平均水平。今年以来连续三个季度,vivo始终稳稳占据市场销量第一名。在实现销量增长的同时,vivo在高端市场的占比也有了明显提升,vivo X100系列在4000-6000元价格段表现优异。

行业回暖的本质是创造极致的用户体验,企业的任何经营活动都要回归用户。vivo正是用户导向理念的长期践行者。多年来,vivo始终将用户置于首位,致力于通过超预期的科技创新解决用户痛点,激发市场活力。

大模型如何装进手机?揭秘vivo全新AI战略-编程日记

周围强调,真正的价值是回到生活,回到用户的平台,致力于创造惊喜,将用户体验提升至极致,这是最重要的。AI手机也应从这一思路出发。

“我们不用去颠覆什么东西,也不要全新创造什么东西,就把原来的功能全部加强一遍,然后把行业里重新涌现出的珍贵能力连接起来,再帮助用户做日常生活中力所能及的一些小动作、小执行,这就很好。手机并非很神秘的东西,就是平常用来生活、工作的东西,vivo就想把它的基础体验做好,把基于产品的功能增强。我们不去做很伟大的东西,很复杂的东西。”

这也与vivo的核心价值观“本分文化”一脉相承,本分地做产品、本分地研究技术,使得vivo成长为国内手机市场的巨头之一。

“vivo的本分文化也叫平常心文化,回到本质去思考,本质的东西就是‘因’层面的东西,我们把这些东西做好,自然‘果’是水到渠成的,我们发展AI的思路和vivo的企业文化是完全一致的。”周围称。