7月4日—7月6日,2024世界人工智能大会在上海开幕。在7月4日的产业发展主论坛上,蚂蚁集团董事长兼CEO井贤栋表示,专业智能体能够破解通用大模型在严谨产业应用的关键难题,蚂蚁集团正在携手产业合作伙伴构建专业智能体生态,加速产业应用,推动服务升级。“从我们的实践来看,专业智能体是大模型落地严谨产业的有效路径。”

井贤栋称,通用大模型落地严谨产业面临着三个“能力短板”:领域知识相对缺乏、复杂决策难以胜任,以及对话交互不等于有效协同。专业智能体能够破解通用大模型在严谨产业应用的关键难题,蚂蚁集团正在携手产业合作伙伴构建专业智能体生态,加速产业应用,推动服务升级。

大会期间,蚂蚁集团首席技术官何征宇在接受《每日经济新闻》等媒体采访时进一步表示,“整个社会都需要专业智能体涌现,我们积极拥抱专业智能体。”在其看来,随着AI落地应用的不断探索,AI不仅“有脑有嘴能对话”,未来智能化的用户体验将真正实现“有手有脚能办事”。

AI点单功能背后:智能服务技术的落地应用

“我想点一杯星巴克的中杯冰拿铁”,打开支付宝下拉进入智能助理,下达这样的指令,AI便会进入小程序自动下单,用户确认并付款后,就能到附近的线下门店取到咖啡。据悉,AI智能点单这一新功能,已在支付宝App开启测试,首批支持星巴克、瑞幸、霸王茶姬、蜜雪冰城等11个茶饮品牌的支付宝小程序。

在移动互联网时代,二维码让移动支付成为每个人的生活日常,“在人工智能时代,我们也在探索,让AI像扫码支付一样便利每个人的生活,让AI技术发展的红利惠及更多人。”井贤栋说。

AI点单功能背后到底是什么的技术支持?何征宇告诉记者,这并不是一些基础的应用程序编程口(API)打通的问题,实际上里面嵌套了一个多模态的模型,当你说“我要点一杯拿铁”的时候,在后台你打开了星巴克的小程序,然后用多模态语言模型的识别能力识别出你要的是哪杯拿铁,并且把那杯拿铁点下去,它要去适配各种页面的布局。

基于多模态大模型的技术,让智能助理具备屏幕感知与仿真执行能力,就像让AI有了“眼睛”和“手脚”。过去用户多次点击才能完成的操作,现在只需要一句话,AI就能帮你办好。“一些深刻的技术,其实藏在产品和服务后面。”何征宇表示,我们是希望产品说话,让用户感受到这款产品真正地能帮你做事,譬如点一杯咖啡,或者说帮你转个账。

据了解,今年4月,支付宝智能助理在首页开启灰度测试。用户通过其下达指令,就能迅速提供相关资讯,并一键直连支付宝生态内挂号、订票、充话费等海量的数字服务,起到“App智能导航”的作用。

据支付宝介绍,这一个名为ACT(Transformer for Actions)的智能服务技术,目前仍在测试中,未来将持续调整优化,并在快餐点单、医院挂号、门票预订等场景中落地应用。

专业智能体是大模型落地严谨产业的有效路径

目前,人工智能产业的飞速发展,催生了新的人机交互模式,核心便是AI大模型驱动的智能体(AI Agent)。

以自动驾驶汽车为例,通过训练大量的驾驶数据,智能体可以学会如何识别交通信号、避障和规划行驶路线,从而实现自动驾驶的功能。因此,智能体的服务升级与互联互通,是国内多家互联网科技公司持续探索的重点。

何征宇看来,在互联网时代,本质上是把模型作为一个软件,加上数据为消费者提供可以选择的服务。这是一个标准的模式,我们预测,在垂类的大模型应用上对数据的需求会更多。

“就像你拥抱互联网,会做个APP,做个小程序一样的逻辑,企业可以让服务更靠近。因为企业更了解他们的消费者,他们可以组装成一个大模型服务,或者把它变成一个专业的智能体,这是我们想做的。”何征宇认为,整个社会都会大量的专业智能体涌现,支付宝想用更先进的技术为用户提供更好的服务。

对于通用大模型落地严谨产业的“能力短板”,井贤栋在演讲中表示,为了破解这些难题,蚂蚁选择了构建专业智能体生态的路径,“从我们的实践来看,专业智能体是大模型落地严谨产业的有效路径。”截至目前,蚂蚁通过与各行各业的深度合作,构建了生活、金融、医疗等领域的智能管家。

谈及AI在金融领域的应用,蚂蚁集团金融AI产品负责人杨帆在受访时表示,领域知识相对缺乏、复杂决策难以胜任,以及对话交互不等于有效协同,是AI提供严谨专业的金融专业服务的痛点。随着技术的演进,除了专业力、知识力、语言力,AI在服务力、可靠性、个性化、情绪理解等方面也在不断进步,目前问题解决率能达到95%

“以投资研究智能体支小助为例,学习了金融专家的分析推理框架后,在接到不同的投研任务时,它会动态学习专家的思考方式,模仿专家的思路进行分析和生成,可以实现媲美人类专家的金融分析能力。”杨帆称。