每经记者:涂颖浩 每经编辑:马子卿
7月4日至6日,2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)在上海召开。在7月4日的产业发展主论坛上,蚂蚁集团董事长兼CEO井贤栋表示,专业智能体能够破解通用大模型在严谨产业应用的关键难题,蚂蚁集团正在携手产业合作伙伴构建专业智能体生态,加速产业应用,推动服务升级。从实践来看,专业智能体是大模型落地严谨产业的有效路径。
井贤栋称,通用大模型落地严谨产业面临着三个“能力短板”:领域知识相对缺乏、复杂决策难以胜任以及对话交互不等于有效协同。专业智能体能够破解通用大模型在严谨产业应用的关键难题,蚂蚁集团正在携手产业合作伙伴构建专业智能体生态,加速产业应用,推动服务升级。
大会期间,蚂蚁集团首席技术官何征宇在接受《每日经济新闻》等媒体采访时进一步表示,“整个社会都需要专业智能体涌现,我们积极拥抱专业智能体。”在其看来,随着AI落地应用的不断探索,AI不仅“有脑有嘴能对话”,未来智能化的用户体验将真正实现“有手有脚能办事”。
智能服务技术落地应用
“我想点一杯星巴克的中杯冰拿铁”,打开支付宝下拉进入智能助理,下达这样的指令,AI便会进入小程序自动下单,用户确认并付款后,就能到附近的线下门店取到咖啡。据悉,AI智能点单这一新功能,已在支付宝App开启测试,首批支持星巴克、瑞幸、霸王茶姬、蜜雪冰城等11个茶饮品牌的支付宝小程序。
在移动互联网时代,二维码让移动支付成为每个人的生活日常。“在人工智能时代,我们也在探索,让AI像扫码支付一样便利每个人的生活,让AI技术发展的红利惠及更多人。”井贤栋说。
AI点单功能背后到底是什么技术?何征宇告诉记者,这并不是一些基础的应用程序编程口(API)打通的问题,实际上里面嵌套了一个多模态的模型,当你说“我要点一杯拿铁”的时候,在后台你打开了星巴克的小程序,然后用多模态语言模型的识别能力识别出你要的是哪杯拿铁,并且把那杯拿铁点下去,它要去适配各种页面的布局。
基于多模态大模型的技术,让智能助理具备屏幕感知与仿真执行能力,就像让AI有了“眼睛”和“手脚”。过去用户多次点击才能完成的操作,现在只需要一句话,AI就能帮你办好。“一些深刻的技术,其实藏在产品和服务后面。”何征宇表示:“我们是希望产品说话,让用户感受到这款产品真正地能帮你做事,譬如点一杯咖啡,或者说帮你转个账。”
据了解,今年4月,支付宝智能助理在首页开启灰度测试。用户通过其下达指令,就能迅速提供相关资讯,并一键直连支付宝生态内挂号、订票、充话费等海量的数字服务,起到“App智能导航”的作用。
据支付宝介绍,这一名为ACT(Transformer for Actions)的智能服务技术,目前仍在测试,未来将持续调整优化,并在快餐点单、医院挂号、门票预订等场景中落地应用。
构建专业智能体生态
目前,人工智能产业的飞速发展,催生了新的人机交互模式,核心便是AI大模型驱动的智能体(AI Agent)。
以自动驾驶汽车为例,通过训练大量的驾驶数据,智能体可以学会如何识别交通信号、避障和规划行驶路线,从而实现自动驾驶的功能。因此,智能体的服务升级与互联互通,是国内多家互联网科技公司持续探索的重点。
在何征宇看来,在互联网时代,本质上是把模型作为一个软件,加上数据为消费者提供可以选择的服务。这是一个标准的模式,预测在垂类的大模型应用上对数据的需求会更多。
“就像你拥抱互联网,会做个App,做个小程序一样的逻辑,企业可以让服务更靠近。因为企业更了解他们的消费者,他们可以组装成一个大模型服务,或者把它变成一个专业的智能体,这是我们想做的。”何征宇认为,整个社会会有大量的专业智能体涌现,支付宝想用更先进的技术为用户提供更好的服务。
对于通用大模型落地严谨产业的“能力短板”,井贤栋在演讲中表示,为了破解这些难题,蚂蚁选择了构建专业智能体生态的路径,“从我们的实践来看,专业智能体是大模型落地严谨产业的有效路径”。截至目前,蚂蚁通过与各行各业的深度合作,构建了生活、金融、医疗等领域的智能管家。