界面新闻记者 | 崔鹏
界面新闻编辑 | 文姝琪
一年前的百度世界大会,李彦宏在现场“手把手”教用户做AI原生应用,号召行业不要继续卷大模型,而是将精力投入到应用开发上。
但在过去的十二个月时间里,大家期待的超级应用并没有出现。反而有越来越多的人开始讨论,这轮全球性的大模型狂热到底是一场新的技术革命,还是新一轮泡沫。
李彦宏显然是听到了这些质疑声,11月12日,他在百度世界大会上说:“作为中国人工智能的扛旗者,我想我们有资格回答这个问题。”
他给出了文心大模型的最新调用数据,目前文心大模型日均调用量已经超过15亿,在不到半年时间里增长至7.5倍。
在6月份这个数据刚到2亿时,李彦宏曾经和百度高管们讨论,大模型的未来“怎么叫成了”,当时的结论是这个调用量能在一年内涨10倍。
而如今半年过去,百度已经接近这个增幅,李彦宏认为这说明用户真的需要大模型,从业者完全可以对此放心。
为了将开发者加入自家大模型生态的门槛降到最低,百度宣布将在明年1月推出多智能体协作工具“秒哒”,李彦宏声称,这款产品可以让完全不懂代码的人也能开发出一款应用产品。
“我们将迎来一个前所未有的,只靠想法就能赚钱的时代”,李彦宏在舞台中央做出了他的大胆预测。
消除幻觉是首要前提
百度想要说服开发者们都来基于文心大模型做应用,消除幻觉是首要前提。
“如果大模型总是一本正经的胡说八道,就不会有人信你,也不会有应用,就不是智能而是智障”,李彦宏表示,过去24个月大模型行业最大的变化是基本消除了幻觉。
在他看来,大模型作为一个概率模型,生成的内容本就具有不确定性,在采用RAG(检索增强手段,Retrieval-augmented Generation)技术后,极大提高了大模型的内容质量和准确性。
今年头部大模型厂商的竞争阵地都在从文生文转向文生图和文生视频领域,最知名的产品无疑是OpenAI发布的文生视频工具Sora,它也带动了国内一大批公司向多模态领域发力,并且向OpenAI进行对标。
拍摄:界面新闻
李彦宏对此尤为自信,他说“在整个中文互联网都为Sora顿足捶胸的时候,我们决定去解决图像生成的幻觉问题,不解决它就不会有应用。”
百度推出的这项文生图新技术,被称为iRAG(检索增强的文生图技术,image based RAG)。
它的基本原理是,将百度搜索的图片资源库跟百度的基础魔性能力结合,用来生成“机器味儿”比较少的图片,官方称其效果远远超过文生图的原生系统。
李彦宏说,目前市面上基于大语言模型的文生图系统,生成的图片通常是“一眼假”,甚至毫无逻辑,而iRAG没有幻觉、超真实且成本低,对于企业客户来说商业价值很高。
从现场展示的大众汽车与百度的合作案例看,用AI生成海报图片,成本能从传统的几十万元一组,降低到接近于0,并且生成的车型与大众现实中的车型保持一致。
这项技术的潜在应用场景目前主要集中在影视作品、动漫作品和海报制作等领域。
AI到哪里去:智能体和产业应用
在过去一年中,李彦宏在内部和外部的多次讲话中,都在强调智能体的重要性,称全球范围内像百度这样把智能体作为重要战略方向的科技公司并不多。
在今天的百度世界大会上,他对这种观点进行了补充解释。
李彦宏认为,智能体将变成AI原生时代内容、信息和服务的新载体,在AI时代做智能体,就像在PC时代做网站,以及在移动时代做自媒体账号,不同之处在于智能体更像一个真人。
一方面,做它的门槛足够低,李彦宏甚至认为谁都能上手做智能体。在百度文心智能体平台上,已经有11岁的小学生在制作智能体,并成功通过搜索等渠道实现了分发。
另一方面,智能体的天花板又非常高,足以支持开发者做出功能非常强大的应用。尤其是多智能体的协作,能解决更加复杂的问题。
图片来源:官方
李彦宏在现场主要展示了四类智能体的应用:公司类智能体、角色类智能体、工具类智能体和行业类智能体。
公司类智能体主要取代传统官网的功能,提供公司介绍、产品图片和一对一服务等能力;角色类智能体主要指数字人(基于大模型)产品,应用于直播、咨询和教育等领域;工具类智能体目前更多集中在写作助手和设计助手等工具层面;行业类智能体主要针对法律、医疗健康、金融和旅行等垂直领域。
从分类上看,李彦宏为百度描绘的智能体应用场景基本都是现实需求比较多的领域,但关键在于如何说服开发者参与进来,并给与他们足够的回报。
在产业应用层面,目前百度的客户主要集中在金融、能源、教育和公共服务领域。在百度智能云的千帆大模型平台上,累计有3.3万个精调大模型以及77万个企业级应用。
在行业案例介绍中,百度拿出的是与百胜中国的合作案例。双方的合作范围从门店选址、智能客服再到内部大模型服务产品都有所涉及,百度也提供了千帆平台和基础算力服务给百胜,未来两家公司还将严重在点餐屏上用大模型点餐的技术可行性。
毫无疑问,百胜中国这种知名品牌是百度推广自家大模型服务急需的标杆客户。在今年的世界大会上,大众汽车、比亚迪、百胜中国和智联招聘等头部公司的案例被李彦宏重点介绍,百度明显希望用它们来吸引更多中小开发者,一同加入百度的大模型生态。
为此,百度还搞起了官方推荐的策略,专门发布了一个”产业应用TOP 100“的榜单,向外界推荐这些基于文心大模型开发的优质行业应用。
李彦宏说,百度并不是要推出一个“超级应用”,而是想要让更多企业打造出百万“超级有用”的应用。
秒哒想要淘汰程序员?
无论是推广智能体还是行业应用,降低门槛都是百度急需解决的问题。
李彦宏在现场模仿苹果公司,也推出了一个“One More Thing”产品,也就是“秒哒”。在官方定位中,这是一款不需要写代码就能做出应用的软件,由基础大模型和智能体组成。
“它是迄今为止人类历史上最复杂的多智能体协作工具”,李彦宏说,这款产品能让一个完全不懂代码的人,具备程序员的能力,将任何想法都快速低成本变为应用产品。
拍摄:界面新闻
虽然并没有多少同行在做这类产品,让这个“人类之最”有些定语过多,但百度在这个产品上的尝试思路非常明确。
当一个普通用户对它提出需求后,秒哒的0号智能体会分析指令并下达调度规划,将任务拆分成需求确定、内容生产和工程开发三个步骤,并召唤多个智能体来协作完成全部开发任务,并最终输出用户需要的应用产品。
在现场演示中,一个发布会的邀请系统从用户发出需求到产品开发结束,全程只需要3分钟,而用户不需要写任何一行代码。
李彦宏表示,秒哒具备无代码编程、多智能体协作和多工具调用的优势,用户借助于自然语言交互,就能完成一整套系统搭建。
这款产品在现场演示中引发了很多参会者的明显兴趣,界面新闻遇到的几位企业开发者都想知道它的能力范围有多大,是不是真的能取代普通程序员,可惜现场并未进行过多详细的展示。
秒哒将于明年1月正式发布,李彦宏称随着基础模型能力的提升,秒哒将能够做更复杂的事情,未来企业可能不需要招聘项目经理、设计人员、开发人员和测试人员,就能独立指挥多个智能体来协同开发应用。