界面新闻记者 | 崔鹏
界面新闻编辑 | 文姝琪
7月7日消息,在刚闭幕的2024世界人工智能大会(WAIC)上,腾讯公布了混元大模型(以下简称为“混元”)的最新进展,相关负责人还谈到了大模型技术趋势、价格战以及应用落地等多个话题。
腾讯集团副总裁蒋杰在会上公开表示,腾讯将人工智能视为公司长期战略,目前腾讯围绕混元组建了一套产品矩阵,包括底层基础设施、自研大模型、模型开发平台以及智能体开发平台。
根据腾讯官方提供的信息,混元大模型在国内率先采用MoE架构,参数量已达到万亿,tokens数量超过7万亿,位居国内大模型第一梯队。
在本届WAIC上,推动人工智能技术落地的话题备受关注。大模型行业经过一年多发展,技术层面取得诸多突破,产业重心正在向应用落地转移。
腾讯云副总裁、优图实验室负责人吴运声在现场采访中对界面新闻等媒体表示,技术一定要在产业落地并产生价值,这才是AI发展的方向。
但要让AI落地,“只靠(优图)几百号人肯定不行”,必须降低门槛,吸引产业链上的更多企业进入。
在大会上,腾讯还联合上海交大等研究机构推出了对大模型行业十大趋势的报告,预测具身智能和人机对齐等方向将成为未来几年大模型行业的热门领域,人工智能也正在成为人类的“机器外脑”。
不愿意看到价格战,更关注能力提升
虽然外界有很多大模型落地进展缓慢的观点,但吴运声并不认同。
“对于大模型好像没怎么落地的看法,我觉得并不是这样”,他认为最主要的原因是目前大模型的需求实在太多。
比如面临1万个大模型的需求场景或者问题,如果其中有100个已经落地,“你觉得这是多还是不多呢?”
今天的大模型技术正在往多模态、零样本学习、3D和视频生成等方向快速演进,同时大模型产品的落地门槛也在逐步降低。
为了推动AI技术落地应用,今年5月腾讯云一口气发布大模型知识引擎、图像创作引擎和视频创作引擎三款PaaS工具,将AI能力和RAG进行封装,开发者在工具上进行简单调用甚至点选就能搭建应用产品。
也是在同一个月,字节、百度、阿里和腾讯等多家头部大模型企业开始打起了价格战,先后降低自家模型产品的使用费。
“站在从业者的角度,我们不太愿意看见价格战发生,或者说我不太关注”,吴运声告诉界面新闻,腾讯更关注能力提升,重点解决模型落地过程中的问题。
“但是作为一个商业组织,看到市场上的降价动作,我们肯定也会有所响应”,吴运声表示。
实际上,价格也确实是阻碍大模型广泛落地的重要因素之一,在给大模型降价的同时,腾讯也对旗下模型产品进行了区分,根据企业的实际需求提供不同尺寸的模型。
因为模型的大小不同,提供的能力也有所区别,推理成本更不一样。
目前混元大模型提供混元-pro、混元-standard和混元-lite三个版本,吴运声透露称混元后续还将上线vision版本。
走向“机器外脑”时代
在WAIC大会现场,上海交通大学、腾讯研究院和腾讯云智能等单位还发布了2024年AI大模型的十大趋势报告。
这十大趋势包括目前热门的具身智能、算力底座、情绪智能和开源共享等技术,也包括推理分析、智能制造、游戏环境、移动革新、人机对齐和创意生成等新趋势。
报告认为,海量GPU和新一代大模型组合后,使人工智能在推理分析、创意生成和情绪智能三个方向上取得突破进展,意味着AI将拥有类人的交互能力,新一代AI正在成为人类的“机器外脑”。
此外,在GTP-4o出现后,行业正在探索多模态甚至端到端的技术演进。这也给数字人这个当下热门的行业带来更多新机会。
吴运声解释称,现在的数字人产品,即便有知识引擎和大模型支持,也不是完全的端到端产品,而是分步骤的:首先是语音或者视频输入进去,进行处理之后再吐出来反馈,这个人机交互有一进一出的过程。
但在真人交流过程中,随时会有一方打断另一方的情况出现。大模型产品想要达到这个效果,需要更好的技术和工程化处理手段。
而今年火爆的另一个领域是智能体(AI Agent),对于它未来的技术趋势,吴运声认为它会回到大语言模型的初衷,也就是用朴素的自然语言帮用户解决问题。因为大语言模型与传统AI的很大区别在于,用户对模型的输入是一种自然表达的方式。
比如对于“我要做一个俄罗斯方块游戏”这种朴素的需求描述,传统的工程做法要经过很多步骤:第一步做产品分析,第二步写产品需求说明书,第三步做总体架构设计,第四步做详细设计,第五步做代码,第六步做测试等。这是一种受约束的解决方式。
“但能不能通过大模型直接做出来”,吴运声表示,希望未来可以形成一个能解决广泛问题的技术路线,用自然语言的方式来直接解决问题。