每经记者:朱成祥 每经编辑:杨夏
7月4日至6日,2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)在上海召开。期间,大模型、算力等多个领域专家发表了前瞻性思考。
商汤科技CEO徐立认为,大模型本质意义上是在做一个记忆的事情,记住世界的知识。而它仅有的一点点智力,完全是来自于对于知识背后高阶的思维逻辑的记忆。所以说,在垂直行业里,如何构造高阶思维逻辑的合成数据,往往是制胜的关键,并且是差异化的关键。这也是中国人工智能之路的关键。
爱芯元智创始人、董事长仇肖莘则认为,大模型真正大规模落地需要云、边、端三级紧密结合,而边缘侧和端侧结合的关键在于AI计算与感知。
2024世界人工智能大会现场人潮涌动。
突破大模型应用障碍
关于大模型应用落地,徐立表示,行业要进行变化,交互模式一定是先行的。实时的交互性能够带来一个流畅的体验,也是推动超级时刻以及应用变化的核心。对于GPT-4o的发布,外界感触最深的是它可以实时地跟人进行交互,从而重新定义了人机交互界面。
另外,阻碍大模型落地的一大因素是“大模型幻觉”。
MiniMax创始人、首席执行官闫俊杰强调要降低错误率。其表示,ChatGPT出来之后,国内很多公司也在迎头赶上,推出了很多模型。最核心的问题是,目前模型的错误率还是比较高的。比如GPT-4,它在很多测试指标上正确率可能只有60%、70%,即有30%到40%的错误率。国内的模型,错误率整体上在60%到70%之间。
闫俊杰补充表示,为什么大模型的产品是对话形式?因为对话的容错率比较高。为什么不能成为一个独立的Agent(代理人)?因为每一步都有30%到40%的错误率。因此,最核心的问题是怎么把大模型的错误率从30%、40%,降低到3%、4%、2%,降低一个数量级。这将是AI从一个辅助人类的工具到能独立完成工作最核心的标志。
智谱AI首席执行官张鹏则认为,准确率是一个方面,一般说准确率的时候,大多数是限定在一些评测或者任务上,就看数值性的量化评测,但有些东西其实很难量化,比如说逻辑性,抽象思考的能力。张鹏强调,这些恰恰是现在的模型,比人或者是比传统的方法更强的地方。
张鹏认为,现在很重要的点是突破大模型的多模态。因为真正的人在现实世界解决问题的时候,他需要输入的信息本身就是多模态的,除了自然语言以外还有视觉、听觉、触觉,所有这些是需要综合起来才能解决现实世界当中很多常见的问题,甚至不是复杂问题,都是常见问题。比如说扫地、做饭、洗衣服这些任务,它所需要输入的信息是多模态的,这些方面能力的突破会带来AI的普惠。
关于工业大模型的应用,香港工业人工智能及机械人研发中心(FLAIR)总裁黎少斌对《每日经济新闻》记者表示:“当我们有更多的数据,可以训练工业用的大模型。彼时,我们可以直接去问设备,你的状态怎么样?有没有什么不妥当?设备就可以回一个答案,比如‘我发现可能某个设备有一点点问题,我应该还能坚持一个星期,你想想如何安排更换,做一个预维护’。”
其补充表示:“我们想把大模型技术与我们的一些解决方案结合起来,让以后车间设备与人之间的沟通,会更像人与人之间的沟通。”
云侧+端侧算力配合
目前在大模型应用方面,也开始更加强调云侧与端侧算力的配合。
徐立认为,如果所有的资源都聚焦在云端,会带来推理成本的大幅度增长,以及推理效率的下降,因为网络的拥挤,势必会带来服务的不流畅。商汤科技在端侧上加大了模型的优化,提升了10%的性能精度,除此之外,速度有大规模提升,成本有大幅度下降。首包延迟下降40%,推理效率提升了15%。
爱芯元智创始人、董事长仇肖莘认为,智能芯片和多模态大模型已经成为人工智能时代的“黄金组合”,当大模型的应用日益广泛,更经济、更高效、更环保将会成为智能芯片的关键词,而搭载AI处理器的高效推理芯片将是大模型落地更合理的选择,这也是推进普惠AI的关键所在。
面壁智能副总裁贾超认为,凭借在成本、隐私、延时性、可靠性等方面的优势,端侧AI发展会成为全球趋势,这也意味着大模型正式进入轻量化时代。这一背景下,“模型知识密度,平均每8个月提升1倍”将会成为大模型时代的新摩尔定律。贾超强调,企业开发端侧大模型需要从算法侧和芯片侧双向奔赴,让端侧模型用端侧芯片,在用户场景上高效落地,这样才能给用户带来最极致的体验。