界面新闻记者 | 李彪
界面新闻编辑 | 宋佳楠
年初发布第一代世界模型Genie后,DeepMind又在年末带着升级版新模型登场了。
美国当地时间12月4日,谷歌旗下人工智能研究机构DeepMind推出新模型Genie 2。作为Genie模型的升级版,Genie2同样是一款世界模型(AI行业对理解和模拟现实世界生成式AI模型的统称),升级后其在模拟复杂环境方面展现出更加强大的实力。
据DeepMind论文介绍,新模型最大的特色是支持通过单张图片和文字描述生成3D世界,生成时长可持续一分钟左右,但多数情况下维持在10到20秒之间。
DeepMind在论文中附带了许多段演示视频,展示用户与Genie 2的互动过程。模型会根据文字描述生成初始图片,再基于这张图片创造出一个完整的3D互动世界。用户可以通过操纵键盘鼠标与其互动,而Genie 2会实时模拟生成你看到的每一帧画面。
图片来源:DeepMind
生成的3D世界支持用户从不同的视角互动,如第一人称视角和等距视角,以还原真实世界互动的既视感。
图片来源:DeepMind
从演示视频中可以看出,模型生成的3D世界中的许多细节都在模拟真实世界,例如模拟物体交互、复杂角色动画、物理现象、照明效果、反射效果及NPC设计等等。
图源:DeepMind
最为重要的是,这款世界模型还可以“继续成长”变得更强大。论文介绍,推出Genie 2的主要目的之一是为通用AI智能体提供无限多样的动态场景,用于训练和评估。经过循环往复的大规模训练,AI也从模拟真实世界无限接近成为一个可以理解真实世界的“智能体”。
具备以上一系列强大功能后,Genie 2模型有望在游戏领域先找到一番“用武之地”。
DeepMind团队在论文中特别指出,Genie 2能按照用户需求生成丰富多样的3D游戏环境,如果未来用于游戏开发中任务场景设计,或可彻底改变游戏行业,特别会给《我的世界》这类开放世界游戏的创作带来“一场技术革命”。