豆包：视频生成模型“VideoWorld”可仅靠视觉认知世界现已开源

fengjun 热点 2025-02-10 4

视频生成实验模型“VideoWorld”由豆包大模型团队与北京交通大学、中国科学技术大学联合提出。不同于Sora 、DALL-E 、Midjourney等主流多模态模型，VideoWorld在业界首次实现无需依赖语言模型，即可认知世界。目前，该项目代码与模型已开源。

豆包：视频生成模型“VideoWorld”可仅靠视觉认知世界 现已开源