《科创板日报》12月6日讯(记者 陈俊清) 空间智能引发科技领域市场高度关注。
近日,李飞飞创业公司World Labs展示了一图生成3D世界的AI系统,仅过一天,谷歌DeepMind就发布了可通过单张图片或文字描述生成3D场景的大型基础世界模型Genie 2,空间智能成为当下热议的焦点。
对于当下空间智能产业发展趋势和创新应用,以及3D生成技术的突破等热点议题,在昨日(12月5日)五一视界举办的的地球克隆计划大会“3D+AI”技术创新论坛上,一众空间智能和3D生成领域的企业创始人与投资专家发表了见解。
▍空间智能如何发展?
“我们目前处于空间智能初级阶段,但整体发展速度是非常快。”一苇资本董事明皓表示,从2012年AlexNet发表到现在12年的时间里,空间智能研究方向快速增多,“市场规模非常宏大”。
Omdia最新报告显示,全球空间计算市场规模预计在2024年将达45亿美元,并于2029年超过100亿美元,在消费者和企业用例中被广泛采用,其累计平均增长率(CAGR)将达18%。
另据泰伯智库预测,到2030年,中国元宇宙市场规模将到达8500亿元;其中与空间计算相关的市场在2030年可能达到3400亿元,约占整个元宇宙市场的40%。
一苇资本董事明皓认为,空间智能分为3D大模型生成、3D重建、人工智能三大部分。
在大模型生成领域,相比与2D图片,独立的3D模型无法传递足够的信息,让普通用户传播和使用独立3D模型的意义非常有限,通过大模型生成丰富的3D内容变得尤为重要。基于此,未来3D领域行业的发展趋势会逐渐面向内容驱动的行业。
在3D重建领域,3DGS具有快速渲染速度、显式表示便于编辑、支持动态重建和物理模拟等特点,通过以上优势有望在自动驾驶场景和机器人场景实现爆发。在文娱社交场景下,明皓认为,3D Instagram可能会在2025年或者2026年有新表现机会。
在人工智能领域,通过META Orion来看未来AI行业的发展趋势涵盖四个点,一是MicroLED会成为主流,因其满足AI设备对轻量化小型化的追求;二是碳化硅波导的可能性,因其具备较高折射率;三是摄像头模组+AI,未来AI眼镜摄像头模组将提升至4颗以上;四是AI Copilot加持下,AR作为离人眼最近的显示设备,将进一步夯实AR作为全天候设备的定位。
关于AR眼镜,论坛现场,百度智能云空间智能行业负责人常佳硕表示,相信明年的AR市场将会有较大的井喷显现。据了解,百度于11月12日发布了小度AI眼镜。“AR虚拟现实的场景里,结合了空间智能的各种元素,将实现更大市场。”
▍3D内容将迎来爆发?
对于空间智能的定义,李飞飞认为,空间智能是机器在3D空间和时间中感知、推理和行动的能力。随着空间智能技术的不断进步,3D技术也在其中更加重要的角色。
对于现在的3D技术,VAST创始人兼CEO宋亚宸认为尚存不足之处。“现在3D生成技术还不够成熟,概达只达720P的水平,在今年年初的时候为360P的水平。我们认为到明年上半年可以达到1080P,明年下半年可以达到手机4K的水平。”
据悉,在最新发布的Genie2中创造出的可交互的3D环境清晰度为720p。
对于未来3D生成发展趋势,宋亚宸认为,3D生成将分为三步走:第一步是静态3D模型生成;第二步是可交互的动态的3D内容的体验的生成;第三步,每个人都可以零门槛、零成本实时创作3D体验。
“3D的内容将会迎来爆发,从文字到图片、到视频到3D,包括声音和音乐,3D是唯一一个没有UGC内容平台的信息载体。”宋亚宸表示,其目标就是制作大级别的创作工具让用户可以零门槛、零成本实时进行创作,才有机会出现3D的UGC平台,形成3D内容的爆发。
其域创新创始人兼CEO赵开勇则是把3D内容生成分成了三个阶段:第一阶段,所画即所得;第二阶段,所见即所得;第三阶段,所想即所得。“现在AIGC就在做这个事情,需要所见即所得到所想即所得的方式生成这样的3D内容,才可能把这样的成本降低,把效率提高,让3D的应用真正推广起来。”
▍3D生成如何应用?
在3D生成应用场景方面,VAST创始人兼CEO宋亚宸表示,在720P的3D生成阶段主要有四个3D应用场景:一是传统CG,包括游戏、动画、影视、虚拟制作等;二是传统工业,包括3D打印、工业设计等;三是新兴行业诞生,包括元宇宙、XR、MR等;四是传统TMT,像社交、直播、教育、电商等。
《科创板日报》记者注意到,本次论坛的参会嘉宾多数将3D生成用于传统CG。
“目前,一个导演一天就可以制作1-2分钟的3D视频内容,可以把传统网剧内容成本降低到1/10。”聚力维度CEO表示赵天奇表示,传统视频产业最大的问题是制作成本太高,而3D路线可以真正解决工业级的AI影视制作。影视级的UGC平台的出现,不仅降低3D创作门槛,也降低了创作成本。
祖母镜的CEO吴瑞凯罗列了他们在3D生成中应用的场景,包括影视预告、广告营销、宣传、品牌IP、文旅。“内容已经非常容易去制作并产出,以至于现在已经达到了内容同质化的时代。”
各个大厂也在积极布局3D生成大模型,且瞄准的赛道多为视频创作。
今年11月初,有媒体报道称,阿里正在测试一款名为“Animode”的AI视频创作工具,据官方介绍,这是一款专业的3D软件,用于创建逼真的二次元角色和大片效果。11月5日,腾讯混元最新的MoE模型“混元Large“以及混元3D生成大模型“Hunyuan3D-1.0”也正式开源。
其域创新创始人兼CEO赵开勇表示,三维数字化的方向并不止于此,“以前2D场景做过的事情,在三维里面都会有迭代和更新”。
“随着未来AR、VR硬件设备的普及,3D内容的消费端将越来越多,3D数字和内容的需求也会随之增长。各厂商在这方面持续布局,从10年前的AI元宇宙、数字化,到2027年AR、VR的更广泛普及,3D内容的需求将会持续增长。”赵开勇如是说。