FantasyWorld是什么
FantasyWorld是高德地图(AMAP)和北京邮电大学合作开发的创新性3D世界建模框架,专注于通过统一的视频和3D预测生成高质量的3D场景。框架通过在冻结的视频基础模型中增加可训练的几何分支,实现了视频潜变量和隐式3D场的联合建模,能在一次前向传播中生成具有几何一致性的3D感知视频。FantasyWorld在多视角一致性方面表现出色,即使在大视角变化(如180度旋转)下,也能保持高度的视觉真实性和几何一致性。
FantasyWorld的主要功能
- 联合建模视频与3D场景:通过在冻结的视频基础模型中增加可训练的几何分支,FantasyWorld能同时生成视频和3D场景,实现视频潜变量与隐式3D场的联合建模,为下游3D任务提供通用表示。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
