StoryMem是什么
StoryMem 是字节跳动与南洋理工大学联合发布的开源视频生成框架,解决 AI 视频生成中长期存在的跨镜头一致性问题。通过显式视觉记忆机制,将单镜头视频扩散模型转化为多镜头叙事工具。核心是 Memory-to-Video(M2V)模块,通过维护动态更新的关键帧记忆库,将记忆注入到单镜头模型中,确保跨镜头一致性。
StoryMem的主要功能
- 多镜头长视频生成:能生成连贯的多镜头长视频故事,支持跨多个场景的叙事,保持角色和场景元素的一致性。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
