StoryMem – 字节联合南洋理工推出的视频生成框架

AI工具6天前发布
10 0

StoryMem是什么

StoryMem 是字节跳动与南洋理工大学联合发布的开源视频生成框架,解决 AI 视频生成中长期存在的跨镜头一致性问题。通过显式视觉记忆机制,将单镜头视频扩散模型转化为多镜头叙事工具。核心是 Memory-to-Video(M2V)模块,通过维护动态更新的关键帧记忆库,将记忆注入到单镜头模型中,确保跨镜头一致性。

StoryMem – 字节联合南洋理工推出的视频生成框架

StoryMem的主要功能

  • 多镜头长视频生成:能生成连贯的多镜头长视频故事,支持跨多个场景的叙事,保持角色和场景元素的一致性。

© 版权声明

相关文章