InfinityStar是什么
InfinityStar 是字节跳动推出的高效视频生成模型,通过统一的时空自回归框架,实现了高分辨率图像和动态视频的快速合成。模型采用时空金字塔结构,将视频分解为序列片段,有效解耦外观和动态信息,提升生成效率。InfinityStar 基于预训练的变分自编码器(VAE)构建,利用知识继承策略,大幅缩短训练时间并降低计算资源消耗。支持多种生成任务,包括文本到图像、文本到视频、图像到视频以及长时间交互视频合成等。
InfinityStar的主要功能
- 高分辨率视频生成:支持生成高质量的720p视频,能快速合成复杂的动态场景。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
