LongCat-Video-Avatar是什么
LongCat-Video-Avatar 是美团 LongCat 团队推出的音频驱动角色动画模型。模型能生成超逼真、口型同步的长视频,保持人物身份一致性和自然动态。LongCat-Video-Avatar支持多种生成模式,包括音频文本生成视频(AT2V)、音频文本图像生成视频(ATI2V)和视频续写。通过解耦音频信号与动作、避免重复内容和减少 VAE 错误累积等技术,实现高质量、长时间的视频生成,可用于演员表演、歌手动态、播客、销售演示及多人互动场景。
LongCat-Video-Avatar的主要功能
- 多模式视频生成:支持音频文本生成视频(AT2V)、音频文本图像生成视频(ATI2V)和视频续写,满足不同场景的多样化需求。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
