Fun-CineForge – 阿里通义开源的影视级多模态配音模型

AI工具1周前发布
2 0

Fun-CineForge是什么

Fun-CineForge是通义实验室开源的首个影视级多模态配音大模型,基于CosyVoice3构建,创新引入”时间模态”实现精准音画同步。模型支持独白、旁白、对话及多人场景,解决口型同步、情绪表达、音色一致、时间对齐四大难题。Fun-CineForge配套开源CineDub数据集构建流程,覆盖350+部影视剧,中文字错率低至1.49%,即使面部遮挡、镜头切换等复杂场景也能保持高质量配音效果。

Fun-CineForge – 阿里通义开源的影视级多模态配音模型

Fun-CineForge的主要功能

  • 口型同步:模型支持合成语音与画面中人物唇部运动高度同步,实现精准音画对齐。

© 版权声明

相关文章