IndexTTS2 – B站开源的最新文本转语音模型

AI工具2天前发布
3 0

IndexTTS2是什么

IndexTTS2是B站语音团队开发的新型文本转语音(TTS)模型,已经正式开源。模型在情感表达和时长控制方面实现了重大突破,是首个支持精确时长控制的自回归TTS模型。支持零样本声音克隆,仅需一个音频文件即可精准复制音色、节奏和说话风格,支持多语言。IndexTTS2实现了情感音色分离控制,用户可以独立指定音色来源和情绪来源。模型具备多模态情感输入功能,支持通过情感参考音频、情感描述文本或情感向量来控制情感。

IndexTTS2 – B站开源的最新文本转语音模型

IndexTTS2的主要功能

  • 零样本语音克隆:仅需一个参考音频,可精准模仿该音频的声线、语调和节奏,支持多语言,实现高度个性化的声音合成。

© 版权声明

相关文章