FireRedTTS-2 – 小红书推出的流式文本转语音系统

AI工具2天前发布
3 0

FireRedTTS-2是什么

FireRedTTS-2 是先进的长格式流式文本转语音(TTS)系统,专注于多说话人对话生成。采用12.5Hz流式语音分词器和双Transformer架构,能实现低延迟、高保真、多语言的语音合成。支持英语、中文、日语、韩语、法语、德语和俄语等多种语言,具备零样本跨语言及语码转换语音克隆能力。目前支持4个说话人的3分钟对话生成,可以通过扩展训练语料进一步延长对话时长和增加说话人数量。在播客生成和聊天机器人集成方面表现出色,提供稳定、自然的语音输出,可以根据上下文生成富有情感的语音。

FireRedTTS-2 – 小红书推出的流式文本转语音系统

FireRedTTS-2的主要功能

  • 长对话语音生成:支持4个说话人的3分钟对话生成,可扩展训练语料以增加对话时长和说话人数量。

© 版权声明

相关文章