DiaMoE-TTS是什么
DiaMoE-TTS 是清华大学和巨人网络联合推出的多方言语音合成(TTS)框架。框架基于国际音标(IPA)统一输入体系,结合方言感知的 Mixture-of-Experts(MoE)架构和低资源适配策略(PEFT),实现低成本、低门槛的多方言语音合成。框架支持多种方言和小语种,能在少量数据下快速建模,兼具高效性和灵活性。DiaMoE-TTS数据、代码和方法全面开源,推动方言保护与文化传承,让小众语言在数字世界中被听见。
DiaMoE-TTS的主要功能
- 多方言语音合成:支持多种方言和小语种语音合成,涵盖粤语、闽南话、吴语等,能扩展到京剧韵白等特殊类型,让小众语言能开口说话。
© 版权声明
文章版权归作者所有,未经允许请勿转载。


