Fun-CosyVoice3.5是什么
Fun-CosyVoice3.5 是阿里通义实验室语音团队最新发布的语音生成模型,主打多语种音色复刻与精细化表达控制。模型最突出的创新在于FreeStyle自然语言控制能力——用户无需掌握专业参数,直接用口语化指令如”语气坚定一点””语速慢一点”即可精准调控语音效果,实现”一句话自由生成语音”。Fun-CosyVoice3.5新增泰语、印尼语、葡萄牙语、越南语支持,覆盖13种语言,生僻字读错率从15.2%降至5.3%,并通过Tokenizer帧率优化将首包延迟降低35%。
Fun-CosyVoice3.5的主要功能
- FreeStyle 自然语言控制:支持用口语化指令直接描述语音效果,如”语气坚定一点””稍微压低音调,语速慢一点””带一点情绪起伏”等,无需掌握专业参数即可精准调控。
© 版权声明
文章版权归作者所有,未经允许请勿转载。

