Speech 2.6是什么
Speech 2.6 是MiniMax推出的全新语音生成模型,专为新一代语音智能体设计,具备超低延时(低于250毫秒),确保实时对话流畅;支持多种语言的网址、邮箱、电话号码等非标准文本格式的直接转换,无需繁琐预处理。模型通过 Fluent LoRA 技术,进一步提升音韵自然度和音色复刻的流利性,原始素材带有口音或不流利,也能生成高质量语音。模型适用智能客服、智能硬件等多种场景,支持40+语种,为用户提供高效、自然的语音交互体验。用户可通过MiniMax开放平台和MiniMax Audio官网使用模型。
Speech 2.6的主要功能
- 超低延时:端到端延迟低于250毫秒,确保实时对话等场景中音频生成快速流畅。
© 版权声明
文章版权归作者所有,未经允许请勿转载。


