Xiaomi MiMo-V2-TTS – 小米推出的语音合成大模型

AI工具3天前发布
3 0

Xiaomi MiMo-V2-TTS是什么

Xiaomi MiMo-V2-TTS 是小米为 Agent 时代推出的语音合成大模型。模型基于自研 Audio Tokenizer 和多码本架构,经上亿小时语音数据预训练与多维度强化学习,实现高度可控的多粒度语音风格控制——从整体基调到局部情绪均可精准调节,支持语气转折、情感递变。模型具备强大的文本理解能力,可智能识别标点与语气词;模型同时支持方言、角色扮演及歌声合成,让 AI 能”听懂”,能用有温度、有灵魂的声音自然表达。

Xiaomi MiMo-V2-TTS – 小米推出的语音合成大模型

Xiaomi MiMo-V2-TTS的主要功能

  • 多层次语音风格控制:支持从整体风格定调到局部情绪表达的精准调节,可在同一句话内完成语气转折和情感递变。

© 版权声明

相关文章