MOSS-TTSD – 清华实验室开源的口语对话语音生成模型

AI工具1年前 (2025)发布

91 0 0

MOSS-TTSD是什么

MOSS-TTSD（Text to Spoken Dialogue）是开源的口语对话语音生成模型，由清华大学语音与语言实验室（Tencent AI Lab）开发。能将文本对话脚本转化为自然流畅、富有表现力的对话语音，支持中英文双语生成。模型基于先进的语义-音学神经网络音频编解码器和大规模预训练语言模型，结合了超过100万小时的单人语音数据和40万小时的对话语音数据进行训练。支持零样本语音克隆，能根据对话脚本生成准确的对话者切换语音，适用于AI播客、访谈、新闻报道等多种场景。

MOSS-TTSD – 清华实验室开源的口语对话语音生成模型

MOSS-TTSD的主要功能

高表现力对话语音生成：能将对话脚本转换为自然、富有表现力的对话语音，准确捕捉对话中的韵律、语调等特性。

# AI工具 # [db:标签]

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

Opal – 谷歌推出的AI工作流生成平台

108 0

苹果探索自研多模态 AI 模型 Manzano：兼具理解与生成能力，不弱于 OpenAI GPT-4o 和谷歌 Nano Banana

85 0

智谱上线并开源文本转语音模型 GLM-TTS：只需 3 秒语音样本即可克隆声音

119 0

马斯克：AI 将像超音速海啸一样，迅速取代数字导向型办公室工作

74 0

花生AI – B站推出AI视频创作工具

178 0

LandPPT – 开源AI PPT生成工具，简化三步工作流

177 0

AI工具集平台！汇聚超2000+免费AI工具，涵盖AI写作、AI编程、AI绘画、AI论文、AI视频、AI生图、AI办公、AI学习、AI生成、agent等全场景工具。每日更新热门 AI工具，助您快速找到提升办公、创作、学习效率的实用工具！

按下Ctrl+D或⌘+D 感谢收藏 ai-gjj.com

友链申请免责声明广告合作关于我们站点地图提交AI工具

Copyright © 2026 AI工具集桂ICP备2025062026号