Qwen3-TTS – 阿里通义开源的系列语音生成模型

AI工具6个月前发布

82 0 0

Qwen3-TTS是什么

Qwen3-TTS是Qwen开源的系列语音生成模型，具备强大的音色克隆、创造和语音控制能力。模型基于创新的Qwen3-TTS-Tokenizer-12Hz多码本语音编码器，实现高效语音压缩与高保真还原。模型采用Dual-Track双轨建模，支持低延迟流式生成，首包音频仅需等待一个字符。模型覆盖10种主流语言（中文、英文、日语、韩语、德语、法语、俄语、葡萄牙语、西班牙语、意大利语）及多种方言，具备智能文本理解能力，可自适应调整语气、节奏和情感。Qwen3-TTS 多码本全系列模型均已开源，包含1.7B和0.6B两种尺寸能满足不同性能与效率需求，为开发者和用户提供全面的语音生成功能。

Qwen3-TTS – 阿里通义开源的系列语音生成模型

Qwen3-TTS的主要功能

音色克隆：模型能通过少量参考音频克隆出特定说话人的音色，实现高度相似的语音合成。

# AI工具 # [db:标签]

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

谷歌 Gemini 3.0 Pro 旗舰 AI 模型内测流出：编程实力亮眼，下周上线

67 0

Meta 加码 AI 布局，拟收购声音克隆公司 PlayAI 部分资产

99 0

Syft – AI新闻聚合应用，指定主题生成个性化新闻摘要

97 0

FlowAct-R1 – 字节推出的实时交互数字人视频生成框架

87 0

DeepSeek R1T2 – TNG推出的改进型AI语言模型，基于DeepSeek

90 0

AppStruct – AI应用开发平台，无代码拖拽式搭建

93 0

AI工具集平台！汇聚超2000+免费AI工具，涵盖AI写作、AI编程、AI绘画、AI论文、AI视频、AI生图、AI办公、AI学习、AI生成、agent等全场景工具。每日更新热门 AI工具，助您快速找到提升办公、创作、学习效率的实用工具！

按下Ctrl+D或⌘+D 感谢收藏 ai-gjj.com

友链申请免责声明广告合作关于我们站点地图提交AI工具

Copyright © 2026 AI工具集桂ICP备2025062026号