KittenTTS是什么
KittenTTS 是轻量级开源文本转语音(TTS)模型,由 KittenML 团队开发。以极小的模型体积(仅 25MB)和强大的 CPU 优化为特点,无需 GPU 即可在低功耗设备上运行,KittenTTS 提供 8 种预置音色(4 男 4 女),支持多语言(目前主要支持英语),可通过 ONNX/PyTorch 格式集成到各种应用中。首次运行时会下载权重并缓存到本地,之后无需联网即可生成语音,适合离线场景。

KittenTTS的主要功能
- 轻量化设计:模型体积仅 25MB,参数量约 1500 万,是目前最小的开源 TTS 模型之一,适合在资源受限的设备上运行。
© 版权声明
文章版权归作者所有,未经允许请勿转载。