AudioFly – 科大讯飞开源的文生音效模型

AI工具10个月前发布

135 0 0

AudioFly是什么

AudioFly 是科大讯飞开源的文本生成音效的AI模型。模型用潜在扩散模型架构，拥有10亿参数，通过大量开放数据集（如AudioSet、AudioCaps、TUT）及内部专有数据训练而成。AudioFly 能根据文本描述生成高质量音频，采样率高达44.1kHz，生成的音效与文本描述高度匹配。模型在单事件和多事件场景下均表现出色，在AudioCaps数据集上性能卓越，超越以往的音频生成模型。AudioFly 适用短视频配音、有声故事生成等领域，为声音创作带来无限可能。

AudioFly – 科大讯飞开源的文生音效模型

AudioFly的主要功能

文本到音效生成：根据用户输入的文本描述生成对应的音效。例如，输入“雷声在远处轰鸣”，模型能生成相应的雷声音效。

# AI工具 # [db:标签]

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

SkyReels V4 – 昆仑万维推出的AI多模态视频基础模型

58 0

TeleChat3 – 中国电信推出的千亿参数MoE语义大模型

100 0

Gmail 被指“拿用户邮件训练 AI”，谷歌否认

56 0

Parlant – 开源的大模型AI Agent开发框架

94 0

谷歌 AI 搜索再进化：生成交互界面，让你秒懂复杂问题

54 0

英伟达黄仁勋称英国查尔斯国王给他一封信，提醒注意 AI 风险

65 0

AI工具集平台！汇聚超2000+免费AI工具，涵盖AI写作、AI编程、AI绘画、AI论文、AI视频、AI生图、AI办公、AI学习、AI生成、agent等全场景工具。每日更新热门 AI工具，助您快速找到提升办公、创作、学习效率的实用工具！

按下Ctrl+D或⌘+D 感谢收藏 ai-gjj.com

友链申请免责声明广告合作关于我们站点地图提交AI工具

Copyright © 2026 AI工具集桂ICP备2025062026号