Fun-AudioGen-VD – 阿里通义实验室推出的音色设计模型

AI工具5个月前发布

63 0 0

Fun-AudioGen-VD是什么

Fun-AudioGen-VD 是阿里通义实验室语音团队推出的创新语音大模型，定位为面向”声音设计与场景化音频生成”的专业工具。模型支持”FreeStyle”自由指令生成，能根据自然语言描述，一次性生成包含特定音色、情绪表达和完整听觉场景的高质量音频，实现”人物+场景”的一体化声音创作。在音色控制方面，Fun-AudioGen-VD 可精准调控性别、年龄、口音、音高、语速等基础属性，支持沙哑、清亮、磁性等音质特征，以及愤怒、悲伤、坚定等情绪表达，能模拟”表面镇定但内心颤抖”等复杂心理状态。在场景构建上，模型可叠加城市喧嚣、战场轰鸣等环境音，模拟大教堂、水下等空间混响，还原老式广播、对讲机等设备听感，实现风噪断续、回声变化等动态环境互动效果。

Fun-AudioGen-VD – 阿里通义实验室推出的音色设计模型

Fun-AudioGen-VD的主要功能

FreeStyle自由指令生成：支持用自然语言描述直接生成目标音色与完整听觉场景，无需复杂参数设置，实现”人物+场景”一体化音频创作。

# AI工具 # [db:标签]

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

石榴数字人 – 向量方程推出的AI数字人视频创作平台

64 0

ChatGPT Pulse – OpenAI推出的主动推送功能

77 0

从 AI 潜在牺牲品到赢家，谷歌在 ChatGPT 冲击下逆袭

58 0

养宠机器人 Vex 亮相 CES 2026：能跟随宠物互动，还能自己剪 Vlog

97 0

腾讯副总裁蔡学忠：看好 AI 的长期价值，内部 30% 代码由人工智能在写

174 0

星流Agent – Liblib推出的AI创意设计Agent

101 0

AI工具集平台！汇聚超2000+免费AI工具，涵盖AI写作、AI编程、AI绘画、AI论文、AI视频、AI生图、AI办公、AI学习、AI生成、agent等全场景工具。每日更新热门 AI工具，助您快速找到提升办公、创作、学习效率的实用工具！

按下Ctrl+D或⌘+D 感谢收藏 ai-gjj.com

友链申请免责声明广告合作关于我们站点地图提交AI工具

Copyright © 2026 AI工具集桂ICP备2025062026号