Fun-AudioGen-VD – 阿里通义实验室推出的音色设计模型

AI工具3周前发布
20 0

Fun-AudioGen-VD是什么

Fun-AudioGen-VD 是阿里通义实验室语音团队推出的创新语音大模型,定位为面向”声音设计与场景化音频生成”的专业工具。模型支持”FreeStyle”自由指令生成,能根据自然语言描述,一次性生成包含特定音色、情绪表达和完整听觉场景的高质量音频,实现”人物+场景”的一体化声音创作。在音色控制方面,Fun-AudioGen-VD 可精准调控性别、年龄、口音、音高、语速等基础属性,支持沙哑、清亮、磁性等音质特征,以及愤怒、悲伤、坚定等情绪表达,能模拟”表面镇定但内心颤抖”等复杂心理状态。在场景构建上,模型可叠加城市喧嚣、战场轰鸣等环境音,模拟大教堂、水下等空间混响,还原老式广播、对讲机等设备听感,实现风噪断续、回声变化等动态环境互动效果。

Fun-AudioGen-VD – 阿里通义实验室推出的音色设计模型

Fun-AudioGen-VD的主要功能

  • FreeStyle自由指令生成:支持用自然语言描述直接生成目标音色与完整听觉场景,无需复杂参数设置,实现”人物+场景”一体化音频创作。

© 版权声明

相关文章