Step-Audio-EditX – 阶跃星辰开源的音频编辑大模型

AI工具9个月前发布

55 0 0

Step-Audio-EditX是什么

Step-Audio-EditX 是阶跃星辰开源的全球首个 LLM 级音频编辑大模型，主打“情感、说话风格、副语言”三轴细粒度迭代控制，可把愤怒、开心、悲伤等情绪强度任意增减，能把撒娇、耳语、老人等风格叠加多次，能像字幕一样插入呼吸、笑声、叹气等 10 类自然副语言 token。自带零样本 TTS，无需目标人语音即可克隆音色，在文本前加“[四川话]”“[粤语]”等标签秒切方言。模型完全基于大间隔合成数据做 SFT+PPO，后训练阶段无需额外编码器或 adapter 能实现属性解耦与迭代控制。

Step-Audio-EditX – 阶跃星辰开源的音频编辑大模型

Step-Audio-EditX的主要功能

情感编辑：愤怒、开心、悲伤、兴奋、恐惧、惊讶、厌恶等几十种标签，可多次迭代增强或减弱强度。

# AI工具 # [db:标签]

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

Skywork-Reward-V2 – 昆仑万维开源的第二代奖励模型系列

101 0

因商标纠纷 OpenAI 与苹果前设计官乔纳森·伊夫合作暂停

96 0

Qwen3-Omni-Flash – 阿里通义推出的全模态大模型

116 0

MAI-1-preview – 微软推出的端到端训练基础模型

93 0

英伟达 4B 小模型击败 GPT-5 Pro！单任务成本仅后者 1/36

59 0

美国多所学校部署监控工具，实时监测学生与聊天机器人对话以预防心理问题

55 0

AI工具集平台！汇聚超2000+免费AI工具，涵盖AI写作、AI编程、AI绘画、AI论文、AI视频、AI生图、AI办公、AI学习、AI生成、agent等全场景工具。每日更新热门 AI工具，助您快速找到提升办公、创作、学习效率的实用工具！

按下Ctrl+D或⌘+D 感谢收藏 ai-gjj.com

友链申请免责声明广告合作关于我们站点地图提交AI工具

Copyright © 2026 AI工具集桂ICP备2025062026号