FLM-Audio – 智源研究院开源的全双工音频对话模型

AI工具10个月前发布

77 0 0

FLM-Audio是什么

FLM-Audio 是北京智源人工智能研究院联合 Spin Matrix 与新加坡南洋理工大学共同发布的原生全双工音频对话大模型，支持中文和英文。采用原生全双工架构，可在每个时间步合并听觉、说话和独白通道，避免传统时分复用方案的高延迟问题。其独特的自然独白与双重训练范式，使模型在对话中更接近人类的自然交流方式，有效解决了异步对齐问题。FLM-Audio 仅用 100 万小时数据训练，数据量大幅减少，但回复质量高且响应敏捷自然，对噪声和用户打断也有较强鲁棒性。

FLM-Audio – 智源研究院开源的全双工音频对话模型

FLM-Audio的主要功能

全双工语音交互：实现“边听边说”，用户可随时打断模型，模型能即时暂停输出并理解新问题后回应，交互自然流畅，延迟低。

# AI工具 # [db:标签]

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

德意志银行：ChatGPT 付费人数仅占周活用户 5%，在欧洲面临收入增长瓶颈

73 0

cto.new – 免费的AI编程平台，自动代码规划与生成

72 0

NemoVideo – AI视频编辑工具，一键制作爆款视频

57 0

六万页仅转化一人：Cloudflare CEO警示AI搜索威胁出版商生存

105 0

迅雷MCP – 迅雷推出的AI自动下载MCP服务

111 0

路透社：AI 热潮催生复杂金融工具，恐重演 2008 年金融危机

72 0

AI工具集平台！汇聚超2000+免费AI工具，涵盖AI写作、AI编程、AI绘画、AI论文、AI视频、AI生图、AI办公、AI学习、AI生成、agent等全场景工具。每日更新热门 AI工具，助您快速找到提升办公、创作、学习效率的实用工具！

按下Ctrl+D或⌘+D 感谢收藏 ai-gjj.com

友链申请免责声明广告合作关于我们站点地图提交AI工具

Copyright © 2026 AI工具集桂ICP备2025062026号