FLM-Audio是什么
FLM-Audio 是北京智源人工智能研究院联合 Spin Matrix 与新加坡南洋理工大学共同发布的原生全双工音频对话大模型,支持中文和英文。采用原生全双工架构,可在每个时间步合并听觉、说话和独白通道,避免传统时分复用方案的高延迟问题。其独特的自然独白与双重训练范式,使模型在对话中更接近人类的自然交流方式,有效解决了异步对齐问题。FLM-Audio 仅用 100 万小时数据训练,数据量大幅减少,但回复质量高且响应敏捷自然,对噪声和用户打断也有较强鲁棒性。

FLM-Audio的主要功能
- 全双工语音交互:实现“边听边说”,用户可随时打断模型,模型能即时暂停输出并理解新问题后回应,交互自然流畅,延迟低。
© 版权声明
文章版权归作者所有,未经允许请勿转载。