FireRedASR2S – 小红书开源的语音识别模型

AI工具3周前发布
24 0

FireRedASR2S是什么

FireRedASR2S是小红书Super Intelligence-AudioLab开源的工业级端到端语音识别模型,集成ASR、VAD、语种识别和标点预测四大SOTA模块。模型支持中文普通话及20+方言、英语、代码切换和歌词识别,中文普通话字错率低至2.89%,方言平均11.55%,全面领先Doubao-ASR、Qwen3-ASR等竞品。系统支持一键本地部署,无需外部API,已在小红书语音评论、语音搜索等高频场景规模化落地。

FireRedASR2S – 小红书开源的语音识别模型

FireRedASR2S的主要功能

  • 语音识别(FireRedASR2):支持中文普通话、20+方言/口音、英语、中英混杂及歌词识别,提供LLM和AED两种架构版本,AED版本支持字级别时间戳和置信度输出。

© 版权声明

相关文章