MedASR是什么
MedASR 是 Google 推出的专注于医学领域的语音识别模型,基于 Conformer 架构,拥有 105M 参数。模型通过大量医学语音数据(约 5000 小时)进行预训练,涵盖医生口述和临床对话等多种场景,能精准识别复杂医学术语和专业上下文。MedASR 在医学语音转录任务中表现出色,为开发者提供可定制化的基础模型,可用在进一步细调适应特定需求。模型通过将语音高效转化为文本,为医疗领域的数字化应用提供强大的支持。
MedASR的主要功能
- 医学语音转录:将医生的口述、临床对话等医学相关语音准确转录为文本。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
