MedASR – 谷歌开源的医疗语音识别模型

AI工具2天前发布
1 0

MedASR是什么

MedASR 是 Google 推出的专注于医学领域的语音识别模型,基于 Conformer 架构,拥有 105M 参数。模型通过大量医学语音数据(约 5000 小时)进行预训练,涵盖医生口述和临床对话等多种场景,能精准识别复杂医学术语和专业上下文。MedASR 在医学语音转录任务中表现出色,为开发者提供可定制化的基础模型,可用在进一步细调适应特定需求。模型通过将语音高效转化为文本,为医疗领域的数字化应用提供强大的支持。

MedASR – 谷歌开源的医疗语音识别模型

MedASR的主要功能

  • 医学语音转录:将医生的口述、临床对话等医学相关语音准确转录为文本。

© 版权声明

相关文章