Mistral 发布 Voxtral 语音理解模型:开源高准确度

AI资讯1个月前发布
11 0

近日消息,Mistral AI于当地时间昨日正式发布了其全新的语音理解模型——Voxtral。这一系列模型以开源形式发布,凭借更低的成本实现了业内领先的低错误率表现,并为真实世界的语音智能生产应用提供了有力支持。

据了解,Voxtral系列模型基于Mistral Small 3.1构建而成,主要包含两个核心版本:专为生产环境设计的24B参数规模模型Voxtral Small,以及适用于本地部署和边缘计算场景的轻量化3B模型Voxtral Mini。此外,该家族中还包含专注于语音转写功能的独立版本——Voxtral Mini Transcribe。

值得注意的是,Voxtral系列在功能上实现了显著突破。其支持最长32K Token的上下文处理能力,可分别完成30分钟的音频转录任务和40分钟的深度语音理解工作。同时,该模型还内置了自动生成相关问题、进行结构化摘要等实用功能,并对英语、西班牙语、法语、葡萄牙语、印地语、德语、荷兰语及意大利语等多种印欧语言提供了全面支持。

Mistral 发布 Voxtral 语音理解模型:开源高准确度

在性能对比方面,Mistral AI表示Voxtral Mini Transcribe在成本敏感型应用场景中展现出超越OpenAI Whisper的性能优势,且其价格仅为后者的不到一半。而在更复杂的高级用例场景下,Voxtral Small同样表现不俗,其效果可与行业标杆模型ElevenLabs Scribe相媲美,同时定价也远低于后者的一半。这一系列产品的推出无疑为语音智能技术的落地应用提供了更具性价比的选择。

© 版权声明

相关文章