近日,科技媒体9to5Mac发文指出,得益于英伟达Parakeet模型的整合,MacWhisper在音频转录效率上实现了显著突破。
这款应用最初于2023年2月由开发者Jordi Bruin发布,主要依托于OpenAI的Whisper转录技术,能够在本地完成音频文件的文字转换工作。
然而,随着OpenAI将重心转移至更具市场潜力的gpt-4o-transcribe模型,Whisper的技术优势逐渐被取代。 newer, faster transcription models have consistently outperformed Whisper.
上个月,英伟达推出了一款名为Parakeet的新模型,该模型能够高效处理音频转录任务,尤其在配备A100、H100、T4或V100 GPU的设备上表现尤为突出:仅需1秒钟即可完成60分钟音频的转录。
虽然Parakeet是一个开源工具,但其复杂的命令行界面和模型部署流程让许多普通用户望而却步。而新版MacWhisper的推出,则极大地降低了这一技术门槛。
开发者Jordi Bruin在介绍此次更新时表示:”通过与Argmax团队的合作,我们现在让用户能够更轻松地使用Parakeet模型。如下面的演示所示,仅需8秒即可完成一档30分钟播客的转录和整理!“
在实际测试中,该媒体利用升级后的MacWhisper处理时长3小时的9to5Mac Happy Hour播客,仅耗时1分22秒便完成了转录工作。
© 版权声明
文章版权归作者所有,未经允许请勿转载。