Qianfan-OCR – 百度千帆推出的端到端文档智能模型

AI工具3天前发布
4 0

Qianfan-OCR是什么

Qianfan-OCR 是百度千帆推出的端到端文档智能模型,基于 4B 参数视觉语言架构,将文档解析、版面分析、文字识别与语义理解融为一体。模型在 OmniDocBench v1.5 评测中以 93.12 分位列端到端模型第一,通过 Layout-as-Thought 机制实现版面结构显式建模,支持复杂表格与图表理解。模型已开源,单卡 A100 可高效部署。

Qianfan-OCR – 百度千帆推出的端到端文档智能模型

Qianfan-OCR的主要功能

  • 文档图像解析:模型支持直接从扫描件或图片中提取结构化文本内容,无需预处理。

© 版权声明

相关文章