DeepSeek-OCR 2 – DeepSeek团队开源的二代OCR模型

AI工具2周前发布
11 0

DeepSeek-OCR 2 是什么

DeepSeek-OCR 2 是 DeepSeek 团队推出的第二代 OCR 模型,通过引入 DeepEncoder V2 架构,实现从固定扫描到语义推理的范式转变。模型采用因果流查询和双流注意力机制,能动态重排视觉 Token,更精准地还原复杂文档的自然阅读逻辑。在 OmniDocBench v1.5 评测中,模型综合得分达到 91.09%,较前代提升显著,同时显著降低了 OCR 识别结果的重复率,为未来构建全模态编码器提供新路径。

DeepSeek-OCR 2 – DeepSeek团队开源的二代OCR模型

DeepSeek-OCR 2 的主要功能

  • 复杂文档解析:模型能精准解析带表格、公式和多栏布局的复杂文档,还原自然阅读逻辑。

© 版权声明

相关文章