豆包大模型1.6-vision – 火山引擎推出的视觉深度思考模型

AI工具2周前发布
8 0

豆包大模型1.6-vision是什么

豆包大模型1.6-vision是火山引擎推出的具备工具调用能力的视觉深度思考模型。模型拥有强大的通用多模态理解和推理能力,支持Responses API,能自主调用工具如定位、剪裁、点选、画线、缩放和旋转等,实现对图像的精细处理。豆包大模型1.6-vision在视觉理解精度上满足高阶需求,在成本上相比前代模型Doubao-1.5-thinking-vision-pro降低了约50%,具有更高的性价比。模型在专业视觉理解公开测评中表现优异,覆盖OCR信息抽取、图像审核、巡检与安防、视频与图片标注、教育解题和AI搜索问答等多个应用场景,助力企业高效、低成本构建AI应用。

豆包大模型1.6-vision – 火山引擎推出的视觉深度思考模型

豆包大模型1.6-vision的主要功能

  • 工具调用能力:豆包大模型1.6-vision能自主调用工具,如POINT(绘制点和线)、GROUNDING(框选区域)、ZOOM(缩放图像)和ROTATE(旋转图像),实现对图像的精细处理。

© 版权声明

相关文章