Mini-o3 – 字节联合港大推出的视觉推理模型

AI工具3天前发布
3 0

Mini-o3是什么

Mini-o3 是字节跳动和香港大学联合推出的开源模型,专为解决复杂的视觉搜索问题而设计。模型通过强化学习和基于图像的工具,能执行深度多轮推理,推理轮次可扩展至数十轮。Mini-o3 通过构建挑战性数据集、采用迭代数据收集流程以及提出过轮遮蔽策略等方法,显著提升模型的推理能力和交互轮次。模型在多个视觉搜索基准测试中取得最佳性能,所有代码、模型和数据集均开源,便于复现和进一步研究。

Mini-o3 – 字节联合港大推出的视觉推理模型

Mini-o3的主要功能

  • 多轮交互推理:能进行深度多轮推理,交互轮次可扩展至数十轮,通过逐步探索和试错解决复杂的视觉搜索问题。

© 版权声明

相关文章