MMSI-Video-Bench – 上海AI Lab推出的空间智能视频基准

AI工具2天前发布
3 0

MMSI-Video-Bench是什么

MMSI-Video-Bench 是用于评估多模态大语言模型(MLLMs)在视频空间智能方面能力的基准测试工具。由上海人工智能实验室等多所高校联合推出,全面评估模型在真实物理世界中的空间理解与推理能力。基准包含来自25个公开数据集和1个自建数据集的1278个视频片段,覆盖室内场景、室外街景、机器人操作等多种复杂场景。问题由11位3D视觉研究员精心设计,确保了高挑战性和准确性。MMSI-Video-Bench 通过多层次任务设计,涵盖空间感知、运动理解、规划、预测和跨视频推理等能力,全面考察模型的视频理解与决策能力。

MMSI-Video-Bench – 上海AI Lab推出的空间智能视频基准

MMSI-Video-Bench的主要功能

  • 多模态能力评估:是一个专门用于评估多模态大语言模型(MLLMs)在视频空间智能方面表现的基准测试工具,能全面衡量模型对视频内容的理解和推理能力。

© 版权声明

相关文章