MMSI-Video-Bench – 上海AI Lab推出的空间智能视频基准

AI工具7个月前发布

95 0 0

MMSI-Video-Bench是什么

MMSI-Video-Bench 是用于评估多模态大语言模型（MLLMs）在视频空间智能方面能力的基准测试工具。由上海人工智能实验室等多所高校联合推出，全面评估模型在真实物理世界中的空间理解与推理能力。基准包含来自25个公开数据集和1个自建数据集的1278个视频片段，覆盖室内场景、室外街景、机器人操作等多种复杂场景。问题由11位3D视觉研究员精心设计，确保了高挑战性和准确性。MMSI-Video-Bench 通过多层次任务设计，涵盖空间感知、运动理解、规划、预测和跨视频推理等能力，全面考察模型的视频理解与决策能力。

MMSI-Video-Bench – 上海AI Lab推出的空间智能视频基准

MMSI-Video-Bench的主要功能

多模态能力评估：是一个专门用于评估多模态大语言模型（MLLMs）在视频空间智能方面表现的基准测试工具，能全面衡量模型对视频内容的理解和推理能力。

# AI工具 # [db:标签]

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

Gemini Embedding 2 – 谷歌推出的首个原生多模态嵌入模型

58 0

WPS灵犀智能文档生成工具发布，用户可通过自然语言完成创作

128 0

Spotify 将整顿“AI 音乐”，打击低质内容、侵权“翻唱”等

79 0

Nano Banana 2 – 谷歌推出的新一代图像生成模型

66 0

MiDashengLM – 小米开源的高效声音理解大模型

90 0

教育部：试点探索 AI 在日常考试命题、组卷、阅卷、分析等关键环节的场景应用

118 0

AI工具集平台！汇聚超2000+免费AI工具，涵盖AI写作、AI编程、AI绘画、AI论文、AI视频、AI生图、AI办公、AI学习、AI生成、agent等全场景工具。每日更新热门 AI工具，助您快速找到提升办公、创作、学习效率的实用工具！

按下Ctrl+D或⌘+D 感谢收藏 ai-gjj.com

友链申请免责声明广告合作关于我们站点地图提交AI工具

Copyright © 2026 AI工具集桂ICP备2025062026号