Xiaomi MiMo-V2-Omni – 小米推出的全模态Agent基座模型

AI工具3天前发布
3 0

Xiaomi MiMo-V2-Omni是什么

Xiaomi MiMo-V2-Omni 是小米推出的全模态 Agent 基座模型,融合文本、视觉、语音三大模态,原生具备感知、推理与执行能力。模型支持工具调用、GUI 操作及复杂任务自主规划,在音频理解、图像推理等评测中比肩 Gemini 3 Pro 与 Claude Opus 4.6。模型曾以”Healer Alpha”代号匿名测试,登顶 OpenRouter 调用榜,现已成为小米面向 Agent 时代的核心 AI 基础设施。

Xiaomi MiMo-V2-Omni – 小米推出的全模态Agent基座模型

Xiaomi MiMo-V2-Omni的主要功能

  • 全模态感知:模型融合文本、视觉、音频三大模态,实现图像理解、视频分析、10+小时长音频处理及跨模态联合推理。

© 版权声明

相关文章