Xiaomi MiMo-V2-Omni是什么
Xiaomi MiMo-V2-Omni 是小米推出的全模态 Agent 基座模型,融合文本、视觉、语音三大模态,原生具备感知、推理与执行能力。模型支持工具调用、GUI 操作及复杂任务自主规划,在音频理解、图像推理等评测中比肩 Gemini 3 Pro 与 Claude Opus 4.6。模型曾以”Healer Alpha”代号匿名测试,登顶 OpenRouter 调用榜,现已成为小米面向 Agent 时代的核心 AI 基础设施。
Xiaomi MiMo-V2-Omni的主要功能
- 全模态感知:模型融合文本、视觉、音频三大模态,实现图像理解、视频分析、10+小时长音频处理及跨模态联合推理。
© 版权声明
文章版权归作者所有,未经允许请勿转载。

