Xiaomi-Robotics-0 – 小米开源的机器人VLA模型

AI工具6个月前发布

75 0 0

Xiaomi-Robotics-0是什么

Xiaomi-Robotics-0是小米开源的首代机器人VLA（视觉-语言-动作）大模型，拥有47亿参数，采用MoT混合架构，Qwen3-VL多模态模型作为”大脑”理解视觉语言指令，Diffusion Transformer作为”小脑”生成高频动作块。创新性地引入异步执行与Λ-shape注意力掩码，解决推理延迟导致的动作卡顿，实现消费级显卡上的实时流畅控制。在LIBERO、CALVIN等仿真基准测试中刷新SOTA，成功应用于积木拆解、毛巾折叠等真机双臂操作任务。

Xiaomi-Robotics-0 – 小米开源的机器人VLA模型

Xiaomi-Robotics-0的主要功能

自然语言理解：模型能解析人类模糊指令，从视觉输入中识别空间关系与操作意图。

# AI工具 # [db:标签]

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

禾赛、广和通联合发布机器人激光雷达方案，已落地国内某头部具身智能公司

61 0

AI Sheets – Hugging Face开源的无代码数据处理工具

105 0

蚂蚁阿福发声明：问答结果中无任何广告推荐、不存在商业排名

106 0

阿里巴巴发布首个数据分析 Agent：10 秒获取数据、20 分钟生成报告

98 0

OpenAI 奥尔特曼“秀肌肉”：GPT-5 实测具备高效整合网络信息能力

86 0

QEMU因版权风险暂停支持AI代码

88 0

AI工具集平台！汇聚超2000+免费AI工具，涵盖AI写作、AI编程、AI绘画、AI论文、AI视频、AI生图、AI办公、AI学习、AI生成、agent等全场景工具。每日更新热门 AI工具，助您快速找到提升办公、创作、学习效率的实用工具！

按下Ctrl+D或⌘+D 感谢收藏 ai-gjj.com

友链申请免责声明广告合作关于我们站点地图提交AI工具

Copyright © 2026 AI工具集桂ICP备2025062026号