近日,谷歌DeepMind在其官方博客发布重要声明,宣布推出全新机器人AI解决方案——Gemini Robotics On-Device本地化模型。
这一创新模型采用了先进的视觉-语言-动作(VLA)架构,能够在无须云端支持的情况下实现机器人实体的精准控制。其核心优势体现在以下几个方面:
技术实力:
-
具备独立运行能力,可实现实时响应(特别适用于医疗等网络不稳定场景)
-
能够完成高精度操作任务,包括开包、拉链、叠衣、系鞋带等复杂动作
-
兼容双机械臂设计,支持ALOHA、Franka FR3及Apollo等多种人形机器人平台
开发者支持:
-
提供专属的Gemini Robotics SDK开发工具包
-
通过50-100次任务演示即可快速定制新功能,大大降低了开发门槛
-
全面兼容MuJoCo物理模拟器进行测试验证
安全防护:
-
采用Live API进行语义安全实时检测
-
通过底层安全控制器严格控制动作力度与速度
-
提供开放的语义安全基准测试框架,确保操作安全性
项目负责人Carolina Parada表示:”我们借鉴了Gemini在多模态世界中理解与生成能力,使其能够像处理文本、代码和图像一样自然地生成机器人动作指令。”
目前该模型仅面向可信测试计划开发者开放,基于Gemini 2.0架构开发(暂未更新至最新版本Gemini 2.5)。
参考文献:
-
《Gemini Robotics On-Device brings AI to local robotic devices》
© 版权声明
文章版权归作者所有,未经允许请勿转载。