DeepMind机器人AI本地化运行:实现复杂操作

AI资讯2个月前发布
18 0

近日,谷歌DeepMind在其官方博客发布重要声明,宣布推出全新机器人AI解决方案——Gemini Robotics On-Device本地化模型。

DeepMind机器人AI本地化运行:实现复杂操作

这一创新模型采用了先进的视觉-语言-动作(VLA)架构,能够在无须云端支持的情况下实现机器人实体的精准控制。其核心优势体现在以下几个方面:

技术实力:

  • 具备独立运行能力,可实现实时响应(特别适用于医疗等网络不稳定场景)

  • 能够完成高精度操作任务,包括开包、拉链、叠衣、系鞋带等复杂动作

  • 兼容双机械臂设计,支持ALOHA、Franka FR3及Apollo等多种人形机器人平台

DeepMind机器人AI本地化运行:实现复杂操作

DeepMind机器人AI本地化运行:实现复杂操作

DeepMind机器人AI本地化运行:实现复杂操作

开发者支持:

  • 提供专属的Gemini Robotics SDK开发工具包

  • 通过50-100次任务演示即可快速定制新功能,大大降低了开发门槛

  • 全面兼容MuJoCo物理模拟器进行测试验证

DeepMind机器人AI本地化运行:实现复杂操作

DeepMind机器人AI本地化运行:实现复杂操作

安全防护:

  • 采用Live API进行语义安全实时检测

  • 通过底层安全控制器严格控制动作力度与速度

  • 提供开放的语义安全基准测试框架,确保操作安全性

DeepMind机器人AI本地化运行:实现复杂操作

项目负责人Carolina Parada表示:”我们借鉴了Gemini在多模态世界中理解与生成能力,使其能够像处理文本、代码和图像一样自然地生成机器人动作指令。”

目前该模型仅面向可信测试计划开发者开放,基于Gemini 2.0架构开发(暂未更新至最新版本Gemini 2.5)。

参考文献:

  • 《Gemini Robotics On-Device brings AI to local robotic devices》

© 版权声明

相关文章