Mobile-Agent-v3.5是什么
Mobile-Agent-v3.5 是阿里巴巴通义实验室开源的新一代多平台GUI Agent框架,标志着开源GUI智能体从”演示级”迈向”工程可用级”。框架原生支持桌面、手机、浏览器三大平台,可跨Android、Ubuntu、macOS、Windows实现自动化操作。配套的GUI-Owl-1.5模型家族提供2B至235B多参数规模,并解耦出Instruct(轻量低延迟)和Thinking(强规划反思)两种变体,支持端侧到云端全链路部署。Mobile-Agent-v3.5在OSWorld-Verified、AndroidWorld、VisualWebArena等20多项主流GUI Benchmark上取得开源领域SOTA成绩,通过混合数据飞轮、统一思维链合成和MRPO多平台强化学习算法三大核心技术,解决了跨平台动作空间差异与长程任务训练不稳定等难题,为社区提供了从底层基座模型到Agent框架的完整开源技术参考。
Mobile-Agent-v3.5的主要功能
- 跨平台GUI自动化:原生支持桌面、手机、浏览器三大平台,实现Android、Ubuntu、macOS、Windows多端统一控制与自动化操作。
© 版权声明
文章版权归作者所有,未经允许请勿转载。

