AgentCPM-Explore是什么
AgentCPM-Explore 是清华大学、中国人民大学、面壁智能和 OpenBMB 开源社区联合推出的开源智能体模型。模型基于仅 4B 参数,在多个长程任务评测基准上超越同尺寸甚至更大模型,展现出极高的能力密度。模型支持超过 100 轮稳定交互,具备深度探索能力。模型全流程开源,包括工具沙盒管理平台 AgentDock、异步强化学习框架 AgentRL 和一键式评测平台 AgentToLeaP,助力开发者复现和扩展研究,推动端侧智能体模型的发展。
AgentCPM-Explore的主要功能
- 长程任务处理能力:模型能进行超过 100 轮的稳定环境交互,支持多源信息验证和动态策略调整,适用复杂的长周期任务。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
