ClawWork是什么
ClawWork 是香港大学数据科学实验室(HKUDS)开源的 AI Agent 经济生存基准测试框架,评估大模型在真实商业环境中的”赚钱能力”。系统为每个 Agent 设定 10 美元启动资金,要求其通过完成 220 个真实职业任务(覆盖金融、医疗、制造等 44 个行业)来赚取收入、支付 Token 成本,资金耗尽即”破产”。任务报酬按质量评分结算,价值从 $82 到 $5,000 不等,迫使 Agent 在”立即工作赚钱”与”投资学习提升”之间做出战略权衡。ClawWork 支持 GPT-4o、Claude、Kimi 等多模型竞技,提供 React 实时仪表板监控生存状态,为 AI 劳动力经济研究提供了首个”用进废退”的真实压力测试环境。
ClawWork的主要功能
- 220 个真实职业任务:来自 OpenAI GDPVal 数据集,覆盖 44 个经济部门(制造、金融、医疗、政府、零售等),每个任务都对应真实世界的工作场景。
© 版权声明
文章版权归作者所有,未经允许请勿转载。

