CL-bench – 腾讯姚顺雨团队推出的模型学习能力评测基准

AI工具6个月前发布

76 0 0

CL-bench是什么

CL-bench是腾讯混元与复旦大学联合推出的Context学习能力评测基准，能衡量大语言模型从全新上下文信息中实时学习、应用知识的能力。CL-bench基准包含500个专家精心构建的复杂场景、1899个任务，涵盖领域知识推理、规则系统应用、程序性任务执行和经验发现与模拟四大类。测试显示，最强模型GPT-5.1解决率仅23.7%，揭示当前AI”不会现场学习”的核心瓶颈，为模型优化指明新方向。

CL-bench – 腾讯姚顺雨团队推出的模型学习能力评测基准

CL-bench的主要功能

实时学习能力评测：支持评测大语言模型从全新上下文信息中实时学习、应用知识的能力。

# AI工具 # [db:标签]

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

Grokipedia – xAI推出的新型AI知识平台

63 0

HistAgent – 普林斯顿联合复旦推出的AI历史研究助手

111 0

Voost – 创新的双向虚拟试穿和试脱AI模型

176 0

谷歌 Chrome 浏览器接入 Gemini AI：能帮你解读网页、模糊检索历史记录

263 0

Vibe Pocket – AI云端开发平台，集成多种AI Agent

102 0

MMSI-Video-Bench – 上海AI Lab推出的空间智能视频基准

95 0

AI工具集平台！汇聚超2000+免费AI工具，涵盖AI写作、AI编程、AI绘画、AI论文、AI视频、AI生图、AI办公、AI学习、AI生成、agent等全场景工具。每日更新热门 AI工具，助您快速找到提升办公、创作、学习效率的实用工具！

按下Ctrl+D或⌘+D 感谢收藏 ai-gjj.com

友链申请免责声明广告合作关于我们站点地图提交AI工具

Copyright © 2026 AI工具集桂ICP备2025062026号