Claude Sonnet 4.6 – Anthropic推出的最新一代AI模型

AI工具1个月前发布
33 0

Claude Sonnet 4.6是什么

Claude Sonnet 4.6是Anthropic推出的最新一代AI模型,定位”高性能与高性价比”的平衡点。在编程、计算机操作、长文本推理和智能体规划等核心能力上实现全面升级,性能已接近旗舰Opus 4.6水平,API定价仅为其五分之一。Sonnet 4.6支持100万token超长上下文窗口,单次可处理完整代码库或数十篇论文,并引入”自适应思考”机制,能根据任务复杂度动态分配推理资源。在OSWorld计算机使用基准测试中,得分从4.5版的61.4%跃升至72.5%,接近人类水平。

Claude Sonnet 4.6 – Anthropic推出的最新一代AI模型

Claude Sonnet 4.6的主要功能

  • 智能编程助手:在SWE-bench Verified编程基准测试中达到79.6%,支持代码生成、调试、重构和多文件项目理解,能处理复杂软件工程任务。
  • 计算机使用能力:具备高级GUI自动化操作能力,在OSWorld基准测试中得分72.5%,可执行网页表单填写、表格导航、跨应用操作等复杂任务。
  • 超长上下文处理:测试版支持100万token上下文窗口(是前代的两倍),单次请求可分析完整代码库、长篇法律合同或数十篇研究论文。
  • 自适应思考推理:引入Adaptive Thinking机制,模型可根据任务复杂度自动分配计算资源,替代固定模式的”扩展思考”开关。
  • 多模态理解:支持图像、图表和文档的视觉分析,能解读复杂数据可视化内容并生成结构化见解。
  • 智能体规划执行:在GDPval办公任务测试中Elo评分达1633,支持多步骤任务分解、工具调用和自主决策。
  • 长文本推理:在ARC-AGI-2推理基准测试中得分58.3%-60.4%,较4.5版的13.6%实现质的飞跃。

© 版权声明

相关文章