QwenLong-L1.5 – 阿里通义开源的长文本推理模型

AI工具3个月前发布
64 0

QwenLong-L1.5是什么

QwenLong-L1.5 是阿里通义实验室推出的专注于长文本推理的大语言模型。模型基于 Qwen3-30B-A3B 架构,通过系统化的后训练方案,显著提升长文本推理能力。模型通过高质量的数据合成管线、稳定的强化学习方法和突破物理窗口限制的记忆管理框架,解决传统模型在长文本任务中的不足,如训练不稳定、上下文窗口有限等问题。模型在多个长文本推理基准测试中表现优异,性能接近甚至超越 GPT-5 等顶尖模型,同时在通用能力上有显著提升。

QwenLong-L1.5 – 阿里通义开源的长文本推理模型

QwenLong-L1.5的主要功能

  • 长文本推理:模型能处理和推理超长文本(如百万级 Token 的文档),解决需要跨段落、跨文档的复杂问题。

© 版权声明

相关文章