Qwen3-Next – 阿里通义开源的混合架构模型

AI工具11个月前发布

77 0 0

Qwen3-Next是什么

Qwen3-Next是阿里通义开源的新一代混合架构大模型，包含指令版(Qwen3-Next-80B-A3B-Instruct )和思维版(Qwen3-Next-80B-A3B-Thinking)两个版本。模型用全球首创的Gated DeltaNet和Gated Attention混合架构，实现更快的处理速度、更强的效果和更省的资源消耗。模型总参数量达80B，每次推理仅激活约3B参数。模型预训练加速机制使长文生成速度显著提升。Qwen3-Next适用长上下文推理、高并发和低延迟需求场景，模型现已上线阿里云百炼支持API调用和QwenChat网页版支持在线体验。

Qwen3-Next – 阿里通义开源的混合架构模型

Qwen3-Next的主要功能

指令理解和执行：特别优化的指令版（Instruct）擅长理解和执行用户的指令。
深度思考和推理：思维版（Thinking）支持多步推理和深度思考问题。
长文本处理：模型能处理和理解长达32K以上的长文本输入。
高效率推理：基于混合动力引擎，结合速度和精度，实现快速且准确的推理。
节省资源：在保持大模型能力的同时，通过激活部分参数节省计算资源。

Qwen3-Next的技术原理

混合架构：结合75%的Gated DeltaNet和25%的Gated Attention，平衡速度和精度。

# AI工具 # [db:标签]

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

智元机器人获龙旗科技数亿元智元精灵 G2 框架订单，将部署近千台机器人

78 0

OpenAI 研究人员宣称已破解模型“幻觉”难题：现有评估方式在鼓励 AI“瞎蒙”

184 0

Kimi CLI – Moonshot AI推出的命令行通用智能体工具

60 0

Hugging Face 联合创始人沃尔夫：当前的 AI 模型不太可能带来重大科学突破

86 0

AI“看图”时的致命盲点，可窃取你的隐私数据

138 0

Gartner 调查：仅 20% 客服支持主管表示因 AI 削减团队规模

55 0

AI工具集平台！汇聚超2000+免费AI工具，涵盖AI写作、AI编程、AI绘画、AI论文、AI视频、AI生图、AI办公、AI学习、AI生成、agent等全场景工具。每日更新热门 AI工具，助您快速找到提升办公、创作、学习效率的实用工具！

按下Ctrl+D或⌘+D 感谢收藏 ai-gjj.com

友链申请免责声明广告合作关于我们站点地图提交AI工具

Copyright © 2026 AI工具集桂ICP备2025062026号