MiniCPM 4.1是什么
MiniCPM 4.1 是面壁智能推出的混合思考模型。采用 InfLLM v2 稀疏注意力架构,每个词元仅需计算与少于 5% 词元的相关性,显著降低长文本处理开销。在 128K 长文本场景下,相比传统模型大幅减少缓存存储空间。MiniCPM 4.1 支持高效双频换挡机制,根据任务类型自动切换注意力模式,平衡计算效率与输出精度。在多个评测基准上取得同尺寸模型第一的成绩,综合能力达到同级最优水平。MiniCPM 4.1 提供了多种部署格式,如 GPTQ、AutoAWQ 等,方便在不同端侧设备上高效部署。

MiniCPM 4.1的主要功能
- 高效稀疏架构:采用 InfLLM v2 稀疏注意力架构,每个词元仅需计算与少于 5% 词元的相关性,在 128K 长文本场景下,相比传统模型大幅减少缓存存储空间,显著降低长文本处理开销。
© 版权声明
文章版权归作者所有,未经允许请勿转载。