MiniCPM-SALA是什么
MiniCPM-SALA是面壁智能开源的9B端侧大模型,采用创新的SALA(稀疏-线性混合注意力)架构,75%线性注意力负责全局高效建模,用25%稀疏注意力精准捕捉关键信息,引入混合位置编码HyPE实现长短文本无缝切换。模型首次在消费级显卡(如RTX 5090)上实现百万级上下文推理,显存占用低、推理速度快,为端侧Agent部署长文本能力提供可行路径。
MiniCPM-SALA的主要功能
- 百万级长文本处理:支持1M+ tokens上下文,首次在RTX 5090消费级显卡上完整运行百万长度推理。
© 版权声明
文章版权归作者所有,未经允许请勿转载。

