MiniCPM-o 4.5是什么
MiniCPM-o 4.5 是面壁智能开源的 9B 参数全模态旗舰模型,采用端到端架构融合 SigLip2、Whisper、CosyVoice2 与 Qwen3-8B。作为行业首个支持「即时自由对话」的模型,模型实现了全双工交互——能边看、边听、边说,告别传统回合制”对讲机”模式。模型具备领先的视觉理解、超拟人语音生成及声音克隆能力,支持主动交互与实时流媒体处理,在端侧设备即可运行,已适配昇腾、海光等多种国产芯片,通过 llama.cpp、vLLM 等框架实现高效部署。
MiniCPM-o 4.5的主要功能
- 全双工实时交互:模型能同时处理视觉、音频输入和生成语音输出,实现边看、边听、边说的并行感知与表达。
© 版权声明
文章版权归作者所有,未经允许请勿转载。

