月之暗面回应 KIMI K2 模型 API 速度慢:优化推理效率及升级硬件支持

AI资讯1个月前发布
17 0

7月15日讯 据了解,月之暗面团队针对近期Kimi K2模型API速度问题作出回应。官方表示,当前延迟主要源于高并发请求与模型复杂度两方面因素。目前团队正在全力优化推理效率,并通过增加算力资源(如GPU显卡和服务器)来提升性能。预计在接下来几天内将显著改善响应速度。

值得关注的是,Kimi K2作为一个完全开源的模型,为广大开发者提供了更多接入选择。除了月之暗面自家的服务平台外,用户还可通过其他专业模型供应商(如硅基流动、无问芯穹等)获取服务。同时,团队也鼓励有技术能力的个人或企业自行部署该模型。

月之暗面回应 KIMI K2 模型 API 速度慢:优化推理效率及升级硬件支持

资料显示,Kimi K2模型于7月11日正式对外发布,并同步开源。该模型采用先进的MoE架构,在代码理解和通用Agent任务方面表现突出。其参数规模达到惊人的1万亿tokens,激活参数则为320亿,展现出强大的处理能力。

目前,Kimi K2的API服务已经全面上线,可支持最长128K上下文窗口,展现了卓越的通用性和工具调用能力。具体计费标准如下:

  • 输入tokens:每百万4元

  • 输出tokens:每百万16元

© 版权声明

相关文章