7月15日讯 据了解,月之暗面团队针对近期Kimi K2模型API速度问题作出回应。官方表示,当前延迟主要源于高并发请求与模型复杂度两方面因素。目前团队正在全力优化推理效率,并通过增加算力资源(如GPU显卡和服务器)来提升性能。预计在接下来几天内将显著改善响应速度。
值得关注的是,Kimi K2作为一个完全开源的模型,为广大开发者提供了更多接入选择。除了月之暗面自家的服务平台外,用户还可通过其他专业模型供应商(如硅基流动、无问芯穹等)获取服务。同时,团队也鼓励有技术能力的个人或企业自行部署该模型。
资料显示,Kimi K2模型于7月11日正式对外发布,并同步开源。该模型采用先进的MoE架构,在代码理解和通用Agent任务方面表现突出。其参数规模达到惊人的1万亿tokens,激活参数则为320亿,展现出强大的处理能力。
目前,Kimi K2的API服务已经全面上线,可支持最长128K上下文窗口,展现了卓越的通用性和工具调用能力。具体计费标准如下:
-
输入tokens:每百万4元
-
输出tokens:每百万16元
© 版权声明
文章版权归作者所有,未经允许请勿转载。