DeepSeek-R2 AI模型开发因美国限制英伟达H20芯片出口而延迟

AI资讯2个月前发布
13 0

6月27日,外媒The Information报道称,由于受到美国出口政策的影响,英伟达H20芯片在中国内地供应出现短缺,这导致DeepSeek-R2人工智能模型的开发工作出现了延误。

值得注意的是,DeepSeek在训练其R1模型时使用了总计5万台GPU设备,其中包括3万台H20、1万台H800和1万台H100型号。这些硬件设备均由公司投资方高毅资产(High-Flyer Capital Management)负责采购。

据两位知情人士透露,DeepSeek团队近期一直在全力推进R2模型的研发工作,但CEO梁文锋对当前模型的能力仍感不足。因此,内部团队正在继续努力提升性能,目前相关模型尚未达到可以正式投入使用的标准。

报道还指出,大多数用户都是基于英伟达的H20芯片来部署和运行现有的DeepSeek-R1模型。由于H20芯片受到美国当局限制出口的影响,这不仅增加了DeepSeek R2研发的难度,同时也对现有DeepSeek-R1的实际应用造成了不利影响。

© 版权声明

相关文章