6月27日,外媒The Information报道称,由于受到美国出口政策的影响,英伟达H20芯片在中国内地供应出现短缺,这导致DeepSeek-R2人工智能模型的开发工作出现了延误。
值得注意的是,DeepSeek在训练其R1模型时使用了总计5万台GPU设备,其中包括3万台H20、1万台H800和1万台H100型号。这些硬件设备均由公司投资方高毅资产(High-Flyer Capital Management)负责采购。
据两位知情人士透露,DeepSeek团队近期一直在全力推进R2模型的研发工作,但CEO梁文锋对当前模型的能力仍感不足。因此,内部团队正在继续努力提升性能,目前相关模型尚未达到可以正式投入使用的标准。
报道还指出,大多数用户都是基于英伟达的H20芯片来部署和运行现有的DeepSeek-R1模型。由于H20芯片受到美国当局限制出口的影响,这不仅增加了DeepSeek R2研发的难度,同时也对现有DeepSeek-R1的实际应用造成了不利影响。
© 版权声明
文章版权归作者所有,未经允许请勿转载。