近期,據(jù)國際媒體報道,英偉達H20芯片在中國內(nèi)地的供應問題對DeepSeek-R2 AI模型的研發(fā)進程產(chǎn)生了連鎖反應。據(jù)悉,這一短缺現(xiàn)象源于美國當局的策略調(diào)整,直接影響了DeepSeek團隊的技術(shù)開發(fā)進度。
DeepSeek在構(gòu)建其R1模型時,曾動用了大量高性能GPU,其中H20芯片占據(jù)了顯著位置。具體來說,為了訓練R1模型,DeepSeek共使用了5萬塊Hopper GPU,包括3萬塊H20、1萬塊H800和1萬塊H100,而這些顯卡的采購工作均由其投資方高毅資產(chǎn)負責完成。
據(jù)兩位內(nèi)部人士透露,DeepSeek團隊近期一直在緊鑼密鼓地推進R2模型的研發(fā)工作。然而,盡管付出了巨大努力,CEO梁文鋒對當前模型的表現(xiàn)仍持保留態(tài)度,認為性能仍有提升空間。因此,R2模型尚未達到正式投入使用的標準。
報道還指出,當前多數(shù)用戶都在依賴英偉達的H20芯片來部署和運行DeepSeek-R1模型。然而,隨著H20芯片受到美國出口限制的影響,DeepSeek R2的研發(fā)工作面臨了更大的挑戰(zhàn)。同時,這一限制措施也對現(xiàn)有DeepSeek-R1模型的實際應用造成了一定程度的困擾。






