近日,DeepSeek公司推出的V3模型在AI領域引發了廣泛關注。這款模型以驚人的訓練成本效益——僅557.6萬,實現了與OpenAI O1推理模型相當的性能。這一突破不僅在全球范圍內引發了連鎖反應,還直接沖擊了英偉達的市場地位,導致其股價在1月27日暴跌17%,市值瞬間蒸發6000億美元。
盡管部分投資人擔憂DeepSeek的崛起會減少市場對先進芯片的需求,但科技界普遍持另一種觀點:高性能、低成本且開源的大模型將促進整個應用生態的繁榮,從而長期利好英偉達。這兩種截然不同的觀點,在科技界引發了激烈的討論。
從技術層面來看,DeepSeek對英偉達、芯片行業乃至整個科技領域的影響遠非簡單。Inference.ai的創始人兼CEO John Yue指出,DeepSeek沖擊了英偉達的兩大核心壁壘——NVLink與CUDA,盡管并未完全沖垮這些壁壘,但確實打掉了英偉達的溢價。
在詳細解讀DeepSeek的技術創新時,加州大學戴維斯分校電子計算機工程系的助理教授、AIZip的聯合創始人陳羽北表示,DeepSeek的成功關鍵在于其基礎模型V3的能力。通過采用GRPO(分組相對策略優化)方法,DeepSeek在R1 Zero未經強化學習的情況下,每生成100條內容就有約10%的成功率,這一顯著提升證明了基礎模型能力的重要性。
陳羽北進一步解釋說,DeepSeek在模型架構效率上進行了重大提升,包括優化混合專家網絡(MoE)的負載均衡和節省鍵值緩存(KV Cache)。這些創新使得DeepSeek在600多B的大模型上表現出色,并通過自啟發式回答和蒸餾學習的方法,成功將大模型的能力傳授給小模型,實現了性能的進一步提升。
關于DeepSeek對英偉達的影響,John Yue認為這是一把雙刃劍。一方面,DeepSeek的出現激發了更多初創企業探索AI應用層面的可能性,從而增加了對GPU的需求,這對英偉達是有利的。另一方面,DeepSeek通過優化MOE和直接調用PTX(并行線程執行)來繞過CUDA高層API,確實沖擊了英偉達的溢價。
然而,John Yue強調,英偉達的核心壁壘——NVLink和CUDA——仍然堅挺。雖然DeepSeek提供了一種可能的替代方案,但尚未出現能夠完全替代CUDA的通用系統。因此,長期來看,英偉達在GPU市場的領先地位仍難以撼動。

DeepSeek選擇開源其模型,這一舉措對整個AI行業產生了深遠影響。John Yue指出,開源降低了AI應用的準入門檻,激發了更多開發者探索AI應用的熱情。陳羽北也表示,開源生態對于提高AI應用的效率至關重要,它使得開發者能夠基于開源模型快速構建自己的應用。
在談到DeepSeek如何降低API成本時,John Yue表示,DeepSeek從上到下進行了整套優化,包括PTX調用、GPU切分等。這些優化措施使得DeepSeek能夠在更低端的芯片上運行,從而大幅降低了每個Token的成本。DeepSeek還通過蒸餾學習等方法,成功將大模型的能力傳授給小模型,進一步降低了推理成本。
陳羽北還提到了小模型在未來的發展潛力。他表示,隨著小模型在性能上的不斷提升,它們將在更多場景中取代大模型,從而降低AI應用的成本并提高普及程度。未來,AI基礎設施將形成端-邊-云的分層體系,小模型將在終端設備和邊緣端發揮重要作用。
最后,陳羽北對DeepSeek的數據構成和訓練細節表示了好奇。他指出,雖然DeepSeek已經公開了部分信息,但關于數據的具體構成和處理流程等關鍵細節仍然未披露。這些細節對于其他研究者復現DeepSeek的工作至關重要。






