近日,科技界迎來了一場震撼性的變革,由中國DeepSeek公司發布的R1模型,對美國AI領域的領先地位構成了前所未有的挑戰。這款模型不僅以極具競爭力的價格超越了多個美國頂尖模型,還選擇了完全開源的路徑,這一舉動引發了業界的廣泛關注和討論。
據透露,美國meta公司的員工甚至表示,R1模型的發布讓他們感到恐慌。這種情緒在本周一的美股市場上得到了體現,尤其是半導體板塊,股價普遍遭遇重挫。其中,英偉達公司的股價表現尤為引人注目,周一收跌16.79%,市值一夜之間蒸發了約5900億美元,創下了美國金融史上的新紀錄。

除英偉達外,臺積電、ARM、阿斯麥以及美光科技等半導體行業巨頭也未能幸免,股價均出現大幅下跌。美股三大指數收盤時漲跌不一,道指微漲0.65%,而標普500指數和納指則分別下跌1.46%和3.07%。
面對DeepSeek帶來的沖擊,英偉達發言人于27日發表評論稱,DeepSeek是一項杰出的人工智能進步,是測試時間縮放的完美典范。他還指出,DeepSeek的工作展示了如何利用該技術創建新模型,同時充分利用廣泛可用的模型和符合出口管制的計算資源。
然而,DeepSeek并未止步于此。在1月28日凌晨,該公司又發布了名為Janus-Pro和JanusFlow的一系列開源多模態AI模型。據DeepSeek介紹,Janus-Pro是JanusFlow大模型的高級版本,在訓練策略、訓練數據以及模型規模上均進行了優化。這款模型在多模態理解和文本到圖像的指令功能方面取得了重大突破,還顯著增強了文本到圖像生成的穩定性。

在文生圖領域的基準測試中,Janus-Pro-7B的表現尤為亮眼。在Geneval和DPG-Bench兩項測試中,其準確率分別高達80%和84.2%,遠超包括OpenAI DALL-E 3在內的其他對比模型。這一成果標志著DeepSeek正式進軍文生圖領域,為AI技術的發展開辟了新的方向。

DeepSeek的R1模型之所以能夠引發如此大的轟動,主要得益于其在AI技術上的突破以及對美國科技巨頭地位的撼動。長期以來,美國科技公司在AI大模型領域一直處于領先地位,而中國科技公司則被視為追趕者。然而,DeepSeek的R1模型在第三方測試中表現優異,打破了這一固有印象。
在當前美國對中國實施制裁、中國公司無法使用高端芯片的背景下,DeepSeek仍然能夠開發出領先模型,這一成就更顯得尤為珍貴。這不僅說明當前AI大模型所需的算力資源可能被高估,也為其他科技公司提供了新的啟示:在有限條件下,通過技術優化同樣可以進行AI研發。
DeepSeek的創始人梁文鋒在接受采訪時曾表示,中國AI不可能永遠處在跟隨的位置。他認為,中國AI與美國之間的差距主要在于原創與模仿之間的差異。為了改變這一現狀,中國必須有人站到技術的前沿,進行原創性的探索和研究。DeepSeek的成就正是這一理念的生動體現。








