近日,科技巨頭meta Platforms, Inc.宣布,即便面臨中國人工智能(AI)初創企業DeepSeek發布的低成本高效能模型帶來的挑戰,公司仍計劃在2025年維持其高額的研發投入。這一決定引發了業界對AI技術持續巨額投入的廣泛討論。

meta首席執行官馬克·扎克伯格上周五在Facebook上發帖稱,盡管AI研發任務艱巨,meta仍計劃在2025年投入600億至650億美元用于資本支出(Capex)。這一數字遠超華爾街預期的513億美元,與分析師預測的約380億美元年度Capex相比增長了近58%,更是2023年支出的兩倍多。
扎克伯格將2025年稱為“AI的決定性一年”,他期望meta AI能成為服務超過十億人的領先助手,開源模型Llama 4能成為最先進的領先模型,并推出AI工程師,為公司研發工作貢獻越來越多的代碼。
為實現上述目標,meta正在建造一座2吉瓦(GW)以上的數據中心,該中心將覆蓋曼哈頓的很大一部分。扎克伯格表示,meta將在2025年上線1吉瓦的計算能力,年底時圖形處理單元(GPU)的數量將超過130萬個。
除了高達650億美元的2025年Capex計劃外,扎克伯格還表示,meta將在今年大幅擴大其AI團隊,并補充說,公司有資金在未來幾年繼續投資。
然而,盡管有著雄心勃勃的支出計劃,面對DeepSeek帶來的新挑戰,meta似乎陷入了恐慌模式。DeepSeek的AI模型能以更低的成本提供與主流產品相當的性能。據《The Information》周末報道,包括AI基礎設施總監馬修·奧爾德姆在內的meta AI團隊領導最近擔心,DeepSeek開發的新AI意味著meta在AI競賽中落后了。這些領導者擔心,meta即將發布的下一代旗艦AI模型Llama的表現可能不如DeepSeek的模型。據該美國科技新聞媒體報道,meta已設立多個“作戰室”,即專門的研究小組,來剖析DeepSeek,并利用這些見解來改進Llama。
據報道,meta的生成式AI團隊和基礎設施團隊已啟動了四個作戰室,以了解DeepSeek的工作原理。其中兩個作戰室正在試圖理解DeepSeek的創始人兼支持者High-Flyer是如何降低DeepSeek的訓練和運行成本的,因為meta希望將這些技術應用于Llama。第三個作戰室正在試圖弄清楚High-Flyer可能使用了哪些數據來訓練DeepSeek模型,而第四個作戰室則正在權衡基于DeepSeek同類模型屬性的新技術來重構meta模型。
在Team Blind這個由數百萬專業人士用來尋求和分享建議的匿名論壇式社交媒體應用程序上,一篇帖子也反映了meta內部報告的恐慌情緒。一名meta員工在帖子中表示,DeepSeek的V3模型讓整個生成式AI團隊陷入了恐慌模式,而“這家擁有550萬訓練預算的未知中國公司”更是雪上加霜。
“工程師們正瘋狂地試圖剖析DeepSeek,并從中學到我們能學到的一切。我甚至沒有夸大其詞,”該員工說,“管理層擔心如何為生成式AI組織的巨額成本辯護。當生成式AI組織的每一位‘領導’的收入都超過了訓練DeepSeek V3的全部成本,而我們又有幾十位這樣的‘領導’時,他們該如何面對領導層呢?”






