埃隆·馬斯克的人工智能企業xAI近日宣布了一項雄心勃勃的計劃,即在美國田納西州的孟菲斯市建造一臺規模空前的超級計算機。據內部文件透露,該公司正斥資數億美元推進這一項目,然而,一個巨大的挑戰正擺在他們面前——電力供應不足。

自2024年6月項目公開以來,xAI已向孟菲斯規劃與發展機構提交了多達14份建筑許可證申請,涉及電氣、機械、管道等多個工程領域,預估總成本高達4.059億美元。其中,一項價值3000萬美元的工程專門用于計算機設備的安裝,另一項390萬美元的工程則是建造防撞圍欄。
馬斯克曾表示,他希望將孟菲斯超級計算機Colossus的規模擴大十倍,以容納100萬個GPU。然而,根據文件顯示,xAI無法從當地電網獲得足夠的電力來支持這一龐大的計算需求。除非xAI能夠在項目現場自行建設發電設施,否則他們將面臨電力短缺的困境。
為了應對這一挑戰,xAI已經向孟菲斯照明、天然氣和水處理公司(MLGW)申請了300兆瓦的電網電力,并成功獲得了150兆瓦的供電許可。同時,xAI還在考慮在超級計算機項目現場安裝天然氣渦輪機來發電。不過,xAI表示,能否全部使用300兆瓦的電網電力還取決于該地區的基礎設施升級和輸電網絡的改善。
目前,xAI正在使用卡特彼勒子公司Solar Turbines的燃氣發電機來補充電力供應,這些發電機的總發電能力為250兆瓦。然而,即使有了這些額外的電力供應,xAI仍然難以滿足其龐大的計算需求。在許可申請中,xAI明確表示:“如果沒有額外的現場發電,我們無法滿足客戶需求。”
田納西河谷管理局(TVA)負責為田納西州大部分地區及周邊六個州的部分地區供電。面對xAI等企業的電力需求增長,TVA在今年2月表示,計劃在未來幾年投資160億美元來滿足歷史性的負荷增長。然而,TVA的發言人表示,其董事會需要審查并批準任何超過100兆瓦的新負荷,以確保電力系統的可靠性得以維持。
加州大學河濱分校電氣與計算機工程副教授任紹磊認為,憑借自主現場發電能力,xAI可能能夠為一定數量的英偉達H100 GPU提供電力。然而,如果xAI想要進一步擴大算力,將面臨巨大的挑戰。根據任紹磊的計算,運行100萬個GPU可能需要超過1千兆瓦的電力,這是xAI目前在孟菲斯可獲得電力的四倍。






