紅帽公司,全球開源技術的領航者,近期宣布了一項名為llm-d的革命性開源項目,該項目專注于解決生成式人工智能在大規模推理應用中的迫切需求。該項目匯聚了包括CoreWeave、谷歌云、IBM研究院和NVIDIA在內的多家行業領軍企業作為初始貢獻者,致力于通過尖端技術,使大語言模型推理云服務能夠滿足最為嚴苛的生產服務級標準。
隨著推理技術在人工智能領域戰略地位的日益凸顯,根據Gartner的最新預測,到2028年,超過80%的數據中心工作負載加速器將專門用于推理而非訓練。這一趨勢反映出推理模型復雜性和規模的持續擴大,但同時也帶來了資源需求急劇增加的問題,限制了集中式推理的可行性。高昂的成本和較長的延遲成為了制約AI創新發展的關鍵障礙。
面對這一挑戰,紅帽及其合作伙伴通過llm-d項目成功地將先進的推理能力融入現有的企業IT基礎設施中。這一統一平臺不僅能夠幫助IT團隊在滿足關鍵業務工作負載需求的同時部署創新技術,以最大化效率,還能顯著降低高性能AI加速器的總體擁有成本。llm-d項目的核心價值在于打破了傳統推理部署的局限,為企業提供了更為靈活、高效且經濟的AI推理解決方案。
llm-d項目得到了由生成式AI模型提供商、AI加速器先驅和主要AI云平臺組成的強大聯盟的支持。除了四家初始貢獻者外,AMD、思科、Hugging Face、英特爾、Lambda和Mistral AI等重要企業也紛紛加入,展現了業界在構建大規模語言模型服務未來方面的深度合作意愿。
行業領袖對llm-d項目給予了積極響應。谷歌云AI與計算基礎設施部門的副總裁兼總經理Mark Lohmeyer表示:“在企業大規模部署AI并為用戶創造價值的過程中,高效的AI推理至關重要。在我們進入推理新時代之際,谷歌云很榮幸能夠作為llm-d項目的初始貢獻者,繼續秉承我們的開源貢獻傳統。”
NVIDIA工程AI框架的副總裁Ujval Kapasi也指出:“llm-d項目是對開源AI生態系統的重要補充,體現了NVIDIA對合作推動生成式AI創新的承諾。可擴展、高性能的推理是下一波生成式AI和代理式AI的關鍵。我們正與紅帽和其他支持合作伙伴合作,利用NVIDIA Dynamo創新如NIXL等,加速llm-d項目的發展。”
llm-d項目的啟動標志著AI推理領域邁入了一個全新的發展階段。通過開源模式匯聚產業智慧,該項目不僅有望解決當前大規模推理面臨的成本和性能挑戰,還將為整個AI生態系統的可持續發展奠定堅實基礎。隨著更多企業和開發者的加入,llm-d項目有望成為推動AI推理技術標準化和普及化的重要力量。






