阿里云近期推出了一款專為自動駕駛領(lǐng)域設(shè)計的訓(xùn)練與推理加速框架——PAI-TurboX。這一創(chuàng)新框架能夠顯著提升自動駕駛模型在感知、規(guī)劃控制以及世界模型構(gòu)建等多個環(huán)節(jié)的訓(xùn)推效率,據(jù)測試數(shù)據(jù)顯示,它在多個行業(yè)模型的訓(xùn)練任務(wù)中成功地將時間縮短了50%。
自動駕駛技術(shù)的快速發(fā)展依賴于對圖像、激光雷達、毫米波雷達、GPS等多種模態(tài)數(shù)據(jù)的高效融合。然而,業(yè)界現(xiàn)有的方案在處理大規(guī)模訓(xùn)練樣本數(shù)據(jù)時面臨加載和預(yù)處理效率低下的難題,這不僅浪費了寶貴的GPU資源,還限制了自動駕駛模型的開發(fā)進度。阿里云PAI-TurboX的推出,正是為了解決這些挑戰(zhàn)。

PAI-TurboX框架從系統(tǒng)和數(shù)據(jù)兩個層面入手,提供了全面的解決方案。在系統(tǒng)層面,它通過優(yōu)化CPU親和性、采用動態(tài)編譯技術(shù)以及實施流水線并行策略,顯著提升了模型的訓(xùn)練與推理效率。而在數(shù)據(jù)層面,PAI-TurboX引入了高性能的DataLoader引擎,優(yōu)化了數(shù)據(jù)預(yù)處理流程,并實現(xiàn)了智能訓(xùn)練樣本分組,從而有效提高了數(shù)據(jù)處理的速度。
PAI-TurboX還具備算子優(yōu)化和量化的能力。這些特性能夠進一步減少訓(xùn)練階段的訪存延遲,提升吞吐效率,并在推理任務(wù)中在保證精度的前提下,降低計算開銷和內(nèi)存帶寬需求。這使得PAI-TurboX能夠在異構(gòu)平臺上實現(xiàn)高性能的推理部署,滿足了自動駕駛系統(tǒng)對實時性和準確性的嚴苛要求。
實測結(jié)果顯示,PAI-TurboX在多個自動駕駛模型訓(xùn)練任務(wù)中表現(xiàn)出色。在3D物體檢測模型BEVFusion的訓(xùn)練任務(wù)中,它將訓(xùn)練時間縮短了58.5%;在實時在線矢量化高精地圖構(gòu)建模型MapTR的訓(xùn)練任務(wù)中,訓(xùn)練時間減少了53%;在端到端自動駕駛模型SparseDrive的訓(xùn)練任務(wù)中,PAI-TurboX在感知模塊訓(xùn)練和聯(lián)合訓(xùn)練兩個階段均取得了顯著的速度提升,分別縮短了51.5%和48.5%的訓(xùn)練時間。

阿里云研究員林偉對PAI-TurboX的前景充滿信心。他表示:“TurboX不僅能夠有效提升自動駕駛模型的訓(xùn)推效率,還將進一步加速世界模型的開發(fā)進程。我們期待通過這一框架,讓未來的終端具備像人類一樣的感知、思考和決策能力,推動自動駕駛技術(shù)的全面發(fā)展。”
自2016年誕生以來,阿里云人工智能平臺PAI已經(jīng)為超過10萬家企業(yè)客戶和數(shù)百萬AI開發(fā)者提供了貫穿AI開發(fā)和運維全流程的平臺服務(wù)。它支撐了阿里云百煉、魔搭社區(qū)等MaaS服務(wù)及社區(qū)的發(fā)展,成為推動人工智能技術(shù)進步的重要力量。






