玉花飛半夜,翠浪舞明年。2022年北京冬奧會的開幕恰逢中國傳統二十四節氣中的立春,開幕式以二十四節氣倒計時開場,以“雪花”作為核心意象串聯,壓軸節目《雪花》更是將“雪”的意象渲染得淋漓盡致——漫天流動的風雪在滑冰運動員的腳下實時消散,數百名兒童亦如粒粒雪花晶瑩——冰雪的高潔與春天的生機相交融,中華文化的浪漫就孕育在這中間。
據冬奧組委會介紹,《雪花》的空靈是由專項團隊開發的一套“基于人工智能技術的演出實時特效系統”所實現的——表演過程中,國家體育場中架設的四臺攝像機實時拍攝演員表演的畫面,隨后攝像機將視頻信號傳送到邊緣計算系統中進行三維信號重組與渲染,生成的藝術形象隨即呈現在現場的地面LED大屏幕上與演員互動——整個過程只需不到幾十毫秒的時間。渲染的實時、互動的流暢均需要強大的算力、高效的AI算法支撐。
北京冬奧會開幕式現場 圖片來源:人民網
冬奧會開幕式總導演張藝謀早先就曾表示:“本次開幕式的理念是用科技讓開幕式‘人少而不空,空靈而浪漫’。”無疑,冬奧會的成功舉辦,讓AI這項新興技術的強大潛力更直觀地呈現在觀眾眼前。然而盡管AI技術的研發不斷突破創新,其在產業端的落地應用卻不像看起來那么簡單。
AI發展迅猛,中小微企業仍受制約
長期以來,數據、算力、算法被視為AI發展的“三架馬車”,然而對于多數企業而言,這三駕馬車卻同時成為了難以跨越的門檻,制約著AI產業的進一步發展乃至產業數字化轉型的進程。
一方面,AI算法對研發能力的要求極高,中小微企業難以與掌握資源的大企業競爭、獲得研發所需的相應人才、能力;另一方面,AI模型的訓練依賴大量數據,而數據同樣往往只掌握在大企業手中;而即便是對于同時掌握了研發能力和數據資源的企業來說,模型復雜程度攀升及數據量急劇增加所帶來的對算力要求的提升,亦進一步推升了算力的成本。這些都使AI技術難以有效應用落地——于大多數企業而言,AI所描繪的旖旎遠景仍似蜃樓難以觸及。
與此同時,對于整個產業來說,AI迅猛發展的同時,AI人才需求亦呈現出了巨大的缺口。高盛所發布的《全球人工智能產業布局》數據顯示,在2017年全球的新興人工智能項目之中,我國人工智能項目占比高達51%,而在同年全球人工智能人才儲備方面,我國的人工智能人才卻僅占5%。報告預測,到2030年,我國人工智能人才缺口將超過500萬人。隨著雙減政策下職業教育成為教育發展的新選擇,如何攜手高職專院校培養專業技術/技能人才,反哺產業人才缺口,成為當前AI產業發展及職業教育發展的一條全新探索路徑。
據此,特斯聯人工智能開放創新中心應運誕生。
2022年,首個特斯聯人工智能開放創新中心(下稱:科創中心)正式于德陽AI PARK落地運營。德陽AI PARK是特斯聯繼重慶AI PARK之后打造的又一座集聚未來城市體驗及城市科技的研發基地,其中位于園區三層的科創中心則成為了這座新落成的園區的關鍵亮點。
特斯聯德陽AI PARK效果圖
以算法、數據、算力賦能中小微企業AI發展
科創中心是特斯聯所打造的人工智能計算中心(AICC),同時兼備著算法孵化、科研共享、及人才培養的使命。據特斯聯介紹,這是公司以創新研發反哺產業生態,助力產業發展的第一步。
據特斯聯相關技術負責人介紹,科創中心的設立旨在充分貫通學術生態和產業生態,使學術生態得以基于產業數據研發相應的預訓練模型,并以“成本共擔”的方式,為AI PARK周邊的中小微企業提供AI所需的算力、數據、算法模型等核心要素,讓各體量、具備不同AI基礎的企業均能通過學術機構所研發出的模型,以低代碼、模塊化的生產方式依據自身的需求,實現自有知識產權算法的孵化及既有成熟算法的調用,進而推動更高效的AI產業實踐。
特斯聯人工智能開放創新中心實景圖
作為特斯聯核心AI能力落地的載體,科創中心具備算力、數據、模型三大核心能力的輸出:
算力方面,特斯聯以科創中心為單位面向中小微企業提供算力,不同的科創中心其規模、設施亦不盡相同。德陽科創中心占地約240平方米,一期規劃算力達全精度31P、雙精度2P、單精度125P、半精度65P。而尤其值得注意的是,未來科創中心的算力并非僅由單個科創中心的算力構成,還將融匯全國各地多個科創中心節點,供給于產業。
數據層面,以AI PARK智能交互終端采集的本地數據、特斯聯自身近萬項目積累的產業數據、與地方政府大數據局的合作數據,以及科研公開數據為基礎,德陽科創中心目前已接入89TB數據。特斯聯科創中心將算力下沉到數據端組成智算節點,通過聯邦學習體系,使數據對研究機構可用及部分有條件可見。科研機構隨即通過智算節點,基于聯邦學習實現預訓練模型的研究。預訓練模型則可通過評測,上載到TACOS(特斯聯城市級AIoT操作系統)的九章算法賦能平臺,為產業所用,實現產業算法的孵化。
算法模型方面,基于前述體系,目前特斯聯在計算機視覺、自然語言處理、推薦預測、知識圖譜四個方向共十三個細分項,與學術生態及產業合作伙伴展開深入合作,并建立了龐大的模型庫。通過弱監督及大模型訓練體系,學術機構所研發出的模型可實現在TACOS的掛載,并通過TACOS的AI Develop Studio向產業提供算法訓練的服務。基于弱監督體系,中小微企業用戶可以基于無標簽數據進行算法訓練,降低算法對數據的依賴。同時弱監督及大模型訓練體系盡可能地降低了算法研發過程中的人工參與程度,讓算法訓練標準化、流程化。
九章算法賦能平臺用戶界面
不具備AI能力的用戶也可通過簡單的“拖拉拽”方式調用相應模型
據特斯聯透露,入駐科創中心的企業均可通過TACOS及九章算法賦能平臺直接調用相應的預訓練模型——截至2022年2月底,據TACOS顯示,已有逾800家企業注冊九章算法賦能平臺并入駐特斯聯科創中心,共計調用算法超過120萬次,而科創中心攜手學術生態也已累計生成了數百個預訓練模型。
自研核心技術體系:以沉默數據降低AI研發門檻
據特斯聯科創中心負責人介紹,弱監督大模型訓練體系、聯邦學習安全訓練體系是科創中心最核心的技術亮點。
科創中心致力于通過九章算法賦能平臺向不具備AI能力或弱AI能力的用戶提供AI算法孵化服務能力,因而弱化機器學習對標簽數據的依賴、弱化人工參與算法訓練,就成為了重中之重。
有別于行業常見的算法研發范式,特斯聯將算力與數據相結合,建立了特斯聯的智算體系,通過科創中心節點將算力下沉與數據綁定,形成算法+數據的分布式計算單元,并通過九章AI算法賦能平臺的AI Research Studio基于聯邦學習安全訓練體系將這一能力提供給科研學術生態。科研學術生態對于這些數據僅有部分有條件可見和使用的權限。基于這些分布式智算節點,科研學術生態可實現預訓練模型的研究,并將研究的預訓練模型通過評測后上載到九章算法賦能平臺的AI Develop Studio供產業使用,這些數據對于產業是完全不可見的。從技術上保證了數據的安全性。
在特斯聯看來,其打造的核心技術體系最關鍵的能力就在于,使城市中龐大的沉默數據資源,能夠真正有效地為產業所用。而這也是科創中心得以賦能企業AI開發的基礎。
2021年,特斯聯完成了基于弱監督和大模型核心技術的里程碑級突破,并實現了與學術生態所研究的預訓練模型的一鍵加載。
“藍領”AI教培體系,反哺產業人才缺口
不止于對企業的賦能,特斯聯對科創中心還有更高遠的野望。
借由德陽科創中心的啟動,特斯聯宣布將正式升級其人才戰略,在不斷投入加碼自身研發團隊的基礎之上,還將構建完善的“藍領”AI教培體系,為產業源源不斷輸送AI人才。
據介紹,特斯聯的“藍領”AI教培體系將以科創中心為實踐基地,以TACOS及九章算法賦能平臺為基礎展開。面向廣泛的本地高職專院校,特斯聯將打造系列基于TACOS的AI教培課程、教材、軟硬件實訓及考核方案,為高職專學生提供基礎AI能力支持。以科創中心為橋梁,高職專學生得以針對企業具體的需求進行AI實習實踐,學以致用。同時,特斯聯還將充分拉通產學研各界,以最新研究成果賦能前沿產業AI發展,打造從科研到應用的AI發展閉環。
從研發到應用,再以市場反饋反哺科研創新,這對于AI產業來說是一個螺旋式發展的過程。借由科創中心,特斯聯希望能進一步縮短AI技術從實驗室到市場的路徑,使研發更具場景針對性,也使市場的需求能更快速地為研究機構所了解。
歷經逾60年,人工智能已從最初的計算、感知階段發展到認知階段,而下一階段的突破離不開更靠近市場的應用實踐。通過打造集算力、數據、算法模型能力于一體的科創中心,特斯聯要做的是為各類企業打造流程化、低門檻的AI基礎設施,讓更多玩家參與到AI發展的浪潮之中,讓AI更‘接地氣’,也為產業輸送更多AI人才。
據悉,2022年,特斯聯還將進一步在沈陽、重慶等AI PARK落地科創中心,讓AI產業在全國范圍內高速、高質量發展。