一個龐大社會機器的運轉,無時無刻不依賴于因基礎建設工程而唾手可得的動能。最初,水利工程促進了農業的發展,馬車、蒸汽機、內燃氣又一步步拉近了溝通的速度,電能更是可謂點亮了地球。如今,一種新的動能正在備受關注,那就是算力,它可以加快各種行業的研發速度,甚至包括疫苗的研發、地震災害的預測,以往可能需要幾個月的工作時間,在強大算力中心的加持下,幾天就有望完成。
然而,如同我們需要電網的部署,家用電器的配置,才能享受的這伸手即來的便利。算力在落地行業的過程中,也需要進行接駁。“‘東數西算’將不單單是數據中心的工程建設,也不單單是算力的堆砌,必然會涉及到技術升級、產業升級。”青云科技副總裁、數字價值研究院院長沈鷗在媒體溝通會的開場白中就專門強調了“東數西算”的更深層意義。
“東數西算”不止于工程建設
今年2月底,國家發展改革委等部門聯合印發通知,宣布全國一體化大數據中心體系總體布局完成設計,“東數西算”工程就此正式全面啟動。從字面含義上不難看出,這意味著國家希望通過算力樞紐和數據中心集群建設,利用西部的地理資源等優勢,來解決東部計算所遇到的問題。
伴隨著“東數西算”工程的建設,綠色節能數據中心、算力調度、海量數據存儲和流通、數據智能分析、數據安全也將會獲得更多的研發投入和產業升級。在整個算力中心的建設上,“東數西算”工程,一方面會新建一批綠色、低PUE的數據中心,也會整合原來高能耗的數據中心,減少數據中心在國家能源消耗中的占比;另一方面,還會提供算力服務來滿足政府和行業企業的數字化計算、數據分析的需求。
一般而言,算力中心的建設主要包含四個要素:其一是機房設施建設,是“東數西算”中非常重要的基礎工作;二是數據中心建設完成后,以物聯網、邊緣計算為技術核心的新型數據中心基礎架構管理與能耗管理;三是多元算力操作系統,也是算力中心的重點和關鍵;四是多算力集群運營運維服務,可以為行業客戶提供多樣性的業務服務。
對于后三個要素,沈鷗表示青云科技都十分擅長。據悉,早在2020年國家提出新基建的時候,青云科技便開始通過研究相關的政策和行業需求,從中看到了數字化對算力中心和多元算力的重要性,并投入相應的研發力量做產品的迭代和解決方案的完善。
這種多年積累下來的技術聚焦,也讓青云科技具備了接駁“東數”與“西算”的能力,讓算力也能像如今水電氣一樣,迅速使其成為行業發展的新動能。
讓算力轉化為易用的基礎設施
“如何將算力轉化為便捷易用的基礎設施,真正讓算力成為基礎設施,各種應用、算法或者模型都能更方便的運用這個算力,是青云一直在思考和努力的。”沈鷗介紹青云能夠讓行業的能力和算力進行有效的連接。
“東數西算”的核心最終要發展數字經濟,數字經濟的本身要解決各行各業具體的業務問題,每個具體的業務問題都會涉及到應用。青云超級智算平臺正是其中的關鍵所在,其相當于在行業應用與算力間構筑了一套如同當下智能手機中的操作系統,可以接駁各種行業應用、政務需求、智慧城市內的各種場景,以及各類科研需求。“在整個‘東數西算’工程里,青云的角色是一個技術工具的供應商,但是不可或缺,因為整個算力中心的核心是‘操作系統’,也就是青云所提供的智算平臺,只有智算平臺才能讓算力具有生命力,支撐多元化產業應用的發展,支撐最終的數字經濟。”青云科技副總裁林源在青云科技十周年之際曾這樣表達了公司對于社會責任的擔當。
青云的這一多元算力操作系統主要包含四個主要方面的平臺能力:一是算力生產供應平臺,包括包括多樣性算力、標準云平臺算力服務、高性能計算能力、物聯網和邊緣計算能力,以及 GPU、AI 為主的 AI 算力能力;二是數據開放共享平臺,利用大數據工作臺的產品來支撐企業數據在生產、采集、計算上的服務要求;三是智能生態建設平臺,主要通過提供開放的應用框架,成為可以被訪問的 PaaS 或SaaS 服務,創建豐富的計算服務生態和行業應用生態;四是產業創新開發平臺,聚焦行業應用開發和迭代,為業務流程的重建和業務場景的迭代提供有力的工具。
同時針對數據中心備受關注的“雙碳”需求。新建數據中心 PUE 現在被要求限制在1.3以下,改造的存量數據中心PUE通常要求在1.4附近,這就意味著智能化管理、能耗管理也會是數據中心建設的重點。
青云打造的智算數據中心管理平臺,構建起了整個數據中心統一的運維數據中臺,包括統一的設備數據采集平臺、統一的設備配置數據庫、統一的監控告警平臺、統一的運維管理流程、統一的管理調度服務。青云通過新型的采集網關和分布式物聯平臺,實現了對數據中心樓宇自控、數據中心設備運行數據的毫秒級采樣,從而可以更加精準計算各類設備的能耗,對高能耗設備進行調度和控制,以及更加有效地降低數據中心的PUE,通過管理提升效能。
自主技術全面支持國產化
另外值得關注的是,超級智算平臺可謂是一個擁有自主知識產權,且自下而上均可支持國產化的平臺。
整個超級智算平臺的核心代碼均為青云科技自主研發。其中還凝聚了多項核心技術能力,包括了可以提供多樣性算力,每種算力都支持海量擴展、按需擴容、按需增加節點,以及基于分布式的云架構和軟件定義廣域網的技術,并可在統一的運營框架下,讓算力服務與服務應用訪問可以跨域申請和使用。
青云科技對信創平臺也有完整的支持,與業界主流的國產芯片、國產操作系統廠商均有深度合作。“在此過程中,青云遇到不少挑戰,包括兼容性挑戰,包括有些代碼庫在不同平臺上的成熟度問題,包括芯片本身性能和硬件適配的問題,各種各樣的問題都有遇到。”據沈鷗介紹青云最早在2016年就有涉及對國產操作系統的適配。今年,青云科技還專門成立了信創產品部,職責就是研發和推廣青云在信創領域的相關產品和技術方案。
目前,青云超級智算中心平臺已經在國家級超算中心落地,承建了超算公共服務云、政務行政服務云和公共云,青云提供了HPC高性能計算、EHPC彈性高性能計算、標準云服務(IaaS/PaaS/GPU/AI),基于分布式云,以及基于分布式云架構的區域云服務全面的服務,為整個超算業務提供了統一的應用服務的能力。
“東數”與“西算”,行業與算力,正在通過青云科技接駁在一起,一種全新的動能正在如其它能源一樣,讓百行千業唾手可得,最終惠及行業升級轉型以及社會民生。