前言
隨著信息革命和信息化的飛速發展,計算機數據量的急劇增長,數據利用和管理的重要性與日俱增,數據逐漸在信息化這個大舞臺上扮演著越來越重要的角色。數據治理是企業大數據基礎,企業級數據平臺助力企業數字化轉型。
在目前數字化轉型大趨勢的推動下,企業數據治理的需求迫在眉睫。為了促進企業有序開展數據治理工作,進一步厘清企業轉型升級的主要痛點和關鍵需求。本篇文章根據《數據治理:工業企業數字化轉型之道》核心內容整理,希望在數據治理方面的理論介紹及實踐經驗,能為眾多企業在數據治理的研究和實踐中提供參考和借鑒價值,以期達到少走彎路,減少探索,打好基礎,快速取勝的效果。
一
數據治理背景和挑戰
數據治理知識體系涉及管理、技術等多個學科領域,是一個非常復雜的系統工程,如何全面而系統地構建較為完整的數據治理體系,是企業實施數據治理的關鍵課題。
從宏觀角度,數據治理是指全球治理,即在大數據時代,以國家、國際組織、多利益攸關方等為主體,對數據權利、流通、管理等方面的治理。
從中觀角度,數據治理是指公共治理,即區域和國家對其主權范圍內的數據質量、權屬、流動機制等方面的宏觀管理。
從微觀角度,數據治理是指對數據資產行使權力控制的活動集合。
不同的行業信息化發展水平不一樣,其對數據的依賴程度不一樣,數據治理水平也不一樣。
1、各國的大數據狀況
根據國際數據公司(IDC)2018年年末的測算,2025年,中國將成為全球五個分區中,最大的數據資源擁有地區(占比為28%,數據總量為49ZB),其數據總量將是美國(排名第四,占比18%的1.56倍。這五個分區是:1)中國;2)歐洲、中東、非洲地區(EMEA);3)亞太國家,指除中國之外的、包括日本在內的亞太地區所有國家(APJxC);4)美國;5)世界其他地區。
實際上,2019年,中國的數據總量已經超過了美國。但是,中國工業企業的數據資源存量普遍不大,寶貴的數據資源由于缺乏科學的數據管理而隨意流失;工業企業數據總量低下,與企業規模極不相稱;半數以上的工業企業仍在使用紙質或更原始的方式進行數據的存儲和管理;數據孤島幾乎是所有工業企業都面臨的困境。此外,無論是數據管理還是數據治理,中國工業企業的狀況也不容樂觀。調查顯示,僅有37.84%的大型工業企業、46.67%的中型工業企業、13.64%的小型工業企業開展了數據管理工作;大多數工業企業缺乏專門的數據管理部門,投入數據管理的人、財資源也非常有限,更談不上頂層規劃和戰略管理。
2、工業企業數據治理面臨的挑戰
工業領域信息化起步相對較晚,工業數據也更為復雜,涉及研發、生產、管理、運維、服務等多個環節,因而數據管理工作的推進也相對滯后。
(1)數據基礎薄弱。我國工業企業的數據資源存量普遍不大,調查顯示,66%的企業數據總量都在20TB以下;管理手段比較落后,51%的企業仍在使用紙質或更原始的方式進行數據的管理。數據孤島幾乎是所有企業都面臨的困境。
(2)數據治理滯后。數據管理缺失,技術手段落后,導致企業數據質量難以得到保障,數據共享困難,數據的價值不能得到充分的挖掘和變現。
(3)數據價值難以量化評估。數據治理投入大,短期內很難看到成效,而數據價值的評估又很難量化。因此,很多企業投入數據治理的意愿不大,這反過來又影響了企業數據的使用。
3、數據治理是工業大數據的基礎
工業大數據區別于其它行業大數據是由智能化時代需要人機協同的特點所決定的。它不僅有企業經營數據、人的行為數據,更重要的是來自于傳感器采集的設備海量數據。其主要特點如下:
數據來源的多樣性,既有經營管理的數據,也有客戶行為畫像的數據,更有多種設備狀態、控制數據。數據的實時性,生產現場的數據具有連續性、實時性、數據海量的特點。這就要求數據的采集、清洗、存儲和處理的技術不一樣,尤其是需要實時分析。
工業機理的復雜性對知識圖譜的構建提出了很高的要求,相應地數據之間的相關性分析非常重要。要圍繞產品全生命周期、企業全價值鏈甚至產業鏈去構建。
4、國家層面對數據治理越來越重視
中共中央、國務院《關于構建更加完善的要素市場化配置體制機制的意見》首次將“數據”作為新型生產要素,與土地、勞動力、資本、技術等傳統要素并列為要素之一,提出要加快培育數據要素市場,對企業數字化轉型有著極其重要的意義。國資委《關于加快推進國有企業數字化轉型工作的通知》,明確提出構建數據治理體系,加快集團數據治理體系建設,明確數據治理歸口管理部門,加強數據標準化、元數據和主數據管理工作,定期評估數據治理能力成熟度,為國有企業數字化轉型指明發展方向,描繪數字藍圖,規劃轉型路徑,提出具體要求。然而隨著信息技術的發展,目前在數據治理方面存在數據定義不規范、數據血緣關系不清晰、數據沖突、數據質量不高等問題和不足,亟需加快解決和完善。
二
數據治理的框架和核心內容
不同層級的人對數據治理的關注點不一樣,因此各自的視圖也不一樣,下面分別從管理者視圖、技術者視圖、數據資產管理者視圖逐一介紹。
數據治理的的管理者視圖可以概括為“五域模型”,分為“管控域”、“過程域”、“治理域”、“技術域”、“價值域”
管控域:在數據治理戰略指導下制訂企業數據治理組織,明確組織的責、權、利,崗位編制及技能要求。
治理域:是數據治理的主體,明確數據治理的對象和目標。
技術域:數據治理的支撐手段,指的工具平臺。
過程域:是數據治理的方法論。
價值域:數據治理的目標就是通過對數據資產的管控挖掘數據資產的價值,并通過數據的流動、共享、交易變現數據資產。
圖2、技術視角:企業大數據治理實踐指南框架
工業數據治理體系,包括數據戰略、數據治理管控體系(數據治理組織、制度、流程、管控機制、績效體系及標準體系)、數據架構、主數據、元數據、指標數據、時序數據、數據質量、數據安全、數據集成與交換、數據開放和共享、數據資產管理能力成熟度評估以及數據價值、數據共享、數據變現等許多方面。
圖3、工業企業數據治理車輪圖
本文重點從數據戰略、數據管控(組織管理、制度體系、流程管理及績效)、三個核心體系(數據標準體系、數據質量體系、數據安全體系)和工具等重點介紹。
圖4、工業企業數據管控和三個核心體系
1、數據戰略
數據戰略是整個數據治理體系的首要任務,是企業開展數據治理工作首先應該考慮的事。數據戰略應由數據治理組織中的決策層制定,需要指明數據治理的方向,包括數據治理的方針、政策等。
數據戰略能力域關注整個組織數據戰略的規劃,愿景和落地實施,為組織數據管理、應用工作的開展提供戰略保障,組織的數據戰略需要和業務戰略保持一致,并且要在利益相關者之間達成一致。
數據戰略已成為企業精細化數據管理不可或缺的基礎,只有切實落實好數據戰略工作,才能提升企業數據質量、實現企業數據價值升華,為企業數字化轉型奠定基礎。
數據資產頂層設計不僅僅是一個報告、一份文件,更是企業系統性設計未來的大膽假設、小心求證、集體溝通、達成共識、形成機制、頒發軍令狀的過程。
圖5、數據資產頂層規劃設計方法論
正確的頂層設計是企業家對未來形勢的正確判斷,對機會和戰略,治理與架構,資本和模式,供應鏈和數字化,品牌和營銷,產品和客戶等整體一盤棋的布局。如果說商戰就是沒有硝煙的戰爭,那么頂層設計則是整體戰的部署
2、組織管理
建立合適的數據治理組織是企業數據治理的關鍵。數據治理的組織建設一般包括組織架構設計、部門職責、人員編制、崗位職責及能力要求、績效管理等內容。數據治理是一項需要企業通力協作的工作,而有效的組織架構是企業數據治理能夠成功的有力保障。為達到數據戰略目標,非常有必要建立體系化的組織架構,明確職責分工。
圖6、某集團數據治理組織架構設置范例
圖7、某央企數據治理組織架構設置范例
3、制度體系
企業的數據治理必須要有相關制度,否則無法可依,再好的技術工具也沒有用。因此,建立完善的數據治理制度很重要。
保障組織架構正常運轉和數據治理各項工作的有序實施,需要建立一套涵蓋不同管理粒度、不同適用對象,異覆蓋數據治理過程的管理制度體系,從“法理”層面保障數據治理工作有據、可行、可控。數據治理制度框架分為政策、制度、細則、手冊4個梯次。
圖8、數據治理制度框架
企業的數據治理制度通常根據企業的IT制度的總體框架和指導原則制定,往往包含數據質量管理、數據標準管理、數據安全管理、數據績效管理等制度,以及元數據管理、主數據管理、交易數據管理、數據指標管理等辦法及若干指導手冊。
圖9、數據治理制度框架體系
圖10、數據資產管理規定目錄
4、流程管理
制定數據治理的流程框架也是數據治理的重要工作。
數據治理流程主要包括從數據的生產、存儲、處理、使用、共享、銷毀全生命周期過程中所遵循的活動步驟,以及元數據管理、主數據管理、數據指標管理等流程。
圖11、數據治理流程框架體系
5、績效管理
數據治理考核是保障數據治理制度落實的根本,是一種正式的員工評估制度,通過系統的方法、原理來評定和測量企業員工在一段時間內數據治理相關的工作行為和工作效果,進一步激發員工的積極性和創造性,提供員工的數據治理責任心和基本素質。
圖12、數據治理績效體系
要使數據治理的體系運轉好,必須要有好的激勵體系。數據績效管理包括數據管理指標、數據認責機制、數據考核標準、數據管理的獎懲機制,以及績效管理過程的一系列活動集合。
6、標準體系
數據標準是實現數據標準化、規范化的前提,是保證數據質量的必要條件。
數據標準一般分為元數據標準、主數據標準、交易數據標準、數據指標標準、數據分類標準、數據編碼標準、數據集成標準等內容。數據標準管理是規范數據標準的內容、程序和方法的活動,分為標準制定、標準實施和控制、標準修訂等。
圖13、數據標準化體系
7、質量體系
數據質量是指數據的適用性,描述數據對業務和管理的滿意度。數據質量主要指數據的準確性、及時性、完整性、唯一性、一致性,有效性六個方面。
數據質量管理是對數據的分析、監控、評估和改進的過程。包括規劃和實施質量管理技術,以測量、評估和提高數據在組織內的適用性,提高數據對業務和管理的滿足度。重點關注數據質量需求、數據質量檢查、數據質量分析和數據質量提升的實現能力。
圖14、數據質量框架體系
數據質量管理貫穿數據生命周期的全過程,除了明確數據質量管理的策略,還要善于使用數據質量管理的手段及工具,覆蓋數據質量需求、數據探查、數據診斷、質量評估、數據監控、數據清洗、質量提升等方面。
8、安全體系
數據安全管理是為了確保數據隱私和機密性得到維護,數據不被破壞,數據被適當訪問。通過采用各種技術和管理措施,保證數據的機密性、完整性和可用性。
數據安全體系框架通過3個維度構建而成,包括政策法規、技術層面和安全組織人員。數據安全治理體系框架在符合政策法規及標準規范的同時,需要在技術上實現對數據的實時監管,并配合經過規范培訓的安全組織人員,構成了數據安全治理整體架構的建設。
圖15、數據安全治理體系
數據安全治理能力建設并非單一產品或平臺的構建,而是建設一個覆蓋數據全部生命周期和使用場景的數據安全體系,需要從決策到技術,從制度到工具,從組織架構到安全技術通盤考慮。
圖16、數據數據全部生命周期
9、平臺工具
搭建云數智一體化數據平臺,滿足前臺應用準確性、快速性和多樣性的數據需求,縮短研發周期、降低技術成本,將數據中心逐步由成本中心向資產中心轉變,提升數據價值,實現五個打通:
(1)橫向打通:破除部門壁壘,打通專業。橫向跨專業間的分析挖掘融通;
(2)縱向打通:內部多層級數據打通,形成統一資源目錄。上下級數據共享交換;
(3)內外打通:消除內外數據的鴻溝,實現內外部數據的關聯分析;
(4)管理打通:建立企業標準,實現統一管理統計口徑;
(5)服務打通:數據中臺統一對外提供數據服務和應用構建,與業務系統和數據應用充分協同。
圖17、兩體系兩平臺一服務的數據平臺總體框架
面向數據全生命周期,提供的一站式數據規劃、集成、開發、治理、服務、應用等產品。數據平臺能力框架:5個維度(采、聚、理、用、保),7個功能層次。
圖18、數據平臺能力框架
從數據接入整合能力、數據共享應用能力、數據綜合管理能力、基礎組件支撐能力四方面,全面建設數據能力,培育能力體系,實現數據接入、存儲計算、數據分析、數據服務、數據資產管理、運營管理等功能,以多類型大數據量的匯聚為基礎,以統一模型為標準,為前端應用提供靈活的統一數據服務。
圖19、數據平臺四大支撐能力
數據平臺是通過企業內外部多源異構的數據采集、治理、建模、分析,應用,使數據對內優化管理賦能業務,對外可以數據合作價值釋放,成為企業數據資產管理和服務中樞。
大數據治理需要多種數據治理工具軟件的支撐,包括以主數據為核心的套裝軟件、以數據資產目錄為核心的數據資源管理工具、以元數據和數據模型為核心的數據中臺,此外還有時序數據、數據交換等。這些工具互有側重,需要根據實際需求予以剪裁。
數據治理管理工具包括數據架構工具、元數據管理工具、數據指標管理工具、主數據管理工具、時序數據管理工具、數據交換與服務工具、質量管理工具和安全管理工具等。
圖20、數據治理工具集
圖21、以元數據治理為核心的數據治理工具
1數據資產
涵蓋數據探查、數據地圖、熱點分析、血緣分析、數據協同共享在內的數據資產管理微服務,有效提升用戶對企業級海量數據的管控協作能力;
數據資產應用、數據資產分析、數據資產服務、數據資產目錄管理。
2數據指標標準
包括數據指標標準錄入、數據標準維護、數據標準查詢、數據標準獲取、數據標準稽核、數據標準監控等。指標數據管理。
3元數據管理
對元數據進行新增、修改、刪除、導出、導入等工作,監管元數據管理執行過程
4數據質量管理
通過可視化的任務管理、多維度的質量評估、靈活的規則配置等功能,為數據接入、整合、加工到消費的全生命周期各階段提供數據質量稽核能力
5數據模型
負責對企業數據模型的管理、比對、分析、展示提供技術支撐,包括數據模型設計、模型差異稽核、數據模型變更管控功能。
6數據安全
數據安全工具其中包括數據采集管理、數據傳輸管理、數據存儲管理、數據處理管理、數據交換和共享管理、數據銷毀管理等7類工具,這6類工具有的是單獨呈現,有的是相互組合在一起形成包括多種功能的軟件平臺。
主數據服務業務視圖包括8個業務域、32個業務子域及相關業務活動,主數據管理工具是主數據全生命周期管理的平臺,也是主數據標準、運維體系落地的重要保障。本章從主數據標準管理、主數據代碼管理、主數據清洗校驗、主數據生命周期管理、主數據質量管理、主數據應用評價、主數據全景圖,主數據應用需求管理、業務需求等。
圖22、以主數據治理為核心的數據治理工具
- 主數據治理平臺是企業數據規劃、數據標準落地的載體,實現數據治理統一標準、統一規則的支撐
- 主數據治理平臺是有效實施主數據、元數據、數據指標管理,提供規范統一的主數據服務的平臺
- 主數據治理平臺是實現數據從產生到應用,分層協同、全面治理的核心
圖23、主數據管理工具-邏輯架構
四 人工智能是大數據治理核心方向
“無治理、不分析”,沒有高質量的數據,就不會有可信的AI。數據治理是人工智能基礎,能夠為人工智能提供高質量的數據輸入。而人工智能是一種技術,它不僅僅是在數據應用端產生作用,在數據的管理端同樣需要人工智能。有了人工智能加持,數據治理將變得更加高效和智能。相信未來,人工智能和數據治理將會擦出越來越多的火花。
人工智能技術在數據采集、數據建模、元數據管理、主數據管理、數據標準、數據質量及數據安全等領域有著深入的應用。
圖24、人工智能技術在數據治理中的應用
結束語
數據治理的發展是伴隨著不同行業對數據資源資產化、數據確權與合規、數據價值創造與共享、隱私保護的認識、研究和實踐的一個演進過程,目前,隨著數據治理理論體系的逐步完善,技術方法和工具的日趨成熟,數據治理被越來越多的企業學習了解和實際應用。






