亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.430618.com 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

文|大數據架構師

曾經有段時間給甲方爸爸做項目的時候,他們看我長的顯小,喜歡挑戰一些問題,其中我遇到最多的就是“什么是元數據”。遇到這種問題既不能啰嗦,也不能太過于專業,否則領導會不開熏。

另外,元數據、主數據也都是數據治理的核心中的核心。今天就給大家把這幾個名詞給徹底解釋清楚。

為什么要取這么多名字?

我初入數據行業的時候也被一堆的名詞給繞暈了。什么元數據、技術元數據、業務元數據、操作元數據、主數據、參考數據、事務數據、業務數據、維度、度量、指標等等等等,那時候簡直一腦門子的官司。

那時候就是劉姥姥進大觀園,看啥都新鮮,看啥也都不懂,長期處于信息過載的狀態。那時候也沒有人幫我整理整理,自己也沒時間去系統性的學習,只是硬著頭皮邊用邊學,慢慢的加深理解。其實這些東西都是內在關聯的。我梳理了一下,這樣看就能清楚很多了:

什么是數據、元數據、主數據?這可能是大多數人沒看過的解釋

 

我們知道,面對大量信息的時候,最好的辦法就是歸類、合并、分解,把它們用一個結構組合起來,這樣就能很容易的理解。其實所有的數據也是一樣,我按照數據的記錄、管理和分析三個用途,對這些數據名詞進行歸類,這樣是不是就清晰多了?

記錄類數據

什么是事務數據?

事務是數據庫的處理數據的一個單元,可以理解為一次數據庫CRUD的操作。事務數據就是記錄下數據庫操作的系統日志數據,以及特定業務場景中,專門記錄的業務操作事務記錄的數據,比如用于安全審計的系統登錄日志。

什么是業務數據?

業務數據就是為了完成業務流程而存儲的業務操作類數據。就是業務系統的絕大多數表和數據。

什么是日志數據?

早期的日志數據是屬于事務數據中的。現在大數據時代,用戶訪問數據變得越來越重要,所以單獨分離出來。

什么是元數據

元數據(Meta-data)是描述數據的數據。如何理解這句話?以小學課文《翠鳥》為例, 我告訴你這是一只翠鳥,如果你沒見過翠鳥,你肯定無法理解翠鳥是個什么東西。但是如果是這樣描述一下呢?

翠鳥喜歡停在水邊的葦稈上,一雙紅色的小爪子緊緊地抓住葦稈。它的顏色非常鮮艷。頭上的羽毛像橄欖色的頭巾,繡滿了翠綠色的花紋。背上的羽毛像淺綠色的外衣。腹部的羽毛像赤褐色的襯衫。它小巧玲瓏,一雙透亮靈活的眼睛下面,長著一張又尖又長的嘴。

上文在描述翠鳥,怎么描述的呢?從這幾個方面:停在那兒、小爪子、顏色、頭上的羽毛、背上的羽毛、腹部的羽毛、體型、眼睛、嘴。

同理,現在我告訴一個數字:175,你除了對175這個數字有比較確定的量化意義之外,也無法理解175具體代表了什么含義。但是如果是這樣描述一下呢?

什么是數據、元數據、主數據?這可能是大多數人沒看過的解釋

 

這樣是不是就很清楚了?175的意思是:2020年統計的全國成年男性平均身高,該值的合理閾值是80-260cm,數據目前存在MySQL中,訪問連接是XXXX,由國家統計局的張三在2020年1月1日創建,數據目前是公開的,很安全,質量經過多重確認無誤的。

在描述175這個數據,用了哪些描述項呢?單位、指標、統計時間、統計范圍、合理閾值、數據庫、表、字段、接口、創建人、創建時間、數據權限、質量等級等等。這些都是在描述175這個數據。我們把描述175這個數據的其他數據稱之為“元數據”。

當然,為了管理方便,我們同樣還能將上述元數據進行歸類:

什么是數據、元數據、主數據?這可能是大多數人沒看過的解釋

 

與業務規則、流程相關的描述性數據,我們稱之為業務元數據;

與存儲、訪問等技術底層的描述性數據,我們稱之為技術元數據;

與數據操作相關的描述性數據,我們稱之為操作元數據;

與數據管理相關的描述性數據,我們稱之為管理元數據

元數據可以解決什么核心問題?

如上所述,元數據就是為了準確的描述我們擁有的所有數據。其核心的目的是降低人與數據之間的溝通成本。描述的越準確,我們使用數據的成本就越低。

什么是主數據

主數據(Master Data)就是關于業務實體的數據。主數據是關鍵業務實體的最權威、最準確、價值最大的數據,用于建立交易閉環。其實Master Data翻譯成“核心數據”可能會更合適,因此主數據也被稱為“黃金數據”。這么說吧,其實阿里的One ID就是主數據理念的結果。

對于CRM客戶管理系統來說,用戶就是主數據;對于銀行來說,卡bin碼、開戶行、賬號、理財產品等都是主數據;對于生產企業,BOM表是主數據;對于二手房平臺,房源信息是主數據。貝殼的樓盤字典就是典型的主數據,他們從2008年開始建設,持續了12年,投入了5、6億。

什么是數據、元數據、主數據?這可能是大多數人沒看過的解釋

 

所以我們總結一下,主數據一共有以下種類:

  • 與人相關的:用戶、客戶、公民、病人、供應商、學生等;
  • 與物相關的:實體產品、虛擬產品(理財產品)、生產資料(BOM表)等;
  • 與場相關的:地址庫、樓盤字典、POI信息等;
  • 與規則相關的:財務的賬套等。

在傳統IT企業,甲方公司的主數據可以立一個千萬級的項目。國內也有很多公司專門做主數據這個行當。主數據的核心思想是全局唯一的標準數據。因此,主數據一般會完成以下工作:

  • 確定核心業務環節
  • 識別主數據
  • 定義和維護主數據匹配規則(代碼規則、ID MApping)
  • 建立及發布數據標準
  • 主數據的后續維護及更新

分享到:
標簽:數據
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定