亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

公告：魔扣目錄網為廣大站長提供免費收錄網站服務，提交前請做好本站友鏈：【網站目錄：http://www.430618.com 】，免友鏈快審服務（50元/站），

網站：51998
待審：31
小程序：12
文章：1030137
會員：747

首頁 > 新聞資訊 > IT業界 >正文

大數據架構設計與數據計算流程

發布時間：2023-07-02 22:08:58 作者：網友整理

大數據架構設計

Hadoop有3個核心組件：分布式文件系統HDFS；分布式運算編程框架MapReduce；分布式資源調度平臺YARN。

HBase，Hadoop dataBase，基于HDFS的NoSQL數據庫，面向列式的內存存儲，定期將內存數據刷新到磁盤(刷盤)。使用LSM樹結構存儲結構。不支持SQL、沒有表關系、無法join操作，不支持事務（僅支持行級事務）、不支持回滾。MySQL4張表在HBase對應1個表、4個列。

HBase列式內存存儲

離線計算數據流程

離線計算數據流程

實時計算數據流程

實時計算數據流程

專業術語

OLTP，聯機事務處理，Online Transaction Processing。

OLAP，聯機實時分析，Online Analytical Processing。

HTAP，混合事務和分析處理，Hybrid Transaction & Analytical Processing。

MPP，大規模并行處理，Massively Parallel Processing。

數據倉庫與分層

ODS 數據接入層：所有的數據首先接入ODS層，數據復雜多樣，粒度最粗。

DIM 維表層：根據維度及其屬性將數據平臺上構建的物理化的表，采用寬表設計的原則。

DWD 數據倉庫層：經過ODS清洗、處理后的一致性、準確的、干凈的數據。

DWS 數據集市層：該層數據是面向主題來組織的輕度匯總級的數據。

DWT 數據應用層：為了滿足具體的分析需求而構建的高度匯總的數據。

ADS 層：為各種報表提供數據。

大數據組件

存儲框架

HBase、TiDB、ClickHouse、InfluxDB（時序數據庫）、GraphQL、Elasticsearch、Apache Doris等。

數據同步轉換組件

Sqoop、canal、DataX、maxwell、Debezium、Flink-CDC、Kettle、StreamSets。

離線批量計算分析引擎

MapReduce、Yarn、Hive、Spark。（Hive無物理存儲功能、邏輯表，定義元數據）

實時流式計算引擎

Flink、Storm、Spark Streaming。

存儲層

HDFS、Apache Ozone、S3、OSS、Ceph、GlusterFS。

數據湖

Apache Hudi、Apache Iceberg、Delta Lake。

任務調度工具

Azkaban、Airflow、Oozie、Dolphin、Scheduler。

ETL數據抽取工具

Kettle、StreamSets、Apache NiFi、Airbyte。

Hodoop集群管理工具、大數據運維

Ambari、CDH（Cloudera版本）、HDP（Hortonwork版）、CDP（Cloudera和Hortonwork合并版本，收費）、USDP（國產UCloud版）、CRH（基于Apache Ambari+Apache BigTop）、TDH（星環收費閉源）。

分享到：

標簽：架構數據

網友整理

注冊時間：

網站：5 個小程序：0 個文章：12 篇

51998
網站
12
小程序
1030137
文章
747
會員

趕快注冊賬號，推廣您的網站吧！

文章分類

熱門網站

各百科-專業百科問答知識名網站 m.geelcn.com
免費軟件,綠色軟件園,手機軟件下載,熱門游戲下載中心-中當網 m.deelcn.com
魔扣科技 www.430618.com
體育新聞_國際體育資訊_全球體育賽事-中名網 www.feelcn.com/tiyu/tiyuxinwen/
食品安全_健康飲食_舌尖上的安全-中名網 www.feelcn.com/shenghuo/shipinanquan/
中合網 www.heelcn.com
中當網 www.deelcn.com
魔扣網站維護代運營 www.430618.com/tg
中合網-健康養生知識科普名站 m.heelcn.com
各百科 www.geelcn.com

數獨大挑戰2018-06-03

數獨一種數學游戲，玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題，題庫，初中，高中，大學四六

運動步數有氧達人2018-06-03

記錄運動步數，積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定