在數(shù)字化轉(zhuǎn)型的浪潮中,數(shù)據(jù)中臺(tái)這一曾被視為企業(yè)數(shù)據(jù)管理與應(yīng)用利器的架構(gòu)模式,近期卻遭遇了市場(chǎng)的質(zhì)疑。全球知名研究與咨詢機(jī)構(gòu)Gartner在其2024年發(fā)布的數(shù)據(jù)分析與人工智能技術(shù)成熟度曲線(中國(guó)版)中,明確指出“數(shù)據(jù)中臺(tái)”已步入泡沫破裂的低谷階段,并預(yù)測(cè)其可能走向消亡。這一論斷引起了業(yè)界的廣泛關(guān)注與討論。
數(shù)據(jù)中臺(tái)自2014年前后由阿里巴巴提出并實(shí)施以來(lái),憑借其解決數(shù)據(jù)孤島、實(shí)現(xiàn)數(shù)據(jù)統(tǒng)一管理和高效利用的能力,迅速在國(guó)內(nèi)企業(yè)中得到推廣。然而,經(jīng)過(guò)十多年的發(fā)展,數(shù)據(jù)中臺(tái)的弊端逐漸顯現(xiàn)。從技術(shù)層面看,數(shù)據(jù)中臺(tái)采用物理集中式架構(gòu),難以應(yīng)對(duì)數(shù)據(jù)規(guī)模指數(shù)級(jí)增長(zhǎng)帶來(lái)的整合挑戰(zhàn),特別是跨源異構(gòu)數(shù)據(jù)的處理。同時(shí),數(shù)據(jù)中臺(tái)的建設(shè)成本高昂,投資回報(bào)周期長(zhǎng),ROI(投資回報(bào)率)成為企業(yè)難以忽視的問(wèn)題。從業(yè)務(wù)層面看,數(shù)據(jù)中臺(tái)高度依賴ETL專業(yè)團(tuán)隊(duì)和工具,缺乏時(shí)效性和靈活性,難以為前端業(yè)務(wù)決策和產(chǎn)品創(chuàng)新提供及時(shí)的數(shù)據(jù)支持。
面對(duì)數(shù)據(jù)中臺(tái)的困境,一種名為“數(shù)據(jù)編織”(Data Fabric)的全新數(shù)據(jù)管理架構(gòu)理念開始受到業(yè)界的青睞。數(shù)據(jù)編織不是具體的產(chǎn)品,而是一種設(shè)計(jì)理念,它利用AI、機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)的功能,實(shí)現(xiàn)數(shù)據(jù)的動(dòng)態(tài)整合,發(fā)現(xiàn)數(shù)據(jù)之間獨(dú)特的業(yè)務(wù)關(guān)系。其核心在于通過(guò)數(shù)據(jù)虛擬化技術(shù),創(chuàng)建邏輯數(shù)據(jù)層,實(shí)現(xiàn)數(shù)據(jù)的統(tǒng)一訪問(wèn)與管理,無(wú)需物理搬運(yùn)數(shù)據(jù)。這種架構(gòu)不僅提高了數(shù)據(jù)的發(fā)現(xiàn)與訪問(wèn)效率,還降低了數(shù)據(jù)管理的成本,實(shí)現(xiàn)了極致敏捷的數(shù)據(jù)交付。
與數(shù)據(jù)中臺(tái)相比,數(shù)據(jù)編織的關(guān)鍵突破在于其邏輯數(shù)據(jù)層的構(gòu)建。通過(guò)單點(diǎn)邏輯集成分散在不同系統(tǒng)中的數(shù)據(jù),為數(shù)據(jù)消費(fèi)者提供了一個(gè)統(tǒng)一的、抽象的、封裝的邏輯數(shù)據(jù)視圖。用戶可以通過(guò)這個(gè)邏輯視圖查詢和操作存儲(chǔ)在異構(gòu)數(shù)據(jù)源中的數(shù)據(jù),無(wú)需關(guān)心數(shù)據(jù)的位置、類型和格式。這種架構(gòu)不僅解決了數(shù)據(jù)遷移和數(shù)據(jù)合規(guī)性的問(wèn)題,還提高了數(shù)據(jù)的響應(yīng)速度和利用效率。
國(guó)際市場(chǎng)對(duì)數(shù)據(jù)編織架構(gòu)的發(fā)展持樂(lè)觀態(tài)度。根據(jù)全球行業(yè)分析師報(bào)告,全球數(shù)據(jù)編織市場(chǎng)從2020年的11億美元增長(zhǎng)到2026年的37億美元,增長(zhǎng)超過(guò)兩倍。Gartner也連續(xù)三年將數(shù)據(jù)編織列為“十大數(shù)據(jù)和分析技術(shù)趨勢(shì)”之一,并預(yù)測(cè)其在未來(lái)2-5年內(nèi)將獲得廣泛應(yīng)用。在國(guó)內(nèi)市場(chǎng),雖然數(shù)據(jù)編織架構(gòu)的應(yīng)用仍處于初期階段,但已有不少企業(yè)開始嘗試并取得了良好的應(yīng)用效果。
以首創(chuàng)證券為例,該公司在構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)時(shí)面臨人員短缺和技術(shù)挑戰(zhàn)。傳統(tǒng)Hadoop數(shù)倉(cāng)體系需要龐大的ETL開發(fā)團(tuán)隊(duì)和深厚的技術(shù)積累,而首創(chuàng)證券僅有少量數(shù)據(jù)工程師。通過(guò)引入數(shù)據(jù)編織架構(gòu),首創(chuàng)證券成功構(gòu)建了一個(gè)邏輯數(shù)倉(cāng),將各業(yè)務(wù)系統(tǒng)的數(shù)據(jù)無(wú)縫連接。這種架構(gòu)不僅簡(jiǎn)化了數(shù)倉(cāng)結(jié)構(gòu),還實(shí)現(xiàn)了數(shù)據(jù)的按需加速與物化,大大提高了數(shù)據(jù)處理的靈活性。報(bào)表的查詢響應(yīng)率也顯著提升,一秒內(nèi)響應(yīng)率達(dá)到95%。
數(shù)據(jù)編織架構(gòu)的出現(xiàn),為企業(yè)數(shù)字化轉(zhuǎn)型提供了新的思路。它不僅能夠解決數(shù)據(jù)中臺(tái)存在的效率、成本、組織、合規(guī)等問(wèn)題,還能夠滿足企業(yè)業(yè)務(wù)快速變化和數(shù)據(jù)自服務(wù)的需求。對(duì)于擁有充足資金和人才儲(chǔ)備的大型企業(yè)而言,數(shù)據(jù)中臺(tái)和數(shù)據(jù)編織可以相互融合、互為補(bǔ)充;而對(duì)于投資謹(jǐn)慎和人才儲(chǔ)備不足的數(shù)字化初階企業(yè)而言,應(yīng)用數(shù)據(jù)編織則能以更低的成本、更快的速度上線業(yè)務(wù),滿足其業(yè)務(wù)變化和調(diào)整的需求。
為了幫助企業(yè)更好地評(píng)估和應(yīng)用數(shù)據(jù)編織架構(gòu),國(guó)內(nèi)Data Fabric架構(gòu)理念的實(shí)踐者與引領(lǐng)者Aloudata發(fā)布了《數(shù)據(jù)編織價(jià)值評(píng)估指南》白皮書。該白皮書提出了業(yè)界首個(gè)數(shù)據(jù)編織價(jià)值實(shí)現(xiàn)評(píng)估框架,包括“提升數(shù)據(jù)交付效率”、“降低數(shù)據(jù)膨脹系數(shù)”、“減少數(shù)據(jù)管理成本”三個(gè)評(píng)估維度,以及“當(dāng)天需求滿足率”和“當(dāng)天數(shù)據(jù)動(dòng)銷率”兩個(gè)關(guān)鍵指標(biāo)。這些維度和指標(biāo)為企業(yè)提供了量化評(píng)估數(shù)據(jù)編織架構(gòu)應(yīng)用效果的方法,有助于企業(yè)更好地激發(fā)數(shù)據(jù)價(jià)值,賦能業(yè)務(wù)發(fā)展。