摘要:TB級(jí)大數(shù)據(jù)使用優(yōu)刻得USQL,將數(shù)據(jù)分析的等待時(shí)間從平均43小時(shí)降到2小時(shí);同時(shí)依托USQL根據(jù)數(shù)據(jù)分析量計(jì)費(fèi),不使用不收費(fèi)的特性,幫助客戶將數(shù)據(jù)運(yùn)算成本降至自建方案的0.5%。
當(dāng)前,大數(shù)據(jù)的價(jià)值已無(wú)需贅述,作為衡量一個(gè)公司核心能力的最底層標(biāo)準(zhǔn),數(shù)據(jù)的建設(shè)也面臨著諸多難題。為了幫助企業(yè)用戶解決大數(shù)據(jù)分析門檻高、效率低的問(wèn)題,優(yōu)刻得USQL數(shù)據(jù)湖分析應(yīng)運(yùn)而生,可輕松完成面向海量數(shù)據(jù)的數(shù)據(jù)建模工作。
縱觀目前企業(yè)大數(shù)據(jù)建設(shè)面臨的問(wèn)題,可大致分為三點(diǎn)。其一,是數(shù)據(jù)資產(chǎn)不清晰,伴隨著業(yè)務(wù)多元化發(fā)展,數(shù)據(jù)來(lái)源越來(lái)越多但數(shù)據(jù)質(zhì)量難以把控;其二,不同業(yè)務(wù)間煙囪式的數(shù)據(jù)架構(gòu)模式造成了數(shù)據(jù)孤島;其三,伴隨著數(shù)據(jù)量逐漸擴(kuò)大,分散的數(shù)據(jù)如何聯(lián)動(dòng),挖掘更大的價(jià)值成為諸多公司探索重點(diǎn);而數(shù)據(jù)分析、數(shù)據(jù)資產(chǎn)管理、數(shù)據(jù)安全也面臨越來(lái)越嚴(yán)峻的挑戰(zhàn)。
企業(yè)用戶在云端搭建大數(shù)據(jù)平臺(tái)時(shí),往往會(huì)被大數(shù)據(jù)生態(tài)的復(fù)雜性所困擾,需要面臨復(fù)雜技術(shù)棧導(dǎo)致的人才門檻、大數(shù)據(jù)分析前期服務(wù)部署產(chǎn)生的巨大成本、數(shù)據(jù)分析耗時(shí)長(zhǎng)等諸多問(wèn)題,使得“大數(shù)據(jù)形成了大麻煩”。
為了幫助用戶解決以上問(wèn)題,優(yōu)刻得USQL數(shù)據(jù)湖分析以一個(gè)能力強(qiáng)大的計(jì)算平臺(tái)作為后端支撐,可以在PB級(jí)海量數(shù)據(jù)上進(jìn)行復(fù)雜的SQL計(jì)算,同時(shí)USQL擁有讀取型Schema的屬性,可關(guān)聯(lián)分析多種存儲(chǔ)格式的數(shù)據(jù),極大降低了產(chǎn)業(yè)用戶使用大數(shù)據(jù)的門檻。
在場(chǎng)景實(shí)踐中,USQL成功賦能新媒體整合營(yíng)銷平臺(tái)愛普新媒的業(yè)務(wù)部門。目前愛普新媒廣告業(yè)務(wù)數(shù)據(jù)規(guī)模達(dá)到數(shù)百TB,日增長(zhǎng)量為1TB左右,業(yè)務(wù)日常不固定的分析需求非常多。在現(xiàn)有的大數(shù)據(jù)處理方案下,數(shù)據(jù)部門每月需投入大數(shù)據(jù)工程師20個(gè)人/日,平均每次需求處理時(shí)長(zhǎng)為1.8天,此外還需額外花費(fèi)數(shù)千元維持一個(gè)數(shù)據(jù)倉(cāng)庫(kù)集群。
與用戶自建大數(shù)據(jù)平臺(tái)的相比,通過(guò)使用優(yōu)刻得USQL,將數(shù)據(jù)分析的等待時(shí)間從平均43小時(shí)降到了2小時(shí);同時(shí)依托USQL根據(jù)數(shù)據(jù)分析量計(jì)費(fèi),不使用不收費(fèi)的特性,幫助客戶將數(shù)據(jù)運(yùn)算成本降至自建方案的0.5%;此外,USQL產(chǎn)品7*24小時(shí)可用,客戶不需調(diào)配技術(shù)人員維護(hù),減少了人力支出,也大幅度改善企業(yè)對(duì)大數(shù)據(jù)工程師的依賴。