摘 要:大數(shù)據(jù)運(yùn)用在處理征信數(shù)據(jù)上具備了先天的優(yōu)勢(shì),至少3000多萬小微企業(yè)用戶需要征信,PB級(jí)數(shù)據(jù)量,日均處理數(shù)據(jù)大于萬億規(guī)模,同時(shí)對(duì)數(shù)據(jù)處理能力要求高,不僅局限于存量和增量,有可能會(huì)發(fā)生全量計(jì)算,也面臨支持實(shí)時(shí)和在線處理的場(chǎng)景。
隨著互聯(lián)網(wǎng)帶動(dòng)實(shí)體經(jīng)濟(jì)的崛起,互聯(lián)網(wǎng)金融行業(yè)也催生出了一波新的發(fā)展浪潮。借貸平臺(tái)、P2P平臺(tái)、交易平臺(tái)等嫣然以成為互聯(lián)網(wǎng)金融圈的新載體,雖然無法顛覆傳統(tǒng)金融的主導(dǎo)地位,但作為其補(bǔ)充的已有效的擴(kuò)展了現(xiàn)在人對(duì)金融的新認(rèn)識(shí)。
互聯(lián)網(wǎng)金融領(lǐng)域如果想要平臺(tái)平穩(wěn)運(yùn)轉(zhuǎn),必須存在一套詳細(xì)風(fēng)險(xiǎn)控制流程,在此之前還存在一個(gè)關(guān)鍵步驟“征信”當(dāng)借款方出現(xiàn)身份欺詐、逾期不還、P2P跑路等行為,平臺(tái)就需通過征信手段提前預(yù)知其行為。由于借款人負(fù)債情況無法統(tǒng)計(jì),數(shù)據(jù)沒有統(tǒng)一的平臺(tái)處理,審核及監(jiān)管尺度松,重復(fù)借款現(xiàn)象普遍致使征信已成為制約企業(yè)發(fā)展的關(guān)鍵因素之一。其根本原因在于各互聯(lián)網(wǎng)金融機(jī)構(gòu)信息封閉,不開放、不共享、評(píng)估標(biāo)準(zhǔn)、評(píng)估模型、風(fēng)險(xiǎn)模型也不規(guī)范,征信數(shù)據(jù)無法共享進(jìn)行分析。
從需求方角度推動(dòng)征信發(fā)展機(jī)構(gòu)可以劃分為三類:
1、電子商務(wù)與O2O企業(yè):目的為構(gòu)建屬于自己的金融體系,同時(shí)可以推送小額貸款業(yè)務(wù)發(fā)展。
2、互聯(lián)網(wǎng)P2P金融機(jī)構(gòu):征信涉及到了其核心業(yè)務(wù)的穩(wěn)定發(fā)展,應(yīng)包含在其風(fēng)控模型中去。
3、第三方征信機(jī)構(gòu):通過平臺(tái)化發(fā)展方式,為從事互聯(lián)網(wǎng)金融行業(yè)客戶提供專業(yè)垂直服務(wù)。
征信數(shù)據(jù)源也包含5個(gè)部分:
1、政府機(jī)構(gòu):中央機(jī)構(gòu)(如公安部數(shù)據(jù)、戶籍信息、學(xué)歷、車輛、身份、護(hù)照等基礎(chǔ)數(shù)據(jù))、地方數(shù)據(jù)(含地方平臺(tái)數(shù)據(jù)信息)、工商經(jīng)營類行業(yè)。
2、民生型企業(yè):央企、國企、大型企業(yè)(如電力企業(yè),通訊企業(yè)、醫(yī)療機(jī)構(gòu)數(shù)據(jù))。
3、金融機(jī)構(gòu):傳統(tǒng)銀行(交易流水、支付情況、商戶數(shù)據(jù))、小額貸款(信貸額度、違約情況等)、信用卡(信用額度、授權(quán)信息、刷卡記錄)、第三方支付公司(線上線下數(shù)據(jù))、投資公司(股票、基金、期貨、保險(xiǎn)等)、支付平臺(tái)數(shù)據(jù)(支付信用情況、分期支付、支付源)。
4、專業(yè)征信機(jī)構(gòu):企業(yè)征信機(jī)構(gòu)、個(gè)人征信機(jī)構(gòu)、征信系統(tǒng)等。
5、互聯(lián)網(wǎng)行業(yè)公司:大型IT公司、電商&O2O公司(交易情況、虛擬貨幣、物流數(shù)據(jù))、社交網(wǎng)站(互聯(lián)網(wǎng)行為),垂直網(wǎng)站和移動(dòng)應(yīng)用公司(位置信息)
推動(dòng)機(jī)構(gòu)與數(shù)據(jù)源為構(gòu)成互聯(lián)網(wǎng)金融征信平臺(tái)創(chuàng)造條件,通過數(shù)據(jù)共享形式為互聯(lián)網(wǎng)金融企業(yè)(2015年P(guān)2P金融企業(yè)超過1000家)提供征信服務(wù)。同時(shí)結(jié)合央行征信系統(tǒng)(無個(gè)人詳細(xì)信息,只有有貸款行為人的貸款信息,《征信業(yè)管理?xiàng)l例》中規(guī)定有貸款行為的機(jī)構(gòu)都必須接入到央行征信系統(tǒng),目前接入比例相當(dāng)?shù)汀?的信息進(jìn)行數(shù)據(jù)互補(bǔ)。大中小型互聯(lián)網(wǎng)金融機(jī)構(gòu)分別將數(shù)據(jù)匯總到平臺(tái)中,平臺(tái)基于用戶線下與線上行為進(jìn)行挖掘分析,制定信用等級(jí)和分?jǐn)?shù)(類似支付寶錢包中的信用評(píng)分),數(shù)據(jù)源的準(zhǔn)確程度則依靠各互聯(lián)網(wǎng)金融機(jī)構(gòu)自控,其質(zhì)量受數(shù)據(jù)量規(guī)模、數(shù)據(jù)維度指標(biāo)、數(shù)據(jù)分析模型、數(shù)據(jù)挖掘算法四個(gè)因素影響。所有分散在互聯(lián)網(wǎng)上的金融平臺(tái)將數(shù)據(jù)匯總后可以針對(duì)征信建立多維分析主題,當(dāng)新的風(fēng)險(xiǎn)出現(xiàn)時(shí),迭代調(diào)整分析主題,進(jìn)行主題升級(jí),最終形成“央行征信數(shù)據(jù) + 互聯(lián)網(wǎng)金融行業(yè)數(shù)據(jù) + 社交行為數(shù)據(jù) = 征信平臺(tái)分析數(shù)據(jù)”的模式。
針對(duì)社交行為數(shù)據(jù),互聯(lián)網(wǎng)中小金融公司及初創(chuàng)金融公司,通常無社交行為數(shù)據(jù)積累,只能單純從自身業(yè)務(wù)中分析用戶信用狀況。而BAT類的互聯(lián)網(wǎng)企業(yè),進(jìn)入互聯(lián)網(wǎng)金融領(lǐng)域后,可以將自身長(zhǎng)期積累的社交行為數(shù)據(jù)結(jié)合伙伴與生態(tài)圈公司數(shù)據(jù)整合構(gòu)建社交行為庫,這方面?zhèn)鹘y(tǒng)互聯(lián)網(wǎng)企業(yè)占據(jù)較大優(yōu)勢(shì)。
大數(shù)據(jù)運(yùn)用在處理征信數(shù)據(jù)上具備了先天的優(yōu)勢(shì),至少3億互聯(lián)網(wǎng)用戶,3000多萬小微企業(yè)用戶需要征信,PB級(jí)數(shù)據(jù)量,日均處理數(shù)據(jù)大于萬億規(guī)模,同時(shí)對(duì)數(shù)據(jù)處理能力要求高,不僅局限于存量和增量,有可能會(huì)發(fā)生全量計(jì)算,也面臨支持實(shí)時(shí)和在線處理的場(chǎng)景。大數(shù)據(jù)的引入可以有效緩解并優(yōu)化這些問題的處理。從處理流程上分為4個(gè)主要步驟:1、對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行采集、清洗處理;2、數(shù)據(jù)分布式存儲(chǔ),滿足處理前準(zhǔn)備;3、數(shù)據(jù)挖掘與分析,多維度、多主題;4、個(gè)性化數(shù)據(jù)服務(wù)保障,提升用戶體驗(yàn)。用友iUAP對(duì)大數(shù)據(jù)的處理完全就是按這樣一個(gè)過程來進(jìn)行的。用友iUAP基于內(nèi)存分析的高性能分析引擎,可存儲(chǔ)和管理PB級(jí)數(shù)據(jù);實(shí)現(xiàn)TB級(jí)數(shù)據(jù)的秒級(jí)實(shí)時(shí)分析;基于列存儲(chǔ)的自適應(yīng)壓縮技術(shù)實(shí)現(xiàn)3-20倍的存儲(chǔ)壓縮比;分析場(chǎng)景下10到50倍性能提升。滿足結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的多類型數(shù)據(jù)的全面數(shù)據(jù)存儲(chǔ)管理能力。

用友iUAP UDH企業(yè)管理器
征信大數(shù)據(jù)的特征如下:
1、用戶基數(shù)大:中國互聯(lián)網(wǎng)用戶將近7億,有一半左右人在央行征信系統(tǒng)沒有信用記錄,征信需要對(duì)互聯(lián)網(wǎng)用戶的行為進(jìn)行畫像,挖掘上網(wǎng)痕跡進(jìn)行分析,基數(shù)決定了分析的樣本域,從橫向和縱向2個(gè)方面提供數(shù)據(jù)依據(jù)。處理基數(shù)大的數(shù)據(jù),需要從處理穩(wěn)定性、處理速度、處理準(zhǔn)確性三方面約束。
2、實(shí)時(shí)數(shù)據(jù)多:相對(duì)傳統(tǒng)靜態(tài)數(shù)據(jù)與離線數(shù)據(jù)分析,互聯(lián)網(wǎng)金融征信實(shí)時(shí)數(shù)據(jù)處理場(chǎng)景會(huì)非常多,很多情況下數(shù)據(jù)變化不僅僅是通過增量計(jì)算可以影響,這里需要大數(shù)據(jù)處理技術(shù)作為技術(shù)支撐,用戶的每一步操作都可以即時(shí)體現(xiàn)在信用體系中。
3、指標(biāo)多:互聯(lián)網(wǎng)數(shù)據(jù)面向的主題或領(lǐng)域多,如金融貸款、汽車租賃、消費(fèi)信貸等,每個(gè)領(lǐng)域的指標(biāo)數(shù)量大、不統(tǒng)一、格式繁瑣,如何有效利用指標(biāo)數(shù)據(jù)需要通過大數(shù)據(jù)技術(shù)進(jìn)行處理,10萬用戶,通過指標(biāo)化后,要處理的數(shù)據(jù)量可能過千萬。
基于大數(shù)據(jù)的征信發(fā)展前景:
1、推動(dòng)征信產(chǎn)業(yè)升級(jí),互聯(lián)網(wǎng)金融企業(yè)升級(jí),目前正處在風(fēng)口上。
2、征信差異化趨勢(shì),不同的數(shù)據(jù)來源、數(shù)據(jù)維度指標(biāo)、數(shù)據(jù)分析主題和用戶模型,分析算法,組成了征信的差異化。
3、更豐富的數(shù)據(jù)來源,不僅僅是線上的電商、社交、交易等數(shù)據(jù),還可延伸至線下數(shù)據(jù),數(shù)據(jù)種類更豐富。
4、改進(jìn)當(dāng)前征信市場(chǎng)現(xiàn)狀,優(yōu)化現(xiàn)有格局,將三類征信機(jī)構(gòu)數(shù)據(jù)更細(xì)分,局部數(shù)據(jù)形成共享。
大數(shù)據(jù)征信面臨的挑戰(zhàn):
1、相關(guān)技術(shù)在征信領(lǐng)域有效運(yùn)用門檻較高,設(shè)計(jì)的技術(shù)點(diǎn)比較多,算法、模型、框架繁雜,對(duì)于中小企業(yè)構(gòu)建自己的數(shù)據(jù)分析平臺(tái)難度較大。
2、處理能力需要有待提高,之前提到用戶基數(shù)大,維度信息多,并且很多數(shù)據(jù)可能非增量,非靜態(tài),對(duì)數(shù)據(jù)處理的能力是一個(gè)嚴(yán)峻的考驗(yàn)。
3、算法的合理性和標(biāo)準(zhǔn)性,目前沒有一個(gè)統(tǒng)一個(gè)標(biāo)準(zhǔn),也沒有一個(gè)類似聯(lián)盟的機(jī)構(gòu)推出相關(guān)草案。
4、需要構(gòu)建支撐大數(shù)據(jù)的云平臺(tái),如果是構(gòu)建企業(yè)私有云平臺(tái)或混合云平臺(tái),成本高,技術(shù)復(fù)雜度大。
5、征信業(yè)務(wù)與大數(shù)據(jù)業(yè)務(wù)處理方式需要匹配,涉及到了數(shù)據(jù)源采集、過濾、處理、分析、挖掘等流程。
6、大數(shù)據(jù)量帶來的安全問題,征信需要對(duì)用戶隱私保護(hù),并提供數(shù)據(jù)安全方案。
完善征信監(jiān)督體系,形成獨(dú)立組織或平臺(tái),監(jiān)控業(yè)務(wù) 數(shù)據(jù)運(yùn)行風(fēng)險(xiǎn)。提煉大數(shù)據(jù)安全保障機(jī)制,明確各組織或者個(gè)人的權(quán)利和義務(wù)的范圍。圍繞大數(shù)據(jù)建立征信體系標(biāo)準(zhǔn),保障企業(yè)商業(yè)機(jī)密、用戶因素、國家信息安全,提供相應(yīng)法律制度,保障大數(shù)據(jù)在對(duì)數(shù)據(jù)使用過程中的權(quán)益。增強(qiáng)大數(shù)據(jù)在互聯(lián)網(wǎng)金融行業(yè)應(yīng)用范圍,提升創(chuàng)新度,不僅僅局限于增值服務(wù)、信用報(bào)告等。創(chuàng)建大數(shù)據(jù)共享聯(lián)盟體系,統(tǒng)一標(biāo)準(zhǔn),使孤立在各機(jī)構(gòu)、公司和互聯(lián)網(wǎng)的數(shù)據(jù)按照一定規(guī)范共享,這些將是未來大數(shù)據(jù)在征信領(lǐng)域的發(fā)展趨勢(shì)。






