人工智能作為一項引領未來的戰(zhàn)略性科技,已成為各領域數(shù)字化、智能化轉(zhuǎn)型的基礎與關鍵。伴隨著技術進一步成熟,AI商業(yè)化落地熱潮即將開幕。正值浪潮初始,AI數(shù)據(jù)安全事件卻頻頻發(fā)生,由此引發(fā)了大眾擔憂。“如何在智能化進程中,保障數(shù)據(jù)安全?”成為人工智能發(fā)展倫理下的重要議題。
數(shù)據(jù)安全需從生產(chǎn)源頭規(guī)范
數(shù)據(jù)作為驅(qū)動人工智能的三駕馬車之一,其重要性不言而喻。現(xiàn)階段,以深度學習為代表的人工智能算法模型搭建與迭代優(yōu)化,都需要大量優(yōu)質(zhì)數(shù)據(jù)作為“燃料”。數(shù)據(jù),已然成為一種軟性資源。
機器學習領域權威學者吳恩達曾在公開演講中多次表達過數(shù)據(jù)的重要性,“科技公司的壁壘不再是算法,而是數(shù)據(jù)。”
對于科技企業(yè)而言,數(shù)據(jù)意味著未來。如若發(fā)生數(shù)據(jù)泄露,無疑是自毀城墻。并且,大量AI數(shù)據(jù)涉及到人臉、指紋、虹膜圖像、聲紋、消費習慣、個人偏好等生物特征及隱私信息,一旦泄露,將造成極大的社會負面影響,不僅企業(yè)聲譽、經(jīng)濟利益受損,甚至還需要面對訴訟等法律指控。
由于數(shù)據(jù)安全治理的緊迫性,國內(nèi)科技企業(yè)都投入了巨大的精力,進行安全漏洞治理,但在AI數(shù)據(jù)生產(chǎn)的源頭,卻鮮少顧及。
在AI領域,單個項目的數(shù)據(jù)需求量非常大。訓練一個最簡單的圖像識別算法,需要至少數(shù)萬張有完整標簽的標注圖片;一個文本審核程序,則需要數(shù)十萬甚至上百萬條NLP數(shù)據(jù)訓練;而布局一個智慧城市應用,所需的數(shù)據(jù)量更是驚人。這些龐雜的數(shù)據(jù)需要大量人力處理,因此,大部分科技公司選擇將這部分業(yè)務委托外部處理。
目前,AI數(shù)據(jù)生產(chǎn)主要依賴于市場上林林總總的數(shù)據(jù)生產(chǎn)服務商、標注團隊以及兼職個人,由于缺少安全生產(chǎn)規(guī)范,行業(yè)整體處于野蠻生長狀態(tài),“灰產(chǎn)數(shù)據(jù)”“層層轉(zhuǎn)包”“數(shù)據(jù)轉(zhuǎn)賣”……行業(yè)亂象屢見不鮮,而對于企業(yè)來說,本應是最核心的資源——數(shù)據(jù),就在層層流動中,增加了泄露、濫用的潛在風險。
景聯(lián)文科技:數(shù)據(jù)安全是標準,也是底線
AI數(shù)據(jù)相對門檻較低,幾臺電腦、幾個人力就能組成一個標注團隊,因此涌進了大批投機的“掘金者”,他們?nèi)狈Π踩a(chǎn)意識,也沒有完善的數(shù)據(jù)安全處理規(guī)范,但卻能通過眾包模式,成為市場中的主力軍。
據(jù)景聯(lián)文科技CEO鄭曉薇介紹:“目前AI數(shù)據(jù)行業(yè)缺乏一個硬性安全生產(chǎn)標準,大部分情況,數(shù)據(jù)安全取決服務商自身的管理能力以及道德標準。”
景聯(lián)文科技作為國內(nèi)領先的指紋防偽技術提供商,“安全”就是刻在骨子里的基因。在指紋防偽領域,景聯(lián)文科技擁有多項自主知識產(chǎn)權專利及軟件著作權,連續(xù)兩屆拿下LivDet:Fingerprint Liveness Detection Competition(國際活體指紋檢測大賽)第一名。此外,公司也是IIFAA(互聯(lián)網(wǎng)金融身份認證聯(lián)盟)、全國信息技術標準化技術委員會生物特征識別分技術委員會成員單位,曾參與編撰行業(yè)標準規(guī)范性文件《生物特征識別白皮書(2019版)》。
因為長期與指紋這類敏感數(shù)據(jù)打交道,在景聯(lián)文科技內(nèi)部擁有著一套成熟的數(shù)據(jù)處理流程與存儲方案,并且率先通過了國際ISO27001信息安全管理體系認證,以安全為前提,為企業(yè)客戶提供高質(zhì)服務。
2016年,景聯(lián)文科技帶著成熟的隱私數(shù)據(jù)處理方法,以及長期深耕To B市場的流程管理經(jīng)驗積累,全力投入AI數(shù)據(jù)采集標注產(chǎn)業(yè)。
在數(shù)據(jù)業(yè)務起步初期,景聯(lián)文科技就將“安全”貫徹落實到數(shù)據(jù)生產(chǎn)的每一個流程中,從作業(yè)環(huán)境、網(wǎng)絡環(huán)境、標注工具、數(shù)據(jù)存儲、數(shù)據(jù)交付、定制服務六個維度出發(fā),全鏈路保障數(shù)據(jù)安全。
作為業(yè)內(nèi)數(shù)據(jù)安全的正面典范,景聯(lián)文科技還在不斷優(yōu)化自身服務流程,并希望形成一個行業(yè)標準進而影響產(chǎn)業(yè)。
對于在安全生產(chǎn)上的投入,鄭曉薇表示:“數(shù)據(jù)安全既是景聯(lián)文科技的標準,也是底線,投入是必要且有價值的。”
目前,AI還是一門依托海量數(shù)據(jù)驅(qū)動知識學習的學科,AI算法模型從技術理論到應用實踐的過程,依賴于大量的結構化數(shù)據(jù),因此,數(shù)據(jù)安全將直接影響AI商業(yè)化落地進程。從行業(yè)發(fā)展的角度看,AI數(shù)據(jù)生產(chǎn)安全標準化、規(guī)范化是一條必行之路,而景聯(lián)文科技愿意做這條道路的先行探索者。