導語:在人工智能時代,數據作為一種信息戰略資源,被賦予了極為重要的意義,新的黃金、新的石油、新的貨幣……但數據本身是沒有意義的,只有通過采集、清洗、標注,數據才具有市場價值。
新基建浪潮呼嘯而來,人工智能產業乘風而上。AI作為許多領域數字化與智能化轉型的基礎與關鍵,在這場時代風口前迎來了新騰飛。
這場自上而下的變革中,大量AI需求被釋放,直接刺激了源頭產業,站在人工智能產業鏈上游的數據服務商,首先吃到了紅利。
據國內知名AI數據服務商景聯文科技透露,近幾個月來,公司接洽的客戶量明顯上升,有幾個科技大廠訂單進入了合同階段,其中一個“萬人采集”的項目已經啟動。
對于人工智能產業而言,應用層AI產品的落地發展離不開數據的支撐,在智能化大潮來臨之時,AI數據產業進入了新一輪加速期。
數據是AI智能化的關鍵
“沒有數據,就沒有人工智能。”這是行業內普遍認同的觀點。
目前主流的深度學習算法,本質是在神經網絡系統中,調節和優化各個層級之間的權重和閾值,當層數越多,對輸入特征的抽象層次就越高,這也意味著算法模型能夠處理更復雜、抽象的任務,同時,對數據的需求也就越大。
Facebook AI研究院負責人、深度學習三巨頭之一的Yann LeCun曾坦言,“你需要數據來訓練你的系統,你的數據越多,你的系統就會越精準。所以,從技術目標和商業角度來看,數據越多越好。”
低質量數據,掣肘AI發展落地
在智能化成為時代趨勢的今天,許多領域都在積極擁抱AI。從隨喊即應的智能音箱,到能夠輔助診斷的智能醫療系統,利用AI為自身賦能,升級迭代的領域與企業越來越多,數據需求如雨后春筍般冒出,前所未有地旺盛。
面對這一藍海市場,大批競爭者涌入,亂象頻發。因為定制采集成本過高,有中小型供應商直接在網絡上抓取或者購買灰產數據,而標注業務則是經過一層層轉包,中間商賺得盆滿缽滿,交付的數據一塌糊涂。
據景聯文科技總經理劉云濤介紹,這種行業“默認”做法隱患其實非常大,一是數據質量堪憂,二是隱私、安全問題。
AI技術要實現商業化落地,進入到我們的生活,這個過程必然需要大量高質量、能被機器識別理解的結構化數據投入訓練。因此,無論出于技術還是商業需求,都需要景聯文科技這類品牌數據服務提供商介入,通過輸送合理、安全、干凈的標注數據,助力人工智能快速實現落地。
景聯文科技:高質量數據為AI賦能
杭州景聯文科技有限公司成立于2012年,早期專注于指紋防偽技術,算法發家,連續兩屆拿下LivDet:Fingerprint Liveness Detection Competition(國際活體指紋檢測大賽)第一名,在該領域擁有多項自主知識產權專利及軟件著作權,曾三次參與國家標準制定,與華為、阿里巴巴、??低暋⑷簳熆萍?、浙江省公安廳、公安部物證鑒定中心等企業、機構達成了深入合作。
2016年,景聯文敏銳嗅到了AI數據市場的巨大潛力,帶著多年處理敏感數據的經驗,以及長期深耕To B市場的流程管理經驗積累,全力投入AI數據采集標注產業。
經過四年的沉淀,景聯文已經發展出了一套完整的標準化流程體系,從前期需求溝通,到數據質檢交付,流程規范可追溯,并且還上線了自有標注平臺,覆蓋多類標注工具,確保數據安全。
此外,景聯文還極為注重AI應用場景。從去年起,其公司內部劃分了多個業務組,垂直化獨立運營,為自動駕駛、智能家居、智能教育、智慧金融、新零售等領域客戶帶來最佳AI數據解決方案,讓客戶數據資產更有價值。
對于這一決定,景聯文CEO鄭曉薇解釋道:“只有站在應用場景的角度理解數據,才能解決AI落地的實際問題。如果要實現更高層次的自動駕駛,就需要針對多樣的駕駛環境進行訓練,因為AI落地投入市場,就必須得考慮到不同場景的適用性。因此根植于AI應用場景,提供一站式、定制化的數據解決方案,是景聯文未來堅定不移的發展路線。”
縱觀人工智能的發展,從算法、算力之爭,逐漸過渡到了數據。數據成為了一種稀缺社會軟資源,其意義就如同石油之于第二次工業革命,可以說誰掌握的數據,誰就掌握了未來。
在這樣的背景下,景聯文科技堅守本心,以高效穩定的執行力,持續生產輸送高質量數據,支撐科技算法公司、傳統領域企業實現智能化跨越。