近日,中國信息通信研究院發布《人工智能白皮書(2022年)》(以下簡稱《白皮書》),全面回顧了2021年以來全球人工智能在政策、技術、應用和治理等方面的最新動向,重點分析了人工智能所面臨的新發展形勢及其所處的新發展階段,為各界提供參考,共同推動人工智能持續健康發展。
《白皮書》指出,人工智能在追求極致創新方面不斷突破,圍繞著算法、算力和數據的技術創新始終是主旋律。在數據層面,隨著AI技術的發展,數據規模正在不斷提升,據IDC測算,2025年全球數據規模將達到163ZB;同時,AI數據服務業進入了深度定制化階段,根據不同場景和需求進行數據定制的服務,數據集需求也從通用簡單場景向個性化場景過渡。

在多元化的人工智能場景落地背景下, AI和傳統行業之間的融合、協作越來越多,孕育著大量的新興細分市場,AI行業應用場景趨于長尾和碎片化。伴隨著人工智能產品的迭代,AI數據的演進過程也伴隨著自身選擇的演化,體現在數據多維化、場景多元化、樣本多樣化、內容專業化、作業精細化、作業高效化等方面。
國內領先AI數據服務廠商云測數據總經理賈宇航認為,想要充分發揮AI數據的價值,一是加強場景化數據的采集能力,換言之就是為人工智能細分場景的落地,提供更加垂直且豐富的數據,滿足其長尾場景的需求;二是提升數據標注的準確性,從工具、規則、流程的開發制定,到標注人員的素質培養,不放過任何可以提升標注準確性的可能;三是充分發揮“底層技術+服務能力”的力量,具備更深刻的行業領域知識、更懂場景、更懂技術、更具行業前瞻性。
賈宇航強調,人工智能時代下,數據是重要一環,推動著算法的應用。算法是一項技術,不獨立存在,需要嵌入到工程研發中,再通過市場的運營和競爭贏得相應的份額。在算法的研發中,從場景定義到算法部署,都與AI數據服務企業息息相關。

目前,云測數據已將產研做到全領域覆蓋,率先形成AI訓練數據的“采、標、管、存”一站式服務,實現了從“數據原料”到最后的“數據成品”全鏈條打通,全方位賦能AI開發中數據引入這一環節。通過建立數據產品、數據處理工具與數據服務的“三螺旋”,為智能駕駛、智慧城市、智能家居、智慧金融等行業提供高效率、高質量、多維度、場景化的數據服務與策略,最大化發揮訓練數據的價值。
同時,云測數據以技術創新加速行業發展為己任,通過推出“云測數據標注平臺”、“AI數據集管理系統”等技術成果,為AI相關企業提供處理大規模感知數據的能力,通過結構創新、智能化、工程化、標準化的標注平臺產品賦能AI訓練數據行業,極大地加速了人工智能相關應用的落地迭代周期,節省大量研發時間和成本,進而推進AI產業的場景化落地。
隨著算法模型、技術理論和應用場景的優化和創新,AI產業對訓練數據的拓展性需求和前瞻性需求均快速增長。行業內對訓練數據需求類型的增加以及對服務標準要求的提高,產業鏈的專業化分工將愈加清晰。AI訓練數據作為人工智能的“老師”,成為訓練機器的關鍵手段,專業化的訓練數據服務提供商將扮演更加重要的角色。






