算法、算力、數據是AI核心三要素,當前階段,人工智能正處于高速增長期,加速滲透到各行各業。結構化數據作為人工智能快速發展的重要基石,在人工智能核心產業發展的催化下基礎數據服務行業應運而生,該行業和市場也隨著人工智能產業的商業化落地保持高速增長,德勤預計,2027年市場規模有望達到130-160億元。
與此同時,智能制造、元宇宙、自動駕駛、生成式AI等復雜智能場景的實現,對人工智能基礎數據服務提出了更高的要求。德勤調研分析顯示,標注復雜化、標注自動化、全棧式服務以及愈加嚴格的數據合規需求是AI基礎數據服務市場的四大趨勢。
AI基礎數據服務是指為各業務場景中的AI算法訓練與調優而提供的數據庫設計、數據采集、數據清洗、數據標注與數據質檢服務。整個基礎數據服務流程圍繞著客戶需求而展開,產品以數據集與數據資源定制服務為主,為AI模型訓練提 供可靠、可用的數據。數據集主要滿足基本的模型開發需求,定制服務則為滿足算法訓練與調優的特定要求。
對于如何充分發揮AI數據對人工智能產業落地的價值,云測數據總經理賈宇航認為,一是加強場景化數據的能力,換言之就是為人工智能細分場景的落地,提供更加垂直且豐富的數據,滿足其長尾場景的需求;二是提升數據標注的準確性,從工具、規則、流程的開發制定,到標注人員的素質培養,從細節提升數據標注準確性;三是充分發揮“底層技術+服務能力”的力量,具備更深刻的行業領域知識、更懂場景、更懂技術、更具行業前瞻性。
云測數據是國內高質量AI數據服務企業代表,也是徳勤《人工智能基礎數據服務白皮書》“產業鏈圖譜”中的代表廠商。與其他數據標注公司不同的是,云測數據在早期就已關注到AI數據服務的需求缺口和潛在的應用市場,立足高質量、場景化的AI訓練數據服務,通過數據產品、數據處理工具與數據服務的“三螺旋”,為人工智能落地場景提供高效率、高質量、多維度、場景化的數據服務與策略,持續為計算機視覺、語音識別、自然語言處理、知識圖譜等AI主流技術領域提供高價值數據支持。
據云測數據總經理介紹,云測數據通過數據采集、數據清洗、數據標注等方式為企業業務引入AI數據治理,以標準API接口支持數據導入和導出,支持已有算法預標注功能,可以提供多項數據產品應用和數據服務,助力多個行業實現智能化轉型和業務流程高效處理。其中,自動駕駛、智慧城市、智能家居、智慧金融、零售貨檢等領域已經具備成熟化的應用實踐,云測數據正在與各行各業進行業務流程對接,助力實現更多行業的人工智能產業化落地,為各行業數智化轉型筑牢地基。