引:算法商城是偽命題嗎?
同樣都是成熟算法,為什么有的落地后精度低于10%,有的卻能達到90%以上?
隨著碎片化AI需求的涌現,市場上出現越來越多“算法商城”,給客戶提供“點單-交貨-支付”的輕型算法服務,讓“買算法”就像“下載APP”一樣簡單。
但落地到現實中,開篇的問題就出來了。帶著這些疑問,我們今天來聊一聊,與共達地AutoML、智慧工地、AI算法商城有關的案例。
“南水北調”路上的困境
案例發生在“南水北調”河北路段某工地上。
客戶想對工人是否佩戴安全帽、是否穿著反光衣進行識別。
無需贅述,這個需求不論對于人工智能領域還是智慧工地領域,都是“老熟人”。市面上有大量“安全帽識別”、“反光衣識別”類成熟算法,在整個智慧工地建設中,也屬于末端小需求。
但就是在這個末端小需求上,翻了車。
最初,客戶采購了市面上某AI廠商算法商城中的成熟算法,順利部署到應用場景后,精度竟然不足10%——用客戶的話說,滿屏誤報,讓人瞠目結舌。
雙方開始排查問題,迭代算法。
事情并不復雜,該算法商城提供的成熟算法,在常規場景下,準確率確實能達到商用水平,但實際應用場景卻并不常規。一是攝像頭距離被被識別物非常遠,且變焦球機來回運動,被識別的安全帽和反光衣都變成了“極小目標”;二是識別場景是在夜間,算法“看到”的數據特征與訓練算法時所使用的數據特征千差萬別。
由此,應用場景識別準確率低于10%也就不奇怪了。
現場實景:識別對象距攝像頭較遠
后面的迭代之路漫長且艱辛。
對于這家AI廠商而言,客戶要的并不是常規的安全帽識別、反光衣識別,需要安排專門的算法工程師團隊就夜間場景特征重新迭代算法,這場合作也就不是“下載算法”型的輕量交易,而是堆人頭、堆工時的重型算法定制。
客戶的感受也很糟糕。早期的滿口承諾被滿屏誤報狠狠打臉。重新迭代算法還要配合提供近萬張圖片,既沒有專門的人力支持,也沒有懂行的專家,新增的工期和成本更是讓人一肚子怨氣。合作陷入了僵局。
案例梳理到這里,AI落地過程中的幾個大坑已經浮現了:
一、業務壁壘。懂算法的人不懂場景,懂場景的人不懂技術,導致明明可以在前期說明的應用風險沒有被及時識別,為合作埋下隱患。
二、場景適配。通過預訓練大量算法,打造算法商城,填補市場上的算法供應空白,擴大人工智能的應用邊界,這是一個很好的思路。但事實上,不存在真正“成熟”的算法,或者說,成熟的算法必然是不斷“成長”的算法。所以,適配碎片化場景時,是否支持高效、輕量的“適當定制”,成為算法商城的一道坎。
三、算法產能。當問題進入到“定制”環節時,就需要重新拷問傳統堆人頭、堆工時生產算法的模式,在效率、成本上是否能跟上客戶需求了。目前市場給出的答案是否定的。
對于這一點,深度參與這個項目的AI”老炮“吳先生深有感觸:“我們在一線市場上,看到越來越多政企客戶的招標書中,主動把AI作為重點建設內容,這是以前所沒有的場景。當新的客戶、新的需求冒出來時,如果你一套算法研發周期動輒幾個月,成本上百萬,客戶根本接受不了,更不用說扛過試用階段,往二期、三期推。”
夜間場景
所以,分析完這些問題,一個清晰的結論浮現出來:當前人工智能應用環節中的問題,歸根結底還是算法供給端的結構性問題——AI算法生產工具低效、生產模式落后所導致的問題,今天在智慧工地上可能是精度驟降,明天可能是工期漫長,后天則可能是硬件適配問題——源頭的癥結在表層可以有千萬種展現,我們要去解決根本問題。
更簡單但更強大,可能嗎?
共達地接觸這個項目時,工期已經變得非常緊張,于是我們采取了“摸著場景過河”的策略。
在共達地的算法商城里,也有“成熟”的安全帽識別算法和反光衣識別算法。于是,初期我們也把這些算法部署到應用場景,也取得了極低的識別準確率,不到70%。
但主菜在后面。共達地的項目經理分析了常見誤報,主要來源于兩類場景:一是被識別物與攝像頭較遠,低于識別的基本像素要求;二是容易將“像”安全帽的物品誤識別為安全帽,尤其是當場景復雜、光線變化時。
于是,共達地的項目經理一方面對系統誤報進行重新標注,手動糾正算法的重點錯誤;另一方面登錄前端盒子,采集現場真實視頻流,進行針對性地數據補充和喂養。然后以一天一個版本的速度進行算法迭代,終于在5天迭代3個版本后,實際應用場景的算法精度超過95%,達到客戶的要求。
共達地算法的應用效果
這個過程講起來特別簡單,但越是簡單的事物,背后越是有一套龐大的支持系統。大家可能已經留意到幾個關鍵指標:
一是在數據補充和優化方面,似乎沒有遇到太多障礙。
在傳統的算法定制模式中,需要上千近萬張圖片,才能喂養出一個精度較高的算法。但對于大部分傳統產業客戶而言,既無法提供足量照片,也無法提供有力的人員支持。
所以,共達地在技術層面,支持基于較小樣本的算法訓練;在策略上,支持異地采集,第三方標注服務,通過小步快跑的方式,讓算法基于場景迭代、生長。在這個案例中,每次迭代優化500-1000張圖片,三次迭代下來也只處理了不超過3000張圖片,加上與曼孚、數據堂等數據服務機構的合作,極大地提高了效率。
二是成熟算法的輕量定制過程十分流暢。
客戶與原AI廠商的合作之所以難以推進,主要在于重新定制算法將耗費大量人力和時間。這是傳統AI生產模式的客觀現實。
共達地的差異點在于,無論是算法商城中的“成熟”算法,還是部署到應用場景后算法的持續迭代,都是基于共達地AutoML自動化AI訓練平臺完成的。也正是因為平臺完成了原本依賴人力的80%的工作,所以才能讓算法以天為單位迭代。
三是不僅交付效率高,人員投入還少。
在項目對接和交付過程中,主要由共達地項目負責人主導,沒有算法工程師的參與,客戶全程幾乎零人員投入——這是許多AI廠商和產業客戶共同期盼的分工方式。
這種分工背后,除了共達地AutoML自動化AI訓練平臺承擔了80%的“黑盒”工作外,還有數據處理環節,曼孚、數據堂等專業服務服務機構的加入,讓工作效率提升了許多;同時部署環節百余款主流芯片的提前適配,也讓工時縮短了數月。
正是背后這一整套復雜系統,支撐了業務環節的簡單交付。
定制VS標品
回到最初的問題:同樣是算法商城,各家到底有什么區別?
事實上在這個案例中,共達地交付的不只是一款算法,而是一整套“軟件平臺+硬件設備+生態服務”的閉環能力。
在這個體系下,不論這個項目負責人來自共達地,還是集成商、政企客戶,都不重要。因為“生產算法”這項工作,已經從高度依賴從業者的專業算法知識儲備,變成僅僅需要了解業務需求和操作流程。這就像許多復雜儀器的生產,從老師傅手工打磨,進化為工業流水線。工人只需要知道如何操作機器,就具備了出色交付的基礎。
而在這套能力內,軟件、硬件、生態各個環節是互相扣合、依存的。當我們談論“產業+AI”時,AI算法的大規模、高效率供應只是一方面,更重要的是,當原本離AI較遠的傳統產業,涌現出大量需求時,整個AI產業是否能及時提供客戶隨時可獲得、到手即可用、應用成本低、全程服務支持的完整能力。
在這一點上,共達地的算法商城解決的是產能供應問題,與硬件、芯片、數據服務商等的生態合作,解決的是落地鏈路問題。
共達地:AI as a service
對于這種變化,AI”老炮“吳先生的評價是”先行者“。吳先生見過太多”黃掉“的需求,背后的原因也無外乎成本高、周期長、技術不穩定——這些都是AI落地的頑疾,也無一不依賴生態上的整合,如果這些問題不能被硬核地解決掉,就只能讓AI賦能的夢想被湮沒。
當整個完整生態聚合到一起時,客戶不需要額外購買硬件、不需要費時費力處理數據,不需要為軟硬件適配問題所導致的工時和人力成本買單,所有這些能在上游供應端通過合作共贏解決的問題,都不會流到下游成為客戶的爛攤子。
也只有在有了生態支撐后,算法商城的輕型交付才具備了可行性。算法商城作為中轉站,一方面承接基于AutoML自動化AI訓練平臺生產的海量算法,另一方面作為與產業客戶溝通的平臺。當客戶選中某一款算法時,根據應用場景特征,數據服務前置到算法迭代過程中,硬件服務前置到算法部署環節中,產生基于標品的輕量定制——“標品”負責拓展AI與產業融合的邊界,“定制”負責落地過程的絲滑適配,讓算法商城從“死的算法交付”,變為“活的算法服務”,或許才能真正撓中產業客戶真正的癢點。