日前,第25屆國際模式識別會議(ICPR2020, International Conference on Pattern Recognition)正在意大利以線上的方式舉行,各項挑戰(zhàn)賽的結(jié)果也陸續(xù)公布。深蘭科技DeepBlueAI團(tuán)隊,一舉斬獲“大規(guī)模商品識別挑戰(zhàn)賽”和“圖表信息提取競賽”兩項冠軍,以及“EndoTect 胃腸道疾病自動檢測競賽”中兩個賽道的亞軍,既驗證了技術(shù)實力,又為新零售、電商、醫(yī)療等領(lǐng)域提供了高效的解決方案。深蘭科技也將在2021年,持續(xù)以人工智能技術(shù)為抓手,踐行為各行業(yè)輸送養(yǎng)分的“沃土”的理念。
作為模式識別的國際重要會議,已有50年歷史的ICPR涵蓋了計算機(jī)視覺、圖像、聲音、語音、傳感器模式處理和機(jī)器智能等領(lǐng)域。本次會議的重量級競賽——“大規(guī)模商品圖像識別挑戰(zhàn)賽”由ICPR 2020、Kaggle和JDAI等聯(lián)合舉辦,要求參賽者對產(chǎn)品圖片的細(xì)粒度分類提供解決方案,積極推動電商及新零售行業(yè)的發(fā)展。深蘭科技Deep BlueAI團(tuán)隊勇奪冠軍。

隨著互聯(lián)網(wǎng)技術(shù)和電子商務(wù)的迅猛發(fā)展,網(wǎng)購已成為主流的購物方式,如何快速地從圖像和視頻中自動識別出產(chǎn)品存貨單元(SKU)級別的類別,并解決SKU級別的產(chǎn)品在視覺上相似、必須進(jìn)行細(xì)粒度分類的需求,成為人工智能零售系統(tǒng)亟待完善的問題。JDAI構(gòu)建了一個名為Products-10K的產(chǎn)品識別數(shù)據(jù)集,包含了約10000種經(jīng)常被中國消費(fèi)者購買的產(chǎn)品。挑戰(zhàn)賽則基于該數(shù)據(jù)集展開,具有每個類別的數(shù)據(jù)量相對較少,并且類內(nèi)間距大、類間間距小的特點,給分類帶來了巨大的挑戰(zhàn)。
DeepBlueAI團(tuán)隊針對大規(guī)模細(xì)粒度商品圖像識別任務(wù),通過數(shù)據(jù)分析、數(shù)據(jù)增強(qiáng)、網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計以及Loss改進(jìn)等方法,設(shè)計了一個簡易的細(xì)粒度圖像識別算法。該算法取得了Public & Private第一名的成績,并領(lǐng)先第2名兩個百分點,有望幫助人工智能零售系統(tǒng)快速并準(zhǔn)確地從圖像和視頻中自動識別出SKU級別的類別,優(yōu)化消費(fèi)者的購物體驗。據(jù)悉,同類方案已在深蘭AI自販柜中得以使用。用戶通過掃描手脈,開門拿取商品、關(guān)門結(jié)算扣費(fèi),能實現(xiàn)猶如在冰箱準(zhǔn)確取物的消費(fèi)體驗,其中對產(chǎn)品識別精確度的要求非常之高。
“圖表信息提取競賽”則由7個子賽題組成,任務(wù)涵蓋圖表分類、圖表文本識別、文本功能分類、軸分析、圖例分析、圖元素提取等。對于每個子賽題,比賽按照數(shù)據(jù)集又分為UB PMC與Adobe Synth兩個賽道,每個賽道單獨計分,最終按照每個子賽題的得分總和進(jìn)行排名。在該比賽的多個任務(wù)中,數(shù)據(jù)類別存在著分布極為不均衡的問題。聯(lián)想、華南理工、合合等隊伍參加了本次競賽,DeepBlueAI團(tuán)隊最終拿下4個賽道冠軍,以總分35分拿到總成績第一名,獲得本次比賽的總冠軍。
“EndoTect 胃腸道疾病自動檢測競賽”,具有極大的社會意義。胃腸道檢查通常使用內(nèi)窺鏡,這個方法高度依賴操作人員的技能和經(jīng)驗,可能造成人為誤差。競賽則意欲通過模式識別技術(shù),幫助醫(yī)生通過在內(nèi)窺鏡檢查過程中進(jìn)行實時自動框架分析,提高發(fā)現(xiàn)病變的幾率。DeepBlueAI參加了競賽三個賽道中的兩個,數(shù)據(jù)集分布不均衡、多種類別類間間距小,息肉大小相差較大且形狀不規(guī)則等實際情況,為比賽增加了不小的難度。最終,團(tuán)隊在賽道一“對23種常見消化系統(tǒng)疾病的腸鏡圖片分類”,以及賽道三“對常見的消化系統(tǒng)疾病息肉進(jìn)行分割”中均獲得亞軍。
ICPR2020吸引了來自56個國家和地區(qū)的科研人員或機(jī)構(gòu),產(chǎn)生了諸多有價值的論文和解決方案,為各領(lǐng)域提供了新的想法和合作機(jī)會。未來,深蘭科技將持續(xù)在計算機(jī)視覺領(lǐng)域推動核心技術(shù)的研發(fā)及創(chuàng)新,并不斷擴(kuò)展技術(shù)成果的應(yīng)用落地,使人工智能更貼近民生、服務(wù)大眾。






