2020年8月,全球計算機三大頂級會議之一ECCV 2020以線上的形式正式舉行,深蘭科技DeepBlueAI團隊包攬了GigaVision 2020挑戰(zhàn)賽圖像多類別目標檢測和視頻多目標跟蹤雙賽道冠軍,有力推動了十億級像素圖像和視頻的目標檢測技術(shù)的發(fā)展。
據(jù)了解,此次深蘭科技獲得雙冠的GigaVision 2020挑戰(zhàn)賽,是由清華大學(xué)基于其新推出的數(shù)據(jù)集PANDA而組織的,PANDA是全球首個十億像素級別視頻數(shù)據(jù)集。過去十年中,行人檢測、跟蹤、動作識別、異常檢測、屬性識別等以人為中心的計算機視覺分析任務(wù)引起了人們的極大關(guān)注,為了促進新的算法來理解大規(guī)模現(xiàn)實世界場景中復(fù)雜的人群活動及社交行為,可將圖像放大千倍的十億級別像素目標檢測,將在例如人臉識別、無人駕駛、監(jiān)控安防和智能手機等多個領(lǐng)域被廣泛應(yīng)用。
GigaVision 2020挑戰(zhàn)賽的任務(wù)為兩類經(jīng)典的視覺任務(wù):圖像多類別目標檢測和視頻多目標跟蹤,任務(wù)一為行人和車輛檢測,任務(wù)二則需要提取行人在視頻中的軌跡。在PANDA上進行檢測必須同時解決準確性和效率問題,準確性受到明顯的目標尺度變化和復(fù)雜遮擋的挑戰(zhàn),而效率則受到十億像素級別分辨率的極大影響。同時,巨大的同類目標尺度變化、對長時間長距離追蹤的需求和行人擁擠、相互遮擋的復(fù)雜場景更帶來了嚴峻挑戰(zhàn)。深蘭科技DeepBlueAI團隊在檢測賽道將任務(wù)解耦為多個子任務(wù),把難點獨立出來重點解決,并根據(jù)以往檢測經(jīng)驗,通過所積累的模塊和方法,使得結(jié)果有了進一步的提升。最終,第二、三名只有千分之幾的分差,而DeepBlueAI團隊的最好成績領(lǐng)先第二名2.6個百分點,強勢獲得冠軍。
據(jù)悉,除此以外,DeepBlueAI團隊還在VIPrios系列賽、Visdrone系列賽中獲得了2個亞軍和4個季軍,一舉囊括8個大獎。值得一提的是,該團隊在由谷歌于Kaggle平臺上舉辦的ECCV挑戰(zhàn)賽Google Landmark Retrieval 2020上也收獲了一枚金牌。
附獲獎名單:
VIPriors Image Classification Challenge 亞軍
該賽題是一個圖像分類任務(wù),難點是如何不使用任何預(yù)訓(xùn)練模型從頭開始訓(xùn)練,主要目標是如何在ImageNet的子集上獲得最高的準確率。
Visdrone-task3 Multi-Object Tracking 亞軍
該賽題要求基于無人機視角拍攝的視頻,進行多類別多目標跟蹤任務(wù),DeepBlueAI團隊基于Tracking-by-detection的方法,逐步優(yōu)化檢測器、特征提取器、數(shù)據(jù)關(guān)聯(lián)。
VIPriors Object Detection Challenge 季軍
該賽題的數(shù)據(jù)集是部分MSCOCO數(shù)據(jù)集,賽題任務(wù)是是利用少量數(shù)據(jù)集在不使用任何預(yù)訓(xùn)練模型的基礎(chǔ)上,進行80個類別的目標檢測。
VIPriors Action Recognition Challenge 季軍
此為動作識別挑戰(zhàn)賽,需要從頭訓(xùn)練模型以完成基于UCF101數(shù)據(jù)集101種動作識別任務(wù)。
Visdrone-task1 Object Detection 季軍
該賽題要求基于無人機視角拍攝的圖片,對車輛、行人等目標進行定位分類,DeepBlueAI團隊基于CascadeRCNN的方法,逐步優(yōu)化數(shù)據(jù)增強方法、特征提取器、后處理等。
OpenEDS Sparse Semantic Segmentation Challenge 季軍
該賽題要求基于VR設(shè)備內(nèi)部拍攝到的眼睛圖片,將眼睛關(guān)鍵區(qū)域分割成鞏膜,虹膜,瞳孔,參賽過程中,DeepBlueAI團隊基于Unet結(jié)構(gòu),并結(jié)合了數(shù)據(jù)增強,注意力機制等方法。
Google Landmark Retrieval 2020 Kaggle金牌
該賽題要求參賽者對收集到的大量地標建筑物圖像進行檢索,DeepBlueAI團隊基于Global feature、優(yōu)化數(shù)據(jù)增強、特征提取網(wǎng)絡(luò)等方法,最終取得金牌一枚。