CVPR2020|深蘭科技挑戰(zhàn)復雜場景,獲霧天條件目標檢測挑戰(zhàn)賽冠軍
03賽題特點&主要工作
在這次挑戰(zhàn)賽中,主要的難點包含以下幾個方面:
1.可視條件差、圖像模糊
可視條件差是這個賽道核心問題,霧天收集的數(shù)據(jù)特點就是能見度低,圖像模糊,遠處的物體不容易被檢測與識別,容易造成大量的目標漏檢、誤檢,從而導致mAP效果下降。
2.圖片數(shù)量少,數(shù)據(jù)分布不平衡
總共只有4000多張帶標注的圖片,增加了訓練難度,再加上數(shù)據(jù)分布的不均衡,很難劃分一個具有代表性的驗證集,很可能導致模型不具有泛化能力,在新的測試集上表現(xiàn)會不如預期。
檢測器
我們先通過常規(guī)檢測所累積的經(jīng)驗構(gòu)造出一個baseline:
Baseline=Backbone+DCN[1]+FPN[2]+CascadeRCNN[3]
這套pipeline,也是去年冠軍團隊所使用的方法,在這里我們沿用這套算法,以此為基礎(chǔ)進行改進。
通過觀察實驗結(jié)果發(fā)現(xiàn),模型誤檢情況遠多于漏檢,經(jīng)常出現(xiàn)一個目標有多個檢測結(jié)果,并且這些檢測結(jié)果之間無法使用nms去除。歸納為兩方面原因。
1.模型自身能力不足,回歸分類能力差,導致大量誤檢;
2.負樣本不足,由于樣本個數(shù)限制,模型會在一些模棱兩可的地方檢測出置信度較高的結(jié)果,無法通過閾值去處理這些誤檢結(jié)果。
根據(jù)目前結(jié)果做了一下幾個方面的改進:
1.DoubleHeads[6]
當需要提升模型能力時,有2個比較簡單高效的方法,一是使用更強的backbone,二是提高RCNN中分類檢測head的能力,通過實驗比對,我們最終使用了doublehead的結(jié)構(gòu)(如下圖所示)。
▲DoubleHeads
Doublehead采用分而治之的思想,將原始head解耦為2個獨立的分支,針對不同的需求設(shè)計head結(jié)構(gòu),通過對比實驗可發(fā)現(xiàn):使用FC-h(huán)ead做分類,Conv-h(huán)ead做回歸,可以得到最好的效果。
因為分類更多地需要語義信息,所以使用全連接層。而坐標框回歸需要更多的空間信息,因此使用卷積層。當然這種方法會增加計算量。在平衡速度和準確率的情況下,最終我們選擇了3個殘差2個Non-local共5個模塊。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 9 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單
- 10 “搶灘”家用機器人領(lǐng)域,聯(lián)通、海爾、美的等紛紛入局