谷歌提出Context R-CNN, 利用時域上下文信息的增強目標(biāo)檢測系統(tǒng)
這種方法超過了僅僅使用單幀圖像的FasterR-CNN方法,在多個生態(tài)環(huán)境圖像檢測領(lǐng)域內(nèi)都具有明顯的優(yōu)勢。研究人員已將模型整合到TF Object Detection API中,為相關(guān)研究人員提供更為簡化的訓(xùn)練和部署。
上圖中顯示了上下文信息(長達(dá)一個月)是如何幫助專家確定模糊場景中的動物的。上下文中目標(biāo)形狀、尺寸、每天固定的食草時間幫助算法確定這是角馬。
上下文R-CNN模型
上下文R-CNN主要利用靜態(tài)相機拍攝圖像序列間的高度相關(guān)性,在無需額外人工標(biāo)注數(shù)據(jù)的情況下提升算法在復(fù)雜情況下的性能,同時改善在新的相機設(shè)置下的泛化性。與Faster R-CNN類似,它也采用了兩階段目標(biāo)檢測架構(gòu)。
上圖顯示了上下文R-CNN的頂層架構(gòu),顯示了檢測模型與長期上下文信息如何有效系統(tǒng)提升性能。
為了抽取某一相機的上下文信息,研究人員首先利用參數(shù)固定的特征抽取器從較大的時間跨度中構(gòu)建出上下文存儲空間(下圖中M);隨后每幅圖像在對應(yīng)上下文信息聚合的幫助下,上下文R-CNN將會更好地在復(fù)雜情況下對目標(biāo)進(jìn)行檢測(包括低光、濃霧、模糊等場景)。這種聚合利用attention方式實現(xiàn),它對靜態(tài)相機中出現(xiàn)的稀疏和非規(guī)則采樣具有較好的魯棒性。
第一階段的Faster R-CNN將提出潛在目標(biāo),而第二階段將對每個候選目標(biāo)進(jìn)行分類。在Context R-CNN中針對第一階段的候選目標(biāo),使用基于相似性的注意力機制來確定當(dāng)前目標(biāo)與記憶池中特征的相關(guān)性。隨后利用相關(guān)性權(quán)重加權(quán)記憶池中的特征來構(gòu)建針對這一目標(biāo)的上下文特征,并將其添加到原始的目標(biāo)特征后,送入第二階段的Faster R-CNN中進(jìn)行最終的分類。
Context R-CNN將近一個月的上下文信息用于幫助分類當(dāng)前目標(biāo)。綠色數(shù)字顯示了每個記憶特征與當(dāng)前目標(biāo)的注意力相關(guān)性權(quán)重。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-6.16立即報名>> 【在線會議】Solution Talks |Computex 2025關(guān)鍵趨勢深讀
-
6月20日立即下載>> 【白皮書】精準(zhǔn)測量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報名中>> 全數(shù)會2025(第六屆)機器人及智能工廠展
-
7月31日免費預(yù)約>> OFweek 2025具身機器人動力電池技術(shù)應(yīng)用大會
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 9 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單
- 10 為何全球AI巨頭都在搶?MCP協(xié)議背后的暴富玄機大公開!