Waymo無人車是如何進(jìn)行行為預(yù)測的?
本文介紹了waymo行為預(yù)測算法VectorNet。
在交通場景中,各個道路使用者(車輛、自行車、行人等)的行為充滿了不確定性,對于這些行為的預(yù)測也應(yīng)是概率的而非確定性的。
優(yōu)秀駕駛員的關(guān)鍵素質(zhì)之一是能夠預(yù)見和預(yù)測道路上其他人可能會做什么。例如,另一輛車并入我們的車道或我們前面的騎自行車的人左轉(zhuǎn)的可能性是多少?能夠準(zhǔn)確預(yù)測其他道路使用者的意圖的能力,可以使無人車做出最安全的決策。
其他道路參與者的行為往往很難預(yù)測,通常需要對交通場景有一個整體的了解,包括車道的寬度,四向交叉路口規(guī)則,交通信號燈和標(biāo)志等。
預(yù)測模塊往往要承接感知、定位、地圖模塊,通過預(yù)測算法,可以給出障礙物未來的運(yùn)動軌跡,輸出給下游規(guī)劃模塊。
盡管行為預(yù)測大致思路是相同的,但是不同研究者在算法等方面的考量還是有很大差別的。本文來介紹一下Waymo是如何做的。
Waymo通過高精地圖與傳感器的實(shí)時信息相結(jié)合,為車輛提供語義環(huán)境。其他道路使用者的行為通常很復(fù)雜,并且很難用一組基于地圖的交通規(guī)則來描述,因?yàn)轳{駛模式在不同位置之間會有所不同,并且其他道路使用者可能會違反這些規(guī)則。所以,需要通過機(jī)器學(xué)習(xí)來使系統(tǒng)學(xué)習(xí)新的行為類型來建模并降低這種復(fù)雜性。
而研究駕駛行為預(yù)測,必然涉及道路網(wǎng)絡(luò)建模,即道路的拓?fù)浣Y(jié)構(gòu)。
將高度詳細(xì)的地圖合并到行為預(yù)測模型中的最流行方法是通過將地圖渲染為像素并使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)對場景信息(例如交通標(biāo)志,車道和道路邊界)進(jìn)行編碼。但是,此過程需要大量的計算和時間。此外,將地圖作為圖像處理會給建模長距離幾何圖形(例如前方合并的車道)帶來挑戰(zhàn),這會影響預(yù)測的質(zhì)量。
為了解決這些痛點(diǎn)并更好地預(yù)測他人的行為以做出更好的決策,Waymo 開發(fā)了一種新的模型VectorNet,與CNN相比,該模型可提供更準(zhǔn)確的行為預(yù)測,同時使用更少的計算量。
VectorNet如何啟用Waymo驅(qū)動程序
地圖要素和傳感器輸入都可以簡化為點(diǎn),多邊形或曲線。例如,車道邊界包含多個建立樣條曲線的控制點(diǎn);人行橫道是由多個點(diǎn)定義的多邊形;停車標(biāo)志由單點(diǎn)表示。曲線,多邊形和點(diǎn)都可以近似表示為包含多個控制點(diǎn)的折線。折線進(jìn)一步分成矢量片段。這樣,我們可以將所有道路特征和其他對象的軌跡表示為此類矢量的集合。借助這種簡化的視圖,waymo著手設(shè)計了一種可以有效處理傳感器和地圖輸入的網(wǎng)絡(luò)。
這是一種新穎的層次圖神經(jīng)網(wǎng)絡(luò):在第一級(由折線子圖組成)中,VectorNet 收集每條折線內(nèi)的信息;在第二層(稱為全局交互圖)中,VectorNet 在折線之間交換信息。
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
圖片新聞
技術(shù)文庫
最新活動更多
推薦專題
- 1 2025上海車展看什么?看這一篇就夠了!
- 2 關(guān)稅大戰(zhàn),汽車芯片會漲價嗎
- 3 工信部召開智能網(wǎng)聯(lián)汽車產(chǎn)品準(zhǔn)入及軟件在線升級管理工作推進(jìn)會提的內(nèi)容,將如何影響智駕行業(yè)發(fā)展?
- 4 地平線智駕方案軟硬結(jié)合,大眾、保時捷的合作紛至沓來
- 5 高呼的“全民智駕”真的做到“全民”了嗎?
- 6 一季度汽車產(chǎn)量省份排名大洗牌!誰在異軍突起?
- 7 奇瑞的混動技術(shù):厚積薄發(fā),從發(fā)動機(jī)到混動系統(tǒng)
- 8 東風(fēng)+華為,還是華為借東風(fēng)?華為ADS3.0技術(shù)詳解
- 9 工信部對浮躁的智駕說“不”
- 10 重要信號!奇瑞汽車IPO背后大佬現(xiàn)身海信集團(tuán)