自動(dòng)駕駛領(lǐng)頭羊Waymo十周年奉獻(xiàn):Auto ML機(jī)器學(xué)習(xí)【PDF】
美國(guó)當(dāng)?shù)貢r(shí)間1月16日,全球自動(dòng)駕駛領(lǐng)頭羊Waymo,發(fā)布了十年周年慶祝短視頻,并且在官方博客上發(fā)布了關(guān)于“Auto ML(Auto Machine Learning)”的文章,深度剖析了Auto ML與Google AI大腦,是如何幫助Waymo發(fā)展自動(dòng)駕駛技術(shù)的。
在Waymo的官方推特上寫(xiě)著:十年前的這個(gè)星期,“項(xiàng)目司機(jī)”正式成立,其使命是改善道路安全,使交通更加便利。從這個(gè)“登月”項(xiàng)目,到谷歌自動(dòng)駕駛汽車項(xiàng)目,現(xiàn)在是Waymo,一起為下一個(gè)十年及更遠(yuǎn)的將來(lái)而努力!
下面是關(guān)于Auto ML的文章,在Waymo,機(jī)器學(xué)習(xí)幾乎在自動(dòng)駕駛系統(tǒng)的每個(gè)部分都扮演著關(guān)鍵角色。它幫助我們的汽車看清周圍的環(huán)境,理解世界,預(yù)測(cè)他人的行為,并決定他們下一步的最佳行動(dòng)。
以感知為例,Waymo的系統(tǒng)采用了神經(jīng)網(wǎng)絡(luò)的組合,使Waymo的車輛能夠解讀傳感器數(shù)據(jù)、識(shí)別物體,并隨著時(shí)間的推移跟蹤它們,從而對(duì)周圍的世界有一個(gè)深入的了解。
創(chuàng)建這些神經(jīng)網(wǎng)絡(luò)通常是一項(xiàng)耗時(shí)的任務(wù):優(yōu)化神經(jīng)網(wǎng)絡(luò)架構(gòu),以達(dá)到自動(dòng)駕駛汽車運(yùn)行所需的質(zhì)量和速度,是一個(gè)復(fù)雜的微調(diào)過(guò)程,Waymo工程師可能需要數(shù)月時(shí)間來(lái)完成一項(xiàng)新任務(wù)。
現(xiàn)在,通過(guò)與來(lái)自Google AI大腦的研究人員合作,Waymo正在將前沿研究付諸實(shí)踐,以自動(dòng)生成神經(jīng)網(wǎng)絡(luò)。更重要的是,這些最先進(jìn)的神經(jīng)網(wǎng)絡(luò)比那些由工程師手工調(diào)整的神經(jīng)網(wǎng)絡(luò)質(zhì)量更高、速度更快。
為了將Waymo的自動(dòng)駕駛技術(shù)應(yīng)用到不同的城市和環(huán)境中,需要針對(duì)不同的場(chǎng)景快速優(yōu)化Waymo的模型。Auto ML使Waymo能夠做到這一點(diǎn),高效和連續(xù)地提供大量ML解決方案。
01
遷移學(xué)習(xí):使用現(xiàn)有的自動(dòng)化架構(gòu)
Waymo和Google AI大腦的合作始于一個(gè)簡(jiǎn)單的問(wèn)題:Auto ML能否為汽車生成高質(zhì)量、低延遲的神經(jīng)網(wǎng)絡(luò)?
質(zhì)量衡量的標(biāo)準(zhǔn)是由神經(jīng)網(wǎng)絡(luò)產(chǎn)生的答案的準(zhǔn)確性,延遲度量網(wǎng)絡(luò)提供答案的速度,也稱為推理時(shí)間。由于駕駛是一種活動(dòng),它要求車輛使用實(shí)時(shí)答案,并且考慮到系統(tǒng)的安全性,神經(jīng)網(wǎng)絡(luò)需要在低延遲的情況下運(yùn)行。大多數(shù)網(wǎng)絡(luò)直接運(yùn)行在Waymo的車輛上,結(jié)果少于10毫秒,這比部署在數(shù)千臺(tái)服務(wù)器上的數(shù)據(jù)中心中的許多網(wǎng)絡(luò)要快。
在原來(lái)的Auto ML論文(Learning Transferable Architectures for Scalable ImageRecognition PDF),谷歌AI的員工能夠自動(dòng)探索12000多個(gè)架構(gòu)解決CIFAR-10的經(jīng)典圖像識(shí)別任務(wù):確定一個(gè)小形象代表十個(gè)類別之一,比如買一輛汽車、飛機(jī)、一只狗,等等。
在后續(xù)文章(NEURAL ARCHITECTURE SEARCH WITHREINFORCEMENT LEARNING
PDF),他們發(fā)現(xiàn)了一個(gè)家庭的神經(jīng)網(wǎng)絡(luò)的構(gòu)建塊,稱為NAS單元,這可能是由自動(dòng)構(gòu)建比手工網(wǎng)CIFAR-10和類似的任務(wù)。通過(guò)這種合作,Waymo的研究人員決定使用這些單元來(lái)自動(dòng)構(gòu)建針對(duì)自動(dòng)駕駛?cè)蝿?wù)的新模型,從而將CIFAR-10上的知識(shí)轉(zhuǎn)移到汽車領(lǐng)域,第一個(gè)實(shí)驗(yàn)是語(yǔ)義分割任務(wù):識(shí)別激光雷達(dá)點(diǎn)云中的每個(gè)點(diǎn),如汽車、行人、樹(shù)等。
圖一:一個(gè)NAS單元的例子,這個(gè)單元在神經(jīng)網(wǎng)絡(luò)中處理前兩層的輸入
為此,Waymo研究人員建立了一個(gè)自動(dòng)搜索算法,在卷積網(wǎng)絡(luò)架構(gòu)(CNN)中探索數(shù)百種不同的NAS單元組合,為Waymo的激光雷達(dá)分割任務(wù)訓(xùn)練和評(píng)估模型。當(dāng)Waymo的工程師手工調(diào)整這些網(wǎng)絡(luò)時(shí),只能探索有限數(shù)量的架構(gòu),但是使用這種方法,可以自動(dòng)探索了數(shù)百個(gè)架構(gòu)。
相比以前的人工微調(diào)優(yōu)化神經(jīng)網(wǎng)絡(luò),Auto ML通過(guò)下面兩種方式來(lái)改進(jìn):
一些具有類似質(zhì)量的延遲顯著降低;
其他的則具有更高的質(zhì)量和類似的延遲。
初步成功后,Waymo將相同的搜索算法應(yīng)用于另外兩個(gè)與交通車道檢測(cè)和定位相關(guān)的任務(wù),轉(zhuǎn)移學(xué)習(xí)技術(shù)也適用于這些任務(wù),最后能夠在汽車上部署三個(gè)新訓(xùn)練和改進(jìn)的神經(jīng)網(wǎng)絡(luò)。
十年前的Waymo自動(dòng)駕駛汽車(普銳斯)
02
端到端搜索:從頭開(kāi)始搜索新的架構(gòu)
被最初成功的結(jié)果所鼓舞,接著就是更進(jìn)一步、更廣泛地尋找能夠提供更好結(jié)果的全新架構(gòu),通過(guò)不局限于組合已經(jīng)發(fā)現(xiàn)的NAS單元,可以更直接地尋找考慮到嚴(yán)格的延遲需求的架構(gòu)。
執(zhí)行端到端搜索通常需要手動(dòng)探索數(shù)千個(gè)架構(gòu),這需要大量的計(jì)算成本。探索單一架構(gòu)需要在具有多個(gè)GPU卡的數(shù)據(jù)中心計(jì)算機(jī)上進(jìn)行幾天的培訓(xùn),這意味著搜索單個(gè)任務(wù)需要數(shù)千天的計(jì)算時(shí)間。相反,通過(guò)設(shè)計(jì)了一個(gè)代理任務(wù):一個(gè)縮小的激光雷達(dá)分割任務(wù),可以在幾個(gè)小時(shí)內(nèi)解決。
Waymo團(tuán)隊(duì)必須克服的一個(gè)挑戰(zhàn),是找到一個(gè)與最初的細(xì)分任務(wù)足夠相似的代理任務(wù)。在確定代理任務(wù)上的架構(gòu)質(zhì)量與原始任務(wù)上的架構(gòu)質(zhì)量之間的良好相關(guān)性之前,對(duì)幾個(gè)代理任務(wù)設(shè)計(jì)進(jìn)行了試驗(yàn)。然后,啟動(dòng)了一個(gè)類似于AutoML論文的搜索,但現(xiàn)在是代理任務(wù):一個(gè)端到端代理搜索。這是這個(gè)概念第一次應(yīng)用在激光雷達(dá)數(shù)據(jù)上。
圖二:代理端到端搜索:在一個(gè)縮小的代理任務(wù)上探索數(shù)千個(gè)架構(gòu),將100個(gè)最佳架構(gòu)應(yīng)用于原始任務(wù),驗(yàn)證和部署car上最好架構(gòu)中的最好架構(gòu)。
Waymo使用了幾種搜索算法,對(duì)質(zhì)量和延遲進(jìn)行優(yōu)化,因?yàn)檫@對(duì)車輛非常重要。觀察不同類型的CNN架構(gòu),使用不同的搜索策略,如隨機(jī)搜索和強(qiáng)化學(xué)習(xí),能夠?yàn)榇砣蝿?wù)探索超過(guò)10,000種不同的架構(gòu)。通過(guò)使用代理任務(wù),在谷歌TPU集群上需要一年以上計(jì)算時(shí)間的任務(wù)只需要兩周時(shí)間。
當(dāng)我們剛剛轉(zhuǎn)移了NAS單元,結(jié)果發(fā)現(xiàn)了比以前更好的網(wǎng)絡(luò):
在相同的質(zhì)量下,神經(jīng)網(wǎng)絡(luò)的延遲降低20-30%;
具有更高質(zhì)量的神經(jīng)網(wǎng)絡(luò),錯(cuò)誤率降低8-10%,與以前的架構(gòu)具有相同的延遲。
圖三 :1)第一個(gè)圖展示了在一組簡(jiǎn)單的架構(gòu)上隨機(jī)搜索發(fā)現(xiàn)的大約4000個(gè)架構(gòu)。每個(gè)點(diǎn)都是一個(gè)經(jīng)過(guò)培訓(xùn)和評(píng)估的架構(gòu)。實(shí)線表示不同推理時(shí)間約束下的最佳體系結(jié)構(gòu),紅點(diǎn)表示用轉(zhuǎn)移學(xué)習(xí)構(gòu)建的網(wǎng)絡(luò)的延遲和性能。在這種隨機(jī)搜索中,網(wǎng)絡(luò)學(xué)習(xí)效果不如遷移學(xué)習(xí)。
圖三:2)在第二張圖中,黃色和藍(lán)色的點(diǎn)表示另外兩種搜索算法的結(jié)果。黃色的是對(duì)一組精致架構(gòu)的隨機(jī)搜索。藍(lán)色的那個(gè)使用了強(qiáng)化學(xué)習(xí),就像在[1]中一樣,探索了6000多個(gè)架構(gòu)。它產(chǎn)生了最好的結(jié)果。這兩個(gè)額外的搜索發(fā)現(xiàn),網(wǎng)絡(luò)明顯優(yōu)于遷移學(xué)習(xí)的網(wǎng)絡(luò)。
在搜索中發(fā)現(xiàn)的一些架構(gòu)顯示了卷積、池化和反卷積操作的創(chuàng)造性組合,如下圖所示。這些架構(gòu)最終非常適合最初的激光雷達(dá)分割任務(wù),并將部署在Waymo的自動(dòng)駕駛汽車上。
圖四:由代理端到端搜索發(fā)現(xiàn)的一種神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
03
接下來(lái)是什么
Waymo的Auto ML實(shí)驗(yàn)僅僅是個(gè)開(kāi)始。對(duì)于激光雷達(dá)分割任務(wù),傳輸學(xué)習(xí)和代理端到端搜索都提供了比人工制作更好的網(wǎng)絡(luò),現(xiàn)在有機(jī)會(huì)將這些機(jī)制應(yīng)用到新的任務(wù)類型上,這可以改善許多其他的神經(jīng)網(wǎng)絡(luò)。
這一發(fā)展為未來(lái)的ML工作開(kāi)辟了新的令人興奮的道路,并將提高Waymo的自動(dòng)駕駛技術(shù)的性能和能力,并繼續(xù)與谷歌AI大腦的合作。
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
技術(shù)文庫(kù)
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
精彩回顧立即查看>> 【線上直播】新能源汽車熱管理行業(yè)應(yīng)用新進(jìn)展
-
精彩回顧立即查看>> 【線上直播】西門子電池行業(yè)研討會(huì)-P4B如何加速電池開(kāi)發(fā)
-
精彩回顧立即查看>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【線下論壇】華邦電子與萊迪思聯(lián)合技術(shù)論壇
- 1 2025上海車展看什么?看這一篇就夠了!
- 2 關(guān)稅大戰(zhàn),汽車芯片會(huì)漲價(jià)嗎
- 3 工信部召開(kāi)智能網(wǎng)聯(lián)汽車產(chǎn)品準(zhǔn)入及軟件在線升級(jí)管理工作推進(jìn)會(huì)提的內(nèi)容,將如何影響智駕行業(yè)發(fā)展?
- 4 地平線智駕方案軟硬結(jié)合,大眾、保時(shí)捷的合作紛至沓來(lái)
- 5 高呼的“全民智駕”真的做到“全民”了嗎?
- 6 一季度汽車產(chǎn)量省份排名大洗牌!誰(shuí)在異軍突起?
- 7 奇瑞的混動(dòng)技術(shù):厚積薄發(fā),從發(fā)動(dòng)機(jī)到混動(dòng)系統(tǒng)
- 8 中國(guó)汽車發(fā)展頂層設(shè)計(jì)思路 - 萬(wàn)鋼主席2025百人會(huì)核心內(nèi)容總結(jié)
- 9 東風(fēng)+華為,還是華為借東風(fēng)?華為ADS3.0技術(shù)詳解
- 10 工信部對(duì)浮躁的智駕說(shuō)“不”