侵權(quán)投訴
訂閱
糾錯
加入自媒體

智能汽車 AI 101,以及“端到端”和“復(fù)合方法”之間有什么區(qū)別?

電氣化之后智能化,汽車的智能化怎么也脫不開人工智能AI,無 AI 不智能這是大家所有人的共識了。但,到底AI是什么?它在汽車行業(yè)應(yīng)用的發(fā)展是怎么樣的?大家競相宣傳和討論的端到端到底什么?它和之前其他AI算法有什么區(qū)別?此類問題卻常讓大家競相莫名圍觀吃瓜。

所以,本文將結(jié)合AI在汽車行業(yè)的應(yīng)用和發(fā)展,總結(jié)下人工智能機(jī)器學(xué)習(xí)

深度學(xué)習(xí)

端到端等 AI 人工智能 101概念內(nèi)容,幫助大家了解AI,以及它在智能汽車中的應(yīng)用和發(fā)展,也方便理解前熱門的各類概念和事件。

人工智能(Artificial Intelligence, AI)人工智能是一門在計算機(jī)中模擬智能行為的科學(xué)。它使計算機(jī)能夠展現(xiàn)出類似人類的行為特征,包括知識、推理、常識、學(xué)習(xí)和決策能力。

他們的核心就是多層的神經(jīng)網(wǎng)絡(luò)(Neural Networks),神經(jīng)網(wǎng)絡(luò)是一種計算機(jī)架構(gòu),它模擬了人腦的結(jié)構(gòu),AI/機(jī)器學(xué)習(xí)程序可以在此基礎(chǔ)上構(gòu)建。

神經(jīng)網(wǎng)絡(luò)由相互連接的節(jié)點組成,這些節(jié)點可以解決更復(fù)雜的問題并進(jìn)行學(xué)習(xí),類似于人腦中的神經(jīng)元,每個節(jié)點用權(quán)重,偏差等參數(shù)去計算傳導(dǎo)到下一步,產(chǎn)生結(jié)果。所以,參數(shù)等成了當(dāng)前模型的一個重要參考指標(biāo),理論上參數(shù)越多代表模型學(xué)習(xí)更完善,產(chǎn)生結(jié)果更真實,在今年英偉達(dá)的 GTC 上,Jensen 透露了一條關(guān)于當(dāng)今最大模型的看似有趣的消息,稱“當(dāng)今最大的模型是 1.8T 參數(shù)“。機(jī)器學(xué)習(xí)(Machine Learning)機(jī)器學(xué)習(xí)是人工智能的一個分支,它使計算機(jī)能夠在沒有明確編程的情況下從數(shù)據(jù)中學(xué)習(xí)。例如,計算機(jī)可以通過數(shù)據(jù)學(xué)習(xí)識別狗或貓等對象。所以智能駕駛最開始的Mobileye就是采用視覺機(jī)器學(xué)習(xí),讓車輛識別前方車輛,行人自行車等VRU,前方道路線,交通標(biāo)志等,這樣實現(xiàn)了AEB,LCC車道保持等功能。

傳統(tǒng)的機(jī)器學(xué)習(xí)方法需要大量的人力來訓(xùn)練軟件。例如,在自動駕駛施工道路的障礙物識別中,需要做以下操作:手動標(biāo)記數(shù)十萬張施工道路以及相關(guān)標(biāo)志的圖像。讓機(jī)器學(xué)習(xí)算法處理這些圖像。用一組未知或者叫泛化的圖像上測試這些算法。找出某些結(jié)果不準(zhǔn)確的原因。通過標(biāo)注新圖像來改進(jìn)數(shù)據(jù)集,以提高結(jié)果準(zhǔn)確性。這個過程稱為有監(jiān)督學(xué)習(xí)。在有監(jiān)督學(xué)習(xí)中,只有廣泛且充分多樣化的數(shù)據(jù)是準(zhǔn)確率的前提。例如,該算法可能可以準(zhǔn)確識別放置非常正面的施工道路牌,但不能準(zhǔn)確識別斜向放置的施工道路牌,因為訓(xùn)練數(shù)據(jù)集包含更多正面施工道路圖像。在這種情況下,那么就需要標(biāo)記更多的斜向放置的施工道路牌圖像并再次訓(xùn)練機(jī)器學(xué)習(xí)模型。國內(nèi)汽車智能駕駛大概在2019年左右,都在通過大量的人工數(shù)據(jù)采集和標(biāo)注的方式,瘋狂通過這種方式訓(xùn)練學(xué)習(xí)模型,最后在2019年特斯拉推出其算法之后,所有訓(xùn)練數(shù)據(jù)和算法推倒重來。

深度學(xué)習(xí)(Deep Learning):深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個子集,深度學(xué)習(xí)擁有更多的分層的層級結(jié)構(gòu)。例如,在識別施工道路牌的例子中,不同的層可能對應(yīng)于給定施工道路牌的關(guān)鍵特征。所以,深度學(xué)習(xí)能夠高效處理非結(jié)構(gòu)化數(shù)據(jù),發(fā)現(xiàn)數(shù)據(jù)之間隱藏的關(guān)系和模式,它能夠做到無監(jiān)督學(xué)習(xí)Unsupervised learning,強(qiáng)化學(xué)習(xí)Reinforcement learning (RL)。例如施工道路牌,它能夠識別逆光,殘缺甚至倒地的施工道路牌。強(qiáng)化學(xué)習(xí)(RL),可以訓(xùn)練軟件做出決策,以實現(xiàn)最佳結(jié)果。它模仿了人類為實現(xiàn)目標(biāo)所采取的反復(fù)試驗的學(xué)習(xí)過程。有助于實現(xiàn)目標(biāo)的軟件操作會得到加強(qiáng),而偏離目標(biāo)的操作將被忽略。ChatGPT剛推出那會兒,Open AI就對使用RL做了簡單介紹,RL 算法在處理數(shù)據(jù)時使用獎懲模式。這些算法從每個操作的反饋中學(xué)習(xí),并自行發(fā)現(xiàn)實現(xiàn)最終結(jié)果的最佳處理路徑。此類算法還能夠?qū)崿F(xiàn)延遲滿足。最好的整體策略可能需要短期的犧牲,因此其發(fā)現(xiàn)的最佳方法可能包括一些懲罰,或在過程中有一些迂回。RL 是一種強(qiáng)大的方法,可以幫助人工智能(AI)系統(tǒng)在看不見的環(huán)境中實現(xiàn)最佳結(jié)果。當(dāng)人工智能算法可以無監(jiān)督和自我強(qiáng)化學(xué)習(xí),對于人工智能最重要的事情就剩下:

大量高質(zhì)量的數(shù)據(jù),在大量高質(zhì)量數(shù)據(jù)上訓(xùn)練深度學(xué)習(xí)算法時,可以獲得更好的效果。輸入數(shù)據(jù)集中的異常值或錯誤會顯著影響深度學(xué)習(xí)過程。例如,在我們的動物圖像示例中,如果數(shù)據(jù)集中意外引入了非動物圖像,深度學(xué)習(xí)模型可能會將飛機(jī)歸類為海龜。為避免此類錯誤,必須先清理和處理大量數(shù)據(jù),然后再訓(xùn)練深度學(xué)習(xí)模型。輸入數(shù)據(jù)預(yù)處理需要大量的數(shù)據(jù)存儲容量。

強(qiáng)大的算力芯片中心,深度學(xué)習(xí)算法是計算密集型的,需要具有足夠計算能力的基礎(chǔ)設(shè)施才能正常運(yùn)行。否則,它們需要很長的時間來處理結(jié)果。

能源,數(shù)據(jù)存儲處理以及計算消耗的能源成為繼物理做功之后又一重要消耗,這也是為什么最近Open AI Sam奧特曼多次不同場合表示對核電感興趣。

在此類人工智能算法的背景下,理想條件下,只需要喂養(yǎng)高質(zhì)量數(shù)據(jù),在強(qiáng)大算力,和豐富能源供給的條件下 AI 可以給人類帶來無窮的應(yīng)用。端到端方法( End-to-End Approach)在2023年,特斯拉開始宣布端到端的智能駕駛算法,他所謂的端到端方法是一個單一模型,它直接從視覺輸入到輸出駕駛策略,如轉(zhuǎn)向和制動。這種方法減少了人工編碼的需求,并可能有助于解決迄今為止限制自動駕駛進(jìn)展的邊緣情況。

熟悉智能駕駛應(yīng)該大概都了解,智能駕駛幾要素,感知,定位,規(guī)劃,控制等流程。目前智能駕駛算法組合大概有三種方式:

感知采用AI神經(jīng)網(wǎng)絡(luò)+規(guī)則控制

各個區(qū)塊都采用神經(jīng)網(wǎng)絡(luò)

端到端融合神經(jīng)網(wǎng)絡(luò)

特斯拉算是從第一個走到了第三步。

其實目前大都在第一步和第二步此類的復(fù)合解決方案,它可以使用AI處理不同的子系統(tǒng)或輸入。然后,這個解決方案可以與組合不同的代碼一起使用,或者覆蓋其他規(guī)則/因素(例如,確保遵守某些交通法規(guī))。盡管有爭議,這種復(fù)合方法是否會限制AI在難以理解的長尾邊緣情況場景中所能達(dá)到的程度,但它:很有效率(例如,ChatGPT不需要使用AI訓(xùn)練來解決基本數(shù)學(xué)問題,它可以直接查詢計算器模塊),可能更容易理解/驗證(這在駕駛中尤其重要,因為AI的錯誤可能是致命的)。仍然使用高級AI技術(shù),如Transformer,Occupancy等等。這些概念為理解AI在自動駕駛汽車中的應(yīng)用提供了基礎(chǔ),并解釋了不同AI方法如何影響技術(shù)的開發(fā)和實施,目前很難說誰好誰不好。其他汽車人工智能應(yīng)用其實,語音算是在智能汽車上應(yīng)用最廣和最快的,畢竟人工智能發(fā)展最快的就是語音和文本模型,例如ChatGPT 此類LLM大語言模型激發(fā)了智能駕駛端到端,基本 AI 原理雷同,目前沒有說主機(jī)廠自研語音算法的,主要是這個產(chǎn)業(yè)已經(jīng)發(fā)展完備,集中頭部供應(yīng)商提供解決方案。當(dāng)然,智能駕駛也應(yīng)該快速走向這個過程,頭部供應(yīng)商提供解決方案,畢竟最終路徑和技術(shù)趨同統(tǒng)一,大家都沒有必要重復(fù)造輪子了。

*未經(jīng)準(zhǔn)許嚴(yán)禁轉(zhuǎn)載和摘錄-參考資料:

Can new AI technology help accelerate AV deployment?- 高盛

       原文標(biāo)題 : 智能汽車 AI 101,以及“端到端”和“復(fù)合方法”之間有什么區(qū)別?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號