端到端類腦自動駕駛 | DeepSeek如何影響國內(nèi)智能汽車行業(yè)
本文來源:智車科技
國內(nèi)智能汽車行業(yè)正經(jīng)歷一場由AI驅(qū)動的技術(shù)變革,而DeepSeek憑借其開源生態(tài)與高效訓(xùn)練能力,迅速引起國內(nèi)車企的共情和合作。在傳統(tǒng)汽車向“軟件定義汽車”轉(zhuǎn)型的浪潮下,車聯(lián)網(wǎng)、自動駕駛等技術(shù)的迭代對算力與研發(fā)成本提出了更高要求。
開源+高效訓(xùn)練
車企擁抱DeepSeek的底層邏輯
DeepSeek的開源模式為汽車行業(yè)提供了新思路。
2月6日,吉利汽車宣布自研大模型星睿與DeepSeek已完成深度融合。吉利將對星睿車控FunctionCall大模型、汽車主動交互端側(cè)大模型等進(jìn)行蒸餾訓(xùn)練。屆時,吉利智能汽車AI不僅能對用戶的模糊意圖實(shí)現(xiàn)精準(zhǔn)理解,進(jìn)而準(zhǔn)確調(diào)用約2000個車載接口,還能基于車內(nèi)外場景主動分析用戶潛在需求,并為用戶主動提供車輛控制、主動對話、售后等服務(wù),智能交互體驗(yàn)將大幅提升。
2月7日,嵐圖汽車旗下車型嵐圖知音完成與DeepSeek模型的深度融合,成為汽車行業(yè)首個搭載該技術(shù)的量產(chǎn)車型。此前,嵐圖座艙已完成DeepSeek全系列模型接入和部署,AI智能體將在云端與DeepSeek大模型融合,帶來精準(zhǔn)智能交互體驗(yàn)。
圖1 吉利凌渡座艙,搭載吉利與DeepSeek整合AI模型
業(yè)界的普遍共識是,汽車行業(yè)正在從傳統(tǒng)的電動汽車(EVs)向智能電動汽車(EIVs)演變。AI和云計算正在推動新能源汽車競爭力。AI和云計算的整合已成為中國新能源汽車(NEV)市場的一個重要趨勢。汽車制造商正在利用這些技術(shù)提升車輛性能,為用戶提供更個性化的駕駛體驗(yàn)。
在近期于達(dá)沃斯舉行的世界經(jīng)濟(jì)論壇上,寧德時代聯(lián)席主席潘健強(qiáng)調(diào),智能與中國電動汽車市場的快速增長密不可分。他表示,電力和智能的無縫整合是這一轉(zhuǎn)型的關(guān)鍵。他強(qiáng)調(diào),電動力為汽車提供了先進(jìn)的智能功能,結(jié)合DeepSeek類大模型,將進(jìn)一步鞏固了中國在全球智能電動汽車領(lǐng)域的領(lǐng)導(dǎo)地位。
在追求模型高效落地的過程中,蒸餾(Distillation)技術(shù)成為DeepSeek賦能車企的另一張王牌。傳統(tǒng)大模型雖性能強(qiáng)悍,但高昂的存儲與運(yùn)行成本使其難以適配車載場景。DeepSeek R1通過知識蒸餾,將大型語言模型的“經(jīng)驗(yàn)”遷移至輕量化模型中,既保留了核心能力,又大幅降低了硬件負(fù)載。據(jù)悉,吉利將對星睿車控 FunctionCall 大模型、汽車主動交互端側(cè)大模型等進(jìn)行蒸餾訓(xùn)練,將DeepSeek R1的語義理解與優(yōu)先級決策能力注入車輛控制模塊,這種“類人思考”的決策邏輯,將為車企在成本與性能間找到了平衡點(diǎn),加速了AI模型從實(shí)驗(yàn)室到量產(chǎn)車的轉(zhuǎn)化。
DeepSeek在智能車輛行業(yè)的未來擴(kuò)展
-類腦思考的端到端自動駕駛
在自動駕駛領(lǐng)域,還沒有自動駕駛模型在大數(shù)據(jù)統(tǒng)計檢驗(yàn)意義上公認(rèn)優(yōu)于人類駕駛員。如何讓機(jī)器理解“人類用語義表達(dá)的操作優(yōu)先級”,這正是DeepSeek和其它潛在大語言模型最好的切入點(diǎn)之一。而且,這種技術(shù)切入是融合到最新的端到端(end to end)自動駕駛技術(shù)潮流的。
圖2 三階段和端到端自動駕駛對比,圖片來自Research Gate
傳統(tǒng)的自動駕駛系統(tǒng)通常由多個獨(dú)立的模塊或者階段組成,如感知、決策和控制。而端到端自動駕駛技術(shù)試圖通過將這些模塊整合成一個統(tǒng)一的龐大神經(jīng)網(wǎng)絡(luò)模型,直接將原始傳感器輸入(圖像、點(diǎn)云、超聲波雷達(dá)等等)映射到車輛的控制命令,以實(shí)現(xiàn)自動駕駛的功能。
具體而言,端到端自動駕駛技術(shù)將原始傳感器數(shù)據(jù)(如攝像頭、雷達(dá)和激光雷達(dá))作為輸入,并通過深度學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行處理,直接輸出車輛的控制命令(如方向盤轉(zhuǎn)角、油門和剎車)。這種方法消除了傳統(tǒng)自動駕駛系統(tǒng)中的中間步驟和模塊,簡化了系統(tǒng)的設(shè)計和實(shí)施過程。
端到端自動駕駛技術(shù)的主要優(yōu)勢在于它可以通過使用大規(guī)模的數(shù)據(jù)集進(jìn)行端到端的訓(xùn)練,從而提高系統(tǒng)的性能和魯棒性。它能夠從原始數(shù)據(jù)中學(xué)習(xí)到更高級別的特征和抽象表示,自動發(fā)現(xiàn)和理解復(fù)雜的交通場景和駕駛行為。此外,端到端自動駕駛技術(shù)還能夠適應(yīng)不同的道路和環(huán)境條件,具有更好的泛化能力。
端到端自動駕駛技術(shù)有許多潛在的優(yōu)勢,但它的優(yōu)勢面也同步帶來對應(yīng)的劣勢,如對大規(guī)模數(shù)據(jù)的需求、對計算資源的要求以及解釋性和安全性等問題。其中最大的潛在劣勢是最終結(jié)果的統(tǒng)一單一模型可能極為龐大,帶來巨大的存儲、訓(xùn)練,運(yùn)行開銷和巨大的能耗。因此,盡管業(yè)界普遍接受端到端方案是自動駕駛的未來,但主要實(shí)踐端到端自駕的還是巨頭Tesla。
一般而言,作為現(xiàn)狀的當(dāng)前自動駕駛系統(tǒng)通常采用混合方法,結(jié)合傳統(tǒng)的模塊化方法和端到端技術(shù),以實(shí)現(xiàn)更可靠和安全的自動駕駛功能。
那么如果有一個破局者,具有低訓(xùn)練成本、低使用成本,最終模型采用蒸餾distillation技術(shù)極小化,又能理解“人類用語義表達(dá)的操作優(yōu)先級”如何呢?
這個回答似乎是訓(xùn)練費(fèi)用560w美元,單個token使用費(fèi)用約chatGPT o1的三十分之一,且不依賴海外高端芯片的DeepSeek R1,以及它的多模態(tài)前身DeepSeek V3。
圖3 學(xué)術(shù)界使用多模態(tài)大語言模型LLM處理自動駕駛傳感器輸入的多模態(tài)數(shù)據(jù)(來自next-GPT)
隨著智能駕駛向“全場景化”邁進(jìn),端到端(End-to-End)技術(shù)成為行業(yè)競爭的高地。傳統(tǒng)自動駕駛依賴感知、決策、控制分階段執(zhí)行的模塊化架構(gòu),存在系統(tǒng)復(fù)雜、響應(yīng)延遲等短板。DeepSeek通過多模態(tài)大模型,將傳感器數(shù)據(jù)直接映射為控制指令,構(gòu)建起“輸入-輸出”一體化的新范式。
以DriveGPT4、商湯DriveAGI、Senna架構(gòu)為代表的端到端方案,已展現(xiàn)出顯著優(yōu)勢。
1.DriveGPT4:DriveGPT4是將大模型應(yīng)用于可解釋的端到端自動駕駛的一個重要里程碑。它通過引入更強(qiáng)大的感知能力和更高的決策透明度,推動了自動駕駛技術(shù)向更加智能的方向發(fā)展。
2.Senna架構(gòu):Senna采用了獨(dú)特的解耦行為決策-軌跡規(guī)劃思路,利用大規(guī)模駕駛數(shù)據(jù)進(jìn)行微調(diào),以增強(qiáng)對駕駛場景的理解能力。此外,該架構(gòu)還能通過自然語言輸出高維決策指令,進(jìn)一步提升了系統(tǒng)的靈活性和適應(yīng)性。
3.商湯絕影DriveAGI:商湯絕影推出的新一代自動駕駛大模型DriveAGI,憑借其寬泛適用場景、高性能以及低門檻的特點(diǎn),成為行業(yè)內(nèi)的一大亮點(diǎn)。該模型特別注重增強(qiáng)端到端自動駕駛方案的可解釋性和交互能力
除此以外,我們還可以再加上前文提到的吉利將自身AI模型和deepseek整合得到混合模型。
也許近期就會出現(xiàn)DeepSeek獨(dú)立的Driving AGI,這些模型在技術(shù)架構(gòu)上都一般包含如下特點(diǎn)作為基礎(chǔ)部件:
1.多模態(tài)數(shù)據(jù)融合:
多模態(tài)大模型能夠處理來自不同傳感器的數(shù)據(jù),如攝像頭、激光雷達(dá)(LiDAR)、毫米波雷達(dá)等。這些數(shù)據(jù)被整合成一個統(tǒng)一的表示形式,從而為后續(xù)的決策和規(guī)劃提供全面的信息支持。
2.端到端學(xué)習(xí):
端到端學(xué)習(xí)是指從原始傳感器數(shù)據(jù)直接輸出駕駛指令或軌跡規(guī)劃的過程。這種方式省去了傳統(tǒng)方法中復(fù)雜的中間步驟,簡化了系統(tǒng)設(shè)計,并提高了系統(tǒng)的實(shí)時性和魯棒性。例如,EMMA(End-to-End Multimodal Model for Autonomous Driving)技術(shù)可以直接將原始攝像頭數(shù)據(jù)映射到具體的駕駛動作。
3.自然語言處理與交互:
一些先進(jìn)的多模態(tài)大模型不僅限于視覺信息,還結(jié)合了自然語言處理能力,可以理解并生成人類語言描述的駕駛意圖或指令。這使得系統(tǒng)能夠更好地理解和響應(yīng)復(fù)雜環(huán)境中的動態(tài)變化,同時也增強(qiáng)了人機(jī)交互的可能性。
其應(yīng)用場景包括:
1.乘用車自動駕駛:在城市道路、高速公路等多種路況下,多模態(tài)大模型可以幫助車輛安全地完成變道、避障、停車等操作。據(jù)報道,理想汽車已經(jīng)基于快慢雙系統(tǒng)的思路實(shí)現(xiàn)了量產(chǎn)上車的應(yīng)用。
2.商用車及物流配送:商用車輛和物流配送機(jī)器人不僅可以在NOA模式下使用多模態(tài)大模型實(shí)現(xiàn)L1-L4級別自駕,特別是在面對非結(jié)構(gòu)化環(huán)境時,如港口(比如東風(fēng)商用車和招商集團(tuán)合作的廈門港、媽灣港無人集卡)、礦區(qū)(遠(yuǎn)安磷礦地下礦區(qū)自動礦車)、工地、倉庫內(nèi)部等特殊場景。這些模型能夠提高運(yùn)輸效率,減少人為干預(yù)的需求,減少司乘人員的精力消耗。
結(jié)語
值得關(guān)注的是,DeepSeek通過開源生態(tài)與高效訓(xùn)練框架,正在打破特斯拉對端到端技術(shù)的壟斷。其模型支持分布式訓(xùn)練與邊緣計算部署,即便在國產(chǎn)芯片上也能實(shí)現(xiàn)低延遲推理。隨著蒸餾技術(shù)的進(jìn)一步優(yōu)化,未來車載模型的體積與能耗有望再降,為L4級自動駕駛的規(guī)模化落地鋪平道路。
從開源賦能到蒸餾提效,再到端到端重構(gòu)駕駛邏輯,DeepSeek正在以“技術(shù)普惠”的姿態(tài)重塑國內(nèi)智能汽車行業(yè)。在這場變革中,車企借助AI大模型的“智力杠桿”,實(shí)現(xiàn)安全、高效與人性化駕駛體驗(yàn)的全面升級。當(dāng)DeepSeek的“類腦思考”真正融入車輪之上,中國智能汽車產(chǎn)業(yè)的全球領(lǐng)導(dǎo)地位或?qū)⒉辉龠b遠(yuǎn)。
免責(zé)聲明:
凡本公眾號注明“來源:XXX(非智車科技)”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞和分享更多信息,并不代表本平臺贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé),版權(quán)歸原作者所有,如有侵權(quán)請聯(lián)系我們刪除。
原文標(biāo)題 : 端到端類腦自動駕駛 | DeepSeek如何影響國內(nèi)智能汽車行業(yè)

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
-
10 月之暗面,絕地反擊
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?