“車位到車位”端到端智駕要取勝,純堆算力和補數據其實并不夠?
文/周雄飛
沒想到,智能駕駛行業(yè)的“風水輪流轉”會來得如此快。
去年下半年開始,隨著特斯拉發(fā)布了BEV+Transformer和OCC占用網絡等技術,一度成為了車企們追逐的熱詞。再到今年初,由于受到特斯拉的啟發(fā),端到端技術也逐漸成為了整個智駕行業(yè)的標配。
但就在最近,一直是“領路人”角色的特斯拉,則反過來向“蔚小理”們學習起來。
因為隨著特斯拉向北美車主們釋放FSD的V13版本后,行業(yè)內外注意到特斯拉官方稱該版本FSD能實現“車位到車位”(Park 2 Park)的智駕功能。
需要注意的是,“車位到車位”這一概念最早是由華為提出,很快理想和小鵬等車企將該功能的落地提上了“日程表”。這就意味著,在“車位到車位”的落地上,華為、理想和小鵬走到了特斯拉前面。
智駕功能迭代的同時,行業(yè)對于算法的探索也在持續(xù)著,以至于從“一段式端到端”和“兩段式端到端”兩大陣營競爭的1.0時代,發(fā)展至VLA(視覺語言動作)模型橫空出世的端到端2.0時代。
車企們之所以會在“車位到車位”和端到端智駕算法上展開競速賽,也是因為這些能力已成為能否進入智駕第一梯隊的“分水嶺”。但要邁過這一分水嶺,除了要追逐技術趨勢之外,無疑也對“冰山之下”的算力和數據提出了更高的要求。
由此,“蔚小理”等眾多車企品牌們紛紛卷入對算力和數據的“軍備競賽”中,與此同時,騰訊為代表的科技大廠們也在陸續(xù)推出智能汽車云相關產品,專為智駕訓練提供云端算力。
然而,隨著算力和數據規(guī)模越來越大,如何獲得高質量數據、并且更有效率和低成本的“流動”起來,以便推動算法的快速迭代,成為整個行業(yè)需要解決的問題。
對此,騰訊提出了他們的解法。早在2022年,對算力、數據和算法“冰山之下”基礎設施長期投入的騰訊,率先行業(yè)推出了“車云一體”和數據驅動閉環(huán)的概念,并基于此在今年9月推出“車云一體數據閉環(huán)”的解決方案,以便來幫助車企和自動駕駛企業(yè)們實現“冰山之上”功能和體驗的進化。
在騰訊智慧出行副總裁鐘學丹看來,隨著汽車進入“AI驅動”的時代,數據質量和規(guī)模直接影響到了車的智力水平,數據閉環(huán)能力成為汽車智能化的核心“增長飛輪”。
英偉達自動駕駛負責人吳新宙也說過相似的觀點,按照他認為,數據閉環(huán)已經成為實現高階智駕的“華山一條路”,沒有一家車企可以繞開。
這就意味著,“冰山之下”的車云一體數據閉環(huán)能力,已成為車企和自動駕駛企業(yè)們能否在未來“冰山之上”智駕功能和體驗的競賽中取勝的關鍵。
1、“車位到車位”、VLA相繼出現,智駕行業(yè)駛入“分水嶺”
“試試特斯拉最新的自動駕駛軟件吧,它一定會超乎你的想象。”
當特斯拉向它的用戶們推送了FSD的V13.2.1版本后,特斯拉CEO埃隆·馬斯克如此在X平臺上為FSD的最新版本做起了宣傳。
他之所以會對FSD新版本如此滿意,也是因為相比于之前的版本,V13.2.1版本不僅可以實現從車位里開啟智駕的功能,更為關鍵還能做到更加擬人的“車位到車位”高階智駕能力。
馬斯克會如此高調為FSD V13站臺,或許他也知道在“車位到車位”功能的落地上,特斯拉已經慢了一步。
對于“車位到車位”這一概念,由華為最先提出,并在今年8月隨享界S9的上市發(fā)布了該功能。這之后,小鵬、理想、極氪和小米等一眾車企品牌也把“車位到車位”的落地,提上了各自的日程。
比如理想汽車率先在上月底向用戶們全量推送了“車位到車位”的智駕能力;華為鴻蒙智行也在近日宣布對于“車位到車位”智駕功能進行全量推送。
在以上兩個品牌后面,小米汽車宣布會在本月開啟“車位到車位”先鋒版推送;極氪則預告會在明年第二季度全量推送“車位到車位”的智駕功能;小鵬在上月也開啟了該功能的公測。
相比于車企們之前喊出的“全國都能開”口號,“車位到車位”可以讓消費者更加直觀的體驗到智駕功能帶來的便利,比如可以不需要接管通過停車場閘口和收費站(ETC)。
但需要注意的是,截至目前放眼整個智駕行業(yè),只有以上這些車企品牌在“車位到車位”上有所動作,因此該功能也被視為能否進入智駕行業(yè)第一梯隊的“分水嶺”。
由于要實現“車位到車位”的智駕能力,對于車企品牌自身的算法能力提出了更高的要求,因此在算法層面的探索一直在進行著,并且也已出現了明顯的“分水嶺”。
從今年初開始,端到端成為了整個智駕行業(yè)追逐的關鍵技術,以至于演化出“一段式端到端”和“兩段式端到端”兩大技術陣營。
以華為乾崑ADS 3.0為例,屬于典型的“兩段式端到端”,因為其架構是由對真實世界的感知和識別的GOD感知神經網絡,以及感知信息迅速做出決策的PDP決策神經網絡兩大塊構成。
相較于“兩段式端到端”,“一段式端到端”則可以將感知端到端與規(guī)控端到端都集成到一個大模型中,使系統(tǒng)能夠更高效地處理信息并作出反應,更具效率優(yōu)勢。特斯拉、商湯絕影和黑芝麻智能等玩家被視為是“一段式端到端”架構的代表玩家。
除了在智駕算法結構上推動進化之外,比如理想、華為和Nullmax等企業(yè),也把人類大腦應對駕駛場景的工作模式引入到智駕算法的構建中,被用作算法執(zhí)行過程中兜底的“安全氣囊”。
但很快,一個名為“VLA”的智駕模型橫空出世,并很快成為了行業(yè)關注的熱點。
VLA,即視覺語言動作模型,是一個融合了視覺、語言和動作的多模態(tài)大模型范式,由元戎啟行在今年9月底率先提出。
該模型可以理解為“端到端+VLM”的融合體,可實現一次性從感知到決策的過程,不用再由“快”“慢”系統(tǒng)進行交互和調優(yōu),從而提高信息處理、決策的效率,以及增加端到端“黑箱”的解釋性。
端到端+VLM與VLA兩大架構對比,圖源元戎啟行
由于這樣的優(yōu)勢,VLA被業(yè)內認為是更為先進的算法架構,但除了元戎啟行之外,只有理想、奇瑞等極少數車企也宣布會對該架構進行布局和投入。這背后的原因,在業(yè)內看來主要是因為布局VLA比VLM(視覺語言模型),對于算力和數據的要求有更高的要求。
從“車位到車位”,再到VLA的橫空出世,這些都被行業(yè)視為智駕行業(yè)區(qū)分實力的“分水嶺”,而玩家們想要率先邁過這些“分水嶺”,“冰山之下”算力和數據的能力,已成為決定性因素。
2、升級算力和數據,“冰山之下”能力還不夠?
FSD V13版本的升級,到底是如何實現的?
這個問題的答案,或許只有馬斯克自己知道。但從FSD V12到V13版本的迭代中,特斯拉也掀起了一場對于算力和數據的行業(yè)“軍備競賽”。
按照特斯拉官方發(fā)布的FSD V13版本升級信息來看,在訓練數據方面,他們用到了大量的模擬仿真生成式數據,讓算法來認識和理解真實世界。
數據之外,特斯拉通過建立名為“Cortex”(大腦皮層)的超算集群,用以支持FSD和Optimus的算法訓練。
特斯拉Cortex超算集群,圖源Electrek
根據最新的消息,該超算集群已包含十萬顆英偉達H100和H200芯片,按照一顆H100 FP64/FP32的60 TFlops算力來估算,Cortex可實現100 EFLOPS左右的算力能力,已成為世界范圍內排在前列的超算集群。
隨著特斯拉的帶頭,智能出行行業(yè)中越來越多玩家也加入到這場算力和數據的“軍備競賽”中。
據理想汽車介紹,截至上月月中的算力已達到6.83 EFLOPS,預計在今年年底達到10 EFLOPS。無獨有偶,小鵬和華為也都計劃在明年把自身的算力提升至10 EFLOPS以上。
數據方面,除了通過量產車采集回收數據之外,據飛說智行了解,目前絕大多數頭部車企和自動駕駛企業(yè)均通過建立“世界模型”,來生成海量的仿真數據供算法進行訓練,這點上與特斯拉如出一轍。
車企們卷起來的同時,以騰訊為代表的科技公司們在算力和數據的升級上也不甘示弱。
根據公開數據,依托分布式云原生的調度能力,騰訊云智算平臺目前可提供16 EFLOPS的浮點算力,處于行業(yè)領先位置。同為大廠的阿里巴巴和中國電信,目前的算力規(guī)模分別為15 EFLOPS和14 EFLOPS。
騰訊、華為、阿里也先后設立了專為智能駕駛服務的云專區(qū),足以證明云廠商對智駕行業(yè)的重視。
就以上來看,車企和自動駕駛企業(yè)們對于數據和算力的升級,一直在持續(xù)著。但與此同時,行業(yè)中越來越多人認為,僅做到這些想要在未來的智駕行業(yè)中取得優(yōu)勢,還遠遠不夠。
主要是因為全球汽車工業(yè)正經歷著時代的變遷。
2010年之前,被視為“硬件構建汽車”的時代,隨著2016年特斯拉開啟了“硬件預埋+軟件付費”的商業(yè)模式,向它的用戶們賣起軟件服務。在英偉達創(chuàng)始人兼CEO黃仁勛等大佬看來,彼時汽車工業(yè)正式進入“軟件定義汽車”的時代。
再到這兩年,隨著以大算力、大數據、大模型為主要代表的人工智能又開始和汽車融合,在中國電動汽車百人會副理事長兼秘書長張永偉看來,以人工智能為驅動的智能汽車時代已經到來。
對此,Caresoft Global合伙人楊繼峰曾在一次公開演講中提到:“從整車角度上,車端架構和云端架構進一步統(tǒng)一后,接下來的競爭是數據挖掘、數據的有效利用以及整個技術棧對數據的理解,以及如何在大規(guī)模的基礎設施上平衡整個計算效率!
換句話說,就是需要獲得高質量、大規(guī)模的數據,再配合高算力,來訓練和迭代算法能力,建立“冰山之下”車端和云端之間的數據閉環(huán)能力,來讓這“三大件”的能力更有效率和更低成本的運轉起來。
3、車云一體數據閉環(huán)能力,如何為智駕行業(yè)“減負增效”?
車云一體數據閉環(huán)能力,本質上是要讓數據在車端和云端之間“流動”起來。
簡言之,就是建立一個橫跨車端和云端的體系化閉環(huán),車端收集的數據上傳到云端,在云端集中和快速的對這些數據進行標注處理和用于算法的訓練。
完成這些后,云端再把訓練好的算法模型數據發(fā)回車端,進行OTA部署及更新,如此車端和云端進行協(xié)同互補,推動完成了智駕技術的迭代與進化。
在這樣的行業(yè)需求下,以騰訊為代表的科技大廠們,已經開始為智駕行業(yè)“減負”和“增效”。
就拿獲取高質量數據這一環(huán)節(jié)為例。目前在端到端算法和BEV真值訓練上,車企們對于高質量數據的需求越來越高,實際上相當于做4D標注了,非常耗時耗錢。
對此,騰訊基于原始的采集數據,通過預處理加工過程,形成資料類的數據產品,可以直接用來做真值訓練。對于車企們來說,直接采購這些數據,相比從0開始采集加工數據,可以大幅提升他們的智駕研發(fā)效率和降低成本。
要獲得高質量數據,數據挖掘也是不可視的環(huán)節(jié);隍v訊云向量數據庫的檢索式數據挖掘能力,最高支持千億級向量規(guī)模和500萬QPS(每秒查詢率)峰值能力。車企們就可以用圖片、文字信息進行精確檢索,從而在海量的數據中快速地把所需數據搜索出來。
騰訊車云一體數據閉環(huán)
好比現在車企要從1000億張圖片數據中尋找一張卡車運輸共享單車的圖片,騰訊云向量數據庫最高可以并發(fā)支持500萬個類似請求進行搜索,就能秒級找到這條記錄,從而利用其訓練算法。
談到智駕,地圖數據也是至關重要的資源。但對于高精地圖來說,鮮度低、成本高一直都是行業(yè)有目共睹的短板,由此才讓許多車企喊出了要用“輕地圖”或者“無圖”來實現高階智駕的口號。
但在騰訊智慧出行副總裁劉澍泉看來,即便是目前車企們都在卷的“車位到車位”智駕功能,從本質上看依然是從A點到B點的行駛過程,因此還是需要地圖數據的支持,就比如復雜路口識別和不規(guī)則掉頭等場景。
對此,騰訊也提出了他們的解決方案——通過融合標準地圖(SD Map)、輔助駕駛地圖(ADAS Map)、高精地圖(HD Map) 等不同精度等級的地圖數據,打造出了智駕云圖、輕高精地圖等產品形式。
其中,智駕云圖的特點就是將地圖數據全面云化,更新更快、更靈活。由此可以實現最快分鐘級、結合車端感知、交通信息和環(huán)境信息進行在線更新,再從云端向車端實時下放數據。
這就是說,當車企的端到端智駕跑到一個不熟悉的路段和場景時,也能基于動圖的動態(tài)數據做出更優(yōu)的決策。
騰訊智駕云圖四大能力
另外,針對車企想要在智駕算法和功能上打造差異性的需求,騰訊不是交給車企一份離線的地圖,而是做成一種常態(tài)化的數據服務。
當車企有不同需求時,就能在合規(guī)的前提下進行定制地圖數據,加速算法的訓練。這樣既降低了車企們定制的成本,同時也避免了云圖數據與車企們適配的難度。
最后,隨著智能汽車行業(yè)的發(fā)展,數據安全一直都是車企們頭上懸著的“達摩克利斯之劍”。
面對這一行業(yè)難題,騰訊專為智駕行業(yè)開設了華東、華北兩地的自動駕駛云專區(qū),這個云專區(qū)的全棧數據與公有云物理上隔離,但是保持了和公有云同源、同架構,并且專門針對自動駕駛相關數據安全要求,開發(fā)了一個端到端和全程合規(guī)的數據訓練閉環(huán)服務。
翻譯一下,就能幫助車企和自動駕駛企業(yè)在數據處理、篩選、標準乃至之后的訓練與儲存上提供自動化的合規(guī)的保護,從而大幅提升這些企業(yè)的算法研發(fā)效率。
基于騰訊在車云一體數據閉環(huán)能力上的長期布局,目前獲得了行業(yè)的廣泛歡迎。目前騰訊已與蔚來、奔馳、長安、博世等100家車企與出行科技公司展開合作。
在飛說智行看來,智能駕駛行業(yè)除了在算法功能和體驗上比拼之外,還要打好“冰山之下”的基礎設施能力,才能真正推動智駕“愛用”時代的到來,同時也能助力我國在全球智能駕駛競逐賽中獲得更大的勝算。
原文標題 : “車位到車位”端到端智駕要取勝,純堆算力和補數據其實并不夠?
請輸入評論內容...
請輸入評論/評論長度6~500個字
圖片新聞