侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

商湯絕影CEO王曉剛:智能駕駛與智能座艙的發(fā)展路徑

在車展前的商湯絕影媒體溝通會(huì)上,商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家、商湯絕影CEO王曉剛深入探討了輔助駕駛與智能座艙的未來發(fā)展方向。

● 輔助駕駛正邁向生成式智能輔助駕駛階段,世界模型與強(qiáng)化學(xué)習(xí)的結(jié)合將突破人類駕駛行為的局限,提升安全性和確定性。

● 智能座艙通過引入深度思考能力和多模態(tài)交互,致力于打造“家庭新成員”體驗(yàn),打破體驗(yàn)同質(zhì)化。

我們將從自動(dòng)駕駛和智能座艙兩個(gè)維度,結(jié)合王曉剛的觀點(diǎn),分析技術(shù)趨勢、行業(yè)挑戰(zhàn)及商湯絕影的戰(zhàn)略布局,展望智能汽車產(chǎn)業(yè)的未來。

01

輔助駕駛:

從端到端到生成式

智能駕駛的躍遷

輔助駕駛技術(shù)經(jīng)歷了從基于物理模型的規(guī)則階段到端到端數(shù)據(jù)驅(qū)動(dòng)階段的轉(zhuǎn)變。

端到端模型通過輸入圖像和視頻直接預(yù)測車輛行駛軌跡,模仿人類駕駛行為。這一模式高度依賴數(shù)據(jù)量和質(zhì)量,尤其在復(fù)雜場景中,優(yōu)質(zhì)數(shù)據(jù)稀缺。

例如,90%的駕駛者在困難場景中可能選擇停車,僅1%-10%的高水平數(shù)據(jù)具有學(xué)習(xí)價(jià)值,端到端模型存在不確定性:特定問題場景難以復(fù)現(xiàn),模型更新后可能導(dǎo)致已解決場景的性能回退,統(tǒng)計(jì)性結(jié)果與自動(dòng)駕駛對(duì)安全性和確定性的高要求相悖。 

輔助駕駛的下一階段是“生成式智能駕駛”,核心在于世界模型與強(qiáng)化學(xué)習(xí)的協(xié)同。

世界模型通過3D重建和物理建模,精準(zhǔn)模擬現(xiàn)實(shí)世界的物理定律、交通規(guī)則和運(yùn)動(dòng)規(guī)律,構(gòu)建類似圍棋棋盤的“虛擬環(huán)境”,強(qiáng)化學(xué)習(xí)通過反復(fù)模擬問題場景,優(yōu)化端到端模型,解決特定場景問題并實(shí)現(xiàn)泛化,突破了人類駕駛行為的上限,還降低了數(shù)據(jù)采集的成本和風(fēng)險(xiǎn)。 

商湯絕影的“開悟”世界模型已取得顯著成果,連續(xù)兩年在Waymo挑戰(zhàn)賽中奪冠。

2023年11月發(fā)布的1.0版本覆蓋多種場景,2025年升級(jí)至2.0,進(jìn)一步結(jié)合強(qiáng)化學(xué)習(xí),形成云端與端側(cè)協(xié)同的新范式,通過云端訓(xùn)練大模型并蒸餾至車端,適應(yīng)不同算力水平的芯片架構(gòu),云端研發(fā)的比重將持續(xù)增加,算力中心等基礎(chǔ)設(shè)施將成為競爭關(guān)鍵。

生成式智能輔助駕駛依賴云端訓(xùn)練,但車端算力需求依然重要,算力與模型應(yīng)對(duì)復(fù)雜場景的能力呈正比。然而,類似DeepSeek的MOE(混合專家模型)架構(gòu)通過優(yōu)化參數(shù)激活,顯著降低算力需求。

這種技術(shù)路線對(duì)車端部署大模型具有普適意義。商湯絕影通過MOE架構(gòu)和工程化優(yōu)化,在有限算力下實(shí)現(xiàn)高性能模型部署,為量產(chǎn)落地提供了可行路徑。 

針對(duì)地平線創(chuàng)始人余凱“99%人類數(shù)據(jù)不值得學(xué)習(xí)”的觀點(diǎn),王曉剛表示認(rèn)同其部分邏輯。

在端到端范式下,人類駕駛數(shù)據(jù)多為簡單場景,信息量低,而復(fù)雜場景數(shù)據(jù)質(zhì)量參差不齊。通過世界模型和仿真,商湯絕影能夠重復(fù)問題場景并生成多樣化數(shù)據(jù),提升模型的確定性和安全性。

量產(chǎn)過程中,商湯結(jié)合自有采集數(shù)據(jù)與世界模型生成數(shù)據(jù),迭代優(yōu)化模型質(zhì)量,確保時(shí)空一致性和場景多樣性。

輔助駕駛安全性的提升離不開艙駕融合和駕駛員監(jiān)控系統(tǒng)(DMS),DMS不僅需監(jiān)測駕駛員狀態(tài)(如疲勞、分心),還需通過3D視線追蹤(Gaze)精準(zhǔn)判斷其關(guān)注目標(biāo)。

在無保護(hù)左轉(zhuǎn)場景中,DMS可確認(rèn)駕駛員是否關(guān)注潛在風(fēng)險(xiǎn)車輛,從而決定采取激進(jìn)或保守的駕駛策略。商湯通過與廣汽、奇瑞、東風(fēng)一汽等車企合作,量產(chǎn)J6M智駕方案和端到端智駕方案,進(jìn)一步驗(yàn)證技術(shù)可靠性。

02

智能座艙:

從工具到家庭成員的體驗(yàn)升級(jí)

DeepSeek通過強(qiáng)化學(xué)習(xí)和思維鏈生成超越人類知識(shí)的數(shù)據(jù),打破了語言模型的Scaling Law瓶頸,其表達(dá)生動(dòng)幽默,深受行業(yè)關(guān)注。

直接將DeepSeek接入座艙并不適合,座艙交互場景要求簡潔高效,冗長的推理過程和中間結(jié)果不適用于車內(nèi)環(huán)境。

商湯絕影基于DeepSeek的核心技術(shù),優(yōu)化SenseAuto-chat模型,結(jié)合多模態(tài)推理,打造“一句話頂一萬句”的交互體驗(yàn),賦予座艙“有趣的靈魂”。智能座艙的同質(zhì)化問題日益凸顯,傳統(tǒng)語言助手在交互能力上缺乏本質(zhì)提升。

● 商湯絕影提出“家庭新成員”理念,將座艙從問答工具、功能助手升級(jí)為情感共情的伙伴。具體體現(xiàn)在以下技術(shù)突破:

◎ 無注冊(cè)人臉識(shí)別與記憶生成:通過對(duì)話自動(dòng)推斷用戶身份并記住面孔,結(jié)合互聯(lián)網(wǎng)信息和交互歷史生成個(gè)性化記憶,形成長期共情。例如,機(jī)器人可根據(jù)用戶近期活動(dòng)主動(dòng)發(fā)起話題,縮短人車距離。◎ 免喚醒多人多輪對(duì)話:機(jī)器人時(shí)刻監(jiān)聽多人對(duì)話,理解上下文并主動(dòng)參與討論,甚至化解矛盾,提供情感調(diào)和。這種能力適配座艙多人交互場景,顯著提升沉浸感。◎ 深度思考與多模態(tài)推理:商湯日日新6.0模型將DeepSeek的深度思考能力引入多模態(tài),結(jié)合視覺、語音等多維輸入,生成精準(zhǔn)幽默的表達(dá)。

商湯絕影發(fā)布行業(yè)首個(gè)車載AI OS基礎(chǔ)設(shè)施“絕影千機(jī)”,核心為AI內(nèi)核,包含多模態(tài)模型、記憶功能、MOE架構(gòu)和全時(shí)運(yùn)行能力,商湯聚焦AI相關(guān)技術(shù),與車企OS結(jié)合形成完整AI操作系統(tǒng),并引入第三方智能體構(gòu)建生態(tài)。

MOE架構(gòu)適配低算力芯片,支持從0.幾B到幾十B的模型部署,確保高效體驗(yàn)。

● 商湯通過3D視線追蹤、健康監(jiān)測(心跳、血氧、血壓)等技術(shù),拓展座艙功能。

◎ 3D Gaze可識(shí)別駕駛員注視的車外目標(biāo),支持自動(dòng)繳費(fèi)、拍照分享等創(chuàng)新應(yīng)用;

◎ 健康監(jiān)測則提供主動(dòng)關(guān)懷和安全預(yù)警,進(jìn)一步融合艙駕功能。

在國內(nèi)市場高度內(nèi)卷的背景下,商湯絕影積極配合車企出海,滿足2026年ENCAP對(duì)DMS和OMS的強(qiáng)制要求。

2024年,商湯已協(xié)助車企實(shí)現(xiàn)ENCAP最高分,未來將深化與合資和全球品牌合作,抓住海外市場對(duì)高階智駕和智能座艙的需求增長。

小結(jié)

商湯絕影的戰(zhàn)略布局展現(xiàn)了其對(duì)自動(dòng)駕駛和智能座艙的深刻洞察,輔助駕駛領(lǐng)域,生成式智能駕駛通過世界模型和強(qiáng)化學(xué)習(xí)突破數(shù)據(jù)瓶頸,提升安全性和確定性;在智能座艙領(lǐng)域,“家庭新成員”理念以深度思考和多模態(tài)交互為核心,打破同質(zhì)化壁壘。

商湯通過AI內(nèi)核和操作系統(tǒng)生態(tài)建設(shè),聯(lián)合車企推動(dòng)技術(shù)落地,同時(shí)積極布局海外市場,應(yīng)對(duì)全球合規(guī)需求。

       原文標(biāo)題 : 商湯絕影CEO王曉剛:智能駕駛與智能座艙的發(fā)展路徑

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)