訂閱
糾錯(cuò)
加入自媒體

人形機(jī)器人如何做到:手眼協(xié)同和大小腦協(xié)同?

芝能科技出品

人形機(jī)器人正逐漸從前沿實(shí)驗(yàn)室邁向產(chǎn)業(yè)化落地階段,成為人工智能和智能制造融合的關(guān)鍵技術(shù)代表。

特斯拉 Optimus 的硬件方案提出后,激發(fā)全球人形機(jī)器人行業(yè)快速發(fā)展,中國(guó)本土企業(yè)在本體制造、核心零部件、自主算法等多個(gè)層面積極參與,產(chǎn)業(yè)生態(tài)日益豐富。政策助推、產(chǎn)學(xué)研聯(lián)動(dòng)與供應(yīng)鏈的多元演進(jìn)共同推動(dòng)這一技術(shù)群體步入規(guī);A段。

但在實(shí)現(xiàn)類人運(yùn)動(dòng)控制、視覺感知、手眼協(xié)同等方面仍面臨眾多技術(shù)難點(diǎn),人形機(jī)器人從“能用”走向“好用”依然任重道遠(yuǎn)。我們從硬件演進(jìn)、功能實(shí)現(xiàn)、現(xiàn)實(shí)應(yīng)用展開分析,梳理當(dāng)前階段的關(guān)鍵矛盾與發(fā)展趨勢(shì)。

01

  技術(shù)演進(jìn)

與產(chǎn)業(yè)生態(tài)的迅速成型

人形機(jī)器人的產(chǎn)業(yè)化起點(diǎn)在特斯拉提出 Optimus 硬件設(shè)計(jì)方案之后變得清晰可見。其采用的 14 個(gè)旋轉(zhuǎn)執(zhí)行器和 14 個(gè)直線執(zhí)行器,為行業(yè)標(biāo)準(zhǔn)化設(shè)計(jì)提供了參考框架,也拉高了公眾和行業(yè)對(duì)大規(guī)模量產(chǎn)可能性的期待。

在這個(gè)標(biāo)桿的帶動(dòng)下,全球各地開始加速推進(jìn)人形機(jī)器人的開發(fā),中國(guó)尤其表現(xiàn)出迅猛發(fā)展態(tài)勢(shì)。

國(guó)產(chǎn)廠商在形態(tài)設(shè)計(jì)上展現(xiàn)出高度差異化。從典型的雙足+直線+旋轉(zhuǎn)關(guān)節(jié),到雙足+純旋轉(zhuǎn)關(guān)節(jié)結(jié)構(gòu),再到雙足結(jié)合輪式底盤或完全輪式平臺(tái),產(chǎn)業(yè)呈現(xiàn)出多路徑演化趨勢(shì)。

這種技術(shù)和結(jié)構(gòu)多樣性背后,是國(guó)內(nèi)完整產(chǎn)業(yè)鏈的承載力在支撐著不同技術(shù)方向的快速試錯(cuò)與演化。

圍繞重點(diǎn)產(chǎn)品、關(guān)鍵技術(shù)和典型應(yīng)用場(chǎng)景,規(guī)劃至2027年綜合實(shí)力達(dá)到世界先進(jìn)水平,并輔以產(chǎn)業(yè)基金、創(chuàng)新中心建設(shè)等方式推動(dòng)資源配置優(yōu)化,國(guó)家級(jí)創(chuàng)新中心已在多地設(shè)立,成為產(chǎn)業(yè)鏈、科研院校和政策體系之間的有效橋梁。

本體廠商構(gòu)成也不再局限于傳統(tǒng)機(jī)器人企業(yè)。科技公司、汽車制造商、AI 創(chuàng)業(yè)公司等紛紛入局。

從宇樹科技的 G1、H1 系列,到小鵬計(jì)劃于 2026 年量產(chǎn)的工業(yè)級(jí)人形機(jī)器人,以及智元機(jī)器人的遠(yuǎn)征系列量產(chǎn)進(jìn)展,人形機(jī)器人正由“秀肌肉”的研發(fā)樣機(jī)轉(zhuǎn)向“謀落地”的功能場(chǎng)景適配。

支撐整個(gè)生態(tài)的零部件供應(yīng)體系正在同步演進(jìn)。以往如行星滾柱絲杠、空心杯電機(jī)等技術(shù)門檻較高的零件,在工藝持續(xù)優(yōu)化后也逐步具備量產(chǎn)能力。

標(biāo)準(zhǔn)工業(yè)品如伺服電機(jī)、諧波減速器已被納入大規(guī)模供應(yīng)邏輯,在滿足人形機(jī)器人對(duì)輕量化、高精度、高頻率響應(yīng)要求上不斷優(yōu)化。資本持續(xù)涌入核心零部件制造環(huán)節(jié),為后續(xù)產(chǎn)業(yè)放量奠定堅(jiān)實(shí)基礎(chǔ)。

02

 核心功能的

技術(shù)挑戰(zhàn)與局部突破

人形機(jī)器人產(chǎn)業(yè)熱度高漲,真正讓機(jī)器人“動(dòng)起來、看得清、抓得準(zhǔn)”的技術(shù)挑戰(zhàn)依舊棘手。

以“大小腦”功能協(xié)同為例,當(dāng)前運(yùn)動(dòng)控制與泛化能力尚未成熟。人形機(jī)器人天生結(jié)構(gòu)復(fù)雜、質(zhì)心高、支撐面積小,在動(dòng)態(tài)平衡控制中遠(yuǎn)較四足結(jié)構(gòu)更加不穩(wěn)定。

控制方法上,無論是 MPC 還是 WBC,都面臨建模復(fù)雜度高與算力消耗巨大的問題。

學(xué)習(xí)方法雖然展示出驚艷的實(shí)驗(yàn)成果,例如強(qiáng)化學(xué)習(xí)可實(shí)現(xiàn)跳舞、踢球等復(fù)雜運(yùn)動(dòng),但受限于環(huán)境泛化能力低、獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)難、容錯(cuò)性差等因素,在真實(shí)場(chǎng)景中的可靠性和穩(wěn)定性遠(yuǎn)未達(dá)標(biāo)。

模仿學(xué)習(xí)雖對(duì)泛化控制有所幫助,但數(shù)據(jù)來源質(zhì)量仍未理想。遙操作數(shù)據(jù)復(fù)用性差,動(dòng)捕受限于設(shè)備布置和數(shù)據(jù)量,視頻數(shù)據(jù)則存在解析難題。

大模型方向正在成為機(jī)器人智能的另一個(gè)探索維度。視覺語言模型(VLM)以通用模型能力對(duì)抗任務(wù)復(fù)雜性,VLA 架構(gòu)也試圖將知識(shí)遷移至運(yùn)動(dòng)指令生成。

但由于大模型對(duì)硬件資源需求極高,響應(yīng)延遲長(zhǎng),目前仍停留在任務(wù)拆解、路徑規(guī)劃等認(rèn)知層面,真正的運(yùn)動(dòng)控制仍依賴小腦的高速反饋機(jī)制。

視覺系統(tǒng)作為人形機(jī)器人的“眼睛”,其在復(fù)雜環(huán)境下的穩(wěn)定性和多樣性處理能力成為關(guān)鍵短板。

3D視覺路線雖然豐富,如多目立體視覺、dToF、結(jié)構(gòu)光、激光雷達(dá)等,但各有利弊。成本、精度、環(huán)境適應(yīng)性、安全性之間難以兼得。

比如,結(jié)構(gòu)光適用于室內(nèi)近距離成像,但室外表現(xiàn)差且體積大;激光雷達(dá)精度高但價(jià)格昂貴;單目視覺+深度學(xué)習(xí)成本低卻受制于遮擋和紋理缺失等問題。

服務(wù)機(jī)器人領(lǐng)域已出現(xiàn)相對(duì)成熟的解決方案。奧比中光在3D視覺傳感器市場(chǎng)的高占有率即是一例,其產(chǎn)品面向多種機(jī)器人類型,并針對(duì)不同場(chǎng)景進(jìn)行了針對(duì)性優(yōu)化。

抓取和操作是機(jī)器人能否勝任任務(wù)的核心能力,靈巧手因此成為另一個(gè)技術(shù)高地。當(dāng)前各廠商在手部結(jié)構(gòu)、控制策略、感知能力等方面進(jìn)行深入差異化探索。靈心巧手、雷賽智能等廠商推出多個(gè)自由度和不同任務(wù)類型適配的產(chǎn)品,但仍面臨泛化抓取動(dòng)作穩(wěn)定性不足的問題。

手眼協(xié)同是解決這一困境的關(guān)鍵。僅依賴視覺或觸覺完成精準(zhǔn)操作成功率有限,結(jié)合視覺識(shí)別與觸覺反饋實(shí)現(xiàn)動(dòng)態(tài)調(diào)整,已成為提升上肢操作能力的主流路徑。雷賽智能的遙操作訓(xùn)練與帕西尼的模仿策略均在嘗試將人類操作經(jīng)驗(yàn)轉(zhuǎn)移至機(jī)器人身上,為提升泛化能力探索出更多可能性。

小結(jié)

走向?qū)嵱玫娜诵螜C(jī)器人,

需要更多耐心與積累

人形機(jī)器人正站在“走出實(shí)驗(yàn)室”的臨界點(diǎn)。從本體制造、控制系統(tǒng)、核心零部件到應(yīng)用場(chǎng)景拓展,技術(shù)與產(chǎn)業(yè)生態(tài)同步演進(jìn),激發(fā)出前所未有的行業(yè)活力。

人形機(jī)器人真正實(shí)現(xiàn)類人的智能行為、運(yùn)動(dòng)能力與操作能力仍非一日之功。從大小腦系統(tǒng)的分布式控制,到多模態(tài)感知與手眼協(xié)同策略,每一個(gè)技術(shù)模塊的突破都需耗費(fèi)大量資源與時(shí)間。

如何在商業(yè)化進(jìn)程與技術(shù)打磨之間找到平衡,是當(dāng)前每一個(gè)從業(yè)者都必須面對(duì)的問題。

       原文標(biāo)題 : 人形機(jī)器人如何做到:手眼協(xié)同+大小腦協(xié)同?

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)