人形機(jī)器人如何做到:手眼協(xié)同和大小腦協(xié)同?
芝能科技出品
人形機(jī)器人正逐漸從前沿實(shí)驗(yàn)室邁向產(chǎn)業(yè)化落地階段,成為人工智能和智能制造融合的關(guān)鍵技術(shù)代表。
特斯拉 Optimus 的硬件方案提出后,激發(fā)全球人形機(jī)器人行業(yè)快速發(fā)展,中國(guó)本土企業(yè)在本體制造、核心零部件、自主算法等多個(gè)層面積極參與,產(chǎn)業(yè)生態(tài)日益豐富。政策助推、產(chǎn)學(xué)研聯(lián)動(dòng)與供應(yīng)鏈的多元演進(jìn)共同推動(dòng)這一技術(shù)群體步入規(guī);A段。
但在實(shí)現(xiàn)類人運(yùn)動(dòng)控制、視覺感知、手眼協(xié)同等方面仍面臨眾多技術(shù)難點(diǎn),人形機(jī)器人從“能用”走向“好用”依然任重道遠(yuǎn)。我們從硬件演進(jìn)、功能實(shí)現(xiàn)、現(xiàn)實(shí)應(yīng)用展開分析,梳理當(dāng)前階段的關(guān)鍵矛盾與發(fā)展趨勢(shì)。
01
技術(shù)演進(jìn)
與產(chǎn)業(yè)生態(tài)的迅速成型
人形機(jī)器人的產(chǎn)業(yè)化起點(diǎn)在特斯拉提出 Optimus 硬件設(shè)計(jì)方案之后變得清晰可見。其采用的 14 個(gè)旋轉(zhuǎn)執(zhí)行器和 14 個(gè)直線執(zhí)行器,為行業(yè)標(biāo)準(zhǔn)化設(shè)計(jì)提供了參考框架,也拉高了公眾和行業(yè)對(duì)大規(guī)模量產(chǎn)可能性的期待。
在這個(gè)標(biāo)桿的帶動(dòng)下,全球各地開始加速推進(jìn)人形機(jī)器人的開發(fā),中國(guó)尤其表現(xiàn)出迅猛發(fā)展態(tài)勢(shì)。
國(guó)產(chǎn)廠商在形態(tài)設(shè)計(jì)上展現(xiàn)出高度差異化。從典型的雙足+直線+旋轉(zhuǎn)關(guān)節(jié),到雙足+純旋轉(zhuǎn)關(guān)節(jié)結(jié)構(gòu),再到雙足結(jié)合輪式底盤或完全輪式平臺(tái),產(chǎn)業(yè)呈現(xiàn)出多路徑演化趨勢(shì)。
這種技術(shù)和結(jié)構(gòu)多樣性背后,是國(guó)內(nèi)完整產(chǎn)業(yè)鏈的承載力在支撐著不同技術(shù)方向的快速試錯(cuò)與演化。
圍繞重點(diǎn)產(chǎn)品、關(guān)鍵技術(shù)和典型應(yīng)用場(chǎng)景,規(guī)劃至2027年綜合實(shí)力達(dá)到世界先進(jìn)水平,并輔以產(chǎn)業(yè)基金、創(chuàng)新中心建設(shè)等方式推動(dòng)資源配置優(yōu)化,國(guó)家級(jí)創(chuàng)新中心已在多地設(shè)立,成為產(chǎn)業(yè)鏈、科研院校和政策體系之間的有效橋梁。
本體廠商構(gòu)成也不再局限于傳統(tǒng)機(jī)器人企業(yè)。科技公司、汽車制造商、AI 創(chuàng)業(yè)公司等紛紛入局。
從宇樹科技的 G1、H1 系列,到小鵬計(jì)劃于 2026 年量產(chǎn)的工業(yè)級(jí)人形機(jī)器人,以及智元機(jī)器人的遠(yuǎn)征系列量產(chǎn)進(jìn)展,人形機(jī)器人正由“秀肌肉”的研發(fā)樣機(jī)轉(zhuǎn)向“謀落地”的功能場(chǎng)景適配。
支撐整個(gè)生態(tài)的零部件供應(yīng)體系正在同步演進(jìn)。以往如行星滾柱絲杠、空心杯電機(jī)等技術(shù)門檻較高的零件,在工藝持續(xù)優(yōu)化后也逐步具備量產(chǎn)能力。
標(biāo)準(zhǔn)工業(yè)品如伺服電機(jī)、諧波減速器已被納入大規(guī)模供應(yīng)邏輯,在滿足人形機(jī)器人對(duì)輕量化、高精度、高頻率響應(yīng)要求上不斷優(yōu)化。資本持續(xù)涌入核心零部件制造環(huán)節(jié),為后續(xù)產(chǎn)業(yè)放量奠定堅(jiān)實(shí)基礎(chǔ)。
02
核心功能的
技術(shù)挑戰(zhàn)與局部突破
人形機(jī)器人產(chǎn)業(yè)熱度高漲,真正讓機(jī)器人“動(dòng)起來、看得清、抓得準(zhǔn)”的技術(shù)挑戰(zhàn)依舊棘手。
以“大小腦”功能協(xié)同為例,當(dāng)前運(yùn)動(dòng)控制與泛化能力尚未成熟。人形機(jī)器人天生結(jié)構(gòu)復(fù)雜、質(zhì)心高、支撐面積小,在動(dòng)態(tài)平衡控制中遠(yuǎn)較四足結(jié)構(gòu)更加不穩(wěn)定。
控制方法上,無論是 MPC 還是 WBC,都面臨建模復(fù)雜度高與算力消耗巨大的問題。
學(xué)習(xí)方法雖然展示出驚艷的實(shí)驗(yàn)成果,例如強(qiáng)化學(xué)習(xí)可實(shí)現(xiàn)跳舞、踢球等復(fù)雜運(yùn)動(dòng),但受限于環(huán)境泛化能力低、獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)難、容錯(cuò)性差等因素,在真實(shí)場(chǎng)景中的可靠性和穩(wěn)定性遠(yuǎn)未達(dá)標(biāo)。
模仿學(xué)習(xí)雖對(duì)泛化控制有所幫助,但數(shù)據(jù)來源質(zhì)量仍未理想。遙操作數(shù)據(jù)復(fù)用性差,動(dòng)捕受限于設(shè)備布置和數(shù)據(jù)量,視頻數(shù)據(jù)則存在解析難題。
大模型方向正在成為機(jī)器人智能的另一個(gè)探索維度。視覺語言模型(VLM)以通用模型能力對(duì)抗任務(wù)復(fù)雜性,VLA 架構(gòu)也試圖將知識(shí)遷移至運(yùn)動(dòng)指令生成。
但由于大模型對(duì)硬件資源需求極高,響應(yīng)延遲長(zhǎng),目前仍停留在任務(wù)拆解、路徑規(guī)劃等認(rèn)知層面,真正的運(yùn)動(dòng)控制仍依賴小腦的高速反饋機(jī)制。
視覺系統(tǒng)作為人形機(jī)器人的“眼睛”,其在復(fù)雜環(huán)境下的穩(wěn)定性和多樣性處理能力成為關(guān)鍵短板。
3D視覺路線雖然豐富,如多目立體視覺、dToF、結(jié)構(gòu)光、激光雷達(dá)等,但各有利弊。成本、精度、環(huán)境適應(yīng)性、安全性之間難以兼得。
比如,結(jié)構(gòu)光適用于室內(nèi)近距離成像,但室外表現(xiàn)差且體積大;激光雷達(dá)精度高但價(jià)格昂貴;單目視覺+深度學(xué)習(xí)成本低卻受制于遮擋和紋理缺失等問題。
服務(wù)機(jī)器人領(lǐng)域已出現(xiàn)相對(duì)成熟的解決方案。奧比中光在3D視覺傳感器市場(chǎng)的高占有率即是一例,其產(chǎn)品面向多種機(jī)器人類型,并針對(duì)不同場(chǎng)景進(jìn)行了針對(duì)性優(yōu)化。
抓取和操作是機(jī)器人能否勝任任務(wù)的核心能力,靈巧手因此成為另一個(gè)技術(shù)高地。當(dāng)前各廠商在手部結(jié)構(gòu)、控制策略、感知能力等方面進(jìn)行深入差異化探索。靈心巧手、雷賽智能等廠商推出多個(gè)自由度和不同任務(wù)類型適配的產(chǎn)品,但仍面臨泛化抓取動(dòng)作穩(wěn)定性不足的問題。
手眼協(xié)同是解決這一困境的關(guān)鍵。僅依賴視覺或觸覺完成精準(zhǔn)操作成功率有限,結(jié)合視覺識(shí)別與觸覺反饋實(shí)現(xiàn)動(dòng)態(tài)調(diào)整,已成為提升上肢操作能力的主流路徑。雷賽智能的遙操作訓(xùn)練與帕西尼的模仿策略均在嘗試將人類操作經(jīng)驗(yàn)轉(zhuǎn)移至機(jī)器人身上,為提升泛化能力探索出更多可能性。
小結(jié)
走向?qū)嵱玫娜诵螜C(jī)器人,
需要更多耐心與積累
人形機(jī)器人正站在“走出實(shí)驗(yàn)室”的臨界點(diǎn)。從本體制造、控制系統(tǒng)、核心零部件到應(yīng)用場(chǎng)景拓展,技術(shù)與產(chǎn)業(yè)生態(tài)同步演進(jìn),激發(fā)出前所未有的行業(yè)活力。
人形機(jī)器人真正實(shí)現(xiàn)類人的智能行為、運(yùn)動(dòng)能力與操作能力仍非一日之功。從大小腦系統(tǒng)的分布式控制,到多模態(tài)感知與手眼協(xié)同策略,每一個(gè)技術(shù)模塊的突破都需耗費(fèi)大量資源與時(shí)間。
如何在商業(yè)化進(jìn)程與技術(shù)打磨之間找到平衡,是當(dāng)前每一個(gè)從業(yè)者都必須面對(duì)的問題。
原文標(biāo)題 : 人形機(jī)器人如何做到:手眼協(xié)同+大小腦協(xié)同?

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
5月30日立即下載>> 【白皮書】電子測(cè)試技術(shù)白皮書合集:解決五大核心挑戰(zhàn)
-
6月13日立即參評(píng)>> 【評(píng)選】維科杯·OFweek2025中國(guó)工業(yè)自動(dòng)化及數(shù)字化行業(yè)年度評(píng)選
-
6月13日立即參評(píng) >> 【評(píng)選】維科杯·OFweek 2025 傳感器行業(yè)年度評(píng)選
-
6月13日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
-
6月20日立即下載>> 【白皮書】精準(zhǔn)測(cè)量 安全高效——福祿克光伏行業(yè)解決方案
推薦專題
- 1 小米YU7新增835公里續(xù)航版,6-7月面市
- 2 “6億年薪”系誤讀,理想官方:老板實(shí)際只拿266萬
- 3 昆侖萬維24年?duì)I收56億,AI出海商業(yè)化獲重要進(jìn)展
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 中國(guó)“智造”背后的「關(guān)鍵力量」
- 6 大模型下半場(chǎng):Agent時(shí)代為何更需要開源模型
- 7 全球無人駕駛技術(shù)排名:誰才是細(xì)分賽道的扛把子?
- 8 全民智駕,宣告結(jié)束
- 9 營(yíng)收猛增46%,昆侖萬維成為AI“爆品工廠”
- 10 人形機(jī)器人,爆單了?