訂閱
糾錯
加入自媒體

紅杉中國連投三輪,上海交大教授帶隊造機器人大腦

作者|向欣

編輯|白雪

今年,Deepseek 橫空出世。

超強性能、免費開源、低訓練成本等特點讓它如同一聲驚雷震撼了全世界,投資市場也在它的誕生和火爆中,看到中國企業(yè)做大模型的巨大潛力。

以具身智能大模型為代表的機器人大腦,現(xiàn)已成為具身智能領(lǐng)域,資本重點關(guān)注的核心賽道。

最近,具身智能大模型企業(yè)穹徹智能就完成了數(shù)億元 Pre-A++輪融資。盛宇投資、清科創(chuàng)投、嘉御資本、云啟資本、上海科創(chuàng)基金等機構(gòu)參投。

現(xiàn)下具身智能大模型技術(shù)路線以 VLA(視覺-語言-動作模型)、VLM(視覺-語言模型)為主流。

而穹徹智能則另辟蹊徑,把力反饋融入機器人決策過程,選擇研發(fā)「以力為中心」的具身智能大模型和相關(guān)工具與平臺,發(fā)布了穹徹具身大腦(Noematrix Brain)。

這種技術(shù)路線在視覺、語言信息之外,增加了力反饋的信息,使得機器人能夠更全面地認識現(xiàn)實世界。

借助 Noematrix Brain,在 2024 年 7 月,機器人就學會了幫人刮胡子,還能削黃瓜、疊衣服、收納桌面物品。

這個被刮胡子的人就是穹徹智能創(chuàng)始人之一盧策吾

其中,機器人疊衣服這一技能的展示,比美國明星具身智能企業(yè) Physical Intelligence 早了 4 個月。

針對業(yè)界普遍頭疼的數(shù)據(jù)問題,穹徹智能也提出了多種低成本、高效率的數(shù)據(jù)收集與機器人訓練方案,包括 CoMiner 伴隨式數(shù)采系統(tǒng)、規(guī);Ψ答伳7聰(shù)據(jù)與學習模型-力捕捉系統(tǒng) ForceMimic 等。

宇樹科技創(chuàng)始人王興興認為,相比硬件本體,機器人大腦才是目前最大的難題,全球都在等待機器人大腦的誕生。

穹徹智能給出了一個切實可行的答案。

創(chuàng)始人來自斯坦福

產(chǎn)業(yè)化經(jīng)驗豐富

穹徹智能 2023 年 11 月成立,由成立近十年、估值達 10 億美元的智能機器人公司非夕科技孵化。

截至目前,穹徹智能已完成 4 輪融資。頂尖投資機構(gòu) Prosperity7、紅杉中國連續(xù)三輪加注,充分顯示出資本對這家公司技術(shù)路線的高度認可。

縱觀具身智能領(lǐng)域,受資本歡迎的企業(yè),在人才上一般為「科研精英+產(chǎn)業(yè)老將」的配置,穹徹智能也不例外。

高校,或許是連接兩位創(chuàng)始人的紐帶。

穹徹智能創(chuàng)始人盧策吾、王世全均來自在機器人領(lǐng)域長期領(lǐng)先的頂尖高!绹固垢4髮W,且目前都任職于上海交通大學。

盧策吾是斯坦福大學人工智能實驗室博士后,師從知名學者李飛飛和 Leo Guibas 教授(美國工程院院士)。

2016 年,盧策吾回國發(fā)展,現(xiàn)任上海交通大學人工智能學院副院長及教授。

與盧策吾一樣,王世全也在斯坦福大學人工智能實驗室工作過。

王世全是斯坦福大學仿生與靈巧操作實驗室及人工智能實驗室(機器人方向)博士,于 2016 年創(chuàng)辦非夕科技,在通用機器人本體 AI 技術(shù)融合與場景應(yīng)用中積累了豐富經(jīng)驗。

2021 年,王世全開始擔任上海交通大學客座教授,目前兼任上海市科協(xié)常委。

在團隊中,盧策吾代表的是前沿科學力量,而王世全則代表商業(yè)化能力。

盧策吾是國內(nèi)最早研究具身智能領(lǐng)域的學者之一,也是該領(lǐng)域唯一的科學探索獎獲得者。

盧策吾在學術(shù)研究方面成果豐碩,他主導的科研團隊在《自然》、《自然-機器智能》、TPAMI、T-RO 等頂級期刊上發(fā)表了 100 多篇論文,獲國際機器人頂會最佳論文、最佳系統(tǒng)論文提名。

盧策吾團隊還原創(chuàng)提出了 AnyGrasp 抓取算法,讓機器人首次實現(xiàn)了在雜亂場景中也能像人一樣精準抓取物品。

團隊也是國內(nèi)唯一獲邀加入 Open X Embodiment Dataset 國際聯(lián)合具身智能大規(guī)模數(shù)據(jù)集項目的學術(shù)力量。

實際上,AnyGrasp 抓取算法也是上海交大-非夕科技聯(lián)合實驗室的研究成果。

該實驗室于 2019 年成立,為后續(xù)非夕科技孵化穹徹智能奠定了基礎(chǔ)。穹徹智能多項技術(shù)成果都是與上海交通大學聯(lián)合推出的。

除了高?蒲匈Y源支持外,作為穹徹智能的產(chǎn)業(yè)支持方,非夕科技不僅讓穹徹智能繼承了其在機器人力控技術(shù)上的技術(shù)優(yōu)勢,也能夠為穹徹智能提供硬件基礎(chǔ)與產(chǎn)品落地能力,使其技術(shù)能夠得到規(guī)模化應(yīng)用。

非夕科技是一家自適應(yīng)機器人公司,2022 年估值已達 10 億美元(約合人民幣 73 億),已發(fā)布兩款機器人產(chǎn)品,分別是七軸自適應(yīng)機器人 RIZON 拂曉、自適應(yīng)并聯(lián)機器人玄暉 Moonlight。

自適應(yīng)機器人可以理解為能夠適應(yīng)多個操作對象、多種環(huán)境、多類任務(wù)的智能機器人,兼具傳統(tǒng)工業(yè)機器人的高性能與協(xié)作機器人的安全性,主要形態(tài)為機械臂、四足機器人等。

2020 年,非夕科技就已實現(xiàn)了規(guī);慨a(chǎn),首批百臺自適應(yīng)機器人在華南制造中心順利投產(chǎn)下線。

目前,非夕科技機器人產(chǎn)品已在工業(yè)制造、食品加工及醫(yī)療服務(wù)等多個行業(yè)廣泛應(yīng)用,能夠執(zhí)行裝配、打磨拋光、汽車座椅熨燙、新能源汽車充電等多種復雜任務(wù),產(chǎn)品已經(jīng)過市場驗證。

這意味著相較其他具身智能大模型企業(yè),穹徹智能擁有天然的硬件優(yōu)勢。其在技術(shù)成果展示中,也多次使用非夕科技的機械臂作為載體。

雖然力控技術(shù)一脈相承,但兩家公司的路線仍然有差異,穹徹展示的技能大多面向家庭場景,而非夕科技的機器人多應(yīng)用于工業(yè)場景。

頂尖科研力量與成熟產(chǎn)業(yè)化經(jīng)驗的融合,使得穹徹智能更容易在技術(shù)深度與商業(yè)落地之間實現(xiàn)高效閉環(huán)。

讓機器人學會削黃瓜、疊衣服

自主性極高

穹徹智能的研發(fā)思路是,回歸問題本質(zhì)提出解決方案,同時保證技術(shù)的可實現(xiàn)性與商業(yè)上的可落地性。

這兩點,恰好滿足了現(xiàn)在資本既追求前沿技術(shù),又希望快速實現(xiàn)投資回報的需求。

穹徹智能主要解決具身智能領(lǐng)域兩個目前最核心的難題:大模型、數(shù)據(jù),提出了創(chuàng)新的解決方案,并且一直以低成本、高效率、可規(guī);鳛樨灤┘夹g(shù)研發(fā)、方案設(shè)計全流程的重要原則。

大模型方面,穹徹智能推出了兼顧泛化性和落地性能要求的具身智能大腦 Noematrix Brain。

盧策吾認為,不能單純地通過復制語言大模型 Scaling Law 的方式來打造具身智能大模型。

因為語言大模型的訓練方法是填充海量的互聯(lián)網(wǎng)數(shù)據(jù)。具身智能相應(yīng)需要的是大量來自現(xiàn)實世界的物理交互數(shù)據(jù)

按照這種技術(shù)路線,具身智能需要 1:1 的實際數(shù)據(jù)采集,但這些數(shù)據(jù)的生成、獲取難度和成本遠高于互聯(lián)網(wǎng)數(shù)據(jù),在數(shù)量和質(zhì)量上都無法滿足具身智能大模型的訓練需求。

所以,盧策吾團隊不依賴于傳統(tǒng)路徑,而是基于第一性原理,回歸到具身智能大模型需要知道「世界是什么」;其次它要知道「如何決策」這兩個本質(zhì)問題上來思考解決方法,重新設(shè)計技術(shù)框架。

穹徹智能通過將操作的物理常識和力反饋結(jié)合在一起,打造了兩個大模型。

具身智能大腦 Noematrix Brain 就是由這兩個大模型組成,它們分別是:

實體世界大模型:教機器人掌握基本的物理常識,理解世界

機器人行為大模型:機器人結(jié)合物理常識和操作時的反饋力來調(diào)整動作,像人類一樣進行決策、使用力量。

兩個大模型構(gòu)成一體,進行端到端的聯(lián)合訓練。

打個比喻,傳統(tǒng)的技術(shù)路線是讓人類老師親身給機器人示范動作,并且事無巨細告訴機器人現(xiàn)場的所有細節(jié),每面對一個新環(huán)境、新任務(wù),需要重新進行基礎(chǔ)教學。

而穹徹智能的技術(shù)路線是,讓老師教機器人物理知識,理解物體之間的力學關(guān)系,結(jié)合語言/視覺大模型做預(yù)訓練或輔助,再讓機器人自己在現(xiàn)實世界中根據(jù)這些知識和力反饋進行學習。

理論上,穹徹智能創(chuàng)新的技術(shù)路線能夠降低具身智能大模型的數(shù)據(jù)量需求,使訓練變得低成本、可規(guī);6诂F(xiàn)實中,它已經(jīng)展示出可行性。

2024 年 7 月舉辦的世界人工智能大會期間,具身智能大腦 Noematrix Brain 部署到雙臂機器人、單臂移動機器人上,在展會現(xiàn)場首次公開展示多種技能,成功執(zhí)行了整理、收納桌面/地面物品,疊衣服,削黃瓜等任務(wù)。

這些任務(wù)對于人類來說很簡單,對于機器人來說卻極其復雜,尤其是疊衣服與削黃瓜。

執(zhí)行這些任務(wù)涉及高精度的力控和運動規(guī)劃,對柔性物體的操作要求極高,需要機器人實時調(diào)整抓取力道,避免破損或滑動。

任務(wù)之間差異大,也要求大模型具備強大的泛化能力,以便應(yīng)對不同形態(tài)和材質(zhì)的物品,并根據(jù)環(huán)境實時調(diào)整策略完成操作。

自主性是這個大腦的重要特點。任務(wù)執(zhí)行過程中,具身大腦自主進行的操作包括但不限于物品識別、軌跡規(guī)劃、決策、避障等等。

降低數(shù)據(jù)獲取成本

數(shù)采系統(tǒng)已獲百套訂單

數(shù)據(jù)方面,穹徹智能聯(lián)合上交大研發(fā)了三種數(shù)據(jù)采集方式,并推出了一個數(shù)據(jù)集,包括:

Noematrix CoMiner 伴隨式數(shù)采系統(tǒng),基于「生產(chǎn)伴隨」式外骨骼數(shù)據(jù)采集方式研發(fā);

規(guī);Ψ答伳7聰(shù)據(jù)與學習模型-力捕捉系統(tǒng) ForceMimic;

視覺-觸覺聯(lián)合記錄和追蹤系統(tǒng) ViTaM;

雙手復雜操作任務(wù)數(shù)據(jù)集 OakInk2:涵蓋廚房、書房、實驗室、浴室 4 大交互場景,包含 75 類物體。

這些數(shù)據(jù)采集方案,都在降低數(shù)據(jù)獲取成本的同時,提高了數(shù)據(jù)利用效率。

「生產(chǎn)伴隨」式外骨骼數(shù)據(jù)采集方式解決的是傳統(tǒng)遙操作設(shè)備昂貴且缺乏便攜性的問題。

研究團隊開發(fā)了一款開源、低成本、通用、便攜、持久耐用和易維護的外骨骼設(shè)備 AirExo,可適配多種機械臂。

AirExo 不僅支持雙臂機器人的遙操作完成數(shù)據(jù)采集,還能不局限于實驗室,直接記錄廣泛且經(jīng)濟的野外演示數(shù)據(jù)。

團隊僅通過 3 分鐘的遙操作演示,結(jié)合 AirExo 收集的廣泛和多樣化的野外數(shù)據(jù),所訓練的機器人策略能夠媲美通過超過 20 分鐘遙操作演示學習的策略,數(shù)采效率提升 7 倍。

規(guī);Ψ答伳7聰(shù)據(jù)與學習模型-力捕捉系統(tǒng) ForceMimic,則是解決機器人力控數(shù)據(jù)收集的問題。力控技術(shù)在機器人操作中至關(guān)重要,而業(yè)界缺乏大規(guī)模力交互數(shù)據(jù)。

ForceMimic 系統(tǒng)由兩個部分組成:

ForceCapture:能「記錄人怎么操作東西」的設(shè)備,可精準、實時捕捉并記錄操作過程中的力、姿態(tài)及運動軌跡等多維度數(shù)據(jù);

HybridIL:能「讓機器人學會人類怎么操作」的模仿學習算法。

實驗表明,F(xiàn)orceCapture 的數(shù)據(jù)采集效率幾乎是遙操作的 3 倍,且該設(shè)備幾乎無需任何額外培訓,比需要對操作員進行專業(yè)培訓的遙操作設(shè)備更具易用性。

系統(tǒng)的另一組成部分——算法 HybridIL 也表現(xiàn)出優(yōu)秀的性能,能夠在嚴苛的條件下保持 85% 的任務(wù)執(zhí)行成功率。

視覺-觸覺聯(lián)合記錄和追蹤系統(tǒng) ViTaM 解決的是數(shù)據(jù)收集過程中,存在視野盲區(qū)的問題。

ViTaM 系統(tǒng)同樣由兩個部分組成:

一個可伸縮的觸覺手套和一個 3D 相機:負責記錄操作過程;

一個基于視覺-觸覺的聯(lián)合學習框架:重建被手部遮擋或形變的物體細節(jié)。

人在操作時常常會遮擋關(guān)鍵部位,尤其是處理柔軟或易變形物體時,單靠視覺難以感知細節(jié)。

ViTaM 系統(tǒng)的作用就是,幫助機器人從現(xiàn)實世界中獲得操作數(shù)據(jù)的完整狀態(tài),從而實現(xiàn)和人類一樣的靈巧操作。

比如在拿一塊海綿時,ViTaM 系統(tǒng)能夠讓機器人感知到其柔軟性、面向手掌心部分的形變情況以及接觸的力度,從而精確地控制操作。

在商業(yè)化方面,穹徹智能的種種技術(shù)成果,得到了市場的初步認可,不僅獲得了訂單,也正在家庭服務(wù)、食品加工等場景嘗試落地。

穹徹智能具身智能大腦 Noematrix Brain 獲得單場景百套訂單的突破,基于「生產(chǎn)伴隨」式數(shù)據(jù)采集方式研發(fā)的數(shù)采系統(tǒng)也獲得了近百套訂單。

在家庭服務(wù)場景,穹徹智能與海爾機器人聯(lián)合研發(fā)了兩款家庭機器人,分別能夠自主閉環(huán)完成地面物品清理、衣物洗烘任務(wù)。

在食品加工領(lǐng)域,「穹徹智能」已與知名食品廠商達成合作意向,雙方將加快復雜食品生產(chǎn)、加工處理產(chǎn)線的智能化與自動化轉(zhuǎn)型。

具身智能仍面臨著許多技術(shù)和應(yīng)用上的挑戰(zhàn),尤其是在大模型訓練的數(shù)據(jù)難題、低效的訓練方式以及如何讓機器人真正理解和適應(yīng)復雜的現(xiàn)實世界等問題上進展緩慢。

結(jié)合低成本、高效率的數(shù)據(jù)收集、利用方式,以及創(chuàng)新的具身智能大模型技術(shù)路線,穹徹智能為行業(yè)提供了一個具有可持續(xù)性與可擴展性的技術(shù)方案,有望繼續(xù)拓展具身智能的應(yīng)用邊界。

       原文標題 : 紅杉中國連投三輪,上海交大教授帶隊造機器人大腦

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號