年薪超 300萬,OpenAI 重金砸向人形機(jī)器人
作者|凌霄
編輯|白雪
人形機(jī)器人的火,終于燒到了 AI 界最亮眼的公司、估值達(dá)萬億的 OpenAI 身上。
2024 年底,OpenAI 傳出重組機(jī)器人團(tuán)隊(duì),準(zhǔn)備自研人形機(jī)器人的消息。
今年 1 月份,消息被證實(shí)了。
OpenAI 開放了 3 個(gè)機(jī)器人相關(guān)的崗位,其中兩個(gè)是工程師,一個(gè)是項(xiàng)目經(jīng)理(現(xiàn)已關(guān)閉,疑似已招到人),待遇豐厚,不僅可以享有股權(quán),最高年薪還可達(dá) 44 萬美元,約合人民幣 318 萬元。
入局人形機(jī)器人,OpenAI 在技術(shù)上擁有巨大的優(yōu)勢(shì)。
大模型通常被認(rèn)為是人形機(jī)器人的大腦,是人形機(jī)器人最核心的技術(shù)之一,決定了機(jī)器人的智能水平。
人形機(jī)器人行業(yè)再度興起,主要是因?yàn)榛?Transformer 架構(gòu)的大模型取得了突破性進(jìn)展。這種架構(gòu)讓大模型擁有了強(qiáng)大的語言理解、生成能力。
借助大模型的泛化能力,人形機(jī)器人得以突破有限規(guī)則編程的束縛,能夠理解語言與環(huán)境,執(zhí)行復(fù)雜任務(wù)。
這背后,讓大模型取得技術(shù)突破的公司,正是 OpenAI。
2022 年 OpenAI 的 ChatGPT 問世,在全球范圍內(nèi)掀起了生成式 AI 的浪潮,創(chuàng)造了引起科技行業(yè)重大變革的「ChatGPT 時(shí)刻」,同時(shí)也帶飛了人形機(jī)器人行業(yè)。
至今為止,OpenAI 仍然是大模型風(fēng)潮的引領(lǐng)者,掌握著世界領(lǐng)先的 AI 技術(shù)。
人形機(jī)器人行業(yè),迎來了史上最強(qiáng)玩家。
招聘機(jī)器人工程師
年薪比特斯拉高 4 倍
根據(jù) OpenAI 官網(wǎng)介紹,機(jī)器人團(tuán)隊(duì)將專注于通用機(jī)器人,并在動(dòng)態(tài)的現(xiàn)實(shí)世界環(huán)境中推動(dòng) AGI 級(jí)智能(AGI 即通用人工智能)。
OpenAI 內(nèi)部人士向科技媒體 The Information 透露了更多細(xì)節(jié):OpenAI 的方向是研發(fā)有雙臂、雙腿的人形機(jī)器人。
不過,目前從 OpenAI 的動(dòng)作來看,它并沒有大舉擴(kuò)張,而是想先打好硬件基礎(chǔ),確定建造機(jī)器人本體的可行性。
為此,OpenAI 在 2024 年 11 月聘請(qǐng)了前 Meta 增強(qiáng)現(xiàn)實(shí)眼鏡項(xiàng)目負(fù)責(zé)人 Caitlin Kalinowski,負(fù)責(zé)領(lǐng)導(dǎo)機(jī)器人和消費(fèi)硬件。
Caitlin Kalinowski 擁有豐富的機(jī)器硬件設(shè)計(jì)與制造經(jīng)驗(yàn)。
她曾在蘋果為 MacBooks 設(shè)計(jì)硬件,隨后加入 Meta,負(fù)責(zé)全息 AR 眼鏡 Orion 的制造,并領(lǐng)導(dǎo)了 Meta 虛擬現(xiàn)實(shí)眼鏡硬件團(tuán)隊(duì)大約九年。
Caitlin Kalinowski 還介紹,OpenAI 的計(jì)算主管 Christopher Berner 將負(fù)責(zé)機(jī)器人軟件方面的工作。
Christopher Berner 在 OpenAI 任職長(zhǎng)達(dá) 8 年,是資深的高級(jí)技術(shù)人員,主要從事機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等領(lǐng)域的研究和開發(fā)工作,在徹底改革 OpenAI 的深度學(xué)習(xí)基礎(chǔ)設(shè)施方面發(fā)揮了關(guān)鍵作用。
經(jīng)過兩個(gè)月醞釀,今年 1 月,Caitlin Kalinowski 宣布 OpenAI 開放了 3 個(gè)機(jī)器人相關(guān)的崗位,分別是:
機(jī)器人系統(tǒng)集成電氣工程師:負(fù)責(zé)機(jī)器人系統(tǒng)從原型設(shè)計(jì)到量產(chǎn)方案的設(shè)計(jì)與集成。Caitlin Kalinowski 介紹該崗位的工作主要是為機(jī)器人設(shè)計(jì)傳感器套件。機(jī)器人機(jī)械設(shè)計(jì)工程師:負(fù)責(zé)評(píng)估和改進(jìn)機(jī)器人身體的硬件配置,包括集成新型傳感器、執(zhí)行器和計(jì)算元件等,需要具有設(shè)計(jì)機(jī)器人齒輪、執(zhí)行器、電機(jī)和連桿的經(jīng)驗(yàn);TPM 經(jīng)理:即機(jī)器人技術(shù)項(xiàng)目經(jīng)理,負(fù)責(zé)產(chǎn)品技術(shù)項(xiàng)目管理工作,包括搭建實(shí)驗(yàn)室,確保機(jī)器人設(shè)計(jì)各階段的工作順利進(jìn)行。
目前 TPM 經(jīng)理崗位的招聘已經(jīng)關(guān)閉,OpenAI 似乎已經(jīng)找到了合適的候選人。
與機(jī)器人領(lǐng)域的競(jìng)爭(zhēng)對(duì)手相比,OpenAI 開放的崗位很少。特斯拉開放了 50 個(gè)機(jī)器人相關(guān)崗位,人形機(jī)器人獨(dú)角獸 Figure AI 則開放了 89 個(gè)崗位。
這主要是因?yàn)?strong>人形機(jī)器人項(xiàng)目在 OpenAI 內(nèi)部的優(yōu)先級(jí)并不高。
據(jù) OpenAI 內(nèi)部人士透露,機(jī)器人項(xiàng)目并不是 OpenAI 的首要任務(wù),當(dāng)下 OpenAI 的重點(diǎn)依然是強(qiáng)化高級(jí)推理模型、開發(fā) AI 助理。
但 OpenAI 給出了極具吸引力的薪資待遇,同崗位的薪酬比特斯拉和 Figure AI 的高 2~4 倍,年薪最高達(dá)到 44 萬美元,約合人民幣 318 萬元,也就是月薪最高人民幣 26 萬元左右,此外還提供公司股權(quán)。
三家公司同崗位薪資對(duì)比如下:
對(duì)待人才,OpenAI 向來慷慨。
優(yōu)渥的薪酬待遇也是 OpenAI 在多位高管和核心技術(shù)人才離職后,仍然能夠保持對(duì)人才的吸引力,并順利推出新模型、新產(chǎn)品的原因。
現(xiàn)在,OpenAI 準(zhǔn)備用同樣的方法來招攬人形機(jī)器人領(lǐng)域的頂尖科學(xué)家,快速推進(jìn)機(jī)器人項(xiàng)目。
OpenAI 曾涉足機(jī)器人技術(shù)
因數(shù)據(jù)不足而放棄
在組建機(jī)器人團(tuán)隊(duì)之前,OpenAI 在人形機(jī)器人行業(yè)更為外界熟知的身份是投資人和技術(shù)賦能者。
OpenAI 投資了機(jī)器人相關(guān)的 3 家公司,涉及機(jī)器人本體與大腦,并為其中一家公司提供了模型方面的技術(shù)支持。它們都是現(xiàn)下行業(yè)中最受矚目,最具備發(fā)展?jié)摿Φ墓尽?/p>
2023 年 3 月,OpenAI 領(lǐng)投了挪威人形機(jī)器人企業(yè) 1X Technologics,后者在這輪融資中獲得了 2350 萬美元。
1X 成立于 2014 年,在人形機(jī)器人領(lǐng)域耕耘已久,目標(biāo)是制造家用人形機(jī)器人,其人形機(jī)器人 NEO 能夠整理杯具,拿起雞蛋,和人類擁抱。
接近一年后,2024 年 2 月,OpenAI 和微軟、英偉達(dá)等投資方投了人形機(jī)器人新秀 Figure AI,促成了 2024 年人形機(jī)器人領(lǐng)域最大的一筆融資,F(xiàn)igure AI 在這輪融資中獲得了 6.75 億美元(約合人民幣 47.3 億元)。
FigureAI 能夠獲得此次大額融資的原因是,它在 2024 年 1 月發(fā)布了機(jī)器人的視頻,機(jī)器人經(jīng)過 10 小時(shí)端到端神經(jīng)網(wǎng)絡(luò)的訓(xùn)練就學(xué)會(huì)了沖咖啡,展示出極其領(lǐng)先的自主學(xué)習(xí)與任務(wù)執(zhí)行能力。
Figure 01 機(jī)器人沖咖啡(2 倍速)
融資完成后,OpenAI 也成為 Figure AI 的合作伙伴,將自家的大模型接入 Figure AI 的人形機(jī)器人中,使其獲得了與人自然交流,理解環(huán)境、思考和推理的能力。
2024 年 11 月,Open AI 投資了具身智能初創(chuàng)公司 Physical Intelligence(PI),PI 獲得了 4 億美元(約合人民幣 28.39 億元)融資。
PI 是一家研發(fā)通用機(jī)器人大腦的公司,其π0 模型可以控制不同形態(tài)的機(jī)器人,使其執(zhí)行多樣化的任務(wù),比如疊衣服、整理桌子、雞蛋裝盒等,泛化能力極強(qiáng)。
可以看出,OpenAI 對(duì)機(jī)器人行業(yè)的投資策略是少而精,要投就投最好的。
實(shí)際上,OpenAI 不僅僅只是一個(gè)投資人,而是從一家從誕生之初就擁有機(jī)器人技術(shù)基因的公司。
Open AI 成立于 2015 年 12 月。2016 年 6 月,OpenAI 確立了其主要的發(fā)展目標(biāo),其中就包括制造「通用」機(jī)器人。
同年,OpenAI聘請(qǐng)了機(jī)器人學(xué)習(xí)專家 Pieter Abbeel。
OpenAI 聯(lián)合創(chuàng)始人 Wojciech Zaremba 也是機(jī)器人團(tuán)隊(duì)的領(lǐng)導(dǎo)者。
但在后續(xù)的研究中,OpenAI 只專注于機(jī)器人的軟件技術(shù),并且最終因?yàn)槿狈C(jī)器人相關(guān)的數(shù)據(jù)在 2021 年解散了機(jī)器人團(tuán)隊(duì),將重點(diǎn)轉(zhuǎn)移到數(shù)據(jù)更容易獲得的其他領(lǐng)域。
他們?cè)跈C(jī)器人方向的研究成果主要有兩個(gè):訓(xùn)練機(jī)械手破解魔方和 Roboschool。
2017 年 5 月,OpenAI 開源了軟件 Roboschool,這是一個(gè)機(jī)器人模擬器,用戶可以在模擬器中控制并訓(xùn)練機(jī)器人。
2019 年 10 月,OpenAI 展示了他們訓(xùn)練機(jī)械手解開魔方的成果。
這項(xiàng)技術(shù)并不完善,機(jī)械手解魔方的成功率為 60%。
OpenAI 的突破之處在于使用了類似人類手掌的機(jī)械手來解魔方,而不是專門設(shè)計(jì)用來破解魔方的機(jī)器。
OpenAI 利用神經(jīng)網(wǎng)絡(luò)技術(shù)在虛擬環(huán)境中訓(xùn)練機(jī)械手破解魔方,并開發(fā)了一種名為 ADR 的新算法,自動(dòng)生成難度遞增的訓(xùn)練環(huán)境,使得機(jī)械手能夠應(yīng)對(duì)復(fù)雜的情況,在執(zhí)行任務(wù)時(shí)具備抗干擾性。
需要注意的是,這項(xiàng)實(shí)驗(yàn)中使用的機(jī)械手并不是 OpenAI 開發(fā)的,而是英國靈巧手公司 Shadow 的產(chǎn)品。
AGI 已就緒,就差物理實(shí)體?
OpenAI 做人形機(jī)器人,目前最大的競(jìng)爭(zhēng)對(duì)手是特斯拉。
與特斯拉不同,OpenAI 并沒有硬件大規(guī)模制造經(jīng)驗(yàn)和供應(yīng)鏈搭建、管理經(jīng)驗(yàn)。但它擁有強(qiáng)大的大模型與算法,其業(yè)務(wù)線的拓展剛好為公司造人形機(jī)器人儲(chǔ)備了關(guān)鍵技術(shù)。
機(jī)器人需要獲取足夠的訓(xùn)練數(shù)據(jù)來學(xué)習(xí)新技能,數(shù)據(jù)來源主要有兩種,一是人類遙操,二是仿真平臺(tái)合成。
OpenAI 的視頻生成模型 Sora 已在 2024 年正式推出,可以根據(jù)文本、圖像和視頻重新生成高質(zhì)量的視頻,為機(jī)器人收集仿真合成數(shù)據(jù)提供了新的可能性。
除了 Sora 之外,2024 年,Open AI 還發(fā)布了多款重大產(chǎn)品,包括語音生成模型 Voice Engine、首款具有推理能力的 AI 大語言模型 o1、o1 的升級(jí)版 o3 等。
從語音交互、語言理解和思考推理,再到視頻數(shù)據(jù)生成,OpenAI 新產(chǎn)品的技術(shù)覆蓋了機(jī)器人在人機(jī)交互、智能決策和環(huán)境感知、數(shù)據(jù)訓(xùn)練等方面所必需的技術(shù)要點(diǎn)。
OpenAI 目前最核心的產(chǎn)品還是 ChatGPT,結(jié)合其他產(chǎn)品來看,其人形機(jī)器人最突出的能力可能首先會(huì)是人機(jī)交互。
而且,OpenAI 似乎已經(jīng)知道如何構(gòu)建通用人工智能(AGI),做人形機(jī)器人是在尋找一個(gè)可承接這個(gè)智能系統(tǒng)的物理實(shí)體。
AGI 是指模擬人類思維和決策過程的人工智能系統(tǒng)。這種人工智能具備與人類相似的智能水平和自學(xué)能力,可以適應(yīng)多種環(huán)境并自主執(zhí)行復(fù)雜的任務(wù)。
1 月 5 日,OpenAI 首席執(zhí)行官 Sam Altman 發(fā)布了意味深長(zhǎng)的六字短語,意為奇點(diǎn)臨近,不知身處何方。網(wǎng)友紛紛猜測(cè)奇點(diǎn)是什么。
第二天,Sam Altman 就公布了答案。他發(fā)表了題為《反思》的新年博客文章,稱 OpenAI 已經(jīng)知道如何構(gòu)建通用人工智能,且正在逐漸接近通用人工智能。
在最近的一次采訪中,Sam Altman 認(rèn)為,在接下來的 18 個(gè)月內(nèi),快速的技術(shù)進(jìn)步可能導(dǎo)致變革性的 AI 系統(tǒng)出現(xiàn)。
OpenAI 在 AI 領(lǐng)域的技術(shù)領(lǐng)先是毋庸置疑的。微軟首席執(zhí)行官 Satya Nadella 認(rèn)為 OpenAI 的技術(shù)發(fā)展比其他公司領(lǐng)先兩年。
要造人形機(jī)器人,現(xiàn)在 OpenAI 面臨的挑戰(zhàn)有兩個(gè):
一是制造機(jī)器人本體;二是將 AI 技術(shù)應(yīng)用到機(jī)器人身上,并使其具備理解環(huán)境和執(zhí)行任務(wù)的能力。
制造機(jī)器人本體不算是一個(gè)太難的問題。現(xiàn)階段多數(shù)人形機(jī)器人公司只花了 1~2 年時(shí)間就造出了人形機(jī)器人,宇樹科技甚至僅用 6 個(gè)月就設(shè)計(jì)制造出人形機(jī)器人 G1。
宇樹科技創(chuàng)始人&CEO 王興興也曾說過,做人形機(jī)器人硬件不是瓶頸,目前限制整個(gè)具身智能發(fā)展的還是 AI 水平。
憑借行業(yè)已有的經(jīng)驗(yàn)和成果,OpenAI 有望更快完成人形機(jī)器人本體的設(shè)計(jì)制造。
將 AI 技術(shù)應(yīng)用到機(jī)器人身上的難度可能會(huì)更高,因?yàn)檫@個(gè)過程會(huì)同時(shí)涉及機(jī)器人感知、運(yùn)動(dòng)控制和多模態(tài)融合技術(shù)等多種復(fù)雜的技術(shù)。
不過,這是整個(gè)機(jī)器人行業(yè)目前都尚未解決的問題。
而 OpenAI 已在機(jī)器學(xué)習(xí)等底層技術(shù)上有深厚積累,憑借其強(qiáng)大的號(hào)召力和研發(fā)資源,極有可能在技術(shù)迭代與市場(chǎng)拓展中實(shí)現(xiàn)彎道超車,再度成為這一行業(yè)的引領(lǐng)者。
原文標(biāo)題 : 年薪超 300萬,OpenAI 重金砸向人形機(jī)器人

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?