Facebook研究機(jī)器人,是打的什么算盤(pán)?
這對(duì)Facebook有什么用呢?
Facebook在計(jì)算機(jī)視覺(jué)方面一直走在前列,正如我們?cè)谒南鄼C(jī)和圖像處理程序以及Portal等設(shè)備上看到的那樣,Potal會(huì)用它的“臉”跟著用戶在房間里轉(zhuǎn)來(lái)轉(zhuǎn)去。
雖然聽(tīng)上去有些驚悚,但是好奇心對(duì)于這些需要了解他們所看到或感覺(jué)到的環(huán)境才能正常工作的應(yīng)用程序來(lái)說(shuō)都是至關(guān)重要的。
任何在應(yīng)用程序或設(shè)備上運(yùn)行的攝像頭,比如Facebook上的攝像頭,都在不斷地分析它所看到的圖像,以獲取有用的信息。
當(dāng)一張臉進(jìn)入畫(huà)面時(shí),十幾個(gè)新的算法就會(huì)同時(shí)啟動(dòng)并開(kāi)始工作。如果有人舉起一個(gè)物體,攝像頭就會(huì)忙著分析:它有文字內(nèi)容嗎?需要翻譯嗎?有二維碼嗎?背景有多遠(yuǎn)?
如果設(shè)備要及時(shí)完成這些任務(wù),就會(huì)產(chǎn)生CPU使用率峰值、可見(jiàn)延遲以及用戶或系統(tǒng)工程師不希望出現(xiàn)的種種情況。
相反,如果人工智能助理在對(duì)場(chǎng)景感到不確定性時(shí),發(fā)揮它的好奇心去檢查這些東西,確定分析物體的優(yōu)先級(jí),是個(gè)相當(dāng)不錯(cuò)的折衷辦法。
通過(guò)觸摸感知
盡管視覺(jué)很重要,但它不是我們或機(jī)器人感知世界的唯一方式。許多機(jī)器人都配備了運(yùn)動(dòng)、聲音和其他形式的傳感器,但對(duì)物體的實(shí)際接觸相對(duì)較少。我們可以把它歸因于缺乏良好的觸覺(jué)接口。
盡管如此,F(xiàn)acebook的研究人員還是想研究使用觸覺(jué)數(shù)據(jù)代替視覺(jué)數(shù)據(jù)的可能性。
仔細(xì)想想,這完全是正常的,就像有視覺(jué)障礙的人用觸覺(jué)來(lái)了解周圍的環(huán)境,獲取關(guān)于物體的細(xì)節(jié)。
因此,F(xiàn)acebook的研究人員部署了一個(gè)人工智能模型,機(jī)器人根據(jù)視頻來(lái)決定采取什么行動(dòng),但不是實(shí)際的視頻數(shù)據(jù),而是給它輸入高分辨率的觸摸數(shù)據(jù)。
結(jié)果表明,該算法并不真正關(guān)心它是否像我們平時(shí)觀察世界的圖像,只要數(shù)據(jù)是以視覺(jué)方式呈現(xiàn)的,例如作為觸覺(jué)傳感器上的壓力圖,它就可以像圖像一樣分析該模式。
這對(duì)Facebook有什么用呢?
雖然Facebook對(duì)用戶接觸并沒(méi)有多大興趣。但這不僅僅是接觸的問(wèn)題,而是跨模式應(yīng)用學(xué)習(xí)。
試想你第一次看到兩個(gè)不同的物體,閉上眼睛,單靠觸摸就可以很容易地分辨出來(lái)。為什么會(huì)這樣?
因?yàn)楫?dāng)你看到某個(gè)東西時(shí),你不只是觀察到它的樣子,還構(gòu)想了一個(gè)內(nèi)部模型來(lái)表示它,包含了多種感官和視角。
類似地,人工智能助理可能需要將其學(xué)習(xí)的內(nèi)容從一個(gè)領(lǐng)域轉(zhuǎn)移到另一個(gè)領(lǐng)域,比如說(shuō)聽(tīng)覺(jué)數(shù)據(jù)告訴握力傳感器如何握緊物體,或者視覺(jué)數(shù)據(jù)告訴麥克風(fēng)如何分離聲音。
現(xiàn)實(shí)世界是一個(gè)復(fù)雜的環(huán)境,這里的數(shù)據(jù)更嘈雜,信息量更大。無(wú)論數(shù)據(jù)類型如何,都能夠利用這些數(shù)據(jù)對(duì)于可靠理解和與現(xiàn)實(shí)交互非常重要。
所以你會(huì)發(fā)現(xiàn),這些研究本有趣,而且事實(shí)上也很重要。正如描述這項(xiàng)研究的博客文章所言:“我們專注于使用機(jī)器人技術(shù),這不僅會(huì)生產(chǎn)出更有能力的機(jī)器人,還將在未來(lái)數(shù)年或者數(shù)十年內(nèi)挑戰(zhàn)人工智能的極限。如果我們想要更接近像人類那樣思考、計(jì)劃和推理的機(jī)器,那么我們需要構(gòu)建人工智能系統(tǒng),使其能夠在多種場(chǎng)景中自主學(xué)習(xí),不僅僅是在虛擬的數(shù)字世界!
隨著各大網(wǎng)絡(luò)社交媒體不斷擴(kuò)大其影響力,其應(yīng)用程序和服務(wù)的的范圍涉及日常生活的方方面面,它對(duì)人工智能助力的要求也就越來(lái)越復(fù)雜。
雖然我們不會(huì)很快看到一個(gè)“Facebook機(jī)器人”,但未來(lái)可期。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?