訂閱
糾錯(cuò)
加入自媒體

【年度專題】XR終端,能否吃到AI落地的最佳紅利?

2025-01-23 14:50
VR陀螺
關(guān)注

文/VR陀螺 萬里

不出意外,剛結(jié)束的2024年又是被AI狠狠刷屏的一年。

這一年以來,AI曾助推微軟以及英偉達(dá)先后登上了全球市值第一的寶座;諾貝爾物理學(xué)獎(jiǎng)、化學(xué)獎(jiǎng)兩大重磅獎(jiǎng)項(xiàng)均與AI相關(guān),另據(jù)CB Insights數(shù)據(jù)顯示,今年Q3季度,全球有接近1/3的風(fēng)投都流向了AI初創(chuàng)企業(yè)。

在XR領(lǐng)域,那些已經(jīng)落地亦或是正在籌備的終端產(chǎn)品當(dāng)中,里面均能看到AI的身影,而AI功能也將成為后續(xù)MR、AR硬件的核心用例之一。本文將回顧這一年以來AI的應(yīng)用落地盛況。

 兩件大事:AI眼鏡起風(fēng)、兩款A(yù)R新品 

如果說2023年對于理想AI硬件形態(tài)仍有不少爭論,那么到了2024年,指向性已經(jīng)明確了許多。

去年開春曾有三大重磅AI終端產(chǎn)品:Ray-Ban Meta、Humane Ai Pin以及Rabbit R1,它們分別是眼鏡形態(tài)、胸針形態(tài)以及手持設(shè)備形態(tài),從銷量以及用戶反饋來看,眼鏡形態(tài)的Ray-Ban Meta均位于前列。此外,Ray-Ban Meta已經(jīng)于去年銷量突破100萬臺(tái),得到了市場初步驗(yàn)證。

另外,我們也可以觀察這一年以來一眾頭部AI巨頭的硬件布局以及發(fā)聲:

7月,比爾蓋茨出席博客節(jié)目《the Next Big Idea》時(shí)曾提到,未來AI Agent的理想硬件形態(tài)可能包括耳機(jī)以及智能眼鏡兩種。

9月,Meta亮相了其首款A(yù)R眼鏡Orion,扎克伯格表示早在2014年團(tuán)隊(duì)便萌生了構(gòu)建下一代計(jì)算平臺(tái)的想法,這一硬件是眼鏡,它可以實(shí)現(xiàn)全息顯示以及AI助理兩大能力。“眼鏡具有獨(dú)特的優(yōu)勢,可以讓人們看到你所看到的,聽到你所聽到的。它們會(huì)給你非常微妙的反饋。”

11月,Meta前硬件硬件主管Caitlin Kalinowski跳槽到了OpenAI,Kalinowski曾負(fù)責(zé)了Orion、Ray-Ban Stories等項(xiàng)目。外界有猜測這是OpenAI布局AR眼鏡賽道的舉措之一。

12月,谷歌發(fā)布Gemini 2.0以及最新AI助手Project Astra,在DeepMind官網(wǎng),智能手機(jī)以及智能眼鏡是唯二兩款與Project Astra集成的硬件設(shè)備。

國內(nèi)市場,今年9月,字節(jié)跳動(dòng)完成對OWS耳機(jī)品牌Oladance的收購,傳內(nèi)部正在開發(fā)AI眼鏡。

今年11月,百度亮相AI眼鏡,也有傳言稱小米正在開發(fā)AI眼鏡產(chǎn)品并計(jì)劃于明年發(fā)布。

可以發(fā)現(xiàn),這幾家頭部企業(yè)矛頭所指、寄望于承載未來AI Agent體驗(yàn)的均為眼鏡設(shè)備。那么眼鏡設(shè)備的優(yōu)勢在哪里?

在筆者看來,理想的AI硬件需要滿足全天候陪伴、時(shí)刻洞察用戶意圖、交流私密等特性,經(jīng)過這幾個(gè)條件篩選,眼鏡、AI耳機(jī)、類似Humane Ai Pin的可穿戴設(shè)備會(huì)是潛在選擇。在這其中,眼鏡是綜合之選,原因在于它兼顧了優(yōu)秀的可穿戴屬性。此外,眼鏡里面還可以進(jìn)一步添加微顯示屏,以補(bǔ)齊視覺信息傳輸媒介。

當(dāng)然,從今年市場的新品數(shù)量以及熱度來看,眼鏡已然成為了里面的最大贏家。此前VR陀螺曾統(tǒng)計(jì),截至11月底,公開入局AI眼鏡的數(shù)量已經(jīng)達(dá)到了36家,產(chǎn)品數(shù)量預(yù)計(jì)超過了50+。此外,在CES期間,我們又可以看到系列AI眼鏡新品的亮相,如Halliday、雷神科技、XPERT等。

不難預(yù)見,新的一年當(dāng)中,VR/AR行業(yè)的一大重要看點(diǎn)是“百鏡大戰(zhàn)”,而在這其中國內(nèi)的戰(zhàn)況尤為激烈。

Ps:2024可能是眼鏡類產(chǎn)品在命名上最為混亂的一年,去年年初,筆者曾習(xí)慣于用智能眼鏡稱呼Ray-Ban Meta這一類不帶屏幕的產(chǎn)品,而AR眼鏡則是帶光學(xué)顯示的設(shè)備。隨著“AI含金量”日益提升,市場上又衍生出了“智能音頻眼鏡”、“拍攝眼鏡”、“AI眼鏡”、“AI+AR眼鏡”等多個(gè)版本。如何讓有關(guān)文章不引起歧義,成為了我這一年以來最為頭疼的事情之一。(這里再強(qiáng)調(diào)一遍,AI眼鏡指的是搭載AI功能但缺乏顯示的設(shè)備,AR眼鏡則在AI眼鏡基礎(chǔ)之上疊加了顯示屏幕)

從當(dāng)前來看,需不需要為眼鏡引入光學(xué)屏幕(此時(shí)便成為了AR眼鏡)仍是一個(gè)值得探討的問題,原因在于單從市場表現(xiàn)來看,沒有屏幕的眼鏡產(chǎn)品似乎更受歡迎,原因在于它可以更好控制設(shè)備外形體積,此外沒有顯示模組價(jià)格也可以更友好。

但不可否認(rèn)的是,從長遠(yuǎn)來看,AR眼鏡是AI眼鏡的發(fā)展必然,并且也將是此類產(chǎn)品的最終形態(tài)。在這一年中,海外的Snap以及Meta為AR眼鏡產(chǎn)品打了個(gè)樣。

Spectacles 5:雖然該產(chǎn)品只面向開發(fā)者推出,不過產(chǎn)品完成度已經(jīng)達(dá)到了較高水平,眼鏡為一體式形態(tài),運(yùn)行Snap OS系統(tǒng),支持手勢交互。其他方面,Snap已經(jīng)推出了AR創(chuàng)作平臺(tái)Lens Studio 5.0,并通過與OpenAI合作的方式為眼鏡引入了AI能力。

Spectacles 5,圖源:網(wǎng)絡(luò)

Meta Orion:這可能是當(dāng)前市面上做得最為極致的AR眼鏡,它的重量控制在了100g以內(nèi),外形趨近于普通AR眼鏡,并且提供了一整套完備的交互解決方案。在光學(xué)選擇上,Meta押注Micro-LED+光波導(dǎo),基于碳化硅波導(dǎo)將FoV提升到了70°。這款產(chǎn)品代表了Meta長期AR愿景的集中展示,只不過想要在消費(fèi)市場落地還有一段距離。

Meta Orion,圖源:網(wǎng)絡(luò)

 AI+AR:多模態(tài)AI上車,今年關(guān)鍵詞會(huì)是“端到端”以及記憶能力 

如果在2023年,可能很多人仍會(huì)好奇AR眼鏡的使用場景甚至殺手級用例是什么,而到了現(xiàn)在,答案已經(jīng)逐漸明朗,那便是AI。圍繞AI,今年國內(nèi)外AR廠商逐漸加碼,類似的報(bào)道屢見不鮮:

Meta堅(jiān)定押注AI大模型并積極提升背后的基礎(chǔ)設(shè)施建設(shè),并表示到“到2024年底,我們的目標(biāo)是擁有350000個(gè)NVIDIA H100 GPU”;近期也有消息稱,字節(jié)跳動(dòng)計(jì)劃2025年斥資至多70億美元購買英偉達(dá)芯片;而小米集團(tuán)近期也高調(diào)宣布開出千萬年薪挖角AI人才等。

如果從AI應(yīng)用場景來看,目前的AR眼鏡功能已經(jīng)逐步趨同,如AI助手已經(jīng)成為了很多眼鏡產(chǎn)品的標(biāo)配,這背后能力高低則主要取決于調(diào)用的大模型。此外,常見的AI功能還包括提詞翻譯、會(huì)議紀(jì)要等。

除了常見的功能場景外,這里進(jìn)一步列舉幾個(gè)去年曾出現(xiàn)的AI眼鏡產(chǎn)品的創(chuàng)新用例:

星紀(jì)魅族StarV Air2與手機(jī)系統(tǒng)打通,如可以實(shí)現(xiàn)眼鏡、手機(jī)同時(shí)雙向顯示翻譯內(nèi)容等多多端流轉(zhuǎn)體驗(yàn);

Rokid Glasses為盲人打造了基于多模態(tài)AI的無障礙模式;

影目科技INMO Go 2實(shí)現(xiàn)了離線翻譯;

閃極「拍拍鏡」A1引入了AI記憶系統(tǒng),可以記住用戶的各種圖像語音信息。

雷鳥V3拍攝眼鏡開發(fā)了AI電臺(tái)功能,基于攝像頭識(shí)別周圍環(huán)境并同步播放相匹配的音樂。

雷鳥V3拍攝眼鏡的部分創(chuàng)意用例,圖源:雷鳥創(chuàng)新

2024年年初,筆者曾在年度回顧中曾提到了“多模態(tài)AI”將成為AI眼鏡的標(biāo)配,并預(yù)言“AR眼鏡產(chǎn)品的攝像頭將會(huì)成為至關(guān)重要的模組之一,攝像頭或許會(huì)在AR眼鏡上率先落地,其優(yōu)先級甚至?xí)哂诠鈱W(xué)屏幕。”

現(xiàn)在再來回看,多模態(tài)AI的確成為了AI眼鏡的一大重要賣點(diǎn),如Ray-Ban Meta于十二月推送了實(shí)時(shí)人工智能,AI具備了理解實(shí)時(shí)視頻的能力;而近期發(fā)布的XREAL One雖然表示不盲目跟風(fēng)AI,但也同樣配備了一顆攝像頭外設(shè)以用于多模態(tài)AI拓展。

那么在新的一年中,AI眼鏡又會(huì)有何新趨勢?

圖源:星紀(jì)魅族

在體驗(yàn)方面,眼鏡的AI功能上限無疑直接取決于AI大模型的能力上限。這一年以來AI大模型的各項(xiàng)能力屢創(chuàng)新高,早些時(shí)候,我們?nèi)远嘁?ldquo;專家水平”來評價(jià)一款出色的AI大模型,而現(xiàn)在隨著GPT-o3等產(chǎn)品的出現(xiàn),它似乎已經(jīng)達(dá)到了“博士級別”。

對于這類層出不窮的AI大模型,筆者也已經(jīng)很難用常規(guī)的問題來判別它們AI能力的高低。在這種情況下,我認(rèn)為AR眼鏡后續(xù)應(yīng)該卷AI能力包括響應(yīng)速度、個(gè)性化能力等,因?yàn)檫@些指標(biāo)的提升對于當(dāng)前用戶感知會(huì)更加明顯。

端到端對話。在AI眼鏡興起初期,筆者曾陸陸續(xù)續(xù)體驗(yàn)了不少同類型產(chǎn)品,當(dāng)時(shí)的痛點(diǎn)主要有幾個(gè),一是調(diào)用AI語音電話時(shí)手機(jī)APP需要在前臺(tái)并且無法熄屏,二是AI響應(yīng)速度太慢,往往長達(dá)數(shù)秒,這很容易讓人失去使用的欲望。

去年GPT-4o的發(fā)布無疑是一個(gè)重要的轉(zhuǎn)折,因?yàn)樗谡Z音對話方面具有“斷檔式”領(lǐng)先優(yōu)勢,平均響應(yīng)速度為320ms,對話可以隨時(shí)打斷、系統(tǒng)可以理解用戶的情緒語氣,這已經(jīng)與與人類日常對話體驗(yàn)十分接近。

這種極低水平的延遲背后得益于模型的端到端訓(xùn)練,即所有輸入和輸出都由同一個(gè)神經(jīng)網(wǎng)絡(luò)處理。今年以來,國內(nèi)不少廠商其實(shí)也看到了端到端AI模型(特別是語音對話式AI)的好處,紛紛展開了相應(yīng)的研究。如科大訊飛于去年8月發(fā)布的星火極速超擬人交互技術(shù)背后應(yīng)用到了端到端的統(tǒng)一模型框架;而豆包于12月份的火山引擎Force大會(huì)上也宣布豆包端到端實(shí)時(shí)語音模型即將上線。預(yù)計(jì)在新的一年當(dāng)中,“端到端”將會(huì)成為AR眼鏡更為高頻的詞匯。

圖源:科大訊飛

個(gè)性化AI。AI Agent是很多人對于AI的終極幻想,與PC、手機(jī)等關(guān)注生產(chǎn)力場景的終端不同,AR眼鏡其實(shí)更應(yīng)該滿足我們的陪伴屬性。不過基于筆者對于AR眼鏡類產(chǎn)品的體驗(yàn)發(fā)現(xiàn),AI在響應(yīng)用戶需求的時(shí)候仍略顯呆板,這是由多方面原因所導(dǎo)致的。

一方面如果我們想要AI更了解我們,那么就需要它對于我們的生活參與更多,如相機(jī)、麥克風(fēng)實(shí)時(shí)處于響應(yīng)狀態(tài)等,這對于設(shè)備續(xù)航是一個(gè)極大的考驗(yàn)。當(dāng)然,這背后也涉及到隱私問題。

另一方面,目前AI大模型的“記憶能力”仍是一個(gè)稀缺屬性,它們只能機(jī)械式記錄特定token數(shù)的上下文信息,因而用戶與之互動(dòng)過程中會(huì)明顯感覺到一種“隔閡”,難以產(chǎn)生體驗(yàn)黏性。(如果能實(shí)現(xiàn)這一點(diǎn),現(xiàn)如今林林總總的年度報(bào)告簡直不值一提。)

好消息是,關(guān)于超強(qiáng)記憶AI似乎很快迎來重要突破,微軟AI CEO Mustafa Suleyman早些時(shí)候接受采訪時(shí)曾提到,微軟正在開發(fā)具有“近乎無限”內(nèi)存功能的技術(shù)。這項(xiàng)進(jìn)步預(yù)計(jì)將于2025年實(shí)現(xiàn),它將使AI能夠無限期地保留信息,從而改變用戶參與度。

無獨(dú)有偶,近日OpenAI CEO Sam Altman公布了公司的新目標(biāo),“更好的記憶力,更長的上下文”赫然在列。

圖源:X

功能落地方面,去年年末Meta以及谷歌均展示了帶短暫記憶能力的AI功能體驗(yàn),如Ray-Ban Meta可以幫你記住停車位置、搭載Android XR的眼鏡可以幫你記住大門的密碼鎖等。谷歌近期所更新的AI助手Project Astra也以“記憶”作為重要功能之一,據(jù)悉可以記住過去互動(dòng)的背景信息。

Project Astra,圖源:Deepmind

 AI+VR:處理器性能飆升帶來的AI功能拓展 

雖說“AI+眼鏡”是最具想象力的場景,不過對于MR產(chǎn)品而言,AI相關(guān)用例也明顯提升。

背后原因可能有兩點(diǎn),一是AI已經(jīng)成為一種重要營銷手段,二是去年的拳頭產(chǎn)品,如PICO 4 Ultra、Quest 3S以及Project Moohan等,處理器升級為了驍龍XR2 Gen 2/+處理器,它具備更強(qiáng)的AI算力。以下是部分頭顯產(chǎn)品曾展示的一些AI功能體驗(yàn):

Quest 3/3S:今年7月,Meta為頭顯上線了Meta AI,可以通過雙擊手柄的Meta按鈕喚醒。對于支持全彩VST的設(shè)備,設(shè)備可以實(shí)現(xiàn)視覺搜索功能,如詢問花園的植物品種等。

PICO 4 Ultra:內(nèi)置了AI生成桌面背景、AI 2D抖音短視頻轉(zhuǎn)3D等玩法。

Project Moohan:配備了與AI深度融合的Android XR系統(tǒng),它在玩法方面相比前兩者更勝一籌,如可以實(shí)現(xiàn)系統(tǒng)級響應(yīng),實(shí)時(shí)在線,并支持語音交互以及視覺搜索等。

筆者認(rèn)為如果在輕度辦公場景下,Project Moohan由于得益于大屏+AI屬性,它的生產(chǎn)力并不一定會(huì)弱于目前的PC設(shè)備。當(dāng)然后續(xù)更多功能還有待進(jìn)一步觀望。

畫圈搜索功能展示,圖源:谷歌

 寫在最后:新一年將繼續(xù)喧囂 

2025年,無疑是“AI+XR”賽道更為熱鬧的一年,對于AI眼鏡,前面提到字節(jié)跳動(dòng)、小米等巨頭將會(huì)進(jìn)場、Ray-Ban Meta會(huì)推出帶屏迭代款;對于AR眼鏡,預(yù)計(jì)三星、谷歌等廠商會(huì)有新品發(fā)布;對于MR頭顯,有傳言稱VIVO將會(huì)在這一年入局。

隨著這些新企業(yè)的入局,“AI+XR”新品在價(jià)格、功能場景以及品牌影響力等方面都會(huì)給市場帶來“巨頭震撼”,市場會(huì)經(jīng)歷一次大浪淘沙。

在筆者看來,今年有兩個(gè)值得持續(xù)關(guān)注的地方,首先谷歌在去年年末發(fā)布了XR操作系統(tǒng)Android XR,預(yù)計(jì)今年會(huì)有不少品牌“上車”。它的出現(xiàn),有利于降低XR行業(yè)的準(zhǔn)入門檻。

此外,筆者認(rèn)為眼鏡并非“AI載體”的唯一解,新的一年中可能會(huì)出現(xiàn)更多全新的終端形態(tài)。

新的一年,讓我們攜手前進(jìn)。

       原文標(biāo)題 : 【年度專題】XR終端,能否吃到AI落地的最佳紅利?

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)