訂閱
糾錯(cuò)
加入自媒體

Gemini 開(kāi)啟大模型路線之爭(zhēng),新戰(zhàn)場(chǎng)將“數(shù)流成河”

 來(lái)源 | 零壹智庫(kù)

作者| 聶鐳

谷歌上演了一出“ 那些沒(méi)有殺死我的,將使我更強(qiáng)大”;ヂ(lián)網(wǎng)高速發(fā)展了幾十年, 但全世界超過(guò)10億用戶的業(yè)務(wù)或者應(yīng)用一共沒(méi)超過(guò)20個(gè), 而谷歌擁有6個(gè)。在絕大很多網(wǎng)民心目中,Google是人類歷史上最偉大的公司,沒(méi)有之一,而且在人工智能方面的先發(fā)優(yōu)勢(shì)不可撼動(dòng)。這一信念嘎然而止在2022年11 月 20 號(hào) ChatGPT發(fā)布的歷史性時(shí)刻,眾人紛紛倒向新觀點(diǎn)“像ChatGPT這樣的人工智能聊天機(jī)器人將像搜索引擎殺死黃頁(yè)一樣摧毀谷歌”(Gmail的創(chuàng)始人Paul Buchheit語(yǔ))。

谷歌Bard發(fā)布當(dāng)天,市值下跌千億美金,似乎正好印證了這個(gè)論斷。但Gemini的發(fā)布驚艷世人,改變了大模型領(lǐng)域ChatGPT獨(dú)領(lǐng)風(fēng)騷的局面。Gemini 不僅在很多性能上超過(guò)了ChatGPT 4,它同時(shí)帶來(lái)了另一種可能性:具有原生數(shù)據(jù)優(yōu)勢(shì)的互聯(lián)網(wǎng)巨頭,可能在多模態(tài)大模型競(jìng)爭(zhēng)中占據(jù)優(yōu)勢(shì)。

這意味著,谷歌、馬斯克、Meta以及中國(guó)的騰訊、抖音、阿里、百度等公司都有可能在Gemini 開(kāi)創(chuàng)的路線上加速迭代大模型。大模型戰(zhàn)局,進(jìn)入第二階段。第一階段只用一年時(shí)間,就攪翻了整個(gè)全球互聯(lián)網(wǎng)和人工智能,在摩爾定律的加持下,第二個(gè)階段,又將是怎樣突破人類的想象力?

 01 史詩(shī)級(jí)的一年

從2022年11 月 20 號(hào) ChatGPT發(fā)布之后這一年,幾乎日日充斥“奇點(diǎn)時(shí)刻”的驚爆與 “AI下半場(chǎng)”的狂歡,GPTs 和GPT4 Turbo 也意料之外情理之中地發(fā)布了。還有一系列 Sam Altman作為CEO 被OpenAI董事會(huì)開(kāi)除、又王者歸來(lái)的橋段出現(xiàn),吃瓜群眾應(yīng)接不暇。然而即便是在這樣的亂世里,由Google + DeepMind用盡洪荒之力推出的 AGI 里程碑“雙子星 Gemini”發(fā)布仍然可以算是核彈級(jí)的。

為什么?不妨讓從資本市場(chǎng)這個(gè)最敏感的儀表盤(pán)看看大模型的史詩(shī)級(jí)影響:1、投資 OpenAI 百億美金的大贏家微軟市值大漲 50% 來(lái)到3萬(wàn)億美元,無(wú)疑成AI最大受益者。2、大模型淘金熱的萬(wàn)卡起步,讓英偉達(dá)股價(jià)飆升了 245%,市值解鎖 萬(wàn)億后停不下來(lái),已突破1.2萬(wàn)億美元,超過(guò)Facebook母公司Meta或特斯拉,躋身所謂“七巨頭”。3、作為登上巔峰后迄今為止在互聯(lián)網(wǎng)搜索領(lǐng)域的完全統(tǒng)治地位的 Google,這一年天天度日如年,這一年內(nèi)討論 Google 被顛覆話題占有史以來(lái)的99%以上,如果谷歌輸?shù)暨@場(chǎng)AI之戰(zhàn)會(huì)怎么樣?二級(jí)市場(chǎng)已經(jīng)給出了回答。

Bard發(fā)布當(dāng)天的一次回答錯(cuò)誤,就讓Google母公司Alphabet市值減少了1000億美元。然而就在上周 ChatGPT 一周年慶之后,Google高調(diào)發(fā)布“史上功能最強(qiáng)的通用人工智能大模型”,據(jù)稱通過(guò)大型語(yǔ)言模型領(lǐng)域中廣泛使用的32個(gè)基準(zhǔn)測(cè)試,幾乎全部(其中30 個(gè))表現(xiàn)出了“最先進(jìn)的性能”,不僅擊敗了OpenAI的GPT-4,甚至在MMLU(大規(guī)模多任務(wù)語(yǔ)言理解)基準(zhǔn)測(cè)試中,成為第一個(gè)超越人類專家的模型。

如果這是真的,意味著什么?“這巨大飛躍將影響幾乎所有的Google產(chǎn)品。” 要知道 Google是(至少目前還是)全球最大的互聯(lián)網(wǎng)公司、搜索引擎的絕對(duì)霸主,而搜索無(wú)處不在,仍是絕大多數(shù)人獲取信息的第一方式;Google母公司Alphabet的名字也說(shuō)明了它的產(chǎn)品布局是無(wú)孔不入的。

2020 年GPT-3以來(lái)的標(biāo)志性大模型產(chǎn)品

 02 谷歌的洪荒之力

那么,姍姍來(lái)遲的 Google AGI,Gemini,究竟有沒(méi)有力挽狂瀾的底氣?實(shí)際上,Gemini項(xiàng)目需溯源至 2023年4月20日,是 Google 吹響了“紅色警報(bào)”之后的關(guān)鍵戰(zhàn)略抉擇。那天,谷歌選擇將Google Brain與DeepMind合并,成立了Google DeepMind,并宣布將公司在AI領(lǐng)域的世界級(jí)人才、計(jì)算能力及 TPU基礎(chǔ)設(shè)施等資源加以結(jié)合,創(chuàng)新研發(fā)大模型以對(duì)標(biāo)OpenAI的GPT-4,可謂押上了全部賭注,殊死背水一戰(zhàn)。

“Gemini是Google的下一代多模態(tài)大模型”的戰(zhàn)書(shū)已下,讓外界對(duì)Gemini關(guān)注度持續(xù)升高、好奇心拉滿。7月,辭職已有四年的谷歌聯(lián)合創(chuàng)始人Sergey Brin(謝爾蓋·布林)重返谷歌,其回歸無(wú)疑是助陣Gemini系統(tǒng),也讓業(yè)界預(yù)感“Gemini將會(huì)是下半年大模型賽道的焦點(diǎn)。”Gemini特征有如下三個(gè):

1、原生多模態(tài)、多語(yǔ)言多國(guó)度、從海量云存儲(chǔ)數(shù)據(jù)中做預(yù)訓(xùn)練

在谷歌給出的長(zhǎng)達(dá)60頁(yè)的Gemini技術(shù)報(bào)告中,最值得關(guān)注的是,Gemini模型的訓(xùn)練數(shù)據(jù)集既多模態(tài)又多語(yǔ)言。其中,前期訓(xùn)練數(shù)據(jù)集使用來(lái)自網(wǎng)絡(luò)文檔、書(shū)籍和代碼的數(shù)據(jù),包括圖像、音頻和視頻數(shù)據(jù)等。“Google拿自家海量云存儲(chǔ)的圖片進(jìn)行了預(yù)訓(xùn)練,確實(shí)把模型的多模態(tài)能力拉升了一大截。”谷歌在Gemini技術(shù)報(bào)告中寫(xiě)到,“當(dāng)模型多模態(tài)能力被真正探索出來(lái)時(shí),會(huì)提供更多細(xì)節(jié)。”實(shí)際搭載Gemini Pro的Bard與GPT-4進(jìn)行的對(duì)比測(cè)試表明:通過(guò)識(shí)別不同圖片中的人物、地點(diǎn)、文字、動(dòng)物甚至其中可能蘊(yùn)含的科學(xué)知識(shí),綜合對(duì)比,Gemini Pro的多模態(tài)能力確實(shí)足以抗衡GPT-4,前者的響應(yīng)速度也“快很多”,另外,前者可以免費(fèi)使用,但后者已經(jīng)有了“3小時(shí)40次的限制”。

2、 多尺寸、分場(chǎng)景,發(fā)揮Google 布局生態(tài)優(yōu)勢(shì)

Gemini分Ultra、Pro和Nano三種不同尺寸和萬(wàn)能應(yīng)用場(chǎng)景的設(shè)計(jì),其中Ultra版可用于大型數(shù)據(jù)中心等,屬于處理高復(fù)雜度任務(wù)的模型;Pro版則用于各種擴(kuò)展任務(wù),屬于日常使用模型,且已搭載于谷歌的對(duì)話機(jī)器人Bard中;Nano版則是應(yīng)用于智能手機(jī)等移動(dòng)設(shè)備終端上的模型。

Google 在多年的布局中,早就通過(guò)收購(gòu)擁有了 TPU 計(jì)算集群、YouTube內(nèi)容入口、Andriod 移動(dòng)操作系統(tǒng)等無(wú)處不在的生態(tài)優(yōu)勢(shì),若 Gimini 能堪與GPT-4在AGI 能力上“掰手腕”的大任,那么勝負(fù)的天平無(wú)疑將反過(guò)來(lái)倒向 守成者Google 一邊

3、人海戰(zhàn)術(shù)

前面提及長(zhǎng)達(dá)60頁(yè)的Gemini技術(shù)報(bào)告,最令其驚訝的是光報(bào)告的作者就多達(dá)9頁(yè),“每頁(yè)90人,八百余人,超過(guò)OpenAI公司的總?cè)藬?shù)。”要知道,OpenAI員工總數(shù)目前不足800人,雖然在 AI 人才爭(zhēng)奪戰(zhàn)中 OpenAI 虹吸了不少來(lái)自各個(gè)巨頭 AI 部門(mén)的大咖,當(dāng)然 Google Brain 和 Deepmind也不會(huì)幸免,在其中貢獻(xiàn)了最大比例。

OpenAI 人才來(lái)源數(shù)據(jù)統(tǒng)計(jì)來(lái)自Leadgenious Punks & Pinstripes但即便如此,瘦死的駱駝比馬大,Google Brain內(nèi)部仍然人才濟(jì)濟(jì),仍然有超過(guò)800位以上來(lái)自世界各地的頂尖科學(xué)家;DeepMind目前擁有大約1000名員工,而且高薪養(yǎng)人,平均每名員工工資接近47萬(wàn)英鎊,相當(dāng)于人民幣400萬(wàn)。兩者合并得到 Gemini,這也不難看出谷歌在Gemini模型開(kāi)發(fā)與技術(shù)創(chuàng)新方面投入的AI人才之多。更何況 Google 畢竟是一個(gè)擁有將近 20 萬(wàn)員工的巨無(wú)霸,AI 巔峰之戰(zhàn)提到最高議事日程上以后,內(nèi)部?jī)?yōu)勢(shì)兵力一定會(huì)向主戰(zhàn)場(chǎng)匯集。

 03 

Gemini帶來(lái)的,是“路線之爭(zhēng)”

但這是否表明Gemini 的發(fā)布已經(jīng)形勢(shì)占優(yōu),甚至對(duì)GPT-4形成了“全面超越”?由于目前還無(wú)法完成全面的測(cè)評(píng),只能為大家提供以下重要參考:

1、Gemini在中文識(shí)別理解能力上,相較GPT-4略遜一籌,也就是說(shuō)“Gemini仍無(wú)法可靠處理‘非英語(yǔ)’的任務(wù)。”2、谷歌專門(mén)針對(duì)測(cè)試相關(guān)領(lǐng)域進(jìn)行了優(yōu)化,Gemini只在既定領(lǐng)域中的指標(biāo)表現(xiàn)好,并不能夠說(shuō)明模型真正的泛化能力強(qiáng)。“至于真正能力,需要在更多的數(shù)據(jù)集上進(jìn)行測(cè)評(píng)。” 演示視頻被質(zhì)疑夸大造假,而且是用尚未發(fā)布的 Ultra 而不是可測(cè)的 Pro版本,一時(shí)間招致很多抨擊,風(fēng)波不斷,但旋即谷歌也甩出演示視頻制作的記錄文章,大方承認(rèn)視頻經(jīng)過(guò)剪輯合成。

原來(lái),在專業(yè)提示詞循循善誘的前提下才調(diào)度到的多模態(tài)推理能力,這多少有些“強(qiáng)力粉飾”的魔術(shù)效果和心理暗示,但多模態(tài)的基礎(chǔ)推理能力還是確實(shí)在的。由此可見(jiàn)與ChatGPT巔峰對(duì)決的難度之大!連昔日AI 絕對(duì)王者也需要做對(duì)公眾先做這樣的心理誘導(dǎo),等不及產(chǎn)品的完整實(shí)用化~

如圖:發(fā)布視頻中只保留了模型輸出的反饋,沒(méi)有充分暴露提示3、原生多模態(tài)訓(xùn)練的范式經(jīng)驗(yàn)證能走通,那么新的訓(xùn)練范式的上限極高,這條技術(shù)路線將吸引大多數(shù)擁有內(nèi)容數(shù)據(jù)的平臺(tái)型企業(yè)追隨。

Google產(chǎn)品線積累的海量高質(zhì)量多模態(tài)數(shù)據(jù), 是后續(xù)Gemini的快速、持續(xù)迭代的保障。Gemini的技術(shù)報(bào)告中也有這樣一段表述,“谷歌發(fā)現(xiàn)數(shù)據(jù)質(zhì)量對(duì)于高性能模型至關(guān)重要,并認(rèn)為在尋找預(yù)訓(xùn)練的最佳數(shù)據(jù)集分布方面,仍有許多有趣的問(wèn)題。”

為拓展多模態(tài)模型的訓(xùn)練數(shù)據(jù)集,谷歌還對(duì)外表示,Bard將在超過(guò) 170 個(gè)國(guó)家和地區(qū)提供 Gemini Pro 版本服務(wù),并計(jì)劃未來(lái)擴(kuò)展到不同的模態(tài),支持更多語(yǔ)言和地區(qū)。不僅明年初將推出升級(jí)的Bard Advanced版本,在接下來(lái)的幾個(gè)月里,谷歌還將陸續(xù)把Gemini應(yīng)用于搜索、廣告、Chrome等更多的產(chǎn)品和服務(wù)中。

 04 新戰(zhàn)局開(kāi)始了

ChatGPT 一騎絕塵的情況下,其他選手本已望塵莫及,Gemini的發(fā)布讓人看到了未來(lái)世界風(fēng)云變幻的一種現(xiàn)實(shí)可能性,就是從數(shù)據(jù)優(yōu)勢(shì)出發(fā),走原生多模態(tài)技術(shù)路線。而這一新賽道(如果將來(lái)成功翻盤(pán)就算是新的)也將必然成為在互聯(lián)網(wǎng)領(lǐng)域原來(lái)已經(jīng)深耕多年、有數(shù)據(jù)優(yōu)勢(shì)的大廠之必選。

谷歌之外,Meta擁有全球 30 億用戶,它的大模型 Llama在下一戰(zhàn)局中不可小覷;而中國(guó)的騰訊、阿里、抖音、百度等互聯(lián)網(wǎng)巨頭都是擁有 10 億級(jí)用戶的大廠,并且都在發(fā)布了自己的大模型。至于下階段哪家率先宣布也有了原生多模態(tài)的競(jìng)爭(zhēng)力,需拭目以待。不過(guò)要說(shuō)每一家有江湖名號(hào)的都重新獲得追趕甚至超越的機(jī)會(huì),那得看“硬核”馬斯克(Elon Musk)同不同意。

現(xiàn)在,他已經(jīng)擁有了龐大的原生數(shù)據(jù)來(lái)源。作為實(shí)干冒險(xiǎn)家,馬斯克向來(lái)生死看淡、不服就干。他曾天使投資OpenAI一億美金,想以特斯拉吸收OpenAI被拒,最終被踢出 局。馬斯克可謂初戀愛(ài)之深、未婚恨之切,攜數(shù)據(jù)優(yōu)勢(shì)與宇宙情懷重新殺回 AI爭(zhēng)霸之路——X改名自馬斯克四百億美金買(mǎi)回來(lái)的 Twitter,xAI于今年7月12日官宣成立。

馬斯克是一個(gè)把太多不可能變成現(xiàn)實(shí)的人,他以“X”入道肩負(fù)起“為全人類發(fā)展的希望,了解宇宙的真實(shí)本質(zhì),確保人工智能的發(fā)展有助于人類意識(shí)的持久發(fā)展”。xAI在通過(guò)X 平臺(tái)實(shí)時(shí)了解世界方面具有獨(dú)特而根本的優(yōu)勢(shì),且能夠回答其他人工智能系統(tǒng)拒絕回答的尖銳問(wèn)題,這源于其設(shè)計(jì)初衷是通過(guò)智慧和一些叛逆的傾向來(lái)回答問(wèn)題,“如果您不喜歡幽默,請(qǐng)不要使用它。

”果然骨骼驚奇,非常馬斯克。更重要的是,馬斯克的擁有龐大的原生數(shù)據(jù)來(lái)源:從推特改名而來(lái)的X(與 xAI幾乎同名),全球特斯拉數(shù)據(jù),以及星鏈可能帶來(lái)的龐大數(shù)據(jù)。前幾個(gè)月出版的《埃隆·馬斯克傳》寫(xiě)道:“喂養(yǎng)人工智能,靠的是數(shù)據(jù)。新誕生的這些聊天機(jī)器人正在接受海量信息的訓(xùn)練,包括互聯(lián)網(wǎng)上的數(shù)十億個(gè)網(wǎng)頁(yè)和其他文檔。谷歌和微軟擁有搜索引擎、云服務(wù)和電子郵箱,他們手頭有大量的數(shù)據(jù)可以幫他們訓(xùn)練這些系統(tǒng)。”

“馬斯克能給這場(chǎng)戰(zhàn)局帶來(lái)什么呢?馬斯克坐擁的一大數(shù)據(jù)資產(chǎn)是推特的信息流,其中包括多年來(lái)所有人發(fā)布的超過(guò)1萬(wàn)億條推文,還有每天新增的5億條。它是人類集體意識(shí)的體現(xiàn),是世界上更新最及時(shí)的數(shù)據(jù)集,包含了現(xiàn)實(shí)生活中人類的各種對(duì)話、新聞、興趣、趨勢(shì)、爭(zhēng)論和術(shù)語(yǔ)。”“此外,它還是一個(gè)很好的訓(xùn)練場(chǎng),可以讓聊天機(jī)器人測(cè)試真人對(duì)其回復(fù)做出的反應(yīng)。馬斯克在收購(gòu)?fù)铺貢r(shí)并沒(méi)有考慮到這些數(shù)據(jù)的價(jià)值,他說(shuō):‘實(shí)際上這算是一個(gè)附帶的好處,我是在買(mǎi)下推特以后才意識(shí)到的。’”

“馬斯克還擁有另一個(gè)數(shù)據(jù)寶庫(kù):特斯拉每天從自家車輛上的攝像頭接收并處理的1 600億幀視頻畫(huà)面。這些數(shù)據(jù)不同于為聊天機(jī)器提供信息的文本文件,這是人類在真實(shí)世界中導(dǎo)航的視頻數(shù)據(jù),它有助于為實(shí)體機(jī)器人打造人工智能系統(tǒng),而不再是只能?成文本的聊天機(jī)器人。”“通用人工智能的王冠是打造出能夠像人類?樣在物理空間(比如工廠、辦公室和火星表面)運(yùn)行的機(jī)器,而不僅是?些讓我們感到驚艷的虛擬聊天機(jī)器人。特斯拉和推特可以共同為這兩個(gè)研究方向提供數(shù)據(jù)集和數(shù)據(jù)處理能力:不管是教機(jī)器在物理空間中自主導(dǎo)航,還是教它們用自然語(yǔ)言回答問(wèn)題。

”2023年1月,馬斯克在推特會(huì)議室召開(kāi)了一系列深夜會(huì)議,研究如何針對(duì)這項(xiàng)服務(wù)收費(fèi)的問(wèn)題。他認(rèn)為這是一個(gè)將推特?cái)?shù)據(jù)集變現(xiàn)的好機(jī)會(huì)。且能限制谷歌和微軟使用這些數(shù)據(jù)改進(jìn)自家的人工智能聊天機(jī)器人。我們可以腦補(bǔ)一下,如果這些具有龐大原生數(shù)據(jù)的大廠在競(jìng)爭(zhēng)中采用數(shù)據(jù)收費(fèi)甚至數(shù)據(jù)壟斷策略,下一階段的戰(zhàn)況,將會(huì)怎樣?!

Google 王者業(yè)已歸來(lái), Gemini 出場(chǎng)花式秀魔術(shù)引發(fā)全員關(guān)注和質(zhì)疑爭(zhēng)論,但宣傳目的已經(jīng)基本達(dá)到了,并就此掀起大模型戰(zhàn)局的新篇章。毫無(wú)疑問(wèn),大模型PK精彩程度將愈演愈烈。在這個(gè)每 72 小時(shí)就必有大事件的時(shí)代,請(qǐng)緊跟了別掉隊(duì),一起洞見(jiàn)未來(lái)~(作者聶鐳,龍馬智芯創(chuàng)始人,零壹智庫(kù)特約專家,國(guó)防科技大學(xué)人工智能博士、副研究員,廣東省領(lǐng)軍人才)End.

       原文標(biāo)題 : Gemini 開(kāi)啟大模型路線之爭(zhēng),新戰(zhàn)場(chǎng)將“數(shù)流成河”

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)