訂閱
糾錯
加入自媒體

馬斯克發(fā)布“地表最強”AI,Grok 3瘋狂狙擊OpenAI,后院卻起火了

20萬塊GPU煉出Grok 3

作者|王磊

編輯|秦章勇

地球上最聰明的人工智能來了。(馬斯克自己說的)

剛剛,馬斯克旗下的人工智能公司xAI舉行了一場技術(shù)演示,正式發(fā)布了其最新的大模型——Grok 3

這是人類歷史上,第一個在20萬塊GPU上訓(xùn)練出的模型,而且其訓(xùn)練計算量是Grok-2的10倍。

馬斯克在忙著深挖美國各機構(gòu)財務(wù)賬單之余,也現(xiàn)身直播間,親自為其站臺。

也正因為老馬親自站臺,愛拖延的老毛病又犯了,原計劃在中午12點開始的發(fā)布會,拖到了中午12點20才正式開始。

這場技術(shù)演示的內(nèi)容,也可以說相當(dāng)?shù)挠病,F(xiàn)場直接展示各項基準(zhǔn)測試數(shù)據(jù),從測試數(shù)據(jù)來看,Grok 3的確像馬斯克說的那樣,是“地球上最聰明的AI”。

在美國AIME數(shù)學(xué)競賽、GPQA、代碼編程方面,成績超過了目前主流智能大模型,比如Gemini 2 Pro、Claude 3.5 Sonnet、GPT-4o 以及國內(nèi)爆火的DeepSeek R1等模型。

不過有意思的是,在Grok 3發(fā)布之前,身為Grok 數(shù)據(jù)團隊工程師Benjamin De Kraker在自家媒體 X 表示,Grok 3只能排第四。

不過現(xiàn)在這個工程師似乎已經(jīng)被解雇了....

01 變態(tài)的推理能力

加上馬斯克,發(fā)布會一共四個人,中間兩位是華人。

Grok 3最大的亮點,是引入了“思維鏈(Chain Of Thought)”能力。

簡單來說,它就像人類一樣,能夠一步一步地思考復(fù)雜問題。當(dāng)你問它一個復(fù)雜的科學(xué)問題時,它不會直接給出答案,而是像老師一樣,一步步分析,最后給出清晰、準(zhǔn)確的解答,讓用戶能夠窺見 AI 在解決問題時的內(nèi)部推理過程

比如,在解決數(shù)學(xué)問題時,模型會展示中間推導(dǎo)步驟,而非直接輸出結(jié)果。不過,因為目前Grok 3 還未開源,為了防止核心算法被復(fù)制,xAI 會對思考過程進行一定程度的遮蔽處理。

Grok 3和國內(nèi)的DeepSeek一樣,采用了深度學(xué)習(xí)和強化學(xué)習(xí)相結(jié)合的方法。通過深度學(xué)習(xí),模型能夠從大量數(shù)據(jù)中提取特征和模式。強化學(xué)習(xí)使Grok 3能夠在訓(xùn)練過程中不斷調(diào)整自身的策略,以獲得更高的獎勵信號。

在推理任務(wù)中,Grok 3通過多次嘗試和驗證,不斷優(yōu)化自身的推理路徑,從而找到最優(yōu)解。 

為了全面評估Grok 3的性能,xAI團隊在直播上展示多個領(lǐng)域的基準(zhǔn)測試,涵蓋了一般數(shù)學(xué)推理、STEM和科學(xué)的一般知識以及計算機科學(xué)編程等方面。

根據(jù)官方公布的測試數(shù)據(jù),Grok-3和Grok-3 mini在數(shù)學(xué)、科學(xué)、代碼等性能上都超過或媲美Gemini、DeepSeek和ChatGPT等對手。

為了展示其性能,馬斯克還在線實操,讓Grok-3現(xiàn)場生成了一段太空發(fā)射的3D動畫的代碼,隨后成功運行。

畫面上出現(xiàn)了飛船在地球和火星間往返的動畫。xAI團隊表示,這不是一段簡單的動畫,這需要AI模型首先能理解復(fù)雜物理知識,比如開普勒定律等相關(guān)問題,才能實現(xiàn)合理的軌跡規(guī)劃。

現(xiàn)場還要求Grok 3現(xiàn)場創(chuàng)造一個融合《俄羅斯方塊》和《寶石迷陣》的新游戲。

現(xiàn)場展示中,Grok 3生成的Python腳本定義了游戲中的常量、顏色、方塊形狀等元素。

在實際運行中,也呈現(xiàn)出了融合性的玩法:當(dāng)連接至少三個相同顏色的方塊時,重力機制啟動,方塊消失,其他方塊隨之掉落,類似《寶石迷陣》的消除機制;同時,游戲也保留了《俄羅斯方塊》的基本元素。

值得一提的是,Grok 3還有可能將被集成到Tesla車輛中,允許通過語音命令與其互動。這意味著Tesla車主可以使用Grok獲取實時信息,如天氣狀況和交通更新。馬斯克還暗示Tesla駕駛者很快就能在駕駛過程中使用Grok處理更復(fù)雜的任務(wù)。

Grok 3是xAI公司發(fā)布的第三代人工智能模型,xAI公司成立于2023年7月,公司團隊成員主要來自O(shè)penAI、DeepMind以及其他頂級AI研究公司。馬斯克創(chuàng)立xAI公司的目的很簡單,就是和OpenAI競爭。

xAI成立不到半年,就發(fā)布了第一款大模型Grok-1,參數(shù)量高達3140億,這一參數(shù)量遠(yuǎn)超OpenAI GPT-3.5的1750億,成為當(dāng)時參數(shù)量最大的開源大語言模型。2024年8月,xAI發(fā)布了更新一代的Grok 2大模型,主要應(yīng)用于訓(xùn)練AI聊天機器人。

從去年8月到今年的2月,半年時間就能成功迭代的背后,馬斯克下了不少本錢,為了訓(xùn)練Grok 3,xAI動用了超過20萬塊英偉達H100 GPU集群組成的全球最大AI超算Colossus進行訓(xùn)練,僅用了214天便完成了大規(guī)模模型的訓(xùn)練。

而Grok 3與第二代相比,Grok 3使用的算力提升了310倍,性能提升了15倍,訓(xùn)練量也高了10倍,在硬件基礎(chǔ)上相當(dāng)?shù)拿汀?/p>

為了維持算力優(yōu)勢,馬斯克還打算籌集100億美元資金,采購新一代GB200 GPU芯片來訓(xùn)練。

畢竟在發(fā)布前不久,馬斯克曾放出豪言:“我們有信心Grok 3會比其他任何AI都強,而且很有可能,再也不會有比Grok(系列)更強的AI了”。

總之一句話,就是要做地表最強AI。

02 馬斯克人紅是非多

馬斯克最近也是真的忙,不光忙著為自家AI大模型站臺,喊話收購Open AI,還得作為新任“政府效率部” 牽頭人,忙著對美國政府機構(gòu)的 “大刀闊斧” 改革。

自古“人紅是非多”,馬斯克忙于政壇和AI戰(zhàn)場之際,也招惹了不少麻煩。

首先就是后院要起火了,據(jù)華盛頓郵報報道,特斯拉內(nèi)部會議的一段錄音被曝光,特斯拉某一部門最近舉行了一次員工會議,在這場會議上,有特斯拉員工和高級管理人員公開表達了對CEO馬斯克與特朗普結(jié)盟的擔(dān)憂,認(rèn)為馬斯克深入政治,會傷害特斯拉公司的長期目標(biāo)。

因此,就有人提出建議,馬斯克如果辭職,特斯拉公司的情況可能會更好。

特斯拉作為馬斯克親自一手打造出的親兒子,竟然想把親爹掃地出門,這對于馬斯克來說,絕對不是一個好消息。

然而,基于現(xiàn)實情況,還真不怪特斯拉內(nèi)部會出現(xiàn)這樣的抗議,馬斯克走馬上任以來,特斯拉的股價和基本盤都開始式微。

自馬斯克“美國變法”開始,特斯拉股價已經(jīng)累計下跌了16.6%,市值蒸發(fā)2273億美元(約合人民幣1.65萬億元)。

銷量方面,2025年1月,特斯拉在美國的注冊量同比下降10.8%;在加州,下降幅度更是達到了12%。歐洲市場的情況更糟,1月份特斯拉在法國的銷量下降了63%,德國下降了59%。

除此之外,不少特斯拉用戶開始抵制馬斯克,甚至有人患上了“特斯拉羞恥癥”。

來自加拿大魁北克的車主阿蘭·羅伊(Alain Roy)就表示,就因為馬斯克在就職日上做的那個手勢,讓他不想再支持他了,決定把家里兩臺特斯拉全賣掉,還把準(zhǔn)備買的Cybertruck的訂單取消了。

根據(jù)荷蘭時事節(jié)目EenVandaag對 26,000 名特斯拉車主的調(diào)查,顯示曾經(jīng)的“特斯拉驕傲”已經(jīng)變成“特斯拉羞恥癥”了,很多人打算和馬斯克劃清界限。

其中31% 的受訪特斯拉車主表示,由于馬斯克的行為,他們正在考慮出售或已經(jīng)出售了他們的汽車,40%的人表示,這位首席執(zhí)行官的行為和立場讓他們羞于開特斯拉

最初,還只是一些特斯拉車主通過個人行為來表達不滿, 但現(xiàn)在已經(jīng)升級為了規(guī)模更大的公眾抵制活動。

根據(jù)英國《金融時報》報道,上個周末,有大量的抗議者聚集在北美數(shù)十家特斯拉門店外,抗議馬斯克對政府開支的激進削減措施,敦促展廳內(nèi)的人不要購買汽車。

不過似乎沒人能阻止馬斯克,他當(dāng)然也知道自己面臨怎樣的輿論,現(xiàn)在他在X平臺有一條置頂推文:

I am endlessly amused by the infinite indignities I suffer on the very platform that I own.

我對自己在自己擁有的平臺上遭受的無盡侮辱,感到無比好笑。

       原文標(biāo)題 : 剛剛,馬斯克發(fā)布“地表最強”AI,Grok 3瘋狂狙擊OpenAI,后院卻起火了

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號