馬斯克發(fā)布大模型Grok 3,號稱性能超越DeepSeek和ChatGPT
前言:
2023年11月,xAI發(fā)布了其首款大型模型Grok-1,該模型擁有3140億參數(shù),成為當時參數(shù)量最大的開源大型語言模型;
2024年8月發(fā)布的Grok-2,在性能上可與最新的ChatGPT模型相媲美。
該系列大型模型能夠通過網(wǎng)絡(luò)連接獲取實時信息,并利用X平臺(原推特)上的資訊,從而保持信息獲取的時效性。
作者 | 方文三
圖片來源 | 網(wǎng) 絡(luò)
馬斯克發(fā)布AI大模型Grok 3
埃隆·馬斯克提前展示了其強大的AI技術(shù),與OpenAI o1、DeepSeek-V3/R1等模型展開競爭。
在北京時間2月18日,馬斯克領(lǐng)導的AI團隊以類似發(fā)布會的形式,與三位技術(shù)負責人共同展示了Grok 3基座大模型。
此前,馬斯克曾贊譽其為[地球上最聰明的AI]。
同時,xAI團隊還公布了推理AI模型Grok3 mini(Reasoning,精簡版),基于Grok 3的[深度思考](Deep thinking)的Agent智能搜索引擎,以及基于Grok App的獨立訂閱服務(wù)[Super Grok]。
具體而言,Grok3模型的訓練計算量(能力)比前一代提升了10倍,采用了20萬張GPU卡集群進行訓練。
在第一階段,使用了10萬個GPU進行了122天的全面訓練同步;在第二階段,又擴展到20萬張GPU卡,再次進行了92天的訓練和推理。
在技術(shù)參數(shù)方面,Grok 3模型配備了20萬GPU,其計算能力相較于Grok2提升了10倍,同樣是一個推理模型,并具備DeepSearch功能;而Big Brain功能則是通過更多的計算資源來解決問題。
依據(jù)xAI所提供的評估標準,Grok 3在科學、編程及數(shù)學領(lǐng)域的表現(xiàn)超越了Gemini 2 Pro、Deepseek V3、ChatGPT 4o等競爭產(chǎn)品。
此外,在盲測環(huán)節(jié),xAI的早期版本Grok-3在lmArena排行榜上以1402分的歷史最高成績榮登榜首,成為首個突破1400分的AI模型,這一成就超越了Google、OpenAI、DeepSeek等業(yè)界主要競爭者。
埃隆·馬斯克強調(diào),Grok-3能夠降低AI的幻覺效應(yīng),其方法在于反復(fù)核查數(shù)據(jù)并努力實現(xiàn)邏輯一致性。
他進一步透露,相較于先前版本,Grok-3的訓練過程消耗了更多的計算資源,并且大量應(yīng)用了合成數(shù)據(jù)。
與DeepSeek算法優(yōu)化路徑(DeepSeek-V3使用2048個H800 GPU,訓練耗時2788千小時)不同。
xAI公司透露,Grok-3的開發(fā)得益于一座名為Colossus的超級計算機,該計算機僅用8個月時間建成,由10萬個英偉達H100 GPU提供動力,為訓練提供了2億個GPU小時,這一數(shù)字是Grok-2的十多倍。
馬斯克還透露,Grok 3的語音交互功能即將推出,并承諾每次發(fā)布新版本時會開源上一個版本,這體現(xiàn)了xAI對技術(shù)透明度和共享的重視。
Grok 3發(fā)布后,業(yè)界普遍認為,特斯拉的FSD(全自動駕駛系統(tǒng))以及特斯拉的人形機器人擎天柱可能是主要受益者。
有消息稱,馬斯克已經(jīng)將Grok 3集成到特斯拉汽車中,利用特斯拉多年積累的車輛傳感器數(shù)據(jù)和SpaceX的航天技術(shù)資料。
Grok 3能夠?qū)崟r解析道路積水深度、預(yù)測相鄰車輛的行駛軌跡,甚至提前30天預(yù)測電池故障。
Gork3架構(gòu)中的深度搜索模塊引人關(guān)注
此外,xAI正致力于為Grok打造深度搜索功能(DeepSearch),該功能預(yù)期將成為其AI體的關(guān)鍵能力之一。
DeepSearch是一款具備推理能力的聊天機器人,它能夠詳細解釋其對查詢內(nèi)容的理解過程以及制定回復(fù)策略的方式。
展示中表明,DeepSearch具備研究、創(chuàng)意發(fā)散和數(shù)據(jù)分析等多項功能。
馬斯克團隊亦透露,他們計劃[盡快]推出一款基于語音交互的聊天機器人。
該模塊具備迅速檢索并驗證信息的能力,為用戶提供精確的答案。
其設(shè)計理念借鑒了當前最先進的搜索引擎技術(shù),并且Gork3在這一基礎(chǔ)上進行了顯著的改進和優(yōu)化。
深度搜索模塊不僅能夠模擬人類的搜索行為,迅速檢索大量信息,而且還能通過推理和驗證確保信息的可靠性。
在搜索過程中,Gork3會展示一個高級進度條,實時反映其思考和搜索的進度。
搜索任務(wù)完成后,界面的右側(cè)將呈現(xiàn)查詢模型的啟動摘要,涵蓋瀏覽的網(wǎng)站、驗證的來源等詳細信息,并且通常會進行多源交叉驗證,以確保答案的精確無誤。
結(jié)尾:在收購OpenAI未果后計劃融資
在DeepSeek大型模型推出之后,業(yè)界開始關(guān)注是否還需要依賴[大規(guī)模堆疊芯片和計算資源]這種昂貴方式來推動AI的發(fā)展。
OpenAI的首席執(zhí)行官奧爾特曼此前表示,DeepSeek使得OpenAI的領(lǐng)先優(yōu)勢不再像前幾年那樣顯著。
他指出,在開源模型和研究成果方面,OpenAI已經(jīng)站在了歷史的錯誤一邊,因此需要制定不同的開源策略。
在馬斯克xAI新模型發(fā)布前數(shù)小時內(nèi),奧爾特曼通過推特發(fā)布了幾條信息,試圖轉(zhuǎn)移公眾對xAI發(fā)布會的注意力,釋放了GPT-4.5、開源等關(guān)鍵信息。
實際上,馬斯克領(lǐng)導的投資者財團在2月10日提出了以974億美元收購OpenAI的提議。
馬斯克的律師馬克·托貝羅夫確認了這一消息,并表示已向OpenAI董事會提交了收購要約。
一旦交易完成,OpenAI很可能會與xAI合并,這將有助于xAI迅速縮小技術(shù)差距,并形成一個能與谷歌、微軟等巨頭競爭的AI企業(yè)。
如果這一收購計劃得以實現(xiàn),它將成為全球AI領(lǐng)域最大規(guī)模的并購交易,為全球AI行業(yè)未來的發(fā)展帶來不確定性,并可能加劇馬斯克與奧爾特曼之間的長期矛盾。
然而,隨著馬斯克提出以974億美元收購OpenAI的消息傳出,奧爾特曼并未表示支持。
對于收購要約,他在社交媒體上回應(yīng)稱:[不,謝謝。但如果你愿意的話,我們可以考慮以97.4億美元收購?fù)铺。]
2月16日,OpenAI董事會正式拒絕了馬斯克的收購提議。
這一目標未能實現(xiàn),同時xAI也面臨著融資挑戰(zhàn)。
據(jù)報道,xAI計劃籌集約100億美元資金,目前正在與潛在投資者如紅杉資本、Andreessen Horowitz等進行接觸,此輪融資可能使公司估值達到約750億美元。
部分資料參考:鈦媒體AGI:《馬斯克Grok 3來襲,性能超DeepSeek,OpenAI加緊圍堵》,華夏時報:《馬斯克發(fā)布最新一代大模型Grok 3,多模態(tài)AI或改變未來出行體驗》,ITPUB:《大模型戰(zhàn)事再起,馬斯克發(fā)布[史上最聰明AI]Grok 3,稱超越DeepSeek》,算力豹:《馬斯克推出Grok-3大模型:算力碾壓、推理能力全球登頂,反擊DeepSeek、OpenAI》,騰訊科技:《馬斯克狂吹的Grok 3,終于發(fā)布了》
原文標題 : AI芯天下丨熱點丨馬斯克發(fā)布大模型Grok 3,號稱性能超越DeepSeek和ChatGPT

最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風翻身?