訂閱
糾錯
加入自媒體

馬斯克發(fā)布大模型Grok 3,號稱性能超越DeepSeek和ChatGPT

前言:

2023年11月,xAI發(fā)布了其首款大型模型Grok-1,該模型擁有3140億參數(shù),成為當時參數(shù)量最大的開源大型語言模型;

2024年8月發(fā)布的Grok-2,在性能上可與最新的ChatGPT模型相媲美。

該系列大型模型能夠通過網(wǎng)絡(luò)連接獲取實時信息,并利用X平臺(原推特)上的資訊,從而保持信息獲取的時效性。

作者 | 方文三

圖片來源 |  網(wǎng) 絡(luò) 

圖片

馬斯克發(fā)布AI大模型Grok 3

埃隆·馬斯克提前展示了其強大的AI技術(shù),與OpenAI o1、DeepSeek-V3/R1等模型展開競爭。

在北京時間2月18日,馬斯克領(lǐng)導的AI團隊以類似發(fā)布會的形式,與三位技術(shù)負責人共同展示了Grok 3基座大模型。

此前,馬斯克曾贊譽其為[地球上最聰明的AI]。

同時,xAI團隊還公布了推理AI模型Grok3 mini(Reasoning,精簡版),基于Grok 3的[深度思考](Deep thinking)的Agent智能搜索引擎,以及基于Grok App的獨立訂閱服務(wù)[Super Grok]。

圖片

具體而言,Grok3模型的訓練計算量(能力)比前一代提升了10倍,采用了20萬張GPU卡集群進行訓練。

在第一階段,使用了10萬個GPU進行了122天的全面訓練同步;在第二階段,又擴展到20萬張GPU卡,再次進行了92天的訓練和推理。

在技術(shù)參數(shù)方面,Grok 3模型配備了20萬GPU,其計算能力相較于Grok2提升了10倍,同樣是一個推理模型,并具備DeepSearch功能;而Big Brain功能則是通過更多的計算資源來解決問題。

依據(jù)xAI所提供的評估標準,Grok 3在科學、編程及數(shù)學領(lǐng)域的表現(xiàn)超越了Gemini 2 Pro、Deepseek V3、ChatGPT 4o等競爭產(chǎn)品。

此外,在盲測環(huán)節(jié),xAI的早期版本Grok-3在lmArena排行榜上以1402分的歷史最高成績榮登榜首,成為首個突破1400分的AI模型,這一成就超越了Google、OpenAI、DeepSeek等業(yè)界主要競爭者。

埃隆·馬斯克強調(diào),Grok-3能夠降低AI的幻覺效應(yīng),其方法在于反復(fù)核查數(shù)據(jù)并努力實現(xiàn)邏輯一致性。

他進一步透露,相較于先前版本,Grok-3的訓練過程消耗了更多的計算資源,并且大量應(yīng)用了合成數(shù)據(jù)。

與DeepSeek算法優(yōu)化路徑(DeepSeek-V3使用2048個H800 GPU,訓練耗時2788千小時)不同。

xAI公司透露,Grok-3的開發(fā)得益于一座名為Colossus的超級計算機,該計算機僅用8個月時間建成,由10萬個英偉達H100 GPU提供動力,為訓練提供了2億個GPU小時,這一數(shù)字是Grok-2的十多倍。

馬斯克還透露,Grok 3的語音交互功能即將推出,并承諾每次發(fā)布新版本時會開源上一個版本,這體現(xiàn)了xAI對技術(shù)透明度和共享的重視。

Grok 3發(fā)布后,業(yè)界普遍認為,特斯拉的FSD(全自動駕駛系統(tǒng))以及特斯拉的人形機器人擎天柱可能是主要受益者。

有消息稱,馬斯克已經(jīng)將Grok 3集成到特斯拉汽車中,利用特斯拉多年積累的車輛傳感器數(shù)據(jù)和SpaceX的航天技術(shù)資料。

Grok 3能夠?qū)崟r解析道路積水深度、預(yù)測相鄰車輛的行駛軌跡,甚至提前30天預(yù)測電池故障。

圖片

Gork3架構(gòu)中的深度搜索模塊引人關(guān)注

此外,xAI正致力于為Grok打造深度搜索功能(DeepSearch),該功能預(yù)期將成為其AI體的關(guān)鍵能力之一。

DeepSearch是一款具備推理能力的聊天機器人,它能夠詳細解釋其對查詢內(nèi)容的理解過程以及制定回復(fù)策略的方式。

展示中表明,DeepSearch具備研究、創(chuàng)意發(fā)散和數(shù)據(jù)分析等多項功能。

馬斯克團隊亦透露,他們計劃[盡快]推出一款基于語音交互的聊天機器人。

該模塊具備迅速檢索并驗證信息的能力,為用戶提供精確的答案。

其設(shè)計理念借鑒了當前最先進的搜索引擎技術(shù),并且Gork3在這一基礎(chǔ)上進行了顯著的改進和優(yōu)化。

深度搜索模塊不僅能夠模擬人類的搜索行為,迅速檢索大量信息,而且還能通過推理和驗證確保信息的可靠性。

在搜索過程中,Gork3會展示一個高級進度條,實時反映其思考和搜索的進度。

搜索任務(wù)完成后,界面的右側(cè)將呈現(xiàn)查詢模型的啟動摘要,涵蓋瀏覽的網(wǎng)站、驗證的來源等詳細信息,并且通常會進行多源交叉驗證,以確保答案的精確無誤。

圖片

結(jié)尾:在收購OpenAI未果后計劃融資

在DeepSeek大型模型推出之后,業(yè)界開始關(guān)注是否還需要依賴[大規(guī)模堆疊芯片和計算資源]這種昂貴方式來推動AI的發(fā)展。

OpenAI的首席執(zhí)行官奧爾特曼此前表示,DeepSeek使得OpenAI的領(lǐng)先優(yōu)勢不再像前幾年那樣顯著。

他指出,在開源模型和研究成果方面,OpenAI已經(jīng)站在了歷史的錯誤一邊,因此需要制定不同的開源策略。

在馬斯克xAI新模型發(fā)布前數(shù)小時內(nèi),奧爾特曼通過推特發(fā)布了幾條信息,試圖轉(zhuǎn)移公眾對xAI發(fā)布會的注意力,釋放了GPT-4.5、開源等關(guān)鍵信息。

實際上,馬斯克領(lǐng)導的投資者財團在2月10日提出了以974億美元收購OpenAI的提議。

馬斯克的律師馬克·托貝羅夫確認了這一消息,并表示已向OpenAI董事會提交了收購要約。

一旦交易完成,OpenAI很可能會與xAI合并,這將有助于xAI迅速縮小技術(shù)差距,并形成一個能與谷歌、微軟等巨頭競爭的AI企業(yè)。

如果這一收購計劃得以實現(xiàn),它將成為全球AI領(lǐng)域最大規(guī)模的并購交易,為全球AI行業(yè)未來的發(fā)展帶來不確定性,并可能加劇馬斯克與奧爾特曼之間的長期矛盾。

圖片

然而,隨著馬斯克提出以974億美元收購OpenAI的消息傳出,奧爾特曼并未表示支持。

對于收購要約,他在社交媒體上回應(yīng)稱:[不,謝謝。但如果你愿意的話,我們可以考慮以97.4億美元收購?fù)铺。]

2月16日,OpenAI董事會正式拒絕了馬斯克的收購提議。

這一目標未能實現(xiàn),同時xAI也面臨著融資挑戰(zhàn)。

據(jù)報道,xAI計劃籌集約100億美元資金,目前正在與潛在投資者如紅杉資本、Andreessen Horowitz等進行接觸,此輪融資可能使公司估值達到約750億美元。

部分資料參考:鈦媒體AGI:《馬斯克Grok 3來襲,性能超DeepSeek,OpenAI加緊圍堵》,華夏時報:《馬斯克發(fā)布最新一代大模型Grok 3,多模態(tài)AI或改變未來出行體驗》,ITPUB:《大模型戰(zhàn)事再起,馬斯克發(fā)布[史上最聰明AI]Grok 3,稱超越DeepSeek》,算力豹:《馬斯克推出Grok-3大模型:算力碾壓、推理能力全球登頂,反擊DeepSeek、OpenAI》,騰訊科技:《馬斯克狂吹的Grok 3,終于發(fā)布了》

       原文標題 : AI芯天下丨熱點丨馬斯克發(fā)布大模型Grok 3,號稱性能超越DeepSeek和ChatGPT

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號