訂閱
糾錯
加入自媒體

OpenAl終于出手!官宣開源新模型,這次是摸著 Deepseek過河

編輯:Yuki | ID:YukiYuki1108

在暗示推出一款開源模型的一個多月后(2025年4月1日),OpenAI CEO山姆·奧特曼(Sam Altman)在社交平臺X上正式宣布:OpenAI計劃在未來幾個月內(nèi)發(fā)布一款具備推理能力的“開放權(quán)重”(open-weight)大模型。這一消息迅速引發(fā)了科技媒體和行業(yè)觀察者的廣泛關(guān)注。許多中文媒體以“OpenAI預告/即將發(fā)布開源模型”為標題進行報道;一些業(yè)內(nèi)人士則將其視為OpenAI重新走向開源的標志性一步。

然而,“開放權(quán)重”是否等同于“開源”?這一問題的答案并不簡單。從OpenAI的措辭

到行業(yè)實踐,“開放權(quán)重”與“開源”之間存在著顯著差異。本文將深入探討這一話題。

一、“開放權(quán)重”與“開源”:概念辨析

首先需要明確的是,“開放權(quán)重”(open-weight)與“開源”(open-source)是兩個不同的概念。

“開放權(quán)重”:指的是在模型訓練完成后公開其參數(shù)(weights),允許開發(fā)者基于這些參數(shù)進行部署、測試甚至微調(diào)。然而,“開放權(quán)重”并不包括訓練數(shù)據(jù)、完整訓練代碼明確的使用權(quán)限。這意味著開發(fā)者可以利用這些參數(shù)進行本地部署和推理服務(wù)(如對話生成或文本分類),但無法復現(xiàn)完整的訓練過程或完全自由地修改模型的底層架構(gòu)。

“開源”:則是一個更廣泛的概念。它不僅包括代碼公開(如訓練代碼和推理代碼),還可能涉及訓練數(shù)據(jù)、方法透明性以及使用權(quán)限的自由度。開源的核心理念是全面透明自由使用。

從這個角度來看,“開放權(quán)重”更像是開源的一個子集——它降低了模型的使用門檻(如本地部署和微調(diào)),但無法滿足真正的可驗證性可重現(xiàn)性需求。

二、行業(yè)實踐:“開放權(quán)重”已成為主流

盡管“開放權(quán)重”與“開源”存在差異(如缺少訓練數(shù)據(jù)和完整

訓練代碼),但從行業(yè)實踐來看,“開放權(quán)重”已經(jīng)成為當前大模型的主流模式。

以DeepSeek、Qwen(阿里)和LLaMA(Meta)為例:

DeepSeek:其V2、V3和R1等系列均采用了“開放權(quán)重”策略。此外DeepSeek還提供了技術(shù)報告并采用了限制極少的MIT開源協(xié)議——允許任何人自由地使用、修改、分發(fā)和商業(yè)化軟件或模型。

Qwen(阿里):Qwen系列不僅公開了權(quán)重還采用了Apache2.0協(xié)議——允許用戶自由地使用修改分發(fā)代碼包括商業(yè)用途僅要求保留原始版權(quán)聲明許可聲明。

LLaMA(Meta):雖然LLaMA系列也公開了參數(shù)推理腳本但其使用協(xié)議限制更多從LLaMA2開始Meta采用了更寬松許可證(LLaMA3又更開放了一點)但仍需申請使用且不能直接用于某些商業(yè)應(yīng)用發(fā)布服務(wù)導致其落地場景受限。

這些案例表明盡管三者都自稱“開源”,但如果將“開源”拆解為幾個維度來看——如是否公開完整訓練數(shù)據(jù)是否提供可復現(xiàn)訓練代碼等——你會發(fā)現(xiàn)沒有一家是真正意義上做到全開。

三、“o3-mini級別”:OpenAI新模型的定位

根據(jù)Sam Altman在今年2月的暗示以及最新推文中提到的“powerful new open-weight model with reasoning”,可以推測出OpenAI在開源路線上最終選擇了一個“o3-mini級別”的推理型大語言來打開局面。

所謂“o3-mini級別”,指的是具備較強推理能力且適合輕量化部署的中小型大語言——這類既能夠滿足企業(yè)級應(yīng)用需求又能夠降低硬件成本使其成為當前市場上最受歡迎類型之一。

四、“重返”還是“妥協(xié)”?

對于OpenAI來說這次重返社區(qū)意義遠不止發(fā)布那么簡單過去兩年間Meta Mistral Qwen DeepSeek輪番上場一邊打造一邊打造生態(tài)甚至逐漸形成規(guī)模龐大生態(tài)尤其在DeepSeek-V3/R1之后越來越多硬件軟件廠商加入其中使得整個行業(yè)格局發(fā)生顯著變化而作為曾經(jīng)引領(lǐng)者卻因閉源策略逐漸被邊緣化因此這次部分回歸可以看作是對競爭壓力回應(yīng)同時也是對自身定位調(diào)整。

五、“真開”還是“假開”?

盡管很多人以為是以起家但實際上至少在GPT-2時期就有了閉源路線打算2019年初GPT-2發(fā)布開始以惡意使用風險名義拒絕公開但在外界一致認為夸大風險輿論下才在年底公開滿血版15億參數(shù)GPT-2不論如何從GPT-3開始徹底走上閉源路線不再公開權(quán)重代碼或訓練數(shù)據(jù)因此這一次重新也可以視為對社區(qū)釋放信號但需要明確是從Sam Altman采用字眼來看大概率將和今天DeepSeek Qwen LLaMA一樣:

優(yōu)點:降低門檻支持本地部署微調(diào)適配缺點:無法復現(xiàn)完整過程難以滿足真正需求

       原文標題 : OpenAl終于出手!官宣開源新模型,這次是摸著 Deepseek過河

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號