DeepSeek的六萬(wàn)張卡如何回本?
究其DeepSeek訓(xùn)練其模型到底使用了多少?gòu)堄ミ_(dá)卡,據(jù)《DeepSeek-V3技術(shù)報(bào)告》官方給出的是2048張英偉達(dá)H800芯片和1萬(wàn)張A100顯卡。而半導(dǎo)體研究機(jī)構(gòu)SemiAnalysis認(rèn)為DeepSeek囤積了包括1萬(wàn)張A100、1萬(wàn)張H100、1萬(wàn)張?zhí)毓┌鍴800、3萬(wàn)張?zhí)毓┌鍴20在內(nèi)的六萬(wàn)張英偉達(dá)GPU卡。
不重要,這不是本文要討論的。
而,DeepSeek的這六萬(wàn)張卡如何回本?
簡(jiǎn)而言之一個(gè)詞:開源。
以下是本文邏輯:
1、”DeepSeek+”行情到來(lái),開源背后的經(jīng)濟(jì)賬
2、都在搞錢,那么DeepSeek的錢怎么搞?
01
“DeepSeek+”行情到來(lái),開源背后的經(jīng)濟(jì)賬
2月10日,OpenAI創(chuàng)始人山姆·奧特曼在個(gè)人博客分享了他對(duì)人工智能經(jīng)濟(jì)學(xué)的三個(gè)觀察(《Three Observations》)。他分享了人工智能經(jīng)濟(jì)學(xué)的三個(gè)觀察。
(一)AI模型的智能水平大致等于用于訓(xùn)練和運(yùn)行它所需資源的對(duì)數(shù)值。這些資源主要包括訓(xùn)練算力、數(shù)據(jù)和推理算力。實(shí)踐表明,投入的資金可以持續(xù)帶來(lái)可預(yù)測(cè)的收益提升;這種scaling law在多個(gè)數(shù)量級(jí)的范圍內(nèi)都保持準(zhǔn)確。
(二)使用特定水平AI的成本每12個(gè)月下降約10倍,較低的價(jià)格又會(huì)帶來(lái)更廣泛的應(yīng)用。這一點(diǎn)可以從2023年初的GPT-4到2024年中的GPT-4o的變化中得到印證,其中每個(gè)token的價(jià)格在這段時(shí)間內(nèi)降低了約150倍。相比之下,摩爾定律以每18個(gè)月翻倍的速度改變了世界,而AI的發(fā)展速度則更為驚人。
(三)智能的線性增長(zhǎng)能帶來(lái)超指數(shù)級(jí)的社會(huì)經(jīng)濟(jì)價(jià)值。因此,我們看不到任何理由認(rèn)為這種指數(shù)級(jí)增長(zhǎng)的投資會(huì)在近期停止。
在山姆·奧特曼的“AI經(jīng)濟(jì)學(xué)”框架中,模型能力的提升與成本的邊際遞減是其核心命題。據(jù)山姆·奧特曼在接受采訪中稱,隨著智能模型固定級(jí)別的智力水平的一旦實(shí)現(xiàn),其訓(xùn)練成本每年都會(huì)下降約10倍。“這很瘋狂!就像摩爾定律是溫和的改變世界!”山姆·奧特曼感嘆。
不得不說(shuō),除了其實(shí)踐經(jīng)驗(yàn),OpenAI最近這關(guān)于開源的最新認(rèn)可,和DeepSeek最近在商業(yè)上的“倒逼”有著直接關(guān)系。開源策略的深層意義,在于構(gòu)建一個(gè)“技術(shù)-數(shù)據(jù)-商業(yè)”的飛輪。
2月17日,DeepSeek正式宣布接入微信并開展灰度測(cè)試。DeepSeek與微信的合作,本質(zhì)是將模型能力嵌入高頻社交場(chǎng)景,獲取海量用戶交互數(shù)據(jù)。
2月3日,DeepSeek官宣與阿里云以及百度智能云聯(lián)合,通過(guò)云服務(wù)觸達(dá)企業(yè)客戶,通過(guò)共享技術(shù)資源、優(yōu)化算法等方式,進(jìn)行生態(tài)共建。
2月初,DeepSeek和三大運(yùn)營(yíng)商達(dá)成戰(zhàn)略合作,實(shí)現(xiàn)AI技術(shù)在通信服務(wù)中的深度融入,這包括網(wǎng)絡(luò)管理、服務(wù)優(yōu)化、用戶體驗(yàn)等多個(gè)維度的突破性進(jìn)展。
1月29日,微軟和DeepSeek共同宣布,DeepSeek-R1已經(jīng)在微軟的AI平臺(tái)Azuer AI Foundry和Github可用,開發(fā)者可以使用新模型進(jìn)行測(cè)試和構(gòu)建基于云的應(yīng)用程序和服務(wù)。
以阿里云為例,其平臺(tái)AI組件產(chǎn)品PAI Model Gallery支持云上一鍵部署DeepSeek系列模型,包括DeepSeek-V3、DeepSeek-R1等。用戶無(wú)需編寫代碼,即可通過(guò)阿里云平臺(tái)實(shí)現(xiàn)模型訓(xùn)練的過(guò)程。值得一提的是, PAI Model Gallery自身是對(duì)阿里云用戶開源的。而PAI Model Gallery的兩種資費(fèi)方式,在線服務(wù)(EAS)計(jì)費(fèi)和分布式訓(xùn)練(DLC)計(jì)費(fèi),都是根據(jù)用戶實(shí)際使用的資源來(lái)計(jì)算費(fèi)用的,比如按使用時(shí)間或者次數(shù)來(lái)收費(fèi)。這代表了AI開源業(yè)界普遍的一種收費(fèi)模式。
DeepSeek和這些B端企業(yè)的合作模式類似于Android的開源生態(tài):DeepSeek提供底層模型框架,合作伙伴貢獻(xiàn)場(chǎng)景與數(shù)據(jù),最終通過(guò)模型迭代實(shí)現(xiàn)“越用越強(qiáng)”的正循環(huán)。
山姆·奧特曼對(duì)AI算力趨勢(shì)的深刻觀察,正體現(xiàn)在DeepSeek 的算力創(chuàng)新中。DeepSeek-V3的崛起——通過(guò)開源模式和技術(shù)創(chuàng)新,將訓(xùn)練成本壓縮至557.6萬(wàn)美元(基于H800 GPU租賃成本計(jì)算),僅為同類閉源模型的1/10甚至更低。這種成本優(yōu)勢(shì)的背后,是算法、框架與硬件的協(xié)同優(yōu)化:FP8混合精度訓(xùn)練使計(jì)算效率提升20%以上,而DeepSeekMoE架構(gòu)以及多頭潛在注意力機(jī)制(MLA)架構(gòu),通過(guò)細(xì)粒度專家分配,讓每個(gè)Token的激活參數(shù)僅占模型總規(guī)模的5.5%(37B/671B)。
因?yàn)槠漭^低的硬件成本投入,DeepSeek-R1的發(fā)布一度使得英偉達(dá)股價(jià)大跌。但有趣的是,根據(jù)經(jīng)濟(jì)學(xué)杰文斯悖論,算力創(chuàng)新和大幅提升的背后,恰恰會(huì)帶動(dòng)高性能硬件(如英偉達(dá)GPU)的需求并使其可能會(huì)呈現(xiàn)反彈式增長(zhǎng)。
這與杰文斯悖論的核心邏輯相吻合:即技術(shù)進(jìn)步提高了資源利用效率,降低了成本,進(jìn)而刺激了需求增加,最終導(dǎo)致資源消耗總量的上升。
多說(shuō)一句杰文斯悖論:英國(guó)經(jīng)濟(jì)學(xué)家杰文斯發(fā)現(xiàn),19世紀(jì)中葉,隨著第一次工業(yè)革命工業(yè)化的進(jìn)程,蒸汽機(jī)效率的提升雖然使煤的使用更加經(jīng)濟(jì),但結(jié)果卻是煤炭的需求飆升。這其實(shí)恰恰滿足了均衡理論中的供需關(guān)系的改變:即價(jià)格降低,勢(shì)必會(huì)帶來(lái)需求量的大幅提升。產(chǎn)品便宜了,買家自然就會(huì)變多。
2月12日,英偉達(dá)在博客中介紹了利用 DeepSeek-R1 和推理時(shí)擴(kuò)展技術(shù)來(lái)自動(dòng)生成優(yōu)化 GPU 內(nèi)核的最新研究成果,效果異常的好。英偉達(dá)表示,其對(duì)于 DeepSeek-R1 的最新進(jìn)展及其應(yīng)用潛力感到非常興奮。
智能的線性增長(zhǎng)能帶來(lái)超指數(shù)級(jí)的社會(huì)經(jīng)濟(jì)價(jià)值。大模型技術(shù)的發(fā)展迭代,必將反哺整個(gè)人工智能和芯片行業(yè)的發(fā)展迭代速率。
這里我們來(lái)具體算一筆賬吧。
賬本落在經(jīng)濟(jì)上,大模型開源,各方怎么個(gè)互惠互利?
一句話:B端(企業(yè))得到DeepSeek的大模型賦能,C端(用戶)得到B端企業(yè)更好的服務(wù),而DeepSeek則得到B端企業(yè)的算力和其服務(wù)的C端的用戶和數(shù)據(jù)。
DeepSeek的六萬(wàn)張顯卡投入,這筆重要且巨大的開支,通過(guò)開源,DeepSeek能夠?qū)⑦@些成本分?jǐn)偟秸麄(gè)生態(tài)系統(tǒng)中。一方面,開源吸引了大量的開發(fā)者和企業(yè)參與到模型的訓(xùn)練和優(yōu)化中,降低了單個(gè)企業(yè)的投入成本,也就是降低了單個(gè)企業(yè)用于構(gòu)建人工智能大模型的邊際費(fèi)用;另一方面,開源也促進(jìn)了DeepSeek技術(shù)的快速迭代和升級(jí),提高了模型的性能和準(zhǔn)確性,從而降低了后期的維護(hù)成本。此外,通過(guò)與其他企業(yè)的合作,DeepSeek還能夠獲得額外的收入來(lái)源,如技術(shù)授權(quán)、定制化服務(wù)等。
開源代碼不僅降低了DeepSeek自身的開發(fā)成本,還為合作方帶來(lái)了技術(shù)上的節(jié)省成本杠桿。通過(guò)共享代碼和算法,DeepSeek能夠幫助合作方快速構(gòu)建和優(yōu)化自己的AI模型,避免了重復(fù)投入和研發(fā)周期。此外,DeepSeek還提供了豐富的訓(xùn)練數(shù)據(jù)和工具,使得合作方能夠更加高效地訓(xùn)練和優(yōu)化模型。這些節(jié)省下來(lái)的成本,可以成為合作方進(jìn)一步投入AI領(lǐng)域的動(dòng)力。而這一切,也都來(lái)自DeepSeek的模型創(chuàng)新。
自此,不難理解關(guān)于DeepSeek“國(guó)運(yùn)級(jí)應(yīng)用”的評(píng)價(jià)了。
02
都在搞錢,那么DeepSeek的錢怎么搞?
眾所周知,DeepSeek目前是免費(fèi)的,并成功倒逼一眾人工智能大模型公司也隨之宣布其產(chǎn)品未來(lái)免費(fèi)供給C端。
但正如所有企業(yè)都需要營(yíng)利,天下并沒有免費(fèi)的午餐。DeepSeek的搞錢之道,依然是開源,開源,開源。
其具體邏輯,通過(guò)B端開源技術(shù)降維與生態(tài)鎖定:即用開源代碼降低B端客戶接入門檻,再用增值服務(wù)構(gòu)建自身的壁壘。B端免費(fèi)算力與數(shù)據(jù)反哺:即用對(duì)B端的開源獲取B端免費(fèi)的算力;B端的廣泛覆蓋又反哺C端的全方位覆蓋,從而帶來(lái)更多token樣本(token是數(shù)據(jù)在被模型處理之前或過(guò)程中被分割成的最小單元),大量開源得到的token樣本加成會(huì)使DeepSeep自身模型算力成本大幅降低,算力效率大幅飛躍使自身模型更優(yōu)化,從而又大幅降低自身模型開發(fā)維護(hù)升級(jí)成本。
這種“算力-數(shù)據(jù)-模型”的三角循環(huán),使得DeepSeek的單位訓(xùn)練成本降低,DeepSeek也正像其無(wú)需人工進(jìn)行標(biāo)注的機(jī)器學(xué)習(xí)模型一樣,可以達(dá)到自學(xué)習(xí)、自維護(hù)、自營(yíng)收益的高效階段。
具體來(lái)說(shuō),DeepSeek通過(guò)向B端用戶開源其技術(shù)和數(shù)據(jù)資源,吸引他們參與到模型的訓(xùn)練和優(yōu)化中。這些B端用戶可以是企業(yè)、研究機(jī)構(gòu)或開發(fā)者團(tuán)隊(duì)等,他們擁有豐富的數(shù)據(jù)和場(chǎng)景資源,能夠?yàn)槟P吞峁└佣鄻踊挠?xùn)練樣本和測(cè)試環(huán)境。通過(guò)向這些用戶提供技術(shù)支持,DeepSeek能夠降低大模型的算力成本和提高用戶的參與度。與此同時(shí),這些B端用戶在使用模型的過(guò)程中也會(huì)產(chǎn)生大量的數(shù)據(jù)和反饋,這些數(shù)據(jù)可以用于進(jìn)一步優(yōu)化模型和提高其性能,促進(jìn)DeepSeek自身模型的快速迭代。這種向B端開源從而獲取算力和數(shù)據(jù)的模式,不僅降低了DeepSeek的運(yùn)營(yíng)成本,還提高了其模型的準(zhǔn)確性和泛化能力。
同時(shí),隨著B端用戶的不斷增加和深入?yún)⑴c,DeepSeek能覆蓋到更多的C端用戶和應(yīng)用場(chǎng)景。這些C端用戶可以是個(gè)人消費(fèi)者、中小企業(yè)或行業(yè)用戶等,他們對(duì)于智能化需求日益增加。通過(guò)向這些用戶提供智能化的服務(wù)和解決方案,DeepSeek能夠吸引他們參與到模型的訓(xùn)練和優(yōu)化中,從而進(jìn)一步增加Token訓(xùn)練樣本的數(shù)量和多樣性。這些Token訓(xùn)練樣本可以用于進(jìn)一步提高模型的準(zhǔn)確性和泛化能力,從而形成C端對(duì)B端的反哺。
獲得大量開源Token訓(xùn)練樣本能夠降低模型算力成本。DeepSeek利用這些樣本進(jìn)行更加高效的模型訓(xùn)練和優(yōu)化。這種“自迭代”使模型能夠在較少的算力硬件資源下達(dá)到更好的性能表現(xiàn)。這對(duì)于DeepSeek來(lái)說(shuō)自然是一筆巨大的成本節(jié)省。
當(dāng)然,盡管DeepSeek在技術(shù)和應(yīng)用方面已經(jīng)取得了顯著的進(jìn)展,但目前仍然存在一些不完善之處。例如:對(duì)于某些復(fù)雜場(chǎng)景的處理能力有限等問(wèn)題。
而通過(guò)開源策略的實(shí)施和生態(tài)系統(tǒng)的構(gòu)建,DeepSeek正在逐步解決這些問(wèn)題。一方面通過(guò)吸引更多的開發(fā)者和企業(yè)參與到模型的訓(xùn)練和優(yōu)化中來(lái)增加token樣本的數(shù)量和多樣性;另一方面通過(guò)與合作伙伴的開源合作來(lái)拓展應(yīng)用場(chǎng)景和提高模型的泛化能力,充分提升模型處理復(fù)雜場(chǎng)景的能力,正如前文所提到。
DeepSeek的商業(yè)模式,似乎正創(chuàng)新出一條AI公司的“自進(jìn)化”之路。
DeepSeek的商業(yè)模式,本質(zhì)是一場(chǎng)“用模型養(yǎng)模型”的試驗(yàn):通過(guò)開源吸引生態(tài)伙伴,降低獲客與數(shù)據(jù)獲取成本;再通過(guò)B端增值服務(wù)與C端數(shù)據(jù)價(jià)值變現(xiàn),支撐算力擴(kuò)容;最后,模型性能提升吸引更多合作伙伴,獲得更多增值收益,形成無(wú)需人工干預(yù)的“數(shù)據(jù)-算力-收益”閉環(huán)。
這一路徑的可行性已初現(xiàn)端倪:DeepSeek-V3的后訓(xùn)練階段僅消耗5K GPU小時(shí),不到預(yù)訓(xùn)練的0.2%,說(shuō)明模型的自學(xué)習(xí)能力顯著增強(qiáng)。若其能持續(xù)壓縮迭代成本,六萬(wàn)張顯卡的回本周期可能從行業(yè)平均的3-5年縮短至18個(gè)月。
然而,爭(zhēng)議依然存在。但無(wú)論如何,DeepSeek已證明:在AI的競(jìng)技場(chǎng)上,低成本與高性能并非零和游戲,而開源生態(tài)可能是打破算力壟斷、提升算力效率的最優(yōu)解。
參考文獻(xiàn):
DeepSeek-V3技術(shù)報(bào)告解讀 來(lái)源:機(jī)器學(xué)習(xí)算法那些事
行業(yè)資訊 | Sam Altman凌晨發(fā)文,AI Agent將重塑世界經(jīng)濟(jì) 來(lái)源:深圳市人工智能行業(yè)協(xié)會(huì)
DeepSeek R1不編程就能生成GPU內(nèi)核,比熟練工程師好,驚到了英偉達(dá) 來(lái)源:機(jī)器之心
全網(wǎng)首發(fā) | PAI Model Gallery一鍵部署階躍星辰Step-Video-T2V、Step-Audio-Chat模型 來(lái)源:阿里云大數(shù)據(jù)AI平臺(tái)
原文標(biāo)題 : DeepSeek的六萬(wàn)張卡如何回本?

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?