DeepSeek的壓力給到華爾街,掀起蝴蝶效應(yīng)
前言:
傳統(tǒng)AI訓(xùn)練對算力的需求巨大,而英偉達(dá)的芯片作為算力的核心,其重要性不言而喻。
然而,DeepSeek的問世使市場認(rèn)識到,AI對算力的需求并非如先前所預(yù)期的那樣龐大。
作者 | 方文三
圖片來源 | 網(wǎng) 絡(luò)
DeepSeek打開大模型新思路
2024年1月20日,DeepSeek公司正式發(fā)布了其推理模型DeepSeek-R1的完整版本。
該模型以較低的訓(xùn)練成本實現(xiàn)了與OpenAI推理模型o1相媲美的性能,并且完全免費開源,這一舉措在業(yè)界引起了巨大反響。
眾多開發(fā)者表示,他們正在考慮利用DeepSeek技術(shù)對現(xiàn)有系統(tǒng)進(jìn)行徹底的重構(gòu)。
在這一趨勢的推動下,DeepSeek推出的移動端應(yīng)用在一周內(nèi)迅速發(fā)酵,并在發(fā)布僅一個月后,躍升至美區(qū)蘋果應(yīng)用商店免費應(yīng)用排行榜首位,不僅超越了ChatGPT,也超越了其他熱門應(yīng)用。
2025年1月28日,DeepSeek進(jìn)一步開源了其多模態(tài)模型Janus-Pro-7B,并宣稱在GenEval和DPG-Bench基準(zhǔn)測試中勝過了DALL-E 3(由OpenAI開發(fā))和Stable Diffusion。
在本次DeepSeek Janus Pro與DALL-E 3的對比分析中,DALL-E 3的參數(shù)量先前公布為120億,而Janus Pro的大模型參數(shù)量僅為70億。
R1的問世不僅打破了科技巨頭獨占推動旗艦開源模型的傳統(tǒng)行業(yè)共識,還顛覆了去年形成的另一個行業(yè)共識,即通用大型模型正逐漸演變成大型企業(yè)間資本競爭的領(lǐng)域。
硬件媒體Tom's Hardware發(fā)布了開年最受關(guān)注的報道:DeepSeek甚至繞過了CUDA,轉(zhuǎn)而使用更為基礎(chǔ)的編程語言進(jìn)行優(yōu)化。
DeepSeek R1與OpenAI o1在技術(shù)上的關(guān)鍵區(qū)別在于其創(chuàng)新的訓(xùn)練方法,例如在數(shù)據(jù)訓(xùn)練階段采用的R1-Zero方法,直接將強化學(xué)習(xí)(RL)應(yīng)用于基礎(chǔ)模型,而無需依賴監(jiān)督微調(diào)(SFT)和已標(biāo)注數(shù)據(jù)。
根據(jù)DeepSeek官方技術(shù)文檔,R1模型利用數(shù)據(jù)蒸餾技術(shù)(Distillation)生成的高質(zhì)量數(shù)據(jù),提升了訓(xùn)練效率。
數(shù)據(jù)蒸餾是指通過一系列算法和策略,對原始、復(fù)雜的數(shù)據(jù)進(jìn)行去噪、降維、提煉等處理,從而得到更為精煉、有用的數(shù)據(jù)。
這也是DeepSeek能夠以更少的參數(shù)量實現(xiàn)與OpenAI o1模型性能相當(dāng)?shù)年P(guān)鍵所在。
DeepSeek并非傳統(tǒng)意義上的科技企業(yè),卻以遠(yuǎn)低于美國大型模型公司所使用的GPU資源和成本,成功研發(fā)出極具創(chuàng)新性的模型。
其R1模型的訓(xùn)練成本僅為560萬美元,這一數(shù)額甚至不及Meta GenAI團(tuán)隊中任何一位高層管理人員的年薪。
背后幻方量化的投資布局考量
梁文鋒,作為兩家資產(chǎn)規(guī)模達(dá)百億的量化私募機構(gòu)——浙江九章資產(chǎn)管理有限公司和寧波幻方量化投資管理合伙企業(yè)(有限合伙)的實際控制人,同時也是DeepSeek的創(chuàng)始人。
梁文鋒自浙江大學(xué)電子工程系A(chǔ)I專業(yè)畢業(yè)后,曾涉足與專業(yè)不直接相關(guān)的金融科技行業(yè),專注于私募基金和量化投資領(lǐng)域多年。
作為量化投資領(lǐng)域的資深私募公司,幻方量化自2015年成立以來迅速崛起,成為行業(yè)的領(lǐng)頭羊,管理規(guī)模一度突破千億人民幣。
作為私募公司,幻方量化必須通過量化投資業(yè)務(wù)實現(xiàn)盈利,以保障公司的持續(xù)運營和發(fā)展,包括為DeepSeek的研發(fā)提供資金支持。
在量化投資領(lǐng)域,公司運用先進(jìn)的量化策略,結(jié)合AI技術(shù)對大量金融數(shù)據(jù)進(jìn)行分析和建模,制定精確的投資決策,在過去的市場表現(xiàn)中取得了顯著的業(yè)績。
在2016年,幻方量化推出了首個基于深度學(xué)習(xí)的交易模型,并開始將GPU引入計算交易倉位。
此后,梁文峰不斷擴大AI算法研究團(tuán)隊,將AI技術(shù)深度融入金融投資量化策略中,逐步取代了所有傳統(tǒng)模型。
至2017年,幻方宣布其投資策略已全面AI化。
至2019年,幻方量化成為中國首家募資超過1000億元人民幣的量化基金。
幻方量化自2019年起開始囤積GPU,至2021年,在中國擁有1萬張GPU的企業(yè)寥寥無幾,而擁有1萬張英偉達(dá)A100芯片的公司僅幻方量化一家。
隨著幻方量化囤積GPU規(guī)模的不斷擴大,幻方開始成立專門的AI研究公司。
2019年推出螢火一號AI集群,2021年又投資10億人民幣,研發(fā)螢火二號以提供算力支持,可見在技術(shù)層面,幻方量化把握住了市場機遇。
在美國于2022年對中共實施芯片制裁之前,幻方量化已大規(guī)模購買英偉達(dá)芯片,為后續(xù)產(chǎn)品的面世奠定了重要基礎(chǔ)。
2023年7月,梁文峰宣布正式進(jìn)軍通用AIAPI領(lǐng)域,創(chuàng)辦了DeepSeek,僅用10個月時間,至2024年5月,DeepSeek推出了version2模型。
DeepSeek的成立標(biāo)志著幻方量化從量化投資向AI技術(shù)的深度轉(zhuǎn)型。
通過DeepSeek,梁文鋒不僅在AI領(lǐng)域取得了顯著成就,還為幻方量化在量化投資領(lǐng)域提供了更強大的技術(shù)支持。
作為國內(nèi)領(lǐng)先的量化投資機構(gòu),幻方量化自成立以來,一直致力于運用機器學(xué)習(xí)和全自動量化交易推動國內(nèi)量化投資的發(fā)展。
隨著AI大模型在國內(nèi)的迅速崛起,業(yè)界流傳著一種說法:在中國,擁有最多高性能GPU的機構(gòu)并非AI公司,而是幻方量化。
資金雄厚、不吝嗇的幻方量化在背后支持DeepSeek進(jìn)行模型研究,其研究路線堅持開放源代碼,且并不急于將研究成果商業(yè)化應(yīng)用。
據(jù)接近DeepSeek管理層的內(nèi)部人士介紹,梁文鋒已個人投資于一些未來可能在DeepSeek模型基礎(chǔ)上發(fā)展起來的下游AI應(yīng)用企業(yè)項目。
這表明梁文鋒正在為DeepSeek未來構(gòu)建一個小型生態(tài)系統(tǒng)而提前進(jìn)行布局。
對英偉達(dá)等科技巨頭的潛在影響
美國財經(jīng)雜志《財富》發(fā)出警告,指出DeepSeek正對英偉達(dá)在AI領(lǐng)域的主導(dǎo)地位構(gòu)成威脅。
正如先前所述,DeepSeek已經(jīng)推出了采用性能較低、成本更為經(jīng)濟(jì)的芯片的最新產(chǎn)品系列,此舉對英偉達(dá)施加了壓力。
有觀點認(rèn)為,這可能導(dǎo)致其他大型科技公司減少對英偉達(dá)更高端產(chǎn)品的采購。
AvaTrade的首席市場分析師凱特·利曼在接受《財富》雜志采訪時指出:[投資者對DeepSeek利用性能較弱的AI芯片的能力表示擔(dān)憂,這可能會影響英偉達(dá)在AI硬件市場的主導(dǎo)地位,尤其是考慮到其估值在很大程度上依賴于AI領(lǐng)域的需求。]
值得注意的是,據(jù)tomshardware的報道,DeepSeek在AI技術(shù)上的突破并未采用英偉達(dá)的CUDA平臺,而是選擇了類似匯編語言的PTX編程方式,這在一定程度上加劇了業(yè)界對英偉達(dá)未來發(fā)展的憂慮。
由于受到DeepSeek的沖擊,美國芯片行業(yè)巨頭英偉達(dá)的股價在當(dāng)日暴跌約17%,博通公司的股價也下跌了17%,AMD的股價下跌了6%,微軟的股價下跌了2%。
美國聯(lián)合能源公司的股價下跌了21%,而Vistra的股價更是下跌了29%。
幻方量化,一家專注于量化投資的公司,早已洞察到AI算力需求的潛在泡沫。
傳統(tǒng)AI訓(xùn)練對算力的需求巨大,而英偉達(dá)的芯片作為算力的核心,其重要性不言而喻。
然而,DeepSeek的問世使市場認(rèn)識到,AI對算力的需求并非如先前所預(yù)期的那樣龐大。
DeepSeek的開源旨在向公眾證明,AI實際上僅需原先算力的十分之一。
這一舉措進(jìn)一步加劇了英偉達(dá)股價的下跌風(fēng)險。
若DeepSeek未能達(dá)到預(yù)期效果,或市場反應(yīng)不及預(yù)期,英偉達(dá)的股價可能不會下跌,甚至可能上漲。
從技術(shù)競爭角度看,DeepSeek的低成本、高效能技術(shù)路徑如果被廣泛應(yīng)用,可能會減少市場對英偉達(dá)高端GPU的依賴,理論上存在促使幻方量化做空英偉達(dá)以獲取利益的動機。
但幻方量化此前囤積了上萬張英偉達(dá) A100 和 H800 芯片,這些芯片是其技術(shù)研發(fā)的重要基礎(chǔ),與英偉達(dá)也存在著一定的合作關(guān)系,這又使得其做空英偉達(dá)的行為存在諸多矛盾之處。
盡管目前缺乏明確證據(jù)證明幻方量化對英偉達(dá)進(jìn)行了做空操作,但DeepSeek在技術(shù)上的突破對英偉達(dá)市場地位可能產(chǎn)生的影響,無疑已經(jīng)引起了市場的廣泛關(guān)注。
根據(jù)券商中國的報道,摩根士丹利在其最新研究報告中宣布,將2025年英偉達(dá)GB200的預(yù)期出貨量從先前的3萬至3.5萬件大幅削減至2萬至2.5萬件,最悲觀的預(yù)測顯示出貨量可能不足2萬件。
此次預(yù)期下調(diào)可能會對GB200供應(yīng)鏈?zhǔn)袌鲈斐?00億至350億美元的影響,給相關(guān)供應(yīng)鏈及半導(dǎo)體行業(yè)帶來沉重壓力。
摩根士丹利指出,市場對于大型語言模型(LLM)的效率存在爭議,例如DeepSeek與微軟之間的分歧,預(yù)計這些爭議在2025年仍將持續(xù),這將使得市場難以對這些股票的價值進(jìn)行重新評估。
此外,依據(jù)周期性規(guī)律,云計算行業(yè)的資本支出增長速度可能在2025年第四季度減緩至個位數(shù)百分比。
盡管如此,摩根士丹利預(yù)測,如果歷史周期性規(guī)律重演,這一增長周期可能會持續(xù)至2025年上半年。
隨著市場逐漸接近周期頂峰,預(yù)計2025年第四季度,同比增長速度將減緩至個位數(shù)。
投資者對GB200供應(yīng)鏈股票的預(yù)期增長過高,可能會對高市盈率的云計算股票產(chǎn)生負(fù)面影響。
結(jié)尾:技術(shù)革新的路徑預(yù)計將產(chǎn)生影響
①AI初創(chuàng)企業(yè)的運營模式將經(jīng)歷轉(zhuǎn)變:那些依賴昂貴GPU集群的AI企業(yè)可能會因為成本上的不利地位而面臨破產(chǎn)風(fēng)險。
這將導(dǎo)致二手市場GPU供應(yīng)量的大幅增加,而中小規(guī)模的AI企業(yè)則更可能傾向于采購價格更為低廉的低端GPU。
②硬件需求也將經(jīng)歷結(jié)構(gòu)性的轉(zhuǎn)變:自去年以來,以訓(xùn)練為主導(dǎo)的算力需求已經(jīng)開始向推理側(cè)轉(zhuǎn)移。
未來這種趨勢預(yù)計將會持續(xù),眾多中小AI企業(yè)將不再致力于訓(xùn)練基礎(chǔ)模型,而是轉(zhuǎn)向采用DeepSeek這類開源模型。
此外,英偉達(dá)在訓(xùn)練市場的主導(dǎo)地位也將面臨重新評估。
部分資料參考:極客公園:《Deepseek又出連招:剛發(fā)布了超越DALL-E3的多模態(tài)模型》,字母榜:《DeepSeek推翻兩座大山》,量子位:《[DeepSeek甚至繞過了CUDA],工程師靈魂提問:英偉達(dá)護(hù)城河還在嗎?》,Meta財經(jīng):《關(guān)于幻方私募:當(dāng)AI算法走進(jìn)量化世界,無痛[躺贏]?》,私募排排網(wǎng):《DeepSeek背后的百億私募大佬基金業(yè)績?nèi)绾?》,?jīng)濟(jì)觀察報:《雷軍都來挖人,這家公司想把1%的AI天才藏起來》,半導(dǎo)體行業(yè)觀察:《成就DeepSeek奇跡的芯片,敲響英偉達(dá)警鐘》,貝殼財經(jīng):《DeepSeek崛起,英偉達(dá)暴跌》,華爾街見聞:《DeepSeek最強國產(chǎn)大殺器?英偉達(dá)一家就沒了近4.3萬億》,甲子光年:《英偉達(dá)市值蒸發(fā)創(chuàng)紀(jì)錄,DeepSeek掀起AI算力革命意味著什么?》
原文標(biāo)題 : AI芯天下丨產(chǎn)業(yè)丨DeepSeek的壓力給到華爾街,掀起蝴蝶效應(yīng)

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風(fēng)翻身?