DeepSeek是中國人工智能趕超美國的加速點嗎?
(本文系紫金財經(jīng)原創(chuàng)稿件,轉(zhuǎn)載請注明來源)
2025年伊始,橫空出世的DeepSeek上演了一場全球技術(shù)風暴,搶走了幾乎所有AI大模型的風頭。
在業(yè)內(nèi),DeepSeek的開源路線備受矚目,甚至讓OpenAI CEO山姆·奧爾特曼自省OpenAI站在了“歷史的錯誤一邊”。而DeepSeek低成本高性能的表現(xiàn),更是打破了行業(yè)遵循“大力出奇跡”的原則,讓大家看到了大模型的更多可能性。
不僅業(yè)內(nèi)將DeepSeek視為顛覆者,DeepSeek更是破圈融入更多領(lǐng)域,不少AI行業(yè)外的用戶也用起了DeepSeek,算命、聊天、工作,甚至還有人拿DeepSeek賺錢......上線僅僅20天,DeepSeek就突破了2000萬日活大關(guān),迅速超越ChatGPT成為全球增速最快的AI應用。
這家起源于中國杭州的科技公司,讓人興奮不已。過去“關(guān)于中國人工智能距離美國差距多遠”的這個問題,有樂觀者認為只有幾個月,也有悲觀的聲音認為還有十年,兩方的認知差距甚遠,但DeepSeek的出現(xiàn),似乎讓人們看到了更清晰的光,原來中國的人工智能一直在亦步亦趨,擇機超越。
DeepSeek的火熱讓國內(nèi)用戶更加自信,悲觀者們也再次樂觀起來。這是條攪動AI發(fā)展進程的鯰魚,攪得全球人工智能賽道的選手們都不得不重新評估自身的技術(shù)水平及位置。DeepSeek技術(shù)水平如何,DeepSeek的成功,會是中國人工智能趕超美國的加速點嗎?
顛覆全球AI行業(yè)格局
將時間回溯至兩年前,2023年初,同樣是春節(jié),來自大洋彼岸的ChatGPT爆火,一場AI大模型浪潮轟轟烈烈地拉開了序幕。
彼時,ChatGPT無疑是這場AI浪潮當之無愧的引領(lǐng)者,而被譽為“ChatGPT之父”的Open AI CEO山姆·奧爾特曼,被《時代》周刊評為2023年度 CEO,也被媒體冠上“硅谷的造王者”之名。
Open AI的成功讓行業(yè)一直跟隨其發(fā)展路徑,遵循“Scaling Law”原則,即認為更多的數(shù)據(jù)和更強的算力能夠訓練出更優(yōu)秀的模型,堅信“大力出奇跡”。
此后,為了踏上這艘時代的AI大船,不少科技巨頭們紛紛在數(shù)據(jù)和算力上投入巨資,試圖買到通往AI世界的“船票”。而所有的努力并沒有讓他們快速勝出,反而成就了顯卡霸主英偉達的萬億市值。
但DeepSeek的出現(xiàn),打破了“大力出奇跡”的大模型原則。
根據(jù)公開資料顯示,DeepSeek 的R1模型訓練成本僅為560萬美元,遠遠低于科技巨頭們此前動輒數(shù)億、數(shù)十億美元的人工智能技術(shù)投入費用。
斯坦福大學計算機科學系和電子工程系副教授吳恩達也公開表示,OpenAI - o1模型每百萬輸出token的成本為60美元,而Deepseek-R1只需2.19 美元,成本差距將近30倍。
成本的大幅下降源于DeepSeek在算法、硬件利用率方面都做了革新。傳統(tǒng)大模型遵循“預訓練-監(jiān)督微調(diào)(SFT)-強化學習(RL)”的三段式訓練流程,其中SFT階段需標注海量數(shù)據(jù),成本占比超40%。DeepSeek-R1跳過了SFT階段,使用“純強化學習+冷啟動”模式,直接用RL訓練實現(xiàn)推理能力。
簡而言之,SFT是人類生成數(shù)據(jù),機器學習;而RL是機器生成數(shù)據(jù),機器學習。
除了算法上的優(yōu)化,DeepSeek將硬件利用率也推向極致。單GPU算力利用率行業(yè)平均是15%,而DeepSeek可以達到23%,不管是DeepSeek的FP8混合精度訓練,還是動態(tài)序列長度調(diào)整,DualPipe并行架構(gòu)優(yōu)化,都在極大程度上榨干硬件潛能。
因此DeepSeek 采用性能更低、價格更便宜的次高端芯片就可以訓練出性能不輸ChatGPT的大模型。
低成本之外,DeepSeek也一反行業(yè)閉源路線,采取開源路線。在DeepSeek 創(chuàng)始人梁文鋒看來,先有一個強大的、廣泛的技術(shù)生態(tài)更重要。開源可以吸引更多大廠和技術(shù)人才涌入,共建共創(chuàng)一個更強大的人工智能大模型生態(tài)。
“低成本+開源路線”的組合拳,大大降低了AI應用的門檻,打破了傳統(tǒng)AI巨頭的壟斷地位,讓AI大模型的未來不再屬于“算力霸權(quán)”,更多的中小企業(yè)也可以入局訓練自己的AI,從而提供了更多的發(fā)展可能性。
可以說,Deepseek的出現(xiàn)幾乎重塑了全球AI市場的競爭格局,催生了一個更開放、更普惠的AI生態(tài)。
加速中國人工智能趕超
不到一個月時間,大廠們紛紛接入DeepSeek。在國內(nèi)市場,華為云、騰訊云、阿里云等頭部云服務(wù)廠商率先行動。
華為云攜手硅基流動,基于昇騰云服務(wù)推出了 DeepSeek - R1/V3 推理服務(wù);騰訊云則利用其高性能應用服務(wù)HAI和TI平臺,支持DeepSeek-R1的快速一鍵部署,整個流程僅需3分鐘即可完成,并為用戶提供了限時免費體驗的機會;阿里云在PAI Model Gallery中也加入了對DeepSeek-V3和R1模型的一鍵部署支持,極大地簡化了從模型訓練到推理的全過程,同時采用按需計費模式,進一步降低了企業(yè)使用AI技術(shù)的成本門檻。
除此之外,百度智能云、京東云、火山引擎等平臺也也相繼跟進,積極擁抱DeepSeek。
不僅國內(nèi)大廠迅速接入DeepSeek,海外科技大廠亦是如此。
微軟Azure平臺已將DeepSeek-R1整合至其Azure AI Foundry服務(wù)中,為企業(yè)級用戶提供專業(yè)的AI解決方案;亞馬遜則在Amazon Bedrock和SageMaker AI平臺上實現(xiàn)了對DeepSeek-R1模型的部署支持,并借助AWS Trainium技術(shù)為用戶提供更具成本效益的部署方案;英偉達通過NVIDIA NIM云原生微服務(wù)技術(shù)上線了DeepSeek-R1模型,
海內(nèi)外的科技大廠們在如此短時間內(nèi)集體接入DeepSeek,這是大模型誕生至今的獨一份,是大廠們反復權(quán)衡后的選擇。行業(yè)內(nèi)能夠迅速達成一致,認可DeepSeek,充分說明了其價值。
不過,DeepSeek收獲了多少贊譽,同樣也要承受多少質(zhì)疑。以破局之姿出現(xiàn),DeepSeek的影響力超出想象,這讓很多國外的大佬們慌了。
馬斯克第一時間質(zhì)疑:“中國公司一定從美國獲得了更高端芯片”。特朗普公開評論DeepSeek,稱它在“給美國產(chǎn)業(yè)敲響警鐘”,并呼吁“集中精力贏得競爭”。而在美國參議院外交關(guān)系委員會聽證會上,智庫代表公然提議“偷走中國最好的工程師”,試圖引發(fā)人才戰(zhàn)。
這些質(zhì)疑聲,無疑是另一個側(cè)面證明——DeepSeek的出現(xiàn)讓美國狠狠地焦慮了。
過去,關(guān)于中國人工智能和美國的差距,大家眾說紛紜,有樂觀的觀點認為差距只有幾個月,也有悲觀者認為有10年差距。兩方的想法差距甚遠,但DeepSeek的出現(xiàn),似乎讓人們看到更清晰的光。
一方面,DeepSeek證明了中國人工智能在成本上的顯著優(yōu)勢,依靠成本優(yōu)勢極有可能趕超美國。另一方面,DeepSeek通過開源路線正在構(gòu)建自己的AI生態(tài),更多開發(fā)者的加入,意味著技術(shù)的應用和迭代也將大大提速。
DeepSeek的破局,讓中國AI企業(yè)首次站上技術(shù)制高點,這或許是中國人工智能趕超美國的重要加速點。
AGI之路并非坦途,DeepSeek也有難題
盡管AGI被視為技術(shù)革命的終極目標,但其發(fā)展路徑充滿技術(shù)、倫理與商業(yè)化難題。DeepSeek雖身披光環(huán),但在推動AGI落地的過程中同樣面臨技術(shù)與現(xiàn)實的重重挑戰(zhàn),甚至它也有自己的“陰影”。
首當其沖的仍然是技術(shù)方面,模型能力與泛化性的難題。目前DeepSeek在文本生成這一單一任務(wù)中表現(xiàn)突出,但要想真正實現(xiàn)AGI,必須擁有跨領(lǐng)域推理和自主決策能力,這一步絕非易事。DeepSeek需要攻克多模態(tài)數(shù)據(jù)融合、模型泛化性等一系列技術(shù)瓶頸,確保AI系統(tǒng)能在不同場景下均能保持高精度與穩(wěn)定性。
不可否認,科技巨頭們生態(tài)系統(tǒng)更強大,數(shù)據(jù)積累、算力基礎(chǔ)建設(shè)更多,也有更大的財力支持,在長遠的AI競爭之下,DeepSeek還是得找到自己的“小米加步槍”式創(chuàng)新路徑,以巧取勝。
其次,隨著DeepSeek擴展到更廣泛的企業(yè)級應用,也可能帶來新的挑戰(zhàn)。服務(wù)于大型客戶、處理復雜實時數(shù)據(jù)的需求激增,對計算資源的消耗呈現(xiàn)出幾何級增長態(tài)勢,這無疑會加大成本控制與效率優(yōu)化的難度。如何在保證服務(wù)質(zhì)量的同時,有效控制成本,成為DeepSeek亟需解決的現(xiàn)實問題。
事實上,近期隨著用戶規(guī)模的快速擴張,服務(wù)器負載過重、響應延遲等問題已經(jīng)暴露出DeepSeek在應對大規(guī)模應用時的短板,這要求DeepSeek必須在技術(shù)架構(gòu)與服務(wù)模式上進行深度革新。
另外,DeepSeek也面臨著激烈的競爭和開源壓力。OpenAI、谷歌在AGI領(lǐng)域形成技術(shù)壁壘不可忽視,尤其是OpenAI通過多模態(tài)模型Sora和智能體AIAgent已經(jīng)構(gòu)建起應用生態(tài),涵蓋智能寫作、圖像生成、智能交互等多個領(lǐng)域,用戶粘性極高。如果DeepSeek聚焦單一領(lǐng)域,很可能在這場激烈的競爭中逐漸喪失優(yōu)勢。
并且開源社區(qū)的壓力會迫使DeepSeek權(quán)衡技術(shù)保密與開放協(xié)作,如何在保持競爭力的同時融入全球AGI生態(tài),也是DeepSeek未來的戰(zhàn)略難題之一。
結(jié)語
DeepSeek的橫空出世,無疑為全球AI領(lǐng)域注入了一股強大的新生力量。它以低成本高性能的創(chuàng)新模式和開源路線,打破了傳統(tǒng) AI 巨頭的壟斷格局,重塑了全球 AI 市場的競爭生態(tài),也為中國人工智能趕超美國帶來了新的希望與可能。
然而,AGI之路并非一蹴而就,DeepSeek在追求技術(shù)巔峰的同時,也面臨著諸多挑戰(zhàn)與難題。從模型能力與泛化性的技術(shù)瓶頸,到成本控制與效率優(yōu)化的現(xiàn)實困境,再到競爭壓力與開源社區(qū)的權(quán)衡考量,每一步都充滿了未知與變數(shù)。
當然這些挑戰(zhàn)很多都是行業(yè)需要共同面對的命題,DeepSeek 此前的成功已經(jīng)證明了其創(chuàng)新能力和無限潛力,如何在人工智能賽道上走得更遠,需要DeepSeek的締造者們更為成熟的考慮。
不管怎么說,DeepSeek帶來的不僅是技術(shù)上的追趕,還有新的信心。信心之下,也許正在孕育孵化更多的可能。
原文標題 : DeepSeek是中國人工智能趕超美國的加速點嗎?

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
-
10 月之暗面,絕地反擊
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風翻身?