DeepSeek啟示錄:偉大不能被計劃
正如梁文鋒所說:「創(chuàng)新都是自己產(chǎn)生的,不是刻意安排的!
文 | 佘宗明
「國運級科技突破」「美國的斯普特尼克時刻」「AI珍珠港事件」……DeepSeek刮起的「最炫民族AI風(fēng)」,遠(yuǎn)沒有停下來的跡象。
美國方面對DeepSeek以國家安全調(diào)查名義展開「獵巫」,又為其輿論熱度火上澆了油。
看上去,DeepSeek才是「春節(jié)檔」最大贏家:成立僅1年半的DeepSeek于無聲處釀出了驚雷,堪比作「魔童鬧!梗皇钩鼋谍埵苏浦苯又貏(chuàng)納斯達(dá)克的DeepSeek提振了國人信心,不啻為「俠之大者」;掀起AI領(lǐng)域「算力起義」的DeepSeek改寫了AI權(quán)力游戲規(guī)則,配得上被「封神」。
正因如此,在國內(nèi)外輿論場,DeepSeek幾乎被各種震驚體圍裹。
▲《黑神話·悟空》制作人馮驥將DeepSeek-R1視作國運級別的科技成果。
在宏大敘事框架下,DeepSeek的異軍突起,很容易被人拿來跟華為突破美國封堵重新推出「爭氣機」5G手機華為Mate60 Pro并論,跟大國科技崛起的話語綁定。
在芯片法案與TikTok剝離法案已成中美科技競賽烈度直觀反映的當(dāng)下,這類解讀在所難免。
但不能因此就抹殺DeepSeek奇跡中「去Nationalism」的部分,要看到,DeepSeek能變成眼下的DeepSeek,跟很多具體因素有關(guān),如梁文鋒的極致技術(shù)理想主義,如DeepSeek人才使用的反經(jīng)驗主義。
也正是DeepSeek身上的多重獨特性,使得它可以像荊棘花那般不懼凜風(fēng)與涸土地盛開。
在我看來,如果要用一句話總結(jié)DeepSeek啟示錄的精髓,那就是:偉大不能被計劃。
01
「偉大不能被計劃」,言下之意是,不要試圖去設(shè)計規(guī)劃好一切,很多事情本就是「無心插柳」的結(jié)果。
DeepSeek能同時登頂蘋果App Store中美下載排行榜第一,就是最直觀的驗證。它的崛起之路,有著太多的「讓人意想不到」。
在9個月前,許多人印象中的國內(nèi)AI頭部玩家,還是以BAT和字節(jié)為代表的大廠和AI大模型六小虎(智譜AI、月之暗面、百川智能、MiniMax、階躍星辰、零一萬物)。
誰能想到,「名少見經(jīng)傳」的DeepSeek 能戳穿性價比天花板,證明「明明是主流玩家的電影,我卻偏偏要有姓名」呢?
在1個多月前,很多人認(rèn)知中的OpenAI挑戰(zhàn)者,依舊在硅谷——紅杉資本此前就認(rèn)為,現(xiàn)在AI領(lǐng)域是五強爭霸:微軟+OpenAI,亞馬遜+Antropic,谷歌,Meta和xAI。
誰能想到,DeepSeek能用OpenAI僅約1/10的預(yù)訓(xùn)練成本,就推出了性能可與GPT-4o、Claude 3.5 Sonnet等頂尖閉源模型相匹敵的DeepSeek-V3呢?
在10多天前,有些人仍然會認(rèn)為,DeepSeek-V3只是曇花一現(xiàn),連DeepSeek都很難再復(fù)制DeepSeek。
誰能想到,DeepSeek又掏出了成本依舊低廉、性能更加強大的DeepSeek-R1(性能可對標(biāo)OpenAI o1正式版,API服務(wù)定價則要低上27-55倍),直接震驚歐美科技界呢?
▲DeepSeek-R1引發(fā)美股地震后,引起國內(nèi)外媒體廣泛關(guān)注。
事實上,就在DeepSeek-V3發(fā)布時,依然有國內(nèi)專家將Deepseek視作小米Su7,「神似某捷的外型、單層的、民用級剎車卡鉗、大概其的隔音……雖然一上賽道跑幾圈剎車就嚴(yán)重衰減,雖然里里外外都是蔚小理玩過的東西,沒有技術(shù)和形態(tài)突破!褂袊馊耸空J(rèn)為DeepSeek雖然拿出了「30美元iPhone」,但那只是平替。
但DeepSeek-R1用特朗普震驚、山姆·奧特曼嘆服、馬斯克「內(nèi)涵」的反應(yīng)證明了,它確實不是池中物。
而今,不少國內(nèi)網(wǎng)友儼然用滿屏驚嘆擺成了四郎的表情包:你還有多少驚喜是朕不知道的?
02
「偉大不能被計劃」,也是因為,很多「偉大」的事物一開始可能是「微小」的。
DeepSeek能不能承載起「國運級成果」的名頭,興許還有爭議,但它確實當(dāng)?shù)闷稹干衿妗苟帧?/p>
DeepSeek-R1究竟厲害在哪?懂技術(shù)的人興許張口就是一堆名詞:合成數(shù)據(jù)、知識蒸餾、FP8低精度、稀疏模型、MoE、多頭注意力機制……
這些技術(shù)未必是首創(chuàng),但DeepSeek能利用既有技術(shù),實現(xiàn)訓(xùn)練量效比、算力能效比的極致提升,也是現(xiàn)象級突破。
都說「多少輛馬車相加,都加不出一輛汽車來。」喬布斯當(dāng)年發(fā)明iPhone,不是在功能機上疊加MP3、攝像機等功能,而是用觸屏體驗+軟硬件一體化重新定義了手機。DeepSeek的難得之處也在于「重新定義」——它打破了路徑依賴,重新定義了算力提升方式。
有人這樣比喻:若是把提升算力視作蓋樓,那OpenAI就是狂堆磚塊(芯片硬件),DeepSeek則是依托發(fā)明鋼筋混凝土(數(shù)學(xué)框架創(chuàng)新)來重塑建造方式。
OpenAI讓大模型研發(fā)變成了比誰磚塊多的比賽,DeepSeek則讓大模型研發(fā)變成了比誰建筑方式更高效的PK。
▲有網(wǎng)友這樣調(diào)侃OpenAI跟DeepSeek的差別。
DeepSeek只是個200多人的公司,卻能挾工程能力優(yōu)勢用算法優(yōu)化「發(fā)明」出算力倍增器,干出很多國內(nèi)外大廠都沒干出的事來,這不免讓人想起凱文·凱利在《5000天后的世界》中的那句話——「未來最成功的那個公司,必然是今天還默默無聞的、在社交媒體領(lǐng)域外的某個小公司!
小就是大。在大公司成功的經(jīng)驗成為它們的桎梏時,創(chuàng)業(yè)公司卻可以以好奇心驅(qū)動的創(chuàng)新動能、扁平無層級的組織架構(gòu),展現(xiàn)出更大的創(chuàng)新勢能來。
DeepSeek就是典型。AI創(chuàng)業(yè)公司的高強活力跟梁文鋒的高維認(rèn)知疊合后,產(chǎn)生的化學(xué)反應(yīng)十分驚人。
梁文鋒對AGI(通用人工智能)的技術(shù)信仰,對中美AI差距本質(zhì)是「原創(chuàng)與模仿之差」的清醒洞見,對「閉源的護(hù)城河是短暫的,OpenAI閉源也無法阻止被趕超」的前瞻判斷,本就體現(xiàn)了高于行業(yè)的認(rèn)知能力。
DeepSeek采用無層級的靈活協(xié)作機制,重潛力和好奇心不重行業(yè)經(jīng)驗的招聘標(biāo)準(zhǔn),開源的生態(tài)戰(zhàn)略,都與此有關(guān),也放大了其勢能。
因而,DeepSeek可以在朱嘯虎式判斷廣受推崇的時下,篤定「不做應(yīng)用,專注大模型研究」的長期主義戰(zhàn)略,可以在OpenAI路線大行其道的情況下,擁抱更高效更開放的AI發(fā)展道路。
為什么是DeepSeek?部分答案就藏在其中。
03
「偉大不能被計劃」,也意味著,那些偶然性與獨特性不該被忽略。
行業(yè)專家楊寬老師就說:當(dāng)OpenAI沉迷于暴力堆料時,DeepSeek團(tuán)隊在玩「算力俄羅斯方塊」——把每個CUDA核心的價值壓榨到小數(shù)點后四位,就硬件利用率而言,硅谷利用GPU群組通信損耗技術(shù)達(dá)到了30%-40%,DeepSeek則利用自研MoE+動態(tài)路由算法達(dá)到了78%,「這不是技術(shù)差距,而是工程思維的代際碾壓!
這背后就離不開DeepSeek團(tuán)隊提出的MLA架構(gòu)創(chuàng)新,它借此將顯存占用降至傳統(tǒng)方法的5%-13%。背后的背后則是一年輕研究員的突然靈感和突發(fā)奇想。
他還講到,梁文鋒將量化交易思維注入AI訓(xùn)練當(dāng)中:風(fēng)險對沖(用多模態(tài)數(shù)據(jù)構(gòu)建「投資組合」)、高頻調(diào)參(在行業(yè)標(biāo)準(zhǔn)72小時/次的前提下,每2小時優(yōu)化一次超參數(shù))、動態(tài)止損(自動終止低效訓(xùn)練分支),這套「華爾街煉金術(shù)」使得DeepSeek的每次訓(xùn)練都像在玩《文明6》的科技樹速通。
這很容易讓人想到肯尼斯·斯坦利和喬爾·雷曼在《為什么偉大不能被計劃》中舉的例子:發(fā)明飛機的萊特兄弟,最早其實是自行車制造商;真空管是早期計算機的奠基性零件,但真空管的誕生與計算機毫無關(guān)系……
做量化交易起家的梁文鋒,創(chuàng)造出了「心價比」超強的AI大模型,又為其新添了案例。
▲被很多歪果仁稱作「東方神秘力量」的DeepSeek,發(fā)展路徑有其獨特性。
DeepSeek被津津樂道的,還有其開源模式:在OpenAI背離初心變成CloseAI的背景下,DeepSeek變成了真正Open的AI;在OpenAI把開發(fā)者當(dāng)「數(shù)字佃農(nóng)」時,DeepSeek用開源協(xié)議發(fā)動「AI土地革命」……這也是其了不起的地方。
這也跟梁文鋒的技術(shù)理想主義氣質(zhì)緊密相關(guān)。換個人,可能又是師山姆·奧特曼長技以制競爭對手的打法了。
梁文鋒說:「創(chuàng)新都是自己產(chǎn)生的,不是刻意安排的!
這相當(dāng)于拍了拍肯尼斯·斯坦利們,并向他們表達(dá)了認(rèn)同。因為肯尼斯·斯坦利說:真正的偉大是計劃不出來的,跟著好奇心一步一步走,才是成就非凡的正確路徑。
04
「偉大不能被計劃」,所以那些看似很小的種子,沒準(zhǔn)也能「開出花,伸出新長的枝椏」;那些在邊緣地帶、外圍區(qū)域、隱秘角落的探索,興許也能「小力出奇跡」。
跟國外的GAFA(谷歌蘋果臉書亞馬遜)和英偉達(dá)、國內(nèi)的BAT一樣,DeepSeek不是計劃出來的,而是在適宜土壤上長成的。
既然創(chuàng)新是激發(fā)好奇心、激活創(chuàng)造性后擺脫路徑依賴的產(chǎn)物,而非計劃出來的結(jié)果,那對于創(chuàng)新應(yīng)有的呵護(hù)與激勵,也不該是回到路徑依賴中去,而是為那些好奇心與創(chuàng)造性提供良好的制度環(huán)境,包括包容氛圍、試錯空間。
就目前看,DeepSeek走紅后,輿論場中有些反應(yīng)就值得警惕,這其中的某些反應(yīng),更進(jìn)一步通向的就是那種對「計劃」的路徑依賴。具體來說就包括:
一,將DeepSeek的突破導(dǎo)入Nationalism的語境中,認(rèn)為要將其作為「AI國家隊」來加以收編、大力扶持。
「自創(chuàng)生」的DeepSeek,不需要揠苗助長,只需要適合創(chuàng)新的氣候土壤。
仔細(xì)看會發(fā)現(xiàn),從《黑神話·悟空》到宇樹科技的機器狗再到DeepSeek在StyleCtrl類別中排第一的大模型,都誕生在杭州。
這不是偶然。通常而言,市場底色足-民營企業(yè)多-創(chuàng)新氛圍濃-經(jīng)濟(jì)活力足-發(fā)展機遇廣-成為未來科技中心概率大,是一體的。
尊重市場、鼓勵創(chuàng)新、擁抱開放、包容失敗,培育適宜創(chuàng)新的市場生態(tài),就可能會有更多企業(yè)——包括中小民營企業(yè),像DeepSeek一樣冒出來。
倒是那些以關(guān)懷為名的干預(yù),以擔(dān)當(dāng)為由的裹挾,可能會抑制其活力。
二,以「干翻硅谷,單挑華爾街」的「厲害了,我的DS」態(tài)度,將其推向大時代的旋流中。
在美國持續(xù)升級對華AI芯片限制的背景下,DeepSeek利用華為芯片、中國本土AI人才、更低的算力成本研發(fā)出了性能領(lǐng)先的大模型,激發(fā)民族自信心和自豪感很正常,被寄予打破卡脖子局面的厚望也很正常。
但這不應(yīng)導(dǎo)向?qū)eepSeek的無意識捧殺,更不應(yīng)通往對「脫鉤斷鏈論」的里應(yīng)外合。
把DeepSeek的突破視作「國運級」的,個中的揚眉吐氣心態(tài)可以理解,饒是如此,也該盡量避免把企業(yè)跟「干翻」「單挑」之類的字眼關(guān)聯(lián),否則很可能迎合外部的那些「××威脅論」,將其無形中推到靶子位置。
▲DeepSeek眼下正遭到美國方面以國家安全調(diào)查為名的「獵巫」。
往大了說,我們不該在「妄自菲薄」和「妄自尊大」兩極間橫跳。
《暗知識》作者王維嘉就認(rèn)為,從技術(shù)格局來看,盡管 DeepSeek 的成果縮小了中美在人工智能技術(shù)上的差距,但中美人工智能整體格局尚未被撼動。
他覺得,「在人工智能技術(shù)的幾個關(guān)鍵方面,芯片領(lǐng)域中國仍與美國存在較大差距;在算法突破方面,過去十年間,從 2012 年的 alexnet 到2017 年的 transformer,再到 2022 年的 ChatGPT 以及后續(xù)的思維鏈、RAG 和推理訓(xùn)練等重大突破,大多發(fā)生在美國,法國的 Mistral 公司也有少量貢獻(xiàn),DeepSeek 的貢獻(xiàn)占比約為 5%,但這已然十分了不起!
接下來,我們需要更多DeepSeek出來去縮小差距,而不是在捧殺DeepSeek中掐滅火種。
05
說到底,DeepSeek的勝利,是對《為什么偉大不能被計劃》中那個觀點的最佳注解——「在探索未知領(lǐng)域的過程中,保持對有趣事物的開放性,在搜索到足夠數(shù)量的踏腳石之后,偉大的成就自然就會與我們不期而遇。」
DeepSeek邁出了AI發(fā)展史上的重要一步,免不了被置于未來大國博弈、科技競爭的框架下打量。
但無論如何,別忘了——
DeepSeek的創(chuàng)新不是計劃出來的,DeepSeek的創(chuàng)新被看到后也不需要「計劃」來裹挾。
作者 | 佘宗明運營 | 李玩
原文標(biāo)題 : DeepSeek啟示錄:偉大不能被計劃

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風(fēng)翻身?