狂舞的DeepSeek、會扭秧歌的AI機(jī)器人,這個春節(jié)不一般
有點(diǎn)數(shù)·數(shù)字經(jīng)濟(jì)工作室原創(chuàng)
作 者 | 有 叔
微信ID | yds_sh
在辭舊迎新的蛇年春節(jié)假期,橫空出世的DeepSeek金蛇狂舞,AI機(jī)器人在春晚上扭起了秧歌,這些領(lǐng)先行業(yè)的“神秘東方力量”,給全球科技界帶來了“億點(diǎn)點(diǎn)”震撼。
憑一己之力,打壓了AI科技巨頭的估值
DeepSeek(深度求索)是量化巨頭幻方量化旗下大模型公司,1月20日,該公司正式發(fā)布推理大模型DeepSeek-R1。1月27日,DeepSeek應(yīng)用登頂蘋果中國地區(qū)和美國地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜。被DeepSeek壓在身后的,包括了OpenAI旗下的ChatGPT以及Google Gemini等AI產(chǎn)品。這是第一次,有中國科技產(chǎn)品APP實(shí)現(xiàn)雙榜登頂。
更震撼的還在后面,美國時間1月27日,英偉達(dá)(Nasdaq:NVDA)股價暴跌16.86%收于每股118.58美元,跌至過去10月以來的最低點(diǎn);總市值2.90萬億美元,一日蒸發(fā)5900億美元(約合人民幣4.28萬億元),創(chuàng)史上最大單日個股市值蒸發(fā)紀(jì)錄。在英偉達(dá)的帶領(lǐng)下,美股半導(dǎo)體芯片板塊集體受挫,甲骨文下跌13.78%,超微電腦下跌12.49%,芯片制造商博通下跌17.4%,臺積電跌13%。
這些科技巨頭為何會在股市被“掀桌”呢?這是因?yàn)镈eepSeek用開源的方式、更低的成本實(shí)現(xiàn)了高性能的大模型,從而引發(fā)了資本市場對AI科技巨頭估值的擔(dān)憂。
先說開源,由微軟、OpenAI、英偉達(dá)等公司構(gòu)筑出的“美式AI生態(tài)有機(jī)體”,商業(yè)化的前提是“不能開源”——要通過AI模型本身收費(fèi)或者將其納入付費(fèi)產(chǎn)品之中完成商業(yè)閉環(huán)。而DeepSeek-R1則是一款開源推理大模型,基于相關(guān)的許可協(xié)議,DeepSeek-R1允許全球開發(fā)者自由地修改、使用、分發(fā)模型,甚至還可以進(jìn)行衍生開發(fā)和商用。
除了商業(yè)化方面的考量,DeepSeek開源帶給OpenAI的另一個巨大挑戰(zhàn)是,當(dāng)開源產(chǎn)品的“能力”和閉源產(chǎn)品接近甚至反超后者時,對閉源產(chǎn)品的沖擊將是巨大的。DeepSeek下載熱度的激增,背后的核心原因之一正是開源:用戶可以在自己的服務(wù)器或云端免費(fèi)部署DeepSeek-R1,且大幅降低(甚至不需要)API調(diào)用費(fèi)用。
DeepSeek第二個驚人之處,是其極低的預(yù)訓(xùn)練成本。性能比肩GPT-4o的DeepSeek-V3,投入研發(fā)費(fèi)用為558萬美元,訓(xùn)練成本不到GPT-4o的1/20,且只用了2048張H100的GPU集群,用時僅53天。在同等水平下,哪怕是全球AI第一梯隊(duì)的頭部公司,至少也要用到1.6萬張以上的GPU進(jìn)行訓(xùn)練。
大幅降低了技術(shù)成本的DeepSeek,對算力市場形成了強(qiáng)大的沖擊。它背后的那個男人,也來到了聚光燈下。
量化私募大佬,一轉(zhuǎn)身大模型就掀起了價格戰(zhàn)
2025年1月20日,AI初創(chuàng)公司深度求索創(chuàng)始人梁文鋒受邀出席相關(guān)部門座談會,并做了相關(guān)發(fā)言。國內(nèi)做AI通用大模型的大廠不下五個,但只邀請了梁文鋒作為AI領(lǐng)域的企業(yè)家代表。而就在這一天,發(fā)布了DeepSeek-R1,梁文鋒也隨即被社會大眾所關(guān)注。
1985年,梁文鋒出生在廣東湛江吳川市的一個普通家庭,父母都是小學(xué)語文老師。這個來自四線城市的少年,對數(shù)學(xué)特別感興趣,初中時期就學(xué)完了高中數(shù)學(xué),甚至開始學(xué)大學(xué)的數(shù)學(xué)。
2002年,17歲的梁文鋒以全校第一的成績考上浙江大學(xué)本科電子信息工程專業(yè),于2007年考上浙江大學(xué)信息與通信工程專業(yè)研究生。在大學(xué)期間,他遇到了改變自己一生的兩件事:愛上了機(jī)器學(xué)習(xí),迷上了量化交易。
畢業(yè)之后,梁文鋒與同學(xué)一起開始積累市場行情數(shù)據(jù)和探索全自動量化交易。2015年,當(dāng)其他人還在為股市的跌宕起伏心驚膽戰(zhàn)時,30歲的梁文鋒在杭州創(chuàng)立了幻方科技,投身于全自動量化交易,立志成為世界頂級的量化對沖基金。
盡管當(dāng)時公司只有10張GPU顯卡,但不久之后的2016年10月,幻方量化推出第一個AI模型,第一份由深度學(xué)習(xí)生成的交易倉位上線執(zhí)行。到2017年底,幾乎所有的量化策略都采用AI模型計(jì)算。有了AI加持助力,用了4年時間,公司就做到了百億規(guī)模,又用2年時間突破千億大關(guān)。
從一開始,投資賺錢就不是梁文鋒的唯一目的,反而是賺到了足夠多的錢,才能更好地去研究人工智能。2019年,幻方量化成立AI公司,其自研的深度學(xué)習(xí)訓(xùn)練平臺“螢火一號”總投資近2億元,搭載了1100塊GPU;兩年后,“螢火二號”的投入增加到10億元,搭載了約1萬張英偉達(dá)A100顯卡。通常認(rèn)為,1萬枚英偉達(dá)A100芯片是做自訓(xùn)大模型的算力門檻,而單從算力角度看,幻方甚至比很多大廠都更早拿到了做ChatGPT的入場券。
有了這些積累,梁文鋒在2023年7月創(chuàng)立了深度求索(DeepSeek),要做AI大模型。"現(xiàn)在入場,怎么跟OpenAI這樣的行業(yè)巨頭競爭?" 面對質(zhì)疑,篤信“人工智能一定會改變世界”的梁文鋒沒有多做解釋。不到一年的時間,所有人就都閉嘴了,只剩下了佩服。
2024年5月,DeepSeek發(fā)布了DeepSeek-V2,憑借創(chuàng)新的模型架構(gòu)和史無前例的性價比,以"AI界的拼多多"迅速出圈。反卷大廠的梁文鋒,在AI領(lǐng)域復(fù)制了黃崢式“后來居上”的故事,并在國內(nèi)掀起打到骨折的大模型價格戰(zhàn)。
DeepSeek-V2的關(guān)鍵開發(fā)者之一羅福莉曾在社交平臺撰文表示,“單論DeepSeek-V2模型的中文水平,是真實(shí)處在國內(nèi)外閉源模型的第一梯隊(duì)”,“外加1元/百萬輸入Tokens的價格,只有GPT4價格的1/100,性價比之王”。這個羅福莉,就是此前傳聞小米創(chuàng)始人雷軍要開千萬年薪挖走的天才少女。
梁文鋒的用人之道也很有意思:不要海歸,只要本土工程師;不要老手,偏愛應(yīng)屆生;沒有KPI,全憑興趣干活。他說:“一件激動人心的事,或許不能單純用錢衡量。就像家里買鋼琴,一來買得起,二來是因?yàn)橛幸蝗杭庇谠谏厦鎻椬鄻非娜恕?rdquo;
底層技術(shù)路線上的顛覆,實(shí)現(xiàn)了彎道趕超
從技術(shù)原理上來說,DeepSeek的崛起,尤其是最新一代deepseek R1的成功,來自于它所采用的RL強(qiáng)化學(xué)習(xí)策略,這是它以極低的成本卻可以實(shí)現(xiàn)和GPT-4o差不多效果的根本原因。
以GPT為代表的傳統(tǒng)AI,其策略的本質(zhì)是"在人類選擇下的猜謎游戲"——GPT們其實(shí)并不會真正思考,而是通過數(shù)據(jù)訓(xùn)練,生成一些"看似靠譜實(shí)則無法深究"的東西,比如早期繪畫AI會把人手畫出六個指頭,就是因?yàn)锳I不知道人該有幾個指頭,只是通過大量的數(shù)據(jù)訓(xùn)練,能生成一個"大概是這樣"的東西。之后再由人類進(jìn)行篩選,把不靠譜的結(jié)果去除掉,才能得到最終的作品。
而對DeepSeek來說,它完全拋棄了這種"猜謎"的訓(xùn)練方式,轉(zhuǎn)而采用了之前在圍棋和智能駕駛領(lǐng)域常用的RL策略(強(qiáng)化學(xué)習(xí))。如果說以前的策略是人類告訴AI什么是對的什么是錯的,那么RL策略,就是真正地讓AI學(xué)會認(rèn)識世界、了解事物規(guī)律,更加自主地去推理探索。
在傳統(tǒng)技術(shù)路徑下,90%的算力消耗在試錯過程中,而Deepseek的自主學(xué)習(xí)機(jī)制能將無效訓(xùn)練降低60%。因?yàn)榈讓蛹夹g(shù)路線上的顛覆,deepseek R1也把運(yùn)行成本大大降低——比起硅谷動輒數(shù)億數(shù)十億美金的投資和數(shù)萬張顯卡的超級集群,這個國產(chǎn)大模型僅僅靠著2000多張顯卡和600萬美元左右的成本就實(shí)現(xiàn)了近似乃至更好的效果。
對我國初創(chuàng)公司來說,更關(guān)鍵的一點(diǎn)是,RL策略對并行計(jì)算的需求較傳統(tǒng)架構(gòu)下降40%,這直接打破了堆砌算力、數(shù)據(jù)的美國式AI道路,使得國產(chǎn)顯卡和國產(chǎn)芯片有機(jī)會實(shí)現(xiàn)對英偉達(dá)等海外巨頭的替代。
說到這里,DeepSeek的崛起,就不僅僅是技術(shù)側(cè)的意義了:一家誕生在中國的民營公司,不超過200人的本土青年工程師團(tuán)隊(duì),繞開了美國人所探索的“成功模式道路”,采取了創(chuàng)新的思路和開源的方式,以極低的成本創(chuàng)造了業(yè)界矚目的成就,實(shí)現(xiàn)了彎道趕超。
作為硅谷眼中“神秘的東方力量”,Scale AI創(chuàng)始人亞歷山大·王(Alexandr Wang)評價DeepSeek道,“過去十年來,美國可能一直在人工智能競賽中領(lǐng)先于中國,但DeepSeek的AI大模型發(fā)布可能會‘改變一切’。”
寫在最后……
DeepSeek的橫空出世,讓自詡領(lǐng)先至少10年以上的META和CHAT gpt有點(diǎn)不知該何去何從了。號稱“星球大戰(zhàn)”2.0版本,并計(jì)劃耗費(fèi)天文數(shù)字的星際之門還沒打開好像就該關(guān)上了——美國總統(tǒng)特朗普在會議上提到DeepSeek的出現(xiàn)為美國的企業(yè)敲響了警鐘,“我們需要集中精力在競爭中獲勝”。相隔一天,據(jù)外媒報(bào)道,多名美國官員稱DeepSeek是“偷竊”,正對其展開國家安全調(diào)查。
在除夕這天震撼世界的,還有同樣是來自杭州的宇樹科技。在央視春晚現(xiàn)場,來自宇樹科技的人形機(jī)器人H1跳起了AI機(jī)器秧歌,還能多角度轉(zhuǎn)手絹。
這些機(jī)器人身上裝備了多套高科技設(shè)備,如高精度3D激光SLAM自主定位和導(dǎo)航、多智能體協(xié)同規(guī)劃、先進(jìn)組網(wǎng)方案和全身AI運(yùn)動控制,可以讓他們在舞臺上走得穩(wěn)穩(wěn)當(dāng)當(dāng),動作整齊得就像復(fù)制粘貼一樣,這些技術(shù)不僅讓他們們定位超精準(zhǔn),連接超穩(wěn)定,還能應(yīng)對各種突發(fā)狀況。可以說,這是人類歷史上首次大型全AI驅(qū)動的全自動集群人形機(jī)器。前些年不可一世的波士頓動力機(jī)器人,好像三下兩下,也被宇樹趕上了。
從大疆、宇樹再到石破天驚的六代機(jī)、DeepSeek,東方大國不斷涌現(xiàn)出改寫世界技術(shù)版圖的高科技企業(yè)。讓世界目不暇接,甚至逼得某些國家要采取并不光明正大的反制措施了。
“中國必然需要有人站到技術(shù)的前沿”,梁文鋒此前接受采訪時曾表示,回望過去30多年IT浪潮,中國基本沒有參與到真正的技術(shù)創(chuàng)新里。“我們覺得現(xiàn)在最重要的是參與到全球創(chuàng)新的浪潮里去。”被外界視為理想主義者的他說,“過去很多年,中國公司習(xí)慣了別人做技術(shù)創(chuàng)新,我們拿過來做應(yīng)用變現(xiàn),但這并非一種理所當(dāng)然。這一波浪潮里,我們的出發(fā)點(diǎn),就不是趁機(jī)賺一筆,而是走到技術(shù)的前沿,去推動整個生態(tài)發(fā)展。”
原文標(biāo)題 : 狂舞的DeepSeek、會扭秧歌的AI機(jī)器人,這個春節(jié)不一般

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會
-
即日-5.15立即報(bào)名>>> 【在線會議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評 >> 【評選啟動】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?