訂閱
糾錯(cuò)
加入自媒體

AI大模型內(nèi)卷加劇,商湯憑什么卷進(jìn)來(lái)

作者|小葳

出品|智能進(jìn)化論

2023年,國(guó)內(nèi)大模型何其多。

目前,已宣布推出或即將推出大模型的國(guó)內(nèi)企業(yè)多達(dá)20余家,基本上能想到的相關(guān)企業(yè)都已入局。其中,既有資金雄厚的BAT、華為、字節(jié)等大廠,也有王慧文、王小川、周伯文等互聯(lián)網(wǎng)大佬領(lǐng)銜的初創(chuàng)企業(yè),還有垂直領(lǐng)域的AI企業(yè),比如商湯科技、科大訊飛等。

4月10日,商湯推出“日日新SenseNova”大模型體系,包括一系列生成式AI模型:大語(yǔ)言模型“商量”、文生圖AI平臺(tái)“秒畫(huà)”、AI數(shù)字人視頻生成平臺(tái)“如影”、3D內(nèi)容生產(chǎn)平臺(tái)“瓊宇”、“格物”,以及大模型數(shù)據(jù)標(biāo)注平臺(tái)“明眸”。

在大模型的輿論場(chǎng)上,商湯并不高調(diào),而是直接搬出全套大模型產(chǎn)品,并迅速開(kāi)放面向企業(yè)的試用通道。從發(fā)布會(huì)現(xiàn)場(chǎng)實(shí)時(shí)演示的效果看,商湯大模型的實(shí)力不容小覷。“一個(gè)專注CV的公司能在LLM上做出如此高成熟度產(chǎn)品,其開(kāi)發(fā)團(tuán)隊(duì)令人起敬。”一名知乎網(wǎng)友的觀點(diǎn)代表了一部分外界聲音。

同時(shí),一些質(zhì)疑的聲音也出現(xiàn)了,比如有觀點(diǎn)認(rèn)為專注機(jī)器視覺(jué)賽道(CV)的獨(dú)角獸AI企業(yè)到底有沒(méi)有必要湊熱鬧搞大模型。畢竟大模型需要長(zhǎng)期巨量燒錢(qián),目前商業(yè)化模式有限,這會(huì)讓尚未盈利的AI企業(yè)面臨更大的虧損壓力。

那么,如何看待商湯進(jìn)軍多模態(tài)大模型領(lǐng)域的布局?在日益擁擠的“中國(guó)版ChatGPT”競(jìng)爭(zhēng)中,商湯又將走出怎樣與眾不同的生態(tài)位呢?

1 從大裝置到大模型,始終指向同一目標(biāo)

當(dāng)ChatGPT推動(dòng)AI行業(yè)走過(guò)“iPhone時(shí)刻”,大模型的通用性已經(jīng)得到了成功驗(yàn)證。

更重要的是,今年3月微軟發(fā)布的一篇論文指出,“GPT-4已經(jīng)可以被視為通用人工智能的一個(gè)早期的版本。”這一觀點(diǎn)也得到了相當(dāng)多專業(yè)人士的認(rèn)可。深度學(xué)習(xí)之父Geoffrey Hinton為代表的一些頂級(jí)科學(xué)家認(rèn)為,通用人工智能(AGI)不再遙不可及,而有可能在數(shù)十年內(nèi)逐步實(shí)現(xiàn)。

接下來(lái),在大模型這一確定性的方向上,中外AI企業(yè)如何摸索出適合自己的道路,成為關(guān)鍵命題。

商湯對(duì)這個(gè)問(wèn)題的答案是:堅(jiān)定地走“大裝置+大模型”的道路。

了解商湯戰(zhàn)略的朋友會(huì)知道,商湯此時(shí)推出大模型并不是跟風(fēng),而是自身在持續(xù)解決AI規(guī)模化落地道路上的又一個(gè)關(guān)鍵節(jié)點(diǎn)。

此前,AI落地難的核心原因是一個(gè)場(chǎng)景一個(gè)模型的開(kāi)發(fā)模式,導(dǎo)致落地成本高,模型復(fù)用率低,難以規(guī);瘶(biāo)準(zhǔn)化。彼時(shí),2020年問(wèn)世的千億參數(shù)的GPT3已經(jīng)為大模型的通用性帶來(lái)一定突破。商湯的解法同理,向下層基礎(chǔ)設(shè)施扎根,希望用龐大的參數(shù)量×數(shù)據(jù)量跑出通用性。

2021年,商湯推出AI大裝置SenseCore,并在2022年完成重要擴(kuò)建。AI大裝置可以理解為大算力基礎(chǔ)設(shè)施+大模型即服務(wù)(Model as a Service)。

目前AI大裝置構(gòu)建了27000塊GPU構(gòu)成的并行計(jì)算系統(tǒng),實(shí)現(xiàn)了5.0exaFLOPS的算力輸出,是亞洲目前最大的智能計(jì)算平臺(tái)之一。商湯AI大裝置上的算力可以同步支持20個(gè)千億規(guī)模參數(shù)量的超大模型,并且以千卡規(guī)模來(lái)同時(shí)訓(xùn)練。

同時(shí),AI大裝置還對(duì)外提供大模型即服務(wù),包括自動(dòng)化數(shù)據(jù)標(biāo)注、大模型并行訓(xùn)練、推理部署等等。目前AI大裝置最大的集群由4000塊芯片并聯(lián)組成,可以訓(xùn)練參數(shù)量超5000億的稠密模型,今年的目標(biāo)是能夠訓(xùn)練超過(guò)萬(wàn)億參數(shù)的大模型。

投入這么大,AI大裝置的應(yīng)用情況如何呢?

2022年,商湯將AI大裝置的能力向行業(yè)客戶開(kāi)放,通過(guò)提供高性能計(jì)算資源、豐富的預(yù)訓(xùn)練模型庫(kù)、易用的開(kāi)發(fā)工具和專業(yè)技術(shù)支持,幫助客戶高效訓(xùn)練大模型。目前已經(jīng)有超過(guò)10個(gè)大模型研發(fā)任務(wù)得以實(shí)現(xiàn),涵蓋了視覺(jué)、語(yǔ)言、多模態(tài)等領(lǐng)域的用戶自定義大模型開(kāi)發(fā)。

面向企業(yè)開(kāi)放后,AI大裝置已經(jīng)有了規(guī)模化的營(yíng)收。根據(jù)商湯2022年年報(bào),2022年AI大裝置對(duì)外服務(wù)產(chǎn)生的收入占比智慧商業(yè)(商湯四大業(yè)務(wù)板塊之一)整體收入超20%。按照2022年智慧商業(yè)收入14.64億元計(jì)算,AI大裝置已經(jīng)為商湯帶來(lái)近3億元營(yíng)收。

看到這里你也許有些明白了,商湯并不是從零開(kāi)始構(gòu)建大模型的。之所以能在短期內(nèi)迅速推出多種類型的大模型,離不開(kāi)AI大裝置這個(gè)根基。而且實(shí)際上,商湯在大模型領(lǐng)域的布局要早于AI大裝置。

在最擅長(zhǎng)的CV領(lǐng)域,2019年商湯就發(fā)布了10億參數(shù)的視覺(jué)大模型。2022年,商湯的視覺(jué)大模型已經(jīng)進(jìn)化到了320億參數(shù),也是世界上迄今為止最大的視覺(jué)模型。

自2021年起,商湯科技開(kāi)始自研NLP大模型和多模態(tài)模型。在NLP領(lǐng)域,商湯的大語(yǔ)言模型達(dá)到了千億參數(shù)級(jí)別。

在多模態(tài)領(lǐng)域, 2022年3月,商湯科技聯(lián)合上海人工智能實(shí)驗(yàn)室、清華大學(xué)、香港中文大學(xué)、上海交通大學(xué)發(fā)布了多模態(tài)多任務(wù)通用大模型“書(shū)生(INTERN)”,擁有30億參數(shù)。書(shū)生大模型已經(jīng)在通用視覺(jué)開(kāi)源平臺(tái)OpenGVLab開(kāi)源,是目前開(kāi)源模型社區(qū)性能最強(qiáng)的多模態(tài)大模型。

在AIGC領(lǐng)域,商湯推出10億參數(shù)的AIGC模型,能夠支持文生圖和圖生圖的各種功能。曾在星際爭(zhēng)霸的比賽中超越DeepMind的AlphaStar的商湯決策智能模型,未來(lái)也將融入到多模態(tài)大模型中。

“未來(lái)商湯的通用人工智能大模型體系會(huì)覆蓋視覺(jué)感知、語(yǔ)言理解、內(nèi)容生成和推理決策四大方面。”商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛表示。

目前,商湯的大模型已在在智慧城市、智慧商業(yè)、智能汽車(chē)和智慧生活四大板塊20多個(gè)場(chǎng)景實(shí)現(xiàn)了落地交付。比如,在自動(dòng)駕駛領(lǐng)域,商湯在視覺(jué)大模型領(lǐng)域研發(fā)的BEVFormer++感知算法以絕對(duì)優(yōu)勢(shì)贏得了2022年Waymo挑戰(zhàn)賽主賽道冠軍。

綜上,商湯做大模型的目標(biāo)不是去搶奪面向個(gè)人用戶的“中國(guó)版ChatGPT”的噱頭,而是用“大裝置+大模型”加速AI商業(yè)化落地。

2 “日日新”的雙重驅(qū)動(dòng)力

“AGI催生了新的研究范式,即基于一個(gè)強(qiáng)大的多模態(tài)基模型,通過(guò)強(qiáng)化學(xué)習(xí)和人類反饋不斷解鎖基模型新的能力,從而更高效地解決海量的開(kāi)放式任務(wù)。AGI將實(shí)現(xiàn)從‘數(shù)據(jù)飛輪’到‘智慧飛輪’的演進(jìn),最終邁向人機(jī)共智。”商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛表示。

具體到商湯“日日新”大模型,「智能進(jìn)化論」認(rèn)為,其對(duì)于商湯而言至少有兩大方面的驅(qū)動(dòng)力:

第一重驅(qū)動(dòng),通過(guò)豐富的AIGC大模型向外賦能,包括通過(guò)開(kāi)放API的形式,降低各行各業(yè)應(yīng)用大模型的門(mén)檻;

目前商湯“日日新”系列大模型僅面向企業(yè)用戶開(kāi)放試用。不過(guò),從發(fā)布會(huì)實(shí)時(shí)演示來(lái)看,“日日新”大模型給人的初步印象是:整體能力全面,相當(dāng)于沒(méi)有“掛科”,而且在數(shù)字人視頻生成、3D內(nèi)容生成等方面令人驚艷,超出預(yù)期。

商湯版ChatGPT大語(yǔ)言模型“商量”,其多輪對(duì)話表現(xiàn)流暢,并有兩個(gè)細(xì)分領(lǐng)域的優(yōu)勢(shì):?jiǎn)栐\與編程。編程助手可幫助開(kāi)發(fā)者更高效地編寫(xiě)和調(diào)試代碼;在健康咨詢方面,“商量”相當(dāng)于一個(gè)AI版的全科醫(yī)院分診臺(tái),類似什么癥狀應(yīng)該看什么科室,可以為用戶提供個(gè)性化的醫(yī)療建議。此外,“商量”可以直接讀取PDF文件提取關(guān)鍵信息的功能也非常實(shí)用。

“秒畫(huà)SenseMirage”文生圖創(chuàng)作平臺(tái),可支持6K高清圖的生成,還支持用戶自定義訓(xùn)練生成模型。

“如影SenseAvatar”AI數(shù)字人視頻生成平臺(tái),僅需一段5分鐘的真人視頻素材,就可以生成出來(lái)聲音及動(dòng)作自然、口型準(zhǔn)確、多語(yǔ)種精通的數(shù)字人分身,這將極大降低電商直播、在線教育等高頻應(yīng)用場(chǎng)景的人力成本。

“瓊宇SenseSpace”和“格物SenseThings”3D內(nèi)容生成平臺(tái),可以高效低成本生成大規(guī)模三維場(chǎng)景和精細(xì)化的物件,能夠?yàn)樵钪娴忍搶?shí)結(jié)合場(chǎng)景提供高品質(zhì)低成本的構(gòu)建技術(shù)。

第二重驅(qū)動(dòng),強(qiáng)化商湯已有的在CV、視覺(jué)感知領(lǐng)域的優(yōu)勢(shì),加速AI技術(shù)落地。

在智能駕駛領(lǐng)域,基于視覺(jué)大模型,商湯開(kāi)發(fā)了用于自動(dòng)駕駛的BEV(Bird Eye View)感知算法,在Waymo挑戰(zhàn)賽上以絕對(duì)優(yōu)勢(shì)取得了冠軍;诖怂惴,商湯開(kāi)發(fā)了業(yè)界首個(gè)感知決策一體化的端到端自動(dòng)駕駛解決方案UniAD,可以為自動(dòng)駕駛多模態(tài)模型帶來(lái)更強(qiáng)的環(huán)境、行為、動(dòng)機(jī)解碼能力。

據(jù)悉,“日日新SenseNova”為政企客戶提供了多種靈活的API接口和服務(wù),包括圖片生成,自然語(yǔ)言生成,視覺(jué)感知通用任務(wù)與標(biāo)注服務(wù)。通過(guò)調(diào)用API接口,企業(yè)用戶可以根據(jù)基模型進(jìn)行微調(diào),低門(mén)檻、低成本、高效率地實(shí)現(xiàn)各類AI應(yīng)用。

 

3 從單點(diǎn)到平臺(tái),轉(zhuǎn)型加速時(shí)

值得注意的是,在堅(jiān)定投身“大裝置+大模型”路線之時(shí),商湯自身也處在業(yè)務(wù)結(jié)構(gòu)轉(zhuǎn)型的關(guān)鍵時(shí)期。

目前,商湯的業(yè)務(wù)邊界早已不局限于CV領(lǐng)域,而是正在成為一家通用AI基礎(chǔ)平臺(tái)公司。而且在此過(guò)程中,“大裝置+大模型”沒(méi)有削弱CV領(lǐng)域原本的優(yōu)勢(shì),反而是增強(qiáng)了。

從商湯對(duì)AI大裝置的定位“AGI時(shí)代基礎(chǔ)設(shè)施的領(lǐng)導(dǎo)者”,可以看出,昔日CV四小龍之首的商湯已今非昔比。對(duì)于行業(yè)邊界的突破,此前商湯科技董事長(zhǎng)兼CEO 徐立曾經(jīng)這樣對(duì)媒體表示,“當(dāng)我們實(shí)現(xiàn)了從物理世界與數(shù)字世界的融合,AI就變成了基礎(chǔ)設(shè)施,人人都可以用,也就不用區(qū)分行業(yè)了。”

不過(guò),業(yè)務(wù)結(jié)構(gòu)的變化是轉(zhuǎn)型更有力的證明。透過(guò)2022年年報(bào),商湯的四大核心業(yè)務(wù)呈現(xiàn)“兩升兩降”的明顯改變。其中,智慧城市、智慧商業(yè)兩大板塊業(yè)務(wù)收入下滑,智慧生活、智慧汽車(chē)兩大新興業(yè)務(wù)大幅增長(zhǎng),顯示出業(yè)務(wù)結(jié)構(gòu)更加多元健康發(fā)展的態(tài)勢(shì)。

比如,2022年智慧生活業(yè)務(wù)收入同比增長(zhǎng)129.9%,創(chuàng)歷史新高,占總收入比重從2021年的8.8%提升至25.1%。智慧生活業(yè)務(wù)涵蓋了AI內(nèi)容生成(AIGC)、AI傳感器、AI ISP芯片、智慧醫(yī)療等多個(gè)產(chǎn)品線,均實(shí)現(xiàn)了商業(yè)化突破。2022年智能汽車(chē)業(yè)務(wù)收入同比增長(zhǎng)58.9%,占總收入比重從2021年的3.9%上升至7.7%。

“日日新來(lái)自《禮記·大學(xué)》,湯之盤(pán)銘曰‘茍日新、日日新、又日新’。也就是每天都要新,而且新的要更新。這代表人工智能大模型,在以周為單位的數(shù)據(jù)輸入上,可以日日更新,能力日日增強(qiáng)。”徐立在發(fā)布會(huì)上這樣解釋日日新的來(lái)歷。

2023年是國(guó)內(nèi)AI大模型的爆發(fā)元年,站在當(dāng)下的時(shí)間節(jié)點(diǎn),我們可能很難預(yù)測(cè)未來(lái)AI大模型領(lǐng)域的市場(chǎng)格局是寡頭壟斷還是百花齊放。

因?yàn)椋@是一場(chǎng)長(zhǎng)期的、全方位的比拼,考驗(yàn)著每一位入局者的資金儲(chǔ)備、戰(zhàn)略意志、技術(shù)能力等核心實(shí)力。

也許,每一位玩家無(wú)需也不可能做到大而全,集中資源聚焦最有差異化優(yōu)勢(shì)的大模型,才是突圍之道。

 文中圖片來(lái)自攝圖網(wǎng)

END

本文為「智能進(jìn)化論」原創(chuàng)作品,

歡迎關(guān)注。

       原文標(biāo)題 : AI大模型內(nèi)卷加劇,商湯憑什么卷進(jìn)來(lái)

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)