訂閱
糾錯
加入自媒體

大模型2.0時代的優(yōu)化與突破

作者

車行運

大模型可以讓無人駕駛更智能

今年6月份,各大廠商紛紛升級自家的類ChatGPT產(chǎn)品。6月9日,訊飛推出星火認知大模型升級版;6月13日,360在發(fā)布類ChatGPT產(chǎn)品之后,再次舉行360智腦大模型應用發(fā)布會。

與2月左右發(fā)布的大模型不同,近期各家公司發(fā)布的升級版產(chǎn)品,更偏向應用層目的是更容易走向千家萬戶。

從目前發(fā)布的情況來看,360智腦已初步具備跨模態(tài)?成能?,除了可以完成文字生成文字、表格、圖片;圖片生成文字、圖片,以及視頻生成文本,文本剪視頻等基礎(chǔ)創(chuàng)作之外,還重新定義“數(shù)字人”,給用戶一種“有靈魂、有?設(shè)、有記憶”可定制的專屬“人工智能”。            

目前360智腦與用戶距離最近的應用場景,是360現(xiàn)有的全家桶,周鴻祎在發(fā)布會表示,“360智腦4.0”會接入360安全衛(wèi)?、360瀏覽器、360搜索等,試圖重塑人機協(xié)作。

在發(fā)布會上,周鴻祎更改了此前觀點,“我曾經(jīng)說過,國產(chǎn)大模型與ChatGPT之間的差距是兩年,現(xiàn)在我想收回這句話。”隨后補充最新觀點,認為目前國產(chǎn)大模型的水平與GPT3.5大打平,照此速度發(fā)展,追趕甚至超過GPT4將在轉(zhuǎn)瞬之間。

從發(fā)布初始版本至正式發(fā)布360智腦的四個月內(nèi),周鴻祎看到了會有如此巨大的轉(zhuǎn)變?

科技大廠圍獵大模型

在2023中關(guān)村論壇上發(fā)布的《中國人工智能大模型地圖研究報告》顯示,當前,中國人工智能大模型正呈現(xiàn)蓬勃發(fā)展態(tài)勢。據(jù)不完全統(tǒng)計,截至目前,參數(shù)在10億規(guī)模以上的大模型全國已發(fā)布了79個。

而科技大廠的大模型參數(shù)量較大:阿里通義千問大模型參數(shù)在10萬億級以上、騰訊混元大模型華為盤古大模型參數(shù)量均在萬億級以上、百度文心一言大模型參數(shù)量在2千億級以上、京東言犀大模型的參數(shù)量為千億級;垂直行業(yè)科技企業(yè)已經(jīng)上線的參數(shù)量普遍在千億級以上;而科研院校大模型的參數(shù)量在千億級及以下。

從大模型的布局體系來看,科技大廠在算力層、平臺層、模型層、應用層進行了四位一體的全面布局。百度、阿里、華為三家均從芯片到應用進行自主研發(fā)的全面布局,如百度的“昆侖芯+飛槳平臺+文心大模型+行業(yè)應用”、阿里的“含光800芯片+M6-OFA底座+通義大模型+行業(yè)應用”、華為的“昇騰芯片+MindSpore框架+盤古大模型+行業(yè)應用”。

此外金山辦公5月31日還發(fā)布了WPS AI,目前,WPSAI已接入金山辦公旗下辦公組件輕文檔、文字、表格、演示、PDF,未來將錨定AIGC、閱讀理解和問答、人機交互三個戰(zhàn)略方向發(fā)展,并接入金山辦公全線產(chǎn)品。

各家大廠迅速涌入這個賽道,主要是因為監(jiān)管層迅速跟進出臺措施規(guī)范行業(yè)發(fā)展,有頂層架構(gòu)保駕護航,各家大廠自然可以放心投入研發(fā),并推出產(chǎn)品。

自今年3月大模型批量上線以來,AI監(jiān)管政策逐漸明晰,這也給行業(yè)應用指明了方向。

回顧整個行業(yè)發(fā)展歷程,4月11日,《生成式人工智能服務(wù)管理方法》征求意見稿發(fā)布;5 月 30 日,信通院正在聯(lián)合編制“紙鳶”開放人工智能模型許可證,下一步將發(fā)布《紙鳶開放人工智能模型許可證(征求意見稿)》。

隨后,一線城市配合發(fā)布了《北京市加快建設(shè)具有全球影響力的人工智能創(chuàng)新策源地實施方案(2023-2025 年)》;《深圳市加快推動人工智能高質(zhì)量發(fā)展高水平應用行動方案(2023-2024 年)》。

在此背景下,周鴻祎認為國產(chǎn)大模型將會迅速縮小和ChatGPT的差距,似乎也好理解了。

360智腦有何不同

按照周鴻祎的規(guī)劃,360大模型將在持續(xù)升級大模型的基礎(chǔ)上,兼顧場景化、產(chǎn)品化、平?化、垂直化。

這種發(fā)展戰(zhàn)略下,360智腦可以實現(xiàn)對消費者(?戶個?AI助理)、中?微企業(yè)(SaaS化垂直應?)、企業(yè)/政府/城市(私有化部署?模型)、?業(yè)(?業(yè)垂直?模型)等四個主要應用場景的覆蓋。

上述四種不同場景的應用,主要通過其他公司在360大模型API基礎(chǔ)上,結(jié)合不同行業(yè)需求推出特定產(chǎn)品,F(xiàn)階段,很多部門、企業(yè)內(nèi)部擁有大量獨占性IP,如果將其統(tǒng)統(tǒng)放到一個公開大模型中,就會重現(xiàn)三星因GPT泄露芯片機密的事件,這就凸顯了專有類GPT產(chǎn)品的重要性。

想要更好滿足上述不同場景的需求,通用大模型需要在現(xiàn)有基礎(chǔ)上,完成從輸入文字輸出文字,到看懂圖像、視頻,并能產(chǎn)出圖像、視頻的轉(zhuǎn)變,相當于讓大模型具備了“耳朵”和“眼睛”,為創(chuàng)建“數(shù)字人”打下基礎(chǔ)。

傳統(tǒng)數(shù)字人只需要按照既定腳本輸出,但在大模型時代,360的數(shù)字人可定制,因此?設(shè)、有記憶、有經(jīng)歷,目前在360數(shù)字??場平臺中,已經(jīng)有200多個??,分為數(shù)字名?和數(shù)字員?兩個種類。360希望未來可以讓每個?都有自己的AI助理,并有機會在虛擬空間內(nèi),跨越時空,和古人交流。

在演示會上,周鴻祎問“諸葛亮”怎么看今天成為鬼畜素材,數(shù)字人以諸葛亮的口吻回復:夫古今之命,乃實事所必然也。今之時勢,天下紛擾不已。吾雖已老,仍志在天下。今者年輕人以吾為鬼畜素材,吾欣然接受此變化。并祝愿年輕朋友在未來的道路上勇往直前,開創(chuàng)更加美好的未來。

同時周鴻祎還強調(diào),未來數(shù)字人的形態(tài)還會有??的?標、規(guī)劃和分解的能?,從而可以調(diào)?各種垂直的模型完成任務(wù)。

不過這些功能其實都是在現(xiàn)有大模型應用基礎(chǔ)上的優(yōu)化,并沒有開辟一個全新的領(lǐng)域。但實際上,當大模型取得突破后,最具創(chuàng)造性的應用場景是無人駕駛。

無人駕駛有機會駛?cè)肟燔嚨?/strong>

回顧無人駕駛領(lǐng)域,自從2016年開始,各大廠商都在布局這個領(lǐng)域,但是直到今年也沒有一家可以實現(xiàn)真正的無人駕駛。

目前一輛L2+級別的無人駕駛系統(tǒng)需要10+顆攝像頭;1-2顆激光雷達;或3-5顆毫米波雷達提供的多維度數(shù)據(jù),人工標注數(shù)據(jù)之后才能用于模型的訓練。在可識別影像的大模型出現(xiàn)之后,人工標注所需要的時間成本和物質(zhì)支出將會驟然下降。

據(jù)2023年4月毫末智行DriveGPT發(fā)布會顯示,目前要得到對諸如車道線、交通參與者、紅綠燈等信息,行業(yè)人工標注的成本約每張圖為5元,毫末DriveGPT的成本為0.5元。我們認為科技公司大模型訓練成熟后,單張圖自動標注的邊際成本趨近于0,平均成本有望進一步下降。

據(jù)愷望數(shù)據(jù)產(chǎn)品項目副總裁張鵬在2023年2月的介紹,目前數(shù)據(jù)標注以人工標注為主,機器標注為輔,95%的數(shù)據(jù)標注還是以人工為主。大模型的介入,可以極大地提升這個行業(yè)的效率。以特斯拉為例,2021年人工標注團隊為1000多人,2022年該團隊裁員200余人。

除此之外,大模型時代,第三方科技巨頭有望通過提供完善的工具鏈,幫助整車廠構(gòu)建自己的自動駕駛算法和數(shù)據(jù)閉環(huán)系統(tǒng),同時依靠大模型的數(shù)據(jù)生成能力縮小在數(shù)據(jù)領(lǐng)域的差距,自動駕駛的安卓時代有望來臨。

目前,大模型已經(jīng)被用于賦能數(shù)據(jù)閉環(huán)、仿真、感知算法、規(guī)控算法等領(lǐng)域。而巨頭如微軟、英偉達在大模型和自動駕駛爭相布局,或?qū)⒉脸鲂碌幕鸹ā?/p>

此外大模型的出現(xiàn)也促進行業(yè)分工,避免“重復造輪子”,同時加速傳感器和芯片迭代,系統(tǒng)成本有望大幅下降。大模型開發(fā)者和自動駕駛產(chǎn)業(yè)鏈玩家有望全面受益。

百度Apollo為例,其首先利用圖文信息預訓練一個原始模型,利用算法將街景圖像數(shù)據(jù)進行物體識別并定位和分割,放入編碼器形成底庫,即基于街景建立一個圖片和文字信息對應的數(shù)據(jù)池。

其次可以通過文本、圖像等形式對特定的場景(如快遞車、輪椅、小孩等)進行搜索和挖掘,對車端模型進行定制化的訓練,大幅提升存量數(shù)據(jù)的利用效果。

百度用半監(jiān)督方法,充分利用2D和3D數(shù)據(jù)訓練一個感知大模型。通過在多個環(huán)節(jié)對小模型進行蒸餾,提升小模型的性能,同時通過自動標注給小模型定制化的訓練,用來增強遠距離視覺3D感知能力、提升多模態(tài)感知模型的感知效果。

另一家頭部玩家商湯科技也曾公開表示,可以用AIGC生成真實的交通場景以及困難樣本來訓練自動駕駛系統(tǒng),以多模態(tài)數(shù)據(jù)作為大模型的輸入,提升系統(tǒng)對Cornercase場景的感知能力上限。

同時自動駕駛多模態(tài)大模型可做到感知決策一體化集成,在輸出端通過環(huán)境解碼器可對3D環(huán)境進行重建,實現(xiàn)環(huán)境可視化理解;行為解碼器可生成完整的路徑規(guī)劃;動機解碼器可用自然語言對推理過程進行描述,使自動駕駛系統(tǒng)變得更加安全可靠。

大模型實現(xiàn)上述功能后,未來無人駕駛門檻會越來越低,頭部廠商加速無人駕駛項目進程的同時,還可以讓更多新玩家加入這個領(lǐng)域,并開拓除道路導航外,需要道路規(guī)劃功能的賽道,比如進一步優(yōu)化掃地機器人的路徑規(guī)劃。

現(xiàn)在看,在經(jīng)歷二月至三月的大模型集中發(fā)布期、四月至五月的產(chǎn)品研發(fā)期和政策方向逐步明確后,六月已經(jīng)進入AI大模型產(chǎn)品和應用有望迎來集中發(fā)布期,這也直接導致OpenAIAPI降價。

在可預期的未來,AI技術(shù)仍然在持續(xù)迭代,應用也在持續(xù)推進,同時越來越多科技大廠推出產(chǎn)品切入這個賽道,還將繼續(xù)助推行業(yè)景氣度上升,并給用戶帶來更貼合市場需求的類GPT產(chǎn)品,比如擁有龐大用戶群的騰訊6月19日也發(fā)布了大模型領(lǐng)域的技術(shù)方案。

當這些從業(yè)企業(yè)一起卷的時候,行業(yè)發(fā)展進入快車道的同時,也意味著C端用戶將會很快就能用上這個產(chǎn)品,至于會為誰付款,就需要各家廠商自憑本事了。

         

© THE END

本文僅作為分享學習使用,不構(gòu)成任何投資建議。

本文由貝克街探案官原創(chuàng),未經(jīng)許可,請勿轉(zhuǎn)載。

       原文標題 : 大模型2.0時代的優(yōu)化與突破

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號