訂閱
糾錯(cuò)
加入自媒體

什么是大模型?未來淘汰你的不是AI,而是掌握了AI的人

昨天和朋友吃飯,聊到個(gè)話題,他現(xiàn)在用豆包、Kimi這些智能助手,總感覺回答的不是自己想要的內(nèi)容。我就從什么是AI,什么是大模型聊起,科普了下這方面的知識(shí)。發(fā)現(xiàn)對(duì)于大眾來說,這些艱澀的技術(shù),確實(shí)挺難理解。今天就來簡(jiǎn)單概括下,讓大家腦子有個(gè)概念到底什么是大模型?

解釋什么是大模型之前,先說說AI的類別、機(jī)器學(xué)習(xí)和深度學(xué)習(xí),便于更清楚大模型的來龍去脈。

01AI的類別

人工智能是一個(gè)非常龐大的科學(xué)領(lǐng)域。

從1950年代正式誕生以來,圍繞人工智能,已經(jīng)有很多科學(xué)家進(jìn)行了大量的研究,也輸出了很多非常了不起的成果。

這些研究,根據(jù)思路方向的不同,被分為了很多種學(xué)派。比較有代表性的,是符號(hào)主義學(xué)派、聯(lián)結(jié)主義學(xué)派、行為主義學(xué)派。這些學(xué)派并沒有對(duì)錯(cuò)之分,相互之間也有一些交叉融合。

早期的時(shí)候(1960-1990),符號(hào)主義(以專家系統(tǒng)、知識(shí)圖譜為代表)是主流。后來,從1980年開始,聯(lián)結(jié)主義(以神經(jīng)網(wǎng)絡(luò)為代表)崛起,一直到現(xiàn)在,都是主流。

將來,也許有新的技術(shù)崛起,形成新的學(xué)派,也不一定。

除了方向路線之外,我們也可以從智能水平以及應(yīng)用領(lǐng)域等方面對(duì)AI進(jìn)行分類。

按智能水平,可以分為:弱人工智能(Weak AI)、強(qiáng)人工智能(Strong AI)、超人工智能(Super AI)。

弱人工智能只專精于單一任務(wù)或一組相關(guān)的任務(wù),不具備通用智能能力。我們目前就處于這個(gè)階段。

強(qiáng)人工智能更厲害一些,具有一定的通用智能能力,能夠理解、學(xué)習(xí)并應(yīng)用于各種不同的任務(wù)。這個(gè)還處于理論和研究階段,還沒落地。

超人工智能當(dāng)然是最強(qiáng)的。它在幾乎所有方面都超過人類智能,包括創(chuàng)造力、社交技能等。超人工智能是未來的終極形態(tài),我們假設(shè)它能夠?qū)崿F(xiàn)。

02機(jī)器學(xué)習(xí)&深度學(xué)習(xí)

什么是機(jī)器學(xué)習(xí)?

機(jī)器學(xué)習(xí)的核心思想,是構(gòu)建一個(gè)可以從數(shù)據(jù)中學(xué)習(xí)的模型,并利用這個(gè)模型來進(jìn)行預(yù)測(cè)或決策。機(jī)器學(xué)習(xí)不是一個(gè)具體的模型或算法。

它包括了很多種類型,例如:

監(jiān)督學(xué)習(xí):算法從帶有標(biāo)簽的數(shù)據(jù)集中學(xué)習(xí),即每個(gè)訓(xùn)練樣本都有一個(gè)已知的結(jié)果。

無監(jiān)督學(xué)習(xí):算法從沒有標(biāo)簽的數(shù)據(jù)集中學(xué)習(xí)。

半監(jiān)督學(xué)習(xí):結(jié)合了少量的帶標(biāo)簽數(shù)據(jù)和大量的未帶標(biāo)簽數(shù)據(jù)進(jìn)行訓(xùn)練。

強(qiáng)化學(xué)習(xí):通過試錯(cuò)的方式,學(xué)習(xí)哪些行為可以獲得獎(jiǎng)勵(lì),哪些行為會(huì)導(dǎo)致懲罰。

什么是深度學(xué)習(xí)?

深度學(xué)習(xí),具體來說,是深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)重要分支。機(jī)器學(xué)習(xí)底下有一條“神經(jīng)網(wǎng)絡(luò)”路線,而深度學(xué)習(xí),是加強(qiáng)版的“神經(jīng)網(wǎng)絡(luò)”學(xué)習(xí)。

神經(jīng)網(wǎng)絡(luò)是聯(lián)結(jié)主義的代表。顧名思義,這個(gè)路線是模仿人腦的工作原理,建立神經(jīng)元之間的聯(lián)結(jié)模型,以此實(shí)現(xiàn)人工神經(jīng)運(yùn)算。

深度學(xué)習(xí)所謂的“深度”,是神經(jīng)網(wǎng)絡(luò)中“隱藏層”的層級(jí)。

經(jīng)典機(jī)器學(xué)習(xí)算法使用的神經(jīng)網(wǎng)絡(luò),具有輸入層、一個(gè)或兩個(gè)“隱藏層”和一個(gè)輸出層。

深度學(xué)習(xí)算法使用了更多的“隱藏層”(數(shù)百個(gè))。它的能力更加強(qiáng)大,讓神經(jīng)網(wǎng)絡(luò)能夠完成更困難的工作。

機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的關(guān)系,通過下面的圖可以看出:

神經(jīng)網(wǎng)絡(luò)從1980年代開始崛起之后,就形成了很多的模型和算法。不同的模型和算法,有著各自的特性和功能。

卷 積 神 經(jīng) 網(wǎng) 絡(luò) ( Convolutional Neural Network , CNN ) 和 循 環(huán) 神 經(jīng) 網(wǎng) 絡(luò) ( Recurrent Neural Network ,RNN),是1990年代左右誕生的比較知名的神經(jīng)網(wǎng)絡(luò)模型。它們的具體工作原理比較復(fù)雜。

反正大家記住:

卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種用于處理具有類似網(wǎng)格結(jié)構(gòu)的數(shù)據(jù)(例如圖像和視頻)的神經(jīng)網(wǎng)絡(luò)。所以,卷積神經(jīng)網(wǎng)絡(luò)通常用于計(jì)算機(jī)視覺中,可以用來圖像識(shí)別和圖像分類。

而循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是一種用于處理序列數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),例如語言模型和時(shí)間序列預(yù)測(cè)。所以,循環(huán)神經(jīng)網(wǎng)絡(luò)通常用于自然語言處理和語音識(shí)別。

transformer也是一個(gè)神經(jīng)網(wǎng)絡(luò)模型。它比卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)出現(xiàn)時(shí)間更晚,2017年由谷歌研究團(tuán)隊(duì)提出,也更加強(qiáng)大。

作為非專業(yè)人士,不需要去研究它的工作原理,只需要知道:

1、它是一種深度學(xué)習(xí)模型;2、它使用了一種名為自注意力(self-attention)的機(jī)制;3、它有效解決了卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)的瓶頸(局限性)問題;4、它很適合自然語言處理(NLP)任務(wù)。相比循環(huán)神經(jīng)網(wǎng)絡(luò),它的計(jì)算可以高度并行化,簡(jiǎn)化了模型架構(gòu),訓(xùn)練效率也大大提升;5、它也被擴(kuò)展到了其他領(lǐng)域,如計(jì)算機(jī)視覺和語音識(shí)別。

6、現(xiàn)在我們經(jīng)常提到的大模型,幾乎都是以transformer為基礎(chǔ)。

神經(jīng)網(wǎng)絡(luò)還有很多種,這里就看下圖,知道有很多就好。

03

什么是大模型?

這兩年說的火熱的人工智能,說的就是大模型。那么,什么是大模型?

大模型,是具有龐大參數(shù)規(guī)模和復(fù)雜計(jì)算結(jié)構(gòu)的機(jī)器學(xué)習(xí)模型。

參數(shù),是指在模型訓(xùn)練過程中,學(xué)習(xí)和調(diào)整的變量。參數(shù)定義了模型的行為、性能、實(shí)現(xiàn)的成本以及對(duì)計(jì)算資源的需求。簡(jiǎn)單來說,參數(shù)是模型內(nèi)部用來做出預(yù)測(cè)或決策的部分。

大模型,通常擁有數(shù)百萬至數(shù)十億的參數(shù)。相對(duì)應(yīng)的,參數(shù)少的,就是小模型。對(duì)一些細(xì)分的領(lǐng)域或場(chǎng)景,小模型也夠用。

大模型需要依賴大規(guī)模數(shù)據(jù)進(jìn)行訓(xùn)練,對(duì)算力資源的消耗極大。

(《從歷史規(guī)律,探尋AI大模型的發(fā)展周期和未來趨勢(shì)》這篇文章詳細(xì)講了算法、數(shù)據(jù)、算力的代表人物杰夫辛頓、李飛飛和黃仁勛,感興趣的可以看下。)

大模型有很多種類別。通常所說的大模型,主要是指語言大模型(以文本數(shù)據(jù)進(jìn)行訓(xùn)練)。但實(shí)際上,還有視覺大模型(以圖像數(shù)據(jù)進(jìn)行訓(xùn)練),以及多模態(tài)大模型(文本和圖像都有)。絕大多數(shù)大模型的基礎(chǔ)核心結(jié)構(gòu),都是Transformer及其變體。

按應(yīng)用領(lǐng)域,大模型可以分為通用大模型和行業(yè)大模型。

通用大模型的訓(xùn)練數(shù)據(jù)集更加廣泛,覆蓋的領(lǐng)域更加全面。行業(yè)大模型,顧名思義,訓(xùn)練數(shù)據(jù)來自特定行業(yè),應(yīng)用于專門的領(lǐng)域(例如金融、醫(yī)療、法律、工業(yè))。

GPT

GPT-1、GPT-2……GPT-4o,等等,都是美國(guó)OpenAI這家公司推出的語言大模型,同樣都是基于Transformer架構(gòu)。

GPT的全稱,叫做Generative Pretrained Transformer,生成式-預(yù)訓(xùn)練-Transformer。

Generative(生成式),表示該模型能夠生成連續(xù)的、有邏輯的文本內(nèi)容,比如完成對(duì)話、創(chuàng)作故事、編寫代碼或者寫詩(shī)寫歌等。

這里剛好提一下,現(xiàn)在常說的AIGC,就是AI Generated Content,人工智能生成內(nèi)容。內(nèi)容可以是文本、圖像、音頻、視頻等。

文生圖,比較有代表性的是DALL·E(也來自O(shè)penAI)、Midjourney(知名度大)和Stable Diffusion(開源)。

文生音頻(音樂),有Suno(OpenAI)、Stable Audio Open(由Stability.ai開源)、Audiobox(Meta)。

文生視頻,有Sora(OpenAI)、Stable Video Diffusion(由Stability.ai開源)、Soya(開源)。圖也可以生視頻,例如騰訊的Follow-Your-Click。

AIGC是一個(gè)“應(yīng)用維度”的定義,它不是一個(gè)具體的技術(shù)或模型。AIGC的出現(xiàn),擴(kuò)展了AI的功能,打破了此前AI主要用于識(shí)別的功能限制,拓寬了應(yīng)用場(chǎng)景。

好了,繼續(xù)解釋GPT的第二個(gè)字母——Pre.trained。

Pre.trained(預(yù)訓(xùn)練),表示該模型會(huì)先在一個(gè)大規(guī)模未標(biāo)注文本語料庫(kù)上進(jìn)行訓(xùn)練,學(xué)習(xí)語言的統(tǒng)計(jì)規(guī)律和潛在結(jié)構(gòu)。通過預(yù)訓(xùn)練,模型才有了一定的通用性。訓(xùn)練的數(shù)據(jù)越龐大(如網(wǎng)頁文本、新聞等),模型的能力就越強(qiáng)。

大家對(duì)于AI的關(guān)注熱潮,主要源于2023年初的ChatGPT爆火。

ChatGPT的chat是聊天的意思。ChatGPT是OpenAI基于GPT模型開發(fā)的一個(gè)AI對(duì)話應(yīng)用服務(wù)。

AI的作用,極為廣泛。

概括來說,AI和傳統(tǒng)計(jì)算機(jī)系統(tǒng)相比,能提供的拓展能力,包括:圖像識(shí)別、語音識(shí)別、自然語言處理、具身智能等方面。

圖像識(shí)別,有時(shí)候也被歸類為計(jì)算機(jī)視覺(Computer Vision,CV),讓計(jì)算機(jī)具備理解和處理圖像和視頻的能力。常見的是攝像頭、工業(yè)質(zhì)檢、人臉識(shí)別之類的。

語音識(shí)別,就是理解和處理音頻,獲得音頻所搭載的信息。常見的是手機(jī)語音助手、電話呼叫中心、聲控智能家居之類的,多用于交互場(chǎng)景。

自然語言處理,前面介紹過,就是使計(jì)算機(jī)能夠理解和處理自然語言,知道我們到底在說什么。這個(gè)很火,多用于創(chuàng)造性的工作,例如寫新聞稿、寫書面材料、視頻制作、游戲開發(fā)、音樂創(chuàng)作等。

具身智能,就是把人工智能搭載在一個(gè)物理形態(tài)(“身體”)上,通過與環(huán)境互動(dòng),來獲得和展示智能。帶AI的機(jī)器人,屬于具身智能。

斯坦福大學(xué)年初推出的“Mobile ALOHA”,就是一個(gè)典型的家用具身機(jī)器人。它可以炒菜、煮咖啡甚至逗貓,火爆全網(wǎng)。并不是所有的機(jī)器人,都是人形機(jī)器人。也不是所有的機(jī)器人,都用到了AI。

結(jié)語:

AI特別擅長(zhǎng)對(duì)海量數(shù)據(jù)進(jìn)行處理,一方面通過海量數(shù)據(jù)進(jìn)行學(xué)習(xí)和訓(xùn)練,另一方面,基于新的海量數(shù)據(jù),完成人工無法完成的工作;蛘哒f,找到海量數(shù)據(jù)中潛在的規(guī)律。

有句話說的好:“未來,淘汰你的不是AI,而是掌握了AI的人”。知道這些AI常識(shí),就是擁抱AI的第一步。至少和別人聊天的時(shí)候,談到AI,就不會(huì)一頭霧水了。

學(xué)會(huì)使用常見的AI工具和平臺(tái),幫助自己提升工作效率,改善生活品質(zhì)。就已經(jīng)領(lǐng)先了90%的人了。

       原文標(biāo)題 : 什么是大模型?未來淘汰你的不是AI,而是掌握了AI的人

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)