什么是大模型?未來淘汰你的不是AI,而是掌握了AI的人
昨天和朋友吃飯,聊到個(gè)話題,他現(xiàn)在用豆包、Kimi這些智能助手,總感覺回答的不是自己想要的內(nèi)容。我就從什么是AI,什么是大模型聊起,科普了下這方面的知識(shí)。發(fā)現(xiàn)對(duì)于大眾來說,這些艱澀的技術(shù),確實(shí)挺難理解。今天就來簡(jiǎn)單概括下,讓大家腦子有個(gè)概念到底什么是大模型?
解釋什么是大模型之前,先說說AI的類別、機(jī)器學(xué)習(xí)和深度學(xué)習(xí),便于更清楚大模型的來龍去脈。
01AI的類別
人工智能是一個(gè)非常龐大的科學(xué)領(lǐng)域。
從1950年代正式誕生以來,圍繞人工智能,已經(jīng)有很多科學(xué)家進(jìn)行了大量的研究,也輸出了很多非常了不起的成果。
這些研究,根據(jù)思路方向的不同,被分為了很多種學(xué)派。比較有代表性的,是符號(hào)主義學(xué)派、聯(lián)結(jié)主義學(xué)派、行為主義學(xué)派。這些學(xué)派并沒有對(duì)錯(cuò)之分,相互之間也有一些交叉融合。
早期的時(shí)候(1960-1990),符號(hào)主義(以專家系統(tǒng)、知識(shí)圖譜為代表)是主流。后來,從1980年開始,聯(lián)結(jié)主義(以神經(jīng)網(wǎng)絡(luò)為代表)崛起,一直到現(xiàn)在,都是主流。
將來,也許有新的技術(shù)崛起,形成新的學(xué)派,也不一定。
除了方向路線之外,我們也可以從智能水平以及應(yīng)用領(lǐng)域等方面對(duì)AI進(jìn)行分類。
按智能水平,可以分為:弱人工智能(Weak AI)、強(qiáng)人工智能(Strong AI)、超人工智能(Super AI)。
弱人工智能只專精于單一任務(wù)或一組相關(guān)的任務(wù),不具備通用智能能力。我們目前就處于這個(gè)階段。
強(qiáng)人工智能更厲害一些,具有一定的通用智能能力,能夠理解、學(xué)習(xí)并應(yīng)用于各種不同的任務(wù)。這個(gè)還處于理論和研究階段,還沒落地。
超人工智能當(dāng)然是最強(qiáng)的。它在幾乎所有方面都超過人類智能,包括創(chuàng)造力、社交技能等。超人工智能是未來的終極形態(tài),我們假設(shè)它能夠?qū)崿F(xiàn)。
02機(jī)器學(xué)習(xí)&深度學(xué)習(xí)
什么是機(jī)器學(xué)習(xí)?
機(jī)器學(xué)習(xí)的核心思想,是構(gòu)建一個(gè)可以從數(shù)據(jù)中學(xué)習(xí)的模型,并利用這個(gè)模型來進(jìn)行預(yù)測(cè)或決策。機(jī)器學(xué)習(xí)不是一個(gè)具體的模型或算法。
它包括了很多種類型,例如:
監(jiān)督學(xué)習(xí):算法從帶有標(biāo)簽的數(shù)據(jù)集中學(xué)習(xí),即每個(gè)訓(xùn)練樣本都有一個(gè)已知的結(jié)果。
無監(jiān)督學(xué)習(xí):算法從沒有標(biāo)簽的數(shù)據(jù)集中學(xué)習(xí)。
半監(jiān)督學(xué)習(xí):結(jié)合了少量的帶標(biāo)簽數(shù)據(jù)和大量的未帶標(biāo)簽數(shù)據(jù)進(jìn)行訓(xùn)練。
強(qiáng)化學(xué)習(xí):通過試錯(cuò)的方式,學(xué)習(xí)哪些行為可以獲得獎(jiǎng)勵(lì),哪些行為會(huì)導(dǎo)致懲罰。
什么是深度學(xué)習(xí)?
深度學(xué)習(xí),具體來說,是深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)重要分支。機(jī)器學(xué)習(xí)底下有一條“神經(jīng)網(wǎng)絡(luò)”路線,而深度學(xué)習(xí),是加強(qiáng)版的“神經(jīng)網(wǎng)絡(luò)”學(xué)習(xí)。
神經(jīng)網(wǎng)絡(luò)是聯(lián)結(jié)主義的代表。顧名思義,這個(gè)路線是模仿人腦的工作原理,建立神經(jīng)元之間的聯(lián)結(jié)模型,以此實(shí)現(xiàn)人工神經(jīng)運(yùn)算。
深度學(xué)習(xí)所謂的“深度”,是神經(jīng)網(wǎng)絡(luò)中“隱藏層”的層級(jí)。
經(jīng)典機(jī)器學(xué)習(xí)算法使用的神經(jīng)網(wǎng)絡(luò),具有輸入層、一個(gè)或兩個(gè)“隱藏層”和一個(gè)輸出層。
深度學(xué)習(xí)算法使用了更多的“隱藏層”(數(shù)百個(gè))。它的能力更加強(qiáng)大,讓神經(jīng)網(wǎng)絡(luò)能夠完成更困難的工作。
機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的關(guān)系,通過下面的圖可以看出:
神經(jīng)網(wǎng)絡(luò)從1980年代開始崛起之后,就形成了很多的模型和算法。不同的模型和算法,有著各自的特性和功能。
卷 積 神 經(jīng) 網(wǎng) 絡(luò) ( Convolutional Neural Network , CNN ) 和 循 環(huán) 神 經(jīng) 網(wǎng) 絡(luò) ( Recurrent Neural Network ,RNN),是1990年代左右誕生的比較知名的神經(jīng)網(wǎng)絡(luò)模型。它們的具體工作原理比較復(fù)雜。
反正大家記住:
卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種用于處理具有類似網(wǎng)格結(jié)構(gòu)的數(shù)據(jù)(例如圖像和視頻)的神經(jīng)網(wǎng)絡(luò)。所以,卷積神經(jīng)網(wǎng)絡(luò)通常用于計(jì)算機(jī)視覺中,可以用來圖像識(shí)別和圖像分類。
而循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是一種用于處理序列數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),例如語言模型和時(shí)間序列預(yù)測(cè)。所以,循環(huán)神經(jīng)網(wǎng)絡(luò)通常用于自然語言處理和語音識(shí)別。
transformer也是一個(gè)神經(jīng)網(wǎng)絡(luò)模型。它比卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)出現(xiàn)時(shí)間更晚,2017年由谷歌研究團(tuán)隊(duì)提出,也更加強(qiáng)大。
作為非專業(yè)人士,不需要去研究它的工作原理,只需要知道:
1、它是一種深度學(xué)習(xí)模型;2、它使用了一種名為自注意力(self-attention)的機(jī)制;3、它有效解決了卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)的瓶頸(局限性)問題;4、它很適合自然語言處理(NLP)任務(wù)。相比循環(huán)神經(jīng)網(wǎng)絡(luò),它的計(jì)算可以高度并行化,簡(jiǎn)化了模型架構(gòu),訓(xùn)練效率也大大提升;5、它也被擴(kuò)展到了其他領(lǐng)域,如計(jì)算機(jī)視覺和語音識(shí)別。
6、現(xiàn)在我們經(jīng)常提到的大模型,幾乎都是以transformer為基礎(chǔ)。
神經(jīng)網(wǎng)絡(luò)還有很多種,這里就看下圖,知道有很多就好。
03
什么是大模型?
這兩年說的火熱的人工智能,說的就是大模型。那么,什么是大模型?
大模型,是具有龐大參數(shù)規(guī)模和復(fù)雜計(jì)算結(jié)構(gòu)的機(jī)器學(xué)習(xí)模型。
參數(shù),是指在模型訓(xùn)練過程中,學(xué)習(xí)和調(diào)整的變量。參數(shù)定義了模型的行為、性能、實(shí)現(xiàn)的成本以及對(duì)計(jì)算資源的需求。簡(jiǎn)單來說,參數(shù)是模型內(nèi)部用來做出預(yù)測(cè)或決策的部分。
大模型,通常擁有數(shù)百萬至數(shù)十億的參數(shù)。相對(duì)應(yīng)的,參數(shù)少的,就是小模型。對(duì)一些細(xì)分的領(lǐng)域或場(chǎng)景,小模型也夠用。
大模型需要依賴大規(guī)模數(shù)據(jù)進(jìn)行訓(xùn)練,對(duì)算力資源的消耗極大。
(《從歷史規(guī)律,探尋AI大模型的發(fā)展周期和未來趨勢(shì)》這篇文章詳細(xì)講了算法、數(shù)據(jù)、算力的代表人物杰夫辛頓、李飛飛和黃仁勛,感興趣的可以看下。)
大模型有很多種類別。通常所說的大模型,主要是指語言大模型(以文本數(shù)據(jù)進(jìn)行訓(xùn)練)。但實(shí)際上,還有視覺大模型(以圖像數(shù)據(jù)進(jìn)行訓(xùn)練),以及多模態(tài)大模型(文本和圖像都有)。絕大多數(shù)大模型的基礎(chǔ)核心結(jié)構(gòu),都是Transformer及其變體。
按應(yīng)用領(lǐng)域,大模型可以分為通用大模型和行業(yè)大模型。
通用大模型的訓(xùn)練數(shù)據(jù)集更加廣泛,覆蓋的領(lǐng)域更加全面。行業(yè)大模型,顧名思義,訓(xùn)練數(shù)據(jù)來自特定行業(yè),應(yīng)用于專門的領(lǐng)域(例如金融、醫(yī)療、法律、工業(yè))。
GPT
GPT-1、GPT-2……GPT-4o,等等,都是美國(guó)OpenAI這家公司推出的語言大模型,同樣都是基于Transformer架構(gòu)。
GPT的全稱,叫做Generative Pretrained Transformer,生成式-預(yù)訓(xùn)練-Transformer。
Generative(生成式),表示該模型能夠生成連續(xù)的、有邏輯的文本內(nèi)容,比如完成對(duì)話、創(chuàng)作故事、編寫代碼或者寫詩(shī)寫歌等。
這里剛好提一下,現(xiàn)在常說的AIGC,就是AI Generated Content,人工智能生成內(nèi)容。內(nèi)容可以是文本、圖像、音頻、視頻等。
文生圖,比較有代表性的是DALL·E(也來自O(shè)penAI)、Midjourney(知名度大)和Stable Diffusion(開源)。
文生音頻(音樂),有Suno(OpenAI)、Stable Audio Open(由Stability.ai開源)、Audiobox(Meta)。
文生視頻,有Sora(OpenAI)、Stable Video Diffusion(由Stability.ai開源)、Soya(開源)。圖也可以生視頻,例如騰訊的Follow-Your-Click。
AIGC是一個(gè)“應(yīng)用維度”的定義,它不是一個(gè)具體的技術(shù)或模型。AIGC的出現(xiàn),擴(kuò)展了AI的功能,打破了此前AI主要用于識(shí)別的功能限制,拓寬了應(yīng)用場(chǎng)景。
好了,繼續(xù)解釋GPT的第二個(gè)字母——Pre.trained。
Pre.trained(預(yù)訓(xùn)練),表示該模型會(huì)先在一個(gè)大規(guī)模未標(biāo)注文本語料庫(kù)上進(jìn)行訓(xùn)練,學(xué)習(xí)語言的統(tǒng)計(jì)規(guī)律和潛在結(jié)構(gòu)。通過預(yù)訓(xùn)練,模型才有了一定的通用性。訓(xùn)練的數(shù)據(jù)越龐大(如網(wǎng)頁文本、新聞等),模型的能力就越強(qiáng)。
大家對(duì)于AI的關(guān)注熱潮,主要源于2023年初的ChatGPT爆火。
ChatGPT的chat是聊天的意思。ChatGPT是OpenAI基于GPT模型開發(fā)的一個(gè)AI對(duì)話應(yīng)用服務(wù)。
AI的作用,極為廣泛。
概括來說,AI和傳統(tǒng)計(jì)算機(jī)系統(tǒng)相比,能提供的拓展能力,包括:圖像識(shí)別、語音識(shí)別、自然語言處理、具身智能等方面。
圖像識(shí)別,有時(shí)候也被歸類為計(jì)算機(jī)視覺(Computer Vision,CV),讓計(jì)算機(jī)具備理解和處理圖像和視頻的能力。常見的是攝像頭、工業(yè)質(zhì)檢、人臉識(shí)別之類的。
語音識(shí)別,就是理解和處理音頻,獲得音頻所搭載的信息。常見的是手機(jī)語音助手、電話呼叫中心、聲控智能家居之類的,多用于交互場(chǎng)景。
自然語言處理,前面介紹過,就是使計(jì)算機(jī)能夠理解和處理自然語言,知道我們到底在說什么。這個(gè)很火,多用于創(chuàng)造性的工作,例如寫新聞稿、寫書面材料、視頻制作、游戲開發(fā)、音樂創(chuàng)作等。
具身智能,就是把人工智能搭載在一個(gè)物理形態(tài)(“身體”)上,通過與環(huán)境互動(dòng),來獲得和展示智能。帶AI的機(jī)器人,屬于具身智能。
斯坦福大學(xué)年初推出的“Mobile ALOHA”,就是一個(gè)典型的家用具身機(jī)器人。它可以炒菜、煮咖啡甚至逗貓,火爆全網(wǎng)。并不是所有的機(jī)器人,都是人形機(jī)器人。也不是所有的機(jī)器人,都用到了AI。
結(jié)語:
AI特別擅長(zhǎng)對(duì)海量數(shù)據(jù)進(jìn)行處理,一方面通過海量數(shù)據(jù)進(jìn)行學(xué)習(xí)和訓(xùn)練,另一方面,基于新的海量數(shù)據(jù),完成人工無法完成的工作;蛘哒f,找到海量數(shù)據(jù)中潛在的規(guī)律。
有句話說的好:“未來,淘汰你的不是AI,而是掌握了AI的人”。知道這些AI常識(shí),就是擁抱AI的第一步。至少和別人聊天的時(shí)候,談到AI,就不會(huì)一頭霧水了。
學(xué)會(huì)使用常見的AI工具和平臺(tái),幫助自己提升工作效率,改善生活品質(zhì)。就已經(jīng)領(lǐng)先了90%的人了。
原文標(biāo)題 : 什么是大模型?未來淘汰你的不是AI,而是掌握了AI的人

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?