機(jī)器學(xué)習(xí):開啟智能創(chuàng)新之門
三、機(jī)器學(xué)習(xí):實(shí)現(xiàn)人工智能的高效方法
從廣義上來說,機(jī)器學(xué)習(xí)是一種能夠賦予機(jī)器學(xué)習(xí)的能力以此讓它完成直接編程無法完成的功能的方法。但從實(shí)踐的意義上來說,機(jī)器學(xué)習(xí)是一種通過利用數(shù)據(jù),訓(xùn)練出模型,然后使用模型預(yù)測的一種方法。國外有些學(xué)者對機(jī)器學(xué)習(xí)進(jìn)行了定義大同小異,有學(xué)者認(rèn)為,機(jī)器學(xué)習(xí)是對能通過經(jīng)驗(yàn)自動改進(jìn)的計(jì)算機(jī)算法的研究;也有學(xué)者認(rèn)為,機(jī)器學(xué)習(xí)是指利用數(shù)據(jù)或以往的經(jīng)驗(yàn),以此優(yōu)化計(jì)算機(jī)程序的性能標(biāo)準(zhǔn)。由此可知,機(jī)器學(xué)習(xí)是通過經(jīng)驗(yàn)或數(shù)據(jù)來改進(jìn)算法的研究,通過算法讓機(jī)器從大量歷史數(shù)據(jù)中學(xué)習(xí)規(guī)律,得到某種模式并利用此模型預(yù)測未來,機(jī)器在學(xué)習(xí)的過程中,處理的數(shù)據(jù)越多,預(yù)測結(jié)果就越精準(zhǔn)。
機(jī)器學(xué)習(xí)在人工智能的研究中具有十分重要的地位。它是人工智能的核心,是使計(jì)算機(jī)具有智能的根本途徑,其應(yīng)用遍及人工智能的各個(gè)領(lǐng)域。從20世紀(jì)50年代人們就開始了對機(jī)器學(xué)習(xí)的研究,從最初的基于神經(jīng)元模型以及函數(shù)逼近論的方法研究,到以符號演算為基礎(chǔ)的規(guī)則學(xué)習(xí)和決策樹學(xué)習(xí)的產(chǎn)生,以及之后的認(rèn)知心理學(xué)中歸納、解釋、類比等概念的引入,至最新的計(jì)算學(xué)習(xí)理論和統(tǒng)計(jì)學(xué)習(xí)的興起,機(jī)器學(xué)習(xí)一直都在相關(guān)學(xué)科的實(shí)踐應(yīng)用中起著主導(dǎo)作用,F(xiàn)在已取得了不少成就,并分化出許多研究方向,主要有符號學(xué)習(xí)、連接學(xué)習(xí)和統(tǒng)計(jì)學(xué)習(xí)等。
(一)機(jī)器學(xué)習(xí)的發(fā)展歷程
機(jī)器學(xué)習(xí)發(fā)展過程大體可分為以下四個(gè)階段:
1.50年代中葉到60年代中葉
在這個(gè)時(shí)期,所研究的是“沒有知識”的學(xué)習(xí),即“無知”學(xué)習(xí);其研究目標(biāo)是各類自組織系統(tǒng)和自適應(yīng)系統(tǒng);其主要研究方法是不斷修改系統(tǒng)的控制參數(shù)以改進(jìn)系統(tǒng)的執(zhí)行能力,不涉及與具體任務(wù)有關(guān)的知識。指導(dǎo)本階段研究的理論基礎(chǔ)是早在40年代就開始研究的神經(jīng)網(wǎng)絡(luò)模型。隨著電子計(jì)算機(jī)的產(chǎn)生和發(fā)展,機(jī)器學(xué)習(xí)的實(shí)現(xiàn)才成為可能。這個(gè)階段的研究導(dǎo)致了模式識別這門新科學(xué)的誕生,同時(shí)形成了機(jī)器學(xué)習(xí)的二種重要方法,即判別函數(shù)法和進(jìn)化學(xué)習(xí)。塞繆爾的下棋程序就是使用判別函數(shù)法的典型例子。不過,這種脫離知識的感知型學(xué)習(xí)系統(tǒng)具有很大的局限性。無論是神經(jīng)模型、進(jìn)化學(xué)習(xí)或是判別函數(shù)法,所取得的學(xué)習(xí)結(jié)果都很有限,遠(yuǎn)不能滿足人們對機(jī)器學(xué)習(xí)系統(tǒng)的期望。在這個(gè)時(shí)期,我國研制了數(shù)字識別學(xué)習(xí)機(jī)。
2.60年代中葉至70年代中葉
本階段的研究目標(biāo)是模擬人類的概念學(xué)習(xí)過程,并采用邏輯結(jié)構(gòu)或圖結(jié)構(gòu)作為機(jī)器內(nèi)部描述。機(jī)器能夠采用符號來描述概念(符號概念獲。⑻岢鲫P(guān)于學(xué)習(xí)概念的各種假設(shè)。本階段的代表性工作有溫斯頓(Winston)的結(jié)構(gòu)學(xué)習(xí)系統(tǒng)和海斯·羅思(Hayes Roth)等的基于邏輯的歸納學(xué)習(xí)系統(tǒng)。雖然這類學(xué)習(xí)系統(tǒng)取得較大的成功,但只能學(xué)習(xí)單一概念,而且未能投入實(shí)際應(yīng)用。此外,神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)機(jī)因理論缺陷未能達(dá)到預(yù)期效果而轉(zhuǎn)入低潮。因此,使那些對機(jī)器學(xué)習(xí)的進(jìn)展抱過大希望的人們感到失望。他們稱這個(gè)時(shí)期為“黑暗時(shí)期”。
3.70年代中葉至80年代中葉
在這個(gè)時(shí)期,人們從學(xué)習(xí)單個(gè)概念擴(kuò)展到學(xué)習(xí)多個(gè)概念,探索不同的學(xué)習(xí)策略和各種學(xué)習(xí)方法。機(jī)器的學(xué)習(xí)過程一般都建立在大規(guī)模的知識庫上,實(shí)現(xiàn)知識強(qiáng)化學(xué)習(xí)。尤其令人鼓舞的是,本階段已開始把學(xué)習(xí)系統(tǒng)與各種應(yīng)用結(jié)合起來,并取得很大的成功,促進(jìn)機(jī)器學(xué)習(xí)的發(fā)展。在出現(xiàn)第一個(gè)專家學(xué)習(xí)系統(tǒng)之后,示例歸約學(xué)習(xí)系統(tǒng)成為研究主流,自動知識獲取成為機(jī)器學(xué)習(xí)的應(yīng)用研究目標(biāo)。1980年,在美國的卡內(nèi)基梅隆大學(xué)(CMU)召開了第一屆機(jī)器學(xué)習(xí)國際研討會,標(biāo)志著機(jī)器學(xué)習(xí)研究已在全世界興起。此后,機(jī)器歸納學(xué)習(xí)進(jìn)入應(yīng)用。1986年,國際雜志《機(jī)器學(xué)習(xí)》(Machine Learning)創(chuàng)刊,迎來了機(jī)器學(xué)習(xí)蓬勃發(fā)展的新時(shí)期。70年代末,中國科學(xué)院自動化研究所進(jìn)行質(zhì)譜分析和模式文法推斷研究,表明我國的機(jī)器學(xué)習(xí)研究得到恢復(fù)。1980年西蒙來華傳播機(jī)器學(xué)習(xí)的火種后,我國的機(jī)器學(xué)習(xí)研究出現(xiàn)了新局面。
4.機(jī)器學(xué)習(xí)最新階段始于1986年
一方面,由于神經(jīng)網(wǎng)絡(luò)研究的重新興起,對連接機(jī)制學(xué)習(xí)方法的研究方興未艾,機(jī)器學(xué)習(xí)的研究已經(jīng)在全世界范圍內(nèi)出現(xiàn)新的高潮,機(jī)器學(xué)習(xí)的基本理論和綜合系統(tǒng)的研究得到加強(qiáng)和發(fā)展。另一方面,對實(shí)驗(yàn)研究和應(yīng)用研究得到前所未有的重視,機(jī)器學(xué)習(xí)有了更強(qiáng)的研究手段和環(huán)境。從而出現(xiàn)了符號學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)、進(jìn)化學(xué)習(xí)和基于行為主義(actionism)的強(qiáng)化學(xué)習(xí)等百家爭鳴的局面。
圖2 機(jī)器學(xué)習(xí)的發(fā)展歷程
(二)機(jī)器學(xué)習(xí)的結(jié)構(gòu)模型
機(jī)器學(xué)習(xí)的本質(zhì)就是算法。算法是用于解決問題的一系列指令。程序員開發(fā)的用于指導(dǎo)計(jì)算機(jī)進(jìn)行新任務(wù)的算法是我們今天看到的先進(jìn)數(shù)字世界的基礎(chǔ)。計(jì)算機(jī)算法根據(jù)某些指令和規(guī)則,將大量數(shù)據(jù)組織到信息和服務(wù)中。機(jī)器學(xué)習(xí)向計(jì)算機(jī)發(fā)出指令,允許計(jì)算機(jī)從數(shù)據(jù)中學(xué)習(xí),而不需要程序員做出新的分步指令。
機(jī)器學(xué)習(xí)的基本過程是給學(xué)習(xí)算法提供訓(xùn)練數(shù)據(jù)。然后,學(xué)習(xí)算法基于數(shù)據(jù)的推論生成一組新的規(guī)則。這本質(zhì)上就是生成一種新的算法,稱之為機(jī)器學(xué)習(xí)模型。通過使用不同的訓(xùn)練數(shù)據(jù),相同的學(xué)習(xí)算法可以生成不同的模型。從數(shù)據(jù)中推理出新的指令是機(jī)器學(xué)習(xí)的核心優(yōu)勢。它還突出了數(shù)據(jù)的關(guān)鍵作用:用于訓(xùn)練算法的可用數(shù)據(jù)越多,算法學(xué)習(xí)到的就越多。事實(shí)上,AI 的許多最新進(jìn)展并不是由于學(xué)習(xí)算法的激進(jìn)創(chuàng)新,而是現(xiàn)在積累了大量的可用數(shù)據(jù)。
圖3 機(jī)器學(xué)習(xí)的結(jié)構(gòu)模型
(三)機(jī)器學(xué)習(xí)的工作方式
1.選擇數(shù)據(jù):首先將原始數(shù)據(jù)分成三組:訓(xùn)練數(shù)據(jù)、驗(yàn)證數(shù)據(jù)和測試數(shù)據(jù);
2.?dāng)?shù)據(jù)建模:再使用訓(xùn)練數(shù)據(jù)來構(gòu)建使用相關(guān)特征的模型;
3.驗(yàn)證模型:使用驗(yàn)證數(shù)據(jù)輸入到已經(jīng)構(gòu)建的數(shù)據(jù)模型中;
4.測試模型:使用測試數(shù)據(jù)檢查被驗(yàn)證的模型的性能表現(xiàn);
5.使用模型:使用完全訓(xùn)練好的模型在新數(shù)據(jù)上做預(yù)測;
6.調(diào)優(yōu)模型:使用更多數(shù)據(jù)、不同的特征或調(diào)整過的參數(shù)來提升算法的性能表現(xiàn)。
圖4 機(jī)器學(xué)習(xí)的工作方式
(四)機(jī)器學(xué)習(xí)發(fā)展的關(guān)鍵基石:
(1)海量數(shù)據(jù):人工智能的能量來源是穩(wěn)定的數(shù)據(jù)流。機(jī)器學(xué)習(xí)可以通過海量數(shù)據(jù)來“訓(xùn)練” 自己,才能開發(fā)新規(guī)則來完成日益復(fù)雜的任務(wù)。目前全球有超過30億人在線,約170 億個(gè)連接的設(shè)備或傳感器,產(chǎn)生了大量數(shù)據(jù),而數(shù)據(jù)存儲成本的降低,使得這些數(shù)據(jù)易于被使用。
(2)超強(qiáng)計(jì)算:強(qiáng)大的計(jì)算機(jī)和通過互聯(lián)網(wǎng)連接遠(yuǎn)程處理能力使可以處理海量數(shù)據(jù)的機(jī)器學(xué)習(xí)技術(shù)成為可能,具某媒體稱,ALPHGO之所以能在與對李世石的對決中取得歷史性的勝利,這與它硬件配置的1920個(gè)CPU和280個(gè)GPU超強(qiáng)運(yùn)算系統(tǒng)密不可分,可見計(jì)算能力對于機(jī)器學(xué)習(xí)是至關(guān)重要的。
(3)優(yōu)秀算法:在機(jī)器學(xué)習(xí)中,學(xué)習(xí)算法(learning algorithms)創(chuàng)建了規(guī)則,允許計(jì)算機(jī)從數(shù)據(jù)中學(xué)習(xí),從而推論出新的指令(算法模型),這也是機(jī)器學(xué)習(xí)的核心優(yōu)勢。新的機(jī)器學(xué)習(xí)技術(shù),特別是分層神經(jīng)網(wǎng)絡(luò),也被稱為“深度學(xué)習(xí)”,啟發(fā)了新的服務(wù),刺激了對人工智能這一領(lǐng)域其他方面的投資和研究。
圖5 機(jī)器學(xué)習(xí)的關(guān)鍵基石

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會
-
即日-5.15立即報(bào)名>>> 【在線會議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評 >> 【評選啟動】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?