中科院自動化所王飛躍教授團隊研究成果入選第五屆中國科協(xié)優(yōu)秀科技論文
本文來源:智車科技
/ 導讀 /
2020年9月30日,中國科協(xié)公布了第五屆優(yōu)秀科技論文評選結果,中科院自動化所王飛躍教授團隊的李力教授牽頭發(fā)表于《自動化學報》的“平行學習-機器學習的一個新型理論框架”一文榜上有名。本屆遴選計劃共收錄96篇論文,均為發(fā)表在我國科技期刊上的優(yōu)秀論文代表。
第五屆科協(xié)優(yōu)秀論文遴選計劃公示表
論文概述
隨著計算能力的提高和計算理論的創(chuàng)新, 機器學習在過去 30 年中取得了長足的發(fā)展 , 正受到越來越多人的關注,與此同時, 機器學習也面臨越來越多的問題, 傳統(tǒng)機器學習理論框架的不足被逐漸發(fā)現(xiàn)和確認, 新的機器學習理論框架不斷被提出。
中科院自動化所王飛躍研究員于2004年提出了平行系統(tǒng)的思想, 試圖用一種適合復雜系統(tǒng)的計算理論與方法解決社會經(jīng)濟系統(tǒng)中的重要問題. 其主要觀點是利用大型計算模擬、 預測并誘發(fā)引導復雜系統(tǒng)現(xiàn)象, 通過整合人工社會, 計算實驗和平行系統(tǒng)等方法, 形成新的計算研究體系。
近年來, 我們嘗試將平行系統(tǒng)的思想擴展并引入到機器學習領域建立一種新型理論框架以更好地解決數(shù)據(jù)取舍、行動選擇等傳統(tǒng)機器學習理論不能很好解決的問題。在本文中,我們將對這一理論框架的結構和方法進行闡述?蚣苁疽鈭D如下:
圖1 平行學習的理論框架圖
平行學習大致可以分為預測學習(Predictive Learning)、描述學習(Descriptive learning)、指示學習(Prescriptive Learning)三個互相耦合關聯(lián)的階段。
在數(shù)據(jù)處理階段,平行學習首先從原始數(shù)據(jù)中選取特定的“小數(shù)據(jù)”,結合先驗知識,使用預測學習產生大量新的數(shù)據(jù)。這些人工數(shù)據(jù)和特定的原始小數(shù)據(jù)一起構成解決問題所需要學習的“大數(shù)據(jù)”集合,通過描述學習的方式產生一個人工系統(tǒng)。
在行動學習階段,平行學習沿用強化學習的思路,使用狀態(tài)遷移來刻畫系統(tǒng)的動態(tài)變化,通過指示學習的方式在人工系統(tǒng)中對行動空間進行探索。通過學習提取,我們可以得到“小知識”——應用于某些具體場景或任務的精準知識,并將其應用于平行控制和平行決策。而平行控制和平行決策將引導系統(tǒng)進行特定的數(shù)據(jù)采集,獲得新的原始數(shù)據(jù),并再次進行新的平行學習,使系統(tǒng)在數(shù)據(jù)和行動之間構成一個閉環(huán)。
以平行學習在自動泊車中的應用為例。首先通過獲取真實系統(tǒng)中的泊車數(shù)據(jù), 結合計算實驗與預測學習生成人工數(shù)據(jù),形成泊車的“大數(shù)據(jù)”。使用這些數(shù)據(jù),通過描述學習的方式構造人工系統(tǒng),該系統(tǒng)是真實車輛的平行系統(tǒng),接受控制序列作為輸入,輸出車輛的移動軌跡。在這一人工系統(tǒng)中,我們可以使用指示學習的方式探索可能的泊車方案,學習到的策略會控制真實車輛進行泊車,進而獲得更多的數(shù)據(jù)。完整流程如下圖所示
圖2 平行學習在自動泊車中的應用
平行的核心思想是從小數(shù)據(jù)產生大數(shù)據(jù),再從大數(shù)據(jù)提煉小規(guī)則即精準知識。平行學習是這一思想在機器學習領域中的具體實現(xiàn)。平行學習已在虛擬場景生成、無人駕駛車輛的智能控制與測試、社會計算和情報處理等領域得到了較好的應用。期待本文拋磚引玉,引起業(yè)內專家學者興趣,共同對機器學習理論做出更加深入的革新。
關于“優(yōu)秀科技論文遴選計劃”
“優(yōu)秀科技論文遴選計劃”是中國科協(xié)基于鼓勵科技工作者多出科研精品和原創(chuàng)性研究成果、促進更多優(yōu)秀成果在我國科技期刊首發(fā)、進而助推世界一流科技期刊建設而設的大型年度評選活動。遴選工作由中國科協(xié)統(tǒng)一部署,面向10個學科集群評選推介發(fā)表在我國正式出版的科技期刊上、且在國際學術界有影響、在科技前沿有突破和建樹、對原始創(chuàng)新有引領作用、對國家經(jīng)濟社會建設有重大貢獻的優(yōu)秀論文,對從源頭上推動我國期刊質量的提升,維護我國科技期刊的成果首發(fā)權,掌握學術評價主導權、進而提升我國在國際科技界的話語權,更好地提升科技創(chuàng)新能力有重要的推動作用。
- End -
請輸入評論內容...
請輸入評論/評論長度6~500個字
圖片新聞
最新活動更多
推薦專題
- 1 2025上海車展看什么?看這一篇就夠了!
- 2 關稅大戰(zhàn),汽車芯片會漲價嗎
- 3 工信部召開智能網(wǎng)聯(lián)汽車產品準入及軟件在線升級管理工作推進會提的內容,將如何影響智駕行業(yè)發(fā)展?
- 4 地平線智駕方案軟硬結合,大眾、保時捷的合作紛至沓來
- 5 高呼的“全民智駕”真的做到“全民”了嗎?
- 6 一季度汽車產量省份排名大洗牌!誰在異軍突起?
- 7 奇瑞的混動技術:厚積薄發(fā),從發(fā)動機到混動系統(tǒng)
- 8 東風+華為,還是華為借東風?華為ADS3.0技術詳解
- 9 工信部對浮躁的智駕說“不”
- 10 重要信號!奇瑞汽車IPO背后大佬現(xiàn)身海信集團