難以“馴服”AI?IBM為企業(yè)提出了這些建議
IBM的研究人員認(rèn)為,由于概率性編程模式和混亂的數(shù)據(jù),目前AI對(duì)企業(yè)而言難以駕馭,日前,IBM的沃森和阿爾馬登研究中心發(fā)布了一篇題目為《刻畫機(jī)器學(xué)習(xí)過(guò)程:一個(gè)成熟度框架》的論文,提出許多充滿希望的建議,同時(shí)也暗示了一個(gè)實(shí)質(zhì)性的問(wèn)題:這家藍(lán)色巨人是否能提出“馴服”AI這匹野獸的方法使其適用于企業(yè)的軟件生命周期和業(yè)務(wù)流程呢?
IBM研究人員給出的建議是,需要仔細(xì)考慮機(jī)器學(xué)習(xí)的多個(gè)階段,包括管理者應(yīng)該如何為神經(jīng)網(wǎng)絡(luò)模型“設(shè)定目標(biāo)”、如何為神經(jīng)網(wǎng)絡(luò)的輸入構(gòu)建數(shù)據(jù)管道(data pipeline)的示例、以及如何不斷迭代和改進(jìn)AI模型。另外,受管制產(chǎn)業(yè)需要特別注意一些地方,比如數(shù)據(jù)血統(tǒng):所使用的數(shù)據(jù)的“合法性”是什么?
AI對(duì)企業(yè)的挑戰(zhàn)在于機(jī)器學(xué)習(xí)編程和傳統(tǒng)軟件編程之間的本質(zhì)區(qū)別:傳統(tǒng)的軟件應(yīng)用程序是確定性的,但機(jī)器學(xué)習(xí)模型是概率性的。另外,使用混雜的數(shù)據(jù)來(lái)開(kāi)發(fā)神經(jīng)網(wǎng)絡(luò),這對(duì)企業(yè)而言并不合適。然而,截至目前關(guān)于機(jī)器學(xué)習(xí)建模的學(xué)術(shù)文獻(xiàn)并沒(méi)有提出如何使機(jī)器學(xué)習(xí)為企業(yè)工作的解決方案。
為了使AI達(dá)到適用于企業(yè)的成熟度,IBM的科學(xué)家建議將機(jī)器學(xué)習(xí)和大量有關(guān)諸如“應(yīng)用生命周期管理”的文獻(xiàn)保持一致,并擴(kuò)展此類術(shù)語(yǔ)的含義以適應(yīng)AI的新特性。IBM提出,一個(gè)機(jī)器學(xué)習(xí)的生命周期涵蓋了各個(gè)階段,企業(yè)必須在持續(xù)基礎(chǔ)上不斷為完成某個(gè)階段的工作做好準(zhǔn)備。
研究人員借鑒了Watts Humphrey在20世紀(jì)80年代對(duì)軟件能力成熟度模型(Capability Maturity Model,CMM)的定義,CMM是對(duì)軟件組織在定義、實(shí)施、度量、控制和改善其軟件過(guò)程的實(shí)踐中各個(gè)發(fā)展階段的描述,其假設(shè)是:只要持續(xù)建立有效的軟件工程過(guò)程的基礎(chǔ)結(jié)構(gòu),不斷改進(jìn)管理的實(shí)踐和過(guò)程,就可以克服軟件生產(chǎn)中的困難。
這項(xiàng)工作最原始的貢獻(xiàn)是研究人員關(guān)于神經(jīng)網(wǎng)絡(luò)應(yīng)根據(jù)一個(gè)特定行業(yè)的特殊性進(jìn)行開(kāi)發(fā)的建議,而為了找到AI的業(yè)務(wù)用例,企業(yè)需要定制行業(yè)和領(lǐng)域通用的機(jī)器學(xué)習(xí)模型,并針對(duì)特殊的情況提供特殊的數(shù)據(jù)。
顯然,IBM正在試圖解決一個(gè)棘手的問(wèn)題,事實(shí)上,機(jī)器學(xué)習(xí)的很多方面并無(wú)法與簡(jiǎn)潔規(guī)范的CMM相協(xié)調(diào),尤其是深度學(xué)習(xí)。比如,IBM建議在企業(yè)內(nèi)部監(jiān)督下建立一套AI服務(wù)數(shù)據(jù)引導(dǎo)系統(tǒng)(AI Service Data Lead),在工作開(kāi)始時(shí),用于訓(xùn)練機(jī)器的數(shù)據(jù)被貼上ground truth(參考標(biāo)準(zhǔn),即用于有監(jiān)督訓(xùn)練的訓(xùn)練集的分類準(zhǔn)確性)的標(biāo)簽,然而仍然有許多未受監(jiān)督的機(jī)器學(xué)習(xí)試圖在神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)中遠(yuǎn)離ground truth。
也許最令人望而卻步的前景是,在IBM看來(lái),企業(yè)有責(zé)任確保神經(jīng)網(wǎng)絡(luò)不存在偏差,而偏差正是令整個(gè)AI社區(qū)都抓耳撓腮的棘手問(wèn)題。IBM在論文中表示,負(fù)責(zé)開(kāi)發(fā)神經(jīng)網(wǎng)絡(luò)的人員需要保證最后建立的模型是公正、透明、沒(méi)有偏差的。
最后,盡管IBM的建議看起來(lái)頗為自信,但似乎現(xiàn)階段的機(jī)器學(xué)習(xí)尚處在一種“未開(kāi)化”的狀態(tài),正如論文的結(jié)尾所描述的那樣,“企業(yè)對(duì)采用AI模型猶豫不決的另外一個(gè)原因就是,他們發(fā)現(xiàn)AI模型就像一個(gè)不透明的黑匣子,這點(diǎn)尤其在用深度學(xué)習(xí)技術(shù)對(duì)模型進(jìn)行訓(xùn)練時(shí)更加突出!

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?