訂閱
糾錯(cuò)
加入自媒體

難以“馴服”AI?IBM為企業(yè)提出了這些建議

IBM的研究人員認(rèn)為,由于概率性編程模式和混亂的數(shù)據(jù),目前AI對(duì)企業(yè)而言難以駕馭,日前,IBM的沃森和阿爾馬登研究中心發(fā)布了一篇題目為《刻畫機(jī)器學(xué)習(xí)過(guò)程:一個(gè)成熟度框架》的論文,提出許多充滿希望的建議,同時(shí)也暗示了一個(gè)實(shí)質(zhì)性的問(wèn)題:這家藍(lán)色巨人是否能提出“馴服”AI這匹野獸的方法使其適用于企業(yè)的軟件生命周期和業(yè)務(wù)流程呢?

IBM研究人員給出的建議是,需要仔細(xì)考慮機(jī)器學(xué)習(xí)的多個(gè)階段,包括管理者應(yīng)該如何為神經(jīng)網(wǎng)絡(luò)模型“設(shè)定目標(biāo)”、如何為神經(jīng)網(wǎng)絡(luò)的輸入構(gòu)建數(shù)據(jù)管道(data pipeline)的示例、以及如何不斷迭代和改進(jìn)AI模型。另外,受管制產(chǎn)業(yè)需要特別注意一些地方,比如數(shù)據(jù)血統(tǒng):所使用的數(shù)據(jù)的“合法性”是什么?

AI對(duì)企業(yè)的挑戰(zhàn)在于機(jī)器學(xué)習(xí)編程和傳統(tǒng)軟件編程之間的本質(zhì)區(qū)別:傳統(tǒng)的軟件應(yīng)用程序是確定性的,但機(jī)器學(xué)習(xí)模型是概率性的。另外,使用混雜的數(shù)據(jù)來(lái)開(kāi)發(fā)神經(jīng)網(wǎng)絡(luò),這對(duì)企業(yè)而言并不合適。然而,截至目前關(guān)于機(jī)器學(xué)習(xí)建模的學(xué)術(shù)文獻(xiàn)并沒(méi)有提出如何使機(jī)器學(xué)習(xí)為企業(yè)工作的解決方案。

為了使AI達(dá)到適用于企業(yè)的成熟度,IBM的科學(xué)家建議將機(jī)器學(xué)習(xí)和大量有關(guān)諸如“應(yīng)用生命周期管理”的文獻(xiàn)保持一致,并擴(kuò)展此類術(shù)語(yǔ)的含義以適應(yīng)AI的新特性。IBM提出,一個(gè)機(jī)器學(xué)習(xí)的生命周期涵蓋了各個(gè)階段,企業(yè)必須在持續(xù)基礎(chǔ)上不斷為完成某個(gè)階段的工作做好準(zhǔn)備。

研究人員借鑒了Watts Humphrey在20世紀(jì)80年代對(duì)軟件能力成熟度模型(Capability Maturity Model,CMM)的定義,CMM是對(duì)軟件組織在定義、實(shí)施、度量、控制和改善其軟件過(guò)程的實(shí)踐中各個(gè)發(fā)展階段的描述,其假設(shè)是:只要持續(xù)建立有效的軟件工程過(guò)程的基礎(chǔ)結(jié)構(gòu),不斷改進(jìn)管理的實(shí)踐和過(guò)程,就可以克服軟件生產(chǎn)中的困難。

這項(xiàng)工作最原始的貢獻(xiàn)是研究人員關(guān)于神經(jīng)網(wǎng)絡(luò)應(yīng)根據(jù)一個(gè)特定行業(yè)的特殊性進(jìn)行開(kāi)發(fā)的建議,而為了找到AI的業(yè)務(wù)用例,企業(yè)需要定制行業(yè)和領(lǐng)域通用的機(jī)器學(xué)習(xí)模型,并針對(duì)特殊的情況提供特殊的數(shù)據(jù)。

顯然,IBM正在試圖解決一個(gè)棘手的問(wèn)題,事實(shí)上,機(jī)器學(xué)習(xí)的很多方面并無(wú)法與簡(jiǎn)潔規(guī)范的CMM相協(xié)調(diào),尤其是深度學(xué)習(xí)。比如,IBM建議在企業(yè)內(nèi)部監(jiān)督下建立一套AI服務(wù)數(shù)據(jù)引導(dǎo)系統(tǒng)(AI Service Data Lead),在工作開(kāi)始時(shí),用于訓(xùn)練機(jī)器的數(shù)據(jù)被貼上ground truth(參考標(biāo)準(zhǔn),即用于有監(jiān)督訓(xùn)練的訓(xùn)練集的分類準(zhǔn)確性)的標(biāo)簽,然而仍然有許多未受監(jiān)督的機(jī)器學(xué)習(xí)試圖在神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)中遠(yuǎn)離ground truth。

也許最令人望而卻步的前景是,在IBM看來(lái),企業(yè)有責(zé)任確保神經(jīng)網(wǎng)絡(luò)不存在偏差,而偏差正是令整個(gè)AI社區(qū)都抓耳撓腮的棘手問(wèn)題。IBM在論文中表示,負(fù)責(zé)開(kāi)發(fā)神經(jīng)網(wǎng)絡(luò)的人員需要保證最后建立的模型是公正、透明、沒(méi)有偏差的。

最后,盡管IBM的建議看起來(lái)頗為自信,但似乎現(xiàn)階段的機(jī)器學(xué)習(xí)尚處在一種“未開(kāi)化”的狀態(tài),正如論文的結(jié)尾所描述的那樣,“企業(yè)對(duì)采用AI模型猶豫不決的另外一個(gè)原因就是,他們發(fā)現(xiàn)AI模型就像一個(gè)不透明的黑匣子,這點(diǎn)尤其在用深度學(xué)習(xí)技術(shù)對(duì)模型進(jìn)行訓(xùn)練時(shí)更加突出!

聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點(diǎn)?帽菊靖寮,務(wù)經(jīng)書面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制、翻譯及建立鏡像,違者將依法追究法律責(zé)任。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)