看IBM的AI辯論家項(xiàng)目(Project Debater)有多可怕
部署辯論家項(xiàng)目的基礎(chǔ)設(shè)施
為了保證項(xiàng)目進(jìn)展的彈性,“辯論家”有兩個(gè)同時(shí)運(yùn)行的完整運(yùn)行時(shí)基礎(chǔ)設(shè)施。
現(xiàn)場(chǎng)辯論系統(tǒng)使用了IBM云和以色列海法實(shí)驗(yàn)室中運(yùn)行的基礎(chǔ)設(shè)施的混合體;
備份實(shí)例完全部署在IBM云中。
IBM研究院的運(yùn)行時(shí)“辯論家”系統(tǒng)由以下部分組成:
主服務(wù)器是一個(gè)雙插槽的IBM/聯(lián)想系統(tǒng)System x3650 M5服務(wù)器。該服務(wù)器內(nèi)置兩個(gè)14核英特爾Xeon E5-2600 v4處理器和768 GB系統(tǒng)內(nèi)存。一個(gè)實(shí)例部署在本地,一個(gè)實(shí)例部署在IBM Cloud的達(dá)拉斯數(shù)據(jù)中心。
一個(gè)Elasticsearch集群。該集群包含四臺(tái)裸機(jī),每臺(tái)機(jī)器具有64 GB內(nèi)存、12個(gè)內(nèi)核和兩個(gè)960 GB的SSD磁盤。該集群同樣部署了兩個(gè)實(shí)例,一個(gè)部署在達(dá)拉斯的IBM Cloud中,一個(gè)本地部署在以色列海法。
一個(gè)Cassandra數(shù)據(jù)庫(kù)集群。該集群包含四個(gè)Linux VM,每個(gè)VM具有32 GB內(nèi)存和4個(gè)內(nèi)核。該集群同樣部署了兩個(gè)實(shí)例:一個(gè)在達(dá)拉斯的IBM Cloud中,另一個(gè)本地部署在海法。
這些服務(wù)器使用IBM Cloud網(wǎng)絡(luò)基礎(chǔ)架構(gòu)以10 Gb/秒的速度聯(lián)網(wǎng)到一起。對(duì)于舊金山的現(xiàn)場(chǎng)辯論,IBM僅使用了10 Mb/秒的互聯(lián)網(wǎng)連接將其現(xiàn)場(chǎng)控制筆記本電腦連接到IBM Cloud和海法的IBM研究實(shí)驗(yàn)室。
IBM Watson基于商業(yè)云的語(yǔ)音到文本服務(wù)和文本到語(yǔ)音服務(wù)。使用IBM Cloud Kubernetes群集上的女性語(yǔ)音運(yùn)行文本到語(yǔ)音服務(wù)。
IBM Cloud上的Kubernetes集群上運(yùn)行了其他服務(wù),用于處理投票、事件流管理和后臺(tái)屏幕呈現(xiàn)。
IBM為“辯論家”項(xiàng)目的舞臺(tái)展示打造了一個(gè)自助服務(wù)終端,該中端只有兩個(gè)扁平的屏幕,用于顯示它的頭像。
IBM沒有在“辯論家”系統(tǒng)中使用GPU或者FPGA這些計(jì)算加速器。
IBM指出,“辯論家”項(xiàng)目的開發(fā)團(tuán)隊(duì)優(yōu)化了其運(yùn)行時(shí)模型,以滿足辯論對(duì)手開場(chǎng)演講和反駁發(fā)言時(shí)的一到兩分鐘的時(shí)間延遲。
令我們印象深刻的是,IBM的“辯論家”運(yùn)行時(shí)系統(tǒng)部署在舊的主流服務(wù)器上,卻依然表現(xiàn)良好。如果該系統(tǒng)使用當(dāng)今最先進(jìn)的服務(wù)器和存儲(chǔ)系統(tǒng)的話,它的尺寸可能會(huì)顯著降低,整個(gè)系統(tǒng)可能用6U機(jī)架高度就能部署完畢。
實(shí)時(shí)性挑戰(zhàn)
“辯論家”不是那種蹦出一句短句快速響應(yīng)的會(huì)話系統(tǒng)。它也沒有設(shè)計(jì)成那種開始時(shí)幾乎沒有任何背景信息、需要在對(duì)話運(yùn)行時(shí)構(gòu)建上下文的對(duì)話系統(tǒng),相反,每次辯論開始時(shí),都已經(jīng)以“決議”的形式給出了背景。這種辯論性質(zhì)的會(huì)話由一系列短語(yǔ)和句子組成。“辯論家”要想?yún)⑴c活躍且響應(yīng)迅速的對(duì)話,它的響應(yīng)延遲應(yīng)該控制在一到兩秒的量級(jí)。
“辯論家”現(xiàn)在只注意捕捉對(duì)手的麥克風(fēng)信息,它并不會(huì)傾聽和觀察觀眾的反饋。在現(xiàn)場(chǎng)辯論中,人類辯手會(huì)觀察觀眾以評(píng)估觀眾對(duì)自己的論述的實(shí)時(shí)反映。請(qǐng)注意,是這些觀眾給辯手打分,辯手需要給這些觀眾留下深刻印象,而不是主持人。原則上,我們相信“辯論家”的繼任者會(huì)增加一個(gè)全新的模型集合,以在視覺上評(píng)估觀眾(點(diǎn)頭、無(wú)聊、興奮等)的反應(yīng),以及在聽覺上評(píng)估觀眾(拍手、喘氣、輕笑等)的反應(yīng)。但是,IBM最初并沒有規(guī)劃這一些,因?yàn)檗q論并不是IBM在商業(yè)上所關(guān)注的點(diǎn)。沒有人類觀眾參加的辯論賽寡淡無(wú)味,所以添加上這些反饋能力能夠使得“辯論家”在演講中改變論述的方向。此外,辯論家這一類的系統(tǒng)必須提前創(chuàng)建幾種論述備選,以根據(jù)觀眾的反應(yīng)動(dòng)態(tài)地選擇。
對(duì)于通過(guò)智能手機(jī)、網(wǎng)絡(luò)攝像頭等進(jìn)行的群組發(fā)言和一對(duì)一聊天來(lái)說(shuō),解決掉觀察觀眾反應(yīng)問(wèn)題將使得會(huì)話系統(tǒng)看起來(lái)更加人性化。21世紀(jì)AI的圖靈測(cè)試應(yīng)該更多地考慮人性化的影響。
拓展人類的知識(shí)
IBM的“辯論家”團(tuán)隊(duì)開發(fā)了20個(gè)基準(zhǔn)數(shù)據(jù)集,所有的數(shù)據(jù)集都根據(jù)Creative Commons License(CC BY-SA 3.0)或GNU免費(fèi)文檔許可(GFDL)發(fā)布,包括:
19,276對(duì)維基百科概念;
5000個(gè)注釋了情感的習(xí)語(yǔ);
帶注釋的3,000個(gè)句子;
有關(guān)55個(gè)主題的2,394個(gè)標(biāo)簽聲明;
由專業(yè)辯手錄制的60篇關(guān)于爭(zhēng)議話題的演講。
IBM Research發(fā)表了32篇論文,描述了其在設(shè)計(jì)和訓(xùn)練Project Debater方面的大部分工作,IBM還在偏置檢測(cè)方面做了大量工作,包括檢測(cè)數(shù)據(jù)集中的偏差和檢測(cè)訓(xùn)練模型中的偏差。 它還發(fā)布了一些描述性的文本片段,這些內(nèi)容可以回溯到它的研究論文里面。
不過(guò),分享研究論文和數(shù)據(jù)集是一回事,分享訓(xùn)練模型就是另外一回事了。如上所述,IBM研究院僅僅披露了其硬件的一些高層級(jí)的詳細(xì)信息,但是并沒有詳細(xì)介紹軟件框架、運(yùn)行時(shí)模型集合中部署的特定訓(xùn)練模型。IBM發(fā)布了訓(xùn)練數(shù)據(jù)集,但是并沒有公布特定模型的訓(xùn)練代碼,也沒有給出和其訓(xùn)練模型有關(guān)的任何權(quán)重?cái)?shù)字。我們只能對(duì)其運(yùn)行時(shí)軟件架構(gòu)有一個(gè)粗略的了解。當(dāng)然,IBM已經(jīng)明確表示過(guò),當(dāng)該技術(shù)商業(yè)化后將發(fā)布更多細(xì)節(jié)信息。
考慮到IBM正在通過(guò)其Crowd產(chǎn)品將“辯論家”技術(shù)商業(yè)化到其Speech服務(wù)中,所以它至今沒有給出關(guān)于模型訓(xùn)練的詳細(xì)信息也在情理之中。
這和OpenAI的套路實(shí)際上很相似。OpenAI也發(fā)布了不少博客和有據(jù)可查的論文,描述了帶有15億個(gè)參數(shù)的GPT-2“Transformer”模型背后的多任務(wù)學(xué)習(xí)算法,但是OpenAI也沒有發(fā)布數(shù)據(jù)集、訓(xùn)練代碼或者GPT-2模型的權(quán)重,只是發(fā)布了一些較小、功能較少的訓(xùn)練模型。
OpenAI在決定不發(fā)布模型時(shí)表示了這些模型可能會(huì)被濫用的可能性。但是,在它宣布不發(fā)布模型一個(gè)月后,它就宣布將通過(guò)一家剝離出來(lái)的公司將這些模型商業(yè)變現(xiàn)。
看來(lái),人工智能剛開始都是瞄準(zhǔn)一些有趣的事情和游戲,然后再用它做一些真正有利可圖的事情。
監(jiān)管AI
AI取得了難以置信的快速進(jìn)步,但是人們還沒有建立合適的文化反對(duì)人工智能的濫用。最近的SXSW互動(dòng)會(huì)議上就有一個(gè)“智能未來(lái)”的議題,追蹤了許多會(huì)議上凸顯的對(duì)AI和道德的爭(zhēng)論。
我們于今年3月11日參加了由歐盟贊助的小組會(huì)議:“該上法學(xué)院的算法們:人工智能的倫理”。該會(huì)議討論的主題之一就是歐盟委員會(huì)即將出臺(tái)的“值得信賴的AI應(yīng)該遵守的道德準(zhǔn)則”。該指南的最終版本將于4月9號(hào)或之前提交給歐盟委員會(huì)。
不過(guò),在會(huì)議小組討論之后的問(wèn)答環(huán)節(jié)中,有一位記者斷言人工智能將會(huì)成為一種過(guò)于危險(xiǎn)的技術(shù),并且聲稱“所有人工智能研究工作都應(yīng)該停止”。這種論調(diào)本身并不令人震驚,真正讓人震驚的是居然有大約三分之一的觀眾對(duì)此表示認(rèn)同。
SXSW上關(guān)注的技術(shù)驅(qū)動(dòng)的社會(huì)性問(wèn)題通常領(lǐng)先大眾一兩年。目前SXSW對(duì)人工智能的道德倫理的強(qiáng)烈興趣表明,未來(lái)幾年內(nèi)這一問(wèn)題將進(jìn)入社會(huì)大眾的視野。我們的行業(yè)需要變得更加透明,以贏得更多公民和消費(fèi)者的信任。
結(jié)論
IBM在2月11日舉行的Think活動(dòng)中進(jìn)行了“辯論家”最后一次演示,“辯論家”輸?shù)袅诉@場(chǎng)辯論。但是,在辯論進(jìn)程的過(guò)程中,IBM研究院通過(guò)“辯論家”向世人展示了一個(gè)可以可信地進(jìn)行對(duì)上下文敏感、可達(dá)人類辯手水平的辯論系統(tǒng)。
IBM設(shè)計(jì)的“辯論家”和人類辯手展開了有意義的辯論,但是人類辯手和觀眾都清楚地知道它就是一個(gè)人工智能。在這個(gè)系統(tǒng)設(shè)計(jì)中,IBM研究院向論述中添加了一些笑話,并為之提供了根據(jù)紐約一位女演員構(gòu)建的聲音。不過(guò),IBM研究院做了一些處理,使之成為一個(gè)明顯的合成聲音,但是該聲音聽起來(lái)并不單調(diào),表現(xiàn)力還不錯(cuò),這對(duì)于辯論來(lái)說(shuō)很重要。
“辯論家”的開場(chǎng)比我們預(yù)期的要好得多,它挑戰(zhàn)了我們對(duì)于自然語(yǔ)言處理(NLP)當(dāng)前能力的假設(shè)。不過(guò),在反駁和總結(jié)性陳詞中,它沒有分辨出人類辯手論點(diǎn)中的幾個(gè)細(xì)微差別,也沒有表現(xiàn)出對(duì)人類觀眾的同情心。正是在理解能力和同理心上面的差距使得“辯論家”進(jìn)入了不可思議的“恐怖谷”。
顯然,無(wú)論從哪個(gè)方面來(lái)看,創(chuàng)建一個(gè)可以參與這種開放性主題辯論的人工智能都是一個(gè)巨大的挑戰(zhàn)。
當(dāng)然,有人可能會(huì)爭(zhēng)辯說(shuō),創(chuàng)建一個(gè)可以在隨機(jī)主題上與人類辯手展開辯論(無(wú)論是贏了還是輸了)的人工智能就等于通過(guò)了圖靈測(cè)試。圖靈測(cè)試是什么?“通過(guò)圖靈測(cè)試”意味著什么。21世紀(jì)的AI的圖靈測(cè)試也需要現(xiàn)代化,簡(jiǎn)單地說(shuō),我們對(duì)會(huì)話系統(tǒng)的人工智能測(cè)試需要更多地涵蓋人文環(huán)境。
雖然IBM的“辯論家”令人印象深刻,但是,它想在未來(lái)的幾年內(nèi)走過(guò)“恐怖谷”依然非常困難。不過(guò),IBM證明了此事可行,就已經(jīng)贏得了戰(zhàn)斗的一半。IBM在舊硬件上拼湊實(shí)現(xiàn)了對(duì)“辯論家”的訓(xùn)練是一項(xiàng)驚人的研發(fā)壯舉!稗q論家”能夠使用更新的硬件進(jìn)行更快的訓(xùn)練和部署呢?現(xiàn)在還很難說(shuō),但是我們相信,其它人可能會(huì)在IBM的啟發(fā)下,針對(duì)人工智能會(huì)話系統(tǒng)投入更多資源,我們將看到這個(gè)領(lǐng)域的快速發(fā)展。
可以肯定的是,會(huì)話系統(tǒng)將變得更加出色,更加復(fù)雜,這將影響未來(lái)的工作機(jī)會(huì)和社會(huì)結(jié)構(gòu),現(xiàn)在是時(shí)候?qū)ψ匀徽Z(yǔ)言處理的未來(lái)進(jìn)行認(rèn)真討論了。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?