為什么要讓AI價(jià)值對(duì)齊?
文/陳根
隨著AI大模型進(jìn)入各行各業(yè)的應(yīng)用,以及AI技術(shù)的持續(xù)迭代,關(guān)于AI是否會(huì)威脅人類(lèi)的討論也越來(lái)越多。
其實(shí)這樣的討論過(guò)去也有很多,甚至從AI技術(shù)誕生開(kāi)始,就有人在擔(dān)憂(yōu)AI會(huì)不會(huì)有一天取代人類(lèi),或者威脅人類(lèi)這個(gè)物種的存在。
只不過(guò),今天,AI大模型的爆發(fā),讓這個(gè)問(wèn)題一下子從抽象的討論變得非常具體。我們必須要思考,我們?cè)撛趺从蛹磳⒌絹?lái)的AI時(shí)代;必須要面對(duì),如果AI的性能以及達(dá)到人類(lèi)水平甚至超越人類(lèi)水平時(shí),我們?nèi)祟?lèi)該怎么辦,以及未來(lái)AI會(huì)不會(huì)有一天真的具有了意識(shí),那個(gè)時(shí)候,人機(jī)發(fā)生沖突該又怎么解決。
而面對(duì)這些問(wèn)題時(shí),有一個(gè)概念也被人們重新提起,那就是“價(jià)值對(duì)齊”。這其實(shí)也不是一個(gè)新的概念,但這個(gè)概念放在今天好像特別合適。那么,到底什么是價(jià)值對(duì)齊?誰(shuí)和誰(shuí)的價(jià)值對(duì)齊?又怎么對(duì)齊?
簡(jiǎn)單來(lái)說(shuō),價(jià)值對(duì)齊,其實(shí)就是讓AI的價(jià)值觀和我們?nèi)祟?lèi)的價(jià)值觀對(duì)齊,而之所以要讓AI的價(jià)值觀和我們?nèi)祟?lèi)的價(jià)值觀對(duì)齊,核心目的就是為了安全。
大家可以想象一下,如果不對(duì)齊,會(huì)有什么后果。
比如哲學(xué)家、牛津大學(xué)人類(lèi)未來(lái)研究所所長(zhǎng)Nick Bostrom,曾經(jīng)就提出一個(gè)經(jīng)典案例。就是說(shuō),如果有一個(gè)能力強(qiáng)大的超級(jí)智能機(jī)器,我們?nèi)祟?lèi)給它布置了一個(gè)任務(wù),就是要“制作盡可能多的回形針”,于是,這個(gè)能力強(qiáng)大的超級(jí)智能機(jī)器就不擇手段的制作回形針,把地球上所有的人和事物都變成制作回形針的材料,最終摧毀了整個(gè)世界。
這個(gè)故事其實(shí)早在古希臘神話(huà)里就發(fā)生過(guò)。說(shuō)的是一位叫邁達(dá)斯的國(guó)王,機(jī)緣巧合救了酒神,于是酒神就承諾滿(mǎn)足他的一個(gè)愿望,邁達(dá)斯很喜歡黃金,于是就許愿,希望自己能點(diǎn)石成金。結(jié)果邁達(dá)斯真的得到了他想要的,凡是他所接觸到的東西都會(huì)立刻變成金子,但很快他就發(fā)現(xiàn)這是一個(gè)災(zāi)難,他喝的水變成了黃金,吃的食物也變成了黃金。
大家從這兩個(gè)故事里有沒(méi)有發(fā)現(xiàn)一個(gè)問(wèn)題,不管是超級(jí)智能機(jī)器還是邁達(dá)斯,它們都是為了自己的目的,最后超級(jí)智能機(jī)器完成了回形針任務(wù),邁達(dá)斯也做到了點(diǎn)石成金,但得到的結(jié)果卻是非常災(zāi)難的。因?yàn)樵谶@個(gè)過(guò)程中,它們?nèi)鄙倭艘欢ǖ脑瓌t。
這就是為什么今天價(jià)值對(duì)齊這個(gè)概念會(huì)被重新重視的原因。AI根本沒(méi)有與人類(lèi)同樣的關(guān)于生命的價(jià)值概念。在這種情況下,AI的能力越大,造成威脅的潛在可能性就越大,傷害力也就越強(qiáng)。
因?yàn)槿绻荒茏?span style="font-size: 16px; font-family: 微軟雅黑, 'Microsoft YaHei';">AI 與我們?nèi)祟?lèi)“價(jià)值對(duì)齊”,我們可能就會(huì)無(wú)意中賦予AI與我們自己的目標(biāo)完全相反的目標(biāo)。比如,為了盡快找到治療癌癥的方法,AI可能會(huì)選擇將整個(gè)人類(lèi)作為豚鼠進(jìn)行實(shí)驗(yàn)。為了解決海洋酸化,它可能會(huì)耗盡大氣中的所有氧氣。這其實(shí)就是系統(tǒng)優(yōu)化的一個(gè)共同特征:目標(biāo)中不包含的變量可以設(shè)置為極值,以幫助優(yōu)化該目標(biāo)。
事實(shí)上,這個(gè)問(wèn)題在現(xiàn)實(shí)世界已經(jīng)有了很多例子,今年11月,韓國(guó)慶尚南道一名機(jī)器人公司的檢修人員,被蔬菜分揀機(jī)器人壓死,原因是機(jī)器人把他當(dāng)成需要處理的一盒蔬菜,將其撿起并擠壓,導(dǎo)致其臉部和胸部受傷嚴(yán)重。而后他被送往醫(yī)院,但因傷重而不治身亡。
除此之外,一個(gè)沒(méi)有價(jià)值對(duì)齊的AI大模型,還可能輸出含有種族或性別歧視的內(nèi)容,幫助網(wǎng)絡(luò)黑客生成用于進(jìn)行網(wǎng)絡(luò)攻擊、電信詐騙的代碼或其他內(nèi)容,嘗試說(shuō)服或幫助有自殺念頭的用戶(hù)結(jié)束自己的生命等等。
好在當(dāng)前,不同的人工智能團(tuán)隊(duì)都在采取不同的方法來(lái)推動(dòng)人工智能的價(jià)值對(duì)齊。OpenAI、谷歌的DeepMind各有專(zhuān)注于解決價(jià)值對(duì)齊問(wèn)題的團(tuán)隊(duì)。除此之外,還有許多第三方監(jiān)督機(jī)構(gòu)、標(biāo)準(zhǔn)組織和政府組織,也將價(jià)值對(duì)齊視作重要目標(biāo)。這也讓我們看到,讓AI與人類(lèi)的價(jià)值對(duì)齊是一件非常急迫的事情,可以說(shuō),如果沒(méi)有價(jià)值對(duì)齊,我們就不會(huì)真正信任AI,人機(jī)協(xié)同的AI時(shí)代也就無(wú)從談起。
原文標(biāo)題 : 陳根:為什么要讓AI價(jià)值對(duì)齊?

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車(chē)】汽車(chē)E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專(zhuān)題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類(lèi)新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?