“移花接木”的AI換臉,“眼見為實”還可信嗎?
DeepFakes的技術原理
DeepFakes的核心是一個“自動編碼器”,這個“自動編碼器”實際上是一個深度神經(jīng)網(wǎng)絡,它能夠接收數(shù)據(jù)輸入,并將其壓縮成一個小的編碼,然后從這個編碼中重新生成原始的輸入數(shù)據(jù)。
在這個標準的自動編碼器設置中,網(wǎng)絡將嘗試學習創(chuàng)建一個編碼,從中網(wǎng)絡能夠重新生成輸入的原始圖片。只要有足夠多的圖像數(shù)據(jù),網(wǎng)絡就能學會創(chuàng)建這種編碼。
DeepFakes讓一個編碼器把一個人臉壓縮成一個代碼和兩個解碼器,一個將其還原成人物A(Fallon),另一個還原成人物B(Oliver)。下面的圖能夠幫助你理解:
在這個案例中,使用的編碼器是一樣的,但是Fallon和Oliver的解碼器是不同的。在訓練的過程中,輸入的人臉會被扭曲,從而模擬一個“我們希望得到這樣的人臉”的概念。
下面將介紹算法訓練的三個步驟:
1. 首先,我們給編碼器輸入了一張Jimmy扭曲臉的圖片,并嘗試用解碼器A來重新還原他的臉,這就使得解碼器A必須要學會在紛繁復雜的圖片中識別并且還原出Jimmy的臉。
2. 然后,把Oliver扭曲臉的圖片輸入至同一個編碼器,并用解碼器B來還原Oliver的臉。
3. 我們不斷重復上面的操作,直到兩個解碼器能夠分別還原出兩個人的臉,同時編碼器也能夠學會通過抓取人臉關鍵信息,從而分辨出Jimmy和Oliver的臉。
等到以上的訓練步驟都完成以后,我們就能把一張Jimmy的照片輸入至編碼器,然后直接把代碼傳輸至解碼器B,將Jimmy的臉換成Oliver的臉。
這就是我們通過訓練模型完成換臉的全過程。解碼器獲取了Jimmy的臉部信息,然后把信息交給解碼器B,這時候解碼器B會作出這樣的反應:“這又是一條干擾信息,這不是Oliver的臉,那么我就把你換成Oliver吧!
一條算法僅通過觀察許多圖片就能夠再次生成、還原這些圖片,這聽起來挺不可思議的,但DeepFakes確確實實做到了,而且效果還相當不錯。
用AI假里辨真
如何辨別“AI換臉術”?值得慶幸的是,科學界正在應對這個問題,而主要“殺手锏”是運用AI技術假里辨真。
紐約州立大學奧爾巴尼分校教授呂斯衛(wèi)領導的團隊發(fā)現(xiàn)了偽造視頻的漏洞:假臉極少甚至不會眨眼,因為它們都是使用睜眼的照片進行訓練的。
研究人員表示,偽造視頻往往忽略了“自發(fā)的、無意識的生理活動,例如呼吸、脈搏和眼球運動”。呂斯衛(wèi)說:“因此,缺少眨眼是判斷一個視頻真假的好方法之一!
這種作為“反AI變臉”技術通過有效預測眼睛的狀態(tài),準確率達99%。此項研究已由美國國防高級研究計劃局資助,作為甄別媒體假新聞,推進媒體取證計劃的一部分。
在偽造視頻的后期處理中手動添加眨眼,其實并非一個巨大挑戰(zhàn),而且一些偽造視頻已包含眨眼。從長遠來看,實際上這是一場通過AI制作假視頻和檢測假視頻之間的持續(xù)戰(zhàn)斗。
此外,還有專家指出,“通過強制記錄照片和視頻拍攝的時間、地點,既在區(qū)塊鏈上記錄照片和視頻不可篡改的時空戳方法,也可進行鑒別”。
至于大家很關心的問題,目前的人臉識別技術還安全嗎?畢竟很多手機都是人臉解鎖、而且支持人臉支付。對此,專家表示,目前人臉識別活體檢測技術能夠毫秒級辨別,成功率高達99.9%,防控技術還是有的,大家無需過于擔憂。
AI面前,人類必須保持敬畏之心。科技的突破與進步是無罪的,關鍵要看我們如何去利用它。作為研發(fā)者和使用者,堃乾智能呼吁,我們不僅應該關注科技進步的最新風向,同時也應該關注技術與社會的融合趨勢,在眾多方向之中,摸準市場的痛點,潛心優(yōu)化,快速布局。AI換臉技術究竟會走向何方,我們且靜觀其變。

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?