IBM未經(jīng)許可將用戶照片用于AI訓練
當面部識別成為越來越廣泛應(yīng)用的技術(shù),隨之而來的是關(guān)于個人數(shù)據(jù)隱私泄露的擔憂。IBM這次就撞在了槍口上。近日,外媒報道曝光IBM未經(jīng)許可,利用網(wǎng)絡(luò)相冊Flickr上近100萬張個人照片,訓練它們面部識別系統(tǒng),同時與外部研究人員共享這些照片。
眾所周知,機器學習的關(guān)鍵就是大量的數(shù)據(jù)訓練,人臉識別算法亦然。為了提高算法的精確度,需要標注上百萬的照片來訓練AI。
據(jù)了解,在Flickr上傳照片的用戶并不同意IBM將其照片用于開發(fā)面部識別系統(tǒng),因為這些可能最終會被用來監(jiān)視和識別他們。一位攝影師透露:“我拍攝的人中沒有一個人知道他們的照片是以這種方式使用的。”
這些照片被IBM統(tǒng)稱之為訓練數(shù)據(jù)集,他們已經(jīng)對照片上人物的膚色、性別、面部輪廓等做了詳細的標注。
盡管IBM保證Flickr用戶可以選擇退出數(shù)據(jù)庫,但報道該事件的媒體NBC新聞發(fā)現(xiàn),刪除照片幾乎是不可能的。IBM要求攝影師通過電子郵件發(fā)送他們想要刪除的照片的鏈接,但該公司尚未公開分享數(shù)據(jù)集中包含的Flickr用戶和照片列表,因此沒有簡單的方法可以找到包含哪些照片。
這幾年隨著面部識別的大規(guī)模應(yīng)用,不少科技公司都和IBM一樣,抓取網(wǎng)絡(luò)上公開、非商業(yè)性質(zhì)的圖片、視頻來訓練AI程序。
此次被曝光的IBM數(shù)據(jù)訓練集就是YFCC100M照片庫的一部分,YFCC100M是Flickr前東家雅虎為進行研究而收集的照片數(shù)據(jù)庫。所有照片都是在CreativeCommonsLicense版權(quán)協(xié)議下共享的,這種版權(quán)協(xié)議表明照片可以自由使用,但存在一些限制。
面對質(zhì)疑,IBM表示數(shù)據(jù)集不會將人臉的照片與其姓名相關(guān)聯(lián),而且他們的目標是為了解決算法的偏差,以防可能出現(xiàn)的種族歧視。但是,公民自由倡導者和技術(shù)倫理研究人員仍然質(zhì)疑IBM的動機,因為IBM也在銷售人臉識別系統(tǒng),這些工具因侵犯公民自由一直受到批評。
有業(yè)內(nèi)人士指出,IBM和Facebook等公司的研究機構(gòu)和商業(yè)運營之間的區(qū)別是模糊的。即使算法由學術(shù)研究人員使用非商業(yè)數(shù)據(jù)集開發(fā),它們通常也會被企業(yè)使用。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風翻身?