聯(lián)邦學(xué)習(xí): 統(tǒng)一數(shù)據(jù)協(xié)作和隱私保護(hù)的技術(shù)解決之道
實(shí)際案例講解
通過(guò)上面的介紹,我們發(fā)現(xiàn)聯(lián)邦學(xué)習(xí)在以下幾個(gè)場(chǎng)景下非常有幫助:? 數(shù)據(jù)總量不夠? 樣品不夠充分? 數(shù)據(jù)維度不夠多? 數(shù)據(jù)隱私/核心價(jià)值保護(hù)
聯(lián)邦學(xué)習(xí)的優(yōu)點(diǎn)是整個(gè)學(xué)習(xí)訓(xùn)練過(guò)程,沒(méi)有傳輸任何原始數(shù)據(jù)。那么聯(lián)邦學(xué)可以具體應(yīng)用在哪些場(chǎng)景中呢?以下兩個(gè)案例希望能幫你更好的理解聯(lián)邦學(xué)習(xí)的實(shí)際應(yīng)用。
案例一:醫(yī)療數(shù)據(jù)聯(lián)邦建模。A, B, C 代表三家地方醫(yī)院,各自擁有疾病的診斷數(shù)據(jù)和診斷結(jié)果,但由于病人數(shù)目的限制, A, B, C本身的數(shù)據(jù)大小有限,單獨(dú)建立的模型效果不佳;
如果將A, B, C數(shù)據(jù)的聯(lián)合建模,使得模型樣本更加充足。極大的提高疾病預(yù)測(cè)的準(zhǔn)確度,使得智能基本輔助診斷成為可能。
案例二:個(gè)人信用風(fēng)險(xiǎn)評(píng)估項(xiàng)目。當(dāng)前金融信貸業(yè)務(wù)中往往受限于數(shù)據(jù)不夠豐富,在數(shù)據(jù)可解釋性及穩(wěn)定性、風(fēng)控模型效果、風(fēng)險(xiǎn)策略和獲客成本等層面面臨諸多挑戰(zhàn),借助聯(lián)邦建?梢栽诒Wo(hù)用戶信息不泄露的前提下將來(lái)自通信運(yùn)營(yíng)商/支付機(jī)構(gòu)等更多維度納入聯(lián)合風(fēng)控模型中,從而構(gòu)建更精準(zhǔn)大數(shù)據(jù)風(fēng)控模型用以測(cè)算借款自然人。
A是地方性銀行,經(jīng)營(yíng)信貸業(yè)務(wù),擁有完整的欺詐標(biāo)簽和用戶存貸款/部分信用卡消費(fèi)信息;B是通信運(yùn)營(yíng)商/支付機(jī)構(gòu),擁有相同用戶的定位,網(wǎng)絡(luò)瀏覽等信息,能夠在不同維度捕捉用戶特征。聯(lián)邦學(xué)習(xí)可以聚合不同維度的特征在加密的狀態(tài)下聯(lián)合建模,從而提高模型的預(yù)測(cè)能力和穩(wěn)定性,打擊不法欺詐行為。
根據(jù)我們已有的實(shí)踐效果,發(fā)現(xiàn)經(jīng)過(guò)聯(lián)合分析后可實(shí)現(xiàn):? 評(píng)分卡模型交叉多方數(shù)據(jù),增加模型入模變量,模型 AUC 提升近 3%;? 提升客戶風(fēng)險(xiǎn)定價(jià)能力,輔助風(fēng)險(xiǎn)策略額外挖掘 2% 產(chǎn)品目標(biāo)人群;
總結(jié)
聯(lián)邦學(xué)習(xí)是為了解決跨設(shè)備、跨機(jī)構(gòu)間的數(shù)據(jù)融合問(wèn)題,無(wú)論是從隱私安全還是從保證數(shù)據(jù)格式統(tǒng)一層面,標(biāo)準(zhǔn)的制定對(duì)聯(lián)邦學(xué)習(xí)的大規(guī)模落地具備重要意義。
從目前整個(gè)數(shù)據(jù)產(chǎn)業(yè)看,聯(lián)邦學(xué)習(xí)可以增加可用數(shù)據(jù)的總量,能很好的解決現(xiàn)存數(shù)據(jù)孤島的問(wèn)題;對(duì)企業(yè)自身而言,使用聯(lián)邦學(xué)習(xí)能簡(jiǎn)單、合法且低成本的獲取外部有效的數(shù)據(jù)信息,快速解決某些因數(shù)據(jù)量或數(shù)據(jù)維度不足而導(dǎo)致的困擾,而且也不會(huì)造成合作企業(yè)間數(shù)據(jù)或商業(yè)機(jī)密的泄露。
規(guī)范數(shù)據(jù)使用可以在匯聚更多數(shù)據(jù)的基礎(chǔ)上迎來(lái)數(shù)據(jù)價(jià)值挖掘的下一個(gè)爆發(fā)點(diǎn),帶動(dòng) AI 的數(shù)據(jù)基礎(chǔ)設(shè)施進(jìn)步,隱私計(jì)算未來(lái)會(huì)逐步成為 AI 的基礎(chǔ)設(shè)施。
現(xiàn)階段要用到聯(lián)邦學(xué)習(xí)的場(chǎng)景需求是很多的,但大規(guī)模落地還未到來(lái),除了以上提到的政策和標(biāo)準(zhǔn)待完善的問(wèn)題,還有就是對(duì)工程師的技能要求很高,例如使用聯(lián)邦學(xué)習(xí)做隱私建模等技術(shù)需要更多的知識(shí)普及和經(jīng)驗(yàn)積累,但隨著市場(chǎng)需求和技術(shù)解決方案的逐步清晰,相信越來(lái)越多的企業(yè)參與其中,聯(lián)邦學(xué)習(xí)助力數(shù)據(jù)流動(dòng),讓數(shù)據(jù)孤島聯(lián)結(jié)成網(wǎng),推動(dòng)人工智能的進(jìn)一步發(fā)展。
互動(dòng)交流
Q: 根據(jù)您工作經(jīng)驗(yàn),應(yīng)用聯(lián)邦學(xué)習(xí)的最佳應(yīng)用場(chǎng)景有哪些?除了隱私數(shù)據(jù)挖掘以外,還有哪些?您認(rèn)為目前在實(shí)際中應(yīng)用聯(lián)邦學(xué)習(xí)最大的障礙是什么?缺乏高效的學(xué)習(xí)模型還是缺乏有利的infra 支持,比如移動(dòng)端計(jì)算資源和網(wǎng)絡(luò)通信速率的限制。A: 最佳應(yīng)用場(chǎng)景包括 1: 缺樣本,需要多方一起補(bǔ)充 2: 缺特征,需要多方補(bǔ)齊。最大的障礙是效率,不僅僅是網(wǎng)絡(luò),也包括算力,需要工程和密碼的共同優(yōu)化。
Q: 多方安全計(jì)算和聯(lián)邦學(xué)習(xí)的性能問(wèn)題沒(méi)有提及,這塊會(huì)是應(yīng)用受限的主要困難嗎?A: 在落地的過(guò)程中,性能是非常重要的一個(gè)限制,這里的性能包括算力,網(wǎng)絡(luò)通訊量,qps等,在相同安全性的前提下,提升性能也是我們重點(diǎn)優(yōu)化對(duì)象。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
最新活動(dòng)更多
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
精彩回顧立即查看>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 松下新能源中國(guó)布局:鋰一次電池新品介紹
-
精彩回顧立即查看>> 2024 智能家居出海論壇
-
精彩回顧立即查看>> 2024中國(guó)國(guó)際工業(yè)博覽會(huì)維科網(wǎng)·激光VIP企業(yè)展臺(tái)直播
-
精彩回顧立即查看>> 【產(chǎn)品試用】RSE30/60在線紅外熱像儀免費(fèi)試用
編輯推薦