訂閱
糾錯
加入自媒體

隱私計算迎來“開源革命”,高質(zhì)量項目有哪些?

如果說隱私計算賽道,最近的熱門關(guān)鍵詞是什么?

“開源”當(dāng)屬其一。

隨著數(shù)據(jù)要素市場培育提速,隱私計算作為數(shù)據(jù)安全流通的關(guān)鍵技術(shù)解,如何加快其技術(shù)開發(fā)以及商業(yè)化的速度成為市場關(guān)切。

從2020商業(yè)落地元年,再至今年,在隱私計算技術(shù)服務(wù)商與B端客戶的深度磨合和訴求匹配中,市場越發(fā)共識到,隱私計算的“商業(yè)化藍圖”中,高性能算力、開源生態(tài)、軟硬件工程優(yōu)化以及場景適配成為“標配項”,缺一不可。而“開源”則被視為隱私計算通向性能提升、規(guī);涞氐闹匾窂胶图夹g(shù)手段。

去年10月,央行等部門聯(lián)合印發(fā)《關(guān)于規(guī)范金融業(yè)開源技術(shù)應(yīng)用與發(fā)展的意見》,強調(diào)“鼓勵開源技術(shù)提供商,加快提升技術(shù)創(chuàng)新能力,切實掌握開源技術(shù)核心代碼,形成自主知識產(chǎn)權(quán),夯實產(chǎn)業(yè)支撐能力”。

算力智庫發(fā)現(xiàn),自今年至8月份,已先后有螞蟻集團宣布開源隱私計算框架“隱語”,九章云極發(fā)布YLearn因果學(xué)習(xí)開源項目,原語科技推出隱私計算開源平臺Primihub,翼方健數(shù)宣布開源翼數(shù)聯(lián)邦學(xué)習(xí)與翼數(shù)安全計算,肉眼可見,開源逐漸“風(fēng)行”,開源隊伍也已不是阿里、字節(jié)、百度等大廠專屬,一些諸如原語科技、翼方健數(shù)這樣新銳的力量也在陸續(xù)加入。

與此同時,今年5月份,由產(chǎn)學(xué)研用近50家單位聯(lián)合發(fā)起的國內(nèi)首個國際化自主可控隱私計算開源社區(qū)——開放群島(Open Islands)開源社區(qū)也正式成立。

“開源吞噬一切”,這是極客們口中的箴言,擁抱開源成為全球基礎(chǔ)軟件行業(yè)的主流之路,在過去的25年,開源驅(qū)動了絕大多數(shù)的技術(shù)創(chuàng)新,從我們智能手機上搭載的應(yīng)用,到瀏覽的每一個網(wǎng)站、平臺,再到物聯(lián)網(wǎng)時代萬物之間的協(xié)同交互,可以說世界上90%以上的代碼,背后都有開源的身影。

而對于尚處技術(shù)萌芽期的隱私計算而言,開源革命才剛剛開始。

隱私計算二連問:

為什么要開源?為什么是現(xiàn)在?

隱私計算作為數(shù)據(jù)流通的基礎(chǔ)設(shè)施,其開源的必要性,不僅在于實現(xiàn)技術(shù)本身優(yōu)化迭代的通用需求,同時也是基于其服務(wù)數(shù)據(jù)要素流通的特殊性。

“如果隱私計算和聯(lián)邦學(xué)習(xí)技術(shù)只是掌握在少數(shù)寡頭的手里,我們還是得不到真正的數(shù)據(jù)流通,也得不到真正的數(shù)字經(jīng)濟發(fā)展,因此必須把門檻降低,其中一個有效手段就是開源,能夠讓人人都可以使用這樣的技術(shù),人人都能貢獻到這樣的技術(shù)”,香港科技大學(xué)計算機與工程系講席教授、FATE開源社區(qū)技術(shù)指導(dǎo)委員會主席楊強如是表示,同時他也是上述開放群島(Open Islands)開源社區(qū)的執(zhí)行主席。

從目標導(dǎo)向來說,數(shù)據(jù)使用的邊際收益是遞增的,只有實現(xiàn)廣泛流通的數(shù)據(jù)要素市場,才能創(chuàng)造釋放更大的數(shù)據(jù)價值,這意味著必須要打通基礎(chǔ)設(shè)施的閉環(huán),消解技術(shù)孤島,如果巨頭們皆出于商業(yè)趨利性,而實行技術(shù)封閉壟斷,是無利于隱私計算的可持續(xù)長遠發(fā)展,對于隱私計算這種“作用于和棲身于”數(shù)據(jù)流通場景中的技術(shù)屬性而言,開放性、普惠性才是其應(yīng)有之義。一位隱私計算行業(yè)從業(yè)者向算力智庫表示。

楊強也表達了同樣的觀點,他認為在隱私計算、聯(lián)邦學(xué)習(xí)的商業(yè)路線圖上,安全、效率、有效性、普惠是緯線,開源生態(tài)主導(dǎo)的技術(shù)迭代與場景普及是經(jīng)線,開源促進了隱私計算的“普惠”與價值共生。以聯(lián)邦學(xué)習(xí)開源社區(qū)FATE為例,F(xiàn)ATE的開源開啟了國內(nèi)隱私計算技術(shù)的開源浪潮,有效降低了“聯(lián)邦學(xué)習(xí)”的技術(shù)門檻,據(jù)中國信通院調(diào)研統(tǒng)計顯示,55%的國內(nèi)隱私計算產(chǎn)品是基于或參考了開源項目,F(xiàn)ATE開源社區(qū)加速了聯(lián)邦學(xué)習(xí)從“大廠”向小微B端企業(yè)的覆蓋與普及的同時,讓聯(lián)邦學(xué)習(xí)產(chǎn)業(yè)生態(tài)及參與方從“單兵作戰(zhàn)”走向生態(tài)化。

此外,另一個顯而易見的原因是“從技術(shù)開發(fā)的供給側(cè)來說,利用現(xiàn)有資源,不需要重復(fù)開發(fā),再造一次輪子,站在既有的技術(shù)基礎(chǔ)上,抓住已經(jīng)錘煉驗證過的生態(tài)系統(tǒng)和場景,再鉆研添加自己的創(chuàng)新,也不會造成技術(shù)資源浪費。

從銀行金融、醫(yī)療機構(gòu)等需求側(cè)來看,不同技術(shù)路線的隱私計算產(chǎn)品在互聯(lián)互通上存在先天壁壘,“各自割據(jù)”,以至于在實際支撐數(shù)據(jù)計算分析和跨業(yè)務(wù)決策上無法兼容通用;而且一個很重要的問題是,隱私計算以算法驅(qū)動,其“算法黑箱和數(shù)據(jù)黑盒”后門風(fēng)險也伴隨而生,雖然隱私計算廠商一直承諾“安全可信可靠”,不會竊取和留用數(shù)據(jù),但如何能真正取信于人,自證清白呢?螞蟻集團隱私智能計算部總經(jīng)理、“隱語”框架負責(zé)人王磊亦表示:“從技術(shù)層面,如果別人看不到我們的代碼,就不能確認產(chǎn)品的安全性,那又談何信任,只有以開源共享的方式,吸引更多優(yōu)秀的開發(fā)者加入,才能凝聚技術(shù)合力降低隱私計算開發(fā)者和使用者的技術(shù)門檻!

可以觀察到,近幾年來,無論是監(jiān)管合規(guī)層面、還是個人信息保護、業(yè)務(wù)風(fēng)控上對于算法和模型的可解釋性及安全性要求越來越高,比如2021年3月,央行發(fā)布并實施的《人工智能算法金融應(yīng)用評價規(guī)范》要求,應(yīng)用AI算法需滿足安全性和可解釋性;2021年末,四部委聯(lián)合發(fā)布的《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》,其中在用戶權(quán)益保障方面,特別規(guī)定算法推薦服務(wù)提供者應(yīng)當(dāng)以顯著方式告知用戶其提供算法推薦服務(wù)的情況,并以適當(dāng)方式公示算法推薦服務(wù)的基本原理、目的意圖和主要運行機制等。

“可解釋性”和“零信任”應(yīng)該成為技術(shù)基因,隱私計算也不例外,開源通過全代碼的公開可驗證有利于使用者了解其技術(shù)邏輯,促進技術(shù)透明化,才能做到不證自明”,上述那位隱私計算行業(yè)從業(yè)者繼續(xù)表示。

值得注意的是,就在前幾年,開源在隱私計算圈并未流行開來,而至如今,開源走熱,呼聲高漲。

“為什么隱私計算開源開放越來越被重視,是因為恰逢其時,首先,是順應(yīng)全國統(tǒng)一大市場的趨勢,一開始我們更多地強調(diào)隱私計算使用的是哪一項技術(shù),而不是特別關(guān)心要達到什么目的,所以可能有點跑偏了,比如有些廠商特別強調(diào)隱私計算要使用多方計算才安全,使用其他的一些技術(shù)就不安全。所以在技術(shù)選型上,A金融機構(gòu)用的是一類技術(shù),B用的是另一類技術(shù),C可能是大數(shù)據(jù)公司,用的第三類技術(shù),標準不一,以至于當(dāng)大家想互聯(lián)互通的時候,卻發(fā)現(xiàn)這些技術(shù)之間很難溝通,所以現(xiàn)在提出統(tǒng)一大市場非常及時;其次,某種程度上,開源也是隱私計算逐步走向成熟的標志,越來越多的企業(yè)選擇開源,一是相信自己的產(chǎn)品和技術(shù)實力,二是開源可以為隱私計算大規(guī)模落地應(yīng)用和創(chuàng)新提供更加高效的解決方案,基于開源協(xié)作的方式,用戶、生態(tài)伙伴等更多角色的參與,使得技術(shù)接受更多維度檢驗,也能夠建立起更加敏捷、全面的反應(yīng)機制,隨時響應(yīng)安全風(fēng)險,極大提高了軟件算法的安全性與迭代效率!睏顝姳硎尽

技術(shù)賽馬,有哪些高質(zhì)量開源項目?

開源成為“潮流”,高質(zhì)量選手云集。

據(jù)算力智庫不完全統(tǒng)計,近年來國內(nèi)外很多大廠和創(chuàng)業(yè)團隊都在積極開源。

表1:隱私計算主要開源框架/平臺

(數(shù)據(jù)統(tǒng)計:信通院、算力智庫)

當(dāng)前隱私計算開源項目大致可分為協(xié)議框架開源和產(chǎn)品開源,協(xié)議框架開源大部分是針對于某一技術(shù),如MPC領(lǐng)域的mp-spdz、OpenCheetah等,專注于安全與性能提升。另外也有對產(chǎn)品平臺的開源,更易形成生態(tài)?傮w來講,優(yōu)秀的底層開源協(xié)議可以嵌入到平臺中被廣泛應(yīng)用,而隱私計算的產(chǎn)品開源項目大部分仍處于初期,僅代碼開放但社區(qū)建設(shè)不完備。上表是國內(nèi)外主要的開源平臺或協(xié)議框架,可以看出近三年越來越多的企業(yè)加入隱私計算開源隊伍,有包括底層技術(shù)協(xié)議,也有企業(yè)的平臺類項目。

面對目前市場上的眾多開源方,開發(fā)方和使用機構(gòu)更關(guān)注哪些指標?一位隱私計算企業(yè)技術(shù)負責(zé)人透露:目前在各種隱私計算的開源框架中,以聯(lián)邦學(xué)習(xí)和多方安全計算開源框架居多,這兩種技術(shù)路徑相對比較成熟且逐漸形成主流。在和一些大型商業(yè)銀行合作時,他們通常會考慮在成熟框架上自研,從聯(lián)合開發(fā)起步。

螞蟻集團隱私智能計算技術(shù)部總經(jīng)理王磊也指出,銀行在招標和共建時主要關(guān)注技術(shù)的易用性和合規(guī)性,如果一個框架使用門檻高就很難用起來,另外,比較關(guān)注技術(shù)合規(guī)標準問題,但這方面行業(yè)仍在摸索階段。

客觀來說,軟件生態(tài)建設(shè)比軟件本身的研發(fā)更加困難,隱私計算若想取得工業(yè)級規(guī);瘧(yīng)用,還需要做很多超出隱私計算之外的事情,而生態(tài)構(gòu)建是關(guān)鍵一步,通過開源開放可以增強生態(tài)中各界之間的粘度。

翼方健數(shù)首席科學(xué)家張霖濤亦表示:伴隨技術(shù)發(fā)展,越來越多的行業(yè)玩家都已具備了相當(dāng)?shù)募夹g(shù)實力,想要進一步拉開競爭差距,就必須對行業(yè)有更深入的洞察,而不再是純技術(shù)問題。人工智能等新科技領(lǐng)域的開源歷史已經(jīng)給隱私計算提供了借鑒參考,獲得絕對技術(shù)優(yōu)勢也變得更難,TensorFlow、PyTorch等開源框架的出現(xiàn),就在技術(shù)競爭之上轉(zhuǎn)向吸引更多人進入AI賽道,推動AI的整體發(fā)展。

可見,“開源”正在拉開隱私計算技術(shù)賽馬的下一征程,從比拼技術(shù),到重生態(tài),整個賽道的價值觀和站位開始向“更具包容性、擴展性和連接性”傾斜,成人達己,合力共建開源生態(tài)社區(qū)和數(shù)據(jù)要素市場,才是長期主義的發(fā)展路徑。

參考資料

中國經(jīng)營報《隱私計算開源創(chuàng)新 數(shù)據(jù)市場有望提速》經(jīng)濟觀察報《楊強:隱私計算為何要開源?》雷鋒網(wǎng)leiphone《螞蟻“隱語”開源,邁過隱私計算的「界河鴻溝」》SegmentFault思否《我們對“開源”的力量一無所知,卻無限期待》隱私計算聯(lián)盟《發(fā)布|2022隱私計算十大觀察》

       原文標題 : 隱私計算迎來“開源革命”,高質(zhì)量項目有哪些?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號