訂閱
糾錯
加入自媒體

數據需要治理!全球頂級大咖匯集SDBD2020探討數據共享最新實踐

2020-08-26 14:41
算力智庫
關注

8月25日,SIGKDD·SDBD2020 第二屆智能數據和區(qū)塊鏈應用國際研討會在線召開,在數據經濟大背景下探討數據治理與共享之道。

ACM SIGKDD2020(知識發(fā)現和數據挖掘會議)是一年一度全球最頂級、最高水平、最具影響力的數據科學盛會,本次SDBD國際研討會作為KDD大會中聚焦智能數據和區(qū)塊鏈等新興技術的專場Workshop,由新加坡管理大學及算力智庫共同舉辦。

算力智庫創(chuàng)始人燕麗表示:“今年國家把數據提到生產要素的高度,標志著行業(yè)風口的到來。算力智庫一直在跟蹤智能數據、隱私計算和區(qū)塊鏈賽道中的好公司、好應用,希望通過第一手原創(chuàng)深度報道和研報推進產業(yè)與生態(tài)的發(fā)展!

會上,來自全球的學界與產業(yè)界專家從數據作為資產的維度探討了前沿科技賦能數據共享的最新實踐,并倡導“技術+制度”雙軌并行充分挖掘數據要素的更大價值。

1數據治理是數字經濟前提

人工智能、區(qū)塊鏈等科技讓數據成為了智慧數據,但所謂數據經濟則不止于智慧數據。新加坡管理大學教授朱飛達認為,在談論科技如何讓數據變得“可計算”之前,還必須認識到一個前提——數據是資產,數據需要治理。

然而即便是這樣一個大前提,人類也花費了很長時間才認識到。朱飛達教授表示,數據經濟歷經了三個階段。第一階段數據只是商業(yè)活動的副產品,人們更多用數據來理解過去。第二階段是大數據與數據經濟的興起,在這一階段數據被少部分企業(yè)壟斷而得利。第三階段則是數據驅動經濟,數據成為了驅動所有機構組織的共享資產。

翼方健數(BaseBit.ai) CEO羅震認為,從信息時代到智能時代,數據正在更多被機器和計算程序使用,也讓機器更加智能化。作為信息時代的遺留物,數據具有獨特的經濟學特征,如虛擬可再利用、固定成本高、可變成本低,同時也在隱私、合規(guī)、機密、安全性等非經濟學維度顯示出鮮明特征。

事實上,人們在認識這些數據特性的過程中已經付出了代價,缺乏治理的數據泄露案例造成巨大損失。

新加坡國立大學副教授何丙勝表示,數據泄露已非孤立事件,各行業(yè)都有相關事件。在教育、醫(yī)藥、能源、健康等領域,每一起數據泄露事件造成的平均損失都至少在500萬美元以上。

這些負面案例不僅承載了巨大的經濟損失,更消耗了整個社會對數據共享的意愿和信心,讓本就基礎薄弱的數據共享愈加困難。

羅震指出,數據本質上不能被安全共享,但應該在不共享數據本身的前提下實現數據價值共享。

當然這就更難,最著名的阻礙就是數據孤島。何丙勝教授以醫(yī)院數據為例表示,不同的醫(yī)院有不同的病人,但其實病例有許多相似性。醫(yī)院、銀行、電商,他們各自的數據實際上是分別掌握了相同人群的不同方面。

朱飛達教授的研究發(fā)現,數據生態(tài)系統(tǒng)中存在兩大瓶頸。第一大瓶頸存在于個人、企業(yè)、政府等不同角色間。第二大瓶頸存在于數據、模型和應用間。

在個人與企業(yè)間,用戶作為數據的貢獻者不僅被排除在價值分配之外,對自身數據的認知與控制也十分有限,更要承受隱私泄露風險。個人與政府間則存在隱私與數據泄露的擔憂。政府部門間因制度原因存在“數據高墻”,企業(yè)之間數據孤島現象普遍,在企業(yè)與政府間數據共享缺乏激勵。

另外,在數據端,數據來源不明,質量差;在模型端,模型的設計與訓練難以獲取真實用戶數據;在應用端,缺少先進的模型造成了低層次的數據智能。

朱飛達教授認為,問題的根源并不在于數據智能本身,而在于數據治理。數據資產治理的核心要素是信任+激勵。其中,信任可以通過聯(lián)邦學習、差分隱私、安全多方計算、TEE等來實現,而激勵則通過數據定價、數據挖掘、機器學習、通證經濟等來實現。

1  2  3  下一頁>  
聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號