作者:邱祥宇
12月5日,2020世界區塊鏈大會·武漢正式在武漢國際會展中心開幕。大會由巴比特主辦,并得到了武漢市政府、江漢區政府、武漢市經信局、大陸信通院等部門單位的大力支持,
在當天下午舉辦的“聯邦學習與隱私計算區塊鏈的商業創新發展應用”圓桌論壇,藍象智聯CEO徐敏、洞見科技創始人、董事長姚明、微眾銀行系統架構師曾紀策、光之樹副總裁武姍姍以及富數科技產品總監林琳,共同探討聯邦學習和隱私計算區塊鏈的商業創新。
如何看待數據商業化和隱私之間的博弈和平衡?
徐敏:
數據隱私和數據商業價值是一對矛盾體,就像兩個對面拍過來的海浪一樣,它今天是互相沖向對方,不管浪多大,在下一秒就會融為一體一起往前走,我認為數據隱私和數據商業價值協同也是一樣的,今天來看,如果要達到數據隱私保護和數據商業價值協同我認為有三個方面,包括人文、法律以及技術。人文,我們會更好地去達成一個個人享受更好的社會福利、社會服務,以及各種隱私保護之間的平衡點,法律方面是去確定數據的底線,人文和法律在一起,一個確定了上線,一個確定下線,而技術就是讓我們更好地達成這個平衡點。
今天我們犧牲了40%的隱私,實現了60%的個人的便利性,有了隱私計算保護之后,我們可能就只需要犧牲20%的隱私就能實現80%的個人的便利性,隱私保護它就是能夠來提升更好的社會福祉。
如何在數據隱私保護的前提下把握智能數據與區塊鏈融合?
姚明:先從信用本身講起,信用行業是比較特殊的行業,行業的本質其實是在利用數據和人的歷史經驗,也就是模型和智慧去判斷交易主體的風險。在這樣一個領域存在第三方的信用評估場景,這個場景里面有個非常重要的原則,就是最少可用原則,如果大家關注信用產業的話,這個詞是在政策法規中頻繁提到的,最少可用的原則其實是為了保護主體的隱私能夠不被泄漏,并且不被侵犯,這在今年的民法典里面也有所體現。另一部分也是為了保障公平性。對于最少可用,實際上來說它實現的對于資訊的可見部分盡可能不讓它去泄漏出來或者被轉售。對于這個最小可用原則,如果我們將它定義為是對可見的資訊部分的一個保護,現在技術就提供了一個更新的機會,對于那些不可見的計算價值部分,如果我們能夠將它抽取出來,是不是就可以打破這個最少可用的原則呢,這點就對于信用評價,特別是風控有重大的意義,
因為從風控的角度來說,它其實并不希望用最小可用原則,他希望用更多的數據來刻劃交易對象的風險,以此來進行信用的量化定價和控制風險,這兩者實際上是沖突的。那么這種沖突就給聯邦學習和多方安全計算提供了機會,對于數據,把它用于計算的價值,從它的可見資訊部分抽離出來,讓這個不可見的計算價值部分盡可能多的去參與共享,參與流通,參與信用評價,這樣就可以從技術層面突破最少可用原則,但是又充分保護了可見的個人隱私資訊部分并沒有被侵犯或者被泄漏,這個實際上是對信用產業一種技術的革新,
如何對整個系統做安全驗證?
曾紀策:
從數據交換或者隱私計算的原理來說,安全驗證需要各種算法的證明、一些證書等等。從系統層面來說,比如系統經過安全的認證,3A、4A的安全認證,包括合作方的身份,還有授權,還有賬號,還有審計。另外還有一個很大的殺手锏,因為微眾銀行是完全基于開源的一套東西,我們整個開源產品的家族,包括在線推理、一鍵可溯化的建模即將推出,也會跟區塊鏈技術結合。
我們不單單想在學術界去建立一些標準,我們也嘗試通過開源的手段,在工業界建立一些標準,前面幾點只是說我們在前面做了一些手段,事后我們還繼續提供可審計,包括我們會提供一些網路抓包的方式,還有日志,我們會利用區塊鏈對整個合作過程中的一些行為追溯,
如何突破傳統的數據合作模式,實現新型數據可用不可見的聯合建模和價值共享?
武姍姍:
在傳統的數據合作模式下,數據的使用權和所有權難以分離,大家都認可我們每方數據放在一起進行計算、建模、應用、分析,會產生更好的結果。但通常在實踐中你會發現,那些擁有比較珍貴的數據資源的企業是非常不愿意去分享他的數據的,一是收到數據的一方不會再對同樣的數據進行反復付費,另外脫離了數據所有權人的控制之后,它的用途實際上是很難以再被明確和被監管的,這是問題之一。問題之二,回到聯合建模,原來聯合建模過程中,大家都是輸出一些脫敏后的數據標簽,它包含某種資訊,但是顆粒度更粗,所以它離真實建模的場景遠一些。
回到聯邦學習,聯邦學習實際上提出了一種比較新的技術架構,大家可以在物理分散但是邏輯集中的情況下進行聯合的計算,整個流轉過程是可用不可見的,
隱私計算在整個商業化落地過程中所遇到的挑戰
林琳:
聯邦學習和隱私計算適合在哪些領域大放異彩?
林琳:
隱私計算和聯邦學習的發展趨勢
徐敏: