上個月,全球知名的資訊技術研究和顧問公司Gartner發布了2021年需要重點關注的戰略性科技趨勢,其中隱私計算這項技術被單獨拿出來作為一個大主題,要知道去年Gartner的報告里,隱私計算只能作為一小項出現。這些足以表明“隱私計算”的身價在當下兩年內必定會水漲船高,
隱私計算的最終目標不在于隱私
為什么這幾年開始隱私計算被提到的次數和權重越來越高?回想一下,以前一提到隱私講的更多是數據安全問題,針對的對象都是黑客入侵,因為現在“敵人”變了,對立者是用戶和企業之間。
企業從消費者數據中獲取收益的爭議越來越多,更多消費者逐步意識到個人數據中蘊藏的價值,人們越來越希望控制自己的數據資產,也使得政府對個人數據的監管力度有所提升,最終令各類組織承擔起越來越高的個人數據保護與管理壓力。
而在用戶自身也很矛盾,有一句話可以形容這種尷尬:“大陸的用戶愿意犧牲隱私來獲取更高的便利性”。我們都知道3G/4G網路,以及互聯網、大數據的發展帶來了很多用戶體驗上的優化,例如我們可以精準獲取想看的內容、想買的商品資訊以及打到離自己最近且最順路的車。但這些也確實傷害了隱私。一方面用戶希望繼續享有這種便利,另一方面又不希望企業過多掌控隱私,表面上這形成了一個無解的局面,
以上這些現象,隱私數據的保護是一個最直接的出發點,但這不能完全代表整個隱私計算的概念。首先企業和機構在隱私方面的動機和需求是不一樣的,消費者可能僅僅希望保護他們的身份、信用卡資訊或其他敏感數據,以防止欺詐或身份盜竊,但企業還要依賴于這些隱私數據給業務帶來更多的增長機會,同時也要承擔在隱私數據使用的整個過程中,這些用戶資訊或者企業敏感資訊保護的壓力,
因此我們在看隱私計算時,一是隱私,然后是計算,最終的目標是在維護用戶數據主權的同時讓數據在計算之后產生價值,因此隱私計算不單單是數據的靜態保護,而是一個過程的保護,
Web2.0向Web3.0遷移的絕對前提
數據就是資產,這已經成為Web2.0向Web3.0轉變的關鍵特征,用戶在確立了對自身數據的主權后就會產生另外一個問題,數據很好地牢牢地握在用戶手里,這時候數據是不具備任何價值的,只有它流通了并且經過算法、算力的處理后才會產生一定的價值。
但問題就在于,我把數據交出去之后,會不會損害到我的數據主權?企業會不會拿著我的數據去做一些用戶授權范圍以外的事情?沒有一個穩妥解決方案,企業很難讓用戶相信自己,那么最終的局面就是,用戶手里拿著自身并不具備價值的數據,企業也無法獲得大量優質的數據源來使其產生商業價值。
這就是隱私計算所要解決的問題,為什么說隱私計算是Web2.0向Web3.0遷移的絕對前提?我們又如何精準地切入到這條風口賽道機會點?我們需要更加全面地了解隱私計算技術,
隱私計算的標準定義是:“一組互不信任的參與方之間,在保護隱私資訊以及沒有可信第三方的前提下的協同計算問題”,我們通過著名的“百萬富翁”假設就可以很好地理解,兩個富翁希望比一下誰更有錢,這是我們要解決的問題,最直接的辦法就是看誰擁有的財富數值大,但是這個時候雙方都不想透露自己具體有多少錢,這個資產數相當于我們手里的個人數據。那么我們可以設計一個算法或者裝置,兩個富翁在各自看不見的地方往那個算法或者裝置里輸入具體的財富數額,那個封閉的算法或者裝置就會輸出誰更有錢的結果,整個過程中誰也不知道他們到底有多少錢,那么這個過程或者說算法和裝置就是隱私計算。
隱私計算涵蓋了資訊搜集者、發布者和使用者在資訊產生、感知、發布、傳播、存儲、處理、使用、銷毀等全生命周期過程的所有計算操作,也就是說從數據產生開始,除了數據的所有者之外,誰都不知道數據具體是什么,其他人可以在所有者的授權下使用這些數據,但是又看不到具體的資訊。
這就很好地解決了前面的矛盾,因為企業可能也并不需要知道你具體的資訊,他們真正需要的是數據經過處理計算后產生的價值。不僅如此,在現實市場里面,每一家掌握的數據多少、維度都不一樣,例如騰訊掌控了國人的社交習慣數據,淘寶擁有大量的用戶購物行為數據,任何片面的數據都不能全面精準地勾畫出目標對象的全部特征。數據流動是數字經濟時代企業的剛性需求,越來越多的企業或組織需要與產業鏈上下游業務伙伴在數據流通和交易領域進行深度合作。因為只有通過各方數據協同計算,才能更好地釋放數據更大的價值,提升生產效率,推進產業創新。數據共享和流通將成為剛性業務需求,但出于數據權屬、數據泄露及自身商業利益等諸多因素考慮,手握大量數據的企業或組織對于開放自己的內部數據尤其是核心數據保持極其謹慎的態度,這就是企業與企業之間的“百萬富翁問題”。
舉個例子,某家電商想用用戶數據做一個推薦算法,又沒辦法拿到淘寶或者京東的用戶數據,直接買,又擔心有人刷單薅羊毛,但是如果接入了區塊鏈。那我可以只賣出我的淘寶購物數據和京東購物數據,而不提供出我的快遞地址,姓名,支付寶號等,因為都記在區塊鏈上,我既沒法辦法把相同數據賣給這家電商兩次,又沒法賣給電商假數據,作為回報,店家給我支付酬勞,并且獲得了真正的數據來幫助他自己完善算法,一舉兩得,
隱私計算在可以在確保保密性或隱私的同時,又保護正在使用的數據,
而且前面也提到,Web3.0的核心特征之一是數據確權,那么只有在數據始終在所有者手中,并且一直得到保護才能說對其擁有完整的主權。因此從Web2.0時代平臺控制下流量經濟到Web3.0個體主導下的數據經濟,隱私計算是轉變的絕對關鍵,
隱私計算的賽道體系
最近一兩年我們可能一直零星地聽到零知識證明、TEE、同態加密等這些概念,但是很難對隱私計算的整體概念有一個很清晰的認知,一般來說,隱私計算主要分為可信硬件和密碼學兩大方向,
可信硬件方向:TEE
其中可信硬件指的是,在一個硬件中建立一個我們可以相信的安全區域,然后把所有的數據處理計算都放在這個封閉的安全區域內進行,但是安全性都需要完全依賴于硬件以及硬件安全環境的建設者。一般是Intel或者其他芯片的制造商。(Intel的SGX、ARM的TrustZone、AMD的SEV等產品),
其中最具有代表性的就是TEE,其他例如“中立國”、“安全沙箱”等技術都是基于這個思路。可信硬件的優勢在于通用性高,它可以處理幾乎所有類型的隱私計算任務,并且開發難度低,性能也更高。但其最大的問題在于,把安全性押在一個廠商身上,等于把后門完全留給了可信硬件的提供方和設計者。在外界看來這其中隱含了巨大的風險,因此可信硬件方案更多地會被用在那些并不追求極致的安全性,更加要求速度和體驗的場景中,
密碼學方向:多方安全計算
多方安全計算也就是常見到的MPC,是指在沒有可信第三方托管的情況下,多方共同通過一個特定的函數,安全地完成一次協同計算,每個人都是秘密輸入自己的數據,然后大家只能得到這個函數最后計算出來的結果,
多方安全計算是歷史最為悠久,并且技術底蘊最為深厚的方向,其他所有涉及隱私計算的技術或者解決方案多多少少都會采用多方安全計算的一些技術。并且多方安全計算也是幾年來和區塊鏈結合的最為緊密的技術方向,區塊鏈可以通過采用MPC技術來提升自身的數據保密的能力,以適應更多的應用場景,MPC可以借助區塊鏈技術實現冗余計算,從而獲得可驗證的特性,Blockchain+MPC在近期的發展極快,也非常具有想象空間。
多方安全計算算是一種協議或者說技術集合,像我們常聽到的零知識證明、同態加密、不經意傳輸、混淆電路都屬于多方安全計算的工具,多方安全計算由于其通用性相對較低、性能處于中等水平,因此往往會用于一些特定的場景,例如大型機構和企業之間做一些聯合數據分析,另外還可以用于銀行之間黑名單去重等等,但近年來性能提升迅速,安全多方計算的應用范圍和價值都在急劇提升。
混淆電路和不經意傳輸是主流的多方安全計算框架的核心技術:計算過程中,邏輯或者函數會轉換為電路,數據會沿著這套電路被加密以及計算,這個加密電路和相關的資訊會發送給其他參與者,然后接收方借助不經意傳輸來選取標簽,然后對這個加密電路進行解密來獲取計算結果,
這其中的混淆電路指的是,所有計算邏輯和問題都可以轉換成不同的電路,比如我想求和,那就是加法電路,然后混淆電路通過加密和擾亂這些電路的值來掩蓋關鍵資訊。這樣整個過程中既沒有任何一個人能看到實際的有效資訊,同時也完成了電路所要求的任務。不經意傳輸的意思是A發送了一個資訊給接收者B,發送者A是不知道B是否收到了資訊的。
再就是最近幾年的明星技術零知識證明,零知識證明的原理是,A和B被一道門隔開,B需要向A證明我是有開門的鑰匙的,那怎么讓門對面的A相信B有鑰匙這個事實呢?只要讓A看到B是打開門從中間扇鎖著的門走過來的就可以了。這樣A便可以相信B持有門的鑰匙這一事實,
零知識證明指的是一方向另一方陳述一件事是正確的,而不透露出該陳述之外的任何資訊,證明者不直接告訴你答案,而是采用另一種表達方式來讓向你證明,直到你認為對方確實知道答案為止,零知識證明技術往下細分也有很多的種類,比如 Zcash 使用的 zk-SNARKs 和 Vitalik Buterin 經常提到的 zk-STARKs,
零知識證明(Zero knowledge proofs)目前被公認是“最完美”的解決方案,盡管技術實現難度最高,但在保護在以太坊網路的隱私性和安全性上,其效果最佳。
最后就是秘密共享和同態加密這兩個基礎型的應用技術,秘密共享通過把秘密進行分割,并把秘密在n個參與者中分享,使得只有多于特定t個參與者合作才可以計算出或是恢復秘密,而少于t個參與者則不可以得到有關秘密。同態加密原理則是加資訊加密后發送給對方,區別于一般加密的點在于,同態加密可以在解密時就完成既定的計算任務,分布式計算環境下的密文數據計算方面具有比較廣泛的應用領域,比如安全云計算與委托計算、多方保密計算、匿名投票、文件存儲與密文檢索等,而在區塊鏈上,使用同態加密技術,智能合約也可以處理密文,而無法獲知真實數據,能極大的提高隱私安全性。
而像聯邦計算、差分隱私是近兩年來比較新興的解決方案,在這里我們就不一一贅述了。
總的來說隱私計算的熱度近幾年才剛剛興起,但是其背后,人類對于加密和隱私保護的追求從來沒有停止過,隱私計算是靜態的數據安全基礎上迎合當下市場新需求的結果,而隨著大數據產業的持續發展和數據安全共享需求的日益嚴重,隱私計算技術的落地場景會越來越多。
當前隱私計算的主要應用領域還是在金融行業,多家金融機構在不泄露客戶資訊的情況下綜合各種數據去完成對客戶或者某些投資的風險測繪,從而達成風險控制的目的。而像醫療衛生這類敏感性的商業場景也是重要方向之一,例如此前頗受爭議的健康碼管控可能涉及隱私泄露的爭議。類似這樣的矛盾會在Web3.0到來時被全面激化,這時候隱私計算就是關鍵中的關鍵,