“數據”在區塊鏈網路中流動的三種范式

撰文:白計劃團隊

區塊鏈是一個多方共同完成總帳本記錄過程的技術,參與的多個計算方將設備連接成網,形成了對外開放的區塊鏈網路,諸如比特幣、以太坊、波卡等等,各個計算參與方共享資源,供開發者和用戶使用, 在這樣的運行規則里,“數據流動”貫穿了每一個運行步驟。 從底層節點的通信到區塊打包、復制、確認,再到應用層的交易轉賬。從網路中的轉賬交易到每個節點的余額、賬戶數據以及數據上鏈。 正是如此,區塊鏈對數據處理的范式是對比傳統資料庫中數據處理的最大優勢, 這里,不得不說的是,在漫長的互聯網周期里,數據已經被企業確認為其價值核心,而與此同時,大量的數據處理和管理問題亟待解決,可喜的是,諸多區塊鏈項目正在嘗試利用區塊鏈技術以及與其他技術結合,形成基于區塊鏈的數據解決方案。 例如,在區塊鏈的數據結構外增加了多元的結構設計和多樣的計算形式。 本文中,白計劃將把目前區塊鏈項目處理數據的3種范式一一闡述,其中包括:最常見的區塊鏈數據結構范式,闡述案例是預言機網路Chainlink;基于硬件的數據流動范式,闡述案例是日本物聯網項目Jasmy;以及目前實現最難的基于可信計算的數據流動范式,闡述項目為數據可信計算網路PlatON。這3種范式,未來一定會大規模改變數據市場。

1.基于區塊鏈數據結構的基礎和進階 區塊鏈網路的數據流動過程是這樣的,節點發現交易(數據),然后將交易打包后形成區塊,繼而由打包節點開始廣播,參與共識的節點開始復制區塊保存起來(或者共識節點確認保存后,其他全節點開始復制), 這樣,區塊鏈上的數據變成了可信的(公開透明,且無法篡改)。 數據是保存在區塊里,因為區塊大小有限,所以區塊里往往都是小字節大小的資訊,例如比特幣轉賬交易,以太坊的轉賬和合約調用消息, 我們可以把這些交易資訊等替換成其他資訊,例如商品溯源流通資訊。還可以替換為任何可以公開的資訊,例如廣告點擊、公益捐款使用情況、銀行共管賬戶資訊等等。 但由于其他資訊的字節較大,更適合存儲進區塊的就是交易數據一類的小字節資訊。經過區塊鏈的多方確認后,這些公開的數據,是可信的,可以讀取使用, 這個模式目前應用最多的示例,是Oracle預言機。例如Chainlink。

2.Chainlink的預言機網路數據結構 我們都知道Chainlink已經成為很多DeFi應用的價格輸入源,因為其網路中提供的喂價足夠安全可信,據Chainlink的技術文檔查閱,Chainlink網路連接了很多的價格輸入點,例如Karken Rates,而輸入的每個價格由接入Chainlink的多個獨立Chainlink Oracle運算符更新,匯總后再進行鏈上處理。

Chainlink的價格處理模型

鏈上處理后會形成可信的價格數據,可以被DeFi應用發現并使用,根據使用數據次數,向網路支付LINK代幣作為酬勞,提供該喂價的價格提供方最后會收到該價格帶來的獎勵收入。 在這個模型里,Chainlink網路外部輸入的數據,經由匯總后進行鏈上處理,最終流轉到需求者方實現價值, 這個過程里,還有很多關鍵部分,例如每個價格喂價要分散的Oracle進行更新。每個價格喂價要獲取分散在很多處的價格,最終匯總處理,并且,每個價格喂價的預言機分散數量數量各不相同,例如,在ETH / USD的價格喂價中,有21個預言機喂價源。 為了隨時更新最準確的數據,處理喂價的智能合約,至少要收到21個預言機中至少14個預言機提供了該價格數據,才會順利更新數據, 以上的操作里數據是否是正確的,可信的,是極為重要的,否則就會出現劫持預言機對DeFi應用進行價格攻擊的事件。 所以要具有一定處理異常的規則,其中包括:對價格進行平均值的取用;價格偏差很大會重新開始價格更新;有指定的價格聚合時間等, Chainlink塑造了基于區塊鏈共識實現可信數據(簡單數據)的最佳示例,而DeFi的崛起,預言機功不可沒,其為DeFi塑造了基礎的安全性,也將區塊鏈數據結構輸出了一個流支付的商業化模式,當然,這還是一個去中心化的商業化模式,

3.基于硬件獲取的數據流動 Chainlink的模式應用非常廣泛,但在上文最基礎的結構里,如果我們謹慎推敲,可以明顯的看到一些不足,例如數據經過鏈處理變成可信的,但“數據上鏈”的過程以及上鏈前并非可控。而更大的問題是,Chainlink處理的都是簡單數據,即字節較小的,公開性較強的數據。 所以,這樣的數據模型,可以做出一些流程的改造,最終塑造出一個這樣的數據流程: 終端(數據產生源)加密–數據存儲–存儲數據哈希上鏈–鏈上的數據流動 這樣的流程可以描述為基于硬件端、分布式存儲與區塊鏈網路結合的數據流動,目前以物聯網網路的融合應用見長,今天我們的闡述舉例是起源于日本的物聯網網路Jasmy。 該網路與Toyota豐田汽車、出行服務供應商Witz曾完成一次合作,將智能汽車的終端數據通過平臺的模型完成處理,在規避個人資訊合規的基礎上,挖掘數據價值。 我們來解剖一下其數據處理范式, 首先是物聯網終端,物聯網設備終端包含了智能設備、行動電話、電腦等具備終端計算能力的設備,可以利用邊緣計算的方式管理在終端的數據。包含了加密和一些管理的集成,

Jasmy對于硬件終端的管理舉例

在這個部分因為要管理大量的終端設備,所以需要將物聯網設備連接起來組建一個物聯網平臺,主要負責設備的管理, 下一步的處理,是因為數據類別是復雜的,并且在設備端已加密,為了實現數據可以調用,便需要將數據上傳到一個開放的網路環境里,并保證數據的隨時可查,可下載,但其所有權和使用權需要控制。 所以為了處理大量數據,就將運用到分布式存儲,最方便的示例是基于IPFS的數據存儲結構。 在完成數據分布式存儲后,也就滿足了與區塊鏈網路中的ID、所有權以及激勵的綁定條件,分布式存儲的文件哈希也可以存入區塊鏈,公開透明。

4.物聯網技術融合的數據處理范式 這個過程與Oracle實現的形式,最不同的是使用了物聯網終端完成了邊緣端的加密,基于端的加密,去完成后續的流轉, Jasmy的流程如下: 1.物聯網平臺負責管理終端物聯網設備,運用Jasmy的SKC服務和SG服務實現終端的數據加密和管理,2.終端的數據存儲在Jasmy的個人數據柜中進行分布式存儲,SKC和SG技術在這個過程里可以將數據定位給個人ID或設備ID。3.分布式存儲的文件哈希上鏈,鏈上的ID和文件哈希綁定。4.基于區塊鏈網路開發的數據交易應用,可以進行數據價值的流轉,即數據所有權以及數據使用權的交換。5.數據使用方可調用分布式存儲個人數據柜中的數據。 這樣的流程,得益于Jasmy的幾個特點,Jasmy有日本硬件制造商新力在硬件領域的加密技術和物聯網領域的供應鏈能力,其他普通區塊鏈創業者無法實現的物聯網優勢上,可以輕松實現,例如SKC的核心技術是在日本應用多年的非接觸式芯片加密技術FeliCa,該技術在為新力產品提供安全性保證。這恰恰是Jasmy結構里增加的新計算方式。 此外還有Jasmy可以和硬件制造商推出具備終端安全性和計算能力的設備,以參與到網路中,例如Jasmy推出了Jasmy Secure PC。 這樣的架構,已經開始為日本的企業服務,包含前文的豐田汽車、Witz、VAIO等,

Jasmy塑造的數據價值實現模式

對比上一種Chainlink Oracle的形式,Jasmy的優勢就在于物聯網終端的加密和分布式存儲個人數據柜的實現,如果不考慮分布式數據存儲,Chainlink也在走向硬件輔助數據源安全的網路結構,其在嘗試利用具備可執行安全環境的硬件作為Oracle數據源實現數據端的可信。與Jasmy在硬件端的實踐如出一轍。

5.基于數據可信計算的數據流動 從Jasmy的設計模型里看到了,將區塊鏈的簡單模型進行一些技術加持后可以實現很突出的效果,如果再把更多技術進行整合,可是實現什么? 對于數據來說,數據最需要的是所屬權的歸屬,以及基于數據所有權進行的數據可信流動,也就是數據實現可用不可見等等一系列保證數據所有者權益的要求, 這個范式,我們可以定義為基于可信計算模型的數據流動,可以拆分為分布式存儲、數據所有權定義、可信執行,這個部分我們用PlatON來闡述。 在PlatON的網路結構里,有一層單獨用來實現可信計算的layer2,layer2可以理解為鏈下部分,負責計算和存儲。所以說PlatON的數據可信計算,同樣是在layer1的區塊鏈結構外,實現了對數據的處理,然后利用區塊鏈網路帶來的權益歸屬、激勵等等。

PlatON的分層邏輯和功能分配

在上圖中,我們可以看到在layer2的計算網路里,存儲著State,這就是數據存儲的載體節點,而在這個結構里,是賬戶模型和數據存儲一起的融合應用。 據PlatON的技術文檔可知,在狀態取用里,PlatON雖然沿用以太坊的賬戶模型存儲數據,但狀態數據因為數據量較大,選擇不保存在帕特里夏樹里(以太坊的存儲結構),而是單獨保存在另外一個不存儲歷史狀態的SNAPDB(資料庫)中, PlatON認為,鏈上存儲需要充分考慮成本,只有有價值的、需要所有賬本做出共識的資訊才應該被存儲到公共賬本上,有價值的資訊包括:區塊、交易、賬戶數據,

PlatON的數據存儲模型

所以PlatON的存儲分為賬戶數據存儲(statedb)和快照存儲(snapshotdb),很明顯一個位于鏈上layer1,一個位于layer2。 但在layer2里,還對數據進行額外的處理,充分發揮其數據計算特性,處理是由可信計算設備和技術完成的,其中包含可驗證計算(VC)算法可實現非交互證明的鏈下計算擴容方案、安全多方計算(MPC)結合秘密共享(SS)和同態加密(HE)實現隱私計算協議等。 此外,還存在MPC虛擬機來執行可信的智能合約計算,這是整個網路里智能合約運行的基礎。 通過這些layer2層的實現,最終實現數據流動以及數據應用的時候,既可以不泄露原始數據且能進行協同計算和結果驗證的計算, 值得非常注重的是,接入layer2的計算設備需要具備專用的計算能力,才可以執行某些應用場景的需求。其要求計算能力超強,并且具備可信能力,因此PlatON會啟用FPGA/ASIC等研發的高性能計算設備接入網路,滿足這一過程的需求, 對比Chainlink和Jasmy的兩種范式,PlatON的不同點顯而易見,其在技術融合應用上,在layer2付諸了非常大的研發力量,其技術落地難度更具挑戰。

6.三種數據處理范式的應用分析 以上3種范式,是主流的基于區塊鏈的數據處理方式,但這三種范式的應用如何呢? 首先我們來看,不容置喙的是,第一種簡單模式其應用數量最廣泛,因為很針對性的使用到了金融領域,正如在DeFi的發展里,Chainlink發揮了巨大的作用,以此為代表的模式,還有溯源等鏈的應用,

Chainlink的部分節點可提供的喂價展示

不過Oracle是面向簡單高頻數據的范式,這個模式簡單,好應用,但對于互聯網社會的遺留問題,并不善于解決。 例如數據隱私問題,Oracle更多是公開的數據可信,而完全不擅長于特有的數據部分。 基于物聯網的數據流動是明顯面向生活化和商業化數據處理的范式,例如Jasmy的應用,已經針對了互聯網App數據,企業辦公數據,以及某些硬件生態的數據。 這是一個從用戶端到平臺和商業生態流動都有設計的范式。這也是目前來講,應用最多的范式結構。 而最后的可信計算是主要面向數據資產商業化的范式,這個部分最難解決的,是商業化數據的合作場景中數據可用不可見,并且是巨量數據的的可信,不只是要求技術,而是要求可信技術和計算能力、存儲的并重, 所以,這三種范式各有千秋,Oracle的范式最適合加密貨幣領域的DeFi,而以Jasmy舉例的應用邊界最廣泛,可以切入除金融簡單數據之外的應用領域,技術相對完善,不過仍需要進行數據更詳細的定義和規范,可以向第三種范式趨勢性發展。 而第三種數據范式,技術上已經可行,但落地應用還需要過程,其中對于數據權益歸屬更詳細的定義和規范,以及技術上實現高并發和高速計算處理,是應用落地更難的部分。

7.寫在最后 數據問題猛于虎,但解決方案在創新者的實踐里已經準備充足,一旦區塊鏈項目落地進程加速,以上3個范式會創造更多的商業價值, 例如Jasmy將企業數據進行了機密設計和終端端數據管理,可以增加邊緣數據的可利用價值,企業數據利用率也會增加。PlatON實現數據的可用不可見,可以繼而應用在AI隱私計算領域,幫助機器學習過程中的數據應用,這個過程是很多產業的突破口,例如AI+醫療、AI+出行、AI+互聯網應用等。 數年前,我們會在感嘆AI技術出現的時候說一句“未來已來”,而筆者認為,如今,解決完數據問題,我們才確確實實可以放心的說一句“未來已來”,因為這是一個讓數據歸于所有者的新未來,是互聯網的數據混沌時代無法代表的新未來,

0 条回复 A文章作者 M管理員
    暫無討論,說說你的看法吧