下一個風口: Web3.0有效數據和分布式搜索

都在說分布式搜索好,能落地才是重頭戲!

本文共3900字,閱讀大約需要6分鐘,

一、痛點的背后是創新的空間

關于分布式搜索引擎,現在大家都怎么看呢?達瓴看到有說是Web3.0數據價值轉換的重要板塊的,也有說中心化搜索引擎不夠中立、數據泄露、數據丟失等問題,進而突出分布式優勢的,但是說實話,單純去比較分布式和中心化搜索引擎的好和壞,其實意義不大,

因為就目前的應用價值來看,中心化搜索引擎的應用價值肯定是比分布式搜索引擎大很多,這是由時間積累所決定的,想要通過技術研發的突破就去替代某些中心化巨頭引擎,顯然是不現實的。

但畢竟中心化搜索引擎存在諸多缺點,所以當人們開始思考有沒有辦法去做一些改變時,就一定會創新出一種能彌補中心化缺點的搜索引擎——分布式搜索引擎,

二、分布式搜索引擎的第一步必須是“存數據”,還得是“有效數據”

由此從創新價值的角度來看,討論分布式與中心化搜索引擎的對比是有必要的,但最終想要落地,還是要殊途同歸,分布式還是要向中心化“學習”,該落地的步驟一個也不能少。

那么,這第一步怎么走呢?可能很多人會直接搬出IPFS和HTTP的優缺點對比,告訴大家IPFS能降低存儲成本、加快網路訪問速度、保障數據安全,一定要應用IPFS,但是要知道HTTP已經存在20余年,其背后存儲的文件數量要遠遠超出IPFS,即使目前在IPFS上存儲的數量文件已超過50億份,這個數據的懸殊也絕對不是一兩年就能追上的。

而對于搜索用戶來說,能夠快速得到想要的結果才是第一位,偶爾“犧牲”下隱私對他們看來是無關痛癢的,若是連一點數據搜不到,哪里還來談分布式呢?HTTP不香嗎?

所以,分布式搜索引擎的第一步必須是“存數據”,而且還得是“有效數據”!這就很好地解釋了為什么分布式存儲的項目要比搜索引擎快一步落地呢?畢竟相比起怎么設計算法能讓用戶快速查到內容,有內容給查才是基本。

由于大陸傳統上通信網路主要圍繞人口聚集程度進行建設,因此大陸的數據中心是集中于東部城市部署的,但近年來,隨著數據中心規模快速擴張,對土地供應、能源保障、氣候條件都提出了更高要求,現有的城市資源,尤其是東部一線城市資源,已難以滿足持續發展要求,

2021年5月26日,國家發展改革委、中央網信辦、工業和資訊化部、國家能源局聯合印發《全國一體化大數據中心協同創新體系算力樞紐實施方案》,明確提出布局全國算力網路國家樞紐節點,啟動實施“東數西算”工程,構建國家算力網路體系。

在這樣的背景下,分布式存儲能從架構上解決了數據存儲的安全問題,并能減少能源消耗,完全是助力“東數西算”工程的好幫手!因此達瓴相信分布式存儲的數據一定會越來越充足,這會是必然的結果。

可是,分布式存儲不能因為技術等優勢就干等著數據送到嘴里,主動去設計激勵手段,不斷創建新的生態,才能加速實現國家數據安全的建設。這樣看來,存數據的“球”現在傳到了激勵層的腳下,怎么做好激勵,怎么建好生態,成為分布式項目能否落地的關鍵,

有的項目直接一來就用token獎勵用戶去剛剛搭建好的搜索界面搜索,以擴充數據。但此時搜索到的大部分還是HTTP打頭的中心化網頁,少部分存在的IPFS的網頁可能無法滿足搜索需求,更多項目還是以獎勵存儲數據的用戶為主,存儲商戶也能通過機器P盤數據獲得token獎勵,以此實現良性循環,

但俗話說得好,想象總是美好的,現實總是殘酷的,雖說任何生態都需要token做支撐,但是為了這個目的才去建設生態的項目比比皆是,大家還沒有開始用token筑起生態,就開始按捺不住,先玩起token的金融價值,想著賺波快錢。

所以說,如果能將設計的激勵層和生態共同促進,就是掌握了此類項目成功的部分關鍵要素。

三、生態的核心——激勵機制

激勵模式一定是要有回流和循環的,token不能只是外送到一個地方后就固定了,沒有流轉的設計,token就很難實現它的價值,因此分布式搜索的激勵層設計一定要合理,且肯定要比存儲項目考慮得更多,設計到的各方利益面也更復雜。

上文看來,激勵層首先就是要激勵用戶和存儲商戶去存儲數據,存了以后還需要存儲商戶及時打包上鏈,所以最開始的激勵力度肯定是要偏向于二者的。例如:傳統云存儲的代表——阿里云,據官網數據顯示,其對存儲商戶的收費=固定費用+數據大小(單位:GB)*倍數,達瓴估算該固定費用為65180元,倍數為8.25左右,

因此,在不考慮固定費用的情況下,存儲1GB的數據大約需要8.25元,緊接著派出分布式存儲的代表——IPFS的激勵層Filecoin,據調查,每個FIL每天可以存儲約782.73GB的數據容量,折算下來存儲1GB的數據大約需要0.623元,

這樣一對比就可以發現分布式項目在存儲數據成本方面有著顯著優勢,更有項目加大力度,不僅不收取存儲數據者的費用,反而獎勵其token,以實現數據層的快速建設,

數據來源:阿里云RDS,數據統計截止8月18日

除了針對用戶的存儲費用激勵,不少項目也獎勵token給打包數據的存儲商戶,以加速數據上鏈。比如最近主網即將上線的QitChain(QTC),基于Web3.0有效數據存儲的分布式搜索引擎,以不同的網路節點來存儲數據,防止丟失,

QTC在生態建設上就根據用戶搜索的關鍵詞,列出分布式節點中的所有結果,中間不插入廣告,同時采用了加密技術,除非用戶會通知他人,對方才能擁有用戶的私人數據密鑰。因此用戶在QTC的生態里可以完全控制自己的數據資訊,

據QTC的官方白皮書顯示, 其通過設計長期激勵的經濟模型保證整個生態的良性發展,同時對現有 POC 進行優化做出了一些改進,將其升級為CPOC(Conditioned-Proof of Capacity)共識,并增加了 POS 權益激勵,可以增強社區共識度,

CPOC條件的發行方式會讓參與方的產生正向商業博弈,使整個系統始終會有一個較為主力的臨時商業既得利者去無形推動整個生態,

數據來源:QTC微信公眾號,數據整理:達瓴智庫

四、搜索引擎的定位不同,有效數據的內容也不同

而且需要注意的是,不同的搜索項目聚焦的數據也是不同。例如:The Graph作為一個查詢區塊鏈數據的索引協議,允許使用查詢語言GraphQL查詢不同的網路(以太坊或IPFS)。

在The Graph的資源管理器中,用戶可輕松查找最流行協議(如Uniswap,Compound,Balancer或ENS)的子圖,而子圖能提供對許多有用數據的訪問,比如說自協議啟動以來所有買賣對的總買賣量,每個買賣對的買賣量數據以及有關特定token或買賣的數據等,因此對它們來說,有效數據主要是由區塊鏈項目的各種數據分析和歷史數據組成的,

由此看來,搜索引擎的定位不同,有效數據的內容也不同。但是可以肯定的是,項目方需要重視有效數據在數據層中的重要作用,并在有效數據的數量與獎勵之間設定相關關系,以實現一個合理的數據區間,

The Graph的搜索界面 圖片來源:https://thegraph.com/explorer

總的來說,只有激勵層設計好了,數據這一層的基礎才能打好,再來走搜索就好走多了!

五、生態的流動——收益機制

如果數據有了,怎么提供給用戶一個較好的搜索體驗,怎么平衡用戶、廣告商和項目方的收益,是分布式搜索引擎的另一關鍵,

在中心化搜索引擎下,我們的個人資訊經常通過一些表單、記錄等方式被跟蹤和記錄了,緊接著這些資訊就被用于各種各樣的廣告活動。企業也要為此付出巨額的資金,才能在在線消費的產業中分得一杯羹。

此時的關系就如下圖所示,紅色箭頭為資金流動方向,可見在此生態下三方處于極不公平的地位,資金流動性一致偏向搜索引擎的項目方,

傳統搜索引擎的運行機制

因此,若要讓分布式搜索引擎長久發展下去,項目方需要開創新的生態環境。在這里資金是流動循環的,用戶可以選擇開放自己的數據,并讓廣告商對這一數據進行投放,而廣告商所支付的廣告費將會與數據的所有人進行分成,在這樣的布局下,三方都能有進有出,生態才得以建設起來。

這里可以來看分布式搜索引擎Boogle的設計,其規定一旦用戶選擇開放自己的數據,并讓廣告商對這一數據進行投放時,其所支付的廣告費用將會與數據的所有人進行分成,

在Boogle中,每個廣告點,會有10%的費用被分給用戶,僅15%直接支付給項目方,剩余的通證則將全部轉入一個公開的銷毀地址,因此在這樣的設計中,資金流動性沒有偏向固定的一方,反而在不停的進行流轉,這才是搜索引擎該有的樣子!

分布式搜索引擎的運行機制

六、分布式搜索的未來

其實一個好的分布式搜索引擎還有許多方面需要注意,無論是對數據資訊的篩選、審核,還是對用戶習慣的調試,亦或是未來在存儲、搜索的基礎上開拓更多的分布式應用,例如:支付、通訊、郵件等等,這都需要項目方細細打磨。

我們相信:分布式搜索引擎的未來一定是穩步前進的,但其落地絕對不是靠炒token實現的,而是項目方匠心打造的生態,這其中包括索引獎勵、隱私計算、邊緣計算等一系列技術的疊加以及Dapp的興起,希望大家能給予認真落地的分布式搜索引擎項目足夠的信心和耐心,不要浮躁于token價格的起起伏伏,分布式搜索引擎的未來將由大家一起創造和見證,

本文為達瓴智庫公眾號原創,內容旨在資訊傳遞,不構成任何投資建議。

作者:Jessica丨達瓴智庫

校對:Jessica、Leaves丨達瓴智庫

排版:Jane、Shine 丨達瓴智庫

審核:Amber丨達瓴智庫

0 条回复 A文章作者 M管理員
    暫無討論,說說你的看法吧