原文標題:《另一個狀態友好的界地址方案》
翻譯:ETH 中文站
回顧:狀態大小管理技術
為了防止以太坊的狀態容量無止境地膨脹,我們需要用一些方法使舊狀態「失活」, 這樣加入網路的節點就不再需要存儲舊狀態了,即使大多數的客戶端都變成無狀態,似乎也可以合理預見,最終這個系統會擴容到網路無法一直保證所有狀態都可用的地步,有兩個方法可以使舊狀態失活:
- 直接刪掉,然后可以把它移到另外的默克爾樹,這樣關心該狀態對象的人可以獲取相應的默克爾分支,在未來某個時候用它來激活該狀態,
- 不把對象移出樹結構;相反,只在樹的該位置標記「失活」,這樣節點就不會存儲它 (且協議也不會要求它們這樣做),通過發送一個提供默克爾證明 (即見證數據) 的事務來訪問該狀態,失活的對象就可以重新被訪問了,
方法 (1) 對應于「經典的存儲租金方案」,方法 (2) 對應于傳統「無狀態客戶端」的最簡單延伸——舊狀態可以被遺忘的模型,這兩種方法都允許關心特定狀態對象的個人追蹤默克爾分支,這樣隨后如果那些狀態對象失活了它們可以用來激活這些對象。然而,這兩種方法都是有明顯問題的,
當要在某個已失效合約的同一個地址上再創建合約時,方法 (1) 會出現一些極端情況,那就是,如果一個合約在地址 A 上創建了,然后已經失效了,那么在地址 A 上創建這個合約的事務會被重新執行,這樣會在地址 A 上創建一個新對象,這會影響原始對象的激活。另一種情況是當在地址 A 上創建了一個對象,然后經歷失活、被激活、被修改 (例如,發送合約上的資金到另一個賬戶)、再失活、再用第一次失活所在的默克爾分支激活。這違背了保留規則,且可能被用于鑄幣;需要增加額外的默克爾證明來證明一個合約還沒有被另一個特定狀態激活,而該狀態也嘗試被激活,
方法 (2) 遇到的是不同的問題。假設兩個相鄰的地址 (也就是兩者間沒有對象) A1 和 A2 都已失活。這樣,不僅 A1 和 A2 都不再可以訪問 (除非有人存儲了默克爾分支),而且 A1 和 A2 之間的所有地址都不可以訪問了。也就是說,如果總共有 N 個地址,那么大約 1/N 的可用地址空間都不再可訪問了,當一半的地址都失活了,大約 1/4 的地址空間不再可訪問,隨著時間推移,會越來越難找到空間生成新的地址。而且由于新地址越來越集中在剩下的「可訪問」空間上,每 N 年可訪問空間減半的這種影響會呈指數增長。
提議
我提議對方法 (2) 進行修改,可以解決以上的問題,正如很多方法 (2) 的提議實現方案所呈現的,賬戶有「活躍」與「失活」兩種狀態,失活賬戶是那些超過一年未被訪問過的賬戶,要訪問失活賬戶,你需要提供見證數據;當失活賬戶被訪問了,該賬戶會自動解除失活狀態 (觸及任何賬戶都會重置它的一年失活期計算)。修改內容如下:
我們給每個地址添加一個 32 個字節的 「epoch 前綴」 (會被解譯為一個整數),例如,epoch 前綴是 9 的地址是這樣:0x00000009de0b295669a9fd93d5f28d9ec85e40f4cb697bae,以 00000009 作為前綴,
默克爾路徑會直接依賴 epoch 的前綴而不是它的哈希值 (因此 merkle_path_key = address[:4] + hash(address[4:]) 而不是現在在用的 merkle_path_key = hash(address) 。這確保了「沒用過的」地址空間是連續的。
除非地址的 epoch 前綴是小于或等于區塊鏈已運行的年數,否則地址不能被使用
會增加一個 CREATE3 操作碼,它會把 epoch 前綴作為一個參數,并在具有該 epoch 前綴的一個地址上創建一個合約。
推薦用戶和合約總是使用具有盡可能新的 epoch 前綴來創建賬戶,甚至設為默認設置,因為肯定會有具有最新 epoch 前綴的全狀態仍然是可以訪問的。為了還能保有「反事實地址 (counterfactual addresses)」(即在合約代碼被發布前,用戶在鏈上 [例如通過發送 ETH 或 ERC20 代幣] 或鏈下 [通過在一個通道里互動] 交互的地址),用舊 epoch 前綴來創建合約還是可能的,但是,對于想要創建反事實地址的用戶,如果長期不創建,他們就要負責為該賬戶存儲舊狀態的分支,
經過多年的運行,預計活躍狀態會由兩部分構成:(i) 有最新 epoch 前綴的全部地址空間,(ii) 與最近被活躍使用過的賬戶相對應的特定舊狀態
請注意,這個方案正常情況下擴展到合約上;事實上,主動遵循這個方案是符合合約自身運作的,因為在這個方案里,地址中代表存儲的部分以幾個字節為前綴,它們所代表的數字 N 指的是這些數據是在 N 年與這些地址產生關聯。這很適合用于存儲像代幣余額這樣的數據。