原文標題:《Vitalik Buterin:反對基尼系數在加密貨幣中的過度使用》
編譯:Kyle
基尼系數(也稱為基尼指數)是迄今為止最受歡迎和廣為人知的不平等不等式衡量標準,通常用于衡量某些國家、地區或其他社區的收入或財富不平等, 它很受歡迎,因為它易于理解,其數學定義可以很容易地在圖形上進行可視化。
然而,正如人們對所有試圖將不平等縮減為一個數字的方案所期望的那樣,基尼系數也有其局限性。 即使在衡量各國收入和財富不平等的原始背景下也是如此,但當基尼系數移植到其他背景下(尤其是:加密貨幣)時,情況就更是如此。 在這篇文章中,我將討論基尼系數的一些限制,并提出一些替代方案,
什么是基尼系數(Gini coefficient)?
基尼系數是科拉多·基尼(Corrado Gini)于 1912 年引入的衡量不平等的指標,它通常用于衡量國家收入和財富的不平等程度,但它也越來越多地用于其他情況。
基尼系數有兩個等效的定義:
曲線上方面積定義:繪制函數圖,f(p) 等于最低收入部分人口賺取的總收入所占的份額(例如,f(0.1)) 是收入最低的 10% 賺取的總收入所占的份額)。 基尼系數是曲線和 y=x 直線之間的面積,作為整個三角形的一部分:
平均差定義:基尼系數是每對所有可能的個人之間的平均收入差的一半除以平均收入。
例如,在上面的示例圖表中,四個收入為 [1, 2, 4, 8],因此 16 個可能的差異為 [0, 1, 3, 7, 1, 0, 2, 6, 3, 2, 0, 4, 7, 6, 4, 0]。 因此平均差異為 2.875,平均收入為 3.75,因此基尼系數 =2.875/(2*3.75)≈0.3833。
事實證明,兩者在數學上是等價的(證明這個是給讀者的一個練習)!
基尼系數存在什么問題?
基尼系數很有吸引力,因為它是一個相當簡單且易于理解的統計數據,這可能看起來并不簡單,但相信我,幾乎所有處理任意規模人口的統計數據都那么糟糕,而且往往更糟。在這里,看看像標準偏差這樣基本的公式:
以下是基尼系數:
那么,這有什么問題呢?嗯,有很多問題,人們寫了很多關于基尼系數的各種問題的文章,在本文中,我將重點討論一個我認為關于整個基尼系數的討論不足的特定問題,但它與分析互聯網社區(如區塊鏈)中的不平等特別相關。基尼系數將兩個實際上看起來完全不同的問題結合到一個單一的不平等指數中:受困于缺乏資源和權力集中,
為了更清楚地理解這兩個問題之間的區別,讓我們看一下兩個反面烏托邦:
- 反面烏托邦 A:一半人口平均分享所有資源,其他人什么都沒有
- 反面烏托邦 B:一個人擁有一半的資源,其他人平分剩余的一半
以下是兩個反烏托邦的洛倫茲曲線(我們上面看到的花式圖表):
顯然,這兩個反面烏托邦都不是生存的好地方,它們并不是非常不同方式的生活的好地方。反面烏托邦 A 使每個居民在難以想象的可怕的大規模饑餓(如果他們最終在分配的左半部分)和平等主義的和諧(如果他們最終分配在右半部分)之間進行拋硬幣。如果你是滅霸,你可能真的會喜歡這種方式!如果不是,則值得以最強的力量避免這種情況。另一方面,反面烏托邦 B 類似于《美麗新世界》:每個人都過著不錯的生活(至少在拍攝每個人資源的快照時),但付出了極其不民主的權力結構的高昂代價,最好的希望是你有一個好的霸主。如果您是 Curtis Yarvin,您可能真的會喜歡它!如果你不是,那也非常值得避免這種情況。
這兩個問題很不相同,值得分別分析和衡量。這種差異同時也不僅僅是理論上的,下面的圖表顯示了底層的 20% 人口賺取的總收入的份額(避免反面烏托邦 A 的一個體面代理)與頂層 1% 人口 的總收入份額(一個接近反烏托邦 B 的體面代理):
Sources: https://data.worldbank.org/indicator/SI.DST.FRST.20 (合并 2015 年和 2016 年數據) 和 http://hdr.undp.org/en/indicators/186106
兩者明顯相關(系數 -0.62),但遠非完全相關(統計學認為 0.7 是「高度相關」的下限,而我們甚至低于此閾值)。圖表中有一個有趣的第二個維度可以分析—— 頂層 1% 賺取了總收入的 20% 而底層 20% 賺取總收入的 3% 的國家,與頂層 1% 賺取總收入的 20% 而底層 20% 賺取總收入的 7% 的國家之間的區別之處,不過,這樣的探索最好留給比我更有經驗的其他有進取心的數據和文化探索者,
為什么基尼系數在非地理社區(例如互聯網 / 加密社區)中很成問題?
尤其是區塊鏈領域的財富集中是一個重要問題,這是一個值得衡量和理解的問題,這對整個區塊鏈領域很重要,因為許多人(和美國參議院聽證會)都在試圖弄清楚加密貨幣在多大程度上是真正的反精英主義,以及在多大程度上它只是用新精英取代了舊精英。在相互比較不同的加密貨幣時,這也很重要。
在加密貨幣的初始供應中明確分配給特定內部人員的代幣份額是一種不平等, 請注意,這個以太坊數據略有錯誤:內部人和基金會份額應為 12.3% 和 4.2%,而不是 15% 和 5%。
鑒于對這些問題的關注程度,許多人嘗試計算加密貨幣的基尼指數也就不足為奇了:
- 觀察到的質押 EOS 代幣的基尼指數(2018)
- 加密貨幣的基尼系數 (2018)
- 使用多種指標和粒度衡量比特幣和以太坊的去中心化(2021 年,包括基尼系數和其他 2 個指標)
- 末日博士 Nouriel Roubini 將比特幣的基尼系數與北韓進行比較(2018 年)
- 加密貨幣市場的鏈上洞察(2021 年,使用 Gini 來衡量集中度)
甚至更早,我們還看到了 2014 年的這篇聳人聽聞的 文章:
除了此類分析經常犯的常見的方法論錯誤(通常混淆收入與財富不平等,混淆用戶與帳戶,或兩者兼有)之外,使用基尼系數進行此類對比分析還存在一個深刻而微妙的問題,問題在于典型地理社區(例如城市、國家)和典型互聯網社區(例如區塊鏈)之間的關鍵區別:
地理社區的典型居民將大部分時間和資源花費在該社區,因此地理社區中衡量的不平等反映了人們可用總資源的不平等,但在互聯網社區中,衡量的不平等可能來自兩個來源:(i) 不同參與者可用總資源的不平等,以及 (ii) 參與社區的興趣水平的不平等。
擁有 15 美元法定貨幣的普通人很窮,并且失去了過上美好生活的能力。擁有 15 美元加密貨幣的普通人只是一個業余愛好者,他們曾經為了好玩而打開過一個錢包,興趣水平的不平等是一件健康的事情;每個社區都有自己的業余愛好者和全職鐵桿粉絲。因此,如果一種加密貨幣具有非常高的基尼系數,但事實證明這種不平等在很大程度上來自興趣水平的不平等,那么這個數字所指向的現實遠沒有標題所暗示的那么可怕,
加密貨幣,即使是那些高度富裕的加密貨幣,也不會將世界的任何地方變成接近反面烏托邦 A,但分布不均的加密貨幣很可能看起來像反面烏托邦 B,如果使用幣投票治理來作出協議決定,則會使問題更加復雜。因此,為了檢測加密貨幣社區最擔心的問題,我們需要一個指標來更具體地捕捉與反面烏托邦 B 的接近程度。
另一種選擇:分別衡量反面烏托邦 A 問題和反面烏托邦 B 問題
衡量不平等的另一種方法是直接估計資源分配不均帶來的痛苦(即「反面烏托邦 A」問題)。首先,從一些表示擁有一定數量貨幣價值的效用功能開始。很受歡迎,因為它抓住了直覺上吸引人的近似性,即收入翻倍在任何水平上都同樣有用:從 10,000 美元到 20,000 美元與從 5,000 美元到 10,000 美元或從 40,000 美元到 80,000 美元的效用是相同的)。這個分數是衡量與每個人都獲得平均收入相比損失多少效用的問題:
第一項(平均對數)是如果貨幣完全重新分配,每個人都會擁有的效用,因此每個人都獲得了平均收入。第二項(對數平均值)是當今該經濟體的平均效用,如果您狹隘地將資源視為用于個人消費的東西,則這種差異代表了不平等造成的效用損失。還有其他方法來定義這個公式,但它們最終接近等價(例如,安東尼·阿特金森 1969 年的論文提出了一個「平均分配的等價收入水平」指標,在這種情況下,它只是上面的一個單調函數,并且 Theil L 指數在數學上完全等同于上述公式),
要衡量集中度(或「反面烏托邦 B」問題),赫芬達爾-赫希曼指數是一個很好的起點,并且已經用于衡量行業的經濟集中度:
或者對于視覺學習者:
Herfindahl-Hirschman 指數:綠地面積除以總面積
對此還有其他選擇;Theil T 指數 具有一些相似的特性,但也存在一些差異。 一個更簡單和更笨的替代方案是中本聰系數:需要的最少參與者人數加起來超過總數的 50%, 請注意,所有這三個集中度指數都非常關注頂層部分發生的事情(并且故意如此):擁有少量資源的大量參與者對指數貢獻很小或沒有貢獻,而兩個頂級參與者合并的行為可能對指數進行非常大的更改。
對于加密貨幣社區來說,資源集中是系統面臨的最大風險之一,但只有 0.00013 個幣的人并不能證明他們實際上在挨餓,采用這樣的指數是顯而易見的方法, 但即使對于國家來說,可能更值得討論和衡量權力的集中和資源缺乏的痛苦,
也就是說,在某些時候,我們甚至必須超越這些指數。 集中性的危害不僅取決于參與者的規模; 它們還嚴重依賴于參與者之間的關系及其相互勾結的能力, 同樣,資源分配依賴于網路:如果缺乏資源的人有一個非正式的網路可以利用,那么缺乏正式資源可能不會那么有害。 但是處理這些問題是一個更加艱巨的挑戰,因此我們確實需要更簡單的工具,同時我們仍然有少量數據可以使用。
特別感謝 Barnabe Monnot 和 Tinazhen 提供反饋和審查,