如果一組選票數據不符合本福特定律,那么首先應該考慮 “選票數據在單位時間內的增長量是否應該正比于存量?” 只有在這個前提得到充分辯護后,“不符合本福特定律” 才構成懷疑選票數據真實性的有效理由,
撰文 | 王培(美國天普大學部計算機與資訊科學系)
在本屆美國總統選舉引起的諸多爭議之中,居然連數學都不能置身事外了。拜登的選票數據被指為 “不符合本福特定律” (Benford’s law,也稱“首位數定律”),因此造假的嫌疑很大,關于這個話題本身,李永樂的《拜登選票不符合本福特定律?如何識別數據造假?》做了很好的介紹,我這里就不重復了。本文要討論的是一個更為一般的問題:
一個抽象的數學結論(如本福特定律)在什么條件下可以回答一個具體的實際問題(如一組選票數據的真實性)?
數學是科學嗎?
在《返樸》這樣的平臺上問 “數學是科學嗎?” 會被很多讀者認為是荒唐的(等著看評論吧),但其實更荒唐的是:這里的 “荒唐感” 可能會來自相反的兩個方向,
很多人認為數學不但是科學,而且是最高級的科學,因為數學所刻畫的乃是世間萬事萬物所遵循的普遍規律。今年的諾貝爾物理學獎得主之一彭羅斯就是個數學家(或稱 “數學物理學家” ),倪憶的《彭羅斯:不思考生物化學的諾貝爾物理學獎得主不是好的數學家》中介紹說:“他的原始獲獎工作是1965年發表的一篇只有三頁的數學論文,在相當廣泛的條件下證明了黑洞內奇點的存在”。歷史上更廣為人知的例子是海王星和冥王星(后者現在不算“行星”了,但這和本案無關),二者都是先“算出來”后“觀察到”的。如果這都不算是科學,什么還能算呢?在理論中大量運用數學常被作為一個學科成熟的標志,這在自然科學中以物理學為最,而在社會科學中的典型大概要數經濟學了,
但反方的觀點也并非毫無根據。數學的內部邏輯結構和外部應用方式都和其它學科(如物理學和經濟學等等)有本質的不同,數學是“抽象”的,就是說它不直接描述外部世界,也不直接面對經驗的檢驗。比如哥德巴赫猜想,不管在多少數字上得到了驗證,仍然是個 “猜想”,而把它變成個“定理” 則要求從定義和公理出發,使用有效的推理規則來證明,這也是本福特 “定律” (law)不是個 “定理” (theorem) 的原因,盡管有不少人嘗試了種種辦法把它從某些更基本的前提中證明出來,比如說李永樂那篇文章就在 “單位時間內的增長量正比于存量” 的前提下推出了本福特定律,一個物理學結論的真假往往是根據實際觀察到的現象而確定的,但一個數學結論的真假一般是根據預設的前提而確定的。“現象” 是一個開放的集合,不斷會有意想不到新成員來到;“前提” 是一個固定的集合,在一個理論的范圍內通常是不變的,
化解數學是否算是科學的這種兩難局面,通常的辦法是把科學進一步劃分為 “經驗科學” 和 “形式科學” (或者用其他名詞),同時承認這兩類理論體系的共同點和不同點,但這仍不足以回答更深層的問題,例如,為什么會有這種差別,以及這兩種理論之間的關系是什么,尤其是數學的抽象性,使得它和經驗的關系成為問題,的確有很多例子說明數學 “歸根結底” 還是來自于經驗,但也有不少例子說明很多數學理論幾乎就是 “憑空想象” 的產物,盡管后來居然發現了巨大的實際用途,物理學家維格納曾感慨道:“數學在自然科學中已經有效得不合常理了”[1],而對此的解釋至今仍然莫衷一是。
從認知的觀點看
關于數學 “本質” 的思考是數學哲學的核心問題之一,有代表性的學派包括柏拉圖主義、邏輯主義、直覺主義、形式主義等等。這里不打算對這個領域進行綜述,只是表述我的看法,當然這個看法也是受了很多前人影響的,但因為本文不是學術論文,就不進行詳細的引用和比較了。
我覺得傳統數學哲學研究的一個缺陷是 “就數學談數學”,而很多問題要放在一個更廣闊的背景上才能看得清楚。我在前面的一些文章中已經從不同側面表述了我的科學觀,和常見的觀點不同,我不認為科學是 “對事物的客觀描述”,或者 “發現宇宙的運行規律”,而是 “以指導行動為終極目標對公共經驗進行總結、整理的結果”,具體說來,我認為一個理論是否算 “科學” 是個程度問題,就是說沒有完美的科學理論,但有相對較好或較差的。對經驗科學而言,這個程度包括三個彼此獨立的成分:(1)和經驗的符合程度;(2)指導行動的明確程度;(3)理論內容的簡單程度。在選用一個理論時,這三方面的相對權重會隨當前場景而變,
一個理論的認知功能是使用概念將蕪雜的過去經驗概括化,從而將其中穩定的基本聯系以 “定律” 等形式推廣到現在和未來,并力圖用少量定律來解釋(即推導出)大量的觀察結果,因此不再需要分別記憶或使用零散的知識。這種理論的建立和使用一般會提高系統的適應能力,一個經驗理論可以被直觀地看成一個概念網,其邊界節點對應于感知和行動,因此其間的關系被經驗所直接約束,而內部節點通過和其它節點的聯系被經驗所間接約束。在這樣一個網路中,每個概念的含義都被其在經驗中的角色所確定了,只是邊界概念的含義比較具體,而離邊界越遠的概念越抽象。由于新經驗不斷被吸收,各個概念的含義可能隨理論的發展而或多或少地演變,在通常情況下,一個基于過去經驗的理論既不能保證解釋所有觀察到的現象,也無法保證其所有預測都不可能錯(休謨、波普爾等都做過影響很大的論證),雖然盡可能多地解釋有關現象和盡可能準確地預測未來仍是絕大多數理論工作者的努力方向。
數學之所以能提供經驗科學所無法企及的確定性,是因為它與經驗 “脫鉤” 、“隔離” 了。以幾何學為例,其中 “點” 和 “線” 的概念固然是來自于經驗,但在理論內部卻僅保留了“點” 的 “位置” 屬性而舍棄了其 “面積” 等屬性,僅保留了“線” 的 “方向” 及 “分隔” 屬性而舍棄了其 “寬度” 等屬性,其結果就是我們不可能直接感知幾何學意義下的 “點” 和 “線”,但可以將某些感知結果在不同的近似程度上看作它們,而這種 “看作” 關系就將抽象的幾何概念和具體的感知結果聯系了起來,類似于在 “感知” 這個認知活動的 “輸入端” 的情形,在其“輸出端”,即 “行動” 或者說 “操作”,也有這種 “抽象和具體” 之別,比如說很多人認為 “數”(shù)的觀念源于 “數”(shǔ)的操作,而“量”(liàng)的觀念源于 “量”(liáng)的操作。和 “推”、“敲” 這些具體的軀體動作不同,“數”、“量” 是抽象的心理操作,是和前者隔了一層的,二者需要通過一個“看作” 關系聯系起來。根據皮亞杰的認知發展理論,抽象操作是在具體操作的基礎上建立的[2],
把 “甲乙丙丁” 抽象到 “ABCD”,或者將后者近似地看作前者的 “符號”,這是數學和經驗概念相互聯系的方式,也就是語義學中的 “指稱” 和 “解釋” 關系,在構建一個數學理論時,其中的抽象概念被定義和公理賦予了確定的含義,而定理則被證明和公理同真,所以一旦在特定的解釋下一個數學理論的公理被認為在一個具體領域中適用,該理論的所有定理就同時都適用。使用這種 “批發” 的結論自然比 “零售” 的效率高,再加上同一個數學理論可以在不同的解釋下應用于不同的領域,數學對經驗科學的重要貢獻就不難理解了,可以說數學的普適性源于認知主體用一組相互協調的感知運動模式處理各種經驗的可能性,
數學的這種貢獻常常被誤解,一個流行的看法是 “用的數學越復雜,理論就越好”,數學只是使一個經驗理論變得更加嚴格、精確、一致的語言和工具,而完全不能為其基本前提的正確性負責。由于數學不直接描述現實,其中每個具體結論A實際上都是 “如果B,那么A”,這里B是該理論的有關公理在這個論域上的解釋。如果這個解釋不恰當,那么結論就無效,比如說兩條河匯成了一條,這不是說1+1=2錯了,而是加法在這里不適用。回到本福特定律,如果一組選票數據不符合這個規律,那么首先應該考慮 “選票數據在單位時間內的增長量是否應該正比于存量?” 只有在這個前提得到充分辯護后,“不符合本福特定律” 才構成懷疑選票數據真實性的有效理由,當然,對那些從其它前提推出本福特定律的人,所需要進行的論證自然會不同,
前面提到的彭羅斯除了靠他的數學功力解決了重要的物理問題并思考生物化學之外,還寫過兩本書論證計算機不可能真正達到人類智能的高度,他的核心論據之一就是哥德爾不完全性定理。如果有些真理是機器不可能證明,而卻是人可以證明的,這不就說明了機器智能永遠達不到人類智能的水平了嗎?這個被不少人重復過的論據的缺陷之一就是,沒考慮到哥德爾不完全性定理的適用范圍是滿足特定條件的公理化系統。
“那廝”怎么算
和我以往的專欄文章一樣,這個討論最后還是要轉到人工智能的設計問題上來,而落地于我研發的 “納思” 系統之中。在《證實、證偽、證明、證據:何以為“證”?》中我說明了在納思的信念中沒有絕對真理或公理(“納思” 是NARS,Non-Axiomatic Reasoning System的縮寫),因為每個信念的真值都是對已有證據的度量,所以可能被新證據所修改。即使僅僅考慮這一點,哥德爾不完全性定理就已經不適用于納思了,因為這個系統不是公理化的,而且不保證傳統意義下的一致性。對納思當然仍可以從很多角度來批評,但是不能再拿哥德爾定理說事,對這一點的詳細討論見參考文獻[3]。
如果沒有任何結論是確定的,那數學怎么辦?簡而言之,就是當系統在非公理化信念的汪洋大海中漂泊時,仍可以在各種數學理論所提供的島嶼上得到短暫的穩定感,和由經驗所 “自然塑造” 的信念不同,數學中的抽象概念和操作是數學家們精心構造和共同維護的結果,和在人腦中類似,納思中的數學概念的基本含義來自于其定義,而其它的相關經驗只能影響對這個概念的直覺或聯想,但不能用于證明,一個數學命題的真假不再取決于其來自經驗的真值,而取決于它是否是某個數學理論的公理或定理,這二者都是有嚴格定義的,一個數學理論的實際應用始于將其中的抽象概念臨時對應于(“解釋” 為)某領域中的具體概念,然后對有關的結論進行相應解讀。
盡管我們在這個方向的工作仍在初步嘗試階段,納思中的下列現有功能已經為這種 “局部公理化” 提供了基礎:
高階陳述:納思可以建立和處理對陳述的陳述,如 “1+1=2 是真的”。
復合概念:納思中的概念可以構成新概念,如 “可以被2整除的數稱為偶數”。
變量詞項:某些詞項可以在不同情境中指代不同概念,如在 “如果X是偶數,則X+1是奇數” 之中的X,
臨時關系:詞項間的關系可以隨時建立或消除,如一個杯子的形狀,在只需要近似計算時可以被看成一個圓柱體,但在必須精確時則不再被看作一個圓柱體,
假設演繹:從任意給定的前提開始推理,不論該前提本身的真假。
在納思中做數學推導和傳統的定理證明系統會有很大的不同,因為納思既可以在一個數學理論內部工作(只使用其中的定義和推理規則),也可以在它的外部工作(使用與其有關的經驗),比如要證明一個定理,納思會先根據以往的經驗考慮一下大致該怎么做,而在基本想通后才嚴格地進行證明。這就和數學家的實際工作過程比較接近了。
抽象概念和具體概念之別還涉及到人工智能理論中的另一個重大問題,就是概念的含義。以往在概念層面上工作的人工智能系統往往被歸類為 “符號主義”,而把其中的概念當作指代外部事物的 “符號”,這就導致了 “系統不知道它所處理的符號的所指” 的詰難(所謂 “中文屋問題” 和 “符號接地問題” 等等),但根據前面的討論,在人腦和像納思這樣的系統中的具體概念本來就沒這個 “接地” 問題(含義本來就是根據經驗確定的),而抽象概念到具體概念的解釋也是可以在系統內部建立的,這個問題也在參考文獻[3]中有進一步討論,
總而言之,納思對抽象概念的建立和使用所遵循的基本原則和人的類似,就是把這種概念結構 “架空” 于經驗概念網之上,以避免經驗細節的煩擾,并允許它們像 “模板” 一樣被滿足條件的各種具體概念結構所 “套用”。由于這種套用本身有恰當程度(這個模板的適用條件在多大程度上被滿足了)的問題,所以不管一個數學理論多完美,也不能保證其所有實際應用及其結論都正確。
參考文獻
[1] Eugene Wigner, “The unreasonable effectiveness of mathematics in the natural sciences”, Communications on Pure and Applied Mathematics. 13: 1–14, 1960
[2] Jean Piaget, The Child’s Conception of Number, London: Routledge and Kegan Paul, 1952
[3] Pei Wang, “Three Fundamental Misconceptions of Artificial Intelligence”, Journal of Experimental & Theoretical Artificial Intelligence, 19(3): 249-268, 2007
注:本文所提到之作者其他文章,可進入公眾號底部菜單“精品專欄-AI那廝”查閱。點擊https:http://cis.temple.edu/~wangp/Chinese.html,可查閱作者所有科普文章和科普視訊。