這個周末,AI圈的一件事在社交網路引起軒然大波:谷歌AI倫理團隊聯合負責人Timnit Gebru被解雇,
Timnit Gebru
而開除她的,正是大名鼎鼎的谷歌AI負責人Jeff Dean。
雙方在一篇論文的內部評審上存在著嚴重分歧,隨后Timnit Gebru的公司賬戶被切斷,
一天后Jeff Dean向谷歌員工發布郵件,表示開除Timnit Gebru。
Timnit Gebru畢業于斯坦福大學部,博士生導師是知名學者李飛飛。她的主要研究方向是算法偏差和數據挖掘,一直致力于黑人在科技圈的平權,是Black in AI的創始人之一。
Timnit Gebru最知名的研究是她在2018年發現,面部識別軟體對黑人女性有高達35%的錯誤率,而對白人男性幾乎完全正確,
幾天時間里,雙方隔空喊話,聲勢愈演愈烈,已有1400名谷歌員工和1900名AI學術圈人士對谷歌的行為表示譴責,其中不乏AI圈的大佬,
一向口碑不錯的Jeff Dean,一下子成了“眾矢之的”,
Jeff Dean
這到底是怎么回事?
時間線
12月2日 (美國當地時間,下同),Gebru發推文表示自己已經被谷歌解雇,核心矛盾是雙方在內部論文評審上的分歧。
Gebru發郵件給公司內部的Brain Women and Allies表達了沮喪的心情,該郵件內容泄露,Gebru被解雇,她對此表示出強烈的憤怒和譴責,
這個事件很快發酵,在Reddit上引發激烈的討論,評論將近一千條,
3日,Gebru公開了她發給谷歌Brain女員工和其他同事的郵件內容,原來,她一直希望發表她的一篇研究論文,但是一直遭到上級反對,
在郵件里,她還揭露了谷歌對黑人這一弱勢群體的不公平對待,以及對AI倫理的不重視,正是因為這封郵件,被爆出“不符合谷歌管理者的期望”,因而被解雇。
Jeff Dean很快就在谷歌內部發郵件回應了此事。他解釋了Gebru論文沒有被發表的原因,并說Gebru提出了一些無理要求,若不答應,她就以辭職威脅。最后,公司決定尊重她辭職的意見,
4日,Jeff Dean向公眾公開了郵件的內容,并且詳細地解釋了谷歌內部研究論文的出版方法,以回應雙方在論文評審上的分歧。
Gebru對他的回應并不買賬,立馬發出六條推文,指出他文章中漏洞和自相矛盾的地方。
5日,Gebru的谷歌上司、著名AI科學家Samy Bengio——圖靈獎得主Yoshua Begio的胞弟,在Facebook上回應此事,實名支持Gebru,并且說:“她的慷慨和不懈的行動,提高了沉默者的聲音,”
“導火索”論文公開
就在雙方為AI公平性、倫理等問題吵得不開交之時,外媒“MIT科技評論”得到了讓雙方開戰的論文原文。
論文的疑似原文也在網上公開流傳,
這篇論文的標題是“On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?”(隨機鸚鵡的危險:語言模型會太大嗎?),
近年來,科技巨頭們都在全力研究自然語言模型,谷歌自己開發的BERT就是其中之一,最近谷歌還宣布英文搜索幾乎全部用上了BERT,
Gebru的論文內容談到了谷歌BERT在AI倫理上的負面影響,因此有人認為,谷歌出于這樣的原因壓下了論文,
文章在開頭提出了一個疑問:我們是否對開發這些模型的潛在風險和減輕這些風險的戰略進行了足夠的思考?直指自然語言模型的“四大風險”:
1. 環境和經濟成本巨大
訓練大型AI模型消耗會消耗大量電力,使用NAS方法的語言模型會產生相當于284噸的二氧化碳,相當于5輛汽車在其壽命內的碳排放。
其中,谷歌訓練一次BERT模型會產生1438磅二氧化碳,幾乎等于紐約和舊金山之間的往返航班的碳排放量,
2. 海量數據與不可解釋的模型
研究人員從互聯網上收集數據,因此種族主義、性別歧視和其他辱罵性語言可能會最終出現在訓練數據中,
由于訓練數據集非常大,很難對其進行審核,檢查這些嵌入的偏差。
另外,模型很難獲取與互聯網接觸較少的群體的語言,這將導致AI生成的語言將同質化,只能反映最富裕國家和社區的做法,
3. 研究機會成本
大型語言模型實際上不理解語言,只是擅長操縱語言,但大型科技公司可以從更準確地從中賺錢,因此一直在投資它們,
而更小、更精心設計的數據集也會取得良好效果,消耗的能量也更少。
4. 語言AI可能欺騙人類
AI非常擅長模仿人類語言,因此很容易用它來愚弄人類。
研究人員舉了一個例子:2017年,Facebook將一名巴勒斯坦男子的用阿拉伯語說的“早上好”誤譯為希伯來語中的“攻擊他們”,導致他被捕。
對于論文提及的這些問題,Jeff Dean在發給員工的郵件中均有解釋,
Jeff Dean認為,Gebru的論文存在著一些漏洞,
她只提到了BERT,而沒有考慮到后來的模型提高了效率,也沒有考慮近來谷歌的研究已經解決了一些倫理問題。
Jeff Dean指出,僅近一年來,谷歌就發表了200多篇關于AI倫理的論文,Gebru的論文缺乏對谷歌這些工作的表述,
而且Gebru提交給谷歌審查論文距離截稿只剩一天時間,通常谷歌需要兩周時間審核論文。
Gebru則表示,論文兩個月前已經交給相關部門審核,但是一直沒有收到反饋,
至于開除Gebru的原因,是因為她要求谷歌提供審核人員的名單,否則她將離開谷歌,Jeff Dean認為谷歌并不能滿足她的要求,因此會尊重并接受她辭職的決定,
雙方分歧的關鍵在于,Gebru究竟算被谷歌開除還是主動離職?
Jeff Dean認為既然谷歌無法滿足Gebru提出的條件,因此Gebru自動離職。而Gebru認為,辭職應該是自己提出,而不是谷歌單方面開除,
另外,Gebru還向谷歌數百名員工發送郵件,希望他們停止DEI(多樣性、公平性、包容性)項目相關工作,這又進一步激化了雙方的矛盾。
谷歌員工質疑Jeff Dean
對于Jeff Dean的這番說辭,谷歌內部員工說:“這真是個謊言。”
谷歌AI蒙特利爾分部的研究員Nicolas Le Roux指出,過去他提交給內部審查的論文只會檢查是否泄露敏感內部資料,而不會檢查文獻評論的質量。
另一位谷歌前PR經理說:“審查這些論文是我在谷歌PR團隊工作的一部分。通常情況下,文章對我們而言太多了,所以我們沒有及時審查它們,或者直到研究人員發布后我們才知道,我們絕不懲罰沒有適當處理的人。”
現在雙方的激戰已經遠遠超出了論文的范圍,但焦點仍在論文處理的流程上,誰說的是事實,另一方就會理虧。
這一場谷歌AI的羅生門事件,只能等“子彈再飛一會兒”了。
然而罕見的是,一度在谷歌擁有“神”一樣地位的Jeff Dean,竟然在這件事中面對如此聲勢的討伐,也確實是“活久見”了。