總部位于英國的人工智能公司DeepMind自開發AlphaGo以來,已經成為人工智能領域的領導者,
然而,很多人批評它在更實際的問題上沒有取得突破。
在這種背景下,DeepMind研究人員正試圖使人工智能解決更基本的重大科學問題。他們使用最新版本的AlphaFold AI引擎,似乎實現了一個雄心勃勃的目標,
大約50年來,分子生物學家一直在推測,蛋白質分子長鏈在空間中的折疊結構,是由鏈上的氨基酸種類和順序唯一決定的——可以一步一步地剪接氨基酸,獲得具有特定功能的酶,或者僅僅通過小分子的順序來預測蛋白質大分子的功能,而不需要實驗——,但這并不是一個容易解決的問題,
事實上,潛在結構的數量如此之大,以至于研究人員推測,對所有可能的分子排列進行采樣所需的時間將超過宇宙的壽命,
但如果能解決這個難題(即蛋白質折疊問題),將大大加快藥物開發和疾病建模的能力,帶來遠遠超出目前想象的效果。
因此,盡管面臨挑戰,研究人員幾十年來一直在努力尋找解決方案。
自20世紀90年代以來,一項名為CASP(蛋白質結構預測的關鍵評估)的嚴格實驗已經進行,以測試科學家設計的預測蛋白質折疊的理論體系,
現在,在CASP的第三個十年,似乎已經產生了最有希望的解決方案,——DeepMind的AlphaFold提供了一個3D蛋白質結構預測模型,精確度前所未有,
在實驗中,DeepMind為AlphaFold使用了一種新的深度學習架構,可以理解和計算3D蛋白質的“空間圖”,從而預測支持其折疊結構的分子結構。
人工智能系統使用了大約170,000個蛋白質的結構數據,并參加了今年的CASP挑戰賽(CASP14)作為培訓,得分為92.4 GDT。
該值高于普通濕實驗方法得到的閾值——90 GDT,而DeepMind表明平均預測偏差僅為1.6埃左右(約為一個原子的寬度),
歐洲分子生物學實驗室的基因組學研究員伊萬伯尼說:“當我看到這些結果時,我差點從椅子上摔下來,我知道CASP有多嚴格。基本保證了計算模型必須從零開始蛋白質折疊。看到這些模型能夠如此精確地做到這一點令人沮喪,我們有許多方面需要理解,但這確實是科學上的一大進步,”
值得注意的是,這項研究還沒有經過同行評審,也沒有在科學期刊上發表(盡管DeepMind研究人員表示很快就會發表),
即便如此,即使我們沒有看到完整的報告和詳細的結果,這一領域的專家也感到驚訝。
結構生物學家、皇家學會主席文基拉瑪克里希南(Venki Ramakrishnan)說:“這一計算代表了蛋白質折疊的驚人進步,蛋白質折疊是生物學中的一個重大問題,已有50年的歷史,”
完整的論文尚未發表,但你可以在這里查看摘要:https://predictioncenter.org/casp14/doc/CASP14_Abstracts.pdf,
https://www . science alert.com/ai-solves-50歲-生物學-大挑戰-幾十年前-專家預測
*解釋也就是說,蛋白質分子長鏈上的氨基酸與空間結構的關系,最理想的情況當然是把它變成一個物理-數學問題,從更基本的物理特性出發,轉化為數學模型,然后直接證明得到規律。就像引力可以推導出天體的軌跡一樣,
但目前還做不到這一點,所以只能寄希望于統計-數值模型,也就是我們從大量數據中找到一個規律性的東西,但是規律的本質還是不清楚的。
AlphaFold是目前最好的模型,給出的預測結果和蛋白質的直接實驗測量一樣,然后它的計算時間足夠快。
基因/癌癥隊馬上要傳送到終點線了?