你相信 AI 能幫我們更快地發現更多新藥,甚至找到人都找不到的藥嗎?
不管你信不信,資本正在相信。大陸 AI 的新風口—— AI+藥物研發,正以肉眼可見的速度崛起。
動脈網數據顯示,2020 年,AI 制藥領域融資項目數量翻了一番,且當年融資總額同比增長 10 倍。其中,單一個晶泰科技在去年 9 月便拿到了 3 億多美元的融資,歷輪投資方也頗為亮眼,譬如谷歌、軟銀、晨興、中金、紅杉等,
數據來源:動脈網
要知道,其中多家明星基金可不是第一次對這個賽道下手了。
除了這些初創公司拿錢、砸錢,更大型的玩家也頻頻親自下場。大陸科技巨頭,除了投資相關公司以外,也做好了自己下場的準備。要么已經開始了正式的進軍姿態,譬如百度成立百圖生科、騰訊推出云深智藥;要么在儲備相關人才,譬如華為官網掛出的招聘藥物研發算法工程師的操作。
醫藥領域的上市公司,大陸如藥明康德、豪森藥業、先聲藥業等,也緊緊跟隨著跨國巨頭諾華、阿斯利康等的步伐,對 AI 制藥的投入逐年增加。
更微觀又直觀的感受是,“我們交叉學院的學生以前畢業時工作沒有那么好找,但現在還沒畢業就都被預訂了”,裴劍鋒(北大前沿交叉學科研究院研究員、英飛智藥創始人)告訴虎嗅,
一個新的元年似乎就此開始了。
這樣的熱烈,在上個月蘇州舉辦的大陸第一屆生物計算大會上讓人有更直觀地感受。
從議程和嘉賓看過去,可以說這是一場學界與企業的大聯歡,先進的算力、算法與包括各種組學在內的前沿生物技術,在這個會場里似乎已經實現了某一種融合,并開始要革生物醫藥研發方式的命,隨后還要再顛覆診斷和治療的思路,
作為百圖生科的董事長,李彥宏表達了對生物計算宏圖的滿滿信心:“生物計算領域有三個關鍵指標在快速增長,分別是基因組學研究帶來的數據快速增長、新藥研發過程中所積累的知識在快速增長甚至是爆發,以及新生的各類機器學習的算法在快速迭代。”
“我們希望打造一批融合生物+計算技術的藥企,利用大量的生物數據,能夠把所有的常識積累到統一的知識圖譜上去,從而把藥物發現的大海撈針變成按圖索驥,這樣就可以加快發展 first-in-class 的創新藥物為人類的生命健康帶來福祉,”
而在由此而生的龐雜且無序的數據海洋中,作為橋梁的 AI 理所當然地被寄予了厚望。
尤其是深度學習,“從數據分析的角度和科學模型的角度,能給我們帶來新的機會”,大陸科學院院士鄂維南院士也同樣看好。
在這兩天的狂熱氛圍中,我有幸聽到了不少學者與企業家的分享,亦無比激動于他們在做的一項項通過計算更精準度量生命的研究和探索。
但素以傳統保守長周期聞名的制藥行業與完全憑數據驅動、跑得飛快的人工智能行業,到底能碰撞出的是火花,還是泡沫?
靠人猜,不如靠 AI
我們需要承認的是,AI 的確已在制藥領域展露了一些頭角。
譬如疫情期間被美國 FDA 授予治療covid19肺炎重癥患者緊急使用權的巴瑞替尼,這款老抗風濕藥的新療效便是由 AI 預判的,
更進一步的是,今年年初,頗受大藥企歡迎的AI+藥物研發公司 Insilico 宣布,自己在純 AI 驅動下,找到了一個全新的特發性纖維化疾病新靶點,以及能打開這把鎖的鑰匙——一個新的針對該靶點的化合物。
僅用 18 個月、180 萬美元,完全靠 AI,新靶點、新藥物,每一個關鍵詞似乎都在刺激著醫藥研發從業者的興奮點,
畢竟,眼下全球新藥研發都面臨著效率不斷下降的窘境,
此前,Nature 上的一篇論文就已經指出,自 1950 年以來,每 10 億美元能換來的新藥批準數量大約每 9 年會減少一半,按通貨膨脹調整后,這 10 億美元的價值下降了約 80 倍。
拆開來看,一方面,一款新藥研發的成本正在不斷上探。
過往,我們就常聽到新藥研發“10 年 10 億美元”的傳說,雖然這樣的時間和金錢成本已然十分不菲,但眼下的實際開銷仍一路水漲船高。
塔夫茨藥物研發中心對三十年來的新藥研發統計后發現,目前開發一個上市新藥的直接現金支出為 13.95 億美元,間接時間成本為 11.63 億美元,還有被批準后的后續研發費用 3.12 億美元,這樣開發一個新藥總價高達 28.70 億美元,
當然,大陸目前有很多 fast-follow 及 me-better 的新藥項目,相對而言能節約不少,可但凡要做國際多中心臨床試驗,又或者試圖靠自己找新的靶點,所耗費的時間和金錢也并不會少到哪去。
另一方面,不斷上漲的成本卻并沒有換來更高的成功率,如下圖所示,每 10 億美元能產生的新藥數量從上世紀 60 年代開始便幾乎在不斷走低,
圖源:百度自然語言處理部總監、螺旋槳 PaddleHelix 生物計算平臺負責人何徑舟演講
在對 2011 年~2020 年十年間 1779 家藥企的 9704 個藥物臨床項目進行研究后,生物技術行業組織 BIO 發現,這些藥物從進入臨床 I 期到獲得美國 FDA 批準上市的成功率平均只有 7.9%,其中腫瘤藥物的成功率只有 5.3%,而一款藥物的成功平均耗時 10.5 年。
也正因如此,藥企的回報率也在不斷下降。據德勤統計,16 家全球巨頭藥企的研發回報率已從 2010 年的 10.1%,下降到了 2016 年的 3.7%,
就算大陸的創新藥走到這一步還有點距離,但這換誰能不焦慮呢?
不僅如此,在同一靶點、差不多適應癥上的內卷,還會讓已經成功上市產品的藥企面對極大的商業化壓力,巨頭尚且如此,譬如同屬 PD-1 的 BMS 的 O 藥和默沙東的 K 藥,都在市場里擠破頭,小公司又該如何自處?
當然,新藥研發進入瓶頸的原因很復雜,我們今天就只談談藥企遇到的困難,
從流程上來看,如今一款新藥的誕生要經歷藥物發現(此處我們將靶點驗證合并到這一階段)、臨床前研究、臨床試驗、監管審批與上市后監測四大階段。
虎嗅根據塔夫茨研究數據整理
其中,藥物發現是最基礎也最重要的一步,從研究和靶點驗證、靶點藥理學和生物標志開發,再到先導化合物發現、先導化合物優化,從而找到可以解決某一疾病的有效化合物。
但正如鄂維南介紹,眼下生物設計是非常經驗化的學科,
簡單來講,從事藥物研發的科學家們憑著前輩學者們的研究,再加上自己多年積累下的經驗,來推測哪些靶點和化合物可能可行,再通過一次次的實驗——從分子到細胞、動物,再到人體身上——來驗證其吸收、代謝、有效性及毒性,
用恒瑞醫藥高級副總經理兼全球研發總裁張連山的話來說便是,“過去我們都是從猜做藥”。
“后來有了計算機輔助,能做的靶點做了非常多,但到今天,太復雜了,一個新的靶點都找不到”,做藥物研發近三十年的他也不由感慨,
的確,隨著我們用更多更精細地方式挖掘人體,所得到的數據量,包括基因組學、蛋白質組學、單細胞組學,無論從復雜程度還是數量來說都愈發“失控”。“診療必須基于海量數據和多參數的表征,這樣一個時代已經來臨”,大陸科學院院士譚蔚泓斷言。
而維數災難之下,如何從中找到規律,是矗立在科學家面前又一個頗具難度的挑戰。
尤其在過往的工具漸漸失效的當下,大家的一個設想是,用人類的智慧訓練AI來猜,或許能成為提效降本的不錯方式。
能猜什么?
那么問題來了,在藥物研發的四大階段中,AI 有哪些發揮空間?
對此,和玉資本合伙管理人曾玉給財新的答案是,在化合物篩選、全新靶點發現、臨床試驗中病人的篩選,以及臨床試驗設計和數據采集分析等領域,AI 均有用武之地。
目前來看,大陸 AI 制藥公司的業務大多集中在藥物發現領域,主要功能就是幫助研究者們篩選/設計、優化化合物,譬如晶泰科技、深度智耀、星亢原等。
究其原因,一方面是由于這是新藥研發的需求所在。“新藥的核心痛點本就是要有新結構,沒有新結構后面都是空中樓閣”,裴劍鋒告訴虎嗅。
另一方面,過去幾十年全球制藥企業發現的化合物數據量已較為可觀,一定程度上,能喂養出更聰明的 AI 。
如前文所述,傳統的藥物發現是從猜到一次次實驗的驗證。理論上來講,藥企確定靶點后,AI 的預測能力可以幫助他們直接找到那些可能有效的藥物分子,而這樣的預測過程又完全在虛擬中進行,從而避免一些本不必要的實驗。
譬如,根據前文所述塔夫茨總結的數據,藥企們要從 5000~10000 個活性化合物(Hit Compound)中,篩選出約 250 個先導化合物,簡單來講,每一個被踢出隊列的化合物背后,都意味著一輪重復的實驗。
而如果人類能夠把所有已知的對該靶點有效及無效的化合物都讓 AI 知道,AI 便可從中分析這些化合物成功或失敗的規律,從而判斷一個分子能否脫穎而出,包括那些可能被人類經驗忽略的化合物,AI 甚至還能夠對這些分子結構的選擇性、ADMET(藥物的吸收、分配、代謝、排泄和毒性)等性質做出預測。
人力研發的經年累月,到 AI 這兒可能最終只需要幾個月,如果順利,別說從幾千個化合物中找到一個,做到“萬里挑一”也不是不可能。
如今,國外投入 AI 制藥的公司們,無論巨頭還是初創,在這一階段中已取得了一些實質性的進展,
譬如 BMS 曾經宣布,其部署的 AI 經過訓練后,對藥物與靶點間的作用關系預測準確度提高到了 95%,較傳統方法失敗率降低六倍,這項測驗關乎藥物的毒副作用,AI 的確能幫助企業篩選淘汰那些潛在有毒藥物,轉而把注意力投向那些可能通過人體試驗的藥物,讓注定失敗的趁早失敗,
更有一批 AI 制藥初創公司陸續公開宣布,他們已經進入臨床的幾款藥物完全依靠 AI 發現與設計。
如 AI 制藥創業公司 Exscientia,去年便拿下了第一款由 AI 發現并進入臨床的新藥,該藥的目標適應癥為強迫癥,據該公司介紹,在此之前,他們只用 12 個月就完成了從篩選到完成臨床前研究的過程,今年4月,該公司由 AI 設計的腫瘤免疫分子將進入人體臨床試驗,
英國的 BenevolentAI 也在去年 2 月將一款由 AI 發現設計的藥物推進臨床,測試其對治療特應性皮炎(也就是濕疹)的治療效果。
遺憾的是,大陸的 AI 藥神還沒有實現走進臨床這一步的突破,但這也不意味著,大陸的企業沒有其他的路子,
眼下最受資本關注的創業公司晶泰科技,及其孵化的劑泰醫藥,就在藥物發現之外,走出了另一條不那么主流的路——稍稍將關口后移到臨床前研究階段,探索以 AI 服務于晶型和劑型的研究的方式。
要知道,即便是一個非常優秀的化合物,其最終能否成藥、藥物是否穩定、藥效如何、患者吸收情況等,全部依賴于其化合物分子的排列方式,也就是晶型,簡單來說,若晶型過于穩定,如同鉆石一樣,則患者難以吸收,甚至根本不能吸收;若晶型不穩定,就好比石墨,放著放著自己就可能變質了,
同時,對于一款新藥來說,晶型專利也是其專利的一部分,也能對其價值加一道保障,
而過往這一步,同樣需要人工一點點實驗試錯,X 線衍射、磁共振、熱分析……不管藥企用哪種方法,燒的都是大量的時間和金錢,
根據晶泰科技的官方介紹,該公司對藥物晶型的預測,是通過量子化學計算與 AI 結合的方式來計算分子之間的作用力來判斷不同晶型間的理化性質,有業內人士告訴虎嗅,這樣一來,晶泰可以在沒有很多數據積累的基礎上完成對算法的訓練,
晶型過后,劑型又是一道關卡。尤其對于靶向藥來說,若要更好地將藥物遞送到靶點,制劑也起到至關重要的作用,
據劑泰醫藥創始人兼 CEO 賴才達介紹,眼下有40% 在研藥物由于藥物遞送難點而放棄開發,大陸的復雜制劑又嚴重依賴進口,制劑的差異化或許將成為未來創新藥的新突破口,
不過,就算一款新的化合物成藥表現再出色,也只是一個單兵罷了;如果能找到全新的靶點,就可能帶來一個嶄新的藥物軍團。
顯然,靶點發現是最值錢的,不然大陸科技巨頭怎么都對之虎視眈眈,騰訊的云深智藥要做,百度的百圖生科也要做,
然而,靶點發現的難度也是顯而易見的,過去幾十年間,被科學家們發現的靶點不少,但驗證有效的數量并不多,不然也不會出現 PD-1 的嚴重內卷,
眼下,有且只有一個公司宣稱自己已經做到了,就是前文提到的 Insilico。值得注意的是,Insilico 發現的全新特發性纖維化疾病新靶點及相應的藥物,也不過剛剛走到臨床前研究這一步,到底能否成功,還需不少時間觀望,
總而言之,我們可以看到,在新藥研發的前期階段,AI 的確是起到了一些作用。可畢竟尚無一款真正走過人體試驗到審批上市的 AI 新藥出現,所有的好與壞,都沒有辦法得到確定性的結論。
冰火兩重天
這也就意味著,沒人能知道 AI 到底能否給藥企帶來提效降本的真正收益。
同時,“目前來說,這些進入臨床的,或者在報臨床批件的(AI 制藥公司),只說我是全用 AI 做的,但并沒有披露技術細節”,裴劍鋒對當前一些進展的質疑,也代表了不少人的看法。
也正因如此,即便自 2020 年以來,我們經常聽到某某藥企與某某 AI 制藥平臺達成了合作,但除了當初拜耳看中 Exscientia,大手一揮就與后者簽訂了為期 3 年、總價值近3億美元的合約外,我們鮮少聽到作為服務方的初創企業到底能拿到多少錢。
在八點健聞的報道中,一筆 200 萬元的訂單在業內已是高價,絕大多數AI制藥企業一年接到的訂單也屈指可數,
藥企的觀望態度并不難理解。畢竟,AI 技術雖已迭代良久,但仍然“涉世未深”,
一方面,AI 成長所需的數據量十分龐大,而它在醫藥研發領域顯然很難得到足夠的養料,對藥企來說,化合物結構、晶型等研發數據是他們的立身之本,如非發表論文、提交專利所必須的部分,要他們公開幾乎是不可能的,即便他們與一些 AI 制藥公司處于合作之中。
大陸在數據方面相對的確更為開放,但值得注意的是,大陸的新藥研發真正起步也不過不到 10 年,數據的量級無法與歐美國家同日而語,
也就是說,AI 制藥公司能用到的基本都是公開數據,來源包括文獻、藥品專利庫等。
但公開數據由于來源不同,質量無法保證,挖掘和標注的難度就不小,譬如我們想預測“毒性”,但針對不同適應癥的不同藥物,毒性本身就沒有固定標準,我們又該如何讓 AI 把握我們都不好總結的東西呢?
同時,公開數據在維度上也難免有所缺失,
以裴劍鋒向虎嗅介紹的“負數據(Negative Data,即測試結果不理想的化合物等數據)”為例,“藥物研發里面特別有用的數據就是負數據,負數據再少,也非常有用,就跟做題目一樣,只有知道你錯哪兒了,之后正確的幾率就能更大一些”,
“而這些負數據我們很難從文獻中找到,因為藥企不會發表,甚至有些企業做完就扔掉了,”
另外,上述說的還是存貨最多的小分子化合物數據,靶點、基因組學、蛋白質組學等的數據,更是少之又少、哪里都缺,
這就等于,把 AI 放在人類經驗的子集之中,卻希望 AI 能猜到跳出人類經驗范圍的東西,簡直像天方夜譚,
另一方面,研究 AI 和新藥的人如何融合,對 AI 制藥公司來說也是個不小的挑戰,“雙方不打起來就是非常成功的第一步”,一位業內人士告訴虎嗅,兩種截然不同的思維間的碰撞激烈程度可見一斑。
大陸的計算和制藥交叉人才又極少,用裴劍鋒的話來說就是“工業界突然火爆,但學術界還沒準備好”。
再加上眼下 AI 制藥公司一邊大把燒錢、一邊難以賺錢的現狀,直讓人覺得,橫亙在理想與現實之間的不啻于天塹,
但裴劍鋒建議大家不要太樂觀的同時,也不必太過悲觀。“這畢竟不像 AI+醫療影像,或者自動駕駛,對準確性的要求特別高。新藥研發的成功率本來已經很低了,如果 AI 能把 1%,提到2%、3%,就已經是發揮作用了。長線來看,如果經過 10 年的驗證,藥真的能做出來了,的確這 10 年內研發的周期和成本并沒有被壓縮,可就像一條汽車流水線一樣,我生產第一輛汽車可能要用 10 小時,但流水線跑通后,剩下的汽車不可能再等 10 個小時出一輛。”
換言之,我們何必期待和大肆宣揚 AI 給醫藥行業帶來完全的顛覆呢?將其當做一個輔助工具,能實際解決哪怕一個小細節的問題,現階段來講就已經足夠了,