人工智能在藥物研發(fā)中的應(yīng)用(上):AI與制藥場景如何相互“適配”?
近年來,人工智能(AI)已經(jīng)被廣泛應(yīng)用于多個行業(yè),徹底改變了 社會 生活的許多領(lǐng)域。
在制藥這一傳統(tǒng)行業(yè),AI也已經(jīng)有了諸多應(yīng)用。AI逐漸應(yīng)用于藥物發(fā)現(xiàn)的靶點發(fā)現(xiàn),虛擬篩選,化合物設(shè)計與合成,ADME-T性質(zhì)和理化性質(zhì)預(yù)測,藥物臨床試驗設(shè)計、管理、患者招募,藥物警戒應(yīng)用和真實世界證據(jù)生成等多個流程和環(huán)節(jié)。
那么,AI應(yīng)用于制藥的邏輯是什么?AI會如何改變藥物研發(fā)?如何應(yīng)對制藥行業(yè)的效率挑戰(zhàn)?本文分為上下篇,本篇重點介紹AI在制藥行業(yè)多場景中展開及面臨的挑戰(zhàn)。
制藥受困
從制藥行業(yè)的困境說起。
在過去的數(shù)十年里,許多科學(xué)、技術(shù)和管理因素都取得了巨大進(jìn)步,這有助于提高藥物研發(fā)的生產(chǎn)率(R&D)。然而,自1950年以來,每10億美元研發(fā)投入獲得批準(zhǔn)的新藥數(shù)量幾乎每9年減少一半,該趨勢在60年間非常穩(wěn)定,被稱為制藥行業(yè)的反摩爾定律(Eroom’s Law)。新藥的開發(fā)成本越來越高,藥物研發(fā)面臨著嚴(yán)重的生產(chǎn)力危機。
對于反摩爾定律主要有三種解釋,即低垂果實假設(shè)(好摘的果子被摘走了)、監(jiān)管障礙假設(shè)(新藥申報的監(jiān)管要求不斷增高)、研發(fā)模式問題。前兩種解釋都是客觀事實難以改變,那么,是否有更好的藥物研發(fā)模式?這是制藥行業(yè)一直在思考的問題。
制藥行業(yè)在遭遇生產(chǎn)力困境的同時,也面臨著數(shù)據(jù)困境。
隨著全 社會 數(shù)字化信息化的快速推進(jìn)、藥物研發(fā)設(shè)備的升級和長期的積累,可用的藥物研發(fā)數(shù)據(jù)越來越多,以至于在一定時間范圍內(nèi)無法使用常規(guī)方法和軟件工具分析和處理所有數(shù)據(jù)。傳統(tǒng)的統(tǒng)計學(xué)在浩瀚的大數(shù)據(jù)面前越來越力不從心。制藥企業(yè)正在經(jīng)歷數(shù)字化轉(zhuǎn)型,大量的數(shù)據(jù)產(chǎn)生。于是,日益增長的數(shù)據(jù)處理的需求,與現(xiàn)有數(shù)據(jù)分析能力之間的矛盾,推動制藥行業(yè)尋求新出路。
AI的橄欖枝
2016年3月,AI程序AlphaGo大勝韓國著名棋手李世石,是AI發(fā)展 歷史 上的里程碑事件。這一事件加快了AI在 社會 生活多個領(lǐng)域的 探索 和應(yīng)用,也讓制藥行業(yè)看到了提高藥物研發(fā)生產(chǎn)率的希望。2016年后,AI在制藥行業(yè)的技術(shù)測試大量開展。實驗科學(xué)不再是唯一選項,以數(shù)據(jù)為中心的藥物發(fā)現(xiàn)逐漸走上舞臺。
在隨后的幾年時間里,AI制藥逐漸 升溫,概念驗證研究持續(xù)不斷、大量的資本涌入AI驅(qū)動的生物技術(shù)初創(chuàng)公司、制藥公司與AI生物技術(shù)公司和AI技術(shù)供應(yīng)商之間的合作越來越多。一些領(lǐng)先的制藥公司的高管認(rèn)為,AI不僅僅是一個先導(dǎo)化合物發(fā)現(xiàn)的工具,而且是一個促進(jìn)生物學(xué)研究、發(fā)現(xiàn)新的生物靶點和開發(fā)新的疾病模型的更通用的工具。
AI在制藥的多場景中展開
數(shù)年間,AI已經(jīng)被嘗試應(yīng)用于藥物研發(fā)的幾乎所有流程和環(huán)節(jié),主要有以下方面:
/ / 靶點確認(rèn)
靶點確認(rèn)是藥物開發(fā)中的關(guān)鍵步驟,也是最復(fù)雜的步驟之一。目前已知的藥物靶點絕大多數(shù)為蛋白質(zhì),通過機器學(xué)習(xí)的方法,從蛋白質(zhì)原始信息中提取特征,構(gòu)建準(zhǔn)確穩(wěn)定的模型進(jìn)行功能的推斷、預(yù)測和分類,已經(jīng)成為靶點研究的重要手段。從患者的樣本中、海量的生物醫(yī)學(xué)資料中提取基因組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)等多組學(xué)數(shù)據(jù),借助深度學(xué)習(xí)來分析非疾病和疾病狀態(tài)之間的差異,也可用來發(fā)現(xiàn)對疾病有影響的蛋白質(zhì)。
/ / 基于表型的藥物發(fā)現(xiàn)
在過去的三十多年里,基于靶點的藥物發(fā)現(xiàn)都是藥物發(fā)現(xiàn)的主要方法。近年來,基于表型的藥物發(fā)現(xiàn)(直接使用生物系統(tǒng)進(jìn)行新藥篩選)受到關(guān)注。機器學(xué)習(xí)可以在表型篩選中將細(xì)胞表型與化合物作用方式聯(lián)系起來,獲得靶點、信號通路或遺傳疾病關(guān)聯(lián)的聚類。而AI強大的圖像處理能力,能夠?qū)⑸锵到y(tǒng)的所有形態(tài)特征整合,系統(tǒng)研究藥物潛在的作用方式和信號通路,擴展對于疾病的生物學(xué)認(rèn)識。
/ / 分子生成
機器學(xué)習(xí)方法可以產(chǎn)生新的小分子。AI可以通過對海量的化合物或者藥物分子的學(xué)習(xí),獲得化合物分子結(jié)構(gòu)和成藥性方面的規(guī)律,進(jìn)而根據(jù)這些規(guī)律生成很多自然界從未存在過的化合物作為候選藥物分子,有效構(gòu)建擁有一定規(guī)模且高質(zhì)量的分子庫。
/ / 化學(xué)反應(yīng)設(shè)計
AI目前正在取得進(jìn)展的化學(xué)領(lǐng)域之一是對化學(xué)反應(yīng)和合成路線進(jìn)行建模和預(yù)測。AI可以將分子結(jié)構(gòu)映射為可以由機器學(xué)習(xí)算法處理的形式,根據(jù)已知化合物的結(jié)構(gòu),形成多條合成路線,并推薦最佳合成路線。反過來,在給定反應(yīng)物的情況下,深度學(xué)習(xí)、遷移學(xué)習(xí)可以預(yù)測化學(xué)反應(yīng)結(jié)果。AI還可用來 探索 新的化學(xué)反應(yīng)。
/ / 化合物篩選
AI能夠?qū)衔锏幕瘜W(xué)結(jié)構(gòu)與生物活性之間的關(guān)系進(jìn)行建模,預(yù)測化合物的作用機制。一個典型的例子是MIT的研究人員基于深度學(xué)習(xí)發(fā)現(xiàn)了新的抗生素。研究人員訓(xùn)練了一個能夠預(yù)測具有抗菌活性的分子的深層神經(jīng)網(wǎng)絡(luò),在幾天內(nèi)篩選超過 1 億個化合物,根據(jù)模型的預(yù)測分?jǐn)?shù)對化合物進(jìn)行排名,最終確定了8種與已知抗生素在結(jié)構(gòu)上差別較大的抗生素。
/ / ADMET性質(zhì)預(yù)測
藥代動力學(xué)性質(zhì)不夠理想,是臨床研究階段藥物研發(fā)失敗的主要原因之一。深度學(xué)習(xí)可以自動識別化合物的相關(guān)特征,評估數(shù)據(jù)集中多個ADMET參數(shù)之間的隱藏的關(guān)系和趨勢,預(yù)測化合物的細(xì)胞滲透性和溶解性等性質(zhì)。
/ / 藥物臨床試驗
新藥開發(fā)中資金投入最多的階段是臨床試驗階段,AI在臨床試驗的設(shè)計、管理、患者招募方面皆有應(yīng)用潛力。自然語言處理技術(shù)可從各種結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)類型中提取信息,找到符合臨床試驗入組標(biāo)準(zhǔn)的受試者;也可用于關(guān)聯(lián)各種大型數(shù)據(jù)集,找到變量之間的潛在關(guān)系,改進(jìn)患者與試驗的匹配情況。諾華已使用機器學(xué)習(xí)算法監(jiān)控和管理所有的臨床試驗。
/ / 藥物警戒
AI將對傳統(tǒng)的藥物警戒帶來沖擊。隨著監(jiān)管要求的嚴(yán)格和患者安全意識的提高,藥物警戒的工作量和成本大大增加。AI可以將藥物不良反應(yīng)從接收到報告的整個流程實現(xiàn)自動化,優(yōu)化藥物警戒的工作并降低成本。基于AI系統(tǒng)還有可能通過預(yù)測能力展開藥物風(fēng)險評估。
/ / 真實世界研究
AI的進(jìn)步提供了分析大型多維RWD(真實世界數(shù)據(jù))的新策略。AI能夠識別真實世界數(shù)據(jù)中的內(nèi)在關(guān)聯(lián),生成新的假設(shè),也能為臨床試驗提供新的信息。最新的一個案例是,AI通過分析真實世界數(shù)據(jù),可以找出不會影響試驗的總生存期的風(fēng)險比的入組標(biāo)準(zhǔn),從而擴大臨床試驗的人群范圍。
AI在藥物研發(fā)中的應(yīng)用還包括 理化性質(zhì)預(yù)測、藥物重定向、制劑開發(fā)中的應(yīng)用 等。
問題顯現(xiàn)
AI在藥物研發(fā)中的應(yīng)用遠(yuǎn)非一帆風(fēng)順,歸結(jié)起來,是AI如何與制藥場景相互“適配”的問題。
對制藥行業(yè)來說,走AI的路,就要穿AI的鞋。AI方法對于其適用對象的相關(guān)條件有諸多要求。如同傳統(tǒng)藥物研發(fā)需要配備必要的硬件設(shè)備和必要的環(huán)境設(shè)施(如科學(xué)儀器設(shè)備、實驗室等),基于AI的藥物研發(fā)需要配備數(shù)據(jù)、算法、算力,其中對數(shù)據(jù)的要求最為嚴(yán)格。
傳統(tǒng)的藥物研發(fā)以實驗科學(xué)為主。數(shù)十年來,藥物研發(fā)數(shù)據(jù)的記錄、治理和儲存都以實驗為核心,根據(jù)實驗的需求來調(diào)整,數(shù)據(jù)是實驗的“附屬”。而AI作為虛擬科學(xué)、計算科學(xué)和數(shù)據(jù)科學(xué)范疇內(nèi)的方法,直接從數(shù)據(jù)入手,將數(shù)據(jù)放在第一位,對于數(shù)據(jù)的格式、標(biāo)準(zhǔn)、質(zhì)量、數(shù)量都有內(nèi)在的要求。在這樣的情況下,AI直接使用傳統(tǒng)藥物研發(fā)模式的數(shù)據(jù)往往遇到困難。
對AI來說,進(jìn)入制藥的主場,就應(yīng)當(dāng)遵循制藥的規(guī)律。比如,藥物的開發(fā)是一個多維同步優(yōu)化的過程,鑒于數(shù)據(jù)的規(guī)模和復(fù)雜性,基于AI的藥物研發(fā)往往需要重寫機器學(xué)習(xí)算法,而不是簡單地調(diào)用。AI與制藥這一傳統(tǒng)行業(yè)的核心業(yè)務(wù)深度融合,需更深刻的行業(yè)理解力和更高的技術(shù)準(zhǔn)確率。AI雖然已經(jīng)可以從大量已知論文、實驗數(shù)據(jù)中挖掘新的知識,改變了傳統(tǒng)基于學(xué)術(shù)經(jīng)驗的研究方式,然而方法的準(zhǔn)確性、可解釋性、可重復(fù)性等還有待提高。
此外,傳統(tǒng)的藥物研發(fā)模式已有相對健全的監(jiān)管政策、行業(yè)體系。作為一種新的模式,AI在制藥行業(yè)的應(yīng)用 探索 ,也需要相應(yīng)的行業(yè)政策和體系來規(guī)范和引導(dǎo)。
文 智藥邦 侯小龍
來源 中國食品藥品網(wǎng)