“數據+計算”成爲醫藥行業新範式,如何應對研發到落地重重阻礙?

“長期以來,藥物研發週期長、成本高、成功率低等問題困擾着整個行業。如今,通過數據、計算與機器學習技術的不斷迭代,藥物研發團隊能夠設計出選擇性更高、活性更優的分子,從而減少篩選候選藥物所需的時間和成本,並增加藥物研發項目進入臨牀開發的成功率。這一突破性進展不僅爲藥物研發帶來了全新的思路和方法,也爲解決全球性的醫藥難題提供了堅實的支撐。”近日,在啓明創投聯合投資企業、全球計算藥物研發領軍公司薛定諤(Schrödinger,NASDAQ:SDGR)舉辦的結合物理建模與機器學習:加速結構化藥物發現研發分享會上,啓明創投主管合夥人樑頴宇指出。

當前,數據與計算的結合已滲透於製藥領域的全流程。啓明創投合夥人陳侃舉例解釋,高通量篩選等技術能夠產生大量高質量生物學和醫學數據,利用人工智能和機器學習可以解析這些數據,發現新的生物學機制和藥物靶點;計算機模擬和虛擬篩選能夠更廣泛地探索化學空間,找到最優藥物化合物;在臨牀試驗方面,去中心化試驗和數字孿生系統可以模擬並準確預測試驗結果,加速並優化以患者爲中心的臨牀試驗設計;通過大數據幫助生成真實世界的臨牀數據研究。這些“幹實驗”技術的進展,是對傳統“溼實驗”方法很好的補充,並且已經越發廣泛的得到製藥行業從業者的認可。相信在不久的將來,能夠將藥物研發從高成本、低成功率逐漸轉變爲更像科技行業的新研發範式。

此次研討會是薛定諤在中國內地舉辦的首次線下活動,旨在搭建小分子藥物研發交流社區,助力企業深入瞭解如何運用領先的計算技術來加速藥物發現。薛定諤公司由Richard Friesner和Bill Goddard於1990年創立,至今已有30多年曆史。薛定諤專注於開發和應用先進的計算方法,旨在改變科學家設計治療方法和材料的方式,其主要應用場景是化合物篩選。薛定諤的計算藥物研發平臺能夠準確預測分子的活性,並利用AI將篩選數十億個分子的時間縮短至幾天,大大提高了藥物發現的速度和成功率。2020年,薛定諤在納斯達克成功上市,成爲行業內首家計算藥物研發上市公司。

計算機驅動的藥物研發

藥物研發是一項週期長、投資高、風險大的系統工程。

作爲本次活動的特邀嘉賓,碩迪生物(NASDAQ:GPCR)化學高級副總裁雷暉博士指出,小分子藥物具有發展歷史悠久、能夠更好控制生產成本、分子相對較爲穩定等特徵。值得關注的是,同爲啓明創投的被投企業,碩迪生物的小分子藥物管線主要專注於難成藥的 GPCR 靶點,其藥物分子的設計大量利用了薛定諤的計算平臺的輔助,並已在臨牀試驗中取得積極結果。

現代小分子藥物研發中最重要的基礎手段是篩選(Screening)。要進行篩選,首先必須發現針對某種疾病指徵藥物的靶點(Target),如受體、酶、轉運蛋白或離子通道、信號蛋白、結構蛋白、微管蛋白、肌動蛋白等;其次,還需要一個小分子庫(Library),提供足夠數量的分子以進行篩選,從中找到一個或多個符合要求的苗頭化合物(Hit),經過多次結構優化得到先導化合物(Lead)和候選化合物(Candidate),再通過系統的臨牀試驗充分驗證其安全性與有效性。

因此,藥物研發是一個非常昂貴且冗長的過程。薛定諤資深首席化學家鄒葉芬博士指出,通常小分子藥物的研發週期爲10到17年。初期階段涉及設計和合成成千上萬個分子,其中大約10個分子可能會進入臨牀試驗,最終只有一個或更少的分子能夠通過臨牀試驗,成爲市場上的藥物,供公衆使用。

在傳統的小分子藥物研發過程中,面臨着兩大主要挑戰。薛定諤應用科學首席科學家胡小虎博士表示,一方面,化學空間非常龐大,如何在這個廣闊的化學空間中進行快速搜索是一個問題。另一方面,即使在早期發現了苗頭化合物,如何將其優化成具有更佳性能的分子是另一個挑戰,這是一個多參數優化的問題,即如何同時優化所有性能。

近年來,隨着大數據和計算機技術的不斷迭代,AI在藥物發現領域取得了顯著進展,爲新藥研發注入了新的活力和創新動力。通過數據挖掘、機器學習和深度學習等技術,AI可以加速藥物發現和設計過程,提高研發效率和成功率。AI還可以在藥物篩選過程中幫助識別具有潛在療效的候選藥物,從而降低研發成本和時間。

“現代科學的發展,讓數字化學成爲可能,使藥物研發從計算機輔助向計算機驅動發展。”鄒葉芬指出。

鄒葉芬進一步解釋道,在傳統制藥行業中,科學家通過分析實驗數提出假設,設計分子來驗證假設,並多次循環進行調整以達到理想的分子特徵。然而,化學家通常會合成較容易合成的分子,以最快速度驗證假設,這導致設計的化學空間受到限制。同時,在多參數的複合優化中,由於無法同時準確預測多個參數,只能逐個參數進行優化,從而導致單獨的DMTA(設計-合成-測試-分析)循環增加。每找到一個新的SAR(結構-活性關係)都需要綜合設計,這樣就增加了循環次數、成本和時間。

通過在設計和合成之間引入建模步驟,可以在分子設計完成後利用計算機綜合預測各種參數,只選擇綜合參數最優的分子進行合成和測試。這樣不僅能夠在計算機上探索更大的化學空間,還能顯著減少DMTA循環的次數和時長,同時提高成功率。

以AI爲代表的數字化手段促進了小分子藥物研發的發展。一項發表在Nature上的研究指出,AI在藥物研發中可以創造多個價值。對24家以AI爲發現戰略核心的公司的研究發現,其管線快速增長,年均增長率約爲36%。根據專利、出版物和公開聲明的時間,多個AI支持的項目在不到四年的時間內完成了整個發現和臨牀前旅程。

得益於數字化手段在製藥上的良好表現,當前醫療行業對AI應用的規模持續增長。華經產業研究院數據顯示,2021年中國AI製藥市場規模爲1.6億元,同比增長100%,預計2023年市場規模將達到4.14億元,2019-2023年複合年增長率(CAGR)爲57.41%,總體市場增速較快。

完善準確性驗證

在市場高速發展的背景下,不少藥企紛紛佈局包含機器學習、深度學習、大數據在內的AI領域。畢馬威數據指出,10大生物製藥公司在2013-2023年AI相關交易中佔比41.5%,最終推動了整個生物製藥市場的AI投資增長。在此期間,輝瑞、羅氏和阿斯利康分別以28、27和25筆交易領跑。此外,從2013年至2022年,AI交易在併購和合作交易總額中的比例達到了24%的複合年均增長率。

薛定諤高級客戶經理沈彥甫(Maurice)指出,製藥公司與軟件技術平臺的商業模式主要有三種。第一種是授權模式,製藥公司通過授權使用軟件技術平臺的工具,直接利用這些技術加速內部研發。第二種是合作模式,軟件技術平臺與製藥公司合作共享知識產權,技術平臺的科學家直接解決合作製藥公司面臨的設計挑戰。對於同時兼顧軟件與製藥的公司來說,第三種方式是軟件技術平臺會有完全自主的一些項目,獨立開展研發。

雖然計算機技術爲製藥行業帶來了廣闊的前景,但當前的發展仍面臨諸多挑戰。一方面,軟件本身還有優化的空間。

薛定諤對接技術產品經理及資深首席科學家章宇奇指出,軟件包含的篩選數據庫往往不夠大。如果篩選的數據庫量越小,找到有活性分子的概率就越低。如果將數據庫規模從幾百萬擴大到幾億、幾十億、甚至幾百億,從概率學的角度來看,找到有活性分子的數量和性質會顯著改善。另一個傳統虛擬篩選的問題是常用的打分函數往往不夠準確。在做基於結構的虛擬篩選時,通常使用一些分子對接軟件。然而,大多數分子對接軟件都是基於剛性蛋白的假設,只評估固定結構下蛋白與小分子的作用,忽視了蛋白和小分子之間的統計熱力學過程,無法準確模擬水分子或溶解作用。因此,單純依賴分子對接的打分函數往往不夠準確。

另一方面,作爲計算模擬工具,軟件預測結果不一定完全準確。因此,相關專業領域的專家必須在複雜的藥物開發過程中對這類模型進行全面驗證。

章宇奇進一步表示,可以通過計算化學的方法預測結果並與實驗室的數據進行比較,以評估模型的準確性。例如,在使用自由能擾動(FEP)方法時,先進行可行性預測。如果發現預測結果與實驗數據正相關,他們就會有信心認爲模型可以用來預測效能(potency)。

此外,章宇奇坦言,計算化學的目的絕不是取代藥物化學家,二者之間是合作關係。人工智能不應取代人類的工作,而是作爲強有力的工具。計算化學能夠幫助篩選更多的創意,通過計算方法,可以篩選出成千上萬甚至上億個分子,這些工作薛定諤都是由完善的工作流處理,科學家可以同時完成許多任務。這在很大程度上減少了昂貴的人力成本。