在所有可能的化學化合物中,估計有 10^20 到 10^60 種可能具有作為小分子藥物的潛力。對每種化合物進行實驗評估,對化學家來說將耗費過多時間。因此,近年來研究人員開始利用人工智慧來協助識別可能成為良好藥物候選物的化合物。麻省理工學院(MIT)副教授 Connor Coley 博士 '19 便是其中一位研究人員,他身兼化學工程系、電機工程與電腦科學系以及 MIT Schwarzman 運算學院的 1957 級職涯發展副教授。
他的研究橫跨化學工程與電腦科學領域,開發並部署運算模型來分析大量的潛在化學化合物、設計新化合物,並預測可能生成這些化合物的反應路徑。他表示:「這是一種非常通用的方法,可以應用於有機分子的任何應用,但我們主要考慮的應用是小分子藥物發現。」AI 與科學的交會Coley 對科學的興趣源自於家庭。
事實上,他表示,他的家庭中科學家比非科學家還多,包括他的父親(一位放射科醫師)、他的母親(在進入 MIT Sloan 管理學院之前獲得分子生物物理學與生物化學學位),以及他的祖母(一位數學教授)。Coley 在俄亥俄州都柏林讀高中時,參加了科學奧林匹亞競賽,並在 16 歲時高中畢業。
隨後他進入加州理工學院,選擇化學工程作為主修,因為這提供了一種結合他對科學和數學興趣的方式。在大學期間,他也追求對電腦科學的興趣,在一個結構生物學實驗室工作,使用 Fortran 程式語言協助解析蛋白質的晶體結構。從加州理工學院畢業後,他決定繼續深造化學工程,並於 2014 年來到 MIT 開始攻讀博士學位。
在 Klavs Jensen 和 William Green 教授的指導下,Coley 致力於優化自動化化學反應的方法。他的工作重點是結合機器學習和化學資訊學(cheminformatics)——即應用運算方法分析化學數據——來規劃可以製造新藥物分子的反應路徑。
他也致力於設計可用於自動執行這些反應的硬體。部分工作是透過 DARPA 資助的 Make-It 計畫完成的,該計畫旨在利用機器學習和數據科學來改進從簡單構建塊合成藥物和其他有用化合物的過程。Coley 說:「那是我真正進入化學資訊學、機器學習以及思考如何利用模型來理解不同化學物質如何製成以及哪些反應是可能的起點。」
Coley 在還是研究生時就開始申請教職,並在 25 歲時接受了 MIT 的聘書。對於是否在他就讀研究所的同一所學校任職,他聽到了各種贊成與反對的建議,最終他認為 MIT 的職位太具吸引力而無法拒絕。他說:「MIT 在資源和跨部門流動性方面是一個非常特殊的地方。
MIT 在支持 AI 與科學的結合方面做得非常好,這是一個充滿活力的生態系統,值得留下來。學生的素質、學生的熱情,以及令人難以置信的合作力量,絕對超越了留在同一個地方的任何潛在顧慮。」化學直覺Coley 將教職延遲了一年,在 Broad Institute 進行博士後研究,以獲得更多化學生物學和藥物發現的經驗。
在那裡,他致力於從 DNA 編碼庫中數十億個候選物中識別可能與疾病相關的突變蛋白質具有結合作用的小分子。2020 年回到 MIT 後,他建立了實驗室團隊,其使命是部署 AI 不僅用於合成具有治療潛力的現有化合物,還用於設計具有理想特性的新分子以及製造它們的新方法。
在過去幾年中,他的實驗室開發了多種運算方法來實現這些目標。Coley 表示:「我們試圖思考如何最好地將化學挑戰與潛在的運算解決方案配對。這種配對通常會激發新方法的開發。」他的實驗室開發的一個模型,名為 ShEPhERD,經過訓練可以根據潛在新藥物分子與目標蛋白質的交互作用方式,以及其三維形狀來評估它們。
這個模型現在正被製藥公司用於協助他們發現新藥。Coley 說:「我們試圖為生成模型提供更多的藥物化學直覺,讓模型了解正確的標準和考量因素。」在另一個專案中,Coley 的實驗室開發了一個名為 FlowER 的生成式 AI 模型,可用於預測結合不同化學輸入後將產生的反應產物。
在設計該模型時,研究人員融入了對基本物理原理的理解,例如質量守恆定律。他們還要求模型考慮從反應物到產物的路徑中所需中間步驟的可行性。研究人員發現,這些限制提高了模型預測的準確性。Coley 說:「思考這些中間步驟、所涉及的機制以及反應如何演變,是化學家非常自然會做的事情。
這是化學的教學方式,但模型本身並不會這樣思考。我們花了很多時間思考如何確保我們的機器學習模型植根於對反應機制的理解,就像一位專業化學家一樣。」他實驗室的學生也致力於許多與化學反應優化相關的不同領域,包括電腦輔助結構解析、實驗室自動化和最佳實驗設計。
Coley 說:「透過這些眾多不同的研究方向,我們希望推進 AI 在化學領域的前沿。」
