目前,AI在新藥研發(fā)的多個細分領域已經有了非常廣泛的應用,如靶點篩選,分子設計,活性預測等。早在50年前,在藥物分子的合成領域,諾貝爾獎得主E.J.Corey就開始嘗試用計算機技術輔助進行逆合成路線設計,但受限于當時的軟硬件條件,并沒有取得廣泛的應用。
近年來,多個AI輔助逆合成產品被研發(fā)出來,并逐漸被應用于制藥領域。但迄今為止,尚未有公開的測試報道將AI的路線設計能力與有經驗的人類化學家進行對比分析。
近期,智化科技研發(fā)的ChemAIRS逆合成系統(tǒng)與上海已錸生物科技的化學家進行了一場人機對比測評,從合成難度、合成思路、合成步驟數、路線合理性等角度對結果進行綜合評定,對ChemAIRS合成路線設計與人工合成設計的案例進行全面分析。
人機測評展示
這次測評選取22個有機分子(不含手性),分子合成難度接近藥物化學家實際工作中遇到的分子復雜度,路線合成總步數從8步到14步不等。由16名平均具備10年合成經驗的化學家來完成人工的路線設計,且設計過程可借助其他查詢工具以及參考資料。
與此同時,ChemAIRS也對這22個分子進行批量路線設計,并從每個分子的路線結果中選出2條路線作測評打分。打分規(guī)則參考了合成思路合理性,合成步驟數,路線反應可行性等指標,打分時對化學家設計的路線和機器路線進行混淆,以保證評分的公平性。
合成路線設計速度對比
基于設計合成路線的速度評定結果,化學家設計合成路線所花費時間都在2小時以內,平均時間為1.5小時左右,AI計算路線平均總時間為8.7分鐘,第一條路線找到的時間平均為2分鐘,AI會給出多條路線,并能夠按照合成路線難易和總步數排序。從路線設計速度上AI算法接近化學家的10倍。
合成路線的可行性打分對比
由6名資深化學家評委對22個分子的化學家/AI合成路線進行評分。可行的路線應該在6分以上,最高10分。化學家得分和AI得分的對比顯示,在10個例子中,AI路線的分數與化學家的分數比較接近(差距在0.5分以內)。在7個例子中,化學家平均分數較高,在5個例子中AI設計的路線平均分數較高。整體在68%的例子中,AI與化學家相比做到了持平或更好。
合成路線的多樣性對比
測試團隊也統(tǒng)計了AI路線的不同合成策略數量,設計不同策略的合成路線對化學家來說難度較大。但在實際工作中,經常會出現(xiàn)由于某關鍵步驟的失敗而需要改變合成策略的情況。在本次測評中,AI在數分鐘內給到了5-20條不等的路線。可以從下圖看到,在這些路線中,每個分子平均能有2-6種不同的合成策略,包含不同的關鍵步驟和關鍵中間體,幫助化學家快速找到成功率更高的方法和最經濟易得的起始物料。
測試團隊從22個測試分子選取了3個分子作為展示,驗證AI算法合成路線可行性與化學家相近甚至更優(yōu)。以TM1為例,在構建咪唑環(huán)的反應中,化學家在第六步用原甲酸三乙酯先構建咪唑環(huán),進而對咪唑環(huán)先后碘化和偶聯(lián)反應。在AI合成路線中,則是在第五步中使用芳香醛與二氨基底物直接一步實現(xiàn)芳基取代的咪唑環(huán)的構建,AI路線的合成步驟更加的簡短高效。
在TM2的合成中,兩條路線均有咪唑環(huán)構建的關鍵步驟。在化學家的路線中,第二步和第三步先后實現(xiàn)咪唑環(huán)構建和后續(xù)的溴代,相比之下, AI合成路線則在第二步就采用了更加簡短高效的方法一步實現(xiàn)了碘取代的咪唑環(huán)的構建。除此之外,兩條路線在整體上除了合成關鍵中間體的次序有差異外,可行性和策略都較為一致。
在TM3中,有一個七元氧環(huán)需要構建,化學家先通過傅克反應并在后續(xù)的官能團轉化得到七元氧環(huán),但是第二步的傅克反應可能會存在位點選擇性問題,這樣勢必會對后續(xù)的分離和鑒定造成影響;而在AI合成路線中,則是在第四步完成雙醇化合物的合成,并在第五步通過Mitsunobo反應完成七元氧環(huán)的構建,并且不存在選擇性問題,且其他合成步驟也不存在可行性問題。AI路線評分優(yōu)于人工合成路線。
人機測評結論
從對路線設計速度,可行性和多樣性測評結果可以看出,當前ChemAIRS的路線設計能力非常接近于10年合成經驗的化學家,而設計速度和策略多樣性方面則超過了有經驗的化學家,且將路線設計的速度提升10倍左右,在68%的情況下能夠更快的設計出類似或者更好的路線,并使23%的路線質量得到提升。同時算法還能夠給出化學家2-6種不同的合成策略做參考,為找到更好,更經濟的路線提供設計思路,解決困難目標分子的合成問題。
以ChemAIRS為代表的逆合成系統(tǒng)并不能替代化學家,特別是針對某些比較新穎的結構,AI還不能代替化學家去進行創(chuàng)新性的思考。但它作為化學家設計路線的重要工具,可實現(xiàn)增強人類智能的目的,就像汽車讓人更快一樣。相信化學家將能夠在這類工具的幫助下能夠更高效,更輕松的設計出更好,更經濟環(huán)保的合成路線。
注:由于本次內部測評的分子數量有限,結果并不具備統(tǒng)計意義,期待未來能夠針對此領域進行更深入全面的測試研究。
點擊閱讀原文或識別二維碼可參與測試ChemAIRS逆合成系統(tǒng)(活動時間:2022/5/1-2022/7/31)。
聲明:化學加刊發(fā)或者轉載此文只是出于傳遞、分享更多信息之目的,并不意味認同其觀點或證實其描述。若有來源標注錯誤或侵犯了您的合法權益,請作者持權屬證明與本網聯(lián)系,我們將及時更正、刪除,謝謝。 電話:18676881059,郵箱:gongjian@huaxuejia.cn