2021年5月7日,浙江大學藥學院侯廷軍教授團隊在Journal of Medicinal Chemistry上在線報道了他們最新的研究成果-“多任務圖注意力框架(Multi-task Graph Attention framework,MGA)”(圖1),用于化合物毒性預測。研究團隊發展的新型AI算法,通過同時學習大量毒性任務,提升了毒性模型的預測精度,并能夠幫助揭示化合物結構與化合物毒性之間的關系。
藥物的發現和開發是一個周期長、投資高、風險高的過程,而安全性是阻礙潛在候選藥物進入市場的主要因素。研究表明,藥物安全性導致藥物開發失敗率為30%,甚至使一些已上市的藥物退出市場。因此,在藥物開發的早期階段確定藥物毒性和不良的藥物相互作用是非常重要的。盡管已經開發了一些體內和體外方法來探索藥物毒性和藥物-藥物相互作用,但是這些方法仍然是耗時較長且昂貴的。而通過計算模型進行毒性預測,由于其綠色、快速、廉價和準確的優點已得到了更廣泛的應用。
近年來,基于機器學習的毒性預測研究取得了很大的進步,但仍然面臨著兩個主要的挑戰,一是部分毒性數據集的質量不高,規模不大;二是難以揭示化合物結構同毒性之間的關系。針對以上挑戰,浙江大學侯廷軍教授團隊、中南大學曹東升教授團隊和騰訊量子實驗室謝昌諭博士合作開發了多任務圖注意力框架(Multi-task Graph Attention framework,MGA),用以從大量的毒性數據中挖掘毒性信息,并構建更精準的毒性預測模型。
圖1.(A)MGA框架。(B)MGA用于毒性預測實例。
MGA多任務圖注意框架是一種可以同時學習回歸和分類毒性任務的多任務圖神經網絡框架,按功能分為四個部分:輸入、深度毒性提取器DTE、毒性指紋生成器DFT-G和毒性預測器TP。MGA的輸入是由原子表征和化學鍵表征組成的分子圖。DTE由兩個圖神經網絡層組成,可以從分子碎片中提取通用的毒性表征。DFP-G可以為不同的毒性任務分配不同的分子碎片權重,然后根據特定的毒性任務從通用毒性表征生成定制化的毒性指紋。最后,TP根據定制化的毒性指紋預測相應的化學毒性。
MGA在31個毒性任務中表現出了優異的預測精度。此外,MGA能夠通過DTE來提取通用毒性特征,并通過TFP-G生成定制化毒性指紋,同時通過分析TFP-G中各注意力層的相似性能揭示不同毒性任務間的相關性。TFP-G中的注意力層能夠賦予環狀分子碎片不同權重,而容易導致毒性的環狀分子碎片則表現出了更高的權重。
該論文第一作者是浙江大學博士研究生吳振興,浙江大學侯廷軍教授為最后通訊作者,中南大學曹東升教授和騰訊量子實驗室謝昌諭博士為共同通訊作者。
論文鏈接:https://pubs.acs.org/doi/pdf/10.1021/acs.jmedchem.1c00421
參考資料:http://www.cps.zju.edu.cn/2021/0531/c26506a2381199/page.htm
聲明:化學加刊發或者轉載此文只是出于傳遞、分享更多信息之目的,并不意味認同其觀點或證實其描述。若有來源標注錯誤或侵犯了您的合法權益,請作者持權屬證明與本網聯系,我們將及時更正、刪除,謝謝。 電話:18676881059,郵箱:gongjian@huaxuejia.cn