隨著化學大數據和人工智能模型跨越式的發展,數據驅動的合成反應精準預測近年來引起了廣泛關注。由于合成反應構效關系高維且復雜的特性,催化劑、反應物、甚至溶劑細微的結構變化都可能引起反應活性和選擇性的顯著改變。因此,開發一種高效、可靠的AI預測模型對于合成反應的智能設計至關重要。
近日,浙江大學化學系洪鑫課題組基于有機化學中的立體與電子效應,設計了化學信息增強的分子圖模型(sterics- and electronics-embedded molecular graph, SEMG),并開發了體現反應組分協同效應的MIGNN框架,為反應活性和選擇性預測提供一個全新的通用架構SEMG-MIGNN。 該策略實現了活性和選擇性的精準預測,尤其展示了出色的外推能力,為數據驅動的合成反應預測和智能設計提供了新技術。相關研究發表在Nature Communications上(網址: https://www.nature.com/articles/s41467-023-39283-x)。
在此項工作中,針對立體位阻和電子信息設計了相應的編碼技術,從而優化了模型對化學信息的捕捉能力(圖1)。位阻信息的編碼基于課題組之前開發的球面投影技術(Synlett202132, 1837),將原子周圍的范德華表面表達為一個可視化的二維編碼圖。電子信息的編碼則通過原子周圍的電子密度采樣,以一個三維張量的形式進行編碼。針對分子圖的每個原子節點進行化學信息的編碼和嵌入,最終得到化學信息增強的分子圖SEMG。此外,為了在建模中體現反應組分對于構效關系的協同影響,該工作提出了一個新型的模型架構——分子交互圖神經網絡(Molecular Interaction Graph Neural Network, MIGNN)。此架構通過注意力機制提升模型對于局部結構的捕捉能力,并運用矩陣算法讓分子信息充分交互,從而提升模型對于多因素協同控制的學習能力。
圖1. SEMG-MIGNN的架構概覽
SEMG-MIGNN被應用于Pd催化Buchwald-Hartwig偶聯反應的產率預測以及手性磷酸催化的亞胺加成反應的對映選擇性預測(圖2)中。隨機劃分的預測結果表明,SEMG-MIGNN策略在產率和對映選擇性的預測上均展示出了良好的準確性。此外,SEMG-MIGNN模型對于訓練集中未出現的底物和催化劑表現出了優秀的外推預測能力,在大多數任務中超過了常見的反應建模手段。
圖2. SEMG-MIGNN模型的對映選擇性預測表現.
SEMG-MIGNN模型在高預測精度的同時,提供了追溯立體效應及電子效應影響的評估能力(圖3)。在Pd催化的Buchwald-Hartwig反應中,位阻信息編碼的消除對產率預測影響較小,而電子信息編碼的消除則影響較大。這表明電子效應對該反應產率起主導作用。而對于亞胺的不對稱加成反應則恰恰相反,位阻信息對立體選擇性的影響尤其顯著,這也與之前該反應的機理模型Goodman Model一致。上述結果充分體現了化學信息的針對性嵌入對于模型化學可解釋性的提升。
圖5. SEMG-MIGNN 模型的化學可解釋性
綜上所述,本研究基于立體位阻和電子效應的編碼嵌入,發展了化學信息增強的SEMG分子圖,并通過強化分子之間的信息交互,設計了MIGNN架構。SEMG-MIGNN策略表現了反應活性和選擇性的精準預測能力,且在外推預測任務中展示了優秀的表現。同時,由于立體和電子信息的明晰表達,該模型的化學可解釋性得到了提升,能夠區分立體位阻及電子效應對于構效關系的定量貢獻。該工作為數據驅動的合成反應建模預測和智能設計提供了有力的技術支持。
洪鑫研究員簡介
洪鑫,2010 年本科畢業于中國科學技術大學(導師:傅堯教授), 2014 年博士畢業于加州大學洛杉磯分校(導師:K. N. Houk 教授)。 2014-2016 年分別于加州大學洛杉磯分校(導師:K. N. Houk 教授)與 斯坦福大學(導師:Jens K. N?rskov 教授)從事博士后研究工作。2016年加入浙江大學化學系,任百人計劃研究員,2022 年晉升為長聘制副教授。作為課題組負責人長期從事合成反應機制與構效關系方向的研究工作。以基元過程的分子形變和結合作用為核心,建立了基元轉化的機理模型,明確了相關反應活性和選擇性的控制因素,并將機制認識與數據建模相融合,在合成反應的數據庫、編碼技術和預測應用上開展了一系列工作,為相關反應的理性設計提供了智能方案。自獨立工作以來以通訊和共同通訊作者身份于 Nature Chemistry, Nature Catalysis, Nature Synthesis, JACS, ACIE 等國際高水平期刊發表論文 100 余篇。曾獲 Thieme Chemistry Journals Award (2022)、國家優秀青年基金項目(2021)、首屆浙江省青年科技英才獎(2021)、 中國化學會青年化學獎(2020)與物理有機化學新人獎(2021)。現任中國化學會物理有機化學專業委員會委員、《Chemistry-An Asian Journal》、《National Science Open》與《Chemical Synthesis》青年編委。
Reaction performance prediction with an extrapolative and interpretable graph model based on chemical knowledge
Shu-Wen Li, Li-Cheng Xu, Cheng Zhang, Shuo-Qing Zhang & Xin Hong
Nat. Commun., 2023,14, 3569, DOI:https://doi.org/10.1038/s41467-023-39283-x
聲明:化學加刊發或者轉載此文只是出于傳遞、分享更多信息之目的,并不意味認同其觀點或證實其描述。若有來源標注錯誤或侵犯了您的合法權益,請作者持權屬證明與本網聯系,我們將及時更正、刪除,謝謝。 電話:18676881059,郵箱:gongjian@huaxuejia.cn