一、你有被化學結構命名難倒過嗎?
“命名難、難命名、命難名!”是許多醫藥、化學科研工作者的一塊心病,特別是面對一些復雜的化學結構式,如何能夠準確、高效地命名是很大的難題。
市面上已有一些軟件能夠實現化學結構的英文命名,比如ChemDraw、ChemDoodle、MarvinSketch。可是ChemDraw訂閱需要高額的費用,同時軟件銷售商也打擊該軟件的盜版。ChemDoodle無論是網頁端還是客戶端都需要收費,在試用條件下,諸如結構式命名等功能無法使用。ChemAxon旗下的MarvinSketch由于秘鑰申請和安裝比較復雜,也降低了使用方便性。
▲免費的InDraw照顧國內科研工作者
并且,這些軟件均由國外開發商開發,從軟件的用戶界面到化學結構式命名均是英文,給國內用戶造成了很大不便。在化學結構式命名這塊,國內市場可以說長期處在空白狀態。對國內用戶而言,很長時間內沒有一款能對化學結構進行IUPAC中英文命名的軟件。
InDraw的出現實現了IUPAC中文命名功能,其命名系統是直接基于化學結構給出英文和中文的名稱。中文命名非基于翻譯,可以說是全球首創。在世界范圍內,還沒有一款科研軟件能做到基于化學結構生成中文名稱。
二、不簡單的IUPAC中文命名
對于復雜結構的中文命名,很早就有人想到先用ChemDraw等軟件生成化學結構的IUPAC英文名稱,然后再利用Google翻譯將其轉化成中文名稱。
這種做法得到的中文命名正確率很低。通過翻譯得到的結果經常會中、英文摻雜在一起,需要人工修改。不僅費時費力,而且又極容易出錯,導致中文名稱不能再還原成正確的結構式,在中文專利知識產權保護上,可能會面臨專利無效的風險。
▲常見化合物的英文名稱與Google翻譯的中文名稱
IUPAC英文命名系統和IUPAC中文命名系統有諸多差異。翻譯軟件只能生搬硬套地對應,無法應付中文命名中很多約定俗成的命名方式。
比如酚類是中文特有的命名方式,在結構式的中文命名中,我們將連接在芳環上的羥基命名為“酚”,以“benzene-1,2,4-triol”為例,對應的中文命名為“苯-1,2,4-三酚”,如果直接將其英文名稱用Google翻譯,則會得到“苯-1,2,4-三醇”,這顯然是錯誤的。
▲如果直接做英文轉中文的翻譯,是不正確的
這樣的例子還有很多,IUPAC英文的命名順序和中文命名也不一樣,直接翻譯也是不準確的。就拿酯類物質而言,酯命名時,其中英文的順序是不同的。例如,中文“丙二酸乙基甲基酯”對應于英文“ethyl methyl malonate”,如果拿英文直接翻譯成中文,則會得到 “乙基甲基丙二酸”,打亂了順序。
▲IUPAC英文的命名順序和中文命名不一樣
如果就這樣對化合物名稱進行草率地翻譯,會埋下隱患。如果在做學術過程中,論文結構名稱出現錯誤,會大大影響到你的學術可信度。在申請專利時,如果中文專利的結構式名稱不規范,則不利于專利審核與保護。很可能你所保護的分子結構,因為命名問題被別人鉆了空子,造成損失。
科學出版社出版的《有機化合物命名原則2017》是目前有機化學結構中文命名的權威參考。中文命名和IUPAC英文名稱有著極大差異,比如中文有機化合物名稱中組合各結構構成名稱時,需要采用各種連綴字來表達它們之間的相互關系,這與英文中以變換字母,尤其是元音即可表達構詞的方法是不同的。
InDraw的中文命名系統則是參考了這本書,其最底層的命名邏輯更契合中文的命名方式,所得到的中文名稱則更加準確。同時InDraw的英文命名,也參考了權威的IUPAC 1993版、IUPAC 2013版,此外InDraw還參考了無機物1980版的命名原則,命名范圍更廣。
▲InDraw的中英文命名系統參考權威的命名書籍
▲相比谷歌翻譯,用InDraw直接生成化合物的中文名稱是靠譜的選擇
三、InDraw的命名功能到底強在哪里?
InDraw與其他命名軟件到底有何異同?由于ChemDraw、ChemDoodle、MarvinSketch只能進行IUPAC英文命名,無法進行中文命名,筆者將其命名結果用Google翻譯轉化成中文做中文名稱的參考。
首先來測試一下很多人在生活工作中必不可少的咖啡因分子,咖啡因是嘌呤類的物質,常被命名為 “1,3,7-三甲基黃嘌呤”,在相關的CAS號查詢平臺和百科上都可以見到這個命名。這樣命名的單體其實就是黃嘌呤了,然后再對三個甲基進行定位,簡潔清楚。PubChem平臺給出的IUPAC英文命名是“1,3,7-trimethylpurine-2,6-dione”,將單體又細分為嘌呤了。ChemDraw、ChemDoodle、MarvinSketch、InDraw的命名單體也圍繞著嘌呤來,前兩者的命名結果是完全一樣的。
▲多種軟件對咖啡因的命名結果比較
MarvinSketch的命名結果則稍微復雜一點,定位更多,有意思的一點是,將其命名結果導入ChemDraw和ChemDoodle的Name to Structure功能,前者無法顯示。說明兩者的命名邏輯是不一樣的,也未能很好的兼容。
InDraw對于咖啡因的命名方式類似MarvinSketch,只不過氫取代基的定位略有不同,MavrinSketch是“2,3,6,7”,而InDraw的定位是“1,2,3,6”。雜環一般是采用并環法命名,編號順序是順時針,而嘌呤是個例外,先逆時針定位完嘧啶環再定位咪唑環,從命名結果上看,InDraw給出的中文命名其更加符合《有機化合物命名原則 2017》的命名順序。導入InDraw命名的英文名稱,另外三款軟件均能顯示出正確的咖啡因結構式。
▲InDraw的中文命名更符合《有機化合物命名原則 2017》
當化學結構的復雜度提升時,InDraw的命名系統也能輕松勝任,能夠命名ChemDraw無法命名的物質。
▲InDraw的命名系統具備更廣泛的命名支持
如果將結構的復雜度提升,換成健康殺手膽固醇呢?膽固醇是甾體類化合物,甾體結構在自然界中大量存在,是比較典型的四環化合物,從事天然產物化學的研究者可能經常與甾體結構打交道。比較簡單的命名方式就是以甾體母核進行命名,比如在膽甾的基礎上增加取代基。
▲膽固醇的命名結果比較
可以看到當化學結構復雜度提升時,這幾款命名軟件給出的英文命名不盡相同。ChemDraw、MarvinSketch的命名邏輯基本相似,所選取的命名單體是一樣的,這也與PubChem數據庫查詢的IUPAC英文命名方式基本相似。
由于MarvinSketch有著兩套命名系統,能同時給出結構式的俗名和IUPAC英文名,MarvinSketch也提供了“Cholesterol”,這個命名的選項。ChemDoodle似乎在這方面做的不夠好,并沒有選取環戊環和菲環作為環的命名單元。而InDraw的命名類似半俗名,直接以膽甾為命名單體,與CAS查詢得到的命名邏輯一致。
再觀察Google的翻譯結果,顯然就和中文命名方式有很大的差別,比如環單元命名這塊,按照中文的命名邏輯應該為“環戊并菲”,而Google翻譯的結果是“環戊二烯菲”,這也說明了直接翻譯IUPAC英文名稱的方式不可取。
InDraw對甾體化合物的命名做了專門的優化,比如可以直接以膽甾、雌甾、雄甾、孕甾為命名單元進行命名,能夠使天然產物的命名更為簡潔。
▲InDraw命名系統支持甾體類化合物的簡潔命名
比如這五種甾體結構,InDraw可以很好地識別其甾體母核,給出的命名類似我們用的半俗名,非常簡潔,而ChemDraw未能識別。
倘若再將物質范圍擴大、用普通有機物、螺環、橋環、氨基酸、甾體以及無機物來考驗這四款軟件,它們的命名表現又將如何?
▲以這幾類化學結構為例,來對InDraw、ChemDraw、ChemDoodle和MarvinSketch進行對比測試
基本有機物命名的對比測試
螺環有機物命名的對比測試
橋環有機物命名的對比測試
氨基酸命名的對比測試
甾體命名的對比測試
無機物命名的對比測試
總體體驗下來,這四款軟件差異還是很明顯的。在基礎有機物這塊,ChemDoodle出師不捷,5個結構最終只能命名出2個。這幾種結構里面含有Si、Se、Sn等在有機化學結構內不常見的元素,對于處理這些結構的命名,ChemDoodle有待提升。在螺環這塊,ChemDoodle更是無法命名。在最后的無機物命名這塊,ChemDoodle也難以達到預期。
▲InDraw、ChemDraw、ChemDoodle和MarvinSketch的命名表現
在無機物這塊,InDraw與這三款軟件相比,有著一定優勢。比如ChemDraw無法識別最基礎的二氧化氮,MarvinSketch無法識別離子化合物,只能單個給出離子的命名,不能給出整體命名,推測它只能識別共價化合物。
MarvinSketch支持俗名以及IUPAC英文命名,比如氨基酸“D-alloisoleucine(D-別異亮氨酸)”,MarvinSketch可以給出縮寫名“Hile”,同時其也支持甾體的簡潔命名。InDraw對氨基酸衍生物的處理也很到位,可以識別其中的氨基酸結構。
▲InDraw對氨基酸衍生物的命名也很簡潔
四、結語
InDraw在化學結構命名中效果良好,特別是直接基于化學結構給出英文和中文的名稱,結果非常精確。與同類型的產品比較,其命名范圍廣、結果可靠、支持原生中文命名,對無機物命名也有很好的效果,同時支持一些天然產物的簡潔命名。
簡而言之,這款結構式命名神器有著如下優點:
? 免費、原生中文界面、操作方便;
? 業界首創的化學結構中文命名;
? 命名范圍廣、正確率高;
? 支持天然產物的簡潔命名;
? 對無機物命名性能優秀。
一鍵IUPAC中文命名,免費試用,快來試試吧!
下載鏈接:http://www.integle.com/static/indraw
聲明:化學加刊發或者轉載此文只是出于傳遞、分享更多信息之目的,并不意味認同其觀點或證實其描述。若有來源標注錯誤或侵犯了您的合法權益,請作者持權屬證明與本網聯系,我們將及時更正、刪除,謝謝。 電話:18676881059,郵箱:gongjian@huaxuejia.cn