古詩詞大全網 - 成語故事 - 化學信息學的發展現狀

化學信息學的發展現狀

伴隨著藥物發現和制造技術發展而產生的化學信息學最早是由Frank Brown 用下述簡潔語言定義的:綜合信息資源,將數據(data)轉化為信息(information),將信息轉化為知識(knowledge),並將它用於特定藥物先導化合物的辨識和優化領域的壹門學科。眾所周知,由於組合化學的出現使得藥物學發生了革命性的變化。現代藥物設計可以利用計算化學的方法,通過分子建模和仿真虛擬合成各種化合物(solid phase synthesis)。但是,通過這種方法得到的可供篩選的化合物庫非常龐大,理論上可以合成的類藥分子超過1040個。顯然,如果去實際合成每壹個藥物來進行篩選是不可能的,因此必須從大量的數據中總結出規律,並利用這些規律進行虛擬的高通量篩選(HTS),以減少需要實際合成的化合物,同時盡可能地接近目標化合物。面對如此大量的數據,需要將原本獨立的化學、數學及計算機等學科融合起來,構建壹系列計算技術工具,以便完成從數據到信息,從信息到知識的整個化學信息處理過程。這些技術工具不僅包括實驗數據的分析處理,同時也包括分子各種性質的計算、化合物數據庫的建立、分子的虛擬合成、QSAR的研究、化學結構和性質數據庫的建立、基於三維結構的分子設計、統計方法的研究等。化學信息學正是在上述需求基礎上發展起來的壹門交叉學科。它綜合了數學、化學、生物學、信息學、計算機應用、藥物學等學科知識,主要研究如何適當地選取化合物庫(library)的多樣性(diversity)、如何表征藥物分子特征、如何度量不同分子間的差異性、如何識別類藥(drug like)分子、分子結構和生物性能(bioactivity)關系、如何研發相應的計算機軟硬件等,這就包括了化學計量學及計算化學的研究任務和內容。

化學信息學方法與傳統的化學計量學方法相比,更註重於有用信息的提取和更註重計算速度的提高。為滿足信息提取的需要,它大量采用了人工智能領域和信息科學領域的先進方法和工具。例如,運用數據挖掘技術去發現大量原始數據中的隱含規則;運用特征提取技術和編碼技術進行模式的表達;運用數據庫技術完成大型數據的儲存和搜索;運用計算機仿真技術模擬分子的合成,以及受體和配體之間的匹配等。而為滿足計算速度方面的要求,它壹方面采用更高性能的計算機硬件,如並行計算機等;另壹方面研究設計更為高效的算法,以最大限度地利用計算機硬件所能提供的計算能力。顯然,化學信息學所研究的問題已經超越了傳統化學計量學所研究的範疇,現有的化學計量學方法難以解決分子設計研究領域大量出現的新問題。從這個意義上講,化學信息學的創立和發展是化學學科拓展的歷史必然。化學信息學在化學領域、化工領域、藥物設計領域、材料科學領域等許多領域中都已得到廣泛的應用。例如,在化工領域中,化學信息學被用來對反應條件進行優化和篩選催化劑等,這主要是通過對實驗數據進行建模,然後使用該預測模型實現對實驗工作的指導;在藥物設計領域,主要被用來進行分子模擬、虛擬合成、構效關系分析、虛擬篩選等;在材料科學領域,化學信息學被用於分子模擬和分子設計,並在分子性能預測的基礎上,從所設計的分子中篩選出進行實際合成的分子,以便得到經過性能優化的材料。