材料數據驅動研發創新模式之趨勢與發展

 

刊登日期:2023/2/5
  • 字級

劉子瑜、李涵榮 / 工研院材化所
 
近年來由於數據驅動方法的應用及數據決策方法的創新,引領了材料設計領域由經驗科學邁向數據驅動科學,進入材料研發的創新模式。以數據驅動進行材料研發,不管在效率和準確性方面皆優於傳統的反覆測試方法,並且藉由機器學習模型可以簡化複雜的材料特徵描述。文中會介紹目前數據量較豐富的模擬數據及實驗數據資料庫,並以電催化產氫過渡金屬觸媒材料設計作為材料數據驅動研發模式之案例說明,文末也會剖析數據驅動創新材料設計未來的挑戰與展望。
 
【內文精選】
前 言
材料的研發要從Trial-and-Error轉型至數據驅動的創新模式,需要結合數學/統計學、計算科學和材料科學三個領域的最新知識,這三個領域的進步及適當的整合將有助於材料數據的生成和分析、不確定性的描述以及材料結構與特質之關聯性描述符研究,提供最新知識並加速創新材料的發現。開發有效的數據驅動方法對於加速創新材料開發有著至關重要的影響,基本的數據驅動架構涉及三個基本階段:①大量數據及機器學習方法的使用,②開發不同領域的綜合數據庫和數據生成方法,③構建可以鏈接數據和實驗特性的描述符;主要目標是透過數據驅動方法來快速且有效地開發高性能創新材料。
 
圖二為數據驅動創新材料研發中機器學習之工作流程示意圖。結合ML演算法、材料數據庫、分子描述符,對材料創新的數據驅動框架進行的材料開發通常包括五個基本階段:目標定義、數據處理、特徵工程、ML模型訓練及分析,最終應用於材料開發。其中數據處理包括將材料三維化學環境轉換成二進位數值化之位元向量,才可導入機器學習模型;特徵工程則是透過特徵選擇(Feature Selection)來協助降維(Dimensionality Reduction),保留權重較高的維度,加速進行後續的機器學習建模。
 
圖二、數據驅動創新材料研發中機器學習之工作流程示意
圖二、數據驅動創新材料研發中機器學習之工作流程示意
 
材料數據資料庫
常見的材料模擬數據資料庫包括OQMD、MP、CEP、CatApp等。Open Quantum Materials Database (OQMD)是一個DFT數據庫,由西北大學的ChrisWolverton小組開發,涵括超過30萬種材料的計算熱力學和結構特性,主要材料結構來自無機晶體結構數據庫(ICSD)作為初始結構,再以DFT模擬後輸出熱力學和結構特性,隨著ICSD晶體數量更新,OQMD資料庫也同步進行更新。Material Project (MP)是一個免費的網路模擬資料庫平台,由柏克萊大學的Kristin Persson團隊最初以MGI計畫經費開發,MP資料庫開放使用者上傳相關的模擬資料,同時有開放的討論區以及自有開發的整合機器學習軟體工具,是目前最完整的模擬數據資料庫。
 
常見的材料實驗數據資料庫包括SciFinder、ChemSpider、CSD、ICSD等。SciFinder是目前最豐富最完整的化學檢索資料庫,資料來源包括:期刊文獻、專利等,數據資料包含:化學物質基礎特性、化學反應、實驗設計等各類型科學資料。ChemSpider是一個免費的網絡化學資料庫,從2008年建立至今,資料庫中已累積數千萬的分子,資料庫主要數據來源為實驗文獻,ChemSpider收錄的結構以化學分子材料為主,包含數十種特性資料,包括基礎物性、化性、酸鹼性、氣體特性、反應性、光譜特性等,相當多元。上述兩者偏向有機化學分子資料庫,Cambridge Structural Database (CSD)和Inorganic Crystal Structure Database (ICSD)則偏向無機結構資料庫,收錄已發表的所有無機晶體結構的資
 
材料數據驅動研發案例
2021年Zhu等人在ACS Catal.上發表以機器學習(Machine Learning; ML)特徵描述和深度學習(Deep Learning; DL)圖像識別來進行數據驅動電催化產氫過渡金屬觸媒材料的設計。一般來說,數據驅動用於描述HER (Hydrogen Evolution Reaction)過渡金屬電催化劑篩選的特徵,來自固有或計算所得的物理化學性質,大致可分為兩類,一種為幾何結構描述特徵,例如:鍵長、晶格參數、原子半徑;另一種為電子結構描述特徵,例如:電負度和價軌域等訊息。而目標特性則為催化反應的活性指標,例如:H的吸附能或電催化劑和與載體的結合能,這些催化反應的活性數據必須由密度泛函理論(Density Functional Theory;DFT)模擬而得。如圖三所示,上半部及下半部分別為以機器學習和深度學習兩種不同的機器學習演算法應用在電催化產氫的反應示意圖,主要差別在於幾何結構描述特徵的部分---以上為部分節錄資料,完整內容請見下方附檔。
 
圖三、機器學習和深度學習應用在Hydrogen Evolution Reaction (HER)反應的流程示意圖
圖三、機器學習和深度學習應用在Hydrogen Evolution Reaction (HER)反應的流程示意圖
 
★本文節錄自《工業材料雜誌》434期,更多資料請見下方附檔。

分享