近年來,計算和表征材料性質的方法發展迅速。在材料性質計算方面,分子動力學(MD)模擬等方法在自由能計算和藥物發現方面取得了良好的結果。除了材料性能計算外,材料性能表征也是材料研究的重要組成部分。在各種表征方法中,電子顯微鏡,包括掃描電子顯微鏡(SEM)、透射電子顯微鏡(TEM)等,是表征材料宏觀和內在性能的重要手段。在現階段,這種檢測技術在很大程度上依賴于人工觀察和判斷,耗時、耗力且難以量化。基于材料微觀圖像分析進行材料性質判斷的自動化、定量化和智能化,無疑是值得探索的研究方向。
本工作中,作者以高分子相容性作為具體研究對象開展了研究。高分子相容性是高分子共混中影響共混材料性能的一個關鍵物理量。高分子相容性一般指高分子在分子尺度上的可混溶性,相容性差將嚴重限制高分子共混物的使用。對于高分子相容性的識別,研究者們通常使用SEM、DSC(差示掃描量熱儀)等手段進行分析,并通過經驗對結果進行人工判別,而計算機視覺的相關技術有望將這一過程自動化。
作者通過從大量已發表的相關文獻與部分高分子數據庫中收集相關數據,獲取了一批高分子微觀結構的SEM圖片與對應的相容性標簽,構建為供機器學習模型訓練與測試的數據集。在機器學習模型上,作者使用了卷積神經網絡(CNN)中目前性能最佳的圖像分類神經網絡包括VGG、ResNet、DenseNet,并與傳統邊緣檢測算法進行了比較(圖2)。為了解決訓練數據不足的問題,作者使用遷移學習方法,將模型在大規模數據集ImageNet上進行預訓練,接著使用共混物的SEM 圖片對模型參數進行微調。除此之外,作者還通過對圖片進行平移、旋轉、翻折、裁剪等操作實現了數據增廣。最終,模型實現了測試集上94%的準確率,高于傳統算法的識別準確率,并與該領域研究工作者進行的人工識別對照組準確率接近。通過消融實驗,作者驗證了預訓練對于模型效果提升的重要作用,為解決目前化學領域普遍存在的少樣本問題提供了思路。此外,作者還通過處理模型的輸出結果,嘗試建立了關于相容性的定量描述。
研究還得出了一些有趣的結果。不同的深度學習模型在預訓練過程中表現不同,并且在預訓練過程中的表現與模型在測試集上的準確率趨于一致(圖3)。在定量化描述方面,現有的結果顯示出兩極分化。混溶樣品的定量結果非常接近“1”,而不混溶樣品則接近“0”,這與訓練過程中所給的標簽有關,未來在更精細的標注下將得到改善。盡管取得了較高的識別準確率,這種方法的性能還受到SEM圖像質量和清晰度的限制。此外,在許多實際應用中還存在更復雜的情況(例如三元或四元共混物)。未來,隨著數據集的增加,我們希望所建立的模型能夠在非理想情況下表現得更好。
這項工作屬于讓化學實驗的表征與分析更加自動化和智能化的探索,這對于未來高通量自動化化學實驗具有重要意義。此外,這項技術可以遷移到其他的材料性能預測中,并且不局限于SEM圖像,如紅外光譜等其他的化學測試結果也可以通過機器學習方法進行分析,這將激發更多將人工智能用于物質科學研究的創造性方法,促進跨學科的發展。
原文鏈接:https://doi.org/10.1021/acs.jcim.3c00489
下載:Automatically Predict Material Properties with Microscopic Image: Example Polymer Miscibility
- 中科院長春應化所 AM: 發明“機器學習增強試錯法” - 實現橡膠配方高效、極限優化,已應用于高技術裝備制造 2025-03-14
- 山西師大崔小靜 ACS Sensors:機器學習輔助熱電水凝膠實現自驅動面部感知 2025-01-11
- Science:AI和高通量結合的逆向分子設計加速材料發現 2024-12-14