近期,威斯康星大學麥迪遜分校Ying Li課題組利用機器學習和分子動力學模擬,建立了一個針對聚酰亞胺結構的機器學習預測框架,可高效地篩選新型高性能聚酰亞胺材料,為加速高性能聚酰亞胺材料的發(fā)展提供了理論指導。聚酰亞胺因其優(yōu)異的機械和熱性能而在現代工業(yè)中得到廣泛應用,但其開發(fā)和應用往往需要耗時數年甚至數十年。為了解決傳統試驗研究的長周期與高成本問題,Ying Li課題組提出了可顯著地加速新型高性能聚酰亞胺材料的設計—可解釋的機器學習篩選框架。具體來說,首先,以已有的2000種聚酰亞胺高分子化學結構為依據,采用深度神經網絡模型建立聚合物的“結構 - 性能”內在聯系,并解釋了機器學習模型物理意義。其次,通過優(yōu)化不同的深度神經網絡模型參數,構建了聚合物的7種熱力學模型。然后,通過數值交聯不同原材料小分子建立了一個包含800萬個假想聚酰亞胺結構的數據集(圖1),并使用訓練好的機器學習模型對其7種熱力學性質進行了預測與評估。最終從中篩選出超出目前已有聚酰亞胺性能的新型高強耐高溫材料(圖2)。為了方便查詢已篩選出的高性能聚酰亞胺材料,研究團隊創(chuàng)建了一個在線平臺https://polyimide-explorer.herokuapp.com/,該平臺嵌入了開發(fā)的機器學習模型,并提供了交互式可視化功能。此外,數值交聯時所使用的原料小分子都是現有且可購買,所以這些假想聚酰亞胺結構不僅理論上可行,而且可進行試驗驗證。根據高通量篩選的結構,該研究組成功合成了一種新型聚酰亞胺結構,并通過試驗驗證了其耐高溫性能,進而論證了所建立機器學習模型的準確性(圖3)。這項工作建立了一個大型的聚酰亞胺結構數據集,并實驗驗證了其篩選出的新型高性能結構,為高性能聚合物材料的開發(fā)與測試提供了科學的理論指導,該工作以“Discovery of Multi-Functional Polyimides through High-Throughput Screening using Explainable Machine Learning”為題發(fā)表在《Chemical Engineering Journal》上。文章共同第一作者是康涅狄格大學機械工程系博士后Lei Tao博士,威斯康星大學麥迪遜分校機械工程系博士后Jinlong He博士,以及弗吉尼亞理工大學化學系博士生Nuwayo Eric Munyaneza。該研究得到美國空軍研究實驗室和美國國家科學基金會的支持。
首先,聚酰亞胺主要通過兩種類型的縮聚反應形成:二酸酐和二胺間的縮聚反應并移除一個水分子形成(圖1a),或者二酸酐和二異氰酸酯間的縮聚反應并移除二氧化碳分子(圖1b)。因此,聚酰亞胺含有兩個互相連接的酰亞胺基團,(圖1a-d中以紅色陰影突出顯示)。基于實驗記錄的高分子數據庫——PoLyInfo數據庫,圖1c展示了數據庫中收集的2233種真實的聚酰亞胺結構。當將這些2233種真實的聚酰亞胺映射到二維化學空間中,他們發(fā)現它們在結構上非常相似(圖1e中的綠色點)。這表明真實聚酰亞胺的多樣性仍然有限,遠未覆蓋所有潛在的聚酰亞胺化學結構。目前,基于如圖1a-b所示的合成路線,通過使用不同的二酸酐和二胺/二異氰酸酯組合,試驗中已經成功合成多種聚酰亞胺,如KaptonTm、UPILEXTm、AvimidTm等。由于二酸酐、二胺和二異氰酸酯間存在許多不同的組合,所以在實驗上很難合成所有可能的組合。例如,在世界上最大的有機分子數據庫中——PubChem數據庫,二酸酐、二胺和二異氰酸酯的數量分別超過了200種、30000種和10000種。因此,二酸酐和二胺的組合將導致超過600萬種潛在的聚酰亞胺,而二酸酐和二異氰酸酯的組合甚至超過200萬種潛在的聚酰亞胺。盡管實驗中不可能合成所有800萬種聚酰亞胺,但是當酰亞胺官能團可正確形成時,這800萬種聚酰亞胺的化學結構計算上可以被獲取。圖1d展示了一些獲得的假想的聚酰亞胺的化學結構。這個假想的數據集包含了更多多樣性的聚酰亞胺結構,占據了更廣泛的化學空間(圖1e中的紅色點)。從真實聚酰亞胺的局部區(qū)域擴展到假想聚酰亞胺的更廣泛區(qū)域,有助于我們更有可能發(fā)現具有期望的多功能性能的新型聚酰亞胺材料。盡管對這800萬種假想的聚酰亞胺進行詳盡的搜索在實驗上是不現實的,但是機器學習模型技術可以避免這些挑戰(zhàn)。
圖1 數值交聯所得800萬個假想聚酰亞胺結構與現有2000聚酰亞胺結構的結構多樣性比較。
然后,基于上述構建的800萬假想的聚酰亞胺數據庫,研究團隊建立了單任務的機器學習模型。單任務的機器學習模型使得他們可以在給定新的聚酰亞胺時評估其特定性能。當他們將訓練好的機器學習模型應用于這800萬種假設性聚酰亞胺時,可以得到它們的屈服強度、楊氏模型和玻璃轉化溫度的估計值,從而可以發(fā)現新型的多功能高性能的聚酰亞胺材料。由于這三個熱力學特性的相互競爭,化學的設計空間變成了三維空間,如圖2所示。在真實聚酰亞胺數據集中,一些聚酰亞胺只有一個或兩個熱力學性能的實驗記錄。然而,在這個三維空間中,需要其全部三個熱力學性能。因此,對于那些沒有記錄的熱力學性能,可使用機器學習模型的預測值進行補充。進而使用完整的屈服強度、楊氏模型和玻璃轉化溫度數據,將所有真實聚酰亞胺在圖2中相應地標出。盡管得到的設計空間基于實驗值和機器學習預測值的混合,但考慮到機器學習模型具有很高準確度的預測性能,此方法構建的設計空間是良好且可靠。
圖2 篩選的聚酰亞胺結構與現有聚酰亞胺結構的性能比較(彈性模量,屈服強度和玻璃轉化溫度)。
圖3 基于機器學習篩選的新型聚酰亞胺結構的實驗合成與測試。
在檢查所有假想聚酰亞胺材料的機器學習預測的屈服強度、楊氏模型和玻璃轉化溫度時,其中一些可以被稱為Pareto frontiers,這意味著在不降低其他性質的情況下無法改善其中任何一個性質。這組假設聚酰亞胺材料的Pareto frontiers定義了三個熱力學特性(屈服強度、楊氏模型和玻璃轉化溫度)的邊界。在假想的聚酰亞胺材料的Pareto frontiers中,選擇了三種表現最佳的假想聚酰亞胺材料(同時具有高屈服強度、楊氏模型和玻璃轉化溫度)。類似地,基于所有真實聚酰亞胺材料的三個熱力學特性,可以確定一個新的Pareto frontiers,它定義了真實聚酰亞胺材料的性能邊界(如圖2所示)。圖2還展示了所有真實聚酰亞胺材料在三個平面上的投影。在每個平面上,二維Pareto frontiers更加直觀,楊氏模型-玻璃轉化溫度、楊氏模型-屈服強度和屈服強度-玻璃轉化溫度的組合是三維設計空間中的特殊情況之一。當從800萬個假想的聚酰亞胺材料中發(fā)現的三種性能最佳的新型聚酰亞胺材料(用紅色星號表示),發(fā)現這些假想的聚酰亞胺材料超出了真實聚酰亞胺材料的Pareto frontiers,表明其性能更為優(yōu)越。它們的化學結構顯示在圖2的右側。與圖2左側Pareto邊界附近的三種真實聚酰亞胺的化學結構相比,發(fā)現共同的結構特征,如主鏈骨架中的芳香環(huán)和硫和氧之間的磺酰雙鍵。這種相似性表明了該機器學習模型在抓取關鍵結構的精確性。此外,影響聚酰亞胺熱力學性能的重要亞結構包含在這些發(fā)現的新型聚酰亞胺中。它們位于真實聚酰亞胺設計空間的Pareto frontiers之外,表明高性能聚酰亞胺試驗合成的可行性。如果基于更多的熱力學性能,7個性能屬性的雷達圖展示了三個高性能的假想的聚酰亞胺。就它們在t-SNE化學空間中的位置而言,這三種新型聚酰亞胺接近真實聚酰亞胺。更重要是,這三個假想的聚酰亞胺具有超越其他真實聚酰亞胺材料的熱力學性能。
為了驗證所篩選聚酰亞胺結構具有優(yōu)越的熱力學性能,基于分子動力學模擬與機器學習預測的匹配程度,研究者對新型聚酰亞胺#2進行了實驗合成和測試,以驗證聚酰亞胺的性能。根據前述的反應路線和反應組分,從Sigma Aldrich購買了所有所需的化學品。發(fā)現的聚酰亞胺#2的反應組分是1,4,5,8-naphthalenetetracarboxylic dianhydride (1,4,5,8 NTDA) and p-Phenylenediamine (p-PDA)。此外,甲酚或對氯苯酚被用于提高反應組分的溶解性,如圖3a所示。對甲酚(99%)由Thermo Fisher Scientific供應。溶劑和1,4,5,8 NTDA未經進一步純化即可使用,而p-PDA在使用前在150°C下升華。一方面,盡管合成可行性分數表明這些潛在的高性能聚合物的合成是可行的,但仍然很難找到優(yōu)秀的溶劑來溶解反應物;另一方面,力學測試需要更多樣品,并進一步加工成狗骨樣本。因此,試驗中著重測量聚酰亞胺的玻璃化轉變溫度。在合成的反應中,將1,4,5,8 NTDA 1.00克、p-PDA 0.403克和對氯苯酚50.0克加入干燥的兩頸瓶中,并裝備有磁力攪拌器,然后轉移到加熱到240°C的油浴中。隨著反應的進行,溶液的顏色從棕色變?yōu)樯罴t色,最終變?yōu)榘底仙榱舜_保整個聚合過程中的惰性條件,反應在氮氣緩慢流動下進行回流。經過15小時,反應混合物冷卻至室溫,并在8000轉/分鐘的離心機中離心,以分離聚合物沉淀物。隨后,將殘渣在50°C的對氯苯酚中攪拌,然后再次離心以去除未反應的單體。最后,將聚合物在240°C的真空烘箱中烘干24小時。對于在對甲酚中采用類似的聚合反應。其產率為:對氯苯酚反應為34.0%,對甲酚反應為31.8%。圖3c展示了聚酰亞胺#2的樣品,產物在反應中約20分鐘沉淀,導致最終樣品的低分子量。最后使用差示掃描量熱法(DSC)和熱重分析(TGA)測試了熱性能。DSC實驗在Discovery DSC2500上進行,溫度范圍為20-400攝氏度,升溫速率為10攝氏度/分鐘或50攝氏度/分鐘。TGA實驗在Discovery TGA5500熱重分析儀上進行,溫度范圍為30-1000攝氏度,升溫速率為10攝氏度/分鐘。圖3d展示了TGA實驗結果,得到熱分解溫度為550攝氏度,與ML模型預測的536攝氏度吻合較好。測試的玻璃化轉變溫度為275攝氏度,低于ML模型預測的383攝氏度,這是由于較低的聚合物的分子量。基于Fox和Loshaek提出的經驗方程,玻璃化轉變溫度誰分子量或交聯度的較小而降低。通過進一步的分子動力學模擬,對不同分子量的模型進行了玻璃化轉變溫度為性能擬合,如圖3b所示,結果符合Fox和Loshaek方程。當ML模型預測的玻璃轉變溫度趨近于非常高的分子量極限時,實際樣品的分子量或交聯度會顯著影響其玻璃化轉變溫度。圖3e展示了從DSC實驗結果進一步測得的玻璃化轉變溫度為值,得到了類似的玻璃化轉變溫度為響應值,為275攝氏度。
原文鏈接:https://www.sciencedirect.com/science/article/abs/pii/S1385894723016807
Dr. Ying Li是威斯康星大學麥迪遜分校機械工程副教授。目前的研究方向是:多尺度建模、計算材料設計、聚合物力學與物理、機器學習加速聚合物設計等方向。該課題組長期招收博士和博士后若干。感興趣的請直接郵件聯系Dr. Ying Li, yli2562@wisc.edu.
【博士招生要求】
1. 在工程力學、土木、材料、機械、化學或相關的領域具有本科或碩士學位。
2. 對MATLAB、Fortran、C/C++ 或 Python 的編程技能熟悉或者感興趣。
3. 對分子動力學模擬、有限元分析以及機器學習熟悉或者感興趣。
4. 計算材料科學和聚合物物理學的廣泛知識將是一個加分項。
【博士后招收要求】
1、所需學位:力學,化學,機械或土木,材料,凝聚態(tài)物理或計算化學的博士學位
2、熟悉或者感興趣的方向:(1) 多尺度建模,如分子動力學、粗粒度技術和連續(xù)介質力學等; (2) 計算材料和高分子物理領域; (3) 在多物理場環(huán)境中進行計算分析; (4) 高分子物理 -- 固態(tài)力學; (5)聚合物或其復合材料的本構模型; (6) 機器學習及其在各個領域的應用。其中熟悉機器學習將是一個加分項。