版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

基于944種材料數(shù)據(jù),日本東北大學(xué)聯(lián)合MIT發(fā)布GNNOpt模型,識別數(shù)百種太陽能電池和量子候選材料

HyperAI超神經(jīng)
原創(chuàng)
人工智能說明書,了解 AI 的功效和副作用。
收藏

**LED、太陽能電池、光電探測器和光子集成電路 (PIC) 等光電設(shè)備是現(xiàn)代通信、照明和能源轉(zhuǎn)換技術(shù)的核心。**這些設(shè)備的性能和效率在很大程度上取決于材料的光學(xué)特性,因此,深入理解這些特性對于推動技術(shù)進步和滿足日益增長的科學(xué)及工業(yè)需求至關(guān)重要。為了應(yīng)對這一挑戰(zhàn),實驗和計算領(lǐng)域的研究人員通過積極開展高通量篩選工作,以尋找和開發(fā)具有定制光學(xué)特性的新型材料。

然而傳統(tǒng)的獲取材料光學(xué)特性的實驗技術(shù),如橢偏儀、紫外-可見光譜儀和傅立葉變換紅外光譜儀 (FTIR),雖然能夠提供精確的測量結(jié)果,但它們通常只適用于特定的波長范圍,并且對樣品條件有嚴格的要求。這些限制使得這些技術(shù)在高通量材料篩選中的應(yīng)用受到了一定制約。

**為了解決這一問題,研究人員轉(zhuǎn)向了基于密度泛函理論 (DFT) 的第一性原理計算。**與傳統(tǒng)實驗技術(shù)相比,DFT 計算能夠覆蓋所有波長范圍的光學(xué)光譜,提供了一種更為全面的分析手段。盡管 DFT 計算能力強大,但在預(yù)測晶體結(jié)構(gòu)的光學(xué)性質(zhì)時,由于缺乏有效的原子嵌入,仍然面臨著一定的挑戰(zhàn)。

**針對于此,日本東北大學(xué) (Tohoku University) 和麻省理工學(xué)院 (MIT) 的研究人員推出了一種新型人工智能工具 GNNOpt,成功識別出 246 種太陽能轉(zhuǎn)換效率超過 32% 的材料,**以及 296 種具有高量子權(quán)重的量子材料,極大地加速了能源和量子材料的發(fā)現(xiàn),為材料科學(xué)領(lǐng)域帶來了新的研究范式。

相關(guān)研究以「Universal Ensemble-Embedding Graph Neural Network for Direct Prediction of Optical Spectra from Crystal Structures」為題,發(fā)表在 Advanced Materials 上。
研究亮點:

* GNNOpt 采用「集成嵌入」技術(shù),不僅能夠?qū)W習(xí)來自多種數(shù)據(jù)集的信息,還能夠直接從晶體結(jié)構(gòu)中精準預(yù)測所有線性光學(xué)光譜

* 通過集成等變神經(jīng)網(wǎng)絡(luò),GNNOpt 利用 944 種材料組成的小型數(shù)據(jù)集實現(xiàn)了高質(zhì)量的預(yù)測

* GNNOpt 從未知材料中成功出了篩選 246 種太陽能轉(zhuǎn)換效率超過 32% 的材料,以及包括 SiOs 在內(nèi)的 296 種具有高量子權(quán)重的量子材料

數(shù)據(jù)集:基于 944 種晶體材料的小樣本學(xué)習(xí)

**研究人員使用基于密度泛函理論 (DFT) 計算得出的 944 種晶體材料,對 GNNOpt 模型進行光譜預(yù)測。**這些數(shù)據(jù)庫是通過 API 從 Materials Project 獲取得到的。而數(shù)據(jù)庫中的光譜數(shù)據(jù)通過獨立粒子近似 (IPA) 獲取,包含了頻率相關(guān)的介電函數(shù)及其對應(yīng)的吸收系數(shù)。

整個數(shù)據(jù)集按照 80%、10% 和 10% 的比例,被隨機分為訓(xùn)練集 (733 種材料)、驗證集 (97 種材料) 和測試集 (110 種材料)。

訓(xùn)練集、驗證集、測試集元素分布
GNNOpt 模型架構(gòu):在晶體結(jié)構(gòu)與頻率相關(guān)光學(xué)特性之間直接建立關(guān)系

GNNOpt 是一種基于圖神經(jīng)網(wǎng)絡(luò) (GNN) 的模型,采用「集成嵌入」技術(shù),能夠直接從晶體結(jié)構(gòu)中預(yù)測所有線性光學(xué)光譜。值得說明的是,在訓(xùn)練 GNNOpt 模型之前,研究人員通過一系列實驗證明了應(yīng)用克拉莫-克若尼關(guān)系式 (Kramers–Kronig relations) 能夠更好地預(yù)測光學(xué)光譜。

如下圖 a 所示,**GNNOpt 的唯一輸入值是晶體結(jié)構(gòu) (Crystal structure),而輸出值則是光譜,**具體包括復(fù)介電函數(shù) (Complex dielectric function)、吸收系數(shù) (Absorption coefficient)、復(fù)折射率 (Complex refractive index)、反折射率 (Reflectance)。

GNNOpt 模型的輸入與輸出示意圖

在圖 b 中,**晶體結(jié)構(gòu)中每種原子種類 (O、CI、TI) 的輸入特征采用獨熱編碼表示。**由于元素周期表中的所有元素都有原子質(zhì)量 (atomic mass, 用 x0 表示)、偶極子極化率 (dipole polarizability, 用 x1 表示) 和有效共價半徑 (effective covalent radius, x2 表示) 這 3 種特征,因此研究人員選擇這 3 個特征進行集成嵌入。

集成嵌入的 3 種特征

研究人員通過引入自動嵌入優(yōu)化的集成嵌入層,可在不修改神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的情況下提高模型預(yù)測精度,具體過程如下圖 c 所示。

首先,所有原子輸入特征通過集成嵌入層 (Ensemble embedding) 進行自動優(yōu)化。為了實現(xiàn)等變性,卷積濾波器由可學(xué)習(xí)的徑向函數(shù)和球諧函數(shù) (Spherical Harmonics) 組成。然后,將嵌入的特征通過一系列等變圖卷積 (Graph convolution) 和門限非線性層 (Gated nonlinear layers) 參數(shù)化為可輸入的參數(shù)。緊接著,參數(shù)結(jié)果被傳遞到包括激活和聚合操作的后處理層,用來生成預(yù)測的輸出光譜。最后,通過最小化預(yù)測光譜與真實光譜之間的均方誤差 (MSE) 損失函數(shù)來訓(xùn)練優(yōu)化 GNNOpt 權(quán)重。

GNNOpt 模型架構(gòu)示意圖

**為了深入了解晶體結(jié)構(gòu),研究人員對 TlClO4 的晶胞 (unit cell) 結(jié)構(gòu)進行了分析,如圖 d 所示。**其中圓形節(jié)點代表晶胞內(nèi)的原子,線條表示圖卷積層的信息傳遞方向。

TlClO4 的晶胞結(jié)構(gòu)

**圖 e 則展示了通用集成嵌入層的細節(jié),即使沒有任何神經(jīng)網(wǎng)絡(luò)模型的改變,它也是性能提高的關(guān)鍵因素。**對于每個原子,每個特征都獨立地嵌入其線性和活化層。然后,所有嵌入的特征通過可學(xué)習(xí)的混合概率 pi 進行加權(quán)平均,其中 pi 通過 ∑ipi = 1 進行歸一化。

通用集成嵌入層細節(jié)展示

模型性能:GNNOpt 可識別出數(shù)百種太陽能電池以及量子候選材料

為了測試 GNNOpt 模型的性能,研究人員使用 GNNOpt 識別太陽能電池材料以及量子材料,成功識別出 246 種太陽能電池材料,以及 296 種具有高量子權(quán)重的量子材料。
上述材料的詳細資料詳見附加信息:
https://go.hyper.ai/rVSS8
關(guān)注公眾號,后臺回復(fù)「預(yù)測材料信息」獲取完整 PDF

GNNOpt 能夠從未知材料中篩選出 246 種太陽能電池材料

在識別具有高性能能量轉(zhuǎn)換功能的潛在太陽能電池材料方面,研究人員使用光譜有限最大效率 (Spectroscopic Limited Maximum Efficiency,SLME) 方法,對太陽能電池的光電轉(zhuǎn)換效率進行初步篩選和評估。
隨后,研究人員使用 GNNOpt 模型預(yù)測了 Materials Project 中 5,281 種未知晶體結(jié)構(gòu)的能量轉(zhuǎn)換效率 (η 值),需要說明的是這些晶體結(jié)構(gòu)沒有真實的光譜數(shù)據(jù)。如下圖 a 所示,研究人員比較了測試集的預(yù)測效率與真實效率,結(jié)果顯示 R2 = 0.81,表明 GNNOpt 對太陽能電池的光電轉(zhuǎn)換效率的預(yù)測準確性較高。

測試集中由 GNNOpt 預(yù)測的效率 η 與由 DFT 計算獲得的真實效率 η 之間的對比

在圖 b 中,研究人員將在測試集中由 GNNOpt 預(yù)測效率 η 與由 DFT 獲得的真實效率 η 值,繪制成能量帶隙 (energy band gap,用 Eg 表示) 的函數(shù)關(guān)系圖。當 Eg 約為 1.3 eV 時,η 的最大值約為 32%,這與 SQ 極限一致。然而, SLME 作為太陽能電池材料的選擇參數(shù)比 SQ 極限更加嚴格,因為對于具有相似帶隙的材料,SLME 顯示了 η 值在較寬范圍內(nèi)的變化,這表明吸收系數(shù) α(E) 對 η 有著顯著的貢獻。

能量帶隙函數(shù)關(guān)系圖

此外,了解元素周期表中哪些元素對高效太陽能電池材料的貢獻最大,可以為材料設(shè)計提供初步的指導(dǎo)。如圖 c 所示,**GNNOpt 模型預(yù)測出過渡金屬 (如 Tc、Rh、Pd、Pt、Cu、Ag、Au 和 Hg) 以及硫族元素 (如 S、Se 和 Te) 是太陽能電池材料的主要組成元素。**這一結(jié)果與廣為人知的太陽能電池材料一致,如富銅的黃銅礦 (Cu-rich chalcopyrite)、鉛基鈣鈦礦 (Pb-based perovskites) 或 CdTe。

根據(jù) SLME 對元素周期表進行著色

為了驗證 GNNOpt 模型對未知材料的 SLME 預(yù)測值,研究人員從最高 SLME 材料列表中選取了 3 個示例:LiZnP、SbSeI 和 BiTeI。需要說明的是,這些材料不在 DFT 數(shù)據(jù)庫中。因此,研究人員對這些材料進行了 DFT 計算,以確定這些材料的吸收系數(shù) α(E)。
結(jié)果如下圖 d 所示,DFT 計算的結(jié)果(用虛線表示)與 GNNOpt 預(yù)測的 α 值(用實線表示)高度吻合。這表明 GNNOpt 可以在大幅降低計算成本的情況下,成為一種有效的材料篩選工具。值得一提的是,對于大型數(shù)據(jù)庫,可以將 GNNOpt 與遺傳算法 (GA) 結(jié)合使用,從而加速候選材料的搜索過程。

對于 3 種未知材料,GNNOpt 預(yù)測結(jié)果和 DFT 計算結(jié)果對比

GNNOpt 成功探測出包括 SiOs 在內(nèi)的 296 種量子材料
除了可以識別未知的、具有高性能能量轉(zhuǎn)換潛力的太陽能電池材料,**GNNOpt 的另一個應(yīng)用是用于探測量子材料中的量子幾何 (quantum geometry) 和拓撲結(jié)構(gòu) (topology)。**此前曾有學(xué)者表明,廣義量子權(quán)重這一概念可以從光譜中推導(dǎo)出來,是衡量基態(tài)量子幾何和拓撲結(jié)構(gòu)的直接指標。量子權(quán)重 Kxx 是由反向頻率加權(quán)的 f-sum 規(guī)則修正而來。

* 量子權(quán)重 Kxx 是量子系統(tǒng)中一個與材料的光學(xué)和電子性質(zhì)相關(guān)的重要物理量,特別用來衡量其量子幾何和拓撲特性。它描述了材料的量子幾何結(jié)構(gòu)與其光學(xué)性質(zhì)或電學(xué)性質(zhì)之間的關(guān)聯(lián)。

在圖 a 中,研究人員比較了測試集中以 h/e2 為單位的預(yù)測 Kxx 和真實 Kxx 的值。在 Kxx < 25 的范圍內(nèi),R2 = 0.73, 表明 GNNOpt 預(yù)測結(jié)果接近 DFT 計算的真實結(jié)果。

GNNOpt預(yù)測的Kxx和DFT計算的真實Kxx比較示意圖

因此,GNNOpt 被用來預(yù)測 5,281 種未知絕緣體材料的 Kxx 值,如圖 b 所示。為了簡化分析,研究人員將著名的拓撲絕緣體 Bi2Te3 的量子權(quán)重 Kxx = 28.87 作為分類量子材料的閾值 (threshold),其中 Kxx > 28.87 的材料被視為高 Kxx 材料。

最終,研究人員確定了 297 種高 Kxx 材料。其中一些材料,如 ZrTe5 (Kxx = 33.90)、TaAs2 (Kxx = 37.66)、FeSi (Kxx = 48.74) 和 NbP (Kxx = 35.58) 等,已被確認為具有反?;魻栃?yīng) (anomalous hall effect)、巨磁阻效應(yīng) (large magnetoresistance)、拓撲費米弧 (topological Fermi arcs) 和量子振蕩 (quantum oscillations) 現(xiàn)象的量子材料。

使用 GNNOpt 搜索具有高量子權(quán)重 Kxx 的量子材料

由于 SiOs 具有極高的量子權(quán)重 (Kxx = 46.52),且此前未被深入研究,因此研究人員對 SiOs 進行了額外的 DFT 計算,并分析了其電子能帶結(jié)構(gòu) (Electronic band structure)。如圖 c 所示,SiOs 在 Γ 點和 R 點分別存在三重費米子 (Three-fold fermion) 和雙韋爾費米子(Double-Weyl fermion)。
SiOs 電子能帶結(jié)構(gòu)

圖 d 則是研究人員使用最大局域化萬尼爾函數(shù) (Wannier functions) 和格林函數(shù) (Green’s function) 方法計算了 SiOs (001) 表面的能帶結(jié)構(gòu),表明了 SiOs 的超量子特性。

SiOs 電子能帶結(jié)構(gòu)的表面

人工智能將重塑材料研發(fā)過程,材料會逆向生成

在材料科學(xué)的快速發(fā)展中,AI 技術(shù)正在引領(lǐng)著一場革命。此前,中國工程院院士干勇曾公開表示,「人工智能將重塑材料研發(fā)過程,材料會逆向生成。」

首先,AI 在材料發(fā)現(xiàn)中的應(yīng)用尤為顯著。**2023 年 11 月底,谷歌旗下的 DeepMind 發(fā)布用于材料科學(xué)的 AI 強化學(xué)習(xí)模型 GNoME,**并通過該模型和高通量第一性原理 (DFT) 計算,尋找到了 38 萬余個熱力學(xué)穩(wěn)定的晶體材料,極大加快了發(fā)現(xiàn)新材料的研究速度。

**微軟不甘其后,在 GNoME 模型發(fā)表數(shù)天后,發(fā)布了材料科學(xué)領(lǐng)域的人工智能生成模型 MatterGen,**可根據(jù)所需要的材料性質(zhì)按需預(yù)測新材料結(jié)構(gòu)。

**2024 年 1 月,微軟與美國能源部下屬的西北太平洋國家實驗室 (PNNL) 合作,利用人工智能和高性能計算,從 3,200 萬種無機材料中篩選出了一種全固態(tài)電解質(zhì)材料,**完成了從預(yù)測到實驗的閉環(huán),該技術(shù)可助力下一代鋰離子電池材料研發(fā)。

此外,AI 也在材料性質(zhì)預(yù)測方面發(fā)揮著重要作用。通過機器學(xué)習(xí)模型,可以預(yù)測材料的電子結(jié)構(gòu)、力學(xué)性質(zhì)等,從而優(yōu)化材料設(shè)計。例如,**北京大學(xué)工學(xué)院研究員陳默涵開發(fā)的國產(chǎn)開源密度泛函理論軟件 ABACUS,**結(jié)合 AI 輔助的交換關(guān)聯(lián)泛函方法 DeePKS,克服了 DFT 計算在精度和效率上的兩難問題,實現(xiàn)了高效率的雜化泛函精度計算。

AI 在材料科學(xué)領(lǐng)域的應(yīng)用遠不只此,在落地層面也涌現(xiàn)出諸如 Green Dynamics、CuspAl、DeepVerse 等致力于將 AI 運用于新材料領(lǐng)域的公司。隨著技術(shù)的不斷發(fā)展,AI 或?qū)⒃诓牧峡茖W(xué)領(lǐng)域迸發(fā)出無限的力量!