撰文|馬雪薇
編審|庫珀
前言
來自世界氣象組織(WMO)的數(shù)據(jù)顯示,在過去 50 年里,平均每一天都會(huì)發(fā)生一場(chǎng)與天氣、氣候或水患有關(guān)的災(zāi)害,而每一場(chǎng)災(zāi)害平均會(huì)造成約 115 人死亡、約 2.02 億美元的經(jīng)濟(jì)損失。
更令人唏噓的是,近年來,由人類活動(dòng)加速的氣候變化,更是使得熱浪、寒潮、強(qiáng)降水、干旱等極端天氣和氣候?yàn)?zāi)害異常頻發(fā)。
因此,及時(shí)、準(zhǔn)確的天氣預(yù)測(cè)和氣候模擬不僅可以每年幫助挽救數(shù)萬人的生命,還能夠降低極端天氣和氣候事件對(duì)人類社會(huì)和生態(tài)系統(tǒng)的災(zāi)難性影響。
如今,由 Google Research 研究團(tuán)隊(duì)及其合作者開發(fā)的人工智能(AI)模型 NeuralGCM,將天氣預(yù)測(cè)和氣候模擬提升到了一個(gè)新的高度——
NeuralGCM 對(duì) 1-15 天預(yù)報(bào)的準(zhǔn)確率,媲美歐洲中期天氣預(yù)報(bào)中心(ECMWF),后者擁有世界上最先進(jìn)的傳統(tǒng)物理天氣預(yù)報(bào)模型;
對(duì)提前 10 天預(yù)報(bào)的準(zhǔn)確率,NeuralGCM 與現(xiàn)有其他 AI 模型性能相當(dāng),甚至更好;
加入海平面溫度后,NeuralGCM 的 40 年氣候預(yù)測(cè)結(jié)果,與從 ECMWF 數(shù)據(jù)中發(fā)現(xiàn)的全球變暖趨勢(shì)一致;
NeuralGCM 在預(yù)測(cè)氣旋及其軌跡方面也超過了現(xiàn)有的氣候模型。
值得一提的是,NeuralGCM 不僅在準(zhǔn)確度方面達(dá)到甚至超過了現(xiàn)有傳統(tǒng)數(shù)值天氣預(yù)報(bào)模型和其他機(jī)器學(xué)習(xí)(ML)模型;在速度上也是“遙遙領(lǐng)先”,可以在 30 秒計(jì)算時(shí)間內(nèi)生成 22.8 天大氣模擬;且可以比傳統(tǒng)模型節(jié)省數(shù)量級(jí)的計(jì)算量。
相關(guān)研究論文以“Neural general circulation models for weather and climate”為題,已發(fā)表在權(quán)威科學(xué)期刊 Nature 上。
這些結(jié)果共同表明,NeuralGCM 可以生成確定性天氣、天氣和氣候的集合預(yù)報(bào),在長(zhǎng)期天氣和氣候模擬方面顯示出了足夠的穩(wěn)定性。
研究團(tuán)隊(duì)認(rèn)為,這種端到端深度學(xué)習(xí)與傳統(tǒng)大氣環(huán)流模型(GCM,表征大氣、海洋和陸地的物理過程,是天氣和氣候預(yù)測(cè)的基礎(chǔ))所執(zhí)行的任務(wù)是兼容的,且能夠增強(qiáng)對(duì)理解和預(yù)測(cè)地球系統(tǒng)至關(guān)重要的大規(guī)模物理模擬。
此外,NeuralGCM 的混合建模方法還可以應(yīng)用于其他科學(xué)領(lǐng)域,比如材料發(fā)現(xiàn)、蛋白質(zhì)折疊和多物理工程設(shè)計(jì)等。
真實(shí)效果怎么樣?
減少長(zhǎng)期預(yù)報(bào)的不確定性以及估算極端天氣事件,是理解氣候緩解和適應(yīng)的關(guān)鍵。
ML 模型一直被認(rèn)為是天氣預(yù)測(cè)的一種替代手段,具有節(jié)省算力成本的優(yōu)勢(shì),甚至在確定性天氣預(yù)報(bào)方面已經(jīng)達(dá)到或超過了大氣環(huán)流模型的水平,但在長(zhǎng)期預(yù)報(bào)的表現(xiàn)常常不如大氣環(huán)流模型。
在這項(xiàng)工作中,研究團(tuán)隊(duì)結(jié)合機(jī)器學(xué)習(xí)和物理方法設(shè)計(jì)了 NeuralGCM,利用 ML 組件替換或校正 GCM 中的傳統(tǒng)物理參數(shù)化方案,由以下幾個(gè)關(guān)鍵部分組成:
可微分的動(dòng)力核心:該核心負(fù)責(zé)求解離散化的動(dòng)力方程,模擬大尺度流體運(yùn)動(dòng)和熱力學(xué)過程,受重力、科氏力和其他因素影響。動(dòng)力核心使用水平偽譜離散化和垂直 sigma 坐標(biāo),并使用 JAX 庫實(shí)現(xiàn),支持自動(dòng)微分。它模擬七個(gè)預(yù)報(bào)變量:水平風(fēng)渦度、水平風(fēng)散度、溫度、地表壓力和三種水物質(zhì)(比濕、冰云水含量和液態(tài)云水含量)。
學(xué)習(xí)物理模塊:該模塊使用 GCM 中的單柱方法,僅使用單個(gè)大氣柱的信息來預(yù)測(cè)該柱內(nèi)未解析過程的影響。它使用具有殘差連接的全連接神經(jīng)網(wǎng)絡(luò),并在所有大氣柱之間共享權(quán)重。神經(jīng)網(wǎng)絡(luò)的輸入包括大氣柱中的預(yù)報(bào)變量、總?cè)肷涮栞椛?、海冰濃度和海表溫度,以及預(yù)報(bào)變量的水平梯度。神經(jīng)網(wǎng)絡(luò)的輸出是預(yù)報(bào)變量趨勢(shì),按目標(biāo)字段無條件標(biāo)準(zhǔn)差進(jìn)行縮放。
編碼器和解碼器:由于 ERA5 數(shù)據(jù)存儲(chǔ)在壓力坐標(biāo)中,而動(dòng)力核心使用 sigma 坐標(biāo)系統(tǒng),因此需要編碼器和解碼器進(jìn)行轉(zhuǎn)換。這些組件執(zhí)行壓力水平和 sigma 坐標(biāo)水平之間的線性插值,并使用與學(xué)習(xí)的物理模塊相同的神經(jīng)網(wǎng)絡(luò)架構(gòu)進(jìn)行校正。編碼器可以消除初始化沖擊引起的重力波,從而避免污染預(yù)測(cè)結(jié)果。
圖|NeuralGCM 模型架構(gòu)。NeuralGCM 結(jié)合了傳統(tǒng)的流體動(dòng)力學(xué)求解器和用于小尺度物理的神經(jīng)網(wǎng)絡(luò)。這些組件由微分方程求解器組合而成,在時(shí)間上依次向前推進(jìn)系統(tǒng)。(來源:Google Research)
結(jié)果顯示,NeuralGCM 在天氣預(yù)測(cè)方面展現(xiàn)出強(qiáng)大的能力,在超短期、短期和中期時(shí)間尺度上與最先進(jìn)的模型相媲美。如下:
超短期預(yù)測(cè)(0-1 天)
泛化能力:與 GraphCast 相比,NeuralGCM 在未經(jīng)訓(xùn)練的天氣條件下表現(xiàn)更好,因?yàn)樗褂镁植可窠?jīng)網(wǎng)絡(luò)來預(yù)測(cè)大氣垂直柱中的物理過程。
短期預(yù)測(cè)(1-10 天)
準(zhǔn)確性:在 1-3 天的短期預(yù)測(cè)中,NeuralGCM-0.7° 和 GraphCast 的表現(xiàn)最佳,準(zhǔn)確追蹤天氣模式的變化。
物理一致性:與其他機(jī)器學(xué)習(xí)模型相比,NeuralGCM 的預(yù)測(cè)更加清晰,避免了物理上不一致的模糊預(yù)測(cè)。
可解釋性:通過診斷降水減去蒸發(fā),NeuralGCM 的結(jié)果更具可解釋性,方便進(jìn)行水資源分析。
地轉(zhuǎn)風(fēng)平衡:與 GraphCast 相比,NeuralGCM 更準(zhǔn)確地模擬了地轉(zhuǎn)風(fēng)和地轉(zhuǎn)風(fēng)的垂直結(jié)構(gòu)及其比率。
中期預(yù)測(cè)(7-15 天)
集合預(yù)報(bào):NeuralGCM-ENS 在 1.4° 分辨率下的集合平均 RMSE、RMSB 和 CRPS 誤差均低于 ECMWF-ENS,表明其能夠更好地捕捉可能的天氣平均狀態(tài)。
可校準(zhǔn)性:NeuralGCM-ENS 的集合預(yù)報(bào)與 ECMWF-ENS 一樣,具有大約 1 的發(fā)散率-技能比,這是校準(zhǔn)預(yù)報(bào)的必要條件。
此外,除了在天氣預(yù)測(cè)方面表現(xiàn)出色,NeuralGCM 在氣候模擬方面也展現(xiàn)出了強(qiáng)大的能力,表現(xiàn)在季節(jié)循環(huán)模擬、熱帶氣旋模擬和歷史溫度趨勢(shì)模擬等方面。如下:
季節(jié)循環(huán)模擬
準(zhǔn)確性:NeuralGCM 能夠準(zhǔn)確地模擬季節(jié)循環(huán),包括全球可降水和全球總動(dòng)能的年度循環(huán),以及哈德利環(huán)流和經(jīng)向平均風(fēng)等關(guān)鍵大氣動(dòng)力學(xué)。
與全球云分辨模型的比較:與全球云分辨模型 X-SHiELD 相比,NeuralGCM 在可降水方面的偏差更小,并且在熱帶地區(qū)具有更低的溫度偏差。
熱帶氣旋模擬
軌跡和數(shù)量:即使在 1.4° 的粗糙分辨率下,NeuralGCM 也能產(chǎn)生與 ERA5 相似的熱帶氣旋軌跡和數(shù)量,而全球云分辨模型 X-SHiELD 在 1.4° 分辨率下卻低估了熱帶氣旋數(shù)量。
歷史溫度趨勢(shì)模擬
AMIP 模擬:NeuralGCM-2.8° 進(jìn)行了 40 年的 AMIP 模擬,結(jié)果表明,所有模擬均準(zhǔn)確地捕捉了 ERA5 數(shù)據(jù)中觀察到的全球變暖趨勢(shì),并且年際溫度趨勢(shì)與 ERA5 數(shù)據(jù)具有強(qiáng)相關(guān)性,表明 NeuralGCM 能夠有效地模擬海溫強(qiáng)迫對(duì)氣候的影響。
與 CMIP6 模型的比較:與 CMIP6 AMIP 模型相比,NeuralGCM-2.8° 在 1981-2014 年期間的溫度偏差更小,即使在消除了 CMIP6 AMIP 模型的全球溫度偏差之后,這一結(jié)果仍然成立。
圖|NeuralGCM 在十年時(shí)間尺度上的準(zhǔn)確性和捕捉全球變暖的能力。NeuralGCM 和 AMIP 在預(yù)測(cè) 1980 年至 2020 年全球平均氣溫方面的表現(xiàn)比較。(來源:Google Research)
盡管 NeuralGCM 在天氣和氣候預(yù)測(cè)方面展現(xiàn)了強(qiáng)大的能力,但它仍然存在一些局限性。
首先,NeuralGCM 預(yù)測(cè)未來氣候的能力有限。NeuralGCM 目前無法預(yù)測(cè)與歷史氣候明顯不同的未來氣候。當(dāng)海表溫度(SST)增加幅度較大時(shí)(比如 +4K),NeuralGCM 的響應(yīng)與預(yù)期不符,并出現(xiàn)氣候漂移現(xiàn)象。
其次,NeuralGCM 模擬未觀測(cè)氣候的能力不足。與其他機(jī)器學(xué)習(xí)氣候模型類似,NeuralGCM 也面臨著模擬未觀測(cè)氣候的挑戰(zhàn),比如未來氣候或與歷史數(shù)據(jù)差異較大的氣候。這需要模型具備更強(qiáng)的泛化能力,以及更先進(jìn)的訓(xùn)練策略,比如對(duì)抗訓(xùn)練或元學(xué)習(xí)。
然后,NeuralGCM 還存在物理約束和數(shù)值穩(wěn)定性問題。例如,NeuralGCM 的譜分布仍然比 ECMWF 物理預(yù)報(bào)模糊,且在模擬熱帶極端事件方面存在低估現(xiàn)象。這需要進(jìn)一步研究和改進(jìn)模型的物理過程參數(shù)化和數(shù)值方法,以提高模型的物理一致性和數(shù)值穩(wěn)定性。
最后,缺乏與其他地球系統(tǒng)組件的耦合。目前 NeuralGCM 僅模擬大氣系統(tǒng),而氣候系統(tǒng)是一個(gè)復(fù)雜的相互作用系統(tǒng),包括海洋、陸地、冰雪和生物圈等。要進(jìn)行更全面的氣候模擬,NeuralGCM 需要與這些組件進(jìn)行耦合,并考慮它們之間的相互作用。這需要開發(fā)新的模型架構(gòu)和訓(xùn)練策略,以實(shí)現(xiàn)多物理場(chǎng)耦合模擬。
傳統(tǒng)天氣預(yù)測(cè)、氣候模擬,正被 AI 顛覆
在天氣預(yù)測(cè)和氣候模擬方面,NeuralGCM 并非“先行者”。
在過去幾年中,包括華為、谷歌和清華大學(xué)等在內(nèi)的科技公司和高校在這一方向均取得了重大進(jìn)展。
2023 年 7 月,由華為云開發(fā)的盤古氣象(Pangu-Weather)模型登上了 Nature,其使用 39 年的全球再分析天氣數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),預(yù)測(cè)準(zhǔn)確率與全球最好的數(shù)值天氣預(yù)報(bào)系統(tǒng) IFS 相當(dāng),且在相同的空間分辨率下比 IFS 系統(tǒng)快 10000 倍以上。
同期發(fā)表在 Nature 上的另一篇論文則介紹了 NowcastNet,其出自機(jī)器學(xué)習(xí)領(lǐng)域泰斗、加州大學(xué)伯克利分校教授 Michael Jordan 和清華大學(xué)教授王建民領(lǐng)導(dǎo)的研究團(tuán)隊(duì),該模型可以結(jié)合物理規(guī)律和深度學(xué)習(xí),進(jìn)行實(shí)時(shí)預(yù)報(bào)降水。
2023 年 11 月,Google DeepMind 推出了一款基于機(jī)器學(xué)習(xí)的天氣預(yù)測(cè)模型——GraphCast,在全球 0.25° 的分辨率下,該模型可以在一分鐘內(nèi)預(yù)測(cè)未來 10 天的數(shù)百個(gè)天氣變量,顯著優(yōu)于傳統(tǒng)氣象預(yù)報(bào)方法,同時(shí)在預(yù)測(cè)極端事件方面表現(xiàn)良好。相關(guān)研究論文已發(fā)表在權(quán)威科學(xué)期刊 Science 上。
今年 3 月,同樣來自 Google Research 團(tuán)隊(duì)開發(fā)的 AI 模型,擊敗了最先進(jìn)全球洪水預(yù)警系統(tǒng),其利用現(xiàn)有的 5680 個(gè)測(cè)量?jī)x進(jìn)行訓(xùn)練,可預(yù)測(cè)未測(cè)量流域在 7 天預(yù)測(cè)期內(nèi)的日徑流。
如今,傳統(tǒng)的天氣預(yù)測(cè)和氣候模擬正在被 AI 顛覆。在未來,AI 將進(jìn)一步加速氣象預(yù)測(cè)的速度和精度,造福全人類。