
近期,实验室次季节-年际气候预测团队张荣华教授和周路、陶灵江博士在中国科学院一区TOP期刊《npj Climate and Atmospheric Science》发表题为“AI-Enabled conditional nonlinear optimal perturbation enhances ensemble prediction of extreme El Niño events”的研究论文。该研究将正交条件非线性最优扰动(CNOP)技术与AI模型结合,成功研发了基于CNOP初值扰动方案的AI集合预报新方法,有效改进了极端厄尔尼诺(El Niño)事件的强度预报并减小其模拟偏差。该研究为改善确定性AI气象/气候大模型的极端事件预报能力提供了一种通用有效的解决思路。主要内容如下:
1.AI模型的强正则化特征与极端事件预测偏差
数据驱动的深度学习(DL)模型已成为天气和气候研究的重要工具。然而,由于训练数据中极端事件样本有限以及梯度优化算法具有批量平均特性及其内在平滑性,使得确定性DL模型用于现象预报时存在一个共性的缺陷,即以均方根误差为损失函数的训练范式使模型本质上倾向于拟合样本的统计平均特征。从而导致两个主要问题:(1)预报场趋于平滑化,极端值被系统性削弱;(2)随预报时长的延伸,模型预报场逐渐退化为气候态的均值。利用DL构建的3D-Geoformer模型对极端厄尔尼诺(El Niño)的预测为例(图1),当模型从春季(3月)起报得到的成熟期Niño3.4预测误差高达1.5~2℃。这些局限性和所导致的系统性误差严重制约了DL模型在极端气候事件预报、预警中的实际应用价值。

图1.(a-d)四次强厄尔尼诺(El Niño)期间的SST异常(填色)和上层150米平均海温异常(T150;等值线)随时间的演变。(e-h)3D-Geoformer模型从3月起报得到的预测结果。(i-l)四次事件中Niño3.4指数随时间的演变:黑线为观测值,蓝线为控制预测值,绿色线为添加随机初始扰动的预测。
集合预报通过对预报概率分布进行采样来克服上述局限性,其中初值扰动方案的设计直接决定了集合系统能否有效表征预报的不确定性,尤其是能否捕捉极端事件发展所依赖的敏感度。在传统数值模式及所采用的集合预报方法中,基于初始场扰动的集合预报方法已被证实能够显著提升极端事件的预测技巧。集合预报之所以成功主要是由于气候系统中存在高度的非线性和混沌特征;早期Lorenz (1963)通过理想试验揭示了初始条件的微小差异就可导致预报结果有巨大差异的现象,即著名的“蝴蝶效应”,表明天气和气候预报存在内在不可预报性的极限。基于该理论,在数值模式中引入微小的初始扰动,可通过模式变量相互作用导致随时间快速发展的模式倾向场,进而在预报目标时刻生成有足够离散度的集合预报。然而,这种在传统数值模式中行之有效的初始场扰动集合预报方法,在确定性的DL模型中却难以奏效。其主要原因在于确定性DL模型中固有的正则化特性会抑制初始扰动的发展和传播,导致集合成员间缺乏足够的离散度(图1 i-l)。
2.CNOP增长型初值扰动提升AI模型集合预报性能
如何克服DL模型的正则化效应并实现初始扰动有效增长,成为构建DL集合预报系统的核心难题。本研究提出了一种基于CNOP方法的初值扰动方案(图2),并将其应用到DL模型的集合预报中,以提升对极端厄尔尼诺事件的预测能力。CNOP方法考虑了非线性过程的影响,能够在约束条件下合理而有效求解非线性最优增长的数值解,以最小的初值扰动能量获得最大的预报误差的增长,集合成员的分布具有明确的动力学特性。

图2.基于大样本迭代优化算法的正交CNOP(O-CNOP)求解流程。控制试验(橙色框)使用未扰动的初始场X生成控制预报场Y。CNOP的计算分为四个步骤:(1)对原始候选扰动样本去掉累积阶CNOP投影后的扰动施加能量约束;(2)将条件约束后的扰动加入到初始场,进行扰动预测得到Yi,并与Y比较并筛选出候选扰动样本;(3)对候选扰动样本进行遗传迭代与变异优化;(4)将收敛后的扰动作为该累积阶的O-CNOP。
研究选取了发生在1982/83、1997/98、2015/16和2023/24年的四次强El Niño事件作为案例,系统评估了该方案对改善DL模型来预测El Niño的有效性。结果显示,当DL模型从春季起报时,基于CNOP的集合预报可将Niño3.4的预测误差降低30%以上(图3-4),并系统改善了对热带太平洋三维海温场的预测精度。
本研究采用的大样本集合优化CNOP求解算法无需构建伴随模式或显式计算模型梯度信息,仅需获取足够数量的初始扰动样本即可实现与传统梯度方法相当的优化效果。该方法的计算也不依赖特定的模型架构,因此具有较好的通用性和拓展性,可广泛应用于DL模型对极端天气和气候事件的集合预测中,为改进极端天气和气候事件等的预报提供了有效方法。

图3.(a-c)分别为三次强El Niño事件的非独立回报分析结果;其中黑线为观测值,粗蓝线为控制预报,粗红线为集合预报均值,其他彩色细线为各集合成员的预测结果。(d)Niño3.4区SST异常的预测误差及集合预报改进率;黑色和绿色分别为控制预报和集合预报平均值的预测误差(℃),紫色为集合预报平均值相比于控制预报的误差减小率。

图4.与图3相同,但在2015-2016年超强El Niño事件上的独立测试结果。
相关文章:
Zhou, L., Zhang, R.-H. & Tao, L. AI-Enabled conditional nonlinear optimal perturbation enhances ensemble prediction of extreme El Niño events. npj Clim Atmos Sci (2026). https://doi.org/10.1038/s41612-025-01303-6