海洋水文学

基于PredRNN++模型对南海中尺度涡旋的预测研究

  • 赵杰 ,
  • 林延奖 ,
  • 刘燃 ,
  • 杜榕
展开
  • 复旦大学大气与海洋科学系, 上海 200438
赵杰。 email:

赵杰(1996—), 男, 安徽省铜陵市人, 硕士研究生, 主要从事人工智能海洋学研究。email:

Copy editor: 孙翠慈

收稿日期: 2023-05-12

  修回日期: 2023-06-08

  网络出版日期: 2023-06-20

Prediction of mesoscale eddies in the South China Sea based on the PredRNN++ model

  • ZHAO Jie ,
  • LIN Yanjiang ,
  • LIU Ran ,
  • DU Rong
Expand
  • Department of Atmospheric and Oceanic Science, Fudan University, Shanghai 200438, China
ZHAO Jie. email:

Copy editor: SUN Cuici

Received date: 2023-05-12

  Revised date: 2023-06-08

  Online published: 2023-06-20

摘要

基于26年的海表面高度异常、海表面风速异常、海表面温度异常资料, 利用时空序列预测模型PredRNN++, 本文预报 1~28d时效的南海中尺度涡旋轨迹和南海西部偶极子活动。结果表明, PredRNN++模型能从整体上考虑整个南海区域时空演变特征和环境风场、温度场的作用, 在短期(1~2周)、中期(3~4周)预报上具有良好的性能。该模型具备一定预报涡旋产生、消亡的能力, 且能将涡旋轨迹4周预报误差控制在42.1km, 对于生命时长小于100d的涡旋生命中期的位置、振幅预报误差小。此外模型在8—11月份的月平均、4天平均下的任意时间点和任意预报时效下均能较好地追踪到偶极子结构的演变、强度变化, 偶极子涡旋相关属性预报误差最小且存在年际、类型差异, 2017年涡旋1~4周振幅位置、预报、半径误差最小, 分别为40~60km、3~5cm、20~40km, 且气旋涡位置预报效果优于反气旋涡。

本文引用格式

赵杰 , 林延奖 , 刘燃 , 杜榕 . 基于PredRNN++模型对南海中尺度涡旋的预测研究[J]. 热带海洋学报, 2024 , 43(1) : 16 -27 . DOI: 10.11978/2023060

Abstract

Based on 26 years of data on sea level anomalies, sea surface wind speed anomalies, and sea surface temperature anomalies, using the spatiotemporal series prediction model PredRNN++, this paper predicts the trajectory of mesoscale eddies in the South China Sea and dipole activity in the western South China Sea over a period of 1 to 28 days. The results indicate that the PredRNN++model can comprehensively consider the spatiotemporal evolution characteristics of the entire South China Sea region and the role of environmental wind and temperature fields, and has good performance in short-term (1~2weeks) and medium-term (3~4weeks) forecasting. This model has the ability to predict the generation and disappearance of eddies to a certain extent, and can control the 4-cycle prediction error of eddy trajectories to 42.1 km. For eddies with a lifespan of less than 100 days, the mid-term position and amplitude prediction error are small. In addition, the model can better track the evolution and intensity change of dipole structure at any time point under the monthly average, 4-day average and any forecast time effect in August-November. The prediction error of dipole eddy related attributes is the smallest and there are interannual and type differences. In 2017, the amplitude position, prediction and radius error of eddy 1-4 cycles are the smallest, which are 40~60 km, 3~5 cm and 20~40 km respectively, and the prediction effect of cyclone position is better than that of anticyclone.

中尺度涡旋蕴藏了90%的海洋动能(Martínez-Moreno et al, 2021), 在海洋的物质、能量以及一些海洋示踪剂的运输方面起到重要的作用(Dong et al, 2014; Zhang et al, 2014; Li et al, 2017; Zhang et al, 2020), 对气候也有重要影响(Chow et al, 2012)。南海是热带西太平洋最大的半封闭边缘海(Shaw et al, 1999), 南海与周边海域有丰富的水体交换通道, 具有频繁的中尺度涡信号(Wang et al, 2000)。南海涡旋预报不仅仅与区域环流、气候、军事(李佳讯 等, 2011)有关, 而且对全球涡旋的预报也具有一定的借鉴作用。夏季南海的海盆尺度环流在北部呈现弱气旋性而南部呈反气旋性, 在这两个环流之间有一股强劲的从越南中部转向的东流, 称为越南离岸流(Kuo et al, 2000)。在越南离岸流南北两侧存在一对气旋和反气旋的偶极子涡对。偶极子涡旋属于夏秋季的涡旋(Chen et al, 2010), 具有年周期性。偶极子结构6月出现, 在8月或9月达到峰值强度, 在10月减弱, 并在10月底消散(Wang et al, 2006; Chen et al, 2011)。越南沿海偶极子相关的上升流和环流变化直接影响南海的营养分布和生物量生产力(Dippner et al, 2007; Li et al, 2014), 因此准确预测偶极子涡旋结构和时间演变的能力可以提供可靠的海洋信息, 更好地为水产养殖业服务。
传统的涡旋预报方法主要基于统计预报和数值模式两种方法。统计预报方面, Li提出了一种简单的多元线性回归模型, 它用反映β效应与平均流作用的参数来预报涡旋未来四周的轨迹(Li et al, 2019), Xia等人在2019年通过经验正交函数分析(empirical orthogonal function, EOF)方法定义了偶极子指数, 成功预测了偶极子的时间演化和强度变化, 提前一个月和一年预报的准确率分别达到了78%和61%(Xia et al, 2018)。数值预报方面, Robbison通过各向异性统计模型预报了中尺度涡旋未来2周的演变过程(Robinson et al, 1984)。随着资料同化技术的发展以及计算机算力、模式分辨率的提高, 模式预报能力也在提高。2016年韩等人则基于HYCOM (hybrid coordinate oceanic circulation model)模式和AVISO(archiving, validation and interpretation of satellite oceanographic) 观测资料再现了菲律宾西部海域中黑潮内的中尺度涡旋脱落个例(韩玉康 等, 2016), 2022年Qiu等人则通过LICOM模式模拟了2007—2017年十年间侵入南海大陆架的中尺度涡旋(Qiu et al, 2022)。随着高性能计算和观测系统的发展, 一些研究聚焦在物理过程、参数化方案、资料同化算法上, 但是仍存在模式对初始条件的敏感(Thoppil et al, 2021), 以及耗费计算资源等问题。
近些年来人工智能技术快速发展(Das et al, 2020), 气象海洋方面多元观测资料不断完善、数据量剧增, 深度学习模型相比数值模型占用的计算资源较少, 快速且灵活, 而且它完全是数据驱动, 抓取数据特征的能力强, 这就使很多方法在气象海洋领域得到应用(Zeng et al, 2015; Zhang et al, 2017; Xiao et al, 2019a)。Reichstein等人将深度学习在气象海洋领域可应用的领域分为分类问题、融合问题、短临预报问题、时间序列建模问题(Reichstein et al, 2019)。短临预报模型会用到很多挖掘时空序列信息的时空序列预测模型。Shi等人提出了多层端到端的卷积长短期记忆网络(conventional long-short-term memory network, ConvLSTM)并将其应用于降水预报, 其预报精度相比传统方法大大提高, 之后TrajGRU (trajectory gated recurrent unit)、PredRNN和PredRNN++模型等时空序列预测模型被提出(Shi et al, 2015; Shi et al, 2017; Wang et al, 2017; Wang et al, 2018)。Xiao等人在东海某区域使用ConvLSTM模型进行中短期海温变化预测, 预报时效为10天的误差的RMSE(root mean square error)为0.9°C左右(Xiao et al, 2019b)。Ma等人使用Prednet模型预测未来7天南海区域的海表面高度异常SLA(sea level anomaly)并结合涡旋检测追踪算法完成对涡旋的预报(Lotter et al, 2017; Ma et al, 2019)。
本文利用近年来比较前沿的可用于时空序列预测的PredRNN++深度学习模型框架, 基于1993—2018年的SLA、海表面风速异常SPDA(wind speed anomaly)、海表面温度异常SSTA(sea surface temperature anomaly)时空序列数据集, 训练一个能够预测和重构未来28天南海区域SLA的模型并在测试集上检验模型性能, 此后结合AVISO官方涡旋检测追踪算法便可以获得涡旋轨迹及属性预报结果并进行相关分析, 如图1
图1 实验流程图

Fig. 1 Experimental flowchart

1 数据

本文选取的是南海区域(5°—25°N, 105°—125°E)作为涡旋预报和相关分析的区域。本文训练模型用到了三种数据集: 来自CMEMS(Copernicus marine environment monitoring service)的网格海表面高度异常SLA数据集, 这个数据集融合了TOPEX/ Poseidon、欧洲遥感卫星(ERS-1和ERS-2)、Geosat Follow-on、Jason-1和Jason-2卫星以及Envisat的数据; 网格海表面风速异常SPDA数据集来自Cross-Calibrated Multi-Platform (CCMP) V2.0数据集, 风速异常数据则是在网格风速数据的基础上减去风速气候态值获得; 海表面温度异常SSTA数据集则来自NOAA (National Oceanic and Atmospheric Administration)的Optimum Interpolation (OI) Sea Surface Temperature (SST) V2 High高分辨率数据集(https://psl.noaa.gov/data/gridded/data.noaa.oisst.v2.highres.html)。这些异常数据集均为1993年到2018年连续26年的时间序列, 时间分辨率为1天, 空间分辨率为0.25°×0.25°。本文中还用了AVISO官方中尺度涡旋轨迹数据集(https://www.aviso.altimetry.fr/en/data/ data-access)作为涡旋检测追踪结果的比较和参考对象, 该数据集基于Chelton和Schlax提出的算法(Chelto et al, 2011), 并经过DUACS (data unification and altimeter combination system)系统处理获得。涡旋轨迹数据集中主要包含中尺度涡振幅、旋转速度、半径、涡旋中心位置的经纬度坐标等信息; 空间分辨率为0.25°×0.25°, 数据集的时间分辨率为 1天。

2 研究方法

2.1 时空序列预测模型PredRNN++介绍

本文使用的是Yunbo Wang在2018年提出的PredRNN++模型(Wang et al, 2018)。PredRNN++相对于PredRNN提高了动态捕捉能力和时空信息的提取能力。该模型提出了一种新的单元时空记忆单元的级联操作(cascading operation of spatiotemporal memory unit, CasualLSTM), 如图2a所示, 这种单元可以将时间记忆$C_{t}^{k}$与空间记忆$M_{t}^{k}$级联混合(图2a中的同心圆), 通过增加更多的非线性操作如tanh函数、σ函数来放大特征, 从而达到捕捉短期动态变化和突发情况的效果。这对于基于在时间和空间上具有高度的非线性和可变性的SLA的涡旋运动特征的捕捉是非常有利的。此外该模型还引入了时空递归结构GHU(gradient highway unit), 如图2b所示, 此单元能够在非常深(图中k的数值较大)的前馈网络中有效地传递梯度, 减缓了网络深度增加带来的梯度减弱的问题, 从而能够捕捉到序列中的长时间的信息依赖关系, 考虑到时间尺度不同而导致的不同的海洋内部变率也对SLA数值也会有影响, 模型的这一特性对于提高SLA及涡旋预报效果有积极影响。此前预测海洋变量的大多数模型输入往往是单变量, 而实际海洋环境中不同变量之间存在动力和热关系, 因此本文的模型输入使用多个热力或者动力相关的变量增加物理意义, 而模型本身具有的放大时间、空间相关的特征, 这将有利于SLA及涡旋预报。另外考虑到在气象领域中应用于短临预报的模型其在海洋要素预报中或许可以增大预报时效, 而海洋本身相对于大气是慢过程, 因此本文对于SLA和涡旋的预报时效最长为28天。
图2 a. 时空记忆单元的级联操作CasualLSTM结构; b. PredRNN++总体结构

H、 C、 M、Z分别代表隐藏层状态、时间记忆、空间记忆、用于传递梯度的隐藏层状态

Fig. 2 (a) for the CasualLSTM structure, (b) represents H, C, M, and Z in the overall structure diagram of PredRNN++, representing the hidden layer state, temporal memory, spatial memory, and hidden layer state used to transfer gradients

$\left( \begin{matrix} {{g}_{t}} \\ {{i}_{t}} \\ {{f}_{t}} \\ \end{matrix} \right)=\left( {{\begin{matrix} tanh \\ \sigma \\ \sigma \\ \end{matrix}}_{1}}\left[ {{X}_{t}},H_{t-1}^{k},C_{t-1}^{k} \right] \right)$
$C_{t}^{k}={{f}_{t}}\odot C_{t-1}^{k}+{{i}_{t}}\odot {{g}_{t}}$
$\left( \begin{matrix} g_{t}^{\text{ }\!\!'\!\!\text{ }} \\ i_{t}^{\text{ }\!\!'\!\!\text{ }} \\ f_{t}^{\text{ }\!\!'\!\!\text{ }} \\ \end{matrix} \right)=\left( {{\begin{matrix} tanh \\ \sigma \\ \sigma \\ \end{matrix}}_{2}}\left[ {{X}_{t}},C_{t}^{k},M_{t}^{k-1} \right] \right)$
$M_{t}^{k}=f_{t}^{\text{ }\!\!'\!\!\text{ }}\odot \tanh ({{W}_{3}}\text{*}M_{t}^{k-1})+i_{t}^{\text{ }\!\!'\!\!\text{ }}\odot g_{t}^{\text{ }\!\!'\!\!\text{ }}$
${{o}_{t}}=\tanh \left( {{W}_{4}}\text{*}\left[ {{X}_{t}},C_{t}^{k},M_{t}^{k} \right] \right)$
${{H}_{t}}={{o}_{t}}\text{*}\tanh \left( {{W}_{5}}\text{*}\left[ C_{t}^{k},M_{t}^{k} \right] \right)$
$H_{t}^{1},C_{t}^{1},M_{t}^{1}=\text{CausalLST}{{\text{M}}_{1}}\left( {{X}_{t}},H_{t-1}^{1},C_{t-1}^{1},M_{t-1}^{L} \right)$
${{Z}_{t}}=\text{GHU}\left( H_{t}^{1},{{Z}_{t-1}} \right)$
$H_{t}^{2},C_{t}^{2},M_{t}^{2}=\text{CausalLST}{{\text{M}}_{2}}\left( {{Z}_{t}},H_{t-1}^{2},C_{t-1}^{2},M_{t}^{1} \right)$
$H_{t}^{k},C_{t}^{k},M_{t}^{k}=\text{CausalLST}{{\text{M}}_{k}}\left( H_{t}^{k-1},H_{t-1}^{k},C_{t-1}^{k},M_{t}^{k-1} \right)$

2.2 模型的参数设置及训练

模型输入的相关物理量异常数据均为时空序列, 它包含了时间和空间两方面信息。本文将输入的含有四类数据集, 包括SLA、SSTA、SPDUA(经向方向风速异常)、SPDVA(纬向风速异常), 这四类数据集最后会划分为1993年到2014年的训练集、2015年到2016年的验证集、2017年到2018年的测试集。作为模型的输入的训练集的形状为(8035, 80, 80, 4), 8035为训练集中总天数, 80×80是格点数据的形状, 验证集与测试集天数分别为731和730天。之后通过滑动窗口的方法将数据集切片为长度为56的序列, 它包括前28天的输入和28天的输出。模型内部如图2b中的一些连接在具体操作中被适当舍弃。在数据预处理阶段, 地形区域格点数据值被赋值为0, 每一类输入数据集$data$进行标准化处理获得$dat{{a}_{\text{norm}}}$, 方法公式如下, 其中$dat{{a}_{\text{min}}}$是数据集的最小值, $dat{{a}_{\text{max}}}$是数据集的最大值:
$dat{{a}_{\text{norm}}}=\frac{data-\text{ }\!\!~\!\!\text{ }dat{{a}_{\text{min}}}}{dat{{a}_{\text{max}}}-\text{ }\!\!~\!\!\text{ }dat{{a}_{\text{min}}}}$
模型训练的时期(epoch)的次数设置为50, 批大小(batch size)为6, 卷积核大小为3×3, 模型总共4层, 而隐藏层分别为64、32、32和32, 模型对数据集进行层标准化(layer normalization), 整个训练过程采用学习率递减策略, 其中学习率为0.000005, 在epoch为40时开始学习率衰减, 学习率衰减率为0.2。模型应用Adam优化器, 利用L2正则化损失函数以及早停法来控制模型的过拟合情况的发生。模型训练过程中利用模型在验证集上的表现来挑选训练过程中保存的模型, 模型是在epoch小于20时每隔5个epoch、epoch大于20时每隔1个epoch储存该epoch下训练获得的模型并在验证集上做验证, 这样每个epoch下模型的在验证集上的验证结果都对应一个预报误差的最小值$\text{SL}{{\text{A}}_{\text{min}}}$, 统计验证过程中的每一个epoch对应的模型所对应的$\text{SL}{{\text{A}}_{\text{min}}}$, 如果发现其随着epoch变化是局部最小值则将该训练模型以及$\text{SL}{{\text{A}}_{\text{min}}}$储存, 最后在存储的若干个$\text{SL}{{\text{A}}_{\text{min}}}$值中找出$\text{min}\left( \text{SL}{{\text{A}}_{\text{min}}} \right)$对应的那个模型作为调参最优模型, 将其运用到测试集上获得预报结果。

2.3 涡旋检测追踪算法和涡旋追踪效果的对比检验

本文按照不同预报时效对SLA预报结果进行划分, 根据不同预报时效将SLA预报结果重新排列, 获得时间范围在2015年1月29至2018年12月4日的若干预报时效的SLA时空序列, 加之观测的SLA时空序列, 本文在此基础上进行涡旋检测追踪获得有运动轨迹的涡旋和没有运动轨迹的孤立涡旋的预报和观测涡旋数据集。
本文采用的是AVISO官方中尺度涡旋数据集META(mesoscale eddy trajectories atlas product)3.0所用的涡旋检测追踪算法代码(https://github.com/AntSimi/ py-eddy-tracker)。针对南海地区SLA格点数据, 算法首先会对SLA格点数据集进行高通滤波, 之后将扫描获得局部SLA极值像素点并搜索SLA轮廓线, 在此过程中轮廓线内部像素点数目的最大最小值、形状误差、轮廓线内SLA局部极值个数、振幅大小范围均可被人为限制。经过迭代搜索多次直至所有区域做完涡旋检测。此后在涡旋检测的基础上进行涡旋检测, 筛选条件是后一天的涡旋落在前一天涡旋位置为中心的椭圆范围内, 并且其与属性相关的损失函数相比其他候选的涡旋为最小值, 整个流程如图3
图3 涡旋检测追踪算法流程

Fig. 3 Eddy detection and tracking algorithm process

随后本文会将观测涡旋轨迹数据集中的观测涡旋与预报涡旋轨迹数据集的预报涡旋进行比较、对应, 之后通过涡旋检测结果找到是否有没有轨迹的孤立预报涡旋与无对应观测涡旋。能够对应的预报涡旋$pred\_eddy$和观测$obs\_eddy$的属性该满足以下公式条件, 其下标$lonlattypetime$分别代表涡旋中心位置的经度、纬度、涡旋的类型、涡旋所在时间点:
$\left| pred\_edd{{y}_{\text{lon}}}-obs\_edd{{y}_{\text{lon}}} \right|< =0.5$
$\left| pred\_edd{{y}_{\text{lat}}}-obs\_edd{{y}_{\text{lat}}} \right|<\text{=0}\text{.5}$
$pred\_edd{{y}_{t\text{ype}}}=obs\_edd{{y}_{\text{type}}}$
$pred\_edd{{y}_{\text{time}}}=obs\_edd{{y}_{\text{time}}}$
本文之后所提及某一天比如时间点为$t$的某个预报时效$j$下的预报结果均是指$t-j$天往后预报$j$天而获得的$t$时间点的预报结果。在时间点$t$的涡旋相关信息为$obs\_eddy_{t}^{j=0}$, $j=$0表示是观测数据集时间点; $t-j$天往后预报$j$天而获得的时间点$t$的涡旋集为$pred\_eddy_{t}^{j}$, 涡旋预报误差数据集$diff\_eddy_{t}^{j}$即等于两者之差, 其定义公式如下, 这类数据集包括了涡旋轨迹、属性的预报误差。
$diff\_eddy_{t}^{j}=pred\_eddy_{t}^{j}-obs\_eddy_{t}^{j=0}$

3 结果与分析

本实验中的预报误差分析中会使用预报误差值的RMSE或者MAE(mean absolute error)作为评估指标, 统计的是追踪到的涡旋的预报误差RMSE定义如下, 其中${{y}_{i}}$代表预报值, $\widehat{{{y}_{i}}}$代表观测值, ${{y}_{i}}-\widehat{{{y}_{i}}}$为预报误差, $m$代表所选取的样本数:
$\text{RMSE}=\sqrt{\frac{1}{m}\underset{i=1}{\overset{m}{\mathop \sum }}\,{{\left( {{y}_{i}}-\widehat{{{y}_{i}}} \right)}^{2}}}$
MAE定义如下, 其中${{y}_{i}}$代表预报值, $\widehat{{{y}_{i}}}$代表观测值, ${{y}_{i}}-\widehat{{{y}_{i}}}$为预报误差, $m$代表所选取的样本数:
$\text{MAE}=\frac{1}{m}\underset{i=1}{\overset{m}{\mathop \sum }}\,\left| {{y}_{i}}-\widehat{{{y}_{i}}} \right|$

3.1 模型预报性能评估

为了评估模型对涡旋轨迹的预报结果, 本文利用2015—2018年四年内南海区域的AVISO官方中尺度涡旋轨迹数据集进行1~28天的预报, 分别应用了LSTM、梯度提升算法(gradient boosting)、随机森林、 extra tree等方法以及Li等人的回归模型的方法, 具体步骤是先把SLA进行涡旋检测追踪获得生命时长大于56天的涡旋数据集, 然后用滑动窗口获得输入28天输出28天序列训练模型并进行测试, 具体结果如表1。从表1中可以看出与其他机器学习或者LSTM方法比较, 例如1周预报误差表现最为优良的是Gradient boosting和本文方法, 3周预报最小的LSTM方法和本文方法, 本文的方法在1到4周的预报结果均为最优。涡旋轨迹预报误差在1周和1周之后的预报误差存在较大差异, 而在2~4周预报误差上变化不明显, 3、4周预报误差相差不大均在42km之内, 且经向、纬向误差均能控制在30km范围内, 这体现了作为PredRNN模型的升级版PredRNN++模型在预报涡旋时兼具短临预报和中期预报的优势。
表1 多个模型涡旋位置预报误差RMSE统计表

Tab. 1 Statistical table of RMSE of SLA prediction errors for multiple models

模型名称 1周预报误差
(经向/纬向预报误差)/km
2周预报误差
(经向/纬向预报误差)/km
3周预报误差
(经向/纬向预报误差)/km
4周预报误差
(经向/纬向预报误差)/km
回归模型
(Li et al, 2019)

(32.7/29.5)

(55.1 /47.3)

(72.5 /61.4)

(89.2 /73.5)
LSTM 36.5
(23.4/28.0)
51.8
(34.8/38.4)
68.7
(47.3/49.8)
84.8
(58.5/61.4)
Gradient boosting 31.2
(22.5/21.6)
59.1
(41.6/41.7)
83.6
(57.8/60.1)
104.3
(72.2/74.9)
随机森林 51.3
(40.2/31.6)
68.1
(51.8/44.0)
86.9
(64.4/58.1)
105.1
(76.6/71.5)
Extra tree 47.2
(38.0/27.8)
69.1
(53.3/43.6)
89.9
(67.0/59.6)
108.8
(79.8/73.4)
Extra tree
(Wang et al, 2020)

(28.8/23.8)

(36.9/30.6)

(41.9/34.1)

(47.2/37.2)
PredRNN++ 28.1
(19.7/20.0)
36.4
(25.6/25.8)
40.8
(28.8/28.7)
42.1
(29.3/30.0)

注: — 表示无数据

3.2 涡旋预报结果

3.2.1 涡旋个数追踪结果

本文将观测SLA时空序列检测出涡旋轨迹与Chelton涡旋数据集进行对照, 它们极为相似, 这证明了涡旋检测算法的有效性。模型的区域SLA预报不准会导致一些观测涡旋无法被追踪到。表2第二列显示的就是轨迹涡旋比较、对应阶段中被追踪到的观测涡旋个数, 可以看出在各个预报时效中观测涡旋基本都能被追踪到。由于用来检测追踪涡旋的预报SLA时空序列来源于一定预报时效之前的预报, 如果预报涡旋是在产生初期或者生命末期, 模型均可能存在无法追踪涡旋产生或者消亡状态的情况。本模型在追踪涡旋生消的同时也首次检验了模型在成功追踪涡旋产生和消亡过程的比率。表2中第三、四列的指标即分别代表了以上两种情况的追踪情况, 可以看出预报时效小于10天的涡旋产生的追踪比率在20%左右, 而预报时效小于10天对于涡旋轨迹最后一天的追踪比率在50%左右, 这表明模型追踪涡旋产生比涡旋消亡更困难一点。
表2 涡旋追踪个数统计表

Tab. 2 Statistical table for the number of eddy trackers

预报
时效
观测涡旋轨迹
追踪到个数
涡旋轨迹第一天被追踪到的涡旋轨迹个数 涡旋轨迹最后一天被
追踪到的涡旋轨迹个数
1 549 297 381
2 549 239 388
3 549 211 367
4 549 181 357
5 549 165 338
6 548 153 316
7 548 129 319
14 528 71 192
21 482 66 110
28 426 47 82

3.2.2 涡旋属性和位置预报误差统计

为了探究涡旋生命时长和涡旋生命阶段对涡旋预报效果的影响, 我们首先根据生命总时长将涡旋划分为50天以下(E1)、51天到100天(E2)、100天以上(E3)三类, 再根据涡旋生命阶段将预报误差分区间统计。这时引入一个参数$r$, 其反映了涡旋生命阶段。之后我们根据此参数的大小分区间统计振幅、位置预报误差, 如图4$r$值定义如下:
$r=\frac{涡旋生命周期中所处的天数}{涡旋生命总时长}$
图4 不同类型涡旋预报误差与预报时效、涡旋演变阶段(r)的关系图

a. 涡旋生命周期不同时期(横轴)的不同预报时效下(颜色)的振幅; b. 位置预报误差RMSE(纵轴). 每个子图从左往右分别为E1、E2、E3三类涡旋, 不同颜色代表不同预报时效, 从1周到4周, 横轴为r值, 表征涡旋所处的生命阶段

Fig. 4 The relationship diagrams (a) and (b) between the prediction errors of different types of eddies and their prediction time and evolution stages show the RMSE of amplitude and position prediction errors (vertical axis) of different prediction times (colors) at different stages of the eddy life cycle (horizontal axis).

Each subgraph represents three types of eddies, E1, E2, and E3, from left to right. Different colors represent different prediction times, from 1 to 4 weeks, and the horizontal axis represents the r value, representing the life stage of the eddy

图4a可以看出: 生命时长在100天以下的涡旋的振幅预报误差总体相对其他两类最小, 同类涡旋的振幅预报误差随着预报时效的增大而增大。对于E1类涡旋来说, 涡旋生命前中期($r$在0.2~0.3左右)的预报误差随着预报时效的增加而增加, 而涡旋生命中后期($r$ > 0.6)则呈现下降趋势, 但其一周预报的误差却在涡旋生命末期反而增加($r$> 0.7)。对于E2类涡旋, 随着预报时效的增加, 涡旋生命中期($r$在0.3~0.6左右)附近的误差显著增大, 并且预报时效为3周的误差最大, 此外1周预报的误差随涡旋生命阶段变化不大。E3类涡旋预报误差均是生命初期最大, 随着涡旋的发展演变, 误差反而呈现明显的减小趋势。这可能与模型固定的卷积核大小导致模型在追踪不同种类特性的涡旋结构变化方面的差异有关。
图4b可以看出: 不同类型的涡旋的位置预报误差大致相当, 且1周预报误差与2~4周预报误差分别明显: 1周预报误差在30km以内, 2~4周预报误差超过了30km, 但是2~4周之间误差差距不大; E3类涡旋的1周预报误差最小; 另外对于E1、E2类生命时长小于100涡旋其初期及消亡末期的位置预报误差较大而中期误差较小。E3类大涡旋的预报误差则随着涡旋发展演变变化不大, 这可能与小涡旋在初期末期更容易受到周边环境影响导致位置随机性增大有关。

3.3 偶极子演变过程的追踪预报

3.3.1 偶极子结构的不同时间尺度下的追踪

本文选取了越南偶极子演变区域分析相关预报结果, 对越南东部区域(6°N—18°N, 106°E—116°E)偶极子结构较为明显稳定的2017—2018年7—11月份SLA的从1周到4周的不同预报时效的预报结果、观测结果进行月平均并进行比较, 如图5。从图5a可以看出在2017年7月份单个反气旋涡以及沿岸狭长的海平面下沉被很好地预报, 但在4周预报结果中出现了一个并不存在的气旋涡; 7—9月份的稳定的偶极子结构在任何预报时效下均能被追踪到, 但是8月份的四周预报结果图中反气旋涡不是很明显。图5b反映出模型能很好地预报2018年7—10月份的稳定的反气旋涡结构以及气旋涡从狭长近岸区域脱离到回归狭长气旋涡结构最后稳定的过程。整体结果显示, 偶极子相关的气旋涡的预报误差主要体现在气旋涡周边区域的SLA预报上, 比如这两年偶极子结构比较稳定的9月份。此外3~4周的预报结果中气旋涡中心或者周边的SLA的预报值偏小且深水区扩大, 而反气旋涡中心或者周边SLA值预报值则大多偏小。
图5 2017年及2018年7—11月份越南东海岸偶极子的观测分布图和预报分布图

a. 2017; b. 2018。每张子图自左往右对应观测分布图、预报时效1~4周的预报分布图, 自上而下对应7—11月份

Fig. 5 Observation and forecast distribution maps of the dipole on the east coast of Vietnam from July to November 2017 (a) and 2018 (b).

Each sub map corresponds to the observation distribution map and the forecast distribution map with a prediction time of 1~4 weeks from left to right, and corresponds to July to November from top to bottom

为了探究模型对偶极子演变过程的更小时间尺度上的预报效果。本文选取了2017、2018两年的8月1日到11月1日的越南东部区域到的预报和观测的SLA时空序列, 按照每4天平均的方法得到长度为23的SLA的时空序列并进行涡旋检测追踪。偶极子结构存在的判定条件是气旋涡和反气旋涡同时存在, 且经纬度在一定区间内。偶极子活跃区域内的预报涡旋与观测涡旋对应的判定条件为两者距离小于175km, 且预报涡旋与观测涡旋的经度纬度差值在一定范围内。偶极子涡旋观测结果显示2017年、2018年偶极子稳定出现的时间段分别为8月25日到10月16日、8月21日到9月30日。本文选取了这些时间点绘制了图6, 其显示了2017、2018两年偶极子结构演变过程的预报结果。从图中可以看出偶极子中气旋涡均有离开越南沿岸向北运动再向南稳定在某个位置上的演变特征, 而反气旋涡的位置较为稳定, 模型在大多数预报时效、时间点上对此现象均能很好地追踪。对于2017年, 除了8月29日到9月10日的3~4周预报中气旋涡和反气旋涡不能被追踪到, 其他预报时效、时间点上偶极子涡旋的位置、形状的追踪效果均很好。相比2017年, 2018年各个时间点的偶极子的位置、形状的追踪效果最佳, 即使在反气旋涡、气旋涡较小较弱的情况下仍能追踪到。
图6 2017、2018年8—11月份越南东海岸偶极子的4天平均下的追踪效果图

(a)、(b)分别代表着2017、2018年, (a)自上而下依次对应8月29日到10月24日时间范围内4天间隔的时间点, (b)自上而下依次对应8月25日到10月4日时间范围内4天间隔的时间点, (a)、(b)子图中第1列为越南东海岸SLA及偶极子结构观测结果, 第2~5列代表1~4周预报时效下越南东海岸SLA及偶极子结构预报结果, 黑色、红色轮廓线分别为气旋涡、反气旋涡边缘

Fig. 6 The 4-day average tracking effect of the dipole on the east coast of Vietnam from August to November 2017 and 2018, represented by (a) and (b), respectively, (a) corresponding to the 4-day interval between August 29 and October 24 from top to bottom, (b) corresponding to the 4-day interval between August 25 and October 4 from top to bottom, the first column in the sub figure (a) and (b) shows the observation results of SLA and dipole structure on the east coast of Vietnam, and the second to fifth columns represent the prediction results of SLA and dipole structure on the east coast of Vietnam under the 1~4 week forecast time effect. The black and red outlines are the edges of cyclones and anticyclone, respectively

3.3.2 偶极子强度的预报

偶极子强度可以由偶极子结构中气旋涡和反气旋涡的振幅的绝对值之和来表征, 其值越大代表偶极子结构越强、偶极子越稳定。本文根据3.3.1的追踪结果统计了2017、2018年4天平均下的偶极子强度观测和预报结果, 如图7图7a中可以看出2017年偶极子强度经历了从最初的局部小值到两个峰值、两个低值之后数值上升到一个稳定值的过程, 图中1周偶极子强度预报最好, 且峰值预报值较为接近观测值, 而偶极子强度低值预报方面存在较大误差; 2~4周的偶极子强度预报仅能与1个观测偶极子强度的峰值以及低值对应, 且偶极子结构末期的偶极子强度预报均低于观测偶极子强度。图7b可以看出2018年偶极子强度预报结果均小于观测结果, 观测偶极子结构与预报偶极子结构均在同一时间点达到峰值和在10月4日下降到低值, 但是随着预报时效的增加, 偶极子初期强度和趋势预报误差显著增加。
图7 2017、2018年8—11月份越南东海岸偶极子强度观测及预报值随着时间变化的折线图

不同颜色的折线分别代表偶极子强度的观测值、1~4周预报值随着时间点的变化, (a)、(b)分别代表着2017、2018年, 横轴代表时间, 纵轴代表偶极子指数大小

Fig. 7 A line chart showing the changes of dipole intensity observation and forecast values along the east coast of Vietnam from August to November 2017 to November 2018.

The lines in different colors represent the changes of dipole intensity observation values and 1~4 week forecast values along time points, (a) and (b) represent 2017 and 2018 respectively, the horizontal axis represents time, and the vertical axis represents dipole index size

3.3.3 偶极子涡旋预报误差的年际、类型差异

本文在3.3.1的追踪结果的基础上使用了MAE作为指标统计了偶极子涡旋不同预报时效下的位置和振幅误差。如图8。图中可以看出: 偶极子涡旋的预报存在年际差异, 2017年的预报结果要好优于2018年。在位置预报方面, 2018年是偶极子中反气旋涡的位置误差大于气旋涡, 而2017年则相反, 2017年偶极子气旋涡、反气旋涡误差在40~60km范围内, 且4周预报时效位置误差在60km左右。在振幅预报方面, 2017年的偶极子涡旋的振幅预报1~4周误差均在3~5cm左右, 2018年的偶极子气旋涡预报误差随着预报时效增大陡增, 由图8可知在越南东岸偶极子气旋涡的形状和振幅预报确实存在肉眼上的偏差, 但是位置预报较小, 反气旋涡振幅预报误差在1~4周其预报结果也能控制在4cm之内。在半径预报方面, 气旋涡半径预报误差相对较小, 2017、2018年4周预报误差均在40~50km以下, 且2018年的反气旋涡半径各个预报时效上的预报误差均大于2017年。总之, 2017年偶极子涡旋属性预报误差较小, 2018年偶极子结构中气旋、反气旋涡追踪个数多但偶极子中反气旋涡的位置预报以及气旋涡的振幅预报存在较大误差, 我们注意到2017、2018年分别是拉尼娜年和厄尔尼诺年, 这可能是导致2018年气旋涡、反气旋涡预报误差差异的原因。
图8 2017(a—c)与2018(d—f)年偶极子结构中气旋涡与反气旋涡误差随着预报时效的变化图

红色、蓝色折线分别代表反气旋涡、气旋涡, 图中自左向右各行分别为位置误差、振幅误差、半径误差的MAE值

Fig. 8 The change of errors of Mesocyclone and anticyclone in the dipole structure with the prediction time effect in 2017 (a, b, c) and 2018 (d, e, f).

The red and blue broken lines represent anticyclone and cyclone, respectively, and the lines from left to right in the figure are MAE of position errors, amplitude errors and radius errors. The abscissa of each sub figure is the prediction time effect

4 结论

本文得到了如下结论:
(1)本文验证了PredRNN++模型对于短中期SLA和涡旋优异的预报能力。此外模型具备一定预报涡旋产生和消失的能力。模型对于小于100天的生命时长较短的涡旋的振幅预报误差总体最小, 4周预报误差在5cm左右, 这类涡旋生命中期的位置预报误差也较小, 4周预报误差在40km左右。
(2)模型能在月平均、4天平均下的任意时间和任意预报时效下追踪到偶极子结构的位置, 且模型在四个预报时效的时间尺度上均能很好地模拟2017年、2018年偶极子演变。偶极子强度预报方面, 2018年1~4周偶极子强度预报结果均能模拟观测偶极子强度的变化, 而2017年的预报结果只能模拟观测偶极子强度变化的一部分, 但2017年偶极子预报误差比2018年小, 其1~4周振幅位置、预报、半径误差最小, 分别为40~60km、3~5cm、20~40km。
(3)本文发现一部分涡旋未被模型追踪, 未来可以通过模型内部的改进、将更多的物理要素的融入模型、增大模型输入的格点时空序列数据的大小、采用动态大小变化的卷积核来捕捉多种运动速度的涡旋、提升特征提取能力, 以期获得更好的效果。
[1]
韩玉康, 周林, 吴炎成, 2016. 基于HYCOM的南海中尺度涡数值模拟[J]. 海洋通报, 35(3): 299-316.

HAN YUKANG, ZHOU LIN, WU YANCHENG, 2016. Numerical simulation of the mesoscale eddy in the South China Sea based on HYCOM[J]. Marine Science Bulletin, 35(3): 299-316 (in Chinese with English abstract).

[2]
李佳讯, 张韧, 陈奕德, 等, 2011. 海洋中尺度涡建模及其在水声传播影响研究中的应用[J]. 海洋通报, 30(1): 37-46.

LI JIAXUN, ZHANG REN, CHEN YIDE, et al, 2011. Ocean mesoscale eddy modeling and its application in studying the effect on underwater acoustic propagation[J]. Marine Science Bulletin, 30(1): 37-46 (in Chinese with English abstract).

[3]
CHELTON D B, SCHLAX M G, SAMELSON R M, 2011. Global observations of nonlinear mesoscale eddies[J]. Progress in Oceanography, 91(2): 167-216.

DOI

[4]
CHEN GENGXIN, HOU YIJUN, CHU XIAOQING, 2011. Mesoscale eddies in the South China Sea: mean properties, spatiotemporal variability, and impact on thermohaline structure[J]. Journal of Geophysical Research, 116(C6): C06018.

[5]
CHEN GENGXIN, HOU YIJUN, ZHANG QILONG, et al, 2010. The eddy pair off eastern Vietnam: interannual variability and impact on thermohaline structure[J]. Continental Shelf Research, 30(7): 715-723.

DOI

[6]
CHOW C H, LIU QINYU, 2012. Eddy effects on sea surface temperature and sea surface wind in the continental slope region of the northern South China Sea[J]. Geophysical Research Letters, 39(2): L02601.

[7]
DAS M, GHOSH S K, 2020. Data-Driven approaches for spatio-temporal analysis: a survey of the state-of-the-arts[J]. Journal of Computer Science and Technology, 35(3): 665-696.

DOI

[8]
DIPPNER J W, NGUYEN K V, HEIN H, et al, 2007. Monsoon-induced upwelling off the Vietnamese coast[J]. Ocean Dynamics, 57(1): 46-62.

DOI

[9]
DONG CHANGMING, MCWILLIAMS J C, LIU YU, et al, 2014. Global heat and salt transports by eddy movement[J]. Nature Communications, 5(1): 3294.

DOI

[10]
KUO N-J, ZHENG QUANNAN, HO C-R, 2000. Satellite observation of upwelling along the Western Coast of the South China Sea[J]. Remote Sensing of Environment, 74(3): 463-470.

DOI

[11]
LI JIAXUN, WANG GUIHUA, XUE HUIJIE, et al, 2019. A simple predictive model for the eddy propagation trajectory in the northern South China Sea[J]. Ocean Science, 15(2): 401-412.

DOI

[12]
LI JIAXUN, WANG GUIHUA, ZHAI XIAOMING, 2017. Observed cold filaments associated with mesoscale eddies in the South China Sea[J]. Journal of Geophysical Research: Oceans, 122(1): 762-770.

DOI

[13]
LI YUANLONG, HAN WEIQING, WILKIN J L, et al, 2014. Interannual variability of the surface summertime eastward jet in the South China Sea[J]. Journal of Geophysical Research: Oceans, 119(10): 7205-7228.

DOI

[14]
LOTTER W, KREIMAN G, COX D, 2017. Deep predictive coding networks for video prediction and unsupervised learning[J/OL]. https://doi.org/10.48550/arXiv.1605.08104.

[15]
MA CHUNYONG, LI SIQING, WANG ANNI, et al, 2019. Altimeter observation-based eddy nowcasting using an improved Conv-LSTM network[J]. Remote Sensing, 11(7): 783.

DOI

[16]
MARTÍNEZ-MORENO J, HOGG A M, ENGLAND M H, et al, 2021. Global changes in oceanic mesoscale currents over the satellite altimetry record[J]. Nature Climate Change, 11(5): 397-403.

DOI

[17]
QIU CHUNHUA, YI ZHENHUI, SU DANYI, et al, 2022. Cross-Slope heat and salt transport induced by slope intrusion eddy’s horizontal asymmetry in the Northern South China Sea[J]. Journal of Geophysical Research: Oceans, 127(9): e2022JC018406.

[18]
REICHSTEIN M, CAMPS-VALLS G, STEVENS B, et al, 2019. Deep learning and process understanding for data-driven Earth system science[J]. Nature, 566(7743): 195-204.

DOI

[19]
ROBINSON A R, CARTON J A, MOOERS C N K, et al, 1984. A real-time dynamical forecast of ocean synoptic/mesoscale eddies[J]. Nature, 309(5971): 781-783.

DOI

[20]
SHAW P-T, 1999. The seasonal variation of the intrusion of the Philippine Sea water into the South China Sea[J]. Journal of Geophysical Research: Oceans, 96(C1): 821-827.

[21]
SHI XIBNGJIAN, GAO ZHIHAN, LAUSEN L, et al, 2017. Deep learning for precipitation nowcasting: a benchmark and a new model[J]: 5622-5632. https://arxiv.org/abs/1706.03458

[22]
SHI XINGJIAN, CHEN ZHUORONG, WANG HAO, et al, 2015. Convolutional LSTM Network: a machine learning approach for precipitation nowcasting[J/OL]. https://arxiv.org/abs/1506.04214v2

[23]
THOPPIL P G, FROLOV S, ROWLEY C D, et al, 2021. Ensemble forecasting greatly expands the prediction horizon for ocean mesoscale variability[J]. Communications Earth & Environment, 2(1): 89.

[24]
WANG GUIHUA, CHEN DAKE, SU JILIAN, 2006. Generation and life cycle of the dipole in the South China Sea summer circulation[J]. Journal of Geophysical Research, 111(C6): C06002.

[25]
WANG LIPING, KOBLINSKY C J, HOWDEN S, 2000. Mesoscale variability in the South China Sea from the TOPEX/Poseidon altimetry data[J]. Deep Sea Research Part I: Oceanographic Research Papers, 47(4): 681-708.

DOI

[26]
WANG XIN, WANG HUIZAN, LIU DONGHAN, et al, 2020. The prediction of oceanic mesoscale eddy properties and propagation trajectories based on machine learning[J]. Water, 12(9): 2521.

DOI

[27]
WANG YUNBO, GAO ZHIFENG, LONG MINGSHENG, et al, 2018. PredRNN++: towards a resolution of the Deep-in-Time dlemma in spatiotemporal predictive learning[J/OL]. https://arxiv.org/abs/1804.06300

[28]
WANG YUNBO, LONG MINGSHENG, WANG JIANMIN, et al, 2017. PredRNN: Recurrent Neural Networks for predictive learning using spatiotemporal LSTMs[C]// GUYON I, LUXBURG U V, BENGIO S, et al. Advances in Neural Information Processing Systems 30. Long Beach: Curran Associates, Inc.:879-888.

[29]
XIA QIONG, HE YIJUN, DONG CHANGMING, et al, 2018. Prediction of the South China Sea Dipole using SSA-MEM[J]. Atmosphere-Ocean, 56(4): 240-253.

DOI

[30]
XIAO CHANGJIANG, CHEN NENGCHENG, HU CHULI, et al, 2019a. A spatiotemporal deep learning model for sea surface temperature field prediction using time-series satellite data[J]. Environmental Modelling & Software, 120: 104502.

[31]
XIAO CHANGJIANG, CHEN NENGCHENG, HU CHULI, et al, 2019b. Short and mid-term sea surface temperature prediction using time-series satellite data and LSTM-AdaBoost combination approach[J]. Remote Sensing of Environment, 233: 111358.

DOI

[32]
ZENG XIANMING, LI YIZHEN, HE RUOYING, 2015. Predictability of the Loop Current Variation and Eddy Shedding Process in the Gulf of Mexico using an Artificial Neural Network approach[J]. Journal of Atmospheric and Oceanic Technology, 32(5): 1098-1111.

DOI

[33]
ZHANG QIN, WANG HUI, DONG JUNYU, et al, 2017. Prediction of sea surface temperature using long short-term memory[J]. IEEE Geoscience and Remote Sensing Letters, 14(10): 1745-1749.

DOI

[34]
ZHANG ZHENGGUANG, QIU BO, 2020. Surface chlorophyll enhancement in mesoscale eddies by submesoscale spiral bands[J]. Geophysical Research Letters, 47(14): e2020GL088820.

[35]
ZHANG ZHENGGUANG, WANG WEI, QIU BO, 2014. Oceanic mass transport by mesoscale eddies[J]. Science, 345(6194): 322-324.

DOI PMID

文章导航

/