Marine Hydrology

An ocean current direction correction method for high-frequency surface wave radars based on CNN-LSTM

  • XU Yi , 1 ,
  • WEI Jun , 1 ,
  • WEI Chunlei 2 ,
  • YANG Fan 2
Expand
  • 1. School of Atmospheric Sciences, Sun Yat-sen University, Southern Marine Science and Engineering Guangdong Laboratory (Zhuhai), Zhuhai 519082, China
  • 2. Zhuhai Marine Environmental Monitoring Central Station of the State Oceanic Administration, Zhuhai 519015, China
WEI Jun. email:

Copy editor: LIN Qiang

Received date: 2024-09-12

  Revised date: 2024-10-29

  Online published: 2024-11-04

Supported by

Southern Marine Science and Engineering Guangdong Laboratory (Zhuhai)(SML2020SP009)

Abstract

High-frequency surface wave radars often encounter interference from coastal topography and islands when detecting nearshore areas, leading to significant errors in the synthesized ocean current directions from radar data. Traditional high-frequency surface wave radar inversion algorithms do not account for the impact of these physical factors. To address this issue, leveraging the strengths of convolutional neural networks (CNN) and long short-term memory (LSTM) neural networks, this paper introduces a hybrid CNN-LSTM model. This model incorporates data on sea surface wind, tide, and elevation, allowing for the refinement of ocean current directions obtained from radar measurements. The experimental results show that the CNN-LSTM model, when combined with physical oceanographic factors, can effectively improve the quality of radar-detected ocean current data in areas affected by topography, significantly enhancing the accuracy of the synthesized ocean current direction. After model correction, compared to the original radar data, the directional angle error of the empirical orthogonal function ellipse decreased from 77.10° to 23.06°, the error of the ellipse’s major and minor axes decreased from 0.0896 to 0.0538, and the average flow directional angle error of the ocean currents decreased from 20.82° to 6.21°.

Cite this article

XU Yi , WEI Jun , WEI Chunlei , YANG Fan . An ocean current direction correction method for high-frequency surface wave radars based on CNN-LSTM[J]. Journal of Tropical Oceanography, 2025 , 44(3) : 24 -35 . DOI: 10.11978/2024176

珠江是中国第二大和第三长河流, 珠江口则是其主要入海口之一。珠江口位于中国广东省南部, 该区域包括多个重要城市, 如广州、深圳及香港、澳门特别行政区等, 是中国最重要的河口之一, 在制造业、航运、贸易、金融、教育和旅游等方面发挥着重大作用。虽然珠江口有相当大的经济和生态价值, 但是该区域经常面临着严重的海洋气象灾害威胁。因此, 建立高效的观测预警系统, 对珠江口的海洋环境进行实时监测具有重要意义, 这可以大幅减少海洋气象灾害带来的损失, 保护人民生命财产安全。
高频地波雷达是一种新兴的海洋观测手段, 它利用高频电磁波能够沿着地球曲面绕射的特点及海面上的目标(如波浪、海流)对电磁波的散射和反射, 基于Bragg散射原理对电磁波进行反演, 提取出风场、浪场、流场等信息, 实现对海洋表面的大范围、远距离实时监测(Crombie, 1955; Barrick et al, 1977; Liu et al, 2010; Paduan et al, 2013)。相较于传统的海洋观测设备, 高频地波雷达具有探测范围大、分辨率高、全天候、低成本等优势(吴雄斌 等, 2015)。
尽管高频地波雷达相较传统海洋观测设备具有诸多优势, 但是, 雷达电磁波在对海探测过程中容易受到地形、海面目标和障碍物的影响, 海岸线和岛屿作为自然障碍物, 能够改变电磁波的传播路径, 导致信号衰减、反射和散射等现象, 这使得雷达对海岸线及岛屿附近海流的探测精度大幅下降。传统的雷达反演算法无法很好地修正这些地形导致的误差, 因此, 需要一种能够结合空间与时间特征对雷达数据进行校正的方法。
近些年来, 机器学习被广泛应用于海洋科学领域的研究, 它不依赖于物理模型, 可以处理高维、非线性的复杂数据, 自动学习和提取数据特征, 有较强的适应性, 可以提供更为精确的预测和分析结果。Ren等(2018)提出了一种基于人工神经网络(artificial neural networks, ANN)的沿海地区海流短期预报方法, 并通过充分利用历史观测数据提高了预报精度和预报时长。蔡佳佳 等(2019)提出一种基于ANN的高频雷达风速反演方法, 反演结果明显优于常规由浪高反演风速的SMB(Sverdrup, Munk, Bretschneider)方法。Pei等(2022)提出了一种由两个生成对抗网络(generative adversarial networks, GAN)组成的新型网络来解决海杂波抑制问题, 该方法能够充分学习海杂波特性, 从而有效抑制海杂波的干扰。东松林 等(2022)结合YOLO (you only look once)模型和高阶奇异值分解(higher order singular value decomposition, HOSVD) 方法实现了高频雷达射频干扰的自动识别与抑制。Yang等(2023)提出了一种基于决策树分类(decision tree classification, DTC)的高频地波雷达目标检测方法, 该方法相较于传统的恒虚警率(constant false alarm rate, CFAR)检测方法, 目标检测精度可提高5%以上。Zhou等(2023)将双向长短期记忆神经网络 (bidirectional long short-term memory network, Bi-LSTM) 应用于雷达数据中的异常值检测, 简化了质量控制过程, 提高了雷达数据质量。于彩彩 等(2024)提出了一种使用卷积神经网(convolutional neural networks, CNN)反演波高的方法, 该方法能够提高雷达在复杂海况下对有效波高的反演精度。由此可见, 机器学习在雷达探测领域的应用研究已经十分广泛, 也说明了机器学习相较于传统方法在数据和图像处理方面的优势。
在本文中, 将结合CNN和长短期记忆(long short-term memory, LSTM)两种神经网络, 对受地形影响区域的高频地波雷达数据进行校正, 使该区域雷达探测得到的海流uv分量合成矢量速度后, 其方向更加准确。CNN能够提取雷达数据的空间特征, 而LSTM则可以捕捉雷达数据的时间特征, 通过结合这两种网络, 可以发挥它们各自的优势, 处理更复杂的数据结构。海流受到多种环境因素的影响, 其中风和潮汐是两个重要物理因素, 因此, 网络的输入中除雷达数据外, 还将加入风和潮汐的数据。此外, 考虑到岛屿、海岸线等地形因素对雷达电磁波造成的干扰, 也将加入海拔数据, 以进一步提升模型的校正能力。

1 数据与方法

1.1 高频地波雷达数据

本文中使用的高频地波雷达是武汉大学研制的OSMAR-071G高频地波雷达系统。该雷达工作的频率范围是9.305~9.355MHz, 可以探测100~150km范围内的海洋表面流和波高。使用的雷达数据来自两部高频地波雷达, 分别部署在珠江口以西的上川和万山群岛。两部雷达的覆盖范围为112°24′E—114°42′E, 20°12′N—22°N, 总探测面积约4×104km2。雷达数据的时间跨度为2020年3月1日至30日, 时间分辨率为10min, 空间分辨率为0.05°×0.05°。由于各种因素的干扰, 雷达探测数据存在部分缺失的情况, 为了保证数据的可靠性, 选取采集率超过90%的数据点作为研究对象, 本次研究所用雷达数据范围如图1所示。
图1 雷达数据范围

该图基于自然资源部标准地图服务网站下载的审图号为GS(2019)4342号的标准地图制作, 底图无修改, 下同; 黑色圆点表示雷达探测数据点

Fig. 1 Range of radar data

1.2 风、潮汐和海拔数据

本文使用的风速数据来自ERA5数据集中的10m高度处风速数据, 该数据空间分辨率为0.25°×0.25°, 时间分辨率为1h。ERA5数据集是由欧洲中期天气预报中心(European Centre for Medium-range Weather Forecasts, ECMWF)开发的第五代全球气候和天气再分析产品, 该数据集将数值天气预报模型和历史观测数据相结合, 提供了多变量的气象数据, 涵盖大气、海洋和地表等方面。潮汐数据来自俄勒冈州立大学开发的TPXO9全球潮汐模型, 该模型构建时融合了高分辨率的区域同化模型结果, 并对海床地形数据和测高数据进行了同化更新。模型的全球空间分辨率为1/6°×1/6°, 其中, 包括中国沿海区域在内的30个沿海区域的空间分辨率可达1/30°×1/30°, TPXO模型在潮汐研究和实践应用中得到了广泛的认可和使用(Egbert et al, 2002; Sun et al, 2022; 周东旭 等, 2023)。在本研究中, 使用TPXO9模型输出数据的时间分辨率为1h, 空间分辨率为0.05°×0.05°。海拔数据来自全球海陆地形数据库(general bathymetric chart of the oceans, GEBCO), GEBCO是由政府间海洋学委员会(Intergovernmental Oceanographic Commission, IOC)与国际水文组织(International Hydrographic Organization, IHO)共同主持开发的大洋水深制图项目, 包括陆地和海洋的全球地形模型, 本文所使用的是GEBCO_2024数据, 空间分辨率为15″×15″。

1.3 模式数据

由于该雷达探测区域没有现场观测数据, 因此, 在本研究中, 我们将使用由马萨诸塞大学达特茅斯分校开发, 经过伍兹霍尔海洋研究所改进而来的非结构有限体积法海洋模型(finite-volume community ocean model, FVCOM) 输出的数据作为真实值(Chen et al, 2003; Chen et al, 2007; Chen et al, 2009)。Zhu等(2022)对该模式和珠江口浮标观测的数据进行了详细对比, 结果表明FVCOM模型可以较好地模拟珠江口的潮流, 因此可以作为评估高频地波雷达探测的海流数据质量的基准, 将其视作真实值, 以便训练网络模型。训练数据包含一整年的模式数据, 其中不包含需校正日期2020年3月1日至30日的模式数据, 这样可以更准确的反应网络模型的校正效果以及泛化能力。该模型网格在珠江口内最小网格尺寸为10m, 大陆架雷达观测区的分辨率为2km, 时间分辨率为1h。

1.4 数据处理

为方便进行神经网络的训练, 须保证所用数据在时间分辨率和空间分辨率上的一致性。在我们的数据中, 雷达数据的时间分辨率高于风速、潮汐及模式数据, 模式、雷达、风速、潮汐和海拔数据之间的空间分辨率也存在差异, 因此, 在对神经网络训练之前, 需要对数据进行处理。除海拔数据外, 所有数据的时间分辨率都被调整为1h, 并对雷达数据使用4h滑动平均进行平滑处理, 以消除高频信号的影响。模式数据、风速数据及海拔数据使用反距离权重法(inverse distance weighting, IDW)进行空间插值, 使所有数据的空间分辨率均为0.05°×0.05°。

1.5 神经网络模型

1.5.1 长短期记忆神经网络

LSTM神经网络首先由Hochreiter等(1997)提出, 是一种特殊的循环神经网络(recurrent neural network, RNN), 为了解决传统RNN在处理长时间序列时梯度消失或梯度爆炸的问题, LSTM引入了两个机制, 分别是记忆元(memory cell)和门控(gated control)结构。其中, 记忆元负责存储和更新时间序列中的长期依赖信息。门控结构是指用门机制来控制状态信息的使用, 共包含三个门, 分别是遗忘门(forget gate)、输入门(input gate)和输出门(output gate), 这些门共同决定了信息的保留、更新以及最后的输出(Gers et al, 2000)。LSTM的网络结构如图2a所示, 其主要的公式如下:
${{f}_{t}}=\sigma ({{W}_{f}}\cdot [{{h}_{t-1}},{{x}_{t}}]+{{b}_{f}})$
${{i}_{t}}=\sigma ({{W}_{i}}\cdot [{{h}_{t-1}},{{x}_{t}}]+{{b}_{i}})$
${{\tilde{C}}_{t}}=\tanh ({{W}_{C}}\cdot [{{h}_{t-1}},{{x}_{t}}]+{{b}_{C}})$
${{C}_{t}}={{f}_{t}}*{{C}_{t-1}}+{{i}_{t}}*{{\tilde{C}}_{t}}$
${{o}_{t}}=\sigma ({{W}_{o}}\cdot [{{h}_{t-1}},{{x}_{t}}]+{{b}_{o}})$
${{h}_{t}}={{o}_{t}}\text{*}\tanh ({{C}_{t}})$
在上面的公式中, σ表示sigmoid激活函数; t a n h表示双曲正切激活函数; 表示点积; *表示哈达玛乘积(Hadamard); t是时间步; xt是第 t时刻的输入数据; ht是第t时刻的隐藏状态; ${{\tilde{C}}_{t}}$表示候选单元状态; Ctt时刻的单元状态; ft是遗忘门, 决定从单元状态Ct中丢弃哪些信息; it是输入门, 控制当前时刻的候选状态有多少信息需要被保存到单元状态中; ot是输出门, 输出门控制当前状态Ct有多少信息被输出到隐藏状态ht; WfWiWCWo是对应门和单元的权重; bfbibCbo是对应门和单元的偏置项。
图2 LSTM网络结构(a)和CNN-LSTM网络结构(b)示意图

FC指全连接层(fully connected layers)

Fig. 2 LSTM network structure diagram (a) and CNN-LSTM network structure diagram (b). FC refers to the fully connected layers

1.5.2 卷积神经网络

CNN是一种包含卷积计算的前馈神经网络, 利用卷积和池化操作, 能够有效提取输入数据中的局部特征, 主要用于处理具有空间结构的数据(如图像和视频等)。相较于传统神经网络(如多层感知机), CNN在参数共享、局部连接、自动特征提取、计算效率、泛化能力等方面均具备显著优势 (Fukushima, 1980; LeCun et al, 1998)。CNN的网络结构由输入层、卷积层、激活层、池化层、全连接层、输出层等多个层次组成, 其中, 卷积层是网络的核心部分, 其负责提取输入数据的局部特征, 并通过参数共享和局部连接的机制, 降低了计算复杂度、增强了泛化能力。

1.5.3 CNN-LSTM网络模型

对受岛屿、海岸线等地形因素影响的雷达探测数据进行校正, 使雷达探测数据合成的海流方向更加准确, 既要考虑地形对电磁波的干扰, 也要考虑雷达数据在时间上的关联性。CNN能够有效地提取雷达数据中的空间特征, 捕捉到雷达信号中由岛屿和海岸线等地形因素造成的局部变化。LSTM则能够很好地捕捉雷达数据中的时间依赖性, 适用于处理雷达数据随时间的变化。结合CNN和LSTM两种神经网络各自的优势, 融合空间和时间特征, 能够更好地对受地形影响区域的雷达数据进行校正。
本文构建的CNN-LSTM模型结构如图2b所示, 神经网络的输入数据均为以需校正数据点为中心点的9×9的矩阵, 即0.45°×0.45°的空间范围。CNN模块的输入数据矩阵包括海流uv分量合成的速度、潮汐流速u分量、潮汐流速v分量、风速u分量以及风速v分量, 每批次输入数据包含tt+1、…、t+9共10个时间步长的矩阵数据。输入矩阵数据经过两次卷积和池化操作后, 展平输入到LSTM模块, LSTM模块的输出与展平后的海拔数据进行组合, 最后通过全连接层(fully connected layers, FC)输出校正后的10个时间步长的uv分量。

1.6 经验正交函数椭圆

经验正交函数(empirical orthogonal function, EOF)是一种用于分析多维时间序列数据中的主要模态和变化特征的方法, 也被称为主成分分析(principal component analysis, PCA), 广泛应用于气象学、海洋学、地球物理等领域。EOF椭圆是利用EOF分析得到的一种椭圆, 用以表示分析结果中模态的方向和振幅特征, 本文中使用EOF椭圆比较雷达和模式的海表流速的时间序列。具体的方法为: 首先建立数据矩阵, 第一列和第二列分别是u分量和v分量, 然后通过EOF分析将速度矩阵分解为第一模态和第二模态。椭圆的长轴代表流速的最大标准差的特征值的第一模态, 短轴为特征值的第二模态, 椭圆的方向角使用公式 (7)计算获得:
$\theta =\arctan \left( \frac{{{v}_{2}}}{{{v}_{1}}} \right)$
式中, v1v2分别是第一模态和第二模态的特征向量(Zhu et al, 2023)。

2 实验结果

2.1 高频地波雷达和模式数据对比

图3a显示了高频地波雷达和模式的海流流速EOF椭圆的对比, 从图中可以看出, 在近海及岛屿比较多的区域, 两者的EOF椭圆在大小和方向上存在着较大差异, 这表明复杂的海岸线和岛屿可能对雷达的电磁波回波造成了很大的影响, 从而导致探测数据出现较大偏差。而在远离海岸线和岛屿的开阔海域, 两者的EOF椭圆几乎重合, 说明高频地波雷达探测得到的流场与模式模拟的结果比较一致。
图3 雷达与模式数据EOF椭圆对比图(a)及两者的方向角误差(b)

蓝色为雷达数据, 红色为模式数据, 数据点以经度0.25°、纬度0.15°的间隔绘制; 用“★”标记点A(21°57′N, 113°21′E)和点B(21°48′N, 113°06′E)

Fig. 3 EOF ellipses comparison between radar and model data (a) and their directional angle errors (b). Blue represents radar data, red represents model data, and the data points are plotted at intervals of 0.25° longitude and 0.15° latitude. Points A (21°57′N, 113°21′E) and B (21°48′N, 113°06′E) are marked with “★”

图3b中绘制了高频地波雷达反演流场与模式模拟流场的EOF椭圆之间的方向角误差, 更为直观的展示了海岸线和岛屿对雷达探测造成的干扰, 黑色虚线圈出的区域为本次研究需要校正的雷达数据区域。方向角的误差计算公式如下:
$\Delta \theta =|({{\theta }_{1}}-{{\theta }_{2}}+{{180}^{{}^\circ }})\text{mod}{{360}^{{}^\circ }}-{{180}^{{}^\circ }}|$
式中, θ1θ2分别代表模式数据EOF椭圆的方向角和雷达数据EOF椭圆的方向角, mod为取模运算, θ为两个EOF椭圆方向角的误差角度。

2.2 网络模型训练数据范围

本次研究中, 训练神经网络模型所用模式数据的范围如图4所示, 分为三个区域, 红色区域为包含需校正雷达数据区域在内的数据点, 绿色区域为不包含需校正雷达数据区域的数据点。红色和绿色区域数据点的选取规则是, 以某个数据点为中心, 在0.5°×0.5°的矩形空间范围内, 若是存在海拔高度大于0的点, 即表明存在陆地, 那么这个数据点就符合选取要求。蓝色区域则是位于远离海岸线和岛屿的开阔海域, 地形对该区域的影响十分微弱。在本文中, 若无特殊说明, 神经网络模型均使用红色区域的数据进行训练。
图4 网络模型训练时所用模式数据范围

Fig. 4 The range of model data used during the training of the neural network

2.3 单个雷达数据点校正

选取图3a中A和B两点进行校正, 以此初步检验网络模型的校正效果。使用模式数据作为基准, 网络输入的雷达数据经过4h滑动平均处理。A点u分量的均方根误差(root mean square error, RMSE)校正前后分别为0.2980和0.1972m·s-1, v分量的均方根误差校正前后分别为0.4899和0.1080m·s-1; u分量的皮尔逊相关系数(Pearson correlation coefficient, PCC) 校正前后分别为0.3377和0.5141, v分量的相关系数校正前后分别为0.1122和0.5676。为了更好地反应神经网络模型对雷达探测的海流方向的校正效果, 对海流EOF椭圆长短轴误差、EOF椭圆方向角误差以及海流的平均流方向角误差的校正结果也进行了对比。其中, EOF椭圆长短轴误差E的计算公式为
$E=\sqrt{{{({{L}_{\text{r}}}-{{L}_{\text{m}}})}^{2}}+{{({{l}_{\text{r}}}-{{l}_{\text{m}}})}^{2}}}$
式中, Lrlr分别表示雷达EOF椭圆的长轴和短轴, Lmlm分别表示模式EOF椭圆的长轴和短轴; EOF椭圆方向角和海流的平均流方向角的误差计算均使用公式(8)。A点EOF椭圆长短轴校正前后的误差分别为0.3217和0.0298; EOF椭圆方向角的误差校正前后分别为64.35°和1.98°; 海流的平均流方向角的误差校正前后分别为10.92°和0.30°。
在B点上, u分量的均方根误差校正前后分别为0.3422和0.3236m·s-1; v分量的均方根误差校正前后分别为0.3640和0.1608m·s-1; u分量相关系数校正前后分别为0.4019和0.5953; v分量的相关系数校正前后分别为0.3110和0.5780。EOF椭圆长短轴校正前后的误差分别为0.0357和0.0808; EOF椭圆方向角的误差校正前后分别为64.36°和6.39°; 海流的平均流方向角的误差校正前后分别为21.90°和1.59°。
通过A、B两点的雷达数据校正的情况可以看出, 神经网络模型的校正效果是十分显著的。其中, v分量均方根误差和相关系数的提升幅度比u分量更大, 这是因为A、B两点位于海岸线的下方, 海岸线对雷达电磁波造成的干扰主要是南北方向上的, 所以校正时, v分量的提升会比u分量更大。此外, uv分量的均方根误差、相关系数以及EOF椭圆长短轴误差的提升程度不如角度相关指标的提升显著, 尤其是B点的EOF椭圆长短轴误差甚至扩大了一些, 这是因为该网络模型的核心设计目标是对雷达探测数据合成海流的方向进行校正, 神经网络的输入中使用的是uv分量合成的矢量速度, 输出的是不同位置的海流在东西和南北方向上的流速分量, 网络模型学习到的是地形对不同位置处海流方向的影响。所以, 下文中, 对于雷达数据的校正效果评估将以EOF椭圆方向角误差、海流的平均流方向角误差以及EOF椭圆长短轴误差作为主要评判指标。

2.4 区域雷达数据校正

为了检验网络模型在受地形影响区域的普遍适用性, 使用该网络模型对整个受影响区域的雷达数据进行校正, 校正结果如图5b所示。通过对比图5a图5b可以发现, 经过神经网络模型校正后, EOF椭圆的长短轴误差、方向角误差以及平均流的方向角误差均有显著提升, 展现了网络模型优秀的校正能力。
图5 原始雷达数据与模式数据的EOF椭圆对比图(a)及校正后雷达数据与模式数据的EOF椭圆对比图(b)

数据点以经度0.15°、纬度0.10°的间隔绘制。a、b中蓝色分别是原始雷达数据和网络模型校正后数据的EOF椭圆, 红色是模式数据的EOF椭圆, 箭头表示平均流方向

Fig. 5 EOF ellipses contrast graph (a) between original radar data and model data and EOF ellipses contrast graph (b) between corrected radar data and model data. Data points are plotted at intervals of 0.15° longitude and 0.10° latitude. In (a) and (b), blue represents the EOF ellipses of the original radar data and the neural network corrected data, respectively, and red represents the EOF ellipses of the model data. The arrows indicate the direction of the mean flow

图6所示, 为了更为直观的展现校正效果, 对校正前后雷达和模式数据的EOF椭圆方向角误差以及平均流方向角误差进行了绘制。从图6ab两图的对比中可以看出, 雷达数据在经过神经网络校正后, 大部分区域的EOF椭圆方向角误差大幅减小, 但在东北角和西南角两个方向上的部分区域仍然存在着较大误差。而图6cd两图的平均速度误差也呈现出相似的特征, 虽然整体的误差减小十分显著, 但是校正后雷达数据平均流方向角在西南角方位上也有较大的误差。之所以会出现这样的现象, 一个可能的原因是网络模型训练时所用的模式数据和2020年3月的模式数据在东北角和西南角这两个区域上存在较大差异, 从而导致模型的校正效果不佳。
图6 雷达数据校正前(a)和校正后(b)的EOF椭圆方向角误差对比, 以及雷达数据校正前(c)和校正后(d)的平均流方向角误差对比

Fig. 6 (a) and (b) are comparison charts of the directional angle errors of EOF ellipses before and after correction of radar data, respectively, and (c) and (d) are comparison charts of the mean flow directional angle errors before and after correction of radar data, respectively

此外, 为了对比使用不同区域的模式数据训练的影响, 下面的实验将使用图4中不同颜色区域的模式数据对神经网络进行训练: (1)使用红色区域模式数据; (2)使用绿色区域模式数据; (3)使用蓝色区域模式数据。其中使用绿色和蓝色区域模式数据进行训练时, 由于都不包含需校正雷达区域对应的模式数据, 因此将对网络结构进行一些调整, 将图2b中的海拔数据矩阵先经过一次卷积层和池化层, 然后展平与LSTM层的输出组合在一起输入到全连接层中, 这样做的目的是提升网络模型的泛化能力, 优化校正效果。每个区域的网络模型都进行3次训练, 每次训练结束后进行一次校正, 最终取3次校正结果的平均值。雷达数据的校正结果如图7所示, 表中数据均为所有需校正数据点校正后的平均值, 同时给出了雷达原始数据作为参考。
图7 网络模型使用不同区域数据训练的校正效果对比

Fig. 7 Comparison of correction effects using data from different regions for training the neural network model

图7的数据对比可看出, 使用红色区域数据训练的网络模型在各项指标上的校正效果均为最好, 绿色区域次之, 蓝色区域最差。这是因为红色区域的训练数据包含了需要校正雷达数据所在区域, 模型在训练时能够充分学习到海岸线、岛屿等地形对该区域海流方向的影响, 从而抑制地形对雷达探测造成的干扰, 实现最好的校正效果。而绿色区域的数据虽然未包含需校正雷达数据所在区域, 但是其包含的数据靠近海岸线和岛屿, 因此模型训练时也能够学习到地形的影响, 但在校正精度上相较红色区域数据训练的网络存在不足。绿色区域训练的模型对EOF椭圆的长短轴误差和方向角误差的校正效果较好, 但平均流方向角误差则会有一定程度的劣化。蓝色区域的训练数据由于位于开阔海域, 模型训练时完全无法学习到地形造成的影响, 校正效果自然是最差的, 对EOF椭圆的长短轴误差和方向角误差的校正效果尚可, 但是平均流方向角误差则出现了大幅度的劣化。因此, 下文中的网络模型训练仍然将使用红色区域数据, 以实现最好的校正效果。

2.5 不同参数的网络模型校正效果

CNN-LSTM网络模型的训练周期设置为200轮, 网络模型的权重参数使用Adam优化算法进行更新, 初始学习速率设置为0.001, 卷积层中的卷积核大小设置为3×3, 为了防止模型过拟合, 增强模型的泛化能力, 在模型训练过程中使用L2正则化, 权重衰减系数设置为0.00001。为获得校正效果最好的网络模型参数, 在模型的训练过程中分别对卷积层层数、LSTM模块的隐藏层层数进行调整, 对比不同参数下模型的校正效果。为保证结论的准确性, 每种网络模型进行3次训练, 每次训练结束后进行一次校正, 最终取3次校正结果的平均值。从表1中可以看出, CNN-LSTM模型在卷积层层数为2, LSTM的隐藏层层数为160时, 综合校正结果最好。虽然在EOF椭圆长短轴误差和平均流方向角误差这两项指标上, 相较于一些参数下的网络模型校正效果稍差, 但在EOF椭圆方向角误差上的校正效果最好, 校正后的雷达数据相较图7中原始雷达数据的三个指标, 平均提升幅度达到60.06%。
表1 不同卷积层、隐藏层数量的神经网络模型校正效果对比

Tab. 1 Comparison of correction effects of neural network models with different numbers of convolutional layers and hidden layers

卷积层数量 隐藏层数量 椭圆长短轴误差 椭圆方向角误差 平均流方向角误差 三个指标平均提升幅度
1 80 0.0767 25.31° 8.66° 46.65%
1 160 0.0775 25.65° 8.79° 45.99%
1 240 0.0766 25.20° 8.81° 46.49%
2 80 0.0558 24.67° 6.14° 58.73%
2 160 0.0538 23.06° 6.21° 60.06%
2 240 0.0555 24.13° 6.83° 57.97%
4 80 0.0535 23.61° 8.52° 56.24%
4 160 0.0500 23.79° 8.41° 57.64%
4 240 0.0553 23.33° 8.38° 55.91%
将网络模型的卷积层数量固定为2, LSTM的隐藏层数量固定为160后, 对卷积层的卷积核大小和dropout层的失活率也进行了调整。其中, dropout层被添加在卷积层和LSTM层的后面, 它的作用是通过在训练过程中随机失活一些神经元来减少模型对特定神经元的依赖, 增强模型的泛化能力。校正结果如表2所示, 首先将失活率设为0, 修改卷积核的大小, 在卷积核大小为3×3时, 校正效果最佳。然后, 固定卷积核大小对失活率进行调整, 可见在提升失活率后, 各项指标的校正效果均变差。因此, 网络模型的卷积层层数为2, LSTM的隐藏层层数为160, 卷积核大小为3×3, 失活率为0时, 模型的综合校正效果达到最佳。
表2 不同卷积核大小、dropout层失活率的神经网络模型校正效果对比

Tab. 2 Comparison of correction effects of neural network models with different convolutional kernel sizes and dropout rates

卷积核大小 失活率 椭圆长短轴误差 椭圆方向角误差 平均流方向角误差 三个指标平均提升幅度
2 0 0.0624 24.06° 7.47° 54.41%
3 0 0.0538 23.06° 6.21° 60.06%
4 0 0.0505 23.79° 7.29° 59.24%
3 0.25 0.0593 23.17° 9.31° 53.00%
3 0.5 0.0708 24.57° 9.87° 47.22%

2.6 敏感性实验

为了探究风速、潮汐流速以及海拔数据在CNN-LSTM模型训练中各自的贡献, 在本小节进行了一次敏感性实验, 每个实验中的网络模型将输入不同组合的物理特征: 实验(1)输入雷达海流数据+潮流数据+海拔数据; 实验(2)输入雷达海流数据+风速数据+海拔数据; 实验(3)输入雷达海流数据+风速数据+潮流数据; 实验(4)输入雷达海流数据+风速数据+潮流数据+海拔数据。为保证结果的准确性, 每种网络模型进行3次训练, 每次训练结束后进行一次校正, 最终取3次校正结果的平均值。图8ab为实验(1) (2)校正后的雷达数据与模式数据的EOF椭圆对比图, 对比图5b可以看出, 这两组实验的校正效果会略差一些。
图8 雷达数据经过神经网络模型校正后与模式数据的EOF椭圆对比

a. 神经网络模型的输入为雷达海流数据+潮流数据+海拔数据; b. 神经网络模型的输入为雷达海流数据+风速数据+海拔数据, 数据点以经度0.15°、纬度0.10°的间隔绘制

Fig. 8 Comparison of EOF ellipses between neural network corrected radar data and model data. In (a), the input to the neural network model is radar ocean current data + tidal current data + elevation data. In (b), the input to the neural network model is radar ocean current data + wind speed data + elevation data. Data points are plotted at intervals of 0.15° longitude and 0.10° latitude

表3列出了敏感性实验的校正结果对比, 同时给出了未经校正的雷达原数据作为参考。雷达数据校正后相较原始雷达数据在3个指标上, 4组实验的平均提升幅度分别为50.15%、50.22%、47.78%、60.06%。从实验(1)和实验(2)可以看出, 在CNN-LSTM网络模型的输入项中, 加入的无论是潮流数据还是海表面风速, 都可以显著提高受地形影响区域的雷达探测的海流数据质量。其中, 潮流数据的加入对EOF椭圆的长短轴误差和平均流的方向角误差校正效果提升显著, 但EOF椭圆方向角误差的校正效果稍差。而风速则对EOF椭圆方向角误差和长短轴误差的提升比较大, 但平均流方向角误差的校正效果则比较一般。综合来看, 两组实验校正后的提升幅度相差很小, 说明潮汐和海表面风对该区域的海流影响几乎同等重要。实验(3)和实验(4)中比较了海拔数据的作用, 加入海拔数据的实验(4)相较实验(3)在各项指标上均有提升, 在EOF椭圆方向角误差和平均流方向角误差的校正效果上提升尤为显著。虽然模型的输入是雷达海流数据、风速数据以及潮流数据的数据矩阵, 即便这些已经包含了矩阵区域的部分空间特征, 但是海拔数据矩阵的加入仍然可以进一步改善校正效果。通过这次敏感性实验表明, CNN-LSTM模型结合物理海洋因子后, 可以对受地形影响区域的雷达探测数据合成的海流方向进行有效校正, 显著提高雷达数据的质量, 实验(4)中将各项物理特征都加入后, 校正效果在四组实验中最佳。
表3 神经网络模型敏感性实验的校正效果对比

Tab. 3 Comparison of correction effects in sensitivity experiments of the neural network model

实验 椭圆长短轴误差 椭圆方向角误差 平均流方向角误差
实验1 0.0540 35.57° 8.97°
实验2 0.0589 26.32° 10.29°
实验3 0.0629 28.18° 10.38°
实验4 0.0538 23.06° 6.21°
原始数据 0.0896 77.01° 20.82°

3 结论

本研究中, 我们提出了一种基于CNN-LSTM的组合神经网络模型对受海岸线、岛屿等地形影响的雷达探测数据进行校正, 提高雷达探测数据合成的海流方向准确性。该模型结合了CNN提取空间特征的优势以及LSTM捕捉时间特征的优势, 同时在模型的输入中加入海面风、潮汐以及海拔数据, 提供物理信息来约束模型, 优化模型的校正效果。结果表明, 结合潮汐、风、海拔这些物理海洋因子后, CNN-LSTM神经网络模型能够显著降低地形对雷达探测造成的干扰, 提高雷达探测海流方向的准确性。校正后的雷达探测海流数据在EOF椭圆的方向角误差和长短轴误差上分别提升70.06%、39.96%, 在平均流方向角误差上的提升幅度则可达70.17%, 三个指标的平均提升幅度达到60.06%。准确的海流方向数据可以帮助改进海洋动力学模型, 提高对海洋环流、潮流等现象的理解和预测能力, 推动海洋科学技术的进步和应用的发展。
但正如图6中所展示的, 部分区域的矫正效果有待进一步提升, 一方面需要对网络模型的结构和参数进行优化, 增强模型的泛化能力。另一方面, 加入更多的不同时间段的数据对模型进行训练, 增加训练集的多样性, 使模型能够充分学习到各种情况下的海流变化。网络模型的训练过程中使用的是模式数据, 而模式数据可能无法完全准确地再现真实世界的复杂性和多样性, 难以捕捉复杂海域或极端天气条件下海洋环境的细微变化, 这会导致模型泛化能力不足, 如果实际的海洋条件与模拟条件有较大差异, 那么校正后的结果对比实际观测数据则会出现较大误差。此外, 文中的CNN-LSTM网络模型主要是针对雷达探测数据合成海流的方向进行校正, 因此对海流的流速大小的校正效果不佳, 这也是未来需要研究改进的一个方向。
在神经网络模型的训练过程中, 不包含需校正日期2020年3月1日至30日的模式数据, 这意味着训练好的模型不局限于2020年3月的雷达数据校正, 也能用于该区域任何时间段的数据校正, 不需要每次校正不同时间的数据都重新训练模型, 这可以大幅降低时间成本, 更具有实际应用价值。同时, 我们也对比了使用不同区域模式数据训练的神经网络模型的校正效果, 可以知道使用图4红色区域的模式数据进行训练得到的模型校正效果最好。但使用图4绿色区域的模式数据进行训练时, 网络模型依然有一定的校正效果, 其中, EOF椭圆的方向角误差和长短轴误差校正后分别提升54.91%、23.51%。这表明, 若是训练数据包含大量受不同地形影响的海流数据, 其校正效果或许不会比使用图4红色区域的模式数据进行训练的模型差多少, 这将增强模型的泛化能力, 大幅提升不同地形影响下的雷达数据校正效果。未来随着实测数据的逐渐丰富, 使用实测数据进行训练的网络模型有望进一步提升校正精度, 深度学习在高频地波雷达数据的校正上将发挥更大作用。
[1]
蔡佳佳, 曾玉明, 周浩, 等, 2019. 基于人工神经网络的高频雷达风速反演[J]. 海洋学报, 41(11): 150-155.

CAI JIAJIA, ZENG YUMING, ZHOU HAO, et al, 2019. Wind speed inversion of high frequency radar based on artificial neural network[J]. Haiyang Xuebao, 41(11): 150-155 (in Chinese with English abstract).

[2]
东松林, 岳显昌, 吴雄斌, 等, 2022. 基于深度学习的高频雷达射频干扰自动识别与抑制[J]. 雷达科学与技术, 20(3): 260-271.

DONG SONGLIN, YUE XIANCHANG, WU XIONGBIN, et al, 2022. Automatic identification and suppression of radio frequency interference of HF radar based on deep learning[J]. Radar Science and Technology, 20(3): 260-271 (in Chinese with English abstract).

[3]
吴雄斌, 张兰, 柳剑飞, 2015. 海洋雷达探测技术综述[J]. 海洋技术学报, 34(3): 8-15.

WU XIONGBIN, ZHANG LAN, LIU JIANFEI, 2015. Overview of detecting techniques using oceanographic radars[J]. Journal of Ocean Technology, 34(3): 8-15 (in Chinese with English abstract).

[4]
于彩彩, 楚晓亮, 王曙曜, 2024. 基于卷积神经网络的高频地波雷达有效波高反演[J]. 海洋科学进展, 42(1): 126-136.

YU CAICAI, CHU XIAOLIANG, WANG SHUYAO, 2024. Significant wave height inversion of high frequency surface wave radar based on convolutional neural network[J]. Advances in Marine Science, 42(1): 126-136 (in Chinese with English abstract).

[5]
周东旭, 孙维康, 付海德, 等, 2023. 三种最新全球海潮模型在中国沿海的精度评估[J]. 海洋科学进展, 41(1): 54-63.

ZHOU DONGXU, SUN WEIKANG, FU HAIDE, et al, 2023. Accuracy assessment of three latest global ocean tide models in coastal areas of China[J]. Advances in Marine Science, 41(1): 54-63 (in Chinese with English abstract).

[6]
BARRICK D E, EVANS M W, WEBER B L, 1977. Ocean surface currents mapped by radar[J]. Science, 198(4313): 138-144.

PMID

[7]
CROMBIE D D, 1955. Doppler spectrum of sea echo at 13. 56 Mc. /s[J]. Nature, 175(4459): 681-682.

[8]
CHEN CHANGSHENG, LIU HEDONG, BEARDSLEY R C, 2003. An unstructured grid, finite-volume, three-dimensional, primitive equations ocean model: application to coastal ocean and estuaries[J]. Journal of Atmospheric and Oceanic Technology, 20(1): 159-186.

[9]
CHEN CHANGSHENG, HUANG HAOSHENG, BEARDSLEY R C, et al, 2007. A finite volume numerical approach for coastal ocean circulation studies: Comparisons with finite difference models[J]. Journal of Geophysical Research: Oceans, 112(C3): C03018.

[10]
CHEN CHANGSHENG, GAO GUOPING, QI JIANHUA, et al, 2009. A new high-resolution unstructured grid finite volume Arctic Ocean model (AO-FVCOM): an application for tidal studies[J]. Journal of Geophysical Research: Oceans, 114(C8): C08017.

[11]
EGBERT G D, EROFEEVA S Y, 2002. Efficient inverse modeling of barotropic ocean tides[J]. Journal of Atmospheric and Oceanic Technology, 19(2): 183-204.

[12]
FUKUSHIMA K, 1980. Neocognitron: a self organizing neural network model for a mechanism of pattern recognition unaffected by shift in position[J]. Biological Cybernetics, 36(4): 193-202.

DOI PMID

[13]
GERS F A, SCHMIDHUBER J, CUMMINS F, 2000. Learning to forget: continual prediction with LSTM[J]. Neural Computation, 12(10): 2451-2471.

DOI PMID

[14]
HOCHREITER S, SCHMIDHUBER J, 1997. Long short-term memory[J]. Neural Computation, 9(8): 1735-1780.

DOI PMID

[15]
LECUN Y, BOTTOU L, BENGIO Y, et al, 1998. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 86(11): 2278-2324.

[16]
LIU YONGGANG, WEISBERG R H, MERZ C R, et al, 2010. HF radar performance in a low-energy environment: CODAR SeaSonde experience on the west Florida shelf[J]. Journal of Atmospheric and Oceanic Technology, 27(10): 1689-1710.

[17]
PADUAN J D, WASHBURN L, 2013. High-frequency radar observations of ocean surface currents[J]. Annual Review of Marine Science, 5: 115-136.

DOI PMID

[18]
PEI JIFANG, YANG YU, WU ZEBIAO, et al, 2022. A sea clutter suppression method based on machine learning approach for marine surveillance radar[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 15: 3120-3130.

[19]
REN LEI, HU ZHAN, HARTNETT M, 2018. Short-term forecasting of coastal surface currents using high frequency radar data and artificial neural networks[J]. Remote Sensing, 10(6): 850.

[20]
SUN WEIKANG, ZHOU XINGHUA, ZHOU DONGXU, et al, 2022. Advances and accuracy assessment of ocean tide models in the Antarctic ocean[J]. Frontiers in Earth Science, 10: 757821.

[21]
YANG ZHIQING, LAI YEPING, ZHOU HAO, et al, 2023. Improving ship detection based on decision tree classification for high frequency surface wave radar[J]. Journal of Marine Science and Engineering, 11(3): 493.

[22]
ZHOU CHUNYE, WEI CHUNLEI, YANG FAN, et al, 2023. A quality control method for high frequency radar data based on machine learning neural networks[J]. Applied Sciences, 13(21): 11826.

[23]
ZHU LANGFENG, LU TIANYI, YANG FAN, et al, 2022. Comparisons of tidal currents in the Pearl River Estuary between high-frequency radar data and model simulations[J]. Applied Sciences, 12(13): 6509.

[24]
ZHU LANGFENG, YANG FAN, YANG YUFAN, et al, 2023. Designing theoretical shipborne ADCP survey trajectories for high-frequency radar based on a machine learning neural network[J]. Applied Sciences, 13(12): 7208.

Outlines

/