Marine Hydrology

Application of convolutional neural network to sea surface temperature prediction in the coastal waters

  • WENG Shaojia ,
  • CAI Jinhai ,
  • PANG Yunxi ,
  • LUO Rongzhen
Expand
  • Shantou Marine Center, Ministry of Natural Resources, Shanwei 516600, China;
LUO Rongzhen, email:

Copy editor: SUN Cuici

Received date: 2023-03-23

  Revised date: 2023-04-23

  Online published: 2023-06-19

Supported by

Science and Technology Plan Projects of Guangdong Province(2021B1212050025)

Abstract

Concerning the low sea surface temperature (SST) prediction accuracy of numerical modeling and empirical methods in near-shore stations, we consider sea surface temperature prediction as forecasting of multivariate time series data, construct the sea surface temperature time series model of near-shore stations by convolutional neural network (CNN) to predict the maximum, minimum and mean sea surface temperature for the next day, and compare CNN model with empirical forecast method and long short-term memory (LSTM) model through experiment. The experimental results show that compared with empirical forecast method, the mean absolute error (MSE) of CNN model on daily maximum SST forecast drops 0.14℃ to 0.36℃, root mean squared error (RMSE) drops 0.21℃ to 0.49℃, the MSE of CNN model on daily minimum SST forecast drops 0.17℃ to 0.36℃, RMSE drops 0.24℃ to 0.63℃, the MSE of CNN model on daily mean SST forecast is 0.30℃, RMSE is 0.47℃, its forecast performance is as good as LSTM model in the testing set. It shows that the application of CNN to SST modeling is feasible, improve the accuracy of sea surface temperature prediction which can compare favorably with LSTM model.

Cite this article

WENG Shaojia , CAI Jinhai , PANG Yunxi , LUO Rongzhen . Application of convolutional neural network to sea surface temperature prediction in the coastal waters[J]. Journal of Tropical Oceanography, 2024 , 43(1) : 40 -47 . DOI: 10.11978/2023037

海水温度是表征海水冷热程度的一个物理量。海水温度状况一直以来是海洋研究中的一个重要方面。海温预报已广泛应用于海洋渔业、海洋资源开发、海洋工程建设、国防军事等领域。海温预报主要方法可概括为三类: 数值预报方法、经验预报方法、统计预报方法 (张建华, 2003)。数值方法是根据动力学和热力学方程建立数值模式。经验预报方法是预报员根据海温变化的持续性、周期性、相似性以及其他要素相关性进行人工预测。统计预报方法是运用数理统计学从大量的历史观测资料中找出海温变化的统计规律, 来预报未来海温。目前绝大部分海温分析和预报是采用统计方法。其中, 多元分析方法、时间序列分析方法、交叉谱等统计方法已广泛应用到海温预报中(张建华, 2004)。时间序列分析方法把海温变化看成随时间变化的数值序列, 每一时刻的海温变化和过去的海温变化有密切关系, 可以利用这种关系建立掌握海温变化规律的模型, 并利用建立的模型对未来海温变化进行预报。多元时间序列分析法认为海温的变化规律不仅与过去的海温有关, 还会受到其他海洋要素变化的影响。
在近岸区域海温预报中, 由于受地形精度、潮汐过程、海陆作用影响, 数值预报对海温预报准确度不高, 无法直接应用到近岸海温预报中。因此研究人员将数值预报和偏差订正释用方法结合起来, 用于中国近岸海域海温预报(王兆毅 等, 2020)。目前中国近岸海洋预报产品主要根据近岸台站的水文气象实测资料, 利用经验预报和统计预报方法开展日平均海温预报(李燕 等, 2007; 庄桦, 2014)。经验预报法需要以海温连续性为基础, 并且依赖预报员的经验、技巧和判断。经验预报法在近岸区域海温预报中预报准确度受到了限制。反向传播(back propagation, BP)神经网络模型作为统计学习方法也被用于近岸海域海温预报中(匡晓迪 等, 2016)。传统的BP神经网络模型由于结构简单, 不能很好地从数据中挖掘出数据变化规律, 因此在近岸海域海温预报中预报误差较大。
自2010年来, 归功于计算机运算能力的提高、算法技术的改进以及大量可获取的数据, 基于深度神经网络的算法研究及应用迎来爆发式发展(郑泽宇 等, 2017)。卷积神经网络(convolutional neural networks, CNN)是应用最广泛的一种深度神经网络结构, 在图像和视频处理中表现十分出色, 已被成功应用于图像分类(Rawat et al, 2017)、动作识别(Yao et al, 2019)、图像分割(Shelhamer et al, 2017 )等方面。其原因在于CNN运用了卷积运算, 具有深层次的特征提取能力, 高效获取图像全部表征信息。同样, CNN可用于处理时间序列任务, 例如时间序列分类和时间序列预测(Fawaz et al, 2019; Shih et al, 2019)。在多元时间序列预测中, CNN可以自主地从输入历史数据中挖掘出各序列变量间潜在的关系以及变化规律, 利用这种关系和变化规律建立模型来对序列未来变化趋势进行预测。因此基于CNN的时间序列预测可看成一种时间序列分析法。近年来CNN在海温预报的应用主要基于卫星遥感数据, 通过构建深度学习模型, 将当前和过去时刻的海表温度场作为模型输入量, 输出未来时刻的海表温度场(Zheng et al, 2020; 张雪薇 等, 2022)。虽然目前未见到CNN应用在近岸定点表层海温预报中, 但是从其在多元时间序列预测中研究和应用中可以看出使用基于CNN的时间序列分析法对海温进行预报是具有可行性。
循环神经网络(recurrent neural network, RNN)是专门设计来处理序列数据的模型, 其循环自回归结构能对时间序列进行很好的表示, 一直以来是时间序列建模首选的神经网络结构。长短期记忆网络(LSTM)是一种特殊的RNN, 具有时序长期记忆能力, 能够解决RNN在处理长序列时出现梯度消失和梯度爆炸问题, 在机器翻译(Sutskever et al, 2014)、语音识别(Hinton et al, 2012)等领域取得很大的成功。由于LSTM是基于循环网络结构, 其计算效率会因为输入序列长度增加而降低。近年来, 卷积神经网络在语音合成、机器翻译上的应用可以达到很好的效果, 这看出序列建模不再是RNN的专属领域, CNN也可以成为时序建模的一个选项(Bai et al, 2018)。
鉴于数值预报、经验预报、BP神经网络在近岸海域海温预报中预报准确度不高, 本文尝试着将近岸台站定点SST预报转换为多元时间序列预测任务, 应用CNN构建近岸站点SST预报模型, 通过输入海洋观测数据对海温预报模型进行训练, 最终使用训练好的模型对遮浪海洋站每日最高SST、最低SST和日平均SST进行预报, 通过与人工经验方法和LSTM (long short-term memory)方法进行对比试验, 验证CNN应用于近岸台站定点海温预报的可行性以及评估模型的预报效果。

1 数据和方法

1.1 研究数据

1.1.1 水文气象数据

影响表层海水温度的主要因素有太阳辐射和海洋大气热交换。在没有其他热量交换形式影响下, 表层海水温度会因为太阳辐射呈现出稳定的日变化状态。白天表层海水受到太阳辐射而升温, 夜晚没有太阳辐射, 海水通过向大气释放热量来降温。在海气热交换的过程中, 海表风会通过驱动海水运动使海水内部热量产生移动, 同时会改变海水上层空气温度, 影响表层海水温度变化(朱贵重 等, 2019)。
我国海洋站一直以来进行长期、连续、系统的海洋水文气象观测, 自2000年起, 海洋水文气象观测逐渐实现了自动化采集, 积累了大量海洋观测数据。本文以遮浪海洋站SST作为预报对象, 使用遮浪海洋站观测资料中的SST、气温、风向风速数据作为SST预报因子。实验数据集采用遮浪站2009年至2020年SST、气温、风向风速每日整点观测数据。为了训练模型和评估建模效果, 数据集划分为训练数据和测试数据。由于CNN对训练数据量要求比较多, 训练数据使用观测资料中2009年1月1日至2019年12月30日整点数据。测试数据使用观测资料中2020年1月1日至12月30日整点数据。

1.1.2 经验预报数据

遮浪站人工经验预报方法主要采用经验外推法, 预报员根据观测海温值以及未来的天气系统预测变化, 结合数值预报系统, 对次日遮浪站海温变化范围进行预报。由于遮浪站每日日平均SST未开展人工经验预报, 人工经验预报结果采用遮浪站2020年全年时效为24小时的日最高和最低SST人工预报值, 对人工预报值与实测观测值进行误差分析, 并与CNN和LSTM方法预报结果进行比较。

1.2 CNN方法

1.2.1 时间序列定义

在介绍基于CNN的时间序列预测方法之前, 从数学的角度了解单变量时间序列和多元量时间序列的定义(Fawaz et al, 2019)。单变量时间序列是一组在连续时间上测得的数据, 可表示为: $X=\left[ {{x}_{1}},{{x}_{2}},\cdots,{{x}_{T}} \right]$, 其中$T$表示序列的时间长度, ${{x}_{i}}$表示变量序列$X$中第$i$时刻的观测值。多元时间序列也称多变量时间序列, 可以看成由$M$个不同单变量时间序列$X$组成的数组, 可表示为: $X=\left[ {{X}^{1}},{{X}^{2}},\cdots,{{X}^{M}} \right]$, 其中${{X}^{j}}$表示多变量时间序列$X$中第$j$个变量, $1<j<M$。时间序列预测是基于以前收集的时间序列数据, 其数据集可表示为: $D=\left\{ \left( {{X}_{1}},{{Y}_{1}} \right),\left( {{X}_{2}},{{Y}_{2}} \right),\cdots,\left( {{X}_{N}},{{Y}_{N}} \right) \right\}$, $D$$\left( {{X}_{i}},{{Y}_{i}} \right)$的集合, ${{X}_{i}}$既可以是单变量时间序列又可以是多变量时间序列, ${{Y}_{i}}$是其对应的预测值。

1.2.2 CNN方法

CNN根据处理数据的维度一般可分为一维、二维、三维CNN。二维和三维CNN常用于图像和视频处理, 一维CNN则用于自然语言处理和时间序列分析。与二维CNN相比, 一维CNN具有计算复杂度低, 训练速度快等优点。一维CNN结构主要由输入层、卷积层、池化层、输出层组成。
输入层是整个CNN的变量输入。输入变量可以是单变量时间序列又可以是多变量时间序列。卷积层是CNN中最重要的部分, 通过使用多个不同卷积核在输入数据上滑动来提取特征。不同于处理图像, 应用在时间序列上的卷积核是沿着时间维度平移滑动, 其数学模型可表示为:
${{C}_{t}}=f\left( \omega *{{X}_{t-l/2:t+l/2}}+b \right)\forall t\in \left[ 1,T \right]$
其中, $\omega $表示长度为$l$, 宽度为$M$的卷积核, $X$表示时间长度为$T$, 宽度为$M$的时间序列, *表示卷积运算, b为偏置项参数, f为非线性激活函数, Ct为卷积层输出结果(Fawaz et al, 2019)。在时间序列上应用一个卷积核将输出成另一个单变量时间序列。因此, 在输入时间序列上应用多个卷积核将输出多变量时间序列, 其维度等于卷积核的数量。应用多个不同卷积核进行卷积运算可以从输入序列中学习到多个数据特征, 有助于对序列进行预测。
池化层是对卷积层输出结果进行池化运算, 最常见的池化运算有最大值池化和平均值池化。使用池化层既可以降低输入序列的长度, 减少最后全连接层中的参数, 加快计算速度也可以避免过拟合问题。
一维CNN输出层使用全连接层来输出预测结果。在时间序列预测中, 经过多轮卷积层和池化层处理后, CNN得到多维的特征输出, 在进入全连接层之前, 需要将多维输出进行一维化。在池化层和输出层之间加入扁平(flattern)层, 可以将池化层输出转换成一维形式CNN采用反向传播算法来优化神经网络。首先, 在神经网络中, 输入的时间序列会通过一系列数据变换层来输出模型的预测值, 计算出当前的预测值与真实值之间的差距。接下来, 基于预测值与真实值之间的差距, 通过反向传播算法对神经网络参数进行计算更新, 使得模型的预测值与真实值更加接近。

1.2.3 CNN模型搭建和实验数据处理

本文模型采用一维CNN, 利用开源人工神经网络库Keras搭建两层CNN模型, 模型结构如图1所示。其中第一层卷积层采用12个卷积核, 第二层卷积层采用24个卷积核, 卷积核的大小设置为3。池化层采用平均值池化, 能有效防止数据信息大量丢失, 池化窗口的大小设置为2。输出层使用全连接(dense)层输出预报值。卷积层和输出层均采用了ReLU激活函数。模型训练迭代次数设置4000次。
图1 模型结构

Fig. 1 Framework of model

在模型训练之前, 需要对输入数据进行处理。将整点的SST、气温、风向、风速数据按时间顺序进行排列, 并按列的形式组合成海温预报数据集。由于数据集中风向数据列单位为度, 角度不能直接作为模型的输入, 需要将风速列和风向列转换成风向量。在本文中, 时间数据作为模型的输入数据, 将有利于提高建模效果。数据集中时间列格式为年月日时, 时间具有每日和每年周期性, 可以将时间转化秒, 然后使用正弦和余弦函数来处理时间的周期性, 将时间数据转换成日向量和年向量。经过转换, 数据集由8列数据组成, 即8个特征维度, 分别是海温、气温、风向量、日向量、年向量。
将数据集划分为训练数据集和测试数据集。由于输入数据序列单位不一致, 在输入模型之前需要对训练数据集和测试数据集中每一列数据分别进行归一化。本文输入数据归一化采用Z-score标准化方法:
${{z}_{i}}=\frac{{{x}_{i}}-{{\mu }_{i}}}{{{\sigma }_{i}}}$
其中${{x}_{i}}$为训练数据集和测试数据集中第i列数据, ${{\mu }_{i}}$${{\sigma }_{i}}$分别为训练数据集中第i列数据的均值和标准偏差, ${{z}_{i}}$为归一化后训练数据集和测试数据集。为了避免测试数据受训练数据的影响, 保证测试效果真实性, 测试数据采用训练数据归一化中的均值和标准差进行归一化, 先剔除训练数据中存在异常值和缺失值, 然后计算每一列数据的均值和标准偏差。
接下来将归一化后的训练数据集和测试数据集分割成时间间隔相等的时序数据输入样本以及对应的输出海温预报实测值。遮浪海洋站SST人工预报一般在每天14时开展, 预报员利用观测资料对次日的最高和最低海温进行预报。因此, 本文选取每日观测资料15时前的整点数据作为模型输入数据, 次日实测的最高、最低SST和日平均SST作为对应输出海温预报实测值。
从训练数据集和测试数据集中选取每日00时至14时的时序数据作为模型输入变量, 分别选取次日00时至23时之间的最高、最低海温和日平均海温作为对应输出海温预报实测值。经数据分割后, 训练数据集被分割成4017组大小为(15, 8)的时序训练样本以及其对应预报实测值, 测试数据集被分割为365组大小为(15, 8)的时序测试样本及其对应预报实测值。在输入模型前, 需要对存在异常值和缺失值的训练样本和测试样本以及存在异常预报值的样本进行剔除, 然后将训练样本分批量输入模型进行训练, 利用训练好的模型对365组测试样本进行预测, 并将模型预测值与样本对应的预报实测值进行比较。

2 实验结果分析与讨论

本文SST预报效果评估采用平均绝对误差(MAE)、均方根误差(RMSE)和相关系数法。为验证CNN在近岸SST预报中应用的可行性及评估模型的预报性能, 采用LSTM进行对比试验。将处理好的训练数据输入到CNN模型与LSTM模型进行训练, 利用测试数据输入训练好的CNN模型和LSTM模型中进行海温预测, 计算模型海温预报值与实测海温值的MAE、RMSE及相关系数, 并与人工经验预报方法相比较。本文中LSTM模型的隐藏层数量为4, 输出层采用ReLU激活函数, 训练迭代次数设置4000次。

2.1 海温变化曲线比较

图2图4是CNN、LSTM、人工经验预报三种方法预报遮浪站2020年每日最高、最低、平均SST变化曲线图。从图2图4中可以看出, 三种预报方法总体上能预报出海温的季节性变化, 但在海温变化显著的区域人工经验预报方法表现较差, 预报海温变化曲线与实测值有明显的偏差。相比人工经验预报方法, CNN和LSTM方法预报海温变化曲线整体上接近实测值, 预报值与实测值的相关性更强, 更能够对海温变化趋势进行准确预报。CNN和LSTM方法预报海温预报相关系数几乎是一致, 两者日最高海温预报相关系数均为0.9935, 日最低海温预报相关系数分别为0.9878和0.9879, 日平均海温预报相关系数分别为0.9940和0.9943, 均高于人工经验预报相关系数。
图2 三种方法预报结果与实测日最高海温的比较

Fig. 2 Comparison of predicted and observed values on the daily maximum SST

图3 三种方法预报结果与实测日最低海温的比较

Fig. 3 Comparison of predicted and observed values on the daily minimum SST

图4 CNN和LSTM预报结果与实测日平均海温的比较

Fig. 4 Comparison of predicted and observed values on the daily mean SST

由于三种方法是在历史的观测数据基础上进行预报, 预报结果会受到输入观测资料的影响。我们选取同一时段海温变化显著的样本, 并对海温预报曲线进行深入分析, 如图5所示。从海温变化曲线中看出, 人工经验预报方法表现出明显的惯性预报特性, 预报值出现明显的滞后现象, 滞后时间约为2天, 主要原因是预报员倾向于基于前两天的历史海温观测资料开展海温预报。CNN和LSTM方法能够减少惯性预报的影响, 预报滞后现象比较少见, 主要原因是CNN模型的卷积层和输出层采用了非线性激活函数ReLU, 能够使模型在训练过程中摆脱单一的线性关系, 增强模型的非线性。
图5 15天预报结果与实测海温的比较

Fig. 5 Comparison of predicted and observed values in the range of 15 days

2.2 预报误差数值比较

表1是CNN、LSTM、人工经验预报三种方法在遮浪站2020年SST预报中每月及全年的预报效果。从每月的数值结果看出CNN和LSTM方法各项指标都明显优于人工经验预报方法, 并且能够大幅降低海温预报误差。其中人工经验方法在6至8月海温预报中预报效果最差, 预报MAE超过0.6℃, RMSE超过0.8℃。相比人工经验预报方法, CNN和LSTM方法在6至8月日最高和日最低SST预报中, 能够大幅度降低海温预报误差, CNN方法日最高海温预报MAE平均下降0.30℃, RMSE平均下降0.35℃, 日最低海温预报MAE平均下降0.30℃, RMSE平均下降0.36℃, LSTM方法日最高海温预报MAE平均下降0.32℃, RMSE平均下降0.38℃, 日最低海温预报MAE平均下降0.34℃, RMSE平均下降0.37℃, LSTM预报效果略优于CNN。在其他月份, CNN和LSTM方法预报误差都十分接近, 两者的MAE差距小于0.06℃, RMSE差距小于0.09℃, 两种方法预报MAE都小于0.5℃, RMSE都小于0.6℃, 预报效果良好。
表1 三种预报方法的SST预报效果

Tab.1 Results of CNN forecast method, LSTM forecast method and empirical forecast method

月份 日最高SST/ ℃ 日最低SST/ ℃ 日平均SST/ ℃
CNN预报 LSTM预报 人工经验预报 CNN预报 LSTM预报 人工经验预报 CNN预报 LSTM预报
MAE RMSE MAE RMSE MAE RMSE MAE RMSE MAE RMSE MAE RMSE MAE RMSE MAE RMSE
1月 0.21 0.28 0.22 0.30 0.24 0.31 0.17 0.23 0.15 0.21 0.30 0.37 0.14 0.22 0.11 0.19
2月 0.31 0.51 0.30 0.50 0.36 0.59 0.19 0.26 0.17 0.25 0.29 0.37 0.18 0.24 0.15 0.21
3月 0.35 0.44 0.40 0.53 0.40 0.53 0.18 0.25 0.17 0.24 0.29 0.37 0.18 0.25 0.19 0.28
4月 0.35 0.45 0.33 0.43 0.40 0.57 0.27 0.38 0.26 0.36 0.31 0.46 0.26 0.37 0.27 0.38
5月 0.48 0.60 0.50 0.63 0.53 0.64 0.39 0.50 0.42 0.52 0.47 0.65 0.39 0.49 0.33 0.46
6月 0.54 0.67 0.49 0.62 0.91 1.15 0.79 1.13 0.74 1.15 1.28 1.78 0.54 0.74 0.54 0.71
7月 0.63 0.80 0.61 0.76 0.88 1.06 1.12 1.45 1.05 1.41 1.36 1.75 0.78 0.97 0.77 0.92
8月 0.41 0.52 0.41 0.51 0.68 0.83 0.45 0.72 0.44 0.71 0.62 0.85 0.32 0.41 0.34 0.44
9月 0.33 0.48 0.38 0.51 0.53 0.78 0.33 0.47 0.37 0.51 0.48 0.72 0.32 0.44 0.30 0.46
10月 0.22 0.29 0.21 0.26 0.46 0.56 0.08 0.13 0.10 0.15 0.20 0.30 0.12 0.16 0.18 0.22
11月 0.24 0.30 0.26 0.31 0.34 0.45 0.14 0.19 0.14 0.19 0.35 0.56 0.15 0.20 0.17 0.24
12月 0.19 0.23 0.20 0.26 0.30 0.40 0.21 0.29 0.24 0.33 0.38 0.46 0.17 0.25 0.18 0.24
全年 0.36 0.49 0.36 0.49 0.50 0.70 0.36 0.63 0.36 0.63 0.53 0.87 0.30 0.47 0.30 0.45
从全年海温的海温预报效果来看, CNN和LSTM方法预报效果都优于人工经验预报方法, 预报误差一致, 全年日最高海温预报MAE都为0.36℃, RMSE都为0.49℃, 日最低海温预报MAE都为0.36℃, RMSE都为0.63℃, 日平均海温预报MAE都为0.30℃。

2.3 误差原因分析

表1中每月预报误差变化趋势来看, 三种方法1月至7月预报误差逐渐增大, 7月至12月预报误差逐渐减少, 7月份预报误差最大。比较每种方法的日最高、日最低、日平均海温预报误差, 6至8月份日最低海温预报误差最大。结合海温变化曲线可以看出, 遮浪站海温预报误差与海温日变化情况具有相关性, 当海温日变化幅度增大时, 海温预报误差也随之增加。6至8月遮浪站的海温日变化幅度较大, 主要原因是夏季期间汕尾近岸海域表层暖水受到上升流低温(张云翼 等, 2012; 许金电 等, 2014)及台风天气影响, 遮浪站的日最高、日最低、日平均海温变化都呈现出频繁振荡现象。其他月份遮浪站的海温主要受天气影响, 海温日变化相对稳定。人工经验预报方法预报误差较大主要原因是在日常海洋预报中, 预报员根据预报区域的天气系统及海况预测变化对遮浪站海温变化进行预测, 当天气系统变化比较单一, 预报员总体上能对海温变化趋势进行准确预报, 预测值与实测值差距不大。当天气系统复杂多变以及受到上升流影响时, 预报员对海温变化的预测就很难进行准确把握, 更倾向于惯性预报, 海温预报值出现明显滞后。
CNN和LSTM模型主要从输入的水文气象观测资料中挖掘出海温变化规律。本文构建的海温预报模型只建立了历史SST、气温、风向风速与未来SST的相关性。汕尾沿岸海域上升流主要是粤东外海深层冷水沿海底地形向近岸爬升形成的, 在不同年份其空间结构和强度存在明显差异, 其主要动力是西南季风 (张云翼 等, 2012; 许金电 等, 2014)。在没有受到上升流影响的月份, 海温日变化幅度较小, CNN和LSTM模型可以从输入观测资料中学习到海温变化规律, 对海温进行很好的预报。相比人工经验预报, 虽然CNN方法和LSTM方法能有效降低海温预报误差, 但面对受上升流影响, 海温变化不稳定, 神经网络仅从SST、气温、风向风速观测数据中挖掘出海温突变规律的能力是有限, 预报海温突变性能会有所欠缺。影响SST变化的因素还有很多, 如上升流、盐度等。在影响因子的选择和模型的构建上需要将这些因素考虑进去, 这有助于神经网络从输入数据中充分挖掘出海温变化规律, 提高海温预报精度。

2.4 CNN和LST模型性能比较

在模型耗时方面,CNN模型训练迭代4000次所需的耗时为1957.3001秒,LSTM模型训练迭代4000次所需的耗时为2318.7432秒。从全年预报效果上看, 基于CNN的海温预报模型预报性能和LSTM模型预报性能相当, 两种算法预报MAE、RMSE、相关系数都十分接近。从耗时数值结果看CNN模型在海温预报中训练速度更快, 耗时更少。主要原因是LSTM模型结构相对复杂, 不能很好地并行处理数据, 在处理时间序列数据上每次只能处理一个时刻的数据, 并且需要等前一个时刻数据处理完才能进行下一个时刻数据处理, 训练起来比CNN模型更加耗时。CNN是一种完全不同于LSTM的神经网络, 在多元时间序列数据处理上, 将序列看作一个二维对象, 时间看作一个空间维度, 特征看作另一个空间维度, 通过固定大小的卷积核沿时间维度滑动来提取特征, 可以并行处理数据, 节省大量时间。

3 结论

本文运用CNN对遮浪海洋站的海温变化规律进行数值建模, 并对遮浪站每日最高海温、最低海温、平均海温进行预报, 将预报结果与LSTM、人工经验预报结果进行对比分析。结论如下:
(1)本文搭建的基于CNN的海温预报模型能够大幅降低SST预报误差, 预报值与实测值的相关性更强, 更能够对海温变化趋势进行准确预报, 预报效果优于人工经验预报。相比人工经验预报, CNN方法全年日最高海温预报MAE为0.36℃, 平均下降0.14℃, RMSE为0.49℃, 平均下降0.21℃, 日最低海温预报MAE为0.36℃, 平均下降0.17℃, RMSE为0.63℃, 平均下降0.24℃。
(2)虽然在海温日突变频繁月份, CNN方法海温预报精度略低于LSTM, 但从全年预报效果上看, 基于CNN的海温预报模型预报性能和LSTM模型预报性能相当, 两种算法预报MAE、RMSE、相关系数都十分接近, 并且CNN训练和预报速度更快、计算代价更低, 在近岸台站海温预报中, 可以替代LSTM。
(3)本文构建的海温预报模型只建立了历史SST、气温、风向风速与未来SST的相关性。影响SST变化的因素还有很多, 如上升流、盐度等。在影响因子的选择和模型的构建上需要将这些因素考虑进去, 这有助于神经网络从输入数据中充分挖掘出海温变化规律, 提高海温预报精度。
综上所述, CNN应用于近岸台站定点海温预报具有可行性, 能够有效降低人工经验方法海温预报误差, 并且预报效果可以媲美LSTM, 为近岸台站定点海温预报提供一种新的思路。
[1]
匡晓迪, 王兆毅, 张苗茵, 等, 2016. 基于BP神经网络方法的近岸数值海温预报释用技术[J]. 海洋与湖沼, 47(6): 1107-1115.

KUANG XIAODI, WANG ZHAOYI, ZHANG MIAOYIN, et al, 2016. An interpretation scheme of numerical near-shore sea-water temperature forecast based on BPNN[J]. Oceanologia et Limnologia Sinica, 47(6): 1107-1115 (in Chinese with English abstract).

[2]
李燕, 张建华, 刘钦政, 等, 2007. 单站海温短期预报自动化[J]. 海洋预报, 2007, 24(4): 33-41.

LI YAN, ZHANG JIANHUA, LIU QINZHENG, et al, 2007. The automation of single sea station's surface sea temperature short term forecasting[J]. Marine Forecasts, 24(4): 33-41 (in Chinese with English abstract).

[3]
王兆毅, 李云, 王旭, 2020. 中国近岸海域基础预报单元海温预报指导产品研制[J]. 海洋预报, 37(4): 59-65.

WANG ZHAOYI, LI YUN, WANG XU, 2020. Development of forecast guidance product for sea temperature of basic forecast units in the Chinese coastal waters[J]. Marine Forecasts, 37(4): 59-65 (in Chinese with English abstract).

[4]
许金电, 蔡尚湛, 宣莉莉, 等, 2014. 粤东至闽南沿岸海域夏季上升流的调查研究[J]. 热带海洋学报, 33(2): 1-9.

DOI

XU JINDIAN, CAI SHANGZHAN, XUAN LILI, et al, 2014. Observational study on summertime upwelling in coastal seas between eastern Guangdong and southern Fujian[J]. Journal of Tropical Oceanography, 33(2): 1-9 (in Chinese with English abstract).

[5]
张建华, 2003. 海温预报知识讲座第一讲: 海水温度预报概况[J]. 海洋预报, 20(4): 81-85 (in Chinese).

[6]
张建华, 2004. 海温预报知识讲座第二讲: 数理统计方法在海温预报中的应用[J]. 海洋预报, 21(1): 85-90.

ZHANG JIANHUA, 2004. Lecture on sea surface temperature prediction: lecture 2 application of mathematical Statistics method in sea surface temperature prediction[J]. Marine Forecasts, 21(1): 85-90 (in Chinese with English abstract).

[7]
张雪薇, 韩震, 2022. 基于ConvGRU深度学习网络模型的海表面温度预测[J]. 大连海洋大学学报, 37(3): 531-538.

ZHANG XUEWEI, HAN ZHEN, 2022. Prediction of sea surface temperature based on ConvGRU deep learning network model[J]. Journal of Dalian Ocean University, 37(3): 531-538 (in Chinese with English abstract).

[8]
张云翼, 江毓武, 2012. 汕尾外侧冷水跨陆架输送的形成机制[J]. 厦门大学学报(自然科学版), 51(4): 746-752.

ZHANG YUNYI, JIANG YUWU, 2012. The Mechanism of cold water cross-shelf transport in the continental shelf off Shanwei[J]. Journal of Xiamen University (Natural Science), 51(4): 746-752 (in Chinese with English abstract).

[9]
郑泽宇, 梁博文, 2017. TensorFlow: 实战Google深度学习框架[M]. 北京: 电子工业出版社: 6-9 (in Chinese).

[10]
朱贵重, 胡松, 2019. 基于LSTM-RNN的海水表面温度模型研究[J]. 应用海洋学学报, 38(2): 191-197.

ZHU GUICHONG, HU SONG, 2019. Study on sea surface temperature model based on LSTM-RNN[J]. Journal of Applied Oceanography, 38(2): 191-197 (in Chinese with English abstract).

[11]
庄桦, 2014. 沿岸海域海温研究进展[J]. 中国水运, 14(2): 194-195 (in Chinese).

[12]
BAI SHAOJIE, KOLTER J Z, KOLTUN V, (2018-04-19) [2023-05-30]. An empirical evaluation of generic convolutional and recurrent networks for sequence modeling[EB/OL]. https://arxiv.org/abs/1803.01271v2

[13]
FAWAZ H I, FORESTIER G, WEBER J, et al, 2019. Deep learning for time series classification: a review[J]. Data mining and knowledge discovery, 33: 917-963.

DOI

[14]
HINTON G, DENG LI, YU DONG, et al, 2012. Deep neural networks for acoustic modeling in speech recognition: the shared views of four research groups[J]. IEEE Signal Processing Magazine, 29(6): 82-97.

[15]
SHELHAMER E, LONG J, DARRELL T, 2017. Fully convolutional networks for semantic segmentation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 39(4): 640-651.

DOI PMID

[16]
RAWAT W, WANG ZENGHUI, 2017. Deep convolutional neural networks for image classification: a comprehensive review[J]. Neural Computation, 29(9): 2352-2449.

DOI PMID

[17]
SHIH SHUNYAO, SUN FANKENG, LEE H Y, 2019. Temporal pattern attention for multivariate time series forecasting[J]. Machine Learning, 108: 1421-1441.

DOI

[18]
SUTSKEVER I, VINYALS O, LE Q V, 2014. Sequence to sequence learning with neural networks[C]// Proceedings of the conference on advances in neural information processing systems, 2: 3104-3112.

[19]
YAO GUANGLE, LEI TAO, ZHONG JIANDAN, 2019. A review of Convolutional-Neural-Network-based action recognition[J]. Pattern Recognition Letters, 118(2): 14-22.

DOI

[20]
ZHENG GANG, LI XIAOFENG, ZHANG RONGHUA, et al, 2020. Purely satellite data-driven deep learning forecast of complicated tropical instability waves[J]. Science Advances, 6(29): eaba1482.

DOI

Outlines

/