Fusing MIC and Res-LSTM models for significant wave height prediction

ZHU Daoheng; LI Yan; LI Zhiqiang; LIU Run

doi:10.11978/2023113

Journal of Tropical Oceanography >

2024 , Vol. 43 >Issue 4: 76 - 85

DOI: https://doi.org/10.11978/2023113

Marine Hydrology

Fusing MIC and Res-LSTM models for significant wave height prediction

ZHU Daoheng ^,¹ ,
LI Yan ² ,
LI Zhiqiang ^,¹ ,
LIU Run ³

Expand

1. School of Electronics and Information Engineering, Guangdong Ocean University, Zhanjiang 524088, China
2. School of Big Data and Information Engineering, Guizhou University, Guiyang 550025, China
3. School of Chemistry and Environment, Guangdong Ocean University, Zhanjiang 524088, China

LI Zhiqiang. email: qiangzl1974@163.com

Copy editor: SUN Cuici

Received date: 2023-08-04

Revised date: 2023-10-11

Online published: 2023-10-16

Supported by

National Natural Science Foundation of China(42176167)

Scientific Research Startup Foundation of Guangdong Ocean University(060302112317)

Fold

Abstract

The prediction of significant wave height (SWH) plays an important role in marine transportation and maritime activities. Based on the near-shore real measurement data of the Hailing Island, Yangjiang, China, a network model integrating the maximum information coefficient algorithm (MIC), residual network (ResNet) and long and short-term memory network (LSTM) is proposed. Firstly, the MIC algorithm was used to screen out the parameters with high correlation with the target predictors from the dataset as the input of the model. Then the residual network was introduced into the LSTM to construct the Res-LSTM prediction model. Finally, the r-squared (R²), root mean square error (RMSE), mean absolute error (MAE) and mean absolute percentage error (MAPE) were selected to evaluate the prediction results. Meanwhile, the prediction results of extreme gradient boosting (XGBoost) network, support vector regression (SVR) network and LSTM network were compared. The results demonstrate that the MIC-Res-LSTM model can improve the accuracy of the short-time significant wave height prediction values.

Key words： wave height prediction; maximum information coefficient; residual network; long and short-term memory network; support vector regression

Cite this article

ZHU Daoheng , LI Yan , LI Zhiqiang , LIU Run . Fusing MIC and Res-LSTM models for significant wave height prediction[J]. Journal of Tropical Oceanography, 2024 , 43(4) : 76 -85 . DOI: 10.11978/2023113

海面风浪可以改变船舶的航向和速度, 甚至产生船体共振, 从而使船体断裂, 引发海上事故。它们还会对雷达的使用、水上飞机和舰载飞机的起飞和着陆、布雷、排雷、海上补给、舰载武器的使用以及海上打捞产生重要影响。波浪传播到近岸也会对港口、码头和海岸防护工程造成破坏(Feng et al, 2022)。因此, 研究波浪条件, 特别是预测有效波高, 对海上作业、海上运输、海洋污染物的分布评估(Rodriguez et al, 1995)、近岸养殖和海岸工程(Rizal et al, 2020)等具有重要意义。

波浪预测模型可分为数据驱动和物理驱动框架。物理驱动方法是基于波谱能量平衡方程, 尽管数值模型的预测在大规模空间和时间范围内是有效的, 但缺点是计算资源和时间方面的成本很高(Güner et al, 2013)。数据驱动方法是使用机器学习技术, 通过分析大量数据之间可能存在的关系和依赖来预测未来不确定的事件。FS (fuzzy system)(Hashim et al, 2016)、EA (evolutionary algorithms) (Cornejo-Bueno et al, 2016)、SVM (support vector machine) (Mahjoobi et al, 2009)、DNN (deep neural network) (Abhigna et al, 2017)和ANN (artificial neural network)(Makarynskyy et al, 2005)都属于机器学习的方法, 它们在构建波浪预测模型时非常有效。波是一个连续的过程, 而RNN (recursive neural network)是一种递归神经网络, 它将序列数据作为输入, 在序列的进化方向上执行递归, 并将链中的所有节点连接起来。RNN中, 神经元可接收来自其他神经元和自身的信息, 形成一个环路网络结构, 从而具有短期记忆能力。然而, 当输入序列较长时, 会出现梯度爆炸问题(Bengio et al, 1994), 这会导致模型失去学习能力。

LSTM是为解决RNN中的梯度消失和梯度爆炸问题而提出的, 它被广泛应用到许多领域(Hochreiter et al, 1997)。如Theodoropoulos等(2021)将LSTM模型用于船舶推进功率预测, 结果表明该模型具有较高的灵敏度和预测精度。Gao等(2018)使用LSTM方法预测台风路径, 并认为所建立的模型对台风短期路径具有一定的预测能力。Gao等(2021)基于LSTM方法建立了渤海三个台站的有效波高预测模型, 认为LSTM在波浪预测中具有广阔的应用前景。Fan等(2020)对随机森林、LSTM和SVM等六种网络在预测有效波高方面的性能进行对比研究, 结果表明LSTM网络具有更好的预测性能。然而, LSTM网络的参数太多, 导致模型训练时间过长。因此, GRU (gate recurrent unit)网络被开发出来。GRU网络可以理解为LSTM网络的简化版本, 它将LSTM网络的遗忘门和输入门合并为更新门, 减少了模型训练时间, 提高了计算效率。GRU网络已应用到许多领域, 如交通流预测(Zhang et al, 2018)和短期风速预测(Liu et al, 2019)。Wang等(2021)在台湾周边海域建立了基于GRU、SVM、ELM(extreme learning machine)等网络的SWH预测模型, 结果表明GRU网络在时间序列预测中具有最佳性能。尽管机器学习模型可以很好地处理非线性问题, 但如果不对输入进行预处理, 非平稳数据集的建模过程可能会很困难(Deka et al, 2012)。因此, Özger (2010)将小波变换添加到模糊逻辑方法中, 通过小波变换分解有效波高的时间序列, 再将分解后的分量作为模型的输入, 得到优于单神经网络的预测结果。

虽然机器学习模型可成为模拟各种海滩波浪的一种时间和成本效益高的替代方法(Shamshirband et al, 2020), 但大多数波浪预测模型都聚焦于深海波浪预测(Yang et al, 2019)和台风浪高预测(周水华等, 2020), 而对近岸SWH的预测研究较少。从波浪的影响因素来看, 风速被确定为波浪产生的主要因素(Mahjoobi et al, 2008), 但波浪传播到近岸会发生破碎和变形而变得不稳定, 此时的波高变化可能由几种因素共同作用。对于近岸浅水区的波浪而言, 波高主要由水深控制(Stokes, 2010), 还可能与地形等因素有关, 如果只考虑风速的影响, 可能会导致预测结果产生偏差。本研究基于机器学习建立了一种波浪预测模型来预测近岸有效波高。在选择输入参数之前, 采用最大信息系数算法对可能影响波高的因素做关联检测, 选择相关性高的变量输入网络模型。提出将残差网络引入到长短期记忆网络中, 建模对输入的数据进行训练, 尝试得出一个置信度较高的波高数值模型, 并利用该网络对有效波高进行短期预测。另外, 分别评估了XGBoost、SVR和LSTM模型的性能, 通过对比多模型预测结果来验证本文所提模型的有效性和预测精度。

1 数据处理与方法

1.1 数据来源

试验数据包括气象、波浪和潮汐数据。其中大气温度、风向、风速、大气压强、相对湿度、水温、监测点水深是2021年8月在中国阳江海陵岛东岛沙滩(111°59′46″E, 21°37′20″N)实地测量所得。深水波高和深水波周期来自欧洲中期天气预报中心 (European center for weather forecast, ECMWF)提供的第五代再分析数据(EAR5)(https://climate.copernicus.eu/), 选取时间从8月1日至30日, 时间分辨率为1h, 其中波高类型为有效波高, 波周期类型为有效波周期。近岸波浪和水深数据是在碎波带布设波潮仪RBRsolo³采集, 采集频率为1Hz。在8月1日至6日, 由于仪器在几个时间段暴露于空气造成小部分数据缺失, 用K近邻算法补全(K取48)该部分数据, 然后利用卡尔曼滤波(Ma et al, 2022)滤除数据中的异常值。原始数据以10分钟的间隔进行分组, 并采用跨零法计算出每组的有效波高和平均波周期, 最后得到每种指标各4320条。潮汐数据是海陵岛闸坡海洋站发布的预报数据, 每小时1条, 共720条。

表1给出所有指标的平均值、最值、标准偏差和变异系数。变异系数反映了数据的离散程度, 变异系数越大说明数据离散程度越大, 数据变化越不稳定。有效波高的平均值和最大值均低于深水波高, 但其变异系数大于深水波高, 说明近岸有效波高的变化不稳定。除有效波高外, 风速、风向和水深的变异系数较大, 说明这些指标的变化不稳定。

表1 样本数据信息

Tab. 1 Information of sample data

指标	大气温度/℃	风向/°	风速/(m·s^-1)	大气压强/kpa	相对湿度/%	水温/℃	潮高/m	深水波高/m	深水波周期/s	水深/m	平均波周期/s	有效波高/m
平均值	30.23	200.62	1.31	99.89	76.24	28.79	1.68	0.71	4.68	0.93	4.95	0.32
最大值	35.00	359.00	4.30	100.19	88.10	36.92	3.32	1.03	6.41	2.54	9.76	0.92
最小值	26.00	0	0	99.59	35.40	25.00	0.25	0.39	3.53	0.21	2.46	0.08
标准偏差	1.98	93.99	0.84	1.22	7.17	1.98	66.87	0.15	0.63	0.53	0.95	0.16
变异系数/%	6.54	46.85	64.31	0.12	9.41	6.90	39.80	20.73	13.43	57.26	19.19	51.13

1.2 最大信息系数

对于有限数据集

D ⊂ R 2

包含一组变量(x, y), x和y被划分为dx和dy块。如果网格大小dx和dy固定, 那么可得到数据集D在固定网格G中的最大互信息熵

I (D / G)

。将每种网格大小的互信息熵归一化到[0,1]的范围内, 代入计数矩阵M中。基于对所有可行网格尺寸dx和dy的遍历, 得到M中最大的元素作为MIC值(Reshef et al, 2011), 如式(1)—(3):

(1)

I ∗ (D, d x, d y) = max I (D / G)

(2)

M (D) d x, d y = I ∗ (D, d x, d y) logmin {d x, d y}

(3)

MIC (D) = max d x ∗ d y < B (n, α) {M (D) d x, d y}

其中,

B (n, α)

是n的函数, 大小等于

n α

, 是网格数量划分的上限,

α

一般取0.6, R表示实数。当变量x和y相互独立时, MIC值等于0; 随着x和y之间的相关性增强, MIC值增大(朱道恒等, 2021)。

由于各监测指标与有效波高之间的关系未知, 而MIC算法对于已知或未知关系的变量间的相关性探测具有通用性和均匀性, 即MIC可以捕获广泛的关系, 而不限于特定类型的关系。对于不同的关系类型, 随噪声量的增长, 两变量间的MIC值的变化程度接近。选择几种常见相关系数来度量各指标特征与有效波高的相关性, 结果如表3所示。有效波高与水深MIC值达到0.659, 表明在“浅水”(水深小于1/2波长)条件下, 波高与水深呈显著正相关关系, 这与Yang等(2012)的研究结论一致。同时潮高、深水波高、深水波周期和近岸平均波周期也是有效波高变化的影响因素。

1.3 长短期记忆网络

LSTM是RNN模型的一种变体, 它是ANN的一种改进。RNN和ANN架构之间的区别在于, 隐藏层中存在递归连接, 在这种情况下, 前一个隐藏层的结果用于在稍后时间计算输出, 因此它能够更有效地捕获时间序列数据的模式。图1是LSTM存储单元结构,

x t

为输入,

h t

为输出,

C t

为细胞状态。LSTM模型用各个门和细胞状态筛选信息的保留程度, 可用公式(4)至(9)表达:

(4)

f t = σ (W f h t − 1 + U f x t + b f)

(5)

i t = σ (W i h t − 1 + U i x t + b i)

(6)

g t = tanh (W c h t − 1 + U c x t + b g)

(7)

C t = f t ∗ C t − 1 + i t ∗ g t

(8)

o t = σ (W o h t − 1 + U o x t + b o)

(9)

h t = o t ∗ tanh (C t)

其中,

f t

、

i t

、

g t

、

x t

分别表示遗忘门、输入门、输出门、t时刻的输入变量。

W f

、

U f

、

W i

、

U i

、

W o

、

U o

分别为遗忘门、输入门和输出门的权重系数,

b f

、

b i

、

b o

分别为遗忘门、输入门和输出门的偏置项。

σ

为Sigmoid函数,

tanh

为双曲正切激活函数,

∗

为Hadamard积。

C t

表示本层输入信息和遗忘门输出上层信息叠加的结果,

C t − 1

是上一层单元的细胞状态。

显示原图|下载原图ZIP|生成PPT

图1 LSTM存储单元结构

Fig. 1 LSTM memory cell structure

1.4 残差网络

2015年He等(2016)提出了残差网络的概念, 并斩获当年ImageNet竞赛中分类任务的冠军。ResNet提出之前, 所有神经网络都是通过卷积层和池化层相叠加组成。研究者认为卷积层和池化层的层数越多, 获取图片的特征信息越全, 学习效果也越好, 但实际上网络层数的增加会使特征丢失导致网络退化, 产生梯度消失或爆炸等情况, 进而使训练和测试效果变差。ResNet能够有效缓解网络模型堆叠产生的梯度消失问题, 并取得良好的训练效果。ResNet的核心结构如图2所示, 其中x为恒等映射, F(x)为非线性输出, 激活函数是ReLU(rectified linear unit)。

显示原图|下载原图ZIP|生成PPT

图2 残差网络的核心结构

Fig. 2 The core structure of Resnet

1.5 MIC-Res-LSTM模型

为提高LSTM模型的训练速度和预测性能, 提出融合MIC与Res-LSTM的有效波高预测模型, 整体结构如图3所示。输入模型之前进行数据归一化处理, 可以避免特征变量与目标变量量纲的不同而影响预测精度, 同时能提升程序运行时的收敛速度。采用最小—最大规范化对原始数据进行线性变换, 结果映射到[0,1]之间, 实现对原始数据的等比缩放, 计算方法如式(10):

(10)

x ′ = x − min (x) max (x) − min (x)

其中x是原始值,

x ′

是归一化的值, min(x)和max(x)分别是最小值和最大值。

显示原图|下载原图ZIP|生成PPT

图3 MIC-Res-LSTM模型的整体结构

Fig. 3 The flowchart of MIC-Res-LSTM model

将ResNet引入LSTM网络后, Res-LSTM网络层通过残差网络的短路连接将残差学习引入LSTM网络层, 仅在网络输出层叠加了输入, 而原始网络总层数不变。结合ResNet和LSTM的优点, 使模型在提升预测速度的同时也增强了泛化能力。Res-LSTM网络利用滑动窗口对数据集取值, 滑窗大小是时间步长(time steps)。LSTM单元内部隐向量的维度为batch, 样本维度(features)。图3中的右侧是LSTM层与ResNet模块的结合, LSTM层中的32是隐藏层数量, 输入层下的数字指当前输入12个时间刻度和筛选出的n个变量。模型工作流程如下: (1)将所有特征数据取值做归一化处理得到无量纲特征; (2)设置MIC相关系数阈值, 将与有效波高的相关系数大于阈值的指标作为预测模型的输入特征; (3)将筛选完成的数据集按8:2分为训练集和测试集, 训练集用于模型建模训练, 测试集用于验证模型的预测效果。

2 结果与讨论

2.1 评估指标

为评估不同模型的预测性能, 采用均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和相关系数(R²)来反映预测效果。4种指标的计算公式如式(11)—(14):

(11)

RMSE = 1 n ∑ i = 1 n (o i − u i) 2

(12)

MAE = 1 n ∑ i = 1 n o i − u i

(13)

MAPE = 100 % n ∑ i = 1 n o i − u i u i

(14)

R 2 = 1 n ∑ i = 1 n (o i − o ¯) (u i − u ¯) 1 n ∑ i = 1 n (o i − o ¯) 2 1 n ∑ i = 1 n (u i − u ¯) 2

式中,

o i

是预测值,

u i

是观测值,

o ¯

是预测值的均值,

u ¯

是观测值的均值, n是样本数量。RMSE描述预测结果和观测结果的偏离程度, 该值越小则模型越稳定。MAE描述所有样本的误差绝对值, 该值越接近于0说明模型拟合效果越好。MAPE反映所有样本的误差绝对值占观测值的比例, 该值越接近于0说明模型预测越精确。R²描述因变量的方差能被自变量解释的比例, 取值范围是[0,1], 取值越大说明模型拟合效果越好。

2.2 实验参数

本文的硬件环境选择Intel系列的Core(TM)i5-10400F, CPU为2.90GHz, 内存大小为16GB, GPU用英伟达GeForce RTX 3060Ti的8GB显卡。软件环境为Windows10系统, 深度学习框架使用TensorFlow 2.0, Python版本为3.7, CUDA版本为7.6.5。自测数据集和公开数据集实验过程中的训练参数设置如表2, 其中批处理大小(batch_size)、学习率(learning_rate)和迭代次数(epoch)在两种数据集实验中不同, 其余参数均相同。为减少过拟合并提升模型的泛化能力, 设置丢弃率(dropout)为0.001。Adam优化器参数中, 动量参数(beta1)和二次动量参数(beta2)分别为0.9、0.999, 数值稳定性参数(epsilon)选择1×10⁻⁸。

表2 训练参数设置

Tab. 2 Configuration of training parameters

参数	batch_size	learning_rate	epoch	beta1	beta2	epsilon	timesteps	dropout
自测数据集实验	72	0.0025	100	0.9	0.999	1×10⁻⁸	12	0.001
公开数据集实验	128	0.001	150	0.9	0.999	1×10⁻⁸	12	0.001

表3 以不同相关系数计算各指标特征与有效波高的相关性

Tab. 3 Correlation between significant wave height and each indicator based on different correlation coefficients

特征指标	MIC	Pearson	Spearman	Kendall
大气温度	0.176	0.026	0.001	0.002
风向	0.154	0.003	0.015	0.010
风速	0.177	0.010	0.047	0.031
大气压强	0.202	0.003	0.108	0.072
相对湿度	0.173	0.019	0.031	0.002
水温	0.221	0.361	0.477	0.324
潮高	0.487	0.647	0.677	0.506
深水波高	0.379	0.286	0.293	0.199
深水波周期	0.361	0.432	0.401	0.349
平均波周期	0.473	0.298	0.312	0.217
水深	0.659	0.672	0.521	0.497

2.3 自测数据集实验结果

将本文提出的Res-LSTM模型和SVR、XGBoost、LSTM模型分别在自测数据集上进行试验。数据集中各变量与有效波高的相关性计算结果如表3, 选择相关性阈值为0.3, 筛选出潮高、深水波高、深水波周期、近岸平均波周期和监测点水深作为预测模型的输入特征。所有实验均设定输入当前时刻前12h的自测数据, 模型标签数据设为预测当前时刻未来1h的有效波高。表4列出4种模型对不同时间跨度的有效波高预测结果。在10min的预测中, XGBoost和SVR模型总体预测精度低于LSTM和Res-LSTM。Res-LSTM模型的RMSE和MAE分别降低至0.0194和0.0152、MAPE降至6.09%,

R 2

为0.9814表明模型拟合效果良好。在30min和1h的预测中, 4种模型的

R 2

值较10min均降低, XGBoost、LSTM和Res-LSTM模型的RMSE、MAE和MAPE值均增加, SVR模型的RMSE、MAE和MAPE值有所减小。表明随着预测时间的增加, 除SVR模型外其他模型的预测精度均逐渐降低, 但Res-LSTM模型性能的衰减速率是最慢。

表4 短期预测的性能比较

Tab. 4 Comparison of short-term forecast results

模型	时间跨度	R²	RMSE	MAE	MAPE/%
XGboost	10min	0.7761	0.1084	0.0903	38.47
SVR		0.8256	0.1152	0.1017	45.59
LSTM		0.9653	0.0373	0.0293	13.35
Res-LSTM		0.9814	0.0194	0.0152	6.09
XGboost	30min	0.7345	0.1473	0.1049	32.16
SVR		0.8136	0.1137	0.0925	37.84
LSTM		0.9567	0.0812	0.0675	14.60
Res-LSTM		0.9641	0.0385	0.0141	6.79
XGboost	1h	0.7198	0.1266	0.1044	43.54
SVR		0.7761	0.0701	0.0572	23.72
LSTM		0.9138	0.0575	0.0524	23.00
Res-LSTM		0.9423	0.0516	0.0416	17.70

4种模型在不同的时间跨度上的有效波高预测结果如图4所示。随着时间跨度的增加, 4种模型的预测性能均有所降低, 但Res-LSTM模型预测精度降低最慢。

R 2

值从0.9814下降到0.9423, 同时MAPE值增大到17.70%, 仍处于可接受的精度范围。对比4种模型的预测结果, Res-LSTM模型的预测精度和稳定性均优于其他模型。由于试验数据集有一定的时序性, 某时刻的有效波高值与该时刻前后数据有一定程度的关联, SVR网络不能保留当前时刻之前的数据信息, 而LSTM网络能通过细胞状态中的信息遗忘和记忆功能来影响后续时刻的信息传递, 发掘出序列间的非线性关联, 从而获得更高的预测精度。

显示原图|下载原图ZIP|生成PPT

图4 基于自测数据集不同模型在不同时段的有效波高预测结果

Fig. 4 Prediction results of various models in different time periods based on self-built dataset

2.4 公开数据集实验结果

公开数据选择美国National Data Buoy Center公开的深海浮标数据(https://www.ndbc.noaa.gov), 其中浮标44013提供每小时的标准气象数据, 且数据完整性良好。该浮标在2019年收集到1268条数据, 包含“月份”“小时”“分钟”“风向”“平均风速”“峰值风速”“主波周期”“平均波周期”“主波方向”“海平面压力”“空气温度”“海平面温度”“露点温度”“浮标能见度”和“有效波高”共15个变量。对比四种相关系数计算出各变量与有效波高之间的相关性值(表5), 发现峰值风速和主波周期与有效波高的相关性最强, 其余变量与有效波高的相关性不高, 且峰值风速、主波周期和主波方向与有效波高的相关性值均大于0.2, 说明MIC与其他3种相关系数在变量的相关性度量上具有一致性, 能够准确筛选出相关性较强的指标特征。

表5 各变量与有效波高的相关性计算结果

Tab. 5 Correlation results of each variable and significant wave height

变量名	MIC	Pearson	Spearman	Kendall
月份	0.1560	0.1011	0.0079	0.0033
小时	0.0744	0.0219	0.0690	0.0471
分钟	0.0663	0.0059	0.0071	0.0047
风向	0	0	0	0
平均风速	0.1847	0.0578	0.0426	0.0319
峰值风速	0.4814	0.5973	0.6078	0.4462
主波周期	0.3148	0.6088	0.6247	0.4572
平均波周期	0.1801	0.0980	0.0248	0.0088
主波方向	0.2276	0.5017	0.3329	0.2420
海平面压力	0.1477	0.1555	0.0900	0.0566
空气温度	0.0975	0.2818	0.1524	0.0989
海平面温度	0.1605	0.2554	0.3597	0.2030
露点温度	0.1864	0.2079	0.2978	0.2030
浮标能见度	0.1617	0.0353	0.3190	0.2146

未筛选变量时, 所有变量均作为输入指标。当相关性阈值设为0.2时, 筛选出峰值风速、主波周期和主波方向作为输入指标。当相关性阈值设为0.3时, 选择峰值风速和主波周期作为输入指标, 所有实验均设定当前时刻前12h的数据输入到模型, 预测当前时刻未来1h的有效波高, 模型参数设置见表2。

表6中的结果表明, 未筛选变量时, Res-LSTM模型的预测精度优于其他三种。筛选变量后, 无论相关性阈值设为0.2或0.3, Res-LSTM模型比其他3种模型的预测效果更好, 且相关性阈值为0.3时的预测性能略优于阈值为0.2的情况, 说明选择相关性阈值为0.3是合理的, 但对于不同的输入变量, 相关性阈值的设定会影响模型的预测效果。

表6 不同相关性阈值条件下的有效波高预测性能

Tab. 6 Significant wave height prediction performance under different correlation thresholds

模型	相关性阈值	R²	RMSE	MAE	MAPE/%
XGBoost	MIC=0	0.8271	0.4635	0.2711	22.22
	MIC=0.2	0.8483	0.5129	0.2889	21.15
	MIC=0.3	0.8596	0.5265	0.3323	20.39
SVR	MIC=0	0.7686	0.5069	0.3854	40.89
	MIC=0.2	0.8108	0.5601	0.3555	32.84
	MIC=0.3	0.8837	0.6092	0.3507	25.56
LSTM	MIC=0	0.9819	0.1733	0.1312	14.24
	MIC=0.2	0.9865	0.1346	0.0933	9.44
	MIC=0.3	0.9879	0.1163	0.0771	7.31
Res-LSTM	MIC=0	0.9817	0.1349	0.0945	10.60
	MIC=0.2	0.9916	0.1089	0.0652	8.50
	MIC=0.3	0.9932	0.0955	0.0644	6.48

浮标44013在变量筛选前后, 不同模型的有效波高预测结果如图5所示。变量筛选之前, LSTM和Res-LSTM模型可以取得较好的预测效果。由于XGBoost和SVR模型擅长分类检测而非时间序列预测, 因此预测效果不如LSTM和Res-LSTM。筛选变量之后, 所有模型的预测效果均得到提升, 特别是SVR模型的MAPE减小了15.33%, 证明多变量经MIC筛选出与预测指标相关性高的特征, 再输入模型能有效提升模型预测精度。在变量筛选前后, Res-LSTM网络的预测效果略优于LSTM网络, 验证了组合ResNet与LSTM网络能提升模型预测性能。

显示原图|下载原图ZIP|生成PPT

图5 不同模型对2019年浮标44013数据集的有效波高预测结果

a. 筛选变量前; b、c: 分别是相关性阈值选为0.2和0.3时的预测结果

Fig. 5 Prediction results of various models before variable screening of buoy 44013 in 2019.

(a) Before variables are screened; (b) and (c) are the predicted results when the correlation thresholds are selected as 0.2 and 0.3

3 结论

通过构建神经网络模型对中国海陵岛近岸有效波高的变化进行数值预测, 并对不同时间跨度的数值预测结果做了对比分析。MIC算法对特征变量间未知关系的探测有显著优势, 能准确检测出与波高相关性高的特征指标加入预测模型, 有效减小模型计算量, 从而加快训练速度, 提升模型预测性能。4种网络模型对有效波高的预测结果表明, 本研究提出的Res-LSTM网络在短时有效波高预测中能够取得良好效果。采用4个统计指标对预测结果进行综合评价, Res-LSTM模型预测结果与观测数值的一致性最好, 且模型的预测结果稳定性最高, 相较其他三种方法, 在短时有效波高预测上具有更高的准确性。在公开深海气象数据集上的实验结果表明, Res-LSTM模型对深海有效波高的预测也有较好的效果。后续的研究将对潮汐、波周期和地形地貌等可能存在的影响因素进行探测, 同时扩大预测的时间跨度和数据量, 不断提升模型的预测精度, 以启发读者并应用于未来的波浪预测。

References

Publishing order | Descend order by publishing year | Descend order by cited within

[1]

周水华, 洪晓, 梁昌霞, 等, 2020. 基于人工神经网络的台风浪高快速计算方法[J]. 热带海洋学报, 39(4): 25-33.

DOI

ZHOU

SHUIHUA

, HONG

XIAO

, LIANG

CHANGXIA

, et al, 2020. A method of tropical cyclone wave height calculation based on Artificial Neural Network[J]. Journal of Tropical Oceanography, 39(4): 25-33 (in Chinese with English abstract).

DOI

[2]	朱道恒, 李志强, 2021. 最大互信息系数的并行计算方法研究[J]. 科学技术与工程, 21(34): 14625-14633. ZHU DAOHENG, LI ZHIQIANG, 2021. Parallel calculation method for maximum information coefficient[J]. Science Technology and Engineering, 21(34): 14625-14633 (in Chinese with English abstract).

[3]

ABHIGNA

, JERRITTA

, SRINIVASAN

, et al, 2017. Analysis of feed forward and recurrent neural networks in predicting the significant wave height at the moored buoys in Bay of Bengal[C]// Proceedings of the 2017 international conference on communication and signal processing (ICCSP). Chennai: IEEE: 1856-1860.

[4]	BENGIO Y, SIMARD P, FRASCONI P, 1994. Learning long-term dependencies with gradient descent is difficult[J]. IEEE Transactions on Neural Networks, 5(2): 157-166. DOI PMID

[5]	CORNEJO-BUENO L, NIETO-BORGE J C, GARCÍA-DÍAZ P, et al, 2016. Significant wave height and energy flux prediction for marine energy applications: a grouping genetic algorithm—extreme learning machine approach[J]. Renewable Energy, 97: 380-389.

[6]	DEKA P C, PRAHLADA R, 2012. Discrete wavelet neural network approach in significant wave height forecasting for multistep lead time[J]. Ocean Engineering, 43: 32-42.

[7]	FAN SHUNTAO, XIAO NIANHAO, DONG SHENG, 2020. A novel model to predict significant wave height based on long short-term memory network[J]. Ocean Engineering, 205: 107298.

[8]	FENG ZHIJIE, HU PO, LI SHUIQING, et al, 2022. Prediction of significant wave height in offshore China based on the machine learning method[J]. Journal of Marine Science and Engineering, 10(6): 836.

[9]	GAO SONG, ZHAO PENG, PAN BIN, et al, 2018. A nowcasting model for the prediction of typhoon tracks based on a long short term memory neural network[J]. Acta Oceanologica Sinica, 37(5): 8-12.

[10]	GAO SONG, HUANG JUAN, LI YARU, et al, 2021. A forecasting model for wave heights based on a long short-term memory neural network[J]. Acta Oceanologica Sinica, 40(1): 62-69.

[11]	GÜNER H A A, YÜKSEL Y, ÇEVIK E Ö, 2013. Estimation of wave parameters based on nearshore wind-wave correlations[J]. Ocean Engineering, 63: 52-62.

[12]	HASHIM R, ROY C, MOTAMEDI S, et al, 2016. Selection of climatic parameters affecting wave height prediction using an enhanced Takagi-Sugeno-based fuzzy methodology[J]. Renewable and Sustainable Energy Reviews, 60: 246-257.

[13]	HE KAIMING, ZHANG XIANGYU, REN SHAOQING, et al, 2016. Deep residual learning for image recognition[C]// IEEE conference on computer vision and pattern recognition. Las Vegas: IEEE: 770-778.

[14]	HOCHREITER S, SCHMIDHUBER J, 1997. Long short-term memory[J]. Neural Computation, 9(8): 1735-1780. DOI PMID

[15]	LIU HUI, MI XIWEI, LI YANFEI, et al, 2019. Smart wind speed deep learning based multi-step forecasting model using singular spectrum analysis, convolutional Gated Recurrent Unit network and Support Vector Regression[J]. Renewable Energy, 143: 842-854.

[16]	MA KEZHAO, KONG JIA, WANG YIHAN, et al, 2022. Review of the applications of Kalman filtering in quantum systems[J]. Symmetry, 14(12): 2478.

[17]	MAHJOOBI J, ETEMAD-SHAHIDI A, KAZEMINEZHAD M H, 2008. Hindcasting of wave parameters using different soft computing methods[J]. Applied Ocean Research, 30(1): 28-36.

[18]	MAHJOOBI J, ADELI MOSABBEB E, 2009. Prediction of significant wave height using regressive support vector machines[J]. Ocean Engineering, 36(5): 339-347.

[19]	MAKARYNSKYY O, PIRES-SILVA A A, MAKARYNSKA D, et al, 2005. Artificial neural networks in wave predictions at the west coast of Portugal[J]. Computers & Geosciences, 31(4): 415-424.

[20]	ÖZGER M, 2010. Significant wave height forecasting using wavelet fuzzy logic approach[J]. Ocean Engineering, 37(16): 1443-1451.

[21]	RESHEF D N, RESHEF Y A, FINUCANE H K, et al, 2011. Detecting novel associations in large data sets[J]. Science, 334(6062): 1518-1524. DOI PMID

[22]	RIZAL A M, NINGSIH N S, 2020. Ocean wave energy potential along the west coast of the Sumatra island, Indonesia[J]. Journal of Ocean Engineering and Marine Energy, 6(2): 137-154.

[23]	RODRIGUEZ A, SÁNCHEZ-ARCILLA A, REDONDO J M, et al, 1995. Pollutant dispersion in the nearshore region: modelling and measurements[J]. Water Science and Technology, 32(9-10): 169-178.

[24]

SHAMSHIRBAND

, MOSAVI

, RABCZUK

, et al, 2020. Prediction of significant wave height; comparison between nested grid numerical model, and machine learning models of artificial neural networks, extreme learning and support vector machines[J]. Engineering Applications of Computational Fluid Mechanics, 14(1): 805-817.

[25]	STOKES G C, 2010. On the theory of oscillation wave[M/OL]. STOKES G C. Mathematical and Physical Papers. Cambridge: Cambridge University Press: 197-229. https://doi.org/10.1017/CBO9780511702242.

[26]	THEODOROPOULOS P, SPANDONIDIS C C, THEMELIS N, et al, 2021. Evaluation of different deep-learning models for the prediction of a ship’s propulsion power[J]. Journal of Marine Science and Engineering, 9(2): 116.

[27]	WANG JICHAO, WANG YUE, YANG JUNGANG, 2021. Forecasting of significant wave height based on gated recurrent unit network in the Taiwan strait and its adjacent waters[J]. Water, 13(1): 86.

[28]	YANG SHAOBO, ZHANG ZHENQUAN, FAN LINLIN, et al, 2019. Long-term prediction of significant wave height based on SARIMA model in the South China Sea and adjacent waters[J]. IEEE Access, 7: 88082-88092.

[29]	YANG SHILUN, SHI BENWEI, BOUMA T J, et al, 2012. Wave attenuation at a salt marsh margin: a case study of an exposed coast on the Yangtze Estuary[J]. Estuaries and Coasts, 35(1): 169-182.

[30]	ZHANG DA, KABUKA M R, 2018. Combining weather condition data to predict traffic flow: a GRU-based deep learning approach[J]. IET Intelligent Transport Systems, 12(7): 578-585.

Options

Outlines

模态框（Modal）标题

Abstract

Cite this article

1 数据处理与方法

1.1 数据来源

表1 样本数据信息

1.2 最大信息系数

1.3 长短期记忆网络

图1 LSTM存储单元结构

1.4 残差网络

图2 残差网络的核心结构

1.5 MIC-Res-LSTM模型

图3 MIC-Res-LSTM模型的整体结构

2 结果与讨论

2.1 评估指标

2.2 实验参数

表2 训练参数设置

表3 以不同相关系数计算各指标特征与有效波高的相关性

2.3 自测数据集实验结果

表4 短期预测的性能比较

图4 基于自测数据集不同模型在不同时段的有效波高预测结果

2.4 公开数据集实验结果

表5 各变量与有效波高的相关性计算结果

表6 不同相关性阈值条件下的有效波高预测性能

图5 不同模型对2019年浮标44013数据集的有效波高预测结果

3 结论

References