Journal of Tropical Oceanography >
Study on the early warning model of red tide in the offshore area of Pingtan, Fujian province
Copy editor: YAO Yantao
Received date: 2021-11-14
Revised date: 2022-02-28
Online published: 2022-02-25
Supported by
National Key R&D Program Funded Projects(2016YFE0202100)
Industry-University Cooperation Project of Fujian Province, China(SC-292)
Industry-University Cooperation Project of Fujian Province, China(21NB000922)
We analyzed the principal components of hydrology, water quality, and meteorological data in Pingtan, Fujian province from 2013 to 2019. We selected 5 meteorological factors and 4 water quality factors. Our study establishes four early-warning model, KNN (K-nearest neighbor), RF (random forest), GBRT (gradient-boosted regression trees), Bagging (bootstrap aggregating) with meteorological factors and water quality factors as input indicators, and algal cell density as output indicators. After normalizing the 802 sets of marine monitoring data from 2013 to 2019, 80% of the data were randomly selected as the model training samples, and the remaining 20% were used as data of model verification. When temperature, wind speed, sea level pressure, and chlorophyll a are used as input parameters, the calculation result of KNN regression model is more accurate (R2=0.624, RMSE=0.821 μg·L-1, MAE=0.836 μg·L-1). In the sea area without chlorophyll a monitoring index, a BP neural network early-warning model with chlorophyll a concentration as the output index and temperature, sunshine, wind speed and AOI as input parameters was established, which has better warning accuracy (R2=0.651, RMSE=0.062 μg·L-1, MAE=0.033 μg·L-1). Our results can provide a reference for the red tide early warning research in the Pingtan coastal area.
SU Jinzhu , ZOU Jiashu , SU Yuping , ZHANG Mingfeng , WENG Zhenzhou , Yang Xiaoqiang . Study on the early warning model of red tide in the offshore area of Pingtan, Fujian province[J]. Journal of Tropical Oceanography, 2022 , 41(4) : 172 -180 . DOI: 10.11978/2021156
表1 2013—2019年平潭海域的环境指标Tab. 1 Environmental data sets of Pingtan coastal area from 2013 to 2019 |
数据类型 | 环境指标 | 数据来源 |
---|---|---|
水质数据 | 水温、盐度、溶解氧、pH、氨氮、硝酸盐-氮、亚硝酸盐-氮、磷酸盐、硅酸盐、溶解氧饱和度、化学耗氧量、叶绿素a、浮游植物密度、气温共14个指标 | 福建省海洋环境与渔业 资源监测中心 |
气象数据 | 风速、降水量、日照时数、气温共4个指标 | 中国气象数据网 |
表2 以藻类密度作为输出参数的4种模型的优缺点Tab. 2 Advantages and disadvantages of four models with algae biomass as output parameter. |
模型 | 优点 | 缺点 |
---|---|---|
KNN回归模型 | 理论成熟, 易于实现(Jiménez-Carvelo et al, 2019), 可以同时用于分类和回归(Liu et al, 2018) | 需要大量运算以及很大的存储空间, 最邻近数据的选择对右方的影响太大(Liu et al, 2018; Jiménez-Carvelo et al, 2019) |
RF回归模型 | 不会过度拟合数据, 随机预测器选择保持低偏差。适合不稳定模型或分类不平衡问题, 可提供更好的预测模型(Prasad et al, 2006; Jiménez-Carvelo et al, 2019) | 在时间序列和计算机资源方面要求非常高。模拟结果复杂, 分类显示为非图形树(Prasad et al, 2006; Jiménez-Carvelo et al, 2019) |
GBRT回归模型 | 能够处理不同类型的数据, 无需预先对数据进行转换或排除异常值, 可以适应复杂的非线性关系, 并自动处理预测器之间的交互效应(Deng et al, 2019) | 会出现过度拟合, 因此可能无法拟合新样本, 从而无法正确预测(Jiménez-Carvelo et al, 2019) |
Bagging回归模型 | 在降低高维数据集的方差和误差方面非常有效。训练集中没有使用的数据称为“out-of-bag”数据, 可以用来提供更好的误差估计(Prasad et al, 2006) | 因为大量的回归树(通常是30~50棵)是平均的, 所以解释结果并不容易, 此外误差的偏倚分量略优于单回归树(Prasad et al, 2006) |
图2 BP神经网络的训练过程(许阳春 等, 2020)hj: 隐含层节点i的输出值; wij: 节点i的神经元权重值; xi: 节点i的输出值; aj: 隐含层阈值; ${{\overset{\scriptscriptstyle\frown}{y}}_{k}}$: 当j为输出节点时, ${{\overset{\scriptscriptstyle\frown}{y}}_{k}}={{h}_{j}}$; bj: 输出层阈值; wjk: 第k个样本的神经元权重值; Yk: 实际输出值; ek: 误差; η: 常数 Fig. 2 Training process of BP neural network (Xu et al, 2020) |
表3 平潭海域各指标因子间的Pearson相关关系Tab. 3 Pearson correlation between various index factors in the Pingtan costal area |
水温 | 盐度 | 溶解氧 | AOI | pH | 叶绿素a | 风速 | 降水 | 日照 | 气温 | 海平面气压 | |
---|---|---|---|---|---|---|---|---|---|---|---|
盐度 | 0.298** | ||||||||||
溶解氧 | -0.707** | -0.401** | |||||||||
AOI | -0.147** | 0.028 | 0.783** | ||||||||
pH | 0.006 | 0.070* | 0.152** | 0.272** | |||||||
叶绿素a | -0.039 | -0.066 | 0.348** | 0.479** | 0.230** | ||||||
风速 | -0.011 | 0.170** | -0.174** | -0.057 | -0.011 | -0.134** | |||||
降水 | -0.117** | -0.214** | 0.066 | -0.131** | -0.205** | -0.093** | -0.022 | ||||
日照 | 0.351** | 0.190** | -0.203** | 0.003 | 0.031 | -0.007 | -0.149** | -0.332** | |||
气温 | 0.844** | 0.379** | -0.621** | -0.081 | 0.073* | 0.034 | -0.031 | -0.281** | 0.532** | ||
海平面气压 | -0.567** | -0.231** | 0.443** | 0.126** | -0.156** | -0.032 | 0.066 | 0.058 | -0.099** | -0.686** | |
藻密度 | 0.057 | 0.076* | 0.178** | 0.251** | 0.107** | 0.414** | -0.109** | 0.006 | -0.013 | 0.112** | -0.123** |
注: *表示显著相关(p<0.05), **表示极显著相关(p<0.01)。 |
表4 4种模型的演算结果Tab. 4 Calculation results of four models |
组合 | 指标 | KNN回归模型 | RF回归模型 | GBRT回归模型 | Bagging回归模型 | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
R2 | MAE/ (μg·L-1) | RMSE/ (μg·L-1) | R2 | MAE/ (μg·L-1) | RMSE/ (μg·L-1) | R2 | MAE/ (μg·L-1) | RMSE/ (μg·L-1) | R2 | MAE/ (μg·L-1) | RMSE/ (μg·L-1) | |||||
组合1 | 风速+气温+海平面气压+叶绿素a | 0.624 | 0.836 | 0.821 | 0.596 | 0.836 | 0.829 | 0.562 | 0.829 | 0.839 | 0.585 | 0.832 | 0.839 | |||
组合2 | 气温+海平面气压+叶绿a+AOI | 0.363 | 0.814 | 0.896 | 0.468 | 0.825 | 0.865 | 0.485 | 0.824 | 0.862 | 0.496 | 0.822 | 0.867 | |||
组合3 | 风速+气温+海平面气压+叶绿a+AOI | 0.477 | 0.823 | 0.863 | 0.537 | 0.829 | 0.846 | 0.536 | 0.826 | 0.846 | 0.530 | 0.826 | 0.853 |
表5 叶绿素a作为输出端的部分模型演算结果Tab. 5 Partial model calculation results with Chl a as output in BP model |
输入组合 | 输入因子 | RMSE/(μg·L-1) | MAE/(μg·L-1) | R2 |
---|---|---|---|---|
组合1 | 气温+日照+溶解氧 | 0.066 | 0.033 | 0.499 |
组合2 | 气温+日照+AOI | 0.073 | 0.041 | 0.258 |
组合3 | 气温+日照+风速 | 0.048 | 0.033 | 0.333 |
组合4 | 气温+日照+降水+溶解氧 | 0.053 | 0.031 | 0.602 |
组合5 | 气温+日照+风速+AOI | 0.062 | 0.033 | 0.651 |
组合6 | 气温+日照+风速+溶解氧 | 0.046 | 0.027 | 0.290 |
[1] |
陈宝红, 谢尔艺, 高亚辉, 等, 2015. 米氏凯伦藻对海洋生物致毒作用的研究进展[J]. 福建水产, 37(3): 241-249.
|
[2] |
陈旭阳, 刘保良, 2018. 海洋在线监测浮标在赤潮监测中的应用研究[J]. 热带海洋学报, 37(5): 20-24.
|
[3] |
赫芬·I·里斯. 2020. 机器学习实战: 使用R、tidyverse和mlr[M]. 但波, 高山, 韩建立, 译. 北京: 清华大学出版社: 1-536.
|
[4] |
蓝虹, 卢君峰, 曹宇峰, 等, 2014. 浅析平潭岛主要海洋灾害及防治对策[J]. 海洋开发与管理, 31(2): 55-58. (in Chinese)
|
[5] |
李冬梅, 高永利, 田甜, 等, 2010. 水体扰动对多种赤潮藻生长的影响[J]. 热带海洋学报, 29(6): 65-70.
|
[6] |
林森杰, 姬南京, 罗昊, 2019. 海洋有害藻华研究进展[J]. 海洋与湖沼, 50(3): 495-510.
|
[7] |
洛昊, 马明辉, 梁斌, 等, 2013. 中国近海赤潮基本特征与减灾对策[J]. 海洋通报, 32(5): 595-600.
|
[8] |
马毅, 吴瑞贞, 李华建, 等, 2008. 有利于赤潮消亡的水文气象条件[J]. 海洋预报, 25(3): 1-6.
|
[9] |
芮政, 杨桂军, 刘玉, 等, 2019. 扰动方式对水华微囊藻(Microcystis flos-aquae)群体大小的影响[J]. 湖泊科学, 31(2): 355-364.
|
[10] |
苏金洙, 高佳, 苏玉萍, 等, 2020. 福建平潭海域米氏凯伦藻(Karenia mikimotoi)增殖影响因子研究[J]. 福建师范大学学报(自然科学版), 36(4): 43-49, 56.
|
[11] |
苏新红, 金丰军, 杨奇志, 等, 2017. 基于BP神经网络模型的福建海域赤潮预报方法研究[J]. 水产学报, 41(11): 1744-1755. (in Chinese)
|
[12] |
小沃尔特·J·韦伯, 1980. 水质控制物理化学方法[M]. 上海市政工程设计院, 译. 北京: 中国建筑工业出版社: 510-511.
|
[13] |
许昆灿, 暨卫东, 周秋麟, 等, 2004. 表观增氧量在近岸海域赤潮快速评价与预警中的应用[J]. 台湾海峡, 23(4): 417-422.
|
[14] |
许阳春, 张明峰, 苏玉萍, 等, 2020. 基于BP人工神经网络平潭海域赤潮叶绿素a浓度模型演算研究[J]. 海洋科学, 44(3): 34-41.
|
[15] |
俞志明, 陈楠生, 2019. 国内外赤潮的发展趋势与研究热点[J]. 海洋与湖沼, 50(3): 474-486.
|
[16] |
张海涵, 王娜, 宗容容, 等, 2022. 水动力条件对藻类生理生态学影响的研究进展[J]. 环境科学研究, 35(1): 181-190.
|
[17] |
赵聪蛟, 刘希真, 付声景, 等, 2020. 基于水质浮标在线监测的米氏凯伦藻赤潮过程及环境因子变化特征分析[J]. 热带海洋学报, 39(2): 88-97.
|
[18] |
赵雪, 杨凡, 郭娜, 等, 2009. 2007年2月汕头赤潮事件水文气象及海水理化因子影响分析[J]. 海洋预报, 26(1): 43-51. (in Chinese)
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|
[29] |
|
[30] |
|
[31] |
|
[32] |
|
[33] |
|
[34] |
|
[35] |
|
[36] |
|
[37] |
|
/
〈 | 〉 |