Marine Environmental Protection

Study on the early warning model of red tide in the offshore area of Pingtan, Fujian province

  • SU Jinzhu , 1, 2 ,
  • ZOU Jiashu 1 ,
  • SU Yuping , 1, 2 ,
  • ZHANG Mingfeng 3 ,
  • WENG Zhenzhou 4 ,
  • Yang Xiaoqiang 4
Expand
  • 1. Environmental Science and Engineering College, Fujian Normal University, Fuzhou 350007, China
  • 2. Fujian Province Research Centre for River and Lake Health Assessment, Fuzhou 350007, China
  • 3. Geographical Sciences College, Fujian Normal University, Fuzhou 350007, China
  • 4. Marine and Fisheries Technology Centre, Fuzhou 350007, China
SU Yuping. email:

Copy editor: YAO Yantao

Received date: 2021-11-14

  Revised date: 2022-02-28

  Online published: 2022-02-25

Supported by

National Key R&D Program Funded Projects(2016YFE0202100)

Industry-University Cooperation Project of Fujian Province, China(SC-292)

Industry-University Cooperation Project of Fujian Province, China(21NB000922)

Abstract

We analyzed the principal components of hydrology, water quality, and meteorological data in Pingtan, Fujian province from 2013 to 2019. We selected 5 meteorological factors and 4 water quality factors. Our study establishes four early-warning model, KNN (K-nearest neighbor), RF (random forest), GBRT (gradient-boosted regression trees), Bagging (bootstrap aggregating) with meteorological factors and water quality factors as input indicators, and algal cell density as output indicators. After normalizing the 802 sets of marine monitoring data from 2013 to 2019, 80% of the data were randomly selected as the model training samples, and the remaining 20% were used as data of model verification. When temperature, wind speed, sea level pressure, and chlorophyll a are used as input parameters, the calculation result of KNN regression model is more accurate (R2=0.624, RMSE=0.821 μg·L-1, MAE=0.836 μg·L-1). In the sea area without chlorophyll a monitoring index, a BP neural network early-warning model with chlorophyll a concentration as the output index and temperature, sunshine, wind speed and AOI as input parameters was established, which has better warning accuracy (R2=0.651, RMSE=0.062 μg·L-1, MAE=0.033 μg·L-1). Our results can provide a reference for the red tide early warning research in the Pingtan coastal area.

Cite this article

SU Jinzhu , ZOU Jiashu , SU Yuping , ZHANG Mingfeng , WENG Zhenzhou , Yang Xiaoqiang . Study on the early warning model of red tide in the offshore area of Pingtan, Fujian province[J]. Journal of Tropical Oceanography, 2022 , 41(4) : 172 -180 . DOI: 10.11978/2021156

*感谢吴嘉祥工程师提供模型的演算支持。
赤潮是一种复杂的海洋生态异常现象, 由海洋中某些浮游生物, 包括微藻、原生动物和细菌等暴发性增殖或聚集而产生的生态灾害(Zohdi et al, 2019; 林森杰 等, 2019)。近几十年来, 由于海洋生态环境的恶化, 赤潮等海洋灾害频繁发生, 其带来的危害效应明显加重(Anderson, 2009)。例如, 2002年由于微小原甲藻赤潮, 导致菲律宾Bolinao和Anda海水养殖场所大量的虱目鱼死亡, 造成经济损失约5.83千万元 (Azanza et al, 2005; San Diego-McGlone et al, 2008)。根据《中国海洋灾害公报》统计, 2000—2019年间我国赤潮共计发生1300多起, 累计面积达到21.3万km2。2012 年5月, 福建近海海域暴发了严重的米氏凯伦藻赤潮, 其藻细胞数量达107个·L-1, 导致养殖鲍鱼大量死亡, 经济损失达20.11亿元, 其中平潭海域经济损失约占31.4%(蓝虹 等, 2014; 苏新红 等, 2017)。赤潮的暴发除了对沿海养殖业造成经济损失外, 有害藻类产生的藻毒素也会危害水生生物, 进而威胁人类健康(陈宝红 等, 2015; Wu et al, 2019)。因此, 有效预警和预报赤潮暴发, 提前做好应急防控工作, 不仅在一定程度上可减少经济损失, 保护海洋生态环境健康, 同时也具有重要的理论和应用价值。
目前, 国际上关于赤潮的预警研究仍处于探索阶段(洛昊 等, 2013; 俞志明 等, 2019)。在赤潮预警模型开发方面, 通常有3种预警模型: 机理演绎模型、数据驱动归纳模型以及遥感空间模型。演绎模型是基于现有理论、知识和研究经验建立的, 使用户能够模拟特定系统的行为趋势(Recknagel, 1997), 演绎模型较为全面地考虑了赤潮过程中的各影响因素, 对赤潮的生态机理研究更为关注。但赤潮的生消过程受复杂的环境因素影响, 与赤潮暴发的关系尚未明确, 甚至部分影响因素暂未发现或仍处于研究阶段, 以致演绎模型对复杂关系的揭示受限。数据驱动归纳模型是通过统计学方法、相关性分析和机器学习方法从经验数据模式中提取出整体信息, 从而使用户能够预测系统的趋势, 而不是解释系统的行为(Recknagel, 1997; Tian et al, 2017)。但在实际海域监测预警中, 需要不断有实时监测数据输入才能客观、及时反映现实情况, 同时由于该模型是基于历史数据建立的, 故其预测精度不高。随着遥感技术的发展, 尤其是在增加了可监测参数及可搭载方式后, 遥感技术在赤潮预测预报方面得到了广泛应用。有学者将遥感技术与叶绿素a或浮游植物密度作为输出参数的模型相结合(俞志明 等, 2019); Karki等(2018)基于MODIS数据建立的数据驱动模型, 可以提前3天作出预测预报, 但是卫星遥感目前尚无法反演赤潮预警中所需的一些生化因素, 且现有的遥感赤潮提取算法无法实现普遍适用性, 尤其是在人为干扰严重的近岸海域适用性较低。不同类型的预警模型各有利弊, 因此在进行赤潮预警模型研究中, 需要针对特定的研究对象, 分析其赤潮时空特征及理化因素来进行模型构建, 找出与赤潮暴发相关性较高的环境因素, 开发适合特定海域的赤潮预警模型。
本研究以平潭海域为研究对象, 在对水文和气象环境数据的统计分析基础上, 筛选出与赤潮发生相关性较强的环境因子, 以藻类密度作为输出因子, 探索K最近邻回归模型(K-nearestneighbor, KNN)、随机森林回归模型(random forest, RF)、梯度提升树回归模型(gradient-boosted regression trees, GBRT)以及Bagging回归模型(bootstrap aggregating, Bagging)这4种赤潮藻类密度模型的构建, 并以叶绿素a浓度作为输出因子, 构建BP人工神经网络预警模型, 应用于没有叶绿素a浓度监测数据的海湾, 为实现平潭海域的赤潮防控提供参考。

1 材料与方法

1.1 研究区与采样概况

平潭岛位于福建省东部沿海, 属湿润的海洋性季风气候, 适合养殖鱼类、贝类、藻类和虾蟹类。根据平潭海域赤潮灾害信息统计, 2009—2019年平潭海域共发生赤潮15起, 角毛藻、拟菱形藻、圆筛藻、东海原甲藻、夜光藻以及米氏凯伦藻是该海域常见的赤潮原因种。
本研究选择平潭综合实验区所辖海域作为研究对象, 监测站位如图1所示。出海采样及监测时间为每年的4—10月, 其中4—6月是平潭海域赤潮高发期, 每周采样1~2次; 7—10月进入赤潮消亡期, 赤潮发生概率较低, 仅在月初和月末进行野外采样。
图1 平潭海域2013—2019年监测站位示意图

该图基于国家测绘地理信息局标准地图服务网站下载的审图号为GS(2019)1822的标准地图制作

Fig. 1 Location map of monitoring stations in the Pingtan costal area from 2013 to 2019

1.2 数据来源与处理

本研究中, 用于构建模型的平潭海域水质数据来源于福建省海洋环境与渔业资源监测中心提供的2013—2019年的802组平潭海洋监测有效样本数据, 模型所用的气象资料来源于中国气象数据网(https://data.cma.cn/)(表1)。其中, 氨氮、硝酸盐-氮、亚硝酸盐-氮、磷酸盐、硅酸盐、溶解氧饱和度、化学耗氧量这7个环境参数为2013—2015年的监测数据。
表1 2013—2019年平潭海域的环境指标

Tab. 1 Environmental data sets of Pingtan coastal area from 2013 to 2019

数据类型 环境指标 数据来源
水质数据 水温、盐度、溶解氧、pH、氨氮、硝酸盐-氮、亚硝酸盐-氮、磷酸盐、硅酸盐、溶解氧饱和度、化学耗氧量、叶绿素a、浮游植物密度、气温共14个指标 福建省海洋环境与渔业
资源监测中心
气象数据 风速、降水量、日照时数、气温共4个指标 中国气象数据网
模型指标包括风速、降水量、日照时数、气温、水温、盐度、pH、溶解氧、表观增氧量(apparent oxygen increase, AOI)、叶绿素a以及浮游植物密度。表观增氧量(AOI)表示在赤潮开始形成之初, 大气中的溶解氧含量与海水中的溶解氧含量达到一种平衡状态(许昆灿 等, 2004)。赤潮暴发时, 浮游植物的光合作用使得海水中的溶解氧增加。表观增氧量的公式为:
$\text{AOI}=\text{D}{{\text{O}}_{实测值}}-\text{D}{{\text{O}}_{饱和值}}$
式中: DO实测值为海水中溶解氧含量的现场实测值(单位: mg·L-1); DO饱和值为现场水温、盐度条件下的饱和溶解氧(单位: mg·L-1); AOI的单位为mg·L-1
关于饱和溶解氧DO饱和值的计算公式, 本研究采用Gammerson和Robertson提出的饱和溶解氧经验式, 简称G氏公式(小沃尔特•J•韦伯, 1980), 即:
$DO_ {饱和值}=\frac{475-2.65{{C}_{\text{ds}}}}{33.5+t}$
式中: Cds为固体溶解物的量(单位: g·L-1); t为水温(单位: ℃)。
数据的归一化处理参考许阳春等(2020), 具体公式如下:
${{x}_{i}}^{\prime }=\frac{{{x}_{i}}-{{x}_{\min }}}{{{x}_{\max }}-{{x}_{\min }}}$
式中: xi为第i个样本值; xi'为第i个数据xi的归一化值; xmin为样本数据中的最小值; xmax为样本数据中的最大值。

1.3 模型介绍

1.3.1 KNN回归模型

KNN回归模型是一种懒惰的回归学习模型(赫芬·I·里斯, 2020)。所有的操作均在测试阶段完成, 通过计算每个测试数据与训练数据之间的距离, 选择最接近K的数据, 并输出预测数据的平均值, 模型公式如下:
$X=\frac{1}{K}\sum\nolimits_{k=1}^{K}{{{y}_{k}}}$
式中: X为预测输出; yk为第k个预测输出值; K为最邻近数据。

1.3.2 RF回归模型

随机森林是一种集成学习器, 在这个学习模型中, 每个学习是一个决策树(Breiman, 2001)。当随机森林构建树时, 从随机选择的特征值中选择最佳的
特征值放入树的节点中。当一个实例进入一个随机森林时, 它将进入所有的树, 每棵树都有一个预测, 并返回预测的平均值, 模型公式如下:
$F(x)=\frac{1}{B}\sum\nolimits_{b=1}^{B}{{}}{{T}_{b}}(x)$
式中: F(x)为预测输出; Tb(x)为第b个预测输出值; x为输入数据; B为回归树数量。

1.3.3 GBRT回归模型

GBRT回归结合了一种称为boosting的统计技术, 是对传统决策树方法进行改进的模型。该方法将一组“弱”模型聚集起来, 形成一个单一的“强”共识模型(Lin et al, 2013)。该模型的构建通过每步添加一棵新树来优化预测(Elith et al, 2008)。假设数据为S = {(xi, yi)| i = 1, …, M}, 其中xiRN, yiR (R表示实数集, RN表示N维实数集), M回归树f(xi)的GBRT模型表示公式如下(Zhou et al, 2016):
$P({{x}_{i}})=\sum\nolimits_{m=1}^{M}{{{f}_{m}}({{x}_{i}})}$
式中: P(xi)为预测输出; fm(xi)为第m个预测输出值; xi为输入数据; M为回归树数量。

1.3.4 Bagging回归模型

Bagging回归模型是一个集合估计器, 它拟合数据集的随机子集上的每个基本回归器, 然后通过投票或平均来累积它们的单个预测, 从而做出最终预测。该模型通过置换和预测抽取样本, 并通过多数投票机制获得样本(Nabipour et al, 2020)。Bagging在不进行修剪的情况下构造函数h(x)的多元回归树, 并利用如下公式(Prasad et al, 2006)预测输出g(x)。
$g(x)=\frac{1}{T}\sum\nolimits_{t=1}^{T}{{{h}_{t}}(x)}$
式中: g(x)为预测输出; ht(x)为第t个预测输出值; x为输入数据; T为回归树数量。

1.3.5 4种模型的优缺点

本研究基于以上4种预警回归模型 (KNN回归模型、RF回归模型、GBRT回归模型和Bagging回归模型), 以环境数据为样本作为输入端, 藻密度为输出端, 对其输出结果进行精度评价和分析, 最终选取精度最高的模型用于构建平潭综合实验区海域甲藻赤潮预警模型, 4种模型的优缺点如表2所示。
表2 以藻类密度作为输出参数的4种模型的优缺点

Tab. 2 Advantages and disadvantages of four models with algae biomass as output parameter.

模型 优点 缺点
KNN回归模型 理论成熟, 易于实现(Jiménez-Carvelo et al, 2019), 可以同时用于分类和回归(Liu et al, 2018) 需要大量运算以及很大的存储空间, 最邻近数据的选择对右方的影响太大(Liu et al, 2018; Jiménez-Carvelo et al, 2019)
RF回归模型 不会过度拟合数据, 随机预测器选择保持低偏差。适合不稳定模型或分类不平衡问题, 可提供更好的预测模型(Prasad et al, 2006; Jiménez-Carvelo et al, 2019) 在时间序列和计算机资源方面要求非常高。模拟结果复杂, 分类显示为非图形树(Prasad et al, 2006; Jiménez-Carvelo et al, 2019)
GBRT回归模型 能够处理不同类型的数据, 无需预先对数据进行转换或排除异常值, 可以适应复杂的非线性关系, 并自动处理预测器之间的交互效应(Deng et al, 2019) 会出现过度拟合, 因此可能无法拟合新样本, 从而无法正确预测(Jiménez-Carvelo et al, 2019)
Bagging回归模型 在降低高维数据集的方差和误差方面非常有效。训练集中没有使用的数据称为“out-of-bag”数据, 可以用来提供更好的误差估计(Prasad et al, 2006) 因为大量的回归树(通常是30~50棵)是平均的, 所以解释结果并不容易, 此外误差的偏倚分量略优于单回归树(Prasad et al, 2006)

1.4 以叶绿素浓度作为输出参数的BP人工神经网络

BP神经网络使用梯度下降法来获得最佳权重和阈值。BP神经网络具有m个输入层和n个输出层, 以及输入层和输出层之间的几个隐含层(Lyu et al, 2019)。当预测精度未达到要求的水平时, 可以通过增加隐含层中的节点数来提高预测精度。设有n个样本(Xk, Yk)(k=1, 2, 3, …, n), 每任一输入值Xk, 其相应输出值为Yk, BP神经网络的训练过程如图2所示。
图2 BP神经网络的训练过程(许阳春 等, 2020)

hj: 隐含层节点i的输出值; wij: 节点i的神经元权重值; xi: 节点i的输出值; aj: 隐含层阈值; ${{\overset{\scriptscriptstyle\frown}{y}}_{k}}$: 当j为输出节点时, ${{\overset{\scriptscriptstyle\frown}{y}}_{k}}={{h}_{j}}$; bj: 输出层阈值; wjk: 第k个样本的神经元权重值; Yk: 实际输出值; ek: 误差; η: 常数

Fig. 2 Training process of BP neural network (Xu et al, 2020)

1.5 模型演算

本研究模型对802组数据随机排序, 从数据集序列中随机选取80%作为模型的训练数据, 其余20%的样本数据作为测试数据(许阳春 等, 2020)。以不同的环境因子指标交叉组合, 作为模型输入参数, 以藻密度作为输出参数, 对赤潮预警模型进行训练和演算。

1.6 模型精度评价

模型评价标准参考Qin等(2017)的ARIMA- DBN模型的标准均方误差(RMSE)、平均绝对误差(MAE)及可决系数(R2), 公式如下:
$\text{RMSE}=\sqrt{\frac{\sum\nolimits_{i=1}^{n}{{{({{x}_{\text{obs},i}}-{{x}_{\text{pre,}i}})}^{2}}}}{n}}$
$\text{MAE}=\frac{1}{n}\sum\nolimits_{i=1}^{n}{\left| {{x}_{\text{obs},i}}-{{x}_{\text{pre,}i}} \right|}$
${{R}^{\text{2}}}={{\left( \frac{\sum\nolimits_{i=1}^{n}{({{x}_{\text{obs},i}}-{{{\bar{x}}}_{\text{obs}}})({{{\bar{x}}}_{\text{pre,}i}}-{{{\bar{x}}}_{\text{pre}}})}}{\sqrt{\sum\nolimits_{i=1}^{n}{{{({{x}_{\text{obs},i}}-{{{\bar{x}}}_{\text{obs}}})}^{2}}}}\sqrt{\sum\nolimits_{i=1}^{n}{{{({{{\bar{x}}}_{\text{pre,}i}}-{{{\bar{x}}}_{\text{pre}}})}^{2}}}}} \right)}^{2}}$
各式中: xobs, i为第i个历史数据实测值; xpre, i为第i个模型演算值; xobs为历史数据实测值; xpre为模型演算值; ${{\bar{x}}_{\text{obs}}}$为历史数据实测均值; ${{\bar{x}}_{\text{pre}}}$为模型演算均值; n为样本数量。

1.7 数据处理

本文的数据预处理主要通过Excel 2016进行规范化, 模型演算所用数据的相关性分析通过SPSS 25.0 统计软件完成, 主成分分析通过Origin 2017完成, 模型的构建及运行环境均在Matlab 2016a中进行开发。

2 结果与讨论

2.1 模型指标筛选结果分析

赤潮的暴发受各环境因子的综合影响, 因此 对数据进行初步的筛选剔除之后, 将802组环境参数的各输入指标与藻密度之间的关系进行相关性分析。运用SPSS 25.0 统计软件, 对2013—2019年平潭海域的藻密度与各环境因子进行Pearson相关分析, 结果显示藻密度与叶绿素a、气温、AOI、溶解氧、pH呈极显著的正相关关系, 与风速、海平面气压则呈极显著的负相关关系, 与盐度呈显著的正相关关系(表3)。结合主成分分析结果, 剔除冗余指标, 精简与浮游植物密度强相关的环境因子, 提高模型的演算精度。主成分分析结果表明, 溶解氧、气温、水温、海平面气压与第一主成分密切相关(图3), 分别为-0.463、0.461、0.442、-0.344; 与第二主成分相关的有叶绿素a、AOI、pH和日照贡, 献率分别为0.466、0.460、0.385、0.282; 风速、降水、盐度在第三主成分中占比较大, 分别为0.569、-0.525、0.416。
表3 平潭海域各指标因子间的Pearson相关关系

Tab. 3 Pearson correlation between various index factors in the Pingtan costal area

水温 盐度 溶解氧 AOI pH 叶绿素a 风速 降水 日照 气温 海平面气压
盐度 0.298**
溶解氧 -0.707** -0.401**
AOI -0.147** 0.028 0.783**
pH 0.006 0.070* 0.152** 0.272**
叶绿素a -0.039 -0.066 0.348** 0.479** 0.230**
风速 -0.011 0.170** -0.174** -0.057 -0.011 -0.134**
降水 -0.117** -0.214** 0.066 -0.131** -0.205** -0.093** -0.022
日照 0.351** 0.190** -0.203** 0.003 0.031 -0.007 -0.149** -0.332**
气温 0.844** 0.379** -0.621** -0.081 0.073* 0.034 -0.031 -0.281** 0.532**
海平面气压 -0.567** -0.231** 0.443** 0.126** -0.156** -0.032 0.066 0.058 -0.099** -0.686**
藻密度 0.057 0.076* 0.178** 0.251** 0.107** 0.414** -0.109** 0.006 -0.013 0.112** -0.123**

注: *表示显著相关(p<0.05), **表示极显著相关(p<0.01)。

图3 2013—2019年平潭海域各环境因子的主成分分析结果

Fig. 3 Principal component analysis results of various environmental factors in the Pingtan coastal area from 2013 to 2019

基于以上分析, 筛选出叶绿素a、气温、AOI、溶解氧、pH、风速、海平面气压、降水、日照这9个环境因子。为了减少模型指标的冗余性, 本研究中的表观增氧量(AOI)已涵盖了水文因子中的水温和盐度。将筛选出的环境组合因子通过模型来建模分析, 并对模型预警精度进行评价。

2.2 以藻密度为输出指标的模型演算结果分析

以藻密度作为输出端的4种模型的部分演算结果如表4所示, 所列的3种多指标组合输出结果相对最优, 可决系数均达到较高拟合优度。所有组合在4种模型演算结果中, MAE和RMSE差异不大, 均在0.800~0.900范围内。
表4 4种模型的演算结果

Tab. 4 Calculation results of four models

组合 指标 KNN回归模型 RF回归模型 GBRT回归模型 Bagging回归模型
R2 MAE/
(μg·L-1)
RMSE/
(μg·L-1)
R2 MAE/
(μg·L-1)
RMSE/
(μg·L-1)
R2 MAE/
(μg·L-1)
RMSE/
(μg·L-1)
R2 MAE/
(μg·L-1)
RMSE/
(μg·L-1)
组合1 风速+气温+海平面气压+叶绿素a 0.624 0.836 0.821 0.596 0.836 0.829 0.562 0.829 0.839 0.585 0.832 0.839
组合2 气温+海平面气压+叶绿a+AOI 0.363 0.814 0.896 0.468 0.825 0.865 0.485 0.824 0.862 0.496 0.822 0.867
组合3 风速+气温+海平面气压+叶绿a+AOI 0.477 0.823 0.863 0.537 0.829 0.846 0.536 0.826 0.846 0.530 0.826 0.853
组合1(风速、气温、海平面气压、叶绿素a)指标数量少, 且4种模型演算结果的R2均大于0.500, 说明组合1的拟合效果在所有多指标组合中精度最好。相反, 虽然组合2(气温、海平面气压、叶绿素a、AOI)指标数量与组合1相同, 但组合2的4种模型结果的R2均小于0.500, 表明风速是赤潮预警的重要环境指标。风速大小影响水体扰动强弱, 风浪扰动是影响浮游植物生长的重要环境因子之一。李冬梅等(2010)通过研究分析水体扰动对多种赤潮藻生长的影响, 发现其他环境因子不变的情况下, 扰动是藻类生长的主要影响因子。一定强度的风浪扰动有利于藻华的消逝, 适宜强度的扰动则会促进藻类聚集和生长, 防止藻类沉降到水体底层, 且能够维持水环境中的营养盐浓度(芮政 等, 2019; 张海涵 等, 2022)。陈旭阳等(2018)通过布设在线监测浮标实时监测赤潮数据的变化, 同样发现了风速的减小有利于表层海水中藻类的迅速增殖, 风速增大则有利于赤潮消退。
所有组合中, 组合3(风速、气温、海平面气压、叶绿a、AOI)的指标数量最多, 除KNN回归模型外, 其他3种模型的R2均大于0.500, 但小于组合1模型演算结果的R2。这表明指标信息冗余并不一定有利于模型预警, 适当降低评价指标数量, 筛选最佳的输入指标进行预警, 不仅节省人力物力, 还能提高一定的预测精度。
4种模型中, 组合1(风速、气温、海平面气压、叶绿素a)在KNN回归中演算的精度最高, R2为0.624。这表明以风速、气温、海平面气压、叶绿素a组合作为输入端, 藻密度作为输出端时, KKN回归模型能够达到很好的预测精度。温度不仅是单个藻类增殖的影响因素, 还是浮游植物群落结构演替的重要环境影响因素(苏金洙 等, 2020)。海平面气压对藻类增殖的影响, 目前还未有明确的定论, 但一定的低压条件有利于赤潮藻类的维持(马毅 等, 2008; 赵雪 等, 2009)。叶绿素a浓度是海水中浮游生物密度的表征, 叶绿素a浓度高, 说明海水中浮游植物密度高(陈旭阳 等, 2018)。因此, 以气温、海平面气压、叶绿素a作为模型输入指标, 能在一定程度上表征藻类密度。

2.3 以叶绿素a浓度为输出因子的赤潮预警模型分析

本研究综合考虑模型的运行成本和特定海域历史数据的特点, 通过BP神经网络模型构建了以叶绿素a为输出因子的赤潮预警模型, 用于未布设叶绿素a浮标探头的赤潮频发海域。
模型演算结果如表5所示, 组合1(气温、日照、溶解氧)和组合2(气温、日照、AOI)的RMSE、MAE在6个组合的误差中较大, RMSE均在0.065μg·L-1以上, MAE均在0.045μg·L-1以下, 且R2较小, 因此排除这2个组合。组合3(气温、日照、风速)、组合4(气温、日照、降水、溶解氧)、组合5(气温、日照、风速、AOI)和组合6(气温、日照、风速、溶解氧)的RMSE在6个组合中较小, 均低于0.065μg·L-1, 且MAE差别不大。这6个组合的指标中均包含有气温和日照指标。日照强弱会对藻类的光合作用速率产生影响, 这是因为藻类经叶绿素吸收光能, 把二氧化碳和水合成有机物, 同时释放出氧气(赵聪蛟 等, 2020)。因此, 日照能够间接反映叶绿素a的浓度情况。
表5 叶绿素a作为输出端的部分模型演算结果

Tab. 5 Partial model calculation results with Chl a as output in BP model

输入组合 输入因子 RMSE/(μg·L-1) MAE/(μg·L-1) R2
组合1 气温+日照+溶解氧 0.066 0.033 0.499
组合2 气温+日照+AOI 0.073 0.041 0.258
组合3 气温+日照+风速 0.048 0.033 0.333
组合4 气温+日照+降水+溶解氧 0.053 0.031 0.602
组合5 气温+日照+风速+AOI 0.062 0.033 0.651
组合6 气温+日照+风速+溶解氧 0.046 0.027 0.290
组合5(气温、日照、风速、AOI)的可决系数R2在所有组合中达到最高值(0.651), 且该组合的RMSE=0.062μg·L-1, MAE=0.033μg·L-1, 拟合度较好。本研究的模型演算结果说明, 在没有布设叶绿素a浮标探头的海域, 通过构建BP神经网络赤潮模型, 以气温、日照、风速等气象数据及AOI作为模型输入端, 能够达到较高的叶绿素a浓度预测准确度。

3 主要结论

本研究分析了平潭海域2009—2019年期间发生赤潮的水文气象环境因素, 优化了输入赤潮预警模型的指标组合。模型演算结果表明, 以藻类密度为模型输出指标, 以风速、气温、海平面气压、叶绿素a组合作为模型输入指标时, 4种预警模型中以KNN回归模型的演算精度较高。此外, 本研究构建了以叶绿素a浓度为输出指标, 以气温、日照、风速、AOI组合为输入指标的BP神经网络赤潮模型, 应用于没有叶绿素a浓度监测的海域, 演算结果表明该模型有较好的预测精度。在未来的研究中, 可以对模型不断增加新数据训练并检验, 有望用于平潭海域的赤潮预警和防控工作, 并为其他海域的赤潮预警提供参考。
[1]
陈宝红, 谢尔艺, 高亚辉, 等, 2015. 米氏凯伦藻对海洋生物致毒作用的研究进展[J]. 福建水产, 37(3): 241-249.

CHEN BAOHONG, XIE ERYI, GAO YAHUI, et al, 2015. Toxic effects of red tide caused by Karenia mikimotoi on marine organisms[J]. Journal of Fujian Fisheries, 37(3): 241-249. (in Chinese with English abstract)

[2]
陈旭阳, 刘保良, 2018. 海洋在线监测浮标在赤潮监测中的应用研究[J]. 热带海洋学报, 37(5): 20-24.

CHEN XUYANG, LIU BAOLIANG, 2018. Application of Real-time monitoring buoy in monitoring red tide[J]. Journal of Tropical Oceanography, 37(5): 20-24. (in Chinese with English abstract)

[3]
赫芬·I·里斯. 2020. 机器学习实战: 使用R、tidyverse和mlr[M]. 但波, 高山, 韩建立, 译. 北京: 清华大学出版社: 1-536.

RHYS H I. 2020. Machine learning: with R, the tidyverse, and mlr[M]. DAN BO, GAO SHAN, HAN JIANLI, trans. Beijing: Tsinghua University Publishing House: 1-536. (in Chinese)

[4]
蓝虹, 卢君峰, 曹宇峰, 等, 2014. 浅析平潭岛主要海洋灾害及防治对策[J]. 海洋开发与管理, 31(2): 55-58. (in Chinese)

[5]
李冬梅, 高永利, 田甜, 等, 2010. 水体扰动对多种赤潮藻生长的影响[J]. 热带海洋学报, 29(6): 65-70.

LI DONGMEI, GAO YONGLI, et al, 2010. Effects of turbulence on phytoplankton: species differences[J]. Journal of Tropical Oceanography, 29(6): 65-70. (in Chinese with English abstract)

[6]
林森杰, 姬南京, 罗昊, 2019. 海洋有害藻华研究进展[J]. 海洋与湖沼, 50(3): 495-510.

LIN SENJIE, JI NANJING, LUO HAO, 2019. Recent progress in marine harmful algal bloom research[J]. Oceanologia et Limnologia Sinica, 50(3): 495-510. (in Chinese with English abstract)

[7]
洛昊, 马明辉, 梁斌, 等, 2013. 中国近海赤潮基本特征与减灾对策[J]. 海洋通报, 32(5): 595-600.

LUO HAO, MA MINGHUI, LIANG BIN, et al, 2013. Basic characteristics and mitigation countermeasures of red tides in China seas[J]. Marine Science Bulletin, 32(5): 595-600. (in Chinese with English abstract)

[8]
马毅, 吴瑞贞, 李华建, 等, 2008. 有利于赤潮消亡的水文气象条件[J]. 海洋预报, 25(3): 1-6.

MA YI, WU RUIZHEN, LI HUAJIAN, et al, 2008. The hydrological-meteorological conditions conducive to the attenuation of red tide[J]. Marine Forecasts, 25(3): 1-6. (in Chinese with English abstract)

[9]
芮政, 杨桂军, 刘玉, 等, 2019. 扰动方式对水华微囊藻(Microcystis flos-aquae)群体大小的影响[J]. 湖泊科学, 31(2): 355-364.

RUI ZHENG, YANG GUIJUN, LIU YU, et al, 2019. Effects of disturbance modes on the size of Microcystis flos-aquae colonies[J]. Journal of Lake Sciences, 31(2): 355-364. (in Chinese with English abstract)

DOI

[10]
苏金洙, 高佳, 苏玉萍, 等, 2020. 福建平潭海域米氏凯伦藻(Karenia mikimotoi)增殖影响因子研究[J]. 福建师范大学学报(自然科学版), 36(4): 43-49, 56.

SU JINZHU, GAO JIA, SU YUPING, et al, 2020. Study on the factors affecting the proliferation of Karenia mikimotoi in Pingtan coastal area of Fujian province[J]. Journal of Fujian Normal University (Natural Science Edition), 36(4): 43-49, 56. (in Chinese with English abstract)

[11]
苏新红, 金丰军, 杨奇志, 等, 2017. 基于BP神经网络模型的福建海域赤潮预报方法研究[J]. 水产学报, 41(11): 1744-1755. (in Chinese)

[12]
小沃尔特·J·韦伯, 1980. 水质控制物理化学方法[M]. 上海市政工程设计院, 译. 北京: 中国建筑工业出版社: 510-511.

WEBER W J, 1980. Physicochemical processes for water quality control[M]. Shanghai Municipal Engineering Design Institute, trans. Beijing: China Architecture & Building Press: 510-511. (in Chinese)

[13]
许昆灿, 暨卫东, 周秋麟, 等, 2004. 表观增氧量在近岸海域赤潮快速评价与预警中的应用[J]. 台湾海峡, 23(4): 417-422.

XU KUNCAN, JI WEIDONG, ZHOU QIULIN, et al, 2004. Apparent oxygen increase (AOI) and its application in rapid assessment and prewarning of red tide in coastal waters[J]. Journal of Oceanography in Taiwan Strait, 23(4): 417-422. (in Chinese with English abstract)

[14]
许阳春, 张明峰, 苏玉萍, 等, 2020. 基于BP人工神经网络平潭海域赤潮叶绿素a浓度模型演算研究[J]. 海洋科学, 44(3): 34-41.

XU YANGCHUN, ZHANG MINGFENG, SU YUPING, et al, 2020. Calculation of the Chlorophyll-a concentration of red tide in the Pingtan Coastal Zone by a BP artificial neural network model[J]. Marine Sciences, 44(3): 34-41. (in Chinese with English abstract)

[15]
俞志明, 陈楠生, 2019. 国内外赤潮的发展趋势与研究热点[J]. 海洋与湖沼, 50(3): 474-486.

YU ZHIMING, CHENG NANSHENG, 2019. Emerging trends in red tide and major research progresses[J]. Oceanologia et Limnologia Sinica, 50(3): 474-486. (in Chinese with English abstract)

[16]
张海涵, 王娜, 宗容容, 等, 2022. 水动力条件对藻类生理生态学影响的研究进展[J]. 环境科学研究, 35(1): 181-190.

ZHANG HAIHAN, WANG NA, ZONG RONGRONG, et al, 2022. Research progress on influence of hydrodynamic conditions on algal physiology and ecology[J]. Research of Environmental Sciences, 35(1): 181-190. (in Chinese with English abstract)

[17]
赵聪蛟, 刘希真, 付声景, 等, 2020. 基于水质浮标在线监测的米氏凯伦藻赤潮过程及环境因子变化特征分析[J]. 热带海洋学报, 39(2): 88-97.

ZHAO CONGJIAO, LIU XIZHEN, FU SHENGJING, et al, 2020. Variation characteristics of the evolution of Karenia mikimotoi bloom and environmental factors based on online monitoring buoy data[J]. Journal of Tropical Oceanography, 39(2): 88-97. (in Chinese with English abstract)

[18]
赵雪, 杨凡, 郭娜, 等, 2009. 2007年2月汕头赤潮事件水文气象及海水理化因子影响分析[J]. 海洋预报, 26(1): 43-51. (in Chinese)

[19]
ANDERSON D M, 2009. Approaches to monitoring, control and management of harmful algal blooms (HABs)[J]. Ocean & Coastal Management, 52(7): 342-347.

[20]
AZANZA R V, FUKUYO Y, YAP L G, et al, 2005. Prorocentrum minimum bloom and its possible link to a massive fish kill in Bolinao, Pangasinan, Northern Philippines[J]. Harmful Algae, 4(3): 519-524.

DOI

[21]
BREIMAN L, 2001. Random forests[J]. Machine Learning, 45(1): 5-32.

DOI

[22]
DENG LEI, YANG WENYI, LIU HUI, 2019. PredPRBA: Prediction of protein-RNA binding affinity using gradient boosted regression trees[J]. Frontiers in Genetics, 10: 637.

DOI

[23]
ELITH J, LEATHWICK J R, HASTIE T, 2008. A working guide to boosted regression trees[J]. Journal of Animal Ecology, 77(4): 802-813.

DOI

[24]
JIMÉNEZ-CARVELO A M, GONZÁLEZ-CASADO A, BAGUR- GONZÁLEZ M G, et al, 2019. Alternative data mining/ machine learning methods for the analytical evaluation of food quality and authenticity - A review[J]. Food Research International, 122: 25-39.

DOI

[25]
KARKI S, SULTAN M, ELKADIRI R, et al, 2018. Mapping and forecasting onsets of harmful algal blooms using MODIS data over coastal waters surrounding Charlotte County, Florida[J]. Remote Sensing, 10(10): 1656.

DOI

[26]
LIN H T, LIANG T J, CHEN S M, 2013. Estimation of battery state of health using probabilistic neural network[J]. IEEE Transactions on Industrial Informatics, 9(2): 679-685.

DOI

[27]
LIU RUONAN, YANG BOYUAN, ZIO E, et al, 2018. Artificial intelligence for fault diagnosis of rotating machinery: A review[J]. Mechanical Systems and Signal Processing, 108: 33-47.

DOI

[28]
LYU JUNCHENG, ZHANG JIE, 2019. BP neural network prediction model for suicide attempt among Chinese rural residents[J]. Journal of Affective Disorders, 246: 465-473.

DOI

[29]
NABIPOUR M, NAYYERI P, JABANI H, et al, 2020. Deep learning for stock market prediction[J]. Entropy, 22(8): 840.

DOI

[30]
PRASAD A M, IVERSON L R, LIAW A, 2006. Newer classification and regression tree techniques: Bagging and random forests for ecological prediction[J]. Ecosystems, 9(2): 181-199.

DOI

[31]
QIN MENGJIAO, LI ZHIHANG, DU ZHENHONG, 2017. Red tide time series forecasting by combining ARIMA and deep belief network[J]. Knowledge-Based Systems, 125: 39-52.

DOI

[32]
RECKNAGEL F, 1997. ANNA-Artificial Neural Network model for predicting species abundance and succession of blue-green algae[J]. Hydrobiologia, 349(1): 47-57.

DOI

[33]
SAN DIEGO-MCGLONE M L, AZANZA R V, VILLANOY C L, et al, 2008. Eutrophic waters, algal bloom and fish kill in fish farming areas in Bolinao, Pangasinan, Philippines[J]. Marine Pollution Bulletin, 57(6-12): 295-301.

DOI

[34]
TIAN WENCHONG, LIAO ZHENLIANG, ZHANG JIN, 2017. An optimization of artificial neural network model for predicting chlorophyll dynamics[J]. Ecological Modelling, 364: 42-52.

DOI

[35]
WU DANNI, CHEN JUNHUI, HE XIUPING, et al, 2019. Distribution, partitioning, and seasonal variation of lipophilic marine algal toxins in aquatic environments of a typical semi-closed mariculture bay[J]. Environmental Pollution, 255: 113299.

DOI

[36]
ZHOU BINGYIN, LU MING, WANG YONGGANG, 2016. Counting people using gradient boosted trees[C]// 2016 IEEE Information Technology, Networking, Electronic and Automation Control Conference. Chongqing, China: IEEE: 391-395.

[37]
ZOHDI E, ABBASPOUR M, 2019. Harmful algal blooms (red tide): a review of causes, impacts and approaches to monitoring and prediction[J]. International Journal of Environmental Science and Technology, 16(3): 1789-1806.

DOI

Outlines

/