海洋水文学

基于深度学习的SAR图像海洋涡旋自动检测模型

  • 刘太龙 , 1 ,
  • 谢涛 , 1, 2, 3, 4 ,
  • 李建 1, 3, 4 ,
  • 王超 1, 5 ,
  • 张雪红 1, 3, 4
展开
  • 1.南京信息工程大学遥感与测绘工程学院, 江苏 南京 210044
  • 2.青岛海洋科技中心区域海洋动力学与数值模拟功能实验室, 青岛 山东 266200
  • 3.自然资源部遥感导航一体化应用工程技术创新中心, 江苏 南京 210044
  • 4.江苏省协同精密导航定位与智能应用工程研究中心, 江苏 南京 210044
  • 5.南京信息工程大学电子与信息工程学院, 江苏 南京 210044
谢涛(1973—), 男, 教授, 博士, 主要从事卫星气象学、卫星海洋学以及极地遥感等方面的研究。email:

刘太龙(1998—), 男, 硕士研究生, 主要从事中尺度涡方面的研究。email:

Copy editor: 殷波

收稿日期: 2024-12-29

  修回日期: 2025-02-18

  网络出版日期: 2025-02-26

基金资助

国家重点研发计划项目(2022YFC3104900)

国家重点研发计划项目(2022YFC3104905)

国家自然科学基金项目(42176180)

Deep learning-based automatic detection model for ocean eddies in SAR images

  • LIU Tailong , 1 ,
  • XIE Tao , 1, 2, 3, 4 ,
  • LI Jian 1, 3, 4 ,
  • WANG Chao 1, 5 ,
  • ZHANG Xuehong 1, 3, 4
Expand
  • 1. School of Remote Sensing & Geomatics Engineering, Nanjing University of Information Science & Technology, Nanjing 210044, China
  • 2. Laboratory for Regional Oceanography and Numerical Modeling, Qingdao Marine Science and Technology Center, Qingdao 266200, China
  • 3. Innovation Center for Integrated Remote Sensing and Navigation Applications Engineering Technology, Ministry of Natural Resources, Nanjing 210044, China
  • 4. Jiangsu Collaborative Innovation Center for Precision Navigation and Intelligent Application Engineering, Nanjing 210044, China
  • 5. School of Electronic and Information Engineering, Nanjing University of Information Science and Technology, Nanjing 210044, China
XIE Tao. email:

Received date: 2024-12-29

  Revised date: 2025-02-18

  Online published: 2025-02-26

Supported by

National Key Research and Development Program of China(2022YFC3104900)

National Key Research and Development Program of China(2022YFC3104905)

National Natural Science Foundation of China(42176180)

摘要

传统基于合成孔径雷达(synthetic aperture radar, SAR)数据的涡旋检测方法需手动设定阈值和特征参数, 操作复杂且难以自动化, 现有深度学习模型在检测过程中也存在较高的漏检和误检情况, 难以满足涡旋检测对精度和效率的要求。为解决这些问题, 文章提出一种基于YOLOv8 (you only look once version 8)的改进模型, 即涡旋检测网络(eddy detection network, EddyDetNet), 以克服上述局限性, 提升检测的准确性和效率。该模型在骨干网络(Backbone)和颈部网络(Neck)中引入自适应特征融合模块(adaptive feature compression module, AFCM)和多尺度特征空间金字塔模块(multi-scale feature spatial pyramid module, MFSP)并优化Neck结构和在头部网络(Head)部分新增小目标检测头, 提升了不同尺度涡旋的检测精度。实验结果表明, EddyDetNet在精确率(precision, p)、召回率(recall, r)和平均精确率均值(mean average precision, mAP)指标上较YOLOv8分别提升了2.4%、3.2%和5.5%, 参数量和运算量减少了38.1%和15.8%。与YOLOv8相比, EddyDetNet在降低计算复杂度和参数量的同时, 保持了较高检测精度, 适用于多目标和复杂背景下的涡旋检测任务。

本文引用格式

刘太龙 , 谢涛 , 李建 , 王超 , 张雪红 . 基于深度学习的SAR图像海洋涡旋自动检测模型[J]. 热带海洋学报, 2025 , 44(5) : 65 -76 . DOI: 10.11978/2024242

Abstract

Traditional eddy detection methods based on SAR data require manual threshold setting and feature parameter tuning, making processes complex and difficult to automate. Existing deep learning models also suffer from high rates of false negatives and false positives, failing to meet the accuracy and efficiency requirements of eddy detection. To address these issues, this paper proposes an improved model based on YOLOv8 (you only look once version 8), named EddyDetNet, to overcome the above limitations and enhance both detection accuracy and efficiency. This model introduces an adaptive feature compression module (AFCM) and a multi-scale feature spatial pyramid module (MFSP) in Backbone and Neck, optimizes the Neck structure, and adds a small target detection head in the Head part, thereby improving the detection accuracy of vortices of different scales. Experimental results show that EddyDetNet outperforms YOLOv8 by 2.4%, 3.2%, and 5.5% in precision (p), recall (r), and mean Average Precision (mAP), respectively, while reducing parameter size and computational complexity by 38.1% and 15.8%. Compared to YOLOv8, EddyDetNet reduces computational complexity and parameter size while maintaining high detection accuracy, making it suitable for eddy detection tasks in multi-target and complex background scenarios.

海洋涡旋是一种重要的海洋现象, 通常指直径从数公里到数百公里、寿命从几天到几十天的旋转水团(Chelton et al, 2007)。涡旋可分为气旋涡(cyclonic eddy, CE)和反气旋涡(anticyclonic eddy, AE), 在北半球分别以逆时针和顺时针方向旋转(Dong et al, 2014), 对海洋中的热量、盐分和营养物质的传输起着关键作用(沈飙 等, 2020)。
在海洋涡旋的研究中, 传统的涡旋检测主要依赖于海表面高度(sea surface height, SSH)(高山 等, 2007; 赵文涛 等, 2016)、海表面温度(sea surface temperature, SST)(郑晓莉 等, 2020)以及海洋水色(甘滢晖, 2022)等数据。然而, 这些数据的空间分辨率较低, 难以准确检测亚中尺度涡旋, 且海表面温度和水色的变化容易受到其他因素干扰, 导致误判(Alpers et al, 2013)。合成孔径雷达(synthetic aperture radar, SAR)具备全天候、全天时的高分辨率观测能力, 在亚中尺度涡旋监测方面展现出显著优势。SAR图像中的海洋涡旋通常表现为由海表面粗糙度变化形成的螺旋状条纹(董昌明, 2015)。尽管传统方法能够通过示踪物或流场反演等技术检测涡旋(陈戈 等, 2021), 但这些方法依赖于手动设置阈值和参数, 操作复杂且难以自动化处理。
随着深度学习技术的发展, 自动化检测成为可能, 特别是能够通过神经网络自动学习涡旋特征, 减少人工干预。深度学习方法不仅提高了检测的精度, 还能够处理日益增加的SAR数据, 提升检测效率。目前, 国内外部分专家在采用深度学习技术进行涡旋检测领域已经取得了一些进展。例如, Huang等(2017)提出了一种结合主成分分析和空间金字塔池化的深度学习模型DeepEddy, 用于检测SAR图像中的涡旋。Xia等(2022)设计了基于YOLOv3 (you only look once version 3)的上下文与边缘关联网络(context and edge association network, CEA-Net)模型, 以增强对上下文和边缘特征的关联能力。Khachatrian等(2023)利用YOLOv5模型有效检测了边缘冰区的涡旋。Xu等(2023)则基于堆叠注意力网络(stacked attention network, SANet), 实现了涡旋的语义分割。Zhang等(2023)提出了以掩码区域卷积神经网络(mask region-based convolutional neural network, Mask R-CNN)为框架的EddyDet模型, 在处理小规模SAR数据集时表现优异。吴进群等(2023)构建了基于YOLOX (you only look once X)的高性能目标检测的海洋涡旋检测模型YOLOX-EDDY, 实现了对高分三号卫星SAR图像涡旋检测。Zi等(2024)以YOLOv5为基础, 引入注意力机制构建了EOLO模型, 显著提升了在SAR图像中涡旋检测的效果。
然而, 现有深度学习模型在处理多尺度涡旋和复杂背景下仍存在较高的漏检和误检问题, 难以满足涡旋检测对精度和效率的严格要求。为此, 本文提出了一种改进的深度学习模型——涡旋检测网络(eddy detection network, EddyDetNet)。该模型以YOLOv8为框架, 旨在通过优化特征提取和多尺度信息融合能力, 提升对不同尺度涡旋的检测性能。具体来说, EddyDetNet引入了自适应特征融合模块和多尺度特征空间金字塔模块, 并在颈部网络(Neck)部分优化了结构设计, 在头部网络(Head)部分增加了专门用于小目标检测的检测头。这些改进不仅有效提升了模型对小尺度涡旋的检测性能, 同时也显著降低了计算的复杂度和参数量, 实现了检测精度与运算效率的平衡。通过实验验证, EddyDetNet展现出优异的检测效果, 为SAR图像中的海洋涡旋检测提供了新方法和有效工具。

1 数据介绍

本文使用哨兵1号(Sentinel-1) SAR卫星的干涉宽幅(interferometric wide-swath, IW)模式下的地距多视产品(ground range detected, GRD) VV极化数据。VV极化模式中, 发射和接收均为垂直极化的电磁波, 与其他极化模式相比, 在海洋表面具有更高的信噪比, 因此更清晰地捕捉海面上的涡旋特征和细节(Alpers et al, 1981; Rizaev et al, 2022), 更适用于海洋涡旋检测。研究区域选择为东中国海(East China Sea, ECS)及其邻近海域。
数据处理采用SNAP软件, 完成轨道校正、热噪声去除、辐射定标、多视处理、相干斑滤波、地形校正和图像裁剪等步骤。随后对处理后的数据进行了亮度增强、对比度增强、错切变换、图像翻转和旋转等数据扩增操作, 最终生成2467幅图像, 每幅图像至少包含一个涡旋。扩增后的数据集按7∶2∶1的比例划分为训练集、验证集和测试集, 分别包含1728幅、493幅和246幅图像。

2 研究方法

2.1 模型概述

YOLO是由Redmon等(2016)提出的一阶段目标检测算法, 以其速度快、精度高的特点在目标检测领域取得了广泛关注。YOLO的核心优势在于将检测任务转化为回归问题, 将目标分类和边界框回归整合在一次前向传递中完成, 从而显著提升了推理速度(图1)。与传统的两阶段检测算法, 例如基于区域的卷积神经网络(faster region-based convolutional neural network, Faster R-CNN)相比, YOLO无需生成候选框, 因而具备更高的实时性和计算效率。此外, YOLO系列算法通过持续迭代, 逐步提高了对小目标检测的敏感度, 同时通过轻量化设计实现了精度与速度的更优平衡。
图1 YOLOv8模型结构图

Conv代表卷积层, Concat代表拼接层, Upsample代表上采样层, Detect代表检测头, C2f代表特征融合模块, SPPF代表快速空间金字塔池化层

Fig. 1 YOLOv8 model architecture diagram. Conv represents convolutional layer, Concat represents concatenation layer, Upsample represents upsampling layer, Detect represents detection head, C2f represents Cross Stage Partial Network with 2 convolutions, and SPPF represents Spatial Pyramid Pooling Fast layer

为了在训练精度和速度之间取得平衡, 本文选择了YOLOv8 (Jocher et al, 2023)作为基础框架, 构建了EddyDetNet模型, 该模型在速度以及性能之间取得了良好的平衡。模型的结构主要由3部分组成: 骨干网络(Backbone)、Neck和Head。Backbone负责从图像中提取多尺度特征, 逐层卷积生成特征图, 捕捉目标的层次信息。Neck则通过上采样和拼接操作, 将不同层次的特征图融合, 使模型既能保留小目标的高分辨率特征, 又能利用深层次的语义信息检测大目标, 从而提升检测效果。Head负责最终的检测任务, 在多层特征图(如P2、P3、P4、P5)上分别处理不同尺寸的目标, 其中P2层专注于极小目标, P3层适合小目标, P4和P5层则用于中等和大目标检测。模型结构如图2所示。
图2 EddyDetNet模型结构图

Conv代表卷积层, AFCM代表自适应特征融合模块, MFSP代表多尺度特征空间金字塔模块, Concat代表拼接层, Upsample代表上采样层, Detect代表检测头

Fig. 2 EddyDetNet model architecture diagram. Conv represents convolutional layer, AFCM represents adaptive feature compression module, MFSP represents multi-scale feature spatial pyramid module, Concat represents concatenation layer, Upsample represents upsampling layer, and Detect represents detection head

2.2 自适应特征融合模块

为了提升多尺度目标检测的特征表达能力和计算效率, 本文提出了一种自适应特征压缩模块。该模块在多尺度特征融合的基础上, 引入了部分卷积(partial convolution, PConv)(Chen et al, 2023)策略和混合局部通道注意力(mixed local channel attention, MLCA)(Wan et al, 2023), 从而在保证精度的前提下显著降低计算复杂度。PConv通过仅在部分输入通道上执行卷积运算, 减少了冗余计算, 并保留剩余通道信息, 以确保特征在后续层中的充分传递。MLCA 则通过双路径设计进一步提升特征表达能力: 一个路径关注全局特征, 另一个路径专注局部空间特征。每个路径均采用一维卷积进行处理, 完成后通过反池化操作将特征恢复到原始分辨率。最终, 将这两个路径的信息融合, 实现了全局与局部特征的混合注意力效果。自适应特征融合模块(adaptive feature compression module, AFCM)的整体结构如图3所示。
图3 自适应特征融合模块(AFCM)结构图

Conv代表卷积层, Split代表分割层, PMBlock代表使用PConv和MLCA构建的新模块, Concat代表拼接层

Fig. 3 Structure diagram of AFCM. Conv represents convolutional layer, Split represents split layer, PMBlock represents new module constructed using PConv and MLCA, and Concat represents concatenation layer

输入特征图首先经过一个卷积操作, 以初步提取低层次特征; 初步提取的特征图通过Split操作被拆分为多个子特征图, 分别传递给后续分支, 这种拆分方式可以减少单个通道的计算量, 并实现特征分离, 以便在不同子路径中进行处理; 拆分后的子特征图进入多个PMBlock, 该模块结合了PConv和MLCA机制, 每个PMBlock在保留全局和局部特征的基础上, 进一步压缩不必要的计算, 提高特征表达的效率, 通过堆叠PMBlock模型能够在多层次上充分提取和融合特征信息(图4); PMBlock处理后的特征图通过拼接(concat)操作进行融合, 此操作将各个子路径的特征重组, 以形成一个包含丰富信息的联合特征图; 融合后的特征图再经过卷积操作, 生成最终输出特征图, 该步骤整合特征信息并调整输出维度, 使其适应后续检测任务。
图4 PMBlock结构图

Conv代表卷积层, PConv代表部分卷积, MLCA代表混合局部通道注意力, 圆圈代表逐元素相加

Fig. 4 PMBlock structure diagram. Conv represents convolutional layer, PConv represents partial convolution, MLCA represents mixed local channel attention, and the circle represents element-wise addition

2.3 多尺度特征空间金字塔模块

为了提升多尺度目标检测的特征表达能力和计算效率, 本文提出了一种多尺度特征空间金字塔模块。该模块结合了空间金字塔池化(spatial pyramid pooling, SPP)和高效多尺度注意力机制(efficient multi-scale attention, EMA)(Ouyang et al, 2023), 能够增强模型对全局与局部信息的捕捉, 尤其在复杂场景下的多尺度目标和细节丰富的特征处理中表现优异。多尺度特征空间金字塔模块(multi-scale feature spatial pyramid module, MFSP)模块的结构如图5所示。
图5 多尺度特征空间金字塔模块(MFSP)结构图

Conv代表卷积层, MaxPool2d代表二维最大池化层, EMA代表高效多尺度注意力机制, Concat代表拼接层

Fig. 5 MFSP structure diagram. Conv represents convolutional layer, MaxPool2d represents two-dimensional maximum pooling layer, EMA represents Efficient Multi-scale Attention mechanism, Concat represents concatenation layer

MFSP首先对输入特征图进行多尺度特征提取, 经过一系列最大池化(maxPool2d)操作生成不同尺度的特征图。这些特征图代表了多层次的上下文信息, 为后续特征融合提供了丰富的多尺度基础。在多尺度特征提取后, 模块引入了EMA注意力机制, 以增强特征表示的自适应性。EMA通过自适应地分配通道权重聚焦于关键特征信息, 具体设计上包括两个1×1卷积分支和一个3×3卷积分支。1×1卷积分支通过水平和垂直方向的一维全局平均池化提取特征图的全局上下文信息, 而3×3卷积分支则捕捉细节丰富的多尺度特征。最终, 各分支的输出结合生成自适应通道权重, 以强化关键特征的表达。经过注意力增强的特征图与多尺度池化生成的特征图在通道维度上拼接, 形成多尺度联合特征图。此融合过程有效结合了全局与局部特征信息, 为后续任务提供了更加全面的特征表达。最后, 融合后的特征图通过卷积操作生成最终输出, 用来进一步整合特征信息并调整输出维度, 使其适应下游任务的需求。

2.4 基于多尺度特征的结构优化方案

本研究提出了一种基于多尺度特征的结构优化方案, 旨在提升目标检测模型在多尺度目标检测中的表现。该方案引入了一个新的P2层检测头, 专门用于检测小目标。原始检测结构通常包含3个检测头, 分别接收来自不同层次的特征图(P3、P4、P5)以检测小、中、大目标, 但在处理极小目标时效果有限。新增的P2检测头接收第二次卷积生成的特征图, 其较小的感受野使其更适合捕捉小目标的细节信息。通过引入P2层, 特征金字塔结构从3层扩展为4层(P2、P3、P4、P5), 显著增强了小目标检测效果, 使多尺度检测能力更加全面。
此外, Neck部分的连接方式也进行了优化, 以改善不同层次特征图间的信息传递。原始结构中, 特征图通常通过concat操作直接连接到后续的C2f层进行处理, C2f层在Neck部分的作用是进一步提取和融合特征, 以增强对目标特征的表达能力。为了引入P2层检测头, 本研究在Neck部分增加了新的连接路径, 使P2层能够与其他特征层充分融合, 确保该层具有足够的特征信息, 以提升小目标检测的精度。为防止模型过拟合, 并在融合后实现更平衡的特征表达, 本优化方案调整了部分concat操作, 使其连接到其他concat层上, 从而增强了不同层次特征间的信息流动。通过这种设计, 高层特征信息能够更好地补充至低层特征中, 增强了低层特征的上下文信息获取能力, 使模型在不同尺度目标检测时表现更均衡。该优化方案有效提升了模型在复杂场景中的检测性能, 尤其在极小目标检测方面表现出色。

3 实验与结果分析

3.1 实验环境

本实验计算机采用 Ubuntu18.04.5 系统, 配置GPU为NVIDIA GeForce RTX 3090, CUDA版本为11.3, Python版本为3.8, 深度学习框架使用 Pytorch1.12.1。本研究所使用的模型在训练时, Batchsize 设置为16, epochs设置为200, 学习率为0.01, 权重衰减为0.0005, 训练图片大小为640×640。

3.2 评价指标

本实验选取精确率、召回率、平均精确率均值、十亿浮点运算数、参数量等5个指标来评价实验效果。
1) 精确率(precision, p)
精确率是衡量模型预测准确性的重要指标, 定义为模型预测为涡旋的样本中, 实际为涡旋的比例。计算公式如下:
$\text{ }p=\frac{\text{TP}}{\text{TP}+\text{FP}}$
式中: TP为真正例(true positive, TP), 表示模型预测图像中存在海洋涡旋, 且实际情况也确实存在; FP为假正例(false positive, FP), 表示模型判断图像中有海洋涡旋, 而事实上图像中却不存在涡旋。
2) 召回率(recall, r)
召回率反映了模型的漏检情况, 衡量的是模型在所有真实涡旋中, 能正确检测出的比例。计算公式如下:
$\text{ }r=\frac{\text{TP}}{\text{TP}+\text{FN}}$
式中: FN为假反例(false negative, FN), 指模型认为图像中不存在海洋涡旋, 但实际上图像中存在涡旋。
3) 平均精确率均值(mean average precision, mAP)
平均精确率均值是目标检测领域中最重要的综合评价指标, 通常用于衡量模型在多类别检测任务中的整体表现。mAP@0.5表示在预测边界框与真实边界框的重叠度(intersection over union, IoU)的阈值为50%时, 模型在所有类别上的平均精确率(average precision, AP)的均值。mAP的计算首先针对每个类别计算AP, 然后对所有类别的AP取平均值, 最终得到模型在整体检测任务中的表现。计算公式如下:
$\text{AP}=\underset{0}{\overset{1}{{\displaystyle \int }}}p\left(r\right)\text{d}r$
$\text{mAP}=\frac{{{\displaystyle \sum }}_{i=1}^{n}{\text{AP}}_{i}}{n}$
式中: p(r)为给定召回率r时的精确率, n为检测目标的类别总数, ${\text{AP}}_{i}$ 为第i类的平均精确率。
4) 十亿浮点运算数(giga floating point operations per second, GFLOPs)
GFLOPs是衡量模型计算复杂度的一个单位, 表示模型在处理单张输入图像时需要执行的浮点运算次数。
5) 参数量(parameters, Params)
参数量是指模型中可训练的参数的总数, 用来衡量模型的大小。

3.3 消融实验

为分析各个模块对模型性能的贡献, 本研究设计了消融实验, 逐步加入AFCM、MFSP和Neck+Head模块。实验结果如表1所示。
表1 消融实验

Tab. 1 Ablation experiment

改进方法 AFCM MFSP Neck+Head p/% r/% mAP@0.5/% 参数量/M GFLOPs
1 88.2 88.6 89.5 24.64 78.7
2 86.2 92.5 94.7 15.85 50.2
3 88.0 89.2 92.5 24.84 80.2
4 88.9 91.0 93.4 24.16 99.6
5 90.6 91.8 95.0 15.26 66.3

注: “√”表示实验结果加入了对应模块, 空白表示实验结果未加入对应模块

表1可知, 引入AFCM模块后, 尽管精确率略有下降(-2%), 但召回率和mAP@0.5显著提高, 分别提升了3.6%和5.2%。该模块有效减少了模型的参数量和计算量, 参数减少约35.7%, GFLOPs减少28.5, 证明其在减少计算开销的同时提升了检测性能。
加入MFSP模块后, 精确率小幅下降(-0.2%), 但召回率和mAP@0.5分别提高了0.6%和3%, 且仅增加了0.2M参数量和1.5GFLOPs。该模块增强了多尺度信息聚合能力, 提升了模型性能且计算开销增加较少。
随后, 通过对Neck进行优化并新增检测头, 进一步增强了模型在多尺度目标检测方面的性能, 此改进使精确率、召回率和mAP@0.5分别提升了0.7%、2.4%和3.9%, 同时参数量减少了0.48M, 降幅约为2%, 但GFLOPs增加了20.9, 涨幅约为26.6%。
优化Neck并新增检测头后, 精确率、召回率和mAP@0.5分别提升了0.7%、2.4%和3.9%, 参数量减少了0.48M, 降幅约为2%, 但GFLOPs增加了20.9, 增幅为26.6%。尽管运算量有所增加, 但模型在多尺度目标检测方面的表现得到了显著提升。
综合3项改进后, 模型在精确率(+2.4%)、召回率(+3.2%)和mAP@0.5 (+5.5%)均取得了显著提升, 同时参数量减少了9.38M, GFLOPs减少了12.4。总体来看, 尽管Neck和检测头的优化增加了计算开销, 但AFCM和MFSP的改进大幅减少了运算量, 使得改进后的模型在降低计算开销的同时, 显著提高了检测性能。

3.4 结果和分析

为了验证所提出模型的效果, 本文改进算法在相同数据集上进行了实验, 并与不同的检测算法进行对比, 包括单次多框检测器(single shot multibox detector, SSD)(Liu et al, 2016)、Faster R-CNN (Ren et al, 2017)、YOLO系列的YOLOv7 (Wang et al, 2023)、YOLOv8、YOLOv9 (Wang et al, 2024)。实验结果如表2所示。由表2可见, EddyDetNet在各项性能指标上均优于所有对比模型。
表2 算法性能对比

Tab. 2 Algorithm performance comparison

模型名称 AP/%(AE) AP/%(CE) p/% r/% mAP@0.5/%
SSD 47.01 81.24 58.48 56.90 64.12
Faster R-CNN 32.99 79.01 43.67 73.76 56.00
YOLOv7 42.60 66.30 51.90 61.10 54.50
YOLOv8 85.20 93.70 88.20 88.60 89.50
YOLOv9 39.70 78.80 52.30 76.00 59.20
EddyDetNet 94.20 95.80 90.60 91.80 95.00
在mAP@0.5指标上, EddyDetNet达到95.00%, 显著高于其他模型。这一结果表明, EddyDetNet在整体检测精度上具有显著优势, 能够更准确地定位和识别目标。
在AP(AE)和AP(CE)指标上, EddyDetNet分别达到94.20%和95.80%, 均高于其他模型的表现。这表明EddyDetNet在处理不同类别和复杂环境下的检测任务时, 表现出更强的适应性和鲁棒性。
在精确率(p)和召回率(r)指标上, EddyDetNet分别为90.60%和91.80%, 同样优于所有对比模型。高精确率意味着EddyDetNet在减少误检方面表现出色, 而高召回率则表明其在减少漏检方面同样具有优越性。
这两项指标的提升, 进一步验证了EddyDetNet在目标检测任务中的可靠性和稳定性。
图6对比展示了6种模型在4幅SAR图像上的涡旋检测结果。所选图像中存在诸多显著干扰因素, 如杂波、强烈的散斑效应以及容易混淆的海面现象。此外, 每幅图中不仅包含多个涡旋, 其形态和尺度也各不相同。
图6 不同模型涡旋在4幅SAR图像上的涡旋检测结果

a. SSD; b. Faster R-CNN; c. YOLOv7; d. YOLOv8; e. YOLOv9; f. EddyDetNet。图中蓝色方框处是被检测出来的涡旋, 数字表示模型检测的置信度。CE为气旋涡, AE为反气旋涡

Fig. 6 Eddy detection results of different models on four SAR images. (a) SSD; (b) Faster R-CNN; (c) YOLOv7; (d) YOLOv8; (e) YOLOv9; (f) EddyDetNet

通过不同网络的预测, 以及可视化结果的对比观察, 发现EddyDetNet的结果更加接近真实情况。SSD、YOLOv7、YOLOv8、YOLOv9均出现了严重的漏检现象, 全面捕捉涡旋的能力不如EddyDetNet。此外, 这些模型在存在漏检的同时, 也存在一定程度的假阳性情况。特别是YOLOv7模型在多涡图像的涡旋提取能力方面表现最差, 在图6第1列至第3列的多涡旋结构中, YOLOv7仅能识别出一个涡旋, 而在图6d第4列则未能检测到任何涡旋。
另一方面, Faster-R-CNN产生了大量假阳性结果, 误将杂波和散斑效应识别为涡旋, 并且在图6第4列中对涡旋范围的描述不准确, 无法有效反映涡旋的实际大小和形态。并且还出现了将气旋涡同时判别为气旋涡和反气旋涡的情况, 进一步影响了检测的准确性。
EddyDetNet在涡旋检测任务中展现出了显著的优势, 其在各项性能指标上的卓越表现不仅证明了其高精度和高召回率, 还体现了其在复杂环境下的强大适应能力。相比于传统的SSD、Faster R-CNN和YOLO系列模型, EddyDetNet能够有效避免漏检和假阳性问题, 精准识别并区分不同类型的涡旋, 准确描绘涡旋的形态和尺度。这些优越的检测能力使EddyDetNet在处理具有显著干扰因素的SAR图像时, 依然能够保持高度的稳定性和可靠性, 确保检测结果的真实性和可信度, 实验结果充分验证了本文提出的改进算法的有效性和优越性。
图7展示了目标海域的Sentinel-1数据中的涡旋分布情况, 可以发现, Sentinel-1数据较多地分布于大陆架或岛屿周围的海岸线附近, 而开阔海域的数据较少。这一分布特征与卫星高度计数据在近岸区域的局限性形成鲜明对比, 传统高度计的雷达回波因陆地反射干扰, 导致数据质量下降(Cazenave et al, 2022)。相比之下, SAR数据能够有效地弥补卫星高度计数据在近岸区域的缺陷, 为相关研究提供更为全面和准确的信息。
图7 目标海域涡旋分布

该地图基于自然资源部标准地图服务网站下载的审图号GS(2024)0650号的标准地图绘制, 底图无修改。图中黑白图片为本文数据集中含有涡旋的图像的空间分布

Fig. 7 Eddy distribution in the target sea area

4 讨论

本研究旨在解决传统SAR涡旋检测方法操作复杂且难以自动化的问题, 以及现有深度学习模型在精度和效率上的不足。为此, 本文提出了一种基于YOLOv8的改进模型——EddyDetNet。实验结果表明, 与基线模型YOLOv8相比, EddyDetNet在精确率、召回率和mAP@0.5等关键指标上均有所提升, 尤其在处理多尺度涡旋和复杂背景时, 展现了更优异的性能。同时, EddyDetNet还优于传统深度学习模型(如SSD、Faster R-CNN)以及YOLO系列的其他版本(如YOLOv7和YOLOv9)。
本研究将EddyDetNet与现有的CEA-Net和EOLO模型进行了对比。根据文献中的数据, EddyDetNet在mAP@0.5上的表现优于这两种模型, 达到了95.0%, 显著高于CEA-Net的85.47%和EOLO的91.5%, 在精确度和召回率方面也都得到了显著提升。这一结果表明, EddyDetNet在多尺度涡旋检测任务中展现出了更强的性能, 进一步证明了该模型在SAR图像涡旋检测中的有效性。
EddyDetNet模型通过引入AFCM模块和MFSP模块, 有效提升了多尺度涡旋的检测能力, 特别是在复杂背景和小目标的检测上表现突出。AFCM模块优化了特征提取过程, 降低了计算复杂度, 而MFSP模块增强了模型对多尺度特征的融合能力。此外, 模型在Neck部分的优化和小目标检测头的加入, 进一步提高了不同尺度涡旋的检测精度。这些创新使EddyDetNet在高精度的基础上, 能够有效提升检测效率, 并在多目标和复杂环境下保持稳定的性能。相比传统方法, EddyDetNet不仅提高了涡旋检测的准确性, 也减少了计算资源的需求, 具有较强的应用潜力。
尽管EddyDetNet在SAR图像中的涡旋检测任务中取得了显著的成果, 但仍存在一些局限性。当前的EddyDetNet主要集中在涡旋的识别和定位上, 并未深入探究涡旋本身的物理特性。例如, 关于涡旋强度、旋转方向及其与周围海域环境相互作用等方面的研究尚显不足。这一局限使得该模型暂时无法为涡旋的定量描述和动力学研究提供全面支持。
此外, 数据获取方面的挑战也是不容忽视的一点。当前Sentinel-1 SAR卫星干涉宽幅(IW)模式虽然提供了丰富的海岸线附近区域的数据资源, 但在开阔海域的数据覆盖度相对较低。这一现象导致了对于目标海域内涡旋空间分布的研究难以基于现有的SAR数据进行全面展开。
未来的工作将聚焦于EddyDetNet模型的进一步优化与扩展, 旨在不仅提升涡旋检测的准确性, 还将增强对涡旋物理属性的深入探索。研究方向将包括但不限于结合涡旋的空间特征和时间序列数据, 以实现对其动态行为的更精准量化分析。例如, 通过引入新的模块和算法, 实现涡旋的精确量化分析, 如涡旋的规模、强度演变、运动轨迹等。
在数据源方面, 除了继续利用现有的SAR卫星数据外, 还需积极探索更多样化的数据来源, 如高分辨率光学遥感图像、浮标观测网络及Argo全球海洋观测系统等。这不仅能补充开阔海域的数据不足, 还将有助于构建一个更为全面和均衡的数据集, 为涡旋的全方位研究提供坚实基础。

5 结论

本文提出的EddyDetNet模型通过引入AFCM和MFSP, 显著提升了SAR图像中多尺度海洋涡旋检测的精度和效率。AFCM模块优化了特征提取过程, 减少了计算复杂度, 并增强了特征表达能力; MFSP模块结合空间金字塔池化和多尺度注意力机制, 进一步增强了对全局与局部信息的捕捉能力。通过新增P2检测头和优化Neck部分的结构, EddyDetNet在小目标检测和多尺度特征融合方面表现优异。
消融实验结果表明, 模型各模块的引入显著提升了召回率和mAP@0.5, 尤其在保持或减少计算资源的同时, 进一步增强了检测精度。与传统检测算法及YOLO系列模型的对比实验进一步验证了EddyDetNet在精确率、召回率和鲁棒性上的优势, 特别是在复杂环境下的鲁棒性和适应性表现突出。
EddyDetNet在SAR图像海洋涡旋检测任务中展示了卓越的性能, 证明了其在实际应用中的潜力, 为海洋涡旋的检测与研究提供了有效的工具。
[1]
陈戈, 杨杰, 田丰林, 等, 2021. 海洋涡旋遥感: 进展与挑战[J]. 遥感学报, 25(1): 302-322.

CHEN GE, YANG JIE, TIAN FENGLIN, et al, 2021. Remote sensing of oceanic eddies: progresses and challenges[J]. National Remote Sensing Bulletin, 25(1): 302-322 (in Chinese with English abstract).

[2]
董昌明, 2015. 海洋涡旋探测与分析[M]. 北京: 科学出版社.

DONG CHANGMING, 2015. Oceanic eddy detection and analysis[M]. Beijing: Science Press (in Chinese).

[3]
甘滢晖, 2022. 基于遥感资料的中尺度涡与叶绿素分布的关系研究[D]. 大连: 大连海洋大学.

GAN YINGHUI, 2022. Study on the relationship between mesoscale Vortex and chlorophyll distribution based on remote sensing data[D]. Dalian: Dalian Ocean University (in Chinese with English abstract).

[4]
高山, 王凡, 李明悝, 等, 2007. 中尺度涡的高度计资料同化模拟[J]. 中国科学(D辑: 地球科学), 37(12): 1669-1678.

GAO SHAN, WANG FAN, LI MINGKUI, et al, 2007. Assimilation simulation of mesoscale Vortex with altimeter data[J]. Science in China (Series D: Earth Sciences), 37(12): 1669-1678 (in Chinese).

[5]
沈飙, 陈扬, 杨琛, 等, 2020. 海洋科学中尺度涡的计算机视觉检测和分析方法[J]. 数据与计算发展前沿, 2(6): 30-41.

SHEN BIAO, CHEN YANG, YANG CHEN, et al, 2020. Computer vision detection and analysis of mesoscale eddies in marine science[J]. Frontiers of Data & Computing, 2(6): 30-41 (in Chinese with English abstract).

[6]
吴进群, 陈戈, 马纯永, 等, 2023. 深度学习的SAR图像海洋涡旋自动检测及其特征提取[J]. 舰船科学技术, 45(6): 170-173.

WU JINQUN, CHEN GE, MA CHUNYONG, et al, 2023. Research on automatic detection of oceanic eddies in SAR image and extraction of its characteristic parameters based on depth learning[J]. Ship Science and Technology, 45(6): 170-173 (in Chinese with English abstract).

[7]
赵文涛, 俞建成, 张艾群, 等, 2016. 基于卫星测高数据的海洋中尺度涡流动态特征检测[J]. 海洋学研究, 34(3): 62-68.

DOI

ZHAO WENTAO, YU JIANCHENG, ZHANG AIQUN, et al, 2016. Dynamic feature detection of mesoscale eddies based on SLA data[J]. Journal of Marine Sciences, 34(3): 62-68 (in Chinese with English abstract).

[8]
郑晓莉, 董庆, 樊星, 2020. 北太平洋中尺度涡海表温度和叶绿素浓度特征分析[J]. 遥感学报, 24(1): 85-96.

ZHENG XIAOLI, DONG QING, FAN XING, 2020. Characteristics of sea surface temperature and Chlorophyll concentration inside mesoscale eddies in the North Pacific Ocean[J]. Journal of Remote Sensing, 24(1): 85-96 (in Chinese with English abstract).

[9]
ALPERS W, BRANDT P, LAZAR A, et al, 2013. A small-scale oceanic eddy off the coast of West Africa studied by multi-sensor satellite and surface drifter data[J]. Remote Sensing of Environment, 129: 132-143.

[10]
ALPERS W R, ROSS D B, RUFENACH C L, 1981. On the detectability of ocean surface waves by real and synthetic aperture radar[J]. Journal of Geophysical Research: Oceans, 86(C7): 6481-6498.

[11]
CAZENAVE A, GOUZENES Y, BIROL F, et al, 2022. Sea level along the world’s coastlines can be measured by a network of virtual altimetry stations[J]. Communications Earth & Environment, 3: 117.

[12]
CHELTON D B, SCHLAX M G, SAMELSON R M, et al, 2007. Global observations of large oceanic eddies[J]. Geophysical Research Letters, 34(15): L15606.

[13]
CHEN JIERUN, KAO S H, HE HAO, et al, 2023. Run, don’t walk: chasing higher FLOPS for faster neural networks[C]//2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Vancouver, BC: IEEE: 12021-12031.

[14]
DONG CHANGMING, MCWILLIAMS J C, LIU YU, et al, 2014. Global heat and salt transports by eddy movement[J]. Nature Communications, 5: 3294.

DOI PMID

[15]
HUANG DONGMEI, DU YANLING, HE QI, et al, 2017. DeepEddy: a simple deep architecture for mesoscale oceanic eddy detection in SAR images[C]//2017 IEEE 14th International Conference on Networking, Sensing and Control (ICNSC). Calabria: IEEE: 673-678.

[16]
JOCHER G, QIU J, CHAURASIA A, 2023. Ultralytics YOLO (Version 8.0.0)[Computer software]. https://github.com/ultralytics.

[17]
KHACHATRIAN E, SANDALYUK N, LOZOU P, 2023. Eddy detection in the marginal ice zone with sentinel-1 data using YOLOv5[J]. Remote Sensing, 15(9): 2244.

[18]
LIU WEI, ANGUELOV D, ERHAN D, et al, 2016. SSD: single shot MultiBox detector[C]// Computer Vision - ECCV 2016. Cham: Springer International Publishing: 21-37.

[19]
OUYANG DALIANG, HE SU, ZHANG GUOZHONG, et al, 2023. Efficient multi-scale attention module with cross-spatial learning[C]// ICASSP 2023-2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). Rhodes Island: IEEE: 1-5.

[20]
REDMON J, DIVVALA S, GIRSHICK R, et al, 2016. You only look once: unified, real-time object detection[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Las Vegas, NV: IEEE: 779-788.

[21]
REN SHAOQING, HE KAIMING, GIRSHICK R, et al, 2017. Faster R-CNN: towards real-time object detection with region proposal networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 39(6): 1137-1149.

DOI PMID

[22]
RIZAEV I G, KARAKUŞ O, HOGAN S J, et al, 2022. Modeling and SAR imaging of the sea surface: a review of the state-of-the-art with simulations[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 187: 120-140.

[23]
WAN DAHANG, LYU RONGSHENG, SHEN SIYUAN, et al, 2023. Mixed local channel attention for object detection[J]. Engineering Applications of Artificial Intelligence, 123: 106442.

[24]
WANG C Y, BOCHKOVSKIY A, LIAO H M, 2023. YOLOv7: trainable bag-of-freebies sets new state-of-the-art for real-time object detectors[C]//2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Vancouver, BC: IEEE: 7464-7475.

[25]
WANG C Y, YEH I H, MARK LIAO H Y, 2024. Yolov9: Learning what you want to learn using programmable gradient information[C]// European conference on computer vision. Cham: Springer Nature Switzerland: 1-21.

[26]
XIA LINGHUI, CHEN GE, CHEN XIAOYAN, et al, 2022. Submesoscale oceanic eddy detection in SAR images using context and edge association network[J]. Frontiers in Marine Science, 9: 1023624.

[27]
XU MING, LI HONGPING, YUN YUYING, et al, 2023. End-to-end pixel-wisely detection of oceanic eddy on SAR images with stacked attention network[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 16: 9711-9724.

[28]
ZHANG DI, GADE M, WANG WENSHENG, et al, 2023. EddyDet: a deep framework for oceanic eddy detection in synthetic aperture radar images[J]. Remote Sensing, 15(19): 4752.

[29]
ZI NANNAN, LI XIAOMING, GADE M, et al, 2024. Ocean eddy detection based on YOLO deep learning algorithm by synthetic aperture radar data[J]. Remote Sensing of Environment, 307: 114139.

文章导航

/