CN114782982A

CN114782982A - 一种基于深度学习的海洋生物智能检测方法

Info

Publication number: CN114782982A
Application number: CN202210230186.4A
Authority: CN
Inventors: 毛国君; 廖观奕; 朱恒亮
Original assignee: Fujian University of Technology
Current assignee: Fujian University of Technology
Priority date: 2022-03-10
Filing date: 2022-03-10
Publication date: 2022-07-22

Abstract

本发明提出一种基于深度学习的海洋生物智能检测方法，包括以下步骤；步骤S1、海洋生物图像预处理；步骤S2、构建并行注意力YoloV4目标检测网络，所述并行注意力分别为空间域注意力和通道域注意力；所述YoloV4目标检测网络为嵌入并行注意力机制的并行注意力YoloV4目标检测网络；步骤S3、训练并行注意力YoloV4目标检测网络：对并行注意力YoloV4目标检测网络进行预训练，得到预训练模型；利用Mosaic数据增强方法随机把多幅图片拼接为一张图片来生成新的训练数据集，对所得到的预训练模型进行训练；步骤S4、重新训练并行注意力YoloV4目标检测网络，对测试集中图像进行检测；本发明能用于准确且快速检测出复杂海洋环境下的海洋生物，为水下机器人的捕捞做出技术支撑。

Description

一种基于深度学习的海洋生物智能检测方法

技术领域

本发明涉及深度学习及海洋海洋生物养殖及捕捞技术领域，尤其是一种基于深度学习的海洋生物智能检测方法。

背景技术

海洋所蕴藏的丰富资源是社会发展的重要依托，随着海洋养殖业蓬勃发展，传统的捕捞作业暴露出了许多显而易见的问题。例如耗时较长、人工作业安全系数较低、培养工作人员时间周期较长等缺点。这些缺点无不制约着捕捞行业的进一步发展。近年来随着信息化的浪潮，水下机器人技术的逐步成熟和应用，目标检测也被应用于水下机器人捕捞作业中。但是相应的，水下机器人应用在水下的实际复杂环境时，同样也面临着许多问题。诸如水下光线较暗，海洋生物易受泥沙遮挡、分布不均匀等问题。因此为了克服上述困难，设计一种可靠的目标检测算法具有重要意义。

在海洋生物检测领域中，图像识别的应用可分为两个大类：一是以传统的目标检测方法一般是由图像特征提取和特征学习两个相对独立的过程来完成。二是深度学习的方法。相较于深度学习的方法，传统的目标检测方法不仅费时费力，并且大部分仅限于较为特定的物种，缺乏一定的通用性。随着深度学习的发展，将深度学习的方法应用于水下目标检测是当今水下生物识别的热门方向。当前，将深度学习应用于海洋生物识别的研究领域中，大多数方法集中于图像的预处理，却忽视了部署到实际的水下机器人有关于参数量的要求，必须在提升精度的同时保证参数量的开销较小，才能做到及时的识别与处理。

发明内容

本发明提出一种基于深度学习的海洋生物智能检测方法，能用于准确且快速检测出复杂海洋环境下的海洋生物，为水下机器人的捕捞做出技术支撑。

一种基于深度学习的海洋生物智能检测方法，包括以下步骤；

步骤S1、海洋生物图像预处理，具体为：针对海洋生物图像，采用RGHS算法对水下所拍摄的图像进行数据增强，生成数据增强后的海洋生物图像；运用LabelImg工具标注出每一幅图像中的海洋生物的位置和类别，并按照预设比例划分为训练集、验证集和测试集；

步骤S2、构建并行注意力YoloV4目标检测网络，所述并行注意力分别为空间域注意力和通道域注意力；所述YoloV4目标检测网络为嵌入并行注意力机制的并行注意力YoloV4目标检测网络；

步骤S3、训练并行注意力YoloV4目标检测网络：利用大型网络公开数据集ImageNet对并行注意力YoloV4目标检测网络进行预训练，得到预训练模型；利用Mosaic数据增强方法随机把海洋生物图像训练集中的多幅图片拼接为一张图片来生成新的训练数据集，对所得到的预训练模型进行训练；

步骤S4、重新训练并行注意力YoloV4目标检测网络，利用重新训练后所得到的并行注意力YoloV4 目标检测网络对测试集中图像进行检测。

步骤S1中按照9:1的比例将海洋生物图像数据集划分为训练集、验证集和测试集，将训练集和验证集一起加入训练，并在训练的过程中将训练验证集按9:1划分参与训练。

所述并行注意力YoloV4目标检测网络结构包括四个部分，第一部分为CSPDarkNet53主干特征提取网络；第二部分为SPP+PANet，即空间金字塔池化网络和路径聚合网络；第三部分为并行注意力机制部分；第四部分是YoloHead用获取到的特征进行预测。

所述方法中，空间金字塔池化网络即空间金字塔池化层SPP，掺杂在CSPDarkNet53最后一个卷积层中，分别利用四个不同尺度的最大池化Maxpool进行处理；最大池化的池化核大小分别为13×13、 9×9、5×5、1×1；其中1×1即无处理，用于极大地增加感受野及分离出最为显著的上下文信息；

路径聚合网络PANet用于实现对特征的反复提取，实现特征融合从浅到深和从深到浅的过程；其具体操作为：步骤S4中，通过CSPDarkNet53分别提取出浅层特征、中层特征、深层特征P₁、P₂、 P₃；利用SPP网络中四种不同大小池化核的最大池化层提取出P₃中较为显著的特征，之后同时利用五次卷积、上采样、下采样将深层特征P₃与中层特征P₂、浅层特征P₁进行特征融合；

通过SPP与PANet所获得的P₁、P₂、P₃在经过并行注意力机制后分别对应YoloHead预测网络中13×13×18、26×26×18、52×52×18三种不同尺寸的预测结果，实现对大、中、小海洋生物目标的检测。

所述方法在PANet和YoloHead中间部分引入并行注意力机制，具体为卷积后获得的特征基础上，利用空间域注意力和通道域注意力提取其权重系数，并与原始特征相乘。

步骤S3中，利用Mosaic数据增强方法随机把海洋生物图像训练集中的四幅图片拼接为一张图片来生成新的训练数据集，对所得到的预训练模型进行重新训练；

重新训练时，训练中设置batchsize为8、学习率为1×10^-3、最大迭代次数为100；每一轮训练结束后采用验证集对并行注意力机制YoloV4目标检测网络训练效果进行评价；验证过程中采用标签平滑方法来降低少量错误标签对并行注意力YoloV4目标检测网络整体性能的影响。

步骤S4中，经过PANet和并行注意力机制后的融合特征将会输入YoloHead中，通过三种不同的尺度检测得到测试集图像中的海洋生物目标类别、置信度、位置。

所述海洋生物图像的图像背景为水体。

所述检测方法用于对复杂海洋环境中的海洋生物进行快速检测；

当含海洋生物的图像完成检测之后，若海洋生物目标周围有着大量的预测框，则再利用非极大值抑制进行筛选，得到置信度最优的检测框作为最后的预测框。

并行注意力机制分为两个部分，一部分为空间域注意力，另一部分是通道域注意力，空间域注意力分别执行最大池化操作和平均池化操作，生成两个特征图；随后将这两个特征图相结合，生成结合后的权重图F₁，再将权重图F₁经过一个7×7卷积重新提取特征，得到一个新的权重图F₂，再将F₂与特征图相结合，得到空间域特征图F_S；有空间域注意力计算公式为：

通道域注意力包括逐点卷积、空间金字塔池化结构和多层感知部分，逐点卷积包括一个1X1的卷积层、一个BN层和一个Relu激活函数；所述BN层为批量归一化层BatchNormalization；

空间金字塔池化结构包含三层不同大小的自适应平均池化层；

多层感知部分用于在空间金字塔的输出中学习特征图；

有通道域注意力计算过程如下：

假设输入的特征图有C个通道，而与此同时每一个通道的大小分别为HⅹW，假设CNN包含L 层，x_l表示l∈[1,L]层的输出，自适应池化层与全连接层分别采用P(·，·),F_fc(·),C(·)表示堆叠操作，σ(·)表示sigmoid激活函数，R(·)表示Resize函数。对于给定的特征图x_l∈R^C×H×W,基于卷积神经网络模型的注意力机制可以从该输入学习权值并与其相乘从而得到输出的对应的权重值。因此，该注意力机制的输出可以表示为：

S(x_l)＝C(R(P(x_l,4),R(P(x_l,2)),R(P(x_l,1)))

对于上述的输出，注意力机制还做了以下的变换：

Γ(x_l)＝σ(F_fc(F_fc(S(x_l))))

公式在展现注意力机制模块计算的方式时，省略了批量归一化层、激活层以及逐点卷积，采用简化方式来表示该注意力模块的核心变化过程。

本发明针对水下图像光线不足，易受泥沙覆盖、水下拍摄图像清晰度不足等问题，设计了一种并行注意力机制，用以提高检测的准确性；将并行注意力嵌入到YoloV4目标检测网络中；训练并行注意力YoloV4目标检测模型，最后利用得到的并行注意力YoloV4目标检测模型对测试集图像进行检测；能够在复杂的水下中快速准确地检测中海洋生物的位置并且可以实现对海洋生物实现计数功能，具有较高的海洋生物检测精度与检测速度。

本发明能用于准确且快速检测出复杂海洋环境下的海洋生物，为水下机器人的捕捞做出技术支撑。

本发明可满足部署到实际工作的水下机器人有关于参数量的要求，可在提升精度的同时保证参数量的开销较小，使机器人做到及时的识别与处理。

附图说明

下面结合附图和具体实施方式对本发明进一步详细的说明：

附图1是本发明实施时的流程示意图。

具体实施方式

如图所示，一种基于深度学习的海洋生物智能检测方法，包括以下步骤；

所述海洋生物图像的图像背景为水体。

多层感知部分用于在空间金字塔的输出中学习特征图；

有通道域注意力计算过程如下：

S(x_l)＝C(R(P(x_l,4),R(P(x_l,2)),R(P(x_l,1)))

对于上述的输出，注意力机制还做了以下的变换：

Γ(x_l)＝σ(F_fc(F_fc(S(x_l))))

本实施例的步骤S1中，采用水下拍摄的海洋生物图像，包括3442张图像，其中包括海胆、海星、海参和扇贝四个物种。

由于水下图像采集较为困难，因此针对样本不足和图像质量较差等问题，本例采用RGHS算法对图像进行增强并扩充数据集，扩充后的数据集达到6884张图片；运用LabelImg工具标注出每一幅海洋生物图像的位置与类别，包括海胆、海星、海参和扇贝四个物种，并定义为echinus、starfish、 holothurian和scallop，自动生成.xml文件；通过转换算法将.xml格式文件转换为PASALVOC格式的.txt 文件，供下一步聚类分析和模型训练时调取数据。将海洋生物数据集按照9:1的比例划分为训练验证集和测试集，并且在训练验证集中按照9:1的比例将训练验证集划分成为训练集和验证集，因此，本实例中训练集包括5576张图片，验证集包括620张图片，测试集包括688张图片。

本实施例中通过CSPDarkNet53分别提取出浅层特征、中层特征、深层特征P₁、P₂、P₃；利用 SPP网络中13×13、9×9、5×5(1×1即无处理)四种不同大小池化核的最大池化层提取出P₃中较为显著的特征，之后同时利用五次卷积、上采样、下采样将深层特征P₃与中层特征P₂、浅层特征P₁进行特征融合。再将融合后的特征送入并行注意力机制中，得到重新分配权重后的特征图P₁、P₂、P₃；最后将重新分配特征权重的三个特征图分别输入YoloHead预测网络中，通过三种尺度检测得到测试集图像中的海洋生物目标类别、置信度和位置；而海洋生物图像完成加测之后，目标周围有着大量的预测框，再利用非极大值抑制进行筛选，得到置信度最优的检测框作为最后的预测框。

本例中，RGHS算法为改进全局直方图拉伸算法。

Claims

1.一种基于深度学习的海洋生物智能检测方法，其特征在于：包括以下步骤；

步骤S4、重新训练并行注意力YoloV4目标检测网络，利用重新训练后所得到的并行注意力YoloV4目标检测网络对测试集中图像进行检测。

2.根据权利要求1所述的一种基于深度学习的海洋生物智能检测方法，其特征在于：步骤S1中按照9:1的比例将海洋生物图像数据集划分为训练集、验证集和测试集，将训练集和验证集一起加入训练，并在训练的过程中将训练验证集按9:1划分参与训练。

3.根据权利要求1所述的一种基于深度学习的海洋生物智能检测方法，其特征在于：所述并行注意力YoloV4目标检测网络结构包括四个部分，第一部分为CSPDarkNet53主干特征提取网络；第二部分为SPP+PANet，即空间金字塔池化网络和路径聚合网络；第三部分为并行注意力机制部分；第四部分是YoloHead用获取到的特征进行预测。

4.根据权利要求3所述的一种基于深度学习的海洋生物智能检测方法，其特征在于：所述方法中，空间金字塔池化网络即空间金字塔池化层SPP，掺杂在CSPDarkNet53最后一个卷积层中，分别利用四个不同尺度的最大池化Maxpool进行处理；最大池化的池化核大小分别为13×13、9×9、5×5、1×1；其中1×1即无处理，用于极大地增加感受野及分离出最为显著的上下文信息；

路径聚合网络PANet用于实现对特征的反复提取，实现特征融合从浅到深和从深到浅的过程；其具体操作为：步骤S4中，通过CSPDarkNet53分别提取出浅层特征、中层特征、深层特征P₁、P₂、P₃；利用SPP网络中四种不同大小池化核的最大池化层提取出P₃中较为显著的特征，之后同时利用五次卷积、上采样、下采样将深层特征P₃与中层特征P₂、浅层特征P₁进行特征融合；

通过SPP与PANet所获得的P₁、P₂、P₃在经过并行注意力机制后分别对应Yolo Head预测网络中13×13×18、26×26×18、52×52×18三种不同尺寸的预测结果，实现对大、中、小海洋生物目标的检测。

5.根据权利要求4所述的一种基于深度学习的海洋生物智能检测方法，其特征在于：所述方法在PANet和YoloHead中间部分引入并行注意力机制，具体为卷积后获得的特征基础上，利用空间域注意力和通道域注意力提取其权重系数，并与原始特征相乘。

6.根据权利要求1所述的一种基于深度学习的海洋生物智能检测方法，其特征在于：步骤S3中，利用Mosaic数据增强方法随机把海洋生物图像训练集中的四幅图片拼接为一张图片来生成新的训练数据集，对所得到的预训练模型进行重新训练；

7.根据权利要求1所述的一种基于深度学习的海洋生物智能检测方法，其特征在于：步骤S4中，经过PANet和并行注意力机制后的融合特征将会输入YoloHead中，通过三种不同的尺度检测得到测试集图像中的海洋生物目标类别、置信度、位置。

8.根据权利要求1所述的一种基于深度学习的海洋生物智能检测方法，其特征在于：所述海洋生物图像的图像背景为水体；

所述检测方法用于对复杂海洋环境中的海洋生物目标进行快速检测；

9.根据权利要求3所述的一种基于深度学习的海洋生物智能检测方法，其特征在于：并行注意力机制分为两个部分，一部分为空间域注意力，另一部分是通道域注意力，空间域注意力分别执行最大池化操作和平均池化操作，生成两个特征图；随后将这两个特征图相结合，生成结合后的权重图F₁，再将权重图F₁经过一个7×7卷积重新提取特征，得到一个新的权重图F₂，再将F₂与特征图相结合，得到空间域特征图F_S；有空间域注意力计算公式为：

多层感知部分用于在空间金字塔的输出中学习特征图；

有通道域注意力计算过程如下：

假设输入的特征图有C个通道，而与此同时每一个通道的大小分别为HⅹW，假设CNN包含L层，x_l表示l∈[1,L]层的输出，自适应池化层与全连接层分别采用P(·，·),F_fc(·),C(·)表示堆叠操作，σ(·)表示sigmoid激活函数，R(·)表示Resize函数。对于给定的特征图x_l∈R^C×H×W,基于卷积神经网络模型的注意力机制可以从该输入学习权值并与其相乘从而得到输出的对应的权重值。因此，该注意力机制的输出可以表示为：

S(x_l)＝C(R(P(x_l,4),R(P(x_l,2)),R(P(x_l,1)))

对于上述的输出，注意力机制还做了以下的变换：

Γ(x_l)＝σ(F_fc(F_fc(S(x_l))))