CN113379603B

CN113379603B - 一种基于深度学习的船舶目标检测方法

Info

Publication number: CN113379603B
Application number: CN202110649805.9A
Authority: CN
Inventors: 潘明阳; 赵丽宁; 李哲林; 李邵喜; 李超; 郝江凌; 胡景峰; 刘宗鹰; 张若澜; 孙慧; 李航琪
Original assignee: Dalian Maritime University
Current assignee: Dalian Maritime University
Priority date: 2021-06-10
Filing date: 2021-06-10
Publication date: 2024-03-15
Anticipated expiration: 2041-06-10
Also published as: CN113379603A

Abstract

本发明提供了一种基于深度学习的船舶目标检测方法，涉及目标检测技术领域，该方法包括：获取船舶数据集；对船舶数据集中的船舶图像进行图像拼接；构建船舶目标检测模型；船舶目标检测模型包括轻量化骨干网络和注意力金字塔；轻量化骨干网络包括输入层、平均池化层以及密集连接单元；注意力金字塔包括三个检测分支，分别连接到骨干网络中输出13*13、26*26、52*52尺寸特征图的密集连接单元；注意力金字塔使用有效通道注意力模块，位于所述注意力金字塔的最前端，每一检测分支各一个；利用构建的船舶目标检测模型进行船舶目标检测，得到船舶检测结果。本发明实现了更精准、轻量、实时的船舶检测。

Description

一种基于深度学习的船舶目标检测方法

技术领域

本发明涉及目标检测技术领域，特别是涉及一种基于深度学习的船舶目标检测方法。

背景技术

伴随港口吞吐能力的提升、船舶数量的增加，有效的船舶辅助导航和监控方法越来越重要。AIS和雷达作为当前主流的辅助导航和监控设备为船舶的航行和监管提供保障。同时由于计算机视觉技术的飞速发展，船舶目标检测的精度与实时性逐渐提高，可以作为AIS和雷达的补充技术来提供更丰富的信息。另外随着无人船技术的逐步发展，船舶目标检测作为一种环境感知方法，为无人船的自主规划和航行提供了一种新的信息获取方式。

船舶图像数据作为载体可以为目标检测算法提供丰富的信息。船舶图像数据的种类可以大致分为光学遥感图像、合成孔径雷达图像、红外图像和可见光图像。其中光学遥感图像容易受到云雾的干扰，合成孔径雷达图像无法捕捉船舶的颜色与纹理信息，红外图像分辨率较低且易受噪声干扰。可见光图像包含较为稳定、丰富、细致的图像信息，有利于水面目标的辨识，更适合应用于辅助导航与监控。

基于可见光的船舶目标检测的任务是对图像数据中的船舶目标进行辨别与定位。基于滑动窗口的目标检测算法虽然实现简单，但是存在大量的计算冗余，并且人工设计的特征对于多变的环境没有很好的鲁棒性。目前，基于深度卷积神经网络的目标检测方法在船舶智能导航和船舶监控领域受到越来越多的关注，其在检测精度、速度方面都优于传统算法。卷积神经网络依靠卷积核逐通道对图像进行卷积计算以获得目标的特征，无需人工设计即可得到更可靠的特征泛化能力。

目前，已有的基于深度卷积神经网络的船舶目标检测方法有：

期刊论文：董超,冯俊健,田联房,郑兵.梯度纹理直方图与多层感知器船舶快速检测[J].红外与激光工程,2019,48(10):290-299.

该论文提出基于梯度纹理直方图特征与多层感知器的船舶快速检测算法，其基本思路是：首先基于二值梯度的特征训练船舶候选区模型,以快速生成具有高召回率的少量船舶候选窗口,并在每个候选窗口提取梯度纹理直方图特征；其次设计一个多层感知器作为船舶分类器,对提取到的梯度纹理直方图特征进行判别。

该方法中，基于滑动窗口和特征直方图的特征提取方式具有一定的局限性，对于船舶目标而言，无法充分表达船舶的语义，鲁棒性不好；另外，多层感知机结构简单，无法实现多尺度的目标检测。

期刊论文：王炳德,杨柳涛.基于YOLOv3的船舶目标检测算法[J].中国航海,2020,43(01):67-72.

该论文提出了提出一种基于YOLOv3算法的船舶目标检测方法，可用于视频图像的监测与跟踪。该方法采用k-means聚类先验框、mixup、标签平滑化等方法对算法进行改进和优化。

该方法中，虽然使用Mixup和标签平滑化对船舶数据进行了处理，具有正则化效果，但是其89.90％的检测准确率不算高，且YOLOv3模型体积较大，并不适合应用普及。

可见，目前已有的这类算法并不完美，卷积层越多的模型虽然可以得到更好的泛化能力与检测精度，但是这种复杂的模型要求硬件设备具有非常高的算力，也会影响检测速度，不利于应用普及。

发明内容

为解决深度卷积神经网络对计算资源要求高、检测实时性差的问题，并综合考虑船舶特征与辅助导航、监控的应用场景，本发明提供了一种基于改进YOLOv3的船舶目标检测方法。该方法通过增强船舶图像提高数据集检测难度，增加边框回归损失函数的惩罚项及使用改进的非极大值抑制方法提高定位准确度，结合基于密集连接结构改进的骨干网络、基于注意力机制改进的特征金字塔实现轻量高效的网络结构，可以实现更精准、轻量、实时的船舶检测。

为此，本发明提供了以下技术方案：

本发明提供了一种基于深度学习的船舶目标检测方法，所述方法包括：

S1、获取船舶数据集；

S2、对船舶数据集中的船舶图像进行图像拼接；

S3、构建船舶目标检测模型；所述船舶目标检测模型包括轻量化骨干网络和注意力金字塔；轻量化骨干网络包括输入层、多个平均池化层以及多个不同尺度的密集连接单元；注意力金字塔包括三个检测分支，分别连接到骨干网络中输出13*13、26*26、52*52尺寸特征图的密集连接单元；注意力金字塔使用有效通道注意力模块，所述有效通道注意力模块位于所述注意力金字塔的最前端，每一检测分支各一个；注意力金字塔中的3*3卷积为空间可分离卷积；

S4、利用构建的船舶目标检测模型进行船舶目标检测，得到船舶检测结果。

进一步地，对船舶数据集中的船舶图像进行图像拼接，包括：图像裁切流程和确定拼接坐标流程；

所述图像裁切流程包括：统计所有船舶的尺寸信息并求出船舶尺寸均值，仅对均值以上的船舶进行下采样；对裁切出的船舶进行随机翻转；保存船舶尺寸信息和图像像素值信息；

所述确定拼接坐标流程包括：将被拼接图像中的船舶下边线作为近似海天线，拼接位置的左下角坐标在图像下边沿和近似海天线之间进行随机选择；

如果使用该坐标时所有船舶的交并比都为0，则保存该坐标；

根据图像裁切流程中的船舶尺寸信息和像素信息完成图像的拼接和xml文件的改写。

进一步地，所述船舶目标检测模型的损失函数包括：置信度损失、类别损失和边框回归损失；

置信度损失和类别损失均采用交叉熵计算；

边框回归损失采用CIoU损失函数，CIoU的计算方式如下：

其中p()为预测框中心点b和真实框中心点b^gt之间的欧氏距离，c为预测框和真实框的最小外接矩形的对角线长度，v用来评价预测框与真实框宽高比的一致性，α是一个平衡权重参数；|w^gt-w|为真实框与预测框宽度差值的绝对值，用以增加宽度回归偏差的惩罚程度，c_w为真实框与预测框的最小外接矩形的宽度值，用来消除不同边框尺寸带来的尺度影响。

进一步地，所述方法还包括：使用DIoU的非极大值抑制方法对冗余预测结果进行删除；

采用DIoU的非极大值抑制方法表示为：

其中DIoU(M，b_i)为最高置信度边框M与其余边框b_i的DIoU距离，ε为非极大值抑制的阈值，s_i为其余边框的分类得分；当DIoU距离大于等于非极大值抑制阈值时，该边框的分类得分被置为0，即删除该边框。

进一步地，所述方法还包括：将置信度作为权重对所有预测框的位置信息进行加权平均计算，将得出的位置信息作为最终的预测结果，计算方式如下所示：

式中，N为所有预测框的数量，(X^bl，Y^bl，X^tr，X^tr)为最终预测位置的左下与右上角点坐标，为预测框的左下与右上角点坐标，ω_i为第i个预测框的权重。

进一步地，所述预测框的权重是置信度与类别概率的乘积，用于削弱低类别概率的预测框对输出结果的贡献度。

本发明的优点和积极效果：

本发明创新性地提出了LSDM-LAPN船舶目标检测方法，其轻量化的模型结构在提高检测精度的前提下有效缩减了模型体积，提高检测速度；损失函数和非极大值抑制方法使模型的船舶定位能力更加优秀。同时，本发明还提出了一种图像拼接方法，该方法可以有效的增加数据集中困难样本的数量，使模型具有更好的鲁棒性。

对于船舶辅助导航，本发明中准确、轻量、实时的船舶检测方案可以作为AIS和雷达设备的补充技术为船舶提供信息，轻量化的方案不仅可以提升模型的检测效率，还可以节约硬件成本。对于船舶监控，本发明中船舶目标检测可以降低人工成本，实现全天候不间断的实时船舶监控。对于无人船，目标检测是无人船信息感知的重要手段，本发明中可靠、实时的目标检测算法可以为无人船的自主规划与航行提供丰富的外界环境信息。

综上，使用本发明的技术方案实现对船舶的准确、实时的检测，在船舶辅助导航、船舶监控以及无人船信息感知等多个方面均有重要应用，具有明显的经济和社会效益。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例中船舶目标检测流程图；

图2为本发明实施例中船舶图像拼接算法流程图；

图3为本发明实施例中船舶图像拼接效果示意图；

图4为本发明实施例中船舶目标检测模型的结构示意图；

图5为本发明实施例中非极大值抑制工作流程图；

图6为本发明实施例中船舶目标检测模型的检测结果示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

YOLOv3算法在被提出时用于检测公开数据集中的80类目标，而对于船舶这种单类别目标进行检测时，存在参数冗余，容易导致过拟合。除此之外，船舶长宽比较大，YOLOv3在对其进行定位时存在回归效果的问题。最后，YOLOv3算法结构复杂，参数量庞大，其较大的模型体积与较高的计算复杂度不利于工程应用。

本发明的基本思路是，首先利用图像拼接方法提升船舶数据集中的困难样本数量，再利用基于改进YOLOv3的LSDM-LAPN方法进行船舶检测。为了实现准确、轻量、实时的船舶目标检测算法，本发明在LSDM-LAPN方法中使用了轻量化骨干网络LSDM和注意力金字塔LAPN，并使用了带有宽度惩罚项的CIoU损失函数和基于DIoU的非极大值抑制方法。

参见图1，其示出了本发明实施例中一种基于深度学习的船舶目标检测方法的流程图。该方法包括以下步骤：

S1、获取船舶数据集；

S2、对船舶数据集中的船舶图像进行图像拼接；

通过对船舶数据集中的船舶图像进行图像拼接实现数据增强；

S3、构建船舶目标检测模型，所述船舶目标检测模型包括轻量化骨干网络和注意力金字塔；

本发明实施例中，基于改进的YOLOv3构建船舶目标检测模型，表示为LSDM(轻量化骨干网络，Lightweight Ship Detection Model)-LAPN(注意力金字塔，LightweightAttention Pyramid Networks)。

本发明实施例中提出的LSDM-LAPN船舶目标检测方法，其轻量化的模型结构在提高检测精度的前提下有效缩减了模型体积，提高检测速度；损失函数和非极大值抑制方法使模型的船舶定位能力更加优秀。

为了便于理解，下面对步骤S2中的船舶图像拼接算法进行具体说明。

为提高训练数据的检测难度，增加较小船舶及多船舶场景的数据数量，本发明提出了一种船舶图像拼接方法，该方法可以在现有数据集中提取船舶，并将其拼接入其他图像中。

如图2所示，该算法主要分为图像裁切和确定拼接坐标两部分，在图像裁切的流程中，首先需要统计所有船舶的尺寸信息并求出船舶尺寸均值，仅对均值以上的船舶进行下采样，防止原本尺寸就很小的船舶被再次缩小。接着对裁切出的船舶进行随机翻转，最后保存船舶尺寸信息和图像像素值信息。在确定拼接坐标流程中需要将被拼接图像中的船舶下边线作为近似海天线，拼接位置的左下角坐标在图像下边沿和近似海天线之间进行随机选择。为保证拼接后的船舶不会互相大面积覆盖，本算法对坐标位置进行限制，如果使用该坐标时所有船舶的交并比都为0，则保存该坐标。最后根据图像裁切流程中的船舶尺寸信息和像素信息完成图像的拼接和xml文件的改写。进行数据增强后的船舶图像效果如图3所示。

本发明实施例中提出的图像拼接方法，可以有效的增加数据集中困难样本的数量，使模型具有更好的鲁棒性。

为了便于理解，下面对步骤S3构建基于改进的YOLOv3的船舶目标检测模型进行具体说明。模型构建包括LSDM的网络结构及参数设置等、LAPN的网络结构及参数设置等、损失函数、非极大值抑制方法。

(1)、模型的构建

基于改进的YOLOv3的船舶目标检测模型LSDM-LAPN如图4所示。

在该模型中，基于密集连接结构改进的骨干网络LSDM的核心参数如下：

该模型由卷积层(Conv)、密集连接单元(Dense_unit)和平均池化层(Avg_pool)构成，该模型的骨干网络LSDM参数如表1所示。

表1

该网络的注意力金字塔LAPN使用了ECA(Efficient Channel Attention，有效通道注意力模块)注意力机制，该注意力模块被放在了注意力金字塔的最前端，每一检测分支各一个。除此之外，注意力金字塔的3*3卷积为空间可分离卷积，假设输入进空间可分离卷积的特征图维度为n，则空间可分离卷积中的参数如表2所示。

表2

船舶目标检测模型的网络结构是一个端到端的整体，需要将骨干网络与注意力金字塔连接，本发明实施例中，将注意力金字塔的三个检测分支分别连接到LSDM骨干网络中输出13*13、26*26、52*52尺寸特征图的最后一个密集连接单元，充分利用不同感受野的特征图来综合提高检测算法的语义判别与目标定位性能。

(2)、损失函数

本发明实施例中船舶目标检测模型的损失函数由三部分组成，分别为置信度损失、类别损失和边框回归损失。其中置信度损失和类别损失均采用交叉熵计算，计算方式如下：

其中loss_obj为置信度损失，λ_noobj为没有物体时置信度损失权重，c_i为预测置信度，为实际置信度。置信度表示框内确实有物体的自信程度和边框将整个物体的所有特征都包括进来的自信程度。对于一幅图像，一般而言大部分内容是不包含待测物体的，这样导致没有物体的计算部分贡献占据优势，使网络倾向于预测单元格不含物体。因此损失函数要削弱没有物体情况下的贡献。loss_cls为类别损失，c为检测目标所属类别，p_i(c)为单元格中目标属于c类别的预测概率，/>为实际概率。

本发明实施例中，采用CIoU损失函数作为边框回归的损失函数，该函数不仅可以消除尺度影响，还同时考虑到了边框间的覆盖面积、中心点距离、宽高比。CIoU的计算方式如下：

其中p()为预测框中心点b和真实框中心点b^gt之间的欧氏距离，c为预测框和真实框的最小外接矩形的对角线长度，v用来评价预测框与真实框宽高比的一致性，α是一个平衡权重参数。

本发明实施例中，在CIoU损失函数中的宽高比一致性函数v中加入宽度惩罚项，使模型更好的回归船舶边框，改进后的宽高比一致性函数如下：

其中|w^gt-w|为真实框与预测框宽度差值的绝对值，用以增加宽度回归偏差的惩罚程度，c_w为真实框与预测框的最小外接矩形的宽度值，用来消除不同边框尺寸带来的尺度影响。

(3)、非极大值抑制

对于一个检测目标，期望只产生一个最佳预测结果，这时检测算法需要使用非极大值抑制方法对冗余的预测结果进行删除。其工作流程如图5所示。

本发明实施例中，采用DIoU作为距离度量，其考虑了边框中心点距离，在检测具有遮挡关系的船舶时可以减少错误抑制。采用DIoU的非极大值抑制方法可以表示为：

其中DIoU(M，b_i)为最高置信度边框M与其余边框b_i的DIoU距离，ε为非极大值抑制的阈值，s_i为其余边框的分类得分。当DIoU距离大于等于非极大值抑制阈值时，该边框的分类得分被置为0，即删除该边框。

除此之外，本发明实施例中将置信度作为权重对所有预测框的位置信息进行加权平均计算，将得出的位置信息作为最终的预测结果，该方法可以得到更准确的预测船舶位置，计算方式如下所示：

式中，N为所有预测框的数量，(X^bl，Y^bl，X^tr，X^tr)为最终预测位置的左下与右上角点坐标，为预测框的左下与右上角点坐标，ω_i为第i个预测框的权重。值得注意的是，本发明实施例中采用的权重是置信度与类别概率的乘积，用于削弱低类别概率的预测框对输出结果的贡献度。

在本发明实施例中，使用LSDM-LAPN对船舶图像进行检测，直观的船舶检测结果如图6所示。采用准确率(Precision)、召回率(Recall)、精度均值(AP)、F1指标、模型体积(Params)、检测帧率(FPS)作为评价指标，在英伟达GTX1060环境下对模型进行评估，评估结果如表3所示。

表3

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种基于深度学习的船舶目标检测方法，其特征在于，所述方法包括：

S1、获取船舶数据集；

S2、对船舶数据集中的船舶图像进行图像拼接；

S3、构建船舶目标检测模型；所述船舶目标检测模型包括轻量化骨干网络和注意力金字塔；其中，轻量化骨干网络包括输入层、多个平均池化层以及多个不同尺度的密集连接单元；注意力金字塔包括三个检测分支，分别连接到骨干网络中输出13*13、26*26、52*52尺寸特征图的密集连接单元；注意力金字塔使用有效通道注意力模块，所述有效通道注意力模块位于所述注意力金字塔的最前端，每一检测分支各一个；注意力金字塔中的3*3卷积为空间可分离卷积；

S4、利用构建的船舶目标检测模型进行船舶目标检测，得到船舶检测结果；对船舶数据集中的船舶图像进行图像拼接，包括：图像裁切流程和确定拼接坐标流程；

如果使用该坐标时所有船舶的交并比都为0，则保存该坐标；

2.根据权利要求1所述的基于深度学习的船舶目标检测方法，其特征在于，所述船舶目标检测模型的损失函数包括：置信度损失、类别损失和边框回归损失；

置信度损失和类别损失均采用交叉熵计算；

边框回归损失采用CIoU损失函数，CIoU的计算方式如下：

3.根据权利要求1所述的基于深度学习的船舶目标检测方法，其特征在于，所述方法还包括：使用DIoU的非极大值抑制方法对冗余预测结果进行删除；

采用DIoU的非极大值抑制方法表示为：

4.根据权利要求3所述的基于深度学习的船舶目标检测方法，其特征在于，所述方法还包括：将置信度作为权重对所有预测框的位置信息进行加权平均计算，将得出的位置信息作为最终的预测结果，计算方式如下所示：

5.根据权利要求4所述的基于深度学习的船舶目标检测方法，其特征在于，所述预测框的权重是置信度与类别概率的乘积，用于削弱低类别概率的预测框对输出结果的贡献度。