CN112800838A

CN112800838A - 一种基于深度学习的航道船舶检测与识别方法

Info

Publication number: CN112800838A
Application number: CN202011576316.7A
Authority: CN
Inventors: 孙德超; 王仁芳; 黄宏; 岑仲迪
Original assignee: Zhejiang Wanli University
Current assignee: Zhejiang Wanli University
Priority date: 2020-12-28
Filing date: 2020-12-28
Publication date: 2021-05-14

Abstract

本发明涉及一种基于深度学习的内河航道船舶检测与识别方法，主要包括：S1：采集不同时间段的船舶视频，通过数据标注建立航道船舶数据集；S2：对船舶数据集重新聚类，设计船舶特征提取网络和船舶分类检测识别网络，使用自制航道船舶数据集训练船舶分类检测识别网络；S3：导入船舶监控视频，对多目标船舶进行实时分类检测识别。将计算机视觉和图像处理等技术应用于水上交通，避免水上安全事故的发生；以及重点水域船舶非法驶入，船舶的类型判断。本发明实现了全天候的内河航道船舶实时检测与识别，针对低照度环境下的图像也能有较好的识别效果，具有较高的准确率和鲁棒性。

Description

一种基于深度学习的航道船舶检测与识别方法

技术领域

本发明涉及计算机视觉和数字图像识别技术领域，尤其是涉及一种基于深度学习的内河航道船舶检测与识别方法。

背景技术

水路运输在现代交通系统中拥有着巨大的优势，是交通运输系统中不可替代的一部分。随着航运业的蓬勃发展，船舶的种类和数量逐渐增长，水上交通事故频繁发生，传统的信息化方式很难满足港口之间船舶身份信息的检测与识别，因此有必要对船舶的种类进行检测与识别以保障水上交通安全。传统的船舶目标检测方法主要包括船舶自动识别系统和船舶特征识别，这些检测方法普遍存在着识别精度较低，需要人为干预等问题，导致传统的船舶检测方法难以达到理想的检测效果。

随着人工智能技术的迅速发展，基于深度学习的目标检测算法得到了广泛应用。目前，通过深度学习来解决目标检测问题的算法主要有两种：二阶段和单阶段检测算法。二阶段算法使用的是区域建议进行检测，虽然在精确度方面较传统方式要提升很多，但特征提取过程耗时较长，难以达到实时检测的效果。为了保持精度的同时，提升检测速度，单阶段算法被提出。单阶段算法整个过程无需区域建议检测，直接输入图片，实现端到端的检测，极大的提升了检测速度。目前，虽然基于深度学习的船舶目标检测算法已经取得了较好的识别效果，但在雾天或夜间这种照度较低的复杂场景下船舶的识别准确率较低，夜间或雾天环境下图像存在模糊、对比度较低以及呈现灰度等现象，这些都会对船舶的分类识别造成干扰，导致误检和漏检等问题。

发明内容

本发明所要解决的技术问题是提供一种能够降低了目标船舶的误检、漏检情况，并且在全天候场景下船舶的分类识别准确率高的基于深度学习的内河航道船舶检测与识别方法。

本发明所采用的技术方案是，一种基于深度学习的内河航道船舶检测与识别方法，包括下列步骤：

S1：采集不同时间段的船舶视频，对采集到的船舶视频进行分帧处理，对视频中存在的低照度图像进行滤波与灰度增强处理，通过数据标注来建立航道船舶数据集；

S2：对步骤S1中得到的船舶数据集进行维度聚类，设计船舶特征提取网络模型和船舶分类检测识别网络模型，使用步骤S1中得到的船舶数据集来训练船舶分类检测识别网络模型；

S3：提取船舶监控视频中的关键帧，并将关键帧加载到训练好的船舶分类检测识别网络模型中来进行测试；

S4：将船舶监控视频导入到优化后的船舶分类检测识别网络模型中，对多目标船舶进行实时分类检测识别。

本发明的有益效果是：上述一种基于深度学习的内河航道船舶检测与识别方法，通过设计船舶特征提取网络和船舶分类检测识别网络，利用建立的船舶数据集来训练船舶分类检测识别网络模型，只需将监控的船舶视频导入到训练后的船舶分类检测识别网络模型中就能对多目标船舶进行实时分类检测与识别。针对照度范围较低的雾天或夜间船舶图像，也能有良好的检测与识别效果，并且降低了目标船舶的误检、漏检情况，达到了全天候场景下船舶的分类识别准确率高的目的，具有较好的鲁棒性。

在步骤S1中，通过数据标注来建立航道船舶数据集的具体方法为：通过标注软件labelImg对视频中的船舶的真实边界框进行标注，并将标注后的船舶分为六种类型，建立航道船舶数据集。

在步骤S2中，对船舶数据集进行维度聚类，并设计船舶特征提取网络模型和船舶分类检测识别网络模型的具体方法包括下列步骤：

S21、采用K-means++算法对船舶样本数据进行维度聚类，聚类出9种尺寸的先验框，分别是(30,14),(61,25),(84,41),(114,27),(133,72),(145,46),(210,97), (240,57),(337,104)；

S22、(1)首先选取CSPDarknet53作为船舶特征提取网络，在YOLOv4算法中将LeakyRelu 激活函数与CSPDarknet53网络进行组合，避免了训练速度急剧下降所导致的梯度饱和，显著的提升了检测性能。

(2)然后采用残差网络的跳跃连接机制来降低特征冗余，通过添加SPP(空间金字塔池化)模块，能够有效的避免对图像裁剪、缩放等操作所造成的图像物体裁剪不全、失真等情况。SPP模块由卷积核大小为5x5，9x9，和13x13的最大池化层以及一个跳跃连接，四个并行的分支构成，特征图经过SPP模块后重新拼接。在YOLOv4的3个尺度的输出预测层y1、y2、y3之前都加入SPP模块，通过输出预测层来实现大、中、小尺度的船舶目标检测。

(3)SPP模块的引入虽然在一定程度上增强了多尺度特征图的表达能力，降低了过拟合，但网络的层数也会随之增加，整体网络结构存在一定的冗余。因此需要对网络进行轻量化处理，对网络中的卷积层进行4次剪枝，每次剪去5层卷积层。网络中卷积层数的减少，能够有效的降低参数量，使模型具有更好的泛化能力。

S23、通过加载Pascal VOC数据集上预训练的权重来进行迁移学习，然后采用改进的 YOLOv4算法训练船舶分类检测识别网络模型，优化学习得到船舶分类检测识别网络模型。

在步骤S21中，聚类过程中距离的衡量公式为： d(box,center)＝1-IOU(box,center)，其中d(box,center)是聚类后船舶样本标签的目标边界框与聚类中心之间的距离，IOU(box,center)是样本标签的目标边界框与聚类中心的交并比。

在步骤S22中，船舶特征提取网络模型包括用于提取船舶特征信息的卷积层以及残差网络，残差网络采用跳跃连接方式，在卷积层中，提取船舶特征信息所应用到的矩阵如下：

其中，

代表的是在第b层网络中与第a个输出之间的对应关系； f是第b层网络的激活函数；

指代的是第b-1个卷积网络层所对的第t个船体映射；

表示第b层船舶网络中第t个输入与第a个输出之间，用来连接两者的权重；

是指在b 层网络对应的第a个船体特征偏置。

在步骤S23中，改进的YOLOv4算法训练船舶分类检测识别网络模型的步骤如下：

S231、利用迁移学习的模型参数赋初值，训练时采用Mosaic数据增强处理，每次读取四张图片，丰富检测物体的背景，分别对四张图片进行翻转，缩放以及色域变换，将图片进行放置，分别对应四张分割图片的位置；

S232、通过标签平滑对分类准确率做出惩罚，减少过拟合现象，使用余弦退火衰减法使得模型收敛速度变得更快，模型效果更佳；

S233、计算预测框与真实框之间的位置，置信度和类别损失；

S234、对模型参数进行微调优化，进一步提高船舶分类识别的精度。

附图说明

图1为本发明的一种基于深度学习的内河航道船舶检测与识别方法的整体框架图；

图2为本发明的实施例中船舶图像处理前后的对比图；

图3为本发明的实施例中改进的YOLOv4目标检测算法结构图；

图4为本发明中YOLOv4算法的网络结构图；

图5为本发明中使用基于深度学习的内河航道船舶检测与识别方法后的效果图；

图5中(a)为矿砂船的效果图；

图5中(b)为散货船的效果图；

图5中(c)为普通货船的效果图；

图5中(d)为集装箱船的效果图；

图5中(e)为渔船的效果图；

图5中(f)为客船的效果图。

具体实施方式

以下参照附图并结合具体实施方式来进一步描述发明，以令本领域技术人员参照说明书文字能够据以实施，本发明保护范围并不受限于该具体实施方式。

本领域技术人员应理解的是，在本发明的公开中，术语“纵向”、“横向”、“上”、“下”、 “前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系是基于附图所示的方位或位置关系，其仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此上述术语不能理解为对本发明的限制。

本发明可以用于港口管理和海事稽查等领域，通过网络摄像头监控，实现多目标船舶检测、船舶特征特征提取以及船舶的分类识别。图1为本发明一种基于深度学习的内河航道船舶检测与识别方法的整体框架图，总体而言，其步骤包括：

S3：提取船舶监控视频中的关键帧，并将关键帧加载到训练好的船舶分类检测识别网络模型中进行测试；

步骤S1中，低照度图像包括夜间或雾天场景下的船舶图像，这些图像均存在模糊与灰度不均等现象，将低照度图像导向滤波与灰度增强处理能够在保持船体平滑滤波的同时，对船体的轮廓特征也进行了保护。有效的解决了雾天和夜间图像产生的模糊，灰度分布不均等难题，而且在去噪方面表现良好。

在步骤S1中，通过数据标注来建立航道船舶数据集的具体方法为：通过标注软件labelImg对视频中的船舶的真实边界框进行标注，并将标注后的船舶分为六种类型，建立航道船舶数据集。本实施例需要识别的船舶类型共分为6种：矿砂船、散货船、普通货船、集装箱船、渔船和客船，使用labelImg软件实现船舶的分类标注，构建内河航道船舶数据集。

S21、采用K-means++算法对船舶样本数据进行维度聚类，聚类出9种尺寸的先验框，分别是(30,14),(61,25),(84,41),(114,27),(133,72),(145,46),(210,97), (240,57),(337,104)；采用K-means++算法对数据集进行先验框维度聚类，可以优化船舶先验框尺寸参数，加速网络的收敛，有效的提升训练过程中的梯度下降；

(2)然后采用残差网络的跳跃连接机制来降低特征冗余，通过添加SPP(空间金字塔池化)模块，能够有效的避免对图像裁剪、缩放等操作所造成的图像物体裁剪不全、失真等情况。在YOLOv4的3个尺度的输出预测层y1、y2、y3之前都加入SPP模块，通过输出预测层来实现大、中、小尺度的船舶目标检测。

(3)SPP模块的引入虽然在一定程度上增强了多尺度特征图的表达能力，降低了过拟合，但网络的层数也会随之增加，整体网络结构存在一定的冗余。因此需要对网络进行轻量化处理，对网络中的卷积层进行4次剪枝，每次剪去5层卷积层。网络中卷积层数的减少，能够有效的降低参数量，使模型具有更好的泛化能力。；

S23、通过加载Pascal VOC数据集上预训练的权重来进行迁移学习，使用改进的YOLOv4 算法训练船舶分类检测识别网络，优化学习得到船舶分类检测识别网络模型。

在步骤S21中，每个尺度的船舶特征图中的每个网格都会预测3个先验框，每一个先验框包含了(4+1+N)维向量，代表了边界框的中心坐标(x,y)，宽高(w,h)和置信度(confidence)， N代表数据集中的类别数，预测的边界框的坐标和尺寸信息计算公式如下：

b_x＝σ(t_x)+c_x

b_y＝σ(t_y)+c_y

p_r(object)*IOU(b,object)＝σ(t_o)

其中的b_x，b_y是指船舶边框中心坐标的检测结果，t_x和t_y是每个船舶边界框预测的中心坐标。经过网络中的激活函数后，会得到船舶边界框中心坐标所对应的偏移量σ(t_x)和σ(t_y)。 b_w和b_h是进行归一化处理后的船舶边框宽和高的检测结果。p_w和p_h是预测先验框的宽和高。

和

指代船舶边界框预测宽度和高度的倍率。σ(t_o)是指船舶预测得分的偏移量。是由船舶预测概率与IOU的乘积得到，area(b)是船舶边界框的区域，area(g)是船舶的实际位置。

在步骤S21中，聚类过程中距离的衡量公式为： d(box,center)＝1-IOU(box,center)，其中d(box,center)是聚类后船舶数据样本标签的目标边界框与聚类中心之间的距离，IOU(box,center)是样本标签的目标边界框与聚类中心的交并比。

在步骤S22中，(1)LeakyRelu激活函数是一种泄露修正线性单元，当网络中出现负值输入时，能够产生很小的坡度。允许更好的信息进入神经网络降低了过拟合现象的发生，提升模型的收敛效果。Darknet53网络是由52个卷积层和一个全连接层组成，网络中使用残差网络ResNet来实现跳跃连接，通过3x3和1x1的卷积核进行特征提取，实现不同尺度的输出。 CSPDarkNet53将CSPNet与DarkNet53结合，把输入特征图拆成两个部分，一部分进行卷积操作，另一部分和上一部分卷积操作的结果堆叠实现特征融合。这种网络架构能够有效的增强CNN的学习能力，在减少计算量的同时，实现更加丰富的梯度组合。选取CSPDarknet53作为船舶特征提取网络，然后将LeakyRelu激活函数与CSPDarknet53网络进行组合，避免了训练速度急剧下降所导致的梯度饱和，显著的提升了检测性能。

(2)然后采用残差网络的跳跃连接机制来降低特征冗余，通过添加SPP(空间金字塔池化)模块，能够有效的避免对图像裁剪、缩放等操作所造成的图像物体裁剪不全、失真等情况。在YOLOv4的3个尺度的输出预测层y1、y2、y3之前都加入SPP模块，通过输出预测层来实现大、中、小尺度的船舶目标检测。避免连续下采样所导致的船舶目标位置信息的丢失，实现复杂场景下船舶目标局部特征与全局特征的融合，提升小目标船舶的检测定位能力。

(3)SPP模块的引入虽然在一定程度上增强了多尺度特征图的表达能力，降低了过拟合，但网络的层数也会随之增加，整体网络结构存在一定的冗余。因此需要对网络进行轻量化处理，对网络中的卷积层进行4次剪枝，每次剪去5层卷积层。网络中卷积层数的减少，能够有效的降低参数量，使模型具有更好的泛化能力。利用FPN(特征图金字塔网络)获取不同尺度大小的船舶特征图，设计船舶分类检测识别网络，采用多尺度特征图进行船舶的分类预测。

船舶特征提取网络模型包括用于提取船舶特征信息的卷积层以及残差网络，船舶特征提取网络中的卷积层，能够有效的分析船舶的特征。网络中添加残差网络，多次使用残差的跳跃连接，解决特征提取过程中梯度难以下降的问题。卷积层中的船舶特征信息提取对应的矩阵如下：

其中

代表的是在第b层网络中与第a个输出之间的对应关系。f是第b层网络的激活函数。

指代的是第b-1个卷积网络层所对的第t个船体映射。

表示第b层船舶网络中第t个输入与第a个输出之间，用来连接两者的权重。

是指在b层网络对应的第a个船体特征偏置。

在步骤S23中，使用改进的YOLOv4算法训练船舶分类检测识别网络模型的步骤如下：

S231、利用迁移学习的模型参数赋予改进的YOLOv4算法初值，训练时采用Mosaic数据增强处理，每次读取四张图片，丰富检测物体的背景；

S232、分别对四张图片进行翻转，缩放以及色域变换，将图片进行放置，分别对应四张分割图片的位置；

S233、通过标签平滑对分类准确率做出惩罚，减少过拟合现象；使用余弦退火衰减法使得模型收敛速度变得更快，模型效果更佳；

S234、计算预测框与真实框之间的位置，置信度和类别损失；

S235、对模型参数进行微调优化，进一步提高船舶分类识别的精度。对训练过程进行微调,第一个阶段恢复初始权重，学习率设置为0.0001，只训练最后的分类/回归层。直到损失降到较低水平。第二个阶段从第一阶段恢复权重，然后学习率设置为0.000001，对所有网络层进行训练。训练总epoch为126，第一阶段batch_size为8，第二阶段batch_size为4，优化器为momentum。装箱船、渔船和客船，使用labelImg软件实现船舶的分类标注，构建内河航道船舶数据集。

Claims

1.一种基于深度学习的内河航道船舶检测与识别方法，其特征在于：包括下列步骤：

2.根据权利要求1所述的一种基于深度学习的内河航道船舶检测与识别方法，其特征在于：在步骤S1中，通过数据标注来建立航道船舶数据集的具体方法为：通过标注软件labelImg对视频中的船舶的真实边界框进行标注，并将标注后的船舶分为六种类型，建立航道船舶数据集。

3.根据权利要求2所述的一种基于深度学习的内河航道船舶检测与识别方法，其特征在于：在步骤S2中，对船舶数据集进行维度聚类，并设计船舶特征提取网络模型和船舶分类检测识别网络模型的具体方法包括下列步骤：

S21、采用K-means++算法对船舶样本数据进行维度聚类，聚类出9种尺寸的先验框，分别是(30,14),(61,25),(84,41),(114,27),(133,72),(145,46),(210,97),(240,57),(337,104)；

S22、选取CSPDarknet53作为船舶特征提取网络模型，并采用残差网络的跳跃连接机制来降低特征冗余；

S23、通过加载PascalVOC数据集上预训练的权重来进行迁移学习，使用YOLOv4算法训练船舶分类检测识别网络模型，优化学习得到船舶分类检测识别网络模型。

4.根据权利要求3所述的一种基于深度学习的内河航道船舶检测与识别方法，其特征在于：在步骤S21中，聚类过程中距离的衡量公式为：d(box,center)＝1-IOU(box,center)，其中d(box,center)是聚类后船舶样本标签的目标边界框与聚类中心之间的距离，IOU(box,center)是样本标签的目标边界框与聚类中心的交并比。

5.根据权利要求4所述的一种基于深度学习的内河航道船舶检测与识别方法，其特征在于：在步骤S22中，船舶特征提取网络模型包括用于提取船舶特征信息的卷积层以及残差网络，残差网络采用跳跃连接方式，在卷积层中，提取船舶特征信息所应用到的矩阵如下：

其中，

代表的是在第b层网络中与第a个输出之间的对应关系；f是第b层网络的激活函数；

指代的是第b-1个卷积网络层所对的第t个船体映射；

是指在b层网络对应的第a个船体特征偏置。

6.根据权利要求5所述的一种基于深度学习的内河航道船舶检测与识别方法，其特征在于：在步骤S23中，使用YOLOv4算法训练船舶分类检测识别网络模型的步骤如下：

S231、利用迁移学习的模型参数赋予YOLOv4算法初值，训练时采用Mosaic数据增强处理，每次读取四张图片，丰富检测物体的背景，分别对四张图片进行翻转，缩放以及色域变换，将图片进行放置，分别对应四张分割图片的位置；

S232、通过标签平滑对分类准确率做出惩罚；

S233、计算预测框与真实框之间的位置、置信度以及类别损失；