CN109272060B

CN109272060B - 一种基于改进的darknet神经网络进行目标检测的方法和系统

Info

Publication number: CN109272060B
Application number: CN201811036910.XA
Authority: CN
Inventors: 舒军; 吴柯; 李鑫武; 涂杏; 沈开斌; 蒋明威; 杨露; 舒心怡; 潘健; 王淑青; 陈张言; 徐成鸿; 李志魁; 刘伟
Original assignee: Hubei University of Technology
Current assignee: Wuhan Yichuang Zhilian Information Technology Co ltd
Priority date: 2018-09-06
Filing date: 2018-09-06
Publication date: 2021-04-16
Anticipated expiration: 2038-09-06
Also published as: CN109272060A

Abstract

本发明提出的一种基于改进的darknet神经网络进行目标检测的方法和系统，包括：采用固定相机连续获取训练样本图像，并对训练样本中的检测目标进行边框和类别的标注；通过旋转角度、调整饱和度、调整曝光量、调整色调来生成更多训练样本；基于改进的darknet神经网络构造图像检测模型；利用上述检测模型训练样本图像，并设置检测模型训练时的学习率及迭代次数，输出指定通道数的像素特征图片；每迭代一定次数保存相应的检测模型，直到指定迭代次数终止，并利用最终的检测模型进行相关图像目标检测。本发明对更加细微的物体有更好的识别度，提高图像保真度并改善了群体目标检测时的遮挡漏检情况。

Description

一种基于改进的darknet神经网络进行目标检测的方法和系统

技术领域

本发明属于深度学习领域，涉及一种目标检测方法，尤其涉及一种基于改进的darknet神经网络进行目标检测的方法和系统。

背景技术

随着机器学习的发展，基于深度学习来进行目标检测的技术越来越成熟。为了适应工业上的需求，现有电箱的开关检测算法中，用作特征模型的样本图像常采用固定相机连续抓取来获得，对于拍摄采集到的部分样本图片，如果检测的目标在整个图像中所占的面积区域非常的少，这会引发一个很大的问题：在改进之前的darknet神经网络结构中，卷积神经网络采取了大量的池化操作，其中下采样因子为32，输入一张416×416像素的图片最终会生成13×13的预测栅格，如果训练样本的目标区域在整个图像中所占很少的区域或像素，即检测的目标在图像中的像素数小于32时，这将会导致检测模型的误检或漏检。

现有的darknet神经网络结构有32层，经过一系列卷积和池化，将26×26分辨率的输出层特征与13×13分辨率的输出层特征整合，最后对输出预测和分类，其对小目标的检测效果仍存在不足，且对群体目标的检测存在一定程度的遮挡漏检。

发明内容

本发明主要是解决现有技术所存在的因检测目标在图像中占比很小导致的技术问题；提供了一种改进的darknet神经网络架构，对于图片的输入，以电箱开关的检测图片为例，如图1，输入的测试图像像素降采样到416×416，13×13的栅格难以将目标全部分辨出来，而26×26的栅格则允许探测器得到更精细的特征，其中每个栅格包含更多检测的开关的像素，更加易于特征的识别，同时网络结构对52×52分辨率的输出的特征与26×26分辨率的输出进行整合输出，为了进一步提高小对象的保真度，对原网络中的52×52输出特征层直接连接到最后一层探测器，有效的改善了高清图像中的细微目标检测准确度，对于检测群体目标聚在一起时造成的漏检问题也有明显的改善。

本发明提出的一种基于改进的darknet神经网络进行目标检测的方法，包括如下步骤：

步骤1，采用固定相机连续获取训练样本图像，并对训练样本中的检测目标进行边框和类别的标注；

步骤2，通过旋转角度、调整饱和度、调整曝光量、调整色调来生成更多训练样本；

步骤3，基于改进的darknet神经网络构造图像检测模型，该检测模型包括依次连接的卷积层、池化层、卷积层、池化层、卷积块(1)、池化层、卷积块(2)、池化层和卷积块(3)，然后复制卷积块(2)中的最后一层的输出，分别输入到路由层(1)和路由层(2)中，将卷积块(3)最后一层的输出和路由层(1)的输出依次输入到整合层和卷积块(4)中，路由层(2)的输出输入到卷积块(5)中，最终将卷积块(4)和卷积块(5)输入到分类层，所述卷积块(1)-(5)均包括多个卷积层；

步骤4，利用步骤3中的检测模型训练样本图像，并设置检测模型训练时的学习率及迭代次数，输出指定通道数的像素特征图片，对图像分类输出检测模型的权重、损失率、准确率；

步骤5，每迭代一定次数保存相应的检测模型，直到指定迭代次数终止，并利用最终的检测模型进行相关图像目标检测。

进一步的，所述卷积块(1)和卷积块(2)分别包括3个卷积层，卷积块(3)包括7个卷积层，卷积块(4)和卷积块(5)分别包括2个卷积层。

本发明还提供一种基于改进的darknet神经网络进行目标检测的系统，包括如下模块，

样本获取模块，用于采用固定相机连续获取训练样本图像，并对训练样本中的检测目标进行边框和类别的标注；

样本处理模块，用于通过旋转角度、调整饱和度、调整曝光量、调整色调来生成更多训练样本；

检测模型构建模块，用于基于改进的darknet神经网络构造图像检测模型，该检测模型包括依次连接的卷积层、池化层、卷积层、池化层、卷积块(1)、池化层、卷积块(2)、池化层和卷积块(3)，然后复制卷积块(2)中的最后一层的输出，分别输入到路由层(1)和路由层(2)中，将卷积块(3)最后一层的输出和路由层(1)的输出依次输入到整合层和卷积块(4)中，路由层(2)的输出输入到卷积块(5)中，最终将卷积块(4)和卷积块(5)输入到分类层，所述卷积块(1)-(5)均包括多个卷积层；

检测模型训练模块，用于利用检测模型构建模块中的检测模型训练样本图像，并设置检测模型训练时的学习率及迭代次数，输出指定通道数的像素特征图片，对图像分类输出检测模型的权重、损失率、准确率；

目标检测模块，用于每迭代一定次数保存相应的检测模型，直到指定迭代次数终止，并利用最终的检测模型进行相关图像目标检测。

与改进前的网络结构相比，改进后的darknet神经网络在预测目标时将从更加细密的26×26的栅格中提取目标特征，对更加细微的物体有更好的识别度；改进后对52×52分辨率的特征分别进行整合和直接输出，提高图像保真度并改善了群体目标检测时的遮挡漏检情况。

附图说明

图1是本发明实施例的栅格效果说明图。

图2是本发明实施例的流程图。

图3是本发明实施例中改进后的darknet神经网络架构图。

具体实施方式

下面通过实施例，并结合附图，对本发明的技术方案作进一步具体的说明，应当理解的是，此处所描述的实施示例仅用于说明和解释本发明，并不用与限定本发明。

请见图2，本发明提供的一种基于改进的darknet神经网络进行目标检测的方法，包括以下步骤：

步骤1：读取本地图片；

本实施例以电箱开关的检测图片为例，首先载入2万张标注好边框和类别的本地样本图片；

步骤2：生成批次，打乱样本载入顺序；

按照样本的顺序每32个为一批次，并通过旋转角度、调整饱和度、调整曝光量、调整色调来生成更多训练样本，以便增强图像识别模型的稳定性，本例中设置模型训练时的学习率为0.0001、迭代次数为45000；

步骤3：构造图像目标检测模型；

检测架构模型请见下表1：

表1目标检测架构模型

对于上表中的卷积块，其中包含矩阵所示的多个卷积层。

在分类层中，图像特征进行连接整合，提取到最终的26×26特征图对每个位置设置不同大小的先验框，使用anchor boxes策略，即使用特征图的一个中心点去预测这些物体的边界框，同时计算置信度；这样各个位置的anchor box都单独预测一套分类概率，最终将各个类别中概率大于0.5的边界框筛选出，取出概率值最高的边界框，以便后期显示在图形界面上。

必须注意的是，层数的序列从0开始计算，所有的卷积操作都对输入图像首先进行BN算法(标准化函数)处理，并使用LReLU激活函数输出。最终的通道数＝每个栅格的框数(默认为5)×(对象种类数+5)，本例的对象种类数为2，最终通道数35。

步骤4：根据卷积网络训练样本图像，对图像进行一系列卷积和下采样操作，输出指定通道数的像素特征图片，对图像分类输出网络的权重、损失率、准确率，方便直观地对检测过程和效果进行评估；

步骤5:每抵达100迭代次数为一间隔保存权重模型，迭代次数超过1000时每10000次保存一次训练的模型，这样我们得到多个权重模型，以免中途程序崩溃时重头训练，最终的权重模型用来做相关图像目标检测。

本实施例保存图像分类识别模型后结合opencv可进行软件界面可视化来识别新的图片。

本发明实施例还提供一种基于改进的darknet神经网络进行目标检测的系统，包括如下模块，

各模块与各步骤的实现方式相应，本发明不予撰述。

本文效果可通过以下实验来实现：

1.实验条件

在Ubuntu 16.04LTS系统上安装CUDA8.0及OpenCV3.3进行实验。

2.实验内容

将本文中采集到的2万张电箱开关图片利用软件labellmg对图像中的检测目标进行边框标注处理，制作为VOC数据集格式，共2个种类。将其作为样本图像经过本发明中提到的各个步骤，计算出平均准确率mAP及每秒传输速率FPS，将其与原有的框架YOLOv2和现有的主流框架Fast R-CNN、Faster R-CNN、SSD进行对比。

3.实验结果及分析

在训练结束之后，得到的实验结果数据如下表：

表2检测框架对比

可以看到在电箱开关制作的VOC数据集中，本文框架在达到一定平均精确度的情况下，处理速度也保持在较高的水平；与改进前对比，改进后的网络结构在速度上基本没有下降，平均精确度明显提升，说明其针对小目标的检测性能强，对于码头的船只检测及无人机高空对地目标等检测有一定参考意义。

本发明对30层的darknet神经网络架构进行了改进，为减少模型粗糙度适当减少了神经网络层数，加密了预测栅格的密度，并分出一个过渡层让探测器直接访问这个拓展的像素特征，使模型以更好地匹配小型预测目标，对密集的群体目标效果明显，并具备一定适用性。

应当理解的是，本说明书未详细阐述的部分均属于现有技术。

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代，但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims

1.一种基于改进的darknet神经网络进行目标检测的方法，其特征在于，包括如下步骤：

2.如权利要求1所述的一种基于改进的darknet神经网络进行目标检测的方法，其特征在于：所述卷积块(1)和卷积块(2)分别包括3个卷积层，卷积块(3)包括7个卷积层，卷积块(4)和卷积块(5)分别包括2个卷积层。

3.一种基于改进的darknet神经网络进行目标检测的系统，其特征在于，包括如下模块，

4.如权利要求3所述的一种基于改进的darknet神经网络进行目标检测的系统，其特征在于：所述卷积块(1)和卷积块(2)分别包括3个卷积层，卷积块(3)包括7个卷积层，卷积块(4)和卷积块(5)分别包括2个卷积层。