CN111695638A

CN111695638A - 一种改进的YOLOv3候选框加权融合选取策略

Info

Publication number: CN111695638A
Application number: CN202010550745.0A
Authority: CN
Inventors: 张红; 李建华; 徐志刚; 曹洁; 任伟
Original assignee: Lanzhou University of Technology
Current assignee: Lanzhou University of Technology
Priority date: 2020-06-16
Filing date: 2020-06-16
Publication date: 2020-09-22

Abstract

本发明公开了一种改进的YOLOv3候选框加权融合选取策略，属于智能优化算法技术领域。本发明中算法五和算法六对比NMS改进算法，多个类别的单一查准率提高了0.9％～14.1％，多类别平均查准率提高了3.1％～6.5％。这两种算法性能相当，并且对比传统的算法均有明显的优势。本发明提出的算法五和算法六的曲线几乎能重叠。本发明提出的候选框融合算法在查准率与查全率之间的博弈关系中，能在保证查全率的前提下将查准率大幅提升。本发明提出的候选框融合算法在单一类别平均检测精确度AP值、多类别平均检测精度mAP值、P‑R曲线的综合性能上完全超越了NMS改进算法，能更准确的完成目标检测任务。

Description

一种改进的YOLOv3候选框加权融合选取策略

技术领域

本发明属于智能优化算法技术领域，具体涉及一种改进的YOLOv3候选框加权融合选取策略。

背景技术

目标检测是计算机视觉领域的热门研究方向，广泛应用于工业检测、智能导航、视频监控等诸多领域。随着机器学习方法的研究，尤其是深度学习的兴起，以Faster-RCNN、YOLO、SSD为首的一系列深度卷积神经网络，在目标检测方向上取得了较好的研究成果。相比于传统的目标检测方法，这些方法在检测精度和速度上均有显著提升。

目前，检测焦点主要集中于神经网络的结构改进，对于目标检测算法的后处理阶段缺乏合理的改进方法。由于现有性能最好的目标检测算法往往是由几十上百层的神经网络结构组成，在算法结构上的改进需要很长的时间才能得到实验结果。如果有一个整体的模块能提升算法性能，并且不需要重新训练网络参数，那么这将大幅提升实验效率，也将被广泛应用。为此本发明将在神经网络的后处理阶段提出候选框融合算法以替代传统的非极大值抑制算法。

基于神经网络的目标检测算法，在经过神经网络处理后的图像会生成成百上千个候选框以及对应的类别置信度，传统的非极大值抑制算法是依据候选框之间的重叠度选择出局部极大值候选框，抑制非极大值候选框，最后得到目标定位框。该算法对于密集目标的图像容易将目标框误判为非极大值候选框进行删除。并且，只能处理神经网络检测出的已有候选框，当神经网络检测的候选框都不准确时，传统的算法无法调整极大值候选框的位置。针对以上问题，本发明提出了候选框融合算法，旨在选择相对最优候选框的同时通过冗余框的复用和融合将其调整为一个绝对最优的候选框，用以解决神经网络检测效果不佳的问题。

发明内容

本发明的目的在于提供一种用以解决神经网络检测效果不佳的改进的YOLOv3候选框加权融合选取策略。

一种改进的YOLOv3候选框加权融合选取策略，包括如下步骤：

1)将候选框按类别分组，取每个类别中局部极大值候选框记作Bk＝[x1,y1,x2,y2]及其置信度记作s，其中[x1,y1]和[x2,y2]分别表示候选框的左上角及右下角坐标；

2)取与极大值候选框重叠度大于预定阈值N_t的n个冗余框集合记作C＝{C₁,C₂,..,C_i,..,C_n}及其相对应的类别置信度集合记作S＝{s₁,s₂,..,s_i,..,s_n}，计算出每个候选框的融合权值；

3)将YOLOv3模型与传统NMS算法结合，通过在COCO数据集上训练，预置初始学习率和衰减系数，采用Adam使神经网络达到收敛，通过将训练数据集图像旋转或增强对比度两种方式扩充训练集数量；

4)将各个算法单独与YOLOv3模型结合运行，通过在COCO验证集上调整参数寻找到使其检测精度参数值。

进一步地，所述C1＝[x1,y1,x2,y2]。

进一步地，所述初始学习率和衰减系数分别为0.001和0.0005。

进一步地，所述算法包括高斯算法、线性算法、算法一、算法二、算法三、算法四、算法五和算法六。

本发明的有益效果是：

1)本发明中算法五和算法六对比NMS改进算法，多个类别的单一查准率提高了0.9％～14.1％，多类别平均查准率提高了3.1％～6.5％。这两种算法性能相当，并且对比传统的算法均有明显的优势。

2)本发明提出的算法五和算法六的曲线几乎能重叠。本发明提出的候选框融合算法在查准率与查全率之间的博弈关系中，能在保证查全率的前提下将查准率大幅提升。

3)本发明提出的候选框融合算法在单一类别平均检测精确度AP值、多类别平均检测精度mAP值、P-R曲线的综合性能上完全超越了NMS改进算法，能更准确的完成目标检测任务。

附图说明

图1为本发明多类别平均查准率mAP值对比图。

图2为本发明算法P-R曲线对比图。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。

实施例1：

基于候选框加权融合的YOLOv3目标检测算法，包括如下步骤：

2)取与极大值候选框重叠度大于预定阈值N_t的n个冗余框集合记作C＝{C₁,C₂,..,C_i,..,C_n}及其相对应的类别置信度集合记作S＝{s₁,s₂,..,s_i,..,s_n}，计算出每个候选框的融合权值；所述C1＝[x1,y1,x2,y2]。

3)将YOLOv3模型与传统NMS算法结合，通过在COCO数据集上训练，预置初始学习率和衰减系数，采用Adam使神经网络达到收敛，通过将训练数据集图像旋转或增强对比度两种方式扩充训练集数量；所述初始学习率和衰减系数分别为0.001和0.0005。

4)将各个算法单独与YOLOv3模型结合运行，通过在COCO验证集上调整参数寻找到使其检测精度参数值。所述算法包括高斯算法、线性算法、算法一、算法二、算法三、算法四、算法五和算法六。

本发明以NMS改进算法作为对比实验，首先将YOLOv3模型与传统NMS算法结合，通过在COCO数据集上训练，预置初始学习率和衰减系数分别为0.001和0.0005，采用Adam优化器优化参数使神经网络达到收敛，通过将训练数据集图像旋转或增强对比度等方式扩充训练集数量。然后将各个算法单独与YOLOv3模型结合运行，通过在COCO验证集上调整参数寻找到使其检测精度最高的参数值，实验所得最佳参数值如表1所示，其中Soft-NMS算法的两类高斯惩罚函数与线性惩罚函数分别记为高斯和线性，类别置信度阈值记为Thres，与极大值候选框的重叠度IoU阈值记为Nt。最后，在各个算法取最佳参数时对比每个算法各项性能指标。

实验结果分析

为充分验证候选框融合算法的可行性，本文将通过对比实验结果分析说明。每个算法在COCO数据集内检测的80个类别中随机选取10个类别的查准率AP值，以及数据集内多个类别的平均查准率mAP值用作算法性能对比，实验结果如表2、图1所示。

由表2可知，算法五和算法六对比NMS改进算法，多个类别的单一查准率提高了0.9％～14.1％，多类别平均查准率提高了3.1％～6.5％。而本发明提出的候选框融合算法五和算法六，由于算法计算上的差异性，无论是单一类别还是多个类别的平均查准率相差在范围1以内，这种微小的差异在目标检测评价中可以认为这两种算法性能相当，并且对比传统的算法均有明显的优势。

由以上实验结果及数据分析可知在传统NMS改进算法中，高斯惩罚函数与算法四的性能相对较好。为验证算法的查全率性能，随机选取四种类别Bicycle、Bus、Diningtable和Surfboard，在这四种类别中对比这两种算法与本发明提出的候选框融合算法的P-R曲线，算法对比结果如图2所示。

本发明提出的候选框融合算法在随机选取的四种类别上验证，其P-R曲线能将其他算法完全包围住，且本发明提出的算法五和算法六的曲线几乎能重叠。本发明提出的候选框融合算法在查准率与查全率之间的博弈关系中，能在保证查全率的前提下将查准率大幅提升。

综上实验结果表明，本发明提出的候选框融合算法在单一类别平均检测精确度AP值、多类别平均检测精度mAP值、P-R曲线的综合性能上完全超越了NMS改进算法，能更准确的完成目标检测任务。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种改进的YOLOv3候选框加权融合选取策略，其特征在于所述包括如下步骤：

2.根据权利要求1所述的一种改进的YOLOv3候选框加权融合选取策略，其特征在于所述C1＝[x1,y1,x2,y2]。

3.根据权利要求1所述的一种改进的YOLOv3候选框加权融合选取策略，其特征在于所述初始学习率和衰减系数分别为0.001和0.0005。

4.根据权利要求1所述的一种改进的YOLOv3候选框加权融合选取策略，其特征在于所述算法包括高斯算法、线性算法、算法一、算法二、算法三、算法四、算法五和算法六。