CN111695638A - 一种改进的YOLOv3候选框加权融合选取策略 - Google Patents

一种改进的YOLOv3候选框加权融合选取策略 Download PDF

Info

Publication number
CN111695638A
CN111695638A CN202010550745.0A CN202010550745A CN111695638A CN 111695638 A CN111695638 A CN 111695638A CN 202010550745 A CN202010550745 A CN 202010550745A CN 111695638 A CN111695638 A CN 111695638A
Authority
CN
China
Prior art keywords
algorithm
candidate
improved
yolov3
candidate box
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010550745.0A
Other languages
English (en)
Inventor
张红
李建华
徐志刚
曹洁
任伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lanzhou University of Technology
Original Assignee
Lanzhou University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lanzhou University of Technology filed Critical Lanzhou University of Technology
Priority to CN202010550745.0A priority Critical patent/CN111695638A/zh
Publication of CN111695638A publication Critical patent/CN111695638A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种改进的YOLOv3候选框加权融合选取策略,属于智能优化算法技术领域。本发明中算法五和算法六对比NMS改进算法,多个类别的单一查准率提高了0.9%~14.1%,多类别平均查准率提高了3.1%~6.5%。这两种算法性能相当,并且对比传统的算法均有明显的优势。本发明提出的算法五和算法六的曲线几乎能重叠。本发明提出的候选框融合算法在查准率与查全率之间的博弈关系中,能在保证查全率的前提下将查准率大幅提升。本发明提出的候选框融合算法在单一类别平均检测精确度AP值、多类别平均检测精度mAP值、P‑R曲线的综合性能上完全超越了NMS改进算法,能更准确的完成目标检测任务。

Description

一种改进的YOLOv3候选框加权融合选取策略
技术领域
本发明属于智能优化算法技术领域,具体涉及一种改进的YOLOv3候选框加权融合选取策略。
背景技术
目标检测是计算机视觉领域的热门研究方向,广泛应用于工业检测、智能导航、视频监控等诸多领域。随着机器学习方法的研究,尤其是深度学习的兴起,以Faster-RCNN、YOLO、SSD为首的一系列深度卷积神经网络,在目标检测方向上取得了较好的研究成果。相比于传统的目标检测方法,这些方法在检测精度和速度上均有显著提升。
目前,检测焦点主要集中于神经网络的结构改进,对于目标检测算法的后处理阶段缺乏合理的改进方法。由于现有性能最好的目标检测算法往往是由几十上百层的神经网络结构组成,在算法结构上的改进需要很长的时间才能得到实验结果。如果有一个整体的模块能提升算法性能,并且不需要重新训练网络参数,那么这将大幅提升实验效率,也将被广泛应用。为此本发明将在神经网络的后处理阶段提出候选框融合算法以替代传统的非极大值抑制算法。
基于神经网络的目标检测算法,在经过神经网络处理后的图像会生成成百上千个候选框以及对应的类别置信度,传统的非极大值抑制算法是依据候选框之间的重叠度选择出局部极大值候选框,抑制非极大值候选框,最后得到目标定位框。该算法对于密集目标的图像容易将目标框误判为非极大值候选框进行删除。并且,只能处理神经网络检测出的已有候选框,当神经网络检测的候选框都不准确时,传统的算法无法调整极大值候选框的位置。针对以上问题,本发明提出了候选框融合算法,旨在选择相对最优候选框的同时通过冗余框的复用和融合将其调整为一个绝对最优的候选框,用以解决神经网络检测效果不佳的问题。
发明内容
本发明的目的在于提供一种用以解决神经网络检测效果不佳的改进的YOLOv3候选框加权融合选取策略。
一种改进的YOLOv3候选框加权融合选取策略,包括如下步骤:
1)将候选框按类别分组,取每个类别中局部极大值候选框记作Bk=[x1,y1,x2,y2]及其置信度记作s,其中[x1,y1]和[x2,y2]分别表示候选框的左上角及右下角坐标;
2)取与极大值候选框重叠度大于预定阈值Nt的n个冗余框集合记作C={C1,C2,..,Ci,..,Cn}及其相对应的类别置信度集合记作S={s1,s2,..,si,..,sn},计算出每个候选框的融合权值;
3)将YOLOv3模型与传统NMS算法结合,通过在COCO数据集上训练,预置初始学习率和衰减系数,采用Adam使神经网络达到收敛,通过将训练数据集图像旋转或增强对比度两种方式扩充训练集数量;
4)将各个算法单独与YOLOv3模型结合运行,通过在COCO验证集上调整参数寻找到使其检测精度参数值。
进一步地,所述C1=[x1,y1,x2,y2]。
进一步地,所述初始学习率和衰减系数分别为0.001和0.0005。
进一步地,所述算法包括高斯算法、线性算法、算法一、算法二、算法三、算法四、算法五和算法六。
本发明的有益效果是:
1)本发明中算法五和算法六对比NMS改进算法,多个类别的单一查准率提高了0.9%~14.1%,多类别平均查准率提高了3.1%~6.5%。这两种算法性能相当,并且对比传统的算法均有明显的优势。
2)本发明提出的算法五和算法六的曲线几乎能重叠。本发明提出的候选框融合算法在查准率与查全率之间的博弈关系中,能在保证查全率的前提下将查准率大幅提升。
3)本发明提出的候选框融合算法在单一类别平均检测精确度AP值、多类别平均检测精度mAP值、P-R曲线的综合性能上完全超越了NMS改进算法,能更准确的完成目标检测任务。
附图说明
图1为本发明多类别平均查准率mAP值对比图。
图2为本发明算法P-R曲线对比图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
实施例1:
基于候选框加权融合的YOLOv3目标检测算法,包括如下步骤:
1)将候选框按类别分组,取每个类别中局部极大值候选框记作Bk=[x1,y1,x2,y2]及其置信度记作s,其中[x1,y1]和[x2,y2]分别表示候选框的左上角及右下角坐标;
2)取与极大值候选框重叠度大于预定阈值Nt的n个冗余框集合记作C={C1,C2,..,Ci,..,Cn}及其相对应的类别置信度集合记作S={s1,s2,..,si,..,sn},计算出每个候选框的融合权值;所述C1=[x1,y1,x2,y2]。
3)将YOLOv3模型与传统NMS算法结合,通过在COCO数据集上训练,预置初始学习率和衰减系数,采用Adam使神经网络达到收敛,通过将训练数据集图像旋转或增强对比度两种方式扩充训练集数量;所述初始学习率和衰减系数分别为0.001和0.0005。
4)将各个算法单独与YOLOv3模型结合运行,通过在COCO验证集上调整参数寻找到使其检测精度参数值。所述算法包括高斯算法、线性算法、算法一、算法二、算法三、算法四、算法五和算法六。
本发明以NMS改进算法作为对比实验,首先将YOLOv3模型与传统NMS算法结合,通过在COCO数据集上训练,预置初始学习率和衰减系数分别为0.001和0.0005,采用Adam优化器优化参数使神经网络达到收敛,通过将训练数据集图像旋转或增强对比度等方式扩充训练集数量。然后将各个算法单独与YOLOv3模型结合运行,通过在COCO验证集上调整参数寻找到使其检测精度最高的参数值,实验所得最佳参数值如表1所示,其中Soft-NMS算法的两类高斯惩罚函数与线性惩罚函数分别记为高斯和线性,类别置信度阈值记为Thres,与极大值候选框的重叠度IoU阈值记为Nt。最后,在各个算法取最佳参数时对比每个算法各项性能指标。
Figure BDA0002542421790000041
实验结果分析
为充分验证候选框融合算法的可行性,本文将通过对比实验结果分析说明。每个算法在COCO数据集内检测的80个类别中随机选取10个类别的查准率AP值,以及数据集内多个类别的平均查准率mAP值用作算法性能对比,实验结果如表2、图1所示。
Figure BDA0002542421790000051
由表2可知,算法五和算法六对比NMS改进算法,多个类别的单一查准率提高了0.9%~14.1%,多类别平均查准率提高了3.1%~6.5%。而本发明提出的候选框融合算法五和算法六,由于算法计算上的差异性,无论是单一类别还是多个类别的平均查准率相差在范围1以内,这种微小的差异在目标检测评价中可以认为这两种算法性能相当,并且对比传统的算法均有明显的优势。
由以上实验结果及数据分析可知在传统NMS改进算法中,高斯惩罚函数与算法四的性能相对较好。为验证算法的查全率性能,随机选取四种类别Bicycle、Bus、Diningtable和Surfboard,在这四种类别中对比这两种算法与本发明提出的候选框融合算法的P-R曲线,算法对比结果如图2所示。
本发明提出的候选框融合算法在随机选取的四种类别上验证,其P-R曲线能将其他算法完全包围住,且本发明提出的算法五和算法六的曲线几乎能重叠。本发明提出的候选框融合算法在查准率与查全率之间的博弈关系中,能在保证查全率的前提下将查准率大幅提升。
综上实验结果表明,本发明提出的候选框融合算法在单一类别平均检测精确度AP值、多类别平均检测精度mAP值、P-R曲线的综合性能上完全超越了NMS改进算法,能更准确的完成目标检测任务。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种改进的YOLOv3候选框加权融合选取策略,其特征在于所述包括如下步骤:
1)将候选框按类别分组,取每个类别中局部极大值候选框记作Bk=[x1,y1,x2,y2]及其置信度记作s,其中[x1,y1]和[x2,y2]分别表示候选框的左上角及右下角坐标;
2)取与极大值候选框重叠度大于预定阈值Nt的n个冗余框集合记作C={C1,C2,..,Ci,..,Cn}及其相对应的类别置信度集合记作S={s1,s2,..,si,..,sn},计算出每个候选框的融合权值;
3)将YOLOv3模型与传统NMS算法结合,通过在COCO数据集上训练,预置初始学习率和衰减系数,采用Adam使神经网络达到收敛,通过将训练数据集图像旋转或增强对比度两种方式扩充训练集数量;
4)将各个算法单独与YOLOv3模型结合运行,通过在COCO验证集上调整参数寻找到使其检测精度参数值。
2.根据权利要求1所述的一种改进的YOLOv3候选框加权融合选取策略,其特征在于所述C1=[x1,y1,x2,y2]。
3.根据权利要求1所述的一种改进的YOLOv3候选框加权融合选取策略,其特征在于所述初始学习率和衰减系数分别为0.001和0.0005。
4.根据权利要求1所述的一种改进的YOLOv3候选框加权融合选取策略,其特征在于所述算法包括高斯算法、线性算法、算法一、算法二、算法三、算法四、算法五和算法六。
CN202010550745.0A 2020-06-16 2020-06-16 一种改进的YOLOv3候选框加权融合选取策略 Pending CN111695638A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010550745.0A CN111695638A (zh) 2020-06-16 2020-06-16 一种改进的YOLOv3候选框加权融合选取策略

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010550745.0A CN111695638A (zh) 2020-06-16 2020-06-16 一种改进的YOLOv3候选框加权融合选取策略

Publications (1)

Publication Number Publication Date
CN111695638A true CN111695638A (zh) 2020-09-22

Family

ID=72481623

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010550745.0A Pending CN111695638A (zh) 2020-06-16 2020-06-16 一种改进的YOLOv3候选框加权融合选取策略

Country Status (1)

Country Link
CN (1) CN111695638A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113963329A (zh) * 2021-10-11 2022-01-21 浙江大学 一种基于双阶段卷积神经网络的数字类交通标志检测识别方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108830188A (zh) * 2018-05-30 2018-11-16 西安理工大学 基于深度学习的车辆检测方法
CN109447034A (zh) * 2018-11-14 2019-03-08 北京信息科技大学 基于YOLOv3网络的自动驾驶中交通标识检测方法
CN109977952A (zh) * 2019-03-27 2019-07-05 深动科技(北京)有限公司 基于局部最大值的候选目标检测方法
CN109977818A (zh) * 2019-03-14 2019-07-05 上海极链网络科技有限公司 一种基于空间特征和多目标检测的动作识别方法及系统
CN110059554A (zh) * 2019-03-13 2019-07-26 重庆邮电大学 一种基于交通场景的多支路目标检测方法
WO2020062804A1 (zh) * 2018-09-25 2020-04-02 平安科技(深圳)有限公司 自然场景中行驶证拍照影像的识别方法、装置及电子设备
CN111062282A (zh) * 2019-12-05 2020-04-24 武汉科技大学 基于改进yolov3模型的变电站指针式仪表识别方法
CN111241931A (zh) * 2019-12-30 2020-06-05 沈阳理工大学 一种基于YOLOv3的空中无人机目标识别和跟踪方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108830188A (zh) * 2018-05-30 2018-11-16 西安理工大学 基于深度学习的车辆检测方法
WO2020062804A1 (zh) * 2018-09-25 2020-04-02 平安科技(深圳)有限公司 自然场景中行驶证拍照影像的识别方法、装置及电子设备
CN109447034A (zh) * 2018-11-14 2019-03-08 北京信息科技大学 基于YOLOv3网络的自动驾驶中交通标识检测方法
CN110059554A (zh) * 2019-03-13 2019-07-26 重庆邮电大学 一种基于交通场景的多支路目标检测方法
CN109977818A (zh) * 2019-03-14 2019-07-05 上海极链网络科技有限公司 一种基于空间特征和多目标检测的动作识别方法及系统
CN109977952A (zh) * 2019-03-27 2019-07-05 深动科技(北京)有限公司 基于局部最大值的候选目标检测方法
CN111062282A (zh) * 2019-12-05 2020-04-24 武汉科技大学 基于改进yolov3模型的变电站指针式仪表识别方法
CN111241931A (zh) * 2019-12-30 2020-06-05 沈阳理工大学 一种基于YOLOv3的空中无人机目标识别和跟踪方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHENCHEN XU 等: "Fast Vehicle and Pedestrian Detection Using Improved Mask R-CNN", 《MATHEMATICAL PROBLEMS IN ENGINEERING》 *
王乃洲 等: "基于Diou-Yolov3的车型检测", 《电子技术与软件工程》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113963329A (zh) * 2021-10-11 2022-01-21 浙江大学 一种基于双阶段卷积神经网络的数字类交通标志检测识别方法

Similar Documents

Publication Publication Date Title
CN107392919B (zh) 基于自适应遗传算法的灰度阈值获取方法、图像分割方法
CN113486764B (zh) 一种基于改进的YOLOv3的坑洼检测方法
CN107169557A (zh) 一种对布谷鸟优化算法进行改进的方法
CN113573322B (zh) 基于改进遗传算法的多目标区域传感器网络覆盖优化方法
CN109931943B (zh) 无人船舶全局路径规划方法及电子设备
CN112507896B (zh) 一种采用改进的yolo-v4模型对樱桃果实进行检测的方法
CN105469118B (zh) 基于核函数的融合主动学习和非参半监督聚类的稀有类别检测方法
CN112465160A (zh) 一种基于vr的车辆维修保养辅助系统
CN109784358A (zh) 一种融合人工特征和深度特征的无参考图像质量评价方法
CN111768354A (zh) 基于多尺度人脸部位特征字典的人脸图像复原系统
CN113052254A (zh) 多重注意力幽灵残差融合分类模型及其分类方法
CN114626435A (zh) 一种高准确率的滚动轴承智能故障特征选择方法
CN111695638A (zh) 一种改进的YOLOv3候选框加权融合选取策略
CN114708479B (zh) 一种基于图结构和特征的自适应防御方法
CN112165401A (zh) 一种基于网络剪枝和局部社区扩展的边社区发现算法
CN110349176B (zh) 基于三重卷积网络和感知干扰学习的目标跟踪方法和系统
CN108564116A (zh) 一种摄像头场景图像的成分智能分析方法
CN111626160A (zh) 一种基于区域式渐进校准网络的角度变化下人脸检测方法
CN109308496A (zh) 一种基于模糊聚类迭代与投影寻踪的最优方案遴选方法
CN115294380A (zh) 一种用于深度学习目标检测的动态训练方法
CN111950635B (zh) 一种基于分层特征对齐的鲁棒特征学习方法
CN109741358A (zh) 基于自适应超图学习的超像素分割方法
CN115994891B (zh) 基于狼群算法的无人载具混凝土坝表面缺陷动态检测方法
CN117132802A (zh) 一种田间小麦病虫害识别方法、装置及存储介质
CN110992402A (zh) 基于特征融合的相关滤波目标跟踪方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination