CN113627491A - 基于改进的自适应Anchor生成的DK-YOLOv4模型 - Google Patents

基于改进的自适应Anchor生成的DK-YOLOv4模型 Download PDF

Info

Publication number
CN113627491A
CN113627491A CN202110803246.2A CN202110803246A CN113627491A CN 113627491 A CN113627491 A CN 113627491A CN 202110803246 A CN202110803246 A CN 202110803246A CN 113627491 A CN113627491 A CN 113627491A
Authority
CN
China
Prior art keywords
anchor
self
real
adaptive anchor
adaptive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110803246.2A
Other languages
English (en)
Inventor
杨晓雅
万冬厚
高辉
付苗苗
邓淼磊
张德贤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan University of Technology
Original Assignee
Henan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan University of Technology filed Critical Henan University of Technology
Priority to CN202110803246.2A priority Critical patent/CN113627491A/zh
Publication of CN113627491A publication Critical patent/CN113627491A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

传统的自适应Anchor生成方法中,对于目标检测框出现宽高比极端变化的情况,会造成的参数过多、收敛慢、不能有效体现目标真实框的宽高比分布进而严重影响小目标检测精度的问题,提出了一种提出了基于改进的自适应Anchor生成的DK‑YOLOv4目标检测模型。

Description

基于改进的自适应Anchor生成的DK-YOLOv4模型
技术领域
本发明目标检测技术领域,具体涉及到一种基于改进的自适应Anchor生成的DK-YOLOv4模型。
背景技术
Anchor机制是大多数目标检测算法中不可或缺的一环,其主要是对数据集中的样本真实边界框进行聚类或其他方式生成的一种预测边界框参考值,通过设置预定义的先验框可以很好的来表示待检测目标的原始状态,得到更合理的数据样本边界框潜在分布。高质量的Anchor在小目标检测和后处理预测过程中可以起到优化调节作用。针对目标检测框宽高比极端变化问题,提出一种基于改进的自适应Anchor生成算法并结合YOLOv4目标检测模型得到该发明的DK-YOLOv4模型。
发明内容
本发明旨在发明一种基于改进的自适应Anchor生成算法。
该算法的输入包括:真实框GT的数量Box={1,2,3…NP},gtwh为训练数据中的所有真实框的宽高,thr设置为宽高比的阈值,T设置为最佳可能召回率BPR的下限阈值,输出一个最优的自适应Anchor个体集合,本发明包括如下的技术方案:
(1)基于K-means++聚类自适应Anchor生成算法
输入:真实框GT的数量Box={1,2,3…N},Anchor聚类中心数量i,代表每一个真实框被选为下个聚类核心的概率区间
输出:K个自适应Anchor
1:从Box={1,2,3…N}中随机选取一个边界框作为初始聚类中心C1;
2:迭代选出剩下的K-1个聚类中心
for i in range(k-1)
3:
Figure BDA0003165451580000011
//每个边界框到聚类中心的距离
4:Sum_min_distance=min(SUM(distance_Box))
5:P=1-IoUB,C//真实框和聚类中心IoU越大,距离越短;
6:P=P+Sum_distance//越大该边界框作为下一个聚类中心的概率越大;
7:end for
8:将迭代选出K个边界框作为初始Anchor聚类中心C={C1,C2,....CK};
9:迭代选出最终的K个自适应Anchor
10:for j in range(Box)
11:对于所有真实框,用IoU作为Anchor框和边界框的度量,将其中任意边界框分派给与其距离最小的Anchor框;
12:计算每个聚类簇中所有真实目标框宽和高的均值,更新Anchor;
13:end for
14:end for
(2)基于差分进化的自适应Anchor生成算法
输入:真实框GT的数量i={1,2,3,…NP},变量维度D,rand是[0,1]之间的随机数,jrand是[1,D]之间的随机数,CR是交叉概率,F是缩放因子。
输出:最优的自适应Anchor个体集合Xi
1.生成初始化种群NP
2.评价初始种群NP中所有个体适应值
3.While生成的Anchor框并不是最优预设边界框do
4.for i=1to NP do
5.随机均匀选择r1≠r2≠r3≠i
6.L=0
7.Ui=Xi
8.repeat
9.Ui(j)=Xr1(j)+F×(Xr2(j)-Xr3(j))
10.jrand=(jrand+1)mod D
11.L=L+1
12.until rand[0,1)>CR or L>D
13.end for
14.for i=0to NP do
15.评价新个体Ui
16.if Ui优于Xi then
17.Xi=Ui
18.end if
19.end for
end
(3)基于K-means++聚类和差分进化相结合的自适应Anchor生成算法输入:真实框GT的数量Box={1,2,3…NP},gtwh为训练数据中的所有真实框的宽高,thr设置为宽高比的阈值,T设置为最佳可能召回率BPR的下限阈值输出:最优的自适应Anchor个体集合
1.使用算法1的K-means++聚类方法迭代生成9个Anchor;
2.计算9个Anchor的宽高值Anchorwh
3.计算gtwh和Anchorwh的比例值x,并将其统一至[0,1]的范围内;
4.计算最佳可能召回率BPR=mean(max(min(x))>thr);
5.if BPR>T then
6.直接将第1步中得到9个Anchor作为最优解保存;
7.else使用K-means++和DE算法进行Anchor重计算
8.for all Box={1,2,3…NP}do
9.按照算法2使用变异算子随机生成边界框;
10.计算变异边界框和Anchor的的交叉概率;
11.重计算样本个体的适应度函数值,选择最优值;
12.end for
13.使用K-means++生成9个Anchor;
14.重复第2步操作,直到得到最优的9个最适合的Anchor。
验证该算法的数据集是MS COCO2017数据集,包含有80个目标类别并且其图像上目标也更多,一共有118287张训练图片、5000张验证图片以及40670张图片,网络的训练参数如下:输入的图像尺寸大小为608×608,其初始学习率设置为0.0013,batch大小设置为64,mini-batch设置为4,动能和权重衰减分别设置为0.949以及0.0005。
本发明算法还在MS COCO2017数据集上进行了消融实验,在实验中设置目标框宽高比阈值thr为0.25,设置BPR下限阈值T为0.97。最后得到的9个Anchor值为[72,33],[78,46],[93,32],[123,50],[134,68],[137,55],[192,69],[184,82],[207,94]。
具体实验结果如表1所示,AP50代表IoU阈值为0.5的精度,AP75代表IoU阈值为0.75时的精度,APS代表小目标的精度,APM代表中等目标的精度,APL代表大目标的精度。从中可以看出在其他参数不变的情况下DE和K-means++结合的方法相对于原来的YOLOv4算法mAP有了0.3%的提升,在小目标和中等目标上分别有0.2%和0.6%的增长,这得益于改进自适应Anchor算法有效的覆盖了样本集中的边界框宽高比分布.
表1在MS COCO2017数据集上自适应Anchor生成改进算法的消融实验
Figure BDA0003165451580000041
附图说明
如附图所示,图1为聚类数K值与平均交并比关系图。
具体实施方式
本发明包括如下的技术方案:
(1)基于K-means++聚类自适应Anchor生成算法
输入:真实框GT的数量Box={1,2,3…N},Anchor聚类中心数量i,代表每一个真实框被选为下个聚类核心的概率区间
输出:K个自适应Anchor
1:从Box={1,2,3…N}中随机选取一个边界框作为初始聚类中心C1;
2:迭代选出剩下的K-1个聚类中心
for i in range(k-1)
3:
Figure BDA0003165451580000051
//每个边界框到聚类中心的距离
4:Sum_min_distance=min(SUM(distance_Box))
5:P=1-IoUB,C//真实框和聚类中心IoU越大,距离越短;
6:P=P+Sum_distance//越大该边界框作为下一个聚类中心的概率越大;
7:end for
8:将迭代选出K个边界框作为初始Anchor聚类中心C={C1,C2,....CK};
9:迭代选出最终的K个自适应Anchor
10:for j in range(Box)
11:对于所有真实框,用IoU作为Anchor框和边界框的度量,将其中任意边界框分派给与其距离最小的Anchor框;
12:计算每个聚类簇中所有真实目标框宽和高的均值,更新Anchor;
13:end for
14:end for
(2)基于差分进化的自适应Anchor生成算法
输入:真实框GT的数量i={1,2,3,…NP},变量维度D,rand是[0,1]之间的随机数,jrand是[1,D]之间的随机数,CR是交叉概率,F是缩放因子。
输出:最优的自适应Anchor个体集合Xi
20.生成初始化种群NP
21.评价初始种群NP中所有个体适应值
22.While生成的Anchor框并不是最优预设边界框do
23.for i=1to NP do
24.随机均匀选择r1≠r2≠r3≠i
25.L=0
26.Ui=Xi
27.repeat
28.Ui(j)=Xr1(j)+F×(Xr2(j)-Xr3(j))
29.jrand=(jrand+1)mod D
30.L=L+1
31.until rand[0,1)>CR or L>D
32.end for
33.for i=0to NP do
34.评价新个体Ui
35.if Ui优于Xi then
36.Xi=Ui
37.end if
38.end for
end
(3)基于K-means++聚类和差分进化相结合的自适应Anchor生成算法输入:真实框GT的数量Box={1,2,3…NP},gtwh为训练数据中的所有真实框的宽高,thr设置为宽高比的阈值,T设置为最佳可能召回率BPR的下限阈值输出:最优的自适应Anchor个体集合
15.使用算法1的K-means++聚类方法迭代生成9个Anchor;
16.计算9个Anchor的宽高值Anchorwh
17.计算gtwh和Anchorwh的比例值x,并将其统一至[0,1]的范围内;
18.计算最佳可能召回率BPR=mean(max(min(x))>thr);
19.if BPR>T then
20.直接将第1步中得到9个Anchor作为最优解保存;
21.else使用K-means++和DE算法进行Anchor重计算
22.for all Box={1,2,3…NP}do
23.按照算法2使用变异算子随机生成边界框;
24.计算变异边界框和Anchor的的交叉概率;
25.重计算样本个体的适应度函数值,选择最优值;
26.end for
27.使用K-means++生成9个Anchor;
28.重复第2步操作,直到得到最优的9个最适合的Anchor。
验证该算法的数据集是MS COCO2017数据集,包含有80个目标类别并且其图像上目标也更多,一共有118287张训练图片、5000张验证图片以及40670张图片,网络的训练参数如下:输入的图像尺寸大小为608×608,其初始学习率设置为0.0013,batch大小设置为64,mini-batch设置为4,动能和权重衰减分别设置为0.949以及0.0005。
本发明算法还在MS COCO2017数据集上进行了消融实验,在实验中设置目标框宽高比阈值thr为0.25,设置BPR下限阈值T为0.97。最后得到的9个Anchor值为[72,33],[78,46],[93,32],[123,50],[134,68],[137,55],[192,69],[184,82],[207,94]。
具体实验结果如表1所示,AP50代表IoU阈值为0.5的精度,AP75代表IoU阈值为0.75时的精度,APS代表小目标的精度,APM代表中等目标的精度,APL代表大目标的精度。从中可以看出在其他参数不变的情况下DE和K-means++结合的方法相对于原来的YOLOv4算法mAP有了0.3%的提升,在小目标和中等目标上分别有0.2%和0.6%的增长,这得益于改进自适应Anchor算法有效的覆盖了样本集中的边界框宽高比分布.
表1在MS COCO2017数据集上自适应Anchor生成改进算法的消融实验
Figure BDA0003165451580000081

Claims (1)

1.针对目标检测框宽高比极端变化问题,提出一种基于改进的自适应Anchor生成算法并结合YOLOv4目标检测模型得到该发明的DK-YOLOv4模型;该模型的技术方案如下:
(1)基于K-means++聚类自适应Anchor生成算法
输入:真实框GT的数量Box={1,2,3…N},Anchor聚类中心数量i,代表每一个真实框被选为下个聚类核心的概率区间
输出:K个自适应Anchor
Figure FDA0003165451570000011
(2)基于差分进化的自适应Anchor生成算法
输入:真实框GT的数量i={1,2,3,…NP},变量维度D,rand是[0,1]之间的随机数,jrand是[1,D]之间的随机数,CR是交叉概率,F是缩放因子;
输出:最优的自适应Anchor个体集合Xi
Figure FDA0003165451570000021
(3)基于K-means++聚类和差分进化相结合的自适应Anchor生成算法输入:真实框GT的数量Box={1,2,3…NP},gtwh为训练数据中的所有真实框的宽高,thr设置为宽高比的阈值,T设置为最佳可能召回率BPR的下限阈值输出:最优的自适应Anchor个体集合
Figure FDA0003165451570000031
使用本发明所用的方法实现Anchor生成,DK-YOLOv4模型在MSCOCO2017数据集上相对于原来的YOLOv4算法mAP有了0.3%的提升,在小目标和中等目标上分别有0.2%和0.6%的增长,验证了本发明的有效性。
CN202110803246.2A 2021-07-15 2021-07-15 基于改进的自适应Anchor生成的DK-YOLOv4模型 Pending CN113627491A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110803246.2A CN113627491A (zh) 2021-07-15 2021-07-15 基于改进的自适应Anchor生成的DK-YOLOv4模型

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110803246.2A CN113627491A (zh) 2021-07-15 2021-07-15 基于改进的自适应Anchor生成的DK-YOLOv4模型

Publications (1)

Publication Number Publication Date
CN113627491A true CN113627491A (zh) 2021-11-09

Family

ID=78379885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110803246.2A Pending CN113627491A (zh) 2021-07-15 2021-07-15 基于改进的自适应Anchor生成的DK-YOLOv4模型

Country Status (1)

Country Link
CN (1) CN113627491A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114842189A (zh) * 2021-11-10 2022-08-02 北京中电兴发科技有限公司 一种用于目标检测的自适应Anchor生成方法
CN114972261A (zh) * 2022-05-27 2022-08-30 东北大学 一种板带钢表面质量缺陷的识别方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114842189A (zh) * 2021-11-10 2022-08-02 北京中电兴发科技有限公司 一种用于目标检测的自适应Anchor生成方法
CN114842189B (zh) * 2021-11-10 2022-11-04 北京中电兴发科技有限公司 一种用于目标检测的自适应Anchor生成方法
CN114972261A (zh) * 2022-05-27 2022-08-30 东北大学 一种板带钢表面质量缺陷的识别方法

Similar Documents

Publication Publication Date Title
CN111563841B (zh) 一种基于生成对抗网络的高分辨率图像生成方法
CN109902873A (zh) 一种基于改进型鲸鱼算法的云制造资源配置的方法
CN113627491A (zh) 基于改进的自适应Anchor生成的DK-YOLOv4模型
CN112581263A (zh) 一种基于灰狼算法优化广义回归神经网络的信用评估方法
Deb et al. Bi-objective portfolio optimization using a customized hybrid NSGA-II procedure
CN111737743A (zh) 一种深度学习差分隐私保护方法
CN111738477B (zh) 基于深层特征组合的电网新能源消纳能力预测方法
Ashlock Evolvable fashion-based cellular automata for generating cavern systems
CN111160400A (zh) 一种基于修正边界攻击的对抗攻击方法
CN103824285B (zh) 一种基于蝙蝠优化模糊聚类的图像分割方法
CN110991621A (zh) 一种基于通道数搜索卷积神经网络的方法
CN114936518A (zh) 一种拉伸/压缩弹簧设计参数求解方法
CN112926645B (zh) 一种基于边缘计算的窃电检测方法
CN112560034A (zh) 基于反馈式深度对抗网络的恶意代码样本合成方法及装置
CN111582384A (zh) 一种图像对抗样本生成方法
CN113141272B (zh) 基于迭代优化rbf神经网络的网络安全态势分析方法
CN109492744A (zh) 一种离散二进制粒子群算法与模糊控制耦合的混合运行优化控制方法
CN107507157B (zh) 一种改进的图像增强方法
CN113704787B (zh) 一种基于差分隐私的隐私保护聚类方法
CN115690476A (zh) 一种基于改进和声搜索算法的数据自动聚类方法
CN114818203A (zh) 一种基于swa算法的减速器设计方法
CN107274357A (zh) 一种参数最优的灰度图像增强处理系统
CN112101461A (zh) 一种基于hrtf-pso-fcm的无人机侦察视觉信息可听化方法
Gerdelan et al. A genetic‐fuzzy system for optimising agent steering
CN113537231B (zh) 一种联合梯度与随机信息的轮廓点云匹配方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination