CN114842189B

CN114842189B - 一种用于目标检测的自适应Anchor生成方法

Info

Publication number: CN114842189B
Application number: CN202111326683.6A
Authority: CN
Inventors: 朱海明; 瞿洪桂; 高珊珊
Original assignee: Beijing Sinonet Science and Technology Co Ltd
Current assignee: Beijing Sinonet Science and Technology Co Ltd
Priority date: 2021-11-10
Filing date: 2021-11-10
Publication date: 2022-11-04
Anticipated expiration: 2041-11-10
Also published as: CN114842189A

Abstract

本发明提供一种用于目标检测的自适应Anchor生成方法，包括以下步骤：根据聚类算法，得到最佳Anchor；计算最佳Anchor和矩阵WH2的相近度，作为最佳相近度；最佳Anchor乘以迭代偏移量，得到偏移Anchor；计算偏移Anchor与矩阵WH2的相近度，进而得到最佳Anchor。本发明根据数据集场景自适应调节Anchor，从而使Anchor设置的尺寸和实际数据集场景匹配，进而使目标检测算法在做位置回归时能够回归到准确位置，提高算法模型检测效果。

Description

一种用于目标检测的自适应Anchor生成方法

技术领域

本发明属于人工智能技术领域，具体涉及一种用于目标检测的自适应Anchor生成方法。

背景技术

目标检测算法按照Anchor(参考框集合)可以划分为Anchor-based和Anchor-free两大类，顾名思义，Anchor-free无需设置Anchor就可以完成目标检测任务，而Anchor-based则需要设置Anchor完成目标检测任务。

对于Anchor-based目标检测算法，Anchor的设置十分重要，设置的Anchor是否合适很大程度影响了目标检测算法模型的检测效果。

现有Anchor-based目标检测算法大多采用人工设定的Anchor，主要存在以下问题：现有设置方式经常出现Anchor设置的尺寸和实际图片中的目标尺寸匹配不佳的情况，从而加大了目标检测算法在做位置回归时的难度，可能导致其无法回归到准确位置，最终导致目标检测算法模型检测效果不佳。

因此，如何针对不同数据集场景设置合适的Anchor，是Anchor-based目标检测算法是否能够检测准确的关键。

发明内容

针对现有技术存在的缺陷，本发明提供一种用于目标检测的自适应Anchor生成方法，可有效解决上述问题。

本发明采用的技术方案如下：

本发明提供一种用于目标检测的自适应Anchor生成方法，包括以下步骤：

步骤S1：对数据集进行分析，得到数据集所有标注目标的目标框的矩阵，记为矩阵WH1；其中，矩阵WH1维度为(n,2)，n代表数据集的目标框的数量；2代表每个目标框的维度为两维，分别为：宽w和高h；

步骤S2：对矩阵WH1进行过滤处理，将目标框的宽或高的像素数小于像素阈值的目标框滤除，得到矩阵WH2；矩阵WH2维度为(m,2)，m表示过滤后得到的目标框的数量；矩阵WH2表示为：

步骤S3：根据聚类算法，得到最佳Anchor：

步骤S3.1：获得矩阵WH2中所有目标框的宽的标准差w_std和所有目标框的高的标准差h_std；

步骤S3.2：采用下式，矩阵WH2中每个目标框的宽除以宽的标准差w_std，矩阵WH2中每个目标框的高除以高的标准差h_std，得到归一化目标框组成的矩阵WH3；

步骤S3.3：矩阵WH3共包括m个宽高数据对；每一个宽高数据对作为一个点，随机选择a个点作为初始质心，组成初始Anchor，表示为：

其中：a为初始Anchor包括的初始质心数量；初始Anchor维度为(a，2)，w_a₁代表第1个初始质心的宽，h_a₁代表第1个初始质心的高；w_a₂代表第2个初始质心的宽，h_a₂代表第2个初始质心的高；依此类推，w_a_a代表第a个初始质心的宽，h_a_a代表第a个初始质心的高；

步骤S3.4：令K-means当前迭代次数＝0；

步骤S3.5：计算矩阵WH3中每一个归一化目标框与每一个初始质心的欧式距离，对于每一个归一化目标框，将其划分到距离其最近的初始质心所属的集合，由此得到a个集合；

步骤S3.6：对于a个集合中的每个集合，计算该集合所有宽的均值和所有高的均值作为新质心；由此形成a个新质心；

步骤S3.7：K-means当前迭代次数+1；

步骤S3.8：判断步骤S3.6得到的每个新质心，是否与上一轮迭代得到的初始质心相同，如果均相同，则执行步骤S3.9；否则，判断K-means当前迭代次数是否等于预设k-means总迭代次数，如果等于，则执行步骤S3.9；如果不等于，则将步骤S3.6得到的每个新质心，作为初始质心，返回步骤S3.5；

步骤S3.9：将每一个新质心的宽乘以宽的标准差w_std，将每一个新质心的高乘以高的标准差h_std，形成的矩阵作为最佳Anchor，表示为：

其中：w_a_1s代表第1个最佳质心的宽，h_a_1s代表第1个最佳质心的高；w_a_2s代表第2个最佳质心的宽，h_a_2s代表第2个最佳质心的高；w_a_as代表第a个最佳质心的宽，h_a_as代表第a个最佳质心的高；

步骤S4：计算最佳Anchor和矩阵WH2的相近度，作为最佳相近度：

步骤S4.1：最佳Anchor包括a个最佳质心，将a个最佳质心作为一组，复制扩充到m组，由此得到维度为(m,a,2)的矩阵，记为扩充Anchor，表示为：

矩阵WH2包括m个目标框，将每个目标框复制扩充到a个目标框，由此得到维度为(m,a,2)的矩阵，记为扩充WH2，表示为：

步骤S4.2：扩充Anchor包括m*a行，每行包括宽和高两维数据；扩充WH2包括m*a行，每行包括宽和高两维数据；比较扩充Anchor和扩充WH2每行宽的值，取较小者作为最小值矩阵相同行的宽；比较扩充Anchor和扩充WH2每行高的值，取较小者作为最小值矩阵相同行的高，由此得到维度为(m,a,2)的最小值矩阵，表示为：

其中：w_min和h_min分别表示最小值矩阵中每行元素的宽和高；

步骤S4.3：将最小值矩阵中每行的宽和高相乘，得到维度为(m,a)的最小值面积矩阵A：

其中：wh_min表示最小值面积矩阵中的每行面积值；

步骤S4.4：比较扩充Anchor和扩充WH2每行宽的值，取较大者作为最大值矩阵相同行的宽；比较扩充Anchor和扩充WH2每行高的值，取较大者作为最大值矩阵相同行的高，由此得到维度为(m,a,2)的最大值矩阵，表示为：

其中：w_max和h_max分别表示最大值矩阵中每行元素的宽和高；

步骤S4.5：将最大值矩阵中每行的宽和高相乘，得到维度为(m,a)的最大值面积矩阵B：

其中：wh_max表示最大值面积矩阵中的每行面积值；

步骤S4.6：将扩充Anchor中每一行的宽高相乘，得到维度为(m,a)的矩阵C1：

其中：wh_a表示矩阵C1中的每行面积值；

将扩充WH2中每一行的宽高相乘，得到维度为(m,a)的矩阵C2：

步骤S4.7：采用下式，将矩阵C1和矩阵C2相加并减去矩阵A，得到矩阵C：

C＝C1+C2-A

采用下式，得到矩阵D：

矩阵D表示为：

其中：d₁₁表示矩阵WH2中第1个目标框和最佳Anchor中第1个最佳质心的相近度，d₁₂表示矩阵WH2中第1个目标框和最佳Anchor中第2个最佳质心的相近度，依此类推，d_ma表示矩阵WH2中第m个目标框和最佳Anchor中第a个最佳质心的相近度；

步骤S4.8：计算矩阵D中每个目标框与a个最佳质心的相近度的最大值，得到维度为(m)的矩阵E：

其中：

e₁表示矩阵WH2中第1个目标框和最佳Anchor中a个最佳质心的最大相近度；

e₂表示矩阵WH2中第2个目标框和最佳Anchor中a个最佳质心的最大相近度；

e_m表示矩阵WH2中第m个目标框和最佳Anchor中a个最佳质心的最大相近度；

步骤S4.9：将矩阵E中数值大于相近度阈值thr的数值取均值，得到最佳Anchor和矩阵WH2的最佳相近度；

步骤S5：设置当前迭代次数＝0；

步骤S6：计算迭代偏移量Offset，具体步骤如下：

步骤S6.1：生成和最佳Anchor维度相同且具有标准正态分布的矩阵，记为矩阵Offset1，维度为(a,2)：

步骤S6.2：将矩阵Offset1中每一个元素加1，得到矩阵Offset2：

步骤S6.3：将矩阵Offset2乘以当前迭代次数后除以总迭代次数，得到迭代偏移量Offset：

步骤S7：当前迭代次数+1；

步骤S8：最佳Anchor乘以迭代偏移量，得到偏移Anchor；

步骤S9：计算偏移Anchor与矩阵WH2的相近度，记为相近度degree；

步骤S10：判断相近度degree是否大于步骤S4.9得到的最佳相近度，如果是，则将相近度degree作为最佳相近度，将偏移Anchor作为最佳Anchor，然后执行步骤S11；如果否，则执行步骤S11；

步骤S11：判断当前迭代次数是否等于总迭代次数，如果是，则最佳Anchor即为最终生成的自适应Anchor；如果否，则返回步骤S6。

优选的，步骤S3中，采用的聚类算法为K-means聚类算法。

本发明提供的一种用于目标检测的自适应Anchor生成方法具有以下优点：

本发明提供一种用于目标检测的自适应Anchor生成方法，具体为一种基于Anchor-based目标检测的自适应Anchor生成方法，根据数据集场景自适应调节Anchor，从而使Anchor设置的尺寸和实际数据集场景匹配，进而使目标检测算法在做位置回归时能够回归到准确位置，提高算法模型检测效果。

附图说明

图1为本发明提供的一种用于目标检测的自适应Anchor生成方法的流程示意图；

图2为本发明提供的步骤S3的最佳Anchor的计算流程图；

图3为本发明提供的步骤S4的最佳Anchor和矩阵WH2的最佳相近度的计算流程图。

具体实施方式

为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

本发明提供一种用于目标检测的自适应Anchor生成方法，参考图1，包括以下步骤：

例如，可以以私有数据集为例，数据集所有目标框数为n＝64086。

其中，矩阵WH2全称为数据集标注目标宽高矩阵，全文简称矩阵WH2。

例如，像素阈值设置为2，过滤掉矩阵WH1中宽或高的像素数小于像素阈值＝2的目标框，得到矩阵WH2，其中m＝64075为过滤后剩余的目标框数。本发明中，像素阈值可按需设置，达到清洗数据集或者过滤过小目标框的目的。

步骤S3：根据聚类算法，得到最佳Anchor：

参考图2，包括以下步骤：

例如，矩阵WH2中所有宽的标准差w_std＝45，所有高的标准差h_std＝50。

其中：

a为初始Anchor包括的初始质心数量；例如，a设置为9。

初始Anchor维度为(a，2)，w_a₁代表第1个初始质心的宽，h_a₁代表第1个初始质心的高；w_a₂代表第2个初始质心的宽，h_a₂代表第2个初始质心的高；依此类推，w_a_a代表第a个初始质心的宽，h_a_a代表第a个初始质心的高；

步骤S3.4：令K-means当前迭代次数＝0；

其中：

欧式距离p计算公式：

其中(x₁,y₁)代表归一化目标框的中心点坐标，(x₂,y₂)代表初始质心的中心点坐标。p代表两点的欧式距离。

其中，新质心更加接近数据集真正的中心。

步骤S3.7：K-means当前迭代次数+1；

步骤S3.8：判断步骤S3.6得到的每个新质心，是否与上一轮迭代得到的初始质心相同，如果均相同，则执行步骤S3.9；否则，判断K-means当前迭代次数是否等于预设k-means总迭代次数，例如，总迭代次数为50，如果等于，则执行步骤S3.9；如果不等于，则将步骤S3.6得到的每个新质心，作为初始质心，返回步骤S3.5；

参考图3，包括以下步骤：

其中：w_min和h_min分别表示最小值矩阵中每行元素的宽和高；

其中：wh_min表示最小值面积矩阵中的每行面积值；

其中：w_max和h_max分别表示最大值矩阵中每行元素的宽和高；

其中：wh_max表示最大值面积矩阵中的每行面积值；

其中：wh_a表示矩阵C1中的每行面积值；

将扩充WH2中每一行的宽高相乘，得到维度为(m,a)的矩阵C2：

C＝C1+C2-A

采用下式，得到矩阵D：

矩阵D表示为：

其中：

例如，相近度阈值thr为0.25。thr目的为过滤掉与最佳Anchor相近度较低的目标框，thr设置不应过高。

步骤S5：设置当前迭代次数＝0；

步骤S6：计算迭代偏移量Offset，迭代偏移量可以细化最佳Anchor的选取，具体步骤如下：

步骤S6.2：将矩阵Offset1中每一个元素加1，得到矩阵Offset2：

例如，总迭代次数＝10000。

步骤S7：当前迭代次数+1；

步骤S8：最佳Anchor乘以迭代偏移量，得到偏移Anchor；

本发明涉及的技术要点：1.生成迭代偏移量与Anchor相乘得到新的Anchor；2.Anchor和数据集目标宽高的相近度计算作为最佳Anchor的度量标准。

与现有技术相比，本发明的有益效果是：

1)相较于传统手动设置的Anchor，本发明使用K-means聚类算法，根据数据集的数据生成Anchor，这种利用聚类算法生成的Anchor尺寸和实际图片中的目标尺寸更相近，更贴合数据集目标大小分布，降低了目标检测算法在位置回归时的难度，加快了收敛速度，并且可以提高检测精度；

2)本发明引入了Anchor与数据集实际目标尺寸相近度的计算，该计算通过将数据集中每个目标的宽高信息和Anchor计算，得到可以衡量自适应Anchor优劣的指标；

同时本发明使用生成迭代偏移量与Anchor相乘的方式迭代生成新Anchor，并通过相近度指标的对比，可以选取到更加贴合数据集目标大小分布的自适应Anchor。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视本发明的保护范围。