CN111523530A

CN111523530A - 一种目标检测中分数图的映射方法及目标检测方法

Info

Publication number: CN111523530A
Application number: CN202010283026.7A
Authority: CN
Inventors: 吴天鹏; 周金明; 林坚; 李军
Original assignee: Nanjing Xingzheyi Intelligent Transportation Technology Co ltd
Current assignee: Nanjing Inspector Intelligent Technology Co ltd
Priority date: 2020-04-13
Filing date: 2020-04-13
Publication date: 2020-08-11
Anticipated expiration: 2040-04-13
Also published as: CN111523530B

Abstract

本发明公开了一种目标检测中分数图的映射方法及目标检测方法，根据具体的目标检测模型架构来计算分数图在原始图片中的感受野尺寸，循环标记目标的分数图中每个点的分数标签值，即目标区域在该点对应的感受野的占比，分数图标记完成，即完成了输入原始图片与该分数图的映射关系的建立。该方法考虑了感受野与目标检测之间的关系，采用感受野中目标的占比直接作为分数标签值，即使用感受野与目标的交集与感受野的比值作为分数标签值去标记，更为细化和合理的构建了图片和分数图的映射关系。

Description

一种目标检测中分数图的映射方法及目标检测方法

技术领域

本发明涉及图像识别研究领域，尤其是目标检测领域和深度学习领域，具体涉及一种目标检测中分数图的映射方法及目标检测方法。

背景技术

目前主流的目标检测算法是深度学习方法，近年来基于深度学习的一阶段目标检测方法已在实际场景中得到应用：行人检测，人脸检测和无人机检测等。目标检测算法作为许多人工智能算法的基础部分，为后续的生物特征识别，人脸匹配和大数据分析等算法提供支持，其在安防安检中的应用有利于公共安全，在人脸支付，业务快捷办理等场景中的应用也方便了人们的生活。在实现本发明过程中，发明人发现现有技术中至少存在如下问题：现有的基于深度学习的目标检测方法，输入图片和分数图的映射关系粗糙且复杂，缺少可解释性，给检测模型的训练带来干扰，较多的模型参数也影响了检测速度，因此更为细化和可解释的映射关系的构建能够促进目标检测算法的发展，具有重要的实际应用意义和学术价值。

发明内容

为了克服现有技术的不足，本公开实施例提供了一种目标检测中分数图的映射方法及目标检测方法，该方法考虑了感受野与目标检测之间的关系，不使用anchor与目标的交并比或者感受野与目标的交并比作为阈值来粗糙的分类，而是采用感受野中目标的占比直接作为分数标签值，即使用感受野与目标的交集与感受野的比值作为分数标签值去标记，更为细化和合理的构建了图片和分数图的映射关系。

第一方面，提供了一种一种目标检测中分数图的映射方法，技术方案如下：

根据具体的目标检测模型架构来计算分数图在原始图片中的感受野尺寸，一种类别的目标对应一个分数图；

循环标记目标的分数图中每个点的分数标签值，即目标区域在该点对应的感受野的占比；

分数标签值的计算公式如下：Score(i,j)＝(A∩RF(i，j))/RF(i，j)，其中i,j表示分数图上某点的横坐标和纵坐标，起点的坐标为i＝1，j＝1，Score(i，j)表示该点的分数，RF(i，j)代表该点在原图上对应的感受野区域，A代表原图中的目标区域；

查看该分数图是否标记完成，如果没有完成，继续分数标签值的标记，如果完成，则分数图标记完成，即完成了输入原始图片与该分数图的映射关系的建立。

优选的，在基于深度学习目标检测模型中，分数图的尺寸为原始输入图片尺寸缩小n倍，感受野尺寸为n×n，n为整数。

进一步的，感受野尺寸可以通过网络架构中的卷积层和池化层得到，感受野尺寸为：

其中l_k-1为第k-1层对应的感受野尺寸，s_i为第i层的步长，f_k为第k层的卷积核大小，或者是池化层的池化尺寸大小。

优选的，若目标存在多个类别，则对多个类别的目标分别进行分数图的标记，得到多个分数图；

优选的，在检测模型中，若存在不同深度的网络层都需要做预测和输出，则对不同深度的网络层计算感受野尺寸，再分别标记该网络层上的分数图，计算其分数标签值，各分数图标记完成后，即完成了输入原始图片与所有的分数图的映射关系的建立。

第二方面，提供了一种目标检测方法，该方法在检测过程中采用了上述所有可能的实现方法中任一项所述的一种目标检测中分数图的映射方法。

与现有技术相比，上述技术方案中的一个技术方案具有如下有益效果：通过考虑了感受野与目标检测之间的关系，采用感受野中目标的占比直接作为分数标签值，即使用感受野与目标的交集与感受野的比值作为分数标签值去标记，这样更为细化和合理的构建了图片和分数图的映射关系，既考虑了目标领域的空间关联性，又增强了映射关系的可解释性，同时在检测时计算量小，速度快，在训练时利于检测模型的拟合。

附图说明

图1为本公开实施例提供的一种目标检测中分数图的映射方法的流程图。

图2为本公开实施例提供的一种目标检测中分数图的映射方法的映射关系示意图。

具体实施方式

为了阐明本发明的技术方案和工作原理，下面将结合附图对本公开实施方式做进一步的详细描述。

上述所有可选技术方案，可以采用任意结合形成本公开的可选实施例，在此不再一一赘述。

本公开实施例提供了一种目标检测中分数图的映射方法：

附图1为本公开实施例提供的一种目标检测中分数图的映射方法的流程图，图2为本公开实施例提供的一种目标检测中分数图的映射方法的映射关系示意图，结合这2个附图，主要包括以下步骤：

优选的，在基于深度学习的检测模型中，可能需要检测多个类别的目标，需要对每一个类别的分数图分别进行分数标签值标记，得到多个分数图；

进一步的，在检测模型中，若存在不同深度的网络层都需要做预测和输出，则对不同深度的网络层计算感受野尺寸，再分别标记该网络层上的分数图，计算其分数标签值，各分数图标记完成后，即完成了输入原始图片与所有的分数图的映射关系的建立。

结合其他的类似检测框回归的策略，就可以进行检测模型的训练等后续工作。

本公开实施例还提供了一种目标检测方法，该方法在检测过程中采用了上述所有可能的实现方法中任一项所述的一种目标检测中分数图的映射方法。

需要说明的是，上述实施例提供的一种目标检测方法与一种目标检测中分数图的映射方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

以上结合附图对本发明进行了示例性描述，显然，本发明具体实现并不受上述方式的限制，凡是采用了本发明的方法构思和技术方案进行的各种非实质性的改进；或者未经改进、等同替换，将本发明的上述构思和技术方案直接应用于其他场合的，均在本发明的保护范围之内。

Claims

1.一种目标检测中分数图的映射方法，其特征在于，包括如下步骤：

分数标签值的计算公式如下：Score(i，j)＝(A∩RF(i，j))/RF(i，j)，其中i，j表示分数图上某点的横坐标和纵坐标，起点的坐标为i＝1，j＝1，Score(i，j)表示该点的分数，RF(i，j)代表该点在原图上对应的感受野区域，A代表原图中的目标区域；

2.根据权利要求1所述的一种目标检测中分数图的映射方法，其特征在于，在基于深度学习目标检测模型中，分数图的尺寸为原始输入图片尺寸缩小n倍，感受野尺寸为n×n，n为整数。

3.根据权利要求2所述的一种目标检测中分数图的映射方法，其特征在于，感受野尺寸通过网络架构中的卷积层和池化层得到，感受野尺寸为：

4.根据权利要求1-3任一项所述的一种目标检测中分数图的映射方法，其特征在于，若目标存在多个类别，则对多个类别的目标分别进行分数图的标记，得到多个分数图。

5.根据权利要求4所述的一种目标检测中分数图的映射方法，其特征在于，在检测模型中，若存在不同深度的网络层都需要做预测和输出，则对不同深度的网络层计算感受野尺寸，再分别标记该网络层上的分数图，计算其分数标签值，各分数图标记完成后，即完成了输入原始图片与所有的分数图的映射关系的建立。

6.一种目标检测方法，其特征在于，该方法在检测过程中采用了权利要求1-5任一项所述的一种目标检测中分数图的映射方法。