CN113705672A

CN113705672A - 图像目标检测的阈值选取方法、系统、装置及存储介质

Info

Publication number: CN113705672A
Application number: CN202110996113.1A
Authority: CN
Inventors: 方芹; 张重阳; 张保柱; 陈铁义; 刘振宇; 缪宁杰; 陈丹霏; 王激华; 杨跃平
Original assignee: Ningbo Haitang Information Technology Co Ltd; Innovation And Entrepreneurship Center Of State Grid Zhejiang Electric Power Co ltd; State Grid Corp of China SGCC
Current assignee: Ningbo Haitang Information Technology Co Ltd; Innovation And Entrepreneurship Center Of State Grid Zhejiang Electric Power Co ltd; State Grid Corp of China SGCC
Priority date: 2021-08-27
Filing date: 2021-08-27
Publication date: 2021-11-26
Anticipated expiration: 2041-08-27
Also published as: CN113705672B

Abstract

本申请公开了一种图像目标检测的阈值选取方法、系统、装置及计算机可读存储介质，包括：获取每个样本数据的正样本置信度值或负样本置信度值；利用所有正样本置信度值和所有负样本置信度值，分别进行拟合得到正样本置信度指数分布函数和负样本置信度指数分布函数；利用正样本置信度指数分布函数和负样本置信度指数分布函数，获取全局置信度阈值；当检测到当前图像中有至少一个正样本时，利用检测阈值修正公式修正当前检测阈值；当没有检测到正样本时，则设置当前目标检测阈值等于全局置信度阈值。本申请利用综合了正负样本置信度的全局置信度阈值对当前目标检测阈值进行修正，平衡了误检和漏检，得到了一种更优的图像目标检测效果。

Description

图像目标检测的阈值选取方法、系统、装置及存储介质

技术领域

本发明涉及图像识别技术领域，特别涉及一种图像目标检测的阈值选取方法、系统、装置及计算机可读存储介质。

背景技术

图像目标检测的任务是找出图像中所有感兴趣的目标，确定它们的类别和位置，是智能安防监控、智能工业缺陷检测等应用中的核心技术之一。由于各类物体有不同的外观、形状和姿态，加上成像时光照、遮挡等因素的干扰，图像目标检测一直是计算机视觉领域最具有挑战性的问题。目前，基于深度卷积神经网络(Deep CNN)等深度学习技术的图像目标检测，因其良好的目标特征学习与表达能力、优越的检测性能，成为图像目标检测领域的主要技术。基于深度学习的目标检测算法主要分为两类：Two stage和One stage。以Faster RCNN等为代表的Tow stage方法是指：先对图像利用卷积神经网络进行特征学习与提取，在提取得到的特征图上进行候选区域生成，该区域称之为目标候选框(proposal)；再利用候选框的特征，通过全连接层等分类和回归网络，进行候选框的类别分类和位置预测。而以YOLO、SSD等为代表的One Stage方法是指：不用专门的网络来生成候选框，而是直接在网络特征图中通过空间网格化划分和每个网格上预设的锚点(Anchor)等，来直接得到候选框及其特征，再来预测目标的类别和位置。

利用深度卷积神经网络进行图像目标检测时，首先利用CNN对图像进行卷积等运算，将二维图像数据转换成二维特征图，在二维特征图上，通过选择性搜索或者锚点模板等方法，选取一些矩形框区域作为目标的候选框(Proposal)，再将这个候选框区域的特征送到一个分类网络里进行类别预测，预测的结果就是一个置信度值，这个置信度表示一个候选框属于某个类别的概率。分类识别时，需要设定一个置信度阈值，通过判断置信度是否大于阈值来确定其是否属于某个类别。比如，如果某个候选框属于A类目标的置信度值大于这个阈值，就判定该候选框为A类目标。传统的方法，大都基于需要的平均精度AP(AveragePrecision)、选定一个经验值作为置信度的阈值。这种选取方法虽然能保证精度，但往往会带来较高的误检率，难以有效平衡目标检测的低漏检同时低误检问题。

传统图像处理中的阈值选取方法，包括基于类间方差法^[1]、基于最大熵法^[2]、基于模糊集^[3]等。

“杜奇,向健勇,袁胜春.一种改进的最大类间方差法[J].红外技术,2003(5):33-36.”，提供了一种类间方差法，该方法是一种自适合于双峰情况的自动求取阈值的方法。它是按图像的灰度特性,将图像分成背景和目标2部分。背景和目标之间的类间方差越大，说明构成图像的2部分的差别越大，当部分目标错分为背景或部分背景错分为目标都会导致2部分差别变小。

“刘耀辉,鲍苏苏.一种结合小波变换与二维最大熵法的图像阈值分割方法[J].现代计算机：下半月版,2005(7):13-16.”，提出了一种最大熵法，其原理是取一组时间序列，使其自相关函数与一组已知数据的自相关函数相同，同时使已知自相关函数以外的部分的随机性最强，以所取时间序列的谱作为已知数据的谱估值。

“吴薇.基于模糊增强的图像阈值分割[J].现代电子技术,2002(9):78-80.”，提供了一种模糊集理论，也称为模糊集合论，或简单地称为模糊集，是数学上的一种描述模糊现象的方法—模糊集合论。这种方法把待考察的对象及反映它的模糊概念作为一定的模糊集合，建立适当的隶属函数，通过模糊集合的有关运算和变换，对模糊对象进行分析。

这些方法都是从通过一维直方图来取得阈值推广到二维。二维直方图充分利用了图像的空间信息，使得分割结果更准确，但其运算量呈指数增长限制了应用，并且通过这些方法计算的阈值是相对固定的，无法在检测过程中进行动态调节。

上述图像目标检测、分割中的阈值选取方法，大都是基于直方图等传统人工设计特征来选取阈值；基于深度学习的图像目标检测模型，置信度阈值自适应选取方法较为缺乏，而且往往因需满足AP或检出率/召回率(Recall)需求、只考虑正样本候选框的置信度统计情况，未能同时从正、负样本的置信度统计分布来选择阈值，导致高检出率但也往往高误检率问题。

另外，智能图像监控往往需要检测出图像中的行人、车辆等重点目标，对这些目标进行结构化描述或进一步的行为分析；智能工业缺陷检测是工业上产品质量管理非常重要的一个环节，需要基于图像等工业视觉技术，对工业产品的表面缺陷等目标进行检测、并确保有瑕疵的不合格品流入市场。这两类应用，都需要通过图像目标检测技术来检测出特定的目标，并都要求尽可能不漏检且误检率尽可能低，这样就面临低漏检和低误检的平衡难题。目前还没有能够解决这些应用中图像目标检测所面临的漏检和误检平衡问题的有效方法。

发明内容

有鉴于此，本发明的目的在于提供一种图像目标检测的阈值选取方法、系统、装置及计算机可读存储介质，选取合适的目标检测阈值，平衡漏检和误检。其具体方案如下：

一种图像目标检测的阈值选取方法，包括：

获取用于图像目标检测训练的每个样本数据的正样本置信度值或负样本置信度值；

利用所有正样本置信度值和所有负样本置信度值，分别进行拟合得到正样本置信度指数分布函数和负样本置信度指数分布函数；

利用所述正样本置信度指数分布函数和所述负样本置信度指数分布函数，获取全局置信度阈值；

利用当前目标检测阈值，对当前图像内的目标进行检测；

当检测到当前图像中有至少一个正样本时，利用检测阈值修正公式修正当前检测阈值；

当没有检测到正样本时，则设置当前目标检测阈值等于所述全局置信度阈值；

其中，所述检测阈值修正公式为：P_当＝P_全+(P_中-P_全)/P_全；

式中，P_当表示当前检测阈值，P_全表示所述全局置信度阈值，P_中表示当前图像中最高正样本置信度值的中值。

可选的，所述获取用于图像目标检测训练的每个样本数据的正样本置信度值或负样本置信度值的过程，包括：

获取图像目标检测训练的样本数据；

获取样本数据中的负样本被判断为正样本目标时的置信度值，得到所有负样本置信度值；

获取样本数据中的正样本被识别为正样本目标时的置信度值，得到所有正样本置信度值。

可选的，所述利用所有正样本置信度值和所有负样本置信度值，分别进行拟合得到正样本置信度指数分布函数和负样本置信度指数分布函数的过程，包括：

利用所有负样本置信度值中置信度值大于等于最小负样本置信度值的负样本置信度，拟合为一个负样本置信度指数分布函数；

利用所有正样本置信度值中置信度值小于等于最大正样本置信度值的正样本置信度，拟合为一个正样本置信度指数分布函数。

可选的，所述利用所述正样本置信度指数分布函数和所述负样本置信度指数分布函数，获取全局置信度阈值的过程，包括：

将所述正样本置信度指数分布函数和所述负样本置信度指数分布函数以同一尺度在同一个二维空间内的交点作为所述全局置信度阈值。

可选的，所述二维空间的一边纵轴表示所述负样本置信度指数分布函数的概率，所述二维空间的另一边纵轴表示所述正样本置信度指数分布函数的概率，所述二维空间横轴从一边到另一边为所述最小负样本置信度值到所述最大正样本置信度值。

可选的，所述利用所述正样本置信度指数分布函数和所述负样本置信度指数分布函数，获取全局置信度阈值，包括：

设定正样本召回率；

在所述正样本置信度指数分布函数曲线上，从置信度值最高点沿曲线获取曲线图形成的包络面积；

当所述包络面积达到所述正样本召回率时，将对应的置信度值作为所述全局置信度阈值。

本发明还公开了一种图像目标检测的阈值选取系统，包括：

置信度获取模块，用于获取用于图像目标检测训练的每个样本数据的正样本置信度值或负样本置信度值；

分布函数拟合模块，用于利用所有正样本置信度值和所有负样本置信度值，分别进行拟合得到正样本置信度指数分布函数和负样本置信度指数分布函数；

全局置信度获取模块，用于利用所有正样本置信度值和所有负样本置信度值，分别进行拟合得到正样本置信度指数分布函数和负样本置信度指数分布函数；

目标检测模块，用于利用当前目标检测阈值，对当前图像内的目标进行检测；

第一阈值修正模块，用于当检测到当前图像中有至少一个正样本时，利用检测阈值修正公式修正当前检测阈值；

第二阈值修正模块，用于当没有检测到正样本时，则设置当前目标检测阈值等于所述全局置信度阈值；

可选的，所述置信度获取模块，包括：

样本获取单元，用于获取图像目标检测训练的样本数据；

负样本置信度获取单元，用于获取样本数据中的负样本被判断为正样本目标时的置信度值，得到所有负样本置信度值；

正样本置信度获取单元，用于获取样本数据中的正样本被识别为正样本目标时的置信度值，得到所有正样本置信度值。

本发明还公开了一种图像目标检测的阈值选取装置，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序以实现如前述的图像目标检测的阈值选取方法。

本发明还公开了一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如前述的图像目标检测的阈值选取方法。

本发明中，图像目标检测的阈值选取方法，包括：获取用于图像目标检测训练的每个样本数据的正样本置信度值或负样本置信度值；利用所有正样本置信度值和所有负样本置信度值，分别进行拟合得到正样本置信度指数分布函数和负样本置信度指数分布函数；利用正样本置信度指数分布函数和负样本置信度指数分布函数，获取全局置信度阈值；利用当前目标检测阈值，对当前图像内的目标进行检测；当检测到当前图像中有至少一个正样本时，利用检测阈值修正公式修正当前检测阈值；当没有检测到正样本时，则设置当前目标检测阈值等于全局置信度阈值；其中，检测阈值修正公式为：P_当＝P_全+(P_中-P_全)/P_全；式中，P_当表示当前检测阈值，P_全表示全局置信度阈值，P_中表示当前图像中最高正样本置信度值的中值。

本发明提出了一种新的图像目标检测的阈值选取方法，利用正、负样本置信度，得到正样本置信度指数分布函数和负样本置信度指数分布函数，再设置综合正、负样本置信度的全局置信度阈值，再利用全局置信度阈值和检测阈值修正公式对当前目标检测阈值进行修正，平衡了误检和漏检，得到了一种更优的图像目标检测效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明实施例公开的一种图像目标检测的阈值选取方法流程示意图；

图2为本发明实施例公开的一种正样本置信度指数分布函数示意图；

图3为本发明实施例公开的一种负样本置信度指数分布函数示意图；

图4为本发明实施例公开的一种图像目标检测的阈值选取方法示意图；

图5为本发明实施例公开的一种全局置信度阈值获取方法示意图；

图6为本发明实施例公开的一种图像目标检测的阈值选取系统结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例公开了一种图像目标检测的阈值选取方法，参见图1和图3所示，该方法包括：

S11：获取用于图像目标检测训练的每个样本数据的正样本置信度值或负样本置信度值。

具体的，获取当前图像目标检测模型在训练时所使用的样本数据，并进一步获取样本数据中的每个负样本被判断为正样本目标时的置信度值，得到每个被判断错误的负样本的负样本置信度值；同理，获取样本数据中的每个正样本被识别为正样本目标时的置信度值，得到每个被判断错误的正样本的正样本置信度值。

S12：利用所有正样本置信度值和所有负样本置信度值，分别进行拟合得到正样本置信度指数分布函数和负样本置信度指数分布函数。

具体的，参见图2所示，利用所有负样本置信度值中置信度值大于等于最小负样本置信度值的负样本置信度，拟合为一个负样本置信度指数分布函数；参见图3所示，利用所有正样本置信度值中置信度值小于等于最大正样本置信度值的正样本置信度，拟合为一个正样本置信度指数分布函数。

S13：利用正样本置信度指数分布函数和负样本置信度指数分布函数，获取全局置信度阈值。

具体的，为了平衡准确度与漏检，不能够将置信度阈值选取太高，容易造成漏检，即设定的判断要求过高，导致一些正样本图像可能不够典型就被漏检，不认为是正样本，也不能选取太低，容易产生过多误检，即设定的判断要过过低，导致一些负样本图像可能仅有部分特征符合要求就被归类为正样本，造成误检。

具体的，为此，综合正样本置信度指数分布函数和负样本置信度指数分布函数，选取适中的全局置信度阈值，或也可以人为指定全局置信度阈值。

其中，正样本置信度指数分布函数为：

负样本置信度指数分布函数为：

式中，E(λ_正)表示正样本置信度指数分布函数，λ_正表示正样本拟合参数，E(λ_误)表示负样本置信度指数分布函数，λ_误表示负样本拟合参数，x_正表示正样本置信度数值，取值范围为(0，1)，x_误表示负样本置信度数值，取值范围为(0，1)。

S14：利用当前目标检测阈值，对当前图像内的目标进行检测。

具体的，在修正前，仍需要利用当前目标检测阈值，对当前图像内的目标进行检测，以判断当前目标检测阈值属于那种情况，以进行相应的调整。

S15：当检测到当前图像中有至少一个正样本时，利用检测阈值修正公式修正当前检测阈值。

具体的，当利用当前目标检测阈值能够检测到当前图像中存在正样本时，说明当前目标检测阈值能够在一定程度上对当前图像进行有效判断，因此，可以利用检测阈值修正公式修正当前检测阈值，调整到最佳状态。

其中，检测阈值修正公式为：P_当＝P_全+(P_中-P_全)/P_全；

式中，P_当表示当前检测阈值，P_全表示全局置信度阈值，P_中表示当前图像中最高正样本置信度值的中值。

S16：当没有检测到正样本时，则设置当前目标检测阈值等于全局置信度阈值。

具体的，如果利用当前目标检测阈值无法检测到当前图像中存在正样本，有可能说明当前目标检测阈值设定不合理，距离适合当前图像的检测阈值差距较大，因此，可以将当前目标检测阈值直接设置为全局置信度阈值不进行修正。

可见，本发明实施例提出了一种新的图像目标检测的阈值选取方法，利用正、负样本置信度，得到正样本置信度指数分布函数和负样本置信度指数分布函数，再设置综合正、负样本置信度的全局置信度阈值，再利用全局置信度阈值和检测阈值修正公式对当前目标检测阈值进行修正，平衡了误检和漏检，得到了一种更优的图像目标检测效果。

具体的，本发明实施例的图像目标检测的阈值选取方法，可以应用在具体的图像目标检测方法中，比如，获取待检测的图像，然后对图像目标进行检测，在该检测过程中采用上述的图像目标检测阈值的选取方法，最终完成图像目标检测。该种图像目标检测方法通过在检测的过程中动态的调整置信度阈值，能有效平衡图像目标检测的漏检率和误检率的目的，可以应用在智能图像监控、智能工业缺陷检测等应用中。

本发明实施例公开了一种具体的图像目标检测的阈值选取方法，相对于上一实施例，本实施例对技术方案作了进一步的说明和优化。具体的：

具体的，上述S3利用正样本置信度指数分布函数和负样本置信度指数分布函数，获取全局置信度阈值的过程，参见图5所示，可以具体为可以将正样本置信度指数分布函数和负样本置信度指数分布函数以同一尺度在同一个二维空间内的交点作为全局置信度阈值，参见图3所示。

其中，二维空间的一边纵轴表示负样本置信度指数分布函数的概率，二维空间的另一边纵轴表示正样本置信度指数分布函数的概率，二维空间横轴从一边到另一边为最小负样本置信度值到最大正样本置信度值。

具体的，此外利用正样本置信度指数分布函数和负样本置信度指数分布函数，获取全局置信度阈值的过程，还可以包括S131至S133；其中，

S131：设定正样本召回率；

S132：在正样本置信度指数分布函数曲线上，从置信度值最高点沿曲线获取曲线图形成的包络面积；

S133：当包络面积达到正样本召回率时，将对应的置信度值作为全局置信度阈值。

其中，包络面积参见图2中正样本置信度指数分布函数曲线下方与坐标轴共同围成的区域面积。

相应的，本发明实施例还公开了一种图像目标检测的阈值选取系统，参见图6所示，该系统包括：

置信度获取模块11，用于获取用于图像目标检测训练的每个样本数据的正样本置信度值或负样本置信度值；

分布函数拟合模块12，用于利用所有正样本置信度值和所有负样本置信度值，分别进行拟合得到正样本置信度指数分布函数和负样本置信度指数分布函数；

全局置信度获取模块13，用于利用所有正样本置信度值和所有负样本置信度值，分别进行拟合得到正样本置信度指数分布函数和负样本置信度指数分布函数；

目标检测模块14，用于利用当前目标检测阈值，对当前图像内的目标进行检测；

第一阈值修正模块15，用于当检测到当前图像中有至少一个正样本时，利用检测阈值修正公式修正当前检测阈值；

第二阈值修正模块16，用于当没有检测到正样本时，则设置当前目标检测阈值等于全局置信度阈值；

其中，检测阈值修正公式为：P_当＝P_全+(P_中-P_全)/P_全；

具体的，置信度获取模块11，包括：

样本获取单元，用于获取图像目标检测训练的样本数据；

具体的，分布函数拟合模块12，包括：

负样本拟合单元，用于利用所有负样本置信度值中置信度值大于等于最小负样本置信度值的负样本置信度，拟合为一个负样本置信度指数分布函数；

正样本拟合单元，用于利用所有正样本置信度值中置信度值小于等于最大正样本置信度值的正样本置信度，拟合为一个正样本置信度指数分布函数。

具体的，全局置信度获取模块13，具体用于将正样本置信度指数分布函数和负样本置信度指数分布函数以同一尺度在同一个二维空间内的交点作为全局置信度阈值。

具体的，全局置信度获取模块13，还可以包括：

召回率设定单元，用于设定正样本召回率；

包络面积计算单元，用于在正样本置信度指数分布函数曲线上，从置信度值最高点沿曲线获取曲线图形成的包络面积；

全局置信度获取单元，用于当包络面积达到正样本召回率时，将对应的置信度值作为全局置信度阈值。

此外，本发明实施例还公开了一种图像目标检测的阈值选取装置，包括：

存储器，用于存储计算机程序；

处理器，用于执行计算机程序以实现如前述的图像目标检测的阈值选取方法。

另外，本发明实施例还公开了一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，计算机程序被处理器执行时实现如前述的图像目标检测的阈值选取方法。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

以上对本发明所提供的技术内容进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种图像目标检测的阈值选取方法，其特征在于，包括：

利用当前目标检测阈值，对当前图像内的目标进行检测；

2.根据权利要求1所述的图像目标检测的阈值选取方法，其特征在于，所述获取用于图像目标检测训练的每个样本数据的正样本置信度值或负样本置信度值的过程，包括：

获取图像目标检测训练的样本数据；

3.根据权利要求2所述的图像目标检测的阈值选取方法，其特征在于，所述利用所有正样本置信度值和所有负样本置信度值，分别进行拟合得到正样本置信度指数分布函数和负样本置信度指数分布函数的过程，包括：

4.根据权利要求3所述的图像目标检测的阈值选取方法，其特征在于，所述利用所述正样本置信度指数分布函数和所述负样本置信度指数分布函数，获取全局置信度阈值的过程，包括：

5.根据权利要求4所述的图像目标检测阈值的选取方法，其特征在于，所述二维空间的一边纵轴表示所述负样本置信度指数分布函数的概率，所述二维空间的另一边纵轴表示所述正样本置信度指数分布函数的概率，所述二维空间横轴从一边到另一边为所述最小负样本置信度值到所述最大正样本置信度值。

6.根据权利要求3所述的图像目标检测的阈值选取方法，其特征在于，所述利用所述正样本置信度指数分布函数和所述负样本置信度指数分布函数，获取全局置信度阈值，包括：

设定正样本召回率；

7.一种图像目标检测的阈值选取系统，其特征在于，包括：

8.根据权利要求1所述的图像目标检测的阈值选取系统，其特征在于，所述置信度获取模块，包括：

样本获取单元，用于获取图像目标检测训练的样本数据；

9.一种图像目标检测的阈值选取装置，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序以实现如权利要求1至6任一项所述的图像目标检测的阈值选取方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的图像目标检测的阈值选取方法。