CN108009544B

CN108009544B - 目标检测方法及装置

Info

Publication number: CN108009544B
Application number: CN201711332697.2A
Authority: CN
Inventors: 张水发
Original assignee: Beijing Xiaomi Mobile Software Co Ltd
Current assignee: Beijing Xiaomi Mobile Software Co Ltd
Priority date: 2017-12-13
Filing date: 2017-12-13
Publication date: 2021-08-31
Anticipated expiration: 2037-12-13
Also published as: CN108009544A

Abstract

本公开是关于目标检测方法及装置。该方法包括：从目标图像中提取由多个检测框组成的检测序列及每个所述检测框的置信度；根据所述检测序列和每个所述检测框的置信度，保留未发生抑制的检测框；根据所述未发生抑制的检测框，生成用于确定所述目标图像内目标物的目标检测框。该技术方案可以根据置信度到对可能发生抑制的检测框进行再判断，能够在某些误检的情况下找回一些检测框，提高检测的准确性。

Description

目标检测方法及装置

技术领域

本公开涉及图像处理领域，尤其涉及目标检测方法及装置。

背景技术

非极大值抑制在目标检测、目标定位等领域是一种被广泛使用的方法。对于目标具体位置定位过程，不管是基于滑动窗口还是选择性搜索方法，都会产生好多的候选区域。实际看到的情形就是好多区域的交叉重叠，难以满足实际的应用。目前的非极大值抑制方法会删除所有的发生抑制的候选区域。

发明内容

本公开实施例提供目标检测方法及装置。所述技术方案如下：

根据本公开实施例的第一方面，提供一种目标检测方法，包括：

从目标图像中提取由多个检测框组成的检测序列及每个所述检测框的置信度；

根据所述检测序列和每个所述检测框的置信度，保留未发生抑制的检测框；

根据所述未发生抑制的检测框，生成用于确定所述目标图像内目标物的目标检测框。

在一个实施例中，所述检测序列中的检测框是按照置信度从小到大排列的；对于所述检测序列中的第i个检测框；所述i是大于1的整数；所述根据所述检测序列和每个所述检测框的置信度，保留未发生抑制的检测框包括：

获取第i个检测框；

从已保留的检测框中获取置信度最低的最低检测框；

根据所述第i个检测框和所述最低检测框确定重叠比率；

当所述重叠比率大于或等于第一阈值时，删除所述第i个检测框；

当所述重叠比率小于所述第一阈值，且大于或等于第二阈值时，根据所述第i个检测框的置信度和所述重叠比率，确定是否保留所述第i个检测框；

当所述重叠比率小于所述第二阈值时，保留所述第i个检测框；

其中，所述未发生抑制的检测框包括所有已保留的检测框。

在一个实施例中，所述根据所述第i个检测框的置信度和所述重叠比率，确定是否保留所述第i个检测框包括：

根据所述第i个检测框的置信度和所述重叠比率确定所述第i个检测框的新置信度；

判断所述新置信度是否大于或等于第三阈值；

其中，当所述新置信度大于或等于第三阈值时，保留所述第i个检测框；当所述新置信度小于所述第三阈值时，删除所述第i个检测框。

在一个实施例中，所述根据所述第i个检测框和所述最低检测框确定重叠比率包括：

获取所述第i个检测框的坐标范围；

获取所述最低检测框的坐标范围；

根据所述第i个检测框的坐标范围和所述第一个检测框的坐标范围，确定两者的交集面积和并集面积；

根据所述交集面积和所述并集面积，确定所述重叠比率。

在一个实施例中，所述从目标图像中提取由多个检测框组成的检测序列及每个所述检测框的置信度包括：

从目标图像中提取多个检测框及每个所述检测框的置信度；

将所述多个检测框按置信度从大到小排序，得到所述检测序列。

根据本公开实施例的第二方面，提供一种目标检测装置，包括：

提取模块，用于从目标图像中提取由多个检测框组成的检测序列及每个所述检测框的置信度；

保留模块，用于根据所述检测序列和每个所述检测框的置信度，保留未发生抑制的检测框；

生成模块，用于根据所述未发生抑制的检测框，生成用于确定所述目标图像内目标物的目标检测框。

在一个实施例中，所述检测序列中的检测框是按照置信度从小到大排列的；对于所述检测序列中的第i个检测框；所述i是大于1的整数；所述保留模块包括：

第一获取子模块，用于获取第i个检测框；

第二获取子模块，用于从已保留的检测框中获取置信度最低的最低检测框；

第一确定子模块，用于根据所述第i个检测框和所述最低检测框确定重叠比率；

删除子模块，用于当所述重叠比率大于或等于第一阈值时，删除所述第i个检测框；

第二确定子模块，用于当所述重叠比率小于所述第一阈值，且大于或等于第二阈值时，根据所述第i个检测框的置信度和所述重叠比率，确定是否保留所述第i个检测框；

保留子模块，用于当所述重叠比率小于所述第二阈值时，保留所述第i个检测框；

其中，所述未发生抑制的检测框包括所有已保留的检测框。

在一个实施例中，所述第二确定子模块包括：

第一确定单元，用于根据所述第i个检测框的置信度和所述重叠比率确定所述第i个检测框的新置信度；

判断单元，用于判断所述新置信度是否大于或等于第三阈值；

在一个实施例中，所述第一确定子模块包括：

第一获取单元，用于获取所述第i个检测框的坐标范围；

第二获取单元，用于获取所述最低检测框的坐标范围；

第二确定单元，用于根据所述第i个检测框的坐标范围和所述第一个检测框的坐标范围，确定两者的交集面积和并集面积；

根据所述交集面积和所述并集面积，确定所述重叠比率。

在一个实施例中，所述提取模块包括：

提取子模块，用于从目标图像中提取多个检测框及每个所述检测框的置信度；

排序子模块，用于将所述检测框按置信度从大到小排序，得到所述检测序列。

根据本公开实施例的第三方面，提供一种目标检测装置，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

本公开的实施例提供的技术方案可以包括以下有益效果：可以根据置信度到对可能发生抑制的检测框进行再判断，能够在某些误检的情况下找回一些检测框，避免如目前非极大值抑制方法暴力去除检测框的方法

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的目标检测方法的流程图。

图2是根据一示例性实施例示出的目标检测方法的流程图。

图3是根据一示例性实施例示出的目标检测方法的流程图。

图4是根据一示例性实施例示出的交集面积的示意图。

图5是根据一示例性实施例示出的并集面积的示意图。

图6是根据一示例性实施例示出的目标检测方法的流程图。

图7是根据一示例性实施例示出的目标检测方法的流程图。

图8是根据一示例性实施例示出的目标检测方法的流程图。

图9是根据一示例性实施例示出的目标检测方法的流程图。

图10是根据一示例性实施例示出的目标检测方法的流程图。

图11是根据一示例性实施例示出的目标检测方法的流程图。

图12是根据一示例性实施例示出的目标检测方法的流程图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

相关技术中，非极大值抑制方法大多通过判断两个检测框之间重叠面积是否大于一个预设值来判断，如果超过就直接删除其中一个。这种一刀切的方法很大程度上减少了重叠面积多的检测框，但是，如果存在误判，就损失了一个检测框，这样，最终得到的目标检测框很可能不能检测到完整目标。

图1是根据一示例性实施例示出的一种目标检测方法的流程图，如图1所示，目标检测方法用于目标检测装置中，该方法包括以下步骤101-103：

在步骤101中，从目标图像中提取由多个检测框组成的检测序列及每个检测框的置信度。

置信度是检测框的可信概率。检测序列的排序规则是预设的，本实施例的排序规则是按照置信度从小到达进行排序的。

本实施例中检测框提取方法包括很多种，例如，选择性搜索(SelectiveSearch，SS)、边缘箱(Edge Boxes，EB)。该检测框作为最终的目标检测框的一个候选区域，候选区域组成了目标检测框。检测框的图像中包括目标物的部分。

本实施例可以提取目标图像的特征图，通过上述检测框提取方法提取检测框及置信度。

在步骤102中，根据检测序列和每个检测框的置信度，保留未发生抑制的检测框。

本实施例中，未发生抑制的检测框至少满足置信度高，与其他检测框的重叠面积小这两个条件。

在步骤103中，根据未发生抑制的检测框，生成用于确定目标图像内目标物的目标检测框。

目标图像所展示的内容包括目标物，本实施例的目的就是为了确定目标物，假设目标物是人，那么目标检测框就是要在目标图像上确定每个人。

这里，目标检测框可以是由未发生检测框进行边框合并，得到的一个大检测框。

在一个实施例中，如图2所示，检测序列中的检测框是按照置信度从小到大排列的；对于检测序列中的第i个检测框；i是大于1的整数；如图1中的步骤102，即检测序列和每个检测框的置信度，保留未发生抑制的检测框，可以包括：

在步骤1021中，获取第i个检测框。

在步骤1022中，从已保留的检测框中获取置信度最低的最低检测框。

本实施例中，置信度最低的最低检测框是到目前为止，最后保留的检测框。

在步骤1023中，根据第i个检测框和最低检测框确定重叠比率。

重叠比率iou是两个检测框的相互重叠的面积与总体面积的比值。

在步骤1024中，当重叠比率大于或等于第一阈值时，删除第i个检测框。

如果重叠比率过大，那么，两个检测框覆盖的像素几乎相同，只需保留置信度高的检测框，本实施例中的检测序列中的检测框是由高到底排序的，因此，删除第i个检测框。第一阈值可以是0.7。

在步骤1025中，当重叠比率小于第一阈值，且大于或等于第二阈值时，根据第i个检测框的置信度和重叠比率，确定是否保留第i个检测框。

该范围内的重叠面积不算太大也不算太小，第i个检测框内未重叠部分可能也包括目标，如果直接删除，可能损失掉部分的目标，为了避免这种情况，需要再加入置信度对重叠比率进行检测。这里，第二阈值是0.3。

在步骤1026中，当重叠比率小于第二阈值时，保留第i个检测框。

重叠比率较小，说明重叠面积较小，因此，两个检测框覆盖的像素不尽相同，两者分别包括了目标物的较多的不同特征和较少的相同特征。

其中，未发生抑制的检测框包括所有已保留的检测框。

本实施例中，第1个检测框作为已保留的检测框中的第1个检测框。对于第2个检测框，计算第1个检测框和第2个检测框的重叠比率，从而确定是否保留第2个检测框。

在一个实施例中，如图3所示，图2中的步骤1025，即根据第i个检测框的置信度和重叠比率，确定是否保留第i个检测框，可以包括：

在步骤10251中，根据第i个检测框的置信度和重叠比率确定第i个检测框的新置信度。

对于与最低检测框重叠比率大的第i个检测框，如果其置信度高，说明第i个检测框是真检测框的可能性就大，因此，可以更大程度的保留了真检测框。

在步骤10252中，判断新置信度是否大于或等于第三阈值。

其中，当新置信度大于或等于第三阈值时，保留第i个检测框；当新置信度小于第三阈值时，删除第i个检测框。第三阈值是0.3。本实施例中第三阈值是通过经验选择出来的。

在一个实施例中，图3中的步骤10251，即根据第i个检测框和最低检测框确定重叠比率，可以包括：

获取第i个检测框的坐标范围；获取最低检测框的坐标范围；根据第i个检测框的坐标范围和第一个检测框的坐标范围，确定两者的交集面积和并集面积；根据交集面积和并集面积，确定重叠比率。

这里，交集面积是两个重叠面积，并集面积是两者总共的面积，如图4所示，黑色隐形面积是交集面积；如图5所示，斜条纹隐形面积是并集面积。

重叠比率iou的计算公式为：

iou＝area_交集/area_并集；

area_交集＝(min(xj_max,xi_max)-max(xj_min,xi_min))*(min(yj_max,yi_max)-max(yj_min,xi_min))；

area_并集＝(max(xj_max,xi_max)-min(xj_min,xi_min))*(max(yj_max,yi_max)-min(yj_min,xi_min))。

其中，最低检测框的坐标范围为(xj_min,yj_min,xj_max,yj_max)，最低检测框是检测序列的第j检测框，j是正整数，xj_min是第j检测框中最小横坐标，yj_min是第j检测框中最小纵坐标，xj_max是第j检测框中最大横坐标，yj_max是第j检测框中最大纵坐标；第i检测框的坐标范围为(xi_min,yi_min,xi_max,yi_max)；xi_min是第i检测框中最小横坐标，yi_min是第i检测框中最小纵坐标，xi_max是第i检测框中最大横坐标，yi_max是第i检测框中最大纵坐标。

在一个实施例中，如图6所示，图1中的步骤101，即从目标图像中提取由多个检测框组成的检测序列及每个检测框的置信度，可以包括：

在步骤1011中，从目标图像中提取多个检测框及每个检测框的置信度。

在步骤1012中，将多个检测框按置信度从大到小排序，得到检测序列。

下述为本公开装置实施例，可以用于执行本公开方法实施例。

图7是根据一示例性实施例示出的一种目标检测装置的框图，该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图7所示，该目标检测装置包括：

提取模块201，用于从目标图像中提取由多个检测框组成的检测序列及每个所述检测框的置信度；

保留模块202，用于根据所述检测序列和每个所述检测框的置信度，保留未发生抑制的检测框；

生成模块203，用于根据所述未发生抑制的检测框，生成用于确定所述目标图像内目标物的目标检测框。

在一个实施例中，如图8所示，所述检测序列中的检测框是按照置信度从小到大排列的；对于所述检测序列中的第i个检测框；所述i是大于1的整数；所述保留模块202包括：

第一获取子模块2021，用于获取第i个检测框；

第二获取子模块2022，用于从已保留的检测框中获取置信度最低的最低检测框；

第一确定子模块2023，用于根据所述第i个检测框和所述最低检测框确定重叠比率；

删除子模块2024，用于当所述重叠比率大于或等于第一阈值时，删除所述第i个检测框；

第二确定子模块2025，用于当所述重叠比率小于所述第一阈值，且大于或等于第二阈值时，根据所述第i个检测框的置信度和所述重叠比率，确定是否保留所述第i个检测框；

保留子模块2026，用于当所述重叠比率小于所述第二阈值时，保留所述第i个检测框；

其中，所述未发生抑制的检测框包括所有已保留的检测框。

在一个实施例中，如图9所示，所述第二确定子模块2025包括：

第一确定单元20251，用于根据所述第i个检测框的置信度和所述重叠比率确定所述第i个检测框的新置信度；

判断单元20252，用于判断所述新置信度是否大于或等于第三阈值；

在一个实施例中，如图10所示，所述第一确定子模块2023包括：

第一获取单元20231，用于获取所述第i个检测框的坐标范围；

第二获取单元20232，用于获取所述最低检测框的坐标范围；

第二确定单元20233，用于根据所述第i个检测框的坐标范围和所述第一个检测框的坐标范围，确定两者的交集面积和并集面积；

第三确定单元20234，用于根据所述交集面积和所述并集面积，确定所述重叠比率。

在一个实施例中，如图11所示，所述提取模块201包括：

提取子模块2011，用于从目标图像中提取多个检测框及每个所述检测框的置信度；

排序子模块2012，用于将所述检测框按置信度从大到小排序，得到所述检测序列。

处理器；

用于存储处理器可执行指令的存储器；

其中，处理器被配置为：

上述处理器还可被配置为：

所述检测序列中的检测框是按照置信度从小到大排列的；对于所述检测序列中的第i个检测框；所述i是大于1的整数；所述根据所述检测序列和每个所述检测框的置信度，保留未发生抑制的检测框包括：

获取第i个检测框；

从已保留的检测框中获取置信度最低的最低检测框；

根据所述第i个检测框和所述最低检测框确定重叠比率；

其中，所述未发生抑制的检测框包括所有已保留的检测框。

所述根据所述第i个检测框的置信度和所述重叠比率，确定是否保留所述第i个检测框包括：

判断所述新置信度是否大于或等于第三阈值；

所述根据所述第i个检测框和所述最低检测框确定重叠比率包括：

获取所述第i个检测框的坐标范围；

获取所述最低检测框的坐标范围；

根据所述交集面积和所述并集面积，确定所述重叠比率。

从目标图像中提取多个检测框及每个所述检测框的置信度；

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图12是根据一示例性实施例示出的一种用于目标检测装置的框图。例如，装置1900可以被提供为一服务器。装置1900包括处理组件1922，其进一步包括一个或多个处理器，以及由存储器1932所代表的存储器资源，用于存储可由处理组件1922的执行的指令，例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件1922被配置为执行指令，以执行上述方法。

装置1900还可以包括一个电源组件1926被配置为执行装置1900的电源管理，一个有线或无线网络接口1950被配置为将装置1900连接到网络，和一个输入输出(I/O)接口1958。装置1900可以操作基于存储在存储器1932的操作系统，例如Windows ServerTM，MacOS XTM，UnixTM,LinuxTM，FreeBSDTM或类似。

一种非临时性计算机可读存储介质，当所述存储介质中的指令由装置1900的处理器执行时，使得装置1900能够执行上述目标检测方法，所述方法包括：

获取第i个检测框；

从已保留的检测框中获取置信度最低的最低检测框；

根据所述第i个检测框和所述最低检测框确定重叠比率；

其中，所述未发生抑制的检测框包括所有已保留的检测框。

判断所述新置信度是否大于或等于第三阈值；

获取所述第i个检测框的坐标范围；

获取所述最低检测框的坐标范围；

根据所述交集面积和所述并集面积，确定所述重叠比率。

所述从目标图像中提取由多个检测框组成的检测序列及每个所述检测框的置信度包括：

从目标图像中提取多个检测框及每个所述检测框的置信度；

本领域技术人员在考虑说明书及实践这里公开的公开后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种目标检测方法，其特征在于，包括：

根据所述未发生抑制的检测框，生成用于确定所述目标图像内目标物的目标检测框，

获取第i个检测框；

从已保留的检测框中获取置信度最低的最低检测框；

根据所述第i个检测框和所述最低检测框确定重叠比率；

其中，所述未发生抑制的检测框包括所有已保留的检测框。

2.根据权利要求1所述的方法，其特征在于，所述根据所述第i个检测框的置信度和所述重叠比率，确定是否保留所述第i个检测框包括：

判断所述新置信度是否大于或等于第三阈值；

3.根据权利要求2所述的方法，其特征在于，所述根据所述第i个检测框和所述最低检测框确定重叠比率包括：

获取所述第i个检测框的坐标范围；

获取所述最低检测框的坐标范围；

根据所述第i个检测框的坐标范围和所述最低检测框的坐标范围，确定两者的交集面积和并集面积；

根据所述交集面积和所述并集面积，确定所述重叠比率。

4.根据权利要求1所述的方法，其特征在于，所述从目标图像中提取由多个检测框组成的检测序列及每个所述检测框的置信度包括：

从目标图像中提取多个检测框及每个所述检测框的置信度；

5.一种目标检测装置，其特征在于，包括：

生成模块，用于根据所述未发生抑制的检测框，生成用于确定所述目标图像内目标物的目标检测框，

所述检测序列中的检测框是按照置信度从小到大排列的；对于所述检测序列中的第i个检测框；所述i是大于1的整数；所述保留模块包括：

第一获取子模块，用于获取第i个检测框；

其中，所述未发生抑制的检测框包括所有已保留的检测框。

6.根据权利要求5所述的装置，其特征在于，所述第二确定子模块包括：

7.根据权利要求6所述的装置，其特征在于，所述第一确定子模块包括：

第一获取单元，用于获取所述第i个检测框的坐标范围；

第二获取单元，用于获取所述最低检测框的坐标范围；

第二确定单元，用于根据所述第i个检测框的坐标范围和所述最低检测框的坐标范围，确定两者的交集面积和并集面积；

第三确定单元，用于根据所述交集面积和所述并集面积，确定所述重叠比率。

8.根据权利要求5所述的装置，其特征在于，所述提取模块包括：

9.一种目标检测装置，其特征在于，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

获取第i个检测框；

从已保留的检测框中获取置信度最低的最低检测框；

根据所述第i个检测框和所述最低检测框确定重叠比率；

其中，所述未发生抑制的检测框包括所有已保留的检测框。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1-4任一项所述方法的步骤。