CN108009544B - 目标检测方法及装置 - Google Patents

目标检测方法及装置 Download PDF

Info

Publication number
CN108009544B
CN108009544B CN201711332697.2A CN201711332697A CN108009544B CN 108009544 B CN108009544 B CN 108009544B CN 201711332697 A CN201711332697 A CN 201711332697A CN 108009544 B CN108009544 B CN 108009544B
Authority
CN
China
Prior art keywords
detection
ith
confidence
detection frame
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711332697.2A
Other languages
English (en)
Other versions
CN108009544A (zh
Inventor
张水发
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Mobile Software Co Ltd
Original Assignee
Beijing Xiaomi Mobile Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Mobile Software Co Ltd filed Critical Beijing Xiaomi Mobile Software Co Ltd
Priority to CN201711332697.2A priority Critical patent/CN108009544B/zh
Publication of CN108009544A publication Critical patent/CN108009544A/zh
Application granted granted Critical
Publication of CN108009544B publication Critical patent/CN108009544B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/245Aligning, centring, orientation detection or correction of the image by locating a pattern; Special marks for positioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本公开是关于目标检测方法及装置。该方法包括:从目标图像中提取由多个检测框组成的检测序列及每个所述检测框的置信度;根据所述检测序列和每个所述检测框的置信度,保留未发生抑制的检测框;根据所述未发生抑制的检测框,生成用于确定所述目标图像内目标物的目标检测框。该技术方案可以根据置信度到对可能发生抑制的检测框进行再判断,能够在某些误检的情况下找回一些检测框,提高检测的准确性。

Description

目标检测方法及装置
技术领域
本公开涉及图像处理领域,尤其涉及目标检测方法及装置。
背景技术
非极大值抑制在目标检测、目标定位等领域是一种被广泛使用的方法。对于目标具体位置定位过程,不管是基于滑动窗口还是选择性搜索方法,都会产生好多的候选区域。实际看到的情形就是好多区域的交叉重叠,难以满足实际的应用。目前的非极大值抑制方法会删除所有的发生抑制的候选区域。
发明内容
本公开实施例提供目标检测方法及装置。所述技术方案如下:
根据本公开实施例的第一方面,提供一种目标检测方法,包括:
从目标图像中提取由多个检测框组成的检测序列及每个所述检测框的置信度;
根据所述检测序列和每个所述检测框的置信度,保留未发生抑制的检测框;
根据所述未发生抑制的检测框,生成用于确定所述目标图像内目标物的目标检测框。
在一个实施例中,所述检测序列中的检测框是按照置信度从小到大排列的;对于所述检测序列中的第i个检测框;所述i是大于1的整数;所述根据所述检测序列和每个所述检测框的置信度,保留未发生抑制的检测框包括:
获取第i个检测框;
从已保留的检测框中获取置信度最低的最低检测框;
根据所述第i个检测框和所述最低检测框确定重叠比率;
当所述重叠比率大于或等于第一阈值时,删除所述第i个检测框;
当所述重叠比率小于所述第一阈值,且大于或等于第二阈值时,根据所述第i个检测框的置信度和所述重叠比率,确定是否保留所述第i个检测框;
当所述重叠比率小于所述第二阈值时,保留所述第i个检测框;
其中,所述未发生抑制的检测框包括所有已保留的检测框。
在一个实施例中,所述根据所述第i个检测框的置信度和所述重叠比率,确定是否保留所述第i个检测框包括:
根据所述第i个检测框的置信度和所述重叠比率确定所述第i个检测框的新置信度;
判断所述新置信度是否大于或等于第三阈值;
其中,当所述新置信度大于或等于第三阈值时,保留所述第i个检测框;当所述新置信度小于所述第三阈值时,删除所述第i个检测框。
在一个实施例中,所述根据所述第i个检测框和所述最低检测框确定重叠比率包括:
获取所述第i个检测框的坐标范围;
获取所述最低检测框的坐标范围;
根据所述第i个检测框的坐标范围和所述第一个检测框的坐标范围,确定两者的交集面积和并集面积;
根据所述交集面积和所述并集面积,确定所述重叠比率。
在一个实施例中,所述从目标图像中提取由多个检测框组成的检测序列及每个所述检测框的置信度包括:
从目标图像中提取多个检测框及每个所述检测框的置信度;
将所述多个检测框按置信度从大到小排序,得到所述检测序列。
根据本公开实施例的第二方面,提供一种目标检测装置,包括:
提取模块,用于从目标图像中提取由多个检测框组成的检测序列及每个所述检测框的置信度;
保留模块,用于根据所述检测序列和每个所述检测框的置信度,保留未发生抑制的检测框;
生成模块,用于根据所述未发生抑制的检测框,生成用于确定所述目标图像内目标物的目标检测框。
在一个实施例中,所述检测序列中的检测框是按照置信度从小到大排列的;对于所述检测序列中的第i个检测框;所述i是大于1的整数;所述保留模块包括:
第一获取子模块,用于获取第i个检测框;
第二获取子模块,用于从已保留的检测框中获取置信度最低的最低检测框;
第一确定子模块,用于根据所述第i个检测框和所述最低检测框确定重叠比率;
删除子模块,用于当所述重叠比率大于或等于第一阈值时,删除所述第i个检测框;
第二确定子模块,用于当所述重叠比率小于所述第一阈值,且大于或等于第二阈值时,根据所述第i个检测框的置信度和所述重叠比率,确定是否保留所述第i个检测框;
保留子模块,用于当所述重叠比率小于所述第二阈值时,保留所述第i个检测框;
其中,所述未发生抑制的检测框包括所有已保留的检测框。
在一个实施例中,所述第二确定子模块包括:
第一确定单元,用于根据所述第i个检测框的置信度和所述重叠比率确定所述第i个检测框的新置信度;
判断单元,用于判断所述新置信度是否大于或等于第三阈值;
其中,当所述新置信度大于或等于第三阈值时,保留所述第i个检测框;当所述新置信度小于所述第三阈值时,删除所述第i个检测框。
在一个实施例中,所述第一确定子模块包括:
第一获取单元,用于获取所述第i个检测框的坐标范围;
第二获取单元,用于获取所述最低检测框的坐标范围;
第二确定单元,用于根据所述第i个检测框的坐标范围和所述第一个检测框的坐标范围,确定两者的交集面积和并集面积;
根据所述交集面积和所述并集面积,确定所述重叠比率。
在一个实施例中,所述提取模块包括:
提取子模块,用于从目标图像中提取多个检测框及每个所述检测框的置信度;
排序子模块,用于将所述检测框按置信度从大到小排序,得到所述检测序列。
根据本公开实施例的第三方面,提供一种目标检测装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
从目标图像中提取由多个检测框组成的检测序列及每个所述检测框的置信度;
根据所述检测序列和每个所述检测框的置信度,保留未发生抑制的检测框;
根据所述未发生抑制的检测框,生成用于确定所述目标图像内目标物的目标检测框。
本公开的实施例提供的技术方案可以包括以下有益效果:可以根据置信度到对可能发生抑制的检测框进行再判断,能够在某些误检的情况下找回一些检测框,避免如目前非极大值抑制方法暴力去除检测框的方法
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的目标检测方法的流程图。
图2是根据一示例性实施例示出的目标检测方法的流程图。
图3是根据一示例性实施例示出的目标检测方法的流程图。
图4是根据一示例性实施例示出的交集面积的示意图。
图5是根据一示例性实施例示出的并集面积的示意图。
图6是根据一示例性实施例示出的目标检测方法的流程图。
图7是根据一示例性实施例示出的目标检测方法的流程图。
图8是根据一示例性实施例示出的目标检测方法的流程图。
图9是根据一示例性实施例示出的目标检测方法的流程图。
图10是根据一示例性实施例示出的目标检测方法的流程图。
图11是根据一示例性实施例示出的目标检测方法的流程图。
图12是根据一示例性实施例示出的目标检测方法的流程图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
相关技术中,非极大值抑制方法大多通过判断两个检测框之间重叠面积是否大于一个预设值来判断,如果超过就直接删除其中一个。这种一刀切的方法很大程度上减少了重叠面积多的检测框,但是,如果存在误判,就损失了一个检测框,这样,最终得到的目标检测框很可能不能检测到完整目标。
图1是根据一示例性实施例示出的一种目标检测方法的流程图,如图1所示,目标检测方法用于目标检测装置中,该方法包括以下步骤101-103:
在步骤101中,从目标图像中提取由多个检测框组成的检测序列及每个检测框的置信度。
置信度是检测框的可信概率。检测序列的排序规则是预设的,本实施例的排序规则是按照置信度从小到达进行排序的。
本实施例中检测框提取方法包括很多种,例如,选择性搜索(SelectiveSearch,SS)、边缘箱(Edge Boxes,EB)。该检测框作为最终的目标检测框的一个候选区域,候选区域组成了目标检测框。检测框的图像中包括目标物的部分。
本实施例可以提取目标图像的特征图,通过上述检测框提取方法提取检测框及置信度。
在步骤102中,根据检测序列和每个检测框的置信度,保留未发生抑制的检测框。
本实施例中,未发生抑制的检测框至少满足置信度高,与其他检测框的重叠面积小这两个条件。
在步骤103中,根据未发生抑制的检测框,生成用于确定目标图像内目标物的目标检测框。
目标图像所展示的内容包括目标物,本实施例的目的就是为了确定目标物,假设目标物是人,那么目标检测框就是要在目标图像上确定每个人。
这里,目标检测框可以是由未发生检测框进行边框合并,得到的一个大检测框。
在一个实施例中,如图2所示,检测序列中的检测框是按照置信度从小到大排列的;对于检测序列中的第i个检测框;i是大于1的整数;如图1中的步骤102,即检测序列和每个检测框的置信度,保留未发生抑制的检测框,可以包括:
在步骤1021中,获取第i个检测框。
在步骤1022中,从已保留的检测框中获取置信度最低的最低检测框。
本实施例中,置信度最低的最低检测框是到目前为止,最后保留的检测框。
在步骤1023中,根据第i个检测框和最低检测框确定重叠比率。
重叠比率iou是两个检测框的相互重叠的面积与总体面积的比值。
在步骤1024中,当重叠比率大于或等于第一阈值时,删除第i个检测框。
如果重叠比率过大,那么,两个检测框覆盖的像素几乎相同,只需保留置信度高的检测框,本实施例中的检测序列中的检测框是由高到底排序的,因此,删除第i个检测框。第一阈值可以是0.7。
在步骤1025中,当重叠比率小于第一阈值,且大于或等于第二阈值时,根据第i个检测框的置信度和重叠比率,确定是否保留第i个检测框。
该范围内的重叠面积不算太大也不算太小,第i个检测框内未重叠部分可能也包括目标,如果直接删除,可能损失掉部分的目标,为了避免这种情况,需要再加入置信度对重叠比率进行检测。这里,第二阈值是0.3。
在步骤1026中,当重叠比率小于第二阈值时,保留第i个检测框。
重叠比率较小,说明重叠面积较小,因此,两个检测框覆盖的像素不尽相同,两者分别包括了目标物的较多的不同特征和较少的相同特征。
其中,未发生抑制的检测框包括所有已保留的检测框。
本实施例中,第1个检测框作为已保留的检测框中的第1个检测框。对于第2个检测框,计算第1个检测框和第2个检测框的重叠比率,从而确定是否保留第2个检测框。
在一个实施例中,如图3所示,图2中的步骤1025,即根据第i个检测框的置信度和重叠比率,确定是否保留第i个检测框,可以包括:
在步骤10251中,根据第i个检测框的置信度和重叠比率确定第i个检测框的新置信度。
对于与最低检测框重叠比率大的第i个检测框,如果其置信度高,说明第i个检测框是真检测框的可能性就大,因此,可以更大程度的保留了真检测框。
在步骤10252中,判断新置信度是否大于或等于第三阈值。
其中,当新置信度大于或等于第三阈值时,保留第i个检测框;当新置信度小于第三阈值时,删除第i个检测框。第三阈值是0.3。本实施例中第三阈值是通过经验选择出来的。
在一个实施例中,图3中的步骤10251,即根据第i个检测框和最低检测框确定重叠比率,可以包括:
获取第i个检测框的坐标范围;获取最低检测框的坐标范围;根据第i个检测框的坐标范围和第一个检测框的坐标范围,确定两者的交集面积和并集面积;根据交集面积和并集面积,确定重叠比率。
这里,交集面积是两个重叠面积,并集面积是两者总共的面积,如图4所示,黑色隐形面积是交集面积;如图5所示,斜条纹隐形面积是并集面积。
重叠比率iou的计算公式为:
iou=area交集/area并集
area交集=(min(xjmax,ximax)-max(xjmin,ximin))*(min(yjmax,yimax)-max(yjmin,ximin));
area并集=(max(xjmax,ximax)-min(xjmin,ximin))*(max(yjmax,yimax)-min(yjmin,ximin))。
其中,最低检测框的坐标范围为(xjmin,yjmin,xjmax,yjmax),最低检测框是检测序列的第j检测框,j是正整数,xjmin是第j检测框中最小横坐标,yjmin是第j检测框中最小纵坐标,xjmax是第j检测框中最大横坐标,yjmax是第j检测框中最大纵坐标;第i检测框的坐标范围为(ximin,yimin,ximax,yimax);ximin是第i检测框中最小横坐标,yimin是第i检测框中最小纵坐标,ximax是第i检测框中最大横坐标,yimax是第i检测框中最大纵坐标。
在一个实施例中,如图6所示,图1中的步骤101,即从目标图像中提取由多个检测框组成的检测序列及每个检测框的置信度,可以包括:
在步骤1011中,从目标图像中提取多个检测框及每个检测框的置信度。
在步骤1012中,将多个检测框按置信度从大到小排序,得到检测序列。
下述为本公开装置实施例,可以用于执行本公开方法实施例。
图7是根据一示例性实施例示出的一种目标检测装置的框图,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图7所示,该目标检测装置包括:
提取模块201,用于从目标图像中提取由多个检测框组成的检测序列及每个所述检测框的置信度;
保留模块202,用于根据所述检测序列和每个所述检测框的置信度,保留未发生抑制的检测框;
生成模块203,用于根据所述未发生抑制的检测框,生成用于确定所述目标图像内目标物的目标检测框。
在一个实施例中,如图8所示,所述检测序列中的检测框是按照置信度从小到大排列的;对于所述检测序列中的第i个检测框;所述i是大于1的整数;所述保留模块202包括:
第一获取子模块2021,用于获取第i个检测框;
第二获取子模块2022,用于从已保留的检测框中获取置信度最低的最低检测框;
第一确定子模块2023,用于根据所述第i个检测框和所述最低检测框确定重叠比率;
删除子模块2024,用于当所述重叠比率大于或等于第一阈值时,删除所述第i个检测框;
第二确定子模块2025,用于当所述重叠比率小于所述第一阈值,且大于或等于第二阈值时,根据所述第i个检测框的置信度和所述重叠比率,确定是否保留所述第i个检测框;
保留子模块2026,用于当所述重叠比率小于所述第二阈值时,保留所述第i个检测框;
其中,所述未发生抑制的检测框包括所有已保留的检测框。
在一个实施例中,如图9所示,所述第二确定子模块2025包括:
第一确定单元20251,用于根据所述第i个检测框的置信度和所述重叠比率确定所述第i个检测框的新置信度;
判断单元20252,用于判断所述新置信度是否大于或等于第三阈值;
其中,当所述新置信度大于或等于第三阈值时,保留所述第i个检测框;当所述新置信度小于所述第三阈值时,删除所述第i个检测框。
在一个实施例中,如图10所示,所述第一确定子模块2023包括:
第一获取单元20231,用于获取所述第i个检测框的坐标范围;
第二获取单元20232,用于获取所述最低检测框的坐标范围;
第二确定单元20233,用于根据所述第i个检测框的坐标范围和所述第一个检测框的坐标范围,确定两者的交集面积和并集面积;
第三确定单元20234,用于根据所述交集面积和所述并集面积,确定所述重叠比率。
在一个实施例中,如图11所示,所述提取模块201包括:
提取子模块2011,用于从目标图像中提取多个检测框及每个所述检测框的置信度;
排序子模块2012,用于将所述检测框按置信度从大到小排序,得到所述检测序列。
根据本公开实施例的第三方面,提供一种目标检测装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,处理器被配置为:
从目标图像中提取由多个检测框组成的检测序列及每个所述检测框的置信度;
根据所述检测序列和每个所述检测框的置信度,保留未发生抑制的检测框;
根据所述未发生抑制的检测框,生成用于确定所述目标图像内目标物的目标检测框。
上述处理器还可被配置为:
所述检测序列中的检测框是按照置信度从小到大排列的;对于所述检测序列中的第i个检测框;所述i是大于1的整数;所述根据所述检测序列和每个所述检测框的置信度,保留未发生抑制的检测框包括:
获取第i个检测框;
从已保留的检测框中获取置信度最低的最低检测框;
根据所述第i个检测框和所述最低检测框确定重叠比率;
当所述重叠比率大于或等于第一阈值时,删除所述第i个检测框;
当所述重叠比率小于所述第一阈值,且大于或等于第二阈值时,根据所述第i个检测框的置信度和所述重叠比率,确定是否保留所述第i个检测框;
当所述重叠比率小于所述第二阈值时,保留所述第i个检测框;
其中,所述未发生抑制的检测框包括所有已保留的检测框。
所述根据所述第i个检测框的置信度和所述重叠比率,确定是否保留所述第i个检测框包括:
根据所述第i个检测框的置信度和所述重叠比率确定所述第i个检测框的新置信度;
判断所述新置信度是否大于或等于第三阈值;
其中,当所述新置信度大于或等于第三阈值时,保留所述第i个检测框;当所述新置信度小于所述第三阈值时,删除所述第i个检测框。
所述根据所述第i个检测框和所述最低检测框确定重叠比率包括:
获取所述第i个检测框的坐标范围;
获取所述最低检测框的坐标范围;
根据所述第i个检测框的坐标范围和所述第一个检测框的坐标范围,确定两者的交集面积和并集面积;
根据所述交集面积和所述并集面积,确定所述重叠比率。
在一个实施例中,所述从目标图像中提取由多个检测框组成的检测序列及每个所述检测框的置信度包括:
从目标图像中提取多个检测框及每个所述检测框的置信度;
将所述多个检测框按置信度从大到小排序,得到所述检测序列。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图12是根据一示例性实施例示出的一种用于目标检测装置的框图。例如,装置1900可以被提供为一服务器。装置1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。
装置1900还可以包括一个电源组件1926被配置为执行装置1900的电源管理,一个有线或无线网络接口1950被配置为将装置1900连接到网络,和一个输入输出(I/O)接口1958。装置1900可以操作基于存储在存储器1932的操作系统,例如Windows ServerTM,MacOS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置1900的处理器执行时,使得装置1900能够执行上述目标检测方法,所述方法包括:
从目标图像中提取由多个检测框组成的检测序列及每个所述检测框的置信度;
根据所述检测序列和每个所述检测框的置信度,保留未发生抑制的检测框;
根据所述未发生抑制的检测框,生成用于确定所述目标图像内目标物的目标检测框。
所述检测序列中的检测框是按照置信度从小到大排列的;对于所述检测序列中的第i个检测框;所述i是大于1的整数;所述根据所述检测序列和每个所述检测框的置信度,保留未发生抑制的检测框包括:
获取第i个检测框;
从已保留的检测框中获取置信度最低的最低检测框;
根据所述第i个检测框和所述最低检测框确定重叠比率;
当所述重叠比率大于或等于第一阈值时,删除所述第i个检测框;
当所述重叠比率小于所述第一阈值,且大于或等于第二阈值时,根据所述第i个检测框的置信度和所述重叠比率,确定是否保留所述第i个检测框;
当所述重叠比率小于所述第二阈值时,保留所述第i个检测框;
其中,所述未发生抑制的检测框包括所有已保留的检测框。
所述根据所述第i个检测框的置信度和所述重叠比率,确定是否保留所述第i个检测框包括:
根据所述第i个检测框的置信度和所述重叠比率确定所述第i个检测框的新置信度;
判断所述新置信度是否大于或等于第三阈值;
其中,当所述新置信度大于或等于第三阈值时,保留所述第i个检测框;当所述新置信度小于所述第三阈值时,删除所述第i个检测框。
所述根据所述第i个检测框和所述最低检测框确定重叠比率包括:
获取所述第i个检测框的坐标范围;
获取所述最低检测框的坐标范围;
根据所述第i个检测框的坐标范围和所述第一个检测框的坐标范围,确定两者的交集面积和并集面积;
根据所述交集面积和所述并集面积,确定所述重叠比率。
所述从目标图像中提取由多个检测框组成的检测序列及每个所述检测框的置信度包括:
从目标图像中提取多个检测框及每个所述检测框的置信度;
将所述多个检测框按置信度从大到小排序,得到所述检测序列。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种目标检测方法,其特征在于,包括:
从目标图像中提取由多个检测框组成的检测序列及每个所述检测框的置信度;
根据所述检测序列和每个所述检测框的置信度,保留未发生抑制的检测框;
根据所述未发生抑制的检测框,生成用于确定所述目标图像内目标物的目标检测框,
所述检测序列中的检测框是按照置信度从小到大排列的;对于所述检测序列中的第i个检测框;所述i是大于1的整数;所述根据所述检测序列和每个所述检测框的置信度,保留未发生抑制的检测框包括:
获取第i个检测框;
从已保留的检测框中获取置信度最低的最低检测框;
根据所述第i个检测框和所述最低检测框确定重叠比率;
当所述重叠比率大于或等于第一阈值时,删除所述第i个检测框;
当所述重叠比率小于所述第一阈值,且大于或等于第二阈值时,根据所述第i个检测框的置信度和所述重叠比率,确定是否保留所述第i个检测框;
当所述重叠比率小于所述第二阈值时,保留所述第i个检测框;
其中,所述未发生抑制的检测框包括所有已保留的检测框。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第i个检测框的置信度和所述重叠比率,确定是否保留所述第i个检测框包括:
根据所述第i个检测框的置信度和所述重叠比率确定所述第i个检测框的新置信度;
判断所述新置信度是否大于或等于第三阈值;
其中,当所述新置信度大于或等于第三阈值时,保留所述第i个检测框;当所述新置信度小于所述第三阈值时,删除所述第i个检测框。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第i个检测框和所述最低检测框确定重叠比率包括:
获取所述第i个检测框的坐标范围;
获取所述最低检测框的坐标范围;
根据所述第i个检测框的坐标范围和所述最低检测框的坐标范围,确定两者的交集面积和并集面积;
根据所述交集面积和所述并集面积,确定所述重叠比率。
4.根据权利要求1所述的方法,其特征在于,所述从目标图像中提取由多个检测框组成的检测序列及每个所述检测框的置信度包括:
从目标图像中提取多个检测框及每个所述检测框的置信度;
将所述多个检测框按置信度从大到小排序,得到所述检测序列。
5.一种目标检测装置,其特征在于,包括:
提取模块,用于从目标图像中提取由多个检测框组成的检测序列及每个所述检测框的置信度;
保留模块,用于根据所述检测序列和每个所述检测框的置信度,保留未发生抑制的检测框;
生成模块,用于根据所述未发生抑制的检测框,生成用于确定所述目标图像内目标物的目标检测框,
所述检测序列中的检测框是按照置信度从小到大排列的;对于所述检测序列中的第i个检测框;所述i是大于1的整数;所述保留模块包括:
第一获取子模块,用于获取第i个检测框;
第二获取子模块,用于从已保留的检测框中获取置信度最低的最低检测框;
第一确定子模块,用于根据所述第i个检测框和所述最低检测框确定重叠比率;
删除子模块,用于当所述重叠比率大于或等于第一阈值时,删除所述第i个检测框;
第二确定子模块,用于当所述重叠比率小于所述第一阈值,且大于或等于第二阈值时,根据所述第i个检测框的置信度和所述重叠比率,确定是否保留所述第i个检测框;
保留子模块,用于当所述重叠比率小于所述第二阈值时,保留所述第i个检测框;
其中,所述未发生抑制的检测框包括所有已保留的检测框。
6.根据权利要求5所述的装置,其特征在于,所述第二确定子模块包括:
第一确定单元,用于根据所述第i个检测框的置信度和所述重叠比率确定所述第i个检测框的新置信度;
判断单元,用于判断所述新置信度是否大于或等于第三阈值;
其中,当所述新置信度大于或等于第三阈值时,保留所述第i个检测框;当所述新置信度小于所述第三阈值时,删除所述第i个检测框。
7.根据权利要求6所述的装置,其特征在于,所述第一确定子模块包括:
第一获取单元,用于获取所述第i个检测框的坐标范围;
第二获取单元,用于获取所述最低检测框的坐标范围;
第二确定单元,用于根据所述第i个检测框的坐标范围和所述最低检测框的坐标范围,确定两者的交集面积和并集面积;
第三确定单元,用于根据所述交集面积和所述并集面积,确定所述重叠比率。
8.根据权利要求5所述的装置,其特征在于,所述提取模块包括:
提取子模块,用于从目标图像中提取多个检测框及每个所述检测框的置信度;
排序子模块,用于将所述检测框按置信度从大到小排序,得到所述检测序列。
9.一种目标检测装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
从目标图像中提取由多个检测框组成的检测序列及每个所述检测框的置信度;
根据所述检测序列和每个所述检测框的置信度,保留未发生抑制的检测框;
根据所述未发生抑制的检测框,生成用于确定所述目标图像内目标物的目标检测框,
所述检测序列中的检测框是按照置信度从小到大排列的;对于所述检测序列中的第i个检测框;所述i是大于1的整数;所述根据所述检测序列和每个所述检测框的置信度,保留未发生抑制的检测框包括:
获取第i个检测框;
从已保留的检测框中获取置信度最低的最低检测框;
根据所述第i个检测框和所述最低检测框确定重叠比率;
当所述重叠比率大于或等于第一阈值时,删除所述第i个检测框;
当所述重叠比率小于所述第一阈值,且大于或等于第二阈值时,根据所述第i个检测框的置信度和所述重叠比率,确定是否保留所述第i个检测框;
当所述重叠比率小于所述第二阈值时,保留所述第i个检测框;
其中,所述未发生抑制的检测框包括所有已保留的检测框。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-4任一项所述方法的步骤。
CN201711332697.2A 2017-12-13 2017-12-13 目标检测方法及装置 Active CN108009544B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711332697.2A CN108009544B (zh) 2017-12-13 2017-12-13 目标检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711332697.2A CN108009544B (zh) 2017-12-13 2017-12-13 目标检测方法及装置

Publications (2)

Publication Number Publication Date
CN108009544A CN108009544A (zh) 2018-05-08
CN108009544B true CN108009544B (zh) 2021-08-31

Family

ID=62058911

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711332697.2A Active CN108009544B (zh) 2017-12-13 2017-12-13 目标检测方法及装置

Country Status (1)

Country Link
CN (1) CN108009544B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108960174A (zh) * 2018-07-12 2018-12-07 广东工业大学 一种目标检测结果优化方法及装置
CN110826572B (zh) * 2018-08-09 2023-04-21 京东方科技集团股份有限公司 多目标检测的非极大值抑制方法、装置及设备
CN109145931B (zh) * 2018-09-03 2019-11-05 百度在线网络技术(北京)有限公司 物体检测方法、装置及存储介质
CN109344899B (zh) * 2018-09-30 2022-05-17 百度在线网络技术(北京)有限公司 多目标检测方法、装置和电子设备
CN109410601A (zh) * 2018-12-04 2019-03-01 北京英泰智科技股份有限公司 交通信号灯控制方法、装置、电子设备及存储介质
CN110033424A (zh) * 2019-04-18 2019-07-19 北京迈格威科技有限公司 图像处理的方法、装置、电子设备及计算机可读存储介质
CN110210474B (zh) 2019-04-30 2021-06-01 北京市商汤科技开发有限公司 目标检测方法及装置、设备及存储介质
CN110852321B (zh) * 2019-11-11 2022-11-22 北京百度网讯科技有限公司 候选框过滤方法、装置以及电子设备
CN111144475A (zh) * 2019-12-22 2020-05-12 上海眼控科技股份有限公司 车厢座位的确定方法、装置、电子设备及可读存储介质
CN113221929A (zh) * 2020-02-05 2021-08-06 华为技术有限公司 一种图像处理方法以及相关设备
CN111413702B (zh) * 2020-05-13 2022-04-05 中国水产科学研究院渔业机械仪器研究所 用于宽带探鱼仪的高效目标分割方法
CN111738263A (zh) * 2020-08-24 2020-10-02 北京易真学思教育科技有限公司 目标检测方法、装置、电子设备及存储介质
CN113255648B (zh) * 2021-06-21 2023-12-19 北博(厦门)智能科技有限公司 一种基于图像识别的滑动窗口框选方法及终端
CN114140830A (zh) * 2021-12-09 2022-03-04 广东亿云付科技有限公司 一种基于循环肿瘤细胞图像的重复识别抑制方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9166961B1 (en) * 2012-12-11 2015-10-20 Amazon Technologies, Inc. Social networking behavior-based identity system
US9514366B2 (en) * 2014-02-03 2016-12-06 Xerox Corporation Vehicle detection method and system including irrelevant window elimination and/or window score degradation
CN106527455A (zh) * 2017-01-03 2017-03-22 北京博瑞空间科技发展有限公司 无人机降落控制方法及装置
CN106651955A (zh) * 2016-10-10 2017-05-10 北京小米移动软件有限公司 图片中目标物的定位方法及装置
CN106991408A (zh) * 2017-04-14 2017-07-28 电子科技大学 一种候选框生成网络的生成方法及人脸检测方法
US9734587B2 (en) * 2015-09-30 2017-08-15 Apple Inc. Long term object tracker
CN107403158A (zh) * 2017-07-28 2017-11-28 中国电子科技集团公司第三十八研究所 一种人员在岗视频识别方法及智能用户信息传输装置
CN109101859A (zh) * 2017-06-21 2018-12-28 北京大学深圳研究生院 使用高斯惩罚检测图像中行人的方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9166961B1 (en) * 2012-12-11 2015-10-20 Amazon Technologies, Inc. Social networking behavior-based identity system
US9514366B2 (en) * 2014-02-03 2016-12-06 Xerox Corporation Vehicle detection method and system including irrelevant window elimination and/or window score degradation
US9734587B2 (en) * 2015-09-30 2017-08-15 Apple Inc. Long term object tracker
CN106651955A (zh) * 2016-10-10 2017-05-10 北京小米移动软件有限公司 图片中目标物的定位方法及装置
CN106527455A (zh) * 2017-01-03 2017-03-22 北京博瑞空间科技发展有限公司 无人机降落控制方法及装置
CN106991408A (zh) * 2017-04-14 2017-07-28 电子科技大学 一种候选框生成网络的生成方法及人脸检测方法
CN109101859A (zh) * 2017-06-21 2018-12-28 北京大学深圳研究生院 使用高斯惩罚检测图像中行人的方法
CN107403158A (zh) * 2017-07-28 2017-11-28 中国电子科技集团公司第三十八研究所 一种人员在岗视频识别方法及智能用户信息传输装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ROBUST OBJECT SEGMENTATION USING ADAPTIVE THRESHOLDING;Xiaxi Huang et al;《2007 IEEE International Conference on Image Processing》;20071112;45-48页 *
改进星型级联可形变部件模型的行人检测;韦皓瀚等;《中国图像图形学报》;20170228;170-178页 *

Also Published As

Publication number Publication date
CN108009544A (zh) 2018-05-08

Similar Documents

Publication Publication Date Title
CN108009544B (zh) 目标检测方法及装置
CN109325964B (zh) 一种人脸追踪方法、装置及终端
CN108108739B (zh) 图像目标区域的检测方法、装置、x射线系统及存储介质
CN109426785B (zh) 一种人体目标身份识别方法及装置
CN106971401B (zh) 多目标跟踪装置和方法
US8355079B2 (en) Temporally consistent caption detection on videos using a 3D spatiotemporal method
US20170358093A1 (en) Method and apparatus for updating a background model
US9082181B2 (en) Image processing method and apparatus
JP7093427B2 (ja) オブジェクト追跡方法および装置、電子設備並びに記憶媒体
KR102552968B1 (ko) 다중 객체 추적 방법 및 이를 위한 장치
KR20140031742A (ko) 이미지 특징 추출 장치 및 이미지 특징 추출 방법, 그를 이용한 영상 처리 시스템
CN109389019B (zh) 人脸图像选择方法、装置及计算机设备
US20180047271A1 (en) Fire detection method, fire detection apparatus and electronic equipment
CN110163857B (zh) 图像背景区域的检测方法、装置、存储介质及x射线系统
KR20220093187A (ko) 포지셔닝 방법 및 장치, 전자 기기, 컴퓨터 판독 가능 저장 매체
AU2019291969A1 (en) Computer vision systems and methods for automatically detecting, classifying, and pricing objects captured in images or videos
CN114445768A (zh) 目标识别方法、装置、电子设备及存储介质
JP2021068056A (ja) 路上障害物検知装置、路上障害物検知方法、及び路上障害物検知プログラム
CN115049954A (zh) 目标识别方法、装置、电子设备和介质
CN110913209A (zh) 摄像头遮挡检测方法、装置、电子设备及监控系统
CN116091781B (zh) 一种用于图像识别的数据处理方法及装置
JP2016071800A (ja) 情報処理装置、情報処理方法及びプログラム
KR101681282B1 (ko) 대상체 검출 장치 및 방법
Sandhu et al. Automatic edge detection algorithm and area calculation for flame and fire images
CN115908802A (zh) 摄像头遮挡检测方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant