CN110032916A

CN110032916A - 一种检测目标物体的方法和装置

Info

Publication number: CN110032916A
Application number: CN201810031047.2A
Authority: CN
Inventors: 吴江旭; 张洪光; 张伟华; 孔磊锋; 彭刚林; 李凡
Original assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Jingdong Shangke Information Technology Co Ltd
Current assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Jingdong Shangke Information Technology Co Ltd
Priority date: 2018-01-12
Filing date: 2018-01-12
Publication date: 2019-07-19

Abstract

本发明公开了一种检测目标物体的方法和装置，涉及计算机技术领域。该方法的一具体实施方式包括：从对待检测区域录制的历史视频文件中提取样本图片集；分别基于不同大小的第一置信度阈值和第二置信度阈值对所述样本图片集进行目标物体检测，以得到不同置信度阈值下的样本数据集；通过对比第一置信度阈值和第二置信度阈值下的样本数据集确定无效区域；在对当前获取的图像数据进行检测时，排除所述无效区域中的目标物体。该实施方式能够提高检测目标物体时的准确度。

Description

一种检测目标物体的方法和装置

技术领域

本发明涉及计算机技术领域，尤其涉及一种检测目标物体的方法和装置。

背景技术

“物体检测”是利用计算机视觉技术判断图像或者视频序列中是否存在目标物体并给予定位的技术手段；其中，以“行人检测”应用最为广泛，在人工智能系统、车辆辅助驾驶系统、智能机器人、智能视频监控、人体行为分析和智能交通等领域均有重要作用。

现有的物体检测算法多种多样，但其输出结果时的方法基本相同：对于检测到的物体使用检测框进行定位，并分别计算该物体属于预设的多个类别中每一个类别的概率，取概率最大值作为该检测框中的物体为特定类别的置信度。在实际的检测过程中，若需要检测某一特定类别的目标物体，则额外设置一个置信度阈值，并保留该特定类别中置信度大于该置信度阈值的检测框作为最终的检测结果。

在实现本发明过程中，发明人发现现有技术中至少存在如下问题：现有技术的检测方法中，置信度阈值很难确定；若置信度阈值过小，则检测结果中可能误检到其他物体，造成结果不准确；若置信度阈值过大，则检测结果的个数会大大降低，同时漏检一些真正的目标物体，同样存在结果不准确的问题。

发明内容

有鉴于此，本发明实施例提供一种检测目标物体的方法和装置，能够提高检测目标物体时的准确度。

为实现上述目的，根据本发明实施例的一个方面，提供了一种检测目标物体的方法，包括：

从对待检测区域录制的历史视频文件中提取样本图片集；

分别基于不同大小的第一置信度阈值和第二置信度阈值对所述样本图片集进行目标物体检测，以分别得到两种置信度阈值下的样本数据集；

通过对比第一置信度阈值和第二置信度阈值下的样本数据集确定无效区域；

在对当前获取的图像数据进行检测时，排除所述无效区域中的目标物体。

可选的，所述分别基于不同大小的第一置信度阈值和第二置信度阈值对所述样本图片集进行目标物体检测，以分别得到两种置信度阈值下的样本数据集的步骤包括：

对所述样本图片集中的各帧图片进行目标物体检测，以得到检测结果；其中，所述检测结果包括目标物体的检测框和与该检测框对应的置信度；

若判定所述检测结果的置信度不小于所述置信度阈值，则将该检测结果加入所述样本数据集；

分别基于第一置信度阈值和第二置信度阈值重复上述步骤，以分别得到第一置信度阈值和第二置信度阈值下的样本数据集。

可选的，通过对比第一置信度阈值和第二置信度阈值下的所述样本数据集确定无效区域的步骤前，还包括：

将所述待检测区域划分为多个子区域；

所述通过对比第一置信度阈值和第二置信度阈值下的所述样本数据集确定无效区域的步骤包括：

分别从第一置信度阈值和第二置信度阈值下的样本数据集中获取对应于子区域的检测框集；

计算第一置信度阈值和第二置信度阈值下的检测框集中各检测框之间的重叠率，根据所述重叠率判断该子区域是否为有效区域；

重复上述过程直至遍历全部子区域，将所述待检测区域中除所述有效区域之外的其他区域作为无效区域。

可选的，所述第二置信度阈值大于所述第一置信度阈值，所述分别从第一置信度阈值和第二置信度阈值下的样本数据集中获取对应于该子区域的检测框集的步骤包括：

从所述第一置信度阈值下的样本数据集中获取全部对应于该子区域的检测框以得到第一检测框集，从所述第二置信度阈值下的样本数据集中获取全部对应于该子区域的检测框以得到第二检测框集；

所述计算不同置信度阈值下的检测框集中各检测框之间的重叠率，根据所述重叠率判断该子区域是否为有效区域的步骤包括：

从所述第一检测框集中获取第一检测框，计算所述第二检测框集中与所述第一检测框重叠率大于预设重叠率阈值的检测框的个数占所述第二检测框集中全部检测框个数的比例；

重复上述步骤直至遍历所述第一检测框集中的全部检测框；

若判定计算得到的比例中的最大值大于预设的比例阈值，则确定所述子区域为有效区域。

可选的，所述第一置信度阈值与所述第二置信度阈值的差值不小于所述第一置信度阈值的20％。

可选的，所述第一置信度阈值的取值范围是[0.3，0.5]；所述第二置信度阈值的取值范围是[0.6，0.7]。

可选的，第一检测框与第二检测框的重叠率为第一检测框与第二检测框交集除以第一检测框与第二检测框并集的计算结果。

可选的，分别从第一置信度阈值和第二置信度阈值下的样本数据集中获取对应于该子区域的检测框集的步骤还包括：

若判定某检测框的底端中点落在该子区域内，则确定该检测框对应于该子区域。

可选的，所述从对待检测区域录制的历史视频文件中提取样本图片集的步骤包括：

从对待检测区域录制的历史视频文件中以均匀的时间间隔提取图片，以得到所述样本图片集。

为实现上述目的，根据本发明实施例的另一个方面，提供了一种检测目标物体的装置，包括：

样本提取模块，用于从对待检测区域录制的历史视频文件中提取样本图片集；

结果生成模块，用于分别基于不同大小的第一置信度阈值和第二置信度阈值对所述样本图片集进行目标物体检测，以分别得到两种置信度阈值下的样本数据集；

无效区域确定模块，用于通过对比第一置信度阈值和第二置信度阈值下的样本数据集确定无效区域；

检测模块，用于在对当前获取的图像数据进行检测时，排除所述无效区域中的目标物体。

可选的，所述结果生成模块还用于：

可选的，所述装置还包括：

区域划分模块，用于将所述待检测区域划分为多个子区域；

所述无效区域确定模块还用于：

可选的，所述第二置信度阈值大于所述第一置信度阈值，所述无效区域确定模块还用于：

重复上述步骤直至遍历所述第一检测框集中的全部检测框；

可选的，所述无效区域确定模块还用于：

可选的，所述样本提取模块还用于：

为实现上述目的，根据本发明实施例的再一个方面，提供了一种检测目标物体的电子设备，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器至少实现：

从对待检测区域录制的历史视频文件中提取样本图片集；

为实现上述目的，根据本发明实施例的又一个方面，提供一种计算机可读介质，其上存储有计算机程序，所述程序被处理器执行时至少实现：

从对待检测区域录制的历史视频文件中提取样本图片集；

上述发明中的一个实施例具有如下优点或有益效果：因为采用基于不同置信度阈值进行目标物体检测，并通过比对检测结果确定无效区域，在检测时排除无效区域中出现的检测结果技术手段，这样一来，实际检测过程可以在较低的置信度阈值下运行，既能够防止漏检，又可以避免低置信度阈值下无效区域中物体的误检，从而解决了现有目标检测技术中可能出现的漏检和误检问题，达到了提高检测准确度的技术效果。

上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

附图说明

附图用于更好地理解本发明，不构成对本发明的不当限定。其中：

图1是根据本发明实施例的检测目标物体的方法的主要步骤的示意图；

图2是基于现有技术中的检测方法以在置信度阈值为0.5时的检测结果示意图；

图3是基于现有技术中的检测方法以在置信度阈值为0.7时的检测结果示意图；

图4是基于本发明实施例中的方法以在置信度阈值为0.5时的检测结果示意图；

图5是根据本发明实施例的检测目标物体的装置的主要模块的示意图；

图6是本发明实施例可以应用于其中的示例性系统架构图；

图7是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。

具体实施方式

以下结合附图对本发明的示范性实施例做出说明，其中包括本发明实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本发明的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

图1是根据本发明实施例的检测目标物体的方法的主要步骤的示意图。

如图1所示，根据本实施例提供的一种检测目标物体的方法，包括：

S10，从对待检测区域录制的历史视频文件中提取样本图片集。本实施例较佳的应用场景为固定的摄像头中的目标物体检测，通常的监控状态下，摄像头的取景范围一定，获取一段时间长度的历史监控视频文件，并从该监控视频文件中提取帧图片以得到样本图片集。当然，除适用于固定监控摄像头的场景外，本实施例还适用于其他待检测区域固定或有规律变化的使用环境。

需说明的是，在从视频文件中提取样本图片集时，应以均匀的时间间隔提取帧图片，例如可以从每一秒的帧图片中等间隔地取出5帧图片，将提取的到的帧图片集合作为样本图片集。

S11，基于不同的置信度阈值对所述样本图片集进行目标物体检测，以得到样本数据集。本实施例中，采用至少2个不同的置信度阈值对样本图片集中的各帧图片进行目标物体检测，包括第一置信度阈值，以及大于该第一置信度阈值的第二置信度阈值。

S12，通过对比不同置信度阈值下的所述样本数据集确定所述待检测区域中的无效区域。本实施例的实现原理，是根据不同置信度阈值下得到的至少两组样本数据集进行对比，若某一检测框在两组样本数据集中均出现，则说明该检测框对应的区域具备较好的可信度，即是有效的；若某一检测框仅在低置信度阈值下的样本数据集中出现，说明该检测框对应的区域可能无法在低置信度阈值时获取到准确的检测结果，即为无效区域。具体的对比方法在后续实施例中详述。

S13，在对当前获取的图像数据进行检测时，排除所述无效区域中的目标物体。确定了无效区域之后，即可使用较低的置信度阈值进行目标物体检测，并在进行当前实际的检测过程时，将无效区域中的检测结果排除，从而既保证不会出现漏检的问题，又尽可能地降低了误检率。

从上面所述可以看出，本实施提供的方法通过采用不同置信度阈值进行目标物体检测，并通过比对检测结果确定无效区域，在检测时排除无效区域中出现的检测结果；这样一来，后续的检测过程可以在较低的置信度阈值下运行，既能够防止漏检，又可以避免低置信度阈值下无效区域中物体的误检，从而解决了现有目标检测技术中可能出现的漏检和误检问题，达到了提高检测准确度的技术效果。

在一些可选的实施例中，S11，所述基于不同的置信度阈值对所述样本图片集进行目标物体检测，以得到样本数据集的步骤包括：

分别基于不同的置信度阈值重复上述步骤，以得到不同置信度阈值下的样本数据集。

在本实施例中，优选采用两个不同的置信度阈值进行检测；其中较低的置信度阈值应当等于或者接近在当前检测工作中希望采用的置信度阈值，较高的置信度阈值可以根据需要进行确定。

在一些可选的实施例中，在S12，通过对比不同置信度阈值下的样本数据集确定所述待检测区域中的无效区域的步骤前，还包括：

将所述待检测区域划分为多个子区域。子区域的划分是为了更加方便地确定有效区域和无效区域；较佳的实现方法是将矩形的待检测区域划分为例如M*N的网格型子区域，分别判断各子区域有效或者无效，从而最终确定整个待检测区域的有效区域或无效区域。

在划分子区域后，S12，所述通过对比不同置信度阈值下的样本数据集确定所述待检测区域中的无效区域的步骤包括：

对于某子区域，分别从不同置信度阈值下的样本数据集中获取对应于该子区域的检测框集。对于2个不同的置信度阈值的情况而言，例如第一置信度阈值和第二置信度阈值，所述第二置信度阈值大于所述第一置信度阈值；从所述第一置信度阈值下的样本数据集中获取全部对应于该子区域的检测框以得到第一检测框集，从所述第二置信度阈值下的样本数据集中获取全部对应于该子区域的检测框以得到第二检测框集。其中，“对应于该子区域的检测框”是指检测框的检测中心落在该子区域内。检测中心在检测框中的位置取决于检测场景；例如，在商店的行人检测中，应当以行人可以行走的位置作为主要的有效检测区域，那么可以将矩形的检测框的下边缘中点位置作为该检测框的检测中心，以定位至行人脚部，从而提高有效区域划分的精确度和行人检测系统的检测精度。

计算不同置信度阈值下的检测框集中各检测框之间的重叠率，根据所述重叠率判断该子区域是否为有效区域。具体而言，本步骤从所述第一检测框集中获取第一检测框，计算所述第二检测框集中与所述第一检测框重叠率大于预设重叠率阈值的检测框的个数占所述第二检测框集中全部检测框个数的比例；重复上述步骤直至遍历所述第一检测框集中的全部检测框；若判定计算得到的比例中的最大值大于预设的比例阈值，则确定所述子区域为有效区域。本实施例中的重叠率阈值和比例阈值可以根据算法、场景、人员复杂程度等进行确定。

重复上述过程直至遍历全部子区域，将所述待检测区域中除所述有效区域之外的其他区域作为无效区域。除此之外，在其他一些可选的实施例中，若确定某一子区域的检测框数量小于预设的数量阈值，则将确定该子区域为无效区域；即，当经过大量样本检测后，某一检测框中几乎没有出现过目标物体时，则认为该检测框对于整体的数据影响很小，为了避免误检问题，可以将这些检测框排除。

本实施例步骤中的“重叠率”用于表示两个检测框的重叠程度，重叠的部分越多，说明这两个检测框所标识的检测结果越接近；当重叠率达到预设的重叠率阈值，则可以近似地认为这两个检测框所标识的物体是同一个。本实施例中以“交并比”来表示两个检测框之间的重叠率，例如有第一检测框和第二检测框，则以交并比表示二者之间重叠率为：

本实施例步骤的最后，根据有效区域划分无效区域，并通过无效区域来对检测框进行筛选，这是因为使用无效区域在算法上更加容易表示，并且除了通过本实施例方法得到的无效区域之外，还可以根据实际的待检测区域人工对无效区域边界进行优化，例如可以根据场景的实际布置对无效区域的边界进行调整等。

下面通过另一个实施例说明本发明提供的方法在商店的行人检测中的应用。

步骤1：对于一个特定摄像头，选择该摄像头的监控区域(即待检测区域)中客流量较大的时段，获取该时段中时长为8小时左右的监控视频。

步骤2：从监控视频文件中提取视频帧图片，具体为从每秒的全部帧图片中提取5幅帧图片。

步骤3：在执行检测前，对各帧图片进行区域划分；例如对于1280*720像素分辨率的视频文件，可以将其帧图片按照每个子区域80*80像素的规格划分为16*9分布的子区域网格。需说明，本步骤并非对每一副图片进行单独划分，而是对于图片大小的区域进行划分，并将后续步骤得到的样本数据集根据子区域进行分类，以便判断每个子区域属于有效区域或者无效区域。视频文件的时长越长、子区域划分的越细致，最终得到的无效区域结果越精确，但相应的需要消耗更长的计算时间，实际工程中可以根据设备性能进行调整。

步骤4：分别在第一置信度阈值和第二置信度阈值下(第二置信度阈值大于第一置信度阈值)，通过行人检测算法对提取得到的帧图片进行检测，分别得到第一置信度阈值和第二置信度阈值下的样本数据集。本实施例采用的行人检测算法为YOLO(You only lookonce)算法，基于该算法，上述第一置信度阈值的较佳取值范围是0.3-0.5，若低于该范围则物体误检和错检概率大大增加；第二置信度阈值的较佳取值范围是0.6-0.7，若高于该范围则会导致检测到的行人过少，无法得到真实的行人数据。在采用其他行人检测算法时，可以根据算法输出置信度的准确性对第一置信度阈值和第二置信度阈值进行调整，并应当保证第一置信度阈值与第二置信度阈值之差较大，建议将该差值设置为第一置信度阈值的数值的20％以上，以便后续步骤的比对中取得较为准确的结果。

步骤5：对于某一子区域，从第一置信度阈值对应的样本数据集中查找检测中心落在该子区域中的检测框，以得到第一检测框集；同样从第二子区域中查找检测中心落在该子区域中的检测框，以得到第二检测框集(需要说明，第一检测框集和第二检测框集的概念只是为了便于表述，在实际的算法程序中并非一定存在该实体)。

步骤6：从第一检测框集中获取第一检测框，分别计算所述第二检测框集中与所述第一检测框重叠率大于预设重叠率阈值的检测框的个数占所述第二检测框集中全部检测框个数的比例。

本步骤中的重叠率以交并比(Intersection-over-Union,IoU)来表示，例如有第一检测框和第二检测框，则以交并比表示二者之间重叠率为：

对于商店场景下、720像素分辨率的视频文件、以80*80像素大小的子区域进行划分、第一置信度阈值为0.3-0.5、第二置信度阈值为0.6-0.7的情况，重叠率阈值的较佳数值为80％。对于其他场景，可以根据参数和场景的变化对重叠率阈值进行适应性调整。

步骤7：重复步骤6直至遍历第一检测框集中的全部检测框；判断得到的全部比例中的最大值是否大于预设的比例阈值，若大于，则确定该子区域为有效区域。

基于步骤6中所述的场景和参数，本步骤中的比例阈值宜设置为86％，同样可以根据参数和场景的变化对比例阈值进行适应性调整。

步骤8：重复步骤7直至遍历全部子区域，以得到待检测区域的全部有效区域；以待检测区域中除该有效区域外的其他区域作为无效区域。

除了根据有效区域确定无效区域外，在执行步骤5时，若判断第二检测框集中检测框的数量过少(可以通过设置阈值来判断)，则可以将该子区域设置为无效区域。这是因为若检测框过少，说明该区域并非行人常经过的区域，偶尔出现在该区域中的大多并非行人，而是例如利用梯子上货的工作人员、电灯维修工等。在第二检测框集中检测框的数量过少时，即使该子区域的第一检测框集中的检测框数量很多，也不应当将其纳入考虑范围，因为这种情况说明该子区域中经常存在类人物体，例如广告宣传板、大型拟人玩具等等。无论是何种情况都会对行人数据产生干扰，所以应当将其排除。

步骤9：在进行实时的行人检测的过程中，排除检测中心落在无效区域中的结果。

步骤1-8的目的是根据监控区域中的大量行人样本确定无效区域。对于同一个摄像头而言，其监控的区域中的场景通常是固定的，例如货架的位置、墙壁的位置等。当然可能会出现监控区域中场景改变的问题，此时可以重复上述步骤1-8，重新划分无效区域。步骤9是当前实时的检测过程，通过获取实时的图像数据并执行检测，得到将检测得到的行人数据，从而可以根据行人数据统计出商店中的行人热度，以便于进行销售规划。

图2是基于现有技术中的检测方法以在置信度阈值为0.5时的检测结果示意图；图3是基于现有技术中的检测方法以在置信度阈值为0.7时的检测结果示意图；图4是基于本发明实施例中的方法以在置信度阈值为0.5时的检测结果示意图。在图2-图4中，虚线框体表示检测框，检测框旁的数字表示该检测框的置信度。

如图2所示，为商店场景中的某一待检测区域，包括三列货架。在置信度阈值为0.5时，采用现有技术中的行人检测算法可以检测出行人21、行人22、行人23、行人24和行人25，但是由于置信度阈值较低，所以摆放在货架上的玩具熊26也被作为行人识别出来，造成误检。如图3所示，当提高置信度阈值至0.7后，虽然玩具熊26被排除在结果之外，但是行人24和行人25由于距离摄像头较远，特征不够明显，同样被排除在结果之外，造成结果不准确的问题。

如图4所示，在基于本发明实施例中的方法对该待检测区域进行处理后，划出无效区域(图中以斜线覆盖的区域，为了使图像清楚，并未按照子区域进行覆盖，仅示意性地标识)。可见玩具熊26所在的区域已经被置为无效区域，因此不会将玩具熊26纳入检测结果中；而行人24、行人25所在的走道，由于常有行人经过，在大量数据的支撑下符合有效区域的条件。此时将置信度阈值设置为0.5进行检测，全部的行人被准确地检测出来，并且玩具熊被排除在检测结果之外。

图5是根据本发明实施例的检测目标物体的装置的主要模块的示意图。

如图5所示，本发明实施例还体用一种检测目标物体的装置500，包括：

样本提取模块501，用于从对待检测区域录制的历史视频文件中提取样本图片集；

结果生成模块502，用于基于不同的置信度阈值对所述样本图片集进行目标物体检测，以得到样本数据集；

无效区域确定模块503，用于通过对比不同置信度阈值下的所述样本数据集确定无效区域；

检测模块504，用于在对当前获取的图像数据进行检测时，排除所述无效区域中的目标物体。

从上面所述可以看出，本实施提供的装置通过采用不同置信度阈值进行目标物体检测，并通过比对检测结果确定无效区域，在检测时排除无效区域中出现的检测结果；这样一来，后续的检测过程可以在较低的置信度阈值下运行，既能够防止漏检，又可以避免低置信度阈值下无效区域中物体的误检，从而解决了现有目标检测技术中可能出现的漏检和误检问题，达到了提高检测准确度的技术效果。

在一些可选的实施例中，所述结果生成模块502还用于：

在一些可选的实施例中，所述装置500还包括：

区域划分模块505，用于将待检测区域划分为多个子区域；

所述无效区域确定模块503还用于：

分别从不同置信度阈值下的样本数据集中获取对应于子区域的检测框集；

计算不同置信度阈值下的检测框集中各检测框之间的重叠率，根据所述重叠率判断该子区域是否为有效区域；

在一些可选的实施例中，所述不同的置信度阈值包括第一置信度阈值和第二置信度阈值，所述第二置信度阈值大于所述第一置信度阈值；所述无效区域确定模块503还用于：

从所述第一检测框集中获取某一检测框，计算所述第二检测框集中与所述某一检测框重叠率大于预设重叠率阈值的检测框的个数占所述第二检测框集中全部检测框个数的比例；

重复上述步骤直至遍历所述第一检测框集中的全部检测框；

在一些可选的实施例中，计算两检测框之间重叠率的公式为：

在一些可选的实施例中，所述无效区域确定模块503还用于：

在一些可选的实施例中，所述样本提取模块501还用于：

从历史视频文件中以均匀的时间间隔提取图片，以得到所述样本图片集。

图6示出了可以应用本发明实施例的检测目标物体的方法或检测目标物体的装置的示例性系统架构600。

如图6所示，系统架构600可以包括终端设备601、602、603，网络604和服务器605。网络604用以在终端设备601、602、603和服务器605之间提供通信链路的介质。网络604可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备601、602、603通过网络604与服务器605交互，以接收或发送消息等。

终端设备601、602、603可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器605可以是提供各种服务的服务器，例如对用户利用终端设备601、602、603所采集的视频数据进行收集和处理的后台服务器。

需要说明的是，本发明实施例所提供的检测目标物体的方法一般由服务器605执行，相应地，检测目标物体的装置一般设置于服务器605中。

应该理解，图6中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

根据本发明的实施例，本发明还提供了一种电子设备和一种可读存储介质。

下面参考图7，其示出了适于用来实现本发明实施例的终端设备的计算机系统700的结构示意图。图7示出的终端设备仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图7所示，计算机系统700包括中央处理单元(CPU)701，其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中，还存储有系统700操作所需的各种程序和数据。CPU 701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。

以下部件连接至I/O接口705：包括键盘、鼠标等的输入部分706；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707；包括硬盘等的存储部分708；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器710上，以便于从其上读出的计算机程序根据需要被安装入存储部分708。

特别地，根据本发明的实施例，上文主要步骤的示意图描述的过程可以被实现为计算机软件程序。例如，本发明的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行主要步骤的示意图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分709从网络上被下载和安装，和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(CPU)701执行时，执行本发明的系统中限定的上述功能。

需要说明的是，本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的模块可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中，例如，可以描述为：一种处理器包括样本提取模块、结果生成模块、无效区域确定模块、检测模块和区域划分模块。其中，这些模块的名称在某种情况下并不构成对该模块本身的限定，例如，结果生成模块还可以被描述为“用于基于不同的置信度阈值对所述样本图片集进行目标物体检测，以得到样本数据集的模块”。

作为另一方面，本发明还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的设备中所包含的；也可以是单独存在，而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该设备执行时，使得该设备包括：

从历史视频文件中提取样本图片集；

基于不同的置信度阈值对所述样本图片集进行目标物体检测，以得到样本数据集；

通过对比不同置信度阈值下的所述样本数据集确定无效区域；

本实施提供的方案通过采用不同置信度阈值进行目标物体检测，并通过比对检测结果确定无效区域，在检测时排除无效区域中出现的检测结果；这样一来，后续的检测过程可以在较低的置信度阈值下运行，既能够防止漏检，又可以避免低置信度阈值下无效区域中物体的误检，从而解决了现有目标检测技术中可能出现的漏检和误检问题，达到了提高检测准确度的技术效果。

上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，取决于设计要求和其他因素，可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

Claims

1.一种检测目标物体的方法，其特征在于，包括：

从对待检测区域录制的历史视频文件中提取样本图片集；

2.根据权利要求1所述的方法，其特征在于，所述分别基于不同大小的第一置信度阈值和第二置信度阈值对所述样本图片集进行目标物体检测，以分别得到两种置信度阈值下的样本数据集的步骤包括：

3.根据权利要求2所述的方法，其特征在于，通过对比第一置信度阈值和第二置信度阈值下的所述样本数据集确定无效区域的步骤前，还包括：

将所述待检测区域划分为多个子区域；

4.根据权利要求3所述的方法，其特征在于，所述第二置信度阈值大于所述第一置信度阈值，所述分别从第一置信度阈值和第二置信度阈值下的样本数据集中获取对应于该子区域的检测框集的步骤包括：

重复上述步骤直至遍历所述第一检测框集中的全部检测框；

5.根据权利要求4所述的方法，其特征在于，所述第一置信度阈值与所述第二置信度阈值的差值不小于所述第一置信度阈值的20％。

6.根据权利要求4所述的方法，其特征在于，所述第一置信度阈值的取值范围是[0.3，0.5]；所述第二置信度阈值的取值范围是[0.6，0.7]。

7.根据权利要求3所述的方法，其特征在于，第一检测框与第二检测框的重叠率为第一检测框与第二检测框交集除以第一检测框与第二检测框并集的计算结果。

8.根据权利要求3所述的方法，其特征在于，分别从第一置信度阈值和第二置信度阈值下的样本数据集中获取对应于该子区域的检测框集的步骤还包括：

9.根据权利要求1所述的方法，其特征在于，所述从对待检测区域录制的历史视频文件中提取样本图片集的步骤包括：

10.一种检测目标物体的装置，其特征在于，包括：

11.根据权利要求10所述的装置，其特征在于，所述结果生成模块还用于：

12.根据权利要求11所述的装置，其特征在于，所述装置还包括：

区域划分模块，用于将所述待检测区域划分为多个子区域；

所述无效区域确定模块还用于：

13.根据权利要求12所述的装置，其特征在于，所述第二置信度阈值大于所述第一置信度阈值，所述无效区域确定模块还用于：

重复上述步骤直至遍历所述第一检测框集中的全部检测框；

14.根据权利要求13所述的装置，其特征在于，所述第一置信度阈值与所述第二置信度阈值的差值不小于所述第一置信度阈值的20％。

15.根据权利要求13所述的装置，其特征在于，所述第一置信度阈值的取值范围是[0.3，0.5]；所述第二置信度阈值的取值范围是[0.6，0.7]。

16.根据权利要求12所述的装置，其特征在于，第一检测框与第二检测框的重叠率为第一检测框与第二检测框交集除以第一检测框与第二检测框并集的计算结果。

17.根据权利要求12所述的装置，其特征在于，所述无效区域确定模块还用于：

18.根据权利要求10所述的装置，其特征在于，所述样本提取模块还用于：

19.一种检测目标物体的电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-9中任一所述的方法。

20.一种计算机可读介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1-9中任一所述的方法。