CN113936199B

CN113936199B - 一种图像的目标检测方法、装置及摄像设备

Info

Publication number: CN113936199B
Application number: CN202111548863.9A
Authority: CN
Inventors: 肖兵; 许汉龙; 黄昌松
Original assignee: Zhuhai Shixi Technology Co Ltd
Current assignee: Zhuhai Shixi Technology Co Ltd
Priority date: 2021-12-17
Filing date: 2021-12-17
Publication date: 2022-05-13
Anticipated expiration: 2041-12-17
Also published as: CN113936199A

Abstract

本申请公开了一种图像的目标检测方法、装置及摄像设备，用于对现有的检测器加以改进，使其能够灵活地适配不同的检测范围，满足不同的产品需求。本申请方法包括：确定预设检测器当前的应用场景，并根据所述应用场景获取对应的配置文件；获取待检测图像；从所述配置文件中读取位置关系，所述位置关系为所述预设检测器在所述应用场景下子区域和所述待检测图像的位置关系；根据所述位置关系对所述待检测图像进行划分，得到与所述子区域对应的子图像；通过所述预设检测器对所述子图像进行目标检测，得到检测结果；对所述检测结果进行处理，得到所述待检测图像的目标检测结果。

Description

一种图像的目标检测方法、装置及摄像设备

技术领域

本申请涉及图像检测技术领域，尤其涉及一种图像的目标检测方法、装置及摄像设备。

背景技术

现如今，基于人脸检测、人头检测、行人检测、车辆检测等类型的目标检测应用极为普遍，目标检测技术被广泛用于消费电子、智能终端、商显、交通、安防等领域。目标检测算法大多是基于深度学习，而相应的深度学习模型通常都是基于特定数据集或特定场景训练出来的，一旦部署，其规格（比如检测精度、检测距离）以及能应对的场景都是确定的。而实际应用场景中，同一个公司可能有多个产品或同一个产品的多个功能需要用到同类的目标检测算法，但其需求又不尽相同。甚至，当同样的产品功能搭配不同规格的相机模组时，若相机模组视场角差异较大，即使对目标检测算法的外在规格要求（如检测距离）不变，但实际的要求已经发生了较大变化，相应地，必须对目标检测算法做出调整。

即使现有技术中，能够针对不同的应用需求定制化、针对性地训练出不同的模型，或者是尝试训练出一个通用的能同时应对各种场景、满足各种规格要求的模型。但是前者费时费力，研发成本高且周期长，后者训练难度极大甚至未必可行，即使能满足效果，其性能往往是大多数移动设备尤其是中低端嵌入式平台不能承受的。

综上所述，如果产品需求发生变化，选择训练新的检测器费时费力，而对于较大尺度范围的需求，要训练出新的检测器难度也较大，即使训练出来，其计算开销势必很大，单帧检测时间相比原始的检测器会大幅增加，对于中低端嵌入式平台，相应的计算速度以及检测帧率将大大降低。

发明内容

本申请提供了一种图像的目标检测方法、装置及摄像设备，用于对现有的检测器加以改进，使其能够灵活地适配不同的检测范围，满足不同的产品需求。

本申请第一方面提供了一种图像的目标检测方法，包括：

确定预设检测器当前的应用场景，并根据所述应用场景获取对应的配置文件，不同的应用场景映射有不同的配置文件；

获取待检测图像；

从所述配置文件中读取位置关系，所述位置关系为所述预设检测器在所述应用场景下子区域和所述待检测图像的位置关系；

根据所述位置关系对所述待检测图像进行划分，得到与所述子区域对应的子图像；

通过所述预设检测器对所述子图像进行目标检测，得到检测结果；

对所述检测结果进行处理，得到所述待检测图像的目标检测结果。

可选的，若所述子区域的数量大于1，则所述对所述检测结果进行处理，得到所述待检测图像的目标检测结果包括：

通过非极大值抑制对所述检测结果进行合并，将合并的结果作为所述待检测图像的目标检测结果。

可选的，所述配置文件通过如下方式生成：

检测所述预设检测器的极限检测尺度；

检测满足需求规格的目标临界尺寸，所述目标临界尺寸为所述需求规格下目标在画面中的最大尺寸和最小尺寸，所述需求规格为满足当前的应用场景的规格；

根据所述极限检测尺度和所述目标临界尺寸确定图像临界尺寸；

分析目标在图像中的位置分布和尺度分布；

根据所述位置分布、所述尺度分布以及所述图像临界尺寸，在原始图像中划分出至少一个子区域；

根据所述子区域相对于所述原始图像的位置关系生成配置文件。

可选的，所述检测所述预设检测器的极限检测尺度包括：

获取第一测试图像，所述第一测试图像为分辨率满足所述预设检测器默认规格的测试图像；

根据所述第一测试图像确定所述默认规格下检测出的目标的第一最小尺寸和第一最大尺寸；

分别确定所述第一最小尺寸和所述第一最大尺寸相对于所述第一测试图像尺寸的第一比值和第二比值；

将所述第一比值和所述第二比值对应的区域确定为所述预设检测器的极限检测尺度。

可选的，所述检测满足需求规格的目标临界尺寸包括：

获取第二测试图像，所述第二测试图像为分辨率满足需求规格的测试图像；

根据所述第二测试图像确定所述需求规格下检测出的目标的第二最小尺寸和第二最大尺寸；

将所述第二最小尺寸和所述第二最大尺寸确定为目标临界尺寸。

可选的，所述根据所述极限检测尺度和所述目标临界尺寸确定图像临界尺寸包括：

根据所述极限检测尺度和所述目标临界尺寸确定图像尺寸范围，所述图像尺寸范围包括检测出最小目标的图像尺寸范围和检测出最大目标的图像尺寸范围；

若所述图像尺寸范围之间存在交集，则在所述图像尺寸范围之间确定图像临界尺寸；

若所述图像尺寸范围之间不存在交集，则增加所确定的图像临界尺寸的个数。

可选的，所述分析目标在图像中的位置分布包括：

确认目标在画面中的活动区域；

确认目标检测结果在画面中的被关注区域；

根据所述活动区域和所述被关注区域的交集确定目标在图像中的位置分布。

可选的，所述分析目标在图像中的尺度分布包括：

测量并统计目标在图像中不同位置时的尺寸大小，得到目标在图像中的尺度分布。

可选的，根据所述位置分布、所述尺度分布以及所述图像临界尺寸，在原始图像中划分出至少一个子区域包括：

确定非活动区域；

在所述原始图像中排除所述非活动区域，确定所述原始图像中的活动区域；

根据所述位置分布、所述尺度分布以及所述图像临界尺寸，在所述活动区域中划分出至少一个子区域。

可选的，所述确定非活动区域包括：

通过对非活动目标进行目标检测确定非活动区域；

或，

通过用户划定的区域分界线确定非活动区域；

或，

通过统计预设时间段内的目标检测结果的分布确定非活动区域。

可选的，若所述子区域的数量大于1，在根据所述子区域相对于所述原始图像的位置关系生成配置文件之前，所述方法还包括：

调整各个子区域的大小，以使得各个子区域相互之间存在满足预设尺寸的重叠区域，所述预设尺寸不小于需求规格下目标能够被检出的最小图像尺寸。

可选的，在所述根据所述位置分布、所述尺度分布以及所述图像临界尺寸，在原始图像中划分出至少一个子区域时，所述子区域的数量满足数量最小原则。

可选的，若所述应用场景为人脸检测及对焦，则所述子区域的数量为4，分别为第一区域、第二区域、第三区域和第四区域；

所述第一区域的尺寸为第一预设值，所述第二区域、所述第三区域和所述第四区域的尺寸均为第二预设值，所述第一预设值大于所述第二预设值，所述第二区域、所述第三区域之间存在重叠部分，所述第三区域和所述第四区域之间存在重叠部分。

本申请第二方面提供了一种图像的目标检测装置，包括：

场景确定单元，用于确定预设检测器当前的应用场景，并根据所述应用场景获取对应的配置文件，不同的应用场景映射有不同的配置文件；

获取单元，用于获取待检测图像；

读取单元，用于从所述配置文件中读取位置关系，所述位置关系为所述预设检测器在所述应用场景下子区域和所述待检测图像的位置关系；

第一处理单元，用于根据所述位置关系对所述待检测图像进行划分，得到与所述子区域对应的子图像；

检测单元，用于通过所述预设检测器对所述子图像进行目标检测，得到检测结果；

第二处理单元，用于对所述检测结果进行处理，得到所述待检测图像的目标检测结果。

可选的，所述目标检测装置还包括：

第一检测单元，用于检测所述预设检测器的极限检测尺度；

第二检测单元，用于检测满足需求规格的目标临界尺寸，所述目标临界尺寸为所述需求规格下目标在画面中的最大尺寸和最小尺寸，所述需求规格为满足当前的应用场景的规格；

确定单元，用于根据所述极限检测尺度和所述目标临界尺寸确定图像临界尺寸；

分析单元，用于分析目标在图像中的位置分布和尺度分布；

划分单元，用于根据所述位置分布、所述尺度分布以及所述图像临界尺寸，在原始图像中划分出至少一个子区域；

生成单元，用于根据所述子区域相对于所述原始图像的位置关系生成配置文件。

可选的，所述第一检测单元具体用于：

可选的，所述第二检测单元具体用于：

可选的，所述确定单元具体用于：

可选的，所述分析单元具体用于：

确认目标在画面中的活动区域；

确认目标检测结果在画面中的被关注区域；

可选的，所述分析单元具体还用于：

可选的，所述划分单元具体用于：

确定非活动区域；

可选的，所述划分单元具体用于：

通过对非活动目标进行目标检测确定非活动区域；

或，

通过用户划定的区域分界线确定非活动区域；

或，

可选的，若所述子区域的数量大于1，则所述目标检测装置还包括：

调整单元，用于调整各个子区域的大小，以使得各个子区域相互之间存在满足预设尺寸的重叠区域，所述预设尺寸不小于需求规格下目标能够被检出的最小图像尺寸。

可选的，在所述划分单元根据所述位置分布、所述尺度分布以及所述图像临界尺寸，在所述原始图像中划分出至少一个子区域时，所述子区域的数量满足数量最小原则。

本申请第三方面提供了一种摄像设备，所述摄像设备执行如第一方面以及第一方面中任一项可选的图像的目标检测方法。

本申请第四方面提供了一种图像的目标检测装置，所述装置包括：

处理器、存储器、输入输出单元以及总线；

所述处理器与所述存储器、所述输入输出单元以及所述总线相连；

所述存储器保存有程序，所述处理器调用所述程序以执行第一方面以及第一方面中任一项可选的图像的目标检测方法。

从以上技术方案可以看出，本申请具有以下优点：

在目标检测中，不同的应用场景对应着不同的检测范围。而对于一个特定规格的预设检测器，用户可以预先根据应用场景的特性，为不同的应用场景配置对应的配置文件，使得该预设检测器能够通过该配置文件满足不同应用场景下的期望规格。

通过对现有的检测器加以改进，使其能够灵活地适配不同的检测范围，满足不同的产品需求。同时无需重复训练深度学习模型，从而缩短开发周期，节省开发成本。

附图说明

为了更清楚地说明本申请中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请提供的图像的目标检测方法一个实施例流程示意图；

图2为本申请提供的图像的目标检测方法另一个实施例流程示意图；

图3-a和图3-b为本申请提供的图像的目标检测方法一个应用场景的活动区域及区域划分示意图；

图4-a和图4-b为本申请提供的图像的目标检测方法另一个应用场景的活动区域及区域划分示意图；

图5为本申请提供的图像的目标检测装置一个实施例结构示意图；

图6为本申请提供的图像的目标检测实体装置一个实施例结构示意图。

具体实施方式

需要说明的是，本申请提供的图像的目标检测方法，可以应用于终端，还可以应用于服务器上，例如终端可以是会议电视、会议电脑、会议平板、智能手机或电脑、平板电脑、智能电视、智能手表、便携计算机终端也可以是台式计算机等固定终端。为方便阐述，本申请中以终端为执行主体进行举例说明。

请参阅图1，图1为本申请提供的图像的目标检测方法的一个实施例，该方法包括：

101、确定预设检测器当前的应用场景，并根据应用场景获取对应的配置文件；

现如今，目标检测的应用十分普遍，目标检测技术被广泛应用于消费电子、智能终端、商显、交通、安防等领域。在不同的应用场景中，其所依赖的检测精度和检测需求不同，新的应用场景所要求的检测尺度很可能超过检测器的原始规格，故该检测器无法被直接应用。

在本实施例中，用户可以根据目标检测的不同应用场景，预先为所使用的预设检测器配置好与应用场景对应的配置文件，从而可以利用配置文件中保存的配置信息，根据不同应用场景的特性，采用一些策略进行目标检测，使其既能够满足应用场景中的产品需求，满足检测效果及硬件性能要求，又能够精简计算量，节省算力降低功耗。

例如，对于某视频会议设备来说，在不同的应用场景中，其需求规格不同，这里主要是指检测距离不同。在该视频会议设备的实际应用过程中，如果应用场景发生切换，例如由一个大会议室（检测距离为0.5-8米）切换到小会议室（检测距离为0.5-3米），大小会议室的检测距离不同，终端则需要先重新获取与当前应用场景对应的配置文件，即与小会议室检测距离对应的配置文件，再执行后续步骤以进行目标检测。

102、获取待检测图像；

在终端执行目标检测的过程中，先从视频图像中提取待检测图像，终端可以是从视频图像逐帧提取待检测图像，也可以是间隔预设时间提取待检测图像，具体此处不做限定。

103、从配置文件中读取位置关系，所述位置关系为预设检测器在应用场景下子区域和待检测图像的位置关系；

配置文件中保存的是在某一应用场景下，终端预先划分出的子区域相对于待检测图像的位置关系。在部署配置文件的阶段，终端会根据预设检测器的极限检测尺度和与需求规格对应的目标临界尺寸确定图像临界尺寸，再结合该应用场景中目标的分布规律，预先将原始图像（待检测图像）划分出若干子区域，再将划分出的子区域相对于原始图像的位置关系保存成配置文件。

其中，预设检测器的极限检测尺度是指该预设检测器所能检测的最小目标尺寸和最大目标尺寸相对于测试图像尺寸的比值，该极限检测尺度用于作为不同应用场景的参照基准。该目标临界尺寸是指满足应用场景（检测距离）的目标的最大尺寸和最小尺寸。该图像临界尺寸则是指能够检测出最大目标和最小目标的图像尺寸范围。

不同的应用场景就对应着不同的配置文件，终端在步骤101中先确定当前的应用场景，获取与该应用场景对应的配置文件，终端在进行目标检测前先从该配置文件中读取该应用场景下，终端所预先划分出的子区域相对于待检测图像的位置关系。该位置关系包含各个子区域的尺寸大小以及子区域与原始图像的相对位置关系。

104、根据位置关系对待检测图像进行划分，得到与子区域对应的子图像；

终端按照获取到的位置关系，对待检测图像进行划分，具体是对待检测图像进行裁剪或缩放，得到若干与子区域对应的子图像。

例如，子区域的数量为n，终端则根据位置关系将待检测图像划分为n张子图像，分别记为I1、I2...In。

需要说明的是，子图像的数量与子区域的数量相同，不同子图像的尺寸与其对应的子区域的尺寸相同。

105、通过预设检测器对子图像进行目标检测，得到检测结果；

终端将各个子图像分别送入预设检测器进行目标检测，并存储检测结果。

例如，子区域的数量为n，终端则根据位置关系将待检测图像划分为n张子图像，分别记为I1、I2...In，终端再将I1、I2...In分别送入预设检测器进行目标检测，得到对应的检测结果，记为D1、D2...Dn。

106、对检测结果进行处理，得到待检测图像的目标检测结果。

终端对得到的检测结果进行处理，将得到的结果作为该待检测图像的目标检测结果，记为D*。

具体的，若子区域的数量大于1，则对应子图像的数量也大于1，得到的检测结果也大于1，就可能出现多个子图像同时检测到同一个目标或不同子图像检测到了不同目标的情况，此时就需要对通检测结果加以合并，以合并的结果作为该待检测图像的目标检测结果。在一些具体的实施例中，可以通过非极大值抑制（Non-Maximum Suppression，NMS）对检测结果进行合并。

在本实施例中，不同的应用场景对应着目标检测不同的检测范围。而对于一个特定规格的预设检测器，用户可以预先根据应用场景的特性，为不同的应用场景配置对应的配置文件，使得该预设检测器能够通过该配置文件满足不同应用场景下的期望规格。

通过对现有的检测器加以改进，使其能够灵活地适配不同的检测范围，满足不同的产品需求，满足不同的效果和性能要求。同时无需重复训练深度学习模型，从而缩短开发周期，节省开发成本。

通过不同的配置文件可以使同一特定规格的检测器适用于不同的应用场景，下面对本申请中提供的配置文件的部署过程进行详细说明，请参阅图2，图2为本申请提供的图像的目标检测方法的另一个实施例，其中，步骤201至步骤206为本申请提供的图像的目标检测方法部署阶段步骤，步骤207至步骤212为实际运行阶段，该图像的目标检测方法具体包括：

201、检测预设检测器的极限检测尺度；

终端首先测算预设检测器的极限检测尺度，具体的，终端执行如下步骤：

1）获取第一测试图像，第一测试图像为分辨率满足预设检测器默认规格的测试图像；

2）根据第一测试图像确定默认规格下检测出的目标的第一最小尺寸和第一最大尺寸；

3）分别确定第一最小尺寸和第一最大尺寸相对于第一测试图像尺寸的第一比值和第二比值；

4）将第一比值和第二比值对应的区域确定为预设检测器的极限检测尺度。

终端采集一张或多张分辨率满足预设检测器默认规格的且包含目标的测试图像；终端使用预设检测器对测试图像进行目标检测，以确认预设检测器所能检测到的最小目标尺寸和最大目标尺寸；终端计算最小目标尺寸和最大目标尺寸相对于测试图像尺寸的比值，以该比值区域作为预设检测器的极限检测尺度。

需要说明的是，将该比值区域作为预设检测器的极限检测尺度的目的是将其作为不同应用场景（检测距离）的参照基准，使用标准化的极限检测尺度能够对不同应用场景中对应的目标临界尺寸和图像临界尺寸进行更好地计算和评判。

具体地，记该最小目标尺寸为DS_min，最大目标检测尺寸为DS_max，该第一测试图像尺寸（分辨率）记为DIS，则预设检测器的极限检测尺度为[DS_min/DIS,DS_max/DIS]。需要说明的是，在计算该极限检测尺度时，优选以目标尺寸的短边作为DS_min或DS_max，测试图像的短边作为DIS进行计算，目的是为了保证后续计算的图像临界尺寸大小不超出原图范围。

例如，对于某个人脸检测器，其在640x360的图像中能检测到最小人脸尺寸为72x72，最大人脸尺寸为288x288，则可根据折算出检测器的极限检测尺度约为[20%,80%]。

202、检测满足需求规格的目标临界尺寸，目标临界尺寸为需求规格下目标在画面中的最大尺寸和最小尺寸，需求规格为满足当前的应用场景的规格；

终端还需要检测满足需求规格的目标临界尺寸，终端具体执行如下步骤：

1）获取第二测试图像，第二测试图像为分辨率满足需求规格的测试图像；

2）根据第二测试图像确定需求规格下检测出的目标的第二最小尺寸和第二最大尺寸；

3）将第二最小尺寸和第二最大尺寸确定为目标临界尺寸。

具体的，终端采集一张或多张分辨率满足需求规格的且包含目标的测试图像，测量需求规格需要检出的目标临界尺寸，目标临界尺寸中包含最小目标尺寸TS_min和最大目标尺寸TS_max，该第二测试图像尺寸记为TIS。

203、根据极限检测尺度和目标临界尺寸确定图像临界尺寸；

终端根据上述极限检测尺度估算预设检测器在上述目标临界尺寸下的图像临界尺寸，该图像临界尺寸是指满足检测距离（极限检测尺度）的待检测图像的尺寸范围。

具体的，预设检测器要检出最小目标的图像尺寸范围为，预设检测器要检出最大目标的图像尺寸范围为。

需要说明的是，若上述检出最小目标的图像尺寸范围和检出最大目标的图像尺寸范围之间存在交集，则可以直接在对应的图像尺寸范围中确定block的blocksize。若上述图像尺寸范围之间不存在交集，则需要增加block的类型，即增加多种blocksize的block，其目的是能完全检测出应用场景（检测距离）内所有尺度的目标。上述blocksize为送入预设检测器的图像尺寸，对应后续步骤中子区域的大小以及子图像的尺寸。

204、分析目标在图像中的位置分布和尺度分布；

终端分析应用场景中，目标在图像中的位置分布和尺度分布。

具体的，关于位置分布的分析包括：终端确认目标在画面中的活动区域，确认目标检测结果在使用时在画面中的被关注区域，然后将活动区域和被关注区域求交集。这是为了确定不同应用场景下，目标在画面中可能分布的区域。其中，活动区域是指目标在画面中可能存在的区域，例如，对于在摄像头安装位置较高且具有一定向下倾角的应用场景中，在进行人脸检测时人脸在画面中的活动区域并非占满整个画面，人脸不会出现在图像的顶部区域，也一般不会出现在图像的底部区域。而在一些特殊的应用场景中，由于其功能的特殊性，实际只需要对画面中的部分区域进行目标检测，该部分区域被称为被关注区域，例如在特写画面的计算中，实际上只需要对声源角度范围内的目标进行检测，此时声源角度范围内的区域被称为被关注区域。

具体的，关于尺度分布的分析包括：测量并统计目标在图像中不同位置时的尺寸大小，得到目标的基本分布规律。

例如，对于商显领域的大型会议设备，其摄像头安装高度可能比成人高度高，且有一定的垂直倾角，这种情况下，当人离平板设备较近且站立时，或人坐着的时候，人脸一般处于画面中部以及中部靠下区域，相应的人脸尺寸跨度较大，即人脸尺寸可能很大，也可能较小；而当人离平板设备极远时，人脸处于画面中部靠上区域，此时人脸必然很小。基于此，对于中部及中部靠下的图像区域，应保证有较大的检测跨度；而对于中部靠上的区域，由于人脸很小，则主要考虑涵盖小人脸。具体的，不同应用场景中的检测距离不同，终端还需要结合应用场景中实际的检测距离来进行该尺度分布的分析。

205、根据目标的位置分布、尺度分布以及图像临界尺寸，在原始图像中划分出至少一个子区域；

终端根据目标的位置分布和尺度分布，以及上述图像临界尺寸，将原始图像划分成若干子区域。

进一步的，对于所划分出的子区域数目大于1的情形，终端还需要进一步调整各个子区域的大小，使其相互之间存在一定的重叠区域，而重叠区域的尺寸不应该小于目标能被检测出的图像最小尺寸，即重叠区域的尺寸需满足预设检测器要检出最小目标的图像尺寸范围。

需要说明的是，上述活动区域和被关注区域还可以是在后续运行阶段中确定的，在这种情况下，终端对于位置分布的分析则只能够先确认区域位置和区域大小中能够事先确认的部分，不能确认的部分需等待到运行阶段确认。例如上述被关注区域由声源角度范围决定时，被关注区域在部署阶段无法事先确认，只能够在运行阶段确定。

具体的，在进行子区域的划分时，在满足目标检测效果规格的情况下，所划分的子区域的数量应该尽可能少，即子区域的数量需满足最小原则，这是为了在后续运行阶段中节省算力,降低功耗。

206、根据子区域相对于原始图像的位置关系生成配置文件；

终端将划分得到的子区域相对于原始图像的位置关系保存成配置文件。

进一步的，终端可以为多个应用场景部署多个配置文件，相应地，针对各个应用场景，终端分别执行步骤202至步骤206以生成对应的配置文件。

207、确定预设检测器当前的应用场景，并根据应用场景获取对应的配置文件；

208、获取待检测图像；

209、从配置文件中读取位置关系，位置关系为预设检测器在应用场景下子区域和待检测图像的位置关系；

210、根据位置关系对待检测图像进行划分，得到与子区域对应的子图像；

211、通过预设检测器对子图像进行目标检测，得到检测结果；

212、通过非极大值抑制对检测结果进行合并，将合并的结果作为待检测图像的目标检测结果。

在本实施例中，步骤207至步骤212与前述实施例步骤101至步骤106类似，此处不再赘述。

进一步的，如果步骤205中活动区域和/或被关注区域无法事先确认，那么在运行阶段中，则根据运行阶段所确认的活动区域和/或被关注区域，结合配置文件中保存的部分位置关系，来确定实际场景中的活动区域和/或被关注区域，然后相应地更新子区域，并根据更新后的子区域进行目标检测。

下面以人脸检测为例对本申请提供的图像的目标检测方法作进一步阐述。相关领域的技术应当知晓，该举例并非将本发明限定于人脸检测，其他检测任务诸如人头检测、人体检测（行人检测）、手部检测、车辆检测等均归为本申请所指目标检测的范畴。

例如，当前有一个人脸检测器，该人脸检测器在640x360的图像中能检测到最小人脸尺寸为72x72，最大人脸尺寸为288x288，则可根据折算出检测器地极限检测尺度约为[20%,80%]。

一、应用场景1：

请参阅图3-a和图3-b，作为一个实施例，该应用场景需实现人脸的检测及对焦，该应用场景的规格为：人脸检测距离范围0.5m～3.0m。

测量需求场景下目标在画面中达到需求规格的目标临界尺寸，需求规格至少包括人脸检测距离和选用的摄像头模组。测量过程中，使用规定的摄像头模组进行图像采集，采集的图像信息至少包括人在检测范围临界值即0.5m和3.0m时的人脸（对于检测范围内的其他距离，也可以采集若干图像）。此部分测量的目的是为了在后续子区域划分时估算能达到期望检测距离的子区域大小。

再分析应用场景下目标在图像中的位置分布和尺度分布，具体过程为：在该应用场景中，摄像头安装位置较高且具有一定向下倾角，相应的人脸检测主要用于视频会议场景，人在画面中站立或坐着。部署阶段，测试人员可以在摄像头前，上述检测距离范围（0.5m～3.0m）内进行或坐或站立的姿态模拟，可以发现这样的规律：如图3-a所示，人脸在画面中的活动区域并非占满整个画面，人脸不会出现在图中所示顶部区域，也一般不会出现在图中所示底部区域（除非人离会议平板很近且蹲着，但这在正常会议场景中出现的概率极低，可以忽略不计）。因此，在该应用场景中实际无需对整幅图像进行人脸检测，而只需对图示中间区域（斜线填充区域）进行检测。进一步分析人脸在画面中的尺度分布可知：大人脸在图示活动区域中一般处于中部以及中部靠下区域，而活动区域的中部及中部靠上的区域一般是小人脸。

补充说明：对于不同视场角（FOV）的摄像头，同等距离的人脸在画面中的占比差别可能较大，所以测试、模拟时应选择需求规格的摄像头。（若同一应用场景、同样的检测需求，但产品对应的摄像头FOV差异明显，则也需要重新测算并调整后续子区域划分）。

进一步的，根据上述分析得到的目标的位置分布和尺度分布分析结果以及图像临界尺寸测算，可以将需求规格原始图像划分成如图3-b所示的4个子区域，分别为R1（A1B1C1D1）、R2（A2B2C2D2）、R3（A3B3C3D3）、R4（A4B4C4D4），即第一区域、第二区域、第三区域和第四区域。其中，R1和R2、R3、R4就对应着不同的blocksize，R1整个区域尺寸较大，用于检测画面中的大人脸；而R2、R3、R4尺寸一致，用于检测画面中较小的人脸，综合R1、R2、R3、R4可以兼顾0.5m～3.0m距离内的大小人脸。

进一步的，如图3-b所示，对于R2、R3、R4三个子区域，各相邻区域子区域之间有一定的重叠，以应对人脸刚好处于相邻区域边界线上的情形。相应的重叠尺寸需满足人脸刚好处于相邻区域边界上时能被正常检测出的要求。

二、应用场景2：

请参阅图4-a和图4-b，作为另一个实施例，该应用场景需实现特写画面的计算和展示，对应的应用场景规格为：人脸检测范围2.0m～6.0m。

此场景中人脸在画面中的活动区域如图4-a（斜线填充区域）所示。与应用场景一不同，应用场景二检测距离最远达6米，当人处于较远距离时，人脸能够接近画面顶部区域，故顶部可以忽略的区域很小，只有底部区域可以忽略掉。

进一步的，由于功能的特殊性：该场景功能实际只关注声源角度范围内是否有人脸以及人脸位置，所以实际既不需要对整幅画面进行检测，也无需对图4-a所示目标活动区域整个区域进行检测。通过测算，声源角度范围内对应的画面区域最大宽度不超过400像素，如图4-b右图所示（即为被关注区域），只需对图示被关注区域进行划分及检测。

进一步的，根据上述目标位置分布和尺度分布分析结果以及图像临界尺寸测算情况，将被关注区域初步划分成图4-b中间图所示5个子区域，分别为R1、R2、R3、R4、R5。其中，R1整个区域尺寸较大，用于检测画面中部及中部靠下部分出现的大人脸；而R2、R3、R4、R5尺寸一致，用于更精细的检测画面中部靠上的较小的人脸，综合R1、R2、R3、R4、R5可以兼顾该场景下2.0m～6.0m距离范围内的大小人脸。

进一步的，考虑各相邻区域子区域之间有一定的重叠，对初步拆分的区域进行调整，最终划分的子区域如图4-b中左图所示。

进一步的，图4-b中左图所示的图像子区域其大小是在开发阶段可以确定的并且被保存为配置文件。而所示图像子区域的位置，即水平方向坐标（竖直中轴线坐标）是开发阶段未知的，只能在运行期间确定，更具体地说，图中所示图像子区域水平方向坐标由输入的声源角度决定。所以，在程序运行期间，根据声源角度先确定图像子区域水平方向坐标，然后待检测图像对应水平坐标处按照配置文件中的图像子区域尺寸分别裁剪出相应的子图像，经过缩放后分别送入检测器检测。

三、应用场景3：

作为进一步的实施例，本场景同时包含了上述应用场景1、应用场景2即项目中既包含人脸检测及对焦功能，也包含特写画面展示功能。这种情况下，分别按照场景1、场景2所示实施方式，得到各自划分的子区域信息，并保存成对应的配置文件。

相应地，在程序运行阶段，根据应用当前的功能模式，选择与之匹配的配置文件，比如，当前的视频会议中用户未开启特写画面展示功能，只需要人脸检测及对焦功能，则根据人脸检测及对焦功能获取对应的配置文件，按照应用场景一所示划分区域进行检测；再比如，当前只需要应用场景二对应功能，则按照应用场景二功能获取相应的配置文件，按照应用场景二所示划分区域进行检测。

除了上述商显会议设备的应用场景，在安防监控领域，本方法也有应用价值。例如，一些监控摄像头存在“死角”，如墙壁、天空、树木、路牌等区域，目标（行人、车辆等）是不会出现在这些区域的，故可称作非目标活动区域。因而，在上述步骤205进行子区域的划分时，可以先确定该非目标活动区域，再在原始图像中剔除该非目标活动区域，得到目标活动区域，仅对目标活动区域进行子区域的划分（仅对目标活动区域进行检测）。

具体的，可以通过以下三种方式进行非目标活动区域的确认：

A、通过对非活动目标进行目标检测确定非活动区域；

对于摄像头布置位置确定、画面非活动区域事先可预估的场景，算法侧可提前确定非活动区域，将这些区域排除，仅对目标活动区域进行检测。即通过对画面中的墙壁、天空、树木、路牌等非活动目标进行目标检测，再根据目标检测的结果确定非活动区域。

B、通过用户划定的区域分界线确定非活动区域；

对于某些应用场景，算法侧不能完全预知活动区域，而用户又有客制化或个性化需求，则可以由用户来参与划定活动区域。例如，在楼道（楼梯口）监控或楼道客流统计的应用中，在摄像机部署好后，用户一般可以自主划定活动区域或统计分界线。相应地，算法会根据用户的划定得到画面活动区域，然后仅对活动区域进行子区域的划分及目标检测。

C、通过统计预设时间段内的目标检测结果的分布确定非活动区域。

对于非A、B场景，即活动区域既不能完全预知，也没有（或无法要求）用户参与设定，但可以意料画面中大概率会存在一些非活动区域的场景，则可以自适应（智能感知）的确定活动区域。比如对于一些公路监控摄像头，其布置位置是算法不能预知的，但一旦其安装完毕就不再移动了，即工作过程中摄像头是基本是静止的，对于这种情形，可以这样处理：当设备刚开始工作时，目标检测算法可以先针对整幅画面进行检测；同时，在一个后台线程中，通过活动区域检测算法对视频画面进行分析，经过一段时间的分析之后，非目标活动区域被确定下来，再次之后目标检测算法就仅对活动区域进行检测。这样以来，目标检测算法在经过一段时间的运行后变得更快、更节省功耗。具体的，上述活动区域检测算法基本原理为：通过背景建模算法（背景更新速度可以设置的较慢，比如几十分钟甚至超过一个小时）在相当长时间（比如几天时间）来对视频画面进行分析，若画面中某些区域始终为背景，则可被认作非目标活动区域，而其他区域则为目标活动区域。

通过以上三种方式进行非目标活动区域的确认，可以进一步地节省目标检测算法过程中的计算开销，降低功耗，从而达到节省能源的效果。

在本实施例中，通过需求规格部署对应的配置文件，并根据配置文件来完成目标检测，无需重复训练深度学习模型，缩短开发周期，节省开发成本。其次，通过为不同的应用场景部署不同的配置文件，使得同一检测器可以满足多个应用场景，实用性高，适用性广，能够灵活地适配不同的检测范围，满足不同的产品需求。通过配置文件能够根据不同应用场景的特性有针对性的进行部分区域的目标检测，达到节省算力，降低功耗的作用，适用于中低端移动嵌入式平台。

以上对本申请提供的图像的目标检测方法进行描述，以下对本申请提供的图像的目标检测装置进行描述。请参阅图5，图5为本申请提供的图像的目标检测装置一个实施例，该装置包括：

场景确定单元501，用于确定预设检测器当前的应用场景，并根据应用场景获取对应的配置文件，不同的应用场景映射有不同的配置文件；

获取单元502，用于获取待检测图像；

读取单元503，用于从配置文件中读取位置关系，位置关系为预设检测器在应用场景下子区域和待检测图像的位置关系；

第一处理单元504，用于根据位置关系对待检测图像进行划分，得到与子区域对应的子图像；

检测单元505，用于通过预设检测器对子图像进行目标检测，得到检测结果；

第二处理单元506，用于对检测结果进行处理，得到待检测图像的目标检测结果。

可选的，若子区域的数量大于1，则第二处理单元506具体用于：

通过非极大值抑制对检测结果进行合并，将合并的结果作为待检测图像的目标检测结果。

可选的，目标检测装置还包括：

第一检测单元507，用于检测预设检测器的极限检测尺度；

第二检测单元508，用于检测满足需求规格的目标临界尺寸，目标临界尺寸为需求规格下目标在画面中的最大尺寸和最小尺寸，需求规格为满足当前的应用场景的规格；

确定单元509，用于根据极限检测尺度和目标临界尺寸确定图像临界尺寸；

分析单元510，用于分析目标在图像中的位置分布和尺度分布；

划分单元511，用于根据目标的位置分布、尺度分布以及图像临界尺寸，在原始图像中划分出至少一个子区域；

生成单元512，用于根据子区域相对于原始图像的位置关系生成配置文件。

可选的，第一检测单元507具体用于：

获取第一测试图像，第一测试图像为分辨率满足预设检测器默认规格的测试图像；

根据第一测试图像确定默认规格下检测出的目标的第一最小尺寸和第一最大尺寸；

分别确定第一最小尺寸和第一最大尺寸相对于第一测试图像尺寸的第一比值和第二比值；

将第一比值和第二比值对应的区域确定为预设检测器的极限检测尺度。

可选的，第二检测单元508具体用于：

获取第二测试图像，第二测试图像为分辨率满足需求规格的测试图像；

根据第二测试图像确定需求规格下检测出的目标的第二最小尺寸和第二最大尺寸；

将第二最小尺寸和第二最大尺寸确定为目标临界尺寸。

可选的，确定单元509具体用于：

根据极限检测尺度和目标临界尺寸确定图像尺寸范围，图像尺寸范围包括检测出最小目标的图像尺寸范围和检测出最大目标的图像尺寸范围；

若图像尺寸范围之间存在交集，则在图像尺寸范围之间确定图像临界尺寸；

若图像尺寸范围之间不存在交集，则增加所确定的图像临界尺寸的个数。

可选的，分析单元510具体用于：

确认目标在画面中的活动区域；

确认目标检测结果在画面中的被关注区域；

根据活动区域和被关注区域的交集确定目标在图像中的位置分布。

可选的，分析单元510具体还用于：

可选的，划分单元511具体用于：

确定非活动区域；

在原始图像中排除非活动区域，确定原始图像中的活动区域；

根据目标的位置分布、尺度分布以及图像临界尺寸，在活动区域中划分出至少一个子区域。

可选的，划分单元511具体用于：

通过对非活动目标进行目标检测确定非活动区域；

或，

通过用户划定的区域分界线确定非活动区域；

或，

可选的，若子区域的数量大于1，则目标检测装置还包括：

调整单元513，用于调整各个子区域的大小，以使得各个子区域相互之间存在满足预设尺寸的重叠区域，预设尺寸不小于需求规格下目标能够被检出的最小图像尺寸。

可选的，在划分单元511根据目标的位置分布、尺度分布以及图像临界尺寸，在原始图像中划分出至少一个子区域时，子区域的数量满足数量最小原则。

可选的，若应用场景为人脸检测及对焦，则子区域的数量为4，分别为第一区域、第二区域、第三区域和第四区域；

第一区域的尺寸为第一预设值，第二区域、第三区域和第四区域的尺寸均为第二预设值，第一预设值大于第二预设值，第二区域、第三区域之间存在重叠部分，第三区域和第四区域之间存在重叠部分。

本实施例装置中，各单元的功能与前述图1或图2所示方法实施例中的步骤对应，此处不再赘述。

本申请还提供了一种摄像设备，摄像设备在运行时执行如上任一图像的目标检测方法。

本申请还提供了一种图像的目标检测装置，请参阅图6，图6为本申请提供的图像的目标检测装置一个实施例，该装置包括：

处理器601、存储器602、输入输出单元603、总线604；

处理器601与存储器602、输入输出单元603以及总线604相连；

存储器602保存有程序，处理器601调用程序以执行如上任一图像的目标检测方法。

本申请还涉及一种计算机可读存储介质，计算机可读存储介质上保存有程序，其特征在于，当程序在计算机上运行时，使得计算机执行如上任一图像的目标检测方法。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（ROM，read-onlymemory）、随机存取存储器（RAM，random access memory）、磁碟或者光盘等各种可以存储程序代码的介质。

Claims

1.一种图像的目标检测方法，其特征在于，所述目标检测方法包括：

获取待检测图像；

对所述检测结果进行处理，得到所述待检测图像的目标检测结果；

所述配置文件通过如下方式生成：

检测所述预设检测器的极限检测尺度；

分析目标在图像中的位置分布和尺度分布；

根据所述子区域相对于所述原始图像的位置关系生成配置文件；

所述分析目标在图像中的位置分布包括：

确认目标在画面中的活动区域；

确认目标检测结果在画面中的被关注区域；

2.根据权利要求1所述的目标检测方法，其特征在于，若所述子区域的数量大于1，则所述对所述检测结果进行处理，得到所述待检测图像的目标检测结果包括：

3.根据权利要求1所述的目标检测方法，其特征在于，所述检测所述预设检测器的极限检测尺度包括：

分别确定所述第一最小尺寸和所述第一最大尺寸相对于所述第一测试图像的尺寸的第一比值和第二比值；

4.根据权利要求1所述的目标检测方法，其特征在于，所述检测满足需求规格的目标临界尺寸包括：

5.根据权利要求1所述的目标检测方法，其特征在于，所述根据所述极限检测尺度和所述目标临界尺寸确定图像临界尺寸包括：

6.根据权利要求1所述的目标检测方法，其特征在于，所述分析目标在图像中的尺度分布包括：

7.根据权利要求1至6中任一项所述的目标检测方法，其特征在于，根据所述位置分布、所述尺度分布以及所述图像临界尺寸，在原始图像中划分出至少一个子区域包括：

确定非活动区域；

8.根据权利要求7所述的目标检测方法，其特征在于，所述确定非活动区域包括：

通过对非活动目标进行目标检测确定非活动区域；

或，

通过用户划定的区域分界线确定非活动区域；

或，

9.根据权利要求1至6中任一项所述的目标检测方法，其特征在于，若所述子区域的数量大于1，在根据所述子区域相对于所述原始图像的位置关系生成配置文件之前，所述方法还包括：

10.根据权利要求1至6中任一项所述的目标检测方法，其特征在于，在所述根据所述位置分布、所述尺度分布以及所述图像临界尺寸，在原始图像中划分出至少一个子区域时，所述子区域的数量满足数量最小原则。

11.根据权利要求1所述的目标检测方法，其特征在于，若所述应用场景为人脸检测及对焦，则所述子区域的数量为4，分别为第一区域、第二区域、第三区域和第四区域；

12.一种图像的目标检测装置，其特征在于，所述目标检测装置包括：

获取单元，用于获取待检测图像；

第二处理单元，用于对所述检测结果进行处理，得到所述待检测图像的目标检测结果；

所述目标检测装置还包括：

第一检测单元，用于检测所述预设检测器的极限检测尺度；

分析单元，用于分析目标在图像中的位置分布和尺度分布；

生成单元，用于根据所述子区域相对于所述原始图像的位置关系生成配置文件；

所述分析单元具体用于：

确认目标在画面中的活动区域；

确认目标检测结果在画面中的被关注区域；

13.一种摄像设备，其特征在于，所述摄像设备执行如权利要求1至11中任一项所述的图像的目标检测方法的方法。

14.一种图像的目标检测装置，其特征在于，所述目标检测装置包括：

处理器、存储器、输入输出单元以及总线；

所述存储器保存有程序，所述处理器调用所述程序以执行如权利要求1至11中任一项所述方法。