WO2023024779A1

WO2023024779A1 - 人像检测方法、装置、电子设备和存储介质

Info

Publication number: WO2023024779A1
Application number: PCT/CN2022/107190
Authority: WO
Inventors: 李远哲; 闵捷
Original assignee: 西门子（中国）有限公司
Priority date: 2021-08-26
Filing date: 2022-07-21
Publication date: 2023-03-02
Also published as: CN115731585A

Abstract

本申请提供了人像检测方法、装置、电子设备和存储介质，该人像检测方法包括：获取一张待检测图像，其中，所述待检测图像中包括至少一个人像；生成所述待检测图像的至少两个第一特征图像，其中，首个第一特征图像是从所述待检测图像中提取特征后得到的，后一个第一特征图像是从前一个第一特征图像中提取特征后得到的；对所述至少两个第一特征图像进行特征融合，获得至少两个第二特征图像；根据所述至少两个第二特征图像，确定所述待检测图像中人像的分布。本方案降低对聚集人员数量进行统计的成本。

Description

人像检测方法、装置、电子设备和存储介质

技术领域

本申请涉及图像处理技术领域，尤其涉及一种人像检测方法、装置、电子设备和存储介质。

背景技术

随着城市的快速发展，城市交通枢纽的人流量越来越大，比如地铁站、火车站、机场等交通枢纽具有较大的人流量，在出现意外情况或恶劣天气时，会在短时间内聚集大量人员，较多人员聚集存在较大的安全隐患，为此需要确定交通枢纽内聚集人员数量，以在聚集人员数量超过交通枢纽的承载能力时采取限流措施，预防跌落站台、踩踏等事故的发生。

目前，为了确定交通枢纽内的聚集人员数量，由工作人员在交通枢纽的出入口统计出入交通枢纽的人数，根据各工作人员的人数统计结果确定交通枢纽内的聚集人员数量。

由于交通枢纽通常具有多个出入口，通过工作人员在出入口统计出入交通枢纽人数以确定聚集人员数量的方法，需要在交通枢纽的每个出入口配备工作人员进行人数统计，因此需要较多的人力，导致对聚集人员数量进行统计的成本较高。

发明内容

有鉴于此，本申请提供的人像检测方法、装置、电子设备和存储介质，能够降低对聚集人员数量进行统计的成本。

第一方面，本申请实施例提供了一种人像检测方法，包括：

获取一张待检测图像，其中，所述待检测图像中包括至少一个人像；

生成所述待检测图像的至少两个第一特征图像，其中，首个第一特征图像是从所述待检测图像中提取特征后得到的，后一个第一特征图像是从前一个第一特征图像中提取特征后得到的；

对所述至少两个第一特征图像进行特征融合，获得至少两个第二特征图像；

根据所述至少两个第二特征图像，确定所述待检测图像中人像的分布。

第二方面，本申请实施例还提供了一种人像检测装置，包括：

获取模块，用于获取一张待检测图像，其中，所述待检测图像中包括至少一个人像；

生成模块，用于生成所述获取模块获取到的所述待检测图像的至少两个第一特征图像，其中，首个第一特征图像是从所述待检测图像中提取特征后得到的，后一个第一特征图像是从前一个第一特征图像中提取特征后得到的；

融合模块，用于对所述生成模块生成的所述至少两个第一特征图像进行特征融合，获得至少两个第二特征图像；

检测模块，用于根据所述融合模块获得的所述至少两个第二特征图像，确定所述待检测图像中人像的分布。

第三方面，本申请实施例还提供了一种电子设备，包括：处理器、通信接口、存储器和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行上述第一方面所提供人像检测方法对应的操作。

第四方面，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机指令，所述计算机指令在被处理器执行时，使所述处理器执行上述第一方面所提供人像检测方法对应的操作。

第五方面，本申请实施例还提供了一种计算机程序产品，所述计算机程序产品被有形地存储在计算机可读介质上并且包括计算机可执行指令，所述计算机可执行指令在被执行时使至少一个处理器执行如上述第一方面或第一方面的任一可能的实现方式提供的人像检测方法。

其中，获取包括人像的待检测图像后，从待检测图像中提取特征获得多个第一特征图像，然后对各第一特征图像进行融合获得多个第二特征图像，进而根据各第二特征图像确定待检测图像中人像的分布，由于待检测图像可以从相应场所内采集，因此可以将待检测图像中的人像映射到相应的场所内，从而根据待检测图像中人像的分布，确定相应场所内聚集人员的数量和人员的分布情况，实现了聚集人员数量和人员分布情况的自动检测，无需在场所的各出入口配备工作人员进行人数统计，从而能够节省人力，降低对场所内聚集人员数量进行统计的成本。

对于上述任一方面，可选地，在通过对第一特征图像进行特征融合而获得第二特征图像时，根据各第一特征图像的生成顺序，对相邻生成的至少两个第一特征图像进行特征融合，获得至少两个第二特征图像，不同的第二特征图像由不完全相同的至少两个第一特征图像进行特征融合而得到。

由于各第一特征图像顺序生成，后一个第一特征图像从前一个第一特征图像中提取特征后得到，前一个第一特征图像中的部分特征在后一个第一特征图像中可能被舍弃，而被舍弃的特征可能是待检测图像中尺寸较小的人像，通过对相邻生成的第一特征图像进行特征融合，保证所获得的第二特征图像不会丢失待检测图像中的特征，从而在基于第二特征图像确定待检测图像中人像的分布时，待检测图像中尺寸较小的人像也能够被识别出来，从而能够提高对待检测图像中人像数量和人像分布进行检测的准确性。

对于上述任一方面，可选地，在对相邻生成的第一特征图像进行特征融合获得第二特征图像时，首先对最后一个生成的第一特征图像进行卷积处理，获得与最后一个生成的第一特征图像相对应的第二特征图像，然后将与后一个生成的第一特征图像相对应的第二特征图像，与前一个生成的第一特征图像进行特征融合，获得与前一个生成的第一特征图像相对应的第二特征图像。

由于将与后一个生成的第一特征图像相对应的第二特征图像，与前一个生成的第一特征图像进行特征融合，获得与前一个生成的第一特征图像相对应的第二特征图像，因此，对于任意一个第一特征图像，与该第一特征图像相对应的第二特征图像中包括，比该第一特征图像高阶的第一特征图像中的全部特征，不会丢失待检测图像中的特征，从而在基于第二特征图像确定待检测图像中的人像数量和人像分布时，能够提高对待检测图像中人像进行识别的全面性，进而提高对待检测图像中人像数量和人像分布进行检测的准确性。

对于上述任一方面，可选地，在将后一个生成的第一特征图像对应的第二特征图像，与前一个生成的第一特征图像进行特征融合，获得与前一个生成的第一特征图像相对应的第二特征图像时，对与第n个生成的第一特征图像相对应的第二特征图像进行卷积处理，获得第三特征图像，对第三特征图像进行双线性插值处理获得第四特征图像，将第四特征图像与第n-1个生成的第一特征图像进行特征融合获得第五特征图像，对第五特征图像进行卷积处理，获得与第n-1个生成的第一特征图像相对应的第二特征图像。其中，n为大于1且小于或等于第一特征图像总数的整数，与第n个生成的第一特征图像相对应的第二特征图像和第三特征图像的尺寸均为C*W*H，C为通道数，W为图像的宽度，H为图像的高度，第四特征图像的尺寸为C*2W*2H，第n-1个生成的第一特征图像的尺寸为C*2W*2H，第五特征图像的尺寸为2C*2W*2H，与第n-1个生成的第一特征图像相对应的第二特征图像的尺寸为C*2W*2H。

在进行特征融合之前，对第三特征图像进行双线性插值处理，获得与第n-1个生成的第一特征图像具有相同尺寸的第四特征图像，以使特征融合能够顺利进行。在进行特征融合之后，对特征融合生成的第五特征图像进行卷积处理，获得与第n-1个生成的第一特征图像具有相同尺寸的第二特征图像，保证输入的特征图像与输出的特征图像具有相同的尺寸，便于后续根据第二特征图像确定待检测图像中人像的分布，使得人像检测能够顺利进行。

对于上述任一方面，可选地，在根据第二特征图像确定待检测图像中人像的分布时，首先对每个第二特征图像进行感受野增强处理，获得相应的第五特征图像，然后对各第五特征图像进行特征融合获得一张第六特征图像，然后根据第六特征图像确定待检测图像中人像的分布。

由于待处理图像中不同人像的尺寸不同，通过对第二特征图像进行感受野增强处理获得第五特征图像，增大第五特征图像中人像在待检测图像中的参考区域，由于增大了第五特征图像在待检测图像中的参考区域，因此在基于第五特征图像确定待检测图像中人像的分布时，能够提高对待检测图像中不同尺寸人像进行检测的能力，进而提高对待检测图像中人像数量和人像分布进行检测的准确性。

对于上述任一方面，可选地，在对第二特征图像进行感受野增强处理获得第五特征图像时，针对每个第二特征图像，对该第二特征图像进行三次卷积处理获得第七特征图像，对该第二特征图像进行两次卷积处理获得第八特征图像，对该第二特征图像进行一次卷积处理获得第九特征图像，然后对第七特征图像、第八特征图像和第九特征图像进行特征融合，获得第十特征图像，然后对第十特征图像进行卷积处理，获得与该第二特征图像相对应的第五特征图像。其中，针对任意一个第二特征图像，该第二特征图像以及与该第二特征图像相对应的第五特征图像、第七特征图像、第八特征图像和第九特征图像的尺寸均为C*W*H，与该第二特征图像相对应的第十特征图像的尺寸为3C*W*H。

通过对第二特征图像进行不同次数的卷积处理，获得第七特征图像、第八特征图像和第九特征图像，通过对第七特征图像、第八特征图像和第九特征图像进行特征融合，获得第十特征图像，通过对第十特征图像进行卷积获得与第二特征图像相对应的第五特征图像。由于第七特征图像、第八特征图像和第九特征图像通过对第二特征图像进行不同次数的卷积获得，使得基于第七特征图像、第八特征图像和第九特征图像获得的第五特征图像相对于第二特征图像具有更强的感受野，从而能够基于第五特征图像对待检测图像中不同尺寸的人像进行准确检测，从而保证对待检测图像中人像数量和人像分布进行检测的准确性。

对于上述任一方面，可选地，在根据第六特征图像确定待检测图像中人像的分布时，首先对第六特征图像进行归一化处理，然后将经归一化处理后的第六特征图像分别输入预先训练的第一分类器、第二分类器和第三分类器，获得第一分类器输出的中心点信息，获得第二分类器输出的第一图像框信息，获得第三分类器输出的第二图像框信息，进而根据中心点信息、第一图像框信息和第二图像框信息，确定待检测图像中人像的分布。

中心点信息用于指示待检测图像中人像头部的中心点坐标，第一图像框信息包括在待检测图像中用于标注人像头部的矩形框的坐标值，第二图像框信息包括在待检测图像汇总用于标注人体的矩形框的坐标值，根据中心点信息和第一图像框信息可以确定待检测图像中人像头部的位置，根据第二图像框信息可以确定待检测图像中人体的位置，进而根据标注人像头部的矩形框的数量或标注人体的矩形框的数量，可以确定待检测图像中人像的数量，根据待检测图像中标注人像头部的矩形框的位置和标注人体的矩形框的位置，可确定待检测图像中人像的分布。通过矩形框标注出待处理图像中的人像头部和人体，能够更加准确地确定待检测图像中人像的数量和分布，进而可以更加准确地确定相应场所内人员的聚集数量和人员分布情况，有助于提高用户的使用体验。

对于上述任一方面，可选地，还可以经归一化处理后的第六特征图像输入第四分类器，获得第四分类器输出的图像框质量信息，图像框质量信息用于指示在待检测图像中用于标注人像头部的矩形框对人像头部进行标注的准确性，然后根据图像框质量信息从中心点信息中筛选出目标中心点，目标中心点对应的用于标注人像头部的矩形框的准确性小于预设的准确性阈值，然后从中心点信息中将目标中心点的坐标值删除。

由于第二分类器确定出的每个矩形框与中心点信息中的一个中心点坐标相对应，在确定第二分类器确定出的一个矩形框不能准确标注待检测图像中的人像头部时，将该矩形框对应的中心点坐标从中心点信息中删除，进而舍弃未能准确标注待检测图像中人像头部的矩形框，避免人像的误识别，从而能够进一步提高对待检测图像中人像数量和人像分布进行检测的准确性。

附图说明

图1是本申请实施例一提供的一种人像检测方法的流程图；

图2是本申请实施例二提供的一种特征融合方法的示意图；

图3是本申请实施例二提供的另一种特征融合方法的流程图；

图4是本申请实施例二提供的一种特征融合方法的流程图；

图5是本申请实施例三提供的一种人像检测方法的示意图；

图6是本申请实施例三提供的一种感受野增强处理方法的示意图；

图7是本申请实施例三提供的一种人像数量和人像分布确定方法的流程图；

图8是本申请实施例四提供的一种人像检测装置的示意图；

图9是本申请实施例四提供的另一种人像检测装置的示意图；

图10是本申请实施例四提供的又一种人像检测装置的示意图；

图11是本申请实施例四提供的再一种人像检测装置的示意图；

图12是本申请实施例五提供的一种电子设备的示意图。

附图标记列表：

100：人像检测方法 400：特征融合方法

700：人像数量和人像分布确定方法 800：人像检测装置

1200：电子设备 A ₀-A _N：第一特征图像

B ₀-B _N：第二特征图像 C ₀-C _N：第五特征图像 D：第六特征图像

B _i：第二特征图像 B _i11、B _i12、B _i21：特征图像 B _i13：第七特征图像

B _i22：第八特征图像 B _i31：第九特征图像 B _i123：第十特征图像

C _i：第五特征图像 801：获取模块 802：生成模块

803：融合模块 804：检测模块 8031：卷积子模块

8032：第一融合子模块 8041：增强子模块 8042：第二融合子模块

8043：检测子模块 805：计算模块 806：筛选模块

807：删除模块 1202：处理器 1204：通信接口

1206：存储器 1208：通信总线 1210：程序

101：获取一张待检测图像

102：生成待检测图像的至少两个第一特征图像

103：对各第一特征图像进行特征融合，获得至少两个第二特征图像

104：根据各第二特征图像，确定待检测图像中人像的分布

401：输入与第n个生成的第一特征图像相对应的第二特征图像

402：对与第n个第一特征图像相对应的第二特征图像进行卷积处理，获得第三特征图像

403：对第三特征图像进行双线性插值处理，获得第四特征图像

404：将第四特征图像与第n-1个生成的第一特征图像进行特征融合，获得第五特征图像

405：对第五特征图像进行卷积处理，获得与第n-1个第一特征图像相对应的第二特征图像

701：将归一化处理后的第六特征图像输入第一分类器，获得中心点信息

702：将归一化处理后的第六特征图像输入第二分类器，获得第一图像框信息

703：将归一化处理后的第六特征图像输入第三分类器，获得第二图像框信息

704：根据中心点信息、第一及第二图像框信息，确定人像的分布

具体实施方式

如前所述，在地铁站、火车站、机场等人流量较大的场所，为了预防跌落站台、踩踏等事故的发生，需要确定相应场所内的聚集人员数量和人员分布情况。目前，通过人工在相应场所的出入口统计出入场所的人数，根据人数统计结果确定场所内的聚集人员数量，通过这种方式仅能够确定场所内聚集人员的数量，无法确定场所内的人员分布情况，要确定人员分布情况还需要人工现场查看。另外，人流量较大的场所通常包括多个出入口，比如地铁站通常包括4个出入口，火车站包括多个进站口和多个出站口，通过人工计数的方式需要在每个出入口配备人员进行人数统计，为了确定场所内聚集人员的数量，需要较多的人力，导致对聚集人员数量进行统计的成本较高。

本申请实施例中，对于需要确定聚集人员数量和人员分布情况的场所，从该场所采集包括人像的待检测图像，从待检测图像中提取特征获得多个第一特征图像，然后对各第一特征图像进行特征融合，获得多个第二特征图像，然后根据各第二特征图像确定待检测图像中人像的分布，由于待检测图像从需要确定聚集人员数量和人员分布情况的场所采集，因此根据待检测图像中人像的分布，可以确定场所内聚集人员的数量和人员分布情况。由此可见，从待进行人员数量统计和人员分布情况确定的场所采集包括人像的待检测图像，通过对待检测图像进行图像处理，确定待检测图像中人像的分布，进而确定场所内聚集人员的数量和人员分布情况，无需在场所的每个出入口配备工作人员进行人数统计，从而能够节省人力，降低对场所内聚集人员数量进行统计的成本。

需要说明的是，本申请实施例从待检测图像中提取特征图像，通过对特征图像进行诸如特征提取、特征融合、感受野增强等各种类型的处理，确定待检测图像中的人员数量和人员分布，其中涉及的各特征图像(包括第一特征图像、第二特征图像…第N特征图像等)均是指卷积层中的特征图像(featuremap)。

下面结合附图对本申请实施例提供的人像检测方法、装置和电子设备进行详细说明。

实施例一

图1是本申请实施例一提供的一种人像检测方法100的流程图，如图1所示，该人像检测方法100包括如下步骤：

步骤101、获取一张待检测图像。

待检测图像是需要进行人像识别的图像，待检测图像中包括至少一个人像。在确定人流量较大场所内聚集人员数量和人员分布情况时，待检测图像是人流量较大场所内的图像，比如可以通过设置在人流量较大场所内高处的摄像头采集待检测图像。

步骤102、生成待检测图像的至少两个第一特征图像。

在获取到待检测图像后，首先从待检测图像中提取特征，获得一个第一特征图像，然后从获得的第一特征图像中提取特征，获得新的第一特征图像，即首个第一特征图像是从待检测图像中提取特征后得到的，后一个第一特征图像是从前一个第一特征图像中提取特征后得到的。

比如，从待检测图像中提取特征获得第一特征图像1，从第一特征图像1中提取特征获得第一特征图像2，从第一特征图像2中提取特征获得第一特征图像3，从第一特征图像3中提取特征获得第一特征图像4。即，第一特征图像1是从待检测图像中提取特征后得到的，第一特征图像2是从第一特征图像1中提取特征后得到的，第一特征图像3是从第一特征图像2中提取特征后得到的，第一特征图像4是从第一特征图像3中提取特征后得到的。

步骤103、对各第一特征图像进行特征融合，获得至少两个第二特征图像。

在获取到多个第一特征图像后，对两个或两个以上的第一特征图像进行特征融合，获得至少两个第二特征图像，其中，不同的第二特征图像由不完全相同的至少两个第一特征图像融合而获得。

特征融合的目的，是将从图像中提取的特征合并成一个比输入更具有判别能力的特征，即对至少两个第一特征图像进行特征融合，获得一个比所使用的每个第一特征图像更具有判别能力的第二特征图像。在进行特征融合时，可以采用系列特征融合策略或并行特征融合策略，其中，系列特征融合策略直接将两个特征进行连接，两个输入特征x和y的维数若为p和q，输出特征z的维数为p+q，并行特征融合策略将两个特征向量组合成负向量，对于输入特征x和y，输出特征z＝x+iy，i是虚数单元。

需要说明的是，通过对第一特征图像进行特征融合获得第二特征图像，除了可以使用上述的系列特征融合策略或并行特征融合策略外，还可以使用其他类型的特征融合方式，对于特征融合的具体方式本申请实施例不作限定。

步骤104、根据各第二特征图像，确定待检测图像中人像的分布。

由于第二特征图像通过对第一特征图像进行特征融合而获得，第一特征图像直接或间接从待检测图像中提取获得，因此第二特征图像中包括反映待检测图像中人像位置、人像轮廓、人像尺寸等的信息，所以根据各第二特征图像能够确定待检测图像中人像的分布。

在本申请实施例中，获取包括人像的待检测图像后，从待检测图像中提取特征获得多个第一特征图像，然后对各第一特征图像进行融合获得多个第二特征图像，进而根据各第二特征图像确定待检测图像中人像的分布，由于待检测图像可以从相应场所内采集，因此可以将待检测图像中的人像映射到相应的场所内，从而根据待检测图像中人像的分布，确定相应场所内聚集人员的数量和人员的分布情况，实现了聚集人员数量和人员分布情况的自动检测，无需在场所的各出入口配备工作人员进行人数统计，从而能够节省人力，降低对场所内聚集人员数量进行统计的成本。

需要说明的是，由于首个第一特征图像是从待检测图像中提取特征后得到的，后一个第一特征图像是从前一个第一特征图像中提取特征后得到的，按照第一特征图像的获取顺序，越靠后获取的第一特征图像越高阶，高阶的第一特征图像具有更强的语义信息，但分辨率较低，对细节的感知能力较差，导致小物体在高阶的第一特征图像中丢失。通过对不同的第一特征图像进行特征融合获得第二特征图像，保证第二特征图像包括高阶的语义信息，同时不会丢失小物体，保证能够识别出待检测图像中较小的人像，从而保证对待检测图像中人像数量和人像分布进行检测的准确性。

还需要说明的是，在本申请实施例及后续各实施例中，待检测图像中人像的分布，可包括待检测图像中人像的位置分布，可包括待检测图像中人像的数量。

实施例二

在实施例一所提供人像检测方法100的基础上，在对第一特征图像进行特征融合获得第二图像时，可以根据各第一特征图像的生成顺序，对相邻生成的至少两个第一特征图像进行特征融合，获得至少两个第二特征图像，其中，不同的第二特征图像，由不完全相同的至少两个第一特征图像进行特征融合而获得。

在本申请实施例中，由于后一个第一特征图像是从前一个第一特征图像中提取特征后得到的，前一个第一特征图像中小物体在后一个第一特征图像中可能会丢失，根据第一特征图像的生成顺序，将相邻生成的至少两个第一特征图像进行特征融合，获得第二特征图像，保证第二特征图像中包括小物体，进而在根据第二特征图像确定待检测图像中的人像数量和人像分布时，能够将待检测图像中较小的人像识别出来，从而保证对待检测图像中人像数量和人像分布进行检测的准确性。

在一个例子中，按照各第一特征图像由前至后的生成顺序，各第一特征图像为第一特征图像1、第一特征图像2、第一特征图像3和第一特征图像4，在对第一特征图像进行特征融合生成第二特征图像时，可以对第一特征图像1和第一特征图像2进行特征融合，对第一特征图像2和第一特征图像3进行特征融合，对第一特征图像3和第一特征图像4进行特征融合，对第一特征图像1、第一特征图像2和第一特征图像3进行特征融合，对第一特征图像2、第一特征图像3和第一特征图像4进行特征融合，对第一特征图像1、第一特征图像2、第一特征图像3和第一特征图像4进行特征融合，每次特征融合均可以获得一个第二特征图像。

应理解，在对第一特征图像1、第一特征图像2和第一特征图像3进行特征融合时，可以先对第一特征图像1和第一特征图像2进行特征融合，然后再将特征融合结果与第一特征图像3进行特征融合，获得第二特征图像。在对第一特征图像2、第一特征图像3和第一特征图像4进行特征融合时，可以先对第一特征图像2和第一特征图像3进行特征融合，然后再将特征融合结果与第一特征图像4进行特征融合，获得第二特征图像。在对第一特征图像1、第一特征图像2、第一特征图像3和第一特征图像4进行特征融合时，可以先对第一特征图像1和第一特征图像2进行特征融合获得特征融合结果1，然后将特征融合结果1与第一特征图像3进行特征融合获得特征融合结果2，然后将特征融合结果2与第一特征图像4进行特征融合，获得第二特征图像。

在一种可能的实现方式中，在对第一特征图像进行特征融合生成第二特征图像时，可以将后一个第一特征图像对应的第二特征图像，与前一个第一特征图像进行特征融合，获得与前一个第一特征图像相对应的第二特征图像。图2是本申请实施例二提供的一种特征融合方法的示意图，如图2所示，共计有N个第一特征图像，按照各第一特征图像的生成顺序，首个第一特征图像A ₁从待检测图像A ₀中提取得到，第n个第一特征图像A _n从第一特征图像A _n-1中提取得到，其中n为大于1且小于或等于N的整数。对第N个生成的第一特征图像A _N进行卷积处理，获得与第N个生成的第一特征图像A _N相对应的第二特征图像B _N。将与第n个生成的第一特征图像A _n相对应的第二特征图像B _n，与第n-1个生成的第一特征图像A _n-1进行特征融合，获得与第n-1个生成的第一特征图像A _n-1相对应的第二特征图像B _n-1。

图3是本申请实施例二提供的另一种特征融合方法的示意图，如图3所示，共计有4个第一特征图像，按照各第一特征图像的生成顺序，首个第一特征图像A ₁从待检测图像A ₀中提取得到，第二个第一特征图像A ₂从第一特征图像A ₁中提取得到，第三个第一特征图像A ₃从第一特征图像A ₂中提取得到，第四个第一特征图像A ₄从第一特征图像A ₃中提取得到。对第一特征图像A ₄进行卷积处理，获得与第一特征图像A ₄相对应的第二特征图像B ₄；对第一特征图像A ₃和第二特征图像B ₄进行特征融合，获得与第一特征图像A ₃相对应的第二特征图像B ₃；对第一特征图像A ₂和第二特征图像B ₃进行特征融合，获得与第一特征图像A ₂相对应的第二特征图像B ₂；对第一特征图像A ₁和第二特征图像B ₂进行特征融合，获得与第一特征图像A ₁相对应的第二特征图像B ₁。

在本申请实施例中，对第N个生成的第一特征图像进行卷积处理，获得与第N个第一特征图像相对应的第二特征图像，将与第n个生成的第一特征图像相对应的第二特征图像，与第n-1个生成的第一特征图像进行特征融合，获得与第n-1个生成的第一特征图像相对应的第二特征图像，使得各第二特征图像的总和包括了待检测图像中的全部特征信息，进而能够提高对待检测图像中人像进行识别的全面性，进而保证对待检测图像中人像数量和人像分布进行检测的准确性。

在本申请实施例中，对于较后获取到的第一特征图像，该第一特征图像对应的第二特征图像具有较低的分辨率，相应的该第二特征图像所包括的特征较少，且该第二特征图像的尺寸较小，通过该第二特征图像可以快速识别待检测图像中较大的人像。对于较先获取到的第一特征图像，该第一特征图像对应的第二特征图像具有较高的分辨率，相应的该第二特征图像所包括的特征较多，且该第二特征图像的尺寸较大，通过该第二特征图像可以识别待检测图像中较小的人像。由此可见，所获得的各第二特征图像具有不同的分辨率，分辨率较低的第二特征图像包括高阶特征，可用于快速识别待检测图像中较大的人像，而分辨率较高的第二特征图像包括较多的图像信息，可用于识别待检测图像中较小的人像，从而通过各第二特征图像确定待检测图像中人像的分布时，不仅能够提高对待检测图像中人像进行识别的效率，还能够保证对待检测图像中人像进行识别的准确性。

在一种可能的实现方式中，在将与第n个生成的第一特征图像相对应的第二特征图像，与第n-1个生成的第一特征图像进行特征融合，获得与第n-1个生成的第一特征图像相对应的第二特征图像时，可以通过双线性插值使特征融合的第一特征图像和第二特征图像具有相同的尺寸，以保证能够顺利对第一特征图像和第二特征图像进行特征融合。图4是本申请实施例二提供的一种特征融合方法400的流程图，如图4所示，该特征融合方法400包括如下步骤：

步骤401、输入与第n个生成的第一特征图像相对应的第二特征图像。

与第n个生成的第一特征图像相对应的第二特征图像的尺寸为C*W*H，C为通道数，W为图像的宽度，H为图像的高度。

需要说明的是，定义与第n个生成的第一特征图像相对应的第二特征图像的尺寸为C*W*H，仅是为了说明特征融合过程中各特征图像的尺寸和通道数的变化，并非对第三特征图像的尺寸和通道数进行具体限定，因为不同第一特征图像具有不同的尺寸，不同的第一特征图像对应的第二特征图像也具有不同的尺寸。

步骤402、对与第n个生成的第一特征图像相对应的第二特征图像进行卷积处理，获得第三特征图像。

在获取与对n-1个生成的第一特征图像相对应的第二特征图像时，首先对与第n个生成的第一特征图像相对应的第二特征图像进行卷积处理，获得第三特征图像。参见图3，比如在获取与第一特征图像A ₃相对应的第二特征图像B ₃时，首先对第二特征图像B ₄进行卷积处理，获得第三特征图像。

在对与第n个生成的第一特征图像相对应的第二特征图像进行卷积处理时，所获得第三特征图像的尺寸也为C*W*H。另外，在对与第n个生成的第一特征图像相对应的第二特征图像进行卷积处理时，所使用卷积核的尺寸可以为C*3*3。

步骤403、对第三特征图像进行双线性插值处理，获得第四特征图像。

在与第n个生成的第一特征图像相对应的第二特征图像的尺寸为C*W*H时，第n-1个生成的第一特征图像的尺寸为C*2W*2H，为了能够与第n-1个生成的第一特征图像进行特征融合，对第三特征图像进行双线性插值处理，获得尺寸为C*2W*2H的第四特征图像。

在对尺寸为C*W*H的第三特征图像进行双线性插值处理时，可以对第三特征图像进行上采样层双线性插值，以获得尺寸为C*2W*2H的第四特征图像。

步骤404、将第四特征图像与第n-1个生成的第一特征图像进行特征融合，获得第五特征图像。

在与第n个生成的第一特征图像相对应的第二特征图像的尺寸为C*W*H时，第n-1个生成的第一特征图像的尺寸为C*2W*2H，第四特征图像的尺寸也为C*2W*2H，通过对第四特征图像与第n-1个生成的第一特征图像进行特征融合，获得尺寸为2C*2W*2H的第五特征图像。

步骤405、对第五特征图像进行卷积处理，获得与第n-1个生成的第一特征图像相对应的第二特征图像。

由于第五特征图像的尺寸为2C*2W*2H，而第n-1个生成的第一特征图像的尺寸为C*2W*2H，与第n-1个生成的第一特征图像对应的第二特征图像，应当与第n-1个生成的第一特征图像具有相同的尺寸，为此对第五特征图像进行卷积处理，获得与第n-1个生成的第一特征图像相对应且尺寸为C*2W*2H的第二特征图像。

在对第五特征图像进行卷积处理时，所使用卷积核的尺寸可以为C*3*3。

在本申请实施例中，在进行特征融合之前，对第三特征图像进行双线性插值处理获得第四特征图像，使第四特征图像与第n-1个生成的第一特征图像具有相同的尺寸，以使特征融合能够顺利进行。在特征融合之后，对第五特征图像进行卷积处理获得与第n-1个生成的第一特征图像相对应的第二特征图像，使得与第n-1个生成的第一特征图像相对应的第二特征图像，与第n-1个生成的第一特征图像具有相同的尺寸，保证输入的特征图像与输出的特征图像具有相同的尺寸，便于后续根据第二特征图像确定待检测图像中人像的分布，使得人像检测能够顺利进行。

实施例三

待检测图像中包括多个人像时，受人员与图像采集设备之间距离的影响，待检测图像中人像的大小是不确定的，距离图像采集设备较近的人员在待检测图像中具有较大的人像，距离图像采集设备较远的人员在待检测图像中具有较小的人像，为了能够从待检测图像中识别出具有不同尺寸的人像，可以对第二特征图像进行感受野增强处理，进而根据经感受野增强处理后的第二特征图像，确定待检测图像中人像的分布。

图5是本申请实施例三提供的一种人像检测方法的示意图，如图5所示，分别对每个第二特征图像进行感受野增强处理，获得相对应的第五特征图像，具体地，对第二特征图像B ₁进行感受野增强处理获得第五特征图像C ₁，对第二特征图像B ₂进行感受野增强处理获得第五特征图像C ₂，对第二特征图像B _n-1进行感受野增强处理获得第五特征图像C _n-1，对第二特征图像B _n进行感受野增强处理获得第五特征图像C _n，对第二特征图像B _N进行感受野增强处理获得第五特征图像C _N。在获得各第二特征图像对应的第五特征图像后，对各第五特征图像进行特征融合，获得一张第六特征图像D，进而根据第六特征图像D确定待检测图像中人像的分布。

在本申请实施例中，由于人员距离图像采集设备的距离不同，导致待检测图像中人像的尺寸不同，通过对第二特征图像进行感受野增强处理获得第五特征图像，可以增大第五特征图像中人像在待检测图像中的参考区域，从而基于第五特征图像确定待检测图像中人像的分布时，能够提高对待检测图像中不同尺寸人像进行检测的能力，进而提高对待检测图像中人像数量和人像分布进行检测的准确性。

在一种可能的实现方式中，在对第二特征图像进行感受野增强处理获得第五特征图像时，可以对第二特征图像进行不同次数的卷积处理，进而将通过不同次数卷积处理获得的多个特征图像进行融合，而获得第五特征图像。

图6是本申请实施例三提供的一种感受野增强处理方法的示意图，如图6所示，针对每个第二特征图像B _i，通过三个并行的卷积处理流程分别对该第二特征图像B _i进行卷积处理，进而通过对三个并行的卷积处理流程获得的特征图像进行特征融合而获得第五特征图像C _i，此处定义第二特征图像B _i的尺寸为C*W*H，C为通道数，W为图像的宽度，H为图像的高度。

在第一个卷积处理流程中，首先通过尺寸为C*3*3的卷积核对第二特征图像B _i进行卷积处理，获得尺寸为C*W*H的特征图像B _i11，然后通过尺寸为C*3*3的卷积核对特征图像B _i11进行卷积处理，获得尺寸为C*W*H的特征图像B _i12，然后通过尺寸为C*3*3的卷积核对特征图像B _i12进行卷积处理，获得尺寸为C*W*H的第七特征图像B _i13。

在第二个卷积处理流程中，首先通过尺寸为C*3*3的卷积核对第二特征图像B _i进行卷积处理，获得尺寸为C*W*H的特征图像B _i21，然后通过尺寸为C*3*3的卷积核对特征图像B _i21进行卷积处理，获得尺寸为C*W*H的第八特征图像B _i22。

在第三个卷积处理流程中，通过尺寸为C*3*3的卷积核对第二特征图像B _i进行卷积处理，获得尺寸为C*W*H的第九特征图像B _i31。

需要说明的是，在上述三个卷积处理流程中，共计6次卷积处理所使用卷积核的尺寸均为C*3*3，6次卷积处理可以使用相同或不同的卷积核，或者其中部分卷积处理使用相同的卷积核，对此本申请实施例不作限定。

在获得第七特征图像B _i13、第八特征图像B _i22和第九特征图像B _i31后，对第七特征图像B _i13、第八特征图像B _i22和第九特征图像B _i31进行特征融合，获得尺寸为3C*W*H的第十特征图像B _i123，然后对采用尺寸为C*1*1的卷积核对第十特征图像进行卷积处理，获得与第二特征图像B _i相对应的第五特征图像C _i，第五特征图像C _i的尺寸与第二特征图像B _i相同，也为C*W*H。

在本申请实施例中，通过对第二特征图像进行不同次数的卷积处理，获得第七特征图像、第八特征图像和第九特征图像，在对第七特征图像、第八特征图像和第九特征图像进行特征融合获得第十特征图像后，再对第十特征图像进行卷积处理，获得与第二特征图像具有相同尺寸的第五特征图像，使得所获得第五特征图像相对于第二特征图像具有更强的感受野，从而能够基于第五特征图像对待检测图像中不同尺寸的人像进行准确检测，从而保证对待检测图像中人像数量和人像分布进行检测的准确性。

在一种可能的实现方式中，在根据第六特征图像确定待检测图像中人像的分布时，可以将第六特征图像输入预先训练的多个分类器，通过各分类器确定待检测图像中人像的中心点坐标及标注人像的矩形框，进而根据人像的中心点坐标及标注人像的矩形框，确定待检测图像中人像的分布。

图7是本申请实施例三提供的一种人像数量和人像分布确定方法700的流程图，如图7所示，该人像数量和人像分布确定方法700包括如下步骤：

步骤701、将经归一化处理后的第六特征图像输入第一分类器，获得第一分类器输出的中心点信息。

在获得第六特征图像之后，首先对第六特征图像进行归一化处理，以便于后续将第六特征图像输入预先训练的分类器，分类器基于归一化处理后的第六特征图像识别待检测图像中的人像。在对第六特征图像进行归一化处理时，具体可以对第六特征图像进行组归一化处理。

预先通过图像样本训练第一分类器，第一分类器用于根据输入的特征图像，确定与该特征图像相对应的原图像中人像头部的中心点坐标。在对第六特征图像进行归一化处理后，将归一化处理后的第六特征图像输入第一分类器，获得第一分类器输出的中心点信息，中心点信息用于指示待检测图像中人像头部的中心点坐标。根据第一分类器输出的中心点坐标，可以在待检测图像上标注出人像头部的中心点。

步骤702、将经归一化处理后的第六特征图像输入第二分类器，获得第二分类器输出的第一图像框信息。

预先通过图像样本训练第二分类器，第二分类器用于根据输入的特征图像，确定用于在该特征图像对应的原图像中标注人像头部的矩形框。在对第六特征图像进行归一化处理后，将归一化处理后的第六特征图像输入第二分类器，获得第二分类器输出的第一图像框信息，第一图像框信息包括在待检测图像中用于标注人像头部的矩形框的坐标值。

在一个例子中，第一图像框信息包括图像框的左上角坐标值和右下角坐标值，该左上角坐标值和右下角坐标值是相对于人像头部中心点的偏离值，由于第一图像框信息定义的图像框用于标注待检测图像中人像的头部，因此，结合第一分类器输出的中心点信息和第一图像框信息，可以在待检测图像上通过矩形框标注出各人像头部。

步骤703、将经归一化处理后的第六特征图像输入第三分类器，获得第三分类器输出的第二图像框信息。

预先通过样本图像训练第三分类器，第三分类器用于根据输入的特征图像，确定用于在该特征图像对应的原图像中标注人体的矩形框。在对第六特征图像进行归一化处理后，将归一化处理后的第六特征图像输入第三分类器，获得第三分类器输出的第二图像框信息，第二图像框信息包括在待检测图像中用于标注人体的矩形框的坐标值。

在一个例子中，第二图像框信息包括图像框放入左上角坐标值和右下角坐标值，由于第二图像框信息定义的图像框用于标注待检测图像中的人体，因此根据第二图像框信息，可以在待检测图像上通过矩形标注出各人体。

需要说明的是，由于遮挡等原因，待检测图像中可能并不包括完整的人体，比如在待检测中仅包括人像头部或者仅包括人像头部和上半身图像，通过图像样本训练出的第三分类器，能够基于人像头部预测出整个人体在待检测图像中所处的位置，进而输出用于标注待检测图像中人体的图像框的坐标值。

步骤704、根据中心点信息、第一图像框信息和第二图像框信息，确定待检测图像中人像的分布。

由于中心点信息用于指示待检测图像中人像头部的中心点坐标，第一图像框信息用于指示待检测图像中标注人像头部的矩形框，第二图像框信息用于指示待检测图像中标注人体的矩形框，因此根据中心点信息和第一图像框信息能够确定待检测图像中人像头部的位置，根据第二图像框信息能够确定待检测图像中人体的位置，进而根据待检测图像中人像头部的数量或人体的数量，可以确定待检测图像中人像的数量，根据待检测图像中人像头部的位置和人体的位置，可以确定待检测图像中人像的分布。

在本申请实施例中，预先训练多个分类器，将归一化处理后的第六特征图像分别输入各分类器，获得各分类器输出的中心点信息、第一图像框信息和第二图像框信息，根据中心点信息和第一图像框信息可以确定待检测图像中人像头部的位置，根据第二图像框信息可以确定待检测图像中人体的位置，进而根据标注人像头部的矩形框的数量或标注人体的矩形框的数量，可以确定待检测图像中人像的数量，根据待检测图像中标注人像头部的矩形框的位置和标注人体的矩形框的位置，可确定待检测图像中人像的分布。基于中心点信息确定待检测图像中人像的数量和人像的分布，采用坐标偏离值确定标注人像头部的矩形框，可以提高第二分类器的运算速度。基于标注人像头部的矩形框和标注人体的矩形框，确定待检测图像中人像的数量和人像的分布，能够避免人像头部特征与人体特征冲突，从而能够更加准确地确定待检测图像中的人像，以更加准确地确定待检测图像中的人像数量和人像分布，进而在将待检测图像中标注人像头部的矩形框和标准人体的矩形框映射到相应场所后，可以准确地确定相应场所内的聚集人员的数量和人员分布情况。

可选地，在图7所示人像数量和人像分布确定方法700的基础上，可以预先通过图像样本训练第四分类器，第四分类器用于根据输入的特征图像，确定用于表征在该特征图像对应的原图像中，标注人像头部的矩形框对人像头部进行标注的准确性信息。在对第六特征图像进行归一化处理后，将经归一化处理后的第六特征图像输入第四分类器，获得第四分类器输出的图像框质量信息，图像框质量信息用于指示在待检测图像中，用于标注人像头部的矩形框对人像头部进行标注的准确性。在获得图像框质量信息后，可以根据图像框质量信息，从中心点信息中确定目标中心点，其中目标中心点对应的用于标注人像头部的矩形框的准确性小于预设的准确性阈值，进而从中心点信息中奖目标中心点的坐标值删除。

在本申请实施例中，预先训练的第四分类器用于检测第二分类器确定出的矩形框是否能够准确标注人像头部，由于第二分类器确定出的每个矩形框与中心点信息中的一个中心点坐标相对应，在确定第二分类器确定出的一个矩形框不能准确标注待检测图像中的人像头部时，将该矩形框对应的中心点坐标从中心点信息中删除，进而舍弃未能准确标注待检测图像中人像头部的矩形框，避免人像的误识别，从而能够进一步提高对待检测图像中人像数量和人像分布进行检测的准确性。

实施例四

图8是本申请实施例四提供的一种人像检测装置800的示意图，如图8所示，该人像检测装置800包括：

获取模块801，用于获取一张待检测图像，其中，待检测图像中包括至少一个人像；

生成模块802，用于生成获取模块801获取到的待检测图像的至少两个第一特征图像，其中，首个第一特征图像是从待检测图像中提取特征后得到的，后一个第一特征图像是从前一个第一特征图像中提取特征后得到的；

融合模块803，用于对生成模块802生成的至少两个第一特征图像进行特征融合，获得至少两个第二特征图像；

检测模块804，用于根据融合模块803获得的至少两个第二特征图像，确定待检测图像中人像的分布。

在本申请实施例中，获取模块801可用于执行上述实施例一中的步骤101，生成模块802可用于执行上述实施例一中的步骤102，融合模块803可用于执行上述实施例一中的步骤103，检测模块804可用于执行上述实施例一中的步骤104。

在一种可能的实现方式中，如图8所示，融合模块803用于根据各第一特征图像的生成顺序，对相邻生成的至少两个第一特征图像进行特征融合，获得至少两个第二特征图像，其中，不同的第二特征图像，由不完全相同的至少两个第一特征图像进行特征融合而得到。

图9是本申请实施例四提供的另一种人像检测装置800的示意图，如图9所示，融合模块803包括：

卷积子模块8031，用于根据各第一特征图像被的生成顺序，对第N个生成的第一特征图像进行卷积处理，获得与第N个生成的第一特征图像相对应的第二特征图像，其中，N为第一特征图像的数量；

第一融合子模块8032，用于将卷积子模块8031获得的与第n个生成的第一特征图像相对应的第二特征图像，与第n-1个生成的第一特征图像进行特征融合，获得与第n-1个生成的第一特征图像相对应的第二特征图像，其中，n为大于1且小于或等于N的整数。

在一种可能的实现方式中，如图9所示，第一融合子模块8032用于执行如下操作：

对与第n个生成的第一特征图像相对应的第二特征图像进行卷积处理，获得第三特征图像，其中，与第n个生成的第一特征图像相对应的第二特征图像和第三特征图像的尺寸均为C*W*H，C为通道数，W为图像的宽度，H为图像的高度；

对第三特征图像进行双线性插值处理，获得第四特征图像，其中，第四特征图像的尺寸为C*2W*2H；

将第四特征图像与第n-1个生成的第一特征图像进行特征融合，获得第五特征图像，其中，第n-1个生成的第一特征图像的尺寸为C*2W*2H，第五特征图像的尺寸为2C*2W*2H；

对第五特征图像进行卷积处理，获得与第n-1个生成的第一特征图像相对应的第二特征图像，其中，与第n-1个生成的第一特征图像相对应的第二特征图像的尺寸为C*2W*2H。

图10是本申请实施例四提供的又一种人像检测装置800的示意图，如图10所示，检测模块804包括：

增强子模块8041，用于分别对每个第二特征图像进行感受野增强处理，获得相对应的第五特征图像；

第二融合子模块8042，用于对增强子模块8041获得的各第五特征图像进行特征融合，获得一张第六特征图像；

检测子模块8043，用于根据第二融合子模块8042获得的第六特征图像，确定待检测图像中人像的分布。

在一种可能的实现方式中，如图10所示，增强子模块8041用于针对每个第二特征图像，均执行如下处理：

对该第二特征图像进行三次卷积处理，获得第六特征图像，其中，该第二特征图像和第六特征图像的尺寸均为C*W*H，C为通道数，W为图像的宽度，H为图像的高度；

对该第二特征图像进行两次卷积处理，获得第七特征图像，其中，第七特征图像的尺寸为C*W*H；

对该第二特征图像进行一次卷积处理，获得第八特征图像，其中，第八特征图像的尺寸为C*W*H；

对第六特征图像、第七特征图像和第八特征图像进行特征融合，获得第九特征图像，其中，第九特征图像的尺寸为3C*W*H；

对第九特征图像进行卷积处理，获得与该第二特征图像相对应的第五特征图像，其中，第五特征图像的尺寸为C*W*H。

在一种可能的实现方式中，如图10所示，检测子模块8043用于执行如下处理：

将经归一化处理后的第六特征图像输入第一分类器，获得第一分类器输出的中心点信息，其中，第一分类器用于根据输入的特征图像，确定与该特征图像对应的原图像中人像头部的中心点坐标，中心点信息用于指示待检测图像中人像头部的中心点坐标；

将经归一化处理后的第六特征图像输入第二分类器，获得第二分类器输出的第一图像框信息，其中，第二分类器用于根据输入的特征图像，确定用于在该特征图像对应的原图像中标注人像头部的矩形框，第一图像框信息包括在待检测图像中用于标注人像头部的矩形框的坐标值；

将经归一化处理的第六特征图像输入第三分类器，获得第三分类器输出的第二图像框信息，其中，第三分类器用于根据输入的特征图像，确定用于在该特征图像对应的原图像中标注人体的矩形框，第二图像框信息包括在待检测图像中用于标注人体的矩形框的坐标值；

根据中心点信息、第一图像框信息和第二图像框信息，确定待检测图像中人像的分布。

图11是本申请实施例四提供的再一种人像检测装置800的示意图，如图11所示，该人像检测装置800还包括：

计算模块805，用于将经归一化处理后的第六特征图像输入第四分类器，获得第四分类器输出的图像框质量信息，其中，第四分类器用于根据输入的特征图像，确定用于表征该特征图像对应的原图像中，标注人像头部的矩形框对人像头部进行标注的准确性的信息，图像框质量信息用于指示待检测图像中，用于标注人像头部的矩形框对人像头部进行标注的准确性；

筛选模块806，用于根据计算模块805获得的图像框质量信息，从中心点信息中确定目标中心点，其中，目标中心点对应的用于标注人像头部的矩形框的准确性小于预设的准确性阈值；

删除模块807，用于从中心点信息中将筛选模块806确定出的目标中心点的坐标值删除。

需要说明的是，上述人像检测装置内的各模块、子模块之间的信息交互、执行过程等内容，由于与前述人像检测方法实施例基于同一构思，具体内容可参见前述人像检测方法实施例中的叙述，此处不再赘述。

实施例五

图12是本申请实施例五提供的一种电子设备的示意图，本申请具体实施例并不对电子设备的具体实现做限定。参见图12，本申请实施例提供的电子设备1200包括：处理器(processor)1202、通信接口(Communications Interface)1204、存储器(memory)1206、以及通信总线1208。其中：

处理器1202、通信接口1204、以及存储器1206通过通信总线1208完成相互间的通信。

通信接口1204，用于与其它电子设备或服务器进行通信。

处理器1202，用于执行程序1210，具体可以执行前述任一人像检测方法实施例中的相关步骤。

具体地，程序1210可以包括程序代码，该程序代码包括计算机操作指令。

处理器1202可能是中央处理器CPU，或者是特定集成电路ASIC(Application Specific Integrated Circuit)，或者是被配置成实施本申请实施例的一个或多个集成电路。智能设备包括的一个或多个处理器，可以是同一类型的处理器，如一个或多个CPU；也可以是不同类型的处理器，如一个或多个CPU以及一个或多个ASIC。

存储器1206，用于存放程序1210。存储器1206可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

程序1210具体可以用于使得处理器1202执行前述任一实施例中的人像检测方法。

程序1210中各步骤的具体实现可以参见前述任一人像检测方法实施例中的相应步骤和单元中对应的描述，在此不赘述。所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的设备和模块的具体工作过程，可以参考前述方法实施例中的对应过程描述，在此不再赘述。

通过本申请实施例的电子设备，获取包括人像的待检测图像后，从待检测图像中提取特征获得多个第一特征图像，然后对各第一特征图像进行融合获得多个第二特征图像，进而根据各第二特征图像确定待检测图像中人像的分布，由于待检测图像可以从相应场所内采集，因此可以将待检测图像中的人像映射到相应的场所内，从而根据待检测图像中人像的分布，确定相应场所内聚集人员的数量和人员的分布情况，实现了聚集人员数量和人员分布情况的自动检测，无需在场所的各出入口配备工作人员进行人数统计，从而能够节省人力，降低对场所内聚集人员数量进行统计的成本。

本申请还提供了一种计算机可读存储介质，存储用于使一机器执行如本文所述的图像检测方法的指令。具体地，可以提供配有存储介质的系统或者装置，在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码，且使该系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。

在这种情况下，从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能，因此程序代码和存储程序代码的存储介质构成了本申请的一部分。

用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地，可以由通信网络从服务器计算机上下载程序代码。

此外，应该清楚的是，不仅可以通过执行计算机所读出的程序代码，而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作，从而实现上述实施例中任意一项实施例的功能。

此外，可以理解的是，将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展模块中设置的存储器中，随后基于程序代码的指令使安装在扩展板或者扩展模块上的CPU等来执行部分和全部实际操作，从而实现上述实施例中任一实施例的功能。

本申请实施例还提供了一种计算机程序产品，所述计算机程序产品被有形地存储在计算机可读介质上并且包括计算机可执行指令，所述计算机可执行指令在被执行时使至少一个处理器执行上述各实施例提供的人像检测方法。应理解，本实施例中的各方案具有上述方法实施例中对应的技术效果，此处不再赘述。

需要说明的是，上述各流程和各系统结构图中不是所有的步骤和模块都是必须的，可以根据实际的需要忽略某些步骤或模块。各步骤的执行顺序不是固定的，可以根据需要进行调整。上述各实施例中描述的系统结构可以是物理结构，也可以是逻辑结构，即，有些模块可能由同一物理实体实现，或者，有些模块可能分由多个物理实体实现，或者，可以由多个独立设备中的某些部件共同实现。

以上各实施例中，硬件模块可以通过机械方式或电气方式实现。例如，一个硬件模块可以包括永久性专用的电路或逻辑(如专门的处理器，FPGA或ASIC)来完成相应操作。硬件模块还可以包括可编程逻辑或电路(如通用处理器或其它可编程处理器)，可以由软件进行临时的设置以完成相应操作。具体的实现方式(机械方式、或专用的永久性电路、或者临时设置的电路)可以基于成本和时间上的考虑来确定。

上文通过附图和优选实施例对本申请进行了详细展示和说明，然而本申请不限于这些已揭示的实施例，基与上述多个实施例本领域技术人员可以知晓，可以组合上述不同实施例中的代码审核手段得到本申请更多的实施例，这些实施例也在本申请的保护范围之内。

Claims

一种人像检测方法(100)，其特征在于，包括：

获取(101)一张待检测图像，其中，所述待检测图像中包括至少一个人像；

生成(102)所述待检测图像的至少两个第一特征图像，其中，首个第一特征图像是从所述待检测图像中提取特征后得到的，后一个第一特征图像是从前一个第一特征图像中提取特征后得到的；

对所述至少两个第一特征图像进行特征融合(103)，获得至少两个第二特征图像；

根据所述至少两个第二特征图像，确定(104)所述待检测图像中人像的分布。
根据权利要求1所述的方法，其特征在于，所述对所述至少两个第一特征图像进行特征融合(103)，获得至少两个第二特征图像，包括：

根据各所述第一特征图像的生成顺序，对相邻生成的至少两个所述第一特征图像进行特征融合，获得至少两个所述第二特征图像，其中，不同的所述第二特征图像，由不完全相同的至少两个所述第一特征图像进行特征融合而得到。
根据权利要求2所述的方法，其特征在于，所述根据各所述第一特征图像的生成顺序，对相邻生成的至少两个所述第一特征图像进行特征融合，获得至少两个所述第二特征图像，包括：

根据各所述第一特征图像被的生成顺序，对第N个生成的第一特征图像进行卷积处理，获得与第N个生成的第一特征图像相对应的第二特征图像，其中，N为第一特征图像的数量；

将与第n个生成的第一特征图像相对应的第二特征图像，与第n-1个生成的第一特征图像进行特征融合，获得与第n-1个生成的第一特征图像相对应的第二特征图像，其中，n为大于1且小于或等于N的整数。
根据权利要求3所述的方法，其特征在于，所述将与第n个生成的第一特征图像相对应的第二特征图像，与第n-1个生成的第一特征图像进行特征融合，获得与第n-1个生成的第一特征图像相对应的第二特征图像，包括：

对与第n个生成的第一特征图像相对应的第二特征图像进行卷积处理(402)，获得第三特征图像，其中，与第n个生成的第一特征图像相对应的第二特征图像和所述第三特征图像的尺寸均为C*W*H，C为通道数，W为图像的宽度，H为图像的高度；

对所述第三特征图像进行双线性插值处理(403)，获得第四特征图像，其中，所述第四特征图像的尺寸为C*2W*2H；

将所述第四特征图像与第n-1个生成的第一特征图像进行特征融合(404)，获得第五特征图像，其中，第n-1个生成的第一特征图像的尺寸为C*2W*2H，所述第五特征图像的尺寸为2C*2W*2H；

对所述第五特征图像进行卷积处理(405)，获得与第n-1个生成的第一特征图像相对应的第二特征图像，其中，与第n-1个生成的第一特征图像相对应的第二特征图像的尺寸为C*2W*2H。
根据权利要求1至4中任一所述的方法，其特征在于，所述根据所述至少两个第二特征图像，确定所述待检测图像中人像的分布，包括：

分别对每个所述第二特征图像进行感受野增强处理，获得相对应的第五特征图像；

对各所述第五特征图像进行特征融合，获得一张第六特征图像；

根据所述第六特征图像，确定所述待检测图像中人像的分布。
根据权利要求5所述的方法，其特征在于，所述分别对每个所述第二特征图像进行感受野增强处理，获得相对应的第五特征图像，包括：

针对每个所述第二特征图像，均执行：

对该第二特征图像进行三次卷积处理，获得第七特征图像，其中，该第二特征图像和所述第七特征图像的尺寸均为C*W*H，C为通道数，W为图像的宽度，H为图像的高度；

对该第二特征图像进行两次卷积处理，获得第八特征图像，其中，所述第八特征图像的尺寸为C*W*H；

对该第二特征图像进行一次卷积处理，获得第九特征图像，其中，所述第九特征图像的尺寸为C*W*H；

对所述第七特征图像、所述第八特征图像和所述第九特征图像进行特征融合，获得第十特征图像，其中，所述第十特征图像的尺寸为3C*W*H；

对所述第十特征图像进行卷积处理，获得与该第二特征图像相对应的所述第五特征图像，其中，所述第五特征图像的尺寸为C*W*H。
根据权利要求5所述的方法，其特征在于，所述根据所述第六特征图像，确定所述待检测图像中人像的分布，包括：

将经归一化处理后的所述第六特征图像输入(701)第一分类器，获得所述第一分类器输出的中心点信息，其中，所述第一分类器用于根据输入的特征图像，确定与该特征图像对应的原图像中人像头部的中心点坐标，所述中心点信息用于指示所述待检测图像中人像头部的中心点坐标；

将经归一化处理后的所述第六特征图像输入(702)第二分类器，获得所述第二分类器输出的第一图像框信息，其中，所述第二分类器用于根据输入的特征图像，确定用于在该特征图像对应的原图像中标注人像头部的矩形框，所述第一图像框信息包括在所述待检测图像中用于标注人像头部的矩形框的坐标值；

将经归一化处理的所述第六特征图像输入(703)第三分类器，获得所述第三分类器输出的第二图像框信息，其中，所述第三分类器用于根据输入的特征图像，确定用于在该特征图像对应的原图像中标注人体的矩形框，所述第二图像框信息包括在所述待检测图像中用于标注人体的矩形框的坐标值；

根据所述中心点信息、所述第一图像框信息和所述第二图像框信息，确定(704)所述待检测图像中人像的分布。
根据权利要求7所述的方法，其特征在于，所述方法还包括：

将经归一化处理后的所述第六特征图像输入第四分类器，获得所述第四分类器输出的图像框质量信息，其中，所述第四分类器用于根据输入的特征图像，确定用于表征该特征图像对应的原图像中，标注人像头部的矩形框对人像头部进行标注的准确性的信息，所述图像框质量信息用于指示所述待检测图像中，用于标注人像头部的矩形框对人像头部进行标注的准确性；

根据所述图像框质量信息，从所述中心点信息中确定目标中心点，其中，所述目标中心点对应的用于标注人像头部的矩形框的准确性小于预设的准确性阈值；

从所述中心点信息中将所述目标中心点的坐标值删除。
一种人像检测装置(800)，其特征在于，包括用于执行如权利要求1-8中任一项所述方法中各操作的模块。
一种电子设备(1200)，其特征在于，包括：处理器(1202)、通信接口(1204)、存储器(1206)和通信总线(1208)，所述处理器(1202)、所述存储器(1206)和所述通信接口(1204)通过所述通信总线(1208)完成相互间的通信；

所述存储器(1206)用于存放至少一可执行指令，所述可执行指令使所述处理器(1202)执行如权利要求1-8中任一项所述的人像检测方法对应的操作。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机指令，所述计算机指令在被处理器执行时，使所述处理器执行权利要求1-8中任一项所述的方法。
一种计算机程序产品，其特征在于，所述计算机程序产品被有形地存储在计算机可读介质上并且包括计算机可执行指令，所述计算机可执行指令在被执行时使至少一个处理器执行根据权利要求1-8中任一项所述的方法。