CN111860100B

CN111860100B - 行人数量的确定方法、装置、电子设备及可读存储介质

Info

Publication number: CN111860100B
Application number: CN202010320802.6A
Authority: CN
Inventors: 冯辉; 苟巍; 沈海峰
Original assignee: Beijing Didi Infinity Technology and Development Co Ltd
Current assignee: Beijing Didi Infinity Technology and Development Co Ltd
Priority date: 2020-04-22
Filing date: 2020-04-22
Publication date: 2024-06-07
Anticipated expiration: 2040-04-22
Also published as: CN111860100A

Abstract

本申请涉及图像处理技术领域，尤其涉及一种行人数量的确定方法、装置、电子设备及可读存储介质。本申请通过从待识别图像中初步确定出存在行人的至少一个待识别区域，并只针对待识别图像中的待识别区域进行行人的识别，可以减少识别范围，进而提高识别效率，进一步地，针对于待识别图像中的每一个待识别区域，同时检测每一个待识别区域中的行人头部以及行人骨骼结构，从而结合检测出的行人头部的数量以及行人骨骼结构的数量，可以更加准确地确定出待识别区域中的行人的第一数量，进而根据待识别图像中各个待识别区域中行人的第一数量，确定出待识别图像中行人的第二数量，可以提高行人数量统计结果的准确性。

Description

行人数量的确定方法、装置、电子设备及可读存储介质

技术领域

本申请涉及图像处理技术领域，尤其涉及一种行人数量的确定方法、装置、电子设备及可读存储介质。

背景技术

行人检测技术(Pedestrian Detection)是利用计算机视觉技术判断图像或者视频序列中是否存在行人并给予精确定位。该技术可与行人跟踪，行人重识别等技术结合，应用于人工智能系统、车辆辅助驾驶系统、智能机器人、智能视频监控、人体行为分析、智能交通等领域。

行人数量统计方法是在从图像中检测出行人后，再对行人的数量进行统计的方法。然而，在实际场景中，行人与行人之间可能存在着相邻、遮挡等情况，在这些情况下，很容易将多个行人检测成一个行人，导致检测出的结果不够准确。

发明内容

有鉴于此，本申请实施例至少提供一种行人数量的确定方法、装置、电子设备及可读存储介质，可以提高行人数量统计结果的准确性。

本申请主要包括以下几个方面：

第一方面，本申请实施例提供一种行人数量的确定方法，所述确定方法包括：

获取待识别图像，并从所述待识别图像中确定出至少一个待识别区域；

针对于每一个所述待识别区域，识别所述待识别区域中的行人头部以及行人骨骼结构；

基于每一个所述待识别区域中所述行人头部的数量以及所述行人骨骼结构的数量，确定出所述待识别区域中行人的第一数量；

根据所述至少一个待识别区域中行人的第一数量，确定所述待识别图像中行人的第二数量。

在一种可能的实施方式中，在所述获取待识别图像，并从所述待识别图像中确定出至少一个待识别区域之后，所述确定方法还包括：

确定所述至少一个待识别区域中是否存在误检区域；

若存在，则将所述误检区域从所述至少一个待识别区域中删除。

在一种可能的实施方式中，根据以下步骤确定所述至少一个待识别区域中是否存在误检区域：

针对于每一个所述待识别区域，将所述待识别区域对应的图像输入至预先训练好的行人检测模型中，确定所述待识别区域是否为误检区域；

若任意一个所述待识别区域为误检区域，则确定所述至少一个待识别区域中存在误检区域。

在一种可能的实施方式中，根据以下步骤识别所述待识别区域中的行人头部：

从所述待识别区域中识别出头部特征；

基于所述头部特征，确定所述待识别区域中的行人头部。

在一种可能的实施方式中，根据以下步骤识别所述待识别区域中的行人骨骼结构：

从所述待识别区域中识别出人体骨骼关键点；

基于所述人体骨骼关键点，确定出行人的人体骨骼结构。

在一种可能的实施方式中，所述基于所述人体骨骼关键点，确定出行人的人体骨骼结构，包括：

对所述人体骨骼关键点进行聚类，将属于同一行人的所述人体骨骼关键点确定为同类别骨骼关键点；

根据各个所述同类别骨骼关键点，以及各个所述同类别骨骼关键点之间的连线，确定出行人的人体骨骼结构。

在一种可能的实施方式中，所述基于每一个所述待识别区域中所述行人头部的数量以及所述行人骨骼结构的数量，确定出所述待识别区域中行人的第一数量，包括：

当所述行人头部的数量大于所述行人骨骼结构的数量时，将所述行人头部的数量确定为所述待识别区域中行人的第一数量；

当所述行人头部的数量小于或等于所述行人骨骼结构的数量时，将所述行人骨骼结构的数量确定为所述待识别区域中行人的第一数量。

在一种可能的实施方式中，通过以下步骤训练所述行人检测模型：

将包括行人的多个样本图像作为正训练样本，以及未包括行人的多个样本图像作为负训练样本，并获取每个正训练样本对应的第一类别标签和每个负训练样本对应的第二类别标签；

基于多个正训练样本、多个负训练样本、以及每个正训练样本对应的第一类别标签和每个负训练样本对应的第二类别标签对初始的行人检测模型进行训练，得到训练好的行人检测模型。

在一种可能的实施方式中，所述获取待识别图像，并从所述待识别图像中确定出至少一个待识别区域，包括：

获取所述待识别图像，并将所述待识别图像转换为预设尺寸的标准图像；

根据所述标准图像，确定出所述至少一个待识别区域。

第二方面，本申请实施例还提供一种行人数量的确定装置，所述确定装置包括：

区域确定模块，用于获取待识别图像，并从所述待识别图像中确定出至少一个待识别区域；

识别模块，用于针对于每一个所述待识别区域，识别所述待识别区域中的行人头部以及行人骨骼结构；

第一数量确定模块，用于基于每一个所述待识别区域中所述行人头部的数量以及所述行人骨骼结构的数量，确定出所述待识别区域中行人的第一数量；

第二数量确定模块，用于根据所述至少一个待识别区域中行人的第一数量，确定所述待识别图像中行人的第二数量。

在一种可能的实施方式中，所述确定装置还包括区域校验模块，所述区域校验模块用于：

确定所述至少一个待识别区域中是否存在误检区域；

在一种可能的实施方式中，所述区域校验模块根据以下步骤确定所述至少一个待识别区域中是否存在误检区域：

在一种可能的实施方式中，所述识别模块根据以下步骤识别所述待识别区域中的行人头部：

从所述待识别区域中识别出头部特征；

基于所述头部特征，确定所述待识别区域中的行人头部。

在一种可能的实施方式中，所述识别模块根据以下步骤识别所述待识别区域中的行人骨骼结构：

从所述待识别区域中识别出人体骨骼关键点；

基于所述人体骨骼关键点，确定出行人的人体骨骼结构。

在一种可能的实施方式中，所述识别模块在用于基于所述人体骨骼关键点，确定出行人的人体骨骼结构时，所述识别模块用于：

在一种可能的实施方式中，所述第一数量确定模块在用于基于每一个所述待识别区域中所述行人头部的数量以及所述行人骨骼结构的数量，确定出所述待识别区域中行人的第一数量时，所述第一数量确定模块用于：

在一种可能的实施方式中，所述确定装置还包括模型训练模块，所述模型训练模块用于：

在一种可能的实施方式中，所述区域确定模块在用于获取待识别图像，并从所述待识别图像中确定出至少一个待识别区域时，所述区域确定模块用于：

根据所述标准图像，确定出所述至少一个待识别区域。

第三方面，本申请实施例还提供一种电子设备，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过所述总线进行通信，所述机器可读指令被所述处理器运行时执行上述第一方面或第一方面中任一种可能的实施方式中所述的行人数量的确定方法的步骤。

第四方面，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行上述第一方面或第一方面中任一种可能的实施方式中所述的行人数量的确定的步骤。

在本申请实施例中，通过从待识别图像中初步确定出存在行人的至少一个待识别区域，并只针对待识别图像中的待识别区域进行行人的识别，可以减少识别范围，进而提高识别效率，进一步地，针对于待识别图像中的每一个待识别区域，同时检测每一个待识别区域中的行人头部以及行人骨骼结构，从而结合检测出的行人头部的数量以及行人骨骼结构的数量，可以更加准确地确定出待识别区域中的行人的第一数量，进而根据待识别图像中各个待识别区域中行人的第一数量，确定出待识别图像中行人的第二数量，可以提高行人数量统计结果的准确性。

为使本申请的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请实施例所提供的一种行人数量的确定方法的流程图；

图2为本申请另一实施例所提供的一种行人数量的确定方法的流程图；

图3为本申请实施例所提供的一种行人数量的确定装置的功能模块图之一；

图4为本申请实施例所提供的一种行人数量的确定装置的功能模块图之二；

图5为本申请实施例所提供的一种行人数量的确定装置的功能模块图之三；

图6为本申请实施例所提供的一种电子设备的结构示意图。

主要元件符号说明：

图中：300-行人数量的确定装置；310-区域确定模块；320-识别模块；330-第一数量确定模块；340-第二数量确定模块；350-区域校验模块；360-模型训练模块；600-电子设备；610-处理器；620-存储器；630-总线。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，应当理解，本申请中的附图仅起到说明和描述的目的，并不用于限定本申请的保护范围。另外，应当理解，示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应当理解，流程图的操作可以不按顺序实现，没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外，本领域技术人员在本申请内容的指引下，可以向流程图添加一个或多个其他操作，也可以从流程图中移除一个或多个操作。

另外，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的全部其他实施例，都属于本申请保护的范围。

为了使得本领域技术人员能够使用本申请内容，结合特定应用场景“确定行人数量”，给出以下实施方式，对于本领域技术人员来说，在不脱离本申请的精神和范围的情况下，可以将这里定义的一般原理应用于其他实施例和应用场景。

本申请实施例下述方法、装置、电子设备或计算机可读存储介质可以应用于任何需要确定行人数量的场景，本申请实施例并不对具体的应用场景作限制，任何使用本申请实施例提供的行人数量的确定方法及装置的方案均在本申请保护范围内。

值得注意的是，在本申请提出之前，现有方案中在行人之间可能存在着相邻、遮挡等情况下，很容易将多个行人检测成一个行人，标记输出一个行人位置检测框，显然，在这些情况下会使得检测的结果不够准确，进而产生错误的统计结果。

针对上述问题，在本申请实施例中，通过从待识别图像中初步确定出存在行人的至少一个待识别区域，并只针对待识别图像中的待识别区域进行行人的识别，可以减少识别范围，进而提高识别效率，进一步地，针对于待识别图像中的每一个待识别区域，同时检测每一个待识别区域中的行人头部以及行人骨骼结构，从而结合检测出的行人头部的数量以及行人骨骼结构的数量，可以更加准确地确定出待识别区域中的行人的第一数量，进而根据待识别图像中各个待识别区域中行人的第一数量，确定出待识别图像中行人的第二数量，可以提高行人数量统计结果的准确性。

为便于对本申请进行理解，下面结合具体实施例对本申请提供的技术方案进行详细说明。

图1为本申请实施例所提供的一种行人数量的确定方法的流程图。如图1所示，本申请实施例提供的行人数量的确定方法，包括以下步骤：

S101：获取待识别图像，并从所述待识别图像中确定出至少一个待识别区域。

在具体实施中，首先，获取需要进行行人数量统计的待识别图像，从待识别图像中确定出可能存在行人的至少一个待识别区域，用于后续进行行人数量的确定。

这样，本申请能够通过从待识别图像中确定出待识别区域，在后续的行人数量确定的过程中，仅针对于确定出的待识别区域进行行人的识别与统计，无需对没有行人的背景区域进行不必要的检测，大大减少了识别过程中的计算量以及数据的处理量，可以提高识别过程中的计算速度，以及工作效率。

进一步的，步骤S101中所述获取待识别图像，并从所述待识别图像中确定出至少一个待识别区域，包括以下步骤：

步骤a1：获取所述待识别图像，并将所述待识别图像转换为预设尺寸的标准图像。

在具体实施中，在上述步骤S101确定出的至少一个待识别区域中，可能会存在没有行人的误检区域，因此，为了便于行人检测模型能够更快地确定出至少一个待识别区域对应的图像中是否存在误检区域，避免行人检测模型因为图像尺寸的问题出现不能识别或识别错误的问题，影响检测结果的准确性，进而，对待识别图像进行标准尺寸处理，可以提升模型对待识别图像的检测速度。

步骤a2：根据所述标准图像，确定出所述至少一个待识别区域。

在具体实施中，基于得到的标准图像，从标准图像中确定出至少一个待识别区域。

这里，行人检测模型在训练的过程中，也会将用于训练模型的正训练样本以及负训练样本进行尺寸统一化处理，从而基于尺寸统一化处理后的正训练样本以及负训练样本训练行人检测模型，那么在使用训练好的行人检测模型时，预设的尺寸即为正训练样本以及负训练样本的尺寸。其中，在对人体检测模型进行训练时，通过对训练的图像的尺寸进行统一化处理，并利用处理后的图像对人体检测模型进行训练，可以提升人体检测模型的训练效率。

这样，本申请能够将图像的尺寸进行统一化处理，避免因为图像尺寸的问题，在图像检测的过程中出现不能识别图像或者识别错误的问题，进一步地提高了行人检测模型的鲁棒性以及兼容性，还可以提高识别效率以及准确性。

S102：针对于每一个所述待识别区域，识别所述待识别区域中的行人头部以及行人骨骼结构。

在具体实施中，针对于每一个待识别区域，同时识别该待识别区域中的行人头部以及行人骨骼结构，从而在后续的行人数量的确定过程中，能够综合考虑待识别区域中行人头部以及行人骨骼结构，而不是仅单一的考虑一个方面，进而能够提高行人数量确定结果的准确性。

需要说明的是，由于在一些特殊的情况下，例如，三个人并排行走时，位置距离采集图像的摄像机较远的行人可能会被位置距离于摄像机较近的行人遮挡住，使得待识别区域中存在行人被遮挡的情况，将多个行人错误识别成一个行人，从而影响最后的数量统计结果。但是在大多数情况下行人与行人之间不会存在完全遮挡的情况，即行人与行人之间头部会存在一定的距离间隙，或者是一个行人的头部被另一个行人完全遮挡，而该行人的腿部或者胳膊会被摄像机采集到，因此，为了避免在上述特殊情况下统计结果不准确的问题，本申请在确定出至少一个待识别区域的基础上，针对于每一个待识别区域，还能够进一步的同时对待识别区域中的行人头部以及行人骨骼结构进行识别，获得该待识别区域中行人头部以及行人骨骼结构。

对于行人检测技术来说，若仅仅是在确定出待识别图像中行人位置的检测框的基础上，统计该待识别图像中行人的数量，在行人之间存在遮挡时会出现行人漏记的情况，因此，为了减少漏记情况的发生，综合考虑行人头部与行人骨骼结构，能够在行人彼此之间存在遮挡的情况下，仍然能够准确地识别出待识别区域中行人的数量，提高行人数量确定的准确性。

进一步的，所述确定方法根据以下步骤识别所述待识别区域中的行人头部：从所述待识别区域中识别出头部特征；基于所述头部特征，确定所述待识别区域中的行人头部。

在具体实施中，从待识别区域中识别行人的头部特征，例如，皮肤特征、头发特征、面部五官以及肤色特征等，进而根据上述的头部特征，确定并划分出待识别区域中的行人头部。

其中，可以通过可以使用YOLOv3、轻量级人脸检测器(ALight and Fast FaceDetector for Edge Devices，LFFD)等深度学习的检测方法，对待识别区域中的行人头部进行检测，确定出待识别区域中的行人头部。

其中，YOLO3采用了称之为Darknet-53的网络结构(含有53个卷积层)，它借鉴了残差网络residual network的做法，在一些层之间设置了快捷链路(shortcutconnections)。YOLO3主要的改进有：调整了网络结构；利用行人头部的多尺度特征进行行人头部检测；对象分类用Logistic取代了softmax。YOLOv3主要是借鉴一些较优的方案融合到YOLO里面，能够产生较好的检测效果，在保持速度优势的前提下，提升了预测精度，尤其是加强了对行人头部这种小目标物体的识别能力。

LFFD是通用的一类目标检测器，可以进行头部检测。LFFD还有如下优势：(1)通过添加更多CNN层，可以覆盖更大尺度的目标(比如典型的自拍场景人脸)，而增加的延迟有限；(2)检测行人头部这种小目标物体的能力突出，能够在极高分辨率(比如8K或更大)画面，可以检测其间10个像素大小的目标，在及时采集到的待识别图像的分辨率过高，而画面中行人头部区域又很小的情况下，仍然能够识别出画面中的行人头部；(3)使用的网络操作是常见的，可以轻松部署到任何设备上，进行行人头部的检测。

进一步的，所述确定方法根据以下步骤识别所述待识别区域中的行人骨骼结构：从所述待识别区域中识别出人体骨骼关键点；基于所述人体骨骼关键点，确定出行人的人体骨骼结构。

在具体实施中，可以从待识别区域中识别出所有的人体骨骼关键点，根据每个人体骨骼关键点所处位置等特征，确定出每一个人体骨骼关键点所属的行人，从而基于该行人对应的人体骨骼关键点，确定出行人的人体骨骼结构。

所述人体骨骼关键点可以为：脚踝关节节点，膝盖关节节点、手腕关节节点、胳膊关节节点、颈部节点以及头部节点等。

进一步的，所述基于所述人体骨骼关键点，确定出行人的人体骨骼结构，包括：对所述人体骨骼关键点进行聚类，将属于同一行人的所述人体骨骼关键点确定为同类别骨骼关键点；根据各个所述同类别骨骼关键点，以及各个所述同类别骨骼关键点之间的连线，确定出行人的人体骨骼结构。

在具体实施中，对识别出的待识别区域中的所有人体骨骼关键点进行聚类，即将属于同一个行人的人体骨骼关键点确定为同类别骨骼关键点，对于这个行人来说，可以将该行人对应的同类别骨骼关键点之间通过连线连接起来，从而基于这些同类别骨骼关键点以及同类别骨骼关键点之间的连线，构成该行人对应的人体骨骼结构。

具体的，在识别出待识别区域中所有的人体骨骼关键点之后，根据每个人体骨骼关键点所处的位置等特征，对所有的人体骨骼关键点进行聚类处理，即将具有相同骨骼特征的人体骨骼关键点，确定为属于同一行人的同类别骨骼关键点，而后可以根据同类别骨骼关键点的位置特征，确定出各个同类别骨骼关键点对应的行人身体部位，从而根据行人身体部位应有的连接方式，确定出各个同类别骨骼关键点之间的连线，最终，得到行人的人体骨骼结构。

示例性的，确定出的同类别骨骼关键点有头部节点、颈部节点、手腕关节节点、以及胳膊关节节点，那么对应的连线应该，头部节点与颈部节点之间的连线，颈部节点与胳膊关节节点之间的连线，以及手腕关节节点与胳膊关节节点之间的连线等。

在实际的连接过程中，不同的连线之间可以选择不同的颜色进行表示，对应于上述实施例，头部节点与颈部节点之间的连线可以为红色，颈部节点与胳膊关节节点之间的连线可以为绿色，以及手腕关节节点与胳膊关节节点之间的连线可以为蓝色等，在使用过程中可以根据实际情况进行调整，在此不做限制。

其中，可以通过openpose、pifpaf等深度学习人体骨骼关键点检测的方法来，对待识别区域中的行人骨骼结构进行检测，确定出待识别区域中的行人骨骼结构。

openpose是基于卷积神经网络和监督学习并以caffe为框架的开源库，可以实现对行人的面部表情、躯干和四肢甚至手指的跟踪，从图像中识别出行人的人体关键点，以及连接各个人体关键点的连线，构造出人体骨骼结构，不仅适用于单人也适用于多人，同时具有较好的鲁棒性。

PIFPAF在G-RMI、PersonLab的基础上，引入了PAF和PIF复合结构，实际上是具备显式含义的向量场，即在图像每个location的像素位置，寄托更多的复合含义，编码具有直观含义的向量PIF针对同类别的关键点即同类别骨骼关键点，PAF针对每一种关联肢体，即同类别骨骼关键点之间的连线。

S103、基于每一个所述待识别区域中所述行人头部的数量以及所述行人骨骼结构的数量，确定出所述待识别区域中行人的第一数量。

在具体实施中，统计每一个待识别区域中识别出的行人头部的数量，以及该待识别区域中识别出的行人骨骼结构的数量，并对该待识别区域的行人头部的数量以及行人骨骼数量进行交叉判定，即，判定行人头部的数量与行人骨骼数量是否相等，基于交叉判定的结果确定该待识别区域中行人的第一数量，即确定出该待识别区域中的行人数量。

这样，由于本申请既能够检测行人的行人头部又能够检测行人的行人骨骼结构，因此，就算是在待识别区域中存在遮挡的情况(例如，行人与行人之间有头部遮挡，在此种情况下仅根据待识别区域中的行人头部确定待识别区域中的行人数量会获得错误的识别结果；或者是存在肢体间遮挡，在此种情况下仅根据待识别区域中的行人骨骼确定待识别区域中的行人数量会获得错误的识别结果等情况时)，本申请中通过对待识别区域中的行人头部以及行人骨骼结构进行双重检测，综合考虑了行人头部的数量以及行人骨骼结构的数量，在待识别区域中行人之间存在遮挡的情况下，可以基本避免检测错误的发生，能够正确地统计出该待识别区域中行人的第一数量，保证了确定出的待识别区域中行人数量的准确性。

进一步的，步骤S103包括：当所述行人头部的数量大于所述行人骨骼结构的数量时，将所述行人头部的数量确定为所述待识别区域中行人的第一数量；当所述行人头部的数量小于或等于所述行人骨骼结构的数量时，将所述行人骨骼结构的数量确定为所述待识别区域中行人的第一数量。

在具体实施中，在确定出行人头部的数量以及行人骨骼结构的数量之后，将根据行人头部的数量以及行人骨骼结构的数量进一步地确定出待识别区域中的第一数量，即确定出待识别区域中的行人的数量，具体的，将行人头部的数量与行人骨骼结构的数量进行比较，当行人头部的数量大于行人骨骼结构的数量时，将行人头部的数量确定为待识别区域中行人的第一数量，当行人头部的数量大于行人骨骼结构的数量时，说明在待识别区域中，有行人的肢体被另一行人遮挡，因此，将行人头部的数量确定为待识别区域中行人的第一数量是正确的；当行人头部的数量小于或等于行人骨骼结构的数量时，将行人骨骼结构的数量确定为待识别区域中行人的第一数量，当行人头部的数量小于或等于行人骨骼结构的数量时，说明在待识别区域中，有行人的头部被另一行人遮挡，因此，将行人骨骼结构的数量确定为待识别区域中行人的第一数量是正确的。

在本申请实施例中，在行人头部的数量等于行人骨骼结构的数量时，将行人骨骼结构的数量确定为待识别区域中行人的第一数量，在其他实施例中，还可以是在行人头部的数量等于行人骨骼结构的数量时，将行人头部的数量确定为待识别区域中行人的第一数量。

S104、根据所述至少一个待识别区域中行人的第一数量，确定所述待识别图像中行人的第二数量。

在具体实施中，由于待识别图像中包括有至少一个待识别区域，因此，若想确定待识别图像中行人的第二数量，即待识别图像中行人的总数量，需要加和各个待识别区域的行人的第一数量，计算出该待识别图像的第二行人数量。

示例性的，在一个待识别图像中存在两个待识别区域，经过识别确定出在第一个待识别区域中存在2个行人，在第二个待识别区域中存在1个行人，则在待识别图像中一共存在3个行人。

图2为本申请另一实施例所提供的一种行人数量的确定方法的流程图。如图2所示，本申请实施例提供的行人数量的确定方法，包括以下步骤：

S201、获取待识别图像，并从所述待识别图像中确定出至少一个待识别区域。

S202、确定所述至少一个待识别区域中是否存在误检区域。

在具体实施中，通常在识别出的至少一个待识别区域中会存在误检区域，误检区域即为将未存在行人的区域错误的识别为存在行人的区域，从而将待识别图像中未存在行人的区域识别为存在行人的待识别区域。因此，在本申请中为了减少后续识别过程中的计算量，会对至少一个待识别区域进行二次检测，确定至少一个待识别区域中是否存在误检区域。

其中，误检区域是指不包括行人的待识别区域，这种不包括行人的待识别区域在后续的行人识别过程中是不被需要的，不会影响到行人数量的统计结果，若对误检区域进行识别将会增加行人识别过程的工作量，降低识别的效率。

S203、若存在，则将所述误检区域从所述至少一个待识别区域中删除。

在具体实施中，若检测出在至少一个待识别区域中存在误检区域，则将误检区域从至少一个待识别区域中删除，从而在后续的识别过程中不需要再对误检区域进行识别，精简了识别的过程，减少了识别过程的计算量以及工作量。

进一步的，根据以下步骤确定所述至少一个待识别区域中是否存在误检区域：

针对于每一个所述待识别区域，将所述待识别区域对应的图像输入至预先训练好的行人检测模型中，确定所述待识别区域是否为误检区域；若任意一个所述待识别区域为误检区域，则确定所述至少一个待识别区域中存在误检区域。

在具体实施中，针对于每一个待识别区域，将该待识别区域对应的图像输入至预先训练好的行人检测模型中，通过行人检测模型确定该待识别区域是否为误检区域；若任意一个待识别区域为误检区域，则可以确定至少一个待识别区域中存在误检区域。

具体的，待识别区域对应的图像为待识别区域在待识别图像中对应的图像部分，行人检测模型可以为一个二分类模型，能够将待识别区域分为两种，一种为是，即代表待识别区域为误检区域，另一种为否，即代表待识别区域不是误检区域，从而确定出待识别区域是否为误检区域；若确定出在至少一个待识别区域中任意一个待识别区域为误检区域，则确定至少一个待识别区域中存在区间区域。

进一步的，所述确定方法通过以下步骤训练所述行人检测模型：

步骤b1：将包括行人的多个样本图像作为正训练样本，以及未包括行人的多个样本图像作为负训练样本，并获取每个正训练样本对应的第一类别标签和每个负训练样本对应的第二类别标签。

在具体实施中，首先，获取包括行人的多个样本图像以及未包括行人的多个样本图像，将包括行人的多个样本图像作为正训练样本，即将图像中有行人的图像作为正训练样本，将未包括行人的多个样本图像作为负训练样本，即将图像中没有行人的图像作为负训练样本，同时获取每个正训练样本对应的第一类别标签，该第一类别标签可以表明该正训练样本中包括行人，即第一类别标签可以用“1”表示，获取每个负训练样本对应的第二类别标签，同理，该第二类别标签可以表明该负训练样本中未包括行人，即第二类别标签可以用“0”表示。

步骤b2：基于多个正训练样本、多个负训练样本、以及每个正训练样本对应的第一类别标签和每个负训练样本对应的第二类别标签对初始的行人检测模型进行训练，得到训练好的行人检测模型。

在具体实施中，基于获取到的多个正训练样本、多个负训练样本，以及每个正训练样本对应的第一类别标签和每个负训练样本对应的第二类别标签对初始的行人检测模型进行训练，得到训练好的行人检测模型。

其中，行人检测模型可以为CNN分类网络等深度学习分类模型。

同样的，在行人检测模型的训练过程中，同样会统一正训练样本以及负训练样本的尺寸规格，提高行人检测模型的鲁棒性以及兼容性。

S204、针对于每一个所述待识别区域，识别所述待识别区域中的行人头部以及行人骨骼结构；

S205、基于每一个所述待识别区域中所述行人头部的数量以及所述行人骨骼结构的数量，确定出所述待识别区域中行人的第一数量；

S206、根据所述至少一个待识别区域中行人的第一数量，确定所述待识别图像中行人的第二数量。

其中，步骤S201、S204-S206的描述可以参加步骤S101-S104的描述，并且能够达到相同的技术效果，对此，不再进行阐述。

在本申请实施例中，通过从待识别图像中确定出至少一个待识别区域，减少后续识别行人过程中的识别范围，提高识别效率，并且为了尽可能的避免在至少一个待识别区域中存在误检区域，即误将未存在行人的区域，错误的识别为存在行人的待识别区域，还会对至少一个待识别区域进行二次检测，确定在至少一个待识别区域中是否存在误检区域，若存在将误检区域从至少一个待识别区域中删除，而后再针对于每一个待识别区域，同时检测每一个待识别区域中的行人头部以及行人骨骼结构，从而结合检测出的行人头部的数量以及行人骨骼结构的数量，可以更加准确地确定出待识别区域中的行人的第一数量，进而基于待识别图像中各个待识别区域中行人的第一数量，确定出待识别图像中行人的第二数量，可以提高行人数量统计结果的准确性。

基于同一申请构思，本申请实施例中还提供了与上述实施例提供的行人数量的确定方法对应的行人数量的确定装置，由于本申请实施例中的装置解决问题的原理与本申请上述实施例的行人数量的确定方法相似，因此装置的实施可以参见方法的实施，重复之处不再赘述。

如图3至图5所示，图3为本申请实施例提供的一种行人数量的确定装置300的功能模块图之一，图4为本申请实施例提供的一种行人数量的确定装置300的功能模块图之二，图5为本申请实施例提供的一种行人数量的确定装置300的功能模块图之三。

如图3所示，所述行人数量的确定装置300包括：

区域确定模块310，用于获取待识别图像，并从所述待识别图像中确定出至少一个待识别区域；

识别模块320，用于针对于每一个所述待识别区域，识别所述待识别区域中的行人头部以及行人骨骼结构；

第一数量确定模块330，用于基于每一个所述待识别区域中所述行人头部的数量以及所述行人骨骼结构的数量，确定出所述待识别区域中行人的第一数量；

第二数量确定模块340，用于根据所述至少一个待识别区域中行人的第一数量，确定所述待识别图像中行人的第二数量。

在一种可能的实施方式中，如图4示，所述行人数量的确定装置300还包括区域校验模块350，所述区域校验模块350用于：

确定所述至少一个待识别区域中是否存在误检区域；

在一种可能的实施方式中，所述区域校验模块350根据以下步骤确定所述至少一个待识别区域中是否存在误检区域：

在一种可能的实施方式中，所述识别模块320根据以下步骤识别所述待识别区域中的行人头部：

从所述待识别区域中识别出头部特征；

基于所述头部特征，确定所述待识别区域中的行人头部。

在一种可能的实施方式中，所述识别模块320根据以下步骤识别所述待识别区域中的行人骨骼结构：

从所述待识别区域中识别出人体骨骼关键点；

基于所述人体骨骼关键点，确定出行人的人体骨骼结构。

在一种可能的实施方式中，所述识别模块320在用于基于所述人体骨骼关键点，确定出行人的人体骨骼结构时，所述识别模块320用于：

在一种可能的实施方式中，所述第一数量确定模块330在用于基于每一个所述待识别区域中所述行人头部的数量以及所述行人骨骼结构的数量，确定出所述待识别区域中行人的第一数量时，所述第一数量确定模块330用于：

在一种可能的实施方式中，如图5所示，所述行人数量的确定装置300还包括模型训练模块360，所述模型训练模块360用于：

在一种可能的实施方式中，所述区域确定模块310在用于获取待识别图像，并从所述待识别图像中确定出至少一个待识别区域时，所述区域确定模块310用于：

根据所述标准图像，确定出所述至少一个待识别区域。

基于同一申请构思，参见图6所示，为本申请实施例提供的一种电子设备600的结构示意图，包括：处理器610、存储器620和总线630，所述存储器620存储有所述处理器610可执行的机器可读指令，当电子设备600运行时，所述处理器610与所述存储器620之间通过所述总线630进行通信，所述机器可读指令被所述处理器610运行时执行如上述实施例中任一所述的行人数量的确定方法的步骤。

具体地，所述机器可读指令被所述处理器610执行时可以执行如下处理：

基于同一申请构思，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行上述实施例提供的行人数量的确定方法的步骤。

具体地，所述存储介质能够为通用的存储介质，如移动磁盘、硬盘等，所述存储介质上的计算机程序被运行时，能够执行上述确定方法，通过识别出待识别图像中的至少一个待识别区域，检测每一个待识别区域中的行人头部以及行人骨骼结构，并基于确定出的行人头部的数量以及行人骨骼结构的数量，确定每一个待识别区域中行人的第一数量，最后，根据各个待识别区域的行人的第一数量，确定出待识别图像中行人的第二数量。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统和装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。在本申请所提供的几个实施例中，应所述理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者所述技术方案的部分可以以软件产品的形式体现出来，所述计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种行人数量的确定方法，其特征在于，所述确定方法包括：

根据所述至少一个待识别区域中行人的第一数量，确定所述待识别图像中行人的第二数量；

所述基于每一个所述待识别区域中所述行人头部的数量以及所述行人骨骼结构的数量，确定出所述待识别区域中行人的第一数量，包括：

当所述行人头部的数量大于所述行人骨骼结构的数量时，将所述行人头部的数量确定为所述待识别区域中行人的第一数量；当所述行人头部的数量小于或等于所述行人骨骼结构的数量时，将所述行人骨骼结构的数量确定为所述待识别区域中行人的第一数量；

识别所述待识别区域中的行人骨骼结构，包括：

从所述待识别区域中识别出人体骨骼关键点；基于所述人体骨骼关键点，确定出行人的人体骨骼结构。

2.根据权利要求1所述的确定方法，其特征在于，在所述获取待识别图像，并从所述待识别图像中确定出至少一个待识别区域之后，所述确定方法还包括：

确定所述至少一个待识别区域中是否存在误检区域；

3.根据权利要求2所述的确定方法，其特征在于，根据以下步骤确定所述至少一个待识别区域中是否存在误检区域：

4.根据权利要求1所述的确定方法，其特征在于，根据以下步骤识别所述待识别区域中的行人头部：

从所述待识别区域中识别出头部特征；

基于所述头部特征，确定所述待识别区域中的行人头部。

5.根据权利要求1所述的确定方法，其特征在于，所述基于所述人体骨骼关键点，确定出行人的人体骨骼结构，包括：

6.根据权利要求3所述的确定方法，其特征在于，通过以下步骤训练所述行人检测模型：

7.根据权利要求1所述的确定方法，其特征在于，所述获取待识别图像，并从所述待识别图像中确定出至少一个待识别区域，包括：

根据所述标准图像，确定出所述至少一个待识别区域。

8.一种行人数量的确定装置，其特征在于，所述确定装置包括：

第二数量确定模块，用于根据所述至少一个待识别区域中行人的第一数量，确定所述待识别图像中行人的第二数量；

识别模块，用于从所述待识别区域中识别出人体骨骼关键点；基于所述人体骨骼关键点，确定出行人的人体骨骼结构；

第一数量确定模块，用于当所述行人头部的数量大于所述行人骨骼结构的数量时，将所述行人头部的数量确定为所述待识别区域中行人的第一数量；当所述行人头部的数量小于或等于所述行人骨骼结构的数量时，将所述行人骨骼结构的数量确定为所述待识别区域中行人的第一数量。

9.一种电子设备，其特征在于，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过所述总线进行通信，所述机器可读指令被所述处理器运行时执行如权利要求1至7任一所述的行人数量的确定方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行如权利要求1至7任一所述的行人数量的确定方法的步骤。