CN114332948A

CN114332948A - 基于yolov5算法的人头检测方法、模型训练方法和装置

Info

Publication number: CN114332948A
Application number: CN202111678096.3A
Authority: CN
Inventors: 雷庆庆; 王晓; 毛少将; 任峰
Original assignee: CRSC Communication and Information Group Co Ltd CRSCIC
Current assignee: CRSC Communication and Information Group Co Ltd CRSCIC
Priority date: 2021-12-31
Filing date: 2021-12-31
Publication date: 2022-04-12

Abstract

本申请公开一种基于YOLOV5算法的人头检测方法、模型训练方法和装置，涉及图像处理技术领域。人头检测方法包括：获取待检测图像；确定与待检测图像对应的多个预设尺寸；将待检测图像和多个预设尺寸，输入到预设的多尺寸头肩检测模型中进行检测，确定待检测图像中包括的人头数量；其中，多尺寸头肩检测模型是使用获取到的样本图像和随机选取的多个训练尺寸对初始头肩检测模型进行训练，获得的模型，初始头肩检测模型是基于YOLOV5算法构建的模型。能够通过多尺寸头肩检测模型增强对待检测图像的检测精准性，并使用多个预设尺寸适应性对待检测图像中的不同区域进行人头数量的检测，提升检测准确性。

Description

基于YOLOV5算法的人头检测方法、模型训练方法和装置

技术领域

本申请涉及图像处理技术领域，具体涉及一种基于YOLOV5算法的人头检测方法、模型训练方法和装置。

背景技术

随着视频监控系统在不同领域中的广泛应用，用户可以对获取到的监控视频数据中的人员数量进行统计，以获取在不同场景下出现的人员情况。例如，可以通过公共区域安装的监控摄像装置对出现在该公共区域内的人物的头部特征进行检测，可以快捷高效的确定出现在该公共区域内的人员数量，能够有效降低目标被遮挡的比例，提升对公共区域的人员数量的监控准确性。

但是，在一些复杂的场景下(例如，在高铁候车室中)，出现的人头的数量过多，摄像装置的安装位置低于人物的身高的情况下，使得通过摄像装置获取到的图像中，各个人物对应的图像面积差异较大，例如，距离摄像装置远的行人，对应的图像面积会很小；而距离摄像装置近的行人，对应的图像面积会很大，使得对出现在高铁候车室中的人员数量的统计结果不准确，无法精准的控制高铁候车室中的人员数量。

发明内容

为此，本申请提供一种基于YOLOV5算法的人头检测方法、模型训练方法和装置，解决如何提升对待检测图像中的人头数量的检测准确性的问题。

为了实现上述目的，本申请第一方面提供一种基于YOLOV5算法的人头检测方法，方法包括：获取待检测图像；确定与待检测图像对应的多个预设尺寸；将待检测图像和多个预设尺寸，输入到预设的多尺寸头肩检测模型中进行检测，确定待检测图像中包括的人头数量；其中，多尺寸头肩检测模型是使用获取到的样本图像和随机选取的多个训练尺寸对初始头肩检测模型进行训练，获得的模型，初始头肩检测模型是基于YOLOV5算法构建的模型。

在一些具体实现中，确定与待检测图像对应的多个预设尺寸，包括：获取待检测图像中预设区域中的待检测人头与图像获取装置之间的位置关系信息；依据位置关系信息和预设基准距离，确定多个预设尺寸。

在一些具体实现中，多个预设尺寸包括：尺寸依次递增的第一检测尺寸、第二检测尺寸和第三检测尺寸；将待检测图像和多个预设尺寸，输入到预设的多尺寸头肩检测模型中进行检测，确定待检测图像中包括的人头数量，包括：将待检测图像和第一检测尺寸输入到多尺寸头肩检测模型中进行检测，获得第一检测结果；将待检测图像和第二检测尺寸输入到多尺寸头肩检测模型中进行检测，获得第二检测结果；将待检测图像和第三检测尺寸输入到多尺寸头肩检测模型中进行检测，获得第三检测结果；依据第一检测结果、第二检测结果和第三检测结果，确定待检测图像中包括的人头数量。

在一些具体实现中，第二检测尺寸是在确定待检测图像中的待检测人头与图像获取装置之间的待检测距离等于预设基准距离的情况下，确定的尺寸。

在一些具体实现中，第一检测结果包括第一待处理头肩图像；第二检测结果包括第二待处理头肩图像；第三检测结果包括第三待处理头肩图像；依据第一检测结果、第二检测结果和第三检测结果，确定待检测图像中包括的人头数量，包括：依据预设变换尺寸，分别对第一待处理头肩图像、第二待处理头肩图像和第三待处理头肩图像进行数据变换，生成多个变换后的头肩图像；对多个变换后的头肩图像进行拼接，生成拼接图像；依据拼接图像，确定待检测图像中包括的人头数量。

在一些具体实现中，依据拼接图像，确定待检测图像中包括的人头数量，包括：采用非极大抑制NMS物体检测算法，对拼接图像中的重叠信息进行过滤，获得过滤后的图像；依据过滤后的图像，确定待检测图像中包括的人头数量。

在一些具体实现中，依据过滤后的图像，确定待检测图像中包括的人头数量，包括：获取预设置信度阈值；依据预设置信度阈值，对过滤后的图像进行处理，确定待检测图像中包括的人头数量。

为了实现上述目的，本申请第二方面提供一种头肩检测模型的训练方法，方法包括：随机选取多个训练尺寸；基于YOLOV5算法构建初始头肩检测模型；使用获取到的样本图像和多个训练尺寸对初始头肩检测模型进行训练，获得多尺度头肩检测模型；其中，多尺度头肩检测模型应用于本申请中任意一种基于YOLOV5算法的人头检测方法。

在一些具体实现中，基于YOLOV5算法构建初始头肩检测模型之前，还包括：获取多个样本图像；对多个样本图像中的头肩区域进行标注，生成头肩标注信息；依据YOLOV5算法和头肩标注信息，对头肩区域进行数据增强，确定头肩数据，头肩数据至少包括头肩目标框。

为了实现上述目的，本申请第三方面提供一种检测装置，其包括：获取模块，被配置为获取待检测图像；确定模块，被配置为确定与待检测图像对应的多个预设尺寸；检测模块，被配置为将待检测图像和多个预设尺寸，输入到预设的多尺寸头肩检测模型中进行检测，确定待检测图像中包括的人头数量；其中，多尺寸头肩检测模型是使用获取到的样本图像和随机选取的多个训练尺寸对初始头肩检测模型进行训练，获得的模型，初始头肩检测模型是基于YOLOV5算法构建的模型。

本申请中的基于YOLOV5算法的人头检测方法、模型训练方法和装置，通过获取待检测图像，并确定与待检测图像对应的多个预设尺寸，能够为待检测图像的检测做好准备，加快对待检测图像的检测速度；将待检测图像和多个预设尺寸，输入到预设的多尺寸头肩检测模型中进行检测，确定待检测图像中包括的人头数量，能够通过多个预设尺寸适应性对待检测图像中的不同区域进行人头数量的检测，提升检测准确性；并且，其中的多尺寸头肩检测模型是使用获取到的样本图像和随机选取的多个训练尺寸对初始头肩检测模型进行训练，获得的模型，初始头肩检测模型是基于YOLOV5算法构建的模型，能够增强对待检测图像的检测精准性，进而可以对待检测图像对应的预设区域内的人员数量进行控制，以保证预设区域内的人员安全。

附图说明

附图用来提供对本申请实施例的进一步理解，并且构成说明书的一部分，与本申请的实施例一起用于解释本申请，并不构成对本申请的限制。通过参考附图对详细示例实施例进行描述，以上和其它特征和优点对本领域技术人员将变得更加显而易见，在附图中。

图1示出本申请实施例提供的常规的人头检测方法的流程示意图。

图2示出本申请一实施例提供的基于YOLOV5算法的人头检测方法的流程示意图。

图3示出本申请又一实施例提供的基于YOLOV5算法的人头检测方法的流程示意图。

图4示出本申请实施例提供的头肩检测模型训练方法的流程示意图。

图5示出本申请实施例提供的检测装置的组成方框图。

图6示出本申请实施例提供的头肩检测模型训练装置的组成方框图。

图7示出本申请实施例提供的基于YOLOV5算法的人头检测系统的组成方框图。

图8示出本申请实施例提供的基于YOLOV5算法的人头检测系统的工作方法流程图。

具体实施方式

以下结合附图对本申请的具体实施方式进行详细说明。应当理解的是，此处所描述的具体实施方式仅用于说明和解释本申请，并不用于限制本申请。对于本领域技术人员来说，本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

常规的人头检测算法，如图1所示，包括如下步骤：

步骤S101，获取待检测图片。

步骤S102，将待检测图片输入都YOLOv5检测模型中进行检测，获得待检测图片中的人头坐标。

其中，YOLOv5(You Only Look Once)是一种单阶段目标检测算法，能够在检测平均精度降低不多的基础上，具有均值权重文件更小，训练时间和推理速度更短的特点。

但是，从数据集的角度分析，目前业内有大量的人头数据集，可以直接训练人头检测模型。由于人的头发是黑色，神经网络很容易将人头和一些黑的物体混淆，从而造成误判。

步骤S103，基于待检测图片中的人头坐标，确定待检测图片包括的人头数量。

从算法的角度分析，现在业内的算法(例如，YOLOv5算法等)一般是基于特定尺寸的数据进行训练和推理，在YOLOv5算法的训练过程中，通常需要将预设尺寸的样本图像(例如，640*640的图像，或416*416的图像等)输入神经网络中进行训练，从而获得YOLOv5检测模型。但是该YOLOv5检测模型只能对特定尺寸的图像进行检测(例如，640*640的图像，或416*416的图像等)。但是，通常采用摄像头等设备采集到的图像的尺寸都较大(例如，1920*1080的图像等)，而对于这种高像素的图像，若仍然采用特定尺寸的图像检测模型进行检测，易导致人头检测率低，无法获得准确的人头数量。

本申请提供的基于YOLOV5算法的人头检测方法、模型训练方法和装置，在原有YOLOv5算法的基础上，重新设计架构。获取样本图像并随机选取多个训练尺寸，使用获取到的样本图像和多个训练尺寸对初始头肩检测模型进行训练，获得多尺度头肩检测模型；从而使用该多尺度头肩检测模型对待检测图像进行检测，确定待检测图像中包括的人头数量，能够使检测准确率更高，并提升人头检测率。

图2示出本申请一实施例提供的基于YOLOV5算法的人头检测方法的流程示意图。该方法可应用于检测装置。如图2所示，基于YOLOV5算法的人头检测方法包括但不限于如下步骤。

步骤S201，获取待检测图像。

其中，待检测图像可以是通过图像获取装置(例如：摄像头或照相机等)对预设区域进行拍摄或照相获得的图像。在该预设区域内，可能存在多个人物以及相关物体。

步骤S202，确定与待检测图像对应的多个预设尺寸。

其中，多个预设尺寸均是基于待检测图像中预设区域中的待检测人头与图像获取装置之间的位置关系信息和预设基准距离确定的尺寸。

并且，多个预设尺寸之间可以差异较大，也可以差异较小。例如，多个预设尺寸可以包括：460*460、640*640、480*480、960*960、960*1280等多个尺寸。

以上对于预设尺寸的说明仅是举例说明，可根据实际需要进行具体限定，其他未说明的预设尺寸也在本申请的保护范围之内，在此不再赘述。

步骤S203，将待检测图像和多个预设尺寸，输入到预设的多尺寸头肩检测模型中进行检测，确定待检测图像中包括的人头数量。

其中，多尺寸头肩检测模型是基于YOLOV5算法对样本图像中的头肩数据和随机选取的多个训练尺寸进行训练确定的模型。

需要说明的是，随机选取的多个训练尺寸可以与多个预设尺寸相同，也可以不同，通过基于YOLOV5算法对样本图像中的头肩数据和随机选取的多个训练尺寸进行训练确定的多尺寸头肩检测模型，能够针对多种不同的尺寸，对待检图像中的人头进行检测，使与图像获取装置之间的距离不同的人物都能够被清晰的检测出来，获取该人物对应的人头位置，准确确定待检测图像中包括的人头数量，提升检测准确性。

在本实施例中，通过获取待检测图像，并确定与待检测图像对应的多个预设尺寸，能够为待检测图像的检测做好准备，加快对待检测图像的检测速度；将待检测图像和多个预设尺寸，输入到预设的多尺寸头肩检测模型中进行检测，确定待检测图像中包括的人头数量，能够通过多个预设尺寸适应性对待检测图像中的不同区域进行人头数量的检测，提升检测准确性；并且，其中的多尺寸头肩检测模型是使用获取到的样本图像和随机选取的多个训练尺寸对初始头肩检测模型进行训练，获得的模型，初始头肩检测模型是基于YOLOV5算法构建的模型，能够增强对待检测图像的检测精准性，进而可以对待检测图像对应的预设区域内的人员数量进行控制，以保证预设区域内的人员安全。

图3示出本申请又一实施例提供的基于YOLOV5算法的人头检测方法的流程示意图。该方法可应用于检测装置。本实施例与上一实施例的区别在于：多个预设尺寸包括：尺寸依次递增的第一检测尺寸、第二检测尺寸和第三检测尺寸。通过尺寸依次递增的三种检测尺寸，能够对待检测图像进行区域划分，能够对待检测图像中的不同区域进行检测，细化检测区域，提升对待检测图像中包括的人头数量的检测准确性。

如图3所示，基于YOLOV5算法的人头检测方法包括但不限于如下步骤。

步骤S301，获取待检测图像。

需要说明的是，本实施例中的步骤S301与上一实施例中的步骤S201相同，在此不再赘述。

步骤S302，确定与待检测图像对应的多个预设尺寸。

其中，多个预设尺寸包括：尺寸依次递增的第一检测尺寸、第二检测尺寸和第三检测尺寸。

在一些具体实现中，确定与待检测图像对应的多个预设尺寸，可以采用如下方式实现。

获取待检测图像中预设区域中的待检测人头与图像获取装置之间的位置关系信息；依据位置关系信息和预设基准距离，确定多个预设尺寸。

其中，位置关系信息可以包括：待检测人头对应的第一坐标值，以及图像获取装置对应的第二坐标值。通过第一坐标值和第二坐标值，能够确定待检测人头与图像获取装置之间的距离，进而将该距离与预设基准距离进行比较，确定待检测人头与图像获取装置之间的位置关系(例如，待检测人头位于距离图像获取装置较远的区域，或，待检测人头位于距离图像获取装置较近的区域，或，待检测人头位于与图像获取装置之间的距离适中的区域等等)。

通过待检测人头与图像获取装置之间的位置关系，可设定多个不同的预设尺寸，以方便将多个预设尺寸运用与后续对待检测图像中的不同区域的检测，提升对待检测图像的检查准确性。

需要说明的是，以上三个检测尺寸的递增可以是基于待检测图像中的待检测人头与图像获取装置之间的待检测距离确定的递增尺寸，也可以是基于对待检测图像中不同区域的检测顺序确定的递增尺寸。以上对于三个检测尺寸仅是举例说明，可根据实际需要进行具体的设定，其他未说明的检测尺寸也在本申请的保护范围之内，在此不再赘述。

步骤S303，将待检测图像和第一检测尺寸输入到多尺寸头肩检测模型中进行检测，获得第一检测结果。

基于第一检测尺寸，将待检测图像输入到多尺寸头肩检测模型中进行检测，以确定与该第一检测尺寸相匹配的图像。例如，可以是人物头像的中心点落入该第一检测尺寸对应的方框内的图像等。

例如，第一检测尺寸是在确定待检测图像中的待检测人头与图像获取装置之间的待检测距离大于预设基准距离的情况下，确定的尺寸。

因待检测人头与图像获取装置之间的待检测距离大于预设基准距离，故待检测人头在待检测图像中占用的图像面积可能相对于待检测图像中的其他人头在待检测图像中占用的图像面积小，故获得的与第一检测尺寸相匹的图像，能够体现距离图像获取装置较远的区域的特征，从而检测到距离图像获取装置较远的区域内的人头数量，提升对该区域的人头检测准确性。

步骤S304，将待检测图像和第二检测尺寸输入到多尺寸头肩检测模型中进行检测，获得第二检测结果。

基于第二检测尺寸，将待检测图像输入到多尺寸头肩检测模型中进行检测，以确定与该第二检测尺寸相匹配的图像。例如，可以是人物头像的中心点落入该第二检测尺寸对应的方框内的图像等。

例如，第二检测尺寸是在确定待检测图像中的待检测人头与图像获取装置之间的待检测距离等于预设基准距离的情况下，确定的尺寸。

因待检测人头与图像获取装置之间的待检测距离等于预设基准距离，故待检测人头在待检测图像中占用的图像面积适中，因此，获得的与第二检测尺寸相匹的图像，能够体现待检测图像的中心区域的特征，从而检测到该中心区域内的人头数量，提升对该中心区域的人头检测准确性。

步骤S305，将待检测图像和第三检测尺寸输入到多尺寸头肩检测模型中进行检测，获得第三检测结果。

基于第三检测尺寸，将待检测图像输入到多尺寸头肩检测模型中进行检测，以确定与该第三检测尺寸相匹配的图像。例如，可以是人物头像的中心点落入该第三检测尺寸对应的方框内的图像等。

例如，第三检测尺寸是在确定待检测图像中的待检测人头与图像获取装置之间的待检测距离小于预设基准距离的情况下，确定的尺寸。

因待检测人头与图像获取装置之间的待检测距离小于预设基准距离，故待检测人头在待检测图像中占用的图像面积可能相对于待检测图像中的其他人头在待检测图像中占用的图像面积要大很多，故获得的与第三检测尺寸相匹的图像，能够体现距离图像获取装置较近的区域的特征，从而检测到距离图像获取装置较近的区域内的人头数量，提升对该区域的人头检测准确性。

步骤S306，依据第一检测结果、第二检测结果和第三检测结果，确定待检测图像中包括的人头数量。

通过检测获得的待检测图像中的三种不同区域内的检测结果，能够细化对待检测图像的检测精确性，从而使获得的待检测图像中包括的人头数量更准确。

本申请实施例提供了再一种可能的实现方式，其中，第一检测结果包括第一待处理头肩图像；第二检测结果包括第二待处理头肩图像；第三检测结果包括第三待处理头肩图像。步骤S306中的依据第一检测结果、第二检测结果和第三检测结果，确定待检测图像中包括的人头数量，可以采用如下方式实现。

依据预设变换尺寸，分别对第一待处理头肩图像、第二待处理头肩图像和第三待处理头肩图像进行数据变换，生成多个变换后的头肩图像；对多个变换后的头肩图像进行拼接，生成拼接图像；依据拼接图像，确定待检测图像中包括的人头数量。

其中，依据拼接图像，确定待检测图像中包括的人头数量，可以是通过直接计算拼接图像中的人头数量，从而确定待检测图像中包括的人头数量；也可以将拼接图像进行再次处理，例如，将拼接图像输入到多尺度头肩检测模型进行检测，从而确定最终的待检测图像中包括的人头数量。

需要说明的是，预设变换尺寸是基于原始的待检测图像确定的尺寸，能够使第一待处理头肩图像、第二待处理头肩图像和第三待处理头肩图像在经过数据变换后，都可以还原回与待检测图像相同的尺寸。进一步地，将多个变换后的头肩图像进行拼接所生成拼接图像，能够体现原始的待检测图像的特征，从而方便后续的检测。

其中，非极大抑制(Non Maximum Suppression，NMS)物体检测算法，用于抑制不是极大值的元素，搜索局部的极大值。

通过该算法对拼接图像进行处理，能够从一张图片(例如，拼接图像)中找出很多个可能是物体的矩形框，然后基于这些矩形框，对拼接图像中的重叠信息进行过滤，获得过滤后的图像，减少重叠信息造成的误判干扰等，以使过滤后的图像能够更清晰的表征其包括的人头数量，提升对人头数量的检测准确性。

统计学中，在一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数测量值的可信程度范围，即前面所要求的“一定概率”。这个概率被称为置信水平。

本申请中的预设置信度阈值可以是基于置信水平确定的阈值。例如，可设置预设置信度阈值为0.8，对过滤后的图像中置信度阈值低于0.8的人头检测框进行筛除，从而获得高于阈值置信度阈值的人头检测框，进一步提升人头检测精准性。

采用预设置信度阈值对过滤后的图像进行处理，能够确定过滤后的图像中所包括的人头数量，可以真实体现原始的待检测图像中包括的人头数量的概率，从而使最终获得的待检测图像中包括的人头数量能够更准确，提升对待检测图像的检查准确性。进而可以对待检测图像对应的预设区域内的人员数量进行控制，以保证预设区域内的人员安全。

图4示出本申请实施例提供的头肩检测模型训练方法的流程示意图。该方法可应用于头肩检测模型训练装置。如图4所示，头肩检测模型训练方法包括但不限于如下步骤。

步骤S401，随机选取多个训练尺寸。

其中，多个训练尺寸是随机选取的尺寸，例如，可通过设定随机函数，通过该随机函数确定多个训练尺寸。

例如，训练尺寸可以包括：460*460、640*640、480*480、960*960、960*1280等多个尺寸。

以上对于训练尺寸的说明仅是举例说明，可根据实际需要进行具体限定，其他未说明的训练尺寸也在本申请的保护范围之内，在此不再赘述。

步骤S402，基于YOLOV5算法构建初始头肩检测模型。

其中，YOLOV5算法是使用整个图片的特征去预测每一个边界框。它还同时预测一个图像在所有类中的所有边界框。YOLO先把整个图片划分成S*S个方格，如果一个物体的中心正好落在一个方格中，那么这个方格就用于预测该物体。其中，S为大于或等于1的整数。

针对每一个方格，会预测出B个边界框和这些边界框的置信度分值。通过B个边界框及其对应的置信度分值表示该方格包括的物体的准确度和产生的框的精确程度，从而输出一个张量为：S*S*(5*B+C)；其中，B表示每个方格预测的边界框的数量，C表示边界框的类别的数量。

通过基于YOLOV5算法构建初始头肩检测模型，能够使初始头肩检测模型能够针对待检测图像进行检查，粗略检测出待检测图像中包括的人头数量。

步骤S403，使用获取到的样本图像和多个训练尺寸对初始头肩检测模型进行训练，获得多尺度头肩检测模型。

其中，多尺度头肩检测模型应用于本申请中任意一种基于YOLOV5算法的人头检测方法。该多尺度头肩检测模型可以实现高速、高准确率，以及人头检测率较高的人头检测。

在本实施例中，通过基于YOLOV5算法构建初始头肩检测模型，能够使该初始头肩检测模型能够对待检测图像进行粗略的检测，获得检测结果，并结合该检测结果，对后续使用获取到的样本图像和随机选取的多个训练尺寸对初始头肩检测模型进行训练的训练结果进行评价，使得多次训练后，所获得的多尺度头肩检测模型能够适应与多种不同的尺寸的图像的检测，提升对待检测图像的检查准确性。

在一些具体实现中，基于YOLOV5算法构建初始头肩检测模型之前，还包括：获取多个样本图像；对多个样本图像中的头肩区域进行标注，生成头肩标注信息；依据YOLOV5算法和头肩标注信息，对头肩区域进行数据增强，确定头肩数据。

需要说明的是，依据YOLOV5算法和头肩标注信息，对头肩区域进行数据增强，可以是通过头肩标注信息，对多个样本图像中的头肩区域进行放大或缩小，以使头肩区域的特征能够更具体的展现处理，方便数据的采集，从而确定头肩数据。其中，头肩数据至少包括头肩目标框。

通过头肩目标框，能够加快对落到该头肩目标框中的物体的检测速度；并且，如果一个人物的中心正好落在该头肩目标框中，那么就会使用该头肩目标框来预测该人物。不仅可以提升对人物的检查准确性，还能够使用多个头肩目标框对多个人物进行同时检测，提升检测效率。

图5示出本申请实施例提供的检测装置的组成方框图。如图5所示，该检测装置500，包括：

获取模块501，被配置为获取待检测图像；确定模块502，被配置为确定与待检测图像对应的多个预设尺寸；检测模块503，被配置为将待检测图像和多个预设尺寸，输入到预设的多尺寸头肩检测模型中进行检测，确定待检测图像中包括的人头数量；其中，多尺寸头肩检测模型是基于YOLOV5算法对样本图像中的头肩数据和随机选取的多个训练尺寸进行训练确定的模型。

本实施方式中的装置的具体实施不局限于以上实施例，其他未说明的实施例也在本装置的保护范围之内。

在本实施方式中，通过获取模块获取待检测图像，并使用确定模块确定与待检测图像对应的多个预设尺寸，能够为待检测图像的检测做好准备，加快对待检测图像的检测速度；使用检测模块将待检测图像和多个预设尺寸，输入到预设的多尺寸头肩检测模型中进行检测，确定待检测图像中包括的人头数量，能够通过多个预设尺寸适应性对待检测图像中的不同区域进行人头数量的检测，提升检测准确性；并且，其中的多尺寸头肩检测模型是使用获取到的样本图像和随机选取的多个训练尺寸对初始头肩检测模型进行训练，获得的模型，初始头肩检测模型是基于YOLOV5算法构建的模型，能够增强对待检测图像的检测精准性，进而可以对待检测图像对应的预设区域内的人员数量进行控制，以保证预设区域内的人员安全。

图6示出本申请实施例提供的头肩检测模型训练装置的组成方框图。如图6所示，该头肩检测模型训练装置600，包括：

随机选择模块601，被配置为随机选取多个训练尺寸；模型构建模块602，被配置为基于YOLOV5算法构建初始头肩检测模型；模型训练模块603，被配置为使用获取到的样本图像和多个训练尺寸对初始头肩检测模型进行训练，获得多尺度头肩检测模型；其中，多尺度头肩检测模型应用于本申请中任一项的基于YOLOV5算法的人头检测方法。

在本实施方式中，通过模型构建模块基于YOLOV5算法构建初始头肩检测模型，能够使该初始头肩检测模型能够对待检测图像进行粗略的检测，获得检测结果，并结合该检测结果，对使用模型训练模块进行模型训练的训练结果进行评价，即使用获取到的样本图像和随机选取的多个训练尺寸对初始头肩检测模型进行训练的训练结果进行评价，使得多次训练后，所获得的多尺度头肩检测模型能够适应与多种不同的尺寸的图像的检测，提升对待检测图像的检查准确性。

值得一提的是，本实施方式中所涉及到的各模块均为逻辑模块，在实际应用中，一个逻辑单元可以是一个物理单元，也可以是一个物理单元的一部分，还可以以多个物理单元的组合实现。此外，为了突出本申请的创新部分，本实施方式中并没有将与解决本申请所提出的技术问题关系不太密切的单元引入，但这并不表明本实施方式中不存在其它的单元。

图7示出本申请实施例提供的基于YOLOV5算法的人头检测系统的组成方框图。如图7所示，基于YOLOV5算法的人头检测系统包括如下设备。

图像获取装置710和人头检测服务器720。其中，人头检测服务器720包括：头肩检测模型训练装置721和人头检测装置722。

图像获取装置710，用于获取预设区域的待检测图像，或多个不同检测区域内的多个样本图像。并将多个样本图像输入到头肩检测模型训练装置721进行训练，以获得多尺度头肩检测模型；将待检测图像输入到人头检测装置722中进行检测，以确定待检测图像中包括的人头数量。

头肩检测模型训练装置721，用于通过特征提取网络对输入的样本图像进行特征提取，并对样本图像中的头肩区域进行标注，生成头肩标注信息，依据该头肩标注信息和YOLOV5算法，对样本图像中的头肩区域进行数据增强(例如，突出特定区域的图像识别度等)，从而确定头肩数据；然后，随机选取多个训练尺寸，并使用多个训练尺寸对初始头肩检测模型进行训练，获得多尺度头肩检测模型。

人头检测装置722，用于将获得的待检测图像，以及该待检测图像对应的多个预设尺寸，输入到头肩检测模型训练装置721训练获得的多尺寸头肩检测模型中进行检测，确定待检测图像中包括的人头数量。

例如，样本图像可以包括多个不同的特征图(例如，13*13的特征图等)，可将样本图像分割成多个特征方格，如果某个人头的中心坐标落在某个特征方格中，那么就由该特征方格来预测该目标人头，其中，每个特征方格都会预测3个不同尺度的边界框。

需要说明的是，预测得到的输出特征图可以包括三个维度信息(例如，颜色系统(Red Green Blue，RGB)中，R、G、B分别代表红、绿、蓝三个通道的颜色)，其中，可以使用两个通道用于提取人头特征(比如，13*13)，而剩余的一个通道可以表示为：B*(5+C)。

其中，B表示每个方格预测的边界框的数量，C表示边界框的类别的数量。

通过多尺寸头肩检测模型增强对待检测图像的检测精准性，并使用多个预设尺寸适应性对待检测图像中的不同区域进行人头数量的检测，提升检测准确性。

图8示出本申请实施例提供的基于YOLOV5算法的人头检测系统的工作方法流程图。如图8所示，基于YOLOV5算法的人头检测系统的工作方法包括但不限于如下步骤。

步骤S801，使用图像获取装置710获取待检测图像，并将待检测图像输入到人头检测装置722中。

其中，待检测图像还可以采用如下方式获取；通过图像获取装置710采集预设区域内拍摄的原始视频数据；然后，将原始视频数据中的某帧图像作为待检测图像。

例如，原始视频数据可以包括多帧图像，可以通过对多帧图像进行筛选，以获得针对预设区域的某帧图像都可以作为待检测图像，该帧图像中能够表征预设区域的环境特征，以及该预设区域内可容纳的多个人物数量特征。例如，待检测图像是原始视频数据中的多帧图像中包括最多人头的图像等。

步骤S802，人头检测装置722针对待检测图像，确定与待检测图像对应的多个预设尺寸，其中的多个预设尺寸至少包括三个检测尺寸。

例如，可以根据获取到的待检测图像中预设区域中的待检测人头与图像获取装置710之间的位置关系信息和预设基准距离，确定多个预设尺寸。其中的位置关系信息包括：待检测人头与图像获取装置之间的距离，或，待检测人头在预设坐标系中的坐标信息。

通过待检测人头在预设坐标系中的坐标信息，以及图像获取装置710在预设坐标系中的坐标信息，能够确定待检测人头与图像获取装置之间的距离。

若确定某些待检测人头与图像获取装置之间的距离等于预设基准距离，则可基于该预设基准距离确定中间检测尺寸(例如，第二检测尺寸)；然后，在确定某些待检测人头与图像获取装置之间的距离大于预设基准距离的情况下，生成第一检测尺寸；在确定某些待检测人头与图像获取装置之间的距离小于预设基准距离的情况下，生成第三检测尺寸。

通过选取三种不同的检测尺寸，来初步对待检测图像进行划分，以方便后续对待检测图像进行人头检测。

需要说明的是，针对不同的检测尺寸，其对应的侧重检测范围也不同。例如，第一检测尺寸侧重检测距离图像获取装置710较远的人头数量；第二检测尺寸侧重检测待检测图像中央区域的人头数量；第三检测尺寸侧重检测距离图像获取装置710较近的人头数量。

步骤S803，人头检测装置722将待检测图像分别与第一检测尺寸、第二检测尺寸和第三检测尺寸输入到多尺寸头肩检测模型中进行检测，从而获得三种检测结果。

需要说明的是，其中的多尺寸头肩检测模型可以是人头检测服务器720中的头肩检测模型训练装置721采用如下训练方法获得：

首先，随机选取多个训练尺寸。例如，在预设图像范围内，在每个批尺寸(bach_size)中，随机选择不同尺寸大小的图像，并将随机选择的尺寸作为训练尺寸。例如，多个训练尺寸可以包括：640*640、480*480、960*960、960*1280等多个尺寸。以上对于训练尺寸仅是举例说明，其他未说明的训练尺寸也在本申请的保护范围之内，在此不再赘述。

然后，获取多个样本图像；对多个样本图像中的头肩区域进行标注，生成头肩标注信息；依据YOLOV5算法和头肩标注信息对头肩区域进行数据增强，确定头肩数据，该头肩数据至少包括头肩目标框。

再基于YOLOV5算法构建初始头肩检测模型；并使用获取到的样本图像和多个训练尺寸对初始头肩检测模型进行训练，获得多尺度头肩检测模型，该多尺度头肩检测模型可以实现高速、高准确率，以及人头检测率较高的人头检测。

步骤S804，人头检测装置722分别将三种检测结果中的待处理头肩图像进行数据变换，以获得尺寸相同的三个变换后的头肩图像。

例如，第一检测结果包括第一待处理头肩图像；第二检测结果包括第二待处理头肩图像；第三检测结果包括第三待处理头肩图像。其中的第一检测结果是将待检测图像和第二检测尺寸输入到多尺寸头肩检测模型中进行检测获得的结果；第二检测结果是将待检测图像和第二检测尺寸输入到多尺寸头肩检测模型中进行检测获得的结果；第三检测结果是将待检测图像和第三检测尺寸输入到多尺寸头肩检测模型中进行检测获得的结果。

依据预设变换尺寸(例如，460*460等)，分别对第一待处理头肩图像、第二待处理头肩图像和第三待处理头肩图像进行数据变换，生成三个变换后的头肩图像。

例如，通过将三个不同尺寸的待处理头肩图像对应的坐标，统一还原到原始的待检测图像对应的尺寸，以使变化后的头肩图像更能体现人头特征。

步骤S805，人头检测装置722对三个变换后的头肩图像进行拼接，生成拼接图像。

其中，拼接图像可以是与待检测图像的尺寸相同的图像，也可以是经过尺寸放大或尺寸缩小的图像，能够使拼接图像全面的体现待检测图像中的人头特征，提升对人头数量的检查准确性。

步骤S806，人头检测装置722采用NMS物体检测算法，对拼接图像中的重叠信息进行过滤，获得过滤后的图像。

其中，NMS物体检测算法，用于抑制不是极大值的元素，搜索局部的极大值。通过该算法对拼接图像进行处理，能够从一张图片(例如，拼接图像)中找出很多个可能是物体的矩形框，然后在对每个矩形框做进一步的分类。

例如，可通过调节NMS阈值的方式，对拼接图像中的重叠图像进行过滤，从而获得清晰的人头检测框，提升检测准确性。

步骤S807，人头检测装置722依据获取到的预设置信度阈值，对过滤后的图像进行处理，确定待检测图像中包括的人头数量。

例如，可设置预设置信度阈值为0.8，对过滤后的图像中置信度阈值低于0.8的人头检测框进行筛除，从而获得高于阈值置信度阈值的人头检测框，进一步提升人头检测精准性。

在本实施例中，通过使用头肩检测模型训练装置721对获取到的多个样本图像中的头肩区域进行标注，生成头肩标注信息；依据YOLOV5算法和头肩标注信息对头肩区域进行数据增强，确定头肩数据，能够使头肩数据更准确，方便后续的模型训练；进一步地，基于YOLOV5算法构建初始头肩检测模型，并使用获取到的样本图像和多个随机选取的训练尺寸对初始头肩检测模型进行训练，获得多尺度头肩检测模型。当使用该多尺度头肩检测模型对待检测图像进行检测时，不仅能够提升距离图像获取装置710较近的大人头的检测准确率，而且也能够提升距离图像获取装置710较远的小人头的检测准确率。能够增强对待检测图像的检测精准性，进而可以对待检测图像对应的预设区域内的人员数量进行控制，以保证预设区域内的人员安全。

可以理解的是，以上实施方式仅仅是为了说明本申请的原理而采用的示例性实施方式，然而本申请并不局限于此。对于本领域内的普通技术人员而言，在不脱离本申请的精神和实质的情况下，可以做出各种变型和改进，这些变型和改进也视为本申请的保护范围。

Claims

1.一种基于YOLOV5算法的人头检测方法，其特征在于，所述方法包括：

获取待检测图像；

确定与所述待检测图像对应的多个预设尺寸；

将所述待检测图像和多个所述预设尺寸，输入到预设的多尺寸头肩检测模型中进行检测，确定所述待检测图像中包括的人头数量；

其中，所述多尺寸头肩检测模型是使用获取到的样本图像和随机选取的多个训练尺寸对初始头肩检测模型进行训练，获得的模型，所述初始头肩检测模型是基于YOLOV5算法构建的模型。

2.根据权利要求1所述的方法，其特征在于，所述确定与所述待检测图像对应的多个预设尺寸，包括：

获取所述待检测图像中预设区域中的待检测人头与图像获取装置之间的位置关系信息；

依据所述位置关系信息和预设基准距离，确定多个所述预设尺寸。

3.根据权利要求1所述的方法，其特征在于，多个所述预设尺寸包括：尺寸依次递增的第一检测尺寸、第二检测尺寸和第三检测尺寸；

所述将所述待检测图像和多个所述预设尺寸，输入到预设的多尺寸头肩检测模型中进行检测，确定所述待检测图像中包括的人头数量，包括：

将所述待检测图像和所述第一检测尺寸输入到所述多尺寸头肩检测模型中进行检测，获得第一检测结果；

将所述待检测图像和所述第二检测尺寸输入到所述多尺寸头肩检测模型中进行检测，获得第二检测结果；

将所述待检测图像和所述第三检测尺寸输入到所述多尺寸头肩检测模型中进行检测，获得第三检测结果；

依据所述第一检测结果、所述第二检测结果和所述第三检测结果，确定所述待检测图像中包括的人头数量。

4.根据权利要求3所述的方法，其特征在于，所述第二检测尺寸是在确定所述待检测图像中的待检测人头与图像获取装置之间的待检测距离等于预设基准距离的情况下，确定的尺寸。

5.根据权利要求3或4所述的方法，其特征在于，所述第一检测结果包括第一待处理头肩图像；所述第二检测结果包括第二待处理头肩图像；所述第三检测结果包括第三待处理头肩图像；

所述依据所述第一检测结果、所述第二检测结果和所述第三检测结果，确定所述待检测图像中包括的人头数量，包括：

依据预设变换尺寸，分别对所述第一待处理头肩图像、所述第二待处理头肩图像和所述第三待处理头肩图像进行数据变换，生成多个变换后的头肩图像；

对多个所述变换后的头肩图像进行拼接，生成拼接图像；

依据所述拼接图像，确定所述待检测图像中包括的人头数量。

6.根据权利要求5所述的方法，其特征在于，所述依据所述拼接图像，确定所述待检测图像中包括的人头数量，包括：

采用非极大抑制NMS物体检测算法，对所述拼接图像中的重叠信息进行过滤，获得过滤后的图像；

依据所述过滤后的图像，确定所述待检测图像中包括的人头数量。

7.根据权利要求6所述的方法，其特征在于，所述依据所述过滤后的图像，确定所述待检测图像中包括的人头数量，包括：

获取预设置信度阈值；

依据所述预设置信度阈值，对所述过滤后的图像进行处理，确定所述待检测图像中包括的人头数量。

8.一种头肩检测模型训练方法，其特征在于，所述方法包括：

随机选取多个训练尺寸；

基于YOLOV5算法构建初始头肩检测模型；

使用获取到的样本图像和多个所述训练尺寸对所述初始头肩检测模型进行训练，获得多尺度头肩检测模型；

其中，所述多尺度头肩检测模型应用于如权利要求1至7中任一项所述的基于YOLOV5算法的人头检测方法。

9.根据权利要求8所述的方法，其特征在于，所述基于YOLOV5算法构建初始头肩检测模型之前，还包括：

获取多个样本图像；

对多个所述样本图像中的头肩区域进行标注，生成头肩标注信息；

依据所述YOLOV5算法和所述头肩标注信息，对所述头肩区域进行数据增强，确定所述头肩数据，所述头肩数据至少包括头肩目标框。

10.一种检测装置，其包括：

获取模块，被配置为获取待检测图像；

确定模块，被配置为确定与所述待检测图像对应的多个预设尺寸；

检测模块，被配置为将所述待检测图像和多个所述预设尺寸，输入到预设的多尺寸头肩检测模型中进行检测，确定所述待检测图像中包括的人头数量；