CN113569691A

CN113569691A - 人头检测模型生成方法、装置、人头检测模型及人头检测方法

Info

Publication number: CN113569691A
Application number: CN202110828287.7A
Authority: CN
Inventors: 刘成; 周有喜
Original assignee: Xinjiang Aiwinn Information Technology Co Ltd
Current assignee: Xinjiang Aiwinn Information Technology Co Ltd
Priority date: 2021-07-19
Filing date: 2021-07-19
Publication date: 2021-10-29

Abstract

本申请涉及模型生成的技术领域，尤其涉及一种人头检测模型生成方法、装置、人头检测模型及人头检测方法。包括：获取初始模型和训练样本集，所述训练样本集中的训练样本包括样本图像；基于所述样本图像得到第一训练图像以及第二训练图像，所述第一训练图像包含头部正例训练样本，所述第二训练图像包含手部负例训练样本；以及，根据所述第一训练图像以及第二训练图像对初始模型进行训练，得到人头检测模型。在训练样本集加入手部负例训练样本和头部正例训练样本，有效减少在检测过程中将手部误检为头部的可能，从而便于提高人头检测的精度。

Description

人头检测模型生成方法、装置、人头检测模型及人头检测方法

技术领域

本申请涉及人工神经网络深度学习的技术领域，尤其是涉及一种人头检测模型生成方法、装置、人头检测模型及人头检测方法。

背景技术

栏杆是桥梁和建筑上的安全设施，栏杆在使用中起分隔的作用，使被分割区域边界明确清晰。但在学校里，常有一些学生将头伸出栏杆外，造成安全隐患。

为解决上述问题，但受到芯片能力的约束，使用的模型不能太大，因此采用RFSong-779模型获取图像，并自动检测人头是否伸出栏杆外，帮助学校找到做出危险动作的学生。但由于RFSong-779模型较小，在检测时容易导致误检和漏检情况较多，使得检测精确度较低。

发明内容

为了便于提高人头检测的准确性，本申请提供一种人头检测模型生成方法、装置、人头检测模型及人头检测方法。

第一方面，本申请提供的一种人头检测模型的生成方法，采用如下的技术方案：

一种人头检测模型的生成方法，包括：

获取初始模型和训练样本集，所述训练样本集包括样本图像，所述样本图像中包含头部正例训练样本、头部标注信息、手部负例训练样本以及手部标注信息；

根据样本图像得到第一训练图像与第二训练图像，其中，第一训练图像包含头部正例训练样本与头部标注信息，第二训练图像包含手部负例训练样本；

根据所述第一训练图像以及第二训练图像对初始模型进行训练，得到人头检测模型。

通过采用上述技术方案，在训练样本集加入手部负例训练样本和头部正例训练样本，有效减少在检测过程中将手部误检为头部的可能，从而便于提高人头检测的精度。

可选的，包括：

对所述第一训练图像以及第二训练图像进行数据增强，并生成训练图片；所述训练图片中包含头部正例训练样本、手部负例训练样本以及头部标注信息；

根据所述训练图片以及头部标注信息对初始模型进行训练得到人头检测模型。

通过采用上述技术方案，采用数据增强，便于增加样本丰富度，从而便于提高检测精度；另外，在对训练图片进行训练时，对标注有检测头部目标的位置信息的第一训练图像进行训练，从而便于进一步提高人头检测的精度；

将第一训练图像以及第二训练图像放在一张图片中，在不影响检测精度的同时，便于减少训练的图片数量，从而有助于缩短训练时间。

可选的，所述第一训练图像或第二训练图像的获取方法包括：

对样本图像中的头部正例训练样本或手部负例训练样本进行标注生成样本图像标注框，对样本图像标注框对应的样本图像进行抠图；

所述抠图范围满足如下公式：

其中，x_label-min为样本图像标注框的x轴的最小值，x_label-max为样本图像标注框的x轴的最大值，y_label-min为样本图像标注框的y轴的最小值，y_label-max为样本图像标注框的y轴的最大值，width为样本图像的宽，height为样本图像的高，a为自定义系数。

通过采用上述技术方案，对样本图像进行自定义标注样本图像标注框，其中样本图像标注框内的样本图像通常是一个包含有头部正例训练样本或手部负例训练样本的大致范围，并基于样本图像的宽和高以及样本图像标注框x轴的值、y轴的值对样本图像标注框内的区域进行抠图，便于第一训练图像或第二训练图像的获取。

可选的，还包括：所述检测头部目标的位置信息的获取方法包括：

x_new-hand-max＝x_new-hand-min+(x_label-max-x_label-min)；

y_new-hand-max＝y_new-hand-min+(y_label-max-y_label-min)；

其中，x和y分别为训练图片中第一训练图像或第二训练图像放置的左上角坐标，width为样本图像的宽，height为样本图像的高。

通过采用上述技术方案，

可选的，还包括：所述训练图片中第一训练图像或第二训练图像的左上角坐标的获取方法包括：

其中，width_m为第一训练图像或第二训练图像的宽，height_m为第一训练图像或第二训练图像的高，num为第一训练图像或第二训练图像的放置序号。

通过采用上述技术方案，生成训练图片后，且该训练图片中第一训练图像和/或第二训练图像的左上角位置相对固定，便于判断训练图片中是否包含头部正例训练样本。

可选的，还包括：

获取训练图片中的第一训练图像和/或第二训练图像的左上角坐标；

对所述第一训练图像和/或第二训练图像的左上角坐标进行调节，得到最终训练图片。

通过采用上述技术方案，有效减少因第一训练图像和/或第二训练图像的左上角位置相对固定而不利于模型的泛化能力的情况。

可选的，所述第一训练图像和/或第二训练图像的左上角坐标的调节范围满足如下公式：

其中，β和γ为函数自动生成的随机整数。

通过采用上述技术方案，对第一训练图像或第二训练图像设定范围，有效减少出现训练图像重叠的可能。

第二方面，本申请提供的一种人头检测模型的生成装置，采用如下的技术方案：

一种人头检测模型的生成装置，包括：

获取模块，用于获取训练样本集，所述训练样本集中的训练样本包括样本图像；

训练图像生成模块，用于根据所述样本图像得到第一训练图像以及第二训练图像，所述第一训练图像包含头部正例训练样本，所述第二训练图像包含手部负例训练样本；以及，

训练模块，用于根据所述第一训练图像以及第二训练图像对初始模型进行训练，得到人头检测模型。

第三方面，本申请提供的一种人头检测模型，采用如下的技术方案：

一种人头检测模型，包括：

第一子模块，用于获取训练样本集中训练样本包括的样本图像；

第二子模块，用于判断所述样本图像中是否包含头部正例训练样本，如果是，则生成第一训练图像；

第三子模块，用于判断所述样本图像中是否包含手部负例训练样本，如果是，则生成第二训练图像；

第四子模块，将第一训练图像与第二训练图像进行数据增强，生成训练图片；所述训练图片包括检测头部目标的位置信息；

第五子模块，用于判断训练图片中是否包含头部正例训练样本，并在判断为是时输出检测结果信息。

通过采用上述技术方案，在训练样本集加入手部负例训练样本和头部正例训练样本，有效减少在检测过程中将手部误检为头部的可能，从而便于提高人头检测的精度；另外，对第一训练图像以及第二训练图像进行数据增强，便于提高样本的丰富度，从而便于进一步提高人头检测的精度。

第四方面，本申请提供的一种基于人头检测模型的人头检测方法，采用如下的技术方案：

一种基于人头检测模型的人头检测方法，所述人头检测方法基于上述人头检测模型，包括：

获取待识别图像并将所述待识别图像发送至人头检测模型；

根据所述人头检测模型，判断所述待识别图像中是否包含头部正例训练样本，如果是，则输出检测结果信息。

通过采用上述技术方案，获取目标图像，将目标图像输入至人头检测模型，基于人头检测模型判断目标图像中是否包含头部正例训练样本，如果是，则证明该人头伸出栏杆外，便于帮助学校找到做出危险动作的学生。

附图说明

图1是本申请其中一实施例示出的系统架构的流程图。

图2是本申请其中一实施例示出的人头检测模型的生成方法的流程图。

图3是本申请其中一实施例示出的训练图片的示意图。

图4是本申请其中一实施例示出的最终训练图片的示意图。

图5是本申请其中一实施例示出的最终训练图片区域划分的示意图。

图6是本申请其中一实施例示出的人头检测模型的生成装置的结构框图。

图7是本申请其中一实施例示出的人头检测模型的结构框图。

附图标记说明：1、终端设备；2、网络；3、服务器；4、获取模块；5、训练图像生成模块；6、训练模块。

具体实施方式

下面结合附图和对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互结合。

首先，对本申请实施例涉及的名词进行介绍。

正例训练样本，为对目标图像进行查询时得到的正确查询结果。

负例训练样本，为对目标图像进行查询时得到的错误查询结果。

Mosaic数据增强，是将四张图片，通过随机缩放、随机裁剪、随机排布的方式进行拼接。随机使用4张图片，随机缩放，再随机分布进行拼接，大大丰富了检测数据集；而且直接计算4张图片的数据，使得Mini-batch大小并不需要很大，一个GPU就可以达到比较好的效果。

图1示出了可以应用在本申请的实施例的用于生成人头检测模型的方法或用于生成人头检测模型的装置的实施例的示例性系统架构。

如图1所示，系统架构可以包括终端设备1、网络2和服务器3，网络2用以在终端设备1和服务器3之间提供通信链路的介质，网络2可以包括各种连接类型，例如有线、无线通信或者光纤光缆等。

用户可以使用终端设备1通过网络2与服务器3交互，以接收或发送数据等。

终端设备1可以是硬件，也可以是软件。当终端设备1为硬件时，可以是具有通信功能的各种电子设备，包括但不限于智能手机、平板电脑及台式计算机等等。当终端设备1为软件时，可以安装在上述所列举的电子设备中。

服务器3可以是提供各种服务的服务器3，例如对终端设备1发送的图像进行处理的后台服务器，并将处理结果反馈给终端设备1。作为示例，服务器3可以是云端服务器，也可以是物理服务器。

还需要说明的是，本申请的实施例所提供的模型的生成方法可以由服务器3执行，也可以由终端设备1执行，还可以由服务器1和终端设备3彼此配合执行。相应地，模型的生成装置包括的各个部分(例如各个单元、子单元、模块、子模块)可以全部设置于服务器3中，也可以全部设置于终端设备1中，还可以分别设置于服务器3和终端设备1中。

应该理解，图1中的终端设备1、网络2和服务器3的数目仅仅是示意性的；根据实现需要，可以选择任意数目的终端设备1、网络2和服务器3。

本申请实施例公开了一种人头检测模型的生成方法。本实施例主要以该方法应用于一定运算能力的电子设备中来举例说明，该电子设备可以是图1示出的服务器。

如图2所示，作为人头检测模型的生成方法的一种实施方式，包括以下步骤：

S1、获取初始模型和训练样本集，训练样本集包括样本图像，样本图像中包含头部正例训练样本、头部标注信息、手部负例训练样本以及手部标注信息。

其中，初始模型可以是待进行训练的模型，也可以是未完成训练的模型。作为示例，初始模型可以为卷积神经网络。

具体的，训练样本集可以是包含头部正例训练样本和手部负例训练样本的图像，也可以是不包含头部正例训练样本和手部负例训练样本的图像。头部正例训练样本可以是对人体进行拍摄而得到的图像中所呈现的被拍摄的人体头部的特征，手部负例训练样本可以是对人体进行拍摄而得到的图像中所呈现的被拍摄的人体手部的特征。头部标注信息为头部正例训练样本在样本图像中位置的位置坐标，手部标注信息为手部负例训练样本在样本图像中位置的位置坐标。

作为训练样本集的获取方法的一种实施方式，模型的生成装置可以获取训练样本集。其中模型的生成装置可以部署于终端设备上，也可以部署于服务器上。

S2、根据样本图像得到第一训练图像与第二训练图像，其中，第一训练图像包含头部正例训练样本与头部标注信息，第二训练图像包含手部负例训练样本。

作为第一训练图像或第二训练图像的获取方法的一种实施方式，对样本图像进行标注生成样本图像标注框，对样本图像标注框对应的样本图像进行抠图，得到第一训练图像或第二训练图像，同时，取消第二训练图像中的手部负例训练样本的手部标注信息。

其中，用户可以根据需求，对样本图像进行自定义标注图像区域，并在图像区域的周围设置矩形框，通过移动或缩小矩形框减少矩形框中的干扰信息，得到样本图像标注框。

需要说明的是，矩形框的初始位置可以通过关键点来确定，若只有一个关键点，则关键点为矩形框的中心点，在确定矩形框的长度和宽度后，通过确定关键点的位置即可得到矩形框的位置信息；若有两个关键点，则关键点可以为矩阵框任意对角线上的两点。为减少矩形框中的干扰信息对训练结果的影像，可以移动或缩小矩形框，得到样本图像标注框。其中样本图像标注框内的图像区域通常是一个包含有头部正例训练样本或手部负例训练样本的大致范围，并将样本图像标注框内的图像区域作为抠图区域抠出。

作为抠图区域的设定方法的一种实施方式，抠图区域的范围满足如下公式：

其中，x_label-min为样本图像标注框的x轴的最小值，x_label-max为样本图像标注框的x轴的最大值，y_label-min为样本图像标注框的y轴的最小值，y_label-max为样本图像标注框的y轴的最大值，width为训练图像的宽，height为训练图像的高，a为自定义系数，可以根据实际情况定义，例如a＝0.5。

具体的，以样本图像标注框的左上角的位置点为原点，x_label-min为样本图像标注框的左上角位置点的x轴坐标，y_label-min为样本图像标注框的左上角位置点的y轴坐标，x_label-max为样本图像标注框的右下角位置点的x轴坐标，y_label-max为样本图像标注框的右下角位置点的y轴坐标。

S3、根据第一训练图像以及第二训练图像对初始模型进行训练，得到人头检测模型。

在训练时，对标注有头部标注信息的第一训练图像进行训练，没有标注的图像被认为是不需要识别目标，有效减少了原有模型中将手部误检为头部的可能，从而便于提高人头检测的精度。

具体的，利用机器学习算法，将训练图片作为初始模型的输入数据，得到判别信息，判别信息可以包括头部正例训练样本的位置坐标。将判别信息和头部标注信息进行比较，根据损失函数得到损失值，基于该损失值，判断训练的人头检测模型是否收敛。

具体可以为：判断该损失值是否小于预设的阈值，如果是，则判定训练的人头检测模型收敛，得到人头检测模型；如果否，则判断训练的人头检测模型未收敛，并调整人头检测模型的参数，继续对人头检测模型进行训练，直至损失值小于预设的阈值。

作为人头检测模型生成方法的另一种实施方式，步骤S3具体包括以下步骤：

S31、对第一训练图像以及第二训练图像进行数据增强，并生成训练图片；训练图片中包含头部正例训练样本、手部负例训练样本以及头部标注信息；

具体的，对第一训练图像进行Mosaic数据增强，并保留头部标注信息；对第二训练图像进行Mosaic数据增强，并取消手部标注信息。

S32、根据训练图片以及头部标注信息对初始模型进行训练得到人头检测模型。

在训练时，对训练图片中标注有头部标注信息的目标物进行训练，没有标注的图像被认为是不需要识别目标，有效减少了原有模型中将手部误检为头部的可能，从而便于提高人头检测的精度。

作为检测头部标注信息的获取方法的一种实施方式，包括：

x_new-hand-max＝x_new-hand-min+(x_label-max-x_label-min)；

y_new-hand-max＝y_new-hand-min+(y_label-max-y_label-min)；

如图3所示，作为训练图片中第一训练图像和/或第二训练图像位置的获取方法的一种实施方式，包括：

其中，x为第一训练图像或第二训练图像的左上角位置点的x轴坐标，y为第一训练图像或第二训练图像的左上角位置点的y轴坐标，width_m为第一训练图像或第二训练图像的宽，height_m为第一训练图像或第二训练图像的高，num为第一训练图像或第二训练图像的放置序号，％表示取余数，

表示向下取整数。例如图片左上角的训练图片的放置序号为0，右上角的训练图片的放置序号为1，左下角的训练图片的放置序号为2，右下角的训练图片的放置序号为3。

举例来说，训练图片的右上角放置有第一训练图像，则num为1，若width_m＝90mm，height_m＝100mm，则x＝90mm/2×(1％2)＝45mm，y＝100mm/2×(1/2)＝0mm，该第一训练图像的位置坐标为(45mm,0mm)。

将第一训练图像和/或第二训练图像进行Mosaic数据增强，生成训练图片后，且该训练图片中第一训练图像和/或第二训练图像的左上角位置相对固定，便于判断训练图片中是否包含头部正例训练样本。

如图4所示，作为人头检测模型生成方法的又一种实施方式，获取背景负例训练样本，将该背景负例训练样本与训练图片进行拟合。且背景负例训练样本为不包含手部负例训练样本和头部正例训练样本的图像。

生成训练图片后，由于头部或手部所占区域较小，因此会导致训练图片中绝大部分都是灰色区域，在检测训练图片中是否包含头部正例训练样本时容易产生干扰，容易将背景图片识别为头部整理训练样本，导致识别精准确度降低。通过获取背景负例训练样本，并将背景负例训练样本与训练图片进行拟合，有效去除背景图片的影响，大大降低误检概率，提高检测精度。

如图4所示，作为人头检测模型生成方法的又一种实施方式，还包括：获取训练图片中的第一训练图像和/或第二训练图像的左上角坐标，并对该左上角坐标进行调节，得到最终训练图片。

作为第一训练图像和/或第二训练图像的左上角坐标的调节方法的一种实施方式，该左上角坐标调节的范围满足如下公式：

其中，β和γ为函数自动生成的随机整数。为了避免训练图像超出规定范围，两个随机整数都有如上的范围限制，有效减少出现训练图像重叠的可能。同时，有效减少因第一训练图像和/或第二训练图像的左上角位置相对固定而不利于模型的泛化能力的情况。

其中，泛化能力(generalization ability)，是指机器学习算法对新鲜样本的适应能力；学习的目的是学到隐含在数据背后的规律，对具有同一规律的学习集以外的数据，经过训练的网络也能给出合适的输出，该能力称为泛化能力。

具体的，如图5所示，通过上述左上角坐标的调节方法将最终训练图片平均分为四个区域，即左上角区域、右上角区域、左下角区域以及右下角区域，并对第一训练图像和/或第二训练图像的左上角坐标进行范围限制，使得第一训练图像或第二训练图像在相对应的区域内进行移动。

作为对上述人头检测模型的生成方法的实现，本申请实施例还公开了一种人头检测模型的生成装置，该生成装置可以应用于各种电子设备中。

如图6所示，作为人头检测模型的生成装置的一种实施方式，包括：

获取模块4，用于获取训练样本集，所述训练样本集中的训练样本包括样本图像；样本图像中包含头部正例训练样本、头部标注信息、手部负例训练样本以及手部标注信息；

训练图像生成模块5，用于根据样本图像得到第一训练图像以及第二训练图像，第一训练图像包含头部正例训练样本，所述第二训练图像包含手部负例训练样本；以及，

训练模块6，用于根据第一训练图像以及第二训练图像对初始模型进行训练，得到人头检测模型。

在训练时，训练模块6对标注有头部标注信息的第一训练图像进行训练，没有标注的第二训练图像被认为是不需要识别目标，有效减少了原有模型中将手部误检为头部的可能，从而便于提高人头检测的精度。

基于上述人头检测模型的生成方法以及生成装置，本申请实施例还公开了一种人头检测模型。

如图7所示，一种人头检测模型包括：

第一子模块，用于获取训练样本集中的训练样本包括的样本图像；

第二子模块，用于获取所述样本图像，并判断所述样本图像中是否包含头部正例训练样本，如果是，则生成第一训练图像；

第三子模块，用于获取所述样本图像，并判断所述样本图像中是否包含手部正例训练样本，如果是，则生成第二训练图像；

第四子模块，将第一训练图像与第二训练图像进行Mosaic数据增强，生成训练图片；其中，训练图片基于Yolov5的以及Mosaic数据增强算法生成。

第五子模块，用于判断训练图片中相应的区域内是否包含头部正例训练样本，并输出检测结果信息。

基于上述人头检测模型，本申请实施例还公开了一种基于人头检测模型的人头检测方法。

一种基于人头检测模型的人头检测方法包括：获取目标图像，将目标图像输入至预先训练的人头检测模型，判断目标图像中是否包含头部正例训练样本，如果是，则输出检测结果信息。

具体的，将目标图像输入至人头检测模型，基于人头检测模型判断目标图像中是否包含头部正例训练样本，如果是，则证明该人头伸出栏杆外，便于帮助学校找到做出危险动作的学生。

以上均为本申请的较佳实施例，并非依此限制本申请的保护范围，故：凡依本申请的结构、形状、原理所做的等效变化，均应涵盖于本申请的保护范围之内。

Claims

1.一种人头检测模型的生成方法，其特征在于，包括：

2.根据权利要求1所述的一种人头检测模型的生成方法，其特征在于，还包括：

3.根据权利要求1所述的一种人头检测模型的生成方法，其特征在于，所述第一训练图像或第二训练图像的获取方法包括：

所述抠图范围满足如下公式：

x_min≥0；

x_max≤width；

y_min≥0；

y_max≤height；

4.根据权利要求1或3所述的一种人头检测模型的生成方法，其特征在于，还包括：所述检测头部目标的位置信息的获取方法包括：

x_new-hand-max＝x_new-hand-min+(x_label-max-x_label-min)；

y_new-hand-max＝y_new-hand-min+(y_label-max-y_label-min)；

5.根据权利要求1所述的一种人头检测模型的生成方法，其特征在于，还包括，所述训练图片中第一训练图像或第二训练图像的左上角坐标的获取方法包括：

6.根据权利要求5所述的一种人头检测模型的生成方法，其特征在于，还包括：

7.根据权利要求6所述的一种人头检测模型的生成方法，其特征在于，所述第一训练图像和/或第二训练图像的左上角坐标的调节范围满足如下公式：

其中，β和γ为函数自动生成的随机整数。

8.一种人头检测模型的生成装置，其特征在于，包括：

获取模块(4)，用于获取训练样本集，所述训练样本集中的训练样本包括样本图像；

训练图像生成模块(5)，用于根据所述样本图像得到第一训练图像以及第二训练图像，所述第一训练图像包含头部正例训练样本，所述第二训练图像包含手部负例训练样本；以及，

训练模块(6)，用于根据所述第一训练图像以及第二训练图像对初始模型进行训练，得到人头检测模型。

9.一种人头检测模型，其特征在于，包括：

10.一种基于人头检测模型的人头检测方法，其特征在于，所述人头检测方法基于权利要求9任一所述的人头检测模型，包括：

获取待识别图像并将所述待识别图像发送至人头检测模型；