CN112528850B

CN112528850B - 人体识别方法、装置、设备和存储介质

Info

Publication number: CN112528850B
Application number: CN202011448336.6A
Authority: CN
Inventors: 卢子鹏; 王健; 袁宇辰; 孙昊; 丁二锐
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-12-11
Filing date: 2020-12-11
Publication date: 2024-06-04
Anticipated expiration: 2040-12-11
Also published as: EP3905123A3; US11854237B2; EP3905123A2; US20210312172A1; CN112528850A

Abstract

本申请公开了一种人体识别方法、装置、设备和存储介质，涉及计算机视觉和深度学习等人工智能技术领域。具体实现方案包括：将待识别图像输入人体检测模型，得到多个预选检测框；根据人体关键点检测模型，从各预选检测框中分别识别出多个关键点，并得到各关键点的关键点得分；根据关键点得分满足关键点阈值的关键点的数量，从各预选检测框中确定出目标检测框；将目标检测框输入人体关键点分类模型，得到对待识别图像的人体识别结果。本申请实施例的技术方案可以充分利用人体关键点的拓扑信息，提升识别准确率和召回率。

Description

人体识别方法、装置、设备和存储介质

技术领域

本申请涉及人工智能技术领域，尤其涉及计算机视觉和深度学习领域。

背景技术

人体识别广泛应用于多种场景中，如各种安防监控场景。现有技术中，主要基于人体检测框架和行人检测集，训练人体检测模型进行人体识别。由于这种方式只是学习人体轮廓、纹理的语义信息，缺少肢体间的关系、形态信息机制，因此，在复杂的场景中会出现各种误检问题。

发明内容

本申请提供了一种人体识别方法、装置、设备和存储介质。

根据本申请的第一方面，提供了一种人体识别方法，包括：

将待识别图像输入人体检测模型，得到多个预选检测框；

根据人体关键点检测模型，从各预选检测框中分别识别出多个关键点，并得到各关键点的关键点得分；

根据关键点得分满足关键点阈值的关键点的数量，从各预选检测框中确定出目标检测框；

将目标检测框输入人体关键点分类模型，得到对待识别图像的人体识别结果。

根据本申请的第二方面，提供了一种人体关键点分类模型的生成方法，包括：

获取正样本图像，正样本图像对应有至少一个人体标注框，人体标注框中包括关键点标注；

基于正样本图像，生成负样本图像；

将负样本图像输入人体关键点检测模型，得到负样本标注框；

根据人体标注框以及负样本标注框，训练机器学习模型，生成人体关键点分类模型。

根据本申请的第三方面，提供了一种人体识别装置，包括：

预选检测框确定模块，用于将待识别图像输入人体检测模型，得到多个预选检测框；

关键点检测模块，用于根据人体关键点检测模型，从各预选检测框中分别识别出多个关键点，并得到各关键点的关键点得分；

目标检测框确定模块，用于根据关键点得分满足关键点阈值的关键点的数量，从各预选检测框中确定出目标检测框；

人体识别结果确定模块，用于将目标检测框输入人体关键点分类模型，得到对待识别图像的人体识别结果。

根据本申请的第四方面，提供了一种人体关键点分类模型的生成装置，包括：

正样本图像获取模块，用于获取正样本图像，正样本图像对应有至少一个人体标注框，人体标注框中包括关键点标注；

负样本图像生成模块，用于基于正样本图像，生成负样本图像；

负样本标注框确定模块，用于将负样本图像输入人体关键点检测模型，得到负样本标注框；

训练模块，用于根据人体标注框以及负样本标注框，训练机器学习模型，生成人体关键点分类模型。

根据本申请的第五方面，提供了一种电子设备，包括：

至少一个处理器；以及

与至少一个处理器通信连接的存储器；其中，

存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行本申请任意实施例提供的方法。

根据本申请的第六方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，计算机指令用于使计算机执行本申请任意实施例提供的方法。

根据本申请的第七方面，提供了一种计算机程序产品，包括计算机程序，该计算机程序在被处理器执行时实现本申请任意实施例提供的方法。

本申请实施例的技术方案可以充分利用人体关键点的拓扑信息，提升识别准确率和召回率。

应当理解，本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征，也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是根据本申请实施例的应用场景的示意图；

图2是根据本申请实施例人体识别方法的流程图；

图3是根据本申请实施例人体识别方法的应用示例图；

图4是根据本申请实施例人体关键点分类模型的生成方法的流程图；

图5是根据本申请实施例一种实施方式的人体识别装置的框图；

图6是根据本申请实施例另一种实施方式的人体识别装置的框图；

图7是根据本申请实施例一种实施方式的人体关键点分类模型的生成装置框图；

图8是根据本申请实施例另一种实施方式的人体关键点分类模型的生成装置的框图；

图9是用来实现本申请实施例的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

图1为本申请实施例的应用场景示意图。如图1所示，终端设备101可以是硬件，如手机、平板、车载终端、便携计算机或台式计算机等具有显示屏的电子设备。当终端设备101为软件时，可安装于上述电子设备中。服务器102可以提供各种服务，例如为安装于终端设备101上的应用提供支持。本申请实施例提供的方法可以由服务器102执行，也可以由终端设备101执行，相应的与方法对应的装置可以设置于终端设备101中，也可以设置于服务器102中。其中，为了实现需要可以配置任意数量的终端设备、网络和服务器。

在一个示例中，待识别图像可以输入终端设备101中，由终端设备101执行本申请实施例的人体识别方法，进而得到人体识别结果；也可以由终端设备101发送给服务器102，由服务器102执行本申请实施例的人体识别方法，进而得到人体识别结果。

图2示出本申请实施例的人体识别方法，如图2所示，该方法包括：

步骤S201、将待识别图像输入人体检测模型，得到多个预选检测框；

步骤S202、根据人体关键点检测模型，从各预选检测框中分别识别出多个关键点，并得到各关键点的关键点得分；

步骤S203、根据关键点得分满足关键点阈值的关键点的数量，从各预选检测框中确定出目标检测框；

步骤S204、将目标检测框输入人体关键点分类模型，得到对待识别图像的人体识别结果。

示例性地，人体检测模型可以采用yolov3模型，并基于coco人体检测集训练得到。

示例性地，人体关键点检测模型可以采用resnet50作为骨干网络(backbone)，并基于coco关键点数据集训练得到。人体关键点检测模型可以对输入其的图像输出人体姿态关键点，如头部、脖子、左肩、左肘、左腕、右肩、右肘、右腕、左髋、左膝、左脚、右髋、右膝、右脚17个关键点。

示例性地，人体关键点分类模型可以采用图卷积网络(Graph ConvolutionalNetwork，GCN)，并基于coco关键点训练集训练得到。人体关键点分类模型，可以对输入其的包含关键点信息的检测框输出人体识别结果。

根据本申请实施例的方法，将待识别图像输入人体检测模型，可以得到多个预选检测框；然后基于预选检测框的大小和位置从待识别图像中提取原图特征，并将提取到的原图特征输入人体关键点检测模型，以识别出多个关键点，以及每个关键点的关键点得分。

其中，“得分”可以理解为置信度。例如，关键点得分可以理解为识别出的关键点为人体关键点的置信度。

进一步地，根据预选检测框中关键点得分满足关键点阈值的关键点的数目，从各预选检测框中确定出目标检测框；将目标检测框输入人体关键点分类模型，得到对待识别图像的人体识别结果。

其中，人体识别结果分为两种：是人体的识别结果，即该目标检测框对应的图像部分为人体图像区(本申请实施例中可以命名为第三人体图像区)；不是人体的识别结果，即该目标检测框对应的图像部分不是人体图像区。示例性地，根据目标检测框的大小和位置，从待识别图像中截取出的图像为该目标检测框对应的图像部分。

本申请实施例的人体识别方法，基于人体姿态关键点(人体关键点)辅助判别人体识别，可以充分利用人体关键点的拓扑信息，提升识别准确率和召回率。进一步地，基于关键点得分满足关键点阈值的关键点的数量，筛选出目标检测框，并根据人体关键点分类模型对目标检测框进行识别，以得到人体识别结果，可以进一步提高识别准确率。

在一种实施方式中，在步骤S201中可以包括：将待识别图像输入人体检测模型，得到多个初始检测框，以及各初始检测框的检测框得分Sbbox；在检测框得分Sbbox大于等于检测框低阈值Lbs，且小于等于检测框高阈值Hbs的情况下，将对应的初始检测框确定为预选检测框。

也就是说，将待识别图像输入人体检测模型后，可以得到多个初始检测框，以及每个初始检测框的检测框得分Sbbox。检测框得分Sbbox可以理解为：根据初始检测框的大小和位置，从待识别图像中截取出的图像部分为人体图像区(图像区中包含有人体元素)的置信度。

进一步地，设置检测框低阈值Lbs和检测框高阈值Hbs，示例性地，设置检测框低阈值Lbs≤0.1；设置检测框高阈值Hbs≥0.95。

在一个示例中，如图3所示，根据检测框得分Sbbox与检测框低阈值Lbs和检测框高阈值Hbs的关系，可以分为三种情况：

(1)在Sbbox<Lbs的情况下，过滤掉对应的初始检测框，即对应的初始检测框代表低置信度检测结果或误检；

(2)在Lbs≤Sbbox≤Hbs的情况下，将对应的初始检测框作为预选检测框，进入步骤S202；

(3)在Sbbox>Hbs的情况下，将对应的初始检测框确定为第一高置信检测框，并将根据第一高置信检测框的大小以及位置，从待识别图像中提取出(截取出)的图像部分作为人体图像区(即第一人体图像区)。

也就是说，第一人体图像区代表了是人体的人体识别结果；过滤掉的初始检测框对应的图像部分代表了不是人体的人体识别结果。

基于此，可以完成对待识别图像的初步人体识别，一方面可以过滤掉一部分初始检测框，并得到第一人体图像区，只有部分初始检测框(预选检测框)送入下一检测环节，简化了之后的检测计算量；另一方面可以得到初步的人体识别结果，包括第一人体图像区，避免高置信人体图像被漏掉。

在一种实施方式中，关键点阈值可以包括关键点低阈值Lks。在步骤S203中可以包括：在第一关键点数量KptNum大于预设数量的情况下，将对应的预选检测框确定为目标检测框；其中，第一关键点数量KptNum为关键点得分大于关键点低阈值Lks的关键点的数量。

示例性地，预设数量可以6，当然也可以为其他值，本申请实施例不作限定。

对于每个预选检测框，统计该预选检测框中关键点得分大于关键点低阈值Lks的关键点的数量，得到第一关键点数量KptNum。进而根据第一关键点数量KptNum和预设数量的关系，可以分为三种情况：

(2.1)在KptNum＝0的情况下，过滤掉对应的预选检测框，代表该预选检测框中不存在人体肢体信息；

(2.2)在KptNum>预设数量6的情况下，将对应的预选检测框确定为目标检测框，进入步骤S204；

(2.3)在0<KptNum≤预设数量6的情况下，进行第二人体图像区的确定流程。

在一种实施方式中，关键点阈值可以包括关键点高阈值Hks，上述的第二人体图像区的确定流程包括：在第二关键点数量Hkptnum大于等于第一关键点数量KptNum的预设比例的情况下，将对应的预选检测框确定为第二高置信检测框；其中，第二关键点数量Hkptnum为关键点得分大于关键点高阈值Hks的关键点的数量；根据第二高置信检测框的大小以及位置，从待识别图像中提取出第二人体图像区。

示例性地，预设比例可以为50％；可以设置关键点高阈值Hks≥0.8。

根据第二关键点数量Hkptnum与第一关键点数量KptNum的预设比例的关系，可以分为以下两种情况：

(2.3.1)在Hkptnum<50％KptNum的情况下，过滤掉对应的预选检测框，代表该预选检测框为低置信度检测框；

(2.3.2)在Hkptnum≥50％KptNum的情况下，将对应的预选检测框确定为第二高置信检测框，并将根据第二高置信检测框的大小以及位置，从待识别图像中提取出(截取出)的图像部分作为人体图像区(即第二人体图像区)。

也就是说，第二人体图像区代表了是人体的人体识别结果；过滤掉的预选检测框对应的图像部分代表了不是人体的人体识别结果。

基于此，可以完成对待识别图像的进一步人体识别，一方面可以过滤掉一部分预选检测框，并得到第二人体图像区，只有部分预选检测框(目标检测框)送入下一检测环节，简化了之后的检测计算量；另一方面可以得到进一步的人体识别结果，包括第二人体图像区，避免高置信人体图像被漏掉。

在一种实施方式中，本申请实施例的方法还可以包括：对各目标检测框进行基于关键点的非极大值抑制(Non Maximum Suppression，NMS)处理；将经过NMS处理之后的目标检测框输入人体关键点分类模型，得到人体识别结果。

在两个人体靠得非常近的情况下，对应的检测框之间的交并比(Intersection-over-Union，IoU)也比较大，如果基于检测框之间的IoU距离进行NMS处理，那么靠的近的检测框虽然代表了人体人侧框，但也会被NMS掉。

而本申请实施例基于关键点进行NMS处理，可以避免这种情况发生。由于两个相邻较近的人体对应的检测框的IoU距离虽然比较大，但往往两个人的姿态不同或者关键部位的关键点位置不同，因此通过两个检测框对应的人体各个部位关键点位置进行NMS处理，是可以将两个人体检测框区分开，进一步提升识别准确率和召回率。

示例性地，可以对高置信检测框(包括第一高置信检测框和第二高置信检测框)进行基于检测框之间的IoU距离进行NMS处理；对预选检测框和目标检测框进行基于关键点的NMS处理。

下面介绍对检测框(预先检测框或目标检测框)进行基于关键点的NMS处理的示例性流程：

根据检测框得分从大到小进行排序，直接保留得分第一的检测框为集合S；剩下每个检测框和S集合中的检测框计算关键点相似度Kptiou；设置阈值kptth，如果Kptiou<Kptth，则表示两个检测框的姿态相近，去掉该检测框，否则保留该检测框到S集合中；循环重复上述步骤，直到遍历完成以上所有检测框。保留下来的检测框都是一一对应一个人体的检测框。

其中，关键点相似度Kptiou的计算公式为:

其中，k为关键点编号；表示第一个检测框的第k个关键点的位置；表示第二个检测框的第k个关键点的位置。

图4示出根据本申请实施例的人体关键点分类模型的生成方法的流程图。如图4所示，该方法包括：

步骤S401、获取正样本图像，正样本图像对应有至少一个人体标注框，人体标注框中包括关键点标注；

步骤S402、基于正样本图像，生成负样本图像；

步骤S403、将负样本图像输入人体关键点检测模型，得到负样本标注框；

步骤S404、根据人体标注框以及负样本标注框，训练机器学习模型，生成人体关键点分类模型，人体关键点分类模型用于上述的人体识别方法。

示例性地，正样本可以采用coco关键点训练集。在coco关键点训练集中包括大量的正样本图像，且每个正样本图像都分别对应有一个或多个人体标注框，人体标注框中还包含有关键点标注。正样本图像也可以自行获取或标注，在此不作限定。

进一步地，根据正样本图像可以生成一些负样本图像，即可以从正样本图像中截取不包含人体元素的图像部分作为负样本图像；将负样本图像输入人体关键点检测模型，得到负样本标注框；基于人体标注框以及负样本标注框，训练机器学习模型，可以得到人体关键点分类模型。

示例性地，该机器学习模型可以为GCN网络。GCN网络输入用(N，C，T，M)表示，N表示为一个训练批处理(batch)的训练数目，C为特征的数目，本发明中特征有2D关键点特征(x,y,score)一共3维特征，因此C＝3；V为关键点的数目，M为人数，这里为单人，M＝1。

在一种实施方式中，在步骤S402中可以包括：在正样本图像上随机生成样本检测框；在样本检测框与每个人体标注框之间的距离均小于预设距离的情况下，根据样本检测框的大小和位置，从正样本图像中截取出负样本人体图像。

示例性地，可以在coco训练集上随机生成样本检测框negbox。样本检测框negbox与所有人体标注框计算IoU距离。在每个IoU距离均小于预设距离(如0.1)的情况下，该样本检测框negbox保留作为训练GCN网络的负样本；否则，继续循环随机生成满足条件的样本negbox。对于满足条件的可以作为负样本的样本检测框negbox，根据该样本检测框negbox的大小和位置，从对应的图像中截取出的图像部分作为负样本人体图像。

人体关键点分类模型可以以人体17个肢体关键点作为输入，根据人体关键点的拓扑信息判断该拓扑结构是否为一个人体，从而提高识别准确率。

图5示出根据本申请实施例的人体识别装置的框图。如图5所示，该装置包括：

预选检测框确定模块501，用于将待识别图像输入人体检测模型，得到多个预选检测框；

关键点检测模块502，用于根据人体关键点检测模型，从各预选检测框中分别识别出多个关键点，并得到各关键点的关键点得分；

目标检测框确定模块503，用于根据关键点得分满足关键点阈值的关键点的数量，从各预选检测框中确定出目标检测框；

人体识别结果确定模块504，用于将目标检测框输入人体关键点分类模型，得到对待识别图像的人体识别结果。

在一种实施方式中，如图6所示，预选检测框确定模块501包括：

初始检测框确定子模块601，用于将待识别图像输入人体检测模型，得到多个初始检测框，以及各初始检测框的检测框得分；

预选检测框确定子模块602，用于在检测框得分大于等于检测框低阈值，且小于等于检测框高阈值的情况下，将对应的初始检测框确定为预选检测框。

在一种实施方式中，如图6所示，该装置还包括：

第一高置信检测框确定模块603，用于在检测框得分大于检测框高阈值的情况下，将对应的初始检测框确定为第一高置信检测框；

第一人体图像区确定模块604，用于根据第一高置信检测框的大小以及位置，从待识别图像中提取出第一人体图像区。

在一种实施方式中，关键点阈值包括关键点低阈值，目标检测框确定模块503还用于：

在第一关键点数量大于预设数量的情况下，将对应的预选检测框确定为目标检测框；其中，第一关键点数量为关键点得分大于关键点低阈值的关键点的数量。

在一种实施方式中，如图6所示，该装置还包括：

第二高置信检测框确定模块605，用于在第一关键点数量大于零且小于等于预设数量，以及第二关键点数量大于等于第一关键点数量的预设比例的情况下，将对应的预选检测框确定为第二高置信检测框；其中，第二关键点数量为关键点得分大于关键点高阈值的关键点的数量；

第二人体图像区确定模块606，用于根据第二高置信检测框的大小以及位置，从待识别图像中提取出第二人体图像区。

在一种实施方式中，目标检测框为多个，如图6所示，人体识别结果确定模块504包括：

NMS处理子模块607，用于对各目标检测框进行基于关键点的非极大值抑制NMS处理；

人体识别结果确定子模块608，用于将经过NMS处理之后的目标检测框输入人体关键点分类模型，得到人体识别结果。

图7示出根据本申请实施例的一种人体关键点分类模型的生成装置的框图。如图7所示，该装置包括：

正样本图像获取模块701，用于获取正样本图像，正样本图像对应有至少一个人体标注框，人体标注框中包括关键点标注；

负样本图像生成模块702，用于基于正样本图像，生成负样本图像；

负样本标注框确定模块703，用于将负样本图像输入人体关键点检测模型，得到负样本标注框；

训练模块704，用于根据人体标注框以及负样本标注框，训练机器学习模型，生成人体关键点分类模型，人体关键点分类模型用于上述的人体识别装置。

在一种实施方式中，如图8所示，负样本图像生成模块702包括：

随机生成子模块801，用于在正样本图像上随机生成样本检测框；

截取子模块802，用于在样本检测框与每个人体标注框之间的距离均小于预设距离的情况下，根据样本检测框的大小和位置，从正样本图像中截取出负样本人体图像。

本申请实施例各装置中的各模块的功能可以参见上述方法中的对应描述，在此不再赘述。

根据本申请的实施例，本申请还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

如图9所示，是根据本申请实施例的生成方法或评估方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图9所示，该电子设备包括：一个或多个处理器901、存储器902，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图9中以一个处理器901为例。

存储器902即为本申请所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本申请所提供的生成方法或评估方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的生成方法或评估方法。

存储器902作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的生成方法或评估方法或生成装置或评估装置对应的程序指令/模块。处理器901通过运行存储在存储器902中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的生成方法或评估方法。

存储器902可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据生成方法或评估方法的电子设备的使用所创建的数据等。此外，存储器902可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器902可选包括相对于处理器901远程设置的存储器，这些远程存储器可以通过网络连接至生成方法或评估方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

生成方法或评估方法的电子设备还可以包括：输入装置903和输出装置904。处理器901、存储器902、输入装置903和输出装置904可以通过总线或者其他方式连接，图9中以通过总线连接为例。

输入装置903可接收输入的数字或字符信息，以及产生与生成方法或评估方法的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置904可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入、或者触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决传统物理主机与虚拟专用服务器(VPS)服务中，存在的管理难度大，业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种人体识别方法，包括：

将待识别图像输入人体检测模型，得到多个预选检测框；

根据人体关键点检测模型，从各所述预选检测框中分别识别出多个关键点，并得到各所述关键点的关键点得分；

根据关键点得分大于关键点低阈值的关键点的数量，从各所述预选检测框中确定出目标检测框；

将所述目标检测框输入人体关键点分类模型，得到对所述待识别图像的人体识别结果；

其中，将待识别图像输入人体检测模型，得到多个预选检测框，包括：将所述待识别图像输入所述人体检测模型，得到多个初始检测框，以及各所述初始检测框的检测框得分，其中，所述检测框得分用于指示从所述待识别图像中截取出的图像部分为人体图像区的置信度；在所述检测框得分大于等于检测框低阈值，且小于等于检测框高阈值的情况下，将对应的初始检测框确定为所述预选检测框；

其中，所述方法还包括：根据所述关键点得分大于所述关键点低阈值的关键点的数量，以及所述关键点得分大于关键点高阈值的关键点的数量，从所述预选检测框中确定第二高置信检测框；根据所述第二高置信检测框的大小以及位置，从所述待识别图像中提取出第二人体图像区。

2.根据权利要求1所述的方法，所述方法还包括：

在检测框得分大于所述检测框高阈值的情况下，将对应的初始检测框确定为第一高置信检测框；

根据所述第一高置信检测框的大小以及位置，从所述待识别图像中提取出第一人体图像区。

3.根据权利要求1所述的方法，其中，所述的根据所述预选检测框中关键点得分大于关键点低阈值的关键点的数量，从各所述预选检测框中确定出目标检测框，包括：

在第一关键点数量大于预设数量的情况下，将对应的预选检测框确定为目标检测框；其中，所述第一关键点数量为关键点得分大于所述关键点低阈值的关键点的数量。

4.根据权利要求3所述的方法，所述方法还包括：

在所述第一关键点数量大于零且小于等于所述预设数量，以及第二关键点数量大于等于所述第一关键点数量的预设比例的情况下，将对应的预选检测框确定为第二高置信检测框；其中，所述第二关键点数量为关键点得分大于所述关键点高阈值的关键点的数量。

5.根据权利要求1至4任一项所述的方法，其中，所述目标检测框为多个，所述的将所述目标检测框输入人体关键点分类模型，得到对所述待识别图像的人体识别结果，包括：

对各所述目标检测框进行基于关键点的非极大值抑制NMS处理；

将经过NMS处理之后的目标检测框输入所述人体关键点分类模型，得到所述人体识别结果。

6.一种人体关键点分类模型的生成方法，包括：

获取正样本图像，所述正样本图像对应有至少一个人体标注框，所述人体标注框中包括关键点标注；

基于所述正样本图像，生成负样本图像；

将所述负样本图像输入人体关键点检测模型，得到负样本标注框；

根据所述人体标注框以及所述负样本标注框，训练机器学习模型，生成人体关键点分类模型，所述人体关键点分类模型用于权利要求1至5任一项所述的人体识别方法。

7.根据权利要求6所述的方法，其中，基于所述正样本图像，生成负样本图像，包括：

在所述正样本图像上随机生成样本检测框；

在所述样本检测框与每个所述人体标注框之间的距离均小于预设距离的情况下，根据所述样本检测框的大小和位置，从所述正样本图像中截取出负样本人体图像。

8.一种人体识别装置，包括：

关键点检测模块，用于根据人体关键点检测模型，从各所述预选检测框中分别识别出多个关键点，并得到各所述关键点的关键点得分；

目标检测框确定模块，用于根据关键点得分大于关键点低阈值的关键点的数量，从各所述预选检测框中确定出目标检测框；

人体识别结果确定模块，用于将所述目标检测框输入人体关键点分类模型，得到对所述待识别图像的人体识别结果；

其中，预选检测框确定模块包括：初始检测框确定子模块，用于将所述待识别图像输入所述人体检测模型，得到多个初始检测框，以及各所述初始检测框的检测框得分，其中，所述检测框得分用于指示从所述待识别图像中截取出的图像部分为人体图像区的置信度；预选检测框确定子模块，用于在检测框得分大于等于检测框低阈值，且小于等于检测框高阈值的情况下，将对应的初始检测框确定为所述预选检测框；

其中，所述装置还用于：根据所述关键点得分大于所述关键点低阈值的关键点的数量，以及所述关键点得分大于所述关键点高阈值的关键点的数量，从所述预选检测框中确定第二高置信检测框；根据所述第二高置信检测框的大小以及位置，从所述待识别图像中提取出第二人体图像区。

9.根据权利要求8所述的装置，所述装置还包括：

第一高置信检测框确定模块，用于在检测框得分大于所述检测框高阈值的情况下，将对应的初始检测框确定为第一高置信检测框；

第一人体图像区确定模块，用于根据所述第一高置信检测框的大小以及位置，从所述待识别图像中提取出第一人体图像区。

10.根据权利要求8所述的装置，其中，所述目标检测框确定模块还用于：

11.根据权利要求10所述的装置，所述装置还包括：

第二高置信检测框确定模块，用于在所述第一关键点数量大于零且小于等于所述预设数量，以及第二关键点数量大于等于所述第一关键点数量的预设比例的情况下，将对应的预选检测框确定为第二高置信检测框；其中，所述第二关键点数量为关键点得分大于所述关键点高阈值的关键点的数量。

12.根据权利要求8至11任一项所述的装置，其中，所述目标检测框为多个，所述人体识别结果确定模块包括：

NMS处理子模块，用于对各所述目标检测框进行基于关键点的非极大值抑制NMS处理；

人体识别结果确定子模块，用于将经过NMS处理之后的目标检测框输入所述人体关键点分类模型，得到所述人体识别结果。

13.一种人体关键点分类模型的生成装置，包括：

正样本图像获取模块，用于获取正样本图像，所述正样本图像对应有至少一个人体标注框，所述人体标注框中包括关键点标注；

负样本图像生成模块，用于基于所述正样本图像，生成负样本图像；

负样本标注框确定模块，用于将所述负样本图像输入人体关键点检测模型，得到负样本标注框；

训练模块，用于根据所述人体标注框以及所述负样本标注框，训练机器学习模型，生成人体关键点分类模型，所述人体关键点分类模型用于权利要求8至12任一项所述的人体识别装置。

14.根据权利要求13所述的装置，其中，所述负样本图像生成模块包括：

随机生成子模块，用于在所述正样本图像上随机生成样本检测框；

截取子模块，用于在所述样本检测框与每个所述人体标注框之间的距离均小于预设距离的情况下，根据所述样本检测框的大小和位置，从所述正样本图像中截取出负样本人体图像。

15. 一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。

16.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使计算机执行权利要求1-7中任一项所述的方法。

17.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现如权利要求1-7中任一项所述的方法。