CN115331263A

CN115331263A - 鲁棒的姿态估计方法及其在朝向判断的应用及相关方法

Info

Publication number: CN115331263A
Application number: CN202211139036.9A
Authority: CN
Inventors: 刘偲; 姜文韬; 张天宇; 杨山; 李波; 张永飞
Original assignee: Beihang University
Current assignee: Beihang University
Priority date: 2022-09-19
Filing date: 2022-09-19
Publication date: 2022-11-11
Anticipated expiration: 2042-09-19
Also published as: CN115331263B

Abstract

本发明提供了一种鲁棒的姿态估计方法及其在朝向判断的应用及相关方法，首先训练鲁棒的人体姿态估计算法，使用人体姿态模型对输入图片进行人体关键点检测。该鲁棒的人体姿态估计算法将全局人体关键点检测以及人体局部部位关键点检测进行融合，输出鲁棒的人体姿态。然后基于输出的人体姿态，可以计算人体水平向量与垂直向量以及关键肢体的朝向和长度，从而对人体进行快速且具有可解释性的人体朝向判断。通过检测到关键点的个数以及置信度则可以进行人体图像质量评价。

Description

鲁棒的姿态估计方法及其在朝向判断的应用及相关方法

技术领域

本发明涉及计算机视觉技术领域，具体涉及使用深度神经网络进行人体姿态估计并使用结果辅助下游人体分析任务的方法。

背景技术

当前的人体姿态估计模型对于某些人体关键局部的关键点估计准确度不高，导致整体结果不够鲁棒。另一方面，针对人体进行朝向判断是一个较少被研究的任务，当前方法通常通过单独的模型分别对人体朝向进行判断。而在现有技术中，通过单独模型对两个任务进行判断需要的时间开销较多，且没有中间表示进行转化，导致精度不高。

因此，如何提供一种能够得到鲁棒的人体关键点，以及如何使用得到的关键性信息以及置信度对人体朝向进行识别的应用及相关方法是本领域技术人员亟需解决的问题。

发明内容

有鉴于此，本发明首先训练鲁棒的人体姿态估计算法，然后基于人体姿态对行人进行快速且具有可解释性的人体朝向以及人体图像质量评价。

为了实现上述目的，本发明采用如下技术方案：

本发明首先公开了一种鲁棒的姿态估计方法，包括如下步骤：

S1、对人体图片I进行人体部位解析，得到集合{I _p}，其中I _p表示不同的人体部位图片；

S2、将人体图片I输入全身人体姿态估计网络PoseNet，预测得到全身关键点结果，包括：全身人体关键点热力图k _i以及置信度c _i；

S3、将人体部位图片I _p输入仿射学习变换网络，进行仿射变换学习，得到转向偏正的人体部位图片集合{I _p ^’}；

S4、将人体部位图片集合{I _p ^’}输入人体部件关键点估计网络PartNet，预测得到部位关键点结果，包括：每个部位I _p ^’所包含的部位人体关键点热力图

以及置信度

；

S5、对全身关键点结果和部位关键点结果进行加权融合，得到鲁棒的人体姿态关键点识别结果。

优选的，所述全身人体关键点k _i和部位人体关键点

从属于相同的人体关键点集合，所述人体关键点集合包含每个人体部位图片中的人体关键点。

优选的，所述{I _p}至少包括以下人体部位的图片：左手、左下臂、左上臂、右手、右下臂、右上臂、左脚、左小腿、左大腿、右脚、右小腿、右大腿和头部；所述人体关键点集合至少包括以下人体部位的关键点：鼻子、左眼、右眼、左耳、右耳、左肩、右肩、左肘、右肘、左腕、右腕、颈部、左髋、右髋、左膝、右膝、左踝和右踝。

优选的，还包括根据鲁棒的人体姿态关键点识别结果进行人体图片

质量分类的步骤：

获取所述鲁棒的人体姿态关键点识别结果中设定人体部位图片中所有关键点的置信度求和，若所有部位的求和置信度低于设置的阈值，则赋予该人体图片I低质量标签。

本发明其次还公开了一种所述的鲁棒的姿态估计方法在识别图片中人体朝向的应用，利用所述鲁棒的姿态估计方法得到的鲁棒的人体姿态关键点识别结果，检测所述人体图片I中的人体朝向。

本发明最后还公开了一种图片中人体朝向的识别方法，包括如下步骤：

S2、将人体图片I输入全身人体姿态估计网络

，预测得到全身关键点结果，包括：全身人体关键点k _i以及置信度c _i；

S4、将人体部位图片集合{I _p ^’}输入人体部件关键点估计网络PartNet，预测得到部位关键点结果，包括：每个部位I _p ^’所包含的部位人体关键点

以及置信度

；

S5、对全身关键点结果和部位关键点结果进行加权融合，得到鲁棒的人体姿态关键点识别结果；

S6、获取鲁棒的人体姿态关键点识别结果中以下人体部位的关键点：左肩、右肩、颈部、左髋、右髋和鼻子，计算左肩关键点至右肩关键点的长度一，以及颈部关键点到置信度不为零的左髋/右髋关键点的长度二，计算长度一和长度二的比例判断人体图片I中行人朝向是否为侧面，然后再根据鼻子关键点向量的夹角判断人体图片I中行人的朝向是左朝向或者右朝向；

计算人体水平向量和人体垂直向量之间的夹角d，根据夹角d的值判断人体图片I中行人的朝向为正面或者背面；其中，由左肩关键点到右肩关键点构成人体水平向量，由颈部关键点到左髋关键点构成人体左垂直向量，由颈部关键点到右髋关键点构成人体右垂直向量，人体左垂直向量和人体右垂直向量求和得到人体垂直向量。

优选的，所述S6之前，还包括：筛选所述鲁棒的人体姿态关键点识别结果中预设的关键点，根据该关键点的置信度与阈值的大小关系，判断所述人体图片I是否属于未知朝向，若否则执行所述S6。

优选的，还包括根据鲁棒的人体姿态关键点识别结果进行人体图片I质量分类的步骤：根据所述S6得到的行人朝向信息，若朝向被判定为未知朝向，则赋予该人体图片I低质量标签。

经由上述的技术方案可知，与现有技术相比，本发明的有益效果包括：

本发明通过先对输入人体图片进行部件解析，对全局关键点以及局部关键点分别预测并融合，输出鲁棒的人体姿态作为中间表示方式。使用得到的关键性信息以及置信度基于输出的人体姿态，可以计算人体水平向量与垂直向量以及关键肢体的朝向和长度，从而对人体进行快速且具有可解释性的人体朝向判断。通过检测到关键点的个数以及置信度则可以进行人体图像质量评价。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图；

图1为本发明实施例提供的鲁棒的姿态估计方法的流程图；

图2为本发明实施例提供的图片中人体朝向识别方法的流程图；

图3为本发明实施例提供的图片中人体朝向识别方法的执行过程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例一

本实施例公开了一种鲁棒的姿态估计方法，首先训练鲁棒的人体关键点检测模型，其次将人体图片进行人体部位图片拆解，并分别进行关键点估计，其中对人体部件图片进行仿射变换旋转的学习，让网络更加鲁棒地检测人体关键点。具体包括如下执行步骤：

S1、对人体图片I进行人体部位解析，将其分为13个类别，得到集合{I _p}，其中I _p表示不同的人体部位图片。

在一个实施例中，{I _p}至少包括以下人体部位的图片：左手、左下臂、左上臂、右手、右下臂、右上臂、左脚、左小腿、左大腿、右脚、右小腿、右大腿和头部。

S2、将人体图片I输入全身人体姿态估计网络PoseNet，预测得到全身关键点结果，包括：全身人体关键点k _i以及置信度c _i，则有

其中

包括17个人体关键点，人体关键点集合至少包括以下人体部位的关键点：鼻子、左眼、右眼、左耳、右耳、左肩、右肩、左肘、右肘、左腕、右腕、颈部、左髋、右髋、左膝、右膝、左踝和右踝。PostNet由10层restnet构成，接受图片输入后预测每个关键点的热力图（heatmap），由训练数据得到的真实热力图直接监督。

在一个实施例中，全身人体关键点k _i和部位人体关键点

从属于相同的人体关键点集合，人体关键点集合包含每个人体部位图片中的人体关键点。

S3、在对人体部件图片进行训练时，将人体部位图片I _p输入仿射学习变换网络，进行仿射变换学习，得到转向偏正的人体部位图片集合{I _p ^’}。

对每个输入人体部件

，

里包含的仿射学习变换网络AffNet对其学习仿射变换矩阵M_p。通过对人体部件图片应用该矩阵，可得到I _p ^’。具体则有：

该操作使得输入

的图片转向偏正，可使得检测结果更加精确。

S4、将人体部位图片集合{I _p ^’}输入人体部件关键点估计网络PartNet，PartNet的结构与PoseNet一致。预测得到部位关键点结果，包括：每个部位I _p ^’所包含的部位人体关键点

以及置信度

，则有：

其中每个人体部件图片

均包含特定的人体关键点，其中“鼻子”、“左眼”、“右眼”、“左耳”、“右耳”、“脖子”属于“头部”；“左肩”属于“左上臂”；“左肘”属于“左下臂”；“右肩”属于“右上臂”；“右肘”属于“右下臂”；“左腕”属于“左手”；“右腕”属于“右手”；“左髋”属于“左大腿”；“右髋”属于“右大腿”；“左膝”属于“左小腿”；“右膝”属于“右小腿”；“左踝”属于“左脚”；“右踝”属于“右脚”。

S5、通过前面步骤得到的全图人体关键点热力图以及置信度

，以及部件网络得到的人体关键点热力图以及置信度

，对两种结果以手工权值

进行加权融合，得到最终的鲁棒结果，即人体关键点信息：

。

在一个实施例中，还包括根据鲁棒的人体姿态关键点识别结果进行人体图片

质量分类的步骤：

其中一种质量分类方法为：获取鲁棒的人体姿态关键点识别结果中设定人体部位图片中所有关键点的置信度求和，若所有部位的求和置信度低于设置的阈值，则赋予该人体图片I低质量标签。

例如：对一幅行人图像，根据生成的人体关键点信息，取头部所有关键点的置信度求和，一般包括“鼻子”、“左眼”、“右眼”、“左耳”、“右耳”等关键点，若所有部位的求和置信度低于设置的阈值T_head，则将该行人图像标记低质量标签。

对一幅行人图像，根据所述步骤1生成人体关键点信息，取上半身所有关键点的置信度求和，一般包括“左肩”、“右肩”、“左肘”、“右肘”、“左腕”、“右腕”、“脖子”，若所有部位的求和置信度低于设置的阈值T_up，则将该行人图像标记低质量标签。

对一幅行人图像，根据所述步骤1生成人体关键点信息，取全身所有关键点的置信度求和，一般包括“鼻子”、“左眼”、“右眼”、“左耳”、“右耳”、“左肩”、“右肩”、“左肘”、“右肘”、“左腕”、“右腕”、“脖子”、“左髋”、“右髋”、“左膝”、“右膝”、“左踝”、“右踝”，若所有部位的求和置信度低于设置的阈值T_all，则将该行人图像标记低质量标签。

实施例二

本实施例公开了一种的鲁棒的姿态估计方法在识别图片中人体朝向的应用，利用鲁棒的姿态估计方法得到的鲁棒的人体姿态关键点识别结果，检测人体图片I中的人体朝向。

实施例三

本实施例公开了一种图片中人体朝向的识别方法，包括如下步骤，其中S1-S5的具体实施方式与实施例一相同：

S2、将人体图片I输入全身人体姿态估计网络

以及置信度

；

在一个实施例中，S6之前，还包括：筛选鲁棒的人体姿态关键点识别结果中预设的关键点，根据该关键点的置信度与阈值的大小关系，判断人体图片I是否属于未知朝向，若否则执行S6。

例如，根据S1-S5生成的人体关键点信息，先判断行人朝向是否为未知朝向，从上半身所有关键点的置信度中挑选出的最小置信度低于设置的阈值a，则将该行人的朝向归于未知朝向。参见图3所示，包括如下步骤：

S601：根据提取人体关键点信息，如果肩和髋关节的关键点置信度都不为0，则从中选择最小的置信度，如果只有左肩和右肩关键点的置信度都不为0，则从中挑选最小的置信度。

S602：根据S601中选择的最小置信度，如果该最小置信度低于设定的阈值a，则判断其朝向为未知朝向。

在一个实施例中，根据S601-S602的行人朝向判断结果，如果其不是未知朝向，则根据肩膀的长度和颈部到置信度不为零的髋关节关键点的长度的比例判断行人朝向是否为侧面，然后再根据鼻子向量的夹角判断行人的朝向是左朝向还是右朝向，具体执行步骤包括：

S611：根据提取人体关键点信息，计算左右肩关键点之间的长度l，然后再计算颈部关键点到置信度不为零的髋关节关键点之间的距离d，二者之间的比值l/d小于设定的阈值b则判断其为侧面，否则执行S612。

S612：根据S611的计算结果，计算鼻子向量夹角。如果鼻子关键点置信度为0，则使用置信度不为0的耳朵或者眼睛关键点信息代替鼻子关键点。根据提取人体关键点信息，计算颈部和鼻子两个关键点组成的向量m，颈部和左肩两个关键点组成的向量n，然后计算两个向量之间的夹角c，如果0< c <180，则人体朝向判断为右朝向，如果360> c >180，则人体朝向判断为左朝向。

需要说明的是，鼻子关键点向量是由鼻子的关键点坐标减去颈部关键点坐标得到。

鼻子关键点向量的夹角计算过程为：计算颈部和鼻子两个关键点组成的向量m，颈部和左肩两个关键点组成的向量n，然后计算两个向量之间的夹角c，夹角计算公式如下：

在一个实施例中，根据提取人体关键点信息的到人体水平向量和人体垂直向量之间的夹角d，根据夹角d的值判断人体的朝向为正面或者背面，具体执行步骤包括：

S621：由左侧肩关键点起到右侧肩关键点止构成人体水平向量i，由颈部关键点起到左髋关节关键点止得到人体左垂直向量lv，由颈部关键点起到右髋关节关键点止得到人体右垂直向量rv，lv和rv求和得到人体垂直向量v，计算人体水平向量i和人体垂直向量v之间的夹角e。

S622：根据上述S621计算结果，如果e >= 270-阈值f 且e <= 270+阈值f ,则判断该行人为正朝向。如果e >= 90-阈值f 且e <= 90+阈值f ,则判断该行人为正朝向。

在一个实施例中，如果人体关键点信息根据S611-S612、S621-S622均未能对其进行朝向分类，则将人体朝向判定为未知朝向。

在一个实施例中，还包括根据鲁棒的人体姿态关键点识别结果进行人体图片I质量分类的步骤：根据S6得到的行人朝向信息，若朝向被判定为未知朝向，则赋予该人体图片I低质量标签。

在一个实施例中，对一幅行人图像，若没有被标记低质量标签，则选为备用图像，可被用于后续的跨摄像机目标跟踪、目标聚档等各种应用。

以上对本发明所提供的非弹道目标可达区快速预测方法进行了详细介绍，本实施例中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上，本说明书内容不应理解为对本发明的限制。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本实施例中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本实施例所示的这些实施例，而是要符合与本实施例所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种鲁棒的姿态估计方法，其特征在于，包括如下步骤：

以及置信度

；

2.根据权利要求1所述的鲁棒的姿态估计方法，其特征在于，所述全身人体关键点k _i和部位人体关键点

3.根据权利要求2所述的鲁棒的姿态估计方法，其特征在于，所述{I _p}至少包括以下人体部位的图片：左手、左下臂、左上臂、右手、右下臂、右上臂、左脚、左小腿、左大腿、右脚、右小腿、右大腿和头部；所述人体关键点集合至少包括以下人体部位的关键点：鼻子、左眼、右眼、左耳、右耳、左肩、右肩、左肘、右肘、左腕、右腕、颈部、左髋、右髋、左膝、右膝、左踝和右踝。

4.根据权利要求1所述的鲁棒的姿态估计方法，其特征在于，还包括根据鲁棒的人体姿态关键点识别结果进行人体图片

质量分类的步骤：

5.一种权利要求1-3中任一项所述的鲁棒的姿态估计方法在识别图片中人体朝向的应用，其特征在于，利用所述鲁棒的姿态估计方法得到的鲁棒的人体姿态关键点识别结果，检测所述人体图片I中的人体朝向。

6.一种图片中人体朝向的识别方法，其特征在于，包括如下步骤：

S2、将人体图片I输入全身人体姿态估计网络Posenet，预测得到全身关键点结果，包括：全身人体关键点k _i以及置信度c _i；

以及置信度

；

7.根据权利要求6所述的鲁棒的姿态估计方法，其特征在于，所述S6之前，还包括：筛选所述鲁棒的人体姿态关键点识别结果中预设的关键点，根据该关键点的置信度与阈值的大小关系，判断所述人体图片I是否属于未知朝向，若否则执行所述S6。

8.根据权利要求7所述的鲁棒的姿态估计方法，其特征在于，还包括根据鲁棒的人体姿态关键点识别结果进行人体图片I质量分类的步骤：根据所述S6得到的行人朝向信息，若朝向被判定为未知朝向，则赋予该人体图片I低质量标签。