CN111046825A

CN111046825A - 人体姿态识别方法、装置、系统及计算机可读存储介质

Info

Publication number: CN111046825A
Application number: CN201911318525.9A
Authority: CN
Inventors: 汤家兴; 胡昌明; 叶立华; 郑顺利
Original assignee: Hangzhou Chenying Juntai Technology Co ltd
Current assignee: Hangzhou Chenying Juntai Technology Co ltd
Priority date: 2019-12-19
Filing date: 2019-12-19
Publication date: 2020-04-21

Abstract

本申请公开了一种人体姿态识别方法，包括获取待识别图片，并在所述待识别图片中确定人体区域；对所述人体区域进行特征提取，获得特征热点图；根据所述特征热点图获得人体关键点的坐标信息；利用预设SVM分类器对所述坐标信息进行识别处理，确定姿态类别；该人体姿态识别方法可以有效提高人体行为识别过程中的实时性。本申请还公开了一种人体姿态识别装置、系统及计算机可读存储介质，均具有上述有益效果。

Description

人体姿态识别方法、装置、系统及计算机可读存储介质

技术领域

本申请涉及计算机视觉技术领域，特别涉及一种人体姿态识别方法，还涉及一种人体姿态识别装置、系统以及计算机可读存储介质。

背景技术

人体行为识别技术是机器视觉领域的重要分支和前沿性技术，其在目前的智能应用具有重要意义，例如，可广泛应用于智能视频监控、机器人视觉、人机交互、游戏控制等领域，应用市场前景广阔。

在现有技术中，一般使用基于时空3D卷积的分类识别方法，但该种实现方式需要占用很大的显存空间，因此对计算资源要求很高，并且其实现过程需要很长的预测时间，无法有效满足实时性的要求。

因此，如何有效提高人体行为识别过程中的实时性是本领域技术人员亟待解决的问题。

发明内容

本申请的目的是提供一种人体姿态识别方法，该人体姿态识别方法可以有效提高人体行为识别过程中的实时性；本申请的另一目的是提供一种人体姿态识别装置、系统、通讯服务器以及计算机可读存储介质，也具有上述有益效果。

为解决上述技术问题，本申请提供了一种人体姿态识别方法，所述人体姿态识别方法包括：

获取待识别图片，并在所述待识别图片中确定人体区域；

对所述人体区域进行特征提取，获得特征热点图；

根据所述特征热点图获得人体关键点的坐标信息；

利用预设SVM分类器对所述坐标信息进行识别处理，确定姿态类别。

优选的，所述对所述人体区域进行特征提取，获得特征热点图，包括：

通过卷积神经网络对所述人体区域进行特征提取，获得所述特征热点图。

优选的，所述根据所述特征热点图获得人体关键点的坐标信息，包括：

根据所述特征热点图对所述待识别图片中的各所述人体关键点进行连接，获得人体关键点分布图；

在所述人体关键点分布图中获得各所述人体关键点的坐标信息。

优选的，所述根据所述特征热点图获得人体关键点的坐标信息之后，还包括：

对各所述人体关键点的坐标信息进行归一化处理，获得归一化后的坐标信息。

优选的，所述预设SVM分类器为基于径向基核函数的分类器。

优选的，所述利用预设SVM分类器对所述坐标信息进行识别处理，确定姿态类别之前，还包括：

以指定摄像头坐标系为基准，对各所述人体关键点的坐标信息进行坐标系转换，获得各所述人体关键点的标准坐标信息。

优选的，所述人体姿态识别方法还包括：

当所述待识别图片为视频信息中的视频帧时，识别获取各所述视频帧对应的姿态类别；

当所述视频帧的数量达到预设数量时，对各所述姿态类别进行数量统计，获得对应的姿态类别数量；

输出所述姿态类别数量取最大值时对应的姿态类别。

为解决上述技术问题，本申请还提供了一种人体姿态识别装置，所述人体姿态识别装置包括：

图片获取模块，用于获取待识别图片，并在所述待识别图片中确定人体区域；

特征提取模块，用于对所述人体区域进行特征提取，获得特征热点图；

坐标计算模块，用于根据所述特征热点图获得人体关键点的坐标信息；

姿态识别模块，用于利用预设SVM分类器对所述坐标信息进行识别处理，确定姿态类别。

为解决上述技术问题，本申请还提供了一种人体姿态识别系统，所述人体姿态识别系统还包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现上述任意一种人体姿态识别方法的步骤。

为解决上述技术问题，本申请还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现上述任意一种人体姿态识别方法的步骤。

本申请所提供的一种人体姿态识别方法，包括获取待识别图片，并在所述待识别图片中确定人体区域；对所述人体区域进行特征提取，获得特征热点图；根据所述特征热点图获得人体关键点的坐标信息；利用预设SVM分类器对所述坐标信息进行识别处理，确定姿态类别。

可见，本申请所提供的人体姿态识别方法，基于人体关键点检测和SVM(SupportVector Machine，支持向量机)分类器实现了人体姿态识别，即先通过人体关键点检测获得各个人体关键点的坐标信息，再利用预先设立的SVM分类器对坐标信息进行识别处理，确定待识别图片中人体的姿态类别，由于人体关键点检测算法与SVM分类器对计算资源的需求远远小于时空3D卷积对计算资源的需求，因此，该种实现方式有效地提高了人体姿态识别过程中的实时性，保证了用户体验。

本申请所提供的一种人体姿态识别装置、系统以及计算机可读存储介质，均具有上述有益效果，在此不再赘述。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请所提供的一种人体姿态识别方法的流程示意图；

图2为本申请所提供的一种人体姿态识别装置的结构示意图；

图3为本申请所提供的一种人体姿态识别系统的结构示意图。

具体实施方式

本申请的核心是提供一种人体姿态识别方法，该人体姿态识别方法可以有效提高人体行为识别过程中的实时性；本申请的另一核心是提供一种人体姿态识别装置、设备以及计算机可读存储介质，也具有上述有益效果。

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

请参考图1，图1为本申请所提供的一种人体姿态识别方法的流程示意图，该人体姿态识别方法可以包括：

S101：获取待识别图片，并在待识别图片中确定人体区域；

本步骤旨在实现待识别图片的获取以及待识别图片中人体区域的确定，其中，该待识别图片即为需要对其中的人体图像进行姿态识别的图片，其获取方式并不唯一，可以是由用户直接基于客户端输入的单一图片，也可以是从视频流中分帧获取视频帧，本申请对此不做限定。进一步，由于是对人体姿态进行识别，因此，在获得待识别图片后，即可确定图片中的人体区域，可以理解的是，由于图片中人体的数量可能为一个，也可能为多个，因此，此处在待识别图片中所确定的人体区域的数量也不唯一，并不影响本技术方案的实施。

S102：对人体区域进行特征提取，获得特征热点图；

本步骤旨在实现特征提取，以获得待识别图片对应的特征热点图，该特征热点图中包括有待识别图片中每个人体的人体关键点以及人体关键点之间的连接信息，以便实现后续人体关键点的坐标信息的获取。

其中，热点图是通过使用不同的标志将图片或页面上的区域按照受关注程度的不同加以标注并呈现的一种分析手段，标注的手段一般采用颜色的深浅、点的疏密以及呈现比重的形式，以将数据变得更为清晰明了。

其中，上述人体关键点为预先在人体中设定的关键点，例如，可以为眼睛、膝盖、双手等，其具体类型和数量由用户根据实际需求进行设定即可，可以想到的是，预设的人体关键点数量越多，相应的识别结果越准确。

另外，特征热点图的获取方式通过特征提取技术即可实现，其具体实现过程可以采用已有技术中的任意一种特征提取方法，本申请对此不做限定。

优选的，上述对人体区域进行特征提取，获得特征热点图，可以包括：通过卷积神经网络对人体区域进行特征提取，获得特征热点图。

本优选实施例提供了一种较为具体的特征提取方法，即基于卷积神经网络的特征提取方法。卷积神经网络是一种深度前馈神经网络，人工神经元可以响应周围单元，该技术已经广泛的应用于图像识别领域，可以实现大型图像处理，由此，可利用卷积神经网络对待识别图像中的人体区域进行特征提取，获得相应的特征热点图。

S103：根据特征热点图获得人体关键点的坐标信息；

本步骤旨在实现人体关键点坐标信息的获取，由于特征热点图中包括了待识别图片中每个人体的每个人体关键点以及各个人体关键点之间的连接信息，且清晰直观，因此，可基于该特征热点图获得各个人体关键点的坐标信息，以便实现人体姿态识别。

优选的，上述根据特征热点图获得人体关键点的坐标信息，可以包括：根据特征热点图对待识别图片中的各人体关键点进行连接，获得人体关键点分布图；在人体关键点分布图中获得各人体关键点的坐标信息。

本优选实施例提供了一种较为具体的人体关键点坐标信息的获取方法，具体而言，由于热点图可以很清晰直观的确定人体关键点的位置，因此，可直接基于特征热点图对待识别图片中的人体关键点进行连接，获得人体关键点分布图，进而在人体关键分布图中获得各个人体关键点的坐标信息。

优选的，上述根据特征热点图获得人体关键点的坐标信息之后，还可以包括：对各人体关键点的坐标信息进行归一化处理，获得归一化后的坐标信息。

具体的，为进一步提高识别结果的准确性，可对各个人体关键点的坐标信息进行归一化，以获得归一化后的坐标信息。其中，归一化是一种无量纲处理手段，可以使物理系统数值的绝对值变成某种相对值关系，具有简化计算，缩小量值的效果。

S104：利用预设SVM分类器对坐标信息进行识别处理，确定姿态类别。

本步骤旨在实现待识别图片中人体的姿态识别，即利用预设SVM分类器实现，该预设SVM分类器为预先建立的分类器，是一种有监督的学习模型，可用于实现模式识别、分类以及回归分析等，可预先将其存储于相应的存储空间，在进行人体姿态识别时直接调用即可。在具体实现过程中，将基于S103获得的各个人体关键点的坐标信息输入预设SVM分类器进行识别处理，其输出结果即为相应人体的姿态类别，当然，该姿态类别的具体种类已经预先在预设SVM分类器中设定好，具体可包括正常姿态如站立、正常坐姿等，异常姿态如侧身坐姿、趴在桌上、仰面朝上、脚放桌上等。

优选的，上述预设SVM分类器可以为基于径向基核函数的分类器。

本优选实施例提供了一种具体类型的预设SVM分类器，即基于径向基核函数的分类器，其中，径向基核函数(Radial Basis Function，RBF)是某种沿径向对称的标量函数，可实现非线性映射，且参数数量较少，复杂度相对较低。

优选的，上述利用预设SVM分类器对坐标信息进行识别处理，确定姿态类别之前，还可以包括：以指定摄像头坐标系为基准，对各人体关键点的坐标信息进行坐标系转换，获得各人体关键点的标准坐标信息。

具体的，当不同的使用场景中摄像机处于不同的高度，拍摄方向朝向不同的角度时，拍摄的画面可能会出现一定的畸变，此时，人体的身材比例会发生变化，导致各个人体关键点的相对位置特随之发生改变，因此，针对不同位置和角度的摄像机所得到的坐标信息，可对其进行坐标转换处理，以满足通用性的要求。在具体实现过程中，可以将指定摄像头对应的坐标系作为基准，对各个人体关键点的坐标信息进行坐标转换，进而获得各个转换后的坐标信息，即上述标准坐标信息。其中，指定摄像头一般为当前自行数据采集场景的摄像头，即正对人体的摄像头。

优选的，该人体姿态识别方法还可以包括：当待识别图片为视频信息中的视频帧时，识别获取各视频帧对应的姿态类别；当视频帧的数量达到预设数量时，对各姿态类别进行数量统计，获得对应的姿态类别数量；输出姿态类别数量取最大值时对应的姿态类别。

具体的，对于视频流中的图像的人体姿态识别，由于视频信息中被拍摄到的人体可能处于动作状态，仅对其中的一张视频帧进行识别所获得的识别结果可能并不准确，因此，可以对视频信息中预设数量个相连的视频帧进行识别，获得各个视频帧的识别结果，进一步，对各种识别确定的姿态类别进行统计，并将出现次数最多的姿态类别作为最终的结果进行输出。例如，对视频信息中相连的50张视频帧进行识别，在识别结果中，有40张的视频帧的识别结果为正常坐姿，有5张的视频帧的识别结果为侧身坐姿，有5张的视频帧的识别结果为站立，此时，即可输出姿态类别为正常坐姿。

本申请所提供的人体姿态识别方法，基于人体关键点检测和SVM分类器实现了人体姿态识别，即先通过人体关键点检测获得各个人体关键点的坐标信息，再利用预先设立的SVM分类器对坐标信息进行识别处理，确定待识别图片中人体的姿态类别，由于人体关键点检测算法与SVM分类器对计算资源的需求远远小于时空3D卷积对计算资源的需求，因此，该种实现方式有效地提高了人体姿态识别过程中的实时性，保证了用户体验。

在上述各个实施例的基础上，本申请实施例以识别战士在执勤过程中的人体姿态为例，提供了一种更为具体的人体姿态识别方法，其具体实现流程如下：

(1)人体关键点检测模块：

人体关键点检测模块的输入为单张图片，即上述待识别图片，通过卷积神经网络对其进行特征提取，获得图片的特征热点图，热点图上包含了原始图片中每个人体的十八个关键点(本申请实施例设定18个人体关键点)以及各个关键点之间的连接信息。进一步，通过热点图对原始图片中的人体关键点进行连接，得到每个人体的人体关键点分布，即每个人体的十八个关键点在图片上的坐标数据。其中，人体十八个关键点的具体定义及对应标签如下：

(2)SVM分类器识别模块：

SVM分类器模块的输入为每个人体的十八个关键点的坐标相对于人体框的相对值，是一个18×2维的特征向量，并且x(x轴)和y(y轴)的值分别是相对于人体框的宽和高的比例，即此时每个点的x值和y值均被归一化到了[0，1]。其中，SVM分类器为一个多分类的分类器，使用径向基核函数，采用软间隔最大化的优化方式训练获得，设定SVM分类器的六个姿态类别分别为：站立和正常坐姿为正常姿态；侧身坐姿，趴在桌上，脚放桌上，仰面朝上为异常姿态。

进一步，以当前自行数据采集场景的摄像头作为基准，将其他场景的摄像头向该基准进行转换，在实际使用的场景中，可以将摄像头的拍摄方向尽量调整到正对着战士的执勤区域，此时的变量为摄像机拍摄方向与竖直方向的夹角β，而基准角度α(自行采集数据的场景下)为50.66°，由此，在得到β角之后，即可通过下述公式实现坐标转换：

进一步，在实际使用过程中，由于某些时刻战士的姿态肯定会处于上述定义的六种姿态的中间过渡状态，此时的姿态其实不属于六个类别的任何一个，但SVM分类器依然会给出一个预测结果，因此这个结果不可用，也就是说，如果每一帧视频帧均进行检测且报告检测结果，会有较多误识别的情况出现。因此，可以将每一帧的检测结果暂时保存，当保存数量达到50时，计算每一个姿态类别的出现次数，并输出出现次数最多的姿态类别。

可见，本申请实施例所提供的人体姿态识别方法，基于人体关键点检测和SVM分类器实现了人体姿态识别，即先通过人体关键点检测获得各个人体关键点的坐标信息，再利用预先设立的SVM分类器对坐标信息进行识别处理，确定待识别图片中人体的姿态类别，由于人体关键点检测算法与SVM分类器对计算资源的需求远远小于时空3D卷积对计算资源的需求，因此，该种实现方式有效地提高了人体姿态识别过程中的实时性，保证了用户体验。

为解决上述问题，请参考图2，图2为本申请所提供的一种人体姿态识别装置的结构示意图，该人体姿态识别装置可包括：

图片获取模块10，用于获取待识别图片，并在待识别图片中确定人体区域；

特征提取模块20，用于对人体区域进行特征提取，获得特征热点图；

坐标计算模块30，用于根据特征热点图获得人体关键点的坐标信息；

姿态识别模块40，用于利用预设SVM分类器对坐标信息进行识别处理，确定姿态类别。

可见，本申请实施例所提供的人体姿态识别装置，基于人体关键点检测和SVM分类器实现了人体姿态识别，即先通过人体关键点检测获得各个人体关键点的坐标信息，再利用预先设立的SVM分类器对坐标信息进行识别处理，确定待识别图片中人体的姿态类别，由于人体关键点检测算法与SVM分类器对计算资源的需求远远小于时空3D卷积对计算资源的需求，因此，该种实现方式有效地提高了人体姿态识别过程中的实时性，保证了用户体验。

作为一种优选实施例，上述特征提取模块20可具体用于通过卷积神经网络对人体区域进行特征提取，获得特征热点图。

作为一种优选实施例，上述坐标计算模块30可具体用于根据特征热点图对待识别图片中的各人体关键点进行连接，获得人体关键点分布图；在人体关键点分布图中获得各人体关键点的坐标信息。

作为一种优选实施例，该人体姿态识别装置还可以包括归一化模块，用于在上述根据特征热点图获得人体关键点的坐标信息之后，对各人体关键点的坐标信息进行归一化处理，获得归一化后的坐标信息。

作为一种优选实施例，该人体姿态识别装置还可以包括坐标转换模块，用于在上述利用预设SVM分类器对坐标信息进行识别处理，确定姿态类别之前，以指定摄像头坐标系为基准，对各人体关键点的坐标信息进行坐标系转换，获得各人体关键点的标准坐标信息。

作为一种优选实施例，该人体姿态识别装置还可以包括叠加预测模块，用于当待识别图片为视频信息中的视频帧时，识别获取各视频帧对应的姿态类别；当视频帧的数量达到预设数量时，对各姿态类别进行数量统计，获得对应的姿态类别数量；输出姿态类别数量取最大值时对应的姿态类别。

对于本申请提供的装置的介绍请参照上述方法实施例，本申请在此不做赘述。

为解决上述问题，请参考图3，图3为本申请所提供的一种人体姿态识别系统结构示意图，该人体姿态识别系统可包括：

存储器1，用于存储计算机程序；

处理器2，用于执行计算机程序时可实现上述任意一种人体姿态识别方法的步骤。

对于本申请提供的服务器的介绍请参照上述方法实施例，本申请在此不做赘述。

为解决上述问题，本申请还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，计算机程序被处理器执行时可实现上述任意一种人体姿态识别方法的步骤。

该计算机可读存储介质可以包括：U盘、移动硬盘、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

对于本申请提供的计算机可读存储介质的介绍请参照上述方法实施例，本申请在此不做赘述。

说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

以上对本申请所提供的人体姿态识别方法、装置、系统以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以对本申请进行若干改进和修饰，这些改进和修饰也落入本申请权利要求的保护范围要素。

Claims

1.一种人体姿态识别方法，其特征在于，包括：

获取待识别图片，并在所述待识别图片中确定人体区域；

对所述人体区域进行特征提取，获得特征热点图；

根据所述特征热点图获得人体关键点的坐标信息；

2.如权利要求1所述的人体姿态识别方法，其特征在于，所述对所述人体区域进行特征提取，获得特征热点图，包括：

3.如权利要求1所述的人体姿态识别方法，其特征在于，所述根据所述特征热点图获得人体关键点的坐标信息，包括：

4.如权利要求1所述的人体姿态识别方法，其特征在于，所述根据所述特征热点图获得人体关键点的坐标信息之后，还包括：

5.如权利要求1所述的人体姿态识别方法，其特征在于，所述预设SVM分类器为基于径向基核函数的分类器。

6.如权利要求1所述的人体姿态识别方法，其特征在于，所述利用预设SVM分类器对所述坐标信息进行识别处理，确定姿态类别之前，还包括：

7.如权利要求1至6任意一项所述的人体姿态识别方法，其特征在于，还包括：

输出所述姿态类别数量取最大值时对应的姿态类别。

8.一种人体姿态识别装置，其特征在于，包括：

9.一种人体姿态识别系统，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至7任意一项所述的人体姿态识别方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述的人体姿态识别方法的步骤。