CN110032932B

CN110032932B - 一种基于视频处理和决策树设定阈值的人体姿态识别方法

Info

Publication number: CN110032932B
Application number: CN201910172226.2A
Authority: CN
Inventors: 王鹏; 孔凡宁; 李东滨; 沈翔; 孙鑫悦; 陈化良
Original assignee: Harbin University of Science and Technology
Current assignee: Harbin University of Science and Technology
Priority date: 2019-03-07
Filing date: 2019-03-07
Publication date: 2021-09-21
Anticipated expiration: 2039-03-07
Also published as: CN110032932A

Abstract

一种基于视频处理和决策树设定阈值的人体姿态识别方法，属于人体姿态识别技术，目的是为了解决现有的基于视频处理的人体姿态识别算法在区分不同姿态时会出现很大误差，识别效果较差的问题。本发明所述的方法为：判断工作模式是否为人姿态数据库建立，当判断结果为是时，执行基于决策树的人体姿态特征阈值区间数据库建立步骤；否则，执行基于人体姿态特征阈值区间匹配的姿态识别步骤，通过决策树分类器确定不同人体各个姿态的阈值区间，利用多个人体姿态特征对同一姿态进行判定，克服了传统姿态识别中阈值设置固定的缺点，提高了姿态识别的准确率。

Description

一种基于视频处理和决策树设定阈值的人体姿态识别方法

技术领域

本发明属于人体姿态识别技术。

背景技术

人体姿态识别在计算机视觉领域中是一个有着很大发展潜力的研究方向，也是模式识别和人工智能领域中很重要的一个研究方向，其在虚拟现实、人机交互、安防监控、医疗辅助、智能家居、体育训练等领域有着广泛应用。

人体姿态识别根据原始数据的方式主要分为两类：非视觉传感器采集数据方式和视觉传感器采集数据方式。基于非视觉的方式通过可穿戴式传感器或者布设在人体活动区域内的传感器采集其运动信息数据，如人体运动的加速度、角速度等信息，虽然该方案采集到的数据进行简单的筛选和处理就可以用于后期的姿态识别，但是这种方案需要人保证设备穿戴在固定的位置或对活动区域内的环境进行改造，人一般都会对可穿戴的设备有着抵触心理且容易遗忘，用户体验较差，而改造活动环境成本较高。基于视觉的方式通过在人体活动区域安放摄像头，利用摄像头采集人体的运动图像序列，结合图像处理算法实现对人体图像的标记，获得多种人体姿态特征数据，如人体高宽比、人体中心变化率等，该方案获取的特征数据虽然在筛选和分类较为复杂，但该方案系统组成简单，成本低廉。

目前基于视频处理的人体姿态识别算法中，多是将获得的人体姿态特征数据用于姿态识别，各个姿态的识别利用固定单一的姿态特征阈值，而且在设定姿态特征阈值时主要通过经验或者取数据平均值等方法，不仅在区分不同姿态时会出现很大误差，还不适用于身型不同的目标，识别的效果较差。

发明内容

本发明的目的是为了解决现有的基于视频处理的人体姿态识别算法在区分不同姿态时会出现很大误差，识别效果较差的问题，提供一种基于视频处理和决策树设定阈值的人体姿态识别方法。

本发明所述的一种基于视频处理和决策树设定阈值的人体姿态识别方法为：判断工作模式是否为人姿态数据库建立，当判断结果为是时，执行基于决策树的人体姿态特征阈值区间数据库建立步骤；否则，执行基于人体姿态特征阈值区间匹配的姿态识别步骤；

所述基于决策树的人体姿态特征阈值区间数据库建立步骤包括：

第一人体视频采集步骤：首先采集目标活动区域的背景视频，然后采集用户各个姿态的多帧视频图像，该视频图像为人体彩色图像；

第一图像预处理步骤：对获取到的多帧人体彩色图像进行预处理，然后将人体图像从所述彩色图像中分离；

第一人体目标标记步骤：利用人体外接最小水平矩形框和其中心点与左下角的连线分别对多帧人体图像中的人体目标进行标记；

第一人体姿态特征数据计算步骤：计算多帧图像人体外接最小水平矩形框内部像素点的特征数据，以此作为人体姿态特征数据；

人体姿态特征阈值设定步骤：通过决策树对获得的多个人体姿态特征数据进行分析，获得各个姿态的人体姿态特征阈值区间，然后执行数据库更新判断步骤；

数据库更新判断步骤：判断所述人体姿态特征阈值数据是否满足人体姿态数据库更新条件，如果是，执行数据库更新步骤；否则，返回第一人体视频采集步骤采集下一用户的视频；

数据库更新步骤：将本次采集到的人体姿态特征数据加入到原数据库中，并将该人体姿态特征数据获得的各姿态的人体姿态特征阈值区间端点与原数据库中已经存储的对应姿态的各人体姿态特征阈值区间端点比较，若本次的采集到的各个姿态的人体姿态特征数据阈值全部在原始数据库的阈值区间内，则不进行数据库更新；否则，将该姿态特征数据阈值和对应的原数据库的人体姿态特征数据阈值进行比较之后进行更新，

所述人体姿态特征阈值区间匹配的姿态识别步骤包括：

第二人体视频采集步骤：首先采集目标活动区域的背景视频，然后采集用户各个姿态的单视频图像，然后执行图像预处理步骤；

第二图像预处理步骤：对获取到的单帧人体的彩色图像进行预处理，然后将人体图像从所述彩色图像中分离，然后执行人体目标标记步骤；

第二人体目标标记步骤：利用人体外接最小水平矩形框和其中心点与左下角的连线对单帧人体图像中的人体目标进行标记，然后执行人体姿态特征数据计算步骤；

第二人体姿态特征数据计算步骤：计算单帧图像人体外接最小水平矩形框内部像素点的特征数据，以此作为人体姿态特征数据；

人体姿态判定步骤：利用数据库中各姿态的人体姿态特征阈值区间完成对人体姿态的判定。

进一步地，所述第一图像预处理步骤以及第二图像预处理步骤中，对获取到的人体的彩色图像进行预处理包括将采集到的彩色图像进行灰度化、背景减除、二值化和形态学运算。

进一步地，所述第一人体姿态特征数据计算步骤以及第二人体姿态特征数据计算步骤中，采集的人体姿态特征数据包括：通过最小矩形框标记之后计算出的人体的高宽比、人体像素面积占最小矩形框面积的有效面积比、人体中心高度变化和人体倾斜度。

进一步地，所述人体姿态特征阈值设定步骤中，利用决策树对获得的人体姿态特征数据进行分析，获得各个姿态的人体姿态特征阈值区间的具体方法为：将每帧图像的人体姿态特征作为分类的属性，通过N种姿态对N×n个姿态图像进行分组，每两个姿态的人体姿态特征数据作为一组送入决策树分类器，经过分类得到每个姿态各个属性的阈值，并组成阈值区间，其中N为偶数。

本发明采用视频式方案结合数字图像处理技术获取多种人体姿态特征数据，自建人体姿态数据库并使用决策树分类方法确定阈值区间实现人体姿态的识别，相比穿戴式姿态识别方法依靠单一的加速度特征有更高的准确率，相比环境布设式识别方法成本更低、实现更容易；在图像处理过程中选择最小亮度值进行灰度化，采用均值法构建背景模型实现背景差分，使用形态学滤波的方案对前景图像进行优化，相比传统的背景差分法能够更好的提取人体目标；在人体标记时采用隔列隔行扫描的方式，提升了标记的速度；在姿态阈值设定时根据自建人体姿态数据库，通过决策树分类器确定不同人体各个姿态的阈值区间，利用多个人体姿态特征对同一姿态进行判定，克服了传统姿态识别中阈值设置固定的缺点，提高了姿态识别的准确率。

附图说明

图1是实施方式所述的一种基于视频处理和决策树设定阈值的人体姿态识别方法的流程图；

图2是实施方式中基于决策树的人体姿态特征阈值区间数据库建立步骤的流程图；

图3是实施方式中人体姿态特征阈值区间匹配的姿态识别步骤的流程图；

图4是实施方式中，基于决策树的人体姿态特征阈值区间数据库建立和人体姿态特征阈值区间匹配的姿态识别过程中，视频采集的流程图；

图5是实施方式中图像预处理步骤的流程图；

图6是实施方式中人体目标标记的原理示意图；

图7是实施方式中决策树阈值设定的流程图；

图8是实施方式中人体姿态识别的流程图。

具体实施方式

结合图1至图8说明本实施方式，本实施方式所述的一种基于视频处理和决策树设定阈值的人体姿态识别方法为：判断工作模式是否为人姿态数据库建立，当判断结果为是时，执行基于决策树的人体姿态特征阈值区间数据库建立步骤；否则，执行基于人体姿态特征阈值区间匹配的姿态识别步骤；如图1所示。

基于决策树的人体姿态特征阈值区间数据库建立步骤如图2所示，包括人体视频采集、图像预处理、人体目标标记、人体姿态特征数据计算、决策树设定人体姿态特征阈值区间、判断是否满足人体姿态数据库、数据库更新。

人体姿态特征阈值区间匹配的姿态识别步骤包括人体视频采集、图像预处理、人体目标标记、人体姿态特征数据计算、人体姿态判定。

其中，基于决策树的人体姿态特征阈值区间数据库建立步骤和人体姿态特征阈值区间匹配的姿态识别步骤中的人体视频采集、图像预处理、人体目标标记和人体姿态特征数据计算的原理相同，只是前者是处理多帧数据，后者是处理单帧数据。

所述基于决策树的人体姿态特征阈值区间数据库建立步骤如图2所示，具体包括：

数据库更新步骤：将本次采集到的人体姿态特征数据加入到原数据库中，并将该人体姿态特征数据获得的各姿态的人体姿态特征阈值区间端点与原数据库中已经存储的对应姿态的各人体姿态特征阈值区间端点比较，若本次的采集到的各个姿态的人体姿态特征数据阈值全部在原始数据库的阈值区间内，则不进行数据库更新；否则，将该姿态特征数据阈值和对应的原数据库的人体姿态特征数据阈值进行比较之后进行更新。

所述人体姿态特征阈值区间匹配的姿态识别步骤如图3所示，具体包括：

所述第一图像预处理步骤以及第二图像预处理步骤中，对获取到的人体的彩色图像进行预处理包括将采集到的彩色图像进行灰度化、背景减除、二值化和形态学运算。

所述第一人体姿态特征数据计算步骤以及第二人体姿态特征数据计算步骤中，采集的人体姿态特征数据包括：通过最小矩形框标记计算出的人体的高宽比、人体像素面积占最小矩形框面积的有效面积比、人体中心高度变化和人体倾斜度。

所述人体姿态特征阈值设定步骤中，利用决策树对获得的人体姿态特征数据进行分析，获得各个姿态的人体姿态特征阈值区间的具体方法为：将每帧图像的人体姿态特征作为分类的属性，通过N种姿态对N×n个姿态图像进行分组，每两个姿态的人体姿态特征数据作为一组送入决策树分类器，经过分类得到每个姿态各个属性的阈值，并组成阈值区间，其中N为偶数。

本实施方式所述的人体姿态识别方法使用摄像头对人体活动的区域进行视频数据的采集，对得到的视频图像进行处理，将人体目标图像进行提取和标记，获得标记后的人体姿态特征数据，通过决策树处理特征数据并确定不同姿态的人体姿态特征数据阈值区间。

上述人体姿态识别算法主要包括两个部分：基于决策树的人体姿态特征阈值区间数据库建立和人体姿态特征阈值区间匹配的姿态识别。

基于决策树的人体姿态特征阈值区间数据库建立过程包括：人体视频采集、图像预处理、人体目标标记、人体姿态特征数据计算、利用决策树设定人体姿态特征阈值区间和数据库更新6个步骤。

人体姿态特征阈值区间匹配的姿态识别过程包括：人体视频采集、图像预处理、人体目标标记、人体外姿态征数据计算和人体姿态判定5个步骤。

在进行人体姿态特征阈值区间匹配的姿态识别之前首先要建立人体姿态特征阈值数据库，该人体姿态特征数据库包含设定好的各个姿态的特征阈值区间，未建立数据库时，人体姿态特征数据库为空集。通过对用户人体视频数据的采集，获取人体的彩色图像；图像预处理将采集到的彩色图像进行灰度化、背景减除、二值化和形态学运算，将人体目标从图像中分离出来；人体目标利用最小水平矩形框和其中心点标记；人体姿态特征数据计算包括计算最小水平矩形框和其内部像素点的特征数据实现；人体姿态特征阈值设定通过决策树对获得的人体姿态特征数据进行分析，获得各个姿态的阈值区间(每个姿态对应的人体姿态特征数据的最大值和最小值作为阈值区间的端点)。

在人体姿态识别过程中，人体视频采集、图像预处理和人体目标标记和人体姿态特征阈值设定与人体姿态数据库建立的处理的图像数量是不同的，人体姿态数据库建立是处理一个用户的多帧图像，获得多组人体姿态数据来设定人体姿态特征阈值区间，而人体姿态识别时针对单帧图像，获得一组人体姿态数据去判断该帧图像的人体姿态。通过对被测人员单帧姿态特征数据实时读取，利用得到的姿态阈值区间完成对人体姿态的判定。

下面对各步骤进行详细说明。

1.人体视频采集

人体视频的采集一方面用于数据库建立过程，另一方面用于姿态识别过程。如图4(a)所示，用于数据库建立过程时，首先要采集无用户进入的活动区域背景视频，存储n帧背景图像用于背景的建模(n≥100)，再让用户进入活动区域进行姿态视频采集，如用户需要按照姿态顺序直立行走、弯腰、下蹲和摔倒等动作姿态进行采集，姿态数量有N种且N为偶数，每个动作同样存储n帧，存储完N×n帧图像后，便进行图像预处理以及后续步骤。本方法根据不同场景的需要来设定姿态和顺序，并不限于以上动作姿态及顺序。如图4(b)所示，在姿态识别过程中，背景建模过程与数据库建立过程一致，但使用的背景可以与数据库建立不同，且用户进入活动区域为单帧采集，存储当前姿态的图像用于图像预处理以及后续步骤。图4给出了人体视频采集的一个示例性流程图，实际操作时，用户做出的各个姿态的顺序可以随意调整。

2.图像预处理

图像预处理是将图像中的人体目标进行提取，是后续人体标记的基础。图像预处理流程如图5所示。

第一步将采集到的背景彩色图像和姿态彩色图像进行灰度化，将RGB颜色空间三个通道的数据转化为一个通道的灰度数据以减少数据量，使用RGB颜色空间中亮度最小值的灰度化方法以降低亮度对图像的影响，灰度化如公示(1)所示。

Gray(x,y)＝min(R(x,y),min(G(x,y),B(x,y))) (1)

其中，R(x,y)、G(x,y)、B(x,y)代表RGB颜色空间中的红色、绿色和蓝色各个颜色分量的像素数据值，通过比较得到Gray(x,y)，Gray(x,y)是R(x,y)、G(x,y)、B(x,y)三个通道中像素亮度的最小值。

得到灰度图后，首先将背景图像进行平均，建立背景模型，背景模型建立如公式(2)所示。

其中Background(x,y)表示背景图像的平均值，n表示背景帧图像的数量，要求n≥100，(x,y)为像素位置坐标。

数据库建立过程中，背景建模完成后将姿态1到姿态N的N×n图像分别与平均背景帧进行差分操作，使得人体图像从背景环境中分离，然后覆盖原姿态帧图像；姿态是别过程中背景建模完成后将当前的姿态图像与平均背景帧进行差分操作，使得人体图像从背景环境中分离，然后覆盖原姿态帧图像。背景减除及图像二值化如公式(3)所示。

其中，等式右边的Pose_i(x,y)是第i帧姿态图像，Foreground_i(x,y)是第i帧姿态图像与背景均值图像差分后的前景图像，T为灰度阈值，背景差分后图像的像素值小于等于T则为背景，并设定其像素值为黑，背景差分后图像的像素值大于T则为前景，并设定其像素值为白色，图像在存储时第i帧前景图像将会对应覆盖第i帧姿态图像。

得到二值前景图像后，由于存在噪点，为了进一步将人体图像完整提取，需要进行形态学滤波操作，首先去除第i帧前景图像中的小目标，然后对图像采用相同的结构元素进行先腐蚀后膨胀运算，即开运算，如公式(4)所示。最后进行孔洞填充，得到完整的人体前景图像。

其中，Foreground_i(x,y)为前景图像，se为圆盘形状结构元素，半径为8。

3.人体目标标记

提取到完整的人体前景目标后对目标进行最小水平矩形框ABCD标记，最小水平矩形框中心坐标用o标记，连接最小矩形框的左下定点B和中心o得到角a，标记方法如图6所示。

最小水平矩形框通过对前景图像隔列隔行扫描的方式实现，扫描起始点为每帧图像的左上角，扫描方向为向左和向下，向左对应列扫描，向下对应行扫描，首先进行隔列扫描确定第i帧矩形框ABCD的横坐标x_i,1和x_i,2，然后进行隔行扫描确定矩形ABCD的纵坐标y_i,1和y_i,2，利用A、B、C、D四个点的坐标绘制矩形，得到矩形高度Height_i、宽度Width_i、人体中心点o坐标(x_i,y_i)。依次如公式(5)、(6)、(7)所示。

Height_i＝|y_i,2-y_i,1| (5)

Width_i＝|x_i,2-x_i,1| (6)

4.人体姿态特征数据计算

人体姿态特征数据是阈值设定步骤中用到的数据样本，为了克服人距离摄像头的远近对图像中人体大小的影响，通过最小矩形框标记可以计算出人体的高宽比R_hwi、人体像素面积占最小矩形框面积的有效面积比R_si、人体中心高度变化C_oi+1和人体倾斜度a_i共4个不同的人体姿态特征，对这4个人体姿态特征进行数据采集。如公式(8)至(11)所示。

C_oi+1＝Height_i+1-Height_i (10)

其中，R_hwi为第i帧的人体高宽比；S_人i表示人体图像像素数之和，S_矩i表示第i帧人体外接最小水平矩形框内的像素之和，R_si为第i帧的人体有效面积比。Height_i+1表示第i+1帧的人体中心坐标高度；C_oi+1为第i+1帧的人体中心高度变化，C_o1＝0；a_i为第i帧的人体倾斜角度。

5.人体姿态特征阈值设定

由于不同的用户体型有着差异，如果设定固定的姿态阈值，面对不同用户时往往会造成姿态的误判，因此本方法将人体姿态特征数据库中的不同的人体姿态数据的4种特征作为分类的属性，在得到各个姿态的人体姿态特征数据后，通过N种姿态对N×n个姿态图像进行分组，每两个姿态人体姿态特征数据作为一组送入决策树分类器，经过分类得到每个姿态各个属性的阈值，并组成阈值区间，共有N/2个分类器。具体流程如图7所示，决策树分类器采用的是已有的C4.5决策树方法，采集到的用户不同姿态图像的4种人体姿态数据作为分类属性，姿态作为分类输出。利用采集到的数据样本确定人体姿态特征的阈值。

6.数据库更新

数据库更新前首先要判断本次采集到的各个姿态的人体姿态特征数据阈值的区间端点是否在原始数据库的阈值区间内，若本次采集到的各个姿态的人体姿态特征数据阈值的区间端点都在原始数据库对应的各个姿态的阈值区间内，则返回人体视频采集步骤采集下一用户；若本次的采集到的各个姿态的人体姿态特征数据阈值区间只要有一个姿态的阈值不在原始数据库的阈值区间内，则将该姿态特征数据阈值和对应的原数据库的人体姿态特征数据阈值进行比较之后进行更新，具体更新方式是将本次的人体姿态特征数据阈值替换原始人体姿态特征数据阈值的最大值或最小值，若该阈值比原阈值区间的最大值要大则替换其最大值，若该阈值比原阈值区间的最小值要小则替换其最小值，以此完成阈值数据库的更新，得到更新后的人体姿态数据特征阈值区间。

7.人体姿态识别

获得了不同姿态的人体姿态特征数据阈值区间之后，即可用于姿态识别过程，首先读取当前帧的人体姿态特征数据，再判定用户当前的姿态，按顺序从姿态1开始，若当前帧姿态数据符合姿态1的阈值区间则结束，否则依次判断当前姿态数据是否符合姿态2到姿态N的阈值区间，若当前姿态数据阈值区间都不符合则舍弃该姿态数据，采集下一帧数据进行人体姿态是别过程。姿态识别流程如图8所示。

Claims

1.一种基于视频处理和决策树设定阈值的人体姿态识别方法，其特征在于，判断工作模式是否为人姿态数据库建立，当判断结果为是时，执行基于决策树的人体姿态特征阈值区间数据库建立步骤；否则，执行基于人体姿态特征阈值区间匹配的姿态识别步骤；

数据库更新步骤：将本次采集到的人体姿态特征数据加入到原数据库中，并将该人体姿态特征数据获得的各姿态的人体姿态特征阈值区间端点与原数据库中已经存储的对应姿态的各人体姿态特征阈值区间端点比较，若本次的采集到的各个姿态的人体姿态特征数据阈值全部在原始数据库的阈值区间内，则不进行数据库更新；否则，将该姿态特征数据阈值和对应的原数据库的人体姿态特征数据阈值进行比较之后进行更新；

所述人体姿态特征阈值区间匹配的姿态识别步骤包括：

2.根据权利要求1所述的方法，其特征在于，所述第一图像预处理步骤以及第二图像预处理步骤中，对获取到的人体的彩色图像进行预处理包括将采集到的彩色图像进行灰度化、背景减除、二值化和形态学运算。

3.根据权利要求1所述的方法，其特征在于，所述第一人体姿态特征数据计算步骤以及第二人体姿态特征数据计算步骤中，采集的人体姿态特征数据包括：通过最小矩形框标记之后计算出的人体的高宽比、人体像素面积占最小矩形框面积的有效面积比、人体中心高度变化和人体倾斜度。

4.根据权利要求1、2或3所述的方法，其特征在于，所述人体姿态特征阈值设定步骤中，利用决策树对获得的人体姿态特征数据进行分析，获得各个姿态的人体姿态特征阈值区间的具体方法为：将每帧图像的人体姿态特征作为分类的属性，通过N种姿态对N×n个姿态图像进行分组，每两个姿态的人体姿态特征数据作为一组送入决策树分类器，经过分类得到每个姿态各个属性的阈值，并组成阈值区间，其中N为偶数，n表示背景帧图像的数量。