CN104636756A

CN104636756A - 一种用于家庭老人监护的姿态识别方法

Info

Publication number: CN104636756A
Application number: CN201510066640.7A
Authority: CN
Inventors: 王明江; 曲中鑫; 卢婷舒; 刘晓炯; 刘明
Original assignee: Shenzhen Graduate School Harbin Institute of Technology
Current assignee: Shenzhen Graduate School Harbin Institute of Technology
Priority date: 2015-02-06
Filing date: 2015-02-06
Publication date: 2015-05-20

Abstract

本发明提出了一种基于多帧图像的用于家庭老人监护的姿态识别方法，该方法将K均值聚类分析识别和隐马尔科夫模型相结合。实验结果表明，该方法在降低计算量和内存占用的前提下，实现了对多帧图像的姿态识别，而且运行时间相对单帧识别缩小了近3倍，相对直接使用HMM多帧识别缩小了近2倍，并提高了算法的鲁棒性。

Description

一种用于家庭老人监护的姿态识别方法

技术领域

本发明涉及模式识别技术领域，尤其涉及一种姿态识别方法。

背景技术

20世纪后期，为控制人口急剧增长，我国实行计划生育政策，使得人口出生率显著降低，但同时这加快了中国人口老龄化的进程。而大量的老人群体对医疗护理和家庭看护有很大的依赖。另外，许多平常看似健康的中老年人在自然老化的过程中也会有慢性疾病或者突发疾病，由于缺乏及时的提醒或救治，会造成难以挽回的后果。但是，在未来可用人力资源愈加贫乏的状况下，单纯依赖于子女或者专业医护人员看护老人是难以实现的，而这就必然使我们联想要通过科技技术的创新来改善上述状况。

从老人监护的目的来看，指对视频序列进行前景提取处理的基础上，进一步对场景中的事件进行分析和识别，其技术实现过程即将一个事变特征的数据进行分类，即根据提取出的目标特征与一组预先存储的典型行为参考样本进行匹配，以确定所属类别。

目前，应用广泛的模式识别技术有K近邻(K-Nearest Neighbor)算法、贝叶斯分类(Bayes Classifier)、支持向量机(SVM)分类、隐马尔科夫模型(HMM)识别等。但是诸如以上算法都有其优点和不足。前三种技术能够很好地对单帧图像(单个时间点)进行模式识别，但不能对一个连续的动作(时间段)做出判断；HMM技术虽然适合对多帧图像进行实时检测，但是需要直接采用原始的特征聚类数据，训练和识别阶段都有巨大的计算量和内存占用。

发明内容

为了解决现有技术中的问题，本发明提供了一种基于多帧图像用于家庭老人监护的姿态识别方法，克服了背景技术中所提到的算法的缺点，非常适合于对老人动作和姿态进行实时检测。实验结果表明，该方法在降低计算量和内存占用的前提下，实现了对多帧图像的姿态识别，而且运行时间相对单帧识别缩小了近3倍，相对直接使用HMM多帧识别缩小了近2倍。

本发明的基于多帧图像用于家庭老人监护的姿态识别方法，利用LBG聚类识别算法结合HMM多帧检测算法进行优化，为了实现该方案，运用了以下技术：

1)特征参数选择方面采用了目标轮廓的宽高比、周长、面积、矩、重心、离心率、傅里叶描述子；

2)单个动作是由一系列连续的单帧姿态组成；

3)LBG聚类识别算法主要基于K-Means聚类识别算法对特征矩阵进行训练，得到每一动作的各个中间姿态的聚类点群中心(一组特征向量)，并标号；在训练和测试阶段计算当前帧的特征向量与各个候选姿态聚类点群中心向量之间的欧几里得距离，选择具有最小距离候选姿态的标号作为训练和测试的特征参数；

4)HMM前向后向算法训练得到各个动作HMM模型、HMM前向算法选择最适合的HMM模型即判定所属动作。

本发明的有益效果是：HMM模型的输入使用聚类分析简化后的特征数据，不但能够实现多帧图像的姿态识别，还能有效的降低了内存占用和运算时间。另外此方法对单帧噪声有一定的鲁棒性。

附图说明

图1是本发明的用于家庭老人监护的姿态识别方法的训练过程流程图。

图2是本发明的用于家庭老人监护的姿态识别方法的测试过程流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

本发明的基于多帧图像的用于家庭老人监护的姿态识别方法，将K均值聚类识别算法和隐马尔科夫模型相结合，所述方法包括以下步骤：

步骤A：训练阶段，首先将同一姿态动作的所有视频单帧的特征数据作聚类分析，然后由HMM前向后向算法训练该动作经聚类识别分析后的特征参数进而得到HMM模型参数(具体包括初始状态概率矩阵π、隐含状态转移概率矩阵A、观测状态转移概率矩阵B)；

其中初始状态指先验设定单帧人体姿态是某一种姿态的概率；隐含状态是指单帧人体姿态由一种姿态在下一帧转换到其他姿态的概率；观测状态是指给定单帧人体姿态下特征向量属于2^n中某一个聚类点群中心的概率。

步骤B：识别阶段，将待识别视频每帧提取的特征向量做聚类分析识别后，计算每一个候选动作的HMM模型产生待识别视频的特征序列的概率，最大者即为判定动作。

附图1是本发明的姿态识别训练过程的流程图。

1)对某一个姿态动作(如摔倒)的视频文件的每一帧提取特征参数，得到样本的特征矩阵，通过LBG聚类量化为2^n(其中n为大于等于1的整数)个聚类点群中心，并分别标号为0～2^n-1，存储该动作的聚类点群中心数据；2)选定特定动作(如摔倒)的视频文件，提取单帧图像中前景的特征参数，得到特征向量，计算当前帧的特征向量与各个候选姿态聚类点群中心向量之间的欧几里得距离，选择具有最小距离候选姿态的标号0～2^n-1作为训练的特征参数；3)将所得一个连续姿态动作的聚类点群中心标号组成一个状态序列(长度为T)，当作HMM训练模型的输入，以得到该动作的HMM模型参数文件。循环执行上述三个步骤，训练得到所有动作的聚类点群中心数据和HMM模型数据。其中，所述特征参数采用目标轮廓的宽高比、周长、面积、矩、重心、离心率、傅里叶描述子。

附图2是本发明的姿态识别测试过程的流程图。

1)根据经验设定一个动作的有效帧数T，提取T帧的特征参数；2)依次使用所有候选动作的聚类点群中心数据和候选动作对应的HMM模型参数进行识别判断，得到所有动作识别概率；3)概率最高的HMM模型对应姿态即为所判定的动作。

实验结果表明，该方法在降低计算量和内存占用的前提下，实现了对多帧图像的姿态识别，而且运行时间相对单帧识别缩小了近3倍，相对直接使用HMM多帧识别缩小了近2倍，并提高了算法的鲁棒性。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

Claims

1.一种基于多帧图像的用于家庭老人监护的姿态识别方法，其特征在于：所述方法将K均值聚类识别算法和隐马尔科夫模型相结合，所述方法包括以下步骤：

步骤A：训练阶段，首先将同一姿态动作的所有视频单帧的特征数据作聚类分析，然后由HMM前向后向算法训练该动作经聚类识别分析后的特征参数进而得到HMM模型参数；

2.根据权利要求1所述的姿态识别方法，其特征在于：所述步骤A包括以下步骤：

步骤A1：对某一姿态动作的所有视频的每一帧提取特征参数，得到样本的特征矩阵，通过K均值聚类分析得到2^n个聚类点群中心数据，其中n为大于等于1的整数，并分别标号；

步骤A2：对A1所选的某一姿态动作的视频文件，提取每一帧图像的特征向量，计算特征向量与该动作的各个中间姿态聚类中心向量的欧几里得距离，选取距离最小的聚类中心的标号代表当前帧的特征参数；

步骤A3：将A2聚类识别得到的聚类中心标号组成一个中间状态序列，长度为T，当作HMM训练模型的输入，经由HMM前向后向算法以得到该动作的HMM模型参数文件；

步骤A4：循环执行步骤A1～A3,直至训练完所有动作。

3.根据权利要求1所述的姿态识别方法，其特征在于：所述步骤A包括以下步骤：

步骤B1：根据经验设定一个动作的有效帧数T，提取T帧的特征参数；

步骤B2：依次使用所有候选动作的聚类中心数据和HMM模型参数进行识别判断，得到识别概率；

步骤B3：选出概率最高的HMM模型，即为所识别的动作。

4.根据权利要求2所述的姿态识别方法，其特征在于：所述特征参数采用目标轮廓的宽高比、周长、面积、矩、重心、离心率、傅里叶描述子。