CN104636756A - 一种用于家庭老人监护的姿态识别方法 - Google Patents
一种用于家庭老人监护的姿态识别方法 Download PDFInfo
- Publication number
- CN104636756A CN104636756A CN201510066640.7A CN201510066640A CN104636756A CN 104636756 A CN104636756 A CN 104636756A CN 201510066640 A CN201510066640 A CN 201510066640A CN 104636756 A CN104636756 A CN 104636756A
- Authority
- CN
- China
- Prior art keywords
- steps
- hmm
- action
- cluster
- recognition method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
- G06F18/295—Markov models or related models, e.g. semi-Markov models; Markov random fields; Networks embedding Markov models
Abstract
本发明提出了一种基于多帧图像的用于家庭老人监护的姿态识别方法,该方法将K均值聚类分析识别和隐马尔科夫模型相结合。实验结果表明,该方法在降低计算量和内存占用的前提下,实现了对多帧图像的姿态识别,而且运行时间相对单帧识别缩小了近3倍,相对直接使用HMM多帧识别缩小了近2倍,并提高了算法的鲁棒性。
Description
技术领域
本发明涉及模式识别技术领域,尤其涉及一种姿态识别方法。
背景技术
20世纪后期,为控制人口急剧增长,我国实行计划生育政策,使得人口出生率显著降低,但同时这加快了中国人口老龄化的进程。而大量的老人群体对医疗护理和家庭看护有很大的依赖。另外,许多平常看似健康的中老年人在自然老化的过程中也会有慢性疾病或者突发疾病,由于缺乏及时的提醒或救治,会造成难以挽回的后果。但是,在未来可用人力资源愈加贫乏的状况下,单纯依赖于子女或者专业医护人员看护老人是难以实现的,而这就必然使我们联想要通过科技技术的创新来改善上述状况。
从老人监护的目的来看,指对视频序列进行前景提取处理的基础上,进一步对场景中的事件进行分析和识别,其技术实现过程即将一个事变特征的数据进行分类,即根据提取出的目标特征与一组预先存储的典型行为参考样本进行匹配,以确定所属类别。
目前,应用广泛的模式识别技术有K近邻(K-Nearest Neighbor)算法、贝叶斯分类(Bayes Classifier)、支持向量机(SVM)分类、隐马尔科夫模型(HMM)识别等。但是诸如以上算法都有其优点和不足。前三种技术能够很好地对单帧图像(单个时间点)进行模式识别,但不能对一个连续的动作(时间段)做出判断;HMM技术虽然适合对多帧图像进行实时检测,但是需要直接采用原始的特征聚类数据,训练和识别阶段都有巨大的计算量和内存占用。
发明内容
为了解决现有技术中的问题,本发明提供了一种基于多帧图像用于家庭老人监护的姿态识别方法,克服了背景技术中所提到的算法的缺点,非常适合于对老人动作和姿态进行实时检测。实验结果表明,该方法在降低计算量和内存占用的前提下,实现了对多帧图像的姿态识别,而且运行时间相对单帧识别缩小了近3倍,相对直接使用HMM多帧识别缩小了近2倍。
本发明的基于多帧图像用于家庭老人监护的姿态识别方法,利用LBG聚类识别算法结合HMM多帧检测算法进行优化,为了实现该方案,运用了以下技术:
1)特征参数选择方面采用了目标轮廓的宽高比、周长、面积、矩、重心、离心率、傅里叶描述子;
2)单个动作是由一系列连续的单帧姿态组成;
3)LBG聚类识别算法主要基于K-Means聚类识别算法对特征矩阵进行训练,得到每一动作的各个中间姿态的聚类点群中心(一组特征向量),并标号;在训练和测试阶段计算当前帧的特征向量与各个候选姿态聚类点群中心向量之间的欧几里得距离,选择具有最小距离候选姿态的标号作为训练和测试的特征参数;
4)HMM前向后向算法训练得到各个动作HMM模型、HMM前向算法选择最适合的HMM模型即判定所属动作。
本发明的有益效果是:HMM模型的输入使用聚类分析简化后的特征数据,不但能够实现多帧图像的姿态识别,还能有效的降低了内存占用和运算时间。另外此方法对单帧噪声有一定的鲁棒性。
附图说明
图1是本发明的用于家庭老人监护的姿态识别方法的训练过程流程图。
图2是本发明的用于家庭老人监护的姿态识别方法的测试过程流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明的基于多帧图像的用于家庭老人监护的姿态识别方法,将K均值聚类识别算法和隐马尔科夫模型相结合,所述方法包括以下步骤:
步骤A:训练阶段,首先将同一姿态动作的所有视频单帧的特征数据作聚类分析,然后由HMM前向后向算法训练该动作经聚类识别分析后的特征参数进而得到HMM模型参数(具体包括初始状态概率矩阵π、隐含状态转移概率矩阵A、观测状态转移概率矩阵B);
其中初始状态指先验设定单帧人体姿态是某一种姿态的概率;隐含状态是指单帧人体姿态由一种姿态在下一帧转换到其他姿态的概率;观测状态是指给定单帧人体姿态下特征向量属于2^n中某一个聚类点群中心的概率。
步骤B:识别阶段,将待识别视频每帧提取的特征向量做聚类分析识别后,计算每一个候选动作的HMM模型产生待识别视频的特征序列的概率,最大者即为判定动作。
附图1是本发明的姿态识别训练过程的流程图。
1)对某一个姿态动作(如摔倒)的视频文件的每一帧提取特征参数,得到样本的特征矩阵,通过LBG聚类量化为2^n(其中n为大于等于1的整数)个聚类点群中心,并分别标号为0~2^n-1,存储该动作的聚类点群中心数据;2)选定特定动作(如摔倒)的视频文件,提取单帧图像中前景的特征参数,得到特征向量,计算当前帧的特征向量与各个候选姿态聚类点群中心向量之间的欧几里得距离,选择具有最小距离候选姿态的标号0~2^n-1作为训练的特征参数;3)将所得一个连续姿态动作的聚类点群中心标号组成一个状态序列(长度为T),当作HMM训练模型的输入,以得到该动作的HMM模型参数文件。循环执行上述三个步骤,训练得到所有动作的聚类点群中心数据和HMM模型数据。其中,所述特征参数采用目标轮廓的宽高比、周长、面积、矩、重心、离心率、傅里叶描述子。
附图2是本发明的姿态识别测试过程的流程图。
1)根据经验设定一个动作的有效帧数T,提取T帧的特征参数;2)依次使用所有候选动作的聚类点群中心数据和候选动作对应的HMM模型参数进行识别判断,得到所有动作识别概率;3)概率最高的HMM模型对应姿态即为所判定的动作。
实验结果表明,该方法在降低计算量和内存占用的前提下,实现了对多帧图像的姿态识别,而且运行时间相对单帧识别缩小了近3倍,相对直接使用HMM多帧识别缩小了近2倍,并提高了算法的鲁棒性。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (4)
1.一种基于多帧图像的用于家庭老人监护的姿态识别方法,其特征在于:所述方法将K均值聚类识别算法和隐马尔科夫模型相结合,所述方法包括以下步骤:
步骤A:训练阶段,首先将同一姿态动作的所有视频单帧的特征数据作聚类分析,然后由HMM前向后向算法训练该动作经聚类识别分析后的特征参数进而得到HMM模型参数;
步骤B:识别阶段,将待识别视频每帧提取的特征向量做聚类分析识别后,计算每一个候选动作的HMM模型产生待识别视频的特征序列的概率,最大者即为判定动作。
2.根据权利要求1所述的姿态识别方法,其特征在于:所述步骤A包括以下步骤:
步骤A1:对某一姿态动作的所有视频的每一帧提取特征参数,得到样本的特征矩阵,通过K均值聚类分析得到2^n个聚类点群中心数据,其中n为大于等于1的整数,并分别标号;
步骤A2:对A1所选的某一姿态动作的视频文件,提取每一帧图像的特征向量,计算特征向量与该动作的各个中间姿态聚类中心向量的欧几里得距离,选取距离最小的聚类中心的标号代表当前帧的特征参数;
步骤A3:将A2聚类识别得到的聚类中心标号组成一个中间状态序列,长度为T,当作HMM训练模型的输入,经由HMM前向后向算法以得到该动作的HMM模型参数文件;
步骤A4:循环执行步骤A1~A3,直至训练完所有动作。
3.根据权利要求1所述的姿态识别方法,其特征在于:所述步骤A包括以下步骤:
步骤B1:根据经验设定一个动作的有效帧数T,提取T帧的特征参数;
步骤B2:依次使用所有候选动作的聚类中心数据和HMM模型参数进行识别判断,得到识别概率;
步骤B3:选出概率最高的HMM模型,即为所识别的动作。
4.根据权利要求2所述的姿态识别方法,其特征在于:所述特征参数采用目标轮廓的宽高比、周长、面积、矩、重心、离心率、傅里叶描述子。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510066640.7A CN104636756A (zh) | 2015-02-06 | 2015-02-06 | 一种用于家庭老人监护的姿态识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510066640.7A CN104636756A (zh) | 2015-02-06 | 2015-02-06 | 一种用于家庭老人监护的姿态识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104636756A true CN104636756A (zh) | 2015-05-20 |
Family
ID=53215484
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510066640.7A Pending CN104636756A (zh) | 2015-02-06 | 2015-02-06 | 一种用于家庭老人监护的姿态识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104636756A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105559789A (zh) * | 2015-12-31 | 2016-05-11 | 成都麦杰康科技有限公司 | 跌倒检测系统及方法 |
CN108006898A (zh) * | 2017-11-30 | 2018-05-08 | 奥克斯空调股份有限公司 | 电子设备、控制系统及方法 |
CN108710819A (zh) * | 2018-03-28 | 2018-10-26 | 上海乐愚智能科技有限公司 | 一种消除安全隐患的方法、装置、存储介质及机器人 |
CN108764131A (zh) * | 2018-05-25 | 2018-11-06 | 哈尔滨理工大学 | 一种基于视频处理的自适应阈值多目标摔倒检测方法 |
CN112598052A (zh) * | 2020-12-21 | 2021-04-02 | 中建八局第二建设有限公司 | 一种基于K-Means的机械姿态分析方法及系统 |
CN116108391A (zh) * | 2023-04-12 | 2023-05-12 | 江西珉轩智能科技有限公司 | 一种基于无监督学习的人体姿态分类识别系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040120554A1 (en) * | 2002-12-21 | 2004-06-24 | Lin Stephen Ssu-Te | System and method for real time lip synchronization |
US20070154071A1 (en) * | 2005-12-29 | 2007-07-05 | Microsoft Corporation | Signature verification |
CN103902984A (zh) * | 2014-04-15 | 2014-07-02 | 福州大学 | 一种改进的动态手势识别的hmm模型训练算法 |
CN103942575A (zh) * | 2014-04-02 | 2014-07-23 | 公安部第三研究所 | 基于场景和马尔科夫逻辑网的智能行为分析系统及方法 |
-
2015
- 2015-02-06 CN CN201510066640.7A patent/CN104636756A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040120554A1 (en) * | 2002-12-21 | 2004-06-24 | Lin Stephen Ssu-Te | System and method for real time lip synchronization |
US20070154071A1 (en) * | 2005-12-29 | 2007-07-05 | Microsoft Corporation | Signature verification |
CN103942575A (zh) * | 2014-04-02 | 2014-07-23 | 公安部第三研究所 | 基于场景和马尔科夫逻辑网的智能行为分析系统及方法 |
CN103902984A (zh) * | 2014-04-15 | 2014-07-02 | 福州大学 | 一种改进的动态手势识别的hmm模型训练算法 |
Non-Patent Citations (6)
Title |
---|
Y. ZHU: "Using moment invariants and HMM in facial expression", 《IMAGE ANALYSIS AND INTERPRETATION,2000.PROCEEDINGS.4TH IEEE SOUTHWEST SYMPOSIUM》 * |
华茜菲: "基于视频的人体行为表征及识别方法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
文艳娥: "视频监控中运动图像检测与人体姿态识别的研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
李弼程等: "《模式识别原理与应用》", 28 February 2008 * |
杨艳芳等: "一种隐马尔可夫模型人脸表情分析算法", 《工程图学学报》 * |
马婉婕等: "基于神经网络集成的手写识别系统", 《计算机应用与软件》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105559789A (zh) * | 2015-12-31 | 2016-05-11 | 成都麦杰康科技有限公司 | 跌倒检测系统及方法 |
CN108006898A (zh) * | 2017-11-30 | 2018-05-08 | 奥克斯空调股份有限公司 | 电子设备、控制系统及方法 |
CN108710819A (zh) * | 2018-03-28 | 2018-10-26 | 上海乐愚智能科技有限公司 | 一种消除安全隐患的方法、装置、存储介质及机器人 |
CN108764131A (zh) * | 2018-05-25 | 2018-11-06 | 哈尔滨理工大学 | 一种基于视频处理的自适应阈值多目标摔倒检测方法 |
CN108764131B (zh) * | 2018-05-25 | 2021-11-30 | 哈尔滨理工大学 | 一种基于视频处理的自适应阈值多目标摔倒检测方法 |
CN112598052A (zh) * | 2020-12-21 | 2021-04-02 | 中建八局第二建设有限公司 | 一种基于K-Means的机械姿态分析方法及系统 |
CN116108391A (zh) * | 2023-04-12 | 2023-05-12 | 江西珉轩智能科技有限公司 | 一种基于无监督学习的人体姿态分类识别系统 |
CN116108391B (zh) * | 2023-04-12 | 2023-06-30 | 江西珉轩智能科技有限公司 | 一种基于无监督学习的人体姿态分类识别系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104636756A (zh) | 一种用于家庭老人监护的姿态识别方法 | |
Zhan et al. | Face detection using representation learning | |
CN102799870B (zh) | 基于分块一致lbp和稀疏编码的单训练样本人脸识别方法 | |
CN103186774A (zh) | 一种基于半监督学习的多姿态人脸表情识别方法 | |
Wang et al. | Boosted multi-task learning for face verification with applications to web image and video search | |
US8837773B2 (en) | Apparatus which detects moving object from image and method thereof | |
CN106778796B (zh) | 基于混合式协同训练的人体动作识别方法及系统 | |
Zhang et al. | Real-time multi-view face detection | |
US20130294651A1 (en) | System and method for gesture recognition | |
CN103902978B (zh) | 人脸检测及识别方法 | |
CN103942577A (zh) | 视频监控中基于自建立样本库及混合特征的身份识别方法 | |
CN109558855B (zh) | 一种基于手掌轮廓特征与模版匹配法相结合的空间手势识别方法 | |
Wang et al. | Improving human action recognition by non-action classification | |
CN101661554A (zh) | 远距离视频下的正面人体自动身份识别方法 | |
KR20110109695A (ko) | 얼굴 인식 시스템 및 그 얼굴 인식 방법 | |
CN102855488A (zh) | 三维手势识别方法和系统 | |
Parkhi et al. | It's in the bag: Stronger supervision for automated face labelling | |
CN107832713A (zh) | 一种基于OptiTrack的人体姿态识别方法 | |
Zhou et al. | Real-time action recognition based on key frame detection | |
Alletto et al. | Head pose estimation in first-person camera views | |
Yin et al. | Weakly Supervised Metric Learning towards Signer Adaptation for Sign Language Recognition. | |
CN105678265A (zh) | 基于流形学习的数据降维方法及装置 | |
KR20110029805A (ko) | 시각 기반 사용자 연령대 구분 및 추정 방법 | |
Khryashchev et al. | Gender and age recognition for video analytics solution | |
CN103902975A (zh) | 一种基于平衡型Vector Boosting算法的人眼状态检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150520 |
|
RJ01 | Rejection of invention patent application after publication |