CN102393910B - 一种基于非负矩阵分解和隐马尔科夫模型的人体行为识别方法 - Google Patents
一种基于非负矩阵分解和隐马尔科夫模型的人体行为识别方法 Download PDFInfo
- Publication number
- CN102393910B CN102393910B CN 201110181112 CN201110181112A CN102393910B CN 102393910 B CN102393910 B CN 102393910B CN 201110181112 CN201110181112 CN 201110181112 CN 201110181112 A CN201110181112 A CN 201110181112A CN 102393910 B CN102393910 B CN 102393910B
- Authority
- CN
- China
- Prior art keywords
- behavior
- matrix
- training
- row
- behavior sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
一种基于非负矩阵分解和隐马尔科夫模型的人体行为识别方法,包括离线训练阶段,首先对选取的各类行为序列训练数据进行图像预处理,获得所有训练数据的总样本数据矩阵A;将A进行非负矩阵分解(NMF),获得基矩阵W和基向量数r,根据W和A得到各类训练行为序列的特征矩阵Ei;初始化各类训练行为序列的隐马尔科夫模型(HMM),并分别估计其最优参数;在线识别阶段,首先对输入的待识别行为序列进行图像预处理,获得该行为序列的原始矩阵a;根据W和a得到特征矩阵e;最后计算待识别行为序列与各类训练行为序列的似然值,确定其行为类别。本发明得到的人体行为识别率较高,可提高应用于实时智能视频监控系统中的人体行为自动分析能力。
Description
技术领域
本发明属于模式识别领域,涉及人工智能,计算机视觉和图像处理等领域,特别涉及智能视频监控系统中的人体行为识别方法。
背景技术
近年来,视频监控技术备受社会关注,已经被应用到了生活中的方方面面。摄像头在许多社区,街道,校园内都随处可见。人体行为识别和理解一直是智能视频监控系统领域最活跃的主题,它要求从摄像机捕获的数据中检测、跟踪运动目标,并最终识别和理解目标行为。
目前,人体行为识别的方法主要分为两类:模板匹配法和状态空间法。前者是将视频序列转换为一组静态形状模式,然后将其与预先保存好的模板进行比较,选择与测试序列距离最小的模板所属类别作为被测试序列的最终识别结果,该方法虽然简单,但对相邻帧间的动态特性缺乏考虑,难以取得较好的效果;后者定义每个静态姿势作为一个状态,将这些状态之间通过某种概率联系起来,任何运动序列可以看作是这些静态姿势的不同状态之间的一次遍历过程,在整个遍历过程中计算联合似然值并将最大值作为行为分类的标准,该方法能够较好的刻画人体行为的本质特征,但每一帧行为特征值的提取对结果的影响比较大。
目前,许多特征提取方法可用于状态空间法中行为帧的特征提取,如Hu矩,R变换等,但是采用这些方法提取特征得到的人体行为识别率不高,难以达到实时应用要求。因此,如何从行为帧中提取得到更优的特征是提高人体行为分析识别率的一个关键问题。
发明内容
针对目前在人体行为识别中使用的特征提取方法不能够提取优良的特征而导致识别率不高的问题,本发明提出一种能够有效提升识别率的基于非负矩阵分解和隐马尔科夫模型的人体行为识别方法,将非负矩阵分解方法用于人体行为特征的提取,并使用隐马尔科夫模型对行为特征进行行为的识别与分类。
为实现上述目的,本发明的技术解决方案是:
一种基于非负矩阵分解和隐马尔科夫模型的人体行为识别方法,所述人体行为识别方法包括以下过程:
(一)、离线训练阶段,包括以下步骤:
1.1,在行为数据库中选取待识别类型行为序列作为训练数据,假设共选取了NUM个行为序列,NUM为自然数,对每一行为序列进行图像预处理,得到该行为连续N帧的二值化图像;
1.2,将得到的每一帧二值化图像的像素矩阵按列拆开,并按顺序首尾相连形成一列,则一个训练行为序列可以得到一个包含N列的原始矩阵Ai;
1.3,将NUM个训练行为序列所得到的原始矩阵按列方式组合在一起,得到一个具有N×NUM列的总样本数据矩阵A;
1.4,将获得的总样本数据矩阵A进行非负矩阵分解,以获得基矩阵W和系数矩阵H,分解原理为:
Am×n≈Wm×rHr×n
其中,r为基向量数,其为任意值且(m+n)r<m×n;分解方法为对W和H按下式进行迭代更新,直至||A-WH||2收敛:
其中,ij和ki均为矩阵的下标,表示矩阵在第i(k)行和第j(i)列的值;
1.5,以基矩阵W的列向量为基向量构造特征子空间,将每一个训练行为序列的原始矩阵Ai投影到该特征子空间,得到该训练行为序列的特征向量ei,计算公式为:
ei=WTAi
则可知ei的大小为r×N,按列组合ei可得各类训练行为特征矩阵Ei;
1.6,为每一类行为建立一个隐马尔科夫模型,初始化各类行为的隐马尔科夫模型,并采用Baum-Welch算法根据各类训练行为特征矩阵Ei分别估计各个隐马尔科夫模型的最优参数;
(二)在线识别阶段,包括以下步骤:
2.1,读取待识别的测试行为序列,对其进行图像预处理,得到该行为连续N帧的二值化图像;
2.2,将得到的每一帧二值化图像的像素矩阵按列拆开,并按顺序首尾相连形成一列,则得到一个N列的原始矩阵a;
2.3,以训练样本所得到的基矩阵W的列向量为基向量构造特征子空间,将待识别行为序列的原始矩阵a投影到该特征子空间,得到该行为序列的特征向量er×N,计算公式为:
e=WTa
2.4,使用在离线训练阶段已经估计好最优参数的HMM,使用前向后向算法分别计算特征向量e与每一类训练行为在N个分量上的似然值;
2.5,计算待识别行为序列与每一类训练行为序列的总似然值,即将N个分量上的似然值相加,并比较总似然值大小,依最大似然原则,总似然值最大的训练行为所在的行为类别即为该行为的行为类别,完成人体行为识别。
进一步,所述步骤1.1和步骤2.1中,预处理包括运动目标检测、噪声处理和二值化处理。
本发明的技术构思为:该方法的一个递推过程包括两个阶段,分别为离线训练阶段和在线识别阶段。
离线训练阶段包括以下基本步骤:
1.1、对各个训练行为序列进行图像预处理。
1.2、获取训练行为序列原始矩阵Ai。
1.3、按列组合各个行为序列原始矩阵,得到总样本数据矩阵A。
1.4、对A进行非负矩阵分解获取基矩阵W。
1.5、根据基矩阵W形成特征子空间,计算各类行为特征矩阵Ei。
1.6、初始化隐马尔科夫模型,并根据特征矩阵E估计其最优参数。
在线识别阶段包括以下基本步骤:
2.1、读取待识别行为序列并对其进行图像预处理。
2.2、获取该行为序列原始矩阵a。
2.3、根据W及a计算该行为的特征矩阵e。
2.4、计算特征向量e与每一类训练行为序列在N个分量上的似然值。
2.5、计算总似然值并确定该行为类别。
本发明的有益效果主要表现在:采用非负矩阵分解方法提取人体行为序列的特征后,得到的行为识别率高于其他方法得到的识别率,可提高应用于实时智能视频监控系统中的人体行为自动分析能力。
附图说明
图1为本发明的一种基于非负矩阵分解和隐马尔科夫模型的人体行为识别方法流程图。
图2为本发明的一个连续动作的样本数据的原始矩阵Ai获取示意图。
图3为本发明当基向量数r=10时一帧图像的特征向量获取示意图。
图4为本发明NMF方法中基向量数r取不同值时的行为识别率比较图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
参照图1~图3,一种基于非负矩阵分解和隐马尔科夫模型的人体行为识别方法,采用非负矩阵分解方法进行人体行为特征的提取,并使用隐马尔科夫模型来进行行为的识别与分类。
一个递推过程包括两个阶段,分别为离线训练阶段和在线识别阶段。
(一)离线训练阶段包括以下步骤:
1.1,在行为数据库中选取待识别类型行为序列作为训练数据,假设共选取了NUM个行为序列,对每一行为序列进行图像预处理,包括运动目标检测,噪声处理等,得到该行为连续N帧的二值化图像。
1.2,将得到的每一帧二值化图像的像素矩阵按列拆开,并按顺序首尾相连形成一列,则一个训练行为序列可以得到一个包含N列的原始矩阵Ai。
1.3,将NUM个训练行为序列所得到的原始矩阵按列方式组合在一起,得到一个具有N×NUM列的总样本数据矩阵A。
1.4,将获得的总样本数据矩阵A进行非负矩阵分解(NMF),以获得基矩阵W和系数矩阵H,分解原理为:
Am×n≈Wm×rHr×n
其中,r为基向量数,其为任意值且(m+n)r<m×n。分解方法为对W和H按下式进行迭代更新,直至||A-WH||2收敛:
其中,ij和ki均为矩阵的下标,表示矩阵在第i(k)行和第j(i)列的值。
1.5,以基矩阵W的列向量为基向量构造特征子空间,将每一个训练行为序列的原始矩阵Ai投影到该特征子空间,得到该训练行为序列的特征向量ei,计算公式为:
ei=WTAi
则可知ei的大小为r×N,按列组合ei可得各类训练行为特征矩阵Ei。
1.6,为每一类行为建立一个隐马尔科夫模型(HMM),初始化各类行为的隐马尔科夫模型,并采用Baum-Welch算法根据各类训练行为特征矩阵Ei分别估计各个隐马尔科夫模型的最优参数。
(二)在线识别阶段包括以下步骤:
2.1,读取待识别的测试行为序列,对其进行图像预处理,包括运动目标检测,噪声处理等,得到该行为连续N帧的二值化图像;
2.2,将得到的每一帧二值化图像的像素矩阵按列拆开,并按顺序首尾相连形成一列,则得到一个N列的原始矩阵a;
2.3,以训练样本所得到的基矩阵W的列向量为基向量构造特征子空间,将待识别行为序列的原始矩阵a投影到该特征子空间,得到该行为序列的特征向量er×N,计算公式为:
e=WTa
2.4,使用在离线训练阶段已经估计好最优参数的HMM,使用前向后向算法分别计算特征向量e与每一类训练行为在N个分量上的似然值。
2.5,计算待识别行为序列与每一类训练行为序列的总似然值,即将N个分量上的似然值相加,并比较总似然值大小,依最大似然原则,总似然值最大的训练行为所在的行为类别即为该行为的行为类别,从而完成人体行为识别。
本实施例通过采用以色列Weizmann科学院的人体行为数据库,将本发明和采用Hu矩和R变换进行特征提取的行为识别方法进行比较。
根据图2所示的方法,在离线训练阶段,使用数据库中7类行为共67个视频行为序列作为训练数据,每一个视频训练序列可以得到一个4000×15大小的样本数据矩阵,将这67个矩阵组合得到原始矩阵A4000×1005;通过非负矩阵分解得到基矩阵W4000×r和系数矩阵Hr×1005,其中根据训练序列的样本数据矩阵和基矩阵W4000×r计算得到各类行为的特征矩阵E;最后,根据7类行为初始化7组HMM并根据其特征矩阵E分别估计其最优参数。
在在线识别阶段,首先得到待识别视频序列的原始矩阵a4000×15,根据基矩阵W4000×r计算该数据的特征矩阵er×15,图3是当基向量数r=10时一帧图像的特征向量获取示意图;使用在离线训练阶段已经估计好最优参数的HMM,用前向后向算法分别计算特征向量e与每一类训练行为在N个分量上的似然值;最后计算总似然值,依最大似然原则,确定行为类别。
本发明的一种基于非负矩阵分解和隐马尔科夫模型的人体行为识别方法在基向量r取不同值时的识别率如图4所示,由图4可见,本发明方法在基向量数r取350时识别效果达到最优。将本发明方法在基向量数r取最优值350时得到的识别率和采用Hu矩、R变换提取特征得到的人体行为识别率进行比较,比较结果如表1所示。从表1可以看出,本发明方法得到的识别率明显高于其他两种方法,即本发明方法的人体行为识别效果优于其他两种方法。
表1。
Claims (2)
1.一种基于非负矩阵分解和隐马尔科夫模型的人体行为识别方法,其特征在于:所述人体行为识别方法包括以下过程:
(一)、离线训练阶段,包括以下步骤:
1.1,在行为数据库中选取待识别类型行为序列作为训练数据,假设共选取了NUM个行为序列,NUM为自然数,对每一行为序列进行图像预处理,得到该行为序列连续N帧的二值化图像;
1.2,将得到的每一帧二值化图像的像素矩阵按列拆开,并按顺序首尾相连形成一列,则一个训练行为序列得到一个包含N列的原始矩阵Ai;
1.3,将NUM个训练行为序列所得到的原始矩阵按列方式组合在一起,得到一个具有N×NUM列的总样本数据矩阵A;
1.4,将获得的总样本数据矩阵A进行非负矩阵分解,以获得基矩阵W和系数矩阵H,分解原理为:
Am×n≈Wm×rHr×n
其中,r为基向量数,其为任意值且(m+n)r<m×n;分解方法为对W和H按下式进行迭代更新,直至||A-WH||2收敛:
其中,ij和ki均为矩阵的下标,表示矩阵在第i(k)行和第j(i)列的值;
1.5,以基矩阵W的列向量为基向量构造特征子空间,将每一个训练行为序列的原始矩阵Ai投影到该特征子空间,得到该训练行为序列的特征向量ei,计算公式为:
ei=WTAi
则知ei的大小为r×N,按列组合ei可得各类训练行为特征矩阵Ei;
1.6,为每一类行为建立一个隐马尔科夫模型,初始化各类行为的隐马尔科夫模型,并采用Baum-Welch算法根据各类训练行为特征矩阵Ei分别估计各个隐马尔科夫模型的最优参数;
(二)在线识别阶段,包括以下步骤:
2.1,读取待识别的测试行为序列,对其进行图像预处理,得到该行为连续N帧的二值化图像;
2.2,将得到的每一帧二值化图像的像素矩阵按列拆开,并按顺序首尾相连形成一列,则得到一个N列的原始矩阵a;
2.3,以训练样本所得到的基矩阵W的列向量为基向量构造特征子空间,将待识别行为序列的原始矩阵a投影到该特征子空间,得到该行为序列的特征向量er×N,计算公式为:
e=WTa
2.4,使用在离线训练阶段已经估计好最优参数的HMM,使用前向后向算法分别计算特征向量e与每一类训练行为在N个分量上的似然值;
2.5,计算待识别行为序列与每一类训练行为序列的总似然值,即将N个分量上的似然值相加,并比较总似然值大小,依最大似然原则,总似然值最大的训练行为所在的行为类别即为该行为的行为类别,完成人体行为识别。
2.如权利要求1所述的基于非负矩阵分解和隐马尔科夫模型的人体行为识别方法,其特征在于:所述步骤1.1和步骤2.1中,预处理包括运动目标检测、噪声处理和二值化处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110181112 CN102393910B (zh) | 2011-06-29 | 2011-06-29 | 一种基于非负矩阵分解和隐马尔科夫模型的人体行为识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110181112 CN102393910B (zh) | 2011-06-29 | 2011-06-29 | 一种基于非负矩阵分解和隐马尔科夫模型的人体行为识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102393910A CN102393910A (zh) | 2012-03-28 |
CN102393910B true CN102393910B (zh) | 2013-04-24 |
Family
ID=45861230
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201110181112 Active CN102393910B (zh) | 2011-06-29 | 2011-06-29 | 一种基于非负矩阵分解和隐马尔科夫模型的人体行为识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102393910B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102789639B (zh) * | 2012-07-16 | 2015-02-04 | 中国科学院自动化研究所 | 基于非负矩阵分解的高光谱图像和可见光图像融合方法 |
CN103440471B (zh) * | 2013-05-05 | 2016-08-10 | 西安电子科技大学 | 基于低秩表示的人体行为识别方法 |
CN103544503B (zh) * | 2013-11-14 | 2016-09-21 | 中国科学院自动化研究所 | 一种基于多实例马尔科夫模型的行为识别方法 |
CN103824062B (zh) * | 2014-03-06 | 2017-01-11 | 西安电子科技大学 | 基于非负矩阵分解的分部位人体运动识别方法 |
JP2016006611A (ja) * | 2014-06-20 | 2016-01-14 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
CN104063721B (zh) * | 2014-07-04 | 2017-06-16 | 中国科学院自动化研究所 | 一种基于语义特征自动学习与筛选的人类行为识别方法 |
CN107563287B (zh) * | 2017-06-16 | 2019-12-31 | 江汉大学 | 人脸识别方法和装置 |
CN108549856B (zh) * | 2018-04-02 | 2021-04-30 | 上海理工大学 | 一种人体动作和路况识别方法 |
CN109410098A (zh) * | 2018-09-04 | 2019-03-01 | 四川文轩教育科技有限公司 | 一种学生课堂行为分析及监控方法 |
CN110569879B (zh) * | 2019-08-09 | 2024-03-15 | 平安科技(深圳)有限公司 | 舌头图像提取方法、装置及计算机可读存储介质 |
CN112347991B (zh) * | 2020-11-30 | 2022-04-01 | 北京理工大学 | 一种基于隐马尔可夫分析滑雪运动序列的方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4571628B2 (ja) * | 2003-06-30 | 2010-10-27 | 本田技研工業株式会社 | 顔認識システム及び方法 |
CN101299234B (zh) * | 2008-06-06 | 2011-05-11 | 华南理工大学 | 一种基于嵌入式隐马尔可夫模型的人眼状态识别方法 |
CN101464950B (zh) * | 2009-01-16 | 2011-05-04 | 北京航空航天大学 | 基于在线学习和贝叶斯推理的视频人脸识别与检索方法 |
-
2011
- 2011-06-29 CN CN 201110181112 patent/CN102393910B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN102393910A (zh) | 2012-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102393910B (zh) | 一种基于非负矩阵分解和隐马尔科夫模型的人体行为识别方法 | |
Zhang et al. | Efficient temporal sequence comparison and classification using gram matrix embeddings on a riemannian manifold | |
Baccouche et al. | Sequential deep learning for human action recognition | |
Zhan et al. | Face detection using representation learning | |
Zhao et al. | A fuzzy background modeling approach for motion detection in dynamic backgrounds | |
Minhas et al. | Incremental learning in human action recognition based on snippets | |
CN107194418B (zh) | 一种基于对抗特征学习的水稻蚜虫检测方法 | |
CN101470809B (zh) | 一种基于扩展混合高斯模型的运动目标检测方法 | |
Akkaladevi et al. | Action recognition for human robot interaction in industrial applications | |
Dreuw et al. | Tracking using dynamic programming for appearance-based sign language recognition | |
Mahmud et al. | Human face recognition using PCA based Genetic Algorithm | |
Zhao et al. | Learning view-disentangled human pose representation by contrastive cross-view mutual information maximization | |
CN101324958A (zh) | 一种目标跟踪方法及装置 | |
Rao et al. | Neural network classifier for continuous sign language recognition with selfie video | |
Peng et al. | Motion boundary based sampling and 3D co-occurrence descriptors for action recognition | |
Vainstein et al. | Modeling video activity with dynamic phrases and its application to action recognition in tennis videos | |
Atikuzzaman et al. | Human activity recognition system from different poses with cnn | |
Alp et al. | Action recognition using MHI based Hu moments with HMMs | |
Jia et al. | Object Detection Based on the Improved Single Shot MultiBox Detector | |
CN103530651A (zh) | 一种基于标记分布的头部姿态估计方法 | |
CN105574494B (zh) | 一种多分类器姿势识别方法及装置 | |
Ahmed et al. | Two person interaction recognition based on effective hybrid learning | |
Uddin et al. | Shape-based human activity recognition using independent component analysis and hidden Markov model | |
DelRose et al. | Evidence feed forward hidden Markov model: A new type of hidden Markov model | |
Huang et al. | View-independent behavior analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20201127 Address after: 11th floor, donglecheng international, Shuguang Road, Chengguan Street, Dongming County, Heze City, Shandong Province Patentee after: Heze Jianshu Intelligent Technology Co., Ltd Address before: Hangzhou City, Zhejiang province 310014 City Zhaohui District Six Patentee before: ZHEJIANG University OF TECHNOLOGY |
|
TR01 | Transfer of patent right |