CN102930250B - 一种多尺度条件随机场模型的动作识别方法 - Google Patents
一种多尺度条件随机场模型的动作识别方法 Download PDFInfo
- Publication number
- CN102930250B CN102930250B CN201210406248.9A CN201210406248A CN102930250B CN 102930250 B CN102930250 B CN 102930250B CN 201210406248 A CN201210406248 A CN 201210406248A CN 102930250 B CN102930250 B CN 102930250B
- Authority
- CN
- China
- Prior art keywords
- scale
- action
- random field
- represent
- field models
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种多尺度条件随机场模型的动作识别方法,包括以下步骤,首先采集人体运动视频信息,预处理采集到的人体运动目标,然后同时考虑人的运动轨迹,人的体态特征以及人的肢体运动情况,利用多尺度特征提取的方法从大、中、小三个尺度上提取人体运动特征,最后使用多尺度条件随机场模型进行动作的建模与识别。本发明方法基于多尺度条件随机场模型,充分利用动作序列的上下文信息以及不同尺度状态之间的相互限制和影响信息,解决了人体运动过程中同一个时刻存在着多个动作模式进行识别的问题,且识别率明显提高。
Description
技术领域
本发明属于智能视觉监控和机器学习技术领域,涉及一种多尺度条件随机场模型的动作识别方法。
背景技术
利用图像信息的视频分析系统越来越多的被应用于各个领域,如视频监控、视频检索、医疗诊断、运动视频分析及基于感知的高级人机接口等。
但是目前,在基于视频监控及分析的诸多研究领域中,大多数的研究都是从单尺度上研究人体运动,现实中,人的运动同时包含着多个尺度的运动细节,如果同一时刻人体运动存在着多种动作模式时,其识别率较低,难以达到识别技术要求。
因此,不同尺度上的运动特征在运动分析中具有不同的角色,恰当地将不同尺度上的动作特征结合起来对解决人体运动问题有重要意义。
发明内容
本发明的目的是提供一种多尺度条件随机场模型的动作识别方法,解决了现有技术在同一时刻存在着多种动作模式时,识别率较低的问题。
本发明所采用的技术方案是,一种多尺度条件随机场模型的动作识别方法,该方法按照以下步骤实施:
步骤1、多尺度特征描述
通过大、中、小三个尺度特征提取方法提取人体运动的多尺度特征;
步骤2、建立多尺度条件随机场模型
多尺度条件随机场模型的结构包含三层结构,分别对应着大、中、小三个尺度及各尺度间的关系,设x1,t、x2,t及x3,t分别表示t时刻提取到的不同尺度上的特征值,y1,t、y2,t及y3,t分别为对应的状态变量值,{fk,gk}分别表示给定的一个尺度内的状态转移特征函数和观察特征函数,{hk,pk,qk}则表示两个尺度之间的状态转移特征函数和观察特征函数;
步骤3、建立多尺度条件随机场模型的表达式
设X={X1,X2,X3}为提取出来的特征数据,其中X1={x1,1,x1,2,…,x1,t,…,x1,T}、X2={x2,1,x2,2,…,x2,t,…,x2,T}、X3={x3,1,x3,2,…,x3,t,…,x3,T}分别表示大尺度、中尺度和小尺度上的特征数据;另外,Y={Y1,Y2,Y3}表示三个尺度上对应的标记序列,其中的Y1={y1,1,...,y1,T}、Y2={y2,1,...,y2,T}、Y3={y3,1,...,y3,T},则所建立的多尺度条件随机场模型描述为:
其中的φ是链内的势函数,ψ是链间的势函数,具体的形式如下:
其中,{fk,gk}分别表示给定的一个尺度内的状态转移特征函数和观察特征函数,{hk,pk,qk}则表示两个尺度之间的状态转移特征函数和观察特征函数,λk,μk,αk,βk,γk分别为fk,gk,hk,pk,qk所对应的权重,fk,gk,hk,pk,qk的算式如下:
其中,是第l层的状态空间中的第m个状态的标记值,在这里第1层的状态空间包括了场景中的各个位置区域的标记,是大尺度上的状态标记;第2层的状态空间包括了整个人体意义上的动作类型,表示“走”,是中尺度上的状态标记;第3层的状态空间包括了四肢和头的绝对位置和相对位置情况,表示“挥手”;
步骤4、对多尺度条件随机场模型的参数进行学习
4.1)多尺度条件随机场模型中包含了5组特征函数{fk,gk,hk,pk,qk},以及所对应的5组需要学习的模型参数{λk,μk,αk,βk,γk},所有的参数表达式为:
Λ={λ1,...λJ,,μ1,...μK,,α1,...αL,,β1,...βM,,γ1,...γN,};(13)
4.2)对式(13)所示的多尺度条件随机场模型参数,采用训练样本进行学习,
设(X(i),Y(i))(i=1,2,…,J)是输入的用于训练模型参数的特征数据和对应的标记序列对,采用式(5)的对数形式,得到如下的对数似然度函数,作为学习时的目标函数:
其中是惩罚因子,σ2为高斯先验方差,
对于式(14),使用L-BFGS方法来求解这个大规模无约束问题,所得到的参数集Λ就是要学习的最终模型参数;
4.3)对每种动作类型都建立一个多尺度的条件随机场模型,并进行参数学习,
设共有C种动作类型,则按照式(13)对第i(i=1,2,…,C)种动作类型采用步骤4.2)进行学习,则得到学习后的模型参数,记为Λ(i);
步骤5、进行动作识别
首先获取各种动作的运动视频序列;
然后采用背景建模技术,通过背景减除技术检测到运动目标;
再根据步骤1中的方法提取待识别动作的多尺度特征数据X;
最后利用学习到的每种动作类型的模型参数Λ(i)和多尺度特征数据X,按照式(5)计算待识别的动作的条件概率,设对第i(i=1,2,…,C)种动作类型(其对应的参数为Λ(i)),计算得到的条件概率为:P(Y(i)|X,Λ(i)),若P(Y(i)|X,Λ(i))是这些条件概率中的最大值,即如式(15)所示:
P(Y(i)|X,Λ(i))=max{P(Y(1)|X,Λ(1)),P(Y(2)|X,Λ(2)),…,P(Y(C)|X,Λ(C))},(15)
则待识别的动作类型确定为第i种动作。
本发明的有益效果是,通过从大、中、小三个尺度上提取人体运动特征数据,建立多尺度条件随机场模型(Multi-scaleconditionrandomfieldmodel,MSCRF),最后使用所建立的模型对人体动作进行建模与识别。多尺度条件随机场模型可以充分利用动作序列的上下文信息以及不同尺度状态之间的相互限制和影响信息,识别效果较好。
附图说明
图1是本发明的多尺度条件随机场模型的动作识别方法原理示意图;
图2是本发明的多尺度条件随机场模型的总体结构示意图;
图3是本发明的多尺度条件随机场模型在横向上的结构分布示意图;
图4是本发明的多尺度条件随机场模型在纵向上的结构分布示意图;
图5是本发明的多尺度条件随机场模型动作识别示意图。
具体实施方式
如图1所示,本发明是一种多尺度条件随机场模型的动作识别方法,通过多尺度特征提取方法提取人体运动的多尺度特征,然后建立多尺度条件随机场模型(Multi-scaleconditionrandomfieldmodel,MSCRF),再对建立的模型进行参数学习,最后利用多尺度条件随机场模型进行建模与识别。
以下以目标对象行人边“走路”边“挥手”为例来说明本发明的方法,具体按照以下步骤实施:
步骤1、多尺度特征描述
1.1)大尺度特征提取
设t时刻处运动人体的大尺度特征向量表示为:x1,,t={xc,yc,v,θ},其中的(xc,yc)表示人的质心位置,v表示人的运动速度大小,θ是本帧图像中的运动人体相对于第一帧图像中运动人体的角度。
大尺度特征表示的是运动轨迹相关的信息。
1.2)中尺度特征提取
中尺度是根据整个人体的体态信息进行建模,表示的是整个人体的运动效果,通过关注动态部位进行中尺度动作特征提取,具体过程如下:
设Mt(x,y)表示t时刻的人体运动目标图,则在一个运动周期T内的运动能量图为:
根据得到的运动能量图,计算该运动序列的动态权值掩膜:
最后,得到该运动序列对应的运动权值模型序列x2,t,作为中尺度特征:
x2,t=Mt(x,y)×DWM(x,y);(3)
1.3)小尺度特征提取
小尺度是根据四肢和头的相对位置来进行建模,表示的是四肢的运动情况,设t时刻处运动人体的小尺度特征表示为:
其中,和分别表示人的左手质心和右手质心的坐标,和分别表示左脚质心和右脚质心的坐标,表示头的质心的坐标位置,d1表示左手质心到右手质心的距离,d2表示左脚质心到右脚质心的距离,d3表示左手质心到头质心的距离,d4表示右手质心到头质心的距离。
步骤2、建立多尺度条件随机场模型
图2是本发明的多尺度条件随机场模型的结构,包含三层结构,分别对应着大、中、小三个尺度及各尺度间的关系。图3是对图2中3个尺度的分解图,可以看出每个尺度都是由一个条件随机场模型组成的。图4是对图2中不同尺度之间的关系结构的分解图。从图3及图4可以看出,图2给出的多尺度条件随机场模型结构能够对不同尺度上的动作进行建模,并且能够表示不同尺度上的动作之间的关系,从而可以对同一时刻存在着多种人体动作进行建模。图2、图3及图4中,x1,t、x2,t及x3,t分别表示t时刻提取到的不同尺度上的特征值,y1,t、y2,t及y3,t分别为对应的状态变量值,{fk,gk}分别表示给定的一个尺度内的状态转移特征函数和观察特征函数,{hk,pk,qk}则表示两个尺度之间的状态转移特征函数和观察特征函数。
步骤3、建立多尺度条件随机场模型的表达式
设X={X1,X2,X3}为提取出来的特征数据,其中X1={x1,1,x1,2,…,x1,t,…,x1,T}、X2={x2,1,x2,2,…,x2,t,…,x2,T}、X3={x3,1,x3,2,…,x3,t,…,x3,T}分别表示大尺度、中尺度和小尺度上的特征数据;另外,Y={Y1,Y2,Y3}表示三个尺度上对应的标记序列,其中的Y1={y1,1,...,y1,T}、Y2={y2,1,...,y2,T}、Y3={y3,1,...,y3,T},则所建立的多尺度条件随机场模型描述为:
其中的φ是链内的势函数,ψ是链间的势函数,具体的形式如下:
其中,{fk,gk}分别表示给定的一个尺度内的状态转移特征函数和观察特征函数,{hk,pk,qk}则表示两个尺度之间的状态转移特征函数和观察特征函数,λk,μk,αk,βk,γk分别为fk,gk,hk,pk,qk所对应的权重,fk,gk,hk,pk,qk的算式如下:
其中,是第l层的状态空间中的第m个状态的标记值,在这里第1层的状态空间包括了场景中的各个位置区域的标记,是大尺度上的状态标记;第2层的状态空间包括了整个人体意义上的动作类型,表示“走”,是中尺度上的状态标记;第3层的状态空间包括了四肢和头的绝对位置和相对位置情况,表示“挥手”。
步骤4、对多尺度条件随机场模型的参数进行学习
4.1)多尺度条件随机场模型中包含了5组特征函数{fk,gk,hk,pk,qk},以及所对应的5组需要学习的模型参数{λk,μk,αk,βk,γk},所有的参数表达式为:
Λ={λ1,...λJ,,μ1,...μK,,α1,...αL,,β1,...βM,,γ1,...γN,};(13)
4.2)对式(13)所示的多尺度条件随机场模型参数,采用训练样本进行学习。设(X(i),Y(i))(i=1,2,…,J)是输入的用于训练模型参数的特征数据和对应的标记序列对,采用式(5)的对数形式,得到如下的对数似然度(log-likelihood)函数,作为学习时的目标函数:
其中是惩罚因子,σ2为高斯先验方差,
对于式(14),使用L-BFGS方法来求解这个大规模无约束问题,所得到的参数集Λ就是要学习的最终模型参数。
4.3)对每种动作类型都建立一个多尺度的条件随机场模型,如图2所示,并进行参数学习。
设共有C种动作类型,则按照式(13)对第i(i=1,2,…,C)种动作类型采用步骤4.2)进行学习,则得到学习后的模型参数,记为Λ(i);
步骤5、进行动作识别。
如图5所示,首先获取各种动作的运动视频序列;
然后采用背景建模技术,通过背景减除技术检测到运动目标;
再根据步骤1中的方法提取待识别动作的多尺度特征数据X;
最后利用学习到的每种动作类型的模型参数Λ(i)和多尺度特征数据X,按照式(5)计算待识别的动作的条件概率,设对第i(i=1,2,…,C)种动作类型(其对应的参数为Λ(i)),计算得到的条件概率为:P(Y(i)|X,Λ(i)),若P(Y(i)|X,Λ(i))是这些条件概率中的最大值,即如式(15)所示:
P(Y(i)|X,Λ(i))=max{P(Y(1)|X,Λ(1)),P(Y(2)|X,Λ(2)),…,P(Y(C)|X,Λ(C))},(15)
则待识别的动作类型确定为第i种动作。
Claims (2)
1.一种多尺度条件随机场模型的动作识别方法,其特征在于,该方法按照以下步骤实施:
步骤1、多尺度特征描述
通过大、中、小三个尺度特征,进行提取人体运动的多尺度特征;
步骤2、建立多尺度条件随机场模型
多尺度条件随机场模型的结构包含三层结构,分别对应着大、中、小三个尺度及各尺度间的关系,设x1,t、x2,t及x3,t分别表示t时刻提取到的不同尺度上的特征值,y1,t、y2,t及y3,t分别为对应的状态变量值,{fk,gk}分别表示给定的一个尺度内的状态转移特征函数和观察特征函数,{hk,pk,qk}则表示两个尺度之间的状态转移特征函数和观察特征函数;
步骤3、建立多尺度条件随机场模型的表达式
设X={X1,X2,X3}为提取出来的特征数据,其中X1={x1,1,x1,2,…,x1,t,…,x1,T}、X2={x2,1,x2,2,…,x2,t,…,x2,T}、X3={x3,1,x3,2,…,x3,t,…,x3,T}分别表示大尺度、中尺度和小尺度上的特征数据;另外,Y={Y1,Y2,Y3}表示大、中、小三个尺度上对应的标记序列,其中的Y1={y1,1,...,y1,T}、Y2={y2,1,...,y2,T}、Y3={y3,1,...,y3,T},则所建立的多尺度条件随机场模型描述为:
其中的φ是链内的势函数,ψ是链间的势函数,具体的形式如下:
其中,{fk,gk}分别表示给定的一个尺度内的状态转移特征函数和观察特征函数,{hk,pk,qk}则表示两个尺度之间的状态转移特征函数和观察特征函数,λk,μk,αk,βk,γk分别为fk,gk,hk,pk,qk所对应的权重,fk,gk,hk,pk,qk的算式如下:
其中,是第l层的状态空间中的第m个状态的标记值,是第l层的状态空间中的第n个状态的标记值,在这里第1层的状态空间包括了场景中的各个位置区域的标记,是大尺度上的状态标记;第2层的状态空间包括了整个人体意义上的动作类型,表示“走”,是中尺度上的状态标记;第3层的状态空间包括了四肢和头的绝对位置和相对位置情况,表示“挥手”;
步骤4、对多尺度条件随机场模型的参数进行学习
4.1)多尺度条件随机场模型中包含了5组特征函数{fk,gk,hk,pk,qk},以及所对应的5组需要学习的模型参数{λk,μk,αk,βk,γk},所有的参数表达式为:
Λ={λ1,...,λJ,μ1,...,μK,α1,...,αL,β1,...,βM,γ1,...,γN};(13)
4.2)对式(13)所示的多尺度条件随机场模型参数,采用训练样本进行学习,
设(X(i),Y(i))(i=1,2,…,J)是输入的用于训练模型参数的特征数据和对应的标记序列对,采用式(5)的对数形式,得到如下的对数似然度函数,作为学习时的目标函数:
其中是惩罚因子,σ2为高斯先验方差,
对于式(14),使用L-BFGS方法来求解这个大规模无约束问题,所得到的参数集Λ就是要学习的最终模型参数;
4.3)对每种动作类型都建立一个多尺度的条件随机场模型,并进行参数学习,
设共有C种动作类型,则按照式(13)对第i(i=1,2,…,C)种动作类型采用步骤4.2)进行学习,则得到学习后的模型参数,记为Λ(i);
步骤5、进行动作识别
首先获取各种动作的运动视频序列;
然后采用背景建模技术,通过背景减除技术检测到运动目标;
再根据步骤1中的方法提取待识别动作的多尺度特征数据X;
最后利用学习到的每种动作类型的模型参数Λ(i)和多尺度特征数据X,按照式(5)计算待识别的动作的条件概率,设对第i(i=1,2,…,C)种动作类型,其对应的参数为Λ(i),计算得到的条件概率为:P(Y(i)|X,Λ(i)),若P(Y(i)|X,Λ(i))是这些条件概率中的最大值,即如式(15)所示:
P(Y(i)|X,Λ(i))=max{P(Y(1)|X,Λ(1)),P(Y(2)|X,Λ(2)),…,P(Y(C)|X,Λ(C))},(15)
则待识别的动作类型确定为第i种动作。
2.根据权利要求1所述的多尺度条件随机场模型的动作识别方法,其特征在于,所述的步骤1中的三个尺度特征提取过程是:
1.1)大尺度特征提取
设t时刻处运动人体的大尺度特征向量表示为:x1,t={xc,yc,v,θ},其中的(xc,yc)表示人的质心位置,v表示人的运动速度大小,θ是本帧图像中的运动人体相对于第一帧图像中运动人体的角度;
1.2)中尺度特征提取
中尺度是根据整个人体的体态信息进行建模,表示的是整个人体的运动效果,通过关注动态部位进行中尺度动作特征提取,具体过程如下:
设Mt(x,y)表示t时刻的人体运动目标图,则在一个运动周期T内的运动能量图为:
根据得到的运动能量图,计算该运动序列的动态权值掩膜:
最后,得到该运动序列对应的运动权值模型序列x2,t,作为中尺度特征:
x2,t=Mt(x,y)×DWM(x,y);(3)
1.3)小尺度特征提取
小尺度是根据四肢和头的相对位置来进行建模,表示的是四肢的运动情况,设t时刻处运动人体的小尺度特征表示为:
其中,和分别表示人的左手质心和右手质心的坐标,和分别表示左脚质心和右脚质心的坐标,表示头的质心的坐标位置,d1表示左手质心到右手质心的距离,d2表示左脚质心到右脚质心的距离,d3表示左手质心到头质心的距离,d4表示右手质心到头质心的距离。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210406248.9A CN102930250B (zh) | 2012-10-23 | 2012-10-23 | 一种多尺度条件随机场模型的动作识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210406248.9A CN102930250B (zh) | 2012-10-23 | 2012-10-23 | 一种多尺度条件随机场模型的动作识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102930250A CN102930250A (zh) | 2013-02-13 |
CN102930250B true CN102930250B (zh) | 2015-11-18 |
Family
ID=47645047
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210406248.9A Expired - Fee Related CN102930250B (zh) | 2012-10-23 | 2012-10-23 | 一种多尺度条件随机场模型的动作识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102930250B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103390278B (zh) * | 2013-07-23 | 2016-03-09 | 中国科学技术大学 | 一种视频异常行为检测系统 |
CN107273857B (zh) * | 2017-06-19 | 2021-03-02 | 深圳市酷浪云计算有限公司 | 运动动作的识别方法及装置、电子设备 |
CN107341471B (zh) * | 2017-07-04 | 2019-10-01 | 南京邮电大学 | 一种基于双层条件随机场的人体行为识别方法 |
CN111507216A (zh) * | 2017-11-03 | 2020-08-07 | 阿里巴巴集团控股有限公司 | 无人值守场景中非法行为的识别方法和装置 |
CN112488483B (zh) * | 2020-11-25 | 2024-03-26 | 上上德盛集团股份有限公司 | 一种基于ai技术的ehs透明管理系统及管理方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101425139A (zh) * | 2008-11-05 | 2009-05-06 | 西安理工大学 | 一种视角无关的动作识别方法 |
-
2012
- 2012-10-23 CN CN201210406248.9A patent/CN102930250B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101425139A (zh) * | 2008-11-05 | 2009-05-06 | 西安理工大学 | 一种视角无关的动作识别方法 |
Non-Patent Citations (1)
Title |
---|
基于多层动态贝叶斯网络的人的行为多尺度分析及识别方法;杜友田等;《自动化学报》;20090331;第35卷(第3期);225-232 * |
Also Published As
Publication number | Publication date |
---|---|
CN102930250A (zh) | 2013-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jalal et al. | Human posture estimation and sustainable events classification via pseudo-2D stick model and K-ary tree hashing | |
CN106650687B (zh) | 一种基于深度信息和骨骼信息的姿势矫正方法 | |
Gochoo et al. | Stochastic remote sensing event classification over adaptive posture estimation via multifused data and deep belief network | |
Perez-Sala et al. | A survey on model based approaches for 2D and 3D visual human pose recovery | |
CN102930250B (zh) | 一种多尺度条件随机场模型的动作识别方法 | |
CN107203753A (zh) | 一种基于模糊神经网络和图模型推理的动作识别方法 | |
CN105512621A (zh) | 一种基于Kinect的羽毛球动作指导系统 | |
Alrubayi et al. | A pattern recognition model for static gestures in malaysian sign language based on machine learning techniques | |
CN106066996A (zh) | 人体动作的局部特征表示方法及其在行为识别的应用 | |
CN103268500B (zh) | 一种对行走状态变化具有鲁棒性的步态识别方法 | |
Kim et al. | Golf swing segmentation from a single IMU using machine learning | |
CN105184767B (zh) | 一种运动人体姿态相似性度量方法 | |
Ghotkar et al. | Dynamic hand gesture recognition using hidden Markov model by Microsoft Kinect sensor | |
CN102682452A (zh) | 基于产生式和判别式结合的人体运动跟踪方法 | |
CN104298974A (zh) | 一种基于深度视频序列的人体行为识别方法 | |
CN106127125A (zh) | 基于人体行为特征的分布式dtw人体行为意图识别方法 | |
Echeverria et al. | Toward modeling psychomotor performance in karate combats using computer vision pose estimation | |
CN104616324A (zh) | 基于自适应表观模型和点-集距离度量学习的目标跟踪方法 | |
CN108875586A (zh) | 一种基于深度图像与骨骼数据多特征融合的功能性肢体康复训练检测方法 | |
CN106548194A (zh) | 二维图像人体关节点定位模型的构建方法及定位方法 | |
CN109508686A (zh) | 一种基于层次化特征子空间学习的人体行为识别方法 | |
CN105354532A (zh) | 一种基于手部运动帧数据的手势识别方法 | |
Zang et al. | An extremely fast and precise convolutional neural network for recognition and localization of cataract surgical tools | |
Sharma et al. | Trbaggboost: An ensemble-based transfer learning method applied to Indian Sign Language recognition | |
Zhang | Analyzing body changes of high-level dance movements through biological image visualization technology by convolutional neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20151118 Termination date: 20201023 |