CN102760237B - 三维相关滤波器序列动作识别方法及其装置 - Google Patents
三维相关滤波器序列动作识别方法及其装置 Download PDFInfo
- Publication number
- CN102760237B CN102760237B CN201210185738.0A CN201210185738A CN102760237B CN 102760237 B CN102760237 B CN 102760237B CN 201210185738 A CN201210185738 A CN 201210185738A CN 102760237 B CN102760237 B CN 102760237B
- Authority
- CN
- China
- Prior art keywords
- sigma
- dimensional
- filter
- video
- sequence action
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明涉及一种三维相关滤波器序列动作识别方法及其装置,该方法首先建立样本数据库,针对特定序列动作得到训练样本视频列向量,然后建立动作视频最大平均相关滤波器模板,得到特定序列动作的三维最大平均相关高度滤波器;最后将优化后的滤波器响应值与设定的阈值进行比较,判断待测视频中是否存在特定序列动作。该装置包括三维最大平均相关高度滤波器、滤波器响应计算模块、优化滤波器响应模块和特定序列动作判断模块。本发明算法简便、易于实现、运行效率高,识别准确率高,适用于地铁、车站、银行等场所的监控。
Description
技术领域
本发明属于图像信号处理技术领域,涉及一种三维相关滤波器序列动作识别方法及其装置。
背景技术
目前国内外用于分析和识别行为的模式识别方法大多数是基于时域的匹配模板方法。时域动作分析识别方法往往计算复杂,适应性差,效率低下,识别率不高,而且时域模板是针对单幅图像的,对于序列动作的分析需要形成多个模板进行匹配,以上缺点是动作识别理论算法走向实际应用的瓶颈。
发明内容
本发明要解决的一个技术问题是提供一种可以针对特定序列动作形成一个频域三维相关滤波器模板,以完成特定序列行为动作自动识别的三维相关滤波器序列动作识别方法。该方法算法简便、易于实现、运行效率高、识别率高。
为了解决上述技术问题,本发明的三维相关滤波器序列动作识别方法包括下述步骤:
一、建立样本数据库:
存储至少一个特定序列动作的训练样本视频;每个特定序列动作包含L个训练样本视频,每个训练样本视频包含Q帧图像,每幅图像包含d个像素,其中d=M×N,M×N为每帧图像的大小;则一个特定序列动作的其中任意一个训练样本视频可以表示为s(x,y,t),其中x、y、t分别为某一像素所在列序号、行序号、帧号;
对s(x,y,t)求导,得到s(x,y,t)的导数d(x,y,t);
对d(x,y,t)进行三维傅立叶变换得到三维频域响应矩阵F(u,v,w);
将三维频域响应矩阵F(u,v,w)按照每帧图像像素从左到右,从上到下,帧间按照时间先后顺序排成一个列向量,则针对每个特定序列动作得到L个训练样本视频列向量a1,a2,...,ai,...aL;
二、建立动作视频最大平均相关滤波器模板:
通过计算噪声协方差矩阵C,训练图像的平均能量光谱密度Da和对角平均相似性度矩阵Sa来合成最大平均相关动作高度一维滤波器h;
其中α,β,γ是非负的平衡参数,ma是L个训练样本视频列向量a1,a2,...,ai,...aL的平均值;
C=σ2I(3)
其中σ是白噪声的均方差,I是单位矩阵;Ai是训练样本视频的对角化矩阵,它对角线上的元素是列向量ai的所有元素;*表示复共轭运算;Ma是ma的对角矩阵,它的对角线元素对应向量ma的所有元素。
将一维滤波器h还原成三维滤波器,之后进行三维傅立叶反变换,得到特定序列动作的三维最大平均相关高度滤波器H(x,y,t);
三、计算滤波器响应:
将三维最大平均相关高度滤波器H(x,y,t)和待测试视频t(m,n,q)做相关运算,得到滤波器响应c(m,n,q);
四、优化滤波器响应:
利用式(7)运算得到优化后的滤波器响应c'(m,n,q);
其中EH是代表滤波器能力的尺度值,ES(m,n,q)是待测视频相应的响应;
五、将优化后的滤波器响应值与设定的阈值ρ进行比较,如果大于阈值ρ则认为待测视频中存在特定序列动作,否则认为不存在该特定序列动作;
ρ=kmin(ε1,ε2,ε3,......εT)(10)
其中,k为加权系数,ε1,ε2,...,εT为多个待测视频特定序列动作优化后的滤波器响应值,min表示计算括号内数值的最小值。
本发明首先对特定序列动作的训练样本s(x,y,t)求导,得到训练样本的导数d(x,y,t);然后采用x(水平方向),y(垂直方向),t(时间轴方向)分别进行一维FFT,然后组合得到三维FFT响应,算法简便、易于实现、运行效率高。利用优化后的滤波器响应值与设定的阈值进行比较判断待测视频中是否存在特定序列动作,消除了场景中光线和噪声的影响,识别准确率高。本发明适用于地铁、车站、银行等场所的监控。
所述α,β,γ可以根据具体的应用灵活设定。
在Weizman动作数据库跳跃动作识别的应用中,α=0.001,β=0.5,γ=0.1,k=0.9。
在Weizman动作数据库的实验表明,光流法的平均识别准确率是86.5%,当α=0.001,β=0.5,γ=0.1,k=0.9时,本发明的平均识别准确率是90.3%。
本发明要解决的另一个技术问题是提供一种三维相关滤波器序列动作识别装置。
为了解决上述技术问题,本发明的三维相关滤波器序列动作识别装置包括:建立样本数据库模块:
存储至少一个特定序列动作的训练样本视频;每个特定序列动作包含L个训练样本视频,每个训练样本视频包含Q帧图像,每幅图像包含d个像素,其中d=M×N,M×N为每帧图像的大小;则一个特定序列动作的其中任意一个训练样本视频可以表示为s(x,y,t),其中x、y、t分别为某一像素所在列序号、行序号、帧号;
对s(x,y,t)求导,得到s(x,y,t)的导数d(x,y,t);
对d(x,y,t)进行三维傅立叶变换得到三维频域响应矩阵F(u,v,w);
将三维频域响应矩阵F(u,v,w)按照每帧图像像素从左到右,从上到下,帧间按照时间先后顺序排成一个列向量,则针对每个特定序列动作得到L个训练样本视频列向量a1,a2,...,ai,...aL;
建立动作视频最大平均相关滤波器模板的模块:
通过计算噪声协方差矩阵C,训练图像的平均能量光谱密度Da和对角平均相似性度矩阵Sa来合成最大平均相关动作高度一维滤波器h;
其中α,β,γ是非负的平衡参数,ma是L个训练样本视频列向量a1,a2,...,ai,...aL的平均值;
C=σ2I (3)
其中σ是白噪声的均方差,I是单位矩阵;Ai是训练样本视频的对角化矩阵,它对角线上的元素是列向量ai的所有元素;*表示复共轭运算;Ma是ma的对角矩阵,它的对角线元素对应向量ma的所有元素;
将一维滤波器h还原成三维滤波器,之后进行三维傅立叶反变换,得到特定序列动作的三维最大平均相关高度滤波器H(x,y,t);
滤波器响应计算模块:将H(x,y,t)与待测试视频时空矩阵t(m,n,q)做相关运算,得到滤波器响应c(m,n,q);
优化滤波器响应模块:利用式(7)运算得到优化后的滤波器响应c'(m,n,q);
其中EH是代表滤波器能力的尺度值,ES(m,n,q)是待测视频相应的响应;
特定序列动作判断模块:将优化后的滤波器响应值与设定的阈值ρ进行比较,如果大于阈值ρ则认为待测视频中存在特定序列动作,否则认为不存在该特定序列动作;
ρ=kmin(ε1,ε2,ε3,......εT) (10)
其中,k为加权系数,ε1,ε2,...,εT为多个待测视频特定序列动作优化后的滤波器响应值,min表示计算括号内数值的最小值。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细说明。
图1为实现本发明的三维相关滤波器序列动作识别方法的程序流程图。
图2为本发明的三维相关滤波器序列动作识别装置结构框图。
具体实施方式
如图1所示,本发明的三维相关滤波器序列动作识别方法具体包括下述步骤:
一、建立样本数据库:
按照特定的序列动作(如跑、跳、行走、举手等序列动作)进行样本视频收集。对于每个特定序列动作(如说跑的动作),数据库中包含L个训练样本视频,其中每个训练样本视频包含Q帧图像,每幅图像包含d个像素,其中d=M×N,M×N为每帧图像的大小。则一个特定序列动作的其中任意一个训练样本视频可以表示为s(x,y,t),其中x、y、t分别为某一像素所在列序号、行序号、帧号。
对s(x,y,t)求导,得到特定序列动作训练样本视频s(x,y,t)的导数d(x,y,t)。
对d(x,y,t)进行三维傅立叶变换,如式1所示。
其中F(u,v,w)是d(x,y,t)的三维频域响应矩阵。为了提高运算效率,我们采用x(水平方向),y(垂直方向),z(时间轴方向),三个方向分别进行一维FFT,然后组合成三维频域响应矩阵F(u,v,w)。得到三维频域响应矩阵F(u,v,w)之后,将这个三维频域响应矩阵每帧图像按照第一行像素从左到右,然后第二行像素从左到右,……,最后一行像素从左到右的顺序,帧间按照时间轴顺序排成一个列向量ai,它的维数是D,D=T×M×N,则针对每个特定序列动作得到L个训练样本视频列向量a1,a2,......,ai,......,aL。
二、建立动作视频最大平均相关滤波器模板:
通过计算噪声协方差矩阵C,训练图像的平均能量光谱密度Da和对角平均相似性度矩阵Sa来合成最大平均相关动作高度一维滤波器h。
其中α,β,γ是非负的平衡参数,可以根据具体的应用方向的要求灵活设定。ma是L个训练样本视频列向量a1,a2,......,ai,......,aL的平均值。
C=σ2I(3)
其中σ是白噪声的均方差,I是单位矩阵;Ai是训练样本视频的对角化矩阵,它对角线上的元素是列向量ai的所有元素;*表示复共轭运算;Ma是ma的对角矩阵,它的对角线元素对应向量ma的所有元素。
完成一维滤波器h设计之后,将一维滤波器h还原成三维滤波器,之后进行三维傅立叶反变换,得到特定序列动作的三维最大平均相关高度滤波器H(x,y,t)。
三、计算滤波器响应:
完成特定序列动作的最大平均相关高度滤波器设计后,按照式(6)将三维最大平均相关高度滤波器H(x,y,t)和待测试视频t(m,n,q)做相关运算,可以检测待测视频中是否包含待检测动作;其中m、n、q分别为待测视频图像中某一像素所在列序号、行序号、帧号;
其中,t(m,n,q)是待测视频的时空矩阵,P×Q×R是时空矩阵t(m+x,n+y,q+t)的维数。这项操作的结果我们得到滤波器响应c(m,n,q),它的维数是(P-L+1)×(Q-M+1)×(R-N+1)。
四、优化滤波器响应:
由于场景中存在光线和噪声,我们通过归一化相关空间来优化相关滤波器响应,得到优化后的滤波器响应c'(m,n,q)。
其中c(l,m,n)来自公式(6),EH是代表滤波器能力的尺度值,ES(m,n,q)是待测视频相应的响应。
归一化之后,每个像元的响应在0和1之间,将优化后的滤波器响应值与设定的阈值ρ进行比较,如果大于阈值ρ认为待测视频中存在特定的序列动作,否则认为不存在该动作。
阈值ρ可以由多个待测视频序列动作优化后的滤波器响应值的最小值乘以加权系数k得到。
ρ=kmin(ε1,ε2,ε3,......εT) (10)
其中,k为加权系数,ε1,ε2,...,εT为多个待测视频特定序列动作优化后的滤波器响应值,min表示计算括号内数值的最小值。
其中α,β,γ,k的具体数值由发明人根据具体的应用方向的要求,通过大量实验确定。在Weizman动作数据库跳跃动作识别的应用中,发明人通过大量的实验确定,当α=0.001,β=0.5,γ=0.1,k=0.9时,相关滤波器的平均识别准确率最高,达到90.3%。
如图2所示,本发明的三维相关滤波器序列动作识别装置包括:
三维最大平均相关高度滤波器H(x,y,t);H(x,y,t)由上述方法中的步骤一和步骤二得到;
滤波器响应计算模块:将H(x,y,t)与待测试视频时空矩阵t(l,m,n)做相关运算,得到滤波器响应c(l,m,n);
其中x、y、t分别为训练样本视频某一像素所在列序号、行序号、帧号;l、m、n分别为待测视频图像中某一像素所在列序号、行序号、帧号;
优化滤波器响应模块:利用式(7)运算得到归一化滤波器响应c'(l,m,n);
其中EH是代表滤波器能力的尺度值,ES(m,n,q)是待测视频相应的响应;
特定序列动作判断模块:将优化后的滤波器响应值与设定的阈值ρ进行比较,如果大于阈值ρ则认为待测视频中存在特定序列动作,否则认为不存在该特定序列动作;
ρ=kmin(ε1,ε2,ε3,......εT) (10)
其中,k为加权系数,ε1,ε2,...,εT为多个待测视频特定序列动作优化后的滤波器响应值,min表示计算括号内数值的最小值。
在Weizman动作数据库的实验表明,光流法的平均识别准确率是86.5%,当α=0.001,β=0.5,γ=0.1,k=0.9时,本发明的平均识别准确率是90.3%。表1中给出了Weizman动作数据库跳跃动作识别中的部分实验数据结果。
表1Weizman动作数据库实验结果
Claims (3)
1.一种三维相关滤波器序列动作识别方法,其特征在于包括下述步骤:
一、建立样本数据库:
存储至少一个特定序列动作的训练样本视频;每个特定序列动作包含L个训练样本视频,每个训练样本视频包含Q帧图像,每幅图像包含d个像素,其中d=M×N,M×N为每帧图像的大小;则一个特定序列动作的其中任意一个训练样本视频可以表示为s(x,y,t),其中x、y、t分别为某一像素所在列序号、行序号、帧号;
对s(x,y,t)求导,得到s(x,y,t)的导数d(x,y,t);
对d(x,y,t)进行三维傅立叶变换得到三维频域响应矩阵F(u,v,w);
将三维频域响应矩阵F(u,v,w)按照每帧图像像素从左到右,从上到下,帧间按照时间先后顺序排成一个列向量,则针对每个特定序列动作得到L个训练样本视频列向量a1,a2,...,ai,...aL;
二、建立动作视频最大平均相关滤波器模板:
通过计算噪声协方差矩阵C,训练图像的平均能量光谱密度Da和对角平均相似性度矩阵Sa来合成最大平均相关动作高度一维滤波器h;
其中α,β,γ是非负的平衡参数,ma是L个训练样本视频列向量a1,a2,...,ai,...aL的平均值;
C=σ2I (3)
其中σ是白噪声的均方差,I是单位矩阵;Ai是训练样本视频的对角化矩阵,它对角线上的元素是列向量ai的所有元素;*表示复共轭运算;Ma是ma的对角矩阵,它的对角线元素对应向量ma的所有元素;
将一维滤波器h还原成三维滤波器,之后进行三维傅立叶反变换,得到特定序列动作的三维最大平均相关高度滤波器H(x,y,t);
三、计算滤波器响应:
将三维最大平均相关高度滤波器H(x,y,t)和待测试视频时空矩阵t(m,n,q)做相关运算,得到滤波器响应c(m,n,q);
四、优化滤波器响应:
利用式(7)运算得到优化后的滤波器响应c'(m,n,q);
其中EH是代表滤波器能力的尺度值,ES(m,n,q)是待测视频相应的响应;
五、将优化后的滤波器响应值与设定的阈值ρ进行比较,如果大于阈值ρ则认为待测视频中存在特定序列动作,否则认为不存在该特定序列动作;
ρ=kmin(ε1,ε2,ε3,......εT) (10)
其中,k为加权系数,ε1,ε2,...,εT为多个待测视频特定序列动作优化后的滤波器响应值,min表示计算括号内数值的最小值。
2.根据权利要求1所述的三维相关滤波器序列动作识别方法,其特征在于α=0.001,β=0.5,γ=0.1,k=0.9。
3.一种三维相关滤波器序列动作识别装置,其特征在于包括:
建立样本数据库模块:
存储至少一个特定序列动作的训练样本视频;每个特定序列动作包含L个训练样本视频,每个训练样本视频包含Q帧图像,每幅图像包含d个像素,其中d=M×N,M×N为每帧图像的大小;则一个特定序列动作的其中任意一个训练样本视频可以表示为s(x,y,t),其中x、y、t分别为某一像素所在列序号、行序号、帧号;
对s(x,y,t)求导,得到s(x,y,t)的导数d(x,y,t);
对d(x,y,t)进行三维傅立叶变换得到三维频域响应矩阵F(u,v,w);
将三维频域响应矩阵F(u,v,w)按照每帧图像像素从左到右,从上到下,帧间按照时间先后顺序排成一个列向量,则针对每个特定序列动作得到L个训练样本视频列向量a1,a2,...,ai,...aL;
建立动作视频最大平均相关滤波器模板的模块:
通过计算噪声协方差矩阵C,训练图像的平均能量光谱密度Da和对角平均相似性度矩阵Sa来合成最大平均相关动作高度一维滤波器h;
其中α,β,γ是非负的平衡参数,ma是L个训练样本视频列向量a1,a2,...,ai,...aL的平均值;
C=σ2I (3)
其中σ是白噪声的均方差,I是单位矩阵;Ai是训练样本视频的对角化矩阵,它对角线上的元素是列向量ai的所有元素;*表示复共轭运算;Ma是ma的对角矩阵,它的对角线元素对应向量ma的所有元素;
将一维滤波器h还原成三维滤波器,之后进行三维傅立叶反变换,得到特定序列动作的三维最大平均相关高度滤波器H(x,y,t);
滤波器响应计算模块:将H(x,y,t)与待测试视频时空矩阵t(m,n,q)做相关运算,得到滤波器响应c(m,n,q);
优化滤波器响应模块:利用式(7)运算得到优化后的滤波器响应c'(m,n,q);
其中EH是代表滤波器能力的尺度值,ES(m,n,q)是待测视频相应的响应;
特定序列动作判断模块:将优化后的滤波器响应值与设定的阈值ρ进行比较,如果大于阈值ρ则认为待测视频中存在特定序列动作,否则认为不存在该特定序列动作;
ρ=kmin(ε1,ε2,ε3,......εT) (10)
其中,k为加权系数,ε1,ε2,...,εT为多个待测视频特定序列动作优化后的滤波器响应值,min表示计算括号内数值的最小值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210185738.0A CN102760237B (zh) | 2012-06-07 | 2012-06-07 | 三维相关滤波器序列动作识别方法及其装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210185738.0A CN102760237B (zh) | 2012-06-07 | 2012-06-07 | 三维相关滤波器序列动作识别方法及其装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102760237A CN102760237A (zh) | 2012-10-31 |
CN102760237B true CN102760237B (zh) | 2014-05-07 |
Family
ID=47054690
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210185738.0A Expired - Fee Related CN102760237B (zh) | 2012-06-07 | 2012-06-07 | 三维相关滤波器序列动作识别方法及其装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102760237B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2541179B (en) * | 2015-07-31 | 2019-10-30 | Imagination Tech Ltd | Denoising filter |
CN111222011B (zh) * | 2020-01-06 | 2023-11-14 | 腾讯科技(深圳)有限公司 | 一种视频向量确定方法和装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1786735A (zh) * | 2004-12-09 | 2006-06-14 | 电子科技大学 | 一种雷达图像相干斑抑制技术 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040022436A1 (en) * | 2001-03-16 | 2004-02-05 | Paul Patti | System and method for data analysis of x-ray images |
-
2012
- 2012-06-07 CN CN201210185738.0A patent/CN102760237B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1786735A (zh) * | 2004-12-09 | 2006-06-14 | 电子科技大学 | 一种雷达图像相干斑抑制技术 |
Also Published As
Publication number | Publication date |
---|---|
CN102760237A (zh) | 2012-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9008365B2 (en) | Systems and methods for pedestrian detection in images | |
CN102609716B (zh) | 一种基于改进的hog特征和pca的行人检测方法 | |
CN103886308B (zh) | 一种使用聚合通道特征和软级联分类器的行人检测方法 | |
CN104392432A (zh) | 基于方向梯度直方图的显示面板缺陷检测方法 | |
CN101178770B (zh) | 一种图像检测方法及装置 | |
CN105320962B (zh) | 一种基于分类器集成的路面破损类型识别方法 | |
CN104680144A (zh) | 基于投影极速学习机的唇语识别方法和装置 | |
CN104063719A (zh) | 基于深度卷积网络的行人检测方法及装置 | |
CN103839038A (zh) | 一种人数统计的方法及装置 | |
CN100561501C (zh) | 一种图像检测方法及装置 | |
WO2013063765A1 (en) | Object detection using extended surf features | |
CN101196995B (zh) | 图像中最大人脸的检测装置及方法 | |
CN106940791B (zh) | 一种基于低维方向梯度直方图的行人检测方法 | |
CN105447503A (zh) | 基于稀疏表示lbp和hog融合的行人检测方法 | |
CN109460787A (zh) | 入侵检测模型建立方法、装置及数据处理设备 | |
CN107622237A (zh) | 一种电梯中目标的检测方法 | |
Costea et al. | Fast pedestrian detection for mobile devices | |
CN105809173A (zh) | 一种基于仿生物视觉变换的图像rstn不变属性特征提取及识别方法 | |
CN105447834A (zh) | 一种基于特征分类的麻将图像光照不均校正方法 | |
CN103839066A (zh) | 一种源于生物视觉的特征提取方法 | |
CN102760237B (zh) | 三维相关滤波器序列动作识别方法及其装置 | |
CN104318224A (zh) | 一种人脸识别方法及监控设备 | |
US7953245B2 (en) | System, method and program product for camera-based object analysis | |
CN111127407B (zh) | 一种基于傅里叶变换的风格迁移伪造图像检测装置及方法 | |
CN101276404A (zh) | 一种快速准确的智能图像处理系统及其处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140507 Termination date: 20160607 |