CN104881651A - 一种基于随机投影和Fisher向量的人物行为识别方法 - Google Patents
一种基于随机投影和Fisher向量的人物行为识别方法 Download PDFInfo
- Publication number
- CN104881651A CN104881651A CN201510289260.XA CN201510289260A CN104881651A CN 104881651 A CN104881651 A CN 104881651A CN 201510289260 A CN201510289260 A CN 201510289260A CN 104881651 A CN104881651 A CN 104881651A
- Authority
- CN
- China
- Prior art keywords
- mrow
- msub
- msubsup
- mfrac
- msup
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000013598 vector Substances 0.000 title claims abstract description 67
- 238000000034 method Methods 0.000 title claims abstract description 49
- 230000009467 reduction Effects 0.000 claims abstract description 33
- 239000011159 matrix material Substances 0.000 claims abstract description 26
- 230000006399 behavior Effects 0.000 claims description 88
- 238000012360 testing method Methods 0.000 claims description 21
- 230000009471 action Effects 0.000 claims description 17
- 238000012549 training Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 7
- 239000000203 mixture Substances 0.000 claims description 4
- 230000003542 behavioural effect Effects 0.000 claims description 3
- 238000012847 principal component analysis method Methods 0.000 abstract description 4
- 238000007906 compression Methods 0.000 abstract 2
- 230000006835 compression Effects 0.000 abstract 1
- 238000013507 mapping Methods 0.000 abstract 1
- 238000005259 measurement Methods 0.000 abstract 1
- 230000000007 visual effect Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 6
- 238000012800 visualization Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000009189 diving Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Human Computer Interaction (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于随机投影和Fisher向量的人物行为识别方法,采用随机投影定理的方法替代主成份分析法进行特征降维,以解决其时间消耗大,主成份保留不明确等问题,随机投影定理表明,通过一个压缩测量矩阵,可以把具有稀疏性质的原始信号投影到某个低维子空间上,该映射后的向量与原始高维特征向量间点距离基本保持不变,即整个压缩过程不会产生数据的曲解。此外不同于BoW模型的硬划分,本发明采用GMM—Fisher向量混合模型对轨迹特征向量进行软划分,它融合了Fisher核生成模式和判别模式的特点,不仅能计算出每个特性描述子出现的频率,还能从统计学的意义上描述这些特征描述子的概率分布情况,既丰富了行为动作的特征表达又提高了行为识别的效率。
Description
技术领域
本发明涉及信号处理技术领域,特别是一种基于随机投影和Fisher向量的人物行为识别方法。
背景技术
行为识别技术被广泛运用到视频监控、视频检索、军事检测、医疗诊断和监护等领域,具有广阔的应用前景和经济价值。传统的行为识别方法是将提取到的轨迹特征嵌入到视觉词袋(Bag-of-Words,BoW)模型中,通过提取视频中的局部轨迹特征来构建一个丰富的视觉词典,并利用中心聚类的方式分别统计出局部特征向量相对于中心单词出现的频率,通过视觉词频构成的直方图来表征一类视频最终达到人物行为识别的目的。BoW模型最关键的就是要构造出一个非常庞大的视觉词典,因而行为识别的准确率在很大程度上取决于所构造特征词典的规模的大小,局部轨迹特征描述子越丰富,人物行为识别就越准确,但同时行为轨迹向量维度就越高,这样在一定程度上就增加了计算成本和时间的消耗,同时给分类器的学习和训练的过程也带来了巨大的挑战,因此在保证原始高维轨迹信息的前提下寻找有效的措施来降低这些轨迹特征向量的维度就势在必行。
主成份分析法是在均方误差最小的意义下对原始信号实现线性降维。它用方差的大小来衡量信息量的贡献的多少,即方差越大的分量其所含有用信息越多,于是摒弃那些贡献小的分量上的信息,原始信号就映射到由前K个最大的主成分张成的线性子空间上,以达到降低数据的维度的目的。但是该方法无法处理非线性流形上的数据且计算过程相当耗时,需占用大量的存储空间,严重影响分类器训练和分类的效率。
发明内容
本发明所要解决的技术问题是克服现有技术的不足而提供一种基于随机投影和Fisher向量的人物行为识别方法,本发明采用GMM—Fisher向量混合模型对轨迹特征向量进行软划分,它融合了Fisher核生成模式和判别模式的特点,不仅能计算出每个特性描述子出现的频率,还能从统计学的意义上描述这些特征描述子的概率分布情况,既丰富了行为动作的特征表达又提高了行为识别的效率。
本发明为解决上述技术问题采用以下技术方案:
根据本发明提出的一种基于随机投影和Fisher向量的人物行为识别方法,包括以下步骤:
步骤(1)、在固定帧数前提下提取和跟踪视频中局部行为特征,在最小误差允许范围内提取其特征轨迹,然后融合各类特征轨迹描述子信息,得到一个高维轨迹特征向量,组成该类行为视频的特征轨迹矩阵空间;
步骤(2)、将步骤(1)得到的矩阵空间采用随机投影的方法投影到低维子空间中,然后采用高斯混合模型对投影降维后的轨迹特征信号的生成过程进行建模,求得轨迹特征的Fisher向量;
步骤(3)、将步骤(2)得到的Fisher向量再次利用随机投影的方法将其二次投影到一个低维子空间中,用SVM分类器通过添加类别标签的方式训练出用于区别各种行为的一个超平面;
步骤(4)、根据步骤(3)训练好的分类器对待测试视频的轨迹特征的Fisher向量进行行为分类预测,实现行为分类识别。
作为本发明所述的一种基于随机投影和Fisher向量的人物行为识别方法进一步优化方案,具体包括以下步骤:
步骤一、遍历所有m个训练视频S=[S1,S2,...Sm],针对每个训练视频SI提取其特征轨迹描述子,形成轨迹特征得到高维轨迹特征矩阵X=[X1,X2,...,Xm];其中,TI为第I个行为视频中轨迹的数目,I为整数且1≤I≤m,上标T为转置,xa为训练视频中提取到的特征轨迹描述子,a为整数且1≤a≤TI;
步骤二、将步骤一中的高维轨迹特征矩阵用随机投影的方法投影到一个低维子空间中,即
其中,d表示轨迹特征经随机降维处理后的维度,D为原始轨迹维度,Rd表示降维后的低维子空间,vt表示降维后的一个行为视频的轨迹特征,VRP表示投影降维后所有行为视频轨迹特征的集合;
步骤三、pλ(vt)是关于参数集λ={wi,ui,∑i}的概率密度函数,用来对经随机投影降维后的轨迹特征信号的生成过程进行建模,其中,wi表示第i个高斯单元的混合权重,ui表示第i个高斯单元的均值向量,∑i表示第i个高斯单元的协方差矩阵,i=1,...,K;设vt∈Rd都服从独立同分布,对含有K个高斯单元的GMM的参数集λ的高斯混合模型的定义如下:
其中表示降维后的轨迹特征vt的第i个高斯单元的概率密度函数;协方差矩阵为对角矩阵,由贝叶斯公式可知,降维后的轨迹特征vt分配到第i个高斯单元的概率为:
步骤四、则是经随机投影后所有轨迹特征的集合V关于λ的对数似然函数,则经过降维后的轨迹特征vt关于GMM参数集λ={wi,ui,∑i}的梯度分别表示为:
其中,表示含k个主成分的第i个高斯单元的均值向量,表示含k个主成分的第i个高斯单元的协方差向量;
归一化梯度向量后级联各个梯度值,最后求出轨迹特征的Fisher向量;
步骤五、将步骤四中得到的Fisher向量再次利用随机投影的方法将其二次投影到一个低维子空间中,即
其中,d'表示Fisher向量经过随机投影二次降维后维度,Rd'表示二次降维后的低维子空间,vt'表示二次降维后的一个Fisher向量,VRP'表示二次降维后所有Fisher向量的集合;
步骤六、训练SVM分类器,将m个训练视频降维编码后的轨迹特征分别贴上m个对应特征行为的标签,训练出能区分不同行为动作的一个超平面;
步骤七、选取n个测试集Z=[Z1,Z2,...Zn,1≤J≤n]中的一个新的行为视频ZJ,提取测试视频的轨迹特征其中,n表示测试集视频的个数,TJ表示第J个测试集行为视频ZJ中轨迹的数目;
步骤八、对YJ利用随机投影定理对其进行特征降维,将其投影到一个的低维子空间HRP中,即
其中,htt表示测试视频降维后的轨迹特征,dd表示降维后的维度,Rdd表示测试集轨迹特征降维后的值域;
步骤九、令则其中H是经随机投影后所有轨迹特征的集合,根据步骤四中得到的关于GMM参数集λ={wi,ui,∑i},计算测试集行为视频的轨迹特征的相关的梯度向量,即
归一化梯度向量后级联各个梯度值,最后求出测试集行为视频轨迹特征的Fisher向量;
步骤十、利用随机投影定理对测试集行为视频轨迹特征的Fisher向量进行二次特征降维;
步骤十一、根据步骤六训练好的分类器对经过二次特征降维后的测试集行为视频轨迹特征的Fisher向量进行行为分类预测,完成行为测试集视频的识别。
作为本发明所述的一种基于随机投影和Fisher向量的人物行为识别方法进一步优化方案,所述步骤二中随机投影的方法,具体如下:
对原始D维轨迹特征空间xt∈RD,作用一个列单元长度的随机矩阵Φ,将其投影到一个低维子空间vt∈Rd中,其中d<<D,其公式表达如下:
其中,表示轨迹特征的原始D维空间,表示轨迹特征被降为d维的低维子空间;
随机矩阵Φ满足JL引理,将xt∈RD以最小误差从vt∈Rd重构出来,即投影后的低维子空间vt包含了原始的轨迹特征xt中的近似全部信息。
作为本发明所述的一种基于随机投影和Fisher向量的人物行为识别方法进一步优化方案,所述随机矩阵为满足约束等距性质的随机矩阵。
作为本发明所述的一种基于随机投影和Fisher向量的人物行为识别方法进一步优化方案,所述d=100,dd=d'=48。
作为本发明所述的一种基于随机投影和Fisher向量的人物行为识别方法进一步优化方案,所述步骤六中的SVM分类器的核函数采用Linear线性核函数来实现一个多类输出。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:本发明采用随机投影定理的方法替代主成份分析法进行特征降维,以解决其时间消耗大,主成份保留不明确等问题,随机投影定理表明,通过一个压缩测量矩阵,可以把具有稀疏性质的原始信号投影到某个低维子空间上,该映射后的向量与原始高维特征向量间点距离基本保持不变,即整个压缩过程不会产生数据的曲解。此外不同于BoW模型的硬划分,本发明采用GMM—Fisher向量混合模型对轨迹特征向量进行软划分,它融合了Fisher核生成模式和判别模式的特点,不仅能计算出每个特性描述子出现的频率,还能从统计学的意义上描述这些特征描述子的概率分布情况,既丰富了行为动作的特征表达又提高了行为识别的效率。
附图说明
图1是本发明采用密集取样对视频集进行轨迹行为动作提取的可视化效果图,其中:(a)是KTH数据集人物挥手行为动作的可视化效果图;(b)是KTH数据集人物快跑行为动作的可视化效果图;(c)是KTH数据集人物拳击行为动作的可视化效果图;(d)是UCF50数据集人物打篮球行为动作的可视化效果图;(e)是UCF50数据集人物举重行为动作的可视化效果图;(f)是UCF50数据集人物高尔夫球摆行为动作的可视化效果图。
图2是本发明所述基于随机投影和Fisher向量的人物行为识别方法的流程图。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明:
本发明实验所用计算机的配置为内存8GB,CPU是Intel Core i3 3.4GHz的台式计算机,所用代码是在visual studio 2013上用C++语言开发的。两种数据集设定以下相同的缺省参数,在稠密轨迹跟踪算法中,取N=32,nσ=2,nτ=3,轨迹跟踪长度L=15帧,取样步长W=5像素,随机投影中降维后的特征轨迹维度d=100,d'=48,SVM分类器的核函数采用Linear线性核函数来实现一个多类输出。
如图1所示,一种对视频集稠密取样进行轨迹行为动作提取的可视化效果图。本发明通过提取稠密的轨迹来表征一类行为运动,利用光流场对兴趣点进行多层次稠密采样来实现跟踪。这些兴趣点沿一个密集的网格被重复采样且被跟踪在一个固定长度帧的范围内,行为轨迹就是这些固定帧数内的特征描述子连续性表达的结果。轨迹的形状用来区别不同的人物行为变化,它表现在视频中就是人物目标在视频中的运动位置在时间和空间上的改变,即位移矢量。考虑到人物行为在每个视频中出现的位置的不同,本发明通过对提取到的所有位置信息进行求和运算,实现位置矢量的归一化。对于任意一条轨迹来说除了提取其位置信息外,还要各个描述子信息来丰富它的表达。如方向直方图(HOG)用来描述人物外在的静态信息,光流直方图(HOF)用来描述轨迹的局部运动信息,而运动边界直方图(MBH)用来描述像素之间的相对运动。因此最终的轨迹是位置信息、方向梯度、光流和运动边界直方图信息的集合。图1中的(a)是KTH数据集人物挥手行为动作的可视化效果图;图1中的(b)是KTH数据集人物快跑行为动作的可视化效果图;图1中的(c)是KTH数据集人物拳击行为动作的可视化效果图;图1中的(d)是UCF50数据集人物打篮球行为动作的可视化效果图;图1中的(e)是UCF50数据集人物举重行为动作的可视化效果图;图1中的(f)是UCF50数据集人物高尔夫球摆行为动作的可视化效果图。从图1中可以直观的看到所提取到的有效轨迹能够形象的描述出视频人物行为的连续运动。
如图2所示,一种基于Fisher向量和投影定理的人物行为识别的流程图。本发明针对一类行为视频,首先在固定帧数前提下提取和跟踪局部行为特征,再在最小误差允许范围内提取有效轨迹,然后融合各类描述子信息形成一个高维轨迹特征向量,组成该类行为视频的特征轨迹矩阵空间,最后嵌入到高斯混合-Fisher向量模型框架中,用一个SVM分类器通过添加类别标签的方式训练出用于区别各种行为的一个超平面,通过这个超平面实现最终的行为分类,期间我们采用随机投影的方式对高维特征进行二次投影降维来降低计算复杂度。
如表一所示是本发明在KTH数据集下人物行为的识别率。KTH数据集包括6种人物行为动作:散步、慢跑、快跑、拳击、挥手和拍手,每一个动作是在四个不同的场景中实现的:户内,户外,户外尺寸改变,在户外搭配不同的服装。在大部分场景中背景单一且静态,但背景噪声大。结果表明,本发明方法可以有效的识别出KTH数据集中不同的人物行为动作。
表一
如表二所示是UCF50数据集下人物行为的识别率。UCF50数据集有50个动作类,包括打篮球、跳水、高尔夫摆臂、举重、单杠、骑马等体育项目以及从YouTube选取的现实生活的视频片段。该数据集背景复杂,场景不一,视觉角度各异,相对于行为识别难度较大。结果表明,本发明方法可以有效的识别出UCF500数据集中不同的人物行为动作。
表二
如表三所示是随机投影和主成分分析法两种降维方法的计算时间的比较(单位:s)。结果表明随机投影的降维方法大大提高了行为识别算法的效率,运行时间相对于主成分分析法提高了近200倍。
表三
10维 | 30维 | 50维 | 70维 | 90维 | 110维 | 130维 | 150维 | |
RP | 0.18 | 0.21 | 0.23 | 0.27 | 0.34 | 0.37 | 0.41 | 0.43 |
PCA | 28.28 | 28.67 | 28.85 | 28.97 | 29.13 | 29.52 | 29.87 | 30.16 |
以上只是对本发明的优选实施方式进行了描述。对该技术领域的普通技术人员来说,根据以上实施方式可以很容易地联想到其它的优点和变形。因此,本发明并不局限于上述实施方式,其仅仅作为例子对本发明的一种形态进行详细、示范性的说明。在不背离本发明宗旨的范围内,本领域普通技术人员在本发明技术的方案范围内进行的通常变化和替换,都应包含在本发明的保护范围之内。
Claims (6)
1.一种基于随机投影和Fisher向量的人物行为识别方法,其特征在于,包括以下步骤:
步骤(1)、在固定帧数前提下提取和跟踪视频中局部行为特征,在最小误差允许范围内提取其特征轨迹,然后融合各类特征轨迹描述子信息,得到一个高维轨迹特征向量,组成该类行为视频的特征轨迹矩阵空间;
步骤(2)、将步骤(1)得到的矩阵空间采用随机投影的方法投影到低维子空间中,然后采用高斯混合模型对投影降维后的轨迹特征信号的生成过程进行建模,求得轨迹特征的Fisher向量;
步骤(3)、将步骤(2)得到的Fisher向量再次利用随机投影的方法将其二次投影到一个低维子空间中,用SVM分类器通过添加类别标签的方式训练出用于区别各种行为的一个超平面;
步骤(4)、根据步骤(3)训练好的分类器对待测试视频的轨迹特征的Fisher向量进行行为分类预测,实现行为分类识别。
2.根据权利要求1所述的一种基于随机投影和Fisher向量的人物行为识别方法,其特征在于,具体包括以下步骤:
步骤一、遍历所有m个训练视频S=[S1,S2,...Sm],针对每个训练视频SI提取其特征轨迹描述子,形成轨迹特征得到高维轨迹特征矩阵X=[X1,X2,...,Xm];其中,TI为第I个行为视频中轨迹的数目,I为整数且1≤I≤m,上标T为转置,xa为训练视频中提取到的特征轨迹描述子,a为整数且1≤a≤TI;
步骤二、将步骤一中的高维轨迹特征矩阵用随机投影的方法投影到一个低维子空间中,即
其中,d表示轨迹特征经随机降维处理后的维度,D为原始轨迹维度,Rd表示降维后的低维子空间,vt表示降维后的一个行为视频的轨迹特征,VRP表示投影降维后所有行为视频轨迹特征的集合;
步骤三、pλ(vt)是关于参数集λ={wi,ui,∑i}的概率密度函数,用来对经随机投影降维后的轨迹特征信号的生成过程进行建模,其中,wi表示第i个高斯单元的混合权重,ui表示第i个高斯单元的均值向量,∑i表示第i个高斯单元的协方差矩阵,i=1,...,K;设vt∈Rd都服从独立同分布,对含有K个高斯单元的GMM的参数集λ的高斯混合模型的定义如下:
其中表示降维后的轨迹特征vt的第i个高斯单元的概率密度函数;协方差矩阵为对角矩阵,由贝叶斯公式可知,降维后的轨迹特征vt分配到第i个高斯单元的概率为:
步骤四、则是经随机投影后所有轨迹特征的集合V关于λ的对数似然函数,则经过降维后的轨迹特征vt关于GMM参数集λ={wi,xi,∑i}的梯度分别表示为:
其中,表示含k个主成分的第i个高斯单元的均值向量,表示含k个主成分的第i个高斯单元的协方差向量;
归一化梯度向量后级联各个梯度值,最后求出轨迹特征的Fisher向量;
步骤五、将步骤四中得到的Fisher向量再次利用随机投影的方法将其二次投影到一个低维子空间中,即
其中,d'表示Fisher向量经过随机投影二次降维后维度,Rd'表示二次降维后的低维子空间,v′t表示二次降维后的一个Fisher向量,VRP'表示二次降维后所有Fisher向量的集合;
步骤六、训练SVM分类器,将m个训练视频降维编码后的轨迹特征分别贴上m个对应特征行为的标签,训练出能区分不同行为动作的一个超平面;
步骤七、选取n个测试集Z=[Z1,Z2,...Zn,1≤J≤n]中的一个新的行为视频ZJ,提取测试视频的轨迹特征其中,n表示测试集视频的个数,TJ表示第J个测试集行为视频ZJ中轨迹的数目;
步骤八、对YJ利用随机投影定理对其进行特征降维,将其投影到一个的低维子空间HRP中,即
其中,htt表示测试视频降维后的轨迹特征,dd表示降维后的维度,Rdd表示测试集轨迹特征降维后的值域;
步骤九、令则其中H是经随机投影后所有轨迹特征的集合,根据步骤四中得到的关于GMM参数集λ={wi,ui,∑i},计算测试集行为视频的轨迹特征的相关的梯度向量,即
归一化梯度向量后级联各个梯度值,最后求出测试集行为视频轨迹特征的Fisher向量;
步骤十、利用随机投影定理对测试集行为视频轨迹特征的Fisher向量进行二次特征降维;
步骤十一、根据步骤六训练好的分类器对经过二次特征降维后的测试集行为视频轨迹特征的Fisher向量进行行为分类预测,完成行为测试集视频的识别。
3.根据权利要求2所述的一种基于随机投影和Fisher向量的人物行为识别方法,其特征在于,所述步骤二中随机投影的方法,具体如下:
对原始D维轨迹特征空间xt∈RD,作用一个列单元长度的随机矩阵Φ,将其投影到一个低维子空间vt∈Rd中,其中d<<D,其公式表达如下:
其中,表示轨迹特征的原始D维空间,表示轨迹特征被降为d维的低维子空间;
随机矩阵Φ满足JL引理,将xt∈RD以最小误差从vt∈Rd重构出来,即投影后的低维子空间vt包含了原始的轨迹特征xt中的近似全部信息。
4.根据权利要求3所述的一种基于随机投影和Fisher向量的人物行为识别方法,其特征在于,所述随机矩阵为满足约束等距性质的随机矩阵。
5.根据权利要求2所述的一种基于随机投影和Fisher向量的人物行为识别方法,其特征在于,所述d=100,dd=d'=48。
6.根据权利要求2所述的一种基于随机投影和Fisher向量的人物行为识别方法,其特征在于,所述步骤六中的SVM分类器的核函数采用Linear线性核函数来实现一个多类输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510289260.XA CN104881651B (zh) | 2015-05-29 | 2015-05-29 | 一种基于随机投影和Fisher向量的人物行为识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510289260.XA CN104881651B (zh) | 2015-05-29 | 2015-05-29 | 一种基于随机投影和Fisher向量的人物行为识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104881651A true CN104881651A (zh) | 2015-09-02 |
CN104881651B CN104881651B (zh) | 2017-12-15 |
Family
ID=53949138
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510289260.XA Active CN104881651B (zh) | 2015-05-29 | 2015-05-29 | 一种基于随机投影和Fisher向量的人物行为识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104881651B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105956610A (zh) * | 2016-04-22 | 2016-09-21 | 中国人民解放军军事医学科学院卫生装备研究所 | 一种基于多层编码结构的遥感图像地形分类方法 |
CN106529426A (zh) * | 2016-10-21 | 2017-03-22 | 中国科学院自动化研究所 | 一种基于贝叶斯模型的视觉人体行为识别方法 |
GB2547760A (en) * | 2015-12-23 | 2017-08-30 | Apical Ltd | Method of image processing |
CN113111587A (zh) * | 2021-04-20 | 2021-07-13 | 北京理工雷科电子信息技术有限公司 | 一种基于插件式模型的可重用、可扩展机器学习方法 |
US20210369146A1 (en) * | 2015-10-14 | 2021-12-02 | President And Fellows Of Harvard College | Automatically classifying animal behavior |
CN114782945A (zh) * | 2022-04-19 | 2022-07-22 | 西安医学院 | 一种智能交互型运动员投篮姿态矫正系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009075802A (ja) * | 2007-09-20 | 2009-04-09 | Giken Torasutemu Kk | 人物行動検索装置 |
CN103295032A (zh) * | 2013-05-15 | 2013-09-11 | 西安电子科技大学 | 基于空间Fisher向量的图像分类方法 |
CN103927559A (zh) * | 2014-04-17 | 2014-07-16 | 深圳大学 | 超声图像胎儿颜面部标准切面自动识别方法及系统 |
CN104036287A (zh) * | 2014-05-16 | 2014-09-10 | 同济大学 | 一种基于人类运动显著轨迹的视频分类方法 |
-
2015
- 2015-05-29 CN CN201510289260.XA patent/CN104881651B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009075802A (ja) * | 2007-09-20 | 2009-04-09 | Giken Torasutemu Kk | 人物行動検索装置 |
CN103295032A (zh) * | 2013-05-15 | 2013-09-11 | 西安电子科技大学 | 基于空间Fisher向量的图像分类方法 |
CN103927559A (zh) * | 2014-04-17 | 2014-07-16 | 深圳大学 | 超声图像胎儿颜面部标准切面自动识别方法及系统 |
CN104036287A (zh) * | 2014-05-16 | 2014-09-10 | 同济大学 | 一种基于人类运动显著轨迹的视频分类方法 |
Non-Patent Citations (1)
Title |
---|
ELLABINGHAM等: "Random projection in dimensionality reduction:Applications to image and text data", 《KNOWLEDGE DISCOVERY AND DATA MINING》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210369146A1 (en) * | 2015-10-14 | 2021-12-02 | President And Fellows Of Harvard College | Automatically classifying animal behavior |
US11622702B2 (en) * | 2015-10-14 | 2023-04-11 | President And Fellows Of Harvard College | Automatically classifying animal behavior |
US20230225636A1 (en) * | 2015-10-14 | 2023-07-20 | President And Fellows Of Harvard College | Automatically classifying animal behavior |
US11944429B2 (en) * | 2015-10-14 | 2024-04-02 | President And Fellows Of Harvard College | Automatically classifying animal behavior |
GB2547760A (en) * | 2015-12-23 | 2017-08-30 | Apical Ltd | Method of image processing |
US10062013B2 (en) | 2015-12-23 | 2018-08-28 | Apical Ltd. | Method of image processing |
GB2547760B (en) * | 2015-12-23 | 2020-04-15 | Apical Ltd | Method of image processing |
CN105956610A (zh) * | 2016-04-22 | 2016-09-21 | 中国人民解放军军事医学科学院卫生装备研究所 | 一种基于多层编码结构的遥感图像地形分类方法 |
CN105956610B (zh) * | 2016-04-22 | 2019-02-22 | 中国人民解放军军事医学科学院卫生装备研究所 | 一种基于多层编码结构的遥感图像地形分类方法 |
CN106529426A (zh) * | 2016-10-21 | 2017-03-22 | 中国科学院自动化研究所 | 一种基于贝叶斯模型的视觉人体行为识别方法 |
CN113111587A (zh) * | 2021-04-20 | 2021-07-13 | 北京理工雷科电子信息技术有限公司 | 一种基于插件式模型的可重用、可扩展机器学习方法 |
CN114782945A (zh) * | 2022-04-19 | 2022-07-22 | 西安医学院 | 一种智能交互型运动员投篮姿态矫正系统 |
Also Published As
Publication number | Publication date |
---|---|
CN104881651B (zh) | 2017-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | $ p $-Laplacian regularized sparse coding for human activity recognition | |
Wang et al. | Deep CNNs meet global covariance pooling: Better representation and generalization | |
CN104881651B (zh) | 一种基于随机投影和Fisher向量的人物行为识别方法 | |
Yang et al. | Temporal dynamic appearance modeling for online multi-person tracking | |
CN109344736B (zh) | 一种基于联合学习的静态图像人群计数方法 | |
Han et al. | Semisupervised feature selection via spline regression for video semantic recognition | |
CN104036287B (zh) | 一种基于人类运动显著轨迹的视频分类方法 | |
CN102609681B (zh) | 基于字典学习模型的人脸识别方法 | |
Roy et al. | Unsupervised universal attribute modeling for action recognition | |
CN106778854A (zh) | 基于轨迹和卷积神经网络特征提取的行为识别方法 | |
Ma et al. | Insights into multiple/single lower bound approximation for extended variational inference in non-Gaussian structured data modeling | |
Luo et al. | Semi-supervised feature selection via insensitive sparse regression with application to video semantic recognition | |
CN105678261B (zh) | 基于有监督图的直推式数据降维方法 | |
Luo et al. | Learning human actions by combining global dynamics and local appearance | |
Mu et al. | Hyperspectral image classification based on active learning and spectral-spatial feature fusion using spatial coordinates | |
CN107316005A (zh) | 基于稠密轨迹核协方差描述子的行为识别方法 | |
CN105160290A (zh) | 一种基于改进型稠密轨迹的移动边界采样的行为识别方法 | |
Wang et al. | S 3 D: Scalable pedestrian detection via score scale surface discrimination | |
Xu et al. | Discriminative analysis for symmetric positive definite matrices on lie groups | |
Zhang et al. | Second-and high-order graph matching for correspondence problems | |
CN105868711B (zh) | 一种基于稀疏低秩的人体行为识别方法 | |
Wang et al. | Basketball shooting angle calculation and analysis by deeply-learned vision model | |
Li et al. | Augmenting bag-of-words: a robust contextual representation of spatiotemporal interest points for action recognition | |
Vainstein et al. | Modeling video activity with dynamic phrases and its application to action recognition in tennis videos | |
Wang et al. | Salient region detection via discriminative dictionary learning and joint Bayesian inference |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20210427 Address after: 210019 area a, 4th floor, building A8, 8 Bailongjiang East Street, Nanjing, Jiangsu Province Patentee after: Nanji Agricultural Machinery Research Institute Co.,Ltd. Address before: 210044 Nanjing Ning Road, Jiangsu, No. six, No. 219 Patentee before: NANJING University OF INFORMATION SCIENCE & TECHNOLOGY |
|
TR01 | Transfer of patent right |