CN103530603B - 基于环路图模型的视频异常检测方法 - Google Patents
基于环路图模型的视频异常检测方法 Download PDFInfo
- Publication number
- CN103530603B CN103530603B CN201310439344.8A CN201310439344A CN103530603B CN 103530603 B CN103530603 B CN 103530603B CN 201310439344 A CN201310439344 A CN 201310439344A CN 103530603 B CN103530603 B CN 103530603B
- Authority
- CN
- China
- Prior art keywords
- lda
- alpha
- parameter
- video
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种基于LDA‑HMM的环路图模型视频异常检测方法。现有的方法在HMM状态确定LDA主题特征的概率推理中,视频异常检测会受到概率拖尾问题和模型过度拟合或欠拟合问题的困扰。本发明首先选取正常场景的视频段作为训练数据,经过低层特征提取,LDA主题特征提取,通过环路模型参数推理,训练出一个LDA‑HMM环路模型。异常检测时,将正常场景视频段和含异常事件视频段数据处理后分布送入已训练好的环路模型中,根据前向算法,得到每一帧的似然函数,当似然函数差大于某一阈值时,判断该帧出现异常。本发明很好地解决了概率拖尾及模型阶数需人为设定的问题,使视频异常检测达到更加精确的效果。
Description
技术领域
本发明属于计算机视觉技术领域,具体涉及一种基于环路图模型的视频异常检测方法。
背景技术
近年来,随着国民经济的快速增长和社会的迅速进步,银行、电力、交通、安检以及军事设施等领域对安全防范和现场记录报警系统的需求与日俱增,视频监控在生产生活各方面得到了非常广泛的应用。视频异常检测作为智能视频监控的重要应用,具有重要的理论意义和实际应用前景。已有的异常事件检测方法主要是基于异常事件建模的方法,即先从视频序列中提取图像特征,特征通常包括运动目标外形、颜色、运动等信息,然后,基于提取的特征通过人工或应用监督学习技术构建正常事件模型,为了检测异常事件,将视频与正常事件模型相匹配,不适合该模型的片段认为是异常。当前主要有两大主流的检测模型:一个是采用动态贝叶斯网络如隐马尔科夫模型(HMM),另一个是基于概率主题模型,如LDA模型或其扩展。2007年Naohiko Suzuki等人用离散隐马尔科夫模型(DHMM)对人的轨迹进行建模,识别超市中正常购物者的行为和非正常购物的可疑行为;M.Brand,N.Oliver等人用半监督-自适应隐马尔科夫模型,监控扑克牌游戏场景,来分析其场景中的违规行为。2009年R.Mehran,A.Oyama等人提出了一种群体异常行为检测算法,检测阶段使用LDA检测算法,从视频中提取n*n*T的数据块作为单词,进行似文本分类。基于LDA和HMM的视频异常事件检测框架凭借其突出的描述能力在近几年备受关注。在该框架中,LDA抽取主题特征,HMM利用状态描述主题特征的演化,但在HMM状态确定LDA主题特征的概率推理中,视频异常事件检测会受到概率拖尾问题的困扰,此外,使用前人为设定HMM模型阶数会导致视频异常检测模型过度拟合或欠拟合问题。针对目前的不足,本发明提出基于LDA-HMM的环路图模型视频异常检测方法,建立HMM状态和LDA主题特征之间的“谐振”,即不仅HMM状态影响LDA主题特征,而且反过来LDA主题特征也会影响HMM状态,这样在视频异常事件检测过程中,不仅HMM模型中的异常状态演化将导致LDA模型关注于相应的异常主题特征,同时LDA模型中的异常主题特征也会影响HMM模型中的状态向异常状态的发展,从而解决概率拖尾及模型阶数需人为设定的问题,实现检测性能的提升。
发明内容
本发明针对现有技术的不足,提供了一种基于环路图模型的视频异常检测方法。
本发明基于环路图模型的视频异常检测方法,具体思路如下:对于某一个场景的异常事件检测,首先选取正常场景的视频段作为训练数据,接着通过SIFT算法,逐帧提取低层特征,并对这些特征进行聚类,构建成词袋的形式,再通过LDA提取数据的语义特征,将得到的语义特征视为iHMM的观测量,然后通过对LDA-HMM环路模型的参数推理,根据Beam采样和EM算法训练出一个LDA-HMM环路模型。异常事件检测时,将正常场景的视频段和含有异常事件的该场景的视频段分别进行低层特征提取,LDA主题特征提取,送入已训练好的LDA-HMM模型中,根据前向算法,可以得到不同视频段每一帧的似然函数。当某帧的似然函数差大于某一个阈值时,判断该帧出现异常。
为了方便描述本发明的内容,首先作一下术语定义:
定义1词汇
词汇一般定义是一篇文档或者语言里所有的词和固定短语的综合,本文定义是将视频段每一帧低层特征提取处理后得到的数据形式视为词汇。
定义2语义特征
语义特征是一篇文档中能够描述这篇文档主题分布的参数。本文定义为能够最佳表示视频每一帧信息数据的量。
定义3前向算法
前向算法是用来计算给定隐马尔科夫模型(HMM)后一个观察序列的概率,给定这种算法,可以直接用来确定对于已知的一个观察序列,在一些隐马尔科夫模型(HMMs)中哪一个HMM最好的描述了它——先用前向算法评估每一个(HMM),再选取其中概率最高的一个。
本发明提出基于LDA-HMM的环路图模型视频异常检测方法,建立HMM状态和LDA主题特征之间的“谐振”,包括底层特征提取、LDA语义特征提取和HMM的动态评估、参数推理和学习等三项关键技术,具体处理步骤如下:
步骤一:底层特征提取
对已录制的视频,采用尺度不变特征变换算法(SIFT)对每一帧图像抽取二维图像位置信息(x,y)的特征。SIFT特征是图像的局部特征,其对旋转、尺度缩放、颜色变化保持不变性,对视角变化、噪声也保持一定程度的稳定性,独特性好,信息量丰富,即使少数的几个物体也可以产生大量的SIFT特征向量,能够得到好的检测效果。
SIFT算法主要分为五个步骤:
1.构建尺度空间,检测DOG尺度空间极值点,获得尺度不变性;
2.特征点过滤并进行精确定位;
3.为每个关键点赋予128维方向参数;
4.生成关键点的描述子;
步骤二:LDA语义特征提取
LDA是一个三层贝叶斯概率模型,包含词、主题和文档三层结构。LDA将每个文档表示为一个主题混合,每个主题是固定词表上的一个多项式分布。LDA假设文档由一个主题混合产生,同时每个主题是在固定词表上的一个多项式分布;这些主题被集合中的所有文档共享;每个文档有一个特定的主题混合比例,其从Dirichlet分布中抽样产生。作为一种生成式文档模型,用LDA提取文档的隐含语义结构和文档表征已经成功地应用到很多文本相关的领域。
生成一篇文档的具体步骤如下:
1.选择N,N服从Poisson(ξ)分布,N表示每篇文档的词汇量;
2.选择θ,θ服从Dirichlet(α)分布,θ是主题发生的概率,α是θ的先验分布;
3.选择主题zmn,zmn服从Multinomial(θ)分布;
4.选择词汇参数wmn,wmn服从分布,其中是主题词项分布矩阵。
LDA主题模型提供了一种介于观测变量和隐藏变量之间的联合概率模型,这样主题参数估计就等价于主题词的最大后验概率估计,或称之为主题模型的推理问题。主题模型的推理是生成文档的逆向过程,已知先验参数α和β,根据文档生成过程可以写出各种随机变量D、z和θ的联合概率,其中D={w1,w2,…,wM},表示文档集合,z表示主题,w1,w2,.......,wM表示各个词汇,其下标表示此词汇是第多少个词汇。
其中M表示文档数目,θm是第m篇文档的主题分布。
对主题先验参数θ进行积分得到p(z,w|α,β),则根据贝叶斯公式,
其中,zn表示除第m篇文档中第n篇词汇所对应的主题词,z-n表示除第m篇文档中第n篇词汇所对应的主题词以外,其它所有的已知文档中的词汇所对应的主题词,w表示文档词汇。上式可用来完成主题参数的估计,即确定其对应的具有语义特征的关键词。
给定α和β情况下,主题先验参数θ、主题z以及每篇文档词汇w的联合分布可以表示为:
其中,整合θ和z,得到一个词汇的边缘分布:
依据上面的边缘分布,得到M篇文档概率分布为:
其中,D代表M篇文档集合,m表示第m篇文档标签序号。
然后计算给定一篇文档条件下隐藏变量的后验分布,公式如下所述:
此后验分布采用变分EM算法进行推理可得到,取Q分布的函数去逼近p(θ,z|w,α,β),其中Q分布的形式如下:
其中γ表示狄利克雷参数,表示多项式参数,表示多项式的第n个参数。
为了得到最佳的变分参数将变分分布和真实分布p(θ,z|w,α,β)之间的KL散度最小化,最小值可以通过迭代的方法获得。通过推导可得到和γ的迭代公式:
其中:表示在γ条件下θi的条件概率期望值,Ψ是对数伽玛函数,是条件多项式参数,αi表示第i次迭代时的狄利克雷参数。更新Dirichlet参数α用的是Newton-Raphson方法。
通过上述的推理,得到新参数γ的估计值,γ携带了每次使用者产生数据组成文档的语义特征,这样就完成了LDA提取数据的语义特征的过程。
步骤三:环路HMM模型参数学习
对环路LDA-HMM的参数推理过程可以分为上下两部分,上一部分是基于iHMM模型进行构造的,下一部分是基于LDA模型构造的,因此在参数推理过程中,首先对上一部分按照类似于iHMM模型的参数推理过程进行推理,然后对下一部分按照类似于LDA的参数进行参数推理。
将主题特征矩阵γ作为环路HMM-LDA模型的观测量进行环路HMM-LDA的上一部分的参数推理,引入Beam采样的方法,Beam采样通过引入辅助变量u,使得潜在状态轨迹中的状态数量为一有限值,然后利用动态规划的方法计算状态轨迹的条件概率并对整个轨迹进行采样。Beam采样具有更高的效率,且在基础先验分布D(·)和观测分布F(·)非共轭的情况下,Beam采样仍然有效。为此,我们可以使用Beam采样算法对环路LDA-HMM模型进行参数推理。
与传统MCMC(Markov Chain Monte Carlo)方法相比,Beam采样不必边沿化π和θ,而是在其它变量不变的情况下,迭代地采样辅助变量u,轨迹S,状态转移概率矩阵π,共享DP基础测量β以及精度参量α和γ。
采样u:对于每个t,引入辅助变量ut,在已知π、st-1和st情况下,ut服从条件分布:
采样S:在给定辅助变量u和其它参数的基础上,利用前向滤波后向采样(forwardfiltering-backward)方法对整个状态序列S进行采样。重要的观测是指具有非零概率的轨迹在给定u的情况下,只有有限个这样的轨迹,故可利用动态规划的方法计算所有轨迹的条件分布。ut的概率密度为:式中,如果满足条件C则ΙΙ(C)=1,否则ΙΙ(C)=0。因此,对于所有的t,通过以下方法可计算得到st的后验概率(为了简洁,式中略去了条件变量π和θ):
在Beam采样中,只需计算有限个转移概率为正的状态组成的轨迹的后验概率。此外,对st-1求和,虽然在原理上要累加无限项,但可通过利用辅助变量ut截取满足条件和p(st-1|zn,1:t-1,u1:t-1)>0的有限个st-1。最后,为了对整个轨迹s采样,首先从p(sT|zn,1:T,u1:T)采样sT,然后在已知st+1时执行后向遍历采样st,即:
p(st|st+1,zn,1:T,u1:T)∝p(st|zn,1:t,u1:t)p(st+1|st,ut+1)
采样π:若nij表示从状态i转移到状态j的次数,S中不同状态的数目为K,这些状态被标记为1,2,…,K,将s中所有未出现的无限多个状态融合在一起,则πk可表示为给定S、β和α,πk的后验分布表示为:
为了采样β引入一个辅助变量集mij,条件独立服从下列分布:
p(mij|s,β,α)∝S(nij,m)(αβj)m
其中S(.,.)表示第一类Stirling数,共享DP参数服从条件分布Dirichlet(m.1…m.K,γ)其中最终,每一项θm关于s,z及他们的先验分布H条件独立服从分布:
p(θ|s,z,H)=∏kp(θm|s,z,H)
由于基分布Dir(α)和数据分布F多项式分布为共轭分布,每一个θm迅速的采集到。
采样β:通过引入辅助变量集的方法来采样β。根据z的后验概率密度函数:
考虑上式的似然函数项,βk作为伽马(Gamma)函数的参考。然而两个Gamma函数的比值是一个α0βk的多项式,可以按下式展开:
上式中,s(njk,mjk)是的系数。事实上s(njk,mjk)是第一类无符号Stirling的数量,引入辅助变量集m=(mjk,对所有j,k),考虑β的先验,可得到z,m,β的联合分布:
可以验证,∑mp(z,m|β)=p(z|β)。当L→∞时,根据上式的条件分布,可得到m和β的后验分布是:
p(mjk=m|z,m-jk,β)∝s(nik,m)(αβk)m
mjk的后验分布容易求得,因为它只能从0~njk范围内取值,且s(nik,m)可较容易地计算得到。给定m的条件下β的后验分布是Dirichlet分布,即β|m,γ~Dir(∑jmj1,…,∑jmjK,γ)。
采样θ:在给定z、x和先验H的条件下,各θk之间相互独立的,即θk的后验概率分布完全由分量k对应的观测序列决定:
式中h(θ)是基础分布H(·)的概率密度函数,若H(·)是F(·)的共轭先验分布,则可积分消除参数θ。
采样精度参量α0,γ:辅助变量集m和超参数β具有某种形式上的共轭关系,且可以得到:
利用上式及α0的先验,可以得到α0的Gibbs采样方法。
假设α0先验服从参数为a和b的Gamma分布。对于每一个j有:
式中和为辅助变量,其中ωj在[0,1]内取值,sj是一二进制{0,1}变量,定义如下分布:
通过求上式的边沿概率积分可得到α0的后验概率分布:
上式是服从参数为和的Gamma分布。给定α0,ωj和sj是相互独立的,后验概率密度函数是:
分别是Beta和二项式分布,这样就实现了对精度参量α0的采样。
给定辅助变量集的总数m=∑jmj,则混合分量数K的分布由精度参量γ给出:
从上式可知,给定m和K的情况下,各观测和γ相互独立,该情况和辅助变量集m和超参数β的情形完全类似,因此可利用和采样精度参量α0相同的方法采样γ。
步骤四:环路LDA模型参数学习
选取新的视频段序列重复步骤1,得到新的BOW词袋,将步骤3采样得到的α作为LDA模型的超先验参数,进行环路HMM-LDA下一部分的参数学习,下一部分关键的推理问题是计算给定一篇文档条件下隐藏变量的后验分布,公式如下所述:
由于θ和φ存在耦合,导致后验分布在计算上是很难处理的,因此需要相应的推理算法将计算进一步的简化。本发明结合变分推理和EM估计的推理算法,简称变分EM算法,变分推理的基本思想是利用Jensen不等式来获得对数似然的下限。获得下限簇的一个简单办法是对最初圆形标记模型中的一些边缘节点进行删减,再赋予新参数后得到隐藏变量的分布族,θ和φ之间耦合问题的产生是由于θ,z和y之间的边缘,通过放弃这些边缘和y节点,在独立变分参数基础上简化模型,可以获取隐藏变量的分布族。族具有以下的变分分布:
其中Dirichlet参数γ和多项式参数是独立变分参数。指定了简化的概率分布族后,下一步是建立一个优化问题去决定变分参数γ和的值,这样寻找对数似然下限的问题直接转化成了下面的优化问题:
通过将变分分布和真实分布p(θ,zn,t|yn,t,α,φ)之间的Kullback-Leibler(KL)散度最小化得到最佳的变分参数值,最小值可以通过迭代的方法获得。通过计算KL散度的导数和设置它们为零,得到一对新的更新方程。变分参数的推导过程可以描述如下:考虑上式的变分分布,在处理上常将其看成后验分布p(θ,z|y,α,φ)的近似替代,其中变分参数γ,通过我们下面的描述的优化过程进行设置,使用杰森不等式来获取文档对数似然的边界,为了简化省略参数γ和可以得到:
通过上式可以看出杰森不等式能够为一个随机的变分分布提供了一个对数似然的下界。可以容易证明上式左右两面等式之间的差别等于变分后验概率和真实后验概率的KL散度。即让表示式的右边部分(其中在下面的式子中还原了对变分参数γ和的依赖关系)表示成:
这表明最大化指定γ和时的下界等价于最小化变分后验概率和真实后验概率之间的KL散度。通过使用p和q的因子展开下界:
最后,展开式以模型参数(α,φ)和变分参数的形式,
其中使用了多项式中的期望式子:
接下来,使用指定的变分参数γ,去最大化该下界。值得注意的是这是个约束最大化,因此引入拉格朗日算符通过孤立条件和增加合适的拉格朗日乘数λ。其中对相关:
其中为了简化省略了L的参数,下标表示L是关于的函数。对L关于求导得:
令导数为零计算出变分参数的最大值为:
同理,我们可以得到包含γi(第i个后验Dirichlet参数分量)的形式:
关于γi求导并令导数为零可得:
变分分布其实是一个条件概率分布,作为一个y的函数变化。因此,变分分布公式最终可以写成形式,可以看成是真实后验分布p(θ,zn,t|yn,t,α,φ)的近似。
在给定文档语料库D={Y1,...,YM}条件下,要获得使数据的对数似然函数最大化的参数α和φ的值,正如上面描述的,概率分布p(y|α,φ)在计算上并不易于处理。不过由于变分推理算法给处理对数似然的下限,这个下限可以最大化对应的α和φ。因此可以寻求近似经验贝叶斯估计为模型的下一部分通过一个交替变化的EM过程,这个过程可以在给定对应的变分参数γ和的前提下最大化下界,然后固定变分参数的值,就对应的模型参数α和φ最大化下界。可以运用变分EM算法得到变分参数γ和以及模型参数α和φ来将下限最大化处理。
变分EM算法迭代过程分为以下两个步骤:
1.E-步骤,对于每个文档集合,寻找变分参数的最佳值,然后让变分分布近似p(θ,z|y,α,φ)。
2.M-步骤,将对数似然的下限最大化,相当于E-步骤中得到的近似后验条件下推导出每篇文档的最大似然估计,根据α和φ极大化E中p(y|α,φ)边界。
考虑模型参数获取数α和φ的经验贝叶斯估计问题,通过将变分下界作为边缘对数似然的近似来解决该问题,将变分参数的和γ的取值在变分推理得到的值上,然后获取(近似)经验贝叶斯估计通过最大化这个下界关于模型参数。综合的方法去寻找经验贝叶斯估计是基于变分EM步骤的,在变分E步骤中,最大化边界关于变分参数γ和在M步骤中,最大化边界关于模型参数α和φ。为了最大化边界关于φ,孤立其他条件和引入拉格朗日乘数。
关于φij求导并设导数为零得:
同理边界关于α的为:
关于αi求导:
这个导数依赖于α,其中i≠j,因此需要使用迭代的方法寻求α的最大值,本发明调用Linear-time Newton-Raphson算法去迭代上式求得α的最大值。值得注意的是,可以使用相同的方法去得到η的一个经验贝叶斯点估计值。这样在环路LDA-HMM下部分采样得到α,φ及η的估计。
步骤五:环路HMM-LDA模型的树加权
环路LDA-HMM在iHMM和LDA的基础上构建了HMM状态和LDA主题特征之间的相互影响,该模型是一个有向有环概率图模型结构,在参数的推理过程中必将按照有环概率图模型结构的树重加权的思想进行参数推理。即:将有向有环图转换为无环的生成树形式,在无环树上进行参数推理,将推理之后的参数再次使用树重加权进行优化。环路LDA-HMM模型可以分解为两个生成树形式,一个树为iHMM结构,另一个树为LDA结构,各自参数已由上面推理过程得到,设iHMM的树结构参数推理得到αihmm和θihmm,LDA的树结构参数推理得到αlda和θlda,则环路LDA-HMM的参数可以表示为:
α=λihmmαihmm+λldaαlda
θ=μihmmθihmm+μldaθlda
其中λihmm,μihmm,分别为iHMM的树结构参数α和θ的权值,λlda,μlda,分别为LDA树结构α和θ的权值。为了简化推理过程,取最理想的加权状态,令两个树的参数的加权值都为0.5,即λihmm=λlda=0.5,μihmm=μlda=0.5。
步骤六:视频异常检测
iHMM异常检测包含两个部分,前一个部分是对事件的评估,后一部分是参数的学习,参数学习就是模型参数未知,求最佳模型参数λ的问题。将使用者产生的数据组成的数据文档的语义特征视为HMM模型的观测量O=O1,O2,…OT。
视频异常检测过程主要涉及到iHMM三个问题中的评估问题,采取前向算法则可以解决这一问题。
前向算法:
定义t时刻状态j的局部概率为αt(j)=Pr(观测状态|隐藏状态j)×Pr(t时刻所有指向状态j的路径),对于最后的状态,其局部概率包括了通过所有可能的路径到达这些状态的概率。
特别当t=1时,没有任何指向当前状态的路径。故t=1时位于当前状态的概率是初始概率,即Pr(state|t=1)=P(state),因此,t=1时的局部概率α1(i)等于当前状态的初始概率乘以相关的观察概率:
α1(i)=π(i)bi(o1)
计算t>1时的局部概率α′s。
t-1时刻α′s给出了所有到达此t时刻状态的前一路径概率,因此,我们可以通过t-1时刻的局部概率定义t时刻的α′s:
可以递归地计算给定隐马尔科夫模型后一个观察序列的概率,即通过t=1时刻的局部概率α′s计算t=2时刻的α′s,通过t=2时刻的α′s计算t=3时刻的α′s等等直到t=T。给定隐马尔科夫模型的观察序列的概率就等于t=T时刻的局部概率之和。
使用前向算法计算T时长的观察序列的概率:
已知T时长观察序列:O=Ο1Ο2…ΟT
1)t=1时刻所有状态的局部概率α:
α1(j)=π(j)bj(o1)
2)在t=2……T时,对于每个状态的局部概率,由下式计算:
3)最后,给定HMM,观察序列的概率等于T时刻所有局部概率之和:
对于某一个场景的异常事件检测,我们可以选取正常场景的视频段作为训练数据,经过低层特征提取,LDA主题特征提取后,训练出一个LDA-HMM环路模型。然后,将正常场景的视频段和含有异常事件的该场景的视频段分别送入已训练好的LDA-HMM模型,根据前向算法,可以得到不同视频段每一帧的似然函数。当某帧的似然函数差大于某一个阈值时,这个阈值可以人为设定,判断该帧出现异常。
本发明的有益效果在于针对基于LDA和HMM的视频异常事件检测框架下,受到概率拖尾问题和视频异常检测模型过度拟合的困扰,提出了一种基于LDA-HMM的环路图模型视频异常检测方法,建立HMM状态和LDA主题特征之间的“谐振”,使得HMM状态影响LDA主题特征,而且反过来LDA主题特征也会影响HMM状态,从而解决概率拖尾及模型阶数需人为设定的问题,使视频异常检测达到更加精确的效果。
附图说明
图1为本发明的流程图;
图2为环路LDA-HMM生成图
具体实施方式
本发明的实施流程图如图1所示,具体实施步骤如下:
步骤1.底层特征提取:对已录制的视频,采用SIFT算法对每一帧图像抽取二维图像位置信息特征,得到若干个特征点的128维方向参数,将这些特征点聚类,构建BOW词袋的形式;
步骤2.将视频帧序列的BOW词袋作为文档D,通过LDA模型进行主题语义特征的提取,获取得到表示每帧图像主题特征的主题特征矩阵γ;
步骤3.将主题特征矩阵γ作为环路HMM-LDA模型的观测量进行环路HMM-LDA的上一部分的参数学习,通过引入辅助变量u,使得潜在状态轨迹中的状态数量为一有限值,利用动态规划的方法计算状态轨迹的条件概率并对整个轨迹进行采样;
采样u:在已知状态转移概率矩阵π、t-1和t时刻的轨迹状态st-1、st情况下,ut服从条件分布
采样s:st的后验概率为:
其中zn,t表示t时刻的观测量,n为设定的观测个数,ΙΙ(C)表示如果满足条件C则ΙΙ(C)=1,否则ΙΙ(C)=0;
采样π:令mij表示从状态i转移到状态j的次数,s中不同状态的数目为K,这些状态被标记为1,2…,K,将s中所有未出现的无限多个状态融合在一起,则πk可表示为在给定轨迹状态s,共享DP基础测量β和精度测量α下,其后验分布为:
采样α:假设α服从参数为a和b的Gamma分布,则其后验概率分布为:
其中和为辅助变量,ωj在[0,1]内取值,vj是一二进制{0,1}变量;
采样θ:每一项θm关于s,z及它们的先验分布H条件独立服从分布:
p(θ|s,z,H)=∏kp(θm|s,z,H)
由于基分布Dir(α)和数据分布F多项式分布为共轭分布,每一个θm可以迅速的采集到;
步骤4.选取新的视频段序列重复步骤1,得到新的BOW词袋,将步骤3采样得到的α作为LDA模型的超先验参数,进行环路HMM-LDA下一部分的参数学习;在给定词袋D={Y1,...,YM}条件下,参数推理的目的是为了获得数据对数似然函数最大化的参数α和φ的值,首先引入变分参数γ和将寻找对数下限的问题转化成下面的优化问题:
其中z表示主题,y表示词汇,θ表示主题-文档分布矩阵,然后将变分分布和真实分布p(θ,zn,t|yn,t,α,φ)之间的Kullback-Leibler(KL)散度最小化得到最佳的变分参数值和计算KL散度的导数并设置为0,得到一组更新方程:
运用EM算法,进行反复迭代,直到超先验参数α和β收敛,求出此时α和β的值,根据θ~Dir(α),可以继而推导出参数θ;
步骤5.将环路HMM-LDA关联树上的参数进行树重加权处理,把环路模型分解为iHMM结构和LDA结构的两个无环生成树,由步骤3、步骤4的参数推理过程,可以得到αihmm,θihmm和αlda,θlda,环路模型的参数可以表示为:
α=λihmmαihmm+λldaαlda
θ=μihmmθihmm+μldaθlda
其中λihmm,μihmm和λlda,μlda分别为iHMM和LDA树结构参数α和θ的权值,取最理想的加权状态,令两个树的参数的加权值都为0.5,完成建模;
步骤6.异常检测,将正常场景的视频段和含有异常事件的视频段分别进行步骤1和步骤2,得到的语义特征作为已训练好的环路HMM-LDA模型的输入值,根据前向算法,计算得到两视频段每一帧的似然函数,将两似然函数作差并设置一个阈值,绝对值大于阈值时设定为异常事件,小于等于阈值时设定为正常事件。
Claims (1)
1.基于环路图模型的视频异常检测方法,其特征在于该方法的具体步骤是:
步骤1.底层特征提取:对已录制的视频,采用SIFT算法对每一帧图像抽取二维图像位置信息特征,得到若干个特征点的128维方向参数,将这些特征点聚类,构建BOW词袋的形式;
步骤2.将视频帧序列的BOW词袋作为词袋D,通过LDA模型进行主题语义特征的提取,获取得到表示每帧图像主题特征的主题特征矩阵γ;
步骤3.将主题特征矩阵γ作为环路HMM-LDA模型的观测量进行环路HMM-LDA的上一部分的参数推理,通过引入辅助变量u,使得潜在状态轨迹中的状态数量为一有限值,利用动态规划的方法计算状态轨迹的条件概率并对整个轨迹进行采样;
采样u:在已知状态转移概率矩阵π、t-1和t时刻的轨迹状态st-1、st情况下,ut服从条件分布
采样s:st的后验概率为:
其中zn,t表示t时刻的观测量,n为设定的观测个数,ΙΙ(C)表示如果满足条件C则ΙΙ(C)=1,否则ΙΙ(C)=0;
采样π:令mij表示从状态i转移到状态j的次数,s中不同状态的数目为K,这些状态被标记为1,2…,K,将s中所有未出现的无限多个状态融合在一起,则πk可表示为在给定轨迹状态s,共享DP基础测量β和精度测量α下,其后验分布为:
采样α:假设α服从参数为a和b的Gamma分布,则其后验概率分布为:
其中和为辅助变量,ωj在[0,1]内取值,vj是一二进制{0,1}变量;
采样θ:每一项θm关于s,z及它们的先验分布H条件独立服从分布:
p(θ|s,z,H)=∏kp(θm|s,z,H)
由于基分布Dir(α)和数据分布F多项式分布为共轭分布,每一个θm可以迅速的采集到;
步骤4.选取新的视频段序列重复步骤1,得到新的BOW词袋,将步骤3采样得到的α作为LDA模型的超先验参数,进行环路HMM-LDA下一部分的参数推理;在给定词袋D={Y1,...,YM}条件下,参数推理的目的是为了获得数据对数似然函数最大化的参数作为α和φ的估计值,首先引入变分参数γ和将寻找对数下限的问题转化成下面的优化问题:
其中z表示主题,y表示词汇,θ表示主题-文档分布矩阵,然后将变分分布和真实分布p(θ,zn,t|yn,t,α,φ)之间的Kullback-Leibler散度最小化得到最佳的变分参数值和计算KL散度的导数并设置为0,得到一组更新方程:
运用EM算法,进行反复迭代,直到超先验参数α和β收敛,求出此时α和β的值,根据θ~Dir(α),可以继而推导出参数θ;
步骤5.将环路HMM-LDA关联树上的参数进行树重加权处理,把环路模型分解为iHMM结构和LDA结构的两个无环生成树,由步骤3、步骤4的参数推理过程,可以得到αihmm,θihmm和αlda,θlda,环路模型的参数可以表示为:
α=λihmmαihmm+λldaαlda
θ=μihmmθihmm+μldaθlda
其中λihmm,μihmm和λlda,μlda分别为iHMM和LDA树结构参数α和θ的权值,取最理想的加权状态,令两个树的参数的加权值都为0.5,完成建模;
步骤6.异常检测,将正常场景的视频段和含有异常事件的视频段分别进行步骤1和步骤2,得到的语义特征作为已训练好的环路HMM-LDA模型的输入值,根据前向算法,计算得到两视频段每一帧的似然函数,将两似然函数作差并设置一个阈值,绝对值大于阈值时设定为异常事件,小于等于阈值时设定为正常事件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310439344.8A CN103530603B (zh) | 2013-09-24 | 2013-09-24 | 基于环路图模型的视频异常检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310439344.8A CN103530603B (zh) | 2013-09-24 | 2013-09-24 | 基于环路图模型的视频异常检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103530603A CN103530603A (zh) | 2014-01-22 |
CN103530603B true CN103530603B (zh) | 2017-01-04 |
Family
ID=49932602
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310439344.8A Expired - Fee Related CN103530603B (zh) | 2013-09-24 | 2013-09-24 | 基于环路图模型的视频异常检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103530603B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108162848A (zh) * | 2016-12-07 | 2018-06-15 | 丰田自动车株式会社 | 前灯控制数据生成装置和车辆控制装置 |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105547722A (zh) * | 2015-12-12 | 2016-05-04 | 北京化工大学 | 基于lda主题模型的往复机械异常检测方法 |
CN105843223B (zh) * | 2016-03-23 | 2018-11-20 | 东南大学 | 一种基于空间词袋模型的移动机器人三维建图与避障方法 |
CN105931271B (zh) * | 2016-05-05 | 2019-01-18 | 华东师范大学 | 一种基于变分bp-hmm的人的行为轨迹识别方法 |
CN106557779A (zh) * | 2016-10-21 | 2017-04-05 | 北京联合大学 | 一种基于显著区域词袋模型的物体识别方法 |
CN107992549B (zh) * | 2017-11-28 | 2022-11-01 | 南京信息工程大学 | 动态短文本流聚类检索方法 |
CN108108688B (zh) * | 2017-12-18 | 2021-11-23 | 青岛联合创智科技有限公司 | 一种基于低维时空特征提取与主题建模的肢体冲突行为检测方法 |
CN108509834B (zh) * | 2018-01-18 | 2022-05-31 | 杭州电子科技大学 | 基于多元对数高斯分布下视频特征的图结构规约方法 |
CN108462708B (zh) * | 2018-03-16 | 2020-12-08 | 西安电子科技大学 | 一种基于hdp-hmm的行为序列的检测方法 |
CN108418835A (zh) * | 2018-04-08 | 2018-08-17 | 北京明朝万达科技股份有限公司 | 一种基于Netflow日志数据的端口扫描攻击检测方法及装置 |
CN109142979B (zh) * | 2018-09-18 | 2023-08-11 | 中国电力科学研究院有限公司 | 一种配电网异常状态的检测方法及装置 |
CN111368089B (zh) * | 2018-12-25 | 2023-04-25 | 中国移动通信集团浙江有限公司 | 一种基于知识图谱的业务处理方法及装置 |
CN109918939B (zh) * | 2019-01-25 | 2023-08-11 | 东华大学 | 基于hmm的用户查询风险评估和隐私保护方法 |
CN113642986B (zh) * | 2021-08-02 | 2024-04-16 | 上海示右智能科技有限公司 | 构建数字公证的方法 |
CN115879179B (zh) * | 2023-02-24 | 2023-05-09 | 忻州师范学院 | 一种异常病历检测装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6314204B1 (en) * | 1998-11-03 | 2001-11-06 | Compaq Computer Corporation | Multiple mode probability density estimation with application to multiple hypothesis tracking |
CN102163290A (zh) * | 2011-05-16 | 2011-08-24 | 天津大学 | 基于时空关联信息的多视角视频监控中异常事件建模方法 |
CN102201065A (zh) * | 2011-05-16 | 2011-09-28 | 天津大学 | 基于轨迹分析的监控视频异常事件检测方法 |
CN102938078A (zh) * | 2012-11-30 | 2013-02-20 | 北京理工大学 | 基于非均衡时序的监控视频异常事件检测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101640077B1 (ko) * | 2009-06-05 | 2016-07-15 | 삼성전자주식회사 | 인체 동작 및 얼굴 표정 모델링 및 인식을 위한 비디오 센서 기반의 장치 및 방법 |
-
2013
- 2013-09-24 CN CN201310439344.8A patent/CN103530603B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6314204B1 (en) * | 1998-11-03 | 2001-11-06 | Compaq Computer Corporation | Multiple mode probability density estimation with application to multiple hypothesis tracking |
CN102163290A (zh) * | 2011-05-16 | 2011-08-24 | 天津大学 | 基于时空关联信息的多视角视频监控中异常事件建模方法 |
CN102201065A (zh) * | 2011-05-16 | 2011-09-28 | 天津大学 | 基于轨迹分析的监控视频异常事件检测方法 |
CN102938078A (zh) * | 2012-11-30 | 2013-02-20 | 北京理工大学 | 基于非均衡时序的监控视频异常事件检测方法 |
Non-Patent Citations (1)
Title |
---|
基于HMM和LDA级联的视频异常检测;邹友辉等;《杭州电子科技大学学报》;20130430;第33卷(第2期);第13-16页 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108162848A (zh) * | 2016-12-07 | 2018-06-15 | 丰田自动车株式会社 | 前灯控制数据生成装置和车辆控制装置 |
Also Published As
Publication number | Publication date |
---|---|
CN103530603A (zh) | 2014-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103530603B (zh) | 基于环路图模型的视频异常检测方法 | |
CN111950594B (zh) | 基于子图采样的大规模属性图上的无监督图表示学习方法和装置 | |
Wyse et al. | Inferring structure in bipartite networks using the latent blockmodel and exact ICL | |
Wang et al. | A united approach to learning sparse attributed network embedding | |
CN103177450B (zh) | 一种基于构件集采样的图像场景分割与分层联合求解方法 | |
Tan et al. | Traffic volume data outlier recovery via tensor model | |
CN101299241A (zh) | 基于张量表示的多模态视频语义概念检测方法 | |
CN104992184A (zh) | 一种基于半监督极限学习机的多类图像分类方法 | |
Cheng et al. | An advanced hybrid deep adversarial autoencoder for parameterized nonlinear fluid flow modelling | |
CN102129463A (zh) | 一种融合项目相关性的基于pmf的协同过滤推荐系统 | |
CN107085764A (zh) | 一种基于改进dfhmm模型的负荷分解方法及装置 | |
Liu et al. | A two-stage deep autoencoder-based missing data imputation method for wind farm SCADA data | |
Abdulhai et al. | Spatio-temporal inductance-pattern recognition for vehicle re-identification | |
CN106126910A (zh) | 基于马尔科夫状态转移模型的状态转换预测方法及系统 | |
CN108830301A (zh) | 基于锚图结构的双拉普拉斯正则化的半监督数据分类方法 | |
CN104820843A (zh) | 一种基于优化高斯混合模型的图像语义标注的方法 | |
CN110162744A (zh) | 一种基于张量的车联网数据缺失多重估计新方法 | |
CN104317837B (zh) | 一种基于主题模型的跨模态检索方法 | |
CN103268484A (zh) | 用于高精度人脸识别的分类器设计方法 | |
Yin et al. | Spatiotemporal dynamic graph convolutional network for traffic speed forecasting | |
Monteiro et al. | Polynomial-time algorithm for learning optimal tree-augmented dynamic Bayesian networks. | |
Zhao et al. | KE-X: Towards subgraph explanations of knowledge graph embedding based on knowledge information gain | |
Gao et al. | Unbiased risk estimator to multi-labeled complementary label learning | |
CN116775855A (zh) | 基于Bi-LSTM的TextRank中文摘要自动生成方法 | |
Yang et al. | Fast flow field prediction of three-dimensional hypersonic vehicles using an improved Gaussian process regression algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170104 Termination date: 20180924 |
|
CF01 | Termination of patent right due to non-payment of annual fee |