CN107832716B - 基于主动被动高斯在线学习的异常检测方法 - Google Patents
基于主动被动高斯在线学习的异常检测方法 Download PDFInfo
- Publication number
- CN107832716B CN107832716B CN201711130646.1A CN201711130646A CN107832716B CN 107832716 B CN107832716 B CN 107832716B CN 201711130646 A CN201711130646 A CN 201711130646A CN 107832716 B CN107832716 B CN 107832716B
- Authority
- CN
- China
- Prior art keywords
- feature vector
- passive
- gaussian
- active
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
- G06V20/42—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items of sport video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/251—Fusion techniques of input or preprocessed data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
Abstract
本发明公开了一种基于主动被动高斯在线学习的异常检测方法,包括:将输入的正常的连续视频帧进行预处理使目标形态上融入运动的信息,获得处理后的融合图像;利用深度神经网络提取融合图像的特征,获得一系列的特征向量;利用特征向量并结合基于主动被动规则约束的在线学习方法训练高斯分布,作为正常参考模型;在异常检测阶段,采用同样的方式对输入的连续视频帧进行预处理与特征提取操作,并求取各个特征向量在训练后的高斯分布上的分布距离,根据分布距离来判断相应特征向量是否异常。该方法可以在保证检测精度的前提下,降低训练时间并减少资源消耗。
Description
技术领域
本发明涉及异常检测技术领域,尤其涉及一种基于主动被动高斯在线学习的异常检测方法。
背景技术
视频异常检测是关乎公共安全的计算机视觉和机器学习相结合的重要研究领域,目前有大量的精确有效的基于场景监控视频的异常检测算法,主要完成具有不同于场景中大部分目标的特殊目标检测,这种不同主要表现在外观速度或者轨迹上。
现有的异常检测技术很多的是使用手工特征来进行分类,手工特征有着算法复杂度高,算法精度较差的缺陷。由于近年来深度学习的广泛应用和出色表现,使用深度神经网络进行异常检测,也成为一种比较新的解决思路,但是由于深度信息数量大维度高,训练判别模型时具有资源占用巨大时间开销巨大的缺点。
发明内容
本发明的目的是提供一种基于主动被动高斯在线学习的异常检测方法,可以在保证检测精度的前提下,降低训练时间并减少资源消耗。
本发明的目的是通过以下技术方案实现的:
一种基于主动被动高斯在线学习的异常检测方法,包括:
将输入的正常的连续视频帧进行预处理使目标形态上融入运动的信息,获得处理后的融合图像;
利用深度神经网络提取融合图像的特征,获得一系列的特征向量;
利用特征向量并结合基于主动被动规则约束的在线学习方法训练高斯分布,作为正常参考模型;
在异常检测阶段,采用同样的方式对输入的连续视频帧进行预处理与特征提取操作,并求取各个特征向量在训练后的高斯分布上的分布距离,根据分布距离来判断相应特征向量是否异常。
由上述本发明提供的技术方案可以看出,通过基于主动被动规则约束的在线学习方法训练高斯分布,将训练后的高斯分布用于分类和提取来自视频深度信息中可能存在的异常,大大减少了传统训练手段带来的时间和计算资源消耗巨大的问题。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的一种基于主动被动高斯在线学习的异常检测方法的流程图;
图2为本发明实施例提供的一种基于主动被动高斯在线学习的异常检测方法的示意图;
图3为本发明实施例提供的计算模型和学习模型的异常检测效果比较结果。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
图1为本发明实施例提供的一种基于主动被动高斯在线学习的异常检测方法的流程图,图2为相应的示意图。如图1所示,其主要包括如下步骤:
步骤11、将输入的正常的连续视频帧进行预处理使目标形态上融入运动的信息,获得处理后的融合图像。
预处理过程如下:将连续的六帧视频帧按顺序两两平均,然后将平均产生的三张均值图片作为三个通道融合成一张图片。
细节说明:由于图片的预处理机制,会产生6帧图像的延迟,这段时间对于目前至少25fps的监控视频是可以忽略的(即少于0.2秒)。同时由于在线学习初期对噪声的敏感性,可以考虑事先采用部分视频帧进行初始化,1秒钟的视频帧就足以完成对判别模型的初始化过程了,在此之后系统可以在线地运行。
步骤12、利用深度神经网络提取融合图像的特征,获得一系列的特征向量。
本发明实施例中,可以先测试和比较目前常用的几种深度神经网络对于监控视频的特征响应,找到响应最突出的一种网络结构用于之后的特征提取工作。通过大量实验比较,本实施例中,可以优选VGG16网络的conv4-1层作为特征输出层。
对于特定的深度神经网络,其包含若干输出层,对于某一时刻t,输入的融合图像,输出层k输出的特征为每个像素点坐标的mk维的特征向量的集合,表示为:
其中,(wk,hk)为特征向量的尺寸,(u,v)为特征向量中像素点坐标,mk为特征向量的数目,每一特征向量分别对应着输出层k中一个卷积核产生的响应。
每个特征向量产生自一个特定层的特定位置,源自于一个特定的感知区域。一般地对于大部分卷积和池化操作构成的卷积神经网络而言,每层输出的特征向量尺寸(wk,hk)随着k的增加而减小,但是特征向量的维度(数目)mk会随着k的增加而变高。
步骤13、利用特征向量并结合基于主动被动规则约束的在线学习方法训练高斯分布,作为正常参考模型。
为了对正常的行为进行建模,本发明实施例中使用一个高斯分布(高斯模型)来拟合步骤12提取的正常区域的特征分布,这一高斯分布就成为正常参考模型。在后续的检测阶段,测试帧It被类似的区域特征描述表示,出现和正常区域特征有很大差异的输入区域被确定为异常,这样的处理方式便于我们进行高效的计算。
在本步骤中,使用一系列特征向量训练高斯分布G(f,μ,Σ),其中,μ为均值,Σ为协方差,f为特征向量集合,输出层k对应的第l个特征向量为fk(u,v,l),u=1,2,...,wk,v=1,2,...,hk,l=1,2,...,mk。
训练高斯分布G时使用基于主动被动规则约束(passive-aggressive rule)的在线学习方法,主动条件下让目标方程向着一个方向逼近,但是被动地我们需要让它承受某种约束,也就是说被动规则使得我们的目标方程加入了一个惩罚单元,类似于优化神经网络参数时使用的惩罚项(penalty term)。将更新前和更新后的两个分布的KL分歧作为被动约束,被动约束用于约束参数值同时约束参数的分布类型和变化趋势,也就是说,我们在优化对数似然概率的同时要求我们这一次更新产生的高斯分布和更新之前的高斯分布尽可能相像。之后我们不通过梯度下降,而是直接求取组合了主动和被动规则的方程的极值,从而得到对于目标参数的更新。公式的主要推导过程如下:
式中,L表示目标函数,x指特征向量,等价于fk(u,v,l),为了书写简单和表述方便用x表示;μ指训练高斯分布的均值,Σ表示训练高斯分布的协方差;无下标表示当前次的更新参数,下标t-1表示上一次更新的参数,例如,当前次为第t次的更新,则μ、Σ分别对应当前次(第t次)更新的均值与协方差,μt-1、Σt-1分别对应上一次(t-1次)更新的均值与协方差;N表示高斯分布函数,DKL为两个分布(N(μt-1,Σt-1)与N(μ,Σ))的KL分歧。
对于第t次的更新,在特征向量批内(批内特征向量数量为M)计算特征向量的均值与协方差,因为设置批大小M等于每个输入帧所产生的特征向量数,所以t在物理意义上代表着帧序号;之后再使用以上公式优化更新批之间(当先批和前一批之间)的均值与协方差,也可以认为t指批号。基于此,本领域技术人员可以理解,式中的t-1主要是为了区分相关参数是上一次更新产生的产生。
展开L(μ,Σ)后得到:
式中,xi为批内第i个特征向量
将上式中的DKL进行展开:
其中的λ为约束系数,等于迭代次数分之一(λ=1/(t-1));Tr为矩阵基本运算的迹运算,d为常数。
使用快坐标优化算法的方式求解上式取极限条件目标参数μ,Σ的值;首先固定协方差Σ不变,来更新均值μ,求解方法是,求关于μ的偏微分函数,然后令其为0,解得对于均值的更新方程:
即,
之后,再固定均值μ不变,求关于协方差Σ的偏微分函数,解出对于协方差Σ的更新:
通过上式公式能够得到对于目标参数均值和方差的更新,在每次迭代中,一次性读入一批(M个)特征向量,在批内计算对均值和协方差的更新,通过若干批的更新得到最终的均值与协方差,从而完成高斯分布的训练。
步骤14、在异常检测阶段,采用同样的方式对输入的连续视频帧进行预处理与特征提取操作,并求取各个特征向量在训练后的高斯分布上的分布距离,根据分布距离来判断相应特征向量是否异常。
在异常检测阶段,对输入的连续视频帧进行预处理与特征提取操作后,输出层k对应的特征向量记为fk'(u,v,l),求取特征向量fk'(u,v,l)在训练后高斯分布G上的分布距离(马氏距离):
若求得的分布距离小于阈值α,则相应特征正常;否则,相应特征异常,表示为:
使用这样的判别模型,基于的是对于异常目标的出现以及异常目标的形态具有高度的随机性而符合正态分布的假设。同时在考虑检测的快速性方面单高斯模型有着很大的优势。
由于特征向量的维度很高,在本发明中有512维(mk=512)这样即便使用的是简单的单高斯分布,训练产生均值和协方差矩阵的成本仍然是很高的(512维的高维高斯分布),假设对于一个长度为5分钟的视频其帧率是25FPS分辨率为256×256,训练产生其对应的单高斯分布的代价是在一个宽为512高为5×60×25×32×32=768万的矩阵中计算均值和协方差,我们使用最直接的方法进行计算并粗略测算了时间,高达1.5小时,内存(RAM)占用更是高达180GB。而且在实际状况下,我们不仅不能只使用5分钟的视频进行训练,也不可能使用这么不清晰的视频进行训练,而且超过180GB内存配置的PC机是几乎不存在的,所以对训练过程在保证结果有效性的前提下进行加速和内存压缩就成为了一个非常重要的问题。
另外,现有的异常检测算法中虽然有着很高的检测精度,但是由于计算缓慢,完全没有检测的实时性可言,这样大大制约了这类技术在现实场景中的使用,按照我们对传统训练高斯模型方法的估计,现在最高端的高性能计算服务器中都很少有满足其内存要求的型号,更不要说我们实际应用环境下的普通个人电脑的计算资源了,所以对算法进行“减负”是现在很多异常检测技术实际应用前必须面对的重要问题。所以,本发明提出的在线学习策略,不仅仅对于我们使用的高斯模型,对于很多的判别模型的训练,以及很多异常检测手段的优化,都有着一定的参考和启发意义。
通过相关实验表明,使用本发明的方法可以节约80%以上的时间消耗和99%的内存占用(参见表1)。在加速和节约资源的同时保证异常检测的精度不下降(参见附图3),计算模型(VGG4-1learned(AUC=0.83))和基于本发明的学习模型(Computed(AUC=0.83))的异常检测效果几乎一致说明我们学习到的模型和直接计算结果是一致的。
表1算法内存占用和训练时间分析和比较
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,上述实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。
Claims (5)
1.一种基于主动被动高斯在线学习的异常检测方法,其特征在于,包括:
将输入的正常的连续视频帧进行预处理使目标形态上融入运动的信息,获得处理后的融合图像;
利用深度神经网络提取融合图像的特征,获得一系列的特征向量;
利用特征向量并结合基于主动被动规则约束的在线学习方法训练高斯分布,作为正常参考模型;
在异常检测阶段,采用同样的方式对输入的连续视频帧进行预处理与特征提取操作,并求取各个特征向量在训练后的高斯分布上的分布距离,根据分布距离来判断相应特征向量是否异常。
2.根据权利要求1所述的一种基于主动被动高斯在线学习的异常检测方法,其特征在于,所述将输入的正常的连续视频帧进行预处理使目标形态上融入运动的信息,获得处理后的融合图像包括:
将连续的六帧视频帧按顺序两两平均,然后将平均产生的三张均值图片作为三个通道融合成一张图片。
4.根据权利要求1所述的一种基于主动被动高斯在线学习的异常检测方法,其特征在于,所述利用特征向量并结合基于主动被动规则约束的在线学习方法训练高斯分布包括:
使用一系列特征向量训练高斯分布G(f,μ,Σ),其中,μ为均值,Σ为协方差,f为特征向量集合,输出层k对应的第l个特征向量为fk(u,v,l),u=1,2,...,wk,v=1,2,...,hk,(wk,hk)为特征向量的尺寸,(u,v)为特征向量中像素点坐标,mk为特征向量的数目;
训练高斯分布G时使用基于主动被动规则约束的在线学习方法,主动条件下让目标方程向着一个方向逼近,将更新前和更新后的两个分布的KL分歧作为被动约束,被动约束用于约束参数值同时约束参数的分布类型和变化趋势,具体如下:
式中,L表示目标函数,x指特征向量,等价于fk(u,v,l),μ、Σ分别对应当前次,即第t次更新的均值、协方差,μt-1、Σt-1分别对应上一次,即t-1次更新的均值、协方差;N表示高斯分布函数,DKL为两个分布的KL分歧;
展开L(μ,Σ)后得到:
式中,xi为第i个特征向量;
将上式中的DKL进行展开:
其中的λ为约束系数;
使用快坐标优化算法的方式求解上式取极限条件目标参数μ,Σ的值;首先固定协方差Σ不变,来更新均值μ,求解方法是,求关于μ的偏微分函数,然后令其为0,解得对于均值的更新方程:
即,
之后,再固定均值μ不变,求关于协方差Σ的偏微分函数,解出对于协方差Σ的更新:
通过上式公式能够得到对于目标参数μ,Σ的更新,在每次迭代中,一次性读入一批特征向量,在批内计算对均值和协方差的更新,通过若干批的更新得到最终的均值与协方差,从而完成高斯分布的训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711130646.1A CN107832716B (zh) | 2017-11-15 | 2017-11-15 | 基于主动被动高斯在线学习的异常检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711130646.1A CN107832716B (zh) | 2017-11-15 | 2017-11-15 | 基于主动被动高斯在线学习的异常检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107832716A CN107832716A (zh) | 2018-03-23 |
CN107832716B true CN107832716B (zh) | 2020-05-12 |
Family
ID=61654473
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711130646.1A Active CN107832716B (zh) | 2017-11-15 | 2017-11-15 | 基于主动被动高斯在线学习的异常检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107832716B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108829136B (zh) * | 2018-08-29 | 2019-06-25 | 北京航空航天大学 | 无人机群大范围协同监测方法 |
CN109409268A (zh) * | 2018-10-16 | 2019-03-01 | 江苏开放大学(江苏城市职业学院) | 一种网络在线学习的学习环境监测方法 |
CN110349673B (zh) * | 2019-06-27 | 2022-08-05 | 吉林大学 | 一种基于高斯混合分布的群体体质评估方法 |
CN111160170B (zh) * | 2019-12-19 | 2023-04-21 | 青岛联合创智科技有限公司 | 一种自学习的人体行为识别与异常检测方法 |
CN113887383A (zh) * | 2021-09-29 | 2022-01-04 | 厦门大学 | 基于无监督异常检测的溺水检测方法及装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8140301B2 (en) * | 2007-04-30 | 2012-03-20 | International Business Machines Corporation | Method and system for causal modeling and outlier detection |
CN101719216B (zh) * | 2009-12-21 | 2012-01-04 | 西安电子科技大学 | 基于模板匹配的运动人体异常行为识别方法 |
US9495594B2 (en) * | 2013-07-18 | 2016-11-15 | The United States Of America As Represented By The Secretary Of The Army | Image anomaly detection in a target area using polarimetric sensor data |
CN103390278B (zh) * | 2013-07-23 | 2016-03-09 | 中国科学技术大学 | 一种视频异常行为检测系统 |
CN104599243B (zh) * | 2014-12-11 | 2017-05-31 | 北京航空航天大学 | 一种多视频流与三维场景的虚实融合方法 |
CN105426820B (zh) * | 2015-11-03 | 2018-09-21 | 中原智慧城市设计研究院有限公司 | 基于安防监控视频数据的多人异常行为检测方法 |
CN105608446B (zh) * | 2016-02-02 | 2019-02-12 | 北京大学深圳研究生院 | 一种视频流异常事件的检测方法及装置 |
CN106571014A (zh) * | 2016-10-24 | 2017-04-19 | 上海伟赛智能科技有限公司 | 一种在视频中识别异常动作的方法和系统 |
-
2017
- 2017-11-15 CN CN201711130646.1A patent/CN107832716B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN107832716A (zh) | 2018-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107832716B (zh) | 基于主动被动高斯在线学习的异常检测方法 | |
CN108241849B (zh) | 基于视频的人体交互动作识别方法 | |
Chen et al. | A cascaded convolutional neural network for age estimation of unconstrained faces | |
JP4964159B2 (ja) | ビデオのフレームのシーケンスにおいてオブジェクトを追跡するコンピュータに実装される方法 | |
CN103150546B (zh) | 视频人脸识别方法和装置 | |
CN109191488B (zh) | 一种基于csk与tld融合算法的目标跟踪系统及方法 | |
CN111104925B (zh) | 图像处理方法、装置、存储介质和电子设备 | |
CN108875655A (zh) | 一种基于多特征的实时目标视频跟踪方法及系统 | |
CN108280421B (zh) | 基于多特征深度运动图的人体行为识别方法 | |
CN107368802B (zh) | 基于kcf和人脑记忆机制的运动目标跟踪方法 | |
CN111402303A (zh) | 一种基于kfstrcf的目标跟踪架构 | |
CN110827262A (zh) | 一种基于连续有限帧红外图像的弱小目标检测方法 | |
CN117541994A (zh) | 一种密集多人场景下的异常行为检测模型及检测方法 | |
Huang et al. | A novel method for video moving object detection using improved independent component analysis | |
Saif et al. | Moment features based violence action detection using optical flow | |
Wang et al. | Spatio-temporal online matrix factorization for multi-scale moving objects detection | |
US20150371080A1 (en) | Real-time head pose tracking with online face template reconstruction | |
WO2024114500A1 (zh) | 一种人体姿态识别方法及装置 | |
Dutta et al. | Weighted singular value thresholding and its application to background estimation | |
CN105740819A (zh) | 一种基于整数规划的人群密度估计方法 | |
Foytik et al. | Tracking and recognizing multiple faces using Kalman filter and ModularPCA | |
CN109902720B (zh) | 基于子空间分解进行深度特征估计的图像分类识别方法 | |
CN112149596A (zh) | 一种异常行为检测方法、终端设备及存储介质 | |
Li et al. | Research on hybrid information recognition algorithm and quality of golf swing | |
CN110503061B (zh) | 一种融合多特征的多因素视频遮挡区域检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |