CN114926767A - 融合隐空间自回归的预测重构视频异常检测方法 - Google Patents
融合隐空间自回归的预测重构视频异常检测方法 Download PDFInfo
- Publication number
- CN114926767A CN114926767A CN202210587622.3A CN202210587622A CN114926767A CN 114926767 A CN114926767 A CN 114926767A CN 202210587622 A CN202210587622 A CN 202210587622A CN 114926767 A CN114926767 A CN 114926767A
- Authority
- CN
- China
- Prior art keywords
- network
- prediction
- reconstruction
- implicit
- autoregressive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
本发明公开了融合隐空间自回归的预测重构视频异常检测方法,属于监控视频处理领域,解决传统方法中由于视频信息多样性、异常事件稀少性而造成的视频异常误检、漏检问题;包括先对输入视频序列采用随机裁剪、随机水平旋转、标准化操作对输入视频序列进行数据预处理;定义预测网络约束,生成满足约束的预测帧;再结合UNet网络和隐空间自回归层构造重构网络,生成满足约束的重构帧;然后采用多个卷积层堆叠构造判别器,判别输入帧的异常值;最后采用生成对抗算法,训练预测生成网络、重构网络和判别器,优化网络参数。本发明获取的识别准确率比较高,识别速度比较快,能够满足大规模监控场景下视频异常检测的实时性要求。
Description
技术领域
本发明属于监控视频处理领域,涉及隐空间自回归技术,具体是融合隐空间自回归的预测重构视频异常检测方法。
背景技术
随着视频监控系统的普及,视频监控在公共安全、交通路况、城市管理等各个领域扮演着不可或缺的重要角色。但快速增长的视频监控设备产生了的海量视频数据,使得对于视频数据智能化处理成为迫切需要解决的现实需求。因此,如何高效、快速地对视频数据进行分析、识别、检测等问题已备受关注。
监控视频异常事件检测是视频智能化分析在安防领域应用的一个重要分支。监控视频异常事件检测旨在利用各类机器学习和深度学习的方法自动地检测和定位监控视频中各类违反常规的事件或行为,如人行道上闯入车辆,高速公路上行走的行人等异常事件。
相较于计算机视觉领域其他检测任务,视频异常事件检测任务面临以下挑战:
1)异常事件定义具有场景依赖性。即同一种事件在某个场景下为异常事件,但在另外一个场景下却被视为正常的事件。如行人在人行道上行走是正常事件,但行人在高速公路上行走却是异常事件。
2)异常事件的稀少性。现实生活中,异常事件毕竟是少数的事件,异常样本往往是稀少且难以获得的,这就造成了异常事件检测任务中正异常样本极度不均衡的情况。
3)视频信息的多样性。视频不同于图像以及文本数据,它不仅仅具备空间信息同时也具备极强的时序信息。
伴随着深度学习的发展,针对视频异常检测任务所面临的挑战,利用深度学习方法可以在一定程度上弱化异常检测任务对场景地依赖性,增加模型的泛化能力。同时,无监督的方法也能一定程度上解决样本不均衡引发的问题。基于无监督的视频异常检测方法是目前研究的热点,此类研究文献也较多,主要分为三类具体的方法:基于聚类的,基于重构的和基于预测的方法。以上方法在算法精度、算法鲁棒性及实时性上有待进一步提高,而隐含特征空间在语义特征表示上的作用有利于提高检测效率。
为此,本发明提出融合隐空间自回归的预测重构视频异常检测方法。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出融合隐空间自回归的预测重构视频异常检测方法,该融合隐空间自回归的预测重构视频异常检测方法主要用来满足大规模应用场景下监控视频异常检测的实时性要求。本发明采用生成对抗网络框架,采用视频帧先预测再重构的方法,结合隐空间自回归模型估计隐含特征向量的概率分布,通过最小化隐含特征向量的交叉熵、预测损失及重构损失优化生成器,生成高质量正常样本。训练阶段,采用生成对抗损失优化网络参数;测试阶段,将测试视频作为网络输入,输出的异常分数值,从而实现视频异常检测。本发明获取的识别准确率比较高,并且识别速度比较快,能够满足大规模监控场景下视频异常检测的实时性要求。
为实现上述目的,根据本发明的第一方面的实施例提出融合隐空间自回归的预测重构视频异常检测方法。该融合隐空间自回归的预测重构视频异常检测方法包括以下步骤:
步骤一:采用随机裁剪、随机水平旋转、标准化Normalize对输入视频序列进行数据预处理;
步骤二:采用结合UNet网络和隐空间自回归层构造预测网络,定义预测网络约束,生成满足约束的预测帧;
步骤三:对于生成的预测帧,结合UNet网络和隐空间自回归层构造重构网络,定义重构约束,生成满足约束的重构帧;
步骤四:采用多个卷积层堆叠构造判别器,定义判别器约束,判别输入帧的异常值;
步骤五: 采用生成对抗训练算法,训练预测生成网络、重构网络和判别器,优化网络参数;测试阶段,利用训练好的模型对测试视频序列进行判别,输出异常分值,实现异常检测。
进一步地,其中步骤一的具体执行过程如下:
在一个具体的应用场景下设定监控装置,并设定监控装置实时获取监控视频,同时将实时获取的监控视频按照获取时间顺序存储在视频序列中。
采用RandomResizedCrop和RandomHorizontalFlip变换对输入的视频帧序列进行随机裁剪和随机水平翻转,增强训练数据的多样性;
采用Normalize对训练数据进行标准化操作,规范化训练数据的统计分布;
进一步地,其中步骤二的具体执行过程如下:
采用预测编码器、隐空间自回归层、预测解码器三部分构造预测生成网络;其中预测编码器与预测解码器均采用UNet编码器和UNet解码器;在预测编码器和预测解码器之间,构建隐空间自回归层用于最大化隐含预测特征的概率分布;
进一步地,在生成网络中,UNet预测编码器将输入样本映射为隐含特征向量,自回归密度估计网络估计的概率分布,UNet预测解码器则对隐含特征向量进行解码。隐含特征的先验分布可分解为,因此,先验分布的估计问题转化为多个条件概率密度估计问题。自回归密度估计网络则采用自回归估计输出多个条件概率,通过隐空间自回归层的设计,确保每个仅就根据进行计算;
在实际计算中,隐空间的自回归密度网络将每个条件概率建模成多项式,隐空间的自回归密度估计表示为每个条件概率密度与其对应的分类分布的交叉熵损失,具体表示如下:
结合预测生成网络结构,预测生成器的约束定义如下:
将预测生成器的约束表示为:
进一步地,其中步骤三的具体执行过程如下:
采用重构编码器、隐空间自回归层、重构解码器三部分构成重构生成网络,重构生成网络的结构与步骤二的预测生成网络结构一致。重构生成器中隐空间自回归层的条件密度的计算方法与步骤二中类似。
进一步地,其中步骤四的具体执行过程如下:
定义判别器网络由多个卷积层堆叠,每层卷积核大小为5*5,卷积层后采用ReLU层作为激活函数。判别器的目标函数定义为:
进一步地,其中步骤五的具体执行过程如下:
采用生成对抗网络训练网络,使生成器生成高质量图像。结合以上预测网络和重构网络的约束表示,生成器目标函数定义为:
采用Adam随机梯度下降算法,训练预测网络、重构网络和判别器网络,优化网络参数;
训练阶段,预测网络、重构网络用于生成高质量视频帧,判别器网络用于判断当前输入帧是否为真实帧;
测试阶段,对于输入的测试视频序列,判别器直接输出异常分数,判别测试帧是否异常,分数低于给定阈值的帧被标记为异常帧,从而实现异常检测。
与现有技术相比,本发明的有益效果是:
本发明通过对输入视频序列采用随机裁剪、随机水平旋转、标准化操作对输入视频序列进行数据增强;结合UNet网络和隐空间自回归层构造预测网络,定义预测网络约束,生成满足约束的预测帧;对于生成的预测帧,再结合UNet网络和隐空间自回归层构造重构网络,定义重构约束,生成满足约束的重构帧;然后采用多个卷积层堆叠构造判别器,定义判别器约束,判别输入帧的异常值;最后采用生成对抗算法,训练预测生成网络、重构网络和判别器,优化网络参数。测试阶段,利用训练好的模型对测试视频序列进行判别,输出异常分值,实现异常检测;本发明获取的识别准确率较高,识别速度较快,能够满足大规模监控场景下视频异常检测的实时性要求。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的流程图;
图2为本发明中的判别器的网络结构图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1至图2所示,本发明提出了融合隐空间自回归的预测重构视频异常检测方法,包括以下步骤:
步骤一:采用随机裁剪、随机水平旋转、标准化Normalize对输入视频序列进行数据预处理;
具体过程为:
在一个具体的应用场景下设定监控装置,并设定监控装置实时获取监控视频,同时将实时获取的监控视频按照获取时间顺序存储在视频序列中。
在本申请中,采用RandomResizedCrop和RandomHorizontalFlip变换对输入的视频帧序列进行随机裁剪和随机水平翻转,增强训练数据的多样性;
采用Normalize对训练数据进行标准化操作,规范化训练数据的统计分布;
步骤二:采用结合UNet网络和隐空间自回归层构造预测网络,定义预测网络约束,生成满足约束的预测帧;具体过程为:
采用预测编码器、隐空间自回归层、预测解码器三部分构造预测生成网络。
其中预测编码器与预测解码器均采用UNet编码器和UNet解码器。在预测编码器和预测解码器之间,构建隐空间自回归层用于最大化隐含预测特征的概率分布;
在实际计算中,隐空间的自回归密度网络将每个条件概率建模成多项式,隐空间的自回归密度估计表示为每个条件概率密度与其对应的分类分布的交叉熵损失,具体表示如下:
结合预测生成网络结构,预测生成器的约束定义如下:
将预测生成器的约束表示为:
步骤三:对于生成的预测帧,结合UNet网络和隐空间自回归层构造重构网络,定义重构约束,生成满足约束的重构帧;具体过程为:
采用重构编码器、隐空间自回归层、重构解码器三部分构成重构生成网络,重构生成网络的结构与步骤二的预测生成网络结构一致。重构生成器中隐空间自回归层的条件密度的计算方法与步骤二中类似。
步骤四:采用多个卷积层堆叠构造判别器,定义判别器约束,判别输入帧的异常值;具体过程为:
定义判别器网络由多个卷积层堆叠,每层卷积核大小为5*5,卷积层后采用ReLU层作为激活函数。判别器的目标函数定义为:
在一个实施例中,判别器的网络结构如图2所示。
步骤五: 采用生成对抗训练算法,训练预测生成网络、重构网络和判别器,优化网络参数。测试阶段,利用训练好的模型对测试视频序列进行判别,输出异常分值,实现异常检测。具体过程为:
采用生成对抗网络训练网络,使生成器生成高质量图像。结合预测网络和重构网络的约束表示,生成器目标函数定义为:
采用Adam随机梯度下降算法,训练预测网络、重构网络和判别器网络,优化网络参数;训练阶段,预测网络、重构网络用于生成高质量视频帧,判别器网络用于判断当前输入帧是否为真实帧;测试阶段,对于输入的测试视频序列,判别器直接输出异常分数,判别测试帧是否异常,分数低于给定阈值的帧被标记为异常帧,从而实现异常检测。
需要进行说明的是,采用预测生成网络和重构生成网络,结合隐空间自回归模型提取视频序列的隐含特征表示,生成满足预测约束和重构约束的视频帧;再基于判别器对生成帧的判别结果优化网络参数的过程为训练阶段;
基于训练阶段的预测重构生成网络生成视频帧,再基于判别器输出异常判别值,实现异视频常检测为测试阶段。
上述公式均是去除量纲取其数值计算,公式是由采集大量数据进行软件模拟得到最接近真实情况的一个公式,公式中的预设参数和预设阈值由本领域的技术人员根据实际情况设定或者大量数据模拟获得。
以上实施例仅用以说明本发明的技术方法而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方法进行修改或等同替换,而不脱离本发明技术方法的精神和范围。
Claims (6)
1.融合隐空间自回归的预测重构视频异常检测方法,其特征在于,包括以下步骤:
步骤一:采用随机裁剪、随机水平旋转、标准化Normalize对输入视频序列进行数据预处理;
步骤二:采用结合UNet网络和隐空间自回归层构造预测网络,定义预测网络约束,生成满足约束的预测帧;
步骤三:对于生成的预测帧,结合UNet网络和隐空间自回归层构造重构网络,定义重构约束,生成满足约束的重构帧;
步骤四:采用多个卷积层堆叠构造判别器,定义判别器约束,判别输入帧的异常值;
步骤五: 采用生成对抗训练算法,训练预测生成网络、重构网络和判别器,优化网络参数;利用训练好的模型对测试视频序列进行判别,输出异常分值,实现异常检测。
2.根据权利要求1所述的融合隐空间自回归的预测重构视频异常检测方法,其特征在于,预测网络和重构网络中均采用隐空间自回归进行密度估计,最大化隐含特征空间的概率,减少预测帧和重构帧的生成误差;自回归密度估计应用于预测生成网络的形式化表示为:
UNet预测编码器将输入样本映射为隐含特征向量,自回归密度估计网络估计的概率分布,UNet预测解码器则对隐含特征向量进行解码;隐含特征的先验分布可分解为,先验分布的估计问题转化为多个条件概率密度估计问题;自回归密度估计网络则采用自回归估计输出多个条件概率,通过隐空间自回归层的设计,确保每个仅就根据进行计算;
自回归密度估计应用于重构生成网络的方法与在预测生成网络中类似。
3.根据权利要求1所述的融合隐空间自回归的预测重构视频异常检测方法,其特征在于,步骤二的具体执行过程包含如下:
采用预测编码器、隐空间自回归层、预测解码器三部分构成预测生成网络;其中预测编码器与预测解码器均采用UNet编码器和UNet解码器;在预测编码器和预测解码器之间,构建隐空间自回归层用于最大化隐含预测特征的概率分布;
结合预测生成网络结构,预测生成器的约束定义如下:
隐空间的自回归密度网络将每个条件概率建模成多项式,隐空间的自回归密度估计表示为每个条件概率密度与其对应的分类分布的交叉熵损失,具体表示如下:
将预测生成器的约束表示为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210587622.3A CN114926767A (zh) | 2022-05-27 | 2022-05-27 | 融合隐空间自回归的预测重构视频异常检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210587622.3A CN114926767A (zh) | 2022-05-27 | 2022-05-27 | 融合隐空间自回归的预测重构视频异常检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114926767A true CN114926767A (zh) | 2022-08-19 |
Family
ID=82810840
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210587622.3A Pending CN114926767A (zh) | 2022-05-27 | 2022-05-27 | 融合隐空间自回归的预测重构视频异常检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114926767A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115527151A (zh) * | 2022-11-04 | 2022-12-27 | 南京理工大学 | 一种视频异常检测方法、系统、电子设备及存储介质 |
CN115690665A (zh) * | 2023-01-03 | 2023-02-03 | 华东交通大学 | 一种基于交叉U-Net网络的视频异常检测方法及装置 |
-
2022
- 2022-05-27 CN CN202210587622.3A patent/CN114926767A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115527151A (zh) * | 2022-11-04 | 2022-12-27 | 南京理工大学 | 一种视频异常检测方法、系统、电子设备及存储介质 |
CN115527151B (zh) * | 2022-11-04 | 2023-07-11 | 南京理工大学 | 一种视频异常检测方法、系统、电子设备及存储介质 |
CN115690665A (zh) * | 2023-01-03 | 2023-02-03 | 华东交通大学 | 一种基于交叉U-Net网络的视频异常检测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lv et al. | Localizing anomalies from weakly-labeled videos | |
Islam et al. | Crash data augmentation using variational autoencoder | |
CN112016500A (zh) | 基于多尺度时间信息融合的群体异常行为识别方法及系统 | |
CN114926767A (zh) | 融合隐空间自回归的预测重构视频异常检测方法 | |
CN111241343A (zh) | 一种道路信息监控与分析检测方法、智慧交通控制系统 | |
CN113313037A (zh) | 一种基于自注意力机制的生成对抗网络视频异常检测方法 | |
CN113537027B (zh) | 基于面部划分的人脸深度伪造检测方法及系统 | |
CN115471216B (zh) | 智慧实验室管理平台的数据管理方法 | |
CN112084240B (zh) | 一种群租房智能识别、联动治理方法及系统 | |
CN115731513B (zh) | 基于数字孪生的智慧园区管理系统 | |
CN116702090A (zh) | 一种多模态数据融合与不确定估计的水位预测方法及系统 | |
CN116758475A (zh) | 基于多源图像识别和深度学习的能源站异常行为预警方法 | |
CN116866054A (zh) | 公共信息安全监测系统及其方法 | |
Du et al. | Convolutional neural network-based data anomaly detection considering class imbalance with limited data | |
Zheng et al. | Anomaly detection of metro station tracks based on sequential updatable anomaly detection framework | |
CN112861762B (zh) | 基于生成对抗网络的铁路道口异常事件检测方法及系统 | |
CN116189063B (zh) | 一种用于智能视频监控的关键帧优化方法及装置 | |
Piroli et al. | LS-VOS: Identifying Outliers in 3D Object Detections Using Latent Space Virtual Outlier Synthesis | |
CN115601674A (zh) | 一种输电工程烟雾隐患识别方法、装置及存储介质 | |
Jiang et al. | Fast Traffic Accident Identification Method Based on SSD Model | |
Basak et al. | Diffusion-based normality pre-training for weakly supervised video anomaly detection | |
Yang et al. | 3D U-Net for Video Anomaly Detection | |
CN112016403A (zh) | 一种视频异常事件检测方法 | |
Li et al. | Infrared Small Target Detection Algorithm Based on ISTD-CenterNet. | |
CN117676099B (zh) | 基于物联网的安全预警方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |