CN112949344A - 一种用于异常检测的特征自回归方法 - Google Patents
一种用于异常检测的特征自回归方法 Download PDFInfo
- Publication number
- CN112949344A CN112949344A CN201911170284.8A CN201911170284A CN112949344A CN 112949344 A CN112949344 A CN 112949344A CN 201911170284 A CN201911170284 A CN 201911170284A CN 112949344 A CN112949344 A CN 112949344A
- Authority
- CN
- China
- Prior art keywords
- low
- samples
- input
- dimensional
- autoregressive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
- G06F18/2193—Validation; Performance evaluation; Active pattern learning techniques based on specific statistical tests
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
- G06V20/53—Recognition of crowd images, e.g. recognition of crowd congestion
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Human Computer Interaction (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种用于异常检测的特征自回归方法。包括以下步骤:首先,通过自动编码器得到输入样本的低维特征,再将其重建为高维图像。接着,使用分类器对输入样本和生成样本进行分类,并提取它们的低维特征通过不断缩小分类损失和重建损失使模型能够重建出更高质量的正常样本。在此基础上,为了降低模型表示异常的能力。引入密度估计器对低维特征的分布进行正则化约束。然后,经过多次迭代训练得到最优模型。最后,通过比较输入样本和生成样本的高维图像和低维特征的重建误差来判断是否异常。该方法在视频监控异常行为检测领域具有广阔的应用前景。
Description
技术领域
本发明涉及一种用于异常检测的特征自回归方法,属于计算机视觉领域中的异常检测问题。
背景技术
异常检测由于异常样本较少,且标签难以获取成为了智能视频监控的研究难点和关键技术。由于传统视频监控依赖于人眼捕捉异常行为需要耗费大量的人力物力,且主观性太强。目前更多的是让计算机自动检测出异常,其中深度学习的方法应用最为广泛。
深度学习的方法能从海量的数据中自动提取出有用的特征。基于标记信息可以分为监督学习方法,如支持向量机(SVM)、主成分分析(PCANet)等。半监督学习方法,如自动编码器(AutoEncoder,简称AE)和生成对抗网络(GAN)。和无监督学习,如受限玻尔兹曼机(RBM),稀疏编码器(Sparse Coding)等。由于异常标签难以获取,标注量大,半监督学习和无监督学习在异常检测中的应用更为广泛。自动编码器的原理比较简单:对于输入样本,首先通过编码器将其压缩为低维特征,然后通过解码器对每个样本点进行重建,还原到原来的维度,整个训练模型的目的就是减少重构误差。假设异常样本会产生更大的误差。然而,由于自动编码器强大的重构能力,即使是异常样本也能够得到很好的重建。所以,仅对样本相似度进行约束是不够的。因此,如何在保证重建出高质量样本的同时降低表示异常的可能性逐渐成为异常检测方向的研究趋势。
发明内容
本发明提出了一种用于异常检测的特征自回归方法,目的就在于解决上述问题。
本发明通过以下技术方案来实现上述目的:
(1)通过使用跳线连接的自动编码器,获得样本的低维特征再将其重建成高维图像。
(2)使用一个自回归密度估计器来获得低维特征的概率分布,并对其进行约束。提高模型对正常样本的记忆能力,同时降低模型表示异常的能力。
(3)引入分类器网络对输入样本和生成样本进行分类。并提取输入样本和生成样本的低维特征。
(4)通过不断的迭代训练,得到最优的异常检测模型。
附图说明
图1一种用于异常检测的特征自回归方法流程图。
具体实施方式
下面结合附图对本发明作进一步说明:
如图1所示,整个网络结构分别包括编码器EN,解码器DE,分类器C和参数密度估计器H。
编码器网络EN通过将高维图像x映射成低维特征z来捕获输入数据的分布。解码器网络DE将低维特征z上采样回到输入图像维度并重建输出。编解码器采用跳线连接方式,保留了多尺度信息,因此能够产生更好的重建。
分类器网络C的任务是对由编解码器网络生成的伪图像x和真实图像x进行分类。并用作特征提取器,提取输入图像x和重建图像x的低维特征。
想要提高模型区分正常和异常样本的能力,仅仅依靠自动编码器来缩小图像层面对正常样本的重建误差是不够的,因为它不能保证异常样本能产生很大的重构误差,所以本文提出在自动编码器上引入参数密度估计器H,得到低维特征向量z的概率分布,假设输入样本x和低维特征z之间存在这样的关系:
p(x)=∫p(x|z)p(z)dz, (1)
本文仅用正常样本进行训练,则p(x)表示正常样本的分布,p(x|z)是在给定潜在向量的先验分布p(z)的情况下所观察到的条件概率密度。为了使低维特征z尽量不重建出异常图片,就需要找到使p(x|z)最大的特征向量z。因此本文通过一个自回归过程来学习p(z)的真实分布。自回归模型为涉及顺序预测的任务提供了通用表述,即每个输出都取决于先前的观察结果,本文采用这种技术来分解联合概率密度,从而避免预先定义其分布:
其中,<表示一种顺序结构,保证每个zi的条件概率密度是根据输入{z1,...,zi-1}计算的。估计器输出条件概率密度p(zi|z<i)的参数,表示为o=H(h),输入参数为(假设输入层的通道数ci=1),输出为(其中co=B是输出通道的数量)。位置i,通道数为k的输入hi,k和位置为j通道数为l的输出oj,l之间的连接参数ω定义为:
⊥表示将d个多项式式拼接起来,得到分布参数,进而推断出概率分布q(z)。
本发明结合了四个损失值。
对抗损失:该损失确保网络EN和DE尽可能逼真地重建正常图像x至x,而分类器网络C对样本进行分类。其中Lcla表示为:
重建损失:为了明确地学习表观特征以充分捕获输入数据分布,我们将一范数正则化应用于输入x和重构输出x。这种标准化确保模型能够生成与输入样本类似的图像。重建损失如下所示:
特征损失:分类器C除了对样本进行分类还提取x和x的特征以重建它们的潜在特征向量。因此,潜在特征向量的损失变为:
密度估计损失:估计器用一种自回归的方式获取真实分布p(z)的参数模型,得到近似分布q(z)。为了确保它和真实分布之间的信息差距很小,从而降低特征向量表示异常的可能性,用Lde来表示真实分布与拟合分布的交叉熵,定义为:
Lde=DKL(p(z)||q(z)), (8)
最终,总损失定义为:
L=λclaLcla+λintLint+λfeaLfea+λdeLde, (9)
其中,λcla、λint、λfea和λde是权重参数。
对于异常性的评估是通过计算异常分数,假设正常样本的异常分数小,异常样本的分数更高。因此,对于给定样本x,它的异常分数s(x)定义为:
s(x)=αI(x)+γV(x), (10)
其中I(x)和V(x)分别表示给定样本和潜在向量的重建分数,α和γ是他们的权重。最后将整个测试集中所有图像的异常分数归一化到[0,1]范围,并使用以下等式计算每个测试样本的异常分数As(x)为:
为了验证本发明提出的基于特征自回归的异常检测方法的有效性,在CIFAR-10和UCSD Ped2两个个公共数据集上进行了实验验证。与目前主流的方法进行对比,表现出较好的效果。采用ROC作为评测标准,AUC表示ROC曲线下面积。实验结果如表1和表2所示:
表1 CIFAR-10数据集的AUC结果
表2 UCSD Ped2数据集的AUC结果
Claims (4)
1.一种用于异常检测的特征自回归方法,其特点在于包括以下步骤:
(1)通过使用跳线连接的自动编码器,获得样本的低维特征再将其重建成高维图像;
(2)使用自回归密度估计器获得低维特征的概率分布;
(3)分类器对输入样本和生成样本进行分类,并提取输入样本和生成样本的低维特征,经过不断的迭代得到最终的异常检测模型。
2.根据权利要求1所述的方法,其特点在于步骤(1)中所述的自动编码器添加了跳线连接结构;编码器通过连续的下采样提取低维特征向量,解码器结合下采样各层信息和上采样的输入信息还原细节信息,并且逐步还原图像精度,能捕捉样本的多尺度信息。
3.根据权利要求1所述的方法,其特点在于步骤(2)中所述的获得低维特征向量的概率分布,计算方法如下:
假设输入样本x和低维特征z之间存在这样的关系:
p(x)=∫p(x|z)p(z)dz, (1)
p(x|z)是给定潜在向量的先验分布p(z)的情况下所观察到的条件概率密度,通过找到使p(x|z)最大的特征向量z来排除模型表示异常的可能性;该方法不强制要求特征向量服从某一分布(如高斯分布),而是通过一个自回归过程来学习它的真实分布,即每个输出都取决于先前的观察结果:
其中,<表示一种顺序结构;为了使每个输出条件概率密度具有自回归特性,需要使估计器H的每一层有正确连接模式,自回归估计器通过堆叠多个掩膜全链接(Masked FullyConnections)组成,它输出条件概率密度p(zi|z<i)的参数,表示为o=H(h),输入参数为(假设输入层的通道数ci=1),输出为(其中co=B是输出通道的数量),位置i通道数为k的输入hi,k和位置为j通道数为l的输出oj,l之间的连接参数ω定义为:
⊥表示将d个多项式式拼接起来,得到分布参数,进而推断出概率分布q(z)。
4.根据权利要求1所述的方法,其特点在于步骤(3)中所述的不仅对输入样本和生成样本进行分类还用作特征提取器,最终用图像的重建损失和低维特征的重建损失来定义异常分数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911170284.8A CN112949344B (zh) | 2019-11-26 | 2019-11-26 | 一种用于异常检测的特征自回归方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911170284.8A CN112949344B (zh) | 2019-11-26 | 2019-11-26 | 一种用于异常检测的特征自回归方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112949344A true CN112949344A (zh) | 2021-06-11 |
CN112949344B CN112949344B (zh) | 2023-03-31 |
Family
ID=76224979
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911170284.8A Active CN112949344B (zh) | 2019-11-26 | 2019-11-26 | 一种用于异常检测的特征自回归方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112949344B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115496892A (zh) * | 2022-11-07 | 2022-12-20 | 合肥中科类脑智能技术有限公司 | 工业缺陷检测方法、装置及电子设备、存储介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110058609A1 (en) * | 2009-09-04 | 2011-03-10 | Stmicroelectronics Pvt. Ltd. | System and method for object based parametric video coding |
US20120170659A1 (en) * | 2009-09-04 | 2012-07-05 | Stmicroelectronics Pvt. Ltd. | Advance video coding with perceptual quality scalability for regions of interest |
US20120177121A1 (en) * | 2009-09-04 | 2012-07-12 | Stmicroelectronics Pvt. Ltd. | Advance video coding with perceptual quality scalability for regions of interest |
US20170161635A1 (en) * | 2015-12-02 | 2017-06-08 | Preferred Networks, Inc. | Generative machine learning systems for drug design |
US20170372155A1 (en) * | 2016-06-23 | 2017-12-28 | Siemens Healthcare Gmbh | Image Quality Score Using A Deep Generative Machine-Learning Model |
US20170372193A1 (en) * | 2016-06-23 | 2017-12-28 | Siemens Healthcare Gmbh | Image Correction Using A Deep Generative Machine-Learning Model |
CN108628281A (zh) * | 2017-03-23 | 2018-10-09 | 株式会社日立制作所 | 异常检测系统及异常检测方法 |
CN109492193A (zh) * | 2018-12-28 | 2019-03-19 | 同济大学 | 基于深度机器学习模型的异常网络数据生成与预测方法 |
EP3492945A1 (en) * | 2017-12-01 | 2019-06-05 | Origin Wireless, Inc. | Method, apparatus, and system for periodic motion detection and monitoring |
US20190220701A1 (en) * | 2018-01-16 | 2019-07-18 | Siemens Healthcare Gmbh | Trained generative network for lung segmentation in medical imaging |
US20190287404A1 (en) * | 2018-03-13 | 2019-09-19 | Nec Laboratories America, Inc. | Traffic prediction with reparameterized pushforward policy for autonomous vehicles |
US20190327124A1 (en) * | 2012-12-05 | 2019-10-24 | Origin Wireless, Inc. | Method, apparatus, and system for object tracking and sensing using broadcasting |
-
2019
- 2019-11-26 CN CN201911170284.8A patent/CN112949344B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110058609A1 (en) * | 2009-09-04 | 2011-03-10 | Stmicroelectronics Pvt. Ltd. | System and method for object based parametric video coding |
US20120170659A1 (en) * | 2009-09-04 | 2012-07-05 | Stmicroelectronics Pvt. Ltd. | Advance video coding with perceptual quality scalability for regions of interest |
US20120177121A1 (en) * | 2009-09-04 | 2012-07-12 | Stmicroelectronics Pvt. Ltd. | Advance video coding with perceptual quality scalability for regions of interest |
US20190327124A1 (en) * | 2012-12-05 | 2019-10-24 | Origin Wireless, Inc. | Method, apparatus, and system for object tracking and sensing using broadcasting |
US20170161635A1 (en) * | 2015-12-02 | 2017-06-08 | Preferred Networks, Inc. | Generative machine learning systems for drug design |
CN107545309A (zh) * | 2016-06-23 | 2018-01-05 | 西门子保健有限责任公司 | 使用深度生成机器学习模型的图像质量评分 |
US20170372193A1 (en) * | 2016-06-23 | 2017-12-28 | Siemens Healthcare Gmbh | Image Correction Using A Deep Generative Machine-Learning Model |
CN107610193A (zh) * | 2016-06-23 | 2018-01-19 | 西门子保健有限责任公司 | 使用深度生成式机器学习模型的图像校正 |
US20170372155A1 (en) * | 2016-06-23 | 2017-12-28 | Siemens Healthcare Gmbh | Image Quality Score Using A Deep Generative Machine-Learning Model |
CN108628281A (zh) * | 2017-03-23 | 2018-10-09 | 株式会社日立制作所 | 异常检测系统及异常检测方法 |
EP3492945A1 (en) * | 2017-12-01 | 2019-06-05 | Origin Wireless, Inc. | Method, apparatus, and system for periodic motion detection and monitoring |
US20190220701A1 (en) * | 2018-01-16 | 2019-07-18 | Siemens Healthcare Gmbh | Trained generative network for lung segmentation in medical imaging |
US20190287404A1 (en) * | 2018-03-13 | 2019-09-19 | Nec Laboratories America, Inc. | Traffic prediction with reparameterized pushforward policy for autonomous vehicles |
CN109492193A (zh) * | 2018-12-28 | 2019-03-19 | 同济大学 | 基于深度机器学习模型的异常网络数据生成与预测方法 |
Non-Patent Citations (2)
Title |
---|
FANG Z等: "Abnormal event detection in crowded scenes based on deep learning", 《MULTIMED TOOLS APPL》 * |
张泰: "周界视频监控中人员翻越行为检测算法", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115496892A (zh) * | 2022-11-07 | 2022-12-20 | 合肥中科类脑智能技术有限公司 | 工业缺陷检测方法、装置及电子设备、存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112949344B (zh) | 2023-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11645835B2 (en) | Hypercomplex deep learning methods, architectures, and apparatus for multimodal small, medium, and large-scale data representation, analysis, and applications | |
Kim et al. | Deep convolutional neural models for picture-quality prediction: Challenges and solutions to data-driven image quality assessment | |
Ding et al. | Context contrasted feature and gated multi-scale aggregation for scene segmentation | |
CN108805015B (zh) | 加权卷积自编码长短期记忆网络人群异常检测方法 | |
Liu et al. | Learning converged propagations with deep prior ensemble for image enhancement | |
CN110232341B (zh) | 基于卷积-堆叠降噪编码网络的半监督学习图像识别方法 | |
WO2022095645A1 (zh) | 基于内存增强潜在空间自回归的图像异常检测方法 | |
CN110766056B (zh) | 一种融合图像生成和多标签分类的异常图像检测方法 | |
CN111738054B (zh) | 一种基于时空自编码器网络和时空cnn的行为异常检测方法 | |
Shah et al. | Abnormality detection using deep neural networks with robust quasi-norm autoencoding and semi-supervised learning | |
CN111681182A (zh) | 图片修复方法、装置、终端设备以及存储介质 | |
Yin et al. | Graph-based normalizing flow for human motion generation and reconstruction | |
Mazumdar et al. | Universal image manipulation detection using deep siamese convolutional neural network | |
Zhang et al. | Occlusion-robust face recognition using iterative stacked denoising autoencoder | |
Salem et al. | Semantic image inpainting using self-learning encoder-decoder and adversarial loss | |
Lu et al. | Image-specific prior adaptation for denoising | |
CN116934725A (zh) | 一种基于无监督学习的铝箔封口密封性的检测方法 | |
CN112949344B (zh) | 一种用于异常检测的特征自回归方法 | |
KR102178238B1 (ko) | 회전 커널을 이용한 머신러닝 기반 결함 분류 장치 및 방법 | |
CN114821174B (zh) | 一种基于内容感知的输电线路航拍图像数据清洗方法 | |
Lin et al. | Ml-capsnet meets vb-di-d: A novel distortion-tolerant baseline for perturbed object recognition | |
Cang et al. | Scalable microstructure reconstruction with multi-scale pattern preservation | |
CN114330650A (zh) | 基于进化元学习模型训练的小样本特征分析方法及装置 | |
Ali et al. | A deep convolutional neural wavelet network for classification of medical images | |
CN113052132A (zh) | 基于面部关键点轨迹特征图的视频情感识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |