CN112766459A - 一种基于生成器的异常检测方法 - Google Patents

一种基于生成器的异常检测方法 Download PDF

Info

Publication number
CN112766459A
CN112766459A CN202110036714.8A CN202110036714A CN112766459A CN 112766459 A CN112766459 A CN 112766459A CN 202110036714 A CN202110036714 A CN 202110036714A CN 112766459 A CN112766459 A CN 112766459A
Authority
CN
China
Prior art keywords
generator
encoder
anomaly detection
test sample
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110036714.8A
Other languages
English (en)
Other versions
CN112766459B (zh
Inventor
宋艳枝
罗翌新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Liman Information Technology Co ltd
Original Assignee
Hefei Liman Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Liman Information Technology Co ltd filed Critical Hefei Liman Information Technology Co ltd
Priority to CN202110036714.8A priority Critical patent/CN112766459B/zh
Publication of CN112766459A publication Critical patent/CN112766459A/zh
Application granted granted Critical
Publication of CN112766459B publication Critical patent/CN112766459B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Computational Mathematics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Operations Research (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及异常检测算法领域,具体涉及一种基于生成器的异常检测方法,包括神经网络架构训练异常检测模型,其特征在于:所述的神经网络架构训练异常检测模型包括编码器、生成器、判别器,所述的编码器为从数据空间到特征向量空间的编码器,在所述的编码器后置一个正则化层用以规范化特征向量的取值范围,所述的生成器与所述的编码器连接,所述的判别器添加于所述的生成器后,用以拟合分布度量;这种基于生成器的异常检测方法,实现同时利用特征向量以及正常数据流形分布的异常检测。

Description

一种基于生成器的异常检测方法
技术领域
本发明涉及异常检测算法领域,具体涉及一种基于生成器的异常检测方法。
背景技术
异常检测问题,是一类在仅有某个类别的样本(也被称为正常样本)可用的情况下,如何通过训练一个机器学习模型或者使用一族相关指标,能够在未知类别的测试样本集中找到不同于正常样本的样本(也称为异常样本)的问题。
传统的用于解决异常检测问题的算法,一般有两种:一种是通过将样本通过某种变换(例如对于图像数据的几何算子变换或卷积神经网络,对于向量数据的傅立叶变换等)被映射成特征向量,然后在特征向量空间内找到正常样本的边界,并依此设计分数函数来确定测试样本是否属于边界内样本;一种是通过无监督学习的方式(例如Auto-encoders,GANs)找到正常样本在数据空间域的流形分布,并设计距离函数度量测试样本和这个流形质检的差异。上述两大类方法各自在不同的领域取得了较好的效果,但如何将这两者有机地结合起来,从而获取对于异常检测问题更好的算法,是我们需要考虑的问题。
发明内容
本发明的目的是提供一种基于生成器的异常检测方法,实现同时利用特征向量以及正常数据流形分布的异常检测。
为了实现以上目的,本发明采用的技术方案为:一种基于生成器的异常检测方法,包括神经网络架构训练异常检测模型,其特征在于:所述的神经网络架构训练异常检测模型包括编码器、生成器、判别器,所述的编码器为从数据空间到特征向量空间的编码器,在所述的编码器后置一个正则化层用以规范化特征向量的取值范围,所述的生成器与所述的编码器连接,所述的判别器添加于所述的生成器后,用以拟合分布度量。
进一步的,所述的方法还包括以下步骤:
S1:统计正常样本在重构误差上的分布直方图,得到测试样本的对应累积概率密度Cr;
S2:统计训练样本对应的特征向量到所有特征向量中心(即求均值)之间的距离分布直方图,得到测试样本对应特征向量在特征向量空间中与中心距离的累积概率密度Cd;
S3:对所述的测试样本的对应累积概率密度Cr和测试样本对应特征向量在特征向量空间中与中心距离的累积概率密度Cd取log并相加得到测试样本的正常程度。
本发明的技术效果在于:这种基于生成器的异常检测方法基于自动编码器和对抗生成网络同时优化重构误差以及获取正常样本的流形分布,并通过设计同时考虑特征向量空间和数据空间的分数用以判别测试样本的正常程度的方法,具有训练快、精度高、效果好的特点。
附图说明
图1为本发明实施例提供的异常检测算法的训练及测试流程示意图。
图2为本发明实施例提供的异常检测算法对分数函数设计的思路示意图。
图3为本发明实施例提供的异常检测算法在MNIST,CIFAR10上的检测效果示意图。
图4为本发明实施例提供的异常检测算法在CIFAR10上和使用重构误差方法的对比示意图。
具体实施方式
参照附图1-4,一种基于生成器的异常检测方法,包括神经网络架构训练异常检测模型,其特征在于:所述的神经网络架构训练异常检测模型包括编码器、生成器、判别器,所述的编码器为从数据空间到特征向量空间的编码器,在所述的编码器后置一个正则化层用以规范化特征向量的取值范围,所述的生成器与所述的编码器连接,所述的判别器添加于所述的生成器后,用以拟合分布度量。
优选的,所述的方法还包括以下步骤:
S1:统计正常样本在重构误差上的分布直方图,得到测试样本的对应累积概率密度Cr;
S2:统计训练样本对应的特征向量到所有特征向量中心(即求均值)之间的距离分布直方图,得到测试样本对应特征向量在特征向量空间中与中心距离的累积概率密度Cd;
S3:对所述的测试样本的对应累积概率密度Cr和测试样本对应特征向量在特征向量空间中与中心距离的累积概率密度Cd取log并相加得到测试样本的正常程度。
本发明实施基于生成器的异常检测方法包括:
在模型训练时:
1)使用编码器E将数据x映射到特征向量空间Z;
2)使用标准化层将特征向量E(x)归一化到z;
3)使用生成器G将特征向量z映射到数据空间
Figure BDA0002894631490000041
4)使用判别器D将真实数据x和生成数据
Figure BDA0002894631490000042
映射到处于[0,1]区间的数D(x)和D(x’);
5)最小化判别器损失函数
Figure BDA0002894631490000043
训练判别器D的参数;
6)最小化生成器损失函数以及重构误差
Figure BDA0002894631490000044
训练生成器G的参数;
7)给定一个特征向量的中心z0,最小化特征向量
Figure BDA0002894631490000045
训练编码器E的参数。
8)在训练完成后,使用编码器E将所有训练时所用数据
Figure BDA0002894631490000046
(其中N时训练数据的数目)映射到特征向量空间,得到一列特征向量
Figure BDA0002894631490000047
Figure BDA0002894631490000048
统计得到频率直方图Hz
9)在训练完成后,使用标准化层以及生成网络G将所有特征向量
Figure BDA0002894631490000049
映射到数据空间,得到一列生成数据
Figure BDA00028946314900000410
Figure BDA00028946314900000411
统计得到频率直方图Hr
2.在模型测试时:
1)给定一个待检测样本x′,通过编码器E得到特征向量E(x′),计算得到距离||E(x′)-z0||并代入到频率直方图Hz中得到分数sz(x′)=logCz(||E(x′)-z0||),其中Cz是Hz的累积概率密度;
2)通过标准化层以及生成网络G将特征向量映射到数据空间的
Figure BDA00028946314900000412
计算得到距离
Figure BDA00028946314900000413
并代入到频率直方图Hr中得到分数
Figure BDA00028946314900000414
其中Cr是Hr的累积概率密度;
3)得到x′的最终分数s(x′)=sz(x′)+sr(x′),当分数低时,x′是正常样本,否则为异常样本,这个阈值可以通过用户自定义选取。
可见,本发明实施例异常检测算法有效地利用待检测数据在特征向量空间以及数据空间的差异来进行是否正常的判断,因此能够展现出更好的效果。
本发明实施例提供的异常检测算法通过使用对抗生成网络的训练方式,能够获得一个更加准确的表达正常样本的流形分布,从而获得区分性更加显著的重构误差。假设没有判别器D以及概率分布损失函数,那么使用重构误差将导致复合映射
Figure BDA0002894631490000051
趋向于一个恒等映射,那么对于正常样本和非正常样本便几乎没有区别,从而降低模型的性能。通过添加判别器D以及概率分布损失函数,生成器G受到约束从而避免陷入恒等映射的局部最优解,由于生成器G只能生成正常样本,从而加大了正常和非正常样本之间的差异性,从而提升模型的性能。
本发明实施例提供的异常检测算法通过添加对特征向量的正则项
Figure BDA0002894631490000052
约束,能够获得在特征向量空间更加聚合的特征向量表达,从而获得区分性更加显著的特征向量。通过压缩编码器的输出向量与固定向量之间的距离将正常样本纳入一个非常小的区域内,那么非正常样本在经过编码后落入这个区域的概率就会变低,因此区分性就会变大,从而提升模型的性能。
本发明实施例提供的异常检测算法通过标准化层连接编码器的输出和生成器的输入,避免了分布不匹配导致的训练困难问题。众所周知,生成对抗网络需要从一个固定的先验分布中进行采样,而我们无论是使用重构误差还是上述正则项训练编码器都无法得到一个固定的先验分布。因此,使用标准化层后,能够将编码器得到的输出映射到和生成器一般所使用的标准正态分布重合度非常高的区域内,也就能够在很大程度上缓解这个问题,带来训练的便利。
本发明实施例提供的异常检测算法中的分数函数能够同时考虑到样本在特征向量空间以及数据空间上的差异性,从而获得更好的性能。以往的方法往往只关注于上述两方面之一,我们的方法能够以等权重的方式将两者结合起来,因此取得了更好的效果。为了避免出现两部分分数数量级的差距,我们使用概率直方图的方式将两部分分数统一化成了概率密度,并通过使用累积概率密度的方式,避免了分数的歧义性(参考图2)。因此我们的分数函数能够表现出更好的性能。
本发明实施例提供的异常检测算法在MNIST、Fashion-MNIST、CIFAR10这三个数据集上都成功完成了实验,如图3。结果表明,相对于其他方法,本发明实施例提供的异常检测算法可以在添加少量计算的情况下,大大提升模型的效果。
本发明实施例提供的异常检测算法在CIFAR10数据集上的依分数函数从小(正常)到大(非正常)的效果示意(见图4)明显优于仅使用重构误差训练的自动编码器。可以看到,使用像素级别的重构误差训练的模型往往会被数据中更大比例的背景信息所干扰,而我们的方法由于避免了坍缩到近似的恒等映射上,因此排序的效果更加合理。
本发明实施例提供的异常检测算与现有其它异常检测算相比具有以下优点:提出一种全新的网络架构,能够同时训练正常样本的重构误差以及流形分布;提出了一种新的分数函数,能够同时考虑待检测样本在特征向量空间以及数据空间中俄差异性。本发明实施例提供的异常检测算法在多个数据集上都取得了超越其他方法的性能
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (2)

1.一种基于生成器的异常检测方法,包括神经网络架构训练异常检测模型,其特征在于:所述的神经网络架构训练异常检测模型包括编码器、生成器、判别器,所述的编码器为从数据空间到特征向量空间的编码器,在所述的编码器后置一个正则化层用以规范化特征向量的取值范围,所述的生成器与所述的编码器连接,所述的判别器添加于所述的生成器后,用以拟合分布度量。
2.根据权利要求1所述基于生成器的异常检测方法,其特征在于:所述的方法还包括以下步骤:
S1:统计正常样本在重构误差上的分布直方图,得到测试样本的对应累积概率密度Cr;
S2:统计训练样本对应的特征向量到所有特征向量中心(即求均值)之间的距离分布直方图,得到测试样本对应特征向量在特征向量空间中与中心距离的累积概率密度Cd;
S3:对所述的测试样本的对应累积概率密度Cr和测试样本对应特征向量在特征向量空间中与中心距离的累积概率密度Cd取log并相加得到测试样本的正常程度。
CN202110036714.8A 2021-01-12 2021-01-12 一种基于生成器的异常检测方法 Active CN112766459B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110036714.8A CN112766459B (zh) 2021-01-12 2021-01-12 一种基于生成器的异常检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110036714.8A CN112766459B (zh) 2021-01-12 2021-01-12 一种基于生成器的异常检测方法

Publications (2)

Publication Number Publication Date
CN112766459A true CN112766459A (zh) 2021-05-07
CN112766459B CN112766459B (zh) 2024-05-03

Family

ID=75701630

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110036714.8A Active CN112766459B (zh) 2021-01-12 2021-01-12 一种基于生成器的异常检测方法

Country Status (1)

Country Link
CN (1) CN112766459B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114298240A (zh) * 2021-12-30 2022-04-08 中山大学 一种针对多元时间序列的主动异常检测方法及其相关装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109741292A (zh) * 2017-10-27 2019-05-10 罗伯特·博世有限公司 用对抗自编码器检测第一图像数据集当中异常图像的方法
CN109861953A (zh) * 2018-05-14 2019-06-07 新华三信息安全技术有限公司 一种异常用户识别方法及装置
CN110674882A (zh) * 2019-09-27 2020-01-10 成都信息工程大学 一种基于傅立叶函数变换的异常点检测方法
CN110992354A (zh) * 2019-12-13 2020-04-10 华中科技大学 基于引入自动记忆机制对抗自编码器的异常区域检测方法
US20200202160A1 (en) * 2018-12-20 2020-06-25 Penta Security Systems Inc. Method and apparatus for detecting abnormal traffic based on convolutional autoencoder
US20200410403A1 (en) * 2019-06-27 2020-12-31 Royal Bank Of Canada System and method for detecting data drift

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109741292A (zh) * 2017-10-27 2019-05-10 罗伯特·博世有限公司 用对抗自编码器检测第一图像数据集当中异常图像的方法
CN109861953A (zh) * 2018-05-14 2019-06-07 新华三信息安全技术有限公司 一种异常用户识别方法及装置
US20200202160A1 (en) * 2018-12-20 2020-06-25 Penta Security Systems Inc. Method and apparatus for detecting abnormal traffic based on convolutional autoencoder
US20200410403A1 (en) * 2019-06-27 2020-12-31 Royal Bank Of Canada System and method for detecting data drift
CN110674882A (zh) * 2019-09-27 2020-01-10 成都信息工程大学 一种基于傅立叶函数变换的异常点检测方法
CN110992354A (zh) * 2019-12-13 2020-04-10 华中科技大学 基于引入自动记忆机制对抗自编码器的异常区域检测方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
DONG GONG等: "Memorizing Normality to Detect Anomaly: Memory-augmented Deep Autoencoder for Unsupervised Anomaly Detection", 《ARXIV:1904.02639V2》, pages 1 - 10 *
ELIES GHERBI等: "An Encoding Adversarial Network for Anomaly Detection", 《PROCEEDINGS OF MACHINE LEARNING RESEARCH 101》, pages 188 - 203 *
JIANYU LIU等: "A two-stage anomaly detection framework: Towards low omission rate in industrial vision applications", 《ADVANCED ENGINEERING INFORMATICS》, vol. 55 *
YIXIN LUO等: "Anomaly detection for image data based on data distribution and reconstruction", 《APPLIED INTELLIGENCE》, vol. 53, pages 22500 *
戴俊等: "基于生成对抗网络和自动编码器的机械系统异常检测", 《仪器仪表学报》, vol. 40, no. 09, pages 16 - 26 *
杨永娇等: "一种基于深度Encoder-Decoder神经网络的智能电网数据服务器流量异常检测算法", 《计算机与现代化》, no. 10, pages 66 - 71 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114298240A (zh) * 2021-12-30 2022-04-08 中山大学 一种针对多元时间序列的主动异常检测方法及其相关装置

Also Published As

Publication number Publication date
CN112766459B (zh) 2024-05-03

Similar Documents

Publication Publication Date Title
CN108696331B (zh) 一种基于生成对抗网络的信号重构方法
Yu et al. C_CART: an instance confidence-based decision tree algorithm for classification
CN112766459A (zh) 一种基于生成器的异常检测方法
CN111127532B (zh) 基于深度学习特征光流的医学图像形变配准方法及系统
CN112200060A (zh) 一种基于网络模型的旋转设备故障诊断方法、系统及可读存储介质
CN109039721A (zh) 基于误差重构的节点重要性评估方法
Fawcett PRIE: a system for generating rulelists to maximize ROC performance
CN118312868A (zh) 基于深度同心孪生网络的船舶主机小样本故障诊断方法
Xie et al. A nonlocal self-similarity-based weighted tensor low-rank decomposition for multichannel image completion with mixture noise
CN113553319A (zh) 基于信息熵加权的lof离群点检测清洗方法、装置、设备及存储介质
Ni et al. Multi-meter intelligent detection and recognition method under complex background
CN110751201A (zh) 基于纹理特征变换的sar装备任务失效成因推理方法
Kohns et al. Decoupling shrinkage and selection for the Bayesian quantile regression
CN115034580A (zh) 融合数据集的质量评估方法和装置
CN115982566A (zh) 一种水电机组多通道故障诊断方法
CN112989374B (zh) 基于复杂网络分析的数据安全风险识别方法及装置
Hou et al. What Has Been Enhanced in my Knowledge-Enhanced Language Model?
CN112217749A (zh) 一种盲信号分离方法及装置
CN112529080A (zh) 一种基于频谱特征判别的图像生成方法
Wu et al. GADF-VGG16 based fault diagnosis method for HVDC transmission lines
CN110297989A (zh) 异常检测的测试方法、装置、设备和介质
Quan et al. Efficient semi-supervised inference for logistic regression under case-control studies
CN118362805B (zh) 一种emc的测试方法、测试装置和终端设备
CN111861967B (zh) 用于检测辐射图像中的局部异常的网络、方法和装置
Li et al. Rolling Bearing Fault Classification Utilizing Adaptive Density Peaks Search Clustering Based on Wavelet Packet Transform

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant