CN111079805A - 一种结合注意力机制及信息熵最小化的异常图像检测方法 - Google Patents

一种结合注意力机制及信息熵最小化的异常图像检测方法 Download PDF

Info

Publication number
CN111079805A
CN111079805A CN201911217230.2A CN201911217230A CN111079805A CN 111079805 A CN111079805 A CN 111079805A CN 201911217230 A CN201911217230 A CN 201911217230A CN 111079805 A CN111079805 A CN 111079805A
Authority
CN
China
Prior art keywords
model
sample
training
attention mechanism
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911217230.2A
Other languages
English (en)
Inventor
郭东岩
吴宇鹏
田苗
邵燕燕
张剑华
陈胜勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201911217230.2A priority Critical patent/CN111079805A/zh
Publication of CN111079805A publication Critical patent/CN111079805A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

一种结合注意力机制及信息熵最小化的异常图像检测方法,所述方法包括以下步骤:(1)挑选整合当前主流的数据集,用作训练数据集;(2)选择一类新奇性检测的深度神经网络,并改进主流检测模型的结构;(3)样本图像预处理,以适合网络输入;(4)训练检测模型;(5)用已经训练好的检测模型进行检测,得出检测结果。本发明提供了一种结合注意力机制及信息熵最小化的异常图像检测方法,通过在主流方法上做出一定改进,使得模型在训练过后对正常样本特性有较好的表示,对异常样本的敏感能力比较强,提高新奇性检测对正常样本与异常样本的鉴别能力。

Description

一种结合注意力机制及信息熵最小化的异常图像检测方法
技术领域
本发明提出一种结合注意力机制及信息熵最小化的异常图像检测方法,具有更强的识别新的或未知的样本的能力。
背景技术
异常图像检测具有广泛的应用价值。异常图像检测任务要求模型具有识别出新的或未知的样本的能力。异常图像检测的关键是使模型对正常样本具有好的表达能力,且对异常样本保持一定的灵敏性。总的来说,模型的这两种能力在训练时都应该被增强。异常图像检测的一个普遍假设是:异常样本不仅在高维数据空间内与正常样本存在特征差异,且在低维数据空间中也是如此。因此,异常图像检测任务的关键变为如何更好地重构正常样本的高维数据空间和低维数据空间。
在异常图像检测任务中,异常样本的稀缺性、多变性和不可预测性使得模型对异常样本的检测更为困难,因此无监督学习通常被认为是处理此类任务的理想方法。传统的解决方案包括一类支持向量机(SVM),该方法将正常样本限制在一个子空间中,达到区分正常、异常样本的目的;还有研究基于局部异常因子算法(LOF)利用k聚类和密度估计完成异常检测。但是传统方法训练过程中仍依赖于正常样本和异常样本。如今,深度学习在图像处理领域取得了巨大成就,目前的主流策略是借助深度深神网络从重建、概率分布角度来解决此问题。
在基于重建的策略中,重建前后图像的重建误差作为检测依据。例如,在AnoGAN中,第一次将生成对抗网络(GAN)应用到异常图像检测任务中,它通过反向传播找到合适的编码向量,借助自动编码器完成图像重建,并计算图像重建误差来判断图像是否异常。在ALOCC中,自动编码器被用作生成器并同时扮演两个角色,一个用于增强正常样本,另一个用于毁坏异常样本。
在基于概率分布的策略中,方法的重点被放在研究低维编码层的概率分布上。例如,在Abati等人的研究中,模型通过自回归过程学习编码层的概率分布。在OCGAN模型中,其将去噪自编码器作为生成器,通过对抗训练机制,使正常样本与低维编码空间能实现一对一映射。
然而,目前这些深度神经网络模型仍面临一个问题:只经过正常样本训练得的模型不止对正常样本有较好的泛化能力,其对异常样本仍存在一定泛化能力,导致应用模型推理时对异常样本没有较好的辨别能力。而本发明通过在GANomaly方法上做出一定改进,使得训练过后的模型对正常样本特性有较好的表示,同时对异常样本的敏感能力增强,最终提高模型对正常样本与异常样本的鉴别能力。
发明内容
针对现有技术中存在的不足,本发明提供了一种基于新颖性检测的异常图像检测方法。其在网络结构、损失函数等方面对GANomaly模型做出改进,提升该模型的应用效果。
为了解决上述技术问题,本发明提供如下的技术方案:
一种结合注意力机制及信息熵最小化的异常图像检测方法,包括以下步骤::
(1)挑选整合当前主流的数据集,用作训练数据集;
(2)选择GANomaly作为待改进神经网络模型,并对模型优化;
(3)样本图像预处理,以适合网络输入;
(4)训练检测模型;
(5)用已经训练好的检测模型进行检测,得出检测结果。
进一步,所述步骤(1)中,选择三个常用的经典数据集,分别为COIL100、MNIST和CIFAR10;
再进一步地,所述步骤(2)中,通过非监督对抗学习方式来处理异常检测问题,在无监督信息的情况下通过对抗训练方式训练去噪自编码器,能在图像重建任务中取得较好效果。具体地,本发明选择GANomaly作为待改进神经网络模型,并对该模型做出如下改进:
a.引入注意力机制,基于注意力机制来提升模型的特征提取能力,达到特征选择的目的;
b.新增信息熵最小化优化目标,消除编码层编码冗余,保留正常样本的独特的编码信息。
进一步地,所述步骤(3)中,统一将步骤(1)中提到的三个数据集做预处理:所有图像的像素值都被缩放到在[-1,1]范围内,图像的尺寸缩放为32*32像素以适应GANomaly网络模型输入。此外不需要对样本图像做其他预处理工作。
进一步地,所述步骤(4)中,划分数据集以及选择合适的超参数来训练模型,具体为:
a.为GANomaly模型配置超参数。GANomaly网络待定参数包含:子损失函数间的权重α,β,γ,δ、异常值计算权重λ,μ、自编码器中隐层向量长度hlen、注意力机制模块中隐藏层神经元的数量的比例R;
b.为了与比较的方法保持一致,按照不同的训练集和测试集划分标准,对COIL100、MNIST、CIFAR10三个数据集分别划分出训练集与测试集。对COIL100数据集,使用80%的正常样本进行训练,其余20%的正常样本数据用于测试。之后随机选择异常测试样本,使其构成测试集的一半。针对MNIST、CIFAR10数据集,使用给定数据集的训练集-测试集拆分标准来进行训练。正常样本的训练集用于训练和验证,所有样本的测试数据都用于测试。
进一步地,所述步骤(5)中,GANomaly模型训练完毕后,将COIL100、MNIST、CIFAR10三个数据集的测试数据样本输入到GANomaly模型中,根据样本的异常得分判断样本是否为正常样本。最终以实验的接收机工作特性曲线(ROC)下的区域面积(AUC)值量化本发明的应用效果;
所述方法还包括以下步骤:
(6)对比试验分析本发明做出的改进的提升效果:为验证本发明提出的改进方案的有效性,现分别提出以下三种对比方案:仅使用原有模型的方案一,加入信息熵损失的方案二,在方案二基础上加入注意力机制的方案三。分别计算三种方案的AUC值,分析本发明在改进异常图像检测任务中的改进效果。
与现有技术相比,本发明具有以下优点:
(1)本发明将深度学习的对抗神经网络应用到图像领域的异常检测问题中,仅需正常样本训练深度神经网络模型,能有效处理异常样本数量不足、异常样本种类不全等异常检测问题。另外,在对GANomaly方法做出改进后,本发明训练的模型对异常样本具有更强的灵敏度,且对正常样本保持良好的泛化能力;
(2)本发明在保留GANomaly方法损失函数的同时,在训练阶段另加入了新的损失函数,即隐层特征信息熵最小化,使编码层特征稀疏化。该改进思想力求网络能提的信息冗余少,正常样本的重要特征保留量大的隐层特性。另外,本发明还在网络结构中引入通道注意力机制,该改动希望网络对正常样本的重要特征提取能力更强,且对重要特征的重建能力也更强。综上,本发明经过以上两处改进,使网络对正常样本具有较强的泛化能力,且对异常样本具有良好的灵敏度;
(3)本发明在推理阶段,同时考虑了高维全局特征与低维编码特征,信息利用率更高。该特点使网络在训练过程中能获取正常样本更多的重要特征,经过训练的网络对正常样本的重构能力更强,使得正常样本与重构样本之间的差异性不大;而在网络推导的过程中,异常样本则会在重构过程中丢失较大的重要信息,使得重构前后样本的差异性较大。
附图说明
图1为本发明异常图像检测模型的结构示意图;
具体实施方式
为使本发明更容易理解、优势更加清楚,下面结合附图和具体实施例,对本发明实施例中的技术方案作详细说明。
(1)为验证本发明在异常图像检测任务上的准确性,现通过三个常用的数据集验证:COIL100、MNIST、CIFAR10。下面对每一个数据集的内容与图像尺寸做一定解释:
COIL-100:该数据集是自然图片集合,包含对100个物体从不同角度的拍摄,每隔5度拍摄一副图像,每个物体包含72张图像,图像尺寸均为128*128。
MNIST:该数据集是一个经典的数据集,经常被用作异常检测数据集,由10类手写数字构成的数据库,每类6000张图,每一张图像的大小为28*28。
CIFAR10:该数据集共有60000张彩色图像,这些图像全部来源于真实世界中的自然图像,分为10个类,每类6000张图,尺寸为32*32。
(2)本发明挑选对抗网络模型GANomaly作为基础网络,然后对其的网络结构与损失函数两方面提出改进。最终改进后的发明结构图如附图1;
A.算法网络结构
如附图1所示,本发明的模型结构由两部分组成:生成器G、鉴别器D。其中生成器为一个自编码器,其包含编码器GE和解码器GD。接下来详细地介绍每一个部分:
网络的第一部分是由编码器与解码器组成的生成器。生成器G通过GE提取有代表性的正常样本特征,并由GD重建样本。其主要过程为生成器G首先将输入图像x送到编码器网络GE,得到的编码信息用隐层向量h表示。然后h通过解码器网络GD,使用反卷积操作,批归一化和激活函数等操作得到重建图像
Figure BDA0002299819470000051
该重建样本与原样本具有相同的尺寸。另外,网络的第二部分鉴别器D网络结构与编码器GD基本一致,并在最终输出部分通过添加卷积层将维度降至1。值得注意的是,本发明的模型的鉴别器部分并没有添加注意力组件;
B.模型改进
上文中提到,目前的模型仍存在对异常样本具备一定泛化能力的问题。这导致模型对异常样本敏感性不足。本专利现通过提升自编码器对正常样本有效信息的提取能力,缩小正常样本与其重构图像之间的差异度,实现模型效果的提升。具体改进为两个方面:a.在原有损失函数的基础上加入信息熵损失函数;b.在编码器与解码器出加入通道注意力机制。
a.信息熵损失
已知异常检测任务的模型仅由正常样本训练,因此理想的模型应有效提取正常样本的重要特征。为此,如何在编码层提取有代表性的特征变得尤为重要。而若使编码层稀疏化,去除编码信息的冗余,缩小编码空间范围,使编码器尽可能保留正常样本的特征信息,即可提升模型对异常样本的敏感能力。因此本发明以编码层特征向量信息熵最小化为目标,在原有损失函数的基础上加入如下损失函数:
Figure BDA0002299819470000061
上式中Linf表示隐层特征h的信息熵损失,记hlen为隐层特征的长度,取hlen=100。另外计算信息熵损失之前隐层特征h需要经过Softmax层处理使其模长为1。本发明以最小化Linf为目标,以实现降低特征向量冗余、提升稀疏化程度的目标;
b.通道注意力机制
除了在损失函数的优化,为使生成器的编码器与解码器更加关注正常样本的重要特征,本发明在生成器的编码器与解码器都加入通道注意力机制(CAM)。附图1即表明了通道注意力机制的位置。
附图1还对注意力组件做了详细的结构说明。具体来说,注意力组件接收一个特征图F,F分别通过最大池化层、平均池化层得到V1,V2。之后V1,V2将分别通过一个共享的三层全连接层(MLP)。MLP的输出层和输入层的尺寸相同,而中间隐藏层的神经元数量由比例R控制。最后,MLP的两个输出特征向量对应元素相加,再经Sigmoid层处理后,即得到特征图F每一个通道对应的权重Mc。Mc=Sigmoid(MLP(AvgPool(F))+MLP(MaxPool(F)))
最终特征图F乘以相应的通道权重Mc即可得到改进的特征图F':
F′=Mc·F
(3)本步骤主要说明模型训练前需要的预处理部分:
我们需要的准备包括:
a.将所有样本图像的像素值缩放到[-1,1]之间,图像尺寸缩放为32*32像素;
b.按照不同的划分标准将数据集划分为训练集与测试集;
c.定义实验过程中的正常样本与异常样本。
步骤a)中,为适合网络输入,本发明统一将图像尺寸缩放到32*32。步骤b)中,为便于与其他算法的对比分析,本发明划分训练集、测试集遵循不同的划分标准。步骤c)中,COIL-100、MNIST、CIFAR10这三个数据库的正常样本与异常样本的划分规则如下:
COIL-100:本发明以数据集中一类作为正常样本,剩余所有类则记为异常样本。
MNIST:该手写数字数据集共含0~9中手写数字,共计10类样本。训练时指定一类作为正常样本,而剩余九类作为异常样本。
CIFAR10:该数据集分为10个类,与MNIST数据集规定类似,训练时指定一类为正常样本,剩余九类被作为异常样本。
(4)深度神经网络模型的训练包含配置网络参数、模型训练两个主要步骤:
a.配置网络参数
一组合适的网络参数能使在训练网络时表现良好的效果,并使整体参数收敛迅速,使训练完成的生成器具备良好的样本重构能力,使检测器对异常样本具备良好的敏感性。本发明需设置的参数包括:子损失函数间的权重α=1,β=50,γ=δ1,、离群值计算权重λ=0.1,μ=0.9、自编码器中隐层向量长度hlen=100,控制注意力组件的隐藏层神经元的数量的比例R=8。
b.参数训练
步骤(3)处,本发明提出了对GANomaly模型损失函数的具体改进。结合该模型原有的损失函数,本发明训练时的总损失由以下4个子损失组成:
对抗损失:用正常样本数据训练网络参数时,为了最大化正常样本的重建能力。模型采用对抗训练的方式。该方式确保网络G尽可能真实地重建正常图像x到
Figure BDA0002299819470000081
(服从样本分布px),而鉴别器网络D对真实和(假)生成的样本进行分类。
因此,对抗损失函数定义为:
Figure BDA0002299819470000083
上下文损失:除了对抗性损失,为了使得生成器学习到一些全局信息,通过重建误差来实现。因此,在原图x和重建图像
Figure BDA0002299819470000082
之间添加L1损失来更新生成器。因此,上下文损失函数定义为:
Lcon=Ex~Px||x-G(x)||1
编码损失:网络的鉴别器同时起到了特征提取器的作用,借助它衡量高维图像在低维编码信息之间的差异。经过正常样本的训练,模型能缩小正常样本编码信息GE(x)与重建图像编码信息D(G(x))之间的差距。由于模型是经过正常样本训练得到的,本模型则不能缩小异常样本与重建样本编码信息之间的差距。因此,编码损失函数定义为:
Lenc=Ex~Px||GE(x)-D(G(x))||1
信息熵损失:该损失可详见步骤(3)内容。
最终,训练时总损失的子损失分别为:信息熵损失、对抗损失、上下文损失、编码损失。总损失可表示为:
L=αLadv+βLcon+γLlat+δLinf
其中α,β,γ,为本发明的种不同子损失的权重系数,具体为α=1,β=50,γ=1,δ=10。
(5)COIL-100、MNIST、CIFAR10三个数据集在模型推理阶段的推理步骤如下:
本发明利用生成器与检测器,同时得到低维编码信息与高维上下文信息,这两类信息都含有差异特征,而上文提到的编码损失与上下文损失能量化具体的差异量。因此在模型推理阶段,使用编码损失与上下文损失共同计算异常得分值A。对于测试集样本x,其对应的异常分数A(x)被定义为:
A(x)=λLcon+μLlat
上式中A(x)由编码损失与上下文损失加权累加后求得。为方便比较,我们将所有样本的差异值A(x)放缩到[0,1]之间,便于测试集样本异常值与真实标签值之间的比较。归一化后样本x的差异值A(x)越接近1,说明其为异常样本的可能性越大。
(6)结果分析
下面为COIL-100、MNIST、CIFAR10三个数据集测试样本输入网络得到的检测结果。为量化本发明的异常图像检测效果,选择AUC值(area under the curve)作为模型的评估指标。
另外为方便对比分析,我们将一些主流的模型的效果也一并列出,参与COIL-100数据集比较的重要模型有:ALOCC DR、ALOCC D、DCAE;参与MNIST、CIFAR10数据集比较的重要模型有:OCSVM、KDE、DAE、VAE、PixCNN、GAN、AND、AnoGAN、GANomaly。
COIL-100:COIL-100数据集的特点是:正常样本间的差距相对小,正常样本与异常样本差距较大。由于数据集相对简单,故比较的模型能得到较高的AUC值,本发明的模型与其他重要模型的效果比较如表1所示,比DCAE超出1%:
表1本发明在COIL-100数据集上的效果分析
模型 AUC
ALOCC DR 0.809
ALOCC D 0.686
DCAE 0.949
Ours 0.961
表1MNIST:测试时一类认为是正常,剩余九类被认为是异常。结果正如表2所示,其中每一列代表一种模型在不同正常样本的结果,每一行代表该类为正常样本时,各个模型的测试结果。和考虑的方法相比,我们的结果并没有很明显的提升,效果一般。分析可能是改进的部分对背景单一和简单图像的效果不明显。
表2本发明在MNIST数据集上的效果分析
Figure BDA0002299819470000101
表2CIFAR10:最为比较有挑战性的数据集,测试时依旧是一类认为是正常,剩余九类被认为是异常。在图表3中,我们展示了每一类作为正常图像的测试结果。跟之前的模型GANomaly模型相比,我们注意到当Car或Truck这种相似目标作为正常样本时,模型的准确度相对较低,而我们的方案比之前有明显的改善,最终有4%的提升。
表3本发明在CIFAR10数据集上的效果分析
Figure BDA0002299819470000111
表3
对比试验:为了验证改进模型的有效性,我们在自然图像集CIFAR10做了一系列的对比实验,分别对本发明提出的两个改进方案进行了测试,首先我们只考虑原始结构,记为方案一;其次将信息熵损失加入到损失函数中,记为方案二;最后在添加熵损失的基础上,为生成器的编码器、解码器都添加通道注意力组件,即最终网络结构,记为方案三。三个方案在CIFAR10数据集上的AUC得分如下表:
表4三个方案的对比分析结果表
方案 AUC
方案一 0.639
方案二 0.649
方案三 0.655
表4。

Claims (7)

1.一种结合注意力机制及信息熵最小化的异常图像检测方法,其特征在于,所述方法包括以下步骤:
(1)挑选整合当前主流的数据集,用作训练数据集;
(2)选择一类新颖性检测的深度神经网络,并改进主流检测模型的结构;
(3)样本图像预处理,以适合网络输入;
(4)训练检测模型;
(5)用已经训练好的检测模型进行检测,得出检测结果。
2.如权利要求1所述的一种结合注意力机制及信息熵最小化的异常图像检测方法,其特征在于,所述步骤(1)中,效果测试选择三个常用的数据集,分别为COIL100、MNIST和CIFAR10。
3.如权利要求1或2所述的一种结合注意力机制及信息熵最小化的异常图像检测方法,其特征在于,所述步骤(2)中,选择非监督对抗学习类型的网络处理新颖性检测问题,该类神经网络在无监督信息的情况下通过对抗训练方式训练自编码器,能在图像重建任务中取得较好效果,选择GANomaly作为待改进神经网络模型,并对该模型做出如下改进:
a.引入注意力机制,基于注意力机制来提升模型的特征提取能力;
b.新增熵最小化优化目标,消除隐层编码冗余,保留样本的独特信息。
4.如权利要求1或2所述的一种结合注意力机制及信息熵最小化的异常图像检测方法,其特征在于,所述步骤(3)中,同一将步骤(1)中提到的三个数据集的样本尺寸做预处理:所有图像的像素值都被缩放到在[-1,1]范围内,图像的尺寸缩放为23*23,以适应GANomaly网络模型输入。
5.如权利要求1或2所述的一种结合注意力机制及信息熵最小化的异常图像检测方法,其特征在于,所述步骤(4)中,选择合适的训练、测试协议,配置网络参数并训练模型,过程为:
a.为GANomaly模型配置训练参数,GANomaly网络待定参数包含:子损失函数间的权重α,β,γ,δ、离群值计算权重λ,μ、自编码器中隐层向量长度hlen、控制注意力组件隐藏层神经元的数量的比例R;
b.按照对应数据集规定的练、测试协议,从COIL100、MNIST、CIFAR10三个数据集中划分出训练集与测试集,并取去除训练集数据参与模型的训练。
6.如权利要求1或2所述的一种结合注意力机制及信息熵最小化的异常图像检测方法,其特征在于,所述步骤(5)中,GANomaly模型训练完毕后,将训练、测试协议中规定COIL100、MNIST、CIFAR10三个数据集的测试数据样本输入到GANomaly模型中,根据样本的离群得分判断样本是否为正常样本,最终以实验的AUC值量化应用效果。
7.如权利要求1或2所述的一种结合注意力机制及信息熵最小化的异常图像检测方法,其特征在于,所述方法还包括以下步骤:
(6)对比试验分析本发明做出的改进的提升效果,提出以下三种对比方案:仅加深网络深度的方案一,加入信息熵损失的方案二,在方案二基础上加入注意力机制的方案三,分别计算三种方案的AUC值,分析在新颖性检测任务中的改进效果。
CN201911217230.2A 2019-12-03 2019-12-03 一种结合注意力机制及信息熵最小化的异常图像检测方法 Pending CN111079805A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911217230.2A CN111079805A (zh) 2019-12-03 2019-12-03 一种结合注意力机制及信息熵最小化的异常图像检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911217230.2A CN111079805A (zh) 2019-12-03 2019-12-03 一种结合注意力机制及信息熵最小化的异常图像检测方法

Publications (1)

Publication Number Publication Date
CN111079805A true CN111079805A (zh) 2020-04-28

Family

ID=70312498

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911217230.2A Pending CN111079805A (zh) 2019-12-03 2019-12-03 一种结合注意力机制及信息熵最小化的异常图像检测方法

Country Status (1)

Country Link
CN (1) CN111079805A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111951264A (zh) * 2020-08-28 2020-11-17 浙江中烟工业有限责任公司 一种基于深度学习的卷烟包装异常检测与定位方法
CN112434571A (zh) * 2020-11-09 2021-03-02 西安理工大学 一种基于注意力自编码网络的高光谱异常检测方法
CN112598650A (zh) * 2020-12-24 2021-04-02 苏州大学 眼底医学影像中视杯视盘的联合分割方法
CN113076980A (zh) * 2021-03-24 2021-07-06 中山大学 一种基于注意力增强以及输入扰动的分布外图像检测方法
CN113723950A (zh) * 2020-05-21 2021-11-30 同济大学 基于动态加权信息熵的欺诈交易识别方法、系统及装置
CN114463587A (zh) * 2022-01-30 2022-05-10 中国农业银行股份有限公司 一种异常数据检测方法、装置、设备及存储介质
CN114564696A (zh) * 2022-03-07 2022-05-31 昆明学院 一种基于信息熵的异常数据判别方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009145723A1 (en) * 2008-05-30 2009-12-03 Ge Healthcare Bio-Sciences Corp System and method for detecting and eliminating one or more defocused or low contrast-to-noise ratio images
CN107590567A (zh) * 2017-09-13 2018-01-16 南京航空航天大学 一种基于信息熵聚类和注意力机制的循环神经网络短期负荷预测方法
CN109086913A (zh) * 2018-07-11 2018-12-25 山东大学 一种基于深度学习的电力系统暂态稳定评估方法及系统
CN109584221A (zh) * 2018-11-16 2019-04-05 聚时科技(上海)有限公司 一种基于监督式生成对抗网络的异常图像检测方法
US20190156212A1 (en) * 2017-11-21 2019-05-23 Microsoft Technology Licensing, Llc Entity linking via disambiguation using machine learning techniques
CN110135567A (zh) * 2019-05-27 2019-08-16 中国石油大学(华东) 基于多注意力生成对抗网络的图像字幕生成方法
CN110457511A (zh) * 2019-08-16 2019-11-15 成都数之联科技有限公司 基于注意力机制和生成对抗网络的图像分类方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009145723A1 (en) * 2008-05-30 2009-12-03 Ge Healthcare Bio-Sciences Corp System and method for detecting and eliminating one or more defocused or low contrast-to-noise ratio images
CN107590567A (zh) * 2017-09-13 2018-01-16 南京航空航天大学 一种基于信息熵聚类和注意力机制的循环神经网络短期负荷预测方法
US20190156212A1 (en) * 2017-11-21 2019-05-23 Microsoft Technology Licensing, Llc Entity linking via disambiguation using machine learning techniques
CN109086913A (zh) * 2018-07-11 2018-12-25 山东大学 一种基于深度学习的电力系统暂态稳定评估方法及系统
CN109584221A (zh) * 2018-11-16 2019-04-05 聚时科技(上海)有限公司 一种基于监督式生成对抗网络的异常图像检测方法
CN110135567A (zh) * 2019-05-27 2019-08-16 中国石油大学(华东) 基于多注意力生成对抗网络的图像字幕生成方法
CN110457511A (zh) * 2019-08-16 2019-11-15 成都数之联科技有限公司 基于注意力机制和生成对抗网络的图像分类方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PHILIPPE BURLINA ET AL: "Where"s Wally Now? Deep Generative and Discriminative Embeddings for Novelty Detection", 《 2019 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》 *
SAMET AKCAY等: "GANomaly: Semi-supervised Anomaly Detection via Adversarial Training", 《COMPUTER VISION-ACCV 2018》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113723950A (zh) * 2020-05-21 2021-11-30 同济大学 基于动态加权信息熵的欺诈交易识别方法、系统及装置
CN113723950B (zh) * 2020-05-21 2024-03-05 同济大学 基于动态加权信息熵的欺诈交易识别方法、系统及装置
CN111951264A (zh) * 2020-08-28 2020-11-17 浙江中烟工业有限责任公司 一种基于深度学习的卷烟包装异常检测与定位方法
CN112434571A (zh) * 2020-11-09 2021-03-02 西安理工大学 一种基于注意力自编码网络的高光谱异常检测方法
CN112434571B (zh) * 2020-11-09 2023-07-25 西安理工大学 一种基于注意力自编码网络的高光谱异常检测方法
CN112598650A (zh) * 2020-12-24 2021-04-02 苏州大学 眼底医学影像中视杯视盘的联合分割方法
CN113076980A (zh) * 2021-03-24 2021-07-06 中山大学 一种基于注意力增强以及输入扰动的分布外图像检测方法
CN113076980B (zh) * 2021-03-24 2023-11-14 中山大学 一种基于注意力增强以及输入扰动的分布外图像检测方法
CN114463587A (zh) * 2022-01-30 2022-05-10 中国农业银行股份有限公司 一种异常数据检测方法、装置、设备及存储介质
CN114564696A (zh) * 2022-03-07 2022-05-31 昆明学院 一种基于信息熵的异常数据判别方法

Similar Documents

Publication Publication Date Title
CN111079805A (zh) 一种结合注意力机制及信息熵最小化的异常图像检测方法
CN110992354B (zh) 基于引入自动记忆机制对抗自编码器的异常区域检测方法
CN110689544A (zh) 一种遥感图像细弱目标分割方法
CN112580590A (zh) 一种基于多语义特征融合网络的指静脉识别方法
CN111127316B (zh) 一种基于sngan网络的单幅人脸图像超分辨方法及系统
CN113923104B (zh) 基于小波神经网络的网络故障诊断方法、设备及存储介质
CN113469236A (zh) 一种自我标签学习的深度聚类图像识别系统及方法
CN112700432B (zh) 一种基于异常合成与分解的纹理表面缺陷检测方法与系统
CN111738363A (zh) 基于改进的3d cnn网络的阿尔茨海默病分类方法
CN109191418A (zh) 一种基于收缩自编码器特征学习的遥感图像变化检测方法
CN110930378A (zh) 基于低数据需求的肺气肿影像处理方法及系统
CN114565594A (zh) 基于软掩膜对比损失的图像异常检测方法
CN115994907A (zh) 用于食品检测机构综合信息的智能处理系统及方法
CN115909002A (zh) 一种基于对比学习的图像翻译方法
Chen et al. A convolutional neural network with dynamic correlation pooling
CN114037001A (zh) 基于wgan-gp-c和度量学习的机械泵小样本故障诊断方法
CN110659274B (zh) 类脑分层记忆机制启发的异常数据流在线校准系统
CN112633301A (zh) 一种基于深度度量学习的中医舌图像腐腻特征分类方法
CN116597274A (zh) 无监督双向变分自编码本质图像分解网络、方法及应用
CN115375966A (zh) 一种基于联合损失函数的图像对抗样本生成方法及系统
CN114048837A (zh) 一种基于分布式类脑图的深度神经网络模型加固方法
Kang et al. CST-YOLO: A Novel Method for Blood Cell Detection Based on Improved YOLOv7 and CNN-Swin Transformer
CN113435321A (zh) 一种主轴轴承状态评估方法、系统、设备及可读存储介质
CN113011370A (zh) 一种基于深度学习的多状态人脸识别方法
CN112365551A (zh) 一种图像质量处理系统、方法、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200428