CN114882007A - 一种基于记忆网络的图像异常检测方法 - Google Patents

一种基于记忆网络的图像异常检测方法 Download PDF

Info

Publication number
CN114882007A
CN114882007A CN202210641017.XA CN202210641017A CN114882007A CN 114882007 A CN114882007 A CN 114882007A CN 202210641017 A CN202210641017 A CN 202210641017A CN 114882007 A CN114882007 A CN 114882007A
Authority
CN
China
Prior art keywords
image
feature vector
encoder
memory network
anomaly detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210641017.XA
Other languages
English (en)
Inventor
朱鹏飞
王晓航
郭东岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN202210641017.XA priority Critical patent/CN114882007A/zh
Publication of CN114882007A publication Critical patent/CN114882007A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于记忆网络的图像异常检测方法,采用正常图像训练数据集训练所构建的图像异常检测网络模型,所述图像异常检测网络模型包括第一编码器、记忆网络和至少两个解码器。在训练后,通过知识蒸馏提取基于第一编码器的轻量化第二编码器,以所述第二编码器替换图像异常检测网络模型中的第一编码器,生成最终的图像异常检测网络模型对待检测图像进行检测。本发明通过引入知识蒸馏轻量化特征提取网络模型改进编码器提高对异常图像的编码敏感程度和引入多解码器提高正常样本重构质量,提高了图像异常检测的精度。

Description

一种基于记忆网络的图像异常检测方法
技术领域
本申请属于计算机视觉技术领域,尤其涉及一种基于记忆网络的图像异常检测方法。
背景技术
图像异常检测是计算机视觉领域的一个热门研究方向,其研究目标是在不使用真实异常样本的情况下,利用正常样本去训练一个特定的模型以检测可能出现的各种各样的异常图像。在工业产品缺陷检测,医学图像分析,视频监控安防等领域有较高的研究意义和应用价值。图像异常检测的难度相对而言比较大,主要体现在一下几点:①图像中异常类别的异构性、未知性:异常是不规则的,一类异常可能表现出与另一类异常完全不同的异常特征。例如,在工业产品中,外包装的缺陷的形状,位置等未知。但异常未发生的时候就不知道什么是异常等情况。②类别不均衡,异常样本少:异常通常是罕见的数据实例,而正常实例通常占数据的绝大部分。因此,收集大量标了标签的异常实例是困难的,甚至是不可能的。这导致无法像常规的监督学习一样可以有正负样本用来学习训练模型。
由于以上的研究现状致使图像异常检测的目标只能是通过无监督或者半监督学习的方式(少量负样本或者人为制造负样本),检测与正常图像不同的异常图像或者局部异常区域。当前该研究方向已经在众多的研究学者共同努力下已经取得了一些研究进展,根据在模型构建阶段有无神经网络的参与,现有的图像异常检测方法可以分为基于传统方法和基于深度学习的方法两大类别。基于传统方法的异常检测技术大致包含以下几个分支:分别是基于模板匹配、基于统计模型、基于频域分析和基于分类面构建的异常检测模型。而基于深度学习的方法大致有以下几个类别:分别是基于高维特征向量距离度量、基于输入图像重构对比的和结合传统方法的异常检测方法。
近年来传统机器学习方法已经在图像异常检测领域有了较多的应用,而随着深度学习技术的发展,结合神经网络来实现图像异常检测已然成为了当下的研究新技术。其中基于对输入神经网络的输入图像重构的异常检测方法越来越成为一个研究的热门。基于输入正常图像重构的方法其核心思想在于对输入的正常图像通过神经网络进行编码,并使用解码器对提取的高维特征进行解码重构,并以重构输入为目标训练神经网络。然后在检测阶段通过对比输入正常图像与重构图像之间的差异来达到异常检测的目的。根据采取的训练模式,常用的基于输入正常图像重构的方法大致包含基于自编码器和基于生成式对抗网络(Generative adversarial networks,GAN)两种类型。
在基于输入正常图像重构的方法中,最为常用的网络结构为自编码器(Autoencoder,AE)。仅利用正常样本训练搭建好的自编码器,在测试阶段期待能够对正常图像进行较高质量的重构,而对于测试中存在异常的图像,在图像编码以及后续的解码重构过程中都会与正常图像产生差异,而差异的大小可以作为衡量待测样本异常程度的指标。自编码器的结构一般由一个编码器和一个解码器组成,且两者的网络结构一般是对称的。其中,编码器在网络前向传播过程中一边不断缩小特征图的宽高尺寸一边增加其图像通道维度,以此来删除冗余的信息。而解码器负责对特征进行解码,得到与输入图像相同大小的图像,通过对比计算输入的正常图像与重构的正常图像之间的差异来训练网络模型。而在此过程中最为常用的损失函数函数就是均方误差(Mean square error,MSE)。MSE用重构前后图像中所有像素点上的像素值之差的平方均值来衡量图像重构的质量。训练结束后,由于瓶颈结构的存在,对于一些异常区域面积较小的样本,自编码器能够在图像编解码的过程中消除异常区域的影响,重构出一张正常图像作为参考,随后可以通过逐像素比较的方式得到异常区域,通过此方式不仅可以实现异常图像的检测还可以图像异常检测区域的定位,即定位到具体的异常的位置区域。
但是基于自编码器下图像重构的方法有一个比较明显的不足之处就是不管是训练还是测试阶段其重构出来的图像相对比较模糊,这就会引起网络模型把正常样本也重构为异常图像的可能。除了重构图像质量不高的问题,基于自编码器的方法还存在着无法保证完全消除输入图像中的异常区域的问题。当训练样本比较多样化时,自编码器会体现出强大的学习能力并对潜在的异常样本产生过强的适应能力。
发明内容
本申请的目的是提供一种基于记忆网络的图像异常检测方法,用以接解决现有技术方案重构图像质量不高及无法保证完全消除输入图像中的异常区域的问题。
为了实现上述目的,本申请技术方案如下:
一种基于记忆网络的图像异常检测方法,包括:
构建图像异常检测网络模型,所述图像异常检测网络模型包括第一编码器、记忆网络和至少两个解码器,所述第一编码器采用神经网络VGG-16;
采用正常图像训练数据集训练所构建的图像异常检测网络模型,将训练样本输入到第一编码器中提取高维特征,在记忆网络中查询出与所述高维特征匹配的映射特征,然后将所述映射特征分别输入到解码器中重构图像,取与原训练样本协方差值最小的重构图像作为输出的重构图像,计算联合损失更新图像异常检测网络模型的参数,完成训练;
通过知识蒸馏提取基于第一编码器的轻量化第二编码器,将第一编码器后四个卷积块中的最大池化层作为知识蒸馏层传递给所述第二编码器,以所述第二编码器替换图像异常检测网络模型中的第一编码器,生成最终的图像异常检测网络模型;
将待检测图像输入到最终的图像异常检测网络模型,输出重构图像,计算输入待检测图像与重构图像的异常检测得分,判断输入的待检测图像是否异常。
进一步的,所述第二编码器在神经网络VGG-16基础上,将最后三个卷积块的最后一层卷积去掉,同时舍弃VGG-16最后的全连接层,并且将第一编码器VGG-16最后四个卷积块的最大池化层作为知识蒸馏层传递给所述第二编码器最后四个卷积块。
进一步的,所述在记忆网络中查询出与所述高维特征匹配的映射特征,包括:
将第一编码器提取的高维特征作为记忆网络的查询特征向量项集,将高维特征中每一个特征向量项作为查询特征向量项;
计算每个查询特征向量项与记忆网络中存储的所有原型特征向量项之间的匹配概率,然后计算原型特征向量项与其对应的匹配概率的加权平均值,作为查询得到的特征向量项,将所有查询得到的特征向量项组合为与输入高维特征匹配的映射特征。
进一步的,所述计算每个查询特征向量项与记忆网络中存储的所有原型特征向量项之间的匹配概率,计算公式如下:
Figure BDA0003682201890000041
其中,wt,m为计算得到的匹配概率,exp为以自然常数e为底的指数函数,pm表示原型特征向量项,qt表示查询特征向量项,M表示记忆网络中存储的原型特征向量项数量。
进一步的,所述基于记忆网络的图像异常检测方法,还包括:
将第一编码器提取的高维特征作为记忆网络的查询特征向量项集,将高维特征中每一个特征向量项作为查询特征向量项;
计算记忆网络中存储的每个原型特征向量项与所有查询特征向量项之间的匹配概率vt,m
Figure BDA0003682201890000042
其中,pm表示原型特征向量项,qt表示查询特征向量项,Q为查询特征向量项的数量;
将匹配概率vt,m进行标准化得到v′t,m,标准化公式如下:
Figure BDA0003682201890000043
最后通过如下公式更新原型特征向量项:
pm=f(pm+∑t∈Qv′t,mqt);
其中f()是L2函数。
进一步的,所述计算输入待检测图像与重构图像的异常检测得分,包括:
计算待检测图像经过第二编码器后的每一个查询特征向量项与记忆网络中最佳匹配特征向量项之间的L2距离:
Figure BDA0003682201890000051
其中,Q表示查询特征向量项的数量,qt表示查询特征向量项,ps表示记忆网络中最佳匹配原型特征向量项;
计算待检测图像与重建图像的峰值信噪比:
Figure BDA0003682201890000052
其中,N为待检测图像中的像素数,x表示待检测图像,
Figure BDA0003682201890000053
表示重构图像,
Figure BDA0003682201890000054
表示求最佳重构图像;
对L2距离和峰值信噪比进行归一化处理,然后计算两者的加权和,作为异常检测得分。
进一步的,所述基于记忆网络的图像异常检测方法,还包括:
计算输入图像x和输出图像
Figure BDA0003682201890000055
之间的加权重建误差作为常规分数εt,计算公式如下:
Figure BDA0003682201890000056
其中,Wt(.)为权重函数,计算公式如下:
Figure BDA0003682201890000057
当分数εt高于一个阈值γ时,将x视为异常图像,从而不使用它来更新记忆网络中原型特征向量项,否则使用它来更新记忆网络中原型特征向量项。
进一步的,所述计算两者的加权和,作为异常检测得分,计算公式如下:
Figure BDA0003682201890000058
其中,g(.)为归一化操作,λ为权重系数,St表示计算得到的异常检测得分。
本申请提出的一种基于记忆网络的图像异常检测方法,在基于记忆网络的基础上,使用多解码器提高正常图像的重构质量,继而可以在检测异常样本的时候,异常样本也会按照正常样本来重构,继而突出异常图像的检测精度。借助知识蒸馏,将教师网络对正常样本的高度敏感特性,提炼给学生网络,使得学生网络在测试的时候依据保持对正常图像的敏感,但是遇到异常图像的时候,可以使得提取得到的特征与正常图像的特征相比有明显差异,从而得到的特征查询特征向量项多是异常特征。通过引入知识蒸馏轻量化特征提取网络模型改进编码器提高对异常图像的编码敏感程度和引入多解码器提高正常样本重构质量,实现一个有效的图像异常检测的方法。
附图说明
图1为本申请基于记忆网络的图像异常检测方法流程图;
图2为本申请实施例图像异常检测网络模型结构示意图;
图3为本申请实施例编码器知识蒸馏示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提出了一种基于记忆网络的图像异常检测方法,包括:
步骤S1、构建图像异常检测网络模型,所述图像异常检测网络模型包括第一编码器、记忆网络和至少解码器,所述第一编码器采用VGG-16。
本实施例中图像异常检测网络模型如图2所示,包括第一编码器(Encoder)、记忆网络(Memory Module)和至少两个结构相同的解码器(Decoder)。考虑到计算性能的开销,解码器优选的设置为三个。
在一个具体的实施例中,第一编码器采用VGG-16,VGG-16为机器学习库Pytorch中常用的一个神经网络,其往往自带了经过预训练的网络参数。本实施例各个解码器的网络可以同样采用VGG-16结构。
步骤S2、采用正常图像训练数据集训练所构建的图像异常检测网络模型,将训练样本输入到第一编码器中提取高维特征,在记忆网络中查询出与所述高维特征匹配的映射特征,然后将所述映射特征分别输入到解码器中重构图像,取与原训练样本协方差值最小的重构图像作为输出的重构图像,计算联合损失更新图像异常检测网络模型的参数,完成训练。
本实施例采用的训练数据集以UCSD的Ped2数据集为例子,UCSD的Ped2数据集包含16个训练数据图像集和12个测试图像集,其中包括12个不规则事件,包括骑自行车和驾驶车辆。首先是对数据的预处理,将图像的尺寸调整为256×256×3,其中三个数值依次为图像的宽、图像的高和图像的通道数。以4个图像为一个批次作为编码器的输入,进行训练。
在训练过程中,训练样本图像经过第一编码器以提取高维特征,特征的尺寸为14×14×512,作为记忆网络的查询特征向量项集,包括14×14个特征向量项。对于其中的任意一个特征向量项qt(t∈Q,本实施例为14×14),在记忆网络中查询最相近的原型特征向量项。记忆网络保存正常数据所对应的特征向量项作为原型特征向量项,即如果输入的是正常数据,记忆网络会保存其对应的特征向量项,作为原型特征向量项,以备进行查询。
记忆网络查询到最相近的原型特征向量项后,输出经查询得到的最相近的原型特征向量项。高维特征具有的14×14个特征向量项都经过查询后,将记忆网络输出的所有原型特征向量项组合为与输入高维特征匹配的映射特征,所述映射特征与高维特征尺寸相同。
将得到的映射特征分别输入到各个解码器进行解码重构图像,再将得到的多个重构图像分别与原输入图像比较,取与原训练样本协方差值最小的重构图像作为输出的重构图像。在一个批次后,计算联合损失更新图像异常检测网络模型的参数,逐个批次的进行训练,直到网络收敛,完成训练。
需要指出的是,在记忆网络中查询出与所述高维特征匹配的映射特征,可以直接将第一编码器提取的高维特征作为记忆网络的查询特征向量项集,即将高维特征中每一个特征向量项作为查询特征向量项,在记忆网络中查询最相近的原型特征向量项,然后记忆网络查询到最相近的原型特征向量项后,输出经查询得到的最相近的原型特征向量项,将记忆网络输出的所有原型特征向量项组合为与输入高维特征匹配的映射特征。
在一个具体的实施例中,本申请在记忆网络中查询出与所述高维特征匹配的映射特征,包括:
将第一编码器提取的高维特征作为记忆网络的查询特征向量项集,将高维特征中每一个特征向量项作为查询特征向量项;
计算每个查询特征向量项与记忆网络中存储的所有原型特征向量项之间的匹配概率,然后计算原型特征向量项与其对应的匹配概率的加权平均值,作为查询得到的特征向量项,将所有查询得到的特征向量项组合为与输入高维特征匹配的映射特征。
例如,记忆网络存储了M个1×1×512个原型特征向量项,记录了各种正常数据的最典型特征,本申请用pm∈M(m=1,…,M)表示记忆网络存储的一个原型特征向量项。
本实施例首先计算每个查询特征向量项qt和原型特征向量项pm之间的匹配概率wt,m,计算公式如下:
Figure BDA0003682201890000081
其中,exp为以自然常数e为底的指数函数。
对于每一个查询特征向量项qt,通过计算原型特征向量项pm与匹配概率wt,m的加权平均值,可得查询得到的特征向量项qt′,计算公式如下:
Figure BDA0003682201890000082
在得到查询得到的特征向量项qt′∈R14×14×512后,将他们汇总得到与与输入高维特征匹配的映射特征,再由解码器进行解码重构。
本实施例使用所有的特征项而不是最接近的特征项,可以让本申请的网络模型理解不同的正常数据的特征分布,并考虑到整体的正常特征。也就是说,本申请使用记忆网络中原型特征向量项pm的组合来表示查询特征向量项qt。本实施例将读取操作应用于每一个查询特征向量项,得到一个转换后的特征映射项qt′∈R14×14×512,将他们汇总再由解码器进行解码重构。这使得解码器能够利用记忆网络中的保存的正常样本的最典型特征项重构输入帧,从而使得重构的图像更加倾向于正常图像,减轻了解码器重构异常图像的能力。
在一个具体的实施例中,记忆网络中需要存储正常数据所对应的特征向量项作为原型特征向量项,本实施例提供了一种记忆网络中原型特征向量项的更新方法,包括:
将第一编码器提取的高维特征作为记忆网络的查询特征向量项集,将高维特征中每一个特征向量项作为查询特征向量项;
计算记忆网络中存储的每个原型特征向量项与所有查询特征向量项之间的匹配概率vt,m
Figure BDA0003682201890000091
其中,pm表示原型特征向量项,qt表示查询特征向量项,Q为查询特征向量项的数量;
将匹配概率vt,m进行标准化得到v′t,m,标准化公式如下:
Figure BDA0003682201890000092
最后通过如下公式更新原型特征向量项:
pm=f(pm+∑t∈Qv′t,mqt);
其中f()是L2函数。
本实施例对于每一个原型特征向量项,计算其与所有查询特征向量项之间的匹配概率,选择用所有的查询特征向量项去更新最接近的一个原型特征向量项。本申请通过使用查询特征向量项的加权平均值,而不是将它们汇总求和,可以更多地将注意力集中于原型特征向量项附近的查询特征向量项。
本实施例联合损失包括重建损失lrec、特征紧凑性损失lcompact和特征分离损失lseparateness,同时加入权重系数λc和λs来平衡后两个损失函数的比重,计算公式如下:
Totalloss=lrecclcompactslseparateness
图像重构损失计算公式如下:
Figure BDA0003682201890000093
Figure BDA0003682201890000094
其中x1,x2,x3分别为三个解码器的输出,x为原输入图像。
特征紧凑性(压缩)的损失计算公式如下:
Figure BDA0003682201890000095
其中s是查询qt对应的原型特征向量项中最匹配项的索引编号,计算公式为:
Figure BDA0003682201890000096
即ps表示记忆网络中最佳匹配原型特征向量项,也即匹配概率最大的原型特征向量项。
特征分离损失函,类似的查询应该分配给相同的项,以减少项的数量和内存大小。使用特征压缩损失训练模型只会使所有内存特征项都很相似,因此所有查询特征项都被紧密地映射到嵌入空间中,从而失去了记录不同正常模式的能力。然而内存中的特征项之间应该足够远,以考虑正常数据的各种特征样式。为了防止在获得紧凑的特征表示时出现这个问题,设计一个特征分离损失,并使用α因子来调整特征分离损失函数,计算公式如下:
Figure BDA0003682201890000101
其中n为查询特征项qt的第二近索引号,计算公式如下:
Figure BDA0003682201890000102
步骤S3、通过知识蒸馏提取基于第一编码器的轻量化第二编码器,将第一编码器后四个卷积块中的最大池化层作为知识蒸馏层传递给所述第二编码器,以所述第二编码器替换图像异常检测网络模型中的第一编码器,生成最终的图像异常检测网络模型。
本实施例对于训练好的第一编码器,通过知识蒸馏提取基于第一编码器的轻量化第二编码器。
具体的,如图2所示,第一编码器为VGG-16(图2上),第二编码器是(图2下)在Pytorch中提供的预训练的VGG-16基础上,将最后三个卷积块(Conv2-Conv4)的最后一层卷积去掉(由原来三个卷积层变为两个卷积层),同时舍弃VGG-16最后的全连接层,将14×14×512作为最后的网络输出。并且第一编码器VGG-16最后四个卷积块(Conv1-Conv4)的最大池化层作为知识蒸馏层传递给所述第二编码器最后四个卷积块。
最终的图像异常检测网络模型中保留了训练好的图像异常检测网络模型中的记忆网络和解码器,每个解码器的网络结构层与训练时的编码器一致,这里不再赘述。
步骤S4、将待检测图像输入到最终的图像异常检测网络模型,输出重构图像,计算输入待检测图像与重构图像的异常检测得分,判断输入的待检测图像是否异常。
采用最终的图像异常检测网络模型来对输入的待检测图像进行检测,计算输入待检测图像与重构图像的异常检测得分,判断输入的待检测图像是否异常。
其中,可以直接以输入待检测图像与重构图像的峰值信噪比PSNR(Peak Signalto Noise Ratio)作为异常检测得分,当待检测图像为异常时,得到一个较低的PSNR值,反之为正常的图像。
在一个具体的实施例中,计算输入待检测图像与重构图像的异常检测得分,包括:
计算待检测图像经过第二编码器后的每一个查询特征向量项与记忆网络中最佳匹配特征向量项之间的L2距离:
Figure BDA0003682201890000111
其中,Q表示查询特征向量项的数量,qt表示查询特征向量项,ps表示记忆网络中最佳匹配特征向量项;
计算待检测图像与重建图像的峰值信噪比:
Figure BDA0003682201890000112
其中,N为待检测图像中的像素数,x表示待检测图像,
Figure BDA0003682201890000113
表示重构图像,
Figure BDA0003682201890000114
表示求最佳重构图像;
对L2距离和峰值信噪比进行归一化处理,然后计算两者的加权和,作为异常检测得分。
具体的,异常检测得分St计算公式如下:
Figure BDA0003682201890000115
g(.)为归一化操作,λ为权重系数,具体归一化公式为如下:
Figure BDA0003682201890000116
在计算得到异常检测得分后,与设定的阈值进行比较,将异常检测得分大于设定阈值的待检测图像判定为异常图像,否则判定为正常图像。
需要指出的是,在训练好网络模型后,对网络模型进行测试或采用网络模型对待检测图像进行检测时,输入的有可能是正常图像或异常图像,为了扩充记忆网络中存储的原型特征向量项,还可以将正常图像所对应的特征向量项存储在记忆网络中,作为原型特征向量项。
为此,本申请还包括:
计算输入图像x和输出图像
Figure BDA0003682201890000123
之间的加权重建误差作为常规分数εt,计算公式如下:
Figure BDA0003682201890000121
其中,W(.)为权重函数,计算公式如下:
Figure BDA0003682201890000122
当分数εt高于一个阈值γ时,将x视为异常图像,从而不使用它来更新记忆网络中原型特征向量项,否则使用它来更新记忆网络中原型特征向量项。关于如何更新记忆网络中原型特征向量项,在前面步骤中已经进行过阐述,这里不再赘述。
本申请提出的异常检测方法,提高了基于解码器重构图像过程中正常图像的重构质量,继而可以提高异常检测的精度。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (8)

1.一种基于记忆网络的图像异常检测方法,其特征在于,所述基于记忆网络的图像异常检测方法,包括:
构建图像异常检测网络模型,所述图像异常检测网络模型包括第一编码器、记忆网络和至少两个解码器,所述第一编码器采用神经网络VGG-16;
采用正常图像训练数据集训练所构建的图像异常检测网络模型,将训练样本输入到第一编码器中提取高维特征,在记忆网络中查询出与所述高维特征匹配的映射特征,然后将所述映射特征分别输入到解码器中重构图像,取与原训练样本协方差值最小的重构图像作为输出的重构图像,计算联合损失更新图像异常检测网络模型的参数,完成训练;
通过知识蒸馏提取基于第一编码器的轻量化第二编码器,将第一编码器后四个卷积块中的最大池化层作为知识蒸馏层传递给所述第二编码器,以所述第二编码器替换图像异常检测网络模型中的第一编码器,生成最终的图像异常检测网络模型;
将待检测图像输入到最终的图像异常检测网络模型,输出重构图像,计算输入待检测图像与重构图像的异常检测得分,判断输入的待检测图像是否异常。
2.根据权利要求1所述的基于记忆网络的图像异常检测方法,其特征在于,所述第二编码器在神经网络VGG-16基础上,将最后三个卷积块的最后一层卷积去掉,同时舍弃VGG-16最后的全连接层,并且将第一编码器VGG-16最后四个卷积块的最大池化层作为知识蒸馏层传递给所述第二编码器最后四个卷积块。
3.根据权利要求1所述的基于记忆网络的图像异常检测方法,其特征在于,所述在记忆网络中查询出与所述高维特征匹配的映射特征,包括:
将第一编码器提取的高维特征作为记忆网络的查询特征向量项集,将高维特征中每一个特征向量项作为查询特征向量项;
计算每个查询特征向量项与记忆网络中存储的所有原型特征向量项之间的匹配概率,然后计算原型特征向量项与其对应的匹配概率的加权平均值,作为查询得到的特征向量项,将所有查询得到的特征向量项组合为与输入高维特征匹配的映射特征。
4.根据权利要求3所述的基于记忆网络的图像异常检测方法,其特征在于,所述计算每个查询特征向量项与记忆网络中存储的所有原型特征向量项之间的匹配概率,计算公式如下:
Figure FDA0003682201880000021
其中,wt,m为计算得到的匹配概率,exp为以自然常数e为底的指数函数,pm表示原型特征向量项,qt表示查询特征向量项,M表示记忆网络中存储的原型特征向量项数量。
5.根据权利要求1所述的基于记忆网络的图像异常检测方法,其特征在于,所述基于记忆网络的图像异常检测方法,还包括:
将第一编码器提取的高维特征作为记忆网络的查询特征向量项集,将高维特征中每一个特征向量项作为查询特征向量项;
计算记忆网络中存储的每个原型特征向量项与所有查询特征向量项之间的匹配概率vt,m
Figure FDA0003682201880000022
其中,pm表示原型特征向量项,qt表示查询特征向量项,Q为查询特征向量项的数量;
将匹配概率vt,m进行标准化得到v′t,m,标准化公式如下:
Figure FDA0003682201880000023
最后通过如下公式更新原型特征向量项:
pm=f(pm+∑t∈Qv′t,mqt);
其中f()是L2函数。
6.根据权利要求1所述的基于记忆网络的图像异常检测方法,其特征在于,所述计算输入待检测图像与重构图像的异常检测得分,包括:
计算待检测图像经过第二编码器后的每一个查询特征向量项与记忆网络中最佳匹配特征向量项之间的L2距离:
Figure FDA0003682201880000024
其中,Q表示查询特征向量项的数量,qt表示查询特征向量项,ps表示记忆网络中最佳匹配原型特征向量项;
计算待检测图像与重建图像的峰值信噪比:
Figure FDA0003682201880000031
其中,N为待检测图像中的像素数,x表示待检测图像,
Figure FDA0003682201880000032
表示重构图像,
Figure FDA0003682201880000033
表示求最佳重构图像;
对L2距离和峰值信噪比进行归一化处理,然后计算两者的加权和,作为异常检测得分。
7.根据权利要求1所述的基于记忆网络的图像异常检测方法,其特征在于,所述基于记忆网络的图像异常检测方法,还包括:
计算输入图像x和输出图像
Figure FDA0003682201880000034
之间的加权重建误差作为常规分数εt,计算公式如下:
Figure FDA0003682201880000035
其中,Wt(.)为权重函数,计算公式如下:
Figure FDA0003682201880000036
当分数εt高于一个阈值γ时,将x视为异常图像,从而不使用它来更新记忆网络中原型特征向量项,否则使用它来更新记忆网络中原型特征向量项。
8.根据权利要求6所述的基于记忆网络的图像异常检测方法,其特征在于,所述计算两者的加权和,作为异常检测得分,计算公式如下:
Figure FDA0003682201880000037
其中,g(.)为归一化操作,λ为权重系数,St表示计算得到的异常检测得分。
CN202210641017.XA 2022-06-07 2022-06-07 一种基于记忆网络的图像异常检测方法 Pending CN114882007A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210641017.XA CN114882007A (zh) 2022-06-07 2022-06-07 一种基于记忆网络的图像异常检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210641017.XA CN114882007A (zh) 2022-06-07 2022-06-07 一种基于记忆网络的图像异常检测方法

Publications (1)

Publication Number Publication Date
CN114882007A true CN114882007A (zh) 2022-08-09

Family

ID=82680364

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210641017.XA Pending CN114882007A (zh) 2022-06-07 2022-06-07 一种基于记忆网络的图像异常检测方法

Country Status (1)

Country Link
CN (1) CN114882007A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117152646A (zh) * 2023-10-27 2023-12-01 武汉大学 无人电力巡检ai轻量大模型方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117152646A (zh) * 2023-10-27 2023-12-01 武汉大学 无人电力巡检ai轻量大模型方法及系统
CN117152646B (zh) * 2023-10-27 2024-02-06 武汉大学 无人电力巡检ai轻量大模型方法及系统

Similar Documents

Publication Publication Date Title
CN110491416B (zh) 一种基于lstm和sae的电话语音情感分析与识别方法
CN112101426B (zh) 基于自编码器的无监督学习图像异常检测方法
CN111967502B (zh) 一种基于条件变分自编码器的网络入侵检测方法
Balakrishnan et al. Comparative performance of the FSCL neural net and K-means algorithm for market segmentation
CN111353395A (zh) 一种基于长短期记忆网络的换脸视频检测方法
JPH1055444A (ja) Dctをベースとするフィーチャー・ベクトルを使った顔の認識
CN110070895B (zh) 一种基于监督变分编码器因素分解的混合声音事件检测方法
CN107169117B (zh) 一种基于自动编码器和dtw的手绘图人体运动检索方法
CN112446242A (zh) 声学场景分类方法、装置及相应设备
CN113328755B (zh) 一种面向边缘计算的压缩数据传输方法
CN114120041A (zh) 一种基于双对抗变分自编码器的小样本分类方法
CN116342894B (zh) 基于改进YOLOv5的GIS红外特征识别系统及方法
CN108830829B (zh) 联合多种边缘检测算子的无参考质量评价算法
CN114821299B (zh) 一种遥感图像变化检测方法
CN112950480A (zh) 一种融合多感受野和密集残差注意的超分辨率重建方法
CN115131313A (zh) 基于Transformer的高光谱图像变化检测方法及装置
CN113971440A (zh) 一种基于深度聚类的无监督雷达信号分选方法
CN114882007A (zh) 一种基于记忆网络的图像异常检测方法
CN116680343A (zh) 基于融合多模态信息的实体和关系表示的链接预测方法
CN114037001A (zh) 基于wgan-gp-c和度量学习的机械泵小样本故障诊断方法
CN108319935B (zh) 基于区域稀疏的人脸群体识别方法
CN117011219A (zh) 物品质量检测方法、装置、设备、存储介质和程序产品
CN112101095B (zh) 基于语言和肢体特征的自杀和暴力倾向情感识别方法
CN114283301A (zh) 一种基于Transformer的自适应医学影像分类方法及系统
CN112232270A (zh) 一种基于模型量化的mdssd人脸检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination