CN114565594A - 基于软掩膜对比损失的图像异常检测方法 - Google Patents
基于软掩膜对比损失的图像异常检测方法 Download PDFInfo
- Publication number
- CN114565594A CN114565594A CN202210209818.9A CN202210209818A CN114565594A CN 114565594 A CN114565594 A CN 114565594A CN 202210209818 A CN202210209818 A CN 202210209818A CN 114565594 A CN114565594 A CN 114565594A
- Authority
- CN
- China
- Prior art keywords
- image
- encoder
- mask
- self
- representing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 68
- 238000012549 training Methods 0.000 claims abstract description 59
- 230000002159 abnormal effect Effects 0.000 claims abstract description 44
- 238000000034 method Methods 0.000 claims abstract description 31
- 238000012360 testing method Methods 0.000 claims abstract description 22
- 230000006870 function Effects 0.000 claims abstract description 19
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 16
- 230000005856 abnormality Effects 0.000 claims abstract description 12
- 230000011218 segmentation Effects 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 4
- 239000002131 composite material Substances 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 8
- 239000000126 substance Substances 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 6
- 238000011176 pooling Methods 0.000 claims description 6
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 5
- 230000002547 anomalous effect Effects 0.000 claims description 5
- 238000010586 diagram Methods 0.000 claims description 5
- 230000004807 localization Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000003745 diagnosis Methods 0.000 abstract description 2
- 230000000694 effects Effects 0.000 description 11
- 238000004088 simulation Methods 0.000 description 7
- 238000009826 distribution Methods 0.000 description 6
- 238000003062 neural network model Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 240000009226 Corylus americana Species 0.000 description 1
- 235000001543 Corylus americana Nutrition 0.000 description 1
- 235000007466 Corylus avellana Nutrition 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000013140 knowledge distillation Methods 0.000 description 1
- 239000010985 leather Substances 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000004753 textile Substances 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/002—Image coding using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Quality & Reliability (AREA)
- Multimedia (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种基于软掩膜对比损失的图像异常检测方法,主要解决现有技术异常检测种类少,检测精度差的问题。其方案是:利用超像素分割算法与高斯噪声对MVTec数据集进行处理,得到合成图像训练数据集;搭建由重建自编码器和掩膜自编码器组成的异常检测模型,并使用L2误差损失作为掩膜自编码器的损失函数,使用L2误差损失与软掩膜对比损失作为重建自编码器的损失函数;利用合成图像训练数据集对其掩膜编码器和重建自编码器进行交替训练,直至各自的损失函数收敛;将测试图像输入到训练好的图像异常检测模型,得到图像异常检测与定位的结果。本发明异常识别种类多,检测精度高,可用于工业品瑕疵检测、医疗辅助诊断、视频违规行为检测。
Description
技术领域
本发明属于图像处理技术领域,更进一步涉及一种图像异常检测方法,可应用工业品瑕疵检测、医疗辅助诊断、视频违规行为检测。
背景技术
图像异常检测是计算机视觉领域的一项用于检测和定位图像中异常或缺陷区域的任务。图像异常检测在生产生活中有着广泛的应用,比如针对电子元器件、纺织半成品等工业产品在生产过程中由于操作不当等原因而不慎出现的瑕疵品进行检测,辅助剔除残次品;帮助医务人员对病理图像进行病灶定位;也能够对监控视频当中的非法行为进行检测。由于在实际生活中,异常样本的出现概率极其微小,获取包含数量充足、类别丰富的异常样本数据集需要耗费大量的成本,因此当前图像异常检测数据集大多只包含正常样本。图像异常检测算法通常以无监督的方式在正常数据集上进行训练,尝试拟合正常样本分布,通过判断测试样本是否符合所学分布来判断图像是否存在异常。由于手工构造图像特征的方式对于图像采集环境以及图像质量极其敏感,因此,传统的图像异常检测算法始终无法达到与人工检测同等的水平。
近年来,随着深度学习技术的飞速发展,使用在数据集上训练得到的卷积神经网路提取到的特征对图像质量要求更低,因此基于深度学习的图像异常检测算法取得了长远的进步,并实现了令人满意的检测精度。
成都东方天呈智能科技有限公司在其专利申请号:202111288603.2的专利文献中公开了“一种基于生成对抗网络的异常检测系统、方法和存储介质”,该系统包含特征映射网络部分、生成器网络部分以及判别器网络部分,特征映射网络部分用于将图像样本映射成隐藏空间张量,生成器网络部分用于从隐藏空间张量中学习图像的真实分布,所述判别器网络部分用于在训练过程中区分真实图像与重构图像;该系统以重建正常样本为目标,尝试从正常样本中学习正常样本分布,使得在测试过程中,通过异常区域的高重建误差实现异常检测,但是这种仅以重建为目标函数的方法由于其生成器的重建能力过于强大,往往也能重建出异常区域,致使异常图像的重建误差同样很小,而导致异常检测效果变差。
湖南大学在其申请号:202111161614.4的专利文献中提出“一种基于混合监督学习的表面异常检测方法”。该方法首先获取表面正常的正常样本以及表面异常的异常样本进行预处理;并构建包括异常定位网络、自注意力网络和异常判别网络的神经网络模型,然后将预处理数据输入神经网络中进行训练以获取异常检测模型中进行训练以获取异常检测神经网络模型;最后将待测图像数据输入异常检测神经网络模型中,进而能够自动判别待测图像是否存在异常以及对异常区域进行定位。该方法由于以一种混合监督学习方式进行学习,将正常样本以及少量的带有粗略标注的样本作为训练集,因而对于从未在训练集中出现过的异常种类数据检测效果差。
发明内容
本发明的目的在于针对上述已有技术的不足,提出一种无监督学习的软掩膜对比损失图像异常检测方法,以提升图像异常检测效果,扩大对异常样本的识别种类。
为实现上述目的,本发明的技术方案包括如下:
(1)利用超像素分割算法和高斯噪声对MVTec工业异常检测训练数据集进行处理,得到合成图像训练数据集:
1a)将MVTec训练数据集中的所有正常图像数据利用超像素分割算法进行超像素分割,获取超像素图像与分割掩膜图;
1b)从分割后的超像素图像中随机选二十分之一数量的超像素,对其添加高斯噪声,得到合成图像,并将选取超像素对应的分割掩膜图作为合成图像的掩膜图标签;
1c)将合成图像及其对应的掩膜图标签作为训练数据集;
(2)搭建由重建自编码器和掩膜自编码器并联组成图像异常检测模型;
(3)利用合成图像训练集对图像异常检测模型进行训练:
3a)计算掩膜自编码器输出的预测掩膜图与输入的合成异常图像对应的标签掩膜图Msyn_ab之间的L2误差损失LMAE(Isyn_ab),并将该L2误差损失作为损失函数,利用Adam反向传播优化算法训练掩膜自编码器,完成其一次训练,其中的Isyn_ab表示输入的合成异常图像,表示掩膜自编码器,ωMAE表示掩膜自编码器的参数;
3b)对重建自编码器进行一次训练:
3b1)计算重建自编码器输出的重建图像与原始正常图像Inor之间的L2误差损失Lres(Isyn_ab),并利用一次训练得到的掩膜自编码器得到软掩膜图:其中的表示一次训练得到的掩膜自编码器,表示一次训练得到的掩膜自编码器参数;
3b2)将3b1)计算得到的软掩膜图与合成异常图像逐像素相乘,获取软掩膜对比损失中的负例样本:N=Msoft*Isyn_ab;
3b3)计算重建编码器的重建图像A、负例样本N、与合成图像对应的原始正常图像P三者之间的软掩膜对比损失LCL(A,P,N),并将L2误差损失Lres(Isyn_ab)与软掩膜对比损失LCL(A,P,N)的加权和作为重建自编码器的损失函数LRAE(Isyn_ab,P,N),并利用Adam反向传播优化算法训练重建自编码器,完成其一次训练;
3d)交替执行3a)和3b)直至各自对应的损失函数收敛,停止迭代,得到训练好的图像异常检测模型;
(4)图像异常定位与检测:
4a)将MVTec测试数据集中的图像I作为输入,输入到训练好的图像异常检测模型中,其通过掩膜自编码器输出预测掩膜图Smask(I),通过重建自编码器输出重建图像,并通过L2误差SL2(I)与对比误差SCL(I)得到重建自编码器的异常得分图Sres(I);
4b)通过掩膜自编码器的输出预测掩膜图Smask(I)与重建自编码器的异常得分图Sres(I),获取用于异常定位的像素级异常得分图S(I):
S(I)=Sres(I)+h··Smask(I)
其中的h·为掩膜自编码器的置信度参数;
4c)在像素级异常得分图中选取其最大值,得到用于异常检测的图像级异常得分η:
其中w表示像素级异常得分图的宽,h表示像素级异常得分图的高,S(I)(i,j)表示在像素级异常得分图中第i行第j列处的异常得分;
4d)根据MVTec训练数据集原始正常图像设置阈值T,将测试图像I的图像级异常得分η与设定的阈值进行比较:
若η>T,则图像I被判定为异常;
若η≤T,则图像I被判定为正常。
本发明与现有技术相比具有以下优点:
第一,本发明除以重建误差损失作为目标函数外,由于引入符合异常检测定义的对比损失函数,在学习正常分布的同时,远离异常分布,使得模型对于异常区域的重建效果差,增大异常区域的重建误差,提高异常检测结果。
第二,本发明由于利用具有高斯噪声超像素的合成图像训练数据集对图像异常检测模型进行训练,通过合成图像中随机生成的噪声超像素来模拟异常的多样性,扩大了对异常样本的识别种类。
附图说明
图1为本发明的实现总流程图;
图2是本发明中搭建的图像异常检测模型图;
图3是本发明中对图像异常检测模型进行训练的子流程图。
具体实施方式
下面结合附图对本发明的实施例和效果做进一步详细描述。
参照图1,本实例的实现步骤如下。
步骤1,构建合成图像训练数据集。
1.1)从公开网站获取MVTec工业异常检测数据集,并利用SEEDs超像素分割算法对MVTec训练数据集中的所有正常图像数据进行超像素分割,获取超像素图像与分割掩膜图;
1.2)从分割后的超像素图像中随机选二十分之一数量的超像素,对其添加高斯噪声,得到合成图像,并将选取超像素对应的分割掩膜图作为合成图像的掩膜图标签;
1.3)将合成图像及其对应的掩膜图标签作为训练数据集。
步骤2,搭建图像异常检测模型。
参照图2,图像异常检测模型包括重建自编码器和掩膜自编码器,其结构如下:
2.1)建立由编码器和重建解码器级联组成,且输出通道为3的重建自编码器:
所述编码器,依次由卷积层、第一最大池化层、四个残差模块和第二个最大池化层级联组成,其中,卷积层的卷积核大小为7×7,步长为2,填充像素为1;两个最大池化层的步长均为2;四个残差模块分别由3、4、6、3个残差卷积组组成,每个残差卷积组由第一卷积层、第二卷积层连接组成,这两个卷积层的卷积核大小均为3×3,步长均为1,填充像素均为1,该第二卷积层的输出特征与其输入特征逐通道相加即为残差卷积组的输出特征;
所述重建解码器,依次由六个解码模块和一个卷积模块级联组成,其中,每个解码模块由一个步长为2的双线性插值上采样层及第三卷积层、第四卷积层组成;卷积模块由两个卷积层组成,即第五卷积层和第六卷积层;该第三卷积层与第四卷积层的卷积核大小均为3×3,步长为1,填充像素为1;该第五卷积层和第六卷积层的卷积核大小均为3×3,步长为2,填充像素为1,其输出通道为3;
2.2)建立由编码器和重建解码器级联组成,且输出通道1的掩膜自编码器:
所述编码器与重建自编码器中的编码器结构相同;
所述掩膜解码器与重建自编码器中的重建自编码器结构相同,其输出通道为1;
2.3)重建自编码器与掩膜自编码器进行并联连接,组成图像异常检测模型,其中:
重建自编码器用于对输入图像进行重建,即通过编码器将输入图像编码成特征图,重建解码器将特征图解码为3通道的图像,以完成对输入图像的重建;
掩膜自编码器用于对输入图像进行异常预测,即通过编码器将输入图像编码成特征图,掩膜解码器将特征图解码为1通道的掩膜图,以完成对输入图像中异常的异常预测。
步骤3,对图像异常检测模型进行训练。
参照图3,本步骤的具体实现如下:
3.1)对掩膜编码器进行一次训练:
3.1.2)利用Adam反向传播优化算法最小化损失函数LMAE(Isyn_ab)的值,对掩膜自编码器参数进行更新,完成掩膜自编码器的一次训练;
3.2)对重建自编码器进行一次训练:
N=Msoft*Isyn_ab
3.2.3)计算重建编码器的重建图像A、负例样本N与合成图像对应的原始正常图像P三者之间的软掩膜对比损失LCL(A,P,N):
其中,P=Inor,为重建自编码器,ωRAE为重建自编码器的权重参数,vi(A)表示重建图像通过第i个VGG19特征层后得到的特征图,vi(P)表示原始正常图像通过第i个VGG19特征层后得到的特征图,vi(N)表示负例样本通过第i个VGG19特征层后得到的特征图,d(vi(A),vi(P))表示重建图像特征图与原始正常图像特征图之间的L1距离,d(vi(A),vi(N))表示重建图像特征图与负例样本特征图之间的L1距离,wi表示第i个尺度特征提取层下的软掩膜对比损失项的权重参数,i取值范围为{1,2,...,k},k表示选取在ImageNet公开数据集上训练好的VGG19不同尺度的特征提取层个数,k=5,即权重参数分别为h表示软掩膜对比损失中因子所占的权重,公式如下:其中, 表示一次训练得到的掩膜自编码器,表示一次训练得到的掩膜自编码器参数;
3.2.4)将L2误差损失Lres(Isyn_ab)与软掩膜对比损失LCL(A,P,N)的加权和作为重建自编码器的损失函数LRAE(Isyn_ab,P,N),表示如下:
LRAE(Isyn_ab,P,N)=Lres(Isyn_ab)+λ·LCL(A,P,N)
3.2.5)利用Adam反向传播优化算法最小化损失函数LRAE(Isyn_ab,P,N)的值,对重建自编码器参数进行更新,完成重建自编码器的一次训练;
3.3)重复执行3.1)和3.2),对掩膜自编码器与和重建自编码器交替进行训练,直至各自对应的损失函数收敛,停止迭代,得到训练好的图像异常检测模型。
步骤4,图像异常定位与检测。
4.1)将MVTec测试数据集中的图像I作为输入,输入到训练好的图像异常检测模型中,其通过掩膜自编码器输出预测掩膜图Smask(I):
4.2)图像I通过重建自编码器输出重建图像,并计算L2误差SL2(I)与对比误差SCL(I):
其中,表示训练好的重建自编码器,表示得到的重建自编码器权重参数,wi表示第i个尺度特征提取层下的软掩膜对比损失项的权重参数,i取值范围为{1,2,...,k},k表示选取在ImageNet公开数据集上训练好的VGG19不同尺度的特征提取层个数,k=5,即权重参数分别为vi(I)表示测试图像通过第i个VGG19特征层后得到的特征图,表示重建图像通过第i个VGG19特征层后得到的特征图,表示重建图像特征图与原始正常图像特征图之间的L1距离,表示将重建图像特征图与原始正常图像特征图之间的L1距离上采样到测试图像尺寸。
4.3)通过L2误差SL2(I)与对比误差SCL(I)得到重建自编码器的异常得分图Sres(I):
Sres(I)=SL2(I)+λ·SCL(I)
其中,λ为平衡L2误差与对比误差的权重超参数;
4.4)通过掩膜自编码器的输出预测掩膜图Smask(I)与重建自编码器的异常得分图Sres(I),获取用于异常定位的像素级异常得分图S(I):
S(I)=Sres(I)+h··Smask(I)
其中的h·为掩膜自编码器的置信度参数:
4.5)在像素级异常得分图中选取其最大值,得到用于异常检测的图像级异常得分η:
其中,w表示像素级异常得分图的宽,h表示像素级异常得分图的高,S(I)(i,j)表示在像素级异常得分图中第i行第j列处的异常得分;
4.6)根据MVTec训练数据集中的所有原始正常图像设置阈值T:
4.6.2)从像素级异常得分集合中计算每个原始正常图像的图像级异常得分μk:
4.6.3)根据每个原始正常图像的图像级异常得分得到所有原始正常图像对应的图像级异常分数集合:
Ω={μ1,μ2,...μk,...,μn}
4.6.4)从原始正常图像图像级异常分数集合集合Ω中选取最大值作为阈值T:
4.7)将测试图像I的图像级异常得分η与设定的阈值T进行比较:
若η>T,则图像I被判定为异常;
若η≤T,则图像I被判定为正常,至此完成对测试图像I的异常检测。
下面结合仿真实验对本发明的效果做进一步的描述。
1、仿真实验条件:
本发明的仿真实验的硬件平台为:Intel Core i7-8700K@3.70GHZ、32GB RAM,显卡为NVIDIA GeForce GTX 1080Ti。
本发明仿真实验的软件平台为:Ubuntu18.04操作系统,Pytorch1.6.0,Python3.6;
仿真实验采用MVTec数据集,包含训练数据集与测试数据集,此数据集是一个用于评估图像异常检测与定位算法好坏的基准数据集,共包含15类不同的工业品,其中包含5类纹理类型数据:网格、瓷砖、地毯、木材及皮革;包含10类物品类型数据:瓶口、胶囊、药片、电缆、晶体管、拉链、榛果、螺母、螺丝及牙刷。
2、仿真内容及其结果分析:
仿真1,用本发明与现有的四种图像异常定位方法,即基于SSIM损失函数自编码器的图像异常定位方法AESSIM、基于能量迭代的正态数据流形投影图像异常定位方法VAE-grad、多尺度知识蒸馏图像异常定位方法MKD、基于判别性潜在向量的教师-学生网络的图像异常定位方法US,分别对MVTec测试数据集中的所有测试图像计算像素级异常得分图,计算各种方法的像素级受试者工作特征曲线与横坐标轴围成的面积AUC这个指标,结果如表1所示。
表1.五种方法的像素级AUC评价结果(%)对比表
所述像素级AUC,是像素级受试者工作特征曲线与横坐标轴围成的面积AUC,用于衡量异常定位方法的效果,其值介于0%-100%,值越大则定位效果越好。
从表1可见,本发明在测试集上的像素级AUC指标平均值高于其他四种方法,证明本发明具有更好的图像异常定位效果。
仿真2,用本发明与现有的三种图像异常检测方法,即基于SSIM损失函数自编码器的图像异常检测方法AESSIM、基于深度支持向量数据描述模型的异常检测方法DSVDD、基于能量迭代的正态数据流形投影图像异常检测方法VAE-grad,分别利用各方法对MVTec测试数据集中的所有测试图像计算图像级异常得分,并计算各种方法的图像级受试者工作特征曲线与横坐标轴围成的面积AUC这个指标,结果如表2所示。
表2.四种方法的图像AUC评价结果(%)对比表
所述图像级AUC,是图像级受试者工作特征曲线与横坐标轴围成的面积AUC,用于衡量异常检测方法的效果,其值介于0%-100%,值越大则检测效果越好。
从表2可见,本发明在测试集上的图像级AUC指标平均值高于其他三种方法,证明本发明具有更好的图像异常检测效果。
Claims (8)
1.一种基于软掩膜对比损失的图像异常检测方法,其特征在于,包括如下步骤:
(1)利用超像素分割算法和高斯噪声对MVTec工业异常检测训练数据集进行处理,得到合成图像训练数据集:
1a)将MVTec训练数据集中的所有正常图像数据利用超像素分割算法进行超像素分割,获取超像素图像与分割掩膜图;
1b)从分割后的超像素图像中随机选二十分之一数量的超像素,对其添加高斯噪声,得到合成图像,并将选取超像素对应的分割掩膜图作为合成图像的掩膜图标签;
1c)将合成图像及其对应的掩膜图标签作为训练数据集;
(2)搭建由重建自编码器和掩膜自编码器并联组成图像异常检测模型;
(3)利用合成图像训练数据集对图像异常检测模型进行训练:
3a)计算掩膜自编码器输出的预测掩膜图与输入的合成异常图像对应的标签掩膜图Msyn_ab之间的L2误差损失LMAE(Isyn_ab),并将该L2误差损失作为损失函数,利用Adam反向传播优化算法训练掩膜自编码器,完成其一次训练,其中的Isyn_ab表示输入的合成异常图像,表示掩膜自编码器,ωMAE表示掩膜自编码器的参数;
3b)对重建自编码器进行一次训练:
3b1)计算重建自编码器输出的重建图像与原始正常图像Inor之间的L2误差损失Lres(Isyn_ab),并利用一次训练得到的掩膜自编码器得到软掩膜图:其中的表示一次训练得到的掩膜自编码器,表示一次训练得到的掩膜自编码器参数;
3b2)将3b1)计算得到的软掩膜图与合成异常图像逐像素相乘,获取软掩膜对比损失中的负例样本:N=Msoft*Isyn_ab;
3b3)计算重建编码器的重建图像A、负例样本N、与合成图像对应的原始正常图像P三者之间的软掩膜对比损失LCL(A,P,N),并将L2误差损失Lres(Isyn_ab)与软掩膜对比损失LCL(A,P,N)的加权和作为重建自编码器的损失函数LRAE(Isyn_ab,P,N),并利用Adam反向传播优化算法训练重建自编码器,完成其一次训练;
3d)交替执行3a)和3b)直至各自对应的损失函数收敛,停止迭代,得到训练好的图像异常检测模型;
(4)图像异常定位与检测:
4a)将MVTec测试数据集中的图像I作为输入,输入到训练好的图像异常检测模型中,其通过掩膜自编码器输出预测掩膜图Smask(I),通过重建自编码器输出重建图像,并通过L2误差SL2(I)与对比误差SCL(I)得到重建自编码器的异常得分图Sres(I);
4b)通过掩膜自编码器的输出预测掩膜图Smask(I)与重建自编码器的异常得分图Sres(I),获取用于异常定位的像素级异常得分图S(I):
S(I)=Sres(I)+h··Smask(I)
其中的h·为掩膜自编码器的置信度参数;
4c)在像素级异常得分图中选取其最大值,得到用于异常检测的图像级异常得分η:
其中w表示像素级异常得分图的宽,h表示像素级异常得分图的高,S(I)(i,j)表示在像素级异常得分图中第i行第j列处的异常得分;
4d)根据MVTec训练数据集原始正常图像设置阈值T,将测试图像I的图像级异常得分η与设定的阈值进行比较:
若η>T,则图像I被判定为异常;
若η≤T,则图像I被判定为正常。
2.根据权利要求1所述的方法,其特征在于,步骤2)图像异常检测模型中的重建自编码器和掩膜自编码器结构如下;
所述重建自编码器,由编码器和重建解码器级联组成;
该编码器,依次由卷积层、第一最大池化层、四个残差模块和第二个最大池化层级联组成,其中,卷积层的卷积核大小为7×7,步长为2,填充像素为1;两个最大池化层的步长均为2;四个残差模块分别由3、4、6、3个残差卷积组组成,每个残差卷积组由第一卷积层、第二卷积层连接组成,这两个卷积层的卷积核大小均为3×3,步长均为1,填充像素均为1,该第二卷积层的输出特征与其输入特征逐通道相加即为残差卷积组的输出特征;
该重建解码器,依次由六个解码模块和一个卷积模块级联组成,其中,每个解码模块由一个步长为2的双线性插值上采样层及第三卷积层、第四卷积层组成;卷积模块由两个卷积层组成,即第五卷积层和第六卷积层;该第三卷积层与第四卷积层的卷积核大小均为3×3,步长为1,填充像素为1;该第五卷积层和第六卷积层的卷积核大小均为3×3,步长为2,填充像素为1;其输出通道为3;
所述掩膜自编码器,包含编码器与掩膜编码器,其结构与重建自编码器相同,其输出通道为1。
5.根据权利要求1所述的方法,其特征在于,3b3)中计算重建编码器的重建图像A、负例样本N与合成图像对应的原始正常图像P三者之间的软掩膜对比损失LCL(A,P,N),公式如下:
其中,P=Inor,为重建自编码器,ωRAE为重建自编码器的权重参数,vi(A)表示重建图像通过第i个VGG19特征层后得到的特征图,vi(P)表示原始正常图像通过第i个VGG19特征层后得到的特征图,vi(N)表示负例样本通过第i个VGG19特征层后得到的特征图,d(vi(A),vi(P))表示重建图像特征图与原始正常图像特征图之间的L1距离,d(vi(A),vi(N))表示重建图像特征图与负例样本特征图之间的L1距离,wi表示第i个尺度特征提取层下的软掩膜对比损失项的权重参数,i取值范围为{1,2,...,k},k表示选取在ImageNet公开数据集上训练好的VGG19不同尺度的特征提取层个数,k=5,h表示软掩膜对比损失中因子所占的权重,公式如下:其中,
7.根据权利要求1所述的方法,其特征在于,4a)中掩膜自编码器输出的预测掩膜图Smask(I)和重建自编码器的异常得分图Sres(I),分别表示如下:
Sres(I)=SL2(I)+λ·SCL(I)
其中,I表示MVTec测试数据集中的图像,表示训练好的掩膜自编码器,表示掩膜自编码器的权重参数,λ为平衡L2误差SL2(I)与对比误差SCL(I)的权重超参数, 表示训练好的重建自编码器,表示得到的重建自编码器权重参数,wi表示第i个尺度特征提取层下的软掩膜对比损失项的权重参数,i取值范围为{1,2,...,k},k表示选取在ImageNet公开数据集上训练好的VGG19不同尺度的特征提取层个数,k=5,即权重参数分别为vi(I)表示测试图像通过第i个VGG19特征层后得到的特征图,表示重建图像通过第i个VGG19特征层后得到的特征图,表示重建图像特征图与原始正常图像特征图之间的L1距离,表示将重建图像特征图与原始正常图像特征图之间的L1距离上采样到测试图像尺寸。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210209818.9A CN114565594A (zh) | 2022-03-04 | 2022-03-04 | 基于软掩膜对比损失的图像异常检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210209818.9A CN114565594A (zh) | 2022-03-04 | 2022-03-04 | 基于软掩膜对比损失的图像异常检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114565594A true CN114565594A (zh) | 2022-05-31 |
Family
ID=81716941
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210209818.9A Pending CN114565594A (zh) | 2022-03-04 | 2022-03-04 | 基于软掩膜对比损失的图像异常检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114565594A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115170890A (zh) * | 2022-07-28 | 2022-10-11 | 哈尔滨市科佳通用机电股份有限公司 | 一种铁路货车连接拉杆链折断故障识别方法 |
CN116228769A (zh) * | 2023-05-09 | 2023-06-06 | 和峻(广州)胶管有限公司 | 一种适用于钢丝编织管瑕疵检测的装置及检测方法 |
CN117409192A (zh) * | 2023-12-14 | 2024-01-16 | 武汉大学 | 一种基于数据增强的红外小目标检测方法及装置 |
-
2022
- 2022-03-04 CN CN202210209818.9A patent/CN114565594A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115170890A (zh) * | 2022-07-28 | 2022-10-11 | 哈尔滨市科佳通用机电股份有限公司 | 一种铁路货车连接拉杆链折断故障识别方法 |
CN116228769A (zh) * | 2023-05-09 | 2023-06-06 | 和峻(广州)胶管有限公司 | 一种适用于钢丝编织管瑕疵检测的装置及检测方法 |
CN116228769B (zh) * | 2023-05-09 | 2023-10-17 | 和峻(广州)胶管有限公司 | 一种适用于钢丝编织管瑕疵检测的装置及检测方法 |
CN117409192A (zh) * | 2023-12-14 | 2024-01-16 | 武汉大学 | 一种基于数据增强的红外小目标检测方法及装置 |
CN117409192B (zh) * | 2023-12-14 | 2024-03-08 | 武汉大学 | 一种基于数据增强的红外小目标检测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112966684B (zh) | 一种注意力机制下的协同学习文字识别方法 | |
CN107657279B (zh) | 一种基于少量样本的遥感目标检测方法 | |
CN114565594A (zh) | 基于软掩膜对比损失的图像异常检测方法 | |
CN110657984B (zh) | 一种基于强化胶囊网络的行星齿轮箱故障诊断方法 | |
CN111368769B (zh) | 基于改进锚点框生成模型的船舶多目标检测方法 | |
CN109389171B (zh) | 基于多粒度卷积降噪自动编码器技术的医疗图像分类方法 | |
CN114972213A (zh) | 一种基于机器视觉的两阶段主板图像缺陷检测及定位方法 | |
CN114283120B (zh) | 一种基于领域自适应的端到端多源异质遥感影像变化检测方法 | |
Lv et al. | A novel pixel-wise defect inspection method based on stable background reconstruction | |
CN110930378A (zh) | 基于低数据需求的肺气肿影像处理方法及系统 | |
CN114283285A (zh) | 交叉一致性自训练遥感图像语义分割网络训练方法及装置 | |
CN112906813A (zh) | 一种基于密度聚类和胶囊神经网络的浮选工况识别方法 | |
He et al. | A diffusion-based framework for multi-class anomaly detection | |
CN117576079A (zh) | 一种工业产品表面异常检测方法、装置及系统 | |
CN115546171A (zh) | 一种基于关注阴影边界和特征校正的阴影检测方法及设备 | |
CN115829942A (zh) | 基于非负性约束稀疏自编码器的电子电路缺陷检测方法 | |
CN115358337A (zh) | 一种小样本故障诊断方法、装置及存储介质 | |
CN116994044A (zh) | 一种基于掩码多模态生成对抗网络的图像异常检测模型的构建方法 | |
CN117611599B (zh) | 融合中心线图和增强对比度网络的血管分割方法及其系统 | |
CN107392211A (zh) | 基于视觉稀疏认知的显著目标检测方法 | |
CN113989256A (zh) | 遥感图像建筑物的检测模型优化方法及检测方法、装置 | |
CN111401209B (zh) | 一种基于深度学习的动作识别方法 | |
CN117593243A (zh) | 可靠伪标签引导的压缩机外观自适应检测方法 | |
CN114764880B (zh) | 多成分gan重建的遥感图像场景分类方法 | |
Yang et al. | Multi-category decomposition editing network for the accurate visual inspection of texture defects |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |