CN114862811A - 一种基于变分自动编码器的缺陷检测方法 - Google Patents

一种基于变分自动编码器的缺陷检测方法 Download PDF

Info

Publication number
CN114862811A
CN114862811A CN202210544694.XA CN202210544694A CN114862811A CN 114862811 A CN114862811 A CN 114862811A CN 202210544694 A CN202210544694 A CN 202210544694A CN 114862811 A CN114862811 A CN 114862811A
Authority
CN
China
Prior art keywords
image
network
defect detection
distribution
reconstructed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210544694.XA
Other languages
English (en)
Inventor
张辉
胡非易
陈煜嵘
刘嘉轩
毛建旭
朱青
袁小芳
王耀南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University
Original Assignee
Hunan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University filed Critical Hunan University
Priority to CN202210544694.XA priority Critical patent/CN114862811A/zh
Publication of CN114862811A publication Critical patent/CN114862811A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于变分自动编码器的缺陷检测方法,采集产品数据集,对数据集进行划分得到训练集和测试集;将训练集中的图片生成按标签Si打乱的图像块;构建变分自动编码器网络,将打乱后的图像块送入编码器网络得到潜在特征;构建解码器网络,将编码器输出潜在特征输入解码器,辅助求解拼图,捕获全局和局部信息,从而重构出高分辨率图像,结合预设的损失函数对模型反向传播更新网络参数,得到训练好的模型;在测试集上进行测试,完成缺陷检测。实验结果表现了模型优秀的泛化能力以及缺陷检测能力。

Description

一种基于变分自动编码器的缺陷检测方法
技术领域
本发明属于缺陷检测领域,特别是涉及一种基于变分自动编码器的工业缺陷检测方法。
背景技术
缺陷检测是生产制造中非常重要的一个环节,它可以对产品的质量进行监测,使工人能及时发现问题,从而筛选出不合格产品并对技术进行改良,渗透到各个生产步骤中的工业缺陷检测对减少生产成本、提高生产效率、提升产品质量合格率等方面起着至关重要的作用。而传统的人工肉眼检测存在种种限制,无法满足高速准确的检测需求。
深度学习算法广泛应用于工业缺陷检测,然而一些传统方法,如One-class SVM、SVDD,依赖于人工标记的数据集,当直接应用于高维复杂数据时,会出现维度灾难。现有方法遵循特征提取和学习正常数据分布的方式。例如,Deep SVDD将神经网络输出拟合到最小集合中。此外,基于生成对抗网络(GAN)的异常检测可以学习拟合正常数据分布,该方法通常会产生视觉上更清晰的图像数据,但它们受限于没有可操作的潜在空间和不稳定的训练。
变分贝叶斯技术背景下的生成模型在对复杂分布进行建模方面显示出巨大的潜力。变分自动编码器(VAE)在理论上很好且易于训练。然而,观察基于VAE的异常检测方法,重构结果通常只是模糊地类似于输入,并且只是基于语义上而不是在像素值方面的重构。对于这些过度平滑的重构图像,很难设置阈值来对异常值和正常值进行分类。
在WAE、SWAE中使用Wasserstein距离来代替传统的散度度量。网络生成高分辨率图像并同时保留真实的后验。然而,近似的后验分布通常过于简单,并且与真实的后验分布不同。
针对以上问题,亟需一种能准确进行缺陷检测的模型及方法。
发明内容
针对以上技术问题,本发明提供一种基于变分自动编码器的缺陷检测方法。
本发明解决其技术问题采用的技术方案是:
一种基于变分自动编码器的缺陷检测方法,方法包括以下步骤:
步骤S100:收集数据集,并按照预设比例划分为训练集和测试集,其中,训练集为正常样本,测试集包括正常样本和异常样本;
步骤S200:构建缺陷检测网络模型,缺陷检测网络模型包括变分自动编码器网络和解码器网络;
步骤S300:对变分自动编码器网络和解码器网络进行参数的初始化后,将训练集中的图片按照预设规则拆分打乱后输入至变分自动编码器网络得到每个图像块对应的潜在特征,将每个图像块对应的潜在特征输入至解码器网络进行拼图重构得到重构训练图像,根据重构训练图像、训练集中的图像和预设的损失函数对模型进行反向传播更新网络参数,得到训练好的缺陷检测网络模型;
步骤S400:将测试集中的图片输入至训练好的缺陷检测网络模型中得到重构测试图像,根据重构测试图像和测试集中的图片得到整个图片的重构测试误差和每个补丁图片的重构测试误差,根据整个图片的重构测试误差、每个补丁图片的重构测试误差和预设的对应的误差阈值得到缺陷检测结果。
优选地,步骤S300中将训练集中的图片输入至变分自动编码器网络得到每个块对应的潜在特征,包括:
步骤S310:将训练集中的图片生成按伪标签打乱的图像块,将打乱后的图像块并行发送至变分自动编码器网络;
步骤S320:变分自动编码器网络对接收的打乱后的图像块进行特征提取和推理,得到每个图像块对应的潜在特征;其中,变分自动编码器网络使用ImageNet上的标准预训练ResNet-50网络,移除标准预训练ResNet-50网络的最后的全连接层,将倒数第二层作为潜在特征映射层。
优选地,步骤S310包括:
步骤S311:使用规则的n×n网格分隔训练图像得到训练补丁图像
Figure BDA0003651637930000021
Figure BDA0003651637930000022
步骤S312:根据Si的伪标签对补丁进行打乱,得到打乱后的图像块,将打乱后的图像块发送至变分自动编码器网络。
优选地,步骤S320中的每个图像块对应的潜在特征服从后验分布,引入先验分布,根据编码器推理得到每个图像块对应的潜在特征的后验分布,通过瓦瑟斯坦距离拟合先验分布和后验分布,具体为:
引入t分布
Figure BDA0003651637930000031
作为每个网格补丁xk的潜在特征的先验分布p(zk):
Figure BDA0003651637930000032
其中ν表示自由度数,Γ是伽马函数;
将变分自动编码器网络对接收的打乱后的图像块进行推理得到每个图像块对应的潜在特征的后验分布q(zk|xk);
根据瓦瑟斯坦距离拟合先验分布p(zk)和后验分布q(zk|xk)之间的分布差异。
优选地,根据瓦瑟斯坦距离拟合先验分布p(zk)和后验分布q(zk|xk)之间的分布差异具体为:
Figure BDA0003651637930000033
其中,
Figure BDA0003651637930000034
表示d维单位球体,对于固定的值
Figure BDA00036516379300000311
Figure BDA0003651637930000035
表示p(x)的边际分布,Wp为p-wasserstein距离。
优选地,步骤S300中将每个块对应的潜在特征输入至解码器网络进行拼图重构得到重构训练图像,包括:
解码器网络对接收的每个块对应的潜在特征重新进行排序,其中,解码器网络为多个由Upsample-Conv-BN-ReLU层组成的块构建。
优选地,预设的损失函数具体为:
Figure BDA0003651637930000036
其中
Figure BDA0003651637930000037
Figure BDA0003651637930000038
Figure BDA0003651637930000039
其中,λ1、λ2是超参数,
Figure BDA00036516379300000310
是输入数据和重构数据之间的均方误差,xi为第i个输入图像,
Figure BDA0003651637930000041
为第i个输入图像对应的重构图像,
Figure BDA0003651637930000042
是推理分布损失,
Figure BDA0003651637930000043
表示排列分类误差,Si是标签,zk是第k个图像块的潜在特征,
Figure BDA0003651637930000044
表示求解zk对应的标签对应为
Figure BDA0003651637930000045
的概率。
优选地,步骤S400中根据整个图片的重构测试误差、每个补丁图片的重构测试误差和预设的对应的误差阈值得到缺陷检测结果,包括:
优选地,当整个图片的重构测试误差小于或等于预设的第一阈值∈0且每个补丁图片的重构测试误差小于或等于预设的第二阈值∈k时,缺陷检测结果为输入为正常输入,具体为:
Figure BDA0003651637930000046
其中,
Figure BDA0003651637930000047
为第i个输入图像的第k个图像块,
Figure BDA0003651637930000048
为第i个输入图像的第k个图像块对应的重构图像,∈0、∈k分别为预设的第一阈值和预设的第二阈值。
上述一种基于变分自动编码器的缺陷检测方法,通过编码器网络可以推理正常数据的分布,通过解码器网络求解拼图作为辅助,网络可以捕获全局和局部信息,从而支持网络重构出高分辨率图像,根据重构训练图像、训练集中的图像和预设的损失函数对模型进行反向传播更新网络参数,得到训练好的缺陷检测网络模型;将测试集中的图片输入至训练好的缺陷检测网络模型中得到重构测试图像,根据重构测试图像和测试集中的图片得到整个图片的重构测试误差和每个补丁图片的重构测试误差,根据整个图片的重构测试误差、每个补丁图片的重构测试误差和预设的对应的误差阈值得到缺陷检测结果,缺陷检测准确率高。
附图说明
图1为本发明的一种基于变分自动编码器的缺陷检测方法的流程图;
图2为本发明设计的缺陷检测网络模型的结构图;
图3为本发明的方法在MVTec-AD数据集上的测试结果可视化图。
具体实施方式
为了使本技术领域的人员更好地理解本发明的技术方案,下面结合附图对本发明作进一步的详细说明。
在一个实施例中,如图1所示,一种基于变分自动编码器的缺陷检测方法,方法包括以下步骤:
步骤S100:收集数据集,并按照预设比例划分为训练集和测试集,其中,训练集为正常样本,测试集包括正常样本和异常样本。
具体地,本发明构建的异常检测网络模型核心思想是对正常数据分布进行建模,正常分布外的情况可以被检测为异常。因此需将收集到的原始数据集进行拆分(即训练集中仅包含正常数据,测试集中包含正常和异常数据)。从而配置了一个无监督的异常检测场景,在训练期间只使用正常样本。本发明的实验在MVTec-AD数据集上进行。采用数据集中的瓶子、药片、胶囊三类分别对网络进行训练和测试。
例如在对瓶子的数据集进行训练和测试时,将其中包含的N个样本表示为DX(DX={x1,x2,…,xN}),其中
Figure BDA0003651637930000051
是从欧几里得空间中无缺陷流形
Figure BDA0003651637930000052
中采样的单个输入数据点,异常检测的核心目标是对DX建模并学习其流形
Figure BDA0003651637930000053
Figure BDA0003651637930000054
为代表空间,使
Figure BDA0003651637930000055
表示xi的潜在特征。
步骤S200:构建缺陷检测网络模型,缺陷检测网络模型包括变分自动编码器网络和解码器网络。
步骤S300:对变分自动编码器网络和解码器网络进行参数的初始化后,将训练集中的图片按照预设规则拆分打乱后输入至变分自动编码器网络得到每个图像块对应的潜在特征,将每个图像块对应的潜在特征输入至解码器网络进行拼图重构得到重构训练图像,根据重构训练图像、训练集中的图像和预设的损失函数对模型进行反向传播更新网络参数,得到训练好的缺陷检测网络模型;
在一个实施例中,如图2所示,步骤S300中将训练集中的图片输入至变分自动编码器网络得到每个块对应的潜在特征,包括:
步骤S310:将训练集中的图片生成按伪标签打乱的图像块,将打乱后的图像块并行发送至变分自动编码器网络。
进一步地,步骤S310包括:
步骤S311:使用规则的n×n网格分隔训练图像得到训练补丁图像
Figure BDA0003651637930000056
Figure BDA0003651637930000057
步骤S312:根据Si的伪标签对补丁进行打乱,得到打乱后的图像块,将打乱后的图像块发送至变分自动编码器网络。
具体地,给定训练期间的正常样本,首先使用规则的n×n网格分隔训练补丁图像
Figure BDA0003651637930000061
然后根据Si的伪标签对补丁进行打乱。例如,保持n=3,并且S包含1000个随机排列数组。也就是说,将图像分成9个补丁,并且对于每次训练迭代,根据Si的伪标签对补丁进行打乱,这些补丁并行发送到变分自动编码器网络
Figure BDA0003651637930000062
步骤S320:变分自动编码器网络对接收的打乱后的图像块进行特征提取和推理,得到每个图像块对应的潜在特征;其中,变分自动编码器网络使用ImageNet上的标准预训练ResNet-50网络,移除标准预训练ResNet-50网络的最后的全连接层,将倒数第二层作为潜在特征映射层。
具体地,使用ImageNet上的标准预训练ResNet-50网络进行推理,移除最后的全连接层,将倒数第二层作为潜在特征映射器。
在一个实施例中,步骤S320中的每个图像块对应的潜在特征服从后验分布,引入先验分布,根据编码器推理得到每个图像块对应的潜在特征的后验分布,通过瓦瑟斯坦距离拟合先验分布和后验分布,具体为:
引入t分布
Figure BDA0003651637930000063
作为每个网格补丁xk的潜在特征的先验分布p(zk):
Figure BDA0003651637930000064
其中v表示自由度数,Γ是伽马函数;
将变分自动编码器网络对接收的打乱后的图像块进行推理得到每个图像块对应的潜在特征的后验分布q(zk|xk);
根据瓦瑟斯坦距离拟合先验分布p(zk)和后验分布q(zk|xk)之间的分布差异。
具体地,对于每个补丁潜在特征
Figure BDA0003651637930000065
将t分布
Figure BDA0003651637930000066
分配为先验分布,其中5是自由度。使用自由度为5的原因是其结果表现更稳健和收敛。在变分自动编码器网络中得到每个图像块对应的潜在特征的后验分布q(zk|xk),对潜在特征zi进行近似。遵循变分推理原理,目标是最小化q(zk|xk)和先验p(zk)之间的差异,这里引入瓦瑟斯坦距离来测量散度。
在一个实施例中,根据瓦瑟斯坦距离拟合先验分布p(zk)和后验分布q(zk|xk)之间的分布差异具体为:
Figure BDA0003651637930000071
其中,
Figure BDA0003651637930000072
表示d维单位球体,,对于固定的值
Figure BDA00036516379300000710
Figure BDA0003651637930000073
表示p(x)的边际分布,Wp为p-wasserstein距离。
具体地,Sliced-Wasserstein距离(SWD)可以通过线性切片(Radon变换)概率分布来减轻其高计算成本:
Figure BDA0003651637930000074
其中
Figure BDA0003651637930000075
表示d维单位球体,δ(·)表示一维狄拉克函数,对于固定的
Figure BDA00036516379300000711
Figure BDA0003651637930000076
是pX的边际分布。
在此基础上,用于先验分布p(zk)和推理后验p(zk|xk)之间分布差异度量的sliced-Wasserstein距离可以定义为:
Figure BDA0003651637930000077
累积的推理损失函数是每个补丁的切片sliced-Wasserstein距离之和:
Figure BDA0003651637930000078
其中n2是补丁的数量。
最后,累积的补丁推理分布∑q(zk|xk)可以分别根据学生t分布先验
Figure BDA0003651637930000079
的混合来近似。
在一个实施例中,如图2所示,步骤S300中将每个块对应的潜在特征输入至解码器网络进行拼图重构得到重构训练图像,包括:
解码器网络对接收的每个块对应的潜在特征重新进行排序,其中,解码器网络为多个由Upsample-Conv-BN-ReLU层组成的块构建。
具体地,将编码器输出潜在特征zi输入解码器fθ(·),辅助求解拼图,捕获全局和局部信息,从而重构出高分辨率图像。
在一个实施例中,预设的损失函数具体为:
Figure BDA0003651637930000081
其中
Figure BDA0003651637930000082
Figure BDA0003651637930000083
Figure BDA0003651637930000084
其中,λ1、λ2是超参数,
Figure BDA0003651637930000085
是输入数据和重构数据之间的均方误差,xi为第i个输入图像,
Figure BDA0003651637930000086
为第i个输入图像对应的重构图像,
Figure BDA0003651637930000087
是推理分布损失,
Figure BDA0003651637930000088
表示排列分类误差,Si是标签,zk是第k个图像块的潜在特征,
Figure BDA0003651637930000089
表示求解zk对应的标签对应为
Figure BDA00036516379300000810
的概率。
具体地,在训练阶段,给定无缺陷实例,目标函数包括三个部分:
Figure BDA00036516379300000811
通过上述目标函数,网络就可以方便地模拟真正的正常数据分布。
步骤S400:将测试集中的图片输入至训练好的缺陷检测网络模型中得到重构测试图像,根据重构测试图像和测试集中的图片得到整个图片的重构测试误差和每个补丁图片的重构测试误差,根据整个图片的重构测试误差、每个补丁图片的重构测试误差和预设的对应的误差阈值得到缺陷检测结果。
进一步地,步骤S400中根据整个图片的重构测试误差、每个补丁图片的重构测试误差和预设的对应的误差阈值得到缺陷检测结果,包括:
在一个实施例中,当整个图片的重构测试误差小于或等于预设的第一阈值∈0且每个补丁图片的重构测试误差小于或等于预设的第二阈值∈k时,缺陷检测结果为输入为正常输入,具体为:
Figure BDA00036516379300000812
其中,
Figure BDA00036516379300000813
为第i个输入图像的第k个图像块,
Figure BDA00036516379300000814
为第i个输入图像的第k个图像块对应的重构图像。∈0、∈k分别为预设的第一阈值和预设的第二阈值。
具体地,无缺陷实例的标准是整个图像和每个补丁的重建误差都应低于阈值。
上述一种基于变分自动编码器的缺陷检测方法,提出了用于异常检测的模型结构,这是一种简单而有效的方法,可以推理正常数据的分布,通过求解拼图作为辅助任务,网络可以捕获全局和局部信息,从而鼓励网络生成高分辨率图像。引入一个切片瓦瑟斯坦测量法来针对特征崩溃的问题,从而提升了网络的泛化能力,与普通散度相比,它们的计算成本更低。该方法在异常检测方面表现出优越的性能,包括但不限于工业缺陷检测。
以上对本发明所提供的一种基于变分自动编码器的缺陷检测方法进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (9)

1.一种基于变分自动编码器的缺陷检测方法,其特征在于,所述方法包括以下步骤:
步骤S100:收集数据集,并按照预设比例划分为训练集和测试集,其中,所述训练集为正常样本,所述测试集包括正常样本和异常样本;
步骤S200:构建缺陷检测网络模型,所述缺陷检测网络模型包括变分自动编码器网络和解码器网络;
步骤S300:对所述变分自动编码器网络和所述解码器网络进行参数的初始化后,将训练集中的图片按照预设规则拆分打乱后输入至所述变分自动编码器网络得到每个图像块对应的潜在特征,将所述每个图像块对应的潜在特征输入至所述解码器网络进行拼图重构得到重构训练图像,根据所述重构训练图像、所述训练集中的图像和预设的损失函数对所述模型进行反向传播更新网络参数,得到训练好的缺陷检测网络模型;
步骤S400:将所述测试集中的图片输入至所述训练好的缺陷检测网络模型中得到重构测试图像,根据所述重构测试图像和所述测试集中的图片得到整个图片的重构测试误差和每个补丁图片的重构测试误差,根据所述整个图片的重构测试误差、所述每个补丁图片的重构测试误差和预设的对应的误差阈值得到缺陷检测结果。
2.根据权利要求1所述的方法,其特征在于,步骤S300中所述将训练集中的图片输入至所述变分自动编码器网络得到每个块对应的潜在特征,包括:
步骤S310:将所述训练集中的图片生成按伪标签打乱的图像块,将打乱后的图像块并行发送至所述变分自动编码器网络;
步骤S320:所述变分自动编码器网络对接收的所述打乱后的图像块进行特征提取和推理,得到每个图像块对应的潜在特征;其中,所述变分自动编码器网络使用ImageNet上的标准预训练ResNet-50网络,移除所述标准预训练ResNet-50网络的最后的全连接层,将倒数第二层作为潜在特征映射层。
3.根据权利要求2所述的方法,其特征在于,步骤S310包括:
步骤S311:使用规则的n×n网格分隔训练图像得到训练补丁图像
Figure FDA0003651637920000011
Figure FDA0003651637920000012
步骤S312:根据Si的伪标签对补丁进行打乱,得到打乱后的图像块,将所述打乱后的图像块发送至所述变分自动编码器网络。
4.根据权利要求3所述的方法,其特征在于,步骤S320中的每个图像块对应的潜在特征服从后验分布,引入先验分布,根据所述编码器推理得到每个图像块对应的潜在特征的后验分布,通过瓦瑟斯坦距离拟合所述先验分布和所述后验分布,具体为:
引入t分布
Figure FDA0003651637920000021
作为每个网格补丁xk的潜在特征的先验分布p(zk):
Figure FDA0003651637920000022
其中v表示自由度数,Γ是伽马函数;
将所述变分自动编码器网络对接收的所述打乱后的图像块进行推理得到每个图像块对应的潜在特征的后验分布q(zk|xk);
根据瓦瑟斯坦距离拟合所述先验分布p(zk)和所述后验分布q(zk|xk)之间的分布差异。
5.根据权利要求4所述的方法,其特征在于,所述根据瓦瑟斯坦距离拟合所述先验分布p(zk)和所述后验分布q(zk|xk)之间的分布差异具体为:
Figure FDA0003651637920000023
其中,
Figure FDA0003651637920000024
表示d维单位球体,对于固定的值θ,
Figure FDA0003651637920000025
表示p(x)的边际分布,Wp为p-wasserstein距离。
6.根据权利要求5所述的方法,其特征在于,步骤S300中将所述每个块对应的潜在特征输入至所述解码器网络进行拼图重构得到重构训练图像,包括:
所述解码器网络对接收的所述每个块对应的潜在特征重新进行排序,其中,所述解码器网络为多个由Upsample-Conv-BN-ReLU层组成的块构建。
7.根据权利要求6所述的方法,其特征在于,预设的损失函数具体为:
Figure FDA0003651637920000026
其中
Figure FDA0003651637920000027
Figure FDA0003651637920000028
Figure FDA0003651637920000031
其中,λ1、λ2是超参数,
Figure FDA0003651637920000032
是输入数据和重构数据之间的均方误差,xi为第i个输入图像,
Figure FDA0003651637920000033
为第i个输入图像对应的重构图像,
Figure FDA0003651637920000034
是推理分布损失,
Figure FDA0003651637920000035
表示排列分类误差,Si是标签,zk是第k个图像块的潜在特征,
Figure FDA0003651637920000036
表示求解zk对应的标签对应为
Figure FDA0003651637920000037
的概率。。
8.根据权利要求7所述的方法,其特征在于,步骤S400中根据所述整个图片的重构测试误差、所述每个补丁图片的重构测试误差和预设的对应的误差阈值得到缺陷检测结果,包括:
当所述整个图片的重构测试误差大于或等于预设的第一阈值时,缺陷检测结果为输入为异常输入;
当所述整个图片的重构测试误差小于或等于预设的第二阈值且所述每个补丁图片的重构测试误差小于或等于预设的第三阈值时,缺陷检测结果为输入为正常输入。
9.根据权利要求8所述的方法,其特征在于,当所述整个图片的重构测试误差小于或等于预设的第一阈值∈0且所述每个补丁图片的重构测试误差小于或等于预设的第二阈值∈k时,缺陷检测结果为输入为正常输入,具体为:
Figure FDA0003651637920000038
其中,
Figure FDA0003651637920000039
为第i个输入图像的第k个图像块,
Figure FDA00036516379200000310
为第i个输入图像的第k个图像块对应的重构图像,∈0、∈k分别为预设的第一阈值和预设的第二阈值。
CN202210544694.XA 2022-05-19 2022-05-19 一种基于变分自动编码器的缺陷检测方法 Pending CN114862811A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210544694.XA CN114862811A (zh) 2022-05-19 2022-05-19 一种基于变分自动编码器的缺陷检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210544694.XA CN114862811A (zh) 2022-05-19 2022-05-19 一种基于变分自动编码器的缺陷检测方法

Publications (1)

Publication Number Publication Date
CN114862811A true CN114862811A (zh) 2022-08-05

Family

ID=82639005

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210544694.XA Pending CN114862811A (zh) 2022-05-19 2022-05-19 一种基于变分自动编码器的缺陷检测方法

Country Status (1)

Country Link
CN (1) CN114862811A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115861306A (zh) * 2023-02-20 2023-03-28 武汉纺织大学 一种基于自监督拼图模块的工业品异常检测方法
CN116796251A (zh) * 2023-08-25 2023-09-22 江苏省互联网行业管理服务中心 一种基于图文多模态的不良网站分类方法、系统及设备
CN117011650A (zh) * 2023-10-07 2023-11-07 腾讯科技(深圳)有限公司 一种图像编码器的确定方法及相关装置
CN117173543A (zh) * 2023-11-02 2023-12-05 天津大学 一种肺腺癌和肺结核的混合图像重构方法及系统
CN117649387A (zh) * 2023-11-30 2024-03-05 中科海拓(无锡)科技有限公司 一种适用于带有表面复杂纹理物体的缺陷检测方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115861306A (zh) * 2023-02-20 2023-03-28 武汉纺织大学 一种基于自监督拼图模块的工业品异常检测方法
CN116796251A (zh) * 2023-08-25 2023-09-22 江苏省互联网行业管理服务中心 一种基于图文多模态的不良网站分类方法、系统及设备
CN117011650A (zh) * 2023-10-07 2023-11-07 腾讯科技(深圳)有限公司 一种图像编码器的确定方法及相关装置
CN117011650B (zh) * 2023-10-07 2023-12-08 腾讯科技(深圳)有限公司 一种图像编码器的确定方法及相关装置
CN117173543A (zh) * 2023-11-02 2023-12-05 天津大学 一种肺腺癌和肺结核的混合图像重构方法及系统
CN117173543B (zh) * 2023-11-02 2024-02-02 天津大学 一种肺腺癌和肺结核的混合图像重构方法及系统
CN117649387A (zh) * 2023-11-30 2024-03-05 中科海拓(无锡)科技有限公司 一种适用于带有表面复杂纹理物体的缺陷检测方法

Similar Documents

Publication Publication Date Title
CN114862811A (zh) 一种基于变分自动编码器的缺陷检测方法
Zhang et al. Identity crisis: Memorization and generalization under extreme overparameterization
EP4027300B1 (en) Apparatus, program, and method for anomaly detection and classification
US11481585B2 (en) Segmentation of data
Li et al. Superpixel Masking and Inpainting for Self-Supervised Anomaly Detection.
Lee et al. AnoViT: Unsupervised anomaly detection and localization with vision transformer-based encoder-decoder
WO2008133951A2 (en) Method and apparatus for image processing
CN115605878A (zh) 使用基于自注意力的神经网络处理图像
CN116524299A (zh) 一种图像样本生成方法、装置、设备及存储介质
CN115439694A (zh) 一种基于深度学习的高精度点云补全方法及装置
Cao et al. Latent tangent space representation for normal estimation
CN112435258A (zh) 一种图像检测模型的构建方法、图像检测方法及装置
Yang et al. Fill in the blank: transferrable deep learning approaches to recover missing physical field information
Kong et al. Semi-supervised classification of wafer map based on ladder network
Shih et al. Automatic reclaimed wafer classification using deep learning neural networks
CN114998360A (zh) 一种基于SUnet算法的脂肪细胞祖细胞分割方法
KR102178238B1 (ko) 회전 커널을 이용한 머신러닝 기반 결함 분류 장치 및 방법
CN112767331A (zh) 基于零样本学习的图像异常检测方法
CN117011219A (zh) 物品质量检测方法、装置、设备、存储介质和程序产品
CN115861284A (zh) 印刷制品线状缺陷检测方法、装置、电子设备和存储介质
Parllaku et al. Using computational intelligence for smart device operation monitoring
CN113688773A (zh) 一种基于深度学习的储罐穹顶位移数据修复方法及其装置
Huang et al. Quality control on manufacturing computer keyboards using multilevel deep neural networks
Hwang et al. Anomaly Detection in Time Series Data and its Application to Semiconductor Manufacturing
Chen High-Dimensional Generative Models for 3D Perception

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination