CN115205650B - 基于多尺度标准化流的无监督异常定位与检测方法及装置 - Google Patents
基于多尺度标准化流的无监督异常定位与检测方法及装置 Download PDFInfo
- Publication number
- CN115205650B CN115205650B CN202211118934.6A CN202211118934A CN115205650B CN 115205650 B CN115205650 B CN 115205650B CN 202211118934 A CN202211118934 A CN 202211118934A CN 115205650 B CN115205650 B CN 115205650B
- Authority
- CN
- China
- Prior art keywords
- scale
- flow model
- abnormal
- standardized flow
- standardized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 173
- 238000000034 method Methods 0.000 title claims abstract description 98
- 238000001514 detection method Methods 0.000 claims abstract description 154
- 230000004927 fusion Effects 0.000 claims abstract description 129
- 230000010354 integration Effects 0.000 claims abstract description 38
- 238000004458 analytical method Methods 0.000 claims abstract description 16
- 238000012549 training Methods 0.000 claims description 39
- 230000006870 function Effects 0.000 claims description 37
- 230000005856 abnormality Effects 0.000 claims description 33
- 230000008878 coupling Effects 0.000 claims description 27
- 238000010168 coupling process Methods 0.000 claims description 27
- 238000005859 coupling reaction Methods 0.000 claims description 27
- 238000012360 testing method Methods 0.000 claims description 27
- 238000010276 construction Methods 0.000 claims description 20
- 230000004807 localization Effects 0.000 claims description 20
- 230000004913 activation Effects 0.000 claims description 14
- 238000005457 optimization Methods 0.000 claims description 12
- 238000007476 Maximum Likelihood Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 3
- 230000007547 defect Effects 0.000 description 19
- 239000000463 material Substances 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 8
- 239000002131 composite material Substances 0.000 description 6
- 230000011218 segmentation Effects 0.000 description 6
- 238000012935 Averaging Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000011176 pooling Methods 0.000 description 5
- 239000000654 additive Substances 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 230000008447 perception Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000004821 distillation Methods 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 101100481876 Danio rerio pbk gene Proteins 0.000 description 2
- 101100481878 Mus musculus Pbk gene Proteins 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000013140 knowledge distillation Methods 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008825 perceptual sensitivity Effects 0.000 description 1
- 238000005211 surface analysis Methods 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明属于计算机视觉中图像异常定位与检测技术领域,具体公开了基于多尺度标准化流的无监督异常定位与检测方法及装置,所述方法先通过构建的多尺度标准化流模型获取图片的多尺度融合特征;再分别针对异常定位任务、异常检测任务设置不同的多尺度输出整合方案;最后由多尺度融合特征作为多尺度输出整合方案的输入计算得到用于异常定位分析的异常定位分数图和用于异常检测分析的异常检测分数,实现对输入图片的异常定位与检测。本发明增强了标准化流对异常区域大小多变性的泛化能力,提高了异常定位和检测性能。
Description
技术领域
本发明属于计算机视觉中图像异常定位与检测技术领域,具体的说,是一种基于多尺度标准化流的无监督异常定位与检测方法及实现无监督异常定位与检测功能的装置。
背景技术
无监督异常检测是计算机视觉中一个具有高度实用性而又富有挑战性的问题,旨在不花费大量的人力物力对异常图片进行标志,仅通过收集到的无异常图片进行训练神经网络模型,最终判定输入图片是否存在异常并且进一步对异常区域进行定位。从提出至今一直是学术界研究的热点任务,并且在工业生产、金融安全、医疗诊断等行业中都有着广泛的应用,因此在工业界也备受关注。
近年来,基于深度学习的异常检测技术不断涌现,相较于手工设计数据的特征,深度学习方法可以自动学习数据的特征并由此对数据进行分类与回归,因此具有更高的鲁棒性。而且,深度学习方法不仅能够实现旨在判定输入图片是否存在异常的异常检测,还能够实现对图像中的异常区域进行异常定位。随着深度卷积神经网络的应用和MVTec AD等高质量异常检测数据集的发布,无监督异常检测与定位方法已经取得了较大的发展,它们大致可以分为基于重建、基于聚类和基于概率密度估计的方法。
1)基于重建的方法:此类方法通过无异常图片训练一个图像复原网络,该网络包括一个编码器和解码器。由于此类方法只对在无异常图片上训练过重建参数,因此对异常区域重建效果差甚至无法重建,由此实现对异常的检测与定位。此类方法的核心在于如何限制重建网络只对正常区域进行重建而不泛化到异常区域。
2)基于聚类的方法:此类方法对于无异常图像的编码特征构建特征库,并且对特征库中的所有特征进行聚类。在测试时,对测试图像的编码特征和在无异常数据上获取的聚类中心进行相似度计算,超过一定阈值则判定为异常特征,对应区域也标定为异常区域。此类方法的核心主要集中在对特征库的聚类和特征相似度的计算。
3)基于概率密度估计的方法:此类方法基于标准化流模型通过最大似然估计的方法对无异常图像进行概率估计,这样训练好的标准化流模型会对异常区域给出远低于正常区域的似然概率,从而分辨出异常区域。此类方法的核心在于对标准化流模型的设计。
相较于前两种方法,基于概率密度估计的方法在效果和实时性上都取得了更好的性能,但是仍然面临着不可预知、具有高度不确定性的异常样本中异常区域大小多变性问题,限制着标准化流模型的检测性能。
发明内容
本发明针对因异常样本中异常区域大小多变性而导致现有技术中标准化流模型检测性能受限的问题,提供了一种基于多尺度标准化流的无监督异常定位与检测方法,通过开发标准化流模型中的多尺度特性,并针对异常定位和异常检测两个任务设计不同的多尺度输出整合方案,增强了标准化流对异常区域大小多变性的泛化能力,提高了异常定位和检测性能。
本发明通过下述技术方案实现:
基于多尺度标准化流的无监督异常定位与检测方法,先通过构建的多尺度标准化流模型获取图片的多尺度融合特征;再分别针对异常定位任务、异常检测任务设置不同的多尺度输出整合方案;最后由多尺度融合特征作为多尺度输出整合方案的输入计算得到用于异常定位分析的异常定位分数图和用于异常检测分析的异常检测分数,实现对输入图片的异常定位与检测。
本发明核心思想在于发掘标准化流模型中的多尺度特性,提高标准化流模型对于异常区域大小多变性的泛化能力不仅在模型设计上充分发掘了多尺度特性,还根据异常检测和异常定位两个任务之间的故有差距,分别设计不同的多尺度输出的整合方案。此方法增强了标准化流对异常区域多变性的泛化能力,提高了异常检测和定位性能。
进一步地,为了更好地实现本发明,针对异常定位任务设置的多尺度输出整合方案,是采用将不同尺度的输出相加的方式得到异常定位概率密度函数,再通过概率密度估计的方法计算得到异常定位分数。
进一步地,为了更好地实现本发明,针对异常检测任务设置的多尺度输出整合方案,是先采用将不同尺度的输出相乘的方式得到异常检测概率密度函数,再通过概率密度估计的方法计算得到异常检测分数图,最后从异常检测分数图中选择最大的K个分值取平均得到异常检测分数;K为不小于1的正整数。
进一步地,为了更好地实现本发明,所述通过构建多尺度标准化流模型获取图片的多尺度融合特征,具体是指:基于标准化流模型构建非对称的多尺度并行标准化流模型和多尺度融合标准化流模型这两个多尺度标准化流模型;利用构建的特征提取器提取图片的L个多尺度图像特征,并将L个多尺度图像特征作为多尺度标准化流模型的输入,L为不小于2的正整数;多尺度图像特征依次经多尺度并行标准化流模型、多尺度融合标准化流模型编码后得到对应的多尺度融合特征。
进一步地,为了更好地实现本发明,所述方法分为训练阶段和测试阶段:
所述训练阶段,具体是指:先选取异常检测数据集并仅以无异常的图片作为训练数据;接着利用构建的特征提取器从图片中提取L个多尺度图像特征;再将L个多尺度图像特征依次输入构建的多尺度并行标准化流模型和多尺度融合标准化流模型中得到多尺度融合特征;然后对多尺度融合特征进行最大似然优化从而训练多尺度并行标准化流模型和多尺度融合标准化流模型这两个多尺度标准化流模型;
所述测试阶段,具体是指:先输入待分析的图片;接着利用构建的特征提取器从图片中提取L个多尺度图像特征;再将L个多尺度图像特征依次输入构建的多尺度并行标准化流模型和多尺度融合标准化流模型中得到多尺度融合特征;然后根据多尺度输出整合方案对多尺度融合特征进行整合;最后计算得到异常定位分数图和异常检测分数。
进一步地,为了更好地实现本发明,所述多尺度并行标准化流模型的构建方法如下:先搭建由两个核大小为3的卷积网络以及ReLU激活函数组合而成的网络,将其作为线性耦合层的子网络并构建具有线性耦合层的标准化流模块;再将个标准化流模块堆叠成标准化流模型的第i个模型分支,其中:1≦i≦L,﹤且、、i均为正整数;然后将L个模型分支按顺序组合,得到分支并行且独立的并行标准化流模型,即非对称的多尺度并行标准化流模型。
进一步地,为了更好地实现本发明,所述多尺度融合标准化流模型的构建方法如下:先搭建由两个核大小为3的卷积网络以及ReLU激活函数组合而成的网络,将其作为线性耦合层的子网络并构建多尺度融合标准化流模型。
进一步地,为了更好地实现本发明,所述L取2或3。
进一步地,为了更好地实现本发明,基于多尺度标准化流的无监督异常定位与检测方法,具体包括以下步骤:
步骤S1:选取异常检测数据集,并仅以无异常的图片作为训练数据;
步骤S2:构建特征提取器,并从图片中提取L个多尺度图像特征作为多尺度标准化流模型的输入;
步骤S3:基于标准化流模型构建非对称的多尺度并行标准化流模型,并对步骤S2中提取出的多尺度图像特征进行编码得到对应的多尺度并行特征;
步骤S4:基于标准化流模型构建多尺度融合标准化流模型,并对步骤S3中提取出的多尺度并行特征进行特征融合,得到对应的多尺度融合特征;
步骤S5:在训练阶段,对步骤S4中编码得到的多尺度融合特征进行最大似然优化从而训练多尺度并行标准化流模型和多尺度融合标准化流模型这两个多尺度标准化流模型;
步骤S6:在测试阶段,通过训练后的多尺度标准化流模型对步骤S4中编码得到的多尺度融合特征进行整合,并且通过多尺度输出整合方案计算像素级别的异常定位分数图和图像级别的异常检测分数。
本发明还提供了一种基于多尺度标准化流的无监督异常定位与检测装置,所述装置为包括存储器和处理器的电子设备;
所述存储器,其上存储有计算机程序;
所述处理器,用于执行所述存储器中的所述计算机程序,以实现上述无监督异常定位与检测方法。
本发明还提供了一种基于多尺度标准化流的无监督异常定位与检测装置,所述装置为存储能实现上述无监督异常定位与检测方法的计算机程序的计算机可读存储介质。
本发明与现有技术相比,具有以下优点及有益效果。
(1)本发明提供的基于多尺度标准化流的无监督异常定位与检测方法,通过开发标准化流模型中的多尺度特性,并针对异常定位和异常检测两个任务设计不同的多尺度输出整合方案,增强了标准化流对异常区域大小多变性的泛化能力,提高了异常定位和检测性能。
(2)本发明提供的基于多尺度标准化流的无监督异常定位与检测方法,通过概率密度计算异常分数,在MVTecAD工业缺陷检测数据集上达到了99.7%的异常检测精度和98.8%的异常定位精度。
附图说明
图1为实施例6中基于多尺度标准化流的无监督异常定位与检测方法的主要环节的流程示意图。
图2为本发明所述基于多尺度标准化流的无监督异常定位与检测方法的网络框架图。
图3为本发明的多尺度融合标准化流模型的网络结构的示意图。
图4是具体实施方式中无异常的合格工业零件的图片。
图5是实施例9中异常定位检测的可视化结果。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
实施例1:
异常检测是计算视觉里新兴的研究领域,它包含检测和定位两种功能。检测是图像的分类,区分正常异常样本;定位是图像像素的分割,定位异常区域。本领域中,实现异常检测的技术和实现异常定位的技术也通称为异常检测技术。
现有的异常检测技术中,基于概率密度估计的方法在效果和实时性上优于基于重建的方法和基于聚类的方法。但是面对不可预知、具有高度不确定性的异常样本,由于异常样本中异常区域大小多变性问题,限制了传统的标准化流模型的检测性能,导致传统的标准化流模型泛化能力较弱。泛化能力:英文名称是Generalization Ability,是指机器学习算法对新鲜样本的适应能力。学习的目的是学到隐含在数据背后的规律,对具有同一规律的学习集以外的数据,经过训练的网络也能给出合适的输出,该能力称为泛化能力。
基于上述技术背景,本实施例提供一种基于多尺度标准化流的无监督异常定位与检测方法,先通过构建的多尺度标准化流模型获取图片的多尺度融合特征;再分别针对异常定位任务、异常检测任务设置不同的多尺度输出整合方案;最后由多尺度融合特征作为多尺度输出整合方案的输入计算得到用于异常定位分析的异常定位分数图和用于异常检测分析的异常检测分数,实现对输入图片的异常定位与检测。
首先,本实施例通过构建的多尺度标准化流模型获取图片的多尺度融合特征,捕捉输入图片的不同尺度的空间结构化信息,以解决异常样本中异常区域大小多变性问题。
不同尺度的空间结构化信息能够增强异常检测模型对不同大小的异常区域的感知能力,从而提高异常检测模型对异常区域大小多变性的泛化能力。
其次,本实施例所述方法既能实现异常检测又能实现异常定位。异常检测,旨在判定输入图片是否包含异常,对于一张输入图片只有一个异常得分。异常定位,旨在对输入图片中的异常区域进行定位,输出为和输入图片大小一样的异常分值图。因此,异常检测和异常定位两个任务之间的故有差距。
针对图像级异常检测任务,通过乘法对不同尺度的异常概率图进行整合,能够过滤掉单一尺度的异常概率图中的噪声;针对异常定位任务,通过加法对不同尺度的异常概率图进行整合,能够更好地保存对不同尺度感知能力。
再者,本实施例所述方法是一种无监督异常检测方法,旨在不花费大量的人力物力对异常图片进行标记,仅通过收集到的无异常图片训练神经网络模型,最终判定输入图片是否存在异常。本实施例采用无异常图片进行训练的无监督异常检测方法,不同于有监督异常检测方法,也不同于半监督异常检测方法。其中,训练采用的训练神经网络模型是多尺度标准化流模型。多尺度标准化流模型,英文名称是Multi-scale Flow-based Model,简称MSFlow。本实施例所述MSFlow,通过多尺度模型设计优化了标准化流模型的多尺度感知能力。
综合上述内容,本实施例提供的异常检测方法是一种基于多尺度标准化流的无监督异常定位与检测方法。所述方法先基于标准化流模型构建多尺度标准化流模型,实现对图片的多个尺度的空间结构信息进行交互融合;再针对异常定位任务、异常检测任务设置不同的多尺度输出整合方案,最终获得用于异常定位分析的异常定位分数图和用于异常检测分析的异常检测分数,实现对输入图片的异常定位与检测。更确切地,本实施例所述方法的内在逻辑是先进行异常区域的定位,若定位到异常区域则判定输入图片存在异常,若未定位到异常区域则判定输入图片不存在异常。
本实施例所述方法通过构建多尺度标准化流模型和设置不同的多尺度输出整合方案两个主要技术手段对现有方法进行优化设计,解决了现有技术中基于概率密度估计的方法存在的异常样本中异常区域大小多变而导致异常检测与定位准确率较低的问题,提高了标准化流模型对于异常区域大小多变性的泛化能力。
实施例2:
本实施例在实施例1的基础上,进一步提供了一种通过构建多尺度标准化流模型获取图片的多尺度融合特征的具体实现方式。本实施例中,基于标准化流模型构建非对称的多尺度并行标准化流模型和多尺度融合标准化流模型这两个多尺度标准化流模型;利用构建的特征提取器提取图片的L个多尺度图像特征,并将L个多尺度图像特征作为多尺度标准化流模型的输入,L为不小于2的正整数;多尺度图像特征依次经多尺度并行标准化流模型、多尺度融合标准化流模型编码后得到对应的多尺度融合特征。
本实施例的一个关键技术手段是借助特征提取器提取图片的L个多尺度图像特征。在特征提取器中,不同阶段的输出对应了不同尺度。因此,通过对特征提取器不同阶段的输出的选取就能实现多尺度特征的提取。
从获取输入图片的空间结构化信息这个技术手段分析,只要获取两个或两个以上尺度的图像特征都可以获取输入图片的空间结构化信息。但是,由于第四阶段的输出只包含语义信息,并没有空间结构化信息,因此第四阶段对于异常检测与定位这个任务是不必要的。因此,实际应用时通常采用获取2个尺度的图像特征或获取3个尺度的图像特征的技术方案,即所述L取2或3。
本实施例的另一个关键技术手段是基于标准化流模型构建非对称的多尺度并行标准化流模型和多尺度融合标准化流模型这两个多尺度标准化流模型,用于执行后续的异常定位和异常检测任务。
在另一具体实施例中,所述多尺度并行标准化流模型的构建方法如下:先搭建由两个核大小为3的卷积网络以及ReLU激活函数组合而成的网络,将其作为线性耦合层的子网络并构建具有线性耦合层的标准化流模块;再将个标准化流模块堆叠成标准化流模型的第i个模型分支,其中:1≦i≦L,﹤且、、i均为正整数;然后将L个模型分支按顺序组合,得到分支并行且独立的并行标准化流模型,即非对称的多尺度并行标准化流模型。
在另一具体实施例中,所述多尺度融合标准化流模型的构建方法如下:先搭建由两个核大小为3的卷积网络以及ReLU激活函数组合而成的网络,将其作为线性耦合层的子网络并构建多尺度融合标准化流模型。
本实施例的其他部分与实施例1相同,故不再赘述。
实施例3:
本实施例在实施例1的基础上,进一步提供了一种针对异常定位任务、异常检测任务设置不同的多尺度输出整合方案的具体实现方式。
针对异常定位任务设置的多尺度输出整合方案,是采用将不同尺度的输出相加的方式得到异常定位概率密度函数,再通过概率密度估计的方法计算得到异常定位分数;
针对异常检测任务设置的多尺度输出整合方案,是先采用将不同尺度的输出相乘的方式得到异常检测概率密度函数,再通过概率密度估计的方法计算得到异常检测分数图,最后从异常检测分数图中选择最大的K个分值取平均得到异常检测分数;K为不小于1的正整数。
本实施例中首次基于概率密度估计提出乘法整合方案,其中单一尺度的异常分数图是通过概率密度估计的方式获取的。另一方面,异常检测分值代表整张图片是否包含异常,因此需要将异常分值图整合成一个分值。以前的方法或取最大值,或取平均。取最大值很容易收到噪音影响;取平均则对异常的感知敏感性差。本实施例所提出的topK算法结合了以上两种方案,弥补了他们所存在的缺陷。
本实施例的其他部分与实施例1或实施例2相同,故不再赘述。
实施例4:
本实施例在实施例1-实施例3任一项的基础上,对基于多尺度标准化流的无监督异常定位与检测方法进行详细说明。所述方法分为训练阶段和测试阶段。
所述训练阶段,具体是指:先选取异常检测数据集并仅以无异常的图片作为训练数据;接着利用构建的特征提取器从图片中提取L个多尺度图像特征;再将L个多尺度图像特征依次输入构建的多尺度并行标准化流模型和多尺度融合标准化流模型中得到多尺度融合特征;然后对多尺度融合特征进行最大似然优化从而训练多尺度并行标准化流模型和多尺度融合标准化流模型这两个多尺度标准化流模型;
所述测试阶段,具体是指:先输入待分析的图片;接着利用构建的特征提取器从图片中提取L个多尺度图像特征;再将L个多尺度图像特征依次输入构建的多尺度并行标准化流模型和多尺度融合标准化流模型中得到多尺度融合特征;然后根据多尺度输出整合方案对多尺度融合特征进行整合;最后计算得到异常定位分数图和异常检测分数。
本实施例的其他部分与实施例1-实施例3任一项相同,故不再赘述。
实施例5:
本实施例在实施例1-实施例4任一项的基础上,对基于多尺度标准化流的无监督异常定位与检测方法进行详细说明。
如图1所示,本实施例所述方法包括:选择训练数据集、构建基于预训练的特征提取器提取多尺度图像特征、构建多尺度并行标准化流模型、构建多尺度融合标准化流模型、使用损失函数训练网络、多尺度特征图融合并验证网络效果这六大环节。
所述方法具体包括以下步骤。
步骤S1:选取异常检测数据集,并仅以无异常的图片作为训练数据。
其中,异常检测数据集可以选择工业缺陷检测数据集,如:MVTec AD数据集、MTD数据集、BTAD数据集、AITEX数据集等,在工业产品视觉检测中用于检测产品缺陷。异常检测数据集可以选择医学病灶检测数据集,如:COVIDx数据集、HeadCT数据集、BrainMRI数据集、Hyper-Kvasir等,在数字医疗领域用于确认核磁共振图像中异常部位等。异常检测数据集还可以选择其他数据集,适用于不同的异常检测需求。
多阶段特征提取器实际上就是常规特征提取器,只是在不同阶段提取出特征。其中,“阶段”通常定义为Stage,就是在特征提取器中预先定义的模型层级。例如:ResNet50就有stage0到stage4多个阶段。
在另一具体实施例中,所述步骤S2具体包括以下步骤。
步骤S21:首先通过预训练的特征提取器对输入图片进行特征编码,并且提取出其中个阶段的多尺度输出特征;其中:表示图片的高, 表示图片的宽,表示特征提取器中第 个阶段特征的通道数; 表示特征提取器中第个阶段特征的高度; 表示特征提取器中第个阶段特征的宽度。
所述步骤S22中,通过“核大小为3且步长为2的平均池化层”进行特征下采样,能够减小每个尺度特征的空间大小,减少计算量,并且进一步扩大每个尺度特征的感受野。
在另一具体实施例中,所述步骤S3具体包括以下步骤。
步骤S32:构建非对称的多尺度并行标准化流模型;多尺度并行标准化流模型包含个分支并行且独立的并行标准化流模型, 表示第i个阶段特征输出对应的并行标准化流模型。其中由个步骤S32中所构建的标准化流模块堆叠而成,且 <。
在另一具体实施例中,所述步骤S4具体包括以下步骤。
在另一具体实施例中,所述步骤S5具体包括以下步骤。
在另一具体实施例中,所述步骤S6具体包括以下步骤。
步骤S64:针对异常检测任务,对步骤S62中计算得到的概率密度图通过相乘的方式得到乘性整合概率密度图,并且计算异常检测分数图,其中是中的最大值;进一步地,在异常检测分数图中选择最大的 个分值,并且对这 个分值取平均得到图像级别的异常检测分数 。其中, 是超参,人工设定,topK中的K的设置。
按异常分数图中所有位置的异常分值大小排序,选取异常分值较大的前K个分值。K一般根据图像大小变化而变化,例如图像大小为(H,W),则K选取为H*W*0.05,即前5%的最大值。
本实施例的其他部分与实施例1-实施例4任一项相同,故不再赘述。
实施例6:
本实施例在实施例5的基础上,以对MVTec AD数据集中的15类工业零件进行缺陷检测与定位为例,基于3个尺度特征提取方案,即L=3,采用一种基于多尺度标准化流的无监督异常定位与检测方法对这15类工业零件进行缺陷检测与定位。
所述基于多尺度标准化流的无监督异常定位与检测方法的网络框架图,如图2所示。所述方法具体步骤如下。
步骤S1:选取工业缺陷检测数据集中的MVTec AD数据集作为异常检测数据集,并仅以无异常的合格工业零件图片作为训练数据。无异常的合格工业零件图片如图4所示。
MVTec AD数据集包含15个工业零件类别,其中有10种工业物品和5种工业纹理,一共有3629张无异常图片用来训练,1725张包含无异常和异常的图片用来测试。MVTec AD的测试集中包含了各种各样的异常类型,异常区域大小多样,是一个非常具有挑战性的数据集。
在另一具体实施例中,所述步骤S2具体包括以下步骤。
步骤S21:首先通过预训练的ResNet四阶段特征提取器 输入图片进行特征编码,并且提取出其中的第1阶段、第2阶段、第3阶段共3个阶段的多尺度输出特征 ;其中:表示图片的高,表示图片的宽, 表示特征提取器中第 个阶段特征的通道数; 表示特征提取器中第个阶段特征的高度;表示特征提取器中第个阶段特征的宽度。
步骤S22:对步骤S21提取出的3个阶段的多尺度输出特征,通过核大小为3且步长为2的平均池化层进行特征下采样,从而得到多尺度图像特征。其中,表示特征提取器中第i个阶段的特征。此时,也可以表示为 ;表示特征提取器中第1个阶段的特征; 表示特征提取器中第2个阶段的特征;表示特征提取器中第3个阶段的特征。
在另一具体实施例中,所述步骤S3具体包括以下步骤。
步骤S31:构建基于线性耦合层的标准化流模块 。标准化流模块的线性耦合层中的子网络都是由两个核大小为3的卷积网络以及ReLU激活函数组合而成。基于线性耦合层的标准化流模型本身属于现有技术,本实施例仅利用此现有技术构建多尺度并行标准化流模型和多尺度融合标准化流模型,故不对基于线性耦合层的标准化流模型本身进行赘述。
步骤S32:构建非对称的多尺度并行标准化流模型 。多尺度并行标准化流模型包含3个分支并行且独立的并行标准化流模型, 表示第i个阶段特征输出对应的并行标准化流模型。此时,也可以表示为; 表示第1个阶段特征输出对应的并行标准化流模型;表示第2个阶段特征输出对应的并行标准化流模型;表示第3个阶段特征输出对应的并行标准化流模型。其中由2个步骤S32中所构建的标准化流模块 堆叠而成,由5个步骤S32中所构建的标准化流模块 堆叠而成,由8个步骤S32中所构建的标准化流模块堆叠而成。
步骤S33:通过步骤S32中构建的并行标准化流模型 对步骤S2中提取到的多尺度图像特征 分别进行特征编码,得到3个分支独立编码的多尺度并行特征。其中 表示多尺度并行标准化流的第i个分值的输出,对应到特征提取器中第i个阶段。此时,也可以表示为 ;表示多尺度并行标准化流的第1个分值的输出; 表示多尺度并行标准化流的第2个分值的输出; 表示多尺度并行标准化流的第3个分值的输出。
在另一具体实施例中,所述步骤S4具体包括以下步骤。
步骤S44:对步骤S43中得到的融合特征 沿特征维度进行分割并且通过双线性插值对分割后的特征进行缩放,得到分割特征 ; 表示第i个分割后的特征,对应到特征提取器中第i个阶段。其中, 与步骤S3中编码得到的 特征维度保持一致。
在另一具体实施例中,所述步骤S5具体包括以下步骤。
步骤S52:基于步骤S51所计算的概率密度损失函数 ,通过梯度优化器对步骤S3中所构建的非对称的多尺度并行标准化流模型 和步骤S4中所构建的多尺度融合标准化流模型 进行训练。其中,Adam优化器的超参设置为:学习率le-4,用于计算梯度的运行平均值的系数 ,用于计算梯度平方的运行平均值的系数 。
在另一具体实施例中,所述步骤S6具体包括以下步骤。
步骤S64:针对异常检测任务,对步骤S62中计算得到的概率密度图通过相乘的方式得到乘性整合概率密度图 ,并且计算异常检测分数图,其中是中的最大值;进一步地,在异常检测分数图中选择最大的个分值,并且对这个分值取平均得到图像级别的异常检测分数 。
本实施例的其他部分与实施例5相同,故不再赘述。
实施例7:
本实施例在实施例5的基础上,以对MVTec AD数据集中的15类工业零件进行缺陷检测与定位为例,基于2个尺度特征提取方案,即L=2,采用一种基于多尺度标准化流的无监督异常定位与检测方法对这15类工业零件进行缺陷检测与定位。
所述方法具体步骤如下。
步骤S1:选取工业缺陷检测数据集中的MVTec AD数据集作为异常检测数据集,并仅以无异常的合格工业零件图片作为训练数据。无异常的合格工业零件图片如图4所示。
MVTec AD数据集包含15个工业零件类别,其中有10种工业物品和5种工业纹理,一共有3629张无异常图片用来训练,1725张包含无异常和异常的图片用来测试。MVTec AD的测试集中包含了各种各样的异常类型,异常区域大小多样,是一个非常具有挑战性的数据集。
在另一具体实施例中,所述步骤S2具体包括以下步骤。
步骤S21:首先通过预训练的ResNet四阶段特征提取器输入图片进行特征编码,并且提取出其中的第2阶段、第3阶段2个阶段的多尺度输出特征;其中:表示图片的高,表示图片的宽,表示特征提取器中第个阶段特征的通道数; 表示特征提取器中第个阶段特征的高度; 表示特征提取器中第个阶段特征的宽度。
第2阶段、第3阶段的输出特征既包括了局部的细节信息,有包括更大的感受野,从而得到一个全局感知,两种信息子这两个阶段的特征中达到了一个很好的平衡。
在另一具体实施例中,所述步骤S3具体包括以下步骤。
步骤S32:构建非对称的多尺度并行标准化流模型 。多尺度并行标准化流模型 包含2个分支并行且独立的并行标准化流模型 ,其中 由5个步骤S32中所构建的标准化流模块 堆叠而成, 由8个步骤S32中所构建的标准化流模块 堆叠而成。
在另一具体实施例中,所述步骤S4具体包括以下步骤。
在另一具体实施例中,所述步骤S5具体包括以下步骤。
步骤S52:基于步骤S51所计算的概率密度损失函数 ,通过梯度优化器对步骤S3中所构建的非对称的多尺度并行标准化流模型 和步骤S4中所构建的多尺度融合标准化流模型 进行训练。其中,Adam优化器的超参设置为:学习率le-4,用于计算梯度的运行平均值的系数 ,用于计算梯度平方的运行平均值的系数 。
在另一具体实施例中,所述步骤S6具体包括以下步骤。
步骤S64:针对异常检测任务,对步骤S62中计算得到的概率密度图 通过相乘的方式得到乘性整合概率密度图 ,并且计算异常检测分数图,其中 是 中的最大值;进一步地,在异常检测分数图 中选择最大的 个分值,并且对这 个分值取平均得到图像级别的异常检测分数 。
本实施例的其他部分与实施例5相同,故不再赘述。
实施例8:
本实施例在实施例5的基础上,以对MVTec AD数据集中的15类工业零件进行缺陷检测与定位为例,基于4个尺度特征提取方案,即L=4,采用一种基于多尺度标准化流的无监督异常定位与检测方法对这15类工业零件进行缺陷检测与定位。
具体步骤如下。
步骤S1:选取工业缺陷检测数据集中的MVTec AD数据集作为异常检测数据集,并仅以无异常的合格工业零件图片作为训练数据。无异常的合格工业零件图片如图4所示。
MVTec AD数据集包含15个工业零件类别,其中有10种工业物品和5种工业纹理,一共有3629张无异常图片用来训练,1725张包含无异常和异常的图片用来测试。MVTec AD的测试集中包含了各种各样的异常类型,异常区域大小多样,是一个非常具有挑战性的数据集。
在另一具体实施例中,所述步骤S2具体包括以下步骤。
步骤S21:首先通过预训练的EfficientNet九阶段特征提取器 输入图片进行特征编码,并且提取出其中的第3阶段、第4阶段、第5阶段、第7阶段4个阶段的多尺度输出特征;其中: 表示图片的高, 表示图片的宽, 表示特征提取器中第个阶段特征的通道数; 表示特征提取器中第个阶段特征的高度; 表示特征提取器中第个阶段特征的宽度。
在另一具体实施例中,所述步骤S3具体包括以下步骤。
步骤S32:构建非对称的多尺度并行标准化流模型 。多尺度并行标准化流模型 包含4个分支并行且独立的并行标准化流模型 ,其中 由2个步骤S32中所构建的标准化流模块 堆叠而成, 由5个步骤S32中所构建的标准化流模块 堆叠而成, 由8个步骤S32中所构建的标准化流模块 堆叠而成, 由11个步骤S32中所构建的标准化流模块 堆叠而成。需要说明的是, 中标准化流模块 数量不影响结果,因此无需限定,但为了输出确切结果进行分析,此处设定 由11个步骤S32中所构建的标准化流模块 堆叠而成。
在另一具体实施例中,所述步骤S4具体包括以下步骤。
在另一具体实施例中,所述步骤S5具体包括以下步骤。
步骤S52:基于步骤S51所计算的概率密度损失函数 ,通过梯度优化器对步骤S3中所构建的非对称的多尺度并行标准化流模型 和步骤S4中所构建的多尺度融合标准化流模型 进行训练。其中,Adam优化器的超参设置为:学习率le-4,用于计算梯度的运行平均值的系数 ,用于计算梯度平方的运行平均值的系数 。
在另一具体实施例中,所述步骤S6具体包括以下步骤。
步骤S64:针对异常检测任务,对步骤S62中计算得到的概率密度图 通过相乘的方式得到乘性整合概率密度图 ,并且计算异常检测分数图,其中 是 中的最大值;进一步地,在异常检测分数图 中选择最大的 个分值,并且对这 个分值取平均得到图像级别的异常检测分数 。
本实施例的其他部分与实施例5相同,故不再赘述。
实施例9:
所述基于多尺度标准化流的无监督异常定位与检测方法,简称MSFlow。
本实施例以如图4所示的MVTec AD数据集中的15类工业零件进行缺陷检测与定位为例,将实施例6中提取3个尺度特征的所述基于多尺度标准化流的无监督异常定位与检测方法与DRAEM、SSPCAB、RD4AD、PathCore、CFlow进行异常检测结果对比。
DRAEM模型:是一种发表于“DRAEM-A discriminatively trainedreconstruction embedding for surface anomaly detection”的基于异常生成的异常检测与定位方法。该方法通过在无异常的图像上人工生成“缺陷”,从而将无监督任务转变为全监督任务。
SSPCAB模型:是一种发表于“Self-Supervised Predictive ConvolutionalAttentive Block for Anomaly Detection”的自监督模块。这里的SSPCAB模型在DRAEM模型的基础上,通过这篇文章中所提出的自监督模块所构建的优化模型。
RD4AD模型:是一种发表于“Anomaly Detection via Reverse Distillationfrom One-Class Embedding”的基于知识蒸馏异常检测与定位方法。该方法通过反向蒸馏的网络架构和知识蒸馏的损失函数来实现无监督异常检测与定位。
PathCore模型:是一种发表于“Towards Total Recall in Industrial AnomalyDetection”的基于聚类算法的异常检测与定位方法。该方法通过对正常图像所提取出的特征进一步进行聚类,从而抑制噪点影响并且提升了检测精度和效率。
CFlow模型:是一种发表于“CFLOW-AD: Real-Time Unsupervised AnomalyDetection with Localization via Conditional Normalizing Flows”的基于标准化流的异常检测与定位方法。该方法通过标准化流模型对每个像素点的特征分别编码,实现了异常定位。
图像级别异常检测精度对比表如表1所示:
表1
从表1可以看出,实施例6所提出的MSFlow方法在MVTec AD数据集所包含的所有类别上都达到了很好的检测效果,并且在其中10类纹理或物品上都达到了100%的检测精度。对于MVTec AD数据集所有类别的平均检测精度也实现了高达99.7%的检测精度。
像素级别异常检测精度对比表如表2所示:
表2
从表2可以看出,实施例6所提出的MSFlow方法在MVTec AD数据集所包含的许多类别上都达到最优的定位效果。对于MVTec AD数据集所有类别的平均检测精度也实现了高达98.8%的定位精度,具有很强的可应用性。
综上,实施例6提供的基于多尺度标准化流的无监督异常定位与检测方法,通过概率密度计算异常分数,在MVTecAD工业缺陷检测数据集上达到了99.7%的异常检测精度和98.8%的异常定位精度。而且,实施例6所提出的MSFlow方法进行异常定位检测的可视化结果如图5所示,其中百分数表示缺陷位置相对于整张图片的占比,从图中也可以看出实施例6所提出的MSFlow方法对于缺陷的大小有很强的泛化能力,对各种大小的缺陷能进行高精度的定位与检测。
实施例10:
本实施例在实施例1-实施例8任一项的基础上,公开了一种基于多尺度标准化流的无监督异常定位与检测装置。
所述装置为包括存储器和处理器的电子设备;
所述存储器,其上存储有计算机程序;
所述处理器,用于执行所述存储器中的所述计算机程序,以实现实施例1-实施例8中任一项所述方法。
实施例11:
本实施例在实施例1-实施例8任一项的基础上,公开了一种基于多尺度标准化流的无监督异常定位与检测装置。
所述装置为存储能实现实施例1-实施例8中任一项所述方法的计算机程序的计算机可读存储介质。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,凡依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化,均落入本发明的保护范围之内。
Claims (6)
1.基于多尺度标准化流的无监督异常定位与检测方法,其特征在于,先通过构建的多尺度标准化流模型获取图片的多尺度融合特征;再分别针对异常定位任务、异常检测任务设置不同的多尺度输出整合方案;最后由多尺度融合特征作为多尺度输出整合方案的输入计算得到用于异常定位分析的异常定位分数图和用于异常检测分析的异常检测分数,实现对输入图片的异常定位与检测;
针对异常定位任务设置的多尺度输出整合方案,是采用将不同尺度的输出相加的方式得到异常定位概率密度函数,再通过概率密度估计的方法计算得到异常定位分数;
针对异常检测任务设置的多尺度输出整合方案,是先采用将不同尺度的输出相乘的方式得到异常检测概率密度函数,再通过概率密度估计的方法计算得到异常检测分数图,最后从异常检测分数图中选择最大的K个分值取平均得到异常检测分数;K为不小于1的正整数;
所述通过构建多尺度标准化流模型获取图片的多尺度融合特征,具体是指:基于标准化流模型构建非对称的多尺度并行标准化流模型和多尺度融合标准化流模型这两个多尺度标准化流模型;利用构建的特征提取器提取图片的L个多尺度图像特征,并将L个多尺度图像特征作为多尺度标准化流模型的输入,L为不小于2的正整数;多尺度图像特征依次经多尺度并行标准化流模型、多尺度融合标准化流模型编码后得到对应的多尺度融合特征;
所述多尺度并行标准化流模型的构建方法如下:先搭建由两个核大小为3的卷积网络以及ReLU激活函数组合而成的网络,将其作为线性耦合层的子网络并构建具有线性耦合层的标准化流模块;再将ki个标准化流模块堆叠成标准化流模型的第i个模型分支,其中:1≤i≤L,ki<ki+1且ki、ki+1、i均为正整数;然后将L个模型分支按顺序组合,得到分支并行且独立的并行标准化流模型,即非对称的多尺度并行标准化流模型;
所述多尺度融合标准化流模型的构建方法如下:先搭建由两个核大小为3的卷积网络以及ReLU激活函数组合而成的网络,将其作为线性耦合层的子网络并构建多尺度融合标准化流模型。
2.根据权利要求1所述的基于多尺度标准化流的无监督异常定位与检测方法,其特征在于,所述方法分为训练阶段和测试阶段;
所述训练阶段,具体是指:先选取异常检测数据集并仅以无异常的图片作为训练数据;接着利用构建的特征提取器从图片中提取L个多尺度图像特征;再将L个多尺度图像特征依次输入构建的多尺度并行标准化流模型和多尺度融合标准化流模型中得到多尺度融合特征;然后对多尺度融合特征进行最大似然优化从而训练多尺度并行标准化流模型和多尺度融合标准化流模型这两个多尺度标准化流模型;
所述测试阶段,具体是指:先输入待分析的图片;接着利用构建的特征提取器从图片中提取L个多尺度图像特征;再将L个多尺度图像特征依次输入构建的多尺度并行标准化流模型和多尺度融合标准化流模型中得到多尺度融合特征;然后根据多尺度输出整合方案对多尺度融合特征进行整合;最后计算得到异常定位分数图和异常检测分数。
3.根据权利要求1所述的基于多尺度标准化流的无监督异常定位与检测方法,其特征在于,所述L取2或3。
4.根据权利要求1-3任一项所述的基于多尺度标准化流的无监督异常定位与检测方法,其特征在于,所述方法具体包括以下步骤:
步骤S1:选取异常检测数据集,并仅以无异常的图片作为训练数据;
步骤S2:构建特征提取器,并从图片中提取L个多尺度图像特征作为多尺度标准化流模型的输入;
步骤S3:基于标准化流模型构建非对称的多尺度并行标准化流模型,并对步骤S2中提取出的多尺度图像特征进行编码得到对应的多尺度并行特征;
步骤S4:基于标准化流模型构建多尺度融合标准化流模型,并对步骤S3中提取出的多尺度并行特征进行特征融合,得到对应的多尺度融合特征;
步骤S5:在训练阶段,对步骤S4中编码得到的多尺度融合特征进行最大似然优化从而训练多尺度并行标准化流模型和多尺度融合标准化流模型这两个多尺度标准化流模型;
步骤S6:在测试阶段,通过训练后的多尺度标准化流模型对步骤S4中编码得到的多尺度融合特征进行整合,并且通过多尺度输出整合方案计算像素级别的异常定位分数图和图像级别的异常检测分数。
5.基于多尺度标准化流的无监督异常定位与检测装置,其特征在于,所述装置为包括存储器和处理器的电子设备;
所述存储器,其上存储有计算机程序;
所述处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-4中任一项所述方法。
6.基于多尺度标准化流的无监督异常定位与检测装置,其特征在于,所述装置为存储能实现权利要求1-4中任一项所述方法的计算机程序的计算机可读存储介质。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211118934.6A CN115205650B (zh) | 2022-09-15 | 2022-09-15 | 基于多尺度标准化流的无监督异常定位与检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211118934.6A CN115205650B (zh) | 2022-09-15 | 2022-09-15 | 基于多尺度标准化流的无监督异常定位与检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115205650A CN115205650A (zh) | 2022-10-18 |
CN115205650B true CN115205650B (zh) | 2022-11-29 |
Family
ID=83572433
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211118934.6A Active CN115205650B (zh) | 2022-09-15 | 2022-09-15 | 基于多尺度标准化流的无监督异常定位与检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115205650B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115937555A (zh) * | 2023-03-09 | 2023-04-07 | 厦门微亚智能科技有限公司 | 一种基于标准化流模型的工业缺陷检测算法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114332008A (zh) * | 2021-12-28 | 2022-04-12 | 福州大学 | 一种基于多层次特征重构的无监督缺陷检测与定位方法 |
CN114782694A (zh) * | 2022-06-21 | 2022-07-22 | 中国科学技术大学 | 无监督异常检测方法、系统、设备及存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021077376A (ja) * | 2019-11-07 | 2021-05-20 | ハイパーコネクト インコーポレイテッド | 画像変換装置及び方法、並びにコンピュータ読み取り可能な記録媒体 |
CN112036513B (zh) * | 2020-11-04 | 2021-03-09 | 成都考拉悠然科技有限公司 | 基于内存增强潜在空间自回归的图像异常检测方法 |
CN114332094B (zh) * | 2021-12-07 | 2024-09-24 | 海南大学 | 基于轻量级多尺度信息融合网络的语义分割方法及装置 |
CN114299040A (zh) * | 2021-12-30 | 2022-04-08 | 季华实验室 | 瓷砖瑕疵检测方法、装置和电子设备 |
CN114464159A (zh) * | 2022-01-18 | 2022-05-10 | 同济大学 | 一种基于半流模型的声码器语音合成方法 |
CN114926754A (zh) * | 2022-04-18 | 2022-08-19 | 阿里巴巴达摩院(杭州)科技有限公司 | 图像检测方法、存储介质及处理器 |
-
2022
- 2022-09-15 CN CN202211118934.6A patent/CN115205650B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114332008A (zh) * | 2021-12-28 | 2022-04-12 | 福州大学 | 一种基于多层次特征重构的无监督缺陷检测与定位方法 |
CN114782694A (zh) * | 2022-06-21 | 2022-07-22 | 中国科学技术大学 | 无监督异常检测方法、系统、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115205650A (zh) | 2022-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lee et al. | AnoViT: Unsupervised anomaly detection and localization with vision transformer-based encoder-decoder | |
CN110889852B (zh) | 基于残差-注意力深度神经网络的肝脏分割方法 | |
CN111738363B (zh) | 基于改进的3d cnn网络的阿尔茨海默病分类方法 | |
Chen et al. | SNIS: A signal noise separation-based network for post-processed image forgery detection | |
CN112862830B (zh) | 一种多模态图像分割方法、系统、终端及可读存储介质 | |
CN114708255B (zh) | 一种基于TransUNet模型的多中心儿童X线胸片图像肺部分割方法 | |
CN111524117A (zh) | 一种基于特征金字塔网络的隧道表面缺陷检测方法 | |
CN117078930A (zh) | 基于边界感知和注意力机制的医学图像分割方法 | |
Zhu et al. | ECFNet: A Siamese network with fewer FPs and fewer FNs for change detection of remote-sensing images | |
CN116563285B (zh) | 一种基于全神经网络的病灶特征识别与分割方法及系统 | |
CN115205650B (zh) | 基于多尺度标准化流的无监督异常定位与检测方法及装置 | |
Li et al. | Multi-Scale Fusion Siamese Network Based on Three-Branch Attention Mechanism for High-Resolution Remote Sensing Image Change Detection | |
CN117523350A (zh) | 基于多模态特征的口腔影像识别方法、系统及电子设备 | |
CN111223113B (zh) | 基于双重密集上下文感知网络的核磁共振海马体分割算法 | |
CN112381818A (zh) | 面向亚类疾病的医学图像识别增强方法 | |
CN117253034A (zh) | 一种基于差异化上下文的图像语义分割方法及系统 | |
Adegun et al. | Deep convolutional network-based framework for melanoma lesion detection and segmentation | |
Ikeda et al. | RGB-D salient object detection using saliency and edge reverse attention | |
Patnaik et al. | Remote Sensing Single-Image Super-Resolution Using Convolutional Block Attention Residual Network With Joint Adversarial Mechanisms | |
CN114821524A (zh) | 一种基于BiSeNet的轨道交通道路识别优化方法 | |
CN114529794A (zh) | 一种红外与可见光图像融合方法、系统及介质 | |
Li et al. | ESR-DMNet: Enhanced super-resolution-based dual-path metric change detection network for remote sensing images with different resolutions | |
CN116912183B (zh) | 一种基于边缘引导和对比损失的深度修复图像的篡改定位方法及系统 | |
Qiao et al. | DeepSEM-Net: Enhancing SEM defect analysis in semiconductor manufacturing with a dual-branch CNN-Transformer architecture | |
CN118154906B (zh) | 基于特征相似性和多尺度边缘注意力的图像篡改检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |