CN117036266A - 一种基于知识蒸馏的工业图像异常检测方法及系统 - Google Patents
一种基于知识蒸馏的工业图像异常检测方法及系统 Download PDFInfo
- Publication number
- CN117036266A CN117036266A CN202310958108.0A CN202310958108A CN117036266A CN 117036266 A CN117036266 A CN 117036266A CN 202310958108 A CN202310958108 A CN 202310958108A CN 117036266 A CN117036266 A CN 117036266A
- Authority
- CN
- China
- Prior art keywords
- network
- image
- teacher
- industrial
- anomaly detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 90
- 238000013140 knowledge distillation Methods 0.000 title claims abstract description 74
- 230000002159 abnormal effect Effects 0.000 claims abstract description 40
- 238000012549 training Methods 0.000 claims abstract description 25
- 238000005457 optimization Methods 0.000 claims abstract description 10
- 230000008014 freezing Effects 0.000 claims abstract description 4
- 238000007710 freezing Methods 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 35
- 238000005070 sampling Methods 0.000 claims description 26
- 238000012795 verification Methods 0.000 claims description 11
- 238000007781 pre-processing Methods 0.000 claims description 10
- 238000009826 distribution Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 4
- 238000004140 cleaning Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000012800 visualization Methods 0.000 claims description 3
- 238000013527 convolutional neural network Methods 0.000 claims description 2
- 230000010339 dilation Effects 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 238000011176 pooling Methods 0.000 claims description 2
- 238000004821 distillation Methods 0.000 claims 2
- 238000010200 validation analysis Methods 0.000 claims 1
- 230000005856 abnormality Effects 0.000 abstract description 10
- 238000000034 method Methods 0.000 description 9
- 238000000605 extraction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 230000008034 disappearance Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及异常检测技术领域,更具体地,涉及一种基于知识蒸馏的工业图像异常检测方法及系统,包括以下步骤:将所述源域数据集输入教师网络进行训练优化,获得完成优化的教师网络并对其进行冻结;构建下采样学生网络和上采样学生网络,由冻结的教师网络、所述下采样学生网络和所述上采样学生网络构成双分支知识蒸馏网络;将所述工业数据集输入所述双分支知识蒸馏网络,通过最小化异常检测损失函数输出的函数值,获得完成优化的双分支知识蒸馏网络;将待检测图像输入至完成优化的双分支知识蒸馏网络,通过异常检测得分函数计算待检测图像的异常得分,若所述异常得分小于预设值,则判定待检测图像为正常图像,否则,判定待检测图像为异常图像。
Description
技术领域
本发明涉及图像异常检测技术领域,更具体地,涉及一种基于知识蒸馏的工业图像异常检测方法及系统。
背景技术
目前工业现场的异常检测一般根据异常特征信息,人为地设计每种异常的识别算法,一般使用图像滤波,形态学操作,图像二值化处理,边缘计算等,使用传统的工业异常检测算法一般可调整不同的参数从而实现较快速地识别异常,但是存在以下缺点:每一种具有不同特征的异常都需要对其单独地设计识别算法;泛化能力差,对成像要求高,当背景信息改变时需要及时地对算法的参数进行调整以实现最佳的检测效果。
为了克服上述缺点,现有技术采用无监督异常检测方法进行异常检测,现有的无监督异常检测方法主要通过使用具有强特征提取能力的特征提取模块提取正常样本在特征空间中的特征表示并将其保存,再使用KNN方法通过计算待测样本与所保存的正常样本在特征空间中的欧式距离作为异常评价指标。但是该方法面临着存储正常样本的特征表示需耗费额外空间,并且KNN算法检测时间长的问题,导致该算法的稳定性与快速性上无法得到保障;这种异常检测方法,虽然在较少正常样本的情况下能够有效的进行检测,但在正常样本数量大时,由于每一次检测时都需计算待测样本与所存储的正常样本特征在特征空间中的距离,因此检测速度随着正常样本数量的提高反而降低。因此现有技术在正常样本多的情况下进行工业异常检测存在计算速度慢,占用资源多,对环境的硬件要求高等问题。同时由于每种异常之间的检测网络相互独立,使用到的数据集的构成需要保证每种异常的数量,若异常样本种类数量不平衡,方法获得的检测结果的精准度则会不高。
发明内容
本发明为克服上述现有技术所述的工业异常检测技术中存在计算速度慢、占用资源多,且当异常样本种类数量不平衡时检测精准度低的缺陷,提供一种数据集易得且能实现快速精准检测的基于知识蒸馏的工业图像异常检测方法及系统。
为解决上述技术问题,本发明的技术方案如下:
一种基于知识蒸馏的工业图像异常检测方法,包括以下步骤:
S1:采集若干已知标签的源域图像和若干工业图像并进行预处理,分别组成源域数据集和工业数据集;
S2:将所述源域数据集输入教师网络,获得完成优化的教师网络并对其进行冻结;
S3:构建下采样学生网络和上采样学生网络,由冻结的教师网络、所述下采样学生网络和所述上采样学生网络构成双分支知识蒸馏网络;
S4:将所述工业数据集输入所述双分支知识蒸馏网络,并根据所述双分支知识蒸馏网络输出的第一教师特征、第一下采样特征和第一上采样特征确定所述双分支知识蒸馏网络的异常检测损失函数Loss和异常检测得分函数Score;通过最小化所述异常检测损失函数Loss输出的损失值,获得完成优化的双分支知识蒸馏网络;
S5:将待检测图像输入至完成优化的双分支知识蒸馏网络,通过所述异常检测得分函数Score计算待检测图像的异常得分,若所述异常得分小于预设值,则判定待检测图像为正常图像,否则,判定待检测图像为异常图像。
优选地,本发明还提出了一种基于知识蒸馏的工业图像异常检测系统,应用于上述的基于知识蒸馏的工业图像异常检测方法。其中,基于知识蒸馏的工业图像异常检测系统,包括依次连接的采集模块、构建优化模块和异常检测模块:
采集模块,用于采集并预处理源域图像和工业图像;
构建优化模块,用于构建教师网络、下采样学生网络和上采样学生网络,进而构建双分支知识蒸馏网络;且用于根据采集模块输出的图像数据,优化所述教师网络和双分支知识蒸馏网络;
异常检测模块,其上配置有完成优化的双分支知识蒸馏网络,用于对待检测图像进行检测,输出异常检测结果。
与现有技术相比,本发明技术方案的有益效果是:
本发明通过经源域数据集训练好的教师网络,指导下采样学生网络和上采样学生网络,使其通过工业数据集学习到提取正常样本的特征的能力,只需提供易得的源域数据集和由正常样本构成的数据集,对数据集的要求低,无需受异常样本种类及数量的限制,可以对各种异常类型的图像进行精准检测,同时,无需存储正常样本的特征表示,计算速度快、占用资源少,可以实现快速检测出异常图像的目的。
附图说明
图1为实施例1的基于知识蒸馏的工业图像异常检测方法的流程示意图;
图2为实施例1的双分支知识蒸馏网络结构示意图;
图3为实施例2的基于知识蒸馏的工业图像异常检测系统的整体框架图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
本实施例提出一种基于知识蒸馏的工业图像异常检测方法及系统,如图1所示,为本实施例的基于知识蒸馏的工业图像异常检测方法的流程示意图。
本实施例提出的一种基于知识蒸馏的工业图像异常检测方法中,包括以下步骤:
S1:采集若干已知标签的源域图像和若干工业图像并进行预处理,分别组成源域数据集和工业数据集;
S2:将所述源域数据集输入教师网络,获得完成优化的教师网络并对其进行冻结;
S3:构建下采样学生网络和上采样学生网络,由冻结的教师网络、所述下采样学生网络和所述上采样学生网络构成双分支知识蒸馏网络;
S4:将所述工业数据集输入所述双分支知识蒸馏网络,并根据所述双分支知识蒸馏网络输出的第一教师特征、第一下采样特征和第一上采样特征确定所述双分支知识蒸馏网络的异常检测损失函数Loss和异常检测得分函数Score;通过最小化所述异常检测损失函数Loss输出的损失值,获得完成优化的双分支知识蒸馏网络;
S5:将待检测图像输入至完成优化的双分支知识蒸馏网络,通过所述异常检测得分函数Score计算待检测图像的异常得分,若所述异常得分小于预设值,则判定待检测图像为正常图像,否则,判定待检测图像为异常图像。
在具体实施过程中,本实施例在源域数据集上训练教师网络,使其具有强特征提取能力,将工业正常样本输入双分支知识蒸馏网络,通过教师网络指导下采样学生网络和上采样学生网络,使其学习到对正常样本的特征提取能力,而后,将待检测图像输入完成优化的双分支知识蒸馏网络,即可根据教师网络与学生网络输出的特征,计算待检测图像的异常得分,进而输出异常检测结果。
在一可选实施例中,对源域图像进行预处理的操作包括:图像的缩放、裁剪和归一化;对工业图像进行预处理的操作包括:清洗、去噪、标准化、人工筛选保留正常图像,以及将保留的正常图像以预设比例划分为工业训练集和工业验证集;其中,所述工业验证集中的工业图像通过人工标记带有已知标签,用于对所述双分支知识蒸馏网络进行优化训练。
作为示例性说明,所述源域数据集采用ImageNet,ImageNet是一个包含数百万张图片和数千个类别的庞大数据集,它涵盖了各种各样的物体和场景。
通过ImageNet数据集训练教师网络,能够使教师网络获得足够的特征提取能力。通过ImageNet,教师网络可以学习到丰富的图像特征和语义信息,从而具备更好的视觉理解能力,能够更好地捕捉和表示图像中的细节、纹理和语义信息,从而提高教师网络在工业图像异常检测任务的性能和泛化能力。
作为示例性说明,工业图像可以从工业现场或工业生产过程中采集;对工业图像进行清洗、去噪和标准化的预处理,可以确保图像质量和一致性,对人工筛选保留的正常图像通过旋转、翻转、剪切的操作增加数据样本,增强双分支知识蒸馏网络的泛化能力。
在一可选实施例中,如图2所示,为本实施例的双分支知识蒸馏网络结构示意图;所述教师网络包括宽残差网络,所述宽残差网络是包括四个模块的卷积神经网络;其中,每个模块包括若干卷积块,所述卷积块通过堆叠卷积层、批归一化、激活函数和残差连接构建;所述下采样学生网络采用与教师网络相同的宽残差网络,所述上采样学生网络采用与教师网络传播方式相反的宽残差网络。
作为示例性说明,所述宽残差网络采用WideResNet50;训练优化后的WideResNet50,可以在大规模图像数据集上学习到丰富特征的表示能力,能够更好地捕捉和表示图像中的细节、纹理和语义信息,提供高度抽象的特征表达,使得WideResNet50能够更好地刻画正常样本的特征分布,从而更准确地检测和识别异常情况。
采用与教师网络结构完全一致的WideResNet50作为下采样学生网络的基础网络。这样可以有效减少信息丢失,使得下采样学生网络提取到的正常图像的特征分布与教师网络更加相似。同时基于特征金字塔的思想,使双分支知识蒸馏网络中的各模块输出特征以互补的方式兼顾上下文语义信息和局部细节,有利于对工业图像进行更精确的异常检测。
使用与教师网络传播方式相反的上采样学生网络来解决激活差异消失问题,提高异常图像检测的有效性。上采样学生网络利用经过教师网络特征提取的输入数据流,能够获得与下采样学生网络不同的异常图像表示,从而更全面地表示异常图像。其中,上采样学生网络与下采样教师网络完全对称,可以确保上采样学生网络与下采样教师网络输出的特征表示具有相同的维度。
其中可选地,所述教师网络和所述下采样学生网络中,每个所述模块的输出端设置有步长为预设值的3×3卷积层,用于进行通道数翻倍及分辨率减半的下采样操作;所述上采样学生网络中,每个所述模块的输出端设置有步长为预设值的3×3反卷积层,用于进行通道数减半及分辨率翻倍的上采样操作。
作为示例性说明,步长的预设值为2。
本实施例中,将图像输入至教师网络和下采样学生网络,教师网络和下采样学生网络对输入图像进行如重复卷积的下采样操作,获得各个模块输出的特征,将教师网络输出的特征输入至上采样学生网络,上采样学生网络对输入的特征进行如重复反卷积的上采样操作,还原出分辨率更高的特征。
在一可选实施例中,所述源域数据集根据预设比例划分为源域训练集和源域验证集;其中,S2步骤包括:
S2.1:对教师网络进行优化训练前,在教师网络的第四模块之后添加全局平均池化层和全连接层;
S2.2:对教师网络进行优化训练时,将源域训练集输入教师网络,通过全连接层上的Softmax激活函数,将教师网络从源域训练集中提取到的特征归一化,输出类别概率分布,将类别概率分布输入交叉熵损失函数,通过最小化所述交叉熵损失函数输出的损失值,对所述教师网络的参数进行更新,获得完成优化的教师网络;其中,每当源域训练集对教师网络完成一次训练后,将源域验证集输入经训练的教师网络,验证经训练的教师网络的图像检测精度,当所述图像检测精度达到预设值时,停止对经训练的教师网络的参数更新
在一可选实施例中,所述工业数据集根据预设比例划分为工业训练集和工业验证集;其中,S4步骤包括:
S4.1:将工业训练集输入冻结的教师网络和下采样学生网络,分别获得第一教师特征和第一下采样特征;将部分第一教师特征输入上采样学生网络,获得第一上采样特征;
S4.2:根据所述第一教师特征、第一下采样特征和第一上采样特征,基于余弦相似度,计算上采样学生网络与冻结的教师网络间,以及下采样学生网络与冻结的教师网络间的特征距离Ωk(h,w):
式中,h和w分别表示或/>提取的对应特征的纵坐标和横坐标,/>和/>分别表示教师网络、上采样学生网络和下采样学生网络的第k模块提取的对应特征,其中,k为正整数;‖·‖表示欧几里德范数;
S4.3:根据特征距离Ωk(h,w)确定异常检测损失函数Loss:
式中,H和W分别表示每层特征的长和宽,K表示参与计算的特征对应的总模块数;
S4.4:根据特征距离Ωk(h,w)确定异常检测得分函数Score:
式中,Upsample(·)表示使用双线性插值法进行特征的像素扩张;Score∈(0,1)其中,Score越接近1表示输入的图像越有可能是异常图像,Score越接近0则表示待检测图像越有可能是正常图像;
S4.5:通过最小化所述异常检测损失函数Loss输出的损失值,对所述下采样学生网络和上采样学生网络的参数进行更新,获得经优化的双分支知识蒸馏网络;将工业验证集输入经优化的双分支知识蒸馏网络,进行n次优化训练,获得完成优化的双分支知识蒸馏网络,其中,n表示预设的正整数。
作为示例性说明,n=300,K=3;相比于使用教师网络的所有模块输出的特征进行学习,仅学习教师网络中的前三个模块输出的特征更有意义,因为从第四模块开始,模块输出的特征对应的感受野太大且分辨率太低,对于精确的异常定位反而起到反作用;因此,通过下采样学生网络的前三个模块输出的特征捕获教师网络的正态数据流形,从而确保学生网络能够更加准确地学习到正常样本的特征分布,并且能够在异常检测任务中取得更好的性能。
在本实施例中,设计了以余弦相似度为核心的损失函数。该损失函数的主要目的是在训练过程中保持一致性,使得异常计算函数与损失函数关联,从而避免由于不同的相似度计算函数引起的计算差异。同时,与欧式距离相比,余弦相似度可以在训练过程中避免梯度消失的问题。在高维空间中,欧式距离的导数会迅速趋近于零,导致梯度无法传播。而余弦相似度的导数在相似度接近1时仍然存在,不会出现梯度消失的情况,从而提高了双分支知识蒸馏网络的稳定性。
因为用于确定异常检测得分函数的特征距离的值的范围为[0,+∞),所以,根据余弦相似度确定的异常得分函数值的范围为[0,1]。
通过双线性插值进行特征的像素扩张,使特征距离的分辨率一致。
其中可选地,S4.1步骤中,输入上采样学生网络的部分第一教师特征,包括冻结的教师网络的第四模块输出的特征。
在本实施例中,上采样学生网络利用冻结的教师网络的第四模块输出的特征,还原冻结的教师网络的前三个模块输出的特征对应的分辨率更高的特征,从而更准确地还原图像中的物体区域。
在一可选实施例中,S5步骤包括:将待检测图像输入完成优化的双分支知识蒸馏网络中的冻结的教师网络和下采样学生网络,分别获得第二教师特征和第二下采样特征;将部分第二教师特征输入上采样学生网络,获得第二上采样特征,根据第二教师特征、第二下采样特征、第二上采样特征和异常检测得分函数Score计算待检测图像的异常得分,若所述异常得分小于预设值,则判定待检测图像为正常图像,否则,判定待检测图像为异常图像。
实施例2
本实施例提出一种基于知识蒸馏的工业图像异常检测系统,应用实施例1提出的一种基于知识蒸馏的工业图像异常检测方法。
如图3所示,为本实施例的基于知识蒸馏的工业图像异常检测系统的整体框架图。
所述基于知识蒸馏的工业图像异常检测系统,包括:
采集模块,用于采集并预处理源域图像和工业图像;
构建优化模块,用于构建教师网络、下采样学生网络和上采样学生网络,进而构建双分支知识蒸馏网络;且用于根据采集模块输出的图像数据,优化所述教师网络和双分支知识蒸馏网络;
异常检测模块,其上配置有完成优化的双分支知识蒸馏网络,用于对待检测图像进行检测,输出异常检测结果。
可选地,基于知识蒸馏的工业图像异常检测系统,还包括可视化模块,用于可视化地显示待检测图像及其对应的异常得分,并展示异常检测结果,能够使用户直观地获知异常检测结果,方便用户对系统进行操作。
可以理解,本实施例的系统应用于上述实施例1的方法,上述实施例1中的可选项同样适用于本实施例,故在此不再重复描述。
相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (10)
1.一种基于知识蒸馏的工业图像异常检测方法,其特征在于,包括以下步骤:
S1:采集若干已知标签的源域图像和若干工业图像并进行预处理,分别组成源域数据集和工业数据集;
S2:将所述源域数据集输入教师网络进行训练优化,获得完成优化的教师网络并对其进行冻结;
S3:构建下采样学生网络和上采样学生网络,由冻结的教师网络、所述下采样学生网络和所述上采样学生网络构成双分支知识蒸馏网络;
S4:将所述工业数据集输入所述双分支知识蒸馏网络,并根据所述双分支知识蒸馏网络输出的第一教师特征、第一下采样特征和第一上采样特征确定所述双分支知识蒸馏网络的异常检测损失函数Loss和异常检测得分函数Score;通过最小化所述异常检测损失函数Loss输出的损失值,获得完成优化的双分支知识蒸馏网络;
S5:将待检测图像输入至完成优化的双分支知识蒸馏网络,通过所述异常检测得分函数Score计算待检测图像的异常得分,若所述异常得分小于预设值,则判定待检测图像为正常图像,否则,判定待检测图像为异常图像。
2.根据权利要求1所述的基于知识蒸馏的工业图像异常检测方法,其特征在于,对源域图像进行预处理的操作包括:图像的缩放、裁剪和归一化;对工业图像进行预处理的操作包括:清洗、去噪、标准化、人工筛选保留正常图像,以及将保留的正常图像以预设比例划分为工业训练集和工业验证集;其中,所述工业验证集中的工业图像通过人工标记带有已知标签,用于对所述双分支知识蒸馏网络进行优化训练。
3.根据权利要求1所述的基于知识蒸馏的工业图像异常检测方法,其特征在于,所述教师网络包括宽残差网络,所述宽残差网络是包括四个模块的卷积神经网络;其中,每个模块包括若干卷积块,所述卷积块通过堆叠卷积层、批归一化、激活函数和残差连接构建;所述下采样学生网络采用与教师网络相同的宽残差网络,所述上采样学生网络采用与教师网络传播方式相反的宽残差网络。
4.根据权利要求3所述的基于知识蒸馏的工业图像异常检测方法,其特征在于,所述教师网络和所述下采样学生网络中,每个所述模块的输出端设置有步长为预设值的3×3卷积层,用于进行通道数翻倍及分辨率减半的下采样操作;所述上采样学生网络中,每个所述模块的输出端设置有步长为预设值的3×3反卷积层,用于进行通道数减半及分辨率翻倍的上采样操作。
5.根据权利要求3或4所述的基于知识蒸馏的工业图像异常检测方法,其特征在于,所述源域数据集根据预设比例划分为源域训练集和源域验证集;其中,S2步骤包括:
S2.1:对教师网络进行优化训练前,在教师网络的第四模块之后添加全局平均池化层和全连接层;
S2.2:对教师网络进行优化训练时,将源域训练集输入教师网络,通过全连接层上的Softmax激活函数,将教师网络从源域训练集中提取到的特征归一化,输出类别概率分布,将类别概率分布输入交叉熵损失函数,通过最小化所述交叉熵损失函数输出的损失值,对所述教师网络的参数进行更新,获得完成优化的教师网络;其中,每当源域训练集对教师网络完成一次训练后,将源域验证集输入经训练的教师网络,验证经训练的教师网络的图像检测精度,当所述图像检测精度达到预设值时,停止对经训练的教师网络的参数更新。
6.根据权利要求3或4所述的基于知识蒸馏的工业图像异常检测方法,其特征在于,所述工业数据集根据预设比例划分为工业训练集和工业验证集;其中,S4步骤包括:
S4.1:将工业训练集输入冻结的教师网络和下采样学生网络,分别获得第一教师特征和第一下采样特征;将部分第一教师特征输入上采样学生网络,获得第一上采样特征;
S4.2:根据所述第一教师特征、第一下采样特征和第一上采样特征,基于余弦相似度计算上采样学生网络与冻结的教师网络间,以及下采样学生网络与冻结的教师网络间的特征距离Ωk(h,w):
式中,h和w分别表示或/>提取的对应特征的纵坐标和横坐标,/> 和/>分别表示教师网络、上采样学生网络和下采样学生网络的第k模块提取的对应特征,其中,k为正整数;‖·‖表示欧几里德范数;
S4.3:根据特征距离Ωk(h,w)确定异常检测损失函数Loss:
式中,H和W分别表示每层特征的长和宽,K表示参与计算的特征对应的总模块数;
S4.4:根据特征距离Ωk(h,w)确定异常检测得分函数Score:
式中,Upsample(·)表示使用双线性插值法进行特征的像素扩张;
Score∈(0,1)其中,Score越接近1表示输入的图像越有可能是异常图像,Score越接近0则表示待检测图像越有可能是正常图像;Ωk表示特征距离;
S4.5:通过最小化所述异常检测损失函数Loss输出的损失值,对所述下采样学生网络和上采样学生网络的参数进行更新,获得经优化的双分支知识蒸馏网络;将工业验证集输入经优化的双分支知识蒸馏网络,进行n次优化训练,获得完成优化的双分支知识蒸馏网络,其中,n表示预设的正整数。
7.根据权利要求6所述的基于知识蒸馏的工业图像异常检测方法,其特征在于,S4.1步骤中,输入上采样学生网络的部分第一教师特征,包括冻结的教师网络的第四模块输出的特征。
8.根据权利要求1~4任一项所述的基于知识蒸馏的工业图像异常检测方法,其特征在于,S5步骤包括:将待检测图像输入完成优化的双分支知识蒸馏网络中的冻结的教师网络和下采样学生网络,分别获得第二教师特征和第二下采样特征;将部分第二教师特征输入上采样学生网络,获得第二上采样特征;根据第二教师特征、第二下采样特征和第二上采样特征,通过所述异常检测得分函数Score计算待检测图像的异常得分,若所述异常得分小于预设值,则判定待检测图像为正常图像,否则,判定待检测图像为异常图像。
9.一种基于知识蒸馏的工业图像异常检测系统,应用权利要求1~8任一项所述的基于知识蒸馏的工业图像异常检测方法,其特征在于,包括:
采集模块,用于采集并预处理源域图像和工业图像;
构建优化模块,用于构建教师网络、下采样学生网络和上采样学生网络,进而构建双分支知识蒸馏网络;且用于根据采集模块输出的图像数据,优化所述教师网络和双分支知识蒸馏网络;
异常检测模块,其上配置有完成优化的双分支知识蒸馏网络,用于对待检测图像进行检测,输出异常检测结果。
10.根据权利要求9所述的基于知识蒸馏的工业图像异常检测系统,其特征在于,所述系统还包括可视化模块,用于可视化地显示待检测图像及其对应的异常得分,并展示异常检测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310958108.0A CN117036266A (zh) | 2023-07-31 | 2023-07-31 | 一种基于知识蒸馏的工业图像异常检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310958108.0A CN117036266A (zh) | 2023-07-31 | 2023-07-31 | 一种基于知识蒸馏的工业图像异常检测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117036266A true CN117036266A (zh) | 2023-11-10 |
Family
ID=88634606
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310958108.0A Pending CN117036266A (zh) | 2023-07-31 | 2023-07-31 | 一种基于知识蒸馏的工业图像异常检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117036266A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117519044A (zh) * | 2023-12-01 | 2024-02-06 | 重庆雄川科技有限公司 | 基于智慧园区的生产线智能控制方法及系统 |
-
2023
- 2023-07-31 CN CN202310958108.0A patent/CN117036266A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117519044A (zh) * | 2023-12-01 | 2024-02-06 | 重庆雄川科技有限公司 | 基于智慧园区的生产线智能控制方法及系统 |
CN117519044B (zh) * | 2023-12-01 | 2024-06-11 | 重庆雄川科技有限公司 | 基于智慧园区的生产线智能控制方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110648310B (zh) | 基于注意力机制的弱监督铸件缺陷识别方法 | |
CN112465759A (zh) | 一种基于卷积神经网络的航空发动机叶片缺陷检测方法 | |
CN111626994A (zh) | 基于改进U-Net神经网络的设备故障缺陷诊断方法 | |
CN116416497B (zh) | 一种轴承故障诊断系统及方法 | |
CN113344110B (zh) | 一种基于超分辨率重建的模糊图像分类方法 | |
CN111462068A (zh) | 一种基于迁移学习的螺钉螺母检测方法 | |
CN117036266A (zh) | 一种基于知识蒸馏的工业图像异常检测方法及系统 | |
CN114332473A (zh) | 目标检测方法、装置、计算机设备、存储介质及程序产品 | |
CN110895815A (zh) | 一种基于深度学习的胸部x线气胸分割方法 | |
CN116205876A (zh) | 基于多尺度标准化流的无监督笔记本外观缺陷检测方法 | |
CN111832616A (zh) | 利用多类深度表示图的遥感图像飞机型号识别方法及系统 | |
CN116977387B (zh) | 基于形变场融合的可变形医学图像配准方法 | |
CN117975087A (zh) | 一种基于ECA-ConvNext铸件缺陷识别方法 | |
CN112200789A (zh) | 一种图像识别的方法及装置、电子设备和存储介质 | |
CN116778164A (zh) | 一种基于多尺度结构改进DeeplabV3+网络的语义分割方法 | |
CN115587989A (zh) | 一种工件ct图像缺陷检测分割方法及系统 | |
CN115937095A (zh) | 融合图像处理算法和深度学习的印刷缺陷检测方法及系统 | |
CN115588196A (zh) | 基于机器视觉的指针型仪表读数方法和装置 | |
CN113870328A (zh) | 一种液体异物视觉检测方法及系统 | |
CN113362347A (zh) | 基于多尺度超像素特征增强的图像缺陷区域分割方法和系统 | |
CN118379283B (zh) | 扁线电机定子表面缺陷检测方法、装置、设备及存储介质 | |
CN118411363B (zh) | 一种基于复合骨干改进网络的铸件dr图像检测方法 | |
CN113705346B (zh) | 一种遥感影像地物分类泛化性提升方法及装置 | |
CN112115949B (zh) | 一种烟草证件以及订单的光学文字识别方法 | |
Chen et al. | Automatic detection of microfabric defects with Gabor fractal network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |