CN115641474A - 基于高效学生网络的未知类型缺陷检测方法与装置 - Google Patents

基于高效学生网络的未知类型缺陷检测方法与装置 Download PDF

Info

Publication number
CN115641474A
CN115641474A CN202211295955.5A CN202211295955A CN115641474A CN 115641474 A CN115641474 A CN 115641474A CN 202211295955 A CN202211295955 A CN 202211295955A CN 115641474 A CN115641474 A CN 115641474A
Authority
CN
China
Prior art keywords
network
training
student network
student
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211295955.5A
Other languages
English (en)
Inventor
白翔
章哲彦
罗东亮
杨子豪
蔡雨萱
周瑜
郑增强
刘荣华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Wuhan Jingce Electronic Group Co Ltd
Wuhan Jingli Electronic Technology Co Ltd
Original Assignee
Huazhong University of Science and Technology
Wuhan Jingce Electronic Group Co Ltd
Wuhan Jingli Electronic Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology, Wuhan Jingce Electronic Group Co Ltd, Wuhan Jingli Electronic Technology Co Ltd filed Critical Huazhong University of Science and Technology
Priority to CN202211295955.5A priority Critical patent/CN115641474A/zh
Publication of CN115641474A publication Critical patent/CN115641474A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于高效学生网络的未知类型缺陷检测方法。所述方法包括以下步骤:提出了一种预训练方法,通过让各个类别数据的平均损失最低的策略,在第三方数据集上对学生网络参数进行更新,得到了一个具有较强泛化能力的学生网络初始化模型,随后,在上述训练策略的基础上,在网络中通过多任务学习的思路和注意力机制的思想,加入了自适应权重模块和分类网络辅助学生网络训练,提升了预训练模型在异常检测任务上的效果。利用本发明提出的方法得到的初始化模型,在后续异常检测任务中,面对不同新类型的数据进行训练时,仅使用少量样本,即可实现快速收敛,并在测试阶段达到较好的异常检测效果。本发明还提供了相应的基于高效学生网络的未知类型缺陷检测装置。

Description

基于高效学生网络的未知类型缺陷检测方法与装置
技术领域
本发明属于计算机视觉技术领域,更具体地,涉及一种基于高效学生网络的未知类型缺陷检测方法与装置。
背景技术
随着我国经济的高速发展和科技水平的提高,异常检测技术在工业质检、视频监控等实际应用领域扮演着越来越重要的角色。如在工业质检领域,异常检测技术不仅可以减少经济损失,更是可以保证用户的使用安全。因为异常检测场景常存在着异常样本匮乏等问题,因此在该领域仅使用正常样本进行训练的无监督异常检测算法为主流方法。
在无监督异常检测方法中,包括基于图像相似度的方法和基于特征相似度的方法。基于图像相似度的方法包括基于图像重建的方法和基于图像恢复的方法,基于特征相似度的方法包括深度一类分类方法、基于模板匹配的方法和基于教师-学生网络的方法。教师-学生网络是目前一种效果优异的无监督异常检测算法。但是在实际异常检测任务中,该方法在训练模型时训练样本需超过200张,训练时间大于2小时,难以满足实际模型快速部署到新的应用场景的需求。为了提升模型的学习效率,也有许多模型高效学习的方法,该方法中主要从模型微调、迁移学习和元学习的角度出发考虑设计。但是现有方法大多是针对图像分类等较简单的任务,没有专门为异常检测任务设计。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种基于高效学生网络的未知类型缺陷检测方法。
为达到上述目的,按照本发明的一个方面,提供了一种基于高效学生网络的未知类型缺陷检测方法,包括以下步骤:
步骤S1,构建教师网络(1),准备一个在ImageNet数据集上预训练好的ResNet18网络,并将ImageNet中图像随机裁剪为为边长为预设值的图像块,将图像块同时输入教师网络(1)和预训练好的ResNet18网络,约束教师网络(1)的输出特征和预训练好的ResNet18网络的输出特征相同,在后续步骤中教师网络(1)的参数都被固定;
步骤S2,在MSRA10K数据集上利用K-means聚类算法,将该数据集划分为N个粗组,在每个粗组中计算样本到中心特征的结构相似性距离,保留距离中心最近的M个样本,据此构造含有N个类别的数据集(2),所述M和N为预设值;
步骤S3,构建预训练网络(3),预训练网络(3)由学生网络(4)、自适应权重模块、特征融合模块和分类模块组成,其中自适应权重模块为学生网络(4)不同层特征提供不同的权重,特征融合模块将学生网络不同层特征与其对应的权重相乘再进行特征融合,然后将融合后的特征输入分类模块中,分类模块输出分类标签;
步骤S4,训练预训练网络(3),首先将数据集(2)中每一类数据划分为训练样本(5)和验证样本(6),将训练样本(5)输入到预训练网络(3)中,首先约束学生网络(4)在训练样本(5)上提取的特征与教师网络(1)提取的特征相同,随后将学生网络(4)的中间层输出特征与最终输出特征分别经过自适应权重模块,并将不同层特征与对应的权重相乘输入特征融合模块,将融合后特征输入分类模块,预测特征的类别,随后,将完成训练后的预训练网络(3)在验证样本(6)上计算损失函数,并回传该损失函数,更新还未输入训练样本(5)进行更新前的预训练网络(3)的参数;
步骤S5,在异常检测任务上的训练阶段,准备训练样本(7),将其输入到学生网络(4)中,此时学生网络(4)的初始化参数为完成步骤S4训练后的学生网络(4)的参数,随后约束学生网络(4)在训练样本(7)上提取的特征与教师网络(1)提取的特征相同;
步骤S6,测试阶段,将含有异常区域的测试样本(8)同时输入教师网络(1)和学生网络(4)中,通过异常得分函数(9)计算两者提取的特征图在特征空间的距离,得到异常得分图,随后通过设置阈值对异常得分图进行二值化,得到该阶段的输出。
本发明的一个实施例中,预训练网络(3)中的学生网络(4)的网络结构为全卷积结构,网络最后一层输出尺寸为H1×W1×C1,中间层输出尺寸为H2×W2×C1,其中H1、W1、C1、H2、W2、C2为预设值。
本发明的一个实施例中,预训练网络(3)的自适应权重模块分别给学生网络(4)的中间层特征和最后一层输出特征一个自适应的权重,具体包括:
步骤S3-1,使用3×3卷积对学生网络中间层输出特征进行尺寸进行下采样
Figure BDA0003902588890000031
H和W为预设值;
步骤S3-2,将步骤3-1得到的特征图经过全局平均池化层、全连接层以及Sigmoid操作,得到该特征对应的权重ω0
步骤S3-3,使用3×3卷积对学生网络最后一层输出特征进行尺寸进行下采样
Figure BDA0003902588890000032
步骤S3-4,将步骤3-3得到的特征图经过全局平均池化层、全连接层以及Sigmoid操作,得到该特征对应的权重ω1
本发明的一个实施例中,预训练网络(3)的特征融合模块用于融合加权后的学生网络(4)的中间层特征和最后一层输出特征,具体包括:
步骤S3-5,将学生网络(4)的中间层特征与步骤S3-2中对应的权重ω0相乘;
步骤S3-6,将学生网络(4)的最后一层输出特征与步骤S3-4中对应的权重ω0相乘;
步骤S3-7,将步骤S3-5和步骤S3-6得到的特征在通道维度上进行堆叠
Figure BDA0003902588890000041
本发明的一个实施例中,预训练网络(3)的分类模块用于将融合后的特征预测为一个类别标签,具体包括:
步骤S3-8,将步骤S3-7中的特征输入3个3×3的卷积层,将特征进行升维
Figure BDA0003902588890000042
C2为预设值,并使用ReLu进行激活;
步骤S3-9,将步骤S3-8中的特征输入到一个平均池化层、一个全连接层,并使用Sigmoid函数激活,得到分类的标签。
本发明的一个实施例中,在训练预训练网络(3)时,为了约束学生网络(4)提取的特征与教师网络(1)提取的特征在样本上保持一致,优化的目标函数(10)为:
Figure BDA0003902588890000043
其中,Sθ(x)表示训练样本(7)经过学生网络(4)输出的特征图,Tθ(x)表示训练样本(7)经过教师网络(1)输出的特征图,μ和σ分别表示教师网络特征在整个训练集上得到特征的均值与标准差,diag(σ)-1表示用σ的值填充的对角矩阵的逆矩阵,
Figure BDA0003902588890000044
表示计算L2距离。
本发明的一个实施例中,在预训练网络(3)的训练阶段,使用交叉熵损失(11)为:
Figure BDA0003902588890000045
其中,CE(·)表示交叉熵损失,N表示样本类别数,pi表示真值标签,qi表示融合后特征经过分类网络后的预测标签。
本发明的一个实施例中,总优化目标函数(12)为目标函数(10)与目标函数(11)的加权和,为:
L(Sθ(x))=Lossst+λLosscls
其中Lossst为学生网络的回归损失函数,Losscls为对学生网络提取特征进行分类的损失函数,λ为平衡两个损失函数的权重,λ为预设值。
本发明的一个实施例中,在预训练网络(3)的训练阶段,数据集(2)被划分为N个类别,每类的图像组分别为
Figure BDA0003902588890000051
每次模型更新任务在图像组
Figure BDA0003902588890000052
中随机选取2K张不同的样本,其中K张作为训练样本(5),另外K张作为验证样本(6),K为预设值,在训练样本(5)上更新模型的参数,并利用参数更新后的模型在训练样本(6)上计算总优化目标函数(12),在预训练网络(3)更新前,首先得到该学生网络更新前的参数,在每次模型更新任务的训练样本(5)上对该网络更新前的参数进行更新,得到N个学生网络模型,得到此时网络经过一组样本更新参数(13)再利用这N个模型分别在对应任务的验证样本(6)上计算总优化目标函数(12),最终通过最小化这N个损失函数的总和来更新一次网络更新前的参数,为更新后的学生网络预训练模型参数(14)。
按照本发明的另一方面,还提供了一种基于高效学生网络的未知类型缺陷检测装置,包括至少一个处理器和存储器,所述至少一个处理器和存储器之间通过数据总线连接,所述存储器存储能被所述至少一个处理器执行的指令,所述指令在被所述处理器执行后,用于完成所述的基于高效学生网络的未知类型缺陷检测方法。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有如下有益效果:
(1)本发明为了使模型在异常检测任务上训练时能够快速收敛,提出了一种预训练方法,该方法通过让各个类别数据的验证集上平均损失最低的方式进行网络训练,在第三方数据集上对学生网络参数进行更新,得到了一个具有较强泛化能力的学生网络初始化模型。利用本发明得到的初始化模型,在异常检测任务中新类型的数据上进行训练时,仅使用少量样本,即可实现快速收敛,随后完成异常检测任务;
(2)本发明在上述训练策略的基础上,在网络中通过多任务学习的思路和注意力机制的思想,加入了自适应权重模块和分类网络辅助学生网络训练,提升了预训练模型在异常检测任务上的效果。
附图说明
图1是本发明提供的基于高效学生网络的未知类型缺陷检测方法的预训练整体流程图;
图2是本发明提供的基于高效学生网络的未知类型缺陷检测方法的训练及测试过程流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
本发明提供了一种基于高效学生网络的未知类型缺陷检测方法,如图1和图2所示,包括以下步骤:
步骤S1,构建教师网络(1),准备一个在ImageNet数据集上预训练好的ResNet18网络,并将ImageNet中图像随机裁剪为为边长为预设值(例如17)的图像块,将图像块同时输入教师网络(1)和预训练好的ResNet18网络,约束教师网络(1)的输出特征和预训练好的ResNet18网络的输出特征相同。在后续步骤中教师网络(1)的参数都被固定;
步骤S2,在MSRA10K数据集上利用K-means聚类算法,将该数据集划分为N个粗组,在每个粗组中计算样本到中心特征的结构相似性距离,保留距离中心最近的M个样本,据此构造含有N个类别的数据集(2)。
步骤S3,构建预训练网络(3)。预训练网络(3)由学生网络(4)、自适应权重模块、特征融合模块和分类模块组成。其中自适应权重模块为学生网络(4)不同层特征提供不同的权重,特征融合模块将学生网络不同层特征与其对应的权重相乘再进行特征融合,然后将融合后的特征输入分类模块中,分类模块输出分类标签。
步骤S4,训练预训练网络(3)。首先将数据集(2)中每一类数据划分为训练样本(5)和验证样本(6)。将训练样本(5)输入到预训练网络(3)中,首先约束学生网络(4)在训练样本(5)上提取的特征与教师网络(1)提取的特征相同,随后将学生网络(4)的中间层输出特征与最终输出特征分别经过自适应权重模块,并将不同层特征与对应的权重相乘输入特征融合模块,将融合后特征输入分类模块,预测特征的类别。随后,将完成训练后的预训练网络(3)在验证样本(6)上计算损失函数,并回传该损失函数,更新还未输入训练样本(5)进行更新前的预训练网络(3)的参数。
步骤S5,在异常检测任务上的训练阶段,准备训练样本(7),将其输入到学生网络(4)中,此时学生网络(4)的初始化参数为完成步骤S4训练后的学生网络(4)的参数。随后约束学生网络(4)在训练样本(7)上提取的特征与教师网络(1)提取的特征相同。
步骤S6,测试阶段。将含有异常区域的测试样本(8)同时输入教师网络(1)和学生网络(4)中。通过异常得分函数(9)计算两者提取的特征图在特征空间的距离,得到异常得分图,随后通过设置阈值对异常得分图进行二值化,得到该阶段的输出。
优选地,预训练网络(3)中的学生网络(4)的网络结构为全卷积结构,网络最后一层输出尺寸为H1×W1×C1,中间层输出尺寸为H2×W2×C1
优选地,预训练网络(3)的自适应权重模块分别给学生网络(4)的中间层特征和最后一层输出特征一个自适应的权重,具体包括:
步骤S3-1,使用3×3卷积对学生网络中间层输出特征进行尺寸进行下采样
Figure BDA0003902588890000081
H和W为预设值。
步骤S3-2,将步骤3-1得到的特征图经过全局平均池化层、全连接层以及Sigmoid操作,得到该特征对应的权重ω0
步骤S3-3,使用3×3卷积对学生网络最后一层输出特征进行尺寸进行下采样
Figure BDA0003902588890000082
H和W为预设值。
步骤S3-4,将步骤3-3得到的特征图经过全局平均池化层、全连接层以及Sigmoid操作,得到该特征对应的权重ω1
优选地,预训练网络(3)的特征融合模块用于融合加权后的学生网络(4)的中间层特征和最后一层输出特征,具体包括:
步骤S3-5,将学生网络(4)的中间层特征与步骤S3-2中对应的权重ω0相乘。
步骤S3-6,将学生网络(4)的最后一层输出特征与步骤S3-4中对应的权重ω0相乘。
步骤S3-7,将步骤S3-5和步骤S3-6得到的特征在通道维度上进行堆叠
Figure BDA0003902588890000083
优选地,预训练网络(3)的分类模块用于将融合后的特征预测为一个类别标签,具体包括:
步骤S3-8,将步骤S3-7中的特征输入3个3×3的卷积层,将特征进行升维
Figure BDA0003902588890000084
C2为预设值,并使用ReLu进行激活。
步骤S3-9,将步骤S3-8中的特征输入到一个平均池化层、一个全连接层,并使用Sigmoid函数激活,得到分类的标签。
优选地,在训练预训练网络(3)时,为了约束学生网络(4)提取的特征与教师网络(1)提取的特征在样本上保持一致,优化的目标函数(10)为:
Figure BDA0003902588890000091
其中,Sθ(x)表示训练样本(7)经过学生网络(4)输出的特征图,Tθ(x)表示训练样本(7)经过教师网络(1)输出的特征图,μ和σ分别表示教师网络特征在整个训练集上得到特征的均值与标准差,diag(σ)-1表示用σ的值填充的对角矩阵的逆矩阵,
Figure BDA0003902588890000092
表示计算L2距离。
优选地,在预训练网络(3)的训练阶段,为了使分类网络输出正确的分类标签,本发明在此使用交叉熵损失(11)为:
Figure BDA0003902588890000093
其中,CE(·)表示交叉熵损失,N表示样本类别数,pi表示真值标签,qi表示融合后特征经过分类网络后的预测标签。
优选地,此阶段的总优化目标函数(12)为目标函数(10)与目标函数(11)的加权和,为:
L(Sθ(x))=Lossst+λLosscls
其中Lossst为学生网络的回归损失函数,Losscls为对学生网络提取特征进行分类的损失函数,λ为平衡两个损失函数的权重,为预设值。
此阶段利用总优化目标函数(12)对学生网络参数进行更新。
优选地,在预训练网络(3)的训练阶段,数据集(2)被划分为N个类别,每类的图像组分别为
Figure BDA0003902588890000094
每次模型更新任务在图像组
Figure BDA0003902588890000095
中随机选取2K张不同的样本,其中K张作为训练样本(5),另外K张作为验证样本(6),在训练样本(5)上更新模型的参数,并利用参数更新后的模型在训练样本(6)上计算总优化目标函数(12)。在预训练网络(3)更新前,首先得到该学生网络更新前的参数。本发明在每次模型更新任务的训练样本(5)上对该网络更新前的参数进行更新,得到N个学生网络模型,得到此时网络经过一组样本更新参数(13)再利用这N个模型分别在对应任务的验证样本(6)上计算总优化目标函数(12),最终通过最小化这N个损失函数的总和来更新一次网络更新前的参数,为更新后的学生网络预训练模型参数(14)。
优选地,异常检测任务上的训练阶段,准备训练样本(7),将其输入到学生网络(4)中,此时学生网络(4)的初始化参数为完成步骤S4训练后的学生网络(4)的参数。随后约束学生网络(4)在训练样本(7)上提取的特征与教师网络(1)提取的特征相同,优化的目标函数为目标函数(10)。
优选地,在测试阶段,本发明将含有异常区域的测试样本(8)同时输入教师网络(1)和学生网络(4)中。通过异常得分函数(9)计算两者提取的特征图在特征空间的距离。异常得分函数(9)为:
Figure BDA0003902588890000101
其中
Figure BDA0003902588890000102
代表学生网络的特征在(r,c)处表示的特征向量,
Figure BDA0003902588890000103
代表教师网络的特征在(r,c)处表示的特征向量,μ和σ分别表示教师网络特征FT在训练集上得到特征的均值与标准差,其中
Figure BDA0003902588890000104
diag(σ)-1表示用σ的值填充的对角矩阵的逆矩阵。
得到异常得分图,随后通过设置阈值对异常得分图进行二值化,得到该阶段的二值分割结果输出。此外,为了得到二值分割结果,还需要对异常得分图设置合适的阈值进行二值化。
本发明提出了一种基于高效学生网络的未知类型缺陷检测方法。该方法首先提出了一种预训练方法,该方法通过让各个类别数据的平均损失最低的策略,在第三方数据集上对学生网络参数进行更新,得到了一个具有较强泛化能力的学生网络初始化模型,随后,本发明在上述训练策略的基础上,在网络中通过多任务学习的思路和注意力机制的思想,加入了自适应权重模块和分类网络辅助学生网络训练,提升了预训练模型在异常检测任务上的效果。利用本发明提出的方法得到的初始化模型,在后续异常检测任务中,面对不同新类型的数据进行训练时,仅使用少量样本,即可实现快速收敛,并在测试阶段达到较好的异常检测效果。
进一步地,本发明还提供了一种基于高效学生网络的未知类型缺陷检测装置,包括至少一个处理器和存储器,所述至少一个处理器和存储器之间通过数据总线连接,所述存储器存储能被所述至少一个处理器执行的指令,所述指令在被所述处理器执行后,用于完成所述的基于高效学生网络的未知类型缺陷检测方法。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于高效学生网络的未知类型缺陷检测方法,其特征在于,包括如下步骤:
步骤S1,构建教师网络(1),准备一个在ImageNet数据集上预训练好的ResNet18网络,并将ImageNet中图像随机裁剪为为边长为预设值的图像块,将图像块同时输入教师网络(1)和预训练好的ResNet18网络,约束教师网络(1)的输出特征和预训练好的ResNet18网络的输出特征相同,在后续步骤中教师网络(1)的参数都被固定;
步骤S2,在MSRA10K数据集上利用K-means聚类算法,将该数据集划分为N个粗组,在每个粗组中计算样本到中心特征的结构相似性距离,保留距离中心最近的M个样本,据此构造含有N个类别的数据集(2),所述M和N为预设值;
步骤S3,构建预训练网络(3),预训练网络(3)由学生网络(4)、自适应权重模块、特征融合模块和分类模块组成,其中自适应权重模块为学生网络(4)不同层特征提供不同的权重,特征融合模块将学生网络不同层特征与其对应的权重相乘再进行特征融合,然后将融合后的特征输入分类模块中,分类模块输出分类标签;
步骤S4,训练预训练网络(3),首先将数据集(2)中每一类数据划分为训练样本(5)和验证样本(6),将训练样本(5)输入到预训练网络(3)中,首先约束学生网络(4)在训练样本(5)上提取的特征与教师网络(1)提取的特征相同,随后将学生网络(4)的中间层输出特征与最终输出特征分别经过自适应权重模块,并将不同层特征与对应的权重相乘输入特征融合模块,将融合后特征输入分类模块,预测特征的类别,随后,将完成训练后的预训练网络(3)在验证样本(6)上计算损失函数,并回传该损失函数,更新还未输入训练样本(5)进行更新前的预训练网络(3)的参数;
步骤S5,在异常检测任务上的训练阶段,准备训练样本(7),将其输入到学生网络(4)中,此时学生网络(4)的初始化参数为完成步骤S4训练后的学生网络(4)的参数,随后约束学生网络(4)在训练样本(7)上提取的特征与教师网络(1)提取的特征相同;
步骤S6,测试阶段,将含有异常区域的测试样本(8)同时输入教师网络(1)和学生网络(4)中,通过异常得分函数(9)计算两者提取的特征图在特征空间的距离,得到异常得分图,随后通过设置阈值对异常得分图进行二值化,得到该阶段的输出。
2.如权利要求1所述的基于高效学生网络的未知类型缺陷检测方法,其特征在于,预训练网络(3)中的学生网络(4)的网络结构为全卷积结构,网络最后一层输出尺寸为H1×W1×C1,中间层输出尺寸为H2×W2×C1,其中H1、W1、C1、H2、W2、C2为预设值。
3.如权利要求1或2所述的基于高效学生网络的未知类型缺陷检测方法,其特征在于,预训练网络(3)的自适应权重模块分别给学生网络(4)的中间层特征和最后一层输出特征一个自适应的权重,具体包括:
步骤S3-1,使用3×3卷积对学生网络中间层输出特征进行尺寸进行下采样
Figure FDA0003902588880000021
H和W为预设值;
步骤S3-2,将步骤3-1得到的特征图经过全局平均池化层、全连接层以及Sigmoid操作,得到该特征对应的权重ω0
步骤S3-3,使用3×3卷积对学生网络最后一层输出特征进行尺寸进行下采样
Figure FDA0003902588880000022
步骤S3-4,将步骤3-3得到的特征图经过全局平均池化层、全连接层以及Sigmoid操作,得到该特征对应的权重ω1
4.如权利要求1或2所述的基于高效学生网络的未知类型缺陷检测方法,其特征在于,预训练网络(3)的特征融合模块用于融合加权后的学生网络(4)的中间层特征和最后一层输出特征,具体包括:
步骤S3-5,将学生网络(4)的中间层特征与步骤S3-2中对应的权重ω0相乘;
步骤S3-6,将学生网络(4)的最后一层输出特征与步骤S3-4中对应的权重ω0相乘;
步骤S3-7,将步骤S3-5和步骤S3-6得到的特征在通道维度上进行堆叠
Figure FDA0003902588880000031
5.如权利要求1或2所述的基于高效学生网络的未知类型缺陷检测方法,其特征在于,预训练网络(3)的分类模块用于将融合后的特征预测为一个类别标签,具体包括:
步骤S3-8,将步骤S3-7中的特征输入3个3×3的卷积层,将特征进行升维
Figure FDA0003902588880000032
C2为预设值,并使用ReLu进行激活;
步骤S3-9,将步骤S3-8中的特征输入到一个平均池化层、一个全连接层,并使用Sigmoid函数激活,得到分类的标签。
6.如权利要求1或2所述的基于高效学生网络的未知类型缺陷检测方法,其特征在于,在训练预训练网络(3)时,为了约束学生网络(4)提取的特征与教师网络(1)提取的特征在样本上保持一致,优化的目标函数(10)为:
Figure FDA0003902588880000033
其中,Sθ(x)表示训练样本(7)经过学生网络(4)输出的特征图,Tθ(x)表示训练样本(7)经过教师网络(1)输出的特征图,μ和σ分别表示教师网络特征在整个训练集上得到特征的均值与标准差,diag(σ)-1表示用σ的值填充的对角矩阵的逆矩阵,
Figure FDA0003902588880000034
表示计算L2距离。
7.如权利要求1或2所述的基于高效学生网络的未知类型缺陷检测方法,其特征在于,在预训练网络(3)的训练阶段,使用交叉熵损失(11)为:
Figure FDA0003902588880000041
其中,CE(·)表示交叉熵损失,N表示样本类别数,pi表示真值标签,qi表示融合后特征经过分类网络后的预测标签。
8.如权利要求1或2所述的基于高效学生网络的未知类型缺陷检测方法,其特征在于,总优化目标函数(12)为目标函数(10)与目标函数(11)的加权和,为:
L(Sθ(x))=Lossst+λLosscls
其中Lossst为学生网络的回归损失函数,Losscls为对学生网络提取特征进行分类的损失函数,λ为平衡两个损失函数的权重,λ为预设值。
9.如权利要求1或2所述的基于高效学生网络的未知类型缺陷检测方法,其特征在于,在预训练网络(3)的训练阶段,数据集(2)被划分为N个类别,每类的图像组分别为
Figure FDA0003902588880000042
每次模型更新任务在图像组
Figure FDA0003902588880000043
中随机选取2K张不同的样本,其中K张作为训练样本(5),另外K张作为验证样本(6),K为预设值,在训练样本(5)上更新模型的参数,并利用参数更新后的模型在训练样本(6)上计算总优化目标函数(12),在预训练网络(3)更新前,首先得到该学生网络更新前的参数,在每次模型更新任务的训练样本(5)上对该网络更新前的参数进行更新,得到N个学生网络模型,得到此时网络经过一组样本更新参数(13)再利用这N个模型分别在对应任务的验证样本(6)上计算总优化目标函数(12),最终通过最小化这N个损失函数的总和来更新一次网络更新前的参数,为更新后的学生网络预训练模型参数(14)。
10.一种基于高效学生网络的未知类型缺陷检测装置,其特征在于:
包括至少一个处理器和存储器,所述至少一个处理器和存储器之间通过数据总线连接,所述存储器存储能被所述至少一个处理器执行的指令,所述指令在被所述处理器执行后,用于完成权利要求1-9中任一项所述的基于高效学生网络的未知类型缺陷检测方法。
CN202211295955.5A 2022-10-21 2022-10-21 基于高效学生网络的未知类型缺陷检测方法与装置 Pending CN115641474A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211295955.5A CN115641474A (zh) 2022-10-21 2022-10-21 基于高效学生网络的未知类型缺陷检测方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211295955.5A CN115641474A (zh) 2022-10-21 2022-10-21 基于高效学生网络的未知类型缺陷检测方法与装置

Publications (1)

Publication Number Publication Date
CN115641474A true CN115641474A (zh) 2023-01-24

Family

ID=84944099

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211295955.5A Pending CN115641474A (zh) 2022-10-21 2022-10-21 基于高效学生网络的未知类型缺陷检测方法与装置

Country Status (1)

Country Link
CN (1) CN115641474A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116958148A (zh) * 2023-09-21 2023-10-27 曲阜师范大学 输电线路关键部件缺陷的检测方法、装置、设备、介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116958148A (zh) * 2023-09-21 2023-10-27 曲阜师范大学 输电线路关键部件缺陷的检测方法、装置、设备、介质
CN116958148B (zh) * 2023-09-21 2023-12-12 曲阜师范大学 输电线路关键部件缺陷的检测方法、装置、设备、介质

Similar Documents

Publication Publication Date Title
CN109816032B (zh) 基于生成式对抗网络的无偏映射零样本分类方法和装置
CN109120462B (zh) 机会网络链路的预测方法、装置及可读存储介质
CN110046550B (zh) 基于多层特征学习的行人属性识别系统及方法
CN111091175A (zh) 神经网络模型训练方法、分类方法、装置和电子设备
CN110852447A (zh) 元学习方法和装置、初始化方法、计算设备和存储介质
CN114332578A (zh) 图像异常检测模型训练方法、图像异常检测方法和装置
CN112446331A (zh) 基于知识蒸馏的时空双流分段网络行为识别方法及系统
CN112634992A (zh) 分子性质预测方法及其模型的训练方法及相关装置、设备
CN111242176B (zh) 计算机视觉任务的处理方法、装置及电子系统
CN112420125A (zh) 分子属性预测方法、装置、智能设备和终端
CN115641474A (zh) 基于高效学生网络的未知类型缺陷检测方法与装置
CN115879509A (zh) 基于代理辅助进化算法的卷积神经网络结构优化方法
CN115101145A (zh) 一种基于自适应元学习的药物虚拟筛选方法
CN111914949B (zh) 基于强化学习的零样本学习模型的训练方法及装置
CN113609337A (zh) 图神经网络的预训练方法、训练方法、装置、设备及介质
CN116452904B (zh) 图像美学质量确定方法
CN114565092A (zh) 一种神经网络结构确定方法及其装置
CN117197451A (zh) 基于域自适应的遥感图像语义分割方法及装置
CN115858725A (zh) 一种基于无监督式图神经网络的文本噪声筛选方法及系统
CN115858388A (zh) 基于变异模型映射图的测试用例优先级排序方法和装置
CN115439878A (zh) 目标重识别模型抗遗忘训练方法、目标重识别方法及装置
CN112465253B (zh) 一种城市路网中的链路预测方法及装置
WO2021237682A1 (zh) 显示面板的检测装置、检测方法、电子装置、可读介质
CN113298233A (zh) 一种基于代理模型的渐进式深度集成架构搜索方法
JP6993250B2 (ja) コンテンツ特徴量抽出装置、方法、及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination