CN114519803A

CN114519803A - 一种基于迁移学习的小样本目标识别方法

Info

Publication number: CN114519803A
Application number: CN202210076849.1A
Authority: CN
Inventors: 尹玲; 叶正伟
Original assignee: Dongguan University of Technology
Current assignee: Dongguan University of Technology
Priority date: 2022-01-24
Filing date: 2022-01-24
Publication date: 2022-05-20

Abstract

本发明属于图像处理技术领域，具体涉及一种基于迁移学习的小样本目标识别方法，其包括以下步骤，S1、对玻璃缺陷样本分成划痕、崩边以及脏污三个类别进行图像采样，获取样本图像；S2、将样本图像制作成样本数据集；S3、构建玻璃表面缺陷模型，用热轧带钢表面缺陷数据集作为特征输入对玻璃表面缺陷模型进行预训练，获得玻璃表面模型的初始权重；S4、获取热轧带钢表面缺陷数据集，采用迁移学习方法，将样本数据集对玻璃表面缺陷模型进行训练，获得优化后的玻璃表面缺陷模型；S5、将待检测玻璃图像输入玻璃表面缺陷模型，获取待检测玻璃的缺陷类别。本发明提供的小样本目标识别方法可以有效的解决数据样本量小的问题。

Description

一种基于迁移学习的小样本目标识别方法

技术领域

本发明属于图像处理技术领域，具体涉及一种基于迁移学习的小样本目标识别方法。

背景技术

在工业应用领域复杂的深加工过程中，如原片平板玻璃进深加工一般需要经过切割、磨边、清洗、抛光等工序，有些还需要经过钻孔、印刷和钢化等，由于受技术条件、生产环境或人为因素的影响，均可能出现缺陷。

深度学习中的目标检测模型可以用于实现缺陷检测、目标定位以及尺寸测量等任务，是缺陷检测领域可以被采用的一种检测手段，通过对图片中待检测目标的位置标注，利用深度卷积神经对缺陷的特征进行提取，训练完成输出目标检测模型，完成对缺陷检测的识别和分类。但深度学习是一种对数据量要求较高的一种技术，其能获得出色的效果主要依赖于大量的带类标签的训练样本，而在现实的工业应用领域中并没有足够的带类标签的样本，或者获得大量带有标签样本的成本非常高昂。因此，需提供一种用于缺陷检测的小样本目标识别方法。

发明内容

本发明针对工业应用领域中，用于目标检测的数据样本量小的问题，提供一种基于迁移学习的小样本目标识别方法。

一种基于迁移学习的小样本目标识别方法，包括以下步骤，

S1、对玻璃缺陷样本分成划痕、崩边以及脏污三个类别进行图像采样，获取样本图像；

S2、将样本图像制作成样本数据集；

S3、构建玻璃表面缺陷模型；

S4、获取热轧带钢表面缺陷数据集，采用迁移学习方法，将热轧带钢表面缺陷数据集作为特征输入对玻璃表面缺陷模型进行预训练，获得玻璃表面模型的初始权重；用样本数据集对玻璃表面缺陷模型进行训练，获得优化后的玻璃表面缺陷模型。

S5、将待检测玻璃图像输入玻璃表面缺陷模型，获取待检测玻璃的缺陷类别。

此方法中，利用迁移学习方法，借助热轧带钢表面缺陷数据集获得特征参数的同时保持与目标对象数据集的相关性，可以有效的解决数据样本量小的问题，并且能加速玻璃表面缺陷模型的训练、改善玻璃表面缺陷检测模型的检测效果。

进一步的，所述S2包括：

提取样本图像的高亮部分；对样本图像的连通域进行分割，选取整个玻璃表面区域并显示；

将样本数据集按照yolo的格式进行标签的制作；

将样本数据集按比例划分为训练集、测试集和验证集。

进一步的，所述S3包括：

以CSPDakeNet网络为作为BackBone主干网络，构建玻璃表面缺陷模型，所述CSPDakeNet网络级联多个残差块。

进一步的，所述残差块由两个部分组成，其中一部分由卷积块、BN层以及Mish激活函数组成，对图像特征进行抽象提取，缺陷特征信息不可逆，另一部分直接对图像特征进行获取，处理完成后，两部分的特征向量相加融合。

进一步的，在BackBone主干网络中加入注意力机制模块CBAM；所述注意力机制模块CBAM的输入为F，所述F为中间层的feature map，每个CSPDacknet模块均包括中间层；所述中间层位于CSPDacknet模块中的两个CBM层之间，所述注意力机制模块CBAM依次生成一维通道Mc和二维通道Ms；所述注意力机制模块CBAM的输出特征为最终注意力权重F′；。

Mc(F)＝σ(MLP(avgpool(F))+MLP(maxpool(F)))

Ms(F)＝σ(f^7×7([avgpool(F)；maxpool(F)]))

F′＝Ms(Mc(F)F)×(Mc(F)F)

式中Mc(F)为在channel维度上做attention提取操作，MLP(avgpool(F))为通过多层感知机模块的平均池化，MLP(maxpool(F))为通过多层感知机模块的最大池化；σ为sigmoid函数

Ms(F)为在spatial维度上做attention提取操作；f^7×7([avgpool(F)；maxpool(F)])为滤波器尺寸为7×7的卷积运算；avgpool(F)为对F进行平均池化；

maxpool(F)为对F进行最大池化；

Ms(Mc(F)F)为权重系数；(Ms(F)F)为输入特征。

进一步的，所述获取热轧带钢表面缺陷数据集包括收集热轧带钢公开的缺陷图片，将缺陷图片统一缩放到416*416的尺寸，对缺陷图片进行图像增强，获得热轧带钢表面缺陷数据集；所述图像增强包括突出缺陷特征和扩增热轧带钢表面缺陷数据集的样本数量；采用频域增强算法突出缺陷特征；通过旋转、翻转、添加噪声扩增热轧带钢表面缺陷数据集的样本数量。

进一步的，所述迁移学习方法为载入热轧带钢表面缺陷数据集训练的模型权重作为玻璃表面缺陷模型的初始权重，冻住前部分残差块的网络层，用样本数据集训练后部分残差块的网络层。

进一步的，所述S4还包括：

构建损失函数；

结合损失函数和SGDM动量梯度下降方法对玻璃表面缺陷模型进行优化训练，总训练轮数达到预设值后停止训练，获得优化后的玻璃表面缺陷模型；

采用验证集作为玻璃表面缺陷模型的评估指标，对优化训练后的迁玻璃表面缺陷模型进行评估；

采用测试集对优化训练后的玻璃表面缺陷模型进行测试。

进一步的，所损失函数为

Loss_total＝Loss_location+Loss_conf+Loss_class

式中：Loss_total为总损失值；Loss_location为预测框与真实框的误差损失；Loss_conf为置信度损失；Loss_class为类别损失；

使用二值交叉熵损失函数计算置信度损失Loss_conf与类别损失Loss_class；

使用CIOU损失计算box的损失，公式如下

式中：α为权重参数，v为宽高比一致性参数，ω为box的宽，h为box的高，gt为真实框的信息；IoU为交并比，ρ为欧几里得度量，c为对角线长度，A为预测框，B为目标框。

进一步的，所述SGDM动量梯度下降方法为在随机梯度下降的方法上引入动量Momentum；

m_t＝β×m_t-1+(1-β)×g_t

式中，m_t为t时刻一介动量，β为衰减系数，β取值为0.9：m_t-1为t的上一时刻动量；g_t为下降梯度值。

有益效果：本发明提供的基于迁移学习的小样本目标识别方法，热轧带钢表面缺陷数据集采用公开的缺陷图片数据集，利用迁移学习方法，借助热轧带钢表面缺陷数据集获得特征参数的同时保持与目标对象数据集的相关性，可以有效的解决数据样本量小的问题，并且能加速玻璃表面缺陷模型的训练、改善玻璃表面缺陷检测模型的检测效果。

附图说明

下面结合附图和具体实施例对本发明作出进一步详细说明。

图1为基于迁移学习的小样本目标识别方法流程图。

图2为注意力框架模块CBAM的框架图。

图3为BackBone主干网络的结构图。

图4为迁移学习的过程示意图。

具体实施方式

下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明的描述中，需要说明的是，术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

在本发明的描述中，需要说明的是，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。此外，下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。

实施例

本实施例以玻璃表面缺陷为例，提供一种基于迁移学习的小样本目标识别方法，其包括以下步骤。

S1、搭建工业相机图像采集平台，对玻璃缺陷样本分成划痕、崩边以及脏污三个类别进行图像采样，获取样本图像；在实验样本有限的条件下，对每个样本进行重复采样，获得各类样本图像的数量分别为400个。

为避免在光源的照射下空中的灰尘落入玻璃表面时，系统误识别为缺陷，本实施例选择在超净台的空间内完成图像采集平台的搭建以及后续数据集的制作。

S2、将样本图像制作成样本数据集；包括以下步骤，

对样本图像的阈值进行选择，提取图中的高亮部分；对样本图像连通域进行分割，选取整个玻璃表面区域并显示，从而去除样本图像中的干扰因素；

将样本图像制作成样本数据集；并通过labelmg软件将样本数据集按照yolo的格式进行标签的制作；

将玻璃表面数据集按8∶1∶1的比例划分为训练集、测试集和验证集。

S3、构建玻璃表面缺陷检测模型；

具体为：

以CSPDakeNet网络为作为BackBone主干网络，构建玻璃表面缺陷模型，所述CSPDakeNet网络级联五个残差块，各残差块对应的个数分别为1、2、8、8、4，分别对应了五次下采样的操作；所述残差块包括卷积层、BN层以及Mish激活函数。在BackBone主干网络中加入注意力机制模块CBAM；所述注意力机制模块CBAM的输入为F，所述F为中间层的featuremap，每个CSPDacknet模块均包括中间层；所述中间层位于CSPDacknet模块中的两个CBM层之间；所述注意力机制模块CBAM依次生成一维通道Mc和二维通道Ms；所述注意力机制模块CBAM的输出特征为最终注意力权重F′；CBAM框架图如图2所示，BackBone主干网络结构图如图3所示。

Mc(F)＝σ(MLP(avgpool(F))+MLP(maxpool(F)))

Ms(F)＝σ(f^7×7([avgpool(F)；maxpool(F)]))

F′＝Ms(Mc(F)F)×(Ms(F)F)

Ms(F)为在spatial维度上做attention提取操作；f^7×7([avgpool(F)；maxpool(F)])为滤波器尺寸为7×7的卷积运算；avgpool(F)为对F进行平均池化；maxpool(F)对F进行最大池化；

Ms(Mc(F)F)为权重系数；(Ms(F)F)为输入特征。

加入注意力模块之后，BackBone主干网络更能将注意力集中到玻璃缺陷样本的位置上，所以在加入注意力模块之后，玻璃表面缺陷模型能将提取的有效信息更加集中于玻璃缺陷样本上，而非盲目地搜索。

每个残差块由两个部分组成，其中一部分由卷积块、BN层以及Mish激活函数组成，对图像特征进行抽象提取，缺陷特征信息不可逆，另一部分不进行操作，直接对图像特征进行获取，处理完成后，两部分的特征向量相加融合。

S4、采用迁移学习方法，用热轧带钢表面缺陷数据集作为特征输入对玻璃表面缺陷模型进行预训练，获得玻璃表面模型的初始权重；用样本数据集对玻璃表面缺陷模型进行训练，获得优化后的玻璃表面缺陷模型；

所述迁移学习主要分为三种：(1)载入玻璃表面缺陷模型的初始权重后，训练所有参数；(2)载入玻璃表面缺陷模型的初始权重后，训练最后几层模型权重weight和偏置bias；(3)载入玻璃表面缺陷模型的初始权重后，在原网络基础上再添加一层全连接层，仅训练最后一个全连接层。

由于目前样本数据集的数据量较小，为了让缺陷特征能更充分的学习到缺陷，本实施例的迁移学习方法为载将使用热轧带钢表面缺陷数据集训练得到的模型作为玻璃表面缺陷模型的初始权重；冻住前四大残差块的网络层，即前85层；用样本数据集训练后四大残差块的网络层，即针对小样本学习场景调整参数，以适应新的缺陷特征，使CSPDakeNet网络在借助热轧带钢表面缺陷数据集获得特征参数的同时保持了与样本数据集的相关性。

因热轧带钢表面缺陷与玻璃表面的特征较为相近，故本实施例采用热轧带钢表面缺陷数据集作为对玻璃表面缺陷模型进行预训练；收集热轧带钢公开的缺陷图片，将缺陷图片统一缩放到416*416的尺寸，对缺陷图片进行图像增强，获得热轧带钢表面缺陷数据集。

图像增强包括突出缺陷特征和扩增热轧带钢表面缺陷数据集的样本数量；突出缺陷特征的图像增强方式有频域与时域两大类，为更加凸显目标缺陷区域的特征，本实施例采用频域增强算法对缺陷图片进行预处理；即使用傅里叶变换和高低通滤波等方法实现，通过抑制低频分量、增强高频分量来减少光照变换并锐化边缘细节，凸显缺陷图片的缺陷特征。通过旋转、翻转、添加噪声等扩增热轧带钢表面缺陷数据集的样本数量，添加噪声为了防止模型过拟合，可以提高样本的多样性和复杂性，提高模型检测能力。

为公开的缺陷图片数据集。所述热轧带钢表面缺陷数据集一部分经过卷积层、BN层以及Mish激活函数作为第一输入；所述热轧带钢表面缺陷数据集的另一部分直接作为第二输入，第一输入与第二输入进行特征融合后作为玻璃表面缺陷模型的特征输入。

具体包括以下步骤：

将热轧带钢表面缺陷数据集中的原始图像裁剪到618*618*3的大小作为玻璃表面缺陷模型的输入，采用特征提取器进行特征提取，提取特征后经过SPP+PAN对不同尺度的特征信息进行融合操作，划分出76*76、39*39、19*19这三个尺度的网格区域，在每个网格区域内预测三个比例为1∶2，2∶1和1∶3的边界框，得到76*76*21、39*39*21、19*19*21这三个特征向量传入到YOLOv3检测头中，获得玻璃表面模型的初始权重；

模型微调，由于全连接层的参数的随机的，所以需要对其进行初始化操作，使用Xavie均匀分布进行全连接层初始化。

冻结层，主要冻结前四个残差块的网络层，获取他们的网络层的权重weight和偏置bias，不再获取其更新的梯度信息，意味着不会进行反向传播更新参数，相当于冻结了这些网络层的参数，数值保持不变；并用样本数据集训练后部分残差块的网络层，对后部分残差块的网络层进行参数更新。

构建损失函数，所损失函数为

Loss_total＝Loss_location+Loss_conf+Loss_class

充分考虑边界重叠面积、中心点位置和宽高比等信息，本专利使用CIOU损失计算box的损失，公式如下：

式中：α为权重参数，v为宽高比一致性参数，ω为预测框的宽，h为预测框的高，gt为真实框的信息；

IoU为交并比，ρ为欧几里得度量，c为对角线长度，A为预测框，B为目标框，

模型优化训练，结合损失函数和SGDM动量梯度下降方法对玻璃表面缺陷模型进行优化训练；所述SGDM动量梯度下降方法为在随机梯度下降的方法上引入动量Momentum，并设置参数β为0.9，初始学习率为0.0001；

m_t＝β×m_t-1+(1-β)×g_t

所述m_t为t时刻一介动量，所述β为衰减系数，β取值为0.9，所述m_t-1为t的上一时刻动量；所述g_t为梯度下降值；

此方法利用两次训练间隔的梯度变化，使其梯度变化不只与当前的梯度相关，参数更新就可以保持之前更新趋势，而不会卡在当前梯度较小的点。每训练10个epochs将学习率调整至原值的0.1倍；总训练轮数达100个epochs后，停止训练，获得优化后的玻璃表面缺陷模型；

模型评估，采用验证集作为玻璃表面缺陷模型的评估指标，本实施例的硬件为RTX2020GPU，软件环境为Ubuntu16.04操作系统，基于Python脚本语言，Pytorch1.8深度学习框架和Pycharm开发平台对优化训练后的玻璃表面缺陷模型进行评估；

模型测试，采用测试集对优化训练后的玻璃表面缺陷模型进行测试，判断优化训练后的玻璃表面缺陷模型效果，满足检测条件即获得优化后的玻璃表面缺陷模型。

此实施例中，热轧带钢表面缺陷数据集采用公开的缺陷图片数据集，利用迁移学习方法，借助热轧带钢表面缺陷数据集获得特征参数的同时保持与目标对象数据集的相关性，可以有效的解决数据样本量小的问题，并且能加速玻璃表面缺陷模型的训练、改善玻璃表面缺陷检测模型的检测效果；BackBone主干网络中加入注意力机制模块CBAM，可优化玻璃表面缺陷模型，增强网络感受野，对特征进行自适应细化处理；构件损失函数，加强玻璃表面缺陷模型的收敛效果以及对玻璃表面缺陷模型准确度的有效评估。

显然，上述实施例仅仅是为清楚地说明所作的举例，而并非对实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims

1.一种基于迁移学习的小样本目标识别方法，其特征在于，包括以下步骤，

S2、将样本图像制作成样本数据集；

S3、构建玻璃表面缺陷模型；

S4、获取热轧带钢表面缺陷数据集，采用迁移学习方法，将热轧带钢表面缺陷数据集作为特征输入对玻璃表面缺陷模型进行预训练，获得玻璃表面模型的初始权重；用样本数据集对玻璃表面缺陷模型进行训练，获得优化后的玻璃表面缺陷模型；

2.根据权利要求1所述的基于迁移学习的小样本目标识别方法，其特征在于，所述S2包括：

将样本数据集按照yolo的格式进行标签的制作；

将样本数据集按比例划分为训练集、测试集和验证集。

3.根据权利要求2所述的基于迁移学习的小样本目标识别方法，其特征在于，所述S3包括：

4.根据权利要求3所述的基于迁移学习的小样本目标识别方法，其特征在于，所述残差块由两个部分组成，其中一部分由卷积块、BN层以及Mish激活函数组成，对图像特征进行抽象提取，缺陷特征信息不可逆，另一部分直接对图像特征进行获取，处理完成后，两部分的特征向量相加融合。

5.根据权利要求4所述的基于迁移学习的小样本目标识别方法，其特征在于，在BackBone主干网络中加入注意力机制模块CBAM；所述注意力机制模块CBAM的输入为F，所述F为中间层的feature map，每个CSPDacknet模块均包括中间层；所述中间层位于CSPDacknet模块中的两个CBM层之间，所述注意力机制模块CBAM依次生成一维通道Mc和二维通道Ms；所述注意力机制模块CBAM的输出特征为最终注意力权重F′；

Mc(F)＝σ(MLP(avgpool(F))+MLP(maxpool(F)))

Ms(F)＝σ(f^7×7([avgpool(F)；maxpool(F)]))

F′＝Ms(Mc(F)F)×(Mc(F)F)

式中Mc(F)为在channel维度上做attention提取操作，MLP(avgpool(F))为通过多层感知机模块的平均池化，MLP(maxpool(F))为通过多层感知机模块的最大池化；σ为sigmoid函数；

maxpool(F)为对F进行最大池化；

Ms(Mc(F)F)为权重系数；(Ms(F)F)为输入特征。

6.根据权利要求5所述的基于迁移学习的小样本目标识别方法，其特征在于，所述获取热轧带钢表面缺陷数据集包括收集热轧带钢公开的缺陷图片，将缺陷图片统一缩放到416*416的尺寸，对缺陷图片进行图像增强，获得热轧带钢表面缺陷数据集；

所述图像增强包括突出缺陷特征和扩增热轧带钢表面缺陷数据集的样本数量；采用频域增强算法突出缺陷特征；通过旋转、翻转、添加噪声扩增热轧带钢表面缺陷数据集的样本数量。

7.根据权利要求6所述的基于迁移学习的小样本目标识别方法，其特征在于，所述迁移学习方法为载入热轧带钢表面缺陷数据集训练的模型权重作为玻璃表面缺陷模型的初始权重，冻住前部分残差块的网络层，用样本数据集训练后部分残差块的网络层。

8.根据权利要求7所述的基于迁移学习的小样本目标识别方法，其特征在于，所述S4还包括：

构建损失函数；

采用测试集对优化训练后的玻璃表面缺陷模型进行测试。

9.根据权利要求8所述的基于迁移学习的小样本目标识别方法，其特征在于，所损失函数为

Loss_total＝Loss_location+Loss_conf+Loss_class

使用CIOU损失计算box的损失，公式如下

10.根据权利要求9所述的基于迁移学习的小样本目标识别方法，其特征在于，所述SGDM动量梯度下降方法为在随机梯度下降的方法上引入动量Momentum；

m_t＝β×m_t-1+(1-β)×g_t