CN114037684A

CN114037684A - 一种基于yolov5和注意力机制模型的疵点检测方法

Info

Publication number: CN114037684A
Application number: CN202111316595.8A
Authority: CN
Inventors: 朱加乐; 江结林; 陈亚当; 金子龙
Original assignee: Nanjing University of Information Science and Technology
Current assignee: Nanjing University of Information Science and Technology
Priority date: 2021-11-08
Filing date: 2021-11-08
Publication date: 2022-02-11
Anticipated expiration: 2041-11-08
Also published as: CN114037684B

Abstract

本发明公开了一种基于yo1ov5和注意力机制模型的疵点检测方法，包括：基于yo1ov5网络和注意力机制模型构建疵点检测模型；对导入的工业疵点图像进行预处理，将预处理图像导入疵点检测模型，得到形状不同的三个输出特征层；对形状不同的三个输出特征层进行预测，生成边界框并预测类别；对图像上疵点的类别和疵点的位置信息进行显示，得到疵点检测图像。本发明可以有效的提高模型对空间特征和通道特征的学习，通过检测头可以实现对不同大小的疵点进行检测，提高了对于大疵点的检测效果，从而提高检测效率，解决了当前工业疵点检测算法很难同时保证检测算法的准确率及实时性。

Description

一种基于yolov5和注意力机制模型的疵点检测方法

技术领域

本发明涉及图像检测技术领域，具体而言涉及一种基于yolov5和注意力机制模型的疵点检测方法。

背景技术

工业材料是制作工业产品必不可少的材料，与人们生活息息相关。在工业生产过程中，为确保工业材料的质量，疵点检测是一个必不可少的步骤。目前大部分工厂仍然采用传统的人工，或者半人工的检测方式，但由于人工长时间的工作，会导致疲惫、注意力不集中，这些因素都会导致工业疵点的漏检。工业材料表面的自动缺陷检测可以克服这个问题，自动缺陷检测的核心技术是算法，目前最具影响力的方法是基于深度学习图像检测算法。由于神经网络模型在工业方面的应用，使得疵点检测领域走向了完全自动化的阶段。

疵点检测算法分为无监督学习和有监督学习两种，其中大部分算法都是基于有监督学习的。在有监督学习中一般分为两类：一阶段算法和两阶段算法。其中两阶段算法中较为经典的有R-CNN、Fast-R-CNN、Faster-R-CNN。两阶段算法的优点是精度高，但其效率相对低下，实时性不高。一阶段算法是在两阶段的基础上提出来的，能有效解决两阶段算法的效率低问题，但其缺陷是牺牲了算法的检测精度，一阶段算法主要包括yolov1、yolov2、yolov3等。

目前疵点检测存在的主要缺陷是，在算法保持较高精度的同时，很难保障算法的时效性；或保持了算法的时效性时，算法的精度难以得到保证。

专利号为2021111205541的发明中提出了一种基于扩张坐标注意力的改进YOLOv3目标检测方法，采用具有不同扩张率的并行的多个扩张卷积结构对坐标注意力模块进行改进，引入扩张坐标注意力模块，构建得到改进YOLOv3目标检测网络；采用多尺度训练策略，预先设定更多不同尺度的图像进行训练。但该方法主要是针对YOLOv3网络。专利号为CN112990392A的发明中提出了一种基于改进YOLOv5算法的新材料地板缺陷目标检测系统，包括改进YOLOv5网络模型，改进YOLOv5网络模型包括输入端、主干网络模块、颈部网络模型和输出端；所述输入端的自适应锚框计算单元内的初始锚框根据尺度划分为4类，每类具有3个初始锚框；并在所述颈部网络的4个检测头前嵌入注意力机制块，改进YOLOv5网络模型的检测精度和速度满足实际生产需求，同时具有较低的参数量，更易于嵌入小型设备使用。虽然提到了特征融合相加，但是是通过下采样增大特征图尺寸再与CBL模块中卷积块输出的特征图进行特征融合相加，仍然是传统的特征堆叠方法，特征融合度仍然不够。

发明内容

本发明针对现有技术中的不足，提供一种基于yolov5和注意力机制模型的疵点检测方法，可以有效的提高模型对空间特征和通道特征的学习，通过检测头可以实现对不同大小的疵点进行检测，提高了对于大疵点的检测效果，从而提高检测效率，解决了当前工业疵点检测算法很难同时保证检测算法的准确率及实时性。

为实现上述目的，本发明采用以下技术方案：

第一方面，本发明实施例提出了一种基于yolov5和注意力机制模型的疵点检测方法，所述疵点检测方法包括以下步骤：

S1，基于yolov5网络和注意力机制模型构建疵点检测模型，疵点检测模型用于对输入图片进行下采样后，采用注意力模块筛选出有意义的特征，再进行5层进一步的特征卷积处理，最后，将中层特征图与深层特征图上采样的结果进行堆叠后再次做卷积和上采样处理，将处理结果与浅层特征图进行融合和残差处理，得到第一个输出特征层；将第一个输出特征层再次与中层特征图与深层特征图的堆叠结果进行融合和残差处理，得到第二个输出特征层；将第二个输出特征层再次与深层特征图进行融合和残差处理，得到第三个输出特征层；

S2，对导入的工业疵点图像进行预处理，将预处理图像导入疵点检测模型，得到形状不同的三个输出特征层；

S3，对形状不同的三个输出特征层进行预测，生成边界框并预测类别；

S4，对图像上疵点的类别和疵点的位置信息进行显示，得到疵点检测图像。

进一步地，步骤S1中，疵点检测模型包括下采样模块、注意力模块、第一特征提取模块、第一残差模块、第二特征提取模块、第二残差模块、第三特征提取模块、第三残差模块、第四特征提取模块、映射模块、第四残差模块、第五特征提取模块、第一上采样模块、第一融合模块、第五残差模块、第六特征提取模块、第二上采样模块、第二融合模块、第七残差模块、第一卷积模块、第七特征提取模块、第三融合模块、第八残差模块、第二卷积模块、第八特征提取模块、第四融合模块、第九残差模块和第三卷积模块；

所述下采样模块、注意力模块、第一特征提取模块、第一残差模块、第二特征提取模块、第二残差模块、第三特征提取模块、第三残差模块、第四特征提取模块、映射模块、第四残差模块、第五特征提取模块、第一上采样模块依次相连；第三残差模块的输出结果与第一上采样模块的输出结果同时输入第一融合模块，第一融合模块的输出端再依次与第五残差模块、第六特征提取模块、第二上采样模块相连；第二上采样模块的输出结果与第二残差模块的输出结果同时输入第二融合模块，第二融合模块的输出端再依次与第七残差模块、第一卷积模块相连，以输出第一个输出特征层；

所述第七残差模块的输出结果经第七特征提取模块处理后，与第六特征提取模块的输出结果同时输入第三融合模块，第三融合模块的输出结果再依次与第八残差模块、第二卷积模块相连，以输出第二个输出特征层；

所述第八残差模块的输出结果经第八特征提取模块处理后，与第五特征提取模块的输出结果同时输入第四融合模块，第四融合模块的输出结果再依次与第九残差模块、第三卷积模块相连，以输出第三个输出特征层。

进一步地，每个特征提取模块均包括依次相连的卷积层、归一化层和激活层。

进一步地，所述注意力模块包括通道注意力单元、空间注意力单元、第一融合单元和第二融合单元；

所述第一融合单元用于融合下采样结果和经过通道注意力单元处理后下采样结果；所述第二融合单元用于融合第一融合单元的处理结果和经过空间注意力单元处理后的第一融合单元的处理结果。

进一步地，所述对导入的工业疵点图像进行预处理是指：

采用Mosaic数据增强技术对导入的工业疵点图像进行数据增强处理。

进一步地，步骤S3中，对形状不同的三个输出特征层进行预测，生成边界框并预测类别的过程包括以下步骤：

S31，利用目标框损失函数，计算出目标框的信息；再利用非极大值抑制，将不符合的目标框筛选出来，进行丢弃，输出符合的目标框信息；

S32，利用交叉熵损失对学习到的特征进行类别的分类，输出类别的信息。

第二方面，本发明实施例提出了一种基于yolov5和注意力机制模型的疵点检测装置，所述疵点检测装置包括预处理模块、疵点检测模型和预测显示模型；

所述预处理模块用于对导入的工业疵点图像进行预处理；

所述疵点检测模型用于对预处理后的工业疵点图像进行处理，对输入图片进行下采样后，采用注意力模块筛选出有意义的特征，再进行5层进一步的特征卷积处理，最后，将中层特征图与深层特征图上采样的结果进行堆叠后再次做卷积和上采样处理，将处理结果与浅层特征图进行融合和残差处理，得到第一个输出特征层；将第一个输出特征层再次与中层特征图与深层特征图的堆叠结果进行融合和残差处理，得到第二个输出特征层；将第二个输出特征层再次与深层特征图进行融合和残差处理，得到第三个输出特征层；

所述预测显示模型用于对形状不同的三个输出特征层进行预测，生成边界框并预测类别；以及对图像上疵点的类别和疵点的位置信息进行显示，得到疵点检测图像。

进一步地，所述疵点检测模型包括下采样模块、注意力模块、第一特征提取模块、第一残差模块、第二特征提取模块、第二残差模块、第三特征提取模块、第三残差模块、第四特征提取模块、映射模块、第四残差模块、第五特征提取模块、第一上采样模块、第一融合模块、第五残差模块、第六特征提取模块、第二上采样模块、第二融合模块、第七残差模块、第一卷积模块、第七特征提取模块、第三融合模块、第八残差模块、第二卷积模块、第八特征提取模块、第四融合模块、第九残差模块和第三卷积模块；

本发明的有益效果是：

与目前疵点检测算法相比，本发明的yolov5结合注意力机制的疵点检测算法通过数据增强进行预处理，提高模型的学习效果；利用yolov5模型对图像进行特征的提取和学习，在模型中加入注意力机制，且是在网络的第一次focus卷积层后在入注意力机制模块，这样可以保证在原有输入信息丢失很少的情况下，更好的学习到输入信息的空间信息和通道信息，从而在使用极少量参数量的情况下，实现对于疵点更精准的定位和分类；只是通过检测头就可以实现对不同大小的疵点进行检测，提高了对于大疵点的检测效果，从而提高检测效率，解决了当前工业疵点检测算法很难同时保证检测算法的准确率及实时性的问题。

附图说明

图1为本发明实施例的基于yolov5和注意力机制模型的疵点检测方法流程图。

图2为本发明实施例的疵点检测模型的结构示意图。

图3(a)为带疵点的图像示意图；图3(b)为针对图3(a)图像的疵点检测效果示意图。

图4(a)为带疵点的图像示意图；图4(b)为针对图4(a)图像的疵点检测效果示意图。

具体实施方式

现在结合附图对本发明作进一步详细的说明。

需要注意的是，发明中所引用的如“上”、“下”、“左”、“右”、“前”、“后”等的用语，亦仅为便于叙述的明了，而非用以限定本发明可实施的范围，其相对关系的改变或调整，在无实质变更技术内容下，当亦视为本发明可实施的范畴。

图1为本发明实施例的基于yolov5和注意力机制模型的疵点检测方法流程图。参见图1，该疵点检测方法包括以下步骤：

S1，基于yolov5网络和注意力机制模型构建疵点检测模型，疵点检测模型用于对输入图片进行下采样后，采用注意力模块筛选出有意义的特征，再进行5层进一步的特征卷积处理，最后，将中层特征图与深层特征图上采样的结果进行堆叠后再次做卷积和上采样处理，将处理结果与浅层特征图进行融合和残差处理，得到第一个输出特征层；将第一个输出特征层再次与中层特征图与深层特征图的堆叠结果进行融合和残差处理，得到第二个输出特征层；将第二个输出特征层再次与深层特征图进行融合和残差处理，得到第三个输出特征层。

S2，对导入的工业疵点图像进行预处理，将预处理图像导入疵点检测模型，得到形状不同的三个输出特征层。示例性地，可以采用Mosaic数据增强技术，包括随机缩放、随机裁剪、随机排布的方式进行拼接，对于小目标的检测效果还是很不错的，得到预处理图像。

s3，对形状不同的三个输出特征层进行预测，生成边界框并预测类别。具体的，包括以下步骤：S31，利用目标框损失函数，计算出目标框的信息；再利用非极大值抑制，将不符合的目标框筛选出来，进行丢弃，输出符合的目标框信息；S32，利用交叉熵损失对学习到的特征进行类别的分类，输出类别的信息。

参见图2，所述疵点检测模型包括下采样模块、注意力模块、第一特征提取模块、第一残差模块、第二特征提取模块、第二残差模块、第三特征提取模块、第三残差模块、第四特征提取模块、映射模块、第四残差模块、第五特征提取模块、第一上采样模块、第一融合模块、第五残差模块、第六特征提取模块、第二上采样模块、第二融合模块、第七残差模块、第一卷积模块、第七特征提取模块、第三融合模块、第八残差模块、第二卷积模块、第八特征提取模块、第四融合模块、第九残差模块和第三卷积模块。

所述下采样模块、注意力模块、第一特征提取模块、第一残差模块、第二特征提取模块、第二残差模块、第三特征提取模块、第三残差模块、第四特征提取模块、映射模块、第四残差模块、第五特征提取模块、第一上采样模块依次相连；第三残差模块的输出结果与第一上采样模块的输出结果同时输入第一融合模块，第一融合模块的输出端再依次与第五残差模块、第六特征提取模块、第二上采样模块相连；第二上采样模块的输出结果与第二残差模块的输出结果同时输入第二融合模块，第二融合模块的输出端再依次与第七残差模块、第一卷积模块相连，以输出第一个输出特征层。

所述第七残差模块的输出结果经第七特征提取模块处理后，与第六特征提取模块的输出结果同时输入第三融合模块，第三融合模块的输出结果再依次与第八残差模块、第二卷积模块相连，以输出第二个输出特征层。

下面对每个模块的工作原理进行说明。

下采样模块(Focus层)：首先对输入图片进行切片操作，然后通过concat操作连接到一起，形成图片大小为输入图片的一半通道数为输入图像的4倍，最后进行卷积输出特征图。将平面上的信息转换到通道维度，再通过卷积的方式提取不同特征。采用Focus层的目的是下采样，Focus层能够有效减少下采样带来的信息损失，同时减少计算量。

注意力模块(CBAM层)：由于每个特征图相当于捕获了原图中的某一个特征，通道注意力有助于筛选出有意义的特征，即告诉CNN原图哪一部分特征具有意义。由于特征图中一个像素代表原图中某个区域的某种特征，空间注意力相当于告诉网络应该注意原图中哪个区域的特征。获得需要重点关注的目标区域，以获取更多所需要关注目标的细节信息，而抑制其他无用信息。

特征提取模块(CBL层)：每个特征提取模块均包括依次相连的卷积层(Conv)、归一化层(BN)和激活层(SiLU)。卷积层的作用是进一步地提取特征，批归一化的作用是使得每一层神经网络的输入保持相同分布的，而BN就是通过一定的规范化手段，把每层神经网络任意神经元。这个输入值的分布强行拉回到均值为0方差为1的标准正态分布，其实就是把越来越偏的分布强制拉回比较标准的分布，这样使得激活输入值落在非线性函数对输入比较敏感的区域，这样输入的小变化就会导致损失函数较大的变化，意思是这样让梯度变大，避免梯度消失问题产生，而且梯度变大意味着学习收敛速度快，能大大加快训练速度。

残差模块(C3)：C3中包含Res unit(残差单元)结构，C3层是为了进一步提取特征，同时加上输入信息，在没有损失特征信息的前提下，进一步学习特征中的信息。

映射模块(SPP)：SPP模块首要作用是用来解决输入特征图尺寸不统一的问题。大部分目标检测网络中，一般都会在最后使用全连接层作为输出层，这要求输入特征图的尺寸固定。SPP模块，使用固定分块的池化操作，可以对不同尺寸的输入实现相同大小的输出，因此能够避免这一问题。此外，SPP中不同大小特征的融合，有利于待检测图像中目标大小差异较大的情况。

上采样模块：上采样模块的作用是放大原图像，从而改变图样的大小。

融合模块：融合模块的作用是将特征图沿通道相加。

本发明主要解决工业疵点检测问题，通过yolov5结合注意力机制的策略，建立一种新的基于深度学习的疵点检测方法。最终实现对工业材料智能检测的目的。与目前疵点检测算法相比，yolov5结合注意力机制的疵点检测算法通过数据增强进行预处理，提高模型的学习效果；利用yolov5模型对图像进行特征的提取和学习，在模型中加入注意力机制，从而可以有效的提高模型对空间特征和通道特征的学习，通过检测头可以实现对不同大小的疵点进行检测，提高了对于大疵点的检测效果，从而提高检测效率。下面给出两组具体的检测样例。如图3(a)、图3(b)、图4(a)、图4(b)所示，图1(a)和图4(a)分别为两种不同材料不同疵点的图像示意图，图3(b)和图4(b)为相应的基于yolov5结合注意力机制的疵点检测效果。其中class1代表疵点的类别为1，0.88表示对于这个疵点的置信度为0.88。

以上仅是本发明的优选实施方式，本发明的保护范围并不仅局限于上述实施例，凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理前提下的若干改进和润饰，应视为本发明的保护范围。

Claims

1.一种基于yolov5和注意力机制模型的疵点检测方法，其特征在于，所述疵点检测方法包括以下步骤：

2.根据权利要求1所述的基于yolov5和注意力机制模型的疵点检测方法，其特征在于，步骤S1中，疵点检测模型包括下采样模块、注意力模块、第一特征提取模块、第一残差模块、第二特征提取模块、第二残差模块、第三特征提取模块、第三残差模块、第四特征提取模块、映射模块、第四残差模块、第五特征提取模块、第一上采样模块、第一融合模块、第五残差模块、第六特征提取模块、第二上采样模块、第二融合模块、第七残差模块、第一卷积模块、第七特征提取模块、第三融合模块、第八残差模块、第二卷积模块、第八特征提取模块、第四融合模块、第九残差模块和第三卷积模块；

3.根据权利要求2所述的基于yolov5和注意力机制模型的疵点检测方法，其特征在于，每个特征提取模块均包括依次相连的卷积层、归一化层和激活层。

4.根据权利要求1所述的基于yolov5和注意力机制模型的疵点检测方法，其特征在于，所述注意力模块包括通道注意力单元、空间注意力单元、第一融合单元和第二融合单元；

5.根据权利要求1所述的基于yolov5和注意力机制模型的疵点检测方法，其特征在于，所述对导入的工业疵点图像进行预处理是指：

6.根据权利要求1所述的基于yolov5和注意力机制模型的疵点检测方法，其特征在于，步骤S3中，对形状不同的三个输出特征层进行预测，生成边界框并预测类别的过程包括以下步骤：

7.一种基于yolov5和注意力机制模型的疵点检测装置，其特征在于，所述疵点检测装置包括预处理模块、疵点检测模型和预测显示模型；

所述预处理模块用于对导入的工业疵点图像进行预处理；

8.根据权利要求7所述的基于yolov5和注意力机制模型的疵点检测装置，其特征在于，所述疵点检测模型包括下采样模块、注意力模块、第一特征提取模块、第一残差模块、第二特征提取模块、第二残差模块、第三特征提取模块、第三残差模块、第四特征提取模块、映射模块、第四残差模块、第五特征提取模块、第一上采样模块、第一融合模块、第五残差模块、第六特征提取模块、第二上采样模块、第二融合模块、第七残差模块、第一卷积模块、第七特征提取模块、第三融合模块、第八残差模块、第二卷积模块、第八特征提取模块、第四融合模块、第九残差模块和第三卷积模块；

9.根据权利要求7所述的基于yolov5和注意力机制模型的疵点检测装置，其特征在于，所述注意力模块包括通道注意力单元、空间注意力单元、第一融合单元和第二融合单元；