CN113763364A

CN113763364A - 一种基于卷积神经网络的图像缺陷检测方法

Info

Publication number: CN113763364A
Application number: CN202111056024.5A
Authority: CN
Inventors: 杨利军; 邓新
Original assignee: Shenzhen Yonggu Precision Fixture Co ltd
Current assignee: Shenzhen Yonggu Precision Fixture Co ltd
Priority date: 2021-09-09
Filing date: 2021-09-09
Publication date: 2021-12-07
Anticipated expiration: 2041-09-09
Also published as: CN113763364B

Abstract

本发明公开了一种基于卷积神经网络的图像缺陷检测方法，目标检测技术领域，包括训练阶段和测试阶段；训练阶段：选取Q幅原始的缺陷检测图像及每幅原始的缺陷检测图像对应的真实检测分类图像构成训练集；构建卷积神经网络检测模型；将训练集中的每幅原始的RGB彩色图像进行数据增强，输入到卷积神经网络中进行训练，得到训练集中的每幅原始的缺陷图像对应的缺陷图像的检测结果；测试阶段：取多幅原始的缺陷图像以及相应的真实检测图像作为测试集；将检测的缺陷图像输入到卷积神经网络检测模型中，得到待检测图像对应的边框回归坐标、目标分类结果和置信度大小。本发明能够比较准确地描述缺陷存在的位置，从而有效地提高了缺陷检测的精确度。

Description

一种基于卷积神经网络的图像缺陷检测方法

技术领域

本发明属于深度学习的目标检测技术领域，更具体的说是涉及一种基于卷积神经网络的图像缺陷检测方法。

背景技术

随着新一代信息技术与制造业的深入融合，引发制造业产生了巨大变革，逐步从数量扩增向质量提升转变。影响产品质量的因素多种多样，如产品存在变形等问题就会严重影响产品的价值。因此，产品图像缺陷的目标检测就异常重要。所谓目标检测，简单来讲就是检测图像中的对象是什么以及在哪里的问题，即“目标分类+定位”问题。

深度学习用于目标检测的算法从思路上来看，可以分为两大类，一类是两阶段检测方法，也就是把整个分为两部分，生成候选框和识别框内物体，它在检测准确率和定位精度上占优；另一类是单阶段检测方法，把整个流程统一在一起，直接给出检测结果，在算法速度上占优。前者作为特征提取器，给出图像不同大小、不同抽象层次的表示；后者则依据这些表示和监督信息学习类别和位置关联。检测头部负责的类别预测和位置回归两个任务常常是并行进行的，构成多任务的损失进行联合训练。其检测速度快，但在小物体目标检测任务上的效果却不太好。

因此，如何提供一种基于卷积神经网络的图像缺陷检测方法是本领域技术人员亟需解决的问题。

发明内容

有鉴于此，本发明提供了一种基于卷积神经网络的图像缺陷检测方法，能够比较准确地描述缺陷存在的位置，从而有效地提高了缺陷检测的精确度。

为了实现上述目的，本发明采用如下技术方案：

一种基于卷积神经网络的图像缺陷检测方法，包括：训练阶段和测试阶段两个过程；

所述的训练阶段过程的步骤为：

步骤S11：选取Q幅原始的缺陷检测图像及每幅原始的缺陷检测图像对应的真实检测分类图像，并构成训练集；

步骤S12：构建卷积神经网络检测模型；

步骤S13：将训练集中的每幅原始的RGB彩色图像进行数据增强之后作为初始输入图像，输入到卷积神经网络中进行训练，得到训练集中的每幅原始的缺陷图像对应的缺陷图像的检测结果；

步骤S14：计算训练集中的每幅原始的缺陷图像对应的边框回归坐标、目标分类结果和置信度大小构成的集合与对应的真实边框回归坐标、目标分类结果和置信度大小构成的集合之间的损失函数值；

所述的测试阶段过程的步骤为：

步骤S21：取多幅原始的缺陷图像以及相应的真实检测图像作为测试集；

步骤S22：将检测的缺陷图像的R通道分量、G通道分量和B通道分量输入到卷积神经网络检测模型中，并利用已经训练好的网络权重进行预测，得到待检测图像对应的边框回归坐标、目标分类结果和置信度大小。

进一步的，卷积神经网络检测模型包括特征提取层，编码层和解码层和检测层四个部分；特征提取层包含6个模块，分别定义为头部卷积模块，第1个提取模块，第2个提取模块，第3个提取模块，第4个提取模块，第5个提取模块；对于编码层，包含2个模块，分别定义为基础编码模块和编码模块；解码层包含2个模块，分别定义为分类子网络模块和边界框子网络模块；检测层包含1个检测模块。

进一步的，头部卷积模块，由依次设置的第一卷积层，第一批量归一化层，第一激活层组成；其中第一卷积层采用卷积核大小为3，步长为1，边缘填充为1，卷积核个数为32；第一卷积层的输入端接收原始输入图像的RGB三通道分量，要求输入端接收的原始输入图像的宽度为W、高度为H；经过第一批量归一化层的归一化操作之后再经过第一激活层输出32幅输出特征图；将32副特征图构成的集合记为N₁，其中每幅特征图的宽度为W、高度为H。

进一步的，第1个提取模块，依次由基础模块，部分转换模块一，阶段模块，部分转换模块二，融合转换模块组成；基础模块依次由卷积层，归一化层和激活层组成，卷积层，卷积核大小为3×3，步长为2，填充系数为1，卷积核个数为64；部分转换模块一，依次由卷积层，卷积核为1，步长为1，卷积核个数为64，归一化层和激活层组成；阶段模块，则由1个残差模块组成，残差模块的主分支依次由下采样层，第一卷积层，卷积核为1，步长为1，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为1，第二归一化层和第二激活层组成；部分转换模块二，依次由卷积层，卷积核为1，步长为1，归一化层和激活层组成；融合转换模块，依次由卷积层，卷积核大小为1，步长为1，归一化层，激活层组成；

第2个提取模块，依次由基础模块，部分转换模块一，阶段模块，部分转换模块二，融合转换模块组成；基础模块依次由卷积层，归一化层和激活层组成，卷积层，卷积核大小为3×3，步长为2，填充系数为1，卷积核个数为128；部分转换模块一，依次由卷积层，卷积核为1，步长为1，卷积核个数为64，归一化层和激活层组成；阶段模块，由2个残差模块组成，对于第一个残差模块，主分支依次由下采样层，第一卷积层，卷积核为1，步长为1，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为1，第二归一化层和第二激活层组成；第二个残差模块，与第一个残差模块相比没有下采样层，其他结构完全相同；对于部分转换模块二，依次由卷积层，卷积核为1，步长为1，归一化层和激活层组成；对于融合转换模块，依次由卷积层，卷积核大小为1，步长为1，归一化层，激活层组成；

第3个提取模块，依次由基础模块，部分转换模块一，阶段模块，部分转换模块二，融合转换模块组成；基础模块依次由卷积层，归一化层和激活层组成，对于卷积层，卷积核大小为3×3，步长为2，填充系数为1，卷积核个数为256；对于部分转换模块一，依次由卷积层，卷积核为1，步长为1，卷积核个数为128，归一化层和激活层组成；阶段模块，则由8个残差模块组成，第一个残差模块，主分支依次由下采样层，第一卷积层，卷积核为1，步长为1，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为1，第二归一化层和第二激活层组成；其他残差模块，与第一个残差模块相比没有下采样层，其他结构完全相同；部分转换模块二，依次由卷积层，卷积核为1，步长为1，归一化层和激活层组成；融合转换模块，依次由卷积层，卷积核大小为1，步长为1，归一化层，激活层组成；

第4个提取模块，依次由基础模块，部分转换模块一，阶段模块，部分转换模块二，融合转换模块组成；基础模块依次由卷积层，归一化层和激活层组成，对于卷积层，卷积核大小为3×3，步长为2，填充系数为1，卷积核个数为512；部分转换模块一，依次由卷积层，卷积核为1，步长为1，卷积核个数为256，归一化层和激活层组成；阶段模块，则由8个残差模块组成，对于第一个残差模块，主分支依次由下采样层，第一卷积层，卷积核为1，步长为1，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为1，第二归一化层和第二激活层组成；其他残差模块，与第一个残差模块相比没有下采样层，其他结构完全相同；部分转换模块二，依次由卷积层，卷积核为1，步长为1，归一化层和激活层组成；融合转换模块，依次由卷积层，卷积核大小为1，步长为1，归一化层，激活层组成；

第5个提取模块，依次由基础模块，部分转换模块一，阶段模块，部分转换模块二，融合转换模块组成；基础模块依次由卷积层，归一化层和激活层组成，对于卷积层，卷积核大小为3×3，步长为2，填充系数为1，空洞系数为2，卷积核个数为1024；部分转换模块一，依次由卷积层，卷积核为1，步长为1，卷积核个数为512，归一化层和激活层组成；阶段模块，则由4个残差模块组成，第一个残差模块，主分支依次由下采样层，第一卷积层，卷积核为1，步长为1，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为2，空洞系数为2，第二归一化层和第二激活层组成；其他残差模块，与第一个残差模块相比没有下采样层，其他结构完全相同；部分转换模块二，依次由卷积层，卷积核为1，步长为1，归一化层和激活层组成；融合转换模块，依次由卷积层，卷积核大小为1，步长为1，归一化层，激活层组成。

进一步的，基础编码模块，依次由第一卷积层，第一归一化层，第二卷积层，第二归一化层组成；对于第一卷积层，卷积核大小为1，步长为1，卷积核个数为512；对于第二卷积层，卷积核大小为3，步长为1，填充系数为1，卷积核个数为512。

进一步的，编码模块，依次由第1个残差单元，第2个残差单元，第3个残差单元，第4个残差单元，第5个残差单元，第6个残差单元，第7个残差单元和第8个残差单元组成；对于第1个残差单元，主分支依次由第一卷积层，卷积核为1，步长为1，卷积核个数为128，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为1，卷积核个数为128，第二归一化层，第二激活层，第三卷积层，卷积核为1，步长为1，卷积核个数为512，第三归一化层，第三激活层组成；第2个残差单元，主分支依次由第一卷积层，卷积核为1，步长为1，卷积核个数为128，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为2，空洞系数为2，卷积核个数为128，第二归一化层，第二激活层，第三卷积层，卷积核为1，步长为1，卷积核个数为512，第三归一化层，第三激活层组成；第3个残差单元，主分支依次由第一卷积层，卷积核为1，步长为1，卷积核个数为128，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为3，空洞系数为3，卷积核个数为128，第二归一化层，第二激活层，第三卷积层，卷积核为1，步长为1，卷积核个数为512，第三归一化层，第三激活层组成；对于第4个残差单元，主分支依次由第一卷积层，卷积核为1，步长为1，卷积核个数为128，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为4，空洞系数为4，卷积核个数为128，第二归一化层，第二激活层，第三卷积层，卷积核为1，步长为1，卷积核个数为512，第三归一化层，第三激活层组成；对于第5个残差单元，主分支依次由第一卷积层，卷积核为1，步长为1，卷积核个数为128，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为5，空洞系数为5，卷积核个数为128，第二归一化层，第二激活层，第三卷积层，卷积核为1，步长为1，卷积核个数为512，第三归一化层，第三激活层组成；对于第6个残差单元，主分支依次由第一卷积层，卷积核为1，步长为1，卷积核个数为128，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为6，空洞系数为6，卷积核个数为128，第二归一化层，第二激活层，第三卷积层，卷积核为1，步长为1，卷积核个数为512，第三归一化层，第三激活层组成；对于第7个残差单元，主分支依次由第一卷积层，卷积核为1，步长为1，卷积核个数为128，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为7，空洞系数为7，卷积核个数为128，第二归一化层，第二激活层，第三卷积层，卷积核为1，步长为1，卷积核个数为512，第三归一化层，第三激活层组成；对于第8个残差单元，主分支依次由第一卷积层，卷积核为1，步长为1，卷积核个数为128，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为8，空洞系数为8，卷积核个数为128，第二归一化层，第二激活层，第三卷积层，卷积核为1，步长为1，卷积核个数为512，第三归一化层，第三激活层组成。

进一步的，分类子网络模块，依次由第一卷积层，第一归一化层，第一激活层，第二卷积层，第二归一化层，第二激活层和分类得分模块组成；第一卷积层，卷积核大小为3，步长为1，填充系数为1，卷积核个数为512；第二卷积层，卷积核大小为3，步长为1，填充系数为1，卷积核个数为512；分类得分模块，由卷积层组成，卷积核大小为3，步长为1，填充系数为1，卷积核个数为144。

进一步的，边界框子网络模块，依次由第一卷积层，第一归一化层，第一激活层，第二卷积层，第二归一化层，第二激活层，第三卷积层，第三归一化层，第三激活层，第四卷积层，第四归一化层，第四激活层和边界框预测模块组成；第一卷积层，卷积核大小为3，步长为1，填充系数为1，卷积核个数为512；其他卷积层，参数与第一卷积层完全相同；边界框预测模块，由卷积层组成，卷积核大小为3，步长为1，填充系数为1，卷积核个数为24。

进一步的，检测模块，由一个卷积层组成，卷积核大小为3，步长为1，填充系数为1，卷积核个数为6。

本发明的有益效果在于：

(1)本发明方法构建卷积神经网络检测模型，使用训练集中的RGB图像输入到卷积神经网络中进行训练，得到卷积神经网络分类训练模型；再将待检测的图像输入到卷积神经网络分类训练模型中，预测得到缺陷检测图像，由于本发明方法在构建卷积神经网络时使用了新的特征提取方法，使网络可以更好的学习RGB信息，充分利用了特征的信息，因此能够比较准确地描述缺陷存在的位置，从而有效地提高了缺陷检测的精确度。

(2)本发明方法使用了新型的编码模块，有效的提高了缺陷检测的检测精度。

(3)本发明方法在解码部分使用了多级残差结构，进而在训练集和测试集上都获得了很好的检测效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明方法的总体实现框图。

图2为头部卷积模块的实现框图。

图3为提取模块的实现框图。

图4为第i个提取模块中阶段模块的实现框图(1<＝i<＝8)。

图5为编码阶段基础编码模块的实现框图。

图6为编码阶段编码模块的实现框图。

图7为编码模块中第i个残差单元的实现框图(1<＝i<＝8)。

图8为解码阶段分类子网络模块的实现框图。

图9为解码阶段边界框子网络模块的实现框图。

图10a为第一幅原始的图像。

图10b为利用本发明方法对图10a所示的第一幅原始的图像进行检测，所得到的缺陷检测图像。

图11a为第二幅原始的图像。

图11b为利用本发明方法对图11a所示的第二幅原始的图像进行检测，所得到的缺陷检测图像。

图12a为第三幅原始的图像。

图12b为利用本发明方法对图12a所示的第三幅原始的图像进行检测，所得到的缺陷检测图像。

图13a为第四幅原始的图像。

图13b为利用本发明方法对图13a所示的第三幅原始的图像进行检测，所得到的缺陷检测图像。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提出的一种基于卷积神经网络的图像缺陷检测方法，其总体实现框图如图1所示，其包括训练阶段和测试阶段两个过程；

所述的训练阶段过程的具体步骤为：

步骤S11：选取Q幅原始的缺陷检测图像及每幅原始的缺陷检测图像对应的真实检测分类图像，并构成训练集，将训练集中的第q幅原始的待检测缺陷图像的边框坐标、分类结果、置信度大小分别记为

将训练集中与

对应的真实目标检测图像的边框坐标、分类结果、置信度大小分别记为

和

其中，缺陷检测图像为RGB彩色图像，Q为正整数，Q≥10000，如取Q＝7718，q为正整数，1≤q≤Q，在此，原始的缺陷图像采用7718张不同的缺陷图像。

步骤S12：构建卷积神经网络：卷积神经网络包括特征提取层，编码层和解码层和检测层四个部分，参考附图1-9。

特征提取层包含6个模块，分别定义为头部卷积模块，第1个提取模块，第2个提取模块，第3个提取模块，第4个提取模块，第5个提取模块。对于编码层，包含2个模块，分别定义为基础编码模块和编码模块。解码层包含2个模块，分别定义为分类子网络模块和边界框子网络模块。检测层只包括一个检测模块。其中，要求特征提取层的输入端接收的原始输入图像的宽度为W、高度为H。

对于头部卷积模块，其由依次设置的第一卷积层(Convolution，Conv)，第一批量归一化层(BatchNorm)，第一激活层(Activation，Act)组成。其中第一卷积层采用卷积核(kernel_size)大小为3，步长(stride)为1，边缘填充(padding)为1，卷积核个数为32。基础卷积块的输入端接收原始输入图像的RGB三通道分量，要求输入端接收的原始输入图像的宽度为W、高度为H。经过第一批量归一化层的归一化操作之后再经过第一激活层(激活方式为Mish)输出32幅输出特征图。将32副特征图构成的集合记为N₁，其中每幅特征图的宽度为W、高度为H。

对于第1个提取模块，依次由基础模块，部分转换模块一，阶段模块，部分转换模块二，融合转换模块组成。对于基础模块依次由卷积层，归一化层和激活层组成，对于卷积层，卷积核大小为3×3，步长为2，填充系数为1，卷积核个数为64；对于部分转换模块一，依次由卷积层，卷积核为1，步长为1，卷积核个数为64，归一化层和激活层组成；对于阶段模块，则由1个残差模块组成，对于残差模块的主分支依次由下采样层，第一卷积层，卷积核为1，步长为1，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为1，第二归一化层和第二激活层组成，其捷径分支无其他操作，只是单纯的输入数据的流动。每个残差单元最后的操作都是主分支与捷径分支进行Add操作，然后得到输出；对于部分转换模块二，依次由卷积层，卷积核为1，步长为1，归一化层和激活层组成；对于融合转换模块，依次由卷积层，卷积核大小为1，步长为1，归一化层，激活层组成。其中，部分转换模块一为第一个提取模块的分支结构，部分转换模块一的输入为基础模块的输出，部分转换模块一的输出与部分转换模块二的输出进行拼接操作，然后将所得到的特征作为融合转换模块的输入，最终输出64副特征图。将64副特征图构成的集合记为N₂，其中每幅特征图的宽度为

高度为

对于第2个提取模块，依次由基础模块，部分转换模块一，阶段模块，部分转换模块二，融合转换模块组成。对于基础模块依次由卷积层，归一化层和激活层组成，对于卷积层，卷积核大小为3×3，步长为2，填充系数为1，卷积核个数为128；对于部分转换模块一，依次由卷积层，卷积核为1，步长为1，卷积核个数为64，归一化层和激活层组成；对于阶段模块，则由2个残差模块组成，对于第一个残差模块，主分支依次由下采样层，第一卷积层，卷积核为1，步长为1，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为1，第二归一化层和第二激活层组成，其捷径分支无其他操作，只是单纯的输入数据的流动。每个残差单元最后的操作都是主分支与捷径分支进行Add操作，然后得到输出。

对于第二个残差模块，与第一个残差模块相比没有下采样层，其他结构完全相同；对于部分转换模块二，依次由卷积层，卷积核为1，步长为1，归一化层和激活层组成；对于融合转换模块，依次由卷积层，卷积核大小为1，步长为1，归一化层，激活层组成。其中，部分转换模块一为第一个提取模块的分支结构，部分转换模块一的输入为基础模块的输出，部分转换模块一的输出与部分转换模块二的输出进行拼接操作，然后将所得到的特征作为融合转换模块的输入，最终输出128副特征图。将128副特征图构成的集合记为N₃，其中每幅特征图的宽度为

高度为

对于第3个提取模块，依次由基础模块，部分转换模块一，阶段模块，部分转换模块二，融合转换模块组成。对于基础模块依次由卷积层，归一化层和激活层组成，对于卷积层，卷积核大小为3×3，步长为2，填充系数为1，卷积核个数为256；对于部分转换模块一，依次由卷积层，卷积核为1，步长为1，卷积核个数为128，归一化层和激活层组成；对于阶段模块，则由8个残差模块组成，对于第一个残差模块，主分支依次由下采样层，第一卷积层，卷积核为1，步长为1，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为1，第二归一化层和第二激活层组成，其捷径分支无其他操作，只是单纯的输入数据的流动。每个残差单元最后的操作都是主分支与捷径分支进行Add操作，然后得到输出。

对于其他残差模块，与第一个残差模块相比没有下采样层，其他结构完全相同；对于部分转换模块二，依次由卷积层，卷积核为1，步长为1，归一化层和激活层组成；对于融合转换模块，依次由卷积层，卷积核大小为1，步长为1，归一化层，激活层组成。其中，部分转换模块一为第一个提取模块的分支结构，部分转换模块一的输入为基础模块的输出，部分转换模块一的输出与部分转换模块二的输出进行拼接操作，然后将所得到的特征作为融合转换模块的输入，最终输出256副特征图。将256副特征图构成的集合记为N₄，其中每幅特征图的宽度为

高度为

对于第4个提取模块，依次由基础模块，部分转换模块一，阶段模块，部分转换模块二，融合转换模块组成。对于基础模块依次由卷积层，归一化层和激活层组成，对于卷积层，卷积核大小为3×3，步长为2，填充系数为1，卷积核个数为512；对于部分转换模块一，依次由卷积层，卷积核为1，步长为1，卷积核个数为256，归一化层和激活层组成；对于阶段模块，则由8个残差模块组成，对于第一个残差模块，主分支依次由下采样层，第一卷积层，卷积核为1，步长为1，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为1，第二归一化层和第二激活层组成，其捷径分支无其他操作，只是单纯的输入数据的流动。每个残差单元最后的操作都是主分支与捷径分支进行Add操作，然后得到输出，对于其他残差模块，与第一个残差模块相比没有下采样层，其他结构完全相同；对于部分转换模块二，依次由卷积层，卷积核为1，步长为1，归一化层和激活层组成；对于融合转换模块，依次由卷积层，卷积核大小为1，步长为1，归一化层，激活层组成。其中，部分转换模块一为第一个提取模块的分支结构，部分转换模块一的输入为基础模块的输出，部分转换模块一的输出与部分转换模块二的输出进行拼接操作，然后将所得到的特征作为融合转换模块的输入，最终输出512副特征图。将512副特征图构成的集合记为N₅，其中每幅特征图的宽度为

高度为

对于第5个提取模块，依次由基础模块，部分转换模块一，阶段模块，部分转换模块二，融合转换模块组成。对于基础模块依次由卷积层，归一化层和激活层组成，对于卷积层，卷积核大小为3×3，步长为2，填充系数为1，空洞系数为2，卷积核个数为1024；对于部分转换模块一，依次由卷积层，卷积核为1，步长为1，卷积核个数为512，归一化层和激活层组成；对于阶段模块，则由4个残差模块组成，对于第一个残差模块，主分支依次由下采样层，第一卷积层，卷积核为1，步长为1，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为2，空洞系数为2，第二归一化层和第二激活层组成，其捷径分支无其他操作，只是单纯的输入数据的流动。每个残差单元最后的操作都是主分支与捷径分支进行Add操作，然后得到输出，对于其他残差模块，与第一个残差模块相比没有下采样层，其他结构完全相同；对于部分转换模块二，依次由卷积层，卷积核为1，步长为1，归一化层和激活层组成；对于融合转换模块，依次由卷积层，卷积核大小为1，步长为1，归一化层，激活层组成。其中，部分转换模块一为第一个提取模块的分支结构，部分转换模块一的输入为基础模块的输出，部分转换模块一的输出与部分转换模块二的输出进行拼接操作，然后将所得到的特征作为融合转换模块的输入，最终输出1024副特征图。将1024副特征图构成的集合记为N₆，其中每幅特征图的宽度为

高度为

对于基础编码模块，依次由第一卷积层，第一归一化层，第二卷积层，第二归一化层组成。对于第一卷积层，卷积核大小为1，步长为1，卷积核个数为512；对于第二卷积层，卷积核大小为3，步长为1，填充系数为1，卷积核个数为512。编码基础模块的输入为第5个提取模块的输出，最终输出512副特征图。将512副特征图构成的集合记为N₇，其中每幅特征图的宽度为

高度为

对于编码模块，依次由第1个残差单元，第2个残差单元，第3个残差单元，第4个残差单元，第5个残差单元，第6个残差单元，第7个残差单元和第8个残差单元组成。对于第1个残差单元，主分支依次由第一卷积层，卷积核为1，步长为1，卷积核个数为128，第一归一化层，第一激活层(激活方式为LeakyReLU)，第二卷积层，卷积核为3，步长为1，填充系数为1，卷积核个数为128，第二归一化层，第二激活层，第三卷积层，卷积核为1，步长为1，卷积核个数为512，第三归一化层，第三激活层组成；其捷径分支无其他操作，只是单纯的输入数据的流动，残差单元最后的操作是主分支与捷径分支进行Add操作，然后得到输出。对于第2个残差单元，主分支依次由第一卷积层，卷积核为1，步长为1，卷积核个数为128，第一归一化层，第一激活层(激活方式为LeakyReLU)，第二卷积层，卷积核为3，步长为1，填充系数为2，空洞系数为2，卷积核个数为128，第二归一化层，第二激活层，第三卷积层，卷积核为1，步长为1，卷积核个数为512，第三归一化层，第三激活层组成；其捷径分支无其他操作，只是单纯的输入数据的流动，残差单元最后的操作是主分支与捷径分支进行Add操作，然后得到输出。对于第3个残差单元，主分支依次由第一卷积层，卷积核为1，步长为1，卷积核个数为128，第一归一化层，第一激活层(激活方式为LeakyReLU)，第二卷积层，卷积核为3，步长为1，填充系数为3，空洞系数为3，卷积核个数为128，第二归一化层，第二激活层，第三卷积层，卷积核为1，步长为1，卷积核个数为512，第三归一化层，第三激活层组成；其捷径分支无其他操作，只是单纯的输入数据的流动，残差单元最后的操作是主分支与捷径分支进行Add操作，然后得到输出。对于第4个残差单元，主分支依次由第一卷积层，卷积核为1，步长为1，卷积核个数为128，第一归一化层，第一激活层(激活方式为LeakyReLU)，第二卷积层，卷积核为3，步长为1，填充系数为4，空洞系数为4，卷积核个数为128，第二归一化层，第二激活层，第三卷积层，卷积核为1，步长为1，卷积核个数为512，第三归一化层，第三激活层组成；其捷径分支无其他操作，只是单纯的输入数据的流动，残差单元最后的操作是主分支与捷径分支进行Add操作，然后得到输出。对于第5个残差单元，主分支依次由第一卷积层，卷积核为1，步长为1，卷积核个数为128，第一归一化层，第一激活层(激活方式为LeakyReLU)，第二卷积层，卷积核为3，步长为1，填充系数为5，空洞系数为5，卷积核个数为128，第二归一化层，第二激活层，第三卷积层，卷积核为1，步长为1，卷积核个数为512，第三归一化层，第三激活层组成；其捷径分支无其他操作，只是单纯的输入数据的流动，残差单元最后的操作是主分支与捷径分支进行Add操作，然后得到输出。对于第6个残差单元，主分支依次由第一卷积层，卷积核为1，步长为1，卷积核个数为128，第一归一化层，第一激活层(激活方式为LeakyReLU)，第二卷积层，卷积核为3，步长为1，填充系数为6，空洞系数为6，卷积核个数为128，第二归一化层，第二激活层，第三卷积层，卷积核为1，步长为1，卷积核个数为512，第三归一化层，第三激活层组成；其捷径分支无其他操作，只是单纯的输入数据的流动，残差单元最后的操作是主分支与捷径分支进行Add操作，然后得到输出。对于第7个残差单元，主分支依次由第一卷积层，卷积核为1，步长为1，卷积核个数为128，第一归一化层，第一激活层(激活方式为LeakyReLU)，第二卷积层，卷积核为3，步长为1，填充系数为7，空洞系数为7，卷积核个数为128，第二归一化层，第二激活层，第三卷积层，卷积核为1，步长为1，卷积核个数为512，第三归一化层，第三激活层组成；其捷径分支无其他操作，只是单纯的输入数据的流动，残差单元最后的操作是主分支与捷径分支进行Add操作，然后得到输出。对于第8个残差单元，主分支依次由第一卷积层，卷积核为1，步长为1，卷积核个数为128，第一归一化层，第一激活层(激活方式为LeakyReLU)，第二卷积层，卷积核为3，步长为1，填充系数为8，空洞系数为8，卷积核个数为128，第二归一化层，第二激活层，第三卷积层，卷积核为1，步长为1，卷积核个数为512，第三归一化层，第三激活层组成；其捷径分支无其他操作，只是单纯的输入数据的流动，残差单元最后的操作是主分支与捷径分支进行Add操作，然后得到输出。编码模块的输入为编码基础模块的输出，最终输出512副特征图。将512副特征图构成的集合记为N₈，其中每幅特征图的宽度为

高度为

对于分类子网络模块，依次由第一卷积层，第一归一化层，第一激活层，第二卷积层，第二归一化层，第二激活层和分类得分模块组成。对于第一卷积层，卷积核大小为3，步长为1，填充系数为1，卷积核个数为512；对于第二卷积层，卷积核大小为3，步长为1，填充系数为1，卷积核个数为512。对于分类得分模块，由卷积层组成，卷积核大小为3，步长为1，填充系数为1，卷积核个数为144。

对于边界框子网络模块，依次由第一卷积层，第一归一化层，第一激活层，第二卷积层，第二归一化层，第二激活层，第三卷积层，第三归一化层，第三激活层，第四卷积层，第四归一化层，第四激活层和边界框预测模块组成。对于第一卷积层，卷积核大小为3，步长为1，填充系数为1，卷积核个数为512；对于其他卷积层，参数与第一卷积层完全相同。对于边界框预测模块，由卷积层组成，卷积核大小为3，步长为1，填充系数为1，卷积核个数为24。

对于检测模块，由一个卷积层组成，卷积核大小为3，步长为1，填充系数为1，卷积核个数为6。将上述分类子网络模块的输出和边界框子网络模块的输出输入到检测模块，得到物体的边框回归坐标、目标分类结果以及置信度大小。

步骤S13：将训练集中的每幅原始的RGB彩色图像通过裁剪，明亮度，翻转等方式进行数据增强之后作为初始输入图像，批次大小为20。输入到卷积神经网络中进行训练，得到训练集中的每幅原始的缺陷图像对应的缺陷图像的检测结果，将对应的缺陷图像检测得到的边框回归坐标、目标分类结果和置信度大小分别记为J_pre1、J_pre2、J_pre3。

步骤S14：计算训练集中的每幅原始的缺陷图像对应的边框回归坐标、目标分类结果和置信度大小构成的集合与对应的真实边框回归坐标、目标分类结果和置信度大小构成的集合之间的损失函数值，将

与

之间的损失函数值记为

采用二分类交叉熵(binary categoricalcrossentropy)获得，将

与

之间的损失函数值记为

采用二分类交叉熵获得，将

与

之间的损失函数值记为

采用二分类交叉熵获得。

测试阶段过程的具体步骤为：

步骤S21：取8576幅原始的缺陷图像以及相应的真实检测图像作为测试集。令

表示检测的缺陷图像；其中，1≤i'≤W'，1≤j'≤H'，W'表示

的宽度，H'表示

的高度，

表示

中坐标位置为(i,j)的像素点的像素值。

步骤S22：将

的R通道分量、G通道分量和B通道分量输入到卷积神经网络检测模型中，并利用已经训练好的网络权重进行预测，得到待检测图像对应的边框回归坐标、目标分类结果和置信度大小，分别记为

其中

表示I^q通过网络后的得到的预测的边框回归坐标，

表示I^q通过网络后的得到的预测的目标分类结果，

表示I^q通过网络后的得到的预测的置信度大小。

本发明其在训练阶段，构建卷积神经网络，其卷积神经网络由1个头部卷积模块，5个特征提取模块，1个基础编码模块，1个编码模块，1个分类子网络模块，1个边界框子网络模块和一检测模块组成；使用原始的缺陷图像输入到卷积神经网络中进行训练，得到原始输入图像对应的边框回归坐标、目标分类结果和置信度大小；再通过计算原始输入图像对应的边框回归坐标、目标分类结果和置信度大小构成的集合与对应的原始输入图像对应的真实边框回归坐标、真实目标分类结果和真实置信度大小构成的集合之间的损失函数值，从而获得卷积神经网络分类检测训练模型的最优权值矢量和偏置项；在测试阶段，将待检测的道缺陷图像输入到卷积神经网络分类训练模型中，得到缺陷检测预测图像；优点是提高了缺陷图像的检测效率和准确度。

为了进一步验证本发明方法的可行性和有效性，进行实验。

使用基于Python的深度学习库Pytorch搭建卷积神经网络的架构。采用自制的缺陷检测图像的测试集来分析利用本发明方法检测缺陷图像(取x幅道路场景图像)的效果如何。这里，利用评估目标检测方法的常用客观参量作为评价指标，即平均精度均值(mAP：mean average precision)来评价预测缺陷图像的检测性能。

利用本发明方法对测试集中的每幅缺陷图像进行检测，得到每幅缺陷图像对应的边框回归坐标、目标分类结果和置信度大小，反映本发明方法的目标检测效果的平均精度均值如表1所示。从表1所示的数据可知，按本发明方法得到的缺陷图像检测结果是较好的，表明利用本发明方法来检测缺陷图像是可行性且有效的。

表1

图10a给出了同一场景的第1幅原始的缺陷图像，图10b给出了利用本发明方法对图10a所示的原始的缺陷图像进行检测，得到的缺陷分类图像；图11a给出了同一场景的第2幅原始的缺陷图像，图11b给出了利用本发明方法对图11a所示的原始的缺陷图像进行检测，得到的缺陷分类图像；图12a给出了同一场景的第3幅原始的缺陷图像，图12b给出了利用本发明方法对图12a所示的原始的缺陷图像进行检测，得到的缺陷分类图像；图13a给出了同一场景的第1幅原始的缺陷图像，图13b给出了利用本发明方法对图13a所示的原始的缺陷图像进行检测，得到的缺陷分类图像对比图10a和图10b，对比图11a和图11b，对比图12a和图12b，对比图13a和图13b，可以看出利用本发明方法得到的目标检测图像的精确率较高。

Claims

1.一种基于卷积神经网络的图像缺陷检测方法，其特征在于，包括：训练阶段和测试阶段两个过程；

所述的训练阶段过程的步骤为：

步骤S12：构建卷积神经网络检测模型；

所述的测试阶段过程的步骤为：

2.根据权利要求1所述的一种基于卷积神经网络的图像缺陷检测方法，其特征在于，卷积神经网络检测模型包括特征提取层，编码层和解码层和检测层四个部分；特征提取层包含6个模块，分别定义为头部卷积模块，第1个提取模块，第2个提取模块，第3个提取模块，第4个提取模块，第5个提取模块；对于编码层，包含2个模块，分别定义为基础编码模块和编码模块；解码层包含2个模块，分别定义为分类子网络模块和边界框子网络模块；检测层包含1个检测模块。

3.根据权利要求2所述的一种基于卷积神经网络的图像缺陷检测方法，其特征在于，头部卷积模块，由依次设置的第一卷积层，第一批量归一化层，第一激活层组成；其中第一卷积层采用卷积核大小为3，步长为1，边缘填充为1，卷积核个数为32；第一卷积层的输入端接收原始输入图像的RGB三通道分量，要求输入端接收的原始输入图像的宽度为W、高度为H；经过第一批量归一化层的归一化操作之后再经过第一激活层输出32幅输出特征图；将32副特征图构成的集合记为N₁，其中每幅特征图的宽度为W、高度为H。

4.根据权利要求3所述的一种基于卷积神经网络的图像缺陷检测方法，其特征在于，第1个提取模块，依次由基础模块，部分转换模块一，阶段模块，部分转换模块二，融合转换模块组成；基础模块依次由卷积层，归一化层和激活层组成，卷积层，卷积核大小为3×3，步长为2，填充系数为1，卷积核个数为64；部分转换模块一，依次由卷积层，卷积核为1，步长为1，卷积核个数为64，归一化层和激活层组成；阶段模块，则由1个残差模块组成，残差模块的主分支依次由下采样层，第一卷积层，卷积核为1，步长为1，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为1，第二归一化层和第二激活层组成；部分转换模块二，依次由卷积层，卷积核为1，步长为1，归一化层和激活层组成；融合转换模块，依次由卷积层，卷积核大小为1，步长为1，归一化层，激活层组成；

5.根据权利要求4所述的一种基于卷积神经网络的图像缺陷检测方法，其特征在于，基础编码模块，依次由第一卷积层，第一归一化层，第二卷积层，第二归一化层组成；对于第一卷积层，卷积核大小为1，步长为1，卷积核个数为512；对于第二卷积层，卷积核大小为3，步长为1，填充系数为1，卷积核个数为512。

6.根据权利要求5所述的一种基于卷积神经网络的图像缺陷检测方法，其特征在于，编码模块，依次由第1个残差单元，第2个残差单元，第3个残差单元，第4个残差单元，第5个残差单元，第6个残差单元，第7个残差单元和第8个残差单元组成；对于第1个残差单元，主分支依次由第一卷积层，卷积核为1，步长为1，卷积核个数为128，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为1，卷积核个数为128，第二归一化层，第二激活层，第三卷积层，卷积核为1，步长为1，卷积核个数为512，第三归一化层，第三激活层组成；第2个残差单元，主分支依次由第一卷积层，卷积核为1，步长为1，卷积核个数为128，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为2，空洞系数为2，卷积核个数为128，第二归一化层，第二激活层，第三卷积层，卷积核为1，步长为1，卷积核个数为512，第三归一化层，第三激活层组成；第3个残差单元，主分支依次由第一卷积层，卷积核为1，步长为1，卷积核个数为128，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为3，空洞系数为3，卷积核个数为128，第二归一化层，第二激活层，第三卷积层，卷积核为1，步长为1，卷积核个数为512，第三归一化层，第三激活层组成；对于第4个残差单元，主分支依次由第一卷积层，卷积核为1，步长为1，卷积核个数为128，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为4，空洞系数为4，卷积核个数为128，第二归一化层，第二激活层，第三卷积层，卷积核为1，步长为1，卷积核个数为512，第三归一化层，第三激活层组成；对于第5个残差单元，主分支依次由第一卷积层，卷积核为1，步长为1，卷积核个数为128，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为5，空洞系数为5，卷积核个数为128，第二归一化层，第二激活层，第三卷积层，卷积核为1，步长为1，卷积核个数为512，第三归一化层，第三激活层组成；对于第6个残差单元，主分支依次由第一卷积层，卷积核为1，步长为1，卷积核个数为128，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为6，空洞系数为6，卷积核个数为128，第二归一化层，第二激活层，第三卷积层，卷积核为1，步长为1，卷积核个数为512，第三归一化层，第三激活层组成；对于第7个残差单元，主分支依次由第一卷积层，卷积核为1，步长为1，卷积核个数为128，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为7，空洞系数为7，卷积核个数为128，第二归一化层，第二激活层，第三卷积层，卷积核为1，步长为1，卷积核个数为512，第三归一化层，第三激活层组成；对于第8个残差单元，主分支依次由第一卷积层，卷积核为1，步长为1，卷积核个数为128，第一归一化层，第一激活层，第二卷积层，卷积核为3，步长为1，填充系数为8，空洞系数为8，卷积核个数为128，第二归一化层，第二激活层，第三卷积层，卷积核为1，步长为1，卷积核个数为512，第三归一化层，第三激活层组成。

7.根据权利要求6所述的一种基于卷积神经网络的图像缺陷检测方法，其特征在于，分类子网络模块，依次由第一卷积层，第一归一化层，第一激活层，第二卷积层，第二归一化层，第二激活层和分类得分模块组成；第一卷积层，卷积核大小为3，步长为1，填充系数为1，卷积核个数为512；第二卷积层，卷积核大小为3，步长为1，填充系数为1，卷积核个数为512；分类得分模块，由卷积层组成，卷积核大小为3，步长为1，填充系数为1，卷积核个数为144。

8.根据权利要求7所述的一种基于卷积神经网络的图像缺陷检测方法，其特征在于，边界框子网络模块，依次由第一卷积层，第一归一化层，第一激活层，第二卷积层，第二归一化层，第二激活层，第三卷积层，第三归一化层，第三激活层，第四卷积层，第四归一化层，第四激活层和边界框预测模块组成；第一卷积层，卷积核大小为3，步长为1，填充系数为1，卷积核个数为512；其他卷积层，参数与第一卷积层完全相同；边界框预测模块，由卷积层组成，卷积核大小为3，步长为1，填充系数为1，卷积核个数为24。

9.根据权利要求8所述的一种基于卷积神经网络的图像缺陷检测方法，其特征在于，检测模块，由一个卷积层组成，卷积核大小为3，步长为1，填充系数为1，卷积核个数为6。