CN110930383A

CN110930383A - 基于深度学习语义分割和图像分类的注射器缺陷检测方法

Info

Publication number: CN110930383A
Application number: CN201911138597.5A
Authority: CN
Inventors: 李俊宇; 黄坤山; 彭文瑜; 林玉山; 魏登明
Original assignee: Foshan Nanhai Guangdong Technology University CNC Equipment Cooperative Innovation Institute; Foshan Guangdong University CNC Equipment Technology Development Co. Ltd
Current assignee: Foshan Nanhai Guangdong Technology University CNC Equipment Cooperative Innovation Institute; Foshan Guangdong University CNC Equipment Technology Development Co. Ltd
Priority date: 2019-11-20
Filing date: 2019-11-20
Publication date: 2020-03-27

Abstract

本发明提供基于深度学习语义分割和图像分类的注射器缺陷检测方法，包括以下步骤，S1注射器图像采集和分割数据集{TrainX1、Y1、TestX1}的制作；S2训练注射器分割网络模型，得到N1；S3利用N1对真实图片进行处理，得到注射器分割图M1并将其处理成图像X2；S4将X2进行缺陷标记后输入到分类网络中进行训练，迭代得到收敛的分类网络N2；S5联合N1和N2对注射器图像进行检测，判断是否有缺陷。本检测方法具有较好的鲁棒性，降低了背景环境对图像的干扰，在较为复杂的场景中也能表现良好，相较于传统人工检测，更加快速和准确，提高制造过程的自动化程度，大大降低企业成本，提高生产率。

Description

基于深度学习语义分割和图像分类的注射器缺陷检测方法

技术领域

本发明涉及及其视觉技术领域，特别涉及一种基于深度学习语义分割和图像分类的注射器缺陷检测方法。

背景技术

在注射器在制造过程中，不可避免的会有残次品，所以加工厂需要将这些残次品挑选出来，而注射器制造商以往都是利用人眼来判断其制造缺陷，由于注射器制造数量十分庞大，完全靠人来检测制造缺陷，不仅检测效率低，而且成本高，人工检测还具有不稳定性。需要采用智能检测的方法来代替人工，提高检测效率。

因此，有必要提供一种基于深度学习语义分割和图像分类的注射器缺陷检测方法来克服此难题。

发明内容

本发明提供一种基于深度学习语义分割和图像分类的注射器缺陷检测方法，利用深度学习的语义分割和图像检测模型进行实时注射器的缺陷检测，可用于无损、无接触检测。描述采集的注射器图像被制作为注射器数据集输入到语义分割网络进行训练，接着进行图像处理后，再输入到图形分类网络进行训练，最终得到两个训练好的网络模型，结合模型后端的预测，可实现智能缺陷检测，达到高效率和高精度的检测目的。

为解决上述技术问题，本发明提出的一种基于深度学习语义分割和图像分类的注射器缺陷检测方法，包括以下步骤：

步骤S1：注射器图像采集，对采集的图像利用软件进行标记得到分割图像，和训练测试数据集{TrainX1、Y1、TestX1}的制作；

步骤S2：构建全卷积神经网络模型，将训练数据集{TrainX1、Y1}输入到语义分割网络中，迭代模型参数后得到收敛的分割模型N1；

步骤S3：利用分割模型N1对真实图片进行处理，得到注射器分割图M1以及注射器的坐标信息，对注射器原图进行分割和旋转处理，并将其缩放成(224，224×4)的图像X2；

步骤S4：将图像X2进行缺陷标记后输入到分类网络中进行训练，通过训练迭代得到收敛的分类网络N2；

步骤S5：联合分割和分类网络(N1和N2)就能对采集的注射器图像进行预测，当输出Y为[1，1，1，1]时为无缺陷图像，其他情况均为有缺陷。

优选地，在步骤S1中进行图像标注，采用labelme软件进行标注，用外接矩形框标注出注射器所在位置，然后导出标记json文件，接着将json文件用代码转换成二值灰度图像，框选中的注射器为前景，将其像素值涂成255白色，其余地方涂成像素值0的黑色，修改后的图片是真实值掩膜{Y1}。

优选地，在步骤S2中采用语义分割网络，所述语义分割网络的具体结构为：

第一、二层，卷积层，卷积核大小为3，步长为1，输出64个特征图；

第三层，池化核大小为2、步长为2的池化层；

第四、五层，卷积层，卷积核大小为3，步长为1，输出128个特征图；

第六层，池化核大小为2、步长为2的池化层；

第七、八层，卷积层，卷积核大小为3，步长为1，输出256个特征图；

第九层，池化层，池化核大小为2、步长为2；

十一层，卷积层，卷积核大小为3，步长为1，输出512个特征图；

第十二层，池化层，池化核大小为2、步长为2的池化层；

十四层，卷积层，卷积核大小为3，步长为1，输出1024个特征图；

第十五层，上采样卷积层，上采样核大小为2，步长为2，卷积核2，步长为2，输出512个特征图；

第十六层，以第三维度拼接第十二层和十五层；

十八层，卷积层，卷积核大小为3，步长为1，输出512个特征图；

第十九层，上采样卷积层，上采样核大小为2，步长为2，卷积核2，步长为2，输出256个特征图；

第二十层，以第三维度拼接第八层和十九层；

第二十一、二十二层，卷积层，卷积核大小为3，步长为1，输出256个特征图；

第二十三层，上采样卷积层，上采样核大小为2，步长为2，卷积核2，步长为2，输出128个特征图；

第二十四层，以第三维度拼接第五层和二十三层；

第二十五、二十六层，卷积层，卷积核大小为3，步长为1，输出128个特征图；

第二十七层，上采样卷积层，上采样核大小为2，步长为2，卷积核2，步长为2，输出64个特征图；

第二十八层，以第三维度拼接第二层和二十七层；

第二十九、三十层，卷积层，卷积核大小为3，步长为1，输出64个特征图；

第三十一层，卷积层，卷积核大小为3，步长为1，输出2个特征图；

第三十二层、卷积层(输出层)，卷积核大小为1，步长为1，输出1个特征图；

损失函数定义为交叉熵

优化算法采用Adam优化器。

优选地，在步骤S2中，将原图和对应的掩膜进行数据增强操作获得更多的训练数据，让模型参数迭代更多次，以获得精度更高的模型。

优选地，在步骤S2中预测后可获得分割的注射器前景的外接矩形的四个顶点的坐标，然后在步骤S3中可以计算出注射器旋转角度，然后利用OpenCV图像处理，将注射器图像进行切割然后旋转到水平位置，再将每个注射器缩放到[224，224×4]大小，最后将其分从左往右分割成四块。其中旋转角度θ计算公式如下：

优选地，在步骤S4中，所述分类网络的具体结构：

第一层：卷积层，核大小为7，步长为2，输出64个特征图；

第二层：池化层，核大小为3，步长为2；

第三层：卷积层，核大小为3，步长为1，输出64个特征图；

第四层：卷积层，核大小为3，步长为1，输出64个特征图；

第五层：处理层，第二层的输出加上第四层的输出；

第六层：卷积层，核大小为3，步长为1，输出64个特征图；

第七层：卷积层，核大小为3，步长为1，输出64个特征图；

第八层：处理层，第五层的输出加上第七层的输出；

第九层：卷积层，核大小为3，步长为1，输出64个特征图；

第十层：卷积层，核大小为3，步长为1，输出64个特征图；

第十一层：处理层，第八层的输出加上第十层的输出；

第十二层：卷积层，核大小为3，步长为2，输出128个特征图；

第十三层：卷积层，核大小为3，步长为1，输出128个特征图；

第十四层：处理层，第十一层的输出卷积(1×1×128)后加上第十三层的输出；

第十五层：卷积层，核大小为3，步长为1，输出128个特征图；

第十六层：卷积层，核大小为3，步长为1，输出128个特征图；

第十七层：处理层，第十四层的输出加上第十六层的输出；

第十八层：卷积层，核大小为3，步长为1，输出128个特征图；

第十九层：卷积层，核大小为3，步长为1，输出128个特征图；

第二十层：处理层，第十七层的输出加上第十九层的输出；

第二十一层：卷积层，核大小为3，步长为1，输出128个特征图；

第二十二层：卷积层，核大小为3，步长为1，输出128个特征图；

第二十三层：处理层，第二十层的输出加上第二十二层的输出；

第二十四层：卷积层，核大小为3，步长为2，输出256个特征图；

第二十五层：卷积层，核大小为3，步长为1，输出256个特征图；

第二十六层：处理层，第二十三层的输出卷积(1×1×256)后加上第二十四层的输出；

第二十七层：卷积层，核大小为3，步长为1，输出256个特征图；

第二十八层：卷积层，核大小为3，步长为1，输出256个特征图；

第二十九层：处理层，第二十六层的输出加上第二十八层的输出；

第三十层：卷积层，核大小为3，步长为1，输出256个特征图；

第三十一层：卷积层，核大小为3，步长为1，输出256个特征图；

第三十二层：处理层，第二十九层的输出加上第三十一层的输出；

第三十三层：卷积层，核大小为3，步长为1，输出256个特征图；

第三十四层：卷积层，核大小为3，步长为1，输出256个特征图；

第三十五层：处理层，第三十二层的输出加上第三十四层的输出；

第三十六层：卷积层，核大小为3，步长为1，输出256个特征图；

第三十七层：卷积层，核大小为3，步长为1，输出256个特征图；

第三十八层：处理层，第三十五层的输出加上第三十七层的输出；

第三十九层：卷积层，核大小为3，步长为1，输出256个特征图；

第四十层：卷积层，核大小为3，步长为1，输出256个特征图；

第四十一层：处理层，第三十八层的输出加上第四十层的输出；

第四十二层：卷积层，核大小为3，步长为2，输出512个特征图；

第四十三层：卷积层，核大小为3，步长为1，输出512个特征图；

第四十四层：处理层，第四十一层的输出卷积(1×1×512)后加上第四十三层的输出；

第四十五层：卷积层，核大小为3，步长为1，输出512个特征图；

第四十六层：卷积层，核大小为3，步长为1，输出512个特征图；

第四十七层：处理层，第四十一层的输出加上第四十三层的输出；

第四十八层：卷积层，核大小为3，步长为1，输出512个特征图；

第四十九层：卷积层，核大小为3，步长为1，输出512个特征图；

第五十层：处理层，第四十七层的输出加上第四十九层的输出；

第五十一层：池化层，核大小为7；

第五十二层：处理层，降维1×512；

第五十三层：全连接层，输入1×512，输出为1×200；

第五十四层：全连接层，输入1×200，输出为1×50；

第五十五层：全连接层，输入1×50，输出为1×10；

第五十六层：全连接层，输入1×10，输出为1×2。

与相关技术相比较，本发明提供的基于深度学习语义分割和图像分类的注射器缺陷检测方法具有如下有益效果：

本发明较传统的方法有较大提升，通过两种网络的结合，先从原图中的将注射器分割出来，然后经过图像变换后，利用图像分类模型进行判断是否为缺陷注射器。并且在由于加入图像分割的作用下，让该检测方法具有较好的鲁棒性，降低了背景环境对图像的干扰，在较为复杂的场景中也能表现良好，相较于直接进行图像分类的缺陷检测方法有很大的提升。相较于传统的人工检测，更加快速和准确，提高制造过程的自动化程度，能大大降低企业成本，同时提高生产率。

附图说明

图1为本发明例举的注射器原图；

图2为本发明例举的注射器分割图；

图3为本发明的技术方案的流程图；

图4为本发明步骤S3中旋转角度计算的公式原理图；

图1与图2中：黑色墨迹即待检测缺陷。

具体实施方式

下面结合附图和实施方式对发明作进一步说明。

请结合参阅图1、图2与图3，其中，图1与图2分别为本发明例举的注射器原图和注射器分割图，用以更直观地阐述本发明，图中黑色墨迹即待检测缺陷；图3为本发明基于深度学习语义分割和图像分类的注射器缺陷检测方法的技术方案的流程图；图4为本发明步骤S3中旋转角度计算的公式原理图。

基于深度学习语义分割和图像分类的注射器缺陷检测方法，包括以下步骤：

在步骤S1中进行图像标注，采用labelme软件进行标注，用外接矩形框标注出注射器所在位置，然后导出标记json文件，接着将json文件用代码转换成二值灰度图像，框选中的注射器为前景，将其像素值涂成255白色，其余地方涂成像素值0的黑色，修改后的图片是真实值掩膜{Y1}，联合。

在步骤S2中采用语义分割网络，所述语义分割网络的具体结构为：

第三层，池化核大小为2、步长为2的池化层；

第六层，池化核大小为2、步长为2的池化层；

第九层，池化层，池化核大小为2、步长为2；

第十二层，池化层，池化核大小为2、步长为2的池化层；

第十六层，以第三维度拼接第十二层和十五层；

第二十层，以第三维度拼接第八层和十九层；

第二十四层，以第三维度拼接第五层和二十三层；

第二十八层，以第三维度拼接第二层和二十七层；

损失函数定义为交叉熵

优化算法采用Adam优化器。

在步骤S2中，将原图和对应的掩膜进行数据增强操作获得更多的训练数据，让模型参数迭代更多次，以获得精度更高的模型。

在步骤S2中预测后可获得分割的注射器前景的外接矩形的四个顶点的坐标，然后在步骤S3中可以计算出注射器旋转角度，然后利用OpenCV图像处理，将注射器图像进行切割然后旋转到水平位置，再将每个注射器缩放到[224，224×4]大小，最后将其分从左往右分割成四块。结合图4，旋转角度计算的公式原理图，其中旋转角度θ计算公式如下：

在步骤S4中，所述分类网络的具体结构：

第一层：卷积层，核大小为7，步长为2，输出64个特征图；

第二层：池化层，核大小为3，步长为2；

第三层：卷积层，核大小为3，步长为1，输出64个特征图；

第四层：卷积层，核大小为3，步长为1，输出64个特征图；

第五层：处理层，第二层的输出加上第四层的输出；

第六层：卷积层，核大小为3，步长为1，输出64个特征图；

第七层：卷积层，核大小为3，步长为1，输出64个特征图；

第八层：处理层，第五层的输出加上第七层的输出；

第九层：卷积层，核大小为3，步长为1，输出64个特征图；

第十层：卷积层，核大小为3，步长为1，输出64个特征图；

第十一层：处理层，第八层的输出加上第十层的输出；

第十七层：处理层，第十四层的输出加上第十六层的输出；

第二十层：处理层，第十七层的输出加上第十九层的输出；

第五十一层：池化层，核大小为7；

第五十二层：处理层，降维1×512；

第五十三层：全连接层，输入1×512，输出为1×200；

第五十四层：全连接层，输入1×200，输出为1×50；

第五十五层：全连接层，输入1×50，输出为1×10；

第五十六层：全连接层，输入1×10，输出为1×2。

结合图3与图4进行更进一步的说明，本发明提供的基于深度学习语义分割和图像分类的注射器缺陷检测方法，包括以下实施步骤(此步骤与上述S1-S5步骤不冲突，是为提取关键描述并进行更详尽释义)：

步骤S1：注射器图像采集和训练测试数据集{TrainX1、TestX1}的制作。

步骤S1-1：在生产线上进行拍摄采集注射器图片，将采集到的图片进行统一尺寸为512×512(长×宽)，接着进行标注，利用标记软件labelme，用矩形框外接框选到图中注射器的位置，然后生成标记后文件。

步骤S1-2：将标记后生成的json文件利用代码转换成掩膜图片{M1}，掩膜图片定义为注射器部分为白色，其余部分为黑色，其作为分割的目标图像。

步骤S1-3：转换完后，然后将标记过的原图作为训练数据集{TrainX1}，再采集一部分训练集以外的注射器图片作为测试数据集{TestX1}，加上上一步的掩膜图{M1}，这三个类图片即用来训练注射器分割网络模型。

步骤S2，训练注射器分割网络模型。

步骤S2-1，设计语义分割模型，按照网络顺序训练依次经过：输入层512*512*3。初始化模型的各项参数和权重值，然后将上一步制作的数据集{TrainX1，M1}输入依次输入到语义分割模型中进行训练。

步骤S2-2，模型每次读取到一批图像后，计算预测值和标准值之间的误差，然后利用梯度下降法减小误差；

步骤S2-3，迭代完所有的测试集图片之后导出训练完的分割模型，利用训练好的模型来测试图片{TestX1}，然后观察分割效果，如果每张图片都能达到比较好的分割效果，那么就完成了分割模型的训练，如果没有达到所要求的精度，那么就继续可能需要增加训练数据集的大小后，继续训练达到更高的精度。

步骤S3，对分割后的图片进行处理。

步骤S3-1，利用分割模型得到注射器在图片中的几何坐标，然后用opencv将注射器方向矫正，得到水平放置注射器图像；

步骤S3-2，缩放图像的比例变为[224]，接着每个注射器被分成四部分[224，224]，用于分类模型的训练；

步骤S3-3，将处理好的图像作为图像分类网络的的训练数据{TrainX2}，并且制作对应的标签{label2}，每个注射器分为四块，无缺陷是定义为1，有缺陷定义为0，所以一个无缺陷的注射器的标签定义为Y2[1，1，1，1]，如果向量中含有0，则视为有缺陷的图像。

步骤S4，缺陷分类网络模型的训练。

步骤S4-1，设计图像分类网络，初始化权重，然后设置迭代次数，将训练数据和对应标签{TrainX2，label2}输入到网络中进行训练；

步骤S4-2，当迭代完之后，导出注射器缺陷分类模型N2，进行测试计算出该模型在新的测试集上准确率，达到要求之后，将其保存为最后的分类网络模型，否则继续重复上一步骤。

步骤S5，将前面训练好的分割模型N1和分类模型N2组合起来实现将摄像头采集到的注射器图片进行实时的检测，得到输出的结果判断是否含有缺陷。

以上所述仅为本发明的实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其它相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.基于深度学习语义分割和图像分类的注射器缺陷检测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于深度学习语义分割和图像分类的注射器缺陷检测方法，其特征在于，在步骤S1中进行图像标注，采用labelme软件进行标注，用外接矩形框标注出注射器所在位置，然后导出标记json文件，接着将json文件用代码转换成二值灰度图像，框选中的注射器为前景，将其像素值涂成255白色，其余地方涂成像素值0的黑色，修改后的图片是真实值掩膜{Y1}。

3.根据权利要求1所述的基于深度学习语义分割和图像分类的注射器缺陷检测方法，其特征在于，在步骤S2中采用语义分割网络，所述语义分割网络的具体结构为：

第三层，池化核大小为2、步长为2的池化层；

第六层，池化核大小为2、步长为2的池化层；

第九层，池化层，池化核大小为2、步长为2；

第十二层，池化层，池化核大小为2、步长为2的池化层；

第十六层，以第三维度拼接第十二层和十五层；

第二十层，以第三维度拼接第八层和十九层；

第二十四层，以第三维度拼接第五层和二十三层；

第二十八层，以第三维度拼接第二层和二十七层；

损失函数定义为交叉熵

优化算法采用Adam优化器。

4.根据权利要求1所述的基于深度学习语义分割和图像分类的注射器缺陷检测方法，其特征在于，在步骤S2中，将原图和对应的掩膜进行数据增强操作获得更多的训练数据，让模型参数迭代更多次，以获得精度更高的模型。

5.根据权利要求1所述的基于深度学习语义分割和图像分类的注射器缺陷检测方法，其特征在于，在步骤S2中预测后可获得分割的注射器前景的外接矩形的四个顶点的坐标，然后在步骤S3中可以计算出注射器旋转角度，然后利用OpenCV图像处理，将注射器图像进行切割然后旋转到水平位置，再将每个注射器缩放到[224，224×4]大小，最后将其分从左往右分割成四块。其中旋转角度θ计算公式如下：

6.根据权利要求1所述的基于深度学习语义分割和图像分类的注射器缺陷检测方法，其特征在于，在步骤S4中，所述分类网络的具体结构：

第一层：卷积层，核大小为7，步长为2，输出64个特征图；

第二层：池化层，核大小为3，步长为2；

第三层：卷积层，核大小为3，步长为1，输出64个特征图；

第四层：卷积层，核大小为3，步长为1，输出64个特征图；

第五层：处理层，第二层的输出加上第四层的输出；

第六层：卷积层，核大小为3，步长为1，输出64个特征图；

第七层：卷积层，核大小为3，步长为1，输出64个特征图；

第八层：处理层，第五层的输出加上第七层的输出；

第九层：卷积层，核大小为3，步长为1，输出64个特征图；

第十层：卷积层，核大小为3，步长为1，输出64个特征图；

第十一层：处理层，第八层的输出加上第十层的输出；

第十七层：处理层，第十四层的输出加上第十六层的输出；

第二十层：处理层，第十七层的输出加上第十九层的输出；

第四十九层：卷积层，核大小为3，步长为1，输出512个特征图；第五十层：处理层，第四十七层的输出加上第四十九层的输出；

第五十一层：池化层，核大小为7；

第五十二层：处理层，降维1×512；

第五十三层：全连接层，输入1×512，输出为1×200；

第五十四层：全连接层，输入1×200，输出为1×50；

第五十五层：全连接层，输入1×50，输出为1×10；

第五十六层：全连接层，输入1×10，输出为1×2。