WO2021004130A1

WO2021004130A1 - Logo缺陷检测方法及装置

Info

Publication number: WO2021004130A1
Application number: PCT/CN2020/086818
Authority: WO
Inventors: 邓远志; 陈润康; 戴志威; 刘志永; 林淼; 陈志列
Original assignee: 研祥智能科技股份有限公司
Priority date: 2019-07-10
Filing date: 2020-04-24
Publication date: 2021-01-14
Also published as: CN110910339A; CN110910339B

Abstract

本发明提供一种Logo缺陷检测方法及装置。所述方法包括：构建VGG网络模型，其中，所述VGG网络模型中的两个最大池化层后面具有PCA层；对待检测的Logo图片进行分割，并记好分割后的每张图片在原图中的相对位置；对所述VGG网络模型进行训练，直至达到预设的最大迭代数，结束训练输出缺陷分类模型；将分割后的图片传入所述缺陷分类模型，对所述Logo图片的缺陷进行判定。本发明能够提升Logo缺陷的检测速度。

Description

Logo缺陷检测方法及装置

技术领域

本发明涉及图像识别与检测技术领域，尤其涉及一种Logo缺陷检测方法及装置。

背景技术

Logo检测是对加工过程中有明显形状和表面缺陷的产品进行剔除，并根据实际生产情况对生产设备做出必要的干预，通过对相应的设备进行检修、修改工艺参数等手段提高产品的合格率。然而传统人工检测方式对Logo的表面是否存在缺陷进行判断存在如下缺点：易使人身心疲劳产生错检、漏检，易受人主观影响难以形成一致的检测标准，人力成本和管理成本增加。

现有的CNN(Convolutional Neural Network)技术作为一种非常有效的特征提取方法，目前在图像识别与检测等领域取得了巨大的突破。如VGG(Visual Geometry Group)卷积网络结构，对不同部位图像进行卷积操作提取特征映射，能够实现于图像目标的分类，针对Logo缺陷判定。VGG通过对网络不停地加卷积层，扩展神经网络的深度，提高模型质量，但它同时也面临着参数过于庞大冗余，训练和预测较慢等缺点，导致Logo缺陷检测速度较慢。

发明内容

本发明提供的Logo缺陷检测方法及装置，能够提升Logo缺陷的检测速度。

第一方面，本发明提供一种Logo缺陷检测方法，包括：

构建VGG网络模型，其中，所述VGG网络模型中的两个最大池化层后面具有PCA层；

对待检测的Logo图片进行分割，并记好分割后的每张图片在原图中的相对位置；

对所述VGG网络模型进行训练，直至达到预设的最大迭代数，结束训练输出缺陷分类模型；

将分割后的图片传入所述缺陷分类模型，对所述Logo图片的缺陷进行判定。

可选地，所述构建VGG网络模型包括：

在预处理时，将训练集中每张图像的每个像素上减去图像RGB的均值；

通过PCA层对最大池化层后的特征图矩阵进行粗提取主成分向量，得到的变量再进行两个Conv256层的卷积操作和最大池化层的操作；

对得到的特征图矩阵进行细提取主成分向量；

在全连接层将特征整合成1000维的特征向量，用Softmax函数对特征向量进行分类，0表示Logo图片存在缺陷，1表示Logo图片正常。

可选地，在所述对所述VGG网络模型进行训练之前，所述方法还包括：

对分割后的图片进行标注，其中0表示图片存在缺陷，1表示图片正常；

对分割后的图片进行旋转、翻转、随机改变曝光度和添加噪声操作，实现数据集增广。

可选地，所述PCA层的计算流程为：

输入粗特征向量；

将每个特征值减去平均特征值；

求特征向量协方差矩阵；

求协方差矩阵的特征向量；

将特征向量中的特征值进行重新按大小排列，选取最大的K个，其中，K 为预设值；

输出这K个向量作为新的特征向量。

可选地，所述将分割后的图片传入所述缺陷分类模型，对所述Logo图片的缺陷进行判定包括：

将分割后的图片传入训练好的缺陷分类模型，对所有图片进行分类；

将有缺陷的图片依据相对位置在原Logo图片上进行定位，找出缺陷并确定缺陷所在位置。

第二方面，本发明提供一种Logo缺陷检测装置，包括：

构建单元，用于构建VGG网络模型，其中，所述VGG网络模型中的两个最大池化层后面具有PCA层；

分割单元，用于对待检测的Logo图片进行分割，并记好分割后的每张图片在原图中的相对位置；

训练单元，用于对所述VGG网络模型进行训练，直至达到预设的最大迭代数，结束训练输出缺陷分类模型；

判定单元，用于将分割后的图片传入所述缺陷分类模型，对所述Logo图片的缺陷进行判定。

可选地，所述构建单元，用于在预处理时，将训练集中每张图像的每个像素上减去图像RGB的均值；通过PCA层对最大池化层后的特征图矩阵进行粗提取主成分向量，得到的变量再进行两个Conv256层的卷积操作和最大池化层的操作；对得到的特征图矩阵进行细提取主成分向量；在全连接层将特征整合成1000维的特征向量，用Softmax函数对特征向量进行分类，0表示Logo图片存在缺陷，1表示Logo图片正常。

可选地，所述装置还包括：

标注单元，用于在所述训练单元对所述VGG网络模型进行训练之前，对分割后的图片进行标注，其中0表示图片存在缺陷，1表示图片正常；

增广单元，用于对分割后的图片进行旋转、翻转、随机改变曝光度和添加噪声操作，实现数据集增广。

可选地，所述PCA层的计算流程为：

输入粗特征向量；

将每个特征值减去平均特征值；

求特征向量协方差矩阵；

求协方差矩阵的特征向量；

将特征向量中的特征值进行重新按大小排列，选取最大的K个，其中，K为预设值；

输出这K个向量作为新的特征向量。

可选地，所述判定单元，用于将分割后的图片传入训练好的缺陷分类模型，对所有图片进行分类；将有缺陷的图片依据相对位置在原Logo图片上进行定位，找出缺陷并确定缺陷所在位置。

本发明实施例提供的Logo缺陷检测方法及装置，通过对VGG网络进行修改，添加PCA机制，组建级联的PCA卷积神经网络，将网络模型进行精简，使得模型能够快速收敛，能够使得Logo缺陷检测速度进一步提升，同时，在训练网络时，降低了网络参数量，使得训练速度加快。

附图说明

图1为现有的VGG网络的模型架构图；

图2为本发明实施例提供的Logo缺陷检测方法的流程图；

图3为本发明实施例提供的VGG网络的模型架构图；

图4为本发明实施例提供的Logo正常原图；

图5为本发明实施例提供的Logo中Y字母处有缺陷的原图；

图6为本发明实施例提供的图像分割后的效果图；

图7为本发明实施例提供的对图6进行标注后的示意图；

图8为本发明实施例提供的对图7进行增广后的示意图；

图9为本发明实施例提供的训练模型的架构图；

图10为本发明实施例提供的logo缺陷检测效果图；

图11为本发明实施例通过的Logo缺陷检测装置的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例使用基于级联的PCA(Principal Component Analysis，主成分分析)卷积网络提取特征的方法来对Logo进行缺陷的有无判定。PCA将变量从原来的坐标系转换到新的坐标系，转换坐标系时，以方差最大的方向作为坐标轴方向，因为变量的最大方差给出了变量的最重要的信息，去除了冗余的变量，即寻求变量中线性无关的变量，使得变量集进行降维。降维是对数据高维度特征的一种处理方法，将高维度的数据保留下最重要的一些特征，通过去除噪声，从而实现提升数据处理速度的目的。在实际的生产和应用中，降维在一定的信息损失范围内，可以节省大量的时间和成本。

本发明实施例提供一种Logo缺陷检测方法，如图2所示，所述方法包括：

S21、构建VGG网络模型，其中，所述VGG网络模型中的两个最大池化层后面具有PCA层；

S22、对待检测的Logo图片进行分割，并记好分割后的每张图片在原图中的相对位置；

S23、对所述VGG网络模型进行训练，直至达到预设的最大迭代数，结束训练输出缺陷分类模型；

S24、将分割后的图片传入所述缺陷分类模型，对所述Logo图片的缺陷进行判定。

本发明实施例提供的Logo缺陷检测方法，通过对VGG网络进行修改，添加PCA机制，组建级联的PCA卷积神经网络，将网络模型进行精简，使得模型能够快速收敛，能够使得Logo缺陷检测速度进一步提升，同时，在训练网络时，降低了网络参数量，使得训练速度加快。

下面对本发明实施例Logo缺陷检测方法进行详细说明。

本实施例Logo缺陷检测方法主要包括三大部分：模型构建、模型训练和模型应用。

首先构建VGG网络模型，本实施例构建的VGG网络模型架构如图3所示：

级联PCA网络输入图像大小为224×224像素，在预处理时，训练集中每张图像的每个像素上都需要减去图像RGB的均值。卷积层Conv_x中，分别使用了1×1、3×3和5×5像素的卷积核。卷积步长为1个像素，图像四周的填充为1个像素，采用Max-pooling(最大池化)，总共有四层，分布于其中的卷积层后，窗口大小为2×2的卷积核，步长为2。然后通过PCA对MaxPooling层后的特征图矩阵进行粗提取主成分向量，得到的变量再进行两个Conv256 层的卷积操作和Maxpooling层的操作。接着再对得到的特征图矩阵进行细提取主成分向量。最后，在全连接层将特征整合成1000维的特征向量，用Softmax函数对特征向量进行分类，0表示Logo图片存在缺陷，1表示Logo图片正常。

然后对所述VGG网络模型进行训练。

在对所述VGG网络模型进行训练之前，先对待检测的Logo图片进行预处理，包括图片的分割和数据集的增广。由于在Logo检测设备上采集的图片并提取Logo的ROI(Region Of Interest，感兴趣区域)后图片大小为800×120，而缺陷分类网络输入大小为224×224，为了实现全覆盖检测，本实施例将每张采集图片分割出16张小图，并记好每张分割图片在原图中相对位置。然后将分割后的图片传入训练好的缺陷分类模型，对所有图片进行分类。最后将有缺陷的图片依据相对位置在原图上进行定位，以此来找出缺陷并确定其位置。在原来VGG的两个Maxpooling层后面增加PCA层。在前面通过Maxpooling层输出的特征，通过PCA层进行特征的筛选“提纯”，其中PCA层的计算流程如下：

输入“粗”特征向量；

每个特征值减去平均特征值；

求特征向量协方差矩阵；

求协方差矩阵的特征向量；

将特征向量中的特征值进行重新按大小排列，选取最大的K个；

输出这K个向量作为新的特征向量。

如图4所示，为训练数据的Logo正常原图SKYWORTH。

如图5所示，为训练数据的Logo中Y字母处有缺陷的原图。

先对图像进行分割，水平方向分成8份，垂直方向分成2份，得到16个小图像，分割效果如图6所示。

接着对分割后的图像进行标注，标识结果如图7所示，其中0表示Logo图片存在缺陷，1表示Logo图片正常。

接着对图像进行增广，对图像进行旋转、翻转、随机改变曝光度和添加噪声，以期提高模型的鲁棒性，增广后图像如图8所示。

训练模型的流程如图9所示，直至达到预设的最大迭代数，结束训练输出缺陷分类模型。

最后，将分割后的图片传入所述缺陷分类模型，对所述Logo图片的缺陷进行判定。

得到训练好的模型后，加载模型到显卡的显存，通过输入的Logo分割后的每张图片来对Logo缺陷进行判定，对每张小图变换到224×224的大小。

模型预测出输入的图片是否为有缺陷的Logo后，将位置坐标还原回原图，检测出的Logo缺陷效果如图10所示。

本发明通过减少原有的VGG网络模型的参数量，通过级联的PCA方法来对VGG网络模型进行加工，实现对Logo缺陷的判定，对比原有的VGG网络模型，在模型的参数数量上减少了1/3，在训练时间上，模型的训练速度加快了50％，在模型的应用上，模型的前向计算速度增加了1/3。

本发明实施例还提供一种Logo缺陷检测装置，如图11所示，所述装置包括：

构建单元21，用于构建VGG网络模型，其中，所述VGG网络模型中的两个最大池化层后面具有PCA层；

分割单元22，用于对待检测的Logo图片进行分割，并记好分割后的每张图片在原图中的相对位置；

训练单元23，用于对所述VGG网络模型进行训练，直至达到预设的最大迭代数，结束训练输出缺陷分类模型；

判定单元24，用于将分割后的图片传入所述缺陷分类模型，对所述Logo图片的缺陷进行判定。

本发明实施例提供的Logo缺陷检测装置，通过对VGG网络进行修改，添加PCA机制，组建级联的PCA卷积神经网络，将网络模型进行精简，使得模型能够快速收敛，能够使得Logo缺陷检测速度进一步提升，同时，在训练网络时，降低了网络参数量，使得训练速度加快。

可选地，所述构建单元21，用于在预处理时，将训练集中每张图像的每个像素上减去图像RGB的均值；通过PCA层对最大池化层后的特征图矩阵进行粗提取主成分向量，得到的变量再进行两个Conv256层的卷积操作和最大池化层的操作；对得到的特征图矩阵进行细提取主成分向量；在全连接层将特征整合成1000维的特征向量，用Softmax函数对特征向量进行分类，0表示Logo图片存在缺陷，1表示Logo图片正常。

可选地，所述装置还包括：

标注单元，用于在所述训练单元23对所述VGG网络模型进行训练之前，对分割后的图片进行标注，其中0表示图片存在缺陷，1表示图片正常；

可选地，所述PCA层的计算流程为：

输入粗特征向量；

将每个特征值减去平均特征值；

求特征向量协方差矩阵；

求协方差矩阵的特征向量；

输出这K个向量作为新的特征向量。

可选地，所述判定单元24，用于将分割后的图片传入训练好的缺陷分类模型，对所有图片进行分类；将有缺陷的图片依据相对位置在原Logo图片上进行定位，找出缺陷并确定缺陷所在位置。

本实施例的装置，可以用于执行上述方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

本领域普通技术人员可以理解实现上述方法实施例中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random Access Memory，RAM)等。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

Claims

一种Logo缺陷检测方法，其特征在于，包括：

构建VGG网络模型，其中，所述VGG网络模型中的两个最大池化层后面具有PCA层；

对待检测的Logo图片进行分割，并记好分割后的每张图片在原图中的相对位置；

对所述VGG网络模型进行训练，直至达到预设的最大迭代数，结束训练输出缺陷分类模型；

将分割后的图片传入所述缺陷分类模型，对所述Logo图片的缺陷进行判定。
根据权利要求1所述的方法，其特征在于，所述构建VGG网络模型包括：

在预处理时，将训练集中每张图像的每个像素上减去图像RGB的均值；

通过PCA层对最大池化层后的特征图矩阵进行粗提取主成分向量，得到的变量再进行两个Conv256层的卷积操作和最大池化层的操作；

对得到的特征图矩阵进行细提取主成分向量；

在全连接层将特征整合成1000维的特征向量，用Softmax函数对特征向量进行分类，0表示Logo图片存在缺陷，1表示Logo图片正常。
根据权利要求1所述的方法，其特征在于，在所述对所述VGG网络模型进行训练之前，所述方法还包括：

对分割后的图片进行标注，其中0表示图片存在缺陷，1表示图片正常；

对分割后的图片进行旋转、翻转、随机改变曝光度和添加噪声操作，实现数据集增广。
根据权利要求1至3中任一项所述的方法，其特征在于，所述PCA层的计算流程为：

输入粗特征向量；

将每个特征值减去平均特征值；

求特征向量协方差矩阵；

求协方差矩阵的特征向量；

将特征向量中的特征值进行重新按大小排列，选取最大的K个，其中，K为预设值；

输出这K个向量作为新的特征向量。
根据权利要求4所述的方法，其特征在于，所述将分割后的图片传入所述缺陷分类模型，对所述Logo图片的缺陷进行判定包括：

将分割后的图片传入训练好的缺陷分类模型，对所有图片进行分类；

将有缺陷的图片依据相对位置在原Logo图片上进行定位，找出缺陷并确定缺陷所在位置。
一种Logo缺陷检测装置，其特征在于，包括：

构建单元，用于构建VGG网络模型，其中，所述VGG网络模型中的两个最大池化层后面具有PCA层；

分割单元，用于对待检测的Logo图片进行分割，并记好分割后的每张图片在原图中的相对位置；

训练单元，用于对所述VGG网络模型进行训练，直至达到预设的最大迭代数，结束训练输出缺陷分类模型；

判定单元，用于将分割后的图片传入所述缺陷分类模型，对所述Logo图片的缺陷进行判定。
根据权利要求6所述的装置，其特征在于，所述构建单元，用于在预处理时，将训练集中每张图像的每个像素上减去图像RGB的均值；通过PCA层对最大池化层后的特征图矩阵进行粗提取主成分向量，得到的变量再进行两个Conv256层的卷积操作和最大池化层的操作；对得到的特征图矩阵进行细提取主成分向量；在全连接层将特征整合成1000维的特征向量，用Softmax函数对特征向量进行分类，0表示Logo图片存在缺陷，1表示Logo图片正常。
根据权利要求6所述的装置，其特征在于，所述装置还包括：

标注单元，用于在所述训练单元对所述VGG网络模型进行训练之前，对分割后的图片进行标注，其中0表示图片存在缺陷，1表示图片正常；

增广单元，用于对分割后的图片进行旋转、翻转、随机改变曝光度和添加噪声操作，实现数据集增广。
根据权利要求6至8中任一项所述的装置，其特征在于，所述PCA层的计算流程为：

输入粗特征向量；

将每个特征值减去平均特征值；

求特征向量协方差矩阵；

求协方差矩阵的特征向量；

将特征向量中的特征值进行重新按大小排列，选取最大的K个，其中，K为预设值；

输出这K个向量作为新的特征向量。
根据权利要求9所述的装置，其特征在于，所述判定单元，用于将分割后的图片传入训练好的缺陷分类模型，对所有图片进行分类；将有缺陷的图片依据相对位置在原Logo图片上进行定位，找出缺陷并确定缺陷所在位置。