CN110910339A

CN110910339A - Logo缺陷检测方法及装置

Info

Publication number: CN110910339A
Application number: CN201910619417.9A
Authority: CN
Inventors: 邓远志; 陈润康; 戴志威; 陈志列
Original assignee: EVOC Intelligent Technology Co Ltd
Current assignee: Shenzhen Yanxiang Smart Technology Co ltd
Priority date: 2019-07-10
Filing date: 2019-07-10
Publication date: 2020-03-24
Anticipated expiration: 2039-07-10
Also published as: WO2021004130A1; CN110910339B

Abstract

本发明提供一种Logo缺陷检测方法及装置。所述方法包括：构建VGG网络模型，其中，所述VGG网络模型中的两个最大池化层后面具有PCA层；对待检测的Logo图片进行分割，并记好分割后的每张图片在原图中的相对位置；对所述VGG网络模型进行训练，直至达到预设的最大迭代数，结束训练输出缺陷分类模型；将分割后的图片传入所述缺陷分类模型，对所述Logo图片的缺陷进行判定。本发明能够提升Logo缺陷的检测速度。

Description

Logo缺陷检测方法及装置

技术领域

本发明涉及图像识别与检测技术领域，尤其涉及一种Logo缺陷检测方法及装置。

背景技术

一个优秀的Logo设计，高品质的Logo制作，能够为企业树立良好的品牌形象打下坚实的基础，是一个品牌形象的灵魂。因此Logo的设计加工越来越受到厂家的重视。

人工检测Logo是对加工过程中有明显形状和表面缺陷的产品进行剔除，并根据实际生产情况对生产设备做出必要的干预，通过对相应的设备进行检修、修改工艺参数等手段提高产品的合格率。然而用人工检测的方式对Logo的表面是否存在缺陷进行判断会有很多的缺点：(1)工人长期在相同环境下重复劳动，通过眼睛观察待检测的Logo表面，因为金属制品表面存在反光，并且Logo尺寸较小，存在的缺陷往往比较细微，容易使人身心疲劳，产生错检、漏检；(2)由于人的主观性强，难以形成一致的检测标准；(3)人易受外界环境与内心因素干扰，影响产品检测的合格率；(4)随着劳动力成本的不断提高，会大大增加企业的产品加工成本。

现有的CNN(Convolutional Neural Network)技术作为一种非常有效的特征提取方法，目前在图像识别与检测等领域取得了巨大的突破。它受启发源于生物神经网络，它的权值共享结构特点大大降低了模型的复杂度，尤其当网络输入多维数据时权值共享的作用更是体现的淋漓尽致，它能减少几个数量级的权值学习量，大大提升模型的训练速度。CNN是针对二维图像数据而设计的一种网络模型，使多维图像数据可以直接作为网络的输入，避免了传统识别算法中繁琐的数据预处理与数据重建过程。卷积神经网络能提取到数据浅层至高层的特征，并且它的结构特点决定了该网络模型对尺度、平移、旋转或者其他形式的形变具有一定程度的不变性。

如目前的VGG卷积网络结构，对不同部位图像进行卷积操作提取特征映射时，这种网络在图像识别上有较好的表现，能够实现于图像目标的分类，针对Logo缺陷判定。网络规定输入图像大小为224×224像素，在预处理时，训练集中每张图像的每个像素上都需要减去图像RGB的均值。卷积层中使用了3×3像素的卷积核。卷积步长为1个像素，图像四周的填充为1个像素，采用Max-pooling(最大池化)，总共有五层，分布于其中的一些卷积层后，窗口大小为2×2的卷积核，步长为2。网络结构如图1所示，图像经过8个卷积层后再通过Maxpooling层进行提取后，将他们调整大小成为同样的层进入网络，最终得到512维特征映射，经过3次全连接层，转化成长度1000的一维向量，经过Softmax层后就得到了网络判定Logo缺陷的有无。整个网络的参数量达到140M(百万)。

VGG网络对网络不停地加卷积层，扩展神经网络的深度，并且取得了较好的效果，也让人们认识到加深网络是提高模型质量的一个有效途径，但它同时也面临着参数过于庞大冗余，训练和预测较慢等缺点，导致Logo缺陷检测速度较慢。

发明内容

本发明提供的Logo缺陷检测方法及装置，能够提升Logo缺陷的检测速度。

第一方面，本发明提供一种Logo缺陷检测方法，包括：

构建VGG网络模型，其中，所述VGG网络模型中的两个最大池化层后面具有PCA层；

对待检测的Logo图片进行分割，并记好分割后的每张图片在原图中的相对位置；

对所述VGG网络模型进行训练，直至达到预设的最大迭代数，结束训练输出缺陷分类模型；

将分割后的图片传入所述缺陷分类模型，对所述Logo图片的缺陷进行判定。

可选地，所述构建VGG网络模型包括：

在预处理时，将训练集中每张图像的每个像素上减去图像RGB的均值；

通过PCA层对最大池化层后的特征图矩阵进行粗提取主成分向量，得到的变量再进行两个Conv256层的卷积操作和最大池化层的操作；

对得到的特征图矩阵进行细提取主成分向量；

在全连接层将特征整合成1000维的特征向量，用Softmax函数对特征向量进行分类，0表示Logo图片存在缺陷，1表示Logo图片正常。

可选地，在所述对所述VGG网络模型进行训练之前，所述方法还包括：

对分割后的图片进行标注，其中0表示图片存在缺陷，1表示图片正常；

对分割后的图片进行旋转、翻转、随机改变曝光度和添加噪声操作，实现数据集增广。

可选地，所述PCA层的计算流程为：

输入粗特征向量；

将每个特征值减去平均特征值；

求特征向量协方差矩阵；

求协方差矩阵的特征向量；

将特征向量中的特征值进行重新按大小排列，选取最大的K个，其中，K为预设值；

输出这K个向量作为新的特征向量。

可选地，所述将分割后的图片传入所述缺陷分类模型，对所述Logo图片的缺陷进行判定包括：

将分割后的图片传入训练好的缺陷分类模型，对所有图片进行分类；

将有缺陷的图片依据相对位置在原Logo图片上进行定位，找出缺陷并确定缺陷所在位置。

第二方面，本发明提供一种Logo缺陷检测装置，包括：

构建单元，用于构建VGG网络模型，其中，所述VGG网络模型中的两个最大池化层后面具有PCA层；

分割单元，用于对待检测的Logo图片进行分割，并记好分割后的每张图片在原图中的相对位置；

训练单元，用于对所述VGG网络模型进行训练，直至达到预设的最大迭代数，结束训练输出缺陷分类模型；

判定单元，用于将分割后的图片传入所述缺陷分类模型，对所述Logo图片的缺陷进行判定。

可选地，所述构建单元，用于在预处理时，将训练集中每张图像的每个像素上减去图像RGB的均值；通过PCA层对最大池化层后的特征图矩阵进行粗提取主成分向量，得到的变量再进行两个Conv256层的卷积操作和最大池化层的操作；对得到的特征图矩阵进行细提取主成分向量；在全连接层将特征整合成1000维的特征向量，用Softmax函数对特征向量进行分类，0表示Logo图片存在缺陷，1表示Logo图片正常。

可选地，所述装置还包括：

标注单元，用于在所述训练单元对所述VGG网络模型进行训练之前，对分割后的图片进行标注，其中0表示图片存在缺陷，1表示图片正常；

增广单元，用于对分割后的图片进行旋转、翻转、随机改变曝光度和添加噪声操作，实现数据集增广。

可选地，所述PCA层的计算流程为：

输入粗特征向量；

将每个特征值减去平均特征值；

求特征向量协方差矩阵；

求协方差矩阵的特征向量；

输出这K个向量作为新的特征向量。

可选地，所述判定单元，用于将分割后的图片传入训练好的缺陷分类模型，对所有图片进行分类；将有缺陷的图片依据相对位置在原Logo图片上进行定位，找出缺陷并确定缺陷所在位置。

本发明实施例提供的Logo缺陷检测方法及装置，通过对VGG网络进行修改，添加PCA机制，组建级联的PCA卷积神经网络，将网络模型进行精简，使得模型能够快速收敛，能够使得Logo缺陷检测速度进一步提升，同时，在训练网络时，降低了网络参数量，使得训练速度加快。

附图说明

图1为现有的VGG网络的模型架构图；

图2为本发明实施例提供的Logo缺陷检测方法的流程图；

图3为本发明实施例提供的VGG网络的模型架构图；

图4为本发明实施例提供的Logo正常原图；

图5为本发明实施例提供的Logo中Y字母处有缺陷的原图；

图6为本发明实施例提供的图像分割后的效果图；

图7为本发明实施例提供的对图6进行标注后的示意图；

图8为本发明实施例提供的对图7进行增广后的示意图；

图9为本发明实施例提供的训练模型的架构图；

图10为本发明实施例提供的logo缺陷检测效果图；

图11为本发明实施例通过的Logo缺陷检测装置的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例使用基于级联的PCA(Principal Component Analysis，主成分分析)卷积网络提取特征的方法来对Logo进行缺陷的有无判定。PCA将变量从原来的坐标系转换到新的坐标系，转换坐标系时，以方差最大的方向作为坐标轴方向，因为变量的最大方差给出了变量的最重要的信息，去除了冗余的变量，即寻求变量中线性无关的变量，使得变量集进行降维。降维是对数据高维度特征的一种处理方法，将高维度的数据保留下最重要的一些特征，通过去除噪声，从而实现提升数据处理速度的目的。在实际的生产和应用中，降维在一定的信息损失范围内，可以节省大量的时间和成本。

本发明实施例提供一种Logo缺陷检测方法，如图2所示，所述方法包括：

S21、构建VGG网络模型，其中，所述VGG网络模型中的两个最大池化层后面具有PCA层；

S22、对待检测的Logo图片进行分割，并记好分割后的每张图片在原图中的相对位置；

S23、对所述VGG网络模型进行训练，直至达到预设的最大迭代数，结束训练输出缺陷分类模型；

S24、将分割后的图片传入所述缺陷分类模型，对所述Logo图片的缺陷进行判定。

本发明实施例提供的Logo缺陷检测方法，通过对VGG网络进行修改，添加PCA机制，组建级联的PCA卷积神经网络，将网络模型进行精简，使得模型能够快速收敛，能够使得Logo缺陷检测速度进一步提升，同时，在训练网络时，降低了网络参数量，使得训练速度加快。

下面对本发明实施例Logo缺陷检测方法进行详细说明。

本实施例Logo缺陷检测方法主要包括三大部分：模型构建、模型训练和模型应用。

首先构建VGG网络模型，本实施例构建的VGG网络模型架构如图3所示：

级联PCA网络输入图像大小为224×224像素，在预处理时，训练集中每张图像的每个像素上都需要减去图像RGB的均值。卷积层Conv_x中，分别使用了1×1、3×3和5×5像素的卷积核。卷积步长为1个像素，图像四周的填充为1个像素，采用Max-pooling(最大池化)，总共有四层，分布于其中的卷积层后，窗口大小为2×2的卷积核，步长为2。然后通过PCA对MaxPooling层后的特征图矩阵进行粗提取主成分向量，得到的变量再进行两个Conv256层的卷积操作和Maxpooling层的操作。接着再对得到的特征图矩阵进行细提取主成分向量。最后，在全连接层将特征整合成1000维的特征向量，用Softmax函数对特征向量进行分类，0表示Logo图片存在缺陷，1表示Logo图片正常。

然后对所述VGG网络模型进行训练。

在对所述VGG网络模型进行训练之前，先对待检测的Logo图片进行预处理，包括图片的分割和数据集的增广。由于在Logo检测设备上采集的图片并提取Logo的ROI(RegionOf Interest，感兴趣区域)后图片大小为800×120，而缺陷分类网络输入大小为224×224，为了实现全覆盖检测，本实施例将每张采集图片分割出16张小图，并记好每张分割图片在原图中相对位置。然后将分割后的图片传入训练好的缺陷分类模型，对所有图片进行分类。最后将有缺陷的图片依据相对位置在原图上进行定位，以此来找出缺陷并确定其位置。在原来VGG的两个Maxpooling层后面增加PCA层。在前面通过Maxpooling层输出的特征，通过PCA层进行特征的筛选“提纯”，其中PCA层的计算流程如下：

输入“粗”特征向量；

每个特征值减去平均特征值；

求特征向量协方差矩阵；

求协方差矩阵的特征向量；

将特征向量中的特征值进行重新按大小排列，选取最大的K个；

输出这K个向量作为新的特征向量。

如图4所示，为训练数据的Logo正常原图SKYWORTH。

如图5所示，为训练数据的Logo中Y字母处有缺陷的原图。

先对图像进行分割，水平方向分成8份，垂直方向分成2份，得到16个小图像，分割效果如图6所示。

接着对分割后的图像进行标注，标识结果如图7所示，其中0表示Logo图片存在缺陷，1表示Logo图片正常。

接着对图像进行增广，对图像进行旋转、翻转、随机改变曝光度和添加噪声，以期提高模型的鲁棒性，增广后图像如图8所示。

训练模型的流程如图9所示，直至达到预设的最大迭代数，结束训练输出缺陷分类模型。

最后，将分割后的图片传入所述缺陷分类模型，对所述Logo图片的缺陷进行判定。

得到训练好的模型后，加载模型到显卡的显存，通过输入的Logo分割后的每张图片来对Logo缺陷进行判定，对每张小图变换到224×224的大小。

模型预测出输入的图片是否为有缺陷的Logo后，将位置坐标还原回原图，检测出的Logo缺陷效果如图10所示。

本发明通过减少原有的VGG网络模型的参数量，通过级联的PCA方法来对VGG网络模型进行加工，实现对Logo缺陷的判定，对比原有的VGG网络模型，在模型的参数数量上减少了1/3，在训练时间上，模型的训练速度加快了50％，在模型的应用上，模型的前向计算速度增加了1/3。

本发明实施例还提供一种Logo缺陷检测装置，如图11所示，所述装置包括：

构建单元21，用于构建VGG网络模型，其中，所述VGG网络模型中的两个最大池化层后面具有PCA层；

分割单元22，用于对待检测的Logo图片进行分割，并记好分割后的每张图片在原图中的相对位置；

训练单元23，用于对所述VGG网络模型进行训练，直至达到预设的最大迭代数，结束训练输出缺陷分类模型；

判定单元24，用于将分割后的图片传入所述缺陷分类模型，对所述Logo图片的缺陷进行判定。

本发明实施例提供的Logo缺陷检测装置，通过对VGG网络进行修改，添加PCA机制，组建级联的PCA卷积神经网络，将网络模型进行精简，使得模型能够快速收敛，能够使得Logo缺陷检测速度进一步提升，同时，在训练网络时，降低了网络参数量，使得训练速度加快。

可选地，所述构建单元21，用于在预处理时，将训练集中每张图像的每个像素上减去图像RGB的均值；通过PCA层对最大池化层后的特征图矩阵进行粗提取主成分向量，得到的变量再进行两个Conv256层的卷积操作和最大池化层的操作；对得到的特征图矩阵进行细提取主成分向量；在全连接层将特征整合成1000维的特征向量，用Softmax函数对特征向量进行分类，0表示Logo图片存在缺陷，1表示Logo图片正常。

可选地，所述装置还包括：

标注单元，用于在所述训练单元23对所述VGG网络模型进行训练之前，对分割后的图片进行标注，其中0表示图片存在缺陷，1表示图片正常；

可选地，所述PCA层的计算流程为：

输入粗特征向量；

将每个特征值减去平均特征值；

求特征向量协方差矩阵；

求协方差矩阵的特征向量；

输出这K个向量作为新的特征向量。

可选地，所述判定单元24，用于将分割后的图片传入训练好的缺陷分类模型，对所有图片进行分类；将有缺陷的图片依据相对位置在原Logo图片上进行定位，找出缺陷并确定缺陷所在位置。

本实施例的装置，可以用于执行上述方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

本领域普通技术人员可以理解实现上述方法实施例中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

Claims

1.一种Logo缺陷检测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述构建VGG网络模型包括：

对得到的特征图矩阵进行细提取主成分向量；

3.根据权利要求1所述的方法，其特征在于，在所述对所述VGG网络模型进行训练之前，所述方法还包括：

4.根据权利要求1至3中任一项所述的方法，其特征在于，所述PCA层的计算流程为：

输入粗特征向量；

将每个特征值减去平均特征值；

求特征向量协方差矩阵；

求协方差矩阵的特征向量；

输出这K个向量作为新的特征向量。

5.根据权利要求4所述的方法，其特征在于，所述将分割后的图片传入所述缺陷分类模型，对所述Logo图片的缺陷进行判定包括：

6.一种Logo缺陷检测装置，其特征在于，包括：

7.根据权利要求6所述的装置，其特征在于，所述构建单元，用于在预处理时，将训练集中每张图像的每个像素上减去图像RGB的均值；通过PCA层对最大池化层后的特征图矩阵进行粗提取主成分向量，得到的变量再进行两个Conv256层的卷积操作和最大池化层的操作；对得到的特征图矩阵进行细提取主成分向量；在全连接层将特征整合成1000维的特征向量，用Softmax函数对特征向量进行分类，0表示Logo图片存在缺陷，1表示Logo图片正常。

8.根据权利要求6所述的装置，其特征在于，所述装置还包括：

9.根据权利要求6至8中任一项所述的装置，其特征在于，所述PCA层的计算流程为：

输入粗特征向量；

将每个特征值减去平均特征值；

求特征向量协方差矩阵；

求协方差矩阵的特征向量；

输出这K个向量作为新的特征向量。

10.根据权利要求9所述的装置，其特征在于，所述判定单元，用于将分割后的图片传入训练好的缺陷分类模型，对所有图片进行分类；将有缺陷的图片依据相对位置在原Logo图片上进行定位，找出缺陷并确定缺陷所在位置。