CN110910339A - Logo缺陷检测方法及装置 - Google Patents

Logo缺陷检测方法及装置 Download PDF

Info

Publication number
CN110910339A
CN110910339A CN201910619417.9A CN201910619417A CN110910339A CN 110910339 A CN110910339 A CN 110910339A CN 201910619417 A CN201910619417 A CN 201910619417A CN 110910339 A CN110910339 A CN 110910339A
Authority
CN
China
Prior art keywords
picture
logo
defect
training
network model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910619417.9A
Other languages
English (en)
Other versions
CN110910339B (zh
Inventor
邓远志
陈润康
戴志威
陈志列
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yanxiang Smart Technology Co ltd
Original Assignee
EVOC Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EVOC Intelligent Technology Co Ltd filed Critical EVOC Intelligent Technology Co Ltd
Priority to CN201910619417.9A priority Critical patent/CN110910339B/zh
Publication of CN110910339A publication Critical patent/CN110910339A/zh
Priority to PCT/CN2020/086818 priority patent/WO2021004130A1/zh
Application granted granted Critical
Publication of CN110910339B publication Critical patent/CN110910339B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20216Image averaging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20224Image subtraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种Logo缺陷检测方法及装置。所述方法包括:构建VGG网络模型,其中,所述VGG网络模型中的两个最大池化层后面具有PCA层;对待检测的Logo图片进行分割,并记好分割后的每张图片在原图中的相对位置;对所述VGG网络模型进行训练,直至达到预设的最大迭代数,结束训练输出缺陷分类模型;将分割后的图片传入所述缺陷分类模型,对所述Logo图片的缺陷进行判定。本发明能够提升Logo缺陷的检测速度。

Description

Logo缺陷检测方法及装置
技术领域
本发明涉及图像识别与检测技术领域,尤其涉及一种Logo缺陷检测方法及装置。
背景技术
一个优秀的Logo设计,高品质的Logo制作,能够为企业树立良好的品牌形象打下坚实的基础,是一个品牌形象的灵魂。因此Logo的设计加工越来越受到厂家的重视。
人工检测Logo是对加工过程中有明显形状和表面缺陷的产品进行剔除,并根据实际生产情况对生产设备做出必要的干预,通过对相应的设备进行检修、修改工艺参数等手段提高产品的合格率。然而用人工检测的方式对Logo的表面是否存在缺陷进行判断会有很多的缺点:(1)工人长期在相同环境下重复劳动,通过眼睛观察待检测的Logo表面,因为金属制品表面存在反光,并且Logo尺寸较小,存在的缺陷往往比较细微,容易使人身心疲劳,产生错检、漏检;(2)由于人的主观性强,难以形成一致的检测标准;(3)人易受外界环境与内心因素干扰,影响产品检测的合格率;(4)随着劳动力成本的不断提高,会大大增加企业的产品加工成本。
现有的CNN(Convolutional Neural Network)技术作为一种非常有效的特征提取方法,目前在图像识别与检测等领域取得了巨大的突破。它受启发源于生物神经网络,它的权值共享结构特点大大降低了模型的复杂度,尤其当网络输入多维数据时权值共享的作用更是体现的淋漓尽致,它能减少几个数量级的权值学习量,大大提升模型的训练速度。CNN是针对二维图像数据而设计的一种网络模型,使多维图像数据可以直接作为网络的输入,避免了传统识别算法中繁琐的数据预处理与数据重建过程。卷积神经网络能提取到数据浅层至高层的特征,并且它的结构特点决定了该网络模型对尺度、平移、旋转或者其他形式的形变具有一定程度的不变性。
如目前的VGG卷积网络结构,对不同部位图像进行卷积操作提取特征映射时,这种网络在图像识别上有较好的表现,能够实现于图像目标的分类,针对Logo缺陷判定。网络规定输入图像大小为224×224像素,在预处理时,训练集中每张图像的每个像素上都需要减去图像RGB的均值。卷积层中使用了3×3像素的卷积核。卷积步长为1个像素,图像四周的填充为1个像素,采用Max-pooling(最大池化),总共有五层,分布于其中的一些卷积层后,窗口大小为2×2的卷积核,步长为2。网络结构如图1所示,图像经过8个卷积层后再通过Maxpooling层进行提取后,将他们调整大小成为同样的层进入网络,最终得到512维特征映射,经过3次全连接层,转化成长度1000的一维向量,经过Softmax层后就得到了网络判定Logo缺陷的有无。整个网络的参数量达到140M(百万)。
VGG网络对网络不停地加卷积层,扩展神经网络的深度,并且取得了较好的效果,也让人们认识到加深网络是提高模型质量的一个有效途径,但它同时也面临着参数过于庞大冗余,训练和预测较慢等缺点,导致Logo缺陷检测速度较慢。
发明内容
本发明提供的Logo缺陷检测方法及装置,能够提升Logo缺陷的检测速度。
第一方面,本发明提供一种Logo缺陷检测方法,包括:
构建VGG网络模型,其中,所述VGG网络模型中的两个最大池化层后面具有PCA层;
对待检测的Logo图片进行分割,并记好分割后的每张图片在原图中的相对位置;
对所述VGG网络模型进行训练,直至达到预设的最大迭代数,结束训练输出缺陷分类模型;
将分割后的图片传入所述缺陷分类模型,对所述Logo图片的缺陷进行判定。
可选地,所述构建VGG网络模型包括:
在预处理时,将训练集中每张图像的每个像素上减去图像RGB的均值;
通过PCA层对最大池化层后的特征图矩阵进行粗提取主成分向量,得到的变量再进行两个Conv256层的卷积操作和最大池化层的操作;
对得到的特征图矩阵进行细提取主成分向量;
在全连接层将特征整合成1000维的特征向量,用Softmax函数对特征向量进行分类,0表示Logo图片存在缺陷,1表示Logo图片正常。
可选地,在所述对所述VGG网络模型进行训练之前,所述方法还包括:
对分割后的图片进行标注,其中0表示图片存在缺陷,1表示图片正常;
对分割后的图片进行旋转、翻转、随机改变曝光度和添加噪声操作,实现数据集增广。
可选地,所述PCA层的计算流程为:
输入粗特征向量;
将每个特征值减去平均特征值;
求特征向量协方差矩阵;
求协方差矩阵的特征向量;
将特征向量中的特征值进行重新按大小排列,选取最大的K个,其中,K为预设值;
输出这K个向量作为新的特征向量。
可选地,所述将分割后的图片传入所述缺陷分类模型,对所述Logo图片的缺陷进行判定包括:
将分割后的图片传入训练好的缺陷分类模型,对所有图片进行分类;
将有缺陷的图片依据相对位置在原Logo图片上进行定位,找出缺陷并确定缺陷所在位置。
第二方面,本发明提供一种Logo缺陷检测装置,包括:
构建单元,用于构建VGG网络模型,其中,所述VGG网络模型中的两个最大池化层后面具有PCA层;
分割单元,用于对待检测的Logo图片进行分割,并记好分割后的每张图片在原图中的相对位置;
训练单元,用于对所述VGG网络模型进行训练,直至达到预设的最大迭代数,结束训练输出缺陷分类模型;
判定单元,用于将分割后的图片传入所述缺陷分类模型,对所述Logo图片的缺陷进行判定。
可选地,所述构建单元,用于在预处理时,将训练集中每张图像的每个像素上减去图像RGB的均值;通过PCA层对最大池化层后的特征图矩阵进行粗提取主成分向量,得到的变量再进行两个Conv256层的卷积操作和最大池化层的操作;对得到的特征图矩阵进行细提取主成分向量;在全连接层将特征整合成1000维的特征向量,用Softmax函数对特征向量进行分类,0表示Logo图片存在缺陷,1表示Logo图片正常。
可选地,所述装置还包括:
标注单元,用于在所述训练单元对所述VGG网络模型进行训练之前,对分割后的图片进行标注,其中0表示图片存在缺陷,1表示图片正常;
增广单元,用于对分割后的图片进行旋转、翻转、随机改变曝光度和添加噪声操作,实现数据集增广。
可选地,所述PCA层的计算流程为:
输入粗特征向量;
将每个特征值减去平均特征值;
求特征向量协方差矩阵;
求协方差矩阵的特征向量;
将特征向量中的特征值进行重新按大小排列,选取最大的K个,其中,K为预设值;
输出这K个向量作为新的特征向量。
可选地,所述判定单元,用于将分割后的图片传入训练好的缺陷分类模型,对所有图片进行分类;将有缺陷的图片依据相对位置在原Logo图片上进行定位,找出缺陷并确定缺陷所在位置。
本发明实施例提供的Logo缺陷检测方法及装置,通过对VGG网络进行修改,添加PCA机制,组建级联的PCA卷积神经网络,将网络模型进行精简,使得模型能够快速收敛,能够使得Logo缺陷检测速度进一步提升,同时,在训练网络时,降低了网络参数量,使得训练速度加快。
附图说明
图1为现有的VGG网络的模型架构图;
图2为本发明实施例提供的Logo缺陷检测方法的流程图;
图3为本发明实施例提供的VGG网络的模型架构图;
图4为本发明实施例提供的Logo正常原图;
图5为本发明实施例提供的Logo中Y字母处有缺陷的原图;
图6为本发明实施例提供的图像分割后的效果图;
图7为本发明实施例提供的对图6进行标注后的示意图;
图8为本发明实施例提供的对图7进行增广后的示意图;
图9为本发明实施例提供的训练模型的架构图;
图10为本发明实施例提供的logo缺陷检测效果图;
图11为本发明实施例通过的Logo缺陷检测装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例使用基于级联的PCA(Principal Component Analysis,主成分分析)卷积网络提取特征的方法来对Logo进行缺陷的有无判定。PCA将变量从原来的坐标系转换到新的坐标系,转换坐标系时,以方差最大的方向作为坐标轴方向,因为变量的最大方差给出了变量的最重要的信息,去除了冗余的变量,即寻求变量中线性无关的变量,使得变量集进行降维。降维是对数据高维度特征的一种处理方法,将高维度的数据保留下最重要的一些特征,通过去除噪声,从而实现提升数据处理速度的目的。在实际的生产和应用中,降维在一定的信息损失范围内,可以节省大量的时间和成本。
本发明实施例提供一种Logo缺陷检测方法,如图2所示,所述方法包括:
S21、构建VGG网络模型,其中,所述VGG网络模型中的两个最大池化层后面具有PCA层;
S22、对待检测的Logo图片进行分割,并记好分割后的每张图片在原图中的相对位置;
S23、对所述VGG网络模型进行训练,直至达到预设的最大迭代数,结束训练输出缺陷分类模型;
S24、将分割后的图片传入所述缺陷分类模型,对所述Logo图片的缺陷进行判定。
本发明实施例提供的Logo缺陷检测方法,通过对VGG网络进行修改,添加PCA机制,组建级联的PCA卷积神经网络,将网络模型进行精简,使得模型能够快速收敛,能够使得Logo缺陷检测速度进一步提升,同时,在训练网络时,降低了网络参数量,使得训练速度加快。
下面对本发明实施例Logo缺陷检测方法进行详细说明。
本实施例Logo缺陷检测方法主要包括三大部分:模型构建、模型训练和模型应用。
首先构建VGG网络模型,本实施例构建的VGG网络模型架构如图3所示:
级联PCA网络输入图像大小为224×224像素,在预处理时,训练集中每张图像的每个像素上都需要减去图像RGB的均值。卷积层Conv_x中,分别使用了1×1、3×3和5×5像素的卷积核。卷积步长为1个像素,图像四周的填充为1个像素,采用Max-pooling(最大池化),总共有四层,分布于其中的卷积层后,窗口大小为2×2的卷积核,步长为2。然后通过PCA对MaxPooling层后的特征图矩阵进行粗提取主成分向量,得到的变量再进行两个Conv256层的卷积操作和Maxpooling层的操作。接着再对得到的特征图矩阵进行细提取主成分向量。最后,在全连接层将特征整合成1000维的特征向量,用Softmax函数对特征向量进行分类,0表示Logo图片存在缺陷,1表示Logo图片正常。
然后对所述VGG网络模型进行训练。
在对所述VGG网络模型进行训练之前,先对待检测的Logo图片进行预处理,包括图片的分割和数据集的增广。由于在Logo检测设备上采集的图片并提取Logo的ROI(RegionOf Interest,感兴趣区域)后图片大小为800×120,而缺陷分类网络输入大小为224×224,为了实现全覆盖检测,本实施例将每张采集图片分割出16张小图,并记好每张分割图片在原图中相对位置。然后将分割后的图片传入训练好的缺陷分类模型,对所有图片进行分类。最后将有缺陷的图片依据相对位置在原图上进行定位,以此来找出缺陷并确定其位置。在原来VGG的两个Maxpooling层后面增加PCA层。在前面通过Maxpooling层输出的特征,通过PCA层进行特征的筛选“提纯”,其中PCA层的计算流程如下:
输入“粗”特征向量;
每个特征值减去平均特征值;
求特征向量协方差矩阵;
求协方差矩阵的特征向量;
将特征向量中的特征值进行重新按大小排列,选取最大的K个;
输出这K个向量作为新的特征向量。
如图4所示,为训练数据的Logo正常原图SKYWORTH。
如图5所示,为训练数据的Logo中Y字母处有缺陷的原图。
先对图像进行分割,水平方向分成8份,垂直方向分成2份,得到16个小图像,分割效果如图6所示。
接着对分割后的图像进行标注,标识结果如图7所示,其中0表示Logo图片存在缺陷,1表示Logo图片正常。
接着对图像进行增广,对图像进行旋转、翻转、随机改变曝光度和添加噪声,以期提高模型的鲁棒性,增广后图像如图8所示。
训练模型的流程如图9所示,直至达到预设的最大迭代数,结束训练输出缺陷分类模型。
最后,将分割后的图片传入所述缺陷分类模型,对所述Logo图片的缺陷进行判定。
得到训练好的模型后,加载模型到显卡的显存,通过输入的Logo分割后的每张图片来对Logo缺陷进行判定,对每张小图变换到224×224的大小。
模型预测出输入的图片是否为有缺陷的Logo后,将位置坐标还原回原图,检测出的Logo缺陷效果如图10所示。
本发明通过减少原有的VGG网络模型的参数量,通过级联的PCA方法来对VGG网络模型进行加工,实现对Logo缺陷的判定,对比原有的VGG网络模型,在模型的参数数量上减少了1/3,在训练时间上,模型的训练速度加快了50%,在模型的应用上,模型的前向计算速度增加了1/3。
本发明实施例还提供一种Logo缺陷检测装置,如图11所示,所述装置包括:
构建单元21,用于构建VGG网络模型,其中,所述VGG网络模型中的两个最大池化层后面具有PCA层;
分割单元22,用于对待检测的Logo图片进行分割,并记好分割后的每张图片在原图中的相对位置;
训练单元23,用于对所述VGG网络模型进行训练,直至达到预设的最大迭代数,结束训练输出缺陷分类模型;
判定单元24,用于将分割后的图片传入所述缺陷分类模型,对所述Logo图片的缺陷进行判定。
本发明实施例提供的Logo缺陷检测装置,通过对VGG网络进行修改,添加PCA机制,组建级联的PCA卷积神经网络,将网络模型进行精简,使得模型能够快速收敛,能够使得Logo缺陷检测速度进一步提升,同时,在训练网络时,降低了网络参数量,使得训练速度加快。
可选地,所述构建单元21,用于在预处理时,将训练集中每张图像的每个像素上减去图像RGB的均值;通过PCA层对最大池化层后的特征图矩阵进行粗提取主成分向量,得到的变量再进行两个Conv256层的卷积操作和最大池化层的操作;对得到的特征图矩阵进行细提取主成分向量;在全连接层将特征整合成1000维的特征向量,用Softmax函数对特征向量进行分类,0表示Logo图片存在缺陷,1表示Logo图片正常。
可选地,所述装置还包括:
标注单元,用于在所述训练单元23对所述VGG网络模型进行训练之前,对分割后的图片进行标注,其中0表示图片存在缺陷,1表示图片正常;
增广单元,用于对分割后的图片进行旋转、翻转、随机改变曝光度和添加噪声操作,实现数据集增广。
可选地,所述PCA层的计算流程为:
输入粗特征向量;
将每个特征值减去平均特征值;
求特征向量协方差矩阵;
求协方差矩阵的特征向量;
将特征向量中的特征值进行重新按大小排列,选取最大的K个,其中,K为预设值;
输出这K个向量作为新的特征向量。
可选地,所述判定单元24,用于将分割后的图片传入训练好的缺陷分类模型,对所有图片进行分类;将有缺陷的图片依据相对位置在原Logo图片上进行定位,找出缺陷并确定缺陷所在位置。
本实施例的装置,可以用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
本领域普通技术人员可以理解实现上述方法实施例中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (10)

1.一种Logo缺陷检测方法,其特征在于,包括:
构建VGG网络模型,其中,所述VGG网络模型中的两个最大池化层后面具有PCA层;
对待检测的Logo图片进行分割,并记好分割后的每张图片在原图中的相对位置;
对所述VGG网络模型进行训练,直至达到预设的最大迭代数,结束训练输出缺陷分类模型;
将分割后的图片传入所述缺陷分类模型,对所述Logo图片的缺陷进行判定。
2.根据权利要求1所述的方法,其特征在于,所述构建VGG网络模型包括:
在预处理时,将训练集中每张图像的每个像素上减去图像RGB的均值;
通过PCA层对最大池化层后的特征图矩阵进行粗提取主成分向量,得到的变量再进行两个Conv256层的卷积操作和最大池化层的操作;
对得到的特征图矩阵进行细提取主成分向量;
在全连接层将特征整合成1000维的特征向量,用Softmax函数对特征向量进行分类,0表示Logo图片存在缺陷,1表示Logo图片正常。
3.根据权利要求1所述的方法,其特征在于,在所述对所述VGG网络模型进行训练之前,所述方法还包括:
对分割后的图片进行标注,其中0表示图片存在缺陷,1表示图片正常;
对分割后的图片进行旋转、翻转、随机改变曝光度和添加噪声操作,实现数据集增广。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述PCA层的计算流程为:
输入粗特征向量;
将每个特征值减去平均特征值;
求特征向量协方差矩阵;
求协方差矩阵的特征向量;
将特征向量中的特征值进行重新按大小排列,选取最大的K个,其中,K为预设值;
输出这K个向量作为新的特征向量。
5.根据权利要求4所述的方法,其特征在于,所述将分割后的图片传入所述缺陷分类模型,对所述Logo图片的缺陷进行判定包括:
将分割后的图片传入训练好的缺陷分类模型,对所有图片进行分类;
将有缺陷的图片依据相对位置在原Logo图片上进行定位,找出缺陷并确定缺陷所在位置。
6.一种Logo缺陷检测装置,其特征在于,包括:
构建单元,用于构建VGG网络模型,其中,所述VGG网络模型中的两个最大池化层后面具有PCA层;
分割单元,用于对待检测的Logo图片进行分割,并记好分割后的每张图片在原图中的相对位置;
训练单元,用于对所述VGG网络模型进行训练,直至达到预设的最大迭代数,结束训练输出缺陷分类模型;
判定单元,用于将分割后的图片传入所述缺陷分类模型,对所述Logo图片的缺陷进行判定。
7.根据权利要求6所述的装置,其特征在于,所述构建单元,用于在预处理时,将训练集中每张图像的每个像素上减去图像RGB的均值;通过PCA层对最大池化层后的特征图矩阵进行粗提取主成分向量,得到的变量再进行两个Conv256层的卷积操作和最大池化层的操作;对得到的特征图矩阵进行细提取主成分向量;在全连接层将特征整合成1000维的特征向量,用Softmax函数对特征向量进行分类,0表示Logo图片存在缺陷,1表示Logo图片正常。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
标注单元,用于在所述训练单元对所述VGG网络模型进行训练之前,对分割后的图片进行标注,其中0表示图片存在缺陷,1表示图片正常;
增广单元,用于对分割后的图片进行旋转、翻转、随机改变曝光度和添加噪声操作,实现数据集增广。
9.根据权利要求6至8中任一项所述的装置,其特征在于,所述PCA层的计算流程为:
输入粗特征向量;
将每个特征值减去平均特征值;
求特征向量协方差矩阵;
求协方差矩阵的特征向量;
将特征向量中的特征值进行重新按大小排列,选取最大的K个,其中,K为预设值;
输出这K个向量作为新的特征向量。
10.根据权利要求9所述的装置,其特征在于,所述判定单元,用于将分割后的图片传入训练好的缺陷分类模型,对所有图片进行分类;将有缺陷的图片依据相对位置在原Logo图片上进行定位,找出缺陷并确定缺陷所在位置。
CN201910619417.9A 2019-07-10 2019-07-10 Logo缺陷检测方法及装置 Active CN110910339B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910619417.9A CN110910339B (zh) 2019-07-10 2019-07-10 Logo缺陷检测方法及装置
PCT/CN2020/086818 WO2021004130A1 (zh) 2019-07-10 2020-04-24 Logo缺陷检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910619417.9A CN110910339B (zh) 2019-07-10 2019-07-10 Logo缺陷检测方法及装置

Publications (2)

Publication Number Publication Date
CN110910339A true CN110910339A (zh) 2020-03-24
CN110910339B CN110910339B (zh) 2022-11-22

Family

ID=69814564

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910619417.9A Active CN110910339B (zh) 2019-07-10 2019-07-10 Logo缺陷检测方法及装置

Country Status (2)

Country Link
CN (1) CN110910339B (zh)
WO (1) WO2021004130A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112037205A (zh) * 2020-09-01 2020-12-04 湖北微特传感物联研究院有限公司 一种基于深度学习的起重机裂纹检测方法
CN112051270A (zh) * 2020-09-10 2020-12-08 广州云从人工智能技术有限公司 一种输电线缺陷检测方法、系统、设备及介质
WO2021004130A1 (zh) * 2019-07-10 2021-01-14 研祥智能科技股份有限公司 Logo缺陷检测方法及装置
CN113239960A (zh) * 2021-04-09 2021-08-10 中用科技有限公司 融合ai视觉算法的道路防护智能预警方法和系统
CN113610832A (zh) * 2021-08-19 2021-11-05 创优数字科技(广东)有限公司 一种徽标缺陷检测方法、装置、设备和存储介质
CN113239960B (zh) * 2021-04-09 2024-05-28 中用科技有限公司 融合ai视觉算法的道路防护智能预警方法和系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130113914A1 (en) * 2011-11-03 2013-05-09 Pratt & Whitney System and Method for Automated Borescope Inspection User Interface
CN108109137A (zh) * 2017-12-13 2018-06-01 重庆越畅汽车科技有限公司 车辆部件的机器视觉检测系统及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110910339B (zh) * 2019-07-10 2022-11-22 研祥智能科技股份有限公司 Logo缺陷检测方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130113914A1 (en) * 2011-11-03 2013-05-09 Pratt & Whitney System and Method for Automated Borescope Inspection User Interface
CN108109137A (zh) * 2017-12-13 2018-06-01 重庆越畅汽车科技有限公司 车辆部件的机器视觉检测系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘琳: "基于CNN跨层特征融合的门牌号码识别方法", 《中国优秀硕士学位论文全文数据库(电子期刊)信息科技辑》 *
黄森林: "啤酒空瓶检测机器人的瓶身缺陷检测算法研究及应用", 《中国优秀硕士学位论文全文数据库(电子期刊)信息科技辑》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021004130A1 (zh) * 2019-07-10 2021-01-14 研祥智能科技股份有限公司 Logo缺陷检测方法及装置
CN112037205A (zh) * 2020-09-01 2020-12-04 湖北微特传感物联研究院有限公司 一种基于深度学习的起重机裂纹检测方法
CN112051270A (zh) * 2020-09-10 2020-12-08 广州云从人工智能技术有限公司 一种输电线缺陷检测方法、系统、设备及介质
CN112051270B (zh) * 2020-09-10 2021-08-13 广州云从人工智能技术有限公司 一种输电线缺陷检测方法、系统、设备及介质
CN113239960A (zh) * 2021-04-09 2021-08-10 中用科技有限公司 融合ai视觉算法的道路防护智能预警方法和系统
CN113239960B (zh) * 2021-04-09 2024-05-28 中用科技有限公司 融合ai视觉算法的道路防护智能预警方法和系统
CN113610832A (zh) * 2021-08-19 2021-11-05 创优数字科技(广东)有限公司 一种徽标缺陷检测方法、装置、设备和存储介质
CN113610832B (zh) * 2021-08-19 2023-02-10 创优数字科技(广东)有限公司 一种徽标缺陷检测方法、装置、设备和存储介质

Also Published As

Publication number Publication date
WO2021004130A1 (zh) 2021-01-14
CN110910339B (zh) 2022-11-22

Similar Documents

Publication Publication Date Title
CN110910339B (zh) Logo缺陷检测方法及装置
CN108562589B (zh) 一种对磁路材料表面缺陷进行检测的方法
CN107578418B (zh) 一种融合色彩和深度信息的室内场景轮廓检测方法
CN110400322B (zh) 基于颜色和三维几何信息的水果点云分割方法
CN109377555B (zh) 自主水下机器人前景视场三维重建目标特征提取识别方法
CN110826389B (zh) 基于注意力3d频率卷积神经网络的步态识别方法
CN109190456B (zh) 基于聚合通道特征和灰度共生矩阵的多特征融合俯视行人检测方法
CN112419185B (zh) 基于光场迭代的精确高反光去除方法
CN113112416B (zh) 一种语义引导的人脸图像修复方法
CN111080574A (zh) 一种基于信息熵和视觉注意机制的织物疵点检测方法
CN113516619A (zh) 一种基于图像处理技术的产品表面瑕疵识别方法
CN116228757B (zh) 一种基于图像处理算法的深海网箱网衣检测方法
CN112669300A (zh) 瑕疵检测方法及装置、计算机设备和存储介质
CN111553217A (zh) 一种驾驶员打电话监测方法与系统
Sari et al. Fruit classification quality using convolutional neural network and augmented reality
CN106909936B (zh) 一种基于双车辆可变形部件模型的车辆检测方法
CN115937095A (zh) 融合图像处理算法和深度学习的印刷缺陷检测方法及系统
CN115861226A (zh) 基于特征值梯度变化的深度神经网络智能识别表面缺陷方法
CN114463379A (zh) 一种视频关键点的动态捕捉方法及装置
CN110659694B (zh) 一种基于机器学习的柑橘果蒂的检测方法
CN113901916A (zh) 一种基于可视化光流特征的面部欺诈动作识别方法
CN108268533A (zh) 一种用于图像检索的图像特征匹配方法
Hayashi et al. Frequency perturbation analysis for anomaly detection using Fourier heat map
Liu et al. Multi-face detection based on improved gaussian distribution
JP2005071125A (ja) 被写体検出装置、被写体検出方法、被写体データ選定プログラムおよび被写体位置検出プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230707

Address after: 518057 1701, Yanxiang science and technology building, 31 Gaoxin middle Fourth Road, Maling community, Yuehai street, Nanshan District, Shenzhen City, Guangdong Province

Patentee after: Shenzhen Yanxiang Smart Technology Co.,Ltd.

Address before: No.1, Yanxiang Zhigu chuangxiangdi, No.11, Gaoxin Road, Guangming New District, Shenzhen, Guangdong 518107

Patentee before: EVOC INTELLIGENT TECHNOLOGY Co.,Ltd.