CN116681668A - 一种基于四层梯度融合神经网络的外观缺陷检测方法 - Google Patents

一种基于四层梯度融合神经网络的外观缺陷检测方法 Download PDF

Info

Publication number
CN116681668A
CN116681668A CN202310645383.7A CN202310645383A CN116681668A CN 116681668 A CN116681668 A CN 116681668A CN 202310645383 A CN202310645383 A CN 202310645383A CN 116681668 A CN116681668 A CN 116681668A
Authority
CN
China
Prior art keywords
feature
image
initial image
defect
defect detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310645383.7A
Other languages
English (en)
Inventor
李小龙
黄银祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yuanshan Intelligent Technology Co Ltd
Original Assignee
Beijing Yuanshan Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yuanshan Intelligent Technology Co Ltd filed Critical Beijing Yuanshan Intelligent Technology Co Ltd
Priority to CN202310645383.7A priority Critical patent/CN116681668A/zh
Publication of CN116681668A publication Critical patent/CN116681668A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4038Image mosaicing, e.g. composing plane images from plane sub-images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/52Scale-space analysis, e.g. wavelet analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/32Indexing scheme for image data processing or generation, in general involving image mosaicing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供了一种基于四层梯度融合神经网络的外观缺陷检测方法,该方法包括:获取待检测烟盒的烟盒初始图像,利用第一编码器及第二编码器分别对烟盒初始图像中的特征进行提取,获得第一初始图像特征及第二初始图像特征;利用第一解码器及第二解码器对第一初始图像特征及第二初始图像特征进行上采样,得到第一特征图及第二特征图;对第一特征图及第二特征图进行拼接后获得拼接图像;利用注意力层对拼接图像进行自适应池化及特征加权处理获得重构图像;将重构图像输入分类器中确定缺陷等级及缺陷类型。通过采用上述基于四层梯度融合神经网络的外观缺陷检测方法,解决了烟盒外观缺陷检测效率及检测准确率低的问题。

Description

一种基于四层梯度融合神经网络的外观缺陷检测方法
技术领域
本申请涉及图像处理技术领域,具体而言,涉及一种基于四层梯度融合神经网络的外观缺陷检测方法。
背景技术
在烟草制造行业中,烟盒是直接面向消费者的产品,对烟盒生产质量的控制显得尤为重要。常见的烟盒缺陷包括封签污、破损、擦伤、褶皱、脱落、吐胶、叠角、缺失、小盒轧皱、轧破、外形不方正等等,这些缺陷可能是由于机械生产设备装置故障、装置漏油、生产挤压引起、胶水粘合不紧等原因导致的,如何快速、准确地对烟盒外观缺陷进行检测,是控制烟盒生产质量的重要一环。目前,通常是采用模版匹配的方式进行缺陷检测,模板匹配需要建立模板库,模板库中存储了针对不同缺陷所建立的模板。
然而,上述基于四层梯度融合神经网络的外观缺陷检测方法,模板匹配的检测速度较慢,无法满足高速生产线的要求,并且模板匹配对于光照、阴影等环境因素较为敏感,容易出现误检或漏检的情况,导致检测准确性低的问题。
发明内容
有鉴于此,本申请的目的在于提供一种基于四层梯度融合神经网络的外观缺陷检测方法,以解决在对烟盒外观缺陷进行检测时,检测效率及检测准确率低的问题。
第一方面,本申请实施例提供了一种基于四层梯度融合神经网络的外观缺陷检测方法,包括:
获取待检测烟盒的烟盒初始图像,利用缺陷检测模型中的第一编码器及第二编码器分别对烟盒初始图像中的不同特征尺度的特征进行提取,获得第一初始图像特征及第二初始图像特征,第一初始图像特征的特征尺度大于第二初始图像特征的特征尺度;
利用缺陷检测模型中的第一解码器及第二解码器对第一初始图像特征及第二初始图像特征进行上采样,得到第一特征图及第二特征图;
对第一特征图及第二特征图进行拼接后,获得拼接图像;
利用缺陷检测模型中的注意力层对拼接图像进行自适应池化及特征加权处理,获得重构图像;
将重构图像输入缺陷检测模型的分类器中,确定待检测烟盒的缺陷等级及缺陷类型。
可选地,对第一特征图及第二特征图进行拼接后,获得拼接图像,包括:将第一特征图对应的第一特征数组与第二特征图对应的第二特征数组拼接在一起,获得特征张量;对特征张量进行多层卷积及上采样操作,获得拼接图像。
可选地,利用缺陷检测模型中的注意力层对拼接图像进行自适应池化及特征加权处理,获得重构图像,包括:针对拼接图像对应的特征图中的每个区域,采用自适应池化方法将该区域内的所有特征缩放到同一尺寸;对缩放后的特征进行加权平均处理,获得该区域的池化特征;将该区域的池化特征与特征图上对应位置的特征进行加权相乘,获得加权特征;对不同区域的加权特征进行多层卷积和上采样处理,获得重构图像。
可选地,分类器包括缺陷等级分类器及缺陷类型分类器;将重构图像输入缺陷检测模型的分类器中,确定待检测烟盒的缺陷等级及缺陷类型,包括:将重构图像输入缺陷等级分类器中,确定待检测烟盒的缺陷等级;将重构图像输入缺陷类型分类器中,确定待检测烟盒的缺陷类型。
可选地,利用缺陷检测模型中的第一解码器及第二解码器对第一初始图像特征及第二初始图像特征进行上采样,得到第一特征图及第二特征图,包括:利用第一解码器对第一初始图像特征进行上采样,获得与烟盒初始图像大小相同的第一特征图;利用第二解码器对第二初始图像特征进行上采样,获得与烟盒初始图像大小相同的第二特征图。
可选地,在获取待检测烟盒的烟盒初始图像之前,还包括:采用监督学习方法,利用无缺陷标签的烟盒图像对第一编码器及第二编码器进行训练,以提取图像特征;利用有缺陷标签的烟盒图像对缺陷检测模型进行整体训练。
可选地,利用有缺陷标签的烟盒图像对缺陷检测模型进行整体训练,包括:将交叉熵损失函数作为目标函数;利用随机梯度下降算法对目标函数的结果进行迭代计算,根据迭代计算的结果确定缺陷检测模型中的模型参数的取值。
第二方面,本申请实施例还提供了一种基于四层梯度融合神经网络的外观缺陷检测装置,所述装置包括:
特征提取模块,用于获取待检测烟盒的烟盒初始图像,利用缺陷检测模型中的第一编码器及第二编码器分别对烟盒初始图像中的不同特征尺度的特征进行提取,获得第一初始图像特征及第二初始图像特征,第一初始图像特征的特征尺度大于第二初始图像特征的特征尺度;
解码模块,用于利用缺陷检测模型中的第一解码器及第二解码器对第一初始图像特征及第二初始图像特征进行上采样,得到第一特征图及第二特征图;
拼接模块,用于对第一特征图及第二特征图进行拼接后,获得拼接图像;
图像重构模块,用于利用缺陷检测模型中的注意力层对拼接图像进行自适应池化及特征加权处理,获得重构图像;
缺陷确定模块,用于将重构图像输入缺陷检测模型的分类器中,确定待检测烟盒的缺陷等级及缺陷类型。
第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的基于四层梯度融合神经网络的外观缺陷检测方法的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的基于四层梯度融合神经网络的外观缺陷检测方法的步骤。
本申请实施例带来了以下有益效果:
本申请实施例提供的一种基于四层梯度融合神经网络的外观缺陷检测方法,能够利用缺陷检测模型中的编码器及解码器对烟盒初始图像进行特征提取及上采样获得拼接图像,并利用注意力层对拼接图像进行处理,以得到烟盒初始图像中的重要特征,对关键区域进行重点关注,以根据重要特征确定烟盒外观缺陷,与现有技术中的基于四层梯度融合神经网络的外观缺陷检测方法相比,解决了在对烟盒外观缺陷进行检测时,检测效率及检测准确率低的问题。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的基于四层梯度融合神经网络的外观缺陷检测方法的流程图;
图2示出了本申请实施例所提供的基于四层梯度融合神经网络的外观缺陷检测装置的结构示意图;
图3示出了本申请实施例所提供的电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。
值得注意的是,在本申请提出之前,在烟草制造行业中,烟盒是直接面向消费者的产品,对烟盒生产质量的控制显得尤为重要。常见的烟盒缺陷包括封签污、破损、擦伤、褶皱、脱落、吐胶、叠角、缺失、小盒轧皱、轧破、外形不方正等等,这些缺陷可能是由于机械生产设备装置故障、装置漏油、生产挤压引起、胶水粘合不紧等原因导致的,如何快速、准确地对烟盒外观缺陷进行检测,是控制烟盒生产质量的重要一环。目前,通常是采用模版匹配的方式进行缺陷检测,模板匹配需要建立模板库,模板库中存储了针对不同缺陷所建立的模板。然而,上述基于四层梯度融合神经网络的外观缺陷检测方法,需要大量的人工操作来建立模板库,且需要不断对模板库进行更新及维护,更新维护成本较高。另外,模板匹配的检测速度较慢,无法满足高速生产线的要求,并且模板匹配对于光照、阴影等环境因素较为敏感,容易出现误检或漏检的情况,导致检测准确性低的问题。
基于此,本申请实施例提供了一种基于四层梯度融合神经网络的外观缺陷检测方法,以提高烟盒外观缺陷的检测效率及检测准确率。
请参阅图1,图1为本申请实施例所提供的一种基于四层梯度融合神经网络的外观缺陷检测方法的流程图。如图1所示,本申请实施例提供的基于四层梯度融合神经网络的外观缺陷检测方法,包括:
步骤S101,获取待检测烟盒的烟盒初始图像,利用缺陷检测模型中的第一编码器及第二编码器分别对烟盒初始图像中的不同特征尺度的特征进行提取,获得第一初始图像特征及第二初始图像特征。
该步骤中,烟盒初始图像可指烟盒的外观图像。
缺陷检测模型可指神经网络模型,示例性的,缺陷检测模型为四层梯度融合神经网络模型。
特征尺度可指图像特征的尺度,特征尺度越大越容易被识别,特征尺度越小越不容易被识别。第一初始图像特征的特征尺度大于第二初始图像特征的特征尺度。
第一初始图像特征可指低等特征,第二初始图像特征可指中等特征,低等特征的特征尺度大于中等特征的特征尺度。
在本申请实施例中,将待检测烟盒放入传送带上,传送带将待检测烟盒传送至检测区域内,检测区域内传送带的上方设置由电荷耦合器件(Charge Coupled Device,CCD)工业相机、光源、频闪器及高精度光纤位置传感器等设备。当待检测烟盒被高精度光纤位置传感器识别到时,高精度光纤位置传感器会发送触发信号,以启动CCD工业相机和光源,光源、频闪器对待检测烟盒进行照射,CCD工业相机对待检测烟盒进行图像采集获得未经过预处理的烟盒初始图像。
对未经过预处理的烟盒初始图像进行定位及矫正,以消除平移和抖动,然后利用低通滤波进行降噪处理,得到经过预处理的烟盒初始图像。
将经过预处理的烟盒初始图像输入至缺陷检测模型中,缺陷检测模型中包括第一编码器及第二编码器,第一编码器对烟盒初始图像中的低等尺度的特征进行提取获得第一初始图像特征,第二编码器对烟盒初始图像中的中等尺度的特征进行提取获得第二初始图像特征。
在一可选实施例中,在获取待检测烟盒的烟盒初始图像之前,还包括:采用监督学习方法,利用无缺陷标签的烟盒图像对第一编码器及第二编码器进行训练,以提取图像特征;利用有缺陷标签的烟盒图像对缺陷检测模型进行整体训练。
具体的,在对待检测烟盒进行外观缺陷检测之前,需要先对缺陷检测模型进行训练。训练前先对不同烟盒在正常外观下的参数进行采集,以利用这些正常外观下的参数对缺陷检测模型进行训练。其中,正常外观下的参数包括但不限于:烟盒品牌类别、烟盒尺寸、烟盒产地、相机曝光参数,相机曝光参数可指光圈、快门和感光度。
同时,获取不同参数下存在外观缺陷的历史烟盒图像,并对历史烟盒图像中的外观缺陷进行标签标注,获得无缺陷标签的历史烟盒图像及有标签的历史烟盒图像。利用无缺陷标签且存在外观缺陷的历史烟盒图像对第一编码器及第二编码器进行训练,保证特征提取的准确性。再利用有缺陷标签的历史烟盒图像及正外观下的参数对缺陷检测模型进行整体训练,实现对不同缺陷等级、不同缺陷类型的划分。
其中,在对历史烟盒图像中的外观缺陷进行标签标注时,先对缺陷等级进行标注,利用标注缺陷等级的历史烟盒图像对缺陷等级分类器进行训练得到优化后的缺陷等级分类器。然后,针对每个缺陷等级,对该缺陷等级下的不同缺陷类型分类器进行训练,获得该缺陷等级下优化后的缺陷类型分类器。
在一可选实施例中,利用有缺陷标签的烟盒图像对缺陷检测模型进行整体训练,包括:将交叉熵损失函数作为目标函数;利用随机梯度下降算法对目标函数的结果进行迭代计算,根据迭代计算的结果确定缺陷检测模型中的模型参数的取值。
具体的,在对缺陷检测模型进行整体训练时,可采用交叉熵损失函数作为目标函数。其中,交叉熵损失函数可以用于衡量真实标签与缺陷检测模型预测结果之间的差距,从而作为目标函数进行优化。在训练缺陷检测模型时,采用反向传播算法,将最小化交叉熵损失函数作为目标,利用Adam优化算法不断迭代计算目标函数的取值,将目标函数的取值最小时缺陷检测模型的模型参数的取值作为优化后的参数取值。
步骤S102,利用缺陷检测模型中的第一解码器及第二解码器对第一初始图像特征及第二初始图像特征进行上采样,得到第一特征图及第二特征图。
该步骤中,上采样可指通过转置卷积方法来放大原图像,以获得更高分辨率的图像。
第一特征图可指包括第一初始图像特征的特征尺度较大的特征图,其中,特征尺度较大用于表征特征细节少。
第二特征图可指包括第二初始图像特征的特征尺度较小的特征图,特征尺度较小用于表征特征细节多。
在一可选实施例中,利用缺陷检测模型中的第一解码器及第二解码器对第一初始图像特征及第二初始图像特征进行上采样,得到第一特征图及第二特征图,包括:利用第一解码器对第一初始图像特征进行上采样,获得与烟盒初始图像大小相同的第一特征图;利用第二解码器对第二初始图像特征进行上采样,获得与烟盒初始图像大小相同的第二特征图。
具体的,假设烟盒初始图像为256×256的图像,则经第一解码器对第一初始图像特征进行上采样后,得到同样为256×256的第一特征图,该第一特征图中包括了第一初始图像特征,例如:烟盒轮廓及烟盒纹理。
经第二解码器对第二初始图像特征进行上采样后,得到同样为256×256的第二特征图,该第二特征图中包括了第二初始图像特征,例如:烟盒标志及烟盒商标。
步骤S103,对第一特征图及第二特征图进行拼接后,获得拼接图像。
该步骤中,拼接图像可指解码后获得的包含第一初始图像特征及第二初始图像特征的图像。
其中,烟盒初始图像是原始图像,拼接后得到的拼接图像是由多个特征图反过来倒推出的图像。
在一可选实施例中,对第一特征图及第二特征图进行拼接后,获得拼接图像,包括:将第一特征图对应的第一特征数组与第二特征图对应的第二特征数组拼接在一起,获得特征张量;对特征张量进行多层卷积及上采样操作,获得拼接图像。
具体的,第一特征图对应第一特征数组,第二特征图对应第二特征数组,将第一特征数组与第二特征数组拼接在一起获得特征张量,每个特征数组用于表征对应的特征图信息,例如:第一特征数组为一个1×30的数组,第二特征数组为一个1×50的数组,则拼接后得到一个1×80的数组,该1×80的数组即为特征张量。然后,对该特征张量进行多层卷积和上采样操作,得到拼接图像。
步骤S104,利用缺陷检测模型中的注意力层对拼接图像进行自适应池化及特征加权处理,获得重构图像。
该步骤中,注意力层对拼接图像中的关键区域进行重点关注,实现对关键区域的强化,整个缺陷检测模型采用了多层卷积和池化操作,实现了对不同特征的提取和融合。
在一可选实施例中,利用缺陷检测模型中的注意力层对拼接图像进行自适应池化及特征加权处理,获得重构图像,包括:针对拼接图像对应的特征图中的每个区域,采用自适应池化方法将该区域内的所有特征缩放到同一尺寸;对缩放后的特征进行加权平均处理,获得该区域的池化特征;将该区域的池化特征与特征图上对应位置的特征进行加权相乘,获得加权特征;对不同区域的加权特征进行多层卷积和上采样处理,获得重构图像。
具体的,使用第一编码器和第二编码器对拼接图像进行特征提取,获得特征图,然后,对特征图上的每个区域进行自适应池化处理,以将该区域内所有特征缩放到同一个尺寸,并对这些特征进行加权平均,得到该区域的池化特征。将池化特征与特征图上对应位置的原始特征进行加权相乘,得到加权特征。将加权特征经过多层卷积和上采样操作得到重构图像。
通过以上过程,注意力机制可以自适应地捕捉图像中的关键区域,即存在外观缺陷的区域,并针对这些区域进行重点关注,实现对关键区域的准确表达。
步骤S105,将重构图像输入缺陷检测模型的分类器中,确定待检测烟盒的缺陷等级及缺陷类型。
该步骤中,由于重构图像中存在外观缺陷的区域为关键区域,并对关键区域进行了强化,将对外观缺陷进行强化表达后的图像输入至分类器中,能够更准确地确定缺陷等级及缺陷类型。
在一可选实施例中,分类器包括缺陷等级分类器及缺陷类型分类器;将重构图像输入缺陷检测模型的分类器中,确定待检测烟盒的缺陷等级及缺陷类型,包括:将重构图像输入缺陷等级分类器中,确定待检测烟盒的缺陷等级;将重构图像输入缺陷类型分类器中,确定待检测烟盒的缺陷类型。
这里,缺陷等级可指缺陷的严重等级,示例性的,缺陷等级为X、A、B、C、D五个等级,其中,X等级的缺陷最严重。
缺陷类型可指缺陷的种类,缺陷种类包括但不限于:封签污、破损、擦伤、褶皱、脱落、吐胶、叠角、缺失、小盒轧皱、轧破、外形不方正。
具体的,分类器分为两类,一类是缺陷等级分类器,一类是缺陷类型分类器,且缺陷等级分类器为分布式缺陷检测模型,缺陷类型分类器中包括多个检测算法,每个缺陷类型对应一个检测算法。
按照工业生产缺陷等级的评定标准构建缺陷等级分类器,并将重构图像输入缺陷等级分类器中,确定待检测烟盒的缺陷等级,再将重构图像输入缺陷类型分类器中,确定待检测烟盒的缺陷类型。
与现有技术中基于四层梯度融合神经网络的外观缺陷检测方法相比,本申请能够利用缺陷检测模型中的编码器及解码器对烟盒初始图像进行特征提取及上采样获得拼接图像,并利用注意力层对拼接图像进行处理,以得到烟盒初始图像中的重要特征,对关键区域进行重点关注,以根据重要特征确定烟盒外观缺陷,解决了在对烟盒外观缺陷进行检测时,检测效率及检测准确率低的问题。
基于同一发明构思,本申请实施例中还提供了与基于四层梯度融合神经网络的外观缺陷检测方法对应的基于四层梯度融合神经网络的外观缺陷检测装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述基于四层梯度融合神经网络的外观缺陷检测方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
请参阅图2,图2为本申请实施例所提供的一种基于四层梯度融合神经网络的外观缺陷检测装置的结构示意图。如图2中所示,所述基于四层梯度融合神经网络的外观缺陷检测装置200包括:
特征提取模块201,用于获取待检测烟盒的烟盒初始图像,利用缺陷检测模型中的第一编码器及第二编码器分别对烟盒初始图像中的不同特征尺度的特征进行提取,获得第一初始图像特征及第二初始图像特征,第一初始图像特征的特征尺度大于第二初始图像特征的特征尺度;
解码模块202,用于利用缺陷检测模型中的第一解码器及第二解码器对第一初始图像特征及第二初始图像特征进行上采样,得到第一特征图及第二特征图;
拼接模块203,用于对第一特征图及第二特征图进行拼接后,获得拼接图像;
图像重构模块204,用于利用缺陷检测模型中的注意力层对拼接图像进行自适应池化及特征加权处理,获得重构图像;
缺陷确定模块205,用于将重构图像输入缺陷检测模型的分类器中,确定待检测烟盒的缺陷等级及缺陷类型。
请参阅图3,图3为本申请实施例所提供的一种电子设备的结构示意图。如图3中所示,所述电子设备300包括处理器310、存储器320和总线330。
所述存储器320存储有所述处理器310可执行的机器可读指令,当电子设备300运行时,所述处理器310与所述存储器320之间通过总线330通信,所述机器可读指令被所述处理器310执行时,可以执行如上述图1所示方法实施例中的基于四层梯度融合神经网络的外观缺陷检测方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述图1所示方法实施例中的基于四层梯度融合神经网络的外观缺陷检测方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种基于四层梯度融合神经网络的外观缺陷检测方法,其特征在于,包括:
获取待检测烟盒的烟盒初始图像,利用缺陷检测模型中的第一编码器及第二编码器分别对所述烟盒初始图像中的不同特征尺度的特征进行提取,获得第一初始图像特征及第二初始图像特征,所述第一初始图像特征的特征尺度大于所述第二初始图像特征的特征尺度;
利用所述缺陷检测模型中的第一解码器及第二解码器对所述第一初始图像特征及所述第二初始图像特征进行上采样,得到第一特征图及第二特征图;
对所述第一特征图及所述第二特征图进行拼接后,获得拼接图像;
利用所述缺陷检测模型中的注意力层对所述拼接图像进行自适应池化及特征加权处理,获得重构图像;
将所述重构图像输入所述缺陷检测模型的分类器中,确定所述待检测烟盒的缺陷等级及缺陷类型。
2.根据权利要求1所述的方法,其特征在于,所述对所述第一特征图及所述第二特征图进行拼接后,获得拼接图像,包括:
将所述第一特征图对应的第一特征数组与所述第二特征图对应的第二特征数组拼接在一起,获得特征张量;
对所述特征张量进行多层卷积及上采样操作,获得拼接图像。
3.根据权利要求1所述的方法,其特征在于,所述利用所述缺陷检测模型中的注意力层对所述拼接图像进行自适应池化及特征加权处理,获得重构图像,包括:
针对所述拼接图像对应的特征图中的每个区域,采用自适应池化方法将该区域内的所有特征缩放到同一尺寸;
对缩放后的特征进行加权平均处理,获得该区域的池化特征;
将该区域的池化特征与所述特征图上对应位置的特征进行加权相乘,获得加权特征;
对不同区域的加权特征进行多层卷积和上采样处理,获得重构图像。
4.根据权利要求1所述的方法,其特征在于,所述分类器包括缺陷等级分类器及缺陷类型分类器;
所述将所述重构图像输入所述缺陷检测模型的分类器中,确定所述待检测烟盒的缺陷等级及缺陷类型,包括:
将所述重构图像输入所述缺陷等级分类器中,确定所述待检测烟盒的缺陷等级;
将所述重构图像输入所述缺陷类型分类器中,确定所述待检测烟盒的缺陷类型。
5.根据权利要求1所述的方法,其特征在于,所述利用所述缺陷检测模型中的第一解码器及第二解码器对所述第一初始图像特征及所述第二初始图像特征进行上采样,得到第一特征图及第二特征图,包括:
利用所述第一解码器对所述第一初始图像特征进行上采样,获得与所述烟盒初始图像大小相同的第一特征图;
利用所述第二解码器对所述第二初始图像特征进行上采样,获得与所述烟盒初始图像大小相同的第二特征图。
6.根据权利要求1所述的方法,其特征在于,在所述获取待检测烟盒的烟盒初始图像之前,还包括:
采用监督学习方法,利用无缺陷标签的烟盒图像对所述第一编码器及所述第二编码器进行训练,以提取图像特征;
利用有缺陷标签的烟盒图像对所述缺陷检测模型进行整体训练。
7.根据权利要求6所述的方法,其特征在于,所述利用有缺陷标签的烟盒图像对所述缺陷检测模型进行整体训练,包括:
将交叉熵损失函数作为目标函数;
利用随机梯度下降算法对所述目标函数的结果进行迭代计算,根据迭代计算的结果确定所述缺陷检测模型中的模型参数的取值。
8.一种基于四层梯度融合神经网络的外观缺陷检测装置,其特征在于,包括:
特征提取模块,用于获取待检测烟盒的烟盒初始图像,利用缺陷检测模型中的第一编码器及第二编码器分别对所述烟盒初始图像中的不同特征尺度的特征进行提取,获得第一初始图像特征及第二初始图像特征,所述第一初始图像特征的特征尺度大于所述第二初始图像特征的特征尺度;
解码模块,用于利用所述缺陷检测模型中的第一解码器及第二解码器对所述第一初始图像特征及所述第二初始图像特征进行上采样,得到第一特征图及第二特征图;
拼接模块,用于对所述第一特征图及所述第二特征图进行拼接后,获得拼接图像;
图像重构模块,用于利用所述缺陷检测模型中的注意力层对所述拼接图像进行自适应池化及特征加权处理,获得重构图像;
缺陷确定模块,用于将所述重构图像输入所述缺陷检测模型的分类器中,确定所述待检测烟盒的缺陷等级及缺陷类型。
9.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至7中任一项所述的基于四层梯度融合神经网络的外观缺陷检测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7中任一项所述的基于四层梯度融合神经网络的外观缺陷检测方法的步骤。
CN202310645383.7A 2023-06-01 2023-06-01 一种基于四层梯度融合神经网络的外观缺陷检测方法 Pending CN116681668A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310645383.7A CN116681668A (zh) 2023-06-01 2023-06-01 一种基于四层梯度融合神经网络的外观缺陷检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310645383.7A CN116681668A (zh) 2023-06-01 2023-06-01 一种基于四层梯度融合神经网络的外观缺陷检测方法

Publications (1)

Publication Number Publication Date
CN116681668A true CN116681668A (zh) 2023-09-01

Family

ID=87781759

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310645383.7A Pending CN116681668A (zh) 2023-06-01 2023-06-01 一种基于四层梯度融合神经网络的外观缺陷检测方法

Country Status (1)

Country Link
CN (1) CN116681668A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112766283A (zh) * 2021-01-25 2021-05-07 西安电子科技大学 一种基于多尺度卷积网络的两相流流型识别方法
CN113065551A (zh) * 2021-03-19 2021-07-02 杭州迪英加科技有限公司 利用深度神经网络模型执行图像分割的方法
CN113780296A (zh) * 2021-09-13 2021-12-10 山东大学 基于多尺度信息融合的遥感图像语义分割方法及系统
CN114708214A (zh) * 2022-03-28 2022-07-05 北京远舢智能科技有限公司 一种烟盒缺陷检测方法、装置、设备及介质
CN115272330A (zh) * 2022-09-28 2022-11-01 深圳先进技术研究院 基于电池表面图像的缺陷检测方法、系统及相关设备
CN116012339A (zh) * 2023-01-09 2023-04-25 广州广芯封装基板有限公司 图像处理方法、电子设备及计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112766283A (zh) * 2021-01-25 2021-05-07 西安电子科技大学 一种基于多尺度卷积网络的两相流流型识别方法
CN113065551A (zh) * 2021-03-19 2021-07-02 杭州迪英加科技有限公司 利用深度神经网络模型执行图像分割的方法
CN113780296A (zh) * 2021-09-13 2021-12-10 山东大学 基于多尺度信息融合的遥感图像语义分割方法及系统
CN114708214A (zh) * 2022-03-28 2022-07-05 北京远舢智能科技有限公司 一种烟盒缺陷检测方法、装置、设备及介质
CN115272330A (zh) * 2022-09-28 2022-11-01 深圳先进技术研究院 基于电池表面图像的缺陷检测方法、系统及相关设备
CN116012339A (zh) * 2023-01-09 2023-04-25 广州广芯封装基板有限公司 图像处理方法、电子设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN111325713B (zh) 基于神经网络的木材缺陷检测方法、系统及存储介质
CN110619618B (zh) 一种表面缺陷检测方法、装置及电子设备
CN114066811B (zh) 一种工业产品异常检测方法、系统、装置及存储介质
Zipfel et al. Anomaly detection for industrial quality assurance: A comparative evaluation of unsupervised deep learning models
KR20200039049A (ko) 외관불량 검사방법 및 외관불량 검사 시스템
CN111257341A (zh) 基于多尺度特征与堆叠式全卷积网络的水下建筑物裂缝检测方法
CN111310826B (zh) 样本集的标注异常检测方法、装置及电子设备
CA3206604A1 (en) System and method for manufacturing quality control using automated visual inspection
JP2007156655A (ja) 変動領域検出装置及びその方法
KR20210038303A (ko) 제품 분류 시스템 및 방법
CN115830004A (zh) 表面缺陷检测方法、装置、计算机设备和存储介质
CN116542984A (zh) 五金件缺陷检测方法、装置、计算机设备及存储介质
CN114078127A (zh) 物件的缺陷检测及计数方法、装置、设备和存储介质
CN117745678A (zh) 一种输送带滚筒包胶检测方法、装置、设备及存储介质
Vargas et al. Development of an online automated fabric inspection system
CN117274689A (zh) 用于包装盒缺陷检测的检测方法及其系统
CN116681668A (zh) 一种基于四层梯度融合神经网络的外观缺陷检测方法
CN116977249A (zh) 缺陷检测的方法、模型训练的方法和装置
CN115830385A (zh) 图像检测方法、装置、电子设备及计算机可读取存储介质
CN113034432B (zh) 一种产品缺陷检测方法、系统、装置及存储介质
CN114708214A (zh) 一种烟盒缺陷检测方法、装置、设备及介质
CN115082416A (zh) 镜片瑕疵检测方法、装置、设备及存储介质
CN114235810A (zh) 一种基于面阵工业相机的布匹瑕疵自动检测方法
WO2020031423A1 (ja) オブジェクト検出方法、オブジェクト検出装置及びコンピュータプログラム
KR20230036650A (ko) 영상 패치 기반의 불량 검출 시스템 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination