CN117214178A - 一种用于包装生产线上包装件外观缺陷智能识别方法 - Google Patents

一种用于包装生产线上包装件外观缺陷智能识别方法 Download PDF

Info

Publication number
CN117214178A
CN117214178A CN202311194739.6A CN202311194739A CN117214178A CN 117214178 A CN117214178 A CN 117214178A CN 202311194739 A CN202311194739 A CN 202311194739A CN 117214178 A CN117214178 A CN 117214178A
Authority
CN
China
Prior art keywords
image
gray
processing
package
production line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311194739.6A
Other languages
English (en)
Inventor
董春玲
王玘璇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Communication University of China
Original Assignee
Communication University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Communication University of China filed Critical Communication University of China
Priority to CN202311194739.6A priority Critical patent/CN117214178A/zh
Publication of CN117214178A publication Critical patent/CN117214178A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种用于包装生产线上包装件外观缺陷智能识别方法,包括以下步骤:经过包装机包装后的包装件被传送到光触开关的位置,此时,工业相机开始采集外包装的图像信号,并将其传送至计算机进行图像处理。通过对图像进行分析和比对,系统能够准确地检测出外包装的缺陷问题。一旦识别出缺陷,识别结果将被传送至气缸模块。气缸模块根据接收到的指令,迅速对有缺陷的产品进行剔除,以确保只有合格的产品能够继续流经生产线。而通过传送带,合格的产品将被顺利地传送到后续的工艺环节,以完成整个生产过程。本发明具有高效、精确和可靠的特点,大大提升包装生产线的生产质量和效率,实现自动化的缺陷检测,减少了人力成本和人为误差的可能性。

Description

一种用于包装生产线上包装件外观缺陷智能识别方法
技术领域
本发明属于包装机械以及人工智能技术领域,具体涉及一种用于包装生产线上包装件外观缺陷智能识别方法。
背景技术
大部分工业产品的外包装具有质量轻、强度高和价格低等优点,被广泛用于食品、农产品、化工产品等物料的包装中。然而,包装件的外观质量直接影响着包装效果,甚至对产品的质量和存储运输环节起着至关重要的作用。因此,在生产过程中对包装件外观进行在线缺陷检测具有重要的意义。传统的人工检测方法存在一些问题,包括误差率高、劳动量大和成本高等。近年来,智能化无损检测技术不断发展成熟,并迅速应用于各个领域。无损检测技术主要包括超声波检测、红外线检测和机器视觉检测等。在这些技术中,机器视觉检测以其高检测精度和低成本等优点,被广泛用于产品缺陷检测中。机器视觉检测技术利用高性能的相机和图像处理算法,能够快速、准确地分析和识别包装件外观的缺陷。通过图像采集和处理,系统可以检测出缺陷如破损、污渍、错位等,并及时做出判断和处理。相比于传统的人工检测方法,机器视觉检测具有更高的检测精度和效率,减少了人为因素的干扰,同时降低了劳动量和成本。所以,智能化无损检测技术在工业产品外包装缺陷检测中具有重要的应用价值。机器视觉检测作为一种高精度、低成本的技术,为产品质量控制和生产效率提升提供了有效的解决方案。随着工业4.0的不断推进,这种智能化的检测技术将在工业生产中发挥越来越重要的作用。
发明内容
本发明为了解决现有技术存在的不足,提供一种检测精度高、效率高、成本低的用于包装生产线上包装件外观缺陷智能识别方法。
为解决上述技术问题,本发明采用如下技术方案:一种用于包装生产线上包装件外观缺陷智能识别方法,包括以下步骤:在包装生产线上,经过包装机包装后的包装件通过传送带被输送到光电触发开关所检测的位置,光电触发开关将检测到有包装件到位需要进行检测的信号传输给图像识别处理以及系统运动控制模块;图像识别处理以及系统运动控制模块向图像采集模块发出启动工作的信号,图像采集模块采集包装件的外包装图像信号,并将图像信号传送至图像识别处理以及系统运动控制模块进行图像的识别和处理;图像识别处理以及系统运动控制模块内置图像识别处理算法,高效地分析采集的图像并比对预设的标准,通过对图像进行分析和比对,准确地检测出外包装的缺陷问题,如破损、污渍或错误的标;合格的包装件外观经传送带继续向前输送,若包装件的外包装有上述缺陷问题,在包装件被输送到剔除装置时,图像识别处理以及系统运动控制模块命令剔除装置动作,将有缺陷问题的包装件从生产线的传送带上剔除。
图像采集模块包括LED条形背光源一个、光源模拟控制器一台和CMOS工业相机;
图像识别处理以及系统运动控制模块内置的图像识别处理算法包括以下流程:图像预处理→图像灰度化→图像二值化→二值图像去噪→边缘检测→旋转校正与缩放校正→数据增强→视觉注意力训练→交叉验证→完成缺陷分类。
所述的图像预处理具体为:在生产线上对包装件的外包装进行缺陷检测时,使用COMS工业相机采集图像,但是由于存在目标产品区域和背景区域导致产品的规格大小以及在图像中的位置不确定,为了对包装件的外包装的检测区域进行校正与定位裁剪,因此,需要从采集图像中提取出外包装需要检测的部位,并对其进行初步剪裁;
同时由于包装件在传送带上输送过程中处于持续运动状态,可能会出现倾斜并导致包装件与COMS工业相机之间的物距发生变化;因此,需要对包装件进行倾斜校正和缩小物距误差的缩放校正;确保在后续的图像处理中,获取到准确且可靠的包装件的外包装图像数据。
所述的图像灰度化具体为:灰度图是一种二维矩阵图像,在该图像中,每个像素点都对应着一个灰度值,通常范围从黑色0到白色255;相比彩色图像,灰度图数据量较小,但信息描述基本保持一致;常用的灰度化有分量法、最大值法、平均值法和加权平均法;对于产品原始图像灰度化,采用加权平均法,如公式(1)所示:
Gray=0.2989*R+0.5870*G+0.1140*B (1)
式中:Gray为转化后灰度值;R,G,B分别是红色、绿色、蓝色通道的灰度图像值;
当采集到包装件的图像时,它通常是一个3维的RGB彩色图像,由红色、绿色和蓝色三个通道组成,由于彩色图像的数据量较大且算法处理时间较长,为了减少数据量并加快处理速度,对图像进行灰度化处理;灰度化将彩色图像转化为灰度图像,仅保留一个通道的灰度信息,从而将图像的维度从3降低到1;这样一来,处理灰度图像所需的计算量和存储空间都大大减少。
所述的图像二值化具体为:二值图像是一种每个像素只有两个取值的图像,通常为黑色和白色;在处理产品图像时,经过灰度化处理后,可以使用某种阈值方法将像素值转换为二值(黑白)形式;这样的二值图像能更好地突出产品与背景的对比,便于后续的信息提取和分析;常用的图像二值化方法包括最大类间方差法和灰度直方图双峰阈值法;通过选择适当的阈值T,将目标和背景区域分开,将灰度图像转换为二值图像;这样可以更好地进行图像处理和特征提取,使得产品与背景区别更加明显,有利于后续的进一步处理和分析,如公式(2)所示:
式中:T为灰度阈值;x,y为二维矩阵图像像素行列位置;BW(x,y)为二值化后的值(0或1);Gray(x,y)为灰度图像对应坐标(x,y)的灰度值;
对于包装件的灰度化图像,采用灰度直方图双峰阈值法进行二值化处理,它的基本原理是先通过直方图寻找图像的双峰分布,然后选择两个峰之间的波谷对应的灰度级作为阈值进行图像的二值化处理,具体步骤如下:
(1)计算图像的灰度直方图,统计每个灰度级别的像素数量,
(2)对直方图进行平滑处理,常用的方法是采用相邻灰度频数的平均值进行平滑,如公式(3)所示:Gray(i)=Gray(i-1)+Gray(i+1)/2 (3)
式中:Gray(i)为灰度值为i的频数;Gray(i-1)为灰度值为i-1的频数;Gray(i+1)为灰度值为i+1的频数;
(3)在平滑后的直方图上寻找双峰,即找到两个明显的峰值;
(4)选择两个峰之间的波谷所对应的灰度级作为阈值T,将图像进行二值化处理。
所述的二值图像去噪具体步骤为:
1)标记各连通区域:采取8连通算法,通过连通区域分析,将二值图像中的像素按照连通性进行分组,形成不同的连通区域,将目标物体与噪声区域进行区分;通过标记连通区域,得到一些关于图像结构的基本信息,为后续处理提供基础;
2)计算每个连通区域的像素数量或面积,以了解它们的大小;这一步骤得出各个连通区域的重要性和特征;通常情况下,噪声区域的面积较小,而目标物体的面积较大;
3)找到面积最大的连通区域:通过比较各个连通区域的面积,确定哪个连通区域是主要的目标物体,而哪些是噪声,选择面积最大的连通区域可以减少噪声对图像处理的干扰,提高处理结果的准确性,如公式(4)所示:
max_area=max(areas) (4)
其中,max_area表示最大连通区域面积,areas是包含所有连通区域面积的集合;
4)对结果进行孔洞填充:在面积最大的连通区域内部,可能存在一些孔洞或空洞,这些孔洞可能是由于噪声或其他因素导致的,为了消除这些孔洞,使用孔洞填充算法,将这些孔洞填充起来,使连通区域变得完整无缺;这一步进一步消除由于噪声而产生的断裂或空洞,提高图像的连续性和完整性。
边缘检测是一种常用的图像处理技术,用于提取图像中物体或区域之间的边界或轮廓信息;边缘通常表示图像亮度或色彩发生显著变化的位置;在实际应用中,Canny算子是一种常用的边缘检测算法,因其在提取图像边缘时具有较好的性能,同时对噪声和干扰具有一定的抑制作用;所述的边缘检测的步骤具体如下:
A、高斯平滑,首先对输入图像进行高斯平滑处理,以减少噪声的影响;高斯平滑通过卷积输入图像与一个高斯核函数来实现,公式表示如(5)所示:
G(x,y)=(1/2πσ2)*exp(-(x2+y2)/2σ2) (5)
其中,G(x,y)表示高斯核函数在坐标(x,y)处的值,σ表示高斯核函数的标准差;
B、梯度计算,在经过高斯平滑后的图像上计算梯度信息;常用的梯度算子有Sobel算子和Prewitt算子,分别计算图像在水平和垂直方向上的梯度值;水平方向梯度Gx=(I(x+1,y)-I(x-1,y))/2,垂直方向梯度Gy=(I(x,y+1)-I(x,y-1))/2,其中,I(x,y)表示经过高斯平滑后的图像在坐标(x,y)处的灰度值;
C、非极大值抑制,在梯度图像上执行非极大值抑制,以细化边缘;对于每个像素点,比较其梯度方向上的两个相邻像素值,如果当前像素的梯度值最大,则保留,否则抑制;
D、双阈值处理,根据设定的低阈值和高阈值,将梯度图像中的像素分为强边缘、弱边缘和非边缘三类;强边缘像素被确定为最终边缘像素,非边缘像素被排除,而弱边缘像素则需要进一步判断;
E、边缘连接,对于弱边缘像素,如果其与强边缘像素相连,则将其确定为最终边缘像素;这一步骤可以通过像素的连通性或者其他约束条件来实现。
所述的旋转校正具体为:霍夫变换是一种拟合策略,它通过将图像空间中的坐标转换到参数空间,从而实现对直线和曲线的拟合;该变换方法能够有效地提取图像中的直线和曲线特征,对噪声和不完整的边缘也有一定的鲁棒性;直线用极坐标形式,公式如(6)所示:
ρ=r*cosθ+c*sinθ,θ∈(0,π) (6)
式中:r,c分别是像素点行和列位置;θ是直线角度;ρ是从原点到直线的距离;
在霍夫变换中,图像空间中的每个点都可以表示为参数空间中的一条曲线或曲面;通过对图像中的像素进行遍历,计算其在参数空间中所对应的曲线或曲面的投票值,并选取投票值高于阈值的曲线或曲面作为最终的拟合结果;这样能够在参数空间中找到最佳拟合直线或曲线的参数,进而还原到图像空间,得到相应的特征线段或轮廓;最后通过对边缘检测图像进行霍夫变换,计算出最大角度即为倾斜角度,通过旋转变换得到旋转后图像;
所述的缩放校正根据产品外包装的一致性,计算宽度像素范围,通过比例计算统一到一致像素宽度。
样本数据像素行列应该保持一致,训练数据应该尽可能的增加,以便提高训练模型的准确率以及模型的泛化能力;因此,采用以下手段对图像数据集进行数据增强:
a.平移、旋转和镜像操作:对于经过旋转校正和缩放校正后的图像,可以进行平移、旋转和镜像等操作,将待检测物体置于图像中心位置,并扩充图像数据;这样可以模拟不同位置和角度下的物体出现情况,增加模型对不同视角的识别能力;
b.随机裁剪和镜像操作:对于待检测物体的图像,可以进行随机裁剪操作,生成不同大小和位置的图像块,并对裁剪后的图像块进行镜像等操作,进一步扩充图像数据;这样可以模拟物体在不同尺寸和位置上的出现情况,增加模型对多样化目标的识别能力。
所述的视觉注意力训练、所述的交叉验证和所述的完成缺陷的分类是基于VisionTransformer的缺陷识别模型的构建;
Vit_Base_Patch16_224_In21k是一种基于Vision Transformer(ViT)架构的图像分类模型,在训练过程中使用了包含21,000个图像类别的大规模数据集进行预训练;预训练有助于模型学习到更丰富的特征表示,提高了其在各种图像分类任务上的性能;
对于图像数据而言,其数据格式为[H,W,C],即长、宽及通道数,这种三维矩阵的形式非视觉Transformer模块的输入形式,需要使用Liner Projection of FlattenedPatches模块对图片的数据格式进行变换;首先将图片按照给定大小分成若干Patches;以所构建的缺陷识别模型为例,训练数据的图片大小为128×128,故按照分成图片之后的大小为16×16来看,划分后得到(128/16)^2=64个Patches;然后将每一个Patches映射到一维向量中,即[16×16×3]->[768];在具体的代码实现中,直接使用一个卷积核大小为16×16,步长为16,卷积核个数为768的卷积层来实现;通过卷积使[128,128,3]->[8,8,768],之后将前两个维度展平变为[64,768],即为Transformer Encoder所需要的二维矩阵的形式,Transformer Encoder是将Encoder Block重复堆叠12次;在Encoder Block中,包含一个模块为MLP Block;在输入Transformer Encoder之前,还需要分类编码Class token和位置编码Position Embedding;分类编码和位置编码都是可训练的参数,其数据格式也为向量;通过Liner Projection of Flattened Patches和Transformer Encoder后输出的维度是不变的;由于只需要关注分类编码,即确定图片的类别,故只需要提取Class token所对应的结果即可,即[1,768];最终通过MLP Head得到最终的分类结果;
为了适应缺陷分类这一特定的任务,需要对预训练模型进行微调;首先,冻结模型的初始几层,只对最后几层进行训练;以便更好地适应产品外包装数据集;这样做可以很好的保留模型在大规模数据集上学习到的通用特征,通过微调更适用于缺陷检测的任务;
在微调过程中,使用交叉验证来寻找最优的参数组合;交叉验证是一种评估模型性能和选择最佳参数的常用技术;将数据集划分为k折,k通常为5到10的自然数,并在每个折上进行训练和验证,对于每个折,选择其中的一组参数进行训练,在其他折上进行验证;通过多次迭代,可以得到每组参数的平均性能,得到最优的参数组合;
通过交叉验证,比较不同参数组合的性能,并选择在验证集上表现最佳的参数组合作为模型的最终参数;这样可以使模型在各种缺陷分类问题上拥有较强的泛化能力。
采用上述技术方案,本发明的创新核心在于设计一种新的图像识别处理算法,通过图像采集、缺陷分类、图像灰度化处理、图像二值化处理、二值图像去噪、边缘检测、旋转校正以及缩放校正、数据集扩充等步骤获得可供Vision Transformer训练的原始数据集。使用Vision Transformer对原始数据集进行训练,迁移学习交叉验证获得最优的参数组合,使得缺陷检测系统的识别准确率达到最高,从而满足实际检测的需要。
通过灰度化处理,可以更加高效地进行后续的图像处理和分析。灰度图像中的灰度值反映了像素的亮度信息,使得我们能够更集中地关注产品的表面特征、纹理细节或其他重要的视觉特征,非常适合产品的外包装缺陷检测。因此,灰度化处理在工业相机图像处理中具有重要的作用,能够提高图像处理的速度和准确性,进而为产品的外包装质量控制和缺陷检测提供有力支持。
对二值图像的去噪过程,有效地去除了噪声的干扰,突出了产品外包装图像数据的特征。为后续的更精确的分析提供了基础。
通过Canny边缘检测算法能够有效地对图像进行边缘检测和轮廓提取,提取出图像的最优边缘。
在包装生产线上,经过包装机包装后的包装件被传送到光电触发开关的位置。工业相机开始采集外包装的图像信号,并将其传送至图像识别处理以及系统运动控制模块(计算机)进行图像处理。通过对图像进行分析和比对,系统能够准确地检测出外包装的缺陷问题。一旦识别出缺陷,识别结果将被传送至剔除装置(气缸模块)。气缸模块根据接收到的指令,迅速对有缺陷的产品进行剔除,以确保只有合格的产品能够继续流经生产线。而通过传送带,合格的产品将被顺利地传送到后续的工艺环节,以完成整个生产过程。
本发明智能检测技术具有高效、精确和可靠的特点,能够大大提升包装生产线的生产质量和效率。通过上述自动化系统的协作,包装生产线能够实现高效的包装过程,并确保只有符合质量标准的产品被送到下一个工艺环节。这种自动化检测和剔除缺陷的过程大大提高了生产线的效率和质量控制水平,减少了人工错误的可能性,并节省了人力资源和时间成本。相比传统的人工检测方法,该系统能够实现自动化的缺陷检测,减少了人力成本和人为误差的可能性。同时,通过采用视觉Transformer,系统还能够不断学习和优化,提升缺陷识别的准确性和稳定性。
附图说明
图1为本发明在包装生产线上进行检测时的结构示意图;
图2为本发明中图像识别处理算法的流程图;
图3为视觉注意力机制智能识别产品外包装缺陷模型;
图4为编码模块层的结构框图;
图5为多层感知机模块的结构框图。
具体实施方式
下面结合附图介绍本申请实施例中提供的一个具体的一种用于包装生产线上包装件外观缺陷智能识别方法。
如图1所示,本发明的一种用于包装生产线上包装件外观缺陷智能识别方法,包括以下步骤,在包装生产线上,经过包装机3包装后的包装件2通过传送带4被输送到光电触发开关5所检测的位置,光电触发开关5将检测到有包装件2到位需要进行检测的信号传输给图像识别处理以及系统运动控制模块1(计算机),图像识别处理以及系统运动控制模块1向图像采集模块发出启动工作的信号,图像采集模块采集包装件2的外包装图像信号,并将图像信号传送至图像识别处理以及系统运动控制模块1进行图像的识别和处理,图像识别处理以及系统运动控制模块1内置图像识别处理算法,高效地分析采集的图像并比对预设的标准,通过对图像进行分析和比对,准确地检测出外包装的缺陷问题,如破损、污渍或错误的标签,合格的包装件2外观经传送带4继续向前输送,若包装件2的外包装有上述缺陷问题,在包装件2被输送到剔除装置8时,图像识别处理以及系统运动控制模块1命令剔除装置8(采用气缸模块)动作,将有缺陷问题的包装件2从生产线的传送带4上剔除。
图像采集模块包括LED条形背光源7一个、光源模拟控制器一台和CMOS工业相机6;CMOS工业相机6(型号为MV-SUF1205GCM-T,1200万像素,彩色,USB3.0 TYPE B,全局快门),工业相机6的镜头(型号为MV-LD-16-10M-B,1000万像素,焦距为16mm)。光电触发开关5的型号为迈德威视(MindVision),气缸模块设置2个,采用亚德客SC标准气缸。
如图2所示,图像识别处理以及系统运动控制模块1内置的图像识别处理算法包括以下流程:图像预处理→图像灰度化→图像二值化→二值图像去噪→边缘检测→旋转校正与缩放校正→数据增强→视觉注意力训练→交叉验证→完成缺陷分类。
所述的图像预处理具体为:在生产线上对包装件2的外包装进行缺陷检测时,使用COMS工业相机6采集图像,但是由于存在目标产品区域和背景区域导致产品的规格大小以及在图像中的位置不确定,为了对包装件2的外包装的检测区域进行校正与定位裁剪,因此,需要从采集图像中提取出外包装需要检测的部位,并对其进行初步剪裁;
同时由于包装件2在传送带4上输送过程中处于持续运动状态,可能会出现倾斜并导致包装件2与COMS工业相机6之间的物距发生变化;因此,需要对包装件2进行倾斜校正和缩小物距误差的缩放校正;确保在后续的图像处理中,获取到准确且可靠的包装件2的外包装图像数据。
所述的图像灰度化具体为:灰度图是一种二维矩阵图像,在该图像中,每个像素点都对应着一个灰度值,通常范围从黑色0到白色255;相比彩色图像,灰度图数据量较小,但信息描述基本保持一致;常用的灰度化有分量法、最大值法、平均值法和加权平均法;对于产品原始图像灰度化,采用加权平均法,如公式(1)所示:
Gray=0.2989*R+0.5870*G+0.1140*B (1)
式中:Gray为转化后灰度值;R,G,B分别是红色、绿色、蓝色通道的灰度图像值;
当采集到包装件2的图像时,它通常是一个3维的RGB彩色图像,由红色、绿色和蓝色三个通道组成,由于彩色图像的数据量较大且算法处理时间较长,为了减少数据量并加快处理速度,对图像进行灰度化处理;灰度化将彩色图像转化为灰度图像,仅保留一个通道的灰度信息,从而将图像的维度从3降低到1;这样一来,处理灰度图像所需的计算量和存储空间都大大减少。
所述的图像二值化具体为:二值图像是一种每个像素只有两个取值的图像,通常为黑色和白色;在处理产品图像时,经过灰度化处理后,可以使用某种阈值方法将像素值转换为二值(黑白)形式;这样的二值图像能更好地突出产品与背景的对比,便于后续的信息提取和分析;常用的图像二值化方法包括最大类间方差法和灰度直方图双峰阈值法;通过选择适当的阈值T,将目标和背景区域分开,将灰度图像转换为二值图像;这样可以更好地进行图像处理和特征提取,使得产品与背景区别更加明显,有利于后续的进一步处理和分析,如公式(2)所示:
式中:T为灰度阈值;x,y为二维矩阵图像像素行列位置;BW(x,y)为二值化后的值(0或1);Gray(x,y)为灰度图像对应坐标(x,y)的灰度值;
对于包装件2的灰度化图像,采用灰度直方图双峰阈值法进行二值化处理,它的基本原理是先通过直方图寻找图像的双峰分布,然后选择两个峰之间的波谷对应的灰度级作为阈值进行图像的二值化处理,具体步骤如下:
(1)计算图像的灰度直方图,统计每个灰度级别的像素数量,
(2)对直方图进行平滑处理,常用的方法是采用相邻灰度频数的平均值进行平滑,如公式(3)所示:Gray(i)=Gray(i-1)+Gray(i+1)/2 (3)
式中:Gray(i)为灰度值为i的频数;Gray(i-1)为灰度值为i-1的频数;Gray(i+1)为灰度值为i+1的频数;
(3)在平滑后的直方图上寻找双峰,即找到两个明显的峰值;
(4)选择两个峰之间的波谷所对应的灰度级作为阈值T,将图像进行二值化处理。
所述的二值图像去噪具体步骤为:
1)标记各连通区域:采取8连通算法,通过连通区域分析,将二值图像中的像素按照连通性进行分组,形成不同的连通区域,将目标物体与噪声区域进行区分;通过标记连通区域,得到一些关于图像结构的基本信息,为后续处理提供基础;
2)计算每个连通区域的像素数量或面积,以了解它们的大小;这一步骤得出各个连通区域的重要性和特征;通常情况下,噪声区域的面积较小,而目标物体的面积较大;
3)找到面积最大的连通区域:通过比较各个连通区域的面积,确定哪个连通区域是主要的目标物体,而哪些是噪声,选择面积最大的连通区域可以减少噪声对图像处理的干扰,提高处理结果的准确性,如公式(4)所示:
max_area=max(areas) (4)
其中,max_area表示最大连通区域面积,areas是包含所有连通区域面积的集合;
4)对结果进行孔洞填充:在面积最大的连通区域内部,可能存在一些孔洞或空洞,这些孔洞可能是由于噪声或其他因素导致的,为了消除这些孔洞,使用孔洞填充算法,将这些孔洞填充起来,使连通区域变得完整无缺;这一步进一步消除由于噪声而产生的断裂或空洞,提高图像的连续性和完整性。
边缘检测是一种常用的图像处理技术,用于提取图像中物体或区域之间的边界或轮廓信息;边缘通常表示图像亮度或色彩发生显著变化的位置;在实际应用中,Canny算子是一种常用的边缘检测算法,因其在提取图像边缘时具有较好的性能,同时对噪声和干扰具有一定的抑制作用;所述的边缘检测的步骤具体如下:
A、高斯平滑,首先对输入图像进行高斯平滑处理,以减少噪声的影响;高斯平滑通过卷积输入图像与一个高斯核函数来实现,公式表示如(5)所示:
G(x,y)=(1/2πσ2)*exp(-(x2+y2)/2σ2) (5)
其中,G(x,y)表示高斯核函数在坐标(x,y)处的值,σ表示高斯核函数的标准差;
B、梯度计算,在经过高斯平滑后的图像上计算梯度信息;常用的梯度算子有Sobel算子和Prewitt算子,分别计算图像在水平和垂直方向上的梯度值;水平方向梯度Gx=(I(x+1,y)-I(x-1,y))/2,垂直方向梯度Gy=(I(x,y+1)-I(x,y-1))/2,其中,I(x,y)表示经过高斯平滑后的图像在坐标(x,y)处的灰度值;
C、非极大值抑制,在梯度图像上执行非极大值抑制,以细化边缘;对于每个像素点,比较其梯度方向上的两个相邻像素值,如果当前像素的梯度值最大,则保留,否则抑制;
D、双阈值处理,根据设定的低阈值和高阈值,将梯度图像中的像素分为强边缘、弱边缘和非边缘三类;强边缘像素被确定为最终边缘像素,非边缘像素被排除,而弱边缘像素则需要进一步判断;
E、边缘连接,对于弱边缘像素,如果其与强边缘像素相连,则将其确定为最终边缘像素;这一步骤可以通过像素的连通性或者其他约束条件来实现。
所述的旋转校正具体为:霍夫变换是一种拟合策略,它通过将图像空间中的坐标转换到参数空间,从而实现对直线和曲线的拟合;该变换方法能够有效地提取图像中的直线和曲线特征,对噪声和不完整的边缘也有一定的鲁棒性;直线用极坐标形式,公式如(6)所示:
ρ=r*cosθ+c*sinθ,θ∈(0,π) (6)
式中:r,c分别是像素点行和列位置;θ是直线角度;ρ是从原点到直线的距离;
在霍夫变换中,图像空间中的每个点都可以表示为参数空间中的一条曲线或曲面;通过对图像中的像素进行遍历,计算其在参数空间中所对应的曲线或曲面的投票值,并选取投票值高于阈值的曲线或曲面作为最终的拟合结果;这样能够在参数空间中找到最佳拟合直线或曲线的参数,进而还原到图像空间,得到相应的特征线段或轮廓;最后通过对边缘检测图像进行霍夫变换,计算出最大角度即为倾斜角度,通过旋转变换得到旋转后图像;
所述的缩放校正根据产品外包装的一致性,计算宽度像素范围,通过比例计算统一到一致像素宽度。
样本数据像素行列应该保持一致,训练数据应该尽可能的增加,以便提高训练模型的准确率以及模型的泛化能力;因此,采用以下手段对图像数据集进行数据增强:
a.平移、旋转和镜像操作:对于经过旋转校正和缩放校正后的图像,可以进行平移、旋转和镜像等操作,将待检测物体置于图像中心位置,并扩充图像数据;这样可以模拟不同位置和角度下的物体出现情况,增加模型对不同视角的识别能力;
b.随机裁剪和镜像操作:对于待检测物体的图像,可以进行随机裁剪操作,生成不同大小和位置的图像块,并对裁剪后的图像块进行镜像等操作,进一步扩充图像数据;这样可以模拟物体在不同尺寸和位置上的出现情况,增加模型对多样化目标的识别能力。
所述的视觉注意力训练、所述的交叉验证和所述的完成缺陷的分类是基于VisionTransformer的缺陷识别模型的构建;
Vit_Base_Patch16_224_In21k是一种基于Vision Transformer(ViT)架构的图像分类模型,在训练过程中使用了包含21,000个图像类别的大规模数据集进行预训练;预训练有助于模型学习到更丰富的特征表示,提高了其在各种图像分类任务上的性能;
对于图像数据而言,其数据格式为[H,W,C],即长、宽及通道数,这种三维矩阵的形式非视觉Transformer模块的输入形式,需要使用Liner Projection of FlattenedPatches模块对图片的数据格式进行变换;如图3所示,首先将图片按照给定大小分成若干Patches;以所构建的缺陷识别模型为例,训练数据的图片大小为128×128,故按照分成图片之后的大小为16×16来看,划分后得到(128/16)^2=64个Patches;然后将每一个Patches映射到一维向量中,即[16×16×3]->[768];在具体的代码实现中,直接使用一个卷积核大小为16×16,步长为16,卷积核个数为768的卷积层来实现;通过卷积使[128,128,3]->[8,8,768],之后将前两个维度展平变为[64,768],即为Transformer Encoder所需要的二维矩阵的形式,Transformer Encoder是将Encoder Block重复堆叠12次,EncoderBlock的详细架构如图4所示;在Encoder Block中,包含一个模块为MLP Block,其详细架构如图5所示;在输入Transformer Encoder之前,还需要分类编码Class token和位置编码Position Embedding;分类编码和位置编码都是可训练的参数,其数据格式也为向量;通过Liner Projection of Flattened Patches和Transformer Encoder后输出的维度是不变的;由于只需要关注分类编码,即确定图片的类别,故只需要提取Class token所对应的结果即可,即[1,768];最终通过MLP Head得到最终的分类结果;
为了适应缺陷分类这一特定的任务,需要对预训练模型进行微调;首先,冻结模型的初始几层,只对最后几层进行训练;以便更好地适应产品外包装数据集;这样做可以很好的保留模型在大规模数据集上学习到的通用特征,通过微调更适用于缺陷检测的任务;
在微调过程中,使用交叉验证来寻找最优的参数组合;交叉验证是一种评估模型性能和选择最佳参数的常用技术;将数据集划分为k折,k通常为5到10的自然数,并在每个折上进行训练和验证,对于每个折,选择其中的一组参数进行训练,在其他折上进行验证;通过多次迭代,可以得到每组参数的平均性能,得到最优的参数组合;
通过交叉验证,比较不同参数组合的性能,并选择在验证集上表现最佳的参数组合作为模型的最终参数;这样可以使模型在各种缺陷分类问题上拥有较强的泛化能力。
以上实施例说明了本发明的基本原理和特点,但上述仅仅说明了本发明的较优实施例,并不受所述实施例的限制。本领域的普通技术人员在本专利的启发下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可以做出很多形式变形和改进,这些均属于本发明的保护范围之内。因此,本发明专利和保护范围应以所附权利要求书为准。

Claims (10)

1.一种用于包装生产线上包装件外观缺陷智能识别方法,其特征在于:包括以下步骤,在包装生产线上,经过包装机包装后的包装件通过传送带被输送到光电触发开关所检测的位置,光电触发开关将检测到有包装件到位需要进行检测的信号传输给图像识别处理以及系统运动控制模块,图像识别处理以及系统运动控制模块向图像采集模块发出启动工作的信号,图像采集模块采集包装件的外包装图像信号,并将图像信号传送至图像识别处理以及系统运动控制模块进行图像的识别和处理,图像识别处理以及系统运动控制模块内置图像识别处理算法,高效地分析采集的图像并比对预设的标准,通过对图像进行分析和比对,准确地检测出外包装的缺陷问题,如破损、污渍或错误的标签,合格的包装件外观经传送带继续向前输送,若包装件的外包装有上述缺陷问题,在包装件被输送到剔除装置时,图像识别处理以及系统运动控制模块命令剔除装置动作,将有缺陷问题的包装件从生产线的传送带上剔除。
2.根据权利要求1所述的一种用于包装生产线上包装件外观缺陷智能识别方法,其特征在于:图像采集模块包括LED条形背光源一个、光源模拟控制器一台和CMOS工业相机;
图像识别处理以及系统运动控制模块内置的图像识别处理算法包括以下流程:图像预处理→图像灰度化→图像二值化→二值图像去噪→边缘检测→旋转校正与缩放校正→数据增强→视觉注意力训练→交叉验证→完成缺陷分类。
3.根据权利要求2所述的一种用于包装生产线上包装件外观缺陷智能识别方法,其特征在于:所述的图像预处理具体为:在生产线上对包装件的外包装进行缺陷检测时,使用COMS工业相机采集图像,但是由于存在目标产品区域和背景区域导致产品的规格大小以及在图像中的位置不确定,为了对包装件的外包装的检测区域进行校正与定位裁剪,因此,需要从采集图像中提取出外包装需要检测的部位,并对其进行初步剪裁;
同时由于包装件在传送带上输送过程中处于持续运动状态,可能会出现倾斜并导致包装件与COMS工业相机之间的物距发生变化;因此,需要对包装件进行倾斜校正和缩小物距误差的缩放校正;确保在后续的图像处理中,获取到准确且可靠的包装件的外包装图像数据。
4.根据权利要求3所述的一种用于包装生产线上包装件外观缺陷智能识别方法,其特征在于:所述的图像灰度化具体为:灰度图是一种二维矩阵图像,在该图像中,每个像素点都对应着一个灰度值,通常范围从黑色0到白色255;相比彩色图像,灰度图数据量较小,但信息描述基本保持一致;常用的灰度化有分量法、最大值法、平均值法和加权平均法;对于产品原始图像灰度化,采用加权平均法,如公式(1)所示:
Gray=0.2989*R+0.5870*G+0.1140*B (1)
式中:Gray为转化后灰度值;R,G,B分别是红色、绿色、蓝色通道的灰度图像值;
当采集到包装件的图像时,它通常是一个3维的RGB彩色图像,由红色、绿色和蓝色三个通道组成,由于彩色图像的数据量较大且算法处理时间较长,为了减少数据量并加快处理速度,对图像进行灰度化处理;灰度化将彩色图像转化为灰度图像,仅保留一个通道的灰度信息,从而将图像的维度从3降低到1;这样一来,处理灰度图像所需的计算量和存储空间都大大减少。
5.根据权利要求4所述的一种用于包装生产线上包装件外观缺陷智能识别方法,其特征在于:所述的图像二值化具体为:二值图像是一种每个像素只有两个取值的图像,通常为黑色和白色;在处理产品图像时,经过灰度化处理后,可以使用某种阈值方法将像素值转换为二值(黑白)形式;这样的二值图像能更好地突出产品与背景的对比,便于后续的信息提取和分析;常用的图像二值化方法包括最大类间方差法和灰度直方图双峰阈值法;通过选择适当的阈值T,将目标和背景区域分开,将灰度图像转换为二值图像;这样可以更好地进行图像处理和特征提取,使得产品与背景区别更加明显,有利于后续的进一步处理和分析,如公式(2)所示:
式中:T为灰度阈值;x,y为二维矩阵图像像素行列位置;BW(x,y)为二值化后的值(0或1);Gray(x,y)为灰度图像对应坐标(x,y)的灰度值;
对于包装件的灰度化图像,采用灰度直方图双峰阈值法进行二值化处理,它的基本原理是先通过直方图寻找图像的双峰分布,然后选择两个峰之间的波谷对应的灰度级作为阈值进行图像的二值化处理,具体步骤如下:
(1)计算图像的灰度直方图,统计每个灰度级别的像素数量,
(2)对直方图进行平滑处理,常用的方法是采用相邻灰度频数的平均值进行平滑,如公式(3)所示:Gray(i)=Gray(i-1)+Gray(i+1)/2 (3)
式中:Gray(i)为灰度值为i的频数;Gray(i-1)为灰度值为i-1的频数;Gray(i+1)为灰度值为i+1的频数;
(3)在平滑后的直方图上寻找双峰,即找到两个明显的峰值;
(4)选择两个峰之间的波谷所对应的灰度级作为阈值T,将图像进行二值化处理。
6.根据权利要求5所述的一种用于包装生产线上包装件外观缺陷智能识别方法,其特征在于:所述的二值图像去噪具体步骤为:
1)标记各连通区域:采取8连通算法,通过连通区域分析,将二值图像中的像素按照连通性进行分组,形成不同的连通区域,将目标物体与噪声区域进行区分;通过标记连通区域,得到一些关于图像结构的基本信息,为后续处理提供基础;
2)计算每个连通区域的像素数量或面积,以了解它们的大小;这一步骤得出各个连通区域的重要性和特征;通常情况下,噪声区域的面积较小,而目标物体的面积较大;
3)找到面积最大的连通区域:通过比较各个连通区域的面积,确定哪个连通区域是主要的目标物体,而哪些是噪声,选择面积最大的连通区域可以减少噪声对图像处理的干扰,提高处理结果的准确性,如公式(4)所示:
max_area=max(areas) (4)
其中,max_area表示最大连通区域面积,areas是包含所有连通区域面积的集合;
4)对结果进行孔洞填充:在面积最大的连通区域内部,可能存在一些孔洞或空洞,这些孔洞可能是由于噪声或其他因素导致的,为了消除这些孔洞,使用孔洞填充算法,将这些孔洞填充起来,使连通区域变得完整无缺;这一步进一步消除由于噪声而产生的断裂或空洞,提高图像的连续性和完整性。
7.根据权利要求6所述的一种用于包装生产线上包装件外观缺陷智能识别方法,其特征在于:边缘检测是一种常用的图像处理技术,用于提取图像中物体或区域之间的边界或轮廓信息;边缘通常表示图像亮度或色彩发生显著变化的位置;在实际应用中,Canny算子是一种常用的边缘检测算法,因其在提取图像边缘时具有较好的性能,同时对噪声和干扰具有一定的抑制作用;所述的边缘检测的步骤具体如下:
A、高斯平滑,首先对输入图像进行高斯平滑处理,以减少噪声的影响;高斯平滑通过卷积输入图像与一个高斯核函数来实现,公式表示如(5)所示:
G(x,y)=(1/2πσ2)*exp(-(x2+y2)/2σ2) (5)
其中,G(x,y)表示高斯核函数在坐标(x,y)处的值,σ表示高斯核函数的标准差;
B、梯度计算,在经过高斯平滑后的图像上计算梯度信息;常用的梯度算子有Sobel算子和Prewitt算子,分别计算图像在水平和垂直方向上的梯度值;水平方向梯度Gx=(I(x+1,y)-I(x-1,y))/2,垂直方向梯度Gy=(I(x,y+1)-I(x,y-1))/2,其中,I(x,y)表示经过高斯平滑后的图像在坐标(x,y)处的灰度值;
C、非极大值抑制,在梯度图像上执行非极大值抑制,以细化边缘;对于每个像素点,比较其梯度方向上的两个相邻像素值,如果当前像素的梯度值最大,则保留,否则抑制;
D、双阈值处理,根据设定的低阈值和高阈值,将梯度图像中的像素分为强边缘、弱边缘和非边缘三类;强边缘像素被确定为最终边缘像素,非边缘像素被排除,而弱边缘像素则需要进一步判断;
E、边缘连接,对于弱边缘像素,如果其与强边缘像素相连,则将其确定为最终边缘像素;这一步骤可以通过像素的连通性或者其他约束条件来实现。
8.根据权利要求7所述的一种用于包装生产线上包装件外观缺陷智能识别方法,其特征在于:所述的旋转校正具体为:霍夫变换是一种拟合策略,它通过将图像空间中的坐标转换到参数空间,从而实现对直线和曲线的拟合;该变换方法能够有效地提取图像中的直线和曲线特征,对噪声和不完整的边缘也有一定的鲁棒性;直线用极坐标形式,公式如(6)所示:
ρ=r*cosθ+c*sinθ,θ∈(0,π) (6)
式中:r,c分别是像素点行和列位置;θ是直线角度;ρ是从原点到直线的距离;
在霍夫变换中,图像空间中的每个点都可以表示为参数空间中的一条曲线或曲面;通过对图像中的像素进行遍历,计算其在参数空间中所对应的曲线或曲面的投票值,并选取投票值高于阈值的曲线或曲面作为最终的拟合结果;这样能够在参数空间中找到最佳拟合直线或曲线的参数,进而还原到图像空间,得到相应的特征线段或轮廓;最后通过对边缘检测图像进行霍夫变换,计算出最大角度即为倾斜角度,通过旋转变换得到旋转后图像;
所述的缩放校正根据产品外包装的一致性,计算宽度像素范围,通过比例计算统一到一致像素宽度。
9.根据权利要求8所述的一种用于包装生产线上包装件外观缺陷智能识别方法,其特征在于:样本数据像素行列应该保持一致,训练数据应该尽可能的增加,以便提高训练模型的准确率以及模型的泛化能力;因此,采用以下手段对图像数据集进行数据增强:
a.平移、旋转和镜像操作:对于经过旋转校正和缩放校正后的图像,可以进行平移、旋转和镜像等操作,将待检测物体置于图像中心位置,并扩充图像数据;这样可以模拟不同位置和角度下的物体出现情况,增加模型对不同视角的识别能力;
b.随机裁剪和镜像操作:对于待检测物体的图像,可以进行随机裁剪操作,生成不同大小和位置的图像块,并对裁剪后的图像块进行镜像等操作,进一步扩充图像数据;这样可以模拟物体在不同尺寸和位置上的出现情况,增加模型对多样化目标的识别能力。
10.根据权利要求9所述的一种用于包装生产线上包装件外观缺陷智能识别方法,其特征在于:所述的视觉注意力训练、所述的交叉验证和所述的完成缺陷的分类是基于VisionTransformer的缺陷识别模型的构建;
Vit_Base_Patch16_224_In21k是一种基于Vision Transformer(ViT)架构的图像分类模型,在训练过程中使用了包含21,000个图像类别的大规模数据集进行预训练;预训练有助于模型学习到更丰富的特征表示,提高了其在各种图像分类任务上的性能;
对于图像数据而言,其数据格式为[H,W,C]即长、宽及通道数,这种三维矩阵的形式非视觉Transformer模块的输入形式,需要使用Liner Projection of Flattened Patches模块对图片的数据格式进行变换;首先将图片按照给定大小分成若干Patches;以所构建的缺陷识别模型为例,训练数据的图片大小为128×128,故按照分成图片之后的大小为16×16来看,划分后得到(128/16)^2=64个Patches;然后将每一个Patches映射到一维向量中,即[16×16×3]->[768];在具体的代码实现中,直接使用一个卷积核大小为16×16,步长为16,卷积核个数为768的卷积层来实现;通过卷积使[128,128,3]->[8,8,768],之后将前两个维度展平变为[64,768],即为Transformer Encoder所需要的二维矩阵的形式,Transformer Encoder是将Encoder Block重复堆叠12次;在Encoder Block中,包含一个模块为MLP Block;在输入Transformer Encoder之前,还需要分类编码Class token和位置编码Position Embedding;分类编码和位置编码都是可训练的参数,其数据格式也为向量;通过Liner Projection of Flattened Patches和Transformer Encoder后输出的维度是不变的;由于只需要关注分类编码,即确定图片的类别,故只需要提取Class token所对应的结果即可,即[1,768];最终通过MLP Head得到最终的分类结果;
为了适应缺陷分类这一特定的任务,需要对预训练模型进行微调;首先,冻结模型的初始几层,只对最后几层进行训练;以便更好地适应产品外包装数据集;这样做可以很好的保留模型在大规模数据集上学习到的通用特征,通过微调更适用于缺陷检测的任务;
在微调过程中,使用交叉验证来寻找最优的参数组合;交叉验证是一种评估模型性能和选择最佳参数的常用技术;将数据集划分为k折,k通常为5到10的自然数,并在每个折上进行训练和验证,对于每个折,选择其中的一组参数进行训练,在其他折上进行验证;通过多次迭代,可以得到每组参数的平均性能,得到最优的参数组合;
通过交叉验证,比较不同参数组合的性能,并选择在验证集上表现最佳的参数组合作为模型的最终参数;这样可以使模型在各种缺陷分类问题上拥有较强的泛化能力。
CN202311194739.6A 2023-09-15 2023-09-15 一种用于包装生产线上包装件外观缺陷智能识别方法 Pending CN117214178A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311194739.6A CN117214178A (zh) 2023-09-15 2023-09-15 一种用于包装生产线上包装件外观缺陷智能识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311194739.6A CN117214178A (zh) 2023-09-15 2023-09-15 一种用于包装生产线上包装件外观缺陷智能识别方法

Publications (1)

Publication Number Publication Date
CN117214178A true CN117214178A (zh) 2023-12-12

Family

ID=89036655

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311194739.6A Pending CN117214178A (zh) 2023-09-15 2023-09-15 一种用于包装生产线上包装件外观缺陷智能识别方法

Country Status (1)

Country Link
CN (1) CN117214178A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117635606A (zh) * 2024-01-23 2024-03-01 锐卡(常州)科技有限公司 激光切管机卡盘缺陷检测方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117635606A (zh) * 2024-01-23 2024-03-01 锐卡(常州)科技有限公司 激光切管机卡盘缺陷检测方法、装置、设备及存储介质
CN117635606B (zh) * 2024-01-23 2024-04-05 锐卡(常州)科技有限公司 激光切管机卡盘缺陷检测方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN109829914B (zh) 检测产品缺陷的方法和装置
CN107203990B (zh) 一种基于模板匹配与图像质量评估的标贴破损检测方法
CN107230203B (zh) 基于人眼视觉注意机制的铸件缺陷识别方法
CN107966454A (zh) 一种基于fpga的端塞缺陷检测装置及检测方法
CN111507976B (zh) 基于多角度成像的缺陷检测方法及系统
WO2022236876A1 (zh) 一种玻璃纸缺陷识别方法、系统、装置及存储介质
CN106355579A (zh) 烟条表面褶皱的缺陷检测方法
CN112085024A (zh) 一种罐表面字符识别方法
CN112348787A (zh) 物体缺陷检测模型的训练方法、物体缺陷检测方法及装置
CN117214178A (zh) 一种用于包装生产线上包装件外观缺陷智能识别方法
CN111539927B (zh) 汽车塑料组合件紧固卡扣缺装检测装置的检测方法
CN110763700A (zh) 一种半导体元器件缺陷检测方法和设备
CN115752969A (zh) 一种铝箔封口密封性检测方法及系统和设备
US11348349B2 (en) Training data increment method, electronic apparatus and computer-readable medium
CN113996500A (zh) 一种基于视觉点胶机器人的点胶智能识别系统
CN115830004A (zh) 表面缺陷检测方法、装置、计算机设备和存储介质
CN112200790A (zh) 布料缺陷检测方法、设备和介质
CN110288040B (zh) 一种基于拓扑验证的图像相似评判方法及设备
CN113516619B (zh) 一种基于图像处理技术的产品表面瑕疵识别方法
CN109596620A (zh) 基于机器视觉的产品表面形状缺陷检测方法和系统
CN114494169A (zh) 基于机器视觉的工业柔性物体检测方法
CN114266751A (zh) 基于ai技术的产品包装袋打码缺陷检测方法及系统
KR20220101373A (ko) 영상 기반 pcb 결함 검출 장치 및 방법
CN112730427B (zh) 一种基于机器视觉的产品表面缺陷检测方法及系统
CN114972798B (zh) 一种基于特征纹理增强的目标检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination