CN110232675B - 一种工业环境下的纹理表面缺陷检测与分割装置及方法 - Google Patents
一种工业环境下的纹理表面缺陷检测与分割装置及方法 Download PDFInfo
- Publication number
- CN110232675B CN110232675B CN201910241008.XA CN201910241008A CN110232675B CN 110232675 B CN110232675 B CN 110232675B CN 201910241008 A CN201910241008 A CN 201910241008A CN 110232675 B CN110232675 B CN 110232675B
- Authority
- CN
- China
- Prior art keywords
- defect
- module
- segmentation
- detection
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
- G06T7/0008—Industrial image inspection checking presence/absence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/40—Analysis of texture
- G06T7/41—Analysis of texture based on statistical description of texture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20092—Interactive image processing based on input by user
- G06T2207/20104—Interactive definition of region of interest [ROI]
Abstract
本发明涉及一种工业环境下的纹理表面缺陷检测与分割装置及方法,属于工业纹理表面缺陷检测与分割技术领域。本发明包括输入模块I、特征提取模块II、缺陷区域提取模块III、缺陷区域对齐模块IV、检测模块V、分割模块VI;所述输入模块I输出至特征提取模块II,特征提取模块II输出至缺陷区域提取模块III和缺陷区域对齐模块IV,缺陷区域提取模块III输出至缺陷区域对齐模块IV,缺陷区域对齐模块IV输出至检测模块V和分割模块VI;本发明能够自动获取多类缺陷具体类别、缺陷精确位置坐标和缺陷空间分布信息,对缺陷多尺度有良好的鲁棒性。对纹理表面缺陷有着广泛的适用性和较高的检测精度。
Description
技术领域
本发明涉及一种工业环境下的纹理表面缺陷检测与分割装置及方法,属于工业纹理表面缺陷检测与分割技术领域。
背景技术
在工业产品加工过程中,由于原材料、轧制设备和工艺等原因,使得其表面不可避免会出现不同类型的缺陷,常见的缺陷包括划痕,气孔和夹杂物等,这些缺陷不仅影响产品的外观,还会降低产品的耐腐蚀性、耐磨性和疲劳强度等性能,给企业造成巨大的经济损失。如何在生产过程中自动检测与分割表面缺陷以控制和提高产品质量,一直是企业高度关注的问题。
传统检测方法采用形态学、局部环形对比、显着图,区域和大津等进行缺陷定位;通过小波滤波器、局部二值模式,散射卷积网络等提取缺陷特征;通过贝叶斯网络、支持向量机、杂交染色体遗传算法等进行分类。传统分割方法大多基于统计特征、数学形态学、模糊集合、神经网络、多尺度理论和遗传算法等。这些基于人工设计的特征或浅层学习的特征对于缺陷多样化和噪声没有良好的鲁棒性,且要求设计者具有丰富的先验知识,只适用于特定的缺陷检测和分割,很难适应缺陷面积大小不一、形状种类多样化、背景区域复杂的缺陷自动检测与分割,自适应性及泛化性较差,存在应用的局限性。
此外,一些研究人员仅关注单一类型的表面缺陷,如残留氧化皮,周期性缺陷,微缺陷和裂纹缺陷等。多类缺陷检测与分割仍然是一个主要挑战,因此,有必要提供一种通用的、可重用的缺陷检测与分割方法。
目前,深度学习技术在视觉领域取得了巨大成功,并得益于GPU硬件加速和大数据技术,其已从学术界走向工程界,大量应用在图像分类、物体检测、图像分割、图像标注等实际工程领域。与传统的缺陷检测与分割方法不同,特征提取器和分类器可以从输入缺陷图像自动端到端地进行训练,以构建更加智能的检测与分割系统,可以弥补传统手动和浅层学习方法的缺点。除此之外,CNN的高度非线性映射能力使其非常有效解决表面缺陷检测与分割的实际问题,能自适应提取不同层级的特征,有效提高检测精度及泛化性。
发明内容
本发明提供了一种工业环境下的纹理表面缺陷检测与分割装置及方法,以用于解决传统方法需要依赖特征提取技术、自适应性和泛化性差等问题。使用基于掩模区域的卷积神经网络模型同时对输入的多类缺陷图像执行缺陷检测和分割任务。
本发明的技术方案是:一种工业环境下的纹理表面缺陷检测与分割装置,包括输入模块I、特征提取模块II、缺陷区域提取模块III、缺陷区域对齐模块IV、检测模块V、分割模块VI;
所述输入模块I输出至特征提取模块II,特征提取模块II输出至缺陷区域提取模块III和缺陷区域对齐模块IV,缺陷区域提取模块III输出至缺陷区域对齐模块IV,缺陷区域对齐模块IV输出至检测模块V和分割模块VI。
进一步地,所述特征提取模块II用于提取缺陷图像的多尺度特征;
所述缺陷区域提取模块III为候选区域提取网络RPN,用于对提取的缺陷图像的多尺度特征进行预测输出质量高的预测缺陷区域;
所述缺陷区域对齐模块IV为感兴趣区域对齐层RoIAlign,用于根据提取的缺陷图像的多尺度特征使生成的预测缺陷区域映射产生固定大小的特征图;
所述检测模块V为快速的基于区域的卷积神经网络Fast R-CNN,用于输出预测缺陷区域映射产生的固定大小的特征图的具体类别和位置坐标;
所述分割模块VI为掩码区域提取网络Mask,输出对应预测缺陷区域映射产生的固定大小的特征图的空间分布信息。
一种工业环境下的纹理表面缺陷检测与分割方法,包括如下步骤:
步骤1、建立用于微调训练的工业纹理表面缺陷检测与分割图像数据集作为输入模块I,其中包括训练集和测试集;
步骤2、搭建特征提取模块II、缺陷区域提取模块III、缺陷区域对齐模块IV、检测模块V和分割模块VI;此些模块共同组成缺陷检测与分割网络;
步骤3、通过特征提取模块II对输入模块I中的图像数据集进行缺陷图像的多尺度特征的提取;
步骤4、通过缺陷区域提取模块III对提取的缺陷图像的多尺度特征进行预测输出质量高的预测缺陷区域;
步骤5、缺陷区域对齐模块IV根据提取的缺陷图像的多尺度特征使生成的预测缺陷区域映射产生固定大小的特征图;
步骤6、使用大型图像数据集COCO对缺陷检测与分割网络进行预训练;
步骤7、设置缺陷检测与分割网络的超参数,包括卷积层数量、池化层数量、全连接层数量、卷积核尺寸、卷积核数量、卷积核滑动步长值、池化策略和激活函数类型;
步骤8、构建整个缺陷检测与分割网络的多任务损失函数;
步骤9、设置缺陷检测与分割网络的训练超参数,包括优化方法、迭代学习率、权重初始化策略、权重衰减参数和动量系数;
步骤10、采用迁移学习方法对整个缺陷检测与分割网络进行训练,减少训练数据需求并提高训练模型的预测准确性;
步骤11、使用训练完成的缺陷检测与分割网络来进行缺陷检测和分割的任务,得出预测缺陷区域映射产生的固定大小的特征图的轮廓、具体类别、位置坐标和空间分布信息。
进一步地,步骤1所述的工业纹理表面缺陷检测与分割图像数据集的训练集为人工采用多边形对缺陷图像中的缺陷区域进行标注,每个标注指示对应缺陷的真实类别、位置坐标和空间分布。
进一步地,步骤3所述特征提取模块II包括残差网络Resnet-101或Resnet-50 和改进后的特征金字塔网络FPN,Resnet-101或Resnet-50包括第一层池化层输出C1,四个残差模块输出{C2,C3,C4,C5},不同之处在于,Resnet-101残差网络的层数与 Resnet-50的层数不同,Resnet-101包括101层,Resnet-50包括50层;FPN用于融合Resnet-101或Resnet-50的四个残差模块输出{C2,C3,C4,C5},并输出最终的多尺度特征图。
进一步地,步骤8所述损失函数为一个多任务损失函数,包括缺陷分类任务损失函数、缺陷定位损失函数和缺陷分割损失函数;
所述缺陷分类任务损失函数如下式所示:
Lcls(pi,pi *)=-log[pipi *+(1-pi)(1-pi *)]
其中,Lcls为缺陷分类任务损失函数,将候选缺陷区域anchor预测为缺陷和背景的对数损失;i表示缺陷特征图上anchor的下标;pi表示第i个anchor被预测为正样本即缺陷的概率;当anchor为正样本时,pi *=1,当anchor为负样本即背景时, pi *=0;
所述缺陷定位任务损失函数如下式所示:
其中,Lloc为缺陷定位任务损失函数,通过比较预测缺陷区域predicted-box边界框和真实缺陷区域ground-truth边界框的坐标差值得到;tl={tx,ty,tw,th}为第l个predicted-box边界框坐标对应的向量,(tx,ty)为predicted-box边界框的中心点坐标,tw和 th为predicted-box边界框的宽和高;tl *={tx *,ty *,tw *,th *}为第l个ground-truth边界框坐标对应的向量,(tx *,ty *)为ground-truth边界框的中心点坐标,tw *和th *为ground-truth边界框的宽和高;R(tl-tl *)是函数,即
向量t和t*中每个值的计算方法如下式所示:
其中,(x,y)为predicted-box边界框的中心点坐标,w和h为predicted-box边界框的高和宽;(xa,ya)为anchor边界框的中心点坐标,wa和ha为anchor边界框的高和宽;(x*,y*)为ground-truth边界框的中心点坐标,w*和h*为ground-truth边界框的高和宽;
所述缺陷分割任务损失函数如下式所示:
Lmask=Sigmoid([Km2]n)
其中,Lmask为缺陷分割任务损失函数,定义为平均二进制交叉熵损失,通过逐像素的Sigmoid计算得到;对于每个predicted-box,分割模块VI的输出维度为Km2,表示生成K个分辨率为m*m的二进制掩码,K表示缺陷种类,n表示当前predicted-box 的类别;
进而得到缺陷检测与分割网络的多任务损失函数,如下式所示:
其中,分类任务损失Lcls和定位任务损失Lloc由Ncls和Nreg归一化,Ncls表示从一张缺陷图像中任意提取的anchor数量,正负样本各占128个,Nreg表示anchor的数量,λ表示平衡Lcls和Lloc的权重参数,pi *为定位任务损失激活参数,pi *可以取0或1;当输入anchor是正样本时,pi *取1;当输入anchor是负样本时,pi *取0;所述正样本通过IoU策略进行筛选,IoU>0.5的anchor视为正样本,0<IoU>0.3的anchor视为负样本,剩余的忽略不计。
进一步地,所述步骤9中:
优化方法为:设置输入缺陷图像大小为512*512;使用批量梯度下降法进行训练,每批次选取一张缺陷图像,训练缺陷区域提取模块III的批次为256个缺陷区域,训练检测模块V和分割模块VI的批次为32个缺陷区域;缺陷检测与分割网络的权重衰减参数设置为0.0001,动量系数设置为0.9;
微调缺陷检测与分割网络时,训练前20k的迭代学习率设置为0.001,后20k的迭代学习率设置为0.0001;权重初始化策略为:使用高斯方法对缺陷检测与分割网络独有层的参数进行初始化。
本发明的有益效果是:
1、提取的融合特征具有缺陷丰富的位置信息和空间分布信息,能有效解决多尺度检测和分割的问题;
2、在有效检测多类缺陷目标的同时完成高质量的缺陷语义分割,提供了一种更高效和通用的缺陷检测与分割方法;
3、特征提取网络与检测网络和分割网络共享卷积层,减少了训练和测试过程中的计算量,具有良好的灵活性和鲁棒性。
附图说明
图1为本发明提供的缺陷检测与分割网络模型结构示意图;
图2为本发明提供的缺陷检测与分割流程图;
图3为本发明实施例提供的缺陷检测与分割结果示意图,其中(a)为class1缺陷,(b)为class2缺陷,(c)为class3缺陷,(d)为class4缺陷,(e)为class5缺陷, (f)为class6缺陷,(g)为class7缺陷,(h)为class8缺陷,(i)为class9缺陷,(j) 为class10缺陷;
图4为本发明实施例提供的缺陷检测与分割实验结果图。
图5为本发明改进后的共享特征图。
具体实施方式
实施例1:如图1-5所示,一种工业环境下的纹理表面缺陷检测与分割装置,包括输入模块I、特征提取模块II、缺陷区域提取模块III、缺陷区域对齐模块IV、检测模块V、分割模块VI;
所述输入模块I输出至特征提取模块II,特征提取模块II输出至缺陷区域提取模块III和缺陷区域对齐模块IV,缺陷区域提取模块III输出至缺陷区域对齐模块IV,缺陷区域对齐模块IV输出至检测模块V和分割模块VI。
进一步地,所述特征提取模块II用于提取缺陷图像的多尺度特征;
所述缺陷区域提取模块III为候选区域提取网络RPN,用于对提取的缺陷图像的多尺度特征进行预测输出质量高的预测缺陷区域;
所述缺陷区域对齐模块IV为感兴趣区域对齐层RoIAlign,用于根据提取的缺陷图像的多尺度特征使生成的预测缺陷区域映射产生固定大小的特征图;
所述检测模块V为快速的基于区域的卷积神经网络Fast R-CNN,用于输出预测缺陷区域映射产生的固定大小的特征图的具体类别和位置坐标;
所述分割模块VI为掩码区域提取网络Mask,输出对应预测缺陷区域映射产生的固定大小的特征图的空间分布信息。
一种工业环境下的纹理表面缺陷检测与分割方法,包括如下步骤:
步骤1、建立用于微调训练的工业纹理表面缺陷检测与分割图像数据集作为输入模块I,其中包括训练集和测试集;
步骤2、搭建特征提取模块II、缺陷区域提取模块III、缺陷区域对齐模块IV、检测模块V和分割模块VI;此些模块共同组成缺陷检测与分割网络;
步骤3、通过特征提取模块II对输入模块I中的图像数据集进行缺陷图像的多尺度特征的提取;
步骤4、通过缺陷区域提取模块III对提取的缺陷图像的多尺度特征进行预测输出质量高的预测缺陷区域;
步骤5、缺陷区域对齐模块IV根据提取的缺陷图像的多尺度特征使生成的预测缺陷区域映射产生固定大小的特征图;
步骤6、使用大型图像数据集COCO对缺陷检测与分割网络进行预训练;
步骤7、设置缺陷检测与分割网络的超参数,包括卷积层数量、池化层数量、全连接层数量、卷积核尺寸、卷积核数量、卷积核滑动步长值、池化策略和激活函数类型;
步骤8、构建整个缺陷检测与分割网络的多任务损失函数;
步骤9、设置缺陷检测与分割网络的训练超参数,包括优化方法、迭代学习率、权重初始化策略、权重衰减参数和动量系数;
进一步地,所述步骤9中:
优化方法为:设置输入缺陷图像大小为512*512;使用批量梯度下降法进行训练,每批次选取一张缺陷图像,训练缺陷区域提取模块III的批次为256个缺陷区域,训练检测模块V和分割模块VI的批次为32个缺陷区域;缺陷检测与分割网络的权重衰减参数设置为0.0001,动量系数设置为0.9;
微调缺陷检测与分割网络时,训练前20k的迭代学习率设置为0.001,后20k的迭代学习率设置为0.0001;权重初始化策略为:使用高斯方法对缺陷检测与分割网络独有层的参数进行初始化。
步骤10、采用迁移学习方法对整个缺陷检测与分割网络进行训练,减少训练数据需求并提高训练模型的预测准确性;
步骤11、使用训练完成的缺陷检测与分割网络来进行缺陷检测和分割的任务,得出预测缺陷区域映射产生的固定大小的特征图的轮廓、具体类别、位置坐标和空间分布信息。
进一步地,步骤1所述的工业纹理表面缺陷检测与分割图像数据集的训练集为人工采用多边形对缺陷图像中的缺陷区域进行标注,每个标注指示对应缺陷的真实类别、位置坐标和空间分布。
进一步地,步骤3所述特征提取模块II包括残差网络Resnet-101或Resnet-50 和改进后的特征金字塔网络FPN,Resnet-101或Resnet-50包括第一层池化层输出C1,四个残差模块输出{C2,C3,C4,C5},不同之处在于,两个残差网络不同的地方是残差模块中的卷积层数和卷积核数不同,其中,Resnet-101残差网络的层数与Resnet-50 的层数不同,Resnet-101包括101层,Resnet-50包括50层;FPN用于融合Resnet-101 或Resnet-50的四个残差模块输出{C2,C3,C4,C5},并输出最终的多尺度特征图。经过大型图像数据集COCO的学习使得网络获得强大的表征能力,能够充分发挥神经网络的迁移学习能力。
选取的残差网络设置如表1所示:
表1残差网络设置
改进后的FPN如下图所示,采用自下而上的连接方法对特征金字塔网络提取的特征图进行连接,并融合特征图形成最终的共享特征图,充分利用高层特征,达到更好的检测效果。其中,C2-C5、P2-P5、D2-D5分别为共享卷积层、FPN及改进后的FPN生成的特征图。具体方法为:
步骤3.1、对FPN生成的不同尺寸特征图P2-P5,增加一条自下而上的路径D2-D5。
步骤3.2、D2与P2尺寸相同,P2经过1x1卷积核得到D2,D2经过步长为2 的3x3卷积核,得到与P3相同尺寸的特征图并与P3经过进行1x1卷积核得到的特征图进行相加,得到D3,以此类推得到D4和D5。上述卷积操作的卷积核数量均为 256。
步骤3.3、基于步骤3.2得到的D2、D3、D4和D5,均通过256个3x3卷积核并融合得到改进后的共享特征图;
进一步地,步骤8所述损失函数为一个多任务损失函数,包括缺陷分类任务损失函数、缺陷定位损失函数和缺陷分割损失函数;
所述缺陷分类任务损失函数如下式所示:
Lcls(pi,pi *)=-log[pipi *+(1-pi)(1-pi *)]
其中,Lcls为缺陷分类任务损失函数,将候选缺陷区域anchor预测为缺陷和背景的对数损失;i表示缺陷特征图上anchor的下标;pi表示第i个anchor被预测为正样本即缺陷的概率;当anchor为正样本时,pi *=1,当anchor为负样本即背景时, pi *=0;
所述缺陷定位任务损失函数如下式所示:
其中,Lloc为缺陷定位任务损失函数,通过比较预测缺陷区域predicted-box边界框和真实缺陷区域ground-truth边界框的坐标差值得到;tl={tx,ty,tw,th}为第l个predicted-box边界框坐标对应的向量,(tx,ty)为predicted-box边界框的中心点坐标,tw和 th为predicted-box边界框的宽和高;tl *={tx *,ty *,tw *,th *}为第l个ground-truth边界框坐标对应的向量,(tx *,ty *)为ground-truth边界框的中心点坐标,tw *和th *为ground-truth边界框的宽和高;R(tl-tl *)是函数,即
向量t和t*中每个值的计算方法如下式所示:
其中,(x,y)为predicted-box边界框的中心点坐标,w和h为predicted-box边界框的高和宽;(xa,ya)为anchor边界框的中心点坐标,wa和ha为anchor边界框的高和宽;(x*,y*)为ground-truth边界框的中心点坐标,w*和H*为ground-truth边界框的高和宽;
所述缺陷分割任务损失函数如下式所示:
Lmask=Sigmoid([Km2]n)
其中,Lmask为缺陷分割任务损失函数,定义为平均二进制交叉熵损失,通过逐像素的Sigmoid计算得到;对于每个predicted-box,分割模块VI的输出维度为Km2,表示生成K个分辨率为m*m的二进制掩码,K表示缺陷种类,n表示当前predicted-box 的类别;
进而得到缺陷检测与分割网络的多任务损失函数,如下式所示:
其中,分类任务损失Lcls和定位任务损失Lloc由Ncls和Nreg归一化,Ncls表示从一张缺陷图像中任意提取的anchor数量,正负样本各占128个,Nreg表示anchor的数量,λ表示平衡Lcls和Lloc的权重参数,pi *为定位任务损失激活参数,pi *可以取0或1;当输入anchor是正样本时,pi *取1;当输入anchor是负样本时,pi *取0;所述正样本通过IoU策略进行筛选,IoU>0.5的anchor视为正样本,0<IoU>0.3的anchor视为负样本,剩余的忽略不计。
使用专业的纹理表面缺陷图像数据集DAGM进行整个网络的微调,利用本发明所述方法将缺陷类别分为class1-class10共10个。
通过检测模块V得到包围该缺陷的矩形框,可以叫缺陷的轮廓(对应图像上的虚线矩形框,即包含矩形框左上脚和右下脚两个像素点的坐标)、缺陷的具体类别和属于该类别的概率值(对应图像上的白色文本描述信息);通过分割模块VI得到缺陷更详细的分布区域信息(对应图像上虚线矩形框中的不规则实线区域)。
为了验证所提方法的有效性,与Resnet-50和Resnet-101方法进行了对比实验。缺陷检测与分割评价结果如图4所示,使用平均准确率均值(mAP)来评价缺陷检测与分割结果,其能够有效衡量检测与分割网络的准确性和召回率,考虑了不同IoU 阈值下三种方法的mAP。实验结果证明,增加自下而上连接路径后,所提方法在一定IoU阈值范围内提高了mAP。本发明提供一种基于深度学习的工业纹理表面缺陷检测与分割方法,能够自动获取多类缺陷具体类别、缺陷精确位置坐标和缺陷空间分布信息,对缺陷多尺度有良好的鲁棒性。对纹理表面缺陷有着广泛的适用性和较高的检测精度。
上面结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。
Claims (5)
1.一种工业环境下的纹理表面缺陷检测与分割装置,其特征在于:包括输入模块I、特征提取模块II、缺陷区域提取模块III、缺陷区域对齐模块IV、检测模块V、分割模块VI;
所述输入模块I输出至特征提取模块II,特征提取模块II输出至缺陷区域提取模块III和缺陷区域对齐模块IV,缺陷区域提取模块III输出至缺陷区域对齐模块IV,缺陷区域对齐模块IV输出至检测模块V和分割模块VI;
所述特征提取模块II用于提取缺陷图像的多尺度特征;
所述缺陷区域提取模块III为候选区域提取网络RPN,用于对提取的缺陷图像的多尺度特征进行预测输出质量高的预测缺陷区域;
所述缺陷区域对齐模块IV为感兴趣区域对齐层RoIAlign,用于根据提取的缺陷图像的多尺度特征使生成的预测缺陷区域映射产生固定大小的特征图;
所述检测模块V为快速的基于区域的卷积神经网络Fast R-CNN,用于输出预测缺陷区域映射产生的固定大小的特征图的具体类别和位置坐标;
所述分割模块VI为掩码区域提取网络Mask,输出对应预测缺陷区域映射产生的固定大小的特征图的空间分布信息;
所述特征提取模块II包括残差网络Resnet-101或Resnet-50和改进后的特征金字塔网络FPN,Resnet-101或Resnet-50包括第一层池化层输出C1,四个残差模块输出{C2,C3,C4,C5},不同之处在于,Resnet-101残差网络的层数与Resnet-50的层数不同,Resnet-101包括101层,Resnet-50包括50层;FPN用于融合Resnet-101或Resnet-50的四个残差模块输出{C2,C3,C4,C5},并输出最终的多尺度特征图;
改进后的FPN,采用自下而上的连接方法对特征金字塔网络提取的特征图进行连接,并融合特征图形成最终的共享特征图,充分利用高层特征,达到更好的检测效果;其中,C2-C5、P2-P5、D2-D5分别为共享卷积层、FPN及改进后的FPN生成的特征图;具体方法为:
步骤3.1、对FPN生成的不同尺寸特征图P2-P5,增加一条自下而上的路径D2-D5;
步骤3.2、D2与P2尺寸相同,P2经过1x1卷积核得到D2,D2经过步长为2的3x3卷积核,得到与P3相同尺寸的特征图并与P3经过进行1x1卷积核得到的特征图进行相加,得到D3,以此类推得到D4和D5;上述卷积操作的卷积核数量均为256;
步骤3.3、基于步骤3.2得到的D2、D3、D4和D5,均通过256个3x3卷积核并融合得到改进后的共享特征图。
2.根据权利要求1所述的装置进行工业环境下的纹理表面缺陷检测与分割的方法,其特征在于:包括如下步骤:
步骤1、建立用于微调训练的工业纹理表面缺陷检测与分割图像数据集作为输入模块I,其中包括训练集和测试集;
步骤2、搭建特征提取模块II、缺陷区域提取模块III、缺陷区域对齐模块IV、检测模块V和分割模块VI;此些模块共同组成缺陷检测与分割网络;
步骤3、通过特征提取模块II对输入模块I中的图像数据集进行缺陷图像的多尺度特征的提取;
步骤4、通过缺陷区域提取模块III对提取的缺陷图像的多尺度特征进行预测输出质量高的预测缺陷区域;
步骤5、缺陷区域对齐模块IV根据提取的缺陷图像的多尺度特征使生成的预测缺陷区域映射产生固定大小的特征图;
步骤6、使用大型图像数据集COCO对缺陷检测与分割网络进行预训练;
步骤7、设置缺陷检测与分割网络的超参数,包括卷积层数量、池化层数量、全连接层数量、卷积核尺寸、卷积核数量、卷积核滑动步长值、池化策略和激活函数类型;
步骤8、构建整个缺陷检测与分割网络的多任务损失函数;
步骤9、设置缺陷检测与分割网络的训练超参数,包括优化方法、迭代学习率、权重初始化策略、权重衰减参数和动量系数;
步骤10、采用迁移学习方法对整个缺陷检测与分割网络进行训练,减少训练数据需求并提高训练模型的预测准确性;
步骤11、使用训练完成的缺陷检测与分割网络来进行缺陷检测和分割的任务,得出预测缺陷区域映射产生的固定大小的特征图的轮廓、具体类别、位置坐标和空间分布信息。
3.根据权利要求2所述的工业环境下的纹理表面缺陷检测与分割方法,其特征在于:步骤1所述的工业纹理表面缺陷检测与分割图像数据集的训练集为人工采用多边形对缺陷图像中的缺陷区域进行标注,每个标注指示对应缺陷的真实类别、位置坐标和空间分布。
4.根据权利要求2所述的工业环境下的纹理表面缺陷检测与分割方法,其特征在于:步骤8所述损失函数为一个多任务损失函数,包括缺陷分类任务损失函数、缺陷定位损失函数和缺陷分割损失函数;
所述缺陷分类任务损失函数如下式所示:
Lcls(pi,pi *)=-log[pipi *+(1-pi)(1-pi *)]
其中,Lcls为缺陷分类任务损失函数,将候选缺陷区域anchor预测为缺陷和背景的对数损失;i表示缺陷特征图上anchor的下标;pi表示第i个anchor被预测为正样本即缺陷的概率;当anchor为正样本时,pi *=1,当anchor为负样本即背景时,pi *=0;
所述缺陷定位任务损失函数如下式所示:
其中,Lloc为缺陷定位任务损失函数,通过比较预测缺陷区域predicted-box边界框和真实缺陷区域ground-truth边界框的坐标差值得到;tl={tx,ty,tw,th}为第l个predicted-box边界框坐标对应的向量,(tx,ty)为predicted-box边界框的中心点坐标,tw和th为predicted-box边界框的宽和高;tl *={tx *,ty *,tw *,th *}为第l个ground-truth边界框坐标对应的向量,(tx *,ty *)为ground-truth边界框的中心点坐标,tw *和th *为ground-truth边界框的宽和高;R(tl-tl *)是函数,即
向量t和t*中每个值的计算方法如下式所示:
其中,(x,y)为predicted-box边界框的中心点坐标,w和h为predicted-box边界框的高和宽;(xa,ya)为anchor边界框的中心点坐标,wa和ha为anchor边界框的高和宽;(x*,y*)为ground-truth边界框的中心点坐标,w*和h*为ground-truth边界框的高和宽;
所述缺陷分割任务损失函数如下式所示:
Lmask=Sigmoid([Km2]n)
其中,Lmask为缺陷分割任务损失函数,定义为平均二进制交叉熵损失,通过逐像素的Sigmoid计算得到;对于每个predicted-box,分割模块VI的输出维度为Km2,表示生成K个分辨率为m*m的二进制掩码,K表示缺陷种类,n表示当前predicted-box的类别;
进而得到缺陷检测与分割网络的多任务损失函数,如下式所示:
其中,分类任务损失Lcls和定位任务损失Lloc由Ncls和Nloc归一化,Ncls表示从一张缺陷图像中任意提取的anchor数量,正负样本各占128个,Nloc表示anchor的数量,λ表示平衡Lcls和Lloc的权重参数,pi *为定位任务损失激活参数,pi *取0或1;当输入anchor是正样本时,pi *取1;当输入anchor是负样本时,pi *取0;所述正样本通过IoU策略进行筛选,IoU>0.5的anchor视为正样本,0<IoU<0.3的anchor视为负样本,剩余的忽略不计。
5.根据权利要求2所述的工业环境下的纹理表面缺陷检测与分割方法,其特征在于:所述步骤9中:
优化方法为:设置输入缺陷图像大小为512*512;使用批量梯度下降法进行训练,每批次选取一张缺陷图像,训练缺陷区域提取模块III的批次为256个缺陷区域,训练检测模块V和分割模块VI的批次为32个缺陷区域;缺陷检测与分割网络的权重衰减参数设置为0.0001,动量系数设置为0.9;
微调缺陷检测与分割网络时,训练前20k的迭代学习率设置为0.001,后20k的迭代学习率设置为0.0001;权重初始化策略为:使用高斯方法对缺陷检测与分割网络独有层的参数进行初始化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910241008.XA CN110232675B (zh) | 2019-03-28 | 2019-03-28 | 一种工业环境下的纹理表面缺陷检测与分割装置及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910241008.XA CN110232675B (zh) | 2019-03-28 | 2019-03-28 | 一种工业环境下的纹理表面缺陷检测与分割装置及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110232675A CN110232675A (zh) | 2019-09-13 |
CN110232675B true CN110232675B (zh) | 2022-11-11 |
Family
ID=67860650
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910241008.XA Active CN110232675B (zh) | 2019-03-28 | 2019-03-28 | 一种工业环境下的纹理表面缺陷检测与分割装置及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110232675B (zh) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111160085A (zh) * | 2019-11-19 | 2020-05-15 | 天津中科智能识别产业技术研究院有限公司 | 一种人体图像关键点姿态估计方法 |
CN111027547B (zh) * | 2019-12-06 | 2022-08-09 | 南京大学 | 一种针对二维图像中的多尺度多形态目标的自动检测方法 |
CN111080622B (zh) * | 2019-12-13 | 2023-11-07 | 熵智科技(深圳)有限公司 | 神经网络训练方法、工件表面缺陷分类与检测方法及装置 |
CN111179229B (zh) * | 2019-12-17 | 2023-10-20 | 中信重工机械股份有限公司 | 一种基于深度学习的工业ct缺陷检测方法 |
CN111127416A (zh) * | 2019-12-19 | 2020-05-08 | 武汉珈鹰智能科技有限公司 | 基于计算机视觉的混凝土结构表面缺陷自动检测方法 |
CN111179253B (zh) | 2019-12-30 | 2023-11-24 | 歌尔股份有限公司 | 一种产品缺陷检测方法、装置与系统 |
CN111199543A (zh) * | 2020-01-07 | 2020-05-26 | 南京航空航天大学 | 一种基于卷积神经网络的冰柜表面缺陷检测 |
CN111325713B (zh) * | 2020-01-21 | 2023-05-23 | 杭州未名信科科技有限公司 | 基于神经网络的木材缺陷检测方法、系统及存储介质 |
CN111398307A (zh) * | 2020-03-23 | 2020-07-10 | 首钢集团有限公司 | 一种用于检测板坯皮下缺陷的方法及系统 |
CN111696636B (zh) * | 2020-05-15 | 2023-09-22 | 平安科技(深圳)有限公司 | 一种基于深度神经网络的数据处理方法及装置 |
CN111951232A (zh) * | 2020-07-24 | 2020-11-17 | 上海微亿智造科技有限公司 | 一种金属粉末注射成型外观缺陷检测方法及系统 |
CN112053357A (zh) * | 2020-09-27 | 2020-12-08 | 同济大学 | 一种基于fpn的钢材表面瑕疵检测方法 |
CN112288727A (zh) * | 2020-10-30 | 2021-01-29 | 创新奇智(重庆)科技有限公司 | 磁环表面缺陷检测方法、装置、电子设备及存储介质 |
CN113160109B (zh) * | 2020-12-15 | 2023-11-07 | 宁波大学 | 反背景差分的细胞图像分割方法 |
CN113189005B (zh) * | 2021-05-10 | 2022-06-28 | 郑州大学 | 便携式表面缺陷一体化检测装置及表面缺陷自动检测方法 |
CN112991344A (zh) * | 2021-05-11 | 2021-06-18 | 苏州天准科技股份有限公司 | 基于深度迁移学习的检测方法、存储介质和检测系统 |
CN113538436A (zh) * | 2021-09-17 | 2021-10-22 | 深圳市信润富联数字科技有限公司 | 零件缺陷的检测方法、装置、终端设备及存储介质 |
CN117409003B (zh) * | 2023-12-14 | 2024-02-20 | 四川宏亿复合材料工程技术有限公司 | 一种用于铁轨减震扣件的垫板的检测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108345911A (zh) * | 2018-04-16 | 2018-07-31 | 东北大学 | 基于卷积神经网络多级特征的钢板表面缺陷检测方法 |
CN109034210A (zh) * | 2018-07-04 | 2018-12-18 | 国家新闻出版广电总局广播科学研究院 | 基于超特征融合与多尺度金字塔网络的目标检测方法 |
CN109446369A (zh) * | 2018-09-28 | 2019-03-08 | 武汉中海庭数据技术有限公司 | 图像半自动标注的交互方法及系统 |
CN109522966A (zh) * | 2018-11-28 | 2019-03-26 | 中山大学 | 一种基于密集连接卷积神经网络的目标检测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10733876B2 (en) * | 2017-04-05 | 2020-08-04 | Carnegie Mellon University | Deep learning methods for estimating density and/or flow of objects, and related methods and software |
-
2019
- 2019-03-28 CN CN201910241008.XA patent/CN110232675B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108345911A (zh) * | 2018-04-16 | 2018-07-31 | 东北大学 | 基于卷积神经网络多级特征的钢板表面缺陷检测方法 |
CN109034210A (zh) * | 2018-07-04 | 2018-12-18 | 国家新闻出版广电总局广播科学研究院 | 基于超特征融合与多尺度金字塔网络的目标检测方法 |
CN109446369A (zh) * | 2018-09-28 | 2019-03-08 | 武汉中海庭数据技术有限公司 | 图像半自动标注的交互方法及系统 |
CN109522966A (zh) * | 2018-11-28 | 2019-03-26 | 中山大学 | 一种基于密集连接卷积神经网络的目标检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110232675A (zh) | 2019-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110232675B (zh) | 一种工业环境下的纹理表面缺陷检测与分割装置及方法 | |
CN110097543B (zh) | 基于生成式对抗网络的热轧带钢表面缺陷检测方法 | |
CN108830188B (zh) | 基于深度学习的车辆检测方法 | |
CN108345911B (zh) | 基于卷积神经网络多级特征的钢板表面缺陷检测方法 | |
CN107944396B (zh) | 一种基于改进深度学习的刀闸状态识别方法 | |
CN108562589B (zh) | 一种对磁路材料表面缺陷进行检测的方法 | |
CN106169081B (zh) | 一种基于不同照度的图像分类及处理方法 | |
CN108280856A (zh) | 基于混合信息输入网络模型的未知物体抓取位姿估计方法 | |
CN111982910B (zh) | 一种基于人工缺陷仿真的弱监督机器视觉检测方法及系统 | |
CN112862811B (zh) | 基于深度学习的材料显微图像缺陷识别方法、设备及装置 | |
CN112070727B (zh) | 一种基于机器学习的金属表面缺陷检测方法 | |
Jiang et al. | A machine vision-based realtime anomaly detection method for industrial products using deep learning | |
CN113920107A (zh) | 一种基于改进yolov5算法的绝缘子破损检测方法 | |
CN111798447B (zh) | 一种基于Faster RCNN的深度学习塑化材料缺陷检测方法 | |
JP2014178229A (ja) | 教師データ作成方法、画像分類方法および画像分類装置 | |
CN113221881B (zh) | 一种多层级的智能手机屏幕缺陷检测方法 | |
CN104537359A (zh) | 一种车辆目标检测方法及装置 | |
CN110334594A (zh) | 一种基于批再规范化处理的yolo算法的目标检测方法 | |
Ji et al. | Apple grading method based on features of color and defect | |
Yusof et al. | Automated asphalt pavement crack detection and classification using deep convolution neural network | |
CN115272204A (zh) | 一种基于机器视觉的轴承表面划痕检测方法 | |
Ning et al. | Research on surface defect detection algorithm of strip steel based on improved YOLOV3 | |
CN114820471A (zh) | 一种面向智能制造精微结构表面缺陷的视觉检测方法 | |
CN113421223B (zh) | 基于深度学习和高斯混合的工业产品表面缺陷检测方法 | |
Wangli et al. | Foxtail Millet ear detection approach based on YOLOv4 and adaptive anchor box adjustment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |