CN115170475A - 一种基于深度学习方法的无纺布缺陷检测方法 - Google Patents

一种基于深度学习方法的无纺布缺陷检测方法 Download PDF

Info

Publication number
CN115170475A
CN115170475A CN202210639153.5A CN202210639153A CN115170475A CN 115170475 A CN115170475 A CN 115170475A CN 202210639153 A CN202210639153 A CN 202210639153A CN 115170475 A CN115170475 A CN 115170475A
Authority
CN
China
Prior art keywords
network
image
model
precision
woven fabric
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210639153.5A
Other languages
English (en)
Inventor
王洋
李申
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin University of Science and Technology
Original Assignee
Harbin University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin University of Science and Technology filed Critical Harbin University of Science and Technology
Priority to CN202210639153.5A priority Critical patent/CN115170475A/zh
Publication of CN115170475A publication Critical patent/CN115170475A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20024Filtering details
    • G06T2207/20032Median filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30124Fabrics; Textile; Paper

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

一种基于深度学习方法的无纺布缺陷检测方法,属于图像识别领域。现有关于无纺布的缺陷检测方法存在识别效果差的缺点。一种基于深度学习方法的无纺布缺陷检测方法,搭建图像采集系统,通过图像采集系统对待检测的无纺布进行图像信号的获取;图像采集系统包含图像拍摄系统、图像处理系统、缺陷识别系统、光源照明系统、光学成像系统、图像传感器以及系统支撑部分;对获取的图像信号进行预处理操作;建立YOLOX模型,并基于建立的YOLOX模型进行缺陷识别。本发明是利用深度学习的方法对无纺布缺陷进行检测,该方法为非接触测量,具有准确性高、实时性好、精度高、效率高等优点,可以实现在线监测和智能化检测。

Description

一种基于深度学习方法的无纺布缺陷检测方法
技术领域
本发明涉及一种基于深度学习方法的无纺布缺陷检测方法。
背景技术
无纺布作为医用外科口罩,护士帽,手术帽等一次性医用耗材的原料,在生产中被大 量的使用。一次性医用消耗品的品质主要取决于无纺布的质量,由于无纺布的生产和运输 过程中,无法保证环境的绝对无菌无尘,且其本身就具有很强的静电吸附能力,因此常会 吸附空气中的小杂质,所以在无纺布的极少数区域会存在异物,该缺陷的存在直接造成后 续产品的质量不达标,因此,生产厂商需要将这些缺陷部分剔除,否则将造成巨大的经济 损失。目前行业中,多数大型公司采用进口的视觉检测设备进行缺陷检测,虽然效果不错, 但是这些设备通常造价和后期维护费用高昂,并不适合小型企业和作坊使用。
国内大多数小公司还是采用传统人工目视方式进行缺陷筛选,这种方式较为简单,但 是需要较长时间的工人培训,且检测效率及精度较低,并且会浪费较多的人力资源,检测 效率低,不能满足自动化生产线高速生产速度的需求,人工检测需要检测工人有很高的熟 练度,而且人眼检测的效率一般难以跟随布匹生产的速度,因此人工缺陷检测也会制约生 产效率。对劳动力需求大,人工检测过程中会出现视觉疲劳现象,并且受人主观因素影响 大,不同质检员可能会出现不同的判断标准,且一个质检员的判断标准也无法保证一直不 变,所以易出现漏检、误检的现象。对企业经营来讲是一笔不小的开销。
近年来,伴随着机器视觉领域相关技术的不断进步,相关的图像识别检测算法不断地 涌现出来。传统的图像处理算法需要人工设定图像特征提取和识别的参数,并根据不同的 缺陷类型制定不同的检测方案,缺乏灵活性,且很难达到更高的识别准确率。
随着计算机技术的迅速发展,研究人员发现可以利用计算机将摄像机采集到的图像、 视频作为数据源提取其中信息进行处理从而模拟人类的视觉。从视觉出发,让计算机从图 像中提取信息模拟人眼去检测产品缺陷是一项值得研究的课题,在无纺布表面缺陷的识别 检测中使用深度学习算法后,人为提取特征的繁琐程序不仅可以被简化,实现不同类型缺 陷的精确识别。利用深度学习算法对物体表面缺陷图像进行检测的方法不仅能够替代人工 节约成本还能提高检测速度和检测精度。因此,将深度学习运用到工业领域成为最迫切的 需求,这不仅能提高了口罩产品生产合格率,还能提高口罩产品的生产效率,这正是目前 工业生产线上所需要的技术。
目前,基于人工设计特征和机器学习的传统识别算法的情况是,随着计算机运算能力 的不断提升,图像识别技术被应用在很多场景中,其中之一就是缺陷检测,自上世纪90年 代以来,基于计算机视觉技术的缺陷检测逐渐成为研究热点,国内外研究学者也提出了很 多检测方法,大体可以分为基于缺陷结构纹理的方法、基于灰度像素统计的方法、基于频 谱的方法、基于特征学习的方法四类。
上述现有的识别算法存在不同程度的缺点,例如,基于缺陷结构纹理的方法十分依赖 于布匹本身的缺陷纹理特征,只有当缺陷纹理规律非常强的时候,才能有较好的检测结果, 易受布匹纹理和采集光照的影响,可靠性很低。其次,基于像素统计的方法可以描述像素 的空间关系,提供很多有用的信息,比如粗糙度、规则性、自相关性以及同一性等信息, 但它不能分析纹理结构,不能和较大的纹理单元共同作用,又因布匹瑕疵种类繁多及形状 大小不一的问题,导致该方法的鲁棒性较差。
发明内容
本发明的目的是为了解决以上的问题,而提出一种基于深度学习方法的无纺布缺陷检 测方法。
一种基于深度学习方法的无纺布缺陷检测方法,所述方法通过以下步骤实现:
首先,搭建图像采集系统,通过图像采集系统对待检测的无纺布进行图像信号的获取; 图像采集系统包含图像拍摄系统、图像处理系统、缺陷识别系统、光源照明系统、光学成 像系统、图像传感器以及系统支撑部分;
然后,对获取的图像信号进行预处理操作,预处理操作包括灰度化、图像去噪、形态 操作、图像增强;
最后,建立YOLOX模型,并基于建立的YOLOX模型进行缺陷识别。
优选地,所述的图像拍摄系统包括工业相机、镜头、光源;
相机采用CCD作为采样设备。
优选地,所述的图像预处理操作过程在采用中值滤波器进行预处理。
优选地,所述的基于建立的YOLOX模型进行缺陷识别的步骤具体为:
建立改进的YOLOX模型并进行缺陷识别;
第一、建立特征提取网络;
在网络前端采用ReLU函数,只在后端采用h-swish函数,三层卷积神经网络通过对模 型降维和升维用更少的参数进行特征学习,经过通道维的全局平局池化获取全局感受野, 再通过自适应一维卷积实现不降维的局部跨信道交互,其中学习到的通道注意力用Wk表 示,其中包含k×C个参数。
Figure BDA0003683130410000031
yi的权重由yi与其相邻的k个通道共同决定,避免了不同通道之间的完全独立性:
Figure BDA0003683130410000032
其中,
Figure BDA0003683130410000033
表示yi的第k个相邻通道的集合,
Figure BDA0003683130410000034
表示
Figure BDA0003683130410000035
的权重。让所有通道共享权值可 以进一步提高模型性能:
Figure BDA0003683130410000036
最后通过含有k个参数的一维卷积就能够实现有效捕捉局部跨通道的交互信息,其中 C表示一维卷积:
ω=σ(Ck(y))
第二,进行模型结构化剪枝操作;
在神经网络中的BN层引入可学习的参数γ和β加快网络的训练和收敛速度,通过平 移和缩放对通道数据进行归一化处理,在迭代训练中学习网络的特征分布:
Figure BDA0003683130410000037
其中,zin和zout表示BN层的输入和输出,B表示mini-patch,μB和σB表示均值和标准差;
L1正则化的正则项为:
Figure BDA0003683130410000038
其中λ表示正则项的系数,n表示样本大小,ω表示权重.在损失函数中增加L1正则化可以降低模型的复杂度,使神经网络中的权重趋于0,得到稀疏网络;与L1正则化相似,在BN层的每个通道引入尺度因子,损失函数中增加关于γ的惩罚项,与神经网络权重进 行联合训练,最后将稀疏网络的尺度因子γ大小作为衡量各层网络通道重要性的指标;
Figure BDA0003683130410000039
其中,第一项表示网络正常训练的损失函数,(x,y)表示训练的输入和输出,W表示可训练的网络权重;第二项表示L1正则项,λ表示两项的平衡因子,Γ表示所有剪枝通道 的集合;
通过控制超参数λ的大小,使网络获得合适的稀疏度,从而对冗余通道进行筛选;网 络中贡献较小的通道去掉之后不会影响模型对特征的有效提取,而且降低了网络的复杂度, 经过重新训练后进行微调能够提高模型的精度和泛化性能;
第三,确定识别结果;
设TP(True positives)表示正样本被正确识别为正样本;
TN(True negatives):负样本被正确识别为负样本;
FP(False positives):负样本被错误识别为正样本;
FN(False negatives):正样本被错误识别为负样本;
(1)精确率(Precision):Precision就是在识别出来的正样本中,True positives所占的 比率;
Figure BDA0003683130410000041
(2)召回率(Recall):Recall是测试集中所有正样本样例中,被正确识别为正样本的 比例;
Figure BDA0003683130410000042
(3)准确率(Accuracy):分类正确的样本数除以所有的样本数;准确率一般用来评估模型的全局准确程度,不能包含太多信息,无法全面评价一个模型性能;
(4)平均精度(Average-Precision,AP)
如果一个分类器的性能比较好,那么它应该有如下的表现:在Recall值增长的同时,Precision 的值保持在一个很高的水平;而性能比较差的分类器可能会损失很多Precision值才能换来 Recall值的提高;通常情况下,文章中都会使用Precision-recall曲线,来显示出分类器在 Precision与Recall之间的权衡;
AP就是Precision-recall曲线下面的面积,通常来说一个越好的分类器,AP值越高;
Figure BDA0003683130410000043
(5)mean Average Precision(mAP):mAP是多个类别AP的平均值。这个mean的意思是对每个类的AP再求平均,得到的就是mAP的值,mAP的大小一定在[0,1]区间,越大越 好;
(6)IoU:IoU这一值,;为系统预测出来的框与原来图片中标记的框的重合程度;计算方法即检测结果Detection Result与Ground Truth的交集比上它们的并集,即为检测的准 确率;
Figure BDA0003683130410000051
本发明的有益效果为:
本发明涉及的无纺布检测对象与其他识别对象类型的缺陷相比,在无纺布生产过程中 更容易受到其他因素的干扰。生产车间一般非常干燥容易产生静电易于吸附尘土,这对无 纺布缺陷检测带来了一定的影响。光照条件的变化、视角和距离的不同、复杂的背景等因 素使无纺布缺陷图像的采集更加困难。
本发明是利用深度学习的方法对无纺布缺陷进行检测,该方法为非接触测量,具有准 确性高、实时性好、精度高、效率高等优点,可以实现在线监测和智能化检测。常见无纺 布缺陷进行分类,无纺布缺陷可分为褶皱、脏点、断裂、缺纱。
由于无纺布表面纹理由经线和纬线交织组成具有一定方向尺寸的规则性,在处理这种 图像的噪声,比较好的方法是在尽量不影响无纺布表面缺陷的情形下把规则性纹理模糊化 处理,那么中值滤波器是比较好的选择。通过去中值的方法可以有效地剔除个别反常值, 因此在利用中值滤波实现图像平滑时,图像产生的模糊效果比较低,同时可以将对于突出 物体属性比较重要的边缘有效地保留下来。
针对上述情况,本发明采用YOLOX模型来识别无纺布缺陷,并针对网络对小目标识别能力不足的问题进行了相应的改进。通过对模型降维和升维用更少的参数进行特征学习, 可以避免通道降维的影响,更有效地学习通道注意力。通过结构化剪枝的方法把通道中贡 献低的神经元去掉,去掉这部分神经元能够有效降低模型复杂度,同时几乎不会对网络的 精度产生影响,甚至还能改善网络的综合性能。
附图说明
图1为本发明的流程图;
图2为本发明涉及的图像拍摄系统;
图3为本发明涉及的预处理内容;
图4为本发明涉及的YOLOX网络结构;
图5为本发明涉及的DarkNet53网络结构图;
图6为本发明涉及的YOLOX的预测头结构图;
图7a、7b、7c、7d为本发明涉及的无纺布缺陷类型图,分别表示褶皱、脏点、断裂、缺纱;
图8为本发明涉及的注意力网络SENet结构图;
图9为本发明涉及的通过含有k个参数的一维卷积就捕捉局部跨通道的交互信息的图 示;
图10为本发明涉及的结构化剪枝方法示意图;
图11为本发明涉及的平均精度图示方法。
具体实施方式
具体实施方式一:
本实施方式的一种基于深度学习方法的无纺布缺陷检测方法,如图1所示,所述方法 通过以下步骤实现:
首先,搭建图像采集系统,通过图像采集系统对待检测的无纺布进行图像信号的获取; 图像采集系统包含图像拍摄系统、图像处理系统、缺陷识别系统、光源照明系统、光学成 像系统、图像传感器以及系统支撑部分,图像拍摄系统如图2所示,预处理内容如图3所 示;
然后,对获取的图像信号进行预处理操作,预处理操作包括灰度化、图像去噪、形态 操作、图像增强;
最后,建立YOLOX模型,并基于建立的YOLOX模型进行缺陷识别。
具体实施方式二:
与具体实施方式一不同的是,本实施方式的一种基于深度学习方法的无纺布缺陷检测 方法,所述的图像拍摄系统包括工业相机1、镜头2、光源3和计算机4;无纺布5放置在平台6上,平台上安装支架,支架上安装工业相机1,工业相机1下方安装镜头2,镜头2 下方设置光源3,工业相机1连接计算机4,镜头对准无纺布5。作为无纺布5的缺陷检测 的第一步,首先要获得原始的图像信息。一般而言,获取原始图像的质量与使用的图像采 集设备密切相关。但是一方面基于成本方面的考虑,通常图像获取设备的结构不能过于复 杂,同时采用的设备材料也不能过于昂贵,这势必会造成一些无关的噪声信息的引入,对 于后面的识别过程产生影响。另一方面,从用户使用方面考虑,采样过程也应该尽量的简 化。
基于目前实验室的环境,工业相机1采用CCD(电荷藕合器件)作为采样设备,这种图 像传感器可以同时进行光电转换、储存转换信号的电荷、完成转移和输出功能。近几年来, MOS集成电路的制造生产相关技术不断提升带动了CCD相关技术的不断成熟,现已经被广泛的应用于图像采集、扫描仪等视觉数据采集领域。CCD相机最大的特点在于比普通相机具有高得多的灵敏度和几何精度,同时能够处理的光谱范围比较宽,还能在低温潮湿等恶劣条件下工作而成本却并不高。CCD相机的工作原理是通过相机镜头把来自被摄对象反射回来的光线汇聚到CCD芯片上,其中的传感器就可以根据反射光的不同能量来聚集 对应数目的电荷,继而进行周期性的放电,这样就形成了电信号用以描述相应的画面,对 微弱信号进行放大消除掉干扰后即可输出图像画面。
具体实施方式三:
与具体实施方式一或二不同的是,本实施方式的一种基于深度学习方法的无纺布缺陷 检测方法,所述的图像预处理操作过程在采用中值滤波器进行预处理。
尽管在采样方式的选择上尽可能的提高精度,减少外部因素的干扰,但是在实际过程 中噪声的混入不可避免,例如在图像采集过程中常常会受到噪声的干扰,常见的有光电转 化过程中的噪声、脉冲干扰及现场环境中的电磁干扰等,为了提高检测的准确性,需要在 缺陷检测之前对于获取的图像进行预处理,通过预处理能够达到去除干扰、消去不属于布 匹本身的纹理、突出目标边缘等效果。
由于无纺布表面纹理由经线和纬线交织组成具有一定方向尺寸的规则性,在处理这种 图像的噪声,比较好的方法是在尽量不影响无纺布表面缺陷的情形下把规则性纹理模糊化 处理,那么中值滤波器是比较好的选择。中值滤波作为一种非线性滤波器,其基本处理思 想是用像素点一定范围领域的灰度值中值来替换该邻域中心像素点的灰度值。相比于均值 滤波,中值滤波取的是一定区域范围内的像素灰度均值,容易引起图像中尖锐突出不连续 部分的模糊,不利于保存图像边缘部分的细节,通过去中值的方法可以有效地剔除个别反 常值,因此在利用中值滤波实现图像平滑时,图像产生的模糊效果比较低,同时可以将对 于突出物体属性比较重要的边缘有效地保留下来。
具体实施方式四:
与具体实施方式三不同的是,本实施方式的一种基于深度学习方法的无纺布缺陷检测 方法,所述的基于建立的YOLOX模型进行缺陷识别的步骤具体为:
首先,介绍YOLOX模型:
YOLOX选取Darknet53为主干网络,其中加入了无锚检测器、先进的标签分配策略和 数据增强等设计单元。提高了YOLOX的性能,超过了现存的YOLO系列检测器。与其他 的目标检测网络相比,YOLOX具有以下三方面优势。
1)解耦头(Decoupled Head):原来的YOLO各系列都采用了一个耦合在一起的检测头,同时进行分类、回归的检测任务。YOLOX在结构上采用了Decoupled Head,将特征平 行分成两路卷积特征,同时为了降低参数量提前进行了降维操作,其好处在于:在检测的 过程中分类需要的特征和回归所需要的特征不同,所以在Decoupled Head中进行解耦处理后学习的过程会变得更加简单。
2)先进的标签分配策略(SimOTA):SimOTA的作用是为不同目标设定不同的正样本数量:
(a)确定正样本候选区域在空间尺度上,先选定每一个中心的区域作为候选区域;
(b)计算每个样本对每个GT的Reg+Cls loss,计算候选区域的样本和GT之间的loss, 得到Reg+Cls loss的结果;
(c)使用每个GT的预测样本确定它需要分配到的正样本数(Dynamic_k)中的k值等于多少,其中操作为:获取于当前GT的iou前10的样本;将这top10的样本的iou求和 取整,为当前GT的danamic_k。此外,iou取前10个数字对结果影响较小,并且在5-15 之间取值,结果的影响差距比较小。
(d)舍去全局优化求解过程,只为每个GT取loss最小的前danamic_k个样本作为正样本;
(e)人工去掉同一个样本被分配到多个GT的正样本的情况(全局信息)。
3)无锚检测器:Anchor Based检测器为了追求最优性能通常会需要对anchor box进 行聚类分析,这无形中增加了部分计算量。无锚检测器的性能可以与基于锚的检测器相媲 美。Anchor-free机制显著减少了需要启发式调整的设计参数的数量和涉及的许多技巧。使 得检测器,特别是其训练和解码阶段变得相当简单。通过这样的修改降低了检测器的参数 和GFLOP,使其速度更快。
YOLOX包括输入端、主干网络、Neck、检测头四部分组成,网络结构如图4所示。
首先需要把采集到的数据进行数据增强,常见的数据增强方法有Mosaic和MixUp数 据增强方法。Mosaic数据增强这种数据增强方式简单来说就是把4张图片,通过随机缩放、 随机裁减、随机排布的方式进行拼接。这种方法的优点是丰富了检测物体的背景和小目标, 并且在计算Batch Normalization的时候一次会计算四张图片的数据,使得mini-batch大小不 需要很大,一个GPU就可以达到比较好的效果。缺点是如果的数据集本身就有很多的小目 标,那么Mosaic数据增强会导致本来较小的目标变得更小,导致模型的泛化能力变差。
YOLOX使用DarkNet53网络进行特征提取,DarkNet53融合了ResNet,共包含5个 残差块,每个残差块由数量不等的残差单元组成,每个残差单元又由两个CBL单元及残差 操作构成。其中,每个CBL单元又是由卷积层、归一化(batch normalization)和激活函数(leaky relu)组成。残差块的使用既可以防止有效信息的丢失,也能够防止深层网络训练时 出现梯度消失。除此之外,该网络中没有池化层,它使用步长为2的卷积做下采样来代替池化操作,进一步防止有效信息的丢失,这对检测多种目标来说是十分有利的。DarkNet53网络结构图如图5所示,
YOLOX的主要改进在于预测头的变化,采用anchor-free代替以前YOLO各个系列广泛应用的anchor-based。Anchor-based的优点在于使用anchor机制产生密集的anchorbox, 使得网络可直接在此基础上进行目标分类及边界框坐标回归。加入先验,训练稳定,密集 的anchor box可有效提高网络目标召回能力,对于小目标检测来说提升非常明显。缺点是 anchor机制中,需要设定的超参:尺度(scale)和长宽比(aspect ratio)是比较难设计的。这需 要较强的先验知识。冗余框非常之多,网络实质上是看不见anchor box的,在anchor box 的基础上进行边界回归更像是一种在范围比较小时候的强行记忆。反之anchor-free更大更 灵活的解空间、摆脱了使用anchor而带来计算量从而让检测和分割都进一步走向实时高精 度。YOLOX的预测头结构图如图6所示。
其次,进行无纺布缺陷分析
由于无纺布缺陷大部分缺陷很小,属于小目标检测。现有的小目标定义方式主要分为 以下两类,即基于相对尺度的定义与基于绝对尺度的定义。基于相对尺度定义。即从目标 与图像的相对比例这一角度考虑来对小目标进行定义。即边界框面积与图像面积之比的中 位数在0.08%~0.58%之间。基于绝对尺度定义,则从目标绝对像素大小这一角度考虑来对 小目标进行定义。将小目标定义为分辨率小于32像素×32像素的目标。通过这些定义可以 发现小目标像素占比少,存在覆盖面积小、包含信息少等基本特点。
(1)可利用的特征少
无论是从基于绝对尺度还是基于相对尺度的定义,小目标相对于大/中尺度尺寸目标都 存在分辨率低的问题。低分辨率的小目标可视化信息少,难以提取到明显的特征,并且极 易受到环境因素的干扰,进而导致了检测模型难以精准定位和识别小目标。
(2)定位精度要求高
小目标由于在图像中覆盖面积小,因此其边界框的定位相对于大/中尺度尺寸目标具有 更大的挑战性。在预测过程中,预测边界框框偏移一个像素点,对小目标的误差影响远高 于大/中尺度目标。此外,现在基于锚框的检测器依旧占据绝大多数,在训练过程中,匹配 小目标的锚框数量远低于大/中尺度目标,这进一步地导致了检测模型更侧重于大/中尺度目 标的检测,难以检测小目标。
(3)样本不均衡的问题
为了定位目标在图像中的位置,现有的方法大多是预先在图像的每个位置生成一系列 的锚框。在训练的过程中,通过设定固定的阈值来判断锚框属于正样本还是负样本。这种 方式导致了模型训练过程中不同尺寸目标的正样本不均衡问题。当人工设定的锚框与小目 标的真实边界框差异较大时,小目标的训练正样本将远远小于大/中尺度目标的正样本,这 将导致训练的模型更加关注大/中尺度目标的检测,而忽略小目标的检测。如何解决锚框机 制导致的小目标和大/中尺度目标样本不均衡问题也是当前面临的一大挑战。
(4)网络结构的原因
在目标检测领域,现有算法的设计往往更为关注大/中尺度目标的检测性能。针对小目 标特性的优化设计并不多,加之小目标自身特性所带来的难度,导致现有算法在小目标检 测上普遍表现不佳。虽然无锚框的检测器设计是一个新的发展趋势,但是现有网络依旧是 基于锚框的检测器占据主流,而锚框这一设计恰恰对小目标极不友好。
基于以上四点原因,选择YOLOX算法实现对小目标检测的检测。其检测头采用无锚机制,现有的目标检测方法大部分都是基于锚框机制而设计的。现有的锚框设计难以获得平衡小目标召回率与计算成本之间的矛盾,而且这种方式导致了小目标的正样本与大目标的正样本极度不均衡,使得模型更加关注于大目标的检测性能,从而忽视了小目标的检测。此外,锚框的使用引入了大量的超参,比如锚框的数量、宽高比和大小等,使得网络难以 训练,不易提升小目标的检测性能。
本课题采用加工口罩的无纺布块作为研究对象,根据GB15979《一次性使用卫生用品 卫生标准》长度不小于17cm,宽度不小于17cm。所以本课题采用20cm*20cm的无纺布作为研究对象,无纺布缺陷大致可以分为以下四类。
1、褶皱:褶皱样本图像中有贯穿图像的纹路,图像灰度值比周围有明显变化。
2、脏点:脏点样本图像有一个或者多个黑色污点,灰度值比周围像素点低。
3、断裂:断裂样本图像有明显灰度变化,边缘处还有纤维丝。
4、缺纱:缺纱样本表面有明亮相间的网眼。
无纺布缺陷类型如图7a-7b所示。
最后,建立改进的YOLOX模型并进行缺陷识别;
第一、建立特征提取网络;
在深层目标检测模型中,非线性激活函数swish能够改善神经网络的精度,但是其中 的sigmoid函数σ(x)在移动端非常消耗计算资源,而ReLU函数在许多软硬件框架中都已实现,易于量化部署,即使以16位浮点数或8位整型低精度运算时性能也较好,且计算推 理速度快.因此引入h-swish函数,能在保持精度的情况下加快速度,有利于在移动平台的 嵌入式设备中使用。
swish(x)=x·σ(x)
Figure BDA0003683130410000101
在设计特征提取网络时,考虑到模型检测实时性的要求,在网络前端采用ReLU函数, 只在后端采用h-swish函数,减少h-swish函数造成的网络延迟,达到检测速度和精度的平 衡。由于无纺布缺陷小,因此对特征提取网络提出了更高的要求,视觉注意力机制基于原 有数据之间的关联性,突出其中的重要特征,在卷积神经网络中的应用能够提升模型特征 的表达能力,改善网络的性能,采用融合注意力机制增强神经网络特征提取能力。
原始注意力网络SENet是通过对每个通道进行全局平均池化,使其具有全局的感受野, 因此浅层网络也具有了全局信息。之后通过非线性变换为每个通道生成相应的权重,在通 道维进行建模重新标定原始特征。其中输入X的大小为H×W×C,GAP表示全局平均池化, FC表示全连接层,ReLU和h-swish为激活函数,scale表示对神经网络进行尺度恢复。注 意力网络SENet结构图如图8所示。
通过两个全连接层捕捉非线性的跨通道交互和以降维的方式来控制模型的复杂性,不 仅会对通道注意力预测造成不良影响,而且这种方式捕获所有通道之间的依赖关系效率较 低。采用这种新的模型复杂度简化方式,可以避免通道降维的影响,更有效地学习通道注 意力。三层卷积神经网络通过对模型降维和升维用更少的参数进行特征学习,经过通道维 的全局平局池化获取全局感受野,再通过自适应一维卷积实现不降维的局部跨信道交互, 这种捕捉局部跨通道交互的新方法能够保证模型效率,其中学习到的通道注意力用Wk表 示,其中包含k×C个参数。
Figure BDA0003683130410000111
yi的权重由yi与其相邻的k个通道共同决定,避免了不同通道之间的完全独立性:
Figure BDA0003683130410000112
其中,
Figure BDA0003683130410000113
表示yi的第k个相邻通道的集合,
Figure BDA0003683130410000114
表示
Figure BDA0003683130410000115
的权重。让所有通道共享权值可 以进一步提高模型性能:
Figure BDA0003683130410000116
最后通过含有k个参数的一维卷积就能够实现有效捕捉局部跨通道的交互信息,其中 C表示一维卷积:
ω=σ(Ck(y))
如图9所示的通过含有k个参数的一维卷积就捕捉局部跨通道的交互信息的图示
第二,进行模型结构化剪枝操作;
由于目前深度学习软件框架、硬件性能以及模型部署系统的限制,通道剪枝以模型重 构的方式筛选神经网络中存在的一些冗余连接,这些结构对于模型性能的贡献很小,去掉 这部分神经元能够有效降低模型复杂度,同时几乎不会对网络的精度产生影响,甚至还能 改善网络的综合性能。目前的剪枝算法分为结构化剪枝和非结构化剪枝。有人将网络中的 权重与设定的阈值进行比较,低于阈值的连接都被剪除,然后对剪枝后的网络重新训练优 化网络性能。类似的非结构化剪枝的方法需要对稀疏连接的网络进行量化和编码才能减少 模型的实际存储空间,而且需要采用专业的硬件设备和计算方式才能实现模型推理加速。 本发明采用结构化剪枝方法,便于软硬件实现和部署。在神经网络中的BN层引入可学习 的参数γ和β加快网络的训练和收敛速度,通过平移和缩放对通道数据进行归一化处理, 在迭代训练中学习网络的特征分布:
Figure BDA0003683130410000121
其中,zin和zout表示BN层的输入和输出,B表示mini-patch,μB和σB表示均值和标准差;
L1正则化的正则项为:
Figure BDA0003683130410000122
其中λ表示正则项的系数,n表示样本大小,ω表示权重.在损失函数中增加L1正则化可以降低模型的复杂度,使神经网络中的权重趋于0,得到稀疏网络;与L1正则化相似,在BN层的每个通道引入尺度因子,损失函数中增加关于γ的惩罚项,与神经网络权重进 行联合训练,最后将稀疏网络的尺度因子γ大小作为衡量各层网络通道重要性的指标;
Figure BDA0003683130410000123
其中,第一项表示网络正常训练的损失函数,(x,y)表示训练的输入和输出,W表示可训练的网络权重;第二项表示L1正则项,λ表示两项的平衡因子,Γ表示所有剪枝通道 的集合;
通过控制超参数λ的大小,使网络获得合适的稀疏度,从而对冗余通道进行筛选;网 络中贡献较小的通道去掉之后不会影响模型对特征的有效提取,而且降低了网络的复杂度, 经过重新训练后进行微调能够提高模型的精度和泛化性能;结构化剪枝方法示意图如图10 所示。
第三,确定识别结果;
设TP(True positives)表示正样本被正确识别为正样本;
TN(True negatives):负样本被正确识别为负样本;
FP(False positives):负样本被错误识别为正样本;
FN(False negatives):正样本被错误识别为负样本;
(1)精确率(Precision):Precision就是在识别出来的正样本中,True positives所占的 比率;
Figure BDA0003683130410000131
(2)召回率(Recall):Recall是测试集中所有正样本样例中,被正确识别为正样本的 比例;
Figure BDA0003683130410000132
(3)准确率(Accuracy):分类正确的样本数除以所有的样本数;准确率一般用来评估模型的全局准确程度,不能包含太多信息,无法全面评价一个模型性能;
(4)平均精度(Average-Precision,AP)
如果一个分类器的性能比较好,那么它应该有如下的表现:在Recall值增长的同时,Precision 的值保持在一个很高的水平;而性能比较差的分类器可能会损失很多Precision值才能换来 Recall值的提高;通常情况下,文章中都会使用Precision-recall曲线,来显示出分类器在 Precision与Recall之间的权衡;
AP就是Precision-recall曲线下面的面积,通常来说一个越好的分类器,AP值越高; 平均精度图示如图图11所示。
Figure BDA0003683130410000133
(5)mean Average Precision(mAP):mAP是多个类别AP的平均值。这个mean的意思是对每个类的AP再求平均,得到的就是mAP的值,mAP的大小一定在[0,1]区间,越大越 好;该指标是目标检测算法中最重要的一。
(6)IoU:IoU这一值,;为系统预测出来的框与原来图片中标记的框的重合程度;计算方法即检测结果Detection Result与Ground Truth的交集比上它们的并集,即为检测的准 确率;
Figure BDA0003683130410000141
本发明的实施例公布的是较佳的实施例,但并不局限于此,本领域的普通技术人员, 极易根据上述实施例,领会本发明的精神,并做出不同的引申和变化,但只要不脱离本发 明的精神,都在本发明的保护范围内。

Claims (4)

1.一种基于深度学习方法的无纺布缺陷检测方法,其特征在于:所述方法通过以下步骤实现:
首先,搭建图像采集系统,通过图像采集系统对待检测的无纺布进行图像信号的获取;图像采集系统包含图像拍摄系统、图像处理系统、缺陷识别系统、光源照明系统、光学成像系统、图像传感器以及系统支撑部分;
然后,对获取的图像信号进行预处理操作,预处理操作包括灰度化、图像去噪、形态操作、图像增强;
最后,建立YOLOX模型,并基于建立的YOLOX模型进行缺陷识别。
2.根据权利要求1所述的一种基于深度学习方法的无纺布缺陷检测方法,其特征在于:所述的图像拍摄系统包括工业相机、镜头、光源;
相机采用CCD作为采样设备。
3.根据权利要求1或2所述的一种基于深度学习方法的无纺布缺陷检测方法,其特征在于:所述的图像预处理操作过程在采用中值滤波器进行预处理。
4.根据权利要求3所述的一种基于深度学习方法的无纺布缺陷检测方法,其特征在于:所述的基于建立的YOLOX模型进行缺陷识别的步骤具体为:
建立改进的YOLOX模型并进行缺陷识别;
第一、建立特征提取网络;
在网络前端采用ReLU函数,只在后端采用h-swish函数,三层卷积神经网络通过对模型降维和升维用更少的参数进行特征学习,经过通道维的全局平局池化获取全局感受野,再通过自适应一维卷积实现不降维的局部跨信道交互,其中学习到的通道注意力用Wk表示,其中包含k×C个参数;
Figure FDA0003683130400000011
yi的权重由yi与其相邻的k个通道共同决定,避免了不同通道之间的完全独立性:
Figure FDA0003683130400000012
其中,
Figure FDA0003683130400000013
表示yi的第k个相邻通道的集合,
Figure FDA0003683130400000014
表示
Figure FDA0003683130400000015
的权重;让所有通道共享权值可以进一步提高模型性能:
Figure FDA0003683130400000021
最后通过含有k个参数的一维卷积就能够实现有效捕捉局部跨通道的交互信息,其中C表示一维卷积:
ω=σ(Ck(y))
第二,进行模型结构化剪枝操作;
在神经网络中的BN层引入可学习的参数γ和β加快网络的训练和收敛速度,通过平移和缩放对通道数据进行归一化处理,在迭代训练中学习网络的特征分布:
Figure FDA0003683130400000022
其中,zin和zout表示BN层的输入和输出,B表示mini-patch,μB和σB表示均值和标准差;
L1正则化的正则项为:
Figure FDA0003683130400000023
其中λ表示正则项的系数,n表示样本大小,ω表示权重.在损失函数中增加L1正则化可以降低模型的复杂度,使神经网络中的权重趋于0,得到稀疏网络;与L1正则化相似,在BN层的每个通道引入尺度因子,损失函数中增加关于γ的惩罚项,与神经网络权重进行联合训练,最后将稀疏网络的尺度因子γ大小作为衡量各层网络通道重要性的指标;
Figure FDA0003683130400000024
其中,第一项表示网络正常训练的损失函数,(x,y)表示训练的输入和输出,W表示可训练的网络权重;第二项表示L1正则项,λ表示两项的平衡因子,Γ表示所有剪枝通道的集合;
通过控制超参数λ的大小,使网络获得合适的稀疏度,从而对冗余通道进行筛选;网络中贡献较小的通道去掉之后不会影响模型对特征的有效提取,而且降低了网络的复杂度,经过重新训练后进行微调能够提高模型的精度和泛化性能;
第三,确定识别结果;
设TP(True positives)表示正样本被正确识别为正样本;
TN(True negatives):负样本被正确识别为负样本;
FP(False positives):负样本被错误识别为正样本;
FN(False negatives):正样本被错误识别为负样本;
(1)精确率(Precision):Precision就是在识别出来的正样本中,True positives所占的比率;
Figure FDA0003683130400000031
(2)召回率(Recall):Recall是测试集中所有正样本样例中,被正确识别为正样本的比例;
Figure FDA0003683130400000032
(3)准确率(Accuracy):分类正确的样本数除以所有的样本数;准确率一般用来评估模型的全局准确程度,不能包含太多信息,无法全面评价一个模型性能;
(4)平均精度(Average-Precision,AP)
如果一个分类器的性能比较好,那么它应该有如下的表现:在Recall值增长的同时,Precision的值保持在一个很高的水平;而性能比较差的分类器可能会损失很多Precision值才能换来Recall值的提高;通常情况下,文章中都会使用Precision-recall曲线,来显示出分类器在Precision与Recall之间的权衡;
AP就是Precision-recall曲线下面的面积,通常来说一个越好的分类器,AP值越高;
Figure FDA0003683130400000033
(5)mean Average Precision(mAP):mAP是多个类别AP的平均值;这个mean的意思是对每个类的AP再求平均,得到的就是mAP的值,mAP的大小一定在[0,1]区间,越大越好;
(6)IoU:IoU这一值,;为系统预测出来的框与原来图片中标记的框的重合程度;计算方法即检测结果Detection Result与Ground Truth的交集比上它们的并集,即为检测的准确率;
Figure FDA0003683130400000034
CN202210639153.5A 2022-06-08 2022-06-08 一种基于深度学习方法的无纺布缺陷检测方法 Pending CN115170475A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210639153.5A CN115170475A (zh) 2022-06-08 2022-06-08 一种基于深度学习方法的无纺布缺陷检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210639153.5A CN115170475A (zh) 2022-06-08 2022-06-08 一种基于深度学习方法的无纺布缺陷检测方法

Publications (1)

Publication Number Publication Date
CN115170475A true CN115170475A (zh) 2022-10-11

Family

ID=83485281

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210639153.5A Pending CN115170475A (zh) 2022-06-08 2022-06-08 一种基于深度学习方法的无纺布缺陷检测方法

Country Status (1)

Country Link
CN (1) CN115170475A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115631402A (zh) * 2022-12-22 2023-01-20 联通(四川)产业互联网有限公司 一种适用于智慧养殖的ai算法服务平台构建方法
CN116758029A (zh) * 2023-06-15 2023-09-15 东莞市商斯迈智能科技有限公司 基于机器视觉的擦窗机移动控制方法及系统
CN117663720A (zh) * 2024-01-29 2024-03-08 石狮市飞轮线带织造有限公司 一种涤纶缝纫线制备过程中的烘干工艺
CN117710377A (zh) * 2024-02-06 2024-03-15 中国科学院长春光学精密机械与物理研究所 一种基于深度学习算法的cmos的缺陷检测方法
CN117710377B (zh) * 2024-02-06 2024-05-24 中国科学院长春光学精密机械与物理研究所 一种基于深度学习算法的cmos的缺陷检测方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115631402A (zh) * 2022-12-22 2023-01-20 联通(四川)产业互联网有限公司 一种适用于智慧养殖的ai算法服务平台构建方法
CN115631402B (zh) * 2022-12-22 2023-05-23 联通(四川)产业互联网有限公司 一种适用于智慧养殖的ai算法服务平台构建方法
CN116758029A (zh) * 2023-06-15 2023-09-15 东莞市商斯迈智能科技有限公司 基于机器视觉的擦窗机移动控制方法及系统
CN117663720A (zh) * 2024-01-29 2024-03-08 石狮市飞轮线带织造有限公司 一种涤纶缝纫线制备过程中的烘干工艺
CN117663720B (zh) * 2024-01-29 2024-04-30 石狮市飞轮线带织造有限公司 一种涤纶缝纫线制备过程中的烘干工艺
CN117710377A (zh) * 2024-02-06 2024-03-15 中国科学院长春光学精密机械与物理研究所 一种基于深度学习算法的cmos的缺陷检测方法
CN117710377B (zh) * 2024-02-06 2024-05-24 中国科学院长春光学精密机械与物理研究所 一种基于深度学习算法的cmos的缺陷检测方法

Similar Documents

Publication Publication Date Title
Ren et al. State of the art in defect detection based on machine vision
CN115170475A (zh) 一种基于深度学习方法的无纺布缺陷检测方法
Jeon et al. Automatic recognition of woven fabric patterns by an artificial neural network
CN110060237A (zh) 一种故障检测方法、装置、设备及系统
CN105844621A (zh) 一种印刷品质量检测方法
CN108364291A (zh) 基于计算机视觉技术的原坯布快速检测方法
CN108765402B (zh) 无纺布缺陷检测与分类方法
CN109087286A (zh) 一种基于计算机图像处理和模式识别的检测方法及应用
Behera Image-processing in textiles
CN111047655A (zh) 基于卷积神经网络的高清摄像机布料疵点检测方法
CN115082744B (zh) 一种基于人工智能的太阳能集热效率分析方法及系统
Zhang et al. A review of fabric identification based on image analysis technology
CN112802016A (zh) 基于深度学习的实时布匹缺陷检测方法及系统
CN115205274A (zh) 一种基于轻量化级联网络的布匹瑕疵检测方法
CN110335233A (zh) 基于图像处理技术的高速公路护栏板缺陷检测系统和方法
CN112102224A (zh) 一种基于深度卷积神经网络的布匹疵点识别方法
CN115908354A (zh) 一种基于双尺度策略和改进的yolov5网络的光伏面板缺陷检测方法
Meng et al. Woven fabric density measurement by using multi-scale convolutional neural networks
CN113393461A (zh) 基于深度学习的分裂中期染色体图像质量筛选方法和系统
CN114283137A (zh) 基于多尺度特征图推理网络的光伏组件热斑缺陷检测方法
CN116664565A (zh) 一种光伏太阳能电池片的隐裂检测方法及系统
CN110458809B (zh) 一种基于亚像素边缘检测的纱线条干均匀度检测方法
CN115187544A (zh) 基于DR-RSBU-YOLOv5的织物瑕疵检测方法
CN117495836A (zh) 一种素色织物疵点检测方法
Yu et al. Research on CNN Algorithm for Monochromatic Fabric Defect Detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination