WO2022120665A1

WO2022120665A1 - 一种基于深度学习的电容缺陷智能检测方法

Info

Publication number: WO2022120665A1
Application number: PCT/CN2020/135051
Authority: WO
Inventors: 蔡洪斌; 卢光辉; 王涵; 卢平悦; 黄娅婷; 李一帆; 范云翼; 王博洋; 伏彪
Original assignee: 电子科技大学
Priority date: 2020-12-09
Filing date: 2020-12-09
Publication date: 2022-06-16

Abstract

本发明是一种基于深度学习的电容缺陷智能检测方法。该方法包括：数据集裁剪、数据扩充、标签平滑、构建网络与参数、训练网络模型与参数、应用网络模型测试数据以及后处理。该方法使用深度学习框架提取特征，并对提取的特征进一步加工处理，实现对多尺度缺陷电容的检测，提升了检测的准确率，同时提升了检测的速度，也避免了使用人眼辨别困难大、成本高，以及传统图像处理和计算机视觉等方法的精确度低等问题。

Description

一种基于深度学习的电容缺陷智能检测方法

技术领域

本发明属于计算机智能检测领域，尤其涉及一种基于深度学习的电容缺陷智能检测方法。

背景技术

随着电子信息产业的蓬勃发展，电子器件作为该产业的重要组成部件也逐渐得到关注。电子器件是电子产品的核心单元，然而任何细小的缺陷都可能影响整个产品的使用，甚至对使用者造成重大损失，所以生产厂家会采取提高工艺技术等方法来降低缺陷率。尽管这些方法能从一定程度上降低缺陷率，但是不可避免地还是可能会产生少量的缺陷电容，进而针对电子器件的缺陷检测就显得尤为重要了。传统的缺陷检测方案是依靠人眼对每一个器件进行判别，这不仅要耗费巨大的人力成本，而且在人眼疲劳后也无法保证检测的效率和准确率。因此，提出一种智能的缺陷检测方法意义重大。

本发明仅针对电容内部的物理缺陷，如气泡、空洞、裂纹、杂质等进行判断检测。论文“基于LabVIEW的电容器缺陷检测系统研究”采用稀疏中值滤波、混合灰度变换和全局阈值分割的图像处理等算法，实现了一种基于LabVIEW的电容缺陷检测系统。论文“基于机器视觉的电容器表面缺陷检测系统的研究与开发”采用了一种基于Canny算子的改进算法研发的一套电容器外观缺陷检测系统。论文“机器视觉在电容器外观缺陷检测中的应用”采用图像采集、预处理等方式匹配定位电容区域，并采用阈值分割和模板匹配检测缺陷，并通过Blob分析数据得到检测结果。发明专利“一种基于机器视觉的电容缺陷检测方法”采用转动电容获得电容表面图像数据集、电容表面编码模板、缺陷检测等步骤完成对电容的检测。发明专利“一种电解电容外观缺陷检测装置”采用电容的全方位无死角采集的图像来判断是否存在缺陷。

以上所述的技术方案均采用图像处理或者计算机视觉的方法实现对缺陷电容的筛选。此类检测方法的设计原理比较简单，对于一些较明显的缺陷可以正确检出，但是也存在一个缺点就是鲁棒性差。在实际生产过程中，电容图像可能存在大量的干扰因素，此时通过传统方案难以得到更加精确的结果。

本发明主要针对采用超声波成像采集得到的电容图像，使用深度学习框架进行缺陷智能检测的方法。该方法具备良好的鲁棒性，即使在图像存在大量噪声点，或者电容器件大小不一的情况下，也能获得较好的预测结果。

发明内容

本发明提供了一种基于深度学习的电容缺陷智能检测方法，包括以下主要步骤：

步骤1，数据集裁剪，将原始超声电容图像长宽均扩充为512的整数倍数，并将其裁剪为若干512×512的图片。

步骤2，数据扩充，采用图像处理方法对上一步得到的数据进行处理，得到更加丰富的数据集。此步骤不仅能扩充数据集数量，还能在一定程度上缓解“过拟合”问题。

本步骤主要包括：

步骤2.1，图像平移、旋转以及缩放处理，将原始图片沿任意方向平移任意长度或将原始图像沿任意方向旋转任意角度或将原始图像缩小或放大。若变换后的图片超过512×512，则直接将其截断，反之，若小于512×512，则用白底填充。

步骤2.2，添加高斯噪声，高斯噪声是一个均值为0，方差为

的正态分布，是一个加性噪声。此步骤可能会导致有较低的信息失真水平，但是却能极大地增加网络的学习能力，避免发生“过拟合”的现象。

步骤3，标签平滑，对训练样本标签执行预处理，提高网络的泛化能力。

步骤4，构建网络模型与参数，结合主流特征提取网络架构，运用注意力机制、多重特征融合等特征层处理技巧搭建本发明网络模型。

本步骤主要包括：

步骤4.1，构建主干网络，主干网络用于对输入数据做初步的特征提取，不断增加网络深度，获得不同尺度的特征图。

步骤4.2，构建特征层处理结构，特征层处理结构用于对主干网络中提取的特征层作进一步的加工，得到语义更加丰富的特征图。

步骤4.3，构建网络的输出结构，根据检测任务的具体情况和网络设计方式，需要设计针对性的输出结果。

步骤5，训练网络模型与参数，使用上述步骤得到的数据集和网络模型训练网络参数，得到最终训练数据。

步骤6，应用网络模型测试数据，使用上一步得到的训练数据，对输入数据集测试，输出预测值。

步骤7，后处理，对网络的输出值进一步解码、非极大抑制以及效果展示。

本步骤主要包括：

步骤7.1，解码，根据网络输出结果，对该结果进行解码操作，获得真实回归框信息。

步骤7.2，非极大抑制，通过非极大抑制法，去除重叠较多的重叠框。

步骤7.3，效果展示，得出最终预测框后，采用画图工具绘制回归框的位置、标签以及置信度等信息。

附图说明

图1示出了本发明一种基于深度学习的电容缺陷智能检测方法的基本流程。

图2示出了本发明一种基于深度学习的电容缺陷智能检测方法的具体流程。

图3示出了本发明一种基于深度学习的电容缺陷智能检测方法的主干网络结构示意图。

图4示出了本发明一种基于深度学习的电容缺陷智能检测方法的主干网络结构图中Layer1所示结构图。

图5示出了本发明一种基于深度学习的电容缺陷智能检测方法的主干网络结构图中的Layer2～Layer6结构示意图。

图6示出了本发明一种基于深度学习的电容缺陷智能检测方法的特征处理层结构的示意图。

具体实施方式

下面结合附图和实施例对本发明优先实施方式进一步说明。

图1所示的流程图给出了本发明试试的基本流程，图2所示的流程图给出了本发明整个实施的具体过程：

本步骤主要包括：

步骤2.2，添加高斯噪声，高斯噪声是一个均值为0，方差为

步骤3，标签平滑，对训练样本标签执行预处理，提高网络的泛化能力。对于分类任务，常常将两个类别用n个数组元素组成的向量来表示每个类别的概率，在设置训练标签时，向量中只有0或者1，表明必定不是该类别或者必定是该类别。对于损失函数，需要用预测概率去拟合真实概率，然后上述标签方式会带来两个问题：(1)无法保证模型的泛化能力，容易造成过拟合；(2)全概率和零概率鼓励所属类别和其他类别之间的距离尽可能大，由梯度有界可知，这种情况会导致模型过于相信预测的类别。标签平滑可以避免上述问题。其具体做法为，按照公式(1)修改标签，式中∈表示平滑因子，是一个超参数。

new_label＝old_label*(1-∈)+∈/num_class (1)

本步骤主要包括：

步骤4.1，构建主干网络，主干网络用于对输入数据做初步的特征提取，不断增加网络深度，获得不同尺度的特征图。主干特征网络如图3所示。特征提取网络的输入图片大小为512×512，一共执行6大步特征提取操作。其中Layer1层的主要作用是提升特征通道数，其组成如图4所示，Conv2D的作用是使用32个大小3×3的卷积核处理输入数据，将通道数提升为32维。后续经过一层Batch Normalization(BN)层处理经过卷积后的特征层。BN层的作用是，对于每一个隐藏层的神经元，把逐渐向非线性函数映射后的区间极限饱和区靠近的输入分布强制拉回到均值为0，方差为1的标准正态分布上，使得非线性变换函数的输入值落入对输入比较敏感的区域，以此避免“梯度消失”的问题。BN层的具体实施过程如公式(2)～(5)所示，

首先初始化待学习参数γ和β，并输入mini-batch的数据集B(x1,…xm)；按照式(2)计算mini-batch的均值μ _β；按照式(3)计算mini-batch的方差

按照式(4)得到变换后的值

按照式(5)得出最终的偏移结果y _i。主干特征提取网络的Layer2～Layer6十分相似，其组成部分如图5所示。由图可知，从数据输入后首先经过了两个分支曾，左分支为一个大的残差层，右分支为X个残差结构和注意力结构(Squeeze-and-Excitation Block,SE Block)的叠加。残差结构使用恒等映射变换把上一层的输出直接传送到后面层的输出结构中，使得将学习目标由h(X)变为了h(X)-X，即前一步的残差，在反向传播的时候始终保持一个很大的值。SE Block主要包含Squeeze和Excitation两个部分。Squeeze操作就是一个全局操作，其公式如式(6)所示。该公式将H×W×C的输入转化为1×1×C的输出，这一步的结果相当于C个特征图的分布情况，也称作全局信息。Excitation操作如公式(7)所示，先用W1乘以先用W1乘以Squeeze得到的结果z(这是一个全连接层操作)，W1的维度是C/r×C，这个r是一个缩放参数，本算法取值为16，这个参数的目的是为了减少通道个数从而降低计算量。(W1z)的结果为1×1×C/r，经过Relu激活层后，输出维度不变，之后与W2相乘(这也是全连接操作)，W2的维度是C×C/r，因此输出维度为1×1×C，最后通过sigmoid函数激活得到s。将得到的s乘以原始特征图，即可得到最终结果，其公式如式(8)所示，Sc是一个数，也是该通道的权重值，u _c是一个二维矩阵，相当于将该二维矩阵的每一个值都乘以S _c。通过SE Block可以让网络更加专注于有效的通道，使得检测更加准确。

s＝F _ex(z,W)＝σ(g(z,W))＝σ(W ₂δ(W ₁z)) (7)

步骤4.2，构建特征层处理结构，特征层处理结构用于对主干网络中提取的特征层作进一步的加工，得到语义更加丰富的特征图。本发明特征层处理结构如图6所示，该结构使用主干特征提取结构中的后三层特征输出作为输入，将Layer6层的输出经过卷积后分别向上采样2倍和4倍，并分别与Layer5和Layer4输出的特征层融合；将Layer4层的输出经过下采样和卷积后与Layer5特征层的输出融合。这样的连接方式具备以下两个优势：(1)充分利用多尺度特征，引入多尺度跳跃连接，该连接结合了来自尺度的低级语义和高级语义；(2)进行深监督训练，从全面的聚合特征图中学习层次表示，优化了混合损失韩式以增强边界信息。

步骤4.3，构建网络的输出结构，根据检测任务的具体情况和网络设计方式，需要设计针对性的输出结果。经过特征处理结构后，将得到的三个大小分别为64×64×128、32×32×256和16×16×512的特征图。所以网络对应输出三个维度：64×64×18、32×32×18以及16×16×18，他们分别表示三个不同尺度的目标，其中“18”表示3个先验框×(4个回归框预测值+1个置信度+1个检测类别)。

步骤5，训练网络模型与参数，使用上述步骤得到的数据集和网络模型训练网络参数，得到最终训练数据。经过上述几步后，现已获得完成的数据集和网络结构。此步骤设置了学习超参数后，即可开始训练。常见的超参数有：迭代次数、学习率、验证集与训练集分配比例以及batch size大小。网络训练完成后，即可得到参数权重信息。

本步骤主要包括：

步骤7.1，解码，根据网络输出结果，对该结果进行解码操作，获得真实回归框信息。本发明深度学习网络的最终输出结果包括：回归框预测信息、置信度、种类信息。其中回归框预测信息并非真实的回归框坐标点，而是先验框的平移尺度和缩放尺度，需要经过公式(9)～(12)解码得到最终预测回归框的中心点坐标和长宽信息。

步骤7.2，非极大抑制，通过非极大抑制法去除重叠较多的回归框。对于每一个回归框，计算当前回归框与其它回归框的交并比(Intersection over Union,IoU)，如果IoU≥0.3并且该回归框的预测标签为同一个物体，则保留置信度较高的回归框，丢弃置信度较低的回归框。

步骤7.3，效果展示，得出最终预测框后，采用画图工具绘制回归框的位置、标签以及置信度等信息。对于每一个预测框，如果其置信度＞0.5，则在原图上绘制其回归框的位置、标签类别以及置信度值。

Claims

一种基于深度学习的电容缺陷智能检测方法，其特征在于，包括以下步骤：

步骤1，数据集裁剪，将原始超声电容图像长宽均扩充为512的整数倍数，并将其裁剪为若干512×512的图片。

步骤2，数据扩充，采用图像处理方法对上一步得到的数据进行处理，得到更加丰富的数据集。

步骤3，标签平滑，对训练样本标签执行预处理，提高网络的泛化能力。

步骤4，构建网络模型与参数，结合主流特征提取网络架构，运用注意力机制、多重特征融合等特征层处理技巧搭建本发明网络模型。

步骤5，训练网络模型与参数，使用上述步骤得到的数据集和网络模型训练网络参数，得到最终训练数据。

步骤6，应用网络模型测试数据，使用上一步得到的训练数据，对输入数据集测试，输出预测值。

步骤7，后处理，对网络的输出值进一步解码、非极大抑制以及效果展示。
根据权利要求1中所述的一种基于深度学习的电容缺陷智能检测方法，其特征在于所述的步骤1中数据集裁剪，先将原数据图片扩充为长宽均为512整数倍数的图片后，将其裁剪为若干512×512的图片。
根据权利要求1中所述的一种基于深度学习的电容缺陷智能检测方法，其特征在于所述步骤2中数据扩充，采用图像处理方式对上一步得到的数据进行处理，得到更加丰富的数据集。所述的步骤2进一步包括：

步骤2.1，图像平移、旋转以及缩放处理，将原始图片沿任意方向平移任意长度或将原始图像沿任意方向旋转任意角度或将原始图像缩小或放大。若变换后的图片超过512×512，则直接将其截断，反之，若小于512×512，则用白底填充。

步骤2.2，添加高斯噪声，高斯噪声是一个均值为0，方差为
的正态分布，是一个加性噪声。
根据权利要求1中所述的一种基于深度学习的电容缺陷智能检测方法，其特征在于所述步骤3中标签平滑，使用公式(1)处理样本标签。
根据专利要求1中所述的一种基于深度学习的电容缺陷智能检测方法，其特征在于所述步骤4中构建网络模型与参数，结合主流特征提取网络架构，运用注意力机制、多重特征融合等特征层处理技巧搭建本发明网络模型。所述步骤4 进一步包括：

步骤4.1，构建主干网络，主干网络用于对输入数据做初步特征提取，不断增加网络深度，获得不同尺度的特征图。主干网络主要分为六大层次，其中Layer1网络层结构如图4所示，其余Layer2～Layer6层相似，不同之处在于残差结构和SE Block的重复次数，如图5所示。

步骤4.2，构建特征层处理结构，特征处理结构用于对主干网络中提取的特征层作进一步加工，得到语义更加丰富的特征图。本发明特征处理结构如图6所示，该结构使用后三层特征输出作为输入，由图所示的方式跳跃连接，获得语义更加充分的特征图。

步骤4.3，构建网络的输出结构，本发明网络的输出有三个维度，分别为：64×64×18、32×32×18以及16×16×18，用此三个输出检测不同尺度的目标。
根据专利要求1中所述的一种基于深度学习的电容缺陷智能检测方法，其特征在于所述步骤7中后处理，对网络的输出值进一步解码、非极大抑制以及效果展示。所述步骤7进一步包括：

步骤7.1，解码，根据网络输出结果，对该结果进行解码操作，获得真实回归框信息。解码步骤如公式(9)～(12)所示。

步骤7.2，非极大抑制，通过非极大抑制法去除重叠较多的回归框。对于每一个回归框，计算当前回归框与其它回归框的IoU，如果IoU≥0.3并且与该回归框预测标签为同一类别是，保留置信度较高的回归框，丢弃置信度较低的回归框。

步骤7.3，效果展示，得出最终预测框，采用画图工具绘制回归框位置、标签以及置信度等信息。对于每一个预测框，如果其置信度＞0.5，则在原图上绘制其回归框的位置、标签类别以及置信度。