CN113344903A

CN113344903A - 一种基于变分自编码器的玻璃瑕疵检测方法

Info

Publication number: CN113344903A
Application number: CN202110716109.5A
Authority: CN
Inventors: 李岳阳; 王续澎; 罗海驰
Original assignee: Jiangnan University
Current assignee: Jiangnan University
Priority date: 2021-06-25
Filing date: 2021-06-25
Publication date: 2021-09-03

Abstract

本发明公开了一种基于变分自编码器的玻璃瑕疵检测方法，属于玻璃瑕疵检测技术领域。所述方法通过VAE编码器对玻璃无瑕疵样本进行建模，可以对随机样本进行重构，得到与无瑕疵样本接近的重构图像。检测时，将有瑕疵的玻璃图像输入训练好的VAE编码解码网络生成与无瑕疵样本接近的重构图，再通过比对重构图与原图像间的差异区域确定差异的像素点，即瑕疵区域。对于得到的瑕疵区域会有噪声的干扰，本发明通过投影法与MAD方法结合的方式减少噪声干扰，对于VAE模型生成过程中存在的噪声，通过投影法和MAD方法结合将非目标区域去除，提升分割准确率。

Description

一种基于变分自编码器的玻璃瑕疵检测方法

技术领域

本发明涉及一种基于变分自编码器的玻璃瑕疵检测方法，属于玻璃瑕疵检测技术领域。

背景技术

玻璃制品作为一种常见的工业材料，在生产加工过程中会出现多种情况的瑕疵，如气泡、划痕、脏污、碎裂、边缘凹凸及毛边等缺陷，这些缺陷对于玻璃制品的性能和美观造成了影响。因此需要在玻璃生产过程设定检测机制。

目前大部分方法采用人工或计算机视觉的方式进行玻璃瑕疵检测。人工检测的方式费时费力，不符合工业智能化的发展趋势；而在计算机视觉领域，瑕疵检测的方法通常可分为两类。第一类是采用传统特征提取的方法，针对指定类别的瑕疵，可以通过人为设定不同的算子提取特征，然后进行检测，但此类方法特征提取算子过于依赖于人的主观经验，而且在玻璃生产过程中也无法预测所产生的瑕疵的类型。第二类是基于深度学习的方法，利用卷积神经网络自动提取瑕疵的特征，这些特征相比于传统方法提取的特征有更好的通用性和可迁移性，但这种特征提取主要以数据驱动的方式学习，获得标注样本需要耗费大量的人力。

综上，可以看出进行人工检测的方式显然不能满足目前对玻璃瑕疵检测的要求。而基于传统特征提取的方式和基于深度学习的检测方法在玻璃瑕疵检测中都存在着一些问题。其中，基于传统特征提取的检测的方式，特征提取算子过于依赖于人的主观经验，这种方法仅针对有限类别的瑕疵检测有效。随着深度技术的普及，通过人工标注样本的方式让基于深度学习的方法可以准确地检测出不同种类的瑕疵，但这是一种训练成本较高的方法，需要获取不同类别的大量的瑕疵数据进行训练，这在实际问题中往往是困难的，如果缺乏足够异常数据的信息会影响模型的泛化能力，不能满足检测复杂多变的玻璃瑕疵类型的要求。

发明内容

为了解决上述问题，本发明提供了一种基于变分自编码器的玻璃瑕疵检测方法，所述方法包括：

获取待检测的玻璃制品的灰度图像；

将待检测的玻璃制品的灰度图像输入训练好的VAE重构模型获得重构图像；

将重构图像与原测试图像做像素对比，找到有差异的区域，得到差异分割图；

使用投影法和MAD方法去除所述差异分割图中存在的噪点，得到最终分割图；

根据最终分割图中是否存在瑕疵像素确定待检测的玻璃制品是否存在瑕疵。

可选的，所述VAE重构模型包括编码器和解码器两部分；VAE重构模型的编码器将灰度图像编码为隐变量Z，解码器根据隐变量Z重构得到与灰度图像相似的重构图像；

所述编码器由三层神经网络组成，输入层有16384个神经元，中间层有400个神经元，输出层由两个并行的全连接神经网络组成；输出层的两个并行的全连接神经网络根据输入层输入的待检测的玻璃制品的灰度图像，一个输出20维的均值特征向量，另一个输出20维的方差特征向量；

所述解码网络由两层神经网络组成，第一层有400个神经元，第二层为16384个神经元，最终输出分割二值图像，即与灰度图像相似的重构图像。

可选的，所述编码器将灰度图像编码为隐变量Z服从d维高斯分布：

其中，该分布均值为μ_z，方差为

I是由N(0,1)分布中采样得到特征矩阵，隐变量Z表示为：

每个隐变量的均值μ_z和标准差

μ_z＝f₁(x_i；W_μ) (3)

σ_z＝f₂(x_i；W_σ) (4)

其中，x_i表示灰度图像；W_μ表示编码器的输出层中输出均值特征向量的全连接神经网络的可学习权重；W_σ表示编码器的输出层中输出方差特征向量的全连接神经网络的可学习权重；f₁表示输出层中输出均值特征向量的全连接神经网络的Sigmoid非线性激活函数，f₂表示编码器的输出层中输出方差特征向量的全连接神经网络的Sigmoid非线性激活函数；

解码器通过从隐变量Z中采样经由解码网络生成重构图像

其中，z_i表示隐变量Z的第i维的特征，W_γ表示解码器神经网络的可学习权重；g表示解码器神经网络的的Sigmoid非线性激活函数。

可选的，所述方法还包括训练VAE重构模型；训练过程中，定义VAE重构模型总的损失函数为：

L_T＝L_D+L_KL (6)

其中L_T为总的损失函数，L_D为重构损失，L_KL为用于训练VAE重构模型的样本数据分布与标准正态分布的KL散度；其中L_D重构损失为重构图像与输入的灰度图像的均方误差损失：

用于训练VAE重构模型的样本数据分布与标准正态分布的KL散度L_KL为：

其中d是隐变量Z的维度，μ_(j)和σ_(j)分别表示高斯分布的均值向量和方差向量的第j个分量；利用反向传播算法最小化损失函数完成训练。

可选的，所述用于训练VAE重构模型的样本数据为玻璃制品的无瑕疵的图像数据；训练之前，对样本数据进行随机翻转、随机旋转、随机明暗变化进行扩充处理。

可选的，所述使用投影法和MAD方法去除所述差异分割图中存在的噪点，得到最终分割图，包括：

使用投影法将差异分割图中瑕疵区域的像素分别投影到x和y方向并统计像素值，利用MAD方法找到离群值；MAD的计算方法如下:

X_k'为调整后的值，参数X_m是所有元素的中值；bias_m＝|X_k-X_m|是所有元素与中位数之间的绝对偏差的中位数；参数MAD是绝对偏差的中位数，MAD＝bias_m；参数λ是调节变量。

当x方向或y方向的像素投影值不在[X_m-λMAD,X_m+λMAD]区间时，将该像素点判定为噪点，分别将分割图中x方向和y方向噪点以外的点去除，得到去除噪点干扰后的最终分割图。

可选的，训练过程中，调节变量λ设为3。

可选的，训练过程中，所述用于训练VAE重构模型的样本数据为128*128像素的灰度图像。

本申请还提供一种上述基于变分自编码器的玻璃瑕疵检测方法在玻璃生产技术领域中的应用方法，所述方法采用上述方法检测所生产出的玻璃是否存在瑕疵。

本发明有益效果是：

通过利用变分自编码器在无监督的条件下实现对玻璃制品多种瑕疵的检测，变分自编码器的本质是生成模型，通过VAE编码器对玻璃无瑕疵样本进行建模，可以对随机样本进行重构，得到与无瑕疵样本接近的重构图像。检测时，有瑕疵的玻璃图像输入训练好的VAE编码解码网络可以生成与无瑕疵样本接近的重构图，再通过比对重构图与原图像间的差异区域确定差异的像素点，即瑕疵区域。对于得到的瑕疵区域会有噪声的干扰，本发明通过投影法与MAD方法结合的方式减少噪声干扰，对于VAE模型生成过程中存在的噪声，通过投影法和MAD方法结合将非目标区域去除，提升分割准确率。本申请方法通过采用一种无监督的学习方式检测瑕疵，无需对瑕疵样品进行标注训练，满足实际工业生产中的需要。而且所生成的模型具备一定的鲁棒性，可以检测出多种玻璃瑕疵类型。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一种基于变分自编码器的玻璃瑕疵检测方法的流程图。

图2为本发明实施例中VAE方法的原理图。

图3为本发明用于VAE训练的无瑕疵玻璃样品图。

图4为本发明中测试样品的解码重构图。

图5为VAE解码重构图与测试图像的差异分割图。

图6为去除背景干扰后的分割结果图。

图7为不同玻璃瑕疵类型的分割结果。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

实施例一：

本实施例提供一种基于变分自编码器的玻璃瑕疵检测方法，所述方法包括：

获取待检测的玻璃制品的灰度图像；

所述VAE重构模型包括编码器和解码器两部分；VAE重构模型的编码器将灰度图像编码为隐变量Z，解码器根据隐变量Z重构得到与灰度图像相似的重构图像；

实施例二：

本实施例提供一种基于变分自编码器的玻璃瑕疵检测方法，参见图1，所述方法包括：

步骤1：图像数据集划分：对17000张采集的128*128像素玻璃制品灰度图像划分为训练数据集和测试数据集。其中，训练数据集使用1000张无瑕疵的图像数据，测试数据集中包含无瑕疵图像数据和多种有瑕疵图像数据16000张。

步骤2：训练基于VAE的重构模型，利用反向传播算法最小化由重构误差和分布间的KL散度组成的损失函数完成训练，得到VAE模型并保存。为了增加模型的泛化能力，这里对训练数据使用了数据增强的方法。

进一步的，在步骤2中使用的VAE模型具体为：

变分自编码器包括编码器和解码器两部分。编码器通过神经网络将图像编码为隐变量Z，该变量服从高斯分布，高斯分布产生两个向量：一个是均值向量，另一个是标准差向量。Z服从d维高斯分布：

其中，该分布均值为μ_z，方差为

I是由N(0,1)分布中采样得到特征矩阵，隐变量Z表示为：

解码器是将隐变量Z重构成与原始图像相似的新样本。结构上，变分自编码器的编码网络的输出层由两个并行的全连接神经网络组成，网络通过学习得到每个隐变量的均值μ_z和标准差

μ_z＝f₁(x_i；W_μ) (3)

σ_z＝f₂(x_i；W_σ) (4)

其中，x_i表示灰度图像；W_μ表示编码器的输出层中输出均值特征向量的全连接神经网络的可学习权重；W_σ表示编码器的输出层中输出方差特征向量的全连接神经网络的可学习权重；f₁表示输出层中输出均值特征向量的全连接神经网络的Sigmoid非线性激活函数，f₂表示编码器的输出层中输出方差特征向量的全连接神经网络的Sigmoid非线性激活函数。

解码器通过从隐变量Z中采样经由解码网络生成重构图像：

定义总的损失函数为：

L_T＝L_D+L_KL (6)

其中L_T为总的损失函数，L_D为重构损失，L_KL为样本数据分布与标准正态分布的KL散度。其中L_D重构损失为重构样本与原样本像素的均方误差损失：

其中L_KL为样本数据分布与标准正态分布的KL散度：

在步骤2中使用的编码网络由三层神经网络组成，输入图像为128*128单通道灰度图像，即输入层有16384个神经元，中间层有400个神经元，输出层由两个并行的全连接神经网络组成，一个输出20维的均值特征向量，另一个输出20维的方差特征向量。解码网络由两层神经网络组成，第一层有400个神经元，第二层为16384个神经元，最终输出128*128的分割二值图像，VAE原理图如图2所示。

在步骤2中使用数据增强的方法具体为：为了增加模型的泛化性能，这里对训练数据使用了随机翻转，随机旋转，随机明暗变化等变换方法，等同于对训练数据做了扩充处理。

步骤3：使用VAE模型对测试数据进行推理，得到重构图像。

在模型推理阶段，测试图像通过训练好的VAE模型可以得到重构图像，所获得的重构图像和原测试图像如图3、图4所示。

步骤4：将重构图像与原测试图像做像素对比，找到有差异的区域，得到差异分割图如图5所示。

步骤5：对差异分割图中存在的噪点，使用投影法和MAD(Median AbsoluteDeviation)方法去除噪点的干扰。

投影法将分割图中瑕疵区域的像素分别投影到x和y方向并统计像素值，利用MAD方法找到离群值(即噪点)，对非瑕疵区域的噪点进行剔除，得到最终分割图。若最终分割图中无瑕疵像素则判定原图像为无瑕疵类别。

在步骤5中使用的投影法并利用MAD选取阈值进行噪点剔除的过程具体为：对于得到的分割二值图像，对其像素点分别计算x方向和y方向的像素统计图，分别使用MAD方法得到其离群点，在统计学中，MAD是单变量数值数据样本偏差的稳健度量。该方法是通过发现某一元素与中值之间的偏差是否在合理范围内来确定每个元素是否为离群点。MAD的计算方法如下:

X_k'为调整后的值，参数X_m是所有元素的中值。bias_m＝|X_k-X_m|是所有元素与中位数之间的绝对偏差的中位数。参数MAD是绝对偏差的中位数，MAD＝bias_m。参数λ是调节变量，这里λ设为3。在本方法中，当x方向或y方向的像素投影值不在[X_m-λMAD,X_m+λMAD]区间时，将这些点判定为离群点，分别将分割图中x方向和y方向离群点以外的点去除，得到去除噪点干扰后的结果，最终分割结果图如图6所示。

模型的评价指标由漏检率(escape)、过检率(overkill)和平均交并比(mIOU)加权组成。其中，漏检率是指未检测出有瑕疵样品占所有有瑕疵样品总数的百分比；过检率是指无瑕疵样品检测出有瑕疵占所有无瑕疵样品总数的百分比；漏检率、过检率是有瑕疵或无瑕疵的检测指标，考察瑕疵分类检测能力。平均交并比考察的是分割图像与原始图像瑕疵区域的重叠准确性。得分计算公式如下：

score＝0.5*(1-escape)+0.3*(1-overkill)+0.2*(mIOU) (10)

本申请提供的方法可以对不同的玻璃瑕疵类别进行检测，通过16000张测试图像的测试，最终score为93，针对不同瑕疵的检测结果如图7所示；图7中，a为玻璃表面内部的原始检测图像，其中包含了玻璃内部的各种瑕疵类型，b为a对应的检测结果图像；c为玻璃表面边缘的原始检测图像，其中包含了玻璃边缘的各种瑕疵类型，d为c对应的检测结果图像。可以看出本方法可以准确地检测出玻璃内部和边缘的瑕疵区域，模型对不同类别玻璃瑕疵的检测具有较好的鲁棒性。

结果表明，本发明一种基于变分自编码器的玻璃瑕疵检测方法可以在无监督的学习方式下实现较好的检测效果。模型具备一定的鲁棒性，可以检测出多种玻璃瑕疵类型。通过无瑕疵样本训练好的VAE模型可同时完成识别和分割任务，对于VAE模型生成过程中存在的噪声，通过投影法和MAD方法结合将非目标区域去除，提升分割准确率。

本发明实施例中的部分步骤，可以利用软件实现，相应的软件程序可以存储在可读取的存储介质中，如光盘或硬盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。