CN116596891A

CN116596891A - 基于半监督多任务检测的木地板颜色分类及缺陷检测方法

Info

Publication number: CN116596891A
Application number: CN202310578316.8A
Authority: CN
Inventors: 倪超; 端木安宁; 朱婷婷; 李振业; 崔闻琪; 薛胜
Original assignee: Nanjing Forestry University
Current assignee: Nanjing Forestry University
Priority date: 2023-05-22
Filing date: 2023-05-22
Publication date: 2023-08-15

Abstract

本发明涉及一种基于半监督多任务检测的木地板颜色分类及缺陷检测方法，属于图像处理领域。该方法包括：对输入图像进行缺陷色彩校正；标记少量图像作为数据集输入Color‑RCNN模型训练，实现颜色分类和缺陷检测；训练半监督预测监视网络判别伪标签是否准确的；用Color‑RCNN模型预测剩余的未标记图像，实现颜色分类，生成伪标签，用半监督预测监视网络对伪标签进行判别，将正确的检测框留下，过滤掉错误的检测框；将识别正确的图像加入数据集，重新输入Color‑RCNN模型训练，预测剩余的未标记图像，直至未标记图像全部获得正确标签，实现半监督学习。本发明在图像识别的过程中，通过半监督学习，使用少量人工标记和大量未标记的木地板图像训练出模型，提高了分选的效率。

Description

基于半监督多任务检测的木地板颜色分类及缺陷检测方法

技术领域

本发明属于木地板颜色分类和缺陷检测领域，具体涉及基于半监督多任务检测的木地板颜色分类及缺陷检测方法。

背景技术

木地板生产加工过程中，颜色分类和缺陷检测是两个重要的技术领域。在传统方法的基础上，随着计算机视觉和人工智能技术的发展，这两个领域得到了很大的改进。对于颜色分类，图像处理技术、特征提取技术和机器学习技术的应用，使得木地板颜色的分类更加准确高效；对于缺陷检测，图像处理技术、特征提取技术和深度学习技术的应用，使得木地板缺陷的检测更加准确和自动化。目前，主流的木地板分类和检测模型的缺点是需要大量经过人工标记的数据集，花费的时间多，效率慢。

在此基础上，有公开号CN103761743A的发明专利申请公开了一种基于深度学习的地板缺陷检测方法，该检测方法自动提取关键特征免去人工提取特征环节，提高了效率，但仍需要大量人工标记图像作为数据集。

发明内容

发明目的：针对现有技术存在的不足，提供一种基于半监督多任务检测的木地板颜色分类及缺陷检测方法。

技术方案：为了解决上述技术问题，本发明采用的技术方案如下：

采集木地板图像利用基于灰度世界算法和完美反射算法结合的色彩矫正公式进行缺陷色彩校正；标记少量图像作为数据集输入基于Faster-RCNN改进的Color-RCNN模型进行训练，实现木地板的颜色分类和缺陷检测；将有标记图像中的检测框作为正样本，在未标记图像上随机画框作为负样本，训练基于卷积神经网络设计的半监督预测监视网络判别伪标签是否准确；用训练好的Color-RCNN模型预测剩余的未标记图像，实现颜色分类，生成伪标签，利用半监督预测监视网络对伪标签进行判别，将正确识别的检测框留下，过滤掉错误的检测框；将识别正确的图像加入数据集，重新输入Color-RCNN模型训练，预测剩余的未标记图像，直至未标记图像全部获得可靠标签，实现半监督学习。

作为优选，包括以下步骤：

S1：采集多种颜色并且有缺陷的木地板图像，标注少量木地板中的颜色类别以及框选缺陷位置作为有标记图像，剩余作为未标记图像，由于缺陷可能对木地板颜色识别造成影响，根据缺陷色彩校正公式矫正木地板颜色，见公式1-4；

S2：利用有标记图像训练出一个Color-RCNN模型，见图3，实现木地板的颜色分类和缺陷检测；

S3：将有标记图像的检测框作为正样本，在部分图像上随机画框作为负样本，构建一个包含正负样本的数据集，训练一个半监督预测监视网络，见图4，输入为ROI的特征表示和ROI的类别，输出为该ROI是否为可靠的伪标签，判别伪标签是否准确；

S4：用训练好的Color-RCNN模型预测剩余的未标记图像，实现颜色分类，生成伪标签，利用半监督预测监视网络对伪标签进行判别，将正确识别的检测框留下，过滤掉错误的检测框；

S5：筛选后的未标记图像和有标记图像结合起来，重新训练Color-RCNN模型，预测剩余的未标记图像，直至未标记图像全部获得可靠标签，实现半监督学习。

作为优选，在所述步骤S1中，使用基于灰度世界和完美反射结合的色彩矫正器矫正木地板颜色，将缺陷占比面积作为影响参数，缺陷占比面积的分布情况可以用一个核函数g(x)来描述，可以将其作为一个权重因子，与原始的颜色校正公式相乘，通过对核函数进行傅里叶变换，可以将其从时域转换到频域，以便更好地对图像进行颜色校正。计算RGB三个通道各自的均值，得到R_avg、G_avg和B_avg，计算RGB三个通道各自的最大值，得到R_max、G_max和B_max，选用高斯核函数。基于灰度世界算法和完美反射算法结合的色彩矫正公式，如下所示：

其中，R_corr表示考虑了缺陷占比面积和分布情况的R通道校正值，G_corr表示考虑了缺陷占比面积和分布情况的G通道校正值，B_corr表示考虑了缺陷占比面积和分布情况的B通道校正值，R_avg表示R通道平均值，G_avg表示G通道平均值，B_avg表示B通道平均值，R_max表示R通道最大值，G_max表示G通道最大值，B_max表示B通道最大值，G(f)表示核函数g(x)的傅里叶变换，g(x)表示描述缺陷占比面积的分布情况的高斯核函数，f表示频率，A表示木地板中多有缺陷占比面积的总和，x表示单个缺陷占比面积，将傅里叶变换和反变换的过程进行展开，可以得到：

接着，可以将指数项进行合并，得到：

最后，可以将x从积分中提出来，得到：

其中，表示核函数在频域中的值，可以通过傅里叶反变换得到。当缺陷占比面积分布更加均匀时，/>的值会更加集中在低频部分，反之则会更加分散在高频部分。因此，/>的值可以用来表示缺陷占比面积分布对颜色的影响程度，在色彩校正公式中，将/>与x进行卷积或积分，就可以得到考虑缺陷占比面积分布影响后的色彩校正值。

作为优选，所述步骤S2中，基于Faster-RCNN设计一个Color-RCNN模型。利用一个色彩预测网络用于颜色分类，该网络包括卷积层和全连接层。输入为经过PyramidROIAlign输出的缺陷区域的ROI(感兴趣区域)以及FPN_Classifier网络的输出结果，输出为颜色分类结果。将FPN_Classifier网络与色彩预测网络级联，再将FPN_Classifier网络输出的ROI的分类和BB回归结果输入色彩预测网络，使其可以同时进行目标检测和颜色分类。

作为优选，所述步骤S2的具体实现方法如下：

S21：首先将有标记图像输入，进行数据预处理；

S22：将处理好的图像传入ResNet-101+FPN中，获得相应的feature map，并提取颜色分类器的输入特征；

S23：通过feature map中的每一点设定ROI，获得多个ROI候选框；

S24：对这些多个ROI候选框送到RPN中进行二值分类(前景或后景)和BB回归(Bounding-box regression)，过滤掉一部分候选的ROI；

S25：对剩下的ROI进行ROIAlign操作，采用双线性插值将每个ROI精确地转换为相同的大小，先将原图和feature map的pixel对应起来，然后将feature map和固定的feature对应起来；

S26：将经过Pyramid ROIAlign的ROI输入FPN_Classifier网络，得到每个ROI的分类和BB回归结果；

S27：将经过Pyramid ROI Align的ROI以及每个ROI的分类和BB回归结果输入色彩预测网络，得到颜色分类结果；

S28：将颜色分类的结果与目标检测的结果合并，得到最终的目标检测和颜色分类结果，计算目标检测和颜色分类的损失函数，使用反向传播算法更新网络参数，重复执行步骤S21-S28，直到达到预定的训练轮数或收敛。

作为优选，所述步骤S3的具体实现方法如下：

S31：将有标记图像的检测框作为正样本，在未标记图像上随机画框作为负样本，构建一个包含正负样本的数据集；

S32：对半监督预测监视网络进行训练，使用正样本和负样本数据集进行二分类，训练结束后，该网络可以对未标记图像生成的伪标签进行可靠性判断；

S33：通过半监督预测监视网络筛选出可靠的伪标签，加入有标记的数据集中重新训练Color-RCNN，不可靠的伪标签作为未标记数据集的一部分，继续进行半监督学习。

作为优选，所述的半监督预测监视网络其结构包括卷积层、池化层和全连接层，其中卷积层1使用32个3x3的卷积核，步长为1，采用ReLU激活函数，输入图像数据，提取图像特征，池化层1使用2x2的最大池化核，步长为2，进行下采样，减小特征图尺寸；卷积层2将池化层1的结果作为输入，提取更高级别的特征，卷积层2使用64个3x3的卷积核，步长为1，采用ReLU激活函数，池化层2使用2x2的最大池化核，步长为2，进行下采样，减小特征图尺寸；卷积层3将池化层2的结果作为输入，继续提取高级别特征，卷积层3使用128个3x3的卷积核，步长为1，采用ReLU激活函数，池化层3使用2x2的最大池化核，步长为2，进行下采样，减小特征图尺寸；经过一个全连接层1，将特征图展开成一维向量，进行全连接操作，共有256个神经元，采用ReLU激活函数；经过一个Dropout层，随机丢弃50％的神经元，减少过拟合；最后经过一个全连接层2，作为输出层，采用Sigmoid激活函数，对伪标签进行二分类，输出为0代表错误的伪标签，输出为1代表正确的伪标签。

有益效果：与现有技术对比，本发明的优点包括：

(1)利用有标记数据和未标记数据的信息，充分利用了数据资源，提高了模型的泛化能力。

(2)提出色彩矫正公式对木地板进行颜色矫正，提出Color-RCNN模型对木地板进行颜色分类和缺陷检测，提高了模型的分类准确性以及伪标签的质量。

(3)提出半监督预测监视网络对伪标签进行判别，可以过滤掉错误的伪标签，加强伪标签的准确性。

附图说明

图1是本发明的木地板缺陷检测图；

图2是木地板分类及检测流程示意图；

图3是本发明的Color-RCNN网络结构图；

图4是本发明的半监督预测监视网络结构图。

具体实施方式

下面结合具体实施例，进一步阐明本发明，实施例在以本发明技术方案为前提下进行实施，应理解这些实施例仅用于说明本发明而不用于限制本发明的范围。

本实施例的基于半监督多任务检测的木地板颜色分类及缺陷检测方法，其特征在于，采集木地板图像利用基于灰度世界算法和完美反射算法结合的色彩矫正公式进行缺陷色彩校正；标记少量图像作为数据集输入基于Faster-RCNN改进的Color-RCNN模型进行训练，实现木地板的颜色分类和缺陷检测；将有标记图像中的检测框作为正样本，在未标记图像上随机画框作为负样本，训练基于卷积神经网络设计的半监督预测监视网络判别伪标签是否准确；用训练好的Color-RCNN模型预测剩余的未标记图像，实现颜色分类，生成伪标签，利用半监督预测监视网络对伪标签进行判别，将正确识别的检测框留下，过滤掉错误的检测框；将识别正确的图像加入数据集，重新输入Color-RCNN模型训练，预测剩余的未标记图像，直至未标记图像全部获得可靠标签，实现半监督学习。主要包括以下步骤：

步骤1：采集多种颜色并且有缺陷的木地板图像，标注少量木地板中的颜色类别以及框选缺陷位置作为有标记图像，剩余作为未标记图像，由于缺陷占木地板表面面积过大时会对颜色分类造成影响，使用基于灰度世界和完美反射结合的色彩矫正器矫正木地板颜色，基于灰度世界算法和完美反射算法结合的色彩矫正公式，如下所示：

其中，R_corr表示考虑了缺陷占比面积和分布情况的R通道校正值，G_corr表示考虑了缺陷占比面积和分布情况的G通道校正值，B_corr表示考虑了缺陷占比面积和分布情况的B通道校正值，R_avg表示R通道平均值，G_avg表示G通道平均值，B_avg表示B通道平均值，R_max表示R通道最大值，G_max表示G通道最大值，B_max表示B通道最大值，G(f)表示核函数g(x)的傅里叶变换，g(x)表示描述缺陷占比面积的分布情况的高斯核函数，A表示木地板中多有缺陷占比面积的总和，x表示单个缺陷占比面积，df表示积分变量，将傅里叶变换和反变换的过程进行展开，可以得到：

接着，可以将指数项进行合并，得到：

最后，可以将x从积分中提出来，得到：

步骤2：利用有标记图像训练出一个Color-RCNN模型，见图3，实现木地板的颜色分类和缺陷检测。具体实现步骤如下：

步骤21：首先将有标记图像输入，进行数据预处理；

步骤22：将处理好的图像传入ResNet-101+FPN中，获得相应的feature map，并提取颜色分类器的输入特征；

步骤23：通过feature map中的每一点设定ROI，获得多个ROI候选框；

步骤24：对这些多个ROI候选框送到RPN中进行二值分类(前景或后景)和BB回归(Bounding-box regression)，过滤掉一部分候选的ROI；

步骤25：对剩下的ROI进行ROIAlign操作，采用双线性插值将每个ROI精确地转换为相同的大小，先将原图和feature map的pixel对应起来，然后将feature map和固定的feature对应起来；

步骤26：将经过Pyramid ROIAlign的ROI输入FPN_Classifier网络，得到每个ROI的分类和BB回归结果；

步骤27：将经过Pyramid ROIAlign的ROI以及每个ROI的分类和BB回归结果输入色彩预测网络，得到颜色分类结果；

步骤28：将颜色分类的结果与目标检测的结果合并，得到最终的目标检测和颜色分类结果，计算目标检测和颜色分类的损失函数，使用反向传播算法更新网络参数，重复执行步骤S21-S28，直到达到预定的训练轮数或收敛。

步骤3：将有标记图像的检测框作为正样本，在部分图像上随机画框作为负样本，构建一个包含正负样本的数据集，训练一个半监督预测监视网络，见图4，输入为ROI的特征表示和ROI的类别，输出为该ROI是否为可靠的伪标签，判别伪标签是否准确。其具体实现步骤如下：

步骤31：将有标记图像的检测框作为正样本，在未标记图像上随机画框作为负样本，构建一个包含正负样本的数据集；

步骤32：对半监督预测监视网络进行训练，使用正样本和负样本数据集进行二分类，训练结束后，该网络可以对未标记图像生成的伪标签进行可靠性判断；

步骤33：通过半监督预测监视网络筛选出可靠的伪标签，加入有标记的数据集中重新训练Color-RCNN，不可靠的伪标签作为未标记数据集的一部分，继续进行半监督学习。

步骤4：用训练好的Color-RCNN模型预测剩余的未标记图像，实现颜色分类，生成伪标签，利用半监督预测监视网络对伪标签进行判别，将正确识别的检测框留下，过滤掉错误的检测框；

步骤5：筛选后的未标记图像和有标记图像结合起来，重新训练Color-RCNN模型，预测剩余的未标记图像，直至未标记图像全部获得可靠标签，实现半监督学习。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.基于半监督多任务检测的木地板颜色分类及缺陷检测方法，其特征在于，采集木地板图像利用基于灰度世界算法和完美反射算法结合的色彩矫正公式进行缺陷色彩校正；标记少量图像作为数据集输入基于Faster-RCNN改进的Color-RCNN模型进行训练，实现木地板的颜色分类和缺陷检测；将有标记图像中的检测框作为正样本，在未标记图像上随机画框作为负样本，训练基于卷积神经网络设计的半监督预测监视网络判别伪标签是否准确；用训练好的Color-RCNN模型预测剩余的未标记图像，实现颜色分类，生成伪标签，利用半监督预测监视网络对伪标签进行判别，将正确识别的检测框留下，过滤掉错误的检测框；将识别正确的图像加入数据集，重新输入Color-RCNN模型训练，预测剩余的未标记图像，直至未标记图像全部获得可靠标签，实现半监督学习。

2.根据权利要求1所述的基于半监督多任务检测的木地板颜色分类及缺陷检测方法，其特征在于，包括以下步骤：

S1：采集多种颜色并且有缺陷的木地板图像，标注少量木地板中的颜色类别以及框选缺陷位置作为有标记图像，剩余作为未标记图像，由于缺陷可能对木地板颜色识别造成影响，根据缺陷色彩校正公式矫正木地板颜色；

S2：利用有标记图像训练出一个Color-RCNN模型，实现木地板的颜色分类和缺陷检测；

3.根据权利要求2所述的基于半监督多任务检测的木地板颜色分类及缺陷检测方法，其特征在于，在所述步骤S1中，使用基于灰度世界和完美反射结合的色彩矫正器矫正木地板颜色，基于灰度世界算法和完美反射算法结合的色彩矫正公式，如下所示：

接着，可以将指数项进行合并，得到：

最后，可以将x从积分中提出来，得到：

4.根据权利要求2所述的基于半监督多任务检测的木地板颜色分类及缺陷检测方法，其特征在于，所述步骤S2中，一个基于Faster-RCNN改进的Color-RCNN模型，利用一个色彩预测网络用于颜色分类，该网络包括卷积层和全连接层，输入为经过PyramidROIAlign输出的缺陷区域的ROI(感兴趣区域)以及FPN_Classifier网络的输出结果，输出为颜色分类结果，将FPN_Classifier网络与色彩预测网络级联，再将FPN_Classifier网络输出的ROI的分类和BB回归结果输入色彩预测网络，使其可以同时进行目标检测和颜色分类。

5.根据权利要求2所述的基于半监督多任务检测的木地板颜色分类及缺陷检测方法，其特征在于，所述步骤S2包括以下步骤：

S21：首先将有标记图像输入，进行数据预处理；

S23：通过feature map中的每一点设定ROI，获得多个ROI候选框；

6.根据权利要求2所述的基于半监督多任务检测的木地板颜色分类及缺陷检测方法，其特征在于，所述步骤S3包括以下步骤：

7.根据权利要求2所述的基于半监督多任务检测的木地板颜色分类及缺陷检测方法，其特征在于，所述的半监督预测监视网络其结构包括卷积层、池化层和全连接层，其中卷积层1使用32个3x3的卷积核，步长为1，采用ReLU激活函数，输入图像数据，提取图像特征，池化层1使用2x2的最大池化核，步长为2，进行下采样，减小特征图尺寸；卷积层2将池化层1的结果作为输入，提取更高级别的特征，卷积层2使用64个3x3的卷积核，步长为1，采用ReLU激活函数，池化层2使用2x2的最大池化核，步长为2，进行下采样，减小特征图尺寸；卷积层3将池化层2的结果作为输入，继续提取高级别特征，卷积层3使用128个3x3的卷积核，步长为1，采用ReLU激活函数，池化层3使用2x2的最大池化核，步长为2，进行下采样，减小特征图尺寸；经过一个全连接层1，将特征图展开成一维向量，进行全连接操作，共有256个神经元，采用ReLU激活函数；经过一个Dropout层，随机丢弃50％的神经元，减少过拟合；最后经过一个全连接层2，作为输出层，采用Sigmoid激活函数，对伪标签进行二分类，输出为0代表错误的伪标签，输出为1代表正确的伪标签。