CN111951264B

CN111951264B - 一种基于深度学习的卷烟包装异常检测与定位方法

Info

Publication number: CN111951264B
Application number: CN202010885700.9A
Authority: CN
Inventors: 朱立明; 王伟; 章强; 邱建雄
Original assignee: China Tobacco Zhejiang Industrial Co Ltd
Current assignee: China Tobacco Zhejiang Industrial Co Ltd
Priority date: 2020-08-28
Filing date: 2020-08-28
Publication date: 2022-03-25
Anticipated expiration: 2040-08-28
Also published as: CN111951264A

Abstract

本发明涉及一种基于深度学习的卷烟包装异常检测与定位方法，包括双自编码器模块训练、注意力图生成器模块训练、异常检测与定位三个步骤；其中，所述双自编码器模块学习图像和隐空间之间的相互映射关系，仅使用正常图像进行训练；所述注意力图生成器模块利用真实图像和所述双自编码器模块生成图像的残差生成注意力图，测试时可突出异常区域。通过对所述双自编码器模块得到异常分数值进行阈值判别实现异常检测，并利用所述注意力图生成器模块生成的注意力图实现异常区域定位。本发明能够有效解决异常检测任务中训练样本不均衡的问题，满足高速生产下对产品检测实时性和准确性的双重要求，且对工业生产环境的适应性和鲁棒性强。

Description

一种基于深度学习的卷烟包装异常检测与定位方法

技术领域

本发明涉及一种基于深度学习的卷烟包装异常检测与定位方法，尤其是涉及一种基于卷烟小包透明纸的图像数据，考虑卷烟小包图像数据的不均衡性，构建基于深度学习的RADAE异常检测与定位模型，进行小包透明纸缺陷的检测技术。

背景技术

在卷烟包装环节中，由于卷烟输送歪斜，透明纸质量等问题，会产生透明纸折叠、透明纸破损、透明纸松脱等多种包装缺陷。卷烟包装环节是产品生产的最后一道工序，若不能及时准确的检测到包装异常，会对产品质量产生很大的负面影响，包装异常的产品流入市场，将对卷烟企业信誉度造成极坏的影响。

随着工业4.0的不断推进，卷烟制造工业的自动化水平不断提升，针对卷烟生产中包装异常的问题，利用人工检测的方法已难以适应自动生产下高速度、高精度、低成本的需求，逐渐被机器视觉检测技术所取代。

前人已尝试使用传统的机器视觉检测方法，相继提出了一些针对工业产品生产图像的异常检测方法。总体来说，主要包括传统的图像处理方法和基于手工特征或浅层学习技术的传统机器学习方法。然而，工业生产场景中存在着产品生产速度快、检测的环境复杂等因素，使得传统的机器视觉检测技术在工业生产的应用上存在检测模型参数设置复杂，适应性和鲁棒性差，难以满足工业检测对高精度和实时性的双重要求等问题，这给卷烟包装异常检测和定位带来了很大的挑战。

近年来深度学习的兴起，为工业产品异常检测带来新的思路。深度学习方法基于数据驱动，把特征和学习融合起来形成特征学习，代替了传统机器视觉检测技术中繁琐的图像预处理、特征抽取、特征选择及模型建立和学习的过程。

然而，在卷烟包装图像数据中，异常图像极少，正常图像远多于异常图像。现有的深度学习的异常检测模型往往基于均衡数据所建立，在异常图像非常有限的不均衡数据情况下较难适用。

发明内容

为了解决上述技术问题，本发明的目的是提供一种基于深度学习的卷烟包装异常检测与定位方法。

为了实现上述发明目的，本发明采用以下技术方案：

一种基于深度学习的卷烟包装异常检测与定位方法，包括双自编码器模块训练、注意力图生成器模块训练、异常检测与定位三个步骤；

一、所述双自编码器模块训练包括以下步骤：

(1)采集实际工业生产环境下的卷烟包装图像；

(2)构建数据集I，所述数据集I中包括正常图像数据集X＝{x₁，x₂，…，x_i，…，x_M}和异常图像数据集Y＝{y₁，y₂，…，y_j，…，y_N}，其中x_i表示第i张包装正常的图像，y_j表示第j张包装异常的图像，正常图像的总数M大于异常图像的总数N；

(3)构建所述双自编码器模块，该步骤通过以下子步骤实现：

(3.1)构建编码器E₁和编码器E₂；

(3.2)构建解码器D₁；

(3.3)将所述编码器E₁、所述解码器D₁和所述编码器E₂依次连接，组成所述双自编码器模块；

(4)训练所述双自编码器模块，该步骤通过以下子步骤实现：

(4.1)初始化所述双自编码器模块中的网络权值，并设定超参数，所述超参数包括迭代次数、批次值、学习率和动量；

(4.2)将所述数据集I中正常图像数据集X作为所述双自编码器模块的训练数据集；

(4.3)对所述正常图像数据集X进行随机采样，获得此轮训练的一批正常图像样本；

(4.4)将所述正常图像样本x输入双自编码器模块中，得到潜在特征E₁(x)、生成图像D₁(E₁(x))和生成特征E₂(D₁(E₁(x))，计算加权重建损失

具体子步骤包括如下：

(4.4.1)根据所述真实图像x和所述生成图像D₁(E₁(x))，计算图像重建损失

定义为公式(1)

(4.4.2)根据所述潜在特征E₁(x)和所述生成特征E₂(D₁(E₁(x))，计算特征重建损失

定义为公式(2)

(4.4.3)根据所述图像重建损失

和所述特征重建损失

计算加权重建损失

定义为公式(3)

其中w_x和w_z为加权权重系数，w_x，w_z∈[0，1]且w_x+w_z＝1

(4.5)根据步骤(4.4)得到的所述双自编码器模块的所述加权重建损失，采用自适应矩估计(Adam)优化器更新所述双自编码器的网络权值；

(4.6)判断是否达到设定迭代次数，若是，则执行(4.7)步骤，若否，则返回(4.3)步骤进行下一次迭代；

(4.7)保存RADAE模型双自编码器模块中的参数以及训练好的网络权值；

二、所述注意力图生成器模块训练包括以下步骤：

(1)冻结并加载训练好的RADAE算法模型中的所述双自编码器模块；

(2)构建所述注意力图生成器模块G_A：所述注意力图生成器模块的输入为所述双自编码器得到的所述真实图像x和所述生成图像D₁(E₁(x))之间的残差；输出为所述注意力图A_map；

(3)训练所述注意力图生成器模块，该步骤通过以下子步骤实现：

(3.1)初始化所述注意力图生成器模块中的网络权值，并设定迭代次数、批次值、学习率和动量等参数；

(3.2)将所述数据集I中正常图像数据集X作为所述双自编码器模块的训练数据集；

(3.3)对所述正常图像数据集X进行随机采样，获得此轮训练的一批正常图像样本；

(3.4)将所述真实图像x输入所述双自编码器模块，将所述双自编码器模块得到的所述真实图像x和所述生成图像D₁(E₁(x))之间的残差输入所述注意力图生成器模块，输出为所述注意力图A_map；

(3.5)根据所述注意力图A_map计算注意力损失

定义为公式(4)，其中A_i，j∈[0，1]是A_map的(i，j)元素；

(3.6)根据步骤(3.5)得到的所述注意力图生成器模块的所述注意力损失

采用自适应矩估计(Adam)优化器更新所述注意力图生成器的网络权值；

(3.7)判断是否达到设定迭代次数，若是，则执行(3.8)步骤，若否，则返回(3.3)步骤进行下一次迭代；

(3.8)保存RADAE模型注意力图生成器模块中的参数以及训练好的网络权值；

三、所述异常检测与定位包括以下步骤：

(1)加载训练好的RADAE算法模型，包括所述双自编码器模块和所述注意力图生成器模块；

(2)对待检测图像进行预处理，得到测试集T；

(3)将所述测试集T中的测试图像x输入所述双自编码器模块，得到潜在特征E₁(x)、生成图像D₁(E₁(x))和生成特征E₂(D₁(E₁(x))

(4)根据所述潜在特征E₁(x)和生成特征E₂(D₁(E₁(x))，计算异常判别得分S_A，定义为公式(5)

S_A＝∑||E₁(x)-E₂(D₁(E₁(x))||₁ (5)

(5)判别所述异常判别得分是否大于设定阈值，若是，则判断为异常图像x_a；否则，则判断为正常图像x_n；

(6)将所述判别为异常的图像x_a和对应的生成图像D₁(E₁(x_a))之间的残差输入所述注意力图生成器模块，输出为注意力图A_map；

(7)根据所述注意力图A_map，将灰度图使用彩色映射方法映射为彩色热图，实现异常区域的定位和可视化；

(8)保存异常检测与定位的结果。

作为优选方案：所述构建数据集I，对卷烟包装图像进行预处理步骤，具体子步骤包括如下：

(2.1)对所述卷烟包装图像进行裁剪，去除背景区域，获得待检测区域图像；

(2.2)对所述待检测区域图像进行灰度变换和尺寸变换，获得128×128×1的图像数据；(2.3)判断所述128×128×1的图像数据是否出现包装异常情况：若是，则判定为异常图像，若否，则判定为正常图像。所有所述图像数据构成数据集I。

作为优选方案：所述编码器E₁和所述编码器E₂具有相同结构，包含4个残差块，每个残差块由两个3×3卷积核的卷积层组成，激活函数为leaky Relu。

作为优选方案：所述解码器D₁包含4个残差块，每个残差块由两个3×3卷积核的卷积层组成，激活函数为Relu。

作为优选方案：所述注意力图生成器模块由收缩路径和扩张路径组成，收缩路径通过3×3卷积，ReLU激活函数，步长2的2×2最大池化操作的4次组合使用实现下采样；扩展路径包括4个2×2反卷积操作，以及最后的1×1卷积和sigmoid函数。

本发明公开了一种基于深度学习的卷烟包装异常检测与定位方法，通过设计并搭建RADAE算法模型以实现卷烟包装异常的检测与定位。所述RADAE算法模型包括双自编码器模块和注意力图生成器模块。其中，所述双自编码器模块学习图像和隐空间之间的相互映射关系，仅使用正常图像进行训练；所述注意力图生成器模块利用真实图像和所述双自编码器模块生成图像的残差生成注意力图，测试时可突出异常区域。所述RADAE算法通过对所述双自编码器模块得到异常分数值进行阈值判别实现异常检测，并利用所述注意力图生成器模块生成的注意力图实现异常区域定位。本发明能够有效解决异常检测任务中训练样本不均衡的问题，满足高速生产下对产品检测实时性和准确性的双重要求，且对工业生产环境的适应性和鲁棒性强。

本发明针对卷烟厂包装异常检测与定位这一典型的高速度、环境复杂的工业产品生产检测环节提出了一种基于深度学习的卷烟包装异常检测与定位检测方法。该方法考虑到卷烟包装图像数据的不均衡性，构建了基于深度学习的RADAE异常检测与定位模型，仅使用正常图像样本进行模型训练。结合双自编码器模块和注意力图生成器模块，定义了异常检测与定位实现方法，能够通过判断待检测图像的异常分数是否大于设定的异常判别阈值实现异常图像的检测，并通过生成的注意力图实现异常区域的定位，满足高速生产下对产品检测实时性和准确性的双重要求，对工业生产环境的适应性和鲁棒性强。

附图说明

构成本申请的一部分的说明书附图用来提供对本申请的进一步理解，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的限定。

图1是本发明一种基于深度学习的卷烟包装异常检测与定位方法所使用的RADAE模型示意图；

图2是本发明一种基于深度学习的卷烟包装异常检测与定位方法所使用的RADAE模型中双自编码器模块示意图；

图3是本发明一种基于深度学习的卷烟包装异常检测与定位方法所使用的RADAE模型中双自编码器模块训练过程流程图；

图4是本发明一种基于深度学习的卷烟包装异常检测与定位方法所使用的RADAE模型中双自编码器模块中编码器的结构图；

图5是本发明一种基于深度学习的卷烟包装异常检测与定位方法所使用的RADAE模型中双自编码器模块中解码器的结构图；

图6是本发明一种基于深度学习的卷烟包装异常检测与定位方法所使用的RADAE模型中注意力图生成器模块示意图；

图7是本发明一种基于深度学习的卷烟包装异常检测与定位方法所使用的RADAE模型中注意力图生成器模块训练过程流程图；

图8是本发明一种基于深度学习的卷烟包装异常检测与定位方法所使用的RADAE模型中注意力图生成器模块结构图；

图9是本发明一种基于深度学习的卷烟包装异常检测与定位方法所使用的RADAE模型中异常检测与定位流程图；

图10是本发明一种基于深度学习的卷烟包装异常检测与定位方法实验结果示意图，列出异常图像的实验结果，其中第一行表示待检测图像，第二行表示注意力图实现异常定位的结果。

具体实施方式

下面结合附图与实施例对本发明作进一步说明。

本发明以某卷烟厂某品牌卷烟生产中卷烟包装图像为例，该异常检测与定位任务要求模型检测速度小于30ms，即每秒需要处理33张以上的图像，且检测精度保持在90％以上，即误报率应小于10％。

如图1至图10所示，本发明是一种基于深度学习的卷烟包装异常检测与定位方法，该方法通过构建RADAE算法模型实现卷烟包装图像异常检测与定位。如图1所示，所述异常检测与定位模型包括双自编码器模块和注意力图生成器模块。如图2所示，所述双自编码器模块为一个编码-解码-编码网络，学习图像和隐空间之间的相互映射关系，仅使用正常图像进行训练；如图6所示，所述注意力图生成器模块利用输入图像和所述双自编码器模块生成图像的残差生成注意力图，均匀关注正常样本中的所有区域；在进行异常检测与定位时，如图9所示，利用所述双自编码器模块得到异常分数值，通过阈值判别实现异常检测，并利用注意力图生成器模块生成的注意力图实现异常区域定位。

如图3所示，所述双自编码器模块训练包括以下步骤：

(1)采集实际工业生产环境下的卷烟包装图像。

(2)构建数据集I，该步骤通过以下子步骤实现：

(2.1)对卷烟包装图像进行预处理步骤，具体子步骤包括如下：

(2.1.1)对所述卷烟包装图像进行裁剪，去除背景区域，获得待检测区域图像。

(2.1.2)对所述待检测区域图像进行灰度变换和尺寸变换，获得128×128×1的图像数据。

(2.1.3)判断所述128×128×1的图像数据是否出现包装异常情况：若是，则判定为异常图像，若否，则判定为正常图像。所有所述图像数据构成数据集I。

(2.1.4)所述数据集I中包括正常图像数据集X＝{x₁，x₂，…，x_i，…，x_M}和异常图像数据集Y＝{y₁，y₂，…，y_j，…，y_N}，其中x_i表示第i张包装正常的图像，y_j表示第j张包装异常的图像，正常图像的总数M大于异常图像的总数N。

(3)构建所述双自编码器模块，该步骤通过以下子步骤实现：

(3.1)构建编码器E₁和编码器E₂：如图4所示，所述编码器E₁和所述编码器E₂具有相同结构，包含4个残差块，每个残差块由两个3×3卷积核的卷积层组成，激活函数为leakyRelu。。

(3.2)构建解码器D₁：如图5所示，所述解码器D₁包含4个残差块，每个残差块由两个3×3卷积核的卷积层组成，激活函数为Relu。

(3.3)将所述编码器E₁、所述解码器D₁和所述编码器E₂依次连接，组成所述双自编码器模块。

(4)训练所述双自编码器模块，该步骤通过以下子步骤实现：

(4.1)初始化所述双自编码器模块中的网络权值，并设定迭代次数、批次值、学习率和动量等超参数。

(4.2)将所述数据集I中正常图像数据集X作为所述双自编码器模块的训练数据集。

(4.3)对所述正常图像数据集X进行随机采样，获得此轮训练的一批正常图像样本。

具体子步骤包括如下：

定义为公式(1)

定义为公式(2)

(4.4.3)根据所述图像重建损失

和所述特征重建损失

计算加权重建损失

定义为公式(3)

其中w_x和w_z为加权权重系数，w_x，w_z∈[0，1]且w_x+w_z＝1。

(4.5)根据步骤(4.4)得到的所述双自编码器模块的所述加权重建损失，采用自适应矩估计(Adam)优化器更新所述双自编码器的网络权值。

(4.6)判断是否达到设定迭代次数，若是，则执行(4.7)步骤，若否，则返回(4.3)步骤进行下一次迭代。

(4.7)保存RADAE模型双自编码器模块中的参数以及训练好的网络权值。

如图7所示，所述注意力图生成器模块训练包括以下步骤：

(1)冻结并加载训练好的RADAE算法模型中的所述双自编码器模块。

(2)构建所述注意力图生成器模块G_A：如图6所示，所述注意力图生成器模块的输入为所述双自编码器得到的所述真实图像x和所述生成图像D₁(E₁(x))之间的残差。如图8所示所述注意力图生成器模块由收缩路径和扩张路径组成，收缩路径通过3×3卷积，ReLU激活函数，步长2的2×2最大池化操作的4次组合使用实现下采样；扩展路径包括4个2×2反卷积操作，以及最后的1×1卷积和sigmoid函数，输出为所述注意力图A_map。

(3.1)初始化所述注意力图生成器模块中的网络权值，并设定迭代次数、批次值、学习率和动量等参数。

(3.2)将所述数据集I中正常图像数据集X作为所述双自编码器模块的训练数据集。

(3.3)对所述正常图像数据集X进行随机采样，获得此轮训练的一批正常图像样本。

(3.4)将所述正常图像x输入所述双自编码器模块，将所述双自编码器模块得到的所述真实图像x和所述生成图像D₁(E₁(x))之间的残差输入所述注意力图生成器模块，输出为所述注意力图A_map。

(3.5)根据所述注意力图A_map计算注意力损失

定义为公式(4)，其中A_i，j∈[0，1]是A_map的(i，j)元素。

采用自适应矩估计(Adam)优化器更新所述注意力图生成器的网络权值。

(3.7)判断是否达到设定迭代次数，若是，则执行(3.8)步骤，若否，则返回(3.3)步骤进行下一次迭代。

(3.8)保存RADAE模型注意力图生成器模块中的参数以及训练好的网络权值。

如图9所示，所述异常检测与定位模块构建的过程如下：

(1)加载训练好的RADAE算法模型，包括所述双自编码器模块和所述注意力图生成器模块。

(2)对待检测图像进行预处理，得到测试集T，该步骤通过如下子步骤实现：

(2.1)对所述待检测的图像检测关键区域进行裁剪，去除背景，获得待检测区域图像。

(2.2)对所述待检测区域图像进行灰度化处理，并缩放为128×128的图像数据。

(2.3)所有所述图像数据构成测试集T。

S_A＝∑||E₁(x)-E₂(D₁(E₁(x))||₁ (5)

(5)判别所述异常判别得分是否大于设定阈值，若是，则判断为异常图像x_a；否则，则判断为正常图像x_n。

(6)将所述判别为异常的图像x_a和对应的生成图像D₁(E₁(x_a))之间的残差输入所述注意力图生成器模块，输出为注意力图A_map。

(7)根据所述注意力图A_map，将灰度图使用彩色映射方法映射为彩色热图，实现异常区域的定位和可视化。

(8)保存异常检测与定位的结果。

本发明中选择的实际案例是某卷烟厂某品牌卷烟生产中卷烟包装环节的异常检测和定位。图10列出了部分异常图像的检测结果，第一行为输入模型的异常图像，第二行为生成的注意力图，可以看到异常区域通过彩色热图体现，可以实现异常区域的定位。

表1列出了RADAE模型的异常检测性能详细的测试结果。

表1 RADAE模型的异常检测性能

数据集	精度	检测速度	FPS
				卷烟包装数据集	98％	1.59ms	630

本发明方法的异常检测与定位的优越性体现在仅使用正常图像训练异常检测模型，解决了深度学习模型训练中样本不均衡的问题，并满足卷烟厂高速生产下对卷烟包装异常检测与定位的实时性和准确性的双重要求，对工业生产环境的适应性和鲁棒性强。

以上所述的，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围内。

Claims

1.一种基于深度学习的卷烟包装异常检测与定位方法，其特征在于：包括双自编码器模块训练、注意力图生成器模块训练、异常检测与定位三个步骤；

一、所述双自编码器模块训练包括以下步骤：

(1)采集实际工业生产环境下的卷烟包装图像；

(3)构建所述双自编码器模块，该步骤通过以下子步骤实现：

(3.1)构建编码器E₁和编码器E₂；

(3.2)构建解码器D₁；

(4)训练所述双自编码器模块，该步骤通过以下子步骤实现：

具体子步骤包括如下：

定义为公式(1)

定义为公式(2)

(4.4.3)根据所述图像重建损失

和所述特征重建损失

计算加权重建损失

定义为公式(3)

其中w_x和w_z为加权权重系数，w_x，w_z∈[0，1]且w_x+w_z＝1

二、所述注意力图生成器模块训练包括以下步骤：

(3.5)根据所述注意力图A_map计算注意力损失

定义为公式(4)，其中A_i，j∈[0，1]是A_map的(i，j)元素；

三、所述异常检测与定位包括以下步骤：

(2)对待检测图像进行预处理，得到测试集T；

S_A＝∑||E₁(x)-E₂(D₁(E₁(x))||₁ (5)

(5)判别所述异常判别得分是否大于设定阈值，若是，则判断为异常图像x_a；否则，则判断为正常图像x_a；

(8)保存异常检测与定位的结果。

2.根据权利要求1所述的一种基于深度学习的卷烟包装异常检测与定位方法，其特征在于：所述构建数据集I，对卷烟包装图像进行预处理步骤，具体子步骤包括如下：

(1)对所述卷烟包装图像进行裁剪，去除背景区域，获得待检测区域图像；

(2)对所述待检测区域图像进行灰度变换和尺寸变换，获得128×128×1的图像数据；

(3)判断所述128×128×1的图像数据是否出现包装异常情况：若是，则判定为异常图像，若否，则判定为正常图像，所有所述图像数据构成数据集I。

3.根据权利要求1所述的一种基于深度学习的卷烟包装异常检测与定位方法，其特征在于：所述编码器E₁和所述编码器E₂具有相同结构，包含4个残差块，每个残差块由两个3×3卷积核的卷积层组成，激活函数为leaky Relu。

4.根据权利要求1所述的一种基于深度学习的卷烟包装异常检测与定位方法，其特征在于：所述解码器D₁包含4个残差块，每个残差块由两个3×3卷积核的卷积层组成，激活函数为Relu。

5.根据权利要求1所述的一种基于深度学习的卷烟包装异常检测与定位方法，其特征在于：所述注意力图生成器模块由收缩路径和扩张路径组成，收缩路径通过3×3卷积，ReLU激活函数，步长2的2×2最大池化操作的4次组合使用实现下采样；扩展路径包括4个2×2反卷积操作，以及最后的1×1卷积和sigmoid函数。

6.根据权利要求1所述的一种基于深度学习的卷烟包装异常检测与定位方法，其特征在于：对待检测图像进行预处理，得到测试集T，该步骤通过如下子步骤实现：

(1)对所述待检测的图像检测关键区域进行裁剪，去除背景，获得待检测区域图像；

(2)对所述待检测区域图像进行灰度化处理，并缩放为128×128的图像数据；

(3)所有所述图像数据构成测试集T。