CN117474914B

CN117474914B - 一种基于轻量化神经网络的飞机蒙皮表面缺陷检测方法

Info

Publication number: CN117474914B
Application number: CN202311812865.3A
Authority: CN
Inventors: 毛建旭; 易俊飞; 王耀南; 张辉; 刘彩苹; 曾凯; 陶梓铭; 谢核; 谭浩然; 朱青
Original assignee: Hunan University
Current assignee: Hunan University
Priority date: 2023-12-27
Filing date: 2023-12-27
Publication date: 2024-04-12
Anticipated expiration: 2043-12-27
Also published as: CN117474914A

Abstract

本发明公开了一种基于轻量化神经网络的飞机蒙皮表面缺陷检测方法，包括：构建用于网络训练的数据集；构建用于飞机蒙皮缺陷检测的教师网络模型和轻量化学生网络模型，使用数据集对教师网络模型进行训练，并将训练好的教师网络模型权重文件保存并载入到教师网络模型，使用数据集对学生网络模型进行训练，根据教师网络模型和学生网络模型输出的多尺度特征计算不确定性预测的知识蒸馏损失，结合蒸馏损失和学生网络模型原本的检测损失利用反向传播算法来训练学生网络模型，保存训练好的学生网络模型的权重文件；利用训练好的轻量化学生网络模型实现飞机蒙皮的缺陷检测。在确保精度的前提下，大幅度降低计算复杂度，提高自动化检测技术应用的实时性。

Description

一种基于轻量化神经网络的飞机蒙皮表面缺陷检测方法

技术领域

本发明属于飞机蒙皮缺陷检测技术领域，特别是涉及一种基于轻量化神经网络的飞机蒙皮表面缺陷检测方法。

背景技术

随着航空工业的飞速发展，在飞机制造过程中，飞机蒙皮的缺陷检测技术成为决定飞机整体性能高低的关键因素。在飞机航行过程中，蒙皮持续受到外界的压力作用，容易出现裂纹、凹陷等缺陷，这些缺陷严重影响了飞机性能和航行安全。人工缺陷检测方法存在效率低、依赖经验、成本高昂等问题，因此迫切需要一种高效、准确的自动化检测方法。

近年来，计算机视觉和深度学习技术迅猛发展，自动化缺陷检测成为飞机制造业的研究热点。然而，传统深度学习方法存在计算资源消耗大、模型复杂等问题，很难应用在大规模飞机蒙皮图像的处理上，对于飞机制造现场这类对实时性要求较高的场景，传统方法并不适用。

为解决上述问题，提出了一种基于轻量化神经网络的飞机蒙皮缺陷检测方法。

发明内容

针对以上技术问题，本发明提供一种基于轻量化神经网络的飞机蒙皮表面缺陷检测方法。

本发明解决其技术问题采用的技术方案是：

一种基于轻量化神经网络的飞机蒙皮表面缺陷检测方法，所述方法包括以下步骤：

S100：对飞机蒙皮进行拍照，并对拍摄的照片进行预处理操作，使用标注软件进行标注，构建用于网络训练的数据集；

S200：构建用于飞机蒙皮缺陷检测的教师网络模型和轻量化学生网络模型；

S300：使用数据集对教师网络模型进行训练，并将训练好的教师网络模型权重文件保存；

S400：载入保存的教师网络模型权重文件到教师网络模型，使用数据集对学生网络模型进行训练，根据教师网络模型和学生网络模型输出的多尺度特征计算不确定性预测的知识蒸馏损失，结合蒸馏损失和学生网络模型原本的检测损失利用反向传播算法来训练学生网络模型，利用不确定性预测的知识蒸馏方法实现教师网络模型对学生网络模型的知识传递，保存训练好的学生网络模型的权重文件，作为最终用于飞机蒙皮缺陷检测的轻量化学生网络网络的权重文件；

S500：将训练好的用于飞机蒙皮缺陷检测的轻量化学生网络模型部署和应用到自主移动机器人上，实现飞机蒙皮的动态、实时缺陷检测。

优选地，S200中教师网络模型包括用于多尺度特征提取的深度为101层的残差网络、用于多尺度特征融合的特征金字塔模块和用于检测结果预测的检测头模块；其中，特征金字塔模块先利用卷积层构建出不同尺度大小、通道数相同的多尺度特征，再利用双线性插值实现自顶向下的特征融合，实现语义特征与像素级特征的融合，检测头模块先利用四个共享权重的卷积层对融合后的多尺度特征进行编码，再通过由卷积层组成的两条解码分支分别预测出缺陷的定位框和类别。

优选地，S200中轻量化网络模型包括用于多尺度特征提取的深度为18层的残差网络、用于多尺度特征融合的特征金字塔模块和用于检测结果预测的检测头模块；其中，特征金字塔模块先利用卷积层构建出不同尺度大小、通道数相同的多尺度特征，再利用双线性插值实现自顶向下的特征融合，实现语义特征与像素级特征的融合，检测头模块先利用四个共享权重的卷积层对融合后的多尺度特征进行编码，再通过由卷积层组成的两条解码分支分别预测出缺陷的定位框和类别。

优选地，S400包括：

S410：载入保存的教师网络模型权重文件到教师网络模型，使用数据集对轻量化学生网络模型进行训练；

S420：数据集中的缺陷图片分别经过教师网络模型和学生网络模型的残差网络和特征金字塔之后得到具有不同尺度大小的特征图和/>，其中，/>，/>表示学生网络模型的多尺度特征，/>表示教师网络模型的多尺度特征；

S430：利用不确定性预测的知识蒸馏方法计算具有相同尺寸大小的特征图和之间的不确定性预测的知识蒸馏损失；其中，基于不确定性预测的知识蒸馏损失包括不确定性前景损失/>、不确定性背景损失/>、注意力损失/>和全局损失/>；

S440：结合蒸馏损失和学生网络模型原本的检测损失利用反向传播算法来训练学生网络模型，利用不确定性预测的知识蒸馏方法实现教师网络模型对学生网络模型的知识传递，保存训练好的学生网络模型的权重文件，作为最终用于飞机蒙皮缺陷检测的轻量化学生网络网络的权重文件。

优选地，S430包括：

S431：计算具有相同尺寸大小的特征图和/>之间的空间注意力损失、通道注意力损失、特征损失和全局信息损失，根据空间注意力损失和通道注意力损失计算得到注意力损失；

S432：搭建不确定性预测网络，包括特征映射模块、MLP编码模块、特征拼接模块和不确定性预测模块；

S433：计算特征图的掩码和尺度缩放矩阵，将空间注意力损失、通道注意力损失、特征损失和全局信息损失输出至不确定性预测网络，通过特征映射模块中1x1卷积层计算不同损失的深度特征映射，再利用MLP编码模块的多层感知机技术分别对损失的特征映射进行编码得到编码特征，并通过特征拼接模块对不同损失的编码特征进行拼接，通过不确定性预测模块对损失的编码特征进行解码，进而预测出每个像素位置的不确定性因子；结合不确定因子得到不确定前景损失和不确定性背景损失。

S434：根据注意力损失、全局信息损失、不确定前景损失和不确定性背景损失计算得到不确定性预测的知识蒸馏损失。

优选地，S431中计算具有相同尺寸大小的特征图和/>之间的空间注意力损失、通道注意力损失，根据空间注意力损失和通道注意力损失计算得到注意力损失，具体为：

利用空间注意力和通道注意力/>对传递过程进行约束，/>和的计算公式如下：

；

其中，和/>表示教师网络模型的空间注意力和通道注意力，/>和/>表示学生网络模型的空间注意力和通道注意力，C代表通道总数，c代表当前通道，/>表示坐标位置；

进一步通过空间和通道注意力/>计算空间注意力掩码/>和通道注意力掩码/>，具体计算公式如下：

；

其中，和/>表示教师网络模型的空间注意力掩码和通道注意力掩码，/>和/>表示学生网络模型的空间注意力掩码和通道注意力掩码，T是超参数用于平滑softmax函数的分布；

通过注意力损失将空间和通道掩码背后对应的知识进行传递，具体计算公式如下：

；

其中，是超参数用于调整注意力损失的大小，/>和/>分别代表教师网络模型和学生网络模型的空间掩码，/>和/>分别代表教师网络模型和学生网络模型的通道掩码，MSE代表均方差误差。

优选地，S431中计算具有相同尺寸大小的特征图和/>之间的全局信息损失，具体为：

教师网络模型的全局关系采用GcBlock网络计算，计算方式如下：

；

学生网络模型的全局关系采用GcBlock网络计算，计算方式如下：

；

其中，，/>和/>分别代表了卷积层，/>代表了层级归一化，/>表示特征图中像素点的数量；

通过均方差进一步计算教师网络模型和学生网络模型全局损失，计算公式如下：

；

其中，是超参数用于调整全局损失的大小，MSE代表均方差误差。

优选地，S431中计算具有相同尺寸大小的特征图和/>之间的特征损失，具体为：

。

优选地，S433具体为：

为了对特征图的前景和背景分开蒸馏，前景对应了飞机蒙皮缺陷，背景对应了非缺陷，计算特征图的掩码，具体计算公式如下：

；

其中，表示坐标位置，GT表示真实标注框；

为了防止计算过程中的损失值过大，通过计算和/>的乘积来减小/>的数值，其中/>的计算方式如下：

；

其中，表示尺度缩放矩阵，H和W分别表示特征图的高和宽，/>表示坐标位置，GT表示真实标注框；

先利用1x1卷积层计算不同损失的深度特征映射，再利用多层感知机技术MLP分别对损失的特征映射进行编码得到编码特征E，并通过线性层对损失的编码特征进行解码，从而预测出每个像素位置的不确定性因子U，具体的计算如下：

；

其中，和/>分别代表教师网络模型和学生网络模型的特征，conv1代表用于特征映射的1x1卷积层，MLP代表多层感知机，Cat表示将不同损失的编码特征进行拼接，predict是由线性层和ReLU层组成的不确定性预测网络，U表示每个像素点的不确定性；

不确定前景损失和不确定性背景损失/>计算如下：

；

其中，和/>适用于调整前景不确定性和背景不确定损失大小的超参数，/>是用于调整将学生网络模型通道数的自适应函数，/>表示教师网络模型中在c通道/>位置的特征值，/>表示学生网络模型中在c通道/>位置的特征值。

优选地，S434具体为：

；

其中，表示不确定性预测的知识蒸馏损失，/>表示不确定前景损失，/>表示不确定性背景损失，/>表示全局信息损失，/>表示注意力损失。

上述一种基于轻量化神经网络的飞机蒙皮表面缺陷检测方法，通过采用轻量级的神经网络结构，在确保检测精度的前提下，利用知识蒸馏的传递，能够大幅度降低计算复杂度，提高自动化检测技术应用的实时性。这一方法将为飞机制造过程中的自动化缺陷检测提供一种创新、高效的解决方案，为飞机航行安全提供坚实的技术保障，推动飞机制造业向数字化、智能化的方向迈进。

附图说明

图1为本发明一实施例中一种基于轻量化神经网络的飞机蒙皮表面缺陷检测方法的流程图；

图2为本发明一实施例中构建的用于飞机蒙皮缺陷检测的教师网络模型和轻量化学生网络模型的结构示意图；

图3为本发明一实施例中不确定性预测网络的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明的技术方案，下面结合附图对本发明作进一步的详细说明。

在一个实施例中，如图1所示，一种基于轻量化神经网络的飞机蒙皮表面缺陷检测方法，所述方法包括以下步骤：

S100：对飞机蒙皮进行拍照，并对拍摄的照片进行预处理操作，使用标注软件进行标注，构建用于网络训练的数据集。

具体地，利用高清工业相机对飞机蒙皮进行拍照，并对拍摄的照片进行翻转、缩放等预处理操作，使用标注软件进行标注，构建用于网络训练的数据集。

S200：构建用于飞机蒙皮缺陷检测的教师网络模型和轻量化学生网络模型。

在一个实施例中，如图2所示，S200中教师网络模型包括用于多尺度特征提取的深度为101层的残差网络、用于多尺度特征融合的特征金字塔模块和用于检测结果预测的检测头模块；其中，特征金字塔模块先利用卷积层构建出不同尺度大小、通道数相同的多尺度特征，再利用双线性插值实现自顶向下的特征融合，实现语义特征与像素级特征的融合，检测头模块先利用四个共享权重的卷积层对融合后的多尺度特征进行编码，再通过由卷积层组成的两条解码分支分别预测出缺陷的定位框和类别。

在一个实施例中，S200中轻量化网络模型包括用于多尺度特征提取的深度为18层的残差网络、用于多尺度特征融合的特征金字塔模块和用于检测结果预测的检测头模块；其中，特征金字塔模块先利用卷积层构建出不同尺度大小、通道数相同的多尺度特征，再利用双线性插值实现自顶向下的特征融合，实现语义特征与像素级特征的融合，检测头模块先利用四个共享权重的卷积层对融合后的多尺度特征进行编码，再通过由卷积层组成的两条解码分支分别预测出缺陷的定位框和类别。

具体地，构建一个参数量大但性能强的缺陷检测网络作为教师网络模型，构建一个参数量小但性能一般的缺陷检测网络作为学生网络模型。为了保证检测效率，采用单阶段目标检测网络作为飞机蒙皮缺陷检测的网络模型。该网络模型包括了用于多尺度特征提取的残差网络、用于多尺度特征融合的特征金字塔模块和用于检测结果预测的检测头模块。

S300：使用数据集对教师网络模型进行训练，并将训练好的教师网络模型权重文件保存。

S400：载入保存的教师网络模型权重文件到教师网络模型，使用数据集对学生网络模型进行训练，根据教师网络模型和学生网络模型输出的多尺度特征计算不确定性预测的知识蒸馏损失，结合蒸馏损失和学生网络模型原本的检测损失利用反向传播算法来训练学生网络模型，利用不确定性预测的知识蒸馏方法实现教师网络模型对学生网络模型的知识传递，保存训练好的学生网络模型的权重文件，作为最终用于飞机蒙皮缺陷检测的轻量化学生网络网络的权重文件。

在一个实施例中S400包括：

具体地，基于不确定性预测的知识蒸馏主要通过将不确定性引入到教师和学生网络模型的知识传递过程中，进而提升飞机蒙皮缺陷检测的效果。首先，缺陷图片分别经过教师网络模型和学生网络模型的残差网络和特征金字塔之后可以得到具有不同尺度大小的特征图，通过计算教师网络模型和学生网络模型中具有相同尺度的特征图之间的不确定性预测的知识蒸馏损失，结合反向传播算法来实现知识传递。基于不确定性预测的知识蒸馏损失包括了不确定性前景损失，和不确定性背景损失/>，注意力损失/>和全局损失/>。

在一个实施例中S431中计算具有相同尺寸大小的特征图和/>之间的空间注意力损失、通道注意力损失，根据空间注意力损失和通道注意力损失计算得到注意力损失，具体为：

；

具体地，利用空间和通道注意力/>对传递过程进行约束，是为了让缺陷类别和位置相关的知识在教师和学生模型之间有效传递。

在一个实施例中S431中计算具有相同尺寸大小的特征图和/>之间的全局信息损失，具体为：

；

具体地，全局损失主要是用于将教师模型中不同位置、不同通道之间的全局关系传递给学生模型。

在一个实施例中，S431中计算具有相同尺寸大小的特征图和/>之间的特征损失，具体为：

。

在一个实施例中，S433具体为：

；

其中，表示坐标位置，GT表示真实标注框；

；

其中，表示尺度缩放矩阵，用于调整掩码的大小，防止损失过大，H和W分别表示特征图的高和宽，/>表示坐标位置，GT表示真实标注框；

；

不确定前景损失和不确定性背景损失/>计算如下：

；/>

；

具体的，虽然教师模型的缺陷性能优于学生模型，但是教师模型也不具备完美的检测效果，因此教师模型的知识应当具备一种不确定性。这种不确定性是由教师模型能力影响的。为此，通过结合不确定性的知识蒸馏更加符合教师模型和学生模型之间的知识传递。

进一步地，在知识传递过程中，不确定性与模型损失密切相关。为此，先利用1x1卷积层计算不同损失的深度特征映射，再利用多层感知机技术（MLP）分别对损失的特征映射进行编码得到编码特征E，并通过线性层对损失的编码特征进行解码，从而预测出每个像素位置的不确定性因子U，不确定性预测网络如图3所示。

在一个实施例中，S434具体为：

；

具体地，通过将知识蒸馏损失结合到原来的训练损失之中，就可以实现教师模型和学生模型之间的知识迁移，从而提升轻量化学生模型的缺陷检测能力。

以上对本发明所提供的一种基于轻量化神经网络的飞机蒙皮表面缺陷检测方法进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的核心思想。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以对本发明进行若干改进和修饰，这些改进和修饰也落入本发明权利要求的保护范围内。

Claims

1.一种基于轻量化神经网络的飞机蒙皮表面缺陷检测方法，其特征在于，所述方法包括以下步骤：

S400：使用数据集对轻量化学生网络模型进行训练，根据教师网络模型和轻量化学生网络模型输出的多尺度特征计算不确定性预测的知识蒸馏损失，利用反向传播算法来训练轻量化学生网络模型；

S500：将训练好的用于飞机蒙皮缺陷检测的轻量化学生网络模型部署和应用到自主移动机器人上，实现飞机蒙皮的动态、实时缺陷检测；

S200中教师网络模型包括用于多尺度特征提取的深度为101层的残差网络、用于多尺度特征融合的特征金字塔模块和用于检测结果预测的检测头模块；其中，特征金字塔模块先利用卷积层构建出不同尺度大小、通道数相同的多尺度特征，再利用双线性插值实现自顶向下的特征融合，实现语义特征与像素级特征的融合，检测头模块先利用四个共享权重的卷积层对融合后的多尺度特征进行编码，再通过由卷积层组成的两条解码分支分别预测出缺陷的定位框和类别；

S200中轻量化学生网络模型包括用于多尺度特征提取的深度为18层的残差网络、用于多尺度特征融合的特征金字塔模块和用于检测结果预测的检测头模块；其中，特征金字塔模块先利用卷积层构建出不同尺度大小、通道数相同的多尺度特征，再利用双线性插值实现自顶向下的特征融合，实现语义特征与像素级特征的融合，检测头模块先利用四个共享权重的卷积层对融合后的多尺度特征进行编码，再通过由卷积层组成的两条解码分支分别预测出缺陷的定位框和类别；

S400包括：

S420：数据集中的缺陷图片分别经过教师网络模型和轻量化学生网络模型的残差网络和特征金字塔之后得到具有不同尺度大小的特征图和/>，其中，/>，/>表示轻量化学生网络模型的多尺度特征，/>表示教师网络模型的多尺度特征；

S430：利用不确定性预测的知识蒸馏方法计算具有相同尺寸大小的特征图和/>之间的不确定性预测的知识蒸馏损失；其中，基于不确定性预测的知识蒸馏损失包括不确定性前景损失/>、不确定性背景损失/>、注意力损失/>和全局损失/>；

S440：结合蒸馏损失和轻量化学生网络模型原本的检测损失利用反向传播算法来训练轻量化学生网络模型，利用不确定性预测的知识蒸馏方法实现教师网络模型对轻量化学生网络模型的知识传递，保存训练好的轻量化学生网络模型的权重文件，作为最终用于飞机蒙皮缺陷检测的轻量化学生网络的权重文件；

S430包括：

S433：计算特征图的掩码和尺度缩放矩阵，将空间注意力损失、通道注意力损失、特征损失和全局信息损失输出至不确定性预测网络，通过特征映射模块中1x1卷积层计算不同损失的深度特征映射，再利用MLP编码模块的多层感知机技术分别对损失的特征映射进行编码得到编码特征，并通过特征拼接模块对不同损失的编码特征进行拼接，通过不确定性预测模块对损失的编码特征进行解码，进而预测出每个像素位置的不确定性因子；结合不确定因子得到不确定前景损失和不确定性背景损失；

S434：根据注意力损失、全局信息损失、不确定前景损失和不确定性背景损失计算得到不确定性预测的知识蒸馏损失；

S433具体为：

；

其中，表示坐标位置，GT表示真实标注框；

；

其中，和/>分别代表教师网络模型和轻量化学生网络模型的特征，conv1代表用于特征映射的1x1卷积层，MLP代表多层感知机，Cat表示将不同损失的编码特征进行拼接，predict是由线性层和ReLU层组成的不确定性预测网络，U表示每个像素点的不确定性；

不确定性前景损失和不确定性背景损失/>计算如下：

；

其中，和/>适用于调整前景不确定性和背景不确定损失大小的超参数，/>是用于调整将轻量化学生网络模型通道数的自适应函数，/>表示教师网络模型中在c通道/>位置的特征值，/>表示轻量化学生网络模型中在c通道/>位置的特征值。

2.根据权利要求1所述的方法，其特征在于，S431中计算具有相同尺寸大小的特征图和/>之间的空间注意力损失、通道注意力损失，根据空间注意力损失和通道注意力损失计算得到注意力损失，具体为：

利用空间注意力和通道注意力/>对传递过程进行约束，/>和/>的计算公式如下：

；

其中，和/>表示教师网络模型的空间注意力和通道注意力，/>和表示轻量化学生网络模型的空间注意力和通道注意力，C代表通道总数，c代表当前通道，/>表示坐标位置；

；

其中，和/>表示教师网络模型的空间注意力掩码和通道注意力掩码，和/>表示轻量化学生网络模型的空间注意力掩码和通道注意力掩码，T是超参数用于平滑softmax函数的分布；

；

其中，是超参数用于调整注意力损失的大小，/>和/>分别代表教师网络模型和轻量化学生网络模型的空间掩码，/>和/>分别代表教师网络模型和轻量化学生网络模型的通道掩码，MSE代表均方差误差。

3.根据权利要求2所述的方法，其特征在于，S431中计算具有相同尺寸大小的特征图和/>之间的全局信息损失，具体为：

；

轻量化学生网络模型的全局关系采用GcBlock网络计算，计算方式如下：

；

通过均方差进一步计算教师网络模型和轻量化学生网络模型全局损失，计算公式如下：

；

4.根据权利要求3所述的方法，其特征在于，S431中计算具有相同尺寸大小的特征图和/>之间的特征损失，具体为：

。

5.根据权利要求4所述的方法，其特征在于，S434具体为：

；

其中，表示不确定性预测的知识蒸馏损失。