CN117952985A

CN117952985A - 基于缺陷检测场景下提升信息复用的图像数据处理方法

Info

Publication number: CN117952985A
Application number: CN202410354546.0A
Authority: CN
Inventors: 刘刚; 万文谦; 王磊; 于浩洋; 朱秀; 金道勋; 金春山
Original assignee: Jiangxi Normal University
Current assignee: Jiangxi Normal University
Priority date: 2024-03-27
Filing date: 2024-03-27
Publication date: 2024-04-30

Abstract

本发明公开了一种基于缺陷检测场景下提升信息复用的图像数据处理方法，采用交叉熵函数、卷积神经网络架构等技术组合，其中卷积神经网络架构使用的是YOLOv5架构，主要包括Focus、CBS等模块。本发明还采用SiLU激活函数、批量标准化及Sigmoid函数进行优化，以保障训练出性能更好的表面缺陷检测模型，同时可以进行快速运算，减少训练时间，生成的模型可以对复杂的工业场景下的表面缺陷目标进行实时检测，本发明可以使得检测网络更加注重于加强空间信息以及通道信息之间的联系以及有效抑制了检测过程中相似的背景信息对表面缺陷检测带来的不利影响，并且在大幅提升检测网络的检测精度的同时仍能保持良好的实时性。

Description

基于缺陷检测场景下提升信息复用的图像数据处理方法

技术领域

本发明涉及计算机视觉技术领域，尤其涉及一种基于缺陷检测场景下提升信息复用的图像数据处理方法。

背景技术

目标检测是计算机视觉领域的重要问题之一，它可以应用于诸如自动驾驶、安防监控、人脸识别等领域。

表面缺陷检测一直以来都是工业应用领域中备受挑战的难题。这一挑战的本质在于，表面缺陷常常呈现出形状不规则、尺寸多变、分布不均以及颜色变化多端等特征，这些特征共同作用导致了表面缺陷的准确检测变得困难重重。

在工业应用场景下，表面缺陷检测任务常常面临高度相似性的挑战。在这个背景下，表面缺陷的相似性通常呈现出两种不同的模式：类内缺陷展示出显著差异，而类间缺陷则可能呈现一定的相似性。具体而言，类内缺陷，尽管属于同一类别，往往表现出多样性的特征。例如，针对划痕这一类型的缺陷，其可能表现为水平、垂直或倾斜等不同方向的特征。相反，某些类间缺陷则可能呈现出一定的相似性，增加了正确分类的难度。例如，被氧化的表面与经历过腐蚀的表面可能具有相似的外观特征。

基于卷积神经网络的深度学习方法已经成为先进图像分类技术在实现表面缺陷检测方面的有效工具，具备卓越的性能，包括更高的检测精度、更快的处理速度以及更强的适应性等显著优势。这些深度学习算法能够直接处理图像数据，能够自动地从复杂的表面缺陷中提取相关特征信息，从而为检测任务提供了更为有效的手段，传统卷积神经网络通过共享权值来减少计算，总是在各类检测任务中发挥着至关重要的作用。然而，通过有步长卷积操作进行的连续下采样将不可避免地会导致特征信息的丢失，从而不利于从特征图中获取足够的信息。

这个时候建立良好的基于缺陷检测场景下提升信息复用的图像数据处理方法，再结合工业应用中的钢材表面缺陷汇总数据集和YOLOv5网络，根据自身经验建立的多个训练模型，一方面减少卷积神经网络在下采样过程中信息的丢失，尽最大程度地保留特征图中的细粒程度信息，另一方面注意力机制的作用还能够使得卷积神经网络关注于更加重要的特征并抑制背景信息对检测过程的干扰；此外，通过对深层语义信息的高效多尺度融合使得网络能够提取出更深层次的隐藏特征信息。进而提高工业应用场景下表面缺陷检测的准确率和效率。当训练完毕后，生成的神经网络模型还可以做到面对新的数据集或实时图像，检测出其中各类缺陷，依然可以保持良好的检测准确率以及实时性，对工业应用中的多种缺陷检测领域都极具意义。

我们注意到表面缺陷检测存在的不仅仅是图片分辨率低，缺陷目标形状不规则、尺寸不一等问题，还在于在复杂背景下，背景信息可能对表面缺陷检测带来的影响的问题，并且我们还注意到交叉熵函数、轮次、PyTorch、SGD、注意力机制、特征增强方法，神经网络架构和改善传统卷积神经网络下采样时信息丢失的问题等技术手段都可以用来提高工业应用场景下表面缺陷检测的性能，但是如何充分利用这些技术的组合并改进它们，以适应工业应用场景下的表面缺陷检测问题，是一个重要而复杂的问题。

基于上述原因，本发明公开一种基于缺陷检测场景下提升信息复用的图像数据处理方法。

发明内容

本发明的目的是为了提供一种基于缺陷检测场景下提升信息复用的图像数据处理方法。本发明所要解决的技术问题在于有效缓解在卷积神经网络下采样过程中信息丢失的问题，尽最大程度地保留特征图中细粒程度的信息，以及通道注意力机制的捆绑能够使得网络更多地抑制复杂背景信息对表面缺陷检测的干扰，并且在空间换深度操作后尽可能地抓取特征信息，提升网络的特征表达能力，并且通过更多卷积层的作用以及多残差分支的融合使得网络能够挖掘更深层次的多尺度语义信息，并且残差分支的作用使得较为浅层富含较多初始特征和位置信息的特征图与较为深层富含更多语义信息的特征图进行融合，模型能够在保持良好的检测实时性的同时进一步提升特征表达能力，从而提升表面缺陷检测的精确度。

一种基于缺陷检测场景下提升信息复用的图像数据处理方法，包括以下步骤：S21：对输入网络的特征图进行切片采样操作，将形状为N × N × C₁的特征图X采样到scale²个尺寸为N/scale × N/scale × C₁的子特征图中，特征图X中的每个像素仍然保留在相应的子特征图中，其中特征图X的高和宽一致，均用N表示，C₁表示特征图X和采样后的子特征图的通道数，scale表示采样因子。据采样规则采样后得到的scale²个子特征图，分别命名为：f_0,0, f_1,0, f_0,1, f_1,1, …, f_scale-1,_scale-1，其中，采样规则为：

；

其中，f和scale分别表示子特征图和特征图X上的切片操作的步幅，i和j分别是特征图X上输入矩阵中的行和列索引，i和j也代表特征图X上输入矩阵中每个元素的位置，N表示特征图X上输入矩阵的维度；

S22：沿着通道维度方向使用串联连接方式对得到的scale²个子特征图进行连接，得到沿通道拼接后的第一特征图，命名为X’，其形状为N/scale × N/scale × scale²C₁；

S23：使用步长为1的卷积对第一特征图X’进行卷积操作，得到卷积后的第二特征图X’’，其形状为N/scale × N/scale × C₂，C₂为第二特征图X’’的通道数；

S24：第二特征图X’’进入C3模块，首先使用SiLU激活函数对输入数据即原始图像或特征图进行数字化处理，这一步包括将从输入中提取的特征转换为数字化形式，并增强特征的非线性表达，处理后的结果通过张量矩阵进行存储，随后经过 Sigmoid 激活函数实现张量矩阵的归一化处理，从而加快卷积神经网络收敛，其中SiLU激活函数的计算公式为：

；

其中Sigmoid激活函数计算公式为：

；

其中x为输入的张量矩阵，通过Sigmoid进行压缩，Sigmoid激活函数将张量矩阵的数据根据其范围，压缩到区间（0, 1）中的某个值，以保证归一化；

S25：归一化处理后的图像数据进入C3模块的瓶颈结构中，坐标注意力模块嵌入于C3模块的瓶颈结构中，坐标注意力模块置于瓶颈结构中的两个卷积核均为1×1的卷积模块之后，坐标注意力模块通过精确的位置信息对通道关系和长期依赖性进行编码，先将输入特征图分为高度和宽度两个方向分别进行全局平均池化，分别获得在高度和宽度两个方向的特征图，公式如下：

；

其中和/>分别表示在高度和宽度方向上对通道维度的全局平均池化结果，/>为输入图像在通道c处的特征图，尺寸为W×H×C，W、H和C分别表示宽、高和通道，i和j分别代表高和宽上的像素点位置，h和w分别代表全局平均池化结果中的高度和宽度索引。

接着将获得全局感受野的特征图沿着宽度和高度两个方向拼接在一起，之后将拼接后的特征图送入共享的卷积核为1×1的卷积模块，将拼接后的特征图的维度降低为原来的C/r，然后将经过批量归一化处理后的特征图送入Sigmoid激活函数得到形状为 1×(W+H)×C/r 的特征图，其中C为拼接后特征图的通道数，r表示对C进行降维的比例因子，W和H分别表示经过Sigmoid激活函数后的特征图的宽和高，全局感受野指在整个网络中某个层输出的单元所能感受到的输入图像区域的大小，为得到 1×(W+H)×C/r 的特征图，计算公式如下：

；

其中[ , ]表示沿着空间维度的串联操作，表示1×1的卷积功能，/>为非线性激活函数，最后得到的特征图记录为f₁。

接着，对经过 Sigmoid 激活函数处理的特征图执行高度和宽度方向上的卷积操作，使用1×1的卷积核，分别生成两个特征图 F_h 和 F_w。这两个特征图的通道数与在宽度和高度方向进行全局平均池化后的特征图相一致，随后，这经过1×1卷积的特征图再次经过Sigmoid 激活函数处理，分别得到在高度和宽度上的注意力权重。

S26：在经过瓶颈结构中的坐标注意力模块的处理后，通过为特征图引入注意力权重，然后将结合注意力权重的输出结果与瓶颈结构外的另一残差分支相结合，另一残差分支仅经过一个卷积批归一化SiLU的集成模块，引入注意力权重的特征图再与另一残差分支输出的特征图通过串联操作融合，随后再通过一个卷积批归一化SiLU的集成模块，最终得到输出特征图；

进一步的，上述步骤S21和S22中对输入特征图进行了切片和重组操作，将输入特征图中的空间信息采样到了新特征图的通道维度中，从而使得卷积神经网络更加关注于特征图中空间信息与通道信息之间的联系，更加有利于在表面缺陷检测中捕捉空间信息与通道信息联系比较紧密的缺陷目标，从而提升目标检测精度。

进一步的，上述步骤S23中使用步长为1的卷积对特征图进行卷积操作，能够最大程度地减小通道降低的过程中信息的丢失，最大程度地保留原始特征图中最重要的信息，例如，如果使用步长为3的3×3卷积，则特征图中的每个像素只被采样一次，从而对特征图产生“收缩”效应。如果使用步幅为2则会导致采样不平衡，其中偶数行或列和奇数行或列的采样频率是不同的，所以使用步长为1的卷积能够最大程度地保留特征图中细粒程度的信息。

进一步的，上述步骤S24中的C3模块包含了3个卷积模块以及多个瓶颈结构，该结构是网络对残差特征进行学习的主要手段，其主要作用是在网络中结合不同尺度的特征图来提取更加丰富的特征信息，从而提升网络的特征提取能力。

进一步的，输入数据经过整个C3模块后仅仅改变其通道数，尤其是在瓶颈结构中，通道数先减小再扩大，具体做法是先进行1×1卷积将通道数减小一半，再通过3×3卷积将通道数加倍，并使用两个卷积模块提取特征，最后再通过坐标注意力模块，其输入与输出的通道数是不发生改变的。

进一步的，上述步骤S25中的C3模块中的瓶颈数量随网络参数的设置而在主干部分和颈部部分的各个位置处各有不同，瓶颈结构中包含两个卷积模块。此外，网络中主干部分的瓶颈结构包含短接操作，而在网络中颈部部分的瓶颈结构不包含短接操作，瓶颈结构的作用是对C3模块中的残差特征进行进一步的学习与提取，更加增益了网络对于残差特征的特征提取能力，此外，全局感受野的实现通常依赖于合并多个尺度的特征图，以确保网络更多地能够关注到检测目标的各种尺寸和位置信息，从而能够使得网络更好地理解特征图中的整体结构和语义信息。

进一步的，上述步骤S21，S22，S23和S26中，输入特征图在经过采样和串联拼接之后，原始特征图中的所有像素都得以保留，即信息没有任何丢失，而在步长为1的卷积操作过程中，因通道数的大幅下降可能会导致重要信息的大量丢失。因此在C3模块的瓶颈结构中嵌入坐标注意力模块，使得网络能够在步长为1的卷积操作之后，尽可能地抓取和保留更多重要的特征信息，并且通道注意力机制的引入能够使得卷积神经网络对更加重要的特征信息分配更多权重，从而抑制背景干扰信息对表面缺陷检测带来的不利影响，此外，串联融合是一种用于合并多个张量或特征图的操作，比如将多个张量沿着一个指定的轴进行拼接，形成一个更大的张量。

进一步的，还包括：

S27：在YOLOv5网络结构中SPPF模块的基础上使用更多的卷积操作层并且增加了一条残差分支以实现更丰富的多尺度信息的融合，将此使用更多的卷积操作层并且增加了一条残差分支后的SPPF模块命名为多尺度空间融合金字塔模块；

S28：输入特征图进入多尺度空间融合金字塔模块后，受两条分支作用，其中一条只经过一个卷积模块，另一分支首先经过两个卷积模块，然后经过池化核均为5的串联空间金字塔层以扩大特征图的感受野，并提取丰富的多尺度信息，随后再经过两个卷积模块以进一步更深层次地提取多尺度的语义信息；

S29：输入特征图经过两条分支作用后分别得到的两个特征图通过串联连接方式在通道维度上进行融合，融合完成后得到的特征图再经过一个卷积模块得到最终的特征图。

进一步的，上述步骤S27，S28和S29中，相比较原YOLOv5网络结构中SPPF模块，引入一条残差分支可以有助于网络捕捉基础特征，如较为浅层的位置信息、纹理信息等等，然后再与使用了更多的卷积模块的串联空间金字塔层输出的特征图进行融合，于是较为浅层的基础特征与较为深层的语义信息能够进行结合形成丰富的多尺度信息，旨在生成更丰富、多尺度的特征表达，为网络提供了更强大的语义信息提取能力，从而在表面缺陷目标检测等任务中提升了性能。

本发明的有益效果：

本发明建立一种良好的基于缺陷检测场景下提升信息复用的图像数据处理方法，再结合工业应用中的钢材表面缺陷汇总数据集和YOLOv5网络，根据自身经验建立的多个训练模型，一方面减少卷积神经网络在下采样过程中信息的丢失，尽最大程度地保留特征图中的细粒程度信息，另一方面注意力机制的作用还能够使得卷积神经网络关注于更加重要的特征并抑制背景信息对检测过程的干扰；此外，通过对深层语义信息的高效多尺度融合使得网络能够提取出更深层次的隐藏特征信息。进而提高工业应用场景下表面缺陷检测的准确率和效率。

附图说明

图1为本发明的空间换深度的卷积块模块流程示意图；

图2为本发明的嵌入坐标注意力的C3模块流程示意图；

图3为本发明中多尺度空间融合金字塔模块流程示意图；

图4为本发明中SiLU函数修正线性示意图；

图5为本发明中Sigmoid函数数据归一化示意图；

图6为本发明中基于缺陷检测场景下提升信息复用的图像数据处理方法的网络流程示意图。

具体实施方式

实施例

下面对本发明进一步清楚完整说明，本发明实施例提供一种基于缺陷检测场景下提升信息复用的图像数据处理方法，如图1至图6所示，包括以下步骤：S21：对输入网络的特征图进行切片采样操作，将形状为N × N × C₁的特征图X采样到scale²个尺寸为N/scale× N/scale × C₁的子特征图中，特征图X中的每个像素仍然保留在相应的子特征图中，其中特征图X的高和宽一致，均用N表示，C₁表示特征图X和采样后的子特征图的通道数，scale表示采样因子。特征图X中的每个像素仍然保留在相应的子特征图中，具体流程如图1中对输入特征图做空间换深度操作过程所示。据采样规则采样后得到的scale²个子特征图，分别命名为：f_0,0, f_1,0, f_0,1, f_1,1, …, f_{scale-1,scale-1}，其中，采样规则为：

；

其中，f和scale分别表示子特征图和特征图X上的切片操作的步幅，i和j分别是特征图X上输入矩阵中的行和列索引，i和j也代表特征图X上输入矩阵中每个元素的位置，N表示特征图X上输入矩阵的维度。

S24：第二特征图进入C3模块，首先使用SiLU激活函数对输入数据即原始图像或特征图进行数字化处理，这一步包括将从输入中提取的特征转换为数字化形式，并增强特征的非线性表达。处理后的结果通过张量矩阵进行存储，随后经过 Sigmoid 激活函数实现张量矩阵的归一化处理，从而加快卷积神经网络收敛，其中SiLU激活函数的计算公式为：

；

其中Sigmoid激活函数计算公式为：

；

其中x为输入的张量矩阵，通过Sigmoid进行压缩，Sigmoid激活函数将张量矩阵的数据根据其范围，压缩到区间（0, 1）中的某个值，以保证归一化。其中SiLU激活函数和Sigmoid激活函数曲线如图4至图5所示；

S25：归一化处理后的图像数据进入C3模块的瓶颈结构中，坐标注意力模块嵌入于C3模块的瓶颈结构中，坐标注意力模块置于瓶颈结构中的两个卷积核均为1×1的卷积模块之后，其中坐标注意力模块的嵌入位置如图2所示，坐标注意力模块通过精确的位置信息对通道关系和长期依赖性进行编码，先将输入特征图分为宽度和高度两个方向分别进行全局平均池化，分别获得在宽度和高度两个方向的特征图，公式如下：

；

接着，对经过 Sigmoid 激活函数处理的特征图执行高度和宽度方向上的卷积操作，使用1×1的卷积核，分别生成两个特征图 F_h 和 F_w。这两个特征图的通道数与在宽度和高度方向进行全局平均池化后的特征图相一致。随后，这经过1×1卷积的特征图再次经过Sigmoid 激活函数处理，分别得到在高度和宽度上的注意力权重；

在本实施例中，上述步骤S21和S22中对输入特征图进行了切片和重组操作，将输入特征图中的空间信息采样到了新特征图的通道维度中，从而使得卷积神经网络更加关注于特征图中空间信息与通道信息之间的联系，更加有利于在表面缺陷检测中捕捉空间信息与通道信息联系比较紧密的缺陷目标，从而提升目标检测精度。

在本实施例中，上述步骤S23中使用步长为1的卷积对特征图进行卷积操作，能够最大程度地减小通道降低的过程中信息的丢失，最大程度地保留原始特征图中最重要的信息。例如，如果使用步长为3的3×3卷积，则特征图中的每个像素只被采样一次，从而对特征图产生“收缩”效应。如果使用步幅为2则会导致采样不平衡，其中偶数行或列和奇数行或列的采样频率是不同的。所以使用步长为1的卷积能够最大程度地保留特征图中细粒程度的信息。

在本实施例中，上述步骤S24中的C3模块包含了3个卷积模块以及多个瓶颈模块，该模块是网络对残差特征进行学习的主要手段，其主要作用是在网络中结合不同尺度的特征图来提取更加丰富的特征信息，从而提升网络的特征提取能力。

在本实施例中，上述步骤S24中，输入数据经过整个C3模块后仅仅改变其通道数，尤其是在瓶颈结构中，通道数先减小再扩大，具体做法是先进行1×1卷积将通道数减小一半，再通过3×3卷积将通道数加倍，并使用两个卷积模块提取特征，最后再通过坐标注意力模块，其输入与输出的通道数是不发生改变的。

在本实施例中，上述步骤S25中的C3模块中的瓶颈数量随网络参数的设置而在主干部分和颈部部分的各个位置处各有不同，瓶颈结构中包含两个卷积模块。此外，网络中主干部分的瓶颈结构包含短接操作，而在网络中颈部部分的瓶颈结构不包含短接操作。瓶颈结构的作用是对C3模块中的残差特征进行进一步的学习与提取，更加增益了网络对于残差特征的特征提取能力。此外，全局感受野的实现通常依赖于合并多个尺度的特征图，以确保网络更多地能够关注到检测目标的各种尺寸和位置信息，从而能够使得网络更好地理解特征图中的整体结构和语义信息。

在本实施例中，上述步骤S21，S22，S23和S26中，输入特征图在经过采样和串联拼接之后，原始特征图中的所有像素都得以保留，即信息没有任何丢失，而在步长为1的卷积操作过程中，因通道数的大幅下降可能会导致重要信息的大量丢失。因此在C3模块的瓶颈结构中嵌入坐标注意力模块，使得网络能够在步长为1的卷积操作之后，尽可能地抓取和保留更多重要的特征信息，空间换深度的卷积块模块与嵌入坐标注意力的C3模块之间的相对位置关系如图6所示。并且坐标注意力机制的引入能够使得卷积神经网络对更加重要的特征信息分配更多权重，从而抑制背景干扰信息对表面缺陷检测带来的不利影响。此外，串联融合是一种用于合并多个张量或特征图的操作，比如将多个张量沿着一个指定的轴进行拼接，形成一个更大的张量。

在本实施例中，还包括：

S29：输入特征图经过两条分支作用后分别得到的两个特征图通过串联连接方式在通道维度上进行融合，融合完成后得到的特征图再经过一个卷积模块得到最终的特征图，多尺度空间融合金字塔模块作用过程如图3所示。

在本实施例中，上述步骤S27，S28和S29中，相比较原YOLOv5网络结构中SPPF模块，引入一条残差分支可以有助于网络捕捉基础特征，如较为浅层的位置信息、纹理信息等等，然后再与使用了更多的卷积模块的串联空间金字塔层输出的特征图进行融合。于是较为浅层的基础特征与较为深层的语义信息能够进行结合形成丰富的多尺度信息，旨在生成更丰富、多尺度的特征表达，为网络提供了更强大的语义信息提取能力，从而在表面缺陷目标检测等任务中提升了性能。

本发明的实施例公布的是较佳的实施例，但并不局限于此，本领域的普通技术人员，极易根据上述实施例，领会本发明的精神，并做出不同的引申和变化，但只要不脱离本发明的精神，都在本发明的保护范围内。

Claims

1.一种基于缺陷检测场景下提升信息复用的图像数据处理方法，其特征在于，包括以下步骤：

S21：对输入网络的特征图进行切片采样操作，将形状为N × N × C₁的特征图X采样到scale²个尺寸为N/scale × N/scale × C₁的子特征图中，特征图X中的每个像素仍然保留在相应的子特征图中，其中特征图X的高和宽一致，均用N表示，C₁表示特征图X和采样后的子特征图的通道数，scale表示采样因子；

；

其中Sigmoid激活函数计算公式为：

；

S25：归一化处理后的图像数据进入C3模块的瓶颈结构中，坐标注意力模块嵌入于C3模块的瓶颈结构中，坐标注意力模块置于瓶颈结构中的两个卷积核均为1×1的卷积模块之后，坐标注意力模块通过精确的位置信息对通道关系和长期依赖性进行编码，先将输入特征图分为高度和宽度两个方向分别进行全局平均池化，分别获得在高度和宽度两个方向的特征图；

接着将获得全局感受野的特征图沿着高度和宽度两个方向拼接在一起，之后将拼接后的特征图送入共享的卷积核为1×1的卷积模块，将拼接后的特征图的维度降低为原来的C/r，然后将经过批量归一化处理后的特征图送入Sigmoid激活函数得到形状为 1×(W+H)×C/r 的特征图，其中C为拼接后特征图的通道数，r表示对C进行降维的比例因子，W和H分别表示经过Sigmoid激活函数后的特征图的宽和高，全局感受野指在整个网络中某个层输出的单元所能感受到的输入图像区域的大小；

接着，对经过 Sigmoid 激活函数处理的特征图执行高度和宽度方向上的卷积操作，使用1×1的卷积核，分别生成两个特征图 F_h 和 F_w，这两个特征图的通道数与在宽度和高度方向进行全局平均池化后的特征图相一致，随后，这经过1×1卷积的特征图再次经过Sigmoid 激活函数处理，分别得到在高度和宽度上的注意力权重；

S26：在经过瓶颈结构中的坐标注意力模块的处理后，通过为特征图引入注意力权重，然后将结合注意力权重的输出结果与瓶颈结构外的另一残差分支相结合，另一残差分支仅经过一个卷积批归一化SiLU的集成模块，引入注意力权重的特征图再与另一残差分支输出的特征图通过串联操作融合，随后再通过一个卷积批归一化SiLU的集成模块，得到输出特征图；

S27：在YOLOv5网络结构中SPPF模块的基础上使用更多的卷积操作层并且增加了一条残差分支以实现更丰富的多尺度信息的融合，并将此使用更多的卷积操作层并且增加了一条残差分支后的SPPF模块命名为多尺度空间融合金字塔模块；

2.如权利要求1所述的一种基于缺陷检测场景下提升信息复用的图像数据处理方法，其特征在于，所述S21中根据采样规则采样后得到的scale²个子特征图，分别命名为：f_0,0,f_1,0, f_0,1, f_1,1, …, f_{scale-1,scale-1}，其中，采样规则为：

；

其中，f和scale分别表示子特征图和特征图X上的切片操作的步幅，i和j分别是特征图X上输入矩阵中的行和列索引，i和j也代表特征图X上输入矩阵中每个元素的位置，N 表示特征图X上输入矩阵的维度。

3.如权利要求1所述的一种基于缺陷检测场景下提升信息复用的图像数据处理方法，其特征在于，所述S25中全局平均池化在高度和宽度两个方向的特征图的公式如下：

；

4.如权利要求1所述的一种基于缺陷检测场景下提升信息复用的图像数据处理方法，其特征在于，所述S26中为得到 1×(W+H)×C/r 的特征图，计算公式如下：

；