CN114863094A

CN114863094A - 基于双支路网络的工业图像感兴趣区域分割算法

Info

Publication number: CN114863094A
Application number: CN202210609039.8A
Authority: CN
Inventors: 都卫东; 方志斌; 张鹏
Original assignee: Focusight Technology Co Ltd
Current assignee: Focusight Technology Co Ltd
Priority date: 2022-05-31
Filing date: 2022-05-31
Publication date: 2022-08-05

Abstract

本发明涉及一种基于双支路网络的工业图像感兴趣区域分割算法，包括以下步骤，S1、收集工业零件的图像数据集；S2、按照不同质检要求，对数据集进行感兴趣区域标注；S3、对数据集进行预处理和扩增并划分数据集；S4、构建双支路网络，包括语义信息提取支路和空间信息提取支路；根据优化目标，通过感兴趣区域标注数据集对网络进行训练，得到训练好的模型；S5、将待测工业图像输入训练好的模型中得到对于的感兴趣区域分割图。本发明采用双支路结构，按照工业零件的质量检测要求，实时地将工业图像划分成多个感兴趣区域，以便后续检测，具有分割速度快，分割精度高，能够替代人工提取感兴趣区域，降低产品质量评估难度，提高效率等特点。

Description

基于双支路网络的工业图像感兴趣区域分割算法

技术领域

本发明涉及图像视觉检测技术领域，尤其是一种基于双支路网络的工业图像感兴趣区域分割算法。

背景技术

随着科学技术的发展，工业生产也逐渐步入智能化时代。工业智能化所需的智能设备和生产的产品，往往都需要去检测器完整性和功能性。以前常常通过人工来对工业零件进行质量评估，这不仅需要大量的劳动力，而且包含很多的主观性影响其客观结果。同一工业零件的质量评估要经过很多种工序，每种工序所对应的需要检测感兴趣区域也不大不相同。因此，如何快速准确将工业零件图像分割为不同检测工序所需的感兴趣区域图像成为工业缺陷检测领域亟待解决的问题。

近年来，图像分割技术取得了重大的进展。传统的语义分割方法基于阈值的选择、区域增长、超像素、图算法采用手工制作的特性来解决这个问题。随着深度学习的发展，越来越多的科研工作者使用深度学习来解决感兴趣区域的分割问题。近年来，许多基于FCN(全卷积神经网络)的算法在不同的基准上保持着优越的性能，其主要划分为两种类型：基于空洞卷积的网络，基于编解码的网络。基于空洞卷积的网络去除掉下采样操作，并且对使用卷积进行上采样，来保持高分辨率的特征描述。Deeplabv3网络采用了空洞空间金字塔来捕获更多的上下层特征，PSPNet在空洞卷积的网络主干上也采用了空间金字塔池化模块。另一方面，基于编解码的网络通常会采用自下而上的横向连接，使得解码器部分能够恢复高分辨率的特征图。U-Net、SegNet保存了池化的索引来帮助上采样操作获得更好的分割结果，DFN网络采用通道注意力模块来放大更有效的特征通道，以此提高准确率。但这两种类型网络的参数量较大，都使用了较宽而且较深的网络来同时提取图像的低级空间信息和高级语义信息，虽然他们都达到了很好地准确率，但是他们的推理速度都很慢，无法满足实时地要求。这主要的原因就是，网络越宽、越深其包含的参数就越多，计算量也就越大，其推理时间也就会想应地变长，无法满足实时地需求。

为了更好地满足快速响应和交互的实时需求，很多学者也开发出了优秀的实时分割网络。SegNet采用一个小的网络和跳过连接的操作来实现快速的推理，E-Net重新设计了一个参数量很小速度很快的轻量级网络，DFANet通过不断重新利用特征来增加特征表示能力并降低网络复杂度提高速度。虽然这些实时的分割网络可以实现推理速度的飞跃，但是由于参数量的骤减，虽然满足了速度上的要求，但在精度上丢失了很多。主要原因是其大多是选择丢掉低级的空间信息来进行分割，在细节边缘的表现就很差，会丢失图像的低级空间信息，极大地影响网络准确率。

发明内容

本发明要解决的技术问题是：提供一种基于双支路网络的工业图像感兴趣区域分割算法，按照工业零件的质量检测要求，实时地将工业图像划分成多个感兴趣区域，以便后续检测，具有分割速度快，分割精度高，能够替代人工提取感兴趣区域，降低产品质量评估难度，提高效率等特点。

本发明解决其技术问题所采用的技术方案是：一种基于双支路网络的工业图像感兴趣区域分割算法，包括以下步骤，

S1、收集工业零件的图像数据集；

S2、按照不同质检要求，对数据集进行感兴趣区域标注；

S3、对数据集进行预处理和扩增并划分数据集；

S4、构建双支路网络，包括语义信息提取支路和空间信息提取支路；根据优化目标，通过感兴趣区域标注数据集对网络进行训练，得到训练好的模型；

S5、将待测工业图像输入训练好的模型中得到对于的感兴趣区域分割图。

进一步的说，本发明所述的步骤S1中，数据需要在检测平台上，使用均匀恒定的光源进行拍摄，按照统一的格式进行保存。

进一步的说，本发明所述的步骤S3中，将采集到的工业图像进行去噪和/或滤波操作，并将图像进行切分，调整图像大小；然后将调整大小后得到的图像，通过旋转、翻转、随机噪声和/或颜色变换来增强数据并扩充数据集；最后将扩增后的数据集按照8:2的比例随机划分为训练集和测试集。

进一步的说，本发明所述的步骤S4中，包括以下步骤，

S401、空间信息提取支路包括3个卷积模块，输入图像x经过空间信息提取支路的3个卷积模块后得到的最终特征图就是空间信息特征图Y1；

S402、语义信息提取支路包括5个卷积模块，输入图像x经过语义信息提取支路的5个卷积模块后得到的最终特征图就是语义信息特征图Y2；

S403、空间信息特征图Y1和语义信息特征图Y2通过特征融合模块将二者向对方的特征维度进行采样并进行点乘操作，以此来融合二者，得到特征图Y3；

S404、使用步长为1，卷积核3x3的卷积模块对特征图Y3在通道层进行融合，得到最终的特征图Y；

S405、使用分割模块对特征图Y进行分割预测；

S406、使用加权交叉熵损失函数来优化网络。

再进一步的说，本发明所述的步骤S403中，空间信息特征图Y1使用均值池化下采样4倍得到特征图Y1’，将Y1’与Y2进行点乘获得新的融合特征Y12；语义信息特征图Y2使用双线性差值进行4倍上采样获得特征图Y2’，并将Y2’与Y1进行点乘获得新的融合特征Y21；最终，使用双线性差值将Y12上采样4倍，再与Y21在通道维度进行拼接，得到特征图Y3。

再进一步的说，本发明所述的S405中，使用分割模块对特征图Y进行分割预测时，先使用双线性差值将特征图Y上采样到原图的分辨率，再使用1x1xN的卷积层进行分割预测；其中N为不同感兴趣区域的数量。

再进一步的说，本发明所述的S406中，加权交叉熵损失函数公式为：

其中，N为感兴趣区域类别数，wⁱ为i区域类别占总区域的比例的倒数，yⁱ代表输入图像的真实标签，

表示网络的预测结果。

本发明的有益效果是：

1、端到端检测，由输入图像可以直接得到感兴趣区域分割图；

2、双支路网络包含的语义信息提取支路和空间信息提取支路，在提取到有效的高维语义信息的同时，可以很好地保留图像底层特征的空间信息；

3、双支路网络的参数量小，分割速度快能满足实时要求。

附图说明

图1是本发明感兴趣区域提取方法流程图；

图2是本发明双支路网络结构图；

图3是本发明卷积模块结构图；

图4是本发明分割模块结构图。

具体实施方式

现在结合附图和优选实施例对本发明作进一步详细的说明。这些附图均为简化的示意图，仅以示意方式说明本发明的基本结构，因此其仅显示与本发明有关的构成。

如图1-图4所示的一种基于双支路网络的工业图像感兴趣区域分割算法，在网络的设计上，采用双支路结构，设计了语义信息提取支路和空间信息提取支路来分别提取低级的空间信息与高级的语义信息；将低级的空间信息与高级的语义信息进行区分提取，接着使用特征融合模块来融合两种特征，使得网络保留高层语义信息的特征提取能力的同时，也能很好地兼顾到低级的空间信息，以此实现高精度和高效率。

如图1所示，本发明主要包括以下步骤：数据集构建、数据标注、数据预处理、扩增和划分、训练双支路网络，从而实现对各个图像的感兴趣区域进行有效分割。

下面对各个步骤进行详细说明：

步骤S1：数据集构建：构建工业数据集，所述数据需要在检测平台上，使用均匀恒定的光源进行拍摄，按照统一的格式进行保存。

步骤S2：数据集标注：对收集到的工业零件数据集，使用Label-me等标注工具对图像进行感兴趣区域划分，生成标注文件并转化为图片格式(label图)。

步骤S3：数据预处理和扩增：采集到的工业图像进行去噪、滤波，以此去除拍照环境造成的影响。然后使用旋转、翻转、随机噪声等操作对工业图像和其对应的label图进行扩增。最后按照8:2的比例，将扩增后的数据集随机划分为训练集和测试集。

步骤S4：网络训练：利用划分好的数据集训练所提出的双支路网络。

步骤S5：利用训练好的双支路网络对工业图像进行感兴趣区域分割。

在步骤S1中，数据集的构建之前，更详细的步骤包括：

步骤S101：根据待检测设备和检测平台所处的环境，选择合适的光源和相机，并调配到最佳状态。

在步骤S2中，更详细的数据预处理包括：

步骤S201：使用label-me等标注软件对采集到的图像进行标注，获得不同感兴趣区域的标签文件，再将图像的标签文件转换成png图像格式。

在步骤S3中，更详细的数据预处理和扩增操作并划分数据集操作包括：

步骤S301：首先，对相机采集到的图像进行去噪和滤波等图像操作，获得较为纯净的图像。

步骤S302：采集到的工业图像都是非常大的，需要将得到的工业图像进行切分，得到512x512大小的图像块。特别地，对样本标签也做同样的调整大小操作，确保待分割图像和label图一一对应。

步骤S303：将调整大小后得到的图像，通过旋转、翻转、随机噪声和颜色变换等数据增强操作来扩充数据集。当图像在旋转和翻转操作时，对应图像的标签图像也进行相同的操作。当图像进行随机噪声和颜色变换等操作时，图像的标签数据不发生改变。

步骤S304：将扩增后的数据集按照8:2随机划分为训练集和测试(验证)集。

在步骤S4中，更详细的网络训练模块操作包括：

步骤S401：构建基于双支路的网络结构，所述网络的架构如图2所示。网络主要包含2个分支：语义信息提取支路和空间信息提取支路。空间信息提取支路主要为3个卷积模块，每个卷积模块结构如图3所示，其中3x3卷积层的步长为2，这会使输入数据的特征图变为原来的1/2。空间信息提取支路的输入图像为x(大小为512×512×3)经过三个卷积模块分别得到256×256×64，128×128×128，64×64×256的特征图，最终的64×64×256特征图就是空间信息特征图Y1。而语义信息提取支路包含5个卷积模块，其会将输入图像抽象为256×256×16，128×128×32，64×64×64，32×32×128，16×16×256的特征图，最小的16×16×256的特征图就是语义信息特征图Y2。

步骤S402：通过双支路分别获得空间信息特征Y1(64×64×256)和语义信息特征Y2(16×16×256)，设计了新的融合模块会将二者向对方的特征维度进行采样并进行点乘操作，以此来融合二者有点。

具体来说，空间信息特征Y1将会使用均值池化下采样4倍得到16×16×256特征图，将其与Y2进行点乘获得新的融合特征Y12(16×16×256)。另一方面，语义信息特征Y2将会使用双线性差值进行4倍上采样获得64×64×256的特征图，并将其与Y1进行点乘获得新的融合特征Y21(64×64×256)。最终，使用双线性差值将Y12上采样4倍，再与Y21在通道维度进行拼接，得到特征图Y3(64×64×512)。

步骤S403：使用步长为1，卷积核3x3的卷积模块对特征图Y3在通道层进行融合，得到最终的特征图Y(64×64×256)。如图4所示，使用分割模块对特征图Y进行分割预测，先使用双线性差值将特征图Y上采样到原图的分辨率，再使用1×1×N的卷积层进行分割预测。其中N为不同感兴趣区域的数量，也就是区域类别数。

由于不同感兴趣区域的大小不同，数据集中的不同感兴趣区域的数据占比就会失衡，不利于双支路网络的学习。故使用加权交叉熵损失函数来优化网络，公式如下：

其中，N为感兴趣区域类别数，wⁱ为i区域类别占总区域的比例的倒数(总区域面积和/i类别区域面积)，yⁱ代表输入图像的真实标签，

表示网络的预测结果。

在步骤S5中，利用所训练的双支路网络模型对工业图像进行感兴趣区域分割的详细操作如下：

步骤S501：对采集到的工业图像进行预处理，将其切分为512×512的小图，送入训练好的双支路网络中进行感兴趣区域分割，最后将分割好的小图在拼成原始工业图像大小。

本发明提出基于双支路网络的感兴趣区域分割架构，使用不同支路来提取不同特征，每条支路的参数量都大大减少，有效缩短了工业图像感兴趣区域分割时间，能满足实施要求。

本发明提出的双支路网络设计了两条支路，空间信息提取支路和语义信息提取支路分别提取空间信息特征和语义信息，独立的分支提取到的对应特征更具有表达力。此外，设计的特征融合模块，使不同的特征能有效地融合到一起，有效提高网络的精度

由于不同感兴趣区域大小差距过大，会引发数据倾斜的问题，也就是网络将图像过多的预测为面积大的感兴趣区域。而本发明使用加权的交叉熵损失来优化网络参数，加权能有效平衡数据之间的占比，使得网络更鲁棒。

以上说明书中描述的只是本发明的具体实施方式，各种举例说明不对本发明的实质内容构成限制，所属技术领域的普通技术人员在阅读了说明书后可以对以前所述的具体实施方式做修改或变形，而不背离发明的实质和范围。

Claims

1.一种基于双支路网络的工业图像感兴趣区域分割算法，其特征在于：包括以下步骤，

S1、收集工业零件的图像数据集；

S2、按照不同质检要求，对数据集进行感兴趣区域标注；

S3、对数据集进行预处理和扩增并划分数据集；

2.如权利要求1所述的基于双支路网络的工业图像感兴趣区域分割算法，其特征在于：所述的步骤S1中，数据需要在检测平台上，使用均匀恒定的光源进行拍摄，按照统一的格式进行保存。

3.如权利要求1所述的基于双支路网络的工业图像感兴趣区域分割算法，其特征在于：所述的步骤S3中，将采集到的工业图像进行去噪和/或滤波操作，并将图像进行切分，调整图像大小；然后将调整大小后得到的图像，通过旋转、翻转、随机噪声和/或颜色变换来增强数据并扩充数据集；最后将扩增后的数据集按照8:2的比例随机划分为训练集和测试集。

4.如权利要求1所述的基于双支路网络的工业图像感兴趣区域分割算法，其特征在于：所述的步骤S4中，包括以下步骤，

S405、使用分割模块对特征图Y进行分割预测；

S406、使用加权交叉熵损失函数来优化网络。

5.如权利要求4所述的基于双支路网络的工业图像感兴趣区域分割算法，其特征在于：所述的步骤S403中，空间信息特征图Y1使用均值池化下采样4倍得到特征图Y1’，将Y1’与Y2进行点乘获得新的融合特征Y12；语义信息特征图Y2使用双线性差值进行4倍上采样获得特征图Y2’，并将Y2’与Y1进行点乘获得新的融合特征Y21；最终，使用双线性差值将Y12上采样4倍，再与Y21在通道维度进行拼接，得到特征图Y3。

6.如权利要求4所述的基于双支路网络的工业图像感兴趣区域分割算法，其特征在于：所述的S405中，使用分割模块对特征图Y进行分割预测时，先使用双线性差值将特征图Y上采样到原图的分辨率，再使用1x1xN的卷积层进行分割预测；其中N为不同感兴趣区域的数量。

7.如权利要求4所述的基于双支路网络的工业图像感兴趣区域分割算法，其特征在于：所述的S406中，加权交叉熵损失函数公式为：

表示网络的预测结果。