CN113269237A

CN113269237A - 基于注意力机制的装配体变化检测方法、设备和介质

Info

Publication number: CN113269237A
Application number: CN202110507300.9A
Authority: CN
Inventors: 陈成军; 李长治; 李东年; 洪军
Original assignee: Qingdao University of Technology
Current assignee: Qingdao University of Technology
Priority date: 2021-05-10
Filing date: 2021-05-10
Publication date: 2021-08-17
Anticipated expiration: 2041-05-10
Also published as: CA3121440C; US11630972B2; US20220358334A1; CN113269237B; CA3121440A1

Abstract

本发明涉及一种基于注意力机制的装配体变化检测方法，包括以下步骤：建立装配体的三维模型，对三维模型中各零件添加标签，设定若干个装配节点，获取各装配节点下的三维模型在不同视角下的深度图像，并获取各装配节点新增零件的变化标签图像；选取前后两时刻不同视角下的两张深度图像作为训练样本；将训练样本依次经过语义融合、特征提取、注意力机制处理以及度量学习，对检测模型进行训练，不断选取训练样本对检测模型进行训练，保存训练过程中相似度最优的模型参数，完成训练；获取待检测的装配体装配过程中前后两装配节点的深度图像，输入至训练好的检测模型中，输出装配过程中装配体新增零件的变化图像。

Description

基于注意力机制的装配体变化检测方法、设备和介质

技术领域

本发明涉及基于注意力机制的装配体多视角变化检测方法，属于计算机视觉和智能制造技术领域。

背景技术

计算机视觉对智能制造业升级具有重要意义，尤其是深度学习网络的大量涌现促进了现代工业的发展。在大规模个性化定制生产组装过程中，产品类型的不断变化将增加组装产品的难度。在复杂装配体零部件装配过程中，若未能及时检测到新装配的零部件正确与否，则会影响到机械产品的质量和装配效率。因此，在机械类装配体装配过程中，从多视角检测每个装配步骤新装配零部件，将有助于获取机械装配过程的相关信息，并及时发现其中错误，进而实现错误快速定位，提高机械产品的生产效率，保障机械产品质量水平，对机械类装配体的装配过程智能检测具有重要研究价值。

图像变化检测能够根据两张不同时间、不同视角的图像，判断图像状态的差异。图像变化检测目前主要应用于卫星图像和航拍图像研究中，对农业调查、自然灾害检测、森林资源监测等方面具有重要实用价值。传统的变化检测方法主要包含三步流程：1)输入两张需要检测分析的图像；2)使用差异算子或其他方法获得差异图；3)分析差异图的数据差异获得变化区域。对于传统的变化检测方法，性能的好坏依赖于差异图的形成，而差异图的形成又有较大的噪声干扰，所以无法得到较高的精度。

当前，随着深度学习技术蓬勃发展，深度学习已经被引入到变化检测中，提出了许多基于深度学习的变化检测算法，并取得了良好效果。但是在这些方法中，主要是针对遥感卫星图像和航拍图像相似视角的变化检测。目前，对于机械类装配体的多视角变化检测的研究很少，这主要是因为相对于卫星图像，机械零件结构较为复杂、遮挡严重、视角变化大、零部件的颜色和纹理信息单一等特点，难以对其装配过程进行变化检测，同时缺少对应的数据集。

发明内容

为了解决上述现有技术中存在的问题，本发明提出了一种基于注意力机制的装配体变化检测方法、设备和介质，能够在装配体装配过程中进行变化检测。

本发明的技术方案如下：

技术方案一：

一种基于注意力机制的装配体变化检测方法，包括以下步骤：

建立数据集；建立装配体的三维模型，对三维模型中各零件添加标签，依据给定的装配体的装配步骤确定若干个装配节点，分别对各装配节点下的三维模型进行成像处理，获取各装配节点下的三维模型在不同视角下的深度图像，并根据零件的标签获取各装配节点新增零件的变化标签图像；

训练检测模型；选取前后两相邻装配节点的三维模型在不同视角下的两张深度图像作为训练样本；分别对两深度图像进行语义分割获得语义图像，将两语义图像与对应的深度图像进行像素融合，得到两张融合图像；分别对两张融合图像进行特征提取，获取对应的两张初始特征图；通过注意力机制分别收集两张初始特征图的上下文信息，并根据上下文信息捕获初始特征图的全局位置依赖性，得到对应的两张注意力特征图；计算两张注意力特征图之间的欧式距离，并生成特征距离图，根据特征距离图输出变化图像；定义损失函数计算变化图像与变化标签图像之间的相似度，不断选取训练样本对检测模型进行训练，保存训练过程中相似度最优的模型参数，完成训练；

变化检测；获取待检测的装配体装配过程中前后两装配节点的深度图像，输入至训练好的检测模型中，输出装配过程中装配体新增零件的变化图像。

进一步的，在所述对两张融合图像进行特征提取，获取对应的两张初始特征图的步骤中，特征提取的方法具体为：

对输入的融合图像进行3×3卷积，利用RepVGG分类网络的四个stage阶段提取输入图像的特征；

在RepVGG分类网络的每个stage阶段后嵌入注意力机制，分别得到四组特征映射，分别对四组特征映射进行1×1卷积后，再将特征映射的通道尺寸都转换为P1，P1设定为前两组特征映射的通道尺寸平均值；

将后三个stage阶段特征映射的特征图尺寸统一上采样为第一个stage阶段的特征图尺寸大小，对得到的四组特征图进行通道的串联融合，并将融合后的特征图依次进行3×3卷积和1×1卷积获得初始特征图。

进一步的，在所述RepVGG分类网络中嵌入的注意力机制与所述收集两张初始特征图的上下文信息步骤中使用的注意力机制相同，该注意力机制包括两个阶段：

在第一个阶段，通过自注意力算法，在保存原有特征信息的情况下收集特征信息水平和垂直方向的上下文信息，得到原有特征信息的横纵交叉路径；

在第二个阶段，再次通过自注意力算法，从所述横纵交叉路径获取其他上下文信息，得到特征图的全局位置依赖性。

进一步的，所述计算两张注意力特征图之间的欧式距离，并生成特征距离图，根据特征距离图输出变化图像的具体步骤为：

首先通过双线性插值将两张输入的注意力特征图的尺寸调整为与最初输入的深度图像的尺寸大小相同；

计算尺寸调整后的两张注意力特征图之间的欧式距离，并生成特征距离图；

根据特征距离图中距离信息，设定变化阈值，通过变化阈值和距离信息将深度图像区域划分为变化区域和未变区域，据此输出后一装配节点相对于前一装配节点的变化图像。

进一步的，所述损失函数具体为：

其中，d＝||a_n-b_n||₂，表示两个训练样本的映射向量之间的欧式距离，y为通过变化标签图像获取的标签值，y＝1代表相似，y＝0则代表不相似，N为训练样本像素点的个数，margin为人为设定的阈值。

技术方案二：

一种基于注意力机制的装配体变化检测设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如本发明任一实施例所述的一种基于注意力机制的装配体变化检测方法。

技术方案三：

一种基于注意力机制的装配体变化检测介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如本发明任一实施例所述的一种基于注意力机制的装配体变化检测方法。

本发明具有如下有益效果：

本发明设计了包含语义融合模块、特征提取模块、注意力模块、度量学习模块的检测模型。其中，语义融合模块用于融合语义图像和深度图像获得融合图像，进而丰富图像特征信息；特征提取模块提取融合图像的高维语义信息和低维空间信息获得初始特征图；注意力模块从初始特征图中快速聚焦于当前任务的关键信息，进而获得最终特征图；度量学习模块根据最终特征图的特征信息计算特征间的距离大小以获得变化区域，通过变化区域输出装配体前后装配节点的变化图像，利用变化图像可以监测装配体装配过程中的漏装、错装以及装配步骤。

附图说明

图1为本发明实施例的流程图；

图2为本发明实施例检测模型的示意图；

图3为本发明实施例中特征提取模块的示例图；

图4为本发明实施例中注意力模块的示例图；

图5为本发明实施例中训练样本的示例图；

图6为本发明实施例中，模型输出的变化图像与真实的变化标签图像的示例图。

具体实施方式

下面结合附图和具体实施例来对本发明进行详细的说明。

实施例一：

参见图1，一种基于注意力机制的装配体变化检测方法，包括以下步骤：

建立数据集；通过SolidWorks软件建立机械装配体的三维模型，对三维模型中各零件添加标签，本实施例中，对零件添加的标签为颜色标记，设定m个装配节点，m-1个装配步骤，每个步骤装配一个零零件，然后将机械装配体的三维模型加载到深度图像和彩色图像成像软件中，设定虚拟摄像机分别对各装配节点的不同角度进行成像处理，获取各装配节点下的三维模型在不同视角下的深度图像和彩色图像，并利用彩色图像的颜色标记生成各装配节点新装配的零件的变化标签图像；

训练检测模型；选取前一装配节点的三维模型在一视角下的深度图像以及后一装配节点的三维模型在不同视角下的深度图像作为一组训练样本；

参见图2，本实施例中，检测模型包括四个模块：语义融合模块、特征提取模块、注意力模块以及度量学习模块；

首先将训练样本输入至语义融合模块，语义融合模块包括语义分割网络和像素融合网络，首先通过语义分割网络分别对两张深度图像进行语义分割获得对应的两张语义图像，再通过像素融合网络将两张语义图像分别与其对应的深度图像进行像素融合，得到两张融合图像；本实施例中，语义分割网络(如FCN、U-Net等)用于分割装配体零件，将不同视角的深度图像输入到语义分割网络得到语义图像。像素融合网络采用像素级图像融合方法将语义图像和深度图像按一定的像素比例值融合，从而在融合语义信息的条件下尽量保存深度信息，增加了图像特征信息量。

通过特征提取模块分别对两张融合图像进行特征提取，本实施例设计了多尺度特征提取融合机制，融合高维语义信息和低维空间信息以增加特征的信息量，获取对应的两张初始特征图；

通过注意力模块，利用注意力机制分别收集两张初始特征图的上下文信息，并根据上下文信息捕获初始特征图的全局位置依赖性，得到对应的两张注意力特征图；

通过度量模块，首先计算两张注意力特征图之间的欧式距离，并生成特征距离图，根据特征距离图输出变化图像；定义损失函数计算变化图像与后一装配节点的变化标签图像之间的相似度，不断选取训练样本对检测模型进行训练，保存训练过程中相似度最优的模型参数，完成训练；

本实施例设计了包含语义融合模块、特征提取模块、注意力模块、度量学习模块的检测模型。其中，语义融合模块用于融合语义图像和深度图像获得融合图像，进而丰富图像特征信息；特征提取模块提取融合图像的高维语义信息和低维空间信息获得初始特征图；注意力模块从初始特征图中快速聚焦于当前任务的关键信息，进而获得最终特征图；度量学习模块根据最终特征图的特征信息计算特征间的距离大小以获得变化区域，通过变化区域输出装配体前后装配节点的变化图像，利用变化图像可以监测装配体装配过程中的漏装、错装以及装配步骤是否正确。

实施例二：

参见图3，本实施例提出了一种特征提取模块的具体实现方式：

首先对输入的融合图像进行3×3卷积，利用RepVGG分类网络的四个stage阶段提取输入图像的特征；

将后三个stage阶段特征映射的特征图尺寸统一上采样为第一个stage阶段的特征图尺寸大小，对得到的四组特征图进行通道的串联融合，并将融合后的特征图依次进行3×3卷积和1×1卷积获得初始特征图。由于采用多尺度特征融合机制，得到的融合后特征图信息量较大，不利于模块速度和精度的提升，通过这二个卷积层能够有效降低通道维度，充分利用融合后的特征信息，生成更具区分性的特征量。

进一步的，参见图4，在所述RepVGG分类网络中嵌入的注意力机制与所述注意力模块使用的注意力机制相同，本实施例提出了一种注意力机制的具体实现方式，该注意力机制包括两个阶段：

在第一个阶段即Self-attention 1，通过Self-attention自注意力算法，在保存原有特征信息的情况下收集特征信息水平和垂直方向的上下文信息，得到包含原有特征信息的横纵交叉路径的初始注意力特征图；

在第二个阶段即Self-attention 2，将产生的初始注意力特征图馈送给Self-attention 2，再次通过Self-attention自注意力算法，从所述横纵交叉路径获取其他上下文信息，得到特征图的全局位置依赖性。在Self-attention 1阶段和Self-attention 2阶段共享每个特征向量参数值，只需两次Self-attention算法便可捕获全局位置依赖性，输出最终注意力特征图中的每个位置都可以从所有像素中收集信息。注意力模块有助于在众多的输入信息中快速聚焦于当前任务关键信息，降低无关信息，并显著提高任务的处理效率和准确性

进一步的，本实施例提出了一种度量学习模块的具体实现方式：

该模块通过学习从输入数据到映射空间的非线性转换，对于相似样本的映射向量趋向于更近，而相异样本的映射向量彼此趋向于远离。为此，本专利采用对比损失函数来定义映射向量的较小距离和较大距离来实现映射空间中的每个变化。对比损失函数L为：

其中d＝||a_n-b_n||₂，代表两个样本映射向量的欧氏距离，y为通过变化标签图像获取的标签值，y＝1代表预测出的变化图像与真实的变化标签图像对应的像素点的像素值相似或匹配，y＝0则代表不匹配，N为训练样本像素点的个数，margin为设定的阈值，这里设定为1。该损失函数可以理解为两步骤，一步是计算两个训练样本的距离信息，也就是前后两张图像的特征差异信息。第二步是根据这个差异信息，即预测的变化图像与真实的变化标签图像的实际差异信息进行对比。

具体过程中，首先给定不同时刻、不同视角的双时相特征图，通过双线性插值将每个特征图的大小调整为与输入的图像大小相同。然后计算尺寸调整后的特征图之间的欧式距离，以生成特征距离图

其中W₀，H₀分别为输入图像的高度和宽度。在训练阶段，通过上述定义的对比损失函数学习并不断更新网络参数，生成变化掩码并保存最优模块。在测试阶段，根据训练网络所保存的最优模型，通过设定固定阈值获得变化区域B：

其中i,j(1≤i≤W₀,1≤j≤H₀)，表示特征距离图D的宽和高索引，θ为分离变化区域设定的固定阈值，在这里设定为1。

基于变化区域B输出装配过程的场景变化图像。如图5和图6所示，图5中展示了一组训练样本，即装配体的三维模型在前后时刻两相邻装配节点的深度图像的示例图；图6中，左边为根据图5中两深度图像输出的变化图像，右边为根据装配节点得到的实际变化标签图像；通过损失函数计算相似度，不断选取训练样本对模型进行迭代训练，使模型输出的变化图像逐渐匹配变化标签图像。

实施例三：

实施例四：

以上所述仅为本发明的实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种基于注意力机制的装配体变化检测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于注意力机制的装配体变化检测方法，其特征在于，在所述对两张融合图像进行特征提取，获取对应的两张初始特征图的步骤中，特征提取的方法具体为：

3.根据权利要求2所述的一种基于注意力机制的装配体变化检测方法，其特征在于，在所述RepVGG分类网络中嵌入的注意力机制与所述收集两张初始特征图的上下文信息步骤中使用的注意力机制相同，该注意力机制包括两个阶段：

4.根据权利要求1所述的一种基于注意力机制的装配体变化检测方法，其特征在于，所述计算两张注意力特征图之间的欧式距离，并生成特征距离图，根据特征距离图输出变化图像的具体步骤为：

5.根据权利要求1所述的一种基于注意力机制的装配体变化检测方法，其特征在于，所述损失函数具体为：

6.一种基于注意力机制的装配体变化检测设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至5任一项所述的一种基于注意力机制的装配体变化检测方法。

7.一种基于注意力机制的装配体变化检测介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的一种基于注意力机制的装配体变化检测方法。