CN116630728A

CN116630728A - 基于注意力残差孪生网络的加工精度预测方法

Info

Publication number: CN116630728A
Application number: CN202310577060.9A
Authority: CN
Inventors: 唐倩; 李潇; 李志航
Original assignee: Chongqing University
Current assignee: Chongqing University
Priority date: 2023-05-19
Filing date: 2023-05-19
Publication date: 2023-08-22

Abstract

本发明提供的一种基于注意力残差孪生网络的加工精度预测方法，包括以下步骤：S1.采集时序位移数据，利用分段聚合近似和格拉姆角场处理时序位移数据，得到二维灰度图像数据，将得到的灰度图像数据作为样本数据集；S2.构建注意力机制残差孪生网络，并在网络中加入通道注意力模块和残差块；S3.将样本数据集输入注意力机制残差孪生网络中进行训练；S4.判断注意力机制残差孪生网络是否训练完成，如是，则进入步骤S5，如否，则更新注意力机制残差孪生网络学习模型的参数，返回步骤S3中；S5.将待测数据输入训练完成的学习模型中进行预测分类。

Description

基于注意力残差孪生网络的加工精度预测方法

技术领域

本发明涉及一种零件加工精度预测领域，尤其涉及一种基于注意力残差孪生网络的加工精度预测方法。

背景技术

数控机床是实现复杂零件高精度加工的关键设备，已广泛应用于航空航天、模具制造、核电等领域。目前，人们对加工精度要求的日益提高，也使得对机数控床本身的质量和加工效果有了更高的要求。在数控加工作业中会产生多种生产数据，这些数据一定程度上反映了产品的加工质量，使用高效准确的加工精度预测方法对加工过程进行调控，在产品检测之前对数控机床存在的误差进行补偿，能有效提升加工性能，降低下一次加工的零件次品率。因此，对数控加工精度预测方法的研究具有十分重要的意义。

数控加工中产生的数据信号是一种时序序列，时序位移序列具有数据量大、维度高、周期性、趋势性等特点。随着工作场景的变迁、加工工况的调整、工艺指标的考虑，使用传统的方法对数控加工中产生的时序位移序列数据进行分析建模的难度越来越大。

因此，为解决上述技术问题，亟需提出一种新的技术手段。

发明内容

本发明提供的一种基于注意力残差孪生网络的加工精度预测方法，包括以下步骤：

S1.采集加工零件的时序位移数据作为样本数据集，对时序位移数据利用分段聚合近似法进行降维，再将降维后的时序位移数据进行格拉姆角场处理升维，得到时间维度和位移维度的二维矩阵，将二维矩阵转化为二维灰度图像数据；

S2.构建通道注意力模块和残差模块的注意力机制残差孪生网络；

S3.将二维灰度图像数据输入注意力机制残差孪生网络中进行训练；

S4.判断注意力机制残差孪生网络是否训练完成，如是，则进入步骤S5，如否，则更新注意力机制残差孪生网络学习模型的参数，返回步骤S3中；

S5.将实时采集的待加工零件时序位移数据通过步骤S1转化为二维灰度图像数据，将二维灰度图像数据输入至训练完成的注意力机制残差孪生网络中进行预测分类，输出预测结果。

进一步，步骤S1中，通过如下方法得到二维灰度图像数据：

对时序位移数据进行数据清洗和滤波，并去除噪声，得到有周期性的时序位移数据；

利用分段聚合近似法对时序位移数据的长度进行降维，分段聚合近似降维过程如下：

将长度为L的时序位移序列平均分为n段，求取每个时序位移序列片段的均值，并将均值作为时域特征值，再将汇聚后的时域特征值用于表征长度为L的时序位移数据，均值计算公式为：

其中，表示时序位移序列片段中的第m个时序位移序列的特征值，n表示长度为L的时序位移序列被平均分成了n段，x_k表示第m个片段中的第k个时序位移序列数值；

对降维后的时序位移数据进行格拉姆角场升维，格拉姆角场升维过程如下：

首先，对降维后的时序位移数据进行归一化处理，归一化公式为：

其中，X表示降维后的时序位移序列，X_i表示降维后的时序位移序列中第i个时序位移序列的数值，S_i表示第i个归一化后时序位移序列的数值，i表示时序位移序列序号，n表示时序位移序列的长度；

然后，将归一化后的时序位移序列转化为极坐标形式，极坐标转换公式为：

其中，表示极角，i表示时序位移序列序号，S表示归一化后的时序位移序列，S_i表示归一化之后的第i个时序位移序列，r表示极轴，t表示与时序位移序列S对应的时间，n是时序位移序列数据的个数；

最后，计算极角之和的余弦值，计算公式为：

其中，G表示时间维度和位移维度的二维矩阵，表示第i个归一化后的时序位移序列对应的极角，/>表示第j个归一化后的时序位移序列对应的极角，i和j为相邻的时序位移数据；

将时间维度和位移维度的二维矩阵转化为二维灰度图像，得到表征时序位移序列的二维灰度图像。

进一步，步骤S2中，根据如下方法构建注意力机制残差孪生网络：

注意力机制残差孪生网络有两条主干提取网络，主干提取网络均由通道注意力模块和残差模块组成，在两条主干提取网络后接一个全连接层，其中，通道注意力模块使用有效通道注意力模块，在有效通道注意力模块后堆叠3个残差模块。

进一步，步骤S3中，通过如下方法进行训练：

S31.有效通道注意力模块对输入的二维灰度图进行卷积，并在特征图的空间维度进行特征压缩，进行特征压缩时保证通道数不变，在通道维度进行学习，对各个通道的重要性进行加权，得到特征矩阵；

S32.残差模块对输入的特征矩阵进行深层特征提取，得到两个样本特征向量；

S33.将两个样本特征向量一维化，并相减得到新向量，将新向量输入至全连接层中，进行预测分类，输出预测结果。

进一步，步骤S3中，注意力机制残差孪生网络使用Contrastive loss函数作为损失函数：

使用Contrastive loss函数作为损失函数，计算损失函数在训练参数上的梯度值，进行反向传播，并使用优化器更新权重；

Contrastive loss函数如下：

其中，N表示成对输入网络的样本数量，E_w表示孪生神经网络的两个样本特征之间的欧式距离，Y表示两个样本是否匹配的标签，Y＝1代表两个样本相似或者匹配，Y＝0则代表不匹配，m为设定的表示不相似的距离阈值。

进一步，步骤S3中，将样本数据集输入注意力残差孪生网络中进行训练，学习率使用余弦退火学习率；

余弦退火公式如下：

其中，η_t表示学习率，b表示运行的次数，分别表示学习率的最小值和最大值，T_cur表示epoch的执行个数，T_b表示第b次运行中总的epoch数。

进一步，步骤S4中，当样本数据集对应的二维灰度图像输入注意力残差孪生网络中得到的预测值达到预设精度要求时，注意力残差孪生网络训练完成。

有益效果：本发明公开了一种基于注意力残差孪生网络的加工精度预测方法，是将数控加工精度预测问题转化为图像分类问题，将深度学习作为时序位移序列数据特征提取的有力工具，充分挖掘数控加工信号中的价值信息，将有效提升数控加工精度预测过程的智能化水平和预测准确率。

附图说明

下面结合附图和实施例对本发明作进一步描述：

图1为本发明的流程图；

图2为分段聚合近似降维过程图；

图3为格拉姆角场时序二维化过程图；

图4为基于通道注意力的残差孪生网络结构图；

图5为有效通道注意力模块；

图6为残差块结构图。

具体实施方式

以下结合说明书附图对本发明作出进一步说明：

S5.将实时采集的待加工零件时序位移数据通过步骤S1转化为二维灰度图像数据，将二维灰度图像数据输入至训练完成的注意力机制残差孪生网络中进行预测分类，输出预测结果。通过上述方法，能够将深度学习作为时序位移序列数据特征提取的强有力工具，充分挖掘数控加工信号中的价值信息，将有效提升数控加工精度预测过程的智能化水平和预测准确率。

本实施例中，步骤S1中，时序位移数据是一种具有时间先后顺序的位移数据，通过涡流位移传感器采集数控加工的位移数据，对时序位移数据进行数据清洗和滤波，并去除噪声，得到具有周期性的时序位移数据；

利用分段聚合近似法对时序位移数据的长度进行降维，分段聚合近似过程如图2，分段聚合近似降维为现有技术，分段聚合近似降维过程如下：

将一个长度为L的零件的时序位移序列平均分为n段，对每个时序位移序列片段计算均值，将均值作为特征值，再将整个加工信号的n个特征值进行汇聚用于表征长度为L的时序位移序列，均值计算公式为：

对降维后的时序位移数据进行格拉姆角场升维，格拉姆角场升维过程如图3，格拉姆角场升维过程为现有技术，格拉姆角场升维过程如下：

其中，i表示时序位移序列序号，X表示降维后的时序位移序列，X＝{X₁,X₂,X₃,……,X_n}，X_i表示降维后的时序位移序列中的第i个时序位移序列数值，S表示归一化后的时序位移序列，S＝{S₁,S₂,S₃,……,S_n}，S_i表示第i个归一化后的时序位移序列数值，n表示时序位移序列维度，即时序位移序列的个数

最后，计算极角之和的余弦值，计算公式为：

将时间维度和位移维度的二维矩阵转化为二维灰度图像，得到表征时序位移序列的二维灰度图像，其中，将二维矩阵转化为灰度图的方法采用常用的现有技术，例如：使用matlab进行转化，转化方法在此不加以赘述。通过上述方法，能够在降低数据维度的同时，保持数据中原有的时序位移序列信息，减少计算量和存储空间的使用，并在二维空间上较好的保留一维时序位移序列的相关性，能够更好地利用神经网络学习影响数控加工精度的主要特征。

本实施例中，步骤S2中，根据如下方法构建注意力机制残差孪生网络：

注意力机制残差孪生网络由两条主干提取网络和一个全连接层组成，具体结构如图4，,主干提取网络均由通道注意力模块和残差模块组成，其中，通道注意力模块使用有效通道注意力模块，在有效通道注意力模块后堆叠3个残差块组成残差模块，一个残差块由残差部分和捷径分支部分组成，其中，残差部分由3个卷积层组成，3个卷积层之间使用RELU激活函数，第一层卷积层的卷积核个数a,大小为1×1，第一层卷积层用于压缩channel维度，第二层卷积层的卷积核个数为a，大小为3×3，第二层卷积层用于特征提取，第三层卷积层的卷积核个数4a，大小为1×1，第三层卷积层用于还原channel维度。通过上述方法，能够增加感受野，获取图像的整体信息，并提升特征提取能力，降低模型的学习难度。

本实施例中，步骤S3中，通过如下方法训练注意力机制残差孪生网络：

S31.有效通道注意力模块通过全局平均池化获得特征图的聚合特征，再通过卷积核大小为k的一维卷积来生成通道权重，一维卷积后接Sigmoid激活函数，将得到的结果和原特征图相乘，为每一个通道赋予不同的权重，得到特征矩阵，其中，卷积核大小k根据预测分类的准确度确定，使用分类准确度最高时卷积核的大小作为最终的有效通道注意力模块的卷积核的尺度；例如，当卷积核大小为3时，预测分类的准确率为95％，当卷积核大小为7时，预测分类的准确率为98％，则有效通道注意力模块中的卷积核大小为7，通常有效通道注意力模块中使用的一维卷积核大小为7；

S33.使用flatten函数将两个样本特征向量一维化，并相减得到新向量，将新向量输入至全连接层中进行预测分类，输出预测结果；

注意力机制残差孪生网络使用的损失函数为Contrastive loss函数，Contrastive loss函数公式如下：

其中，N表示成对输入网络的样本数量，E_w表示孪生神经网络的两个一维化样本特征之间的欧式距离，Y表示两个样本是否匹配的标签，Y＝1代表两个样本相似或者匹配，Y＝0则代表不匹配，m为设定的表示不相似的距离阈值，m的取值根据具体任务进行调整，取适合任务目标的最优值，m的取值可以通过交叉验证等技术来确定，在实际使用中，可以先选取一个较大的阈值，然后根据模型在验证集上的表现进行调整，以取得最优的性能；

注意力残差孪生网络使用余弦退火作为学习率；

余弦退火公式如下：

其中，η_t表示学习率，b表示运行的次数，分别表示学习率的最小值和最大值，T_cur表示epoch的执行个数，T_b表示第b次运行中总的epoch数。通过上述方法，能够通过注意力残差孪生网络进行准确预测。

本实施例中，步骤S4中，当样本数据集对应的二维灰度图像输入注意力残差孪生网络中得到的预测结果达到预设精度要求时，注意力残差孪生网络训练完成，预设精度要求根据合格率要求进行设定。

本实施例中，步骤S5中，将待测数据输入至训练完成的注意力残差孪生网络中，经过有效通道注意力模块和残差模块后得到的两个特征向量，将两个特征向量一维化并相减，得到一个新的向量，将新的向量输入全连接层中，得到是否合格的分类结果。通过上述方法，能够将数控加工精度预测问题转化为图像分类问题，将深度学习作为时序位移序列数据特征提取的有力工具，充分挖掘数控加工信号中的价值信息，将有效提升数控加工精度预测过程的智能化水平和预测准确率。

最后说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的宗旨和范围，其均应涵盖在本发明的权利要求范围当中。

Claims

1.一种基于注意力残差孪生网络的加工精度预测方法，其特征在于：包括以下步骤：

2.根据权利要求1所述基于注意力残差孪生网络的加工精度预测方法，其特征在于：步骤S1中，通过如下方法得到二维灰度图像数据：

最后，计算极角之和的余弦值，计算公式为：

3.根据权利要求1所述基于注意力残差孪生网络的加工精度预测方法，其特征在于：步骤S2中，根据如下方法构建注意力机制残差孪生网络：

4.根据权利要求1所述基于注意力残差孪生网络的加工精度预测方法，其特征在于：步骤S3中，通过如下方法进行训练：

5.根据权利要求1所述基于注意力残差孪生网络的加工精度预测方法，其特征在于：步骤S3中，注意力机制残差孪生网络使用Contrastive loss函数作为损失函数：

Contrastive loss函数如下：

6.根据权利要求1所述基于注意力残差孪生网络的加工精度预测方法，其特征在于：步骤S3中，将样本数据集输入注意力残差孪生网络中进行训练，学习率使用余弦退火学习率；

余弦退火公式如下：

7.根据权利要求1所述基于注意力残差孪生网络的加工精度预测方法，其特征在于：步骤S4中，当样本数据集对应的二维灰度图像输入注意力残差孪生网络中得到的预测值达到预设精度要求时，注意力残差孪生网络训练完成。