CN114239733A

CN114239733A - 基于迁移学习的机床响应建模方法、系统及响应预测方法

Info

Publication number: CN114239733A
Application number: CN202111570003.5A
Authority: CN
Inventors: 胡鹏程; 谢杰君; 高仕博
Original assignee: Huazhong University of Science and Technology
Current assignee: Huazhong University of Science and Technology
Priority date: 2021-12-21
Filing date: 2021-12-21
Publication date: 2022-03-25

Abstract

本发明公开了一种基于迁移学习的机床响应建模方法、建模系统以及响应预测方法，该建模方法包括：利用源域数据训练源域响应预测模型；在源域响应预测模型上加入自适应层，以使损失函数小于预设值为目标反向调节源域响应预测模型的参数，得到域适应初始模型，损失函数包括分类损失和域适应损失；将目标域数据输入域适应初始模型进行微调，得到域适应模型；将源域数据输入域适应模型，得到辅助训练数据；利用辅助训练数据和目标域数据训练目标域响应预测模型。该方法结合模型迁移和样本迁移，实现源域数据的复用，减少了新工况下模型建立对新数据的需求量，从而降低实际生产中面对多种不同工况进行数据采集的实验成本。

Description

基于迁移学习的机床响应建模方法、系统及响应预测方法

技术领域

本发明属于神经网络学习技术领域，更具体地，涉及一种基于迁移学习的机床响应建模方法、建模系统以及响应预测方法。

背景技术

在现代加工过程中，利用计算机技术建立机床响应模型可以快速预测对应工艺参数条件下的机床响应，如今数据驱动建模是最常用的预测机床响应的方法之一，建立性能优良的模型可以快速预测得到机床响应。众多的研究者一直致力于特定场景建模的研究，然而，当工况发生改变时，需要根据新的工艺条件重新建模。例如，通过切削建模预测主轴功率时，不同的加工条件对模型有不同的系数和参数。因此，一种切削条件下的模型难以应用于另一种切削条件。例如，加工铝的切削功率模型不能用于预测切削钢的功率。在这种情况下，唯一可行的方法是根据新的切削条件重建模型。然而，这是一个耗时且繁琐的过程，尤其是对于具有大量切削条件组合的铣削操作。如何在新的加工条件下高效、方便地建立预测模型是一个迫切而富有挑战性的问题。

发明内容

针对现有技术的以上缺陷或改进需求，本发明提供了一种基于迁移学习的机床响应建模方法、建模系统以及响应预测方法，其目的在于结合已有的不同工况下的数据集进行建模，由此解决重新获取当前工况下的实验数据进行建模所导致的效率低、耗时长的技术问题。

为实现上述目的，按照本发明的一个方面，提供了一种基于迁移学习的机床响应建模方法，包括：

获取源域数据和目标域数据，其中，所述源域数据为第一工况下的样本数据，所述目标域数据为第二工况下的样本数据；

利用所述源域数据训练源域响应预测模型；

在所述源域响应预测模型上加入自适应层，将所述源域数据输入所述源域响应预测模型，基于所述自适应层计算损失函数并以使所述损失函数小于预设值为目标反向调节所述源域响应预测模型的参数，得到域适应初始模型，所述损失函数包括分类损失和域适应损失，所述域适应损失包括所述源域数据和所述目标域数据之间的最大均值差异损失；

将所述目标域数据输入所述域适应初始模型，以分类损失函数小于预设值为目标对所述域适应初始模型的参数进行反向微调，得到域适应模型；

将所述源域数据输入所述域适应模型，得到辅助训练数据；

利用所述辅助训练数据和所述目标域数据训练目标域响应预测模型。

在其中一个实施例中，

所述源域数据包括：

所述目标域数据包括：

其中，x_i表示第i个样本数据中的工艺参数特征向量，y_i表示第i个样本数据中与工艺参数特征向量对应的响应特征；n表示源域数据的样本数量，m表示目标域的样本数量，k表示每个样本内的特征维度；

包括分类损失和域适应损失的损失函数为：

其中，

表示将

输入所述源域响应预测模型所得到的结果，λ为权重。

在其中一个实施例中，所述域适应初始模型的神经网络结构包括顺序连接的第一至第四层，其中，第一层为输入层、第二层和第三层为隐藏层，第四层为输出层。

在其中一个实施例中，进行反向微调的步骤包括：

冻结域适应初始模型的神经网络结构及其第一层和第二层的系数，确定第三层的映射

sp＝σ₃(W₃x₃+b₃)

其中，sp为输出层的输出结果，x₃为第三层的向量，W₃和b₃为第三层的系数，σ₃为第三层的激活函数；

利用所述目标域数据训练所述域适应初始模型，以分类损失函数小于预设值为目标训练系数W₃和b₃，得到域适应模型。

在其中一个实施例中，利用所述源域数据训练源域响应预测模型时的学习率为c，利用所述目标域数据训练所述域适应初始模型时的学习率小于或等于

在其中一个实施例中，利用所述辅助训练数据和所述目标域数据训练目标域响应预测模型，包括：

步骤S1：初始化权重向量

其中，第i个样本的权重为

步骤S2：对于第t次迭代，调用基学习器，根据合并数据集T＝T_s′∪T_t以及T＝T_s′∪T_t上的权重分布w^t，得到一个基学习器h_t:X→Y；

步骤S3：计算基学习器h_t对数据集T中每个样本的调整误差：

其中，E_t表示目标域数据集T_t中样本误差的最大值，且

步骤S4：计算h_t在目标域数据集T_t上的调整误差：

步骤S5：判断∈_t是否小于设定阈值，若否，跳转至步骤S2，若是，则将第t+1次迭代的权重向量可以更新为：

其中，β_t＝ε_t/(1-ε_t)，

N为预设迭代次数；

步骤S6：判断迭代次数是否达到预设迭代次数，若否，则继续迭代直至迭代次数达到预设迭代次数，生成一组基学习器{h₁,h₂,…,h_N}，取后P个基学习器集成，得到最终的目标域响应预测模型：

在其中一个实施例中，训练目标域响应预测模型所基于的神经网络结构和训练源域响应预测模型所基于的神经网络结构相同。

在其中一个实施例中，所述源域数据为第一加工工况下的铣削主轴功率样本数据，所述目标域数据为第二加工工况下的铣削主轴功率样本数据，所述源域响应预测模型为源域铣削主轴功率预测模型，所述目标域响应预测模型为目标域铣削主轴功率预测模型。

为实现上述目的，按照本发明的另一个方面，提出一种基于迁移学习的机床响应建模系统，包括：

数据获取单元，用于获取源域数据和目标域数据，其中，所述源域数据为第一工况下的样本数据，所述目标域数据为第二工况下的样本数据；

源域建模单元，用于利用所述源域数据训练源域响应预测模型；

自适应调节单元，用于将所述源域数据输入所述源域响应预测模型，计算损失函数并以使所述损失函数小于预设值为目标反向调节所述源域响应预测模型的参数，得到域适应初始模型，所述损失函数包括分类损失和域适应损失，所述域适应损失包括所述源域数据和所述目标域数据之间的最大均值差异损失；

微调单元，用于将所述目标域数据输入所述域适应初始模型，以分类损失函数小于预设值为目标对所述域适应初始模型的参数进行反向微调，得到域适应模型；

数据迁移单元，用于将所述源域数据输入所述域适应模型，得到辅助训练数据；

目标域建模单元，用于利用所述辅助训练数据和所述目标域数据训练目标域响应预测模型。

为实现上述目的，按照本发明的又一个方面，提出一种基于迁移学习的响应预测方法，包括：

获取目标域响应预测模型，所述目标域响应预测模型为根据上述的基于迁移学习的机床响应建模方法所得到的目标域响应预测模型；

将已知参数输入所述目标域响应预测模型，得到与已知参数对应的预测信息。

总体而言，本申请提出了一种模型迁移和样本迁移混合的迁移学习方法，将历史保存的第一工况下的源域数据样本重新利用到第二工况下以降低对第二工况下目标域数据样本的需求。首先，基于模型迁移的方法建立域适应模型神经网络，即复用已经训练好的源域响应预测模型，依次通过自适应调节和微调技术，将源域响应预测模型调整为域适应模型。然后，基于样本迁移的方法获取辅助训练数据，即将源域数据输入域适应模型，得到辅助训练数据，通过域适应模型可以实现两种不同工况下数据的域适应，减少数据分布差异，使得源域的大量数据样本可以在目标域的建模过程中实现重用。

与直接使用未经域适应处理的源域数据相比，通过域适应得到的更加近似于目标域数据的源域辅助训练数据，将其用于迁移建模过程对建模效果的提升十分显著。并且，在一种工况已经采集了充足的数据本的情况下，通过对该工况的数据样本的迁移，从而使得在其他类似的加工工况中，只需要很少量的新数据就可以建立性能良好的主轴功率预测模型，减少了新工况下模型建立对新数据的需求量，从而降低实际生产中面对多种不同工况进行数据采集的实验成本。

附图说明

图1为本申请一实施例中的基于迁移学习的机床响应建模方法的步骤流程图；

图2为本申请一实施例中的基于迁移学习的铣削主轴功率建模方法的步骤流程图；

图3为本申请一实施例中的源域响应预测模型的神经网络结构图；

图4为本申请一实施例中的在源域响应预测模型上加入自适应层后的结构示意图；

图5所示为本申请一实施例中具体获取辅助训练数据的步骤流程图；

图6为本申请一实施例中的目标域响应预测模型构建流程图；

图7为本申请一实施例中的域适应模型进行源域和目标域数据域适应的结果图；

图8为采用本申请一实施例中的迁移建模方法得到的预测模型在目标域部分测试集上的预测效果；

图9为采用本申请一实施例中的迁移建模方法得到的预测模型在目标域全部测试集上的预测误差曲线图；

图10为采用本申请一实施例中的迁移建模方法得到的预测模型在目标域全部测试集上的预测误差分布的占比情况；

图11为本申请使用目标域的192组数据单独训练主轴功率模型的预测效果图；

图12为为采用本申请一实施例中的迁移建模方法得到的预测模型预测效果图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。此外，下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

图1为本申请一实施例中的基于迁移学习的机床响应建模方法的步骤流程图，图2为本申请一实施例中的基于迁移学习的铣削主轴功率建模方法的步骤流程图。如图1和图2所示，该方法包括以下步骤：

步骤S100：获取源域数据和目标域数据，其中，源域数据为第一工况下的样本数据，目标域数据为第二工况下的样本数据。

其中，第一工况和第二工况的加工参数不同。

源域数据可以是已经保存的第一工况下的历史数据样本，目标域数据可以是当前通过实验重新获得的新数据样本。目标域数据中的样本数据远小于源域数据中的样本数量，即目标域响应预测模型训练所用的数据样本中，复用源域数据的样本数据占比更大。其中，每个样本均包含多个维度的特征值，具体为工艺参数特征以及与工艺参数特征对应的响应特征，通常，响应特征为一个，而工艺参数特征可以具有多个，当工艺参数特征具有多个时，构成多维的工艺参数特征向量。

以切削加工为例说明，如图2所示，通过切削加工实验获取足够的源域铣削刀具和材料下的主轴功率数据样本，作为源域数据样本。其中，主轴功率数据样本包含各种不同的工艺参数组合(工艺参数特征)与其对应的主轴功率值(响应特征)。通过少量切削加工实验获取少量目标域刀具和材料下的主轴功率数据样本。例如，每个铣削样本中的工艺参数包括进给率F、切削深度a_a、切削宽度a_r和主轴转速S，对应的响应特征为切削功率SP。

步骤S200：利用源域数据训练源域响应预测模型。

将源域响应预测模型建为多隐层神经网络，以每个样本中的工艺参数特征作为输入，以响应特征作为输出，训练源域响应预测模型。

图3为本申请一实施例中的源域响应预测模型的神经网络结构图。为了获得最佳的神经网络结构，基于上述建立的源域数据样本，通过试错法确定超参数，如隐层数和神经元数，最终结构如图3所示，其包括顺序连接的第一至第四层，其中，第一层为输入层、第二层和第三层为隐藏层，第四层为输出层。以切削加工为例说明，给定特定刀具、工件和冷却条件下的切削条件，铣削的切削功率受进给率F、切削深度a_a、切削宽度a_r和主轴转速S等加工参数的影响，以4个加工参数为输入，切削功率为输出，将切削功率建模为多隐层神经网络，所提出的神经网络在输入层有4个神经元，在输出层有1个神经元；此外，2个隐藏层中的每个隐藏层有10个神经元。

步骤S300：在源域响应预测模型上加入自适应层，将源域数据输入源域响应预测模型，基于自适应层计算损失函数并以使损失函数小于预设值为目标反向调节源域响应预测模型的参数，得到域适应初始模型，损失函数包括分类损失和域适应损失，域适应损失包括源域数据和目标域数据之间的最大均值差异损失。

为了使迁移学习的效果更好，首先需要解决源域与目标域样本不服从同一分布的问题，在建模之前需要将其数据分布的差异减小。图4为本申请一实施例中的在源域响应预测模型上加入自适应层后的结构示意图，如图4所示，本发明通过复用S200中的源域响应预测模型并加入了自适应层，提出了一种适用于回归问题的域适应神经网络结构，以最大均值差异MMD为度量标准，在学习源域主轴功率数据中的知识并同时降低源域数据与目标域数据的分布差异，得到域适应初始模型。

图5所示为本申请一实施例中具体获取辅助训练数据的步骤流程图，如图5所示，

将源域数据样本表示为：

将目标域数据样本表示为：

其中，x_i表示第i个样本数据中的工艺参数特征向量，y_i表示第i个样本数据中与工艺参数特征向量对应的响应特征；n表示源域数据的样本数量，m表示目标域的样本数量，k表示每个样本内的特征维度，例如，当以进给率F、切削深度a_a、切削宽度a_r和主轴转速S加工参数为输入，切削功率为输出时，每个样本包含5维特征，k＝5。

将源域数据送入域适应神经网络进行训练，以最小化损失函数为目标，

其中，l表示网络的最终损失，

表示网络在有标注数据的常规分类损失，

表示网络的域适应损失，λ是权衡两部分的权重参数。λ的取值可以根据试错法，以得到的辅助训练数据和目标域数据差异较小确定较佳取值。

步骤S400：将目标域数据输入域适应初始模型，以分类损失函数小于预设值为目标对域适应初始模型的参数进行反向微调，得到域适应模型。

需要说明的是，不同步骤中的预设值可以相同，也可以不同。

由于步骤S300中的损失函数包含

通过域适应网络迁移得到的辅助训练数据

的分布不能完全接近T_t的分布，因此，需要利用目标域数据对域适应初始模型进行训练，以实现微调。

在一实施例中，以图3中的神经网络为例说明，该模型微调(Fine-Tune)过程包括：

首先，冻结域适应初始模型的神经网络结构及其第一层(输入层)和第二层的系数。对于第三层的映射，即sp＝σ₃(W₃x₃+b₃)(其中x₃是第三层的向量，W₃和b₃是系数，σ₃是激活函数)；

然后，通过目标域数据T_t用损失函数

进一步训练模型系数W₃和b₃。在微调过程中，使用了较小的学习率0.001，而步骤S300中训练的学习率为0.01。

通过上述微调得到最终的域适应模型，也即，得到域适应神经网络(DaNN)。

步骤S500：将源域数据输入域适应模型，得到辅助训练数据。

具体的，如图5所示，将源域数据T_s送入训练完成的域适应神经网络进行域适应后得到与目标域数据更加相似的辅助训练数据T′_s。

步骤S600：利用辅助训练数据和目标域数据训练目标域响应预测模型。

其中，可以通过辅助训练数据和目标域数据直接训练目标域响应预测模型。来自源域的数据经过域适应之后得到的辅助训练数据T′_s与目标域训练数据T_t的差异已经很小，但一定程度上仍有些不同，因此，也可以在训练中对辅助训练数据和目标域数据进行区别处理，以生成目标域具有良好性能的目标域响应预测模型。

在一实施例中，训练目标域响应预测模型所基于的神经网络结构和训练源域响应预测模型所基于的神经网络结构相同。具体的，两者都用的图3所示的神经网络结构。

图6为本申请一实施例中的目标域响应预测模型构建流程图。如图6所示，该训练过程包括：

步骤S1：初始化权重向量

其中，第i个样本的权重为

其中，i＝1,…,n的权重对应辅助训练数据，i＝n+1,…,n+m的权重对应目标域数据。

步骤S2：对于第t次迭代，调用基学习器，根据合并数据集T＝T′_s∪T_t以及T＝T_s′∪T_t上的权重分布w^t，得到一个基学习器h_t:X→Y；

步骤S3：计算基学习器h_t对数据集T中每个样本的调整误差：

其中，E_t表示目标域数据集T_t中样本误差的最大值，且

步骤S4：计算h_t在目标域数据集T_t上的调整误差：

其中，β_t＝ε_t/(1-ε_t)，

N为预设迭代次数；具体的，设定阈值可以为0.5；

具体的，P可以等于N/2。

为了进一步验证本申请的效果，以下以一具体的实施例进行说明。

步骤S101：通过切削实验获取迁移学习的源域与目标域的主轴功率训练样本。

本发明实施例在一台三轴立式加工中心上进行，迁移的工况包括不同刀具类型以及毛坯材料。

(1)设定如下切削工况作为源域：

直径6mm，HRC 50，硬质合金3刃平底铣刀T₁，切削7075铝；

(2)设定如下切削工况作为目标域：

直径6mm，HRC 60，硬质合金3刃平底铣刀T₂，切削45钢；

(3)针对源域工况与目标域工况分别进行铣削主轴功率数据采集实验获得主轴功率训练样本。

源域切削加工实验参数如表1所示。

表1源域切削加工实验参数

实验获得源域的主轴功率样本共2400组，全部用于训练。

目标域切削加工实验参数如表2所示。

表2目标域切削加工实验参数

目标域的主轴功率样本共1536组，只用其中的192组用于训练，其余用于测试。

步骤S201，构建源域主轴功率预测模型

给定特定刀具、工件和冷却条件下的切削条件，铣削的切削功率受进给率F、切削深度a_a、切削宽度a_r和主轴转速S等加工参数的影响，以4个加工参数为输入，切削功率为输出，将切削功率建模为多隐层神经网络，所提出的神经网络结构如图3所示。为了获得最佳的神经网络结构，基于上述建立的源域数据样本，通过试错法确定超参数，如隐层数和神经元数，最终结构如图2所示：所提出的神经网络在输入层有4个神经元，在输出层有1个神经元；此外，它有2个隐藏层，其中每个隐藏层有10个神经元。

步骤S301，源域与目标域的主轴功率数据的初步域适应，将源域主轴功率预测模型迁移为预适应初始模型。

步骤S401，对预适应初始模型进行微调，得到域适应模型。

其中，自适应和微调的步骤已在上文介绍，在此不再赘述。

步骤S501，将源域数据T_s送入训练完成的域适应模型进行域适应后得到与目标域数据更加相似的辅助训练数据T′_s。

图7为本申请一实施例中的域适应模型进行源域和目标域数据域适应的结果图。如图7所示，经过域适应后，2400组源域数据与目标域数据之间的分布差异明显减小，并得到2400组辅助训练样本。

步骤S601，构建目标域主轴功率模型。

训练过程中将使用S501中得到的2400组源域辅助训练样本和192组目标域数据样本，其中采用的基学习算法为图3所示的源域神经网络，产生的基学习器的数量N＝10，并得到最终的目标域主轴功率模型，其具体步骤已在上文介绍，在此不再赘述。

将目标域没有用于训练的剩余1344组主轴功率样本作为测试集用于测试目标域主轴功率模型。图8为采用本申请一实施例中的迁移建模方法得到的预测模型在目标域部分测试集上的预测效果。图9为采用本申请一实施例中的迁移建模方法得到的预测模型在目标域全部测试集上的预测误差曲线图。图10为采用本申请一实施例中的迁移建模方法得到的预测模型在目标域全部测试集上的预测误差分布的占比情况。由测试结果表明，在目标域测试集1344组数据的预测结果中，97％的样本预测误差在±10％以内，81％的样本的预测误差在±5％以内，平均预测误差为3.13％，满足准确度要求。

图11为本申请使用目标域的192组数据单独训练主轴功率模型的预测效果图。图12为采用本申请一实施例中的迁移建模方法得到的预测模型预测效果图。为了进一步验证不使用迁移和使用迁移的预测结果的区别，只使用目标域的192组训练主轴功率模型，所训练的模型神经网络结构与上文相同，训练结果如图11所示，其预测误差高达17.39％，结合图11和图12所示，不使用迁移学习的效果明显差于迁移学习的预测效果，只使用目标域约10％的数据训练无法训练出效果良好的模型。将用于训练的目标域数据样本比例提升至60％，即922组目标域数据，获得了5.16％的平均预测误差，将用于训练的目标域数据样本比例提升至80％，即1229组目标域数据，获得了3.71％的平均预测误差。说明迁移模型的性能水平至少达到了非迁移模型使用80％数据用于训练所能达到的预测精度，而迁移模型的训练数据量只是其1/8，表明对数据量的降低程度至少在85％以上。

相应地，本申请还保护一种与上述方法对应的基于迁移学习的机床响应建模系统，其包括：

数据获取单元，用于获取源域数据和目标域数据，其中，源域数据为第一工况下的样本数据，目标域数据为第二工况下的样本数据；

源域建模单元，用于利用源域数据训练源域响应预测模型；

自适应调节单元，用于将源域数据输入源域响应预测模型，计算损失函数并以使损失函数小于预设值为目标反向调节源域响应预测模型的参数，得到域适应初始模型，损失函数包括分类损失和域适应损失，域适应损失包括源域数据和目标域数据之间的最大均值差异损失；

微调单元，用于将目标域数据输入域适应初始模型，以分类损失函数小于预设值为目标对域适应初始模型的参数进行反向微调，得到域适应模型；

数据迁移单元，用于将源域数据输入域适应模型，得到辅助训练数据；

目标域建模单元，用于利用辅助训练数据和目标域数据训练目标域响应预测模型。

以上基于迁移学习的机床响应建模系统，用于实现上文中的基于迁移学习的机床响应建模方法，各个单元用于执行建模方法的对应步骤，其中，各个单元执行相应步骤的具体过程可参考上文介绍，在此不再赘述。

对应地，本申请还保护一种基于迁移学习的响应预测方法，其包括：

获取目标域响应预测模型，目标域响应预测模型为根据上文任一种基于迁移学习的机床响应建模方法所得到的目标域响应预测模型；

将已知参数输入目标域响应预测模型，得到与已知参数对应的预测信息。

综上，本申请结合一种模型迁移和样本迁移，将历史保存的第一工况下的源域数据样本重新利用到第二工况下以降低对第二工况下目标域数据样本的需求。其中，基于模型迁移的方法建立域适应模型神经网络，然后，基于样本迁移的方法获取辅助训练数据，通过域适应模型可以实现两种不同工况下数据的域适应，减少数据分布差异，使得源域的大量数据样本可以在目标域的建模过程中实现重用。与直接使用未经域适应处理的源域数据相比，通过域适应得到的更加近似于目标域数据的源域辅助训练数据，将其用于迁移建模过程对建模效果的提升十分显著。并且，在一种工况已经采集了充足的数据本的情况下，通过对该工况的数据样本的迁移，从而使得在其他类似的加工工况中，只需要很少量的新数据就可以建立性能良好的主轴功率预测模型，减少了新工况下模型建立对新数据的需求量，从而降低实际生产中面对多种不同工况进行数据采集的实验成本。

本领域的技术人员容易理解，以上仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。