CN115328691B

CN115328691B - 基于模型差异的故障诊断方法、系统、存储介质及设备

Info

Publication number: CN115328691B
Application number: CN202211256431.5A
Authority: CN
Inventors: 宋艳; 李沂滨; 文韬; 贾磊
Original assignee: Shandong University
Current assignee: Shandong University
Priority date: 2022-10-14
Filing date: 2022-10-14
Publication date: 2023-03-03
Anticipated expiration: 2042-10-14
Also published as: CN115328691A

Abstract

本发明涉及故障诊断技术领域，提供了基于模型差异的故障诊断方法、系统、存储介质及设备，包括：在每次迭代训练中，每个源域客户端基于加权分类损失、模型域分类损失和特征距离测量损失的加权和，使用本地训练数据集训练全局模型，使用添加噪声的本地数据集训练本地模型，更新全局模型和本地模型；中心服务器进行全局模型参数平均，更新全局模型；在迭代训练结束后，中心服务器发送全局模型至目标域客户端；目标域客户端基于待诊断的机械故障数据，通过中心服务器发送的全局模型，得到故障诊断结果。增强了模型对噪声有更强的鲁棒性，在保证本地模型和全局模型差异的基础上实现特征空间对齐，而且提高了泛化能力。

Description

基于模型差异的故障诊断方法、系统、存储介质及设备

技术领域

本发明属于故障诊断技术领域，尤其涉及基于模型差异的故障诊断方法、系统、存储介质及设备。

背景技术

本部分的陈述仅仅是提供了与本发明相关的背景技术信息，不必然构成在先技术。

随着工业数据数量日益增加，数据驱动故障诊断方法得到了迅速发展。然而，随着用户和企业对数据安全的重视，不同用户之间的数据无法共享，这给数据驱动故障诊断方法的发展带来了挑战。

联邦学习（Federated Learning，FL）是一种带有隐私保护、安全加密技术的分布式机器学习框架，旨在让分散的各参与方在满足不向其他参与者披露隐私数据的前提下，协作进行机器学习的模型训练。FL提供了一种隐私保护机制，这一机制使其在智能故障诊断领域中得到了迅速发展。FL通过客户端和中心服务器的协作训练预测模型，不需要聚合分布在客户端的用户数据。

除了故障诊断中的数据隐私要求外，用于故障诊断模型训练的训练数据集也可能来自不同工况下的机械设备，这意味着训练数据量的增加并不能保证模型具有良好的泛化性能。以设备中的轴承举例，一个设备在工作中轴承转速可能为每分钟1797转（rpm），而其他设备的轴承转速可能为每分钟1730转。由于这些数据存在域偏移，用这些数据训练的故障诊断模型泛化能力差，对测试数据集的预测精度较低。基于域泛化和域适应的迁移学习方法旨在解决这一问题。域泛化和域适应有一定的区别。域适应在训练时可以使用有标记的源域数据和未标记或少量标记的目标域数据进行特征空间对齐或对抗训练，基于联邦域适应（Federated Domain Adaptation，FDA）的方法实现了域偏移数据集上的故障诊断；然而，目前大多数基于FDA的故障诊断方法在训练模型时采用特征空间对齐的方式，这导致FDA存在着隐私泄露风险。而域泛化在训练模型时没有目标域数据的参与。域适应和域泛化两种方法解决了多个源域之间或源域和目标域之间特征表示不一致的问题。这两种方法在训练阶段需要从多源域和目标域中收集特征数据进行模型训练。

考虑到来自不同客户端的故障数据同时面临数据保护和域偏移问题，基于联邦迁移学习（Federated Transfer Learning，FTL）的故障诊断方法在近期被提出。虽然，联邦迁移学习在故障诊断方面取得了与迁移学习相当的性能，但现有的联邦迁移学习方法没有考虑目标域数据完全不可用的情况。此外，现有的基于迁移学习的方法通过对不同领域故障数据的特征空间对齐来实现领域迁移，这可能会因特征空间的范围只覆盖已知领域从而限制训练模型在未知领域的泛化能力。此外，在联邦迁移学习中，特征在客户端和中心服务器之间传输存在隐私泄露风险。

发明内容

为了解决上述背景技术中存在的技术问题，本发明提供基于模型差异的故障诊断方法、系统、存储介质及设备，在本地模型训练时加入噪声，增强了模型对噪声有更强的鲁棒性；同时使用加权分类损失、模型域分类损失和特征距离测量损失，不仅在保证本地模型和全局模型差异的基础上实现特征空间对齐，而且考虑了客户端模型与中心服务器全局模型之间的差异，扩大了全局模型的特征空间边界，提高了泛化能力。

为了实现上述目的，本发明采用如下技术方案：

本发明的第一个方面提供基于模型差异的故障诊断方法，应用于目标域客户端，包括：

获取待诊断的机械故障数据；

基于待诊断的机械故障数据，通过中心服务器发送的全局模型，得到故障诊断结果；

其中，全局模型是通过中心服务器和源域客户端进行多次迭代训练得到的，每次迭代训练的步骤为：中心服务器将全局模型发送到所有源域客户端；每个源域客户端基于加权分类损失、模型域分类损失和特征距离测量损失的加权和，使用本地训练数据集训练全局模型，使用添加噪声的本地数据集训练本地模型，更新全局模型和本地模型；源域客户端将更新后的全局模型发送到中心服务器进行全局模型参数平均，以更新全局模型。

进一步地，所述加权分类损失为：

其中，

是源域客户端k中本地模型的损失加权值，

是源域客户端k中全局模型的损失加权值，

是源域客户端k中本地模型的分类损失值，

是源域客户端k中全局模型的分类损失值，

为数据样本j的真实标签，

为源域客户端k中本地模型对数据样本j的预测结果，

为源域客户端k中全局模型对数据样本j的预测结果，m _k为源域客户端k中包含的数据样本数。

进一步地，所述模型域分类损失为：

其中，

是客户端k的本地训练数据集中的样本j的域标签，

是客户端k的本地训练数据集中的样本j的域预测结果，m _k为源域客户端k中包含的数据样本数。

进一步地，所述特征距离测量损失为：

其中，

为客户端k中全局模型的特征提取网络得到的特征的特征协方差矩阵，

为客户端k中本地模型的特征提取网络得到的特征的特征协方差矩阵，d代表

和

的维度，m _k为源域客户端k中包含的数据样本数。

本发明的第二个方面提供基于模型差异的故障诊断方法，应用于中心服务器，包括：

在每次迭代训练中，将全局模型发送到所有源域客户端，以使每个源域客户端基于加权分类损失、模型域分类损失和特征距离测量损失的加权和，使用本地训练数据集训练全局模型，使用添加噪声的本地数据集训练本地模型，更新全局模型和本地模型；并接收源域客户端发送的更新后的全局模型，进行全局模型参数平均，更新全局模型；

在迭代训练结束后，发送全局模型至目标域客户端，以使目标域客户端基于待诊断的机械故障数据进行故障诊断。

本发明的第三个方面提供基于模型差异的故障诊断方法，应用于源域客户端，包括：

在每次迭代训练中，接收中心服务器发送的全局模型，基于加权分类损失、模型域分类损失和特征距离测量损失的加权和，使用本地训练数据集训练全局模型，使用添加噪声的本地数据集训练本地模型，更新全局模型和本地模型，并将全局模型发送至中心服务器，以使中心服务器进行全局模型参数平均，更新全局模型；

其中，中心服务器在迭代训练结束后，发送全局模型至目标域客户端，以使目标域客户端基于待诊断的机械故障数据进行故障诊断。

本发明的第四个方面提供基于模型差异的故障诊断方法，其特征在于，包括：

在每次迭代训练中，中心服务器将全局模型发送到所有源域客户端；每个源域客户端基于加权分类损失、模型域分类损失和特征距离测量损失的加权和，使用本地训练数据集训练全局模型，使用添加噪声的本地数据集训练本地模型，更新全局模型和本地模型；中心服务器接收源域客户端发送的更新后的全局模型，进行全局模型参数平均，更新全局模型；

在迭代训练结束后，中心服务器发送全局模型至目标域客户端；目标域客户端基于待诊断的机械故障数据，通过中心服务器发送的全局模型，得到故障诊断结果。

本发明的第五个方面提供基于模型差异的故障诊断系统，其特征在于，包括：

源域客户端，其被配置为：在每次迭代训练中，接收中心服务器发送的全局模型，基于加权分类损失、模型域分类损失和特征距离测量损失的加权和，使用本地训练数据集训练全局模型，使用添加噪声的本地数据集训练本地模型，更新全局模型和本地模型；

中心服务器，其被配置为：在每次迭代训练中，接收源域客户端发送的更新后的全局模型，进行全局模型参数平均，更新全局模型；并在迭代训练结束后发送全局模型至目标域客户端；

目标域客户端，其被配置为：基于待诊断的机械故障数据，通过中心服务器发送的全局模型，得到故障诊断结果。

本发明的第六个方面提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上述所述的基于模型差异的故障诊断方法中的步骤。

本发明的第七个方面提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述所述的基于模型差异的故障诊断方法中的步骤。

与现有技术相比，本发明的有益效果是：

本发明提供了基于模型差异的故障诊断方法，其为了使模型对噪声有更强的鲁棒性，同时增加训练数据集的差异，在本地模型训练时加入噪声。

本发明提供了基于模型差异的故障诊断方法，其同时使用模型分类损失和特征差异损失，在保证本地模型和全局模型差异的基础上实现特征空间对齐。

本发明提供了基于模型差异的故障诊断方法，其为了保证客户端训练的全局模型的鲁棒性，对本地模型和全局模型的故障分类损失进行加权，为较高的损失分配较大的权重值，从而实现反向传播训练时较差的模型快速收敛。

本发明提供了基于模型差异的故障诊断方法，其考虑了客户端模型与中心服务器全局模型之间的差异，扩大了全局模型的特征空间边界，提高了其泛化能力。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

图1是本发明实施例一的基于模型差异的故障诊断方法的流程图；

图2是本发明实施例一的故障诊断模型的结构示意图；

图3是本发明实施例一的客户端k的模型训练的流程图。

具体实施方式

下面结合附图与实施例对本发明作进一步说明。

应该指出，以下详细说明都是例示性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

实施例一

本实施例提供了基于模型差异的故障诊断方法，利用客户端模型和中心服务器模型之间的差异，提出一种联邦域泛化（Federated Domain Generalization，FDG）方法以提高故障诊断模型的泛化能力，训练过程中只有不同工况下的源域客户端（简称客户端）参加训练，而目标域客户端不参加训练；具体而言，利用不同模型之间的差异性，在不进行特征传输的情况下，在包含源域数据集的客户端中同时训练客户端模型和中心服务器模型；此外，对不同模型的分类损失加权以提高性能较差的模型的泛化能力；方法的性能在3个故障诊断数据集上进行了评估，并与多源域自适应方法和联邦学习方法进行比较，结果表明了本实施例提供的基于模型差异的故障诊断方法的优越性。

本实施例提供的基于模型差异的故障诊断方法，在训练阶段，首先中心服务器初始化全局模型，并将其发送到所有源域客户端；然后，每个源域客户端使用私有的训练数据集分别训练接收到的全局模型和本地模型；之后源域客户端将更新后的全局模型发送到中心服务器进行全局模型参数平均；最后，当训练轮数达到设定值时，训练任务结束；在测试阶段，中心服务器将全局模型发送到目标域客户端进行故障诊断。

本实施例提供的基于模型差异的故障诊断方法，在每次迭代训练中，中心服务器将全局模型发送到所有源域客户端；每个源域客户端基于本地模型和全局模型的加权分类损失、模型域分类损失和特征距离测量损失的加权和，使用本地训练数据集训练全局模型，使用添加噪声的本地数据集训练本地模型，更新全局模型和本地模型；中心服务器接收源域客户端发送的更新后的全局模型，进行全局模型参数平均，更新全局模型；在迭代训练结束后，中心服务器发送全局模型至目标域客户端；目标域客户端基于待诊断的机械故障数据，通过中心服务器发送的全局模型，得到故障诊断结果。如图1所示，具体包括以下步骤：

步骤1、模型初始化。

设N个源域客户端中的N个数据集为

，源域客户端k中的数据集为

，其中，m _k为源域客户端k中包含的数据样本数，

为第k个源域客户端中的的第j个数据样本，

为第k个源域客户端中的的第j个数据样本的标签。目标域客户端的数据集

在第N+1个客户端中，n _t为目标域样本数，

为目标域客户端中的第i个样本。

源域客户端和服务器中的故障诊断模型分别包括一个特征提取网络和一个分类网络。分别将N个源域客户端上的N个特征提取器记为

，N个分类器记为

，中心服务器上的特征提取器和分类器分别记为

和

。源域客户端中的故障诊断模型称为本地模型，服务器中的故障诊断模型称为全局模型。

初始化模型对训练时间以及模型的最终性能有着较大影响。将第一轮训练的源域客户端中的故障诊断模型的平均值作为初始全局模型。具体而言，在第一轮中，源域客户端k使用其数据集

训练特征提取器

和分类器

，得到本地模型；之后所有源域客户端将本地模型发送到中心服务器，中心服务器将所有本地模型的平均值将作为初始全局模型，具体实现如下：

（1）

（2）

步骤2、源域客户端模型训练。

FL禁止客户端之间或者客户端与中心服务器之间共享客户端原始数据，因此FL通过聚合梯度和本地客户端的损失实现全局模型训练。源域客户端k的模型训练过程如图3所示。

在训练模型时，中心服务器首先将初始全局模型发送给所有源域客户端，然后源域客户端k(k=1,2,…,N)使用其本地训练数据集

更新接收到的全局模型。为了提高全局模型的泛化能力，本实施例在不共享参数的情况下，分别训练源域客户端的本地模型和全局模型。为了使模型对噪声有更强的鲁棒性，同时增加训练数据集的差异，源域客户端k的本地模型输入为

，其中N(0,0.1)代表方差为0.1的高斯噪声。在客户端k中，采用损失加权策略对本地模型和全局模型的分类损失进行加权，损失越大的模型泛化能力越差，在训练中会被赋予更高的权重。损失权重的计算如下：

（3）

（4）

其中，c是保证权值变化平滑的超参数，

是源域客户端k中本地模型的损失加权值，

是源域客户端k中全局模型的损失加权值，

是源域客户端k中本地模型的分类损失值，其公式为：

（5）

其中，

为数据样本j的真实标签，

为源域客户端k中本地模型对数据样本j的预测结果。

是使用源域客户端k中的全局模型的分类损失值，其公式为：

（6）

其中，

为源域客户端k中全局模型对数据样本j的预测结果。

源域客户端本地模型和全局模型的加权分类损失的计算公式为：

（7）

中心服务器的全局模型是所有源域客户端训练的全局模型的平均值，它包含所有源域客户端训练的全局模型的信息。因此，来自中心服务器的全局模型提供了不同于本地模型的特征。为了扩大全局模型的特征空间边界，采用二值分类器分辨本地模型和全局模型的特征，即源域客户端中使用的另一种损失函数是模型域分类损失。如果特征提取网络

和

(k=1,…,N)的输出能够使模型域分类损失值和加权分类损失值都最小，则意味着全局模型的特征提取网络

和分类网络

可以推广到与源域客户端k的特征空间不同的特征空间中。模型域分类损失值

定义如下：

（8）

其中，

是客户端k的本地训练数据集中的样本j的域标签；

是客户端k的本地训练数据集中的样本j的域预测结果；对于来自全局模型的特征提取网络

的输出，域标签

，来自客户端的本地模型的特征提取网络

的特征域标签为

。

此外，为了约束本地模型和全局模型特征空间之间的距离，使用基于相关性对齐（Correlation Alignment，CORAL）的特征距离测量损失，计算过程如下：

（9）

其中，

和

分别为

和

中特征的特征协方差矩阵，即，

为客户端k中本地模型的特征提取网络得到的特征的特征协方差矩阵；d代表

和

的维度，

代表Frobenius范数。

因此，包含源域数据集的客户端k中的全局模型和本地模型训练损失值为加权分类损失、模型域分类损失和特征距离测量损失的加权和，即：

（10）

其中，

为

限制参数，在本实施例中，

，

；损失值

用于识别特征来源于本地模型或全局模型，而

用于限制本地模型和全局模型特征之间的距离；两种损失相结合，保证了本地模型和全局模型虽然特征不同，但处在相同的特征空间中。

步骤3、中心服务器上的全局模型聚合。

在所有源域客户端的模型训练一轮后，所有在客户端上训练的全局模型都会被发送至中心服务器。然后N个源域客户端上的N个全局模型的特征提取器

和N个源域客户端上的N个全局模型的分类器

平均化后，更新中心服务器上的全局模型的特征提取器

和分类器

，其中，

为第i个源域客户端上的全局模型的特征提取器，

为第i个源域客户端上的全局模型的分类器。在本实施例中，全局模型没有在中心服务器上进行进一步的训练，而是被发送到所有源域客户端中进行下一轮训练。

步骤4、当训练轮数达到设定值时，训练任务结束，中心服务器将全局模型发送到目标域客户端进行故障诊断，目标域客户端获取待诊断的机械故障数据，通过中心服务器发送的全局模型，得到故障诊断结果。

其中，客户端的模型结构与中心服务器的模型结构和参数相同，即全局模型和本地模型的结构和参数相同，全局模型和本地模型的结构和参数均如图2所示，包括特征提取网络（特征提取器）和分类网络（分类器）；目标域客户端收到的模型包括特征提取网络和分类网络；客户端还包括一个模型域分类网络。

特征提取网络的结构：特征提取网络由一个注意力机制模块和三组依次连接的卷积层、正则化层、线性修正单元和最大池化层组成；特征提取网络的输入首先进入第一组的卷积层，第一组的最大池化层连接第二组的卷积层，第二组的最大池化层连接第三组的卷积层；注意力机制模块包括依次连接的第一卷积层、第一正则化层和降采样层，以及依次连接的第二卷积层和第二正则化层，以及相加操作和sigmoid函数。三个卷积层的卷积核数都是128，第一组、第二组和第三组中的卷积层的卷积核大小分别为17、17和3；第一组、第二组和第三组中的最大池化层的参数依次为16、16和2。第二组的最大池化层的输出依次经过第一卷积层（卷积核数：128，卷积核大小：1）、第一正则化层、降采样层处理，得到第一结果。第三组的最大池化层的输出依次经过第二卷积层（卷积核数：128，卷积核大小：1）、第二正则化层处理，得到第二结果。第一结果和第二结果经过相加操作后，再由sigmoid函数做非线性变换；将非线性变换的结果与第三组的最大池化层的输出连接，得到特征提取网络的输出。

分类网络结构：分类网络由依次连接的展平层、第一全连接层、正则化层、修正线性单元层、第二全连接层和softmax函数层组成；其中，第一全连接层的参数为512，第二全连接层的参数为故障种类数。

模型域分类网络结构：模型域分类网络由依次连接的展平层、第三全连接层、正则化层、修正线性单元层、第四全连接层和softmax函数层组成。其中，第三全连接层的参数为512，第四全连接层的参数为2。

模型域分类网络与分类网络的输入都是特征提取网络的输出，两者的区别在于最后一个全连接层的参数不同，即第二全连接层和第四全连接层的参数，分类网络是为了故障分类，因此分类网络的最后一个全连接层的参数是故障种类数；模型域分类网络是为了区分特征来自客户端的本地模型还是全局模型，因此分类的最后一个全连接层的参数是2。

本实施例提供的基于模型差异的故障诊断方法，利用中心服务器的全局模型和多个源域客户端的本地模型之间的差异来提高预测模型的泛化能力；目标域客户端不参与训练过程，原始故障数据和提取的特征在客户端和服务器之间不共享，以保证数据的私密性和安全性；在源域客户端中同时训练全局模型和本地模型，不需要这两种模型共享网络参数，从而进一步保护了客户端的数据隐私。

在本实施例中，使用了三组不同工况下的机械故障数据集来验证FDG在机械故障诊断领域的优越性。接下来，分别从比较方法、FDG实验结果分别展开介绍。

1、比较方法。

为了证明FDG的泛化能力，本发明将与2018年在NeurIPS发表的论文Adversarialmultiple source domain adaptation中提出的多源域自适应方法进行比较。此外，还将广泛应用的联邦平均算法（FedAvg）应用于故障诊断领域，以证明FDG的优越性。除此之外，不采用注意力机制的特征提取网络也作为评价网络结构的一种比较方法。

（1）多源域对抗网络（Multi-source Domain Adaptation Network，MDAN）：MDAN网络被提出以学习不受多个域偏移影响的特征表示。对于MDAN来说，所有源域和未被标记的目标域都参与模型训练。

（2）联邦平均（Federated Average，FedAvg）：FedAvg作为一种分布式框架，允许多个源域客户端无需将任何私有数据上传至中心服务器便可以直接训练机器学习模型。在此方法中，本地客户端对本地模型进行训练，中心服务器对本地模型通过平均加权聚合得到全局模型。经过多轮训练，FedAvg得到全局优化模型。在本发明中，FedAvg的特征提取器和分类网络与FDG相同。

（3）FDG无注意力机制（NoAtten）：为了证明注意力机制的有效性，第三种比较方法是FDG的特征提取器不采用注意力机制的方法（NoAtten）。在NoAtten中，特征提取网络架构中没有注意力机制，NoAtten网络的其他模块与FDG相同。

2、案例1：Paderborn大学轴承故障数据集。

（1）Paderborn数据集：实验中使用的第一个数据集是Paderborn数据集[18]。本实验中使用的轴承代号详见表1。该数据集包含三种不同状态下的轴承：内圈故障（IR）、外圈故障（OR）和健康（H）。数据集来自于不同转速、径向力以及负载扭矩下工作的轴承。使用的轴承工况详见表2。假设A、B、C、D分布在四个客户端中，并使用其中的两个或者三个作为源域客户端，基于所提出的FDG方法，在不产生数据聚合的情况下协同训练模型。训练好的模型将在目标域客户端上进行测试。

表1、Paderborn数据集实验轴承代号

表2、不同工况下Paderborn数据集

（2）实验结果：在Paderborn数据集上，FDG的结果以及与其他方法的对比如表3所示。与MDAN和FedAvg相比，FDG取得了相当乃至更好的结果。这说明与其他方法相比，FDG具有更良好的泛化能力，意味着FDG方法在源域客户端上训练的模型可以适应其他领域。此外，FDG比NoAtten具有更高的准确率，证明了注意力机制在特征提取过程中的有效性。

表3、Paderborn数据集实验结果

3、案例2：CWRU大学轴承故障数据集。

（1）CWRU数据集：案例2中使用的数据集来自凯斯西储大学（CWRU）。CWRU数据集中包含了故障尺寸为7、14和21英寸的数据。对于每种故障尺寸，又有内圈故障（IR）、球故障（ball）以及外圈故障（OR）三种不同的故障类型。标签信息详见表4。轴承的工作转速分别又有1797、1772、1750以及1730rpm四种。任务编号及其对应的包含源域数据集的客户端和目标客户端如表5所示。

表4、CWRU数据信息

表5、CWRU数据集实验任务代号和转速

（2）实验结果：FDG与MDAN、FedAvg、NoAtten的实验结果对比如表6所示。结果表明，FDG可以提高故障诊断的准确率。同时，更高的分类准确率也表明FDG和FedAvg以及MDAN相比具有更好的泛化性能。NoAtten和FDG在CWRU数据集上的的实验结果对比进一步说明了注意力机制的有效性。

表6、不同任务测试结果

4、案例3：XJTU-SY轴承数据集实验。

（1）XJTU-SY数据集：案例3中本发明使用的轴承数据集由西安交通大学、浙江盛阳科技股份有限公司提供。该数据集包含15个通过加速老化实验获得的完整运行的滚动轴承故障数据。表7和表8中列出了本实验中使用的8种轴承的详细信息。

表7、XJTU-SY轴承数据集

表8、XJTU-SY数据集任务代码

（2）实验结果：表9显示了FDG等方法在本实验中的准确率，结果证明了FDG在任务X2和X3优于其他方法。这些结果证明了FDG方法在目标域有着更好的性能。同时，FDG的性能优于NoAtten，更进一步的验证了注意力机制的有效性。

表9、XJTU-SY轴承数据集实验结果

本实施例致力于研究数据隐私保护状况下的跨域故障诊断方法，针对FL中的域偏移问题，提出了一种适用于包含不同工况源域数据集的客户端的FDG方法，FDG方法通过源域客户端和中心服务器协同训练，得到了具有较强泛化能力的数据驱动故障诊断模型，FDG在三种不同的故障诊断数据集上进行实验得到的结果表明，FDG具有良好的性能。

实施例二

本实施例提供了基于模型差异的故障诊断方法，应用于目标域客户端，包括：

获取待诊断的机械故障数据；

详细方法与实施例一提供的方法相同，这里不再赘述。

实施例三

本实施例提供了基于模型差异的故障诊断方法，应用于中心服务器，包括：

实施例四

本实施例提供了基于模型差异的故障诊断方法，应用于源域客户端，包括：

实施例五

本实施例提供了基于模型差异的故障诊断系统，包括：

此处需要说明的是，本实施例中的各个模块与实施例一中的各个步骤一一对应，其具体实施过程相同，此处不再累述。

实施例六

本实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上述实施例二、实施例三或实施例四所述的基于模型差异的故障诊断方法中的步骤。

实施例七

本实施例提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述实施例二、实施例三或实施例四所述的基于模型差异的故障诊断方法中的步骤。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.基于模型差异的故障诊断方法，其特征在于，应用于目标域客户端，包括：

获取待诊断的机械故障数据；

其中，全局模型是通过中心服务器和源域客户端进行多次迭代训练得到的，每次迭代训练的步骤为：中心服务器将全局模型发送到所有源域客户端；每个源域客户端基于加权分类损失、模型域分类损失和特征距离测量损失的加权和，使用本地机械故障数据集训练全局模型，使用添加噪声的本地机械故障数据集训练本地模型，更新全局模型和本地模型；源域客户端将更新后的全局模型发送到中心服务器进行全局模型参数平均，以更新全局模型；

所述加权分类损失为：

其中，

是源域客户端k中本地模型的损失加权值，

是源域客户端k中全局模型的损失加权值，

是源域客户端k中本地模型的分类损失值，

是源域客户端k 中全局模型的分类损失值，

为数据样本j的真实标签，

为源域客户端k中本地模型对数据样本j的预测结果，

为源域客户端k中全局模型对数据样本j的预测结果，m _k为源域客户端k中包含的数据样本数；

所述模型域分类损失为：

其中，

是客户端k的本地机械故障数据集中的样本j的域标签，

是客户端k的本地机械故障数据集中的样本j的域预测结果，m _k为源域客户端k中包含的数据样本数；

所述特征距离测量损失为：

其中，

和

的维度，m _k为源域客户端k中包含的数据样本数；

所述加权分类损失、模型域分类损失和特征距离测量损失的加权和为：

其中，

为

限制参数。

2.基于模型差异的故障诊断方法，其特征在于，应用于中心服务器，包括：

在每次迭代训练中，将全局模型发送到所有源域客户端，以使每个源域客户端基于加权分类损失、模型域分类损失和特征距离测量损失的加权和，使用本地机械故障数据集训练全局模型，使用添加噪声的本地机械故障数据集训练本地模型，更新全局模型和本地模型；并接收源域客户端发送的更新后的全局模型，进行全局模型参数平均，更新全局模型；

在迭代训练结束后，发送全局模型至目标域客户端，以使目标域客户端基于待诊断的机械故障数据进行故障诊断；

所述加权分类损失为：

其中，

是源域客户端k中本地模型的损失加权值，

是源域客户端k中全局模型的损失加权值，

是源域客户端k中本地模型的分类损失值，

是源域客户端k 中全局模型的分类损失值，

为数据样本j的真实标签，

为源域客户端k中本地模型对数据样本j的预测结果，

所述模型域分类损失为：

其中，

是客户端k的本地机械故障数据集中的样本j的域标签，

所述特征距离测量损失为：

其中，

和

的维度，m _k为源域客户端k中包含的数据样本数；

其中，

为

限制参数。

3.基于模型差异的故障诊断方法，其特征在于，应用于源域客户端，包括：

在每次迭代训练中，接收中心服务器发送的全局模型，基于加权分类损失、模型域分类损失和特征距离测量损失的加权和，使用本地机械故障数据集训练全局模型，使用添加噪声的本地机械故障数据集训练本地模型，更新全局模型和本地模型，并将全局模型发送至中心服务器，以使中心服务器进行全局模型参数平均，更新全局模型；

其中，中心服务器在迭代训练结束后，发送全局模型至目标域客户端，以使目标域客户端基于待诊断的机械故障数据进行故障诊断；

所述加权分类损失为：

其中，

是源域客户端k中本地模型的损失加权值，

是源域客户端k中全局模型的损失加权值，

是源域客户端k中本地模型的分类损失值，

是源域客户端k 中全局模型的分类损失值，

为数据样本j的真实标签，

为源域客户端k中本地模型对数据样本j的预测结果，

所述模型域分类损失为：

其中，

是客户端k的本地机械故障数据集中的样本j的域标签，

所述特征距离测量损失为：

其中，

和

的维度，m _k为源域客户端k中包含的数据样本数；

其中，

为

限制参数。

4.基于模型差异的故障诊断方法，其特征在于，包括：

在每次迭代训练中，中心服务器将全局模型发送到所有源域客户端；每个源域客户端基于加权分类损失、模型域分类损失和特征距离测量损失的加权和，使用本地机械故障数据集训练全局模型，使用添加噪声的本地机械故障数据集训练本地模型，更新全局模型和本地模型；中心服务器接收源域客户端发送的更新后的全局模型，进行全局模型参数平均，更新全局模型；

在迭代训练结束后，中心服务器发送全局模型至目标域客户端；目标域客户端基于待诊断的机械故障数据，通过中心服务器发送的全局模型，得到故障诊断结果；

所述加权分类损失为：