CN115600134A

CN115600134A - 基于域动态对抗自适应的轴承迁移学习故障诊断方法

Info

Publication number: CN115600134A
Application number: CN202210323048.0A
Authority: CN
Inventors: 张明; 张儒; 谢新民; 苏少忻; 许建; 甘雨; 孙自飞; 金云峰; 郭震
Original assignee: Nanjing Tianfu Software Co ltd
Current assignee: Nanjing Tianfu Software Co ltd
Priority date: 2022-03-30
Filing date: 2022-03-30
Publication date: 2023-01-13

Abstract

本公开涉及轴承故障诊断技术领域，提供一种基于域动态对抗自适应的轴承迁移学习故障诊断方法，包括：搭建不同工况类别的轴承故障数据样本库，划分源域数据和目标域数据；使用包括多层卷积神经网络的特征提取器，提取源域数据、目标域数据的样本特征；构建类判别器；构建并训练全局域判别器，构建梯度反转层；将类判别器预测的类别权重与特征提取器生成的特征进行加权得到子域特征，构建子域判别器，构建梯度反转层；计算动态对抗因子；优化特征提取器、类判别器、全局域判别器和子域判别器的总损失，得到优化后的模型；将目标域数据输入优化后的模型，获得预测类别，计算分类精度。本公开可提升样本域自适应能力，加强故障诊断模型的泛化性。

Description

基于域动态对抗自适应的轴承迁移学习故障诊断方法

技术领域

本公开涉及轴承故障诊断技术领域，特别涉及一种基于域动态对抗自适应的轴承迁移学习故障诊断方法。

背景技术

旋转机械广泛应用于航空航天、轨道交通、石油化工、汽车制造、风力发电等国计民生的重要工程领域，在国民经济生产中具有举足轻重的作用。为满足实际生产需求，机械设备通常工作在重载、高温、腐蚀以及高作业率的复杂恶劣环境，一旦出现故障，会带来巨大的经济损失。随着工业大数据和物联网在工业4.0背景下的飞速发展，用于工业设备的故障预测和健康管理(Prognostics Health Management，PHM)变得越来越重要，从而导致用于工业设备的智能维护系统越来越多。智能故障诊断正成为机器PHM技术的重要分支，包括支持向量机和人工神经网络在内的传统机器学习方法已在该领域得到广泛应用。同时，随着可用数据的增加，具有表示学习能力的数据驱动的情报方法变得越来越流行。在这种背景下，深度学习具有自适应特征提取和数据模式识别逐渐成为工业设备PHM研究的热点。诸如卷积神经网络(Convolutional Neural Networks，CNN)、稀疏自动编码器等深度学习模型，对于PHM任务的有效性已在当前研究中得到了成功验证。

然而，当前在智能故障诊断中的有效性基于以下两个假设：1)有大量标签数据；2)训练数据集的故障模式与测试数据集的故障模式相同(在数学上，训练数据集应与测试数据集遵循相同的分布)。一般而言，采集大量有标签数据从而训练智能识别方法是实现智能故障的必要条件，但是该条件在有些应用场景下却难以满足。例如，在工业应用场景中，由于以下两个因素的存在，常常难以采集到足够的标签数据：1)部分机械设备安全系数较高，在机械设备出现故障前进行了维护维修策略，导致难以采集到故障状态下的监测信号；2)部分机械设备性能退化历时长，采集足够的全寿命周期监测数据耗时巨大。综上，在工业应用场景下，一般难以采集足够的标签数据，尤其是机械设备在故障状态下的数据。与工业现场有标签数据缺乏形成鲜明对比的是，在实验室条件下，通过实验设备可以对机械设备的不同运行状态进行仿真，从而可以采集机械设备在不同状态下的监测数据。但是，实验室所采集的机械设备模拟运行状态监测数据和实际工况条件下所采集的运行状态监测数据之间存在差异，使得通过实验室数据所训练的智能故障诊断模型并不能直接应用在工业现场，这在一定程度限制了智能故障诊断方法的工业化应用。

迁移学习把一个领域(即源领域)的知识迁移到另外一个领域(即目标领域)，使得智能模型可在目标领域能够取得更好的学习效果。因此，迁移学习可解决目标域没有标签数据的问题，该方法已经在图像、语音等域得到广泛应用。迁移学习的核心是，找到源领域和目标领域之间的相似性，并加以合理利用。这种相似性非常普遍，比如，不同人的身体构造是相似的，自行车和摩托车的骑行方式是相似的，等等。找到相似性后，以度量为准则，通过不同方式的学习手段，增大两个领域之间的相似性，从而完成迁移学习。利用迁移学习在模型泛化方面的优点，可为复杂机械系统的故障诊断提供一种新的手段。

近年来，基于对抗的迁移学习方式在故障诊断领域取得了很多重大成果。基于对抗的迁移是指使用域判别器减少深度特征提取器产生的源域和目标域的特征分布差异的对抗方法。源域深层特征提取器使用标记的数据进行了预训练，模型参数通过源域类分类器进行迭代优化。训练好的特征提取模型同样可以应用于目标域特征生成。之后，对源域和目标域的特征进行联合训练，以最大程度地增加域判别器的损失，使得源域和目标域具有相似的分布。然而，当前的对抗迁移学习要么是单个域分类器对齐边缘分布(全局域)或条件分布(子域)，要么是多个域分类器对齐条件分布。不过，在实际应用中，域之间的边缘分布和条件分布往往对领域适应有不同的贡献。虽然上述方法在一些数据集上取得了一定的效果，但是随着目标域数据集分布的变化，预测效果可能会产生急速下降。针对不同的数据集，给边缘分布和条件分布分配合适的权重是当前提升对抗迁移学习模型泛化性的难点。轴承迁移学习故障模型的重点是对于不同源或变工况数据均有良好的诊断效果，如果模型不具备良好的泛化性，则不适于应用在诊断中。

发明内容

本公开旨在至少解决现有技术中存在的问题之一，提供一种基于域动态对抗自适应的轴承迁移学习故障诊断方法。

本公开的一个方面，提供了一种基于域动态对抗自适应的轴承迁移学习故障诊断方法，包括以下步骤：

S1：搭建基于不同工况类别的轴承故障数据样本库，划分源域故障数据和目标域故障数据，并将源域样本作为训练数据，将目标域样本作为测试数据；

S2：使用包括多层卷积神经网络的特征提取器G_f，分别提取源域故障数据的故障隐含特征和目标域故障数据的故障隐含特征；

S3：基于BP神经网络和Softmax分类器构建类判别器G_y，并基于源域故障数据的故障隐含特征训练类判别器G_y，判别对应的源域故障数据属于哪一工况类别；

S4：基于BP神经网络构建全局域判别器G_d，并将源域故障数据和目标域故障数据作为样本，将对应的故障隐含特征作为样本特征，训练全局域判别器G_d，判别样本特征的域类别，构建第一梯度反转层，利用第一梯度反转层对特征提取器G_f和类判别器G_y进行对抗学习，其中，域类别包括源域和目标域；

S5：将样本特征代入类判别器G_y中，计算对应的样本属于某一工况类别的概率，并将其与未代入类判别器G_y的样本特征进行加权计算，得到子域特征，使用基于BP神经网络分别的构建C个子域判别器

判别子域特征的域类别，构建第二梯度反转层，利用第二梯度反转层对特征提取器G_f和类判别器G_y再次进行对抗学习，其中，C表示工况类别的类别数量，c∈{1,2,...,C}表示工况类别的编号；

S6：基于全局域判别器G_d的损失和子域判别器

的损失，计算动态对抗因子ω；

S7：基于动态对抗因子ω，利用随机梯度下降(Stochastic Gradient Descent，SGD)算法优化特征提取器G_f、类判别器G_y、全局域判别器G_d和C个子域判别器

的总损失，得到优化后的特征提取器和类判别器；

S8：将测试数据输入优化后的特征提取器，获得测试数据的样本特征，并将测试数据的样本特征输入优化后的类判别器，获得测试数据的预测工况类别，基于预测工况类别，计算优化后的类判别器的分类精度。

可选的，类判别器G_y由包括一层全连接层和Softmax分类器的BP神经网络构成，类判别器G_y的损失函数L_y表示为下式(1)：

其中，

表示源域故障数据，x⁽ⁱ⁾(i＝1,2,…,n_s)表示标记有真实工况类别的源域样本，y⁽ⁱ⁾(i＝1,2,…,n_s)表示x⁽ⁱ⁾的真实工况类别，n_s表示标记有真实工况类别的源域样本的数量，i表示标记有真实工况类别的源域样本的编号，

表示x⁽ⁱ⁾的工况类别为c的概率，G_f(x⁽ⁱ⁾)表示特征提取器G_f提取出的x⁽ⁱ⁾的故障隐含特征，G_y(G_f(x⁽ⁱ⁾))表示类判别器G_y预测出的x⁽ⁱ⁾的工况类别。

可选的，全局域判别器G_d中的BP神经网络包括依次连接的第二全连接层、第一relu函数激活层、第二丢失层、第三全连接层、第二relu函数激活层、第三丢失层、全连接分类层，全局域判别器G_d的损失函数L_g表示为下式(2)：

其中，

表示目标域故障数据，x^(j)(j＝1,2,…,n_t)表示未标记真实工况类别的目标域样本，n_t表示未标记真实工况类别的目标域样本的数量，j表示未标记真实工况类别的目标域样本的编号，x^(k)(k＝1,2,…,n_t+n_s)表示D_s与D_t组成的集合中的样本，k表示D_s与D_t组成的集合中的样本编号，G_f(x^(k))表示特征提取器G_f提取出的x^(k)的故障隐含特征，G_d(G_f(x^(k)))表示全局域判别器G_d预测出的x^(k)的域类别，d^k表示x^(k)对应的真实域类别，L_d(G_d(G_f(x^(k))),d^k)表示全局域判别器G_d针对x^(k)的损失。

可选的，子域判别器

的结构与全局域判别器G_d的结构相同，子域判别器

的损失函数L_l表示为下式(3)：

其中，

表示x^(k)的工况类别为c的概率，

表示x^(k)的工况类别为c时子域判别器

预测出的x^(k)的域类别，

表示子域判别器

针对x^(k)的损失。

可选的，动态对抗因子ω表示为下式(4)：

其中，d_A,g(D_s,D_t)＝2(1-2(L_g))表示全局域判别器G_d的A-distance距离，

表示子域判别器

的A-distance距离，

表示预测出的工况类别为c的源域故障数据，

表示预测出的工况类别为c的目标域故障数据，

表示预测出的工况类别为c的子域判别器

的损失。

可选的，特征提取器G_f、类判别器G_y、全局域判别器G_d和C个子域判别器

的总损失表示为下式(5)所示的目标函数：

其中，θ_f表示特征提取器G_f的模型参数，θ_y表示类判别器G_y的模型参数，θ_d表示全局域判别器G_d的模型参数，

表示预测出的工况类别为c的子域判别器

的模型参数，λ表示权衡参数；

步骤S7包括：

利用随机梯度下降算法，根据下式(6)确定的更新规则，优化上式(5)所示的目标函数：

其中，Θ为

可选的，优化后的类判别器的分类精度通过下式(7)确定：

其中，

表示目标域样本x^(j)(j＝1,2,…,n_t)的预测工况类别，y^(j)(j＝1,2,…,n_t)表示目标域样本x^(j)(j＝1,2,…,n_t)的真实工况类别。

可选的，特征提取器G_f包括顺序连接的五个特征提取单元，分别为第一特征提取单元、第二特征提取单元、第三特征提取单元、第四特征提取单元、第五特征提取单元，其中：

第一特征提取单元包括顺序连接的第一卷积层、第一批量归一化层；

第二特征提取单元包括顺序连接的第二卷积层、第二批量归一化层、第一最大池化层；

第三特征提取单元包括顺序连接的第三卷积层、第三批量归一化层；

第四特征提取单元包括顺序连接的第四卷积层、第四批量归一化层、第二最大池化层；

第五特征提取单元包括顺序连接的展平层、第一全连接层、第一丢失层；

第一批量归一化层、第二批量归一化层、第三批量归一化层、第四批量归一化层、第一全连接层均采用relu函数作为激活函数。

可选的，特征提取器G_f中的卷积层均为一维卷积神经网络。

本公开的另一个方面，提供了一种基于域动态对抗自适应的轴承迁移学习故障诊断装置，包括：

搭建模块，用于搭建基于不同工况类别的轴承故障数据样本库，划分源域故障数据和目标域故障数据，并将源域样本作为训练数据，将目标域样本作为测试数据；

特征提取模块，用于使用包括多层卷积神经网络的特征提取器G_f，分别提取源域故障数据的故障隐含特征和目标域故障数据的故障隐含特征；

类别判断模块，用于基于BP神经网络和Softmax分类器构建类判别器G_y，并基于源域故障数据的故障隐含特征训练类判别器G_y，判别对应的源域故障数据属于哪一工况类别；

全局域判别模块，用于基于BP神经网络构建全局域判别器G_d，并将源域故障数据和目标域故障数据作为样本，将对应的故障隐含特征作为样本特征，训练全局域判别器G_d，判别样本特征的域类别，构建第一梯度反转层，利用第一梯度反转层对特征提取器G_f和类判别器G_y进行对抗学习，其中，域类别包括源域和目标域；

子域判别模块，用于将样本特征代入类判别器G_y中，计算对应的样本属于某一工况类别的概率，并将其与未代入类判别器G_y的样本特征进行加权计算，得到子域特征，使用基于BP神经网络分别的构建C个子域判别器

计算模块，用于基于全局域判别器G_d的损失和子域判别器

的损失，计算动态对抗因子ω；

优化模块，用于基于动态对抗因子ω，利用随机梯度下降算法优化特征提取器G_f、类判别器G_y、全局域判别器G_d和C个子域判别器

的总损失，得到优化后的特征提取器和类判别器；

测试模块，用于将测试数据输入优化后的特征提取器，获得测试数据的样本特征，并将测试数据的样本特征输入优化后的类判别器，获得测试数据的预测工况类别，基于预测工况类别，计算优化后的类判别器的分类精度。

本公开的有益效果在于：

1、将对抗思想和领域自适应思想结合在一起，分别构造了可以对齐边缘分布和条件分布的两种域分类器，从不同角度实现了源域样本特征空间和目标域样本特征空间的对齐。

2、基于域之间的边缘分布和条件分布往往对领域适应有不同贡献的假设，提出了一种动态计算不同分布贡献权重参数的方法，提升了样本域自适应能力，解决了在目标域进行无监督标签预测的问题，提高了轴承故障诊断的精度，增强了故障诊断模型的泛化性。

附图说明

一个或多个实施方式通过与之对应的附图中的图片进行示例性说明，这些示例性说明并不构成对实施方式的限定，附图中具有相同参考数字标号的元件表示为类似的元件，除非有特别申明，附图中的图不构成比例限制。

图1为本公开一实施方式提供的一种基于域动态对抗自适应的轴承迁移学习故障诊断方法的流程图；

图2为本公开另一实施方式提供的特征提取器G_f的网络结构示意图；

图3为本公开另一实施方式提供的轴承迁移学习故障诊断模型的结构示意图；

图4为本公开另一实施方式提供的一种基于域动态对抗自适应的轴承迁移学习故障诊断方法的流程图；

图5为本公开另一实施方式提供的一种基于域动态对抗自适应的轴承迁移学习故障诊断装置的结构示意图。

具体实施方式

为使本公开实施方式的目的、技术方案和优点更加清楚，下面将结合附图对本公开的各实施方式进行详细的阐述。然而，本领域的普通技术人员可以理解，在本公开各实施方式中，为了使读者更好地理解本公开而提出了许多技术细节。但是，即使没有这些技术细节和基于以下各实施方式的种种变化和修改，也可以实现本公开所要求保护的技术方案。以下各个实施方式的划分是为了描述方便，不应对本公开的具体实现方式构成任何限定，各个实施方式在不矛盾的前提下可以相互结合相互引用。

本公开的一个实施方式涉及一种基于域动态对抗自适应的轴承迁移学习故障诊断方法，其流程如图1所示，包括以下步骤：

S1：搭建基于不同工况类别的轴承故障数据样本库，划分源域故障数据和目标域故障数据，并将源域样本作为训练数据，将目标域样本作为测试数据。

源域故障数据为

目标域故障数据为

其中，x⁽ⁱ⁾(i＝1,2,…,n_s)表示标记有真实工况类别的源域样本，y⁽ⁱ⁾(i＝1,2,…,n_s)表示x⁽ⁱ⁾的真实工况类别，n_s表示标记有真实工况类别的源域样本的数量，i表示标记有真实工况类别的源域样本的编号，x^(j)(j＝1,2,…,n_t)表示未标记真实工况类别的目标域样本，n_t表示未标记真实工况类别的目标域样本的数量，j表示未标记真实工况类别的目标域样本的编号。将源域样本的真实工况类别数量记为Y_s，目标域样本的真实工况类别数量记为Y_t，则有Y_t∈Y_s。

工况类别指的是轴承故障数据样本对应的故障状态及故障大小。在搭建基于不同工况类别的轴承故障数据样本库时，可以收集多种故障状态以及不同故障大小下的轴承故障数据，将其组成轴承故障数据样本库，从而提高样本的多样性。

S2：使用包括多层卷积神经网络的特征提取器G_f，分别提取源域故障数据的故障隐含特征和目标域故障数据的故障隐含特征。

示例性的，如图2所示，特征提取器G_f包括顺序连接的五个特征提取单元，分别为第一特征提取单元layer1、第二特征提取单元layer2、第三特征提取单元layer3、第四特征提取单元layer4、第五特征提取单元layer5。分别将源域故障数据和目标域故障数据输入特征提取器G_f，即可得到对应的故障隐含特征(feature)。

其中，第一特征提取单元layer1包括顺序连接的第一卷积层CNN1、第一批量归一化层BN1；第二特征提取单元layer2包括顺序连接的第二卷积层CNN2、第二批量归一化层BN2、第一最大池化层Max pooling1；第三特征提取单元layer3包括顺序连接的第三卷积层CNN3、第三批量归一化层BN3；第四特征提取单元layer4包括顺序连接的第四卷积层CNN4、第四批量归一化层BN4、第二最大池化层Max pooling2；第五特征提取单元layer5包括顺序连接的展平层flaten、第一全连接层fc1、第一丢失层dropout1；第一批量归一化层BN1、第二批量归一化层BN2、第三批量归一化层BN3、第四批量归一化层BN4、第一全连接层fc1均采用relu函数作为激活函数。

示例性的，特征提取器G_f中的卷积层均为一维卷积神经网络(1D-CNN)。

S3：基于BP神经网络和Softmax分类器构建类判别器G_y，并基于源域故障数据的故障隐含特征训练类判别器G_y，判别对应的源域故障数据属于哪一工况类别。

示例性的，如图3所示，类判别器G_y结构简单，由包括一层全连接层fc和Softmax分类器的BP神经网络构成，Softmax分类器是一种多标签分类器，用于得到多种标签的概率，概率最大的标签即为样本标签。对于输入的标记有真实工况类别的源域样本x⁽ⁱ⁾(i＝1,2,…,n_s)，类判别器G_y的损失函数L_y表示为下式(1)：

其中，

S4：基于BP神经网络构建全局域判别器G_d，并将源域故障数据和目标域故障数据作为样本，将对应的故障隐含特征作为样本特征，训练全局域判别器G_d，判别样本特征的域类别，构建第一梯度反转层，利用第一梯度反转层对特征提取器G_f和类判别器G_y进行对抗学习，其中，域类别包括源域和目标域。

示例性的，一并结合图3，全局域判别器G_d中的BP神经网络包括依次连接的第二全连接层、第一relu函数激活层、第二丢失层、第三全连接层、第二relu函数激活层、第三丢失层、全连接分类层，对于输入样本x^(k)(k＝1,2,…,n_t+n_s)，全局域判别器G_d的损失函数L_g表示为下式(2)：

其中，x^(k)(k＝1,2,…,n_t+n_s)表示D_s与D_t组成的集合中的样本，k表示D_s与D_t组成的集合中的样本编号，G_f(x^(k))表示特征提取器G_f提取出的x^(k)的故障隐含特征，G_d(G_f(x^(k)))表示全局域判别器G_d预测出的x^(k)的域类别，d^k表示x^(k)对应的真实域类别，L_d(G_d(G_f(x^(k))),d^k)表示全局域判别器G_d针对x^(k)的损失。

判别子域特征的域类别，构建第二梯度反转层，利用第二梯度反转层对特征提取器G_f和类判别器G_y再次进行对抗学习，其中，C表示工况类别的类别数量，c∈{1,2,...,C}表示工况类别的编号。

示例性的，一并结合图3，子域判别器

即

至

的结构与全局域判别器G_d的结构相同，对于输入样本x^(k)(k＝1,2,…,n_t+n_s)，子域判别器

的损失函数L_l表示为下式(3)：

其中，

表示x^(k)的工况类别为c的概率，

表示x^(k)的工况类别为c时子域判别器

预测出的x^(k)的域类别，

表示子域判别器

针对x^(k)的损失。

S6：基于全局域判别器G_d的损失和子域判别器

的损失，计算动态对抗因子ω。

示例性的，全局域判别器G_d的A-distance距离表示为d_A,g(D_s,D_t)＝2(1-2(L_g))，子域判别器

的A-distance距离表示为

其中，

表示预测出的工况类别为c的源域故障数据，

表示预测出的工况类别为c的目标域故障数据，

表示预测出的工况类别为c的子域判别器

的损失，则动态对抗因子ω可表示为下式(4)：

通过深度对抗表示来学习和更新网络中的动态对抗因子ω，并使用全局域判别器的损失和子域判别器的损失来对ω进行微调，使得由上述特征提取器G_f、类判别器G_y、全局域判别器G_d和C个子域判别器

组成的轴承迁移学习故障诊断模型变得更加稳健和准确，且简单有效。

S7：基于动态对抗因子ω，利用随机梯度下降算法优化特征提取器G_f、类判别器G_y、全局域判别器G_d和C个子域判别器

的总损失，得到优化后的特征提取器和类判别器，优化后的特征提取器和类判别器即组成最终的轴承迁移学习故障诊断模型。

示例性的，特征提取器G_f、类判别器G_y、全局域判别器G_d和C个子域判别器

的总损失表示为下式(5)所示的目标函数：

表示预测出的工况类别为c的子域判别器

的模型参数，λ表示权衡参数。

步骤S7包括：

其中，Θ为

示例性的，优化后的类判别器的分类精度通过下式(7)确定：

其中，

本实施方式涉及的基于域动态对抗自适应的轴承迁移学习故障诊断方法的有益效果在于：

为了使本领域技术人员能够更好地理解上述实施方式，下面以一具体示例进行说明。

如图4所示，一种基于域动态对抗自适应的轴承迁移学习故障诊断方法，包括以下步骤：

(1)收集轴承数据，搭建不同工况类别的轴承故障数据样本库，划分源域故障数据和目标域故障数据，并将源域样本作为训练数据，将目标域样本作为测试数据。

(2)通过训练模块进行训练：

使用1D-CNN网络作为特征提取器进行特征提取，分别提取源域故障数据的故障隐含特征和目标域故障数据的故障隐含特征，得到源域样本特征和目标域样本特征；

使用源域样本特征对由BP神经网络和Softmax分类器构成的类判别器进行训练，判别输入的源域样本特征属于哪一工况类别；

使用源域样本特征和目标域样本特征，对BP神经网络构建的全局域判别器进行训练，判别输入的样本特征来自源域样本还是目标域样本，构造梯度反转层，将其用于实现特征提取器和域判别器的对抗学习；

将源域样本特征和目标域样本特征代入类判别器中，计算对应的样本属于某一工况类别的概率，并将其与未代入类判别器的样本特征进行加权计算，得到子域特征，使用BP神经网络分别构建与样本的工况类别数量相同数量的子域判别器，判别输入的样本特征来自源域样本还是目标域样本，构架梯度反转层，将其用于实现特征提取器和域判别器的对抗学习；

使用全局域判别器的损失和子域判别器的损失进行动态对抗因子计算；

使用随机梯度下降算法，优化根据动态对抗因子确定的特征提取器、类判别器、全局域判别器、子域判别器的总损失，得到优化后的特征提取器和类判别器。

(3)通过诊断模块进行轴承故障诊断测试：

将作为测试数据的目标域样本输入优化后的特征提取器，得到对应的目标域样本特征，并将得到的目标域样本特征输入优化后的类判别器，该优化后的类判别器输出对应的诊断结果即目标域样本对应的预测工况类别，根据该预测工况类别以及目标域样本的真实工况类别，即可计算出优化后的类判别器的分类精度。

为了对本公开实施方式采用的基于域动态对抗自适应的轴承迁移学习故障诊断方法的技术效果加以验证说明，下面以变工况轴承故障为例进行验证说明。

本次验证选择自适应批量归一化(Adaptive Batch Normalization，AdaBN)、深层相关对齐(Deep Correlation Alignment，DeepCORAL)和域对抗神经网络(Domain-Adversarial Neural Networks，DANN)三种方法进行对比实验，作为轴承故障数据样本库的数据源分别来自凯斯西储大学(Case Western Reserve University，CWRU)轴承数据集和江南大学(Jiangnan University，JNU)轴承数据集。

数据集说明：

CWRU轴承数据集：CWRU数据集是故障诊断研究中最著名的开源数据集之一，由凯斯西储大学轴承数据中心提供，大量迁移学习故障诊断方面的论文都用到了该数据集。CWRU中的数据是通过附在外壳上并带有磁性的加速度计收集的。本次验证使用了其中的驱动端轴承故障数据，其采样频率为12kHz，表1中列出了由故障状态和故障大小组成的十种轴承工况类别，其中，故障状态包括一个正常轴承(NA)状态和三个故障状态，三个故障状态分别为内部故障(IF)状态、球形故障(BF)状态、外部故障(OF)状态，故障大小分为0英寸、7英寸、14英寸、21英寸四类，其中，0英寸表示轴承处于正常状态。CWRU数据集由四个不同的电动机负载组成，分别对应于四个不同的运行速度，如表2所示。本次验证将这些不同的工作条件视为不同的任务，包括0、1、2和3。例如，任务0→1表示源域故障数据是电机负载为0HP的数据，而目标域故障数据是电动机负载为1HP的数据。CWRU轴承数据集中总共有12种迁移学习设置。

表1 CWRU轴承数据集工况类别描述表

表2 CWRU轴承数据集迁移学习任务划分表

JNU轴承数据集：江南大学轴承数据集包含四种状态，即正常状态、内圈故障状态、外圈故障状态、球面故障状态。振动信号在三种不同的转速(600rpm、800rpm和1000rpm)下使用加速度计进行采样，采样频率为50kHz。如表3所示，不同的工作条件被认为是不同的迁移学习任务。例如，任务0→1表示源域故障数据是转速为600rpm的数据，目标域故障数据是转速为800rpm的数据。

表3 JNU轴承数据集迁移学习任务划分表

数据处理：本次验证采用原始数据进行训练，直接将测得的振动信号用作轴承迁移学习故障诊断模型的输入，每个样本的长度为1024，没有任何重叠；

本次验证中，每个模型训练迭代200次，在训练过程中，模型训练和测试过程交替进行。其中，训练过程中采用小批量的SGD来进行反向传播，每批大小为64。使用Pytorch中的“逐步”策略作为学习速率退火方法，初始学习速率为0.001，并分别在时期50和150中衰减(乘以0.1)，对比结果如表4和表5所示。

表4 CRWU轴承数据集效果对比表

表5 JNU轴承数据集效果对比表

由表4和表5可知，本公开提出的基于域动态对抗自适应的轴承迁移学习故障诊断方法具有更强的适应性，个体平均效果和整体平均效果均优于其他方法。

综上，本公开提出的基于域动态对抗自适应的轴承迁移学习故障诊断方法，将对抗学习的思路融入到迁移学习故障诊断中，通过动态对抗因子合理修正目标域边缘分布和条件分布偏差，使目标域的样本特征分布更接近于源域的样本特征分布，并用源域数据训练的类判别器来预测目标域的故障工况类别，实现了无监督学习，提高了故障诊断精度，轴承迁移学习故障诊断模型的泛化性得到了加强。

本公开的另一个实施方式涉及一种基于域动态对抗自适应的轴承迁移学习故障诊断装置，如图5所示，包括：

搭建模块501，用于搭建基于不同工况类别的轴承故障数据样本库，划分源域故障数据和目标域故障数据，并将源域样本作为训练数据，将目标域样本作为测试数据；

特征提取模块502，用于使用包括多层卷积神经网络的特征提取器G_f，分别提取源域故障数据的故障隐含特征和目标域故障数据的故障隐含特征；

类别判断模块503，用于基于BP神经网络和Softmax分类器构建类判别器G_y，并基于源域故障数据的故障隐含特征训练类判别器G_y，判别对应的源域故障数据属于哪一工况类别；

全局域判别模块504，用于基于BP神经网络构建全局域判别器G_d，并将源域故障数据和目标域故障数据作为样本，将对应的故障隐含特征作为样本特征，训练全局域判别器G_d，判别样本特征的域类别，构建第一梯度反转层，利用第一梯度反转层对特征提取器G_f和类判别器G_y进行对抗学习，其中，域类别包括源域和目标域；

子域判别模块505，用于将样本特征代入类判别器G_y中，计算对应的样本属于某一工况类别的概率，并将其与未代入类判别器G_y的样本特征进行加权计算，得到子域特征，使用基于BP神经网络分别的构建C个子域判别器

计算模块506，用于基于全局域判别器G_d的损失和子域判别器

的损失，计算动态对抗因子ω；

优化模块507，用于基于动态对抗因子ω，利用随机梯度下降算法优化特征提取器G_f、类判别器G_y、全局域判别器G_d和C个子域判别器

的总损失，得到优化后的特征提取器和类判别器；

测试模块508，用于将测试数据输入优化后的特征提取器，获得测试数据的样本特征，并将测试数据的样本特征输入优化后的类判别器，获得测试数据的预测工况类别，基于预测工况类别，计算优化后的类判别器的分类精度。

本公开实施方式提供的基于域动态对抗自适应的轴承迁移学习故障诊断装置的具体实现方法，可以参见本公开实施方式提供的基于域动态对抗自适应的轴承迁移学习故障诊断方法所述，此处不再赘述。

本实施方式涉及的基于域动态对抗自适应的轴承迁移学习故障诊断装置的有益效果在于：

本领域的普通技术人员可以理解，上述各实施方式是实现本公开的具体实施方式，而在实际应用中，可以在形式上和细节上对其作各种改变，而不偏离本公开的精神和范围。

Claims

1.一种基于域动态对抗自适应的轴承迁移学习故障诊断方法，其特征在于，所述方法包括以下步骤：

S2：使用包括多层卷积神经网络的特征提取器G_f，分别提取所述源域故障数据的故障隐含特征和所述目标域故障数据的故障隐含特征；

S3：基于BP神经网络和Softmax分类器构建类判别器G_y，并基于所述源域故障数据的故障隐含特征训练所述类判别器G_y，判别对应的所述源域故障数据属于哪一工况类别；

S4：基于BP神经网络构建全局域判别器G_d，并将所述源域故障数据和所述目标域故障数据作为样本，将对应的故障隐含特征作为样本特征，训练所述全局域判别器G_d，判别所述样本特征的域类别，构建第一梯度反转层，利用所述第一梯度反转层对所述特征提取器G_f和所述类判别器G_y进行对抗学习，其中，所述域类别包括源域和目标域；

S5：将所述样本特征代入所述类判别器G_y中，计算对应的样本属于某一工况类别的概率，并将其与未代入所述类判别器G_y的样本特征进行加权计算，得到子域特征，使用基于BP神经网络分别的构建C个子域判别器

判别所述子域特征的域类别，构建第二梯度反转层，利用所述第二梯度反转层对所述特征提取器G_f和所述类判别器G_y再次进行对抗学习，其中，C表示工况类别的类别数量，c∈{1,2,...,C}表示工况类别的编号；

S6：基于所述全局域判别器G_d的损失和所述子域判别器

的损失，计算动态对抗因子ω；

S7：基于所述动态对抗因子ω，利用随机梯度下降算法优化所述特征提取器G_f、所述类判别器G_y、所述全局域判别器G_d和所述C个子域判别器

的总损失，得到优化后的特征提取器和类判别器；

S8：将所述测试数据输入优化后的特征提取器，获得所述测试数据的样本特征，并将所述测试数据的样本特征输入优化后的类判别器，获得所述测试数据的预测工况类别，基于所述预测工况类别，计算所述优化后的类判别器的分类精度。

2.根据权利要求1所述的方法，其特征在于，所述类判别器G_y由包括一层全连接层和Softmax分类器的BP神经网络构成，所述类判别器G_y的损失函数L_y表示为下式(1)：

其中，

表示所述源域故障数据，x⁽ⁱ⁾(i＝1,2,…,n_s)表示标记有真实工况类别的源域样本，y⁽ⁱ⁾(i＝1,2,…,n_s)表示x⁽ⁱ⁾的真实工况类别，n_s表示标记有真实工况类别的源域样本的数量，i表示标记有真实工况类别的源域样本的编号，

表示x⁽ⁱ⁾的工况类别为c的概率，G_f(x⁽ⁱ⁾)表示所述特征提取器G_f提取出的x⁽ⁱ⁾的故障隐含特征，G_y(G_f(x⁽ⁱ⁾))表示所述类判别器G_y预测出的x⁽ⁱ⁾的工况类别。

3.根据权利要求2所述的方法，其特征在于，所述全局域判别器G_d中的BP神经网络包括依次连接的第二全连接层、第一relu函数激活层、第二丢失层、第三全连接层、第二relu函数激活层、第三丢失层、全连接分类层，所述全局域判别器G_d的损失函数L_g表示为下式(2)：

其中，

表示所述目标域故障数据，x^(j)(j＝1,2,…,n_t)表示未标记真实工况类别的目标域样本，n_t表示未标记真实工况类别的目标域样本的数量，j表示未标记真实工况类别的目标域样本的编号，x^(k)(k＝1,2,…,n_t+n_s)表示D_s与D_t组成的集合中的样本，k表示D_s与D_t组成的集合中的样本编号，G_f(x^(k))表示所述特征提取器G_f提取出的x^(k)的故障隐含特征，G_d(G_f(x^(k)))表示所述全局域判别器G_d预测出的x^(k)的域类别，d^k表示x^(k)对应的真实域类别，L_d(G_d(G_f(x^(k))),d^k)表示所述全局域判别器G_d针对x^(k)的损失。

4.根据权利要求3所述的方法，其特征在于，所述子域判别器

的结构与所述全局域判别器G_d的结构相同，所述子域判别器

的损失函数L_l表示为下式(3)：

其中，

表示x^(k)的工况类别为c的概率，

表示x^(k)的工况类别为c时所述子域判别器

预测出的x^(k)的域类别，

表示所述子域判别器

针对x^(k)的损失。

5.根据权利要求4所述的方法，其特征在于，所述动态对抗因子ω表示为下式(4)：

其中，d_A,g(D_s,D_t)＝2(1-2(L_g))表示所述全局域判别器G_d的A-distance距离，

表示所述子域判别器

的A-distance距离，

表示预测出的工况类别为c的源域故障数据，

表示预测出的工况类别为c的目标域故障数据，

表示预测出的工况类别为c的所述子域判别器

的损失。

6.根据权利要求5所述的方法，其特征在于，所述特征提取器G_f、所述类判别器G_y、所述全局域判别器G_d和所述C个子域判别器

的总损失表示为下式(5)所示的目标函数：

其中，θ_f表示所述特征提取器G_f的模型参数，θ_y表示所述类判别器G_y的模型参数，θ_d表示所述全局域判别器G_d的模型参数，

表示预测出的工况类别为c的子域判别器

的模型参数，λ表示权衡参数；

步骤S7包括：

其中，Θ为

7.根据权利要求6所述的方法，其特征在于，所述优化后的类判别器的分类精度通过下式(7)确定：

其中，

8.根据权利要求1至7任一项所述的方法，其特征在于，所述特征提取器G_f包括顺序连接的五个特征提取单元，分别为第一特征提取单元、第二特征提取单元、第三特征提取单元、第四特征提取单元、第五特征提取单元，其中：

所述第一特征提取单元包括顺序连接的第一卷积层、第一批量归一化层；

所述第二特征提取单元包括顺序连接的第二卷积层、第二批量归一化层、第一最大池化层；

所述第三特征提取单元包括顺序连接的第三卷积层、第三批量归一化层；

所述第四特征提取单元包括顺序连接的第四卷积层、第四批量归一化层、第二最大池化层；

所述第五特征提取单元包括顺序连接的展平层、第一全连接层、第一丢失层；

所述第一批量归一化层、所述第二批量归一化层、所述第三批量归一化层、所述第四批量归一化层、所述第一全连接层均采用relu函数作为激活函数。

9.根据权利要求8所述的方法，其特征在于，所述特征提取器G_f中的卷积层均为一维卷积神经网络。

10.一种基于域动态对抗自适应的轴承迁移学习故障诊断装置，其特征在于，所述装置包括：

特征提取模块，用于使用包括多层卷积神经网络的特征提取器G_f，分别提取所述源域故障数据的故障隐含特征和所述目标域故障数据的故障隐含特征；

类别判断模块，用于基于BP神经网络和Softmax分类器构建类判别器G_y，并基于所述源域故障数据的故障隐含特征训练所述类判别器G_y，判别对应的所述源域故障数据属于哪一工况类别；

全局域判别模块，用于基于BP神经网络构建全局域判别器G_d，并将所述源域故障数据和所述目标域故障数据作为样本，将对应的故障隐含特征作为样本特征，训练所述全局域判别器G_d，判别所述样本特征的域类别，构建第一梯度反转层，利用所述第一梯度反转层对所述特征提取器G_f和所述类判别器G_y进行对抗学习，其中，所述域类别包括源域和目标域；

子域判别模块，用于将所述样本特征代入所述类判别器G_y中，计算对应的样本属于某一工况类别的概率，并将其与未代入所述类判别器G_y的样本特征进行加权计算，得到子域特征，使用基于BP神经网络分别的构建C个子域判别器

计算模块，用于基于所述全局域判别器G_d的损失和所述子域判别器

的损失，计算动态对抗因子ω；

优化模块，用于基于所述动态对抗因子ω，利用随机梯度下降算法优化所述特征提取器G_f、所述类判别器G_y、所述全局域判别器G_d和所述C个子域判别器

的总损失，得到优化后的特征提取器和类判别器；

测试模块，用于将所述测试数据输入优化后的特征提取器，获得所述测试数据的样本特征，并将所述测试数据的样本特征输入优化后的类判别器，获得所述测试数据的预测工况类别，基于所述预测工况类别，计算所述优化后的类判别器的分类精度。