CN115600134A - 基于域动态对抗自适应的轴承迁移学习故障诊断方法 - Google Patents
基于域动态对抗自适应的轴承迁移学习故障诊断方法 Download PDFInfo
- Publication number
- CN115600134A CN115600134A CN202210323048.0A CN202210323048A CN115600134A CN 115600134 A CN115600134 A CN 115600134A CN 202210323048 A CN202210323048 A CN 202210323048A CN 115600134 A CN115600134 A CN 115600134A
- Authority
- CN
- China
- Prior art keywords
- discriminator
- class
- domain
- layer
- fault
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 47
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000013526 transfer learning Methods 0.000 title description 10
- 238000013508 migration Methods 0.000 claims abstract description 32
- 230000005012 migration Effects 0.000 claims abstract description 30
- 238000012549 training Methods 0.000 claims abstract description 30
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 14
- 238000000605 extraction Methods 0.000 claims description 49
- 238000012360 testing method Methods 0.000 claims description 39
- 238000013528 artificial neural network Methods 0.000 claims description 29
- 230000006870 function Effects 0.000 claims description 28
- 238000010606 normalization Methods 0.000 claims description 25
- 230000003042 antagnostic effect Effects 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 239000000126 substance Substances 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 9
- 230000003044 adaptive effect Effects 0.000 claims description 6
- 238000011176 pooling Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000009826 distribution Methods 0.000 description 31
- 230000000694 effects Effects 0.000 description 9
- 230000006978 adaptation Effects 0.000 description 7
- 238000012544 monitoring process Methods 0.000 description 5
- 238000012795 verification Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 102100033620 Calponin-1 Human genes 0.000 description 1
- 102100033591 Calponin-2 Human genes 0.000 description 1
- 102100033592 Calponin-3 Human genes 0.000 description 1
- 101000945318 Homo sapiens Calponin-1 Proteins 0.000 description 1
- 101000945403 Homo sapiens Calponin-2 Proteins 0.000 description 1
- 101000945410 Homo sapiens Calponin-3 Proteins 0.000 description 1
- 240000007472 Leucaena leucocephala Species 0.000 description 1
- 235000010643 Leucaena leucocephala Nutrition 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005260 corrosion Methods 0.000 description 1
- 230000007797 corrosion Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/04—Bearings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
Abstract
本公开涉及轴承故障诊断技术领域,提供一种基于域动态对抗自适应的轴承迁移学习故障诊断方法,包括:搭建不同工况类别的轴承故障数据样本库,划分源域数据和目标域数据;使用包括多层卷积神经网络的特征提取器,提取源域数据、目标域数据的样本特征;构建类判别器;构建并训练全局域判别器,构建梯度反转层;将类判别器预测的类别权重与特征提取器生成的特征进行加权得到子域特征,构建子域判别器,构建梯度反转层;计算动态对抗因子;优化特征提取器、类判别器、全局域判别器和子域判别器的总损失,得到优化后的模型;将目标域数据输入优化后的模型,获得预测类别,计算分类精度。本公开可提升样本域自适应能力,加强故障诊断模型的泛化性。
Description
技术领域
本公开涉及轴承故障诊断技术领域,特别涉及一种基于域动态对抗自适应的轴承迁移学习故障诊断方法。
背景技术
旋转机械广泛应用于航空航天、轨道交通、石油化工、汽车制造、风力发电等国计民生的重要工程领域,在国民经济生产中具有举足轻重的作用。为满足实际生产需求,机械设备通常工作在重载、高温、腐蚀以及高作业率的复杂恶劣环境,一旦出现故障,会带来巨大的经济损失。随着工业大数据和物联网在工业4.0背景下的飞速发展,用于工业设备的故障预测和健康管理(Prognostics Health Management,PHM)变得越来越重要,从而导致用于工业设备的智能维护系统越来越多。智能故障诊断正成为机器PHM技术的重要分支,包括支持向量机和人工神经网络在内的传统机器学习方法已在该领域得到广泛应用。同时,随着可用数据的增加,具有表示学习能力的数据驱动的情报方法变得越来越流行。在这种背景下,深度学习具有自适应特征提取和数据模式识别逐渐成为工业设备PHM研究的热点。诸如卷积神经网络(Convolutional Neural Networks,CNN)、稀疏自动编码器等深度学习模型,对于PHM任务的有效性已在当前研究中得到了成功验证。
然而,当前在智能故障诊断中的有效性基于以下两个假设:1)有大量标签数据;2)训练数据集的故障模式与测试数据集的故障模式相同(在数学上,训练数据集应与测试数据集遵循相同的分布)。一般而言,采集大量有标签数据从而训练智能识别方法是实现智能故障的必要条件,但是该条件在有些应用场景下却难以满足。例如,在工业应用场景中,由于以下两个因素的存在,常常难以采集到足够的标签数据:1)部分机械设备安全系数较高,在机械设备出现故障前进行了维护维修策略,导致难以采集到故障状态下的监测信号;2)部分机械设备性能退化历时长,采集足够的全寿命周期监测数据耗时巨大。综上,在工业应用场景下,一般难以采集足够的标签数据,尤其是机械设备在故障状态下的数据。与工业现场有标签数据缺乏形成鲜明对比的是,在实验室条件下,通过实验设备可以对机械设备的不同运行状态进行仿真,从而可以采集机械设备在不同状态下的监测数据。但是,实验室所采集的机械设备模拟运行状态监测数据和实际工况条件下所采集的运行状态监测数据之间存在差异,使得通过实验室数据所训练的智能故障诊断模型并不能直接应用在工业现场,这在一定程度限制了智能故障诊断方法的工业化应用。
迁移学习把一个领域(即源领域)的知识迁移到另外一个领域(即目标领域),使得智能模型可在目标领域能够取得更好的学习效果。因此,迁移学习可解决目标域没有标签数据的问题,该方法已经在图像、语音等域得到广泛应用。迁移学习的核心是,找到源领域和目标领域之间的相似性,并加以合理利用。这种相似性非常普遍,比如,不同人的身体构造是相似的,自行车和摩托车的骑行方式是相似的,等等。找到相似性后,以度量为准则,通过不同方式的学习手段,增大两个领域之间的相似性,从而完成迁移学习。利用迁移学习在模型泛化方面的优点,可为复杂机械系统的故障诊断提供一种新的手段。
近年来,基于对抗的迁移学习方式在故障诊断领域取得了很多重大成果。基于对抗的迁移是指使用域判别器减少深度特征提取器产生的源域和目标域的特征分布差异的对抗方法。源域深层特征提取器使用标记的数据进行了预训练,模型参数通过源域类分类器进行迭代优化。训练好的特征提取模型同样可以应用于目标域特征生成。之后,对源域和目标域的特征进行联合训练,以最大程度地增加域判别器的损失,使得源域和目标域具有相似的分布。然而,当前的对抗迁移学习要么是单个域分类器对齐边缘分布(全局域)或条件分布(子域),要么是多个域分类器对齐条件分布。不过,在实际应用中,域之间的边缘分布和条件分布往往对领域适应有不同的贡献。虽然上述方法在一些数据集上取得了一定的效果,但是随着目标域数据集分布的变化,预测效果可能会产生急速下降。针对不同的数据集,给边缘分布和条件分布分配合适的权重是当前提升对抗迁移学习模型泛化性的难点。轴承迁移学习故障模型的重点是对于不同源或变工况数据均有良好的诊断效果,如果模型不具备良好的泛化性,则不适于应用在诊断中。
发明内容
本公开旨在至少解决现有技术中存在的问题之一,提供一种基于域动态对抗自适应的轴承迁移学习故障诊断方法。
本公开的一个方面,提供了一种基于域动态对抗自适应的轴承迁移学习故障诊断方法,包括以下步骤:
S1:搭建基于不同工况类别的轴承故障数据样本库,划分源域故障数据和目标域故障数据,并将源域样本作为训练数据,将目标域样本作为测试数据;
S2:使用包括多层卷积神经网络的特征提取器Gf,分别提取源域故障数据的故障隐含特征和目标域故障数据的故障隐含特征;
S3:基于BP神经网络和Softmax分类器构建类判别器Gy,并基于源域故障数据的故障隐含特征训练类判别器Gy,判别对应的源域故障数据属于哪一工况类别;
S4:基于BP神经网络构建全局域判别器Gd,并将源域故障数据和目标域故障数据作为样本,将对应的故障隐含特征作为样本特征,训练全局域判别器Gd,判别样本特征的域类别,构建第一梯度反转层,利用第一梯度反转层对特征提取器Gf和类判别器Gy进行对抗学习,其中,域类别包括源域和目标域;
S5:将样本特征代入类判别器Gy中,计算对应的样本属于某一工况类别的概率,并将其与未代入类判别器Gy的样本特征进行加权计算,得到子域特征,使用基于BP神经网络分别的构建C个子域判别器判别子域特征的域类别,构建第二梯度反转层,利用第二梯度反转层对特征提取器Gf和类判别器Gy再次进行对抗学习,其中,C表示工况类别的类别数量,c∈{1,2,...,C}表示工况类别的编号;
S7:基于动态对抗因子ω,利用随机梯度下降(Stochastic Gradient Descent,SGD)算法优化特征提取器Gf、类判别器Gy、全局域判别器Gd和C个子域判别器的总损失,得到优化后的特征提取器和类判别器;
S8:将测试数据输入优化后的特征提取器,获得测试数据的样本特征,并将测试数据的样本特征输入优化后的类判别器,获得测试数据的预测工况类别,基于预测工况类别,计算优化后的类判别器的分类精度。
可选的,类判别器Gy由包括一层全连接层和Softmax分类器的BP神经网络构成,类判别器Gy的损失函数Ly表示为下式(1):
其中,表示源域故障数据,x(i)(i=1,2,…,ns)表示标记有真实工况类别的源域样本,y(i)(i=1,2,…,ns)表示x(i)的真实工况类别,ns表示标记有真实工况类别的源域样本的数量,i表示标记有真实工况类别的源域样本的编号,表示x(i)的工况类别为c的概率,Gf(x(i))表示特征提取器Gf提取出的x(i)的故障隐含特征,Gy(Gf(x(i)))表示类判别器Gy预测出的x(i)的工况类别。
可选的,全局域判别器Gd中的BP神经网络包括依次连接的第二全连接层、第一relu函数激活层、第二丢失层、第三全连接层、第二relu函数激活层、第三丢失层、全连接分类层,全局域判别器Gd的损失函数Lg表示为下式(2):
其中,表示目标域故障数据,x(j)(j=1,2,…,nt)表示未标记真实工况类别的目标域样本,nt表示未标记真实工况类别的目标域样本的数量,j表示未标记真实工况类别的目标域样本的编号,x(k)(k=1,2,…,nt+ns)表示Ds与Dt组成的集合中的样本,k表示Ds与Dt组成的集合中的样本编号,Gf(x(k))表示特征提取器Gf提取出的x(k)的故障隐含特征,Gd(Gf(x(k)))表示全局域判别器Gd预测出的x(k)的域类别,dk表示x(k)对应的真实域类别,Ld(Gd(Gf(x(k))),dk)表示全局域判别器Gd针对x(k)的损失。
可选的,动态对抗因子ω表示为下式(4):
其中,dA,g(Ds,Dt)=2(1-2(Lg))表示全局域判别器Gd的A-distance距离,表示子域判别器的A-distance距离,表示预测出的工况类别为c的源域故障数据,表示预测出的工况类别为c的目标域故障数据,表示预测出的工况类别为c的子域判别器的损失。
步骤S7包括:
利用随机梯度下降算法,根据下式(6)确定的更新规则,优化上式(5)所示的目标函数:
可选的,优化后的类判别器的分类精度通过下式(7)确定:
可选的,特征提取器Gf包括顺序连接的五个特征提取单元,分别为第一特征提取单元、第二特征提取单元、第三特征提取单元、第四特征提取单元、第五特征提取单元,其中:
第一特征提取单元包括顺序连接的第一卷积层、第一批量归一化层;
第二特征提取单元包括顺序连接的第二卷积层、第二批量归一化层、第一最大池化层;
第三特征提取单元包括顺序连接的第三卷积层、第三批量归一化层;
第四特征提取单元包括顺序连接的第四卷积层、第四批量归一化层、第二最大池化层;
第五特征提取单元包括顺序连接的展平层、第一全连接层、第一丢失层;
第一批量归一化层、第二批量归一化层、第三批量归一化层、第四批量归一化层、第一全连接层均采用relu函数作为激活函数。
可选的,特征提取器Gf中的卷积层均为一维卷积神经网络。
本公开的另一个方面,提供了一种基于域动态对抗自适应的轴承迁移学习故障诊断装置,包括:
搭建模块,用于搭建基于不同工况类别的轴承故障数据样本库,划分源域故障数据和目标域故障数据,并将源域样本作为训练数据,将目标域样本作为测试数据;
特征提取模块,用于使用包括多层卷积神经网络的特征提取器Gf,分别提取源域故障数据的故障隐含特征和目标域故障数据的故障隐含特征;
类别判断模块,用于基于BP神经网络和Softmax分类器构建类判别器Gy,并基于源域故障数据的故障隐含特征训练类判别器Gy,判别对应的源域故障数据属于哪一工况类别;
全局域判别模块,用于基于BP神经网络构建全局域判别器Gd,并将源域故障数据和目标域故障数据作为样本,将对应的故障隐含特征作为样本特征,训练全局域判别器Gd,判别样本特征的域类别,构建第一梯度反转层,利用第一梯度反转层对特征提取器Gf和类判别器Gy进行对抗学习,其中,域类别包括源域和目标域;
子域判别模块,用于将样本特征代入类判别器Gy中,计算对应的样本属于某一工况类别的概率,并将其与未代入类判别器Gy的样本特征进行加权计算,得到子域特征,使用基于BP神经网络分别的构建C个子域判别器判别子域特征的域类别,构建第二梯度反转层,利用第二梯度反转层对特征提取器Gf和类判别器Gy再次进行对抗学习,其中,C表示工况类别的类别数量,c∈{1,2,...,C}表示工况类别的编号;
测试模块,用于将测试数据输入优化后的特征提取器,获得测试数据的样本特征,并将测试数据的样本特征输入优化后的类判别器,获得测试数据的预测工况类别,基于预测工况类别,计算优化后的类判别器的分类精度。
本公开的有益效果在于:
1、将对抗思想和领域自适应思想结合在一起,分别构造了可以对齐边缘分布和条件分布的两种域分类器,从不同角度实现了源域样本特征空间和目标域样本特征空间的对齐。
2、基于域之间的边缘分布和条件分布往往对领域适应有不同贡献的假设,提出了一种动态计算不同分布贡献权重参数的方法,提升了样本域自适应能力,解决了在目标域进行无监督标签预测的问题,提高了轴承故障诊断的精度,增强了故障诊断模型的泛化性。
附图说明
一个或多个实施方式通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施方式的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1为本公开一实施方式提供的一种基于域动态对抗自适应的轴承迁移学习故障诊断方法的流程图;
图2为本公开另一实施方式提供的特征提取器Gf的网络结构示意图;
图3为本公开另一实施方式提供的轴承迁移学习故障诊断模型的结构示意图;
图4为本公开另一实施方式提供的一种基于域动态对抗自适应的轴承迁移学习故障诊断方法的流程图;
图5为本公开另一实施方式提供的一种基于域动态对抗自适应的轴承迁移学习故障诊断装置的结构示意图。
具体实施方式
为使本公开实施方式的目的、技术方案和优点更加清楚,下面将结合附图对本公开的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本公开各实施方式中,为了使读者更好地理解本公开而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本公开所要求保护的技术方案。以下各个实施方式的划分是为了描述方便,不应对本公开的具体实现方式构成任何限定,各个实施方式在不矛盾的前提下可以相互结合相互引用。
本公开的一个实施方式涉及一种基于域动态对抗自适应的轴承迁移学习故障诊断方法,其流程如图1所示,包括以下步骤:
S1:搭建基于不同工况类别的轴承故障数据样本库,划分源域故障数据和目标域故障数据,并将源域样本作为训练数据,将目标域样本作为测试数据。
源域故障数据为目标域故障数据为其中,x(i)(i=1,2,…,ns)表示标记有真实工况类别的源域样本,y(i)(i=1,2,…,ns)表示x(i)的真实工况类别,ns表示标记有真实工况类别的源域样本的数量,i表示标记有真实工况类别的源域样本的编号,x(j)(j=1,2,…,nt)表示未标记真实工况类别的目标域样本,nt表示未标记真实工况类别的目标域样本的数量,j表示未标记真实工况类别的目标域样本的编号。将源域样本的真实工况类别数量记为Ys,目标域样本的真实工况类别数量记为Yt,则有Yt∈Ys。
工况类别指的是轴承故障数据样本对应的故障状态及故障大小。在搭建基于不同工况类别的轴承故障数据样本库时,可以收集多种故障状态以及不同故障大小下的轴承故障数据,将其组成轴承故障数据样本库,从而提高样本的多样性。
S2:使用包括多层卷积神经网络的特征提取器Gf,分别提取源域故障数据的故障隐含特征和目标域故障数据的故障隐含特征。
示例性的,如图2所示,特征提取器Gf包括顺序连接的五个特征提取单元,分别为第一特征提取单元layer1、第二特征提取单元layer2、第三特征提取单元layer3、第四特征提取单元layer4、第五特征提取单元layer5。分别将源域故障数据和目标域故障数据输入特征提取器Gf,即可得到对应的故障隐含特征(feature)。
其中,第一特征提取单元layer1包括顺序连接的第一卷积层CNN1、第一批量归一化层BN1;第二特征提取单元layer2包括顺序连接的第二卷积层CNN2、第二批量归一化层BN2、第一最大池化层Max pooling1;第三特征提取单元layer3包括顺序连接的第三卷积层CNN3、第三批量归一化层BN3;第四特征提取单元layer4包括顺序连接的第四卷积层CNN4、第四批量归一化层BN4、第二最大池化层Max pooling2;第五特征提取单元layer5包括顺序连接的展平层flaten、第一全连接层fc1、第一丢失层dropout1;第一批量归一化层BN1、第二批量归一化层BN2、第三批量归一化层BN3、第四批量归一化层BN4、第一全连接层fc1均采用relu函数作为激活函数。
示例性的,特征提取器Gf中的卷积层均为一维卷积神经网络(1D-CNN)。
S3:基于BP神经网络和Softmax分类器构建类判别器Gy,并基于源域故障数据的故障隐含特征训练类判别器Gy,判别对应的源域故障数据属于哪一工况类别。
示例性的,如图3所示,类判别器Gy结构简单,由包括一层全连接层fc和Softmax分类器的BP神经网络构成,Softmax分类器是一种多标签分类器,用于得到多种标签的概率,概率最大的标签即为样本标签。对于输入的标记有真实工况类别的源域样本x(i)(i=1,2,…,ns),类判别器Gy的损失函数Ly表示为下式(1):
S4:基于BP神经网络构建全局域判别器Gd,并将源域故障数据和目标域故障数据作为样本,将对应的故障隐含特征作为样本特征,训练全局域判别器Gd,判别样本特征的域类别,构建第一梯度反转层,利用第一梯度反转层对特征提取器Gf和类判别器Gy进行对抗学习,其中,域类别包括源域和目标域。
示例性的,一并结合图3,全局域判别器Gd中的BP神经网络包括依次连接的第二全连接层、第一relu函数激活层、第二丢失层、第三全连接层、第二relu函数激活层、第三丢失层、全连接分类层,对于输入样本x(k)(k=1,2,…,nt+ns),全局域判别器Gd的损失函数Lg表示为下式(2):
其中,x(k)(k=1,2,…,nt+ns)表示Ds与Dt组成的集合中的样本,k表示Ds与Dt组成的集合中的样本编号,Gf(x(k))表示特征提取器Gf提取出的x(k)的故障隐含特征,Gd(Gf(x(k)))表示全局域判别器Gd预测出的x(k)的域类别,dk表示x(k)对应的真实域类别,Ld(Gd(Gf(x(k))),dk)表示全局域判别器Gd针对x(k)的损失。
S5:将样本特征代入类判别器Gy中,计算对应的样本属于某一工况类别的概率,并将其与未代入类判别器Gy的样本特征进行加权计算,得到子域特征,使用基于BP神经网络分别的构建C个子域判别器判别子域特征的域类别,构建第二梯度反转层,利用第二梯度反转层对特征提取器Gf和类判别器Gy再次进行对抗学习,其中,C表示工况类别的类别数量,c∈{1,2,...,C}表示工况类别的编号。
示例性的,全局域判别器Gd的A-distance距离表示为dA,g(Ds,Dt)=2(1-2(Lg)),子域判别器的A-distance距离表示为其中,表示预测出的工况类别为c的源域故障数据,表示预测出的工况类别为c的目标域故障数据,表示预测出的工况类别为c的子域判别器的损失,则动态对抗因子ω可表示为下式(4):
通过深度对抗表示来学习和更新网络中的动态对抗因子ω,并使用全局域判别器的损失和子域判别器的损失来对ω进行微调,使得由上述特征提取器Gf、类判别器Gy、全局域判别器Gd和C个子域判别器组成的轴承迁移学习故障诊断模型变得更加稳健和准确,且简单有效。
S7:基于动态对抗因子ω,利用随机梯度下降算法优化特征提取器Gf、类判别器Gy、全局域判别器Gd和C个子域判别器的总损失,得到优化后的特征提取器和类判别器,优化后的特征提取器和类判别器即组成最终的轴承迁移学习故障诊断模型。
步骤S7包括:
利用随机梯度下降算法,根据下式(6)确定的更新规则,优化上式(5)所示的目标函数:
S8:将测试数据输入优化后的特征提取器,获得测试数据的样本特征,并将测试数据的样本特征输入优化后的类判别器,获得测试数据的预测工况类别,基于预测工况类别,计算优化后的类判别器的分类精度。
示例性的,优化后的类判别器的分类精度通过下式(7)确定:
本实施方式涉及的基于域动态对抗自适应的轴承迁移学习故障诊断方法的有益效果在于:
1、将对抗思想和领域自适应思想结合在一起,分别构造了可以对齐边缘分布和条件分布的两种域分类器,从不同角度实现了源域样本特征空间和目标域样本特征空间的对齐。
2、基于域之间的边缘分布和条件分布往往对领域适应有不同贡献的假设,提出了一种动态计算不同分布贡献权重参数的方法,提升了样本域自适应能力,解决了在目标域进行无监督标签预测的问题,提高了轴承故障诊断的精度,增强了故障诊断模型的泛化性。
为了使本领域技术人员能够更好地理解上述实施方式,下面以一具体示例进行说明。
如图4所示,一种基于域动态对抗自适应的轴承迁移学习故障诊断方法,包括以下步骤:
(1)收集轴承数据,搭建不同工况类别的轴承故障数据样本库,划分源域故障数据和目标域故障数据,并将源域样本作为训练数据,将目标域样本作为测试数据。
(2)通过训练模块进行训练:
使用1D-CNN网络作为特征提取器进行特征提取,分别提取源域故障数据的故障隐含特征和目标域故障数据的故障隐含特征,得到源域样本特征和目标域样本特征;
使用源域样本特征对由BP神经网络和Softmax分类器构成的类判别器进行训练,判别输入的源域样本特征属于哪一工况类别;
使用源域样本特征和目标域样本特征,对BP神经网络构建的全局域判别器进行训练,判别输入的样本特征来自源域样本还是目标域样本,构造梯度反转层,将其用于实现特征提取器和域判别器的对抗学习;
将源域样本特征和目标域样本特征代入类判别器中,计算对应的样本属于某一工况类别的概率,并将其与未代入类判别器的样本特征进行加权计算,得到子域特征,使用BP神经网络分别构建与样本的工况类别数量相同数量的子域判别器,判别输入的样本特征来自源域样本还是目标域样本,构架梯度反转层,将其用于实现特征提取器和域判别器的对抗学习;
使用全局域判别器的损失和子域判别器的损失进行动态对抗因子计算;
使用随机梯度下降算法,优化根据动态对抗因子确定的特征提取器、类判别器、全局域判别器、子域判别器的总损失,得到优化后的特征提取器和类判别器。
(3)通过诊断模块进行轴承故障诊断测试:
将作为测试数据的目标域样本输入优化后的特征提取器,得到对应的目标域样本特征,并将得到的目标域样本特征输入优化后的类判别器,该优化后的类判别器输出对应的诊断结果即目标域样本对应的预测工况类别,根据该预测工况类别以及目标域样本的真实工况类别,即可计算出优化后的类判别器的分类精度。
为了对本公开实施方式采用的基于域动态对抗自适应的轴承迁移学习故障诊断方法的技术效果加以验证说明,下面以变工况轴承故障为例进行验证说明。
本次验证选择自适应批量归一化(Adaptive Batch Normalization,AdaBN)、深层相关对齐(Deep Correlation Alignment,DeepCORAL)和域对抗神经网络(Domain-Adversarial Neural Networks,DANN)三种方法进行对比实验,作为轴承故障数据样本库的数据源分别来自凯斯西储大学(Case Western Reserve University,CWRU)轴承数据集和江南大学(Jiangnan University,JNU)轴承数据集。
数据集说明:
CWRU轴承数据集:CWRU数据集是故障诊断研究中最著名的开源数据集之一,由凯斯西储大学轴承数据中心提供,大量迁移学习故障诊断方面的论文都用到了该数据集。CWRU中的数据是通过附在外壳上并带有磁性的加速度计收集的。本次验证使用了其中的驱动端轴承故障数据,其采样频率为12kHz,表1中列出了由故障状态和故障大小组成的十种轴承工况类别,其中,故障状态包括一个正常轴承(NA)状态和三个故障状态,三个故障状态分别为内部故障(IF)状态、球形故障(BF)状态、外部故障(OF)状态,故障大小分为0英寸、7英寸、14英寸、21英寸四类,其中,0英寸表示轴承处于正常状态。CWRU数据集由四个不同的电动机负载组成,分别对应于四个不同的运行速度,如表2所示。本次验证将这些不同的工作条件视为不同的任务,包括0、1、2和3。例如,任务0→1表示源域故障数据是电机负载为0HP的数据,而目标域故障数据是电动机负载为1HP的数据。CWRU轴承数据集中总共有12种迁移学习设置。
表1 CWRU轴承数据集工况类别描述表
表2 CWRU轴承数据集迁移学习任务划分表
JNU轴承数据集:江南大学轴承数据集包含四种状态,即正常状态、内圈故障状态、外圈故障状态、球面故障状态。振动信号在三种不同的转速(600rpm、800rpm和1000rpm)下使用加速度计进行采样,采样频率为50kHz。如表3所示,不同的工作条件被认为是不同的迁移学习任务。例如,任务0→1表示源域故障数据是转速为600rpm的数据,目标域故障数据是转速为800rpm的数据。
表3 JNU轴承数据集迁移学习任务划分表
数据处理:本次验证采用原始数据进行训练,直接将测得的振动信号用作轴承迁移学习故障诊断模型的输入,每个样本的长度为1024,没有任何重叠;
本次验证中,每个模型训练迭代200次,在训练过程中,模型训练和测试过程交替进行。其中,训练过程中采用小批量的SGD来进行反向传播,每批大小为64。使用Pytorch中的“逐步”策略作为学习速率退火方法,初始学习速率为0.001,并分别在时期50和150中衰减(乘以0.1),对比结果如表4和表5所示。
表4 CRWU轴承数据集效果对比表
表5 JNU轴承数据集效果对比表
由表4和表5可知,本公开提出的基于域动态对抗自适应的轴承迁移学习故障诊断方法具有更强的适应性,个体平均效果和整体平均效果均优于其他方法。
综上,本公开提出的基于域动态对抗自适应的轴承迁移学习故障诊断方法,将对抗学习的思路融入到迁移学习故障诊断中,通过动态对抗因子合理修正目标域边缘分布和条件分布偏差,使目标域的样本特征分布更接近于源域的样本特征分布,并用源域数据训练的类判别器来预测目标域的故障工况类别,实现了无监督学习,提高了故障诊断精度,轴承迁移学习故障诊断模型的泛化性得到了加强。
本公开的另一个实施方式涉及一种基于域动态对抗自适应的轴承迁移学习故障诊断装置,如图5所示,包括:
搭建模块501,用于搭建基于不同工况类别的轴承故障数据样本库,划分源域故障数据和目标域故障数据,并将源域样本作为训练数据,将目标域样本作为测试数据;
特征提取模块502,用于使用包括多层卷积神经网络的特征提取器Gf,分别提取源域故障数据的故障隐含特征和目标域故障数据的故障隐含特征;
类别判断模块503,用于基于BP神经网络和Softmax分类器构建类判别器Gy,并基于源域故障数据的故障隐含特征训练类判别器Gy,判别对应的源域故障数据属于哪一工况类别;
全局域判别模块504,用于基于BP神经网络构建全局域判别器Gd,并将源域故障数据和目标域故障数据作为样本,将对应的故障隐含特征作为样本特征,训练全局域判别器Gd,判别样本特征的域类别,构建第一梯度反转层,利用第一梯度反转层对特征提取器Gf和类判别器Gy进行对抗学习,其中,域类别包括源域和目标域;
子域判别模块505,用于将样本特征代入类判别器Gy中,计算对应的样本属于某一工况类别的概率,并将其与未代入类判别器Gy的样本特征进行加权计算,得到子域特征,使用基于BP神经网络分别的构建C个子域判别器判别子域特征的域类别,构建第二梯度反转层,利用第二梯度反转层对特征提取器Gf和类判别器Gy再次进行对抗学习,其中,C表示工况类别的类别数量,c∈{1,2,...,C}表示工况类别的编号;
测试模块508,用于将测试数据输入优化后的特征提取器,获得测试数据的样本特征,并将测试数据的样本特征输入优化后的类判别器,获得测试数据的预测工况类别,基于预测工况类别,计算优化后的类判别器的分类精度。
本公开实施方式提供的基于域动态对抗自适应的轴承迁移学习故障诊断装置的具体实现方法,可以参见本公开实施方式提供的基于域动态对抗自适应的轴承迁移学习故障诊断方法所述,此处不再赘述。
本实施方式涉及的基于域动态对抗自适应的轴承迁移学习故障诊断装置的有益效果在于:
1、将对抗思想和领域自适应思想结合在一起,分别构造了可以对齐边缘分布和条件分布的两种域分类器,从不同角度实现了源域样本特征空间和目标域样本特征空间的对齐。
2、基于域之间的边缘分布和条件分布往往对领域适应有不同贡献的假设,提出了一种动态计算不同分布贡献权重参数的方法,提升了样本域自适应能力,解决了在目标域进行无监督标签预测的问题,提高了轴承故障诊断的精度,增强了故障诊断模型的泛化性。
本领域的普通技术人员可以理解,上述各实施方式是实现本公开的具体实施方式,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本公开的精神和范围。
Claims (10)
1.一种基于域动态对抗自适应的轴承迁移学习故障诊断方法,其特征在于,所述方法包括以下步骤:
S1:搭建基于不同工况类别的轴承故障数据样本库,划分源域故障数据和目标域故障数据,并将源域样本作为训练数据,将目标域样本作为测试数据;
S2:使用包括多层卷积神经网络的特征提取器Gf,分别提取所述源域故障数据的故障隐含特征和所述目标域故障数据的故障隐含特征;
S3:基于BP神经网络和Softmax分类器构建类判别器Gy,并基于所述源域故障数据的故障隐含特征训练所述类判别器Gy,判别对应的所述源域故障数据属于哪一工况类别;
S4:基于BP神经网络构建全局域判别器Gd,并将所述源域故障数据和所述目标域故障数据作为样本,将对应的故障隐含特征作为样本特征,训练所述全局域判别器Gd,判别所述样本特征的域类别,构建第一梯度反转层,利用所述第一梯度反转层对所述特征提取器Gf和所述类判别器Gy进行对抗学习,其中,所述域类别包括源域和目标域;
S5:将所述样本特征代入所述类判别器Gy中,计算对应的样本属于某一工况类别的概率,并将其与未代入所述类判别器Gy的样本特征进行加权计算,得到子域特征,使用基于BP神经网络分别的构建C个子域判别器判别所述子域特征的域类别,构建第二梯度反转层,利用所述第二梯度反转层对所述特征提取器Gf和所述类判别器Gy再次进行对抗学习,其中,C表示工况类别的类别数量,c∈{1,2,...,C}表示工况类别的编号;
S8:将所述测试数据输入优化后的特征提取器,获得所述测试数据的样本特征,并将所述测试数据的样本特征输入优化后的类判别器,获得所述测试数据的预测工况类别,基于所述预测工况类别,计算所述优化后的类判别器的分类精度。
3.根据权利要求2所述的方法,其特征在于,所述全局域判别器Gd中的BP神经网络包括依次连接的第二全连接层、第一relu函数激活层、第二丢失层、第三全连接层、第二relu函数激活层、第三丢失层、全连接分类层,所述全局域判别器Gd的损失函数Lg表示为下式(2):
8.根据权利要求1至7任一项所述的方法,其特征在于,所述特征提取器Gf包括顺序连接的五个特征提取单元,分别为第一特征提取单元、第二特征提取单元、第三特征提取单元、第四特征提取单元、第五特征提取单元,其中:
所述第一特征提取单元包括顺序连接的第一卷积层、第一批量归一化层;
所述第二特征提取单元包括顺序连接的第二卷积层、第二批量归一化层、第一最大池化层;
所述第三特征提取单元包括顺序连接的第三卷积层、第三批量归一化层;
所述第四特征提取单元包括顺序连接的第四卷积层、第四批量归一化层、第二最大池化层;
所述第五特征提取单元包括顺序连接的展平层、第一全连接层、第一丢失层;
所述第一批量归一化层、所述第二批量归一化层、所述第三批量归一化层、所述第四批量归一化层、所述第一全连接层均采用relu函数作为激活函数。
9.根据权利要求8所述的方法,其特征在于,所述特征提取器Gf中的卷积层均为一维卷积神经网络。
10.一种基于域动态对抗自适应的轴承迁移学习故障诊断装置,其特征在于,所述装置包括:
搭建模块,用于搭建基于不同工况类别的轴承故障数据样本库,划分源域故障数据和目标域故障数据,并将源域样本作为训练数据,将目标域样本作为测试数据;
特征提取模块,用于使用包括多层卷积神经网络的特征提取器Gf,分别提取所述源域故障数据的故障隐含特征和所述目标域故障数据的故障隐含特征;
类别判断模块,用于基于BP神经网络和Softmax分类器构建类判别器Gy,并基于所述源域故障数据的故障隐含特征训练所述类判别器Gy,判别对应的所述源域故障数据属于哪一工况类别;
全局域判别模块,用于基于BP神经网络构建全局域判别器Gd,并将所述源域故障数据和所述目标域故障数据作为样本,将对应的故障隐含特征作为样本特征,训练所述全局域判别器Gd,判别所述样本特征的域类别,构建第一梯度反转层,利用所述第一梯度反转层对所述特征提取器Gf和所述类判别器Gy进行对抗学习,其中,所述域类别包括源域和目标域;
子域判别模块,用于将所述样本特征代入所述类判别器Gy中,计算对应的样本属于某一工况类别的概率,并将其与未代入所述类判别器Gy的样本特征进行加权计算,得到子域特征,使用基于BP神经网络分别的构建C个子域判别器判别所述子域特征的域类别,构建第二梯度反转层,利用所述第二梯度反转层对所述特征提取器Gf和所述类判别器Gy再次进行对抗学习,其中,C表示工况类别的类别数量,c∈{1,2,...,C}表示工况类别的编号;
测试模块,用于将所述测试数据输入优化后的特征提取器,获得所述测试数据的样本特征,并将所述测试数据的样本特征输入优化后的类判别器,获得所述测试数据的预测工况类别,基于所述预测工况类别,计算所述优化后的类判别器的分类精度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210323048.0A CN115600134A (zh) | 2022-03-30 | 2022-03-30 | 基于域动态对抗自适应的轴承迁移学习故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210323048.0A CN115600134A (zh) | 2022-03-30 | 2022-03-30 | 基于域动态对抗自适应的轴承迁移学习故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115600134A true CN115600134A (zh) | 2023-01-13 |
Family
ID=84841860
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210323048.0A Pending CN115600134A (zh) | 2022-03-30 | 2022-03-30 | 基于域动态对抗自适应的轴承迁移学习故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115600134A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117407698A (zh) * | 2023-12-14 | 2024-01-16 | 青岛明思为科技有限公司 | 一种混合距离引导的领域自适应故障诊断方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111860677A (zh) * | 2020-07-29 | 2020-10-30 | 湖南科技大学 | 一种基于部分域对抗的滚动轴承迁移学习故障诊断方法 |
CN112183581A (zh) * | 2020-09-07 | 2021-01-05 | 华南理工大学 | 基于自适应迁移神经网络的半监督机械故障诊断方法 |
US20210390355A1 (en) * | 2020-06-13 | 2021-12-16 | Zhejiang University | Image classification method based on reliable weighted optimal transport (rwot) |
CN113884300A (zh) * | 2021-09-24 | 2022-01-04 | 郑州恩普特科技股份有限公司 | 一种深度对抗迁移学习的滚动轴承故障诊断方法 |
-
2022
- 2022-03-30 CN CN202210323048.0A patent/CN115600134A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210390355A1 (en) * | 2020-06-13 | 2021-12-16 | Zhejiang University | Image classification method based on reliable weighted optimal transport (rwot) |
CN111860677A (zh) * | 2020-07-29 | 2020-10-30 | 湖南科技大学 | 一种基于部分域对抗的滚动轴承迁移学习故障诊断方法 |
CN112183581A (zh) * | 2020-09-07 | 2021-01-05 | 华南理工大学 | 基于自适应迁移神经网络的半监督机械故障诊断方法 |
CN113884300A (zh) * | 2021-09-24 | 2022-01-04 | 郑州恩普特科技股份有限公司 | 一种深度对抗迁移学习的滚动轴承故障诊断方法 |
Non-Patent Citations (2)
Title |
---|
CHAOHUI YU: "《Transfer Learning with Dynamic Adversarial Adaptation Network》", 《2019 IEEE INTERNATIONAL CONFERENCE ON DATA MINING (ICDM)》, pages 778 - 786 * |
杨聪: "《智能网联汽车研究与开发丛书 智能座舱开发与实践》", 北京:机械工业出版社, pages: 83 - 88 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117407698A (zh) * | 2023-12-14 | 2024-01-16 | 青岛明思为科技有限公司 | 一种混合距离引导的领域自适应故障诊断方法 |
CN117407698B (zh) * | 2023-12-14 | 2024-03-08 | 青岛明思为科技有限公司 | 一种混合距离引导的领域自适应故障诊断方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhao et al. | Deep multi-scale convolutional transfer learning network: A novel method for intelligent fault diagnosis of rolling bearings under variable working conditions and domains | |
CN110162018B (zh) | 基于知识蒸馏与隐含层共享的增量式设备故障诊断方法 | |
CN110728360B (zh) | 一种基于bp神经网络的微能源器件能量识别方法 | |
Xie et al. | End to end multi-task learning with attention for multi-objective fault diagnosis under small sample | |
CN108062572A (zh) | 一种基于DdAE深度学习模型的水电机组故障诊断方法与系统 | |
CN111709448A (zh) | 一种基于迁移关系网络的机械故障诊断方法 | |
CN106682688A (zh) | 基于粒子群优化的堆叠降噪自编码网络轴承故障诊断方法 | |
CN113988126B (zh) | 一种基于少标签数据特征迁移的滚动轴承故障诊断方法 | |
CN110516305B (zh) | 基于注意机制元学习模型的小样本下故障智能诊断方法 | |
CN111721536A (zh) | 一种改进模型迁移策略的滚动轴承故障诊断方法 | |
CN114358123B (zh) | 一种基于深度对抗迁移网络的广义开放集故障诊断方法 | |
CN112685504B (zh) | 一种面向生产过程的分布式迁移图学习方法 | |
CN110657984A (zh) | 一种基于强化胶囊网络的行星齿轮箱故障诊断方法 | |
CN113505655A (zh) | 面向数字孪生系统的轴承故障智能诊断方法 | |
Lv et al. | Deep transfer network with multi-kernel dynamic distribution adaptation for cross-machine fault diagnosis | |
CN116026593A (zh) | 跨工况的滚动轴承故障靶向迁移诊断方法及系统 | |
CN114118138A (zh) | 一种基于多标签领域自适应模型的轴承复合故障诊断方法 | |
CN113536697A (zh) | 一种基于改进残差网络和wgan的轴承剩余寿命预测方法 | |
CN114548199A (zh) | 一种基于深度迁移网络的多传感器数据融合方法 | |
Qin et al. | The fault diagnosis of rolling bearing based on improved deep forest | |
CN115165366A (zh) | 一种旋转机械变工况故障诊断方法及系统 | |
CN115600134A (zh) | 基于域动态对抗自适应的轴承迁移学习故障诊断方法 | |
CN114897085A (zh) | 一种基于封闭子图链路预测的聚类方法及计算机设备 | |
CN114708479A (zh) | 一种基于图结构和特征的自适应防御方法 | |
Wang et al. | Abnormal traffic detection-based on memory augmented generative adversarial IIoT-assisted network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |