CN112784872B - 一种基于开放集联合迁移学习的跨工况故障诊断方法 - Google Patents
一种基于开放集联合迁移学习的跨工况故障诊断方法 Download PDFInfo
- Publication number
- CN112784872B CN112784872B CN202011557783.5A CN202011557783A CN112784872B CN 112784872 B CN112784872 B CN 112784872B CN 202011557783 A CN202011557783 A CN 202011557783A CN 112784872 B CN112784872 B CN 112784872B
- Authority
- CN
- China
- Prior art keywords
- data
- model
- fault diagnosis
- fault
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 124
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000013526 transfer learning Methods 0.000 title claims abstract description 24
- 238000000605 extraction Methods 0.000 claims abstract description 59
- 238000013145 classification model Methods 0.000 claims abstract description 53
- 238000012549 training Methods 0.000 claims abstract description 52
- 230000006870 function Effects 0.000 claims description 49
- 239000013598 vector Substances 0.000 claims description 11
- 238000012821 model calculation Methods 0.000 claims description 2
- 239000010410 layer Substances 0.000 description 54
- 238000013508 migration Methods 0.000 description 34
- 230000005012 migration Effects 0.000 description 34
- 238000011176 pooling Methods 0.000 description 17
- 238000013527 convolutional neural network Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000009467 reduction Effects 0.000 description 7
- 230000004913 activation Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000013136 deep learning model Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 239000012792 core layer Substances 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明公开了一种基于开放集联合迁移学习的跨工况故障诊断方法,包括:通过提取并识别跨工况的源域样本数据和目标域样本数据的故障类型,训练特征提取模型和特征分类模型;用训练好的特征提取模型和特征分类模型搭建故障诊断模型;将需要进行故障诊断的目标域数据输入到所述故障诊断模型,对目标域数据对应的故障类型进行诊断。
Description
技术领域
本发明涉及一种故障诊断方法,特别涉及一种基于开放集联合迁移学习的跨工况故障诊断方法。
背景技术
由于机械设备实际运行过程中负载,转速等因素发生变化导致运行工况存在差异,即使是同类型设备的运行数据也会存在不同。为了解决训练样本量不足导致无法训练故障诊断模型的问题,迁移学习方法通过最小化不同工况数据差异,能够利用相似设备的运行数据,实现缺少训练数据的目标设备的故障诊断。现有基于迁移学习的故障诊断技术,通常是在待诊断的目标设备与已有的样本数据的故障类型对称的前提下,利用领域特征迁移的方式辅助完成目标设备的故障诊断任务。然而,在实际的故障诊断应用场景中,无法保证需要诊断的目标设备的故障类型与收集的历史数据集所包含的故障模式完全相同,不能实现有效迁移。
发明内容
本发明的目的是提供一种基于开放集联合迁移学习的跨工况故障诊断方法,用于在目标数据与样本数据的故障类型不对称的情况,找到目标数据和样本数据具有的共享数据类型,并对共享特征进行迁移,完成目标设备的故障诊断任务。
本发明的一种基于开放集联合迁移学习的跨工况故障诊断方法包括:
通过提取并识别跨工况的源域样本数据和目标域样本数据的故障类型,训练特征提取模型和特征分类模型;
用训练好的特征提取模型和特征分类模型搭建故障诊断模型;
将需要进行故障诊断的目标域数据输入到所述故障诊断模型,对目标域数据对应的故障类型进行诊断。
本发明针对源工况与目标工况数据开集情况下缺少目标工况故障标签的跨工况故障诊断问题,将开放集的概念引用到迁移学习中,实现基于联合迁移学习的跨工况故障诊断。由于目标工况缺少带标签的训练数据,源工况具有丰富的带标签训练数据,但与目标工况数据的故障类型不对称,需要提取并识别目标数据和样本数据共有的故障类型,并对共享特征进行迁移。
本发明首先利用基于卷积网络构的特征提取模型提取原始数据的故障特征;然后通过特征分类模型判别提取的特征属于已知类型还是未知类型,识别目标域数据和源域数据的共享特征;最后,训练特征提取器和特征分类器构成的联合迁移模型,使得二者的联合损失函数最小,实现从源工况到目标工况的联合迁移诊断,提高目标域数据的诊断准确度。
上述的通过提取并识别跨工况的源域样本数据和目标域样本数据共有的故障类型,训练特征提取模型和特征分类模型包括:
利用特征提取模型提取源域样本数据和目标域样本数据的故障特征;
利用特征分类模型判别所提取的故障特征是已知数据类型还是未知数据类型;
根据判别得到的已知数据类型和未知数据类型,调整所述特征提取模型和特征分类模型的权重参数。
上述的根据判别得到的已知数据类型和未知数据类型,调整所述特征提取模型和特征分类模型的参数包括:
根据所述已知数据类型,计算源域数据的分类损失;
根据所述位置数据类型,计算目标域数据的分类损失;
根据所述源域数据的分类损失和目标域数据的分类损失依次调整所述特征分类模型和所述特征提取模型的权重参数,直至所述源域数据的分类损失和目标域数据的分类损失最小。
上述的用训练好的特征提取模型和特征分类模型构成故障诊断模型包括:
将训练好的特征提取模型的输出与训练好的特征分类模型的输入连接在一起;
将训练好的特征提取模型的输入作为故障诊断模型的用于接收目标域数据的输入;
将训练好的特征分类模型的输出作为故障诊断模型的用于输出故障标签的输出。
优选地,所述特征提取模型包括二维卷积层和全连接层,所述特征提取模型利用卷积层的非线性特征提取能力进行特征提取。
优选地,所述特征分类模型包括全连接层和Softmax层,所述特征分类模型的Softmax层利用Softmax函数对特征的故障类型进行识别。
优选地,所述特征分类模型的Softmax层利用Softmax函数将多维向量转换为0至1之间的概率值,用于表示被识别为相应故障类型的概率。
本发明的有益技术效果是,1)解决了未知故障模式和跨工况条件下,分布差异化数据的有效挖掘的技术问题;2)能够实现开放集数据条件下的跨工况故障诊断任务;3)具有较高的故障诊断准确度。
下面结合附图以具体实例对本发明进行详细说明。
附图说明
图1是ReLu,LeakyReLU激活函数示意图;
图2是封闭集和开放集迁移学习分类任务场景对比示意图;
图3是本发明的基于开放集联合迁移跨工况故障诊断方法流程图;
图4是本发明的故障诊断模型结构的示意图;
图5是二级减速齿轮箱组成结构;
图6是35Hz-40Hz不同目标工况数据占比的损失函数曲线示意图;
图7是35Hz-45Hz不同目标工况数据占比的损失函数曲线示意图;
图8是35Hz-50Hz不同目标工况数据占比的损失函数曲线示意图;
图9是35Hz-40Hz不同目标域工况数据占比时的诊断结果示意图;
图10是35Hz-45Hz不同目标域工况训练数据占比时的诊断结果示意图;
图11是35Hz-50Hz不同目标域工况训练数据占比时的诊断结果示意图;
图12是本发明的基于开放集联合迁移学习的跨工况故障诊断方法的示意图。
具体实施方式
卷积层是深度卷积网络中特征提取的核心层,通过卷积核对输入向量做卷积运算并输出到下一层来提取原始数据的特征。由卷积层运算得到的表达特征称为特征图,在逐层提取特征的过程中,第k层特征图的局部感受野会影响第k+1层提取到的特征图。由卷积层输出的特征向量可以表示为:
LeakyReLU函数是经典的ReLu激活函数的变体,LeakyReLU函数可以表示为
yLeakyReLU(x)=max(ax,x) (2)
LeakyReLU和ReLu激活函数图像如图1所示。
LeakyReLU激活函数在ReLu函数的基础上,对负值输入添加了非零的斜率,避免了在输入小于零时,Relu函数的梯度恒等于零而导致深度学习模型无法更新权重参数的问题,能够加快模型训练收敛速度。
池化层
池化层是卷积神经网络中的一种特征压缩层,也叫下采样层。池化层对特征图进行压缩和抽象,能够减小参数量,降低网络的复杂度和计算量,同时尽可能地减小数据的失真率,可以表示为:
其中表示池化层的输入,/>表示池化层的输出。池化层按照一定的规则对特征进行整合,根据池化窗口与步距的大小不同,池化操作分为一般池化和重叠池化;根据采样方式不同,可分为最大池化和平均池化。常用的池化运算包括平均池化层和最大池化层两种。
卷积神经网络通过池化运算处理特征图,能够在尽可能保留提取到的卷积特征图的前提下,降低特征图的尺寸,增大卷积核感受野,同时减少模型计算数据量,预防过拟合。
Softmax函数用于多分类过程,能够将多个神经元的输出映射到区间(0,1)内,而映射后的值和为1。其本质相当于一个归一化的指数函数,可以表示为:
其中xi表示向量x的第i个元素。对于k种故障类型的多分类任务,相应的softmax分类器根据不同的输入特征向量,得到一个k维输出矩阵,输出矩阵每个维度的值表示该特征属于相应类别的概率大小,选择概率值最大的类作为最终的分类结果,从而实现多分类任务。
现有基于迁移学习的故障诊断技术研究,往往是在待诊断的目标设备与历史样本数据的故障类型对称(目标设备中的故障类型和已知样本完全相同)的前提下,利用相似特征迁移的方式,将源工况数据特征迁移到目标工况,对不同分布的数据进行特征对齐,从而辅助完成目标设备的故障诊断任务。然而,在实际的故障诊断应用场景中,无法保证需要诊断的目标设备发生的故障类型与已有的历史数据集涵盖的故障模式完全一致。在源工况和目标工况数据标签不对称的情况下,现有的迁移故障诊断方法难以从相似设备的运行数据中识别有效的可迁移特征,不能取得良好的故障诊断效果。
封闭集和开放集数据的跨工况迁移诊断任务场景对比如图2所示。
在封闭集数据迁移场景中,源领域数据(工况A)有标签,目标领域数据(工况B)无标签,但是两种运行工况下的数据的故障类型完全一致,数据类型对称。传统的迁移学习方法通过将目标域特征映射到的源域特征空间进行对齐,就能实现B工况数据的故障诊断;而对于开放集数据迁移场景,源领域数据(工况A)有标签,目标领域数据(工况B)无标签,并且B工况数据具有新的(未知)故障模式,数据类型不对称。现有的迁移学习方法在特征迁移对齐时,由于B工况数据存在新的故障模式数据,无法将新的故障模式特征映射到源域特征空间,难以实现有效的迁移故障诊断。
在开放集数据条件下,只提供了带标记的源工况数据和未标记的目标工况数据,但不能保证两种工况下数据的故障类型是一致的。也就是说,在目标工况数据中存在某种故障类型,但在源工况数据中没有对应的类型,无法建立特征空间的映射关系,从而具有一定的非对称(开放)性。本发明把源域中存在的类别称为“已知类型”,不存在的类别称为“未知类型”,在建立从源领域到目标领域的特征映射关系时,需要对目标域的“未知类型”进行识别。通过共享特征选择的方式找到两个领域公共的故障特征,对领域间的共享特征进行迁移,辅助训练目标领域的学习任务,从而能够提升迁移学习效果,更加适用于实际故障诊断任务。
在实际的故障诊断场景中,迁移利用历史故障数据集协助完成目标设备的故障诊断任务时,由于目标工况设备的故障类型不明确,无法保证故障模式种类与历史数据集中的故障模式完全一致,需要考虑源域和目标域数据标签不对称(开放集)的问题。开放集数据条件下,主要任务就是识别目标工况中的“未知类”,并迁移利用源工况中的“已知类”对目标工况的数据进行诊断。通过特征选择的方式找到两种工况公共的特征,解决数据类型不对称的问题。由于卷积神经网络在故障诊断方法研究中得到了广泛的研究,具有强大的鲁棒和稳定特征提取能力,因此,本发明利用深度卷积网络构建开放集联合迁移诊断模型,提取原始振动数据的故障特征,通过不同类型损失函数的联合迁移方法,能够识别并标记未知数据类型,从而实现故障诊断。
图12显示了本发明的一种基于开放集联合迁移学习的跨工况故障诊断方法,包括:
通过提取并识别跨工况的源域样本数据和目标域样本数据的故障类型,训练特征提取模型和特征分类模型;
用训练好的特征提取模型和特征分类模型搭建故障诊断模型;
将需要进行故障诊断的目标域数据输入到所述故障诊断模型,对目标域数据对应的故障类型进行诊断。
本发明针对源工况与目标工况数据开集情况下缺少目标工况故障标签的跨工况故障诊断问题,将开放集的概念引用到迁移学习中,实现基于联合迁移学习的跨工况故障诊断。由于目标工况缺少带标签的训练数据,源工况具有丰富的带标签训练数据,但与目标工况数据的故障类型不对称,需要提取并识别目标数据和样本数据共有的故障类型,并对共享特征进行迁移。
本发明首先利用基于卷积网络构的特征提取模型提取原始数据的故障特征;然后通过特征分类模型判别提取的特征属于已知类型还是未知类型,识别目标域数据和源域数据的共享特征;最后,训练特征提取器和特征分类器构成的联合迁移模型,使得二者的联合损失函数最小,实现从源工况到目标工况的联合迁移诊断,提高目标域数据的诊断准确度。
在本发明中,通过提取并识别跨工况的源域样本数据和目标域样本数据共有的故障类型,训练特征提取模型和特征分类模型包括:
利用特征提取模型提取源域样本数据和目标域样本数据的故障特征;
利用特征分类模型判别所提取的故障特征是已知数据类型还是未知数据类型;
根据判别得到的已知数据类型和未知数据类型,调整所述特征提取模型和特征分类模型的权重参数。
在本发明中,根据判别得到的已知数据类型和未知数据类型,调整所述特征提取模型和特征分类模型的参数包括:
根据所述已知数据类型,计算源域数据的分类损失;
根据所述位置数据类型,计算目标域数据的分类损失;
根据所述源域数据的分类损失和目标域数据的分类损失依次调整所述特征分类模型和所述特征提取模型的权重参数,直至所述源域数据的分类损失和目标域数据的分类损失最小。
在本发明中,用训练好的特征提取模型和特征分类模型构成故障诊断模型包括:
将训练好的特征提取模型的输出与训练好的特征分类模型的输入连接在一起;
将训练好的特征提取模型的输入作为故障诊断模型的用于接收目标域数据的输入;
将训练好的特征分类模型的输出作为故障诊断模型的用于输出故障标签的输出。
在本发明中,特征提取模型包括二维卷积层和全连接层,所述特征提取模型利用卷积层的非线性特征提取能力进行特征提取。
在本发明中,特征分类模型包括全连接层和Softmax层,特征分类模型的Softmax层利用Softmax函数对特征的故障类型进行识别。
在本发明中,特征分类模型的Softmax层利用Softmax函数将多维向量转换为0至1之间的概率值,用于表示被识别为相应故障类型的概率。
图3显示了本发明的开放集数据联合迁移诊断方法流程。在迁移学习任务中,带标记的源工况数据集可表示为DS={XS,YS},XS表示源工况的样本数据,YS是相应的已知数据标签,未标记的目标工况数据集可表示为DT={XT,YT},XT是目标工况的样本数据,YT是相应的未知数据标签。假设XS={xs1,xs2,...,xsk}具有k种类型,而XT={xt1,xt2,...,xtk,xt(k+1)}具有k+1种数据类型,其中xt(k+1)代表目标工况中独有的数据类型集合。开放集数据的迁移学习故障诊断任务需要找到源工况和目标工况之间的相似数据特征,对未知类进行识别,通过迁移源工况和目标工况间的共享特征,利用softmax分类函数将目标工况的数据分为k种已知的故障类型以及一种未知的故障类型,通过最小化已知类型和未知类型数据的联合分类损失训练模型,实现故障诊断。
开放集数据联合迁移学习模型主要由特征提取模型和分类模型两部分构成,特征提取模型F主要由卷积层和池化层构成,从不同领域的原始数据中提取高维故障特征,输出记为F(x);由特征分类模型C主要由全连接层和softmax分类层构成,将提取的特征分为k+1种类别,分别对应k种已知的类型和所有未知的类型。由特征分类模型C得到的k+1维输出向量记为C(F(x))={l1,l2,…,lk+1},每一维对应不同的数据种类;通过softmax函数可以将k+1维输出向量转化为0到1之间概率值,表示样本被分为相应类型的概率,因此,样本x属于第i种类型的概率可表示为:
其中第k+1维输出为p(y=k+1|x)=t,表示该样本属于未知类型的可能性大小为t。采用小批量样本(Minibatch)训练方式和反向传播算法迭代更新模型的权重参数,获得目标工况数据的分类标签。
开放集数据迁移的难点在于识别目标工况中未知的数据类型。由于源工况中缺少相应类型的数据,源工况数据不能直接与目标域未知的数据类型建立正确的映射关系。对于源工况数据(XS,YS),定义交叉熵分类损失函数为:
LS(XS,YS)=-∑log(p(y=ys|xs)) (6)
p(y=ys|xs)=C(F(xs)) (7)
LS(XS,YS)表示模型对源工况数据分类的损失大小;对于目标领域数据XT,定义未知类型数据的二分类损失函数为:
LT(XT)=-∑tlog(p(y=k+1|xt))-∑(1-t)log(1-p(y=k+1|xt)) (8)
表示将样本XT标记为未知类型而可能产生的分类损失大小。
在开放集数据条件下,为了正确地区分目标工况和源工况数据的共享特征,识别待诊断目标设备的不同故障数据,利用源域交叉熵分类损失函数LS(XS,YS)度量诊断模型对已知类型数据分类的损失大小,利用目标域二分类损失函数LT(XT)度量诊断模型将样本XT判为未知类型而可能产生的分类损失大小,通过最小化已知类型和未知类型数据的联合分类损失训练诊断模型,实现故障诊断。因此总的模型训练损失函数可表示为:
minLS(XS,YS)+LT(XT) (9)
在训练过程中,采用小批量样本训练方法利用源领域已知的数据样本{xs,ys},{xt}训练特征提取模型和分类模型,计算损失函数更新模型的权重参数,最小化损失函数,使其能够正确区分已知的k种数据类型并识别第k+1种未知数据类型。模型权重更新策略如算法1所示。
特征提取深度学习模型的训练样本包含输入数据和标签,通过计算误差对网络进行调节,这些模型为有监督学习模型。完成故障诊断的训练,需要经过前向传播阶段和反向传播阶段。
在前向传播阶段,样本信息从输入层向输出层传播。首先从训练集中随机地抽取一个样本,将样本输入深度卷积神经网络模型,经过模型中的不同层的特征提取和分类过程,最终传递给输出层;
在反向传播阶段,深度学习模型中神经元的权值从后向前依次进行调整。训练样本的真实标签与模型计算得到的实际输出存在误差,通过随机梯度下降优化算法调整网络中神经元的权值,最小化模型的分类损失,使得模型计算得到的实际输出与训练样本真实标签趋向一致,提高诊断准确度。
也就是,从所述特征分类模型到特征提取模型迭代地调整权重参数,最小化所述源域数据的分类损失和目标域数据的分类损失,使得模型计算得到的实际输出与训练样本真实标签趋向一致。
基于上述方法,搭建的故障诊断模型结构如图4所示。需要说明的是,在图4中,特征提取层对应上述的特征提取模型,特征分类层对应上述的特征分类模型;并且在进行目标域数据故障诊断时,仅仅将需要进行故障诊断的目标域数据输入到图4所示的特征提取层。
特征提取模型F包括二维卷积层(Conv2D)和全连接层(Dense),从不同领域的原始数据中提取可迁移的共享特征向量;特征分类模型C包括全连接层和Softmax层;BatchNorm2d表示对中间层的输出向量进行归一化,能够避免因数据分布不同导致的训练网络不稳定问题;LeakRelu表示非饱和激活函数,能解决深度神经网络的“梯度消失”问题,加快模型收敛速度。利用卷积层的非线性特征提取能力构建特征提取层,通过softmax函数对特征的故障类型进行识别。
具体实施例
为了验证本发明所提出的基于开放集联合迁移的跨工况故障诊断方法的有效性,使用2009年PHM数据挑战赛发布的工业齿轮箱数据集进行案例验证。该齿轮箱数据集的采集自一个工业用二级减速齿轮箱,在齿轮箱输入端布置有加速度传感器,用于采集齿轮箱振动数据信号,如图5所示。输入轴齿轮的齿数为32,中间轴齿轮的齿数为48,一级减速比为1.5;输出轴齿轮的齿数为80,二级减速比为1.667。
试验过程中,对齿轮箱注入了4种故障,其详细故障信息如表1所示。输入轴具有35Hz,40Hz,45Hz和50Hz四种不同转速工况,在每种工况下分别采集振动数据,采样频率66.67KHz,采样时间为4s。
表1减速齿轮箱不同故障模式注入情况对比
利用提出的跨工况联合迁移故障诊断方法,借助源领域的辅助数据对目标数据集中的齿轮箱故障模式进行诊断。首先对每种故障模式下采集到的原始振动信号进行样本划分,每个样本包括4000个数据点。训练数据为源域工况的样本数据,样本容量为150,每种故障模式有50组样本;测试数据为目标域数据集,样本容量为80,每种故障模式有20组样本。在训练过程中,将训练的批次大小(batch size)设置为60,训练迭代次数epochs设置为50次,损失函数设置为多类别交叉熵,采用随机梯度下降(SGD)优化器,初始学习率设置为0.001,学习率衰减设置为1%。利用卷积神经网络特征自学习能力提取原始振动信号的故障特征,在不同数据条件下训练故障诊断模型,对测试样本进行故障诊断。
利用基于开放集联合迁移学习的跨工况故障诊断方法,通过减速齿轮箱数据集振动信号进行故障诊断的效果如下。
选取35Hz转速作为源域工况,40Hz,45Hz和50Hz转速作为不同的目标域工况。以35Hz-40Hz工况下的联合迁移诊断任务为例,35Hz-40Hz表示源域工况为35Hz,目标域工况为40Hz,源领域数据集为35Hz转速下,正常,故障1,故障2三种故障模式的数据;目标领域数据集为40Hz转速下,正常,故障1,故障2和未知故障四种类型的齿轮箱数据,其中源域数据集中缺少未知故障数据类型的训练样本。
不同目标工况损失函数对比
为了分析训练数据中目标域工况数据占比对联合迁移效果的影响,向训练数据中加入不同比例的目标域工况样本数据,本文分别设置了以下不同数据比例的多组对照实验。分别对应不同的源领域工况和目标领域工况数据量。
为了便于比较,选取35Hz-40Hz工况下3种不同目标工况数据占比时得到的训练损失函数曲线进行对比分析,如图6所示。
可以发现,35Hz-40Hz工况下,随着目标工况数据占比发生变化,源域和目标域的数据相似度逐渐增大,因此损失函数曲线下降趋势也随之变快,并且目标工况数据量占比较大时的损失函数曲线整体低于目标工况数据量占比较小时的损失函数曲线,表明不同领域数据间的相似更高,模型的训练损失更小。通过损失函数曲线可以看出,在不同目标工况数据占比情况下模型的训练均能快速收敛到很小值,且在30次epoch后基本保持不变,故障诊断模型性能稳定。
在此基础上,分别进行了35Hz-45Hz,35Hz-50Hz两组联合迁移诊断实验,相应的训练损失函数曲线分别如图7,图8所示。
通过分析实验结果可以发现,与35Hz-40Hz任务类似,在35Hz-45Hz和35Hz-50Hz故障诊断任务汇中,随着目标域工况数据占比逐渐增大,源域和目标域的数据相似度逐渐增大,因此损失函数曲线下降趋势也随之变快。通过损失函数曲线可以看出,在不同目标工况数据占比情况下模型的训练均能快速收敛,且在30次epoch后基本保持不变,故障诊断模型性能稳定。同时,相比于40Hz工况,45Hz和50Hz目标工况下的数据与历史数据差异更大,模型的损失函数值也较大,数据可迁移性较差。
为了验证提出的基于开放集联合迁移的旋转机械跨工况故障诊断方法的性能,下文将诊断结果与其它三种不同故障诊断模型进行了对比分析,分别为CNN模型(不使用联合迁移方法),支持向量机(SVM)模型,概率神经网络(PNN)模型。故障诊断准确度如图9所示。
通过故障诊断准确度对比分析可以发现,本发明提出的基于开放集联合迁移学习的工况故障诊断方法在不同目标域工况数据条件下,均取得了最高的故障诊断准确度,如图中蓝色线段所示。当训练样本中目标工况样本量占比较小时,即使源域数据中缺少未知类型的训练样本,该方法也能够将35Hz工况下的数据迁移到40hz工况数据的故障诊断任务中,取得了80%的诊断准确度;随着目标域工况数据占比逐渐增大,训练集中40Hz工况的样本逐渐增多,源域和目标域的数据相似度逐渐增大,模型的诊断准确度也随之提高;当训练样本中目标工况样本量占比为100%时,虽然源域数据中缺少未知类型的训练样本,但是联合迁移方法通过识别共享特征,能够判别未知的数据类型,故障诊断准确度达到了95%。
而在对比方法中,CNN模型采用联合迁移方法相同的卷积神经网络结构,但没有引入联合领域自适应的策略,仅仅是一种深度学习故障诊断方法。由于无法识别共享特征,缺乏对未知数据类型的判别能力,其平均诊断准确度为73.64%,低于联合迁移方法,如图中红色线段所示;SVM是常见的浅层机器学习分类模型,PNN是一种基于贝叶斯策略前馈神经网络,二者常用于封闭集数据的故障诊断任务,但在开放集数据条件下,传统方法无法判别目标领域中包含未知的数据类型,因而诊断准确率最高仅为75%左右,对于开放集数据的故障诊断效果不佳。
为了进一步验证提出的方法对不同运行工况数据进行联合迁移诊断的能力,分别进行了35Hz-45Hz,35Hz-50Hz两组联合迁移诊断实验,相应的故障诊断准确度对比分别如图10和图11所示。
通过对比实验结果可以发现,在35Hz-45Hz和35Hz-50Hz故障诊断任务汇中,随着目标域工况数据占比逐渐增大,目标工况训练集数据的样本量数据逐渐增加,源域和目标域的数据相似度逐渐增大,蓝色线段所示的联合迁移模型的诊断准确度也随之提高,且均高于其它传统诊断方法。CNN模型采用联合迁移方法相同的卷积神经网络结构,但没有引入联合领域迁移策略,诊断结果如红色线段所示,SVM模型诊断结果如绿色线段所示,PNN模型诊断结果如黄色线段所示。随着目标域工况数据占比逐渐增大,不同对比方法准确度均有所升高,但在开放集数据条件下,无法判别目标领域中包含未知的数据类型,对于开放集数据的故障诊断效果不佳。
本发明针对相似设备故障诊断场景中,源域与目标域数据开集,缺少故障标签的问题,将开放集的概念运用到联合迁移学习中,提出了一种基于开放集联合迁移学习的跨工况故障诊断方法,解决了未知故障模式和跨工况条件下,分布差异化数据的有效挖掘利用该方法能够解决开放集数据条件下的跨工况故障诊断任务,具有较高的故障诊断准确度。首先,构建基于卷积网络结构的特征提取模型,提取原始数据的故障特征;其次,通过特征分类模型将提取的特征分为已知类型和未知类型,识别目标域数据和源域数据的共享特征类型,最小化特征分类的损失;最后,训练特征提取器和特征分类器构成的联合迁移模型,提高特征可迁移性,使得二者的联合损失函数最小。在案例分析部分,利用工业减速齿轮箱数据集验证了本发明所提方法的有效性。通过联合损失函数度量故障特征的可迁移性,识别目标工况和源工况数据的共享特征并进行迁移,利用相似工况的运行数据辅助实现了目标工况设备的故障诊断。
尽管上文对本发明进行了详细说明,但是本发明不限于此,本技术领域技术人员可以根据本发明的原理进行各种修改。因此,凡按照本发明原理所作的修改,都应当理解为落入本发明的保护范围。
Claims (8)
1.一种基于开放集联合迁移学习的跨工况故障诊断方法,包括:
利用特征提取模型提取跨工况的源域样本数据和目标域样本数据的故障特征;
利用特征分类模型判别所提取的跨工况的源域样本数据和目标域样本数据的故障特征是已知故障数据类型还是未知故障数据类型;
根据所述已知故障数据类型,计算源域数据的分类损失;
根据所述未知故障数据类型,计算目标域数据的分类损失;
根据所述源域数据的分类损失和目标域数据的分类损失依次调整所述特征分类模型和所述特征提取模型的权重参数,直至所述源域数据的分类损失和目标域数据的分类损失最小,从而得到训练好的特征提取模型和特征分类模型;
用训练好的特征提取模型和特征分类模型搭建故障诊断模型;
将需要进行故障诊断的目标域数据输入到所述故障诊断模型,诊断目标域数据对应的故障类型;
其中,利用源域交叉熵分类损失函数LS(XS,YS)度量所述故障诊断模型对已知分类数据分类的损失大小,利用目标域二分类损失函数LT(XT)度量所述故障诊断模型将目标工况样本XT判为未知类型可能产生的分类损失大小,通过最小化LS(XS,YS)与LT(XT)之和,训练所述故障诊断模型;其中:
LS(XS,YS)=-∑log(p(y=ys|xs)),p(y=ys|xs)是特征分类模型将源工况样本xs分为标签ys对应类型的概率;
LT(XT)=-∑t log(p(y=k+1|xt))-∑(1-t)log(1-p(y=k+1|xt)),p(y=k+1|xt)=t是特征分类模型第k+1维输出,表示目标工况样本xt属于未知类型的可能性大小为t。
2.根据权利要求1所述的跨工况故障诊断方法,其中,用训练好的特征提取模型和特征分类模型搭建故障诊断模型包括:
将所述训练好的特征提取模型的输出与所述训练好的特征分类模型的输入连接在一起;
将所述训练好的特征提取模型的输入作为故障诊断模型的用于接收目标域数据的输入;
将所述训练好的特征分类模型的输出作为故障诊断模型的用于输出故障标签的输出。
3.根据权利要求1所述的跨工况故障诊断方法,其中,所述特征提取模型包括二维卷积层和全连接层。
4.根据权利要求1所述的跨工况故障诊断方法,其中,所述特征分类模型包括全连接层和Softmax层。
5.根据权利要求3所述的跨工况故障诊断方法,其中,所述特征提取模型利用卷积层的非线性特征提取能力进行特征提取。
6.根据权利要求4所述的跨工况故障诊断方法,其中,所述特征分类模型的Softmax层利用Softmax函数对特征的故障类型进行识别。
7.根据权利要求6所述的跨工况故障诊断方法,其中,所述特征分类模型的Softmax层利用Softmax函数将多维向量转换为0至1之间的概率值,用于表示被识别为相应故障类型的概率。
8.根据权利要求2所述的跨工况故障诊断方法,其中,根据所述源域数据的分类损失和目标域数据的分类损失依次调整所述特征分类模型和所述特征提取模型的权重参数包括:
从所述特征分类模型到特征提取模型迭代地调整权重参数,最小化所述源域数据的分类损失和目标域数据的分类损失,使得模型计算得到的实际输出与训练样本真实标签趋向一致。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011557783.5A CN112784872B (zh) | 2020-12-25 | 2020-12-25 | 一种基于开放集联合迁移学习的跨工况故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011557783.5A CN112784872B (zh) | 2020-12-25 | 2020-12-25 | 一种基于开放集联合迁移学习的跨工况故障诊断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112784872A CN112784872A (zh) | 2021-05-11 |
CN112784872B true CN112784872B (zh) | 2023-06-30 |
Family
ID=75752349
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011557783.5A Active CN112784872B (zh) | 2020-12-25 | 2020-12-25 | 一种基于开放集联合迁移学习的跨工况故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112784872B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113342476B (zh) * | 2021-07-05 | 2023-04-07 | 中山大学 | 一种基于迁移学习的设备集群跨域故障预测方法及系统 |
CN114818996B (zh) * | 2022-06-28 | 2022-10-11 | 山东大学 | 基于联邦域泛化的机械故障诊断方法及系统 |
CN116206154B (zh) * | 2023-02-17 | 2024-02-13 | 北京科技大学 | 一种非常见工况下的污水处理过程的故障分类方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080250265A1 (en) * | 2007-04-05 | 2008-10-09 | Shu-Ping Chang | Systems and methods for predictive failure management |
CN110750665A (zh) * | 2019-10-12 | 2020-02-04 | 南京邮电大学 | 基于熵最小化的开集域适应方法及系统 |
CN111060318A (zh) * | 2020-01-09 | 2020-04-24 | 山东科技大学 | 一种基于深度对抗迁移网络的轴承故障诊断方法 |
CN111626345A (zh) * | 2020-05-15 | 2020-09-04 | 北京航空航天大学 | 不同轴承设备之间的多阶段深度卷积迁移学习故障诊断方法 |
CN111898095A (zh) * | 2020-07-10 | 2020-11-06 | 佛山科学技术学院 | 深度迁移学习智能故障诊断方法、装置、存储介质和设备 |
-
2020
- 2020-12-25 CN CN202011557783.5A patent/CN112784872B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080250265A1 (en) * | 2007-04-05 | 2008-10-09 | Shu-Ping Chang | Systems and methods for predictive failure management |
CN110750665A (zh) * | 2019-10-12 | 2020-02-04 | 南京邮电大学 | 基于熵最小化的开集域适应方法及系统 |
CN111060318A (zh) * | 2020-01-09 | 2020-04-24 | 山东科技大学 | 一种基于深度对抗迁移网络的轴承故障诊断方法 |
CN111626345A (zh) * | 2020-05-15 | 2020-09-04 | 北京航空航天大学 | 不同轴承设备之间的多阶段深度卷积迁移学习故障诊断方法 |
CN111898095A (zh) * | 2020-07-10 | 2020-11-06 | 佛山科学技术学院 | 深度迁移学习智能故障诊断方法、装置、存储介质和设备 |
Non-Patent Citations (2)
Title |
---|
基于域对抗迁移的变工况滚动轴承故障诊断模型;金余丰等;《自动化仪表》;20191220(第12期);第55-65页 * |
基于迁移学习的小样本识别研究;王超;《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》;20200615(第06期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112784872A (zh) | 2021-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112784872B (zh) | 一种基于开放集联合迁移学习的跨工况故障诊断方法 | |
WO2024021246A1 (zh) | 基于持续学习的跨设备增量轴承故障诊断方法 | |
CN109635677B (zh) | 基于多标签分类卷积神经网络的复合故障诊断方法及装置 | |
CN114048568B (zh) | 一种基于多源迁移融合收缩框架的旋转机械故障诊断方法 | |
CN111709448A (zh) | 一种基于迁移关系网络的机械故障诊断方法 | |
CN112763214B (zh) | 基于多标签零样本学习的滚动轴承故障诊断方法 | |
CN114358124B (zh) | 基于深度对抗卷积神经网络的旋转机械新故障诊断方法 | |
CN114358123B (zh) | 一种基于深度对抗迁移网络的广义开放集故障诊断方法 | |
CN113887136A (zh) | 一种基于改进GAN和ResNet的电动汽车电机轴承故障诊断方法 | |
CN114358125B (zh) | 一种基于多源信息深度融合的旋转机械故障自动识别方法 | |
CN114118138A (zh) | 一种基于多标签领域自适应模型的轴承复合故障诊断方法 | |
CN113157732A (zh) | 一种基于pso-bp神经网络的地下铲运机故障诊断方法 | |
CN112686372A (zh) | 基于深度残差gru神经网络的产品性能预测方法 | |
CN116401603A (zh) | 一种基于迁移学习的多模态轴承故障智能诊断方法 | |
CN116894215B (zh) | 一种基于半监督动态图注意的齿轮箱故障诊断方法 | |
CN115659174A (zh) | 基于图正则化CNN-BiLSTM的多传感器故障诊断方法、介质及设备 | |
CN111507365A (zh) | 一种基于模糊聚类的置信规则自动生成方法 | |
CN115051929A (zh) | 基于自监督目标感知神经网络的网络故障预测方法及装置 | |
CN116805051A (zh) | 基于注意力机制的双卷积动态域适应设备故障诊断方法 | |
CN115578568A (zh) | 一种小规模可靠数据集驱动的噪声修正算法 | |
CN117349595A (zh) | 一种面向工业场景的极端少样本故障诊断方法 | |
CN113609480B (zh) | 基于大规模网络流的多路学习入侵检测方法 | |
CN113343123B (zh) | 一种生成对抗多关系图网络的训练方法和检测方法 | |
CN114299305A (zh) | 聚合密集和注意力多尺度特征的显著性目标检测算法 | |
CN112668633B (zh) | 一种基于细粒度领域自适应的图迁移学习方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |