CN114358124A - 基于深度对抗卷积神经网络的旋转机械新故障诊断方法 - Google Patents
基于深度对抗卷积神经网络的旋转机械新故障诊断方法 Download PDFInfo
- Publication number
- CN114358124A CN114358124A CN202111470695.6A CN202111470695A CN114358124A CN 114358124 A CN114358124 A CN 114358124A CN 202111470695 A CN202111470695 A CN 202111470695A CN 114358124 A CN114358124 A CN 114358124A
- Authority
- CN
- China
- Prior art keywords
- domain
- sample
- discriminator
- data
- target domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000003745 diagnosis Methods 0.000 title claims abstract description 34
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 22
- 238000012549 training Methods 0.000 claims abstract description 26
- 238000009826 distribution Methods 0.000 claims abstract description 23
- 238000012360 testing method Methods 0.000 claims abstract description 17
- 238000000605 extraction Methods 0.000 claims abstract description 12
- 238000004364 calculation method Methods 0.000 claims abstract description 9
- 230000006870 function Effects 0.000 claims description 43
- 230000003042 antagnostic effect Effects 0.000 claims description 32
- 230000006978 adaptation Effects 0.000 claims description 13
- 238000013527 convolutional neural network Methods 0.000 claims description 11
- 239000004576 sand Substances 0.000 claims description 10
- 230000001133 acceleration Effects 0.000 claims description 8
- 238000011176 pooling Methods 0.000 claims description 7
- 150000001875 compounds Chemical class 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 4
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 2
- 230000007246 mechanism Effects 0.000 abstract description 10
- 238000013507 mapping Methods 0.000 abstract description 2
- 238000001514 detection method Methods 0.000 abstract 1
- 230000008569 process Effects 0.000 description 13
- 238000002474 experimental method Methods 0.000 description 12
- 238000013508 migration Methods 0.000 description 7
- 230000005012 migration Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- HJVCHYDYCYBBQX-HLTLHRPFSA-N (2s,3s,4e,6e,8s,9s)-3-amino-9-methoxy-2,6,8-trimethyl-10-phenyldeca-4,6-dienoic acid Chemical compound OC(=O)[C@@H](C)[C@@H](N)/C=C/C(/C)=C/[C@H](C)[C@@H](OC)CC1=CC=CC=C1 HJVCHYDYCYBBQX-HLTLHRPFSA-N 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- PBLZLIFKVPJDCO-UHFFFAOYSA-N omega-Aminododecanoic acid Natural products NCCCCCCCCCCCC(O)=O PBLZLIFKVPJDCO-UHFFFAOYSA-N 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Landscapes
- Complex Calculations (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了基于深度对抗卷积神经网络的旋转机械新故障诊断方法,包括步骤:构建源域样本数据集和目标域样本数据集;构建用于识别已知故障以及新故障的深度对抗卷积神经网络,包括特征提取器G,标签分类器CF,领域判别器D,非对抗领域判别器;在训练阶段,通过特征提取模块将源域与目标域数据映射到高维特征空间中,获取数据特征分布;设计一种加权判别机制,评估目标域样本数据与源域数据的相似程度,判别数据的可迁移性;将目标域测试数据输入到训练好的网络中测试,通过计算所得权重值判别数据是否属于新故障类别,输出最终的分类诊断结果。通过加权对抗训练和目标域测试样本权重阈值选取,使得构建的网络适用于变工况下的已知故障和新故障检测。
Description
技术领域
本发明属于旋转机械智能故障诊断领域,具体涉及基于深度对抗卷积神经网络的旋转机械新故障诊断方法。
背景技术
随着现代工业技术和机械设备现代化水平的不断发展,旋转机械越来越趋向于复杂化、大型化、高性能、高效率和高自动化发展。然而,设备的零部件在运行过程中不可避免地会出现损伤,进而引发设备故障,轻则打乱生产节奏,重则造成安全事故。为了保障工业设备的稳定高效运转,实时掌握设备的运行状态,机械智能故障诊断技术扮演着越来越重要的角色,机械设备健康状况监测已成为智能制造中的重要技术手段。旋转机械系统作为机械设备的重要组成部分,被广泛应用于各个领域中,且长期工作在交变负荷下,极易出现疲劳失效,引发设备故障。因此,准确、及时识别旋转机械系统故障的产生与演变,减少或避免重大事故的发生,对保障设备高质量、高效率地运行具有重大而深远的意义。
深度学习通常指由多层隐藏层构建的深度神经网络。其基本思想在于模拟人脑的分层结构,通过构建多层非线性变换,对外部输入的数据进行处理,从而可从大量数据中,学习多层次抽象特征以及隐藏结构表示,实现对输入数据的智能识别和预测。因此,基于深度学习的故障诊断方法不需要进行复杂的信号机理分析,通过神经网络自动提取数据的有效特征进行故障诊断及分类,促进了智能故障诊断方法的发展及应用。
随着计算机技术和数据采集技术的发展,工业现场可采集到海量的设备运行数据,推动故障诊断领域进入了智能化时代。然而,旋转机械设备运行工况复杂多变,轻微的条件变化都有可能导致采集的振动信号发生大幅度改变,且机械故障具有突发性,使得采集到的故障数据可能出现新故障类别,导致待诊断样本与训练样本的数据分布不同,使得原有故障诊断模型并不完全适用于新的运行工况。若对不同任务分别建立故障诊断模型,不仅耗费时间和人力,还需要充足的故障样本。然而在工业应用中,旋转机械无法带故障长时间运转,每个任务采集和标注故障数据的代价十分高昂。
安晶等在中国公开专利“一种域对抗自适应一维卷积神经网络智能故障诊断方法”中构建了一种一维卷积神经网络,并结合对抗学习技术,用于变工况下的轴承故障诊断。但是该方法只能对源域数据中已知的故障类型进行诊断,缺乏新故障识别能力,无法满足诊断需求。
发明内容
为了解决现有技术存在的问题,本发明设计了一种基于深度对抗卷积神经网络的旋转机械新故障诊断方法,提出深度对抗卷积神经网络(Domain AdversarialConvolutional Neural Network,DACNN)。所述方法通过特征提取模块(特征提取器),将源域与目标域数据映射到高维特征空间中,获取数据特征分布;利用领域对抗模块(领域判别器)学习两域的域不变特征,减小两域分布差异,进行特征分布匹配;由于目标域中存在新故障的类别,因此,设计了一种加权判别机制,评估目标域样本数据与源域数据的相似程度,判别数据的可迁移性,最终通过权重值判别数据所属类别,实现目标域样本与源域样本自适应匹配,从而有效改进实际变工况下的智能故障诊断任务。
为了实现本发明目的,本发明提供的基于深度对抗卷积神经网络的旋转机械新故障诊断方法,包括步骤:
步骤1:分别采集旋转机械在不同实验工况下的振动加速度信号,从振动加速度信号中截取数据段来构成样本,并进行标注,获得大量的源域样本数据集{xs,ys},其中,xs为源域数据,ys为对应的标签,在不同工况下获取多于源域故障类别的目标域样本数据集{xt},xt为不带标签的目标域数据xt;
步骤2:构建用于识别已知故障以及出现的新故障的深度对抗卷积神经网络,包括:特征提取器G,标签分类器CF,领域判别器D,非对抗领域判别器D′,其中,特征提取器G用于对输入信号提取高维特征,标签分类器CF用于输出已知类故障和新故障的类别概率,领域判别器D用于在对抗训练阶段对来自源域的样本和目标域样本进行判别,非对抗领域判别器D′用于对来自源域样本和目标域的样本进行二分类,其不参与对抗训练,且特征提取器G和领域对抗判别器D之间设置有梯度反转层;
步骤3:利用步骤1构建的源域数据集{xs,ys},采用监督学习算法和梯度下降法对特征提取器G的参数以及标签分类器CF的参数进行优化训练,并对非对抗领域判别器D′进行训练以量化每个样本的域相似度;
步骤4:在域适配阶段,利用训练的标签分类器CF对目标域数据进行分类,利用非对抗领域判别器D′对源域数据xs和目标域数据xt进行判别,从而获得训练阶段的目标域权重函数wt,通过获取的权重进行加权训练;
步骤5:在测试阶段,输入测试样本,将获得对应的目标域权重与设定的阈值进行对比,判断该样本属于已知故障还是新故障。
本发明通过构建深度对抗卷积神经网络,并引入目标域权重函数自适应度量源域和目标域共享类故障和未知新故障的差异性,通过加权对抗训练和目标域测试样本权重阈值选取,可使得构建的网络适用于变工况下的已知故障和新故障检测。
进一步地,步骤1中,源域数据是有标签样本,目标域数据是无标签样本,两域的数据特征分布不同,即p(xs)≠q(xt);且两域的类别空间不同Cs≠Ct,并且满足Cs∈Ct,两者共享的公共标签集为C=Cs∩Ct。新故障样本集为针对两域标签不对齐,两域的数据来自于不同工况的迁移问题,导致领域差距加剧,如果采用常规的领域适配的方法进行两域特征匹配,容易导致目标域中的未知类别被预测为Cs中的一类,引起负迁移问题。
进一步地,步骤2中所构建的特征提取器G,标签分类器CF,领域判别器D,非对抗领域判别器D′,分别都采用了一维卷积神经网络和全连接结构,其中标签分类器输出层采用Softmax输出函数;特别的,领域判别器D和非对抗领域判别器D′两者共享相同的结构及参数,并且输出层都采用Sigmoid输出函数。
进一步地,步骤3基于特征提取器G,标签分类器CF,构建分类损失函数:
式中,L表示标准的交叉熵损失函数,ys表示标签样本,CF(G(xs))表示分类器CF输出的类别。需要说明的是,本步骤与其它方法不同的的地方在于,网络首先采用大的学习率进行模型监督训练,待达到一定的分类精度后,采用小的学习率进行网络微调,从而可以使得网络加快收敛。
此外,对输入样本提取的特征分布z,输入非对抗领域判别器D′,获得域相似度它的目标是要使得源域的样本预测为1,目标域的样本预测为0,量化每个样本的域相似度,即量化输入样本与源域样本的相似程度。对于源域样本,越小,即说明此样本接近目标域;对于目标域样本,越大,说明此样本与源域越相似。构建对应的损失函数:
进一步的,领域对抗判别器D的目标是区分源域和目标域内来自于公共标签集C的数据,而后通过对此部分数据样本加权计算,使得在公共标签集C中能够最大程度的匹配源域与目标域。该加权机制划分出了目标域中的未知类别数据,使得两域在类别空间相同情况下,匹配源域与目标域中归属于公共标签集C的数据特征。其损失函数为:
式中wt(xt)是目标域权重函数,表示目标域样本属于公共标签集C的概率。
最终上述三个损失函数的优化过程可以总结为:
该方法在特征提取器G和领域对抗判别器D之间添加了梯度反转层,以“端对端”的优化所有模块的网络参数。
进一步地,步骤4对目标域权重函数进行进一步明确和计算。
针对两域类别空间不一致,目标域中含有未知类别的情况,如果能去除或弱化目标域私有类别的影响,获得公共标签集C的样本,而后通过领域对抗进行两域特征分布匹配,提升网络的分类精度。但由于目标域未包含标签信息,无法知悉目标域数据所含的公共类别C及新故障类别对于此种情形,源域与目标域的公共标签集C是未知的,为了解决此问题,可以通过计算目标域中每个样本的权重值,在网络训练过程中,以此判别样本的可迁移性;在测试阶段,通过权重大小识别样本是否属于公共标签集C,以此标记新故障类别,并去除目标域私有类别对领域适配过程的影响,改善两域的特征分布匹配。因此,在网络的损失函数中,引入权值计算策略,对目标域中的样本进行加权,以减少在领域对抗训练过程中不相关类别的影响,因而需要构建具有样本区分度的加权机制,度量每个样本的可迁移性。
熵是不确定性的度量,熵值越小,则其预测的可信度越高,反之,则可信度较低。但是由于源域样本带有标签,而目标域数据未标记,对于标签分类器CF,在训练的过程中输入了源域标签,因此标签分类器CF对源域样本xs的预测相较于目标域样本而言,预测可靠性较高,则其熵较小;根据输入样本获得的类别标签采用最小熵原理,构建信息熵,其定义为:其中si表示在样本中出现的概率。进而,计算目标域样本的熵值:
对于非对抗领域判别器D′,其通过输入特征分布z获得域相似度它的目标是要使得源域的样本预测为1,目标域的样本预测为0,因此可表示每个样本的域相似度。针对源域样本,若越小,则表示该样本与目标域越为相似;针对目标域,若越大,则表示该样本与源域越为相似;
因此,根据预测的不确定性及域相似度的分析,目标域的加权计算可以表示为:
进一步地,步骤5在于,将目标域样本数据输入特征提取器G中,用以提取目标域样本的特征分布z,并进一步通过标签分类器CF和非对抗领域判别器D′进行样本权值计算:
式中,w0表示多次实验所得经验值。在测试过程中,若wt(x)<w0,则输入样本判别为“未知类”;若wt(x)≥w0,则输入样本属于公共标签集C中,其后通过softmax函数输出类别标签。
与现有技术相比,本发明的有益效果至少如下:
1、本发明采用具有一维卷积核和一维池化核构建特征提取器,避免了人为特征提取,减少了对信号处理等专业知识的依赖性,可以有效地提取数据的高维特征。
2、本发明构建了非对抗领域判别器,量化每个样本的域相似度,即量化目标域样本与源域样本的相似程度,促进两域进行特征分布匹配,使得利用源域样本数据训练所得的标签分类器能够很好的应用于目标域判别。
3、本发明设计了一种加权判别机制,评估目标域样本数据与源域数据的相似程度,判别数据的可迁移性,最终通过权重值判别数据所属类别,实现对目标域中新故障类别的识别及原有故障类别的准确分类。
4、本发明所构建的网络模型,充分考虑工业应用的实际情况,可通过实验室数据或者工业设备的历史数据学习诊断知识,并迁移到不同运行工况、带有新故障类型的智能诊断实例中,用于解决在工业生产中,实际设备发生故障但是训练数据中故障类别未知的诊断问题,大大提升了诊断的多样性,为评价设备的综合性能提供了重要信息。
5、本发明通过深度迁移学习中的对抗域适配算法,挖掘现有数据的深层信息,解决旋转机械变工况故障诊断识别问题,为实现“端到端”的旋转机械设备状态监测及故障诊断提供可行的解决方案。
附图说明
图1是本发明方法的故障诊断流程图。
图2是本发明方法的特征提取器G的结构示意图。
图3是本发明方法深度对抗卷积神经网络的网络框架示意图。
图4是本发明方法的测试诊断过程示意图。
具体实施方式
为了使本发明的技术方案和目的更加的清楚明白,下面结合附图和具体实施例对本发明进行详细说明,应当理解,此处所描述的具体实施步骤只用于更好的阐述本发明的应用,但本发明的实施方式所涉及到的技术特征不限于此。
请参阅图1,本发明提供的基于深度对抗卷积神经网络(Domain AdversarialConvolutional Neural Network,DACNN)的旋转机械新故障诊断方法,包括以下步骤:
步骤1:进行数据采集,获得大量的源域样本数据集{xs,ys}和多于源域故障类别的目标域样本数据集{xt},源域样本数据集中包括源域数据xs及其对应标签ys,目标域样本数据集{xt}由不带标签的目标域数据xt构成。
在本发明的其中一些实施例中,分别采集旋转机械在不同实验工况下的振动加速度信号,从振动加速度信号中截取所有故障类别中包含故障特征频率最少一个周期长度的数据段来构成样本,并进行标注,获得大量的源域样本数据集{xs,ys},数据集由源域数据xs及其对应标签ys构成。
在本发明的其中一些实施例中,在不同工况下获取多于源域故障类别的目标域样本数据集{xt}。
在本发明的其中一些实施例中,步骤1中,源域数据是有标签的样本,目标域数据是无标签的样本,两域的数据特征分布不同,即p(xs)≠q(xt);且两域的类别空间不同Cs≠Ct,并且满足Cs∈Ct,两者共享的公共标签集C=Cs∩Ct。新故障样本集为针对两域标签不对齐、两域的数据来自于不同工况的迁移问题,导致领域差距加剧,如果采用常规的领域适配的方法进行两域特征匹配,容易导致目标域中的未知类别被预测为Cs中的一类,引起负迁移问题。
步骤2:构建深度对抗卷积神经网络,用来同时识别已知故障以及出现的新故障。包括:特征提取器G、标签分类器CF、领域判别器D和非对抗领域判别器D′。特征提取器G用于对输入信号提取高维特征,标签分类器CF用于输出已知类故障和新故障的类别概率,领域判别器D用于在对抗训练阶段对来自源域的样本和目标域样本进行判别;非对抗领域判别器D′用于对来自源域样本和目标域的样本进行二分类,其不参与对抗训练。
在本发明的其中一些实施例中,针对输入数据为一维信号的特点,构建的特征提取器G的结构包括多个特征提取单元,多个特征提取单元依次堆叠,每个特征提取单元均包括一维卷积核的卷积层、批次归一化层、一维池化核的最大池化层。请参阅图2,本实施例中设置了4个特征提取单元,第一个特征提取单元的卷积核大小设置为64,滤波器数目设置为16,最大池化层大小设置为2,其他特征提取单元中的卷积层采用更小的卷积核,大小设置为3,最大池化层大小设置均为2。领域判别器D、非对抗领域判别器D′和标签分类器CF三个模块都由全连接层构成。
在本发明的其中一些实施例中,请参阅图2,通过对特征提取器的输出进行展平后,输入具有全连接层结构的标签分类器CF,标签分类器CF的输出层采用Softmax输出函数,其输出标签为{1,2,3,...,m,m+1},其中m是源域中的标签类别数目,m+1是指新故障类。
在本发明的其中一些实施例中,领域判别器D和非对抗领域判别器D′两者共享相同的结构及参数,并且输出层都采用Sigmoid输出函数。
步骤3:利用步骤1构建的源域数据集{xs,ys},采用传统的监督学习算法和梯度下降法对特征提取器G的参数以及标签分类器CF的参数进行优化训练。
在训练阶段,通过特征提取模块,将源域与目标域数据,映射到高维特征空间中,获取数据特征分布;利用领域对抗模块学习两域的域不变特征,减小两域分布差异,进行特征分布匹配。
在本发明的其中一些实施例中,基于特征提取器G和标签分类器CF构建分类损失函数:
式中,EG表示源域样本的分类损失函数,表示所有源域样本的交叉熵损失平均值,L表示标准的交叉熵损失函数,ys表示标签样本,CF(G(xs))表示标签分类器CF输出的类别,G(xs)表示特征提取器对源域样本提取的高维特征。
需要说明的是,本步骤与现有其它方法不同的的地方在于,网络首先采用大的学习率(学习率设为设为0.001)进行模型监督训练,待达到一定的分类精度后,采用小的学习率进行网络微调(学习率设为0.0001),从而可以使得网络加快收敛。
此外,将源域样本和目标域样本一起输入到特征提取器,提取特征z,然后将特征z输入非对抗领域判别器D′,获得域相似度其目标是要使得源域的样本预测为1,目标域的样本预测为0,量化每个样本的域相似度,即量化输入样本与源域样本的相似程度。对于源域样本,越小,即说明此样本接近目标域;对于目标域样本,越大,说明此样本与源域越相似。构建对应的损失函数:
ED′为非对抗领域判别器损失函数,表示非对抗领域判别器在源域样本输入下的输出平均值,D′(G(xs))表示非对抗领域判别器在源域样本输入下的概率输出,G(xs)表示特征提取器对源域样本提取的高维特征,表示非对抗领域判别器在目标域样本输入下的输出平均值、D′(G(xt))表示非对抗领域判别器在目标域样本输入下的概率输出,G(xt)表示特征提取器对目标域样本提取的高维特征。
在本发明的其中一些实施例中,领域判别器D的目标是区分源域和目标域内来自于公共标签集C的数据,而后通过对此部分数据样本加权计算,使得在公共标签集C中能够最大程度地匹配源域与目标域。该加权机制划分出了目标域中的未知类别数据,使得两域在类别空间相同情况下,匹配源域与目标域中归属于公共标签集C的数据特征。其损失函数为:
式中,ED为领域判别器的损失函数,D(G(xs))表示领域判别器在源域样本输入下的概率输出,D(G(xt))表示领域判别器在目标域样本输入下的概率输出,wt(xt)是目标域权重函数,表示目标域样本属于公共标签集C的概率,ws(xs)是源域权重函数,表示源域样本属于公共标签集C的概率。
因而,最终上述三个损失函数的优化过程总结为:
该方法在特征提取器G和领域对抗判别器D之间添加了梯度反转层(GRL层),以“端对端”的方式优化所有模块的网络参数。
步骤4:在域适配阶段,利用训练的标签分类器CF对目标域数据进行分类,利用非对抗领域判别器D′对源域数据xs和目标域数据xt进行判别,从而获得训练阶段的目标域权重函数wt;通过获取的权重进行加权训练。
由于两域数据采自不同的工况,且类别标签不对齐,容易导致预测错误,进一步设计了一种加权判别机制,评估目标域样本数据与源域数据的相似程度,判别数据的可迁移性,从而有效改进故障的分类性能。
在本发明的其中一些实施例中,步骤4对目标域权重函数进行进一步明确和计算。
针对两域类别空间不一致,目标域中含有未知类别的情况,如果能去除或弱化目标域私有类别的影响,获得公共标签集C的样本,而后通过领域对抗进行两域特征分布匹配,则可以提升网络的分类精度。但由于目标域未包含标签信息,无法知悉目标域数据所含的公共类别及新故障类别,对于此种情形,源域与目标域的公共标签集C是未知的,为了解决此问题,本发明通过计算目标域中每个样本的权重值,在网络训练过程中,以此判别样本的可迁移性;在测试阶段,通过权重大小识别样本是否属于公共标签集C,以此标记新故障类别,并去除目标域私有类别对领域适配过程的影响,改善两域的特征分布匹配。因此,在网络的损失函数中,引入权值计算策略,对目标域中的样本进行加权,以减少在领域对抗训练过程中不相关类别的影响,因而需要构建具有样本区分度的加权机制,度量每个样本的可迁移性。
熵是不确定性的度量,熵值越小,则其预测的可信度越高,反之,则可信度较低。但是由于源域样本带有标签,而目标域数据未标记,对于标签分类器CF,在训练的过程中输入了源域标签,因此标签分类器CF对源域样本xs的预测相较于目标域样本而言,预测可靠性较高,则其熵较小;根据输入样本获得的类别标签采用最小熵原理,构建信息熵,其定义为:其中si表示在样本中出现的概率,n表示样本个数;进而,计算目标域样本的熵值:
对于非对抗领域判别器D′,其通过输入特征z获得域相似度它的目标是要使得源域的样本预测为1,目标域的样本预测为0,因此可表示每个样本的域相似度。针对源域样本,若越小,则表示该样本与目标域越为相似;针对目标域,若越大,则表示该样本与源域越为相似;分别代表在源域和目标域样本下求得的域相似度。
因此,根据预测的不确定性及域相似度的分析,目标域的加权计算可以表示为:
式中,x代表输入的样本。
步骤5:在测试阶段,输入测试样本,将获得对应的目标域权重与设定的阈值进行对比,判断该样本属于已知故障还是新故障。
在本发明的其中一些实施例中,步骤5在于,首先去掉领域判别器D,请参阅图4,将目标域样本数据输入特征提取器G中,用以提取目标域样本的特征分布z,并进一步通过标签分类器CF和非对抗领域判别器D′进行样本权值计算:
式中,w0表示设定的阈值,是多次实验所得的经验值。在测试过程中,若wt(x)<w0,则输入样本判别为“未知类”;若wt(x)≥w0,则输入样本属于公共标签集C中,其后通过softmax函数输出类别标签。
下文结合附图和实验案例对本发明做进一步说明。
为评估所提方法的性能,通过公开的MFPT轴承数据集(机械故障预防技术学会的轴承故障数据集)进行实验验证。MFPT轴承数据集在输入轴转速为1500rpm下进行数据采集。其包含三种轴承状态的数据,分别为正常、内圈故障(IF)和外圈故障(OF)。其中,正常轴承的运转负载为270lbs,采样频率97656Hz,采样时间持续6秒;轴承内圈故障、外圈故障分别在七种负载条件下(0lbs~3001bs,每次采集负载间隔501bs)进行采集,采样频率为48828Hz,采样持续3秒。特别地,MFPT轴承数据集包含3个真实轴承故障案例数据,故障轴承来自于机械传动系统中废弃的故障轴承,包括了来自风力涡轮机的中间轴轴承(InterMediate Speed Bearing,IMSB),来自风力涡轮机的油泵轴轴承(Oil-Pump Bearing,OPB)和行星故障轴承(Planet Bearing,PB),但三个真实故障轴承的所属故障类别未知。
为了构建网络的训练集和测试集,对于每种轴承状态,每个样本提取2048个数据点,并通过傅里叶变换(FFT)将提取的振动信号变换到频域得到1024个数据点,每种轴承状态共有150个样本。在构建MFPT轴承数据集的诊断任务时,各个诊断任务的目标域均包含新故障类型,即目标域的故障种类多于源域所包含的故障种类,具体实验任务设计如下:对于源域,样本数据采集自负载501bs,构建包含3种故障类别(即正常/内圈故障/外圈故障),共450个样本的数据集;对于目标域,数据采集自负载150lbs,实验一至试验三的目标域类别数为4,两域共享类占目标域样本量的3/4;实验四至试验六的目标域类别数为5,两域共享类占目标域样本量的3/5;实验七的目标域类别数为6,两域共享类占目标域样本量的1/2。数据集设置如表1所示。
表1 MFPT轴承数据集构建的迁移任务
以实验一为例,S1为源域数据集,包含3种轴承状态(即正常/内圈故障/外圈故障),其振动信号采集自负载为50lbs的工况下,而T1为目标域数据集,其振动信号采集自负载为150lbs的工况下,包含4种轴承状态(即正常/内圈故障/外圈故障/真实的风力涡轮机中间轴轴承故障)。
由于CNN的特征学习能力较强,均采用一维CNN构建网络进行两域的特征提取和诊断分类,其模块参数如表2所示。
表2特征提取器结构
为了验证所提方法的优越性,在七个迁移任务上使用了几种经典的算法进行比较,算法包括:DANN和ADDA。
为了实验的公平性,所有的方法都采用了相同的卷积神经网络结构。为了预防实验的偶然性,每个迁移任务进行5次,取准确率的平均值。
表3本发明DACNN与其他方法作比较
在进行诊断实验时,由于各个实验的目标域中均包含新故障类型,即目标域故障种类多于源域所包含的故障种类,而传统的域适配方法,未将目标域的新故障类别纳入考虑,无法识别目标域中所包含的新故障类型。而本发明所提方法DACNN,在七个故障实验中表现出最好的分类性能,相比ADDA、DANN,其诊断准确性有显著的提高,说明在域适配过程中,通过构建加权机制判别样本的可迁移性,在进行目标域诊断时,剔除了目标域新故障类别的影响,减小了两域的特征分布差异,提高了网络的域适配性能,提升了网络的特征学习能力及领域适配能力。本发明方法能够有效地减少不同域之间的分布差异,获得更好的域适配和分类能力。
本发明针对在进行不同工况故障诊断时,存在的数据分布不一致、目标域任务带有新故障类别且无标签的问题,以滚动轴承故障研究对象,通过利用深度对抗卷积神经网络,来有效将带标签源域诊断知识迁移到无标签目标域,有效地改进了工业设备的故障诊断能力。
需要说明的是,虽然已经参照实例对本发明实施进行了详细的阐述,但本领域的技术人员容易理解,在不偏离所附权利要求中所阐述的本发明的精神和原则之内所作的任何修改、替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.基于深度对抗卷积神经网络的旋转机械新故障诊断方法,其特征在于,包括以下步骤:
步骤1:分别采集旋转机械在不同实验工况下的振动加速度信号,从振动加速度信号中截取数据段来构成样本,并进行标注,获得大量的源域样本数据集{xs,ys},其中,xs为源域数据,ys为对应的标签,在不同工况下获取多于源域故障类别的目标域样本数据集{xt},xt为不带标签的目标域数据xt;
步骤2:构建用于识别已知故障以及出现的新故障的深度对抗卷积神经网络,包括:特征提取器G,标签分类器CF,领域判别器D,非对抗领域判别器D′,其中,特征提取器G用于对输入信号提取高维特征,标签分类器CF用于输出已知类故障和新故障的类别概率,领域判别器D用于在对抗训练阶段对来自源域的样本和目标域样本进行判别,非对抗领域判别器D′用于对来自源域样本和目标域的样本进行二分类,其不参与对抗训练,且特征提取器G和领域对抗判别器D之间设置有梯度反转层;
步骤3:利用步骤1构建的源域数据集{xs,ys},采用监督学习算法和梯度下降法对特征提取器G的参数以及标签分类器CF的参数进行优化训练,并对非对抗领域判别器D′进行训练以量化每个样本的域相似度;
步骤4:在域适配阶段,利用训练的标签分类器CF对目标域数据进行分类,利用非对抗领域判别器D′对源域数据xs和目标域数据xt进行判别,从而获得训练阶段的目标域权重函数wt,通过获取的权重进行加权训练;
步骤5:在测试阶段,输入测试样本,将获得对应的目标域权重与设定的阈值进行对比,判断该样本属于已知故障还是新故障。
2.根据权利要求1所述的基于深度对抗卷积神经网络的旋转机械新故障诊断方法,其特征在于,步骤1中从振动加速度信号中截取数据段时,是从从振动加速度信号中截取所有故障类别中包含故障特征频率最少一个周期长度的数据段来构成样本。
3.根据权利要求1所述的基于深度对抗卷积神经网络的旋转机械新故障诊断方法,其特征在于,步骤1中,源域数据是有标签样本,目标域数据是无标签样本,两域的数据特征分布不同,即p(xs)≠q(xt);且两域的类别空间不同Cs≠Ct,并且满足Cs∈Ct,两者共享的公共标签集为C=Cs∩Ct。
4.根据权利要求1所述的基于深度对抗卷积神经网络的旋转机械新故障诊断方法,其特征在于,步骤2中所构建的特征提取器G包括多个特征提取单元,多个特征提取单元依次堆叠,每个特征提取单元均包括一维卷积核的卷积层、批次归一化层、一维池化核的最大池化层。
5.根据权利要求1所述的基于深度对抗卷积神经网络的旋转机械新故障诊断方法,其特征在于,标签分类器CF、领域判别器D和非对抗领域判别器D′均由全连接层构成。
6.根据权利要求1所述的基于深度对抗卷积神经网络的旋转机械新故障诊断方法,其特征在于,标签分类器CF的输出层采用Softmax输出函数,领域判别器D和非对抗领域判别器D′两者共享相同的结构及参数,并且输出层都采用Sigmoid输出函数。
7.根据权利要求1所述的基于深度对抗卷积神经网络的旋转机械新故障诊断方法,其特征在于,步骤3基于损失函数对特征提取器G的参数、标签分类器CF的参数以及非对抗领域判别器D′的参数进行优化,所述损失函数为
其中,源域样本的分类损失函数EG为:
非对抗领域判别器损失函数ED′为:
式中,表示非对抗领域判别器在源域样本输入下的输出平均值,D′(G(xs))表示非对抗领域判别器在源域样本输入下的概率输出,G(xs)表示特征提取器对源域样本提取的高维特征,Ext~q表示非对抗领域判别器在目标域样本输入下的输出平均值、D′(G(xt))表示非对抗领域判别器在目标域样本输入下的概率输出,G(xt)表示特征提取器对目标域样本提取的高维特征;
领域判别器的损失函数ED为:
式中,D(G(xs))表示领域判别器在源域样本输入下的概率输出,D(G(xt))表示领域判别器在目标域样本输入下的概率输出;wt(xt)是目标域权重函数,表示目标域样本属于公共标签集C的概率,ws(xs)是源域权重函数,表示源域样本属于公共标签集C的概率;
在优化时通过特征提取器G和领域对抗判别器D之间添加了梯度反转层以端对端的方式优化所有模块的网络参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111470695.6A CN114358124B (zh) | 2021-12-03 | 2021-12-03 | 基于深度对抗卷积神经网络的旋转机械新故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111470695.6A CN114358124B (zh) | 2021-12-03 | 2021-12-03 | 基于深度对抗卷积神经网络的旋转机械新故障诊断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114358124A true CN114358124A (zh) | 2022-04-15 |
CN114358124B CN114358124B (zh) | 2024-03-15 |
Family
ID=81097624
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111470695.6A Active CN114358124B (zh) | 2021-12-03 | 2021-12-03 | 基于深度对抗卷积神经网络的旋转机械新故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114358124B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114821282A (zh) * | 2022-06-28 | 2022-07-29 | 苏州立创致恒电子科技有限公司 | 一种基于域对抗神经网络的图像检测模型及方法 |
CN115933531A (zh) * | 2023-01-09 | 2023-04-07 | 广东工业大学 | 一种基于深度域对抗迁移的机床热误差建模方法及系统 |
CN115964661A (zh) * | 2023-01-04 | 2023-04-14 | 东北林业大学 | 基于域对抗网络的旋转机械故障诊断方法和系统 |
CN116992953A (zh) * | 2023-09-27 | 2023-11-03 | 苏州捷杰传感技术有限公司 | 一种模型训练方法、故障诊断方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111898634A (zh) * | 2020-06-22 | 2020-11-06 | 西安交通大学 | 一种基于深度对抗域自适应的智能故障诊断方法 |
CN112183581A (zh) * | 2020-09-07 | 2021-01-05 | 华南理工大学 | 基于自适应迁移神经网络的半监督机械故障诊断方法 |
CN113375941A (zh) * | 2021-06-08 | 2021-09-10 | 西安交通大学 | 高速动车组轴承的开集故障诊断方法 |
-
2021
- 2021-12-03 CN CN202111470695.6A patent/CN114358124B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111898634A (zh) * | 2020-06-22 | 2020-11-06 | 西安交通大学 | 一种基于深度对抗域自适应的智能故障诊断方法 |
CN112183581A (zh) * | 2020-09-07 | 2021-01-05 | 华南理工大学 | 基于自适应迁移神经网络的半监督机械故障诊断方法 |
CN113375941A (zh) * | 2021-06-08 | 2021-09-10 | 西安交通大学 | 高速动车组轴承的开集故障诊断方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114821282A (zh) * | 2022-06-28 | 2022-07-29 | 苏州立创致恒电子科技有限公司 | 一种基于域对抗神经网络的图像检测模型及方法 |
CN115964661A (zh) * | 2023-01-04 | 2023-04-14 | 东北林业大学 | 基于域对抗网络的旋转机械故障诊断方法和系统 |
CN115964661B (zh) * | 2023-01-04 | 2023-09-08 | 东北林业大学 | 基于域对抗网络的旋转机械故障诊断方法和系统 |
CN115933531A (zh) * | 2023-01-09 | 2023-04-07 | 广东工业大学 | 一种基于深度域对抗迁移的机床热误差建模方法及系统 |
CN115933531B (zh) * | 2023-01-09 | 2024-04-05 | 广东工业大学 | 一种基于深度域对抗迁移的机床热误差建模方法及系统 |
CN116992953A (zh) * | 2023-09-27 | 2023-11-03 | 苏州捷杰传感技术有限公司 | 一种模型训练方法、故障诊断方法及装置 |
CN116992953B (zh) * | 2023-09-27 | 2024-04-19 | 苏州捷杰传感技术有限公司 | 一种模型训练方法、故障诊断方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN114358124B (zh) | 2024-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114358124B (zh) | 基于深度对抗卷积神经网络的旋转机械新故障诊断方法 | |
Ren et al. | A novel model with the ability of few-shot learning and quick updating for intelligent fault diagnosis | |
CN114358123B (zh) | 一种基于深度对抗迁移网络的广义开放集故障诊断方法 | |
CN111914883B (zh) | 一种基于深度融合网络的主轴轴承状态评估方法及装置 | |
CN113988126B (zh) | 一种基于少标签数据特征迁移的滚动轴承故障诊断方法 | |
CN111046945A (zh) | 基于组合卷积神经网络的故障类型及损坏程度诊断方法 | |
CN116894187A (zh) | 一种基于深度迁移学习的齿轮箱故障诊断方法 | |
CN114676742A (zh) | 一种基于注意力机制和残差网络的电网异常用电检测方法 | |
CN114048568A (zh) | 一种基于多源迁移融合收缩框架的旋转机械故障诊断方法 | |
Ma et al. | An unsupervised domain adaptation approach with enhanced transferability and discriminability for bearing fault diagnosis under few-shot samples | |
Han et al. | Cross‐machine intelligent fault diagnosis of gearbox based on deep learning and parameter transfer | |
Tian et al. | Deep learning-based open set multi-source domain adaptation with complementary transferability metric for mechanical fault diagnosis | |
CN112860183B (zh) | 基于高阶矩匹配的多源蒸馏-迁移机械故障智能诊断方法 | |
CN114429152A (zh) | 基于动态指数对抗性自适应的滚动轴承故障诊断方法 | |
CN115204272A (zh) | 基于多采样率数据的工业系统故障诊断方法与设备 | |
Du et al. | Fault diagnosis of plunger pump in truck crane based on relevance vector machine with particle swarm optimization algorithm | |
Wei et al. | Fault diagnosis of sucker rod pump based on deep-broad learning using motor data | |
Yu et al. | A Novel 1D‐CNN‐Based Diagnosis Method for a Rolling Bearing with Dual‐Sensor Vibration Data Fusion | |
CN113551904B (zh) | 基于层次机器学习的齿轮箱多类型并发故障诊断方法 | |
CN115597879A (zh) | 一种数据驱动的柴油机振动信号中故障信息定位识别方法 | |
Tusar et al. | Detecting chronic kidney disease (CKD) at the initial stage: A novel hybrid feature-selection method and robust data preparation pipeline for different ML techniques | |
CN114548295A (zh) | 基于多尺度领域自适应网络的轴承故障分类系统及方法 | |
CN115146675A (zh) | 一种深度多特征动态对抗的变工况下旋转机械迁移诊断方法 | |
Lin et al. | Multi-Scale Pooled Convolutional Domain Adaptation Network for Intelligent Diagnosis of Rolling Bearing Under Variable Conditions | |
CN113723592A (zh) | 一种基于风电齿轮箱监测系统的故障诊断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |