CN115508073B - 基于多尺度注意力的原型适配机械设备故障诊断方法 - Google Patents
基于多尺度注意力的原型适配机械设备故障诊断方法 Download PDFInfo
- Publication number
- CN115508073B CN115508073B CN202211298191.5A CN202211298191A CN115508073B CN 115508073 B CN115508073 B CN 115508073B CN 202211298191 A CN202211298191 A CN 202211298191A CN 115508073 B CN115508073 B CN 115508073B
- Authority
- CN
- China
- Prior art keywords
- prototype
- sample
- network
- pseudo
- scale attention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 52
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 62
- 238000012544 monitoring process Methods 0.000 claims abstract description 31
- 230000006978 adaptation Effects 0.000 claims abstract description 27
- 230000036541 health Effects 0.000 claims abstract description 20
- 238000005457 optimization Methods 0.000 claims abstract description 15
- 238000012360 testing method Methods 0.000 claims description 80
- 238000009826 distribution Methods 0.000 claims description 45
- 230000006870 function Effects 0.000 claims description 43
- 230000008569 process Effects 0.000 claims description 14
- 238000012216 screening Methods 0.000 claims description 14
- 238000013527 convolutional neural network Methods 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 10
- 238000005096 rolling process Methods 0.000 claims description 10
- 238000011176 pooling Methods 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 5
- 238000012795 verification Methods 0.000 description 5
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013136 deep learning model Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000005299 abrasion Methods 0.000 description 2
- 239000003638 chemical reducing agent Substances 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000006247 magnetic powder Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012733 comparative method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明提供一种基于多尺度注意力的原型适配网络的机械设备故障诊断方法,其包括:对原型网络进行重构,建立基于多尺度注意力的以一个深层编码结构为主体的原型约束优化网络;基于伪标签学习策略,提出基于预测偏差的跨域原型适配策略;在此基础上,减小不同领域间同类嵌入原型的差异,提出一种基于预测偏差的高置信原型适配策略;模型训练收敛后,利用网络适配之后的原型对无标注目标样本进行健康状态辨识,实现故障诊断。通过监督原型损失约束以及不同领域间的嵌入原型适配,实现不同领域间的特征嵌入最优化;本发明充分考虑到监测数据的稀缺性以及目标域的无标签性,使训练出的诊断模型能够更好地服务于机械设备健康状态监测。
Description
技术领域
本发明属于机械故障诊断技术领域,具体地涉及一种基于多尺度注意力的原型适配网络的机械设备故障诊断方法。
背景技术
随着工业装备不断朝着高集成度和复杂度的趋势发展,为确保现代生产制造中机械装备的安全性与可靠性,先进的故障诊断技术已成为当前工业复杂系统监测和维护的不可或缺的技术手段。当前,工业系统中不断积累的大量监测数据,使得近年来数据驱动的诊断方法得到了前所未有的研究和发展。其中以深度学习为代表的智能诊断方法形成规模和体系化的发展,例如卷积神经网络、深度信念网络、生成对抗网络等深度学习模型已被广泛应用于故障诊断的研究。在利用深度学习模型完成故障诊断任务时,首先需要使用该任务中大量有标签的数据样本进行模型的构建和训练,然后基于训练后的模型对未知样本进行预测辨识。然而,在实际工业场景下,受故障样本难获取及标签成本等因素的影响,可用故障样本稀缺严重制约了常规智能诊断方法的性能。此外,由于监测数据多来自于不同工况下的服役设备,监测数据分布差异也是弱化深度学习模型诊断性能的关键因素。为此,如何在数据量不足以及数据分布差异较大的情况下完成故障诊断任务是亟待解决的难题。
针对样本量不足的问题,直观的解决方案是采用数据增强技术,通过人工合成样本扩充原始数据集,进一步利用增强的数据集训练诊断模型。例如,采用变分自动编码器和生成对抗网络拟合原始数据分布以合成相似的数据样本,扩充训练数据集。然而,这一过程通常会面临网络难训练以及合成样本与期望合成样本质量存在偏差的问题。进一步,针对数据分布差异的问题,直观的解决方案是借助已知领域所学到的知识用于目标未知任务的预测和辨识,在领域间的分布偏差较小时,这种解决方案是成本最小收益较大的方法,然而,当不同领域间存在较大数据分布差异的情况下,原有已训练的诊断模型的预测精度将会受到严重影响,造成许多分类混淆,无法有效辨识机械装备的健康状态,导致严重的误诊和误判。归纳上述问题可以看出:常规诊断模型在应对可用样本匮乏以及分布偏差较大的诊断任务时,难以获取满意的诊断效果,有必要探索和开发提升模型诊断性能的增强泛化智能诊断模型。
发明内容
本发明需要解决的技术问题是在原型网络中引入多尺度注意力机制,增强原型网络对不同感受野下的信息调控能力,使其能够捕获最佳感受野下的特征信息;通过利用模型预测未知目标样本并赋予伪标签,依据预测的概率分数分布,筛选较高置信度的伪标签作为未知样本的真实标签,进而拉近已知训练样本和赋予伪标签测试样本间原型的距离实现分布匹配;使用以模型预测偏差为置信度的高置信原型适配技术,确保能够以较为精准的为目标域的无标签样本提供可靠的预测模型,使训练出的模型能够更为有效地辨识设备的健康状态。
为解决上述问题,本发明提供一种基于多尺度注意力的原型适配网络的机械设备故障诊断方法,其包括以下步骤:
S1、针对具有多种不同健康状态的机械设备,采集M种不同工况下的振动监测数据,获得M种不同工况的振动监测数据集{X,Y},X为振动监测数据,Y为振动监测数据的标签;
S2、在M种不同工况的振动监测数据集{X,Y}中选取其中一个工况的监测数据集作为训练集,即源领域,并选取第二工况的监测数据集作为测试集,即目标域,构建一组包含训练集和测试集的诊断任务;
S3、对作为源领域的训练集和作为目标域的测试集的数据进行数据标准化,构建标准化的训练数据集和测试数据集;
S4、建立基于多尺度注意力的原型适配网络的机械设备故障诊断模型,所述机械设备故障诊断模型的网络架构采用一维卷积神经网络搭建,包括一个卷积特征提取网络以及一个多尺度注意力模块组成编码网络结构,其中,卷积特征提取网络结构包含四个卷积层、非线性激活函数、BatchNorm标准化层、池化层以及一个多尺度注意力模块,具体建立过程包括以下步骤:
S41、构建诊断模型在有监督训练阶段的Episode数据集,在标准化后的训练集的每类中随机选择K个样本组成支撑集S,在每类的剩余样本中随机筛选一定量的样本组成查询集Q;
S42、构建多尺度注意力原型网络,获取多尺度注意力原型网络损失函数;所述多尺度注意力原型网络包含一个特征编码器、一个多尺度注意力模块以及一个有监督损失;利用步骤S41中获得的支撑集S和查询集Q对多尺度注意力原型网络进行训练,获得训练完成的类原型嵌入表示,获取源领域类原型的嵌入表示以及多尺度注意力原型网络损失函数/>其中μ为原型表示,s表示源领域,C为类别数,c为类别序号;
S43、为测试集样本分配伪标签,利用步骤S42中获得的原型表示为每个测试集中无标签样本分配伪标签,获得带有伪标签的测试集样本其中/>为测试集样本,/>为对应样本的伪标签,i为样本序号,t表示目标领域,nt为目标领域样本数;
S44、评估伪标签预测偏差,自适应筛选伪标签;计算训练集中查询集样本和步骤S43中已分配伪标签测试集样本的相似度,利用SoftMax函数转换为概率分布;在步骤S42中获得了训练集类原型和查询集样本相似度的概率分数分布,通过KL散度在类级别计算训练集中查询集样本和步骤S43中已分配伪标签测试集样本相似度的概率分数分布与在步骤S42中得到的训练集类原型和查询集样本相似度的概率分数分布的差异,并采用指数操作将其约束在[0,1]的区间内,将计算结果作为伪标签筛选的置信阈值,获得符合当前网络预测的伪标签测试样本集;
S45、跨域原型匹配,获取原型适配损失函数;计算测试集中伪标签对应样本的嵌入类原型表示即伪原型表示在此基础上计算训练集原型表示与测试集伪原型表示的相似度,并将此相似度作为原型适配过程损失函数/>以在类级别约束源领域和目标领域的数据分布差异;
S46、总体损失优化,确定总体损失函数;结合步骤S42多尺度注意力原型网络约束损失和步骤S45中基于预测偏差估计的原型跨域适配损失,获得基于多尺度注意力的原型适配预诊断模型的总体损失函数,总体优化目标为:
式中:为总体损失函数;α和β为权重系数;/>为多尺度注意力原型网络损失函数;/>为原型适配损失函数;
S47、使用Adam梯度下降方法优化步骤S45中的总体优化目标,当步骤S45中获得的总体优化目标最小或达到设定的迭代次数时,获得基于多尺度注意力的原型适配诊断模型;否则重复步骤S41-S47;
S5、将采集到的机械设备的振动监测数据输入步骤S46中获得的基于多尺度注意力的原型适配网络的机械设备故障诊断模型中,进行健康状态辨识。
进一步,所述步骤S42中的多尺度注意力原型网络损失函数为:
式中:nq为查询集样本个数;c为样本所属类别;p(*)为预测概率;为查询集第i个样本;/>为样本/>的真实标签;d为相似度计算函数,其中/> 为支撑集第i个样本;θe为可训练的网络参数;|Dc|为送入网络的支撑集样本数。
进一步,所述步骤S3为测试集未知样本分配伪标签,这一过程表示为:
式中:表示输入的测试集样本;/>表示样本/>的预测标签;Xt表示测试数据集;通过计算测试集无标注样本与训练集原型的相似度,为测试集样本分配伪标签,获取伪标签测试数据集/>
进一步,所述步骤S44中的伪原型表示计算表示为:
式中:为测试集中第c类样本,f(*)表示编码网络的前向计算过程;为确保能够自适应的获取高置信伪标签,根据伪标签的预测偏差估计筛选伪标签的置信阈值;首先需获取源领域中类原型与查询集样本的相似度概率分数分布/>在此基础上获取源领域中查询集样本与测试集伪原型表示的相似度概率分数分布/>利用KL散度计算两个概率分布的相似度以获取伪标签的预测偏差,表示为:
式中:DKL(*)为KL散度;为第c类训练集的第i个样本的相似度概率分数分布;为第c类测试集的第i个样本的相似度概率分数分布;根据所获取的预测相似度偏差计算每类样本的伪标签置信阈值,这一过程表示为:
式中:mc为类别c的伪标签筛选置信阈值;nρ为第c类的查询集样本数;为第c类的概率分数分布KL散度。
进一步,所述步骤S45中的高置信原型适配过程损失函数为:
优选的,所述步骤S1中的机械设备包括滚动轴承。
优选的,所述滚动轴承采样频率为10kHz。
优选的,所述步骤S3中的标准化过程具体表示为:
式中:xi为第i个数据样本;为xi的平均值;σi为xi的标准差;xi(j)为xi的第j个样本点。
与现有技术相比,本发明具有以下有益效果:
(1)本发明直接以原始振动监测数据作为模型输入,自适应的提取设备的高维健康状态信息表征,构建了一种端到端的智能诊断框架,减轻了对复杂信号处理和领域内专家知识的依赖。
(2)本发明解决了可用数据量匮乏与数据分布差异耦合的问题,一方面通过将多尺度注意力机制引入原型网络增强对有限数据的特征提取能力,另一方面,构造自适应高置信伪标签筛选和跨域原型适配加权策略提升跨域分布对齐的能力。
(3)本发明提出了更为细粒度的跨域分布对齐策略,并且能够根据每一类的预测偏差对损失函数加权。实现了多运行工况、目标样本无标注下的复杂机械设备的健康状态辨识,弥补了常规智能诊断模型的不足,有效提升了故障识别的准确率。
附图说明
图1为本发明基于多尺度注意力的高置信原型适配网络的机械只能故障诊断方法流程图;
图2为本发明基于多尺度注意力的高置信原型适配网络的机械设备故障诊断模型的训练步骤流程图;
图3为本发明实施例中的MAHCPAN的特征生成器的网络结构及参数设置;
图4为本发明实施例中MAHCPAN的多尺度注意力模块的结构及参数设置;
图5为本发明实施例中MAHCPAN生成训练样本原型表示和测试样本的伪标记原型表示流程简图;
图6为本发明实施例中MAHCPAN进行高置信原型适配过程简图;
图7为本发明实施例中滚动轴承实验装置示意图。
附图中的部分附图说明如下:
1-驱动电机;2-联轴器;3-行星齿轮箱;4-两级平行轴齿轮箱;5-转速转矩传感器;6-轴承座;7-振动传感器;8-磁粉制动器。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。需要理解的是,此处所描述的具体实施例仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。附图中相同的附图标记表示功能相同或相似的元件,尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
图1示出了本发明实例提供了一种基于多尺度注意力的原型适配网络的机械设备故障诊断方法,具体步骤包括:
S1、针对具有多种不同健康状态的机械设备,分别在M种不同工况下采集机械设备的振动监测数据,采集的M种不同工况的振动监测数据集可表示为:{X,Y},其中d表示单个样本的维度,n表示样本个数,X={x1,x2,...,xn}为振动监测数据集,/>Y={y1,y2,...,yn}为振动监测数据的标签集。
S2、在步骤S1中M种不同工况的振动监测数据集{X,Y}中任意选取一个工况的监测数据和标签集{XS,YS}作为训练集,即源领域,再任意选取第二工况的监测数据和标签集{XT,YT}作为测试集,即目标域,其中{XT,YT}用于算法的验证,构建一组包含训练集和测试集的诊断任务;训练数据集表示为:其中,/>上标s表示源领域,Ns表示训练集样本数;/>表示训练集的第i个样本;/>表示样本/>对应的标签。测试数据集表示为:/>其中,上标t表示目标领域,Nt表示测试集样本数,/>表示测试集的第i个样本;上述训练集为有标签样本集,测试集为无标签样本集,不同工况的数据可以任意组合构造诊断任务并进行交叉验证。
S3、对步骤S2中获得的源领域训练样本集和目标领域测试样本集的数据进行数据标准化,构建标准化的训练和测试样本数据集,标准化过程表示为:
式中:xi为第i个数据样本;为xi的平均值;σi为xi的标准差;xi(j)为xi的第j个样本点。
S4、构建MAHCPAN框架,使用标准化的训练集和测试集样本共同训练MAHCPAN的编码网络结构,结合多尺度注意力和自适应高置信原型匹配策略,构建基于MAHCPAN的机械设备故障诊断模型,图2为基于MAHCPAN的机械设备故障诊断模型训练步骤流程图,具体步骤如下:
S41、构建诊断模型在有监督训练阶段的Episode数据集。首先在训练集的每类中随机选择K个样本组成支撑集S,其中 表示支撑集中的第i个样本,为样本/>对应的标签,nk为支撑集中每类样本个数,在每类的剩余样本中随机筛选一定量的样本组成查询集Q,其中/> 为查询集第i个样本,/>为样本/>的标签,nρ为查询集中每类样本个数。
S42、构建MAHCPAN框架,获取多尺度注意力原型网络损失函数;该框架的特征编码网络结构源于原型网络,该网络架构主要采用一维卷积神经网络搭建,由一个卷积特征提取网络以及一个多尺度注意力模块组成编码网络结构,其中,卷积特征提取网络结构包含四个卷积层、非线性激活函数、BatchNorm标准化层、池化层以及一个多尺度注意力模块。如图3所示为MAHCPAN的编码网络的结构及参数设置,其中,Input表示信号输入维度,“ConvChannel:32”表示卷积层通道数为32,“Kernel:32×1”表示卷积核尺寸为32×1,padding表示填充操作,“stride“表示池化运算的滑移步长伪2,“Maxpool:2×1”表示最大池化操作,“BN”表示批量标准化操作,“Flatten”表示展平操作。图4为多尺度注意力模块的结构及参数设置。利用步骤S41获取的支撑集和查询集训练初始多尺度注意力原型网络,获取训练集样本的原型表示该训练过程的目标优化函数/>可表示为:
式中:nq为查询集样本个数;c为样本所属类别;p(*)为预测概率;为查询集第i个样本;/>为样本/>的真实标签;d为相似度计算函数,其中/> 为支撑集第i个样本;θe为可训练的网络参数;|Dc|为送入网络的支撑集样本数。
首先根据支撑集样本获取每类样本的嵌入原型表示计算查询样本与嵌入原型的相似度概率分布,并计算其负对数概率分布得到分类损失函数表示/>
S43、为测试集样本分配伪标签;利用步骤S42中获得的原型表示为每个测试集中无标签样本分配伪标签,获得带有伪标签的测试集样本这一过程可以表示为:
式中:表示输入的测试集样本;/>表示样本/>的预测标签;Xt表示测试数据集。
通过计算测试集无标注样本与训练集原型的相似度,为测试集样本分配伪标签,获取伪标签测试数据集获取流程如图5所示。
S44、评估伪标签预测偏差,自适应筛选高置信伪标签,具体步骤如图6所示,计算训练集中查询集样本和步骤S43中已分配伪标签测试集样本的相似度,利用SoftMax函数转换为概率分数分布;在步骤S42中可以得到类原型和查询集样本相似度的概率分数分布,通过KL散度在类级别计算两个概率分数分布的差异,并采用指数操作将其约束在[0,1]的区间内,将计算结果作为伪标签筛选的阈值,得到符合当前网络预测的高置信伪标签测试样本集;其中,伪原型的计算过程可表示为:
式中:为测试集中第c类样本,f(*)表示编码网络的前向计算过程。
进一步,为确保能够自适应的获取高置信伪标签,根据伪标签的预测偏差估计筛选伪标签的置信阈值;首先需获取源领域中类原型与查询集样本的相似度概率分数分布在此基础上获取源领域中查询集样本与测试集伪原型表示的相似度概率分数分布/>利用KL散度计算两个概率分布的相似度以获取伪标签的预测偏差,表示为:
式中:DKL(*)为KL散度;为第c类训练集的第i个样本的相似度概率分数分布;为第c类测试集的第i个样本的相似度概率分数分布。
更进一步,根据所获取的预测相似度偏差计算每类样本的伪标签置信阈值,这一过程表示为:
式中:mc为类别c的伪标签筛选置信阈值;nρ为第c类的查询集样本数;为第c类的概率分数分布KL散度。
S45、跨域原型匹配,获取高置信原型适配损失函数;根据步骤S42中计算得到的训练集样本原型以及步骤S44中计算得到的测试集高置信伪原型/>计算训练集原型和测试集高置信伪原型的相似度,表示为/>在此基础上,根据步骤S44中计算得到的伪标签筛选置信阈值hc为每类原型的相似度计算赋予自适应权重。因此高置信原型适配过程的损失函数/>表示为:
S46、总体损失优化,确定总体损失函;结合步骤S42多尺度注意力原型网络约束损失和步骤S45中基于预测偏差估计的高置信原型跨域适配损失,获得基于多尺度注意力的高置信原型适配预诊断模型的总体损失函数,总体优化目标为:
式中:为总体损失函数;α和β为平衡参数;/>为多尺度注意力原型网络损失函数;/>为高置信原型适配损失函数。
S47、使用Adam梯度下降方法优化步骤S45中的总体优化目标,当步骤S45中获得的总体优化目标最小或达到设定的迭代次数时,获得基于多尺度注意力的高置信原型适配诊断模型;否则重复步骤S41-47。
S5、将采集到的机械设备的振动监测数据输入步骤S46获得的基于多尺度注意力的高置信原型适配网络的机械设备故障诊断模型中,进行健康状态辨识。
以下提供具体实施例,该实施例中机械设备为滚动轴承,采集滚动轴承的监测数据采样频率为64kHz。
在实施例验证的过程中,选取传统智能诊断方法作为参照,基于卷积神经网络的诊断方法(Convolutional Neural Network,CNN),基于最大均值差异的领域适配方法(Maximum Mean Discrepancy,MMD),基于对抗领域适配的诊断方法(Domain AdversarialNeural Network,DANN),基于原型网络的诊断方法(Prototypical Network,ProtoNet),与本发明进行比较以得到更有说服力的验证结果。其中CNN是深度学习用于智能故障诊断领域的典型代表,根据标准的智能故障诊断流程,首先使用有标注的训练集样本进行有监督网络训练,然后对测试集无标记数据进行测试。为保证对比的一致性,CNN网络的特征提取部分与MAHCPAN的卷积结构部分相同。MMD是一种基于显式统计矩约束领域间分布差异的代表性领域适配方法,网络结构与CNN相同。DANN是一种基于对抗博弈思想的隐式跨域分布对齐的代表性领域适配方法,其特征提取部分与CNN一致,判别器结构为三层全连接结构。ProtoNet网络源于小样本中的原型网络,本发明的对比中,该网络的测试采用训练集原型作为分类器,特征提取部分与CNN相同。
将本发明应用到滚动轴承故障诊断实施例进行验证。
具体应用到滚动轴承故障诊断,本发明采用传动试验台轴承数据进行实施例验证,实验台示意图如图7所示,该试验台由驱动电机,联轴器,行星齿轮箱减速器,平行轴减速器,转速转矩传感器,轴承座,振动传感器,磁粉制动器组成。该试验台的动力由驱动电机1提供。本发明使用采样频率为10kHz的振动数据进行分析。滚动轴承的健康状态包括正常、外圈磨损、外圈裂纹、内外圈裂纹、内圈磨损、内圈裂纹、保持架故障,共计六种健康状态。其中每种健康状态的轴承样本在三种运行工况下(B0,B1,B2)进行采集,其中转速设置为1200rpm;B0的负载转矩为0.7Nm,B1的负载转矩为2Nm,B2的负载转矩为5Nm。。为满足样本数量稀少的条件,每种健康状态的轴承在每种工况下共获取100个时域信号样本,每个样本包含1024个数据点。根据运行工况的不同,总共构建了6种故障诊断任务。其中B0-B1表示使用在工况B0下获取的样本集作为训练集,将B1工况下获取得样本集作为测试集。
基于已采集得到得振动信号数据集,经过模型端到端的训练和测试,最终得到的针对轴承诊断实施例各种方法的分类精度及标准差如表1所示。从该结果可以看出,MAHCPAN在所有诊断任务中都达到了超过88%的分类精度,且标准差在相同测试条件下均较小,在任务B2-B0中达到了最高的92.36%诊断精度,总体平均诊断精度达到88.43%,优于对比方法。此外,根据诊断任务的不同,以CNN诊断结果为参考基准,任务B0-B2与B2-B0难度较大,在这种情况下,MAHCPAN方法依然获得了较高的诊断精度,进一步说明了该方法的优越诊断性能。因此,MAHCPAN能够在样本稀少且分布偏差较大的情况下实现较高的健康状态辨识精度。
表1
本发明提供的基于多尺度注意力的高置信原型适配网络机械故障诊断模型,直接以原始有限的时域振动信号作为输入,自适应地提取健康状态信息并进行准确预测,形成了一种端到端的智能化机械故障诊断方法,减轻了对专家诊断经验和规模化训练数据量的依赖;充分利用了数据本身的结构和高维特征信息,一方面构建多尺度注意力原型网络增强网络的特征挖掘能力,另一方面构建基于高置信伪标签筛选的原型适配策略,有效增强了网络对有限监测数据、多运行工况、无标注测试样本下的复杂机械健康状态辨识。
以上的实施例仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。
Claims (8)
1.一种基于多尺度注意力的原型适配网络的机械设备故障诊断方法,其特征在于,其包括以下步骤:
S1、针对具有多种不同健康状态的机械设备,采集M种不同工况下的振动监测数据,获得M种不同工况的振动监测数据集{X,Y},X为振动监测数据,Y为振动监测数据的标签;
S2、在M种不同工况的振动监测数据集{X,Y}中选取其中一个工况的监测数据集作为训练集,即源领域,并选取第二工况的监测数据集作为测试集,即目标域,构建一组包含训练集和测试集的诊断任务;
S3、对作为源领域的训练集和作为目标域的测试集的数据进行数据标准化,构建标准化的训练数据集和测试数据集;
S4、建立基于多尺度注意力的原型适配网络的机械设备故障诊断模型,所述机械设备故障诊断模型的网络架构采用一维卷积神经网络搭建,包括一个卷积特征提取网络以及一个多尺度注意力模块组成编码网络结构,其中,卷积特征提取网络结构包含四个卷积层、非线性激活函数、BatchNorm标准化层、池化层以及一个多尺度注意力模块,具体建立过程包括以下步骤:
S41、构建诊断模型在有监督训练阶段的Episode数据集,在标准化后的训练集的每类中随机选择K个样本组成支撑集S,在每类的剩余样本中随机筛选一定量的样本组成查询集Q;
S42、构建多尺度注意力原型网络,获取多尺度注意力原型网络损失函数;所述多尺度注意力原型网络包含一个特征编码器、一个多尺度注意力模块以及一个有监督损失;利用步骤S41中获得的支撑集S和查询集Q对多尺度注意力原型网络进行训练,获得训练完成的类原型嵌入表示,获取源领域类原型的嵌入表示以及多尺度注意力原型网络损失函数/>其中μ为原型表示,s表示源领域,C为类别数,c为类别序号;
S43、为测试集样本分配伪标签,利用步骤S42中获得的原型表示为每个测试集中无标签样本分配伪标签,获得带有伪标签的测试集样本其中/>为测试集样本,为对应样本的伪标签,i为样本序号,t表示目标领域,nt为目标领域样本数;
S44、评估伪标签预测偏差,自适应筛选伪标签;计算训练集中查询集样本和步骤S43中已分配伪标签测试集样本的相似度,利用SoftMax函数转换为概率分布;在步骤S42中获得了训练集类原型和查询集样本相似度的概率分数分布,通过KL散度在类级别计算训练集中查询集样本和步骤S43中已分配伪标签测试集样本相似度的概率分数分布与在步骤S42中得到的训练集类原型和查询集样本相似度的概率分数分布的差异,并采用指数操作将其约束在[0,1]的区间内,将计算结果作为伪标签筛选的置信阈值,获得符合当前网络预测的伪标签测试样本集;
S45、跨域原型匹配,获取原型适配损失函数;计算测试集中伪标签对应样本的嵌入类原型表示即伪原型表示在此基础上计算训练集原型表示与测试集伪原型表示的相似度,并将此相似度作为原型适配过程损失函数/>以在类级别约束源领域和目标领域的数据分布差异;
S46、总体损失优化,确定总体损失函数;结合步骤S42多尺度注意力原型网络约束损失和步骤S45中基于预测偏差估计的原型跨域适配损失,获得基于多尺度注意力的原型适配预诊断模型的总体损失函数,总体优化目标为:
式中:为总体损失函数;α和β为权重系数;/>为多尺度注意力原型网络损失函数;为原型适配损失函数;
S47、使用Adam梯度下降方法优化步骤S45中的总体优化目标,当步骤S45中获得的总体优化目标最小或达到设定的迭代次数时,获得基于多尺度注意力的原型适配诊断模型;否则重复步骤S41-S47;
S5、将采集到的机械设备的振动监测数据输入步骤S46中获得的基于多尺度注意力的原型适配网络的机械设备故障诊断模型中,进行健康状态辨识。
2.根据权利要求1所述的基于多尺度注意力的原型适配网络的机械设备故障诊断方法,其特征在于,所述步骤S42中的多尺度注意力原型网络损失函数为:
式中:nq为查询集样本个数;c为样本所属类别;p(*)为预测概率;为查询集第i个样本;/>为样本/>的真实标签;d为相似度计算函数,其中/> 为支撑集第i个样本;θe为可训练的网络参数;|Dc|为送入网络的支撑集样本数。
3.根据权利要求1所述的基于多尺度注意力的原型适配网络的机械设备故障诊断方法,其特征在于,所述步骤S43为测试集未知样本分配伪标签,表示为:
式中:表示输入的测试集样本;/>表示样本/>的预测标签;Xt表示测试数据集;通过计算测试集无标注样本与训练集原型的相似度,为测试集样本分配伪标签,获取伪标签测试数据集/>
4.根据权利要求1所述的基于多尺度注意力的原型适配网络的机械设备故障诊断方法,其特征在于,所述步骤S44中的伪原型表示计算表示为:
式中:为测试集中第c类样本,f(*)表示编码网络的前向计算过程;为确保能够自适应的获取伪标签,根据伪标签的预测偏差估计筛选伪标签的置信阈值;首先需获取源领域中类原型与查询集样本的相似度概率分数分布/>在此基础上获取源领域中查询集样本与测试集伪原型表示的相似度概率分数分布/>利用KL散度计算两个概率分布的相似度以获取伪标签的预测偏差,表示为:
式中:DKL(*)为KL散度;为第c类训练集的第i个样本的相似度概率分数分布;/>为第c类测试集的第i个样本的相似度概率分数分布;根据所获取的预测相似度偏差计算每类样本的伪标签置信阈值,这一过程表示为:
式中:mc为类别c的伪标签筛选置信阈值;nρ为第c类的查询集样本数;为第c类的概率分数分布KL散度。
5.根据权利要求1所述的基于多尺度注意力的原型适配网络的机械设备故障诊断方法,其特征在于,所述步骤S45中的原型适配过程损失函数为:
6.根据权利要求1所述的基于多尺度注意力的原型适配网络的机械设备故障诊断方法,其特征在于,所述步骤S1中的机械设备包括滚动轴承。
7.根据权利要求6所述的基于多尺度注意力的原型适配网络的机械设备故障诊断方法,其特征在于,所述滚动轴承采样频率为10kHz。
8.根据权利要求1所述的基于多尺度注意力的原型适配网络的机械设备故障诊断方法,其特征在于,所述步骤S3中的构建标准化的过程具体表示为:
式中:xi为第i个数据样本;为xi的平均值;σi为xi的标准差;xi(j)为xi的第j个样本点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211298191.5A CN115508073B (zh) | 2022-10-21 | 2022-10-21 | 基于多尺度注意力的原型适配机械设备故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211298191.5A CN115508073B (zh) | 2022-10-21 | 2022-10-21 | 基于多尺度注意力的原型适配机械设备故障诊断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115508073A CN115508073A (zh) | 2022-12-23 |
CN115508073B true CN115508073B (zh) | 2024-04-26 |
Family
ID=84509629
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211298191.5A Active CN115508073B (zh) | 2022-10-21 | 2022-10-21 | 基于多尺度注意力的原型适配机械设备故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115508073B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116894215B (zh) * | 2023-07-20 | 2024-03-12 | 江南大学 | 一种基于半监督动态图注意的齿轮箱故障诊断方法 |
CN117708694B (zh) * | 2023-11-15 | 2024-09-20 | 佛山科学技术学院 | 自适应原型网络与伪标签的半监督学习的诊断方法及设备 |
CN117290742B (zh) * | 2023-11-27 | 2024-03-29 | 北京航空航天大学 | 一种基于动态聚类的信号时序数据故障诊断方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110866365A (zh) * | 2019-11-22 | 2020-03-06 | 北京航空航天大学 | 基于部分迁移卷积网络的机械设备智能故障诊断方法 |
CN114528906A (zh) * | 2021-12-30 | 2022-05-24 | 爱普(福建)科技有限公司 | 一种旋转机械的故障诊断方法、装置、设备和介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6837893B2 (ja) * | 2017-03-31 | 2021-03-03 | 住友重機械工業株式会社 | 故障診断システム |
-
2022
- 2022-10-21 CN CN202211298191.5A patent/CN115508073B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110866365A (zh) * | 2019-11-22 | 2020-03-06 | 北京航空航天大学 | 基于部分迁移卷积网络的机械设备智能故障诊断方法 |
CN114528906A (zh) * | 2021-12-30 | 2022-05-24 | 爱普(福建)科技有限公司 | 一种旋转机械的故障诊断方法、装置、设备和介质 |
Non-Patent Citations (1)
Title |
---|
大数据下机械装备故障的深度迁移诊断方法;雷亚国;杨彬;杜兆钧;吕娜;;机械工程学报;20190125(第07期);17-24 * |
Also Published As
Publication number | Publication date |
---|---|
CN115508073A (zh) | 2022-12-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115508073B (zh) | 基于多尺度注意力的原型适配机械设备故障诊断方法 | |
CN109635677B (zh) | 基于多标签分类卷积神经网络的复合故障诊断方法及装置 | |
CN110942101B (zh) | 基于深度生成式对抗网络的滚动轴承剩余寿命预测方法 | |
CN108178037A (zh) | 一种基于卷积神经网络的电梯故障识别方法 | |
CN113837000A (zh) | 一种基于任务排序元学习的小样本故障诊断方法 | |
CN113780292A (zh) | 一种基于证据推理的语义分割网络模型不确定性量化方法 | |
CN117034123B (zh) | 健身器材的故障监控系统及其方法 | |
CN112784920A (zh) | 云边端协同的旋转部件对抗域自适应故障诊断方法 | |
CN117158904B (zh) | 基于行为分析的老年人认知障碍检测系统及方法 | |
CN115290326A (zh) | 一种滚动轴承故障智能诊断方法 | |
CN116704431A (zh) | 水污染的在线监测系统及其方法 | |
CN116007937B (zh) | 一种机械设备传动部件智能故障诊断方法及装置 | |
CN116026569A (zh) | 释放源数据的机械设备无监督迁移智能故障诊断方法 | |
CN115204272A (zh) | 基于多采样率数据的工业系统故障诊断方法与设备 | |
CN115859777A (zh) | 一种多故障模式下产品系统寿命预测的方法 | |
CN116467577A (zh) | 基于mtf和改进密集连接网络的风机齿轮箱故障诊断方法 | |
CN115861246A (zh) | 应用于工业互联网的产品质量异常检测方法及其系统 | |
CN113469013B (zh) | 一种基于迁移学习和时间序列的电机故障预测方法及系统 | |
CN118094342A (zh) | 旋转机械无监督域自适应故障诊断方法及系统 | |
CN117079017A (zh) | 可信的小样本图像识别分类方法 | |
CN115587299A (zh) | 一种可迁移的多尺度旋转机械故障诊断方法及系统 | |
CN114004295B (zh) | 一种基于对抗增强的小样本图像数据拓展方法 | |
CN115217534A (zh) | 一种汽轮机服役质量状态监测方法及系统 | |
CN114941890A (zh) | 一种基于图像和深度模糊的中央空调故障诊断方法及系统 | |
CN114881073B (zh) | 一种变工况滚动轴承分段式故障诊断方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |