CN117786507A - 全局和局部特征耦合指导的滚动轴承未知故障检测方法 - Google Patents
全局和局部特征耦合指导的滚动轴承未知故障检测方法 Download PDFInfo
- Publication number
- CN117786507A CN117786507A CN202410210595.7A CN202410210595A CN117786507A CN 117786507 A CN117786507 A CN 117786507A CN 202410210595 A CN202410210595 A CN 202410210595A CN 117786507 A CN117786507 A CN 117786507A
- Authority
- CN
- China
- Prior art keywords
- global
- local
- feature
- features
- branch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000008878 coupling Effects 0.000 title claims abstract description 37
- 238000010168 coupling process Methods 0.000 title claims abstract description 37
- 238000005859 coupling reaction Methods 0.000 title claims abstract description 37
- 238000001514 detection method Methods 0.000 title claims abstract description 31
- 238000005096 rolling process Methods 0.000 title claims abstract description 19
- 238000000034 method Methods 0.000 claims abstract description 65
- 230000001364 causal effect Effects 0.000 claims abstract description 63
- 238000012549 training Methods 0.000 claims abstract description 29
- 238000000605 extraction Methods 0.000 claims description 21
- 239000013598 vector Substances 0.000 claims description 19
- 230000003993 interaction Effects 0.000 claims description 17
- 238000013507 mapping Methods 0.000 claims description 10
- 238000009826 distribution Methods 0.000 claims description 8
- 230000004927 fusion Effects 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 7
- 238000010586 diagram Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 6
- 238000005259 measurement Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000005065 mining Methods 0.000 claims description 2
- 230000000452 restraining effect Effects 0.000 claims 1
- 238000003745 diagnosis Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000013140 knowledge distillation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本发明属于故障检测技术领域,公开了全局和局部特征耦合指导的滚动轴承未知故障检测方法,包括预训练阶段,使用伪孪生网络进行预训练,提取尺度耦合特征;使用有标签的数据监督调整阶段;故障新类发现阶段,在未标记数据上训练全局和局部耦合特征指导的未知故障检测模型:通过全局特征学习分支和局部特征学习分支学习全局特征和局部特征,建模全局‑局部特征结构因果图,以捕获故障振动信号中全局特征、局部特征和故障类别之间的真实因果关系;通过一致性预测方法约束全局特征学习分支和局部特征学习分支的预测结果,使全局特征学习分支和局部特征学习分支对同一样本的预测结果保持一致。
Description
技术领域
本发明属于故障检测技术领域,特别涉及全局和局部特征耦合指导的滚动轴承未知故障检测方法。
背景技术
滚动轴承故障检测能够在早期发现轴承故障,预防故障的进一步发展,在机械设备、汽车工业、核电能源等领域广泛应用。但由于设备的高安全可靠运行需求,使发生故障的样本稀少。目前,许多基于深度学习的故障诊断方法已针对该问题进行了研究,比如基于自动编码器的故障诊断方法,基于孪生神经网络的少样本学习方法,基于迁移学习的故障诊断方法等。但这些方法没有考虑新的故障发生时,模型如何识别未知的故障。未知故障检测是指给定一个已知的故障样本集和一个未知的故障样本集(这两个样本集的类别不重叠),利用从已知的类故障样本中学习到的知识来发现未知的类样本的新故障。
而且这些方法存在以下问题:第一,没有充分挖掘故障样本的时空分布不平衡特性,过多的关注全局特征忽略了局部特征的影响,全局特征和局部特征对故障类别的影响并不总是相同,故障可能由全局特征引发,也可能由局部特征引发。现在的故障检测方法大多仅利用全局特征进行检测或者仅利用局部特征进行故障检测。因此,需要同时挖掘全局特征和局部特征对故障类别的影响。第二,没有挖掘全局、局部特征与故障类别的真实因果关系,没有剔除设备故障样本中的混杂特征。模型在学习特征跟故障类别的关系时,不可避免的受到混杂特征(例如,故障样本中的正常信号会成为冗余信息)的影响。例如,对于全局特征,数据样本并不总是故障部分,包括有故障和正常的特征,正常的特征会干扰模型的判断。对于局部特征,除了邻域中的干扰特征,本身也可能是正常特征作为模型的干扰因素。因此,需要挖掘全局、局部特征跟故障类别的真实因果关系。
发明内容
针对现有技术存在的不足,本发明提供一种全局和局部特征耦合指导的滚动轴承未知故障检测方法,将故障诊断问题与新类发现问题一起考虑,将故障数据集划分为已知类的故障数据集和未知类的故障数据集,利用已知类的知识来辅助未知类的聚类过程。通过保持全局和局部知识并且建立全局、局部特征与故障的真实因果关系模型来解决未知故障检测这个问题。
为了解决上述技术问题,本发明采用的技术方案是:
全局和局部特征耦合指导的滚动轴承未知故障检测方法,包括三个阶段,以下步骤:
阶段1,预训练阶段,使用伪孪生网络进行预训练,提取尺度耦合特征:
输入数据是不同尺度的一维振动信号样本,通过尺度耦合特征提取模块建立数据不同尺度之间的相似性关联关系,完成预训练;所述尺度耦合特征提取模块采用基于Transformer的伪孪生网络,具体来说,所述伪孪生网络包括两个结构相同的基于Transformer的特征提取分支和距离度量模块,每个特征提取分支采用Transformer编码器结构,两个分支不共享权重,不同尺度的数据输入到伪孪生网络的两个分支中,通过距离度量模块度量两个分支的输出特征是否属于相同类别来学习尺度间的相似性关系,该相似性关系即尺度间的耦合特征;
阶段2,使用有标签的数据监督调整阶段;
使用预训练阶段训练好的Transformer编码器,在标记数据集上进行监督训练,使其提高对已知类别数据进行分类的能力;
阶段3,故障新类发现阶段,在未标记数据上训练全局和局部耦合特征指导的未知故障检测模型:
故障新类发现阶段的全局和局部耦合特征指导的未知故障检测模型架构包括预训练的Transformer编码器、全局特征学习分支、局部特征学习分支及全局局部特征交互模块,首先将无标记的未知类数据集输入到Transformer编码器中,然后通过全局特征学习分支和局部特征学习分支学习全局特征和局部特征,并通过全局局部特征交互模块挖掘全局特征和局部特征跟故障类别之间的真实因果关系,建模全局-局部特征结构因果图,以捕获故障震动信号中全局特征、局部特征和故障类别之间的真实因果关系;最后通过一致性预测方法约束全局特征学习分支和局部特征学习分支的预测结果,使全局特征学习分支和局部特征学习分支对同一样本的预测结果保持一致。
进一步的,在预训练阶段前,先进行数据集的划分,具体是:将数据集划分为标记数据集和未标记数据集,确保两个数据集的类别不相交,标记数据集包含已知的类标签和对应的样本数,未标记数据集包含未知的样本数。
进一步的,阶段1中,输入数据是一对尺度大小不同的一维故障振动信号样本,分别为大尺度样本X1和小尺度样本X2,其中X2的大小为X1的1/2,将两个尺度的输入数据分别输入到伪孪生网络的两个分支中,每个分支包括嵌入层、N个堆叠的Transformer层、全连接层,在每个分支内,输入的数据样本先通过嵌入层投影到一个线性嵌入矩阵E中,将故障振动信号中时序位置信息Epos进行编码,保持故障信号样本中的位置信息,得到Transformer层的输入特征,Transformer层的输出经过全连接层处理;伪孪生网络的两个分支的输出根据距离度量进行优化,得到输入数据属于相同类别或不同类别的输出结果。
进一步的,每个Transformer层具体结构包括归一化层、多头注意力层和多层感知机,首先将输入特征Fin进行归一化,多头注意力层接收来自归一化后的特征,之后将多头注意力层的输出与输入特征进行残差连接,并将输出进行归一化得到多层感知机的输入,同样在多层感知机后进行残差连接得到下一个Transformer层的输入。
进一步的,伪孪生网络的损失函数可以表示为:
;其中i表示第i个样本对的编号,/>表示输入到第一个分支的样本,/>表示输入到第二个分支的样本,/>表示一个控制因子,当第i个样本对属于同一类别时,等于1,否则为0,即当输入到两个分支的第i个样本对/>和来自于同一个故障类别时,设/>,当/>和/>来自于不同故障类别时,设/>;Y表示伪孪生网络的输出,它的形式为/>,Sigmoid函数的计算形式为,/>;
其中表示输入变量,/>是Transformer网络,/>表示第一个分支的输出,/>表示第二个分支的输出,/>表示两个分支的距离。
进一步的,阶段3中,全局特征学习分支侧重于利用故障样本的整体轮廓信息进行故障判别,局部特征学习分支擅长利用邻域细节信息进行故障判别,两个分支使用共同的transformer编码器提取特征,该transformer编码器在阶段1和阶段2已进行预训练;以全局分支为例,该分支包括一个特征映射层和两个线性头,分别用来分类标记的已知类和无标记的未知类,通过排序统计伪标签生成方法RS生成未标记数据的伪标签,将知识从标记数据转移到未标记数据。
进一步的,阶段3中,使用全局局部特征交互模块来建立全局和局部特征的因果关系,并约束两个分支预测结果的一致性,方法是:输入未标记数据,由transformer编码器处理生成特征,将该特征输入到全局特征学习分支和局部特征学习分支,全局特征学习分支和局部特征学习分支分别利用RS生成特征的伪标签,将两个分支生成的伪标签经过一致性预测模块生成整体的监督标签,用于训练两个分支的损失;两个分支通过全局局部特征交互模块交换信息,利用全局-局部特征结构因果建模挖掘不同特征的因果关系。
进一步的,全局特征学习分支和局部特征学习分支生成伪标签的方法,具体来说,对于全局特征学习分支,给出一对样本和/>,经过特征映射层/>获得特征向量/>,采用特征向量/>经过排序统计伪标签生成方法RS获得成对全局伪标签/>:
;
其中和/>是全局特征学习分支中两个无标记样本的特征向量;
局部特征学习分支通过维护一个先进先出的动态队列,将每个部分实例对象与队列中的特征进行比较来获得部分级排序统计数据;之后,将输入样本的所有部分级排序统计数据通过平均池化融合到一起,得到样本的融合相似向量/>,同理可得到样本/>的相似向量/>,融合相似向量/>可以形式化为:
;
其中n为样本x划分为小块的数量,表示X中的每个局部块特征,V是随机的动态队列,Sim表示/>与V的相似性;
采用融合相似向量经过排序统计伪标签生成方法RS获得成对局部伪标签/>:
;
其中,和/>是局部特征学习分支中两个无标记样本的特征向量。
进一步的,全局-局部特征结构因果关系建模时,使用后门调整方法挖掘故障信号中全局特征Xg、局部特征Xp和故障类别Y之间的真实因果关系,避免受到混杂特征Cg、Cp的影响,后门调整方法具体如下:
后门调整设定可以观察混杂因素并对其进行分层,针对全局特征学习分支,对全局混杂特征Cg进行分层,划分为n个等大小的分层,即,其中每个/>是全局混杂特征Cg知识的一个分层,在每个分层/>中,分别计算全局特征Xg和故障类别Y之间的关系;之后计算所有分层因果效应的平均值,并根据各个特征层在种群中的分布频率进行加权求和;局部特征学习分支按相同方式处理,最终得到全局分支和局部分支整体的因果关系,即真实因果关系/>公式如下:
;
其中cg是对全局混杂特征Cg的分层,cp是对局部混杂特征Cp的分层,P(Cg)是Cg的先验概率,P(Cp)是Cp的先验概率,是全局特征Xg和故障类别Y的因果关系,/>是局部特征Xp和故障类别Y的因果关系。
与现有技术相比,本发明优点在于:
本发明的尺度耦合特征提取模块可以学习不同尺度样本的相似关系,建立全局和局部特征的潜在联系。全局-局部特征交互模块通过全局、局部特征的交互指导来发现新的故障类别。
本发明提出了一种全局-局部特征结构因果关系建模方法。全局、局部特征与故障类别是因果关系建模,可以挖掘与故障发生有关的真实因果特征,去除混杂特征的影响。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的方法流程图;
图2为本发明的尺度耦合特征提取模块示意图;
图3为本发明的新类发现阶段的未知故障检测模型架构图;
图4为干预前全局、局部特征跟故障类别Y的因果关系图;
图5为本发明干预后全局、局部特征跟故障类别Y的真实因果关系。
具体实施方式
下面结合附图及具体实施例对本发明作进一步的说明。
未知故障检测是从已知类别的标记数据集上学习知识,利用学到的知识在未标记数据集上发现新的类别。标记数据集和未标记数据集的类别要求不相交。因此,在未知故障检测任务中,本发明首先进行数据集的划分,具体是:将数据集划分为标记数据集和未标记数据集/>,确保两个数据集的类别不相交,标记数据集包含已知的类标签和对应的样本数,未标记数据集包含未知的样本数。其中/>和/>分别是标记数据集/>和未标记数据集/>中的数据样本。/>是/>中的类标签。N是标记数据集中的样本数,M是未标记数据集中的样本数。
结合图1,本发明提出的全局和局部特征耦合指导的滚动轴承未知故障检测方法,包括三个阶段,预训练阶段、监督调整阶段(使用标记数据集的数据)和新类发现阶段(使用无标记数据集的数据)。
下面分别介绍各个阶段的步骤:
阶段1,预训练阶段,使用伪孪生网络进行预训练,提取尺度耦合特征。
输入数据是不同尺度的一维振动信号样本,通过尺度耦合特征提取模块建立数据不同尺度之间的相似性关联关系,完成预训练。
尽管现有方法在特征提取过程中对多尺度特征学习已经做了很多工作,但这些工作大多是提取多个尺度的特征融合在一起使用,仅是学习了不同尺度的知识,并没有建立不同尺度之间的潜在关系。为了解决这个问题,本发明提出了尺度耦合特征提取模块,该模块建立了不同尺度的相似性关联。
在特征提取阶段,目前故障检测领域大多采用卷积神经网络CNN和循环神经网络RNN提取特征,但由于CNN忽略数据的时序相关性、RNN计算长时序数据代价很大等问题,本发明使用Trasnformer作为特征提取阶段的基础架构。
结合图2所示,尺度耦合特征提取模块采用基于Transformer的伪孪生网络,该模块采用伪孪生网络的思想,利用大尺度的输入数据训练一个子网络分支,利用小尺度的输入数据训练另一个子网络分支,通过度量两个分支的输出特征是否属于相同类别来学习尺度间的相似性。具体来说,所述伪孪生网络包括两个结构相同的基于Transformer的特征提取分支和距离度量模块,每个特征提取分支采用Transformer编码器结构,由于两个分支的输入的不同,两个分支不共享权重,不同尺度的数据输入到伪孪生网络的两个分支中,通过距离度量模块度量两个分支的输出特征是否属于相同类别来学习尺度间的相似性关系,该相似性关系即尺度间的耦合特征。
阶段1中,输入数据是一对尺度大小不同的一维故障振动信号样本,分别为大尺度样本X1和小尺度样本X2,这对样本可能来自相同的类别,也可能是不同的类别。其中X2的大小为X1的1/2,本发明将故障振动信号按照2048的长度、80的移步大小采集大尺度的样本,按照1024的长度、80的移步大小采集小尺度的样本。之后,将两个尺度的输入数据分别输入到伪孪生网络的两个分支中,每个分支包括嵌入层、N个堆叠的Transformer层、全连接层,在每个分支内,输入的数据样本先通过嵌入层投影到一个线性嵌入矩阵E中,将故障振动信号中时序位置信息Epos进行编码,保持故障信号样本中的位置信息,由于位置信息跟嵌入矩阵具有相同的维数,可直接添加到线性嵌入矩阵E中,得到Transformer层的输入特征Fin=E+Epos。Transformer层的输出经过全连接层处理;伪孪生网络的两个分支的输出根据距离度量进行优化,得到输入数据属于相同类别或不同类别的输出结果。
作为一个优选的实施例,每个Transformer层具体结构包括归一化层、多头注意力层和多层感知机,首先将输入特征Fin进行归一化,多头注意力层接收来自归一化后的特征,之后将多头注意力层的输出与输入特征进行残差连接,并将输出进行归一化得到多层感知机的输入,同样在多层感知机后进行残差连接得到下一个Transformer层的输入。
伪孪生网络两个分支根据其输出之间的距离度量进行优化,距离度量公式可以表示为:
;
其中i表示第i个样本对的编号,表示输入到第一个分支的样本,/>表示输入到第二个分支的样本,/>是Transformer网络,/>表示第一个分支的输出,/>表示第二个分支的输出,/>表示两个分支的距离。
因此,伪孪生网络的损失函数可以表示为:
;
其中表示一个控制因子,当第i个样本对属于同一类别时,等于1,否则为0,即当输入到两个分支的第i个样本对/>和/>来自于同一个故障类别时,设/>,当/>和/>来自于不同故障类别时,设/>;Y表示伪孪生网络的输出,它的形式为,Sigmoid函数的计算形式为/>,/>表示输入变量。
阶段2,使用有标签的数据监督调整阶段。
使用预训练阶段训练好的Transformer编码器,在标记数据集上进行监督训练,使其提高对已知类别数据进行分类的能力。
阶段3,故障新类发现阶段,在未标记数据上训练全局和局部耦合特征指导的未知故障检测模型。
本发明的故障新类发现阶段采用全局特征学习分支及局部特征学习分支的双分支结构,全局特征学习分支关注较长范围的数据特征对故障造成的影响(比如内圈故障发生时会出现周期性的振幅变化),局部特征学习分支关注较小的数据特征可能造成的故障(比如外圈故障或滚动体故障出现时可能会有局部的冲击脉冲信号)。尽管两个分支从不同的角度考虑了现实场景中可能发生的故障,但是全局和局部分支特征提取过程学习了过多的冗余特征。例如,对于全局分支,由于学习的数据大多数是正常的,故障信号占比较少,所以全局分支的样本中存在很多冗余信息;对于局部分支,由于局部特征关注细节信息且本身比较小,所以局部特征本身可能是冗余信息。因此,为了挖掘全局特征和局部特征跟故障类别之间的真实因果关系,同时保证全局分支和局部分支的预测一致性,本发明提出了全局-局部特征交互模块。因此,故障新类发现阶段的模型架构图如图3所示。
故障新类发现阶段的全局和局部耦合特征指导的未知故障检测模型架构包括预训练的Transformer编码器、全局特征学习分支、局部特征学习分支及全局局部特征交互模块,首先将无标记的未知类数据集输入到Transformer编码器中,然后通过全局特征学习分支和局部特征学习分支学习全局特征和局部特征,并通过全局局部特征交互模块挖掘全局特征和局部特征跟故障类别之间的真实因果关系,建模全局-局部特征结构因果图,以捕获故障震动信号中全局特征、局部特征和故障类别之间的真实因果关系;最后通过一致性预测方法约束全局特征学习分支和局部特征学习分支的预测结果,使全局特征学习分支和局部特征学习分支对同一样本的预测结果保持一致。
阶段3中,全局特征学习分支侧重于利用故障样本的整体轮廓信息进行故障判别,局部特征学习分支擅长利用邻域细节信息进行故障判别,两个分支使用共同的transformer编码器提取特征,该transformer编码器在阶段1和阶段2已进行预训练;以全局分支为例,该分支包括一个特征映射层和两个线性头,分别用来分类标记的已知类和无标记的未知类,通过排序统计伪标签生成方法RS生成未标记数据的伪标签,将知识从标记数据转移到未标记数据。此处需要说明的是,本发明使用的RS方法是现有技术,方法原理此处不再赘述。
阶段3中,使用全局局部特征交互模块来建立全局和局部特征的因果关系,并约束两个分支预测结果的一致性,方法是:输入未标记数据,由transformer编码器处理生成特征,将该特征输入到全局特征学习分支和局部特征学习分支,全局特征学习分支和局部特征学习分支分别利用RS生成特征的伪标签,将两个分支生成的伪标签经过一致性预测模块生成整体的监督标签,用于训练两个分支的损失;两个分支通过全局局部特征交互模块交换信息,利用全局-局部特征结构因果建模挖掘不同特征的因果关系。
对于图3,和/>表示两个分支的特征映射层,/>和/>为两个分支的特征向量,/>和/>为两个分支的线性头,/>和/>是两个分支的二进制交叉熵损失,RS为排序统计伪标签生成方法,V是局部特征的随机队列,/>为局部特征融合后的特征向量。
结合图3,作为一个具体实施方式,全局特征学习分支和局部特征学习分支生成伪标签的方法,具体来说,对于全局特征学习分支,给出一对样本和/>,经过特征映射层/>获得特征向量/>,采用特征向量/>经过排序统计伪标签生成方法RS获得成对全局伪标签/>:
;
其中和/>是全局特征学习分支中两个无标记样本的特征向量。使用二进制伪标签,之后可以使用未标记数据上的二进制交叉熵损失来训练模型。
对于局部特征学习分支,给出一对样本和/>,经过特征映射层/>获得特征向量,局部特征学习分支通过维护一个先进先出的动态队列,将每个部分实例对象与队列中的特征进行比较来获得部分级排序统计数据;之后,将输入样本的所有部分级排序统计数据通过平均池化融合到一起,得到样本/>的融合相似向量/>,同理可得到样本/>的相似向量/>,融合相似向量/>可以形式化为:
;
其中n为样本x划分为小块的数量,表示X中的每个局部块特征,V是随机的动态队列,Sim表示/>与V的相似性。
采用融合相似向量经过排序统计伪标签生成方法RS获得成对全局伪标签/>,局部伪标签/>获取公式可以表示为:
;
其中,和/>是局部特征学习分支中两个无标记样本的特征向量。
为了使全局特征学习分支和局部特征学习分支得到一致性的预测,将全局特征和局部特征联合训练,将全局特征学习分支获得的伪标签和局部特征学习分支获得的伪标签/>进行融合获得一致性伪标签/>,使用S分别监督两个分支进行训练。因此一致性预测任务可以表示为:
其中和/>分别是全局和局部特征学习分支的二进制交叉熵损失。M是未标记数据集的样本数量,/>和/>是全局特征学习分支中两个无标记样本的特征向量,/>和/>是局部特征学习分支中两个无标记样本的特征向量,/>和/>分别为全局和局部特征学习分支的线性头。
结合图4和图5,作为一个优选的实施例,本发明构造了全局-局部特征的结构因果关系图,图4和图5描述了输入数据D、全局特征Xg、全局混杂特征Cg、局部特征Xp、局部混杂特征Cp以及预测的故障类别Y间的因果关系,图中,圆圈代表对象,箭头代表对象之间的因果关系。图4表示干预前全局、局部特征跟故障类别Y的因果关系,图5表示干预后全局、局部特征跟故障类别Y的真实因果关系。
下面对因果关系图的详细信息展开介绍。
Cg←D→Xg: D表示为故障数据集(即输入数据),Xg是全局特征学习分支中的全局特征。D→Xg表示Xg是通过预训练的Transformer编码器提取的特征,Cg是全局特征中的混杂特征,在这里它通常是故障数据中占比较大的正常信号特征。
Cg→Y←Xg:Y表示为故障类别,对于全局特征学习分支,故障类别Y只由全局特征Xg引起,但不可避免地被混杂特征Cg干扰。
Cp←D→Xp:Xp是局部特征学习分支中的局部特征, D→Xp表示Xp是通过预训练的Transformer编码器提取的局部分支的特征。Cp是局部特征中的混杂特征,它可能是局部特征中的正常信号特征,也可能是局部特征本身。
Cp→Y←Xp:对于局部特征学习分支,故障类别Y应该只由局部特征Xp引起,但被混杂特征Cp干扰。
本发明步骤的目的是捕获故障信号中全局特征Xg、局部特征Xp和故障类别Y之间的真实因果关系,避免受到混淆特征Cg、Cp的影响。期望在复杂的故障环境中,使模型根据故障发生的真实特征做出判断。但是,传统的概率公式无法实现这一点。以全局特征学习分支为例,Y给定Xg的概率不仅由Xg→Y产生,还由D→Cg→Y影响。因此,为了挖掘Xg与Y的真实因果关系,本发明提出使用因果干预来切断混杂特征的影响,如图5所示。
具体来说,本发明使用后门调整方法挖掘故障信号中全局特征Xg、局部特征Xp和故障类别Y之间的真实因果关系,避免受到混杂特征Cg、Cp的影响,后门调整方法具体如下:
后门调整设定可以观察混杂因素并对其进行分层,针对全局特征学习分支,对全局混杂特征Cg进行分层,划分为n个等大小的分层,即,其中每个/>是全局混杂特征Cg知识的一个分层,在每个分层/>中,分别计算全局特征Xg和故障类别Y之间的关系;之后计算所有分层因果效应的平均值,并根据各个特征层在种群中的分布频率进行加权求和;局部特征学习分支按相同方式处理,最终得到全局分支和局部分支整体的因果关系,即真实因果关系/>公式如下:
;
其中cg是对全局混杂特征Cg的分层,cp是对局部混杂特征Cp的分层,P(Cg)是Cg的先验概率,P(Cp)是Cp的先验概率,是全局特征Xg和故障类别Y的因果关系,/>是局部特征Xp和故障类别Y的因果关系。
需要说明的是,本发明在应用时,不仅可以用于滚动轴承未知故障检测,还可以根据需求做参数调整,适用于其他轴承故障检测。
综上所述,本方法与现有方法的不同之处在于:现有的全局和局部分支交互方法,采用两个分支之间的互知识蒸馏方法。在全局和局部分支各自维护一个先进先出的特征库队列,用来存放全局和局部特征。通过比较每个实例与特征库队列的相似性得分分布,并优化两个分布的KL散度来实现全局和局部分支的相互学习。以上方法仅约束了两个分支特征分布的距离,使两个分支产生的预测结果逼近,但是并不能完全保证全局分支和局部分支预测的一致性,也没有充分挖掘全局和局部特征的关联关系。然而,本方法通过全局-局部特征结构因果关系建模挖掘了全局、局部特征跟故障类别的真实因果关系;同时,一致性预测机制从联合监督的视角出发,使两个分支使用共同的均衡监督,保证了两个分支对相同样本的一致预测结果。
也就是说,本发明(1)可以同时挖掘全局特征和局部特征对故障类别的影响。本发明通过全局和局部耦合特征指导的未知故障检测模型,利用尺度耦合特征提取模块在预训练阶段建立全局特征和局部特征的相似关系,将预训练学习到的知识用于全局-局部特征交互模块的新类发现,在该模块中使全局和局部特征进行交互学习,进一步指导未知故障类别的检测。(2)聚焦于全局和局部分支中故障发生的主要因果特征。本发明借鉴因果干预的思想,通过提出因果推理模块来筛选与故障相关的特征,建立全局、局部特征与故障的真实因果关系。利用后门调整观察和分层混杂因素,在每一层混杂特征中学习特征与故障发生的关系。按照每个特征层在总体中的分布频率进行加权求和,得到总体的因果效应。有效的去除混杂特征对模型的影响,保留引起故障的主要因果特征。因此,通过对全局、局部特征与故障类别因果关系的建立,使模型可以更精准的识别故障类别。
当然,上述说明并非是对本发明的限制,本发明也并不限于上述举例,本技术领域的普通技术人员,在本发明的实质范围内,做出的变化、改型、添加或替换,都应属于本发明的保护范围。
Claims (9)
1.全局和局部特征耦合指导的滚动轴承未知故障检测方法,其特征在于,包括三个阶段,以下步骤:
阶段1,预训练阶段,使用伪孪生网络进行预训练,提取尺度耦合特征:
输入数据是不同尺度的一维振动信号样本,通过尺度耦合特征提取模块建立数据不同尺度之间的相似性关联关系,完成预训练;所述尺度耦合特征提取模块采用基于Transformer的伪孪生网络,具体来说,所述伪孪生网络包括两个结构相同的基于Transformer的特征提取分支和距离度量模块,每个特征提取分支采用Transformer编码器结构,两个分支不共享权重,不同尺度的数据输入到伪孪生网络的两个分支中,通过距离度量模块度量两个分支的输出特征是否属于相同类别来学习尺度间的相似性关系,该相似性关系即尺度间的耦合特征;
阶段2,使用有标签的数据监督调整阶段;
使用预训练阶段训练好的Transformer编码器,在标记数据集上进行监督训练,使其提高对已知类别数据进行分类的能力;
阶段3,故障新类发现阶段,在未标记数据上训练全局和局部耦合特征指导的未知故障检测模型:
故障新类发现阶段的全局和局部耦合特征指导的未知故障检测模型架构包括预训练的Transformer编码器、全局特征学习分支、局部特征学习分支及全局局部特征交互模块,首先将无标记的未知类数据集输入到Transformer编码器中,然后通过全局特征学习分支和局部特征学习分支学习全局特征和局部特征,并通过全局局部特征交互模块挖掘全局特征和局部特征跟故障类别之间的真实因果关系,建模全局-局部特征结构因果图,以捕获故障振动信号中全局特征、局部特征和故障类别之间的真实因果关系;最后通过一致性预测方法约束全局特征学习分支和局部特征学习分支的预测结果,使全局特征学习分支和局部特征学习分支对同一样本的预测结果保持一致。
2.根据权利要求1所述的全局和局部特征耦合指导的滚动轴承未知故障检测方法,其特征在于,在预训练阶段前,先进行数据集的划分,具体是:将数据集划分为标记数据集和未标记数据集,确保两个数据集的类别不相交,标记数据集包含已知的类标签和对应的样本,未标记数据集包含未知类别的样本。
3.根据权利要求1所述的全局和局部特征耦合指导的滚动轴承未知故障检测方法,其特征在于,阶段1中,输入数据是一对尺度大小不同的一维故障振动信号样本,分别为大尺度样本X1和小尺度样本X2,其中X2的大小为X1的1/2,将两个尺度的输入数据分别输入到伪孪生网络的两个分支中,每个分支包括嵌入层、N个堆叠的Transformer层、全连接层,在每个分支内,输入的数据样本先通过嵌入层投影到一个线性嵌入矩阵E中,将故障振动信号中时序位置信息Epos进行编码,保持故障信号样本中的位置信息,得到Transformer层的输入特征,Transformer层的输出经过全连接层处理;伪孪生网络的两个分支的输出根据距离度量进行优化,得到输入数据属于相同类别或不同类别的输出结果。
4.根据权利要求3所述的全局和局部特征耦合指导的滚动轴承未知故障检测方法,其特征在于,每个Transformer层具体结构包括归一化层、多头注意力层和多层感知机,首先将输入特征Fin进行归一化,多头注意力层接收来自归一化后的特征,之后将多头注意力层的输出与输入特征进行残差连接,并将输出进行归一化得到多层感知机的输入,同样在多层感知机后进行残差连接得到下一个Transformer层的输入。
5.根据权利要求1所述的全局和局部特征耦合指导的滚动轴承未知故障检测方法,其特征在于,伪孪生网络的损失函数可以表示为:
;其中i表示第i个样本对的编号,/>表示输入到第一个分支的样本,/>表示输入到第二个分支的样本,/>表示一个控制因子,当第i个样本对属于同一类别时,等于1,否则为0,即当输入到两个分支的第i个样本对/>和/>来自于同一个故障类别时,设/>,当/>和/>来自于不同故障类别时,设/>;Y表示伪孪生网络的输出,它的形式为/>,Sigmoid函数的计算形式为,/>;
其中表示输入变量,/>是Transformer网络,/>表示第一个分支的输出,/>表示第二个分支的输出,/>表示两个分支的距离。
6.根据权利要求1所述的全局和局部特征耦合指导的滚动轴承未知故障检测方法,其特征在于,阶段3中,全局特征学习分支侧重于利用故障样本的整体轮廓信息进行故障判别,局部特征学习分支擅长利用邻域细节信息进行故障判别,两个分支使用共同的transformer编码器提取特征,该transformer编码器在阶段1和阶段2已进行预训练;以全局分支为例,该分支包括一个特征映射层和两个线性头,分别用来分类标记的已知类和无标记的未知类,通过排序统计伪标签生成方法RS生成未标记数据的伪标签,将知识从标记数据转移到未标记数据。
7.根据权利要求6所述的全局和局部特征耦合指导的滚动轴承未知故障检测方法,其特征在于,阶段3中,使用全局局部特征交互模块来建立全局和局部特征的因果关系,并约束两个分支预测结果的一致性,方法是:输入未标记数据,由transformer编码器处理生成特征,将该特征输入到全局特征学习分支和局部特征学习分支,全局特征学习分支和局部特征学习分支分别利用RS生成特征的伪标签,将两个分支生成的伪标签经过一致性预测模块生成整体的监督标签,用于训练两个分支的损失;两个分支通过全局局部特征交互模块交换信息,利用全局-局部特征结构因果建模挖掘不同特征的因果关系。
8.根据权利要求7所述的全局和局部特征耦合指导的滚动轴承未知故障检测方法,其特征在于,全局特征学习分支和局部特征学习分支生成伪标签的方法,具体来说,对于全局特征学习分支,给出一对样本和/>,经过特征映射层/>获得特征向量/>,采用特征向量经过排序统计伪标签生成方法RS获得成对全局伪标签/>:
;
其中和/>是全局特征学习分支中两个无标记样本的特征向量;
局部特征学习分支通过维护一个先进先出的动态队列,将每个部分实例对象与队列中的特征进行比较来获得部分级排序统计数据;之后,将输入样本的所有部分级排序统计数据通过平均池化融合到一起,得到样本的融合相似向量/>,同理可得到样本/>的相似向量/>,融合相似向量/>可以形式化为:
;
其中n为样本x划分为小块的数量,表示X中的每个局部块特征,V是随机的动态队列,Sim表示/>与V的相似性;
采用融合相似向量经过排序统计伪标签生成方法RS获得成对局部伪标签/>:
;
其中,和/>是局部特征学习分支中两个无标记样本的特征向量。
9.根据权利要求7所述的全局和局部特征耦合指导的滚动轴承未知故障检测方法,其特征在于,全局-局部特征结构因果关系建模时,使用后门调整方法挖掘故障信号中全局特征Xg、局部特征Xp和故障类别Y之间的真实因果关系,避免受到混杂特征Cg、Cp的影响,后门调整方法具体如下:
后门调整设定可以观察混杂因素并对其进行分层,针对全局特征学习分支,对全局混杂特征Cg进行分层,划分为n个等大小的分层,即,其中每个/>是全局混杂特征Cg知识的一个分层,在每个分层/>中,分别计算全局特征Xg和故障类别Y之间的关系;之后计算所有分层因果效应的平均值,并根据各个特征层在种群中的分布频率进行加权求和;局部特征学习分支按相同方式处理,最终得到全局分支和局部分支整体的因果关系,即真实因果关系/>公式如下:
;
其中cg是对全局混杂特征Cg的分层,cp是对局部混杂特征Cp的分层,P(Cg)是Cg的先验概率,P(Cp)是Cp的先验概率,是全局特征Xg和故障类别Y的因果关系,/>是局部特征Xp和故障类别Y的因果关系。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410210595.7A CN117786507B (zh) | 2024-02-27 | 2024-02-27 | 全局和局部特征耦合指导的滚动轴承未知故障检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410210595.7A CN117786507B (zh) | 2024-02-27 | 2024-02-27 | 全局和局部特征耦合指导的滚动轴承未知故障检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117786507A true CN117786507A (zh) | 2024-03-29 |
CN117786507B CN117786507B (zh) | 2024-04-30 |
Family
ID=90381873
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410210595.7A Active CN117786507B (zh) | 2024-02-27 | 2024-02-27 | 全局和局部特征耦合指导的滚动轴承未知故障检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117786507B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118258547A (zh) * | 2024-05-31 | 2024-06-28 | 远届测控设备(青岛)有限公司 | 一种多工况下的轴类动平衡检测系统和装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113792758A (zh) * | 2021-08-18 | 2021-12-14 | 中国矿业大学 | 一种基于自监督学习和聚类的滚动轴承故障诊断方法 |
CN114399066A (zh) * | 2022-01-15 | 2022-04-26 | 中国矿业大学(北京) | 基于弱监督学习的机械设备预知性维护系统和维护方法 |
US20220327035A1 (en) * | 2020-06-03 | 2022-10-13 | Soochow University | Intra-class adaptation fault diagnosis method for bearing under variable working conditions |
CN115791179A (zh) * | 2022-11-29 | 2023-03-14 | 上海大学 | 基于聚类算法的自监督轴承故障诊断方法 |
WO2023216572A1 (zh) * | 2022-05-07 | 2023-11-16 | 深圳先进技术研究院 | 一种跨视频目标跟踪方法、系统、电子设备以及存储介质 |
CN117407772A (zh) * | 2023-12-13 | 2024-01-16 | 江西师范大学 | 监督对比学习网络模型训练多元时序数据分类方法及系统 |
CN117516937A (zh) * | 2023-10-26 | 2024-02-06 | 中国海洋大学 | 基于多模态特征融合增强的滚动轴承未知故障检测方法 |
CN117592543A (zh) * | 2023-11-13 | 2024-02-23 | 大连理工大学 | 一种基于自监督学习的航空发动机滚动轴承故障诊断方法 |
-
2024
- 2024-02-27 CN CN202410210595.7A patent/CN117786507B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220327035A1 (en) * | 2020-06-03 | 2022-10-13 | Soochow University | Intra-class adaptation fault diagnosis method for bearing under variable working conditions |
CN113792758A (zh) * | 2021-08-18 | 2021-12-14 | 中国矿业大学 | 一种基于自监督学习和聚类的滚动轴承故障诊断方法 |
CN114399066A (zh) * | 2022-01-15 | 2022-04-26 | 中国矿业大学(北京) | 基于弱监督学习的机械设备预知性维护系统和维护方法 |
WO2023216572A1 (zh) * | 2022-05-07 | 2023-11-16 | 深圳先进技术研究院 | 一种跨视频目标跟踪方法、系统、电子设备以及存储介质 |
CN115791179A (zh) * | 2022-11-29 | 2023-03-14 | 上海大学 | 基于聚类算法的自监督轴承故障诊断方法 |
CN117516937A (zh) * | 2023-10-26 | 2024-02-06 | 中国海洋大学 | 基于多模态特征融合增强的滚动轴承未知故障检测方法 |
CN117592543A (zh) * | 2023-11-13 | 2024-02-23 | 大连理工大学 | 一种基于自监督学习的航空发动机滚动轴承故障诊断方法 |
CN117407772A (zh) * | 2023-12-13 | 2024-01-16 | 江西师范大学 | 监督对比学习网络模型训练多元时序数据分类方法及系统 |
Non-Patent Citations (2)
Title |
---|
PEIZHE YIN等: "A Multiscale Graph Convolutional Neural Network Framework for Fault Diagnosis of Rolling Bearing", 《IEEE TRANSACTIONS ON INSTRUMENTATION AND MEASUREMENT》, 4 July 2023 (2023-07-04) * |
赵晓平等: "改进孪生网络在小样本轴承故障诊断中的应用", 《计算机工程与应用》, 31 December 2023 (2023-12-31) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118258547A (zh) * | 2024-05-31 | 2024-06-28 | 远届测控设备(青岛)有限公司 | 一种多工况下的轴类动平衡检测系统和装置 |
CN118258547B (zh) * | 2024-05-31 | 2024-08-23 | 远届测控设备(青岛)有限公司 | 一种多工况下的轴类动平衡检测系统和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN117786507B (zh) | 2024-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Variational attention-based interpretable transformer network for rotary machine fault diagnosis | |
Shen et al. | Dynamic joint distribution alignment network for bearing fault diagnosis under variable working conditions | |
CN111368690B (zh) | 基于深度学习的海浪影响下视频图像船只检测方法及系统 | |
Xu et al. | Recognition of rust grade and rust ratio of steel structures based on ensembled convolutional neural network | |
CN117786507B (zh) | 全局和局部特征耦合指导的滚动轴承未知故障检测方法 | |
CN117520924B (zh) | 基于多模态数据的海岛光伏运维故障原因分析方法及系统 | |
Li et al. | Framework and case study of cognitive maintenance in Industry 4.0 | |
CN114708518A (zh) | 基于半监督学习与先验知识嵌入策略的螺栓缺陷检测方法 | |
CN117516937A (zh) | 基于多模态特征融合增强的滚动轴承未知故障检测方法 | |
CN116030050A (zh) | 基于无人机与深度学习的风机表面缺陷在线检测分割方法 | |
CN111586728A (zh) | 一种面向小样本特征的异构无线网络故障检测与诊断方法 | |
Zhang et al. | Transformer-enabled cross-domain diagnostics for complex rotating machinery with multiple sensors | |
Zhou et al. | Reliable and intelligent fault diagnosis with evidential VGG neural networks | |
Li et al. | A novel remaining useful life transfer prediction method of rolling bearings based on working conditions common benchmark | |
Hao et al. | KDBiDet: A bi-branch collaborative training algorithm based on knowledge distillation for photovoltaic hot-spot detection systems | |
Zan et al. | Defect Identification of Power Line Insulators Based on a MobileViT‐Yolo Deep Learning Algorithm | |
Wang et al. | KMSA-Net: A Knowledge-Mining-Based Semantic-Aware Network for Cross-Domain Industrial Process Fault Diagnosis | |
Shi et al. | Recognizing the take-off action pattern of basketball players based on fuzzy neural network system | |
CN115661429B (zh) | 一种锅炉水冷壁管缺陷识别系统、方法和存储介质 | |
CN115880660A (zh) | 一种基于结构表征和全局注意力机制的轨道线检测方法和系统 | |
Wang et al. | Image recognition of wind turbines blade surface defects based on mask-RCNN | |
Şimşek et al. | A Study on Deep Learning Methods in the Concept of Digital Industry 4.0 | |
Zhao et al. | A new multilabel recognition framework for transmission lines bolt defects based on the combination of semantic knowledge and structural knowledge | |
Xu et al. | Intelligent multi-severity nuclear accident identification under transferable operation conditions | |
CN118115591B (zh) | 功率预测模型训练方法、光伏电站运维方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |