CN117786507B

CN117786507B - 全局和局部特征耦合指导的滚动轴承未知故障检测方法

Info

Publication number: CN117786507B
Application number: CN202410210595.7A
Authority: CN
Inventors: 聂婕; 王成龙; 许佳立; 于树松; 贾东宁; 魏志强
Original assignee: Ocean University of China
Current assignee: Ocean University of China
Priority date: 2024-02-27
Filing date: 2024-02-27
Publication date: 2024-04-30
Anticipated expiration: 2044-02-27
Also published as: CN117786507A

Abstract

本发明属于故障检测技术领域，公开了全局和局部特征耦合指导的滚动轴承未知故障检测方法，包括预训练阶段，使用伪孪生网络进行预训练，提取尺度耦合特征；使用有标签的数据监督调整阶段；故障新类发现阶段，在未标记数据上训练全局和局部耦合特征指导的未知故障检测模型：通过全局特征学习分支和局部特征学习分支学习全局特征和局部特征，建模全局‑局部特征结构因果图，以捕获故障振动信号中全局特征、局部特征和故障类别之间的真实因果关系；通过一致性预测方法约束全局特征学习分支和局部特征学习分支的预测结果，使全局特征学习分支和局部特征学习分支对同一样本的预测结果保持一致。

Description

全局和局部特征耦合指导的滚动轴承未知故障检测方法

技术领域

本发明属于故障检测技术领域，特别涉及全局和局部特征耦合指导的滚动轴承未知故障检测方法。

背景技术

滚动轴承故障检测能够在早期发现轴承故障，预防故障的进一步发展，在机械设备、汽车工业、核电能源等领域广泛应用。但由于设备的高安全可靠运行需求，使发生故障的样本稀少。目前，许多基于深度学习的故障诊断方法已针对该问题进行了研究，比如基于自动编码器的故障诊断方法，基于孪生神经网络的少样本学习方法，基于迁移学习的故障诊断方法等。但这些方法没有考虑新的故障发生时，模型如何识别未知的故障。未知故障检测是指给定一个已知的故障样本集和一个未知的故障样本集（这两个样本集的类别不重叠），利用从已知的类故障样本中学习到的知识来发现未知的类样本的新故障。

而且这些方法存在以下问题：第一，没有充分挖掘故障样本的时空分布不平衡特性，过多的关注全局特征忽略了局部特征的影响，全局特征和局部特征对故障类别的影响并不总是相同，故障可能由全局特征引发，也可能由局部特征引发。现在的故障检测方法大多仅利用全局特征进行检测或者仅利用局部特征进行故障检测。因此，需要同时挖掘全局特征和局部特征对故障类别的影响。第二，没有挖掘全局、局部特征与故障类别的真实因果关系，没有剔除设备故障样本中的混杂特征。模型在学习特征跟故障类别的关系时，不可避免的受到混杂特征（例如，故障样本中的正常信号会成为冗余信息）的影响。例如，对于全局特征，数据样本并不总是故障部分，包括有故障和正常的特征，正常的特征会干扰模型的判断。对于局部特征，除了邻域中的干扰特征，本身也可能是正常特征作为模型的干扰因素。因此，需要挖掘全局、局部特征跟故障类别的真实因果关系。

发明内容

针对现有技术存在的不足，本发明提供一种全局和局部特征耦合指导的滚动轴承未知故障检测方法，将故障诊断问题与新类发现问题一起考虑，将故障数据集划分为已知类的故障数据集和未知类的故障数据集，利用已知类的知识来辅助未知类的聚类过程。通过保持全局和局部知识并且建立全局、局部特征与故障的真实因果关系模型来解决未知故障检测这个问题。

为了解决上述技术问题，本发明采用的技术方案是：

全局和局部特征耦合指导的滚动轴承未知故障检测方法，包括三个阶段，以下步骤：

阶段1，预训练阶段，使用伪孪生网络进行预训练，提取尺度耦合特征：

输入数据是不同尺度的一维振动信号样本，通过尺度耦合特征提取模块建立数据不同尺度之间的相似性关联关系，完成预训练；所述尺度耦合特征提取模块采用基于Transformer的伪孪生网络，具体来说，所述伪孪生网络包括两个结构相同的基于Transformer的特征提取分支和距离度量模块，每个特征提取分支采用Transformer编码器结构，两个分支不共享权重，不同尺度的数据输入到伪孪生网络的两个分支中，通过距离度量模块度量两个分支的输出特征是否属于相同类别来学习尺度间的相似性关系，该相似性关系即尺度间的耦合特征；

阶段2，使用有标签的数据监督调整阶段；

使用预训练阶段训练好的Transformer编码器，在标记数据集上进行监督训练，使其提高对已知类别数据进行分类的能力；

阶段3，故障新类发现阶段，在未标记数据上训练全局和局部耦合特征指导的未知故障检测模型：

故障新类发现阶段的全局和局部耦合特征指导的未知故障检测模型架构包括预训练的Transformer编码器、全局特征学习分支、局部特征学习分支及全局局部特征交互模块，首先将无标记的未知类数据集输入到Transformer编码器中，然后通过全局特征学习分支和局部特征学习分支学习全局特征和局部特征，并通过全局局部特征交互模块挖掘全局特征和局部特征跟故障类别之间的真实因果关系，建模全局-局部特征结构因果图，以捕获故障震动信号中全局特征、局部特征和故障类别之间的真实因果关系；最后通过一致性预测方法约束全局特征学习分支和局部特征学习分支的预测结果，使全局特征学习分支和局部特征学习分支对同一样本的预测结果保持一致。

进一步的，在预训练阶段前，先进行数据集的划分，具体是：将数据集划分为标记数据集和未标记数据集，确保两个数据集的类别不相交，标记数据集包含已知的类标签和对应的样本数，未标记数据集包含未知的样本数。

进一步的，阶段1中，输入数据是一对尺度大小不同的一维故障振动信号样本，分别为大尺度样本X₁和小尺度样本X₂，其中X₂的大小为X₁的1/2，将两个尺度的输入数据分别输入到伪孪生网络的两个分支中，每个分支包括嵌入层、N个堆叠的Transformer层、全连接层，在每个分支内，输入的数据样本先通过嵌入层投影到一个线性嵌入矩阵E中，将故障振动信号中时序位置信息E_pos进行编码，保持故障信号样本中的位置信息，得到Transformer层的输入特征，Transformer层的输出经过全连接层处理；伪孪生网络的两个分支的输出根据距离度量进行优化，得到输入数据属于相同类别或不同类别的输出结果。

进一步的，每个Transformer层具体结构包括归一化层、多头注意力层和多层感知机，首先将输入特征F_in进行归一化，多头注意力层接收来自归一化后的特征，之后将多头注意力层的输出与输入特征进行残差连接，并将输出进行归一化得到多层感知机的输入，同样在多层感知机后进行残差连接得到下一个Transformer层的输入。

进一步的，伪孪生网络的损失函数可以表示为：

；其中i表示第i个样本对的编号，/>表示输入到第一个分支的样本，/>表示输入到第二个分支的样本，/>表示一个控制因子，当第i个样本对属于同一类别时，等于1，否则为0，即当输入到两个分支的第i个样本对/>和/>来自于同一个故障类别时，设/>，当/>和/>来自于不同故障类别时，设/>；Y表示伪孪生网络的输出，它的形式为/>，Sigmoid函数的计算形式为/>，/>；

其中表示输入变量，/>是Transformer网络，/>表示第一个分支的输出，表示第二个分支的输出，/>表示两个分支的距离。

进一步的，阶段3中，全局特征学习分支侧重于利用故障样本的整体轮廓信息进行故障判别，局部特征学习分支擅长利用邻域细节信息进行故障判别，两个分支使用共同的transformer编码器提取特征，该transformer编码器在阶段1和阶段2已进行预训练；以全局分支为例，该分支包括一个特征映射层和两个线性头，分别用来分类标记的已知类和无标记的未知类，通过排序统计伪标签生成方法RS生成未标记数据的伪标签，将知识从标记数据转移到未标记数据。

进一步的，阶段3中，使用全局局部特征交互模块来建立全局和局部特征的因果关系，并约束两个分支预测结果的一致性，方法是：输入未标记数据，由transformer编码器处理生成特征，将该特征输入到全局特征学习分支和局部特征学习分支，全局特征学习分支和局部特征学习分支分别利用RS生成特征的伪标签，将两个分支生成的伪标签经过一致性预测模块生成整体的监督标签，用于训练两个分支的损失；两个分支通过全局局部特征交互模块交换信息，利用全局-局部特征结构因果建模挖掘不同特征的因果关系。

进一步的，全局特征学习分支和局部特征学习分支生成伪标签的方法，具体来说，对于全局特征学习分支，给出一对样本和/>，经过特征映射层/>获得特征向量/>，采用特征向量/>经过排序统计伪标签生成方法RS获得成对全局伪标签/>：

；

其中和/>是全局特征学习分支中两个无标记样本的特征向量；

局部特征学习分支通过维护一个先进先出的动态队列，将每个部分实例对象与队列中的特征进行比较来获得部分级排序统计数据；之后，将输入样本的所有部分级排序统计数据通过平均池化融合到一起，得到样本的融合相似向量/>，同理可得到样本/>的相似向量/>，融合相似向量/>可以形式化为：

；

其中n为样本x划分为小块的数量，表示X中的每个局部块特征，V是随机的动态队列，Sim表示/>与V的相似性；

采用融合相似向量经过排序统计伪标签生成方法RS获得成对局部伪标签/>：

；

其中，和/>是局部特征学习分支中两个无标记样本的特征向量。

进一步的，全局-局部特征结构因果关系建模时，使用后门调整方法挖掘故障信号中全局特征X_g、局部特征X_p和故障类别Y之间的真实因果关系，避免受到混杂特征C_g、C_p的影响，后门调整方法具体如下：

后门调整设定可以观察混杂因素并对其进行分层，针对全局特征学习分支，对全局混杂特征C_g进行分层，划分为n个等大小的分层，即，其中每个/>是全局混杂特征C_g知识的一个分层，在每个分层/>中，分别计算全局特征X_g和故障类别Y之间的关系；之后计算所有分层因果效应的平均值，并根据各个特征层在种群中的分布频率进行加权求和；局部特征学习分支按相同方式处理，最终得到全局分支和局部分支整体的因果关系，即真实因果关系/>公式如下：

；

其中c_g是对全局混杂特征C_g的分层，c_p是对局部混杂特征C_p的分层，P(C_g)是C_g的先验概率，P(C_p)是C_p的先验概率，是全局特征X_g和故障类别Y的因果关系，是局部特征X_p和故障类别Y的因果关系。

与现有技术相比，本发明优点在于：

本发明的尺度耦合特征提取模块可以学习不同尺度样本的相似关系，建立全局和局部特征的潜在联系。全局-局部特征交互模块通过全局、局部特征的交互指导来发现新的故障类别。

本发明提出了一种全局-局部特征结构因果关系建模方法。全局、局部特征与故障类别是因果关系建模，可以挖掘与故障发生有关的真实因果特征，去除混杂特征的影响。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的方法流程图；

图2为本发明的尺度耦合特征提取模块示意图；

图3为本发明的新类发现阶段的未知故障检测模型架构图；

图4为干预前全局、局部特征跟故障类别Y的因果关系图；

图5为本发明干预后全局、局部特征跟故障类别Y的真实因果关系。

具体实施方式

下面结合附图及具体实施例对本发明作进一步的说明。

未知故障检测是从已知类别的标记数据集上学习知识，利用学到的知识在未标记数据集上发现新的类别。标记数据集和未标记数据集的类别要求不相交。因此，在未知故障检测任务中，本发明首先进行数据集的划分，具体是：将数据集划分为标记数据集和未标记数据集/>，确保两个数据集的类别不相交，标记数据集包含已知的类标签和对应的样本数，未标记数据集包含未知的样本数。其中/>和/>分别是标记数据集/>和未标记数据集/>中的数据样本。/>是/>中的类标签。N是标记数据集中的样本数，M是未标记数据集中的样本数。

结合图1，本发明提出的全局和局部特征耦合指导的滚动轴承未知故障检测方法，包括三个阶段，预训练阶段、监督调整阶段（使用标记数据集的数据）和新类发现阶段（使用无标记数据集的数据）。

下面分别介绍各个阶段的步骤：

阶段1，预训练阶段，使用伪孪生网络进行预训练，提取尺度耦合特征。

输入数据是不同尺度的一维振动信号样本，通过尺度耦合特征提取模块建立数据不同尺度之间的相似性关联关系，完成预训练。

尽管现有方法在特征提取过程中对多尺度特征学习已经做了很多工作，但这些工作大多是提取多个尺度的特征融合在一起使用，仅是学习了不同尺度的知识，并没有建立不同尺度之间的潜在关系。为了解决这个问题，本发明提出了尺度耦合特征提取模块，该模块建立了不同尺度的相似性关联。

在特征提取阶段，目前故障检测领域大多采用卷积神经网络CNN和循环神经网络RNN提取特征，但由于CNN忽略数据的时序相关性、RNN计算长时序数据代价很大等问题，本发明使用Trasnformer作为特征提取阶段的基础架构。

结合图2所示，尺度耦合特征提取模块采用基于Transformer的伪孪生网络，该模块采用伪孪生网络的思想，利用大尺度的输入数据训练一个子网络分支，利用小尺度的输入数据训练另一个子网络分支，通过度量两个分支的输出特征是否属于相同类别来学习尺度间的相似性。具体来说，所述伪孪生网络包括两个结构相同的基于Transformer的特征提取分支和距离度量模块，每个特征提取分支采用Transformer编码器结构，由于两个分支的输入的不同，两个分支不共享权重，不同尺度的数据输入到伪孪生网络的两个分支中，通过距离度量模块度量两个分支的输出特征是否属于相同类别来学习尺度间的相似性关系，该相似性关系即尺度间的耦合特征。

阶段1中，输入数据是一对尺度大小不同的一维故障振动信号样本，分别为大尺度样本X₁和小尺度样本X₂，这对样本可能来自相同的类别，也可能是不同的类别。其中X₂的大小为X₁的1/2，本发明将故障振动信号按照2048的长度、80的移步大小采集大尺度的样本，按照1024的长度、80的移步大小采集小尺度的样本。之后，将两个尺度的输入数据分别输入到伪孪生网络的两个分支中，每个分支包括嵌入层、N个堆叠的Transformer层、全连接层，在每个分支内，输入的数据样本先通过嵌入层投影到一个线性嵌入矩阵E中，将故障振动信号中时序位置信息E_pos进行编码，保持故障信号样本中的位置信息，由于位置信息跟嵌入矩阵具有相同的维数，可直接添加到线性嵌入矩阵E中，得到Transformer层的输入特征F_in=E+E_pos。Transformer层的输出经过全连接层处理；伪孪生网络的两个分支的输出根据距离度量进行优化，得到输入数据属于相同类别或不同类别的输出结果。

作为一个优选的实施例，每个Transformer层具体结构包括归一化层、多头注意力层和多层感知机，首先将输入特征F_in进行归一化，多头注意力层接收来自归一化后的特征，之后将多头注意力层的输出与输入特征进行残差连接，并将输出进行归一化得到多层感知机的输入，同样在多层感知机后进行残差连接得到下一个Transformer层的输入。

伪孪生网络两个分支根据其输出之间的距离度量进行优化，距离度量公式可以表示为：

；

其中i表示第i个样本对的编号，表示输入到第一个分支的样本，/>表示输入到第二个分支的样本，/>是Transformer网络，/>表示第一个分支的输出，/>表示第二个分支的输出，/>表示两个分支的距离。

因此，伪孪生网络的损失函数可以表示为：

；

其中表示一个控制因子，当第i个样本对属于同一类别时，等于1，否则为0，即当输入到两个分支的第i个样本对/>和/>来自于同一个故障类别时，设/>，当/>和来自于不同故障类别时，设/>；Y表示伪孪生网络的输出，它的形式为，Sigmoid函数的计算形式为/>，/>表示输入变量。

阶段2，使用有标签的数据监督调整阶段。

使用预训练阶段训练好的Transformer编码器，在标记数据集上进行监督训练，使其提高对已知类别数据进行分类的能力。

阶段3，故障新类发现阶段，在未标记数据上训练全局和局部耦合特征指导的未知故障检测模型。

本发明的故障新类发现阶段采用全局特征学习分支及局部特征学习分支的双分支结构，全局特征学习分支关注较长范围的数据特征对故障造成的影响（比如内圈故障发生时会出现周期性的振幅变化），局部特征学习分支关注较小的数据特征可能造成的故障（比如外圈故障或滚动体故障出现时可能会有局部的冲击脉冲信号）。尽管两个分支从不同的角度考虑了现实场景中可能发生的故障，但是全局和局部分支特征提取过程学习了过多的冗余特征。例如，对于全局分支，由于学习的数据大多数是正常的，故障信号占比较少，所以全局分支的样本中存在很多冗余信息；对于局部分支，由于局部特征关注细节信息且本身比较小，所以局部特征本身可能是冗余信息。因此，为了挖掘全局特征和局部特征跟故障类别之间的真实因果关系，同时保证全局分支和局部分支的预测一致性，本发明提出了全局-局部特征交互模块。因此，故障新类发现阶段的模型架构图如图3所示。

阶段3中，全局特征学习分支侧重于利用故障样本的整体轮廓信息进行故障判别，局部特征学习分支擅长利用邻域细节信息进行故障判别，两个分支使用共同的transformer编码器提取特征，该transformer编码器在阶段1和阶段2已进行预训练；以全局分支为例，该分支包括一个特征映射层和两个线性头，分别用来分类标记的已知类和无标记的未知类，通过排序统计伪标签生成方法RS生成未标记数据的伪标签，将知识从标记数据转移到未标记数据。此处需要说明的是，本发明使用的RS方法是现有技术，方法原理此处不再赘述。

阶段3中，使用全局局部特征交互模块来建立全局和局部特征的因果关系，并约束两个分支预测结果的一致性，方法是：输入未标记数据，由transformer编码器处理生成特征，将该特征输入到全局特征学习分支和局部特征学习分支，全局特征学习分支和局部特征学习分支分别利用RS生成特征的伪标签，将两个分支生成的伪标签经过一致性预测模块生成整体的监督标签，用于训练两个分支的损失；两个分支通过全局局部特征交互模块交换信息，利用全局-局部特征结构因果建模挖掘不同特征的因果关系。

对于图3，和/>表示两个分支的特征映射层，/>和/>为两个分支的特征向量，和/>为两个分支的线性头，/>和/>是两个分支的二进制交叉熵损失，RS为排序统计伪标签生成方法，V是局部特征的随机队列，/>为局部特征融合后的特征向量。

结合图3，作为一个具体实施方式，全局特征学习分支和局部特征学习分支生成伪标签的方法，具体来说，对于全局特征学习分支，给出一对样本和/>，经过特征映射层获得特征向量/>，采用特征向量/>经过排序统计伪标签生成方法RS获得成对全局伪标签/>：

；

其中和/>是全局特征学习分支中两个无标记样本的特征向量。使用二进制伪标签，之后可以使用未标记数据上的二进制交叉熵损失来训练模型。

对于局部特征学习分支，给出一对样本和/>，经过特征映射层/>获得特征向量/>，局部特征学习分支通过维护一个先进先出的动态队列，将每个部分实例对象与队列中的特征进行比较来获得部分级排序统计数据；之后，将输入样本的所有部分级排序统计数据通过平均池化融合到一起，得到样本/>的融合相似向量/>，同理可得到样本/>的相似向量/>，融合相似向量/>可以形式化为：

；

其中n为样本x划分为小块的数量，表示X中的每个局部块特征，V是随机的动态队列，Sim表示/>与V的相似性。

采用融合相似向量经过排序统计伪标签生成方法RS获得成对全局伪标签/>，局部伪标签/>获取公式可以表示为：

；

为了使全局特征学习分支和局部特征学习分支得到一致性的预测，将全局特征和局部特征联合训练，将全局特征学习分支获得的伪标签和局部特征学习分支获得的伪标签/>进行融合获得一致性伪标签/>，使用S分别监督两个分支进行训练。因此一致性预测任务可以表示为：

其中和/>分别是全局和局部特征学习分支的二进制交叉熵损失。M是未标记数据集的样本数量，/>和/>是全局特征学习分支中两个无标记样本的特征向量，/>和/>是局部特征学习分支中两个无标记样本的特征向量，/>和/>分别为全局和局部特征学习分支的线性头。

结合图4和图5，作为一个优选的实施例，本发明构造了全局-局部特征的结构因果关系图，图4和图5描述了输入数据D、全局特征X_g、全局混杂特征C_g、局部特征X_p、局部混杂特征C_p以及预测的故障类别Y间的因果关系，图中，圆圈代表对象，箭头代表对象之间的因果关系。图4表示干预前全局、局部特征跟故障类别Y的因果关系，图5表示干预后全局、局部特征跟故障类别Y的真实因果关系。

下面对因果关系图的详细信息展开介绍。

C_g←D→X_g： D表示为故障数据集（即输入数据），X_g是全局特征学习分支中的全局特征。D→X_g表示X_g是通过预训练的Transformer编码器提取的特征，C_g是全局特征中的混杂特征，在这里它通常是故障数据中占比较大的正常信号特征。

C_g→Y←X_g：Y表示为故障类别，对于全局特征学习分支，故障类别Y只由全局特征X_g引起，但不可避免地被混杂特征C_g干扰。

C_p←D→X_p：X_p是局部特征学习分支中的局部特征， D→X_p表示X_p是通过预训练的Transformer编码器提取的局部分支的特征。C_p是局部特征中的混杂特征，它可能是局部特征中的正常信号特征，也可能是局部特征本身。

C_p→Y←X_p：对于局部特征学习分支，故障类别Y应该只由局部特征X_p引起，但被混杂特征C_p干扰。

本发明步骤的目的是捕获故障信号中全局特征X_g、局部特征X_p和故障类别Y之间的真实因果关系，避免受到混淆特征C_g、C_p的影响。期望在复杂的故障环境中，使模型根据故障发生的真实特征做出判断。但是，传统的概率公式无法实现这一点。以全局特征学习分支为例，Y给定X_g的概率不仅由X_g→Y产生，还由D→C_g→Y影响。因此，为了挖掘X_g与Y的真实因果关系，本发明提出使用因果干预来切断混杂特征的影响，如图5所示。

具体来说，本发明使用后门调整方法挖掘故障信号中全局特征X_g、局部特征X_p和故障类别Y之间的真实因果关系，避免受到混杂特征C_g、C_p的影响，后门调整方法具体如下：

；

需要说明的是，本发明在应用时，不仅可以用于滚动轴承未知故障检测，还可以根据需求做参数调整，适用于其他轴承故障检测。

综上所述，本方法与现有方法的不同之处在于：现有的全局和局部分支交互方法，采用两个分支之间的互知识蒸馏方法。在全局和局部分支各自维护一个先进先出的特征库队列，用来存放全局和局部特征。通过比较每个实例与特征库队列的相似性得分分布，并优化两个分布的KL散度来实现全局和局部分支的相互学习。以上方法仅约束了两个分支特征分布的距离，使两个分支产生的预测结果逼近，但是并不能完全保证全局分支和局部分支预测的一致性，也没有充分挖掘全局和局部特征的关联关系。然而，本方法通过全局-局部特征结构因果关系建模挖掘了全局、局部特征跟故障类别的真实因果关系；同时，一致性预测机制从联合监督的视角出发，使两个分支使用共同的均衡监督，保证了两个分支对相同样本的一致预测结果。

也就是说，本发明（1）可以同时挖掘全局特征和局部特征对故障类别的影响。本发明通过全局和局部耦合特征指导的未知故障检测模型，利用尺度耦合特征提取模块在预训练阶段建立全局特征和局部特征的相似关系，将预训练学习到的知识用于全局-局部特征交互模块的新类发现，在该模块中使全局和局部特征进行交互学习，进一步指导未知故障类别的检测。（2）聚焦于全局和局部分支中故障发生的主要因果特征。本发明借鉴因果干预的思想，通过提出因果推理模块来筛选与故障相关的特征，建立全局、局部特征与故障的真实因果关系。利用后门调整观察和分层混杂因素，在每一层混杂特征中学习特征与故障发生的关系。按照每个特征层在总体中的分布频率进行加权求和，得到总体的因果效应。有效的去除混杂特征对模型的影响，保留引起故障的主要因果特征。因此，通过对全局、局部特征与故障类别因果关系的建立，使模型可以更精准的识别故障类别。

当然，上述说明并非是对本发明的限制，本发明也并不限于上述举例，本技术领域的普通技术人员，在本发明的实质范围内，做出的变化、改型、添加或替换，都应属于本发明的保护范围。

Claims

1.全局和局部特征耦合指导的滚动轴承未知故障检测方法，其特征在于，包括三个阶段，以下步骤：

阶段1中，输入数据是一对尺度大小不同的一维故障振动信号样本，分别为大尺度样本X₁和小尺度样本X₂，其中X₂的大小为X₁的1/2，将两个尺度的输入数据分别输入到伪孪生网络的两个分支中，每个分支包括嵌入层、N个堆叠的Transformer层、全连接层，在每个分支内，输入的数据样本先通过嵌入层投影到一个线性嵌入矩阵E中，将故障振动信号中时序位置信息E_pos进行编码，保持故障信号样本中的位置信息，得到Transformer层的输入特征，Transformer层的输出经过全连接层处理；伪孪生网络的两个分支的输出根据距离度量进行优化，得到输入数据属于相同类别或不同类别的输出结果；

每个Transformer层具体结构包括归一化层、多头注意力层和多层感知机，首先将输入特征F_in进行归一化，多头注意力层接收来自归一化后的特征，之后将多头注意力层的输出与输入特征进行残差连接，并将输出进行归一化得到多层感知机的输入，同样在多层感知机后进行残差连接得到下一个Transformer层的输入；

伪孪生网络的损失函数表示为：

其中i表示第i个样本对的编号，x₁表示输入到第一个分支的样本，x₂表示输入到第二个分支的样本，tⁱ表示一个控制因子，当第i个样本对属于同一类别时，等于1，否则为0，即当输入到两个分支的第i个样本对/>和/>来自于同一个故障类别时，设tⁱ＝1，当/>和/>来自于不同故障类别时，设tⁱ＝0；Y表示伪孪生网络的输出，它的形式为/>Sigmoid函数的计算形式为/>

其中a表示输入变量，f是Transformer网络，表示第一个分支的输出，/>表示第二个分支的输出，/>表示两个分支的距离；

阶段2，使用有标签的数据监督调整阶段；

故障新类发现阶段的全局和局部耦合特征指导的未知故障检测模型架构包括预训练的Transformer编码器、全局特征学习分支、局部特征学习分支及全局局部特征交互模块，首先将无标记的未知类数据集输入到Transformer编码器中，然后通过全局特征学习分支和局部特征学习分支学习全局特征和局部特征，并通过全局局部特征交互模块挖掘全局特征和局部特征跟故障类别之间的真实因果关系，建模全局-局部特征结构因果图，以捕获故障振动信号中全局特征、局部特征和故障类别之间的真实因果关系；最后通过一致性预测方法约束全局特征学习分支和局部特征学习分支的预测结果，使全局特征学习分支和局部特征学习分支对同一样本的预测结果保持一致。

2.根据权利要求1所述的全局和局部特征耦合指导的滚动轴承未知故障检测方法，其特征在于，在预训练阶段前，先进行数据集的划分，具体是：将数据集划分为标记数据集和未标记数据集，确保两个数据集的类别不相交，标记数据集包含已知的类标签和对应的样本，未标记数据集包含未知类别的样本。

3.根据权利要求1所述的全局和局部特征耦合指导的滚动轴承未知故障检测方法，其特征在于，阶段3中，全局特征学习分支侧重于利用故障样本的整体轮廓信息进行故障判别，局部特征学习分支擅长利用邻域细节信息进行故障判别，两个分支使用共同的Transformer编码器提取特征，该Transformer编码器在阶段1和阶段2已进行预训练；以全局分支为例，该分支包括一个特征映射层和两个线性头，分别用来分类标记的已知类和无标记的未知类，通过排序统计伪标签生成方法RS生成未标记数据的伪标签，将知识从标记数据转移到未标记数据。

4.根据权利要求3所述的全局和局部特征耦合指导的滚动轴承未知故障检测方法，其特征在于，阶段3中，使用全局局部特征交互模块来建立全局和局部特征的因果关系，并约束两个分支预测结果的一致性，方法是：输入未标记数据，由Transformer编码器处理生成特征，将该特征输入到全局特征学习分支和局部特征学习分支，全局特征学习分支和局部特征学习分支分别利用RS生成特征的伪标签，将两个分支生成的伪标签经过一致性预测模块生成整体的监督标签，用于训练两个分支的损失；两个分支通过全局局部特征交互模块交换信息，利用全局-局部特征结构因果建模挖掘不同特征的因果关系。

5.根据权利要求4所述的全局和局部特征耦合指导的滚动轴承未知故障检测方法，其特征在于，全局特征学习分支和局部特征学习分支生成伪标签的方法，具体来说，对于全局特征学习分支，给出一对样本x_i和x_j，经过特征映射层ψ_g获得特征向量Z_i，采用特征向量Z_i经过排序统计伪标签生成方法RS获得成对全局伪标签

局部特征学习分支通过维护一个先进先出的动态队列，将每个部分实例对象与队列中的特征进行比较来获得部分级排序统计数据；之后，将输入样本的所有部分级排序统计数据通过平均池化融合到一起，得到样本x_i的融合相似向量同理可得到样本x_j的相似向量/>融合相似向量o^u形式化为：

其中n为样本x划分为小块的数量，x_m表示X中的每个局部块特征，V是随机的动态队列，Sim表示x_m与V的相似性；

采用融合相似向量o^u经过排序统计伪标签生成方法RS获得成对局部伪标签

6.根据权利要求4所述的全局和局部特征耦合指导的滚动轴承未知故障检测方法，其特征在于，全局-局部特征结构因果关系建模时，使用后门调整方法挖掘故障信号中全局特征X_g、局部特征X_p和故障类别Y之间的真实因果关系P(Y|do(X_g，X_p))，避免受到混杂特征C_g、C_p的影响，后门调整方法具体如下：

后门调整设定观察混杂因素并对其进行分层，针对全局特征学习分支，对全局混杂特征C_g进行分层，划分为n个等大小的分层，即C_g＝{c_gi，i＝1，...，n}，其中每个c_gi是全局混杂特征C_g知识的一个分层，在每个分层c_gi中，分别计算全局特征X_g和故障类别Y之间的关系；之后计算所有分层因果效应的平均值，并根据各个特征层在种群中的分布频率进行加权求和；局部特征学习分支按相同方式处理，最终得到全局分支和局部分支整体的因果关系，即真实因果关系P(Y|do(X_g，X_p))公式如下：

其中c_g是对全局混杂特征C_g的分层，c_p是对局部混杂特征C_p的分层，P(C_g)是C_g的先验概率，P(C_p)是C_p的先验概率，P(Y|X_g，C_g)是全局特征X_g和故障类别Y的因果关系，P(Y|X_p，C_g)是局部特征X_p和故障类别Y的因果关系。