CN116383737B

CN116383737B - 基于聚类对比学习的旋转机械故障诊断方法及系统

Info

Publication number: CN116383737B
Application number: CN202310654940.1A
Authority: CN
Inventors: 王凯; 魏杨; 谢辉洋; 李文强; 赵武; 李翔龙
Original assignee: Sichuan University
Current assignee: Sichuan University
Priority date: 2023-06-05
Filing date: 2023-06-05
Publication date: 2023-08-11
Anticipated expiration: 2043-06-05
Also published as: CN116383737A

Abstract

本申请提出了一种基于聚类对比学习的旋转机械故障诊断方法及系统，该方法包括：获取多个无标签振动信号，生成无标签训练集；提取无标签训练集的时频域特征，对无标签训练集进行聚类，划分为多个信号簇类；对划分后的无标签训练集进行随机的数据增强，得到双视角训练集；基于对比学习预训练的方式提取双视角训练集中信号的普遍特征，生成预训练完成的编码器；生成少样本数据集并输入编码器，提取深层语义特征；将深层语义特征输入Softmax分类器进行分类器训练，并将测试样本输入训练完成的编码器和分类器诊断故障类别。该方法可以从无标签的训练样本中自适应地学习具有深层语义的故障特征表示，提高故障诊断的准确性且便于实施。

Description

基于聚类对比学习的旋转机械故障诊断方法及系统

技术领域

本申请涉及机械设备故障诊断技术领域，尤其涉及一种基于聚类对比学习的旋转机械故障诊断方法及系统。

背景技术

目前，旋转机械，比如轴承等，在各个领域中应用的较为广泛，对旋转机械的故障进行诊断是维持设备正常运行的重要步骤。相关技术中，在进行旋转机械故障诊断时，通常是采用有监督深度学习方法，使用有标签数据样本来学习故障样本的数据分布，以实现端到端故障诊断。

然而，由于在实际的工业环境中，旋转机械设备通常只工作在正常工况下，因此旋转机械的故障数据采集起来较为困难，且采集成本高昂。而在工业环境或者实验环境中采集到的各种无标签数据通常难以利用于故障诊断。因此，上述相关技术中的诊断方案在仅使用少量的有标签故障样本进行故障诊断时，往往会导致诊断分类的鲁棒性差，并且极易产生过拟合，诊断结果的准确性较低。

因此，如何使用少量的有标签的故障信号样本完成旋转机械的故障诊断，成为目前亟需解决的问题。

发明内容

本申请旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本申请的第一个目的在于提出一种基于聚类对比学习的旋转机械故障诊断方法，该方法可以从无标签的训练样本中自适应地学习具有深层语义的故障特征表示，能使用较少的有标签数据完成故障模式判别，大大降低当前故障诊断领域对有标签数据的需求，提高故障诊断的准确性且便于实施。

本申请的第二个目的在于提出一种基于聚类对比学习的旋转机械故障诊断系统。

本申请的第三个目的在于提出一种非临时性计算机可读存储介质。

为达上述目的，本申请的第一方面在于提出一种基于聚类对比学习的旋转机械故障诊断方法，该方法包括以下步骤：

获取多个无标签振动信号,生成无标签训练集；

提取所述无标签训练集的时频域特征，并基于所述时频域特征对所述无标签训练集进行聚类，以将所述无标签训练集划分为多个信号簇类；

对划分后的无标签训练集进行随机的数据增强，得到双视角训练集；

基于对比学习预训练的方式提取所述双视角训练集中信号的普遍特征，生成预训练完成的编码器；

采集少量的有标签振动信号，生成少样本数据集，并将所述少样本数据集输入所述预训练完成的编码器，提取所述少样本数据集的深层语义特征；

将所述深层语义特征输入Softmax分类器进行分类器训练，并获取实际待测试的测试样本，将所述测试样本输入训练完成的编码器和分类器，诊断所述测试样本对应的故障类别。

可选地，在本申请的一个实施例中，所述提取所述无标签训练集的时频域特征，包括：提取所述无标签训练集的12个时域特征和12个频域特征，并将所述12个时域特征和所述12个频域特征组合为长度为24的时频域特征向量；对所述时频域特征向量进行Z标准化处理；其中，所述12个时域特征，包括时域上的均值、标准差、平方根振幅、绝对均值、偏度、峰度、方差、峰度指数、峰值指数、波形指数、脉冲指数和偏度指数，所述12个频域特征，包括频域上的均值、标准差、方差、偏度、陡度、重力频率、均方根、平均频率、正则度、变异参数、八阶矩和十六阶矩。

可选地，在本申请的一个实施例中，所述基于所述时频域特征对所述无标签训练集进行聚类，包括：基于所述时频域特征通过K-means聚类算法将所述无标签训练集划分为K个信号簇类，其中，每个所述信号簇类具有相似的时频域特性；通过预设的筛选机制为每个所述信号簇类中的信号样本分配伪标签，生成伪标签训练集。

可选地，在本申请的一个实施例中，所述通过预设的筛选机制为每个所述信号簇类中的信号样本分配伪标签，生成伪标签训练集，包括：在每个所述信号簇类中，确定每个所述信号样本与聚类中心的距离，并为预设占比的最接近聚类中心的信号样本，分配与聚类中心的编号对应的伪标签；对于每个所述信号簇类中在所述预设占比之外的信号样本，分配数值为0的伪标签；将所述无标签训练集与每个信号样本分配的所述伪标签进行组合，生成所述伪标签训练集。

可选地，在本申请的一个实施例中，所述对划分后的无标签训练集进行随机的数据增强，包括：对所述划分后的无标签训练集依次进行两次随机的数据增强操作，获得每个信号样本对应的两个不同视角的数据；将所述两个不同视角的数据进行拼接，并根据每个所述信号样本的伪标签为对应的增强后生成的数据分配伪标签。

可选地，在本申请的一个实施例中，对所述划分后的无标签训练集进行随机的数据增强操作，包括：将每个所述信号样本中随机四分之一的数据点设置为0；在每个所述信号样本中添加一个随机噪声，所述随机噪声符合均值为0且方差为0.01的正态分布；以随机概率继续通过所述随机噪声对每个所述信号样本进行缩放；以随机概率继续对每个所述信号样本通过傅里叶变换进行重采样，根据每个所述信号样本对应的原始样本长度和重采样样本长度更新样本信号；对变换后的伪标签训练集进行Z标准化处理。

可选地，在本申请的一个实施例中，所述基于对比学习预训练的方式提取所述双视角训练集中信号的普遍特征，生成预训练完成的编码器，包括：将所述双视角训练集输入预设的深度学习特征编码器进行运算，获得所述双视角训练集中每个信号对应的高维特征向量；通过多正例交叉熵损失对所述高维特征向量进行预训练，根据信号自身的相似度差异训练编码器学习相似度分布。

可选地，在本申请的一个实施例中，所述根据信号自身的相似度差异训练编码器学习相似度分布，包括：对于所述双视角训练集中伪标签不为0的高维特征向量，增大具有相同伪标签的各个高维特征向量之间的相似度，并减少具有不同伪标签的各个高维特征向量之间的相似度；对于所述双视角训练集中伪标签为0的高维特征向量，将任一高维特征向量与除自身的另一个视角之外的每个高维特征向量之间的相似度降低。

为达上述目的，本申请的第二方面还提出了一种基于聚类对比学习的旋转机械故障诊断系统，包括以下模块：

获取模块，用于获取多个无标签振动信号,生成无标签训练集；

聚类模块，用于提取所述无标签训练集的时频域特征，并基于所述时频域特征对所述无标签训练集进行聚类，以将所述无标签训练集划分为多个信号簇类；

增强模块，用于对划分后的无标签训练集进行随机的数据增强，得到双视角训练集；

训练模块，用于基于对比学习预训练的方式提取所述双视角训练集中信号的普遍特征，生成预训练完成的编码器；

提取模块，用于采集少量的有标签振动信号，生成少样本数据集，并将所述少样本数据集输入所述预训练完成的编码器，提取所述少样本数据集的深层语义特征；

诊断模块，用于将所述深层语义特征输入Softmax分类器进行分类器训练，并获取实际待测试的测试样本，将所述测试样本输入训练完成的编码器和分类器，获得所述测试样本对应的故障类别。

为了实现上述实施例，本申请第三方面还提出了一种非临时性计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述实施例中的基于聚类对比学习的旋转机械故障诊断方法。

本申请的实施例提供的技术方案至少带来以下有益效果：本申请利用聚类将真实故障领域中广泛存在的无标签信号划分为具有不同时频域特征的簇类，并通过对比学习放大处于同一簇类信号的相似性，同时增强不同簇类之间的区分性，从而使编码器能获取信号中普遍存在的可区分特征。由此，本申请提升了少样本的学习能力，可以从无标签的训练样本中自适应地学习具有深层语义的故障特征表示，能使用较少的有标签数据完成故障模式判别，且可以取得极高的故障诊断准确率。从而，本申请大大降低当前故障诊断领域对有标签数据的需求，可以避免采集大量的有标签数据，降低了故障诊断的成本，提高故障诊断的准确性且便于实施。

本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1为本申请实施例提出的一种基于聚类对比学习的旋转机械故障诊断方法的流程图；

图2为本申请实施例提出的一种数据增强方法的流程图；

图3为本申请实施例提出的一种对比学习预训练的原理示意图；

图4为本申请实施例提出的一种对比学习预训练方法的流程图；

图5为本申请实施例提出的一种基于聚类对比学习的旋转机械故障诊断方法的原理示意图；

图6为本申请实施例提出的一种基于聚类对比学习的旋转机械故障诊断系统的结构示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

需要说明的是，基于深度学习的故障诊断方法主要研究如何从旋转机械的振动信号中高效地提取故障特征，从而提高故障诊断精度。然而相关技术中的有监督学习依赖于大量的有标签数据样本，学习到的故障特征仅能针对训练样本所处的领域，迁移能力较弱。且在实际应用中获取的有标签数据样本数量较少时，诊断结果误差较大。

在本申请实施例中，通过自监督学习技术对深度学习模型进行预训练，从而能够提取无标签信号中存在的普遍特征，通过对比不同信号特征差异，学习隐藏在差异中的信号深层语义特征。因此，基于自监督的深度学习方法能够从少量有标签故障样本提取具有高度区分性的故障特征。然而在旋转机械故障诊断领域中，缺乏有效的自监督预训练的具体实现方案。

为此，本申请提出一种基于聚类对比学习（ClCo）的在少样本条件下的旋转机械故障诊断方法及系统，可以从无标签的训练样本中自适应地学习具有深层语义的故障特征表示，从而能使用较少的有标签数据完成故障模式判别。

下面参考附图详细描述本申请实施例所提出的一种基于聚类对比学习的旋转机械故障诊断方法和系统。

图1为本申请实施例提出的一种基于聚类对比学习的旋转机械故障诊断方法的流程图，如图1所示，该方法包括以下步骤：

步骤S101，获取多个无标签振动信号，生成无标签训练集。

具体的，本申请可以通过多种方式采集旋转机械在实际的工业环境中或者实验环境中产生的各种无标签的振动信号，并汇总获取到的大量的无标签振动信号，根据无标签振动信号生成训练集，以用于后续的深度学习模型的训练。

举例而言，本申请可以通过振动传感器等各类信息采集设备，实时采集某个待测试的旋转机械设备在实际的工业应用中的振动信号，并记录信号采集的时间，以根据旋转机械的历史运行数据生成训练集。又比如，还可以直接调用已有的旋转机械的数据集。

步骤S102，提取无标签训练集的时频域特征，并基于时频域特征对无标签训练集进行聚类，以将无标签训练集划分为多个信号簇类。

具体的，先对生成的无标签训练集进行时频域特征提取，以得到训练集中的每一个样本的时频域特征向量表示，包括分别提取无标签训练集在时域和频域上的多个特征。

在本申请一个实施例中，提取无标签训练集的时频域特征，包括：提取无标签训练集的12个时域特征和12个频域特征，并将12个时域特征和12个频域特征组合为长度为24的时频域特征向量；再对时频域特征向量进行Z标准化处理。

具体而言，假设无标签训练集中包含的信号样本数量为n，则该无标签训练集可表示为{x_i}_i=1 ⁿ，其中，x_i表示无标签训练集中的任一信号样本，i是1至n中的任一正整数。则对{x_i}_i=1 ⁿ提取包括时域上的均值、标准差、平方根振幅、绝对均值、偏度、峰度、方差、峰度指数、峰值指数、波形指数、脉冲指数和偏度指数等12个时域特征，以及包括频域上的均值、标准差、方差、偏度、陡度、重力频率、均方根、平均频率、正则度、变异参数、八阶矩和十六阶矩等12个频域特征。然后，将这时域和频域上的各12个特征组合为长度为24的时频域特征向量{Fi}_i=1 ⁿ={f₁ ⁱ,f₂ ⁱ,...,f₂₄ ⁱ}_i=1 ⁿ。

进而，对时频域特征向量进行Z标准化处理，得到后续用于聚类的训练集{Fi}_i=1 ⁿ。

进一步的，对信号的时频域特征进行聚类，将上述得到的训练集{Fi}_i=1 ⁿ划分为多个具有相似时频域特征的信号簇类，并通过特定的筛选机制为训练集中的信号样本分配伪标签，以得到具有伪标签的训练集。

其中，可以根据实际需要确定不同的聚类方式，比如，聚合聚类、DBSCAN聚类或K-means聚类等。并且，根据一定的筛选机制从训练集中筛选出一些信号样本，为其分配伪标签。

在本申请一个实施例中，基于时频域特征对无标签训练集进行聚类，包括：基于时频域特征通过K-means聚类算法将无标签训练集划分为K个信号簇类，其中，每个信号簇类具有相似的时频域特性；通过预设的筛选机制为每个信号簇类中的信号样本分配伪标签，生成伪标签训练集。

具体而言，在本实施例中，首先对时频域特征向量进行K-means聚类，将训练集{Fi}_i=1 ⁿ划分为K个具有相似时频域特性的信号簇类。具体进行K-means聚类的实现过程可参照相关技术中的K-means聚类算法，比如，先通过K-均值聚类算法对训练集进行初步划分，确定初始聚类数，再通过silhouette准则评价全部聚类点与对应的样本数据间的相似度，并根据相似度确定最终聚类数K等，此处不再赘述。

进而，通过筛选为训练集中的信号样本分配伪标签，以得到具有伪标签的训练集。在本实施例中，通过预设的筛选机制为每个信号簇类中的信号样本分配伪标签，生成伪标签训练集，包括：在每个信号簇类中，确定每个信号样本与聚类中心的距离，并为预设占比的最接近聚类中心的信号样本，分配与聚类中心的编号对应的伪标签；对于每个信号簇类中在预设占比之外的信号样本，分配数值为0的伪标签；将无标签训练集与每个信号样本分配的伪标签进行组合，生成伪标签训练集。

具体而言，在每个信号簇类中，确定各个信号样本与其所处的簇的聚类中心的距离，并按照距离由近至远的顺序进行排序，然后选取排序靠前的，前预设占比s的最接近聚类中心的信号样本，赋予与其聚类中心对应编号的伪标签，即P_i=k，其中，k∈{1,2,...,K}，k表示聚类中心对应编号，在上述进行K-means聚类确定K个信号簇时确定，P_i表示当前信号簇类中任一筛选出的信号样本的伪标签。

在本实施例中，对于未筛选出的其余距离聚类中心较远的数据，则认为不属于任何一类，进而将对应的训练集中样本赋予伪标签P_i=0。

更进一步的，将无标签训练集与K-means聚类和筛选后产生的伪标签进行组合，生成新的具有伪标签的训练集{x_i,P_i}_i=1 ⁿ。

步骤S103，对划分后的无标签训练集进行随机的数据增强，得到双视角训练集。

具体的，对于划分后的无标签训练集，即步骤S102中最终生成的伪标签训练集{x_i,P_i}_i=1 ⁿ，进行两次随机的数据增强生成双视角训练集。

在本申请一个实施例中，对划分后的无标签训练集进行随机的数据增强，包括：对划分后的无标签训练集依次进行两次随机的数据增强操作，获得每个信号样本对应的两个不同视角的数据；再将两个不同视角的数据进行拼接，并根据每个信号样本的伪标签为对应的增强后生成的数据分配伪标签。

具体而言，首先，对具有伪标签的训练集进行两次随机的数据增强操作t和t’,得到同一个样本的两个不同视角的数据，分别为x_i’=t(x_i)和x_i+n’=t’(x_i)，其中x_i’和x_i+n’表示具有伪标签的训练集中同一个原始信号x_i进行数据增强后的两个不同视角。

在本实施例中为了更加清楚的说明本申请进行随机的数据增强操作的具体实现过程，下面以本实施例中提出的一种数据增强方法进行示例性说明。图2为本申请实施例提出的一种数据增强方法的流程图，如图2所示，该方法包括以下步骤：

步骤S201，将每个信号样本中随机四分之一的数据点设置为0。

具体的，对于具有伪标签的训练集{x_i,P_i}_i=1 ⁿ中的每个样本，将样本中随机的1/4的数据点设置为0。

步骤S202，在每个信号样本中添加一个随机噪声，随机噪声符合均值为0且方差为0.01的正态分布。

具体的，对于经过步骤S201进行变换的具有伪标签的训练集，在其中的每个样本中添加一个均值为0，方差为0.01的正态分布的随机噪声。

步骤S203，以随机概率继续通过随机噪声对每个信号样本进行缩放；以随机概率继续对每个信号样本通过傅里叶变换进行重采样，根据每个信号样本对应的原始样本长度和重采样样本长度更新样本信号。

具体的，随机选择是否执行缩放操作或重采样操作，可以为缩放操作或重采样操作随机设置一个的概率值，比如，存在1/2的概率，对经过变换的具有伪标签的训练集中的每个样本使用一个均值为0，方差为0.01的正态分布的随机噪声进行缩放。并且，还存在1/2的概率，对经过变换的具有伪标签的训练集中的每个样本，使用傅里叶变换进行重采样为原始样本长度的0.5倍到1.5倍。需要说明的是，由于上述的缩放和重采样操作是随机选择是否执行，即还存在一定的概率不执行上述操作，若不执行上述操作则视为在本步骤中的相关阶段进行空操作，即保持数据输入不变。

进而，假如重采样后的信号长度小于原始样本，则随机选取原始样本头尾相同长度的数据进行覆盖重采样的样本，以生成新的样本信号。假如重采样后的样本的信号长度大于原始样本，则随机选取信号头尾部与原始样本相同长度的信号，作为新的样本信号。

步骤S204，对变换后的伪标签训练集进行Z标准化处理。

具体的，对经过上述步骤S201至步骤S203变换处理后的具有伪标签的训练集，进行Z标准化，得到经过数据增强的训练集，且将该训练集作为原始训练集的一个视角。

可以理解的是，基于上述同样的方式，可以继续进行另一次的随机数据增强操作，实现过程相同。

进一步的，将上述获得的两个不同视角的数据进行拼接，同时使数据新生成视角的伪标签P_i+n=P_i，最终生成数量为原训练集两倍的双视角训练集为{x_i’,P_i}_i=1 ²ⁿ。

步骤S104，基于对比学习预训练的方式提取双视角训练集中信号的普遍特征，生成预训练完成的编码器。

具体的，通过对预先设置的一个编码器进行对比学习预训练，学习具有两个不同视角的训练集{x_i’,P_i}_i=1 ²ⁿ中故障信号深层的语义信息，即，使用针对多类别的对比学习方法提取双视角训练集中无标签信号的普遍特征，从而得到预训练完成的编码器。本申请基于对比学习预训练的方式对编码器进行预训练的原理可以参见图3。

在本申请一个实施例中，为了更加清楚的说明图3中对编码器进行对比学习预训练的具体实现过程，下面以本实施例中提出的一种对比学习预训练方法进行示例性说明。图4为本申请实施例提出的一种对比学习预训练方法的流程图，如图4所示，该方法包括以下步骤：

步骤S401，将双视角训练集输入预设的深度学习特征编码器进行运算，获得双视角训练集中每个信号对应的高维特征向量。

需要说明的是，先对本实施例中所使用的公式符号进行说明。其中，用D_u={x_i,P_i}_i=1 ⁿ表示无标签的预训练数据集，D_u’={x_i’,P_i}_i=1 ²ⁿ表示数据增强后的双视角数据集。其中，x_i’和x_i+n’表示同一个原始信号x_i数据增强后的两个不同视角，P_i和P_i+n表示x_i所拥有的伪标签。Z={z_i,P_i}_i=1 ²ⁿ表示双视角数据集经过编码器后得到的对应高维特征向量，其中z_i∈Z。

具体的，将双视角训练集输入预设的深度学习特征编码器中进行运算，该运算过程可以通过以下公式进行表达：

其中，f表示Resnet18-1D的深度学习编码器，Resnet18是计算机视觉中的深度学习网络，本申请采用Resnet18-1D时，先通过将原始Resnet18网络结构中的所有二维卷积替换为一位卷积，使编码器能适应输入的一维故障信号，并从中提取高维信号特征。g代表一个两层的全连接网络，用于将编码器得到高维信号特征投影到特征空间中，这两个全连接层的神经元数量分别为[512,128]和[128,512]。其中，在第一个全连接层之后使用了批量归一化层和ReLU激活函数。由此，经过运算后最终得到训练集样本的高维编码特征为Z={z_i,P_i}_i=1 ²ⁿ。

步骤S402，通过多正例交叉熵损失对高维特征向量进行预训练，根据信号自身的相似度差异训练编码器学习相似度分布。

具体的，先通过以下公式，对高维编码特征使用多正例交叉熵损失进行预训练：

其中，I[·]表示指示函数，当其满足[]中包含的条件时其所代表的值为1，反之则为0。sim(z _i，z _j)表示两个高维特征向量的余弦相似度，z_i,z_j∈Z。mod（）表示取余函数。τ是值为0.07的一个常数，使得概率分布更加陡峭。

在本实施例中，根据信号自身的相似度差异训练编码器学习相似度分布，包括：对于双视角训练集中伪标签不为0的高维特征向量，增大具有相同伪标签的各个高维特征向量之间的相似度，并减少具有不同伪标签的各个高维特征向量之间的相似度；对于双视角训练集中伪标签为0的高维特征向量，将任一高维特征向量与除自身的另一个视角之外的每个高维特征向量之间的相似度降低。

即，对于从双视角数据集提取的其中一个特征向量z_i，若其伪标签P_i未被设定为0情况下，多正例交叉熵损失将使它与有相同伪标签（P_i= P_j）的数据特征z_j相似度尽量高，同时，使具有不同伪标签（P_i P_j）的数据样本特征z_j的相似度尽量低。对于伪标签P_i设定为0的无标签数据特征，它与除了自身的另一个不同视角外的特征的相似度都应该尽量低。

进而，经过预训练后，根据信号自身的相似度差异，编码器会学习到最为准确的相似度分布，能够使整体的损失尽量低。

由此，通过上述对比学习预训练，编码器能够提取故障信号中深层的语义信息，最终保存预训练完成的编码器f。

步骤S105，采集少量的有标签振动信号，生成少样本数据集，并将少样本数据集输入预训练完成的编码器，提取少样本数据集的深层语义特征。

具体的，先获取少量的有标签信号，具体采集有标签振动信号的实现方式可参照相关技术中采集有标签故障数据的方式，再根据有标签信号生成用于编码器微调的少样本数据集。然后，将少样本数据集输入预训练完成的编码器，得到具有深层语义表达的信号特征。

步骤S106，将深层语义特征输入Softmax分类器进行分类器训练，并获取实际待测试的测试样本，将测试样本输入训练完成的编码器和分类器，诊断测试样本对应的故障类别。

具体的，使用预训练完成的编码器，将少样本数据集的特征向量输入Softmax分类器，训练分类器，使训练完成的分类器可以根据输入的测试数据输出对应的故障类别。在训练完成分类器后，在实际对测试数据进行故障诊断过程中，将测试数据输入预训练完成的编码器得到测试数据的深层语义表达的信号特征，再将编码器输出的信号特征输入分类器，获得分类器输出的与当前的测试数据相对应的故障类别。

本申请的基于聚类对比学习的旋转机械故障诊断方法，方案整体的实现原理可以参见图5所示的原理示意图，可以按照图5中的流程执行本申请的旋转机械故障诊断方法。由此，本申请使用聚类算法为对比学习预训练提供无标签的提示信息，辅助特征编码器提取无标签信号数据中的深层语义特征，从而更好的表征故障模式。本申请还设计了多正例交叉熵损失函数，使特征编码器能够根据信号自身的相似度差异，学习到准确的相似度分布，可以提升编码器对不同信号的区分能力。

综上所述，本申请实施例的基于聚类对比学习的旋转机械故障诊断方法，利用聚类将真实故障领域中广泛存在的无标签信号划分为具有不同时频域特征的簇类，并通过对比学习放大处于同一簇类信号的相似性，同时增强不同簇类之间的区分性，从而使编码器能获取信号中普遍存在的可区分特征。由此，该方法提升了少样本的学习能力，可以从无标签的训练样本中自适应地学习具有深层语义的故障特征表示，能使用较少的有标签数据完成故障模式判别，且可以取得极高的故障诊断准确率。从而，该方法大大降低当前故障诊断领域对有标签数据的需求，可以避免采集大量的有标签数据，降低了故障诊断的成本，提高故障诊断的准确性且便于实施。

为了更加清楚地说明本申请实施例的基于聚类对比学习的旋转机械故障诊断方法的实现流程，以及能够实现的技术效果，下面以一个在实际应用中的具体实施例进行详细说明。

在本实施例中，以已有PU数据集和CWRU轴承数据集为例，说明基于聚类对比学习的旋转机械故障诊断实现方法，及其在缺乏有标签故障样本时的分类性能。

其中，PU轴承数据集包含三种不同类型的数据，包括6种正常数据、12种人工故障数据和14种由加速寿命试验产生的真实故障。本申请选取运行状态为电机转速1500RPM，负载0.7Nm，径向力1000N的故障数据。在此基础上，本申请将轴承编号为K001的正常数据和12种人工故障数据组合为PU-A数据集，将轴承编号为K001的正常数据与14种真实故障数据组合为PU-B数据集，将6种正常数据单独作为验证集，命名为PU-C数据集。通过对信号进行切片划分，每一个信号能够产生多个数据样本，本申请中用于故障诊断的数据样本长度为2048。对于PU-A和PU-B数据集，对数据集中包含的每个类别的信号分别收集4110个数据样本进行预训练。对于PU-B和PU-C数据集，对每个故障类型的数据信号收集1000个样本进行测试，收集数量分别为[1,2,3,5,10]个数据样本进行微调。

CWRU数据集由不同测试条件下的多个传感器（安装位置位于驱动端、风扇端和基座）和多个零件（安装位置位于驱动端和风扇端）收集的共411种不同类别的故障数据。我们将所有的411种的数据收集为CWRU-A数据集，其中每个类别收集100个样本进行预训练。对于用于微调和测试的目标数据集，采用采样率为12k，故障部件和传感器位置都安装在轴承端的共10个类别的有标签子数据集进行微调和测试。对于每个故障类型收集1000个样本进行测试，收集分别为[1,2,3,5,10]数据样本进行微调。所有的数据样本包含2048个数据点。

在进行实验设置时，本申请中所有的实验方法均使用学习率设为1e-3，权重衰减参数为1e-5，小批量大小设置为512的SGD优化器，预训练轮次设置为100，对于每次训练的前10个训练轮次使用学习率预热策略，剩下的训练过程使用余弦学习率衰减策略。对于微调过程，SGD优化器的学习率重新设置为0.01，不再采用学习率衰减策略，将训练轮次设置为200，并采用适应微调数据集的小批量大小设置。每个实验重复5次。

对于对比方法的设置：本申请在PU和CWRU数据集上与当前在少样本故障诊断领域的最优方法进行了比较，具体如下：

RWKDCAE：基于宽卷积核的深度残差卷积自编码器是一种利用数据重建进行自监督学习从而实现少样本故障诊断方法。

Self-CNN：是将信号进行不同形式的数据增强形式，让特征编码器以数据增强方法的类别作为预测目标完成自监督预训练的故障诊断方法。

PM：通过提取和构造无标签信号中包含的先验知识和普遍特征作为特征编码器的预测目标完成自监督预训练的故障诊断方法。

SimCLR ：使用个体判别进行对比学习预训练方法。

MoCo ：使用个体判别和加以记忆银行辅助训练的对比学习预训练方法。

首先，在进行超参数的选择时，对于小样本故障诊断问题，通常难以采集到足够的有标签故障样本划分为验证集进行超参数的筛选。因此通过利用运行在不同状态下的正常信号作为验证集，其中不同的运行状态代表了验证集中不同正常信号的类别。利用故障诊断方法在验证集上获取的分类准确率数据来判断所训练的编码器是否学习到信号中具备区分性的特征。本申请中采用了包含6种不同正常轴承运行数据的PU-A数据集作为验证集进行超参数的选择。最终对于所提出的ClCo方法，对齐在聚类中心数量K从[5, 10, 15,20, 30]，和每个聚类中心附近正例样本选取的比例从[0.1,0.3,0.5,0.7,0.9]中搜索得到，以获取使得ClCo具备最佳性能表现的最优超参数。

其次，在PU数据集上对旋转机械故障诊断分类性能比较。本申请利用PU-B数据集测试了所有的采样数据（包括无标签的训练数据、有标签的微调和测试数据）都来自于同一个实验平台的故障情况，即所有诊断方法都采用PU-B上采集的无标签数据进行预训练，之后再使用PU-B上采集的少量有标签数据和用于检测分类性能的有标签进行微调和测试，得到的结果如以下表1所示：

表1：各类方法在PU-B数据集进行预训练和微调下的诊断性能比较表

表1展示了所提出的ClCo与5种当前最先进的方法在PU-B数据集上进行预训练和微调的故障分类性能比较，容易发现ClCo在使用不同数量的有标签训练样本情况下的性能都优于其他现有的方法，且当训练样本越少时ClCo的优势越大。特别是在使用一个标签数据进行微调的情况下，本申请提出的ClCo方法精度达到61.68%，明显优于其他方法。

本申请重新在PU-A数据集上采集无标签信号（源域数据），在PU-B数据集上采集用于微调和测试的信号（目标域数据），用于衡量不同方法在不同领域数据之间进行迁移故障诊断的能力，同时也是检测故障诊断方法提取不同领域信号中可能存在的普遍可区分特征的能力。

表2：在PU-A数据集进行预训练和在PU-B数据集进行微调下的诊断性能比较表

表2展示了提出的CICO与五种最先进的方法的在PU-A数据集进行预训练同时在PU-B数据集下微调所取得的实验比较结果。在所有使用不同有标签训练样本数量的情况下，本申请所提出的ClCO方法的准确率均显著优于所有比较方法，特别是当每类PU-B数据集只选取一个故障样本进行微调时，所提出的ClCO的准确率仍达到54.01%，较RWKDCAE[28]、self-CNN[16]、PM[17]、SimCLR[29]和MoCo[30]分别提高了44.39%、14.18%、16.57%、16.56%和10.99%。因此，本申请提出的CICO在处理小样本故障诊断问题上表现出了优异的性能，并且在预训练和测试来自不同领域的数据源时表现出了更好的迁移学习和泛化能力，这在实际的故障诊断中普遍存在。

再者，在CWRU数据集上对旋转机械故障诊断分类性能比较。

在CWRU-A数据集中包含了多个来自不同型号的故障轴承和振动传感器所收集的数据，模拟了现实情况中在不同的安装方式和工作场景中采集的振动数据；CWRU-B的微调和测试数据则只包含了一个零件在一个传感器下采集到的数据，用于模拟真实情况下所仅收集了少量故障样本的目标工作场景。

表3：在 CWRU-A数据集进行预训练和在CWRU-B数据集进行微调下的诊断性能比较表

表3中比较了不同的少样本故障诊断方法从多传感器多部件的故障领域到单传感器单部件的故障领域的分类性能。从实验结果可以看出，本申请所提出的ClCo方法明显优于其他的对比方法，而且当每类数据仅有一个样本时ClCo达到了的分类准确率，相比于RWKDCAE，Self-CNN，PM，SimCLR，MoCo分别提高了62.83%，56.6%，36.61%，7.8%和6.3%。ClCo在单样本故障诊断中展现的对信号普遍特征的提取能力，可以在以后的研究中提升在不平衡故障诊断和故障诊断的迁移学习领域的表现。

为了实现上述实施例，本申请还提出了一种基于聚类对比学习的旋转机械故障诊断系统，图6为本申请实施例提出的一种基于聚类对比学习的旋转机械故障诊断系统的结构示意图，如图6所示，该系统包括获取模块100、聚类模块200、增强模块300、训练模块400、提取模块500和诊断模块600。

其中，获取模块100，用于获取多个无标签振动信号,生成无标签训练集。

聚类模块200，用于提取无标签训练集的时频域特征，并基于时频域特征对无标签训练集进行聚类，以将无标签训练集划分为多个信号簇类。

增强模块300，用于对划分后的无标签训练集进行随机的数据增强，得到双视角训练集。

训练模块400，用于基于对比学习预训练的方式提取双视角训练集中信号的普遍特征，生成预训练完成的编码器。

提取模块500，用于采集少量的有标签振动信号，生成少样本数据集，并将少样本数据集输入预训练完成的编码器，提取少样本数据集的深层语义特征。

诊断模块600，用于将深层语义特征输入Softmax分类器进行分类器训练，并获取实际待测试的测试样本，将测试样本输入训练完成的编码器和分类器，获得测试样本对应的故障类别。

可选地，在本申请的一个实施例中，聚类模块200，具体用于：提取无标签训练集的12个时域特征和12个频域特征，并将12个时域特征和12个频域特征组合为长度为24的时频域特征向量；对时频域特征向量进行Z标准化处理。

可选地，在本申请的一个实施例中，聚类模块200，具体用于：基于时频域特征通过K-means聚类算法将无标签训练集划分为K个信号簇类，其中，每个信号簇类具有相似的时频域特性；通过预设的筛选机制为每个信号簇类中的信号样本分配伪标签，生成伪标签训练集。

可选地，在本申请的一个实施例中，聚类模块200，具体用于：在每个信号簇类中，确定每个信号样本与聚类中心的距离，并为预设占比的最接近聚类中心的信号样本，分配与聚类中心的编号对应的伪标签；对于每个信号簇类中在预设占比之外的信号样本，分配数值为0的伪标签；将无标签训练集与每个信号样本分配的伪标签进行组合，生成伪标签训练集。

可选地，在本申请的一个实施例中，增强模块300，具体用于：对划分后的无标签训练集依次进行两次随机的数据增强操作，获得每个信号样本对应的两个不同视角的数据；将两个不同视角的数据进行拼接，并根据每个信号样本的伪标签为对应的增强后生成的数据分配伪标签。

可选地，在本申请的一个实施例中，增强模块300，具体用于：将每个信号样本中随机四分之一的数据点设置为0；在每个信号样本中添加一个随机噪声，随机噪声符合均值为0且方差为0.01的正态分布；以随机概率继续通过随机噪声对每个信号样本进行缩放；以随机概率继续对每个信号样本通过傅里叶变换进行重采样，根据每个信号样本对应的原始样本长度和重采样样本长度更新样本信号；对变换后的伪标签训练集进行Z标准化处理。

可选地，在本申请的一个实施例中，训练模块400，具体用于：将双视角训练集输入预设的深度学习特征编码器进行运算，获得双视角训练集中每个信号对应的高维特征向量；通过多正例交叉熵损失对所述高维特征向量进行预训练，根据信号自身的相似度差异训练编码器学习相似度分布。

可选地，在本申请的一个实施例中，训练模块400，具体用于：对于双视角训练集中伪标签不为0的高维特征向量，增大具有相同伪标签的各个高维特征向量之间的相似度，并减少具有不同伪标签的各个高维特征向量之间的相似度；对于双视角训练集中伪标签为0的高维特征向量，将任一高维特征向量与除自身的另一个视角之外的每个高维特征向量之间的相似度降低。

需要说明的是，前述对基于聚类对比学习的旋转机械故障诊断方法的实施例的解释说明也适用于该实施例的系统，此处不再赘述。

综上所述，本申请实施例的基于聚类对比学习的旋转机械故障诊断系统，利用聚类将真实故障领域中广泛存在的无标签信号划分为具有不同时频域特征的簇类，并通过对比学习放大处于同一簇类信号的相似性，同时增强不同簇类之间的区分性，从而使编码器能获取信号中普遍存在的可区分特征。由此，该系统提升了少样本的学习能力，可以从无标签的训练样本中自适应地学习具有深层语义的故障特征表示，能使用较少的有标签数据完成故障模式判别，且可以取得极高的故障诊断准确率。从而，该系统大大降低当前故障诊断领域对有标签数据的需求，可以避免采集大量的有标签数据，降低了故障诊断的成本，提高故障诊断的准确性且便于实施。

为了实现上述实施例，本申请还提出了一种非临时性计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现如上述实施例中任一所述的基于聚类对比学习的旋转机械故障诊断方法。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、 “示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本申请的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备（如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统）使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例（非穷尽性列表）包括以下：具有一个或多个布线的电连接部（电子装置），便携式计算机盘盒（磁装置），随机存取存储器（RAM），只读存储器（ROM），可擦除可编辑只读存储器（EPROM或闪速存储器），光纤装置，以及便携式光盘只读存储器（CDROM）。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如，如果用硬件来实现和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列（PGA），现场可编程门阵列（FPGA）等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本申请各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种基于聚类对比学习的旋转机械故障诊断方法，其特征在于，包括以下步骤：

获取多个无标签振动信号，生成无标签训练集；

提取所述无标签训练集的时频域特征，并基于所述时频域特征通过K-means聚类算法对所述无标签训练集进行聚类，以将所述无标签训练集划分为多个信号簇类，其中，在每个所述信号簇类中，确定每个信号样本与聚类中心的距离，并为预设占比的最接近聚类中心的信号样本，分配与聚类中心的编号对应的伪标签，对于每个所述信号簇类中在所述预设占比之外的信号样本，分配数值为0的伪标签，将所述无标签训练集与每个信号样本分配的所述伪标签进行组合，生成伪标签训练集；

对所述划分后的无标签训练集依次进行两次随机的数据增强操作，获得每个信号样本对应的两个不同视角的数据，将所述两个不同视角的数据进行拼接，并根据每个所述信号样本的伪标签为对应的增强后生成的数据分配伪标签，以得到双视角训练集；

基于对比学习预训练的方式提取所述双视角训练集中信号的普遍存在的可区分特征，生成预训练完成的编码器，其中，将所述双视角训练集输入预设的深度学习特征编码器进行运算，获得所述双视角训练集中每个信号对应的高维特征向量，通过多正例交叉熵损失对所述高维特征向量进行预训练，根据信号自身的相似度差异训练编码器学习相似度分布；

2.根据权利要求1所述的基于聚类对比学习的旋转机械故障诊断方法，其特征在于，所述提取所述无标签训练集的时频域特征，包括：

提取所述无标签训练集的12个时域特征和12个频域特征，并将所述12个时域特征和所述12个频域特征组合为长度为24的时频域特征向量；

对所述时频域特征向量进行Z标准化处理；

其中，所述12个时域特征，包括时域上的均值、标准差、平方根振幅、绝对均值、偏度、峰度、方差、峰度指数、峰值指数、波形指数、脉冲指数和偏度指数，所述12个频域特征，包括频域上的均值、标准差、方差、偏度、陡度、重力频率、均方根、平均频率、正则度、变异参数、八阶矩和十六阶矩。

3.根据权利要求1所述的基于聚类对比学习的旋转机械故障诊断方法，其特征在于，每个所述信号簇类具有相似的时频域特性。

4.根据权利要求1所述的基于聚类对比学习的旋转机械故障诊断方法，其特征在于，对所述划分后的无标签训练集依次进行两次随机的数据增强操作，包括：

将每个所述信号样本中随机四分之一的数据点设置为0；

在每个所述信号样本中添加一个随机噪声，所述随机噪声符合均值为0且方差为0.01的正态分布；

以随机概率继续通过所述随机噪声对每个所述信号样本进行缩放；

以随机概率继续对每个所述信号样本通过傅里叶变换进行重采样，根据每个所述信号样本对应的原始样本长度和重采样样本长度更新样本信号；

对变换后的伪标签训练集进行Z标准化处理。

5.根据权利要求1所述的基于聚类对比学习的旋转机械故障诊断方法，其特征在于，所述根据信号自身的相似度差异训练编码器学习相似度分布，包括：

对于所述双视角训练集中伪标签不为0的高维特征向量，增大具有相同伪标签的各个高维特征向量之间的相似度，并减少具有不同伪标签的各个高维特征向量之间的相似度；

对于所述双视角训练集中伪标签为0的高维特征向量，将任一高维特征向量与除自身的另一个视角之外的每个高维特征向量之间的相似度降低。

6.一种基于聚类对比学习的旋转机械故障诊断系统，其特征在于，包括以下模块：

聚类模块，用于提取所述无标签训练集的时频域特征，并基于所述时频域特征通过K-means聚类算法对所述无标签训练集进行聚类，以将所述无标签训练集划分为多个信号簇类，其中，在每个所述信号簇类中，确定每个信号样本与聚类中心的距离，并为预设占比的最接近聚类中心的信号样本，分配与聚类中心的编号对应的伪标签，对于每个所述信号簇类中在所述预设占比之外的信号样本，分配数值为0的伪标签，将所述无标签训练集与每个信号样本分配的所述伪标签进行组合，生成伪标签训练集；

增强模块，用于对所述划分后的无标签训练集依次进行两次随机的数据增强操作，获得每个信号样本对应的两个不同视角的数据，将所述两个不同视角的数据进行拼接，并根据每个所述信号样本的伪标签为对应的增强后生成的数据分配伪标签，以得到双视角训练集；

训练模块，用于基于对比学习预训练的方式提取所述双视角训练集中信号的普遍存在的可区分特征，生成预训练完成的编码器，其中，将所述双视角训练集输入预设的深度学习特征编码器进行运算，获得所述双视角训练集中每个信号对应的高维特征向量，通过多正例交叉熵损失对所述高维特征向量进行预训练，根据信号自身的相似度差异训练编码器学习相似度分布；

7.一种非临时性计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，实现如权利要求1-5中任一所述的基于聚类对比学习的旋转机械故障诊断方法。