CN113204738B

CN113204738B - 一种基于小波变换与拓扑数据分析的机械故障特征提取方法

Info

Publication number: CN113204738B
Application number: CN202110480837.0A
Authority: CN
Inventors: 李沂滨; 汪雨晴; 贾磊; 宋艳; 徐丹雅; 郑维红; 李沐阳; 张悦
Original assignee: Shandong University
Current assignee: Shandong University
Priority date: 2021-04-30
Filing date: 2021-04-30
Publication date: 2022-04-08
Anticipated expiration: 2041-04-30
Also published as: CN113204738A

Abstract

本发明涉及一种基于小波变换与拓扑数据分析的机械故障特征提取方法，该方法并行使用小波变换和拓扑数据分析对原始信号进行特征分析，将两组特征进行并行融合，作为输入送入到后续的分类网络中去，一方面不仅采用小波变换分析考虑了机械故障数据时域和频域的特征，从多个尺度分析原始振动信号，从非平稳的原始时域信号中，提取出更优特征；另一方面，将拓扑数据分析应用在故障诊断领域，利用拓扑数据分析方法也可以在有噪音的影响下，能有效挖掘出故障数据集之间的深层次的拓扑关系和隐藏数据中的形状，提取出更加鲁棒、更加重要的数据特征，有助于提升后续故障类型分类准确率。

Description

一种基于小波变换与拓扑数据分析的机械故障特征提取方法

技术领域

本发明涉及一种基于小波变换与拓扑数据分析的机械故障特征提取方法，属于特征提取技术领域。

背景技术

随着科学技术的飞速发展，现代工业中的机械设备功能越来越复杂。机械设备的故障诊断成为系统设计和维护中最关键的方面。机器故障可能会造成巨大的经济损失，有时还会对使用机器的人员造成威胁。故障诊断在监视数据与机器健康状态之间的关系中起着重要作用，这已成为机器健康管理中广泛关注的问题，其中，提高诊断准确性尤为重要。而故障分类步骤中，特征提取又是最为关键的一环，因此，从机械故障信号中提取的特征的好坏直接影响故障诊断准确率。

故障诊断的基本方法是在被测部件周围安置传感器，监测振动信号，利用故障诊断算法进行检测。常见的故障诊断系统通常包括两个关键步骤：数据处理(特征提取)，故障分类识别。最常见的智能故障诊断系统是基于特征提取算法的预处理来构建的，转换输入模式，以便可以用低维特征向量表示它们，从而更易于匹配和比较。然后，将特征向量用作用于故障识别的AI技术的输入。故障诊断的步骤相当于将特征空间中获得的信息映射到故障空间中的机器故障。

然而，一方面大多数传统方法的诊断性能在很大程度上取决于提取和选择的特征的质量，在工程实践中，所收集的振动信号始终是数据量大，复杂且不稳定的，并且噪声很大。不仅如此，在多数情况下，特征选择在很大程度上取决于诊断专家的工程经验，对于复杂庞大的数据集，利用专家经验做出有用假设变得非常困难。另一方面，浅层的学习模型很难有效地学习故障数据之间复杂的非线性关系。

发明内容

传统故障特征提取方法往往基于时域分析，使用原始的振动信号进行故障诊断分析，会忽略振动信号的频域特性，在故障特征的提取和选择上有一定的局限性；同时，无论是实验所用的振动信号或是实际采集到的原始振动信号，数据体量大，复杂性高，传统的浅层学习模型难以数据之间复杂的关系。

针对现有技术的不足，本发明提供一种基于小波变换与拓扑数据分析的机械故障特征提取方法。该方法并行使用小波变换和拓扑数据分析对原始信号进行特征分析，可以更加全面、有效地提取原始信号的有效特征，并且不依赖专家经验。将两组特征进行并行融合，作为输入送入到后续的分类网络中去。

术语原理解释：如果一个时间序列是由一个确定性的非线性动力系统产生的，则由时间序列来恢复并刻画原动力系统称为相空间重构。相空间重构基本思想：为了重构一个等价的状态空间，只需考察一个分量，并将他在某些固定的时间延迟点上的测量作为新的维数处理，它们确定了某个多维状态空间的一点。重复这一过程并测量相对于不同时间的各延迟量，就可以产生出许多这样的点，它可以将原系统的许多性质保存下来，即用系统的一个观察量可以重构出原动力系统模型，可以初步确定原系统的真实信息。Takens定理：证明了所需维数d大小的嵌入定理:为了保证该相空间容纳该状态空间原来吸引子的拓扑特征，如果原来吸引子处在一个m维空间中，那么，将该吸引子嵌入其中的相空间维数必须达到d>＝2m+1。Takens定理是最首要、最基本的相空间重构办法。

本发明的技术方案如下：

一种基于小波变换与拓扑数据分析的机械故障特征提取方法，包括步骤如下：

1.选取原始机械振动数据作为训练集，对训练集中的每一个样本做小波变换，将原始机械振动信号的时域图转换为相应的时频图；

2.选取与步骤1相同的原始机械振动数据，对所有数据样本选择最优的时延嵌入参数，并生成对应的持久性图表(PD)，将生成的持久性图表向量化，即持久性图片(PI)；

3.将提取到的两组特征集相互融合用于生成新的特征集，即特征融合，以此组成新的特征向量，并进行全局主成分分析(GPCA)，构建数据-标签对，作为后续分类神经网络的输入；

4.利用训练集融合后数据对卷积神经网络进行不断的迭代训练，优化神经网络参数；

另取一组测试集数据，对测试集中的振动信号同样进行步骤1、2的小波变换和PI图生成，并将生成的两组特征进行步骤3的特征融合之后输入到训练完成的卷积神经网络，对振动数据进行故障分类。

优选的，步骤1中，小波变换是一种针对信号的非平稳特性的技术，可以很好的体现出信号的相关特性。小波变换是一种具有固定窗口大小的时频分析方法，但是可以改变窗口的形状，使其具有多分辨率。小波变换具有时域和频域局部分析的能力，被广泛应用与机械部件的诊断中。

小波变换的公式如下：

其中，α是控制小波函数伸缩的尺度，β是控制小波函数平移的平移量，

为母小波函数，代表一个函数族，通过小波变换，一维的轴承振动时域信号被转换为二维函数U(α,β)，即将原始的轴承振动信号转化为相应的时频图，因此在一个特定的时间常数(参数β)下,可以确定一个特定的频率(参数α)。t是时间。

优选的，步骤2中，拓扑数据分析基于持久同源性理论，从数据形成的点云中获得有关数据本身的拓扑特征的信息，所述拓扑特征信息包括连通性、回路、空隙、二维拓扑特征；在获得数据点云的基础上，通过构建Vietoris-Rips复合体，得到持久性图表(PD)，如附图1所示。

进一步优选的，Vietoris-Rips复合体具体构建过程为：如附图1所示，黄色的为ε-球(以ε半径的虚线圆)去围绕d维空间点集P中的每一个点，并在这个点和它的圈内的所有其他点之间连线。

定义解释：单纯复形：拓扑数据分析使用了单纯复形，这是一种由叫做单纯形的几何结构组成而成。TDA使用单纯复形是因为它们可以近似比较复杂的形状，而且它们比它们近似的原始图形在数学和计算上更容易处理。构建VR复形：如果在d维空间中有一个点集P，R^d的子集，那么比例ε的VR复形V_ε(P)是这样定义的：

意思是，比例ε下的VR复形是集合V_ε(P)中的P的所有子集σ，也就是说σ中任何不同点之间的距离不大于参数ε。

持久性图表(PD)表明了在构建Vietoris-Rips复合体的过程中，每一种拓扑特征出现和消亡的时间点，而这些特征持续的时间则代表了这些特征在拓扑空间中的鲁棒性，越是重要的特征，存在的时间越长。因此，拓扑数据分析非常适用于有噪声干扰的数据处理场景。然而，拓扑数据分析是针对多维数据更为有效的方法，因此，对于单变量的机械振动数据，利用时间延迟变量将一维时间变量数据嵌入到更高维的空间中；即，对于给定序列X(t),t＝1,2,…,n,可以构建一个延时图Y(t)＝[X(t),X(t-τ),X(t-2τ),…,X(t-dτ),]，其中，τ是时延参数，d是维数；x(t)代表一维时间序列{x1,...,xt}，n指一个数据样本的长度；该序列就是要处理的一维原始机械故障数据；在本方法中，选定好最优的τ和d之后，将原始振动信号在d维空间中重构，并得到持久性图表(PD)，重构的过程就是根据takens定理将一维时间序列通过选定好的d和τ,即时间延迟参数嵌入到高维空间中；为了适应后续神经网络的输入，将步骤2中得到的持久性图表(PD)向量化，转换成张量形式的持久性图片(PI)；所述时延嵌入参数即维数d和时延参数τ。

进一步优选的，τ和d的选定具体为：

在Takens嵌入定理中，嵌入维数和延迟时间都只是理论上证明了其存在性，并没有给出具体的表达式，而且实际应用中时间序列都是有噪声的有限序列，嵌入维数和时间延迟必须要根据实际的情况来选取合适的值。

确定τ——采用交互信息法：确定整个时间序列的最大值x_max和最小值x_min，设p_k为第k个时间样本数据中一个元素的概率，p_j,k是x_i在第j个时间样本中而x_i+τ在第k个时间样本中的概率，交互信息定义为：

此处，n_bins为时间序列的总样本数。

I(τ)第一个最小值就是最佳的时延参数τ；

确定d——采用虚假最邻近点法：该方法基于这样一种假设，即“展开”或将一个确定性系统嵌入到连续的高维空间是平滑的。换言之，在一个嵌入维度接近的点应该在更高维的嵌入维中也接近；如果有一个点p_i和近邻p_j,判断下一个维度的标准化距离R_i是否大于某个阈值R_th：

如果R_i>R_th，就有一个“虚假近邻”，通过最小化这些近邻的总数来获得最佳嵌入维数；从嵌入维数的最小值2开始，计算虚假最临近点的比例，然后逐渐增加维数d,直到虚假最临近点的比例小于5％或者虚假最临近点的不再随着d的增加而减少时，此时的d就是嵌入维数。

优选的，步骤3中，特征融合是指将两个或多个特征向量按照某种规则组合成新的特征向量。最常规的特征融合方法包括串行融合方法和并行融合方法。串行融合方法是单纯地将一个m维特征向量和一个n维特征向量进行组合，则新的特征向量的则是(m+n)。并行融合方法则与之不同，并不是简单的将两组特征合并。将上述两组提取到的特征进行并行特征融合，组成卷积神经网络的输入张量；两组特征向量分别是小波变换和拓扑数据分析提取到的两路特征。

进一步优选的，特征融合为：假设三个特征空间A、B和C中有三个特征向量，α∈A,β∈B,γ∈C,并行特征融合方式是将α、β和γ三个特征向量合并成一个复合的δ特征向量，其公式如下：

δ＝α+iβ+jγ (4)

其中，i，j均为虚数单位，当α、β和γ的维数不一致时，低维的特征需要补0，三个特征才能进行并行融合。

主成分分析(PCA)是利用降维的思想多指标转换为少数几个综合指标，往往能够保留住数据最重要的方面。其中经典主成分分析是全局主成分分析的一个特例。

因此，特征融合不只是包含特征组合，同时也包含了对组合的特征进行降维等重新处理的过程，再一次筛选了具有区分性的信息，同时消除了冗余或无效信息。

优选的，步骤4中，所述优化神经网络参数为：优化卷积核的权重和偏置，利用反向传播算法进行优化：定义损失函数，量化batch样本通过前向传播算法的预测值与真实值之间的差距，使用Adam算法更新神经网络参数的取值。

优选的，步骤3中，所述构建数据-标签对为：每个数据样本对应不同的故障类型，故障类型包括正常、内圈故障、外圈故障、滚动体故障，每种故障类型用不同的标签表示，标签包括0、1、2、3，正常、内圈故障、外圈故障、滚动体故障分别对应于0、1、2、3。

小波变换和有时间延迟嵌入的拓扑数据分析技术(TDA)的结合是解决该问题的一个方法，不仅可以对故障数据集进行时域和频域分析，同时可以对投影到高维的故障数据集进行拓扑结构的研究，识别和挖掘高维空间中数据的形状和数据之间的关系和模式。

本发明的有益效果在于：

本发明与现有技术方案相比，一方面不仅采用小波变换分析考虑了机械故障数据时域和频域的特征，从多个尺度分析原始振动信号，从非平稳的原始时域信号中，提取出更优特征；另一方面，将拓扑数据分析应用在故障诊断领域，利用拓扑数据分析方法也可以在有噪音的影响下，能有效挖掘出故障数据集之间的深层次的拓扑关系和隐藏数据中的形状，提取出更加鲁棒、更加重要的数据特征，有助于提升后续故障类型分类准确率。再者，小波变换时在低维空间中提取时频域的特征，对数据进行处理时会有冗余度的出现；而拓扑数据分析是在高维空间中处理数据，两者结合，把低维和高维空间中的重要特征提取出来。最后，通过特征融合的方式将两组特征合融合成一组新特征，提取出更为精炼和有效的特征，为后续故障分类网络提供输入。

附图说明

图1为持久性图表(PD)原理图；从a)到e)是连续的变化过程；a)到e)中点集右边的横线图为持久性条形码，是拓扑形状的一种直观表示，表明数据集实际具有这种形状。

a)：对于半径r＝0，球的并集减小到初始有限点集，每个点都对应于0维拓扑特征，即连接组件。在r＝0时，为每个特征创建一个出生的时间点。

b)：一些球开始重叠，导致一些连接在一起的组件合并在一起而死亡；持久性图跟踪这些死亡，并记录死亡时间点，形成一个间隔(interval)。

c)：又有一些组件合并，并出现了两个新的一维特征，从而出生开始出现了两个新间隔(球中的连线及对应右边横线图中长线下方新出现的两个短线)。

d)：两个一维循环中的一个已被填充，导致其在这一过程中死亡并且其相应的间隔结束。

e)：所有一维特征均已消失，仅保留了较长的(且永不消逝)间隔(即横线图中的最长线)。与前面的示例一样，最终条形码也可以等效地表示为持久性图表，其中每个间隔(a,b)均由R²中的坐标点(a,b)表示。条形码中的间隔越长，或者在持久性图表中等效地，距对角线越远的点，表示在变化过程中相应的同源性就越持久，因此也就越相关，即表明该拓扑特征的重要性。

图2为基于小波变换与拓扑数据分析机械故障特征提取模型。

具体实施方式

下面通过实施例并结合附图对本发明做进一步说明，但不限于此。

实施例1

小波变换是一种针对信号的非平稳特性的技术，可以很好的体现出信号的相关特性。小波变换是一种具有固定窗口大小的时频分析方法，但是可以改变窗口的形状，使其具有多分辨率。小波变换具有时域和频域局部分析的能力，被广泛应用与机械部件的诊断中。

小波变换的公式如下：

拓扑数据分析基于持久同源性理论，从数据形成的点云中获得有关数据本身的拓扑特征的信息，所述拓扑特征信息包括连通性、回路、空隙、二维拓扑特征；在获得数据点云的基础上，通过构建Vietoris-Rips复合体，得到持久性图表(PD)，如附图1所示。

Vietoris-Rips复合体具体构建过程为：如附图1所示，灰色的为ε-球(以ε半径的虚线圆)去围绕d维空间点集P中的每一个点，并在这个点和它的圈内的所有其他点之间连线。

进一步，τ和d的选定具体为：

确定τ——采用交互信息法：确定整个时间序列的最大值x_max和最小值x_min，设p_k为第k个时间样本数据中一个元素的概率，p_j，k是x_i在第j个时间样本中而x_i+τ在第k个时间样本中的概率，交互信息定义为：

此处，n_bins为时间序列的总样本数。

I(τ)第一个最小值就是最佳的时延参数τ；

特征融合是指将两个或多个特征向量按照某种规则组合成新的特征向量。最常规的特征融合方法包括串行融合方法和并行融合方法。串行融合方法是单纯地将一个m维特征向量和一个n维特征向量进行组合，则新的特征向量的则是(m+n)。并行融合方法则与之不同，并不是简单的将两组特征合并。将上述两组提取到的特征进行并行特征融合，组成卷积神经网络的输入张量；两组特征向量分别是小波变换和拓扑数据分析提取到的两路特征。

δ＝α+iβ+jγ (4)

所述构建数据-标签对具体为：每个数据样本对应不同的故障类型，故障类型包括正常、内圈故障、外圈故障、滚动体故障，每种故障类型用不同的标签表示，标签包括0、1、2、3，正常、内圈故障、外圈故障、滚动体故障分别对应于0、1、2、3。

所述优化神经网络参数为：优化卷积核的权重和偏置，利用反向传播算法进行优化：定义损失函数，量化batch样本通过前向传播算法的预测值与真实值之间的差距，使用Adam算法更新神经网络参数的取值。

实验例1：

以凯斯西储大学的轴承故障振动数据集为例，详细叙述本方法。

凯斯西储数据集包含四种不同工况负载(0HP,1HP,2HP,3HP)下的振动数据,同时又包含一种正常状态和三种故障状态的数据(内圈故障、外圈故障、滚动体故障),每种故障又分为不同的故障直径，因此整个数据集一共有九种故障类型。本实施方式采用同一故障尺寸，不同负载下的数据集进行实验。本方案还可以使用不同故障尺寸或者不同负载的数据，此例仅为参考理解。

步骤1：对原始振动训练数据进行预处理，所述预处理指的是对原始振动数据集进行切分，每1024个数据组成一个样本数据，首先对原始振动数据进行小波变换，由于目前尚无标准或者通用的母小波选取方法，本实施方式选择了Morlet小波作为母小波，运算公式如下。

其中，α是控制小波函数伸缩的尺度，β是控制小波函数平移的平移量。

步骤2：选取与步骤1相同的原始机械振动数据，通过自定义的函数选取最优的时延参数τ和重构空间的维数d。将训练集投影到高维空间中，根据持久同源性生成持久性图表(PD)。对于给定的时间序列X(t)，使用

来表示生成的二维PD图。

步骤3：由步骤1和步骤2得到的两组特征进行特征融合，根据公式(4)，生成的新特征为

F_WT+iF_TDA，具体为F_new＝F_WT+iF_TDA

F_WT:小波变换后生成的特征，F_TDA：拓扑数据分析后生成的特征，随后对得到的并行结合形式按照以下公式进行GPCA降维变换，构建标签-数据对，以适应后续神经网络的输入。

Y＝Φ^HX (5)

其中，Φ＝(ξ₁，…，ξ_d),ξ₁，…,ξ_d为投影轴，X:降维变换之前的特征张量，Y:降维变换后的特征张量。

步骤4：构建卷积神经网络，设置网络参数。双层卷积神经网络由四层组成：两个卷积层和两个池化层，第一个卷积层含有16个卷积核，第二个卷积层含有32个卷积核。卷积核大小为3*3，每个卷积层采用ReLU激活函数，进行最大池化操作，窗口大小为2*2。二维卷积定义为：

其中，W为卷积核，X为输入，*表示卷积操作，s(i,j)：卷积后得到的特征图的第i行第j列的元素，i,j：输入矩阵中元素的下标，m,n:卷积核的元素下标。

池化层运算公式如下所示：

其中，

为r层的第j个输入特征图，

为r+1层的第j个输出特征图。m为池化核的尺寸大小，等式左边的c,d:r+1层的第j个输出特征图的元素坐标，等式右边的c,d:r层的第j个输入特征图的元素坐标，p,q:池化窗口坐标，r:卷积神经网络第r层。

Claims

1.一种基于小波变换与拓扑数据分析的机械故障特征提取方法，其特征在于，包括步骤如下：

步骤1.选取原始机械振动数据作为训练集，对训练集中的每一个样本做小波变换，将原始机械振动信号的时域图转换为相应的时频图；

步骤2.选取与步骤1相同的原始机械振动数据，对所有数据样本选择最优的时延嵌入参数，并生成对应的持久性图表(PD)，将生成的持久性图表向量化，即持久性图片(PI)；

从数据形成的点云中获得有关数据本身的拓扑特征的信息，所述拓扑特征信息包括连通性、回路、空隙、二维拓扑特征；在获得数据点云的基础上，通过构建Vietoris-Rips复合体，得到持久性图表(PD)；

对于单变量的机械振动数据，利用时间延迟变量将一维时间变量数据嵌入到更高维的空间中；即，对于给定序列X(t)，t＝1，2，…，n，可以构建一个延时图Y(t)＝[X(t)，X(t-τ)，X(t-2_τ，...，Xt-dτ，]，其中，τ是时延参数，d是维数；x(t)代表一维时间序列{x1,...,xt}，n指一个数据样本的长度；该序列就是要处理的一维原始机械故障数据；选定好最优的τ和d之后，将原始振动信号在d维空间中重构，并得到持久性图表(PD)，重构的过程就是根据takens定理将一维时间序列通过选定好的d和τ,即时间延迟参数嵌入到高维空间中；将步骤2中得到的持久性图表(PD)向量化，转换成张量形式的持久性图片(PI)；所述时延嵌入参数即维数d和时延参数τ；

步骤3.将步骤1小波变换生成的时频图和步骤2获得的持久性图片(PI)相互融合用于生成新的特征集，即特征融合，以此组成新的特征向量，并进行全局主成分分析(GPCA)，构建数据-标签对，作为后续分类神经网络的输入；

步骤4.利用训练集融合后数据对卷积神经网络进行不断的迭代训练，优化神经网络参数；

另取一组测试集数据，对测试集中的振动信号同样进行步骤1、步骤2的小波变换和持久性图片(PI)生成，并将生成的两组特征进行步骤3的特征融合之后输入到训练完成的卷积神经网络，对振动数据进行故障分类。

2.根据权利要求1所述的基于小波变换与拓扑数据分析的机械故障特征提取方法，其特征在于，步骤1中，小波变换的公式如下：

为母小波函数，代表一个函数族，通过小波变换，一维的轴承振动时域信号被转换为二维函数U(α,β)，即将原始的轴承振动信号转化为相应的时频图，t是时间，x(t)为输入时间序列。

3.根据权利要求1所述的基于小波变换与拓扑数据分析的机械故障特征提取方法，其特征在于，Vietoris-Rips复合体具体构建过程为：以ε半径的虚线圆去围绕d维空间点集P中的每一个点，并在这个点和它的圈内的所有其他点之间连线。

4.根据权利要求1所述的基于小波变换与拓扑数据分析的机械故障特征提取方法，其特征在于，τ和d的选定具体为：

此处，n_bins为时间序列的总样本数；

I(τ)第一个最小值就是最佳的时延参数τ；

确定d——采用虚假最邻近点法：在一个嵌入维度接近的点应该在更高维的嵌入维中也接近；如果有一个点p_i和近邻p_j,判断下一个维度的标准化距离R_i是否大于某个阈值R_th：

5.根据权利要求1所述的基于小波变换与拓扑数据分析的机械故障特征提取方法，其特征在于，步骤3中，将上述两组提取到的特征进行并行特征融合，组成卷积神经网络的输入张量；两组特征向量分别是小波变换和拓扑数据分析提取到的两路特征。

6.根据权利要求5所述的基于小波变换与拓扑数据分析的机械故障特征提取方法，其特征在于，并行特征融合为：假设三个特征空间A、B和C中有三个特征向量，a∈A,p∈B,γ∈C,并行特征融合方式是将α、β和γ三个特征向量合并成一个复合的δ特征向量，其公式如下：

δ＝α+iβ+jγ (4)

其中，i，j均为虚数单位，当α、β和γ的维数不一致时，低维的特征需要补0，三个特征才能进行并行融合；两组特征向量融合时γ取0。

7.根据权利要求1所述的基于小波变换与拓扑数据分析的机械故障特征提取方法，其特征在于，步骤4中，所述优化神经网络参数为：优化卷积核的权重和偏置，利用反向传播算法进行优化：定义损失函数，量化batch样本通过前向传播算法的预测值与真实值之间的差距，使用Adam算法更新神经网络参数的取值。

8.根据权利要求1所述的基于小波变换与拓扑数据分析的机械故障特征提取方法，其特征在于，步骤3中，所述构建数据-标签对为：每个数据样本对应不同的故障类型，故障类型包括正常、内圈故障、外圈故障、滚动体故障，每种故障类型用不同的标签表示，标签包括0、1、2、3，正常、内圈故障、外圈故障、滚动体故障分别对应于0、1、2、3。