CN113204738B - 一种基于小波变换与拓扑数据分析的机械故障特征提取方法 - Google Patents
一种基于小波变换与拓扑数据分析的机械故障特征提取方法 Download PDFInfo
- Publication number
- CN113204738B CN113204738B CN202110480837.0A CN202110480837A CN113204738B CN 113204738 B CN113204738 B CN 113204738B CN 202110480837 A CN202110480837 A CN 202110480837A CN 113204738 B CN113204738 B CN 113204738B
- Authority
- CN
- China
- Prior art keywords
- data
- fault
- wavelet transformation
- topological
- dimensional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010937 topological data analysis Methods 0.000 title claims abstract description 41
- 230000009466 transformation Effects 0.000 title claims abstract description 38
- 238000000605 extraction Methods 0.000 title claims abstract description 22
- 238000000034 method Methods 0.000 claims abstract description 40
- 230000004927 fusion Effects 0.000 claims abstract description 23
- 230000002688 persistence Effects 0.000 claims description 32
- 239000013598 vector Substances 0.000 claims description 19
- 238000013528 artificial neural network Methods 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 14
- 238000013527 convolutional neural network Methods 0.000 claims description 12
- 238000010586 diagram Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 9
- 238000013519 translation Methods 0.000 claims description 8
- 238000000513 principal component analysis Methods 0.000 claims description 7
- 238000005096 rolling process Methods 0.000 claims description 7
- 238000012360 testing method Methods 0.000 claims description 6
- 230000002085 persistent effect Effects 0.000 claims description 5
- 230000008602 contraction Effects 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 239000002131 composite material Substances 0.000 claims description 3
- 230000002452 interceptive effect Effects 0.000 claims description 3
- 238000003745 diagnosis Methods 0.000 abstract description 13
- 238000004458 analytical method Methods 0.000 abstract description 9
- 230000006870 function Effects 0.000 description 17
- 238000007500 overflow downdraw method Methods 0.000 description 12
- 238000010276 construction Methods 0.000 description 6
- 238000011176 pooling Methods 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000034994 death Effects 0.000 description 2
- 231100000517 death Toxicity 0.000 description 2
- 238000005183 dynamical system Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 108010007425 oligomycin sensitivity conferring protein Proteins 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010924 continuous production Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000012958 reprocessing Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/148—Wavelet transforms
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01H—MEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
- G01H17/00—Measuring mechanical vibrations or ultrasonic, sonic or infrasonic waves, not provided for in the preceding groups
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M99/00—Subject matter not provided for in other groups of this subclass
- G01M99/005—Testing of complete machines, e.g. washing-machines or mobile phones
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Computational Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Complex Calculations (AREA)
Abstract
本发明涉及一种基于小波变换与拓扑数据分析的机械故障特征提取方法,该方法并行使用小波变换和拓扑数据分析对原始信号进行特征分析,将两组特征进行并行融合,作为输入送入到后续的分类网络中去,一方面不仅采用小波变换分析考虑了机械故障数据时域和频域的特征,从多个尺度分析原始振动信号,从非平稳的原始时域信号中,提取出更优特征;另一方面,将拓扑数据分析应用在故障诊断领域,利用拓扑数据分析方法也可以在有噪音的影响下,能有效挖掘出故障数据集之间的深层次的拓扑关系和隐藏数据中的形状,提取出更加鲁棒、更加重要的数据特征,有助于提升后续故障类型分类准确率。
Description
技术领域
本发明涉及一种基于小波变换与拓扑数据分析的机械故障特征提取方法,属于特征提取技术领域。
背景技术
随着科学技术的飞速发展,现代工业中的机械设备功能越来越复杂。机械设备的故障诊断成为系统设计和维护中最关键的方面。机器故障可能会造成巨大的经济损失,有时还会对使用机器的人员造成威胁。故障诊断在监视数据与机器健康状态之间的关系中起着重要作用,这已成为机器健康管理中广泛关注的问题,其中,提高诊断准确性尤为重要。而故障分类步骤中,特征提取又是最为关键的一环,因此,从机械故障信号中提取的特征的好坏直接影响故障诊断准确率。
故障诊断的基本方法是在被测部件周围安置传感器,监测振动信号,利用故障诊断算法进行检测。常见的故障诊断系统通常包括两个关键步骤:数据处理(特征提取),故障分类识别。最常见的智能故障诊断系统是基于特征提取算法的预处理来构建的,转换输入模式,以便可以用低维特征向量表示它们,从而更易于匹配和比较。然后,将特征向量用作用于故障识别的AI技术的输入。故障诊断的步骤相当于将特征空间中获得的信息映射到故障空间中的机器故障。
然而,一方面大多数传统方法的诊断性能在很大程度上取决于提取和选择的特征的质量,在工程实践中,所收集的振动信号始终是数据量大,复杂且不稳定的,并且噪声很大。不仅如此,在多数情况下,特征选择在很大程度上取决于诊断专家的工程经验,对于复杂庞大的数据集,利用专家经验做出有用假设变得非常困难。另一方面,浅层的学习模型很难有效地学习故障数据之间复杂的非线性关系。
发明内容
传统故障特征提取方法往往基于时域分析,使用原始的振动信号进行故障诊断分析,会忽略振动信号的频域特性,在故障特征的提取和选择上有一定的局限性;同时,无论是实验所用的振动信号或是实际采集到的原始振动信号,数据体量大,复杂性高,传统的浅层学习模型难以数据之间复杂的关系。
针对现有技术的不足,本发明提供一种基于小波变换与拓扑数据分析的机械故障特征提取方法。该方法并行使用小波变换和拓扑数据分析对原始信号进行特征分析,可以更加全面、有效地提取原始信号的有效特征,并且不依赖专家经验。将两组特征进行并行融合,作为输入送入到后续的分类网络中去。
术语原理解释:如果一个时间序列是由一个确定性的非线性动力系统产生的,则由时间序列来恢复并刻画原动力系统称为相空间重构。相空间重构基本思想:为了重构一个等价的状态空间,只需考察一个分量,并将他在某些固定的时间延迟点上的测量作为新的维数处理,它们确定了某个多维状态空间的一点。重复这一过程并测量相对于不同时间的各延迟量,就可以产生出许多这样的点,它可以将原系统的许多性质保存下来,即用系统的一个观察量可以重构出原动力系统模型,可以初步确定原系统的真实信息。Takens定理:证明了所需维数d大小的嵌入定理:为了保证该相空间容纳该状态空间原来吸引子的拓扑特征,如果原来吸引子处在一个m维空间中,那么,将该吸引子嵌入其中的相空间维数必须达到d>=2m+1。Takens定理是最首要、最基本的相空间重构办法。
本发明的技术方案如下:
一种基于小波变换与拓扑数据分析的机械故障特征提取方法,包括步骤如下:
1.选取原始机械振动数据作为训练集,对训练集中的每一个样本做小波变换,将原始机械振动信号的时域图转换为相应的时频图;
2.选取与步骤1相同的原始机械振动数据,对所有数据样本选择最优的时延嵌入参数,并生成对应的持久性图表(PD),将生成的持久性图表向量化,即持久性图片(PI);
3.将提取到的两组特征集相互融合用于生成新的特征集,即特征融合,以此组成新的特征向量,并进行全局主成分分析(GPCA),构建数据-标签对,作为后续分类神经网络的输入;
4.利用训练集融合后数据对卷积神经网络进行不断的迭代训练,优化神经网络参数;
另取一组测试集数据,对测试集中的振动信号同样进行步骤1、2的小波变换和PI图生成,并将生成的两组特征进行步骤3的特征融合之后输入到训练完成的卷积神经网络,对振动数据进行故障分类。
优选的,步骤1中,小波变换是一种针对信号的非平稳特性的技术,可以很好的体现出信号的相关特性。小波变换是一种具有固定窗口大小的时频分析方法,但是可以改变窗口的形状,使其具有多分辨率。小波变换具有时域和频域局部分析的能力,被广泛应用与机械部件的诊断中。
小波变换的公式如下:
其中,α是控制小波函数伸缩的尺度,β是控制小波函数平移的平移量,为母小波函数,代表一个函数族,通过小波变换,一维的轴承振动时域信号被转换为二维函数U(α,β),即将原始的轴承振动信号转化为相应的时频图,因此在一个特定的时间常数(参数β)下,可以确定一个特定的频率(参数α)。t是时间。
优选的,步骤2中,拓扑数据分析基于持久同源性理论,从数据形成的点云中获得有关数据本身的拓扑特征的信息,所述拓扑特征信息包括连通性、回路、空隙、二维拓扑特征;在获得数据点云的基础上,通过构建Vietoris-Rips复合体,得到持久性图表(PD),如附图1所示。
进一步优选的,Vietoris-Rips复合体具体构建过程为:如附图1所示,黄色的为ε-球(以ε半径的虚线圆)去围绕d维空间点集P中的每一个点,并在这个点和它的圈内的所有其他点之间连线。
定义解释:单纯复形:拓扑数据分析使用了单纯复形,这是一种由叫做单纯形的几何结构组成而成。TDA使用单纯复形是因为它们可以近似比较复杂的形状,而且它们比它们近似的原始图形在数学和计算上更容易处理。构建VR复形:如果在d维空间中有一个点集P,Rd的子集,那么比例ε的VR复形Vε(P)是这样定义的: 意思是,比例ε下的VR复形是集合Vε(P)中的P的所有子集σ,也就是说σ中任何不同点之间的距离不大于参数ε。
持久性图表(PD)表明了在构建Vietoris-Rips复合体的过程中,每一种拓扑特征出现和消亡的时间点,而这些特征持续的时间则代表了这些特征在拓扑空间中的鲁棒性,越是重要的特征,存在的时间越长。因此,拓扑数据分析非常适用于有噪声干扰的数据处理场景。然而,拓扑数据分析是针对多维数据更为有效的方法,因此,对于单变量的机械振动数据,利用时间延迟变量将一维时间变量数据嵌入到更高维的空间中;即,对于给定序列X(t),t=1,2,…,n,可以构建一个延时图Y(t)=[X(t),X(t-τ),X(t-2τ),…,X(t-dτ),],其中,τ是时延参数,d是维数;x(t)代表一维时间序列{x1,...,xt},n指一个数据样本的长度;该序列就是要处理的一维原始机械故障数据;在本方法中,选定好最优的τ和d之后,将原始振动信号在d维空间中重构,并得到持久性图表(PD),重构的过程就是根据takens定理将一维时间序列通过选定好的d和τ,即时间延迟参数嵌入到高维空间中;为了适应后续神经网络的输入,将步骤2中得到的持久性图表(PD)向量化,转换成张量形式的持久性图片(PI);所述时延嵌入参数即维数d和时延参数τ。
进一步优选的,τ和d的选定具体为:
在Takens嵌入定理中,嵌入维数和延迟时间都只是理论上证明了其存在性,并没有给出具体的表达式,而且实际应用中时间序列都是有噪声的有限序列,嵌入维数和时间延迟必须要根据实际的情况来选取合适的值。
确定τ——采用交互信息法:确定整个时间序列的最大值xmax和最小值xmin,设pk为第k个时间样本数据中一个元素的概率,pj,k是xi在第j个时间样本中而xi+τ在第k个时间样本中的概率,交互信息定义为:
此处,nbins为时间序列的总样本数。
I(τ)第一个最小值就是最佳的时延参数τ;
确定d——采用虚假最邻近点法:该方法基于这样一种假设,即“展开”或将一个确定性系统嵌入到连续的高维空间是平滑的。换言之,在一个嵌入维度接近的点应该在更高维的嵌入维中也接近;如果有一个点pi和近邻pj,判断下一个维度的标准化距离Ri是否大于某个阈值Rth:
如果Ri>Rth,就有一个“虚假近邻”,通过最小化这些近邻的总数来获得最佳嵌入维数;从嵌入维数的最小值2开始,计算虚假最临近点的比例,然后逐渐增加维数d,直到虚假最临近点的比例小于5%或者虚假最临近点的不再随着d的增加而减少时,此时的d就是嵌入维数。
优选的,步骤3中,特征融合是指将两个或多个特征向量按照某种规则组合成新的特征向量。最常规的特征融合方法包括串行融合方法和并行融合方法。串行融合方法是单纯地将一个m维特征向量和一个n维特征向量进行组合,则新的特征向量的则是(m+n)。并行融合方法则与之不同,并不是简单的将两组特征合并。将上述两组提取到的特征进行并行特征融合,组成卷积神经网络的输入张量;两组特征向量分别是小波变换和拓扑数据分析提取到的两路特征。
进一步优选的,特征融合为:假设三个特征空间A、B和C中有三个特征向量,α∈A,β∈B,γ∈C,并行特征融合方式是将α、β和γ三个特征向量合并成一个复合的δ特征向量,其公式如下:
δ=α+iβ+jγ (4)
其中,i,j均为虚数单位,当α、β和γ的维数不一致时,低维的特征需要补0,三个特征才能进行并行融合。
主成分分析(PCA)是利用降维的思想多指标转换为少数几个综合指标,往往能够保留住数据最重要的方面。其中经典主成分分析是全局主成分分析的一个特例。
因此,特征融合不只是包含特征组合,同时也包含了对组合的特征进行降维等重新处理的过程,再一次筛选了具有区分性的信息,同时消除了冗余或无效信息。
优选的,步骤4中,所述优化神经网络参数为:优化卷积核的权重和偏置,利用反向传播算法进行优化:定义损失函数,量化batch样本通过前向传播算法的预测值与真实值之间的差距,使用Adam算法更新神经网络参数的取值。
优选的,步骤3中,所述构建数据-标签对为:每个数据样本对应不同的故障类型,故障类型包括正常、内圈故障、外圈故障、滚动体故障,每种故障类型用不同的标签表示,标签包括0、1、2、3,正常、内圈故障、外圈故障、滚动体故障分别对应于0、1、2、3。
小波变换和有时间延迟嵌入的拓扑数据分析技术(TDA)的结合是解决该问题的一个方法,不仅可以对故障数据集进行时域和频域分析,同时可以对投影到高维的故障数据集进行拓扑结构的研究,识别和挖掘高维空间中数据的形状和数据之间的关系和模式。
本发明的有益效果在于:
本发明与现有技术方案相比,一方面不仅采用小波变换分析考虑了机械故障数据时域和频域的特征,从多个尺度分析原始振动信号,从非平稳的原始时域信号中,提取出更优特征;另一方面,将拓扑数据分析应用在故障诊断领域,利用拓扑数据分析方法也可以在有噪音的影响下,能有效挖掘出故障数据集之间的深层次的拓扑关系和隐藏数据中的形状,提取出更加鲁棒、更加重要的数据特征,有助于提升后续故障类型分类准确率。再者,小波变换时在低维空间中提取时频域的特征,对数据进行处理时会有冗余度的出现;而拓扑数据分析是在高维空间中处理数据,两者结合,把低维和高维空间中的重要特征提取出来。最后,通过特征融合的方式将两组特征合融合成一组新特征,提取出更为精炼和有效的特征,为后续故障分类网络提供输入。
附图说明
图1为持久性图表(PD)原理图;从a)到e)是连续的变化过程;a)到e)中点集右边的横线图为持久性条形码,是拓扑形状的一种直观表示,表明数据集实际具有这种形状。
a):对于半径r=0,球的并集减小到初始有限点集,每个点都对应于0维拓扑特征,即连接组件。在r=0时,为每个特征创建一个出生的时间点。
b):一些球开始重叠,导致一些连接在一起的组件合并在一起而死亡;持久性图跟踪这些死亡,并记录死亡时间点,形成一个间隔(interval)。
c):又有一些组件合并,并出现了两个新的一维特征,从而出生开始出现了两个新间隔(球中的连线及对应右边横线图中长线下方新出现的两个短线)。
d):两个一维循环中的一个已被填充,导致其在这一过程中死亡并且其相应的间隔结束。
e):所有一维特征均已消失,仅保留了较长的(且永不消逝)间隔(即横线图中的最长线)。与前面的示例一样,最终条形码也可以等效地表示为持久性图表,其中每个间隔(a,b)均由R2中的坐标点(a,b)表示。条形码中的间隔越长,或者在持久性图表中等效地,距对角线越远的点,表示在变化过程中相应的同源性就越持久,因此也就越相关,即表明该拓扑特征的重要性。
图2为基于小波变换与拓扑数据分析机械故障特征提取模型。
具体实施方式
下面通过实施例并结合附图对本发明做进一步说明,但不限于此。
实施例1
一种基于小波变换与拓扑数据分析的机械故障特征提取方法,包括步骤如下:
1.选取原始机械振动数据作为训练集,对训练集中的每一个样本做小波变换,将原始机械振动信号的时域图转换为相应的时频图;
小波变换是一种针对信号的非平稳特性的技术,可以很好的体现出信号的相关特性。小波变换是一种具有固定窗口大小的时频分析方法,但是可以改变窗口的形状,使其具有多分辨率。小波变换具有时域和频域局部分析的能力,被广泛应用与机械部件的诊断中。
小波变换的公式如下:
其中,α是控制小波函数伸缩的尺度,β是控制小波函数平移的平移量,为母小波函数,代表一个函数族,通过小波变换,一维的轴承振动时域信号被转换为二维函数U(α,β),即将原始的轴承振动信号转化为相应的时频图,因此在一个特定的时间常数(参数β)下,可以确定一个特定的频率(参数α)。t是时间。
2.选取与步骤1相同的原始机械振动数据,对所有数据样本选择最优的时延嵌入参数,并生成对应的持久性图表(PD),将生成的持久性图表向量化,即持久性图片(PI);
拓扑数据分析基于持久同源性理论,从数据形成的点云中获得有关数据本身的拓扑特征的信息,所述拓扑特征信息包括连通性、回路、空隙、二维拓扑特征;在获得数据点云的基础上,通过构建Vietoris-Rips复合体,得到持久性图表(PD),如附图1所示。
Vietoris-Rips复合体具体构建过程为:如附图1所示,灰色的为ε-球(以ε半径的虚线圆)去围绕d维空间点集P中的每一个点,并在这个点和它的圈内的所有其他点之间连线。
定义解释:单纯复形:拓扑数据分析使用了单纯复形,这是一种由叫做单纯形的几何结构组成而成。TDA使用单纯复形是因为它们可以近似比较复杂的形状,而且它们比它们近似的原始图形在数学和计算上更容易处理。构建VR复形:如果在d维空间中有一个点集P,Rd的子集,那么比例ε的VR复形Vε(P)是这样定义的: 意思是,比例ε下的VR复形是集合Vε(P)中的P的所有子集σ,也就是说σ中任何不同点之间的距离不大于参数ε。
持久性图表(PD)表明了在构建Vietoris-Rips复合体的过程中,每一种拓扑特征出现和消亡的时间点,而这些特征持续的时间则代表了这些特征在拓扑空间中的鲁棒性,越是重要的特征,存在的时间越长。因此,拓扑数据分析非常适用于有噪声干扰的数据处理场景。然而,拓扑数据分析是针对多维数据更为有效的方法,因此,对于单变量的机械振动数据,利用时间延迟变量将一维时间变量数据嵌入到更高维的空间中;即,对于给定序列X(t),t=1,2,…,n,可以构建一个延时图Y(t)=[X(t),X(t-τ),X(t-2τ),…,X(t-dτ),],其中,τ是时延参数,d是维数;x(t)代表一维时间序列{x1,...,xt},n指一个数据样本的长度;该序列就是要处理的一维原始机械故障数据;在本方法中,选定好最优的τ和d之后,将原始振动信号在d维空间中重构,并得到持久性图表(PD),重构的过程就是根据takens定理将一维时间序列通过选定好的d和τ,即时间延迟参数嵌入到高维空间中;为了适应后续神经网络的输入,将步骤2中得到的持久性图表(PD)向量化,转换成张量形式的持久性图片(PI);所述时延嵌入参数即维数d和时延参数τ。
进一步,τ和d的选定具体为:
在Takens嵌入定理中,嵌入维数和延迟时间都只是理论上证明了其存在性,并没有给出具体的表达式,而且实际应用中时间序列都是有噪声的有限序列,嵌入维数和时间延迟必须要根据实际的情况来选取合适的值。
确定τ——采用交互信息法:确定整个时间序列的最大值xmax和最小值xmin,设pk为第k个时间样本数据中一个元素的概率,pj,k是xi在第j个时间样本中而xi+τ在第k个时间样本中的概率,交互信息定义为:
此处,nbins为时间序列的总样本数。
I(τ)第一个最小值就是最佳的时延参数τ;
确定d——采用虚假最邻近点法:该方法基于这样一种假设,即“展开”或将一个确定性系统嵌入到连续的高维空间是平滑的。换言之,在一个嵌入维度接近的点应该在更高维的嵌入维中也接近;如果有一个点pi和近邻pj,判断下一个维度的标准化距离Ri是否大于某个阈值Rth:
如果Ri>Rth,就有一个“虚假近邻”,通过最小化这些近邻的总数来获得最佳嵌入维数;从嵌入维数的最小值2开始,计算虚假最临近点的比例,然后逐渐增加维数d,直到虚假最临近点的比例小于5%或者虚假最临近点的不再随着d的增加而减少时,此时的d就是嵌入维数。
3.将提取到的两组特征集相互融合用于生成新的特征集,即特征融合,以此组成新的特征向量,并进行全局主成分分析(GPCA),构建数据-标签对,作为后续分类神经网络的输入;
特征融合是指将两个或多个特征向量按照某种规则组合成新的特征向量。最常规的特征融合方法包括串行融合方法和并行融合方法。串行融合方法是单纯地将一个m维特征向量和一个n维特征向量进行组合,则新的特征向量的则是(m+n)。并行融合方法则与之不同,并不是简单的将两组特征合并。将上述两组提取到的特征进行并行特征融合,组成卷积神经网络的输入张量;两组特征向量分别是小波变换和拓扑数据分析提取到的两路特征。
进一步优选的,特征融合为:假设三个特征空间A、B和C中有三个特征向量,α∈A,β∈B,γ∈C,并行特征融合方式是将α、β和γ三个特征向量合并成一个复合的δ特征向量,其公式如下:
δ=α+iβ+jγ (4)
其中,i,j均为虚数单位,当α、β和γ的维数不一致时,低维的特征需要补0,三个特征才能进行并行融合。
所述构建数据-标签对具体为:每个数据样本对应不同的故障类型,故障类型包括正常、内圈故障、外圈故障、滚动体故障,每种故障类型用不同的标签表示,标签包括0、1、2、3,正常、内圈故障、外圈故障、滚动体故障分别对应于0、1、2、3。
4.利用训练集融合后数据对卷积神经网络进行不断的迭代训练,优化神经网络参数;
另取一组测试集数据,对测试集中的振动信号同样进行步骤1、2的小波变换和PI图生成,并将生成的两组特征进行步骤3的特征融合之后输入到训练完成的卷积神经网络,对振动数据进行故障分类。
所述优化神经网络参数为:优化卷积核的权重和偏置,利用反向传播算法进行优化:定义损失函数,量化batch样本通过前向传播算法的预测值与真实值之间的差距,使用Adam算法更新神经网络参数的取值。
实验例1:
以凯斯西储大学的轴承故障振动数据集为例,详细叙述本方法。
凯斯西储数据集包含四种不同工况负载(0HP,1HP,2HP,3HP)下的振动数据,同时又包含一种正常状态和三种故障状态的数据(内圈故障、外圈故障、滚动体故障),每种故障又分为不同的故障直径,因此整个数据集一共有九种故障类型。本实施方式采用同一故障尺寸,不同负载下的数据集进行实验。本方案还可以使用不同故障尺寸或者不同负载的数据,此例仅为参考理解。
步骤1:对原始振动训练数据进行预处理,所述预处理指的是对原始振动数据集进行切分,每1024个数据组成一个样本数据,首先对原始振动数据进行小波变换,由于目前尚无标准或者通用的母小波选取方法,本实施方式选择了Morlet小波作为母小波,运算公式如下。
其中,α是控制小波函数伸缩的尺度,β是控制小波函数平移的平移量。
步骤2:选取与步骤1相同的原始机械振动数据,通过自定义的函数选取最优的时延参数τ和重构空间的维数d。将训练集投影到高维空间中,根据持久同源性生成持久性图表(PD)。对于给定的时间序列X(t),使用来表示生成的二维PD图。
步骤3:由步骤1和步骤2得到的两组特征进行特征融合,根据公式(4),生成的新特征为
FWT+iFTDA,具体为Fnew=FWT+iFTDA
FWT:小波变换后生成的特征,FTDA:拓扑数据分析后生成的特征,随后对得到的并行结合形式按照以下公式进行GPCA降维变换,构建标签-数据对,以适应后续神经网络的输入。
Y=ΦHX (5)
其中,Φ=(ξ1,…,ξd),ξ1,…,ξd为投影轴,X:降维变换之前的特征张量,Y:降维变换后的特征张量。
步骤4:构建卷积神经网络,设置网络参数。双层卷积神经网络由四层组成:两个卷积层和两个池化层,第一个卷积层含有16个卷积核,第二个卷积层含有32个卷积核。卷积核大小为3*3,每个卷积层采用ReLU激活函数,进行最大池化操作,窗口大小为2*2。二维卷积定义为:
其中,W为卷积核,X为输入,*表示卷积操作,s(i,j):卷积后得到的特征图的第i行第j列的元素,i,j:输入矩阵中元素的下标,m,n:卷积核的元素下标。
池化层运算公式如下所示:
Claims (8)
1.一种基于小波变换与拓扑数据分析的机械故障特征提取方法,其特征在于,包括步骤如下:
步骤1.选取原始机械振动数据作为训练集,对训练集中的每一个样本做小波变换,将原始机械振动信号的时域图转换为相应的时频图;
步骤2.选取与步骤1相同的原始机械振动数据,对所有数据样本选择最优的时延嵌入参数,并生成对应的持久性图表(PD),将生成的持久性图表向量化,即持久性图片(PI);
从数据形成的点云中获得有关数据本身的拓扑特征的信息,所述拓扑特征信息包括连通性、回路、空隙、二维拓扑特征;在获得数据点云的基础上,通过构建Vietoris-Rips复合体,得到持久性图表(PD);
对于单变量的机械振动数据,利用时间延迟变量将一维时间变量数据嵌入到更高维的空间中;即,对于给定序列X(t),t=1,2,…,n,可以构建一个延时图Y(t)=[X(t),X(t-τ),X(t-2τ,...,Xt-dτ,],其中,τ是时延参数,d是维数;x(t)代表一维时间序列{x1,...,xt},n指一个数据样本的长度;该序列就是要处理的一维原始机械故障数据;选定好最优的τ和d之后,将原始振动信号在d维空间中重构,并得到持久性图表(PD),重构的过程就是根据takens定理将一维时间序列通过选定好的d和τ,即时间延迟参数嵌入到高维空间中;将步骤2中得到的持久性图表(PD)向量化,转换成张量形式的持久性图片(PI);所述时延嵌入参数即维数d和时延参数τ;
步骤3.将步骤1小波变换生成的时频图和步骤2获得的持久性图片(PI)相互融合用于生成新的特征集,即特征融合,以此组成新的特征向量,并进行全局主成分分析(GPCA),构建数据-标签对,作为后续分类神经网络的输入;
步骤4.利用训练集融合后数据对卷积神经网络进行不断的迭代训练,优化神经网络参数;
另取一组测试集数据,对测试集中的振动信号同样进行步骤1、步骤2的小波变换和持久性图片(PI)生成,并将生成的两组特征进行步骤3的特征融合之后输入到训练完成的卷积神经网络,对振动数据进行故障分类。
3.根据权利要求1所述的基于小波变换与拓扑数据分析的机械故障特征提取方法,其特征在于,Vietoris-Rips复合体具体构建过程为:以ε半径的虚线圆去围绕d维空间点集P中的每一个点,并在这个点和它的圈内的所有其他点之间连线。
4.根据权利要求1所述的基于小波变换与拓扑数据分析的机械故障特征提取方法,其特征在于,τ和d的选定具体为:
确定τ——采用交互信息法:确定整个时间序列的最大值xmax和最小值xmin,设pk为第k个时间样本数据中一个元素的概率,pj,k是xi在第j个时间样本中而xi+τ在第k个时间样本中的概率,交互信息定义为:
此处,nbins为时间序列的总样本数;
I(τ)第一个最小值就是最佳的时延参数τ;
确定d——采用虚假最邻近点法:在一个嵌入维度接近的点应该在更高维的嵌入维中也接近;如果有一个点pi和近邻pj,判断下一个维度的标准化距离Ri是否大于某个阈值Rth:
如果Ri>Rth,就有一个“虚假近邻”,通过最小化这些近邻的总数来获得最佳嵌入维数;从嵌入维数的最小值2开始,计算虚假最临近点的比例,然后逐渐增加维数d,直到虚假最临近点的比例小于5%或者虚假最临近点的不再随着d的增加而减少时,此时的d就是嵌入维数。
5.根据权利要求1所述的基于小波变换与拓扑数据分析的机械故障特征提取方法,其特征在于,步骤3中,将上述两组提取到的特征进行并行特征融合,组成卷积神经网络的输入张量;两组特征向量分别是小波变换和拓扑数据分析提取到的两路特征。
6.根据权利要求5所述的基于小波变换与拓扑数据分析的机械故障特征提取方法,其特征在于,并行特征融合为:假设三个特征空间A、B和C中有三个特征向量,a∈A,p∈B,γ∈C,并行特征融合方式是将α、β和γ三个特征向量合并成一个复合的δ特征向量,其公式如下:
δ=α+iβ+jγ (4)
其中,i,j均为虚数单位,当α、β和γ的维数不一致时,低维的特征需要补0,三个特征才能进行并行融合;两组特征向量融合时γ取0。
7.根据权利要求1所述的基于小波变换与拓扑数据分析的机械故障特征提取方法,其特征在于,步骤4中,所述优化神经网络参数为:优化卷积核的权重和偏置,利用反向传播算法进行优化:定义损失函数,量化batch样本通过前向传播算法的预测值与真实值之间的差距,使用Adam算法更新神经网络参数的取值。
8.根据权利要求1所述的基于小波变换与拓扑数据分析的机械故障特征提取方法,其特征在于,步骤3中,所述构建数据-标签对为:每个数据样本对应不同的故障类型,故障类型包括正常、内圈故障、外圈故障、滚动体故障,每种故障类型用不同的标签表示,标签包括0、1、2、3,正常、内圈故障、外圈故障、滚动体故障分别对应于0、1、2、3。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110480837.0A CN113204738B (zh) | 2021-04-30 | 2021-04-30 | 一种基于小波变换与拓扑数据分析的机械故障特征提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110480837.0A CN113204738B (zh) | 2021-04-30 | 2021-04-30 | 一种基于小波变换与拓扑数据分析的机械故障特征提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113204738A CN113204738A (zh) | 2021-08-03 |
CN113204738B true CN113204738B (zh) | 2022-04-08 |
Family
ID=77029640
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110480837.0A Active CN113204738B (zh) | 2021-04-30 | 2021-04-30 | 一种基于小波变换与拓扑数据分析的机械故障特征提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113204738B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113886181B (zh) * | 2021-09-30 | 2022-10-14 | 中南大学 | 应用于AIOps故障预警的动态阈值预测方法、设备及介质 |
CN114279728B (zh) * | 2021-12-07 | 2023-07-25 | 郑州大学 | 一种振动筛机体的故障诊断方法及系统 |
CN114563186B (zh) * | 2022-01-21 | 2023-01-06 | 苏州大学 | 滚动轴承类不平衡故障诊断方法及系统 |
CN116781159B (zh) * | 2023-06-25 | 2024-04-26 | 江西省通信产业服务有限公司上饶分公司 | 智慧机房光纤业务确认方法、系统以及存储介质 |
CN117725403B (zh) * | 2024-02-08 | 2024-04-12 | 天津大学 | 一种面向智能制造的互信息特征提取方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108535015A (zh) * | 2018-02-26 | 2018-09-14 | 中国人民解放军海军工程大学 | 基于零相位卷积型小波变换分解的轴承故障特征提取方法 |
CN111524478A (zh) * | 2019-02-05 | 2020-08-11 | 三星显示有限公司 | 检测故障的设备和方法 |
CN111562108A (zh) * | 2020-05-09 | 2020-08-21 | 浙江工业大学 | 一种基于cnn和fcmc的滚动轴承智能故障诊断方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108388860B (zh) * | 2018-02-12 | 2020-04-28 | 大连理工大学 | 一种基于功率熵谱-随机森林的航空发动机滚动轴承故障诊断方法 |
-
2021
- 2021-04-30 CN CN202110480837.0A patent/CN113204738B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108535015A (zh) * | 2018-02-26 | 2018-09-14 | 中国人民解放军海军工程大学 | 基于零相位卷积型小波变换分解的轴承故障特征提取方法 |
CN111524478A (zh) * | 2019-02-05 | 2020-08-11 | 三星显示有限公司 | 检测故障的设备和方法 |
CN111562108A (zh) * | 2020-05-09 | 2020-08-21 | 浙江工业大学 | 一种基于cnn和fcmc的滚动轴承智能故障诊断方法 |
Non-Patent Citations (1)
Title |
---|
基于小波变换和神经网络的机械故障检测方法;刘建都等;《宇航计测技术》;20071225(第06期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113204738A (zh) | 2021-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113204738B (zh) | 一种基于小波变换与拓扑数据分析的机械故障特征提取方法 | |
Duan et al. | Deep learning enabled intelligent fault diagnosis: Overview and applications | |
CN106650297B (zh) | 一种无领域知识的卫星分系统异常检测方法 | |
CN110827330B (zh) | 一种时序集成的多光谱遥感图像变化检测方法及系统 | |
Tang et al. | An autoencoder with adaptive transfer learning for intelligent fault diagnosis of rotating machinery | |
Jankowski et al. | Deep learning classifier for fall detection based on IR distance sensor data | |
CN109785409B (zh) | 一种基于注意力机制的图像-文本数据融合方法和系统 | |
Kaiser et al. | Bayesian alignments of warped multi-output Gaussian processes | |
CN113592769A (zh) | 异常图像的检测、模型的训练方法、装置、设备及介质 | |
Carannante et al. | Trustworthy medical segmentation with uncertainty estimation | |
Li et al. | Dual-source gramian angular field method and its application on fault diagnosis of drilling pump fluid end | |
Hassan et al. | Image classification based deep learning: A Review | |
Ngadi et al. | Uniformed two local binary pattern combined with neighboring support vector classifier for classification | |
CN110613445B (zh) | 一种基于dwnn框架的心电信号的识别方法 | |
Le-Tien et al. | Graph-based signal processing to convolutional neural networks for medical image segmentation | |
Ma et al. | An improved multi-channels information fusion model with multi-scale signals for fault diagnosis | |
Zhuang et al. | An Image Processing and Laser Ranging Approach for Radio Frequency Identification (RFID) Tag Group Reading Performance Prediction. | |
Sharma et al. | Image compression and feature extraction using Kohonen's self-organizing map neural network | |
Hashida et al. | MACD-histogram-based fully convolutional neural networks for classifying time series | |
Zhang et al. | An automatic detection model of pulmonary nodules based on deep belief network | |
CN118429650B (zh) | 基于多层注意力机制的汽车零件点云多尺度分割方法 | |
Gorgel et al. | Feature extraction based wavelet transform in breast cancer diagnosis using fuzzy and non-fuzzy classification | |
KR102557850B1 (ko) | 실시간 모션 센싱 데이터를 이용한 이상 탐지 장치 | |
CN117668719B (zh) | 一种自适应阈值的隧道监测数据异常检测方法 | |
Zhang et al. | A Novel Deep Learning Representation for Industrial Control System Data. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |