CN113218658A - 齿轮箱故障特征向量提取方法 - Google Patents
齿轮箱故障特征向量提取方法 Download PDFInfo
- Publication number
- CN113218658A CN113218658A CN202110564701.8A CN202110564701A CN113218658A CN 113218658 A CN113218658 A CN 113218658A CN 202110564701 A CN202110564701 A CN 202110564701A CN 113218658 A CN113218658 A CN 113218658A
- Authority
- CN
- China
- Prior art keywords
- frequency
- feature vector
- gearbox
- data
- frequency domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000013598 vector Substances 0.000 title claims abstract description 71
- 238000000605 extraction Methods 0.000 title claims abstract description 17
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 10
- 238000007637 random forest analysis Methods 0.000 claims abstract description 10
- 238000004458 analytical method Methods 0.000 claims description 10
- 238000000034 method Methods 0.000 claims description 8
- 238000012544 monitoring process Methods 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 4
- 238000007619 statistical method Methods 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 3
- 230000001133 acceleration Effects 0.000 claims description 2
- 230000003190 augmentative effect Effects 0.000 claims 1
- 238000012549 training Methods 0.000 abstract description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000013480 data collection Methods 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000005260 corrosion Methods 0.000 description 1
- 230000007797 corrosion Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000007373 indentation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000005461 lubrication Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000011089 mechanical engineering Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/04—Bearings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- Computer Hardware Design (AREA)
- Evolutionary Computation (AREA)
- Geometry (AREA)
- Computing Systems (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明提供一种齿轮箱故障特征向量提取方法,具体步骤包括:S1:采集齿轮箱数据;S2:提取时域特征向量和频域特征向量;S3:对时域特征向量和频域特征向量进行汇总;S4:根据重要性对特征向量进行选择。本技术方案对时域特征向量和频域特征向量进行汇总,通过随机森林算法对特征向量重要性进行排序,优化出风电机组故障所影响的主要的特征向量,不仅能够缩短故障模型的训练时间,而且可以提高故障模型的精度。
Description
技术领域
本发明属于机械故障诊断技术领域,尤其涉及一种齿轮箱故障特征向量提取方法。
背景技术
风机齿轮箱用于传递力和载荷,在机械工程领域得到了广泛的应用。然而,齿轮箱的工作环境通常较为恶劣与复杂,导致其长时间承受复杂交变负荷,而且运行工况变换频繁,加之温度、润滑、物理化学等多方面的影响,使得存在多种因素容易导致齿轮箱齿轮形成点蚀、剥落与裂纹等故障。此外,轴承容易产生磨损、腐蚀、压痕等故障情况。
现有技术,一般通过搭建故障模型,并将信号采集装置采集的信号输入故障模型,进而对齿轮箱的故障进行检测或者预测。可以采用多种算法搭建故障模型,例如决策树集成、线性模型、距离近邻或神经网络等。但现阶段,无论是采用何种算法搭建故障模型,在模型构建过程中,一般会不加辨别地的使用各种统计方法和全部倍频区域进行特征向量统计,这必然会导致特征向量存在一定冗余,甚至是与故障目标无关的情况。
发明内容
本发明要解决的技术问题是克服现有技术的不足,提供一种通过特征向量重要性排序,提取出关键性故障特征向量,进而缩短故障模型训练时间,提高故障模型精度的齿轮箱故障特征向量提取方法。
为解决上述技术问题,本发明提出的技术方案为:一种齿轮箱故障特征向量提取方法,具体步骤如下:
S1:采集齿轮箱数据;
S2:提取时域特征向量和频域特征向量;
S3:对时域特征向量和频域特征向量进行汇总;
S4:根据重要性对特征向量进行选择。
进一步的,步骤S1的具体步骤为:通过状态监视系统采集齿轮箱的数据。
进一步的,通过加速度传感器采集齿轮箱高速级水平及垂直处数据。
进一步的,步骤S2具体包括:
分别对齿轮箱数据进行时域分析和频域分析,提取对应的时域特征向量和频域特征向量;
对一组信号xi,i=1,…N,所述时域特征向量分别为:
峰值指标:xmax=max(|xi|)
式中,xi为齿轮箱数据,i为构成样本的数据采样点个数,i=1,…N;
所述频域特征向量包括频域描述和频域峰值:
所述频域描述是按照所述时域特征向量的统计方法,在每个预设频率区间内进行特征提取;
所述频域峰值是提取预设频率区间内相对于临近数值较高的点及对应的频率。
进一步的,提取所述频域特征向量的具体步骤为:
步骤一、对齿轮箱数据进行傅里叶变换,得到对应的频谱图;
步骤二、将频谱图横轴的频率转化为倍频;
步骤三、对倍频进行区间划分;
步骤四、在特定倍频所在的倍频区间提取频域描述和频域峰值。
进一步的,步骤二具体包括使相邻的倍频区间保持倍频交叠。
进一步的,均匀划分倍频区间,使各个倍频区间跨度相同。
进一步的,所述特定倍频为40-70倍频。
进一步的,步骤S4的具体步骤为:通过随机森林算法确定汇总的特征向量的重要性排序.
进一步的,对采集的齿轮箱数据进行时长分割,用于扩增数据样本。
与现有技术相比,本发明的优点在于:
1、为了缓解数据样本中转速的差异性,对频谱图中的频率轴进行倍频转换,进而达到消除工况影响的效果。
2、本技术方案对时域特征向量和频域特征向量进行汇总,通过随机森林算法对特征向量重要性进行排序,优化出风电机组故障所影响的主要的特征向量,不仅能够缩短故障模型的训练时间,而且可以提高故障模型的精度。
3、本技术方案适用于各种算法搭建的风机齿轮箱故障模型,适用性强。
附图说明
图1为本发明的总体流程图。
具体实施方式
为了便于理解本发明,下文将通过实施例对本文发明做更全面、细致地描述,但本发明的保护范围并不限于以下具体实施例。
实施例:
本发明提供一种齿轮箱故障特征向量提取方法,具体步骤包括:
S1:采集齿轮箱数据;
S2:提取时域特征向量和频域特征向量;
S3:对时域特征向量和频域特征向量进行汇总;
S4:根据重要性对特征向量进行选择。
一般可以通过数据采集系统、监视控制系统和状态监视系统采集到与齿轮箱相关的数据。但数据采集系统和监控控制系统所采集的数据为1赫兹数据,而齿轮箱的特征频率从几十至几千赫兹不等,因此如果采用数据采集系统和监视控制系统所采集数据不足以检测出齿轮箱的故障。因此,本技术方案采用状态监视系统所采集的齿轮箱高速级水平及垂直处的数据作为数据样本对故障特征向量进行提取。
对故障特征向量进行提取时,一般会选取风机故障前后1至2个月的数据作为样本。在样本统计过程中发现,正常样本数量远大于故障样本数量。这对于提取故障特征向量、机器学习算法来说均是不利的。只有在正负样本数量大致相当且数据充足的情况下,才能使算法发挥较大的价值。通常所采用的样本扩增的方法包括差值、加噪和对抗神经网络生成故障样本等方法。但是由于工业数据的特殊性,上述方法不仅不能丰富故障样本的特性,反而使得模型过拟合,进而造成泛化性能变差。
为了扩增数据样本,本技术方案对所采集的数据进行时长分割。即对单次采集的数据片段,在保证频率分辨率的前提下,对数据片段进行时长切分,平均分割成多分更小的数据片段,并使切分后的数据片段在时间轴上保持时间连续性,切分后的数据片段均保持与切分前数据片段标签一致。现有的数据采集方式是,每隔4小时采集一次,每次采集4秒钟。对上述采集的数据进行时长分割即在满足上述频率、时间连续性等要求的前提下,将每次采集时间分割为小于4秒的时长,例如4秒的数据片段可以平均分割为4个1秒的数据片段,也可以分割为2个2秒的数据片段,分割的小数据片段与原始数据片段之间存有差异性,一定程度增加了样本的丰富性、多样性,进而达到样本扩增的目的。
分别对采集的齿轮箱数据样本进行时域分析和频域分析,
进行时域分析所提取的时域特征向量分别为:
峰值指标:xmax=max(|xi|)
式中,xi为齿轮箱数据,i为构成样本的数据采样点个数,i=1,…N;
进行频域分析所提取的频域特征向量包括频域描述和频域峰值。
频域分析的具体步骤为:
步骤一、对齿轮箱数据进行傅里叶变换,得到对应的频谱图;
步骤二、将频谱图横轴的频率转化为倍频;
由于风机工况不断变化,每一个采集到的数据片段对应的转速有所差异,而与故障相关的特征向量所对应的频率一般与转频有关。为了降低工况对特征向量的影响,将频率转化为倍频。为了进一步消除工况影响,还可以对转化后的倍频做对齐处理。即由于每个数据片段的转速不同,导致转换后的倍频范围不尽相同,对不影响问题分析的高转频段截取后丢弃,实现不同转速数据倍频对齐。
步骤三、对倍频进行区间划分,
可以对全频段倍频进行均匀或不均匀划分倍频区间,均匀划分倍频区间即使各个倍频区间跨度相同。但无论是均匀或不均匀划分倍频区间,需要使相邻的倍频区间保持倍频交叠,进而充分提取特征频率。
步骤四、在特定倍频所在的倍频区间提取频域描述和频域峰值。
其中特定倍频为40-70倍频,频域描述是按照上述时域特征向量的统计方法,在每个预设倍频区间内进行特征提取;频域峰值是提取每个预设倍频区间内相对于临近数值较高的点及对应的倍频。
最后通过随机森林算法确定汇总的特征向量的重要性排序。
随机森林进行特征重要性评估的思想是看每个特征在随机森林中的每颗树上做了多大的贡献,然后取平均值,最后比较特征之间的贡献大小。
我们这里用基尼指数来评价。
我们将变量重要性评分(variableimportancemeasures)用VIM来表示,将Gini指数用GI来表示,假设有m个特征X1,X2,X3,...,Xm,现在要计算出每个特征Xj的Gini指数评分VIMj (Gini),亦即第j个特征在RF(随机森林)所有决策树中节点分裂不纯度的平均改变量。
Gini指数的计算公式为:
其中,K表示有K个类别,pmk表示节点m中类别k所占的比例。
直观地说,就是随便从节点m中随机抽取两个样本,其类别标记不一致的概率。
特征Xj在节点m的重要性,即节点m分枝前后的Gini指数变化量为
其中,GIl和GIr分别表示分枝后两个新节点的Gini指数。
如果,特征Xj在决策树i中出现的节点为集合M,那么Xj在第i颗树的重要性为
假设RF中共有n颗树,那么
最后,把所有求得的重要性评分做一个归一化处理即可。归一化处理方法如下:
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例。对于本领域的技术人员来说,在不脱离本发明的技术构思前提下所得到的改进和变换也应视为本发明的保护范围。
Claims (10)
1.一种齿轮箱故障特征向量提取方法,其特征在于,具体步骤如下:
S1:采集齿轮箱数据;
S2:提取时域特征向量和频域特征向量;
S3:对时域特征向量和频域特征向量进行汇总;
S4:根据重要性对特征向量进行选择。
2.根据权利要求1所述的齿轮箱故障特征向量提取方法,其特征在于,步骤S1的具体步骤为:通过状态监视系统采集齿轮箱的数据。
3.根据权利要求2所述的齿轮箱故障特征向量提取方法,其特征在于,通过加速度传感器采集齿轮箱高速级水平及垂直处数据。
4.根据权利要求1所述的齿轮箱故障特征向量提取方法,其特征在于,步骤S2具体包括:分别对齿轮箱数据进行时域分析和频域分析,提取对应的时域特征向量和频域特征向量;所述时域特征向量分别为:
峰值指标:xmax=max(|xi|)
式中,xi为齿轮箱数据,i为构成样本的数据采样点个数,i=1,…N;
所述频域特征向量包括频域描述和频域峰值:
所述频域描述是按照所述时域特征向量的统计方法,在每个预设频率区间内进行特征提取;
所述频域峰值是提取预设频率区间内相对于临近数值较高的点及对应的频率。
5.根据权利要求4所述的齿轮箱故障特征向量提取方法,其特征在于,提取所述频域特征向量的具体步骤为:
步骤一、对齿轮箱数据进行傅里叶变换,得到对应的频谱图;
步骤二、将频谱图横轴的频率转化为倍频;
步骤三、对倍频进行区间划分;
步骤四、在特定倍频所在的倍频区间提取频域描述和频域峰值。
6.根据权利要求5所述的齿轮箱故障特征向量提取方法,其特征在于,步骤二具体包括使相邻的倍频区间保持倍频交叠。
7.根据权利要求6所述的齿轮箱故障特征向量提取方法,其特征在于,均匀划分倍频区间,使各个倍频区间跨度相同。
8.根据权利要求7所述的齿轮箱故障特征向量提取方法,其特征在于,所述特定倍频为40-70倍频。
9.根据权利要求1-8任意一项所述的齿轮箱故障特征向量提取方法,其特征在于,步骤S4的具体步骤为:通过随机森林算法确定汇总的特征向量的重要性排序。
10.根据权利要求9所述的齿轮箱故障特征向量提取方法,其特征在于,对采集的齿轮箱数据进行时长分割,用于扩增数据样本。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110564701.8A CN113218658A (zh) | 2021-05-24 | 2021-05-24 | 齿轮箱故障特征向量提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110564701.8A CN113218658A (zh) | 2021-05-24 | 2021-05-24 | 齿轮箱故障特征向量提取方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113218658A true CN113218658A (zh) | 2021-08-06 |
Family
ID=77098061
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110564701.8A Pending CN113218658A (zh) | 2021-05-24 | 2021-05-24 | 齿轮箱故障特征向量提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113218658A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102507186A (zh) * | 2011-11-01 | 2012-06-20 | 西安交通大学 | 一种基于特色参数的行星齿轮箱状态监测与故障辨识方法 |
CN105136454A (zh) * | 2015-10-15 | 2015-12-09 | 上海电机学院 | 一种风电机组齿轮箱故障识别方法 |
CN108181107A (zh) * | 2018-01-12 | 2018-06-19 | 东北电力大学 | 计及多分类目标的风电机组轴承机械故障诊断方法 |
CN109540515A (zh) * | 2018-12-08 | 2019-03-29 | 徐州智编信息科技有限公司 | 一种振动信号处理方法 |
CN110286279A (zh) * | 2019-06-05 | 2019-09-27 | 武汉大学 | 基于极端随机森林与堆栈式稀疏自编码算法的电力电子电路故障诊断方法 |
CN111337250A (zh) * | 2020-03-17 | 2020-06-26 | 广州大学 | 基于虚拟仪器的机床状态故障诊断系统和方法 |
-
2021
- 2021-05-24 CN CN202110564701.8A patent/CN113218658A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102507186A (zh) * | 2011-11-01 | 2012-06-20 | 西安交通大学 | 一种基于特色参数的行星齿轮箱状态监测与故障辨识方法 |
CN105136454A (zh) * | 2015-10-15 | 2015-12-09 | 上海电机学院 | 一种风电机组齿轮箱故障识别方法 |
CN108181107A (zh) * | 2018-01-12 | 2018-06-19 | 东北电力大学 | 计及多分类目标的风电机组轴承机械故障诊断方法 |
CN109540515A (zh) * | 2018-12-08 | 2019-03-29 | 徐州智编信息科技有限公司 | 一种振动信号处理方法 |
CN110286279A (zh) * | 2019-06-05 | 2019-09-27 | 武汉大学 | 基于极端随机森林与堆栈式稀疏自编码算法的电力电子电路故障诊断方法 |
CN111337250A (zh) * | 2020-03-17 | 2020-06-26 | 广州大学 | 基于虚拟仪器的机床状态故障诊断系统和方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11333575B2 (en) | Method for fault diagnosis of an aero-engine rolling bearing based on random forest of power spectrum entropy | |
Zhou et al. | Bearing fault recognition method based on neighbourhood component analysis and coupled hidden Markov model | |
CN111562108A (zh) | 一种基于cnn和fcmc的滚动轴承智能故障诊断方法 | |
CN110375987B (zh) | 一种基于深度森林机械轴承故障检测方法 | |
CN112257530B (zh) | 基于盲信号分离和支持向量机的滚动轴承故障诊断方法 | |
CN105607631B (zh) | 间歇过程弱故障模型控制限建立方法及弱故障监测方法 | |
CN112633098B (zh) | 一种旋转机械故障诊断方法、系统及存储介质 | |
CN109255333B (zh) | 一种大型风电机组滚动轴承故障混合诊断方法 | |
Wang et al. | Construction of the efficient attention prototypical net based on the time–frequency characterization of vibration signals under noisy small sample | |
Cao et al. | Intelligent fault diagnosis of wind turbine gearbox based on Long short-term memory networks | |
CN110533314A (zh) | 一种基于概率密度分布的风电场异常机组识别方法 | |
CN115828466A (zh) | 一种基于宽核卷积的风机主轴部件故障预测方法 | |
CN117365869A (zh) | 一种风电机组桨叶扫塔故障的自适应预警策略设计方法 | |
CN111046790A (zh) | 一种泵轴承故障诊断方法 | |
CN115293188A (zh) | 一种用于往复机械设备的故障诊断方法和装置 | |
CN113111752B (zh) | 针对样本不均衡的增强扩展深度置信网络的轧机故障诊断方法 | |
CN113887586A (zh) | 小样本下基于特征融合的ffcnn-svm迁移学习故障诊断方法 | |
CN117606801A (zh) | 一种基于多表征自适应网络的跨域轴承故障诊断方法 | |
Chen et al. | Image feature extraction based on HOG and its application to fault diagnosis for rotating machinery | |
CN113218658A (zh) | 齿轮箱故障特征向量提取方法 | |
CN111461184A (zh) | 基于多元特征矩阵的xgb多维运维数据异常检测方法 | |
CN110598674A (zh) | 一种基于模式识别的转辙机故障识别方法 | |
Gelman et al. | Novel decision-making technique for damage diagnosis | |
Inoue et al. | Learning Discriminative Feature Representations via Metric Learning for Early Operation of Wind Turbine Anomaly Detection Systems | |
Zhou et al. | Study of fault diagnosis for rolling bearing based on clustering algorithms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210806 |