CN113837096A - 一种基于ga随机森林的滚动轴承故障诊断方法 - Google Patents

一种基于ga随机森林的滚动轴承故障诊断方法 Download PDF

Info

Publication number
CN113837096A
CN113837096A CN202111125796.XA CN202111125796A CN113837096A CN 113837096 A CN113837096 A CN 113837096A CN 202111125796 A CN202111125796 A CN 202111125796A CN 113837096 A CN113837096 A CN 113837096A
Authority
CN
China
Prior art keywords
random forest
model
iteration
sample
population
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111125796.XA
Other languages
English (en)
Other versions
CN113837096B (zh
Inventor
何怡刚
朱战伟
孙豪
王涛
曹志煌
谢辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
State Grid Anhui Electric Power Co Ltd
Original Assignee
Hefei University of Technology
State Grid Anhui Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology, State Grid Anhui Electric Power Co Ltd filed Critical Hefei University of Technology
Priority to CN202111125796.XA priority Critical patent/CN113837096B/zh
Publication of CN113837096A publication Critical patent/CN113837096A/zh
Application granted granted Critical
Publication of CN113837096B publication Critical patent/CN113837096B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physiology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

一种基于GA随机森林的滚动轴承故障诊断方法,包括以下步骤:1、采集故障轴承振动信号,通过小波包分解提取轴承振动信号的能量谱,并进行数据归一化处理;2、根据遗传算法编码规则随机初始化种群染色体,构建随机森林模型;3、使用遗传算法优化随机森林模型,得到参数优化后的诊断模型;4、对优化模型进行训练获得故障诊断模型;5、使用诊断模型对故障进行分类。本发明能够获得较好的分类效果,提高了随机森林参数寻优的效率,并且降低了数据处理量,提高了模型的诊断效率。

Description

一种基于GA随机森林的滚动轴承故障诊断方法
技术领域
本发明涉及一种滚动轴承故障诊断方法,具体涉及一种基于GA随机森林的滚动轴承故障诊断方法。
背景技术
滚动轴承是机械设备动力传动装置中至关重要的机械元件。它的主要作用是将运行轴与轴座之间的滑动摩擦变为滚动摩擦,以减少摩擦和磨损。滚动轴承具有结构简单、摩擦系数小、运动精度高、制造成本低等优点。但是,由于工作环境复杂多变,容易出现磨损、腐蚀、裂纹等各种形式的缺陷,影响设备运行,甚至造成巨大损失,因此对滚动轴承故障监测与识别在工程应用中具有重要的作用。
轴承故障诊断首先要获取设备的特征信号,然后通过一定的手段进行处理,最终得到滚动轴承相关的故障信息。这样可以在技术上监控设备的运行状态,判断异常情况,为后续的维修计划提供参考。目前用于故障分类识别的故障诊断方法主要有聚类分析、支持向量机(SVM)、人工神经网络(ANN)、卷积神经网络(CNN)等。然而这些算法又存在一定的局限,例如聚类分析通常适用于低维数据的分类,对高维数据分类不敏感,支持向量机(SVM)在解决大规模训练样本和多重分类问题时需要大量的计算时间,人工神经网络(ANN)运算效率低、收敛数度慢、网络结构选择适应性差,卷积神经网络(CNN)需要大的样本空间,对于小批量样本集表现不佳,卷积操作带来计算开销增加。
发明内容
本发明所要解决的技术问题是,克服现有技术的不足,提供一种诊断效率高的基于GA随机森林的滚动轴承故障诊断方法。
本发明解决其技术问题采用的技术方案是,一种GA随机森林的滚动轴承故障分类方法,步骤如下:
步骤一:获取故障滚动轴承振动信号作为样本集合,对信号样本进行处理,得到样本特征集合L={L1,L2,…,Li,…,Lk},Li表示滚动轴承第i类故障样本特征集合,并有
Figure BDA0003276128940000011
Figure BDA0003276128940000012
表示第i类故障样本特征集合中的第j个样本,并且
Figure BDA0003276128940000013
包含一个长度为N的特征向量;
步骤二:根据编码规则初始化种群基因序列,繁殖代数,种群数量和染色体长度,构建初始随机森林模型;
(1)根据种群数量随机初始化种群,产生种群基因型,每一个种群个体的基因型为一串二进制编码,代表着随机森林决策树数量、决策树最大深度和决策树训练时的最大特征数量;
(2)优化过程随机森林的训练集采用Bootstrap方法,从原始特征样本集中有放回抽取n个样本得到特征样本子集;
步骤三:采用遗传算法和随机森林相结合,对随机森林的参数调优;
(1)定义当前迭代次数为x,对于x=1,以当前基因型为参数的随机森林模型为当前迭代的初始模型;
(2)利用当前基因型构建第x次迭代随机森林模型,对特征样本子集进行分类,得到第x次迭代随机森林模型的分类准确率,并以此次得到的分类准确率作为遗传算法的第x次迭代的适应度值;
(3)以第x次迭代的适应度值最大的个体基因型表示的参数作为模型的局部最优解,并对适应度较低的个体进行淘汰;
(4)对种群中保留的个体基因型进行随机交叉和变异,产生新的个体基因型;
(5)判断x是否达到xmax,否则以新的基因型作为随机森林模型参数进行新一轮迭代,重复步骤(2)和(3);
(6)选出xmax次迭代的局部最优解中的最大值作为全局最优解,以此构建随机森林诊断模型;
步骤四:对参数调优后的随机森林诊断模型进行训练和测试,得到轴承故障诊断结果。
本发明具有以下积极效果:
1、本发明采用遗传算法和随机森林建立了故障诊断模型,提高了诊断模型故障诊断的准确率,与传统方法相比,诊断效率更高。
2、优化了参数调整过程,与传统网格寻优过程相比,本发明解决了计算量大的问题,降低了数据冗余,提高了模型运行效率。
附图说明
图1为本发明实施例的流程图。
具体实施方式
下面结合附图和实施例对本发明作进一步详细说明。
参照附图1,本实施例的步骤如下:
第一步:获取故障滚动轴承振动信号特征样本集合;
1.1使用小波包分解提取振动信号的能量谱值,将能量值按尺度顺序排列组成N个特征向量并进行归一化处理,得到样本特征集合L={L1,L2,…,Li,…,Lk},Li表示滚动轴承第i类故障样本特征集合,并有
Figure BDA0003276128940000031
Figure BDA0003276128940000032
表示第i类故障样本特征集合中的第j个样本,并且
Figure BDA0003276128940000033
包含一个长度为N的特征向量;
1.2从原始样本集合中按一定比例不放回随机抽取,将原始样本集合分为训练集和测试集;
第二步:根据编码规则初始化种群基因序列,繁殖代数,种群数量和染色体长度,构建初始随机森林模型;
2.1根据种群数量随机初始化种群,产生种群基因型,每一个种群个体的基因型为一串二进制编码,代表着随机森林决策树数量、决策树最大深度和决策树训练时的最大特征数量;
2.2优化过程随机森林的训练集采用Bootstrap方法,从原始特征样本集中有放回抽取n个样本得到特征样本子集;
第三步:采用遗传算法和随机森林相结合,对随机森林的参数调优;
3.1定义当前迭代次数为x,对于x=1,以当前基因型为参数的随机森林模型为当前迭代的初始模型;
3.2利用当前基因型构建第x次迭代随机森林模型,对特征样本子集进行分类,得到第x次迭代随机森林模型的分类准确率,并以此次得到的分类准确率作为遗传算法的第x次迭代的适应度值;
3.3以第x次迭代的适应度值最大的个体基因型表示的参数作为模型的局部最优解,并对适应度较低的个体进行淘汰;
3.4对种群中保留的个体基因型进行随机交叉和变异,产生新的个体基因型;
3.5判断x是否达到xmax,否则以新的基因型作为随机森林模型参数进行新一轮迭代,重复步骤3.2和3.3;
3.6选出xmax次迭代的局部最优解中的最大值作为全局最优解,以此构建随机森林诊断模型;
第四步:对参数调优后的随机森林诊断模型进行训练和测试,得到轴承故障诊断结果。
为验证本方法的有效性,选择SVM、KNN、RF进行比较。使用不同特征集对模型进行测试,所得结果如下表所示。
表1不同算法分类效果
Figure BDA0003276128940000041
在表1中可以看出,4种模型中GA-RF模型在不同数据集上的诊断准确率高于其他种模型,说明本实施例的算法对于随机森林模型的优化有明显的效果。
本领域的技术人员可以对本发明进行各种修改和变型,倘若这些修改和变型在本发明权利要求及其等同技术的范围之内,则这些修改和变型也仍在本发明专利的保护范围之内。
说明书中未详细描述的内容为本领域技术人员公知的现有技术。

Claims (1)

1.一种GA随机森林的滚动轴承故障分类方法,其特征在于,步骤如下:
步骤一:获取故障滚动轴承振动信号作为样本集合,对信号样本进行处理,得到样本特征集合L={L1,L2,…,Li,…,LK},Li表示滚动轴承第i类故障样本特征集合,并有
Figure FDA0003276128930000011
Figure FDA0003276128930000012
表示第i类故障样本特征集合中的第j个样本,并且
Figure FDA0003276128930000013
包含一个长度为N的特征向量;
步骤二:根据编码规则初始化种群基因序列,繁殖代数,种群数量和染色体长度,构建初始随机森林模型;
(1)根据种群数量随机初始化种群,产生种群基因型,每一个种群个体的基因型为一串二进制编码,代表着随机森林决策树数量、决策树最大深度和决策树训练时的最大特征数量;
(2)优化过程随机森林的训练集采用Bootstrap方法,从原始特征样本集中有放回抽取n个样本得到特征样本子集;
步骤三:采用遗传算法和随机森林相结合,对随机森林的参数调优;
(1)定义当前迭代次数为x,对于x=1,以当前基因型为参数的随机森林模型为当前迭代的初始模型;
(2)利用当前基因型构建第x次迭代随机森林模型,对特征样本子集进行分类,得到第x次迭代随机森林模型的分类准确率,并以此次得到的分类准确率作为遗传算法的第x次迭代的适应度值;
(3)以第x次迭代的适应度值最大的个体基因型表示的参数作为模型的局部最优解,并对适应度较低的个体进行淘汰;
(4)对种群中保留的个体基因型进行随机交叉和变异,产生新的个体基因型;
(5)判断x是否达到xmax,否则以新的基因型作为随机森林模型参数进行新一轮迭代,重复步骤(2)和(3);
(6)选出xmax次迭代的局部最优解中的最大值作为全局最优解,以此构建随机森林诊断模型;
步骤四:对参数调优后的随机森林诊断模型进行训练和测试,得到轴承故障诊断结果。
CN202111125796.XA 2021-09-24 2021-09-24 一种基于ga随机森林的滚动轴承故障诊断方法 Active CN113837096B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111125796.XA CN113837096B (zh) 2021-09-24 2021-09-24 一种基于ga随机森林的滚动轴承故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111125796.XA CN113837096B (zh) 2021-09-24 2021-09-24 一种基于ga随机森林的滚动轴承故障诊断方法

Publications (2)

Publication Number Publication Date
CN113837096A true CN113837096A (zh) 2021-12-24
CN113837096B CN113837096B (zh) 2024-02-13

Family

ID=78970077

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111125796.XA Active CN113837096B (zh) 2021-09-24 2021-09-24 一种基于ga随机森林的滚动轴承故障诊断方法

Country Status (1)

Country Link
CN (1) CN113837096B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116448425A (zh) * 2023-03-09 2023-07-18 江苏波司登科技有限公司 一种基于改进随机森林的传送带轴承远程故障诊断方法及系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080208487A1 (en) * 2007-02-23 2008-08-28 General Electric Company System and method for equipment remaining life estimation
CN109597401A (zh) * 2018-12-06 2019-04-09 华中科技大学 一种基于数据驱动的设备故障诊断方法
CN109977028A (zh) * 2019-04-08 2019-07-05 燕山大学 一种基于遗传算法和随机森林的软件缺陷预测方法
CN110596492A (zh) * 2019-09-17 2019-12-20 昆明理工大学 一种基于粒子群算法优化随机森林模型的变压器故障诊断方法
US20200074306A1 (en) * 2018-08-31 2020-03-05 Ca, Inc. Feature subset evolution by random decision forest accuracy
US20200200648A1 (en) * 2018-02-12 2020-06-25 Dalian University Of Technology Method for Fault Diagnosis of an Aero-engine Rolling Bearing Based on Random Forest of Power Spectrum Entropy
CN112327149A (zh) * 2020-10-19 2021-02-05 西安工程大学 基于ssd-srae的高压断路器故障诊断方法
CN112364756A (zh) * 2020-11-09 2021-02-12 国网安徽省电力有限公司电力科学研究院 一种基于天牛须和随机森林的gis故障分类方法
CN112418538A (zh) * 2020-11-30 2021-02-26 武汉科技大学 一种基于随机森林分类的连铸坯夹杂预测方法
CN112924808A (zh) * 2021-01-25 2021-06-08 上海海事大学 一种船舶区域配电电力系统短路故障诊断方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080208487A1 (en) * 2007-02-23 2008-08-28 General Electric Company System and method for equipment remaining life estimation
US20200200648A1 (en) * 2018-02-12 2020-06-25 Dalian University Of Technology Method for Fault Diagnosis of an Aero-engine Rolling Bearing Based on Random Forest of Power Spectrum Entropy
US20200074306A1 (en) * 2018-08-31 2020-03-05 Ca, Inc. Feature subset evolution by random decision forest accuracy
CN109597401A (zh) * 2018-12-06 2019-04-09 华中科技大学 一种基于数据驱动的设备故障诊断方法
CN109977028A (zh) * 2019-04-08 2019-07-05 燕山大学 一种基于遗传算法和随机森林的软件缺陷预测方法
CN110596492A (zh) * 2019-09-17 2019-12-20 昆明理工大学 一种基于粒子群算法优化随机森林模型的变压器故障诊断方法
CN112327149A (zh) * 2020-10-19 2021-02-05 西安工程大学 基于ssd-srae的高压断路器故障诊断方法
CN112364756A (zh) * 2020-11-09 2021-02-12 国网安徽省电力有限公司电力科学研究院 一种基于天牛须和随机森林的gis故障分类方法
CN112418538A (zh) * 2020-11-30 2021-02-26 武汉科技大学 一种基于随机森林分类的连铸坯夹杂预测方法
CN112924808A (zh) * 2021-01-25 2021-06-08 上海海事大学 一种船舶区域配电电力系统短路故障诊断方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
樊浩;苏海博;陈立;史宗谦;李兴文;: "随机森林集成学习模型在高压真空断路器振动信号分析中的应用", 电器与能效管理技术, no. 23, 15 December 2019 (2019-12-15) *
郑日晖;岑健;熊建斌;陈志豪;: "基于经验模态分解与随机森林的轴承故障诊断", 广东技术师范学院学报, no. 06, 25 December 2019 (2019-12-25) *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116448425A (zh) * 2023-03-09 2023-07-18 江苏波司登科技有限公司 一种基于改进随机森林的传送带轴承远程故障诊断方法及系统
CN116448425B (zh) * 2023-03-09 2023-11-21 江苏波司登科技有限公司 一种基于改进随机森林的传送带轴承远程故障诊断方法及系统
WO2024183424A1 (zh) * 2023-03-09 2024-09-12 江苏波司登科技有限公司 一种基于改进随机森林的传送带轴承远程故障诊断方法及系统

Also Published As

Publication number Publication date
CN113837096B (zh) 2024-02-13

Similar Documents

Publication Publication Date Title
CN110082136B (zh) 基于云遗传算法优化支持向量机的旋转机械故障诊断方法
CN107516135A (zh) 一种支持多源数据的自动化监督性学习方法
CN111722046B (zh) 一种基于深度森林模型的变压器故障诊断方法
CN105678343B (zh) 基于自适应加权组稀疏表达的水电机组噪声异常诊断方法
CN103324980A (zh) 一种风电场风速预测方法
CN109670676A (zh) 基于支持向量数据描述的配网台区风险预警方法及系统
CN107609774B (zh) 一种基于思维进化算法优化小波神经网络的光伏功率预测方法
CN108564117B (zh) 一种基于svm的贫困生辅助认定方法
CN114528949A (zh) 一种基于参数优化的电能计量异常数据的识别与补偿方法
CN103034691A (zh) 一种基于支持向量机的专家系统知识获取方法
CN110795690A (zh) 风电场运行异常数据检测方法
CN115021679A (zh) 一种基于多维离群点检测的光伏设备故障检测方法
CN113379116A (zh) 基于聚类和卷积神经网络的台区线损预测方法
CN113837096B (zh) 一种基于ga随机森林的滚动轴承故障诊断方法
CN112817954A (zh) 一种基于多种方法集成学习的缺失值插补方法
CN114301719B (zh) 一种基于变分自编码器的恶意更新检测方法及系统
CN109740722A (zh) 一种基于Memetic算法的网络表示学习方法
CN116894744A (zh) 一种基于改进k均值聚类算法的电网用户数据分析方法
CN117473424A (zh) 基于随机森林的变压器故障诊断方法、系统、设备及介质
CN113469252A (zh) 一种考虑不平衡样本的特高压换流阀运行状态评估方法
CN116910506A (zh) 一种基于时空网络变分自编码器算法的负荷降维聚类的方法
CN112801350A (zh) 基于不确定度的深度学习超短时风电功率预测方法
CN108985563B (zh) 一种基于自组织特征映射的机电系统服役动态标记方法
CN114970709B (zh) 基于改进ga的数据驱动型ahu多故障诊断特征选择方法
CN116628488A (zh) 风电功率预测模型的训练方法、风电功率预测方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant