CN113591625B - 一种不平衡样本重要性加权的齿轮箱故障诊断方法 - Google Patents

一种不平衡样本重要性加权的齿轮箱故障诊断方法 Download PDF

Info

Publication number
CN113591625B
CN113591625B CN202110804219.7A CN202110804219A CN113591625B CN 113591625 B CN113591625 B CN 113591625B CN 202110804219 A CN202110804219 A CN 202110804219A CN 113591625 B CN113591625 B CN 113591625B
Authority
CN
China
Prior art keywords
sample
feature extraction
extraction module
health state
gearbox
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110804219.7A
Other languages
English (en)
Other versions
CN113591625A (zh
Inventor
雷亚国
王文彬
姜鑫伟
杨彬
李乃鹏
曹军义
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN202110804219.7A priority Critical patent/CN113591625B/zh
Publication of CN113591625A publication Critical patent/CN113591625A/zh
Application granted granted Critical
Publication of CN113591625B publication Critical patent/CN113591625B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M13/00Testing of machine parts
    • G01M13/02Gearings; Transmission mechanisms
    • G01M13/021Gearings
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M13/00Testing of machine parts
    • G01M13/02Gearings; Transmission mechanisms
    • G01M13/028Acoustic or vibration analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Acoustics & Sound (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

一种不平衡样本重要性加权的齿轮箱故障诊断方法,首先获取齿轮箱在不同健康状态下的振动信号;其次构建特征提取模块自动获取监测样本的深层故障特征;再次构建加权分类模块,在分类时引入自适应权重对各类样本赋予不同的惩罚因子;最后利用构建考虑样本重要性损失函数以及自适应权重损失函数,交替优化特征提取模块参数与自适应权重;本发明所得智能诊断模型由特征提取模块和加权分类模块构成,考虑到了样本重要性,能够有效克服训练样本不平衡对诊断的不利影响,可以直接利用齿轮箱原始振动信号完成健康状态的识别,实现了不平衡训练数据集情境下齿轮箱的健康状态智能诊断。

Description

一种不平衡样本重要性加权的齿轮箱故障诊断方法
技术领域
本发明属于齿轮箱故障诊断技术领域,具体涉及一种不平衡样本重要性加权的齿轮箱故障诊断方法。
背景技术
齿轮箱是复杂机械装备的关键组成之一,一旦发生故障将极大地制约机械设备的正常运行,甚至危及人生安全,保障其健康运行显得尤为重要。随着人工智能在故障诊断领域的深入应用,从监测数据中获取可反映齿轮箱运行状态的有效信息,进而对其健康状态进行识别有了新的方法。借助人工智能算法建立齿轮箱智能故障诊断模型成为齿轮箱安全运行保障的重要手段。
在工程实际中,齿轮箱在运行过程中长期处于正常状态,导致正常状态下的监测数据居多,故障状态下的监测数据少于正常状态;此外,齿轮箱在运行过程中各故障发生的频率亦存在差异。在这两个因素的共同作用下,监测数据中各类健康状态样本数量差异明显,最终形成了不平衡监测数据集。如果使用不平衡数据集训练诊断模型,所得到的诊断模型将难以从少数类样本中学习到充足的诊断知识;进而诊断模型将易于获取多数类样本中的故障信息,而难以获取少数类样本中所蕴含的有效故障信息,最终对各类健康状态诊断精度不同(多数类健康状态诊断精度高,少数类健康状态诊断精度低)。因此,受不平衡监测数据集的影响,现有齿轮箱智能故障诊断方法难以准确地识别少数类健康状态样本,导致整体诊断精度不高。
发明内容
为了克服上述现有技术的缺陷,本发明的目的在于提出一种不平衡样本重要性加权的齿轮箱故障诊断方法,提高了监测数据分布不平衡条件下智能诊断模型诊断精度。
为达到上述目的,本发明采取的技术方案为:
一种不平衡样本重要性加权的齿轮箱故障诊断方法,包括以下步骤:
步骤1:获取齿轮箱各健康状态下的振动信号样本集
Figure BDA0003165770330000021
总共包括R种健康状态,其中,
Figure BDA0003165770330000022
为第m个振动信号样本,由N个振动数据点组成,ym∈{1,2,3,...R}表示第m个振动信号样本的健康状态,M为振动信号样本总数;
步骤2:构建特征提取模块,对输入振动信号样本
Figure BDA0003165770330000023
进行深度故障特征提取,并将提取特征
Figure BDA0003165770330000024
作为特征提取模块的输出,提取过程如下公式:
Figure BDA0003165770330000025
式中:fm为样本xm经过特征提取模块后的输出,
Figure BDA0003165770330000026
为特征提取模块操作函数,θFeature为特征提取模块中待优化参数集合;
步骤3:构建加权分类模块,引入自适应权重δ,得到加权Softmax分类器,对特征提取模块的输出进行分类,得到样本xm属于第r种健康状态的预测概率为:
Figure BDA0003165770330000031
式中:p(·)为加权分类函数,W和b分别为权重矩阵和偏置项,δ为可自适应变化的权重;
步骤4:依次对于特征提取模块中待优化参数θFeature和加权分类模块中自适应权重δ进行优化;
步骤5:重复依次执行步骤2至步骤4迭代优化由特征提取模块与加权分类模块构成的智能诊断模型;
步骤6:将齿轮箱振动信号样本输入至训练好的智能诊断模型中,加权分类模块输出所对应的健康状态即为预测健康状态。
所述的步骤2的具体为:
2.1)构建特征单元,在一个特征单元中依次为卷积层、批量归一化层、线性整流函数激活层和最大池化层;
2.2)堆叠k个特征单元;
2.3)在堆叠的特征单元之后,经过平铺层将提取的深度故障特征平铺成一维向量,在经过全连接层进行降维,得到特征提取模块输出。
所述的步骤4具体为:
4.1)基于Adam优化算法,更新特征提取模块中参数θFeature,以最小化如下目标函数:
Figure BDA0003165770330000032
式中:N为批量输入样本数,
Figure BDA0003165770330000033
为样本xm被预测为第r种健康状态的概率,
Figure BDA0003165770330000041
为样本xm的重要性评价,I{·}为指示函数;
4.2)依次计算G-mean和F-score两种分类评价指标,计算表达式分别为:
Figure BDA0003165770330000042
Figure BDA0003165770330000043
式中:I1为G-mean指标,ar为第r种健康状态的分类准确率,I2为F-score指标,Ir为第r种健康状态的F-measure评价指标;
4.3)基于Adam优化算法,更新自适应权重δ,以最小化如下损失函数:
Figure BDA0003165770330000044
式中:
Figure BDA0003165770330000045
β为训练数据集中各类健康状态样本数量比例。
本发明的有益效果为:
本发明提出了一种不平衡样本重要性加权的齿轮箱故障诊断方法,该方法构建了特征提取模块以及考虑样本重要性的损失函数,并在预测分类时引入可自适应变化的权重向量,利用该权重向量对各类健康状态样本赋予不同的惩罚因子,以提高模型对少数类样本故障信息的获取能力,从而实现对少数类健康状态样本的准确识别。本发明克服了因各类数据样本之间数量不平衡导致模型诊断精度不高的问题,最终提高了模型在不平衡数据集下的诊断精度。
附图说明
图1为本发明的流程图。
图2为本发明智能诊断模型示意图。
具体实施方式
下面结合实施例和附图对本发明做进一步详细描述。
参照图1,一种不平衡样本重要性加权的齿轮箱故障诊断方法,包括以下步骤:
步骤1:获取齿轮箱各健康状态下的振动信号样本集
Figure BDA0003165770330000051
总共包括R种健康状态,其中,
Figure BDA0003165770330000052
为第m个振动信号样本,由N个振动数据点组成,ym∈{1,2,3,...R}表示第m个振动信号样本的健康状态,M为振动信号样本总数;
步骤2:参照图2,构建特征提取模块,对输入振动信号样本
Figure BDA0003165770330000053
进行深度故障特征提取,并将提取特征
Figure BDA0003165770330000054
作为特征提取模块的输出,提取过程如下公式:
Figure BDA0003165770330000055
式中:fm为样本xm经过特征提取模块后输出的特征,
Figure BDA0003165770330000056
为特征提取模块操作函数,θFeature为特征提取模块中待优化参数集合;
具体步骤如下:
2.1)构建特征单元,在一个特征单元中依次为卷积层、批量归一化层、线性整流函数激活层和最大池化层;
2.2)堆叠k个特征单元;
2.3)在堆叠的特征单元之后,经过平铺层将提取的深度故障特征平铺成一维向量,在经过全连接层进行降维,得到特征提取模块输出;
步骤3:参照图2,构建加权分类模块,加权分类模块为一个引入自适应权重δ的Softmax分类器,对特征提取模块的输出
Figure BDA0003165770330000061
进行分类,进而得到样本xm属于第r种健康状态的预测概率为:
Figure BDA0003165770330000062
式中:p(·)为加权分类函数,W和b分别为权重矩阵和偏置项,δ为可自适应变化的权重;
步骤4:参照图2,依次对于特征提取模块中待优化参数θFeature和加权分类模块中自适应权重δ进行优化,具体为:
4.1)基于Adam优化算法,更新特征提取模块中参数θFeature,以最小化如下目标函数,该目标函数考虑到了样本的重要性:
Figure BDA0003165770330000063
式中:N为批量输入样本数,
Figure BDA0003165770330000064
为样本xm被预测为第r种健康状态的概率,
Figure BDA0003165770330000065
为样本xm的重要性评价,I{·}为指示函数;
4.2)依次计算G-mean和F-score两种分类评价指标,计算表达式分别为:
Figure BDA0003165770330000066
Figure BDA0003165770330000067
式中:I1为G-mean指标,ar为第r种健康状态的分类准确率,I2为F-score指标,Ir为第r种健康状态的F-measure评价指标;
4.3)基于Adam优化算法,更新自适应权重δ,以最小化如下损失函数:
Figure BDA0003165770330000068
式中:
Figure BDA0003165770330000071
β为训练数据集中各类健康状态样本数量比例;
步骤5:重复依次执行步骤2至步骤4迭代优化由特征提取模块与加权分类模块构成的智能诊断模型;
步骤6:将齿轮箱振动信号样本输入至训练好的智能诊断模型中,加权分类模块输出所对应的健康状态即为预测健康状态。
实施例:以机械设备中的行星齿轮箱为案例,基于混合齿轮传动实验数据,对本发明方法的有效性进行验证。
获取混合齿轮传动实验的振动信号样本组成1个不平衡数据集如表1所示,包含8种健康状态:正常状态、定轴齿轮故障、太阳轮故障、行星轮故障、定轴齿轮与太阳轮复合故障、定轴齿轮与行星轮复合故障、太阳轮与行星轮复合故障以及定轴齿轮、太阳轮与行星轮复合故障。振动信号样本在电机转速为1800r/min,负载为0.3A的工况下获取,在测试过程中,振动信号的采样频率为12800Hz,测试结束后,每种健康状态的样本数为1000个,每个样本中包含1920个数据点。为模拟样本不平衡情境,将训练数据中正常样本、单一故障样本、两点复合故障样本、多点复合故障样本分别按照50:30:15:10的比例设置得到不平衡训练集。
表1不平衡振动信号样本集
Figure BDA0003165770330000072
Figure BDA0003165770330000081
基于表1所示数据集分别构建诊断任务验证本发明方法的可行性,除诊断精度外,选用G-mean与F-score两种不平衡分类评价指标量化本发明方法在诊断任务上的效果。为排除随机因素干扰,实验重复20次,计算诊断结果的统计值,如表2所示,本发明方法在数据集上取得了98.35%的诊断精度,此外,本发明方法获得的G-mean与F-score指标分别为0.981与0.969,指标均接近于1,说明本发明方法的诊断准确性高,验证了本发明方法在解决不平衡样本诊断问题中的可行性。
表2不同方法的诊断效果对比
Figure BDA0003165770330000082
另选取两种诊断方法对比本发明方法的效果。方法1为基于卷积神经网络诊断方法,未考虑样本重要程度,并且在训练时使用不加权的Softmax损失函数,最终在数据集上的诊断精度仅为84.68%,G-mean与F-score分别为0.871和0.807,明显低于本发明方法。方法2结合SMOTE和Tomek links的混合重采样算法对数据集进行重采样,以消除各类故障样本不平衡状况,这种方法在数据集上的诊断精度为90.19%,G-mean与F-score分别为0.902和0.899,明显低于本发明方法。
通过对比本发明与其余两种诊断方法,表明本发明有效地克服了样本不平衡对诊断的影响,提高了诊断模型的诊断精度。

Claims (3)

1.一种不平衡样本重要性加权的齿轮箱故障诊断方法,其特征在于,包括以下步骤:
步骤1:获取齿轮箱各健康状态下的振动信号样本集
Figure FDA0003165770320000011
总共包括R种健康状态,其中,
Figure FDA0003165770320000012
为第m个振动信号样本,由N个振动数据点组成,ym∈{1,2,3,...R}表示第m个振动信号样本的健康状态,M为振动信号样本总数;
步骤2:构建特征提取模块,对输入振动信号样本
Figure FDA0003165770320000013
进行深度故障特征提取,并将提取特征
Figure FDA0003165770320000014
作为特征提取模块的输出,提取过程如下公式:
Figure FDA0003165770320000015
式中:fm为样本xm经过特征提取模块后的输出,
Figure FDA0003165770320000016
为特征提取模块操作函数,θFeature为特征提取模块中待优化参数集合;
步骤3:构建加权分类模块,引入自适应权重δ,得到加权Softmax分类器,对特征提取模块的输出进行分类,得到样本xm属于第r种健康状态的预测概率为:
Figure FDA0003165770320000017
式中:p(·)为加权分类函数,W和b分别为权重矩阵和偏置项,δ为可自适应变化的权重;
步骤4:依次对于特征提取模块中待优化参数θFeature和加权分类模块中自适应权重δ进行优化;
步骤5:重复依次执行步骤2至步骤4迭代优化由特征提取模块与加权分类模块构成的智能诊断模型;
步骤6:将齿轮箱振动信号样本输入至训练好的智能诊断模型中,加权分类模块输出所对应的健康状态即为预测健康状态。
2.根据权利要求1所述的一种不平衡样本重要性加权的齿轮箱故障诊断方法,其特征在于,所述的步骤2的具体步骤为:
2.1)构建特征单元,在一个特征单元中依次为卷积层、批量归一化层、线性整流函数激活层和最大池化层;
2.2)堆叠k个特征单元;
2.3)在堆叠的特征单元之后,经过平铺层将提取的深度故障特征平铺成一维向量,在经过全连接层进行降维,得到特征提取模块输出。
3.根据权利要求1所述的一种不平衡样本重要性加权的齿轮箱故障诊断方法,其特征在于,所述的步骤4具体为:
4.1)基于Adam优化算法,更新特征提取模块中参数θFeature,以最小化如下目标函数:
Figure FDA0003165770320000021
式中:N为批量输入样本数,
Figure FDA0003165770320000022
为样本xm被预测为第r种健康状态的概率,
Figure FDA0003165770320000023
为样本xm的重要性评价,I{·}为指示函数;
4.2)依次计算G-mean和F-score两种分类评价指标,计算表达式分别为:
Figure FDA0003165770320000024
Figure FDA0003165770320000025
式中:I1为G-mean指标,ar为第r种健康状态的分类准确率,I2为F-score指标,Ir为第r种健康状态的F-measure评价指标;
4.3)基于Adam优化算法,更新自适应权重δ,以最小化如下损失函数:
Figure FDA0003165770320000031
式中:
Figure FDA0003165770320000032
β为训练数据集中各类健康状态样本数量比例。
CN202110804219.7A 2021-07-16 2021-07-16 一种不平衡样本重要性加权的齿轮箱故障诊断方法 Active CN113591625B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110804219.7A CN113591625B (zh) 2021-07-16 2021-07-16 一种不平衡样本重要性加权的齿轮箱故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110804219.7A CN113591625B (zh) 2021-07-16 2021-07-16 一种不平衡样本重要性加权的齿轮箱故障诊断方法

Publications (2)

Publication Number Publication Date
CN113591625A CN113591625A (zh) 2021-11-02
CN113591625B true CN113591625B (zh) 2022-12-09

Family

ID=78247741

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110804219.7A Active CN113591625B (zh) 2021-07-16 2021-07-16 一种不平衡样本重要性加权的齿轮箱故障诊断方法

Country Status (1)

Country Link
CN (1) CN113591625B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115452373B (zh) * 2022-09-23 2024-05-28 西安交通大学 一种基于事件相机的滚动轴承故障诊断方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110059601B (zh) * 2019-04-10 2021-04-13 西安交通大学 一种多特征提取与融合的智能故障诊断方法
CN111337256B (zh) * 2020-03-27 2020-12-29 西安交通大学 域不对称因子加权的滚动轴承故障深度局部迁移诊断方法
CN112101085B (zh) * 2020-07-22 2022-05-20 西安交通大学 一种基于重要性加权域对抗自适应的智能故障诊断方法

Also Published As

Publication number Publication date
CN113591625A (zh) 2021-11-02

Similar Documents

Publication Publication Date Title
CN109918752B (zh) 基于迁移卷积神经网络的机械故障诊断方法、设备及介质
CN111046945B (zh) 基于组合卷积神经网络的故障类型及损坏程度诊断方法
CN112417954B (zh) 一种面向小样本数据集的轴承故障模式诊断方法及系统
CN108918137B (zh) 基于改进的wpa-bp神经网络的齿轮箱故障诊断装置及其方法
CN114429153B (zh) 基于终身学习的齿轮箱增量故障诊断方法及系统
CN111337256B (zh) 域不对称因子加权的滚动轴承故障深度局部迁移诊断方法
CN112161784A (zh) 基于多传感器信息融合迁移网络的机械故障诊断方法
CN109978134B (zh) 一种基于快速集成卷积神经网络的故障预测方法
CN110132554A (zh) 一种深度拉普拉斯自编码的旋转机械故障诊断方法
CN111753891B (zh) 一种无监督特征学习的滚动轴承故障诊断方法
CN112257528B (zh) 一种基于小波变换和密集连接扩张卷积神经网络的风电齿轮箱故障诊断方法
CN111022313B (zh) 一种基于lstm的海洋平台空气压缩机故障诊断方法
CN110909802A (zh) 一种基于改进的pso优化pnn平滑因子的故障分类方法
CN111680788A (zh) 基于深度学习的设备故障诊断方法
CN111812507A (zh) 一种基于图卷积的电机故障诊断方法
CN113591625B (zh) 一种不平衡样本重要性加权的齿轮箱故障诊断方法
CN114091504A (zh) 一种基于生成对抗网络的旋转机械小样本故障诊断方法
CN113125960A (zh) 一种基于随机森林模型的车载锂离子电池荷电状态预测方法
CN113095179A (zh) 元度量学习驱动的直升机行星齿轮箱故障诊断方法
CN115545070A (zh) 基于综合平衡网络的类不平衡轴承智能诊断方法
CN113591638A (zh) 一种基于卷积胶囊网络的行星齿轮箱故障诊断方法
CN115587290A (zh) 基于变分自编码生成对抗网络的航空发动机故障诊断方法
CN112414715A (zh) 基于混合特征与改进灰度共生算法的轴承故障诊断方法
CN111562109A (zh) 一种机械设备深度学习状态识别与诊断方法
CN110490218B (zh) 一种基于两级dbn的滚动轴承故障自学习方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant