CN108229547B - 一种基于局部模型迁移学习的齿轮故障识别方法 - Google Patents

一种基于局部模型迁移学习的齿轮故障识别方法 Download PDF

Info

Publication number
CN108229547B
CN108229547B CN201711442330.6A CN201711442330A CN108229547B CN 108229547 B CN108229547 B CN 108229547B CN 201711442330 A CN201711442330 A CN 201711442330A CN 108229547 B CN108229547 B CN 108229547B
Authority
CN
China
Prior art keywords
dimensional
feature
target
auxiliary
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711442330.6A
Other languages
English (en)
Other versions
CN108229547A (zh
Inventor
严如强
沈飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201711442330.6A priority Critical patent/CN108229547B/zh
Publication of CN108229547A publication Critical patent/CN108229547A/zh
Application granted granted Critical
Publication of CN108229547B publication Critical patent/CN108229547B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本发明公开了一种基于局部模型迁移学习的齿轮故障识别方法,包括时频域特征的提取、迁移学习中辅助数据集的选取和基于局部模型的迁移学习方法。在给定时频域提取特性的基础上,通过建立威氏符号秩检验和卡方检验结合模型计算目标数据与辅助数据的相似度,并筛选辅助数据;最后利用以SVM为核心的局部迁移模型将筛选的辅助数据的有用共性参数迁移至目标数据以实现齿轮箱的故障识别。本发明不但提升了机器学习在仅有少量目标数据时的诊断精度,降低诊断成本,并且增强了齿轮故障诊断的环境适应性和通用性,具有潜在的经济价值。

Description

一种基于局部模型迁移学习的齿轮故障识别方法
技术领域
本法涉及一种机械故障诊断方法,尤其是涉及一种基于局部模型迁移学习的齿轮故障识别方法。
背景技术
一方面,目前的齿轮故障诊断过程特别是传统机器学习算法在遇到传动齿轮箱变工况,变转速和环境条件变化时往往难以诊断。另一方面,假设由于某种限制使得齿轮采集数据量较少,该情况下那些依赖于较多数据为支撑的诊断方法其故障识别精度将大幅降低,难以满足诊断需求。其根本原因是方法依赖于构建模型时所学习的数据,一旦应用数据与学习数据发生偏离,模型对新数据将不再适用,故缺乏通用性。
上述诊断方法中,一旦应用数据发生变化,模型将不得不重新学习新的应用数据以满足新要求,其前提是应用数据样本足够大到可以用于构建新模型。而迁移学习是一种不局限于应用数据与学习数据等同的方法,应用数据发生变化时,学习过程将只吸收学习数据中对应用数据有用的部分,摒弃其无用部分,使得学习数据对应用数据仍旧有效。在齿轮故障诊断过程中,一旦工况,转速或者环境发生变化,应用数据与学习数据出现偏离,迁移学习能够调整学习数据之间的样本权重或者内部参数权重,使得学习数据中与应用数据相似部分权重增大,不相似部分权重减少,从而达到“取其精华,去其糟粕”的目的。
发明内容
发明目的:为了克服现有齿轮故障诊断方法的不足,本发明提供了一种以迁移学习为主要应对策略,能够有效应对齿轮变化工况环境,提升诊断精度,降低诊断成本的基于局部模型迁移学习的齿轮故障识别方法。
技术方案:本发明的一种基于局部模型迁移学习的齿轮故障识别方法,该方法包括以下步骤:
(1)提取时频域特征;
提取目标数据特征向量A和辅助数据特征向量Bj
(2)选取迁移学习中的辅助数据集;
在给定时频域特征的基础上,通过建立威氏符号秩检验和卡方检验结合模型,计算目标数据与辅助数据的相似度,并筛选辅助数据;
(3)利用局部模型迁移学习算法和SVM迭代算法,实现齿轮故障识别;
最后利用以SVM为核心的局部迁移模型将筛选的辅助数据的有用共性参数迁移至目标数据以实现齿轮箱的故障识别。
进一步的,所述步骤(1)包括:对目标特定任务下的齿轮实施时频域特征提取得到目标数据特征向量A=[ε1,ε2,...,ε59],对非目标特定任务下的齿轮实施相同特征提取得到辅助数据特征向量Bj=[δ(j,1),δ(j,2),...,δ(j,59)];
其中,A为59维的目标特征向量,εi为所提取的时频域特征,下标i∈{1,2,...,59}为特征维数,Bj为y组59维的辅助特征向量,y为来自不同辅助域的域数,δ(j,i)为所提取的时频域特征,下标i∈{1,2,...,59}为特征维数,下标j∈{1,2,...,y}为辅助域的域编号。
更进一步的,所述目标特征向量和辅助特征向量包括振动加速度、扭矩、转动频率和驱动电流;59维的目标特征向量和y组59维的辅助特征向量均包括7维时域振动特征、19维频域振动特征、31维噪声特征和2维扭矩特征;
所述7维时域振动特征包含均值、方差、峰值、偏差系数、香农熵、协方差和阿里亚斯烈度特征;
所述19维频域振动特征包含电机频率,行星齿轮箱行星轮频率,行星齿轮箱太阳轮频率,减速齿轮箱一级主动轮频率,减速齿轮箱一级从动轮频率,减速齿轮箱二级主动轮频率,减速齿轮箱二级从动轮频率点上小波能量特征;
所述31维噪声特征包含30维奇异值分解特征和1维信噪比特征;
所述2维扭矩特征包含扭矩和驱动电流。
进一步的,所述步骤(2)包括:从y个59维的辅助数据特征向量Bj中随机选取1个辅助特征向量,对目标数据特征向量和辅助数据特征向量实施威氏符号秩检验和卡方检验相结合的相似度估计,若检验合格,则实施步骤(3),若检验不合格,则返回步骤(2)重新选取辅助特征向量。
更进一步的,所述威氏符号秩检验方法包括以下步骤:
(21-1)选取目标特征向量A=[ε1,ε2,...,ε59]和第j组辅助数据特征向量Bj=[δ(j,1),δ(j,2),...,δ(j,59)],计算两者之间的欧式距离Eu=|A-Bj|;
(21-2)将向量Eu的59维数据从小到大排列,并计算每一维的秩,并将计算所有εi>δ(j,i)秩的和W+,所有εi<δ(j,i)秩的和W-,并令W=min(W+,W-):
Figure BDA0001526877300000031
(21-3)对于双边检验假设:
Figure BDA0001526877300000032
根据(W,59)查找τj分布表,得到Pw值,其代表当A=Bj时,威氏符号秩检验统计量大于或等于实际卡方值τj的概率,即Pw=2P(τ≥|τj||A=Bj),若Pw<0.3,则第j辅助数据域为可利用的辅助数据域,否则为不可利用的辅助数据域。
更进一步的,所述卡方检验方法包括以下步骤:
(22-1)特征向量归一化,包括目标特征向量和辅助特征向量:
Figure BDA0001526877300000033
Figure BDA0001526877300000034
其中,
Figure BDA0001526877300000035
为所有目标数据样本的第i个特征组成的向量,N为目标样本数量,n∈{1,2,...,N}为样本编号,
Figure BDA0001526877300000036
&和
Figure BDA0001526877300000037
为Ei的最小值、中值、最大值和均值,一般而言,N≤100;
其中,
Figure BDA0001526877300000038
为第j辅助域中所有数据样本的第i个特征组成的向量,M为辅助样本数量,m∈{1,2,...,M}为样本编号,
Figure BDA0001526877300000039
Figure BDA00015268773000000310
为F(j,i)的最小值、中值、最大值和均值,一般而言,M≥300;
归一化后第n样本的目标数据特征向量ZA表示为:
Figure BDA00015268773000000311
归一化后第m样本的辅助数据特征向量ZBj表示为:
Figure BDA0001526877300000041
其中,
Figure BDA0001526877300000042
Figure BDA0001526877300000043
为目标特征向量和辅助特征向量归一化后的计算特征值,其特征值限制在0到1的区间内,且指数确保了ZA和ZBj概率分布峰值处于中心;
(22-2)将ZA和ZBj按概率密度分布平均切分成K段:
Figure BDA0001526877300000044
Figure BDA0001526877300000045
其中Pt为ZA的概率密度分布向量,
Figure BDA0001526877300000046
为每一段的概率密度,Pa为ZBj的概率密度分布向量,
Figure BDA0001526877300000047
为每一段的概率密度;
(22-3)计算ZA和ZBj之间的卡方值
Figure BDA0001526877300000048
Figure BDA0001526877300000049
其中,K为切分段数,k为切分段编号;
(22-4)对于双边检验假设:
Figure BDA00015268773000000410
ZA≠ZBj,根据(χ2,K)查找χ2分布表,得到Pc值,其代表当ZA=ZBj时,卡方检验统计量大于或等于实际卡方值
Figure BDA00015268773000000411
的概率,即
Figure BDA00015268773000000412
若Pc<0.3,则第j辅助数据域为可利用的辅助数据域,否则为不可利用的辅助数据域;
(22-5)计算目标数据域和第j辅助数据域综合相似度:
S=(Pw)α×(Pc)β (7);
其中,0≤α≤β≤1,α和β为威氏符号秩检验和卡方检验方法的检验设定权重,故0≤S≤1,越小相似度越高。
进一步的,所述步骤(3)包括以下步骤:
(31)将59维特征向量切分为7维时域振动特征+2维扭矩特征子向量,19维频域振动特征+2维扭矩特征子向量,31维噪声特征+2维扭矩特征子向量,2维扭矩特征子向量,4个子向量为:
A1=[ε1,...,ε7,ε58,ε59] (8);
A2=[ε8,...,ε26,ε58,ε59] (9);
A3=[ε27,...,ε57,ε58,ε59] (10);
A4=[ε58,ε59] (11);
Bj1=[δ(j,1),...,δ(j,7),δ(j,58),δ(j,59)] (12);
Bj2=[δ(j,8),...,δ(j,26),δ(j,58),δ(j,59)] (13);
Bj3=[δ(j,27),...,δ(j,57),δ(j,58),δ(j,59)] (14);
Bj4=[δ(j,58),δ(j,59)] (15);
其中,A1,A2,A3和A4为目标数据子特征向量;Bj1,Bj2,Bj3和Bj4为第j辅助数据子特征向量;
(32)构建分类器的训练集T1、T2、T3及T4和相应的测试集S1、S2、S3及S4,其中T1和S1的构建方法如下:
Figure BDA0001526877300000051
Figure BDA0001526877300000052
Figure BDA0001526877300000053
Figure BDA0001526877300000054
Figure BDA0001526877300000055
其中,
Figure BDA0001526877300000056
Figure BDA0001526877300000057
分别为目标数据训练集和辅助数据的训练集,
Figure BDA0001526877300000058
为目标数据测试集,训练集T1的样本数量为M+N,其中M为
Figure BDA00015268773000000513
的样本数,N为
Figure BDA00015268773000000514
的样本数,M<N,测试集S1的样本数量为X;
Figure BDA00015268773000000515
为第x样本的故障类别编号,不同的齿轮故障类型拥有不同的唯一类别编号;上标t代表目标数据,上标a代表辅助数据;T2和S2,T3和S3,T4和S4的构建方法与T1和S1相同;
(33)针对辅助数据集
Figure BDA0001526877300000059
Figure BDA00015268773000000510
实施高斯内核的支持向量机SVM算法得到4个子分类结果
Figure BDA00015268773000000511
得到该结果的输入参数集分别为(σr,ωr,br),r∈{1,2,3,4},其中:
f(x)=ωTφ(x)+b (21);
Figure BDA00015268773000000512
其中,f(x)为SVM分类器的输出结果,x为分类器输入的特征向量,φ(x)为x所处的低维空间至ω所处的高维空间的映射,ω=(ω1;ω2;...;ωd)为高维空间分类或切割平面的方向,d为高维空间维数;b为分类或切割平面与原点的距离;
其中,φ(x)由高斯核函数
Figure BDA0001526877300000061
计算可得,核函数中σ>0为高斯宽度,xi,xj为向量x的两个元素;
(34)将输入参数集(σr,ωr,br)代入目标数据集
Figure BDA0001526877300000062
Figure BDA0001526877300000063
得到4个子分类结果
Figure BDA0001526877300000064
并计算这4个子分类结果的分类精度[Ac1;Ac2;Ac3;Ac4];
(35)根据三个子分类器的分类精度计算权重:
Figure BDA0001526877300000065
其中,w1,w2和w3分别为A1,A2和A3的分类权重;
(36)输出测试集S局部模型迁移学习的分类结果:
Figure BDA0001526877300000066
其中,Y(·)为故障类别映射函数,1,2,...,L为故障类别编号,L为总故障类别数,E[·]为均值函数。
有益效果:与现有技术相比,本发明的一种基于局部模型迁移学习的齿轮故障识别方法,其采用局部模型迁移学习方法实施故障识别,方法不但能提高传统机器学习在应用数据较少时的诊断和识别精度,而且能够利用更少成本实现变工况,变转速,变环境的传动齿轮箱的齿轮故障识别,节省诊断时间,具有潜在的经济价值。
附图说明
图1是本发明方法的流程图;
图2是本发明的59维特征向量组成图;
图3a-图3d是本发明的变工况环境数据的Pw值和Pc值比较图;其中,图3a为变转速;图3b为变负载;图3c为变信噪比SNR;图3d为不同齿轮对象;
图4是本发明的局部模型特征子向量图;
图5是本发明的滑窗选择辅助数据和目标数据示意图;
图6a为电机转速变化曲线图;
图6b是根据图6a中电机转速的变化下Tradaboost算法与局部模型正确率对比。
具体实施方式
下面结合附图及具体实施例对本发明进行详细说明。
如图1所示,一种基于局部模型迁移学习的齿轮故障识别方法,该方法能够在目标样本数据量较少的情况下,充分挖掘大量辅助样本中与目标样本相似的部分从而帮助目标数据的故障识别,包括如下步骤:
(1)对目标特定任务下的齿轮实施时频域特征提取得到目标数据特征向量A=[ε1,ε2,...,ε59],对非目标特定任务下的齿轮实施相同特征提取得到辅助数据特征向量Bj=[δ(j,1),δ(j,2),...,δ(j,59)]。其中,A为59维的目标特征向量,εi为所提取的时频域特征,下标i∈{1,2,...,59}为特征维数,Bj为y组59维的辅助特征向量,y为来自不同辅助域的域数,δ(j,i)为所提取的时频域特征,下标i∈{1,2,...,59}为特征维数,下标j∈{1,2,...,y}为辅助域的域编号。
其中,所述目标数据来源为:目标环境下目标齿轮的采集数据,包括振动加速度,扭矩,转动频率和驱动电流;所述辅助数据来源为:非目标环境或非目标齿轮的采集数据,包括振动加速度,扭矩,转动频率和驱动电流。
如图2所示,所述时频域特征提取方法包含7维时域振动特征、19维频域振动特征、31维噪声特征、2维扭矩特征、7维时域振动特征包含均值、方差、峰值、偏差系数、香农熵、协方差和阿里亚斯烈度,列表如下:
表1
Figure BDA0001526877300000071
Figure BDA0001526877300000081
其中,x,y,z为采集对象X,Y,Z三个方向的振动值。
19维频域振动特征包含电机频率,行星齿轮箱行星轮频率,行星齿轮箱太阳轮频率,减速齿轮箱一级主动轮频率,减速齿轮箱一级从动轮频率,减速齿轮箱二级主动轮频率,减速齿轮箱二级从动轮频率点上小波能量,特征频率根据齿轮齿数和传动比计算,列表如下:
表2
Figure BDA0001526877300000082
31维噪声特征包含30维奇异值分解(SVD)特征和1维信噪比(SNR)特征,其中30维奇异值为振动数据自相关矩阵的前30对角线元素。
2维扭矩特征为扭矩传感器测定扭矩和控制驱动电流。
(2)从y个59维的辅助特征向量随机选取1个辅助特征向量Bj,其中j∈{1,2,...,y},对A和Bj实施威氏符号秩检验和卡方检验相结合的相似度估计,若检验合格,则实施步骤(3),若检验不合格,则返回步骤(2)重新选取辅助特征向量;
图1中,威氏符号秩检验方法步骤如下:
(21-1)选取目标特征向量A=[ε1,ε2,...,ε59]和第j组辅助数据特征向量Bj=[δ(j,1),δ(j,2),...,δ(j,59)],计算两者之间的欧式距离Eu=|A-Bj|;
(21-2)将向量Eu的59维数据从小到大排列,并计算每一维的秩,并将计算所有εi>δ(j,i)秩的和W+,所有εi<δ(j,i)秩的和W-,并令W=min(W+,W-):
Figure BDA0001526877300000083
(21-3)对于双边检验假设:
Figure BDA0001526877300000084
根据(W,59)查找τj分布表,得到Pw值,其代表当A=Bj时,威氏符号秩检验统计量大于或等于实际卡方值τj的概率,即Pw=2P(τ≥|τj||A=Bj),若Pw<0.3,则第j辅助数据域为可利用的辅助数据域,否则为不可利用的辅助数据域。
图1中,卡方检验方法步骤如下:
(22-1)特征向量归一化,包括目标特征向量和辅助特征向量:
Figure BDA0001526877300000091
Figure BDA0001526877300000092
其中,
Figure BDA0001526877300000093
为所有目标数据样本的第i个特征组成的向量,N为目标样本数量,n∈{1,2,...,N}为样本编号,
Figure BDA0001526877300000094
Figure BDA0001526877300000095
为Ei的最小值、中值、最大值和均值,一般而言,N≤100。
其中,
Figure BDA0001526877300000096
为第j辅助域中所有数据样本的第i个特征组成的向量,M为辅助样本数量,m∈{1,2,...,M}为样本编号,
Figure BDA0001526877300000097
Figure BDA0001526877300000098
为F(j,i)的最小值、中值、最大值和均值,一般而言,M≥300。
归一化后第n样本的目标数据特征向量ZA表示为:
Figure BDA0001526877300000099
归一化后第m样本的辅助数据特征向量ZBj表示为(第j辅助数据域):
Figure BDA00015268773000000910
其中,
Figure BDA00015268773000000911
Figure BDA00015268773000000912
为目标特征向量和辅助特征向量归一化后的计算特征值,其特征值限制在0到1的区间内,且指数确保了ZA和ZBj概率分布峰值处于中心。
(22-2)将ZA和ZBj按概率密度分布平均切分成K段:
Figure BDA00015268773000000913
Figure BDA00015268773000000914
其中Pt为ZA的概率密度分布向量,
Figure BDA00015268773000000915
为每一段的概率密度,Pa为ZBj的概率密度分布向量,
Figure BDA0001526877300000101
为每一段的概率密度。
(22-3)计算ZA和ZBj之间的卡方值
Figure BDA0001526877300000102
Figure BDA0001526877300000103
其中,K为切分段数,k为切分段编号;
(22-4)对于双边检验假设:
Figure BDA0001526877300000104
ZA≠ZBj,根据(χ2,K)查找χ2分布表,得到Pc值,其代表当ZA=ZBj时,卡方检验统计量大于或等于实际卡方值
Figure BDA0001526877300000105
的概率,即
Figure BDA0001526877300000106
若Pc<0.3,则第j辅助数据域为可利用的辅助数据域,否则为不可利用的辅助数据域。
(22-5)计算目标数据域和第j辅助数据域综合相似度:
S=(Pw)α×(Pc)β (7);
其中,0≤α≤β≤1,α和β为威氏符号秩检验和卡方检验方法的检验设定权重,故0≤S≤1,越小相似度越高。
参见图3a-图3d,在变转速、变负载、变信噪比和变对象的Pw和Pc比较曲线中,目标数据的环境设定为:①转速:30Hz,②负载:0V,③信噪比:32.4,④采集对象:减速齿轮箱;辅助数据的环境设定列表如下表3。图3a-图3d中可以看出,变工况对信号特性的影响程度排序为:转速>采集对象>噪声>负载,即变转速对信号影响最大,变负载影响最小,其次,在无论哪种变工况环境下,其影响趋势均为距离目标数据工况越接近的辅助数据影响越小,工况差异越大的影响越大,最后图3d表明,假设我们想要采用减速齿轮箱作为目标对象,电机作为辅助对象是不合适的,而行星齿轮箱作为辅助对象是合适的。
表3
Figure BDA0001526877300000107
Figure BDA0001526877300000111
(3)利用局部模型迁移学习算法,将上述59维向量按照时域、频域、噪声域和扭矩域切分为4组,并利用SVM迭代算法,迭代过程中增强特征向量中有用特征的权重,弱化其无用特征的权重,最终实现比机器学习更好的齿轮故障识别效果。
如图4所示,所述局部模型迁移学习算法,其思想是将全局特征向量分为若干子向量,并构建若干子分类器,利用子分类器获得的参数运用于全局特征向量中,方法实施步骤如下:
(31)将59维特征向量切分为7维时域振动特征+2维扭矩特征子向量,19维频域振动特征+2维扭矩特征子向量,31维噪声特征+2维扭矩特征子向量,2维扭矩特征子向量等4个子向量:
A1=[ε1,...,ε7,ε58,ε59] (8);
A2=[ε8,...,ε26,ε58,ε59] (9);
A3=[ε27,...,ε57,ε58,ε59] (10);
A4=[ε58,ε59] (11);
Bj1=[δ(j,1),...,δ(j,7),δ(j,58),δ(j,59)] (12);
Bj2=[δ(j,8),...,δ(j,26),δ(j,58),δ(j,59)] (13);
Bj3=[δ(j,27),...,δ(j,57),δ(j,58),δ(j,59)] (14);
Bj4=[δ(j,58),δ(j,59)] (15);
其中,A1,A2,A3和A4为目标数据子特征向量;Bj1,Bj2,Bj3&和Bj4为第j辅助数据子特征向量。
(32)构建分类器的训练集T1,T2,T3&和T4和相应的测试集S1,S2,S3和S4,以T1和S1为例,构建方法如下:
Figure BDA0001526877300000112
Figure BDA0001526877300000121
Figure BDA0001526877300000122
Figure BDA0001526877300000123
Figure BDA0001526877300000124
其中,
Figure BDA0001526877300000125
Figure BDA0001526877300000126
分别为目标数据训练集和辅助数据的训练集,
Figure BDA0001526877300000127
为目标数据测试集,训练集T1的样本数量为M+N,其中M为
Figure BDA0001526877300000128
的样本数,N为
Figure BDA0001526877300000129
的样本数,M<N,测试集S1的样本数量为X;
Figure BDA00015268773000001210
为第x样本的故障类别编号,不同的齿轮故障类型拥有不同的唯一类别编号;上标t代表目标数据,上标a代表辅助数据;T2和S2,T3和S3,T4和S4的构建方法与T1和S1相同。
(33)针对辅助数据集
Figure BDA00015268773000001211
Figure BDA00015268773000001212
实施高斯内核的支持向量机SVM算法得到4个子分类结果
Figure BDA00015268773000001213
得到该结果的输入参数集分别为(σr,ωr,br),r∈{1,2,3,4};其中:
f(x)=ωTφ(x)+b (21);
Figure BDA00015268773000001214
其中,f(x)为SVM分类器的输出结果,x为分类器输入的特征向量,φ(x)为x所处的低维空间至ω所处的高维空间的映射,ω=(ω1;ω2;...;ωd)为高维空间分类(或切割)平面的方向,d为高维空间维数;b为分类(或切割)平面与原点的距离。
其中,φ(x)由高斯核函数
Figure BDA00015268773000001215
计算可得,核函数中σ>0为高斯宽度,xi,xj为向量x的两个元素。
(34)将输入参数集(σr,ωr,br)代入目标数据集
Figure BDA00015268773000001216
Figure BDA00015268773000001217
得到4个子分类结果
Figure BDA00015268773000001218
并计算这4个子分类结果的分类精度[Ac1;Ac2;Ac3;Ac4]。
(35)根据三个子分类器的分类精度计算权重:
Figure BDA00015268773000001219
其中,w1,w2和w3分别为A1,A2&和A3的分类权重。
(36)输出测试集S局部模型迁移学习的分类结果:
Figure BDA0001526877300000131
其中,Y(·)为故障类别映射函数,1,2,...,L为故障类别编号,L为总故障类别数,E[·]为均值函数。
在图4的局部模型迁移学习方法中,从辅助数据获得的模型参数只应用于目标数据中与之匹配的部分,其权重分配依赖于三个子特性向量最终的分类结果以及连接特征向量(58-59维扭矩特征)的分类结果,下表4列举一个变转速故障识别的例子,该表4表明,子向量的故障诊断精度排序为:A3>A1>A2,权重值w1=0.338,w2=0.279,w3=0.383。
表4
Figure BDA0001526877300000132
同时试验对纯SVM方法和局部模型迁移学习进行了比较,可以看出,当目标数据量较少时,引入辅助数据对性能提升更大(20个目标样本时性能提升35.3%),目标数据量越多,辅助数据对目标数据性能提升越少(120个目标样本时性能提升2.69%),因此当目标数据量足够时,没有采用迁移学习策略的必要性。
表5
Figure BDA0001526877300000133
参见图5、图6a和图6b,在实时齿轮故障诊断中,采用“滑窗”方法实施变工况齿轮故障识别中目标数据和辅助数据选取,图5表明,其中当前时刻采集的样本为目标数据,目标数据样本量为N,当前时刻之前一段时间采集的样本为辅助数据,辅助数据样本量为M,当工况恒定时,目标数据和辅助数据特征相同,当工况慢速变化时,目标数据和辅助数据特性较为接近,当工况快变时,目标数据和辅助数据特性差异较大。从图6a和图6b中可以看出,无论是基于局部模型的迁移学习,还是基于实例模型的迁移学习(TrAdboost)在变转速的连续实时诊断过程中,在转速恒定时诊断精度出现两个峰值(第1峰值和第2峰值),转速变化较快时出现谷值,总体而言,转速恒定阶段齿轮故障识别精度>转速慢变阶段识别精度>转速快变阶段识别精度。

Claims (5)

1.一种基于局部模型迁移学习的齿轮故障识别方法,其特征在于,该方法包括以下步骤:
(1)提取时频域特征;
提取目标数据特征向量A和辅助数据特征向量Bj
(2)选取迁移学习中的辅助数据集;
在给定时频域特征的基础上,通过建立威氏符号秩检验和卡方检验结合模型,计算目标数据与辅助数据的相似度,并筛选辅助数据;具体包括:
从y个59维的辅助数据特征向量Bj中随机选取1个辅助特征向量,对目标数据特征向量和辅助数据特征向量实施威氏符号秩检验和卡方检验相结合的相似度估计,若检验合格,则实施步骤(3),若检验不合格,则返回步骤(2)重新选取辅助特征向量;
所述卡方检验方法包括以下步骤:
(22-1)特征向量归一化,包括目标特征向量和辅助特征向量:
Figure FDA0003344142280000011
Figure FDA0003344142280000012
其中,
Figure FDA0003344142280000013
为所有目标数据样本的第i个特征组成的向量,N为目标样本数量,n∈{1,2,...,N}为样本编号,
Figure FDA0003344142280000014
Figure FDA0003344142280000015
为Ei的最小值、中值、最大值和均值,N≤100;
其中,
Figure FDA0003344142280000016
为第j辅助域中所有数据样本的第i个特征组成的向量,M为辅助样本数量,m∈{1,2,...,M}为样本编号,
Figure FDA0003344142280000017
Figure FDA0003344142280000018
为F(j,i)的最小值、中值、最大值和均值,M≥300;
归一化后第n样本的目标数据特征向量ZA表示为:
Figure FDA0003344142280000019
归一化后第m样本的辅助数据特征向量ZBj表示为:
Figure FDA0003344142280000021
其中,
Figure FDA0003344142280000022
Figure FDA0003344142280000023
为目标特征向量和辅助特征向量归一化后的计算特征值,其特征值限制在0到1的区间内,且指数确保了ZA和ZBj概率分布峰值处于中心;
(22-2)将ZA和ZBj按概率密度分布平均切分成K段:
Figure FDA0003344142280000024
Figure FDA0003344142280000025
其中Pt为ZA的概率密度分布向量,
Figure FDA0003344142280000026
为每一段的概率密度,Pa为ZBj的概率密度分布向量,
Figure FDA0003344142280000027
为每一段的概率密度;
(22-3)计算ZA和ZBj之间的卡方值
Figure FDA0003344142280000028
Figure FDA0003344142280000029
其中,K为切分段数,k为切分段编号;
(22-4)对于双边检验假设:
Figure FDA00033441422800000210
根据(χ2,K)查找χ2分布表,得到Pc值,其代表当ZA=ZBj时,卡方检验统计量大于或等于实际卡方值
Figure FDA00033441422800000211
的概率,即
Figure FDA00033441422800000212
若Pc<0.3,则第j辅助数据域为可利用的辅助数据域,否则为不可利用的辅助数据域;
(22-5)计算目标数据域和第j辅助数据域综合相似度:
S=(Pw)α×(Pc)β (7);
其中,Pw代表当A=Bj时威氏符号秩检验统计量大于或等于实际卡方值τj的概率,0≤α≤β≤1,α和β为威氏符号秩检验和卡方检验方法的检验设定权重,故0≤S≤1,越小相似度越高;
(3)利用局部模型迁移学习算法和SVM迭代算法,实现齿轮故障识别;
最后利用以SVM为核心的局部迁移模型将筛选的辅助数据的有用共性参数迁移至目标数据以实现齿轮箱的故障识别。
2.根据权利要求1所述的一种基于局部模型迁移学习的齿轮故障识别方法,其特征在于,所述步骤(1)包括:对目标任务下的齿轮实施时频域特征提取得到目标数据特征向量A=[ε1,ε2,...,ε59],对非目标任务下的齿轮实施相同特征提取得到辅助数据特征向量Bj=[δ(j,1),δ(j,2),...,δ(j,59)];
其中,A为59维的目标特征向量,εi为所提取的时频域特征,下标i∈{1,2,...,59}为特征维数,Bj为y组59维的辅助特征向量,y为来自不同辅助域的域数,δ(j,i)为所提取的时频域特征,下标i∈{1,2,...,59}为特征维数,下标j∈{1,2,...,y}为辅助域的域编号。
3.根据权利要求2所述的一种基于局部模型迁移学习的齿轮故障识别方法,其特征在于:所述目标特征向量和辅助特征向量包括振动加速度、扭矩、转动频率和驱动电流;59维的目标特征向量和y组59维的辅助特征向量均包括7维时域振动特征、19维频域振动特征、31维噪声特征和2维扭矩特征;
所述7维时域振动特征包含均值、方差、峰值、偏差系数、香农熵、协方差和阿里亚斯烈度特征;
所述19维频域振动特征包含电机频率,行星齿轮箱行星轮频率,行星齿轮箱太阳轮频率,减速齿轮箱一级主动轮频率,减速齿轮箱一级从动轮频率,减速齿轮箱二级主动轮频率,减速齿轮箱二级从动轮频率点上小波能量特征;
所述31维噪声特征包含30维奇异值分解特征和1维信噪比特征;
所述2维扭矩特征包含扭矩和驱动电流。
4.根据权利要求1所述的一种基于局部模型迁移学习的齿轮故障识别方法,其特征在于,所述威氏符号秩检验方法包括以下步骤:
(21-1)选取目标数据特征向量A=[ε1,ε2,...,ε59]和第j组辅助数据特征向量Bj=[δ(j,1),δ(j,2),...,δ(j,59)],计算两者之间的欧式距离Eu=|A-Bj|;
其中,A为59维的目标特征向量,εi为所提取的时频域特征,下标i∈{1,2,...,59}为特征维数,Bj为y组59维的辅助特征向量,y为来自不同辅助域的域数,δ(j,i)为所提取的时频域特征,下标j∈{1,2,...,y}为辅助域的域编号;
(21-2)将向量Eu的59维数据从小到大排列,并计算每一维的秩,并将计算所有εi>δ(j,i)秩的和W+,所有εi<δ(j,i)秩的和W-,并令W=min(W+,W-):
Figure FDA0003344142280000031
(21-3)对于双边检验假设:
Figure FDA0003344142280000041
根据(W,59)查找τj分布表,得到Pw值,其代表当A=Bj时,威氏符号秩检验统计量大于或等于实际卡方值τj的概率,即Pw=2P(τ≥|τj||A=Bj),若Pw<0.3,则第j辅助数据域为可利用的辅助数据域,否则为不可利用的辅助数据域。
5.根据权利要求1所述的一种基于局部模型迁移学习的齿轮故障识别方法,其特征在于,所述步骤(3)包括以下步骤:
(31)将59维特征向量切分为7维时域振动特征+2维扭矩特征子向量,19维频域振动特征+2维扭矩特征子向量,31维噪声特征+2维扭矩特征子向量,2维扭矩特征子向量,4个子向量为:
A1=[ε1,…,ε7,ε58,ε59] (8);
A2=[ε8,…,ε26,ε58,ε59] (9);
A3=[ε27,…,ε57,ε58,ε59] (10);
A4=[ε58,ε59] (11);
Bj1=[δ(h,1),...,δ(j,7),δ(j,58),δ(j,59)] (12);
Bj2=[δ(j,8),...,δ(j,26),δ(j,58),δ(j,59)] (13);
Bj3=[δ(j,27),...,δ(j,57),δ(j,58),δ(j,59)] (14);
Bj4=[δ(j,58),δ(j,59)] (15);
其中,A1,A2,A3和A4为目标数据子特征向量;Bj1,Bj2,Bj3和Bj4为第j辅助数据子特征向量;
(32)构建分类器的训练集T1、T2、T3及T4和相应的测试集S1、S2、S3及S4,其中T1和S1的构建方法如下:
Figure FDA0003344142280000042
Figure FDA0003344142280000046
Figure FDA0003344142280000043
Figure FDA0003344142280000044
Figure FDA0003344142280000045
其中,
Figure FDA0003344142280000051
Figure FDA0003344142280000052
分别为目标数据训练集和辅助数据的训练集,
Figure FDA0003344142280000053
为目标数据测试集,训练集T1的样本数量为M+N,其中M为
Figure FDA0003344142280000054
的样本数,N为
Figure FDA0003344142280000055
的样本数,M<N,测试集S1的样本数量为x;
Figure FDA0003344142280000056
为第x样本的故障类别编号,不同的齿轮故障类型拥有不同的唯一类别编号;上标t代表目标数据,上标a代表辅助数据;T2和S2,T3和S3,T4和S4的构建方法与T1和S1相同;
(33)针对辅助数据集
Figure FDA0003344142280000057
Figure FDA0003344142280000058
实施高斯内核的支持向量机SVM算法得到4个子分类结果
Figure FDA0003344142280000059
得到该结果的输入参数集分别为(σr,ωr,br),r∈{1,2,3,4},其中:
f(x)=ωTφ(x)+b (21);
Figure FDA00033441422800000510
其中,f(x)为SVM分类器的输出结果,x为分类器输入的特征向量,φ(x)为x所处的低维空间至ω所处的高维空间的映射,ω=(ω1;ω2;...;ωd)为高维空间分类或切割平面的方向,d为高维空间维数;b为分类或切割平面与原点的距离;
其中,φ(x)由高斯核函数
Figure FDA00033441422800000511
计算可得,核函数中σ>0为高斯宽度,xi,xj为向量x的两个元素;
(34)将输入参数集(σr,ωr,br)代入目标数据集
Figure FDA00033441422800000512
Figure FDA00033441422800000513
得到4个子分类结果
Figure FDA00033441422800000514
并计算这4个子分类结果的分类精度[Ac1;Ac2;Ac3;Ac4];
(35)根据三个子分类器的分类精度计算权重:
Figure FDA00033441422800000515
其中,w1,w2和w3分别为A1,A2和A3的分类权重;
(36)输出测试集S局部模型迁移学习的分类结果:
Figure FDA00033441422800000516
其中,Y(·)为故障类别映射函数,1,2,…,L为故障类别编号,L为总故障类别数,E[·]为均值函数。
CN201711442330.6A 2017-12-27 2017-12-27 一种基于局部模型迁移学习的齿轮故障识别方法 Active CN108229547B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711442330.6A CN108229547B (zh) 2017-12-27 2017-12-27 一种基于局部模型迁移学习的齿轮故障识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711442330.6A CN108229547B (zh) 2017-12-27 2017-12-27 一种基于局部模型迁移学习的齿轮故障识别方法

Publications (2)

Publication Number Publication Date
CN108229547A CN108229547A (zh) 2018-06-29
CN108229547B true CN108229547B (zh) 2021-12-24

Family

ID=62649009

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711442330.6A Active CN108229547B (zh) 2017-12-27 2017-12-27 一种基于局部模型迁移学习的齿轮故障识别方法

Country Status (1)

Country Link
CN (1) CN108229547B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108875918B (zh) * 2018-08-14 2021-05-04 西安交通大学 一种基于适配共享深度残差网络的机械故障迁移诊断方法
CN109447511A (zh) * 2018-11-13 2019-03-08 南方电网科学研究院有限责任公司 一种变压器故障诊断方法、系统及相关装置
CN109348410B (zh) * 2018-11-16 2020-07-10 电子科技大学 基于全局和局部联合约束迁移学习的室内定位方法
CN109682596B (zh) * 2018-12-20 2020-11-13 南京航空航天大学 非均衡样本下高速重载输入级故障诊断方法
CN110399854B (zh) * 2019-07-31 2020-10-23 中南大学 基于混合特征提取的滚动轴承故障分类方法
CN111091290B (zh) * 2019-12-17 2020-07-28 广东工业大学 一种基于迁移学习的手机装配工艺知识框架模型构建方法
CN112036301B (zh) * 2020-08-31 2021-06-22 中国矿业大学 一种基于类内特征迁移学习与多源信息融合的驱动电机故障诊断模型构建方法
CN113032367A (zh) * 2021-03-24 2021-06-25 安徽大学 面向动态负载场景的大数据系统跨层配置参数协同调优方法和系统
CN112819107B (zh) * 2021-04-16 2021-07-02 四川九门科技股份有限公司 基于人工智能的燃气调压设备故障预测方法
CN113465925B (zh) * 2021-06-26 2023-10-20 嘉兴学院 一种基于tca的变工况轴承状态诊断方法
CN115118514A (zh) * 2022-07-11 2022-09-27 深信服科技股份有限公司 一种数据检测方法、装置、设备及介质
CN115310561B (zh) * 2022-09-29 2022-12-20 中国空气动力研究与发展中心设备设计与测试技术研究所 一种基于集成即时学习的电磁阀故障监测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103048041A (zh) * 2012-12-20 2013-04-17 北京信息科技大学 基于局部切空间和支持向量机的机电系统故障诊断方法
CN105300693A (zh) * 2015-09-25 2016-02-03 东南大学 一种基于迁移学习的轴承故障诊断方法
CN105628383A (zh) * 2016-02-01 2016-06-01 东南大学 基于改进型lssvm迁移学习的轴承故障诊断方法和系统
CN105759605A (zh) * 2015-12-15 2016-07-13 江南大学 基于自适应参数模型粒子滤波的非线性系统缺陷检测与定位算法
CN106199241A (zh) * 2016-06-24 2016-12-07 清华大学 一种基于数据协调及假设检验的电站系统多故障诊断方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103048041A (zh) * 2012-12-20 2013-04-17 北京信息科技大学 基于局部切空间和支持向量机的机电系统故障诊断方法
CN105300693A (zh) * 2015-09-25 2016-02-03 东南大学 一种基于迁移学习的轴承故障诊断方法
CN105759605A (zh) * 2015-12-15 2016-07-13 江南大学 基于自适应参数模型粒子滤波的非线性系统缺陷检测与定位算法
CN105628383A (zh) * 2016-02-01 2016-06-01 东南大学 基于改进型lssvm迁移学习的轴承故障诊断方法和系统
CN106199241A (zh) * 2016-06-24 2016-12-07 清华大学 一种基于数据协调及假设检验的电站系统多故障诊断方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Bearing Fault Diagnosis Based on SVD Feature Extraction and Transfer Learning Classification;Fei Shen 等;《2015 Prognostics and System Health Management Conference (PHM)》;20151023;全文 *
基于不同工况下辅助数据集的齿轮箱故障诊断;段礼祥 等;《振动与冲击》;20170528;全文 *
奇异值分解与迁移学习在电机故障诊断中的应用;沈飞 等;《振动工程学报》;20170215;第118页第2段-125页倒数第3段 *

Also Published As

Publication number Publication date
CN108229547A (zh) 2018-06-29

Similar Documents

Publication Publication Date Title
CN108229547B (zh) 一种基于局部模型迁移学习的齿轮故障识别方法
Hoang et al. Rolling element bearing fault diagnosis using convolutional neural network and vibration image
Amarouayache et al. Bearing fault diagnostics using EEMD processing and convolutional neural network methods
Pandya et al. Fault diagnosis of rolling element bearing with intrinsic mode function of acoustic emission data using APF-KNN
Zhang et al. Multi-fault diagnosis for rolling element bearings based on ensemble empirical mode decomposition and optimized support vector machines
Yiakopoulos et al. Rolling element bearing fault detection in industrial environments based on a K-means clustering approach
CN110543860B (zh) 基于tjm迁移学习的机械故障诊断方法及系统
CN109190464B (zh) 一种变工况下基于迁移学习的机械故障智能诊断方法
CN112577743B (zh) 一种基于最大局部边界准则的滚动轴承故障诊断方法
CN113673346B (zh) 一种基于多尺度SE-Resnet的电机振动数据处理与状态识别方法
CN110243590B (zh) 一种基于主成分分析和宽度学习的转子系统故障诊断方法
Zhong et al. An intelligent fault diagnosis method based on STFT and convolutional neural network for bearings under variable working conditions
CN113780412A (zh) 故障诊断模型训练方法、系统及其诊断方法、系统
Wang et al. Roller bearing fault diagnosis based on integrated fault feature and SVM
Yang et al. Health condition identification for rolling bearing based on hierarchical multiscale symbolic dynamic entropy and least squares support tensor machine–based binary tree
You et al. An efficient lightweight neural network using BiLSTM-SCN-CBAM with PCA-ICEEMDAN for diagnosing rolling bearing faults
Zhu et al. A multi-scale fuzzy measure entropy and infinite feature selection based approach for rolling bearing fault diagnosis
CN113865866A (zh) 一种基于改进局部非负矩阵分解的轴承复合故障诊断方法
Chao et al. A novel convolutional neural network with multiscale cascade midpoint residual for fault diagnosis of rolling bearings
Tyagi et al. An SVM—ANN hybrid classifier for diagnosis of gear fault
Nezamivand Chegini et al. A new intelligent fault diagnosis method for bearing in different speeds based on the FDAF-score algorithm, binary particle swarm optimization, and support vector machine
CN116337449A (zh) 一种基于信息融合的稀疏自编码故障诊断方法、系统
Li et al. Research on fault diagnosis of highway Bi-LSTM based on attention mechanism
Dang et al. A Fault Diagnosis Method for One‐Dimensional Vibration Signal Based on Multiresolution tlsDMD and Approximate Entropy
Gollamandala et al. An additive sparse logistic regularization method for cancer classification in microarray data.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant