CN113239720B - 一种基于深度迁移学习的地铁车辆走行部故障诊断方法 - Google Patents

一种基于深度迁移学习的地铁车辆走行部故障诊断方法 Download PDF

Info

Publication number
CN113239720B
CN113239720B CN202110338855.5A CN202110338855A CN113239720B CN 113239720 B CN113239720 B CN 113239720B CN 202110338855 A CN202110338855 A CN 202110338855A CN 113239720 B CN113239720 B CN 113239720B
Authority
CN
China
Prior art keywords
fault
domain
data
classification
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110338855.5A
Other languages
English (en)
Other versions
CN113239720A (zh
Inventor
王宇
刘佩琪
轩艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN202110338855.5A priority Critical patent/CN113239720B/zh
Publication of CN113239720A publication Critical patent/CN113239720A/zh
Application granted granted Critical
Publication of CN113239720B publication Critical patent/CN113239720B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B61RAILWAYS
    • B61KAUXILIARY EQUIPMENT SPECIALLY ADAPTED FOR RAILWAYS, NOT OTHERWISE PROVIDED FOR
    • B61K9/00Railway vehicle profile gauges; Detecting or indicating overheating of components; Apparatus on locomotives or cars to indicate bad track sections; General design of track recording vehicles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • G06F2218/04Denoising
    • G06F2218/06Denoising by applying a scale-space analysis, e.g. using wavelet analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Signal Processing (AREA)
  • Mechanical Engineering (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
  • Control Of Transmission Device (AREA)

Abstract

本发明公开了一种基于深度迁移学习的地铁车辆走行部故障诊断方法,包括不同条件状态数据的提取、卷积神经网络的特征提取和基本分类、深度迁移学习的非对抗训练的特征对齐。首先,在不同条件状态数据的提取的基础上,通过对信号进行小波阈值降噪处理和数据归一化实现数据预处理;然后,以卷积神经网络CNN作为基本架构来提取特征和特征分类;最后使用迁移学习算法对架构进行改进,进行领域对抗训练,使源域特征分布和目标域特征分布对齐,不断调整模型参数直至参数收敛,实现走行部的故障识别。本发明提升了地铁车辆走行部在仅有少量目标数据时的诊断精度,降低诊断成本,增强了走行部故障诊断的环境适应性和通用性,具有潜在的经济价值。

Description

一种基于深度迁移学习的地铁车辆走行部故障诊断方法
技术领域
本发明属于故障诊断与健康管理技术领域,尤其涉及一种基于深度迁移学习的地铁车辆走行部故障诊断方法。
背景技术
地铁核心部件之一的走行部,其健康状态直接危及列车运行安全,因此需要对走行部的健康状态进行故障诊断。我国现如今的地铁走行部诊断基本依赖于检修人员实地检查、维修及运行状态的确认,人力物力消耗巨大。故障诊断与健康管理技术训练了一种故障诊断模型,实现不需人工检测即能对走行部进行故障诊断。但是在实际运行过程中,走行部不轻易发生故障,模型训练所需的故障数据难以获取,而故障诊断模型的性能极大程度上依赖于训练数据。同时,当走行部运行条件或者设备发生轻微变化,模型就得重新开始训练。而迁移学习能够通过存储前一模型训练好的的参数迁移到新的模型中来帮助训练新的模型,找到新旧模型之间的相似性,提高模型的泛化性能。
发明内容
本发明目的在于解决地铁车辆走行部故障诊断模型故障数据难以获取,泛化性能低的问题,提出了一种基于深度迁移学习的地铁车辆走行部故障诊断方法。
为实现本发明的目的,本发明所采用的技术方案是:一种基于深度迁移学习的地铁车辆走行部故障诊断方法,包括以下步骤:
(1)针对走行部所处环境条件,设置若干个不同运行条件{0,1,…,m},通过传感器收集走行部在不同条件下的运行状态信号数据作为数据集;
(2)运行条件0作为迁移学习任务的源域,运行条件i,i∈{1,2,…,m}为目标域,对数据集进行小波阈值降噪处理,然后进行数据归一化实现预处理;
(3)利用卷积神经网络CNN搭建故障诊断模型,提取源域和目标域特征和故障分类;
(4)在原故障诊断模型基础上使用迁移学习算法进行改进,进行领域对抗训练,使源域特征分布和目标域特征分布对齐,不断调整模型参数直至参数收敛;
(5)使用收敛后的新的故障诊断模型,再提取目标域特征和故障分类,实现新环境条件下走行部故障诊断。
进一步的,所述步骤(2)中,迁移学习任务表示为环境条件改变设置,包括两个域:源域Ds={xs1,...,xsn}和目标域Dt={xt1,...,xtk},其中xsn是源域的第n个信号数据,xtk是目标域的第k个信号数据;对数据集Ds,Dt进行小波阈值降噪处理,具体包括:
首先,选择db10小波基作为将原始信号分解的母小波,分解为三层;然后,使用全局统一阈值
Figure BDA0002998680970000011
其中σ=MAD/0.6745,MAD为高斯噪声标准方差的调整系数,N为信号长度;接着,选择软阈值去噪法过滤小波系数,以小波系数的绝对值为计算值,令其减去阈值,当结果为正则保留计算结果为小波系数,若为负则使结果为零;最后,根据降噪后的小波系数进行小波重构,至此小波阈值降噪完成。
进一步的,所述步骤(2)中,通过归一化因子对两个域的数据集进行归一化,数据进行归一化方法是min-max标准化,具体为:
对经过小波阈值降噪处理的N点信号数据进行线性变换,将值映射到[0,1]之间,设N点信号序列为{x1,x2,...,xN},归一化公式为:
Figure BDA0002998680970000021
其中归一化后的新序列{y1,y2,...,yN}∈[0,1]且无量纲。
进一步的,所述步骤(3)中,以卷积神经网络CNN作为基本架构来提取源域数据Ds和目标域数据Dt的特征并对Ds故障分类,CNN包括两部分:特征提取器和故障分类器;
特征提取器包括:特征提取器Cf的输入为经过预处理得到的Ds和Dt的无量纲数据,输出为信号的特征表示;采用两个一维卷积层Cf1,Cf2进行特征提取,每一个都具有3个长度的滤镜,以及10个隐藏的尺寸和一个滤除率为0.5的滤除层;然后将经过卷积层提取的特征信号再经过扁平层Cf3进行扁平化,实现从卷积层到全连接层的过渡;
故障分类器包括:在提取特征信号并扁平化后,设置两层256个单元的完全连接层,即故障分类器Cy;第一层是具有Sigmoid激活功能的连接层Cy1,用于区分出输入的特征来自Ds还是Dt;然后,第二个具有ReLu激活功能的完全连接层Cy2,用于对来自Ds的特征进行故障分类;经过两层完全连接层后将源域信号Ds映射到其所属的故障分类函数中;最后,使用softmax分类器Cy3计算分类损失,实现Ds数据集故障准确分类;
Sigmoid函数表达式S(x)和ReLu函数表达式f(x)分别为:
Figure BDA0002998680970000022
式中x为扁平化的特征信号,e为自然常量。
进一步的,所述的softmax分类器通过softmax函数构建概率分布,再使用交叉熵损失函数计算损失;即对最后一个输出层设置n个输出节点,n与分类任务的目标数相等,然后用交叉熵损失函数来判定实际输出和期望输出的差距;
softmax函数构建概率分布计算式yi和交叉熵损失函数表达式Ly分别为:
Figure BDA0002998680970000023
式中s为健康等级标签即故障诊断结果的个数,zi为输出的标签,j为遍历的下标,yi为zi的概率分布;yi是第i个等级标签的真实概率,而
Figure BDA0002998680970000035
是预测的概率分布。
进一步的,所述步骤(4)中,在原故障诊断模型基础上使用迁移学习算法进行改进:
在CNN原始架构的第一层故障分类器Cy1后面设置领域判别器Cd,并在其间添加梯度反转层GRL;在领域判别器Cd之前的过程,与初始架构一致,即将预处理得到的目标域Dt的无量纲数据经过特征提取层Cf1、Cf2、扁平化层Cf3进行特征提取,然后在经过初步Sigmoid特征分类的连接层Cy1过程中,区分出输入的特征来自源域Ds或目标域Dt;在领域判别器Cd后面加上全连接分类器,针对Dt提取的特征进行故障分类。
进一步的,所述的梯度反转层GRL包括:经过CNN提取的特征在前向传播过程中实施恒等变换,在反向传播过程中改变领域判别器Cd回传的梯度符号,实现Ds和Dt数据集训练过程中梯度方向一致,在这个过程中产生的误差为领域误差Ld;GRL的前向计算和反向传播过程表示为:
Figure BDA0002998680970000031
式中I为单位矩阵,x为数据集,R(x)为CNN提取的特征正向传播过程,dR/dx为领域分类误差反向传播过程中的梯度。
进一步的,所述的领域对抗模型训练是实现数据集来源领域分类损失的最大化,其中整体损失的计算转化成故障分类误差最小化和领域分类损失最大化:
Figure BDA0002998680970000032
Figure BDA0002998680970000033
式中L(*)表示整体损失函数,Ld(*)表示领域分类损失最大化函数,Ly(*)表示故障分类误差最小化函数,λ表示权衡参数,xi为数据集中的数据,yi为对数据进行的故障分类标签,Cf,Cy,Cd分别为特征提取器、故障分类器、领域判别器,θfyd分别表示Cf,Cy,Cd的参数,
Figure BDA0002998680970000034
分别表示Cf,Cy,Cd的参数的最优值。
进一步的,所述的全连接分类器包括:使用三层全连接分类器Dy作为区分器;前两层全连接分类器Dy1、Dy2为ReLu激活函数,前两层有1024层;最后一层全连接分类器Dy3为softmax分类器来计算新条件下的故障分类损失Ln;则损耗函数重新公式化为:
L=Ly-Ld+Ln
式中L为整体损失,Ly为故障初始分类器损失,Ld为领域分类损失,Ln为故障分类损失。
有益效果:与现有技术相比,本发明的一种基于深度迁移学习的地铁车辆走行部故障诊断方法,采用深度迁移学习方法针对地铁车辆走行部实施故障识别,方法不但能提高地铁走行部在应用数据较少时的诊断和识别精度,而且能够利用更少成本实现变工况,变环境,变压力的走行部的齿轮故障识别,节省诊断时间,具有潜在的经济价值。
附图说明
图1是本发明方法的流程图;
图2是本发明方法的CNN架构图;
图3是本发明方法的基于迁移学习的修改架构图。
具体实施方式
下面结合附图及具体实施例对本发明进行详细说明。
本发明所述的基于深度迁移学习的地铁车辆走行部故障诊断方法,能够在运行条件或者设备发生轻微变化时,将前一条件下模型数据迁移到新的模型训练中,找到新旧模型之间的相似性从而提高帮助目标数据的故障识别,如图1所示,包括以下步骤:
(1)针对走行部所处环境条件,设置若干个不同运行条件{0,1,…,m},通过传感器收集走行部在不同条件下的运行状态信号数据作为数据集。本实施例从温度、湿度、所受冲击、自身轴承产生的振动几个方面设置若干个不同运行条件,收集走行部的运行状态信号数据包括温度、湿度、振动、冲击传感信号数据。
(2)运行条件0作为迁移学习任务的源域,运行条件i,i∈{1,2,…,m}为目标域,对数据集进行小波阈值降噪处理,然后进行数据归一化实现预处理。
迁移学习任务表示为环境条件改变设置,包括两个域:源域Ds={xs1,...,xsn}和目标域Dt={xt1,...,xtk},其中xsn是源域的第n个信号数据,xtk是目标域的第k个信号数据;源域Ds是用于初始条件下通过旧模型(利用CNN搭建的原始故障诊断模型)打故障类型标签的训练数据;目标域Dt是用于运行条件改变后通过新模型(CNN结构中引入迁移学习算法后的故障诊断模型)打故障类型标签的数据;
对数据集Ds,Dt进行小波阈值降噪处理,具体包括:
首先,选择db10小波基作为将原始信号分解的母小波,分解为三层;然后,使用全局统一阈值
Figure BDA0002998680970000041
其中σ=MAD/0.6745,MAD为高斯噪声标准方差的调整系数,N为信号长度;接着,选择软阈值去噪法过滤小波系数,以小波系数的绝对值为计算值,令其减去阈值,当结果为正则保留计算结果为小波系数,若为负则使结果为零(软阈值去噪法使重构信号不会产生过大波动,其整体性不会发生跳跃性变化);最后,根据降噪后的小波系数进行小波重构,至此小波阈值降噪完成。
通过归一化因子对两个域的数据集进行归一化,采用min-max标准化方法,具体为:
对经过小波阈值降噪处理的N点信号数据进行线性变换,将值映射到[0,1]之间,设N点信号序列为{x1,x2,...,xN},归一化公式为:
Figure BDA0002998680970000042
其中归一化后的新序列{y1,y2,...,yN}∈[0,1]且无量纲。
(3)利用卷积神经网络CNN搭建故障诊断模型,提取源域和目标域特征和故障分类,实现走行部源域信号故障诊断;如图2,CNN包括两部分:特征提取器和故障分类器;
特征提取器包括:特征提取器Cf的输入为经过预处理得到的Ds和Dt的无量纲数据,输出为信号的特征表示;由于预处理的无量纲信号是一维数据,因此采用两个一维卷积层Cf1,Cf2进行特征提取,每一个都具有3个长度的滤镜,以及10个隐藏的尺寸和一个滤除率为0.5的滤除层;然后将经过卷积层提取的特征信号再经过扁平层Cf3进行扁平化,实现从卷积层到全连接层的过渡;
故障分类器包括:在提取特征信号并扁平化后,设置两层256个单元的完全连接层,即故障分类器Cy;第一层是具有Sigmoid激活功能的连接层Cy1,用于区分出输入的特征来自Ds还是Dt;然后,第二个具有ReLu激活功能的完全连接层Cy2,用于对来自Ds的特征进行故障分类;经过两层完全连接层后将源域信号Ds映射到其所属的故障分类函数中;最后,使用softmax分类器Cy3计算分类损失,实现Ds数据集故障准确分类;
Sigmoid函数表达式S(x)和ReLu函数表达式f(x)分别为:
Figure BDA0002998680970000051
式中x为扁平化的特征信号,e为自然常量。
所述的softmax分类器通过softmax函数构建概率分布,再使用交叉熵损失函数计算损失;即对最后一个输出层设置n个输出节点,n与分类任务的目标数相等,然后用交叉熵损失函数来判定实际输出和期望输出的差距;
softmax函数构建概率分布计算式yi和交叉熵损失函数表达式Ly分别为:
Figure BDA0002998680970000052
式中s为健康等级标签即故障诊断结果的个数,zi为输出的标签,j为遍历的下标,yi为zi的概率分布;yi是第i个等级标签的真实概率,而
Figure BDA0002998680970000053
是预测的概率分布。
(4)在原故障诊断模型基础上使用迁移学习算法进行改进,进行领域对抗训练,使源域特征分布和目标域特征分布对齐,降低源域特征分布和目标域特征分布差异(以实现对走行部目标域故障诊断),不断调整模型参数,使得模型更符合目标域条件,直至参数收敛。
如图3,在CNN原始架构的第一层故障分类器Cy1后面设置领域判别器Cd,并在其间添加梯度反转层GRL,来实现不同领域特征之间的对抗训练,减少源特征分布和目标特征分布之间的差异;在领域判别器Cd之前的过程,与初始架构一致,即将预处理得到的目标域Dt的无量纲数据经过特征提取层Cf1、Cf2、扁平化层Cf3进行特征提取,然后在经过初步Sigmoid特征分类的连接层Cy1过程中,区分出输入的特征来自源域Ds或目标域Dt;在领域判别器Cd后面加上全连接分类器,对走行部在新环境条件下即目标域Dt提取的特征进行故障分类。
所述的梯度反转层GRL包括:经过CNN提取的特征在前向传播过程中实施恒等变换,在反向传播过程中改变领域判别器Cd回传的梯度符号,实现Ds和Dt数据集训练过程中梯度方向一致,在这个过程中产生的误差为领域误差Ld;GRL的前向计算和反向传播过程表示为:
Figure BDA0002998680970000061
式中I为单位矩阵,x为数据集,R(x)为CNN提取的特征正向传播过程,dR/dx为领域分类误差反向传播过程中的梯度。
在领域对抗模型训练中,对于Ds数据集,目的是需要取得精准故障分类,使得故障分类误差最小化,因此Cf对其Ds和Dt特征提取,Cy1精准区分特征属于哪个域,原始模型对Ds数据集进行精准分类,此时需要最小化故障分类器的损失Ly;对于Dt数据,目的是需要混淆Ds和Dt,使得领域判别器Cd无法区别特征来自Ds还是Dt,即需要实现数据集来源领域分类损失的最大化Ld。
所述的领域对抗模型训练是实现数据集来源领域分类损失的最大化,其中整体损失的计算转化成故障分类误差最小化和领域分类损失最大化:
Figure BDA0002998680970000062
Figure BDA0002998680970000063
式中L(*)表示整体损失函数,Ld(*)表示领域分类损失最大化函数,Ly(*)表示故障分类误差最小化函数,λ表示权衡参数,xi为数据集中的数据,yi为对数据进行的故障分类标签,Cf,Cy,Cd分别为特征提取器、故障分类器、领域判别器,θfyd分别表示Cf,Cy,Cd的参数,
Figure BDA0002998680970000064
分别表示Cf,Cy,Cd的参数的最优值。
所述的全连接分类器包括:使用三层全连接分类器Dy作为区分器;前两层全连接分类器Dy1、Dy2为ReLu激活函数,前两层有1024层;最后一层全连接分类器Dy3为softmax分类器来计算新条件下的故障分类损失Ln;则损耗函数重新公式化为:
L=Ly-Ld+Ln
式中L为整体损失,Ly为故障初始分类器损失,Ld为领域分类损失,Ln为故障分类损失。
(5)使用收敛后的新的故障诊断模型,再提取目标域特征和故障分类,实现新环境条件下走行部故障诊断。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (5)

1.一种基于深度迁移学习的地铁车辆走行部故障诊断方法,其特征在于,该方法包括以下步骤:
(1)针对走行部所处环境条件,设置若干个不同运行条件{0,1,…,m},通过传感器收集走行部在不同条件下的运行状态信号数据作为数据集;
(2)运行条件0作为迁移学习任务的源域,运行条件i,i∈{1,2,…,m}为目标域,对数据集进行小波阈值降噪处理,然后进行数据归一化实现预处理;
(3)利用卷积神经网络CNN搭建故障诊断模型,提取源域和目标域特征和故障分类;
(4)在原故障诊断模型基础上使用迁移学习算法进行改进,进行领域对抗训练,使源域特征分布和目标域特征分布对齐,不断调整模型参数直至参数收敛;
(5)使用收敛后的新的故障诊断模型,再提取目标域特征和故障分类,实现新环境条件下走行部故障诊断;
所述步骤(4)中,在原故障诊断模型基础上使用迁移学习算法进行改进,包括:
在CNN原始架构的第一层故障分类器Cy1后面设置领域判别器Cd,并在其间添加梯度反转层GRL;在领域判别器Cd之前的过程,与初始架构一致,即将预处理得到的目标域Dt的无量纲数据经过特征提取层Cf1、Cf2、扁平化层Cf3进行特征提取,然后在经过初步Sigmoid特征分类的连接层Cy1过程中,区分出输入的特征来自源域Ds或目标域Dt;在领域判别器Cd后面加上全连接分类器,针对Dt提取的特征进行故障分类;
所述的梯度反转层GRL包括:经过CNN提取的特征在前向传播过程中实施恒等变换,在反向传播过程中改变领域判别器Cd回传的梯度符号,实现Ds和Dt数据集训练过程中梯度方向一致,在这个过程中产生的误差为领域误差Ld;GRL的前向计算和反向传播过程表示为:
R(x)=x,
Figure FDA0003726016450000011
式中I为单位矩阵,x为数据集,R(x)为CNN提取的特征正向传播过程,dR/dx为领域分类误差反向传播过程中的梯度;
所述的领域对抗模型训练是实现数据集来源领域分类损失的最大化,其中整体损失的计算转化成故障分类误差最小化和领域分类损失最大化:
Figure FDA0003726016450000012
Figure FDA0003726016450000013
式中L(*)表示整体损失函数,Ld(*)表示领域分类损失最大化函数,Ly(*)表示故障分类误差最小化函数,λ表示权衡参数,xi为数据集中的数据,yi为对数据进行的故障分类标签,Cf,Cy,Cd分别为特征提取器、故障分类器、领域判别器,θfyd分别表示Cf,Cy,Cd的参数,
Figure FDA0003726016450000021
分别表示Cf,Cy,Cd的参数的最优值;
所述的全连接分类器包括:使用三层全连接分类器Dy作为区分器;前两层全连接分类器Dy1、Dy2为ReLu激活函数,前两层有1024层;最后一层全连接分类器Dy3为softmax分类器来计算新条件下的故障分类损失Ln;则损耗函数重新公式化为:
L=Ly-Ld+Ln
式中L为整体损失,Ly为故障初始分类器损失,Ld为领域分类损失,Ln为故障分类损失。
2.根据权利要求1所述的基于深度迁移学习的地铁车辆走行部故障诊断方法,其特征在于,所述步骤(2)中,迁移学习任务表示为环境条件改变设置,包括两个域:源域Ds={xs1,...,xsn}和目标域Dt={xt1,...,xtk},其中xsn是源域的第n个信号数据,xtk是目标域的第k个信号数据;对数据集Ds,Dt进行小波阈值降噪处理,具体包括:
首先,选择db10小波基作为将原始信号分解的母小波,分解为三层;然后,使用全局统一阈值
Figure FDA0003726016450000022
其中σ=MAD/0.6745,MAD为高斯噪声标准方差的调整系数,N为信号长度;接着,选择软阈值去噪法过滤小波系数,以小波系数的绝对值为计算值,令其减去阈值,当结果为正则保留计算结果为小波系数,若为负则使结果为零;最后,根据降噪后的小波系数进行小波重构,至此小波阈值降噪完成。
3.根据权利要求1所述的基于深度迁移学习的地铁车辆走行部故障诊断方法,其特征在于,所述步骤(2)中,通过归一化因子对两个域的数据集进行归一化,数据进行归一化方法是min-max标准化,具体为:
对经过小波阈值降噪处理的N点信号数据进行线性变换,将值映射到[0,1]之间,设N点信号序列为{x1,x2,...,xN},归一化公式为:
Figure FDA0003726016450000023
其中归一化后的新序列{y1,y2,...,yN}∈[0,1]且无量纲。
4.根据权利要求1所述的基于深度迁移学习的地铁车辆走行部故障诊断方法,其特征在于,所述步骤(3)中,以卷积神经网络CNN作为基本架构来提取源域数据Ds和目标域数据Dt的特征并对Ds故障分类,CNN包括两部分:特征提取器和故障分类器;
特征提取器包括:特征提取器Cf的输入为经过预处理得到的Ds和Dt的无量纲数据,输出为信号的特征表示;采用两个一维卷积层Cf1,Cf2进行特征提取,每一个都具有3个长度的滤镜,以及10个隐藏的尺寸和一个滤除率为0.5的滤除层;然后将经过卷积层提取的特征信号再经过扁平层Cf3进行扁平化,实现从卷积层到全连接层的过渡;
故障分类器包括:在提取特征信号并扁平化后,设置两层256个单元的完全连接层,即故障分类器Cy;第一层是具有Sigmoid激活功能的连接层Cy1,用于区分出输入的特征来自Ds还是Dt;然后,第二个具有ReLu激活功能的完全连接层Cy2,用于对来自Ds的特征进行故障分类;经过两层完全连接层后将源域信号Ds映射到其所属的故障分类函数中;最后,使用softmax分类器Cy3计算分类损失,实现Ds数据集故障准确分类;
Sigmoid函数表达式S(x)和ReLu函数表达式f(x)分别为:
Figure FDA0003726016450000031
f(x)=max(0,x)
式中x为扁平化的特征信号,e为自然常量。
5.根据权利要求4所述的基于深度迁移学习的地铁车辆走行部故障诊断方法,其特征在于,所述的softmax分类器通过softmax函数构建概率分布,再使用交叉熵损失函数计算损失;即对最后一个输出层设置n个输出节点,n与分类任务的目标数相等,然后用交叉熵损失函数来判定实际输出和期望输出的差距;
softmax函数构建概率分布计算式yi和交叉熵损失函数表达式Ly分别为:
Figure FDA0003726016450000032
式中s为健康等级标签即故障诊断结果的个数,zi为输出的标签,j为遍历的下标,yi为zi的概率分布;yi是第i个等级标签的真实概率,而
Figure FDA0003726016450000033
是预测的概率分布。
CN202110338855.5A 2021-03-30 2021-03-30 一种基于深度迁移学习的地铁车辆走行部故障诊断方法 Active CN113239720B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110338855.5A CN113239720B (zh) 2021-03-30 2021-03-30 一种基于深度迁移学习的地铁车辆走行部故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110338855.5A CN113239720B (zh) 2021-03-30 2021-03-30 一种基于深度迁移学习的地铁车辆走行部故障诊断方法

Publications (2)

Publication Number Publication Date
CN113239720A CN113239720A (zh) 2021-08-10
CN113239720B true CN113239720B (zh) 2022-08-23

Family

ID=77130670

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110338855.5A Active CN113239720B (zh) 2021-03-30 2021-03-30 一种基于深度迁移学习的地铁车辆走行部故障诊断方法

Country Status (1)

Country Link
CN (1) CN113239720B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113867307B (zh) * 2021-08-20 2022-10-21 天津大学 基于深度神经网络的航天器智能故障诊断方法
CN115933531B (zh) * 2023-01-09 2024-04-05 广东工业大学 一种基于深度域对抗迁移的机床热误差建模方法及系统
CN118013443A (zh) * 2024-04-08 2024-05-10 华侨大学 基于生成模型算法的在线实时真空干泵异常检测方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111898095A (zh) * 2020-07-10 2020-11-06 佛山科学技术学院 深度迁移学习智能故障诊断方法、装置、存储介质和设备

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111898095A (zh) * 2020-07-10 2020-11-06 佛山科学技术学院 深度迁移学习智能故障诊断方法、装置、存储介质和设备

Also Published As

Publication number Publication date
CN113239720A (zh) 2021-08-10

Similar Documents

Publication Publication Date Title
CN113239720B (zh) 一种基于深度迁移学习的地铁车辆走行部故障诊断方法
CN111898634B (zh) 一种基于深度对抗域自适应的智能故障诊断方法
CN111563554A (zh) 基于回归变分自编码器的零样本图像分类方法
CN111598325A (zh) 基于层次聚类和分层注意力机制的交通速度预测方法
CN104268507A (zh) 一种基于rgb-d图像的手语字母识别方法
CN112330158B (zh) 基于自回归差分移动平均-卷积神经网络的识别交通指数时间序列的方法
CN115791174B (zh) 一种滚动轴承异常诊断方法、系统、电子设备及存储介质
CN111062510A (zh) 一种基于迁移学习的民航发动机叶片裂纹预测方法
CN116106012A (zh) 一种基于注意力机制的滚动轴承域适应故障诊断方法
CN116894215B (zh) 一种基于半监督动态图注意的齿轮箱故障诊断方法
CN117726939A (zh) 一种基于多特征融合的高光谱图像分类方法
CN117312962A (zh) 基于迁移学习和数据驱动的长期服役电梯导轨故障诊断方法
CN115130599B (zh) 时间序列gan数据增强下露天矿卡状态识别的半监督方法
CN117112992A (zh) 一种聚酯酯化阶段的故障诊断方法
CN113158878B (zh) 一种基于子空间的异构迁移故障诊断方法、系统和模型
CN114358189A (zh) 基于多模态深度残差收缩网络的液压防水阀故障诊断方法
CN116204781A (zh) 旋转机械故障迁移诊断方法及系统
CN115217534A (zh) 一种汽轮机服役质量状态监测方法及系统
CN113095386B (zh) 一种基于三轴加速度空时特征融合的手势识别方法及系统
CN114417938A (zh) 一种利用知识向量嵌入的电磁目标分类方法
CN114118146A (zh) 一种基于信念规则库的滚动轴承故障诊断方法及系统
CN118025256B (zh) 车辆轴承温度在线监测系统
CN115034502B (zh) 一种公路车辆旅行时间的预测方法
Fang et al. Application of CNN-1d based on feature fusion in bearing fault diagnosis
CN113420387B (zh) 一种压实机械滚动轴承的迁移诊断方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant