CN113435235B - 一种基于递归融合编码器的装备状态表征提取方法 - Google Patents

一种基于递归融合编码器的装备状态表征提取方法 Download PDF

Info

Publication number
CN113435235B
CN113435235B CN202110039258.2A CN202110039258A CN113435235B CN 113435235 B CN113435235 B CN 113435235B CN 202110039258 A CN202110039258 A CN 202110039258A CN 113435235 B CN113435235 B CN 113435235B
Authority
CN
China
Prior art keywords
rfa
vector
fusion
recursive
vectors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110039258.2A
Other languages
English (en)
Other versions
CN113435235A (zh
Inventor
陶来发
苏铉元
丁宇
马剑
索明亮
吕琛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN202110039258.2A priority Critical patent/CN113435235B/zh
Publication of CN113435235A publication Critical patent/CN113435235A/zh
Application granted granted Critical
Publication of CN113435235B publication Critical patent/CN113435235B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Signal Processing (AREA)
  • Complex Calculations (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于递归融合编码器的装备状态表征提取方法,具体步骤如下:步骤一、监测参数时序化处理;步骤二、RFA模型配置;步骤三、RFA模型无监督训练;步骤四、鲁棒状态表征提取。本发明基于深度递归编码‑解码架构,提出了一种序贯融合层,以直观、简便的方式缓解了现有方法的梯度消失问题,对数据中的噪声、非平稳组分等干扰更为鲁棒,实现从时间、特征两个维度对装备多维状态监控数据进行完备的状态表征提取。本发明提出的状态表征提取方法,可不依赖故障数据,具有良好的自适应性与可扩展性,在普遍缺乏装备故障数据的实际场景中具有较高的应用价值。

Description

一种基于递归融合编码器的装备状态表征提取方法
技术领域
本发明涉及装备状态表征提取领域,尤其涉及一种基于递归融合编码器的装备状态表征提取方法。
背景技术
由于运行环境严酷、技术组成复杂等问题,对装备进行有效的实时状态监控乃至评估预警,在实际工程中意义重大。随着传感器与数据存储技术的不断发展,现有装备的状态监测参数种类以及使用过程中存储的数据量不断增加。这些海量的多维状态监测数据更充分地反映了装备的实时状态,但也不可避免地包含了冗余组分、采集噪声等干扰。因此,通过有效的技术手段提取能准确表征装备真实状态且对数据干扰鲁棒的表征,是实现装备有效状态监控、评估乃至预警的关键。目前,装备状态表征提取主要有两类方法:基于统计、基于神经网络。
基于统计的方法一般采用矩阵分解技术对高维数据中的有效成分进行融合,典型的方法有主成分分析(PCA)、核PCA和独立分量分析(ICA),由于计算相对简单、机理清晰,这类方法在相关领域得到了广泛应用。然而,此类方法的普遍问题在于都需要对输入数据进行不同的理想化假设,如高斯分布、线性相关、变量独立等,这限制了它们在复杂数据条件下的应用性能。相较而言,基于神经网络的方法凭借其强大的特征挖掘能力,能够在不需要过多数据假设的情况下,从多元输入CM数据中充分提取其状态表征,因而受到越来越多的关注。其中,基于全连接层和编码-解码架构的堆叠式自动编码器(SAE)是最典型的一种。然而,对于实际的装备状态监测数据而言,不仅是数据变量间的分布特征,数据局部时段间的时序特征也包含了潜在的状态相关信息。然而,现有的主流自动编码器因其非递归架构的限制,无法很好地处理第二类时序特征提取问题。针对这一局限性,近年来,一些学者试图用递归单元(如长短期记忆单元LSTM)代替传统的全连接层,开发了一类新的递归自动编码器(RA)。理论上,由于引入递归架构,RA具有描述时间特征进而实现更完备状态表征提取的能力。然而,在实际应用中,由于RA架构普遍存在梯度消失问题,导致其往往无法达到预期的状态表征提取性能。
针对真实条件下存在数据干扰的多维状态监控数据,为了自适应地挖掘装备的鲁棒本征状态特性,亟需提出一种新的装备状态表征提取方法。
发明内容
鉴于上述问题,本申请旨在提出一种基于递归融合编码器(recurrent fusionautoencoder,RFA)的装备状态表征提取方法,可在噪声干扰的多维真实数据条件下,从特征、时间两个维度实现对装备本征状态的鲁棒、完备表征提取。
本申请提出的一种基于递归融合编码器的装备状态表征提取方法,其包含如下核心步骤:
第一步:监测参数时序化预处理。
第二步:RFA模型配置。
第三步:RFA模型无监督训练。
第四步:鲁棒状态表征提取。
优选地,在第一步中,对于每个能反映装备状态的多维参数数据样本,首先利用一定长度的滑窗对其进行切割,得到L个局部参数序列矩阵,其中L为需要配置的滑窗切分个数;接着,对各局部参数序列矩阵进行特征预提取,得到L个预提取特征向量;进一步对L个预处理特征向量进行标准化处理,得到L个标准化特征向量。
优选地,在第二步中,所述RFA模型包含递归编码模块、序贯融合层、递归解码模块;进而,对RFA模型关键超参数进行配置,关键配置项包括本征状态向量维度F,序贯融合层数N,特征融合比例C(f)、C(b),训练轮次E;其中,C(f)、C(b)应是加和为1的正数。
优选地,在第二步中,递归编码模块采用双向编码,由2L个LSTM单元依次正向、反向连接;序贯融合层由N层全连接子层堆叠组成;递归解码模块采用双向解码,由另外2L个LSTM单元依次正向、反向连接。
优选地,在第三步中,选取装备正常状态下的多组标准化特征向量样本组成训练数据,以无监督方式完成RFA模型的训练;首先,从训练数据中给定1样本,即L个标准化特征向量,将其输入到递归编码模块分别对进行正向、反向编码,得到L个正向编码向量与L个反向编码向量;进而,将这些正、反向编码向量输入序贯融合层,依次进行时间维度、特征维度融合,得到1个维度为F的向量,即本征状态向量;接着,分别将第L个正向与反向编码向量输入到递归解码模块进行正向、反向解码,得到L个解码向量,并计算L个解码向量与前述输入的L个预处理特征向量间的重构误差;重复上述步骤,遍历训练数据全部样本,记为1轮训练,当训练轮次达到预设值E,训练完毕,输出RFA模型。
优选地,在第三步中,所述序贯融合层的时间维度融合,首先对2L个正向、反向编码向量沿时间轴拼接,得到2个正向、反向编码长向量O(f)、O(b);进而将拼接后的O(f)、O(b)输入N层全连接子层进行时序融合,其公式为:
Figure BDA0002895080410000021
Figure BDA0002895080410000022
式中,·为乘积运算;
Figure BDA0002895080410000031
分别为第i层全连接子层的正向权重矩阵、反向权重矩阵,
Figure BDA0002895080410000032
分别为第i层全连接子层的正向偏置向量、反向偏置向量;经过N层时序融合后的输出
Figure BDA0002895080410000033
Figure BDA0002895080410000034
即为正向时序融合向量、反向时序融合向量。
优选地,在第三步中,所述序贯融合层的特征维度融合,给定配置项C(f)、C(b),将前述FE(f)、FE(b)融合为本征状态向量FE,其公式为:
FE=C(f)⊙FE(f)+C(b)⊙FE(b),
式中,⊙为点积运算。
优选地,在第四步中,对于待测数据样本,首先,重复第一步所述时序化预处理方法,得到待测标准化特征向量;接着,针对第三步训练完毕的RFA模型,去除其递归解码模块,保留递归编码模块与序贯融合层;进而,将待测标准化特征向量依次输入递归编码模块与序贯融合层,依第三步所述时间维度融合与特征维度融合对其进行变换,得到待撤本征状态向量,该本征状态向量从时间、特征两个维度实现测试数据的鲁棒状态表征。
优选地,第三步所述的训练数据可以仅为装备正常状态数据,无需使用实际中通常难以获取的故障数据。
本发明的优点与积极效果在于:
(1)通过递归融合编码器,在现有深度编码-解码架构中引入了序贯融合层,使其能够同时从时间、特征双维度对装备多维状态监控数据进行本征状态向量提取,所提取的本征状态向量能更充分地量化数据本征特性且对噪声干扰不敏感,实现对装备状态的鲁棒、完备表征。
(2)提出的序贯融合层,通过堆叠的全连接子层,以简便、直观的方式缓解了现有递归自编码架构普遍存在的梯度消失问题,克服了现有方法对数据时序特征表征不完备、不充分的局限性,为未来基于神经网络的状态表征提取提供了新思路。
(3)提出的装备状态表征方法采用无监督学习策略,可在不依赖数据标签、故障数据的情况下,完成模型的自主训练以及状态表征提取,该方法具有良好的自适应性与可扩展性,能够有效应用于普遍缺乏装备故障数据的实际工程场景。
附图说明
图1是本发明的基于递归融合编码器的装备状态表征提取方法流程图;
图2是本发明的RFA模型训练数据流示意图;
图3是本发明的序贯融合层-时间维度融合数据流示意图(正向);
图4是本发明具体实施例一的01涡扇发动机完整退化记录-数据划分示意图;
图5是本发明具体实施例一的01涡扇发动机标准化特征向量示意图(训练数据);
图6是本发明具体实施例一的RFA模型无监督训练损失曲线图;
图7是本发明具体实施例一的01涡扇发动机标准化特征向量图(待测数据);
图8是本发明具体实施例一的本征状态向量3d热力散点图;
图9是本发明具体实施例一的基于ICA方法的发动机HI序列图;
图10是本发明具体实施例一的基于深度SAE方法的发动机HI序列图;
图11是本发明具体实施例一的基于RFA方法的发动机HI序列图;
图12是本发明具体实施例二的无人机28V蓄电池某样本原始参数序列图(正常状态/退化状态Ⅳ);
图13是本发明具体实施例二的无人机滑油部件某样本原始参数序列图(正常状态/退化状态Ⅳ);
图14是本发明具体实施例二的无人机28V蓄电池某样本标准化特征向量图(正常状态);
图15是本发明具体实施例二的无人机滑油部件某样本标准化特征向量图(正常状态);
图16是本发明具体实施例二的RFA模型无监督训练损失曲线图(28V蓄电池);
图17是本发明具体实施例二的RFA模型无监督训练损失曲线图(滑油部件);
图18是本发明具体实施例二的无人机28V蓄电池某待测样本标准化特征向量图(退化状态Ⅳ);
图19是本发明具体实施例二的无人机滑油部件某样本标准化特征向量图(退化状态Ⅳ);
图20是本发明具体实施例二的无人机28V蓄电池鲁棒状态表征提取结果图;
图21是本发明具体实施例二的无人机滑油部件鲁棒状态表征提取结果图。
具体实施方式
本发明提出了一种基于递归融合编码器的装备状态表征提取方法。其总体流程如图1所示,主要包括以下步骤:
步骤一、监测参数时序化预处理S1
101滑窗时序分割:针对装备监测参数非平稳的特点,给定一包含多参数序列的数据样本,选取一定长度的滑窗,将该样本切割为L个局部参数序列矩阵;
102特征预提取:对L个局部参数序列矩阵分别进行特征预提取,将各局部参数序列矩阵依次转化为预提取特征向量Il,l=1,...,L。特征预提取方法可根据实际信号特点进行选取,典型的特征预提取方法包括均值、标准差、方均根值、峭度因子等;
103标准化处理:对每个预提取特征向量Il进行特征维度的标准化处理,得到标准化特征向量
Figure BDA0002895080410000051
从而消除向量各维度间的量纲差异,加快后续RFA模型的训练收敛速度;其中,标准化处理采用z-score标准化算法,其核心公式为:
Figure BDA0002895080410000052
式中,μ、σ分别为预提取特征向量的均值向量与协方差矩阵,一般通过对训练数据中的预提取特征向量计算得到。
步骤二、RFA模型配置S2
201 RFA架构配置:为了能从时间维度和变量维度同时学习标准化特征向量的本征状态特性,RFA采用以双向长短周期记忆单元(LSTM)为主体的递归编码模块与递归解码模块,其中各模块均由2L个LSTM单元依次正向、反向连接,从而实现对标准化特征向量的正向、反向编码变换;继而,在递归编码模块后增加两个序贯融合层,其分别由多层全连接神经网络子层堆叠组成,对L个正向编码向量与L个反向编码向量进行时间维度的自适应加权融合,进而实现对融合后的正向融合向量与反向融合向量进行特征维度的加权融合;
202 RFA关键超参数配置:针对上述RFA架构,对4类关键超参数进行配置。关键配置项包括本征状态向量维度F,序贯融合层数N,特征融合比例C(f)、C(b)(C(f)+C(b)=1,0<C(f)<1,0<C(b)<1),训练轮次E。
步骤三、RFA模型无监督训练S3
301递归编码变换:利用装备正常状态下多个样本组成训练数据集;如图2所示,基于步骤二配置的RFA模型,无监督训练阶段,从训练数据集中给定某个训练样本,即L个标准化特征向量,其首先进入递归编码模块分别进行正向编码变换与反向编码变换,核心公式为:
Figure BDA0002895080410000053
Figure BDA0002895080410000061
式中,
Figure BDA0002895080410000062
分别是递归编码模块中第l个LSTM单元输出的正向编码向量与细胞状态向量,
Figure BDA0002895080410000063
分别是递归编码模块中第l个LSTM单元的反向编码向量与细胞状态向量,其中F为步骤202配置的本征状态向量维度;f(e)代表递归编码模块中各LSTM单元的非线性变换函数,采用LSTM单元已公开的通用公式,不再赘述。
302序贯融合:序贯融合层目的在于,在步骤301所述递归编码模块变换的基础上,进一步从时间维度、特征维度实现对2L个正向、反向编码向量的融合。现有主流的递归自编码器模型,将最后位置的LSTM单元(本申请中的第L个)输出OL直接作为数据的状态表征,即OL对最终的状态表征贡献度为100%。然而,由于递归类模型固有的梯度消失问题:当LSTM单元数量增加时,初始LSTM单元的输出信息难以反映在最终状态表征中,进而导致状态表征提取不完备。针对上述问题,本申请提出的序贯融合层首先从时间维度对步骤301所述的L个正向编码向量与L个反向编码向量进行融合,其通过使用Dropout技巧的N层线性全连接子层实现,数据流示意如图3所示,具体操作如下所述。
首先,分别将L个正向编码向量
Figure BDA0002895080410000064
L个反向编码向量
Figure BDA0002895080410000065
沿时间维度进行拼接,得到拼接后的正向编码长向量
Figure BDA0002895080410000066
反向编码长向量
Figure BDA0002895080410000067
进而,分别对O(f)、O(b)进行N次线性变换,核心公式为:
Figure BDA0002895080410000068
Figure BDA0002895080410000069
Figure BDA00028950804100000610
Figure BDA00028950804100000611
式中,
Figure BDA00028950804100000612
分别第i层正向、反向全连接子层的变换结果,其中
Figure BDA00028950804100000613
Wi (f)、Wi (b)分别为第i层正向、反向全连接子层的权重矩阵,
Figure BDA00028950804100000614
分别为第i层正向、反向全连接子层偏置向量;
Figure BDA00028950804100000615
分别为经过时间维度融合的正向融合向量、反向融合向量;·为乘积运算。随着RFA模型训练过程的进行,上述权重矩阵和偏置向量将通过梯度下降与反向传播算法被不断更新,这意味着时间维度的状态表征信息融合是自适应的。
进而,从特征维度对2个正向、反向融合向量进行融合,得到本征状态向量
Figure BDA00028950804100000616
进而完成时间、特征维度的联合融合,核心公式为:
FE=C(f)⊙FE(f)+C(b)⊙FE(b)
式中,C(f)、C(b)分别为步骤202配置的特征融合比例;⊙为点积运算。
303递归解码变换:给定步骤302得到的本征状态向量,FE递归解码模块分别对其进行正向解码与反向解码,核心公式为:
Ol(f)′,Cl(f)′=f(d)(Ol-1(f)′|Cl-1(f)′),l=2,...,L,
Ol(b)′,Cl(b)′=f(d)(Ol+1(b)′|Cl+1(b)′),l=1,...,L-1,
O(f)′=OL(f)′
O(b)′=O1(b)′
式中,Ol(f)′,l=1,...,L、Ol(b)′,l=1,...,L分别为正向解码向量、反向解码向量;f(d)代表递归解码模块中各LSTM单元的非线性变换函数,采用LSTM单元已公开的通用公式,不再赘述。
进而,分别对各Ol(f)′、Ol(b)′进行线性变换,得到L个解码向量
Figure BDA0002895080410000071
向量维度与输入的标准化特征向量保持一致,核心公式为:
Figure BDA0002895080410000072
式中,W′、b′分别为线性变换的权重矩阵、偏置向量。
304模型训练更新:针对步骤303得到的L个解码向量
Figure BDA0002895080410000073
计算其与输入的L个标准化特征向量
Figure BDA0002895080410000074
的损失值,记为1个样本损失,损失值计算方式为均方根误差(MSE);对训练数据集全部样本重复上述步骤得到全部样本损失后,通过已公开的梯度下降方法对RFA模型中参数进行更新,直到达到预设训练轮次E停止训练,最终得到训练完毕的RFA模型,该模型即可实现对输入标准化特征向量的鲁棒、完备状态表征提取;特别地,训练过程中,RFA模型可更新的参数包括步骤301所述递归编码模块中LSTM变换函数f(e)内已公开的参数,步骤302所述序贯融合层中的相关参数Wi (f),i=1,...,N、Wi (b),i=1,...,N、
Figure BDA0002895080410000075
步骤303所述递归解码模块LSTM变换函数f(d)内已公开的参数以及W′、b′。
步骤四、鲁棒状态表征提取S4
401待测数据预处理:给定一包含多维参数序列的待测数据样本,重复步骤一所述预处理操作,得到待测样本的L个标准化特征向量;
402鲁棒状态表征提取:基于步骤三得到的训练完毕的RFA模型,去掉前述递归解码模块,保留递归编码模块与递归融合层,重复步骤301、302所述变换处理,得到待测样本的本征状态向量,该本征状态向量从时间、特征两个维度完成待测样本的完备特征提取,且不易受待测样本噪声、非平稳组分等因素干扰,进而实现对装备的鲁棒状态表征。
具体实施例一、航空涡扇发动机状态表征提取
本实施例以典型装备——涡轮风扇发动机为对象,采用美国国家航空航天局(NASA)所公开的涡轮风扇发动机气路退化仿真数据,通过本申请方法开展状态表征提取,以对申请内容进行阐述,并进一步说明本申请内容的使用过程。
在所选涡轮风扇发动机数据集中,有100条完整的发动机从运行到失效的记录,每条记录包含21个状态监控参数,例如风扇入口处压力、风扇转速、风扇入口总温等,这些参数从不同角度反映了涡扇发动机随循环数增加引起的持续退化。通过分析参数曲线形态,一些没有明显退化趋势的无用参数被舍弃,最终选择了14个状态监控参数作为反映涡扇发动机状态的多维参数数据。
其中,以每3次循环的14维参数数据作为1个样本,选取每条发动机记录的前15%循环数的部分作为训练数据,选取后85%循环数的部分作为待测数据。以第1条(01)发动机完整记录为例,如图4所示,对上述训练、待测数据划分方式与14个状态监控参数形态进行可视化展示。
步骤一、监测参数时序化预处理
首先,如步骤101所述,设定L=3,即每个样本被切割为3个局部参数序列;进而,考虑到该涡扇发动机监测参数为已处理后的缓变信号,因此不再进行特征预提取,直接使用局部参数序列作为步骤102所述的预提取特征向量,即各预提取特征向量尺寸为1*14;进而,如步骤103所述,从训练数据中计算预提取特征向量的均值向量μ与协方差矩阵σ,进而对训练数据中各预提取特征向量进行z-score标准化处理,得到标准化特征向量。如图5所示,以01发动机记录训练数据为例,对其14维标准化特征向量进行展示,可看出标准化处理后向量各维度量纲差异显著减小。
步骤二、RFA模型配置
进而,如步骤201所述,对RFA模型架构进行配置,其依次包含递归编码模块、序贯融合层、递归解码模块;如步骤202所述,对RFA模型关键超参数进行配置,设置本征状态向量维度F=3,序贯融合层数N=2,特征融合比例C(f)=0.5、C(b)=0.5,训练轮次E=25。
步骤三、RFA模型无监督训练
接着,如步骤301所述,基于配置完毕的RFA模型,将训练数据集中各样本,即3个14维标准化特征向量(L=3),依次送入递归编码模块进行变换,分别得到对应的3个正向编码向量与3个反向编码向量;接着,如步骤302所述,将每个训练样本的3个正向编码向量与3个反向编码向量输入到序贯融合层,依次进行时间维度融合与特征维度融合,得到1个3维本征状态向量(F=3);进而,如步骤303所述,将各本征状态向量输入递归解码模块,将3维本征状态向量还原为3个14维解码向量;最终,依次计算训练集所有样本标准化特征向量(输入)与解码向量(输出)的损失值均值,记为1次训练轮次损失值;重复上述步骤直到训练轮次E达到预设的25次,结束训练,得到训练完毕的RFA模型。如图6所示,随着训练轮次增加,RFA模型训练损失稳定下降,证明训练过程有效。
步骤四、鲁棒状态表征提取
如步骤401所述,对待测数据进行预处理,将每个样本预处理为3个标准化特征向量。以01发动机记录待测数据为例,其14维标准化特征向量效果示意如图7所示,可看出标准化处理后向量各维度量纲差异显著减小。
如步骤402所述,基于步骤三得到的训练完毕的RFA模型,舍弃递归解码模块,保留递归编码模块与递归融合层,进而将各待测样本的3个14标准化特征向量变换为3维本征特征向量,从而实现对待测样本的鲁棒状态表征。
为了量化地验证本申请方法对于装备鲁棒状态表征提取的有效性,选取5个现有主流状态表征提取方法进行对比验证,即,基于统计的方法3个:主成分分析(PCA)、核主成分分析(KPCA)、独立成分分析(ICA);基于深度神经网络的方法2个:堆叠自编码器(SAE)、递归自编码器(RA)。同样采用步骤一所述方法对数据进行预处理,由于PCA、KPCA、ICA、SAE不具备时间维度表征提取能力,因此,对此4种方法一次性输入1个14维标准化特征向量进行变换,得到1个3维本征状态向量;对具备时间维度表征提取能力的RA,一次性输入3个14维标准化特征向量进行变换(与本申请所提方法一致),得到1个3维本征状态向量。针对全部数据(100条发动机全部循环数据),通过上述6种方法提取其各样本的3维本征状态向量,并将全部本征状态向量样本绘制3d热力图,其效果如图8所示。由图可知:图中3个轴分别表示本征状态向量的3个特征维度,右侧条状图所示0-1间热力值表示各本征状态向量所对应发动机的真实退化状态,其中热力值=1表示发动机处于初始健康状态,热力值=0表示发动机处于故障状态。因此,有效的状态表征应使得相似状态间的3d散点尽可能接近,而不同状态之间的3d散点则尽可能地分开。对此,由图8可以直观地看出,本申请所提出的RFA在达到了最佳性能,同样采用编码-解码架构的深度RA和深度SAE性能略差,而其他3种基于统计的PCA,KPCA和ICA无法获得令人满意的结果。特别是ICA方法,其提取的3维本征状态散点呈现出明显的状态混叠,没有准确表征待测发动机的真实状态。
上述3d热力散点图初步证明了本申请提出的RFA在鲁棒状态表征提取方面的优越性。进而,为了量化对比方法性能,本申请进一步引入了三种已公开的典型距离函数,即马氏距离、欧几里得距离、标准化欧几里得距离,以此将这些方法提取的3维本征状态向量转换为1个健康指标值HI。具体地,健康指标定义为待测本征状态向量FE与训练本征状态向量FE0的距离:
HI=dist(FE,FE0),
式中,dsit(·)为距离度量函数。
以此,将上述3d热力散点图进一步被转化为1d HI序列图,以ICA、SAE与本申请所提RFA为例,展示结果如图9、图10、图11所示。由于本实施例中的涡扇发动机仿真数据被注入了连续退化趋势,因此,一种鲁棒的状态表征提取方法应对局部样本中的数据噪声鲁棒而突出其退化趋势,即获取的HI序列应具有良好的单调性和趋势性。基于上述标准,由图9-图11所示,本申请提出的RFA仍达到了最佳性能,即其提取的HI序列趋势性更好、且不会因噪声干扰导致明显的局部波动。相比之下,SAE效果稍差,而基于统计的ICA对数据噪声的鲁棒性较差,其HI序列存在明显波动,状态表征提取效果不理想。
上述可视化结果,从直观的角度证明了本申请方法在鲁棒状态表征提取的优越性。为了实现更为精确的量化对比,本申请引入两个已公开的典型HI评价指标——“单调性”(Mono)、“趋势性”(Tend);其中,Mono指标定量描述了一种状态表征提取方法在局部噪声干扰下的鲁棒性,越大的Mono意味着对数据局部干扰具有更好的鲁棒性,Tend指标定量描述了状态表征提取方法的完备性,越大的Tend意味着提取的HI序列与数据真实状态间的相关性越好。在上述指标基础上,计算综合指标Score,其公式如下所示:
Score=Mono+Tend,
基于上述3个HI评价指标,对前述6种对比方法提取的HI序列效果进行量化评价,评价结果如表1所示:
表1状态表征提取方法量化评价指标结果
Figure BDA0002895080410000101
如表1所示,本申请提出的RFA在3种不同的距离函数下,其提取的HI序列均取得了最佳效果,较之现有方法最大分别提升11.32%,0.12%和4.54%。上述量化对比结果,进一步证明了本申请所提出的RFA在装备鲁棒状态表征提取方面的优越性,其能更加完备、鲁棒地表征装备的本征状态。
具体实施例二、无人机典型装备鲁棒状态表征提取
本实施例以典型装备——无人机电气系统中的28V蓄电池、动力系统中的滑油部件为对象,采用某型无人机真实飞行监测数据,通过本申请方法开展鲁棒状态表征提取,以对申请内容进行阐述,并进一步说明本申请内容的使用过程。
所选无人机真实飞行监测数据采集自某型无人机某飞行架次,其中28V蓄电池包含2种状态监控参数,分别为蓄电池电压1、蓄电池电压2,滑油部件包含2种状态监控参数,分别为滑油压力、滑油温度。该组真实数据采集自无人机正常状态。为了验证方法的有效性,该组正常架次数据的4种状态监控参数分别被注入了4组均值、标准差递增的高斯随机序列,得到4组异常注入数据,4组数据分别模拟了异常程度递增的装备状态,定义为退化状态Ⅰ-退化状态Ⅳ。因此,28V蓄电池、滑油部件2类典型装备,分别包含5组数据(正常状态、退化状态Ⅰ、退化状态Ⅱ、退化状态Ⅲ、退化状态Ⅳ),每组数据包含2500个样本,每个样本采样点数为100;其中,设置1组正常状态数据为训练数据,4组退化状态数据为待测数据。如图12、图13所示,对28V蓄电池、滑油部件在正常与退化状态Ⅳ下的某样本原始参数序列进行可视化展示,可直观地观察到2类装备在不同状态下的参数差异。
步骤一、监测参数时序化预处理
首先,如步骤101所述,设定L=3,即每个样本被切割为3个局部参数序列;进而,考虑到该无人机2类装备的监测参数均为未经处理的高频采样信号,噪声干扰较多,因此如步骤102所述,对2类装备的2种监测参数分别提取均值、标准差、方均根值、峰值因子、裕度因子、峭度因子特征,组成预提取特征向量,2类装备的每个预提取特征向量尺寸均为1*12;进而,如步骤103所述,从训练数据中计算预提取特征向量的均值向量μ与协方差矩阵σ,进而对训练数据中各预提取特征向量进行z-score标准化处理,得到标准化特征向量。如图14、图15所示,以某训练数据中的样本为例,分别对28V蓄电池、滑油部件的3个12维标准化特征向量进行展示,可看出标准化处理后向量各维度量纲差异显著减小。
步骤二、RFA模型配置
进而,针对无人机28V蓄电池与滑油部件,采用相同模型配置;如步骤201所述,对RFA模型架构进行配置,其依次包含递归编码模块、序贯融合层、递归解码模块;如步骤202所述,对RFA模型关键超参数进行配置,设置本征状态向量维度F=2,序贯融合层数N=2,特征融合比例C(f)=0.5、C(b)=0.5,训练轮次E=40。
步骤三、RFA模型无监督训练
接着,进而,针对无人机28V蓄电池与滑油部件,基于上述配置展开模型训练;如步骤301所述,基于配置完毕的RFA模型,将训练数据集中各样本,即3个12维标准化特征向量(L=3),依次送入递归编码模块进行变换,分别得到对应的3个正向编码向量与3个反向编码向量;接着,如步骤302所述,将每个训练样本的3个正向编码向量与3个反向编码向量输入到序贯融合层,依次进行时间维度融合与特征维度融合,得到1个2维本征状态向量(F=2);进而,如步骤303所述,将各本征状态向量输入递归解码模块,将2维本征状态向量变换还原为3个12维解码向量;最终,依次计算训练集所有样本标准化特征向量(输入)与解码向量(输出)的损失值均值,记为1次训练轮次损失值;重复上述步骤直到训练轮次E达到预设的40次,结束训练,得到训练完毕的RFA模型。本实施例中的28V蓄电池与滑油部件对应的模型训练损失曲线分别如图16、图17所示,可看出随训练轮次增加,两装备对应RFA模型的训练损失稳定下降,证明训练过程有效。
步骤四、鲁棒状态表征提取
针对无人机28V蓄电池与滑油部件,如步骤401所述,对待测数据进行预处理,将每个样本预处理为3个12维标准化特征向量;如图18、图19所示,以退化状态Ⅳ下某2个样本为例,对28V蓄电池与滑油部件2个装备的标准化特征向量结果进行展示。
进而,针对无人机28V蓄电池与滑油部件,如步骤402所述,基于步骤三得到的训练完毕的2个RFA模型,舍弃递归解码模块,保留递归编码模块与递归融合层,进而将二者各待测样本的3个12维标准化特征向量变换为2维本征特征向量,从而实现对待测样本的鲁棒状态表征。如图20、图21所示,对28V蓄电池与滑油部件在5个状态下(正常、退化Ⅰ-退化Ⅳ)的本征状态向量样本进行了散点图绘制;由图可知,本申请提取的本征状态向量样本准确表征了28V蓄电池与滑油部件的真实退化状态,实现了对无人机装备多维数据的鲁棒、完备状态表征提取。
除非另有定义,本申请中使用的所有技术和/或科学术语具有与由本发明所涉及的领域的普通技术人员通常理解的相同含义。本申请中提到的材料、方法和实施例仅为说明性的,而非限制性的。
虽然已结合具体实施方式对本发明进行了描述,在本申请的发明主旨下,本领域的技术人员可以进行适当的替换、修改和变化,这种替换、修改和变化仍属于本申请的保护范围。

Claims (5)

1.一种基于递归融合编码器的装备状态表征提取方法,其特征在于包括:
第一步、监测参数时序化预处理,对于各多维参数数据样本,首先利用一定长度的滑窗对其进行切割,得到L个局部参数序列矩阵,其中L为需要配置的滑窗切分个数;接着,对各局部参数序列矩阵进行特征预提取,得到L个预提取特征向量,进一步对L个预处理特征向量进行标准化处理,得到L个标准化特征向量;第二步、RFA模型配置,首先构建RFA模型包含的递归编码模块、序贯融合层、递归解码模块,进而对RFA模型关键超参数进行配置,包括本征状态向量维度F,序贯融合层数N,特征融合比例C(f)、C(b),训练轮次E,其中,C(f)、C(b)应是加和为1的正数;第三步、RFA模型无监督训练,选取装备正常状态下的多组标准化特征向量样本组成训练数据,以无监督方式完成RFA模型的训练;给定训练数据中某样本,即L个标准化特征向量,将其输入到递归编码模块分别进行正向、反向编码,得到2L个正向、反向编码向量;进而,将这些正、反向编码向量输入序贯融合层,依次进行时间维度、特征维度融合,得到1个维度为F的向量,即本征状态向量;接着,分别将第L个正向、反向编码向量输入到递归解码模块进行正向、反向解码以及线性变换,得到L个解码向量,并计算L个解码向量与前述输入的L个预处理特征向量间的重构误差;重复上述步骤,遍历训练数据全部样本,记为1轮训练,当训练轮次达到预设值E,训练完毕,输出RFA模型;第四步、鲁棒状态表征提取,给定待测数据样本,首先重复第一步所述时序化预处理,得到待测标准化特征向量;接着,针对训练完毕的RFA模型,去除其递归解码模块,保留递归编码模块与序贯融合层;进而,将待测标准化特征向量依次输入递归编码模块与序贯融合层,依第三步所述时间维度融合与特征维度融合对其进行变换,得到待测本征状态向量,该本征状态向量从时间、特征两个维度实现装备测试数据的鲁棒状态表征。
2.如权利要求1的装备状态表征提取方法,其特征在于:
第二步RFA模型配置中所述的递归编码模块采用双向编码,由2L个LSTM单元依次正向、反向连接;序贯融合层由N层全连接子层堆叠组成;递归解码模块采用双向解码,由另外2L个LSTM单元依次正向、反向连接。
3.如权利要求1的装备状态表征提取方法,其特征在于:
第二步RFA模型配置中所述序贯融合层的时间维度融合,其首先对2L个正向、反向编码向量沿时间轴拼接,得到2个正向、反向编码长向量O(f)、O(b);进而,将拼接后的正、反编码长向量输入N层全连接子层进行时序融合,其公式为:
Figure FDA0003591447950000011
Figure FDA0003591447950000012
式中,·为乘积运算;
Figure FDA0003591447950000013
分别为第i层全连接子层的正向权重矩阵、反向权重矩阵,
Figure FDA0003591447950000014
分别为第i层全连接子层的正向偏置向量、反向偏置向量;经过N层时序融合后的输出
Figure FDA0003591447950000015
Figure FDA0003591447950000016
即为正向时序融合向量、反向时序融合向量。
4.如权利要求1 的装备状态表征提取方法,其特征在于:
第二步RFA模型配置中所述序贯融合层的特征维度融合,给定配置项C(f)、C(b),将前述FE(f)、FE(b)融合为本征状态向量FE,其公式为:
FE=C(f)⊙FE(f)+C(b)⊙FE(b),
式中,⊙为点积运算。
5.如权利要求1的装备状态表征提取方法,其特征在于:
第三步RFA模型无监督训练中所述的训练数据可以仅为装备正常状态数据,无需使用实际中通常难以获取的故障数据。
CN202110039258.2A 2021-01-13 2021-01-13 一种基于递归融合编码器的装备状态表征提取方法 Active CN113435235B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110039258.2A CN113435235B (zh) 2021-01-13 2021-01-13 一种基于递归融合编码器的装备状态表征提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110039258.2A CN113435235B (zh) 2021-01-13 2021-01-13 一种基于递归融合编码器的装备状态表征提取方法

Publications (2)

Publication Number Publication Date
CN113435235A CN113435235A (zh) 2021-09-24
CN113435235B true CN113435235B (zh) 2022-08-02

Family

ID=77753370

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110039258.2A Active CN113435235B (zh) 2021-01-13 2021-01-13 一种基于递归融合编码器的装备状态表征提取方法

Country Status (1)

Country Link
CN (1) CN113435235B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114987773B (zh) * 2022-05-20 2024-06-14 成都飞机工业(集团)有限责任公司 飞机液压系统性能异常识别方法、装置、设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110210495A (zh) * 2019-05-21 2019-09-06 浙江大学 基于并行LSTM自编码器动态特征提取的XGBoost软测量建模方法
CN111257754A (zh) * 2020-03-23 2020-06-09 北京航空航天大学 一种基于plstm序列映射的电池soc鲁棒评估方法
CN112101659A (zh) * 2020-09-15 2020-12-18 安徽三禾一信息科技有限公司 一种基于堆叠去噪自编码器的复杂装备寿命预测方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10706351B2 (en) * 2016-08-30 2020-07-07 American Software Safety Reliability Company Recurrent encoder and decoder
US11188813B2 (en) * 2017-03-01 2021-11-30 Stc.Unm Hybrid architecture system and method for high-dimensional sequence processing
US20190034802A1 (en) * 2017-07-28 2019-01-31 Siemens Aktiengesellschaft Dimensionality reduction in Bayesian Optimization using Stacked Autoencoders

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110210495A (zh) * 2019-05-21 2019-09-06 浙江大学 基于并行LSTM自编码器动态特征提取的XGBoost软测量建模方法
CN111257754A (zh) * 2020-03-23 2020-06-09 北京航空航天大学 一种基于plstm序列映射的电池soc鲁棒评估方法
CN112101659A (zh) * 2020-09-15 2020-12-18 安徽三禾一信息科技有限公司 一种基于堆叠去噪自编码器的复杂装备寿命预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Real-time hierarchical risk assessment for UAVs based on recurrent fusion autoencoder and dynamic FCE: A hybrid framework;X. Su 等;《Applied Soft Computing》;20210318;第106卷(第107286期);全文 *
基于小波神经网络的混沌时间序列预测及应用;陶小创等;《南京航空航天大学学报》;20110715;第43卷;174-178 *

Also Published As

Publication number Publication date
CN113435235A (zh) 2021-09-24

Similar Documents

Publication Publication Date Title
Liu et al. A novel deep learning-based encoder-decoder model for remaining useful life prediction
CN113434970B (zh) 一种机械设备的健康指标曲线提取和寿命预测方法
CN112926641A (zh) 基于多模态数据的三阶段特征融合旋转机械故障诊断方法
Zhao et al. A novel cap-LSTM model for remaining useful life prediction
CN109471049B (zh) 一种基于改进堆叠自编码器的卫星电源系统异常检测方法
CN113536681B (zh) 一种基于时序外推预测的电动舵机健康评估方法
CN112241802A (zh) 一种风电功率的区间预测方法
CN113435235B (zh) 一种基于递归融合编码器的装备状态表征提取方法
CN115166514A (zh) 一种基于自适应频谱分割去噪的电机故障识别方法及系统
CN115831377A (zh) 基于icu病历数据的院内死亡风险预测方法
CN117436476A (zh) 一种基于eis增强数据预测电池rul方法
Tao et al. Chaotic time series prediction based on radial basis function network
CN115952928B (zh) 一种短期电力负荷预测方法、装置、设备及存储介质
CN117113139A (zh) 故障检测模型的训练方法、装置、计算机设备和存储介质
CN116500335A (zh) 基于一维特征和二维特征的智能电网窃电检测方法及系统
CN117154680A (zh) 一种基于非平稳Transformer模型的风电功率预测方法
Zhang et al. Optimal compression of a generalized Prandtl-Ishlinskii operator in hysteresis modeling
Yu et al. Time series reconstruction using a bidirectional recurrent neural network based encoder-decoder scheme
CN115758273A (zh) 一种时序数据异常检测方法、装置、设备及介质
CN115982988A (zh) 一种基于PCA-Transformer的设备剩余使用寿命预测方法
Zhang et al. Remaining useful life predictions for turbofan engine using semi-supervised DBN-LSTM joint training model
CN114792026A (zh) 一种航空发动机设备的剩余寿命预测方法及系统
Fu et al. Supervised Contrastive Learning based Dual-Mixer Model for Remaining Useful Life Prediction
Liu et al. Generative Adversarial Network and CNN-LSTM Based Short-Term Power Load Forecasting
Khumprom et al. Neural networks based feature selection approaches for prognostics of aircraft engines

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant