CN115659797B - 针对航空发动机数据重构的生成对抗多头注意力神经网络自学习方法 - Google Patents
针对航空发动机数据重构的生成对抗多头注意力神经网络自学习方法 Download PDFInfo
- Publication number
- CN115659797B CN115659797B CN202211299935.5A CN202211299935A CN115659797B CN 115659797 B CN115659797 B CN 115659797B CN 202211299935 A CN202211299935 A CN 202211299935A CN 115659797 B CN115659797 B CN 115659797B
- Authority
- CN
- China
- Prior art keywords
- data
- missing
- training
- matrix
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 7
- 238000012549 training Methods 0.000 claims abstract description 50
- 230000007246 mechanism Effects 0.000 claims abstract description 8
- 238000012423 maintenance Methods 0.000 claims abstract description 6
- 238000010801 machine learning Methods 0.000 claims abstract description 5
- 239000011159 matrix material Substances 0.000 claims description 64
- 238000012360 testing method Methods 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 12
- 230000036541 health Effects 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 4
- 238000003745 diagnosis Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 2
- 238000013507 mapping Methods 0.000 claims description 2
- 239000013598 vector Substances 0.000 claims description 2
- 230000003042 antagnostic effect Effects 0.000 claims 1
- 238000007781 pre-processing Methods 0.000 abstract description 4
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005429 filling process Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/094—Adversarial learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/08—Probabilistic or stochastic CAD
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Geometry (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种针对航空发动机数据重构的生成对抗多头注意力神经网络自学习方法,属于航空发动机缺失数据的端到端自学习领域。首先,对样本进行预处理,采用机器学习算法先对标准化后的数据进行预填补,将预填补后的信息作为部分训练信息参与网络训练。其次,构建生成对抗多头注意力网络模型,并利用训练样本集训练生成对抗多头注意力网络模型。最后,利用训练好的样本生成器G生成样本。本发明使用生成对抗网络可以更好的学习到数据的分布信息,使用并联卷积和多头注意力机制充分挖掘了航空发动机数据之间的空间信息和时序信息,与现有填补算法相比,该算法能有效提高缺失数据自学习精度,对航空发动机后续的预测和维护有着重大的意义。
Description
技术领域
本发明属于航空发动机缺失数据的端到端自学习领域,涉及到一种针对航空发动机数据填补的基于卷积多头注意力机制的生成对抗网络建模方法。
背景技术
航空发动机作为飞机的“心脏”,它的健康状况影响着飞机的安全飞行。航空发动机常年工作在高温、高压、高噪声的环境下,因此航空发动机相关参数的测量是一个难点与挑战。事实上,在测量的过程中,常见问题主要是由于振动异常、电磁干扰、传感器测量误差与故障等原因,会导致数据采集中断,造成部分传感器数据缺失等问题。在实际操作中,如果数据库收集到不完整数据,不仅会造成实际数据与事先估计的差异,还会降低计算的准确性,这就造成了数据处理误差,限制了后续的预测和维护。
目前,针对航空发动机缺失数据处理问题的方法有以下几种:
1)基于传统统计学的方法
数据填补问题最早可归类于统计学领域,其核心思想就是利用一些统计学的知识,实现对缺失数据的有效填补,包括均值填补法、众数填补法、极大似然估计法等。其中,均值填补和众数填补方法缺乏随机性,丢失了大量数据的有效信息,而极大似然估计方法计算较复杂。其它们的共同缺点是不能有效挖掘多元数据属性间的相关性。
2)基于机器学习的KNN方法
针对数据填补问题上的机器学习方法,如常见的KNN填补法。KNN算法明显受数据量的大小影响,并且在寻找近邻时需要计算数据之间的距离,因此数据量越大需要的计算时间越多,但是数据量较小时,不能保证选择的K个近邻与待填补数据充分接近。
综合以上论述,本发明设计的基于卷积自注意力机制生成对抗网络自学习技术,是一种针对具有耦合多元时间序列特性的航空发动机缺失数据的建模方法。本专利由中国博士后科学基金(2022TQ0179)和国家重点研发计划(2022YFF0610900)资助。
发明内容
本发明针对当前航空发动机缺失数据重构算法的局限性问题,提供了一种基于卷积多头注意力机制的生成对抗网络建模方法,并获得了更好的填补精确度。由于航空发动机是一种高度复杂的气动-热力-机械系统,它所生成的时间序列数据具有很强的相关性,因此,如何充分利用航空发动机数据中的属性相关性和时序关联性,来预测航空发动机的缺失数据一直是一个挑战性的难题。
为了达到上述目的,本发明采用的技术方案为:
一种针对航空发动机缺失数据的基于卷积多头注意力机制的生成对抗网络建模方法,包括以下几个步骤:
步骤S1:样本预处理
1)将带有缺失值的航空发动机数据集划分为训练样本集和测试样本集,训练样本集用于模型的训练,测试样本集用于训练后模型的检验,由于对训练样本集和测试样本集处理方法相同,故以下表述中不做区分,假设航空发动机数据具有n个属性,则统一用X={X1,X2,...Xn}表示。
2)标记缺失值
由于X中含有缺失值,缺失项用NAN表示,未缺失项为原始值,构造出与X大小相等的掩码矩阵M,对于X中缺失项,掩码矩阵对应位置标记为0,对于X中未缺失项,掩码矩阵对应位置标记为1,从而实现对缺失数据和未缺失数据的标记。
3)由于航空发动机一些传感器之间数值差异过大,如果直接采用原始数据,这些特征的量纲都是不一样的,这会对后续神经网络的训练产生影响。因此通过标准化处理,可以使得不同的特征具有相同的尺度。这样,在使用梯度下降法学习参数的时候,不同特征对参数的影响程度就是相同的。对于未缺失项,利用如下公式将所有传感器数据进行统一标准化,
其中X′i表示特征i标准化后的数据,Xi表示特征i原始数据,meani表示特征i的均值,σi表示特征i的方差,对于缺失项,将NAN替换为0,最终得到标准化后的多元时序数据X′={X′1,X′2,...X′n}。
4)采用滑动窗口法构造时序样本
对X′、M,采用滑动窗口法,在时间维度进行滑动,提取样本的时间信息,构造出一系列n×Windowsize的时序样本,其中n为样本的特征维数,Windowsize为窗口大小,即将X′、M重构为m×n×Windowsize形式,m为样本数量,取决于原始样本大小。
步骤S2,预填补
由于生成对抗网络生成的数据具有较大的随机性,为了使网络生成的数据较好拟合原始数据分布,因此采用机器学习算法先对X′进行预填补,将预填补后的信息作为部分训练信息Xpre参与网络训练。
步骤S3:构建生成对抗多头注意力网络模型
1)针对航空发动机缺失数据的基于卷积多头注意力机制的生成对抗网络建模方法,主要由生成器G和判别器D构成;生成器G由并联卷积层、全连接层、位置编码层、N层TransformerEncoder模块、并联卷积层和全连接层组成,即如下公式表示:
Conv1d1×1&Conv1d1×3-Linear-PositionalEncoding-N×TransformerEncoder-Conv1d1×1&Conv1d1×3-Linear (2)
所述的并联卷积层和全连接层(Conv1d1×1&Conv1d1×3-Linear)是为了有效提取航空发动机多元数据的属性相关性,并联卷积层由Conv1d1×1和Conv1d1×3并联组成,再通过全连接层进行组合,作为后续位置编码层输入。
所述的位置编码层(PositionalEncoding)是为了使模型能够利用序列的顺序,注入一些关于序列中标记的相对或绝对位置的信息。为此,本发明在输入中添加PositionalEncoding,采用公式(3)进行位置编码,其中n为窗口大小,pos是时序位置,dmodel为数据总维数,d为维度数,d∈(0,1...dmodel-1),也就是说,位置编码的每个维度都对应于一个不同的正余弦曲线,由此输入数据的位置可被单独唯一标记,最后作为后续N层TransformerEncoder层输入。
所述的N层TransformerEncoder层是由N个TransformerEncoder串联而成的一个模块,TransformerEncoder由多头注意力模块层,残差连接层,前馈网络层残差连接层组成,即如下公式表示:
MultiHead Attention-Add&Norm-FeedForward-Add&Norm (4)
其中MultiHead Attention是由多个Attention模块并行拼接而来,Attention模块如公式(5),MultiHead Attention模块如公式(6),
其中h表示多头注意力的头数, 分别表示对应的未知权重。Attention可以描述为将查询(Q)和键值对(K-V)映射到输出,其中Q、K、V和输出都是向量,输出值为计算值的加权和。当Q、K、V输入相同时,称为自注意力。
2)构造出与X大小相等的随机矩阵Z,对于缺失项数据,填入均值为0,方差为0.1的随机数,对于未缺失项数据,填入0。由此引入一定的随机值,使之后模型训练更有鲁棒性。
根据掩码矩阵M,构造出与M完全相同的矩阵M′,再对于M′中所有为0的项,以90%的概率置为1,最终得到提示矩阵H。
生成器G的输入数据为标准化后的多元时序数据X′、随机矩阵Z,掩码矩阵M、预填补矩阵Xpre,使用并联卷积层提取属性间关联信息,使用位置编码将输入数据的时序信息进行编码,使用N层TransformerEncoder模块有效提取时序信息,最后使用并联卷积层和全连接层,输出完备数据信息Xg,利用Xg对X′中的缺失项进行填补;判别器D和生成器G结构上几乎一致,仅在最后一层添加Sigmoid激活函数,以计算交叉熵损失,判别器的输入为填补后的数据矩阵Ximpute,以及由掩码矩阵生成的提示矩阵H和预填补矩阵Xpre,输出结果为预测矩阵Xd,预测矩阵中的元素值表示Ximpute中对应元素为真实数据的概率。
步骤S4,利用训练样本集训练生成对抗多头注意力网络模型
1)网络的训练包括两部分:判别器D的训练,生成器G的训练,其中公式(7)为判别器D的交叉熵损失函数,公式(8)为生成器G的损失函数,其中,表示期望,M为掩码矩阵,Xpre为预填补的数据,Xg为生成器G生成的数据,Xd为判别器D输出的概率矩阵,λ,β为超参数。如下公式(9)为填补后的数据集;
Ximpute=X′*M+Xg*(1-M) (9)
2)生成器G和判别器D交替训练,生成器生成样本Xg,尽量拟真实数据即未缺失项数据的分布,判别器D判别生成器G生成样本为真的概率,相互博弈,彼此促进。
步骤S5:利用训练好的样本生成器G生成样本
训练结束后,将带有测试样本集进行步骤1所示预处理,输入训练好的生成器G,得到生成样本Xg。
步骤S6:利用生成样本重构缺失值
利用式(9),最终得到完备的填补后样本Ximpute,完成整个数据集的缺失数据重构工作。缺失数据重构完成之后,可作为后续故障诊断,健康维护工作的数据集,实现对含有缺失数据的航空发动机传感器数据的最大化利用。
本发明的有益效果:
本发明使用生成对抗网络可以更好的学习到数据的分布信息,使用并联卷积和多头注意力机制充分挖掘了航空发动机数据之间的空间信息和时序信息,与现有填补算法相比,该算法能有效提高缺失数据自学习精度,对航空发动机后续的预测和维护有着重大的意义。
附图说明
图1是本发明技术流程图。
图2是本发明提出的生成对抗网络填补自学习模型图,其中图a是本发明提出的改进生成对抗数据填补自学习架构,图b是本发明提出的生成器模型,图c是本发明提出的判别器模型。
图3是图2模型的子模型,其中图a是点击缩放注意力模型,图b是多头注意力模型,图c是并联卷积及线性层模型。
图4是在航空发动机健康管理常用的C-MAPSS数据集下,缺失率{0.1,0.3,0.5,0.7,0.9}下的均方根差(RMSE)效果比较,其中this是本发明算法结果,knn是K-近邻填补算法结果,mean是均值填补算法结果。
具体实施方式
本实施中针对航空发动机数据重构的生成对抗多头注意力神经网络自学习技术,使用C-MAPSS实验数据中FD001数据集进行验证,C-MAPSS实验数据是一个没有缺失值的数据集,并且数据集中给定的发动机都属于同一型号,每个发动机中共有21个传感器,数据集中将这若干个发动机的传感器数据共同构建为矩阵的形式,其中,每个发动机传感器数据的时间序列长度不相同,但都表示发动机完整的寿命周期。FD001数据集包含200台发动机退化数据,由于在本发明中是对航空发动机缺失数据进行重构,而不进行剩余寿命预测,因此将原数据集中划分的test_FD001和train_FD001合并,再按发动机号为最小单位进行随机打乱,选取80%的发动机号的数据作为训练集,20%的发动机号的数据作为测试集,对测试集按指定缺失率进行人工随机缺失。
将训练集数据作为历史数据集,测试集数据作为缺失数据集,附图1表示该技术流程,包括以下步骤。
训练阶段,使用历史数据集数据进行训练。
步骤1:按指定缺失率,这里取{0.1,0.3,0.5,0.7,0.9}五组缺失率,对数据集进行随机缺失,留存这些缺失项的真实值Xtrue,作为后续评判信息。
步骤2:进行数据预处理
1)利用公式(1)将所有传感器数据进行统一标准化,得到标准化后的多元样本X′。
2)采用滑动窗口法构造时序样本
采用滑动窗口法,在时间维度进行滑动,提取样本的时间信息,其中特征维度为21,窗口大小为30,步长为5,构造出一系列特征维度×窗口大小(21×30)的时序样本,生成缺失数据矩阵。
3)标记缺失值
构造出与缺失数据矩阵大小相等的掩码矩阵(21×30),对于缺失数据矩阵中的未缺失项,将掩码矩阵中对应位置标记为1,对于缺失项,将掩码矩阵对应位置标记为0,实现对缺失数据和未缺失数据的标记。
步骤3:预填补
预填补过程,可以采用不同算法进行数据的预先填补,预填补的好坏对最终填补也有一定的影响,此处采用K-近邻算法对预处理后的数据进行预填补,其中K-近邻算法中采用Sklearn库中的KNNImputer函数,K取值为14,预填补后的结果为预填补矩阵,作为后续输入。
步骤4:利用训练样本集Xtrain训练模型
网络的训练包括两部分,生成器G的训练,判别器D的训练两部分,如式(2)所示,生成器G由并联卷积层,全连接层,位置编码层,N层TransformerEncoder模块,并联卷积层,全连接层组成;判别器D在生成器的基础上,在最后一层增加一个sigmoid函数将值域转换为(0,1),用于交叉熵损失函数的计算。
首先进行生成器的训练,将缺失数据矩阵X′、随机矩阵Z、掩码矩阵M和预填补矩阵Xpre作为生成器G的输入,输出生成矩阵Xg,将其用于填补缺失值,得到填补矩阵Ximpute,将填补矩阵Ximpute,由掩码矩阵生成的提示矩阵H,预填补矩阵Xpre输入判别器D计算得到Xd,利用式:计算得到lossg1,利用式:λ∥X′*M-Xg*M∥2计算生成数据与未缺失数据的重构损失得到lossg2,利用式:β∥Xpre*(1-M)-Xg*(1-M)∥2计算生成数据与预填补数据的重构损失得到lossg3,合并lossg1、lossg2、lossg3:
Gloss=lossg1+lossg2+lossg3 (10)
反馈给生成器G并通过Adam函数进行梯度更新。
接着进行判别器D的训练,将填补矩阵Ximpute,掩码矩阵生成的提示矩阵H以及预填补矩阵Xpre输入判别器D计算得到Xd,利用式(7)计算交叉熵损失函数,得到Dloss,反馈给判别器D并通过Adam函数进行梯度更新。
接着进行第二次迭代训练,即重复生成器G和判别器D的训练过程,迭代训练生成器G,使填补样本[Xg*(1-M)]通过判别器D鉴定为未缺失样本(X′*M)的概率不断提升,即得到填补样本的样本分布和真实样本即未缺失项样本的样本分布越来接近;更新判别器D的参数,使得判别器D能准确识别出填补样本和真实样本;以此类推,完成多次模型训练,最终,当达到训练次数后,退出训练,得到训练好的生成器G和判别器D。
在FD001数据集训练中,窗口大小为30,步长为5,批次大小为128,λ=10,β=1/(Pmiss*10),Pmiss为缺失率,dropout率为0.2,训练次数epoch为15,生成器学习率为lrG=1.2e-3,判别器学习率为lrD=1.2e-1,TransformerEncoder模块注意力头数为8,堆叠层数N为2。
测试阶段,使用缺失数据集数据进行测试。
步骤5:缺失数据集数据预处理及预填补
对缺失数据集进行步骤2,步骤3所示的预处理与预填补。这里窗口大小=步长=30,生成缺失数据矩阵X′、随机矩阵Z、掩码矩阵M和预填补矩阵Xpre。
步骤6:缺失数据集填补
将步骤5生成的矩阵输入步骤4训练好的生成器G,得到生成器的输出Xg,再利用式(9),得到最终填补的矩阵Ximpute。
实施结果
本文针对航空发动机健康管理常用的C-MAPSS数据集,C-MAPSS实验数据是一个没有缺失值的数据集,对于其中的FD001数据集,本文按{0.1,0.3,0.5,0.7,0.9}五组缺失率,通过人工随机缺失模拟发动机传感器数据缺失,构建包含缺失值的缺失数据集,再将缺失样本集将原数据集中划分的test_FD001和train_FD001合并,再按发动机号为最小单位进行随机打乱,选取80%的发动机号的数据作为训练集,20%的发动机号的数据作为测试集,进行算法的验证。
此外,由于上述数据集划分具有随机性,即每个发动机号下的数据序列长度不同,发动机号也是随机打乱,因此每次训练及测试结果都会有随机性,因此对每个缺失率下每个算法进行训练与测试五次,并取平均值作为最终结果,表1是最终结果,图4是结果图。
表1:FD001数据集在不同缺失率下填补精度RMSE
从表1中可以看出,在航空发动机健康管理常用的C-MAPSS数据集下,与基准算法相比,本发明不仅在相同缺失率下有着更好的补全效果,随着缺失率增大,本发明也有着更好的稳定性。缺失数据重构完成之后,可作为后续故障诊断,健康维护工作的数据集,在实现对含有缺失数据的航空发动机传感器数据的最大化利用的同时,本发明也能提供更高的准确度。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例仅用以说明本发明的技术方案,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明原理和宗旨情况下,在本发明的范围内可以对以上述实施例进行修改和替换。
Claims (2)
1.一种针对航空发动机数据重构的生成对抗多头注意力神经网络自学习方法,其特征在于,包括以下步骤:
步骤S1:样本预处理
1)将带有缺失值的航空发动机数据集划分为训练样本集和测试样本集,训练样本集用于模型的训练,测试样本集用于训练后模型的检验,假设航空发动机数据具有n个属性,则统一用X={X1,X2,...Xn}表示;
2)标记缺失值
由于X中含有缺失值,缺失项用NAN表示,未缺失项为原始值,构造出与X大小相等的掩码矩阵M,对于X中缺失项,掩码矩阵对应位置标记为0,对于X中未缺失项,掩码矩阵对应位置标记为1,从而实现对缺失数据和未缺失数据的标记;
3)通过标准化处理,使不同的特征具有相同的尺度;对于未缺失项,利用如下公式将所有传感器数据进行统一标准化,
其中X′i表示特征i标准化后的数据,Xi表示特征i原始数据,meani表示特征i的均值,σi表示特征i的方差,对于缺失项,将NAN替换为0,最终得到标准化后的多元时序数据X′={X′1,X′2,...X′n};
4)采用滑动窗口法构造时序样本
对X′、M,采用滑动窗口法,在时间维度进行滑动,提取样本的时间信息,构造出一系列n×Windowsize的时序样本,其中n为样本的特征维数,Windowsize为窗口大小,即将X′、M重构为m×n×Windowsize形式,m为样本数量,取决于原始样本大小;
步骤S2,预填补
为了使网络生成的数据较好拟合原始数据分布,采用机器学习算法先对X′进行预填补,将预填补后的信息作为部分训练信息Xpre参与网络训练;
步骤S3:构建生成对抗多头注意力网络模型
1)针对航空发动机缺失数据的基于卷积多头注意力机制的生成对抗网络建模方法,主要由生成器G和判别器D构成;生成器G由并联卷积层、全连接层、位置编码层、N层TransformerEncoder模块、并联卷积层和全连接层组成,即如下公式表示:
Conv1d1×1&Conv1d1×3-Linear-PositionalEncoding-N×TransformerEncoder-Conv1d1×1&Conv1d1×3-Linear (2)
2)构造出与X大小相等的随机矩阵Z,对于缺失项数据,填入均值为0,方差为0.1的随机数,对于未缺失项数据,填入0;由此引入随机值,使之后模型训练更有鲁棒性;
根据掩码矩阵M,构造出与M完全相同的矩阵M′,再对于M′中所有为0的项,以90%的概率置为1,最终得到提示矩阵H;
生成器G的输入数据为标准化后的多元时序数据X′、随机矩阵Z,掩码矩阵M、预填补矩阵Xpre,使用并联卷积层提取属性间关联信息,使用位置编码将输入数据的时序信息进行编码,使用N层TransformerEncoder模块有效提取时序信息,最后使用并联卷积层和全连接层,输出完备数据信息Xg,利用Xg对X′中的缺失项进行填补;判别器D和生成器G结构上相似,仅在最后一层添加Sigmoid激活函数,以计算交叉熵损失,判别器的输入为填补后的数据矩阵Ximpute,以及由掩码矩阵生成的提示矩阵H和预填补矩阵Xpre,输出结果为预测矩阵Xd,预测矩阵中的元素值表示Ximpute中对应元素为真实数据的概率;
步骤S4,利用训练样本集训练生成对抗多头注意力网络模型
1)网络的训练包括两部分:判别器D的训练,生成器G的训练,其中公式(7)为判别器D的交叉熵损失函数,公式(8)为生成器G的损失函数,其中,表示期望,M为掩码矩阵,Xpre为预填补的数据,Xg为生成器G生成的数据,Xd为判别器D输出的概率矩阵,λ,β为超参数;如下公式(9)为填补后的数据集;
Ximpute=X′*M+Xg*(1-M) (9)
2)生成器G和判别器D交替训练,生成器生成样本Xg,尽量拟真实数据即未缺失项数据的分布,判别器D判别生成器G生成样本为真的概率,相互博弈,彼此促进;
步骤S5:利用训练好的样本生成器G生成样本
训练结束后,将带有测试样本集进行步骤1所示预处理,输入训练好的生成器G,得到生成样本Xg;
步骤S6:利用生成样本重构缺失值
利用式(9)得到完备的填补后样本Ximpute,完成整个数据集的缺失数据重构工作;缺失数据重构完成之后,可作为后续故障诊断,健康维护工作的数据集,实现对含有缺失数据的航空发动机传感器数据的最大化利用。
2.根据权利要求1所述的一种针对航空发动机数据重构的生成对抗多头注意力神经网络自学习方法,其特征在于,所述的步骤S3中:
所述的并联卷积层和全连接层用于提取航空发动机多元数据的属性相关性,并联卷积层由Conv1d1×1和Conv1d1×3并联组成,再通过全连接层进行组合,作为后续位置编码层输入;
所述的位置编码层用于模型能够利用序列的顺序,注入关于序列中标记的相对或绝对位置的信息;为此,在输入中添加PositionalEncoding,采用公式(3)进行位置编码,其中n为窗口大小,pos是时序位置,dmodel为数据总维数,d为维度数,也就是说,位置编码的每个维度都对应于一个不同的正余弦曲线,由此输入数据的位置可被单独唯一标记,最后作为后续N层TransformerEncoder层输入;
所述的N层TransformerEncoder层是由N个TransformerEncoder串联而成的一个模块,TransformerEncoder由多头注意力模块层,残差连接层,前馈网络层残差连接层组成,即如下公式表示:
MultiHead Attention-Add&Norm-FeedForward-Add&Norm (4)
其中MultiHead Attention是由多个Attention模块并行拼接而来,Attention模块如公式(5),MultiHead Attention模块如公式(6),
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211299935.5A CN115659797B (zh) | 2022-10-24 | 2022-10-24 | 针对航空发动机数据重构的生成对抗多头注意力神经网络自学习方法 |
PCT/CN2022/128101 WO2024087129A1 (zh) | 2022-10-24 | 2022-10-28 | 针对航空发动机数据重构的生成对抗多头注意力神经网络自学习方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211299935.5A CN115659797B (zh) | 2022-10-24 | 2022-10-24 | 针对航空发动机数据重构的生成对抗多头注意力神经网络自学习方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115659797A CN115659797A (zh) | 2023-01-31 |
CN115659797B true CN115659797B (zh) | 2023-03-28 |
Family
ID=84992282
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211299935.5A Active CN115659797B (zh) | 2022-10-24 | 2022-10-24 | 针对航空发动机数据重构的生成对抗多头注意力神经网络自学习方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN115659797B (zh) |
WO (1) | WO2024087129A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117493786B (zh) * | 2023-12-29 | 2024-04-09 | 南方海洋科学与工程广东省实验室(广州) | 一种对抗生成网络和图神经网络结合的遥感数据重构方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112185104A (zh) * | 2020-08-22 | 2021-01-05 | 南京理工大学 | 一种基于对抗自编码器的交通大数据修复方法 |
CN112686816A (zh) * | 2020-12-25 | 2021-04-20 | 天津中科智能识别产业技术研究院有限公司 | 一种基于内容注意力机制和掩码先验的图像补全方法 |
CN113158445A (zh) * | 2021-04-06 | 2021-07-23 | 中国人民解放军战略支援部队航天工程大学 | 一种卷积记忆残差自注意力机制的航空发动机剩余使用寿命预测算法 |
CN114757335A (zh) * | 2022-04-01 | 2022-07-15 | 重庆邮电大学 | 一种基于双重条件生成对抗网络的缺失数据填补生成方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200394508A1 (en) * | 2019-06-13 | 2020-12-17 | Siemens Aktiengesellschaft | Categorical electronic health records imputation with generative adversarial networks |
CN113298131B (zh) * | 2021-05-17 | 2022-08-05 | 南京邮电大学 | 一种基于注意力机制的时序数据缺失值插补方法 |
CN113869386A (zh) * | 2021-09-18 | 2021-12-31 | 华北电力大学 | 基于生成对抗插补网络的pmu连续丢失数据恢复方法 |
CN114445252A (zh) * | 2021-11-15 | 2022-05-06 | 南方科技大学 | 数据补全方法、装置、电子设备及存储介质 |
CN114022311A (zh) * | 2021-11-16 | 2022-02-08 | 东北大学 | 基于时序条件生成对抗网络的综合能源系统数据补偿方法 |
-
2022
- 2022-10-24 CN CN202211299935.5A patent/CN115659797B/zh active Active
- 2022-10-28 WO PCT/CN2022/128101 patent/WO2024087129A1/zh unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112185104A (zh) * | 2020-08-22 | 2021-01-05 | 南京理工大学 | 一种基于对抗自编码器的交通大数据修复方法 |
CN112686816A (zh) * | 2020-12-25 | 2021-04-20 | 天津中科智能识别产业技术研究院有限公司 | 一种基于内容注意力机制和掩码先验的图像补全方法 |
CN113158445A (zh) * | 2021-04-06 | 2021-07-23 | 中国人民解放军战略支援部队航天工程大学 | 一种卷积记忆残差自注意力机制的航空发动机剩余使用寿命预测算法 |
CN114757335A (zh) * | 2022-04-01 | 2022-07-15 | 重庆邮电大学 | 一种基于双重条件生成对抗网络的缺失数据填补生成方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2024087129A1 (zh) | 2024-05-02 |
CN115659797A (zh) | 2023-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115018021B (zh) | 基于图结构与异常注意力机制的机房异常检测方法及装置 | |
CN113743016B (zh) | 基于自编码器和回声状态网络的发动机剩余寿命预测方法 | |
CN115659797B (zh) | 针对航空发动机数据重构的生成对抗多头注意力神经网络自学习方法 | |
CN113688869B (zh) | 一种基于生成对抗网络的光伏数据缺失重构方法 | |
CN110083125A (zh) | 一种基于深度学习的机床热误差建模方法 | |
CN110851654A (zh) | 基于张量化数据降维的工业设备故障检测分类方法 | |
CN114841072A (zh) | 一种基于差分融合Transformer的时序预测方法 | |
CN115345222A (zh) | 一种基于TimeGAN模型的故障分类方法 | |
CN115081484A (zh) | 基于crj-oselm算法的航空发动机传感器故障诊断方法 | |
CN113836783A (zh) | 斜拉桥主梁温致挠度监测基准值的数字回归模型建模方法 | |
CN116050621A (zh) | 一种集成提升模式的多头自注意力海上风电超短时功率预测方法 | |
CN117076171A (zh) | 一种面向多元时序数据的异常检测及定位方法及装置 | |
CN116822920A (zh) | 一种基于循环神经网络的流程预测方法 | |
CN107944488A (zh) | 基于层次化深度网络的长时序列数据处理方法 | |
CN116821697B (zh) | 一种基于小样本学习的机械设备故障诊断方法 | |
CN112232570A (zh) | 一种正向有功总电量预测方法、装置及可读存储介质 | |
Silva et al. | Generative network-based reduced-order model for prediction, data assimilation and uncertainty quantification | |
CN114638421A (zh) | 一种发电机组备件需求的预测方法 | |
CN114818281A (zh) | 一种基于卷积神经网络的剖面反演方法及系统 | |
Petrov et al. | IEEE BigData 2021 Cup: Soft sensing at scale | |
Guo et al. | MHT: A multiscale hourglass-transformer for remaining useful life prediction of aircraft engine | |
CN111105074A (zh) | 一种基于改进深度信念学习的故障预测方法 | |
Liu et al. | Generating HSR Bogie Vibration Signals via Pulse Voltage-Guided Conditional Diffusion Model | |
Tang et al. | Research on prognosis for engines by LSTM deep learning method | |
Chen et al. | A Multivariate Time Series Anomaly Detection Method Based on Generative Model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |