CN116611018A

CN116611018A - 基于多源数据融合的装备系统健康管理及故障诊断方法

Info

Publication number: CN116611018A
Application number: CN202211541061.XA
Authority: CN
Inventors: 吕江花; 刘铭; 刘鹤; 张淳; 刘泽玉; 刘丽君
Original assignee: Beihang University; Beijing Institute of Spacecraft System Engineering
Current assignee: Beihang University; Beijing Institute of Spacecraft System Engineering
Priority date: 2021-12-06
Filing date: 2022-12-02
Publication date: 2023-08-18

Abstract

本发明是一种基于多源数据融合的装备系统健康管理及故障诊断方法，属于故障检测领域。本发明方法包括：考虑同类及异类传感器之间的数据一致性，进行航天器多源数据的预处理，保留数据的原始信息及时序特性，对不同传感器来源的数据缺失值进行针对性填充；针对航天器多源数据的同类传感器和异类传感器数据进行融合，对同类传感器数据进行最优融合，对异类传感器数据进行线性及非线性融合，最大程度保留数据原始信息；建立基于变分自编码器和生成式对抗网络的故障检测模型，并引入LSTM模型建立特征之间的时间依赖关系。本发明最大程度地保留了数据原本的特征，提高了故障检测精度，使航天器自主故障检测过程有更强的健壮性、更高的准确率。

Description

基于多源数据融合的装备系统健康管理及故障诊断方法

技术领域

本发明属于航天器故障检测技术领域，涉及多源数据融合技术以及基于深度学习的航天器故障检测技术，具体是一种基于多源数据融合的装备系统健康管理及故障诊断方法。

背景技术

航天器作为航天任务的执行单位，是航天系统的重要组成部分。随着航天技术的进步，航天器变得更为复杂、精密，体现在其分系统内部及分系统间组成和交互变得更为复杂，航天任务量及单个任务累积的数据量大量增加。由于航天器是非常昂贵的器械，极度复杂且往往执行危险系数很大的任务，工作在人类缺乏了解的环境中，因此，系统故障带来的后果十分严重，及时发现并处理这些故障是航天器生命周期的重要一环。这对航天器故障检测的准确性和高效性提出了较高的要求。

传统的故障检测方法，譬如人工判读方法，对于操作人员相关领域知识有较高的要求，对故障的反应时间也会随着数据量的累积而增长。此外，人工检测技术在处理海量数据时会导致故障误判率增高。因此，航天器自主故障检测技术在近几十年间引发了国内外专家的重视，多种自动检测技术得以发展并成功应用在各种实际工程环境中，取得了较好的效果，极大解放了测试人员的低效劳动。目前，航天器自动故障检测技术部署于多种航天器上：IMS(Inductive Monitoring System)与最近邻法应用于国际空间站的故障检测，其采用K-means聚类技术识别其下行遥测数据中的某些参数之间的显著交互特性，以识别异常数据点；ELMER(Envelope Learning and Monitoring using Error Relaxation)则运用神经网络模型以减少异常漏判，其正应用于进行深空探测的深空一号航天器上，但由于内存和计算资源受限，它仅仅对航天器内十个温度传感器的数据进行分析。

目前的检测技术受限于信息采集技术及感知渠道，其检测过程往往基于单一的数据来源。而单源数据无法完全刻画航天器的状态，检测过程易受数据异常波动的影响，稳定性差，因此故障检测准确率上限受到限制。多源数据从不同角度刻画了航天器当前状态，稳定性高于单源数据。数据之间存在着协同、互补、互斥的关系，合理利用多源数据之间存在的关系，既能弥补检测所需信息的缺失，也能剔除或更正存在明显异常的数据。随着航天器复杂程度变高，感知渠道增加、采集数据多源化为基于数据融合的故障检测提供了可能。基于多源数据融合的故障检测技术可以有效提高故障检出率，更加精准地反映故障状态，提高对数据采集过程中的误差和异常跳变的接受度，具有较高的鲁棒性。

来自不同源端的数据通过融合去除冗余，减少了检测的复杂程度；存在相关性的数据通过融合消除相关性，使得故障检测结果趋于稳定；融合使互补协同信息得到体现，使检测精确率提高。多源数据融合的优势明显，但数据之间的关系也更加复杂，隐含较强相关性，存在大量冗余。若直接将原始数据作为检测的输入，会增加系统的复杂性，导致检测结果波动，需要较好的数据组织方式才能更好地发挥多源数据的优势。

发明内容

基于上述问题和需求，综合考虑航天器故障样式多变、持续时间不一、时间依赖性强等特点，本发明提出了一种基于多源数据融合的装备系统健康管理及故障诊断方法，针对航天器多源数据特性，通过多源时序数据融合方法将时序数据融合，融合后提取数据特征，并进行故障检测，解决现有模型面对航天器多源数据故障检测精度不高的问题。

本发明的一种基于多源数据融合的装备系统健康管理及故障诊断方法，包括如下步骤：

(1)对航天器多源数据进行预处理，主要包括缺失值填充，填充方式包括如下两种：

第一种情况：对于存在同类传感器数据的缺失值，对同类传感器同一时间点的数据求平均值，作为缺失值，填充到缺失序列中。

第二种情况：对于不存在同类传感器的时间序列数据的缺失值填充，使用时间序列分析ARIMAX模型进行缺失值预测。

(2)对航天器多源数据进行融合，包括：

第一种情况：采用基于动态支持度的最优二乘融合方法对同类传感器数据进行融合。

干扰信息较大传感器参与融合会降低融合数据质量甚至存在潜在冲突，因此在融合过程中引入支持度的概念，将支持度低的同类传感器数据抛弃，挑选同类间支持度较大的传感器进行最小二乘加权融合。

第二种情况：对异类传感器数据，分两步进行融合，先利用PCA(主成分分析)进行数据降维，在利用LLE(局部线性嵌入)进行特征融合，降低数据维度，得到最终融合结果。

(3)建立航天器多源数据故障检测模型，将融合后的数据利用该故障检测模型进行故障检测。

所述航天器多源数据故障检测模型构建方式为：将变分自编码器VAE和生成式对抗网络GAN结合形成V/G模型；V/G模型中，将VAE的解码器作为GAN的生成器，融合数据作为原始输入数据输入VAE重建，将原始输入数据和VAE重建的数据输入GAN的判别器进行故障检测；V/G模型中，VAE的编码器和解码器引入长短期记忆模型LSTM，利用LSTM预测下一时间窗口的输入数据。

所述故障检测模型在每一轮训练中，依次更新编码器、生成器和判别器的模型参数，再训练LSTM。训练编码器、生成器和判别器的模型参数时，将各自的损失函数独立出来。

将融合后的时间序列数据输入所述故障检测模型进行检测时，计算每个数据点的故障得分，并与预先设置的故障阈值比较，若大于该阈值则标记为故障点，否则表示没有故障，最后根据时间序列长度与故障点总数来判断是否有故障发生。

相对于现有的技术，本发明方法的优点和积极效果在于：

(1)本发明方法通过对航天器多源数据进行预处理，保证了数据的完整性；预处理操作考虑了同类以及异类传感器之间的数据一致性，保留了数据的原始信息以及时序特性，对不同传感器来源的数据缺失值进行有针对的填充，为后续数据融合任务提供数据基础。

(2)本发明方法提出了一种针对航天器多源数据的同类传感器和异类传感器数据融合方法，对同类传感器数据进行最优融合，对异类传感器数据进行两步融合，进行线性及非线性融合，最大程度保留数据原始信息，以提升后续故障检测工作的准确率及性能。

(3)本发明方法提出一种基于变分自编码器和生成式对抗网络的故障检测模型，重建了数据的真实分布，以提高检测精度；为了避免长时间依赖带来的干扰，引入LSTM模型建立特征之间的时间依赖关系。模型通过VAE的编码器重建LSTM的预测窗口特征。在故障检测阶段也不以重建误差为唯一的故障指标，同时考虑重建窗口误差和重建窗口判别器得分，增强模型对点异常和上下文异常的检测能力。

(4)本发明方法最大程度地保留了数据原本的特征，去除了无用冗余数据，统一了特征描述，达到提高故障检测精度的目的，使航天器自主故障检测过程有更强的健壮性、更高的准确率。

附图说明

图1是本发明基于多源数据融合的装备系统健康管理及故障诊断方法的流程示意图；

图2是本发明方法采用的最近邻投影的增量式LLE算法的示意图；

图3是变分自编码器VAE的结构示意图；

图4是长短期记忆入模型LSTM的结构示意图；

图5是本发明构建的航天器多源数据故障检测模型示意图；

图6是本发明实施例试验所输入的部分原始数据示意图；

图7是本发明实施例试验所获得的部分融合数据示意图；

图8是本发明实施例试验对输入数据进行故障检测的结果示意图。

具体实施方式

下面将结合附图和实施例对本发明作进一步的详细说明。

本发明的基于多源数据融合的装备系统健康管理及故障诊断方法，如图1所示，主要包括三个步骤，下面分别进行具体说明。

步骤一，对航天器多源数据进行预处理。

航天器数据受到采集环境、传输条件等限制，容易出现值丢失，这些缺失值将为后续的数据处理带来额外的问题，因此需要对缺失值进行填充。对于航天器多源数据而言，合理利用数据之间的关系可以得到较好的填充值。本发明通过对多源数据的缺失度进行分析，发现多源数据之间，每个传感器采集到的数据有着较高的完整性，缺失程度不大，进行填充不会破坏数据本来特征。本发明采用基于预测的缺失值填充，能最大程度地考虑时序数据的时间关联性并保持多源数据的一致性。本发明方法在传感器多源数据缺失值填充中，可根据是否存在同类传感器，将填充方式分为两类情况。

步骤1.1，首先，对于存在同类传感器数据的缺失值，对同类传感器同一时间点数据求平均值填充到缺失序列中。

步骤1.2，其次，对于不存在同类传感器的时间序列数据的缺失值填充，现在常用差分整合移动平均自回归模型ARIMA进行预测填充。但ARIMA模型只考虑了一元时间序列，忽略了序列间的相互影响作用。为此，本发明引入时间序列分析ARIMAX模型，其能够通过所提供的输入序列，关联不同时间序列，更好地预测数据缺失部分的值。

具体地，本发明实施例利用ARIMAX模型进行缺失值填充的一个实现步骤如下：

(1)对输入序列和输出序列进行平稳性检验，对于非平稳数据进行差分后达到平稳。输入序列为需要缺失值填充的传感器采集的时间序列数据，输出序列为进行填充了缺失值后的序列数据。

(2)对平稳后的输入序列和输出序列，分别建立ARMA(自回归滑动平均)模型，产生各自的白噪声序列{x_t}，{y_t}。

(3)根据{x_t}，{y_t}互相关系数确定ARIMAX模型的结构。

(4)由模型输出的拟合值和真实值获取残差序列，对残差序列的模型进行拟合。

(5)利用整体ARIMX模型进行缺失值预测。

步骤二，对航天器多源数据进行融合。

航天器传感器多源数据具有较高的相关性，数据包含大量冗余，从数据本身的特性出发，融合方法应能够尽可能保留数据原有特征并降低数据冗余。后续故障检测工作要求能够获得到足够多的数据信息，同时对于检测的结果应能够对应到原始数据的具体时间点，这要求融合结果与原始数据具有时间点上的对应关系。

本发明对同类传感器数据融合提出了一种基于动态支持度的最优二乘融合方法。对于异类传感器数据分两步进行融合，利用PCA(Principal Component Analysis，主成分分析方法)和LLE(Locally Linear Embedding，局部线性嵌入)依次处理原始数据，得到最终融合结果。

步骤2.1，对于同类传感器数据，在无先验知识的情况下进行融合，通常基于最小二乘原理的加权融合方式。但干扰信息较大的传感器参与融合会降低融合数据质量甚至存在潜在冲突，因此在融合过程中引入支持度的概念，挑选那些同类间支持度较大的传感器进行最小二乘加权融合。对支持度低的同类传感器数据直接抛弃。

具体地，本发明实施例对同类传感器数据融合的一个实现如下。

设同类传感器个数为n，s_it为传感器i在t时刻的测量值，s_jt为传感器j在t时刻的测量值，定义d_ij＝|s_it-s_jt|为传感器i、j在t时刻的距离。对d_ij进行归一化，设定z_ij＝1-d_ij为传感器i,j相互的支持度。则t时刻传感器i的支持度如下所示：

可预先设置支持度阈值，对低于支持度阈值的同类传感器的数据抛弃，对大于等于支持度阈值的同类传感器数据采用基于最小二乘法加权融合。

步骤2.2，对异类传感器数据依次利用PCA和LLE处理进行融合。

同类传感器数据融合完成以后，得到的数据集合仍然具有较高的相关性，这些相关性仍然存在很大的数据冗余，直接进入检测阶段会使检测模型复杂度较大，检测效果变差。对数据进一步融合具有必要性，现有的融合手段通常分为线性融合和非线性融合，线性融合较为简单，但无法处理非线性关系，同时容易丢失数据特征。非线性融合功能一定程度上包含线性融合过程，但非线性融合存在着核函数选择困难、时间复杂度较大的问题，因此直接将高维传感器数据进行非线性融合存在一定难度。本发明考虑将线性融合和非线性融合结合起来，综合二者的优点，能够在处理非线性关系数据的同时降低时间复杂度，达到较好的融合效果。

(1)利用PCA方法进行特征降维，需要对返回的主成分个数进行设定，确定提取的主成分个数直接关系到检测精度，利用方差累计贡献率得到融合维数。为了最大程度保留数据携带的检测信息，本发明方法选择较为保守的主成分选取规则，对于消除数据冗余和保留原始信息之间侧重于后者。

(2)基于LLE进行特征融合，进一步降维。采用PCA对特征进行降维之后的结果具有较好的独立性，但PCA只关注特征的线性关系，而航天器多维数据存在着非线性关系，对这部分关系不加处理直接进行故障检测，会导致模型复杂度过高同时结果受到冗余影响。因此，本发明方法对PCA降维后的结果利用流形学习进行非线性降维，从复杂度和适用性方面，采用LLE作为进一步降维手段。LLE方法能够对非线性关系的航天器多维数据进一步降维，消除模型复杂度过高和避免受到冗余影响。

采用LLE降维操作之后能够保持数据的局部特征和数据原始拓扑。对于航天器多源数据而言，采集频率较高数据量大，能够满足LLE算法对数据采样的稠密要求。同时LLE局部线性保持的特点面对航天器的大量数据能够较快的处理。

具体地，采用LLE算法对PCA降维之后的数据进行处理，包括：首先，利用KNN算法求出每个数据点的k个临近点；其次，计算每个数据点的局部重建权值矩阵；最后，将所有样本点映射到低维空间，设降到d维空间。LLE算法所需参数较少，降维效果受到临近点数量k和本征维数d的影响，k选择过大则无法体现数据点的局部特征，k值过小会使数据降维到低维空间之后无法保持原有的拓扑结构。本征维数d的选择直接反应了低维空间对原始数据的本质特征的刻画，d过大会导致降维效果一般、噪声过多，d过小会使数据点降维后重叠。

本发明针对采样点受到多个变量影响的情况，提出一种结合最小重构误差和剩余方差的k值确定方法。首先确定k的可能取值范围[1,K_max]，对范围内的每个值得到重建误差ε，画出ε,k值对应变化关系，根据平稳性选取候选的k值集合。对于集合内的每个k算出剩余方差e，选择剩余方差最小的k值作为最终的k。剩余方差e定义为：

e＝1-ρ²(D_X,D_Y)

其中ρ为线性相关系数，D_X为高维空间元素X的欧式距离矩阵,D_Y为低维空间元素Y的欧式距离矩阵。X为经PCA降维后的样本集，Y为X经LLE算法映射得到的低维空间样本集合。

同时，针对LLE只能采用批处理的方式处理数据，如图2所示，本发明提出了最近邻投影的增量式LLE算法，增加局部线性模型建立时依赖的近邻点个数，并同时将近邻点来源范围扩展到训练集和已有测试集合。对于测试集样本x_i，设其在训练集和已经完成增量式降维的测试集中的k个最近邻点的矩阵为X_k，所对应的降维后坐标为Y_k矩阵。由于流形具有局部线性，因此可设存在变换矩阵G，使得X_k和Y_k之间存在如下关系：

Y_k＝GX_k

在两边同时乘以X_k的转置矩阵得：

继续在两边同时乘以的逆得：

由此近邻样本间的线性模型得到建立，对样本x_i，嵌入低维的坐标y_i可表示为：

求解样本点x_i的低维投影具体过程如下：

1)在训练集和投影完成的测试样本中得到x_i的k个近邻点。

2)求取近邻点的变换矩阵G。

3)得到x_i的LLE降维结果y_i。将降维得到的样本存入已完成增量式降维的测试集中。

步骤三，对融合后的多源航空数据输入所建立的故障检测模型进行故障检测。

对于LSTM等时间依赖模型的检测方法，故障会在时间层面传播，当依赖的数据存在故障时，这种故障会影响这个时间点之后的数据。

本发明通过下面两方面提出解决方案：(1)提出一种航天器多源数据故障检测模型；(2)从故障标记角度出发，扩大标记范围。下面分别说明。

(1)首先，本发明提出一种航天器多源数据故障检测模型，在保证捕捉数据时需同时具有上下文异常检测能力。

现有的对时间序列故障检测的模型存在着各自的问题，如随机森林故障检测模型只关注点异常无法捕捉数据时序信息；LSTM-VAE故障检测模型对于真实分布模拟能力不够，且VAE容易陷入局部最优，引入LSTM等时间依赖模型的检测方法，故障会在时间层面传播，当依赖的数据存在故障时，这种故障会影响这个时间点之后的数据，由此将产生故障误报。

本发明在建立航天器多源数据故障检测模型时，结合VAE(变分自编码器)和GAN(生成式对抗网络)赋予模型重建能力和对真实分布的模拟能力。如图3所示，VAE模型由编码器(Encoder)和解码器(Decoder)构成，编码器可将原始数据映射到隐空间，解码器可从隐空间中重建原始数据。图3示例中，输入VAE的样本数据X₁,X₂…X₆，由均值方差计算模块计算均值和方差，获取对应的正态分布，进而获得编码数据Z₁,Z₂…Z₆，再由生成器，即编码器对输入样本重建，即根据Z₁,Z₂…Z₆获取生成样本GAN由生成器和判别器构成，生成器重建数据，将原始数据和重建数据一起输入判别器，判别器对数据真假进行判别输出得分。本发明将VAE的解码器作为GAN的生成器。当模型训练好后，VAE的解码器具有重建能力和真实分布模拟能力。数据的时间依赖性不再基于原始数据，VAE的编码器输出的编码数据完成了对原始数据的特征提取。VAE和GAN的结合可简称为V/G模型。

本发明在建立航天器多源数据故障检测模型时，还引入LSTM(长短期记忆)模型，如图4所示，建立特征之间的时间依赖关系，能够捕获更长的时间相关性避免了原始数据带来的干扰，对于长时间依赖的数据能够更好的建模，比较符合航天器多源数据故障形式。本发明的故障检测模型通过VAE的编码器重建LSTM的预测窗口特征。在故障检测阶段也不以重建误差为唯一的故障指标，同时考虑重建窗口误差和重建窗口判别器得分，通过这种手段在检测阶段也同时将窗口级别特征和窗口序列级别特征纳入考察，能增强模型对点异常和上下文异常的检测能力。

如图5所示，本发明将LSTM引入V/G模型编码器和解码器中，V/G模型对以窗口为单位的时间序列进行特征提取，利用LSTM模型寻找更长的时间依赖，利用LSTM预测下一时间窗口特征分布。LSTM模型需要提前设置窗口数量参数m。LSTM训练数据依赖于V/G模型训练完成后的编码器。LSTM训练需要重新组织数据，同样利用滑动窗口技术，设置步长为1，设新窗口长度为m*l，将新窗口数据拆分为m个小窗口分别输入编码器得到一组LSTM训练数据集，l为小窗口内数据长度，本发明实施例此处l设为1。以m-1为步长，LSTM模型训练的输入输出如下式所示：

通过以下公式更新参数

其中，e_p+1，e_p+2，…，e_p+m-1表示LSTM模型的输入样本，是第p+m时刻之前的(m-1)个时间窗口的输入样本；为LSTM的输出，是预测的第p+m时刻的输入样本，e_p+m代表第p+m时刻的真实输入样本；L_Lstm表示LSTM的损失函数，用于更新LSTM的模型参数；n表示时间步总数，m代表窗口个数。

对于本发明提出的融合模型，将VAE的编码器输出作为GAN的生成器，整体模型的损失函数由三部分构成，分别对应编码器、生成器、判别器。每一轮训练需要三部分依次更新参数，将各自的损失函数独立出来。

编码器的损失函数由两部分构成，如下所示：

L_re＝-E_q(z∣x)[logp(x∣z)]

L_kl＝D_KL(q(z∣x)||p(z))

L_Enc＝L_re+L_kl

其中，L_re表示根据后验生成重建模型的损失，L_kl表示根据KL散度计算的损失，L_Enc表示编码器的损失函数；x代表原始观测数据，对应为步骤二融合后数据，z代表原始观测数据的编码数据；E_q(z∣x)表示对后验概率q(z∣x)的期望；p(x∣z)表示在类别为z的条件下输入为x的概率；q(z∣x)表示根据x获取z分布的识别模型，D_KL表示用来衡量q(z∣x)和p(z)的差异熵，p(z)表示z的概率分布。

在编码器的参数更新中引入相似性度量，利用判别器重建误差代替原有重建误差，因此编码器最终损失函数为：

L_Enc＝L_kl-E_q(z∣x)[logp(Dis_h(x)∣z)]

其中，Dis_h(x)为判别器的第h层的隐藏表示。

解码器(生成器)根据所计算的高斯分布的均值和方差，加入噪声后重新采样，获得重建数据样本设解码器根据随机高斯分布进行采样，进行重建得到数据样本/>

生成器的损失函数L_Gen如下：

判别器的损失函数L_Dis如下：

其中，Dis(x)、分别是判别器对原始观测数据x、x的重建样本/>随机重建样本/>的重建误差。

通过训练使得生成器所重建数据样本更加接近原始观测数据，使具有模拟原始观测数据的真实分布能力，而编码器的编码数据也完成了对原始数据的特征提取。判别器输出的评分反映了生成样本和真实样本之间的可用程度和真实程度。

(2)从故障标记角度出发，扩大标记范围，将预测窗口重建误差和判别器得分归一化加权作为故障得分，对参与此轮故障检测的时间序列数据累加异常得分，包括参与预测的窗口和被预测的窗口。对数据点求取最后的故障得分的平均值作为数据点的最终异常得分。

现有基于重建的阈值往往采用某个重建误差或者重建概率来确定，这两种方式都没有考察重建数据的真实分布和原始数据分布的差异。本发明同时在重建误差的基础上引入判别器，考察窗口序列级别的长时间依赖也考虑当前窗口真实分布。

本发明故障检测时，先将要检测的原始观测时序数据切割为n段[w₁,w₂,…,w_n]，将切割后的每段数据输入编码器编码，获得编码数据[e₁,e₂,…,e_n]。利用LSTM对编码数据利用滑动窗口划分数据并进行预测窗口内数据预测。本发明实施例LSTM滑动窗口长度为m，获得预测数据p∈{1,n-m}。生成器对每个编码数据e_i重建得到/>i∈{1,n}。生成器还对每个LSTM预测数据/>重建得到/>p∈{1,n-m}。计算判别器对各/>的重建误差dis。计算LSTM预测数据的重建数据与真实数据的误差/>

计算原始观测时序数据中数据点的故障得分，计算方式为：

当l＝1时，除去开始和结尾的部分数据，位于LSTM预测窗口内的数据data_i将参与预测m次，对于数据data_i，若当前不位于LSTM预测窗口内，则故障得分

其中，是指data_i所参与的当前LSTM的预测窗口内的预测数据由生成器重建的数据，w为对应的原始输入数据。

若数据data_i当前处于LSTM预测窗口内，则故障得分

ts(data_i)＝α*dis(w)+(1-α)*recon(w)

其中，dis(w)是判别器重建误差，α是预先设置的权重。此时，w即data_i。

对数据data_i计算累加的故障得分的平均值来获得数据data_i的最终故障得分。

当l>1时，即LSTM预测窗口内包含l个数据，除去开始和结尾的部分数据，此时位于LSTM预测窗口内的数据将参与预测l*m次，同理，当数据data_i当前不处于LSTM预测窗口内，则故障得分

ts(data_i)＝recon(w)

若数据data_i当前位于LSTM预测窗口内，则故障得分

ts(data_i)＝α*dis(w)+(1-α)*recon(w)

其中，此时data_i为w中的一个数据。

将数据点的最终故障得分与阈值threshold进行比较，若大于阈值，标记该数据点存在故障，否则，表示该数据点不存在故障。阈值threshold可以根据试验来确定和调整。

为了得到最好的threshold，利用一部分测试数据进行交叉验证，这部分数据做5折交叉验证，每次验证得到F1最大时的阈值，将得到的阈值的均值作为剩余部分数据的threshold，得到测试数据集最优的F1分数。

本发明引入LSTM对特征层面的长时间依赖进行捕获，故障会在步长范围内传播。对数据点的故障得分进行累加，同时记录累加次数，通过这两个值得到数据点的平均故障得分，然后将这个值同阈值进行比较，得到故障标记。

在将所述故障检测模型训练好后，对经过步骤一和二处理后的原始观测数据，按照设置的步长和窗口长度进行划分输入故障检测模型。初始化设置故障检测得分和计数器为0，编码器对划分的数据进行编码得到E_data，之后根据滑动窗口大小遍历编码之后的数据，经过LSTM模型对数据进行预测，生成器对编码之后的数据进行重建。得到预测数据和重建数据之间的差异大小，即计算数据点的最终故障得分，根据设定好的阈值threshold进行比较，如果大于设定的阈值计数器加一，之后根据计数器大小和窗口长度的比值，确定故障是否发生。

如图6所示，本发明实施例获取如图所示的原始数据，采用上面步骤一和步骤二进行填充和融合，得到如图7所示的融合数据，然后输入利用步骤三获取的故障检测模型进行检测，获得如图8所示的故障检测结果。经试验证明，采用本发明方法能检测航天器多源数据的故障，且故障识别的准确率比较高。

除说明书所述的技术特征外，均为本专业技术人员的已知技术。本发明省略了对公知组件和公知技术的描述，以避免赘述和不必要地限制本发明。上述实施例中所描述的实施方式也并不代表与本申请相一致的所有实施方式，在本发明技术方案的基础上，本领域技术人员不需要付出创造性的劳动即可做出的各种修改或变形仍在本发明的保护范围内。

Claims

1.一种基于多源数据融合的装备系统健康管理及故障诊断方法，其特征在于，包括如下步骤：

步骤1，对航天器多源数据进行预处理；预处理包括对缺失值的填充，分两种情况如下：

(1.1)对于存在同类传感器数据的缺失值填充，是对同类传感器同一时间点的数据求平均值，作为缺失值，填充到缺失序列中；

(1.2)对于不存在同类传感器数据的缺失值填充，使用时间序列分析ARIMAX模型进行缺失值预测；

步骤2，对航天器多源数据进行融合，包括：

(2.1)对同类传感器数据，采用基于动态支持度的最小二乘融合方法进行融合；所述动态支持度用于筛选要融合的同类传感器数据，将支持度低的同类传感器数据抛弃；

(2.2)对异类传感器数据，先利用主成分分析PCA进行数据降维，再利用局部线性嵌入LLE进行特征融合，降低数据维度；

步骤3，建立航天器多源数据故障检测模型，将步骤2融合后的数据输入该故障检测模型进行故障检测；

所述航天器多源数据故障检测模型构建方式为：将变分自编码器VAE的解码器作为生成式对抗网络GAN的生成器，形成的故障检测模型包括编码器、生成器和判别器；编码器和解码器引入长短期记忆模型LSTM，利用LSTM预测下一时间窗口的输入数据；融合数据作为原始观测数据输入编码器进行编码后，输入生成器重建原始观测数据，生成器输出的生成数据输入判别器，判别器对输入数据进行真假判断；

所述故障检测模型在每一轮训练中，依次更新编码器、生成器和判别器的模型参数，再训练LSTM；

2.根据权利要求1所述的方法，其特征在于，所述的步骤2中，设同类传感器有n个，计算传感器i在t时刻的支持度Z_it如下：

其中，z_ij为传感器i,j相互的支持度，z_ij＝1-d_ij，d_ij为传感器i、j在t时刻的距离，距离d_ij＝|s_it-s_jt|，s_it、s_jt分别为传感器i、传感器j在t时刻的测量值；

预先设置支持度阈值，对低于支持度阈值的同类传感器的数据抛弃，对大于等于支持度阈值的同类传感器数据采用基于最小二乘法加权融合。

3.根据权利要求1所述的方法，其特征在于，所述的步骤2，采用的最近邻投影的增量式LLE算法如下：

(1)将近邻点来源范围扩展到训练集和经增量式LLE算法映射的测试集，如下：

对测试集中的样本x_i，在训练集和经增量式LLE算法映射的测试集中寻找k个近邻点；i为样本编号；

(2)求取近邻点的变换矩阵G；

设样本x_i的k个近邻点的矩阵为X_k，经增量式LLE算法投影降维后的得到矩阵Y_k；设存在变换矩阵G，使得Y_k＝GX_k，经推到得到G＝Y_kX_k ^T(X_kX_k ^T)^-1；

(3)得到样本x_i经增量式LLE算法投影降维后的结果y_i＝Gx_i；将y_i放入经增量式LLE算法映射的测试集中。

4.根据权利要求1或3所述的方法，其特征在于，所述的步骤2中，在使用LLE算法时，通过如下方式确定近邻点数量k的值：

首先确定k的取值范围[1,K_max]，对该范围内的每个值获取样本重建误差ε，画出ε和k的对应变化关系，根据平稳性选取k值的候选集合；然后对候选集合内的每个k计算剩余方差e，选择其中剩余方差最小的k值作为最终的k值；其中剩余方差e定义为：e＝1-ρ²(D_X,D_Y)；其中，ρ为线性相关系数，Y为对高维空间样本集X使用LLE算法降维得到的低维空间样本集，D_X为X的欧式距离矩阵，D_Y为Y的欧式距离矩阵。

5.根据权利要求1所述的方法，其特征在于，所述的步骤3中，训练编码器、生成器和判别器的模型参数时，将各自的损失函数独立出来，其中：

编码器参数更新时，利用判别器重建误差代替原有重建误差，则建立编码器损失函数

L_Enc＝L_kl-E_q(z_∣x₎[logp(Dis_h(x)∣z)]

其中，L_kl为根据KL散度计算的损失，Dis_h(x)为判别器第h层的隐藏表示，z代表编码器对原始观测数据的编码数据，q(z∣x)表示根据x获取z分布的识别模型，E_q(z_∣x₎为q(z∣x)的期望；

生成器的损失函数

判别器的损失函数

其中，L_re表示根据后验生成重建模型的损失，Dis(x)表示判别器对原始观测数据x的重建误差；生成器对x的重建数据为生成器根据随机高斯分布进行采样生成的重建数据为分别表示判别器对/>的重建误差。

6.根据权利要求1或5所述的方法，其特征在于，所述的步骤3中，在每一轮训练中，编码器、生成器和判别器的模型参数更新后，再训练LSTM，对于编码器中的LSTM，预先设置窗口数量和窗口长度，利用滑动窗口拆分编码数据，生成LSTM训练数据集，对LSTM模型参数进行训练。

7.根据权利要求1或5所述的方法，其特征在于，所述的步骤3中，计算数据点的故障得分的方式如下：

对于数据点data_i，若该数据点当前不处于LSTM预测窗口内，则故障得分

其中，设data_i所参与的当前LSTM的预测窗口内的预测数据为是生成器由/>重建的数据，w为对应当前LSTM的预测窗口的原始输入数据；

若数据data_i当前位于LSTM预测窗口内，则故障得分

ts(data_i)＝α*dis(w)+(1-α)*recon(w)

其中，α是预先设置的权重；dis(w)为判别器对w的重建误差，此时data_i为w中的一个数据；