CN113837226A - 基于不确定性估计的飞行器遥测参数异常检测方法 - Google Patents
基于不确定性估计的飞行器遥测参数异常检测方法 Download PDFInfo
- Publication number
- CN113837226A CN113837226A CN202110981317.8A CN202110981317A CN113837226A CN 113837226 A CN113837226 A CN 113837226A CN 202110981317 A CN202110981317 A CN 202110981317A CN 113837226 A CN113837226 A CN 113837226A
- Authority
- CN
- China
- Prior art keywords
- parameter
- detected
- aircraft
- parameters
- parameter set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 35
- 238000012360 testing method Methods 0.000 claims abstract description 72
- 230000004927 fusion Effects 0.000 claims abstract description 69
- 238000000034 method Methods 0.000 claims abstract description 55
- 238000012512 characterization method Methods 0.000 claims abstract description 32
- 230000036541 health Effects 0.000 claims abstract description 15
- 238000005259 measurement Methods 0.000 claims abstract description 5
- 238000012549 training Methods 0.000 claims description 48
- 210000002569 neuron Anatomy 0.000 claims description 38
- 238000013528 artificial neural network Methods 0.000 claims description 31
- 239000011159 matrix material Substances 0.000 claims description 22
- 230000002159 abnormal effect Effects 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 9
- 238000012847 principal component analysis method Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 8
- 230000005856 abnormality Effects 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 7
- 238000011478 gradient descent method Methods 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 2
- 239000010410 layer Substances 0.000 description 31
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 5
- 238000000513 principal component analysis Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000009499 grossing Methods 0.000 description 3
- 230000002779 inactivation Effects 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Radar Systems Or Details Thereof (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明公开了基于不确定性估计的飞行器遥测参数异常检测方法,属于数据处理技术领域,解决现有方法中不能反映模型估计的置信度和过度拟合的问题。本发明的方法包括:建立基于LSTM的飞行器多元遥测参数不确定性表征估计模型;获取飞行器多元遥测参数的测试参数集和待检测参数的测试数据,对测试参数集进行特征选取;对测试特征参数集进行特征融合;将测试融合特征参数集重复输入到基于LSTM的飞行器多元遥测参数不确定性表征估计模型,获得待检测参数的估计值集合;获得待检测参数的平滑动态阈值区间;根据待检测参数的平滑动态阈值区间和待检测参数的测试数据,判断飞行器的健康状态。本发明适用于对飞行器遥测参数进行异常检测。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及基于不确定性估计的飞行器遥测参数异常检测方法。
背景技术
随着航天科技的飞速发展,飞行器面临着任务复杂性增加、性能要求增加和项目成本增加的挑战,其系统的结构越来越复杂,内部的子系统、子系统内部的设备和设备内部的模块之间的关联程度更加紧密。即使一个小故障也可能引起连锁反应,危及整个飞行器的安全。这对飞行器测试和维护的可靠性、安全性和准确性提出了新的更高要求。
遥测数据是反映飞行器系统状态的重要支撑,及时监测其运行状态,并采取相应的措施可以避免运行异常或者故障的发生。飞行器遥测数据是一组随时间变化的时间序列数据,在时间上反映出具有一定变化状态的特征。近年来,时间序列的异常检测方法主要采用基于数据驱动的模型,深度学习算法是基于数据驱动方法的研究热点之一,此类算法可以深度提取多元参数数据的特征并通过训练学习,从而估计表征值。但是深度学习大多采用最大似然估计或者最大后验来训练,因此产生的是点估计值,并不能反映模型估计的置信度。同时,深度学习的深层次和非线性的神经网络会导致过度拟合,所提出的不确定性引入很大程度上避免了过度拟合。
发明内容
本发明目的是为了解决现有方法中不能反映模型估计的置信度和过度拟合的问题,提供了基于不确定性估计的飞行器遥测参数异常检测方法。
本发明是通过以下技术方案实现的,本发明一方面,提供基于不确定性估计的飞行器遥测参数异常检测方法,所述方法包括:
建立基于LSTM的飞行器多元遥测参数不确定性表征估计模型;
获取飞行器多元遥测参数的测试参数集和待检测参数的测试数据,根据所述基于LSTM的飞行器多元遥测参数不确定性表征估计模型,对所述测试参数集进行特征选取,获得所述测试特征参数集;
对所述测试特征参数集进行特征融合,获得测试融合特征参数集;
设置输入次数,根据所述输入次数,将所述测试融合特征参数集重复输入到所述基于LSTM的飞行器多元遥测参数不确定性表征估计模型,获得所述待检测参数的估计值集合;
根据所述待检测参数的估计值集合,获得待检测参数的平滑动态阈值区间;
根据所述待检测参数的平滑动态阈值区间和所述待检测参数的测试数据,判断飞行器的健康状态。
进一步地,所述建立基于LSTM的飞行器多元遥测参数不确定性表征估计模型,具体包括:
获取飞行器多元遥测参数的训练参数集和待检测参数的训练数据;
对所述训练参数集进行预处理,具体包括:
利用最大互信息系数方法对所述训练参数集进行特征提取,获取所述待检测参数的特征参数集;
利用主成分分析方法对所述特征参数集进行特征融合,获得融合特征参数集;
根据所述融合特征参数集和所述待检测参数的训练数据,建立基于LSTM的飞行器多元遥测参数不确定性表征估计模型。
进一步地,所述利用最大互信息系数方法对所述训练参数集进行特征提取,获取所述待检测参数的特征参数集,具体包括:
根据最大互信息系数方法,获取待检测参数与所述训练参数集中所有参数的最大互信息系数;
设置所述最大互信息系数的阈值,根据所述阈值选取与所述待检测参数相关的参数,根据所述待检测参数相关的参数获取所述待检测参数的特征参数集。
进一步地,所述利用主成分分析方法对所述特征参数集进行特征融合,获得融合特征参数集,具体为:
对所述特征参数集进行标准化,获得标准化特征参数集;
获取所述标准化参数特征集的协方差矩阵;
获取所述协方差矩阵的特征向量矩阵和特征矩阵;
根据所述特征向量矩阵和所述特征矩阵,获取所述标准化特征参数的主成分贡献率;
设置所述融合特征参数集的参数维度,将所述主成分贡献率按照由大到小的顺序排列,选取前所述参数维度个主成分贡献率对应的特征参数作为所述融合特征参数集中的元素,获得融合特征参数集。
进一步地,根据所述融合特征参数集和所述待检测参数的训练数据,建立基于LSTM的飞行器多元遥测参数不确定性表征估计模型,具体包括:
步骤1、建立LSTM神经网络,在所述LSTM神经网络层与输出层之间设置不确定性概率;
步骤2、根据所述不确定性概率,令所述LSTM神经网络层中的神经元服从伯努利分布,设置与失活神经元相连接的权重为零,其中,所述神经元包括失活神经元和激活神经元,所述神经元为失活神经元时的概率为所述不确定性概率,与神经元相连接的权重包括LSTM神经网络层到输出层的权重和输入层到LSTM神经网络层的权重;
步骤3、根据所述融合特征参数集、所述待检测参数的训练数据、所述不确定性概率、所述与神经元相连接的权重,建立融合特征参数集到待检测参数的回归映射;
步骤4、利用梯度下降法更新所述与神经元相连接的权重,其中,通过引入不确定性概率,对所述LSTM神经网络层到输出层的权重进行更新,根据所述更新后的与神经元相连接的权重,设置步骤2中的所述与神经元相连接的权重;
步骤5、设置迭代更新次数,根据所述迭代更新次数,重复步骤2到步骤4,实现对所述融合特征参数集到待检测参数的回归映射的训练;
步骤6、根据所述训练后的融合特征参数集到待检测参数的回归映射,建立所述基于LSTM的飞行器多元遥测参数表征估计模型。
进一步地,所述通过引入不确定性概率,对所述LSTM神经网络层到输出层的权重进行更新,具体包括:
步骤1、建立所述所述融合特征参数集到待检测参数的回归映射的最小二乘法损失函数;
步骤2、根据所述最小二乘法损失函数和不确定性概率,利用梯度下降法,获得LSTM神经网络层到输出层的网络梯度;
步骤3、根据所述网络梯度,对所述LSTM神经网络层到输出层的权重进行更新。
进一步地,所述对所述测试特征参数集进行特征融合,获得测试融合特征参数集,具体包括:利用主成分分析方法对所述测试特征参数集进行特征融合,获得测试融合特征参数集。
进一步地,根据所述待检测参数的估计值集合,获得待检测参数的平滑动态阈值区间,具体包括:
根据所述待检测参数的估计值集合,获取所述估计值集合的均值和标准差;
设置置信度,并根据所述均值和标准差,采用拉依达准则,获取每个时刻的待检测参数的动态阈值区间;
根据所述每个时刻的待检测参数的动态阈值区间,采用均值滤波方法,获取所述待检测参数的平滑动态阈值区间。
进一步地,根据所述待检测参数的平滑动态阈值区间和所述待检测参数的测试数据,判断飞行器的健康状态,具体包括:
若所述待检测参数的测试数据在所述所述待检测参数的平滑动态阈值区间内,判断飞行器的健康状态为正常;
若所述待检测参数的测试数据不在所述所述待检测参数的平滑动态阈值区间内,判断飞行器的健康状态为异常。
另一方面,本发明提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,当所述处理器运行所述存储器存储的计算机程序时执行如上文所述的基于不确定性估计的飞行器遥测参数异常检测方法的步骤。
本发明的有益效果:
LSTM能够有效地分析长短时时间序列数据信息及提取时间序列特征。因此,本发明根据神经元失活的不确定性,采用基于LSTM不确定性表征模型估计实现遥测数据的异常检测。
首先,本发明通过特征融合,降低参数维度,来表征多元遥测参数,从而提高评估模型效果,使模型泛化能力更强,减少过拟合;另外,不确定性概率的引入使神经元随机失活也可以防止过拟合。
其次,针对这些参数的历史遥测数据融合信息,构建基于LSTM不确定性的状态估计表征模型;利用所建立模型对待检测参数迭代进行不确定表征估计,通过点估计值获取每一预测时刻下估计值的统计量,并设置置信度,从而得到动态阈值区间,解决了现有技术不能反映模型估计的置信度的问题。
再次,本发明还通过对所有参数进行特征提取,选出相关联参数,从而获取这些原始的信号中抽取待检测参数具有高敏感性、高鲁棒性和高可靠性的特征。
为实现飞行器多元遥测参数的异常检测,本发明提出一种基于LSTM不确定性表征估计的异常检测方法。设计的LSTM不确定性表征方法是利用建立不确定性神经网络模型,使神经元随机性失活,在推理过程中,产生具有不确定性的估计值,生成动态平滑阈值区间,即根据数据随着时间变化的特性自适应调整待检测参数处于正常状态的估计值范围,结果表明所提方法的异常检测准确率高于95%,则证明所提出方法对飞行器遥测数据异常检测的有效性。
本发明适用于对飞行器遥测参数进行异常检测,监测其健康状态,保证飞行器运行的可靠性和安全性。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为基于不确定性估计的飞行器遥测参数异常检测方法的基本原理图;
图2为本发明的LSTM不确定性神经网络的原理图;
图3为本发明具体实施例的待检测参数的训练数据;
图4为本发明具体实施例的待检测参数的测试数据;
图5为本发明具体实施例的待检测参数估计值的平滑上限、平滑下限和实际值;
图6为本发明具体实施例的异常检测结果示意图。
具体实施方式
如图1所示,实施方式一、本实施方式所述的一种基于不确定性估计的飞行器遥测参数异常检测方法,所述方法包括:
建立基于LSTM的飞行器多元遥测参数不确定性表征估计模型;
获取飞行器多元遥测参数的测试参数集和待检测参数的测试数据,根据所述基于LSTM的飞行器多元遥测参数不确定性表征估计模型,对所述测试参数集进行特征选取,获得所述测试特征参数集;
对所述测试特征参数集进行特征融合,获得测试融合特征参数集;
设置输入次数,根据所述输入次数,将所述测试融合特征参数集重复输入到所述基于LSTM的飞行器多元遥测参数不确定性表征估计模型,获得所述待检测参数的估计值集合;
根据所述待检测参数的估计值集合,获得待检测参数的平滑动态阈值区间;
根据所述待检测参数的平滑动态阈值区间和所述待检测参数的测试数据,判断飞行器的健康状态。
实施方式二、本实施方式是对本实施方式所述的一种基于不确定性估计的飞行器遥测参数异常检测方法中、所述建立基于LSTM的飞行器多元遥测参数不确定性表征估计模型的构建方法做进一步限定,所述方法具体包括:
获取飞行器多元遥测参数的训练参数集和待检测参数的训练数据;
对所述训练参数集进行预处理,具体包括:
利用最大互信息系数方法对所述训练参数集进行特征提取,获取所述待检测参数的特征参数集;
利用主成分分析方法对所述特征参数集进行特征融合,获得融合特征参数集;
根据所述融合特征参数集和所述待检测参数的训练数据,建立基于LSTM的飞行器多元遥测参数不确定性表征估计模型。
实施方式三、本实施方式是对实施方式二所述的基于不确定性估计的飞行器遥测参数异常检测方法中,所述利用最大互信息系数方法对所述训练参数集进行特征提取,获取所述待检测参数的特征参数集的方法的进一步限定,所述方法包括:
根据最大互信息系数方法,获取待检测参数与所述训练参数集中所有参数的最大互信息系数;
设置所述最大互信息系数的阈值,根据所述阈值选取与所述待检测参数相关的参数,根据所述待检测参数相关的参数获取所述待检测参数的特征参数集。
实施方式四、本实施方式是对实施方式二所述的基于不确定性估计的飞行器遥测参数异常检测方法中,所述利用主成分分析方法对所述特征参数集进行特征融合,获得融合特征参数集的方法的进一步限定,所述方法具体包括:
对所述特征参数集进行标准化,获得标准化特征参数集;
获取所述标准化参数特征集的协方差矩阵;
获取所述协方差矩阵的特征向量矩阵和特征矩阵;
根据所述特征向量矩阵和所述特征矩阵,获取所述标准化特征参数的主成分贡献率;
设置所述融合特征参数集的参数维度,将所述主成分贡献率按照由大到小的顺序排列,选取前所述参数维度个主成分贡献率对应的特征参数作为所述融合特征参数集中的元素,获得融合特征参数集。
实施方式五、本实施方式是对实施方式二所述的基于不确定性估计的飞行器遥测参数异常检测方法中,所述根据所述融合特征参数集和所述待检测参数的训练数据,建立基于LSTM的飞行器多元遥测参数不确定性表征估计模型的进一步限定,所述方法具体包括
步骤1.建立基于LSTM的飞行器多元遥测参数不确定性表征估计模型,多元遥测参数表征建模主要分为以下两步:(1)利用特征提取、特征融合以及数据标准化,实现多元遥测参数预处理;(2)提出一种基于LSTM不确定性算法实现待检测参数的状态估计模型训练,训练过程中的多元遥测参数数据均无异常。具体步骤如下:
步骤1.1、获取飞行器多元遥测参数的训练参数集和待检测参数,飞行器多元遥测参数的训练参数集为时间序列待检测参数的实际值,即获取的待检测参数的训练数据为Y=[y1,y2,…yL],其中d为遥测参数的维度,L为参数样本总长度。
步骤1.2对所述训练参数集进行预处理,具体步骤如下:
步骤1.2.1利用最大互信息系数方法对所述训练参数集进行特征提取,获取所述待检测参数的特征参数集,具体如下:
遥测数据之间呈现线性或者非线性关系,为了准确地挖掘参数之间关系,本发明采用最大互信息系数(Maximal Information Coefficient,MIC)方法提取遥测数据的特征参数,MIC方法具体如下:
对于任一有限两元数据集合D={xmi,xni),i=1,2,…,L},其中xmi和xni分别为第m和第n维参数数据。如果将□轴划分为x个格子,□轴划分为y个格子,可以得到一个x×y的网格划分G,将落入G的点的数量占数据集D数量的比例看作其概率密度D|G,而根据不同的网格划分情况得到的概率分布D|G也不同。如此,MIC的定义如下:
给定一个有限两元变量的数据集D,设G为x×y的网格划分,I(D|G)为集合D在划分G下的互信息,则
I*(D,x,y)=maxGI(D|G) (1)
其中max取遍所有可能的x×y网格G,则MIC可定义为:
其中B为可搜寻网格的上界,控制了MIC能够检测的相关关系的复杂度。上式可得到各参数间的最大互相关系数,根据专家经验,设置最大互信息系数阈值,选取与待检测参数相关的参数项,得到特征提取后的数据集,即为特征参数集Xsel=[x11,x22,…,xSL],其中S为特征提取后的参数维度。
步骤1.2.2利用主成分分析方法对所述特征参数集进行特征融合,获得融合特征参数集,飞行器的遥测数据特征提取选取了与待检测参数相关的参数,仍可能有较高的特征维数,会造成计算资源的消耗以及维数灾难等问题。提取后的特征参数不仅与待检测参数紧密关联,参数之间也相互关联。因此,可以对特征参数集进行特征融合。主成分分析(Principle component analysis,PCA)方法能够用较少的主成分来表示数据,实现特征的降维,还可以消除数据的噪声。本发明采用PCA方法实现特征融合技术,具体实现步骤如下:
首先,对特征参数集数据集Xsel进行标准化,表示如下:
计算R的特征向量矩阵M以及特征矩阵N,公式如下:
RM=MN (5)
根据矩阵M和N,计算输入数据的主成分贡献率Qk。其计算公式如下:
其中λk为特征值,设置特征融合后的参数维度为S',根据主成分的贡献率,选择贡献率大的数据,得到特征融合后的特征参数矩阵,即为融合特征参数集Xfu=[x11,x22,…,xS'L]。
步骤1.3、根据所述融合特征参数集和所述待检测参数的训练数据,建立基于LSTM的飞行器多元遥测参数不确定性表征估计模型,具体步骤如下:
基于LSTM不确定性算法实现Xfu到Y的回归映射,LSTM网络由遗忘门、输入门和输出门组成,遗忘门ft、输入门it、输出门ot、第t时刻隐藏状态ht和细胞状态ct更新如下:
ft=σ(wf·[ht-1,xt]+bf) (8)
it=σ(wi·[ht-1,xt]+bi) (9)
ot=σ(wo·[ht-1,xt]+bo) (12)
ht=ot*tanh(ct) (13)
其中,ht-1和ct-1分别为第t-1时刻的隐藏状态和细胞状态,wf、wi、wo和wc分别是遗忘门、输入门、输出门和细胞中间状态的连接权重,bf、bi、bo和bc分别是上述权重相对应的偏置,σ为sigmoid激活函数,tanh为双曲正切激活函数。
构建LSTM不确定性神经网络,如图2所示,是一个标准的时刻t下的单层LSTM神经网络,在LSTM层与输出层之间设置不确定性概率p,假设神经网络层有K个神经元,当神经元失活时状态为C=0,神经元被激活时状态为C=1,使神经网络层神经元为随机状态服从概率p的伯努利分布,可表示如下:
Pr(C=0)=p,Pr(C=1)=1-p,0<p<1 (14)
其中,Pr(·)表示符合括号内条件的数据个数占总数据个数的概率。
给定不确定概率p,神经元服从伯努利分布,随机失活。当神经元失活时,与失活神经元相连接的权重值均为0,时刻t输出可表示为:
其中,wjt为LSTM神经网络层到输出层的权重,bj可表示为
其中,wij为输入层到LSTM神经网络层的权重,在网络训练中,使用最小二乘损失函数进行模型评估,即:
网络训练采用梯度下降法反向传播,因此,带有不确定性的LSTM神经网络层到输出层的网络梯度和输入层到LSTM神经网络层的网络梯度分别为:
更新LSTM神经网络层到输出层的权重和输入层到LSTM神经网络层的权重,可表达为:
其中η表示学习率,设置权重更新的迭代次数为Nw次,不断迭代更新。即神经元仍以不确定性概伯努利分布,使神经元以概率p随机性失活,其他神经元被激活,依照公式(15)至(19),更新权重值。
上式(18)的期望值可表示为:
其中E(·)表示期望,为未引入不确定性的损失函数。由此可见,引入不确定性后的网络梯度的期望等同于正则网络,因此,不确定性神经网络可以防止过拟合,提高预测准确率。而且神经元会服从伯努利分布,失活或者激活状态具有随机性,可以为推理过程提供不确定表征模型。
步骤2、获取飞行器多元遥测参数的测试参数集和待检测参数的测试数据,根据所述基于LSTM的飞行器多元遥测参数不确定性表征估计模型,对所述测试参数集进行特征选取,获得所述测试特征参数集,具体为:
对测试参数集实现特征选取,选取与基于LSTM的飞行器多元遥测参数不确定性表征估计模型中特征选取实现的相同的参数数据,即根据所述训练参数集对应的特征参数集中的特征参数,在所述测试参数集对应的测试特征参数集中选取与其相同的特征参数。
步骤3、对所述测试特征参数集进行特征融合,获得测试融合特征参数集,具体为:
利用对训练参数集的PCA(主成分分析)特征融合模型,对特征提取后的测试参数(即测试特征参数集)进行特征融合,得到特征融合后的测试数据,即为测试融合特征参数集Xtest,融合后的特征维度与训练参数集融合后的特征维度相同。
步骤4、设置输入次数,根据所述输入次数,将所述测试融合特征参数集重复输入到所述基于LSTM的飞行器多元遥测参数不确定性表征估计模型,获得所述待检测参数的估计值集合,具体为:
在推理过程中,将特征融合后的测试数据Xtest通过基于LSTM的飞行器多元遥测参数不确定性表征估计模型,得到待检测参数估计值重复将Xtest通过基于LSTM的飞行器多元遥测参数不确定性表征估计模型fLSTM(Xfu)N次,得到时间序列估计值集合P为预测样本总长度。
根据所述待检测参数的估计值集合,获得待检测参数的平滑动态阈值区间,具体为:
设置滑动窗口大小为w,采用均值滤波方法平滑阈值上限和下限,计算第t个样本的平滑下限为
第t个样本的平滑上限为
其中mean(·)表示计算均值。
步骤5、根据所述待检测参数的平滑动态阈值区间和所述待检测参数的测试数据,判断飞行器的健康状态,具体为:
若待检测参数的实际值,即待检测参数的测试数据yt不在待检测参数的平滑动态阈值区间内,则为异常,并发出警告,反之,无异常,即为:
若所述待检测参数的测试数据在所述所述待检测参数的平滑动态阈值区间内,判断飞行器的健康状态为正常;
若所述待检测参数的测试数据不在所述所述待检测参数的平滑动态阈值区间内,判断飞行器的健康状态为异常。
为实现飞行器多元遥测参数的异常检测,本发明提出一种基于LSTM不确定性表征估计的异常检测方法。设计的LSTM不确定性表征方法是利用建立不确定性神经网络模型,使神经元随机性失活,在推理过程中,产生具有不确定性的估计值,生成动态平滑阈值区间,即根据数据随着时间变化的特性自适应调整待检测参数处于正常状态的估计值范围,结果表明所提方法的异常检测准确率高于95%,则证明所提出方法对飞行器遥测数据异常检测的有效性。
本发明的主要目的是通过对飞行器遥测参数进行异常检测,监测其健康状态,保证飞行器运行的可靠性和安全性。本发明采用某飞行器的电源分系统的参数进行分析,包含蓄电池组等各模块的电压、电流及温度、母线电压及电流、和分流器温度等65维参数。并且飞行器的很多遥测参数之间存在相关关系,所以,首先对所有参数进行特征提取,选出相关联参数,从这些原始的信号中抽取待检测参数具有高敏感性、高鲁棒性和高可靠性的特征;然后对选择的参数进行特征融合,降低数据维数来表征多元数据,从而提高评估模型效果,使模型泛化能力更强,减少过拟合;针对这些参数的历史遥测数据融合信息,构建基于LSTM不确定性的状态估计表征模型;利用所建立模型对待检测参数迭代进行不确定表征估计,每一时刻得到N个估计值集合,计算每一预测时刻下估计值的统计量,得到动态阈值区间,进行均值滤波平滑处理后,与实际值对比,若实际值超过设定阈值,则此时刻发生异常,并给予异常告警警告。
本案例中以某型号飞行器电源系统的遥测参数作为模型的输入,其中包含蓄电池组和太阳阵等各模块的电压、电流及温度、母线电压及电流、A路及B路充电阵电流、A路及B路放电开关状态和分流器温度等65维参数。将A组蓄电池电压作为检测参数,样本点总长度为1214,前750个正常样本数据用于模型训练,后464个带有异常点的样本数据用于模型测试,其中样本点[106,125]间发生异常,用于模型训练的和用于模型测试的待检测参数数据分别如图3、图4所示。
将上述65维参数的训练参数集带入本发明中“多元遥测参数表征建模”部分,通过公式(1)和公式(2)实现特征提取,发现太阳阵电压、太阳阵电流、多个太阳阵温度、A路及B路充电阵电流、其他蓄电池组电压、多个蓄电池组温度等34个参数与待检测参数相关性较强。
特征提取后的维度仍然很高,因此,利用公式(3)至公式(7)对训练参数集和测试参数集均进行特征融合降低参数维度,降低后的维度为4维,然后根据公式(3),将训练参数集带入基于LSTM的飞行器多元遥测参数不确定性表征估计模型中进行训练,得到回归模型。
基于LSTM的飞行器多元遥测参数不确定性表征估计模型,对特征融合后的测试集数据进行异常检测,不确定性表征估计值上下限阈值如图5所示,实际值表示待检测参数的测试数据的实际值,图5显示有部分实际值超出阈值包络,图6表示异常检测结果,数值“1”表示异常点,被检测到的异常点为样本区间为[31,34],[106,125],[138,139],已知此数据在区间[106,125]为异常数据,则区间[31,34],[138,139]为虚警,检测准确率为98.7%,高于95%,说明所提出算法有效度高。
Claims (10)
1.基于不确定性估计的飞行器遥测参数异常检测方法,其特征在于,所述方法包括:
建立基于LSTM的飞行器多元遥测参数不确定性表征估计模型;
获取飞行器多元遥测参数的测试参数集和待检测参数的测试数据,根据所述基于LSTM的飞行器多元遥测参数不确定性表征估计模型,对所述测试参数集进行特征选取,获得所述测试特征参数集;
对所述测试特征参数集进行特征融合,获得测试融合特征参数集;
设置输入次数,根据所述输入次数,将所述测试融合特征参数集重复输入到所述基于LSTM的飞行器多元遥测参数不确定性表征估计模型,获得所述待检测参数的估计值集合;
根据所述待检测参数的估计值集合,获得待检测参数的平滑动态阈值区间;
根据所述待检测参数的平滑动态阈值区间和所述待检测参数的测试数据,判断飞行器的健康状态。
2.根据权利要求1所述的基于不确定性估计的飞行器遥测参数异常检测方法,其特征在于,所述建立基于LSTM的飞行器多元遥测参数不确定性表征估计模型,具体包括:
获取飞行器多元遥测参数的训练参数集和待检测参数的训练数据;
对所述训练参数集进行预处理,具体包括:
利用最大互信息系数方法对所述训练参数集进行特征提取,获取所述待检测参数的特征参数集;
利用主成分分析方法对所述特征参数集进行特征融合,获得融合特征参数集;
根据所述融合特征参数集和所述待检测参数的训练数据,建立基于LSTM的飞行器多元遥测参数不确定性表征估计模型。
3.根据权利要求2所述的基于不确定性估计的飞行器遥测参数异常检测方法,其特征在于,所述利用最大互信息系数方法对所述训练参数集进行特征提取,获取所述待检测参数的特征参数集,具体包括:
根据最大互信息系数方法,获取待检测参数与所述训练参数集中所有参数的最大互信息系数;
设置所述最大互信息系数的阈值,根据所述阈值选取与所述待检测参数相关的参数,根据所述待检测参数相关的参数获取所述待检测参数的特征参数集。
4.根据权利要求2所述的基于不确定性估计的飞行器遥测参数异常检测方法,其特征在于,所述利用主成分分析方法对所述特征参数集进行特征融合,获得融合特征参数集,具体为:
对所述特征参数集进行标准化,获得标准化特征参数集;
获取所述标准化参数特征集的协方差矩阵;
获取所述协方差矩阵的特征向量矩阵和特征矩阵;
根据所述特征向量矩阵和所述特征矩阵,获取所述标准化特征参数的主成分贡献率;
设置所述融合特征参数集的参数维度,将所述主成分贡献率按照由大到小的顺序排列,选取前所述参数维度个主成分贡献率对应的特征参数作为所述融合特征参数集中的元素,获得融合特征参数集。
5.根据权利要求2所述的基于不确定性估计的飞行器遥测参数异常检测方法,其特征在于,所述根据所述融合特征参数集和所述待检测参数的训练数据,建立基于LSTM的飞行器多元遥测参数不确定性表征估计模型,具体包括:
步骤1、建立LSTM神经网络,在所述LSTM神经网络层与输出层之间设置不确定性概率;
步骤2、根据所述不确定性概率,令所述LSTM神经网络层中的神经元服从伯努利分布,设置与失活神经元相连接的权重为零,其中,所述神经元包括失活神经元和激活神经元,所述神经元为失活神经元时的概率为所述不确定性概率,与神经元相连接的权重包括LSTM神经网络层到输出层的权重和输入层到LSTM神经网络层的权重;
步骤3、根据所述融合特征参数集、所述待检测参数的训练数据、所述不确定性概率、所述与神经元相连接的权重,建立融合特征参数集到待检测参数的回归映射;
步骤4、利用梯度下降法更新所述与神经元相连接的权重,其中,通过引入不确定性概率,对所述LSTM神经网络层到输出层的权重进行更新,根据所述更新后的与神经元相连接的权重,设置步骤2中的所述与神经元相连接的权重;
步骤5、设置迭代更新次数,根据所述迭代更新次数,重复步骤2到步骤4,实现对所述融合特征参数集到待检测参数的回归映射的训练;
步骤6、根据所述训练后的融合特征参数集到待检测参数的回归映射,建立所述基于LSTM的飞行器多元遥测参数表征估计模型。
6.根据权利要求5所述的基于不确定性估计的飞行器遥测参数异常检测方法,其特征在于,所述通过引入不确定性概率,对所述LSTM神经网络层到输出层的权重进行更新,具体包括:
步骤1、建立所述融合特征参数集到待检测参数的回归映射的最小二乘法损失函数;
步骤2、根据所述最小二乘法损失函数和不确定性概率,利用梯度下降法,获得LSTM神经网络层到输出层的网络梯度;
步骤3、根据所述网络梯度,对所述LSTM神经网络层到输出层的权重进行更新。
7.根据权利要求1所述的基于不确定性估计的飞行器遥测参数异常检测方法,其特征在于,所述对所述测试特征参数集进行特征融合,获得测试融合特征参数集,具体包括:利用主成分分析方法对所述测试特征参数集进行特征融合,获得测试融合特征参数集。
8.根据权利要求1所述的基于不确定性估计的飞行器遥测参数异常检测方法,其特征在于,根据所述待检测参数的估计值集合,获得待检测参数的平滑动态阈值区间,具体包括:
根据所述待检测参数的估计值集合,获取所述估计值集合的均值和标准差;
设置置信度,并根据所述均值和标准差,采用拉依达准则,获取每个时刻的待检测参数的动态阈值区间;
根据所述每个时刻的待检测参数的动态阈值区间,采用均值滤波方法,获取所述待检测参数的平滑动态阈值区间。
9.根据权利要求1所述的基于不确定性估计的飞行器遥测参数异常检测方法,其特征在于,根据所述待检测参数的平滑动态阈值区间和所述待检测参数的测试数据,判断飞行器的健康状态,具体包括:
若所述待检测参数的测试数据在所述待检测参数的平滑动态阈值区间内,判断飞行器的健康状态为正常;
若所述待检测参数的测试数据不在所述待检测参数的平滑动态阈值区间内,判断飞行器的健康状态为异常。
10.一种计算机设备,其特征在于:包括存储器和处理器,所述存储器中存储有计算机程序,当所述处理器运行所述存储器存储的计算机程序时,所述处理器执行根据权利要求1-9中任一项中所述的基于不确定性估计的飞行器遥测参数异常检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110981317.8A CN113837226B (zh) | 2021-08-25 | 2021-08-25 | 基于不确定性估计的飞行器遥测参数异常检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110981317.8A CN113837226B (zh) | 2021-08-25 | 2021-08-25 | 基于不确定性估计的飞行器遥测参数异常检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113837226A true CN113837226A (zh) | 2021-12-24 |
CN113837226B CN113837226B (zh) | 2024-08-20 |
Family
ID=78961195
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110981317.8A Active CN113837226B (zh) | 2021-08-25 | 2021-08-25 | 基于不确定性估计的飞行器遥测参数异常检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113837226B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117454212A (zh) * | 2023-12-25 | 2024-01-26 | 中国西安卫星测控中心 | 一种基于数据聚类的遥测数据互检测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109934337A (zh) * | 2019-03-14 | 2019-06-25 | 哈尔滨工业大学 | 一种基于集成lstm的航天器遥测数据异常的检测方法 |
CN113035280A (zh) * | 2021-03-02 | 2021-06-25 | 四川大学 | 一种基于深度学习的rbp结合位点预测算法 |
US20210201112A1 (en) * | 2019-12-30 | 2021-07-01 | Element Ai Inc. | Method of and server for training a machine learning algorithm for estimating uncertainty of a sequence of models |
-
2021
- 2021-08-25 CN CN202110981317.8A patent/CN113837226B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109934337A (zh) * | 2019-03-14 | 2019-06-25 | 哈尔滨工业大学 | 一种基于集成lstm的航天器遥测数据异常的检测方法 |
US20210201112A1 (en) * | 2019-12-30 | 2021-07-01 | Element Ai Inc. | Method of and server for training a machine learning algorithm for estimating uncertainty of a sequence of models |
CN113035280A (zh) * | 2021-03-02 | 2021-06-25 | 四川大学 | 一种基于深度学习的rbp结合位点预测算法 |
Non-Patent Citations (1)
Title |
---|
张英: "基于深度神经网络的时间序列数据异常检测与预测算法研究", 中国优秀硕士学位论文全文数据库工程科技Ⅱ辑, no. 1, 15 January 2021 (2021-01-15), pages 031 - 385 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117454212A (zh) * | 2023-12-25 | 2024-01-26 | 中国西安卫星测控中心 | 一种基于数据聚类的遥测数据互检测方法 |
CN117454212B (zh) * | 2023-12-25 | 2024-03-15 | 中国西安卫星测控中心 | 一种基于数据聚类的遥测数据互检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113837226B (zh) | 2024-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112763929B (zh) | 一种储能电站系统电池单体健康预测方法及装置 | |
Takiddin et al. | Deep autoencoder-based anomaly detection of electricity theft cyberattacks in smart grids | |
Zhao et al. | Lithium-ion battery remaining useful life prediction with deep belief network and relevance vector machine | |
Xia et al. | Multi-stage fault diagnosis framework for rolling bearing based on OHF Elman AdaBoost-Bagging algorithm | |
CN116757534B (zh) | 一种基于神经训练网络的智能冰箱可靠性分析方法 | |
CN113255848B (zh) | 基于大数据学习的水轮机空化声信号辨识方法 | |
CN110909822B (zh) | 一种基于改进的高斯过程回归模型的卫星异常检测方法 | |
CN114325450A (zh) | 基于CNN-BiLSTM-AT混合模型的锂离子电池健康状态预测方法 | |
US20220171376A1 (en) | Method For Setting Model Threshold Of Facility Monitoring System | |
CN110751199A (zh) | 一种基于贝叶斯神经网络的卫星异常检测方法 | |
CN114091930B (zh) | 业务指标预警方法、装置、电子设备和存储介质 | |
Cui et al. | Prognostics of lithium-ion batteries based on capacity regeneration analysis and long short-term memory network | |
Chen et al. | A deep learning feature fusion based health index construction method for prognostics using multiobjective optimization | |
Long et al. | Stochastic hybrid system approach to task-orientated remaining useful life prediction under time-varying operating conditions | |
CN113837226B (zh) | 基于不确定性估计的飞行器遥测参数异常检测方法 | |
Zhang et al. | A deep learning approach to estimate the state of health of lithium-ion batteries under varied and incomplete working conditions | |
CN114911185A (zh) | 基于云平台和移动端App的安防大数据物联网智能系统 | |
Yan et al. | Fault diagnosis of lithium-ion battery sensors based on multi-method fusion | |
Wang et al. | Assessing the Performance Degradation of Lithium‐Ion Batteries Using an Approach Based on Fusion of Multiple Feature Parameters | |
ul Hassan et al. | Online static security assessment for cascading failure using stacked De-noising Auto-encoder | |
CN116311739A (zh) | 一种基于长短时记忆网络及环境信息融合的多传感器火灾检测方法 | |
Pang et al. | Anomaly detection for satellite telemetry series with prediction interval optimization | |
Liu et al. | Adaptive robustness evaluation for complex system prognostics and health management software platform | |
Afrasiabi et al. | Power System Transient Security Assessment using Unsupervised Probabilistic Deep Bayesian Neural Network | |
Guo et al. | Multiple elastic networks with time delays for early fault detection and prognostics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |