CN112528554A - 一种适于多发多源火箭试验数据的数据融合方法及系统 - Google Patents

一种适于多发多源火箭试验数据的数据融合方法及系统 Download PDF

Info

Publication number
CN112528554A
CN112528554A CN202011286954.5A CN202011286954A CN112528554A CN 112528554 A CN112528554 A CN 112528554A CN 202011286954 A CN202011286954 A CN 202011286954A CN 112528554 A CN112528554 A CN 112528554A
Authority
CN
China
Prior art keywords
data
fusion
result
source
rocket
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011286954.5A
Other languages
English (en)
Inventor
孙光
程奇峰
李旗挺
李永远
王小锭
高朝辉
张霞
张宏江
阳佳
宋盛菊
雍颖琼
刘焱飞
杜立超
刘洋
刘岱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Academy of Launch Vehicle Technology CALT
Original Assignee
China Academy of Launch Vehicle Technology CALT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Academy of Launch Vehicle Technology CALT filed Critical China Academy of Launch Vehicle Technology CALT
Priority to CN202011286954.5A priority Critical patent/CN112528554A/zh
Publication of CN112528554A publication Critical patent/CN112528554A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/08Probabilistic or stochastic CAD

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physiology (AREA)
  • Genetics & Genomics (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Complex Calculations (AREA)

Abstract

本发明涉及一种适于多发多源火箭试验数据的数据融合方法及系统,针对包含不同部件、模块和系统的多次多发多源的火箭数据,提出了一种具有三级融合(数据级+特征级+决策级)策略的数据处理方法,为高维复杂的多发火箭测试数据提供高效合理的数据融合策略;本发明针对目前多源数据融合处理中易丢失数据有机组合蕴含的特征,提出了一种囊括不同算法模型(物理类、参数类、认识类)的数据融合框架,为火箭数据实现准确的识别与判断奠定了基础;本发明得到了高品质的有用信息,提高了数据的可靠性与准确性,缩短了数据处理的时间。

Description

一种适于多发多源火箭试验数据的数据融合方法及系统
技术领域
本发明涉及一种试验数据的数据处理方法,尤其涉及一种适于多发多源火箭试验数据的数据融合方法及系统,属于数据处理技术领域。
背景技术
数据融合的目的是把来自多个不同的数据库(源)的信息加以校准、联合、相关,合并成统一的表示形式,以获得精确的状态估计和综合评估,从而实现更加准确的识别和判断功能。对于火箭的诸多复杂系统,仅仅依靠单次单发的实验数据不能满足对部件、模块、系统的识别和控制的要求。若对不同次、不同发采集的数据单独、孤立地进行加工,不仅会导致数据处理工作量的剧增,而且割断了各个历史数据之间的有机联系,丢失数据有机组合蕴涵的特征,造成数据资源的浪费。要对多次多发多源的数据进行综合处理即进行数据融合,为数据挖掘提供规范数据,并在数据的特征层面和结果层面进行融合,从而得出更为准确、可靠的结论。
发明内容
本发明的目的在于克服现有技术的上述缺陷,提供一种适于多发多源火箭试验数据的数据融合方法,得到了高品质的有用信息,显著提高数据的可靠性与准确性,缩短了数据处理的时间。
本发明的另外一个目的在于提供一种适于多发多源火箭试验数据的数据融合系统。
本发明的上述目的主要是通过如下技术方案予以实现的:
一种适于多发多源火箭试验数据的数据融合方法,包括如下步骤:
(1)、将包含不同部件、模块或系统的多次多发多源的火箭数据进行数据预处理;
(2)、判断预处理后的数据是否属于同类数据,若是,进入步骤(3);否则,进入步骤(4);
(3)、对所述预处理后的数据进行数据层融合,并判断融合结果是否满意,若满意则输出融合结果;否则,进入步骤(4);
(4)、对所述预处理后的数据或者数据层融合后的数据进行特征层融合,并判断融合结果是否满意,若满意则输出融合结果;否则,进入步骤(5);
(5)、对所述特征层融合后的数据进行决策层融合,并判断融合结果是否满意,若满意则输出融合结果;否则,重复步骤(5),直至融合结果满意。
在上述适于多发多源火箭试验数据的数据融合方法中,所述步骤(1)中对多次多发多源的火箭数据进行数据预处理,包括去除数据噪声和异常点,将不完整的数据补充完整或者对数据进行数据规约及规范化、离散化处理。
在上述适于多发多源火箭试验数据的数据融合方法中,所述步骤(2)中判断预处理后的数据是否属于同类数据,即将来自同一传感器的数据或者从不同传感器采集的同一信号的数据作为同类数据。
在上述适于多发多源火箭试验数据的数据融合方法中,所述步骤(3)中采用基于物理模型类的方法对与预处理后的数据进行数据层融合,具体方法如下:
(3.1)、输入需要融合的数据X1,X2,…,Xn,其中n为正整数;
(3.2)、对数据进行一致性检验,根据传感器测量精度确定检验门限e,若满足公式|X2-X1|≤e,|X3-X2|≤e,…,|Xn-Xn-1|≤e,则进入步骤(3.3),否则检测传感器是否存在故障;
(3.3)、递推计算采样时刻k时的协方差函数Rij(k)=E(XiXj)与Rii(k)=E(XiXi);
(3.4)、根据所述协方差函数计算采样时刻k时的方差
Figure BDA0002782680640000021
其中
Figure BDA0002782680640000031
(3.5)、根据所述方差
Figure BDA0002782680640000032
计算加权因子Wi(k),其中
Figure BDA0002782680640000033
(3.6)、根据所述加权因子Wi(k)以及公式
Figure BDA0002782680640000034
计算当前时刻的估计值
Figure BDA0002782680640000035
其中,
Figure BDA0002782680640000036
为第k采样时刻的各个数据的加权融合结果。
在上述适于多发多源火箭试验数据的数据融合方法中,所述步骤(4)中对所述预处理后的数据或者数据层融合后的数据进行特征层融合,具体包括采用基于参数类自编码器提取数据的特征,若提取的数据特征空间中存在强相关特征,则采用基于认知类模型的遗传算法进行强相关特征的选择,并利用基于参数类模型的模糊聚类方法生成新的特征,完成特征融合;若提取的数据特征空间中不存在强相关特征,则对提取的数据特征利用基于参数类模型的模糊聚类方法生成新的特征,完成特征融合。
在上述适于多发多源火箭试验数据的数据融合方法中,采用基于参数类自编码器提取数据的特征,即对数据进行压缩的具体方法如下:
(1)、在[0,1]上选取随机值设置权重初始值Wi,Woj和偏置初始值bi,boj i=1,…,n,j=1,…,N,n≤N,其中Wi为N维向量,Woj为n维向量;
(2)、输入数据x=(x0,x1,...,xN-1)T,通过反向传播神经网络结构计算输入层到隐含层,即编码过程:
ini=Wix+bi
Figure BDA0002782680640000037
计算隐含层到输出层,即解码过程:
inoj=Wojouti+boj
Figure BDA0002782680640000038
得到实际输出结果y=(y0,y1,...,yN-1)T
(3)、将步骤(2)中得到的结果与原始数据进行比较,得到损失:
Figure BDA0002782680640000041
其中:λ用来控制正则化的强度,在(0,1)之间取值,W=[W1,…,Wn,Wo1,…,WoM]T,b=[b1,…,bn,bo1,…,boM]T
(4)、根据步骤(2)中得到的损失不断更新W和b来优化网络,具体更新公式为:
Figure BDA0002782680640000042
Figure BDA0002782680640000043
其中α为更新率,取值范围为(0,1);
(5)、反复迭代至设定的迭代次数,所得到的编码结果outi即为提取的数据特征。
在上述适于多发多源火箭试验数据的数据融合方法中,若提取的数据特征空间中存在强相关特征,则采用基于认知类模型的遗传算法进行强相关特征的选择的具体方法如下:
(1)、随机产生一个拥有n个染色体的种群X={x1,x2,…,xn};
(2)、用适应度函数
Figure BDA0002782680640000044
计算种群每个个体的适应度,其中acc(X)为个体X在故障诊断上的最高诊断准确率,λ∈[0,1];
(3)、循环以下过程:
选择:依据种群中每个个体的适应度,按轮盘赌选择策略从中选择可以作为父本的个体,个体被选中的概率为:
Figure BDA0002782680640000045
其中:N为种群的个数;
交叉:将任意两个父本个体随机选择一个位置作为交叉点,交换交叉点之后的基因段,形成新的个体;
变异:随机改变某个体的基因值;
适应值计算:按照步骤(2)计算每个个体的适应度;
(4)、当终止条件成立,即达到最大预设的迭代次数或所选的特征子集满足要求,则循环结束;
(5)、选取末代种群中适应度最大的个体采用如下方法进行解码,得到强相关特征子集:
Figure BDA0002782680640000051
在上述适于多发多源火箭试验数据的数据融合方法中,对提取的数据特征或者选择的强相关特征利用基于参数类模型的模糊聚类方法生成新的特征的具体方法如下:
(1)、指定聚类类别数c(2≤c≤n),n为样本容量;确定模糊指标m;设定迭代停止阈值ε;设置迭代计数最大值1;初始化聚类中心矩阵P(t),t=0;
(2)、更新隶属度矩阵U(t),由聚类中心矩阵计算特征集中各样本xj到聚类中心ci的距离,根据
Figure BDA0002782680640000052
更新隶属度矩阵U(t)
(3)、根据
Figure BDA0002782680640000053
更新聚类中心矩阵P(t+1)
(4)、判定阈值,对于给定的阈值ε,如果||P(t+1)-P(t)||≤ε或者迭代次数不小于最大迭代计数值,即t≥l,则停止迭代;否则令t=t+1,转到步骤(2)。
在迭代流程停止后,得到模糊聚类中心以及模糊划分矩阵参数的估计值,最后模糊聚类算法对样本xj的聚类类别判断依据为
Figure BDA0002782680640000054
按照聚类类别将数据划分为不同的类,即为生成新的特征的结果。
在上述适于多发多源火箭试验数据的数据融合方法中,所述步骤(1)中模糊指标m的取值为2;迭代停止阈值ε的取值在0.001至0.01之间。
在上述适于多发多源火箭试验数据的数据融合方法中,所述步骤(5)中对特征层融合后的数据进行决策层融合,即对特征提取后的数据进行模式识别,采用基于参数类模型的DS证据理论方法对数据进行处理并形成局部的决策,最后进行组合形成最终决策。
在上述适于多发多源火箭试验数据的数据融合方法中,采用基于参数类模型的DS证据理论方法对数据进行处理并形成局部的决策,最后进行组合形成最终决策的具体方法如下:
(1)、确定识别框架,输入不同传感器数据的识别结果,即各个命题的基本概率分配函数mj(Ai)(j=1,2,…,n;i=1,2,…,k);
(2)、计算各个命题的信任函数
Figure BDA0002782680640000061
与似然函数Plj=1-Belj
(3)、计算归一化常数
Figure BDA0002782680640000062
(4)、根据合成规则,按照下式重新计算组合后的概率分配函数、信任函数:
Figure BDA0002782680640000063
Figure BDA0002782680640000064
(5)、根据基于信任函数的决策规则,选择组合后信任函数值最大的证据作为判决结果,输出识别结果,即若:
Bel(Afinal)=max{Bel(Ai)}
则Afinal为最终的判决结果,即最终决策。
一种适于多发多源火箭试验数据的数据融合系统,包括数据预处理模块、数据层融合模块、特征层融合模块和决策层融合模块,其中:
数据预处理模块:将包含不同部件、模块或系统的多次多发多源的火箭数据进行数据预处理,并判断预处理后的数据是否属于同类数据,若属于同类数据,则将所述预处理后的数据发送至数据层融合模块:若不属于同类数据,则将所述预处理后的数据发送至特征层融合模块;
数据层融合模块:接收预处理模块发送的预处理后的数据,对所述预处理后的数据进行数据层融合,并判断融合结果是否满意,若满意则输出融合结果,若不满意,则将数据层融合后的数据发送至特征层融合模块;
特征层融合模块;对从数据预处理模块接收的预处理后的数据,或者从数据层融合模块接收的融合数据进行特征层融合,并判断融合结果是否满意,若满意则输出融合结果;若不满意,则将特征层融合后的数据再次进行特征层融合,重复直至融合结果满意。
本发明与现有技术相比的有益效果如下:
(1)、本发明针对多次多发多源数据融合中存在的问题,提供一种适于多发多源火箭试验数据的数据融合方法,得到了高品质的有用信息,提高了数据的可靠性与准确性,缩短了数据处理的时间。
(2)、本发明针对包含不同部件、模块和系统的多次多发多源的火箭数据,提出了一种具有三级融合(数据级+特征级+决策级)策略的数据处理方法,为高维复杂的多发火箭测试数据提供高效合理的数据融合策略。
(3)、本发明针对目前多源数据融合处理中易丢失数据有机组合蕴含的特征,提出了一种囊括不同算法模型(物理类、参数类、认识类)的数据融合框架,为火箭数据实现准确的识别与判断奠定了基础。
(4)、本发明针对复杂系统数据,从数据综合到数据加工再到融合输出过程提出了一种“算法+模型”优化组合的多源数据融合流程,为形成高品质的规范数据提供具体实施途径。
附图说明
图1为本发明适于多发多源火箭试验数据的数据融合方法流程图;
图2为本发明的模型与算法关系图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步详细的描述:
如图1所示为本发明适于多发多源火箭试验数据的数据融合方法流程图,由图可知本发明适于多发多源火箭试验数据的数据融合方法具体包括如下步骤:
步骤(一)、将包含不同部件、模块或系统的多次多发多源的火箭数据进行数据预处理,为了数据便于融合,首先将数据进行预处理。利用现有常用的方法和软件去除数据中的异常点与噪声,对缺失的数据进行补齐,相应数据完成数据规约及规范化、离散化处理。
步骤(二)、判断预处理后的数据是否属于同类数据,若是,进入步骤(3);否则,进入步骤(4);本发明中将来自同一传感器的数据或者从不同传感器采集的同一信号的数据作为同类数据。
步骤(三)、对所述预处理后的数据进行数据层融合,并判断融合结果是否满意,若满意则输出融合结果;否则,进入步骤(四);
本发明一可选实施例中,采用基于物理模型类的方法对与预处理后的数据进行数据层融合,具体方法如下:
(3.1)、输入需要融合的数据X1,X2,…,Xn,其中n为正整数;
(3.2)、对数据进行检验,根据测量精度确定检验门限e,若满足公式|X2-X1|≤e,|X3-X2|≤e,…,|Xn-Xn-1|≤e,则进入步骤(3.3),否则检测传感器是否存在故障;
(3.3)、递推计算采样时刻k时的协方差函数Rij(k)=E(XiXj)与Rii(k)=E(XiXi);
(3.4)、根据所述协方差函数计算采样时刻k时的方差
Figure BDA0002782680640000081
其中
Figure BDA0002782680640000082
(3.5)、根据所述方差
Figure BDA0002782680640000091
计算加权因子Wi(k),其中
Figure BDA0002782680640000092
(3.6)、根据所述加权因子Wi(k)以及公式
Figure BDA0002782680640000093
计算当前时刻的估计值
Figure BDA0002782680640000094
其中,
Figure BDA0002782680640000095
为第k采样时刻的各个数据的加权融合结果。
步骤(四)、对所述预处理后的数据或者数据层融合后的数据进行特征层融合,并判断融合结果是否满意,若满意则输出融合结果;否则,进入步骤(五);
本发明一可选实施例中对所述预处理后的数据或者数据层融合后的数据进行特征层融合,具体包括采用基于参数类自编码器提取数据的特征,若提取的数据特征空间中存在强相关特征,则采用基于认知类模型的遗传算法进行强相关特征的选择,并利用基于参数类模型的模糊聚类方法生成新的特征,完成特征融合;若提取的数据特征空间中不存在强相关特征,则对提取的数据特征利用基于参数类模型的模糊聚类方法生成新的特征,完成特征融合。
(4.1)、其中采用基于参数类自编码器提取数据的特征,即对数据进行压缩的具体方法如下:
(1)、在[0,1]上选取随机值设置权重初始值Wi,Woj和偏置初始值bi,boj i=1,…,n,j=1,…,N,n≤N,其中Wi为N维向量,Woj为n维向量;
(2)、输入数据x=(x0,x1,...,xN-1)T,通过反向传播神经网络结构计算输入层到隐含层,即编码过程:
ini=Wix+bi
Figure BDA0002782680640000096
计算隐含层到输出层,即解码过程:
inoj=Wojouti+boj
Figure BDA0002782680640000097
得到实际输出结果y=(y0,y1,...,yN-1)T
(3)、将步骤(2)中得到的结果与原始数据进行比较,得到损失:
Figure BDA0002782680640000101
其中:λ用来控制正则化的强度,在(0,1)之间取值,W=[W1,…,Wn,Wo1,…,WoM]T,b=[b1,…,bn,bo1,…,boM]T
(4)、根据步骤(2)中得到的损失不断更新W和b来优化网络,具体更新公式为:
Figure BDA0002782680640000102
Figure BDA0002782680640000103
其中α为更新率,取值范围为(0,1);
(5)、反复迭代至设定的迭代次数,所得到的编码结果outi即为提取的数据特征。
(4.2)、若提取的数据特征空间中存在强相关特征,则采用基于认知类模型的遗传算法进行强相关特征的选择的具体方法如下:
(1)、按照数据融合所需解决问题的特点随机产生一个拥有n个染色体的种群X={x1,x2,…,xn};
(2)、用适应度函数
Figure BDA0002782680640000104
计算种群每个个体的适应度,其中acc(X)为个体X在故障诊断上的最高诊断准确率,λ∈[0,1];
(3)、循环以下过程:
选择:依据种群中每个个体的适应度,按轮盘赌选择策略从中选择可以作为父本的个体,个体被选中的概率为
Figure BDA0002782680640000105
其中N为种群的个数;
交叉:将任意两个父本个体按照一定的概率随机选择一个位置作为交叉点,交换交叉点之后的基因段,形成新的个体;
变异:按一定的概率随机改变某个体的基因值;
适应值计算:按照(2)计算每个个体的适应度;
(4)、当终止条件成立,即达到最大预设的迭代次数或所选的特征子集满足要求,则循环结束;
(5)、选取末代种群中适应度最大的个体采用基于参数类自编码器方法中步骤(2)的解码过程进行解码,得到强相关特征子集。即如下公式进行解码:
Figure BDA0002782680640000111
(4.3)、对提取的数据特征或者选择的强相关特征利用基于参数类模型的模糊聚类方法生成新的特征的具体方法如下:
(1)、指定聚类类别数c(2≤c≤n),n为样本容量;确定模糊指标m,取值为2;设定迭代停止阈值ε,ε在0.001至0.01之间取值;设置迭代计数最大值1;初始化聚类中心矩阵P(t),t=0;
(2)、更新隶属度矩阵U(t),由聚类中心矩阵计算特征集中各样本xj到聚类中心ci的距离,根据
Figure BDA0002782680640000112
更新隶属度矩阵U(t)
(3)、根据
Figure BDA0002782680640000113
更新聚类中心矩阵P(t+1)
(4)、判定阈值,对于给定的阈值ε,如果||P(t+1)-P(t)||≤ε或者迭代次数不小于最大迭代计数值(t≥l),则停止迭代;否则令t=t+1,转到步骤(2)。
在迭代流程停止后,可以得到模糊聚类中心以及模糊划分矩阵参数的估计值,最后模糊聚类算法对样本xj的聚类类别判断依据为
Figure BDA0002782680640000121
按照聚类类别将数据划分为不同的类,即为生成新的特征的结果。
步骤(五)、对所述特征层融合后的数据进行决策层融合,并判断融合结果是否满意,若满意则输出融合结果;否则,重复步骤(五),直至融合结果满意。
本发明一可选实施例中,对特征层融合后的数据进行决策层融合,即对特征提取后的数据进行模式识别,采用基于参数类模型的DS证据理论方法对数据进行处理并形成局部的决策,最后进行组合形成最终决策。
其中,采用基于参数类模型的DS证据理论方法对数据进行处理并形成局部的决策,最后进行组合形成最终决策的具体方法如下:
(1)、确定识别框架,输入不同传感器数据的识别结果,即各个命题的基本概率分配函数mj(Ai)(j=1,2,…,n;i=1,2,…,k)。
(2)、计算各个命题的信任函数
Figure BDA0002782680640000122
与似然函数Plj=1-Belj
(3)、计算归一化常数
Figure BDA0002782680640000123
(4)、根据合成规则,按照下式重新计算组合后的概率分配函数、信任函数。
Figure BDA0002782680640000124
Figure BDA0002782680640000125
(5)、根据基于信任函数的决策规则,选择组合后信任函数值最大的证据作为判决结果,输出识别结果,即若
Bel(Afinal)=max{Bel(Ai)}
则Afinal为最终的判决结果,即最终决策。。
如图2所示为本发明的模型与算法关系图。
本发明一种适于多发多源火箭试验数据的数据融合系统,包括数据预处理模块、数据层融合模块、特征层融合模块和决策层融合模块,其中各个模块的功能如下:
数据预处理模块:将包含不同部件、模块或系统的多次多发多源的火箭数据进行数据预处理,并判断预处理后的数据是否属于同类数据,若属于同类数据,则将所述预处理后的数据发送至数据层融合模块:若不属于同类数据,则将所述预处理后的数据发送至特征层融合模块;
数据层融合模块:接收预处理模块发送的预处理后的数据,对所述预处理后的数据进行数据层融合,并判断融合结果是否满意,若满意则输出融合结果,若不满意,则将数据层融合后的数据发送至特征层融合模块;
特征层融合模块;对从数据预处理模块接收的预处理后的数据,或者从数据层融合模块接收的数据层融合后的数据进行特征层融合,并判断融合结果是否满意,若满意则输出融合结果;若不满意,则将特征层融合后的数据再次进行特征层融合,重复直至融合结果满意。
各个模块中具体实现方法参见上述对方法的描述,在此不再赘述。
本发明适于多发多源火箭试验数据的数据融合方法是由三个数据融合结构及相应结构下的数据融合算法组成的一套数据处理策略;
三个数据融合结构分别为数据层融合、特征层融合和决策层融合,其中数据层融合仅针对同类数据融合,对来自于传感器的原始数据或数据预处理之后的同类数据进行低水平层次的融合,融合后的数据尽可能的保存原始数据的特性;特征层融合主要从数据源中提取特征信息,进行综合处理和分析,它是一个中间层次的融合过程,为决策层融合提供决策依据;决策层融合主要针对具体决策目标,对特征提取后的数据进行识别与判断,是最高层次的融合。
数据层融合接收数据预处理后的同类数据,采用基于物理模型类的方法对数据进行融合,融合后的数据按照不同的特征进行提取,然后针对存在或关注的问题对有关联的特征进行识别,给出识别结果。
特征层融合接收数据预处理后的异类数据或数据层融合后的数据,按照不同的特征分别进行提取,采用基于参数类模型或认知类模型的方法对数据进行分析和处理以完成特征融合,然后针对存在或关注的问题对融合后的特征进行识别,给出识别结果。
决策层融合接收特征提取后的数据,针对存在或关注的问题识别出相关联的特征,得到初步的简单判断,然后采用基于参数类模型或认知类模型的方法对数据进行分析和处理,给出局部的初步决策结果,所有局部决策结果在某种规则下进行组合,以获得最终的联合决策结果。
以上所述,仅为本发明最佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
本发明说明书中未作详细描述的内容属于本领域专业技术人员的公知技术。

Claims (12)

1.一种适于多发多源火箭试验数据的数据融合方法,其特征在于:包括如下步骤:
(1)、将包含不同部件、模块或系统的多次多发多源的火箭数据进行数据预处理;
(2)、判断预处理后的数据是否属于同类数据,若是,进入步骤(3);否则,进入步骤(4);
(3)、对所述预处理后的数据进行数据层融合,并判断融合结果是否满意,若满意则输出融合结果;否则,进入步骤(4);
(4)、对所述预处理后的数据或者数据层融合后的数据进行特征层融合,并判断融合结果是否满意,若满意则输出融合结果;否则,进入步骤(5);
(5)、对所述特征层融合后的数据进行决策层融合,并判断融合结果是否满意,若满意则输出融合结果;否则,重复步骤(5),直至融合结果满意。
2.根据权利要求1所述的适于多发多源火箭试验数据的数据融合方法,其特征在于:所述步骤(1)中对多次多发多源的火箭数据进行数据预处理,包括去除数据噪声和异常点,将不完整的数据补充完整或者对数据进行数据规约及规范化、离散化处理。
3.根据权利要求1所述的适于多发多源火箭试验数据的数据融合方法,其特征在于:所述步骤(2)中判断预处理后的数据是否属于同类数据,即将来自同一传感器的数据或者从不同传感器采集的同一信号的数据作为同类数据。
4.根据权利要求1所述的适于多发多源火箭试验数据的数据融合方法,其特征在于:所述步骤(3)中采用基于物理模型类的方法对与预处理后的数据进行数据层融合,具体方法如下:
(3.1)、输入需要融合的数据X1,X2,…,Xn,其中n为正整数;
(3.2)、对数据进行一致性检验,根据传感器测量精度确定检验门限e,若满足公式|X2-X1|≤e,|X3-X2|≤e,…,|Xn-Xn-1|≤e,则进入步骤(3.3),否则检测传感器是否存在故障;
(3.3)、递推计算采样时刻k时的协方差函数Rij(k)=E(XiXj)与Rii(k)=E(XiXi);
(3.4)、根据所述协方差函数计算采样时刻k时的方差
Figure FDA0002782680630000021
其中
Figure FDA0002782680630000022
(3.5)、根据所述方差
Figure FDA0002782680630000023
计算加权因子Wi(k),其中
Figure FDA0002782680630000024
(3.6)、根据所述加权因子Wi(k)以及公式
Figure FDA0002782680630000025
计算当前时刻的估计值
Figure FDA0002782680630000026
其中,
Figure FDA0002782680630000027
为第k采样时刻的各个数据的加权融合结果。
5.根据权利要求1所述的适于多发多源火箭试验数据的数据融合方法,其特征在于:所述步骤(4)中对所述预处理后的数据或者数据层融合后的数据进行特征层融合,具体包括采用基于参数类自编码器提取数据的特征,若提取的数据特征空间中存在强相关特征,则采用基于认知类模型的遗传算法进行强相关特征的选择,并利用基于参数类模型的模糊聚类方法生成新的特征,完成特征融合;若提取的数据特征空间中不存在强相关特征,则对提取的数据特征利用基于参数类模型的模糊聚类方法生成新的特征,完成特征融合。
6.根据权利要求5所述的适于多发多源火箭试验数据的数据融合方法,其特征在于:采用基于参数类自编码器提取数据的特征,即对数据进行压缩的具体方法如下:
(1)、在[0,1]上选取随机值设置权重初始值Wi,Woj和偏置初始值bi,boji=1,…,n,j=1,…,N,n≤N,其中Wi为N维向量,Woj为n维向量;
(2)、输入数据x=(x0,x1,...,xN-1)T,通过反向传播神经网络结构计算输入层到隐含层,即编码过程:
ini=Wix+bi
Figure FDA0002782680630000031
计算隐含层到输出层,即解码过程:
inoj=Wojouti+boj
Figure FDA0002782680630000032
得到实际输出结果y=(y0,y1,...,yN-1)T
(3)、将步骤(2)中得到的结果与原始数据进行比较,得到损失:
Figure FDA0002782680630000033
其中:λ用来控制正则化的强度,在(0,1)之间取值,W=[W1,…,Wn,Wo1,…,WoM]T,b=[b1,…,bn,bo1,…,boM]T
(4)、根据步骤(2)中得到的损失不断更新W和b来优化网络,具体更新公式为:
Figure FDA0002782680630000034
Figure FDA0002782680630000035
其中α为更新率,取值范围为(0,1);
(5)、反复迭代至设定的迭代次数,所得到的编码结果outi即为提取的数据特征。
7.根据权利要求5所述的适于多发多源火箭试验数据的数据融合方法,其特征在于:若提取的数据特征空间中存在强相关特征,则采用基于认知类模型的遗传算法进行强相关特征的选择的具体方法如下:
(1)、随机产生一个拥有n个染色体的种群X={x1,x2,…,xn};
(2)、用适应度函数
Figure FDA0002782680630000041
计算种群每个个体的适应度,其中acc(X)为个体X在故障诊断上的最高诊断准确率,λ∈[0,1];
(3)、循环以下过程:
选择:依据种群中每个个体的适应度,按轮盘赌选择策略从中选择可以作为父本的个体,个体被选中的概率为:
Figure FDA0002782680630000042
其中:N为种群的个数;
交叉:将任意两个父本个体随机选择一个位置作为交叉点,交换交叉点之后的基因段,形成新的个体;
变异:随机改变某个体的基因值;
适应值计算:按照步骤(2)计算每个个体的适应度;
(4)、当终止条件成立,即达到最大预设的迭代次数或所选的特征子集满足要求,则循环结束;
(5)、选取末代种群中适应度最大的个体采用如下方法进行解码,得到强相关特征子集:
Figure FDA0002782680630000043
8.根据权利要求5所述的适于多发多源火箭试验数据的数据融合方法,其特征在于:对提取的数据特征或者选择的强相关特征利用基于参数类模型的模糊聚类方法生成新的特征的具体方法如下:
(1)、指定聚类类别数c(2≤c≤n),n为样本容量;确定模糊指标m;设定迭代停止阈值ε;设置迭代计数最大值1;初始化聚类中心矩阵P(t),t=0;
(2)、更新隶属度矩阵U(t),由聚类中心矩阵计算特征集中各样本xj到聚类中心ci的距离,根据
Figure FDA0002782680630000051
更新隶属度矩阵U(t)
(3)、根据
Figure FDA0002782680630000052
更新聚类中心矩阵P(t+1)
(4)、判定阈值,对于给定的阈值ε,如果||P(t+1)-P(t)||≤ε或者迭代次数不小于最大迭代计数值,即t≥l,则停止迭代;否则令t=t+1,转到步骤(2)。
在迭代流程停止后,得到模糊聚类中心以及模糊划分矩阵参数的估计值,最后模糊聚类算法对样本xj的聚类类别判断依据为
Figure FDA0002782680630000053
按照聚类类别将数据划分为不同的类,即为生成新的特征的结果。
9.根据权利要求8所述的适于多发多源火箭试验数据的数据融合方法,其特征在于:所述步骤(1)中模糊指标m的取值为2;迭代停止阈值ε的取值在0.001至0.01之间。
10.根据权利要求1所述的适于多发多源火箭试验数据的数据融合方法,其特征在于:所述步骤(5)中对特征层融合后的数据进行决策层融合,即对特征提取后的数据进行模式识别,采用基于参数类模型的DS证据理论方法对数据进行处理并形成局部的决策,最后进行组合形成最终决策。
11.根据权利要求10所述的适于多发多源火箭试验数据的数据融合方法,其特征在于:采用基于参数类模型的DS证据理论方法对数据进行处理并形成局部的决策,最后进行组合形成最终决策的具体方法如下:
(1)、确定识别框架,输入不同传感器数据的识别结果,即各个命题的基本概率分配函数mj(Ai)(j=1,2,…,n;i=1,2,…,k);
(2)、计算各个命题的信任函数
Figure FDA0002782680630000061
与似然函数Plj=1-Belj
(3)、计算归一化常数
Figure FDA0002782680630000062
(4)、根据合成规则,按照下式重新计算组合后的概率分配函数、信任函数:
Figure FDA0002782680630000063
Figure FDA0002782680630000064
(5)、根据基于信任函数的决策规则,选择组合后信任函数值最大的证据作为判决结果,输出识别结果,即若:
Bel(Afinal)=max{Bel(Ai)}
则Afinal为最终的判决结果,即最终决策。
12.一种适于多发多源火箭试验数据的数据融合系统,其特征在于:包括数据预处理模块、数据层融合模块、特征层融合模块和决策层融合模块,其中:
数据预处理模块:将包含不同部件、模块或系统的多次多发多源的火箭数据进行数据预处理,并判断预处理后的数据是否属于同类数据,若属于同类数据,则将所述预处理后的数据发送至数据层融合模块:若不属于同类数据,则将所述预处理后的数据发送至特征层融合模块;
数据层融合模块:接收预处理模块发送的预处理后的数据,对所述预处理后的数据进行数据层融合,并判断融合结果是否满意,若满意则输出融合结果,若不满意,则将数据层融合后的数据发送至特征层融合模块;
特征层融合模块;对从数据预处理模块接收的预处理后的数据,或者从数据层融合模块接收的融合数据进行特征层融合,并判断融合结果是否满意,若满意则输出融合结果;若不满意,则将特征层融合后的数据再次进行特征层融合,重复直至融合结果满意。
CN202011286954.5A 2020-11-17 2020-11-17 一种适于多发多源火箭试验数据的数据融合方法及系统 Pending CN112528554A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011286954.5A CN112528554A (zh) 2020-11-17 2020-11-17 一种适于多发多源火箭试验数据的数据融合方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011286954.5A CN112528554A (zh) 2020-11-17 2020-11-17 一种适于多发多源火箭试验数据的数据融合方法及系统

Publications (1)

Publication Number Publication Date
CN112528554A true CN112528554A (zh) 2021-03-19

Family

ID=74980788

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011286954.5A Pending CN112528554A (zh) 2020-11-17 2020-11-17 一种适于多发多源火箭试验数据的数据融合方法及系统

Country Status (1)

Country Link
CN (1) CN112528554A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113159138A (zh) * 2021-04-01 2021-07-23 北京市燃气集团有限责任公司 一种基于数据融合的燃气锅炉故障诊断方法及装置
CN116450586A (zh) * 2023-04-13 2023-07-18 中国人民解放军海军航空大学 火箭数据解析方法、系统、电子设备及计算机存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273924A (zh) * 2017-06-06 2017-10-20 上海电力学院 基于模糊聚类分析的多数据融合的电厂故障诊断方法
CN108710900A (zh) * 2018-05-08 2018-10-26 电子科技大学 一种基于d-s推理的多平台传感器测量数据融合方法
CN108805159A (zh) * 2018-04-17 2018-11-13 杭州电子科技大学 一种基于过滤法和遗传算法的高维数据特征选择方法
US20180367871A1 (en) * 2017-06-14 2018-12-20 GM Global Technology Operations LLC Apparatus, method and system for multi-mode fusion processing of data of multiple different formats sensed from heterogeneous devices
CN109558911A (zh) * 2018-12-26 2019-04-02 杭州电子科技大学 基于遗传算法广义典型相关分析的肌电信号特征融合方法
CN111259927A (zh) * 2020-01-08 2020-06-09 西北工业大学 基于神经网络和证据理论的火箭发动机故障诊断方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273924A (zh) * 2017-06-06 2017-10-20 上海电力学院 基于模糊聚类分析的多数据融合的电厂故障诊断方法
US20180367871A1 (en) * 2017-06-14 2018-12-20 GM Global Technology Operations LLC Apparatus, method and system for multi-mode fusion processing of data of multiple different formats sensed from heterogeneous devices
CN108805159A (zh) * 2018-04-17 2018-11-13 杭州电子科技大学 一种基于过滤法和遗传算法的高维数据特征选择方法
CN108710900A (zh) * 2018-05-08 2018-10-26 电子科技大学 一种基于d-s推理的多平台传感器测量数据融合方法
CN109558911A (zh) * 2018-12-26 2019-04-02 杭州电子科技大学 基于遗传算法广义典型相关分析的肌电信号特征融合方法
CN111259927A (zh) * 2020-01-08 2020-06-09 西北工业大学 基于神经网络和证据理论的火箭发动机故障诊断方法

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
张睿哲;李战国;杨照峰;: "相关性分析和自适应遗传算法的入侵特征选择", 合肥工业大学学报(自然科学版), no. 03, 28 March 2018 (2018-03-28), pages 1 - 5 *
李媛媛;张立峰;: "多传感器自适应加权融合算法及其应用研究", 自动化与仪器仪表, no. 02, 25 March 2008 (2008-03-25), pages 1 - 4 *
李郅琴;杜建强;聂斌;熊旺平;黄灿奕;李欢;: "特征选择方法综述", 计算机工程与应用, no. 24, 4 November 2019 (2019-11-04), pages 1 - 10 *
杨露等: "基于信息融合的故障诊断集成平台设计与实现", 《系统仿真学报》, 31 January 2014 (2014-01-31), pages 132 - 145 *
杨露等: "基于信息融合的故障诊断集成平台设计与实现", 系统仿真学报, vol. 26, no. 1, pages 132 - 136 *
王江萍, 沈力翔, 沈玉娣: "信息融合中多传感器测量一致性检验及其应用", 石油机械, no. 11, 30 November 1997 (1997-11-30), pages 1 - 5 *
王甜甜等: "区间值模糊数的模糊多属性决策方法", 辽宁工程技术大学学报(自然科学版), vol. 39, no. 1 *
郝志强: "基于联合对称不确定性的特征选择算法研究", 《中国优秀硕士学位论文全文数据库》, 15 April 2018 (2018-04-15), pages 1 - 53 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113159138A (zh) * 2021-04-01 2021-07-23 北京市燃气集团有限责任公司 一种基于数据融合的燃气锅炉故障诊断方法及装置
CN116450586A (zh) * 2023-04-13 2023-07-18 中国人民解放军海军航空大学 火箭数据解析方法、系统、电子设备及计算机存储介质
CN116450586B (zh) * 2023-04-13 2024-01-26 中国人民解放军海军航空大学 火箭数据解析方法、系统、电子设备及计算机存储介质

Similar Documents

Publication Publication Date Title
CN111785329B (zh) 基于对抗自动编码器的单细胞rna测序聚类方法
CN111079931A (zh) 一种基于图神经网络的状态空间概率性多时间序列预测方法
CN113378990B (zh) 基于深度学习的流量数据异常检测方法
CN107292097B (zh) 基于特征组的中医主症选择方法
CN111583031A (zh) 一种基于集成学习的申请评分卡模型建立方法
CN107832789B (zh) 基于平均影响值数据变换的特征加权k近邻故障诊断方法
CN112528554A (zh) 一种适于多发多源火箭试验数据的数据融合方法及系统
CN114048468A (zh) 入侵检测的方法、入侵检测模型训练的方法、装置及介质
CN110851654A (zh) 基于张量化数据降维的工业设备故障检测分类方法
CN113887342A (zh) 基于多源信号和深度学习的设备故障诊断方法
CN111144462B (zh) 一种雷达信号的未知个体识别方法及装置
CN116469561A (zh) 一种基于深度学习的乳腺癌生存预测方法
CN116702090A (zh) 一种多模态数据融合与不确定估计的水位预测方法及系统
CN115393631A (zh) 基于贝叶斯层图卷积神经网络的高光谱图像分类方法
CN114037001A (zh) 基于wgan-gp-c和度量学习的机械泵小样本故障诊断方法
Jang et al. Decision fusion approach for detecting unknown wafer bin map patterns based on a deep multitask learning model
Rijal et al. Integrating Information Gain methods for Feature Selection in Distance Education Sentiment Analysis during Covid-19.
CN113065395A (zh) 一种基于生成对抗网络的雷达目标新类检测方法
CN116720095A (zh) 一种基于遗传算法优化模糊c均值的电特性信号聚类方法
CN108734213B (zh) 一种基于贝叶斯统计分析的间歇过程模态识别方法
CN116883128A (zh) 洗钱团伙的挖掘方法、装置、电子设备及计算机存储介质
CN111031042A (zh) 一种基于改进d-s证据理论的网络异常检测方法
CN115293639A (zh) 一种基于隐马尔可夫模型的战场态势研判方法
CN113609480B (zh) 基于大规模网络流的多路学习入侵检测方法
US20220284261A1 (en) Training-support-based machine learning classification and regression augmentation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination