CN110502679A - 一种航天器遥测参数的数据类型自动判别方法 - Google Patents
一种航天器遥测参数的数据类型自动判别方法 Download PDFInfo
- Publication number
- CN110502679A CN110502679A CN201910782033.9A CN201910782033A CN110502679A CN 110502679 A CN110502679 A CN 110502679A CN 201910782033 A CN201910782033 A CN 201910782033A CN 110502679 A CN110502679 A CN 110502679A
- Authority
- CN
- China
- Prior art keywords
- parameter
- para
- telemetry parameter
- telemetry
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
- Navigation (AREA)
Abstract
本发明提供了一种航天器遥测参数的数据类型自动判别方法,确定待分析的遥测参数集合,剔除遥测参数集合中的空值参数和恒值参数;针对每个遥测参数,分别计算其偏移零值占比、偏移正值占比和数值元素计数这三个特征量;利用三个特征量,按照预设的阈值进行航天器遥测参数的数据类型判别。本发明既有利于分析人员高效快速的确定航天器遥测参数的参数类型,又有利于提高大数量遥测参数集应用数据挖掘方法时的准确性。
Description
技术领域
本发明涉及一种数据类型自动判别方法,属于航天器故障诊断分析领域。
背景技术
大数据已经在航天领域产生了深远的影响,并呈现出不断发展的蓬勃趋势。数据既是航天理论的基础,又是航天实践的基石。航天器遥测数据包含系统状态的重要参数信息,反映航天器的数字特征或状态,作为分析挖掘和检测评估等应用的数据依据。数据挖掘涉及的决策树、神经网络、随机森林、贝叶斯等方法都在航天器遥测数据分析中发挥了积极作用,但这些方法在应用时都要求明确遥测参数的数据类型。
目前航天器遥测参数数据类型的判别与设置依靠分析人员手动完成,当分析参数集扩大到几千个甚至上万个参数时,人工操作方式已经无法满足数据分析挖掘的时效性和准确性要求。
发明内容
为了克服现有技术的不足,本发明提供一种航天器遥测参数的数据类型自动判别方法,按照数据挖掘领域中无序离散量、有序离散量及连续变量的定义,对应将遥测参数划分为开关状态、控制模式等离散型状态变量、指令计数与积日积秒等计数型变量和温度、电压、电流等连续型变量,在确定分析参数集后,针对其中的每个参数计算偏移零值占比、偏移正值占比和数值元素计数三个特征量,根据这三个特征量自动判别遥测参数的数据类型。该方法既有利于分析人员高效快速的确定航天器遥测参数的参数类型,又有利于提高大数量遥测参数集应用数据挖掘方法时的准确性。
本发明解决其技术问题所采用的技术方案包括以下步骤:
步骤1,确定待分析的遥测参数集合,剔除遥测参数集合中的空值参数和恒值参数;
步骤2,针对每个遥测参数,分别计算其偏移零值占比、偏移正值占比和数值元素计数这三个特征量;
步骤3,利用三个特征量,按照预设的阈值进行航天器遥测参数的数据类型判别。
所述的步骤1中,待分析的遥测参数集合S={para1,para2,…,paran},S中包含n个遥测参数;每个遥测参数parai=[[t1,v1],…,[tpi,vpi]]为时间和数值组成的序列,1≤i≤n,parai包含pi项数据;如果参数parai的数据项数pi=0,则该参数不含遥测数据,将该参数从待分析集合S中剔除;计算参数parai中的最大值maxpi和最小值minpi,如果maxpi=minpi,则将该参数从集合S中剔除。
所述的步骤2中,对于遥测参数parai,设置偏移序列paraSi=parai.shift(1),计算过程为偏移序列paraSi与原序列parai等长,其中每个数据项的时间不变,参数值依次往后偏移一项,且最后一项补到第一项,即paraSi=[[t1,vpi],[t2,v1],…,[tpi,vpi-1]];偏移序列与原始序列对应时间项的参数值之差定义为paraSubi=parai-paraSi=[v1-vpi,v2-v1,…,vpi-vpi-1];参数parai的偏移零值占比定义为zpi=zi/pi,其中zi为paraSubi中等于0的数据项个数,pi为参数parai中总的数据项个数。
所述的步骤2中,对于遥测参数parai,偏移正值占比定义为upi=ui/pi,其中ui为paraSubi中大于0的数据项个数,pi为参数parai中数据项总数。
所述的步骤2中,对于遥测参数parai,pvi中所有不同数值元素组成的序列dvi=[vd1,…,vdi],其中任意两个元素均不相等,且di≤pi,则遥测参数的数值元素个数cpi=di,即序列dvi中的元素个数。
所述的步骤3中,设置偏移零值占比阈值ZPc、偏移正值占比阈值UPc和数值元素数量阈值CPc;对于遥测参数parai,如果其偏移零值占比量zpi>ZPc,并且数值元素计数为cpi<CPc,则该遥测参数的参数类型判定为离散型变量;如果不满足条件,则判断是否偏移正值占比量upi>UPc,若是,则该遥测参数的参数类型判定为计数型变量;如果不满足条件,则该遥测参数为连续型变量。
所述的步骤3中,ZPc=0.9,UPc=0.9,CPc=20。
本发明的有益效果是:
1)通过对大数据集遥测参数的预处理,去除了不含遥测数据的空值参数和不包含有效信息的恒值参数,提高了后续数据分析挖掘的效率。
2)通过计算特征量自动判别遥测参数的数据类型,使分析人员能够进一步了解掌握参数特性,并为分析人员在大规模参数集上应用数据挖掘算法创造了条件。
附图说明
图1是本发明的流程图。
图2是本发明应用案例的示意。
具体实施方式
下面结合附图和实施例对本发明进一步说明,本发明包括但不仅限于下述实施例。
本发明提供一种航天器遥测参数的数据类型自动判别方法,具体包括如下步骤:
第一步,遥测参数集的确定及预处理;
第二步,遥测参数特征量计算;
第三步,遥测参数的数据类型判别。
如上所述的第一步具体包括如下步骤:
步骤1.1:确定遥测参数集合。待分析的遥测参数集合表示为S={para1,para2,…,paran},S中包含n个遥测参数。对于其中的每个遥测参数parai为时间和数值组成的序列,表示为parai=[[t1,v1],…,[tpi,vpi]],其中1≤i≤n,pi表示参数parai包含pi项数据。对S中的每个参数parai依次执行后续步骤。
步骤1.2:空值参数剔除。航天器遥测参数中有一些发射段使用的参数在在轨运行过程中已经停用,需要剔除这些参数。剔除方法为如果参数parai的数据项数pi=0,则该参数不含遥测数据,将该参数从待分析集合S中剔除,跳转回步骤1.1进行下一个参数的判别。
步骤1.3:恒值参数剔除。航天器遥测参数中有一些备份器部件的参数在未启用时一直为恒定的数值,这些参数不包含任何有效信息,在分析过程中也应该剔除。剔除方法为计算参数parai中的最大值maxpi和最小值minpi,如果maxpi=minpi,则将该参数从待分析集合S中剔除,跳转回步骤1.1进行下一个参数的判别。
如上所述的第二步包括如下步骤:
针对每个遥测参数parai,分别计算其偏移零值占比、偏移正值占比和数值元素计数这三个特征量。具体步骤如下:
步骤2.1:偏移零值占比量计算。对于遥测参数parai,其原始数据序列为[[t1,v1],…,[tpi,vpi]],设置偏移序列paraSi=parai.shift(1),计算过程为偏移序列paraSi与原序列parai等长,其中每个数据项的时间不变,参数值依次往后偏移一项,且最后一项补到第一项,即paraSi=[[t1,vpi],[t2,v1],…,[tpi,vpi-1]]。偏移序列与原始序列对应时间项的参数值之差定义为paraSubi=parai-paraSi=[v1-vpi,v2-v1,…,vpi-vpi-1]。参数parai的偏移零值占比定义为zpi=zi/pi,其中zi为paraSubi中等于0的数据项个数,pi为参数parai中总的数据项个数。
步骤2.2:偏移正值占比量计算。对于遥测参数parai,由上一步可知其偏移序列与原始序列对应时间项的参数值之差paraSubi=parai-paraSi=[v1-vpi,v2-v1,…,vpi-vpi-1]。参数parai的偏移正值占比定义为upi=ui/pi,其中ui为paraSubi中大于0的数据项个数,pi为参数parai中数据项总数。
步骤2.3:遥测参数的数值元素统计。对于遥测参数parai,其所有数值元素组成的序列为pvi=[v1,v2,…,vpi],pi为参数parai中数据项个数。pvi中所有不同数值元素组成的序列dvi=[vd1,…,vdi],其中任意两个元素均不相等,且di≤pi。则遥测参数的数值元素个数cpi=di,即序列dvi中的元素个数。
如上所述的第三步包括如下步骤:
利用上一步计算,得出遥测参数parai的偏移零值占比量为zpi,偏移正值占比量为upi,数值元素计数为cpi,利用这三个特征量进行航天器遥测参数的数据类型判别,具体步骤如下:
步骤3.1:离散型变量判断。设置偏移零值占比阈值ZPc,偏移正值占比阈值UPc和数值元素数量阈值CPc。一般设置ZPc=0.9,UPc=0.9,CPc=20,也可根据经验进行调整。对于遥测参数parai,如果其偏移零值占比量zpi>ZPc,并且数值元素计数为cpi<CPc,则该遥测参数的参数类型判定为离散型变量。如果不满足条件,则继续进行后续判断。
步骤3.2:计数型变量判断。对于遥测参数parai,如果其偏移正值占比量为upi>UPc,则该遥测参数的参数类型判定为计数型变量。如果不满足条件,则继续进行后续判断。
步骤3.3:连续型变量判断。如果遥测参数parai既不满足离散型变量的条件,也不满足计数型变量的条件,则该遥测参数的参数类型判定为连续型变量。
如图1、图2所示,本发明的实施例包括以下步骤:
1)遥测参数集合S中包含4个元素,即S={para1,para2,para3,para4}。分别计算S中各个参数的数据项数p和最大最小差值max-min,其中4个参数的数据项数p都是非零,但遥测参数para1的max-min值为零,说明该参数数据一直未发生变化,无有效信息,将该参数剔除,不参与后续的分析。
2)对遥测参数集合S中剩余的3个参数,即S={para2,para3,para4}。分别计算S中各个参数的偏移零值占比量zp,偏移正值占比量up和数值元素数量cp这三个特征量的值。para2的计算结果分别为zp2=0.99,up2=0.53和cp2=3。para3的计算结果分别为zp3=0.0,up3=0.97和cp3=625。para3的计算结果分别为zp4=0.39,up4=0.01和cp4=186。
3)在完成参数特征量计算后,进行遥测参数参数类型的判断。设置偏移零值占比阈值ZPc=0.9,偏移正值占比阈值UPc=0.9,数值元素数量阈值CPc=20。对于遥测参数para2,其偏移零值占比量zp2>ZPc并且cp2<CPc,满足离散型变量条件,则判定para2为离散型变量。对于遥测参数para3,zp3<ZPc并且cp3>CPc,不满足离散型变量条件,但是偏移正值占比量up3>UPc,满足计数变量条件,则判定para3为计数型变量。对于遥测参数para4,zp4<ZPc并且cp4>CPc,不满足离散型变量条件,同时up4<UPc,也不满足计数型变量条件,则判定para4为连续型变量。
综上所述,本发明提供的一种航天器遥测参数的数据类型自动判别方法,解决了现有大数量遥测参数集中参数数据类型的判别与设置依靠分析人员手动完成,难以满足数据分析挖掘的时效性和准确性要求的技术问题。
Claims (7)
1.一种航天器遥测参数的数据类型自动判别方法,其特征在于包括以下步骤:
步骤1,确定待分析的遥测参数集合,剔除遥测参数集合中的空值参数和恒值参数;
步骤2,针对每个遥测参数,分别计算其偏移零值占比、偏移正值占比和数值元素计数这三个特征量;
步骤3,利用三个特征量,按照预设的阈值进行航天器遥测参数的数据类型判别。
2.根据权利要求1所述的航天器遥测参数的数据类型自动判别方法,其特征在于:所述的步骤1中,待分析的遥测参数集合S={para1,para2,…,paran},S中包含n个遥测参数;每个遥测参数parai=[[t1,v1],…,[tpi,vpi]]为时间和数值组成的序列,1≤i≤n,parai包含pi项数据;如果参数parai的数据项数pi=0,则该参数不含遥测数据,将该参数从待分析集合S中剔除;计算参数parai中的最大值maxpi和最小值minpi,如果maxpi=minpi,则将该参数从集合S中剔除。
3.根据权利要求2所述的航天器遥测参数的数据类型自动判别方法,其特征在于:所述的步骤2中,对于遥测参数parai,设置偏移序列paraSi=parai.shift(1),计算过程为偏移序列paraSi与原序列parai等长,其中每个数据项的时间不变,参数值依次往后偏移一项,且最后一项补到第一项,即paraSi=[[t1,vpi],[t2,v1],…,[tpi,vpi-1]];偏移序列与原始序列对应时间项的参数值之差定义为paraSubi=parai-paraSi=[v1-vpi,v2-v1,…,vpi-vpi-1];参数parai的偏移零值占比定义为zpi=zi/pi,其中zi为paraSubi中等于0的数据项个数,pi为参数parai中总的数据项个数。
4.根据权利要求3所述的航天器遥测参数的数据类型自动判别方法,其特征在于:所述的步骤2中,对于遥测参数parai,偏移正值占比定义为upi=ui/pi,其中ui为paraSubi中大于0的数据项个数,pi为参数parai中数据项总数。
5.根据权利要求4所述的航天器遥测参数的数据类型自动判别方法,其特征在于:所述的步骤2中,对于遥测参数parai,pvi中所有不同数值元素组成的序列dvi=[vd1,…,vdi],其中任意两个元素均不相等,且di≤pi,则遥测参数的数值元素个数cpi=di,即序列dvi中的元素个数。
6.根据权利要求5所述的航天器遥测参数的数据类型自动判别方法,其特征在于:所述的步骤3中,设置偏移零值占比阈值ZPc、偏移正值占比阈值UPc和数值元素数量阈值CPc;对于遥测参数parai,如果其偏移零值占比量zpi>ZPc,并且数值元素计数为cpi<CPc,则该遥测参数的参数类型判定为离散型变量;如果不满足条件,则判断是否偏移正值占比量upi>UPc,若是,则该遥测参数的参数类型判定为计数型变量;如果不满足条件,则该遥测参数为连续型变量。
7.根据权利要求6所述的航天器遥测参数的数据类型自动判别方法,其特征在于:所述的步骤3中,ZPc=0.9,UPc=0.9,CPc=20。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910782033.9A CN110502679B (zh) | 2019-08-23 | 2019-08-23 | 一种航天器遥测参数的数据类型自动判别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910782033.9A CN110502679B (zh) | 2019-08-23 | 2019-08-23 | 一种航天器遥测参数的数据类型自动判别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110502679A true CN110502679A (zh) | 2019-11-26 |
CN110502679B CN110502679B (zh) | 2022-10-21 |
Family
ID=68588910
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910782033.9A Active CN110502679B (zh) | 2019-08-23 | 2019-08-23 | 一种航天器遥测参数的数据类型自动判别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110502679B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013010569A1 (en) * | 2011-07-15 | 2013-01-24 | European Space Agency | Method and apparatus for monitoring an operational state of a system on the basis of telemetry data |
CN104765964A (zh) * | 2015-04-15 | 2015-07-08 | 北京空间飞行器总体设计部 | 一种空间环境敏感参数筛选方法 |
CN107192411A (zh) * | 2017-05-15 | 2017-09-22 | 中国西安卫星测控中心 | 一种航天器多遥测参数分析窗口划分方法 |
-
2019
- 2019-08-23 CN CN201910782033.9A patent/CN110502679B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013010569A1 (en) * | 2011-07-15 | 2013-01-24 | European Space Agency | Method and apparatus for monitoring an operational state of a system on the basis of telemetry data |
CN104765964A (zh) * | 2015-04-15 | 2015-07-08 | 北京空间飞行器总体设计部 | 一种空间环境敏感参数筛选方法 |
CN107192411A (zh) * | 2017-05-15 | 2017-09-22 | 中国西安卫星测控中心 | 一种航天器多遥测参数分析窗口划分方法 |
Non-Patent Citations (2)
Title |
---|
孙振明等: "数据挖掘技术的AHP改进算法在航天器数据分析中的初探", 《哈尔滨工程大学学报》 * |
肇刚等: "基于时间序列数据挖掘的航天器故障诊断方法", 《飞行器测控学报》 * |
Also Published As
Publication number | Publication date |
---|---|
CN110502679B (zh) | 2022-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109193650A (zh) | 一种基于高维随机矩阵理论的电网薄弱点评估方法 | |
CN102789545A (zh) | 基于退化模型匹配的涡轮发动机剩余寿命的预测方法 | |
CN103106535B (zh) | 一种基于神经网络解决协同过滤推荐数据稀疏性的方法 | |
CN104835103A (zh) | 基于神经网络和模糊综合评价的移动网络健康评价方法 | |
CN103869192B (zh) | 智能电网线损检测方法和系统 | |
CN103345209B (zh) | 生产监控方法及系统 | |
CN105654229A (zh) | 一种电网自动化系统及设备运行状态风险评估算法 | |
CN107944005B (zh) | 一种数据展示方法及装置 | |
CN107679734A (zh) | 一种用于无标签数据分类预测的方法和系统 | |
CN108830417B (zh) | 一种基于arma和回归分析的生活能源消费预测方法及系统 | |
CN110188085A (zh) | 一种烟草卷包车间质量数据模型建立方法 | |
CN110298369A (zh) | 一种电力系统不良数据的辨识方法及系统 | |
CN104820771A (zh) | 一种航天工程制造成熟度等级确定方法 | |
CN109063885A (zh) | 一种变电站异常量测数据预测方法 | |
CN117469603B (zh) | 一种基于大数据学习的多水厂供水系统压力优化控制方法 | |
CN111612149A (zh) | 一种基于决策树的主网线路状态检测方法、系统及介质 | |
CN110147827A (zh) | 一种基于iaalo-svm与相似性度量的故障预测方法 | |
CN110187210A (zh) | 一种电气自动化设备自动检测系统及检测方法 | |
CN103218664A (zh) | 一种基于小波神经网络的告警权值确定方法 | |
CN114089255B (zh) | 一种电容式电压互感器稳定性评估方法 | |
CN105868918A (zh) | 一种谐波电流类监测样本的相似度指标计算方法 | |
CN101408492B (zh) | 一种香烟分组加工工艺中在线水分仪的校准方法 | |
CN110414608A (zh) | 一种针对于ResNet的按通道剪枝算法 | |
CN107831668B (zh) | 一种适用于随动控制自适应检测的方法及系统 | |
CN110502679A (zh) | 一种航天器遥测参数的数据类型自动判别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |