一种在轨航天器有效数据选取方法
技术领域
本发明涉及一种在轨航天器遥测数据处理方法。
背景技术
复杂的空间环境、地面网络的性能波动以及数据处理软件的缺陷,都会导致航天器在轨遥测参数出现严重误差,在工程领域中,这类错误的观测值是无效的,会严重影响分析结果的正确性。无效数据所引起的故障误报警问题在航天器在轨管理工作中已经逐渐凸现出来。
现有数据筛选方法中,有的基于实际值与最小二乘法拟合值的差值进行无效值过滤,有的基于实际值与均值误差进行过滤,也有的采用卡尔曼滤波进行无效值过滤,而航天器遥测数据的有效值选取常用于较为紧急的情况,应用上述方法时存在过滤效果差或计算量较大的缺点,尤其是在多航天器多参数同时处理时的实时性不够好。
发明内容
本发明的技术解决问题是:克服现有技术的不足,提供了一种在轨航天器有效数据选取方法,采用模糊算法计算在轨遥测数据的可信度,并基于可信度进行无效值判定和剔除,对剔除的值进行空值填充,经周期性采样后生成周期性的遥测数据有效值序列。
本发明的技术解决方案是:一种在轨航天器有效数据选取方法,步骤如下:
(1)对获取的遥测数据进行处理,计算得到遥测数据的变化斜率,计算公式为:
其中y(k)为变化斜率,x(k)为第k个时刻的遥测参数值,t(k)为k时刻的具体时间值,min()函数表示求最小值,双竖线为绝对值运算;
(2)基于变化斜率的计算结果,采用隶属函数将获取的遥测数据对应到指定的模糊集中,其中模糊集设置为{数据偏差较小、数据偏差小、数据偏差大、数据偏差较大}4个层次,对应的隶属函数分别为:
属于数据偏差较小的隶属度函数为:
u1(y)=1-y/c1,y>=0,y<=c1;
属于数据偏差小的隶属度函数为:
u2(y)=y/c1;y>=0,y<=c1;
u2(y)=(c2-y)/c1,y>c1,y<=c2;
属于数据偏差大的隶属函数为:
u3(y)=(y-c1)/c1;y>c1;y<=c2;
u3(y)=(c3-y)/c1,y>c2,y<=c3;
属于数据偏差较大的隶属函数为:
u4(y)=1;y>c3;
u4(y)=(y-c2)/c1,y>c2,y<=c3;
上述隶属函数中,0<c1<c2<c3<1,c1、c2、c3、c4的设定应能够反映y(k)取值在某一区域中的概率;
(3)利用对应的规则语句,生成各模糊量对应的模糊化后的可信度;所述的可信度集合包括可信度值较小、可信度值小、可信度值大、可信度值较大4个层次;所述的规则语句为:
如果数据偏差比较小,则可信度值较大;
如果数据偏差比较大,则可信度值较小;
如果数据偏差小,则可信度值大;
如果数据偏差大,则可信度值小。
其中,数据偏差较大、数据偏差较小、数据偏差小、数据偏差大由步骤(2)的计算结果确定;
(4)采用重心法计算得到遥测数据对应的精确可信度值reliab(y),计算公式为reliab(y)=d1*k1+d2*k2+d3*k3+d4*k4,式中k4=u1,k3=u2,k2=u3,k1=u4,其中d1、d2、d3、d4为权重系数,确定原则为可信度小的权重系数相对较小;
(5)结合用户设定的可信度阈值,判定目标数据是否为野值,如果判定结果为野值,进入步骤(6),否则进入步骤(8);
(6)如果野值前后的数据均为有效值,则取前后数据的平均值替代被剔除的野值;如果野值的前后存在连续野值,则继续向前向后找到有效值点采用最小二乘法进行曲线拟合,使用拟合后曲线上的值替代野值;
(7)将进行完野值去除填充后的遥测数据按照时间长度进行平滑处理,然后对平滑后的遥测数据进行采样,得到有效值序列;如果原始数据没有受到外部干扰,可以利用采样点处的数据值作为采样数据,如果发现整体上数据的稳定性较差、数据灵敏性很强,则利用采样周期内的平滑值或平均值作为样本数据;
(8)得到最终的航天器有效数据。
本发明与现有技术相比的优点在于:本发明方法基于遥测数据的一步差值,引入模糊判定方法,计算数据可信度,方法原理准确,实际计算过程简单高效,在实时在轨遥测数据的野值甄别与有效值替换中的计算效率和准确度很高,能够快速完成航天器遥测数据的野值判定、剔除和填充工作,更加适用于航天器在轨遥测数据处理。
附图说明
图1为本发明方法的流程框图;
图2为本发明基于模糊算法的可信度计算流程图。
具体实施方式
如图1所示,为本发明在轨航天器有效数据选取方法的流程框图,本发明方法由在轨遥测数据可信度计算、踢野与空值填充和有效值生成三个主要步骤组成,首先计算在轨遥测数据的可信度,基于可信度计算结果进行野值判定,剔除被判定为野值的数据,并进行空值填充,最后经采样得到用户所需要的有效值序列。
1、在轨遥测数据可信度计算
本发明方法采用模糊算法计算航天器在轨遥测数据的可信度,支撑无效值剔除处理。
如图2所示,遥测数据可信度计算分三步进行:第一步对数据进行模糊化,第二步采用规则语句集生成模糊结论,第三步对模糊结论进行解模糊化,计算得到数据的可信度值。
各步骤原理如下:
第一步:通过求遥测数据的斜率将其转化为具有规律的数据,所采用的处理公式为:
其中x(k)为第k个时刻的遥测参数值,t(k)为k时刻的具体时间值,min()函数表示求最小值,双竖线为绝对值运算,由此得到各遥测参数的数据偏差值序列。
第二步:模糊化是将数据对应到指定的模糊集中,该对应过程由特定的隶属函数完成。模糊化隶属函数通过历史遥测数据进行确定,本发明基于数据偏差y(k)设置隶属函数。
将模糊集设置为{数据偏差较小、数据偏差小、数据偏差大、数据偏差较大}4个层次。则隶属函数描述如下:
属于较小的隶属度函数:
u1(y)=1-y/c1,y>=0,y<=c1;
属于小的隶属度函数选择为:
u2(y)=y/c1;y>=0,y<=c1;同时
u2(y)=(c2-y)/c1,y>c1,y<=c2;
属于大的隶属函数选择为
u3(y)=(y-c1)/c1;y>c1;y<=c2;同时
u3(y)=(c3-y)/c1,y>c2,y<=c3
属于较大的隶属函数选择为
u4(y)=1;y>c3;同时
u4(y)=(y-c2)/c1,y>c2,y<=c3;
在上述公式中,0<c1<c2<c3<1,具体参数值根据实际情况进行设置,其基本原则为:c1 c2 c3 c4的设定应能够反映y(k)取值在某一区域中的概率,例如c1=0.02,c2=0.04,c3=0.06。
第三步:在数据模糊化后,利用对应的规则语句,生成各模糊量对应的模糊化后的可信度,得到模糊结论。模糊结论的可信度集合包括可信度值较小、可信度值小、可信度值大、可信度值较大4个层次。规则语句是用if,then形式描述好的。该规则语句可以通过历史遥测数据的规律分析得到的,如采用以下规则:
if数据偏差比较小,then可信度值较大;
if数据偏差比较大,then可信度值较小;
if数据偏差小,then可信度值大;
if数据偏差大,then可信度值小。
其中,数据偏差较大、较小、小、大由第二步的计算结果确定,由此准则给出了数据可信度分别处于较大、大、小和较小时的隶属度函数值。
第四步:在计算得到对应的模糊化可信度值后,通过解模糊化方法计算得到该数据对应的可信度值。解模糊化可采用重心法求取其精确的可信度值。假设k1,k2,k3,k4分别为可信度较小,可信度小,可信度大和可信度较大的概率,则可信度计算可采用如下公式:
reliab(y)=d1*k1+d2*k2+d3*k3+d4*k4;
通过第三步的规则过渡,k1、k2、k3、k4的具体值与第二步中计算得到的u1、u2、u3、u4一一对应,对应关系为k4=u1,k3=u2,k2=u3,k1=u4;而d1、d2、d3、d4可根据实际情况灵活设置,其所遵循的原则为可信度小的权重系数相对较小。例如可以选取d1=0,d2=0.33,d3=0.66,d4=1。
2、踢野与空值填充
根据可信度计算结果和用户设置对数据进行判定,将判定为野值的数据项剔除,并进行空值填充,其中野值是指严重失真、误差较大的值,空值是指剔除野值后留下的没有数值的点。
具体步骤如下:
1)结合用户设定的阈值规则(用于野值判定的可信度阈值,如认为可信度较小的数据为野值,其它数据为有效数据)判定目标数据是否为野值,如果判定结果为野值,进入步骤2),否则进入步骤5);
2)假设被判定为野值的数据在数据序列中的位置为n,向前遍历数据,直至第n-k个数据,遍历结束的条件为该数据为有效数据;向后遍历数据,直至第n+L个数据,遍历结束的条件为该数据为有效数据;如果L+k=2进入步骤3),否则进入步骤4);
3)L+k=2说明野值前后的数据均为有效值,取两者平均值替代被剔除的野值;进入步骤5);
4)L+k不等于2,说明存在连续野值,则继续向前向后各找一些(例如5个)有效值点采用最小二乘法进行曲线拟合,使用拟合后曲线上的值替代被剔除的野值以及遍历过程中发现的野值;
5)得到完整的有效值序列。
3、有效值序列生成
该步骤将遥测数据按照一定的时间长度进行平滑处理,然后以一定的采样周期对遥测数据进行采样,得到有效值序列,其中平滑时间长度和采样周期可根据实际需要确定。
有效值生成包括两步过程:一是采样间隔的设定;二是采样间隔内样本数据的提取。
1)设定采样间隔和平滑时长
其中采样间隔应不大于所设定的采样间隔,平滑时长根据实际需要设定。
2)提取样本数据
如果经踢野和空值填充后的原始数据变化规律符合其设计原理,则说明其信噪比较高,没有受到很强的外部干扰,可以利用采样点处的数据值作为采样数据。如果发现整体上数据的稳定性较差、数据灵敏性很强,则利用采样周期内的平滑值或平均值作为样本数据。平均数又可以采用数值平均数或位置平均数。数值平均数包括算术平均数、调和平均数、几何平均数三种,位置平均数包括众数、中位数、分位数三种。实际样本提取可任选一种。以调和平均数为例,其计算公式如下:
原始数据重要性有区别的条件下应用加权调和平均数,m为权值。
其中重要性反映了某采样点数据与当前采样点数据之间的相似关系,通常可认为距离当前采样点近的采样点数据更加重要,其权值相应较高,而距离远的则相对不重要,其权值相应较低。
实施例
下面以一组举例数据描述本方法的具体实施方式。
某航天器下传的遥测数据为:
{10.0247,10.0470,10.0647,10.0761,15.0800,10.0761,10.0647,10.0470,10.0247,10.0000,9.9753,9.9530,9.9353,9.9239,18.9200,9.9239,9.9353,9.9530,9.9753,10.0000}。其中存在两个无效值15.0800和18.9200。
第一步,遥测数据可信度计算
1)假设该数据采样周期为1秒,那么利用公式 计算得到共有18个值的差值序列如下:
{0.0177,0.0114,0.0114,5.0039,0.0114,0.0114,0.0177,0.0223,0.0247,0.0223,0.0177,0.0114,0.0114,8.9961,0.0114,0.0114,0.0177,0.0223}
2)模糊化
取c1=0.02,c2=0.04,c3=0.06,对上述差值序列进行模糊化得到如下结果:
[1较小0.115小0.885大0.000较大0.000]、[2较小0.432小0.568大0.000较大0.000]、[3较小0.432小0.568大0.000较大0.000]、[4较小0.000小0.000大0.000较大1.000]、[5较小0.432小0.568大0.000较大0.000]、[6较小0.432小0.568大0.000较大0.000]、[7较小0.115小0.885大0.000较大0.000]、[8较小0.000小0.885大0.115较大0.000]、[9较小0.000小0.764大0.236较大0.000]、[10较小0.000小0.885大0.115较大0.000]、[11较小0.115小0.885大0.000较大0.000]、[12较小0.432小0.568大0.000较大0.000]、[13较小0.432小0.568大0.000较大0.000]、[14较小0.000小0.000大0.000较大1.000]、[15较小0.432小0.568大0.000较大0.000]、[16较小0.432小0.568大0.000较大0.000]、[17较小0.115小0.885大0.000较大0.000]、[18较小0.000小0.885大0.115较大0.000]。
3)模糊化可信度判定
按照以下规则进行可信度对应:
if数据偏差比较小,then可信度值较大;
if数据偏差比较大,then可信度值较小;
if数据偏差小,then可信度值大;
if数据偏差大,then可信度值小。
4)计算量化的可信度值
利用公式reliab(y)=d1*k1+d2*k2+d3*k3+d4*k4。计算各遥测数据点的可信度,取d1=0,d2=0.33,d3=0.66,d4=1,得到可信度值如下所示:
[1较小0.115小0.885大0.000较大0.000可信度0.699]、[2较小0.432小0.568大0.000较大0.000可信度0.807]、[3较小0.432小0.568大0.000较大0.000可信度0.807]、[4较小0.000小0.000大0.000较大1.000可信度0.000]、[5较小0.432小0.568大0.000较大0.000可信度0.807]、[6较小0.432小0.568大0.000较大0.000可信度0.807]、[7较小0.115小0.885大0.000较大0.000可信度0.699]、[8较小0.000小0.885大0.115较大0.000可信度0.622]、[9较小0.000小0.764大0.236较大0.000可信度0.582]、[10较小0.000小0.885大0.115较大0.000可信度0.622]、[11较小0.115小0.885大0.000较大0.000可信度0.699]、[12较小0.432小0.568大0.000较大0.000可信度0.807]、[13较小0.432小0.568大0.000较大0.000可信度0.807]、[14较小0.000小0.000大0.000较大1.000可信度0.000]、[15较小0.432小0.568大0.000较大0.000可信度0.807]、[16较小0.432小0.568大0.000较大0.000可信度0.807]、[17较小0.115小0.885大0.000较大0.000可信度0.699]、[18较小0.000小0.885大0.115较大0.000可信度0.622]。
第二步,野值判定与剔除
根据第一步中计算得到的可信度值进行野值判定,不妨取野值阈值为0.5,那么可以看到,由两个点被判定为野值,其可信度值为0,如此得到剔除野值后的序列为:
{10.0247,10.0470,10.0647,10.0761,15.0800,10.0761,10.0647,10.0470,10.0247,10.0000,9.9753,9.9530,9.9353,9.9239,18.9200,9.9239,9.9353,9.9530,9.9753,10.0000}。其中标红加粗的为被剔除的值,此时成为空值。
第三步,空值填充与有效值序列生成
1)采用最小二乘法对被剔除的值进行重新赋值,分别取值为10.0761和9.9239;
2)根据用户采样率进行取值,不妨设用户要求每秒取一个有效值,那最终生成的有效值序列为:
{10.0247,10.0470,10.0647,10.0761,10.0761,10.0761,10.0647,10.0470,10.0247,10.0000,9.9753,9.9530,9.9353,9.9239,9.9239,9.9239,9.9353,9.9530,9.9753,10.0000}。
本发明说明书中未作详细描述的内容属本领域技术人员的公知技术。