发明内容
有鉴于此,本申请实施例提出了一种支持在线故障诊断的FDIR分层软件架构,实现适应多种航天器类型的、FDIR模块可重构的、分层的通用在线故障诊断软件框架。
根据本公开的一方面,本申请实施例提出了一种支持在线故障诊断的FDIR分层软件架构,应用于航天系统,所述分层架构包括:硬件单元层、子系统层、任务系统层和故障诊断层;所述硬件单元层、子系统层、任务系统层和FDIR层均包括:FDIR管理模块、FDIR模块和数据通信模块;
其中,所述FDIR管理模块,用于管理本层和所述相邻层的FDIR模块;
所述FDIR模块,用于本层的故障检测、识别和恢复;
所述数据通信模块,用于在本层、跨层进行模块间的通信。
在一种可能的实现方式中,所述FDIR管理模块包括:
模块配置加载子模块,用于配置加载解析配置文件;
模块生命周期管理子模块,用于部署FDIR模块和FDIR管理模块;
恢复指令执行子模块,用于接收、执行控制指令。
在一种可能的实现方式中,所述FDIR模块包括:
故障检测子模块,用于将航天系统运行的数据转化为检测结果;
故障识别子模块,用于将所述检测结果转化为故障识别结果;
故障恢复子模块,用于将故障识别结果转化为故障恢复指令,并将所述故障恢复指令传递给同层的FDIR管理模块。
在一种可能的实现方式中,所述数据通信模块包括:
数据接收和发送子模块,用于与所述航天系统的通信器进行数据交换;
差错控制子模块,用于将接收的数据进行差错检测;
通信频率控制子模块,用于控制本层模块的故障发生。
在一种可能的实现方式中,所述数据通信模块,用于在本层模块间的通信,包括:收集所述航天系统运行的数据,将所述数据传递到所述FDIR模块的故障检测子模块,所述故障检测子模块将输出的检测结果传递给所述故障识别子模块,所述故障识别子模块将输出的故障识别结果传递给故障恢复子模块,故障恢复模块根据所述识别结果发送恢复指令给所述FDIR管理模块的所述恢复指令执行子模块的执行器进行执行。
在一种可能的实现方式中,所述数据通信模块,用于在跨层模块间的通信,包括:与本层相邻的下层FDIR模块将检测航天系统时产生的健康报告数据传递给本层的FDIR模块;当本层的FDIR模块无法处理故障时,将所述故障传递到上层FDIR模块进行诊断。
在一种可能的实现方式中,根据航天系统的操作系统,所述数据通信模块的通信方式包括:
操作系统为内核态或用户空间时,在单节点内部,所述数据通信模块采用消息队列的通信方式,在多节点之间,所述数据通信模块采用Socket的通信方式;
当操作系统为分区时,在单节点内部分区之内,所述数据通信模块采用消息队列的通信方式,在单节点内部分区之间,所述数据通信模块采用APEX的通信方式,在多节点之间,所述数据通信模块采用Socket的通信方式。
由此可见,本申请实施例具有如下有益效果:
本公开提出的FDIR分层软件架构,通过包括硬件单元层、子系统层、任务系统层和FDIR层,且硬件单元层、子系统层、任务系统层和FDIR层均包括:FDIR管理模块、FDIR模块和数据通信模块;其中,所述FDIR管理模块,用于管理本层和所述相邻层的FDIR模块;所述FDIR模块,用于本层的故障检测、识别和恢复;所述数据通信模块,用于在本层、跨层进行模块间的通信。能够适应不同类型航天器的自主故障诊断与恢复需求,支持本地故障诊断和恢复以及故障诊断信息融合,提高了故障诊断的实时性和覆盖率,保证了FDIR系统自身运行的安全可靠。
附图说明
图1示出了根据本公开一实施例的支持在线故障诊断的FDIR分层软件架构的结构框图;
图2示出了根据本公开一实施例的支持在线故障诊断的FDIR分层软件架构的功能模块图;
图3示出了根据本公开一实施例的支持在线故障诊断的FDIR分层软件架构的分层框图;
图4示出了根据本公开一实施例的支持在线故障诊断的FDIR分层软件架构的通信模块的本层通信数据流图;
图5示出了根据本公开一实施例的支持在线故障诊断的FDIR分层软件架构的通信模块的跨层通信数据流图;
图6示出了根据本公开一实施例的支持在线故障诊断的FDIR分层软件架构的通信模块的跨层通信数据流图;
图7a示出了根据本公开一实施例的支持在线故障诊断的FDIR分层软件架构的内核态操作系统的并发图;
图7b示出了根据本公开一实施例的支持在线故障诊断的FDIR分层软件架构的用户空间操作系统的并发图;
图7c示出了根据本公开一实施例的支持在线故障诊断的FDIR分层软件架构的分区操作系统的并发图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请实施例作进一步详细的说明。
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请实施例作进一步详细的说明。
一种完整的、通用的FDIR分层软件架构设计,包括:1)各层次组件协同完成的功能逻辑结构,如数据采集与故障诊断、诊断对象健康报告、跨层次故障诊断请求、FDIR系统自诊断等;2)针对仅有内核态、有用户空间和支持分区的三种航天器的运行时FDIR功能管理,包括消息同步控制、多种实时通信方式支持、支持消息不丢失的运行时快速可重构等;3)针对单体航天器子系统软件单/多节点部署的支持,包括自动化部署,节点间故诊(故障诊断)信息融合等;4)多粒度的、可重用的故障诊断方法接口,以支持二次开发以及快速、可靠的运行时可重构。
FDIR系统的分层软件架构包括5个级别:1)Level 0,发生在硬件单元中的故障,如单粒子翻转、超电压等,该类故障通常能在本层得到诊断和恢复,对系统不会产生显著影响;2)Level 1,该层的故障通常与子系统的运行模式有关,硬件单元在Level 0中表现正常,却无法完成该模式下的动作指令,通常会对造成子系统的性能降级;3)Level 2,与航天器的系统级任务有关,航天器无法按照要求组合相关子系统完成既定任务,引起系统的性能降级,严重的造成系统服务丢失;4)Level 3,FDIR系统不能正常地执行故障诊断与恢复的功能,航天器的基本的运行安全无法得到保证;5)Level 4,航天器无法自主诊断或恢复该层次的故障,必须转换到安全模式等待地面系统的干预。
基于系统组件的设计方法,提出了一种集中式与分散式并存的在线故障诊断的FDIR分层架构。图1、图2分别示出了根据本公开一实施例的支持在线故障诊断的FDIR分层软件架构的结构框图和功能模块图,FDIR分层架构主要应用于航天系统,还能够应用于其它自诊断系统,下面以航天系统(航天器)为例进行说明。
如图1、图2所示,在线故障诊断的FDIR分层软件架构可以包括:硬件单元层、子系统层、任务系统层和故障诊断层;其中,硬件单元层可以包括:系统电池、地球传感器、太阳传感器、反作用轮、磁力矩器、推进器;子系统层可以包括空间链路节点控制、姿态控制、载荷管理、电力控制、推进器控制、热控制等;任务系统层可以包括遥感系统和导航系统;故障诊断层可以包括系统故障诊断模块和系统故障诊断管理模块。
如图2所示,硬件单元层、子系统层、任务系统层和故障诊断层的每一层都包括:FDIR管理模块、FDIR模块和数据通信模块;
其中,所述FDIR管理模块,用于管理本层和所述相邻层的FDIR模块。FDIR管理模块可以包括模块配置加载子模块,用于配置加载解析配置文件;模块生命周期管理子模块,用于部署FDIR模块和FDIR管理模块;恢复指令执行子模块,用于接收、执行控制指令。
所述FDIR模块,用于本层的故障检测、识别和恢复。FDIR模块可以包括故障检测子模块,用于将航天系统运行的数据转化为检测结果;故障识别子模块,用于将所述检测结果转化为故障识别结果;故障恢复子模块,用于将故障识别结果转化为故障恢复指令,并将所述故障恢复指令传递给同层的FDIR管理模块。
所述数据通信模块,用于在本层、跨层进行模块间的通信。数据通信模块包括:数据接收和发送子模块,用于与所述航天系统的通信器进行数据交换;差错控制子模块,用于将接收的数据进行差错检测;通信频率控制子模块,用于控制本层模块的故障发生。
图3示出了根据本公开一实施例的支持在线故障诊断的FDIR分层软件架构的分层框图;如图3所示,FDIR管理模块的模块配置加载解析配置文件,并调用模块生命周期管理模块部署相对应的FDIR模块和FDIR管理模块,系统运行时,如果收到指令,则调用命令解析模块执行相应指令。FDIR模块的故障检测模块负责将运行时数据转化为检测结果,故障识别子模块负责将检测结果转化为故障识别结果,故障恢复子模块负责将故障识别结果转化为恢复指令传递给同层FDIR管理模块。数据通信模块的数据接收和发送模块负责与匹配的对等通信器进行数据交换,差错控制子模块负责对接收的数据进行差错检测,保证通信的可靠性,通信频率控制子模块防止相同故障频繁发生,导致通信链路资源被大量占用的情况。
本公开提出的FDIR分层软件架构的每层均都有故障诊断和数据通信两大功能。故障诊断是由若干个故障诊断组件执行具体的诊断任务,每个组件根据具体需求可以分为故障检测、故障识别等子组件,这些组件的生命周期均由Fault Diagnosis Manager(故障诊断管理器)负责并且由Fault Diagnosis Manager负责将诊断组件的通信转发到DataManager(数据管理器)。Data Manager通过管理各个通信组件完成该层次内的通信任务,包括数据采集、分发、合并、过滤等。由此降低各个故障诊断组件的耦合程度,支持运行时可重构,且规避由第三方开发的故障诊断组件可能带来的安全性问题,特别的,其他三个层次由故障诊断系统层维护其生命周期,并提供故障诊断功能和恢复策略以保障FDIR系统自身的可靠性。
本公开提出的FDIR分层软件架构,通过包括:硬件单元层、子系统层、任务系统层和故障诊断层;所述硬件单元层、子系统层、任务系统层和FDIR层均包括:FDIR管理模块、FDIR模块和数据通信模块;其中,所述FDIR管理模块,用于管理本层和所述相邻层的FDIR模块;所述FDIR模块,用于本层的故障检测、识别和恢复;所述数据通信模块,用于在本层、跨层进行模块间的通信。能够适应不同类型航天器的自主故障诊断与恢复需求,支持本地故障诊断和恢复以及故障诊断信息融合,提高了故障诊断的实时性和覆盖率,保证了FDIR系统自身运行的安全可靠。
本公开提出的支持在线故障诊断的FDIR分层软件架构可以支持同一层不同模块间以及不同层的不同模块之间的通信,并支持故障诊断、数据同和、故障恢复三大功能。
图4示出了根据本公开一实施例的支持在线故障诊断的FDIR分层软件架构的通信模块的本层通信数据流图;图5、图6分别示出了根据本公开一实施例的支持在线故障诊断的FDIR分层软件架构的通信模块的跨层通信数据流图。
如图4所示,数据通信模块用于在本层模块间的通信时,故障诊断流程包括:首先由数据通信模块从传感器和其它层的FDIR模块收集的航天系统运行的数据,并把数据传递到FDIR模块的故障检测子模块,故障检测子模块将输出的检测结果传递给故障识别子模块,所述故障识别子模块将输出的故障识别结果传递给故障恢复子模块,故障恢复模块根据识别结果发送恢复指令给所述FDIR管理模块的恢复指令执行子模块的执行器进行执行。
在一种可能的实现方式中,数据通信模块,用于在跨层模块间的通信,包括:与本层相邻的下层FDIR模块将检测航天系统时产生的健康报告数据传递给本层的FDIR模块;当本层的FDIR模块无法处理故障时,将所述故障传递到上层FDIR模块进行诊断。
数据通信模块用于在跨层模块间的通信时,可以包括数据融合流程和数据恢复流程。如图5所示,数据融合流程,下层(与本层相邻的下层)FDIR在日常检测时会产生一份被监测对象(例如航天系统)的健康报告并汇报给上层(本层)FDIR,上层FDIR通过收集下层FDIR的健康报告,由此形成一段对应上层FDIR监测对象的运行时上下文,能够更精确对系统状态做出判断。
如图6所示,故障恢复流程,当某一层的FDIR无法处理故障时,需要将故障提交给上层FDIR进行综合诊断,如果还无法解决,则提交给最上层FDIR进行恢复,能够对系统故障进行恢复。
图7a、7b、7c分别示出了根据本公开一实施例的支持在线故障诊断的FDIR分层软件架构的内核态、用户空间、分区操作系统的并发图。
在线故障诊断是航天系统运行时概念,在FDIR系统运行时并发行为需要仔细设计。本发明针对航天器搭载的具有不同特点的操作系统设计了并发行为,包括仅有内核态的操作系统、有用户态的操作系统、分区操作系统。
如图7a所示,在仅有内核态的操作系统中,在线故障诊断系统在一个进程中运行,每一个故障诊断管理器Manager和故障诊断模块FDIR作为一个线程运行。
如图7b所示,在有用户态的操作系统中,在线故障诊断系统分为几个进程运行,每一个故障诊断管理器Manager和其管理的故障诊断模块FDIR同属于同一个进程,并各作为一个线程运行。
如图7c所示,在有分区的操作系统中,在线故障诊断系统分为几个进程运行,在线故障诊断系统层的故障诊断管理器Manager和故障诊断模块FDIR同属于一个进程并在一个分区中运行,子系统层和单元层的故障诊断管理器Manager和故障诊断模块FDIR分别属于一个进程并在同一个分区中运行。
在线故障诊断系统的启动过程如下:启动在线故障诊断系统的故障诊断管理器Manager,读取配置文件,启动若干组本层的通信器和FDIR模块,等待所有模块启动完毕后,再启动若干组下层故障诊断管理器Manager,下层故障诊断管理器Manager递归重复以上行为。
数据通信模块根据航天器操作系统的特点和航天器系统的通信方式,在通信方式上进行自动适配。对于装载有仅有内核态操作系统的航天器系统,在单节点内部,通信模块使用消息队列通信,在多节点之间,通信模块使用基于TCP协议的Socket通信;对于装载有用户空间操作系统的航天器系统,在单节点内部,通信模块使用消息队列通信,在多节点之间,通信模块使用基于TCP协议的Socket通信;对于装载有分区操作系统的航天器系统,在单节点内部分区之内,通信模块使用消息队列通信,在单节点内部分区之间,通信模块使用APEX协议通信,在多节点之间,通信模块使用基于TCP协议的Socket通信,能够保证可靠通信,具有差错检测,模块通信采用异步通信。通信模块与故障诊断模块相分离,运行时故障诊断模块可进行重构,替换诊断算法。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。