CN104360868A - 一种大型飞机综合处理平台中的多级故障管理方法 - Google Patents

一种大型飞机综合处理平台中的多级故障管理方法 Download PDF

Info

Publication number
CN104360868A
CN104360868A CN201410719468.6A CN201410719468A CN104360868A CN 104360868 A CN104360868 A CN 104360868A CN 201410719468 A CN201410719468 A CN 201410719468A CN 104360868 A CN104360868 A CN 104360868A
Authority
CN
China
Prior art keywords
fault
health monitoring
failure
subregion
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410719468.6A
Other languages
English (en)
Other versions
CN104360868B (zh
Inventor
张晓红
牟明
郝玉锴
戴小氐
黄保垒
陈福
李向东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AVIC No 631 Research Institute
Original Assignee
AVIC No 631 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AVIC No 631 Research Institute filed Critical AVIC No 631 Research Institute
Priority to CN201410719468.6A priority Critical patent/CN104360868B/zh
Publication of CN104360868A publication Critical patent/CN104360868A/zh
Application granted granted Critical
Publication of CN104360868B publication Critical patent/CN104360868B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

计算机机载嵌入式软件领域,具体涉及大型飞机综合化模块化航空电子系统处理平台中的多级故障管理方法。本发明的具体步骤:1)统计系统可能发生的所有故障,按照故障信息编码规则进行编码,建立故障分类表;2)根据故障分类表中定义的信息将所有故障在核心OS层配置多级健康监控表,在分区OS层定义信号处理程序;3)系统软件、应用软件运行过程的故障分级处理;本发明解决了平板方式下故障不分级别、不可自动恢复问题,实现并改善大型飞机综合处理平台下处理机故障自动收集、过滤、分级派发、接管等,制止了故障恶意蔓延,提高了整机系统安全性。

Description

一种大型飞机综合处理平台中的多级故障管理方法
技术领域
计算机软件领域,具体涉及大型飞机综合化模块化航空电子系统处理平台中的多级故障管理方法。
背景技术
航电系统至今已经历了独立式、联合式、综合化和高度综合化的发展历程。从各分系统相互独立到采用集中控制、分布处理的层次型结构,以及第三代的综合化航电,将系统按功能分成4个区:传感器区、数字信号处理区、任务处理区和飞机管理区,直至第四代的高度综合化、模块化。可见,航电系统结构越来越复杂,综合化程度越来越高,也显现出故障密集、多类等特点。这种高度模块化、综合化要求对航空综合化平台提出高安全、高可靠要求,因此,对发生的错误进行分级定义、分类设置恢复策略等,可使飞机综合处理平台及时进行错误诊断、分级派遣和分级恢复,从而有效阻止系统故障蔓延,实现对系统状态的监控、接管。
发明内容
为了解决背景技术中的问题,本发明提出了可实现故障自动收集、过滤、分级派发,以及按照运行不同阶段针对故障级别配置故障处理策略及恢复动作的大型飞机综合处理平台中的多级故障管理方法。
本发明的具体技术方案:
一种大型飞机综合处理平台中的多级故障管理方法,其特征在于,包括以下步骤:
1)统计系统可能发生的所有故障,按照故障信息编码规则进行编码,建立故障分类表;
所述故障分类表定义的信息包括故障名称、故障编码、故障描述、故障级别、故障可能发生的原因、故障处置建议;
2)根据故障分类表中定义的信息将所有故障在核心OS层配置健康监控表,在分区OS层定义信号处理程序;
所述健康监控表包括系统健康监控表、模块健康监控表以及分区健康监控表;
所述系统健康监控表由故障代码、系统状态级别和派遣级别组成;系统根据故障代码和故障发生时的系统状态查系统健康监控表,获得故障的派遣级别,据此级别派遣到不同的健康监控任务;
所述模块健康监控表是对派遣到模块级的故障进行故障分析后进行故障恢复的依据;
所述分区健康监控表主要是针对派遣到分区级的故障进行故障的分析后进行故障恢复的依据,每个分区有一个独立的分区健康监控表;
所述信号处理程序的功能是针对派遣到进程级的故障进行故障分析后进入处理程序进行故障恢复,每个分区有一个独立的信号处理程序;
3)系统软件、应用软件运行过程的故障处理;
3.1)应用程序或者系统程序调用操作系统服务将错误事件注入核心OS层中;
3.2)查看系统健康监控表对错误事件进行派遣;
若系统健康监控表认定错误事件为进程级错误,则将错误事件通过信号机制发送给分区OS层的信号处理程序;
若系统健康监控表认定错误事件为模块级故障,则将错误事件发送给模块健康监控任务;
若系统健康监控表认定错误事件为分区级故障,则将错误事件发送给分区健康监控任务;
3.3)针对不同级别的故障进行分析、恢复;
当分区OS层的信号处理程序接收到进程级故障时,根据故障分类表中的故障处置建议进入用户错误程序对故障进行分析、恢复;
当模块健康监控任务接收到模块级故障时,查找模块健康监控表,根据错误处理程序对该模块级故障进行恢复;
当分区健康监控任务接收到分区级故障时,查找分区健康监控表,根据错误处理程序对该分区级故障进行恢复。
上述方法执行步骤3)时,收集到的模块级无法恢复的故障时,则核心OS层将故障上报至系统级中央维护软件处理。
本发明的优点在于:
1、本发明采用对飞行故障进行进程级、分区级和模块级多级处理的方式解决了平板方式下故障不分级别、不可自动恢复问题。
2、本发明提供系统自动实时的检测和排除故障、恢复系统正常运行的能力,能够根据资源状态,提供系统重构依据。
附图说明
图1故障编码定义图;
图2分区OS健康监控结构示意图;
图3模块内部三级故障处理过程示意图。
具体实施方式
下面结合大型飞机综合处理平台的结构对本发明的方法进行描述:
大型飞机综合处理平台由左右两台综合处理机IPC组成。每台综合处理机IPC由1个集成机架、7个LRM模块组成。IPC内部模块之间、外部设备之间的互连通信,采用统一的AFDX通信网络(双余度结构),其基本配置及系统结构:
a.1个集成机架(含AFDX互连底板),可提供9个LRM模块插槽,其中
2个为功能扩展插槽;
b.2块CPM(通用处理模块),其CPU采用PPC G4处理器;
c.1块MMM(大容量存储模块),其存储器容量不低于100GB;
d.2块ASM(交换机模块),每块ASM模块可提供独立的24个AFDX端口;每个端口可提供双余度数据传输结构和变压器耦合方式,其数据传输速率为100mbps;
2块PSM(电源模块),每个PSM可接收2路28V直流电源输入,提供独立的10路电源输出。
本发明的技术方案具体实施步骤是:
步骤1)统计发生的所有故障,按照故障信息编码规则进行编码,建立故障分类表;故障分类表定义的信息包括故障名称、故障编码、故障描述、故障级别、故障可能发生的原因、故障处置建议;
具体的说,大型飞机复杂综合处理平台IPC系统中,各LRM均具设计自检测功能,通过自检测手段实施平台硬件资源功能测试,将故障隔离定位到模块,并可将检测到的模块内部故障报告给系统管理器(系统管理器驻留在MMM模块)。如图1所示,每个故障包括如下信息:
a.故障标识号(ID码,系统统一编码),32位字长,包括平台号(IPC1、IPC2)、LRM模块号(如1、2或A、B等),以及故障码(如01、12、23等),其编码说明详见表1,其中故障码16位每位表示LRM模块的一个工作单元状态(0-表示无故障,1-表示故障);
b.故障描述,以最短字数表达本次故障;
c.故障发生时间。
由于大型飞机大型飞机综合处理平台复杂,安全级别要求高,因此,系统配置有2台同构型工作单元--综合处理平台IPC,故障分类表相应包括两部分,一部分为工作单元代码表格式详见表1。另一部分为工作单元故障信息清单详见表2。
表1 工作单元代码表
表2 工作单元故障分类表
设备检测结果分布存储,记录在本地非易失存储器(NVRAM)中,确保其掉电不丢失,并由应用程序读取及处理。
设备在检测到故障发生或故障消失时,按照综合航空电子系统的故障编码定义,自动向中央维护系统报告。
步骤2)根据故障分类表中定义的信息将所有故障在核心OS层配置健康监控表,在分区OS层定义信号处理程序;
其中,健康监控表包括系统健康监控表、模块健康监控表以及分区健康监控表;
具体的说,系统健康监控表由故障代码、系统状态级别和派遣级别组成;系统根据故障代码和故障发生时的系统状态查系统健康监控表,获得故障的派遣级别,据此级别派遣到不同的健康监控任务;
具体的说,模块健康监控表是对派遣到模块级的故障进行故障的分析后进行故障恢复的依据;
具体的说,分区健康监控表主要是针对派遣到分区级的故障进行故障分析后进行故障恢复的依据,每个分区有一个独立的分区健康监控表;
具体的说,信号处理程序的功能是针对派遣到进程级的故障进行故障分析后进入处理程序进行故障恢复,每个分区有一个独立的信号处理程序;图2给出了分区操作系统中健康监控体系结构示意。图3给出了模块内部以表驱动方式实现系统故障收集、过滤、派发过程示意,结合附图2和附图3对系统软件、应用软件运行过程的故障处理进行描述:
步骤3)系统软件、应用软件运行过程的故障处理;
3.1)应用程序或者系统程序调用操作系统服务,将发生的错误事件注入核心OS中;
3.2)操作系统通过查找系统健康监控表对错误事件进行派遣;
若系统健康监控表认定错误事件为进程级错误,则通过操作系统信号机制将错误事件发送给分区OS层的信号处理程序;
若系统健康监控表认定错误事件为模块级故障,则将错误事件发送给模块健康监控任务;
若系统健康监控表认定错误事件为分区级故障,则将错误事件发送给分区健康监控任务;
3.3)针对不同级别的故障进行分析、恢复;
当分区OS的信号处理程序接收到信号时,根据用户事先挂接的错误处理程序对进程级故障进行分析、恢复;
当模块健康监控任务接收到模块级故障时,查找模块健康监控表,根据配置的错误处理程序对该模块级故障进行恢复;
当分区健康监控任务接收到分区级故障时,查找分区健康监控表,根据配置的错误处理程序对该分区级故障进行恢复。
此处需要说明的是:模块健康监控任务运行在核心操作系统中,并且作为核心操作系统中仅有的一个最高优先级的任务运行,可以抢占任何分区及系统任务的时间。
分区健康监控任务作为分区操作系统中一个独立的任务运行,它的优先级高于所属分区其它所有任务优先级,但只能占用本分区时间。
进程健康监控处理进程作为分区操作系统中一个特殊的进程运行,它的优先级高于分区内其它进程。
针对模块级无法处理的故障,上报至系统级中央维护软件处理。即:
在大型飞机复杂综合处理平台中各模块或综合处理机工作单元状态发生改变时,实时记录故障发生或消失的时间,按照综合航空电子系统的故障编码定义(由系统统一分配),自动向中央维护系统报告,为系统重构决策提供辅助信息,提高系统故障监控及处理能力。
系统管理器驻留在MMM模块,系统包括2个独立的大容量存储器模块(MMM),分布于2个不同的综合处理平台中,承担中央系统管理器功能。2个MMM模块以热备份方式工作,其中一个故障时,另一个接替。备份切换管理由飞行员完成。因此,综合处理平台提供系统级故障告警信息:
a.MMM1故障(综合处理平台1中的MMM故障);
b.MMM2故障(综合处理平台2中的MMM故障)。

Claims (2)

1.一种大型飞机综合处理平台中的多级故障管理方法,其特征在于,包括以下步骤:
1)统计系统可能发生的所有故障,按照故障信息编码规则进行编码,建立故障分类表;
所述故障分类表定义的信息包括故障名称、故障编码、故障描述、故障级别、故障可能发生的原因、故障处置建议;
2)根据故障分类表中定义的信息将所有故障在核心OS层配置多级健康监控表,在分区OS层定义信号处理程序;
所述多级健康监控表包括系统健康监控表、模块健康监控表以及分区健康监控表;
所述系统健康监控表由故障代码、系统状态级别和派遣级别组成;系统根据故障代码和故障发生时的系统状态查系统健康监控表,获得故障的派遣级别,据此级别派遣到不同的健康监控任务;
所述模块健康监控表是对派遣到模块级故障进行故障分析后进行故障恢复的依据;
所述分区健康监控表主要是针对派遣到分区级的故障进行故障分析后进行故障恢复的依据,每个分区有一个独立的分区健康监控表;
所述信号处理程序的主要是针对派遣到进程级的故障进行故障分析后进入处理程序进行故障恢复,每个分区有一个独立的信号处理程序;
3)系统软件、应用软件运行过程的故障处理;
3.1)应用程序或者系统程序调用操作系统服务将错误事件注入核心OS层中;
3.2)查看系统健康监控表对错误事件进行派遣;
若系统健康监控表认定错误事件为进程级错误,则将错误事件通过信号机制发送给分区OS层的信号处理程序;
若系统健康监控表认定错误事件为模块级故障,则将错误事件发送给模块健康监控任务;
若系统健康监控表认定错误事件为分区级故障,则将错误事件发送给分区健康监控任务;
3.3)针对不同级别的故障进行分析、恢复;
当分区OS层的信号处理程序接收到进程级故障时,根据故障分类表中的故障处置建议进入用户错误程序对故障进行分析、恢复;
当模块健康监控任务接收到模块级故障时,查找模块健康监控表,根据错误处理程序对该模块级故障进行恢复;
当分区健康监控任务接收到分区级故障时,查找分区健康监控表,根据错误处理程序对该分区级故障进行恢复。
2.根据权利要求1所述的大型飞机综合处理平台中的多级故障管理方法,其特征在于,执行步骤3)时,收集到模块级无法恢复的故障时,则核心OS层将故障上报至系统级中央维护软件处理。
CN201410719468.6A 2014-11-29 2014-11-29 一种大型飞机综合处理平台中的多级故障管理方法 Active CN104360868B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410719468.6A CN104360868B (zh) 2014-11-29 2014-11-29 一种大型飞机综合处理平台中的多级故障管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410719468.6A CN104360868B (zh) 2014-11-29 2014-11-29 一种大型飞机综合处理平台中的多级故障管理方法

Publications (2)

Publication Number Publication Date
CN104360868A true CN104360868A (zh) 2015-02-18
CN104360868B CN104360868B (zh) 2017-10-24

Family

ID=52528132

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410719468.6A Active CN104360868B (zh) 2014-11-29 2014-11-29 一种大型飞机综合处理平台中的多级故障管理方法

Country Status (1)

Country Link
CN (1) CN104360868B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105404278A (zh) * 2015-12-09 2016-03-16 中国航空工业集团公司西安航空计算技术研究所 一种安全关键软件的健康管理方法
CN106293986A (zh) * 2016-08-12 2017-01-04 中国航空工业集团公司西安飞行自动控制研究所 一种基于虚拟中断的故障监控处理装置与方法
CN106411610A (zh) * 2016-11-09 2017-02-15 上海斐讯数据通信技术有限公司 一种云ac设备故障单编号生成方法和装置
CN107947959A (zh) * 2017-10-13 2018-04-20 北京航空航天大学 一种基于asaac体系的ima系统全面故障管理系统
CN109448231A (zh) * 2018-11-28 2019-03-08 虫极科技(北京)有限公司 一种故障信息的上报、处理方法及系统
CN109920080A (zh) * 2019-02-21 2019-06-21 上海卫星工程研究所 基于实时ads-b的飞机目标黑白名单维护方法
CN110941503A (zh) * 2019-11-20 2020-03-31 中国航空工业集团公司西安航空计算技术研究所 故障处理方法、装置及电子设备
CN110955571A (zh) * 2020-02-20 2020-04-03 南京芯驰半导体科技有限公司 面向车规级芯片功能安全的故障管理系统
CN112478183A (zh) * 2020-11-13 2021-03-12 中国航空工业集团公司西安航空计算技术研究所 一种缓慢任务降级的辅助动力系统保护性停车控制方法
CN112596494A (zh) * 2020-12-04 2021-04-02 中国航空工业集团公司成都飞机设计研究所 一种基于hmc码相关性分析的飞行器故障定位方法
CN112623267A (zh) * 2020-11-30 2021-04-09 中国航空工业集团公司西安航空计算技术研究所 一种机载嵌入式综合处理机的故障隔离方法和装置
CN112965446A (zh) * 2021-01-29 2021-06-15 华中科技大学 一种基于微服务架构的柔性生产线控制系统平台
CN113781257A (zh) * 2021-08-10 2021-12-10 浙江运达风电股份有限公司 一种风电机组故障数据分类存储的方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090076776A1 (en) * 2007-04-06 2009-03-19 Airbus France Process and device for determining a diagnostic for a breakdown of a functional unit in an on-board avionic system
CN102998996A (zh) * 2012-12-07 2013-03-27 陕西千山航空电子有限责任公司 一种飞机机载实时故障诊断方法
CN103544092A (zh) * 2013-11-05 2014-01-29 中国航空工业集团公司西安飞机设计研究所 一种基于arinc653标准机载电子设备健康监控体系
CN103970122A (zh) * 2014-04-10 2014-08-06 海航航空技术有限公司 一种基于acms的飞机故障实时监控方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090076776A1 (en) * 2007-04-06 2009-03-19 Airbus France Process and device for determining a diagnostic for a breakdown of a functional unit in an on-board avionic system
CN102998996A (zh) * 2012-12-07 2013-03-27 陕西千山航空电子有限责任公司 一种飞机机载实时故障诊断方法
CN103544092A (zh) * 2013-11-05 2014-01-29 中国航空工业集团公司西安飞机设计研究所 一种基于arinc653标准机载电子设备健康监控体系
CN103970122A (zh) * 2014-04-10 2014-08-06 海航航空技术有限公司 一种基于acms的飞机故障实时监控方法和系统

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105404278B (zh) * 2015-12-09 2018-08-03 中国航空工业集团公司西安航空计算技术研究所 一种安全关键软件的健康管理方法
CN105404278A (zh) * 2015-12-09 2016-03-16 中国航空工业集团公司西安航空计算技术研究所 一种安全关键软件的健康管理方法
CN106293986A (zh) * 2016-08-12 2017-01-04 中国航空工业集团公司西安飞行自动控制研究所 一种基于虚拟中断的故障监控处理装置与方法
CN106293986B (zh) * 2016-08-12 2019-01-25 中国航空工业集团公司西安飞行自动控制研究所 一种基于虚拟中断的故障监控处理装置与方法
CN106411610A (zh) * 2016-11-09 2017-02-15 上海斐讯数据通信技术有限公司 一种云ac设备故障单编号生成方法和装置
CN107947959A (zh) * 2017-10-13 2018-04-20 北京航空航天大学 一种基于asaac体系的ima系统全面故障管理系统
CN109448231A (zh) * 2018-11-28 2019-03-08 虫极科技(北京)有限公司 一种故障信息的上报、处理方法及系统
CN109920080B (zh) * 2019-02-21 2021-12-07 上海卫星工程研究所 基于实时ads-b的飞机目标黑白名单维护方法
CN109920080A (zh) * 2019-02-21 2019-06-21 上海卫星工程研究所 基于实时ads-b的飞机目标黑白名单维护方法
CN110941503A (zh) * 2019-11-20 2020-03-31 中国航空工业集团公司西安航空计算技术研究所 故障处理方法、装置及电子设备
CN110955571B (zh) * 2020-02-20 2020-07-03 南京芯驰半导体科技有限公司 面向车规级芯片功能安全的故障管理系统
CN110955571A (zh) * 2020-02-20 2020-04-03 南京芯驰半导体科技有限公司 面向车规级芯片功能安全的故障管理系统
CN112478183A (zh) * 2020-11-13 2021-03-12 中国航空工业集团公司西安航空计算技术研究所 一种缓慢任务降级的辅助动力系统保护性停车控制方法
CN112478183B (zh) * 2020-11-13 2023-10-13 中国航空工业集团公司西安航空计算技术研究所 一种缓慢任务降级的辅助动力系统保护性停车控制方法
CN112623267A (zh) * 2020-11-30 2021-04-09 中国航空工业集团公司西安航空计算技术研究所 一种机载嵌入式综合处理机的故障隔离方法和装置
CN112623267B (zh) * 2020-11-30 2024-04-09 中国航空工业集团公司西安航空计算技术研究所 一种机载嵌入式综合处理机的故障隔离方法和装置
CN112596494A (zh) * 2020-12-04 2021-04-02 中国航空工业集团公司成都飞机设计研究所 一种基于hmc码相关性分析的飞行器故障定位方法
CN112965446A (zh) * 2021-01-29 2021-06-15 华中科技大学 一种基于微服务架构的柔性生产线控制系统平台
CN113781257A (zh) * 2021-08-10 2021-12-10 浙江运达风电股份有限公司 一种风电机组故障数据分类存储的方法及系统

Also Published As

Publication number Publication date
CN104360868B (zh) 2017-10-24

Similar Documents

Publication Publication Date Title
CN104360868A (zh) 一种大型飞机综合处理平台中的多级故障管理方法
CN103544092B (zh) 一种基于arinc653标准机载电子设备健康监控系统
CN110361979B (zh) 一种铁路信号领域的安全计算机平台
CN103605581B (zh) 一种分布式计算机系统故障处理流程
CN104461752B (zh) 一种两级故障容错的多媒体分布式任务处理方法
CN104268061B (zh) 一种适用于虚拟机的存储状态监控方法
CN107357671A (zh) 一种故障处理方法、相关装置及计算机
CN101116058B (zh) 用于飞行测试的机载处理的系统和方法
CN105373650A (zh) 基于aadl的ima动态重构建模方法
CN101556679A (zh) 一种综合前端系统故障处理方法及计算机设备
EP3251121B1 (en) Safety critical system
CN105607973A (zh) 一种虚拟机系统中设备故障处理的方法、装置及系统
CN108337108A (zh) 一种基于关联分析的云平台故障自动化定位方法
Trivedi et al. Modeling high availability
CN104461811A (zh) 一种分级、分层次的航天器单粒子软错误防护体系结构
CN107291589B (zh) 在机器人操作系统中提升系统可靠性的方法
CN101794241A (zh) 基于可编程逻辑器件三冗余容错计算机上电复位的电路
CN103365267A (zh) 一种具有自恢复功能的变电站间隔层设备及其实现方法
CN101788940A (zh) 基于可编程逻辑器件2x2冗余容错计算机上电复位的电路
CN103995759A (zh) 基于核内外协同的高可用计算机系统故障处理方法及装置
CN112671627B (zh) 一种机载飞行控制系统的体系化总线选型方法及装置
CN104462581B (zh) 基于微通道内存映射和Smart‑Slice的极速文件指纹提取系统及方法
CN101788941A (zh) 一种基于可编程器件的冗余容错计算机数据同步电路
CN101799782A (zh) 一种基于可编程器件的冗余容错计算机数据表决电路
CN105404278A (zh) 一种安全关键软件的健康管理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant