CN105404278A - 一种安全关键软件的健康管理方法 - Google Patents

一种安全关键软件的健康管理方法 Download PDF

Info

Publication number
CN105404278A
CN105404278A CN201510906486.XA CN201510906486A CN105404278A CN 105404278 A CN105404278 A CN 105404278A CN 201510906486 A CN201510906486 A CN 201510906486A CN 105404278 A CN105404278 A CN 105404278A
Authority
CN
China
Prior art keywords
critical software
fault
security critical
software
health
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510906486.XA
Other languages
English (en)
Other versions
CN105404278B (zh
Inventor
陈福
牟明
戴小氐
崔西宁
张晓红
郝玉锴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Aeronautics Computing Technique Research Institute of AVIC
Original Assignee
Xian Aeronautics Computing Technique Research Institute of AVIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Aeronautics Computing Technique Research Institute of AVIC filed Critical Xian Aeronautics Computing Technique Research Institute of AVIC
Priority to CN201510906486.XA priority Critical patent/CN105404278B/zh
Publication of CN105404278A publication Critical patent/CN105404278A/zh
Application granted granted Critical
Publication of CN105404278B publication Critical patent/CN105404278B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0243Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/24Pc safety
    • G05B2219/24033Failure, fault detection and isolation

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明属于机载计算机技术领域,具体涉及一种安全关键软件的健康管理方法。该方法的具体步骤是:1)创建安全关键软件健康监测表;2)创建安全关键软件健康诊断判据表;3)创建安全关键软件健康管理决策蓝图;4)查询健康监测表判断安全关键软件是否出现故障;5)根据健康诊断判据表确定故障现象;6)根据健康管理决策蓝图制定的故障处理规则对故障进行处理。本发明的方法通过创建的健康监测表、健康诊断判据表、健康管理决策蓝图实现了安全关键软件的故障隔离、故障恢复,避免了安全关键软件不正确的功能或失效就极有可能导致飞机坠毁、人员伤亡、财产损失和环境严重破坏的问题。

Description

一种安全关键软件的健康管理方法
技术领域
本发明属于机载计算机技术领域,具体涉及一种安全关键软件的健康管理方法。
背景技术
机载安全关键系统(Safety-criticalSystem)是指具有潜在破坏力的一类机载系统,此类系统一旦失效,就可能造成飞机坠毁、人员伤亡和环境破坏等严重后果。随着计算机技术和机载航空电子技术的发展,软件在安全关键系统中的应用越来越广泛,规模也与日俱增。F-22战机的综合航电系统中由软件实现的航电功能高达80%,软件代码达到170万余行。F-35战机的先进综合航电系统中,软件代码达到500万行。这表明,越来越多的安全关键系统中,软件日益密集化,逐渐形成安全关键的软件密集型系统。另一方面,安全性关键系统中软件引发的事故频发,20世纪90年代的Arianne5运载火箭等5起航天器事故的起因是软件;2004年12月20日,一架F-22因飞行控制软件故障而坠毁;2009年,法航AF447航班的A330-200飞机由于飞行控制软件错误的攀升指示最终导致飞机在大西洋上坠毁。由此可见,安全关键软件已成为决定机载安全关键系统安全与否的重要因素之一,对安全关键软件的健康管理方法研究具有重大现实意义。
软件健康管理是健康管理技术在软件领域中的应用拓展,通过对被监测软件工作状态的实时监测,对由异常情况引起的不良事件进行自动检测、诊断,并评估该不良事件在软件内部传播的危险性,根据评估结果自动采取相应的措施消除或减缓由该不良事件造成的影响。
发明内容
针对机载安全关键软件不正确的功能或失效就极有可能导致飞机坠毁、人员伤亡、财产损失和环境严重破坏的问题,设计了一种基于健康监测、健康诊断、管理决策、故障隔离、故障恢复和故障预测六位一体的安全关键软件健康管理方法。
本发明的具体技术方案是:
本发明提供了一种安全关键软件的健康管理方法,包括以下步骤:
1)创建安全关键软件健康监测表;所述健康监测表用于监测安全关键软件是否发生故障;监测内容包括安全关键软件中各模块的状态、事件以及日志的监测;
2)创建安全关键软件健康诊断判据表,所述健康诊断判据表用于确定故障现象;所述故障现象内容包括安全关键软件中各模块的消息、响应、声明、架构和规则的诊断;
3)创建安全关键软件健康管理决策蓝图,所述健康管理决策蓝图用于故障处理规则的制定;
4)查询健康监测表判断安全关键软件是否出现故障,若出现故障,则进行步骤6),若未出现故障,则继续周期性的查询健康监测表;
5)根据健康诊断判据表确定故障现象;
6)根据健康管理决策蓝图制定的故障处理规则对故障进行处理;所述故障处理规则包括故障隔离以及故障恢复。
该方法还包括步骤7)建立安全关键软件故障预测模型;依据故障预测模型的内容对安全关键软件的故障进行预测;所述故障预测模型内容包括安全关键软件的规模、复杂度、以探测故障数、引入故障数、探测故障密度、剩余故障密度。
上述故障恢复包括两种方式:
A、对于影响范围小的故障,通过替换故障模块进行故障恢复;
B、对于影响范围大的故障,对安全关键软件或者安全关键软件的子系统进行重构。
本发明的优点在于:
1、本发明的方法通过创建的健康监测表、健康诊断判据表、健康管理决策蓝图实现了安全关键软件的故障隔离、故障恢复。
2、本发明的方法通过建立安全关键软件故障预测模型,可以有效的预测安全关键软件未来可能发生的故障的时机,类型,便于后期处理。
附图说明
图1为本发明的健康管理流程图;
图2为安全关键软件故障恢复流程;
图3为安全关键软件故障预测模型。
具体实施方式
本方案中所指的安全关键软件包括危害性软件(指直接导致危害或用于控制危害的软件)及对危害性软件有影响的软件,所提出的健康管理方法适用于以下几类安全关键软件:
a、用于控制或监控危害性硬件、软件的软件。此类软件一般驻留于实时嵌入式系统中,如机舱门的控制软件、操作系统或交换机监控软件等。
b、向安全相关决策提供信息的软件。如飞行员在引擎起火时必须关闭引擎,读取引擎起火离散量并向飞行员显示的软件必须为安全关键软件,进一步,在所有信息处理过程中的相关软件,包括传感器采集软件、数模转换软件、显示软件等均为安全关键软件;
c、执行特等危害相关过程的软件。如用于验证危害性软件的软件。在一些特定情况下,模型、仿真器、模拟器等常用于对真实硬件相应的模拟,根据产生的结果,会对软件需求、设计等进行更改,因此,这些模型、仿真器、模拟器等也属于安全关键软件。
d、和安全关键软件驻留在一起的软件。非安全关键软件由于和安全关键软件共享计算机资源,可能造成系统故障蔓延,除非证明确实采用了正确手段保证故障隔离,非安全关键软件也被看作安全关键软件。
本方案中的安全关键软件健康管理方法包括以下几个方面健康监测、健康诊断、管理决策、故障隔离、故障恢复、故障预测;
健康监测:实时收集安全关键软件系统的各项运行数据,为软件健康诊断提供依据。
健康诊断:对安全关键软件各部分的监测信息进行分析,鉴定故障,评价安全关键软件系统的健康状态。
管理决策:依据健康诊断结果及故障预测信息决定执行何种故障处理策略,包括故障隔离策略和故障恢复策略。
故障隔离:定位到发生故障的软件子系统或软件模块,并对其进行有效隔离,防止故障扩散。
故障恢复:在不影响软件本身及关联软件正常运行的情况下,执行前向恢复或后向恢复策略,使安全关键软件系统无缝地从故障状态切换到健康状态。
故障预测:综合各种软件健康状况信息如当前状态监测数据、健康诊断信息、故障恢复信息以及健康状态历史经验数据等,预测其未来可能发生的故障的时机。故障预测信息与健康诊断信息一起,构成健康管理决策的基础。
具体步骤是:
1)创建安全关键软件健康监测表;所述健康监测表用于监测安全关键软件是否发生故障;监测内容包括安全关键软件中各模块的状态、事件以及日志的监测;
具体说:健康诊断依据实时监测的健康数据,诊断安全关键软件系统的运行状态,为健康管理与决策以及故障预测提供依据。诊断的及时性和准确性决定了管理决策的有效性和合理性。健康诊断接收在线监测器的监测信息,通过综合评估单元,分析监测信息,评估软件是否存在故障,确定故障等级,对软件的健康状况进行评价。
表1安全关键软件健康实时监测表
2)创建安全关键软件健康诊断判据表,所述健康诊断判据表用于确定故障现象;所述故障现象内容包括安全关键软件中各模块的消息、响应、声明、架构和规则的诊断;
表2安全关键软件健康诊断判据表
3)创建安全关键软件健康管理决策蓝图,所述健康管理决策蓝图用于故障处理规则的制定;
具体说:管理决策依据健康诊断发现的软件故障,进一步分析故障原因,并结合故障预测信息,制定故障处理策略。故障处理策略包括故障隔离和故障恢复两大类。其中,故障恢复策略包含恢复点策略、冗余策略、构件修复策略、系统重构策略。管理决策模块通过查询预先配置的健康管理决策蓝图来下达指令。健康管理决策蓝图的格式定义如表3所示。
表3健康管理决策蓝图
4)查询健康监测表判断安全关键软件是否出现故障,若出现故障,则进行步骤6),若未出现故障,则继续周期性的查询健康监测表;
5)根据健康诊断判据表确定故障现象;
6)根据健康管理决策蓝图制定的故障处理规则对故障进行处理;所述故障处理规则包括故障隔离以及故障恢复。
具体说:故障隔离是指对故障进行有效的隔离,防止故障扩散。在修复故障的同时,必须防止故障的蔓延,否则扩散的故障也会使系统崩溃。故障隔离通常的做法是找出与故障软件模块相关的模块,阻断它们交互,从而达到故障隔离的效果。
具体说:安全关键软件的故障恢复从软件和系统两个层次进行。对于出现的故障,在需要较小恢复的情况下,通过替换故障模块,进行软件恢复;在需要较大恢复的情况下,通过动态替换发生故障的软件恢复系统的功能,采用重新组织系统的可用资源,实现系统重构,保护系统的重要功能。本方案提出的安全关键软件故障恢复流程如图2所示。
图2首先对软件代码进行解析,提取软件的抽象表示方法,形成属性关系图,在此基础上,应用数据挖掘等技术,将属性关系图分解成能够进行模式图匹配的属性关系子图。用户预先指定相应的软件模式,并应用图生成的相关技术形成模式图。当软件故障被检测到的时候启动图匹配算法进行软件恢复与重构,然后对恢复和重构后的软件进行评估,如果没有达到预定的要求,重新启动图匹配算法,进行重新恢复。
步骤7)建立安全关键软件故障预测模型;依据故障预测模型的内容对安全关键软件的故障进行预测;所述故障预测模型内容包括安全关键软件的规模、复杂度、以探测故障数、引入故障数、探测故障密度、剩余故障密度。
具体说:故障预测是根据软件故障发生的历史,预测软件将来可能发生故障的时机、位置和行为,以尽早进行修补,对无法修补的制定故障应对措施,当发现故障先兆时,及时采取相应措施来规避故障的发生。软件故障预测技术分为静态和动态两种。静态预测技术,主要是指基于故障相关的度量数据,对缺陷的数量或者分布进行预测的技术;而动态预测技术则是基于故障或者失效产生的时间,对系统故障随时间的分布进行预测的技术。安全关键软件的故障预测可通过故障预测模型开展。本方案提出了一种基于贝叶斯信念网的安全关键软件故障预测模型,如图3所示。该模型分为两个阶段:第一个阶段覆盖了安全关键软件生命周期的规约、设计和编码,第二个阶段覆盖了安全关键软件的测试验证。设计规模和缺陷数节点为整数或者一个限定的范围,故障密度为实数。问题复杂度表示待开发问题内在的复杂度。测试阶段,已探测故障数和引入故障数的差额是剩余故障数。测试中探测故障密度反映了已探测故障数占设计规模的比例,剩余故障密度反映了剩余故障数占设计规模的比例。

Claims (4)

1.一种安全关键软件的健康管理方法,其特征在于,包括以下步骤:
1)创建安全关键软件健康监测表;所述健康监测表用于监测安全关键软件是否发生故障;监测内容包括安全关键软件中各模块的状态、事件以及日志的监测;
2)创建安全关键软件健康诊断判据表,所述健康诊断判据表用于确定故障现象;所述故障现象内容包括安全关键软件中各模块的消息、响应、声明、架构和规则的诊断;
3)创建安全关键软件健康管理决策蓝图,所述健康管理决策蓝图用于故障处理规则的制定;
4)查询健康监测表判断安全关键软件是否出现故障,若出现故障,则进行步骤5),若未出现故障,则继续周期性的查询健康监测表;
5)根据健康诊断判据表确定故障现象;
6)根据健康管理决策蓝图制定的故障处理规则对故障进行处理;所述故障处理规则包括故障隔离以及故障恢复。
2.根据权利要求1所述的安全关键软件的健康管理方法,其特征在于:还包括步骤7)建立安全关键软件故障预测模型;依据故障预测模型的内容对安全关键软件的故障进行预测;所述故障预测模型内容包括安全关键软件的规模、复杂度、以探测故障数、引入故障数、探测故障密度、剩余故障密度。
3.根据权利要求1所述的安全关键软件的健康管理方法,其特征在于:所述故障隔离是指阻断发生故障模块与其他模块的交互。
4.根据权利要求1所述的安全关键软件的健康管理方法,其特征在于:所述故障恢复包括两种方式:
A、对于影响范围小的故障,通过替换故障模块进行故障恢复;
B、对于影响范围大的故障,对安全关键软件或者安全关键软件的子系统进行重构。
CN201510906486.XA 2015-12-09 2015-12-09 一种安全关键软件的健康管理方法 Active CN105404278B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510906486.XA CN105404278B (zh) 2015-12-09 2015-12-09 一种安全关键软件的健康管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510906486.XA CN105404278B (zh) 2015-12-09 2015-12-09 一种安全关键软件的健康管理方法

Publications (2)

Publication Number Publication Date
CN105404278A true CN105404278A (zh) 2016-03-16
CN105404278B CN105404278B (zh) 2018-08-03

Family

ID=55469821

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510906486.XA Active CN105404278B (zh) 2015-12-09 2015-12-09 一种安全关键软件的健康管理方法

Country Status (1)

Country Link
CN (1) CN105404278B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107968727A (zh) * 2017-11-29 2018-04-27 郑州云海信息技术有限公司 一种cifs服务的检测方法、装置及介质
CN112541008A (zh) * 2020-12-09 2021-03-23 中国航空工业集团公司沈阳飞机设计研究所 一种飞机健康诊断判据方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080040152A1 (en) * 2006-08-10 2008-02-14 The Boeing Company Systems and Methods for Health Management of Single or Multi-Platform Systems
CN102592011A (zh) * 2011-12-30 2012-07-18 清华大学 基于随机Petri网的分层航空操作系统HM/FM建模与评价方法
CN103605608A (zh) * 2013-12-04 2014-02-26 中国航空综合技术研究所 一种嵌入式软件安全性分析充分性检查方法
CN103617074A (zh) * 2013-11-29 2014-03-05 中国航空无线电电子研究所 软件通信体系架构逻辑设备系统及监测、查询与控制方法
US20140324786A1 (en) * 2013-04-24 2014-10-30 The Boeing Company Anomaly detection in chain-of-custody information
CN104133734A (zh) * 2014-07-29 2014-11-05 中国航空无线电电子研究所 分布式综合模块化航空电子系统混合式动态重构系统与方法
CN104360868A (zh) * 2014-11-29 2015-02-18 中国航空工业集团公司第六三一研究所 一种大型飞机综合处理平台中的多级故障管理方法
CN104732105A (zh) * 2015-04-08 2015-06-24 西安电子科技大学 一种组件化系统设计的故障模式与影响分析方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080040152A1 (en) * 2006-08-10 2008-02-14 The Boeing Company Systems and Methods for Health Management of Single or Multi-Platform Systems
CN102592011A (zh) * 2011-12-30 2012-07-18 清华大学 基于随机Petri网的分层航空操作系统HM/FM建模与评价方法
US20140324786A1 (en) * 2013-04-24 2014-10-30 The Boeing Company Anomaly detection in chain-of-custody information
CN103617074A (zh) * 2013-11-29 2014-03-05 中国航空无线电电子研究所 软件通信体系架构逻辑设备系统及监测、查询与控制方法
CN103605608A (zh) * 2013-12-04 2014-02-26 中国航空综合技术研究所 一种嵌入式软件安全性分析充分性检查方法
CN104133734A (zh) * 2014-07-29 2014-11-05 中国航空无线电电子研究所 分布式综合模块化航空电子系统混合式动态重构系统与方法
CN104360868A (zh) * 2014-11-29 2015-02-18 中国航空工业集团公司第六三一研究所 一种大型飞机综合处理平台中的多级故障管理方法
CN104732105A (zh) * 2015-04-08 2015-06-24 西安电子科技大学 一种组件化系统设计的故障模式与影响分析方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107968727A (zh) * 2017-11-29 2018-04-27 郑州云海信息技术有限公司 一种cifs服务的检测方法、装置及介质
CN112541008A (zh) * 2020-12-09 2021-03-23 中国航空工业集团公司沈阳飞机设计研究所 一种飞机健康诊断判据方法

Also Published As

Publication number Publication date
CN105404278B (zh) 2018-08-03

Similar Documents

Publication Publication Date Title
Johnson System health management
CN109976141B (zh) Uav传感器信号余度表决系统
Rushby Runtime certification
Simeu-Abazi et al. A methodology of alarm filtering using dynamic fault tree
CN103544092A (zh) 一种基于arinc653标准机载电子设备健康监控体系
Hoque et al. Towards an accurate reliability, availability and maintainability analysis approach for satellite systems based on probabilistic model checking
KR20180067402A (ko) 비행기 고장 처리를 위한 시스템과 방법 및 이를 달성하기 위한 컴퓨터 설비
Jia et al. Reliability analysis of standby systems with multi‐state elements subject to constant transition rates
Shi et al. Reliability and safety analysis of redundant vehicle management computer system
CN105404278A (zh) 一种安全关键软件的健康管理方法
Kumar et al. Performance and cost benefit analysis of a hardware-software system considering hardware based software interaction failures and different types of recovery
Johnson et al. System health management theory and design strategies
Hecht et al. Use of importance sampling and related techniques to measure very high reliability software
Cazorla et al. A three-stage analysis of IDS for critical infrastructures
Ahangari et al. Analysis of design parameters in safety-critical computers
Yang et al. A combination method for integrated modular avionics safety analysis
Villalta et al. Dependability in FPGAs, a review
Thane Safe and Reliable Computer Control Systems Concepts and Methods
Braband et al. Proven in use for software: assigning an SIL based on statistics
Mo et al. Human error tolerant design for air traffic control systems
CN117634013B (zh) 一种面向系统动力装置msg-3分析过程中功能定义的方法
Santhosh et al. Resilience Engineering: Principles, Methods, and Applications to Critical Infrastructure Systems
Durmaz et al. Reliability considerations for design of space systems
Karimi et al. Notice of Retraction: Accurate and efficient reliability Markov model analysis of predictive hybrid m-out-of-n systems
CN114791830B (zh) 用于控制和自动重启技术装置的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant