CN114706702A - 一种基于fadec操作系统的故障快速定位方法 - Google Patents

一种基于fadec操作系统的故障快速定位方法 Download PDF

Info

Publication number
CN114706702A
CN114706702A CN202210211463.7A CN202210211463A CN114706702A CN 114706702 A CN114706702 A CN 114706702A CN 202210211463 A CN202210211463 A CN 202210211463A CN 114706702 A CN114706702 A CN 114706702A
Authority
CN
China
Prior art keywords
fault
address
operating system
task
positioning method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210211463.7A
Other languages
English (en)
Inventor
胡森
王阳
杨云强
林志强
丁夕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AECC Aero Engine Control System Institute
Original Assignee
AECC Aero Engine Control System Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AECC Aero Engine Control System Institute filed Critical AECC Aero Engine Control System Institute
Priority to CN202210211463.7A priority Critical patent/CN114706702A/zh
Publication of CN114706702A publication Critical patent/CN114706702A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Retry When Errors Occur (AREA)

Abstract

本发明公开了一种基于FADEC操作系统的故障快速定位方法,当FADEC操作系统发生任务超时故障或非预期异常中断故障时,用外设存储器记录发生的故障的地址和类型,由故障引发看门狗复位后,操作系统用串口打印故障信息,或操作系统从外设存储器中读取故障信息传递给应用层,用监视上位机监视,从而快速定位故障。本发明可快速定位故障位置,极大地提高了软件的排故效率,降低了软件的维护成本。

Description

一种基于FADEC操作系统的故障快速定位方法
技术领域
本发明涉及FADEC操作系统,特别是一种基于FADEC操作系统的故障快速定位方法。
背景技术
FADEC操作系统全称全权限数字发动机控制器操作系统,可提高发动机的运行效率和可靠性。FADEC操作系统是安全关键嵌入式操作系统,它通过定时中断对各个任务进行调度,从而严格控制各个任务按照既定的周期与时序运行。
然而在软件设计过程中,往往会因为设计缺陷导致FADEC操作系统出现各类故障,使得任务执行错误,严重的可导致发动机烧毁。因此,在操作操作系统试验过程中就应该尽早发现故障,常见的故障包括任务超时故障、非预期异常中断故障等。目前FADEC操作系统还未引入故障快速定位方法,当发生故障时需要设计人员逐条分析代码寻找故障地址和故障类型,大大降低了开发效率,提高了维护成本。
发明内容
发明目的:本发明的目的是提供一种基于FADEC操作系统的故障快速定位方法,从而极大地提高软件的排故效率,降低软件的维护成本。
技术方案:本发明所述的一种基于FADEC操作系统的故障快速定位方法的原理为:当FADEC操作系统发生任务超时故障或非预期异常中断故障时,用外设存储器记录发生的故障的地址和类型,由故障引发看门狗复位后,操作系统用串口打印故障信息,或操作系统从外设存储器中读取故障信息传递给应用层,用监视上位机监视,从而快速定位故障。
所述方法基于以下条件实现:硬件提供外设储存器,当断电或者复位时存储信息不会丢失;硬件提供复位源信息供软件读取,可监视复位源是上电复位还是看门狗复位;软件提供监视上位机,监视打印的故障信息。
所述方法主要包括任务超时故障快速定位方法和非预期异常中断故障快速定位方法,具体如下:
(1)任务超时故障快速定位方法;
(1.1)在每个定时中断的函数入口处获取被打断的地址;如果操作系统软件正常运行,被打断的地址是后台地址;如果前台任务发生了任务超时故障,被打断的是前台任务发生任务超时故障的地址;
(1.2)将每个被打断的地址存入外设存储器,若发生任务超时故障则会引发看门狗复位;
(1.3)发生复位后,操作系统读取记录的任务超时故障地址,并通过串口打印该地址;或者将地址传递给应用层,在监视上位机监视;
(1.4)通过查看复位源判断该地址是否有效,只有当是因为看门狗超时引起复位时,该地址有效;
(1.5)查看编译链接文件,根据记录的超时任务地址查找发生故障的代码位置;
(2)非预期异常中断故障快速定位方法;
(2.1)在每个非预期异常中断的异常处理函数入口处获取发生异常中断的地址和异常类型;操作系统软件正常运行时不会进入异常处理函数;
(2.2)当发生非预期异常中断时,将异常信息存入外设存储器,同时用串口打印异常信息,并做超时处理,触发看门狗复位;若复位后仍会发生相同异常,则串口频繁打印异常信息;
(2.3)若复位后故障消除,软件正常运行,则可以从外设存储器中读取记录的异常信息,传递给应用层,在监视上位机查看;
(2.4)查看编译链接文件,根据记录的异常信息,寻找发生故障的代码位置。
一种计算机存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的一种基于FADEC操作系统的故障快速定位方法。
一种计算机设备,包括储存器、处理器及存储在存储器上并可再处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的一种基于FADEC操作系统的故障快速定位方法。
有益效果:与现有技术相比,本发明具有如下优点:在FADEC操作系统中,当软件发生任务超时故障或者发生非预期异常中断故障时,用外设存储器记录发生的故障的地址和类型,由故障引发看门狗复位后,操作系统用串口打印故障信息,或操作系统从外设存储器中读取故障信息传递给应用层,用监视上位机监视,可快速定位故障位置,极大地提高了软件的排故效率,降低了软件的维护成本。
附图说明
图1为本发明的步骤流程图;
图2为任务超时故障快速定位原理图;
图3为非预期异常中断故障快速定位原理图;
图4为任务超时信息据结构设计图;
图5为异常信息数据结构设计图。
具体实施方式
下面结合附图对本发明的技术方案作进一步说明。
如图1所示,一种基于FADEC操作系统的故障快速定位方法主要包括任务超时故障快速定位方法和非预期异常中断故障快速定位方法,其中,任务超时故障快速定位方法的原理图见图2,非预期异常中断故障快速定位方法的原理图见图3,具体如下:
(1)任务超时故障快速定位方法。
(1.1)在每个定时中断的函数入口处获取被打断的地址;如果操作系统软件正常运行,被打断的地址是后台地址;如果前台任务发生了任务超时故障,被打断的是前台任务发生任务超时故障的地址;对于PowerPC架构的处理器,当中断或者异常被识别后,最基本的器件模式信息被保存到存储/恢复寄存器对SRR0/SRR1中。其中,中断返回地址被保存到SRR0寄存器,器件模式寄存器MSR的值被保存到SRR1中。本方法需要读取SRR0寄存器的值,获取被打断的地址。
(1.2)将每个被打断的地址存入外设存储器,若发生任务超时故障则会引发看门狗复位;外设存储器是非易失存储器,比如NvRAM或FLASH,看门狗复位后不会丢失记录的被中断返回地址。
(1.3)发生复位后,操作系统读取记录的任务超时故障地址,并通过串口打印该地址;或者将地址传递给应用层,在监视上位机监视;记录或者打印的任务超时信息数据结构设计如图4所示。
(1.4)硬件提供复位源信息供软件读取,可监视复位源是上电复位还是看门狗复位;软件通过查看复位源判断该地址是否有效,只有当是因为看门狗超时引起复位时,该地址有效,认为已经发生了任务超时故障。
(1.5)查看编译链接文件,根据记录的超时任务地址查找发生故障的代码位置;
(2)非预期异常中断故障快速定位方法;
(2.1)在每个非预期异常中断的异常处理函数入口处获取发生异常中断的地址和异常类型;操作系统软件正常运行时不会进入异常处理函数;对于PowerPC架构的处理器,当中断或者异常被识别后,最基本的器件模式信息被保存到存储/恢复寄存器对SRR0/SRR1中。其中,中断返回地址被保存到SRR0寄存器,器件模式寄存器MSR的值被保存到SRR1中。此外,PowerPC架构的处理器还提供异常特征寄存器ESR,由于有一些异常情况共用了一个中断或异常向量,通过检查ESR来请确定发生了哪种异常情况;提供数据异常地址寄存器DEAR,可帮助操作系统代码定位引发访问权限异常的地址。本方法需要读取SRR0寄存器的值,获取被打断的地址;读取SSR1寄存器的值,获取器件的工作模式;读取ESR寄存器,检查异常情况;读取DEAR寄存器,获取异常数据地址;在不同类型的异常处理函数入口记录异常类型号。
(2.2)当发生非预期异常中断时,将异常信息存入外设存储器,同时用串口打印异常信息,并做超时处理,触发看门狗复位;外设存储器是非易失存储器,比如NvRAM或FLASH,看门狗复位后不会丢失记录的异常信息。若复位后仍会发生相同异常,则串口频繁打印异常信息,相同的异常信息也会写入相同位置的外设存储器。记录或者打印的异常信息数据结构设计如图5所示。
(2.3)若复位后故障消除,软件正常运行,则可以从外设存储器中读取记录的异常信息,传递给应用层,在监视上位机查看;
(2.4)查看编译链接MAP文件,根据记录的异常信息,寻找发生故障的代码位置。

Claims (3)

1.一种基于FADEC操作系统的故障快速定位方法,其特征在于,主要包括任务超时故障快速定位方法和非预期异常中断故障快速定位方法,具体如下:
(1)任务超时故障快速定位方法;
(1.1)在每个定时中断的函数入口处获取被打断的地址;如果操作系统软件正常运行,被打断的地址是后台地址;如果前台任务发生了任务超时故障,被打断的是前台任务发生任务超时故障的地址;
(1.2)将每个被打断的地址存入外设存储器,若发生任务超时故障则会引发看门狗复位;
(1.3)发生复位后,操作系统读取记录的任务超时故障地址,并通过串口打印该地址;或者将地址传递给应用层,在监视上位机监视;
(1.4)通过查看复位源判断该地址是否有效,只有当是因为看门狗超时引起复位时,该地址有效;
(1.5)查看编译链接文件,根据记录的超时任务地址查找发生故障的代码位置;
(2)非预期异常中断故障快速定位方法;
(2.1)在每个非预期异常中断的异常处理函数入口处获取发生异常中断的地址和异常类型;操作系统软件正常运行时不会进入异常处理函数;
(2.2)当发生非预期异常中断时,将异常信息存入外设存储器,同时用串口打印异常信息,并做超时处理,触发看门狗复位;若复位后仍会发生相同异常,则串口频繁打印异常信息;
(2.3)若复位后故障消除,软件正常运行,则可以从外设存储器中读取记录的异常信息,传递给应用层,在监视上位机查看;
(2.4)查看编译链接文件,根据记录的异常信息,寻找发生故障的代码位置。
2.一种计算机存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1中所述的一种基于FADEC操作系统的故障快速定位方法。
3.一种计算机设备,包括储存器、处理器及存储在存储器上并可再处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1中所述的一种基于FADEC操作系统的故障快速定位方法。
CN202210211463.7A 2022-02-28 2022-02-28 一种基于fadec操作系统的故障快速定位方法 Pending CN114706702A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210211463.7A CN114706702A (zh) 2022-02-28 2022-02-28 一种基于fadec操作系统的故障快速定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210211463.7A CN114706702A (zh) 2022-02-28 2022-02-28 一种基于fadec操作系统的故障快速定位方法

Publications (1)

Publication Number Publication Date
CN114706702A true CN114706702A (zh) 2022-07-05

Family

ID=82166246

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210211463.7A Pending CN114706702A (zh) 2022-02-28 2022-02-28 一种基于fadec操作系统的故障快速定位方法

Country Status (1)

Country Link
CN (1) CN114706702A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117806870A (zh) * 2024-02-29 2024-04-02 双一力(宁波)电池有限公司 一种故障代码定位方法及相关装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117806870A (zh) * 2024-02-29 2024-04-02 双一力(宁波)电池有限公司 一种故障代码定位方法及相关装置
CN117806870B (zh) * 2024-02-29 2024-05-28 双一力(宁波)电池有限公司 一种故障代码定位方法及相关装置

Similar Documents

Publication Publication Date Title
EP0664511A2 (en) Microprocessor fault log
US5134701A (en) Test apparatus performing runtime replacement of program instructions with breakpoint instructions for processor having multiple instruction fetch capabilities
CN103559121A (zh) 基于日志注入的驱动配置调试方法
CN115495275B (zh) 一种存储系统及其控制方法
CN114706702A (zh) 一种基于fadec操作系统的故障快速定位方法
CN114385418A (zh) 通信设备的保护方法、装置、设备和存储介质
CN101533370B (zh) 一种内存异常访问定位方法及装置
US20070226471A1 (en) Data processing apparatus
CN111931191A (zh) Linux平台二进制软件堆溢漏洞动态检测方法及系统
CN116795576A (zh) 基于日志打印的设备驱动调试方法、装置和电子设备
CN115756935A (zh) 嵌入式软件系统的异常故障定位方法、装置及设备
CN115878363A (zh) 用于解析处理器异常的方法、装置及计算机可读存储介质
CN113094221B (zh) 故障注入方法、装置、计算机设备以及可读存储介质
CN115292082A (zh) 一种处理BIOS启动过程中Assert宕机故障的方法及系统
CN115576734A (zh) 一种多核异构日志存储方法和系统
US20160371501A1 (en) Tracing processing activity
CN116430835B (zh) 一种Cortex-M微控制器的故障存储与分析方法
CN118519842B (zh) 一种基于硬件虚拟化的自动调试方法
CN118779166A (zh) 不良内核的自检方法、多核芯片、自检系统及机器人
CN117667748B (zh) 一种基于复合框架的芯片系统级验证方法
CN118656242A (zh) 多核芯片的异常处理方法以及多核芯片
CN108415788B (zh) 用于对无响应处理电路作出响应的数据处理设备和方法
JPH06266573A (ja) 障害復旧情報管理システム
CN117012257A (zh) 一种机载设备中存储设备单粒子翻转检测方法
CN114416413A (zh) 一种操作系统死机的串口保存系统及保存方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination