CN113157519B - 一种嵌入式计算机系统故障辅助定位架构及方法 - Google Patents
一种嵌入式计算机系统故障辅助定位架构及方法 Download PDFInfo
- Publication number
- CN113157519B CN113157519B CN202110240898.XA CN202110240898A CN113157519B CN 113157519 B CN113157519 B CN 113157519B CN 202110240898 A CN202110240898 A CN 202110240898A CN 113157519 B CN113157519 B CN 113157519B
- Authority
- CN
- China
- Prior art keywords
- fault
- information
- software
- embedded computer
- nonvolatile memory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000012544 monitoring process Methods 0.000 claims abstract description 17
- 238000012423 maintenance Methods 0.000 claims abstract description 9
- 230000004807 localization Effects 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 abstract description 5
- 230000006870 function Effects 0.000 description 7
- 238000011161 development Methods 0.000 description 6
- 230000018109 developmental process Effects 0.000 description 6
- 238000011835 investigation Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000033772 system development Effects 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3013—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is an embedded system, i.e. a combination of hardware and software dedicated to perform a certain function in mobile devices, printers, automotive or aircraft systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/26—Functional testing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3051—Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Computer Hardware Design (AREA)
- Mathematical Physics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明属于机载嵌入式计算机领域,本发明基于嵌入式计算机处理器+非易失存储器的硬件系统,采用在系统软件里进行软件打桩的方法实现对故障的辅助定位:在系统软件中设置故障监测点,根据空中发生故障的初步分析结合软件的运行情况,打桩软件以自定义周期获取故障发生时及前后的现场信息并调用非易失存储器的底层驱动程序以特定的故障现场信息条格式通过处理器将故障现场信息存储于嵌入式计算机系统非易失存储单元中。当飞机空中故障复现并完成故障现场的信息捕获记录后,在飞机地面维护状态下对存储于非易失存储器中的故障监测数据进行卸载并分析,为进一步高效定位故障提供有力支撑。
Description
技术领域
本发明属于机载嵌入式计算机领域,尤其涉及一种嵌入式计算机系统故障辅助定位架构及方法。
背景技术
机载嵌入式计算机系统发展速度快、集成度高、技术复杂,硬件通常具有处理器和非易失存储器等资源,软件通常包含引导程序、操作系统程序、底层驱动程序以及应用程序。在系统研制阶段,由于飞机环境的复杂性和特殊性,一些系统故障只偶发出现于飞机飞行过程中,在飞机地面维护状态下复现概率低、追溯性差、排查难度大,需要一种能够辅助快速定位故障发生原因的方法。
发明内容
本发明的目的是:在机载嵌入式计算机系统研制阶段,当飞机空中状态发生地面维护态较难复现的故障时,提供一种嵌入式计算机系统故障辅助定位架构及方法,用于周期监测和记录故障现场信息。在不增加系统成本和影响系统功能的条件下,为后续对疑难故障的排查提供准确方向,提高排查效率,缩短研制周期。
本发明的技术解决方案是:
技术方案一:
一种嵌入式计算机系统故障辅助定位架构,包括:机载嵌入式计算机系统硬件、机载嵌入式计算机系统软件,以及嵌入在机载嵌入式计算机系统软件中的打桩软件,所述打桩软件用于监测和记录故障发生时及故障发生前后的故障现场信息,并按自定义的结构体格式将捕获的现场信息记录于机载嵌入式计算机系统硬件中。
本发明技术方案一的特点和进一步的改进为:
(1)机载嵌入式计算机系统软件包含:应用程序、底层驱动程序、操作系统程序和引导程序,所述打桩软件嵌入应用程序、底层驱动程序、操作系统程序和引导程序中的至少一个程序。
(2)机载嵌入式计算机系统硬件至少包含:处理器和非易失存储器,所述处理器和非易失存储器通过局部总线连接;所述打桩软件将故障现场信息通过机载嵌入式计算机软件中的底层驱动程序调度处理器记录于非易失存储器中。
技术方案二:
一种嵌入式计算机系统故障辅助定位方法,所述方法包括:
S1,在飞机处于空中飞行状态下,由上级系统或者飞行员开启打桩软件;开启打桩软件表示打桩软件开始监测和记录故障现场信息;
S2,打桩软件以自定义周期捕获故障现场信息,并将捕获的故障现场信息按照自定义的结构体格式组织后生成信息条;所述信息条为固定长度,且每个信息条由索引号及故障现场信息组成;索引号用以表示周期捕获和记录的信息条的编码;
S3,通过机载嵌入式计算机软件中的底层驱动程序调度处理器将所述信息条记录于非易失存储器中。
本发明技术方案二的特点和进一步的改进为:
(1)所述方法还包括:S3之后,所述方法还包括:当打桩软件记录到故障信息后,通过上级软件或者飞行员将打桩软件关闭。
(2)判断打桩软件记录到故障信息的方式为:
打桩软件根据记录的现场信息,通过故障判定条件来判断所述现场信息是否为故障现场信息;
或者,飞行员通过飞机状态信息确定发生故障。
(3)S3具体为:
采用循环记录方式将多个信息条按照索引号从小到大的顺序记录于非易失存储器,当非易失存储器容量记满时,从非易失存储器起始地址开始覆盖记录。
(4)所述故障现场信息至少包含:
周期记录的时间、加电次数、故障状态信息;
周期记录时间为每个周期捕获故障现场信息的时间;
加电次数为机载嵌入式计算机系统当次加电的次数;
故障状态信息为:处理器的资源占用信息以及堆栈状态,或者发生故障的软件分支异常信息,或者计算机系统工作温度。
(5)飞机地面维护状态下,通过卸载记录于非易失存储器中的故障现场信息,分析故障现场信息,排查定位故障原因。
本发明具有的优点效果是:在机载嵌入式计算机系统研制阶段飞机空中发生地面维护状态难以复现的故障时,能快速、准确捕获和记录故障发生时及前后的现场信息,可为定位飞机空中发生疑难故障提供准确方向,提高排查效率,缩短研制周期,且该方法复用了系统的原有物理资源,不增加额外物理资源和成本,具有较高的经济性,通过对监测捕获周期的合理设计亦不影响系统的功能性能。
附图说明
图1是机载嵌入式计算机系统的架构框图;
图2是打桩软件监测和记录过程流程图。
具体实施方式
以下对本发明进行详述:
本发明技术方案提供的机载嵌入式计算机系统由硬件+软件构成,硬件通常包括处理器、非易失存储器以及其它硬件资源,软件通常包括四层:引导程序、操作系统程序、底层驱动程序以及应用程序。故障辅助定位设计方法是根据具体故障现象的排查需要,在系统软件任意层嵌入打桩软件。打桩软件监测和记录功能在飞行过程中由上级系统或飞行员启动,以自定义周期性捕获即将发生的故障现场信息,并将捕获的信息按照自定义的结构体格式组织后生成固定长度的信息条后按照信息条的索引号由小到大追加记录于系统的非易失存储器。故障发生后,打桩软件由上级系统和飞行员手动关闭监测功能,在飞机地面维护状态下对存储于非易失存储器中的故障监测数据进行卸载分析,进一步定位故障原因。
用于故障现场信息记录的结构体通常根据具体故障现象初步分析后自定义,结构体里包括有利于故障分析的所有可获取的数据信息,通常包括信息条索引号、周期记录的时间、加电次数、故障状态信息等信息字段。信息条索引号用以表示周期捕获和记录的信息条的编码;周期记录时间即为每个周期捕获故障现场信息的时间;加电次数为机载嵌入式计算机系统当次加电的次数;故障状态信息根据故障现象不同,状态信息定义不同,如处理器的资源占用信息,发生故障的软件分支异常信息等。
由于采用周期性捕获故障现场信息追加记录于非易失存储器的方法,为防止非易失存储器容量记满,采用循环记录方式,即当非易失存储器容量记满时,可从非易失存储器起始地址开始覆盖记录。软件打桩的目的是捕获故障发生时及前后的现场信息,通过捕获周期长短以及监测信息结构体大小的合理设计可避免有用的故障监测信息被覆盖。
具体的,本发明提供的嵌入式计算机系统架构组成如附图1所示,包括以下部分:
(1)处理器
实现嵌入式计算机系统的运算、任务调度以及控制等工作,向上运行引导程序、操作系统程序、底层驱动程序和应用程序,向下通过局部总线连接非易失存储器。通常采用PowerPC处理器、DSP等。
(2)非易失存储器
与处理器采用局部总线连接,作为处理器的从设备,实现异常故障监测信息和其它信息的存储。通常采用FLASH、nvSRAM等。
(3)嵌入式计算机软件
包括引导程序、操作系统程序、底层驱动程序和应用程序。引导程序用于嵌入式计算机系统的配置及启动;操作系统程序实现处理器的任务调度、内存管理等功能;底层驱动程序向上层应用提供底层硬件资源的访问接口;应用程序通过调用底层驱动软件实现嵌入式计算机系统预期的功能。
(4)打桩软件
打桩软件根据具体故障信息和实际分析需求,可嵌入各层系统软件中,实现故障发生时及前后的故障现场信息监测和记录,并按自定义的结构体格式将捕获的现场信息按信息条索引号由小到大的顺序通过嵌入式计算机底层驱动软件调度处理器记录于非易失存储器中。
本发明涉及的机载嵌入式计算机系统硬件采用PowerPC处理器+非易失存储器nvSRAM+其它硬件资源的架构,软件包括:引导程序、操作系统程序、驱动程序以及应用程序,操作系统程序采用Vxworks。
以某嵌入式计算机系统文件系统空中状态偶发无法写入故障为例,打桩软件嵌入于应用程序和底层驱动程序,用于监测某文件系统文件空中偶发无法写入故障。打桩软件的故障检测自定义结构体针对文件系统无法写入故障,定义了信息条索引号、周期记录的时间(包括年月日时分秒)、加电次数、应用程序无法写入文件的文件索引号、执行的文件操作IO接口、执行错误的代码行数、处理器温度,结构体定义12字节。周期根据系统应用程序实际用况采用不影响应用执行效率的2秒周期任务监测文件系统的运行情况,并将监测的结构体信息条通过底层驱动程序调度处理器循环记录于非易失存储器nvSRAM中,nvSRAM用于故障记录信息存储的可用空间为24KB,可记录故障现场信息达2000条,PowerPC处理器采用LBE总线访问nvSRAM。
参见图2,飞机空中状态下,打开打桩软件的监测和记录功能,打桩软件周期性获取即将发生故障现场状态信息,并将信息按照自定义的结构体格式(包括索引号、周期记录时间、加电次数、发生故障的文件信息、调用的底层IO操作信息等)进行组织以信息条形式按索引号由小到大追加记录于nvSRAM中,当故障发生后,获取故障现场状态信息,并按照相同的信息格式追加记录于nvSRAM,每次获取的现场信息条索引号加1,若nvSRAM记录已满即信息条索引号大于2000,信息条索引号置1,从nvSRAM的故障记录信息起始位置覆盖记录。
在完成故障现场信息监测和记录后,通过上级软件或者飞行员将打桩软件关闭。飞机落地后,在地面维护状态写通过卸载和分析记录于nvSRAM中的故障监测信息,进一步定位故障原因。
本发明技术方案提出的机载计算机系统故障辅助定位设计方法通过对故障初步分析,在机载嵌入式计算机系统相应软件层中进行软件打桩。在飞机空中状态下,启动打桩软件的监测和记录功能,对故障需要监测的现场信息以自定义的周期周期性进行捕获,并将捕获的信息以自定义的结构体格式进行组织,通过调用底层驱动程序存储于非易失存储器中;当飞机降落后处于地面维护状态时,从非易失存储器中卸载相应记录数据,通过对记录数据分析支撑故障原因的进一步快速排查。本方法可为空中故障原因的排查定位提供准确的故障现场信息,提高排查效率,缩短研制周期,且该方法复用了系统的原有物理资源,不增加额外硬件资源和成本,通过对监测捕获周期的合理设计亦不影响系统的功能性能。
Claims (3)
1.一种嵌入式计算机系统故障辅助定位架构,其特征在于,包括:机载嵌入式计算机系统硬件、机载嵌入式计算机系统软件,以及嵌入在机载嵌入式计算机系统软件中的打桩软件,所述打桩软件用于监测和记录故障发生时及故障发生前后的故障现场信息,并按自定义的结构体格式将捕获的现场信息记录于机载嵌入式计算机系统硬件中;
机载嵌入式计算机系统硬件至少包含:处理器和非易失存储器,所述处理器和非易失存储器通过局部总线连接;所述打桩软件将故障现场信息通过机载嵌入式计算机软件中的底层驱动程序调度处理器记录于非易失存储器中;
机载嵌入式计算机系统软件包含:应用程序、底层驱动程序、操作系统程序和引导程序,所述打桩软件嵌入应用程序、底层驱动程序、操作系统程序和引导程序中的至少一个程序;
基于所述故障辅助定位架构的故障辅助定位方法,所述方法包括:
S1,在飞机处于空中飞行状态下,由上级系统或者飞行员开启打桩软件;开启打桩软件表示打桩软件开始监测和记录故障现场信息;
S2,打桩软件以自定义周期捕获故障现场信息,并将捕获的故障现场信息按照自定义的结构体格式组织后生成信息条;所述信息条为固定长度,且每个信息条由索引号及故障现场信息组成;索引号用以表示周期捕获和记录的信息条的编码;
S3,通过机载嵌入式计算机软件中的底层驱动程序调度处理器将所述信息条记录于非易失存储器中;
S3之后,所述方法还包括:当打桩软件记录到故障信息后,通过上级软件或者飞行员将打桩软件关闭;判断打桩软件记录到故障信息的方式为:打桩软件根据记录的现场信息,通过故障判定条件来判断所述现场信息是否为故障现场信息;或者,飞行员通过飞机状态信息确定发生故障;
飞机地面维护状态下,通过卸载记录于非易失存储器中的故障现场信息,分析故障现场信息,排查定位故障原因。
2.根据权利要求1所述的一种嵌入式计算机系统故障辅助定位架构,其特征在于,S3具体为:
采用循环记录方式将多个信息条按照索引号从小到大的顺序记录于非易失存储器,当非易失存储器容量记满时,从非易失存储器起始地址开始覆盖记录。
3.根据权利要求1所述的一种嵌入式计算机系统故障辅助定位架构,其特征在于,所述故障现场信息至少包含:
周期记录的时间、加电次数、故障状态信息;
周期记录时间为每个周期捕获故障现场信息的时间;
加电次数为机载嵌入式计算机系统当次加电的次数;
故障状态信息为:处理器的资源占用信息以及堆栈状态,或者发生故障的软件分支异常信息,或者计算机系统工作温度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110240898.XA CN113157519B (zh) | 2021-03-04 | 2021-03-04 | 一种嵌入式计算机系统故障辅助定位架构及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110240898.XA CN113157519B (zh) | 2021-03-04 | 2021-03-04 | 一种嵌入式计算机系统故障辅助定位架构及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113157519A CN113157519A (zh) | 2021-07-23 |
CN113157519B true CN113157519B (zh) | 2024-05-24 |
Family
ID=76884185
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110240898.XA Active CN113157519B (zh) | 2021-03-04 | 2021-03-04 | 一种嵌入式计算机系统故障辅助定位架构及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113157519B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115509794A (zh) * | 2022-10-20 | 2022-12-23 | 北京和欣运达科技有限公司 | 一种嵌入式智能设备的故障追踪方法及系统 |
CN116430835B (zh) * | 2023-06-13 | 2023-09-15 | 力高(山东)新能源技术股份有限公司 | 一种Cortex-M微控制器的故障存储与分析方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102096634A (zh) * | 2010-12-31 | 2011-06-15 | 中国航空工业集团公司第六三一研究所 | 基于事件级的机载分布式节点调试方法 |
CN106201892A (zh) * | 2016-07-20 | 2016-12-07 | 中国航空工业集团公司航空动力控制系统研究所 | 用于嵌入式软件的异常中断源定位检测方法 |
CN107590078A (zh) * | 2017-09-25 | 2018-01-16 | 中国航空工业集团公司西安飞机设计研究所 | 一种控制律软件的打桩方法 |
CN108132871A (zh) * | 2017-12-07 | 2018-06-08 | 中国航空工业集团公司西安航空计算技术研究所 | 一种机载计算机接口故障记录方法 |
CN108614764A (zh) * | 2016-12-12 | 2018-10-02 | 中国航空工业集团公司西安航空计算技术研究所 | Ima应用软件故障注入方法 |
-
2021
- 2021-03-04 CN CN202110240898.XA patent/CN113157519B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102096634A (zh) * | 2010-12-31 | 2011-06-15 | 中国航空工业集团公司第六三一研究所 | 基于事件级的机载分布式节点调试方法 |
CN106201892A (zh) * | 2016-07-20 | 2016-12-07 | 中国航空工业集团公司航空动力控制系统研究所 | 用于嵌入式软件的异常中断源定位检测方法 |
CN108614764A (zh) * | 2016-12-12 | 2018-10-02 | 中国航空工业集团公司西安航空计算技术研究所 | Ima应用软件故障注入方法 |
CN107590078A (zh) * | 2017-09-25 | 2018-01-16 | 中国航空工业集团公司西安飞机设计研究所 | 一种控制律软件的打桩方法 |
CN108132871A (zh) * | 2017-12-07 | 2018-06-08 | 中国航空工业集团公司西安航空计算技术研究所 | 一种机载计算机接口故障记录方法 |
Non-Patent Citations (1)
Title |
---|
基于上下文的飞控软件老化缺陷定位方法研究;杜晓婷等;《计算机科学与探索》;第1214页至第1223页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113157519A (zh) | 2021-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113157519B (zh) | 一种嵌入式计算机系统故障辅助定位架构及方法 | |
JP2557180B2 (ja) | ソフトウェア例外条件に対する選択的データ捕獲方法 | |
CN103415840A (zh) | 跨硬件层和软件层的错误管理 | |
CN109213132A (zh) | 一种uds诊断接口软件生成的方法、装置及设备 | |
CN106537351B (zh) | 用于诊断无线通信设备中的电源故障的方法 | |
CN100388234C (zh) | 一种基于有限状态机的对内存变量改写进行监控的方法 | |
CN110659197B (zh) | 应用程序的测试用例生成方法、装置和软件测试系统 | |
CN114915643B (zh) | 铁路信号集中监测系统的配置方法、装置、设备及介质 | |
US7546488B2 (en) | Event logging and analysis in a software system | |
CN109189607B (zh) | 一种应用程序断点恢复的方法 | |
CN110515758A (zh) | 一种故障定位方法、装置、计算机设备及存储介质 | |
CN105988885A (zh) | 基于补偿回滚的操作系统故障自恢复方法 | |
CN113742166B (zh) | 一种服务器系统器件日志记录方法、装置及系统 | |
EP3958124B1 (en) | Flight management system and method for reporting an intermitted error | |
CN111797032B (zh) | 存储结构、方法、装置、设备及可读存储介质 | |
CN114911578A (zh) | 存储系统监控及故障收集方法、装置、终端及存储介质 | |
WO2008095829A1 (en) | Changing parameters in a tested system using virtual working pages | |
CN112732522A (zh) | 一种车载mcu可配置日志存储解析方法和系统 | |
CN116932334A (zh) | 多核微控制单元的异常复位监控方法及装置 | |
US9710319B2 (en) | Information processing apparatus and information collection method | |
JP7180319B2 (ja) | 情報処理装置、及び情報処理装置のダンプ管理方法 | |
CN108268336A (zh) | 保证元数据一致性的方法及装置 | |
CN116775587A (zh) | 一种记录采集终端运行信息的方法和装置 | |
CN116414062A (zh) | 一种基于状态的航电系统平台健康监控方法 | |
CN118193466A (zh) | 日志管理方法、装置、存储介质及嵌入式设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |