CN115509794A - 一种嵌入式智能设备的故障追踪方法及系统 - Google Patents
一种嵌入式智能设备的故障追踪方法及系统 Download PDFInfo
- Publication number
- CN115509794A CN115509794A CN202211291873.3A CN202211291873A CN115509794A CN 115509794 A CN115509794 A CN 115509794A CN 202211291873 A CN202211291873 A CN 202211291873A CN 115509794 A CN115509794 A CN 115509794A
- Authority
- CN
- China
- Prior art keywords
- abnormal
- record
- recording
- sequence number
- state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 230000002159 abnormal effect Effects 0.000 claims abstract description 111
- 238000013500 data storage Methods 0.000 claims abstract description 27
- 230000005856 abnormality Effects 0.000 claims abstract description 11
- 238000004891 communication Methods 0.000 claims abstract description 10
- 238000005096 rolling process Methods 0.000 claims abstract description 6
- 230000000875 corresponding effect Effects 0.000 description 21
- 238000004590 computer program Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/079—Root cause analysis, i.e. error or fault diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0736—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in functional embedded systems, i.e. in a data processing system designed as a combination of hardware and software dedicated to performing a certain function
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明提供了一种嵌入式智能设备的故障追踪方法及系统,该方法包括:当发生状态异常时,向数据存储区存入一条与状态异常对应的异常记录,异常记录包括记录顺序号、异常识别号以及画像数据;依据时间顺序,逐个向数据存储区存入异常记录,形成环形队列记录区,当异常记录的个数超过环形队列记录区的底部时便卷回环形队列记录区的头部,其中,每增加一条异常记录,异常记录对应的记录顺序号加一,并在数据存储区的设定位置记下当前记录顺序号;当追踪故障时,通过通信接口读出当前记录顺序号以及所保存的按时间先后排列的近期历次异常记录。本发明基于“画像”的记录顺序号,快速查找到按时间先后排列的近期历次异常记录,提高故障追踪效率。
Description
技术领域
本发明涉及嵌入式智能设备技术领域,特别是涉及一种嵌入式智能设备的故障追踪方法及系统。
背景技术
嵌入式智能设备,如控制器、网关、路由器等,需要经历大量的“改进-测试-应用”循环,尤其到了后期,面对一些小概率的异常事件,难以捕捉证据,难以分析原因,难以彻底解决问题。究其原因,就是因为缺乏异常追踪系统,追踪故障、寻找证据变得极为困难。
追踪的关键是对内部状态的记录,称之“画像”,“画像”就是内部状态的集合,有如下特点:全面性,各种重要的状态变量、标志变量;过程性,不仅仅是当前时间点,而是最新的若干个连续时间点的记录。常见的日志记录各种操作,各种过程,往往不限制记录的多少,那是因为在较大的软件平台上有丰富的硬件资源支撑。但是嵌入式设备往往存在如下限制:存储资源有限,记录的文件不宜太大,不可无限制增长下去;实时性要求高,不宜过多耗费时间资源。因此,“画像”必须节约存储资源和时间资源,一般常规的操作或其它过程不做记录,必须有很强的选择性。因此,亟需一种“画像”查找更加方便的嵌入式智能设备的故障追踪方法。
发明内容
本发明的目的是提供一种嵌入式智能设备的故障追踪方法及系统,基于“画像”的记录顺序号,快速查找到按时间先后排列的近期历次异常记录,提高故障追踪效率。
为实现上述目的,本发明提供了如下方案:
一种嵌入式智能设备的故障追踪方法,包括如下步骤:
当嵌入式智能设备发生状态异常时,向数据存储区存入一条与所述状态异常对应的异常记录,所述异常记录包括记录顺序号、异常识别号以及与所述状态异常对应的画像数据;
依据时间顺序,针对设备发生的状态异常,逐个向数据存储区存入对应的异常记录,形成环形队列记录区,当异常记录超过环形队列记录区的底部时便卷回环形队列记录区的头部;
每增加一条异常记录,异常记录对应的记录顺序号加一,并在数据存储区的设定位置记下当前记录顺序号;
当追踪故障时,通过通信接口读出当前记录顺序号以及所保存的按时间先后排列的近期历次异常记录。
进一步的,所述异常识别号是根据状态异常的类型进行命名的,不同的状态异常命名为不同的异常识别号。
进一步的,所述状态异常对应的记录顺序号采用单字节表示,在0~255之间滚动,当超过255时归0。
进一步的,所述数据存储区的介质属于非易失器件EEPROM,且有固定地址。
进一步的,每条所述异常记录的数据等长,字节数相同。
进一步的,每条所述异常记录的画像数据的数据结构与所述状态异常的类型相对应。
进一步的,所述设备设置有通信接口,用于读出所述异常记录。
本发明还提供一种嵌入式智能设备的故障追踪系统,应用于上述的嵌入式智能设备的故障追踪方法,包括:
第一记录模块,用于当嵌入式智能设备发生状态异常时,向数据存储区存入一条与所述状态异常对应的异常记录,所述异常记录包括记录顺序号、异常识别号以及与所述状态异常对应的画像数据;
第二记录模块,用于依据时间顺序,针对设备发生的状态异常,逐个向数据存储区存入对应的异常记录,形成环形队列记录区,当异常记录超过环形队列记录区的底部时便卷回环形队列记录区的头部;
更新模块,用于每增加一条异常记录,异常记录对应的记录顺序号加一,并在数据存储区的固定地址记下当前记录顺序号;
查看模块,用于追踪故障时,通过通信接口读出当前记录顺序号以及所保存的按时间先后排列的近期历次异常记录。
根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明提供的嵌入式智能设备的故障追踪方法及系统,当发现嵌入式智能设备出现状态异常时触发异常记录,对“画像”数据进行记录,通过记录最新的若干次“画像”,便于对最新的状态异常的查找,记录画像的数据区是一个环形队列,当画像记录超过记录区底部时便卷回记录区头部,每增加一个记录便对异常记录中的顺序号加1(超过255时归0),数据存储区的固定地址记下当前记录顺序号;故障追踪的时候,通过当前记录顺序号,可以直接找出最新的异常记录位置,以及此前发生的几次异常记录,提高了“画像”数据的选择性,便于故障追踪。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明嵌入式智能设备的故障追踪方法的流程示意图;
图2为本发明异常记录的储存文件的文件结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种嵌入式智能设备的故障追踪方法,基于“画像”的记录顺序号,快速查找到按时间先后排列的近期历次异常记录,提高故障追踪效率。
“画像”需要具备两个方面的选择性:
1、记录时机上的选择性。为了解决异常小概率事件,必须建立异常状态监察及纠偏机制。异常状态的监察机制就是对于重要的状态变量、标志变量进行预先备份或计算校验字,定期巡回比对或校验,当发现状态异常时触发对“画像”的记录;记录之后进行执行纠偏。如果采用备份策略,可以直接用备份数据覆盖,如果用校验策略,可以用采用整体复位的策略。
2、画像数据的选择性。追踪系统所监察的异常数据有不同的类型,为了减少记录的资源消耗,对应不同的类型,可以选择不同的画像数据子集,就是从画像总集合中挑选与异常类型有相关性的子集。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明提供的嵌入式智能设备的故障追踪方法,包括如下步骤:
当嵌入式智能设备发生状态异常时,向数据存储区存入一条与所述状态异常对应的异常记录,所述异常记录包括记录顺序号、异常识别号以及与所述状态异常对应的画像数据;所述设备为嵌入式智能设备;
依据时间顺序,针对设备发生的状态异常,逐个向数据存储区存入对应的异常记录,形成环形队列记录区,当异常记录超过环形队列记录区的底部时便卷回环形队列记录区的头部;
每增加一条异常记录,异常记录对应的记录顺序号加一,并在数据存储区的固定地址记下当前记录顺序号;所述固定地址可以为文件头的位置;
当追踪故障时,通过通信接口读出当前记录顺序号以及所保存的按时间先后排列的近期历次异常记录。通过当前记录顺序号,可以直接找出最新的异常记录位置,以及此前发生的几次异常记录。
其中,所述异常识别号是根据状态异常的类型进行命名的,不同的状态异常命名为不同的异常识别号;通过异常识别号就可以判断当前发生了什么类型的故障,提高故障追溯效率。
所述状态异常对应的记录顺序号采用单字节表示,在0~255之间滚动,当超过255时归0。当发生异常数据的时候,只要确实影响到用户使用,就会被用户发现,从而导出画像数据,因此,只需要记录最新的若干次画像数据即可。通过0~255记录顺序号的循环滚动,实现环形队列记录,后发生的异常记录可以覆盖之前发生的异常记录,节省内存空间,便于对最后发生的异常记录对应的画像数据进行查找,实现嵌入式智能设备的最新故障状态的追踪。
所述数据存储区的介质属于非易失器件EEPROM,且有固定地址,能够避免数据丢失,提高异常记录存储的安全可靠性。
每条所述异常记录的数据等长,字节数相同。
每条所述异常记录的画像数据的数据结构与所述状态异常的类型相对应。
如图2所示,每条所述异常记录的存储文件的头部固定位置和长度,包括固定的特殊标志,并动态存储当前记录顺序号;文件固定长度,当到文件末端时,自动滚动到0位置。所述状态异常对应的异常识别号可以分别采用A、B、C、D等形式表示。
所述设备设置有通信接口,用于读出所述异常记录,用户可以借此读出整个追踪文件。
本发明还提供一种嵌入式智能设备的故障追踪系统,应用于上述的嵌入式智能设备的故障追踪方法,包括:
第一记录模块,用于当嵌入式智能设备发生状态异常时,向数据存储区存入一条与所述状态异常对应的异常记录,所述异常记录包括记录顺序号、异常识别号以及与所述状态异常对应的画像数据;
第二记录模块,用于依据时间顺序,针对设备发生的状态异常,逐个向数据存储区存入对应的异常记录,形成环形队列记录区,当异常记录超过环形队列记录区的底部时便卷回环形队列记录区的头部;
更新模块,用于每增加一条异常记录,异常记录对应的记录顺序号加一,并在数据存储区的固定地址记下当前记录顺序号;
查看模块,用于追踪故障时,通过通信接口读出当前记录顺序号以及所保存的按时间先后排列的近期历次异常记录。
本发明提供的嵌入式智能设备的故障追踪方法及系统,当发现嵌入式智能设备出现状态异常时触发异常记录,对“画像”数据进行记录,通过记录最新的若干次“画像”,便于对最新的状态异常的查找,记录画像的数据区是一个环形队列,当画像记录超过记录区底部时便卷回记录区头部,每增加一个记录便对异常记录中的顺序号加1(超过255时归0),数据存储区的固定地址记下当前记录顺序号;故障追踪的时候,通过当前记录顺序号,可以直接找出最新的异常记录位置,以及此前发生的几次异常记录,提高了“画像”数据的选择性,便于故障追踪。
本发明还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述嵌入式智能设备的故障追踪方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述嵌入式智能设备的故障追踪方法。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (8)
1.一种嵌入式智能设备的故障追踪方法,其特征在于,包括以下步骤:
当嵌入式智能设备发生状态异常时,向数据存储区存入一条与所述状态异常对应的异常记录,所述异常记录包括记录顺序号、异常识别号以及与所述状态异常对应的画像数据;
依据时间顺序,针对设备发生的状态异常,逐个向数据存储区存入对应的异常记录,形成环形队列记录区,当异常记录超过环形队列记录区的底部时便卷回环形队列记录区的头部;
每增加一条异常记录,异常记录对应的记录顺序号加一,并在数据存储区的设定位置记下当前记录顺序号;
当追踪故障时,通过通信接口读出当前记录顺序号以及所保存的按时间先后排列的近期历次异常记录。
2.根据权利要求1所述的嵌入式智能设备的故障追踪方法,其特征在于,所述异常识别号是根据状态异常的类型进行命名的,不同的状态异常命名不同的异常识别号。
3.根据权利要求1所述的嵌入式智能设备的故障追踪方法,其特征在于,所述状态异常对应的记录顺序号采用单字节表示,在0~255之间滚动,当超过255时归0。
4.根据权利要求1所述的嵌入式智能设备的故障追踪方法,其特征在于,所述数据存储区的介质属于非易失器件EEPROM,且有固定地址。
5.根据权利要求1所述的嵌入式智能设备的故障追踪方法,其特征在于,每条所述异常记录的数据等长,字节数相同。
6.根据权利要求1所述的嵌入式智能设备的故障追踪方法,其特征在于,每条所述异常记录的画像数据的数据结构与所述状态异常的类型相对应。
7.根据权利要求1所述的嵌入式智能设备的故障追踪方法,其特征在于,所述嵌入式智能设备设置有通信接口,用于读出所述异常记录。
8.一种嵌入式智能设备的故障追踪系统,应用于权利要求1-7任一所述的嵌入式智能设备的故障追踪方法,其特征在于,包括:
第一记录模块,用于当嵌入式智能设备发生状态异常时,向数据存储区存入一条与所述状态异常对应的异常记录,所述异常记录包括记录顺序号、异常识别号以及与所述状态异常对应的画像数据;
第二记录模块,用于依据时间顺序,针对设备发生的状态异常,逐个向数据存储区存入对应的异常记录,形成环形队列记录区,当异常记录超过环形队列记录区的底部时便卷回环形队列记录区的头部;
更新模块,用于每增加一条异常记录,异常记录对应的记录顺序号加一,并在数据存储区的固定地址记下当前记录顺序号;
查看模块,用于追踪故障时,通过通信接口读出当前记录顺序号以及所保存的按时间先后排列的近期历次异常记录。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211291873.3A CN115509794A (zh) | 2022-10-20 | 2022-10-20 | 一种嵌入式智能设备的故障追踪方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211291873.3A CN115509794A (zh) | 2022-10-20 | 2022-10-20 | 一种嵌入式智能设备的故障追踪方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115509794A true CN115509794A (zh) | 2022-12-23 |
Family
ID=84509695
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211291873.3A Pending CN115509794A (zh) | 2022-10-20 | 2022-10-20 | 一种嵌入式智能设备的故障追踪方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115509794A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107908495A (zh) * | 2017-11-15 | 2018-04-13 | 南京南瑞继保电气有限公司 | 一种嵌入式系统异常记录展示方法 |
US20180329769A1 (en) * | 2017-05-15 | 2018-11-15 | Neusoft Corporation | Method, computer readable storage medium and electronic device for detecting anomalies in time series |
CN111600924A (zh) * | 2020-03-30 | 2020-08-28 | 北京和欣运达科技有限公司 | 一种数据通讯方法 |
CN113157519A (zh) * | 2021-03-04 | 2021-07-23 | 中国航空工业集团公司西安航空计算技术研究所 | 一种嵌入式计算机系统故障辅助定位架构及方法 |
CN114443339A (zh) * | 2022-01-29 | 2022-05-06 | 中国航空无线电电子研究所 | 基于双时间戳循环队列的错误日志记录方法 |
-
2022
- 2022-10-20 CN CN202211291873.3A patent/CN115509794A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180329769A1 (en) * | 2017-05-15 | 2018-11-15 | Neusoft Corporation | Method, computer readable storage medium and electronic device for detecting anomalies in time series |
CN107908495A (zh) * | 2017-11-15 | 2018-04-13 | 南京南瑞继保电气有限公司 | 一种嵌入式系统异常记录展示方法 |
CN111600924A (zh) * | 2020-03-30 | 2020-08-28 | 北京和欣运达科技有限公司 | 一种数据通讯方法 |
CN113157519A (zh) * | 2021-03-04 | 2021-07-23 | 中国航空工业集团公司西安航空计算技术研究所 | 一种嵌入式计算机系统故障辅助定位架构及方法 |
CN114443339A (zh) * | 2022-01-29 | 2022-05-06 | 中国航空无线电电子研究所 | 基于双时间戳循环队列的错误日志记录方法 |
Non-Patent Citations (2)
Title |
---|
(日)坂村健等: "《源码开放的嵌入式实时操作系统T-Kernel》", 31 October 2005, 北京航空航天大学出版社, pages: 325 - 326 * |
唐棠等: "《微型计算机(XT、AT、386)与接口技术》", 31 January 1995, 南京大学出版社, pages: 162 - 164 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9672085B2 (en) | Adaptive fault diagnosis | |
CN109240886B (zh) | 异常处理方法、装置、计算机设备以及存储介质 | |
CN106682162B (zh) | 日志管理方法及装置 | |
CN110266544B (zh) | 一种云平台微服务化服务失败的原因定位的装置及方法 | |
CN109460343A (zh) | 基于日志的系统异常监控方法、装置、设备及存储介质 | |
CN109474470A (zh) | 一种自监控方法和装置 | |
CN107171861A (zh) | 一种信息处理方法、电子设备和计算机存储介质 | |
CN114443441B (zh) | 一种存储系统管理方法、装置、设备及可读存储介质 | |
CN113050020A (zh) | 双芯智能电表的超差事件记录方法、装置和计算机设备 | |
CN110636116B (zh) | 一种多维数据采集的系统及方法 | |
CN108763046A (zh) | 线程运行监控方法、装置、计算机设备和存储介质 | |
CN108509322A (zh) | 避免过度回访的方法、电子装置及计算机可读存储介质 | |
CN111818097B (zh) | 基于行为的流量监测方法及装置 | |
CN110543398A (zh) | 一种故障信息的记录方法和系统 | |
CN115509794A (zh) | 一种嵌入式智能设备的故障追踪方法及系统 | |
JP2020525944A (ja) | バス監視システム、方法および装置 | |
CN103514086A (zh) | 一种软件错误报告的提取方法及装置 | |
CN113190399A (zh) | 日志存储方法、装置、计算机设备和存储介质 | |
CN110347572B (zh) | 一种性能日志输出方法、装置、系统、设备及介质 | |
CN111884824A (zh) | 交易链路监控方法、装置、设备及存储介质 | |
CN113884976B (zh) | 一种基于云平台的智能电表数据保护方法、系统 | |
CN116225843A (zh) | 基于异步消息机制的监控采集数据告警方法、系统及装置 | |
CN115129515A (zh) | 一种系统数据保存方法、装置、设备及存储介质 | |
AU2014200806B1 (en) | Adaptive fault diagnosis | |
CN110401582B (zh) | 云计算系统存储健康度窘迫的检测方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |