CN101145992B - 单板任务异常检测方法与系统 - Google Patents

单板任务异常检测方法与系统 Download PDF

Info

Publication number
CN101145992B
CN101145992B CN2007101453526A CN200710145352A CN101145992B CN 101145992 B CN101145992 B CN 101145992B CN 2007101453526 A CN2007101453526 A CN 2007101453526A CN 200710145352 A CN200710145352 A CN 200710145352A CN 101145992 B CN101145992 B CN 101145992B
Authority
CN
China
Prior art keywords
task
detected
unusual
reset
regularly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2007101453526A
Other languages
English (en)
Other versions
CN101145992A (zh
Inventor
张晋
王光辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WUHAN ZHONGXING SOFTWARE CO., LTD.
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN2007101453526A priority Critical patent/CN101145992B/zh
Publication of CN101145992A publication Critical patent/CN101145992A/zh
Application granted granted Critical
Publication of CN101145992B publication Critical patent/CN101145992B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种单板任务异常检测方法,该方法包括以下步骤:步骤1,将任务异常检测功能加入到CPU心跳定时中断处理程序和待检测任务中;步骤2,在CPU心跳定时中断到时,启动任务异常检测功能,任务异常检测功能扫描待检测任务的状态信息;以及步骤3,任务异常检测功能根据待测任务状态信息判断是否具有异常任务,并根据判断结果进行相应处理。本发明还提供了一种单板任务异常检测系统,该系统包括:任务添加装置;检测装置;以及判断装置。因而,采用本发明的方法和系统可以大大提高系统的可靠性,为定位任务异常提供了必要的信息。

Description

单板任务异常检测方法与系统
技术领域
本发明涉及网管系统,更具体地,涉及一种单板任务异常检测方法与系统。
背景技术
图1是根据现有技术的检测单板任务异常及处理的方法的流程图。
如图1所示,华为技术有限公司在申请号为200510066188.0的《单板任务异常检测及处理方法》专利中,提出了一种检测和处理单板任务异常的方法,该方案存在两个明显的缺陷:
依靠监控任务来检测其他任务是否异常时,实现方案的前提是监控任务不会出现异常,但这个前提是不可靠的,监控任务和其他任务一样都有发生异常的可能,所以这个方案理论上无法保证对任务监控的高可靠性;以及
在发现异常后只是进行简单的复位操作,不利于以后对异常现象的分析和解决。
发明内容
为了解决现有技术中的问题,本发明提出了一种单板任务异常检测方法,该方法包括以下步骤:步骤1,将任务异常检测功能加入到CPU心跳定时中断处理程序和待检测任务中;步骤2,在CPU心跳定时中断到时,启动任务异常检测功能,任务异常检测功能扫描待检测任务的状态信息;以及步骤3,任务异常检测功能根据待检测任务的状态信息判断是否具有异常任务,并根据判断结果进行相应处理。
待检测任务的状态信息以状态字的形式存储在内存中,其中,每位对应于一个待检测任务,每个待检测任务定时将对应的位置为“1”或“0”来表示每个待检测任务为“正常”或“异常”。
在步骤3中,当判断结果为具有异常任务时,包括以下处理:将异常任务的异常信息记录到非挥发性介质中;以及判断异常任务是否能够复位,在异常任务能够复位的情况下,将异常任务复位,以及在异常任务不能够复位的情况下,将单板复位。
但是,在步骤3中,当判断结果为不具有异常任务时,返回到步骤2,等待下一次CPU心跳定时中断到。
本发明还提出了一种单板任务异常检测系统,该系统包括:任务添加装置,用于将任务异常检测功能加入到CPU心跳定时中断处理程序和待检测任务中;检测装置,用于在CPU心跳定时中断到时,启动任务异常检测功能,以扫描待检测任务的状态信息;以及判断装置,用于根据待检测任务的状态信息判断是否具有异常任务,并根据判断结果进行相应处理。
待检测任务的状态信息以状态字的形式存储在内存中,其中,每位对应于一个待检测任务,每个待检测任务定时将对应的位置为“1”或“0”来表示每个待检测任务为“正常”或“异常”。
其中,判断装置包括:记录单元,用于在判断结果为具有异常任务时,将异常任务的异常信息记录到非挥发性介质中;以及复位单元,用于判断异常任务是否能够复位,在异常任务能够复位的情况下,将异常任务复位,以及在异常任务不能够复位的情况下,将单板复位。
此外,判断装置还包括:返回单元,用于在判断结果为不具有异常任务时,返回到检测装置,以等待下一次CPU心跳定时中断到。
因此,采用本发明的方法和系统可以提高整个任务检测系统的可靠性,避免了由于检测执行者异常而导致整个系统异常并且无法从异常中恢复的情况发生,而且本方法和系统还为定位发生异常原因提供了必要的信息,同时能够满足检测异常实时性要求很高的设计要求。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是根据现有技术的检测单板任务异常及处理的方法的流程图;
图2是根据本发明的单板任务异常检测方法的流程图;
图3是根据本发明方法的第一实施例的流程图;
图4是根据本发明方法的第二实施例的任务状态字与任务的对应关系图;
图5是根据本发明方法的第二实施例的单板任务异常检测及处理流程图;以及
图6是根据本发明的单板任务异常检测系统的框图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图2是根据本发明的单板任务异常检测方法的流程图。如图2所示,包括以下步骤:
S202,将任务异常检测功能加入到CPU心跳定时中断处理程序和待检测任务中;
S204,在CPU心跳定时中断到时,启动任务异常检测功能,任务异常检测功能扫描待检测任务的状态信息;以及
S206,任务异常检测功能根据待测任务状态信息判断是否具有异常任务,并根据判断结果进行相应处理。
待检测任务的状态信息以状态字的形式存储在内存中,其中,每位对应于一个待检测任务,每个待检测任务定时将对应的位置为“1”或“0”来表示每个待检测任务为“正常”或“异常”。
在S206中,当判断结果为具有异常任务时,包括以下处理:将异常任务的异常信息记录到非挥发性介质中;以及判断异常任务是否能够复位,在异常任务能够复位的情况下,将异常任务复位,以及在异常任务不能够复位的情况下,将单板复位。
在S206中,当判断结果为不具有异常任务时,返回到S204,等待下一次CPU心跳定时中断到。
图3是根据本发明方法的第一实施例的流程图。如图3所示,包括以下步骤:
S302,定时中断到,开始中断处理;
S304,扫描待测任务状态信息;
S306,判断任务是否异常,如异常则执行S308,否则执行S302;
S308,将异常信息记录入到非挥发介质中;
S310,判断异常任务能否复位,如果任务能复位,则执行S312,如果不能复位,则执行S314;
S312,复位任务;以及
S314,复位单板。
图4是根据本发明方法的第二实施例的任务状态字与任务的对应关系图。
第二个实施例是多任务单板软件程序,该程序由32个任务组成,在内存中保存有一个任务状态字,该状态字的1个BIT对应一个任务(如图4所示),每个任务定时将对应BIT置1,表示本任务正常运行;任务检测者定时读任务状态字来判断任务是否正常,如果正常,则将对应BIT置0,如果不正常则进行异常处理。
图5是根据本发明方法的第二实施例的单板任务异常检测及处理流程图。如图5所示,包括以下步骤:
S502,初始化任务状态字为0xFFFF;
S504,定时中断处理时间到;
S506,中断处理中检查任务状态字是否正常(本例中任务状态字为0xFFFE),如果正常,执行S504;否则执行S508;
S508,根据任务状态字与任务的对应关系发现是任务A异常;
S510,将A任务相关信息记录入flash中(供以后查询);
S512,对A任务进行复位,如果复位A任务成功,则执行S504,如果复位A任务失败,则执行S514;以及
S514,复位单板软件。
图6是根据本发明的单板任务异常检测系统600的框图。如图6所示,该系统包括:
任务添加装置602,用于将任务异常检测功能加入到CPU心跳定时中断处理程序和待检测任务中;检测装置604,用于在CPU心跳定时中断到时,启动任务异常检测功能,以扫描待检测任务的状态信息;以及判断装置606,用于根据待测任务状态信息判断是否具有异常任务,并根据判断结果进行相应处理。
待检测任务的状态信息以状态字的形式存储在内存中,其中,每位对应于一个待检测任务,每个待检测任务定时将对应的位置为“1”或“0”来表示每个待检测任务为“正常”或“异常”。
其中,判断装置606包括:记录单元6062,用于在判断结果为具有异常任务时,将异常任务的异常信息记录到非挥发性介质中;以及复位单元6064,用于判断异常任务是否能够复位,在异常任务能够复位的情况下,将异常任务复位,以及在异常任务不能够复位的情况下,将单板复位。
此外,判断单元606还包括:返回单元6066,用于在判断结果为不具有异常任务时,返回到检测装置,以等待下一次CPU心跳定时中断到。
综上所述,采用本发明的方法和系统可以提高整个任务检测系统的可靠性,而且本方法和系统可以为定位发生异常原因提供了必要的信息,同时能够满足对检测异常实时性要求很高的设计要求。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种单板任务异常检测方法,其特征在于,包括以下步骤:
步骤1,将任务异常检测功能加入到CPU心跳定时中断处理程序和待检测任务中;
步骤2,在所述CPU心跳定时中断到时,启动所述任务异常检测功能,所述任务异常检测功能扫描待检测任务的状态信息;以及
步骤3,所述任务异常检测功能根据所述待检测任务的状态信息判断是否具有异常任务,并根据判断结果进行相应处理。
2.根据权利要求1所述的方法,其特征在于,
所述待检测任务的状态信息以状态字的形式存储在内存中,其中,每位对应于一个待检测任务,每个待检测任务定时将对应的位置为“1”或“0”来表示所述每个待检测任务为“正常”或“异常”。
3.根据权利要求1所述的方法,其特征在于,在所述步骤3中,当所述判断结果为具有异常任务时,包括以下处理:
将所述异常任务的异常信息记录到非挥发性介质中;以及
判断所述异常任务是否能够复位,在所述异常任务能够复位的情况下,将所述异常任务复位,以及在所述异常任务不能够复位的情况下,将所述单板复位。
4.根据权利要求1至3中任一项所述的方法,其特征在于,在所述步骤3中,当所述判断结果为不具有异常任务时,返回到步骤2,等待下一次所述CPU心跳定时中断到。
5.一种单板任务异常检测系统,其特征在于,包括:
任务添加装置,用于将任务异常检测功能加入到CPU心跳定时中断处理程序和待检测任务中;
检测装置,用于在所述CPU心跳定时中断到时,启动所述任务异常检测功能,以扫描待检测任务的状态信息;以及
判断装置,用于根据所述待检测任务的状态信息判断是否具有异常任务,并根据判断结果进行相应处理。
6.根据权利要求5所述的系统,其特征在于,
所述待检测任务的状态信息以状态字的形式存储在内存中,其中,每位对应于一个待检测任务,每个待检测任务定时将对应的位置为“1”或“0”来表示所述每个待检测任务为“正常”或“异常”。
7.根据权利要求5所述的系统,其特征在于,所述判断装置包括:
记录单元,用于在所述判断结果为具有异常任务时,将所述异常任务的异常信息记录到非挥发性介质中;以及
复位单元,用于判断所述异常任务是否能够复位,在所述异常任务能够复位的情况下,将所述异常任务复位,以及在所述异常任务不能够复位的情况下,将所述单板复位。
8.根据权利要求5至7中任一项所述的系统,其特征在于,所述判断装置还包括:返回单元,用于在所述判断结果为不具有异常任务时,返回到所述检测装置,以等待下一次所述CPU心跳定时中断到。
CN2007101453526A 2007-09-11 2007-09-11 单板任务异常检测方法与系统 Active CN101145992B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007101453526A CN101145992B (zh) 2007-09-11 2007-09-11 单板任务异常检测方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007101453526A CN101145992B (zh) 2007-09-11 2007-09-11 单板任务异常检测方法与系统

Publications (2)

Publication Number Publication Date
CN101145992A CN101145992A (zh) 2008-03-19
CN101145992B true CN101145992B (zh) 2010-08-18

Family

ID=39208306

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007101453526A Active CN101145992B (zh) 2007-09-11 2007-09-11 单板任务异常检测方法与系统

Country Status (1)

Country Link
CN (1) CN101145992B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017091963A1 (zh) * 2015-11-30 2017-06-08 华为技术有限公司 一种信息处理方法及装置
CN106484555B (zh) * 2016-09-29 2019-05-17 Oppo广东移动通信有限公司 异常检测与恢复的方法及移动终端
CN106371979A (zh) * 2016-11-25 2017-02-01 郑州云海信息技术有限公司 一种监控扩展控制器的方法、装置及系统
CN107342917B (zh) * 2017-07-04 2020-11-10 百度在线网络技术(北京)有限公司 用于检测网络设备性能的方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1477801A (zh) * 2002-08-19 2004-02-25 上海贝尔有限公司 一种用于通信系统的基于自陷保护与调试装置
CN1855066A (zh) * 2005-04-21 2006-11-01 华为技术有限公司 单板任务异常检测及处理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1477801A (zh) * 2002-08-19 2004-02-25 上海贝尔有限公司 一种用于通信系统的基于自陷保护与调试装置
CN1855066A (zh) * 2005-04-21 2006-11-01 华为技术有限公司 单板任务异常检测及处理方法

Also Published As

Publication number Publication date
CN101145992A (zh) 2008-03-19

Similar Documents

Publication Publication Date Title
CN105468484B (zh) 用于在存储系统中确定故障位置的方法和装置
CN102135925B (zh) 用于检测错误检查和纠正内存的方法和装置
CN101145992B (zh) 单板任务异常检测方法与系统
JP2008310748A (ja) タスク実行時間記録装置、タスク実行時間記録方法、及びタスク実行時間記録用プログラム
CN101599042A (zh) 程序跑飞检测方法及其设备
JP4356634B2 (ja) 故障診断回路とこの故障診断回路を備えた情報処理装置、故障診断システム及び故障診断プログラム
JP5545771B2 (ja) 診断装置、診断方法および診断プログラム診断方法
CN101706752B (zh) 一种软件错误现场定位的方法及装置
CN112445749A (zh) 一种信号检测记录方法、系统、设备以及介质
CN106886471A (zh) 一种基于linux中磁盘的读写故障检测方法及系统
CN109102839B (zh) 一种坏块标记方法、装置、设备及可读存储介质
CN111159051A (zh) 死锁检测方法、装置、电子设备及可读存储介质
CN106970851A (zh) 用于分布式文件系统中磁盘检测处理的方法和设备
US7500145B2 (en) Anomaly-driven software switch to capture event responses and automate recovery
JP2010066801A (ja) ログ記録システム、モジュール監視手段、トレースログ管理手段、記録方法、プログラム、及び記憶媒体
CN111737158B (zh) 一种异常断言的处理方法、装置、电子设备及存储介质
US7992047B2 (en) Context sensitive detection of failing I/O devices
CN108231134B (zh) Ram良率补救方法及装置
CN114531499A (zh) 一种基于quic协议的端口共用方法、系统及服务器
KR101539933B1 (ko) Cpu 행업 시 로그를 생성하는 방법 및 장치
JP4562641B2 (ja) コンピュータシステム、動作状態判定プログラムおよび動作状態判定方法
WO2017067249A1 (zh) 光纤电子标签的故障定位方法及装置
CN101149418A (zh) 显示器集成电路错误检测装置及其方法
JP2010056744A (ja) 情報処理装置、画像形成装置及びプログラム
JP4911084B2 (ja) 設定ファイルの適用状況確認方法およびシステム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20151118

Address after: 430223 East Lake Wuhan New Technology Development Zone Hua Hua Road, Optics Valley Industrial Park, ZTE building, building No. 3, building

Patentee after: WUHAN ZHONGXING SOFTWARE CO., LTD.

Address before: 518057 Nanshan District science and Technology Industrial Park, Guangdong high tech Industrial Park, ZTE building

Patentee before: ZTE Corporation