CN102541613B - 用于故障检测和处理的方法和装置 - Google Patents

用于故障检测和处理的方法和装置 Download PDF

Info

Publication number
CN102541613B
CN102541613B CN201110455238.XA CN201110455238A CN102541613B CN 102541613 B CN102541613 B CN 102541613B CN 201110455238 A CN201110455238 A CN 201110455238A CN 102541613 B CN102541613 B CN 102541613B
Authority
CN
China
Prior art keywords
processing module
fault
mark
module
detection module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110455238.XA
Other languages
English (en)
Other versions
CN102541613A (zh
Inventor
吴登奔
石峰
张羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XFusion Digital Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201110455238.XA priority Critical patent/CN102541613B/zh
Publication of CN102541613A publication Critical patent/CN102541613A/zh
Application granted granted Critical
Publication of CN102541613B publication Critical patent/CN102541613B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明涉及用于故障检测和处理的方法和装置,其中,控制装置包括:控制模块,用于当事件发生时,根据各个用于检测和处理不同故障的检测处理模块的触发条件,确定当所述事件发生时需要触发的检测处理模块并获取所述确定的检测处理模块的入口地址;触发模块,用于根据所述确定的检测处理模块的入口地址,触发所述确定的检测处理模块来检测和处理故障,其中,所述各个检测处理模块被包括在至少一个扩展装置中,并且所述至少一个扩展装置独立于所述控制装置而实现。利用该方法和装置,可以灵活地扩展故障检测处理能力。

Description

用于故障检测和处理的方法和装置
技术领域
本发明涉及故障处理领域,尤其涉及用于故障检测和处理的方法和装置。
背景技术
通常,各个系统在运行过程中都会不可避免地出现故障。为此,系统都会配备有故障处理软件,其检测和处理预先可以想到的系统运行过程中可能会出现的各种故障,从而保持系统的平稳运行。
然而,许多系统在运行过程中,除了会出现预先想到的各种故障之外,还会出现一些预先没能想到的故障。在这种情况下,通常需要修改和重新编译故障处理软件,以使得故障处理软件能够处理这些预先没能想到的故障。
然而,通过修改和重新编译故障处理软件的方式来扩展故障检测处理能力,这非常不灵活。
发明内容
考虑到现有技术的缺陷,本发明实施例提供一种用于故障检测和处理的方法和装置,其可以灵活地扩展故障检测处理能力。
按照本发明实施例的一种控制装置,包括:控制模块,用于当事件发生时,根据各个用于检测和处理不同故障的检测处理模块的触发条件,确定当所述事件发生时需要触发的检测处理模块并获取所述确定的检测处理模块的入口地址;触发模块,用于根据所述确定的检测处理模块的入口地址,触发所述确定的检测处理模块来检测和处理故障,其中,所述各个检测处理模块被包括在至少一个扩展装置中,并且所述至少一个扩展装置独立于所述控制装置而实现。
按照本发明实施例的一种扩展装置,包括:检测处理模块,用于检测和处理指定故障;以及,注册模块,用于在所述扩展装置被加载到内存之后进行初始化时,向控制装置发送用于注册所述检测处理模块且包含有所述检测处理模块的触发条件和入口地址的注册请求,其中,所述扩展装置独立于所述控制装置实现。
按照本发明实施例的一种控制方法,包括:当事件发生时,根据各个用于检测和处理不同故障的检测处理模块的触发条件,确定当所述事件发生时需要触发的检测处理模块;获取所述确定的检测处理模块的入口地址;以及,根据所获取的入口地址,触发所述确定的检测处理模块来检测和处理故障,其中,所述各个检测处理模块被包括在至少一个扩展装置中,并且所述至少一个扩展装置独立于用于实现所述控制方法的装置而实现。
由上面的方案可以看出,包含用于检测和处理故障的功能的扩展装置独立于用于控制故障处理的控制装置而实现,因此,如果出现预先没有想到的新故障,则只需提供包含用于检测和处理该新故障的功能的扩展装置,并不需要对控制装置和已有的扩展装置进行修改和重新编译,因此相对于现有技术可以灵活地扩展故障检测处理能力。
附图说明
本发明的其它特点、特征、优点和益处通过以下结合附图的详细描述将变得更加显而易见。其中:
图1示出了按照本发明一个实施例的用于故障检测和处理的系统示意图;
图2示出了按照本发明一个实施例的用于注册扩展装置的方法的流程图;
图3示出了按照本发明又一个实施例的用于注册扩展装置的方法的流程图;
图4示出了按照本发明再一个实施例的用于注册扩展装置的方法的流程图;
图5示出了按照本发明又再一个实施例的用于注册扩展装置的方法的流程图;
图6示出了按照本发明一个实施例的用于控制故障处理的方法的流程图;
图7示出了按照本发明一个实施例的控制装置的示意图;以及
图8示出了按照本发明一个实施例的扩展装置的示意图。
具体实施方式
按照本发明实施例所提供的技术方案,以软件的方式实现的用于检测和处理故障的系统包括控制装置和一个或多个独立于控制装置实现的扩展装置,其中,每一个扩展装置包含用于检测和处理特定故障的功能,而控制装置使用这些扩展装置所提供的功能来控制故障处理,因而,如果出现预先没有想到的新故障,则只需提供包含用于检测和处理该新故障的功能的扩展装置,并不需要对控制装置和已有的扩展装置进行修改和重新编译,因此可以灵活地扩展故障检测处理能力。
下面,将结合附图详细描述本发明的各个实施例。本领域技术人员应当理解,下面所描述的各个实施例目的在于以举例的方式来说明本发明,而不是用于限制本发明。
现在参考图1,其示出了按照本发明一个实施例的用于故障检测和处理的系统示意图。图1所示的系统10可以使用软件的方式来实现,用于根据各个设备和/或节点所上报的故障信息来检测是否发生了故障,并当检测确定故障发生时,处理所发生的故障。
如图1所示,系统10包括一个或多个扩展装置20和控制装置30。扩展装置20独立于控制装置30实现,例如,扩展装置20可以使用动态库的方式来实现。
其中,每一个扩展装置20包括一个用于对其中一种故障G进行检测和处理的检测处理模块JCM,其根据各个设备和/或节点所上报的故障信息来检测故障G是否发生,并当检测发现故障G发生时,处理故障G。这里,例如,故障G可以是设备或节点的内存故障、处理器故障、显示器故障或其它故障等。
检测处理模块JCM通过控制装置30调用用于检测故障G是否发生的故障检测模块GJ来检测故障G是否发生,并当检测发现故障G已发生时,通过控制装置30调用用于处理故障G的故障处理模块GC来处理已发生的故障G。故障检测模块GJ和故障处理模块GC既可以与检测处理模块JCM一起被包括在同一个扩展装置中,也可以被包括在与检测处理模块JCM不同的其它扩展装置中。
为了使得系统10可以使用扩展装置20所包括的各个模块来检测和处理故障G,扩展装置20在被加载到内存中之后进行初始化时需要将其所包括的各个模块注册到控制装置30中。
控制装置30用于控制故障检测和处理。具体地,控制装置30监测各种事件(例如安装了系统10的主机上电等)的发生,并当监测到任一事件SJ发生时,检查已注册的各个检测处理模块中是否存在当事件SJ发生时需要触发的检测处理模块,如果存在这样的检测处理模块,则触发该检测处理模块来检测和处理故障。控制装置30管理故障检测处理管理列表、故障检测管理列表和故障处理管理列表,其中,故障检测处理管理列表用于关联地存储已注册的各个检测处理模块的触发条件和入口地址,故障检测管理列表用于关联地存储各个故障检测模块的名称、标识和入口地址,以及,故障处理管理列表用于关联地存储各个故障处理模块的名称、标识和入口地址。
这里,模块(即检测处理模块、故障检测模块和故障处理模块)的入口地址是指包含该模块的扩展装置被加载到内存之后在内存中存放该模块的地址。检测处理模块的触发条件表明当何种事件发生时触发检测处理模块来检测和处理故障。
现在参考图2,其示出了按照本发明一个实施例的用于注册扩展装置的方法的流程图。在本实施例中,所要注册的扩展装置20包括检测处理模块JCM1、用于检测故障G1是否发生的故障检测模块GJ1和用于处理故障G1的故障处理模块GC1,其中,检测处理模块JCM1通过控制装置30调用故障检测模块GJ1和故障处理模块GC1来检测和处理故障G1。
如图2所示,在步骤S200,在扩展装置20被加载到内存中之后进行初始化时,扩展装置20获取检测处理模块JCM1的入口地址、故障检测模块GJ1的入口地址和故障处理模块GC1的入口地址。
在步骤S204,扩展装置20向控制装置30发送一个用于注册故障检测模块GJ1的注册请求。其中,该注册请求包括故障检测模块GJ1的名称和入口地址。
在步骤S208,在接收到来自扩展装置20的用于注册故障检测模块GJ1的注册请求之后,控制装置30向故障检测模块GJ1分配标识。其中,所分配的故障检测模块GJ1的标识在故障检测管理列表中是唯一的。
在步骤S212,控制装置30将所接收的注册请求消息中所包括的故障检测模块GJ1的名称和入口地址和所分配的故障检测模块GJ1的标识关联地存储在故障检测管理列表中。
在步骤S216,控制装置30把故障检测模块GJ1的标识发送给扩展装置20。
在步骤S220,扩展装置20向控制装置30发送一个用于注册故障处理模块GC1的注册请求。其中,该注册请求包括故障处理模块GC1的名称和入口地址。
在步骤S224,在接收到来自扩展装置20的用于注册故障处理模块GC1的注册请求之后,控制装置30向故障处理模块GC1分配标识。其中,所分配的故障处理模块GC1的标识在故障处理管理列表中是唯一的。
在步骤S228,控制装置30将所接收的注册请求消息中所包括的故障处理模块GC1的名称和入口地址和所分配的故障处理模块GC1的标识关联地存储在故障处理管理列表中。
在步骤S232,控制装置30把故障处理模块GC 1的标识发送给扩展装置20。
在步骤S236,扩展装置20向控制装置30发送一个用于注册检测处理模块JCM1的注册请求。其中,该注册请求包括检测处理模块JCM1的触发条件和入口地址。
在步骤S240,在接收到来自扩展装置20的用于注册检测处理模块JCM1的注册请求之后,控制装置30将所接收的注册请求消息中所包括的检测处理模块JCM1的触发条件和入口地址关联地存储在故障检测处理管理列表中。
在步骤S244,扩展装置20把从控制装置30接收到的故障检测模块GJ1的标识和故障处理模块GC1的标识告知检测处理模块JCM1。
现在参考图3,其示出了按照本发明又一个实施例的用于注册扩展装置的方法的流程图。在本实施例中,所要注册的扩展装置20包括用于检测和处理故障G1的检测处理模块JCM1,其中,检测处理模块JCM1通过控制装置30调用故障检测模块GJ1来检测故障G1是否发生和通过控制装置30调用故障处理模块GC1来处理故障G1,但扩展装置20没有包括故障检测模块GJ1和故障处理模块GC1。
如图3所示,在步骤S300,在扩展装置20被加载到内存中之后进行初始化时,扩展装置20向控制装置30发送一个用于获取故障检测模块GJ1的标识的请求。其中,该请求包括故障检测模块GJ1的名称。
在步骤S304,在接收到来自扩展装置20的请求之后,控制装置30根据所接收的请求中所包括的故障检测模块GJ1的名称,从故障检测管理列表中查找出故障检测模块GJ1的标识。
在步骤S308,控制装置30把所查找的故障检测模块GJ1的标识发送给扩展装置20。
在步骤S312,扩展装置20向控制装置30发送一个用于获取故障处理模块GC1的标识的请求。其中,该请求包括故障处理模块GC1的名称。
在步骤S316,在接收到来自扩展装置20的请求之后,控制装置30根据所接收的请求中所包括的故障处理模块GC1的名称,从故障处理管理列表中查找出故障处理模块GC1的标识。
在步骤S320,控制装置30把所查找的故障处理模块GC1的标识发送给扩展装置20。
在步骤S324,扩展装置20获取检测处理模块JCM1的入口地址。
在步骤S328,扩展装置20向控制装置30发送一个用于注册检测处理模块JCM1的注册请求。其中,该注册请求包括检测处理模块JCM1的触发条件和所获取的检测处理模块JCM1的入口地址。
在步骤S332,在接收到来自扩展装置20的用于注册检测处理模块JCM1的注册请求之后,控制装置30将所接收的注册请求中所包括的检测处理模块JCM1的触发条件和入口地址关联地存储在故障检测处理管理列表中。
在步骤S336,扩展装置20把从控制装置30所接收的故障检测模块GJ1的标识和故障处理模块GC1的标识告知检测处理模块JCM1。
现在参考图4,其示出了按照本发明再一个实施例的用于注册扩展装置的方法的流程图。在本实施例中,所要注册的扩展装置20包括用于检测和处理故障G1的检测处理模块JCM1,其中,检测处理模块JCM1通过控制装置30调用故障检测模块GJ1来检测故障G1是否发生和通过控制装置30调用故障处理模块GC1来处理故障G1,扩展装置20包括故障检测模块GJ1,但未包括故障处理模块GC1。
如图4所示,在步骤S400,在扩展装置20被加载到内存中之后进行初始化时,扩展装置20获取检测处理模块JCM1的入口地址和故障检测模块GJ1的入口地址。
在步骤S404,扩展装置20向控制装置30发送一个用于注册故障检测模块GJ1的注册请求。其中,该注册请求包括故障检测模块GJ1的名称和入口地址。
在步骤S408,在接收到来自扩展装置20的注册请求之后,控制装置30向故障检测模块GJ1分配标识。其中,所分配的故障检测模块GJ1的标识在故障检测管理列表中是唯一的。
在步骤S412,控制装置30将所接收的注册请求中所包括的故障检测模块GJ1的名称和入口地址和所分配的故障检测模块GJ1的标识关联地存储在故障检测管理列表中。
在步骤S416,控制装置30把所分配的故障检测模块GJ1的标识发送扩展装置20。
在步骤S420,扩展装置20向控制装置30发送一个用于获取故障处理模块GC1的标识的请求。其中,该请求包括故障处理模块GC1的名称。
在步骤S424,在接收到来自扩展装置20的请求之后,控制装置30根据所接收的请求中所包括的故障处理模块GC1的名称,从故障处理管理列表中查找出故障处理模块GC1的标识。
在步骤S428,控制装置30把所查找的故障处理模块GC1的标识发送给扩展装置20。
在步骤S432,扩展装置20向控制装置30发送一个用于注册检测处理模块JCM1的注册请求。其中,该注册请求包括检测处理模块JCM1的触发条件和所获取的检测处理模块JCM1的入口地址。
在步骤S436,在接收到来自扩展装置20的用于注册检测处理模块JCM1的注册请求之后,控制装置30将所接收的注册请求中所包括的检测处理模块JCM1的触发条件和入口地址关联地存储在故障检测处理管理列表中。
在步骤S440,扩展装置20把从控制装置30接收的所获取的故障检测模块GJ1的标识和故障处理模块GC1的标识告知检测处理模块JCM1。
现在参考图5,其示出了按照本发明又再一个实施例的用于注册扩展装置的方法的流程图。在本实施例中,所要注册的扩展装置20包括用于检测和处理故障G1的检测处理模块JCM1,其中,检测处理模块JCM1通过控制装置30调用故障检测模块GJ1来检测故障G1是否发生和通过控制装置30调用故障处理模块GC1来处理故障G1,扩展装置20包括故障处理模块GC1,但未包括故障检测模块GJ1。
如图5所示,在步骤S500,在扩展装置20被加载到内存中之后进行初始化时,扩展装置20向控制装置30发送一个用于获取故障检测模块GJ1的标识的请求。其中,该请求包括故障检测模块GJ1的名称。
在步骤S504,在接收到来自扩展装置20的请求之后,控制装置30根据所接收的请求中所包括的故障检测模块GJ1的名称,从故障检测管理列表中查找出故障检测模块GJ1的标识。
在步骤S508,控制装置30把所查找的故障检测模块GJ1的标识发送给扩展装置20。
在步骤S512,扩展装置20获取检测处理模块JCM1的入口地址和故障处理模块GC1的入口地址。
在步骤S516,扩展装置20向控制装置30发送一个用于注册故障处理模块GC1的注册请求。其中,该注册请求包括故障处理模块GC1的名称和入口地址。
在步骤S520,在接收到来自扩展装置20的注册请求之后,控制装置30向故障处理模块GC1分配标识。
在步骤S524,控制装置30将所接收的注册请求中所包括的故障处理模块GC1的入口地址和名称和所分配的故障处理模块GC1的标识关联地存储在故障检测管理列表中。
在步骤S528,控制装置30把所分配的故障处理模块GC1的标识发送给扩展装置20。
在步骤S532,扩展装置20向控制装置30发送一个用于注册检测处理模块JCM1的注册请求。其中,该注册请求包括检测处理模块JCM1的触发条件和所获取的检测处理模块JCM1的入口地址。
在步骤S536,在接收到来自扩展装置20的用于注册检测处理模块JCM1的注册请求之后,控制装置30将所接收的注册请求中所包括的检测处理模块JCM1的触发条件和入口地址关联地存储在故障检测处理管理列表中。
在步骤S540,扩展装置20把从控制装置30所接收的故障检测模块GJ1的标识和故障处理模块GC1的标识告知检测处理模块JCM1。
现在参考图6,其示出了按照本发明一个实施例的用于控制故障处理的方法的流程图。
如图6所示,在步骤S600,控制装置30监测是否有事件发生。
在步骤S604,当监测到任一事件T发生时,控制装置30检查其故障检测处理管理列表中所存储的各个检测处理模块的触发条件,以查看是否存在当事件T发生时需要触发的检测处理模块。
在步骤S608,如果检查结果表明存在当事件T发生时需要触发的检测处理模块,则控制装置30从其故障检测处理管理列表中,获取当事件T发生时需要触发的各个检测处理模块的入口地址。
在步骤S612,控制装置30根据所获取的入口地址,触发当事件T发生时需要触发的各个检测处理模块进行工作。
在步骤S616,在当事件T发生时需要触发的各个检测处理模块中的任一用于检测和处理故障Gn的检测处理模块JCMn被触发之后,检测处理模块JCMn向控制装置30发送一个用于执行故障检测模块GJn的执行请求,以检查故障Gn是否发生。其中,该执行请求包括在注册期间检测处理模块JCMn被告知的故障检测模块GJn的标识。
在步骤S620,在接收到来自检测处理模块JCMn的执行请求后,控制装置30根据所接收的执行请求中所包括的故障检测模块GJn的标识,从故障检测管理列表中检索出故障检测模块GJn的入口地址。
在步骤S624,控制装置30根据所检索的故障检测模块GJn的入口地址,执行故障检测模块GJn,以检测故障Gn是否发生。
在步骤S628,故障检测模块GJn向控制装置30发送表明故障Gn是否发生的检测结果。
在步骤S632,在接收到来自故障检测模块GJn的检测结果之后,控制装置30把所接收的检测结果发送给检测处理模块JCMn。
在步骤S636,在接收到来自控制装置30的检测结果之后,如果所接收的检测结果表明故障Gn已发生,则检测处理模块JCMn向控制装置30发送一个用于执行故障处理模块GCn的执行请求,以处理故障Gn。其中,该执行请求包括在注册期间检测处理模块JCMn被告知的故障处理模块GCn的标识。
在步骤S640,在接收到来自检测处理模块JCMn的执行请求后,控制装置30根据所接收的执行请求中所包括的故障处理模块GCn的标识,从故障处理管理列表中检索出故障处理模块GCn的入口地址。
在步骤S644,控制装置30根据所检索的故障处理模块GCn的入口地址,执行故障处理模块GCn,以处理故障Gn。
本领域技术人员应当理解,虽然在上面的实施例中,故障检测模块GJn的检测结果由控制装置30发送给检测处理模块JCMn,然而,本发明并不局限于此。在本发明的其它实施例中,也可以是故障检测模块GJn在不通过控制装置30的情况下直接把检测结果发送检测处理模块JCMn。
此外,本领域技术人员应当理解,虽然在上面的实施例中,检测处理模块通过调用用于检测故障是否发生的故障检测模块和用于处理故障的故障处理模块来检测和处理故障,然而,本发明并不局限于此。在本发明的其它一些实施例中,也可以是检测处理模块本身就直接实现了用于检测故障是否发生和当故障发生时处理故障的功能,从而不再需要用于检测故障是否发生的故障检测模块和用于处理故障的故障处理模块。在这种情况下,控制装置30可以不包括故障检测管理列表和故障处理管理列表,以及,在扩展装置初始化时只需注册检测处理模块。
此外,本领域技术人员应当理解,虽然在上面的实施例中,每一个扩展装置20仅包括一个检测处理模块,然而,本发明并不局限于此。在本发明的其它一些实施例中,每一个扩展装置20也可以包括多个检测处理模块。
现在参考图7,其示出了按照本发明一个实施例的控制装置的示意图。图7中的控制装置可以用软件的方式来实现。
如图7所示,控制装置30可以包括控制模块32和触发模块34。其中,控制模块32可以用于当事件R发生时,根据各个用于检测和处理不同故障的检测处理模块的触发条件,确定当事件R发生时需要触发的检测处理模块并获取所确定的检测处理模块的入口地址。触发模块34可以用于根据所确定的检测处理模块的入口地址,触发所确定的检测处理模块来检测和处理故障。其中,该各个检测处理模块被包括在至少一个扩展装置20中,并且该至少一个扩展装置20独立于控制装置30而实现。
此外,控制装置30还可以包括接收模块JM和执行模块ZM。其中,接收模块JM可以用于接收来自所确定的检测处理模块的用于执行用于检测故障是否发生的指定故障检测模块或用于处理故障的指定故障处理模块且包含有指定故障检测模块的标识或指定故障处理模块的标识的执行请求。执行模块ZM可以用于根据接收模块JM所接收的执行请求所包括的指定故障检测模块的标识或指定故障处理模块的标识来获取指定故障检测模块的入口地址或指定故障处理模块的入口地址,并根据所获取的指定故障检测模块的入口地址或指定故障处理模块的入口地址来执行指定故障检测模块或指定故障处理模块。
此外,控制装置30还可以包括管理模块GM。其中,管理模块GM可以用于管理故障检测处理管理列表、故障检测管理列表和故障处理管理列表,其中,故障检测处理管理列表用于关联地存储各个检测处理模块的触发条件和入口地址,故障检测管理列表用于关联地存储各个用于检测不同故障是否发生的故障检测模块的名称、标识和入口地址,以及故障处理管理列表用于关联地存储各个用于处理不同故障的故障处理模块的名称、标识和入口地址。其中,控制模块32可以进一步用于从故障检测处理管理列表,确定当事件R发生时需要触发的检测处理模块并获取所确定的检测处理模块的入口地址。其中,执行模块ZM可以进一步用于根据接收模块JM所接收的执行请求所包括的指定故障检测模块的标识或指定故障处理模块的标识,从故障检测管理列表或故障处理管理列表获取指定故障检测模块的入口地址或指定故障处理模块的入口地址。
此外,控制装置30还可以包括注册模块ZCM。其中,注册模块ZCM可以用于当从任一扩展装置接收到用于注册指定检测处理模块的且包含指定检测处理模块的触发条件和入口地址的注册请求时,将所接收的注册请求所包括的指定检测处理模块的触发条件和入口地址关联地存储在故障检测处理管理列表中。
此外,注册模块ZCM还可以用于当从该任一扩展装置接收到用于注册特定故障检测模块的且包含特定故障检测模块的名称和入口地址的注册请求时,分配用于特定故障检测模块的标识,将特定检测模块的名称、标识和入口地址关联地存储在故障检测管理列表中,以及向该任一扩展装置发送特定故障检测模块的标识。
此外,注册模块ZCM还可以用于当从该任一扩展装置接收到用于注册特定故障处理模块的且包含特定故障处理模块的名称和入口地址的注册请求时,分配用于特定故障处理模块的标识,将特定故障处理模块的名称、标识和入口地址关联地存储在故障处理管理列表中,以及向该任一扩展装置发送特定故障处理模块的标识。
此外,控制装置30还可以包括查找模块CZM。其中,查找模块CZM可以用于当从任一扩展装置接收到用于获取特定故障检测模块的标识或特定故障处理模块的标识且包含特定故障检测模块的名称或特定故障处理模块的名称的请求时,根据特定故障检测模块的名称或所述特定故障处理模块的名称,从故障检测管理列表或故障处理管理列表查找特定故障检测模块的标识或特定故障处理模块的标识,以及向该任一扩展装置发送所查找的特定故障检测模块的标识或特定故障处理模块的标识。
此外,执行模块ZM还可以用于当接收到来自指定故障检测模块的检测结果时,把所接收的检测结果发送给所确定的检测处理模块。
此外,该至少一个扩展装置以动态库的方式实现。
现在参考图8,其示出了按照本发明一个实施例的扩展装置的示意图。图8中的扩展装置可以用软件的方式来实现。
如图8所示,扩展装置20可以包括检测处理模块22和注册模块26。其中,检测处理模块22可以用于检测和处理指定故障T。注册模块26可以用于在扩展装置20被加载到内存之后进行初始化时,向控制装置30发送用于注册检测处理模块22且包含有检测处理模块22的触发条件和入口地址的注册请求。其中,扩展装置20独立于控制装置30实现。
此外,检测处理模块22可以进一步用于向控制装置30发送用于执行用于检测指定故障T是否发生的指定故障检测模块PP且包含有指定故障检测模块PP的标识的请求,以及当检测结果表明指定故障T发生时,向控制装置30发送用于执行用于处理指定故障T的指定故障处理模块KK且包含有指定故障处理模块KK的标识的请求。注册模块26还可以用于在扩展装置20被加载到内存之后进行初始化时,从控制装置30获取指定故障检测模块PP的标识和指定故障处理模块KK的标识,以及把所获取的指定故障检测模块PP的标识和指定故障处理模块KK的标识告知检测处理模块22。
此外,扩展装置20包括指定故障检测模块PP。注册模块26可以进一步用于获得指定故障检测模块PP的入口地址;向控制装置30发送用于注册指定故障检测模块PP的且包含指定故障检测模块PP的名称和入口地址的注册请求;以及,当从控制装置30接收到指定故障检测模块PP的标识时,把所接收的指定故障检测模块PP的标识告知检测处理模块22。
此外,扩展装置20不包括指定故障检测模块PP。注册模块26可以进一步用于向控制装置30发送用于获取指定故障检测模块PP的标识且包含指定故障检测模块PP的名称的请求;以及,当从控制装置30接收到指定故障检测模块PP的标识时,把所接收的指定故障检测模块PP的标识告知检测处理模块22。
此外,扩展装置20可以包括指定故障处理模块KK。注册模块26可以进一步用于获得指定故障处理模块KK的入口地址;向控制装置30发送用于注册指定故障处理模块KK的且包含指定故障处理模块KK的名称和入口地址的注册请求;以及,当从控制装置30接收到指定故障处理模块KK的标识时,把所接收的指定故障处理模块KK的标识告知检测处理模块22。
此外,扩展装置20不包括指定故障处理模块KK。注册模块26可以进一步用于向控制装置30发送用于获取指定故障处理模块KK的标识且包含指定故障处理模块KK的标识的请求;以及,当从控制装置30接收到指定故障处理模块KK的标识时,把所接收的指定故障处理模块KK的标识告知检测处理模块22。
此外,所述检测结果可以是检测处理模块22从控制装置30或指定故障检测模块PP接收的。
此外,扩展装置20可以利用动态库的方式实现。
本领域技术人员应当理解,上面所公开的各个实施例可以在不偏离发明实质的情况下做出各种改变和变形,因此,本发明的保护范围应当由所附的权利要求书来限定。

Claims (24)

1.一种用于故障检测和处理的系统,包括:
控制装置,包括:
控制模块,用于当事件发生时,根据各个用于检测和处理不同故障的检测处理模块的触发条件,确定当所述事件发生时需要触发的检测处理模块并获取所述确定的检测处理模块的入口地址;
触发模块,用于根据所述确定的检测处理模块的入口地址,触发所述确定的检测处理模块来检测和处理故障,
至少一个扩展装置,包括:
所述检测处理模块;以及
第一注册模块,用于在所述扩展装置被加载到内存之后进行初始化时,向所述控制装置发送用于注册所述检测处理模块且包含有所述检测处理模块的触发条件和入口地址的注册请求;
其中,所述至少一个扩展装置独立于所述控制装置而实现。
2.如权利要求1所述的系统,其中,所述控制装置还包括:
接收模块,用于接收来自所述确定的检测处理模块的用于执行用于检测故障是否发生的指定故障检测模块或用于处理故障的指定故障处理模块且包含有所述指定故障检测模块的标识或所述指定故障处理模块的标识的执行请求;以及
执行模块,用于根据所述执行请求所包括的所述指定故障检测模块的标识或所述指定故障处理模块的标识来获取所述指定故障检测模块的入口地址或所述指定故障处理模块的入口地址,并根据所述指定故障检测模块的入口地址或所述指定故障处理模块的入口地址来执行所述指定故障检测模块或所述指定故障处理模块。
3.如权利要求2所述的系统,其中,所述控制装置还包括:
管理模块,用于管理故障检测处理管理列表、故障检测管理列表和故障处理管理列表,其中,所述故障检测处理管理列表用于关联地存储各个检测处理模块的触发条件和入口地址,所述故障检测管理列表用于关联地存储各个用于检测不同故障是否发生的故障检测模块的名称、标识和入口地址,以及所述故障处理管理列表用于关联地存储各个用于处理不同故障的故障处理模块的名称、标识和入口地址,
其中,所述控制模块进一步用于从所述故障检测处理管理列表,确定当所述事件发生时需要触发的检测处理模块并获取所确定的检测处理模块的入口地址,
其中,所述执行模块进一步用于根据所述执行请求所包括的所述指定故障检测模块的标识或所述指定故障处理模块的标识,从所述故障检测管理列表或所述故障处理管理列表获取所述指定故障检测模块的入口地址或所述指定故障处理模块的入口地址。
4.如权利要求3所述的系统,其中,所述控制装置还包括:
第二注册模块,用于当从任一扩展装置接收到用于注册指定检测处理模块的且包含所述指定检测处理模块的触发条件和入口地址的注册请求时,将所述指定检测处理模块的触发条件和入口地址关联地存储在所述故障检测处理管理列表中。
5.如权利要求4所述的系统,其中
所述第二注册模块还用于当从所述任一扩展装置接收到用于注册特定故障检测模块的且包含所述特定故障检测模块的名称和入口地址的注册请求时,分配用于所述特定故障检测模块的标识,将所述特定检测模块的名称、标识和入口地址关联地存储在所述故障检测管理列表中,以及向所述任一扩展装置发送所述特定故障检测模块的标识。
6.如权利要求4所述的系统,其中
所述第二注册模块还用于当从所述任一扩展装置接收到用于注册特定故障处理模块的且包含所述特定故障处理模块的名称和入口地址的注册请求时,分配用于所述特定故障处理模块的标识,将所述特定故障处理模块的名称、标识和入口地址关联地存储在所述故障处理管理列表中,以及向所述任一扩展装置发送所述特定故障处理模块的标识。
7.如权利要求3所述的系统,其中,所述控制装置还包括:
查找模块,用于当从任一扩展装置接收到用于获取特定故障检测模块的标识或特定故障处理模块的标识且包含所述特定故障检测模块的名称或所述特定故障处理模块的名称的请求时,根据所述特定故障检测模块的名称或所述特定故障处理模块的名称,从所述故障检测管理列表或所述故障处理管理列表查找所述特定故障检测模块的标识或所述特定故障处理模块的标识,以及向所述任一扩展装置发送所查找的所述特定故障检测模块的标识或所述特定故障处理模块的标识。
8.如权利要求2所述的系统,其中,
所述执行模块还用于当接收到来自所述指定故障检测模块的检测结果时,把所接收的检测结果发送给所述确定的检测处理模块。
9.如权利要求1所述的系统,其中,
所述至少一个扩展装置以动态库的方式实现。
10.如权利要求1所述的系统,其中
所述检测处理模块进一步用于向所述控制装置发送用于执行用于检测所述指定故障是否发生的指定故障检测模块且包含有所述指定故障检测模块的标识的执行请求,以及当检测结果表明所述指定故障发生时,向所述控制装置发送用于执行用于处理所述指定故障的指定故障处理模块且包含有所述指定故障处理模块的标识的执行请求,
所述第一注册模块还用于在所述扩展装置被加载到内存之后进行初始化时,从所述控制装置获取所述指定故障检测模块的标识和所述指定故障处理模块的标识,以及把所获取的所述指定故障检测模块的标识和所述指定故障处理模块的标识告知所述检测处理模块。
11.如权利要求10所述的系统,其中
所述扩展装置包括所述指定故障检测模块,以及
所述第一注册模块进一步用于获得所述指定故障检测模块的入口地址;向所述控制装置发送用于注册所述指定故障检测模块的且包含所述指定故障检测模块的名称和入口地址的注册请求;以及,当从所述控制装置接收到所述指定故障检测模块的标识时,把所接收的所述指定故障检测模块的标识告知所述检测处理模块。
12.如权利要求10所述的系统,其中
所述扩展装置不包括所述指定故障检测模块,以及
所述第一注册模块进一步用于向所述控制装置发送用于获取所述指定故障检测模块的标识且包含所述指定故障检测模块的名称的请求;以及,当从所述控制装置接收到所述指定故障检测模块的标识时,把所接收的所述指定故障检测模块的标识告知所述检测处理模块。
13.如权利要求10所述的系统,其中
所述扩展装置包括所述指定故障处理模块,以及
所述第一注册模块进一步用于获得所述指定故障处理模块的入口地址;向所述控制装置发送用于注册所述指定故障处理模块的且包含所述指定故障处理模块的名称和入口地址的注册请求;以及,当从所述控制装置接收到所述指定故障处理模块的标识时,把所接收的所述指定故障处理模块的标识告知所述检测处理模块。
14.如权利要求10所述的系统,其中
所述扩展装置不包括所述指定故障处理模块,以及
所述第一注册模块进一步用于向所述控制装置发送用于获取所述指定故障处理模块的标识且包含所述指定故障处理模块的名称的请求;以及,当从所述控制装置接收到所述指定故障处理模块的标识时,把所接收的所述指定故障处理模块的标识告知所述检测处理模块。
15.如权利要求10所述的系统,其中
所述检测结果是所述检测处理模块从所述控制装置或所述指定故障检测模块接收的。
16.一种用于故障检测和处理的方法,包括:
当事件发生时,由控制装置根据各个用于检测和处理不同故障的检测处理模块的触发条件,确定当所述事件发生时需要触发的检测处理模块;
所述控制装置获取所述确定的检测处理模块的入口地址;以及
根据所获取的入口地址,所述控制装置触发所述确定的检测处理模块来检测和处理故障,
由至少一个扩展装置中包括的检测处理模块来检测和处理指定故障;
在所述扩展装置被加载到内存之后进行初始化时,所述扩展装置向所述控制装置发送用于注册所述检测处理模块且包含有所述检测处理模块的触发条件和入口地址的注册请求;
其中,所述至少一个扩展装置独立于所述控制装置而实现。
17.如权利要求16所述的方法,其中,还包括:
接收来自所述确定的检测处理模块的用于执行用于检测故障是否发生的指定故障检测模块或用于处理故障的指定故障处理模块且包含有所述指定故障检测模块的标识或所述指定故障处理模块的标识的执行请求;
根据所述执行请求所包括的所述指定故障检测模块的标识或所述指定故障处理模块的标识,获得所述指定故障检测模块的入口地址或所述指定故障处理模块的入口地址;以及,
根据所述指定故障检测模块的入口地址或所述指定故障处理模块的入口地址,执行所述指定故障检测模块或所述指定故障处理模块。
18.如权利要求17所述的方法,其中
所述确定步骤进一步用于从用于关联地存储各个检测处理模块的触发条件和入口地址的故障检测处理管理列表,确定当所述事件发生时需要触发的检测处理模块,
所述获取步骤进一步用于从所述故障检测处理管理列表,获取所述确定的检测处理模块的入口地址,以及
所述获得步骤进一步用于根据所述执行请求所包括的所述指定故障检测模块的标识或所述指定故障处理模块的标识,从故障检测管理列表或故障处理管理列表,获得所述指定故障检测模块的入口地址或所述指定故障处理模块的入口地址,其中,所述故障检测管理列表用于关联地存储各个用于检测不同故障是否发生的故障检测模块的名称、标识和入口地址,以及所述故障处理管理列表用于关联地存储各个用于处理不同故障的故障处理模块的名称、标识和入口地址。
19.如权利要求18所述的方法,其中,还包括:
当从任一扩展装置接收到用于注册指定检测处理模块的且包含所述指定检测处理模块的触发条件和入口地址的注册请求时,将所述指定检测处理模块的触发条件和入口地址关联地存储在所述故障检测处理管理列表中。
20.如权利要求19所述的方法,其中,还包括:
当从所述任一扩展装置接收到用于注册特定故障检测模块的且包含所述特定故障检测模块的名称和入口地址的注册请求时,分配用于所述特定故障检测模块的标识;
将所述特定检测模块的名称、标识和入口地址关联地存储在所述故障检测管理列表中;以及
向所述任一扩展装置发送所述特定故障检测模块的标识。
21.如权利要求19所述的方法,其中,还包括:
当从所述任一扩展装置接收到用于注册特定故障处理模块的且包含所述特定故障处理模块的名称和入口地址的注册请求时,分配用于所述特定故障处理模块的标识;将所述特定故障处理模块的名称、标识和入口地址关联地存储在所述故障处理管理列表中;以及
向所述任一扩展装置发送所述特定故障处理模块的标识。
22.如权利要求18所述的方法,其中,还包括:
当从任一扩展装置接收到用于获取特定故障检测模块的标识或特定故障处理模块的标识且包含所述特定故障检测模块的名称或所述特定故障处理模块的名称的请求时,根据所述特定故障检测模块的名称或所述特定故障处理模块的名称,从所述故障检测管理列表或所述故障处理管理列表查找所述特定故障检测模块的标识或所述特定故障处理模块的标识;以及
向所述任一扩展装置发送所查找的所述特定故障检测模块的标识或所述特定故障处理模块的标识。
23.如权利要求17所述的方法,其中,还包括:
当接收到来自所述指定故障检测模块的检测结果时,把所接收的检测结果发送给所述确定的检测处理模块。
24.如权利要求16所述的方法,其中,
所述至少一个扩展装置以动态库的方式实现。
CN201110455238.XA 2011-12-27 2011-12-27 用于故障检测和处理的方法和装置 Active CN102541613B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110455238.XA CN102541613B (zh) 2011-12-27 2011-12-27 用于故障检测和处理的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110455238.XA CN102541613B (zh) 2011-12-27 2011-12-27 用于故障检测和处理的方法和装置

Publications (2)

Publication Number Publication Date
CN102541613A CN102541613A (zh) 2012-07-04
CN102541613B true CN102541613B (zh) 2015-09-30

Family

ID=46348580

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110455238.XA Active CN102541613B (zh) 2011-12-27 2011-12-27 用于故障检测和处理的方法和装置

Country Status (1)

Country Link
CN (1) CN102541613B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114545888A (zh) * 2020-11-26 2022-05-27 北京新能源汽车股份有限公司 一种端对端的故障诊断方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101179454A (zh) * 2007-12-14 2008-05-14 华为技术有限公司 一种线卡故障定位方法及系统
CN101800675A (zh) * 2010-02-25 2010-08-11 华为技术有限公司 故障监控方法、监控设备及通信系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7979744B2 (en) * 2006-12-04 2011-07-12 Electronics And Telecommunications Research Institute Fault model and rule based fault management apparatus in home network and method thereof

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101179454A (zh) * 2007-12-14 2008-05-14 华为技术有限公司 一种线卡故障定位方法及系统
CN101800675A (zh) * 2010-02-25 2010-08-11 华为技术有限公司 故障监控方法、监控设备及通信系统

Also Published As

Publication number Publication date
CN102541613A (zh) 2012-07-04

Similar Documents

Publication Publication Date Title
US10491671B2 (en) Method and apparatus for switching between servers in server cluster
CN108847982B (zh) 一种分布式存储集群及其节点故障切换方法和装置
US9166872B2 (en) Method and network device for detecting IP address conflict
CN110159929B (zh) 地下排水管网智能管控大数据处理方法
CN111866707B (zh) 一种设备离线处理方法及装置
CN102541613B (zh) 用于故障检测和处理的方法和装置
CN105721203A (zh) 升级处理方法及装置
JP2008181302A (ja) 遠隔管理装置及び遠隔管理システム及び遠隔管理方法
US20120108264A1 (en) Monitoring And Apparatus For Monitoring Cellular Network Coverage Using Mobile Units
CN113868058A (zh) 一种外设组件高速互联设备故障检测方法、装置及服务器
EP1703392A3 (en) Method and apparatus for detecting failures in a partitioned large scale computer system
CN110855394A (zh) 时间校正方法、装置、系统、设备、及存储介质
CN105025179A (zh) 呼叫中心座席的监控方法及系统
CN116823222A (zh) 一种设备排障系统及方法
CN110972071A (zh) 一种多模定位方法、定位服务器、终端和存储介质
CN111083721A (zh) 基站退服告警的处理方法和装置
CN104378246A (zh) 一种网络设备故障定位系统、方法及装置
CN107465531B (zh) 发电调度方法及装置
US7894949B2 (en) Fault tracing in the data bus system of a vehicle
CN111651294B (zh) 一种节点异常检测方法及装置
JPH1139031A (ja) 監視システム及び記録媒体
JP2007249838A (ja) マルチプロセッサシステム及び監視制御方法
CN106878101A (zh) 监控系统中告警信息的处理方法和装置
CN110750418B (zh) 一种信息处理方法、电子设备和信息处理系统
CN111256815B (zh) 光线强度的确定方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20211220

Address after: 450046 Floor 9, building 1, Zhengshang Boya Plaza, Longzihu wisdom Island, Zhengdong New Area, Zhengzhou City, Henan Province

Patentee after: Super fusion Digital Technology Co.,Ltd.

Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd.