CN100563131C - 一种单板故障的检测方法及装置 - Google Patents
一种单板故障的检测方法及装置 Download PDFInfo
- Publication number
- CN100563131C CN100563131C CNB031405606A CN03140560A CN100563131C CN 100563131 C CN100563131 C CN 100563131C CN B031405606 A CNB031405606 A CN B031405606A CN 03140560 A CN03140560 A CN 03140560A CN 100563131 C CN100563131 C CN 100563131C
- Authority
- CN
- China
- Prior art keywords
- formation
- measured
- detection
- time
- veneer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Tests Of Electronic Circuits (AREA)
Abstract
本发明提供了一种单板故障的检测方法。该方法包括步骤:预先选定待测项及定时方式和定时时间,定时时间达到后,对已达到执行时间的待测项进行排队形成待测项队列,然后根据所述待测项队列,按照每个待测项的信息进行单板检测,检测完毕,记录检测结果。本发明还提供了一种实现上述方法的装置。其中包括:定时器组;用户接口,用于定时器及测试项的属性设置,并提供查询和显示功能;消息传送装置;检测执行装置;检测结果处理器。使用本发明,可实现不同频度要求的实时检测,降低了设备的运营、维护成本。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种单板故障的检测方法及装置。
背景技术
随着信息技术及通讯业的迅速发展,大容量、高性能的通讯设备广泛应用于通信网络中,随之对这些设备的可靠性和可维护性的要求也越来越高。如果由于通讯设备的故障造成业务中断,不仅会给用户造成巨大的经济损失,还会给网络运营商带来巨大的经济和声誉损失,因此,实时检测并解除通讯设备的故障成为通讯设备系统可靠运行必不可少的条件。目前的通讯设备广泛采用了嵌入式技术,以这种技术设计的通讯设备系统大多以单板为主要部件组成,因此,对单板的检测便成了确定通讯设备是否可靠工作的一个重要途径。
对于上述通讯设备系统,目前设备制造商为系统单板的故障检测提供了多种手段。通常的方法有两种:
一种是采用告警卡的设计实现对单板环境和物理参数(如温度、电压、电流、风扇转速等)的监测。告警卡与通讯设备相连,不断地监测相关参数,当所述参数超过告警阈值时,点亮告警卡上相应的指示灯,同时驱动相应的转接口,外接声音告警或可视化告警系统,同时把每个告警信息记录在系统控制台上。一般这种检测每60秒进行一次。目前这种检测的对象一般只是单板的最基本的环境和物理参数,而单板的实时运行业务故障(如报文转发失败)及单板上各器件自身的故障却无法监测。
另一种方法是采用现场隔离性测试,即先通过主控台中断单板的正常业务运行,然后加载相应的测试程序到被测单板,进行诊断测试,测试结果通过控制台和指示灯显示。测试通过,则重新为被测单板加载正常运行程序,恢复单板的正常运行;测试不通过,对有故障的单板或模块进行现场更换,恢复单板的正常运行。这种方法的单板测试需要中断被测单板的业务,对不同的单板要加载不同的测试程序,单板故障的检测时间较长,一般要花几分钟,甚至十几分钟,这对于业务可靠性要求很高的系统或大业务流量的设备来说是很难接受的。
发明内容
本发明的目的在于克服上述现有技术的缺点,提供一种不影响系统各单板业务正常运行、多种定时方式并存的在线单板故障检测方法和装置,它可以检测各单板的硬件工作环境、单元器件和业务运行情况。
本发明提供了一种单板故障的检测方法,所述方法包括:
初始化检测任务,设定待测项、检测队列形成时间和检测队列形成周期的信息;
判断所述检测队列形成时间是否达到,
如果未达到,等待预定时间后再执行上述判断所述检测队列形成时间是否达到的步骤,
如果已达到或超过,将已达到所述检测队列形成时间的所述待测项进行排队形成待测项队列,以进行检测;
判断所述单板是否有所述待测项在“检测运行状态”,
如果有,等待预定时间后再执行上述判断所述单板是否有所述待测项在所述“检测运行状态”的步骤,
如果没有,判断是否存在所述形成的待测项队列,
如果有,根据所述形成的待测项队列,进行对应的单板检测,
如果没有,返回到判断所述检测队列形成时间是否达到的步骤。
可选地,所述初始化检测任务的步骤包括步骤:建立至少一个单板测试项链表,所述单板测试项链表对应的定时方式包括下列方式中至少一种:相对非周期定时方式、对应相对周期定时方式、对应绝对非周期定时方式、对应绝对周期定时方式;建立一个测试执行链表,测试执行链表的内容表示为所述待测项队列;建立一个单板状态表。
优选地,所述建立至少一个单板测试项链表的步骤包括步骤:建立四个编号不同、内容相同的单板测试项链表,分别对应相对非周期定时方式,相对周期定时方式,绝对非周期定时方式和绝对周期定时方式。
可选地,所述建立四个编号不同、内容相同的单板测试项链表的步骤包括步骤:设定所述四个单板测试项链表的内容,包括所述待测项名称、待测项对应的节点号、待测项的开关状态、检测相对执行时间、检测结果的消息反馈预定时间。
可选地,所述初始化检测任务的步骤在建立一个单板状态表之后包括步骤:清空所述测试执行链表;设置所述单板状态表中所有单板为“检测停止状态”和“非屏蔽状态”,所述“检测停止状态”表明所述单板目前没有进行故障检测,所述“非屏蔽状态”表明所述单板能接受外部指令进行检测或其它操作。
优选地,所述将已达到所述检测队列形成时间的所述待测项进行排队形成待测项队列的步骤包括步骤:
所述相对非周期定时检测队列形成时间或所述相对周期定时检测队列形成时间达到时,通过遍历所述单板测试项链表的方式,分别判断与所述这两种定时方式对应的所述单板测试项链表中的每个待测项是否达到所述检测执行时间,将达到所述检测执行时间的所述待测项进行排队,形成待测项队列,将所述待测项队列追加到所述测试执行链表中,所述绝对非周期定时检测队列形成时间或所述绝对周期定时检测队列形成时间达到时,将与所述这两种定时方式对应的所述单板测试项链表中的所有所述待测项追加到所述测试执行链表中。
优选地,所述根据所述形成的待测项队列,进行对应的单板检测的步骤包括步骤:
判断所述对应的单板是否是非主控单板,
如果所述单板是所述非主控单板,
向所述非主控单板发送待测项消息,
接收所述非主控单板上报的检测结果消息,
记录所述非主控单板上报的检测结果;
如果所述单板是主控单板,
检测所述主控单板,
记录所述主控单板的检测结果。
可选地,所述接收所述非主控单板上报的检测结果消息的步骤包括步骤:
如果在设定的检测结果的消息反馈预定时间内收到所述单板的全部结果消息,则在所述单板状态表中置被测单板为所述“检测停止状态”,并记录所述检测结果;
如果在设定的检测结果的消息反馈预定时间内没有收到所述单板的全部检测结果消息,则在所述单板状态表中置所述单板为“屏蔽状态”,并发告警消息,所述“屏蔽状态”表明所述单板不能接受外部指令进行检测或其它操作。
优选地,所述向所述非主控单板发送待测项消息的步骤在接收到所述被测单板的全部检测结果消息或所述待测项检测结果的消息反馈时间超过设定的检测结果的消息反馈预定时间后执行。
本发明还提供了一种单板故障的检测装置,用于执行上述单板故障的检测方法中任一种方法,所述装置包括:
定时器组,用于控制单板故障检测的时间和周期;
中央处理器,耦合到所述定时器组,用于控制所述装置中其它部分的运行;
检测结果处理器,耦合到所述中央处理器,用于处理单板故障检测结果;
用户接口,分别通过不同的通道耦合到所述定时器组、所述中央处理器和所述检测结果处理器,用于提供设置、查询和显示功能;
检测执行装置,耦合到所述中央处理器,用于根据所述中央处理器的命令检测单板故障;
消息传送装置,耦合到所述中央处理器和所述检测执行装置,用于在所述中央处理器和所述检测执行装置之间交换检测命令和检测结果消息。
可选地,所述的定时器组还包括:相对周期定时器,用于对单板故障进行定期的相对定时检测的定时,绝对周期定时器,用于对单板故障进行定期的绝对定时检测的定时,相对非周期定时器,用于对单板故障进行非定期的相对定时检测的定时,绝对非周期定时器,用于对单板故障进行非定期的绝对定时检测的定时。
优选地,所述的用户接口,用于设置定时器开关属性、定时方式、定时时间、每个测试项的开关属性及相对执行时间。
优选地,所述的用户接口,用于提供下列信息中至少一种:命令查询并显示定时器的状态和计时值、各测试项的状态和计时值、命令禁止或开放测试项、命令中断当前正在执行的检测。
可选地,所述检测执行装置还包括测试项管理器和测试项运行器,分别用于管理测试项和运行测试项;所述测试项管理器分别耦合到所述中央处理器和所述消息传送装置,所述测试项运行器耦合到所述的中央处理器。
由于在单板故障检测中采用了上述方法和装置,使系统对单板的检测无需先中断单板运行的业务,加载相应的检测程序,然后再对单板进行检测,而是只要有检测请求,即可对单板进行检测,并通过实时上报检测结果,可以及时处理检测故障,缩短了系统单板故障的定位识别时间,提高了设备运行的可靠性;另外,通过采用上述多种定时处理机制,可实现不同频度要求的实时检测,尤其在系统的周期性定时维护方面,大大减少了系统维护人员的工作量,降低了设备的运营、维护成本;采用链表管理、执行机制,可为不同的系统要求配置不同的单板检测项,减少了系统设备的开发成本。
附图说明
图1描述了本发明的优选实施例的单板故障检测方法的步骤的流程图;
图2描述了图1所示的优选实施例的单板故障检测方法中的相对定时方式时所述将已达到检测队列形成时间的待测项进行排队,形成待测项队列的详细步骤流程图;
图3描述了图1所示的优选实施例的单板故障检测方法中的绝对定时方式时所述将已达到检测队列形成时间的待测项进行排队,形成待测项队列的详细步骤流程图;
图4描述了图1所示的优选实施例的单板故障检测方法中的所述启动待测项队列,进行单板检测的详细步骤流程图;
图5描述了所述测试项链表中每项的内容及格式;
图6描述了所述测试执行链表中每项的内容及格式;
图7描述了所述单板状态表中每项的内容及格式;
图8描述了图1所示的优选实施例的单板故障检测方法中建立四个单板测试项链表时将达到检测执行时间的待测项进行排队形成待测项队列的顺序流程;
图9描述了本发明的优选实施例的单板故障检测装置方框图。
具体实施方式
下面结合附图和实施方式对本发明作进一步的详细说明:
首先参照图1,图1描述了本发明的优选实施例的单板故障检测方法的步骤的流程:
首先在步骤10对检测任务初始化,设定待测项、检测队列形成时间和检测队列形成周期等信息,其中包括:建立一个主控单板检测运行状态标志,所述主控单板检测运行状态标志表明主控单板在运行故障检测任务,建立至少一个单板测试项链表对应一种定时方式,建立一个测试执行链表6,测试执行链表6的内容表示为待测项队列,建立一个单板状态表7,所述单板测试项链表、测试执行链表6和单板状态表7的内容及格式将在下文参照图5至图7详细描述;
步骤10对检测任务初始化还包括:清空测试执行链表6,设置单板状态表7的第二个字段检测状态72为“检测停止状态”、第三个字段屏蔽状态73为“非屏蔽状态”,所述“检测停止状态”表明单板目前没有运行故障检测,所述“非屏蔽状态”表明单板能接受外部指令进行检测或其它操作。
然后进到步骤11,判断检测队列形成时间是否达到,其中,检测队列形成时间包括:相对非周期定时检测队列形成时间;相对周期定时检测队列形成时间;绝对非周期定时检测队列形成时间;绝对周期定时检测队列形成时间。
如果未达到,等待预定时间后再执行步骤11,判断检测队列形成时间是否达到,
如果已达到或超过,则方法进到步骤12,将已达到检测队列形成时间的单板测试项链表中的待测项进行排队形成待测项队列,追加到测试执行链表6中,以进行检测,对于不同的定时方式(相对定时方式和绝对定时方式,相对定时方式又包括相对非周期定时方式和相对周期定时方式;绝对定时方式又包括绝对非周期定时方式和绝对周期定时方式),待测项进行排队形成待测项队列的步骤有所不同,下文将参照图2和图3分别进行详细描述。
再参照图1,在步骤12形成待测项队列后,进到步骤13,判断单板是否有待测项在“检测运行状态”,也就是说遍历单板状态表7中的第二个字段检测状态72是否有为“检测运行状态”的项,所述“检测运行状态”表明单板状态表7中第一个字段节点71对应的单板在执行故障检测任务,
如果有,则等待预定时间后再执行步骤13,判断所述单板是否有待测项在“检测运行状态”,
如果没有,则进到步骤14,判断是否有待测项队列,也就说判断测试执行链表6是否非空,
如果有待测项队列,则进到步骤15,根据待测项队列进行单板检测,下文将参照附图4对步骤15根据所述待测项队列进行所述单板检测的流程作详细描述。
如果没有待测项队列,则返回步骤11,判断检测队列形成时间是否达到,以进行下一个待测项的检测任务。
图5描述了所述测试项链表中每项的内容及格式,
在本发明的最佳实施方式中,需要建立四个编号不同、内容相同的单板测试项链表。链表1对应相对非周期定时方式,链表2对应相对周期定时方式,链表3对应绝对非周期定时方式、链表4对应绝对周期定时方式,所述定时是针对不同的检测任务的执行时间而设定的,目的是实现不同频度和检测优先级的要求。例如,对系统例行维护的检测任务就可以设定为周期定时方式,根据系统的实际需要临时需要的检测任务就可以设定为周期定时方式;同一级别的检测任务可由绝对定时方式控制,而级别不同的检测任务可由相对定时方式控制,这样,使得检测任务可灵活设置。
链表1至链表4的内容包括:
第一个字段为名称511:表示待测项名称;
第二个字段为节点512:表示待测项对应的节点号;
第三个字段为状态513:表示待测项的开关状态,“ON”(开)表示为待测项,“OFF”(关)表示为非待测项;
第四个字段为执行时间514:表示检测相对执行时间,此字段需要预先设定,表示检测相对执行时间的初值;
第五个字段为反馈时间515:表示检测结果的消息反馈预定时间。
通过设定测试项链表1至链表4中的第三个字段状态513,可以设定不同的待测项组合,通过设定链表1至链表4的执行时间和执行周期,以及链表1至链表4中的第四个字段执行时间,可以确定每个待测项实际执行时间,下面将分别说明:
对于相对非周期定时方式,通过设定链表1对应的执行时间及链表1中每项的第四个字段执行时间,确定每项检测任务的实际执行时间;
对于相对周期定时方式,通过设定链表2对应的执行时间和执行周期及链表2中每项的第四个字段执行时间,确定每项检测任务的实际执行时间;
对于绝对非周期定时方式,通过设定链表3对应的执行时间,可以不设定链表3的第四个字段执行时间,也可以设定链表3的第四个字段执行时间为0,确定每项检测任务的实际执行时间;
对于绝对周期定时方式,通过设定链表4对应的执行时间,可以不设定链表4的第四个字段执行时间,也可以设定链表4的第四个字段执行时间为0,确定每项检测任务的实际执行时间;
图6描述了测试执行链表6中每项的内容及格式:
其中,第一个字段为名称61:表示待测项名称;
第二个字段为节点62:表示待测项对应的节点号。
第三个字段为反馈时间63:表示检测结果的消息反馈预定时间。
图7描述了单板状态表7中每项的内容及格式:
其中,第一个字段为节点71:表示待测项对应的节点号;
第二个字段为检测状态72:表示节点71对应的单板是否在执行故障检测任务;
第三个字段为屏蔽状态73:表示节点71对应的单板是否能接受外部指令进行检测或其它操作。
图2详细描述了图1所示的优选实施例的单板故障检测方法中相对定时方式时步骤12将已达到检测队列形成时间的待测项进行排队形成待测项队列的一种典型实施方式的流程,其中所述相对定时方式包括相对非周期定时方式和相对周期定时方式:
相对非周期定时方式对应的链表1的执行时间达到后,进到步骤21,取得链表1中的第一个测试项;然后进到步骤22,检索取得项的第三个字段状态513,判断状态513是否为“ON”,“ON”表示为待测项,
如果是“ON”,则进到步骤23,取得当前项的第四个字段检测任务相对执行时间514的值,并将检测相对执行时间514的值减1,即通过递减的方法得到定时的到达时间,本领域普通技术人员知道,对于定时的到达时间的获得并不局限于此,可以有多种方法(例如,可以把字段514的初值设为0,采用递增的方法,每次链表1的执行时间达到后,字段514的值加1,然后判断和设定的相对定时时间是否相等)。然后进到步骤24,判断执行时间514是否为0,即判断该项检测任务的相对执行时间是否达到,
如为0,则到步骤25,将当前项添加到测试执行链表6中,包括:
链表1名称511放入链表6的名称61的位置,
链表1节点512放入链表6的节点62的位置,
链表1反馈时间515放入链表6的反馈时间63的位置,
同时重新给链表1的执行时间514赋初值,即把预先设定的该项检测的相对执行时间的初值重新赋给字段514,然后进到步骤26,判断取得项是否为链表1中最后一项,也就是说判断链表1是否已结束,
如不为0,则跳转到步骤26,判断取得项是否为链表1中最后一项,也就是说判断链表1是否已结束,
如果不是“ON”,则跳转到步骤26,判断取得项是否为链表1中最后一项,也就是说判断链表1是否已结束,
如果是,则返回到图1中的步骤13,判断单板是否有待测项在“检测运行状态”,
否则,进到本图2步骤27,取得链表1中的下一项,然后返回到步骤22,进行链表1下一项的判别,直到遍历完链表1中的所有项,然后返回到图1中的步骤13,判断单板是否有待测项在“检测运行状态”。
相对周期定时方式对应的链表2的遍历方法同链表1的遍历方法相同,不再详细描述。设定相对周期定时方式的目的可以实现不同频度要求的检测,使检测任务成为定时的例行维护手段。
图3详细描述了图1所示的优选实施例的单板故障检测方法中绝对定时方式时所述步骤12将已达到检测队列形成时间的待测项进行排队形成待测项队列的一种典型实施方式的流程,其中所述绝对定时方式包括绝对周期定时方式和绝对非周期定时方式:
绝对非周期定时方式对应的链表3的执行时间达到后,进到步骤31,取得链表3中的第一项;
然后进到步骤32,检索当前项的第三个字段状态533,判断状态533是否为“ON”,
如果是“ON”,则进到步骤33,将当前项添加到测试执行链表6中,包括:
链表3名称531放入链表6的名称61的位置,
链表3节点532放入链表6的节点62的位置,
链表3反馈时间535放入链表6的反馈时间63的位置,
然后进到步骤34,判断当前项是否为链表3中最后一项,也就是说判断链表3是否已结束,
如果不是“ON”,则跳转到步骤34,判断当前项是否为链表3中最后一项,也就是说判断链表3是否已结束,
如果是,则返回到图1中的步骤13,判断单板是否有待测项在“检测运行状态”,
否则,进到步骤35,取得单板测试项链表3中的下一项,然后返回到步骤32,进行链表3下一项的判别,直到遍历完链表3中的所有项,然后返回到图1中的步骤13,判断单板是否有待测项在“检测运行状态”。
绝对周期定时方式对应的链表4的遍历方法同链表3的遍历方法相同,不再详细描述。
图8详细描述了图1所示的优选实施例的单板故障检测方法中建立四个单板测试项链表时步骤11到步骤12的将达到检测执行时间的待测项进行排队形成待测项队列的顺序流程:
如果检测系统建立一个以上的所述单板测试项链表,则要逐个查询测试项链表,将达到检测队列形成时间的对应的测试项链表中达到执行时间的测试项进行排队,追加到测试执行链表6中,建立的四个测试项链表,分别为链表1、链表2、链表3、链表4,
首先判断链表1的执行时间是否达到,
如果达到,则遍历链表1,将链表1中达到执行时间的待测项追加到测试执行链表6中,然后转到判断链表2的执行时间是否达到,
如未达到,则判断链表2的执行时间是否达到,
如果达到,则遍历链表2,将链表2中达到执行时间的待测项追加到测试执行链表6中,然后转到判断链表3的执行时间是否达到,
如未达到,则判断链表3的执行时间是否达到,
如果达到,则遍历链表3,将链表3中达到执行时间的待测项追加到测试执行链表6中,然后转到判断链表4的执行时间是否达到,
如未达到,则判断链表4的执行时间是否达到,
如果达到,则遍历链表4,将链表4中达到执行时间的待测项追加到测试执行链表6中,然后结束。
如未达到,则结束。
图4描述了图1所示的优选实施例的单板故障检测方法中所述步骤15的根据待测项队列,进行单板检测的详细步骤流程图:
首先在步骤41取得测试执行链表6当前项;
然后进到步骤42,判断测试执行链表6当前项是否是非主控单板的待测项,
如果测试执行链表6当前项是非主控单板的待测项,则进到步骤43,把测试执行链表6当前项信息下发给相关单板,同时删除链表6中的当前项、启动所述当前项的状态定时器、置单板状态表7中与测试执行链表6当前项节点62对应项节点71为“检测运行状态”,然后进到步骤44,接收所述相关单板上报的检测结果消息,然后进到步骤45,判断是否接收到所述相关单板的全部检测结果消息,
如果已全部收到,则进到步骤46,置单板状态表7中与测试执行链表6当前项节点62对应项节点71为“检测停止状态”、并停止所述当前项的状态定时器、记录接收到的所述相关单板的检测结果,然后返回图1的步骤13,判断单板是否有待测项在“检测运行状态”,
如果没有全部收到,则进到步骤47,判断所述当前项的状态定时器的时间是否超过测试执行链表6中当前项的反馈时间63,
如未超过,则返回步骤44,继续接收所述相关单板上报的检测结果消息,
如已超过,则进到步骤48,置单板状态表7中与测试执行链表6当前项节点62对应项运行状态72为“检测停止状态”和屏蔽状态73为“屏蔽状态”,然后返回图1的步骤13,判断单板是否有待测项在“检测运行状态”,
如果测试执行链表6当前项不是非主控单板的待测项,则进到步骤49,调用所述主控单板的检测子程序进行主控单板的检测,并删除测试执行链表6当前项、置所述主控单板检测运行状态标志为“检测运行状态”,然后进到步骤410,步骤410为主控单板的检测子程序执行结束后置所述主控单板检测运行状态标志为“检测停止状态”,记录所述主控单板的检测结果,然后返回图1的步骤13,判断单板是否有待测项在“检测运行状态”。
图9描述了本发明的优选实施例的单板故障检测装置方框图,用户接口91分别通过不同的通道耦合到定时器组92、中央处理器93、检测结果处理器94上,其中中央处理器93还分别通过不同的通道耦合到定时器组92和检测结果处理器94,消息传送装置95分别通过不同的通道耦合到中央处理器93和检测执行装置96,所述消息传送装置95用于中央处理器93和检测执行装置96之间的通讯,检测执行装置96还耦合到中央处理器93,检测执行装置96包括一个测试项管理器和一个测试项运行器。其中,定时器组92至少有一个定时器,用于设定故障检测定时方式和定时时间,在所述定时器组92的一个优选实施方式中包括四个不同的定时器,分别为:相对周期定时器、绝对周期定时器、相对非周期定时器、绝对非周期定时器,分别对应四种不同的定时方式。
通过用户接口91设置所述定时器组中各定时器的开关属性、定时方式、定时时间、每个所述待测项的开关属性及检测相对执行时间,还可通过用户接口91提供命令查询并显示所述定时器组的状态和定时时间、各所述待测项的状态和检测执行时间,还可通过用户接口91提供命令禁止或开放所述待测项,还可通过用户接口91提供命令中断当前正在执行的检测。
选择待测项的定时方式对应所述定时器组92中的定时器,由中央处理器93分别查询所述定时器组92中的定时器,如果所述定时器的计时时间超过设定的所述定时时间,则由中央处理器93把已到所述检测执行时间的待测项的消息通过消息传送装置95传到检测执行装置96的测试项管理器901上,同时启动测试项运行器902,单板检测完毕,检测结果消息由测试项管理器901通过消息传送装置95上传给中央处理器93,中央处理器93再将所述检测结果转交检测结果处理器94进行记录或发告警消息。
虽然通过实施例描绘了本发明,本领域普通技术人员知道,本发明有许多变形和变化而不脱离本发明的精神,如,所述相对定时方式的计时方式,可采用检测相对执行时间减1,然后判断检测相对执行时间是否为0的方式计时,也可采用由0开始加1,然后和相对检测执行时间比较的方式,一台通用的计算机在通过将本发明透露的方法编为其可运行的程序后,通过运行实现本发明的程序也可实现本发明的装置来进行系统单板故障的检测,希望所附的权利要求包括这些变形和变化而不脱离本发明的精神。
Claims (14)
1.一种单板故障的检测方法,用于对在网络系统中的网上设备的实时运行中检测要检测的单板的故障,该方法包括步骤:
A、初始化检测任务,设定待测项、检测队列形成时间和检测队列形成周期;
B、判断所述检测队列形成时间是否达到,
B1、如果未达到,等待预定时间后再执行上述步骤B判断所述检测队列形成时间是否达到,
B2、如果已达到或超过,将已达到所述检测队列形成时间的所述待测项进行排队形成待测项队列,以进行检测;
C、判断所述单板是否有以前设定的待测项在“检测运行状态”,
C1、如果有,等待预定时间后再执行上述步骤C判断所述单板是否有以前设定的待测项在所述“检测运行状态”,
C2、如果没有,判断是否存在所述形成的待测项队列,
C21、如果有,根据所述形成的待测项队列,进行对应的单板检测,
C22、如果没有,返回判断所述检测队列形成时间是否达到的步骤。
2.如权利要求1所述的单板故障的检测方法,其中,所述初始化检测任务的步骤A包括步骤:
a1、建立至少一个单板测试项链表,所述单板测试项链表对应的定时方式包括下列方式中至少一种:相对非周期定时方式、相对周期定时方式、绝对非周期定时方式、绝对周期定时方式;
a2、建立一个测试执行链表,所述测试执行链表的内容为所述待测项队列;
a3、建立一个单板状态表。
3.如权利要求2所述的单板故障的检测方法,其中,所述建立至少一个单板测试项链表的步骤a1包括:建立四个编号不同、内容相同的单板测试项链表,分别对应相对非周期定时方式,相对周期定时方式,绝对非周期定时方式和绝对周期定时方式。
4.如权利要求3所述的单板故障的检测方法,其中,所述建立四个编号不同、内容相同的单板测试项链表的步骤包括:
设定所述四个单板测试项链表的内容,包括所述待测项名称、待测项对应的节点号、待测项的开关状态、检测相对执行时间、检测结果的消息反馈预定时间。
5.如权利要求2所述的单板故障的检测方法,其中,所述初始化检测任务的步骤A在建立一个单板状态表之后还包括步骤:
清空所述测试执行链表;
设置所述单板状态表中所有单板为“检测停止状态”和“非屏蔽状态”。
6.如权利要求3所述的单板故障的检测方法,其中,所述将已达到所述检测队列形成时间的所述待测项进行排队形成待测项队列的步骤包括步骤:
c1、所述相对非周期定时检测队列形成时间或所述相对周期定时检测队列形成时间达到时,
c11、通过遍历所述单板测试项链表的方式,分别判断与所述这两种定时方式对应的所述单板测试项链表中的每个待测项是否达到检测时间,
c12、对未达到检测时间的待测项继续计时,等待所述待测项的检测时间达到,
c13、将达到所述检测时间的所述待测项进行排队,形成待测项队列,
c14、将所述待测项队列追加到所述测试执行链表中;
c2、所述绝对非周期定时检测队列形成时间或所述绝对周期定时检测队列形成时间达到时,
将与所述这两种定时方式对应的所述单板测试项链表中的所有所述待测项追加到所述测试执行链表中。
7.如权利要求5所述的单板故障的检测方法,其中,所述根据所述形成的待测项队列,进行对应的单板检测的步骤C21包括步骤:
判断所述对应的单板是否是非主控单板,
d1、如果所述单板是所述非主控单板,
d11、向所述非主控单板发送待测项消息,
d12、接收所述非主控单板上报的检测结果消息,
d13、记录所述非主控单板上报的检测结果;
d2、如果所述单板是主控单板,
d21、检测所述主控单板,
d22、记录所述主控单板的检测结果。
8.如权利要求7所述的单板故障的检测方法,其中,所述接收所述非主控单板上报的检测结果消息的步骤d12包括步骤:
如果在设定的检测结果的消息反馈预定时间内收到所述单板的全部检测结果消息,则在所述单板状态表中置所述单板为所述“检测停止状态”,并记录所述检测结果;
如果在设定的检测结果的消息反馈预定时间内没有收到所述单板的全部检测结果消息,则在所述单板状态表中置所述单板为“屏蔽状态”,并发告警消息。
9.如权利要求7所述的单板故障的检测方法,其中,所述向所述非主控单板发送待测项消息的步骤d11是在接收到所述被测单板的全部检测结果消息或所述待测项检测结果的消息反馈时间超过设定的检测结果的消息反馈预定时间后执行。
10.一种单板故障的检测装置,用于执行权利要求1至9任一项所述的检测方法,所述装置包括:
定时器组,用于控制单板故障检测的时间和周期;
中央处理器,耦合到所述定时器组,用于控制所述装置中其它部分的运行;
检测结果处理器,耦合到所述中央处理器,用于处理单板故障检测结果;
用户接口,分别通过不同的通道耦合到所述定时器组、所述中央处理器和所述检测结果处理器,用于提供设置、查询和显示功能;
检测执行装置,耦合到所述中央处理器,用于根据所述中央处理器的命令检测单板故障;
消息传送装置,耦合到所述中央处理器和所述检测执行装置,用于在所述中央处理器和所述检测执行装置之间交换检测命令和检测结果消息。
11.如权利要求10所述的检测装置,其中所述的定时器组还包括:
相对周期定时器,用于对单板故障进行定期的相对定时检测的定时,
绝对周期定时器,用于对单板故障进行定期的绝对定时检测的定时,
相对非周期定时器,用于对单板故障进行非定期的相对定时检测的定时,
绝对非周期定时器,用于对单板故障进行非定期的绝对定时检测的定时。
12.如权利要求10所述的检测装置,其中所述的用户接口,用于设置定时器开关属性、定时方式、定时时间、每个测试项的开关属性及相对执行时间。
13.如权利要求10所述的检测装置,其中所述的用户接口,用于提供下列信息中至少一种:命令查询并显示定时器的状态和计时值、各测试项的状态和计时值、命令禁止或开放测试项、命令中断当前正在执行的检测。
14.如权利要求10所述的检测装置,其中所述的检测执行装置还包括测试项管理器和测试项运行器,分别用于管理测试项和运行测试项;所述测试项管理器分别耦合到所述中央处理器和所述消息传送装置,所述测试项运行器耦合到所述中央处理器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB031405606A CN100563131C (zh) | 2003-05-29 | 2003-05-29 | 一种单板故障的检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB031405606A CN100563131C (zh) | 2003-05-29 | 2003-05-29 | 一种单板故障的检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1553598A CN1553598A (zh) | 2004-12-08 |
CN100563131C true CN100563131C (zh) | 2009-11-25 |
Family
ID=34323823
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB031405606A Expired - Fee Related CN100563131C (zh) | 2003-05-29 | 2003-05-29 | 一种单板故障的检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100563131C (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100407657C (zh) * | 2005-12-23 | 2008-07-30 | 华为技术有限公司 | 一种单板告警查询方法及装置 |
CN101072089B (zh) * | 2006-05-08 | 2010-06-23 | 中兴通讯股份有限公司 | 一种对传输交叉类单板进行测试的装置 |
CN101098359B (zh) * | 2006-06-27 | 2011-05-11 | 中兴通讯股份有限公司 | 一种用于测试仪的分时测试方法 |
CN101137164B (zh) * | 2006-12-04 | 2011-05-11 | 中兴通讯股份有限公司 | 一种故障诊断测试项的设置方法和系统 |
CN101145986B (zh) * | 2007-06-18 | 2011-04-20 | 中兴通讯股份有限公司 | 一种通讯系统中板间通信状态检测方法 |
CN101111044B (zh) * | 2007-08-22 | 2010-06-09 | 中兴通讯股份有限公司 | 一种移动通信网络管理系统及其诊断基站单板的方法 |
EP2053775A1 (en) * | 2007-10-23 | 2009-04-29 | Siemens Aktiengesellschaft | Module for controlling integrity properties of a data stream |
CN101150461B (zh) * | 2007-11-15 | 2010-06-02 | 杭州华三通信技术有限公司 | 一种查询系统中节点的方法及装置 |
CN101614620A (zh) | 2008-06-27 | 2009-12-30 | 深圳富泰宏精密工业有限公司 | 电子装置及其周期性测试方法 |
CN101989936B (zh) * | 2010-11-01 | 2014-06-11 | 中兴通讯股份有限公司 | 单板故障的测试方法及系统 |
CN102143014A (zh) * | 2010-11-03 | 2011-08-03 | 华为数字技术有限公司 | 一种检测单板故障的方法、单板和路由器 |
CN104066103B (zh) * | 2013-03-19 | 2017-10-10 | 中国移动通信集团湖北有限公司 | 数据业务核心网的故障定位方法和装置 |
CN105588989B (zh) * | 2014-10-22 | 2020-02-07 | 中兴通讯股份有限公司 | 单板测试方法及装置 |
CN106899996A (zh) * | 2015-12-18 | 2017-06-27 | 中兴通讯股份有限公司 | 一种基站单板的硬件故障检测方法及装置 |
CN107995152B (zh) * | 2016-10-27 | 2020-07-03 | 腾讯科技(深圳)有限公司 | 一种恶意访问检测方法、装置及检测服务器 |
CN110596569A (zh) * | 2019-08-20 | 2019-12-20 | 福州瑞芯微电子股份有限公司 | 一种pcba板的测试方法和装置 |
-
2003
- 2003-05-29 CN CNB031405606A patent/CN100563131C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1553598A (zh) | 2004-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100563131C (zh) | 一种单板故障的检测方法及装置 | |
US20130080624A1 (en) | Management computer and method for root cause analysis | |
CN102355368B (zh) | 一种网络设备的故障处理方法及系统 | |
CN112787855B (zh) | 一种面向广域分布式服务的主备管理系统及管理方法 | |
CN114443435A (zh) | 一种面向容器微服务的性能监控告警方法及告警系统 | |
CN101032123B (zh) | 用于确定故障对网络服务的影响的方法和装置 | |
EP0604091A2 (en) | Monitoring and controlling method and system | |
JPH05303494A (ja) | リアルタイム制約に適合し得るエキスパートシステム | |
JP2004145536A (ja) | 管理システム | |
CN109471860A (zh) | 面向电动汽车充电网络大规模充电桩数据处理方法及装置 | |
CN112100019B (zh) | 面向大规模系统的多源故障协同分析定位方法 | |
JP4342795B2 (ja) | 監視制御装置 | |
CN115174350B (zh) | 一种运维告警方法、装置、设备及介质 | |
CN101477342B (zh) | 一种面向采集设备类型的分区间数据采集方法 | |
JP2002259236A (ja) | 分散型制御システムと、かかるシステムにおける異常時データ収集方法 | |
CN100490343C (zh) | 一种通讯设备中主备用单元倒换的实现方法和装置 | |
KR101058001B1 (ko) | 네트워크 기기에 대한 애프터 서비스 제공 방법 및 그시스템 | |
JP2001077814A (ja) | ネットワーク障害解析支援装置、およびネットワーク障害解析方法、ならびに障害解析プログラムを記録した記録媒体 | |
JP2001005795A (ja) | 分散システムにおける異常検出方法 | |
CN109491843A (zh) | 一种应用的故障监测方法和装置 | |
KR101104563B1 (ko) | 시스로그 정보를 활용한 에스오피 관리 시스템 및 그 방법 | |
CN104284185A (zh) | 视频图像质量巡检方法及系统 | |
WO2017047951A1 (ko) | 엔터프라이즈 비즈니스 서비스 레벨의 통합 모니터링 방법 및 시스템 | |
CN114297032A (zh) | 一种多服务器环境中的服务管理方法及可视化系统 | |
KR100256687B1 (ko) | 관리객체 등록 리스트를 이용한 관리객체 검색 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20091125 Termination date: 20180529 |
|
CF01 | Termination of patent right due to non-payment of annual fee |