CN101047573A - 通信设备故障检测系统及通信设备故障检测方法 - Google Patents

通信设备故障检测系统及通信设备故障检测方法 Download PDF

Info

Publication number
CN101047573A
CN101047573A CN 200610090434 CN200610090434A CN101047573A CN 101047573 A CN101047573 A CN 101047573A CN 200610090434 CN200610090434 CN 200610090434 CN 200610090434 A CN200610090434 A CN 200610090434A CN 101047573 A CN101047573 A CN 101047573A
Authority
CN
China
Prior art keywords
perceptive object
execution
perceptive
state
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200610090434
Other languages
English (en)
Other versions
CN100499522C (zh
Inventor
金雪锋
宋志新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CNB2006100904340A priority Critical patent/CN100499522C/zh
Publication of CN101047573A publication Critical patent/CN101047573A/zh
Application granted granted Critical
Publication of CN100499522C publication Critical patent/CN100499522C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种通信设备故障检测系统,包括至少一个感知对象,分别与感知对象连接的至少一个感知部件,与感知部件连接的统一的故障检测装置;故障检测装置包括对象信息处理模块,以及与感知部件和对象信息处理模块连接的对象故障处理模块。本发明还公开了一种通信设备故障检测方法,包括调用预先存储的感知对象的属性信息,确定感知对象所属类型;确定感知对象的故障情况,产生对应的故障事件。通过本发明的系统和方法,避免了重复开发故障检测装置,降低了开发和维护的成本;有利于提高系统的稳定性;实现了故障检测装置在不同通信设备的移植重用。

Description

通信设备故障检测系统及通信设备故障检测方法
技术领域
本发明属于设备维护领域,特别是一种通信设备故障检测系统及一种通信设备故障检测方法。
背景技术
由于网络中通信设备的宕机将导致局部甚至是整个网络的瘫痪,因此,对通信设备的可用性要求一般都比较高;尤其是对于网络中核心的通信设备,通常要求提供5个9的(99.999%)可用性,即一年内允许宕机的时间不能超过5分钟。
要保证如此高的可用性,其前提是构建完善的故障检测系统和故障检测方法,即如果设备有故障,必须能够尽快检测出来;检测到故障后,必须做到尽快定位故障;定位到故障后,必须实现尽快修复故障。只有这样,才有可能满足对通信设备可用性的要求。
现有的通信设备故障检测系统主要由感知对象、感知部件以及故障检测模块三部分组成,如图1所示,包括感知对象1、2和3,分别与之相连的感知部件1、2和3,以及部件1、2和3各自的故障检测模块。感知对象主要指需要被检测的目标,如:温度、电压、风扇等;感知部件的作用主要是采集这些感知对象的状态;故障检测模块主要协调各部分的工作,包括读取感知部件的值、对感知部件获取的信息进行必要的处理、控制感知部件等。图2所示,为一个实际的故障检测系统示意图。
现有的通信设备故障检测方法的流程如下:故障检测模块定时(定时时间可以根据具体的感知对象而定)地通过感知部件去获取感知对象的值,然后通过获取的感知对象的值判断感知对象是否故障,如果故障了,就发送告警事件。其中,主要采用一级门限判断法来判断感知对象是否故障,具体步骤为:通过感知部件获取感知对象的值;将获取的感知对象的值与预先设置的门限值进行比较(该门限值以后可以修改,另外门限可以分为上门限和下门限),如果感知对象的值大于上门限或者小于下门限,则认为感知对象的状态故障;否者就认为感知对象的状态正常;判断上次检测的状态是否与当前检测的状态一致,如果不一致则产生状态改变事件从而改变当前状态,否则,不改变当前状态。
总的来说,现有的通信设备故障检测系统及故障检测方法具有以下缺陷:
1、针对不同的感知对象,使用不同的故障检测模块进行检测;其缺陷为:
故障检测功能分散于各个故障检测模块之上,所以需要针对不同的感知对象编写相应的故障检测程序,导致大量的重复工作,开发整套测试软件的成本居高不下;
针对每一感知对象编写故障检测程序,各程序所提供的对外接口难于统一,妨碍了不同程序的移植和共享;
由于故障检测程序的实现各异,导致了后期软件的维护成本的增加;同时存在系统的兼容性问题,不利于故障检测系统的稳定;
2、检测软件中需要固化通信设备中感知对象的属性描述;其缺陷为:
由于检测软件针对通信设备设计,因此在检测软件中同时固化了感知对象的属性,导致了故障检测系统的局限性极强,仅仅能够对设计之初通信设备的感知对象进行检测,在不同的通信设备间不能重用;
3、采用一级门限判断法,其缺陷为:
一级门限判断法只能判断感知对象的状态是处于故障态还是正常态,而无法区分实际上故障态的严重程度(比如致命/严重/轻微等),更无法根据不同严重程度进行相应的故障处理;
一级门限判断法是根据获取的数值立即判断感知对象的状态,但是由于感知对象的原因,比如一些线路的状态,就需要有一个统计周期,在一个统计周期内,如果检测到故障的次数符合要求,才认为线路的状态故障;因此,传统的一级门限判断法很可能带来误判。
综上所述,现有的通信设备故障检测系统和通信设备检测方法难以满足可移植性、稳定性以及准确性的要求,同时还存在着开发、维护成本高,精度不足的缺陷。
发明内容
本发明的目的是为克服上述现有技术中的缺陷,提供一种通信设备故障检测系统和一种同心设备故障检测方法,通过对不同的感知对象使用统一的故障检测装置,从而避免重复开发,降低开发和维护成本,提高系统稳定性。
为实现上述目的,本发明提供了一种通信设备故障检测系统,包括至少一个感知对象和分别与所述感知对象连接的至少一个感知部件,还包括与所述至少一个感知部件连接的统一的故障检测装置;所述故障检测装置包括:
对象信息处理模块,用于获取感知对象属性信息;
对象故障处理模块,与所述感知部件连接,用于通过所述感知部件获取感知对象的状态状态;与所述对象信息处理模块连接,用于调用感知对象属性信息确定感知对象所属类型;从而根据所述感知对象所属类型和状态信息,确定所述感知对象的故障情况,产生故障事件。
较佳技术方案是:所述对象信息处理模块中还设有配置文件模块,用于预先存储各感知对象属性信息的配置文件。
所述配置文件用于描述所述感知对象的模式信息和参数信息,至少包括:感知对象名称、感知对象类型、感知对象类型标识、感知对象标识ID、感知对象的门限值、感知对象的使能标记、感知对象的物理位置以及感知对象的数据类型。
所述至少一个感知对象为周期统计型感知对象、连续统计型感知对象、多级门限型感知对象、离散型感知对象、水印型感知对象以及计数器型感知对象之一或任意组合。
本发明还提供了一种通信设备故障检测方法,包括以下步骤:
步骤1、调用预先存储的感知对象的属性信息,并根据所述属性信息确定所述感知对象所属类型;
步骤2、根据调用的感知对象的所属类型和状态信息,确定所述感知对象的故障情况,并根据所述故障情况,产生对应的故障事件。
其中,步骤1之前还包括:所述感知对象的属性信息保存在配置文件中。
进一步的,所述感知对象的属性信息是按照XML的格式保存在配置文件中。
当所述步骤1中确定感知对象类型为周期统计型感知对象时,所述步骤2具体为:
步骤A1、当检测周期到达时,获取所述感知对象的当前状态,并累加统计计数器计数;
步骤A2、判断所述感知对象的统计状态,如果是故障态,则执行步骤A3,否则执行步骤A8;
步骤A3、判断所述感知对象的当前状态,是故障态,则执行步骤A4,否则执行步骤A5;
步骤A4、判断是否达到所述感知对象的统计周期,是则执行步骤A7,否则执行步骤A14;
步骤A5、累加状态计数器计数;
步骤A6、判断是否达到所述感知对象的统计周期,是则执行步骤A7,否则执行步骤A14;
步骤A7、判断所述状态计数器的计数是否大于或等于设定的恢复门限值,是则产生故障恢复事件,设置所述感知对象的统计状态为正常态,并执行步骤A13,否则直接执行步骤A13;
步骤A8、判断所述感知对象的当前状态,是正常态,则执行步骤A9,否则执行步骤A10;
步骤A9、判断是否达到所述感知对象的统计周期,是则执行步骤A12,否则执行步骤A14;
步骤A10、累加状态计数器计数;
步骤A11、判断是否达到所述感知对象的统计周期,是则执行步骤A12,否则执行步骤A14;
步骤A12、判断所述状态计数器的计数是否大于或等于设定的恢复门限值,是则产生故障事件,设置所述感知对象的统计状态为故障态,并执行步骤A13,否则直接执行步骤A13;
步骤A13、将状态计数器和统计计数器清零;
步骤A14、结束本次检测。
当所述步骤1中确定感知对象类型为连续统计型感知对象时,所述步骤2具体为:
步骤B1、当检测周期到达时,获取所述感知对象的当前状态;
步骤B2、判断所述感知对象的统计状态,如果是故障态,则执行步骤B3,否则执行步骤B6;
步骤B3、判断所述感知对象的当前状态,是故障态,则执行步骤B9,否则执行步骤B4;
步骤B4、累加状态计数器计数;
步骤B5、判断所述状态计数器的计数是否大于或等于设定的恢复门限值,是则产生故障恢复事件,设置所述感知对象的统计状态为正常态,并执行步骤B9,否则直接执行步骤B10;
步骤B6、判断所述感知对象的当前状态,是正常态,则执行步骤B9,否则执行步骤B7;
步骤B7、累加状态计数器计数;
步骤B8、判断所述状态计数器的计数是否大于或等于设定的恢复门限值,是则产生故障事件,设置所述感知对象的统计状态为故障态,并执行步骤B9;否则直接执行步骤B10;
步骤B9、将状态计数器清零;
步骤B10、结束本次检测。
当所述步骤1中确定感知对象类型为多级门限型感知对象时,所述步骤2具体为:
步骤C1、当检测周期到达时,获取所述感知对象的当前状态以及感知数值;
步骤C2、将所述感知数值与所述感知对象的属性信息中预设的各级门限值比较,获得本次检测的感知对象状态;
步骤C3、如果本次检测的感知对象状态与当前状态一致,则直接执行步骤C5;否则执行步骤C4;
步骤C4、将所述感知对象的状态设置为对应级别;
步骤C5、结束本次检测。
当所述步骤1中确定感知对象类行为离散型感知对象时,所述步骤2具体为:
步骤D1、当检测周期到达时,获取所述感知对象的感知数值;
步骤D2、将所述感知数值与所述感知对象的属性信息中预设的数值比较,如果一致,则执行步骤D4;否则执行步骤D3;
步骤D3、将所述感知数值设置为所述感知对象的当前数值,并产生状态迁移事件,执行步骤D4;
步骤D4、结束本次检测。
当所述步骤1中分析感知对象为水印型感知对象时,所述步骤2具体为:
步骤E1、当检测周期到达时,获取所述感知对象的感知数值;
步骤E2、将所述感知数值与所述感知对象的属性信息中预设的数值比较,如果大于预设的最大值,则执行步骤E3;如果小于预设的最小值,则执行步骤E4;否则执行步骤E5;
步骤E3、记录日志,并将所述预设的最大值设置为所述感知对象的数值,执行步骤E5;
步骤E4、记录日志,并将所述预设的最小值设置为所述感知对象的数值,执行步骤E5;
步骤E5、结束本次检测。
当所述步骤1中确定感知对象类型为计数器型感知对象时,所述步骤2具体为:
步骤F1、当检测周期到达时,获取所述感知对象的感知数值;
步骤F2、将所述感知数值累加到上一次检测的感知数值并保存;
步骤F3、结束本次检测。
由上述技术方案可知,本发明通过对感知对象统一建立属性信息,采用统一的故障检测装置对不同感知对象加以检测,具有以下有益效果:
1、避免针对不同的感知对象重复开发相应的故障检测装置,降低了开发和维护的成本;
2、采用统一的故障检测装置,有利于提高系统的稳定性;
3、实现了故障检测装置在不同通信设备的移植重用。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为现有技术中通信设备故障检测系统的示意图;
图2为现有技术中一个实际的故障检测系统的示意图;
图3为本发明所提供通信设备故障检测系统的实施例1的框图;
图4为本发明所提供通信设备故障检测系统的实施例2的框图;
图5为本发明所提供通信设备故障检测方法的流程图;
图6为图5所示方法的实施例1的流程图;
图7为图5所示方法的实施例2的流程图;
图8为图5所示方法的实施例3的流程图;
图9为图5所示方法的实施例4的流程图;
图10为图5所示方法的实施例5的流程图;
图11为图5所示方法的实施例6的流程图。
具体实施方式
本发明所提供的通信设备故障检测系统,通过对感知对象统一建立属性信息,划分所属类型,实现使用统一的故障检测装置对通信设备进行故障检测处理。
本发明中,进行属性信息建立的感知对象,可以为按照风扇、温度、电压等进行划分的感知对象,但这样划分需要明确通信设备具体的硬件构成,即使完成属性信息建立,也不利于故障检测系统的系统间移植;因此,本发明中所采用的感知对象,是按照需要监视和检测的感知对象的状态进行划分的,分为周期统计型感知对象、连续统计型感知对象、多级门限型感知对象、离散型感知对象、水印型感知对象以及计数器型感知对象。
其中,周期统计型感知对象,是指在一定的统计周期内,感知对象的状态发生改变的次数超过设定的次数,则认为感知对象的状态真正发生改变。感知对象的状态发生改变包括两种情况,一种是感知对象的状态从正常态变为故障态,另一种是从故障态恢复到正常态。举个例子:有一种光信号,它的统计周期为1s(秒),在统计周期内检测光信号10次,如果10次检测中,发现有7次光信号不正常,则可以认为光信号出现故障;同理,在光信号为故障态的情况下,如果10次检测中,发现有6次正常,则可以认为光信号从故障态恢复到正常态。
连续统计型感知对象,是指感知对象的状态在检测过程中,连续发生改变的次数超过设定的次数,则认为感知对象的状态发生改变。例如,一种时钟锁相状态,如果在检测过程中,连续检测到5次状态异常,就可以认为时钟锁相异常;同理,如果连续检测到6次状态正常,则可以认为时针锁相的状态恢复到正常态。
多级门限型感知对象,是指将感知对象的门限分为多级,包括高致命、高严重、高轻微、正常、低致命、低严重、低轻微共7中状态。例如单板的温度,它的高致命门限是90度,高严重门限是70度,高轻微门限是60度,低轻微门限是20度,低严重门限是0度,低致命门限是0下5度,正常是在60~20之间。
离散型感知对象,是指感知对象的状态可以用一组数字表示,感知状态的变迁代表知对象的状态迁移。例如单板的主备硬件状态包括主状态和备状态,单板的指示灯状态包括红绿蓝黄等。尽管在实质上,这种状态迁移并不是故障情况,但作为故障情况的参考信息,往往也需要在故障检测时进行检测。
水印型感知对象,是指需要记录最大值和最小值的感知对象,例如单板的CPU占有率。
计数器型感知对象,是指需要记录累计数值和状态的感知对象,例如网络端口的收发包数。
显然,按照上述分类统一进行属性信息建立,则每一分类对应的类型信息可预先建立,而不依赖于具体的通信设备的硬件构成;类型信息建立完成后,再记录各感知部件的具体参数。属性信息建立后,只需在配置文件中记录实际感知部件与某一属性信息的关联,就可以在实际检测过程中调用该属性信息,根据配置文件中的具体参数加以处理。
例如,当需要检测CPU的时候,可以按照连续统计型模式检测CPU温度,也可以按照周期统计型模式检测CPU拥塞情况。其中,连续统计型模式、周期统计型模式是类型信息,而CPU温度、CPU拥塞则具有分别的参数。
本领域技术人员应当理解,虽然本发明列举了上述感知对象,但仅为说明本发明之用,即感知对象的建模种类并不仅仅局限于上述六种,而可根据实际检测中的需要进行设定。
实施例1:
如图3所示,包括感知对象1,分别与感知对象1连接的感知部件2,与感知部件2连接的统一的故障检测装置3。
该故障检测装置3用来取代现有技术中的故障检测模块,包括:
对象信息处理模块31,具有对感知对象1信息的分类处理功能,具体的,该对象信息处理模块31能够提取感知对象1的属性信息。
该对象信息处理模块31能够在故障检测装置初始化时获取属性信息,也能够在故障检测系统检测过程中获取属性信息。
在本实施例中,该对象信息处理模块31中设有一配置文件模块(图中未示),用于预先存储各感知对象属性信息的配置文件。即在本实施例中,感知对象1的属性信息,包括类型信息和参数设定,分别被预先设置在配置文件中,并保存在对象信息处理模块31中,当故障检测装置3初始化或故障检测系统运行时,对象信息处理模块31就从配置文件中提取出相关联的信息。例如,CPU电压与单板电压,都会关联到周期统计型感知对象加以处理。
具体的,本实施例中配置文件存储的属性信息包括:类型信息如感知对象名称、感知对象类型、感知对象类型标识;参数设定包括感知对象标识ID、感知对象的门限值、感知对象的使能标记、感知对象的物理位置以及感知对象的数据类型。配置文件的格式可以使用XML进行描述,或以文本的形式。在通信设备检测之先将全部待测项信息设定在配置文件中,就可以根据不同的模式进行统一处理。
对象故障处理模块32,与感知部件2连接,用于通过感知部件2获取感知对象1的状态信息;与对象信息处理模块31连接,用于调用感知对象属性信息从而确定感知对象所属类型;还用于根据感知对象所属类型和状态信息确定感知对象1故障情况,即其状态是否发生改变,包括故障态与正常态之间的切换,离散状态的切换等。如果感知对象1的状态发生改变,就产生故障事件,例如,当感知对象1从故障态切换到正常态时,产生故障恢复事件。
由于对象故障处理模块32负责故障事件的产生,因此其中设有计数器、计时器等本领域在进行设备故障检测时常用的模块(图中未示)。
同时,感知对象1为周期统计型感知对象、连续统计型感知对象、多级门限型感知对象、离散型感知对象、水印型感知对象以及计数器型感知对象之一或任意组合。例如,在本实施例中可分为CPU温度、CPU电压、单板电压、风扇等。感知部件2与感知对象1对应连接,用来感知CPU温度的变化,或者感知CPU电压的变化,或者感知风扇的变化,等等。
可以看出,通过本实施例的系统,无需针对不同的部件反复编辑开发故障检测装置,降低了开发和维护成本;同时,没有过多检测软件的存在运行,也有利于提高系统的稳定性。
实施例2:
参见图4,包括感知对象1,与感知对象1连接的感知部件2,与感知部件2连接的统一的故障检测装置3,与故障检测装置3连接的配置文件模块4。
其中,故障检测装置3包括对象信息处理模块31和对象故障处理模块32,配置文件模块4与对象状态信息处理模块31连接,用于预先存储感知对象属性信息的配置文件,所述配置文件用于描述感知对象类型信息和参数设定,包括感知对象名称、感知对象类型、感知对象类型标识、感知对象ID、感知对象的门限值、感知对象的使能标记、感知对象的物理位置以及感知对象的数据类型。配置文件的格式可以使用XML进行描述。
其中,配置文件模块4可以随时更新,只要在变更检测的通信设备之先将全部待测项信息更新,就可以根据不同的模式进行统一处理。
该配置文件模块4可以设置在网络配置服务器中,也可以设置在待测设备中,不受具体物理地址的限制,只要能够与对象信息处理模块31通信连接即可。
可见,采用本实施例所提供的系统,可以实现故障检测装置在不同通信设备的移植重用。
本发明还提供了一种通信设备故障检测方法,其流程图如图5所示,包括以下步骤:
步骤1、调用预先存储的感知对象的属性信息,并根据所述属性信息确定所述感知对象所属类型;
步骤3、根据调用的感知对象的所属类型和状态信息,确定所述感知对象的故障情况,并根据所述故障情况,产生对应的故障事件。
其中,步骤1之前还包括:保存感知对象的属性信息,并将所述感知对象的属性信息保存在配置文件中。
进一步的,可将所述感知对象的属性信息按照XML的格式保存在配置文件中。
实施例1:
在建立感知对象属性信息,并保存在配置文件中后,在故障检测过程中,调用配置文件获取感知对象属性信息,并根据感知对象的属性信息,确定该感知对象所属的类型为周期统计型感知对象。
作为周期统计型感知对象,具有以下技术参数作为判断故障态或者是正常态的依据:
检测周期:被测感知对象当前状态获取的时间间隔;
统计周期:被测感知对象统计状态判断的时间间隔,统计周期是检测周期的倍数,比如一个统计周期等于10个检测周期。
统计计数器:表明当前完成了多少个检测周期。
状态计数器:表明在已经进行的检测周期中,获得与感知对象统计状态不同的状态的计数。
产生门限:在一个统计周期内,检测到感知对象故障的次数如果等于或者大于此值,就认为感知对象的统计状态为故障。
恢复门限:在一个统计周期内,检测到感知对象的正常的次数如果等于或者大于此值,就设置感知对象的统计状态为正常。
当前状态:检测周期获取的感知对象的状态。
统计状态:统计周期内根据门限和状态计数器获得的感知对象的状态。
则确定感知对象为周期统计型感知对象后,处理流程如图6所示:
步骤A1、当检测周期到达时,获取所述感知对象的当前状态,并累加统计计数器计数;
步骤A2、判断所述感知对象的统计状态,如果是故障态,则执行步骤A3,否则执行步骤A8;
步骤A3、判断所述感知对象的当前状态,是故障态,则执行步骤A4,否则执行步骤A5;
步骤A4、判断是否达到所述感知对象的统计周期,是则执行步骤A7,否则执行步骤A14;
步骤A5、累加状态计数器计数;
步骤A6、判断是否达到所述感知对象的统计周期,是则执行步骤A7,否则执行步骤A14;
步骤A7、判断所述状态计数器的计数是否大于或等于设定的恢复门限值,是则产生故障恢复事件,设置所述感知对象的统计状态为正常态,并执行步骤A13,否则直接执行步骤A13;
步骤A8、判断所述感知对象的当前状态,是正常态,则执行步骤A9,否则执行步骤A10;
步骤A9、判断是否达到所述感知对象的统计周期,是则执行步骤A12,否则执行步骤A14;
步骤A10、累加状态计数器计数;
步骤A11、判断是否达到所述感知对象的统计周期,是则执行步骤A12,否则执行步骤A14;
步骤A12、判断所述状态计数器的计数是否大于或等于设定的恢复门限值,是则产生故障事件,设置所述感知对象的统计状态为故障态,并执行步骤A13,否则直接执行步骤A13;
步骤A13、将状态计数器和统计计数器清零;
步骤A14、结束本次检测。
在本实施例中,属性信息也可以不保存在特定的配置文件中,而是以数据库等信息加以存储关联。但配置文件的模式,更加有利于移植和维护。
实施例2:
在建立感知对象属性信息,并保存在配置文件中后,在故障检测过程中,调用配置文件获取感知对象属性信息,并根据感知对象的属性信息,确定该感知对象所属的类型为连续统计型感知对象。
作为连续统计型感知对象,具有以下技术参数作为判断故障态或者是正常态的依据:
状态计数器:表明在已经进行的检测周期中,获得与感知对象统计状态不同的状态的计数。
产生门限:连续检测到感知对象故障的次数如果等于或者大于此值,就设置感知对象的统计状态为故障。
恢复门限:连续检测到感知对象的正常的次数如果等于或者大于此值,就设置感知对象的统计状态为正常。
则确定感知对象为连续统计型感知对象后,处理流程如图7所示:
步骤B1、当检测周期到达时,获取所述感知对象的当前状态;
步骤B2、判断所述感知对象的统计状态,如果是故障态,则执行步骤B3,否则执行步骤B6;
步骤B3、判断所述感知对象的当前状态,是故障态,则执行步骤B9,否则执行步骤B4;
步骤B4、累加状态计数器计数;
步骤B5、判断所述状态计数器的计数是否大于或等于设定的恢复门限值,是则产生故障恢复事件,设置所述感知对象的统计状态为正常态,并执行步骤B9,否则直接执行步骤B10;
步骤B6、判断所述感知对象的当前状态,是正常态,则执行步骤B9,否则执行步骤B7;
步骤B7、累加状态计数器计数;
步骤B8、判断所述状态计数器的计数是否大于或等于设定的恢复门限值,是则产生故障事件,设置所述感知对象的统计状态为故障态,并执行步骤B9;否则直接执行步骤B10;
步骤B9、将状态计数器清零;
步骤B10、结束本次检测。
实施例3:
在建立感知对象属性信息,并保存在配置文件中后,在故障检测过程中,调用配置文件获取感知对象属性信息,并根据感知对象的属性信息,确定该感知对象所属的类型为多级门限型感知对象。
对于多级门限型感知对象,本实施例将感知对象的状态划分为:高致命故障态,高严重态,高轻微态,正常态,低轻微故障态,低严重故障态,以及低致命故障态。
则确定感知对象为多级门限型感知对象后,处理流程如图8所示:
步骤C1、当检测周期到达时,获取所述感知对象的当前状态以及感知数值;以当前状态为高致命故障态为例;
步骤C2、将所述感知数值与所述感知对象的属性信息中预设的各级门限值比较,获得本次检测的感知对象状态;
步骤C3、如果本次检测的感知对象状态与当前状态一致,即感知对象的值还是高于或者等于高致命产生门限,则直接执行步骤C5;否则执行步骤C4;
步骤C4、将所述感知对象的状态设置为对应级别,具体为:如果感知对象的值低于或者等于高致命的恢复门限,并高于或者等于高严重的产生门限,则将感知对象的状态设置为高严重的故障态,并产生高致命故障恢复事件和高严重故障产生事件;如果感知对象的值低于高严重产生门限,并且高于或者等于高轻微产生门限,则将感知对象的状态设置为高轻微的故障态,并产生高致命故障恢复事件和高轻微故障产生事件;如果感知对象的值低于高轻微产生门限,并且高于或者等于低轻微产生门限,则将感知对象的状态设置正常态,并产生高致命故障恢复事件;如果感知对象的值高于低严重产生门限,并且低于或者等于低轻微产生门限,则将感知对象的状态设置为低轻微的故障态,并产生高致命故障恢复事件和低轻微故障产生事件;如果感知对象的值高于低致命的产生门限,并且低于或者等于低严重产生门限,则将感知对象的状态设置为低严重的故障态,并产生高致命故障恢复事件和低严重故障产生事件;如果感知对象的值低于或者等于低致命产生门限,则将感知对象的状态设置为低致命的故障态,并产生高致命故障恢复事件和低致命故障产生事件;
步骤C5、结束本次检测。
本实施例中,虽然以高致命故障态为例进行说明,但显然,高严重态,高轻微态,正常态,低轻微故障态,低严重故障态,以及低致命故障态的处理过程相同。
实施例4:
在建立感知对象属性信息,并保存在配置文件中后,在故障检测过程中,调用配置文件获取感知对象属性信息,并根据感知对象的属性信息,确定该感知对象所属的类型为离散型感知对象。
其后的处理流程如图9所示:
步骤D1、当检测周期到达时,获取所述感知对象的感知数值;
步骤D2、将所述感知数值与所述感知对象的属性信息中预设的数值比较,如果一致,则执行步骤D4;否则执行步骤D3;
步骤D3、将所述感知数值设置为所述感知对象的当前数值,并产生状态迁移事件,执行步骤D4;
步骤D4、结束本次检测。
实施例5:
在建立感知对象属性信息,并保存在配置文件中后,在故障检测过程中,调用配置文件获取感知对象属性信息,并根据感知对象的属性信息,确定该感知对象所属的类型为水印型感知对象。
水印型感知对象具有两个重要的属性:最大值和最小值。
则确定水印型感知对象之后,处理流程如图10所示:
步骤E1、当检测周期到达时,获取所述感知对象的感知数值;
步骤E2、将所述感知数值与所述感知对象的属性信息中预设的数值比较,如果大于预设的最大值,则执行步骤E3;如果小于预设的最小值,则执行步骤E4;否则执行步骤E5;
步骤E3、记录日志,并将所述预设的最大值设置为所述感知对象的数值,执行步骤E5;
步骤E4、记录日志,并将所述预设的最小值设置为所述感知对象的数值,执行步骤E5;
步骤E5、结束本次检测。
实施例6:
在建立感知对象属性信息,并保存在配置文件中后,在故障检测过程中,调用配置文件获取感知对象属性信息,并根据感知对象的属性信息,确定该感知对象所属的类型为计数器型感知对象。
其后的处理流程如图11所示:
步骤F1、当检测周期到达时,获取所述感知对象的感知数值;
步骤F2、将所述感知数值累加到上一次检测的感知数值并保存;
步骤F3、结束本次检测。
上述6个实施例,分别从不同的感知对象类型的角度,对感知对象检测流程进行了说明,丰富了故障检测的方法,解决了传统故障检测方法的局限性,比如多级门限型感知对象检测方法优化了传统的一级门限的检测方法,周期统计型和连续统计型感知对象检测方法解决了感知对象状态不稳定的情况。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围。

Claims (13)

1、一种通信设备故障检测系统,包括至少一个感知对象和分别与所述感知对象连接的至少一个感知部件,其特征在于,还包括与所述至少一个感知部件连接的统一的故障检测装置;所述故障检测装置包括:
对象信息处理模块,用于获取感知对象属性信息;
对象故障处理模块,与所述感知部件连接,用于通过所述感知部件获取感知对象的状态信息;与所述对象信息处理模块连接,用于调用感知对象属性信息确定感知对象所属类型;从而根据所述感知对象所属类型和状态信息,确定所述感知对象的故障情况,产生故障事件。
2、根据权利要求1所述的系统,其特征在于所述对象信息处理模块中还设有配置文件模块,用于预先存储各感知对象属性信息的配置文件。
3、根据权利要求2所述的系统,其特征在于所述配置文件用于描述所述感知对象的属性信息,至少包括:感知对象名称、感知对象类型、感知对象类型标识、感知对象标识ID、感知对象的门限值、感知对象的使能标记、感知对象的物理位置以及感知对象的数据类型。
4、根据权利要求1至3中任一项所述的系统,其特征在于所述至少一个感知对象为周期统计型感知对象、连续统计型感知对象、多级门限型感知对象、离散型感知对象、水印型感知对象以及计数器型感知对象之一或任意组合。
5、一种通信设备故障检测方法,其特征在于包括以下步骤:
步骤1、调用预先存储的感知对象的属性信息,并根据所述属性信息确定所述感知对象所属类型;
步骤2、根据调用的感知对象的所属类型和状态信息,确定所述感知对象的故障情况,并根据所述故障情况,产生对应的故障事件。
6、根据权利要求5所述的方法,其特征在于所述步骤1之前还包括:所述感知对象的属性信息保存在配置文件中。
7、根据权利要求6所述的方法,其特征在于所述感知对象的属性信息是按照XML的格式保存在配置文件中。
8、根据权利要求5至7中任一项所述的方法,其特征在于当所述步骤1中确定感知对象类型为周期统计型感知对象时,所述步骤2具体为:
步骤A1、当检测周期到达时,获取所述感知对象的当前状态,并累加统计计数器计数;
步骤A2、判断所述感知对象的统计状态,如果是故障态,则执行步骤A3,否则执行步骤A8;
步骤A3、判断所述感知对象的当前状态,是故障态,则执行步骤A4,否则执行步骤A5;
步骤A4、判断是否达到所述感知对象的统计周期,是则执行步骤A7,否则执行步骤A14;
步骤A5、累加状态计数器计数;
步骤A6、判断是否达到所述感知对象的统计周期,是则执行步骤A7,否则执行步骤A14;
步骤A7、判断所述状态计数器的计数是否大于或等于设定的恢复门限值,是则产生故障恢复事件,设置所述感知对象的统计状态为正常态,并执行步骤A13,否则直接执行步骤A13;
步骤A8、判断所述感知对象的当前状态,是正常态,则执行步骤A9,否则执行步骤A10;
步骤A9、判断是否达到所述感知对象的统计周期,是则执行步骤A12,否则执行步骤A14;
步骤A10、累加状态计数器计数;
步骤A11、判断是否达到所述感知对象的统计周期,是则执行步骤A12,否则执行步骤A14;
步骤A12、判断所述状态计数器的计数是否大于或等于设定的恢复门限值,是则产生故障事件,设置所述感知对象的统计状态为故障态,并执行步骤A13,否则直接执行步骤A13;
步骤A13、将状态计数器和统计计数器清零;
步骤A14、结束本次检测。
9、根据权利要求5至7中任一项所述的方法,其特征在于当所述步骤1中确定感知对象类型为连续统计型感知对象时,所述步骤2具体为:
步骤B1、当检测周期到达时,获取所述感知对象的当前状态;
步骤B2、判断所述感知对象的统计状态,如果是故障态,则执行步骤B3,否则执行步骤B6;
步骤B3、判断所述感知对象的当前状态,是故障态,则执行步骤B9,否则执行步骤B4;
步骤B4、累加状态计数器计数;
步骤B5、判断所述状态计数器的计数是否大于或等于设定的恢复门限值,是则产生故障恢复事件,设置所述感知对象的统计状态为正常态,并执行步骤B9,否则直接执行步骤B10;
步骤B6、判断所述感知对象的当前状态,是正常态,则执行步骤B9,否则执行步骤B7;
步骤B7、累加状态计数器计数;
步骤B8、判断所述状态计数器的计数是否大于或等于设定的恢复门限值,是则产生故障事件,设置所述感知对象的统计状态为故障态,并执行步骤B9,否则直接执行步骤B10;
步骤B9、将状态计数器清零;
步骤B10、结束本次检测。
10、根据权利要求5至7中任一项所述的方法,其特征在于当所述步骤1中确定感知对象类型为多级门限型感知对象时,所述步骤2具体为:
步骤C1、当检测周期到达时,获取所述感知对象的当前状态以及感知数值;
步骤C2、将所述感知数值与所述感知对象的属性信息中预设的各级门限值比较,获得本次检测的感知对象状态;
步骤C3、如果本次检测的感知对象状态与当前状态一致,则直接执行步骤C5;否则执行步骤C4;
步骤C4、将所述感知对象的状态设置为对应级别;
步骤C5、结束本次检测。
11、根据权利要求5至7中任一项所述的方法,其特征在于当所述步骤1中确定感知对象类型为离散型感知对象时,所述步骤2具体为:
步骤D1、当检测周期到达时,获取所述感知对象的感知数值;
步骤D2、将所述感知数值与所述感知对象的属性信息中预设的数值比较,如果一致,则执行步骤D4;否则执行步骤D3;
步骤D3、将所述感知数值设置为所述感知对象的当前数值,并产生状态迁移事件,执行步骤D4;
步骤D4、结束本次检测。
12、根据权利要求5至7中任一项所述的方法,其特征在于当所述步骤1中确定感知对象为水印型感知对象时,所述步骤2具体为:
步骤E1、当检测周期到达时,获取所述感知对象的感知数值;
步骤E2、将所述感知数值与所述感知对象的属性信息中预设的数值比较,如果大于预设的最大值,则执行步骤E3;如果小于预设的最小值,则执行步骤E4;否则执行步骤E5;
步骤E3、记录日志,并将所述预设的最大值设置为所述感知对象的数值,执行步骤E5;
步骤E4、记录日志,并将所述预设的最小值设置为所述感知对象的数值,执行步骤E5;
步骤E5、结束本次检测。
13、根据权利要求5至7中任一项所述的方法,其特征在于当所述步骤1中确定感知对象为计数器型感知对象时,所述步骤2具体为:
步骤F1、当检测周期到达时,获取所述感知对象的感知数值;
步骤F2、将所述感知数值累加到上一次检测的感知数值并保存;
步骤F3、结束本次检测。
CNB2006100904340A 2006-06-27 2006-06-27 通信设备故障检测系统及通信设备故障检测方法 Expired - Fee Related CN100499522C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2006100904340A CN100499522C (zh) 2006-06-27 2006-06-27 通信设备故障检测系统及通信设备故障检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006100904340A CN100499522C (zh) 2006-06-27 2006-06-27 通信设备故障检测系统及通信设备故障检测方法

Publications (2)

Publication Number Publication Date
CN101047573A true CN101047573A (zh) 2007-10-03
CN100499522C CN100499522C (zh) 2009-06-10

Family

ID=38771819

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006100904340A Expired - Fee Related CN100499522C (zh) 2006-06-27 2006-06-27 通信设备故障检测系统及通信设备故障检测方法

Country Status (1)

Country Link
CN (1) CN100499522C (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101488889B (zh) * 2008-01-17 2011-04-20 中兴通讯股份有限公司 一种网管系统工程故障的检测修复方法
CN101316139B (zh) * 2008-07-14 2011-08-10 中兴通讯股份有限公司 一种光传输设备的状态检测方法和装置
CN104144072A (zh) * 2013-05-10 2014-11-12 中兴通讯股份有限公司 分组传送网故障诊断方法及系统
CN106604316A (zh) * 2017-01-03 2017-04-26 张毅昆 无线接入设备故障定位方法、装置以及系统
CN108226662A (zh) * 2016-12-14 2018-06-29 中国航空工业集团公司西安航空计算技术研究所 一种机载计算机故障预测方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101488889B (zh) * 2008-01-17 2011-04-20 中兴通讯股份有限公司 一种网管系统工程故障的检测修复方法
CN101316139B (zh) * 2008-07-14 2011-08-10 中兴通讯股份有限公司 一种光传输设备的状态检测方法和装置
CN104144072A (zh) * 2013-05-10 2014-11-12 中兴通讯股份有限公司 分组传送网故障诊断方法及系统
CN108226662A (zh) * 2016-12-14 2018-06-29 中国航空工业集团公司西安航空计算技术研究所 一种机载计算机故障预测方法
CN106604316A (zh) * 2017-01-03 2017-04-26 张毅昆 无线接入设备故障定位方法、装置以及系统

Also Published As

Publication number Publication date
CN100499522C (zh) 2009-06-10

Similar Documents

Publication Publication Date Title
CN1199235C (zh) 半导体装置制造中瑕疵聚集的检索方法及装置
CN1252618C (zh) 故障预测系统和方法及设备、打印机和管理服务器
CN1924734A (zh) 一种在线质量检测的控制方法
CN1279778C (zh) 服务器装置、移动通信终端、信息发送系统以及信息发送方法
CN1945476A (zh) 生产管理装置、生产管理方法以及生产管理系统
CN1656599A (zh) 用于监视工具性能的方法和设备
CN1384538A (zh) 半导体集成电路的不良检测方法和不良检测装置
CN101047573A (zh) 通信设备故障检测系统及通信设备故障检测方法
CN1666203A (zh) 用于自动的传感器安装的方法和设备
CN1874418A (zh) 图像处理设备、图像处理方法以及图像处理程序
CN1682165A (zh) 用于监视和控制半导体生产过程的方法和装置
CN1488933A (zh) 良否判定装置、判定程序、方法以及多变量统计解析装置
CN1655325A (zh) 工序和质量关系的模型生成装置及模型生成方法
CN1690971A (zh) 中断控制装置
CN1940994A (zh) 缺陷检测装置、图像传感器器件、图像传感器模块
CN101035027A (zh) 网管接口信息交互方法、装置及通知上报方法
CN1771475A (zh) 窗口堆栈控制方法、窗口管理程序及窗口管理装置
CN1906583A (zh) 信息处理设备、中断处理控制方法、以及计算机程序
CN1920825A (zh) 在流设计工具中显示性能约束的方法和系统
CN101030251A (zh) 信息处理装置、信息处理方法及计算机可读介质
CN1573742A (zh) 图像检索系统、程序和方法及图像分类系统、程序和方法
CN101069181A (zh) 存储设备和记录介质
CN1678021A (zh) 图像处理设备和方法、记录媒体和程序
CN1703657A (zh) 在多事件同时发生期间确定竞争性原因事件的概率和/或系统有效性的方法
CN1747648A (zh) 部件安装质量分析方法和部件安装质量分析装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090610

Termination date: 20160627

CF01 Termination of patent right due to non-payment of annual fee