CN104521181B - 故障处理方法、装置和系统 - Google Patents

故障处理方法、装置和系统 Download PDF

Info

Publication number
CN104521181B
CN104521181B CN201380003385.0A CN201380003385A CN104521181B CN 104521181 B CN104521181 B CN 104521181B CN 201380003385 A CN201380003385 A CN 201380003385A CN 104521181 B CN104521181 B CN 104521181B
Authority
CN
China
Prior art keywords
failure
fault
message
rise
management system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201380003385.0A
Other languages
English (en)
Other versions
CN104521181A (zh
Inventor
余明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN104521181A publication Critical patent/CN104521181A/zh
Application granted granted Critical
Publication of CN104521181B publication Critical patent/CN104521181B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/04Arrangements for maintaining operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/40Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W8/00Network data management
    • H04W8/30Network data restoration; Network data reliability; Network data fault tolerance

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Telephonic Communication Services (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明实施例提供了一种故障处理方法、装置和系统,涉及通信领域,所述方法包括:低层故障管理系统检测低层业务中的故障告警情况;低层故障管理系统根据故障告警情况和系统存储的业务依赖关系表查询得到受影响的高层业务;低层故障管理系统向受影响的高层业务所对应的高层故障管理系统发送故障通知消息;高层故障管理系统根据故障通知消息确定发生故障的高层业务是否需要处理。本发明达到了当低层业务发生故障时,高层故障管理系统可以根据故障通知消息对发生故障的高层业务确定发生故障的高层业务是否需要处理,从而减少不必要的维护资源浪费的效果。

Description

故障处理方法、装置和系统
技术领域
本发明涉及通信领域,特别涉及一种故障处理方法、装置和系统。
背景技术
故障管理系统是移动通信系统中的重要组成部分之一,主要提供针对移动通信系统的故障定位和故障处理。
目前,不同的运营商往往运营不同的移动通信系统,一个具体的移动通信系统通常都是由单独的一个运营商来运营,所以故障管理系统也是基于一个运营商的架构设计的。具体来讲,移动通信系统通常包括有基础设施组成部分、传输组成部分和无线业务组成部分,由于这些组成部分都是由同一个运营商管理,所以故障管理系统也是同时应用于这些组成部分,不论是故障定位还是故障处理,均在该运营商内部完成。当故障管理系统定位到故障后,会产生相应的派工单发送到运营商的维护人员。
但是随着云计算技术的发展,同一个移动通信系统逐渐细分由多个运营商管理。也即,移动通信系统中的不同组成部分可以由不同运营商运营。此时,故障管理系统在检测到一个业务故障时,可能需要向不同运营商都发送故障告警,但实际故障原因可能仅出现在一个运营商所运营的组成部分,导致了其它运营商在故障维护过程对人力或者物力的浪费。
发明内容
为了解决在不同运营商同时运营同一个移动通信系统的场景下,现有的故障管理系统可能会导致一些运营商在故障维护过程对人力或者物力造成浪费的问题,本发明实施例提供了一种故障处理方法、装置和系统。所述技术方案如下:
第一方面,提供了一种故障处理方法,用于通信故障管理系统中的低层故障管理系统,所述通信故障管理系统包括至少一个低层故障管理系统和至少一个高层故障管理系统,所述方法包括:
检测低层业务中的故障告警情况;
根据所述故障告警情况和系统存储的业务依赖关系表查询得到受影响的高层业务;
向所述受影响的高层业务所对应的所述高层故障管理系统发送故障通知消息,以便所述高层故障管理系统接收所述低层故障管理系统发送的所述故障通知消息;根据所述故障通知消息确定发生故障的高层业务是否需要处理;
其中,所述业务依赖关系表是低层业务与依赖所述低层业务运行的高层业务之间的对应关系。
在第一方面的第一种可能的实施方式中,若所述故障告警情况为一个低层业务发生故障,则所述向所述受影响的高层业务所对应的所述高层故障管理系统发送故障通知消息,包括:
向所述受影响的高层业务所对应的所述高层故障管理系统发送故障产生消息,所述故障产生消息携带有高层受影响业务标识,所述高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务;以便所述高层故障管理系统接收并保存所述低层故障管理系统发送的所述故障产生消息;在保存所述故障产生消息的期间,检测所述故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障;若检测结果为发生故障,则暂不处理所述高层业务的故障。
结合第一方面的第一种可能的实施方式,在第二种可能的实施方式中,其特征在于,若所述故障告警情况为一个低层业务的故障已经恢复,则所述向所述受影响的高层业务所对应的所述高层故障管理系统发送故障通知消息,包括:
向所述受影响的高层业务所对应的所述高层故障管理系统发送故障恢复消息,所述故障恢复消息携带有高层受影响业务标识,所述高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务;以便所述高层故障管理系统接收所述低层故障管理系统发送的所述故障恢复消息;检测所述故障恢复消息携带的所述高层受影响业务标识所指示的高层业务的故障是否已经恢复;若检测结果为还未恢复,则处理所述高层业务的故障。
结合第一方面的第二种可能的实施方式,在第三种可能的实施方式中,所述故障产生消息和所述故障恢复消息都还携带有低层业务故障标识和故障类型,所述低层业务故障标识用于指示所述发生故障告警的低层业务;以便所述高层故障管理系统查找与所述故障恢复消息匹配的故障产生消息,所述匹配是指两个消息各自所包括的所述低层业务故障标识和所述故障类型均相同;在查找到与所述故障恢复消息匹配的故障产生消息时,删除所述故障产生消息。
第二方面,提供了一种故障处理方法,用于通信故障管理系统中的高层故障管理系统,所述通信故障管理系统包括至少一层低层故障管理系统和至少一层高层故障管理系统,所述方法包括:
接收所述低层故障管理系统发送的故障通知消息,所述故障通知消息是所述低层故障管理系统检测低层业务中的故障告警情况,根据所述故障告警情况和系统存储的业务依赖关系表查询得到受影响的高层业务,然后向所述受影响的高层业务所对应的所述高层故障管理系统发送的;
根据所述故障通知消息确定发生故障的高层业务是否需要处理;
其中,所述业务依赖关系表是低层业务与依赖所述低层业务运行的高层业务之间的对应关系。
在第二方面的第一种可能的实施方式中,所述接收所述低层故障管理系统发送的故障通知消息,包括:
接收并保存所述低层故障管理系统发送的故障产生消息,所述故障产生消息携带有高层受影响业务标识,所述高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务;
所述根据所述故障通知消息确定发生故障的高层业务是否需要处理,包括:
在保存所述故障产生消息的期间,检测所述故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障;
若检测结果为发生故障,则暂不处理所述高层业务的故障。
结合第二方面的第一种可能的实施方式,在第二种可能的实施方式中,所述在保存所述故障产生消息的期间,检测所述故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障,包括:
在接收到所述故障产生消息后,检测所述故障产生消息携带的所述高层受影响业务标识和当前保存的至少一个高层故障业务标识中的任意一个是否相同,所述高层故障业务标识用于指示发生了故障的高层业务;
若检测结果为接收到的所述高层受影响业务标识和当前保存的一个高层故障业务标识相同,则确定所述故障产生消息中携带的高层受影响业务标识所指示的高层业务发生故障。
结合第二方面的第一种可能的实施方式,在第三种可能的实施方式中,所述在保存所述故障产生消息的期间,检测所述故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障,包括:
在检测到一个高层业务发生故障后,获取对应的高层故障业务标识,所述高层故障业务标识用于指示发生了故障的高层业务;
检测获取到的所述高层故障业务标识和当前保存的至少一个所述高层受影响业务标识中的任意一个是否相同;
若检测结果为获取到的所述高层故障业务标识和当前保存的一个高层受影响业务标识相同,则确定相同的所述故障产生消息中携带的高层受影响业务标识所指示的高层业务发生故障。
结合第二方面的第三种可能的实施方式,在第四种可能的实施方式中,所述检测获取到的所述高层故障业务标识和预先保存的至少一个所述高层受影响业务标识中的任意一个是否相同之后,还包括:
若检测结果为获取到的所述高层故障业务标识和当前保存的所有高层受影响业务标识均不相同,则处理获取到的所述高层故障业务标识所指示的高层业务的故障。
结合第二方面的第一种、第二种、第三种和第四种可能的实施方式,在第五种可能的实施方式中,所述接收所述低层故障管理系统发送的故障通知消息,包括:
接收所述低层故障管理系统发送的故障恢复消息,所述故障恢复消息携带有所述高层受影响业务标识;
所述根据所述故障通知消息确定发生故障的高层业务是否需要处理,包括:
检测所述故障恢复消息携带的所述高层受影响业务标识所指示的高层业务的故障是否已经恢复;
若检测结果为还未恢复,则处理所述高层业务的故障。
结合第二方面的第五种可能的实施方式,在第六种可能的实施方式中,所述故障产生消息和所述故障恢复消息都还携带有低层业务故障标识和故障类型,所述低层业务故障标识用于指示所述发生故障告警的低层业务;
所述接收所述低层故障管理系统发送的故障恢复消息之后,还包括:
查找与所述故障恢复消息匹配的故障产生消息,所述匹配是指两个消息各自所包括的所述低层业务故障标识和所述故障类型均相同;
在查找到与所述故障恢复消息匹配的故障产生消息时,删除所述故障产生消息。
第三方面,提供了一种故障处理装置,用于通信故障管理系统中的低层故障管理系统,所述通信故障管理系统包括至少一个低层故障管理系统和至少一个高层故障管理系统,所述装置包括:
告警检测模块,用于检测低层业务中的故障告警情况;
关系查询模块,用于根据所述故障告警情况和系统存储的业务依赖关系表查询得到受影响的高层业务;
消息发送模块,用于向所述受影响的高层业务所对应的所述高层故障管理系统发送故障通知消息,以便所述高层故障管理系统接收所述低层故障管理系统发送的所述故障通知消息;根据所述故障通知消息确定发生故障的高层业务是否需要处理;
其中,所述业务依赖关系表是低层业务与依赖所述低层业务运行的高层业务之间的对应关系。
在第三方面的第一种可能的实施方式中,若所述故障告警情况为一个低层业务发生故障,则:
所述消息发送模块,用于向所述受影响的高层业务所对应的所述高层故障管理系统发送故障产生消息,所述故障产生消息携带有高层受影响业务标识,所述高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务;以便所述高层故障管理系统接收并保存所述低层故障管理系统发送的所述故障产生消息;在保存所述故障产生消息的期间,检测所述故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障;若检测结果为发生故障,则暂不处理所述高层业务的故障。
结合第三方面的第二种可能的实施方式,在第三种可能的实施方式中,若所述故障告警情况为一个低层业务的故障已经恢复,则:
所述消息发送模块,用于向所述受影响的高层业务所对应的所述高层故障管理系统发送故障恢复消息,所述故障恢复消息携带有高层受影响业务标识,所述高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务;以便所述高层故障管理系统接收所述低层故障管理系统发送的所述故障恢复消息;检测所述故障恢复消息携带的所述高层受影响业务标识所指示的高层业务的故障是否已经恢复;若检测结果为还未恢复,则处理所述高层业务的故障。
结合第三方面的第三种可能的实施方式,在第四种可能的实施方式中,所述故障产生消息和所述故障恢复消息都还携带有低层业务故障标识和故障类型,所述低层业务故障标识用于指示所述发生故障告警的低层业务;以便所述高层故障管理系统查找与所述故障恢复消息匹配的故障产生消息,所述匹配是指两个消息各自所包括的所述低层业务故障标识和所述故障类型均相同;在查找到与所述故障恢复消息匹配的故障产生消息时,删除所述故障产生消息。
第四方面,提供了一种故障处理装置,用于通信故障管理系统中的高层故障管理系统,所述通信故障管理系统包括至少一层低层故障管理系统和至少一层高层故障管理系统,所述装置包括:
消息接收模块,用于接收所述低层故障管理系统发送的故障通知消息,所述故障通知消息是所述低层故障管理系统检测低层业务中的故障告警情况,根据所述故障告警情况和系统存储的业务依赖关系表查询得到受影响的高层业务,然后向所述受影响的高层业务所对应的所述高层故障管理系统发送的;
故障处理模块,用于根据所述故障通知消息确定发生故障的高层业务是否需要处理;
其中,所述业务依赖关系表是低层业务与依赖所述低层业务运行的高层业务之间的对应关系。
在第四方面的第一种可能的实施方式中,所述消息接收模块,用于接收并保存所述低层故障管理系统发送的故障产生消息,所述故障产生消息携带有高层受影响业务标识,所述高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务;
所述故障处理模块,用于在保存所述故障产生消息的期间,检测所述故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障;若检测结果为发生故障,则暂不处理所述高层业务的故障。
结合第四方面的第一种可能的实施方式,在第二种可能的实施方式中,所述故障处理模块,包括:第一检测单元和第一确定单元;
所述第一检测单元,用于在接收到所述故障产生消息后,检测所述故障产生消息携带的所述高层受影响业务标识和当前保存的至少一个高层故障业务标识中的任意一个是否相同,所述高层故障业务标识用于指示发生了故障的高层业务;
所述第一确定单元,用于若检测结果为接收到的所述高层受影响业务标识和当前保存的一个高层故障业务标识相同,则确定所述故障产生消息中携带的高层受影响业务标识所指示的高层业务发生故障。
结合第四方面的第一种可能的实施方式,在第三种可能的实施方式中,所述故障处理模块,包括:标识获取单元、第二检测单元和第二确定单元;
所述标识获取单元,用于在检测到一个高层业务发生故障后,获取对应的高层故障业务标识,所述高层故障业务标识用于指示发生了故障的高层业务;
所述第二检测单元,用于检测获取到的所述高层故障业务标识和当前保存的至少一个所述高层受影响业务标识中的任意一个是否相同;
所述第二确定单元,用于若检测结果为获取到的所述高层故障业务标识和当前保存的一个高层受影响业务标识相同,则确定相同的所述故障产生消息中携带的高层受影响业务标识所指示的高层业务发生故障。
结合第四方面的第三种可能的实施方式,在第四种可能的实施方式中,所述故障处理模块,还包括:第三确定单元;
所述第三确定单元,用于若检测结果为获取到的所述高层故障业务标识和当前保存的所有高层受影响业务标识均不相同,则处理获取到的所述高层故障业务标识所指示的高层业务的故障。
结合第四方面的第一种、第二种、第三种和第四种可能的实施方式,在第五种可能的实施方式中,所述消息接收模块,还用于接收所述低层故障管理系统发送的故障恢复消息,所述故障恢复消息携带有所述高层受影响业务标识;
所述故障处理模块,还用于检测所述故障恢复消息携带的所述高层受影响业务标识所指示的高层业务的故障是否已经恢复;若检测结果为还未恢复,则处理所述高层业务的故障。
结合第四方面的第五种可能的实施方式,在第六种可能的实施方式中,所述故障产生消息和所述故障恢复消息都还携带有低层业务故障标识和故障类型,所述低层业务故障标识用于指示所述发生故障告警的低层业务;
所述装置,还包括:消息匹配模块和消息删除模块;
所述消息匹配模块,用于查找与所述故障恢复消息匹配的故障产生消息,所述匹配是指两个消息各自所包括的所述低层业务故障标识和所述故障类型均相同;
所述消息删除模块,用于在查找到与所述故障恢复消息匹配的故障产生消息时,删除所述故障产生消息。
第五方面,提供了一种通信故障管理系统,所述系统包括至少一个低层故障管理系统和至少一个高层故障管理系统;
所述低层故障管理系统包括如第三方面和第三方面的各种可能的实施方式中任一所述的故障处理装置;
所述高层故障管理系统包括如第四方面和第四方面的各种可能的实施方式中任一所述的故障处理装置。
第六方面,提供了一种故障管理系统,用于实现为通信故障管理系统中的低层故障管理系统,所述通信故障管理系统包括至少一层低层故障管理系统和至少一层高层故障管理系统,所述系统包括:处理器、存储器和发送器;
所述处理器,用于检测低层业务中的故障告警情况;
所述处理器,还用于根据所述故障告警情况和所述存储器中系统存储的业务依赖关系表查询得到受影响的高层业务;
所述处理器,还用于控制所述发送器向所述受影响的高层业务所对应的所述高层故障管理系统发送故障通知消息,以便所述高层故障管理系统接收所述低层故障管理系统发送的所述故障通知消息;根据所述故障通知消息确定发生故障的高层业务是否需要处理;
其中,所述业务依赖关系表是低层业务与依赖所述低层业务运行的高层业务之间的对应关系。
在第六方面的第一种可能的实施方式中,若所述故障告警情况为一个低层业务发生故障,则:
所述处理器,还用于控制所述发送器向所述受影响的高层业务所对应的所述高层故障管理系统发送故障产生消息,所述故障产生消息携带有高层受影响业务标识,所述高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务;以便所述高层故障管理系统接收并保存所述低层故障管理系统发送的所述故障产生消息;在保存所述故障产生消息的期间,检测所述故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障;若检测结果为发生故障,则暂不处理所述高层业务的故障。
结合第六方面的第一种可能的实施方式,在第二种可能的实施方式中,若所述故障告警情况为一个低层业务的故障已经恢复,则:
所述处理器,还用于控制所述发送器向所述受影响的高层业务所对应的所述高层故障管理系统发送故障恢复消息,所述故障恢复消息携带有高层受影响业务标识,所述高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务;以便所述高层故障管理系统接收所述低层故障管理系统发送的所述故障恢复消息;检测所述故障恢复消息携带的所述高层受影响业务标识所指示的高层业务的故障是否已经恢复;若检测结果为还未恢复,则处理所述高层业务的故障。
结合第六方面的第二种可能的实施方式,在第三种可能的实施方式中,所述故障产生消息和所述故障恢复消息都还携带有低层业务故障标识和故障类型,所述低层业务故障标识用于指示所述发生故障告警的低层业务;以便所述高层故障管理系统查找与所述故障恢复消息匹配的故障产生消息,所述匹配是指两个消息各自所包括的所述低层业务故障标识和所述故障类型均相同;在查找到与所述故障恢复消息匹配的故障产生消息时,删除所述故障产生消息。
第七方面,提供了一种故障处理系统,用于实现为通信故障管理系统中的高层故障管理系统,所述通信故障管理系统包括至少一层低层故障管理系统和至少一层高层故障管理系统,所述系统包括:接收器、处理器和存储器;
所述处理器,用于控制所述接收器接收所述低层故障管理系统发送的故障通知消息,所述故障通知消息是所述低层故障管理系统检测低层业务中的故障告警情况,根据所述故障告警情况和系统存储的业务依赖关系表查询得到受影响的高层业务,然后向所述受影响的高层业务所对应的所述高层故障管理系统发送的;
所述处理器,还用于根据所述故障通知消息确定发生故障的高层业务是否需要处理;
其中,所述业务依赖关系表是低层业务与依赖所述低层业务运行的高层业务之间的对应关系。
在第七方面的第一种可能的实施方式中,所述处理器,还用于控制所述接收器接收所述低层故障管理系统发送的故障产生消息,并保存至所述存储器,所述故障产生消息携带有高层受影响业务标识,所述高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务;
所述处理器,还用于在所述存储器保存所述故障产生消息的期间,检测所述故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障;
所述处理器,还用于若检测结果为发生故障,则暂不处理所述高层业务的故障。
结合第七方面的第一种可能的实施方式,在第二种可能的实施方式中,所述处理器,还用于在控制所述接收器接收到所述故障产生消息后,检测所述故障产生消息携带的所述高层受影响业务标识和所述存储器当前保存的至少一个高层故障业务标识中的任意一个是否相同,所述高层故障业务标识用于指示发生了故障的高层业务;
所述处理器,还用于若检测结果为接收到的所述高层受影响业务标识和当前保存的一个高层故障业务标识相同,则确定所述故障产生消息中携带的高层受影响业务标识所指示的高层业务发生故障。
结合第七方面的第一种可能的实施方式,在第三种可能的实施方式中,所述处理器,还用于在检测到一个高层业务发生故障后,获取对应的高层故障业务标识,所述高层故障业务标识用于指示发生了故障的高层业务;
所述处理器,还用于检测获取到的所述高层故障业务标识和所述存储器当前保存的至少一个所述高层受影响业务标识中的任意一个是否相同;
所述处理器,还用于若检测结果为获取到的所述高层故障业务标识和当前保存的一个高层受影响业务标识相同,则确定相同的所述故障产生消息中携带的高层受影响业务标识所指示的高层业务发生故障。
结合第七方面的第三种可能的实施方式,在第四种可能的实施方式中,所述处理器,还用于若检测结果为获取到的所述高层故障业务标识和当前保存的所有高层受影响业务标识均不相同,则处理获取到的所述高层故障业务标识所指示的高层业务的故障。
结合第七方面的第一种、第二种、第三种和第四种可能的实施方式,在第五种可能的实施方式中,所述处理器,还用于控制所述接收器接收所述低层故障管理系统发送的故障恢复消息,所述故障恢复消息携带有所述高层受影响业务标识;
所述处理器,还用于检测所述故障恢复消息携带的所述高层受影响业务标识所指示的高层业务的故障是否已经恢复;
所述处理器,还用于若检测结果为还未恢复,则处理所述高层业务的故障。
结合第七方面的第五种可能的实施方式,在第六种可能的实施方式中,所述故障产生消息和所述故障恢复消息都还携带有低层业务故障标识和故障类型,所述低层业务故障标识用于指示所述发生故障告警的低层业务;
所述处理器,还用于查找与所述故障恢复消息匹配的故障产生消息,所述匹配是指两个消息各自所包括的所述低层业务故障标识和所述故障类型均相同;
所述处理器,还用于在查找到与所述故障恢复消息匹配的故障产生消息时,删除所述故障产生消息。
第八方面,提供了一种通信故障管理系统,所述系统包括至少一个低层故障管理系统和至少一个高层故障管理系统;
所述低层故障管理系统是如第六方面和第六方面的各种可能的实施方式中任一所述的故障管理系统;
所述高层故障管理系统是如第七方面和第七方面的各种可能的实施方式中任一所述的故障管理系统。
本发明实施例提供的技术方案的有益效果是:
通过设置至少两层故障管理系统,并由低层故障管理系统在检测到低层业务的故障告警情况时,根据故障告警情况和系统存储的业务依赖关系表查询得到受影响的高层业务;向受影响的高层业务所对应的高层故障管理系统发送故障通知消息,使得高层故障管理系统根据故障通知消息确定发生故障的高层业务是否需要处理;解决了在不同运营商同时运营同一个移动通信系统的场景下,现有的故障管理系统可能会导致一些运营商在故障维护过程对人力或者物力造成浪费的问题;达到了当低层业务发生故障时,高层故障管理系统可以根据故障通知消息对发生故障的高层业务确定发生故障的高层业务是否需要处理,从而减少不必要的维护资源浪费的效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例所涉及的一种实施环境的结构示意图;
图2是本发明一个实施例提供的故障处理方法的方法流程图;
图3A是本发明另一实施例提供的故障处理方法的方法流程图;
图3B是图3A提供的故障处理方法中的步骤305的子步骤流程图;
图3C是图3A提供的故障处理方法中的步骤305的子步骤流程图;
图4是本发明一个实施例提供的通信故障管理系统的结构方框图;
图5是本发明另一实施例提供的通信故障管理系统的结构方框图;
图6是本发明一个实施例提供的故障管理系统的结构方框图;
图7是本发明另一实施例提供的故障管理系统的结构方框图;和
图8是本发明一个实施例提供的通信故障管理系统的结构方框图。
具体实施方式
请参考图1,其示出了本发明实施例所涉及的一种实施环境的结构示意图。该实施环境是移动通信系统,该移动通信系统包括有基础设备组成部分120、传输组成部分140和无线业务组成部分160。
不同的组成部分之间存在上下层级的关系,所以在业务承载上存在相互影响和相互依赖的关系。具体来讲:
无线业务组成部分160位于最高层,则无线业务组成部分160上的业务的正常运行,依赖于传输组成部分140上的业务或者基础设备组成部分120上的业务的正常运行。比如,假设无线业务组成部分160上提供的业务包括小区1和小区2,传输组成部分140上提供的业务包括传输链路1,基础设备组成部分120上提供的业务包括传输单板1和基带单板1。该小区1的正常运行依赖于传输链路1和传输单板1的正常运行;小区2的正常运行依赖于基带单板1的正常运行。
而传输组成部分140位于基础设备组成部分120的上层,则传输组成部分140上的业务的正常运行,依赖于基础设备组成部分120上的业务的正常运行。比如,传输链路1的正常运行依赖于传输单板1的正常运行。这种高层业务的正常运行需要依赖低层业务的正常运行的对应关系,可以称之为业务依赖关系。
当移动通信系统中的不同组成部分由不同运营商运营时,可以分别为不同运营商设置不同的故障管理系统。对应于不同组成部分的上下层级关系,各个组成部分所对应的故障管理系统也分为多层。其中,每两层故障管理系统中,位于下层的故障管理系统称之为低层故障管理系统,位于上层的故障管理系统称之为高层故障管理系统。比如,在无线业务组成部分160与传输组成部分140之间,无线业务组成部分160所对应的故障管理系统是高层故障管理系统,传输组成部分140所对应的故障管理系统是低层故障管理系统;又比如,在传输组成部分140和基础设备组成部分120之间,传输组成部分140所对应的故障管理系统是高层故障管理系统,基础设备组成部分120所对应的故障管理系统是低层故障管理系统;再比如,无线业务组成部分160和基础设备组成部分120之间,无线业务组成部分160所对应的故障管理系统是高层故障管理系统,基础设备组成部分120所对应的故障管理系统是低层故障管理系统。
上述的移动通信系统的层级划分仅为举例说明,在不同的实施例中,对移动通信系统的划分结构可能各不相同,对此不作具体限定。另外需要说明的是,为例便于描述,本文中所述的“业务”泛指移动通信系统中的物理设施、资源、服务和业务等组成部分,比如小区、基站、传输链路、传输单板、基带单板等等均统称为业务。
请参考图2,其示出了本发明一个实施例提供的故障处理方法的方法流程图。该故障处理方法用于通信故障管理系统中,该通信故障管理系统包括至少一个低层故障管理系统和至少一个高层故障管理系统。该故障处理方法,包括:
步骤201,低层故障管理系统检测低层业务中的故障告警情况;
低层故障管理系统检测低层业务中的故障告警情况。故障告警情况分为两种:一个低层业务发生故障;或者,一个低层业务的故障已经恢复。
比如,低层故障管理系统检测到低层业务A发生了故障,或者,低层故障管理系统检测到低层业务A发生的故障已经恢复。
步骤202,低层故障管理系统根据故障告警情况和系统存储的业务依赖关系表查询得到受影响的高层业务;
一种实现方式下,低层故障管理系统预先配置存储有业务依赖关系表,业务依赖关系表是低层业务与依赖该低层业务运行的高层业务之间的对应关系。另一种实现方式下,低层故障管理系统中存储的业务依赖关系表可以根据业务之间的运行情况而动态生成。
比如,低层业务A与高层业务B存在业务依赖关系,也即高层业务B的运行依赖于低层业务A。
当低层故障管理系统检测到故障告警情况时,根据故障告警情况和系统存储的业务依赖关系表查询得到受影响的高层业务。
比如,低层故障管理系统查询到受影响的高层业务为B。
步骤203,低层故障管理系统向受影响的高层业务所对应的高层故障管理系统发送故障通知消息;
低层故障管理系统向受影响的高层业务B所对应的高层故障管理系统发送故障通知消息。故障通知消息分为两种:故障产生消息和故障恢复消息。
若故障告警情况是低层业务发生故障,则发送故障产生消息;
若故障告警情况是低层业务的故障已经恢复,则发送故障恢复消息。
步骤204,高层故障管理系统接收低层故障管理系统发送的故障通知消息;
步骤205,高层故障管理系统根据故障通知消息确定发生故障的高层业务是否需要处理。
高层故障管理系统根据故障通知消息确定发生故障的高层业务是否可能由低层业务的故障所导致;
若可能由低层业务的故障所导致,则暂不处理该高层业务的故障,以减少不必要的维修资源浪费;
若不可能由低层业务的故障所导致,则处理该高层业务的故障。
综上所述,本实施例提供的故障处理方法,通过设置至少两层故障管理系统,并由低层故障管理系统在检测到低层业务的故障告警情况时,根据故障告警情况和系统存储的业务依赖关系表查询得到受影响的高层业务;向受影响的高层业务所对应的高层故障管理系统发送故障通知消息,使得高层故障管理系统根据故障通知消息确定发生故障的高层业务是否需要处理;解决了在不同运营商同时运营同一个移动通信系统的场景下,现有的故障管理系统可能会导致一些运营商在故障维护过程对人力或者物力造成浪费的问题;达到了当低层业务发生故障时,高层故障管理系统可以根据故障通知消息对发生故障的高层业务确定发生故障的高层业务是否需要处理,从而减少不必要的维护资源浪费的效果。
请参考图3A,其示出了本发明另一实施例提供的故障处理方法的方法流程图。该故障处理方法用于通信故障管理系统中,该通信故障管理系统包括至少一个低层故障管理系统和至少一个高层故障管理系统。该故障处理方法,包括:
步骤301,低层故障管理系统检测低层业务中的故障告警情况;
低层故障管理系统检测低层业务中的故障告警情况。故障告警的检测过程可以采用已有的故障检测技术进行,不再赘述。
故障告警情况分为两种:一个低层业务发生故障;或者,一个低层业务的故障已经恢复。在本步骤中,假设故障告警情况为前一种,比如,低层故障管理系统检测到低层业务A发生了故障。
步骤302,低层故障管理系统根据故障告警情况和系统存储的业务依赖关系表查询得到受影响的高层业务;
具体来讲,低层故障管理系统首先根据故障告警情况获取低层业务故障标识,该低层业务故障标识用于指示发生故障告警的低层业务;然后,低层故障管理系统系统通过低层业务故障标识在系统存储的业务依赖关系表中查询高层受影响业务标识,高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务。
比如,故障告警情况为:低层业务A发生了故障,则低层故障管理系统获取到低层业务故障标识A,然后根据系统存储的业务依赖关系表查询到高层受影响业务标识B,该高层受影响业务标识B用于指示发生故障告警的低层业务A所影响的是高层业务B。
步骤303,若故障告警情况为一个低层业务发生故障,则低层故障管理系统向受影响的高层业务所对应的高层故障管理系统发送故障产生消息;
若故障告警情况为一个低层业务发生故障,则低层故障管理系统向受影响的高层业务所对应的高层故障管理系统发送故障产生消息,该故障产生消息至少携带有高层受影响业务标识。故障产生消息中携带的高层受影响业务标识可以用于高层故障管理系统进行故障定界。
优选地,该故障产生消息还携带有低层业务故障标识和故障类型。一种故障产生消息的格式如下:
低层业务故障标识有两种表示方式:1、低层业务名称;2、低层业务类型+业务ID。
高层受影响业务标识有两种表示方式:1、高层业务名称;2、高层业务类型+业务ID。
步骤304,高层故障管理系统接收并保存低层故障管理系统发送的故障产生消息;
高层故障管理系统接收并保存低层故障管理系统发送的故障产生消息。具体来讲,高层故障管理系统可以将接收到的所有故障产生消息保存在低层故障信息列表中,这些故障产生消息可以来自相同或者不同的低层故障管理系统。
步骤305,高层故障管理系统在保存故障产生消息的期间,检测故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障;
高层故障管理系统在保存故障产生消息的期间,检测故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障。比如,高层受影响业务标识所指示的是高层业务B,则高层故障管理系统需要检测高层业务B是否发生了故障。由于高层故障管理系统检测高层业务是否发生故障的时刻和接收故障产生消息的时刻并不一定是同时的,可能互有先后,所以本步骤的检测过程可以有两种触发方式。在一种触发方式下,本步骤包括如下几个子步骤,如图3B所示:
305a,在接收到故障产生消息后,检测故障产生消息携带的高层受影响业务标识和当前保存的至少一个高层故障业务标识中的任意一个是否相同,高层故障业务标识用于指示发生了故障的高层业务;
在接收故障产生消息之前,高层故障管理系统可能已经检测到一个或者一个以上的高层业务发生了故障,则高层故障管理系统会保存至少一个高层故障业务标识,该高层故障业务标识用于指示发生故障的高层业务。具体来讲,高层故障管理系统可以将至少一个高层故障业务标识保存在高层故障信息列表中。
在接收到故障产生消息后,高层故障管理系统检测故障产生消息携带的高层受影响业务标识和当前保存的至少一个高层故障业务标识中的任意一个是否相同。
比如,高层故障管理系统在新接收到的高层受影响业务标识为“高层业务B”时,遍历高层故障信息列表中是否存在相同的高层故障业务标识。
305b,若检测结果为接收到的高层受影响业务标识和当前保存的一个高层故障业务标识相同,则确定故障产生消息中携带的高层受影响业务标识所指示的高层业务发生故障。
在另一种触发方式下,本步骤包括如下子步骤,如图3C所示:
305A,在检测到一个高层业务发生故障后,获取对应的高层故障业务标识;
高层故障管理系统检测位于本层的高层业务的故障告警情况,在检测到一个高层业务发生故障后,获取对应的高层故障业务标识,高层故障业务标识用于指示发生了故障的高层业务。
305B,检测获取到的高层故障业务标识和当前保存的至少一个所述高层受影响业务标识中的任意一个是否相同;
比如,高层故障管理系统在新获取到的高层故障业务标识为“高层业务B”时,遍历低层故障信息列表中是否存在相同的高层受影响业务标识。
305C,若检测结果为获取到的高层故障业务标识和当前保存的一个高层受影响业务标识相同,则确定相同的故障产生消息中携带的高层受影响业务标识所指示的高层业务发生故障。
优选地,若检测结果为获取到的高层故障业务标识和当前保存的所有高层受影响业务标识均不相同,则处理获取到的高层故障业务标识所指示的高层业务的故障。
步骤306,若检测结果为发生故障,则暂不处理该高层业务的故障。
若步骤305的检测结果为发生故障,则高层故障管理系统暂不处理该高层业务的故障。因为该高层业务所依赖的低层业务发生故障时,该高层业务可能会相应地无法正常运行,此时高层业务的故障可能并非由自身原因造成,所以高层故障管理系统可以暂不处理该高层业务的故障,以减少不必要的派工,派工是指故障管理系统自动生成派工单,以派出工程师进行维修施工。
当然,若步骤305的检测结果为未发生故障,则无需处理。
步骤307,低层故障管理系统检测低层业务中的故障告警情况;
低层故障管理系统检测低层业务中的故障告警情况。故障告警的检测过程可以采用已有的故障检测技术进行,不再赘述。
故障告警情况分为两种:一个低层业务发生故障;或者,一个低层业务的故障已经恢复。在本步骤中,假设故障告警情况为后一种,比如,低层故障管理系统检测到低层业务A发生的故障已经恢复。
步骤308,低层故障管理系统根据故障告警情况和系统存储的业务依赖关系表查询得到受影响的高层业务;
具体来讲,低层故障管理系统首先根据故障告警情况获取低层业务故障标识,该低层业务故障标识用于指示发生故障告警的低层业务;然后,低层故障管理系统系统通过低层业务故障标识在系统存储的业务依赖关系表中查询高层受影响业务标识,高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务。
比如,故障告警情况为:低层业务A的故障已经恢复,则低层故障管理系统获取到低层业务故障标识A,然后根据系统存储的业务依赖关系表查询到高层受影响业务标识B,该高层受影响业务标识B用于指示发生故障告警的低层业务A所影响的是高层业务B。
步骤309,若故障告警情况为一个低层业务的故障已经恢复,则低层故障管理系统向受影响的高层业务所对应的高层故障管理系统发送故障恢复消息;
若故障告警情况为一个低层业务的故障已经恢复,则低层故障管理系统向受影响的高层业务所对应的高层故障管理系统发送故障恢复消息,该故障恢复消息至少携带有高层受影响业务标识。故障恢复消息中携带的高层受影响业务标识可以用于高层故障管理系统进行故障定界。
优选地,该故障恢复消息还携带有低层业务故障标识和故障类型。一种故障恢复消息的格式如下:
低层业务故障标识有两种表示方式:1、低层业务名称;2、低层业务类型+业务ID。
高层受影响业务标识有两种表示方式:1、高层业务名称;2、高层业务类型+业务ID。
相应地,高层故障管理系统接收低层故障管理系统发送的故障恢复消息;
步骤310,高层故障管理系统查找与故障恢复消息匹配的故障产生消息,匹配是指两个消息各自所包括的低层业务故障标识和故障类型均相同;
优选地,高层故障管理系统在接收到故障恢复消息时,查找与故障恢复消息匹配的故障产生消息。匹配是指至少两个消息各自所包括的低层业务故障标识和故障类型均相同。因为同一个低层业务可能出现不同类型的故障;不同的低层业务也可能出现相同类型的故障,只有这两个参数均相同时,才能表明两个消息都是针对同一个低层业务的同一个故障。
步骤311,在查找到与故障恢复消息匹配的故障产生消息时,删除故障产生消息。
具体来讲,高层故障管理系统在查找到与故障恢复消息匹配的故障产生消息时,可以从本地保存的低层故障信息列表中删除匹配的故障产生消息。
步骤312,高层故障管理系统检测故障恢复消息携带的高层受影响业务标识所指示的高层业务的故障是否已经恢复;
比如,故障恢复消息携带的高层受影响业务标识所指示的是高层业务B,则高层故障管理系统在本地检测高层业务B的故障是否已经恢复。
步骤313,若检测结果为还未恢复,则高层故障管理系统处理高层业务的故障。
若检测结果为高层业务B的故障还未恢复,由于高层业务B所依赖的低层业务A的故障已经恢复了,所以能够确定高层业务B的故障不是由低层业务A的故障所导致的,则高层故障管理系统需要对高层业务B的故障进行处理。
另外,若检测结果为高层业务B的故障也同时恢复,则能够确定高层业务B的故障是由低层业务A的故障所导致的,则高层故障管理系统不需要对高层业务B的故障进行处理。若检测结果为高层业务B并未发生故障,则高层故障管理系统也不需要进行任何处理。
综上所述,本实施例提供的故障处理方法,通过高层故障管理系统在保存故障产生消息的期间,检测故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障;若检测结果为发生故障,则暂不处理高层业务的故障,从而可以达到在多运营商同时运营同一个移动通信系统的场景下,减少不必要的派工,以免维修过程的物力资源及人力资源的浪费的效果。
本实施例提供的故障处理方法,还通过高层故障管理系统检测故障恢复消息携带的高层受影响业务标识所指示的高层业务的故障是否已经恢复;若检测结果为还未恢复,则处理高层业务的故障,从而可以达到在多运营商同时运营同一个移动通信系统的场景下,准确地在不同的运营商之间定位高层业务的故障源,合理地分配故障维修任务的效果。
本发明实施例进一步给出实现上述方法实施例中的各方法或步骤的装置实施例。以下为本发明的装置实施例,对于装置实施例中未详尽描述的细节,可以结合参考上述对应的方法实施例。
请参考图4,其示出了本发明一个实施例提供的通信故障管理系统的结构示意图。该通信故障管理系统包括至少一个低层故障管理系统400和至少一个高层故障管理系统500。
低层故障管理系统400包括故障处理装置,该故障处理装置可以通过软件、硬件或者两者的结合实现成为低层故障管理系统400的一部分。该故障处理装置包括:告警检测模块420、关系查询模块440和消息发送模块460;
告警检测模块420,用于检测低层业务中的故障告警情况;
关系查询模块440,用于根据所述故障告警情况和系统存储的业务依赖关系表查询得到受影响的高层业务;
消息发送模块460,用于向所述受影响的高层业务所对应的所述高层故障管理系统发送故障通知消息,以便所述高层故障管理系统接收所述低层故障管理系统发送的所述故障通知消息;根据所述故障通知消息确定发生故障的高层业务是否需要处理;
其中,所述业务依赖关系表是低层业务与依赖所述低层业务运行的高层业务之间的对应关系。
高层故障管理系统500包括故障处理装置,该故障处理装置可以通过软件、硬件或者两者的结合实现成为高层故障管理系统500的一部分。该故障处理装置包括:消息接收模块520和故障处理模块540。
消息接收模块520,用于接收所述低层故障管理系统发送的故障通知消息,所述故障通知消息是所述低层故障管理系统检测低层业务中的故障告警情况,根据所述故障告警情况和系统存储的业务依赖关系表查询得到受影响的高层业务,然后向所述受影响的高层业务所对应的所述高层故障管理系统发送的;
故障处理模块540,用于根据所述故障通知消息确定发生故障的高层业务是否需要处理;
其中,所述业务依赖关系表是低层业务与依赖所述低层业务运行的高层业务之间的对应关系。
综上所述,本实施例提供的通信故障处理系统,通过设置至少两层故障管理系统,并由低层故障管理系统在检测到低层业务的故障告警情况时,根据故障告警情况和系统存储的业务依赖关系表查询得到受影响的高层业务;向受影响的高层业务所对应的高层故障管理系统发送故障通知消息,使得高层故障管理系统根据故障通知消息确定发生故障的高层业务是否需要处理;解决了在不同运营商同时运营同一个移动通信系统的场景下,现有的故障管理系统可能会导致一些运营商在故障维护过程对人力或者物力造成浪费的问题;达到了当低层业务发生故障时,高层故障管理系统可以根据故障通知消息对发生故障的高层业务确定发生故障的高层业务是否需要处理,从而减少不必要的维护资源浪费的效果。
请参考图5,其示出了本发明另一个实施例提供的通信故障管理系统的结构示意图。该通信故障管理系统包括至少一个低层故障管理系统400和至少一个高层故障管理系统500。
低层故障管理系统400包括故障处理装置,该故障处理装置可以通过软件、硬件或者两者的结合实现成为低层故障管理系统400的一部分。该故障处理装置包括:告警检测模块420、关系查询模块440和消息发送模块460;
告警检测模块420,用于检测低层业务中的故障告警情况;
关系查询模块440,用于根据所述故障告警情况和系统存储的业务依赖关系表查询得到受影响的高层业务;
消息发送模块460,用于向所述受影响的高层业务所对应的所述高层故障管理系统发送故障通知消息,以便所述高层故障管理系统接收所述低层故障管理系统发送的所述故障通知消息;根据所述故障通知消息确定发生故障的高层业务是否需要处理;
其中,所述业务依赖关系表是低层业务与依赖所述低层业务运行的高层业务之间的对应关系。
优选地,若所述故障告警情况为一个低层业务发生故障,则:
所述消息发送模块460,用于向所述受影响的高层业务所对应的所述高层故障管理系统发送故障产生消息,所述故障产生消息携带有高层受影响业务标识,所述高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务;以便所述高层故障管理系统接收并保存所述低层故障管理系统发送的所述故障产生消息;在保存所述故障产生消息的期间,检测所述故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障;若检测结果为发生故障,则暂不处理所述高层业务的故障。
优选地,若所述故障告警情况为一个低层业务的故障已经恢复,则:
所述消息发送模块460,用于向所述受影响的高层业务所对应的所述高层故障管理系统发送故障恢复消息,所述故障恢复消息携带有高层受影响业务标识,所述高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务;以便所述高层故障管理系统接收所述低层故障管理系统发送的所述故障恢复消息;检测所述故障恢复消息携带的所述高层受影响业务标识所指示的高层业务的故障是否已经恢复;若检测结果为还未恢复,则处理所述高层业务的故障。
优选地,所述故障产生消息和所述故障恢复消息都还携带有低层业务故障标识和故障类型,所述低层业务故障标识用于指示所述发生故障告警的低层业务;以便所述高层故障管理系统查找与所述故障恢复消息匹配的故障产生消息,所述匹配是指两个消息各自所包括的所述低层业务故障标识和所述故障类型均相同;在查找到与所述故障恢复消息匹配的故障产生消息时,删除所述故障产生消息。
高层故障管理系统500包括故障处理装置,该故障处理装置可以通过软件、硬件或者两者的结合实现成为高层故障管理系统500的一部分。该故障处理装置包括:消息接收模块520、故障处理模块540、消息匹配模块562和消息删除模块564。
消息接收模块520,用于接收所述低层故障管理系统发送的故障通知消息,所述故障通知消息是所述低层故障管理系统检测低层业务中的故障告警情况,根据所述故障告警情况和系统存储的业务依赖关系表查询得到受影响的高层业务,然后向所述受影响的高层业务所对应的所述高层故障管理系统发送的;
故障处理模块540,用于根据所述故障通知消息确定发生故障的高层业务是否需要处理;
其中,所述业务依赖关系表是低层业务与依赖所述低层业务运行的高层业务之间的对应关系。
优选地,所述消息接收模块520,用于接收并保存所述低层故障管理系统发送的故障产生消息,所述故障产生消息携带有高层受影响业务标识,所述高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务;
所述故障处理模块540,用于在保存所述故障产生消息的期间,检测所述故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障;若检测结果为发生故障,则暂不处理所述高层业务的故障。
优选地,所述故障处理模块540,包括:第一检测单元和第一确定单元;
所述第一检测单元,用于在接收到所述故障产生消息后,检测所述故障产生消息携带的所述高层受影响业务标识和当前保存的至少一个高层故障业务标识中的任意一个是否相同,所述高层故障业务标识用于指示发生了故障的高层业务;
所述第一确定单元,用于若检测结果为接收到的所述高层受影响业务标识和当前保存的一个高层故障业务标识相同,则确定所述故障产生消息中携带的高层受影响业务标识所指示的高层业务发生故障。
优选地,所述故障处理模块540,包括:标识获取单元、第二检测单元和第二确定单元;
所述标识获取单元,用于在检测到一个高层业务发生故障后,获取对应的高层故障业务标识,所述高层故障业务标识用于指示发生了故障的高层业务;
所述第二检测单元,用于检测获取到的所述高层故障业务标识和当前保存的至少一个所述高层受影响业务标识中的任意一个是否相同;
所述第二确定单元,用于若检测结果为获取到的所述高层故障业务标识和当前保存的一个高层受影响业务标识相同,则确定相同的所述故障产生消息中携带的高层受影响业务标识所指示的高层业务发生故障。
优选地,所述故障处理模块540,还包括:第三确定单元;
所述第三确定单元,用于若检测结果为获取到的所述高层故障业务标识和当前保存的所有高层受影响业务标识均不相同,则处理获取到的所述高层故障业务标识所指示的高层业务的故障。
优选地,所述消息接收模块520,还用于接收所述低层故障管理系统发送的故障恢复消息,所述故障恢复消息携带有所述高层受影响业务标识;
所述故障处理模块540,还用于检测所述故障恢复消息携带的所述高层受影响业务标识所指示的高层业务的故障是否已经恢复;若检测结果为还未恢复,则处理所述高层业务的故障。
优选地,所述故障产生消息和所述故障恢复消息都还携带有低层业务故障标识和故障类型,所述低层业务故障标识用于指示所述发生故障告警的低层业务;
所述装置,还包括:消息匹配模块562和消息删除模块564;
所述消息匹配模块562,用于查找与所述故障恢复消息匹配的故障产生消息,所述匹配是指两个消息各自所包括的所述低层业务故障标识和所述故障类型均相同;
所述消息删除模块564,用于在查找到与所述故障恢复消息匹配的故障产生消息时,删除所述故障产生消息。
综上所述,本实施例提供的通信故障管理系统,通过高层故障管理系统在保存故障产生消息的期间,检测故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障;若检测结果为发生故障,则暂不处理高层业务的故障,从而可以达到在多运营商同时运营同一个移动通信系统的场景下,减少不必要的派工,以免维修过程的物力资源及人力资源的浪费的效果。
本实施例提供的通信故障管理系统,还通过高层故障管理系统检测故障恢复消息携带的高层受影响业务标识所指示的高层业务的故障是否已经恢复;若检测结果为还未恢复,则处理高层业务的故障,从而可以达到在多运营商同时运营同一个移动通信系统的场景下,准确地在不同的运营商之间定位高层业务的故障源,合理地分配故障维修任务的效果。
请参考图6,其示出了本发明一个实施例提供的故障管理系统的结构示意图,该故障管理系统用于实现为通信故障管理系统中的低层故障管理系统,所述系统包括:处理器620、存储器640和发送器660;
所述处理器620,用于检测低层业务中的故障告警情况;
所述处理器620,还用于根据所述故障告警情况和所述存储器640中系统存储的业务依赖关系表查询得到受影响的高层业务;
所述处理器620,还用于控制所述发送器660向所述受影响的高层业务所对应的所述高层故障管理系统发送故障通知消息,以便所述高层故障管理系统接收所述低层故障管理系统发送的所述故障通知消息;根据所述故障通知消息确定发生故障的高层业务是否需要处理;
其中,所述业务依赖关系表是低层业务与依赖所述低层业务运行的高层业务之间的对应关系。
在更为优选的实施例中,若所述故障告警情况为一个低层业务发生故障,则:
所述处理器620,还用于控制所述发送器660向所述受影响的高层业务所对应的所述高层故障管理系统发送故障产生消息,所述故障产生消息携带有高层受影响业务标识,所述高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务;以便所述高层故障管理系统接收并保存所述低层故障管理系统发送的所述故障产生消息;在保存所述故障产生消息的期间,检测所述故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障;若检测结果为发生故障,则暂不处理所述高层业务的故障。
在更为优选的实施例中,若所述故障告警情况为一个低层业务的故障已经恢复,则:
所述处理器620,还用于控制所述发送器640向所述受影响的高层业务所对应的所述高层故障管理系统发送故障恢复消息,所述故障恢复消息携带有高层受影响业务标识,所述高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务;以便所述高层故障管理系统接收所述低层故障管理系统发送的所述故障恢复消息;检测所述故障恢复消息携带的所述高层受影响业务标识所指示的高层业务的故障是否已经恢复;若检测结果为还未恢复,则处理所述高层业务的故障。
在更为优选的实施例中,所述故障产生消息和所述故障恢复消息都还携带有低层业务故障标识和故障类型,所述低层业务故障标识用于指示所述发生故障告警的低层业务;以便所述高层故障管理系统查找与所述故障恢复消息匹配的故障产生消息,所述匹配是指两个消息各自所包括的所述低层业务故障标识和所述故障类型均相同;在查找到与所述故障恢复消息匹配的故障产生消息时,删除所述故障产生消息。
综上所述,本实施例提供的故障管理系统,通过高层故障管理系统在保存故障产生消息的期间,检测故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障;若检测结果为发生故障,则暂不处理高层业务的故障,从而可以达到在多运营商同时运营同一个移动通信系统的场景下,减少不必要的派工,以免维修过程的物力资源及人力资源的浪费的效果。
本实施例提供的故障管理系统,还通过高层故障管理系统检测故障恢复消息携带的高层受影响业务标识所指示的高层业务的故障是否已经恢复;若检测结果为还未恢复,则处理高层业务的故障,从而可以达到在多运营商同时运营同一个移动通信系统的场景下,准确地在不同的运营商之间定位高层业务的故障源,合理地分配故障维修任务的效果。
请参考图7,其示出了本发明一个实施例提供的故障管理系统的结构示意图,该故障管理系统用于实现为通信故障管理系统中的高层故障管理系统,所述系统包括:接收器720、处理器740和存储器760;
所述处理器740,用于控制所述接收器720接收所述低层故障管理系统发送的故障通知消息,所述故障通知消息是所述低层故障管理系统检测低层业务中的故障告警情况,根据所述故障告警情况和系统存储的业务依赖关系表查询得到受影响的高层业务,然后向所述受影响的高层业务所对应的所述高层故障管理系统发送的;
所述处理器740,还用于根据所述故障通知消息确定发生故障的高层业务是否需要处理;
其中,所述业务依赖关系表是低层业务与依赖所述低层业务运行的高层业务之间的对应关系。
在更为优选的实施例中,所述处理器740,还用于控制所述接收器720接收所述低层故障管理系统发送的故障产生消息,并保存至所述存储器760,所述故障产生消息携带有高层受影响业务标识,所述高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务;
所述处理器740,还用于在所述存储器保存所述故障产生消息的期间,检测所述故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障;
所述处理器740,还用于若检测结果为发生故障,则暂不处理所述高层业务的故障。
在更为优选的实施例中,所述处理器740,还用于在控制所述接收器720接收到所述故障产生消息后,检测所述故障产生消息携带的所述高层受影响业务标识和所述存储器760当前保存的至少一个高层故障业务标识中的任意一个是否相同,所述高层故障业务标识用于指示发生了故障的高层业务;
所述处理器740,还用于若检测结果为接收到的所述高层受影响业务标识和当前保存的一个高层故障业务标识相同,则确定所述故障产生消息中携带的高层受影响业务标识所指示的高层业务发生故障。
在更为优选的实施例中,所述处理器740,还用于在检测到一个高层业务发生故障后,获取对应的高层故障业务标识,所述高层故障业务标识用于指示发生了故障的高层业务;
所述处理器740,还用于检测获取到的所述高层故障业务标识和所述存储器760当前保存的至少一个所述高层受影响业务标识中的任意一个是否相同;
所述处理器740,还用于若检测结果为获取到的所述高层故障业务标识和当前保存的一个高层受影响业务标识相同,则确定相同的所述故障产生消息中携带的高层受影响业务标识所指示的高层业务发生故障。
在更为优选的实施例中,所述处理器740,还用于若检测结果为获取到的所述高层故障业务标识和当前保存的所有高层受影响业务标识均不相同,则处理获取到的所述高层故障业务标识所指示的高层业务的故障。
在更为优选的实施例中,所述处理器740,还用于控制所述接收器接收所述低层故障管理系统发送的故障恢复消息,所述故障恢复消息携带有所述高层受影响业务标识;
所述处理器740,还用于检测所述故障恢复消息携带的所述高层受影响业务标识所指示的高层业务的故障是否已经恢复;
所述处理器740,还用于若检测结果为还未恢复,则处理所述高层业务的故障。
在更为优选的实施例中,所述故障产生消息和所述故障恢复消息都还携带有低层业务故障标识和故障类型,所述低层业务故障标识用于指示所述发生故障告警的低层业务;
所述处理器740,还用于查找与所述故障恢复消息匹配的故障产生消息,所述匹配是指两个消息各自所包括的所述低层业务故障标识和所述故障类型均相同;
所述处理器740,还用于在查找到与所述故障恢复消息匹配的故障产生消息时,删除所述故障产生消息。
综上所述,本实施例提供的故障管理系统,通过高层故障管理系统在保存故障产生消息的期间,检测故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障;若检测结果为发生故障,则暂不处理高层业务的故障,从而可以达到在多运营商同时运营同一个移动通信系统的场景下,减少不必要的派工,以免维修过程的物力资源及人力资源的浪费的效果。
本实施例提供的故障管理系统,还通过高层故障管理系统检测故障恢复消息携带的高层受影响业务标识所指示的高层业务的故障是否已经恢复;若检测结果为还未恢复,则处理高层业务的故障,从而可以达到在多运营商同时运营同一个移动通信系统的场景下,准确地在不同的运营商之间定位高层业务的故障源,合理地分配故障维修任务的效果。
请参考图8,其示出了本发明一个实施例所提供的通信故障管理系统的结构方框图。该系统包括至少一个低层故障管理系统820和至少一个高层故障管理系统840;
所述低层故障管理系统820是如图6所示实施例及图6所示实施例的更为优选的实施例中所述的故障管理系统;
所述高层故障管理系统840是如图7所示实施例及图7所示实施例的更为优选的实施例中所述的故障管理系统。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可以用硬件实现,或固件实现,或它们的组合方式来实现。当使用软件实现时,可以将上述功能存储在计算机可读介质中或作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是计算机能够存取的任何可用介质。以此为例但不限于:计算机可读介质可以包括RAM、ROM、EEPROM、CD-ROM或其他光盘存储、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质。此外。任何连接可以适当的成为计算机可读介质。例如,如果软件是使用同轴电缆、光纤光缆、双绞线、数字用户线(DSL)或者诸如红外线、无线电和微波之类的无线技术从网站、服务器或者其他远程源传输的,那么同轴电缆、光纤光缆、双绞线、DSL或者诸如红外线、无线和微波之类的无线技术包括在所属介质的定影中。如本发明所使用的,盘(Disk)和碟(disc)包括压缩光碟(CD)、激光碟、光碟、数字通用光碟(DVD)、软盘和蓝光光碟,其中盘通常磁性的复制数据,而碟则用激光来光学的复制数据。上面的组合也应当包括在计算机可读介质的保护范围之内。
总之,以上所述仅为本发明技术方案的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (35)

1.一种故障处理方法,其特征在于,用于通信故障管理系统中的低层故障管理系统,所述通信故障管理系统包括至少一个低层故障管理系统和至少一个高层故障管理系统,所述方法包括:
检测低层业务中的故障告警情况;
根据所述故障告警情况和系统存储的业务依赖关系表查询得到受影响的高层业务;
向所述受影响的高层业务所对应的所述高层故障管理系统发送故障通知消息,以便所述高层故障管理系统接收所述低层故障管理系统发送的所述故障通知消息;根据所述故障通知消息确定发生故障的高层业务是否需要处理;
其中,所述业务依赖关系表是低层业务与依赖所述低层业务运行的高层业务之间的对应关系。
2.根据权利要求1所述的故障处理方法,其特征在于,若所述故障告警情况为一个低层业务发生故障,则所述向所述受影响的高层业务所对应的所述高层故障管理系统发送故障通知消息,包括:
向所述受影响的高层业务所对应的所述高层故障管理系统发送故障产生消息,所述故障产生消息携带有高层受影响业务标识,所述高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务;以便所述高层故障管理系统接收并保存所述低层故障管理系统发送的所述故障产生消息;在保存所述故障产生消息的期间,检测所述故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障;若检测结果为发生故障,则暂不处理所述高层业务的故障。
3.根据权利要求2所述的故障处理方法,其特征在于,若所述故障告警情况为一个低层业务的故障已经恢复,则所述向所述受影响的高层业务所对应的所述高层故障管理系统发送故障通知消息,包括:
向所述受影响的高层业务所对应的所述高层故障管理系统发送故障恢复消息,所述故障恢复消息携带有高层受影响业务标识,所述高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务;以便所述高层故障管理系统接收所述低层故障管理系统发送的所述故障恢复消息;检测所述故障恢复消息携带的所述高层受影响业务标识所指示的高层业务的故障是否已经恢复;若检测结果为还未恢复,则处理所述高层业务的故障。
4.根据权利要求3所述的故障处理方法,其特征在于,所述故障产生消息和所述故障恢复消息都还携带有低层业务故障标识和故障类型,所述低层业务故障标识用于指示所述发生故障告警的低层业务;以便所述高层故障管理系统查找与所述故障恢复消息匹配的故障产生消息,所述匹配是指两个消息各自所包括的所述低层业务故障标识和所述故障类型均相同;在查找到与所述故障恢复消息匹配的故障产生消息时,删除所述故障产生消息。
5.一种故障处理方法,其特征在于,用于通信故障管理系统中的高层故障管理系统,所述通信故障管理系统包括至少一层低层故障管理系统和至少一层高层故障管理系统,所述方法包括:
接收所述低层故障管理系统发送的故障通知消息,所述故障通知消息是所述低层故障管理系统检测低层业务中的故障告警情况,根据所述故障告警情况和系统存储的业务依赖关系表查询得到受影响的高层业务,然后向所述受影响的高层业务所对应的所述高层故障管理系统发送的;
根据所述故障通知消息确定发生故障的高层业务是否需要处理;
其中,所述业务依赖关系表是低层业务与依赖所述低层业务运行的高层业务之间的对应关系。
6.根据权利要求5所述的故障处理方法,其特征在于,所述接收所述低层故障管理系统发送的故障通知消息,包括:
接收并保存所述低层故障管理系统发送的故障产生消息,所述故障产生消息携带有高层受影响业务标识,所述高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务;
所述根据所述故障通知消息确定发生故障的高层业务是否需要处理,包括:
在保存所述故障产生消息的期间,检测所述故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障;
若检测结果为发生故障,则暂不处理所述高层业务的故障。
7.根据权利要求6所述的故障处理方法,其特征在于,所述在保存所述故障产生消息的期间,检测所述故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障,包括:
在接收到所述故障产生消息后,检测所述故障产生消息携带的所述高层受影响业务标识和当前保存的至少一个高层故障业务标识中的任意一个是否相同,所述高层故障业务标识用于指示发生了故障的高层业务;
若检测结果为接收到的所述高层受影响业务标识和当前保存的一个高层故障业务标识相同,则确定所述故障产生消息中携带的高层受影响业务标识所指示的高层业务发生故障。
8.根据权利要求6所述的故障处理方法,其特征在于,所述在保存所述故障产生消息的期间,检测所述故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障,包括:
在检测到一个高层业务发生故障后,获取对应的高层故障业务标识,所述高层故障业务标识用于指示发生了故障的高层业务;
检测获取到的所述高层故障业务标识和当前保存的至少一个所述高层受影响业务标识中的任意一个是否相同;
若检测结果为获取到的所述高层故障业务标识和当前保存的一个高层受影响业务标识相同,则确定相同的所述故障产生消息中携带的高层受影响业务标识所指示的高层业务发生故障。
9.根据权利要求8所述的故障处理方法,其特征在于,所述检测获取到的所述高层故障业务标识和预先保存的至少一个所述高层受影响业务标识中的任意一个是否相同之后,还包括:
若检测结果为获取到的所述高层故障业务标识和当前保存的所有高层受影响业务标识均不相同,则处理获取到的所述高层故障业务标识所指示的高层业务的故障。
10.根据权利要求6至9任一所述的故障处理方法,其特征在于,所述接收所述低层故障管理系统发送的故障通知消息,包括:
接收所述低层故障管理系统发送的故障恢复消息,所述故障恢复消息携带有所述高层受影响业务标识;
所述根据所述故障通知消息确定发生故障的高层业务是否需要处理,包括:
检测所述故障恢复消息携带的所述高层受影响业务标识所指示的高层业务的故障是否已经恢复;
若检测结果为还未恢复,则处理所述高层业务的故障。
11.根据权利要求10所述的故障处理方法,其特征在于,所述故障产生消息和所述故障恢复消息都还携带有低层业务故障标识和故障类型,所述低层业务故障标识用于指示所述发生故障告警的低层业务;
所述接收所述低层故障管理系统发送的故障恢复消息之后,还包括:
查找与所述故障恢复消息匹配的故障产生消息,所述匹配是指两个消息各自所包括的所述低层业务故障标识和所述故障类型均相同;
在查找到与所述故障恢复消息匹配的故障产生消息时,删除所述故障产生消息。
12.一种故障处理装置,其特征在于,用于通信故障管理系统中的低层故障管理系统,所述通信故障管理系统包括至少一个低层故障管理系统和至少一个高层故障管理系统,所述装置包括:
告警检测模块,用于检测低层业务中的故障告警情况;
关系查询模块,用于根据所述故障告警情况和系统存储的业务依赖关系表查询得到受影响的高层业务;
消息发送模块,用于向所述受影响的高层业务所对应的所述高层故障管理系统发送故障通知消息,以便所述高层故障管理系统接收所述低层故障管理系统发送的所述故障通知消息;根据所述故障通知消息确定发生故障的高层业务是否需要处理;
其中,所述业务依赖关系表是低层业务与依赖所述低层业务运行的高层业务之间的对应关系。
13.根据权利要求12所述的故障处理装置,其特征在于,若所述故障告警情况为一个低层业务发生故障,则:
所述消息发送模块,用于向所述受影响的高层业务所对应的所述高层故障管理系统发送故障产生消息,所述故障产生消息携带有高层受影响业务标识,所述高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务;以便所述高层故障管理系统接收并保存所述低层故障管理系统发送的所述故障产生消息;在保存所述故障产生消息的期间,检测所述故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障;若检测结果为发生故障,则暂不处理所述高层业务的故障。
14.根据权利要求13所述的故障处理装置,其特征在于,若所述故障告警情况为一个低层业务的故障已经恢复,则:
所述消息发送模块,用于向所述受影响的高层业务所对应的所述高层故障管理系统发送故障恢复消息,所述故障恢复消息携带有高层受影响业务标识,所述高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务;以便所述高层故障管理系统接收所述低层故障管理系统发送的所述故障恢复消息;检测所述故障恢复消息携带的所述高层受影响业务标识所指示的高层业务的故障是否已经恢复;若检测结果为还未恢复,则处理所述高层业务的故障。
15.根据权利要求14所述的故障处理装置,其特征在于,所述故障产生消息和所述故障恢复消息都还携带有低层业务故障标识和故障类型,所述低层业务故障标识用于指示所述发生故障告警的低层业务;以便所述高层故障管理系统查找与所述故障恢复消息匹配的故障产生消息,所述匹配是指两个消息各自所包括的所述低层业务故障标识和所述故障类型均相同;在查找到与所述故障恢复消息匹配的故障产生消息时,删除所述故障产生消息。
16.一种故障处理装置,其特征在于,用于通信故障管理系统中的高层故障管理系统,所述通信故障管理系统包括至少一层低层故障管理系统和至少一层高层故障管理系统,所述装置包括:
消息接收模块,用于接收所述低层故障管理系统发送的故障通知消息,所述故障通知消息是所述低层故障管理系统检测低层业务中的故障告警情况,根据所述故障告警情况和系统存储的业务依赖关系表查询得到受影响的高层业务,然后向所述受影响的高层业务所对应的所述高层故障管理系统发送的;
故障处理模块,用于根据所述故障通知消息确定发生故障的高层业务是否需要处理;
其中,所述业务依赖关系表是低层业务与依赖所述低层业务运行的高层业务之间的对应关系。
17.根据权利要求16所述的故障处理装置,其特征在于:
所述消息接收模块,用于接收并保存所述低层故障管理系统发送的故障产生消息,所述故障产生消息携带有高层受影响业务标识,所述高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务;
所述故障处理模块,用于在保存所述故障产生消息的期间,检测所述故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障;若检测结果为发生故障,则暂不处理所述高层业务的故障。
18.根据权利要求17所述的故障处理装置,其特征在于,所述故障处理模块,包括:第一检测单元和第一确定单元;
所述第一检测单元,用于在接收到所述故障产生消息后,检测所述故障产生消息携带的所述高层受影响业务标识和当前保存的至少一个高层故障业务标识中的任意一个是否相同,所述高层故障业务标识用于指示发生了故障的高层业务;
所述第一确定单元,用于若检测结果为接收到的所述高层受影响业务标识和当前保存的一个高层故障业务标识相同,则确定所述故障产生消息中携带的高层受影响业务标识所指示的高层业务发生故障。
19.根据权利要求17所述的故障处理装置,其特征在于,所述故障处理模块,包括:标识获取单元、第二检测单元和第二确定单元;
所述标识获取单元,用于在检测到一个高层业务发生故障后,获取对应的高层故障业务标识,所述高层故障业务标识用于指示发生了故障的高层业务;
所述第二检测单元,用于检测获取到的所述高层故障业务标识和当前保存的至少一个所述高层受影响业务标识中的任意一个是否相同;
所述第二确定单元,用于若检测结果为获取到的所述高层故障业务标识和当前保存的一个高层受影响业务标识相同,则确定相同的所述故障产生消息中携带的高层受影响业务标识所指示的高层业务发生故障。
20.根据权利要求19所述的故障处理装置,其特征在于,所述故障处理模块,还包括:第三确定单元;
所述第三确定单元,用于若检测结果为获取到的所述高层故障业务标识和当前保存的所有高层受影响业务标识均不相同,则处理获取到的所述高层故障业务标识所指示的高层业务的故障。
21.根据权利要求17至20任一所述的故障处理装置,其特征在于,所述消息接收模块,还用于接收所述低层故障管理系统发送的故障恢复消息,所述故障恢复消息携带有所述高层受影响业务标识;
所述故障处理模块,还用于检测所述故障恢复消息携带的所述高层受影响业务标识所指示的高层业务的故障是否已经恢复;若检测结果为还未恢复,则处理所述高层业务的故障。
22.根据权利要求21所述的故障处理装置,其特征在于,所述故障产生消息和所述故障恢复消息都还携带有低层业务故障标识和故障类型,所述低层业务故障标识用于指示所述发生故障告警的低层业务;
所述装置,还包括:消息匹配模块和消息删除模块;
所述消息匹配模块,用于查找与所述故障恢复消息匹配的故障产生消息,所述匹配是指两个消息各自所包括的所述低层业务故障标识和所述故障类型均相同;
所述消息删除模块,用于在查找到与所述故障恢复消息匹配的故障产生消息时,删除所述故障产生消息。
23.一种通信故障处理系统,其特征在于,所述系统包括至少一个低层故障管理系统和至少一个高层故障管理系统;
所述低层故障管理系统包括如权利要求12至15任一所述的故障处理装置;
所述高层故障管理系统包括如权利要求16至22任一所述的故障处理装置。
24.一种故障处理系统,其特征在于,用于实现为通信故障管理系统中的低层故障管理系统,所述通信故障管理系统包括至少一层低层故障管理系统和至少一层高层故障管理系统,所述系统包括:处理器、存储器和发送器;
所述处理器,用于检测低层业务中的故障告警情况;
所述处理器,还用于根据所述故障告警情况和所述存储器中系统存储的业务依赖关系表查询得到受影响的高层业务;
所述处理器,还用于控制所述发送器向所述受影响的高层业务所对应的所述高层故障管理系统发送故障通知消息,以便所述高层故障管理系统接收所述低层故障管理系统发送的所述故障通知消息;根据所述故障通知消息确定发生故障的高层业务是否需要处理;
其中,所述业务依赖关系表是低层业务与依赖所述低层业务运行的高层业务之间的对应关系。
25.根据权利要求24所述的故障处理系统,其特征在于,若所述故障告警情况为一个低层业务发生故障,则:
所述处理器,还用于控制所述发送器向所述受影响的高层业务所对应的所述高层故障管理系统发送故障产生消息,所述故障产生消息携带有高层受影响业务标识,所述高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务;以便所述高层故障管理系统接收并保存所述低层故障管理系统发送的所述故障产生消息;在保存所述故障产生消息的期间,检测所述故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障;若检测结果为发生故障,则暂不处理所述高层业务的故障。
26.根据权利要求25所述的故障处理系统,其特征在于,若所述故障告警情况为一个低层业务的故障已经恢复,则:
所述处理器,还用于控制所述发送器向所述受影响的高层业务所对应的所述高层故障管理系统发送故障恢复消息,所述故障恢复消息携带有高层受影响业务标识,所述高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务;以便所述高层故障管理系统接收所述低层故障管理系统发送的所述故障恢复消息;检测所述故障恢复消息携带的所述高层受影响业务标识所指示的高层业务的故障是否已经恢复;若检测结果为还未恢复,则处理所述高层业务的故障。
27.根据权利要求26所述的故障处理系统,其特征在于,所述故障产生消息和所述故障恢复消息都还携带有低层业务故障标识和故障类型,所述低层业务故障标识用于指示所述发生故障告警的低层业务;以便所述高层故障管理系统查找与所述故障恢复消息匹配的故障产生消息,所述匹配是指两个消息各自所包括的所述低层业务故障标识和所述故障类型均相同;在查找到与所述故障恢复消息匹配的故障产生消息时,删除所述故障产生消息。
28.一种故障处理系统,其特征在于,用于实现为通信故障管理系统中的高层故障管理系统,所述通信故障管理系统包括至少一层低层故障管理系统和至少一层高层故障管理系统,所述系统包括:接收器、处理器和存储器;
所述处理器,用于控制所述接收器接收所述低层故障管理系统发送的故障通知消息,所述故障通知消息是所述低层故障管理系统检测低层业务中的故障告警情况,根据所述故障告警情况和系统存储的业务依赖关系表查询得到受影响的高层业务,然后向所述受影响的高层业务所对应的所述高层故障管理系统发送的;
所述处理器,还用于根据所述故障通知消息确定发生故障的高层业务是否需要处理;
其中,所述业务依赖关系表是低层业务与依赖所述低层业务运行的高层业务之间的对应关系。
29.根据权利要求28所述的故障处理系统,其特征在于:
所述处理器,还用于控制所述接收器接收所述低层故障管理系统发送的故障产生消息,并保存至所述存储器,所述故障产生消息携带有高层受影响业务标识,所述高层受影响业务标识用于指示发生故障告警的低层业务所影响的高层业务;
所述处理器,还用于在所述存储器保存所述故障产生消息的期间,检测所述故障产生消息中携带的高层受影响业务标识所指示的高层业务是否发生故障;
所述处理器,还用于若检测结果为发生故障,则暂不处理所述高层业务的故障。
30.根据权利要求29所述的故障处理系统,其特征在于:
所述处理器,还用于在控制所述接收器接收到所述故障产生消息后,检测所述故障产生消息携带的所述高层受影响业务标识和所述存储器当前保存的至少一个高层故障业务标识中的任意一个是否相同,所述高层故障业务标识用于指示发生了故障的高层业务;
所述处理器,还用于若检测结果为接收到的所述高层受影响业务标识和当前保存的一个高层故障业务标识相同,则确定所述故障产生消息中携带的高层受影响业务标识所指示的高层业务发生故障。
31.根据权利要求29所述的故障处理系统,其特征在于:
所述处理器,还用于在检测到一个高层业务发生故障后,获取对应的高层故障业务标识,所述高层故障业务标识用于指示发生了故障的高层业务;
所述处理器,还用于检测获取到的所述高层故障业务标识和所述存储器当前保存的至少一个所述高层受影响业务标识中的任意一个是否相同;
所述处理器,还用于若检测结果为获取到的所述高层故障业务标识和当前保存的一个高层受影响业务标识相同,则确定相同的所述故障产生消息中携带的高层受影响业务标识所指示的高层业务发生故障。
32.根据权利要求31所述的故障处理系统,其特征在于:
所述处理器,还用于若检测结果为获取到的所述高层故障业务标识和当前保存的所有高层受影响业务标识均不相同,则处理获取到的所述高层故障业务标识所指示的高层业务的故障。
33.根据权利要求29至32任一所述的故障处理系统,其特征在于:
所述处理器,还用于控制所述接收器接收所述低层故障管理系统发送的故障恢复消息,所述故障恢复消息携带有所述高层受影响业务标识;
所述处理器,还用于检测所述故障恢复消息携带的所述高层受影响业务标识所指示的高层业务的故障是否已经恢复;
所述处理器,还用于若检测结果为还未恢复,则处理所述高层业务的故障。
34.根据权利要求33所述的故障处理系统,其特征在于,所述故障产生消息和所述故障恢复消息都还携带有低层业务故障标识和故障类型,所述低层业务故障标识用于指示所述发生故障告警的低层业务;
所述处理器,还用于查找与所述故障恢复消息匹配的故障产生消息,所述匹配是指两个消息各自所包括的所述低层业务故障标识和所述故障类型均相同;
所述处理器,还用于在查找到与所述故障恢复消息匹配的故障产生消息时,删除所述故障产生消息。
35.一种通信故障处理系统,其特征在于,所述系统包括至少一个低层故障管理系统和至少一个高层故障管理系统;
所述低层故障管理系统是如权利要求24至27任一所述的故障处理系统;
所述高层故障管理系统是如权利要求28至34任一所述的故障处理系统。
CN201380003385.0A 2013-06-27 2013-06-27 故障处理方法、装置和系统 Active CN104521181B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2013/078135 WO2014205721A1 (zh) 2013-06-27 2013-06-27 故障处理方法、装置和系统

Publications (2)

Publication Number Publication Date
CN104521181A CN104521181A (zh) 2015-04-15
CN104521181B true CN104521181B (zh) 2018-01-16

Family

ID=52140820

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380003385.0A Active CN104521181B (zh) 2013-06-27 2013-06-27 故障处理方法、装置和系统

Country Status (4)

Country Link
US (1) US10091672B2 (zh)
EP (1) EP3001606B1 (zh)
CN (1) CN104521181B (zh)
WO (1) WO2014205721A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106789354A (zh) * 2017-02-09 2017-05-31 北京市天元网络技术股份有限公司 一种基于铁路通信的故障诊断方法及装置
CN108632053B (zh) * 2017-03-16 2022-09-27 中兴通讯股份有限公司 业务信息的处理方法及装置
JP7032640B2 (ja) * 2017-12-28 2022-03-09 富士通株式会社 影響範囲特定プログラム、影響範囲特定方法、および影響範囲特定装置
CN109873719B (zh) * 2019-02-03 2019-12-31 华为技术有限公司 一种故障检测方法及装置
US20230022283A1 (en) * 2019-02-11 2023-01-26 Nokia Technologies Oy Apparatus, method and computer program for ue cell selection control in non-terrestrial networks
CN110120146A (zh) * 2019-04-25 2019-08-13 新浪网技术(中国)有限公司 一种基于报警中台系统的报警方法及报警中台系统
US11455202B2 (en) * 2020-09-03 2022-09-27 International Business Machines Corporation Real-time fault localization detection and notification
CN112579356B (zh) * 2020-12-21 2022-09-16 上海金仕达软件科技有限公司 一种故障处理方法及服务器

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101039498A (zh) * 2007-05-09 2007-09-19 中兴通讯股份有限公司 带有分布式告警处理的基站系统及其告警处理方法
CN101159617A (zh) * 2007-11-22 2008-04-09 中国电信股份有限公司 一种融合全网全业务的二维故障管理方法和系统
CN101335643A (zh) * 2008-08-06 2008-12-31 烽火通信科技股份有限公司 用于sdh设备告警相关性分析的方法及装置
CN101800675A (zh) * 2010-02-25 2010-08-11 华为技术有限公司 故障监控方法、监控设备及通信系统
CN101860802A (zh) * 2010-05-21 2010-10-13 中兴通讯股份有限公司 故障处理方法及系统
CN101917288A (zh) * 2010-08-04 2010-12-15 中兴通讯股份有限公司 告警处理方法及网管系统
CN102238144A (zh) * 2010-04-30 2011-11-09 电子科技大学 多层网络中实现层间资源共享的方法、装置及系统

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5768501A (en) * 1996-05-28 1998-06-16 Cabletron Systems Method and apparatus for inter-domain alarm correlation
US6253339B1 (en) * 1998-10-28 2001-06-26 Telefonaktiebolaget Lm Ericsson (Publ) Alarm correlation in a large communications network
US7237138B2 (en) * 2000-05-05 2007-06-26 Computer Associates Think, Inc. Systems and methods for diagnosing faults in computer networks
JP2002033767A (ja) * 2000-07-18 2002-01-31 Fujitsu Ltd ネットワーク管理システム
US20020171886A1 (en) * 2001-03-07 2002-11-21 Quansheng Wu Automatic control plane recovery for agile optical networks
US6965775B2 (en) * 2002-05-15 2005-11-15 Nokia Corporation Service-oriented protection scheme for a radio access network
EP1499049B1 (en) * 2003-07-18 2008-02-20 Alcatel Lucent Network restoration
US7346277B2 (en) * 2003-09-08 2008-03-18 Lucent Technologies Inc. Joint-layer restoration in packet-over-optical networks
JP4523444B2 (ja) * 2005-02-10 2010-08-11 富士通株式会社 通信ネットワークにおける障害の原因を特定する障害管理装置および方法
EP1985092B1 (en) * 2005-12-23 2011-07-06 Telefonaktiebolaget LM Ericsson (publ) Method and apparatus for solving data packet traffic congestion.
JP4758259B2 (ja) * 2006-01-31 2011-08-24 株式会社クラウド・スコープ・テクノロジーズ ネットワーク監視装置及び方法
US7830784B2 (en) * 2007-06-29 2010-11-09 Verizon Patent And Licensing Inc. Intelligent network restoration
US8913481B2 (en) * 2007-06-30 2014-12-16 Alcatel Lucent Method and system for efficient provisioning of multiple services for multiple failure restoration in multi-layer mesh networks
WO2009087556A1 (en) * 2008-01-07 2009-07-16 Tejas Networks Limited A method for fast connectivity fault management [cfm] of a service -network
US7865593B2 (en) * 2008-08-07 2011-01-04 At&T Intellectual Property I, L.P. Apparatus and method for managing a network
MX2011006770A (es) * 2008-12-23 2011-07-20 Ericsson Telefon Ab L M Metodo y sistema para distribuir informacion de falla en sistema de red de comunicacion de escala grande.
US9753455B2 (en) * 2009-06-22 2017-09-05 Johnson Controls Technology Company Building management system with fault analysis
EP2471302B1 (en) * 2009-08-25 2014-03-05 Telefonaktiebolaget LM Ericsson (publ) Using the ecn mechanism to signal congestion directly to the base station
WO2011159868A2 (en) * 2010-06-17 2011-12-22 Aware Inc Event correlation between protocol layers in a network device
US8406134B2 (en) * 2010-06-25 2013-03-26 At&T Intellectual Property I, L.P. Scaling content communicated over a network
CN104272680B (zh) * 2012-03-09 2017-05-17 英国电讯有限公司 用信号通知拥塞
WO2014189453A1 (en) * 2013-05-21 2014-11-27 Telefonaktiebolaget L M Ericsson (Publ) Random access procedure in wireless device, radio base station and methods therein

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101039498A (zh) * 2007-05-09 2007-09-19 中兴通讯股份有限公司 带有分布式告警处理的基站系统及其告警处理方法
CN101159617A (zh) * 2007-11-22 2008-04-09 中国电信股份有限公司 一种融合全网全业务的二维故障管理方法和系统
CN101335643A (zh) * 2008-08-06 2008-12-31 烽火通信科技股份有限公司 用于sdh设备告警相关性分析的方法及装置
CN101800675A (zh) * 2010-02-25 2010-08-11 华为技术有限公司 故障监控方法、监控设备及通信系统
CN102238144A (zh) * 2010-04-30 2011-11-09 电子科技大学 多层网络中实现层间资源共享的方法、装置及系统
CN101860802A (zh) * 2010-05-21 2010-10-13 中兴通讯股份有限公司 故障处理方法及系统
CN101917288A (zh) * 2010-08-04 2010-12-15 中兴通讯股份有限公司 告警处理方法及网管系统

Also Published As

Publication number Publication date
US20160135065A1 (en) 2016-05-12
EP3001606A1 (en) 2016-03-30
US10091672B2 (en) 2018-10-02
CN104521181A (zh) 2015-04-15
EP3001606A4 (en) 2016-06-01
EP3001606B1 (en) 2018-12-19
WO2014205721A1 (zh) 2014-12-31

Similar Documents

Publication Publication Date Title
CN104521181B (zh) 故障处理方法、装置和系统
EP2933949B1 (en) Alarm processing method and device, alarm associated information setting method
CN107071005A (zh) 一种数据同步方法及系统
CN108011770B (zh) 一种甚高频地空通信共用系统多级分布式监控系统
RO126243A2 (ro) Sistem şi metode pentru detectarea întreruperii unei reţele utilitare
CN103812675A (zh) 一种实现业务交付平台异地容灾切换的方法和系统
CN104468648A (zh) 数据处理系统及方法
CN109347705A (zh) 一种环路检测方法及装置
CN102082710A (zh) 网络中节点实现网络拓扑故障检测的方法和系统
CN104038376A (zh) 一种管理真实服务器的方法、装置及lvs集群系统
CN108023746A (zh) 一种视频数据处理方法、装置及系统
CN110048872A (zh) 一种网络告警方法、装置、系统及终端
CN102143011B (zh) 一种实现网络保护的装置及方法
CN103747061A (zh) 一种支持多组网接入的动力环境监控系统及其运行方法
CN103763137B (zh) 一种设备配置连接保护方法、系统及装置
CN103796343A (zh) M2m网关设备及其应用方法
CN104301131A (zh) 故障管理方法和装置
CN104426700B (zh) 网元和环网保护的方法
CN103178997B (zh) 一种基于lldp协议的mac地址相同的检测方法和设备
CN207135281U (zh) 一种生产实时信息管理系统
CN108616937A (zh) 轨道交通lte车地无线系统的核心网故障处理方法及基站
CN106533747A (zh) 一种网络服务器运行状况监测系统
CN103713617B (zh) 一种物联网监管系统
WO2016082368A1 (zh) 一种保持数据一致性的方法、装置及ptn传输设备
CN107426009B (zh) 地铁通信网管系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant