CN114172794A - 网络故障定位方法及服务器 - Google Patents

网络故障定位方法及服务器 Download PDF

Info

Publication number
CN114172794A
CN114172794A CN202010948513.0A CN202010948513A CN114172794A CN 114172794 A CN114172794 A CN 114172794A CN 202010948513 A CN202010948513 A CN 202010948513A CN 114172794 A CN114172794 A CN 114172794A
Authority
CN
China
Prior art keywords
target
network
fault
information
performance parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010948513.0A
Other languages
English (en)
Other versions
CN114172794B (zh
Inventor
朱律韵
郑圣
朱卫锋
井华
涂晶
李叶强
潘海兵
王磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN202010948513.0A priority Critical patent/CN114172794B/zh
Publication of CN114172794A publication Critical patent/CN114172794A/zh
Application granted granted Critical
Publication of CN114172794B publication Critical patent/CN114172794B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种网络故障定位方法及服务器,该方法包括:按照第一预设时间间隔监测并存储网络的多个性能参数,按照第二预设时间间隔监测并存储所有网元的告警信息,从网络的多个性能参数中识别目标异常信息,并根据目标异常信息确定出现故障的目标网元类型以及出现故障的目标异常性能参数,并从所述目标异常性能参数中获取所述目标网元类型的对应的目标性能参数,使得网络运维人员可以通过目标性能参数定位故障网元。通过获取目标网元类型的对应的目标性能参数,使得运维人员根据目标性能参数定位故障网元,缩小了定位故障网元需要处理的数据范围,减少了数据分析的工作量,提高了运维人员进行故障定位的效率以及故障定位方法的准确性。

Description

网络故障定位方法及服务器
技术领域
本发明涉及通信技术领域,尤其涉及一种网络故障定位方法及服务器。
背景技术
网络通信是通过网络将各个孤立的设备进行连接,通过信息交换实现人与人,人与计算机,计算机与计算机之间的通信。为保障网络通信系统的正常运行,当网络发生故障或出现网络通信异常时,需要网络维护人员及时排查网络出现故障的位置及故障原因。
当前网络维护人员在进行故障定位时,需要网络运维人员定时查看网络通信系统指标变化情况及告警信息等数据,并通过登录多个网元进行查询确定网络是否存在问题,以及根据经验确定出现故障网元的根本原因。
但是,现有的网络通信系统包括多个网元例如网络节点(Mobility ManagementEntity,简称MME)、服务网关(Serving Gate Way,简称SGW)、归属签约用户服务器(HomeSubscriber Server,简称HSS)以及策略与计费规则功能单元(Policy and ChargingRules Function,简称PCRF)等。当某一个网元出现问题时,与该网元所有相关的其他网元都会出现对应的异常信息。现有技术中网络运维人员根据经验对网络通信系统的性能参数进行分析,以定位网络故障位置。该方法对网络运维人员的要求较高,不仅需要网络运维人员十分熟悉网络拓扑结构,并且还需要网络运维人员对每个网元十分了解,否则网络运维人员无法在短期内确定故障网元的位置,严重影响网络性能。
发明内容
本发明的目的在于提供一种网络故障定位方法及服务器,以提高网络故障定位的准确性。
第一方面,本发明提供一种网络故障定位方法,包括:
按照第一预设时间间隔监测并存储网络的多个性能参数,按照第二预设时间间隔监测并存储所有网元的告警信息;
从存储的所述网络的多个性能参数中识别目标异常信息;
根据所述目标异常信息确定目标异常性能参数,并根据所述目标异常信息从存储的所述所有网元的告警信息中确定目标网元类型;
从所述目标异常性能参数中获取所述目标网元类型的对应的目标性能参数,并将所述目标性能参数发送至用户终端,以使用户根据所述目标性能参数定位故障网元。
在一种可能的设计中,所述从存储的所述网络的多个性能参数中识别目标异常信息,包括:
根据所述多个性能参数及所述所有网元的告警信息按照时间顺序生成时序图;
根据所述时序图识别目标异常信息,其中所述目标异常信息为性能参数中超过预设误差阈值的性能参数。
在一种可能的设计中,所述根据所述目标异常信息从所述所有网元的告警信息中确定目标网元类型,包括:
根据所述时序图获取出现目标异常信息的故障时间点;
根据所述故障时间点从所述所有网元的告警信息中确定目标告警信息;
根据所述目标告警信息确定目标网元类型。
在一种可能的设计中,所述性能参数包括业务量、性能指标、告警信息、链路状态信息及系统日志;
相应地,所述根据所述时序图识别目标异常信息,包括:
若同时出现两种或两种以上的性能参数超过预设误差阈值,则按照所述业务量、所述性能指标、所述告警信息、所述链路状态信息及所述系统日志的优先级顺序,将优先级最高的超过预设误差阈值的性能参数确定为目标异常信息。
在一种可能的设计中,在所述将所述目标性能参数发送至用户终端,以使用户根据所述目标性能参数定位故障网元之后,还包括:
接收用户终端发送的故障网元信息;
若所述目标异常性能参数中包含紧急性能参数,则将所述故障网元进行紧急故障处理,其中所述紧急故障处理包括脱机或重启,所述紧急性能参数为所述业务量及所述性能指标中的至少一种;
若所述异常性能参数中未包含紧急性能参数,则将所述故障网元进行故障修复,其中所述故障修复包括对所述故障网元的端口及传输线路进行检查或硬件更换。
在一种可能的设计中,所述网元类型包括网络节点、服务网关、交换机、防火墙以及域名解析服务器。
第二方面,本发明实施例提供一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如下步骤:
按照第一预设时间间隔监测并存储网络的多个性能参数,按照第二预设时间间隔监测并存储所有网元的告警信息;
从存储的所述网络的多个性能参数中识别目标异常信息;
根据所述目标异常信息确定目标异常性能参数,并根据所述目标异常信息从存储的所述所有网元的告警信息中确定目标网元类型;
从所述目标异常性能参数中获取所述目标网元类型的对应的目标性能参数,并将所述目标性能参数发送至用户终端,以使用户根据所述目标性能参数定位故障网元。
在一种可能的设计中,所述处理器执行所述计算机程序时还实现如下步骤:
根据所述多个性能参数及所述所有网元的告警信息按照时间顺序生成时序图;
根据所述时序图识别目标异常信息,其中所述目标异常信息为性能参数中超过预设误差阈值的性能参数。
在一种可能的设计中,所述处理器执行所述计算机程序时还实现如下步骤:
根据所述时序图获取出现目标异常信息的故障时间点;
根据所述故障时间点从所述所有网元的告警信息中确定目标告警信息;
根据所述目标告警信息确定目标网元类型。
第三方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如第一方面任一项所述的网络故障定位方法。
本发明实施例提供的一种网络故障定位方法及服务器,通过持续监测网络多个性能参数以及网络中所有网元的告警信息,从网络的多个性能参数中识别目标异常信息,并根据目标异常信息确定出现故障的目标网元类型以及出现故障的目标异常性能参数,并从所述目标异常性能参数中获取所述目标网元类型的对应的目标性能参数,使得网络运维人员可以通过目标性能参数定位故障网元。通过获取目标网元类型的对应的目标性能参数,使得运维人员根据目标性能参数定位故障网元,缩小了定位故障网元需要处理的数据范围,减少了数据分析的工作量,提高了运维人员进行故障定位的效率以及故障定位方法的准确性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1为本发明实施例提供的多网元的网络结构示意图;
图2为本发明实施例提供的网络故障定位方法流程图一;
图3为本发明实施例提供的网络故障定位方法流程图二;
图4为本发明实施例提供的网络故障定位方法时序图;
图5为本发明实施例提供的网络故障定位方法的鱼骨分析图;
图6为本发明实施例提供的网络故障定位方法流程图三;
图7为本发明实施例提供的网络故障定位装置的结构示意图;
图8为本发明实施例提供的服务器结构示意图。
具体实施方式
通过上述附图,已示出本发明明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本发明构思的范围,而是通过参考特定实施例为本领域技术人员说明本发明的概念。
图1为本发明实施例提供的多网元的网络结构示意图,如图1所示:本发明实施例中网络结构中的网元类型主要包括:网络节点、服务网关、交换机、防火墙以及域名解析服务器。如图1所示,现有的多网元网络结构的网元包含网络节点11、服务网关21、交换机31、防火墙41、域名解析服务器51以及故障分析服务器61。其中,网络节点11分别与基站10及服务网关21建立数据传输通信,交换机31分别与服务网关21、防火墙41以及域名解析服务器51建立数据传输通信,故障分析服务器61分别与网络节点11、服务网关21、交换机31、防火墙41、域名解析服务器51建立数据传输通信。
网络中的网元出现故障时会生成告警信息,网络运运维人员可通过获取网元的告警信息及时发现网络系统中的故障并进行故障修复。但是,现有的多网元网络中设备量较大,结构复杂,当一个网元触发故障时,往往会影响直接连接的相关网元也同时出现异常信息。因此网络运维人员需要对多个网元设备的告警信息进行筛选和分析,并根据经验定位出现故障的网元及故障的根本原因。该方法对网络运维人员的要求较高,不仅需要网络运维人员十分熟悉网络拓扑结构,并且还需要网络运维人员对每个网元十分了解,否则网络运维人员无法在短期内确定故障网元的位置,处理网络故障的效率低下。
为了避免上述技术问题,本发明对于基于上述场景的网络故障定位方法进行了改进,即通过持续监测网络多个性能参数以及网络中所有网元的告警信息,从网络的多个性能参数中识别目标异常信息,并根据目标异常信息确定出现故障的目标网元类型以及出现故障的目标异常性能参数,并从所述目标异常性能参数中获取所述目标网元类型的对应的目标性能参数,使得网络运维人员可以通过目标性能参数定位故障网元。通过获取目标网元类型的对应的目标性能参数,使得运维人员根据目标性能参数定位故障网元,缩小了定位故障网元需要处理的数据范围,减少了数据分析的工作量,提高了运维人员进行故障定位的效率以及故障定位方法的准确性。
图2为本发明实施例提供的网络故障定位方法流程图一。本实施例的方法的执行主体可以为图1中的故障分析服务器,如图2所示,网络故障定位方法包括以下步骤:
S201:按照第一预设时间间隔监测并存储网络的多个性能参数,按照第二预设时间间隔监测并存储所有网元的告警信息。
在本实施例中,第一预设时间间隔以及第二预设时间间隔都可以设置为5分钟,即每隔5分钟监测及存储网络的多个性能参数以及所有网元的告警信息。网络中的网元出现故障之后,会生成告警信息,因此可每隔5分钟监测及存储所有网元的告警信息,获得的所有网元的告警信息用于分析和定位网络故障位置和根本原因。可选的,网络的多个性能参数可以包括业务量、性能指标、告警信息、链路状态信息及系统日志。其中,业务量主要为通信系统或通信网络中系统控制信息、路由选择信息、操作维护人员的联络信息等数据的传输。业务量与通信网络的信息处理能力相关,若当前网络中出现故障时,会影响网络的信息处理能力,进而会影响网络的业务量。网络的性能指标用于衡量网络性能,包括速率、带宽、延迟、丢包率、网络带宽积、吞吐率等性能。网络告警信息即通信网络系统中出现故障时触发的告警信息。链路状态信息包括网络中所有设备之间的链路接口的网络地址、子网掩码、网络类型、链路的开销以及链路上所有的相邻路由器的地址信息等。系统日志中记录了网络中所有设备的运行信息。其中,上述几种网络性能参数都与网络的运行相关,当网络中的网元出现故障时,会引起以上任意个网络性能参数出现异常信息。
S202:从存储的所述网络的多个性能参数中识别目标异常信息。
当网络中的某个网元出现故障时,会导致网络的某些性能参数异常。示例性的,当网络中某个服务网关设备出现故障时,会导致与该服务网关相关的链路状态信息出现异常,导致当前网络的链路状态信息传输失败率为20%,超过了10%的偏差范围,因此将链路状态信息传输失败率为20%的链路状态信息作为目标异常信息。因此,可以通过从存储的网络的多个性能参数中识别目标异常信息,初步判断网络已经出现了故障以及网络性能参数的异常情况。
S203:根据所述目标异常信息确定目标异常性能参数,并根据所述目标异常信息从存储的所述所有网元的告警信息中确定目标网元类型。
在本实施例中,当确定了链路状态信息传输失败率为20%的链路状态信息作为目标异常信息时,可以根据目标异常信息的性能参数种类确定目标异常性能参数为链路状态信息,即当前网络中的链路状态信息出现了异常。并且可根据链路状态信息传输失败率为20%的目标异常信息以及根据存储的所述所有网元的告警信息确定出现故障的目标网元类型。可选的,网元类型可以包括网络节点、服务网关、交换机、防火墙以及域名解析服务器。示例性的,当确定链路状态信息传输失败率为20%的目标异常信息时,获取目标异常信息的触发时间,并根据目标异常信息的触发时间从存储的所述所有网元的告警信息中确定目标网元类型,其中目标网元类型出现告警信息的时间与目标异常信息的触发时间一致。例如,确定目标异常信息的触发时间为2016年5月16日00:00时,同时服务网关出现了告警信息,则确定目标网元类型为服务网关,即可以确定是网络中某一个服务网关设备出现了故障生成了告警信息。
S204:从所述目标异常性能参数中获取所述目标网元类型的对应的目标性能参数,并将所述目标性能参数发送至用户终端,以使用户根据所述目标性能参数定位故障网元。
本实施例中,已经确定了目标异常性能参数以及目标网元类型,则可以在所述目标异常性能参数中获取所述目标网元类型的对应的目标性能参数。示例性的,目标异常性能参数为链路状态信息,目标网元类型为服务网关,则可以将链路状态信息中与服务网关相关的所有链路状态信息作为目标性能参数。如表1所示,表1中获取了所有服务网关设备的链路状态信息,则网运维人员可快速的定位是服务网关设备ID为0003的服务网关设备出现了故障,并根据该网关设备的具体的设备性能确定故障的原因。
表1
Figure BDA0002676114020000071
示例性的,如表2所示,查看该网关设备的吞吐率,发现该服务网关设备出现了丢、错包的故障。其中,目标性能参数一方面定位了出现故障的网元设备类型,一方面确定了由于网元故障引发的网络性能参数异常。网络运维人员可以通过目标性能参数快速的定位出现故障的网元位置,并对出现故障的网元设备进行分析,及时发现故障的根本原因。
表2
Figure BDA0002676114020000072
Figure BDA0002676114020000081
本从上述实施例可知,通过持续监测网络多个性能参数以及网络中所有网元的告警信息,从网络的多个性能参数中识别目标异常信息,并根据目标异常信息确定出现故障的目标网元类型以及出现故障的目标异常性能参数,并从所述目标异常性能参数中获取所述目标网元类型的对应的目标性能参数,使得网络运维人员可以通过目标性能参数定位故障网元。通过获取目标网元类型的对应的目标性能参数,使得运维人员根据目标性能参数定位故障网元,缩小了定位故障网元需要处理的数据范围,减少了数据分析的工作量,提高了运维人员进行故障定位的效率以及故障定位方法的准确性。
图3为本发明实施例提供的网络故障定位方法流程图二。如图3所示,网络故障定位方法具体包括以下步骤:
S301:按照第一预设时间间隔监测并存储网络的多个性能参数,按照第二预设时间间隔监测并存储所有网元的告警信息。
本步骤与图2实施例中的S201描述的方法一致,在此不再赘述。
S302:根据所述多个性能参数及所述所有网元的告警信息按照时间顺序生成时序图。
图4为本发明实施例提供的网络故障定位方法时序图。如图4所示,根据存储的多个性能参数以及所有网元的告警信息按照时间顺序生成时序图。网元出现故障时,同时会影响相临网元以及网络的一些性能参数出现异常信息。因此,根据时序图可以直观的分析出所有网元的告警信息以及网络多个性能参数之间的关系。
S303:根据所述时序图识别目标异常信息,其中所述目标异常信息为性能参数中超过预设误差阈值的性能参数。
在本实施例中若网络性能参数出现了偏差但是属于误差允许的范围内时,认为当前网路的性能参数没有出现异常。但是当网络的性能参数中超过预设误差阈值时,可认为当前网络的性能影响了网络的正常运行,需要及时对网络的故障进行定位并及时恢复。示例性的,设定链路状态的失败率的预设误差阈值为10%,当链路状态的失败率超过10%时,可认为当前链路状态信息出现了异常信息。可选的,若同时出现两种或两种以上的性能参数超过预设误差阈值,则按照所述业务量、所述性能指标、所述告警信息、所述链路状态信息及所述系统日志的优先级顺序,将优先级最高的超过预设误差阈值的性能参数确定为目标异常信息。
S304:根据所述目标异常信息确定目标异常性能参数。
本步骤与图2实施例中的S203描述的方法一致,在此不再赘述。
S305:根据所述时序图获取出现目标异常信息的故障时间点。
本实施例中,依据时序图进行分析,将出现目标异常信息的时间点作为故障时间点。示例性的,若目标异常信息的触发时间为2016年5月16日00:00时,则确定故障时间点为2016年5月16日00:00时。
S306:根据所述故障时间点从所述所有网元的告警信息中确定目标告警信息。
图5为本发明实施例提供的网络故障定位方法的鱼骨分析图。如图5所示,根据故障时间点以及所述所有网元的告警信息生成鱼骨图,并根据所述鱼骨图确定由网络故障触发的目标告警信息。
S307:根据所述目标告警信息确定目标网元类型。
本实施例中,根据目标告警信息确定出现故障的目标网元类型。
S308:从所述目标异常性能参数中获取所述目标网元类型的对应的目标性能参数,并将所述目标性能参数发送至用户终端,以使用户根据所述目标性能参数定位故障网元。
本步骤与图2实施例中的S204描述的方法一致,在此不再赘述。
从上述实施例可知,通过根据所述多个性能参数及所述所有网元的告警信息按照时间顺序生成时序图,并根据所述时序图识别目标异常信息以及出现目标异常信息的故障时间点,根据所述故障时间点从所述所有网元的告警信息中确定目标告警信息及目标网元类型,再从所述目标异常性能参数中获取所述目标网元类型的对应的目标性能参数,便于用户根据目标性能参数定位故障网元。通过生成时序图可以直观的分析出所有网元的告警信息以及网络多个性能参数之间的关系,并根据时序图获得目标性能参数,使得网络运维人员根据目标性能参数定位故障网元,缩小了定位故障网元需要处理的数据范围,减少了数据分析的工作量,提高了运维人员进行故障定位的效率以及故障定位方法的准确性。
图6为本发明实施例提供的网络故障定位方法流程图三。如图6所示,在图2实施例的基础上,在S204之后,所述网络故障定位方法还包括以下步骤:
S601:接收用户终端发送的故障网元信息。
运维人员根据目标性能参数定位故障网元之后,将定位的故障网元信息返回给服务器,使得服务器额可以根据定位的出现故障的网元及时进行修复。
S602:若所述目标异常性能参数中包含紧急性能参数,则将所述故障网元进行紧急故障处理,其中所述紧急故障处理包括脱机或重启,所述紧急性能参数为所述业务量及所述性能指标中的至少一种。
当目标异常性能参数中包含紧急性能参数时,说明当前网元的故障已经严重影响了网络的正常运行,需要及时停止网络的运行,将故障的影响减小到最小。示例性的,可以对出现故障的网元及时进行脱机或重启,停止故障网元的运行。可选的,紧急性能参数为业务量或者性能指标中的至少一种。
S603:若所述异常性能参数中未包含紧急性能参数,则将所述故障网元进行故障修复,其中所述故障修复包括对所述故障网元的端口及传输线路进行检查或硬件更换。
当目标异常性能参数中未包含紧急性能参数时,说明当前网元的故障并未严重影响网络的运行,可在网络运行的同时对故障网元进行故障恢复。示例性的,可以对故障网元的端口及传输线路进行检查或硬件更换。
当目标异常性能参数中包含紧急性能参数时并进行紧急故障处理之后,若目标异常性能参数中不再包含紧急性能参数时,可以设置故障网元开机,并同时对故障网元进行故障恢复。
从上述实施例可知,若所述目标异常性能参数中包含紧急性能参数,则及时进行紧急故障处理,将故障的影响减小到最小;若所述异常性能参数中未包含紧急性能参数时,可在网络运行的同时对故障网元进行故障恢复。通过设置紧急性能参数标准,根据网络故障的具体情况进行针对性的恢复,不仅保证了网络的安全运行,还实现了在网络运行的同时对故障网元进行故障恢复,将网元故障的影响减小到最小。
图7为本发明实施例提供的网络故障定位装置的结构示意图。如图7所示,该网络故障定位装置70包括:存储模块701、确定模块702及发送模块703;其中,存储模块701,用于按照第一预设时间间隔监测并存储网络的多个性能参数,按照第二预设时间间隔监测并存储所有网元的告警信息;确定模块702,用于从存储的所述网络的多个性能参数中识别目标异常信息;根据所述目标异常信息确定目标异常性能参数,并根据所述目标异常信息从存储的所述所有网元的告警信息中确定目标网元类型;发送模块703,用于从所述目标异常性能参数中获取所述目标网元类型的对应的目标性能参数,并将所述目标性能参数发送至用户终端,以使用户根据所述目标性能参数定位故障网元。
在本实施例中,该网络故障定位装置可以采用上述图2所示实施例的方法,其技术方案及其技术效果相类似,此处不在赘述。
在本发明的一个实施例中,所述确定模块702具体还用于:根据所述多个性能参数及所述所有网元的告警信息按照时间顺序生成时序图;根据所述时序图识别目标异常信息,其中所述目标异常信息为性能参数中超过预设误差阈值的性能参数。
在本发明的一个实施例中,所述确定模块702具体还用于:根据所述时序图获取出现目标异常信息的故障时间点;根据所述故障时间点从所述所有网元的告警信息中确定目标告警信息;根据所述目标告警信息确定目标网元类型。
在本发明的一个实施例中,所述确定模块702具体还用于:所述性能参数包括业务量、性能指标、告警信息、链路状态信息及系统日志,若同时出现两种或两种以上的性能参数超过预设误差阈值,则按照所述业务量、所述性能指标、所述告警信息、所述链路状态信息及所述系统日志的优先级顺序,将优先级最高的超过预设误差阈值的性能参数确定为目标异常信息。
在本发明的一个实施例中,所述网络故障定位装置70还包括修复模块,其中所述修复模块具体用于:接收用户终端发送的故障网元信息;若所述目标异常性能参数中包含紧急性能参数,则将所述故障网元进行紧急故障处理,其中所述紧急故障处理包括脱机或重启,所述紧急性能参数为所述业务量及所述性能指标中的至少一种;若所述异常性能参数中未包含紧急性能参数,则将所述故障网元进行故障修复,其中所述故障修复包括对所述故障网元的端口及传输线路进行检查或硬件更换。
本实施例提供的装置,可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,本实施例此处不再赘述。
图8为本发明实施例提供的服务器结构示意图。如图8所示,本实施例的服务器80包括:处理器801、存储器802以及存储在所述存储器802中并可在所述处理器801上运行的计算机程序,所述处理器801执行所述计算机程序时实现如下步骤:按照第一预设时间间隔监测并存储网络的多个性能参数,按照第二预设时间间隔监测并存储所有网元的告警信息;从存储的所述网络的多个性能参数中识别目标异常信息;根据所述目标异常信息确定目标异常性能参数,并根据所述目标异常信息从存储的所述所有网元的告警信息中确定目标网元类型;从所述目标异常性能参数中获取所述目标网元类型的对应的目标性能参数,并将所述目标性能参数发送至用户终端,以使用户根据所述目标性能参数定位故障网元。
在一种可能的设计中,所述处理器801执行所述计算机程序时还实现如下步骤:根据所述多个性能参数及所述所有网元的告警信息按照时间顺序生成时序图;根据所述时序图识别目标异常信息,其中所述目标异常信息为性能参数中超过预设误差阈值的性能参数。
在一种可能的设计中,所述处理器801执行所述计算机程序时还实现如下步骤:根据所述时序图获取出现目标异常信息的故障时间点;根据所述故障时间点从所述所有网元的告警信息中确定目标告警信息;根据所述目标告警信息确定目标网元类型。
在一种可能的设计中,所述处理器801执行所述计算机程序时还实现如下步骤:所述性能参数包括业务量、性能指标、告警信息、链路状态信息及系统日志;若同时出现两种或两种以上的性能参数超过预设误差阈值,则按照所述业务量、所述性能指标、所述告警信息、所述链路状态信息及所述系统日志的优先级顺序,将优先级最高的超过预设误差阈值的性能参数确定为目标异常信息。
在一种可能的设计中,所述处理器801执行所述计算机程序时还实现如下步骤:接收用户终端发送的故障网元信息;若所述目标异常性能参数中包含紧急性能参数,则将所述故障网元进行紧急故障处理,其中所述紧急故障处理包括脱机或重启,所述紧急性能参数为所述业务量及所述性能指标中的至少一种;若所述异常性能参数中未包含紧急性能参数,则将所述故障网元进行故障修复,其中所述故障修复包括对所述故障网元的端口及传输线路进行检查或硬件更换。
具体可以参见前述方法实施例中的相关描述。
在一种可能的设计中,存储器802既可以是独立的,也可以跟处理器801集成在一起。
当存储器802独立设置时,该服务器还包括总线803,用于连接所述存储器802和处理器801。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上所述的网络故障定位的方法。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。上述模块成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器执行本申请各个实施例所述方法的部分步骤。
应理解,上述处理器可以是中央处理单元(Central Processing Unit,简称CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。
总线可以是工业标准体系结构(Industry Standard Architecture,简称ISA)总线、外部设备互连(Peripheral Component Interconnect,简称PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,简称EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(Application Specific Integrated Circuits,简称ASIC)中。当然,处理器和存储介质也可以作为分立组件存在于电子设备或主控设备中。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种网络故障定位方法,其特征在于,包括:
按照第一预设时间间隔监测并存储网络的多个性能参数,按照第二预设时间间隔监测并存储所有网元的告警信息;
从存储的所述网络的多个性能参数中识别目标异常信息;
根据所述目标异常信息确定目标异常性能参数,并根据所述目标异常信息从存储的所述所有网元的告警信息中确定目标网元类型;
从所述目标异常性能参数中获取所述目标网元类型的对应的目标性能参数,并将所述目标性能参数发送至用户终端,以使用户根据所述目标性能参数定位故障网元。
2.根据权利要求1所述的方法,其特征在于,所述从存储的所述网络的多个性能参数中识别目标异常信息,包括:
根据所述多个性能参数及所述所有网元的告警信息按照时间顺序生成时序图;
根据所述时序图识别目标异常信息,其中所述目标异常信息为性能参数中超过预设误差阈值的性能参数。
3.根据权利要求2所述的方法,其特征在于,所述根据所述目标异常信息从存储的所述所有网元的告警信息中确定目标网元类型,包括:
根据所述时序图获取出现目标异常信息的故障时间点;
根据所述故障时间点从所述所有网元的告警信息中确定目标告警信息;
根据所述目标告警信息确定目标网元类型。
4.根据权利要求2所述的方法,其特征在于,所述性能参数包括业务量、性能指标、告警信息、链路状态信息及系统日志;
相应地,所述根据所述时序图识别目标异常信息,包括:
若同时出现两种或两种以上的性能参数超过预设误差阈值,则按照所述业务量、所述性能指标、所述告警信息、所述链路状态信息及所述系统日志的优先级顺序,将优先级最高的超过预设误差阈值的性能参数确定为目标异常信息。
5.根据权利要求4所述的方法,其特征在于,在所述将所述目标性能参数发送至用户终端,以使用户根据所述目标性能参数定位故障网元之后,还包括:
接收用户终端发送的故障网元信息;
若所述目标异常性能参数中包含紧急性能参数,则将所述故障网元进行紧急故障处理,其中所述紧急故障处理包括脱机或重启,所述紧急性能参数为所述业务量及所述性能指标中的至少一种;
若所述异常性能参数中未包含紧急性能参数,则将所述故障网元进行故障修复,其中所述故障修复包括对所述故障网元的端口及传输线路进行检查或硬件更换。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述网元类型包括网络节点、服务网关、交换机、防火墙以及域名解析服务器。
7.一种服务器,其特征在于,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如下步骤:
按照第一预设时间间隔监测并存储网络的多个性能参数,按照第二预设时间间隔监测并存储所有网元的告警信息;
从存储的所述网络的多个性能参数中识别目标异常信息;
根据所述目标异常信息确定目标异常性能参数,并根据所述目标异常信息从存储的所述所有网元的告警信息中确定目标网元类型;
从所述目标异常性能参数中获取所述目标网元类型的对应的目标性能参数,并将所述目标性能参数发送至用户终端,以使用户根据所述目标性能参数定位故障网元。
8.根据权利要求7所述的服务器,其特征在于,所述处理器执行所述计算机程序时还实现如下步骤:
根据所述多个性能参数及所述所有网元的告警信息按照时间顺序生成时序图;
根据所述时序图识别目标异常信息,其中所述目标异常信息为性能参数中超过预设误差阈值的性能参数。
9.根据权利要求8所述的服务器,其特征在于,所述处理器执行所述计算机程序时还实现如下步骤:
根据所述时序图获取出现目标异常信息的故障时间点;
根据所述故障时间点从所述所有网元的告警信息中确定目标告警信息;
根据所述目标告警信息确定目标网元类型。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1至6任一项所述的网络故障定位方法。
CN202010948513.0A 2020-09-10 2020-09-10 网络故障定位方法及服务器 Active CN114172794B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010948513.0A CN114172794B (zh) 2020-09-10 2020-09-10 网络故障定位方法及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010948513.0A CN114172794B (zh) 2020-09-10 2020-09-10 网络故障定位方法及服务器

Publications (2)

Publication Number Publication Date
CN114172794A true CN114172794A (zh) 2022-03-11
CN114172794B CN114172794B (zh) 2024-02-13

Family

ID=80475655

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010948513.0A Active CN114172794B (zh) 2020-09-10 2020-09-10 网络故障定位方法及服务器

Country Status (1)

Country Link
CN (1) CN114172794B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114710798A (zh) * 2022-04-19 2022-07-05 中国联合网络通信集团有限公司 一种故障定位方法及装置
CN115134210A (zh) * 2022-05-30 2022-09-30 国网河北省电力有限公司沧州供电分公司 电力通信缺陷故障处理分析方法
CN115174357A (zh) * 2022-09-07 2022-10-11 浪潮通信信息系统有限公司 网络故障定位方法及系统
CN115766400A (zh) * 2022-12-26 2023-03-07 海南电网有限责任公司信息通信分公司 模型驱动和数据驱动相结合的链路故障诊断方法
CN115801561A (zh) * 2022-12-27 2023-03-14 中国联合网络通信集团有限公司 物联网故障处理方法、装置、设备及存储介质
CN116132253A (zh) * 2022-12-27 2023-05-16 中国联合网络通信集团有限公司 故障处理方法、装置及存储介质
CN116708135A (zh) * 2023-08-08 2023-09-05 中国电信股份有限公司 网络业务故障监测方法、装置、电子设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009129841A1 (en) * 2008-04-21 2009-10-29 Telefonaktiebolaget L M Ericsson (Publ) Method and system for network fault management
CN106603317A (zh) * 2017-02-20 2017-04-26 山东浪潮商用系统有限公司 一种基于数据挖掘技术的告警监控策略的分析方法
CN107509213A (zh) * 2016-06-14 2017-12-22 中国联合网络通信集团有限公司 通讯网络故障网元定位的方法及系统
WO2018066041A1 (ja) * 2016-10-03 2018-04-12 富士通株式会社 性能異常検出装置、性能異常検出方法、及び性能異常検出プログラム
CN108206757A (zh) * 2016-12-20 2018-06-26 中国移动通信集团广东有限公司 无线传输故障告警处理方法及装置
CN108696371A (zh) * 2017-04-06 2018-10-23 中国移动通信集团广东有限公司 网络故障确定方法及系统
CN110380907A (zh) * 2019-07-26 2019-10-25 京信通信系统(中国)有限公司 一种网络故障诊断方法、装置、网络设备及存储介质
CN110752938A (zh) * 2018-07-23 2020-02-04 中国移动通信集团广东有限公司 一种volte业务的故障智能定位方法和系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009129841A1 (en) * 2008-04-21 2009-10-29 Telefonaktiebolaget L M Ericsson (Publ) Method and system for network fault management
CN107509213A (zh) * 2016-06-14 2017-12-22 中国联合网络通信集团有限公司 通讯网络故障网元定位的方法及系统
WO2018066041A1 (ja) * 2016-10-03 2018-04-12 富士通株式会社 性能異常検出装置、性能異常検出方法、及び性能異常検出プログラム
CN108206757A (zh) * 2016-12-20 2018-06-26 中国移动通信集团广东有限公司 无线传输故障告警处理方法及装置
CN106603317A (zh) * 2017-02-20 2017-04-26 山东浪潮商用系统有限公司 一种基于数据挖掘技术的告警监控策略的分析方法
CN108696371A (zh) * 2017-04-06 2018-10-23 中国移动通信集团广东有限公司 网络故障确定方法及系统
CN110752938A (zh) * 2018-07-23 2020-02-04 中国移动通信集团广东有限公司 一种volte业务的故障智能定位方法和系统
CN110380907A (zh) * 2019-07-26 2019-10-25 京信通信系统(中国)有限公司 一种网络故障诊断方法、装置、网络设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ASAD M. MADNI: "Smart configurable wireless sensors and actuators for industrial monitoring and control", 《2008 3RD INTERNATIONAL SYMPOSIUM ON COMMUNICATIONS, CONTROL AND SIGNAL PROCESSING》 *
王海波;: "基于无线传感器网络的配电网线路故障定位方案研究", 科技创新与应用, no. 35 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114710798A (zh) * 2022-04-19 2022-07-05 中国联合网络通信集团有限公司 一种故障定位方法及装置
CN114710798B (zh) * 2022-04-19 2024-04-19 中国联合网络通信集团有限公司 一种故障定位方法及装置
CN115134210A (zh) * 2022-05-30 2022-09-30 国网河北省电力有限公司沧州供电分公司 电力通信缺陷故障处理分析方法
CN115174357A (zh) * 2022-09-07 2022-10-11 浪潮通信信息系统有限公司 网络故障定位方法及系统
CN115174357B (zh) * 2022-09-07 2022-12-13 浪潮通信信息系统有限公司 网络故障定位方法及系统
CN115766400A (zh) * 2022-12-26 2023-03-07 海南电网有限责任公司信息通信分公司 模型驱动和数据驱动相结合的链路故障诊断方法
CN115801561A (zh) * 2022-12-27 2023-03-14 中国联合网络通信集团有限公司 物联网故障处理方法、装置、设备及存储介质
CN116132253A (zh) * 2022-12-27 2023-05-16 中国联合网络通信集团有限公司 故障处理方法、装置及存储介质
CN116708135A (zh) * 2023-08-08 2023-09-05 中国电信股份有限公司 网络业务故障监测方法、装置、电子设备及存储介质
CN116708135B (zh) * 2023-08-08 2023-11-07 中国电信股份有限公司 网络业务故障监测方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN114172794B (zh) 2024-02-13

Similar Documents

Publication Publication Date Title
CN114172794B (zh) 网络故障定位方法及服务器
CN111371740B (zh) 一种报文流量监控方法、系统及电子设备
CN113708995A (zh) 一种网络故障诊断方法、系统、电子设备及存储介质
CN109688242B (zh) 一种云防护系统及方法
CN114363151A (zh) 故障检测方法和装置、电子设备和存储介质
CN112003747A (zh) 云虚拟网关的故障定位方法
CN114598506B (zh) 工控网络安全风险溯源方法、装置、电子设备及存储介质
CN109981377B (zh) 一种分布式数据中心链路监控方法及系统
CN110943864B (zh) 分布式存储系统的网络异常定位方法及装置
JP2014147066A (ja) データネットワーク通信において冗長性を提供する方法およびシステム
CN112104523B (zh) 流量透传的检测方法、装置、设备及存储介质
CN113162815A (zh) 一种流量切换方法、系统、设备及介质
CN116708129A (zh) 一种链路故障检测与快速恢复的方法、装置及存储介质
Falahati et al. Faults and failures in cyber-power interdependent networks
US10181997B2 (en) Methods, systems and computer readable media for providing receive port resiliency in a network equipment test device
US10237122B2 (en) Methods, systems, and computer readable media for providing high availability support at a bypass switch
CN113132140B (zh) 一种网络故障检测方法、装置、设备及存储介质
CN112448828A (zh) Ip承载网中ce路由器的高可用实现方法及装置
TWI711285B (zh) 網路故障偵測方法以及網路故障偵測裝置
KR100623554B1 (ko) 인터넷서비스 생존성 확보를 위한 dns/dhcp 서버침입감내기술
CN114244682B (zh) 一种设备告警丢失补漏方法及装置
CN117255005B (zh) 一种基于cdn的业务告警处理方法、装置、设备及介质
CN114513398B (zh) 网络设备告警处理方法、装置、设备及存储介质
CN116781480A (zh) 故障根因分析方法、装置以及相关设备
CN115987894A (zh) 一种同向拥塞场景的自动检测及处理的方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant