CN115733726A - 网络群障确定方法、装置、存储介质及电子装置 - Google Patents

网络群障确定方法、装置、存储介质及电子装置 Download PDF

Info

Publication number
CN115733726A
CN115733726A CN202111017361.3A CN202111017361A CN115733726A CN 115733726 A CN115733726 A CN 115733726A CN 202111017361 A CN202111017361 A CN 202111017361A CN 115733726 A CN115733726 A CN 115733726A
Authority
CN
China
Prior art keywords
fault
service
network
group
network group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111017361.3A
Other languages
English (en)
Inventor
郭文婷
杨帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN202111017361.3A priority Critical patent/CN115733726A/zh
Publication of CN115733726A publication Critical patent/CN115733726A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明实施例提供了一种网络群障确定方法、装置、存储介质及电子装置。该方法包括:对网络业务的业务质量进行监测以确定是否出现网络群障;对出现网络群障的多条群障业务进行共路由分析以定位业务共障点;对经过所述业务共障点的群障业务进行故障诊断以确定所述网络群障的故障原因。在本发明中,可通过监测业务质量来及时发现网络群障,并通过共路由分析和诊断分析,能够快速、准确的定位出共障点和找出引起网络群障的共性故障原因,从而解决相关技术中由人工诊断分析网络群障所导致的效率低、维护成本高以及业务恢复时间长的问题,达到提高网络群障定位效率以及降低网络群障维护成本的效果。

Description

网络群障确定方法、装置、存储介质及电子装置
技术领域
本发明实施例涉及通信技术领域,具体而言,涉及一种网络群障确定方法、装置、存储介质及电子装置。
背景技术
电信网络在运行中有时会出现故障,而且在同一时间(比如几分钟)内可能出现影响多个用户正常通信的电信网络故障,称之为群障。网络故障和群障会影响网络的正常运行,造成用户业务质量下降甚至中断,对网络运营、客户体验造成负面影响。所以及时发现和处理网络故障,特别是群障,是电信网络运维中非常重要的工作。
但是由于网络故障的复杂性,及时发现和快速分析处理一直是网络运维人员面临的难题。对于提供网络设备和服务的厂商而言,也是重要的挑战。因此,明确定义网络群障并提出具体的群障定位分析需求,改革故障及群障的分析效率和体验,是提升网管系统竞争力的一个关键内容。
目前,在网管系统的现有技术中网络群障诊断方法,是在网管中人工地对发生故障的多条业务进行逐一分析。这种操作方式定位效率低、维护成本高、业务恢复时间长,无法快速找到网络共障点,直接影响用户满意度。
发明内容
本发明实施例提供了一种网络群障确定方法、装置、存储介质及电子装置,以至少解决相关技术中网络群障诊断时,人工对发生故障的多条业务进行逐一分析,导致网络群障定位效率低维护成本高、业务恢复时间长的问题。
根据本发明的一个实施例,提供了一种网络群障确定方法,包括:对网络业务的业务质量进行监测以确定是否出现网络群障;对出现网络群障的多条群障业务进行共路由分析以定位业务共障点;对经过所述业务共障点的群障业务进行故障诊断以确定所述网络群障的故障原因。
在一个示例性实施例中,对网络业务的业务质量进行监测以确定是否出现网络群障,包括:设置网络业务的监控策略;根据所述监控策略对网络业务的业务质量状态进行监控以确定是否出现网络群障。
在一个示例性实施例中,设置网络业务的监控策略至少包括以下之一:设置触发网络群障产生条件和触发网络群障消失条件,其中,所述触发网络群障产生条件为在预定时长内同时发生质量异常的业务数大于第一阈值,所述触发网络群障消失条件为在预定时长内同时发生质量异常的业务数小于第二阈值,所述第一阈值大于第二阈值;设置网络业务质量监控指标,其中,所述网络业务质量监控指标至少包括以下之一指标:丢包率、时延、中断。
在一个示例性实施例中,根据所述监控策略对网络业务的业务质量状态进行监控以确定是否出现网络群障,包括:基于业务质量监控指标确定网络业务的业务质量状态;根据网络业务的业务质量状态和触发网络群障产生条件确定是否出现网络群障。
在一个示例性实施例中,根据网络业务的业务质量状态和触发网络群障产生条件确定是否出现网络群障,包括:当多条网络业务的业务质量状态为质量异常,并且满足触发网络群障产生条件时,确定出现网络群障;当发生质量异常的网络业务满足触发网络群障消失条件时,确定所述网络群障消失。
在一个示例性实施例中,对出现网络群障的多条群障业务进行路由分析以定位业务共障点,包括:通过遍历多条群障业务和对应群障业务的故障点,计算每个群障业务故障点所经过业务数占所有发生群障业务的业务总数的比例,将占比达到阈值的公共链路和公共节点确定为所述业务共障点。
在一个示例性实施例中,对经过所述业务共障点的群障业务进行故障诊断以确定所述网络群障的故障原因,包括:选择一条或多条经过所述业务共障点的群障业务,并根据所述群障业务的业务质量状态区分不同场景,对该群障业务进行相应场景下的故障诊断,并将诊断结果作为网络群障的故障原因。
在一个示例性实施例中,在确定所述网络群障的故障原因之后,还包括:将网络群障诊断结果以图表形式进行展示,并将经过业务共障点的业务路由信息通过拓扑图的形式进行展示。
根据本发明的另一个实施例,提供了一种网络群障确定装置,包括:监测模块,用于对网络业务的业务质量进行监测以确定是否出现网络群障;定位模块,用于对出现网络群障的多条群障业务进行共路由分析以定位业务共障点;诊断模块,用于对经过所述业务共障点的群障业务进行故障诊断以确定所述网络群障的故障原因。
在一个示例性实施例中,所述监测模块包括:设置单元,用于设置网络业务的监控策略;确定单元,用于根据所述监控策略对网络业务的业务质量状态进行监控以确定是否出现网络群障。
在一个示例性实施例中,所述网络群障确定装置还包括:展示模块,用于将网络群障诊断结果以图表形式进行展示,并将经过业务共障点的业务路由信息通过拓扑图的形式进行展示。
根据本发明的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
在本发明上述实施例中,可通过监测业务质量来及时发现网络群障,并通过共路由分析和诊断分析,能够快速、准确的定位出共障点和找出引起网络群障的共性故障原因,从而解决相关技术中由人工诊断分析网络群障所导致的效率低、维护成本高以及业务恢复时间长的问题,达到提高网络群障定位效率以及降低网络群障维护成本的效果。
附图说明
图1是根据本发明实施例的所运行的计算机终端的硬件结构框图;
图2是根据本发明实施例的网络群障确定方法的流程图;
图3是根据本发明实施例的网络群障确定装置的结构框图;
图4是根据本发明另一实施例的网络群障确定装置的结构框图;
图5是根据本发明又一实施例的网络群障确定装置的结构框图;
图6是根据本发明实施例的网络群障确定方法的功能结构图;
图7是根据本发明实施例的业务质量监测功能实现的流程图;
图8是根据本发明实施例的业务群障定位功能的实现方式的流程图;
图9是根据本发明实施例的针对SPN场景的业务群障分析功能的实现方式的流程图;
图10是根据本发明实施例的展示群障分析报告的实现方式的流程图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明的实施例。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本申请实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例所运行的计算机终端的硬件结构框图。如图1所示,计算机终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器(Micro Control Unit,MCU)或可编程逻辑器件(FieldProgrammable Gate Array,FPGA)等的处理装置)和用于存储数据的存储器104,其中,上述计算机终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述计算机终端的结构造成限定。例如,计算机终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的网络群障确定方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
图2是根据本发明实施例的网络群障确定方法的流程图,如图2所示,该流程包括如下步骤:
步骤S202,对网络业务的业务质量进行监测以确定是否出现网络群障;
步骤S204,对出现网络群障的多条群障业务进行共路由分析以定位业务共障点;
步骤S206,对经过所述业务共障点的群障业务进行故障诊断以确定所述网络群障的故障原因。
在本实施例的步骤S202中,还可以包括:设置网络业务的监控策略;根据所述监控策略对网络业务的业务质量状态进行监控以确定是否出现网络群障
在本实施例中,设置网络业务的监控策略至少包括以下之一:设置触发网络群障产生条件和触发网络群障消失条件,其中,所述触发网络群障产生条件为在预定时长内同时发生质量异常的业务数大于第一阈值,所述触发网络群障消失条件为在预定时长内同时发生质量异常的业务数小于第二阈值,所述第一阈值大于第二阈值;设置网络业务质量监控指标,其中,所述网络业务质量监控指标至少包括以下之一指标:丢包率、时延、中断。
在本实施例中,根据所述监控策略对网络业务的业务质量状态进行监控以确定是否出现网络群障,包括:基于业务质量监控指标确定网络业务的业务质量状态;根据网络业务的业务质量状态和触发网络群障产生条件确定是否出现网络群障。
在本实施例中,根据网络业务的业务质量状态和触发网络群障产生条件确定是否出现网络群障,包括:当多条网络业务的业务质量状态为质量异常,并且满足触发网络群障产生条件时,确定出现网络群障;当发生质量异常的网络业务满足触发网络群障消失条件时,确定所述网络群障消失。
在本实施例的步骤S204中,还可以包括:通过遍历多条群障业务和对应群障业务的故障点,计算每个群障业务故障点所经过业务数占所有发生群障业务的业务总数的比例,将占比达到阈值的公共链路和公共节点确定为所述业务共障点。
在本实施例的步骤S206中,还可以包括:选择一条或多条经过所述业务共障点的群障业务,并根据所述群障业务的业务质量状态区分不同场景,对该群障业务进行相应场景下的故障诊断,并将诊断结果作为网络群障的故障原因。
在本实施例的步骤S206之后,还可以包括:将网络群障诊断结果以图表形式进行展示,并将经过业务共障点的业务路由信息通过拓扑图的形式进行展示。
通过本实施例的上述步骤,可通过监测业务质量来及时发现网络群障,并通过共路由分析和诊断分析,能够快速、准确的定位出共障点和找出引起网络群障的共性故障原因,从而解决相关技术中由人工诊断分析网络群障所导致的效率低、维护成本高以及业务恢复时间长的问题,达到提高网络群障定位效率以及降低网络群障维护成本的效果。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器/随机存取存储器(Read-Only Memory/Random Access Memory,ROM/RAM)、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
图3是根据本发明实施例的网络群障确定装置的结构框图,如图3所示,该装置包括监测模块10、定位模块20和诊断模块30。
监测模块10,用于对网络业务的业务质量进行监测以确定是否出现网络群障。
定位模块20,用于对出现网络群障的多条群障业务进行共路由分析以定位业务共障点。
诊断模块30,用于对经过所述业务共障点的群障业务进行故障诊断以确定所述网络群障的故障原因。
通过本实施例的提供的网络群障确定装置,可对网络业务质量进行监测来及时发现网络群障,并通过共路由分析和诊断分析,能够快速、准确的定位出共障点和找出引起网络群障的共性故障原因,从而解决相关技术中由人工诊断分析网络群障所导致的效率低、维护成本高以及业务恢复时间长的问题,达到提高网络群障定位效率以及降低网络群障维护成本的效果。
图4是根据本发明另一实施例的网络群障确定装置的结构框图,如图4所示,该网络群障确定装置除包括图3所示的所有模块外,所述监测模块10还进一步包括设置单元11和确定单元12。
设置单元11,用于设置网络业务的监控策略。
确定单元12,用于根据所述监控策略对网络业务的业务质量状态进行监控以确定是否出现网络群障。
图5是根据本发明又一实施例的网络群障确定装置的结构框图,如图5所示,该网络群障确定装置除包括图4所示的所有模块外,还包括:展示模块40,用于将网络群障诊断结果以图表形式进行展示,并将经过业务共障点的业务路由信息通过拓扑图的形式进行展示。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
为了便于对本发明所提供的技术方案的理解,下面将结合具体场景的实施例进行详细描述。
本发明实施例提供一种网络群障确定方法,在本发明实施例中,监测业务质量发现网络业务群障,对出现群障的多条业务进行共路由分析找到业务共障点,再对群障业务进行诊断分析找出引起网络群障的共性故障原因,最终将群障分析结果报告(例如,可包括群障原因、处理建议、业务拓扑路由等)展示出来,可以克服现有技术中网络群障定位分析效率低、业务恢复时间长、用户满意度低的问题,实现了网络群障的智能分析,可以快速准确地对出现群障的网络进行共障点定位和诊断分析,有效提升了网络群障定位分析的准确性和效率。
图6是根据本发明实施例的网络群障确定方法的功能结构图,如图6所示,在本实施例中网络群障确定方法在实现功能上可划分为四部分,包括:业务质量监测、业务群障定位、业务群障分析、分析结果展示。
下面对这四部分功能进行具体的说明。
1.业务质量监测包括:监控策略设置、业务质量感知和监控业务质量。
1.1监控策略设置是指设置触发群障产生条件以及触发群障消失条件。触发群障产生条件可以为在XX时间内同时发生故障的业务条数大于Y条,触发群障消失条件可以为发生故障的业务条数小于Z条(其中Z小于Y)。监控策略设置还包括网络业务质量监控指标的设置,可以设置判定业务产生质量异常的指标。
1.2业务质量感知是指利用业务检测手段自动对业务进行检测,并通过对检测结果的分析,给出业务质量状态(例如,正常、丢包、时延、中断)以及业务故障点。
1.3监控业务质量是指根据监控策略,自动监控业务质量状态的变化,在满足群障产生条件时自动产生一条群障分析记录,并触发群障定位分析。在满足群障消失条件时触发更新群障分析记录里的群障消失时间等信息。
2.业务群障定位,是指对出现群障的多条业务进行共路由分析,找到业务共障点。在本实施例中,共路由分析方法可以为:通过遍历该次群障里的多条业务和对应业务故障点,计算每个业务故障点所经过业务数占群障总业务数的百分比,找出百分比最高(例如,前三高)的公共链路和公共节点,即为业务共障点。
3.业务群障分析,是指利用诊断手段对群障业务做进一步的自动诊断分析,找出导致业务群障的共性故障原因。在业务群障定位结果里挑选一条业务,挑选规则可以是同时经过最高百分比公共链路和公共节点的业务,如果存在多条这样的业务,那么可以随机选择一条;按照这条业务的质量状态(例如,丢包、时延、中断),区分不同场景对该业务进行自动诊断分析,并按照诊断分析结果给出解决建议。
4.分析结果展示,是指将群障分析结果(例如,包括各业务共障点影响业务情况、群障原因、处理建议等信息)以图表形式展示在前端界面上,并通过拓扑图的形式,将经过业务共障点的业务路由信息展示出来。
下面对本发明上述实施例中的业务质量监测功能进行详细说明,图7是根据本发明实施例的业务质量监测功能实现的流程图,下面以承载网络切片分组网(SlicingPacket Network,SPN)场景为例进行详细说明。如图7所示,该业务质量监测功能的实现可包括如下步骤:
步骤S701:设置业务监控策略,包括触发群障产生条件和触发群障消失条件。在本实施例中,触发群障产生条件可默认值为X分钟内同时发生故障的业务数大于Y条,X默认值可为5分钟,Y默认值可为30条。触发群障消失条件默认值可为发生故障的业务条数小于Z条(Z要小于Y),Z默认值可为5。设置业务监控策略还包括业务质量监控指标的设置,业务质量监控指标可以是判定业务发生丢包、时延、中断等质量异常的指标。例如丢包率达到百分之XX(默认值可为20)以上可判定为业务发生丢包,时延超过YY(默认值可为10000)纳秒可判定为业务发生时延,丢包率达到百分之ZZ(默认值可为100)可判定为业务发生中断。
步骤S702:根据步骤S701里的业务监控策略启动监控任务,可以5秒为偏移量,定时统计X分钟时间窗口内发生故障的业务总数;
步骤S703:通过例如带内操作维护管理(Operation Administration andMaintenance,OAM)检测手段,对SPN网络业务自动进行逐跳检测;根据检测结果定位出有异常的节点以及链路,并根据步骤S701中设置的质量监控指标计算得到业务质量状态(例如,正常、丢包、时延、中断);将业务质量状态异常(丢包、时延、中断)的业务信息(包括业务ID、业务质量状态)和业务故障点(包括异常节点、异常链路)以通知形式传递给步骤S702中的业务监控任务,并把异常业务信息存储在数据库中。如果本次检测业务质量状态为正常,并且在数据库中可以查询到上一次检测结果为异常,那么就将这条恢复正常状态的业务也以通知形式传递给业务监控任务,并删除数据库中的相关记录。
步骤S704:判断在步骤S701设置的X分钟时间窗口内收到的质量异常业务数量是否超过了Y条,如果超过了,那么认为满足群障产生条件,后台自动生成一条群障分析记录A保存在数据库中(例如,可包括群障产生时间、群障类型、该条群障对应的所有异常业务、业务故障点、业务质量状态等信息),并触发群障自动定位分析处理。如果未超过,继续按5秒偏移量进行等待;遍历该群障A对应的所有异常业务的质量状态,可将最严重的质量状态作为群障类型(例如,中断>时延>丢包)。
步骤S705:判断群障分析记录A对应的异常业务是否恢复正常,计算剩余的异常业务数量是否小于Z条;如果小于Z条,那么认为满足群障消失条件,后台自动更新群障分析记录A里的消失时间。
需说明的是,本实施例仅举例说明了承载网络SPN场景业务质量监测的其中一种实现方式,本发明中的业务质量监测不限于这一种业务质量监测实现方式。例如,在本实施例的步骤S703里还可以通过Ping、Twamp检测等方式来监测业务质量是否正常。具体来说,对业务进行因特网包探测器(Packet Internet Groper,Ping)检测,可以发现业务是否有丢包、中断的质量异常。对业务进行双向主动测试协议(Two Way Active MeasurementProtocol,Twamp)检测,可以发现业务是否有时延、中断的质量异常。
下面对本发明上述实施例中的业务群障定位功能的实现进行详细说明,图8是根据本发明实施例的业务群障定位功能的实现方式的流程图,如图8所示,该业务群障定位功能的实现可可包括如下步骤:
步骤S801:取出群障分析记录A里的所有异常业务数据B及对应业务故障点数据C,遍历B和C,统计C中每个业务故障点所经过业务的数量,通过公式“经过业务数/总业务数*100%”,计算出每个业务故障点经过业务数所占百分比;
步骤S802:根据步骤S801中计算的每个业务故障点经过业务数所占百分比,统计出前三高的公共链路和公共节点,即为业务共障点;
步骤S803:将步骤S802中查找到的业务共障点保存在群障分析记录A的信息中,并存储到数据库里。
需说明的是,本实施例仅举例说明了定位业务共障点其中一种实现方式,本发明实施例中的业务群障定位不限于这一种实现方式。例如,在本实施例的步骤S801中,还可以遍历所有异常业务经过的全部链路和节点数据,统计每个链路和节点经过的业务条数;计算出每个链路和节点所经过业务数所占百分比,并统计出前三高的公共链路和公共节点,这些链路和节点也可以视为业务共障点。
下面对本发明上述实施例中的业务群障分析功能的实现方式进行详细说明,图9是根据本发明实施例的针对SPN场景的业务群障分析功能的实现方式的流程图,如图9所示,该业务群障分析功能的实现方式可包括如下步骤:
步骤S901:在群障分析记录A的所有异常业务中,查找同时经过最高百分比公共链路和公共节点的业务,如果找到多条满足条件的业务,那么随机选择一条作为诊断分析的业务;
步骤S902:判断步骤S901中查找到的业务的质量状态,如果是丢包或时延,那么对业务进行告警检测;对于丢包状态,那么判断该业务是否存在光功率越限告警、单板温度越限告警、关键芯片错误告警、循环冗余校验(Cyclic Redundancy Check,CRC)误码越限告警;对于时延状态,那么判断该业务是否存在带宽利用率越限告警、队列丢包越限告警;
步骤S903:如果步骤S901中查找到的业务的质量状态为中断,那么先对业务进行告警检测;查找该条业务中故障节点和故障链路的告警数据,判断是否存在影响业务的严重告警,比如端口DOWN告警、信号丢失(Loss Of signal,LOS)告警等;
步骤S904:对于质量状态为中断的业务,还需要对业务配置进行检查;业务配置检查主要是灵活以太网配置的一致性检查,包括灵活以太网组的源宿两端的GroupNumber以及成员个数是否一致、成员端口的PhyNumber是否一致、协商模式是否一致;
步骤S905:根据步骤S902中告警检测的结果,可以找到业务质量劣化的疑似原因,并给出解决建议;如果存在光功率越限告警,那么故障原因为光模块故障,解决建议为需要更换光模块;如果存在带宽利用率越限告警;那么故障原因是业务带宽已达到或超过了业务设定的带宽,解决建议为需要扩容;如果存在单板越限告警,那么故障原因是机房温度高或风扇转速低,解决建议为清洗防尘网或调高风扇转速;如果存在关键芯片故障告警,那么故障原因是线卡可能存在故障,解决建议是更换线卡;
根据步骤S903中告警检测的结果,可以找到业务中断的疑似原因,并给出解决建议;如果存在LOS告警,那么故障原因为光纤中断,解决建议为更换或修改光纤;如果存在端口DOWN告警,那么故障原因为端口DOWN,解决建议为将端口UP;
根据步骤S904中配置检测的结果,可以找到业务中断的疑似原因,并给出解决建议;如果灵活以太网组的源宿两端的GroupNumber不一致,此即为故障原因,解决建议是修改配置,将GroupNumber改为一致;如果灵活以太网组的源宿两端的成员个数不一致,那么此即为故障原因,解决建议也是修改配置,将成员个数改为一致。
步骤S906:将步骤S905中分析得出的故障原因和解决建议,更新到群障分析记录A的信息里,并存储在数据库中。
下面对本发明上述实施例中的群障分析报告功能的实现方式进行详细说明,图10是根据本发明实施例的展示群障分析报告的实现方式的流程图,如图10所示,该展示方式包括如下步骤:
步骤S1001:在网管系统前端界面上以表格形式展示群障分析记录,包括群障发生时间、群障类型、影响业务数量、疑似故障原因、解决建议、群障消失时间等;并以指示灯形式展示出当前存在的各类型(例如,丢包、时延、中断)的群障数量;
步骤S1002:在前端界面上以拓扑图的形式,将经过业务共障点的业务路由信息展示出来,并在拓扑图中以颜色标识出业务共障点(可包括链路和节点);
步骤S1003:在前端界面上以柱状图的形式,将所经过业务数占比统计前三高的业务共障点信息展示出来(例如,横轴表示业务共障点,纵轴表示所经过业务数)。
本发明的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述计算机可读存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (13)

1.一种网络群障确定方法,其特征在于,包括:
对网络业务的业务质量进行监测以确定是否出现网络群障;
对出现网络群障的多条群障业务进行共路由分析以定位业务共障点;
对经过所述业务共障点的群障业务进行故障诊断以确定所述网络群障的故障原因。
2.根据权利要求1所述的方法,其特征在于,对网络业务的业务质量进行监测以确定是否出现网络群障,包括:
设置网络业务的监控策略;
根据所述监控策略对网络业务的业务质量状态进行监控以确定是否出现网络群障。
3.根据权利要求2所述的方法,其特征在于,设置网络业务的监控策略至少包括以下之一:
设置触发网络群障产生条件和触发网络群障消失条件,其中,所述触发网络群障产生条件为在预定时长内同时发生质量异常的业务数大于第一阈值,所述触发网络群障消失条件为在预定时长内同时发生质量异常的业务数小于第二阈值,所述第一阈值大于第二阈值;
设置网络业务质量监控指标,其中,所述网络业务质量监控指标至少包括以下之一指标:丢包率、时延、中断。
4.根据权利要求3所述的方法,其特征在于,根据所述监控策略对网络业务的业务质量状态进行监控以确定是否出现网络群障,包括:
基于业务质量监控指标确定网络业务的业务质量状态;
根据网络业务的业务质量状态和触发网络群障产生条件确定是否出现网络群障。
5.根据权利要求4所述的方法,其特征在于,根据网络业务的业务质量状态和触发网络群障产生条件确定是否出现网络群障,包括:
当多条网络业务的业务质量状态为质量异常,并且满足触发网络群障产生条件时,确定出现网络群障;
当发生质量异常的网络业务满足触发网络群障消失条件时,确定所述网络群障消失。
6.根据权利要求1所述的方法,其特征在于,对出现网络群障的多条群障业务进行路由分析以定位业务共障点,包括:
通过遍历多条群障业务和对应群障业务的故障点,计算每个群障业务故障点所经过业务数占所有发生群障业务的业务总数的比例,将占比达到阈值的公共链路和公共节点确定为所述业务共障点。
7.根据权利要求1所述的方法,其特征在于,对经过所述业务共障点的群障业务进行故障诊断以确定所述网络群障的故障原因,包括:
选择一条或多条经过所述业务共障点的群障业务,并根据所述群障业务的业务质量状态区分不同场景,对该群障业务进行相应场景下的故障诊断,并将诊断结果作为网络群障的故障原因。
8.根据权利要求1所述的方法,其特征在于,在确定所述网络群障的故障原因之后,还包括:
将网络群障诊断结果以图表形式进行展示,并将经过业务共障点的业务路由信息通过拓扑图的形式进行展示。
9.一种网络群障确定装置,其特征在于,包括:
监测模块,用于对网络业务的业务质量进行监测以确定是否出现网络群障;
定位模块,用于对出现网络群障的多条群障业务进行共路由分析以定位业务共障点;
诊断模块,用于对经过所述业务共障点的群障业务进行故障诊断以确定所述网络群障的故障原因。
10.根据权利要求9所述的装置,其特征在于,所述监测模块包括:
设置单元,用于设置网络业务的监控策略;
确定单元,用于根据所述监控策略对网络业务的业务质量状态进行监控以确定是否出现网络群障。
11.根据权利要求9所述的装置,其特征在于,还包括:
展示模块,用于将网络群障诊断结果以图表形式进行展示,并将经过业务共障点的业务路由信息通过拓扑图的形式进行展示。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现所述权利要求1至8任一项中所述的方法的步骤。
13.一种电子装置,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现所述权利要求1至8任一项中所述的方法的步骤。
CN202111017361.3A 2021-08-31 2021-08-31 网络群障确定方法、装置、存储介质及电子装置 Pending CN115733726A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111017361.3A CN115733726A (zh) 2021-08-31 2021-08-31 网络群障确定方法、装置、存储介质及电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111017361.3A CN115733726A (zh) 2021-08-31 2021-08-31 网络群障确定方法、装置、存储介质及电子装置

Publications (1)

Publication Number Publication Date
CN115733726A true CN115733726A (zh) 2023-03-03

Family

ID=85291891

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111017361.3A Pending CN115733726A (zh) 2021-08-31 2021-08-31 网络群障确定方法、装置、存储介质及电子装置

Country Status (1)

Country Link
CN (1) CN115733726A (zh)

Similar Documents

Publication Publication Date Title
US20200106662A1 (en) Systems and methods for managing network health
CN1672362B (zh) 用于故障测量的方法和装置
US7855952B2 (en) Silent failure identification and trouble diagnosis
US8166351B2 (en) Filtering redundant events based on a statistical correlation between events
US5946373A (en) Topology-based fault analysis in telecommunications networks
US5771274A (en) Topology-based fault analysis in telecommunications networks
US6747957B1 (en) Network availability monitor
CN104798341B (zh) 在电子网络上表征服务水平
EP1703671B1 (en) Device and method for network monitoring
EP2795841B1 (en) Method and arrangement for fault analysis in a multi-layer network
US8245079B2 (en) Correlation of network alarm messages based on alarm time
US7082554B2 (en) System and method for providing error analysis and correlation in a network element
US7936688B2 (en) Protocol cross-port analysis
CN113973042B (zh) 用于网络问题的根本原因分析的方法和系统
US11894969B2 (en) Identifying root causes of network service degradation
US7564796B2 (en) Method and system for managing a network slowdown
CN110071843B (zh) 一种基于流路径分析的故障定位方法及装置
CN111865667B (zh) 网络连通性故障根因定位方法及装置
JP6586067B2 (ja) 故障位置特定装置、故障位置特定方法、および、故障位置特定プログラム
CA2486780C (en) A method and system for network wide fault isolation in an optical network
CN115941530A (zh) 一种二层网络环路检测的方法、装置及设备
CN109964450B (zh) 一种确定共享风险链路组的方法及装置
KR100887874B1 (ko) 인터넷 망의 장애 관리 시스템 및 그 방법
CN115733726A (zh) 网络群障确定方法、装置、存储介质及电子装置
CN113873560A (zh) 网络故障的处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication