CN114285726A - 故障定位方法、装置及计算机存储介质 - Google Patents

故障定位方法、装置及计算机存储介质 Download PDF

Info

Publication number
CN114285726A
CN114285726A CN202111618437.8A CN202111618437A CN114285726A CN 114285726 A CN114285726 A CN 114285726A CN 202111618437 A CN202111618437 A CN 202111618437A CN 114285726 A CN114285726 A CN 114285726A
Authority
CN
China
Prior art keywords
alarm data
root
alarm
fault
primary screening
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111618437.8A
Other languages
English (en)
Inventor
韩赛
林凌波
王光全
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN202111618437.8A priority Critical patent/CN114285726A/zh
Publication of CN114285726A publication Critical patent/CN114285726A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请提供一种故障定位方法、装置及计算机存储介质,涉及通信领域,能够提高故障定位的效率。该方法包括:获取第一时间段内第一层级网络的多个告警数据以及第二层级网络的多个告警数据;从第一层级网络的多个告警数据中和第二层级网络的多个告警数据中确定第一初筛根源告警数据和第二初筛根源告警数据,第一初筛根源告警数据和第二初筛根源告警数据分别包括至少一条根源告警数据;对第一初筛根源告警数据和第二初筛根源告警数据进行处理,得到第一根源告警数据和第二根源告警数据,第一根源告警数据和第二根源告警数据中的每组根源告警数据对应一个故障;根据第一根源告警数据以及第二根源告警数据,确定故障所在的层级网络以及故障的原因。

Description

故障定位方法、装置及计算机存储介质
技术领域
本申请涉及通信领域,尤其涉及故障定位方法、装置及计算机存储介质。
背景技术
现有的通信网络包括多个层级网络,例如,包括接入网、网际互连协议(internetprotocol,IP)网、传输网、以及核心网等。目前,各个层级网络之间的维护是相互独立的,例如,当IP网络出现故障后,仅在IP网络中进行故障定位及排除;或者,当传输网出现故障后,仅在传输网中进行故障定位及排除。
然而,由于通信网络的互联特性,故障具有传递性。例如,传输网出现故障后,通常会导致IP网也出现故障。在这种情况下,在IP网络中进行故障定位后,最终发现是传输网出现了故障,这就使得故障定位的时间较长以及故障定位的工作量较大,效率较低。
发明内容
本申请提供一种故障定位方法、装置及计算机存储介质,能够提高故障定位的效率。
为达到上述目的,本申请采用如下技术方案:
第一方面,提供了一种故障定位方法,该方法可以由故障定位装置执行,该方法包括:获取第一时间段内第一层级网络的多个告警数据以及第二层级网络的多个告警数据;从第一层级网络的多个告警数据中确定第一初筛根源告警数据;以及,从第二层级网络的多个告警数据中确定第二初筛根源告警数据,其中,第一初筛根源告警数据和第二初筛根源告警数据分别包括至少一条根源告警数据;对第一初筛根源告警数据进行处理,得到第一根源告警数据;以及对第二初筛根源告警数据进行处理,得到第二根源告警数据,其中,第一根源告警数据和第二根源告警数据中的每组根源告警数据对应一个故障;根据第一根源告警数据以及第二根源告警数据,确定故障所在的层级网络以及故障的原因。
通过对第一时间内第一层级网络的多个告警数据以及第二层级网络的多个告警数据进行处理,获得第一根源告警数据和第二根源告警数据,再根据第一根源告警数据和第二根源告警数据确定故障所在的层级网络以及故障的原因,相较于现有技术中要在每个层级网络中分别定位故障的方案,本申请的方案能够直接定位故障所在的层级网络以及故障的原因,无需在每个层级网络中分别定位故障,减少了故障定位的时间以及故障定位的工作量,提升了故障定位的效率。
结合第一方面,在第一方面的某些实施方式中,根据第一根源告警数据以及第二根源告警数据,确定故障所在的层级网络以及故障的原因,包括:若第二时间段内第一根源告警数据的数量大于第一阈值,确定故障所在的层级网络为第二层级网络;根据第二时间段内第二根源告警数据的故障特征确定故障的原因。
结合第一方面,在第一方面的某些实施方式中,对第一初筛根源告警数据进行处理,得到第一根源告警数据,包括:根据第一初筛根源告警数据中相同告警的告警频率对第一初筛根源告警数据进行处理,获得第一根源告警数据。
结合第一方面,在第一方面的某些实施方式中,根据第一初筛根源告警数据中相同告警的告警频率对第一初筛根源告警数据进行处理,获得第一根源告警数据,包括:根据第一初筛根源告警数据中相同告警的告警频率对第一初筛根源告警数据进行处理,获得再筛第一根源告警数据;利用第一聚类算法对再筛第一根源告警数据进行分组,得到第一根源告警数据,其中,第一根源告警数据中包括一组或多组根源告警数据。
结合第一方面,在第一方面的某些实施方式中,对第二初筛根源告警数据进行处理,得到第二根源告警数据,包括:根据第二初筛根源告警数据中相同告警的告警频率对第二初筛根源告警数据进行处理,获得第二根源告警数据。
结合第一方面,在第一方面的某些实施方式中,根据第二初筛根源告警数据中相同告警的告警频率对第二初筛根源告警数据进行处理,获得第二根源告警数据,包括:根据第二初筛根源告警数据中相同告警的告警频率对第二初筛根源告警数据进行处理,获得再筛第二根源告警数据;利用聚类算法对再筛第二根源告警数据进行分组,得到第二根源告警数据,其中,第二根源告警数据中包括一组或多组根源告警数据。
第二方面,提供了一种故障定位装置用于实现上述故障定位方法。该故障定位装置包括实现上述方法相应的模块、单元、或手段(means),该模块、单元、或means可以通过硬件实现,软件实现,或者通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块或单元。
结合第二方面,在第二方面的某些实施方式中,故障定位装置包括:获取模块和处理模块;获取模块,用于获取第一时间段内第一层级网络的多个告警数据以及第二层级网络的多个告警数据;处理模块,用于从第一层级网络的多个告警数据中确定第一初筛根源告警数据;以及,从第二层级网络的多个告警数据中确定第二初筛根源告警数据,其中,第一初筛根源告警数据和第二初筛根源告警数据分别包括至少一条根源告警数据;处理模块,还用于对第一初筛根源告警数据进行处理,得到第一根源告警数据;以及对第二初筛根源告警数据进行处理,得到第二根源告警数据,其中,第一根源告警数据和第二根源告警数据中的每组根源告警数据对应一个故障;处理模块,还用于根据第一根源告警数据以及第二根源告警数据,确定故障所在的层级网络以及故障的原因。
结合第二方面,在第二方面的某些实施方式中,处理模块,还用于根据第一根源告警数据以及第二根源告警数据,确定故障所在的层级网络以及故障的原因,包括:还用于若第二时间段内第一根源告警数据的数量大于第一阈值,确定故障所在的层级网络为第二层级网络;根据第二时间段内第二根源告警数据的故障特征确定故障的原因。
结合第二方面,在第二方面的某些实施方式中,处理模块,用于对第一初筛根源告警数据进行处理,得到第一根源告警数据,包括:用于根据第一初筛根源告警数据中相同告警的告警频率对第一初筛根源告警数据进行处理,获得第一根源告警数据。
结合第二方面,在第二方面的某些实施方式中,处理模块,用于根据第一初筛根源告警数据中相同告警的告警频率对第一初筛根源告警数据进行处理,获得第一根源告警数据,包括:用于根据第一初筛根源告警数据中相同告警的告警频率对第一初筛根源告警数据进行处理,获得再筛第一根源告警数据;利用第一聚类算法对再筛第一根源告警数据进行分组,得到第一根源告警数据,其中,第一根源告警数据中包括一组或多组根源告警数据。
结合第二方面,在第二方面的某些实施方式中,处理模块,用于对第二初筛根源告警数据进行处理,得到第二根源告警数据,包括:用于根据第二初筛根源告警数据中相同告警的告警频率对第二初筛根源告警数据进行处理,获得第二根源告警数据。
结合第二方面,在第二方面的某些实施方式中,处理模块,用于根据第二初筛根源告警数据中相同告警的告警频率对第二初筛根源告警数据进行处理,获得第二根源告警数据,包括:用于根据第二初筛根源告警数据中相同告警的告警频率对第二初筛根源告警数据进行处理,获得再筛第二根源告警数据;利用聚类算法对再筛第二根源告警数据进行分组,得到第二根源告警数据,其中,第二根源告警数据中包括一组或多组根源告警数据。
第三方面,提供了一种故障定位装置,包括:至少一个处理器;处理器用于执行计算机程序或指令,以使该故障定位装置执行上述第一方面的方法。
结合第三方面,在第三方面的某些实施方式中,该故障定位装置还包括存储器,该存储器,用于保存必要的程序指令和数据。该存储器可以与处理器耦合,或者,也可以独立于该处理器。
在一些可能的设计中,该故障定位装置可以是芯片或芯片系统。该故障定位装置是芯片系统时,可以由芯片构成,也可以包含芯片和其他分立器件。
第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机指令,当其被计算机执行时,使得计算机可以执行上述第一方面的方法。
第五方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机可以执行上述第一方面的方法。
其中,第二方面至第五方面中任一种设计方式所带来的技术效果可参见上述第一方面中不同设计方式所带来的技术效果,在此不再赘述。
附图说明
图1为本申请提供的一种多层级网络的结构示意图;
图2a为本申请提供的一种故障定位方法的流程示意图;
图2b为本申请提供的另一种故障定位方法的流程示意图;
图3为本申请提供的一种故障定位装置的结构示意图;
图4为本申请提供的另一种故障定位装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
在本申请的描述中,除非另有说明,“多个”是指两个或多于两个。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中a,b,c可以是单个,也可以是多个。
另外,为了便于清楚描述本申请实施例的技术方案,在本申请的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。同时,在本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念,便于理解。
可以理解,说明书通篇中提到的“实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各个实施例未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。可以理解,在本申请的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
可以理解,在本申请中,“当…时”、“若”以及“如果”均指在某种客观情况下会做出相应的处理,并非是限定时间,且也不要求实现时一定要有判断的动作,也不意味着存在其它限定。
可以理解,本申请实施例中的一些可选的特征,在某些场景下,可以不依赖于其他特征,比如其当前所基于的方案,而独立实施,解决相应的技术问题,达到相应的效果,也可以在某些场景下,依据需求与其他特征进行结合。相应的,本申请实施例中给出的装置也可以相应的实现这些特征或功能,在此不予赘述。
本申请中,除特殊说明外,各个实施例之间相同或相似的部分可以互相参考。在本申请中各个实施例、以及各实施例中的各个实现方法中,如果没有特殊说明以及逻辑冲突,不同的实施例之间、以及各实施例中的各个实现方法之间的术语和/或描述具有一致性、且可以相互引用,不同的实施例、以及各实施例中的各个实现方法中的技术特征根据其内在的逻辑关系可以组合形成新的实施例、实施方式、实施方法、或实现方法。以下的本申请实施方式并不构成对本申请保护范围的限定。
本申请实施例的技术方案可用于多层级网络,图1为本申请提供的一种多层级网络的结构示意图,该多层级网络包括第一层级网络和第二层级网络,其中,当第二层级网络发生故障时,可能会影响第一层级网络的正常工作,进而导致第一层级网络中产生告警数据。
下面将结合附图,对本申请实施例提供的故障定位方法进行展开说明。
可以理解的,本申请实施例中,执行主体可以执行本申请实施例中的部分或全部步骤,这些步骤或操作仅是示例,本申请实施例还可以执行其它操作或者各种操作的变形。此外,各个步骤可以按照本申请实施例呈现的不同的顺序来执行,并且有可能并非要执行本申请实施例中的全部操作。
如图2a所示,为本申请实施例提供的一种故障定位方法的流程示意图,该故障定位方法包括如下步骤:
S201、故障定位装置获取第一时间段内第一层级网络的多个告警数据以及第二层级网络的多个告警数据。
可选的,第一时间段可以为预设的时间段,例如12:00-12:30、8:10-8:50、或12:00-13:00等,当然,第一时间段也可以为其他预设的时间段,本申请对此不作限制。
可选的,第一层级网络可以为IP层网络,例如,无线接入网IP化(IP radio accessnetwork,IPRAN)网络,当然,在未来技术中,第一层级网络也可以为其他名称的网络,本申请对此不作限制。
可选的,第二层级网络可以为传输层网络,例如光传送网(optical transportnetwork,OTN),当然,在未来技术中,第二层级网络也可以为其他名称的网络,本申请对此不作限制。
S202、故障定位装置从第一层级网络的多个告警数据中确定第一初筛根源告警数据;以及,从第二层级网络的多个告警数据中确定第二初筛根源告警数据。
其中,第一初筛根源告警数据和第二初筛根源告警数据分别包括至少一条根源告警数据。
可选的,故障定位装置从第一层级网络的多个告警数据中确定第一初筛根源告警数据,包括:将第一层级网络的多个告警数据中的第一预设告警数据作为第一初筛根源告警数据。
示例性的,第一预设告警数据可以为预设告警名称的告警数据,例如,告警名称为物理端口down的告警数据,当然,第一预设告警数据也可以为其他预设告警名称的告警数据,本申请对此不作限制。
可选的,故障定位装置从第二层级网络的多个告警数据中确定第二初筛根源告警数据,包括:将第二层级网络的多个告警数据中的第二预设告警数据作为第二初筛根源告警数据。
示例性的,第二预设告警数据可以为预设板卡类型的告警数据,例如,板卡类型为扩展C波段双路可拔插光放基板(DAPXF)的告警数据、板卡类型为光纤放大器(opticalamplify utensil,OAU)的告警数据、板卡类型为100Gbit/s波长转换板(LSC)的告警数据、板卡类型为2x 100Gbit/s统一线路业务处理板(U402)波道板的告警数据,当然,第二预设告警数据也可以为其他预设板卡类型的告警数据,本申请对此不作限制。
需要说明的是,告警数据分为根源告警数据和衍生告警数据,根源告警数据是指由网络故障直接引发的告警数据,衍生告警数据是指由网络故障间接引发的告警数据。
S203、故障定位装置对第一初筛根源告警数据进行处理,得到第一根源告警数据;以及对第二初筛根源告警数据进行处理,得到第二根源告警数据。
其中,第一根源告警数据和第二根源告警数据中的每组根源告警数据对应一个故障。
可选的,故障定位装置对第一初筛根源告警数据进行处理,得到第一根源告警数据,包括:根据第一初筛根源告警数据中告警数据的告警频率对第一初筛根源告警数据进行处理,获得第一根源告警数据。
作为一种可能的实现,当第一时间段内第一层级网络的多个告警数据为实时的告警数据时,故障定位装置根据第一初筛根源告警数据中告警数据的告警频率对第一初筛根源告警数据进行处理,获得第一根源告警数据,包括:过滤第一初筛根源告警数据中发生时间与清除时间的差值小于第二阈值且在第三时间段内出现次数小于或等于第三阈值的告警数据,和/或,过滤第一初筛根源告警数据中预设时长内相同告警数据中的非首条告警数据,获得第一根源告警数据,其中,相同告警数据是指告警名称相同、网元相同、端口相同的告警数据。
示例性的,第二阈值可以为1分钟,第三时间段可以为5分钟,第三阈值可以为1次,预设时间可以为1分钟,当然,上述第二阈值、第三时间段、第三阈值、预设时长也可以取其他值,本申请对此不作限制。
作为另一种可能的实现,当第一时间段内第一层级网络的多个告警数据为历史的告警数据时,故障定位装置根据第一初筛根源告警数据中告警数据的告警频率对第一初筛根源告警数据进行处理,获得第一根源告警数据,包括:根据第一初筛根源告警数据中告警数据的告警频率对第一初筛根源告警数据进行处理,获得再筛第一根源告警数据;利用聚类算法对再筛第一根源告警数据进行分组,得到第一根源告警数据。
示例性的,故障定位装置根据第一初筛根源告警数据中告警数据的告警频率对第一初筛根源告警数据进行处理,获得再筛第一根源告警数据,包括:将第一初筛根源告警数据中发生时间与清除时间的差值小于第二阈值且在第三时间段内出现次数小于或等于第三阈值的告警数据过滤,和/或,过滤第一初筛根源告警数据中预设时长内相同告警数据中的非首条告警数据,获得再筛第一根源告警数据,其中,相同告警数据是指告警名称相同、网元相同、端口相同的告警数据。
作为一种示例,第二阈值可以为1分钟,第三时间段可以为5分钟,第三阈值可以为1次,预设时间可以为1分钟,当然,上述第二阈值、第三时间段、第三阈值、预设时长也可以取其他值,本申请对此不作限制。
示例性的,在获得再筛第一根源告警数据之后,故障定位装置利用聚类算法对再筛第一根源告警数据进行分组,得到第一根源告警数据,包括:根据再筛第一根源告警数据的发生时间按照预设时间间隔将再筛第一根源告警数据分为多个再筛第一根源告警数据组,结合再筛第一根源告警数据组中每个告警数据的名称、再筛第一根源告警数据组中每个告警数据的定位信息、再筛第一根源告警数据组中每个告警数据的告警源利用聚类算法对每个再筛第一根源告警数据组再次进行分组,获得第一根源告警数据。
作为一种示例,预设时间间隔可以为2分钟,当然,预设时间间隔也可以为其他值,本申请对此不作限制。
可选的,故障定位装置对第二初筛根源告警数据进行处理,得到第二根源告警数据,包括:根据第二初筛根源告警数据中告警数据的告警频率对第二初筛根源告警数据进行处理,获得第二根源告警数据。
作为一种可能的实现,当第一时间段内第二层级网络的多个告警数据为实时的告警数据时,故障定位装置根据第二初筛根源告警数据中告警数据的告警频率对第二初筛根源告警数据进行处理,获得第二根源告警数据,包括:过滤第二初筛根源告警数据中发生时间与清除时间的差值小于第二阈值且在第三时间段内出现次数小于或等于第三阈值的告警数据,和/或,过滤第二初筛根源告警数据中预设时长内相同告警数据中的非首条告警数据,获得第二根源告警数据,其中,相同告警数据是指告警名称相同、网元相同、端口相同的告警数据。
示例性的,第二阈值可以为1分钟,第三时间段可以为5分钟,第三阈值可以为1次,预设时间可以为1分钟,当然,上述第二阈值、第三时间段、第三阈值、预设时长也可以取其他值,本申请对此不作限制。
作为另一种可能的实现,当第一时间段内第二层级网络的多个告警数据为历史的告警数据时,故障定位装置根据第二初筛根源告警数据中告警数据的告警频率对第二初筛根源告警数据进行处理,获得第二根源告警数据,包括:根据第二初筛根源告警数据中告警数据的告警频率对第二初筛根源告警数据进行处理,获得再筛第二根源告警数据;利用聚类算法对再筛第二根源告警数据进行分组,得到第二根源告警数据,其中,第二根源告警数据中包括一组或多组告警数据。
示例性的,故障定位装置根据第二初筛根源告警数据中告警数据的告警频率对第二初筛根源告警数据进行处理,获得再筛第二根源告警数据,包括:将第二初筛根源告警数据中发生时间与清除时间的差值小于第二阈值且在第三时间段内出现次数小于或等于第三阈值的告警数据过滤,和/或,过滤第二初筛根源告警数据中预设时长内相同告警数据中的非首条告警数据,获得再筛第二根源告警数据,其中,相同告警数据是指告警名称相同、网元相同、端口相同的告警数据。
作为一种示例,第二阈值可以为1分钟,第三时间段可以为5分钟,第三阈值可以为1次,预设时间可以为1分钟,当然,上述第二阈值、第三时间段、第三阈值、预设时长也可以取其他值,本申请对此不作限制。
示例性的,在获得再筛第二根源告警数据之后,故障定位装置利用聚类算法对再筛第二根源告警数据进行分组,得到第二根源告警数据,包括:根据再筛第二根源告警数据的发生时间按照预设时间间隔将再筛第二根源告警数据分为多个再筛第二根源告警数据组,结合再筛第二根源告警数据组中每个告警数据的名称、再筛第二根源告警数据组中每个告警数据的定位信息、再筛第二根源告警数据组中每个告警数据的告警源利用聚类算法对每个再筛第二根源告警数据组再次进行分组,获得第二根源告警数据。
作为一种示例,预设时间间隔可以为2分钟,当然,预设时间间隔也可以为其他值,本申请对此不作限制。
S204、故障定位装置根据第一根源告警数据以及第二根源告警数据,确定故障所在的层级网络以及故障的原因。
作为一种可能的实现,若第二时间段内第一根源告警数据的数量大于第一阈值,确定故障所在的层级网络为第二层级网络;故障定位装置根据第二时间段内第二根源告警数据的故障特征确定故障的原因。
示例性的,第一阈值可以为1条,第二时间段可以为预设的时间段,例如,12:00-12:01、12:00-12:02、或8:00-8:01等,当然,第一阈值也可以为其他数值,第二时间段也可以为其他预设的时间段,本申请对此不作限制。
在确定故障所在的层级网络为第二层级网络之后,故障定位装置根据第二时间段内第二根源告警数据的故障特征确定故障的原因。
示例性的,以第二层级网络为OTN网络为例,当第二层级网络中的根源告警数据的故障特征为DAPXF时,故障定位装置确定故障的原因为DAPXF对应的OTN网元段的光缆出现中断。或者,当第二层级网络中的根源告警数据的故障特征不为DAPXF时,故障定位装置根据第二层级网络中的根源告警数据的告警名称确定故障的原因,例如,根据第二层级网络中的根源告警数据的告警名称为MUT_LOS确定故障的原因为合路信号丢失、根据第二层级网络中的根源告警数据的告警名称为R_LOS确定故障的原因为合接收侧信号丢失、根据第二层级网络中的根源告警数据的告警名称为SUM_INPWR_LOW确定故障的原因为合路输入光功率过低、或根据第二层级网络中的根源告警数据的告警名称为IN_PWR_HIGH确定故障的原因为输入光功率过高。
通过对第一时间内第一层级网络的多个告警数据以及第二层级网络的多个告警数据进行处理,获得第一根源告警数据和第二根源告警数据,再根据第一根源告警数据和第二根源告警数据确定故障所在的层级网络以及故障的原因,相较于现有技术中要在每个层级网络中分别定位故障的方案,本申请的方案能够直接定位故障所在的层级网络以及故障的原因,无需在每个层级网络中分别定位故障,减少了故障定位的时间以及故障定位的工作量,提升了故障定位的效率。
综上描述,以第一层级网络为IPRAN网络,第二层级网络为OTN网络为例,整个的故障定位方法流程可以图2b所示。
如图2b所示,故障定位装置获取IPRAN网络中第一时间段内多个告警数据,确定第一初筛根源告警数据,根据第一初筛根源告警数据中告警数据的告警频率对第一初筛根源告警数据进行处理,若告警数据为实时告警数据,得到第一根源告警数据。类似的,故障定位装置获取OTN网络中第一时间段内多个告警数据,确定第二初筛根源告警数据,根据第二初筛根源告警数据中告警数据的告警频率对第二初筛根源告警数据进行处理,若告警数据为实时告警数据,得到第二根源告警数据。进一步的,故障定位装置根据第一根源告警数据以及第二根源告警数据,确定故障所在的层级网络以及故障的原因。
可选的,若告警数据为历史告警数据,故障定位装置根据第一初筛根源告警数据中告警数据的告警频率对第一初筛根源告警数据进行处理,得到再筛第一根源告警数据。
可选的,若告警数据为历史告警数据,故障定位装置根据第二初筛根源告警数据中告警数据的告警频率对第二初筛根源告警数据进行处理,得到再筛第二根源告警数据。
上述图2b中涉及的各步骤的所有相关内容均可以参考上述图2a中相关步骤的描述,在此不再赘述。以上是对本申请提供的故障定位方法作了总体性说明,下面将对本申请提供的故障定位方法作进一步说明。
可选的,在步骤S204之后,本申请提供的故障定位方法还可以包括:故障定位装置根据故障所在的层级网络以及故障的原因发出提示信息,该提示信息用于指示故障所在的位置、故障的原因、或故障对应的网元。
作为一种可能的实现,故障定位装置向网络管理系统发送提示信息,使网络管理系统中的网络拓扑上显示故障所在的位置以及故障对应的网元。
作为另一种可能的实现,故障定制装置通过运营商短信或电子运维派单系统向运维人员发送故障的位置和故障的原因。
作为又一种可能的实现,故障定位装置向导航系统发送提示信息,使导航系统显示并导航至故障所在的位置。
上述主要从故障定位装置执行故障定位方法的角度对本申请实施例提供的方案进行了介绍。为了实现上述功能,故障定位装置包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请实施例能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
本申请实施例可以根据上述方法示例对故障定位装置进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。可选的,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。此外,这里的“模块”可以指特定专用集成电路(application-specific integrated circuit,ASIC),电路,执行一个或多个软件或固件程序的处理器和存储器,集成逻辑电路,和/或其他可以提供上述功能的器件。
在采用功能模块划分的情况下,图3示出了一种故障定位装置30的结构示意图。如图3所示,该故障定位装置包括获取模块301和处理模块302。
在一些实施例中,该故障定位装置30还可以包括存储模块(图3中未示出),用于存储程序指令和数据。
其中,获取模块301,用于获取第一时间段内第一层级网络的多个告警数据以及第二层级网络的多个告警数据;处理模块302,用于从第一层级网络的多个告警数据中确定第一初筛根源告警数据;以及,从第二层级网络的多个告警数据中确定第二初筛根源告警数据,其中,第一初筛根源告警数据和第二初筛根源告警数据分别包括至少一条根源告警数据;处理模块302,还用于对第一初筛根源告警数据进行处理,得到第一根源告警数据;以及对第二初筛根源告警数据进行处理,得到第二根源告警数据,其中,第一根源告警数据和第二根源告警数据中的每组根源告警数据对应一个故障;处理模块302,还用于根据第一根源告警数据以及第二根源告警数据,确定故障所在的层级网络以及故障的原因。
作为一种可能的实现,处理模块302,还用于根据第一根源告警数据以及第二根源告警数据,确定故障所在的层级网络以及故障的原因,包括:还用于若第二时间段内第一根源告警数据的数量大于第一阈值,确定故障所在的层级网络为第二层级网络;还用于根据第二时间段内第二根源告警数据的故障特征确定故障的原因。
作为一种可能的实现,处理模块302,用于对第一初筛根源告警数据进行处理,得到第一根源告警数据,包括:用于根据第一初筛根源告警数据中相同告警的告警频率对第一初筛根源告警数据进行处理,获得第一根源告警数据。
作为一种可能的实现,处理模块302,用于根据第一初筛根源告警数据中相同告警的告警频率对第一初筛根源告警数据进行处理,获得第一根源告警数据,包括:用于根据第一初筛根源告警数据中相同告警的告警频率对第一初筛根源告警数据进行处理,获得再筛第一根源告警数据;还用于利用第一聚类算法对再筛第一根源告警数据进行分组,得到第一根源告警数据,其中,第一根源告警数据中包括一组或多组根源告警数据。
作为一种可能的实现,处理模块302,用于对第二初筛根源告警数据进行处理,得到第二根源告警数据,包括:用于根据第二初筛根源告警数据中相同告警的告警频率对第二初筛根源告警数据进行处理,获得第二根源告警数据。
作为一种可能的实现,处理模块302,用于根据第二初筛根源告警数据中相同告警的告警频率对第二初筛根源告警数据进行处理,获得第二根源告警数据,包括:用于根据第二初筛根源告警数据中相同告警的告警频率对第二初筛根源告警数据进行处理,获得再筛第二根源告警数据;还用于利用聚类算法对再筛第二根源告警数据进行分组,得到第二根源告警数据,其中,第二根源告警数据中包括一组或多组根源告警数据。
上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。
在采用硬件的形式实现上述功能模块的功能的情况下,图4示出了另一种故障定位装置40的结构示意图。如图4所示,该故障定位装置包括处理器401,存储器402以及总线403。处理器401与存储器402之间可以通过总线403连接。
处理器401是故障定位装置40的控制中心,可以是一个处理器,也可以是多个处理元件的统称。例如,处理器401可以是一个通用中央处理单元(central processing unit,CPU),也可以是其他通用处理器等。其中,通用处理器可以是微处理器或者是任何常规的处理器等。
作为一种实施例,处理器401可以包括一个或多个CPU,例如图4中所示的CPU 0和CPU 1。
存储器402可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electricallyerasable programmable read-only memory,EEPROM)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
作为一种可能的实现方式,存储器402可以独立于处理器401存在,存储器402可以通过总线403与处理器401相连接,用于存储指令或者程序代码。处理器401调用并执行存储器402中存储的指令或程序代码时,能够实现本发明实施例提供的一次性身份标识使用方法。
另一种可能的实现方式中,存储器402也可以和处理器401集成在一起。
总线403,可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外围设备互连(Peripheral Component Interconnect,PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
需要指出的是,图4示出的结构并不构成对该故障定位装置40的限定。除图4所示部件之外,该故障定位装置40可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
作为一个示例,结合图3,故障定位装置30中的获取模块301和处理模块302实现的功能与图4中的处理器401的功能相同。
可选的,如图4所示,本申请实施例提供的故障定位装置40还可以包括通信接口404。
通信接口404,用于与其他设备通过通信网络连接。该通信网络可以是以太网,无线接入网,无线局域网(wireless local area networks,WLAN)等。通信接口404可以包括用于接收数据的接收单元,以及用于发送数据的发送单元。
在一种可能的实现方式中,本申请实施例提供的故障定位装置40中,通信接口404还可以集成在处理器401中,本申请实施例对此不做具体限定。
作为一种可能的产品形态,本申请实施例的故障定位装置,还可以使用下述来实现:一个或多个现场可编程门阵列(field programmable gate array,FPGA)、可编程逻辑器件(programmable logic device,PLD)、控制器、状态机、门逻辑、分立硬件部件、任何其它适合的电路、或者能够执行本申请通篇所描述的各种功能的电路的任意组合。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能单元的划分进行举例说明。在实际应用中,可以根据需要而将上述功能分配由不同的功能单元完成,即将装置的内部结构划分成不同的功能单元,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当计算机执行该指令时,该计算机执行上述方法实施例所示的方法流程中的各个步骤。
本发明的实施例提供一种包含指令的计算机程序产品,当指令在计算机上运行时,使得计算机执行上述方法实施例所示的方法流程中的各个步骤。
其中,计算机可读存储介质,例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘。随机存取存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、寄存器、硬盘、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的人以合适的组合、或者本领域数值的任何其他形式的计算机可读存储介质。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于特定用途ASIC中。在本申请实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
由于本实施例提供的故障定位装置、计算机可读存储介质、计算机程序产品可以应用于上述由于本实施例提供的故障定位方法,因此,其所能获得的技术效果也可参考上述方法实施例,本发明实施例在此不再赘述。
尽管在此结合各实施例对本申请进行了描述,然而,在实施所要求保护的本申请过程中,本领域技术人员通过查看附图、公开内容、以及所附权利要求书,可理解并实现公开实施例的其他变化。在权利要求中,“包括”(comprising)一词不排除其他组成部分或步骤,“一”或“一个”不排除多个的情况。单个处理器或其他单元可以实现权利要求中列举的若干项功能。相互不同的从属权利要求中记载了某些措施,但这并不表示这些措施不能组合起来产生良好的效果。
尽管结合具体特征及其实施例对本申请进行了描述,显而易见的,在不脱离本申请的精神和范围的情况下,可对其进行各种修改和组合。相应地,本说明书和附图仅仅是所附权利要求所界定的本申请的示例性说明,且视为已覆盖本申请范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (14)

1.一种故障定位方法,其特征在于,所述方法包括:
获取第一时间段内第一层级网络的多个告警数据以及第二层级网络的多个告警数据;
从所述第一层级网络的多个告警数据中确定第一初筛根源告警数据;以及,从所述第二层级网络的多个告警数据中确定第二初筛根源告警数据,其中,所述第一初筛根源告警数据和所述第二初筛根源告警数据分别包括至少一条根源告警数据;
对所述第一初筛根源告警数据进行处理,得到第一根源告警数据;以及对所述第二初筛根源告警数据进行处理,得到第二根源告警数据,其中,所述第一根源告警数据和所述第二根源告警数据中的每组根源告警数据对应一个故障;
根据所述第一根源告警数据以及所述第二根源告警数据,确定故障所在的层级网络以及故障的原因。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一根源告警数据以及所述第二根源告警数据,确定故障所在的层级网络以及故障的原因,包括:
若第二时间段内所述第一根源告警数据的数量大于第一阈值,确定所述故障所在的层级网络为所述第二层级网络;
根据所述第二时间段内所述第二根源告警数据的故障特征确定所述故障的原因。
3.根据权利要求1或2所述的方法,其特征在于,所述对所述第一初筛根源告警数据进行处理,得到第一根源告警数据,包括:
根据所述第一初筛根源告警数据中告警数据的告警频率对所述第一初筛根源告警数据进行处理,获得所述第一根源告警数据。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一初筛根源告警数据中告警数据的告警频率对所述第一初筛根源告警数据进行处理,获得所述第一根源告警数据,包括:
根据所述第一初筛根源告警数据中告警数据的告警频率对所述第一初筛根源告警数据进行处理,获得再筛第一根源告警数据;
利用聚类算法对所述再筛第一根源告警数据进行分组,得到所述第一根源告警数据,其中,所述第一根源告警数据中包括一组或多组根源告警数据。
5.根据权利要求1或2所述的方法,其特征在于,所述对所述第二初筛根源告警数据进行处理,得到第二根源告警数据,包括:
根据所述第二初筛根源告警数据中告警数据的告警频率对所述第二初筛根源告警数据进行处理,获得所述第二根源告警数据。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第二初筛根源告警数据中告警数据的告警频率对所述第二初筛根源告警数据进行处理,获得所述第二根源告警数据,包括:
根据所述第二初筛根源告警数据中告警数据的告警频率对所述第二初筛根源告警数据进行处理,获得再筛第二根源告警数据;
利用聚类算法对所述再筛第二根源告警数据进行分组,得到所述第二根源告警数据,其中,所述第二根源告警数据中包括一组或多组根源告警数据。
7.一种故障定位装置,其特征在于,所述装置包括:获取模块和处理模块;
所述获取模块,用于获取第一时间段内第一层级网络的多个告警数据以及第二层级网络的多个告警数据;
所述处理模块,用于从所述第一层级网络的多个告警数据中确定第一初筛根源告警数据;以及,从所述第二层级网络的多个告警数据中确定第二初筛根源告警数据,其中,所述第一初筛根源告警数据和所述第二初筛根源告警数据分别包括至少一条根源告警数据;
所述处理模块,还用于对所述第一初筛根源告警数据进行处理,得到第一根源告警数据;以及对所述第二初筛根源告警数据进行处理,得到第二根源告警数据,其中,所述第一根源告警数据和所述第二根源告警数据中的每组根源告警数据对应一个故障;
所述处理模块,还用于根据所述第一根源告警数据以及所述第二根源告警数据,确定故障所在的层级网络以及故障的原因。
8.根据权利要求7所述的装置,其特征在于,所述处理模块,还用于根据所述第一根源告警数据以及所述第二根源告警数据,确定故障所在的层级网络以及故障的原因,包括:
还用于若第二时间段内所述第一根源告警数据的数量大于第一阈值,确定所述故障所在的层级网络为所述第二层级网络;
根据所述第二时间段内所述第二根源告警数据的故障特征确定所述故障的原因。
9.根据权利要求7或8所述的装置,其特征在于,所述处理模块,用于对所述第一初筛根源告警数据进行处理,得到第一根源告警数据,包括:
用于根据所述第一初筛根源告警数据中告警数据的告警频率对所述第一初筛根源告警数据进行处理,获得所述第一根源告警数据。
10.根据权利要求9所述的装置,其特征在于,所述处理模块,用于根据所述第一初筛根源告警数据中告警数据的告警频率对所述第一初筛根源告警数据进行处理,获得所述第一根源告警数据,包括:
用于根据所述第一初筛根源告警数据中告警数据的告警频率对所述第一初筛根源告警数据进行处理,获得再筛第一根源告警数据;
利用聚类算法对所述再筛第一根源告警数据进行分组,得到所述第一根源告警数据,其中,所述第一根源告警数据中包括一组或多组根源告警数据。
11.根据权利要求7或8所述的装置,其特征在于,所述处理模块,用于对所述第二初筛根源告警数据进行处理,得到第二根源告警数据,包括:
用于根据所述第二初筛根源告警数据中告警数据的告警频率对所述第二初筛根源告警数据进行处理,获得所述第二根源告警数据。
12.根据权利要求11所述的装置,其特征在于,所述处理模块,用于根据所述第二初筛根源告警数据中告警数据的告警频率对所述第二初筛根源告警数据进行处理,获得所述第二根源告警数据,包括:
用于根据所述第二初筛根源告警数据中告警数据的告警频率对所述第二初筛根源告警数据进行处理,获得再筛第二根源告警数据;
利用聚类算法对所述再筛第二根源告警数据进行分组,得到所述第二根源告警数据,其中,所述第二根源告警数据中包括一组或多组根源告警数据。
13.一种故障定位装置,其特征在于,所述故障定位装置包括:处理器;
所述处理器用于读取存储器中的计算机执行指令,并执行所述计算机执行指令,以使所述故障定位装置执行如权利要求1-6中任一项所述的方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序或指令,当所述计算机程序或指令被故障定位装置执行时,实现如权利要求1-6中任一项所述的方法。
CN202111618437.8A 2021-12-27 2021-12-27 故障定位方法、装置及计算机存储介质 Pending CN114285726A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111618437.8A CN114285726A (zh) 2021-12-27 2021-12-27 故障定位方法、装置及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111618437.8A CN114285726A (zh) 2021-12-27 2021-12-27 故障定位方法、装置及计算机存储介质

Publications (1)

Publication Number Publication Date
CN114285726A true CN114285726A (zh) 2022-04-05

Family

ID=80876542

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111618437.8A Pending CN114285726A (zh) 2021-12-27 2021-12-27 故障定位方法、装置及计算机存储介质

Country Status (1)

Country Link
CN (1) CN114285726A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103378980A (zh) * 2012-04-16 2013-10-30 中兴通讯股份有限公司 一种层网络告警与业务相关性分析方法和装置
CN104065501A (zh) * 2013-03-22 2014-09-24 中兴通讯股份有限公司 一种网管系统中网络故障定位的方法及装置
WO2016119436A1 (zh) * 2015-01-27 2016-08-04 中兴通讯股份有限公司 告警处理方法、装置及控制器
CN109787817A (zh) * 2018-12-28 2019-05-21 武汉船舶通信研究所(中国船舶重工集团公司第七二二研究所) 网络故障诊断方法、装置和计算机可读存储介质
CN112995800A (zh) * 2019-12-12 2021-06-18 中兴通讯股份有限公司 光传送网络告警处理方法、装置、终端设备及存储介质
CN113810101A (zh) * 2020-06-12 2021-12-17 中兴通讯股份有限公司 光传送网络告警处理方法、装置、网络管理系统及介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103378980A (zh) * 2012-04-16 2013-10-30 中兴通讯股份有限公司 一种层网络告警与业务相关性分析方法和装置
CN104065501A (zh) * 2013-03-22 2014-09-24 中兴通讯股份有限公司 一种网管系统中网络故障定位的方法及装置
WO2016119436A1 (zh) * 2015-01-27 2016-08-04 中兴通讯股份有限公司 告警处理方法、装置及控制器
CN109787817A (zh) * 2018-12-28 2019-05-21 武汉船舶通信研究所(中国船舶重工集团公司第七二二研究所) 网络故障诊断方法、装置和计算机可读存储介质
CN112995800A (zh) * 2019-12-12 2021-06-18 中兴通讯股份有限公司 光传送网络告警处理方法、装置、终端设备及存储介质
CN113810101A (zh) * 2020-06-12 2021-12-17 中兴通讯股份有限公司 光传送网络告警处理方法、装置、网络管理系统及介质

Similar Documents

Publication Publication Date Title
CN112162878B (zh) 数据库故障发现方法、装置、电子设备及存储介质
CN109450677B (zh) 一种根源故障的定位方法和装置
CN114338367A (zh) 故障定位方法、装置及计算机存储介质
CN108989136B (zh) 业务端到端性能监控方法及装置
CN107995377A (zh) 客服管理方法、电子装置及计算机可读存储介质
CN113067875B (zh) 基于微服务网关动态流控的访问方法和装置以及设备
CN109818808A (zh) 故障诊断方法、装置和电子设备
CN113656252B (zh) 故障定位方法、装置、电子设备以及存储介质
CN114285726A (zh) 故障定位方法、装置及计算机存储介质
CN116645082A (zh) 一种系统巡检方法、装置、设备以及存储介质
CN110752972A (zh) 一种网卡状态监控方法、装置、设备及介质
CN113162801B (zh) 一种告警分析方法、装置及存储介质
CN115729786A (zh) 一种应用于多系统的监控方法、装置、设备及存储介质
CN113986710A (zh) 大数据平台监控方法及装置
CN115150289A (zh) 基于复合监控的异常处理方法及系统
CN116560882A (zh) 故障根因定位方法、装置、设备及计算机存储介质
CN109379211B (zh) 一种网络监控方法及装置、服务器和存储介质
CN107589907A (zh) 数据处理方法、电子设备及计算机可读存储介质
CN110213120B (zh) 一种消息中间件的压测方法、装置及终端设备
CN109032774A (zh) 应用程序恢复方法与装置
CN110417461A (zh) 多故障点的光缆定位方法、装置及终端设备
CN112988842B (zh) 关联用户id的方法及装置
CN116546537A (zh) 故障排查方法、装置及存储介质
CN111130919B (zh) 一种接口监控方法、装置、系统及存储介质
CN110391929A (zh) 一种容错控制方法、装置及容错构件

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20220405