CN111884859A - 一种网络故障诊断方法、装置及可读存储介质 - Google Patents

一种网络故障诊断方法、装置及可读存储介质 Download PDF

Info

Publication number
CN111884859A
CN111884859A CN202010750489.XA CN202010750489A CN111884859A CN 111884859 A CN111884859 A CN 111884859A CN 202010750489 A CN202010750489 A CN 202010750489A CN 111884859 A CN111884859 A CN 111884859A
Authority
CN
China
Prior art keywords
network
detection
fault
nodes
alternative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010750489.XA
Other languages
English (en)
Other versions
CN111884859B (zh
Inventor
夏翰林
李智
魏长明
周孔均
胡军毅
刘�东
龙方家
胡晓锐
孔洪亮
朱彬
龙羿
汪会财
徐婷婷
詹航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electric Power Research Institute of State Grid Chongqing Electric Power Co Ltd
State Grid Corp of China SGCC
State Grid Chongqing Electric Power Co Ltd
Original Assignee
Electric Power Research Institute of State Grid Chongqing Electric Power Co Ltd
State Grid Corp of China SGCC
State Grid Chongqing Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electric Power Research Institute of State Grid Chongqing Electric Power Co Ltd, State Grid Corp of China SGCC, State Grid Chongqing Electric Power Co Ltd filed Critical Electric Power Research Institute of State Grid Chongqing Electric Power Co Ltd
Priority to CN202010750489.XA priority Critical patent/CN111884859B/zh
Publication of CN111884859A publication Critical patent/CN111884859A/zh
Application granted granted Critical
Publication of CN111884859B publication Critical patent/CN111884859B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种网络故障诊断方法、装置及可读存储介质,其中方法包括:根据确定的底层网络资源的业务相关性构建备选探测节点集合;基于所述备选探测节点集合对网络状态进行探测;根据探测结果构建诊断模型;基于历史故障概率、探测性能以及所述诊断模型进行可信度评估,以获得故障集合。本发明方法基于历史故障概率和探测性能对探测结果进行可信度评估,能够将虚假症状和虚拟故障进行过滤,从而提升故障诊断模型的准确度,提高了故障诊断的效率。

Description

一种网络故障诊断方法、装置及可读存储介质
技术领域
本发明涉及通信技术领域,特别是一种网络故障诊断方法、装置及可读存储介质。
背景技术
4G网络时代实现了人与智能手机的快速连接和移动互联网的快速发展。但是,在5G网络环境下,基于高带宽、低时延的网络特点,将实现万物互联,用于承载高带宽、低时延、高连接数等不同的业务。由于业务类型多样、业务特点不同,网络切片技术已成为5G网络设备商和网络运营商共同支持的一项关键技术。在网络切片环境下,通过采用网络功能虚拟化技术、软件定义网络技术,5G网络的无线子网、传输子网、核心子网的网络设备从原来的独立专用设备,变为通用服务器上的虚拟机,显著降低了网络建设成本。为保证5G业务的可靠性和稳定性,当业务发生故障时,快速准确的故障定位技术已成为当前一个重要的研究重点。
故障诊断技术一般可以分为基于被动监测的故障诊断和基于主动探测的故障诊断两种。前者主要根据网络管理系统的告警数据和网络拓扑信息,进行故障推断,执行简单,对网络业务影响小。后者主要采用主动部署探测站点、执行探测,从而获得特定的症状和故障信息,提高了故障诊断算法的性能。文献[Gontara,S.,Boufaied,A.,&Korbaa,O.AUnified approach for Selecting Probes and Probing Stations for FaultDetection and Localization in Computer Networks[C]//Proceedings of the 2019IEEE International Conference on Systems,Man and Cybernetics(SMC),2019:2071-2076).]提出一种对探测站点和探测同时进行优化的主动探测算法,提升了探测站点和探测选择结果的价值,降低了部署探测站点和执行探测对网络带来的负面影响。为提高故障诊断算法性能,故障诊断算法一般都会基于网络特征构建故障依赖矩阵,从而方便将故障诊断问题使用数学理论进行求解。对于网络虚拟化环境下的故障诊断问题,主要方法是将网络模型从多层模型分解为两层模型,从而简化问题的求解,当前已有研究以被动接受症状,建立故障诊断模型进行故障诊断为主,存在故障诊断准确率低的问题。
发明内容
有鉴于现有技术的上述缺陷,本发明的目的就是提供一种网络故障诊断方法、装置及可读存储介质,用以提高故障诊断的效率。
本发明的目的之一是通过这样的技术方案实现的,一种网络故障诊断方法,包括如下步骤:
根据确定的底层网络资源的业务相关性构建备选探测节点集合;
基于所述备选探测节点集合对网络状态进行探测;
根据探测结果构建诊断模型;
基于历史故障概率、探测性能以及所述诊断模型进行可信度评估,以获得故障集合。
可选的,所述根据确定的底层网络资源的业务相关性构建备选探测节点集合,包括:
根据业务对网络的需求对网络进行切分,以获得切片网络;
基于所述切片网络构建网络拓扑;
基于所述网络拓扑确定底层网络资源的业务相关性;
根据所述业务相关性的大小对底层网络资源进行排序,以获得备选探测节点集合。
可选的,所述基于所述网络拓扑确定底层网络资源的业务相关性,包括:
根据所述网络拓扑中底层网络资源上的虚拟资源以及所述虚拟资源对应的业务数量确定底层网络资源的业务相关性,满足:
Figure BDA0002609908340000021
其中,
Figure BDA0002609908340000022
表示底层网络资源的业务相关性,ni表示底层网络节点,z表示底层网络资源上承载的虚拟网数量,λj表示第j个虚拟网上承载的业务数量。
可选的,所述根据确定的底层网络资源的业务相关性构建备选探测节点集合之后,还包括:
根据所述备选探测节点集合与已有探测集合之间的独立性确定优化探测集合。
可选的,根据所述备选探测节点集合与已有探测集合之间的独立性确定优化探测集合,包括:
基于所述备选探测节点集合中的备选探测节点对所有的底层网络节点进行探测;
根据对所有的底层网络节点完成探测的备选探测节点构建优化探测节点集合。
可选的,所述基于所述备选探测节点集合中的备选探测节点对所有的底层网络节点进行探测,包括:
确定所述备选探测节点集合中的备选探测节点与已有探测集合的独立性,满足:
Figure BDA0002609908340000031
其中,p(tx,ni)表示网络节点ni被探测tx经过的概率,p(ty,nj)表示网络节点nj被探测ty经过的概率,EV(tx,ty)表示探测tx与探测ty的独立性;
根据所述备选探测节点的独立性之和的大小对所有的底层网络节点进行探测。
可选的,基于历史故障概率、探测性能以及所述诊断模型进行可信度评估,包括:
根据预先构建的多种类型的异常集合基于历史故障概率和探测性能确定异常集合对应的性能指标,满足:
Figure BDA0002609908340000032
其中,Okj表示异常集合,
Figure BDA0002609908340000033
表示异常集合的性能指标,α、β表示调节因子,k表示异常集合中故障节点的数量,
Figure BDA0002609908340000034
表示故障节点ni的探测性能;
基于所述性能指标和所述诊断模型进行可信度评估,以获得故障集合。
可选的,所述基于所述性能指标和所述诊断模型进行可信度评估以获得故障集合,包括:
基于所述性能指标选取与所述探测结果匹配的异常集合;
根据所述诊断模型确定所述异常集合的可信度,满足:
Figure BDA0002609908340000035
其中,
Figure BDA0002609908340000036
表示观察到的异常探测属于异常集合Okj产生的概率,
Figure BDA0002609908340000037
表示异常集合Okj可以产生的所有的异常探测的概率,
Figure BDA0002609908340000038
表示底层网络节点
Figure BDA0002609908340000039
导致
Figure BDA00026099083400000310
异常的概率;
选取所述异常集合中可信度大于预设阈值的异常探测作为故障集合。
本发明的目的之二是通过这样的技术方案实现的,一种网络故障诊断装置,包括:
集合构建单元,用于根据确定的底层网络资源的业务相关性构建备选探测节点集合;
探测单元,用于基于所述备选探测节点集合对网络状态进行探测;
模型构建单元,用于根据探测结果构建诊断模型;
评估单元,用于基于历史故障概率、探测性能以及所述诊断模型进行可信度评估,以获得故障集合。
本发明的目的之三是通过这样的技术方案实现的,一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现如前述的网络故障诊断方法。
由于采用了上述技术方案,本发明具有如下的优点:根据确定的底层网络资源的业务相关性构建备选探测节点集合,基于历史故障概率和探测性能对探测结果进行可信度评估,能够将虚假症状和虚拟故障进行过滤,从而提升故障诊断模型的准确度,提高了故障诊断的效率。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。
附图说明
本发明的附图说明如下:
图1为本发明第一实施例流程图;
图2为本发明第一实施例构建探测节点集合流程图;
图3为本发明第一实施例诊断模型示意图;
图4为本发明第一实施例获得故障集合流程图;
图5为本发明第一实施例故障诊断准确率比较示意图;
图6为本发明第一实施例故障诊断误报率比较示意图;
图7为本发明第一实施例故障诊断时长比较示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
实施例一
本发明第一实施例提出一种网络故障诊断方法,如图1所示,包括如下步骤:
S10、根据确定的底层网络资源的业务相关性构建备选探测节点集合;
S20、基于所述备选探测节点集合对网络状态进行探测;
S30、根据探测结果构建诊断模型;
S40、基于历史故障概率、探测性能以及所述诊断模型进行可信度评估,以获得故障集合。
本发明方法根据确定的底层网络资源的业务相关性构建备选探测节点集合,基于历史故障概率和探测性能对探测结果进行可信度评估,能够将虚假症状和虚拟故障进行过滤,从而提升故障诊断模型的准确度,提高了故障诊断的效率。
可选的,如图2所示,所述根据确定的底层网络资源的业务相关性构建备选探测节点集合,包括:
S101、根据业务对网络的需求对网络进行切分,以获得切片网络;
具体的说,根据业务对网络的不同需求,可以把网络切分为移动宽带切片(承载通信业务和互联网业务等)、海量物联网切片(承载智能农业和智慧安防等)和任务关键性物联网切片(承载无人驾驶和智慧工厂等)。
S102、基于所述切片网络构建网络拓扑;
具体的,本实施例中以5G核心网为主要研究对象,使用G=(N,E)表示底层网络拓扑,其中,N表示底层网络节点集合,包括底层网络节点ni∈N。E表示底层网络链路集合,包括底层链路ej∈E。使用GV=(NV,EV)表示虚拟网络拓扑,其中,NV表示虚拟网络节点集合,包括虚拟网络节点
Figure BDA0002609908340000051
EV表示虚拟网络链路集合,包括虚拟链路
Figure BDA0002609908340000052
S103、基于所述网络拓扑确定底层网络资源的业务相关性;
可选的,所述基于所述网络拓扑确定底层网络资源的业务相关性,包括:
根据所述网络拓扑中底层网络资源上的虚拟资源以及所述虚拟资源对应的业务数量确定底层网络资源的业务相关性,满足:
Figure BDA0002609908340000053
其中,
Figure BDA0002609908340000054
表示底层网络资源的业务相关性,ni表示底层网络节点,z表示底层网络资源上承载的虚拟网数量,λj表示第j个虚拟网上承载的业务数量。
具体的,基于前述拓扑结构,每个底层网络资源G=(N,E)会承载多个虚拟网络。每个虚拟网络GV=(NV,EV)上可以同时运行多个5G业务。所以,基于每个底层网络资源上的虚拟资源数量,以及每个虚拟资源上的业务数量,可以获得当前底层网络资源的业务相关性。底层网络资源的业务相关性使用
Figure BDA0002609908340000061
表示,满足:
Figure BDA0002609908340000062
该值越大,说明其上的业务数量越多,z表示底层网络资源上承载的虚拟网数量,λj表示第j个虚拟网上承载的业务数量。
S104、根据所述业务相关性的大小对底层网络资源进行排序,以获得备选探测节点集合。
具体的,通过计算底层网络资源的业务相关性
Figure BDA0002609908340000063
就可以选择出重要的底层网络资源。按照各个底层资源的业务相关性
Figure BDA0002609908340000064
降序排列,就构成了初始的备选探测集合Tstar
可选的,所述根据确定的底层网络根据确定的底层网络资源的业务相关性构建备选探测节点集合之后,还包括:
根据所述备选探测节点集合与已有探测集合之间的独立性确定优化探测集合。
具体地说,在获得备选探测节点集合之后,本实施例中进一步对备选探测节点集合进行优化,以获得优化探测集合。
可选的,根据所述备选探测节点集合与已有探测集合之间的独立性确定优化探测集合,包括:
S105、基于所述备选探测节点集合中的备选探测节点对所有的底层网络节点进行探测;
S106、根据对所有的底层网络节点完成探测的备选探测节点构建优化探测节点集合。
具体地说,在本实施例中,基于路由协议以动态路由协议为主,探测经过网络节点ni存在不确定性,使用p(tx,ni)表示网络节点ni被探测tx经过的概率,计算方法为探测运行一定次数中,经过网络节点ni所占的比例。使用node(tx)表示探测tx经过的节点的集合。如果网络节点nj是探测tx、ty共同经过的节点,将网络节点nj称为探测tx、ty的阴影节点。本实施例中定义探测tx、ty的独立性评估函数EV(tx,ty),满足:
Figure BDA0002609908340000071
其中,nj∈node(tx)∩node(ty),表示探测tx、ty经过节点的交集。
具体的,将所有的底层网络节点放入待探测集合NS。首先,取出Tstar中的第一个节点
Figure BDA0002609908340000072
放入探测节点集合Tend,并将其到网络所有叶子节点的探测经过的节点从待探测集合NS中取出,并标记当前节点的探测集合为
Figure BDA0002609908340000073
其次,依次从Tstar集合中取出备选探测节点,直到待探测集合NS为空,由此获得优化探测节点集合。
可选的,所述基于所述备选探测节点集合中的备选探测节点对所有的底层网络节点进行探测,包括:
确定所述备选探测节点集合中的备选探测节点与已有探测集合的独立性,满足:
Figure BDA0002609908340000074
其中,p(tx,ni)表示网络节点ni被探测tx经过的概率,p(ty,nj)表示网络节点nj被探测ty经过的概率,EV(tx,ty)表示探测tx与探测ty的独立性;
根据所述备选探测节点的独立性之和的大小对所有的底层网络节点进行探测。
具体地说,在本实施例中获取优化探测节点集合包括:
首先,计算Tstar集合中每个节点构成的探测与已有探测集合的独立性;
然后将独立性之和最大的网络节点作为探测节点,放入探测节点集合Tend
将新放入探测节点的所有探测经过的网络节点,从待探测集合NS中取出,直到待探测集合NS为空,由此获得优化探测节点集合。
在获得优化探测节点集合之后,S20、基于所述备选探测节点集合对网络状态进行探测,包括:通过基于优化探测节点集合发送探测,可以得到网络的状态。
S30、根据探测结果构建诊断模型;
具体地说,在本实施例中,为提高探测结果的分析效果,一般采用探测矩阵对探测结果进行管理。探测矩阵是一个二维矩阵,矩阵的行由探测经过的网络节点和探测结果构成。矩阵的列由网络节点构成。根据探测结果,可以基于贝叶斯理论建立故障诊断模型。如图3所示,模型中的上层节点表示网络节点,下层节点表示探测节点,上层节点到下层节点的有向线表示上层节点出现异常时,下层的探测结果为异常的概率。
可选的,基于历史故障概率、探测性能以及所述诊断模型进行可信度评估,包括:
S41、根据预先构建的多种类型的异常集合基于历史故障概率和探测性能确定异常集合对应的性能指标,满足:
Figure BDA0002609908340000081
其中,Okj表示异常集合,
Figure BDA0002609908340000082
表示异常集合的性能指标,α、β表示调节因子,k表示异常集合中故障节点的数量,
Figure BDA0002609908340000083
表示故障节点ni的探测性能;
本实施例中,为提升构建疑似故障集合的效率,本发明基于历史故障概率和探测性能结合,分析故障集合的性能指标,具体的,本实施例在构建疑似故障集合时,从故障节点集合X中基于历史故障概率、探测能力构建疑似故障集合,假设同时发生故障的数量为k,构建故障数量为1到k的k个疑似故障集合。
然后基于历史故障概率和探测性能确定异常集合对应的性能指标,满足:
Figure BDA0002609908340000084
其中,
Figure BDA0002609908340000085
表示底层节点ni的历史故障概率,取值为时间段T内发生故障的次数。使用
Figure BDA0002609908340000086
表示故障节点ni的探测性能,取值为故障节点ni对应的探测结果小于0.5的数量,该值越大,表明该集合中的底层网络节点对应的探测为异常的数量较多。Okj表示故障集合,
Figure BDA0002609908340000087
表示故障集合Okj的解释能力也即性能指标,k表示故障集合中故障节点的数量,j表示第j个故障集合,α、β表示调节因子。
S42、基于所述性能指标和所述诊断模型进行可信度评估,以获得故障集合。
可选的,如图4所示,所述基于所述性能指标和所述诊断模型进行可信度评估以获得故障集合,包括:
S421,基于所述性能指标选取与所述探测结果匹配的异常集合;
S422,根据所述诊断模型确定所述异常集合的可信度,满足:
Figure BDA0002609908340000088
其中,
Figure BDA0002609908340000091
表示观察到的异常探测属于异常集合Okj产生的概率,
Figure BDA0002609908340000092
表示异常集合Okj可以产生的所有的异常探测的概率,
Figure BDA0002609908340000093
表示底层网络节点
Figure BDA0002609908340000094
导致
Figure BDA0002609908340000095
异常的概率;
S423,选取所述异常集合中可信度大于预设阈值的异常探测作为故障集合。
具体地说,在本实施例中,为提高故障诊断的性能,本发明构造k种类型的故障集合,每种类型的故障集合中包含j个网络节点。为了从k*j个故障节点集合中选择最好的故障集合,定义可信度计算公式进行可信度评估,满足:
Figure BDA0002609908340000096
其中,
Figure BDA0002609908340000097
表示观察到的异常探测属于故障集合Okj产生的概率,
Figure BDA0002609908340000098
表示故障集合Okj可以产生的所有的异常探测的概率。
Figure BDA0002609908340000099
表示底层网络节点
Figure BDA00026099083400000910
导致
Figure BDA00026099083400000911
异常的概率(基于诊断模型获得)。
在具体实施过程中,若故障集合导致的异常探测都被发现,说明该故障集合发生真正故障的概率较高,则可以CL(Okj)取值大于预设阈值的疑似故障集合,作为最终的故障集合。
为了验证本发明的性能,本实施例中进一步与基于故障诊断模型的故障诊断算法(Fault diagnosis algorithm based on fault diagnosis model,FDAoFDM)进行比较。本实施例中FDAoFDM采用底层网络和虚拟网络的映射关系,将服务状态与底层网络资源进行关联,构建故障传播模型进行故障定位。
在性能指标方面,从诊断准确度、误判率以及诊断时长三个方面进行分析。诊断准确度是指算法识别出的真实故障数量在总的真实故障数量中的占比。误判率是指诊断出的故障中虚假故障在总的诊断出的故障中的占比。诊断时长是指算法从接收服务状态和网络拓扑数据后,到输出故障节点集合所用的时长。诊断准确度越高,表明算法识别故障的能力越强。诊断误报率越低,说明算法识别出的故障为真实故障的能力越强。诊断时长越短,表明算法能够在较短的时间内求解出故障,为网络管理人员节省故障定位时长。
故障诊断准确率比较结果如图5所示。X轴表示网络节点数量,Y轴表示诊断准确率。从图可知,两个算法的诊断准确率受网络规模的影响较小。本发明方法的诊断准确率比传统算法显著提升。表明本发明方法对故障诊断模型的优化效果较好。
故障诊断误报率比较结果如图6所示,X轴表示网络节点数量,Y轴表示误报率。从图可知,网络规模对两个算法的影响都比较小,本发明算法的误报率低于传统算法。这是因为本发明方法采取主动探测技术,能够将虚假症状和虚拟故障进行过滤,从而提升故障诊断模型的准确度。
故障诊断时长比较结果如图7所示。X轴表示网络节点数量,Y轴表示诊断的时长。从图可知,随着网络规模的增加,两个算法的诊断时长都快速增加,说明网络规模增加,需要处理的故障诊断模型数据量快速增加,延长了故障诊断的时间。由于本发明方法需要选择探测节点并进行主动探测,所以故障诊断时间较长。
实施例二
本发明第二实施例提出一种网络故障诊断装置,包括:
集合构建单元,用于根据确定的底层网络资源的业务相关性构建备选探测节点集合;
探测单元,用于基于所述备选探测节点集合对网络状态进行探测;
模型构建单元,用于根据探测结果构建诊断模型;
评估单元,用于基于历史故障概率、探测性能以及所述诊断模型进行可信度评估,以获得故障集合。
本发明根据确定的底层网络资源的业务相关性构建备选探测节点集合,基于历史故障概率和探测性能对探测结果进行可信度评估,能够将虚假症状和虚拟故障进行过滤,从而提升故障诊断模型的准确度,提高了故障诊断的效率。
实施例三
本发明第三实施例提出一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现如前述的网络故障诊断方法。
具体的,在一个可选的实施例中,所述程序被处理器执行时实现:
根据确定的底层网络资源的业务相关性构建备选探测节点集合;
基于所述备选探测节点集合对网络状态进行探测;
根据探测结果构建诊断模型;
基于历史故障概率、探测性能以及所述诊断模型进行可信度评估,以获得故障集合。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的保护范围之内。

Claims (10)

1.一种网络故障诊断方法,其特征在于,包括如下步骤:
根据确定的底层网络资源的业务相关性构建备选探测节点集合;
基于所述备选探测节点集合对网络状态进行探测;
根据探测结果构建诊断模型;
基于历史故障概率、探测性能以及所述诊断模型进行可信度评估,以获得故障集合。
2.如权利要求1所述的网络故障诊断方法,其特征在于,所述根据确定的底层网络资源的业务相关性构建备选探测节点集合,包括:
根据业务对网络的需求对网络进行切分,以获得切片网络;
基于所述切片网络构建网络拓扑;
基于所述网络拓扑确定底层网络资源的业务相关性;
根据所述业务相关性的大小对底层网络资源进行排序,以获得备选探测节点集合。
3.如权利要求2所述的网络故障诊断方法,其特征在于,所述基于所述网络拓扑确定底层网络资源的业务相关性,包括:
根据所述网络拓扑中底层网络资源上的虚拟资源以及所述虚拟资源对应的业务数量确定底层网络资源的业务相关性,满足:
Figure FDA0002609908330000011
其中,
Figure FDA0002609908330000012
表示底层网络资源的业务相关性,ni表示底层网络节点,z表示底层网络资源上承载的虚拟网数量,λj表示第j个虚拟网上承载的业务数量。
4.如权利要求3所述的网络故障诊断方法,其特征在于,所述根据确定的底层网络资源的业务相关性构建备选探测节点集合之后,还包括:
根据所述备选探测节点集合与已有探测集合之间的独立性确定优化探测集合。
5.如权利要求4所述的网络故障诊断方法,其特征在于,根据所述备选探测节点集合与已有探测集合之间的独立性确定优化探测集合,包括:
基于所述备选探测节点集合中的备选探测节点对所有的底层网络节点进行探测;
根据对所有的底层网络节点完成探测的备选探测节点构建优化探测节点集合。
6.如权利要求5所述的网络故障诊断方法,其特征在于,所述基于所述备选探测节点集合中的备选探测节点对所有的底层网络节点进行探测,包括:
确定所述备选探测节点集合中的备选探测节点与已有探测集合的独立性,满足:
Figure FDA0002609908330000021
其中,p(tx,ni)表示网络节点ni被探测tx经过的概率,p(ty,nj)表示网络节点nj被探测ty经过的概率,EV(tx,ty)表示探测tx与探测ty的独立性;
根据所述备选探测节点的独立性之和的大小对所有的底层网络节点进行探测。
7.如权利要求1-3任一项所述的网络故障诊断方法,其特征在于,基于历史故障概率、探测性能以及所述诊断模型进行可信度评估,包括:
根据预先构建的多种类型的异常集合再基于历史故障概率和探测性能确定异常集合对应的性能指标,满足:
Figure FDA0002609908330000022
其中,Okj表示异常集合,
Figure FDA0002609908330000023
表示异常集合的性能指标,α、β表示调节因子,k表示异常集合中故障节点的数量,
Figure FDA0002609908330000024
表示故障节点ni的探测性能;
基于所述性能指标和所述诊断模型进行可信度评估,以获得故障集合。
8.如权利要求7所述的网络故障诊断方法,其特征在于,所述基于所述性能指标和所述诊断模型进行可信度评估以获得故障集合,包括:
基于所述性能指标选取与所述探测结果匹配的异常集合;
根据所述诊断模型确定所述异常集合的可信度,满足:
Figure FDA0002609908330000025
其中,
Figure FDA0002609908330000026
表示观察到的异常探测属于异常集合Okj产生的概率,
Figure FDA0002609908330000027
表示异常集合Okj可以产生的所有的异常探测的概率,
Figure FDA0002609908330000028
表示底层网络节点
Figure FDA0002609908330000029
导致
Figure FDA00026099083300000210
异常的概率;
选取所述异常集合中可信度大于预设阈值的异常探测作为故障集合。
9.一种网络故障诊断装置,其特征在于,包括:
集合构建单元,用于根据确定的底层网络资源的业务相关性构建备选探测节点集合;
探测单元,用于基于所述备选探测节点集合对网络状态进行探测;
模型构建单元,用于根据探测结果构建诊断模型;
评估单元,用于基于历史故障概率、探测性能以及所述诊断模型进行可信度评估,以获得故障集合。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现如权利要求1至8中任一项所述的网络故障诊断方法。
CN202010750489.XA 2020-07-30 2020-07-30 一种网络故障诊断方法、装置及可读存储介质 Active CN111884859B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010750489.XA CN111884859B (zh) 2020-07-30 2020-07-30 一种网络故障诊断方法、装置及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010750489.XA CN111884859B (zh) 2020-07-30 2020-07-30 一种网络故障诊断方法、装置及可读存储介质

Publications (2)

Publication Number Publication Date
CN111884859A true CN111884859A (zh) 2020-11-03
CN111884859B CN111884859B (zh) 2022-10-21

Family

ID=73204502

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010750489.XA Active CN111884859B (zh) 2020-07-30 2020-07-30 一种网络故障诊断方法、装置及可读存储介质

Country Status (1)

Country Link
CN (1) CN111884859B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112866009A (zh) * 2021-01-04 2021-05-28 国网山东省电力公司青岛供电公司 一种综合服务站虚拟网络故障诊断方法及装置
CN113285837A (zh) * 2021-05-26 2021-08-20 广东电网有限责任公司 一种基于拓扑感知的载波网络服务故障诊断方法及装置
CN113315660A (zh) * 2021-05-26 2021-08-27 广东电网有限责任公司 一种基于网络和业务关系的载波网络故障诊断方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103308824A (zh) * 2013-05-31 2013-09-18 东北大学 一种基于概率Petri网的电力系统故障诊断方法
CN106603293A (zh) * 2016-12-20 2017-04-26 南京邮电大学 虚拟网络环境下一种基于深度学习的网络故障诊断方法
CN107844627A (zh) * 2017-09-25 2018-03-27 北京理工大学 一种仅输出时变结构模态参数贝叶斯估计方法
US20180091418A1 (en) * 2016-09-23 2018-03-29 Huawei Technologies Co., Ltd. Method and Related Apparatus for Probing Packet Forwarding Path
US20180091392A1 (en) * 2016-09-28 2018-03-29 Amazon Technologies, Inc. Visualization of network health information
CN107896168A (zh) * 2017-12-08 2018-04-10 国网安徽省电力有限公司信息通信分公司 一种网络虚拟化环境下的电力通信网多域故障诊断方法
US20180295013A1 (en) * 2017-04-06 2018-10-11 At&T Intellectual Property I, L.P. Network trouble shooting digital assistant system
CN110380903A (zh) * 2019-07-23 2019-10-25 广东电网有限责任公司 一种电力通信网故障探测方法、装置及设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103308824A (zh) * 2013-05-31 2013-09-18 东北大学 一种基于概率Petri网的电力系统故障诊断方法
US20180091418A1 (en) * 2016-09-23 2018-03-29 Huawei Technologies Co., Ltd. Method and Related Apparatus for Probing Packet Forwarding Path
US20180091392A1 (en) * 2016-09-28 2018-03-29 Amazon Technologies, Inc. Visualization of network health information
CN106603293A (zh) * 2016-12-20 2017-04-26 南京邮电大学 虚拟网络环境下一种基于深度学习的网络故障诊断方法
US20180295013A1 (en) * 2017-04-06 2018-10-11 At&T Intellectual Property I, L.P. Network trouble shooting digital assistant system
CN107844627A (zh) * 2017-09-25 2018-03-27 北京理工大学 一种仅输出时变结构模态参数贝叶斯估计方法
CN107896168A (zh) * 2017-12-08 2018-04-10 国网安徽省电力有限公司信息通信分公司 一种网络虚拟化环境下的电力通信网多域故障诊断方法
CN110380903A (zh) * 2019-07-23 2019-10-25 广东电网有限责任公司 一种电力通信网故障探测方法、装置及设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李栋: "面向故障诊断的并行关联规则算法研究与实现", 《中国优秀硕士论文电子期刊网》 *
潘亚莲: "网络虚拟化环境下的故障探测和诊断算法", 《中国优秀硕士论文电子期刊网》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112866009A (zh) * 2021-01-04 2021-05-28 国网山东省电力公司青岛供电公司 一种综合服务站虚拟网络故障诊断方法及装置
CN112866009B (zh) * 2021-01-04 2023-03-10 国网山东省电力公司青岛供电公司 一种综合服务站虚拟网络故障诊断方法及装置
CN113285837A (zh) * 2021-05-26 2021-08-20 广东电网有限责任公司 一种基于拓扑感知的载波网络服务故障诊断方法及装置
CN113315660A (zh) * 2021-05-26 2021-08-27 广东电网有限责任公司 一种基于网络和业务关系的载波网络故障诊断方法及系统

Also Published As

Publication number Publication date
CN111884859B (zh) 2022-10-21

Similar Documents

Publication Publication Date Title
CN111884859B (zh) 一种网络故障诊断方法、装置及可读存储介质
Yang et al. A time efficient approach for detecting errors in big sensor data on cloud
CN110888755B (zh) 一种微服务系统异常根因节点的查找方法及装置
Chen et al. Outage prediction and diagnosis for cloud service systems
CN108306756B (zh) 一种基于电力数据网全息评估系统及其故障定位方法
US8392760B2 (en) Diagnosing abnormalities without application-specific knowledge
US11348023B2 (en) Identifying locations and causes of network faults
CN113935497A (zh) 智能运维故障处理方法、装置、设备及其存储介质
US10884805B2 (en) Dynamically configurable operation information collection
CN113516174B (zh) 调用链异常检测方法、计算机设备以及可读存储介质
CN113516244B (zh) 一种智能运维方法、装置、电子设备及存储介质
CN112769605B (zh) 一种异构多云的运维管理方法及混合云平台
CN109194534B (zh) 面向物联网设备群体的调度与管理方法
CN112383934B (zh) 一种5g网络切片下多域协作的服务故障诊断方法
CN115237717A (zh) 一种微服务异常检测方法和系统
CN112367191B (zh) 一种5g网络切片下服务故障定位方法
CN113467421B (zh) 获取微服务健康状态指标的方法和微服务异常诊断方法
CN103023028A (zh) 一种基于实体间依赖关系图的电网故障快速定位方法
Zhang et al. Faulty sensor data detection in wireless sensor networks using logistical regression
CN115421950A (zh) 一种基于机器学习的自动化系统运维管理方法及系统
He et al. Fault detection and diagnosis of cyber-physical system using the computer vision and image processing
CN111769974A (zh) 一种云系统故障诊断方法
CN113518367B (zh) 5g网络切片下基于服务特征的故障诊断方法及系统
CN114461439A (zh) 一种故障诊断方法、装置、设备及存储介质
CN117221087A (zh) 告警根因定位方法、装置及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant