CN113285837B - 一种基于拓扑感知的载波网络服务故障诊断方法及装置 - Google Patents

一种基于拓扑感知的载波网络服务故障诊断方法及装置 Download PDF

Info

Publication number
CN113285837B
CN113285837B CN202110581841.6A CN202110581841A CN113285837B CN 113285837 B CN113285837 B CN 113285837B CN 202110581841 A CN202110581841 A CN 202110581841A CN 113285837 B CN113285837 B CN 113285837B
Authority
CN
China
Prior art keywords
network
fault
underlying
core
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110581841.6A
Other languages
English (en)
Other versions
CN113285837A (zh
Inventor
付佳佳
施展
梁宇图
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Power Grid Co Ltd
Electric Power Dispatch Control Center of Guangdong Power Grid Co Ltd
Original Assignee
Guangdong Power Grid Co Ltd
Electric Power Dispatch Control Center of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Power Grid Co Ltd, Electric Power Dispatch Control Center of Guangdong Power Grid Co Ltd filed Critical Guangdong Power Grid Co Ltd
Priority to CN202110581841.6A priority Critical patent/CN113285837B/zh
Publication of CN113285837A publication Critical patent/CN113285837A/zh
Application granted granted Critical
Publication of CN113285837B publication Critical patent/CN113285837B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于拓扑感知的载波网络服务故障诊断方法及装置,包括:根据k-Core算法将底层网络分解成边缘子网和核心子网;根据虚拟网和底层网络的映射关系,构建故障传播模型;根据第一预设条件,获取底层网络中每个底层网络节点的故障可信度;根据故障可信度和第二预设条件,计算得到故障传播模型的疑似故障集合;将边缘子网和核心子网的故障传播模型的疑似故障集合进行合并和去重处理;并对处理后的疑似故障集合进行降序处理,获得最终的疑似故障集合。本发明能够根据底层网络的拓扑特征和故障传播模型的特征,对边缘子网、核心子网分别进行网络节点故障可信度评估、疑似故障集合计算,提升了虚拟网服务故障诊断算法的效率。

Description

一种基于拓扑感知的载波网络服务故障诊断方法及装置
技术领域
本发明涉及载波网络服务技术领域,特别是涉及一种基于拓扑感知的载波网络服务故障诊断方法、装置、终端设备和可读存储介质。
背景技术
载波网络环境下,海量物联数据的接入对网络资源提出较大的需求。为解决此问题,网络切片技术被应用到载波网络中。在此背景下,基础网络被划分为底层网络和虚拟网络。底层网络负责为虚拟网络提供底层节点和底层链路资源。虚拟网络从底层网络租用资源构建虚拟节点和虚拟链路,用于承载特定的虚拟网络服务。在此背景下,虚拟网服务提供商可以快速构建虚拟网并提供虚拟网服务,从而提升了服务的上线速度。但是,由于虚拟网服务商不掌握底层网络资源的运营数据,当底层网络资源出现故障时,如何快速发现和解决底层网络故障,保证虚拟网可靠性,已成为急需解决的关键问题。
发明内容
本发明的目的是:提供一种基于拓扑感知的载波网络服务故障诊断方法、装置、终端和存储介质,能够根据底层网络的拓扑特征和故障传播模型的特征,对边缘子网、核心子网分别进行网络节点故障可信度评估、疑似故障集合计算,有效提升了虚拟网服务故障诊断算法的效率。
为了实现上述目的,本发明提供了一种基于拓扑感知的载波网络服务故障诊断方法,包括:
根据k-Core算法将底层网络分解成边缘子网和核心子网;
根据虚拟网和底层网络的映射关系,分别对所述边缘子网和核心子网构建故障传播模型;
根据第一预设条件,获取底层网络中每个底层网络节点的故障可信度;
根据所述每个底层网络节点的故障可信度和第二预设条件,计算得到所述边缘子网和核心子网的故障传播模型的疑似故障集合;
将所述边缘子网和核心子网的故障传播模型的疑似故障集合进行合并和去重处理;获得处理后的疑似故障集合;
根据所述每个底层网络节点的故障可信度和第二预设条件,对所述处理后的疑似故障集合进行处理,获得最终的疑似故障集合。
进一步地,所述根据k-Core算法将底层网络分解成边缘子网和核心子网,包括:
查找底层网络中度数为1的节点;
删除底层网络中度数为1的节点以及相应的边,并放入边缘子网;
判断底层网络中是否还有度数为1的节点,若是,返回步骤查找底层网络中度数为1的节点;
将边缘子网中节点和边的壳指数赋值1;
将所有未裁剪掉的节点和边放入核心子网并将壳指数赋值2。
进一步地,所述第一预设条件,采用如下公式:
Figure BDA0003085263660000021
其中,
Figure BDA0003085263660000022
表示故障节点fi上承载的虚拟网服务中出现异常服务集合
Figure BDA0003085263660000023
Figure BDA0003085263660000024
表示故障节点fi上承载的所有虚拟网服务组成的集合
Figure BDA0003085263660000025
P(sj|fi)表示故障节点fi不可用时,其上承载的虚拟网服务sj出现异常的概率。
进一步地,所述第二预设条件,采用如下公式:
Ability(h*)=argmaxf∈h,s∈SRF(f)×EF(s)
Figure BDA0003085263660000031
Figure BDA0003085263660000032
其中,RF(f)表示h中的故障为真实故障的概率;EF(s)表示S中的被观测的症状能找到对应的发生故障的底层节点的概率;|h|表示故障集合h中包含的故障数量。
本发明实施例还提供一种基于拓扑感知的载波网络服务故障诊断装置,包括:分解模块、构建模块、可信度模块、第一获取模块、数据处理模块和第二获取模块,其中,
所述分解模块,用于根据k-Core算法将底层网络分解成边缘子网和核心子网;
所述构建模块,用于根据虚拟网和底层网络的映射关系,分别对所述边缘子网和核心子网构建故障传播模型;
所述可信度模块,用于根据第一预设条件,获取底层网络中每个底层网络节点的故障可信度;
所述第一获取模块,用于根据所述每个底层网络节点的故障可信度和第二预设条件,处理得到所述边缘子网和核心子网的故障传播模型的疑似故障集合;
所述数据处理模块,用于将所述边缘子网和核心子网的故障传播模型的疑似故障集合进行合并和去重处理;获得处理后的疑似故障集合;
所述第二获取模块,根据所述每个底层网络节点的故障可信度和第二预设条件,对所述处理后的疑似故障集合进行处理,获得最终的疑似故障集合。
进一步地,所述分解模块,具体用于:
查找底层网络中度数为1的节点;
删除底层网络中度数为1的节点以及相应的边,并放入边缘子网;
判断底层网络中是否还有度数为1的节点,若是,返回步骤查找底层网络中度数为1的节点;
将边缘子网中节点和边的壳指数赋值1;
将所有未裁剪掉的节点和边放入核心子网并将壳指数赋值2。
进一步地,所述第一预设条件,采用如下公式:
Figure BDA0003085263660000041
其中,
Figure BDA0003085263660000042
表示故障节点fi上承载的虚拟网服务中出现异常服务集合
Figure BDA0003085263660000043
Figure BDA0003085263660000044
表示故障节点fi上承载的所有虚拟网服务组成的集合
Figure BDA0003085263660000045
P(sj|fi)表示故障节点fi不可用时,其上承载的虚拟网服务sj出现异常的概率。
进一步地,所述第二预设条件,采用如下公式:
Ability(h*)=argmaxf∈h,s∈SRF(f)×EF(s)
Figure BDA0003085263660000046
Figure BDA0003085263660000047
其中,RF(f)表示h中的故障为真实故障的概率;EF(s)表示S中的被观测的症状能找到对应的发生故障的底层节点的概率;|h|表示故障集合h中包含的故障数量。
本发明实施例还提供一种计算机终端设备,包括:一个或多个处理器;存储器,与所述处理器耦接,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述任一项所述的基于拓扑感知的载波网络服务故障诊断方法。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述的基于拓扑感知的载波网络服务故障诊断方法。
本发明实施例一种基于拓扑感知的载波网络服务故障诊断方法及装置与现有技术相比,其有益效果在于:
根据底层网络的拓扑特征和故障传播模型的特征,对边缘子网、核心子网分别进行网络节点故障可信度评估、疑似故障集合计算,有效提升了虚拟网服务故障诊断算法的效率。
附图说明
图1为本发明某一实施例提供的基于拓扑感知的载波网络服务故障诊断方法的流程示意图;
图2为本发明某一实施例提供的虚拟网映射示意图;
图3为本发明某一实施例提供的故障传播模型示意图;
图4为本发明某一实施例提供的故障诊断算法的准确率比较示意图;
图5为本发明某一实施例提供的故障诊断算法的误报率比较示意图;
图6为本发明某一实施例提供的故障诊断算法的运行时间比较示意图;
图7为本发明某一实施例提供的基于拓扑感知的载波网络服务故障诊断装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,文中所使用的步骤编号仅是为了方便描述,不对作为对步骤执行先后顺序的限定。
应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如图1所示,本发明提供的一种基于拓扑感知的载波网络服务故障诊断方法,至少包括如下步骤:
S101、根据k-Core算法将底层网络分解成边缘子网和核心子网;
具体地,为降低故障推断过程的复杂度,采用表1中的基于k-core分解的底层网络分解算法,将底层网络GSN(V,E)分为边缘子网Gedge(V,E)、核心子网Gcore(V,E)。
需要说明的是,网络拓扑的稠密程度,与网络节点的度数相关。由虚拟网映射可知,度数高的底层节点上承载的虚拟资源较多。当度数高的网络节点发生故障时,导致较多的虚拟网业务不可用。
所以,可以根据网络节点的度数,将网络划分为不同稠密程度的子网。度数多的节点,划分到稠密的子网中,这些子网中的节点发生故障,导致虚拟网服务故障数量较多。基于此,根据网络节点的度数,本发明将网络分割为高度数子网、低度数子网,从而简化网络故障传播模型,便于故障定位。
由网络拓扑结构可知,网络一般分为接入网、汇聚网、核心网。随着网络扁平化、高带宽的发展趋势,现有的网络拓扑逐渐演变为接入网、核心网两个层次。接入网中网络节点的特点是度数小,核心网中网络节点的特点是度数大。k核分解可以根据网络节点的度数,对网络进行划分。本发明基于k核分解理论,将网络划分为边缘子网、核心子网。k核分解采用网络拓扑裁剪的方法,对网络拓扑进行分解。例如,对于网络拓扑G(V,E),采用K核分解算法,可以迭代的裁剪度数为k的节点,放入k核集合COREk,直到网络中的节点度数都大于k为止。此时,集合COREk中的节点就是度数为k的节点。
本发明通过k-core分解算法对底层网络进行分解。由于不同k核中网络节点构成的网络拓扑复杂度不同,所以,可以根据不同k核子网的特点,采用不同的故障诊断算法。在划分网络时,属于2-shell或具有更高壳指数的子图被划分为核心网络,而I-shell组成的子图属于边缘网络。
基于k-core分解的底层网络分解算法如表1所示。算法具体步骤为:(1)、删除拓扑中度数为1的节点以及相应的边;(2)、针对裁剪后的剩余图继续迭代地删除度为1的节点以及相应的边,直到拓扑中没有度数为1的节点为止;(3)、将所有裁剪掉的节点的壳指数赋值1,剩余的节点即为1核以上的节点。1-shell的节点和相应边构成多个边缘子网络,称为边缘子网。大于1-shell的所有节点和相应边构成一个核心网络,称为核心子网。
表1基于k-core分解的底层网络分解算法
Figure BDA0003085263660000071
Figure BDA0003085263660000081
S102、根据虚拟网和底层网络的映射关系,分别对所述边缘子网和核心子网构建故障传播模型;
具体地,根据虚拟网GVN(V,E)和底层网络GSN(V,E)的映射关系,以及步骤101中生成的边缘子网Gedge(V,E)和核心子网Gcore(V,E),构建边缘子网故障传播模型FPMedge、核心子网故障传播模型FPMcore
需要说明的是,网络切片后,传统的基础网络被分为虚拟网络和底层网络。底层网络包括底层节点和底层链路。虚拟网络包括虚拟节点和虚拟链路。底层网络的底层节点为虚拟网络的虚拟节点提供计算资源,底层网络的底层链路为虚拟网络的虚拟链路提供带宽资源。虚拟网使用虚拟节点和虚拟链路承载特定的虚拟网服务,为最终用户提供服务。本发明主要研究端到端的虚拟网服务。将虚拟节点和虚拟链路称为虚拟组件CVN。将底层节点和底层链路称为底层组件CSN。每个虚拟网络上可以承载多个虚拟网服务。如图2和图3所示,虚拟网1上承载了
Figure BDA0003085263660000082
Figure BDA0003085263660000083
两个虚拟网服务。虚拟网服务
Figure BDA0003085263660000084
使用的底层路径资源为(a1-b1);虚拟网服务
Figure BDA0003085263660000085
使用的底层路径资源为(a2-e2-d2);虚拟网2上承载了
Figure BDA0003085263660000091
Figure BDA0003085263660000092
两个虚拟网服务。虚拟网服务
Figure BDA0003085263660000093
使用的底层路径资源为(b2-d2-e2)。
为保证虚拟网服务的正常运行,网络运营商一般都会建设网络监控系统。网络监控系统可以获得服务和组件的状态。本发明将网络监控系统获得的服务运行状态称为服务的症状S。根据服务的状态,症状S可以分为正症状和负症状。其中,正症状是指服务正常运行的状态,负症状是指服务异常运行的状态。虚拟网VNi上承载的服务j的症状表示为
Figure BDA0003085263660000094
本发明将网络监控系统获得的组件的状态称为故障F。根据组件的状态,故障F可以分为正故障和负故障。正故障是指组件的状态为正常值。负故障是指组件的状态为异常值。当虚拟组件的状态为负故障时,其上承载的虚拟服务的状态为负症状。因为虚拟组件的资源由底层组件分配,所以,虚拟组件的故障是由底层组件故障导致。本发明的研究目标是快速准确的找到导致虚拟网服务为负症状的底层组件。底层网络SN中底层组件i的故障使用fi SN∈FSN表示。虚拟网VNi中虚拟组件j的故障使用
Figure BDA0003085263660000095
表示。虚拟网VNi中虚拟组件j的先验故障概率使用
Figure BDA0003085263660000096
表示,底层网络SN中底层组件i的先验故障概率表示为p(fi SN)。因为虚拟组件承载在底层组件上,所以,本发明主要研究底层组件的故障定位问题。
为了将症状和故障信息进行关联,本发明使用二分贝叶斯理论,构建症状和故障关系的故障传播模型(fault propagation model,FPM)。在故障传播模型中,包括上层节点、下层节点、上下层节点间的连线。上层节点表示症状节点,下层节点表示故障节点,上下层节点间的连线表示下层节点为负故障时,导致上层节点为负症状的概率,又称为条件概率,使用
Figure BDA0003085263660000101
表示,其取值范围为[0,1]。因为虚拟网组件承载在底层网组件上,在故障传播模型中,本发明基于虚拟组件和底层组件的映射关系,构建底层组件和虚拟网服务的故障传播模型。
S103、根据第一预设条件,获取底层网络中每个底层网络节点的故障可信度;
具体地,对于底层网络拓扑GSN(V,E)中每个底层网络节点,使用公式(1)计算其可信度
Figure BDA0003085263660000102
根据故障传播模型可知,网络节点发生故障时,其上承载的虚拟网服务将出现异常。基于此,可以通过分析每个网络节点承载的虚拟网服务的异常情况,分析网络节点发生故障的可能性。本发明将网络节点发生故障的可能性称为网络节点的故障可信度
Figure BDA0003085263660000103
使用公式(1)计算。其中,
Figure BDA0003085263660000104
表示故障节点fi上承载的虚拟网服务中出现异常服务集合
Figure BDA0003085263660000105
Figure BDA0003085263660000106
表示故障节点fi上承载的所有虚拟网服务组成的集合
Figure BDA0003085263660000107
P(sj|fi)表示故障节点fi不可用时,其上承载的虚拟网服务sj出现异常的概率。从公式可知,网络节点的故障可信度
Figure BDA0003085263660000108
的取值范围为(0,1)。该值越大,表明当前网络节点发生故障的可信度越大。
Figure BDA0003085263660000109
S104、根据所述每个底层网络节点的故障可信度和第二预设条件,计算得到所述边缘子网和核心子网的故障传播模型的疑似故障集合;
具体地,基于上述步骤计算得到的每个底层网络节点的可信度,对底层网络节点进行降序排序。之后,使用公式(2),在边缘子网故障传播模型FPMedge、核心子网故障传播模型FPMcore中分别求解最优的疑似故障集合
Figure BDA0003085263660000111
为了从故障传播模型中找到发生故障的网络节点,需要找到可以解释所有异常虚拟网服务的故障底层节点,并且找到的发生故障的底层节点数量最小。因为故障可信度可以对故障进行评价,所以,按照每个网络节点的故障可信度进行排序。依次选择前k个网络节点,组成疑似故障集合h={fi,fj,...,fk}。K的数量表示同时发生故障的网络节点的最大数量。一般取值为5个。求解最优的疑似故障集合h={fi,fj,...,fk}的故障解释能力Ability(h*),使用公式(2)进行计算。其中,RF(f)表示h中的故障为真实故障的概率,使用公式(3)计算。EF(s)表示S中的被观测的症状能找到对应的发生故障的底层节点的概率,使用公式(4)计算。公式(3)中,|h|表示故障集合h中包含的故障数量。
Ability(h*)=argmaxf∈h,s∈SRF(f)×EF(s) (2)
Figure BDA0003085263660000112
Figure BDA0003085263660000113
S105、将所述边缘子网和核心子网的故障传播模型的疑似故障集合进行合并和去重处理;获得处理后的疑似故障集合;
具体地,将疑似故障集合
Figure BDA0003085263660000114
进行合并,去除重复的底层网络节点。
S106、根据所述每个底层网络节点的故障可信度和第二预设条件,对所述处理后的疑似故障集合进行处理,获得最终的疑似故障集合。
具体地,基于每个底层网络节点的可信度,对合并去重后的疑似故障集合中底层网络节点进行降序排序。使用公式(2),确定最终的疑似故障集合
Figure BDA0003085263660000121
在本发明的某一个实施例中,所述根据k-Core算法将底层网络分解成边缘子网和核心子网,包括:
查找底层网络中度数为1的节点;
删除底层网络中度数为1的节点以及相应的边,并放入边缘子网;
判断底层网络中是否还有度数为1的节点,若是,返回步骤查找底层网络中度数为1的节点;
将边缘子网中节点和边的壳指数赋值1;
将所有未裁剪掉的节点和边放入核心子网并将壳指数赋值2。
在本发明的某一个实施例中,所述第一预设条件,采用如下公式:
Figure BDA0003085263660000122
其中,
Figure BDA0003085263660000123
表示故障节点fi上承载的虚拟网服务中出现异常服务集合
Figure BDA0003085263660000124
Figure BDA0003085263660000125
表示故障节点fi上承载的所有虚拟网服务组成的集合
Figure BDA0003085263660000126
P(sj|fi)表示故障节点fi不可用时,其上承载的虚拟网服务sj出现异常的概率。
在本发明的某一个实施例中,所述第二预设条件,采用如下公式:
Ability(h*)=argmaxf∈h,s∈SRF(f)×EF(s)
Figure BDA0003085263660000127
Figure BDA0003085263660000128
其中,RF(f)表示h中的故障为真实故障的概率;EF(s)表示S中的被观测的症状能找到对应的发生故障的底层节点的概率;|h|表示故障集合h中包含的故障数量。
需要说明的是,为验证本发明算法的性能,本发明使用GT-ITM工具生成网络环境。网络环境包括底层网络和虚拟网络。底层网络的网络节点数量从100个增加到500个,用于模拟不同规模的网络环境。虚拟网络的网络节点数量服从(5,10)的均匀分布。在底层网络节点的故障仿真时,将每个底层网络节点的先验故障概率设置为服从[0.005,0.01]的均匀分布。在算法比较方面,将本发明算法carriernetwork service fault diagnosisalgorithm based on topologyawareness(CNSFDAoTA)与基于解释能力的故障定位算法(servicefault location algorithm based on interpretation ability,SFDAoTA)进行比较。其中,算法SFDAoIA基于最大覆盖的故障定位算法进行故障定位。在比较指标方面,从故障诊断的准确率、误报率、诊断时长三个维度进行比较。
故障诊断算法的准确率比较结果如图4所示,X轴表示底层网络节点数量,Y轴表示算法的故障诊断准确率。从图可知,随时底层网络节点数量的增加,两个算法的故障诊断准确率都维持在一定的范围。说明两个算法在不同的网络环境下性能都比较稳定。两个算法的性能比较方面,本发明算法的故障诊断准确率明显高于比较算法。这说明本发明算法能够通过对故障和症状的故障传播模型进行充分分析和优化,从而提升了故障诊断算法的准确率。
故障诊断算法的误报率比较结果如图5所示,X轴表示底层网络节点数量,Y轴表示算法的故障诊断误报率。从图可知,在不同的底层网络环境下,两个算法的故障误报率都维持在一定的范围。说明网络环境对两个算法的故障诊断误报率影响较小。两个算法的性能比较方面,本发明算法的故障诊断误报率明显低于比较算法。这说明本发明算法通过对疑似故障节点的信任度评估,可以有效提升疑似故障集合的质量,从而降低了故障诊断的误报率。
故障诊断算法的运行时间比较结果如图6所示,X轴表示底层网络节点数量,Y轴表示算法的故障诊断时长。从图可知,在不同的底层网络环境下,两个算法的故障诊断时长都随着底层网络节点数量的增加而快速增加。这说明网络环境的变大,导致故障传播模型快速变大,从而导致两个算法的故障诊断时间快速增长。两个算法的性能比较方面,本发明算法的故障诊断时长明显低于比较算法。这是因为本发明算法通过网络模型分解,降低了故障传播模型的复杂度,从而节约了故障诊断的时长。
本发明实施例一种基于拓扑感知的载波网络服务故障诊断方法与现有技术相比,其有益效果在于:
根据底层网络的拓扑特征和故障传播模型的特征,对边缘子网、核心子网分别进行网络节点故障可信度评估、疑似故障集合计算,有效提升了虚拟网服务故障诊断算法的效率。
如图7所示,本发明还提供的一种基于拓扑感知的载波网络服务故障诊断装置200,包括:分解模块201、构建模块202、可信度模块203、第一获取模块204、数据处理模块205和第二获取模块206,其中,
所述分解模块201,用于根据k-Core算法将底层网络分解成边缘子网和核心子网;
所述构建模块202,用于根据虚拟网和底层网络的映射关系,分别对所述边缘子网和核心子网构建故障传播模型;
所述可信度模块203,用于根据第一预设条件,获取底层网络中每个底层网络节点的故障可信度;
所述第一获取模块204,用于根据所述每个底层网络节点的故障可信度和第二预设条件,处理得到所述边缘子网和核心子网的故障传播模型的疑似故障集合;
所述数据处理模块205,用于将所述边缘子网和核心子网的故障传播模型的疑似故障集合进行合并和去重处理;获得处理后的疑似故障集合;
所述第二获取模块206,根据所述每个底层网络节点的故障可信度和第二预设条件,对所述处理后的疑似故障集合进行处理,获得最终的疑似故障集合。
在本发明的某一个实施例中,所述分解模块201,具体用于:
查找底层网络中度数为1的节点;
删除底层网络中度数为1的节点以及相应的边,并放入边缘子网;
判断底层网络中是否还有度数为1的节点,若是,返回步骤查找底层网络中度数为1的节点;
将边缘子网中节点和边的壳指数赋值1;
将所有未裁剪掉的节点和边放入核心子网并将壳指数赋值2。
在本发明某一个实施例,所述第一预设条件,采用如下公式:
Figure BDA0003085263660000151
其中,
Figure BDA0003085263660000152
表示故障节点fi上承载的虚拟网服务中出现异常服务集合
Figure BDA0003085263660000153
Figure BDA0003085263660000154
表示故障节点fi上承载的所有虚拟网服务组成的集合
Figure BDA0003085263660000161
P(sj|fi)表示故障节点fi不可用时,其上承载的虚拟网服务sj出现异常的概率。
在本发明的某一个实施例中,所述第二预设条件,采用如下公式:
Ability(h*)=argmaxf∈h,s∈SRF(f)×EF(s)
Figure BDA0003085263660000162
Figure BDA0003085263660000163
其中,RF(f)表示h中的故障为真实故障的概率;EF(s)表示S中的被观测的症状能找到对应的发生故障的底层节点的概率;|h|表示故障集合h中包含的故障数量。
本发明还提供一种计算机终端设备,包括:一个或多个处理器;
存储器,与所述处理器耦接,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述任一项所述的一种基于拓扑感知的载波网络服务故障诊断方法。
需要说明的是,所述处理器可以是中央处理单元(CentralProcessingUnit,CPU),还可以是其他通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、现成可编程门阵列(Field-ProgrammableGateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,通用处理器可以是微处理器,或者所述处理器也可以是任何常规的处理器,所述处理器是所述终端设备的控制中心,利用各种接口和线路连接所述终端设备的各个部分。
所述存储器主要包括程序存储区和数据存储区,其中,程序存储区可存储操作系统、至少一个功能所需的应用程序等,数据存储区可存储相关数据等。此外,所述存储器可以是高速随机存取存储器,还可以是非易失性存储器,例如插接式硬盘,智能存储卡(SmartMediaCard,SMC)、安全数字(SecureDigital,SD)卡和闪存卡(FlashCard)等,或所述存储器也可以是其他易失性固态存储器件。
需要说明的是,上述终端设备可包括,但不仅限于,处理器、存储器,本领域技术人员可以理解,上述终端设备仅仅是示例,并不构成对终端设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述的基于拓扑感知的载波网络服务故障诊断方法。
需要说明的是,所述计算机程序可以被分割成一个或多个模块/单元(如计算机程序、计算机程序),所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述终端设备中的执行过程。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步的详细说明,应当理解,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围。特别指出,对于本领域技术人员来说,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于拓扑感知的载波网络服务故障诊断方法,其特征在于,包括:
根据k-Core算法将底层网络分解成边缘子网和核心子网;
根据虚拟网和底层网络的映射关系,分别对所述边缘子网和核心子网构建故障传播模型;
根据第一预设条件,获取底层网络中每个底层网络节点的故障可信度,具体采用如下公式:
Figure FDA0003558352100000011
其中,
Figure FDA0003558352100000012
表示故障节点fi上承载的虚拟网服务中出现异常服务集合
Figure FDA0003558352100000013
Figure FDA0003558352100000014
表示故障节点fi上承载的所有虚拟网服务组成的集合
Figure FDA0003558352100000015
P(sj|fi)表示故障节点fi不可用时,其上承载的虚拟网服务sj出现异常的概率;
根据所述每个底层网络节点的故障可信度和第二预设条件,计算得到所述边缘子网和核心子网的故障传播模型的疑似故障集合;
将所述边缘子网和核心子网的故障传播模型的疑似故障集合进行合并和去重处理;获得处理后的疑似故障集合;
根据所述每个底层网络节点的故障可信度和第二预设条件,对所述处理后的疑似故障集合进行处理,获得最终的疑似故障集合。
2.根据权利要求1所述的基于拓扑感知的载波网络服务故障诊断方法,其特征在于,所述根据k-Core算法将底层网络分解成边缘子网和核心子网,包括:
查找底层网络中度数为1的节点;
删除底层网络中度数为1的节点以及相应的边,并放入边缘子网;
判断底层网络中是否还有度数为1的节点,若是,返回步骤查找底层网络中度数为1的节点;
将边缘子网中节点和边的壳指数赋值1;
将所有未裁剪掉的节点和边放入核心子网并将壳指数赋值2。
3.根据权利要求1所述的基于拓扑感知的载波网络服务故障诊断方法,其特征在于,所述第二预设条件,采用如下公式:
Ability(h*)=argmaxf∈h,s∈SRF(f)×EF(s)
Figure FDA0003558352100000021
Figure FDA0003558352100000022
其中,Ability(h*)表示故障解释能力,S表示服务的症状,RF(f)表示h中的故障为真实故障的概率;EF(s)表示S中的被观测的症状能找到对应的发生故障的底层节点的概率;|h|表示疑似故障集合h中包含的故障数量。
4.一种基于拓扑感知的载波网络服务故障诊断装置,其特征在于,包括:分解模块、构建模块、可信度模块、第一获取模块、数据处理模块和第二获取模块,其中,
所述分解模块,用于根据k-Core算法将底层网络分解成边缘子网和核心子网;
所述构建模块,用于根据虚拟网和底层网络的映射关系,分别对所述边缘子网和核心子网构建故障传播模型;
所述可信度模块,用于根据第一预设条件,获取底层网络中每个底层网络节点的故障可信度,具体采用如下公式:
Figure FDA0003558352100000031
其中,
Figure FDA0003558352100000032
表示故障节点fi上承载的虚拟网服务中出现异常服务集合
Figure FDA0003558352100000033
Figure FDA0003558352100000034
表示故障节点fi上承载的所有虚拟网服务组成的集合
Figure FDA0003558352100000035
P(sj|fi)表示故障节点fi不可用时,其上承载的虚拟网服务sj出现异常的概率;
所述第一获取模块,用于根据所述每个底层网络节点的故障可信度和第二预设条件,处理得到所述边缘子网和核心子网的故障传播模型的疑似故障集合;
所述数据处理模块,用于将所述边缘子网和核心子网的故障传播模型的疑似故障集合进行合并和去重处理;获得处理后的疑似故障集合;
所述第二获取模块,根据所述每个底层网络节点的故障可信度和第二预设条件,对所述处理后的疑似故障集合进行处理,获得最终的疑似故障集合。
5.根据权利要求4所述的基于拓扑感知的载波网络服务故障诊断装置,其特征在于,所述分解模块,具体用于:
查找底层网络中度数为1的节点;
删除底层网络中度数为1的节点以及相应的边,并放入边缘子网;
判断底层网络中是否还有度数为1的节点,若是,返回步骤查找底层网络中度数为1的节点;
将边缘子网中节点和边的壳指数赋值1;
将所有未裁剪掉的节点和边放入核心子网并将壳指数赋值2。
6.根据权利要求4所述的基于拓扑感知的载波网络服务故障诊断装置,其特征在于,所述第二预设条件,采用如下公式:
Ability(h*)=arg maxf∈h,s∈SRF(f)×EF(s)
Figure FDA0003558352100000041
Figure FDA0003558352100000042
其中,Ability(h*)表示故障解释能力,S表示服务的症状,RF(f)表示h中的故障为真实故障的概率;EF(s)表示S中的被观测的症状能找到对应的发生故障的底层节点的概率;|h|表示疑似故障集合h中包含的故障数量。
7.一种计算机终端设备,其特征在于,包括:
一个或多个处理器;
存储器,与所述处理器耦接,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至3任一项所述的基于拓扑感知的载波网络服务故障诊断方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至3任一项所述的基于拓扑感知的载波网络服务故障诊断方法。
CN202110581841.6A 2021-05-26 2021-05-26 一种基于拓扑感知的载波网络服务故障诊断方法及装置 Active CN113285837B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110581841.6A CN113285837B (zh) 2021-05-26 2021-05-26 一种基于拓扑感知的载波网络服务故障诊断方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110581841.6A CN113285837B (zh) 2021-05-26 2021-05-26 一种基于拓扑感知的载波网络服务故障诊断方法及装置

Publications (2)

Publication Number Publication Date
CN113285837A CN113285837A (zh) 2021-08-20
CN113285837B true CN113285837B (zh) 2022-05-06

Family

ID=77281891

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110581841.6A Active CN113285837B (zh) 2021-05-26 2021-05-26 一种基于拓扑感知的载波网络服务故障诊断方法及装置

Country Status (1)

Country Link
CN (1) CN113285837B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114143172A (zh) * 2021-12-02 2022-03-04 国网河南省电力公司 虚拟网服务故障诊断方法、设备、介质和程序产品

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110336590A (zh) * 2019-07-23 2019-10-15 广东电网有限责任公司 一种电力通信网的故障定位方法、装置及设备
CN112383934A (zh) * 2020-10-22 2021-02-19 深圳供电局有限公司 一种5g网络切片下多域协作的服务故障诊断方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160232161A1 (en) * 2015-01-09 2016-08-11 Research Foundation Of The City University Of New York Method to maximize message spreading in social networks and find the most influential people in social media
CN104659917B (zh) * 2015-02-04 2017-02-22 天津大学 一种基于多约简和可信度的故障诊断方法
CN108092706B (zh) * 2017-08-02 2020-11-03 大连大学 一种映射方法
CN108259238B (zh) * 2018-01-10 2021-06-18 重庆邮电大学 数据中心中网络功能服务链映射的方法
CN111884859B (zh) * 2020-07-30 2022-10-21 国网重庆市电力公司电力科学研究院 一种网络故障诊断方法、装置及可读存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110336590A (zh) * 2019-07-23 2019-10-15 广东电网有限责任公司 一种电力通信网的故障定位方法、装置及设备
CN112383934A (zh) * 2020-10-22 2021-02-19 深圳供电局有限公司 一种5g网络切片下多域协作的服务故障诊断方法

Also Published As

Publication number Publication date
CN113285837A (zh) 2021-08-20

Similar Documents

Publication Publication Date Title
US10983856B2 (en) Identifying root causes of performance issues
US10382283B2 (en) Network topology estimation based on event correlation
CN109257195A (zh) 集群中节点的故障处理方法及设备
CN110574338A (zh) 根本原因发现引擎
US10728085B1 (en) Model-based network management
US20180227210A1 (en) Methods Providing Performance Management Using A Proxy Baseline And Related Systems And Computer Program Products
CN111884859B (zh) 一种网络故障诊断方法、装置及可读存储介质
CN113285837B (zh) 一种基于拓扑感知的载波网络服务故障诊断方法及装置
CN115421950B (zh) 一种基于机器学习的自动化系统运维管理方法及系统
US20210359899A1 (en) Managing Event Data in a Network
CN114564580A (zh) 一种自适应的基于知识图谱的告警聚合方法
CN113518367B (zh) 5g网络切片下基于服务特征的故障诊断方法及系统
CN112532408B (zh) 提取故障传播条件的方法、装置及存储介质
CN112367191A (zh) 一种5g网络切片下服务故障定位方法
CN116132263A (zh) 告警解决方案推荐方法、装置、电子设备及存储介质
CN113868367A (zh) 构建知识图谱的方法、装置及系统、计算机存储介质
CN115361295A (zh) 基于topsis的资源备份方法、装置、设备及介质
CN113572639B (zh) 一种载波网络故障的诊断方法、系统、设备和介质
CN112929913B (zh) 网络切片下基于路由可生存性的虚拟网服务故障恢复方法
CN112866009B (zh) 一种综合服务站虚拟网络故障诊断方法及装置
CN114185744A (zh) 告警信息聚合方法、装置、监控系统及存储介质
CN117376084A (zh) 故障检测方法、电子设备及其介质
CN109409411B (zh) 基于运维管理的问题定位方法、装置及存储介质
CN113315663B (zh) 一种基于业务特征的载波网络故障诊断方法及系统
Phan-Vu et al. A Scalable Multi-factor Fault Analysis Framework for Information Systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant