CN113285837B

CN113285837B - 一种基于拓扑感知的载波网络服务故障诊断方法及装置

Info

Publication number: CN113285837B
Application number: CN202110581841.6A
Authority: CN
Inventors: 付佳佳; 施展; 梁宇图
Original assignee: Guangdong Power Grid Co Ltd; Electric Power Dispatch Control Center of Guangdong Power Grid Co Ltd
Current assignee: Guangdong Power Grid Co Ltd; Electric Power Dispatch Control Center of Guangdong Power Grid Co Ltd
Priority date: 2021-05-26
Filing date: 2021-05-26
Publication date: 2022-05-06
Anticipated expiration: 2041-05-26
Also published as: CN113285837A

Abstract

本发明公开了一种基于拓扑感知的载波网络服务故障诊断方法及装置，包括：根据k－Core算法将底层网络分解成边缘子网和核心子网；根据虚拟网和底层网络的映射关系，构建故障传播模型；根据第一预设条件，获取底层网络中每个底层网络节点的故障可信度；根据故障可信度和第二预设条件，计算得到故障传播模型的疑似故障集合；将边缘子网和核心子网的故障传播模型的疑似故障集合进行合并和去重处理；并对处理后的疑似故障集合进行降序处理，获得最终的疑似故障集合。本发明能够根据底层网络的拓扑特征和故障传播模型的特征，对边缘子网、核心子网分别进行网络节点故障可信度评估、疑似故障集合计算，提升了虚拟网服务故障诊断算法的效率。

Description

一种基于拓扑感知的载波网络服务故障诊断方法及装置

技术领域

本发明涉及载波网络服务技术领域，特别是涉及一种基于拓扑感知的载波网络服务故障诊断方法、装置、终端设备和可读存储介质。

背景技术

载波网络环境下，海量物联数据的接入对网络资源提出较大的需求。为解决此问题，网络切片技术被应用到载波网络中。在此背景下，基础网络被划分为底层网络和虚拟网络。底层网络负责为虚拟网络提供底层节点和底层链路资源。虚拟网络从底层网络租用资源构建虚拟节点和虚拟链路，用于承载特定的虚拟网络服务。在此背景下，虚拟网服务提供商可以快速构建虚拟网并提供虚拟网服务，从而提升了服务的上线速度。但是，由于虚拟网服务商不掌握底层网络资源的运营数据，当底层网络资源出现故障时，如何快速发现和解决底层网络故障，保证虚拟网可靠性，已成为急需解决的关键问题。

发明内容

本发明的目的是：提供一种基于拓扑感知的载波网络服务故障诊断方法、装置、终端和存储介质，能够根据底层网络的拓扑特征和故障传播模型的特征，对边缘子网、核心子网分别进行网络节点故障可信度评估、疑似故障集合计算，有效提升了虚拟网服务故障诊断算法的效率。

为了实现上述目的，本发明提供了一种基于拓扑感知的载波网络服务故障诊断方法，包括：

根据k－Core算法将底层网络分解成边缘子网和核心子网；

根据虚拟网和底层网络的映射关系，分别对所述边缘子网和核心子网构建故障传播模型；

根据第一预设条件，获取底层网络中每个底层网络节点的故障可信度；

根据所述每个底层网络节点的故障可信度和第二预设条件，计算得到所述边缘子网和核心子网的故障传播模型的疑似故障集合；

将所述边缘子网和核心子网的故障传播模型的疑似故障集合进行合并和去重处理；获得处理后的疑似故障集合；

根据所述每个底层网络节点的故障可信度和第二预设条件，对所述处理后的疑似故障集合进行处理，获得最终的疑似故障集合。

进一步地，所述根据k－Core算法将底层网络分解成边缘子网和核心子网，包括：

查找底层网络中度数为1的节点；

删除底层网络中度数为1的节点以及相应的边，并放入边缘子网；

判断底层网络中是否还有度数为1的节点，若是，返回步骤查找底层网络中度数为1的节点；

将边缘子网中节点和边的壳指数赋值1；

将所有未裁剪掉的节点和边放入核心子网并将壳指数赋值2。

进一步地，所述第一预设条件，采用如下公式：

其中，

表示故障节点f_i上承载的虚拟网服务中出现异常服务集合

表示故障节点f_i上承载的所有虚拟网服务组成的集合

P(s_j|f_i)表示故障节点f_i不可用时，其上承载的虚拟网服务s_j出现异常的概率。

进一步地，所述第二预设条件，采用如下公式：

Ability(h^*)＝argmax_f∈h,s∈SRF(f)×EF(s)

其中，RF(f)表示h中的故障为真实故障的概率；EF(s)表示S中的被观测的症状能找到对应的发生故障的底层节点的概率；|h|表示故障集合h中包含的故障数量。

本发明实施例还提供一种基于拓扑感知的载波网络服务故障诊断装置，包括：分解模块、构建模块、可信度模块、第一获取模块、数据处理模块和第二获取模块，其中，

所述分解模块，用于根据k－Core算法将底层网络分解成边缘子网和核心子网；

所述构建模块，用于根据虚拟网和底层网络的映射关系，分别对所述边缘子网和核心子网构建故障传播模型；

所述可信度模块，用于根据第一预设条件，获取底层网络中每个底层网络节点的故障可信度；

所述第一获取模块，用于根据所述每个底层网络节点的故障可信度和第二预设条件，处理得到所述边缘子网和核心子网的故障传播模型的疑似故障集合；

所述数据处理模块，用于将所述边缘子网和核心子网的故障传播模型的疑似故障集合进行合并和去重处理；获得处理后的疑似故障集合；

所述第二获取模块，根据所述每个底层网络节点的故障可信度和第二预设条件，对所述处理后的疑似故障集合进行处理，获得最终的疑似故障集合。

进一步地，所述分解模块，具体用于：

查找底层网络中度数为1的节点；

将边缘子网中节点和边的壳指数赋值1；

将所有未裁剪掉的节点和边放入核心子网并将壳指数赋值2。

进一步地，所述第一预设条件，采用如下公式：

其中，

表示故障节点f_i上承载的虚拟网服务中出现异常服务集合

表示故障节点f_i上承载的所有虚拟网服务组成的集合

进一步地，所述第二预设条件，采用如下公式：

Ability(h^*)＝argmax_f∈h,s∈SRF(f)×EF(s)

本发明实施例还提供一种计算机终端设备，包括：一个或多个处理器；存储器，与所述处理器耦接，用于存储一个或多个程序；当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如上述任一项所述的基于拓扑感知的载波网络服务故障诊断方法。

本发明实施例还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如上述任一项所述的基于拓扑感知的载波网络服务故障诊断方法。

本发明实施例一种基于拓扑感知的载波网络服务故障诊断方法及装置与现有技术相比，其有益效果在于：

根据底层网络的拓扑特征和故障传播模型的特征，对边缘子网、核心子网分别进行网络节点故障可信度评估、疑似故障集合计算，有效提升了虚拟网服务故障诊断算法的效率。

附图说明

图1为本发明某一实施例提供的基于拓扑感知的载波网络服务故障诊断方法的流程示意图；

图2为本发明某一实施例提供的虚拟网映射示意图；

图3为本发明某一实施例提供的故障传播模型示意图；

图4为本发明某一实施例提供的故障诊断算法的准确率比较示意图；

图5为本发明某一实施例提供的故障诊断算法的误报率比较示意图；

图6为本发明某一实施例提供的故障诊断算法的运行时间比较示意图；

图7为本发明某一实施例提供的基于拓扑感知的载波网络服务故障诊断装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，文中所使用的步骤编号仅是为了方便描述，不对作为对步骤执行先后顺序的限定。

应当理解，在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

如图1所示，本发明提供的一种基于拓扑感知的载波网络服务故障诊断方法，至少包括如下步骤：

S101、根据k－Core算法将底层网络分解成边缘子网和核心子网；

具体地，为降低故障推断过程的复杂度，采用表1中的基于k－core分解的底层网络分解算法，将底层网络G_SN(V,E)分为边缘子网G_edge(V,E)、核心子网G_core(V,E)。

需要说明的是，网络拓扑的稠密程度，与网络节点的度数相关。由虚拟网映射可知，度数高的底层节点上承载的虚拟资源较多。当度数高的网络节点发生故障时，导致较多的虚拟网业务不可用。

所以，可以根据网络节点的度数，将网络划分为不同稠密程度的子网。度数多的节点，划分到稠密的子网中，这些子网中的节点发生故障，导致虚拟网服务故障数量较多。基于此，根据网络节点的度数，本发明将网络分割为高度数子网、低度数子网，从而简化网络故障传播模型，便于故障定位。

由网络拓扑结构可知，网络一般分为接入网、汇聚网、核心网。随着网络扁平化、高带宽的发展趋势，现有的网络拓扑逐渐演变为接入网、核心网两个层次。接入网中网络节点的特点是度数小，核心网中网络节点的特点是度数大。k核分解可以根据网络节点的度数，对网络进行划分。本发明基于k核分解理论，将网络划分为边缘子网、核心子网。k核分解采用网络拓扑裁剪的方法，对网络拓扑进行分解。例如，对于网络拓扑G(V,E)，采用K核分解算法，可以迭代的裁剪度数为k的节点，放入k核集合CORE_k，直到网络中的节点度数都大于k为止。此时，集合CORE_k中的节点就是度数为k的节点。

本发明通过k－core分解算法对底层网络进行分解。由于不同k核中网络节点构成的网络拓扑复杂度不同，所以，可以根据不同k核子网的特点，采用不同的故障诊断算法。在划分网络时，属于2－shell或具有更高壳指数的子图被划分为核心网络，而I－shell组成的子图属于边缘网络。

基于k－core分解的底层网络分解算法如表1所示。算法具体步骤为：(1)、删除拓扑中度数为1的节点以及相应的边；(2)、针对裁剪后的剩余图继续迭代地删除度为1的节点以及相应的边，直到拓扑中没有度数为1的节点为止；(3)、将所有裁剪掉的节点的壳指数赋值1，剩余的节点即为1核以上的节点。1－shell的节点和相应边构成多个边缘子网络，称为边缘子网。大于1－shell的所有节点和相应边构成一个核心网络，称为核心子网。

表1基于k－core分解的底层网络分解算法

S102、根据虚拟网和底层网络的映射关系，分别对所述边缘子网和核心子网构建故障传播模型；

具体地，根据虚拟网G_VN(V,E)和底层网络G_SN(V,E)的映射关系，以及步骤101中生成的边缘子网G_edge(V,E)和核心子网G_core(V,E)，构建边缘子网故障传播模型FPM_edge、核心子网故障传播模型FPM_core。

需要说明的是，网络切片后，传统的基础网络被分为虚拟网络和底层网络。底层网络包括底层节点和底层链路。虚拟网络包括虚拟节点和虚拟链路。底层网络的底层节点为虚拟网络的虚拟节点提供计算资源，底层网络的底层链路为虚拟网络的虚拟链路提供带宽资源。虚拟网使用虚拟节点和虚拟链路承载特定的虚拟网服务，为最终用户提供服务。本发明主要研究端到端的虚拟网服务。将虚拟节点和虚拟链路称为虚拟组件C^VN。将底层节点和底层链路称为底层组件C^SN。每个虚拟网络上可以承载多个虚拟网服务。如图2和图3所示，虚拟网1上承载了

和

两个虚拟网服务。虚拟网服务

使用的底层路径资源为(a1－b1)；虚拟网服务

使用的底层路径资源为(a2－e2－d2)；虚拟网2上承载了

和

两个虚拟网服务。虚拟网服务

使用的底层路径资源为(b2－d2－e2)。

为保证虚拟网服务的正常运行，网络运营商一般都会建设网络监控系统。网络监控系统可以获得服务和组件的状态。本发明将网络监控系统获得的服务运行状态称为服务的症状S。根据服务的状态，症状S可以分为正症状和负症状。其中，正症状是指服务正常运行的状态，负症状是指服务异常运行的状态。虚拟网VN_i上承载的服务j的症状表示为

本发明将网络监控系统获得的组件的状态称为故障F。根据组件的状态，故障F可以分为正故障和负故障。正故障是指组件的状态为正常值。负故障是指组件的状态为异常值。当虚拟组件的状态为负故障时，其上承载的虚拟服务的状态为负症状。因为虚拟组件的资源由底层组件分配，所以，虚拟组件的故障是由底层组件故障导致。本发明的研究目标是快速准确的找到导致虚拟网服务为负症状的底层组件。底层网络SN中底层组件i的故障使用f_i ^SN∈F^SN表示。虚拟网VN_i中虚拟组件j的故障使用

表示。虚拟网VN_i中虚拟组件j的先验故障概率使用

表示，底层网络SN中底层组件i的先验故障概率表示为p(f_i ^SN)。因为虚拟组件承载在底层组件上，所以，本发明主要研究底层组件的故障定位问题。

为了将症状和故障信息进行关联，本发明使用二分贝叶斯理论，构建症状和故障关系的故障传播模型(fault propagation model，FPM)。在故障传播模型中，包括上层节点、下层节点、上下层节点间的连线。上层节点表示症状节点，下层节点表示故障节点，上下层节点间的连线表示下层节点为负故障时，导致上层节点为负症状的概率，又称为条件概率，使用

表示，其取值范围为[0，1]。因为虚拟网组件承载在底层网组件上，在故障传播模型中，本发明基于虚拟组件和底层组件的映射关系，构建底层组件和虚拟网服务的故障传播模型。

S103、根据第一预设条件，获取底层网络中每个底层网络节点的故障可信度；

具体地，对于底层网络拓扑G_SN(V,E)中每个底层网络节点，使用公式(1)计算其可信度

根据故障传播模型可知，网络节点发生故障时，其上承载的虚拟网服务将出现异常。基于此，可以通过分析每个网络节点承载的虚拟网服务的异常情况，分析网络节点发生故障的可能性。本发明将网络节点发生故障的可能性称为网络节点的故障可信度

使用公式(1)计算。其中，

表示故障节点f_i上承载的虚拟网服务中出现异常服务集合

表示故障节点f_i上承载的所有虚拟网服务组成的集合

P(s_j|f_i)表示故障节点f_i不可用时，其上承载的虚拟网服务s_j出现异常的概率。从公式可知，网络节点的故障可信度

的取值范围为(0，1)。该值越大，表明当前网络节点发生故障的可信度越大。

S104、根据所述每个底层网络节点的故障可信度和第二预设条件，计算得到所述边缘子网和核心子网的故障传播模型的疑似故障集合；

具体地，基于上述步骤计算得到的每个底层网络节点的可信度，对底层网络节点进行降序排序。之后，使用公式(2)，在边缘子网故障传播模型FPM_edge、核心子网故障传播模型FPM_core中分别求解最优的疑似故障集合

为了从故障传播模型中找到发生故障的网络节点，需要找到可以解释所有异常虚拟网服务的故障底层节点，并且找到的发生故障的底层节点数量最小。因为故障可信度可以对故障进行评价，所以，按照每个网络节点的故障可信度进行排序。依次选择前k个网络节点，组成疑似故障集合h＝{f_i,f_j,...,f_k}。K的数量表示同时发生故障的网络节点的最大数量。一般取值为5个。求解最优的疑似故障集合h＝{f_i,f_j,...,f_k}的故障解释能力Ability(h^*)，使用公式(2)进行计算。其中，RF(f)表示h中的故障为真实故障的概率，使用公式(3)计算。EF(s)表示S中的被观测的症状能找到对应的发生故障的底层节点的概率，使用公式(4)计算。公式(3)中，|h|表示故障集合h中包含的故障数量。

Ability(h^*)＝argmax_f∈h,s∈SRF(f)×EF(s) (2)

S105、将所述边缘子网和核心子网的故障传播模型的疑似故障集合进行合并和去重处理；获得处理后的疑似故障集合；

具体地，将疑似故障集合

进行合并，去除重复的底层网络节点。

S106、根据所述每个底层网络节点的故障可信度和第二预设条件，对所述处理后的疑似故障集合进行处理，获得最终的疑似故障集合。

具体地，基于每个底层网络节点的可信度，对合并去重后的疑似故障集合中底层网络节点进行降序排序。使用公式(2)，确定最终的疑似故障集合

在本发明的某一个实施例中，所述根据k－Core算法将底层网络分解成边缘子网和核心子网，包括：

查找底层网络中度数为1的节点；

将边缘子网中节点和边的壳指数赋值1；

将所有未裁剪掉的节点和边放入核心子网并将壳指数赋值2。

在本发明的某一个实施例中，所述第一预设条件，采用如下公式：

其中，

表示故障节点f_i上承载的虚拟网服务中出现异常服务集合

表示故障节点f_i上承载的所有虚拟网服务组成的集合

在本发明的某一个实施例中，所述第二预设条件，采用如下公式：

Ability(h^*)＝argmax_f∈h,s∈SRF(f)×EF(s)

需要说明的是，为验证本发明算法的性能，本发明使用GT－ITM工具生成网络环境。网络环境包括底层网络和虚拟网络。底层网络的网络节点数量从100个增加到500个，用于模拟不同规模的网络环境。虚拟网络的网络节点数量服从(5，10)的均匀分布。在底层网络节点的故障仿真时，将每个底层网络节点的先验故障概率设置为服从[0.005，0.01]的均匀分布。在算法比较方面，将本发明算法carriernetwork service fault diagnosisalgorithm based on topologyawareness(CNSFDAoTA)与基于解释能力的故障定位算法(servicefault location algorithm based on interpretation ability，SFDAoTA)进行比较。其中，算法SFDAoIA基于最大覆盖的故障定位算法进行故障定位。在比较指标方面，从故障诊断的准确率、误报率、诊断时长三个维度进行比较。

故障诊断算法的准确率比较结果如图4所示，X轴表示底层网络节点数量，Y轴表示算法的故障诊断准确率。从图可知，随时底层网络节点数量的增加，两个算法的故障诊断准确率都维持在一定的范围。说明两个算法在不同的网络环境下性能都比较稳定。两个算法的性能比较方面，本发明算法的故障诊断准确率明显高于比较算法。这说明本发明算法能够通过对故障和症状的故障传播模型进行充分分析和优化，从而提升了故障诊断算法的准确率。

故障诊断算法的误报率比较结果如图5所示，X轴表示底层网络节点数量，Y轴表示算法的故障诊断误报率。从图可知，在不同的底层网络环境下，两个算法的故障误报率都维持在一定的范围。说明网络环境对两个算法的故障诊断误报率影响较小。两个算法的性能比较方面，本发明算法的故障诊断误报率明显低于比较算法。这说明本发明算法通过对疑似故障节点的信任度评估，可以有效提升疑似故障集合的质量，从而降低了故障诊断的误报率。

故障诊断算法的运行时间比较结果如图6所示，X轴表示底层网络节点数量，Y轴表示算法的故障诊断时长。从图可知，在不同的底层网络环境下，两个算法的故障诊断时长都随着底层网络节点数量的增加而快速增加。这说明网络环境的变大，导致故障传播模型快速变大，从而导致两个算法的故障诊断时间快速增长。两个算法的性能比较方面，本发明算法的故障诊断时长明显低于比较算法。这是因为本发明算法通过网络模型分解，降低了故障传播模型的复杂度，从而节约了故障诊断的时长。

本发明实施例一种基于拓扑感知的载波网络服务故障诊断方法与现有技术相比，其有益效果在于：

如图7所示，本发明还提供的一种基于拓扑感知的载波网络服务故障诊断装置200，包括：分解模块201、构建模块202、可信度模块203、第一获取模块204、数据处理模块205和第二获取模块206，其中，

所述分解模块201，用于根据k－Core算法将底层网络分解成边缘子网和核心子网；

所述构建模块202，用于根据虚拟网和底层网络的映射关系，分别对所述边缘子网和核心子网构建故障传播模型；

所述可信度模块203，用于根据第一预设条件，获取底层网络中每个底层网络节点的故障可信度；

所述第一获取模块204，用于根据所述每个底层网络节点的故障可信度和第二预设条件，处理得到所述边缘子网和核心子网的故障传播模型的疑似故障集合；

所述数据处理模块205，用于将所述边缘子网和核心子网的故障传播模型的疑似故障集合进行合并和去重处理；获得处理后的疑似故障集合；

所述第二获取模块206，根据所述每个底层网络节点的故障可信度和第二预设条件，对所述处理后的疑似故障集合进行处理，获得最终的疑似故障集合。

在本发明的某一个实施例中，所述分解模块201，具体用于：

查找底层网络中度数为1的节点；

将边缘子网中节点和边的壳指数赋值1；

将所有未裁剪掉的节点和边放入核心子网并将壳指数赋值2。

在本发明某一个实施例，所述第一预设条件，采用如下公式：

其中，

表示故障节点f_i上承载的虚拟网服务中出现异常服务集合

表示故障节点f_i上承载的所有虚拟网服务组成的集合

Ability(h^*)＝argmax_f∈h,s∈SRF(f)×EF(s)

本发明还提供一种计算机终端设备，包括：一个或多个处理器；

存储器，与所述处理器耦接，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如上述任一项所述的一种基于拓扑感知的载波网络服务故障诊断方法。

需要说明的是，所述处理器可以是中央处理单元(CentralProcessingUnit，CPU)，还可以是其他通用处理器、数字信号处理器(DigitalSignalProcessor，DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit，ASIC)、现成可编程门阵列(Field－ProgrammableGateArray，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等，通用处理器可以是微处理器，或者所述处理器也可以是任何常规的处理器，所述处理器是所述终端设备的控制中心，利用各种接口和线路连接所述终端设备的各个部分。

所述存储器主要包括程序存储区和数据存储区，其中，程序存储区可存储操作系统、至少一个功能所需的应用程序等，数据存储区可存储相关数据等。此外，所述存储器可以是高速随机存取存储器，还可以是非易失性存储器，例如插接式硬盘，智能存储卡(SmartMediaCard，SMC)、安全数字(SecureDigital，SD)卡和闪存卡(FlashCard)等，或所述存储器也可以是其他易失性固态存储器件。

需要说明的是，上述终端设备可包括，但不仅限于，处理器、存储器，本领域技术人员可以理解，上述终端设备仅仅是示例，并不构成对终端设备的限定，可以包括更多或更少的部件，或者组合某些部件，或者不同的部件。

本发明还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如上述任一项所述的基于拓扑感知的载波网络服务故障诊断方法。

需要说明的是，所述计算机程序可以被分割成一个或多个模块/单元(如计算机程序、计算机程序)，所述一个或者多个模块/单元被存储在所述存储器中，并由所述处理器执行，以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序在所述终端设备中的执行过程。

以上所述的具体实施例，对本发明的目的、技术方案和有益效果进行了进一步的详细说明，应当理解，以上所述仅为本发明的具体实施例而已，并不用于限定本发明的保护范围。特别指出，对于本领域技术人员来说，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。