CN112866009A - 一种综合服务站虚拟网络故障诊断方法及装置 - Google Patents
一种综合服务站虚拟网络故障诊断方法及装置 Download PDFInfo
- Publication number
- CN112866009A CN112866009A CN202110001467.8A CN202110001467A CN112866009A CN 112866009 A CN112866009 A CN 112866009A CN 202110001467 A CN202110001467 A CN 202110001467A CN 112866009 A CN112866009 A CN 112866009A
- Authority
- CN
- China
- Prior art keywords
- fault
- node
- virtual
- network
- suspected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
- H04L41/065—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0677—Localisation of faults
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/12—Discovery or management of network topologies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Pure & Applied Mathematics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本说明书一个或多个实施例提供的一种综合服务站虚拟网络故障诊断方法及装置,通过构建故障传播模型,首先剔除掉虚假的故障节点,并基于故障风险度对虚拟业务进行排序,从而优先诊断重要的虚拟业务,对于每个虚拟业务,计算对应的疑似故障节点对虚拟业务的解释能力,从而构建出故障集合,有效的提高了网络故障诊断率。
Description
技术领域
本说明书一个或多个实施例涉及虚拟网故障诊断技术领域,尤其涉及一种综合服务站虚拟网络故障诊断方法及装置。
背景技术
由于网络虚拟化技术具有按需扩展、动态调度的优点,近年来已逐渐成为网络高效运营的关键技术。
在某区域发生火灾、洪涝灾害、泥石流、地震等灾难时,网络会出现大面积故障。这种背景下,对于网络运营商来说,如何保证快速恢复关键业务的故障,从而保证关键业务的可用性,是一个急需解决的问题。
现有技术中,已有的网络故障诊断模型包括二进制依赖故障模型、图型依赖故障模型、贝叶斯依赖矩阵模型等。
但是,发明人发现,现有技术中的网络故障诊断模型准确率低下。
发明内容
有鉴于此,本说明书一个或多个实施例的目的在于提出一种综合服务站虚拟网络故障诊断方法及装置,以解决现有技术中虚拟网故障诊断准确率低下的问题。
基于上述目的,本说明书一个或多个实施例提供了一种综合服务站虚拟网络故障诊断方法,包括:
基于底层网络G、原始虚拟业务集合S以及底层网络G与原始虚拟业务集合S的映射关系,构建故障传播模型,基于底层链路集合F构建疑似故障节点集合Forder,基于原始虚拟业务集合S构建虚拟业务集合Sorder;
创建故障集合h*;
从虚拟业务集合Sorder中选择第一个虚拟业务;
若故障集合h*中已有的目标故障节点不能够导致当前虚拟业务不可用,则基于故障传播模型,针对与当前虚拟业务对应的每个疑似故障节点,均计算其对当前业务的解释能力,选择最大的计算结果所对应的疑似故障节点作为目标故障节点,将目标故障节点放入故障集合h*中,并返回从虚拟业务集合Sorder中选择第一个虚拟业务的步骤,直至虚拟业务集合Sorder为空集;若故障集合h*中已有的目标故障节点能够导致当前虚拟业务不可用,则返回从虚拟业务集合Sorder中选择第一个虚拟业务的步骤,直至虚拟业务集合Sorder为空集;
输出故障集合h*。
作为一种可选的实施方式,所述基于底层网络G、原始虚拟业务集合S以及底层网络G与原始虚拟业务集合S的映射关系,构建故障传播模型,包括:
所述故障传播模型包括多个症状节点构成的症状层及多个故障节点构成的故障层,每个症状节点与至少一个故障节点建立映射关系,每个故障节点与至少一个症状节点建立映射关系,其中,症状节点表示原始虚拟业务集合S内的虚拟网业务的运行状态,故障节点表示底层网络G内的网络资源的故障状态。
作为一种可选的实施方式,所述基于底层链路集合F构建疑似故障节点集合Forder,包括:
对底层链路集合F中的疑似故障节点fi进行预处理,过滤虚假的疑似故障节点,得到新的疑似故障节点集合F′;
对于F′中的每个疑似故障节点,计算其节点故障风险度;
按照节点故障风险度由大至小的顺序排列疑似故障节点,得到疑似故障节点集合Forder。
作为一种可选的实施方式,所述对底层链路集合F中的疑似故障节点fi进行预处理,过滤虚假的疑似故障节点,得到新的疑似故障节点集合F′,包括:
过滤虚假的疑似故障节点,得到新的疑似故障节点集合F′。
其中,表示故障节点fi导致的可以被观察到的异常症状节点的集合,数值由网管系统检测获得;表示故障节点fi承载的虚拟网业务的集合,数值由网管系统检测获得;|*|表示集合中包含元素的数量,数值由网管系统检测获得。
作为一种可选的实施方式,所述计算疑似故障节点的节点故障风险度,包括:
其中,hj表示疑似故障节点j的故障风险度;
pz表示底层链路所在故障区域的故障严重程度,取值范围[0,1],数值由网管系统检测获得;
作为一种可选的实施方式,所述基于原始虚拟业务集合S构建虚拟业务集合Sorder,包括:
对于原始虚拟业务集合S中的每个虚拟业务,计算其业务故障风险度;
按照业务故障风险度由大至小的顺序排列虚拟业务,得到虚拟业务集合Sorder。
作为一种可选的实施方式,所述对于原始虚拟业务集合S中的每个虚拟业务,计算其业务故障风险度,包括:
其中,Hi表示虚拟业务Si的总故障风险度;
作为一种可选的实施方式,所述针对与当前虚拟业务对应的每个疑似故障节点,均计算其对当前业务的解释能力,包括:
Ability(h*)=argmaxhRh×PRh
其中,h={fi,fj,...,fk},表示第k次计算时,疑似故障节点集合Forder中与虚拟业务对应的前k个疑似故障节点构成的疑似故障集合;
|S|表示异常症状节点的数量,数值由网管系统检测获得;
|Srel|表示疑似故障集合h中所有疑似故障节点可以解释的异常症状节点中去除重复的异常症状节点后的数量,数值由网管系统检测获得;
作为本发明实施例的第二个方面,本发明实施例还提供了一种综合服务站虚拟网络故障诊断装置,包括:
构建模块,用于基于底层网络G、原始虚拟业务集合S以及底层网络G与原始虚拟业务集合S的映射关系,构建故障传播模型,基于底层链路集合F构建疑似故障节点集合Forder,基于原始虚拟业务集合S构建虚拟业务集合Sorder;
创建模块,用于创建故障集合h*;
选择模块,用于从虚拟业务集合Sorder中选择第一个虚拟业务;
判断模块,用于若故障集合h*中已有的目标故障节点不能够导致当前虚拟业务不可用,则基于故障传播模型,针对与当前虚拟业务对应的每个疑似故障节点,均计算其对当前业务的解释能力,选择最大的计算结果所对应的疑似故障节点作为目标故障节点,将目标故障节点放入故障集合h*中,并返回从虚拟业务集合Sorder中选择第一个虚拟业务的步骤,直至虚拟业务集合Sorder为空集;若故障集合h*中已有的目标故障节点能够导致当前虚拟业务不可用,则返回从虚拟业务集合Sorder中选择第一个虚拟业务的步骤,直至虚拟业务集合Sorder为空集;
输出模块,用于输出故障集合h*。
从上面所述可以看出,本说明书一个或多个实施例提供的一种综合服务站虚拟网络故障诊断方法及装置,通过构建故障传播模型,并基于故障风险度对虚拟业务进行排序,从而优先诊断重要的虚拟业务,对于每个虚拟业务,计算对应的疑似故障节点对虚拟业务的解释能力,从而构建出故障集合,有效的提高了网络故障诊断率。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的故障诊断算法的流程示意图;
图2为网络虚拟化环境示意图;
图3为本发明实施例构建的故障传播模型示意图;
图4为本发明实施例的故障诊断算法与现有算法的准确率比较示意图;
图5本发明实施例的故障诊断算法与现有算法的误报率比较示意图;
图6为本发明实施例的故障诊断算法与现有算法的时长比较示意图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,对本公开进一步详细说明。
为了实现上述发明目的,本发明实施例提供了一种综合服务站虚拟网络故障诊断方法,包括:
基于底层网络G、原始虚拟业务集合S以及底层网络G与原始虚拟业务集合S的映射关系,构建故障传播模型,基于底层链路集合F构建疑似故障节点集合Forder,基于原始虚拟业务集合S构建虚拟业务集合Sorder;
创建故障集合h*;
从虚拟业务集合Sorder中选择第一个虚拟业务;
若故障集合h*中已有的目标故障节点不能够导致当前虚拟业务不可用,则基于故障传播模型,针对与当前虚拟业务对应的每个疑似故障节点,均计算其对当前业务的解释能力,选择最大的计算结果所对应的疑似故障节点作为目标故障节点,将目标故障节点放入故障集合h*中,并返回从虚拟业务集合Sorder中选择第一个虚拟业务的步骤,直至虚拟业务集合Sorder为空集;若故障集合h*中已有的目标故障节点能够导致当前虚拟业务不可用,则返回从虚拟业务集合Sorder中选择第一个虚拟业务的步骤,直至虚拟业务集合Sorder为空集;
输出故障集合h*。
本发明实施例中,通过构建故障传播模型,并基于故障风险度对虚拟业务进行排序,从而优先诊断重要的虚拟业务,对于每个虚拟业务,计算对应的疑似故障节点对虚拟业务的解释能力,从而构建出故障集合,有效的提高了网络故障诊断率。
图1示出了一种综合服务站虚拟网络故障诊断方法,包括:
S100、基于底层网络G、原始虚拟业务集合S以及底层网络G与原始虚拟业务集合S的映射关系,构建故障传播模型,基于底层链路集合F构建疑似故障节点集合Forder,基于原始虚拟业务集合S构建虚拟业务集合Sorder。
网络切片后,基础网络被分为虚拟网和底层网络,底层网络包括底层节点和底层链路,虚拟网络包括虚拟节点和虚拟链路,底层节点为虚拟节点分配计算资源,底层链路为虚拟链路分配带宽资源,虚拟网上承载特定的虚拟网业务,为最终用户提供服务。
例如,如图2所示,网络虚拟化环境包括一个底层网络和两个虚拟网络,底层网络包括A、B、C、D、E、F六个底层节点,以及AB、BC、CD、DE、EF、AF、BF七条底层链路,虚拟网1的a1、b1、c1、d1分别由底层节点A、B、C、D分配资源,虚拟网1的虚拟链路a1b1、a1c1、b1d1、c1d1分别由底层路径AB、AB-BC、BC-CD、CD分配资源,虚拟网1上承载的两个服务为和虚拟网服务是指端到端服务a1-b1,虚拟网服务是指端到端服务a1-c1-d1。
从虚拟网映射关系可知,当底层网络资源发生故障时,其上承载的虚拟网资源也发生故障,此时,虚拟网资源承载的虚拟网业务也出现不可用的状态,所以,本发明的故障诊断问题可以通过虚拟网资源和底层网资源的映射关系,简化为虚拟网业务和底层网络资源之间的故障诊断问题。
作为一种可选的实施方式,所述基于底层网络G、原始虚拟业务集合S以及底层网络G与原始虚拟业务集合S的映射关系,构建故障传播模型,包括:
所述故障传播模型包括多个症状节点构成的症状层及多个故障节点构成的故障层,每个症状节点与至少一个故障节点建立映射关系,每个故障节点与至少一个症状节点建立映射关系,其中,症状节点表示原始虚拟业务集合S内的虚拟网业务的运行状态,故障节点表示底层网络G内的网络资源的故障状态。
为进行故障诊断,本发明构建基于底层网络资源和虚拟网业务的二分故障传播模型,如图3所示,该模型包括症状层、故障层、症状和故障之间的关联关系三部分,其中,症状层包括多个症状节点,故障层包括多个故障节点,每个症状节点与至少一个故障节点建立映射关系,每个故障节点与至少一个症状节点建立映射关系。其中,症状节点表示原始虚拟业务集合S内的虚拟网业务的运行状态,使用表示,当表示虚拟网业务正常运行,称为正症状,当表示虚拟网业务的状态为不可用,称为负症状。故障节点表示底层网络G内的网络资源的故障状态,使用fi SN∈FSN表示,当fi SN=1,表示底层网络资源fi SN正常运行,称为正故障,当fi SN=0,表示底层网络资源fi SN不能正常运行,称为负故障。运营商根据长期的运营数据,可以得到每个底层网络资源的先验故障概率,使用p(fi SN)表示,取值范围为(0,1]。本发明主要研究底层链路资源。症状节点和故障节点之间的映射关系是指当故障层的底层网络资源出现故障时,症状层的虚拟网业务出现不可用的概率,使用表示,取值范围为(0,1]。
作为一种可选的实施方式,所述基于底层链路集合F构建疑似故障节点集合Forder,包括:
对底层链路集合F中的疑似故障节点fi进行预处理,过滤虚假的疑似故障节点,得到新的疑似故障节点集合F′;
对于F′中的每个疑似故障节点,计算其节点故障风险度;
按照节点故障风险度由大至小的顺序排列疑似故障节点,得到疑似故障节点集合Forder。
可选的,所述对底层链路集合F中的疑似故障节点fi进行预处理,过滤虚假的疑似故障节点,得到新的疑似故障节点集合F′,包括:
过滤虚假的疑似故障节点,得到新的疑似故障节点集合F′。
其中,表示故障节点fi导致的可以被观察到的异常症状节点的集合,数值由网管系统检测获得;表示故障节点fi承载的虚拟网业务的集合,数值由网管系统检测获得;|*|表示集合中包含元素的数量,数值由网管系统检测获得。
由于网络噪声的存在,过滤虚假的底层链路故障和虚拟业务,可以实现故障传播模型简化。例如,如果虚拟网业务都经过底层链路li,但是,的状态异常,的状态正常,这是由于经过的底层路径出现故障,或者经过的路径发生了重新路由,为解决此问题,本发明通过设置故障真实度阈值δ来简化故障传播模型。
对于底层链路li表示的故障节点fi,其故障真实度的计算方法如公式(1)。对于底层链路li表示的故障节点fi,其故障真实度时,表示当前链路为虚假的疑似故障,其中,δ表示故障真实度阈值。根据经验,本发明实施例将故障真实度阈值δ设置为0.5。
通过设置故障真实度阈值,可以对故障传播模型中较多的底层链路进行精简,此时,在故障传播模型中,部分虚拟网服务对应的故障节点都被裁剪,说明这些虚拟网服务的异常症状属于噪声信息,可以将其从故障传播模型中进行删除,从而精简故障传播模型。
可选的,所述计算疑似故障节点的节点故障风险度,包括:
其中,hj表示疑似故障节点j的故障风险度;
pz表示底层链路所在故障区域的故障严重程度,取值范围[0,1],数值由网管系统检测获得;
从Rj的计算公式可知,底层链路距离灾难中心c的距离越近,发生故障的概率越大,并且,Rj的取值为大于1的数值。由于底层网络故障的概率与底层网络资源使用情况相关,当底层网络资源使用较多时,底层网络资源发生故障的概率较大。本发明实施例定义疑似故障节点j的故障风险度hj,表示底层网络资源发生故障的可能性以及故障时损失的花费。函数表示底层链路上承载的虚拟资源的数量,取值为其上承载的所有虚拟链路的带宽资源之和。从疑似故障节点j的故障风险度hj的定义可知,底层组件发生故障的概率、其上承载的虚拟业务数量,决定了其故障风险度。
可选的,所述基于原始虚拟业务集合S构建虚拟业务集合Sorder,包括:
对于原始虚拟业务集合S中的每个虚拟业务,计算其业务故障风险度;
其中,Hi表示虚拟业务Si的总故障风险度;
按照业务故障风险度由大至小的顺序排列虚拟业务,得到虚拟业务集合Sorder。
因为虚拟业务承载在底层网络上,所以,虚拟业务发生故障的概率与其所在的底层网络的故障的概率相关,所以,本发明定义虚拟业务的总故障风险度为所经过的底层链路的风险度之和。从公式(3)可知,采用底层链路的风险度来评价虚拟业务的风险大小,不但可以将虚拟业务通过的底层链路的数量作为评价因素,而且将底层链路的资源使用量、底层链路的故障特征作为评价因素,从而更加全面的反映虚拟业务的实际环境特征。当虚拟业务的总故障风险度Hi取值越大,说明当前虚拟业务故障风险度越大,越可能发生故障,而且需要首先被恢复。
S200、创建故障集合h*;
S300、从虚拟业务集合Sorder中选择第一个虚拟业务;
S400、故障集合h*中已有的目标故障节点能否导致当前虚拟业务不可用:若故障集合h*中已有的目标故障节点不能够导致当前虚拟业务不可用,则执行S500、基于故障传播模型,针对与当前虚拟业务对应的每个疑似故障节点,均计算其对当前业务的解释能力,选择最大的计算结果所对应的疑似故障节点作为目标故障节点,将目标故障节点放入故障集合h*中,并执行S600、判断虚拟业务集合Sorder是否为空集,若不为空集,则返回执行S300,若为空集,则计算结束;若故障集合h*中已有的目标故障节点能够导致当前虚拟业务不可用,则执行S600、判断虚拟业务集合Sorder是否为空集,若不为空集,则返回执行S300,若为空集,则计算结束。
作为一种可选的实施方式,所述针对与当前虚拟业务对应的每个疑似故障节点,均计算其对当前业务的解释能力,包括:
Ability(h*)=argmaxhRh×PRh
其中,h={fi,fj,...,fk},表示第k次计算时,疑似故障节点集合Forder中与虚拟业务对应的前k个疑似故障节点构成的疑似故障集合;
|S|表示异常症状节点的数量,数值由网管系统检测获得;
|Srel|表示疑似故障集合h中所有疑似故障节点可以解释的异常症状节点中去除重复的异常症状节点后的数量,数值由网管系统检测获得;
由底层链路的故障风险度分析可知,底层链路的故障风险度越大,虚拟业务发生故障的概率越大。所以,在定位底层链路故障时,优先选择故障概率大的底层链路构造疑似故障集合,可以提升构建疑似故障集合的效率。
灾难环境可以导致较多的链路资源同时发生故障,因本发明考虑的是灾难环境下的故障定位,所以k值比普通环境下取值大,本发明实施例中k的取值为6~10。
Rh的取值越大,表明当前疑似故障集合的解释能力越强。
S700、输出故障集合h*。
本发明实施例中,通过优先诊断关键虚拟网业务、过滤虚假故障两个策略,有效提升了故障传播模型的准确度,从而提升了故障诊断算法的准确率。
可以理解,该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。
需要说明的是,本说明书一个或多个实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本说明书一个或多个实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
实施例:
实验环境使用GT-ITM工具生成,实验环境包括底层网络和虚拟网络两种网络,其中,底层网络的网络节点数量从100个增加到600个,虚拟网络的网络节点服从(5,10)的均匀分布,在虚拟网服务模拟方面,采用虚拟网中的任意两点之间最短路径连接进行模拟,在底层链路的故障模拟方面,设置每条虚拟链路的先验故障概率服从[0.005,0.05]的均匀分布。为验证本发明算法VNSFDA-DEE的性能,将本发明算法与解释能力最大化的故障诊断算法(Fault Diagnosis Algorithm with Maximum Interpretation Ability,VNSFDA-MIA)进行比较。在算法的指标方面,从故障诊断算法的准确率、故障诊断算法的误报率、故障诊断时长三个维度进行分析。
故障诊断算法准确率比较结果如图4所示,X轴表示底层网络节点数量从100个增加到600个,Y轴表示故障诊断的准确率,从图可知,随着底层网络节点数量的增加,两个算法下的故障诊断准确率比较稳定。说明两个算法的性能在不同网络环境下都比较稳定,两个算法的性能方面,本发明算法的故障诊断准确率明显高于传统算法,这是因为本发明算法通过优先诊断关键虚拟网业务、过滤虚假故障两个策略,有效提升了故障传播模型的准确度,从而提升了故障诊断算法的准确率。
故障诊断算法误报率比较结果如图5所示,X轴表示底层网络节点数量从100个增加到600个,Y轴表示故障诊断的误报率,从图可知,随着底层网络节点数量的增加,两个算法下的故障诊断误报率比较稳定,说明两个算法的性能在不同网络环境下都比较稳定,两个算法的性能方面,本发明算法的故障诊断误报率低于传统算法,这是因为本发明算法通过过滤虚假故障,可以有效提升故障传播模型的准确度,从而降低了故障诊断算法的误报率。
故障诊断算法时长比较结果如图6所示,X轴表示底层网络节点数量从100个增加到600个,Y轴表示故障诊断算法时长,从图可知,随着底层网络节点数量的增加,两个算法下的故障诊断算法时长都快速增加,这是因为网络规模增加,故障传播模型将更加复杂,从而需要更长的时间进行故障定位,两个算法的性能方面,在底层网络节点数量较少时,本发明算法相比于对比算法需要更长的时间,当底层网络节点数量增加时,本发明算法的诊断时长逐渐与对比算法接近,这是因为本发明算法对网络模型优化进行优化,当底层网络节点数量增加后,可以降低故障传播模型的复杂度。
与所述虚拟网故障诊断方法相对应的,本发明实施例还提供了一种综合服务站虚拟网络故障诊断装置,包括:
构建模块,用于基于底层网络G、原始虚拟业务集合S以及底层网络G与原始虚拟业务集合S的映射关系,构建故障传播模型,基于底层链路集合F构建疑似故障节点集合Forder,基于原始虚拟业务集合S构建虚拟业务集合Sorder;
创建模块,用于创建故障集合h*;
选择模块,用于从虚拟业务集合Sorder中选择第一个虚拟业务;
判断模块,用于若故障集合h*中已有的目标故障节点不能够导致当前虚拟业务不可用,则基于故障传播模型,针对与当前虚拟业务对应的每个疑似故障节点,均计算其对当前业务的解释能力,选择最大的计算结果所对应的疑似故障节点作为目标故障节点,将目标故障节点放入故障集合h*中,并返回从虚拟业务集合Sorder中选择第一个虚拟业务的步骤,直至虚拟业务集合Sorder为空集;若故障集合h*中已有的目标故障节点能够导致当前虚拟业务不可用,则返回从虚拟业务集合Sorder中选择第一个虚拟业务的步骤,直至虚拟业务集合Sorder为空集;
输出模块,用于输出故障集合h*。
需要说明的是,除非另外定义,本说明书一个或多个实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书一个或多个实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
上述实施例的装置用于实现前述实施例中相应的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本说明书一个或多个实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
本说明书一个或多个实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (10)
1.一种综合服务站虚拟网络故障诊断方法,其特征在于,包括:
基于底层网络G、原始虚拟业务集合S以及底层网络G与原始虚拟业务集合S的映射关系,构建故障传播模型,基于底层链路集合F构建疑似故障节点集合Forder,基于原始虚拟业务集合S构建虚拟业务集合Sorder;
创建故障集合h*;
从虚拟业务集合Sorder中选择第一个虚拟业务;
若故障集合h*中已有的目标故障节点不能够导致当前虚拟业务不可用,则基于故障传播模型,针对与当前虚拟业务对应的每个疑似故障节点,均计算其对当前业务的解释能力,选择最大的计算结果所对应的疑似故障节点作为目标故障节点,将目标故障节点放入故障集合h*中,并返回从虚拟业务集合Sorder中选择第一个虚拟业务的步骤,直至虚拟业务集合Sorder为空集;若故障集合h*中已有的目标故障节点能够导致当前虚拟业务不可用,则返回从虚拟业务集合Sorder中选择第一个虚拟业务的步骤,直至虚拟业务集合Sorder为空集;
输出故障集合h*。
2.根据权利要求1所述的综合服务站虚拟网络故障诊断方法,其特征在于,所述基于底层网络G、原始虚拟业务集合S以及底层网络G与原始虚拟业务集合S的映射关系,构建故障传播模型,包括:
所述故障传播模型包括多个症状节点构成的症状层及多个故障节点构成的故障层,每个症状节点与至少一个故障节点建立映射关系,每个故障节点与至少一个症状节点建立映射关系,其中,症状节点表示原始虚拟业务集合S内的虚拟网业务的运行状态,故障节点表示底层网络G内的网络资源的故障状态。
3.根据权利要求2所述的综合服务站虚拟网络故障诊断方法,其特征在于,所述基于底层链路集合F构建疑似故障节点集合Forder,包括:
对底层链路集合F中的疑似故障节点fi进行预处理,过滤虚假的疑似故障节点,得到新的疑似故障节点集合F′;
对于F′中的每个疑似故障节点,计算其节点故障风险度;
按照节点故障风险度由大至小的顺序排列疑似故障节点,得到疑似故障节点集合Forder。
7.根据权利要求6所述的综合服务站虚拟网络故障诊断方法,其特征在于,所述基于原始虚拟业务集合S构建虚拟业务集合Sorder,包括:
对于原始虚拟业务集合S中的每个虚拟业务,计算其业务故障风险度;
按照业务故障风险度由大至小的顺序排列虚拟业务,得到虚拟业务集合Sorder。
9.根据权利要求8所述的综合服务站虚拟网络故障诊断方法,其特征在于,所述针对与当前虚拟业务对应的每个疑似故障节点,均计算其对当前业务的解释能力,包括:
Ability(h*)=arg maxhRh×PRh
其中,h={fi,fj,...,fk},表示第k次计算时,疑似故障节点集合Forder中与虚拟业务对应的前k个疑似故障节点构成的疑似故障集合;
|S|表示异常症状节点的数量,数值由网管系统检测获得;
|Srel|表示疑似故障集合h中所有疑似故障节点可以解释的异常症状节点中去除重复的异常症状节点后的数量,数值由网管系统检测获得;
10.一种综合服务站虚拟网络故障诊断装置,其特征在于,包括:
构建模块,用于基于底层网络G、原始虚拟业务集合S以及底层网络G与原始虚拟业务集合S的映射关系,构建故障传播模型,基于底层链路集合F构建疑似故障节点集合Forder,基于原始虚拟业务集合S构建虚拟业务集合Sorder;
创建模块,用于创建故障集合h*;
选择模块,用于从虚拟业务集合Sorder中选择第一个虚拟业务;
判断模块,用于若故障集合h*中已有的目标故障节点不能够导致当前虚拟业务不可用,则基于故障传播模型,针对与当前虚拟业务对应的每个疑似故障节点,均计算其对当前业务的解释能力,选择最大的计算结果所对应的疑似故障节点作为目标故障节点,将目标故障节点放入故障集合h*中,并返回从虚拟业务集合Sorder中选择第一个虚拟业务的步骤,直至虚拟业务集合Sorder为空集;若故障集合h*中已有的目标故障节点能够导致当前虚拟业务不可用,则返回从虚拟业务集合Sorder中选择第一个虚拟业务的步骤,直至虚拟业务集合Sorder为空集;
输出模块,用于输出故障集合h*。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110001467.8A CN112866009B (zh) | 2021-01-04 | 2021-01-04 | 一种综合服务站虚拟网络故障诊断方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110001467.8A CN112866009B (zh) | 2021-01-04 | 2021-01-04 | 一种综合服务站虚拟网络故障诊断方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112866009A true CN112866009A (zh) | 2021-05-28 |
CN112866009B CN112866009B (zh) | 2023-03-10 |
Family
ID=76001160
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110001467.8A Active CN112866009B (zh) | 2021-01-04 | 2021-01-04 | 一种综合服务站虚拟网络故障诊断方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112866009B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114143172A (zh) * | 2021-12-02 | 2022-03-04 | 国网河南省电力公司 | 虚拟网服务故障诊断方法、设备、介质和程序产品 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013185497A1 (zh) * | 2012-06-11 | 2013-12-19 | 华为技术有限公司 | 环网中业务处理方法及网络设备 |
CN103763132A (zh) * | 2014-01-02 | 2014-04-30 | 北京邮电大学 | 基于症状与故障相关性的网络虚拟化环境故障诊断方法 |
WO2018054081A1 (zh) * | 2016-09-22 | 2018-03-29 | 华为技术有限公司 | 故障处理方法、虚拟架构管理系统和业务管理系统 |
CN108768748A (zh) * | 2018-06-20 | 2018-11-06 | 广东电网有限责任公司 | 一种用于电力通信服务的故障诊断方法、装置及存储介质 |
CN111884859A (zh) * | 2020-07-30 | 2020-11-03 | 国网重庆市电力公司电力科学研究院 | 一种网络故障诊断方法、装置及可读存储介质 |
-
2021
- 2021-01-04 CN CN202110001467.8A patent/CN112866009B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013185497A1 (zh) * | 2012-06-11 | 2013-12-19 | 华为技术有限公司 | 环网中业务处理方法及网络设备 |
CN103763132A (zh) * | 2014-01-02 | 2014-04-30 | 北京邮电大学 | 基于症状与故障相关性的网络虚拟化环境故障诊断方法 |
WO2018054081A1 (zh) * | 2016-09-22 | 2018-03-29 | 华为技术有限公司 | 故障处理方法、虚拟架构管理系统和业务管理系统 |
CN108768748A (zh) * | 2018-06-20 | 2018-11-06 | 广东电网有限责任公司 | 一种用于电力通信服务的故障诊断方法、装置及存储介质 |
CN111884859A (zh) * | 2020-07-30 | 2020-11-03 | 国网重庆市电力公司电力科学研究院 | 一种网络故障诊断方法、装置及可读存储介质 |
Non-Patent Citations (2)
Title |
---|
朱辉青等: "配用电网通信服务告警相关性模型分割与故障诊断算法", 《电气应用》 * |
谢小军等: "网络虚拟化环境下的电力通信网多域故障诊断算法", 《能源与环保》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114143172A (zh) * | 2021-12-02 | 2022-03-04 | 国网河南省电力公司 | 虚拟网服务故障诊断方法、设备、介质和程序产品 |
Also Published As
Publication number | Publication date |
---|---|
CN112866009B (zh) | 2023-03-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100531054C (zh) | 用于诊断网络性能问题的方法和装置 | |
CN107544839B (zh) | 虚拟机迁移系统、方法及装置 | |
CN103069752B (zh) | 收集信息的代理的方法和存储管理系统 | |
CN107896168B (zh) | 一种网络虚拟化环境下的电力通信网多域故障诊断方法 | |
CN109451540A (zh) | 一种网络切片的资源分配方法和设备 | |
CN111884859B (zh) | 一种网络故障诊断方法、装置及可读存储介质 | |
CN113872997B (zh) | 基于容器集群服务的容器组pod重建方法及相关设备 | |
CN109039699B (zh) | 一种QoS约束的电力OTN通信网服务故障恢复方法 | |
CN112866009B (zh) | 一种综合服务站虚拟网络故障诊断方法及装置 | |
CN112383934A (zh) | 一种5g网络切片下多域协作的服务故障诊断方法 | |
CN113518367B (zh) | 5g网络切片下基于服务特征的故障诊断方法及系统 | |
CN112882875B (zh) | 故障诊断方法 | |
CN117041089B (zh) | 一种面向异地数据中心的设备监控系统及方法 | |
CN109858822B (zh) | 一种基于流关联分析的信息电力融合系统可靠性评估方法 | |
US10656988B1 (en) | Active monitoring of packet loss in networks using multiple statistical models | |
CN113285837B (zh) | 一种基于拓扑感知的载波网络服务故障诊断方法及装置 | |
CN115396335A (zh) | 基于微服务的工业无线网络设备接入IPv6测试系统及方法 | |
CN111917589B (zh) | 一种电力通信网络资源备份方法及相关装置 | |
CN115150253B (zh) | 一种故障根因确定方法、装置及电子设备 | |
CN112291804B (zh) | 一种5g网络切片下噪声网络的服务故障诊断方法 | |
CN113315663B (zh) | 一种基于业务特征的载波网络故障诊断方法及系统 | |
CN117097607A (zh) | 一种网络切片环境下多方协作的故障管理机制 | |
Liang et al. | Carrier Network Fault Diagnosis Algorithm Based on Network and Business Relationship | |
Lu et al. | Service Fault Location Algorithm based on Network Characteristics under 5G Network Slicing | |
Li et al. | Fault Diagnosis Algorithm Based on Service Characteristics Under Software Defined Network Slicing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |