CN112866009B - 一种综合服务站虚拟网络故障诊断方法及装置 - Google Patents

一种综合服务站虚拟网络故障诊断方法及装置 Download PDF

Info

Publication number
CN112866009B
CN112866009B CN202110001467.8A CN202110001467A CN112866009B CN 112866009 B CN112866009 B CN 112866009B CN 202110001467 A CN202110001467 A CN 202110001467A CN 112866009 B CN112866009 B CN 112866009B
Authority
CN
China
Prior art keywords
fault
node
virtual
network
suspected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110001467.8A
Other languages
English (en)
Other versions
CN112866009A (zh
Inventor
李铭
赵磊
邱吉福
李文升
管春伟
崔立勃
张�浩
刘军雨
王艳茹
李坤
曹明明
付振霄
赵晶
侯路
刘卉
马文洁
张洁
郭丹丹
佘蕊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
QINGDAO POWER SUPPLY Co OF STATE GRID SHANDONG ELECTRIC POWER Co
State Grid Information and Telecommunication Co Ltd
Economic and Technological Research Institute of State Grid Shandong Electric Power Co Ltd
Beijing Zhongdian Feihua Communication Co Ltd
Original Assignee
QINGDAO POWER SUPPLY Co OF STATE GRID SHANDONG ELECTRIC POWER Co
State Grid Information and Telecommunication Co Ltd
Economic and Technological Research Institute of State Grid Shandong Electric Power Co Ltd
Beijing Zhongdian Feihua Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by QINGDAO POWER SUPPLY Co OF STATE GRID SHANDONG ELECTRIC POWER Co, State Grid Information and Telecommunication Co Ltd, Economic and Technological Research Institute of State Grid Shandong Electric Power Co Ltd, Beijing Zhongdian Feihua Communication Co Ltd filed Critical QINGDAO POWER SUPPLY Co OF STATE GRID SHANDONG ELECTRIC POWER Co
Priority to CN202110001467.8A priority Critical patent/CN112866009B/zh
Publication of CN112866009A publication Critical patent/CN112866009A/zh
Application granted granted Critical
Publication of CN112866009B publication Critical patent/CN112866009B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network

Abstract

本说明书一个或多个实施例提供的一种综合服务站虚拟网络故障诊断方法及装置,通过构建故障传播模型,首先剔除掉虚假的故障节点,并基于故障风险度对虚拟业务进行排序,从而优先诊断重要的虚拟业务,对于每个虚拟业务,计算对应的疑似故障节点对虚拟业务的解释能力,从而构建出故障集合,有效的提高了网络故障诊断率。

Description

一种综合服务站虚拟网络故障诊断方法及装置
技术领域
本说明书一个或多个实施例涉及虚拟网故障诊断技术领域,尤其涉及一种综合服务站虚拟网络故障诊断方法及装置。
背景技术
由于网络虚拟化技术具有按需扩展、动态调度的优点,近年来已逐渐成为网络高效运营的关键技术。
在某区域发生火灾、洪涝灾害、泥石流、地震等灾难时,网络会出现大面积故障。这种背景下,对于网络运营商来说,如何保证快速恢复关键业务的故障,从而保证关键业务的可用性,是一个急需解决的问题。
现有技术中,已有的网络故障诊断模型包括二进制依赖故障模型、图型依赖故障模型、贝叶斯依赖矩阵模型等。
但是,发明人发现,现有技术中的网络故障诊断模型准确率低下。
发明内容
有鉴于此,本说明书一个或多个实施例的目的在于提出一种综合服务站虚拟网络故障诊断方法及装置,以解决现有技术中虚拟网故障诊断准确率低下的问题。
基于上述目的,本说明书一个或多个实施例提供了一种综合服务站虚拟网络故障诊断方法,包括:
基于底层网络G、原始虚拟业务集合S以及底层网络G与原始虚拟业务集合S的映射关系,构建故障传播模型,基于底层链路集合F构建疑似故障节点集合Forder,基于原始虚拟业务集合S构建虚拟业务集合Sorder
创建故障集合h*
从虚拟业务集合Sorder中选择第一个虚拟业务;
若故障集合h*中已有的目标故障节点不能够导致当前虚拟业务不可用,则基于故障传播模型,针对与当前虚拟业务对应的每个疑似故障节点,均计算其对当前业务的解释能力,选择最大的计算结果所对应的疑似故障节点作为目标故障节点,将目标故障节点放入故障集合h*中,并返回从虚拟业务集合Sorder中选择第一个虚拟业务的步骤,直至虚拟业务集合Sorder为空集;若故障集合h*中已有的目标故障节点能够导致当前虚拟业务不可用,则返回从虚拟业务集合Sorder中选择第一个虚拟业务的步骤,直至虚拟业务集合Sorder为空集;
输出故障集合h*
作为一种可选的实施方式,所述基于底层网络G、原始虚拟业务集合S以及底层网络G与原始虚拟业务集合S的映射关系,构建故障传播模型,包括:
所述故障传播模型包括多个症状节点构成的症状层及多个故障节点构成的故障层,每个症状节点与至少一个故障节点建立映射关系,每个故障节点与至少一个症状节点建立映射关系,其中,症状节点表示原始虚拟业务集合S内的虚拟网业务的运行状态,故障节点表示底层网络G内的网络资源的故障状态。
作为一种可选的实施方式,所述基于底层链路集合F构建疑似故障节点集合Forder,包括:
对底层链路集合F中的疑似故障节点fi进行预处理,过滤虚假的疑似故障节点,得到新的疑似故障节点集合F′;
对于F′中的每个疑似故障节点,计算其节点故障风险度;
按照节点故障风险度由大至小的顺序排列疑似故障节点,得到疑似故障节点集合Forder
作为一种可选的实施方式,所述对底层链路集合F中的疑似故障节点fi进行预处理,过滤虚假的疑似故障节点,得到新的疑似故障节点集合F′,包括:
针对每个疑似故障节点fi,计算其故障真实度
Figure BDA0002881534680000031
判断故障真实度
Figure BDA0002881534680000032
是否小于真实度阈值,若故障真实度
Figure BDA0002881534680000033
小于真实度阈值,则该疑似故障节点fi属于虚假的疑似故障节点,若故障真实度
Figure BDA0002881534680000034
不小于真实度阈值,则该疑似故障节点fi不属于虚假的疑似故障节点;
过滤虚假的疑似故障节点,得到新的疑似故障节点集合F′。
作为一种可选的实施方式,所述计算疑似故障节点fi的故障真实度
Figure BDA0002881534680000035
包括:
Figure BDA0002881534680000036
其中,
Figure BDA0002881534680000037
表示故障节点fi导致的可以被观察到的异常症状节点的集合,数值由网管系统检测获得;
Figure BDA0002881534680000038
表示故障节点fi承载的虚拟网业务的集合,数值由网管系统检测获得;|*|表示集合中包含元素的数量,数值由网管系统检测获得。
作为一种可选的实施方式,所述计算疑似故障节点的节点故障风险度,包括:
Figure BDA0002881534680000039
其中,hj表示疑似故障节点j的故障风险度;
Figure BDA00028815346800000310
表示底层链路
Figure BDA00028815346800000311
上承载的虚拟网业务的数量,数值由网管系统检测获得;
Rj表示故障风险因子,
Figure BDA00028815346800000312
pz表示底层链路所在故障区域的故障严重程度,取值范围[0,1],数值由网管系统检测获得;
Figure BDA0002881534680000041
表示底层链路
Figure BDA0002881534680000042
发生故障的概率,
Figure BDA0002881534680000043
Figure BDA0002881534680000044
表示灾难c可以影响的最大范围,数值由网管系统检测获得;
Disc,j表示底层链路
Figure BDA0002881534680000045
与灾难c的距离,数值由网管系统检测获得。
作为一种可选的实施方式,所述基于原始虚拟业务集合S构建虚拟业务集合Sorder,包括:
对于原始虚拟业务集合S中的每个虚拟业务,计算其业务故障风险度;
按照业务故障风险度由大至小的顺序排列虚拟业务,得到虚拟业务集合Sorder
作为一种可选的实施方式,所述对于原始虚拟业务集合S中的每个虚拟业务,计算其业务故障风险度,包括:
Figure BDA0002881534680000046
其中,Hi表示虚拟业务Si的总故障风险度;
Pi表示虚拟业务i所经过的底层链路,
Figure BDA0002881534680000047
作为一种可选的实施方式,所述针对与当前虚拟业务对应的每个疑似故障节点,均计算其对当前业务的解释能力,包括:
Ability(h*)=argmaxhRh×PRh
其中,h={fi,fj,...,fk},表示第k次计算时,疑似故障节点集合Forder中与虚拟业务对应的前k个疑似故障节点构成的疑似故障集合;
Rh表示疑似故障集合h对异常症状节点的解释能力占比,
Figure BDA0002881534680000048
|S|表示异常症状节点的数量,数值由网管系统检测获得;
|Srel|表示疑似故障集合h中所有疑似故障节点可以解释的异常症状节点中去除重复的异常症状节点后的数量,数值由网管系统检测获得;
PRh表示故障集合h中底层网络资源出现异常时,症状集合S中症状出现异常的概率,
Figure BDA0002881534680000051
数值由网管系统检测获得。
作为本发明实施例的第二个方面,本发明实施例还提供了一种综合服务站虚拟网络故障诊断装置,包括:
构建模块,用于基于底层网络G、原始虚拟业务集合S以及底层网络G与原始虚拟业务集合S的映射关系,构建故障传播模型,基于底层链路集合F构建疑似故障节点集合Forder,基于原始虚拟业务集合S构建虚拟业务集合Sorder
创建模块,用于创建故障集合h*
选择模块,用于从虚拟业务集合Sorder中选择第一个虚拟业务;
判断模块,用于若故障集合h*中已有的目标故障节点不能够导致当前虚拟业务不可用,则基于故障传播模型,针对与当前虚拟业务对应的每个疑似故障节点,均计算其对当前业务的解释能力,选择最大的计算结果所对应的疑似故障节点作为目标故障节点,将目标故障节点放入故障集合h*中,并返回从虚拟业务集合Sorder中选择第一个虚拟业务的步骤,直至虚拟业务集合Sorder为空集;若故障集合h*中已有的目标故障节点能够导致当前虚拟业务不可用,则返回从虚拟业务集合Sorder中选择第一个虚拟业务的步骤,直至虚拟业务集合Sorder为空集;
输出模块,用于输出故障集合h*
从上面所述可以看出,本说明书一个或多个实施例提供的一种综合服务站虚拟网络故障诊断方法及装置,通过构建故障传播模型,并基于故障风险度对虚拟业务进行排序,从而优先诊断重要的虚拟业务,对于每个虚拟业务,计算对应的疑似故障节点对虚拟业务的解释能力,从而构建出故障集合,有效的提高了网络故障诊断率。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的故障诊断算法的流程示意图;
图2为网络虚拟化环境示意图;
图3为本发明实施例构建的故障传播模型示意图;
图4为本发明实施例的故障诊断算法与现有算法的准确率比较示意图;
图5本发明实施例的故障诊断算法与现有算法的误报率比较示意图;
图6为本发明实施例的故障诊断算法与现有算法的时长比较示意图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,对本公开进一步详细说明。
为了实现上述发明目的,本发明实施例提供了一种综合服务站虚拟网络故障诊断方法,包括:
基于底层网络G、原始虚拟业务集合S以及底层网络G与原始虚拟业务集合S的映射关系,构建故障传播模型,基于底层链路集合F构建疑似故障节点集合Forder,基于原始虚拟业务集合S构建虚拟业务集合Sorder
创建故障集合h*
从虚拟业务集合Sorder中选择第一个虚拟业务;
若故障集合h*中已有的目标故障节点不能够导致当前虚拟业务不可用,则基于故障传播模型,针对与当前虚拟业务对应的每个疑似故障节点,均计算其对当前业务的解释能力,选择最大的计算结果所对应的疑似故障节点作为目标故障节点,将目标故障节点放入故障集合h*中,并返回从虚拟业务集合Sorder中选择第一个虚拟业务的步骤,直至虚拟业务集合Sorder为空集;若故障集合h*中已有的目标故障节点能够导致当前虚拟业务不可用,则返回从虚拟业务集合Sorder中选择第一个虚拟业务的步骤,直至虚拟业务集合Sorder为空集;
输出故障集合h*
本发明实施例中,通过构建故障传播模型,并基于故障风险度对虚拟业务进行排序,从而优先诊断重要的虚拟业务,对于每个虚拟业务,计算对应的疑似故障节点对虚拟业务的解释能力,从而构建出故障集合,有效的提高了网络故障诊断率。
图1示出了一种综合服务站虚拟网络故障诊断方法,包括:
S100、基于底层网络G、原始虚拟业务集合S以及底层网络G与原始虚拟业务集合S的映射关系,构建故障传播模型,基于底层链路集合F构建疑似故障节点集合Forder,基于原始虚拟业务集合S构建虚拟业务集合Sorder
网络切片后,基础网络被分为虚拟网和底层网络,底层网络包括底层节点和底层链路,虚拟网络包括虚拟节点和虚拟链路,底层节点为虚拟节点分配计算资源,底层链路为虚拟链路分配带宽资源,虚拟网上承载特定的虚拟网业务,为最终用户提供服务。
例如,如图2所示,网络虚拟化环境包括一个底层网络和两个虚拟网络,底层网络包括A、B、C、D、E、F六个底层节点,以及AB、BC、CD、DE、EF、AF、BF七条底层链路,虚拟网1的a1、b1、c1、d1分别由底层节点A、B、C、D分配资源,虚拟网1的虚拟链路a1b1、a1c1、b1d1、c1d1分别由底层路径AB、AB-BC、BC-CD、CD分配资源,虚拟网1上承载的两个服务为
Figure BDA0002881534680000081
Figure BDA0002881534680000082
虚拟网服务
Figure BDA0002881534680000083
是指端到端服务a1-b1,虚拟网服务
Figure BDA0002881534680000084
是指端到端服务a1-c1-d1。
从虚拟网映射关系可知,当底层网络资源发生故障时,其上承载的虚拟网资源也发生故障,此时,虚拟网资源承载的虚拟网业务也出现不可用的状态,所以,本发明的故障诊断问题可以通过虚拟网资源和底层网资源的映射关系,简化为虚拟网业务和底层网络资源之间的故障诊断问题。
作为一种可选的实施方式,所述基于底层网络G、原始虚拟业务集合S以及底层网络G与原始虚拟业务集合S的映射关系,构建故障传播模型,包括:
所述故障传播模型包括多个症状节点构成的症状层及多个故障节点构成的故障层,每个症状节点与至少一个故障节点建立映射关系,每个故障节点与至少一个症状节点建立映射关系,其中,症状节点表示原始虚拟业务集合S内的虚拟网业务的运行状态,故障节点表示底层网络G内的网络资源的故障状态。
为进行故障诊断,本发明构建基于底层网络资源和虚拟网业务的二分故障传播模型,如图3所示,该模型包括症状层、故障层、症状和故障之间的关联关系三部分,其中,症状层包括多个症状节点,故障层包括多个故障节点,每个症状节点与至少一个故障节点建立映射关系,每个故障节点与至少一个症状节点建立映射关系。其中,症状节点表示原始虚拟业务集合S内的虚拟网业务的运行状态,使用
Figure BDA0002881534680000085
表示,当
Figure BDA0002881534680000086
表示虚拟网业务
Figure BDA0002881534680000087
正常运行,称为正症状,当
Figure BDA0002881534680000088
表示虚拟网业务
Figure BDA0002881534680000089
的状态为不可用,称为负症状。故障节点表示底层网络G内的网络资源的故障状态,使用fi SN∈FSN表示,当fi SN=1,表示底层网络资源fi SN正常运行,称为正故障,当fi SN=0,表示底层网络资源fi SN不能正常运行,称为负故障。运营商根据长期的运营数据,可以得到每个底层网络资源的先验故障概率,使用p(fi SN)表示,取值范围为(0,1]。本发明主要研究底层链路资源。症状节点和故障节点之间的映射关系是指当故障层的底层网络资源出现故障时,症状层的虚拟网业务出现不可用的概率,使用
Figure BDA0002881534680000091
表示,取值范围为(0,1]。
作为一种可选的实施方式,所述基于底层链路集合F构建疑似故障节点集合Forder,包括:
对底层链路集合F中的疑似故障节点fi进行预处理,过滤虚假的疑似故障节点,得到新的疑似故障节点集合F′;
对于F′中的每个疑似故障节点,计算其节点故障风险度;
按照节点故障风险度由大至小的顺序排列疑似故障节点,得到疑似故障节点集合Forder
可选的,所述对底层链路集合F中的疑似故障节点fi进行预处理,过滤虚假的疑似故障节点,得到新的疑似故障节点集合F′,包括:
针对每个疑似故障节点fi,计算其故障真实度
Figure BDA0002881534680000092
判断故障真实度
Figure BDA0002881534680000093
是否小于真实度阈值,若故障真实度
Figure BDA0002881534680000094
小于真实度阈值,则该疑似故障节点fi属于虚假的疑似故障节点,若故障真实度
Figure BDA0002881534680000095
不小于真实度阈值,则该疑似故障节点fi不属于虚假的疑似故障节点;
过滤虚假的疑似故障节点,得到新的疑似故障节点集合F′。
可选的,所述计算疑似故障节点fi的故障真实度
Figure BDA0002881534680000096
包括:
Figure BDA0002881534680000097
其中,
Figure BDA0002881534680000098
表示故障节点fi导致的可以被观察到的异常症状节点的集合,数值由网管系统检测获得;
Figure BDA0002881534680000099
表示故障节点fi承载的虚拟网业务的集合,数值由网管系统检测获得;|*|表示集合中包含元素的数量,数值由网管系统检测获得。
由于网络噪声的存在,过滤虚假的底层链路故障和虚拟业务,可以实现故障传播模型简化。例如,如果虚拟网业务
Figure BDA0002881534680000101
都经过底层链路li,但是,
Figure BDA0002881534680000102
的状态异常,
Figure BDA0002881534680000103
的状态正常,这是由于
Figure BDA0002881534680000104
经过的底层路径出现故障,或者
Figure BDA0002881534680000105
经过的路径发生了重新路由,为解决此问题,本发明通过设置故障真实度阈值δ来简化故障传播模型。
对于底层链路li表示的故障节点fi,其故障真实度
Figure BDA0002881534680000106
的计算方法如公式(1)。对于底层链路li表示的故障节点fi,其故障真实度
Figure BDA0002881534680000107
时,表示当前链路为虚假的疑似故障,其中,δ表示故障真实度阈值。根据经验,本发明实施例将故障真实度阈值δ设置为0.5。
通过设置故障真实度阈值,可以对故障传播模型中较多的底层链路进行精简,此时,在故障传播模型中,部分虚拟网服务对应的故障节点都被裁剪,说明这些虚拟网服务的异常症状属于噪声信息,可以将其从故障传播模型中进行删除,从而精简故障传播模型。
可选的,所述计算疑似故障节点的节点故障风险度,包括:
Figure BDA0002881534680000108
其中,hj表示疑似故障节点j的故障风险度;
Figure BDA0002881534680000109
表示底层链路
Figure BDA00028815346800001010
上承载的虚拟网业务的数量,数值由网管系统检测获得;
Rj表示故障风险因子,
Figure BDA00028815346800001011
pz表示底层链路所在故障区域的故障严重程度,取值范围[0,1],数值由网管系统检测获得;
Figure BDA0002881534680000111
表示底层链路
Figure BDA0002881534680000112
发生故障的概率,
Figure BDA0002881534680000113
Figure BDA0002881534680000114
表示灾难c可以影响的最大范围,数值由网管系统检测获得;
Disc,j表示底层链路
Figure BDA0002881534680000115
与灾难c的距离,数值由网管系统检测获得。
对于底层网络拓扑Gp=(Np,Ep),其中,Np表示底层节点,Ep表示底层链路,当发生灾难时,故障区域使用Gz=(Nz,Ez)表示,故障区域Gz内受灾害影响的底层链路使用
Figure BDA0002881534680000116
表示。
从Rj的计算公式可知,底层链路
Figure BDA0002881534680000117
距离灾难中心c的距离越近,发生故障的概率越大,并且,Rj的取值为大于1的数值。由于底层网络故障的概率与底层网络资源使用情况相关,当底层网络资源使用较多时,底层网络资源发生故障的概率较大。本发明实施例定义疑似故障节点j的故障风险度hj,表示底层网络资源发生故障的可能性以及故障时损失的花费。函数
Figure BDA0002881534680000118
表示底层链路
Figure BDA0002881534680000119
上承载的虚拟资源的数量,取值为其上承载的所有虚拟链路的带宽资源之和。从疑似故障节点j的故障风险度hj的定义可知,底层组件发生故障的概率、其上承载的虚拟业务数量,决定了其故障风险度。
可选的,所述基于原始虚拟业务集合S构建虚拟业务集合Sorder,包括:
对于原始虚拟业务集合S中的每个虚拟业务,计算其业务故障风险度;
Figure BDA00028815346800001110
其中,Hi表示虚拟业务Si的总故障风险度;
Pi表示虚拟业务i所经过的底层链路,
Figure BDA00028815346800001111
按照业务故障风险度由大至小的顺序排列虚拟业务,得到虚拟业务集合Sorder
因为虚拟业务承载在底层网络上,所以,虚拟业务发生故障的概率与其所在的底层网络的故障的概率相关,所以,本发明定义虚拟业务的总故障风险度为所经过的底层链路的风险度之和。从公式(3)可知,采用底层链路的风险度来评价虚拟业务的风险大小,不但可以将虚拟业务通过的底层链路的数量作为评价因素,而且将底层链路的资源使用量、底层链路的故障特征作为评价因素,从而更加全面的反映虚拟业务的实际环境特征。当虚拟业务的总故障风险度Hi取值越大,说明当前虚拟业务故障风险度越大,越可能发生故障,而且需要首先被恢复。
S200、创建故障集合h*
S300、从虚拟业务集合Sorder中选择第一个虚拟业务;
S400、故障集合h*中已有的目标故障节点能否导致当前虚拟业务不可用:若故障集合h*中已有的目标故障节点不能够导致当前虚拟业务不可用,则执行S500、基于故障传播模型,针对与当前虚拟业务对应的每个疑似故障节点,均计算其对当前业务的解释能力,选择最大的计算结果所对应的疑似故障节点作为目标故障节点,将目标故障节点放入故障集合h*中,并执行S600、判断虚拟业务集合Sorder是否为空集,若不为空集,则返回执行S300,若为空集,则计算结束;若故障集合h*中已有的目标故障节点能够导致当前虚拟业务不可用,则执行S600、判断虚拟业务集合Sorder是否为空集,若不为空集,则返回执行S300,若为空集,则计算结束。
作为一种可选的实施方式,所述针对与当前虚拟业务对应的每个疑似故障节点,均计算其对当前业务的解释能力,包括:
Ability(h*)=argmaxhRh×PRh
其中,h={fi,fj,...,fk},表示第k次计算时,疑似故障节点集合Forder中与虚拟业务对应的前k个疑似故障节点构成的疑似故障集合;
Rh表示疑似故障集合h对异常症状节点的解释能力占比,
Figure BDA0002881534680000131
|S|表示异常症状节点的数量,数值由网管系统检测获得;
|Srel|表示疑似故障集合h中所有疑似故障节点可以解释的异常症状节点中去除重复的异常症状节点后的数量,数值由网管系统检测获得;
PRh表示故障集合h中底层网络资源出现异常时,症状集合S中症状出现异常的概率,
Figure BDA0002881534680000132
数值由网管系统检测获得。
由底层链路的故障风险度分析可知,底层链路的故障风险度越大,虚拟业务发生故障的概率越大。所以,在定位底层链路故障时,优先选择故障概率大的底层链路构造疑似故障集合,可以提升构建疑似故障集合的效率。
灾难环境可以导致较多的链路资源同时发生故障,因本发明考虑的是灾难环境下的故障定位,所以k值比普通环境下取值大,本发明实施例中k的取值为6~10。
Rh的取值越大,表明当前疑似故障集合的解释能力越强。
S700、输出故障集合h*
本发明实施例中,通过优先诊断关键虚拟网业务、过滤虚假故障两个策略,有效提升了故障传播模型的准确度,从而提升了故障诊断算法的准确率。
可以理解,该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。
需要说明的是,本说明书一个或多个实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本说明书一个或多个实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
实施例:
实验环境使用GT-ITM工具生成,实验环境包括底层网络和虚拟网络两种网络,其中,底层网络的网络节点数量从100个增加到600个,虚拟网络的网络节点服从(5,10)的均匀分布,在虚拟网服务模拟方面,采用虚拟网中的任意两点之间最短路径连接进行模拟,在底层链路的故障模拟方面,设置每条虚拟链路的先验故障概率服从[0.005,0.05]的均匀分布。为验证本发明算法VNSFDA-DEE的性能,将本发明算法与解释能力最大化的故障诊断算法(Fault Diagnosis Algorithm with Maximum Interpretation Ability,VNSFDA-MIA)进行比较。在算法的指标方面,从故障诊断算法的准确率、故障诊断算法的误报率、故障诊断时长三个维度进行分析。
故障诊断算法准确率比较结果如图4所示,X轴表示底层网络节点数量从100个增加到600个,Y轴表示故障诊断的准确率,从图可知,随着底层网络节点数量的增加,两个算法下的故障诊断准确率比较稳定。说明两个算法的性能在不同网络环境下都比较稳定,两个算法的性能方面,本发明算法的故障诊断准确率明显高于传统算法,这是因为本发明算法通过优先诊断关键虚拟网业务、过滤虚假故障两个策略,有效提升了故障传播模型的准确度,从而提升了故障诊断算法的准确率。
故障诊断算法误报率比较结果如图5所示,X轴表示底层网络节点数量从100个增加到600个,Y轴表示故障诊断的误报率,从图可知,随着底层网络节点数量的增加,两个算法下的故障诊断误报率比较稳定,说明两个算法的性能在不同网络环境下都比较稳定,两个算法的性能方面,本发明算法的故障诊断误报率低于传统算法,这是因为本发明算法通过过滤虚假故障,可以有效提升故障传播模型的准确度,从而降低了故障诊断算法的误报率。
故障诊断算法时长比较结果如图6所示,X轴表示底层网络节点数量从100个增加到600个,Y轴表示故障诊断算法时长,从图可知,随着底层网络节点数量的增加,两个算法下的故障诊断算法时长都快速增加,这是因为网络规模增加,故障传播模型将更加复杂,从而需要更长的时间进行故障定位,两个算法的性能方面,在底层网络节点数量较少时,本发明算法相比于对比算法需要更长的时间,当底层网络节点数量增加时,本发明算法的诊断时长逐渐与对比算法接近,这是因为本发明算法对网络模型优化进行优化,当底层网络节点数量增加后,可以降低故障传播模型的复杂度。
与所述虚拟网故障诊断方法相对应的,本发明实施例还提供了一种综合服务站虚拟网络故障诊断装置,包括:
构建模块,用于基于底层网络G、原始虚拟业务集合S以及底层网络G与原始虚拟业务集合S的映射关系,构建故障传播模型,基于底层链路集合F构建疑似故障节点集合Forder,基于原始虚拟业务集合S构建虚拟业务集合Sorder
创建模块,用于创建故障集合h*
选择模块,用于从虚拟业务集合Sorder中选择第一个虚拟业务;
判断模块,用于若故障集合h*中已有的目标故障节点不能够导致当前虚拟业务不可用,则基于故障传播模型,针对与当前虚拟业务对应的每个疑似故障节点,均计算其对当前业务的解释能力,选择最大的计算结果所对应的疑似故障节点作为目标故障节点,将目标故障节点放入故障集合h*中,并返回从虚拟业务集合Sorder中选择第一个虚拟业务的步骤,直至虚拟业务集合Sorder为空集;若故障集合h*中已有的目标故障节点能够导致当前虚拟业务不可用,则返回从虚拟业务集合Sorder中选择第一个虚拟业务的步骤,直至虚拟业务集合Sorder为空集;
输出模块,用于输出故障集合h*
需要说明的是,除非另外定义,本说明书一个或多个实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书一个或多个实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
上述实施例的装置用于实现前述实施例中相应的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本说明书一个或多个实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
本说明书一个或多个实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (9)

1.一种综合服务站虚拟网络故障诊断方法,其特征在于,包括:
基于底层网络G、原始虚拟业务集合S以及底层网络G与原始虚拟业务集合S的映射关系,构建故障传播模型,基于底层链路集合F构建疑似故障节点集合Forder,基于原始虚拟业务集合S构建虚拟业务集合Sorder
创建故障集合h*
从虚拟业务集合Sorder中选择第一个虚拟业务;
若故障集合h*中已有的目标故障节点不能够导致当前虚拟业务不可用,则基于故障传播模型,针对与当前虚拟业务对应的每个疑似故障节点,均计算其对当前业务的解释能力,选择最大的计算结果所对应的疑似故障节点作为目标故障节点,将目标故障节点放入故障集合h*中,并返回从虚拟业务集合Sorder中选择第一个虚拟业务的步骤,直至虚拟业务集合Sorder为空集;若故障集合h*中已有的目标故障节点能够导致当前虚拟业务不可用,则返回从虚拟业务集合Sorder中选择第一个虚拟业务的步骤,直至虚拟业务集合Sorder为空集;
输出故障集合h*
所述基于底层网络G、原始虚拟业务集合S以及底层网络G与原始虚拟业务集合S的映射关系,构建故障传播模型,包括:
所述故障传播模型包括多个症状节点构成的症状层及多个故障节点构成的故障层,每个症状节点与至少一个故障节点建立映射关系,每个故障节点与至少一个症状节点建立映射关系,其中,症状节点表示原始虚拟业务集合S内的虚拟网业务的运行状态,故障节点表示底层网络G内的网络资源的故障状态。
2.根据权利要求1所述的综合服务站虚拟网络故障诊断方法,其特征在于,所述基于底层链路集合F构建疑似故障节点集合Forder,包括:
对底层链路集合F中的疑似故障节点fi进行预处理,过滤虚假的疑似故障节点,得到新的疑似故障节点集合F′;
对于F′中的每个疑似故障节点,计算其节点故障风险度;
按照节点故障风险度由大至小的顺序排列疑似故障节点,得到疑似故障节点集合Forder
3.根据权利要求2所述的综合服务站虚拟网络故障诊断方法,其特征在于,所述对底层链路集合F中的疑似故障节点fi进行预处理,过滤虚假的疑似故障节点,得到新的疑似故障节点集合F′,包括:
针对每个疑似故障节点fi,计算其故障真实度
Figure FDA0003915714740000021
判断故障真实度
Figure FDA0003915714740000022
是否小于真实度阈值,若故障真实度
Figure FDA0003915714740000023
小于真实度阈值,则该疑似故障节点fi属于虚假的疑似故障节点,若故障真实度
Figure FDA0003915714740000024
不小于真实度阈值,则该疑似故障节点fi不属于虚假的疑似故障节点;
过滤虚假的疑似故障节点,得到新的疑似故障节点集合F′。
4.根据权利要求3所述的综合服务站虚拟网络故障诊断方法,其特征在于,所述计算疑似故障节点fi的故障真实度
Figure FDA0003915714740000025
包括:
Figure FDA0003915714740000026
其中,
Figure FDA0003915714740000027
表示故障节点fi导致的可以被观察到的异常症状节点的集合,数值由网管系统检测获得;
Figure FDA0003915714740000028
表示故障节点fi承载的虚拟网业务的集合,数值由网管系统检测获得;|*|表示集合中包含元素的数量,数值由网管系统检测获得。
5.根据权利要求2所述的综合服务站虚拟网络故障诊断方法,其特征在于,所述计算疑似故障节点的节点故障风险度,包括:
Figure FDA0003915714740000029
其中,hj表示疑似故障节点j的故障风险度;
Figure FDA00039157147400000210
表示底层链路
Figure FDA00039157147400000211
上承载的虚拟网业务的数量,数值由网管系统检测获得;
Rj表示故障风险因子,
Figure FDA00039157147400000212
pz表示底层链路所在故障区域的故障严重程度,取值范围[0,1],数值由网管系统检测获得;
Figure FDA0003915714740000031
表示底层链路
Figure FDA0003915714740000032
发生故障的概率,
Figure FDA0003915714740000033
Figure FDA0003915714740000034
表示灾难c可以影响的最大范围,数值由网管系统检测获得;
Disc,j表示底层链路
Figure FDA0003915714740000035
与灾难c的距离,数值由网管系统检测获得。
6.根据权利要求5所述的综合服务站虚拟网络故障诊断方法,其特征在于,所述基于原始虚拟业务集合S构建虚拟业务集合Sorder,包括:
对于原始虚拟业务集合S中的每个虚拟业务,计算其业务故障风险度;
按照业务故障风险度由大至小的顺序排列虚拟业务,得到虚拟业务集合Sorder
7.根据权利要求6所述的综合服务站虚拟网络故障诊断方法,其特征在于,所述对于原始虚拟业务集合S中的每个虚拟业务,计算其业务故障风险度,包括:
Figure FDA0003915714740000036
其中,Hi表示虚拟业务Si的总故障风险度;
Pi表示虚拟业务i所经过的底层链路,
Figure FDA0003915714740000037
8.根据权利要求7所述的综合服务站虚拟网络故障诊断方法,其特征在于,所述针对与当前虚拟业务对应的每个疑似故障节点,均计算其对当前业务的解释能力,包括:
Ability(h*)=argmaxhRh×PRh
其中,h={fi,fj,...,fk},表示第k次计算时,疑似故障节点集合Forder中与虚拟业务对应的前k个疑似故障节点构成的疑似故障集合;
Rh表示疑似故障集合h对异常症状节点的解释能力占比,
Figure FDA0003915714740000038
|S|表示异常症状节点的数量,数值由网管系统检测获得;
|Srel|表示疑似故障集合h中所有疑似故障节点可以解释的异常症状节点中去除重复的异常症状节点后的数量,数值由网管系统检测获得;
PRh表示故障集合h中底层网络资源出现异常时,症状集合S中症状出现异常的概率,
Figure FDA0003915714740000041
数值由网管系统检测获得。
9.一种综合服务站虚拟网络故障诊断装置,其特征在于,包括:
构建模块,用于基于底层网络G、原始虚拟业务集合S以及底层网络G与原始虚拟业务集合S的映射关系,构建故障传播模型,基于底层链路集合F构建疑似故障节点集合Forder,基于原始虚拟业务集合S构建虚拟业务集合Sorder
创建模块,用于创建故障集合h*
选择模块,用于从虚拟业务集合Sorder中选择第一个虚拟业务;
判断模块,用于若故障集合h*中已有的目标故障节点不能够导致当前虚拟业务不可用,则基于故障传播模型,针对与当前虚拟业务对应的每个疑似故障节点,均计算其对当前业务的解释能力,选择最大的计算结果所对应的疑似故障节点作为目标故障节点,将目标故障节点放入故障集合h*中,并返回从虚拟业务集合Sorder中选择第一个虚拟业务的步骤,直至虚拟业务集合Sorder为空集;若故障集合h*中已有的目标故障节点能够导致当前虚拟业务不可用,则返回从虚拟业务集合Sorder中选择第一个虚拟业务的步骤,直至虚拟业务集合Sorder为空集;
输出模块,用于输出故障集合h*
所述基于底层网络G、原始虚拟业务集合S以及底层网络G与原始虚拟业务集合S的映射关系,构建故障传播模型,包括:
所述故障传播模型包括多个症状节点构成的症状层及多个故障节点构成的故障层,每个症状节点与至少一个故障节点建立映射关系,每个故障节点与至少一个症状节点建立映射关系,其中,症状节点表示原始虚拟业务集合S内的虚拟网业务的运行状态,故障节点表示底层网络G内的网络资源的故障状态。
CN202110001467.8A 2021-01-04 2021-01-04 一种综合服务站虚拟网络故障诊断方法及装置 Active CN112866009B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110001467.8A CN112866009B (zh) 2021-01-04 2021-01-04 一种综合服务站虚拟网络故障诊断方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110001467.8A CN112866009B (zh) 2021-01-04 2021-01-04 一种综合服务站虚拟网络故障诊断方法及装置

Publications (2)

Publication Number Publication Date
CN112866009A CN112866009A (zh) 2021-05-28
CN112866009B true CN112866009B (zh) 2023-03-10

Family

ID=76001160

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110001467.8A Active CN112866009B (zh) 2021-01-04 2021-01-04 一种综合服务站虚拟网络故障诊断方法及装置

Country Status (1)

Country Link
CN (1) CN112866009B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114143172A (zh) * 2021-12-02 2022-03-04 国网河南省电力公司 虚拟网服务故障诊断方法、设备、介质和程序产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103763132A (zh) * 2014-01-02 2014-04-30 北京邮电大学 基于症状与故障相关性的网络虚拟化环境故障诊断方法
WO2018054081A1 (zh) * 2016-09-22 2018-03-29 华为技术有限公司 故障处理方法、虚拟架构管理系统和业务管理系统
CN108768748A (zh) * 2018-06-20 2018-11-06 广东电网有限责任公司 一种用于电力通信服务的故障诊断方法、装置及存储介质
CN111884859A (zh) * 2020-07-30 2020-11-03 国网重庆市电力公司电力科学研究院 一种网络故障诊断方法、装置及可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102801596B (zh) * 2012-06-11 2015-01-21 华为技术有限公司 环网中业务处理方法及网络设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103763132A (zh) * 2014-01-02 2014-04-30 北京邮电大学 基于症状与故障相关性的网络虚拟化环境故障诊断方法
WO2018054081A1 (zh) * 2016-09-22 2018-03-29 华为技术有限公司 故障处理方法、虚拟架构管理系统和业务管理系统
CN108768748A (zh) * 2018-06-20 2018-11-06 广东电网有限责任公司 一种用于电力通信服务的故障诊断方法、装置及存储介质
CN111884859A (zh) * 2020-07-30 2020-11-03 国网重庆市电力公司电力科学研究院 一种网络故障诊断方法、装置及可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
网络虚拟化环境下的电力通信网多域故障诊断算法;谢小军等;《能源与环保》(第12期);135-139 *
配用电网通信服务告警相关性模型分割与故障诊断算法;朱辉青等;《电气应用》;20180905(第17期);38-42 *

Also Published As

Publication number Publication date
CN112866009A (zh) 2021-05-28

Similar Documents

Publication Publication Date Title
CN107544839B (zh) 虚拟机迁移系统、方法及装置
CN103069752B (zh) 收集信息的代理的方法和存储管理系统
US11959596B2 (en) Methods for pipeline network inspection zone generation based on smart gas and internet of things systems thereof
CN107896168B (zh) 一种网络虚拟化环境下的电力通信网多域故障诊断方法
CN112988398A (zh) 一种微服务动态伸缩及迁移方法和装置
CN113973042B (zh) 用于网络问题的根本原因分析的方法和系统
CN111884859B (zh) 一种网络故障诊断方法、装置及可读存储介质
CN112866009B (zh) 一种综合服务站虚拟网络故障诊断方法及装置
CN113518367B (zh) 5g网络切片下基于服务特征的故障诊断方法及系统
CN111160661A (zh) 一种电力通信网可靠性优化方法、系统以及设备
US11695856B2 (en) Scheduling solution configuration method and apparatus, computer readable storage medium thereof, and computer device
CN109858822B (zh) 一种基于流关联分析的信息电力融合系统可靠性评估方法
US10656988B1 (en) Active monitoring of packet loss in networks using multiple statistical models
CN113285837B (zh) 一种基于拓扑感知的载波网络服务故障诊断方法及装置
CN112882875B (zh) 故障诊断方法
CN114116122A (zh) 一种应用容器高可用负载平台
CN113962273A (zh) 一种基于多指标的时间序列异常检测方法、系统及存储介质
CN112838962A (zh) 一种大数据集群的性能瓶颈检测方法及装置
CN112436955A (zh) 一种复杂网络的数据分布式采集方法和装置
CN115150253B (zh) 一种故障根因确定方法、装置及电子设备
CN109257207B (zh) 一种基于耦合链接介数差异指标的提高相互依存网络鲁棒性的方法
Sun Fault Tolerance Mechanism of a Distributed System for Marine Communication Network
CN112291804A (zh) 一种5g网络切片下噪声网络的服务故障诊断方法
Wang et al. Fault Diagnosis Mechanism of Virtual Network Service Based on Network Characteristics
Cui et al. Integrated Energy Virtual Network Service Fault Diagnosis Algorithm Under Disaster Event Environment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant