CN112367191A - 一种5g网络切片下服务故障定位方法 - Google Patents

一种5g网络切片下服务故障定位方法 Download PDF

Info

Publication number
CN112367191A
CN112367191A CN202011138993.0A CN202011138993A CN112367191A CN 112367191 A CN112367191 A CN 112367191A CN 202011138993 A CN202011138993 A CN 202011138993A CN 112367191 A CN112367191 A CN 112367191A
Authority
CN
China
Prior art keywords
network node
fault
network
probability
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011138993.0A
Other languages
English (en)
Other versions
CN112367191B (zh
Inventor
曾凌烽
黄志伟
吴谦
林朝哲
黄豌姝
丘国良
田志峰
翁俊鸿
周婧
宋旅宁
陈嘉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Power Supply Bureau Co Ltd
Original Assignee
Shenzhen Power Supply Bureau Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Power Supply Bureau Co Ltd filed Critical Shenzhen Power Supply Bureau Co Ltd
Priority to CN202011138993.0A priority Critical patent/CN112367191B/zh
Publication of CN112367191A publication Critical patent/CN112367191A/zh
Application granted granted Critical
Publication of CN112367191B publication Critical patent/CN112367191B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0893Assignment of logical groups to network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/04Arrangements for maintaining operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W28/00Network traffic management; Network resource management
    • H04W28/16Central resource management; Negotiation of resources or communication parameters, e.g. negotiating bandwidth or QoS [Quality of Service]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种5G网络切片下服务故障定位方法,所述方法包括根据网络节点的数量以及预设指标的重要性排序,计算每个网络节点的故障概率;对所述每个网络节点的故障概率进行降序排列,并按照先后顺序将排在前面的预设数量个网络节点的故障概率取出,构成疑似故障集合;每次从所述疑似故障集合中选择相同数量的故障节点任意组合构建一个备选故障集合,所述相同数量从1开始增加至所述预设数量;计算得到解释能力最大的备选故障集合,将所述解释能力最大的所述备选故障集合定为确定的故障集合。通过本发明,解决了现有网络故障定位由于网络规模增加,导致算法运行时间较长,影响网络的可靠性的问题。

Description

一种5G网络切片下服务故障定位方法
技术领域
本发明涉及5G通信技术领域,尤其涉及一种5G网络切片下服务故障定位方法。
背景技术
相比于4G网络,5G网络具有高带宽、低时延、高连接数等显著优点。当前,5G网络已在人们的工作生活中有较多的应用。根据5G业务对网络的要求不同,可以把5G业务分为高带宽业务、大规模接入业务、关键计算任务业务三种。高带宽业务是指对网络传输速度要求较高的业务,例如,虚拟现实业务、增强现实业务。大规模接入业务是指同时接入网络的终端设备数量较多的业务,例如,智慧农业和智能建筑中的传感检测业务。关键计算任务业务是指对网络延迟非常敏感、可靠性要求非常高的业务,例如,无人驾驶汽车、自动工厂、远程医疗业务等。从上述描述可知,单一的网络环境不能满足5G业务的多样性需求。为解决此问题,5G网络切片技术已得到全球网络运营商和网络设备商的共同认可。在网络切片以后,原来的物理网络被重新划分为底层网络和虚拟网络两种网络。底层网络负责提供通用的网络节点和网络链路。虚拟网络通过租用底层网络资源,构建虚拟网络节点和虚拟网络链路,并承载各种新型业务。为保证各种业务的稳定性和可靠性,5G网络切片环境下的故障诊断问题已成为一个急需解决的关键问题。
根据故障诊断算法的数据来源,可以将故障诊断算法分为主动诊断和被动诊断两种。主动诊断是由网络管理人员自主确定需要监测和诊断的网络范围。被动诊断是根据网络管理系统的告警信息进行故障定位。相对于主动探测诊断,被动诊断的优点是对网络的性能影响较小。比较适用于对网络可靠性要求不是非常高的环境。主动诊断适用于对网络可靠性要求较高的环境。对于网络虚拟化环境下的故障诊断,主要研究方法是将多层网络模型分解为两层网络模型,之后通过构建二进制模型或贝叶斯模型进行故障推断。为解决攻击造成网络数据不准确的问题,文献[Wu,Bo,et al.RFL:Robust fault localizationon unreliable communication channels[J].Computer Networks,2019,158:158-174.]提出了一种基于对称密钥加密机制的故障诊断算法,较好的实现了被攻击网络环境下的故障定位。从已有研究分析可知,已有研究主要通过构建故障传播模型、优化故障传播模型的方法进行故障诊断。因为5G网络需要实现高带宽、低延迟、高连接数,所以网络规模必然快速增加。传统的故障诊断算法大部分采用贪婪算法构建疑似故障集合。这种方法对于规模较小的网络,比较合适。如果网络规模增加,必然导致算法运行时间较长,影响网络的可靠性。
发明内容
本发明所要解决的技术问题在于,提供一种5G网络切片下服务故障定位方法,用于解决现有的问题。
本发明提供的一种5G网络切片下服务故障定位方法,所述方法包括:
步骤S11、构建服务故障定位模型,所述服务故障定位模型包括网络节点、服务节点以及网络节点至服务节点的有向线条;
步骤S12、获取服务节点异常的概率、网络节点故障的概率以及网络节点故障时,服务节点异常的概率,并根据网络节点故障的概率以及网络节点故障时,服务节点异常的概率计算服务节点异常时,网络节点故障的概率;
步骤S13、根据历史统计获取预设统计时间段内每个网络节点发生故障次数的最大值、发生故障次数的最小值,获取指定预设时间段内每个网络节点发生故障次数,根据所述预设统计时间段内每个网络节点发生故障次数的最大值、发生故障次数的最小值以及指定预设时间段内每个网络节点发生故障次数,计算每个网络节点故障在指定预设时间段内故障发生概率;
步骤S14、获取每个网络节点的度数和包含所述每个网络节点的异常服务数量,根据所述包含每个网络节点的异常服务数量计算包含所述每个网络节点的异常服务的平均故障率以及包含每个网络节点的异常服务之间的独立性;
步骤S15、根据网络节点的数量以及预设指标的重要性排序,计算每个网络节点的故障概率;
步骤S16、按照从大到小的顺序对所述每个网络节点的故障概率进行降序排列,并按照先后顺序将排在前面的预设数量个网络节点取出,构成疑似故障集合;
步骤S17、每次从所述疑似故障集合中选择相同数量的故障节点任意组合构建一个备选故障集合,所述相同数量从1开始增加至所述预设数量;
步骤S18、计算得到解释能力最大的备选故障集合,将所述解释能力最大的所述备选故障集合定为确定的故障集合,所述确定的故障集合中的网络节点被定位为服务故障节点。
进一步地,在所述步骤S12中,根据网络节点异常的概率以及网络节点故障时,服务节点异常的概率计算服务节点异常时,网络节点故障异常的概率的公式具体为:
Figure BDA0002737671780000031
其中所述p(nj|si)为服务节点异常时,网络节点故障的概率;所述p(si|nj)为网络节点故障时,服务节点异常的概率;所述p(nj)为网络节点故障的概率;nj表示第j个网络节点,Ns表示网络拓扑,所述nj∈Ns表示所述第j网络节点归属所述网络拓扑。
进一步地,在所述步骤S13中根据所述预设统计时间段内每个网络节点发生故障次数的最大值、发生故障次数的最小值以及指定预设时间段内每个网络节点发生故障次数,计算每个网络节点故障在指定预设时间段内故障发生概率的公式具体为:
Figure BDA0002737671780000032
其中,所述
Figure BDA0002737671780000033
是第j个网络节点在指定预设时间段内故障发生概率,所述
Figure BDA0002737671780000034
是预设统计时间段内第j个网络节点发生故障次数的最大值,所述
Figure BDA0002737671780000035
是预设统计时间段内第j个网络节点发生故障次数的最小值,所述
Figure BDA0002737671780000036
是指定预设时间段内第j个网络节点发生故障次数,所述预设统计时间段与指定预设时间段的时长相等。
进一步地,在所述步骤S14中,根据所述包含每个网络节点的异常服务数量计算包含所述每个网络节点的异常服务的平均故障率的公式具体为:
Figure BDA0002737671780000041
其中,所述
Figure BDA0002737671780000042
为包含网络节点nj的异常服务的平均故障率,所述
Figure BDA0002737671780000043
为包含网络节点nj的第r个异常服务的故障概率,所述λ为包含网络节点nj的异常服务数量。
进一步地,在所述步骤S14中,根据所述包含每个网络节点的异常服务数量计算包含每个网络节点的异常服务之间的独立性的公式具体为:
Figure BDA0002737671780000044
其中,所述
Figure BDA0002737671780000045
为包含网络节点nj的异常服务之间的独立性,所述λ为包含网络节点nj的异常服务数量,所述
Figure BDA0002737671780000046
为包含网络节点nj的第r个异常服务所包含网络节点的数量。
进一步地,在步骤S15中计算每个网络节点的故障概率具体包括:
步骤S151、根据预设指标的重要性排序,构建预设指标的比较矩阵,所述比较矩阵具体为:
Figure BDA0002737671780000051
其中,所述uab为所述预设指标的比较矩阵,表示第a个指标和第b个指标的重要性比较的取值,当第a个指标比第b个指标重要,其取值为1;当第b个指标比a个指标重要,其取值为0;当第a个指标和第b个指标一样重要其取值为0.5;所述预设指标的重要性排序依次为包含所述每个网络节点的异常服务的平均故障率、每个网络节点故障在预设时间段内故障发生概率、包含每个网络节点的异常服务之间的独立性和每个网络节点的度数;
步骤S152、根据预设指标的维度和所述比较矩阵,计算所述比较矩阵中每一行的行向量之和与每一列的列向量之和,并根据所述行向量之和、所述列向量之和与网络节点数量计算指标权重矩阵中的元素;
根据预设指标的维度和所述比较矩阵,计算每一行的行向量之和公式具体为:
Figure BDA0002737671780000052
所述ya为所述比较矩阵中第a行的行向量之和,所述m表示预设指标的维度;
根据预设指标的维度和所述比较矩阵,计算每一列的列向量之和公式具体为:
Figure BDA0002737671780000053
所述yb为所述比较矩阵中第b列的行向量之和,所述m表示预设指标的维度;
步骤S153、根据所述行向量之和、所述列向量之和与网络节点数量计算指标权重矩阵中的元素;
根据所述行向量之和、所述列向量之和与网络节点数量计算指标权重矩阵中的元素的公式具体为:
Figure BDA0002737671780000054
所述n为网络节点数量;
步骤S154、根据所述指标权重矩阵中的元素构建指标权重矩阵,公式具体为:
Figure BDA0002737671780000061
其中,所述m为指标维度,在指标权重矩阵中第一行的元素分别为第一个网络节点的y11至y1m,第n行的元素分别为第n个网络节点的y11至y1m
步骤S155、根据所述指标权重矩阵,计算每个网络节点的故障概率的公式具体为:
Figure BDA0002737671780000062
其中,
Figure BDA0002737671780000063
Figure BDA0002737671780000064
依次为第一个网络节点故障概率至第n个网络节点的故障概率,
所述n为网络节点的个数,m为所述预设指标的维度,所述
Figure BDA0002737671780000065
为所述指标权重矩阵第n行的行向量之和,
Figure BDA0002737671780000066
为所述指标权重矩阵的所有元素之和。
进一步地,所述预设指标包括每个网络节点故障在预设时间段内故障发生概率、每个网络节点的度数、包含所述每个网络节点的异常服务的平均故障率和包含每个网络节点的异常服务之间的独立性。
进一步地,所述步骤S18中计算每个备选故障集合的解释能力具体包括:
S181、根据所述服务节点异常时,网络节点故障的概率和所述服务节点异常的概率,计算每个网络节点至少引发一个服务节点异常的概率,计算公式具体为:
Figure BDA0002737671780000071
其中,所述pro(nj)为第j个网络节点至少引发一个服务节点异常的概率,所述si∈S表示异常服务归属服务节点集合,所述p(nj|si)为所述服务节点异常时,网络节点故障的概率,所述p(si)为所述服务节点异常的概率;
S182、计算每个备选故障集合的解释能力,计算公式为:
Figure BDA0002737671780000072
其中,
Figure BDA0002737671780000073
是解释能力最大的备选故障集合,
Figure BDA0002737671780000074
表示备选故障集合Nsn中的网络节点都是故障节点的概率;
Figure BDA0002737671780000081
表示备选故障集合Nsn中的网络节点与异常服务无关的概率;
Figure BDA0002737671780000082
表示备选故障集合Nsn中的网络节点与异常服务有关的概率。
实施本发明,具有如下有益效果:
通过本发明,根据网络历史运行数据以及网络拓扑结构计算每个网络节点故障在预设时间段内故障发生概率、每个网络节点的度数、包含所述每个网络节点的异常服务的平均故障率和包含每个网络节点的异常服务之间的独立性;通过上述四个指标计算每个网络节点的故障概率,将故障概率大的预设数量个网络节点取出构成疑似故障集合,并组成多个相等数量故障组成的备选故障集合,计算得到解释能力最大的备选故障集合,将所述解释能力最大的备选故障集合中的故障定位为故障,解决了现有故障定位方法由于网络规模增加,导致算法运行时间长,影响网络可靠性的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的5G网络切片下服务故障定位方法的流程图。
图2是本发明实施例提供的5G网络切片下虚拟网和底层网络的映射关系图。
图3是本发明实施例提供的5G网络切片下故障定位模型的结构图。
图4是本发明实施例提供的故障诊断准确率比较示意图。
图5是本发明实施例提供的故障诊断误诊率比较示意图。
图6是本发明实施例提供的故障诊断时间比较示意图。
具体实施方式
本专利中,以下结合附图和实施例对该具体实施方式做进一步说明。
如图1所示,本发明实施例提供了5G网络切片下服务故障定位方法,所述方法包括:
步骤S11、构建服务故障定位模型,所述服务故障定位模型包括网络节点、服务节点以及网络节点至服务节点的有向线条。
需要说明的是,根据5G网络的位置和功能不同,5G网络一般可以分为接入网、核心网、数据网三种类型的网络。因为网络切片的目标是实现端到端的网络切片,所以,网络切片环境下,5G网络将由接入网切片、核心网切片、数据网切片构成。在网络切片环境下,使用Gsn=(Nsn,Esn)表示底层网络拓扑,使用Gv=(Nv,Ev)表示虚拟网络拓扑。Nsn和Nv分别表示底层网络节点、虚拟网络节点集合,底层网络节点、虚拟网络节点也分别称为网络节点和业务节点。Esn和Ev分别表示底层网络链路和虚拟网络链路集合。
如图2所示,虚拟网和底层网络的映射关系中,在底层网络SN上承载了VN1、VN2两个虚拟网。以VN1为例,其包含的节点a1、b1、c1、d1分别映射到SN的节点A、B、C、D上。VN1的链路a1—b1映射在SN的链路A—B上。为了构建底层网络和服务症状的关联关系,本发明实施例基于贝叶斯理论构建故障定位模型。构建贝叶斯故障定位模型包括服务状态到虚拟资源映射、虚拟网到底层网络映射两个过程。本发明以端到端服务为例进行研究。在一个虚拟网上,可能存在多个端到端的服务。每个端到端的服务需要经过多个虚拟节点和虚拟链路。本发明以虚拟节点为研究对象,虚拟链路的研究方法类似。假设,图2中的VN1的端到端服务s(a1-b1-d1),对应的虚拟节点为a1、b1、d1。由于虚拟节点a1、b1、d1分别在底层节点A、B、D上承载。所以,VN1的端到端服务s(a1-b1-d1)所对应的底层节点为A、B、D。服务的集合使用S表示。
因为网络切片技术基于虚拟化、软件定义网络等技术,可以实现网络资源的动态迁移、按需分配等功能,所以网络存在不确定性。考虑到贝叶斯推理非常适合解决不确定环境下的故障诊断问题,所以,本发明基于贝叶斯构建故障定位模型,本发明提出的贝叶斯故障定位模型,其上层节点为服务节点,也称为服务节点状态,下层节点为底层网络节点,网络节点到服务节点的有向线条表示网络节点出现故障时,服务节点异常的概率,图3示出了网络节点、服务节点以及网络节点至服务节点的有向线条,例如网络节点n1出现故障时,服务节点S1异常的概率为0.7,也就是70%。
步骤S12、获取服务节点异常的概率、网络节点故障的概率以及网络节点故障时,服务节点异常的概率,并根据网络节点故障的概率以及网络节点故障时,服务节点异常的概率计算服务节点异常时,网络节点故障的概率。
需要说明的是,服务节点异常的概率通过实时告警数据查询得到,网络节点故障的概率可以根据历史运营数据及网络拓扑结构计算得到,在网络节点没有变化时,直接取历史运营数据平均值,以及网络节点故障时,服务节点异常的概率可以通过网络管理系统查询历史数据获取。
根据网络节点异常的概率以及网络节点故障时,服务节点异常的概率计算服务节点异常时,网络节点故障异常的概率的公式具体为:
Figure BDA0002737671780000101
其中所述p(nj|si)为服务节点异常时,网络节点故障的概率;所述p(si|nj)为网络节点故障时,服务节点异常的概率;所述p(nj)为网络节点故障的概率;nj表示第j个网络节点,Ns表示网络拓扑,所述nj∈Ns表示所述第j网络节点归属所述网络拓扑。
步骤S13、根据历史统计获取预设统计时间段内每个网络节点发生故障次数的最大值、发生故障次数的最小值,获取指定预设时间段内每个网络节点发生故障次数,根据所述预设统计时间段内每个网络节点发生故障次数的最大值、发生故障次数的最小值以及指定预设时间段内每个网络节点发生故障次数,计算每个网络节点故障在指定预设时间段内故障发生概率。
具体地,根据所述预设统计时间段内每个网络节点发生故障次数的最大值、发生故障次数的最小值以及指定预设时间段内每个网络节点发生故障次数,计算每个网络节点故障在指定预设时间段内故障发生概率的公式具体为:
Figure BDA0002737671780000102
其中,所述
Figure BDA0002737671780000111
是第j个网络节点在指定预设时间段内故障发生概率,所述
Figure BDA0002737671780000112
是预设统计时间段内第j个网络节点发生故障次数的最大值,所述
Figure BDA0002737671780000113
是预设统计时间段内第j个网络节点发生故障次数的最小值,所述
Figure BDA0002737671780000114
是指定预设时间段内第j个网络节点发生故障次数,所述预设统计时间段与指定预设时间段的时长相等。
步骤S14、获取每个网络节点的度数和包含所述每个网络节点的异常服务数量,根据所述包含每个网络节点的异常服务数量计算包含所述每个网络节点的异常服务的平均故障率以及包含每个网络节点的异常服务之间的独立性。
需要说明的是,每个网络节点的度数是每个网络节点连接其他网络节点的数量,通过网络管理软件可以采集到,所述包含所述每个网络节点的异常服务数量也可以通过网络管理软件采集到。
具体地,根据所述包含每个网络节点的异常服务数量计算包含所述每个网络节点的异常服务的平均故障率的公式具体为:
Figure BDA0002737671780000115
其中,所述
Figure BDA0002737671780000116
为包含网络节点nj的异常服务的平均故障率,所述
Figure BDA0002737671780000117
为包含网络节点nj的第r个异常服务的故障概率,所述λ为包含网络节点nj的异常服务数量。
具体地,根据所述包含每个网络节点的异常服务数量计算包含每个网络节点的异常服务之间的独立性的公式具体为:
Figure BDA0002737671780000121
其中,所述
Figure BDA0002737671780000122
为包含网络节点nj的异常服务之间的独立性,所述λ为包含网络节点nj的异常服务数量,所述
Figure BDA0002737671780000123
为包含网络节点nj的第r个异常服务所包含网络节点的数量。
需要说明的是,所述预设统计时间段与所述指定预设时间段的时长相等。
步骤S15、根据网络节点的数量以及预设指标的重要性排序,计算每个网络节点的故障概率。
具体地,所述预设指标包括每个网络节点故障在预设时间段内故障发生概率、每个网络节点的度数、包含所述每个网络节点的异常服务的平均故障率和包含每个网络节点的异常服务之间的独立性。
步骤S151、根据预设指标的重要性排序,构建预设指标的比较矩阵,所述比较矩阵具体为:
Figure BDA0002737671780000124
其中,所述uab为所述预设指标的比较矩阵,表示第a个指标和第b个指标的重要性比较的取值,当第a个指标比第b个指标重要,其取值为1;当第b个指标比a个指标重要,其取值为0;当第a个指标和第b个指标一样重要其取值为0.5;所述预设指标的重要性排序依次为包含所述每个网络节点的异常服务的平均故障率、每个网络节点故障在预设时间段内故障发生概率、包含每个网络节点的异常服务之间的独立性和每个网络节点的度数;
步骤S152、根据预设指标的维度和所述比较矩阵,计算所述比较矩阵中每一行的行向量之和与每一列的列向量之和,并根据所述行向量之和、所述列向量之和与网络节点数量计算指标权重矩阵中的元素;
根据预设指标的维度和所述比较矩阵,计算每一行的行向量之和公式具体为:
Figure BDA0002737671780000131
所述ya为所述比较矩阵中第a行的行向量之和,所述m表示预设指标的维度;
根据预设指标的维度和所述比较矩阵,计算每一列的列向量之和公式具体为:
Figure BDA0002737671780000132
所述yb为所述比较矩阵中第b列的行向量之和,所述m表示预设指标的维度;
步骤S153、根据所述行向量之和、所述列向量之和与网络节点数量计算指标权重矩阵中的元素;
根据所述行向量之和、所述列向量之和与网络节点数量计算指标权重矩阵中的元素的公式具体为:
Figure BDA0002737671780000133
所述n为网络节点数量;
步骤S154、根据所述指标权重矩阵中的元素构建指标权重矩阵,公式具体为:
Figure BDA0002737671780000134
其中,所述m为指标维度,在指标权重矩阵中第一行的元素分别为第一个网络节点的y11至y1m,第n行的元素分别为第n个网络节点的y11至y1m
步骤S155、根据所述指标权重矩阵,计算每个网络节点的故障概率的公式具体为:
Figure BDA0002737671780000141
其中,
Figure BDA0002737671780000142
Figure BDA0002737671780000143
依次为第一个网络节点故障概率至第n个网络节点的故障概率,
所述n为网络节点的个数,m为所述预设指标的维度,所述
Figure BDA0002737671780000144
为所述指标权重矩阵第n行的行向量之和,
Figure BDA0002737671780000145
为所述指标权重矩阵的所有元素之和。
步骤S16、按照从大到小的顺序对所述每个网络节点的故障概率进行降序排列,并按照先后顺序将排在前面的预设数量个网络节点取出,构成疑似故障集合。
需要说明的是,一般预设数量取5个,也就是网络节点的故障概率最大的5个网络节点取出,构成疑似故障集合。
步骤S17、每次从所述疑似故障集合中选择相同数量的故障节点任意组合构建一个备选故障集合,所述相同数量从1开始增加至所述预设数量。
假定疑似故障集合由{f1,f2,f3,f4,f5}组成,构成的备选故障集合分别是{f1,f2,f3,f4,f5}、{f1f2,f1f3,f1f4,f1f5,f2f3,f2f4,f2f5,f3f4,f3 f5,f4f5}、{f1f2f3,f1f2f4,f1f2f5,f1f3 f4,f1f3 f5,f1 f4 f5,f2f3f4,f2f3f5,f2f4f5,f3f4f5}、{f1f2f3f4,f1f2f3f5,f1f2f4 f5,f1f3f4f5,f2f3f4f5}和{f1f2f3f4f5},共五个备选故障集合,相同数量从1至5逐步增加。
步骤S18、计算得到解释能力最大的备选故障集合,将所述解释能力最大的所述备选故障集合定为确定的故障集合,所述确定的故障集合中的网络节点被定位为服务故障节点。
在步骤S18中,计算得到解释能力最大的备选故障集合公式具体包括:
S181、根据所述服务节点异常时,网络节点故障的概率和所述服务节点异常的概率,计算每个网络节点至少引发一个服务节点异常的概率,计算公式具体为:
Figure BDA0002737671780000151
其中,所述pro(nj)为第j个网络节点至少引发一个服务节点异常的概率,所述si∈S表示异常服务归属服务节点集合,所述p(nj|si)为所述服务节点异常时,网络节点故障的概率,所述p(si)为所述服务节点异常的概率;
S182、计算每个备选故障集合的解释能力,计算公式为:
Figure BDA0002737671780000152
其中,
Figure BDA0002737671780000153
是解释能力最大的备选故障集合,
Figure BDA0002737671780000154
表示备选故障集合Nsn中的网络节点都是故障节点的概率;
Figure BDA0002737671780000155
表示备选故障集合Nsn中的网络节点与异常服务无关的概率;
Figure BDA0002737671780000156
表示备选故障集合Nsn中的网络节点与异常服务有关的概率。
为了验证本发明实施例的效果,网络拓扑中的虚拟网和底层网络都使用GT-ITM[E.W.Zegura,K.L.Calvert,S.Bhattacharjee.How to model an internetwork[C]//Proceedings of IEEE INFOCOM,1996.]工具生成。虚拟网的节点数量服从(5,15)的均匀分布。底层网络节点数量从100个到500个之间变化。虚拟网和底层网络的映射算法采用经典的映射算法。为了模拟网络故障,设置网络节点的先验故障概率服从[0.001,0.01]的均匀分布。在网络动态环境模拟方面,以20秒为间隔对网络节点的状态进行更新。
为验证本发明方法的性能,将本发明方法利用的算法与基于映射关系的服务故障诊断算法(Service fault diagnosis algorithm based on mapping relationship,SFDAoMR)进行比较,所述SFDAoMR作为对比算法。SFDAoMR算法以虚拟网和底层网络的映射关系为依据,构建故障和症状的故障传播模型。在性能分析的维度方面,从故障诊断的准确率、误报率、诊断时长三个方面进行分析。准确率是指诊断出的故障在真实故障中的占比,该值越大表明诊断出的故障为真正故障的概率越大。误报率是指将正常网络节点识别为异常网络节点的节点数量,在总的识别出的异常网络节点中的占比,该值越小,说明算法识别出的故障都为真实的故障。诊断时长是指从算法获得服务状态和网络拓扑信息开始,到算法输出诊断的故障集合所用的时间长度。
故障诊断准确率比较的结果如图4所示。从图可知,两个算法在不同网络规模下的故障诊断准确率都比较稳定。说明网络拓扑规模对算法的诊断准确率影响较小。从两个算法性能分析可知,本发明方法的诊断准确率较高。因为本发明算法构建疑似故障集合时,基于网络拓扑特点,提高了疑似故障集合的可信性。
故障诊断误报率比较结果如图5所示。从图可知,网络拓扑规模对两个算法的误报率影响都比较小。本发明方法的误报率低于传统算法的误报率。这是因为本发明方法基于疑似故障集合的可信性,对故障诊断模型进行了优化,所以有效降低了故障诊断的误报率。
故障诊断时长比较结果如图6所示,从图可知,随着网络规模的增加,两个算法的诊断时长都在快速增加,本发明方法诊断时长相对于传统算法增长较慢。这是因为本发明算法基于各个网络节点发生故障的优先级构造疑似故障集合,所以算法的执行效率较高。
实施本发明,具有如下有益效果:
通过本发明,根据网络历史运行数据以及网络拓扑结构计算每个网络节点故障在预设时间段内故障发生概率、每个网络节点的度数、包含所述每个网络节点的异常服务的平均故障率和包含每个网络节点的异常服务之间的独立性;通过上述四个指标计算每个网络节点的故障概率,将故障概率大的预设数量个网络节点取出构成疑似故障集合,并组成多个相等数量故障组成的备选故障集合,计算得到解释能力最大的备选故障集合,将所述解释能力最大的备选故障集合中的故障定位为故障,解决了现有故障定位方法由于网络规模增加,导致算法运行时间长,影响网络可靠性的问题。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (8)

1.一种5G网络切片下服务故障定位方法,其特征在于,所述方法包括:
步骤S11、构建服务故障定位模型,所述服务故障定位模型包括网络节点、服务节点以及网络节点至服务节点的有向线条;
步骤S12、获取服务节点异常的概率、网络节点故障的概率以及网络节点故障时,服务节点异常的概率,并根据网络节点故障的概率以及网络节点故障时,服务节点异常的概率计算服务节点异常时,网络节点故障的概率;
步骤S13、根据历史统计获取预设统计时间段内每个网络节点发生故障次数的最大值、发生故障次数的最小值,获取指定预设时间段内每个网络节点发生故障次数,根据所述预设统计时间段内每个网络节点发生故障次数的最大值、发生故障次数的最小值以及指定预设时间段内每个网络节点发生故障次数,计算每个网络节点故障在指定预设时间段内故障发生概率;
步骤S14、获取每个网络节点的度数和包含所述每个网络节点的异常服务数量,根据所述包含每个网络节点的异常服务数量计算包含所述每个网络节点的异常服务的平均故障率以及包含每个网络节点的异常服务之间的独立性;
步骤S15、根据网络节点的数量以及预设指标的重要性排序,计算每个网络节点的故障概率;
步骤S16、按照从大到小的顺序对所述每个网络节点的故障概率进行降序排列,并按照先后顺序将排在前面的预设数量个网络节点取出,构成疑似故障集合;
步骤S17、每次从所述疑似故障集合中选择相同数量的故障节点任意组合构建一个备选故障集合,所述相同数量从1开始增加至所述预设数量;
步骤S18、计算得到解释能力最大的备选故障集合,将所述解释能力最大的所述备选故障集合定为确定的故障集合,所述确定的故障集合中的网络节点被定位为服务故障节点。
2.如权利要求1所述方法,其特征在于,在所述步骤S12中,根据网络节点异常的概率以及网络节点故障时,服务节点异常的概率计算服务节点异常时,网络节点故障异常的概率的公式具体为:
Figure FDA0002737671770000021
其中所述p(nj|si)为服务节点异常时,网络节点故障的概率;所述p(si|nj)为网络节点故障时,服务节点异常的概率;所述p(nj)为网络节点故障的概率;nj表示第j个网络节点,Ns表示网络拓扑,所述nj∈Ns表示所述第j网络节点归属所述网络拓扑。
3.如权利要求1所述方法,其特征在于,在所述步骤S13中根据所述预设统计时间段内每个网络节点发生故障次数的最大值、发生故障次数的最小值以及指定预设时间段内每个网络节点发生故障次数,计算每个网络节点故障在指定预设时间段内故障发生概率的公式具体为:
Figure FDA0002737671770000022
其中,所述
Figure FDA0002737671770000023
是第j个网络节点在指定预设时间段内故障发生概率,所述
Figure FDA0002737671770000024
是预设统计时间段内第j个网络节点发生故障次数的最大值,所述
Figure FDA0002737671770000025
是预设统计时间段内第j个网络节点发生故障次数的最小值,所述
Figure FDA0002737671770000026
是指定预设时间段内第j个网络节点发生故障次数,所述预设统计时间段与指定预设时间段的时长相等。
4.如权利要求1所述方法,其特征在于,在所述步骤S14中,根据所述包含每个网络节点的异常服务数量计算包含所述每个网络节点的异常服务的平均故障率的公式具体为:
Figure FDA0002737671770000031
其中,所述
Figure FDA0002737671770000032
为包含网络节点nj的异常服务的平均故障率,所述
Figure FDA0002737671770000033
为包含网络节点nj的第r个异常服务的故障概率,所述λ为包含网络节点nj的异常服务数量。
5.如权利要求1所述方法,其特征在于,在所述步骤S14中,根据所述包含每个网络节点的异常服务数量计算包含每个网络节点的异常服务之间的独立性的公式具体为:
Figure FDA0002737671770000034
其中,所述
Figure FDA0002737671770000035
为包含网络节点nj的异常服务之间的独立性,所述λ为包含网络节点nj的异常服务数量,所述
Figure FDA0002737671770000036
为包含网络节点nj的第r个异常服务所包含网络节点的数量。
6.如权利要求1所述方法,其特征在于,在步骤S15中计算每个网络节点的故障概率具体包括:
步骤S151、根据预设指标的重要性排序,构建预设指标的比较矩阵,所述比较矩阵具体为:
Figure FDA0002737671770000041
其中,所述uab为所述预设指标的比较矩阵,表示第a个指标和第b个指标的重要性比较的取值,当第a个指标比第b个指标重要,其取值为1;当第b个指标比a个指标重要,其取值为0;当第a个指标和第b个指标一样重要其取值为0.5;所述预设指标的重要性排序依次为包含所述每个网络节点的异常服务的平均故障率、每个网络节点故障在预设时间段内故障发生概率、包含每个网络节点的异常服务之间的独立性和每个网络节点的度数;
步骤S152、根据预设指标的维度和所述比较矩阵,计算所述比较矩阵中每一行的行向量之和与每一列的列向量之和,并根据所述行向量之和、所述列向量之和与网络节点数量计算指标权重矩阵中的元素;
根据预设指标的维度和所述比较矩阵,计算每一行的行向量之和公式具体为:
Figure FDA0002737671770000042
所述ya为所述比较矩阵中第a行的行向量之和,所述m表示预设指标的维度;
根据预设指标的维度和所述比较矩阵,计算每一列的列向量之和公式具体为:
Figure FDA0002737671770000043
所述yb为所述比较矩阵中第b列的行向量之和,所述m表示预设指标的维度;
步骤S153、根据所述行向量之和、所述列向量之和与网络节点数量计算指标权重矩阵中的元素;
根据所述行向量之和、所述列向量之和与网络节点数量计算指标权重矩阵中的元素的公式具体为:
Figure FDA0002737671770000044
所述n为网络节点数量;
步骤S154、根据所述指标权重矩阵中的元素构建指标权重矩阵,公式具体为:
Figure FDA0002737671770000051
其中,所述m为指标维度,在指标权重矩阵中第一行的元素分别为第一个网络节点的y11至y1m,第n行的元素分别为第n个网络节点的y11至y1m
步骤S155、根据所述指标权重矩阵,计算每个网络节点的故障概率的公式具体为:
Figure FDA0002737671770000052
其中,
Figure FDA0002737671770000053
Figure FDA0002737671770000054
依次为第一个网络节点故障概率至第n个网络节点的故障概率,
所述n为网络节点的个数,m为所述预设指标的维度,所述
Figure FDA0002737671770000055
为所述指标权重矩阵第n行的行向量之和,
Figure FDA0002737671770000056
为所述指标权重矩阵的所有元素之和。
7.如权利要求1所述方法,其特征在于,所述预设指标包括每个网络节点故障在预设时间段内故障发生概率、每个网络节点的度数、包含所述每个网络节点的异常服务的平均故障率和包含每个网络节点的异常服务之间的独立性。
8.如权利要求1所述方法,其特征在于,所述步骤S18中计算每个备选故障集合的解释能力具体包括:
S181、根据所述服务节点异常时,网络节点故障的概率和所述服务节点异常的概率,计算每个网络节点至少引发一个服务节点异常的概率,计算公式具体为:
Figure FDA0002737671770000061
其中,所述pro(nj)为第j个网络节点至少引发一个服务节点异常的概率,所述si∈S表示异常服务归属服务节点集合,所述p(nj|si)为所述服务节点异常时,网络节点故障的概率,所述p(si)为所述服务节点异常的概率;
S182、计算每个备选故障集合的解释能力,计算公式为:
Figure FDA0002737671770000062
其中,
Figure FDA0002737671770000063
是解释能力最大的备选故障集合,
Figure FDA0002737671770000071
表示备选故障集合Nsn中的网络节点都是故障节点的概率;
Figure FDA0002737671770000072
表示备选故障集合Nsn中的网络节点与异常服务无关的概率;
Figure FDA0002737671770000073
表示备选故障集合Nsn中的网络节点与异常服务有关的概率。
CN202011138993.0A 2020-10-22 2020-10-22 一种5g网络切片下服务故障定位方法 Active CN112367191B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011138993.0A CN112367191B (zh) 2020-10-22 2020-10-22 一种5g网络切片下服务故障定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011138993.0A CN112367191B (zh) 2020-10-22 2020-10-22 一种5g网络切片下服务故障定位方法

Publications (2)

Publication Number Publication Date
CN112367191A true CN112367191A (zh) 2021-02-12
CN112367191B CN112367191B (zh) 2023-04-07

Family

ID=74511647

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011138993.0A Active CN112367191B (zh) 2020-10-22 2020-10-22 一种5g网络切片下服务故障定位方法

Country Status (1)

Country Link
CN (1) CN112367191B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113518367A (zh) * 2021-04-09 2021-10-19 广东电网有限责任公司电力调度控制中心 5g网络切片下基于服务特征的故障诊断方法及系统
CN114422332A (zh) * 2022-03-16 2022-04-29 深圳艾灵网络有限公司 网络切片控制方法、装置、处理设备及存储介质
WO2023216457A1 (zh) * 2022-05-11 2023-11-16 中电信数智科技有限公司 一种核心网与基站传输网络异常预测及定位的方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2744116A1 (en) * 2012-12-13 2014-06-18 British Telecommunications public limited company Fault localisation
US20160291076A1 (en) * 2015-04-03 2016-10-06 Aclara Technologies Llc Framework for fault detection and localization in power distribution networks
US20170102984A1 (en) * 2015-10-13 2017-04-13 Huawei Technologies Co., Ltd. Fault Diagnosis Method and Apparatus for Big-Data Network System
WO2017185945A1 (zh) * 2016-04-29 2017-11-02 中兴通讯股份有限公司 一种故障处理方法及装置
CN108833184A (zh) * 2018-06-29 2018-11-16 腾讯科技(深圳)有限公司 服务故障定位方法、装置、计算机设备及存储介质
CN111092827A (zh) * 2019-12-10 2020-05-01 深圳供电局有限公司 一种电力通信网资源分配方法及装置
US20200145283A1 (en) * 2017-07-12 2020-05-07 Huawei Technologies Co.,Ltd. Intra-cluster node troubleshooting method and device

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2744116A1 (en) * 2012-12-13 2014-06-18 British Telecommunications public limited company Fault localisation
US20160291076A1 (en) * 2015-04-03 2016-10-06 Aclara Technologies Llc Framework for fault detection and localization in power distribution networks
US20170102984A1 (en) * 2015-10-13 2017-04-13 Huawei Technologies Co., Ltd. Fault Diagnosis Method and Apparatus for Big-Data Network System
WO2017185945A1 (zh) * 2016-04-29 2017-11-02 中兴通讯股份有限公司 一种故障处理方法及装置
US20200145283A1 (en) * 2017-07-12 2020-05-07 Huawei Technologies Co.,Ltd. Intra-cluster node troubleshooting method and device
CN108833184A (zh) * 2018-06-29 2018-11-16 腾讯科技(深圳)有限公司 服务故障定位方法、装置、计算机设备及存储介质
CN111092827A (zh) * 2019-12-10 2020-05-01 深圳供电局有限公司 一种电力通信网资源分配方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张骁等: "电力系统中隐性故障快速定位检测仿真", 《计算机仿真》 *
郭琰等: "基于模糊优化多目标进化算法的配电网故障定位", 《电气工程学报》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113518367A (zh) * 2021-04-09 2021-10-19 广东电网有限责任公司电力调度控制中心 5g网络切片下基于服务特征的故障诊断方法及系统
CN114422332A (zh) * 2022-03-16 2022-04-29 深圳艾灵网络有限公司 网络切片控制方法、装置、处理设备及存储介质
CN114422332B (zh) * 2022-03-16 2022-07-12 深圳艾灵网络有限公司 网络切片控制方法、装置、处理设备及存储介质
WO2023216457A1 (zh) * 2022-05-11 2023-11-16 中电信数智科技有限公司 一种核心网与基站传输网络异常预测及定位的方法

Also Published As

Publication number Publication date
CN112367191B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN112367191B (zh) 一种5g网络切片下服务故障定位方法
Chen et al. Outage prediction and diagnosis for cloud service systems
US10318366B2 (en) System and method for relationship based root cause recommendation
US8156377B2 (en) Method and apparatus for determining ranked causal paths for faults in a complex multi-host system with probabilistic inference in a time series
Yang et al. A time efficient approach for detecting errors in big sensor data on cloud
CN104903866B (zh) 对事件根本原因的分析予以支援的管理系统以及方法
CN113328872B (zh) 故障修复方法、装置和存储介质
CN107707431A (zh) 一种面向云平台的数据安全监测方法及系统
CN108933694B (zh) 基于拨测数据的数据中心网络故障节点诊断方法及系统
JP2009527839A (ja) 通信ネットワークのトランザクション監視のための方法及びシステム
CN108322320A (zh) 业务生存性分析方法及装置
CN115237717A (zh) 一种微服务异常检测方法和系统
CN111884859A (zh) 一种网络故障诊断方法、装置及可读存储介质
CN110766100B (zh) 轴承故障诊断模型构建方法、诊断方法及电子设备
Karthik et al. Data trust model for event detection in wireless sensor networks using data correlation techniques
Zhang et al. Faulty sensor data detection in wireless sensor networks using logistical regression
CN113518367B (zh) 5g网络切片下基于服务特征的故障诊断方法及系统
CN110083529A (zh) 自动化测试方法、装置、介质和电子设备
CN107590008B (zh) 一种通过加权熵判断分布式集群可靠度的方法和系统
CN111614504A (zh) 基于时间序列和故障树分析的电网调控数据中心业务特性故障定位方法及系统
CN113572639B (zh) 一种载波网络故障的诊断方法、系统、设备和介质
Jha et al. Holistic measurement-driven system assessment
CN111641535B (zh) 网络监控方法、装置、电子设备和介质
CN114385403A (zh) 基于双层知识图谱架构的分布式协同故障诊断方法
CN114124486A (zh) 一种用于拜占庭共识机制中提升节点安全性的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Zeng Lingfeng

Inventor after: Tian Zhifeng

Inventor after: Zhu Hailong

Inventor after: Weng Junhong

Inventor after: Zhou Jing

Inventor after: Song Lvning

Inventor after: Chen Jia

Inventor after: Huang Zhiwei

Inventor after: Hong Danke

Inventor after: Wu Qian

Inventor after: Zhang Guoyi

Inventor after: Qiu Guoliang

Inventor after: Lin Chaozhe

Inventor after: Zhou Jianyong

Inventor after: Huang Wanshu

Inventor before: Zeng Lingfeng

Inventor before: Song Lvning

Inventor before: Chen Jia

Inventor before: Huang Zhiwei

Inventor before: Wu Qian

Inventor before: Lin Chaozhe

Inventor before: Huang Wanshu

Inventor before: Qiu Guoliang

Inventor before: Tian Zhifeng

Inventor before: Weng Junhong

Inventor before: Zhou Jing

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant