CN114221857A - 故障定位的方法、电子设备及存储介质 - Google Patents
故障定位的方法、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114221857A CN114221857A CN202010921946.7A CN202010921946A CN114221857A CN 114221857 A CN114221857 A CN 114221857A CN 202010921946 A CN202010921946 A CN 202010921946A CN 114221857 A CN114221857 A CN 114221857A
- Authority
- CN
- China
- Prior art keywords
- node
- fault
- network
- data
- objects
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/50—Testing arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0677—Localisation of faults
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/12—Discovery or management of network topologies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/16—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请实施例涉及计算机领域,特别涉及一种故障定位的方法、电子设备及存储介质。本申请实施例提供的故障定位的方法,包括:获取待测网络中至少两个待测对象、待测对象的特征数据以及各待测对象之间的关联关系;根据至少两个所述待测对象、所述待测对象的特征数据以及各所述关联关系,生成对象关系结构图;根据所述对象关系结构图以及预设的故障定位模型,定位所述待测网络中的故障对象,故障定位模型为图神经网络结构。能够准确、高效定位出网络中的故障。
Description
技术领域
本申请实施例涉及计算机领域,特别涉及一种故障定位的方法、电子设备及存储介质。
背景技术
随着网络的规模越来越大,网络的结构越来越复杂,当网络发生故障时,如何快速的定位网络故障显得非常重要。相关技术中,通常采用基于机器学习的方法进行故障定位。
然而,基于机器学习的网络故障定位方法中,主要提取网元的特征信息进行故障定位,各个网元之间的特征信息相互独立,导致故障定位不准确。
发明内容
本申请实施例的主要目的在于提出一种故障定位的方法、电子设备及存储介质,能够准确、高效定位出网络中的故障。
为实现上述目的,本申请实施例提供了一种故障定位的方法,包括:获取待测网络中至少两个待测对象、待测对象的特征数据以及各待测对象之间的关联关系;根据至少两个所述待测对象、所述待测对象的特征数据以及各所述关联关系,生成对象关系结构图;根据所述对象关系结构图以及预设的故障定位模型,定位所述待测网络中的故障对象,故障定位模型为图神经网络结构。
为实现上述目的,本申请实施例还提供了一种电子设备,包括:至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的故障定位的方法。
为实现上述目的,本申请实施例还提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现上述的故障定位的方法。
本申请提出的故障定位的方法,获取待测网络中的待测对象、待测对象的特征数据以及各待测对象之间的关联关系,根据待测对象、待测对象的特征数据以及各待测对象之间的关联关系,生成对象关系结构图,从而将待测网络转换成表征待测对象之间关系的图谱形式,根据预设的故障定位模型,定位出该待测网络中的故障对象;故障定位模型是基于图神经网络结构训练获得,图神经网络是通过周围节点来编码中心节点,在训练中充分利用了周围节点与中心节点之间的关系,使得定位的故障节点更加准确,通过该图神经网络模型以及该对象关系结构图进行故障定位,使得定位的故障对象更加准确。
附图说明
图1是根据本发明第一实施例中故障定位的方法的流程图;
图2是根据本发明第二实施例中故障定位的方法的流程图;
图3是根据本发明第三实施例中故障定位的方法的流程图;
图4是根据本发明第三实施例中故障定位的方法中的边的示意图;
图5是根据本发明第三实施例中故障定位的方法中的边的示意图;
图6是根据本发明第三实施例中故障定位的方法中的对象关系结构图的示意图;
图7是根据本发明第三实施例中故障定位的方法中的聚合样本节点的示意图;
图8是根据本发明第四实施例中电子设备的结构框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请的各实施例进行详细的阐述。然而,本领域的普通技术人员可以理解,在本申请各实施例中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施例的种种变化和修改,也可以实现本申请所要求保护的技术方案。以下各个实施例的划分是为了描述方便,不应对本申请的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。
本发明的第一实施方式涉及一种故障定位的方法,其流程如图1所示:
步骤101:获取待测网络中至少两个待测对象、待测对象的特征数据以及各待测对象之间的关联关系。
步骤102:根据至少两个待测对象、待测对象的特征数据以及各关联关系,生成对象关系结构图。
步骤103:根据对象关系结构图以及预设的故障定位模型,定位待测网络中的故障对象,故障定位模型为图神经网络结构。
本申请提出的故障定位的方法,获取待测网络中的待测对象以及各待测对象之间的关联关系,根据待测对象以及各待测对象之间的关联关系,生成对象关系结构图,将待测网络住转换成图谱形式,根据预设的故障定位模型,定位出该待测网络中的故障对象;故障定位模型是基于图神经网络训练获得,图神经网络是通过周围节点来编码中心节点,在训练中充分利用了周围节点与中心节点之间的关系,使得定位的故障节点更加准确,通过该图神经网络模型以及该对象关系结构图进行故障定位,使得定位的故障对象更加准确。
本发明的第二实施方式涉及一种故障定位的方法,该故障定位的方法应用于电子设备,如,服务器等。第二实施例是对第一实施例中的步骤101-103的具体说明,其流程具体如图2所示:
步骤201:获取待测网络中至少两个待测对象、待测对象的特征数据以及各待测对象之间的关联关系。
具体地,本示例中故障定位的方法主要用于对网络中的故障进行定位,待测网络可以是任意一种网络,例如,时钟和时间同步网、同步数字体系(Synchronous DigitalHierarchy,“SDH”)网络、分组传送网(Packet Transport Network,“PTN”)网络、IPRAN网络、光传送网(optical transport network,“OTN”)网络、IP网络等。待测对象为待测网络中需要定位故障的对象,例如,待测网络中的网元、光纤链路等。
可以通过采集的方式获取待测对象的特征数据,该特征数据可以是该待测对象中的告警数据或性能数据,也可以即包括告警数据也包括性能数据等。关联关系可以是待测对象之间的连接关系,可以通过数据的传输检测到各待测对象之间的关联关系。
步骤202:将待测对象作为对应的节点。
具体地,可以将待测对象作为节点,例如,待测对象为网元,那么每个网元可以转换为对应的节点;若待测对象还包括光纤链路,那么可以将该光纤链路转换为对应的一个节点;待测对象可以是网元和光纤链路,将待测网络中的网元抽象作为对应的节点,将该光纤链路作为对应的节点。
步骤203:根据待测对像的特征数据,生成待测对象对应的节点的节点信息。
在一个例子中,根据特征数据的种类数;将特征数据转换为维度等于种类数的特征向量,将特征向量作为节点的节点信息。
具体地,获取特征数据的种类数,例如,若待测对象的特征数据中包括多种告警,获取该告警数据中的种类数N,若特征数据包括性能数据,则获取性能数据的种类数M,若特征数据中既包括告警数据又包括性能数据,告警数据中的种类数为N,性能数据的种类数为M,那么该特征数据的种类数为N+M。
在一个例子中,若特征数据包括告警数据;将告警数据转换为数字编码数据;将数字编码数据作为特征向量,将特征向量作为节点的节点信息。
具体地,由于告警数据可以是字符数据,为了统一数据的形式,可以将该告警数据转换为数字编码数据,将该数字编码数据作为特征数据,例如,可以采用0和1编码的方式表示告警数据;每种类型的告警对应一个特征维度,如果告警存在,该维度表示为1,否则表示为0。如果有N种不同类型的告警数据,就会得到一个N维的特征向量,该N维特征向量记为该节点的节点信息。
在一个例子中,若特征数据包括待测对象的性能数据,对性能数据进行归一化处理,将归一化处理后的性能数据作为特征向量;或者,根据预设的至少两个离散数值区间,将性能数据分散至各离散数值区间;获取性能数据所处的离散数值区间对应的数值作为特征向量。
具体地,若特征数据中包括性能数据,可以直接取性能数据的值作为特征向量中的值,为了便于特征向量的表示,还可以对性能数据进行归一化或离散化处理。归一化处理是指将性能数据表示区间归一化到0到1之间表示。离散化处理是指设置1个或多个阈值,通过阈值,可以获得多个离散数值区间,根据阈值可以将性能数据分散至各个离散数值区域,将性能数据所处的离散数值区间对应的数值作为特征向量的值。例如,若阈值为1个以及对应的两个离散数值区间,将性能数值超过阈值分至离散数值区间1,该离散数值区间1对应数值为1,否则,将性能数值分至离散数值区间0,该离散数值区间0对应数值为表示为0。如果对应多个阈值,根据多个阈值,划分为不同的离散数值区间,由低到高,每一个离散数值区间对应一个数值,性能数据所处于该离散数值区间,则获取该离散数值区间对应的数值,如设置了3个阈值,可划分为4个离散数值区间,分别对应0、1、2、3四个数值。
步骤204:根据各待测对象之间的关联关系,生成每两个节点之间边。
具体地,将各待测对象之间的关联关系作为每两个节点之间的边。例如,网元A和网元B连接,那么在对应的节点A和节点B之间生成一条边。
步骤205:根据每个节点、每个节点的节点信息以及每条边,形成对象关系结构图。
节点、节点的节点信息以及每条边组合后形成该对象关系结构图。
步骤206:根据对象关系结构图以及预设的故障定位模型,定位待测网络中的故障对象。
具体地,故障定位模型为预先基于图神经网络结构训练获得,可以基于图神经网络的节点分类模型训练该故障定位模型。
为了便于对本示例的理解的,下面介绍图神经网络。
图神经网络的传播机制数学描述如公式(1):
其中,h示节点的表征向量(记为“Embedding”),下标v表示当前的节点的索引,u表示与V节点相邻节点的索引上标k表示相邻节点在第k层σ表示激活函数Wk和Bk表示矩阵,N(v)表示节点v的邻节点集合,AGG(*)表示聚合操作。当k=0时,其中,xv是节点v的输入特征向量。
图神经网络传播机制的基础版本是聚合一个节点的邻节点信息时,采用平均的方法,并使用神经网络做聚合操作,其中,每个节点的节点信息可以为节点的表征向量h。传播机制的数学描述如公式(2)所示:
可以理解的是,公式(2)图神经网络传播机制的基础版本,还可以采用其他版本的图神经网络传播机制。图神经网络按照传播机制不同,可以划分为图卷积网络(GraphConvolutional Networks,GCN)、图注意力网络(Graph Attention Networks,GAN)、门控图神经网络(Gated Graph Neural Network)、图同构网络(Graph Isomorphism Network,GIN)和Graph SAGE网络等。
本示例中,按照预设的基于图神经网络训练的故障定位模型,对训练集中的样本结构图进行训练,获得该故障定位模型中的网络参数,通过测试样本集对故障定位模型进行验证,进而调整网络参数,获得故障定位模型。
具体地,训练集中的样本结构图可以包括节点及节点关系信息、节点标签和节点特征数据等。节点标签根据故障定位场景的需要,具体可以划分为故障节点和正常节点,或者划分为故障根源节点、故障影响节点和正常节点。样本结构图中的样本待测网络的来源包括基于实验室仿真网络环境和现网使用中的网络环境。样本结构图还可以基于不同时间获取的同一样本待测网络的数据形成。
根据故障定位的需要,建立一个端到端的基于图神经网络的故障定位模型。图神经网络可以选用具有节点分类能力的图神经网络模型,包括但不限于如下图神经网络模型,如图卷积网络(Graph Convolutional Networks,GCN)、图注意力网络(GraphAttention Networks,GAN)、门控图神经网络(Gated Graph Neural Network)、图同构网络(Graph Isomorphism Network,GIN)和Graph SAGE网络等。
为了进行节点分类,还需要在节点的Embedding后附加一个分类器来完成,负责将每个节点采用图神经网络传播后得到的Embedding,映射为对应的类别输出。本示例中以softmax分类器为例,当然也可以选择其他分类器。除此之外,还需设计对应的损失函数,用于衡量模型预测值与实际值之间的偏差程度,以便可以对已建立的基于图神经网络的节点分类模型进行训练。常用的损失函数包括交叉熵损失函数、0-1损失函数、平方损失函数、绝对损失函数、对数损失函数和指数损失函数等,如本示例中以交叉熵损失函数为例。
采用训练样本集对建立的基于图神经网络结构的故障定位模型进行训练。完成模型训练后,再采用测试样本集验证模型节点分类的效果。当节点分类的准确率达到实际业务使用的标准后,就可以将模型训练得到的参数固化下来,进行具体故障定位的应用。
在一个例子中,显示对象关系结构图以及故障对象在对象关系结构图中的位置。
具体地,可以以拓扑图或列表的形式显示该待测网络中每个对象的结果,采用拓扑图的方式直观呈现,需要对不同节点类型采用不同底色进行渲染。比如对于故障节点,可以采用红色底色进行渲染,对于对故障传播方向上会影响到的节点和边,可以采用黄色或橙色底色进行渲染,对于正常节点和边,可以采用绿色或不采用任何颜色的底色渲染。采用列表的方式呈现,可以将故障节点和正常节点通过增加一列区分开来。
本发明的第三实施方式涉及一种故障定位的方法,第三实施例是对第二实施例的进一步改进,主要改进之处在于:本实施例中的根据关联关系中是否存在方向性,若存在方向性,则将关联关系转换为具有方向性的边。其流程如图3所示。
步骤301:获取待测网络中至少两个待测对象、待测对象的特征数据以及各待测对象之间的关联关系。
步骤302:将待测对象作为对应的节点。
步骤303:根据待测对像的特征数据,生成待测对象对应的节点的节点信息。
本示例中步骤301至步骤303与第二实施例中的步骤201至步骤203大致相同,此处将不再进行赘述。
步骤304:针对每个关联关系进行如下处理:判断关联关系是否存在方向性,若是存在,将关联关系转换为表征方向性的边。
具体地,判断关联关系是否存在方向性,若存在反向性,则将该关联关系抽象为具有方向性的边。例如,若网元A的单向传输数据至网元B,该网元A与网元B之间的关联关系具有方向性。那么可以形成如图4所示的边,即节点A指向节点B。若待测对象中既有光纤链路又有网元,若节点A的数据通过光纤的输入端口1,经过输出端口2传输至节点C,光纤链路作为节点B,可以形成如图5所示的边。每条边有对应的边信息,边信息包括源端和目的端,如源端为节点A,目的端为光纤链路的输入端口1。
若关联关系中没有方向性,则直接将关联关系转换为对应的边,形成无向图。
步骤305:根据每个节点、每个节点的节点信息以及每条边,形成对象关系结构图。
该步骤与第二实施例中的步骤205大致相同,此处不再进行赘述。
步骤306:根据对象关系结构图以及预设的故障定位模型,定位待测网络中的故障对象。
在一个例子中,故障定位模型的训练过程可以包括:获取训练集中的样本结构图,样本结构图为样本网络中的样本对象、各样本对象的特征数据以及各样本对象之间的关联关系生成;若样本结构图中的边具有方向性,在对样本结构图进行训练过程中,针对样本结构图中的每个样本节点进行如下聚合处理:聚合在传播方向上该样本节点的节点信息以及该样本节点的相邻节点的节点信息,相邻节点为与样本节点之间距离处于预设距离之内的其他样本节点。
具体地,每个样本节点的相邻节点,可以是与该样本节点之间距离预设距离之内的其他样本节点,可以将样本节点与样本节点之间的距离以相邻节点所在层的层数表示;例如,如图6和图7所示,若对A节点进行聚合操作,图7中的矩形表示聚合,设定k为2,那么相邻节点为距离该A节点2层内的样本节点,
第0层即输入层,第0层的表征向量为每个样本节点的初始的Embedding;第1层:样本节点B的Embedding来自它的邻节点A、C的Embedding的传播。样本节点C的Embedding来节点A、B、E、F的Embedding的传播。样本节点D的Embedding来自它的样本节点A的Embedding的传播。第2层:样本节点A的Embedding来自它的节点B、C、D的Embedding的传播。也就是说,对于样本节点A的相邻节点是指第1层的节点B、C和D;以及第0层的样本节点A、C、B、E、F。在聚合操作时,按照公式(1)的计算方式聚合该样本节点A的节点信息以及该样本节点A的相邻节点的节点信息,其中,由于预设距离设定为2,则可以预先设置公式(1)中的k=2。
值得一提的是,如果故障传播具有方向性,建立的是有向图,在利用图神经网络进行聚合周围相邻节点特征信息时,可以对故障传播方向上的相邻节点的特征信息进行聚合计算,可以减少了计算代价,也避免了相邻但无关节点信息的干扰。进一步提高了故障定位模型的准确性。
下面本示例中,以一个具体的待测网络介绍整个故障定位的过程。
情景一:待测网络为时钟同步网。
时钟同步网主要负责对网络中各网络设备的时钟频率进行同步,将各网络设备的时钟频率偏差控制在要求的范围内。时钟同步具有方向性,即通过上游网络设备向下游网络设备进行时钟频率的同步。当出现故障时,具有故障传播的方向性,也就是上游网络设备出现故障,会导致下游网络设备出现异常。故障定位的目标,就是在时钟同步网出现故障时,可以快速找到故障网络设备。
时钟同步网故障诊断的待测对象和待测对象之间的关系,转换为节点和边,生成对象关系结构图。对于时钟同步网来说,待测对象包括网元、物理光纤链路和外部时钟源,将其转换为节点。将网元、物理光纤链路和外部时钟源之间的连接关系转换为边。例如,待测对象为网元,根据网元之间的链路关系建立边。因为时钟同步网的故障传播存在方向性,故将关联关系转换为有向边。通过采集时钟同步网的网元、物理光纤链路和外部时钟源信息,得到对应的节点、边以及各节点的节点信息,形成具有方向性的对象关系结构图。
可以采集网元的时钟类告警、性能数据作为待测对象的特征数据。对于物理光纤链路,可以将连接物理光纤链路两端的物理端口产生的告警和性能数据作为其特征数据。对于外部时钟源可以通过采集与外部时钟源相连的网元,将相关的时钟类告警和性能数据作为其特征数据。
将每个节点的特征数据转换为特征向量。对于告警数据,本示例中采用0和1编码的方式将其转换为特征向量,具体是指对于时钟相关的每种类型的告警,分别对应一个特征维度,如果告警存在,以数值1表示,否则,就以数值0表示。针对每个节点:如果有N种不同类型的特征告警,就会得到一个N维的特征向量。对于性能数据,本示例中采用归一化的方式处理性能数据,将性能值归一化到0到1区间进行表示。一种类型的性能数据对应一个特征维度。如果有M种类型的特征性能指标,那么,得到一个M维的特征向量。将告警数据和性能数据各自的特征向量进行拼接,得到一个N+M维的特征向量,将该N+M维的特征向量作为该节点的节点信息。
根据故障定位场景的需要,具体可以划分对象关系结构图中节点的类型,例如,可以划分为故障节点和正常节点,或者划分为故障根源节点、故障影响节点和正常节点。本示例中,节点的类型划分故障节点和正常节点。
在训练故障定位模型之前,获取多个样本结构图,形成训练集,样本结构图包括节点、边信息、节点标签和节点信息等。样本结构图的来源包括基于实验室仿真网络环境和现网使用中的真实网络环境。
在获得训练集之后,预先设置一个端到端的基于图神经网络的故障定位模型。图神经网络模型可以为图注意力网络,节点分类器可以为softmax分类器,损失函数可以为交叉熵损失函数。该故障定位模型的输入为图中各节点、边和节点的特征向量,输出为各节点的类型标签。需要说明的是,在进行图神经网络的聚合计算时,聚合故障传播方向上的相邻节点。
采用训练集对建立的基于图神经网络的节点分类模型对故障定位模型进行训练,一条训练样本结构图包含图中各节点、边、节点的标签和特征向量。对模型训练完成后,采用测试集验证模型训练后的效果。一条测试样本结构图同样包含图中各节点、边、节点的标签和特征向量。通过训练和验证不断更新该故障定位模型的网络参数;当故障定位的准确率达到实际业务使用的标准后,即可将模型训练得到的参数固化,生成故障定位模型。
基于已训练好的故障定位模型对待测网络中的故障对象进行定位的过程包括:首先,采集需要定位故障的时钟同步网络的信息,包括待测对象、各待测对象之间的关系和各待测对像的特征数据等信息。然后,对采集的特征数据进行预处理,转换为数字编码数据,将转换后的数据编码数据作为节点的特征向量,将待测对象作为节点,将个对象之间的关系作为边,根据节点、节点信息、边组成对象关系结构图;将得到的对象关系结构图输入到故障定位模型中,得到各个节点的节点类型,该对象关系结构图中包括节点、节点信息和边。如果节点类型是故障节点类型,则获取该故障节点的位置,完成故障位置的定位。
可以采用拓扑图或列表的方式呈现。采用拓扑图的方式直观呈现,需要对不同节点类型采用不同底色进行渲染。比如对于故障节点,可以采用红色底色进行渲染,对于对故障传播方向上会影响到的节点和边,可以采用黄色或橙色底色进行渲染,对于正常节点和边,可以采用绿色或不采用任何颜色的底色渲染。采用列表的方式呈现,可以将故障节点和正常节点通过增加一列区分开来。
采用本示例中的故障定位模型利用了时钟同步网络节点的特征信息,还充分利用了节点周围相邻节点的特征信息。通过图神经网络可以将网络中待测对象的故障特征信息利用更充分,故障定位的准确率更高。同时,时钟同步网具有故障传播的方向性,在基于图神经网络聚合周围相邻节点特征信息时,对故障传播方向上的节点信息和相邻节点的节点信息本节点进行聚合计算,可以减少计算的代价,还减少了无关节点信息的干扰。
情景二:待测网络为承载网。
承载网主要负责传输业务数据,可以提供L2VPN或L3VPN等业务。承载网中传输数据包括收发两个方向,因此,故障传播的方向包括两个方向。当承载网一个网元节点或物理光纤链路出现故障时,会影响周围相邻的数据传输节点,故障传播在两个方向上都可能存在,因此,本示例中故障传播是无方向性的。故障定位的目标,在承载网出现故障时,可以快速找到故障节点。
对于承载网来说,待测对象包括网元和物理光纤链路,将待测对象作为节点。将网元和物理光纤链路之间的关联关系作为边。承载网的故障传播无方向性,生成无向边。通过采集承载网网元节点和物理光纤链路的信息,得到对应的节点的节点信息,根据节点、节点信息以及边,生成该承载网的对象关系结构图,该对象关系结构图为无向图。
可以采集网元的时钟类告警、性能数据作为待测对象的特征数据。对于物理光纤链路,可以将连接物理光纤链路两端的物理端口产生的告警和性能数据作为其特征数据。对于外部时钟源可以通过采集与外部时钟源相连的网元,将相关的时钟类告警和性能数据作为其特征数据。
将每个节点的特征数据转换为特征向量。对于告警数据,本示例中采用0和1编码的方式将其转换为特征向量,具体是指对于时钟相关的每种类型的告警,分别对应一个特征维度,如果告警存在,以数值1表示,否则,就以数值0表示。针对每个节点:如果有N种不同类型的特征告警,就会得到一个N维的特征向量。对于性能数据,本示例中采用归一化的方式处理性能数据,将性能值归一化到0到1区间进行表示。一种类型的性能数据对应一个特征维度。如果有M种类型的特征性能指标,那么,得到一个M维的特征向量。将告警数据和性能数据各自的特征向量进行拼接,得到一个N+M维的特征向量,将该N+M维的特征向量作为该节点的节点信息。
根据故障定位场景的需要,具体可以划分对象关系结构图中节点的类型,例如,可以划分为故障节点和正常节点,或者划分为故障根源节点、故障影响节点和正常节点。本示例中,节点的类型划分故障节点和正常节点。
在训练故障定位模型之前,获取多个样本结构图,形成训练集,样本结构图包括节点及边信息、节点标签和节点信息等。样本结构图的来源包括基于实验室仿真网络环境和现网使用中的真实网络环境。
在获得训练集之后,预先设置一个端到端的基于图神经网络的故障定位模型。图神经网络模型可以为图注意力网络,节点分类器可以为softmax分类器,损失函数可以为交叉熵损失函数。该故障定位模型的输入为图中各节点、边和节点的特征向量,输出为各节点的类型标签。需要说明的是,在进行图神经网络的聚合计算时,由于故障传播不具有方向性,因此,对每个节点进行聚合操作时需要聚合本节点以及该节点的周围所有相邻的节点进行聚合计算。
采用训练集对建立的基于图神经网络的故障定位模型进行训练,一条训练样本结构图包含图中各节点、边、节点的标签和特征向量。对模型训练完成后,采用测试集验证模型训练后的效果。一条测试样本结构图同样包含图中各节点、边、节点的标签和特征向量。通过训练和验证不断更新该故障定位模型的网络参数;当故障定位的准确率达到实际业务使用的标准后,即可将模型训练得到的参数固化,生成故障定位模型。
基于已训练好的故障定位模型对待测网络中的故障对象进行定位的过程包括:首先,采集需要定位故障的时钟同步网络的信息,包括待测对象、各待测对象之间的关系和各待测对像的特征数据等信息。然后,对采集的特征数据进行预处理,转换为数字编码数据,将转换后的数据编码数据作为节点的特征向量,将待测对象作为节点,将个对象之间的关系作为边,根据节点、节点信息、边组成对象关系结构图;将得到的对象关系结构图输入到故障定位模型中,得到各个节点的节点类型,该对象关系结构图中包括节点、节点信息和边。如果节点类型是故障节点类型,则获取该故障节点的位置,完成故障位置的定位。
可以采用拓扑图或列表的方式呈现。采用拓扑图的方式直观呈现,需要对不同节点类型采用不同底色进行渲染。比如对于故障节点,可以采用红色底色进行渲染,对于对故障传播方向上会影响到的节点和边,可以采用黄色或橙色底色进行渲染,对于正常节点和边,可以采用绿色或不采用任何颜色的底色渲染。采用列表的方式呈现,可以将故障节点和正常节点通过增加一列区分开来。
本发明第四实施方式涉及一种电子设备,其结构框图如图8所示,该电子设备包括:至少一个处理器401;以及,与至少一个处理器401通信连接的存储器402;其中,存储器402存储有可被至少一个处理器401执行的指令,指令被至少一个处理器401执行,以使至少一个处理器401能够执行上述的故障定位的方法。
其中,存储器和处理器采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器和存储器的各种电路链接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器。
处理器负责管理总线和通常的处理,还可以提供各种功能,包括定时,外围接口,电压调节、电源管理以及其他控制功能。而存储器可以被用于存储处理器在执行操作时所使用的数据。
本发明第五实施方式涉及一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现上述的故障定位的方法。
本领域技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。
Claims (10)
1.一种故障定位的方法,其特征在于,包括:
获取待测网络中至少两个待测对象、所述待测对象的特征数据以及各所述待测对象之间的关联关系;
根据至少两个所述待测对象、所述待测对象的特征数据以及各所述关联关系,生成对象关系结构图;
根据所述对象关系结构图以及预设的故障定位模型,定位所述待测网络中的故障对象,所述故障定位模型为图神经网络结构。
2.根据权利要求1所述故障定位的方法,其特征在于,所述获取待测网络中至少两个待测对象、所述待测对象的特征数据以及各所述待测对象之间的关联关系,包括:
将所述待测对象作为对应的节点;
根据所述待测对像的特征数据,生成所述待测对象对应的所述节点的节点信息;
根据各所述待测对象之间的所述关联关系,生成每两个所述节点之间边;
根据每个所述节点、每个所述节点的节点信息以及每条所述边,形成所述对象关系结构图。
3.根据权利要求2所述故障定位的方法,其特征在于,所述根据各所述待测对象之间的所述关联关系,生成每两个所述节点之间边,包括:
针对每个所述关联关系进行如下处理:
判断所述关联关系是否存在方向性,若是存在,将所述关联关系转换为表征所述方向性的边。
4.根据权利要求2所述的故障定位的方法,其特征在于,所述获取所述待测对像的特征数据,生成所述待测对象对应的所述节点的节点信息,包括:
获取所述特征数据的种类数;
将所述特征数据转换为维度等于所述种类数的特征向量;
将所述特征向量作为所述节点的节点信息。
5.根据权利要求4所述的故障定位的方法,其特征在于,若所述特征数据包括所述待测对象的性能数据;
所述将所述特征数据转换为维度等于所述种类数的特征向量,包括:
对所述性能数据进行归一化处理,将归一化处理后的所述性能数据作为所述特征向量;或者,
根据预设的至少两个离散数值区间,将所述性能数据分散至各所述离散数值区间;获取所述性能数据所处的所述离散数值区间对应的数值作为所述特征向量。
6.根据权利要求4所述的故障定位的方法,其特征在于,若所述特征数据包括告警数据;
所述将所述特征数据转换为维度等于所述种类数的特征向量,包括:
将所述告警数据转换为数字编码数据;
将所述数字编码数据作为所述特征向量。
7.根据权利要求4所述的故障定位的方法,其特征在于,所述根据所述对象关系结构图以及预设的故障定位模型,定位所述待测网络中的故障对象之前,所述方法还包括:
获取训练集中的样本结构图,所述样本结构图为样本网络中的样本对象以及各样本对象之间的关联关系生成;
若所述样本结构图中的边具有方向性,在对所述样本结构图进行训练过程中,针对每个所述样本节点进行如下聚合处理:聚合在传播方向上所述样本节点的节点信息以及所述样本节点的相邻节点的节点信息,所述相邻节点为与所述样本节点之间距离处于预设距离之内的其他样本节点。
8.根据权利要求1至7中任一项所述的故障定位的方法,其特征在于,根据所述对象关系结构图以及预设的故障定位模型,定位所述待测网络中的故障对象之后,包括:
显示所述对象关系结构图以及所述故障对象在所述对象关系结构图中的位置。
9.一种电子设备,其特征在于,包括:至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至8中任一所述的故障定位的方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的故障定位的方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010921946.7A CN114221857A (zh) | 2020-09-04 | 2020-09-04 | 故障定位的方法、电子设备及存储介质 |
PCT/CN2021/116527 WO2022048652A1 (zh) | 2020-09-04 | 2021-09-03 | 故障定位的方法、电子设备及存储介质 |
EP21863714.8A EP4156022A4 (en) | 2020-09-04 | 2021-09-03 | FAULT LOCATION METHOD, ELECTRONIC DEVICE AND RECORDING MEDIUM |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010921946.7A CN114221857A (zh) | 2020-09-04 | 2020-09-04 | 故障定位的方法、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114221857A true CN114221857A (zh) | 2022-03-22 |
Family
ID=80491622
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010921946.7A Pending CN114221857A (zh) | 2020-09-04 | 2020-09-04 | 故障定位的方法、电子设备及存储介质 |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP4156022A4 (zh) |
CN (1) | CN114221857A (zh) |
WO (1) | WO2022048652A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114785674A (zh) * | 2022-04-27 | 2022-07-22 | 中国电信股份有限公司 | 故障定位方法及装置、计算机可存储介质 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115481692B (zh) * | 2022-09-23 | 2023-10-10 | 江苏安控智汇科技股份有限公司 | 一种基于sgan的水泵机组故障诊断方法 |
CN115494349B (zh) * | 2022-11-04 | 2023-04-07 | 国网浙江省电力有限公司金华供电公司 | 有源配电网单相接地故障区段定位方法 |
CN115857461B (zh) * | 2023-03-02 | 2023-05-09 | 东莞正大康地饲料有限公司 | 小猪预混合饲料生产在线监控方法及系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106998256B (zh) * | 2016-01-22 | 2020-03-03 | 腾讯科技(深圳)有限公司 | 一种通信故障定位方法及服务器 |
KR102221118B1 (ko) * | 2016-02-16 | 2021-02-26 | 삼성전자주식회사 | 영상의 특징을 추출하여 객체를 인식하는 방법 |
US10050853B2 (en) * | 2016-08-25 | 2018-08-14 | Fujitsu Limited | Neural network learning methods to identify network ports responsible for packet loss or delay |
US10637715B1 (en) * | 2017-05-02 | 2020-04-28 | Conviva Inc. | Fault isolation in over-the-top content (OTT) broadband networks |
US20200242506A1 (en) * | 2019-01-25 | 2020-07-30 | Optum Services (Ireland) Limited | Systems and methods for time-based abnormality identification within uniform dataset |
CN110995475B (zh) * | 2019-11-20 | 2023-04-11 | 国网湖北省电力有限公司信息通信公司 | 一种基于迁移学习的电力通信网故障检测方法 |
CN111538872B (zh) * | 2020-07-09 | 2020-11-03 | 太平金融科技服务(上海)有限公司 | 业务节点信息的可视化方法、装置、计算机设备和介质 |
-
2020
- 2020-09-04 CN CN202010921946.7A patent/CN114221857A/zh active Pending
-
2021
- 2021-09-03 EP EP21863714.8A patent/EP4156022A4/en active Pending
- 2021-09-03 WO PCT/CN2021/116527 patent/WO2022048652A1/zh unknown
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114785674A (zh) * | 2022-04-27 | 2022-07-22 | 中国电信股份有限公司 | 故障定位方法及装置、计算机可存储介质 |
Also Published As
Publication number | Publication date |
---|---|
EP4156022A1 (en) | 2023-03-29 |
WO2022048652A1 (zh) | 2022-03-10 |
EP4156022A4 (en) | 2024-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114221857A (zh) | 故障定位的方法、电子设备及存储介质 | |
EP3796176B1 (en) | Fault root cause analysis method and apparatus | |
US7688758B2 (en) | Node merging process for network topology representation | |
CN112087313A (zh) | 用于生成网络模拟场景的技术 | |
CN114153980A (zh) | 知识图谱构建方法和装置、检查方法、存储介质 | |
CN116684878B (zh) | 一种5g信息传输数据安全监测系统 | |
US11153193B2 (en) | Method of and system for testing a computer network | |
CN113740666B (zh) | 一种数据中心电力系统告警风暴根源故障的定位方法 | |
CN105681088B (zh) | 一种面向物联网的可靠性和性能综合评估方法 | |
US20220303188A1 (en) | Managing telecommunication network event data | |
CN115630073B (zh) | 基于边缘计算的电力物联网数据处理方法及平台 | |
CN116778856A (zh) | 一种应用于电力系统的智能化led显示装置及方法 | |
CN114881540B (zh) | 确定水源治理方案的方法和装置、电子设备和存储介质 | |
CN111510400A (zh) | 用于预测修复的通信信道的比特率的方法和装置 | |
CN112988914B (zh) | 一种基于区块链的纺织检测方法、装置和网络侧服务端 | |
WO2018142694A1 (ja) | 特徴量生成装置、特徴量生成方法及びプログラム | |
Wu et al. | Computer-aided variables sampling inspection plans for compositional proportions and measurement error adjustment | |
Bakhshaliyev et al. | Generation of 2-mode scale-free graphs for link-level internet topology modeling | |
CN108429589B (zh) | 基于光谱分析的光网络的光源及光路径识别方法 | |
CN117591283B (zh) | 基于跨平台数据融合的云切设备管理方法及系统 | |
US11551061B2 (en) | System for generating synthetic digital data of multiple sources | |
CN116992972A (zh) | 机器学习模型训练方法以及装置 | |
CN116295855B (zh) | 基于无线通信网络的故障定位及诊断系统 | |
CN116996527B (zh) | 一种汇聚分流器数据同步的方法及存储介质 | |
CN113596903A (zh) | 一种基于5g通信网络故障诊断方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |