CN112100369A - 结合语义的网络故障关联规则生成方法和网络故障检测方法 - Google Patents
结合语义的网络故障关联规则生成方法和网络故障检测方法 Download PDFInfo
- Publication number
- CN112100369A CN112100369A CN202010744548.2A CN202010744548A CN112100369A CN 112100369 A CN112100369 A CN 112100369A CN 202010744548 A CN202010744548 A CN 202010744548A CN 112100369 A CN112100369 A CN 112100369A
- Authority
- CN
- China
- Prior art keywords
- node
- network
- nodes
- vector representation
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000001514 detection method Methods 0.000 title claims abstract description 16
- 239000013598 vector Substances 0.000 claims abstract description 136
- 238000013528 artificial neural network Methods 0.000 claims abstract description 24
- 238000012216 screening Methods 0.000 claims abstract description 8
- 239000011159 matrix material Substances 0.000 claims description 16
- 238000012549 training Methods 0.000 claims description 10
- 230000011218 segmentation Effects 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 3
- 238000012935 Averaging Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 8
- 238000003745 diagnosis Methods 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 241000700605 Viruses Species 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Animal Behavior & Ethology (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种结合语义的网络故障关联规则生成方法,包括:(1)根据网络设备和告警信息以及关联关系构建网络知识图谱;(2)构建并优化词表,根据词的优化后向量表示构建网络知识图谱中节点的初始向量表示;(3)构建实现自动编码和解码的图神经网络,以节点的初始向量表示作为图神经网络的输入,以解码得到的重构图作为输出,根据重构图与输入图之间的距离值、编码得到的节点的向量表示分布与正态分布的散度值构建损失函数,利用损失函数优化节点的向量表示;(4)根据节点的优化后向量表示,计算任意两个告警节点的相似度,依据该相似度值筛选获得网络故障关联规则并输出。该公开了一种结合语义的网络故障检测方法。
Description
技术领域
本发明属于网络故障检测领域,具体涉及一种结合语义的网络故障关联规则生成方法和网络故障检测方法。
背景技术
网络故障是指由于硬件的问题、软件的漏洞、病毒的侵入等原因引起网络无法提供正常服务或降低服务质量的状态。网络故障检测是支持网络正常运行重要的一环,检测的正常运行则需要大量的网络故障关联规则作为辅助,因此归纳总结网络故障关联规则有助于网络故障的诊断及根因分析。目前的网络故障关联规则的归纳一般由公司内经验丰富的维护人员负责,但这一方式存在着成本高、难以泛化等问题。
图神经网络作为一种基于深度学习的强大图表示技术,旨在扩展深度神经网络以处理任意图结构数据,已显示出了卓越的性能。图神经网络的目标是学习每个节点的低维向量表示,该向量低维向量表示可用于许多下游任务,例如节点分类,节点聚类和链接预测。考虑将实际场景中各个设备抽象为不同的节点,设备间的物理连接或软件调用关系抽象为边的连接,从而将问题建模为异构图上的链接预测问题。
知识图谱作为一种特殊的图数据,是一种人类可识别并且对机器友好的知识表示。作为一种应用型技术,知识图谱在很多领域中都得到了广泛的应用,例如信息检索、自然语言理解、问答系统、推荐系统、金融风控、教育医疗等。然而,如何自动化地构建高质量的知识图谱,以及如何充分地利用知识图谱的实体和关系所包含的语义进行推理,仍是需要研究的问题,方法之一就是使用知识图谱的链接预测算法。链接预测指给定头实体(或尾实体)和关系,预测实体在该关系的对应的尾实体(或头实体),当然也可以给定两个实体预测它们最有可能存在的关系。
申请公布号为CN111010311A的专利申请公开了一种基于知识图谱的智能网络故障诊断方法,提取知识图谱中子图组成事件簇,根据事件簇的中心点作为故障点,以实现智能网络故障诊断检测。申请公布号为CN106603293A的专利申请公开了虚拟网络环境下一种基于深度学习的网络故障诊断方法,该网络故障诊断方法采用LSTM模型进行网络故障。
发明内容
本发明的目的是提供一种结合语义的网络故障关联规则生成方法,仅通过图上部分节点的关联规则对每个点的向量表示进行更新,从而更为准确的计算节点间的相似度进行链接预测。包括以下步骤:
(1)以网络设备和告警信息作为节点,以网络设备之间的连接关系、网络设备与告警信息之间的产生关系,以及告警信息之间的触发关系作为连边,构建网络知识图谱;
(2)构建网络故障场景的词表,对词表进行语义层面的预训练以优化词的向量表示,根据词的优化后向量表示构建网络知识图谱中节点的初始向量表示;
(3)构建实现自动编码和解码的图神经网络,以节点的初始向量表示作为图神经网络的输入,以解码得到的重构图作为输出,根据重构图与输入图之间的距离值、编码得到的节点的向量表示分布与正态分布的散度值构建损失函数,利用损失函数更新图神经网络参数和优化节点的向量表示;
(4)根据节点的优化后向量表示,计算任意两个告警节点的相似度,依据该相似度值筛选获得网络故障关联规则并输出。
本发明实施例提供的一种结合语义的网络故障关联规则生成方法,首先通过词表构建网络节点的节点表示,然后通过图神经网络来优化节点的向量表示,依据节点的优化后向量表示计算相邻两个节点的相似度,以获得多条网络故障关联规则,该多条网络故障关联规则可以补全网络知识图谱中的连接关系。
本发明的另一目的是提供一种结合语义的网络故障检测方法,包括以下步骤:
利用上述结合语义的网络故障关联规则生成方法生成多条网络故障关联规则,利用该多条网络故障关联规则补全网络知识图谱;
当每一网络节点出现故障时,以故障节点作为初始节点,利用补全网络知识图谱搜索获得与故障节点相关的其他网络节点,实现网络故障的检测。
本发明实施例提供的结合语义的网络故障检测方法根据补全的网络知识图谱能够检测到相关联的故障节点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他附图。
图1是本发明实施例提供的结合语义的网络故障关联规则生成方法的流程图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
图1是本发明实施例提供的结合语义的网络故障关联规则生成方法的流程图。如图1所示,实施例提供了一种结合语义的网络故障关联规则生成方法,包括以下步骤:
步骤1,以网络设备和告警信息作为节点,以网络设备之间的连接关系、网络设备与告警信息之间的产生关系,以及告警信息之间的触发关系作为连边,构建网络知识图谱。
实施例构建的网络知识图谱是针对某一个网络故障场景的网络知识图谱。该网络故障场景中包含网络设备和一些告警信息,网络设备和网络设备之间具有固定的连接关系,网络设备能够产生一些告警信息,同时一条告警信息可能触发另一条告警信息,因此,在构建网络知识图谱时,以网络设备和告警信息作为节点,并为每个节点添加节点名称信息,同时以网络设备之间的连接关系、网络设备与告警信息之间的产生关系,以及告警信息之间的触发关系作为连边,当节点之间存在上述连接关系、产生关系以及触发关系时,则节点之间通过连边连接。该网络知识图谱中节点之间连边表示两个节点相似作为监督信号有助于图神经网络的训练,而从在之后的预测阶段,如果两个节点相似,则结果预测为可能存在连接关系。
步骤2,构建网络故障场景的词表,对词表进行语义层面的预训练以优化词的向量表示,根据词的优化后向量表示构建网络知识图谱中节点的初始向量表示。
在获得根据网络故障场景构建的网络知识图谱后,即可以根据网络知识图谱生成词表,具体地,构建网络故障场景的词表过程为:提取网络知识图谱中每个节点名称信息,对所有节点名称信息进行分词后,对分词结果整合、去重处理后得到网络故障场景的词表。为词表中的每个词初始化一个低纬向量空间表示(初始词向量),得到初始化词表,则该初始化词表可以表示为n*d的二维矩阵,该二维矩阵表示将词表中的n个词语映射到d维分布向量空间,即每个词语对应一个d维的初始词向量表示。
表1
节点名称信息 | 节点分词结果 |
格式化失败 | ['失败','格式化'] |
联机设定失败 | ['联机','失败','设定'] |
表1为示例性给出的分词表示。如表1,给定了2个样例节点,每个节点的名称由可分词序列组成,将每个节点名称分词处理后得到的词进行整合、去重等处理,即可构成一个词表。之后每个节点低纬空间的向量表示将被表示为词表的multi-hot向量,即向量表示的维度与词表大小保持一致,节点覆盖的词为1,未覆盖的词为0,具体如表2所示的节点初始化表示:
表2
节点名称信息 | ['失败','格式化','联机','设定'] |
格式化失败 | [1,1,0,0] |
联机设定失败 | [1,0,1,1] |
由于每个告警信息具有一定的文档说明信息,包括语义化的可能原因,依赖设备等。在获得初始化词表之后,使用非结构化文档表述对初始化词表进行端对端的预训练提取语义信息。具体地,对词表进行语义层面的预训练以优化词的向量表示包括:
针对每个节点对应的文档描述,遍历词表中的词,提取文档描述覆盖到的词,将文档描述覆盖词的初始向量表示与节点名称信息包含词的初始向量表示拼接成组合向量;
然后对该组合向量进行预训练以优化组合向量,使组合向量中每个词的向量表示之间关联性更强,从优化组合向量中提取获得词的优化后向量表示。这样通过对表示句子的组合向量的优化过程间接地实现了对初始词向量的优化过程以获得词的优化后向量表示,组成优化词表。
实施例中,采用skip-gram、CBOW等无监督的词向量算法对组合向量进行预训练以优化组合向量,以此使得节点的向量表示能够捕获到文档中可能存在的语义信息,并将节点的向量表示的维度从词表的大小进一步缩小到指定维度,进而获得词间可能存在的共现关系。语义将词表中所有词的向量表示作为预训练模型的输入,以表3的节点对应的文档描述作为监督信号,最大化单个节点对应的文档描述中共同出现的词表中的词,即每一行的下划线标注部分,得到优化后词表中各个词的向量表示。
表3节点文档描述
在获得优化词表的基础上,可以根据优化词表中词的优化后向量表示构建网络知识图谱中节点的初始向量表示,包括:对节点名称信息包含词的优化后向量表示进行求平均、取最大值或进行多层感知机操作等,得到节点的初始向量表示。也就是对每个节点通过聚合其覆盖词的组合向量表示作为初始向量表示。聚合方式可通过各种函数实现,如平均值、最大值、多层感知机等。得到的初始向量表示直接可以作为图神经网络的输入,以训练图神经网络参数和优化节点的向量表示。
步骤3,构建实现自动编码和解码的图神经网络,以节点的初始向量表示作为图神经网络的输入,以解码得到的重构图作为输出,根据重构图与输入图之间的距离值、编码得到的节点的向量表示分布与正态分布的散度值构建损失函数,利用损失函数更新图神经网络参数和优化节点的向量表示。
实施例中,构建的图神经网络及能够实现节点的向量表示的优化,还能够实现根据节点的向量表示重构图,通过重构图上的边作为监督信息来优化编码过程参数,同时通过训练各个节点的向量表示捕获图结构信息,以获得节点的优化后向量表示,该节点的优化后向量表示同时包含了语义信息和图结构信息,用于网络故障关联规则的计算。因此,所述图神经网络包括由图卷积网络构建的编码器,用于编码节点的向量表示,获得节点的优化后向量表示;
还包含用于生成重构图的解码器,该解码器中通过计算两两节点之间存在边的概率来生成重构图,以来进行链路预测。
其中,编码器通过以下过程实现对节点的向量表示的编码:
首先,利用第一图卷积网络对输入的节点特征矩阵X和为输入图的邻接矩阵A进行图卷积操作,获得编码的节点向量表示μ:
μ=GCNμ(X,A)
然后,利用第二图卷积网络对输入的节点特征矩阵X和为输入图的邻接矩阵A进行图卷积操作,获得编码的节点向量表示的方差σ:
logσ=GCNσ(X,A)
最后,根据节点向量表示μ和节点向量表示的方差σ构建正态分布,从正态分布中采集点来编码得到节点的优化后向量表示:
其中,GCNμ(·)表示用于计算节点向量表示μ的第一图卷积网络,GCNσ(·)表示用于计算节点向量表示的方差σ的第二图卷积网络,q(Z|X,A)为优化后向量表示,表示从节点向量表示的均值μ和节点向量表示的方差σ组成的正态分布中的采集值,i表示采集值的索引,与输入节点个数保持一致,zi表示单个节点的向量表示,Z表示所有节点向量表示矩阵。
上述用于计算节点的向量表示均值和方差的第一图卷积网络和第二图卷积网络被定义为:其中,值得注意的是,GCNμ(X,A)和GCNσ(X,A)共享初始网络参数W0,但各自的网络参数W1不同,采样变量这一步和变分自编码器一样,使用重参数技巧。
解码器生成重构图的过程为:
首先,根据节点的优化后向量表示计算两节点之间存在连边的概率值p(Aij=1|zi,zj):
然后,依据该概率值p(Aij=1|zi,zj)生成重构图:
其中,sigmoid(·)表示sigmoid函数,zi,zj表示第i个节点的优化后向量表示和第j个节点的优化后向量表示,Aij=1表示第i个节点和第j个节点之间存在连边,p(Aij|zi,zj)表示第i个节点和第j个节点之间的连边概率,当存在连边时,p(Aij|zi,zj)=p(Aij=1|zi,zj),当不存在连边时,p(Aij|zi,zj)=0,p(A|Z)表示在已知所有节点现在的向量表示的情况下,计算得到的节点间可能存在连接关系的概率。
生成重构图的过程中,是计算节点间存在关联的可能性,使用所有节点的优化向量表示两两计算关联的可能性之后形成的n*n矩阵,计算方式为,矩阵中每一元素,都是横纵坐标对应节点的向量表示通过关联度函数后计算出来的数值,值越大,表示这两个节点之间存在边的概率越大,取值范围为[0,1]。该连边作为监督信号中,若边存在值为1,不存在则为0,然后再利用该监督信号对节点的向量表示进行优化。
实施例中,构建的损失函数L为:
L=Eq(Z|X,A)[logp(A|Z)]-KL[q(Z|X,A)||p(Z)]
其中,Eq(Z|X,A)[logp(A|Z)]为交叉熵函数,作为生成图和原始图之间的距离度量。p(Z)=∏iN(zi|0,I),表示均值为0和方差为1组成的正态分布中的采集值,KL[·]表示散度函数,计算节点表示向量分布和正态分布的散度。
该损失函数L既包含了重构图和输入图之间的距离度量,还包括了节点表示向量分布和正态分布的散度,根据该损失函数L可以不断优化图神经网络参数,还能够使节点不断捕获图上可能在的图结构信息(即当两个节点相连时,即表明两个节点相似,也就是两个节点可能存在连边关系),以优化节点的向量表示,进而获得节点的优化后向量表示,根据该节点的优化后向量表示可以拆分得到进一步优化的词语的向量表示,将该词语的进一步优化向量表示可以组成进一步优化词表。根据这个进一步优化词表,可以构建任意一个节点的优化后向量表示。
步骤4,根据节点的优化后向量表示,计算任意两个告警节点的相似度,依据该相似度值筛选获得网络故障关联规则并输出。
在获得进一步优化词表后,针对某个告警信息,根据进一步优化词表和节点名称信息,采用聚合方式构建节点的优化后向量表示,依据该节点的优化后向量表示计算两个告警节点的相似度,依据该相似度值筛选获得网络故障关联规则并输出。具体过程为:首先根据节点的优化后向量表示,计算任意两个告警节点的相似度,然后根据相似度阈值,筛选出相似度大于相似度阈值的对应的告警节点对,按相似度从高到低进行排序,在告警节点对之间建立关联规则并输出。
当然,也可以根据整个网络知识图谱中节点的优化后向量表示,计算任意两个告警节点的相似度,获得整个网络知识图谱对应的相似度矩阵,然后对该相似度矩阵中的相似度值进行降序排序,并提取较为相似的前n条相似度值对应的关联规则作为结果输出。
当然,还可以先给定某个告警节点的筛选限制条件,例如以告警信息的几邻域范围为筛选限制条件,首先根据诗选限制条件,从网络知识图谱中获得候选告警节点,然后计算告警节点与候选告警节点之间的相似度,该相似度作为告警节点与候选告警节点存在关联的概率,并将概率大于相似度阈值的结果返回,即返回大于相似度阈值的至少1个相似度值对应的两个告警节点,在该两个告警节点之间建立关联规则并输出,然后依据该关联规则补全网络知识图谱,并还可以可视化输出补全的网络知识图谱。
实施例中,告警节点的相似度的计算方法可以为点积、参数化等,在此不受限制。
在知识图谱中,每个节点具有唯一的向量表示。而在网络故障场景中,已有规则无法覆盖到所有的点,因此无法挖掘到整张网络知识图谱上的规则。因此,本实施例提供的结合语义的网络故障关联规则生成方法采用术语的聚合向量表示来生成节点的向量表示后,整个词表都能得到充分的训练,从而更新网络知识图谱上的所有节点,更好的学习到节点间的相互关系。
在实际故障场景中,存在着大量的故障节点。如果采用传统的协作过滤或基于神经网络的one-hot方法来表示节点,则每个节点表示的维度与整张图上的总节点数保持一致,导致参数量过大。使用词表的方式来表示各个节点,每个节点的维度通常设定在16或32维这类相对较小的维度,同时这样只需要学习术语的向量表示,而不是学习节点的向量表示,能够显着减少参数数量。
总之,本实施例提供的一种结合语义的网络故障关联规则生成方法,首先通过词表构建网络节点的节点表示,然后通过图神经网络来优化节点的向量表示,依据节点的优化后向量表示计算相邻两个节点的相似度,以获得多条网络故障关联规则,该多条网络故障关联规则可以补全网络知识图谱中的连接关系。
实施例还提供了一种结合语义的网络故障检测方法,包括以下步骤:
利用上述结合语义的网络故障关联规则生成方法生成多条网络故障关联规则,利用该多条网络故障关联规则补全网络知识图谱;
当每一网络节点出现故障时,以故障节点作为初始节点,利用补全网络知识图谱搜索获得与故障节点相关的其他网络节点,能够预测给定故障节点最有可能关联的故障节点,实现网络故障的检测。
实施例提供的结合语义的网络故障检测方法根据补全的网络知识图谱能够检测到相关联的故障节点。
以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的最优选实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种结合语义的网络故障关联规则生成方法,其特征在于,包括以下步骤:
(1)以网络设备和告警信息作为节点,以网络设备之间的连接关系、网络设备与告警信息之间的产生关系,以及告警信息之间的触发关系作为连边,构建网络知识图谱;
(2)构建网络故障场景的词表,对词表进行语义层面的预训练以优化词的向量表示,根据词的优化后向量表示构建网络知识图谱中节点的初始向量表示;
(3)构建实现自动编码和解码的图神经网络,以节点的初始向量表示作为图神经网络的输入,以解码得到的重构图作为输出,根据重构图与输入图之间的距离值、编码得到的节点的向量表示分布与正态分布的散度值构建损失函数,利用损失函数更新图神经网络参数和优化节点的向量表示;
(4)根据节点的优化后向量表示,计算任意两个告警节点的相似度,依据该相似度值筛选获得网络故障关联规则并输出。
2.如权利要求1所述的结合语义的网络故障关联规则生成方法,其特征在于,所述构建网络故障场景的词表包括:
提取网络知识图谱中每个节点名称信息,对所有节点名称信息进行分词后,对分词结果整合、去重处理后得到网络故障场景的词表。
3.如权利要求1所述的结合语义的网络故障关联规则生成方法,其特征在于,所述对词表进行语义层面的预训练以优化词的向量表示包括:
针对每个节点对应的文档描述,遍历词表中的词,提取文档描述覆盖到的词,将文档描述覆盖词的初始向量表示与节点名称信息包含词的初始向量表示拼接成组合向量;
然后对该组合向量进行预训练以优化组合向量,从优化组合向量中提取获得词的优化后向量表示。
4.如权利要求1所述的结合语义的网络故障关联规则生成方法,其特征在于,所述根据词的优化后向量表示构建网络知识图谱中节点的初始向量表示包括:
对节点名称信息包含词的优化后向量表示进行求平均、取最大值或进行多层感知机操作,得到节点的初始向量表示。
5.如权利要求1所述的结合语义的网络故障关联规则生成方法,其特征在于,所述图神经网络包括由图卷积网络构建的编码器,用于编码节点的向量表示,获得节点的优化后向量表示;
还包含用于生成重构图的解码器,该解码器中通过计算两两节点之间存在边的概率来生成重构图。
6.如权利要求5所述的结合语义的网络故障关联规则生成方法,其特征在于,所述编码器通过以下过程实现对节点的向量表示的编码:
首先,利用第一图卷积网络对输入的节点特征矩阵X和为输入图的邻接矩阵A进行图卷积操作,获得编码的节点向量表示μ:
μ=GCNμ(X,A)
然后,利用第二图卷积网络对输入的节点特征矩阵X和为输入图的邻接矩阵A进行图卷积操作,获得编码的节点向量表示的方差σ:
logσ=GCNσ(X,A)
最后,根据节点向量表示μ和节点向量表示的方差σ构建正态分布,从正态分布中采集点来编码得到节点的优化后向量表示:
其中,GCNμ(·)表示用于计算节点向量表示μ的第一图卷积网络,GCNσ(·)表示用于计算节点向量表示的方差σ的第二图卷积网络,q(Z|X,A)为优化后向量表示,q(zi|X,A)=N(zi|μi,diag(σi 2),表示从节点向量表示的均值μ和节点向量表示的方差σ组成的正态分布中的采集值,i表示采集值的索引,与输入节点个数保持一致,zi表示单个节点的向量表示,Z表示所有节点向量表示矩阵。
7.如权利要求5所述的结合语义的网络故障关联规则生成方法,其特征在于,所述解码器生成重构图的过程为:
首先,根据节点的优化后向量表示计算两节点之间存在连边的概率值p(Aij=1|zi,zj):
然后,依据该概率值p(Aij=1|zi,zj)生成重构图:
其中,sigmoid(·)表示sigmoid函数,zi,zj表示第i个节点的优化后向量表示和第j个节点的优化后向量表示,Aij=1表示第i个节点和第j个节点之间存在连边,p(Aij|zi,zj)表示第i个节点和第j个节点之间的连边概率,当存在连边时,p(Aij|zi,zj)=p(Aij=1|zi,zj),当不存在连边时,p(Aij|zi,zj)=0,p(A|Z)表示在已知所有节点现在的向量表示的情况下,计算得到的节点间可能存在连接关系的概率。
8.如权利要求1所述的结合语义的网络故障关联规则生成方法,其特征在于,构建的损失函数L为:
L=Eq(Z|X,A)[logp(A|Z)]-KL[q(Z|X,A)||p(Z)]
其中,Eq(Z|X,A)[logp(A|Z)]为交叉熵函数,作为生成图和原始图之间的距离度量。p(Z)=ΠiN(zi|0,I),表示均值为0和方差为1组成的正态分布中的采集值,KL[·]表示散度函数,计算节点表示向量分布和正态分布的散度。
9.如权利要求1所述的结合语义的网络故障关联规则生成方法,其特征在于,步骤(4)中,首先根据节点的优化后向量表示,计算任意两个告警节点的相似度,然后根据相似度阈值,筛选出相似度大于相似度阈值的对应的告警节点对,按相似度从高到低进行排序,在告警节点对之间建立关联规则并输出。
10.一种结合语义的网络故障检测方法,其特征在于,包括以下步骤:
利用权利要求1~9任一项所述的结合语义的网络故障关联规则生成方法生成多条网络故障关联规则,利用该多条网络故障关联规则补全网络知识图谱;
当网络节点出现故障时,以故障节点作为初始节点,利用补全网络知识图谱搜索获得与故障节点相关的其他网络节点,实现网络故障的检测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010744548.2A CN112100369B (zh) | 2020-07-29 | 2020-07-29 | 结合语义的网络故障关联规则生成方法和网络故障检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010744548.2A CN112100369B (zh) | 2020-07-29 | 2020-07-29 | 结合语义的网络故障关联规则生成方法和网络故障检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112100369A true CN112100369A (zh) | 2020-12-18 |
CN112100369B CN112100369B (zh) | 2022-06-10 |
Family
ID=73749850
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010744548.2A Active CN112100369B (zh) | 2020-07-29 | 2020-07-29 | 结合语义的网络故障关联规则生成方法和网络故障检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112100369B (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112579813A (zh) * | 2020-12-24 | 2021-03-30 | 上海湃星信息科技有限公司 | 一种基于知识图谱的遥感图像检索方法及其装置 |
CN112988522A (zh) * | 2021-03-08 | 2021-06-18 | 北京明略软件系统有限公司 | 用于告警信号关联的方法、装置及设备 |
CN113065356A (zh) * | 2021-03-19 | 2021-07-02 | 南方电网调峰调频发电有限公司信息通信分公司 | 一种基于语义分析算法的it设备运维故障建议处理方法 |
CN113157923A (zh) * | 2021-04-29 | 2021-07-23 | 北京小米移动软件有限公司 | 实体分类方法、装置及可读存储介质 |
CN113297571A (zh) * | 2021-05-31 | 2021-08-24 | 浙江工业大学 | 面向图神经网络模型后门攻击的检测方法和装置 |
CN113434193A (zh) * | 2021-08-26 | 2021-09-24 | 北京必示科技有限公司 | 根因变更的定位方法和装置 |
CN113886120A (zh) * | 2021-09-28 | 2022-01-04 | 济南浪潮数据技术有限公司 | 一种服务器故障诊断方法、装置、设备及可读存储介质 |
CN114676746A (zh) * | 2022-02-18 | 2022-06-28 | 上海交通大学 | 一种自然灾害下电力设备故障概率预测方法及系统 |
CN114785674A (zh) * | 2022-04-27 | 2022-07-22 | 中国电信股份有限公司 | 故障定位方法及装置、计算机可存储介质 |
CN114867052A (zh) * | 2022-06-10 | 2022-08-05 | 中国电信股份有限公司 | 无线网络故障诊断方法、装置、电子设备和介质 |
WO2022217711A1 (zh) * | 2021-04-15 | 2022-10-20 | 平安科技(深圳)有限公司 | 基于多层关联知识图谱的信息预测方法、装置、设备及介质 |
CN116032725A (zh) * | 2022-12-27 | 2023-04-28 | 中国联合网络通信集团有限公司 | 故障根因定位模型的生成方法及装置 |
CN116684200A (zh) * | 2023-07-31 | 2023-09-01 | 北京天防安全科技有限公司 | 网络安全漏洞的攻击模式的知识补全方法及系统 |
CN116932013A (zh) * | 2023-09-15 | 2023-10-24 | 广州市桂勤器械设备工程有限公司 | 基于人工智能的医用气体设备运行系统更新方法及系统 |
CN117312350A (zh) * | 2023-11-28 | 2023-12-29 | 本溪钢铁(集团)信息自动化有限责任公司 | 钢铁行业碳排放数据管理方法及装置 |
CN118039003A (zh) * | 2024-01-10 | 2024-05-14 | 浙江大学 | 基于分布与图卷积的高炉数字孪生系统硅含量预测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106603293A (zh) * | 2016-12-20 | 2017-04-26 | 南京邮电大学 | 虚拟网络环境下一种基于深度学习的网络故障诊断方法 |
US20190286086A1 (en) * | 2016-11-10 | 2019-09-19 | Rowanalytics Ltd | Control apparatus and method for processing data inputs in computing devices therefore |
US20190392330A1 (en) * | 2018-06-21 | 2019-12-26 | Samsung Electronics Co., Ltd. | System and method for generating aspect-enhanced explainable description-based recommendations |
-
2020
- 2020-07-29 CN CN202010744548.2A patent/CN112100369B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190286086A1 (en) * | 2016-11-10 | 2019-09-19 | Rowanalytics Ltd | Control apparatus and method for processing data inputs in computing devices therefore |
CN106603293A (zh) * | 2016-12-20 | 2017-04-26 | 南京邮电大学 | 虚拟网络环境下一种基于深度学习的网络故障诊断方法 |
US20190392330A1 (en) * | 2018-06-21 | 2019-12-26 | Samsung Electronics Co., Ltd. | System and method for generating aspect-enhanced explainable description-based recommendations |
Non-Patent Citations (1)
Title |
---|
陈曦等: "规则增强的知识图谱表示学习方法", 《情报工程》 * |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112579813A (zh) * | 2020-12-24 | 2021-03-30 | 上海湃星信息科技有限公司 | 一种基于知识图谱的遥感图像检索方法及其装置 |
CN112988522A (zh) * | 2021-03-08 | 2021-06-18 | 北京明略软件系统有限公司 | 用于告警信号关联的方法、装置及设备 |
CN113065356A (zh) * | 2021-03-19 | 2021-07-02 | 南方电网调峰调频发电有限公司信息通信分公司 | 一种基于语义分析算法的it设备运维故障建议处理方法 |
CN113065356B (zh) * | 2021-03-19 | 2023-10-31 | 南方电网调峰调频发电有限公司信息通信分公司 | 一种基于语义分析算法的it设备运维故障建议处理方法 |
WO2022217711A1 (zh) * | 2021-04-15 | 2022-10-20 | 平安科技(深圳)有限公司 | 基于多层关联知识图谱的信息预测方法、装置、设备及介质 |
CN113157923A (zh) * | 2021-04-29 | 2021-07-23 | 北京小米移动软件有限公司 | 实体分类方法、装置及可读存储介质 |
CN113157923B (zh) * | 2021-04-29 | 2023-11-24 | 北京小米移动软件有限公司 | 实体分类方法、装置及可读存储介质 |
CN113297571A (zh) * | 2021-05-31 | 2021-08-24 | 浙江工业大学 | 面向图神经网络模型后门攻击的检测方法和装置 |
CN113297571B (zh) * | 2021-05-31 | 2022-06-07 | 浙江工业大学 | 面向图神经网络模型后门攻击的检测方法和装置 |
CN113434193A (zh) * | 2021-08-26 | 2021-09-24 | 北京必示科技有限公司 | 根因变更的定位方法和装置 |
CN113886120A (zh) * | 2021-09-28 | 2022-01-04 | 济南浪潮数据技术有限公司 | 一种服务器故障诊断方法、装置、设备及可读存储介质 |
CN113886120B (zh) * | 2021-09-28 | 2024-02-27 | 济南浪潮数据技术有限公司 | 一种服务器故障诊断方法、装置、设备及可读存储介质 |
CN114676746A (zh) * | 2022-02-18 | 2022-06-28 | 上海交通大学 | 一种自然灾害下电力设备故障概率预测方法及系统 |
CN114785674A (zh) * | 2022-04-27 | 2022-07-22 | 中国电信股份有限公司 | 故障定位方法及装置、计算机可存储介质 |
CN114867052A (zh) * | 2022-06-10 | 2022-08-05 | 中国电信股份有限公司 | 无线网络故障诊断方法、装置、电子设备和介质 |
CN114867052B (zh) * | 2022-06-10 | 2023-11-07 | 中国电信股份有限公司 | 无线网络故障诊断方法、装置、电子设备和介质 |
CN116032725A (zh) * | 2022-12-27 | 2023-04-28 | 中国联合网络通信集团有限公司 | 故障根因定位模型的生成方法及装置 |
CN116032725B (zh) * | 2022-12-27 | 2024-06-11 | 中国联合网络通信集团有限公司 | 故障根因定位模型的生成方法及装置 |
CN116684200B (zh) * | 2023-07-31 | 2023-09-26 | 北京天防安全科技有限公司 | 网络安全漏洞的攻击模式的知识补全方法及系统 |
CN116684200A (zh) * | 2023-07-31 | 2023-09-01 | 北京天防安全科技有限公司 | 网络安全漏洞的攻击模式的知识补全方法及系统 |
CN116932013A (zh) * | 2023-09-15 | 2023-10-24 | 广州市桂勤器械设备工程有限公司 | 基于人工智能的医用气体设备运行系统更新方法及系统 |
CN116932013B (zh) * | 2023-09-15 | 2023-11-21 | 广州市桂勤器械设备工程有限公司 | 基于人工智能的医用气体设备运行系统更新方法及系统 |
CN117312350A (zh) * | 2023-11-28 | 2023-12-29 | 本溪钢铁(集团)信息自动化有限责任公司 | 钢铁行业碳排放数据管理方法及装置 |
CN117312350B (zh) * | 2023-11-28 | 2024-02-27 | 本溪钢铁(集团)信息自动化有限责任公司 | 钢铁行业碳排放数据管理方法及装置 |
CN118039003A (zh) * | 2024-01-10 | 2024-05-14 | 浙江大学 | 基于分布与图卷积的高炉数字孪生系统硅含量预测方法 |
CN118039003B (zh) * | 2024-01-10 | 2024-09-06 | 浙江大学 | 基于分布与图卷积的高炉数字孪生系统硅含量预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112100369B (zh) | 2022-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112100369B (zh) | 结合语义的网络故障关联规则生成方法和网络故障检测方法 | |
CN111581396B (zh) | 一种基于多维特征融合与依存句法的事件图谱构建系统及方法 | |
CN107516110B (zh) | 一种基于集成卷积编码的医疗问答语义聚类方法 | |
CN114169330B (zh) | 融合时序卷积与Transformer编码器的中文命名实体识别方法 | |
Ilkou et al. | Symbolic vs sub-symbolic ai methods: Friends or enemies? | |
CN111597830A (zh) | 基于多模态机器学习的翻译方法、装置、设备及存储介质 | |
CN111753024A (zh) | 一种面向公共安全领域的多源异构数据实体对齐方法 | |
CN115269357A (zh) | 一种基于调用链的微服务异常检测方法 | |
CN110188195A (zh) | 一种基于深度学习的文本意图识别方法、装置及设备 | |
Xie et al. | Multi-label disaster text classification via supervised contrastive learning for social media data | |
CN115168443A (zh) | 一种基于gcn-lstm和注意力机制的异常检测方法及系统 | |
WO2019180310A1 (en) | A method, an apparatus and a computer program product for an interpretable neural network representation | |
WO2023137918A1 (zh) | 文本数据的分析方法、模型训练方法、装置及计算机设备 | |
CN116225760A (zh) | 一种基于运维知识图谱的实时根因分析方法 | |
CN111540470B (zh) | 一种基于bert迁移学习的社交网络抑郁倾向检测模型及其训练方法 | |
CN113704392A (zh) | 文本中实体关系的抽取方法、装置、设备及存储介质 | |
CN116610816A (zh) | 一种基于图卷积神经网络的人员画像知识图谱分析方法及系统 | |
CN113361559A (zh) | 基于深宽度联合神经网络的多模态数据知识信息提取方法 | |
CN111859979A (zh) | 讽刺文本协同识别方法、装置、设备及计算机可读介质 | |
CN113239143A (zh) | 融合电网故障案例库的输变电设备故障处理方法及系统 | |
CN116561748A (zh) | 一种组件子序列相关性感知的日志异常检测装置 | |
CN115757695A (zh) | 一种日志语言模型训练方法及系统 | |
CN117540035B (zh) | 一种基于实体类型信息融合的rpa知识图谱构建方法 | |
CN114490954A (zh) | 一种基于任务调节的文档级生成式事件抽取方法 | |
Chen et al. | CNFRD: A Few‐Shot Rumor Detection Framework via Capsule Network for COVID‐19 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |