CN114138759B - 基于知识图谱推理的二次设备故障处理推送方法及系统 - Google Patents
基于知识图谱推理的二次设备故障处理推送方法及系统 Download PDFInfo
- Publication number
- CN114138759B CN114138759B CN202111312163.XA CN202111312163A CN114138759B CN 114138759 B CN114138759 B CN 114138759B CN 202111312163 A CN202111312163 A CN 202111312163A CN 114138759 B CN114138759 B CN 114138759B
- Authority
- CN
- China
- Prior art keywords
- data
- entities
- knowledge graph
- fault
- secondary equipment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 43
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000010276 construction Methods 0.000 claims abstract description 19
- 239000013598 vector Substances 0.000 claims description 76
- 238000005295 random walk Methods 0.000 claims description 25
- 238000005065 mining Methods 0.000 claims description 24
- 238000004422 calculation algorithm Methods 0.000 claims description 21
- 238000000605 extraction Methods 0.000 claims description 21
- 238000013528 artificial neural network Methods 0.000 claims description 18
- 238000012549 training Methods 0.000 claims description 16
- 238000007477 logistic regression Methods 0.000 claims description 8
- 230000011218 segmentation Effects 0.000 claims description 8
- 238000004140 cleaning Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 6
- 238000012544 monitoring process Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000009191 jumping Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000036632 reaction speed Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Animal Behavior & Ethology (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于知识图谱推理的二次设备故障处理推送方法及系统。所述方法,包括:获取二次设备故障告警信息;根据二次设备故障告警信息,在故障预案知识图谱中查询并推送相应的应急处置预案;故障预案知识图谱的构建方法,包括:获取二次设备故障数据;由二次设备故障数据构建知识图谱;采用基于约束条件的推理,挖掘知识图谱中的关联关系,将加入关联关系的知识图谱确定为故障预案知识图谱。本发明能实现故障原因的自动查找和处置方式的自动推送,提高故障处理推送的可靠性。
Description
技术领域
本发明涉及故障处理领域,特别是涉及一种基于知识图谱推理的二次设备故障处理推送方法及系统。
背景技术
目前,电力系统二次设备故障处置系统依赖于自动化人员对预案手册的查找,这对调度自动化人员的现场处置能力要求很高,同时自动化人员所能够承担的工作强度小、持续时间短、反应速度慢、记忆容量有限,可靠性易受环境影响且效能不稳定,失误在所难免。
发明内容
基于此,本发明实施例提供一种基于知识图谱推理的二次设备故障处理推送方法及系统,以实现故障原因的自动查找和处置方式的自动推送,提高故障处理推送的可靠性。
为实现上述目的,本发明提供了如下方案:
基于知识图谱推理的二次设备故障处理推送方法,包括:
获取二次设备故障告警信息;
根据所述二次设备故障告警信息,在故障预案知识图谱中查询并推送相应的应急处置预案;
其中,所述故障预案知识图谱的构建方法,包括:
获取二次设备故障数据;
由所述二次设备故障数据构建知识图谱;
采用基于约束条件的推理,挖掘所述知识图谱中的关联关系,将加入所述关联关系的知识图谱确定为所述故障预案知识图谱。
可选的,所述由所述二次设备故障数据构建知识图谱,具体包括:
计算所述二次设备故障数据中实体之间的相似度,并根据所述相似度进行聚类,得到各所述实体的类别;
抽取所述二次设备故障数据中实体的上下位关系,根据所述上下位关系确定所述类别之间的隶属关系;
对所述类别进行二次聚类,并给聚为同一类的实体指定上位词;
由二次聚类后的类别、所述隶属关系和所述上位词生成图谱本体;
将所述二次设备故障数据添加至所述图谱本体中,得到所述知识图谱。
可选的,所述采用基于约束条件的推理,挖掘所述知识图谱中的关联关系,将加入所述关联关系的知识图谱确定为所述故障预案知识图谱,具体包括:
确定目标关系;
在所述知识图谱中寻找具有所述目标关系的正例三元组;
将所述正例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述正例三元组中两个实体之间的每一条路径的特征值,并根据所述正例三元组中两个实体之间的所有路径的特征值,得到正例特征向量;
修改所述正例三元组中的首部实体和/或尾部实体,得到负例三元组;
将所述负例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述负例三元组中两个实体之间的每一条路径的特征值,并根据所述负例三元组中两个实体之间的所有路径的特征值,得到负例特征向量;
采用所述正例特征向量、所述负例特征向量、所述正例三元组中两个实体在所述知识图谱中的关联关系以及所述负例三元组中两个实体在所述知识图谱中的关联关系,对逻辑回归分类器进行训练,得到关联关系挖掘模型;
采用随机游走算法计算两个目标实体之间的每一条路径的特征值,得到目标特征向量;两个所述目标实体为所述知识图谱中关联关系未知的两个实体;
将所述目标特征向量输入所述关联关系挖掘模型中,得到两个所述目标实体之间的关联关系;
采用所述关联关系更新所述知识图谱,得到所述故障预案知识图谱。
可选的,所述获取二次设备故障数据,具体包括:
获取第一类数据和第二类数据;所述第一类数据包括二次设备运行时的监控信息和故障信息;所述第二类数据包括各电力部门的应急处置预案;
对所述第一类数据进行数据清洗,得到第一类处理数据,对所述第二类数据进行分词、实体抽取、关系抽取和属性抽取的操作,得到第二类处理数据;所述二次设备故障数据包括所述第一类处理数据和所述第二类处理数据。
可选的,所述计算所述二次设备故障数据中实体之间的相似度,具体包括:
将所述二次设备故障数据中的各个实体映射到相同维度的向量空间,得到各个实体的实体信息向量;
根据所述实体信息向量计算实体之间的相似度。
可选的,所述将所述二次设备故障数据中的各个实体映射到相同维度的向量空间,得到各个实体的实体信息向量,具体包括:
构建神经网络;所述神经网络包括依次连接的输入层、隐藏层和输出层;
将实体作为目标值,向神经网络中输入实体的上下文进行训练,当所述神经网络输出的预测值与所述目标值之间的损失不再随着迭代次数的增加而变小时,则确定所述神经网络收敛;
将收敛时的神经网络中的隐藏层的权重向量确定为实体的实体信息向量。
本发明还提供了基于知识图谱推理的二次设备故障处理推送系统,包括:
信息获取模块,用于获取二次设备故障告警信息;
预案查询模块,用于根据所述二次设备故障告警信息,在故障预案知识图谱中查询并推送相应的应急处置预案;
知识图谱构建模块,用于构建所述故障预案知识图谱;
所述知识图谱构建模块,包括:
故障数据获取子模块,用于获取二次设备故障数据;
图谱构建子模块,用于由所述二次设备故障数据构建知识图谱;
关联关系挖掘子模块,用于采用基于约束条件的推理,挖掘所述知识图谱中的关联关系,将加入所述关联关系的知识图谱确定为所述故障预案知识图谱。
可选的,所述图谱构建子模块,具体包括:
相似度计算单元,用于计算所述二次设备故障数据中实体之间的相似度,并根据所述相似度进行聚类,得到各所述实体的类别;
隶属关系确定单元,用于抽取所述二次设备故障数据中实体的上下位关系,根据所述上下位关系确定所述类别之间的隶属关系;
二次聚类单元,用于对所述类别进行二次聚类,并给聚为同一类的实体指定上位词;
本体生成单元,用于由二次聚类后的类别、所述隶属关系和所述上位词生成图谱本体;
数据添加单元,用于将所述二次设备故障数据添加至所述图谱本体中,得到所述知识图谱。
可选的,所述关联关系挖掘子模块,具体包括:
目标关系确定单元,用于确定目标关系;
正例三元组确定单元,用于在所述知识图谱中寻找具有所述目标关系的正例三元组;
正例特征向量确定单元,用于将所述正例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述正例三元组中两个实体之间的每一条路径的特征值,并根据所述正例三元组中两个实体之间的所有路径的特征值,得到正例特征向量;
负例三元组确定单元,用于修改所述正例三元组中的首部实体和/或尾部实体,得到负例三元组;
负例特征向量确定单元,用于将所述负例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述负例三元组中两个实体之间的每一条路径的特征值,并根据所述负例三元组中两个实体之间的所有路径的特征值,得到负例特征向量;
分类器训练单元,用于采用所述正例特征向量、所述负例特征向量、所述正例三元组中两个实体在所述知识图谱中的关联关系以及所述负例三元组中两个实体在所述知识图谱中的关联关系,对逻辑回归分类器进行训练,得到关联关系挖掘模型;
目标特征向量确定单元,用于采用随机游走算法计算两个目标实体之间的每一条路径的特征值,得到目标特征向量;两个所述目标实体为所述知识图谱中关联关系未知的两个实体;
关联关系挖掘单元,用于将所述目标特征向量输入所述关联关系挖掘模型中,得到两个所述目标实体之间的关联关系;
知识图谱更新单元,用于采用所述关联关系更新所述知识图谱,得到所述故障预案知识图谱。
可选的,所述故障数据获取子模块,具体包括:
数据获取单元,用于获取第一类数据和第二类数据;所述第一类数据包括二次设备运行时的监控信息和故障信息;所述第二类数据包括各电力部门的应急处置预案;
数据处理单元,用于对所述第一类数据进行数据清洗,得到第一类处理数据,对所述第二类数据进行分词、实体抽取、关系抽取和属性抽取的操作,得到第二类处理数据;所述二次设备故障数据包括所述第一类处理数据和所述第二类处理数据。
与现有技术相比,本发明的有益效果是:
本发明实施例提出了一种基于知识图谱推理的二次设备故障处理推送方法及系统,所述方法,包括:构建故障预案知识图谱,根据获取的二次设备故障告警信息,在故障预案知识图谱中查询并推送相应的应急处置预案,本发明将知识图谱用于故障处理推送,能实现故障原因的自动查找和处置方式的自动推送,提高故障处理推送的效率和可靠性,可以快速、准确的处理故障信息。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于知识图谱推理的二次设备故障处理推送方法的流程图;
图2为本发明实施例提供的故障预案知识图谱的构建方法流程图;
图3为本发明实施例提供的基于知识图谱推理的二次设备故障处理推送系统的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
目前针对具体电网故障的辨别、处置方式和信息填报都是基于人工方式,与人工方式相比,计算机运行速度快、实时性高、存储容量大、可靠性高。如果能通过机器来辅助甚至替代人工方式进行管理,将能有效提高故障处置的效率和可靠性,对减少安全事故具有重大和迫切的现实意义。
知识图谱作为一种智能高效的知识组织方法,在搜索引擎、人工智能、智慧金融等具海量数据的企业中得到了广泛的应用。知识图谱本质上是语义网络,基于图的数据结构存储,由节点和边组成。在知识图谱中每个节点对应真实存在的实体,边反映了实体之间关联关系,所以知识图谱能够处理复杂的关系网络。
将知识图谱应用于二次设备故障处理上,利用知识图谱的强关联性将故障辨识、故障原因、故障设备、故障等级、故障处置方式、处置人员等信息融合到一起。在故障发生时,利用知识图谱的推理能力,快速准确的定位故障原因,给出故障处置方案,并减轻处置人员的工作负荷,提高电力系统的性能和可靠性。
图1为本发明实施例提供的基于知识图谱推理的二次设备故障处理推送方法的流程图。参见图1,本实施例的基于知识图谱推理的二次设备故障处理推送方法,包括:
步骤101:获取二次设备故障告警信息。
步骤102:根据所述二次设备故障告警信息,在故障预案知识图谱中查询并推送相应的应急处置预案。
针对电力二次设备的故障告警信息(文本信息),在存储故障预案知识图谱的图数据库上进行查询,可以快速检索和查找故障处置方法和流程,辅助人工的二次设备故障的处置。采用短信、在线通知、电话和邮件等协作手段,将最后结合的处置工作流程和处置人员关联,实现故障处置工作的合理调度,降低工作人员的压力,减少故障处置错误。
图2为本发明实施例提供的故障预案知识图谱的构建方法流程图。参见图2,所述故障预案知识图谱的构建方法,包括:
步骤201:获取二次设备故障数据。具体为:
1)获取第一类数据和第二类数据。所述第一类数据包括二次设备运行时的监控信息和故障信息,第一类数据存在于通用的关系型数据库中,属于结构化的数据,但其中存在大量的无意义信息,需要初步进行筛选。所述第二类数据包括各电力部门的应急处置预案,第二类数据的内容为根据经验描述的故障辨识、故障设备、故障等级、故障处置方式等,属于一种非结构化信息,无法直接应用于知识图谱的构建。
2)对所述第一类数据进行数据清洗,以实现初步筛选,得到第一类处理数据,数据清洗具体包括:补充缺失的字段数据、剔除重复的数据以及统一同一指标的不同表述等。
对所述第二类数据进行分词、实体抽取、关系抽取和属性抽取的操作,以形成知识图谱可用的规范化、结构化数据,从而得到第二类处理数据。其中,分词使用pythonjieba分词工具自动对文本进行切割。实体抽取即命名实体识别,采用主流的长短时记忆网络(LSTM)以及条件随机场(CRF)来识别,其中LSTM作为特征抽取器,CRF作为输出层。关系抽取可以得到不同实体之间的相互关系,采用人工构造语法和语义规则,例如交换机sw1、主控板和指示灯三个实体,可以定义如下规则:交换机包含主控板,主控板包括指示灯,指示灯指示交换机故障。使用这种人工定义规则的方式有很高的准确率,能精确匹配预案文本中出现的模式。最后是属性的抽取,存储于关系型数据库中的每个表中的一行描述了一个实体,字段描述了其属性,可以直接进行转化。第二类数据这种非结构化数据,使用人工定义模板的方式实现,例如核心交换机,有名称、型号、控制区域、安全等级属性。利用上述的自然语言处理技术,完成所有数据的预处理工作。
所述二次设备故障数据包括所述第一类处理数据和所述第二类处理数据。
步骤202:由所述二次设备故障数据构建知识图谱。知识图谱的构建主要是本体的构建,本体是知识图谱的模板,指定某个领域的重要概念,也就是类。该步骤主要包括相似度计算、隶属关系确定以及本体生成三个方面。
步骤202,具体包括:
1)相似度计算。计算所述二次设备故障数据中实体之间的相似度,并根据所述相似度进行聚类,得到各所述实体的类别。
相似度是用来考察任意两个实体在多大程度上属于同一个分类类别。相似度的计算过程为:将所述二次设备故障数据中的各个实体映射到相同维度的向量空间,得到各个实体的实体信息向量;根据所述实体信息向量计算余弦相似度来衡量实体之间的相似度。
其中,可以采用word2vec算法将所述二次设备故障数据中的各个实体映射到相同维度的向量空间,得到各个实体的实体信息向量。具体的,首先,构建神经网络,本实施例采用连续词袋模型(Continuous Bag-of-Words,CBOW)模型来完成word to vector的转化,主要原理是利用上下文来预测中心值。CBOW是一个具有3层结构的神经网络,该神经网络包含输入层(接收每个词生成的onehot编码)、隐藏层(其权重为最终生成的vector表示)和输出层(将隐藏层权重映射到输出的维度)。然后,将实体作为目标值,向神经网络(CBOW模型)中输入实体的上下文进行训练,当所述神经网络输出的预测值与所述目标值之间的损失不再随着迭代次数的增加而变小时,则确定所述神经网络收敛;将收敛时的神经网络中的隐藏层的权重向量确定为实体的实体信息向量。例如,给定一个句子“故障链路无法PING通本地网关”,其中将“本地网关”作为目标值,剩下词作为上下文输入到CBOW网络中,输出层得到的结果经过softmax计算得到预测值,然后计算目标值和预测值之间的损失并不断迭代。当模型收敛之后,通过实体输入到CBOW网络得到的隐藏层的权重向量就包含了实体相关的信息,隐藏层的权重向量即为实体信息向量。
得到实体信息向量后,通过比较不同实体信息向量之间的余弦相似度来衡量实体之间的相似度。
2)隶属关系确定以及本体生成。由于最终实体的数量不多且专业领域需要保证高准确率,因此该步骤也可以通过人工的方式进行指定。
具体的:抽取所述二次设备故障数据中实体的上下位关系,根据所述上下位关系确定所述类别之间的隶属关系,例如词组(交换机,网络设备)构成上下位关系,“交换机”作为下位词,“网络设备”作为上位词。
对所述类别进行二次聚类,并给聚为同一类的实体指定上位词,例如:对(服务器、工作站)这两个概念指定同一个上位词“主机”。由二次聚类后的类别、所述隶属关系和所述上位词生成图谱本体。
3)将所述二次设备故障数据添加至所述图谱本体中,得到所述知识图谱。
步骤203:采用基于约束条件的推理,挖掘所述知识图谱中的关联关系,将加入所述关联关系的知识图谱确定为所述故障预案知识图谱。
步骤203,具体包括:
1)确定目标关系。
2)在所述知识图谱中寻找具有所述目标关系的正例三元组。
将所述正例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述正例三元组中两个实体之间的每一条路径的特征值,并根据所述正例三元组中两个实体之间的所有路径的特征值,得到正例特征向量。
3)修改所述正例三元组中的首部实体和/或尾部实体,得到负例(反例)三元组,构造负例三元组的目的是增加反例,以丰富数据量。。例如,可以将所述正例三元组中的首部实体和/或尾部实体替换成其他实体,假设正例三元组为“主控板-----包含-----指示灯”,将该正例三元组的尾部实体替换成其他实体,负例三元组可以为“主控板-----不包含-----交换机”。
将所述负例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述负例三元组中两个实体之间的每一条路径的特征值,并根据所述负例三元组中两个实体之间的所有路径的特征值,得到负例特征向量。
4)将所述负例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述负例三元组中两个实体之间的每一条路径的特征值,并根据所述负例三元组中两个实体之间的所有路径的特征值,得到负例特征向量。
5)采用所述正例特征向量、所述负例特征向量、所述正例三元组中两个实体在所述知识图谱中的关联关系以及所述负例三元组中两个实体在所述知识图谱中的关联关系,对逻辑回归分类器进行训练,得到关联关系挖掘模型。
6)采用随机游走算法计算两个目标实体之间的每一条路径的特征值,得到目标特征向量;两个所述目标实体为所述知识图谱中关联关系未知的两个实体。
7)将所述目标特征向量输入所述关联关系挖掘模型中,得到两个所述目标实体之间的关联关系。
8)采用所述关联关系更新所述知识图谱,得到所述故障预案知识图谱。
在实际应用中,步骤203的一个更加具体的实现过程如下:
采用基于约束条件(规则)的推理,在知识图谱上进行数据挖掘形成新的关联关系。例如,将一些路径近似地看成规则,实体间的路径进一步作为判断实体间是否存在指定关系的特征训练学习模型。采用PRA随机游走算法,首先确定要学习的目标关系,然后找出目标关系的正例三元组,替换头/尾实体得到负例三元组;再构造特征集合,将这些三元组中两个实体之间的一条路径作为一个特征,根据随机游走的思想计算路径的特征值,构成每个三元组的特征向量,并训练了逻辑回归分类器。通过分类器可以利用连接实体的已有路径来预测实体间是否存在潜在关系。
具体的,随机游走是指在图结构中的某个节点上都有两个选择,要么以某个概率(游走概率)跳转到随机的某个邻居上,要么跳回起点。当给定一个关系路径P=R1,R2...Rl,P表示路径,即从s点到e点经过R1,R2...Rl共l步,其中Ri表示每两个节点之间的关系,在关系路径上进行随机游走时,使用hs,P表示随机游走的概率分布。当P为一个空路径时(初次确定两个节点之间的关系时,两个节点之间不存在路径),概率分布如下,s表示当前节点,e表示s的邻居节点,domain(P)表示当前关系的知识领域。公式(1)用于在第一步时确定某两个节点之间是否存在路径。
当P=R1,R2...Rl不为空时(例如,第一步确定两个节点之间的关系后,两节点之间存在路径,则下一步继续确定节点之间的关系时,则认为P不为空),令P'=R1,R2...Rl-1定义
其中表示在关系Rl的条件下节点e'到e的随机游走概率,当节点间关系存在时,Rl(e',e)的值为1。p′表示从s点达到e的前一步e'的路径R1,R2...Rl-1,也就是走了l-1步,e'表示达到e的前一节点。给定一个关系R和属于此关系的一系列节点对{(si,ti)},对于每个si,会有多条路径(P1,P2...Pn)到达ti,那么每个可以看作是一个路径特征值。由于事先知道每个节点是否存在关系,那么可以构造一个训练集D={(xi,yi)},这里的xi是第i个节点对的所有路径特征构成的向量,yi表示此节点是否存在关系。通过训练集D训练一个逻辑回归模型来预测条件概率P(y|x;θ),θ是模型参数。通过此回归模型,当获得一对节点以及节点间的路径特征,就可以判断两节点之间是否存在关联关系。
在知识图谱应用时,需要进行复杂的、广范围的关系查询,采用图数据库能更快、更高效的完成查询任务。这是由于图数据库,其使用的存储后端专门为图结构数据的存储和管理进行了定制和优化,能够将知识图谱中的知识(关联关系)采用这种图结构进行存储。在进行关系查询时采用专用的查询语句,例如:利用match来匹配查询的数据模式、用where来限制各个实体节点或关系中的某些属性值、使用return返回想要的节点或者关系数据。因此,通过步骤201-203生成的故障预案知识图谱,可查询并推送二次设备故障告警信息对应的应急处置预案。
目前针对具体电网故障的辨别、处置方式、信息填报都是基于人工方式。由工作人员凭借自身经验以及故障处置预案来判断故障辨识形成的主要原因,再根据处置预案来执行指定的处置方法,最后手动填报信息。和现有的人工处理相比,本实施例使用知识图谱的故障处理推送技术可以快速、准确的处理故障信息,其主要原因在于:
1、故障处置方式的推送:由于使用了知识图谱的知识推理,知识图谱可以结合故障辨识以及所关联的其他属性,自动推算故障发生原因,检索故障处置方式。
2、故障信息自动填报:由于知识图谱的构建,得到了故障辨识、故障原因、故障部位、处置方案、处置人员等不同命名实体之间的关联关系。使得系统能够按照模板要求自动填写故障原因、故障部位、处置方案、处置人员等具体信息,并交给业务员审核后提交,减轻故障处置人员的工作强度。
3、故障处置工作的协同工作:根据故障处置流程,采用现代化通信手段,实现不同单位或部门的协同工作,完成处置工作的自动化工作协同。
本发明还提供了基于知识图谱推理的二次设备故障处理推送系统,图3为本发明实施例提供的基于知识图谱推理的二次设备故障处理推送系统的结构图。参见图3,所述系统,包括:
信息获取模块301,用于获取二次设备故障告警信息。
预案查询模块302,用于根据所述二次设备故障告警信息,在故障预案知识图谱中查询并推送相应的应急处置预案.
知识图谱构建模块303,用于构建所述故障预案知识图谱。
所述知识图谱构建模块303,包括:
故障数据获取子模块,用于获取二次设备故障数据。
图谱构建子模块,用于由所述二次设备故障数据构建知识图谱。
关联关系挖掘子模块,用于采用基于约束条件的推理,挖掘所述知识图谱中的关联关系,将加入所述关联关系的知识图谱确定为所述故障预案知识图谱。
在一个示例中,所述图谱构建子模块,具体包括:
相似度计算单元,用于计算所述二次设备故障数据中实体之间的相似度,并根据所述相似度进行聚类,得到各所述实体的类别。
隶属关系确定单元,用于抽取所述二次设备故障数据中实体的上下位关系,根据所述上下位关系确定所述类别之间的隶属关系。
二次聚类单元,用于对所述类别进行二次聚类,并给聚为同一类的实体指定上位词。
本体生成单元,用于由二次聚类后的类别、所述隶属关系和所述上位词生成图谱本体。
数据添加单元,用于将所述二次设备故障数据添加至所述图谱本体中,得到所述知识图谱。
在一个示例中,所述关联关系挖掘子模块,具体包括:
目标关系确定单元,用于确定目标关系。
正例三元组确定单元,用于在所述知识图谱中寻找具有所述目标关系的正例三元组。
正例特征向量确定单元,用于将所述正例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述正例三元组中两个实体之间的每一条路径的特征值,并根据所述正例三元组中两个实体之间的所有路径的特征值,得到正例特征向量。
负例三元组确定单元,用于修改所述正例三元组中的首部实体和/或尾部实体,得到负例三元组。
负例特征向量确定单元,用于将所述负例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述负例三元组中两个实体之间的每一条路径的特征值,并根据所述负例三元组中两个实体之间的所有路径的特征值,得到负例特征向量。
分类器训练单元,用于采用所述正例特征向量、所述负例特征向量、所述正例三元组中两个实体在所述知识图谱中的关联关系以及所述负例三元组中两个实体在所述知识图谱中的关联关系,对逻辑回归分类器进行训练,得到关联关系挖掘模型。
目标特征向量确定单元,用于采用随机游走算法计算两个目标实体之间的每一条路径的特征值,得到目标特征向量;两个所述目标实体为所述知识图谱中关联关系未知的两个实体。
关联关系挖掘单元,用于将所述目标特征向量输入所述关联关系挖掘模型中,得到两个所述目标实体之间的关联关系。
知识图谱更新单元,用于采用所述关联关系更新所述知识图谱,得到所述故障预案知识图谱。
在一个示例中,所述故障数据获取子模块,具体包括:
数据获取单元,用于获取第一类数据和第二类数据;所述第一类数据包括二次设备运行时的监控信息和故障信息;所述第二类数据包括各电力部门的应急处置预案。
数据处理单元,用于对所述第一类数据进行数据清洗,得到第一类处理数据,对所述第二类数据进行分词、实体抽取、关系抽取和属性抽取的操作,得到第二类处理数据;所述二次设备故障数据包括所述第一类处理数据和所述第二类处理数据。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (8)
1.基于知识图谱推理的二次设备故障处理推送方法,其特征在于,包括:
获取二次设备故障告警信息;
根据所述二次设备故障告警信息,在故障预案知识图谱中查询并推送相应的应急处置预案;
其中,所述故障预案知识图谱的构建方法,包括:
获取二次设备故障数据;
由所述二次设备故障数据构建知识图谱;
采用基于约束条件的推理,挖掘所述知识图谱中的关联关系,将加入所述关联关系的知识图谱确定为所述故障预案知识图谱,具体包括:
确定目标关系;
在所述知识图谱中寻找具有所述目标关系的正例三元组;
将所述正例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述正例三元组中两个实体之间的每一条路径的特征值,并根据所述正例三元组中两个实体之间的所有路径的特征值,得到正例特征向量;
修改所述正例三元组中的首部实体和/或尾部实体,得到负例三元组;
将所述负例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述负例三元组中两个实体之间的每一条路径的特征值,并根据所述负例三元组中两个实体之间的所有路径的特征值,得到负例特征向量;
采用所述正例特征向量、所述负例特征向量、所述正例三元组中两个实体在所述知识图谱中的关联关系以及所述负例三元组中两个实体在所述知识图谱中的关联关系,对逻辑回归分类器进行训练,得到关联关系挖掘模型;
采用随机游走算法计算两个目标实体之间的每一条路径的特征值,得到目标特征向量;两个所述目标实体为所述知识图谱中关联关系未知的两个实体;
将所述目标特征向量输入所述关联关系挖掘模型中,得到两个所述目标实体之间的关联关系;
采用所述关联关系更新所述知识图谱,得到所述故障预案知识图谱。
2.根据权利要求1所述的基于知识图谱推理的二次设备故障处理推送方法,其特征在于,所述由所述二次设备故障数据构建知识图谱,具体包括:
计算所述二次设备故障数据中实体之间的相似度,并根据所述相似度进行聚类,得到各所述实体的类别;
抽取所述二次设备故障数据中实体的上下位关系,根据所述上下位关系确定所述类别之间的隶属关系;
对所述类别进行二次聚类,并给聚为同一类的实体指定上位词;
由二次聚类后的类别、所述隶属关系和所述上位词生成图谱本体;
将所述二次设备故障数据添加至所述图谱本体中,得到所述知识图谱。
3.根据权利要求1所述的基于知识图谱推理的二次设备故障处理推送方法,其特征在于,所述获取二次设备故障数据,具体包括:
获取第一类数据和第二类数据;所述第一类数据包括二次设备运行时的监控信息和故障信息;所述第二类数据包括各电力部门的应急处置预案;
对所述第一类数据进行数据清洗,得到第一类处理数据,对所述第二类数据进行分词、实体抽取、关系抽取和属性抽取的操作,得到第二类处理数据;所述二次设备故障数据包括所述第一类处理数据和所述第二类处理数据。
4.根据权利要求2所述的基于知识图谱推理的二次设备故障处理推送方法,其特征在于,所述计算所述二次设备故障数据中实体之间的相似度,具体包括:
将所述二次设备故障数据中的各个实体映射到相同维度的向量空间,得到各个实体的实体信息向量;
根据所述实体信息向量计算实体之间的相似度。
5.根据权利要求4所述的基于知识图谱推理的二次设备故障处理推送方法,其特征在于,所述将所述二次设备故障数据中的各个实体映射到相同维度的向量空间,得到各个实体的实体信息向量,具体包括:
构建神经网络;所述神经网络包括依次连接的输入层、隐藏层和输出层;
将实体作为目标值,向神经网络中输入实体的上下文进行训练,当所述神经网络输出的预测值与所述目标值之间的损失不再随着迭代次数的增加而变小时,则确定所述神经网络收敛;
将收敛时的神经网络中的隐藏层的权重向量确定为实体的实体信息向量。
6.基于知识图谱推理的二次设备故障处理推送系统,其特征在于,包括:
信息获取模块,用于获取二次设备故障告警信息;
预案查询模块,用于根据所述二次设备故障告警信息,在故障预案知识图谱中查询并推送相应的应急处置预案;
知识图谱构建模块,用于构建所述故障预案知识图谱;
所述知识图谱构建模块,包括:
故障数据获取子模块,用于获取二次设备故障数据;
图谱构建子模块,用于由所述二次设备故障数据构建知识图谱;
关联关系挖掘子模块,用于采用基于约束条件的推理,挖掘所述知识图谱中的关联关系,将加入所述关联关系的知识图谱确定为所述故障预案知识图谱,具体包括:
目标关系确定单元,用于确定目标关系;
正例三元组确定单元,用于在所述知识图谱中寻找具有所述目标关系的正例三元组;
正例特征向量确定单元,用于将所述正例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述正例三元组中两个实体之间的每一条路径的特征值,并根据所述正例三元组中两个实体之间的所有路径的特征值,得到正例特征向量;
负例三元组确定单元,用于修改所述正例三元组中的首部实体和/或尾部实体,得到负例三元组;
负例特征向量确定单元,用于将所述负例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述负例三元组中两个实体之间的每一条路径的特征值,并根据所述负例三元组中两个实体之间的所有路径的特征值,得到负例特征向量;
分类器训练单元,用于采用所述正例特征向量、所述负例特征向量、所述正例三元组中两个实体在所述知识图谱中的关联关系以及所述负例三元组中两个实体在所述知识图谱中的关联关系,对逻辑回归分类器进行训练,得到关联关系挖掘模型;
目标特征向量确定单元,用于采用随机游走算法计算两个目标实体之间的每一条路径的特征值,得到目标特征向量;两个所述目标实体为所述知识图谱中关联关系未知的两个实体;
关联关系挖掘单元,用于将所述目标特征向量输入所述关联关系挖掘模型中,得到两个所述目标实体之间的关联关系;
知识图谱更新单元,用于采用所述关联关系更新所述知识图谱,得到所述故障预案知识图谱。
7.根据权利要求6所述的基于知识图谱推理的二次设备故障处理推送系统,其特征在于,所述图谱构建子模块,具体包括:
相似度计算单元,用于计算所述二次设备故障数据中实体之间的相似度,并根据所述相似度进行聚类,得到各所述实体的类别;
隶属关系确定单元,用于抽取所述二次设备故障数据中实体的上下位关系,根据所述上下位关系确定所述类别之间的隶属关系;
二次聚类单元,用于对所述类别进行二次聚类,并给聚为同一类的实体指定上位词;
本体生成单元,用于由二次聚类后的类别、所述隶属关系和所述上位词生成图谱本体;
数据添加单元,用于将所述二次设备故障数据添加至所述图谱本体中,得到所述知识图谱。
8.根据权利要求6所述的基于知识图谱推理的二次设备故障处理推送系统,其特征在于,所述故障数据获取子模块,具体包括:
数据获取单元,用于获取第一类数据和第二类数据;所述第一类数据包括二次设备运行时的监控信息和故障信息;所述第二类数据包括各电力部门的应急处置预案;
数据处理单元,用于对所述第一类数据进行数据清洗,得到第一类处理数据,对所述第二类数据进行分词、实体抽取、关系抽取和属性抽取的操作,得到第二类处理数据;所述二次设备故障数据包括所述第一类处理数据和所述第二类处理数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111312163.XA CN114138759B (zh) | 2021-11-08 | 2021-11-08 | 基于知识图谱推理的二次设备故障处理推送方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111312163.XA CN114138759B (zh) | 2021-11-08 | 2021-11-08 | 基于知识图谱推理的二次设备故障处理推送方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114138759A CN114138759A (zh) | 2022-03-04 |
CN114138759B true CN114138759B (zh) | 2024-07-23 |
Family
ID=80393178
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111312163.XA Active CN114138759B (zh) | 2021-11-08 | 2021-11-08 | 基于知识图谱推理的二次设备故障处理推送方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114138759B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115022153B (zh) * | 2022-06-07 | 2024-04-23 | 中国工商银行股份有限公司 | 故障根因分析方法、装置、设备和存储介质 |
CN114723059A (zh) * | 2022-06-07 | 2022-07-08 | 达而观数据(成都)有限公司 | 基于知识推理的故障归因系统及方法 |
CN116054910B (zh) * | 2022-12-20 | 2024-05-14 | 中国人民解放军63819部队 | 基于知识图谱构建的地球站设备故障分析及装置 |
CN116055292A (zh) * | 2022-12-30 | 2023-05-02 | 中国联合网络通信集团有限公司 | 基于知识图谱的信息处理方法、装置和设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112269901A (zh) * | 2020-09-14 | 2021-01-26 | 合肥中科类脑智能技术有限公司 | 一种基于知识图谱的故障判别推理方法 |
CN113283704A (zh) * | 2021-04-23 | 2021-08-20 | 内蒙古电力(集团)有限责任公司乌兰察布电业局 | 基于知识图谱的电网故障智能处置系统及方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2014233499A1 (en) * | 2013-03-15 | 2015-11-05 | Neura Labs Corp. | Intelligent internet system with adaptive user interface providing one-step access to knowledge |
CN112242187B (zh) * | 2020-10-26 | 2023-06-27 | 平安科技(深圳)有限公司 | 基于知识图谱表征学习的医疗方案推荐系统及方法 |
-
2021
- 2021-11-08 CN CN202111312163.XA patent/CN114138759B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112269901A (zh) * | 2020-09-14 | 2021-01-26 | 合肥中科类脑智能技术有限公司 | 一种基于知识图谱的故障判别推理方法 |
CN113283704A (zh) * | 2021-04-23 | 2021-08-20 | 内蒙古电力(集团)有限责任公司乌兰察布电业局 | 基于知识图谱的电网故障智能处置系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114138759A (zh) | 2022-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114138759B (zh) | 基于知识图谱推理的二次设备故障处理推送方法及系统 | |
CN111428054B (zh) | 一种网络空间安全领域知识图谱的构建与存储方法 | |
CN101093559B (zh) | 一种基于知识发现的专家系统构造方法 | |
CN110033101A (zh) | 基于融合特征的知识图谱的水电机组故障诊断方法和系统 | |
CN111078780A (zh) | 一种ai优化数据治理的方法 | |
CN112217674B (zh) | 基于因果网络挖掘和图注意力网络的告警根因识别方法 | |
CN111930774A (zh) | 一种电力知识图谱本体自动构建方法及系统 | |
CN117271767A (zh) | 基于多智能体的运维知识库的建立方法 | |
CN114077674A (zh) | 一种电网调度知识图谱数据优化方法及系统 | |
CN107103363A (zh) | 一种基于lda的软件故障专家系统的构建方法 | |
CN113095524A (zh) | 电力设备检修工作单据智能生成方法、系统及存储介质 | |
CN112613611A (zh) | 一种基于知识图谱的税务知识库系统 | |
Deng et al. | Research on the construction of event logic knowledge graph of supply chain management | |
CN115438199A (zh) | 一种基于智慧城市场景数据中台技术的知识平台系统 | |
Jiang et al. | Construction of substation engineering design knowledge graph based on “ontology seven-step method” | |
CN116611813B (zh) | 一种基于知识图谱的智能运维管理方法及系统 | |
CN117235280A (zh) | 一种操作票生成方法、装置、设备及介质 | |
CN116821423A (zh) | 配电网智能解析和知识型故障处理辅助系统及方法 | |
CN116523042A (zh) | 一种电网调度实体关系联合抽取方法及系统 | |
CN114298339B (zh) | 一种变电站设备告警智能决策方法及系统 | |
Wang et al. | Knowledge graph based method for intelligent generation of emergency plans for water conservancy projects | |
Xinjie et al. | A Construction Method for the Knowledge Graph of Power Grid Supervision Business | |
Hao et al. | Ontology Alignment Repair Through 0-1 Programming | |
Tu et al. | Reusable Ontology Generation and Matching from Simulation Models | |
Hou et al. | A study of intelligent decision-making system based on neural networks and expert system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |