CN114138759A - 基于知识图谱推理的二次设备故障处理推送方法及系统 - Google Patents

基于知识图谱推理的二次设备故障处理推送方法及系统 Download PDF

Info

Publication number
CN114138759A
CN114138759A CN202111312163.XA CN202111312163A CN114138759A CN 114138759 A CN114138759 A CN 114138759A CN 202111312163 A CN202111312163 A CN 202111312163A CN 114138759 A CN114138759 A CN 114138759A
Authority
CN
China
Prior art keywords
data
entities
knowledge graph
secondary equipment
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111312163.XA
Other languages
English (en)
Inventor
肖大军
杨群
姜懿
徐遐龄
刘涛
刘绍翰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Central China Grid Co Ltd
Original Assignee
Nanjing University of Aeronautics and Astronautics
Central China Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics, Central China Grid Co Ltd filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN202111312163.XA priority Critical patent/CN114138759A/zh
Publication of CN114138759A publication Critical patent/CN114138759A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于知识图谱推理的二次设备故障处理推送方法及系统。所述方法,包括:获取二次设备故障告警信息;根据二次设备故障告警信息,在故障预案知识图谱中查询并推送相应的应急处置预案;故障预案知识图谱的构建方法,包括:获取二次设备故障数据;由二次设备故障数据构建知识图谱;采用基于约束条件的推理,挖掘知识图谱中的关联关系,将加入关联关系的知识图谱确定为故障预案知识图谱。本发明能实现故障原因的自动查找和处置方式的自动推送,提高故障处理推送的可靠性。

Description

基于知识图谱推理的二次设备故障处理推送方法及系统
技术领域
本发明涉及故障处理领域,特别是涉及一种基于知识图谱推理的二次设备故障处理推送方法及系统。
背景技术
目前,电力系统二次设备故障处置系统依赖于自动化人员对预案手册的查找,这对调度自动化人员的现场处置能力要求很高,同时自动化人员所能够承担的工作强度小、持续时间短、反应速度慢、记忆容量有限,可靠性易受环境影响且效能不稳定,失误在所难免。
发明内容
基于此,本发明实施例提供一种基于知识图谱推理的二次设备故障处理推送方法及系统,以实现故障原因的自动查找和处置方式的自动推送,提高故障处理推送的可靠性。
为实现上述目的,本发明提供了如下方案:
基于知识图谱推理的二次设备故障处理推送方法,包括:
获取二次设备故障告警信息;
根据所述二次设备故障告警信息,在故障预案知识图谱中查询并推送相应的应急处置预案;
其中,所述故障预案知识图谱的构建方法,包括:
获取二次设备故障数据;
由所述二次设备故障数据构建知识图谱;
采用基于约束条件的推理,挖掘所述知识图谱中的关联关系,将加入所述关联关系的知识图谱确定为所述故障预案知识图谱。
可选的,所述由所述二次设备故障数据构建知识图谱,具体包括:
计算所述二次设备故障数据中实体之间的相似度,并根据所述相似度进行聚类,得到各所述实体的类别;
抽取所述二次设备故障数据中实体的上下位关系,根据所述上下位关系确定所述类别之间的隶属关系;
对所述类别进行二次聚类,并给聚为同一类的实体指定上位词;
由二次聚类后的类别、所述隶属关系和所述上位词生成图谱本体;
将所述二次设备故障数据添加至所述图谱本体中,得到所述知识图谱。
可选的,所述采用基于约束条件的推理,挖掘所述知识图谱中的关联关系,将加入所述关联关系的知识图谱确定为所述故障预案知识图谱,具体包括:
确定目标关系;
在所述知识图谱中寻找具有所述目标关系的正例三元组;
将所述正例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述正例三元组中两个实体之间的每一条路径的特征值,并根据所述正例三元组中两个实体之间的所有路径的特征值,得到正例特征向量;
修改所述正例三元组中的首部实体和/或尾部实体,得到负例三元组;
将所述负例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述负例三元组中两个实体之间的每一条路径的特征值,并根据所述负例三元组中两个实体之间的所有路径的特征值,得到负例特征向量;
采用所述正例特征向量、所述负例特征向量、所述正例三元组中两个实体在所述知识图谱中的关联关系以及所述负例三元组中两个实体在所述知识图谱中的关联关系,对逻辑回归分类器进行训练,得到关联关系挖掘模型;
采用随机游走算法计算两个目标实体之间的每一条路径的特征值,得到目标特征向量;两个所述目标实体为所述知识图谱中关联关系未知的两个实体;
将所述目标特征向量输入所述关联关系挖掘模型中,得到两个所述目标实体之间的关联关系;
采用所述关联关系更新所述知识图谱,得到所述故障预案知识图谱。
可选的,所述获取二次设备故障数据,具体包括:
获取第一类数据和第二类数据;所述第一类数据包括二次设备运行时的监控信息和故障信息;所述第二类数据包括各电力部门的应急处置预案;
对所述第一类数据进行数据清洗,得到第一类处理数据,对所述第二类数据进行分词、实体抽取、关系抽取和属性抽取的操作,得到第二类处理数据;所述二次设备故障数据包括所述第一类处理数据和所述第二类处理数据。
可选的,所述计算所述二次设备故障数据中实体之间的相似度,具体包括:
将所述二次设备故障数据中的各个实体映射到相同维度的向量空间,得到各个实体的实体信息向量;
根据所述实体信息向量计算实体之间的相似度。
可选的,所述将所述二次设备故障数据中的各个实体映射到相同维度的向量空间,得到各个实体的实体信息向量,具体包括:
构建神经网络;所述神经网络包括依次连接的输入层、隐藏层和输出层;
将实体作为目标值,向神经网络中输入实体的上下文进行训练,当所述神经网络输出的预测值与所述目标值之间的损失不再随着迭代次数的增加而变小时,则确定所述神经网络收敛;
将收敛时的神经网络中的隐藏层的权重向量确定为实体的实体信息向量。
本发明还提供了基于知识图谱推理的二次设备故障处理推送系统,包括:
信息获取模块,用于获取二次设备故障告警信息;
预案查询模块,用于根据所述二次设备故障告警信息,在故障预案知识图谱中查询并推送相应的应急处置预案;
知识图谱构建模块,用于构建所述故障预案知识图谱;
所述知识图谱构建模块,包括:
故障数据获取子模块,用于获取二次设备故障数据;
图谱构建子模块,用于由所述二次设备故障数据构建知识图谱;
关联关系挖掘子模块,用于采用基于约束条件的推理,挖掘所述知识图谱中的关联关系,将加入所述关联关系的知识图谱确定为所述故障预案知识图谱。
可选的,所述图谱构建子模块,具体包括:
相似度计算单元,用于计算所述二次设备故障数据中实体之间的相似度,并根据所述相似度进行聚类,得到各所述实体的类别;
隶属关系确定单元,用于抽取所述二次设备故障数据中实体的上下位关系,根据所述上下位关系确定所述类别之间的隶属关系;
二次聚类单元,用于对所述类别进行二次聚类,并给聚为同一类的实体指定上位词;
本体生成单元,用于由二次聚类后的类别、所述隶属关系和所述上位词生成图谱本体;
数据添加单元,用于将所述二次设备故障数据添加至所述图谱本体中,得到所述知识图谱。
可选的,所述关联关系挖掘子模块,具体包括:
目标关系确定单元,用于确定目标关系;
正例三元组确定单元,用于在所述知识图谱中寻找具有所述目标关系的正例三元组;
正例特征向量确定单元,用于将所述正例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述正例三元组中两个实体之间的每一条路径的特征值,并根据所述正例三元组中两个实体之间的所有路径的特征值,得到正例特征向量;
负例三元组确定单元,用于修改所述正例三元组中的首部实体和/或尾部实体,得到负例三元组;
负例特征向量确定单元,用于将所述负例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述负例三元组中两个实体之间的每一条路径的特征值,并根据所述负例三元组中两个实体之间的所有路径的特征值,得到负例特征向量;
分类器训练单元,用于采用所述正例特征向量、所述负例特征向量、所述正例三元组中两个实体在所述知识图谱中的关联关系以及所述负例三元组中两个实体在所述知识图谱中的关联关系,对逻辑回归分类器进行训练,得到关联关系挖掘模型;
目标特征向量确定单元,用于采用随机游走算法计算两个目标实体之间的每一条路径的特征值,得到目标特征向量;两个所述目标实体为所述知识图谱中关联关系未知的两个实体;
关联关系挖掘单元,用于将所述目标特征向量输入所述关联关系挖掘模型中,得到两个所述目标实体之间的关联关系;
知识图谱更新单元,用于采用所述关联关系更新所述知识图谱,得到所述故障预案知识图谱。
可选的,所述故障数据获取子模块,具体包括:
数据获取单元,用于获取第一类数据和第二类数据;所述第一类数据包括二次设备运行时的监控信息和故障信息;所述第二类数据包括各电力部门的应急处置预案;
数据处理单元,用于对所述第一类数据进行数据清洗,得到第一类处理数据,对所述第二类数据进行分词、实体抽取、关系抽取和属性抽取的操作,得到第二类处理数据;所述二次设备故障数据包括所述第一类处理数据和所述第二类处理数据。
与现有技术相比,本发明的有益效果是:
本发明实施例提出了一种基于知识图谱推理的二次设备故障处理推送方法及系统,所述方法,包括:构建故障预案知识图谱,根据获取的二次设备故障告警信息,在故障预案知识图谱中查询并推送相应的应急处置预案,本发明将知识图谱用于故障处理推送,能实现故障原因的自动查找和处置方式的自动推送,提高故障处理推送的效率和可靠性,可以快速、准确的处理故障信息。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于知识图谱推理的二次设备故障处理推送方法的流程图;
图2为本发明实施例提供的故障预案知识图谱的构建方法流程图;
图3为本发明实施例提供的基于知识图谱推理的二次设备故障处理推送系统的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
目前针对具体电网故障的辨别、处置方式和信息填报都是基于人工方式,与人工方式相比,计算机运行速度快、实时性高、存储容量大、可靠性高。如果能通过机器来辅助甚至替代人工方式进行管理,将能有效提高故障处置的效率和可靠性,对减少安全事故具有重大和迫切的现实意义。
知识图谱作为一种智能高效的知识组织方法,在搜索引擎、人工智能、智慧金融等具海量数据的企业中得到了广泛的应用。知识图谱本质上是语义网络,基于图的数据结构存储,由节点和边组成。在知识图谱中每个节点对应真实存在的实体,边反映了实体之间关联关系,所以知识图谱能够处理复杂的关系网络。
将知识图谱应用于二次设备故障处理上,利用知识图谱的强关联性将故障辨识、故障原因、故障设备、故障等级、故障处置方式、处置人员等信息融合到一起。在故障发生时,利用知识图谱的推理能力,快速准确的定位故障原因,给出故障处置方案,并减轻处置人员的工作负荷,提高电力系统的性能和可靠性。
图1为本发明实施例提供的基于知识图谱推理的二次设备故障处理推送方法的流程图。参见图1,本实施例的基于知识图谱推理的二次设备故障处理推送方法,包括:
步骤101:获取二次设备故障告警信息。
步骤102:根据所述二次设备故障告警信息,在故障预案知识图谱中查询并推送相应的应急处置预案。
针对电力二次设备的故障告警信息(文本信息),在存储故障预案知识图谱的图数据库上进行查询,可以快速检索和查找故障处置方法和流程,辅助人工的二次设备故障的处置。采用短信、在线通知、电话和邮件等协作手段,将最后结合的处置工作流程和处置人员关联,实现故障处置工作的合理调度,降低工作人员的压力,减少故障处置错误。
图2为本发明实施例提供的故障预案知识图谱的构建方法流程图。参见图2,所述故障预案知识图谱的构建方法,包括:
步骤201:获取二次设备故障数据。具体为:
1)获取第一类数据和第二类数据。所述第一类数据包括二次设备运行时的监控信息和故障信息,第一类数据存在于通用的关系型数据库中,属于结构化的数据,但其中存在大量的无意义信息,需要初步进行筛选。所述第二类数据包括各电力部门的应急处置预案,第二类数据的内容为根据经验描述的故障辨识、故障设备、故障等级、故障处置方式等,属于一种非结构化信息,无法直接应用于知识图谱的构建。
2)对所述第一类数据进行数据清洗,以实现初步筛选,得到第一类处理数据,数据清洗具体包括:补充缺失的字段数据、剔除重复的数据以及统一同一指标的不同表述等。
对所述第二类数据进行分词、实体抽取、关系抽取和属性抽取的操作,以形成知识图谱可用的规范化、结构化数据,从而得到第二类处理数据。其中,分词使用pythonjieba分词工具自动对文本进行切割。实体抽取即命名实体识别,采用主流的长短时记忆网络(LSTM)以及条件随机场(CRF)来识别,其中LSTM作为特征抽取器,CRF作为输出层。关系抽取可以得到不同实体之间的相互关系,采用人工构造语法和语义规则,例如交换机sw1、主控板和指示灯三个实体,可以定义如下规则:交换机包含主控板,主控板包括指示灯,指示灯指示交换机故障。使用这种人工定义规则的方式有很高的准确率,能精确匹配预案文本中出现的模式。最后是属性的抽取,存储于关系型数据库中的每个表中的一行描述了一个实体,字段描述了其属性,可以直接进行转化。第二类数据这种非结构化数据,使用人工定义模板的方式实现,例如核心交换机,有名称、型号、控制区域、安全等级属性。利用上述的自然语言处理技术,完成所有数据的预处理工作。
所述二次设备故障数据包括所述第一类处理数据和所述第二类处理数据。
步骤202:由所述二次设备故障数据构建知识图谱。知识图谱的构建主要是本体的构建,本体是知识图谱的模板,指定某个领域的重要概念,也就是类。该步骤主要包括相似度计算、隶属关系确定以及本体生成三个方面。
步骤202,具体包括:
1)相似度计算。计算所述二次设备故障数据中实体之间的相似度,并根据所述相似度进行聚类,得到各所述实体的类别。
相似度是用来考察任意两个实体在多大程度上属于同一个分类类别。相似度的计算过程为:将所述二次设备故障数据中的各个实体映射到相同维度的向量空间,得到各个实体的实体信息向量;根据所述实体信息向量计算余弦相似度来衡量实体之间的相似度。
其中,可以采用word2vec算法将所述二次设备故障数据中的各个实体映射到相同维度的向量空间,得到各个实体的实体信息向量。具体的,首先,构建神经网络,本实施例采用连续词袋模型(Continuous Bag-of-Words,CBOW)模型来完成word to vector的转化,主要原理是利用上下文来预测中心值。CBOW是一个具有3层结构的神经网络,该神经网络包含输入层(接收每个词生成的onehot编码)、隐藏层(其权重为最终生成的vector表示)和输出层(将隐藏层权重映射到输出的维度)。然后,将实体作为目标值,向神经网络(CBOW模型)中输入实体的上下文进行训练,当所述神经网络输出的预测值与所述目标值之间的损失不再随着迭代次数的增加而变小时,则确定所述神经网络收敛;将收敛时的神经网络中的隐藏层的权重向量确定为实体的实体信息向量。例如,给定一个句子“故障链路无法PING通本地网关”,其中将“本地网关”作为目标值,剩下词作为上下文输入到CBOW网络中,输出层得到的结果经过softmax计算得到预测值,然后计算目标值和预测值之间的损失并不断迭代。当模型收敛之后,通过实体输入到CBOW网络得到的隐藏层的权重向量就包含了实体相关的信息,隐藏层的权重向量即为实体信息向量。
得到实体信息向量后,通过比较不同实体信息向量之间的余弦相似度来衡量实体之间的相似度。
2)隶属关系确定以及本体生成。由于最终实体的数量不多且专业领域需要保证高准确率,因此该步骤也可以通过人工的方式进行指定。
具体的:抽取所述二次设备故障数据中实体的上下位关系,根据所述上下位关系确定所述类别之间的隶属关系,例如词组(交换机,网络设备)构成上下位关系,“交换机”作为下位词,“网络设备”作为上位词。
对所述类别进行二次聚类,并给聚为同一类的实体指定上位词,例如:对(服务器、工作站)这两个概念指定同一个上位词“主机”。由二次聚类后的类别、所述隶属关系和所述上位词生成图谱本体。
3)将所述二次设备故障数据添加至所述图谱本体中,得到所述知识图谱。
步骤203:采用基于约束条件的推理,挖掘所述知识图谱中的关联关系,将加入所述关联关系的知识图谱确定为所述故障预案知识图谱。
步骤203,具体包括:
1)确定目标关系。
2)在所述知识图谱中寻找具有所述目标关系的正例三元组。
将所述正例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述正例三元组中两个实体之间的每一条路径的特征值,并根据所述正例三元组中两个实体之间的所有路径的特征值,得到正例特征向量。
3)修改所述正例三元组中的首部实体和/或尾部实体,得到负例(反例)三元组,构造负例三元组的目的是增加反例,以丰富数据量。。例如,可以将所述正例三元组中的首部实体和/或尾部实体替换成其他实体,假设正例三元组为“主控板-----包含-----指示灯”,将该正例三元组的尾部实体替换成其他实体,负例三元组可以为“主控板-----不包含-----交换机”。
将所述负例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述负例三元组中两个实体之间的每一条路径的特征值,并根据所述负例三元组中两个实体之间的所有路径的特征值,得到负例特征向量。
4)将所述负例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述负例三元组中两个实体之间的每一条路径的特征值,并根据所述负例三元组中两个实体之间的所有路径的特征值,得到负例特征向量。
5)采用所述正例特征向量、所述负例特征向量、所述正例三元组中两个实体在所述知识图谱中的关联关系以及所述负例三元组中两个实体在所述知识图谱中的关联关系,对逻辑回归分类器进行训练,得到关联关系挖掘模型。
6)采用随机游走算法计算两个目标实体之间的每一条路径的特征值,得到目标特征向量;两个所述目标实体为所述知识图谱中关联关系未知的两个实体。
7)将所述目标特征向量输入所述关联关系挖掘模型中,得到两个所述目标实体之间的关联关系。
8)采用所述关联关系更新所述知识图谱,得到所述故障预案知识图谱。
在实际应用中,步骤203的一个更加具体的实现过程如下:
采用基于约束条件(规则)的推理,在知识图谱上进行数据挖掘形成新的关联关系。例如,将一些路径近似地看成规则,实体间的路径进一步作为判断实体间是否存在指定关系的特征训练学习模型。采用PRA随机游走算法,首先确定要学习的目标关系,然后找出目标关系的正例三元组,替换头/尾实体得到负例三元组;再构造特征集合,将这些三元组中两个实体之间的一条路径作为一个特征,根据随机游走的思想计算路径的特征值,构成每个三元组的特征向量,并训练了逻辑回归分类器。通过分类器可以利用连接实体的已有路径来预测实体间是否存在潜在关系。
具体的,随机游走是指在图结构中的某个节点上都有两个选择,要么以某个概率(游走概率)跳转到随机的某个邻居上,要么跳回起点。当给定一个关系路径P=R1,R2...Rl,P表示路径,即从s点到e点经过R1,R2...Rl共l步,其中Ri表示每两个节点之间的关系,在关系路径上进行随机游走时,使用hs,P表示随机游走的概率分布。当P为一个空路径时(初次确定两个节点之间的关系时,两个节点之间不存在路径),概率分布如下,s表示当前节点,e表示s的邻居节点,domain(P)表示当前关系的知识领域。公式(1)用于在第一步时确定某两个节点之间是否存在路径。
Figure BDA0003342403560000111
当P=R1,R2...Rl不为空时(例如,第一步确定两个节点之间的关系后,两节点之间存在路径,则下一步继续确定节点之间的关系时,则认为P不为空),令P'=R1,R2...Rl-1定义
Figure BDA0003342403560000112
其中
Figure BDA0003342403560000113
表示在关系Rl的条件下节点e'到e的随机游走概率,当节点间关系存在时,Rl(e',e)的值为1。p′表示从s点达到e的前一步e'的路径R1,R2...Rl-1,也就是走了l-1步,e'表示达到e的前一节点。给定一个关系R和属于此关系的一系列节点对{(si,ti)},对于每个si,会有多条路径(P1,P2...Pn)到达ti,那么每个
Figure BDA0003342403560000114
可以看作是一个路径特征值。由于事先知道每个节点是否存在关系,那么可以构造一个训练集D={(xi,yi)},这里的xi是第i个节点对的所有路径特征构成的向量,yi表示此节点是否存在关系。通过训练集D训练一个逻辑回归模型来预测条件概率P(y|x;θ),θ是模型参数。通过此回归模型,当获得一对节点以及节点间的路径特征,就可以判断两节点之间是否存在关联关系。
在知识图谱应用时,需要进行复杂的、广范围的关系查询,采用图数据库能更快、更高效的完成查询任务。这是由于图数据库,其使用的存储后端专门为图结构数据的存储和管理进行了定制和优化,能够将知识图谱中的知识(关联关系)采用这种图结构进行存储。在进行关系查询时采用专用的查询语句,例如:利用match来匹配查询的数据模式、用where来限制各个实体节点或关系中的某些属性值、使用return返回想要的节点或者关系数据。因此,通过步骤201-203生成的故障预案知识图谱,可查询并推送二次设备故障告警信息对应的应急处置预案。
目前针对具体电网故障的辨别、处置方式、信息填报都是基于人工方式。由工作人员凭借自身经验以及故障处置预案来判断故障辨识形成的主要原因,再根据处置预案来执行指定的处置方法,最后手动填报信息。和现有的人工处理相比,本实施例使用知识图谱的故障处理推送技术可以快速、准确的处理故障信息,其主要原因在于:
1、故障处置方式的推送:由于使用了知识图谱的知识推理,知识图谱可以结合故障辨识以及所关联的其他属性,自动推算故障发生原因,检索故障处置方式。
2、故障信息自动填报:由于知识图谱的构建,得到了故障辨识、故障原因、故障部位、处置方案、处置人员等不同命名实体之间的关联关系。使得系统能够按照模板要求自动填写故障原因、故障部位、处置方案、处置人员等具体信息,并交给业务员审核后提交,减轻故障处置人员的工作强度。
3、故障处置工作的协同工作:根据故障处置流程,采用现代化通信手段,实现不同单位或部门的协同工作,完成处置工作的自动化工作协同。
本发明还提供了基于知识图谱推理的二次设备故障处理推送系统,图3为本发明实施例提供的基于知识图谱推理的二次设备故障处理推送系统的结构图。参见图3,所述系统,包括:
信息获取模块301,用于获取二次设备故障告警信息。
预案查询模块302,用于根据所述二次设备故障告警信息,在故障预案知识图谱中查询并推送相应的应急处置预案.
知识图谱构建模块303,用于构建所述故障预案知识图谱。
所述知识图谱构建模块303,包括:
故障数据获取子模块,用于获取二次设备故障数据。
图谱构建子模块,用于由所述二次设备故障数据构建知识图谱。
关联关系挖掘子模块,用于采用基于约束条件的推理,挖掘所述知识图谱中的关联关系,将加入所述关联关系的知识图谱确定为所述故障预案知识图谱。
在一个示例中,所述图谱构建子模块,具体包括:
相似度计算单元,用于计算所述二次设备故障数据中实体之间的相似度,并根据所述相似度进行聚类,得到各所述实体的类别。
隶属关系确定单元,用于抽取所述二次设备故障数据中实体的上下位关系,根据所述上下位关系确定所述类别之间的隶属关系。
二次聚类单元,用于对所述类别进行二次聚类,并给聚为同一类的实体指定上位词。
本体生成单元,用于由二次聚类后的类别、所述隶属关系和所述上位词生成图谱本体。
数据添加单元,用于将所述二次设备故障数据添加至所述图谱本体中,得到所述知识图谱。
在一个示例中,所述关联关系挖掘子模块,具体包括:
目标关系确定单元,用于确定目标关系。
正例三元组确定单元,用于在所述知识图谱中寻找具有所述目标关系的正例三元组。
正例特征向量确定单元,用于将所述正例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述正例三元组中两个实体之间的每一条路径的特征值,并根据所述正例三元组中两个实体之间的所有路径的特征值,得到正例特征向量。
负例三元组确定单元,用于修改所述正例三元组中的首部实体和/或尾部实体,得到负例三元组。
负例特征向量确定单元,用于将所述负例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述负例三元组中两个实体之间的每一条路径的特征值,并根据所述负例三元组中两个实体之间的所有路径的特征值,得到负例特征向量。
分类器训练单元,用于采用所述正例特征向量、所述负例特征向量、所述正例三元组中两个实体在所述知识图谱中的关联关系以及所述负例三元组中两个实体在所述知识图谱中的关联关系,对逻辑回归分类器进行训练,得到关联关系挖掘模型。
目标特征向量确定单元,用于采用随机游走算法计算两个目标实体之间的每一条路径的特征值,得到目标特征向量;两个所述目标实体为所述知识图谱中关联关系未知的两个实体。
关联关系挖掘单元,用于将所述目标特征向量输入所述关联关系挖掘模型中,得到两个所述目标实体之间的关联关系。
知识图谱更新单元,用于采用所述关联关系更新所述知识图谱,得到所述故障预案知识图谱。
在一个示例中,所述故障数据获取子模块,具体包括:
数据获取单元,用于获取第一类数据和第二类数据;所述第一类数据包括二次设备运行时的监控信息和故障信息;所述第二类数据包括各电力部门的应急处置预案。
数据处理单元,用于对所述第一类数据进行数据清洗,得到第一类处理数据,对所述第二类数据进行分词、实体抽取、关系抽取和属性抽取的操作,得到第二类处理数据;所述二次设备故障数据包括所述第一类处理数据和所述第二类处理数据。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.基于知识图谱推理的二次设备故障处理推送方法,其特征在于,包括:
获取二次设备故障告警信息;
根据所述二次设备故障告警信息,在故障预案知识图谱中查询并推送相应的应急处置预案;
其中,所述故障预案知识图谱的构建方法,包括:
获取二次设备故障数据;
由所述二次设备故障数据构建知识图谱;
采用基于约束条件的推理,挖掘所述知识图谱中的关联关系,将加入所述关联关系的知识图谱确定为所述故障预案知识图谱。
2.根据权利要求1所述的基于知识图谱推理的二次设备故障处理推送方法,其特征在于,所述由所述二次设备故障数据构建知识图谱,具体包括:
计算所述二次设备故障数据中实体之间的相似度,并根据所述相似度进行聚类,得到各所述实体的类别;
抽取所述二次设备故障数据中实体的上下位关系,根据所述上下位关系确定所述类别之间的隶属关系;
对所述类别进行二次聚类,并给聚为同一类的实体指定上位词;
由二次聚类后的类别、所述隶属关系和所述上位词生成图谱本体;
将所述二次设备故障数据添加至所述图谱本体中,得到所述知识图谱。
3.根据权利要求1所述的基于知识图谱推理的二次设备故障处理推送方法,其特征在于,所述采用基于约束条件的推理,挖掘所述知识图谱中的关联关系,将加入所述关联关系的知识图谱确定为所述故障预案知识图谱,具体包括:
确定目标关系;
在所述知识图谱中寻找具有所述目标关系的正例三元组;
将所述正例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述正例三元组中两个实体之间的每一条路径的特征值,并根据所述正例三元组中两个实体之间的所有路径的特征值,得到正例特征向量;
修改所述正例三元组中的首部实体和/或尾部实体,得到负例三元组;
将所述负例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述负例三元组中两个实体之间的每一条路径的特征值,并根据所述负例三元组中两个实体之间的所有路径的特征值,得到负例特征向量;
采用所述正例特征向量、所述负例特征向量、所述正例三元组中两个实体在所述知识图谱中的关联关系以及所述负例三元组中两个实体在所述知识图谱中的关联关系,对逻辑回归分类器进行训练,得到关联关系挖掘模型;
采用随机游走算法计算两个目标实体之间的每一条路径的特征值,得到目标特征向量;两个所述目标实体为所述知识图谱中关联关系未知的两个实体;
将所述目标特征向量输入所述关联关系挖掘模型中,得到两个所述目标实体之间的关联关系;
采用所述关联关系更新所述知识图谱,得到所述故障预案知识图谱。
4.根据权利要求1所述的基于知识图谱推理的二次设备故障处理推送方法,其特征在于,所述获取二次设备故障数据,具体包括:
获取第一类数据和第二类数据;所述第一类数据包括二次设备运行时的监控信息和故障信息;所述第二类数据包括各电力部门的应急处置预案;
对所述第一类数据进行数据清洗,得到第一类处理数据,对所述第二类数据进行分词、实体抽取、关系抽取和属性抽取的操作,得到第二类处理数据;所述二次设备故障数据包括所述第一类处理数据和所述第二类处理数据。
5.根据权利要求2所述的基于知识图谱推理的二次设备故障处理推送方法,其特征在于,所述计算所述二次设备故障数据中实体之间的相似度,具体包括:
将所述二次设备故障数据中的各个实体映射到相同维度的向量空间,得到各个实体的实体信息向量;
根据所述实体信息向量计算实体之间的相似度。
6.根据权利要求5所述的基于知识图谱推理的二次设备故障处理推送方法,其特征在于,所述将所述二次设备故障数据中的各个实体映射到相同维度的向量空间,得到各个实体的实体信息向量,具体包括:
构建神经网络;所述神经网络包括依次连接的输入层、隐藏层和输出层;
将实体作为目标值,向神经网络中输入实体的上下文进行训练,当所述神经网络输出的预测值与所述目标值之间的损失不再随着迭代次数的增加而变小时,则确定所述神经网络收敛;
将收敛时的神经网络中的隐藏层的权重向量确定为实体的实体信息向量。
7.基于知识图谱推理的二次设备故障处理推送系统,其特征在于,包括:
信息获取模块,用于获取二次设备故障告警信息;
预案查询模块,用于根据所述二次设备故障告警信息,在故障预案知识图谱中查询并推送相应的应急处置预案;
知识图谱构建模块,用于构建所述故障预案知识图谱;
所述知识图谱构建模块,包括:
故障数据获取子模块,用于获取二次设备故障数据;
图谱构建子模块,用于由所述二次设备故障数据构建知识图谱;
关联关系挖掘子模块,用于采用基于约束条件的推理,挖掘所述知识图谱中的关联关系,将加入所述关联关系的知识图谱确定为所述故障预案知识图谱。
8.根据权利要求7所述的基于知识图谱推理的二次设备故障处理推送系统,其特征在于,所述图谱构建子模块,具体包括:
相似度计算单元,用于计算所述二次设备故障数据中实体之间的相似度,并根据所述相似度进行聚类,得到各所述实体的类别;
隶属关系确定单元,用于抽取所述二次设备故障数据中实体的上下位关系,根据所述上下位关系确定所述类别之间的隶属关系;
二次聚类单元,用于对所述类别进行二次聚类,并给聚为同一类的实体指定上位词;
本体生成单元,用于由二次聚类后的类别、所述隶属关系和所述上位词生成图谱本体;
数据添加单元,用于将所述二次设备故障数据添加至所述图谱本体中,得到所述知识图谱。
9.根据权利要求7所述的基于知识图谱推理的二次设备故障处理推送系统,其特征在于,所述关联关系挖掘子模块,具体包括:
目标关系确定单元,用于确定目标关系;
正例三元组确定单元,用于在所述知识图谱中寻找具有所述目标关系的正例三元组;
正例特征向量确定单元,用于将所述正例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述正例三元组中两个实体之间的每一条路径的特征值,并根据所述正例三元组中两个实体之间的所有路径的特征值,得到正例特征向量;
负例三元组确定单元,用于修改所述正例三元组中的首部实体和/或尾部实体,得到负例三元组;
负例特征向量确定单元,用于将所述负例三元组中两个实体之间的每一条路径作为一个特征,采用随机游走算法计算所述负例三元组中两个实体之间的每一条路径的特征值,并根据所述负例三元组中两个实体之间的所有路径的特征值,得到负例特征向量;
分类器训练单元,用于采用所述正例特征向量、所述负例特征向量、所述正例三元组中两个实体在所述知识图谱中的关联关系以及所述负例三元组中两个实体在所述知识图谱中的关联关系,对逻辑回归分类器进行训练,得到关联关系挖掘模型;
目标特征向量确定单元,用于采用随机游走算法计算两个目标实体之间的每一条路径的特征值,得到目标特征向量;两个所述目标实体为所述知识图谱中关联关系未知的两个实体;
关联关系挖掘单元,用于将所述目标特征向量输入所述关联关系挖掘模型中,得到两个所述目标实体之间的关联关系;
知识图谱更新单元,用于采用所述关联关系更新所述知识图谱,得到所述故障预案知识图谱。
10.根据权利要求7所述的基于知识图谱推理的二次设备故障处理推送系统,其特征在于,所述故障数据获取子模块,具体包括:
数据获取单元,用于获取第一类数据和第二类数据;所述第一类数据包括二次设备运行时的监控信息和故障信息;所述第二类数据包括各电力部门的应急处置预案;
数据处理单元,用于对所述第一类数据进行数据清洗,得到第一类处理数据,对所述第二类数据进行分词、实体抽取、关系抽取和属性抽取的操作,得到第二类处理数据;所述二次设备故障数据包括所述第一类处理数据和所述第二类处理数据。
CN202111312163.XA 2021-11-08 2021-11-08 基于知识图谱推理的二次设备故障处理推送方法及系统 Pending CN114138759A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111312163.XA CN114138759A (zh) 2021-11-08 2021-11-08 基于知识图谱推理的二次设备故障处理推送方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111312163.XA CN114138759A (zh) 2021-11-08 2021-11-08 基于知识图谱推理的二次设备故障处理推送方法及系统

Publications (1)

Publication Number Publication Date
CN114138759A true CN114138759A (zh) 2022-03-04

Family

ID=80393178

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111312163.XA Pending CN114138759A (zh) 2021-11-08 2021-11-08 基于知识图谱推理的二次设备故障处理推送方法及系统

Country Status (1)

Country Link
CN (1) CN114138759A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114723059A (zh) * 2022-06-07 2022-07-08 达而观数据(成都)有限公司 基于知识推理的故障归因系统及方法
CN115022153A (zh) * 2022-06-07 2022-09-06 中国工商银行股份有限公司 故障根因分析方法、装置、设备和存储介质
CN116054910A (zh) * 2022-12-20 2023-05-02 中国人民解放军63819部队 基于知识图谱构建的地球站设备故障分析及装置
CN116055292A (zh) * 2022-12-30 2023-05-02 中国联合网络通信集团有限公司 基于知识图谱的信息处理方法、装置和设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140282219A1 (en) * 2013-03-15 2014-09-18 Robert Haddock Intelligent internet system with adaptive user interface providing one-step access to knowledge
CN112269901A (zh) * 2020-09-14 2021-01-26 合肥中科类脑智能技术有限公司 一种基于知识图谱的故障判别推理方法
CN113283704A (zh) * 2021-04-23 2021-08-20 内蒙古电力(集团)有限责任公司乌兰察布电业局 基于知识图谱的电网故障智能处置系统及方法
WO2021189971A1 (zh) * 2020-10-26 2021-09-30 平安科技(深圳)有限公司 基于知识图谱表征学习的医疗方案推荐系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140282219A1 (en) * 2013-03-15 2014-09-18 Robert Haddock Intelligent internet system with adaptive user interface providing one-step access to knowledge
CN112269901A (zh) * 2020-09-14 2021-01-26 合肥中科类脑智能技术有限公司 一种基于知识图谱的故障判别推理方法
WO2021189971A1 (zh) * 2020-10-26 2021-09-30 平安科技(深圳)有限公司 基于知识图谱表征学习的医疗方案推荐系统及方法
CN113283704A (zh) * 2021-04-23 2021-08-20 内蒙古电力(集团)有限责任公司乌兰察布电业局 基于知识图谱的电网故障智能处置系统及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
施正钗;郑俊翔;周泰斌;徐伟敏;郑微;: "基于语义分析的设备监控告警信息知识图谱构建研究", 浙江电力, no. 08, 25 August 2020 (2020-08-25) *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114723059A (zh) * 2022-06-07 2022-07-08 达而观数据(成都)有限公司 基于知识推理的故障归因系统及方法
CN115022153A (zh) * 2022-06-07 2022-09-06 中国工商银行股份有限公司 故障根因分析方法、装置、设备和存储介质
CN115022153B (zh) * 2022-06-07 2024-04-23 中国工商银行股份有限公司 故障根因分析方法、装置、设备和存储介质
CN116054910A (zh) * 2022-12-20 2023-05-02 中国人民解放军63819部队 基于知识图谱构建的地球站设备故障分析及装置
CN116054910B (zh) * 2022-12-20 2024-05-14 中国人民解放军63819部队 基于知识图谱构建的地球站设备故障分析及装置
CN116055292A (zh) * 2022-12-30 2023-05-02 中国联合网络通信集团有限公司 基于知识图谱的信息处理方法、装置和设备

Similar Documents

Publication Publication Date Title
CN114138759A (zh) 基于知识图谱推理的二次设备故障处理推送方法及系统
Redl et al. Automatic SLA matching and provider selection in grid and cloud computing markets
CN101093559A (zh) 一种基于知识发现的专家系统构造方法
CN109614495B (zh) 一种结合知识图谱和文本信息的相关公司挖掘方法
CN117271767B (zh) 基于多智能体的运维知识库的建立方法
CN110826237B (zh) 基于贝叶斯信念网络的风电设备可靠性分析方法及装置
CN113283602B (zh) 基于离线知识学习和在线动态修正电网系统故障诊断方法
CN111930774A (zh) 一种电力知识图谱本体自动构建方法及系统
CN116127084A (zh) 基于知识图谱的微电网调度策略智能检索系统及方法
CN113095524A (zh) 电力设备检修工作单据智能生成方法、系统及存储介质
Deng et al. Research on the construction of event logic knowledge graph of supply chain management
CN113033186B (zh) 一种基于事件分析的纠错预警方法及系统
CN116611813B (zh) 一种基于知识图谱的智能运维管理方法及系统
CN112000708A (zh) 一种基于调控配用数据融合的异常数据处理方法及系统
CN116523042A (zh) 一种电网调度实体关系联合抽取方法及系统
CN116821423A (zh) 配电网智能解析和知识型故障处理辅助系统及方法
CN115601007A (zh) 一种复杂机电系统全生命周期诊断推理与维护决策方法
Jarosław An attempt to knowledge conceptualization of methods and tools supporting ontology evaluation process
CN115409122A (zh) 一种变电设备并发故障分析方法、系统、设备及介质
CN115358369A (zh) 基于卷积神经网络模型的监控告警事件识别方法
CN115239153A (zh) 一种用于化工园区事故的应急指挥决策方法、系统及介质
Xinjie et al. A Construction Method for the Knowledge Graph of Power Grid Supervision Business
Tu et al. Reusable Ontology Generation and Matching from Simulation Models
Li et al. Fault Diagnosis of Industrial Robot based on Fuzzy Multi-attribute Decision-making of Knowledge Graph
Li et al. System of Systems Architecture Prioritization Using A Comprehensive Evaluation Framework

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination