CN115577108A - 一种变压器故障图谱构建方法及相关设备 - Google Patents

一种变压器故障图谱构建方法及相关设备 Download PDF

Info

Publication number
CN115577108A
CN115577108A CN202211278821.2A CN202211278821A CN115577108A CN 115577108 A CN115577108 A CN 115577108A CN 202211278821 A CN202211278821 A CN 202211278821A CN 115577108 A CN115577108 A CN 115577108A
Authority
CN
China
Prior art keywords
data
fault
transformer
data structure
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211278821.2A
Other languages
English (en)
Inventor
龚泽威一
王耀龙
曹占国
段雨廷
朱晓丽
孙成龙
石光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electric Power Research Institute of Yunnan Power Grid Co Ltd
Original Assignee
Electric Power Research Institute of Yunnan Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electric Power Research Institute of Yunnan Power Grid Co Ltd filed Critical Electric Power Research Institute of Yunnan Power Grid Co Ltd
Priority to CN202211278821.2A priority Critical patent/CN115577108A/zh
Publication of CN115577108A publication Critical patent/CN115577108A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/50Testing of electric apparatus, lines, cables or components for short-circuits, continuity, leakage current or incorrect line connections
    • G01R31/62Testing of transformers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Power Engineering (AREA)
  • Housings And Mounting Of Transformers (AREA)

Abstract

本发明实施例公开了一种变压器故障图谱构建方法及相关设备,所述方法包括:从多源异构数据库中抽取变压器的历史故障数据,其中,所述历史故障数据包括历史故障内容信息和数据结构类型;根据所述数据结构类型确定所述历史故障数据的分析方法,并对所述历史故障内容信息进行分析,得到基础元素数据,其中,所述基础元素数据包括实体、关系、属性;基于所述基础元素数据构建变压器故障图谱。通过对不同数据结构的历史故障数据进行分析,得到不同数据结构的历史故障数据中包含的实体、关系、属性,提升了变压器故障历史数据挖掘利用率,构建的变压器故障图谱更精准可靠。

Description

一种变压器故障图谱构建方法及相关设备
技术领域
本发明涉及变压器维护技术领域,尤其涉及一种变压器故障图谱构建方法及相关设备。
背景技术
电力企业在开展变压器设备日常运检过程中,变压器设备的功能较以往更加复杂,其日常的运行维护,包括故障诊断,也更加依赖于专门的电力知识,这些电力知识及其应用的丰富经验往往只由少数老员工掌握,知识传承靠的是老员工与新员工之间传帮带的形式,难以迅速被新员工吸收,容易造成经验传承损失、知识资产流失,对电力企业运作产生不利影响。
而且,即便电力企业已经积累了一定规模的变压器设备技术文档,也常常存在大量电力知识的非结构化文本数据难以利用、全口径数据难以深度融合、设备知识应用深度较浅等困境。
发明内容
有鉴于此,本发明提供了一种变压器故障图谱构建方法及相关设备,用于解决现有技术中不同结构的数据难以融合,不能同时利用,造成资源浪费以及利用单一结构数据生成知识图谱容易带来片面性的问题。
为达上述之一或部分或全部目的或是其他目的,本发明提出一种变压器故障图谱构建方法,包括:从多源异构数据库中抽取变压器的历史故障数据,其中,所述历史故障数据包括历史故障内容信息和数据结构类型,所述数据结构类型包括结构化数据结构和非结构化数据结构;
根据所述数据结构类型确定所述历史故障数据的分析方法,并对所述历史故障内容信息进行分析,得到基础元素数据,其中,所述基础元素数据包括实体、关系、属性;
基于所述基础元素数据构建变压器故障图谱。
可选的,所述从多源异构数据库中抽取变压器的历史故障数据的步骤,包括:
按照预设拆分逻辑将所述变压器拆分为至少两个目标元件;
从多源异构数据库中抽取所述目标元件对应的目标故障内容信息和数据来源;
基于所述数据来源确定所述目标故障数据的数据结构类型,并将所述数据结构类型与所述目标故障内容信息进行绑定,得到所述变压器的历史故障数据。
可选的,所述根据所述数据结构类型确定所述历史故障数据的分析方法,并对所述历史故障内容信息进行分析,得到基础元素数据的步骤,包括:
当所述数据结构类型为结构化数据结构时,将所述历史故障内容信息按照预设对应关系导入图像数据库,得到所述基础元素数据,所述图像数据库用于生成图谱。
可选的,所述根据所述数据结构类型确定所述历史故障数据的分析方法,并对所述历史故障内容信息进行分析,得到基础元素数据的步骤,还包括:
当所述数据结构类型为非结构化数据结构时,对所述历史故障内容信息进行筛选,得到所述历史故障内容信息包含的初始实体与初始属性;
对所述初始实体与所述初始属性进行共指消解,得到目标实体与目标属性,所述共指消解的过程为将所述历史故障内容信息中具有相同含义但表述不同的初始实体/所述初始属性进行合并;
结合所述目标实体与所述目标属性在所述历史故障内容信息中的左右上下文信息,确定所述目标实体与所述目标属性的关系信息;
根据所述关系信息、所述目标实体与所述目标属性,得到所述基础元素数据。
可选的,在所述基于所述基础元素数据构建变压器故障图谱的步骤之后,还包括:
基于所述多源异构数据库获取所述变压器的基础属性信息;
将所述目标实体与其相匹配的目标基础属性信息进行关联,得到显示所述变压器的基础属性信息的变压器故障图谱。
可选的,所述方法,还包括:
基于完整性维度、一致性维度、准确性维度以及时效性维度对所述变压器故障图谱进行评估,得到评估结果;
针对所述评估结果构建修正策略,并根据所述修正策略修改用于构建所述变压器故障图谱的基础元素数据;
基于修改后的基础元素数据生成修正后的变压器故障图谱。
可选的,所述方法还包括:
采用主动更新方式下的局部更新机制对所述变压器故障图谱进行更新。
第二方面,本申请提供了一种变压器故障图谱构建系统,所述系统包括:
数据采集模块,用于从多源异构数据库中抽取变压器的历史故障数据,其中,所述历史故障数据包括历史故障内容信息和数据结构类型,所述数据结构类型包括结构化数据结构和非结构化数据结构;
分析模块,用于根据所述数据结构类型确定所述历史故障数据的分析方法,并对所述历史故障内容信息进行分析,得到基础元素数据,其中,所述基础元素数据包括实体、关系、属性;
图谱生成模块,用于基于所述基础元素数据构建变压器故障图谱。
第三方面,本申请提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线通信,所述机器可读指令被所述处理器执行时执行如上述的变压器故障图谱构建方法的步骤。
第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述的变压器故障图谱构建方法的步骤。
实施本发明实施例,将具有如下有益效果:
通过从多源异构数据库中抽取变压器的历史故障数据,将不同来源的不同数据结构类型的数据进行统一处理,不再对不同来源或者不同数据结构类型的数据进行筛选、分存等处理,节省了计算资源,提高了效率。根据所述数据结构类型确定所述历史故障数据的分析方法,并对所述历史故障内容信息进行分析,得到基础元素数据,通过为不同来源或者不同数据结构类型的数据设置对应的分析方法,解决了非结构化文本数据难以利用、全口径数据难以深度融合、设备知识应用深度较浅等问题;基于所述基础元素数据构建变压器故障图谱,结合不同来源的不同数据结构类型的数据所生成的变压器故障图谱,更精准可靠。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1是本申请实施例提供的一种变压器故障图谱构建方法的流程图;
图2是本申请实施例提供的另一种变压器故障图谱构建方法的流程图;
图3是本申请实施例提供的一种变压器故障图谱构建方法中获取基础元素数据的流程图;
图4是本申请实施例提供的一种变压器故障图谱构建系统的结构示意图;
图5是本申请实施例提供的一种电子设备的结构示意图;
图6是本申请实施例提供的一种存储介质的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本申请实施例提供了一种变压器故障图谱构建方法,包括:
S101、从多源异构数据库中抽取变压器的历史故障数据,其中,所述历史故障数据包括历史故障内容信息和数据结构类型,所述数据结构类型包括结构化数据结构和非结构化数据结构;
示例性的,将不同来源或者不同结构的变压器的历史故障数据进行整合,存放至所述多源异构数据库,所述多源异构数据库可以存储不同数据结构的数据,使得所述多源异构数据库内针对变压器故障的数据更全面,也避免了按照不同数据结构分别对数据进行存储的不便。
S102、根据所述数据结构类型确定所述历史故障数据的分析方法,并对所述历史故障内容信息进行分析,得到基础元素数据,其中,所述基础元素数据包括实体、关系、属性;
示例性的,针对不同来源或者不同数据结构类型的数据设置对应的分析方法,解决了非结构化文本数据难以利用、全口径数据难以深度融合、设备知识应用深度较浅等问题,得到统一的用于生成知识图谱的基础元素数据。
S103、基于所述基础元素数据构建变压器故障图谱。
示例性的,结合不同来源的不同数据结构类型的数据所生成的变压器故障图谱,更精准可靠。
在一种可能的实施方式中,所述从多源异构数据库中抽取变压器的历史故障数据的步骤,包括:
按照预设拆分逻辑将所述变压器拆分为至少两个目标元件;
从多源异构数据库中抽取所述目标元件对应的目标故障内容信息和数据来源;
基于所述数据来源确定所述目标故障数据的数据结构类型,并将所述数据结构类型与所述目标故障内容信息进行绑定,得到所述变压器的历史故障数据。
示例性的,将变压器整体划分为变压器本体、套管、分接开关、绝缘油、冷却系统、附件六个目标元件。
从多源异构数据库中抽取所述变压器本体对应的目标故障内容信息和数据来源时,抽取色谱分析数据,即氢气(H2)、甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4)、乙炔(C2H2)和一氧化碳(CO)、二氧化碳(CO2)七种气体的含量信息;选取绕组直流电阻、绕组介质损耗因数、绕组绝缘电阻、吸收比、极化指数、绕组电容量变化、泄露电流等试验项目的第一实验信息,其中,所述目标故障内容信息包括所述气体的含量信息与所述第一实验信息;由于日常的巡视项目也能反映变压器当前的运行状况,因此,选取漏油情况、噪声、振动情况等日常巡视记录作为变压器本体的故障历史数据来源。
从多源异构数据库中抽取所述套管对应的目标故障内容信息和数据来源时,选取总烃、氢气(H2)、乙炔(C2H2)和一氧化碳(CO)、二氧化碳(CO2)作为油中气体分析项目得到分析信息;选取绝缘电阻、介损、电容量变化值等作为电气试验项目得到第二实验信息,所述目标故障内容信息包括所述分析信息与所述第二实验信息;同时,选取红外测温记录、油位指示等作为相应的套管故障历史数据来源。
从多源异构数据库中抽取所述分接开关对应的目标故障内容信息和数据来源时,有载分接开关以获取油位情况、分接位置、渗漏等巡检项目为主,还有油耐压、动作特性等试验的第三实验信息,所述目标故障内容信息包括所述第三实验信息;而对于无励磁分接开关,选取操作机构是否正常、档位指示否正常等作为相应的分接开关故障历史数据来源。
从多源异构数据库中抽取所述绝缘油对应的目标故障内容信息和数据来源时,选取击穿电压、油介损、油中含气量以及巡视记录等作为绝缘油故障历史数据来源。
从多源异构数据库中抽取所述冷却系统对应的目标故障内容信息和数据来源时,选取以巡视记录为主,比如电机运行情况、冷却水管是否漏油、风扇是否有异常声响等作为目标故障内容信息。
从多源异构数据库中抽取所述附件对应的目标故障内容信息和数据来源时,将温度计、气体继电器、压力释放阀、油位指示计等非电量保护装置的运行信息作为目标故障内容信息。
在一种可能的实施方式中,所述根据所述数据结构类型确定所述历史故障数据的分析方法,并对所述历史故障内容信息进行分析,得到基础元素数据的步骤,包括:
当所述数据结构类型为结构化数据结构时,将所述历史故障内容信息按照预设对应关系导入图像数据库,得到所述基础元素数据,所述图像数据库用于生成图谱。
示例性的,如图2所示,结构化数据主要来源于SCADA系统、CMS系统、FAS系统,记录了变压器运行的各种参数,以及故障发生时伴随的异常数据,即,所述历史故障内容信息,结构化数据结构的历史故障内容信息以表格数据为主,将表格数据视为三元组的形式,导入到Neo4j图像数据库中,将所述历史故障内容信息按照预设对应关系导入图像数据库,例如,将表格的行作为知识图谱的实体节点名称,列名作为属性名,单元格中的值作为属性值。采用Neo4j自带的LOAD方式导入。
在一种可能的实施方式中,所述根据所述数据结构类型确定所述历史故障数据的分析方法,并对所述历史故障内容信息进行分析,得到基础元素数据的步骤,还包括:
当所述数据结构类型为非结构化数据结构时,对所述历史故障内容信息进行筛选,得到所述历史故障内容信息包含的初始实体与初始属性;
对所述初始实体与所述初始属性进行共指消解,得到目标实体与目标属性,所述共指消解的过程为将所述历史故障内容信息中具有相同含义但表述不同的初始实体/所述初始属性进行合并;
结合所述目标实体与所述目标属性在所述历史故障内容信息中的左右上下文信息,确定所述目标实体与所述目标属性的关系信息;
根据所述关系信息、所述目标实体与所述目标属性,得到所述基础元素数据。
示例性的,如图2所示,非结构化数据以文本类的数据为例,主要来源于运维工单、定检记录、操作手册等包含有变压器发生过的历史故障信息、运维人员信息、检修方法等信息,结合自然语言处理技术对文本类的历史故障内容信息进行处理,具体包括:实体/属性抽取、共指消解、关系抽取和数据整合;
其中,实体/属性抽取的过程包括:
分词:将文本类的历史故障内容信息切割为单独的词,如“变压器P1#”、“绝缘油”等,本例采用基于统计的方法分词,具体的采用隐马尔可夫算法模型(HMM)结合电力专业术语集进行分词:
HMM有两个基本假设:a.在任意t时刻的状态只依赖于其前一时刻的状态,与其他观测及状态无关,即:
Figure BDA0003897771820000081
b.任意t时刻的观测值只依赖于该时刻的马尔科夫链的状态,与其他观测及状态无关,即:
Figure BDA0003897771820000082
根据HMM原理,在分词过程中可以认为每个字(观测值)有一个对应的状态(状态值),状态集合我们用G=(B,M,E,S)表示。其中,B:一个词的开始;M:一个词的中间;E:一个词的结束;S:单字成词。例如故障文本:
变压器P1#的绝缘油油温过高,温度达到102°
B E S S B M E B E B E S B E B E S
根据语句的状态序列将句子切分为:变压器/P1#/的/绝缘油/油温/过高/,/温度/达到/102°。结合电力专业术语集证明“变压器P1#”和“油温过高”属于单个词,不应被分开,即,将句子切分为:变压器P1#/的/绝缘油/油温过高/,/温度/达到/102°。提高分词准确率,进一步地调用jieba.posseg函数可以实现带词性的分词。
词抽取:将变压器P1#、绝缘油、油温过高、温度、达到102°逐一在领域专业术语集中进行匹配,得到与目标项相匹配的词,将与目标项相匹配的词作为知识图谱的实体节点、属性名和属性值。对于上述例子,最终抽取出的实体节点有:“变压器P1#”、“绝缘油”、“油温过高”;属性名:“温度”;属性值:“102°”。
共指消解用于将文本类的历史故障内容信息中具有相同含义但表述不同的实体/属性进行合并,由于个人习惯、工作经验和圈内流行用语等因素,运维人员在记录时不会严格按照规范书写,所以针对同一实体/属性经常会出现不同的名称,如“变压器油冷系统失效”和“变压器冷却系统失效”,其中“油冷系统”和“冷却系统”属于同一实体,需要在知识图谱中合并为一个节点,共指消解的过程包括:
根据词性分类:在文本类的历史故障内容信息中,如果两个词属于同一个实体/属性,则两个词的词性相同,因此可以将文本类的历史故障内容信息中表示实体/属性的词按词性分类成不同的词性集合,然后对每个词性集合进行共指消解。
对每个词性集合进行共指消解采用余弦相似度计算的方式,余弦相似度计算:使用word2vec算法将每个词性集合中的词向量化,向量维度选择100维,得到词向量Vword=(v1,v2,v3,…,v100),通过
Figure BDA0003897771820000091
分别计算词向量之间的余弦值,根据余弦定理可知,余弦值越大,两个词向量间的夹角越小,从而判定两个词越相似度,当余弦值达到某个阈值时,就认为两个词属于同一个实体/属性。例如,当cosθ≥0.86时,认为两个词属于同一个实体/属性。
通过余弦相似度计算形成同义词集:将属于同一个实体/属性的词整理成集合,从而形成若干个同义词集,基于电力变压器领域专业术语集在每个同义词集中选择标准化的词作为知识图谱的实体/属性。
Word2Vec算法通过词嵌入把非常稀疏的高维词向量嵌入到一个低维空间,且不会丢失信息,达到降维操作,通过降维之后,语义相似的词在向量空间中位置十分相近。
关系抽取的具体过程为:如图3所示,基于BERT(Bidirectional EncoderRepresentations from Transformers)模型进行文本类的历史故障内容信息中的关系抽取,采用所述BERT模型的具体过程包括:
预训练:采用无监督的方式训练,通过大量不同类型的未标注数据对BERT模型参数进行训练,得到初步参数,进而基于初步参数得到通用模型;
模型调整:根据预设场景,输入相关的有标签数据,本例输入对应的有标签故障文本数据,对所述通用模型进行训练,得到目标BERT模型;
基于所述目标BERT模型得到文本类的历史故障内容信息中的关系信息。BERT模型能够实现融合左右上下文信息的深层双向语言表征,BERT模型具有统一的架构,可以用来完成不同的训练任务,带来更大的使用范围。
数据整合的具体过程包括:将文本类的历史故障内容信息中的所述实体、所述关系信息整理成“实体-关系-实体”的三元组,例如,CSV文件,每一实体节点名称和属性作为单个CSV文件,节点间的每种关系也是一个CSV文件,关系通过实体ID创建,得到所述所述基础元素数据。
在一种可能的实施方式中,在所述基于所述基础元素数据构建变压器故障图谱的步骤之后,还包括:
基于所述多源异构数据库获取所述变压器的基础属性信息;
将所述目标实体与其相匹配的目标基础属性信息进行关联,得到显示所述变压器的基础属性信息的变压器故障图谱。
示例性的,基于多源异构数据源,获取变压器型号、规格、厂家、图片等信息,并将变压器型号、规格、厂家、图片等信息与构建知识图谱的目标实体相互关联,对所述初始知识图谱进行优化,使可视化效果更好。
示例性的,上述关联过程为:在python代码编写时,进行相关变压器实体背景设置代码行编写,可将每个变压器实体的背景设置为相对应图片;在python代码编写时,进行变压器实体注释代码行编写,将相关变压器型号、规格、厂家等信息进行显示。
在一种可能的实施方式中,所述方法,还包括:
基于完整性维度、一致性维度、准确性维度以及时效性维度对所述变压器故障图谱进行评估,得到评估结果;
针对所述评估结果构建修正策略,并根据所述修正策略修改用于构建所述变压器故障图谱的基础元素数据;
基于修改后的基础元素数据生成修正后的变压器故障图谱。
示例性的,采用改进的抽样检测方法对知识图谱进行抽样检测,根据抽样结果,选定三个维度专家分别在完整性维度、一致性维度、准确性维度以及时效性维度对已生成的知识图谱给出“高”,“中”,“低”的概率,假设得到初始概率分布表,如表1所示。
表1各个维度的概率分布
Figure BDA0003897771820000111
基于PERT(Program Evaluation and Review Technique)分布对家意见进行融合。
得到合成后最终的概率分布表,如表2所示。
表2合成后各个维度的概率分布
Figure BDA0003897771820000112
经过维度专家合成得到各个维度的概率分布,通过分析最终的概率分布,得到评估结果;
由所述评估结果可知,已生成的知识图谱在完整性维度方面存在欠缺,需要对缺失关系进行补全,缺失关系补全是指对变压器故障知识图谱中关系不完整的三元组进行补全,在关系抽取过程中,因为数据集大小和模型的缺陷,实体间可能存在关系缺失,进而影响知识图谱的质量,通过对缺失的关系进行补全来改善变压器故障图谱。
采用表示模型中的NTN模型(Neural Tensor Network)来预测实体间存在什么样的关系,进而补全缺失的关系。
NTN模型是一个基于已有数据库预测出额外真实信息的模型,通过把知识图谱中的实体表示成向量,实体间的每一种关系都用一个张量神经网络来表示,在判断实体间是否存在何种关系时,通过把实体向量输入到不同张量神经网络中得到置信分数,分数最高的即为可能的关系,例如:E=(e1:‘绝缘油’,e2:‘绝缘油渗漏’),R=(‘故障’,‘解决方案’,‘维修人员’),通过张量神经网络预测发现g(e1,R,e2)=(‘绝缘油’,‘故障’,‘绝缘油渗漏’)得分最高,则判定为两者间的关系是‘故障’。
具体的,定义置信度得分函数如下:
Figure BDA0003897771820000121
其中g表示对关系R的打分,f=tanh是隐藏层的激活函数,e1,e2∈Rd是实体向量,
Figure BDA0003897771820000122
表示张量,k表示关系数量,维数d=100,VR∈Rk×2d是第一层网络的权重,
Figure BDA0003897771820000123
是第二层网络的权重,bR∈Rk是偏置向量。
基于定义置信度得分函数补全已生成的变压器故障图谱中缺失的关系,进而得到修正后的变压器故障图谱。
在一种可能的实施方式中,所述方法还包括:
采用主动更新方式下的局部更新机制对所述变压器故障图谱进行更新。
示例性的,通过预测更新频率来确定更新周期,假设在一段时间T内对变压器故障历史数据进行了n次观测,即,n次均匀采样,其中X次观测到了数据的更新(0≤X≤n),则观测频率f=n/T。假设一段时间内某事件发生的次数服从泊松分布,即X服从泊松分布:
Figure BDA0003897771820000131
其中,λ是数据更新的频率,即,单位时间内数据发生更新的次数。因此,通过计算λ可以求出更新周期。假设知识更新频率与观测频率的比值为r:
Figure BDA0003897771820000132
此时,知识更新频率入的计算如下:
Figure BDA0003897771820000133
具体地,假设在两周内(以天为单位,则观测周期T=14)观测源数据10次(n=10),观测频率:
Figure BDA0003897771820000134
其中有7次(X=7)观测到数据更新,则:
Figure BDA0003897771820000135
因此可以得到λ=f×r=1/2,即,每2天更新一次。如果仅在一个观测周期内得到的X并不准确,随机性比较大,进而通过多个观察周期得到多个Xi,取平均值
Figure BDA0003897771820000136
得到的λ更准确,根据所述λ完成对所述变压器故障图谱进行更新。
在一种可能的实施方式中,如图3所示,本申请提供了一种变压器故障图谱构建系统,所述系统包括:
数据采集模块201,用于从多源异构数据库中抽取变压器的历史故障数据,其中,所述历史故障数据包括历史故障内容信息和数据结构类型,所述数据结构类型包括结构化数据结构和非结构化数据结构;
分析模块202,用于根据所述数据结构类型确定所述历史故障数据的分析方法,并对所述历史故障内容信息进行分析,得到基础元素数据,其中,所述基础元素数据包括实体、关系、属性;
图谱生成模块203,用于基于所述基础元素数据构建变压器故障图谱。
示例性的,如图4所示,一种变压器故障图谱构建系统,还包括:优化模块204,用于基于所述多源异构数据库获取所述变压器的基础属性信息,并将所述目标实体与其相匹配的目标基础属性信息进行关联,得到显示所述变压器的基础属性信息的变压器故障图谱;
质量评估与控制模块205,用于基于完整性维度、一致性维度、准确性维度以及时效性维度对所述变压器故障图谱进行评估,得到评估结果,并针对所述评估结果构建修正策略,并根据所述修正策略修改用于构建所述变压器故障图谱的基础元素数据,再基于修改后的基础元素数据生成修正后的变压器故障图谱。
一种可能的实施方式中,如图5所示,本申请实施例提供了一种电子设备300,包括:包括存储器310、处理器320及存储在存储器310上并可在处理器320上运行的计算机程序311,处理器320执行计算机程序311时,实现:从多源异构数据库中抽取变压器的历史故障数据,其中,所述历史故障数据包括历史故障内容信息和数据结构类型,所述数据结构类型包括结构化数据结构和非结构化数据结构;根据所述数据结构类型确定所述历史故障数据的分析方法,并对所述历史故障内容信息进行分析,得到基础元素数据,其中,所述基础元素数据包括实体、关系、属性;基于所述基础元素数据构建变压器故障图谱的步骤。
在一种可能的实施方式中,如图6所示,本申请实施例提供了一种计算机可读存储介质400,其上存储有计算机程序411,该计算机程序411被处理器执行时实现:从多源异构数据库中抽取变压器的历史故障数据,其中,所述历史故障数据包括历史故障内容信息和数据结构类型,所述数据结构类型包括结构化数据结构和非结构化数据结构;根据所述数据结构类型确定所述历史故障数据的分析方法,并对所述历史故障内容信息进行分析,得到基础元素数据,其中,所述基础元素数据包括实体、关系、属性;基于所述基础元素数据构建变压器故障图谱的步骤。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本领域普通技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个计算装置上,或者分布在多个计算装置所组成的网络上,可选地,他们可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里上述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (10)

1.一种变压器故障图谱构建方法,其特征在于,包括:
从多源异构数据库中抽取变压器的历史故障数据,其中,所述历史故障数据包括历史故障内容信息和数据结构类型,所述数据结构类型包括结构化数据结构和非结构化数据结构;
根据所述数据结构类型确定所述历史故障数据的分析方法,并对所述历史故障内容信息进行分析,得到基础元素数据,其中,所述基础元素数据包括实体、关系、属性;
基于所述基础元素数据构建变压器故障图谱。
2.如权利要求1所述的变压器故障图谱构建方法,其特征在于,所述从多源异构数据库中抽取变压器的历史故障数据的步骤,包括:
按照预设拆分逻辑将所述变压器拆分为至少两个目标元件;
从多源异构数据库中抽取所述目标元件对应的目标故障内容信息和数据来源;
基于所述数据来源确定所述目标故障数据的数据结构类型,并将所述数据结构类型与所述目标故障内容信息进行绑定,得到所述变压器的历史故障数据。
3.如权利要求1所述的变压器故障图谱构建方法,其特征在于,所述根据所述数据结构类型确定所述历史故障数据的分析方法,并对所述历史故障内容信息进行分析,得到基础元素数据的步骤,包括:
当所述数据结构类型为结构化数据结构时,将所述历史故障内容信息按照预设对应关系导入图像数据库,得到所述基础元素数据,所述图像数据库用于生成图谱。
4.如权利要求1所述的变压器故障图谱构建方法,其特征在于,所述根据所述数据结构类型确定所述历史故障数据的分析方法,并对所述历史故障内容信息进行分析,得到基础元素数据的步骤,还包括:
当所述数据结构类型为非结构化数据结构时,对所述历史故障内容信息进行筛选,得到所述历史故障内容信息包含的初始实体与初始属性;
对所述初始实体与所述初始属性进行共指消解,得到目标实体与目标属性,所述共指消解的过程为将所述历史故障内容信息中具有相同含义但表述不同的初始实体/所述初始属性进行合并;
结合所述目标实体与所述目标属性在所述历史故障内容信息中的左右上下文信息,确定所述目标实体与所述目标属性的关系信息;
根据所述关系信息、所述目标实体与所述目标属性,得到所述基础元素数据。
5.如权利要求4所述的变压器故障图谱构建方法,其特征在于,在所述基于所述基础元素数据构建变压器故障图谱的步骤之后,还包括:
基于所述多源异构数据库获取所述变压器的基础属性信息;
将所述目标实体与其相匹配的目标基础属性信息进行关联,得到显示所述变压器的基础属性信息的变压器故障图谱。
6.如权利要求1所述的变压器故障图谱构建方法,其特征在于,所述方法,还包括:
基于完整性维度、一致性维度、准确性维度以及时效性维度对所述变压器故障图谱进行评估,得到评估结果;
针对所述评估结果构建修正策略,并根据所述修正策略修改用于构建所述变压器故障图谱的基础元素数据;
基于修改后的基础元素数据生成修正后的变压器故障图谱。
7.如权利要求1所述的变压器故障图谱构建方法,其特征在于,所述方法还包括:
采用主动更新方式下的局部更新机制对所述变压器故障图谱进行更新。
8.一种变压器故障图谱构建系统,其特征在于,所述系统包括:
数据采集模块,用于从多源异构数据库中抽取变压器的历史故障数据,其中,所述历史故障数据包括历史故障内容信息和数据结构类型,所述数据结构类型包括结构化数据结构和非结构化数据结构;
分析模块,用于根据所述数据结构类型确定所述历史故障数据的分析方法,并对所述历史故障内容信息进行分析,得到基础元素数据,其中,所述基础元素数据包括实体、关系、属性;
图谱生成模块,用于基于所述基础元素数据构建变压器故障图谱。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至7中任一项所述的变压器故障图谱构建方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7中任一项所述的变压器故障图谱构建方法的步骤。
CN202211278821.2A 2022-10-19 2022-10-19 一种变压器故障图谱构建方法及相关设备 Pending CN115577108A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211278821.2A CN115577108A (zh) 2022-10-19 2022-10-19 一种变压器故障图谱构建方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211278821.2A CN115577108A (zh) 2022-10-19 2022-10-19 一种变压器故障图谱构建方法及相关设备

Publications (1)

Publication Number Publication Date
CN115577108A true CN115577108A (zh) 2023-01-06

Family

ID=84584385

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211278821.2A Pending CN115577108A (zh) 2022-10-19 2022-10-19 一种变压器故障图谱构建方法及相关设备

Country Status (1)

Country Link
CN (1) CN115577108A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116108183A (zh) * 2023-02-24 2023-05-12 武汉理工大学 机电设备故障诊断方法、装置、电子设备和存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116108183A (zh) * 2023-02-24 2023-05-12 武汉理工大学 机电设备故障诊断方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
US11640494B1 (en) Systems and methods for construction, maintenance, and improvement of knowledge representations
Wang et al. A survey on the development status and application prospects of knowledge graph in smart grids
EP4075303A1 (en) Method and apparatus for obtaining poi state information
CN117273133A (zh) 配电网多源异构数据知识图谱的构建方法
CN116881675B (zh) 一种基于贝叶斯算法的电力设备状态监测方法
Xu et al. Data-driven causal knowledge graph construction for root cause analysis in quality problem solving
JP2009289020A (ja) Ft図作成プログラム、ft図作成装置、記録媒体及びft図作成方法
CN116361474A (zh) 一种电力设备缺陷文本知识图谱更新方法及装置
CN115577108A (zh) 一种变压器故障图谱构建方法及相关设备
CN115858807A (zh) 一种基于航空装备故障知识图谱的问答系统
Gao et al. Mining and Visualizing Cost and Schedule Risks from News Articles with NLP and Network Analysis
CN115660695A (zh) 客服人员标签画像构建方法、装置、电子设备及存储介质
CN114325384A (zh) 一种基于电机故障知识的众包采集系统及方法
Drury A Text Mining System for Evaluating the Stock Market's Response To News
Balasundaram et al. Social Media Monitoring Of Airbnb Reviews Using AI: A Sentiment Analysis Approach For Immigrant Perspectives In The UK
CN117473083B (zh) 一种基于提示知识和混合神经网络的方面级情感分类模型
CN118132738B (zh) 针对桥梁检评文本的抽取式问答方法
CN118485046B (zh) 标注数据处理方法和装置、电子设备、计算机存储介质
Zhang Sustainable Scientific and Technological Talents Recommendation Method Based on Recommendation Algorithm
Sinha et al. Web and social media analytics towards enhancing urban transportations: A case for Bangalore
CN118364336A (zh) 一种易投诉用户预测方法、系统及存储介质
CN118690020A (zh) 电力设备缺陷检测方法、装置、设备、存储介质和程序产品
CN118069892A (zh) 思维图谱生成方法、装置、设备及介质
CN116975289A (zh) 基于语义信息的文本属性级情感分类方法及相关设备
CN118551058A (zh) 继电保护非结构化文档信息处理方法、装置和计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination