CN114168740A - 基于图卷积神经网络和知识图谱的变压器并发性故障诊断方法 - Google Patents

基于图卷积神经网络和知识图谱的变压器并发性故障诊断方法 Download PDF

Info

Publication number
CN114168740A
CN114168740A CN202111180570.XA CN202111180570A CN114168740A CN 114168740 A CN114168740 A CN 114168740A CN 202111180570 A CN202111180570 A CN 202111180570A CN 114168740 A CN114168740 A CN 114168740A
Authority
CN
China
Prior art keywords
fault
transformer
neural network
knowledge graph
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111180570.XA
Other languages
English (en)
Inventor
王波
马富齐
冯磊
李志坚
郑渠岸
张驰
魏菊芳
刘力卿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
State Grid Tianjin Electric Power Co Ltd
Electric Power Research Institute of State Grid Tianjin Electric Power Co Ltd
Original Assignee
Wuhan University WHU
State Grid Tianjin Electric Power Co Ltd
Electric Power Research Institute of State Grid Tianjin Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU, State Grid Tianjin Electric Power Co Ltd, Electric Power Research Institute of State Grid Tianjin Electric Power Co Ltd filed Critical Wuhan University WHU
Priority to CN202111180570.XA priority Critical patent/CN114168740A/zh
Publication of CN114168740A publication Critical patent/CN114168740A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Tourism & Hospitality (AREA)
  • Computing Systems (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Marketing (AREA)
  • Mathematical Physics (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Game Theory and Decision Science (AREA)
  • Animal Behavior & Ethology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于图卷积神经网络和知识图谱的变压器并发性故障诊断方法,首先构造出变压器故障知识图谱以凸显其中故障设备或部件的关联性;然后搭建轻量化图卷积神经网络模型,结合变压器故障知识图谱,设计相应的图卷积神经网络,充分利用其邻接矩阵来表征单一故障节点间的拓扑信息,有效地挖掘各单一故障间的关联关系,并通过深层图卷积架构建立并发性故障中各故障设备或部件的映射关系,从而对并发性故障进行充分建模,确定发生并发性故障的设备或部件,本发明优点是:通过与标准的图卷积神经网络进行对比,验证了轻量化图卷积神经网络在挖掘并发性故障的有效性。

Description

基于图卷积神经网络和知识图谱的变压器并发性故障诊断 方法
技术领域
本发明涉及变压器故障诊断方法的技术领域,更具体地说是变压器并发性故障诊断方法的技术领域。
背景技术
目前,中国已建成世界上规模最大的电网,建设总量巨大。然而,随着电网规模的不断扩大,电网内部的电力设备的数量和种类都不断增多。电网作为一个庞大而复杂的系统,故障概率和故障严重程度相比于简单系统和随机系统都更高,并且故障的出现具备随机性、继发性、并发性、爆发性、隐蔽性等性质,大多数情况下会同时发生多个故障。这种故障称为并发性故障,也称复合故障或者多重故障,并发性故障的故障形式多样,不同的场景下的并发性故障完全不同,故障特征极其复杂,诊断难度大。因此,研究一种变压器并发性故障诊断方法对于输变电设备运维以及电力系统的安全可靠传输具有重要意义。
发明内容
本发明的目的就是为了解决上述之足而提供一种基于图卷积神经网络和知识图谱的变压器并发性故障诊断方法,处用图卷积神经网络在知识图谱上挖掘的准确率和召回率均优于卷积神经网络等传统算法,可以满足并发性故障挖掘的有效性和鲁棒性要求。
本发明为了解决上述技术问题而采用的技术解决方案如下:
基于图卷积神经网络和知识图谱的变压器并发性故障诊断方法,首先构造出变压器故障知识图谱以凸显其中故障设备或部件的关联性,知识图谱由节点和边构成,节点表示单一故障特征,而边表示单一故障间的关联关系,该故障知识图谱中既蕴含单一故障的特征信息也蕴含单一故障间的关联关系信息;然后搭建轻量化图卷积神经网络模型,结合变压器故障知识图谱,设计相应的图卷积神经网络,充分利用其邻接矩阵来表征单一故障节点间的拓扑信息,有效地挖掘各单一故障间的关联关系,并通过深层图卷积架构建立并发性故障中各故障设备或部件的映射关系,从而对并发性故障进行充分建模,确定发生并发性故障的设备或部件。
优选的,本专利变压器故障知识图谱的模式层分为部件层和故障层,所述部件层定义了变压器的所有可能发生故障的部件及各部件之间的连接关系,该部件层反映出变压器各部件之间的一阶连接关系;所述故障层定义了变压器所有可能发生故障的类型以及各故障类型之间的相似性和从属关系,故障层以变压器状态评价导则为根据,反映出各故障之间的逻辑关系,本质上是以变压器状态评价导则为数据源的知识图。
优选的,本专利数据层三元组抽取是指在模式层的知识组织架构的指导下,通过知识抽取方法从非结构化数据中获取得到实体和实体间关系以及属性的结构化知识。
优选的,本专利所述数据层的构建方式根据数据源的类型而定,本方法所使用的数据源是结构化的excel表格,其中的某些字段如工作内容含有非结构化的文本内容,故知识抽取分为两个部分,第一部分为excel表格结构化数据抽取,第二部分为工作内容字段的非结构化数据抽取。
优选的,本专利所述知识抽取包括实体识别、关系抽取、事件抽取和共指消解。
优选的,本专利所述实体识别采用基于BiLSTM—RCF的中文实体识别算法来实现检修内容文本的中文命名实体识别并解决专业术语集中、实体关系表述模糊、实体之间界限不清晰的问题,其具体步骤为:步骤一:将句子x中的每个单词表示为一个向量,其中包括单词的嵌入和字符的嵌入,字符的嵌入是随机初始化的,单词的嵌入通常是从一个预先训练的单词嵌入文件导入的,所有的嵌入将在训练过程中进行微调;步骤二:BiLSTM-CRF模型的输入是这些嵌入,输出是句子x中的单词的预测标签,共有五类标签,B-Equipment,I-Equipment,B-Fault,I-Fault,O;其中B-Equipment和I-Equipment指代设备或部件标签,B-Fault,I-Fault则指代故障类型标签,O指代其他字符标签;步骤三:将BiLSTM层预测的所有分数输入CRF层,在CRF层中,选择预测得分最高的合法标签序列作为最佳答案。
优选的,本专利所述关系抽取采用基于BiGRU-Attention的实体间关系抽取算法,实体间关系抽取是在命名实体识别的基础上判断实体间是否存在预定义的关系,从而构成一系列三元组知识,在BiLSTM-Attention模型的基础上,采用简化的双向门控循环BiGRU结构降低参数数量,提升模型的训练速度,BiGRU- Attention模型在BiGRU的基础上引入注意力机制,找到对关系分类起重要作用的字,学习得到一个权重,通过赋予这些字更高的权重以提高他们的重要性,从而提高关系抽取的准确率。
优选的,本专利所述变压器故障知识图谱的构建流程如下,首先,通过分析变压器拓扑图确定变压器各个部件及其电气连接和机械连接关系,采用自顶向下的方式,生成变压器故障知识图谱的第一层模式图,确定各部件故障类型及故障后运行方式和检修方式并采用自顶向下的方式设计出变压器故障知识图谱初始的模式层;然后,在模式层的指导下,采用自底向上的方式,基于图卷积神经网络的方法对运维检修记录进行实体、关系、属性3个要素的抽取,形成高质量的知识表达;最后,将抽取到的故障部件和故障时间作为属性节点添加到模式层中,完成模式层的更新,至此完成了变压器故障知识图谱的构建,并将变压器故障知识图谱以三元组的方式存储。
优选的,本专利所述变压器故障知识图谱共有故障部件和故障类型两种实体,共有故障部件—故障部件、故障部件—故障类型、故障类型—故障类型三种关系。
优选的,本专利所述变压器故障知识图谱的模式层主要由故障部件、故障时间、故障地点等3个核心要素以及他们之间的相互关系构成,首先,根据变压器结构图编制而成故障知识图谱的第一层模式层,提炼出变压器的部件之间的关系;然后,根据变压器检修导则,提炼出变压器的部件与故障之间的关系,形成知识图谱模式层的第二层。
本发明采用上述技术解决方案所能达到的有益效果是:本方法通过引入知识图谱,利用其建模关系型网络的能力,从运维数据中抽取得到一个变压器故障关系型网络;同时基于图卷积神经网络,通过大量抽取变压器故障知识图谱子图并进行标记,训练出一个可以准确用于并发性故障挖掘的图卷积神经网络。通过与标准的图卷积神经网络进行对比,验证了轻量化图卷积神经网络在挖掘并发性故障的有效性。
附图说明
图1为本发明中部件层连接关系图;
图2为本发明中故障层连接关系图;
图3为本发明中变压器故障知识图谱构建流程图;
图4为本发明中变压器故障知识图谱数据层的构建模式图;
图5为本发明中BiLSTM—RCF的中文实体识别算法流程图;
图6为本发明中BiGRU- Attention 模型结构图;
图7为本发明评价指标中召回率示意图;
图8为本发明中轻量化图卷积神经网络与标准图卷积神经网络对比图;
图9为不同层数的图卷积对比图。
具体实施方式
结合附图所示,基于图卷积神经网络和知识图谱的变压器并发性故障诊断方法,首先构造出变压器故障知识图谱以凸显其中故障设备或部件的关联性,知识图谱由节点和边构成,节点表示单一故障特征,而边表示单一故障间的关联关系,该故障知识图谱中既蕴含单一故障的特征信息也蕴含单一故障间的关联关系信息;然后搭建轻量化图卷积神经网络模型,结合变压器故障知识图谱,设计相应的图卷积神经网络,充分利用其邻接矩阵来表征单一故障节点间的拓扑信息,有效地挖掘各单一故障间的关联关系,并通过深层图卷积架构建立并发性故障中各故障设备或部件的映射关系,从而对并发性故障进行充分建模,确定发生并发性故障的设备或部件。
变压器故障知识图谱的模式层分为部件层和故障层。其中,部件层定义了变压器的所有可能发生故障的部件及各部件之间的连接关系,如图1所示,部件层反映出变压器各部件之间的一阶连接关系。而故障层则定义了变压器所有可能发生故障的类型以及各故障类型之间的相似性和从属关系。如图2所示,故障层以变压器状态评价导则为根据,反映出各故障之间的逻辑关系,本质上是以变压器状态评价导则为数据源的知识图。
数据层三元组抽取是指在模式层的知识组织架构的指导下,通过一系列知识抽取方法从非构化数据中获取得到实体和实体间关系以及属性结构化知识。
变压器故障知识图谱共有故障部件和故障类型两种实体,共有故障部件—故障部件、故障部件—故障类型、故障类型—故障类型三种关系。
采用三元组形式存储和表示知识图谱,相比于传统的结构化关系数据库字段间和记录间的关系需要复杂的计算提取,知识的三元组表示形式则可显式地表达出实体间的关系。
由于变压器故障知识图谱的模式层大部分可以通过变压器拓扑图和变压器运检导则来确定,其中的故障属性节点仍需要从知识层中归纳补充。因此,本方法采用自顶向下与自底向上相结合的方式来构建变压器故障知识图谱。
变压器故障知识图谱的构建流程如图3所示,其具体步骤为:首先,通过分析变压器拓扑图确定电力变压器各个部件及其电气连接和机械连接关系,生成知识图谱的第一层模式图,确定各部件故障类型及故障后运行方式和检修方式并采用自顶向下的方式设计出知识图谱初始的模式层;然后,在模式层的指导下,采用自底向上的方式,基于图卷积神经网络的方法对运维检修记录进行实体、关系、属性3个要素的抽取,形成高质量的知识表达;最后,将抽取到的故障部件和故障时间作为属性节点添加到模式层中,完成模式层的更新。至此完成了电力变压器故障知识图谱的构建,并将知识图谱以三元组的方式存储。
变压器故障知识图谱的模式层主要由故障部件、故障时间、故障地点等3个核心要素以及他们之间的相互关系构成。首先,根据变压器结构图编制而成变压器故障知识图谱的第一层模式层,提炼出变压器的部件之间的关系;然后,根据变压器检修导则,提炼出变压器的部件与故障之间的关系,形成变压器故障知识图谱模式层的第二层。变压器故障知识图谱共有故障部件和故障类型两种实体,共有故障部件—故障部件、故障部件—故障类型、故障类型—故障类型三种关系。
如图4所示,数据层的构建方式根据数据源的类型而定,对于结构化数据直接使用图映射或D2R转换即可,半结构化数据则需使用包装器,而对于非结构化的文本数据则需使用专用的信息抽取方法。
本方法所使用的数据源是结构化的excel表格,但是其中的某些字段如工作内容含有非结构化的文本内容。故本知识抽取分为两个部分,第一部分为excel表格结构化数据抽取,第二部分为工作内容等字段的非结构化数据抽取。
结构化数据抽取:表格中的工作时间、工作地点等字段都是结构化的数据,他们各项之间存在明确的关系名称和对应关系。所以直接将其转化为RDF的图数据格式即可,本方法使用常见的R2RML(RDB2RDF)映射语言完成映射。
非结构化数据抽取:非结构化数据抽取则较为复杂,可以分为以下子任务:实体识别、关系抽取、事件抽取、共指消解。本方法所涉及的文本内容来自于检修记录excel表格的工作内容字段,该文本内容成分和事件都较为简单,只需要进行实体识别、关系抽取、共指消解等三部分任务就能完成数据层的构建,并且采用经典的神经网络算法即可。
基于BiLSTM—RCF的中文实体识别算法:由于检修内容文本存在专业术语集中、实体关系表述模糊、实体之间界限不清晰等问题,文本内容短、数量多等特点,因此不适合采用手工规则模板进行实体分类。本方法引入基于BiLSTM—RCF的中文实体识别算法来实现检修内容文本的中文命名实体识别并解决实体之间界限不清晰等问题。其具体步骤为:步骤一:将句子x中的每个单词表示为一个向量,其中包括单词的嵌入和字符的嵌入。字符嵌入是随机初始化的。单词嵌入通常是从一个预先训练的单词嵌入文件导入的。所有的嵌入将在训练过程中进行微调。步骤二:BiLSTM-CRF模型的输入是这些嵌入,输出是句子x中的单词的预测标签,在本章中,一共只有五类标签,B-Equipment,I-Equipment,B-Fault,I-Fault,O;其中B-Equipment和I-Equipment指代设备或部件标签,B-Fault,I-Fault则指代故障类型标签,O指代其他字符标签。步骤三:将BiLSTM层预测的所有分数输入CRF层。在CRF层中,选择预测得分最高的合法标签序列作为最佳答案。模型结构如图5所示。
基于BiGRU-Attention的实体间关系抽取算法:实体间关系抽取(named entityrelation extraction, NRE)是在命名实体识别的基础上判断实体间是否存在预定义的关系,从而构成一系列三元组知识。在BiLSTM-Attention[23]模型的基础上,采用简化的双向门控循环(BiGRU)结构降低参数数量,提升模型的训练速度。BiGRU- Attention 模型结构如图6所示。BiGRU- Attention模型在BiGRU的基础上引入注意力机制,找到对关系分类起重要作用的字,学习得到一个权重,通过赋予这些字更高的权重以提高他们的重要性,从而提高关系抽取的准确率。
评价指标
本方法引入采用准确率(Precision)、召回率(Recall)作为本方法所提基于图卷积神经网络和知识图谱的变压器并发性故障诊断方法的评价指标。其中,准确率是指正确目标在模型检测到的目标总数中所占的比例,通常也被称为查准率;召回率是指模型检测到的正确目标数与正确目标总数的比率,也称为召回率。
如图7所示,假设在正确的样本库中,模型检测到的并发性故障数量为A,未检测到的并发性故障数量为B;在错误的样本库中,模型没检测到的并发性故障数量为C,检测到的并发性故障数量为D,则准确率P与召回率R的计算公式为:
Figure DEST_PATH_GDA0003474691390000101
Figure DEST_PATH_GDA0003474691390000102
仿真分析
基于PyTorch深度学习计算环境,分别设置轻量化图卷积神经网络与标准图卷积神经网络的对比实验、不同层数的轻量化图卷积神经网络的对比实验,对本方法进行验证。模型的相关参数如下表1所示:
表1 模型的参数设置
模型参数 模型参数取值
嵌入方式 60维字向量+60维词向量
CNN层数 5
随机失活率 0.5
训练批数 15
学习率 0.0016
学习率衰减率 0.04
优化器 Adamax
每层卷积核数量 128
轻量化图卷积神经网络与标准图卷积神经网络的对比实验:将训练数据分别导入轻量化图卷积神经网络和标准图卷积神经网络中,轻量化图卷积神经网络和标准图卷积神经网络的训练损失如下表2所示:
表2 训练损失对比
训练次数(Epoch) 轻量化图卷积(LightGCN) 标准图卷积(GCN)
50 0.02 0.261
200 0.0056 0.032
400 0.0037 0.0137
600 0.0036 0.0096
800 0.0036 0.0065
可以看出,轻量化图卷积神经网络训练时的收敛速度远远快于标准图卷积神经网络,最终轻量化图卷积神经网络的训练损失小于标准图卷积神经网络,表明轻量化图卷积神经网络的收敛速度和收敛效果均好于标准图卷积神经网络。
训练完成后,我们使用测试集对两种算法进行测试,得出召回率如下表3所示:
表3 召回率对比
训练次数(Epoch) 轻量化图卷积(LightGCN) 标准图卷积(GCN)
50 0.02 0.261
200 0.0056 0.032
400 0.0037 0.0137
600 0.0036 0.0096
800 0.0036 0.0065
从上表中可以看出,轻量化图卷积神经网络的召回率好于标准图卷积神经网络,表明轻量化图卷积神经网络对并发性故障的挖掘效果好于标准图卷积神经网络。
轻量化图卷积神经网络与标准图卷积神经网络对比如图8所示,可以看出轻量化图卷积神经网络的并发性故障挖掘效果确实好于标准图卷积神经网络,并且轻量化图卷积神经网络的收敛速度更快,训练难度更小,在实用性和易于性方面,轻量化图卷积神经网络优于标准图卷积神经网络。
不同层数的轻量化图卷积神经网络的对比实验:针对不同层数的轻量化图卷积神经网络模型进行对比实验,其结果如下表4所示,可以看出当卷积层数为三层时效果最佳。
表4 轻量化图卷积训练批次为200次时的对比
卷积层层数 训练损失 平均精度均值(mAP/%)
1 0.0078 79.4
2 0.0063 81.1
3 0.0043 82.3
4 0.0061 81.9
不同层数的图卷积神经网络对比如图9所示,可以看出,不管是轻量化图卷积神经网络还是标准图卷积神经网络,在网络层数小于等于三层时,增加网络层数可以有效提高挖掘的准确率。网络层数大于三层后,由于发生了过拟合,增加网络层数反而使得挖掘效果下降,甚至不收敛。故当图卷积层数为三层时,挖掘可以取得最好的效果。

Claims (10)

1.基于图卷积神经网络和知识图谱的变压器并发性故障诊断方法,其特征在于:首先构造出变压器故障知识图谱以凸显其中故障设备或部件的关联性,知识图谱由节点和边构成,节点表示单一故障特征,而边表示单一故障间的关联关系,该故障知识图谱中既蕴含单一故障的特征信息也蕴含单一故障间的关联关系信息;然后搭建轻量化图卷积神经网络模型,结合变压器故障知识图谱,设计相应的图卷积神经网络,充分利用其邻接矩阵来表征单一故障节点间的拓扑信息,有效地挖掘各单一故障间的关联关系,并通过深层图卷积架构建立并发性故障中各故障设备或部件的映射关系,从而对并发性故障进行充分建模,确定发生并发性故障的设备或部件。
2.根据权利要求1所述的基于图卷积神经网络和知识图谱的变压器并发性故障诊断方法,其特征在于:变压器故障知识图谱的模式层分为部件层和故障层,所述部件层定义了变压器的所有可能发生故障的部件及各部件之间的连接关系,该部件层反映出变压器各部件之间的一阶连接关系;所述故障层定义了变压器所有可能发生故障的类型以及各故障类型之间的相似性和从属关系,故障层以变压器状态评价导则为根据,反映出各故障之间的逻辑关系,本质上是以变压器状态评价导则为数据源的知识图。
3.根据权利要求1所述的基于图卷积神经网络和知识图谱的变压器并发性故障诊断方法,其特征在于:数据层三元组抽取是指在模式层的知识组织架构的指导下,通过知识抽取方法从非结构化数据中获取得到实体和实体间关系以及属性的结构化知识。
4.根据权利要求3所述的基于图卷积神经网络和知识图谱的变压器并发性故障诊断方法,其特征在于:所述数据层的构建方式根据数据源的类型而定,本方法所使用的数据源是结构化的excel表格,其中的某些字段如工作内容含有非结构化的文本内容,故知识抽取分为两个部分,第一部分为excel表格结构化数据抽取,第二部分为工作内容字段的非结构化数据抽取。
5.根据权利要求3所述的基于图卷积神经网络和知识图谱的变压器并发性故障诊断方法,其特征在于:所述知识抽取包括实体识别、关系抽取、事件抽取和共指消解。
6.根据权利要求5所述的基于图卷积神经网络和知识图谱的变压器并发性故障诊断方法,其特征在于:所述实体识别采用基于BiLSTM—RCF的中文实体识别算法来实现检修内容文本的中文命名实体识别并解决专业术语集中、实体关系表述模糊、实体之间界限不清晰的问题,其具体步骤为:步骤一:将句子x中的每个单词表示为一个向量,其中包括单词的嵌入和字符的嵌入,字符的嵌入是随机初始化的,单词的嵌入通常是从一个预先训练的单词嵌入文件导入的,所有的嵌入将在训练过程中进行微调;步骤二:BiLSTM-CRF模型的输入是这些嵌入,输出是句子x中的单词的预测标签,共有五类标签,B-Equipment,I-Equipment,B-Fault,I-Fault,O;其中B-Equipment和I-Equipment指代设备或部件标签,B-Fault,I-Fault则指代故障类型标签,O指代其他字符标签;步骤三:将BiLSTM层预测的所有分数输入CRF层,在CRF层中,选择预测得分最高的合法标签序列作为最佳答案。
7.根据权利要求5所述的基于图卷积神经网络和知识图谱的变压器并发性故障诊断方法,其特征在于:所述关系抽取采用基于BiGRU-Attention的实体间关系抽取算法,实体间关系抽取是在命名实体识别的基础上判断实体间是否存在预定义的关系,从而构成一系列三元组知识,在BiLSTM-Attention模型的基础上,采用简化的双向门控循环BiGRU结构降低参数数量,提升模型的训练速度,BiGRU- Attention模型在BiGRU的基础上引入注意力机制,找到对关系分类起重要作用的字,学习得到一个权重,通过赋予这些字更高的权重以提高他们的重要性,从而提高关系抽取的准确率。
8.根据权利要求1所述的基于图卷积神经网络和知识图谱的变压器并发性故障诊断方法,其特征在于:所述变压器故障知识图谱的构建流程如下,首先,通过分析变压器拓扑图确定变压器各个部件及其电气连接和机械连接关系,采用自顶向下的方式,生成变压器故障知识图谱的第一层模式图,确定各部件故障类型及故障后运行方式和检修方式并采用自顶向下的方式设计出变压器故障知识图谱初始的模式层;然后,在模式层的指导下,采用自底向上的方式,基于图卷积神经网络的方法对运维检修记录进行实体、关系、属性3个要素的抽取,形成高质量的知识表达;最后,将抽取到的故障部件和故障时间作为属性节点添加到模式层中,完成模式层的更新,至此完成了变压器故障知识图谱的构建,并将变压器故障知识图谱以三元组的方式存储。
9.根据权利要求1所述的基于图卷积神经网络和知识图谱的变压器并发性故障诊断方法,其特征在于:所述变压器故障知识图谱共有故障部件和故障类型两种实体,共有故障部件—故障部件、故障部件—故障类型、故障类型—故障类型三种关系。
10.根据权利要求1所述的基于图卷积神经网络和知识图谱的变压器并发性故障诊断方法,其特征在于:所述变压器故障知识图谱的模式层主要由故障部件、故障时间、故障地点等3个核心要素以及他们之间的相互关系构成,首先,根据变压器结构图编制而成故障知识图谱的第一层模式层,提炼出变压器的部件之间的关系;然后,根据变压器检修导则,提炼出变压器的部件与故障之间的关系,形成知识图谱模式层的第二层。
CN202111180570.XA 2021-10-11 2021-10-11 基于图卷积神经网络和知识图谱的变压器并发性故障诊断方法 Pending CN114168740A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111180570.XA CN114168740A (zh) 2021-10-11 2021-10-11 基于图卷积神经网络和知识图谱的变压器并发性故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111180570.XA CN114168740A (zh) 2021-10-11 2021-10-11 基于图卷积神经网络和知识图谱的变压器并发性故障诊断方法

Publications (1)

Publication Number Publication Date
CN114168740A true CN114168740A (zh) 2022-03-11

Family

ID=80476819

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111180570.XA Pending CN114168740A (zh) 2021-10-11 2021-10-11 基于图卷积神经网络和知识图谱的变压器并发性故障诊断方法

Country Status (1)

Country Link
CN (1) CN114168740A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115792729A (zh) * 2022-11-30 2023-03-14 广东粤电科试验检测技术有限公司 一种变压器复合故障诊断方法、装置、设备和存储介质
CN117009789A (zh) * 2023-09-27 2023-11-07 通用技术集团机床工程研究院有限公司 机床的故障预测方法、装置、电子设备及存储介质
CN117114657A (zh) * 2023-10-23 2023-11-24 国网江西省电力有限公司超高压分公司 基于电力设备巡检知识图谱的故障信息预警系统及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020140386A1 (zh) * 2019-01-02 2020-07-09 平安科技(深圳)有限公司 基于TextCNN知识抽取方法、装置、计算机设备及存储介质
CN112269901A (zh) * 2020-09-14 2021-01-26 合肥中科类脑智能技术有限公司 一种基于知识图谱的故障判别推理方法
CN113283027A (zh) * 2021-05-20 2021-08-20 南京航空航天大学 一种基于知识图谱和图神经网络的机械故障诊断方法
CN113360679A (zh) * 2021-07-08 2021-09-07 北京国信会视科技有限公司 一种基于知识图谱技术的故障诊断方法
CN113377567A (zh) * 2021-06-28 2021-09-10 东南大学 一种基于知识图谱技术的分布式系统故障根因溯源方法
CN113449072A (zh) * 2021-06-15 2021-09-28 南京航空航天大学 基于深度学习的挖掘机故障知识图谱的构建方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020140386A1 (zh) * 2019-01-02 2020-07-09 平安科技(深圳)有限公司 基于TextCNN知识抽取方法、装置、计算机设备及存储介质
CN112269901A (zh) * 2020-09-14 2021-01-26 合肥中科类脑智能技术有限公司 一种基于知识图谱的故障判别推理方法
CN113283027A (zh) * 2021-05-20 2021-08-20 南京航空航天大学 一种基于知识图谱和图神经网络的机械故障诊断方法
CN113449072A (zh) * 2021-06-15 2021-09-28 南京航空航天大学 基于深度学习的挖掘机故障知识图谱的构建方法
CN113377567A (zh) * 2021-06-28 2021-09-10 东南大学 一种基于知识图谱技术的分布式系统故障根因溯源方法
CN113360679A (zh) * 2021-07-08 2021-09-07 北京国信会视科技有限公司 一种基于知识图谱技术的故障诊断方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
徐幼祥;原玲;范宝杰;: "基于图卷积慕课成绩预测模型", 电视技术, no. 18, 25 September 2019 (2019-09-25) *
郭成;徐成现;蒋维;王波: "面向低压配电网络拓扑的知识图谱构建与检索分析方法", 电力科学与工程, vol. 37, no. 007, 31 December 2021 (2021-12-31) *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115792729A (zh) * 2022-11-30 2023-03-14 广东粤电科试验检测技术有限公司 一种变压器复合故障诊断方法、装置、设备和存储介质
CN117009789A (zh) * 2023-09-27 2023-11-07 通用技术集团机床工程研究院有限公司 机床的故障预测方法、装置、电子设备及存储介质
CN117114657A (zh) * 2023-10-23 2023-11-24 国网江西省电力有限公司超高压分公司 基于电力设备巡检知识图谱的故障信息预警系统及方法

Similar Documents

Publication Publication Date Title
Kim et al. Natural language to SQL: Where are we today?
CN105701253B (zh) 中文自然语言问句语义化的知识库自动问答方法
CN114168740A (zh) 基于图卷积神经网络和知识图谱的变压器并发性故障诊断方法
Xie et al. Topic enhanced deep structured semantic models for knowledge base question answering
CN110096711A (zh) 序列全局关注和局部动态关注的自然语言语义匹配方法
CN107193798A (zh) 一种基于规则的试题类自动问答系统中的试题理解方法
CN113590799B (zh) 一种基于多视角推理的弱监督知识图谱问答方法
CN111143574A (zh) 一种基于少数民族文化知识图谱的查询及可视化系统构建方法
CN111339407B (zh) 一种信息抽取云平台的实现方法
JP5682448B2 (ja) 因果単語対抽出装置、因果単語対抽出方法および因果単語対抽出用プログラム
CN115329088B (zh) 图神经网络事件检测模型的鲁棒性分析方法
CN107436955A (zh) 一种基于Wikipedia概念向量的英文词语相关度计算方法和装置
CN114254093A (zh) 多空间知识增强的知识图谱问答方法及系统
CN114491082A (zh) 基于网络安全应急响应知识图谱特征提取的预案匹配方法
Zhang et al. M-SQL: Multi-task representation learning for single-table Text2sql generation
CN104537280B (zh) 基于文本关系相似性的蛋白质交互关系识别方法
Li et al. Neural factoid geospatial question answering
CN116150757A (zh) 一种基于cnn-lstm多分类模型的智能合约未知漏洞检测方法
Trabelsi et al. SeLaB: Semantic labeling with BERT
Huang et al. Deep entity matching with adversarial active learning
Kilias et al. Idel: In-database entity linking with neural embeddings
Balaji et al. Text summarization using NLP technique
CN114444694A (zh) 一种开放世界知识图谱补全方法及装置
CN112667797B (zh) 自适应迁移学习的问答匹配方法、系统及存储介质
CN112559741B (zh) 核电设备缺陷记录文本分类方法、系统、介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination