CN112101592A - 电力二次设备缺陷诊断方法、系统、设备及存储介质 - Google Patents

电力二次设备缺陷诊断方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN112101592A
CN112101592A CN202010937208.1A CN202010937208A CN112101592A CN 112101592 A CN112101592 A CN 112101592A CN 202010937208 A CN202010937208 A CN 202010937208A CN 112101592 A CN112101592 A CN 112101592A
Authority
CN
China
Prior art keywords
defect
entity
information
power secondary
diagnosis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010937208.1A
Other languages
English (en)
Inventor
刘鹏
季知祥
王晓辉
蔡常雨
刘首文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
State Grid Hubei Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
State Grid Hubei Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, China Electric Power Research Institute Co Ltd CEPRI, State Grid Hubei Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202010937208.1A priority Critical patent/CN112101592A/zh
Publication of CN112101592A publication Critical patent/CN112101592A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Public Health (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Water Supply & Treatment (AREA)
  • Quality & Reliability (AREA)
  • Primary Health Care (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Operations Research (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明属于人工智能领域,公开了一种电力二次设备缺陷诊断方法、系统、设备及存储介质,包括获取电力二次设备的缺陷描述语料;基于预设的实体抽取模型,从缺陷描述语料中抽取用于描述缺陷的实体信息;基于实体信息,遍历预设的缺陷库得到实体信息对应的诊断信息;所述缺陷库包括若干实体信息及若干实体信息分别对应的诊断信息。基于实体抽取模型从缺陷描述语料抽取实体信息,遍历缺陷库得到诊断信息,有效挖掘缺陷描述语料潜在知识与价值,进而提升了电力二次设备缺陷诊断及处置的效率,将过去单独依靠人员分析诊断的工作方式转变为智能手段,促进电力二次设备缺陷诊断及处置尽快从经验型向智能型转变,提升分析决策的智能化水平。

Description

电力二次设备缺陷诊断方法、系统、设备及存储介质
技术领域
本发明属于人工智能领域,涉及一种电力二次设备缺陷诊断方法、系统、设备及存储介质。
背景技术
电力系统中积累了大量关于反映电力二次设备功能缺陷及处理情况的文本数据。这些数据包含了电力二次设备历史上发生的缺陷情况,及相对应的有效解决措施。长期以来,这些数据未能加以有效利用,往往闲置于数据系统中。另一方面,电力二次设备功能缺陷情况繁杂,在缺陷处理过程中,很大程度上依赖于一线运维检修人员的专业知识与经验,诊断难度大。若能将历史积累的缺陷文本数据加以组织和利用,为运维检修人员在将来处理电力二次设备缺陷过程中提供参考建议,对于电力二次设备功能缺陷处理工作具有重要的参考意义。
但是,电力二次设备功能缺陷文本由一线运维检修人员填报,难免会出现专业术语表述口语化且不符合常规语法等现象,增加了文本数据的复杂性,提高了挖掘其潜在知识与价值的难度,增加电力二次设备功能缺陷文本用于电力二次设备功能缺陷诊断难度,导致电力二次设备缺陷诊断困难。
发明内容
本发明的目的在于克服上述现有技术中,由于电力二次设备功能缺陷文本的文本数据较为复杂,很难挖掘其潜在知识与价值,增加电力二次设备功能缺陷文本用于电力二次设备功能缺陷诊断难度,导致电力二次设备缺陷诊断困难的缺点,提供一种电力二次设备缺陷诊断方法、系统、设备及存储介质。
为达到上述目的,本发明采用以下技术方案予以实现:
本发明第一方面,一种电力二次设备缺陷诊断方法,包括以下步骤:
获取电力二次设备的缺陷描述语料;
基于预设的实体抽取模型,从缺陷描述语料中抽取用于描述缺陷的实体信息;
基于实体信息,遍历预设的缺陷库得到实体信息对应的诊断信息;其中,所述缺陷库包括若干实体信息及若干实体信息分别对应的诊断信息。
本发明电力二次设备缺陷诊断方法进一步的改进在于:
所述实体抽取模型采用如下方法建立:
建立初始信息抽取模型;
获取历史电力二次设备缺陷文本数据,将历史电力二次设备缺陷文本数据进行实体信息标注及格式转换,得到初始数据集;
将初始数据集分为训练集和测试集,通过训练集训练初始信息抽取模型,并通过测试集测试训练后的初始信息抽取模型,得到测试结果;
根据测试结果优化初始信息抽取模型的模型参数,得到实体抽取模型。
所述根据测试结果优化信息抽取模型的模型参数,得到实体抽取模型的具体方法为:
基于模型参数变化建立对照组,获取所有对照组的测试结果,选取测试结果最优的对照组的模型参数优化初始信息抽取模型,得到实体抽取模型。
所述初始信息抽取模型为BiLSTM-CRF模型;所述若干实体信息及若干实体信息分别对应的诊断信息以知识图谱的形式存储在缺陷库中。
所述从缺陷描述语料中抽取用于描述缺陷的实体信息的具体方法为:
将缺陷描述语料进行分词处理后得到第一分词结果;
将第一分词结果转换为符合实体抽取模型输入格式的第二分词结果;
基于实体抽取模型对第二分词结果进行实体抽取,得到实体输出信息;
将实体输出信息还原为用于描述缺陷的实体信息。
所述诊断信息包括下述中的至少一种:缺陷电力二次设备、缺陷部件、缺陷类型、缺陷等级、缺陷解决方案、缺陷责任单位、缺陷原因和缺陷现象。
还包括:
基于实体信息,遍历预设的缺陷库得到与该实体信息相似度最大的实体信息,并判别该实体信息与该实体信息相似度最大的实体信息是否表示为同一实体;当为同一实体时,更新缺陷库中的该实体信息;否则,对该实体进行实体消歧。
本发明第二方面,一种电力二次设备缺陷诊断系统,包括:
信息获取模块,用于获取电力二次设备的缺陷描述语料;
信息抽取模块,用于基于预设的实体抽取模型,从缺陷描述语料中抽取用于描述缺陷的实体信息;以及
诊断模块,用于基于实体信息,遍历预设的缺陷库得到实体信息对应的诊断信息;其中,所述缺陷库包括若干实体信息及若干实体信息分别对应的诊断信息。
本发明第三方面,一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现上述电力二次设备缺陷诊断方法的步骤。
本发明第四方面,一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现上述电力二次设备缺陷诊断方法的步骤。
与现有技术相比,本发明具有以下有益效果:
本发明电力二次设备缺陷诊断方法,通过实体抽取模型从缺陷描述语料中抽取用于描述缺陷的实体信息,然后基于该实体信息,遍历预设的缺陷库得到实体信息对应的诊断信息,供运维业务人员参考。缺陷库内包含若干实体信息及若干实体信息分别对应的诊断信息,充分将现有电力二次设备功能缺陷文本数据进行挖掘,作为智能诊断的基础,进而实现将过去单独依靠人员分析诊断的工作方式转变为智能手段为主,人工审核为辅的工作方式,为运维业务人员提供辅助决策支撑,促进电力二次设备缺陷诊断及处置尽快从经验型向智能型转变,提升分析决策的智能化水平,提升电力二次设备缺陷诊断及处置的效率。
进一步的,通过历史电力二次设备缺陷文本数据构建训练集和测试集,进行初始信息抽取模型的训练与测试得到实体抽取模型,极大提升实体抽取模型的精确率、召回率及F1值评测指标,提供了对文本数据挖掘的一种可行方法。
附图说明
图1为本发明一个实施例的电力二次设备缺陷诊断方法流程框图;
图2为本发明实施例的实体抽取模型的建立方法流程框图;
图3为本发明实施例的LSTM网络基本单元示意图;
图4为本发明实施例的BiLSTM-CRF模型的构示意图;
图5为本发明实施例的对照组1模型误差曲线图;
图6为本发明实施例的对照组2模型误差曲线图;
图7为本发明实施例的对照组3模型误差曲线图;
图8为本发明实施例的对照组4模型误差曲线图;
图9为本发明实施例的抽取用于描述缺陷的实体信息的流程框图;
图10为本发明实施例的实体信息及对应的诊断信息的知识图谱示意图;
图11为本发明实施例的缺陷库建立的原理框图;
图12为本发明另一个实施例的电力二次设备缺陷诊断方法流程框图;
图13为本发明实施例的电力二次设备缺陷诊断方法的原理图;
图14为本发明实施例的电力二次设备缺陷诊断方法的实际应用场景示意图;
图15为本发明实施例的电力二次设备缺陷诊断系统结构框图;
图16为本发明实施例的另一种电力二次设备缺陷诊断系统结构框图;
图17为本发明实施例的电力二次设备缺陷诊断系统的框架原理图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或电力二次设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或电力二次设备固有的其它步骤或单元。
近年来,由于深度学习等智能算法的兴起,自然语言处理技术也取得重要进展。国内外学者针对深度学习与自然语言处理技术在电力系统中的应用作了广泛地探讨,较早地探讨并开展了机器学习算法在电力系统中的应用,如通过故障工单等文本数据进行系统潜在故障风险预测。
发明人在实际工作中发现,对于电力文本数据的处理,如简单的文本分类任务,一些机器学习算法如隐马尔可夫模型、卷积神经网络等均取得了很好的效果。然而,简单的文本分类未能充分利用电力文本数据蕴含的价值。相对而言,对文本进行知识抽取、价值挖掘更具有实际的应用意义。比如,针对电力缺陷文本,定义了电力语义框架和语义槽,以提取缺陷信息;该语义框架在处理相对规整的短文本数据,具有较好的效果,但不擅长处理蕴含信息较复杂的长文本数据。针对电力调度文本,首先建立了调度语言的正则表达式知识库,进而设计了多层语义框架,以解析电力文本语义;基于依存句法分析技术,构建了用于电力二次设备缺陷文本和缺陷分类标准文本的依存句法树,完成了从文本到缺陷信息的辨识。
但是,基于规则的方法对电力各类文本进行挖掘,需要较大程度且必要的人为干预,且所设计的规则和具体的业务场景具有强相关性,迁移能力较弱,依旧不能很好的从电力二次设备缺陷文本数据中提取信息,进而有效的指导电力二次设备缺陷的诊断。
针对这一问题,本发明通过引入机器学习算法,构建实体抽取模型,针对电力二次设备缺陷文本数据挖掘问题,考虑到缺陷现象描述可以在原文本中以某一子序列加以概括,本发明将缺陷现象视作命名实体,对电力二次设备缺陷文本数据中的命名实体进行识别与提取,达到了较好的信息提取效果,进而实现智能化电力二次设备缺陷诊断。
下面结合附图对本发明做进一步详细描述:
参见图1,本发明一个实施例中,提供了一种电力二次设备缺陷诊断方法,通过引入机器学习算法,构建实体抽取模型,利用实体抽取模型对缺陷描述语料进行信息提取,进而得到用于描述缺陷的实体信息,然后再遍历缺陷库得到该实体信息对应的诊断信息完成电力二次设备缺陷的智能诊断。具体的,该电力二次设备缺陷诊断方法包括以下步骤:
S1:获取缺陷描述语料。
具体的,一线运维检修人员在检修时发现电力二次设备发生缺陷,通过文字语言将电力二次设备缺陷进行描述,得到缺陷描述语料。简言之,这里的缺陷描述语料就是一段文字语言,描述的就是电力二次设备的缺陷现象。
S2:基于预设的实体抽取模型,从缺陷描述语料中抽取用于描述缺陷的实体信息。
具体的,这里采用了预设的实体抽取模型,在实际工作中,实体抽取模型需要预先建立好后进行存储,以便随时调用。参见图2,在本实施例中,提供了一种实体抽取模型的建立方法,具体的,包括以下步骤:
S201:建立初始信息抽取模型。具体的,本实施例中,基于python和Tensorflow完成BiLSTM-CRF模型的分布式表示层、BiLSTM层以及CRF层的代码编写,进而建立了基于BiLSTM-CRF模型的初始信息抽取模型,以更好的从历史电力二次设备缺陷文本数据中提取出缺陷现象、解决措施等关键信息。其中,TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统,其命名来源于本身的运行原理。Tensor(张量)意味着N维数组,Flow(流)意味着基于数据流图的计算,TensorFlow为张量从流图的一端流动到另一端计算过程,TensorFlow是将复杂的数据结构传输至人工智能神经网中进行分析和处理过程的系统。
BiLSTM-CRF是目前比较流行的序列标注算法,其将BiLSTM和CRF结合在一起,使模型即可以像CRF一样考虑序列前后之间的关联性,又可以拥有LSTM的特征抽取及拟合能力。为了便于理解BiLSTM-CRF模型,参见图3和4,其中,图3示出了LSTM网络基本单元示意图,其各状态量计算公式如式(1)所示。
Figure BDA0002672376120000081
式(1)中,σ和tanh为相应的激活函数,ht-1、st-1分别为上一个时刻的单元状态和隐藏状态,xt为当前时刻的输入,Wf、Wi、Wo、Ws、bf、bi、bo、bs分别为相应的矩阵权重和偏置项,⊙表示元素按位相乘。ft、it、ot分别为遗忘门、输入门、输出门的状态,ht、st则为当前时刻输出的单元状态和隐藏状态。
图4出了BiLSTM-CRF模型的构图,BiLSTM-CRF模型主要由输入层,分布式表示层,双向LSTM层(编码器),CRF层(解码器)以及输出层构成。在分布式表示层中,由于深度学习模型无法接受非数值型数据作为输入,因此,需要将输入的语句表示成一组向量,而在BiLSTM与CRF层则完成原始数据的特征提取,最终输出得到目标序列。
S202:获取历史电力二次设备缺陷文本数据,将历史电力二次设备缺陷文本数据进行实体信息标注及格式转换,得到初始数据集。
正如上所述,由于深度学习模型无法接受非数值型数据作为输入,需要将输入的语句表示成一组向量,因此,需要对获取的历史电力二次设备缺陷文本数据进行预处理。具体的,包括将获取的历史电力二次设备缺陷文本数据进行实体信息标注,本实施例中,将缺陷现象等文本信息在电力二次设备缺陷文本数据中以某一子序列加以概括,或者以多个子序列加以概括,每个子序列视为一个命名实体,并以此为标注数据的规则,对电力二次设备缺陷文本数据进行人工标注数据,得到实体信息标注结果。
在完成标注之后,引入word_embedding思想,完成实体信息的分布式表示,实现格式转换,即将实体信息标注结果转换为初始信息抽取模型能够输入的格式,转换完成后得到初始数据集。其中,word_embedding思想是将文本数据转换为数值型数据,如果将word看作文本的最小单元,可以将word_embedding理解为一种映射,其过程是:将文本空间中的某个word,通过一定的方法,映射或者说嵌入(embedding)到另一个数值向量空间,比如:word_embedding的输入是原始文本中的一组不重叠的词汇,假设有句子:apple on aapple tree,那么为了便于处理,可以将这些词汇放置到一个词典里,例如:[“apple”,“on”,“a”,“tree”],这个词典就可以看作是word_embedding的一个输入。word_embedding的输出就是每个word的向量表示,对于上文中的输入,假设使用最简单的one hot编码方式,那么每个word都对应了一种数值表示。例如,apple对应的向量就是[1,0,0,0],a对应的向量就是[0,0,1,0],各种机器学习应用可以基于这种word的数值表示来构建各自的模型。
S203:将初始数据集分为训练集和测试集,通过训练集训练初始信息抽取模型,并通过测试集测试训练后的初始信息抽取模型,得到测试结果。
具体的,获取初始数据集后,将初始数据集分为训练集和测试集,本实施例中以8:2比例划分为训练集与测试集,在满足一定性能的电力二次设备上完成模型的训练及测试,得到测试结果。其中,具体的训练及测试过程可参见现有神经网络模型的训练过程。
S204:根据测试结果优化初始信息抽取模型的模型参数,得到实体抽取模型。
本实施例中,包括模型前向计算、误差反向传播、权重参数以及模型的超参数调优。具体方法是,基于模型参数变化建立对照组,获取所有对照组的测试结果,选取测试结果最优的对照组的模型参数优化初始信息抽取模型,得到实体抽取模型。其中,超参数包括:优化器(optimizer)、BiLSTM隐藏层单元数(Hidden_dim)、训练轮数(Epoch)、每一批次样本数(Batch_size)、学习率(Learnin_rate)、分布式表示层向量维度(Embedding_dim),通过设置对照组的对比实验法,不断调试,选取最优参数。
具体的,参见图5至8,示出了几个模型参数取值不同下的误差曲线,图5所示的对照组1中的损失(loss)值由最开始的68.60经过3个epoch(540个step),迅速降到3.41,最后稳定在0.75附近,其中,1个epoch等于使用训练集中的全部样本训练一次,通俗的讲epoch的值就是整个数据集被轮几次。相比于对照组1,图6所示的对照组2中将λ(正则化项参数)增大10倍,图7所示的对照组3中将λ设为0,即损失函数中没有正则化项。对照组2的loss值稳定在1.36附近,对照组3的loss值稳定在0.45附近。分析知,对照组2模型欠拟合,对照组3模型过拟合。图8所示的对照组4中则将求解优化器由Adam更改为SGD(StochasticGradientDescent,随机梯度下降),结果表明Adam求解结果更优。其中,Adam是一种可以替代传统随机梯度下降过程的一阶优化算法,它能基于训练数据迭代地更新神经网络权重。通过选取测试结果最好的对照组的参数,作为最终的模型参数,即可得到实体抽取模型。
最后,通过计算测试的精确率、召回率、F1值并与传统机器学习模型如条件随机场对比,本发明在精确率、召回率、F1值评测指标下均具有较好的优势,验证了本发明所提方法的可行性与有效性,本发明可为电力文本数据挖掘、信息抽取相关研究与应用提供思路和有益参考。
综上,完成了实体抽取模型的建立,那么基于该实体抽取模型,从缺陷描述语料中抽取用于描述缺陷的实体信息,参见图9,具体包括:
S211:将缺陷描述语料进行分词处理后得到第一分词结果。
具体的,获得的缺陷描述语料由于是一线运维检修人员在检修时根据缺陷或故障现象进行的描述,基于个体差异,针对同一缺陷现象,描述也大为不同,因此将缺陷描述语料进行分词处理,获得第一分词结果。本实施例中,采用jieba分词方法将缺陷描述语料进行分词处理,将句子分解成单个的词语,并获得每个词语的词性。
S212:将第一分词结果转换为符合实体抽取模型输入格式的第二分词结果。
如上所述,由于深度学习模型无法接受非数值型数据作为输入,因此需要先将第一分词结果转换为符合实体抽取模型输入格式的第二分词结果,这里的第二分词结果即是通过word_embedding思想将文本数据转换为数值型数据,以便能够输入实体抽取模型。
S213:基于实体抽取模型对第二分词结果进行实体抽取,得到实体输出信息。
具体的,将符合输入格式的第二分词结果输入实体抽取模型,实体抽取模型输出实体输出信息,但此时实体输出信息还是数值型数据。
S214:将实体输出信息还原为用于描述缺陷的实体信息。
具体的,基于上述的word_embedding思想,将数值型数据的实体输出信息还原为实体信息,该实体信息即为描述缺陷的实体信息。
S3:基于实体信息,遍历预设的缺陷库得到实体信息对应的诊断信息;其中,所述缺陷库包括若干实体信息及若干实体信息分别对应的诊断信息。
具体的,缺陷库是基于历史的电力二次设备缺陷文本数据,经过专家诊断及决策,得出每个缺陷及其对应的诊断信息,参见图10,本实施例中,实体信息及实体信息对应的诊断信息以知识图谱的形式存储在缺陷库中,形成若干的知识图谱,在获取到缺陷描述语料中的实体信息后,按照对应关系,从缺陷库中找到对应的知识图谱。其中,诊断信息包括缺陷电力二次设备、缺陷部件、缺陷类型、缺陷等级、缺陷解决方案、缺陷责任单位、缺陷原因和缺陷现象,也可以视需求包括其中的几种。
为了辅助理解上述缺陷库的建立,参见图11,示出了缺陷库建立的原理框图,通过专家的经验,实现一定数量语料的规范化描述,并基于自然语言处理技术,进而训练得到实体抽取模型,基于实体抽取模型理解和抽取未处理的语料,得到缺陷现象及解决措施,并所有的缺陷及解决措施整合存储得到缺陷库。
综上所述,本发明电力二次设备缺陷诊断方法,采用基于BiLSTM-CRF模型的电力二次设备缺陷文本信息抽取方法,基于抽取的缺陷现象、措施等构建电力二次设备缺陷信息知识图谱,通过知识推理模型完成智能诊断和辅助决策功能。
参见图12,本发明再一个实施例中,提供了一种电力二次设备缺陷诊断方法,该电力二次设备缺陷诊断方法除包括图1所示实施例中电力二次设备缺陷诊断方法的全部步骤外,还至少包括S4:基于实体信息,遍历预设的缺陷库得到与该实体信息相似度最大的实体信息,并判别该实体信息与该实体信息相似度最大的实体信息是否表示为同一实体;当为同一实体时更新缺陷库中的该实体信息;否则,对该实体进行实体消歧。
具体的,当缺陷库内没有与当前的实体信息一致的实体信息,那么需要首先通过文本相似度计算方法找到与当前的实体信息相似度最大的实体信息,并提交给专家进行决策,判别这两个实体信息是否表示的是同一实体,这里的实体表示的就是缺陷,然后当为同一实体时,那么需要更新缺陷库内该实体的实体信息,以便下次对同一实体信息的自动诊断。如果,不为同一实体时,对该实体进行实体消歧,可以选择基于多方向注意力机制的实体消歧方法、基于融合特征相似度的实体消歧方法等。
参见图13,示出了本发明电力二次设备缺陷诊断方法的原理图,基于现象描述构建电力二次设备缺陷知识图谱,并诊断缺陷原因及缺陷部位,得到解决措施辅助业务人员,是从电力二次设备缺陷知识图谱到业务人员的智能“医生”。
本发明再一个实施例中,提供了本发明电力二次设备缺陷诊断方法在某电力二次设备缺陷诊断中的实际应用过程,参与诊断的220Kv二次电力二次设备保护装置约12000套,继电保护的缺陷分析目前主要依赖于运维人员现场排查和人工分析方式,需要依赖于丰富的缺陷处置经验,对运维人员的技术水平要求较高。缺陷信息的填报也存在效率较低、信息录入内容描述不统一或者信息不完整的问题。为了进一步规范缺陷信息录入并且提升消缺处置的效率,需要智能化手段提供辅助支撑,通过利用历史消缺记录构建缺陷知识图谱,从对人工的依赖逐步转向机器学习,实现缺陷的智能分析与辅助决策。参见图14,示出了本发明电力二次设备缺陷诊断方法的实际应用场景示意图,参见图中间部位的输入框,当一线运维检修人员在检修时发现电力二次设备发生缺陷时,只需将缺陷现象描述为缺陷描述语料,并输入该输入框,基于终端内置的电力二次设备缺陷诊断方法,即可自动诊断缺陷,得到诊断结果。如图:缺陷描述语料为:装置运行灯灭,液晶面板异常告警。自动诊断后得到的诊断信息:缺陷电力二次设备:保护装置本体,缺陷原因:元器件损坏,缺陷程度:一般,缺陷部位:CPU插件,缺陷责任部门:制造部门,缺陷原因分类:非人为原因,缺陷责任单位:南瑞继保,消陷建议:更换-推荐率0.16、重启-推荐率0.16等。
经过应用分析,针对该次电力二次设备缺陷,应用本发明电力二次设备缺陷诊断方法,获得了超过80%准确率的缺陷智能诊断和消缺措施建议,缺陷分析提高二倍以上的智能诊断效率,电力二次设备缺陷消缺速度提高50%以上。
下述为本发明的装置实施例,可以用于执行本发明方法实施例。对于装置实施例中未纰漏的细节,请参照本发明方法实施例。
参见图15,本发明再一个实施例中,提供了一种电力二次设备缺陷诊断系统,该电力二次设备缺陷诊断系统能够用于实施图1所示实施例中的电力二次设备缺陷诊断方法,具体的,该电力二次设备缺陷诊断系统包括信息获取模块、信息抽取模块以及诊断模块。
其中,信息获取模块用于获取电力二次设备的缺陷描述语料;信息抽取模块用于基于预设的实体抽取模型,从缺陷描述语料中抽取用于描述缺陷的实体信息;诊断模块用于基于实体信息,遍历预设的缺陷库得到实体信息对应的诊断信息;其中,所述缺陷库包括若干实体信息及若干实体信息分别对应的诊断信息。
优选的,参见图16,该电力二次设备缺陷诊断系统还可以包括更新及消歧模块,用于基于实体信息,遍历预设的缺陷库得到与该实体信息相似度最大的实体信息,并判别该实体信息与该实体信息相似度最大的实体信息是否表示为同一实体;当为同一实体时,更新缺陷库中的该实体信息;否则,对该实体进行实体消歧。基于更新及消歧模块的设计,该电力二次设备缺陷诊断系统能够用于实施图12所示实施例中的电力二次设备缺陷诊断方法。
为了进一步理解本发明电力二次设备缺陷诊断系统,参见图17,示出了本发明电力二次设备缺陷诊断系统的框架原理图,包括数据层、本体层、业务层以及应用层。数据层提供数据支撑,进行信息抽取至本体层,本体层通过图谱构建至业务层,业务层经过业务开发至应用层,应用层进行智能诊断和辅助决策。
本发明再一个实施例中,提供一种终端设备,该终端设备包括处理器以及存储器,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器用于执行所述计算机存储介质存储的程序指令。处理器可能是中央处理单元(Central ProcessingUnit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor、DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其是终端的计算核心以及控制核心,其适于实现一条或一条以上指令,具体适于加载并执行一条或一条以上指令从而实现相应方法流程或相应功能;本发明实施例所述的处理器可以用于电力二次设备缺陷诊断方法的操作,包括:获取电力二次设备的缺陷描述语料;基于预设的实体抽取模型,从缺陷描述语料中抽取用于描述缺陷的实体信息;基于实体信息,遍历预设的缺陷库得到实体信息对应的诊断信息;其中,所述缺陷库包括若干实体信息及若干实体信息分别对应的诊断信息。
再一个实施例中,本发明还提供了一种计算机可读存储介质(Memory),所述计算机可读存储介质是终端电力二次设备中的记忆电力二次设备,用于存放程序和数据。可以理解的是,此处的计算机可读存储介质既可以包括终端电力二次设备中的内置存储介质,当然也可以包括终端电力二次设备所支持的扩展存储介质。计算机可读存储介质提供存储空间,该存储空间存储了终端的操作系统。并且,在该存储空间中还存放了适于被处理器加载并执行的一条或一条以上的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机可读存储介质可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。
可由处理器加载并执行计算机可读存储介质中存放的一条或一条以上指令,以实现上述实施例中有关电力二次设备缺陷诊断方法的相应步骤;计算机可读存储介质中的一条或一条以上指令由处理器加载并执行如下步骤:获取电力二次设备的缺陷描述语料;基于预设的实体抽取模型,从缺陷描述语料中抽取用于描述缺陷的实体信息;基于实体信息,遍历预设的缺陷库得到实体信息对应的诊断信息;其中,所述缺陷库包括若干实体信息及若干实体信息分别对应的诊断信息。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、电力二次设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理电力二次设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理电力二次设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理电力二次设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理电力二次设备上,使得在计算机或其他可编程电力二次设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程电力二次设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (10)

1.一种电力二次设备缺陷诊断方法,其特征在于,包括以下步骤:
获取电力二次设备的缺陷描述语料;
基于预设的实体抽取模型,从缺陷描述语料中抽取用于描述缺陷的实体信息;
基于实体信息,遍历预设的缺陷库得到实体信息对应的诊断信息;其中,所述缺陷库包括若干实体信息及若干实体信息分别对应的诊断信息。
2.根据权利要求1所述的电力二次设备缺陷诊断方法,其特征在于,所述实体抽取模型采用如下方法建立:
建立初始信息抽取模型;
获取历史电力二次设备缺陷文本数据,将历史电力二次设备缺陷文本数据进行实体信息标注及格式转换,得到初始数据集;
将初始数据集分为训练集和测试集,通过训练集训练初始信息抽取模型,并通过测试集测试训练后的初始信息抽取模型,得到测试结果;
根据测试结果优化初始信息抽取模型的模型参数,得到实体抽取模型。
3.根据权利要求2所述的电力二次设备缺陷诊断方法,其特征在于,所述根据测试结果优化信息抽取模型的模型参数,得到实体抽取模型的具体方法为:
基于模型参数变化建立对照组,获取所有对照组的测试结果,选取测试结果最优的对照组的模型参数优化初始信息抽取模型,得到实体抽取模型。
4.根据权利要求2所述的电力二次设备缺陷诊断方法,其特征在于,所述初始信息抽取模型为BiLSTM-CRF模型;所述若干实体信息及若干实体信息分别对应的诊断信息以知识图谱的形式存储在缺陷库中。
5.根据权利要求1所述的电力二次设备缺陷诊断方法,其特征在于,所述从缺陷描述语料中抽取用于描述缺陷的实体信息的具体方法为:
将缺陷描述语料进行分词处理后得到第一分词结果;
将第一分词结果转换为符合实体抽取模型输入格式的第二分词结果;
基于实体抽取模型对第二分词结果进行实体抽取,得到实体输出信息;
将实体输出信息还原为用于描述缺陷的实体信息。
6.根据权利要求1所述的电力二次设备缺陷诊断方法,其特征在于,所述诊断信息包括下述中的至少一种:缺陷电力二次设备、缺陷部件、缺陷类型、缺陷等级、缺陷解决方案、缺陷责任单位、缺陷原因和缺陷现象。
7.根据权利要求1所述的电力二次设备缺陷诊断方法,其特征在于,还包括:
基于实体信息,遍历预设的缺陷库得到与该实体信息相似度最大的实体信息,并判别该实体信息与该实体信息相似度最大的实体信息是否表示为同一实体;当为同一实体时,更新缺陷库中的该实体信息;否则,对该实体进行实体消歧。
8.一种电力二次设备缺陷诊断系统,其特征在于,包括:
信息获取模块,用于获取电力二次设备的缺陷描述语料;
信息抽取模块,用于基于预设的实体抽取模型,从缺陷描述语料中抽取用于描述缺陷的实体信息;以及
诊断模块,用于基于实体信息,遍历预设的缺陷库得到实体信息对应的诊断信息;其中,所述缺陷库包括若干实体信息及若干实体信息分别对应的诊断信息。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现权利要求1至7任一项所述电力二次设备缺陷诊断方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现权利要求1至7任一项所述电力二次设备缺陷诊断方法的步骤。
CN202010937208.1A 2020-09-08 2020-09-08 电力二次设备缺陷诊断方法、系统、设备及存储介质 Pending CN112101592A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010937208.1A CN112101592A (zh) 2020-09-08 2020-09-08 电力二次设备缺陷诊断方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010937208.1A CN112101592A (zh) 2020-09-08 2020-09-08 电力二次设备缺陷诊断方法、系统、设备及存储介质

Publications (1)

Publication Number Publication Date
CN112101592A true CN112101592A (zh) 2020-12-18

Family

ID=73751805

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010937208.1A Pending CN112101592A (zh) 2020-09-08 2020-09-08 电力二次设备缺陷诊断方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112101592A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112749509A (zh) * 2020-12-30 2021-05-04 西华大学 一种基于lstm神经网络的智能变电站故障诊断方法
CN113377759A (zh) * 2021-07-01 2021-09-10 贵州电网有限责任公司 一种基于专家系统算法的缺陷填报数据治理方法
CN113435652A (zh) * 2021-07-01 2021-09-24 贵州电网有限责任公司 一种一次设备缺陷诊断与预测方法
CN113552434A (zh) * 2021-07-21 2021-10-26 内蒙古电力(集团)有限责任公司内蒙古电力科学研究院分公司 基于专家综合判断的油浸式电流互感器低温特性研究系统
CN113590396A (zh) * 2021-07-23 2021-11-02 南方电网深圳数字电网研究院有限公司 一次设备的缺陷诊断方法、系统、电子设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107783960A (zh) * 2017-10-23 2018-03-09 百度在线网络技术(北京)有限公司 用于抽取信息的方法、装置和设备
CN107887036A (zh) * 2017-11-09 2018-04-06 北京纽伦智能科技有限公司 临床决策辅助系统的构建方法、装置及临床决策辅助系统
CN108460136A (zh) * 2018-03-08 2018-08-28 国网福建省电力有限公司 电力运维信息知识图谱构建方法
CN109033284A (zh) * 2018-07-12 2018-12-18 国网福建省电力有限公司 基于知识图谱的电力信息运维系统数据库构建方法
CN109271506A (zh) * 2018-11-29 2019-01-25 武汉大学 一种基于深度学习的电力通信领域知识图谱问答系统的构建方法
CN109346169A (zh) * 2018-10-17 2019-02-15 长沙瀚云信息科技有限公司 一种人工智能辅助诊疗系统及其构建方法、设备和存储介质
CN109492113A (zh) * 2018-11-05 2019-03-19 扬州大学 一种面向软件缺陷知识的实体、关系联合抽取方法
CN110119355A (zh) * 2019-04-25 2019-08-13 天津大学 一种基于知识图谱向量化推理通用软件缺陷建模方法
CN111400505A (zh) * 2020-03-13 2020-07-10 国家电网有限公司 一种用电信息采集系统匹配故障消缺方案的方法及系统
CN111488468A (zh) * 2020-04-30 2020-08-04 北京建筑大学 地理信息知识点抽取方法、装置、存储介质及计算机设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107783960A (zh) * 2017-10-23 2018-03-09 百度在线网络技术(北京)有限公司 用于抽取信息的方法、装置和设备
CN107887036A (zh) * 2017-11-09 2018-04-06 北京纽伦智能科技有限公司 临床决策辅助系统的构建方法、装置及临床决策辅助系统
CN108460136A (zh) * 2018-03-08 2018-08-28 国网福建省电力有限公司 电力运维信息知识图谱构建方法
CN109033284A (zh) * 2018-07-12 2018-12-18 国网福建省电力有限公司 基于知识图谱的电力信息运维系统数据库构建方法
CN109346169A (zh) * 2018-10-17 2019-02-15 长沙瀚云信息科技有限公司 一种人工智能辅助诊疗系统及其构建方法、设备和存储介质
CN109492113A (zh) * 2018-11-05 2019-03-19 扬州大学 一种面向软件缺陷知识的实体、关系联合抽取方法
CN109271506A (zh) * 2018-11-29 2019-01-25 武汉大学 一种基于深度学习的电力通信领域知识图谱问答系统的构建方法
CN110119355A (zh) * 2019-04-25 2019-08-13 天津大学 一种基于知识图谱向量化推理通用软件缺陷建模方法
CN111400505A (zh) * 2020-03-13 2020-07-10 国家电网有限公司 一种用电信息采集系统匹配故障消缺方案的方法及系统
CN111488468A (zh) * 2020-04-30 2020-08-04 北京建筑大学 地理信息知识点抽取方法、装置、存储介质及计算机设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
刘梓权,王慧芳: "基于知识图谱技术的电力设备缺陷记录检索方法", 电力系统及其自动化, vol. 42, no. 14, pages 158 - 164 *
张芳容,杨青: "知识库问答系统中实体关系抽取方法研究", 计算机工程与应用, vol. 56, no. 11, pages 219 - 224 *
施正钗;郑俊翔;周泰斌;徐伟敏;郑微;: "基于语义分析的设备监控告警信息知识图谱构建研究", 浙江电力, no. 08, pages 216 - 219 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112749509A (zh) * 2020-12-30 2021-05-04 西华大学 一种基于lstm神经网络的智能变电站故障诊断方法
CN113377759A (zh) * 2021-07-01 2021-09-10 贵州电网有限责任公司 一种基于专家系统算法的缺陷填报数据治理方法
CN113435652A (zh) * 2021-07-01 2021-09-24 贵州电网有限责任公司 一种一次设备缺陷诊断与预测方法
CN113435652B (zh) * 2021-07-01 2023-01-24 贵州电网有限责任公司 一种一次设备缺陷诊断与预测方法
CN113552434A (zh) * 2021-07-21 2021-10-26 内蒙古电力(集团)有限责任公司内蒙古电力科学研究院分公司 基于专家综合判断的油浸式电流互感器低温特性研究系统
CN113552434B (zh) * 2021-07-21 2022-06-24 内蒙古电力(集团)有限责任公司内蒙古电力科学研究院分公司 基于专家综合判断的油浸式电流互感器低温特性研究系统
CN113590396A (zh) * 2021-07-23 2021-11-02 南方电网深圳数字电网研究院有限公司 一次设备的缺陷诊断方法、系统、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN112101592A (zh) 电力二次设备缺陷诊断方法、系统、设备及存储介质
US11256487B2 (en) Vectorized representation method of software source code
CN111191002B (zh) 一种基于分层嵌入的神经代码搜索方法及装置
CN110119854A (zh) 基于代价敏感lstm循环神经网络的稳压器水位预测方法
CN106202010A (zh) 基于深度神经网络构建法律文本语法树的方法和装置
WO2023241272A1 (zh) 基于图注意力网络的混凝土坝缺陷图像描述自动生成方法
CN115545970A (zh) 基于数字孪生的电网故障分析方法、系统、设备及介质
CN112347756A (zh) 一种基于序列化证据抽取的推理阅读理解方法及系统
CN116680105A (zh) 一种基于邻域信息融合注意力机制的时序异常检测方法
CN110245232A (zh) 文本分类方法、装置、介质和计算设备
CN113095050A (zh) 一种智能成票方法、系统、设备及存储介质
CN112035629B (zh) 基于符号化知识与神经网络的问答模型的实现方法
CN113505583A (zh) 基于语义决策图神经网络的情感原因子句对提取方法
CN115795038B (zh) 基于国产化深度学习框架的意图识别方法和装置
CN117151222A (zh) 领域知识引导的突发事件案例实体属性及其关系抽取方法、电子设备和存储介质
CN115757775A (zh) 基于文本蕴含的无触发词文本事件检测方法及系统
CN114969087A (zh) 基于多视角特征解耦的nl2sql方法和装置
CN112668481A (zh) 一种遥感图像语义抽取方法
CN113239703B (zh) 基于多元因素融合的深层逻辑推理金融文本分析方法及系统
Jin et al. Representation and Extraction of Diesel Engine Maintenance Knowledge Graph with Bidirectional Relations Based on BERT and the Bi-LSTM-CRF Model
CN116227484B (zh) 模型训练方法、装置、设备、存储介质和计算机程序产品
Qi et al. Multi-label text mining method for electrical equipment defects based on improved CNN-SVM
Chen et al. A mathematical question matching and ranking method based on knowledge graph and semantic similarity
CN117669723A (zh) 一种基于知识图谱的航天人因信息学习推理方法及装置
CN117633186A (zh) 智能问答系统的构建方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination