CN112860872A - 基于自学习的配电网操作票语义合规性的校验方法及系统 - Google Patents

基于自学习的配电网操作票语义合规性的校验方法及系统 Download PDF

Info

Publication number
CN112860872A
CN112860872A CN202110287290.2A CN202110287290A CN112860872A CN 112860872 A CN112860872 A CN 112860872A CN 202110287290 A CN202110287290 A CN 202110287290A CN 112860872 A CN112860872 A CN 112860872A
Authority
CN
China
Prior art keywords
ticket
knowledge base
power grid
operation ticket
semantic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110287290.2A
Other languages
English (en)
Inventor
孟子杰
蔡新雷
李嘉铭
杨民京
陈业夫
郭俊宏
邹扬
杨之翰
王乃啸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Power Grid Co Ltd
Electric Power Dispatch Control Center of Guangdong Power Grid Co Ltd
Original Assignee
Guangdong Power Grid Co Ltd
Electric Power Dispatch Control Center of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Power Grid Co Ltd, Electric Power Dispatch Control Center of Guangdong Power Grid Co Ltd filed Critical Guangdong Power Grid Co Ltd
Priority to CN202110287290.2A priority Critical patent/CN112860872A/zh
Publication of CN112860872A publication Critical patent/CN112860872A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Animal Behavior & Ethology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于自学习的配电网操作票语义合规性的校验方法及系统,所述方法包括根据预先获取的电网基本调度操作规则和历史操作票语义校验结果,构建电网调度操作票知识库;基于单层神经网络及分层LSTM神经网络,对调度操作规则的操作指令进行特征提取、分解,得到调度操作规则中的设备信息与操作动作信息,以作为校验准则,并根据校验准则更新所述电网调度操作票知识库;对待校验的目标操作票数据进行结构化处理,根据更新后的电网调度操作票知识库,对结构化处理后的目标操作票合规性进行实时校验。本发明提供的校验方法,能够适应操作设备种类繁多,文本种类和描述增加的情况,提高了操作票语义分析结果的准确度及分析效率。

Description

基于自学习的配电网操作票语义合规性的校验方法及系统
技术领域
本发明涉及电力系统语义识别技术领域,尤其涉及一种基于自学习的配电网操作票语义合规性的校验方法及系统。
背景技术
目前,随着电网智能化建设的逐步推进,电力企业开始积累了大量电力设备相关的数据信息,不仅设备检修涉及操作的设备种类繁多,手续繁多,而且相应的配调操作票种类及文本描述增加。其中,操作票是指在进行电力设备操作前必须完成的纸质记录,对于电力设备的安全运行起关键作用。从过去完全依赖电网调度人员手动进行操作票的编写和校验,到目前加入人工智能技术以实现自动化识别与校验,在操作票的相关工作中都取得了突破性进展。
现有技术中常常使用用的支持向量机(SVM)、k近邻分类算法等进行操作票语义识别,在操作票信息文本的研究中将文本过滤视为分类问题,采用k近邻分类算法进行过滤;针对提出基于主题分类的文本过滤方法,筛选出文本内容的最优特征项集合,利用SVM分类技术过滤;同时,利用文本分类系统创建特定领域过滤器,减少了手动注释的训练数据量。但是几种方法都不能体现语义,不能够对多主题长文本进行建模,无法从相对较长的时间步长中捕获语义关联,进而会导致识别效率低下,校验结果的精确性无法保障,同时,这些方法不能发现深层次操作票指令特征,且算法计算量较大,计算时间很长,导致算法的计算效率低下。因此,如何提供一种基于自学习的配电网智能操作票语义校验方法,提高识别效率及结果的准确率,是本领域亟待解决的技术问题。
发明内容
本发明的目的在于提供一种基于自学习的配电网操作票语义合规性的校验方法及系统,该方法能够解决现有技术中对操作票语义分析的准确度低及分析效率低下的问题。
为了克服上述现有技术中的缺陷,本发明提供了一种基于自学习的配电网操作票语义合规性的校验方法,包括:
根据预先获取的电网基本调度操作规则、历史操作票语义校验结果,构建电网调度操作票知识库;
基于单层神经网络及分层LSTM神经网络,对所述调度操作规则的操作指令进行特征提取、分解,得到所述调度操作规则中的设备信息与操作动作信息,以作为校验准则,并根据所述校验准则更新所述电网调度操作票知识库;
对待校验的目标操作票数据进行结构化处理,根据更新后的电网调度操作票知识库,对结构化处理后的目标操作票合规性进行实时校验。
作为优选地,所述根据预先获取的电网基本调度操作规则、历史操作票语义校验结果,构建电网调度操作票知识库,包括:
构建配电网知识图谱;
根据预设的数据类别、检索方法、依托变更关系、配置方法、发布方法及所述配电网知识图谱,构建数据关联知识库;
构建所述数据关联知识库的搜索引擎;
获得调度操作知识,并根据所述调度操作知识、所述搜索引擎及所述数据关联知识库,构建电网调度操作票知识库。
作为优选地,所述搜索引擎的功能包括实体查询、篇名查询及术语查询。
作为优选地,所述电网调度操作票知识库基于结构化数据、半结构化数据及纯文本数据构建。
作为优选地,在所述基于单层神经网络及分层LSTM神经网络,对所述调度操作规则的操作指令进行特征提取、分解之后,还包括:
对分解后的操作指令数据经过预处理,得到对应的词序列;
根据预设的映射关系,将所述词序列映射为对应的词向量,并对所述词向量进行标注;
基于单层神经网络及分层LSTM神经网络,过滤所述操作指令中的长文本,得到句向量;
根据标注后的词向量及所述句向量进行操作指令语义的完整性分析。
作为优选地,所述基于自学习的配电网操作票语义合规性的校验方法,还包括:根据最大匹配算法,定义所述电网调度操作票知识库的操作票词典。
作为优选地,所述操作票词典包括:设备操作词典、设备名称词典、厂站词典、电压等级词典、自定义保护名称词典及自定义地区名称词典。
本发明还提供一种基于自学习的配电网操作票语义合规性的校验系统,包括:
知识库构建单元,用于根据预先获取的电网基本调度操作规则、历史操作票语义校验结果,构建电网调度操作票知识库;
知识库更新单元,用于基于单层神经网络及分层LSTM神经网络,对所述调度操作规则的操作指令进行特征提取、分解,得到所述调度操作规则中的设备信息与操作动作信息,以作为校验准则,并根据所述校验准则更新所述电网调度操作票知识库;
操作票校验单元,用于对待校验的目标操作票数据进行结构化处理,根据更新后的电网调度操作票知识库,对结构化处理后的目标操作票合规性进行实时校验。
本发明还提供一种计算机终端设备,包括:
一个或多个处理器;
存储器,与所述处理器耦接,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上任一项所述的基于自学习的配电网操作票语义合规性的校验方法。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行实现如上任一项所述的基于自学习的配电网操作票语义合规性的校验方法。
相对于现有技术,本发明至少存在如下有益效果:
本发明结合单层神经网络和分层长短记忆网络的深度网络模型用于操作票文本过滤任务中;利用词语层LSTM网络模型可以得到具有操作票语义的句向量,依赖配调调度知识库、句子层LSTM网络以得到的句向量作为输入,既可以获得操作票句子与各类别的依赖度,同时也通过句子层LSTM网络挖掘整个操作票中各个类别的依赖关系,有效提高对操作票语义合规性校验的性能。
附图说明
图1是本发明某一实施例提供的基于自学习的配电网操作票语义合规性的校验方法的流程示意图;
图2是本发明某一实施例提供的电力系统调度操作命令票的模板示意图;
图3是本发明又一实施例提供的基于自学习的配电网操作票语义合规性的校验方法的步骤示意图;
图4是本发明某一实施例提供的构建电网调度操作票知识库的架构示意图;
图5是本发明某一实施例提供的调度操作票知识库建设模型示意图;
图6是本发明某一实施例提供的LSTM分析电力调度操作票的整体架构示意图;
图7是本发明某一实施例提供的主题依赖计算模型的原理示意图;
图8是本发明某一实施例提供的分词器设计步骤示意图;
图9是本发明某一实施例提供的操作票智能生成方法的流程示意图;
图10是本发明某一实施例提供的基于自学习的配电网操作票语义合规性的校验系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,文中所使用的步骤编号仅是为了方便描述,不对作为对步骤执行先后顺序的限定。
应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
第一方面:
请参阅图1-3,本发明某一实施例提供了一种基于自学习的配电网操作票语义合规性的校验方法,包括:
S10、根据预先获取的电网基本调度操作规则、历史操作票语义校验结果,构建电网调度操作票知识库;
在本实施例中,基于电网系统的运行方式、各种保护和自动装置的配合以及电网的调度操作规程,根据电网不同的调度等级,以及地区电网调度机构出台的相关的“电网调度规程”的相关操作要求,将电网中基本调度操作规则,即针对某方面的设备或者操作过程进行的规范要求和规则进行分解、分类及建模,构建电网调度操作票知识库为电网调度业务功能建设提供基础支撑;为智能配网调度操作票的语义解析校验提供数据信息比对,达到提高相应调度操作语义辨识的目的。S20、基于单层神经网络及分层LSTM神经网络,对所述调度操作规则的操作指令进行特征提取、分解,得到所述调度操作规则中的设备信息与操作动作信息,以作为校验准则,并根据所述校验准则更新所述电网调度操作票知识库;
需要说明的是,LSTM深度网络模型,即长短期记忆模型(long-short termmemory)是一种特殊的RNN模型,是为了解决RNN模型梯度弥散的问题而提出的;在传统的RNN中,训练算法使用的是BPTT,当时间比较长时,需要回传的残差会出现指数下降,导致网络权重更新缓慢,无法体现出RNN的长期记忆的效果,因此需要一个存储单元来存储记忆,进而提出了LSTM模型。在本实施例中,通过基于LSTM-Attention的神经网络技术,实现调度操作指令特征提取,通过分析分解调度操作票的操作指令,获取操作命令中描述的操作设备及操作动作信息,对知识库中已有的知识进行迭代更新,实现智能调度操作知识库自学习。
S30、对待校验的目标操作票数据进行结构化处理,根据更新后的电网调度操作票知识库,对结构化处理后的目标操作票合规性进行实时校验。
需要说明的是,操作票是指在电力系统中进行电气操作的书面依据,最常见的操作票包括调度操作命令票,如图2所示,在电力系统的调度操作命令票上记录了电力调度文本,即一串进行电网调度的操作命令。在本实施例中,需要对操作票中的数据进行结构化处理,自动分析获取操作命令中描述的操作设备与动作,利用智能调度操作知识库中的记录的调度操作知识及电气操作规则进行检查,实现操作票合规性实时监测,实现操作票的安全逻辑校核及防误,其中,对于违反规则会进行主动告警,并暂停模拟过程,提高电气设备运行的可靠性。
本发明实施例通过结合单层神经网络和分层长短记忆网络的深度网络模型,来适应操作票语义分析过程中操作设备种类繁多,文本种类和描述增加的情况,提高对操作票语义分析的准确度及工作效率。
在某一个示例性的实施例中,可以在构建电网调度操作票知识库结束之后,模拟操作票生成过程,自动研判出此次操作任务术语及步骤过程术语,根据调度操作票规范生成操作票草稿,然后通过将操作票草稿与后续的待校验的真实操作票进行比对,以进行操作票的合规性校验。
在某一个示例性的实施例中,步骤S10、根据预先获取的电网基本调度操作规则、历史操作票语义校验结果,构建电网调度操作票知识库,包括以下四个步骤:
步骤1.1)配电网知识图谱架构设计:
配电网领域的知识图谱是为了让配调人员都能获取相应专业领域的知识,因此,配电网知识图谱应针对配网领域的知识进行构建,而且领域中有组织有结构的数据更容易获取准确的检索。在研究分析配网领域的数据时可以发现,配网领域知识难度大,即使是工作多年的工程师也会存在技术短板,因此现有结构化数据十分缺失,收集较为困难,所以,可信度较高的固定基础知识作为基础数据源,来构建配电网知识图谱。
具体地,配电网知识图谱架构的构建流程如图4所示,该流程首先通过文档数据进行预处理,再进行知识图谱的知识整理,包括实体提取,关系提取和属性提取,然后再针对定义好的专业领域数据中的相关知识,经过知识融合的本体对齐和实体匹配等操作进行配电网知识图谱的构建,并进行储存。
由于配网知识图谱主要为配电网工程人员提供服务,对图谱中的实体和关系的准确性提了很高的要求,因此本文在分析数据源之后,考虑到配电网领域知识的难度大等特点,通过对文本结构以及电力专业术语及其之间关系进行文本名词构建,确定电网核心概念,构建电网领域的知识图谱。
步骤1.2)构建数据存储层:
知识库主要功能在于有效解决半结构化或者非结构化决策问题,是通过一定知识代表方法在计算机内进行存储、管理、使用存在密切联系的知识集合。
知识库合理采用某个特定领域内的知识,并把上述无用的知识集合在一起,它就是把智能引擎与数据库技术相互结合,而创建的用于完成知识表达、存储及交流的系统。
构建数据关联知识库时,先要确定其数据类别、检索方法等内容,依托变更、配置及发布等管理方法顺利完成数据分类,找到相应地关键字,并根据知识图谱明确其关联性,通过数据库对其展开关联操作。在对数据实施管理过程中,一般会出现大量的检索结果或检索获取的数据缺乏相关性。
其次,必须制定相应地知识库管理制度,并把配置信息、版本信息等内容保存在数据库中。如果发生异常情况,可以先在已经构件的知识库内检索处理方案,如果知识库内并不存在这种异常状况处理方案,需要完成独立处理操作。对异常情况进行修复后,会把新的异常信息和相应地解决方案存储到知识库,方便日后遇到此类异常情况及时进行有效的处理。此外,每次出现的异常情况及其处理均会记录在知识库内,纪录的信息包含:发生时间、异常位置、处理方案等。
从技术视角来说,所建立的关联知识主要划分为数据库和信息检索系统这两部分,对数据展开初始化处理中,将结构化数据添加在数据库内,并把非结构化数据存储到信息检索系统中。构建的知识库满足下列检索条件:能够依据异常类型、故障装置等各类关键词展开检索,对于满足要求的知识,根据摘要形式显示出来,便于用户进行选择。这种方法主要优势在于,可以通过关键词组合,准确检索出相应地匹配信息。由此表明,挑选合理的关键词尤为重要,它会影响最终的匹配结果。
进一步地,构建数据存储层的目的主要是为了负责操作票元数据的物理存储管理,一方面实现对内容元数据、检索索引和非结构化数据的保存,并开放相关数据存取接口;另一方面还要通过文件系统和存储资源代理服务来实现数字流的保存。技术上,该层处于系统的最底层,实际上是一个数据管理系统,可以使用Oracle、MSSQL和MySql等关系数据库作为持久化的结构化数据存储数据库,使用MongDB等云服务产品存储Json、XML和文档等非结构化和半结构化数据。
步骤1.3)知识库检索架构设计:
搜索引擎是知识图谱最典型的应用之一,其目的是协助配电网人员通过所输入的关键字获取所需要的信息,该系统主要实现以下查询功能:实体查询,显示关系以及对应的实体;查篇名,显示文档的内容以及关系;查术语,显示相关的关系以及对应的实体。该系统结合了自然语言数据处理技术和图数据库,也提供了结果的可视化功能,从数据上说,本文的方法是与数据处理和领域专家知识相结合的。
具体地,针对搜索引擎的设计包含了如下步骤:
1.3.1)从数据文档转化为HTML格式文件;
1.3.2)对HTML格式文件进行分析,分析HTML中需要提取出的内容;
1.3.3)对数据进行前处理;
1.3.4)抽取出标题、相关的内容以及术语的实体等;
1.3.5)本体构建,建立文本关系;
1.3.6)对数据进行融合;
1.3.7)存储数据,并可视化数据。
步骤1.4)多渠道获取调度操作知识:
一方面,知识库可以从内部和外部获取操作票相关的知识成果,实现知识的共享;另一方面,知识库可以通过人工录入、自动获取和异构数据库导入的方式获取知识信息,通过整合和相关工具提供检索和分享的功能丰富知识库体系。
根据电力调度文本的特点,在调度操作票长本文过滤任务中,采用单层神经网络和分层长短记忆网络相结合的深度网络模型,并在调度操作票长文本过滤任务中进行应用。
在某一个示例性的实施例中,基于单层神经网络及分层LSTM神经网络,对所述调度操作规则的操作指令进行特征提取、分解,得到所述调度操作规则中的设备信息与操作动作信息,以作为校验准则,并根据所述校验准则更新所述电网调度操作票知识库,在这个过程中涉及两个分析,即电力调度文本特点分析和基于LSTM关联的语义完整性分析。
其中,在电力调度文本特点分析中,包含以下特点:
a)电网调度知识库保存了大量历史操作票信息,但作为训练样本则缺乏标签信息,难以直接应用深度学习等机器学习算法。
b)电力调度操作票中每句对应一个电网操作,操作类型众多,且其理解需要电力专业知识,缺乏常规可利用的资源库和句法知识库。
c)电力调度操作票中操作对象描述复杂,类型众多。往往由厂站、电压等级、设备类型和编号等多个名词共同限定。
进一步地,基于LSTM关联的语义完整性分析包括以下内容:
首先,模型的输入为原始文本经过预处理后的词序列,将其映射为相应的词向量并标注。汉语词汇是语言中能够独立运用的最小语言单元,是语言中的原子结构,所以对中文进行分词是自然语言处理的基础。分词的准确率将会直接影响后续词性标注、句法分析、词向量等相关工作的质量。
其次,将结合了单层神经网络和分层长短记忆网络的深度网络模型用于长文本过滤任务中。利用词语层LSTM网络模型可以得到具有语义的句向量,第二层主题依赖度计算模型、句子层LSTM网络以第一层得到的句向量作为输入,既可以对调度操作指令进行语义分析,有效提高调度操作票的安全性。
在某一个示例性的实施例中,步骤S30需要基于最大匹配算法的操作票任务描述分词器设计,根据操作票知识库,实现操作票的合规性校验及安全防误校核,具体又包括如下步骤:
步骤3.1)知识库操作票词典定义:
3.1.1)定义设备操作词典
定义保护操作及一次设备状态词汇,例如“转检修”、“投退”、“退出”、“轮退”等,形成设备动作词典。
3.1.2)定义设备名称词典
将经过处理的设备模型库的设备名称,例如“断路器”、“母线”、“机组”等词汇导入,形成设备名称词典。
3.1.3)定义厂站词典
将经过处理的电网模型的厂站名称例如“xx1站”、“xx2站”等厂站名称导入,形成厂站名称词典。
3.1.4)定义电压等级词典
将所有可能的电压等级例如“110kV”、“220kV”、“500kV”等形成电压等级词典。
3.1.5)自定义保护名称词典
将所有可能的保护名称例如“单一开关断开”、“过流动作”等形成保护名称词典。
3.1.6)自定义地区名称词典
依据广东所包含的地区名称“佛山”、“东莞”、“汕尾”等,形成区域名称词典。
步骤3.2)设计操作票文本分词器:
分析操作票中工作内容的文本描述特点,本文选择并实现基于正向最大匹配(FMM)和逆向最大匹配(RMM)结合的分词算法。由于操作内容文本格式相对固定,自定义词典可有效提高分词正确率。通常逆向最大匹配算法在准确率上更优。
请参阅图5,在某一个示例性的实施例中,给出了电网调度操作票知识库的建设模型结构示意图:其中,配调调度知识库采用基于对象的存储架构。这种存储架构由客户端、元数据服务器和对象存储器集群组成。对象存储集群以对象为单元对数据解析管理。对象作为最基本的数据存储单元,可以直接为用户提高数据读取服务,这样避免元数据服务在数据管理过程中可能造成的性能瓶颈,且存储平台中的数据一直处于动态更新状态中,存储层中包含数量众多、位置分散的存储设备,通过高速通信网络联通,因此可以在海量数据高效实时更新的前提下保证数据完整性,且数据访问效率得到提升。
请参阅图6,在某一个示例性的实施例中,给出了基于LSTM分析电力调度操作票的整体架构。
操作票指令文本分析问题主要是在操作指令中将无意义分词进行剔除,摘取重点描述文本。本技术主要用LSTM模型提取词语间的语义形成句向量,然后进行操作指令判断和语义关联。
数据处理的第一步是将预处理后的全部数据进行分词,然后用GloVe(GlobalVector)进行词向量训练,将训练好的词向量作为第一层LSTM模块的输入;接着将词向量经过LSTM模型进行训练,得到具有语义的句向量,并将此句向量分别作为操作指令依赖度计算模型和句子层LSTM的输入;然后通过依赖度模型计算,得到句子于主题类别的概率;经过句子层LSTM进一步得到完整的操作指令语义关系表示;最后综合考虑操作任务和操作指令的语义关联两个因素实现调度操作票的语义分析并进行合规校验。需要说明的是,GloVe出现在语料库的统计数据,是信息的主要来源,所有非监督方法学习单词的问题在于如何从这些统计数据生成意义,以及由此产生的词向量可能代表的意义。于是构造了一种新的单词表示模型,即GloVe,用于全局向量,因为全局语料库统计数据是由该模型直接捕获的。
具体地,该步骤又包括以下内容:
第一步,对词语层LSTM层的应用:
模型的第一层是LSTM模块,该层主要用来接收最初的词向量数据,将文本库中的词语用GloVe训练得到词向量表示,通过LSTM模型训练后得到连续的句向量。词语层LSTM接收一个以词语为单位的句子作为网络的序列化输入,每个LSTM单元的输入由上个单元隐藏层的输出和本次输入的词向量组成,词语层LSTM可以得到句子内部词语之间的相互关系。
第二步,调用主题依赖度计算模块:
模型的第二层的第一部分是主题依赖度计算层,用来将句子与其所属主题类别以加权的形式联接,再通过softmax函数(归一化指数函数)得到句子对于类别的概率分布,即句子的主题依赖度向量。下图所示的主题依赖度计算模型实际上是基于单层神经网络的softmax分类器,输入为句向量,输出是句向量对于主题类别的概率。模型的输入为词语层LSTM训练得到的句向量,输出Y是一维实向量,Y的计算公式为Y=W·si+b其中,W是权重矩阵,b为偏置项。主题依赖计算模型如图7所示。
第三步,操作票文本分词器
名词定义:分词器是将一个句子转换为组成该句子的单个单词。用来把操作票指令的描述语句进行分词拆分,根据设定的名称词典进行语义识别。
分析操作票中工作内容的文本描述特点,本实施例选择并实现基于正向最大匹配(FMM)和逆向最大匹配(RMM)结合的分词算法。由于操作内容文本格式相对固定,自定义词典可有效提高分词正确率。通常逆向最大匹配算法在准确率上更优。
设计如图8所示的分词器,首先获取操作票文件,然后进行数据清洗,之后对操作内容进行分词处理,最后保存分词结果。
(4)效果对比
分析调度操作票或检修申请单中工作内容的文本描述特点,选择并实现基于正向最大匹配(FMM)和逆向最大匹配(RMM)结合的分词算法。由于调度操作票或检修内容文本格式相对固定,自定义词典可有效提高分词正确率。通常逆向最大匹配算法在准确率上更优。
文本分词的结果给出了操作票内容的文本结构拆分,但是操作票系统却依然无法识别操作内容的实际含义,无法通过分词结果直接进行检修申请单智能成票。还需要将分词后的操作内容与电网知识库解析关联,生成操作票系统能够识别的结构化对象,具体得到厂站(厂站唯一标识)、设备名称(设备唯一标识)、状态(状态编码)等智能票所需的相关信息,最终由操作票系统智能生成与检修申请单对应的操作票。
操作票工作内容通过分词器分词、语义解析处理等,生成操作票系统能够识别的结构化对象;然后,操作票系统调用专家知识库及成票原理,智能生成操作票如图9所示,具体流程如下:
a)获取检修申请单或操作票内容文件。
b)对分词器进行数据清洗、筛选,保存检修内容分词结果。
c)通过语义解析模块对入库的检修内容分词结构进行标注解析,得到与电网模型关联的结构化对象;当解析失败时,返回步骤b进行算法调整。
d)将解析结果按照操作票系统接口格式与操作票系统成票模块交互。
e)操作票系统根据待成票设备及动作状态,调用成票模块生成对应的操作票。
第二方面:
请参阅图10,本发明实施例还提供一种基于自学习的配电网操作票语义合规性的校验系统,包括:
知识库构建单元01,用于根据预先获取的电网基本调度操作规则、历史操作票语义校验结果,构建电网调度操作票知识库;
在本实施例中,基于电网系统的运行方式、各种保护和自动装置的配合以及电网的调度操作规程,根据电网不同的调度等级,以及广东电网调度机构出台的相关的“电网调度规程”的相关操作要求,将电网中基本调度操作规则进行分解、分类及建模,研究构建电网调度操作票知识库为电网调度业务功能建设提供基础支撑;为智能配网调度操作票的语义解析校验提供数据信息比对,达到提高相应调度操作语义辨识的目的。
知识库更新单元02,用于基于单层神经网络及分层LSTM神经网络,对所述调度操作规则的操作指令进行特征提取、分解,得到所述调度操作规则中的设备信息与操作动作信息,以作为校验准则,并根据所述校验准则更新所述电网调度操作票知识库;
操作票校验单元03,用于对待校验的目标操作票数据进行结构化处理,根据更新后的电网调度操作票知识库,对结构化处理后的目标操作票合规性进行实时校验。
在本实施例中,对操作票中的数据进行结构化处理,自动分析获取操作命令中描述的操作设备与动作,利用智能调度操作知识库中的记录的调度操作知识及电气操作规则进行检查,实现操作票合规性实时监测,实现操作票的安全逻辑校核及防误,其中,对于违反规则会进行主动告警,并暂停模拟过程,提高电气设备运行的可靠性。
第三方面:
在某一个示例性的实施例中,还提供了一种计算机终端设备,包括:
一个或多个处理器;
存储器,与所述处理器耦接,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的基于自学习的配电网操作票语义合规性的校验方法。
处理器用于控制该计算机终端设备的整体操作,以完成上述的基于自学习的配电网操作票语义合规性的校验方法的全部或部分步骤。存储器用于存储各种类型的数据以支持在该计算机终端设备的操作,这些数据例如可以包括用于在该计算机终端设备上操作的任何应用程序或方法的指令,以及应用程序相关的数据。该存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static RandomAccess Memory,简称SRAM),电可擦除可编程只读存储器(Electrically ErasableProgrammable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(ErasableProgrammable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
计算机终端设备可以被一个或多个应用专用集成电路(Application Specific1ntegrated Circuit,简称AS1C)、数字信号处理器(Digital Signal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field ProgrammableGate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行如上述任一项实施例所述的基于自学习的配电网操作票语义合规性的校验方法,并达到如上述方法一致的技术效果。
在某一个示例性的实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现如上述任一项实施例所述的基于自学习的配电网操作票语义合规性的校验方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器,上述程序指令可由计算机终端设备的处理器执行以完成如上述任一项实施例所述的基于自学习的配电网操作票语义合规性的校验方法,并达到如上述方法一致的技术效果。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (10)

1.一种基于自学习的配电网操作票语义合规性的校验方法,其特征在于,包括:
根据预先获取的电网基本调度操作规则和历史操作票语义校验结果,构建电网调度操作票知识库;
基于单层神经网络及分层LSTM神经网络,对所述调度操作规则的操作指令进行特征提取、分解,得到所述调度操作规则中的设备信息与操作动作信息,以作为校验准则,并根据所述校验准则更新所述电网调度操作票知识库;
对待校验的目标操作票数据进行结构化处理,根据更新后的电网调度操作票知识库,对结构化处理后的目标操作票合规性进行实时校验。
2.根据权利要求1所述的基于自学习的配电网操作票语义合规性的校验方法,其特征在于,所述根据预先获取的电网基本调度操作规则和历史操作票语义校验结果,构建电网调度操作票知识库,包括:
构建配电网知识图谱;
根据预设的数据类别、检索方法、依托变更关系、配置方法、发布方法及所述配电网知识图谱,构建数据关联知识库;
构建所述数据关联知识库的搜索引擎;
获得调度操作知识,并根据所述调度操作知识、所述搜索引擎及所述数据关联知识库,构建电网调度操作票知识库。
3.根据权利要求2所述的基于自学习的配电网操作票语义合规性的校验方法,其特征在于,所述搜索引擎的功能包括实体查询、篇名查询及术语查询。
4.根据权利要求1所述的基于自学习的配电网操作票语义合规性的校验方法,其特征在于,所述电网调度操作票知识库基于结构化数据、半结构化数据及纯文本数据构建。
5.根据权利要求1所述的基于自学习的配电网操作票语义合规性的校验方法,其特征在于,在所述基于单层神经网络及分层LSTM神经网络,对所述调度操作规则的操作指令进行特征提取、分解之后,还包括:
对分解后的操作指令数据经过预处理,得到对应的词序列;
根据预设的映射关系,将所述词序列映射为对应的词向量,并对所述词向量进行标注;
基于单层神经网络及分层LSTM神经网络,过滤所述操作指令中的长文本,得到句向量;
根据标注后的词向量及所述句向量进行操作指令语义的完整性分析。
6.根据权利要求1所述的基于自学习的配电网操作票语义合规性的校验方法,其特征在于,还包括:根据最大匹配算法,定义所述电网调度操作票知识库的操作票词典。
7.根据权利要求6所述的基于自学习的配电网操作票语义合规性的校验方法,其特征在于,所述操作票词典包括:设备操作词典、设备名称词典、厂站词典、电压等级词典、自定义保护名称词典及自定义地区名称词典。
8.一种基于自学习的配电网操作票语义合规性的校验系统,其特征在于,包括:
知识库构建单元,用于根据预先获取的电网基本调度操作规则和历史操作票语义校验结果,构建电网调度操作票知识库;
知识库更新单元,用于基于单层神经网络及分层LSTM神经网络,对所述调度操作规则的操作指令进行特征提取、分解,得到所述调度操作规则中的设备信息与操作动作信息,以作为校验准则,并根据所述校验准则更新所述电网调度操作票知识库;
操作票校验单元,用于对待校验的目标操作票数据进行结构化处理,根据更新后的电网调度操作票知识库,对结构化处理后的目标操作票合规性进行实时校验。
9.一种计算机终端设备,其特征在于,包括:
一个或多个处理器;
存储器,与所述处理器耦接,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至7任一项所述的基于自学习的配电网操作票语义合规性的校验方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行实现如权利要求1至7任一项所述的基于自学习的配电网操作票语义合规性的校验方法。
CN202110287290.2A 2021-03-17 2021-03-17 基于自学习的配电网操作票语义合规性的校验方法及系统 Pending CN112860872A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110287290.2A CN112860872A (zh) 2021-03-17 2021-03-17 基于自学习的配电网操作票语义合规性的校验方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110287290.2A CN112860872A (zh) 2021-03-17 2021-03-17 基于自学习的配电网操作票语义合规性的校验方法及系统

Publications (1)

Publication Number Publication Date
CN112860872A true CN112860872A (zh) 2021-05-28

Family

ID=75995146

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110287290.2A Pending CN112860872A (zh) 2021-03-17 2021-03-17 基于自学习的配电网操作票语义合规性的校验方法及系统

Country Status (1)

Country Link
CN (1) CN112860872A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112925884A (zh) * 2021-03-09 2021-06-08 海南电网有限责任公司 一种基于自然语言处理的调度应急知识管理的方法
CN113761880A (zh) * 2021-11-08 2021-12-07 北京中电汇智科技有限公司 一种用于文本校验的数据处理方法、电子设备及存储介质
CN113765100A (zh) * 2021-09-10 2021-12-07 国网上海市电力公司 一种电网故障处理系统及方法
CN113780121A (zh) * 2021-08-30 2021-12-10 国网上海市电力公司 一种基于人工智能的电系操作指令票自动识别应用方法
CN113792548A (zh) * 2021-08-30 2021-12-14 国网天津市电力公司 基于文本分词和统计校验的封面自动生成系统及方法
CN113792538A (zh) * 2021-08-27 2021-12-14 北京科东电力控制系统有限责任公司 一种配电网操作票快速生成方法及装置
CN113806453A (zh) * 2021-09-18 2021-12-17 广东电网有限责任公司 调度操作票综合令自动确认方法、装置、终端及介质
CN113991843A (zh) * 2021-10-21 2022-01-28 广东电网有限责任公司 一种电网调度操作的防误方法、系统、设备和介质
CN114157020A (zh) * 2021-10-27 2022-03-08 国家电网有限公司 一种跨安全分区实现调度指令网络化下令的系统及方法
CN115099606A (zh) * 2022-06-21 2022-09-23 厦门亿力吉奥信息科技有限公司 一种电网调度模型的训练方法及终端
WO2023088249A1 (zh) * 2021-11-18 2023-05-25 华为技术有限公司 一种数据处理的合规性检测方法、装置和相关设备
CN116187313A (zh) * 2023-04-27 2023-05-30 南方电网数字电网研究院有限公司 基于自然语言处理技术的电力操作票设备识别与勘误方法
CN117408631A (zh) * 2023-10-18 2024-01-16 江苏泰坦智慧科技有限公司 操作票的生成方法、装置及存储介质
CN115099606B (zh) * 2022-06-21 2024-06-07 厦门亿力吉奥信息科技有限公司 一种电网调度模型的训练方法及终端

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11272710A (ja) * 1998-03-20 1999-10-08 Omron Corp 情報検索システム、情報検索方法および記録媒体
CN107908738A (zh) * 2017-11-15 2018-04-13 昆明能讯科技有限责任公司 基于电力专业词库的企业级知识图谱搜索引擎的实现方法
CN111178699A (zh) * 2019-12-15 2020-05-19 贵州电网有限责任公司 一种调度操作票智能校核系统构建方法
CN112134310A (zh) * 2020-09-18 2020-12-25 贵州电网有限责任公司 一种基于大数据的人工智能电网调控操作方法及系统
CN112232078A (zh) * 2020-10-10 2021-01-15 云南电网有限责任公司昆明供电局 一种基于双向gru与注意力机制的调度操作票审核方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11272710A (ja) * 1998-03-20 1999-10-08 Omron Corp 情報検索システム、情報検索方法および記録媒体
CN107908738A (zh) * 2017-11-15 2018-04-13 昆明能讯科技有限责任公司 基于电力专业词库的企业级知识图谱搜索引擎的实现方法
CN111178699A (zh) * 2019-12-15 2020-05-19 贵州电网有限责任公司 一种调度操作票智能校核系统构建方法
CN112134310A (zh) * 2020-09-18 2020-12-25 贵州电网有限责任公司 一种基于大数据的人工智能电网调控操作方法及系统
CN112232078A (zh) * 2020-10-10 2021-01-15 云南电网有限责任公司昆明供电局 一种基于双向gru与注意力机制的调度操作票审核方法

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112925884A (zh) * 2021-03-09 2021-06-08 海南电网有限责任公司 一种基于自然语言处理的调度应急知识管理的方法
CN113792538B (zh) * 2021-08-27 2024-05-14 北京科东电力控制系统有限责任公司 一种配电网操作票快速生成方法及装置
CN113792538A (zh) * 2021-08-27 2021-12-14 北京科东电力控制系统有限责任公司 一种配电网操作票快速生成方法及装置
CN113780121A (zh) * 2021-08-30 2021-12-10 国网上海市电力公司 一种基于人工智能的电系操作指令票自动识别应用方法
CN113792548A (zh) * 2021-08-30 2021-12-14 国网天津市电力公司 基于文本分词和统计校验的封面自动生成系统及方法
CN113765100A (zh) * 2021-09-10 2021-12-07 国网上海市电力公司 一种电网故障处理系统及方法
CN113806453A (zh) * 2021-09-18 2021-12-17 广东电网有限责任公司 调度操作票综合令自动确认方法、装置、终端及介质
CN113991843B (zh) * 2021-10-21 2024-06-07 广东电网有限责任公司 一种电网调度操作的防误方法、系统、设备和介质
CN113991843A (zh) * 2021-10-21 2022-01-28 广东电网有限责任公司 一种电网调度操作的防误方法、系统、设备和介质
CN114157020A (zh) * 2021-10-27 2022-03-08 国家电网有限公司 一种跨安全分区实现调度指令网络化下令的系统及方法
CN114157020B (zh) * 2021-10-27 2024-03-29 国家电网有限公司 一种跨安全分区实现调度指令网络化下令的系统及方法
CN113761880A (zh) * 2021-11-08 2021-12-07 北京中电汇智科技有限公司 一种用于文本校验的数据处理方法、电子设备及存储介质
WO2023088249A1 (zh) * 2021-11-18 2023-05-25 华为技术有限公司 一种数据处理的合规性检测方法、装置和相关设备
CN115099606A (zh) * 2022-06-21 2022-09-23 厦门亿力吉奥信息科技有限公司 一种电网调度模型的训练方法及终端
CN115099606B (zh) * 2022-06-21 2024-06-07 厦门亿力吉奥信息科技有限公司 一种电网调度模型的训练方法及终端
CN116187313A (zh) * 2023-04-27 2023-05-30 南方电网数字电网研究院有限公司 基于自然语言处理技术的电力操作票设备识别与勘误方法
CN116187313B (zh) * 2023-04-27 2023-06-27 南方电网数字电网研究院有限公司 基于自然语言处理技术的电力操作票设备识别与勘误方法
CN117408631A (zh) * 2023-10-18 2024-01-16 江苏泰坦智慧科技有限公司 操作票的生成方法、装置及存储介质

Similar Documents

Publication Publication Date Title
CN112860872A (zh) 基于自学习的配电网操作票语义合规性的校验方法及系统
CN112612902B (zh) 一种电网主设备的知识图谱构建方法及设备
CN111177394B (zh) 基于句法注意力神经网络的知识图谱关系数据分类方法
Yan et al. KnowIME: a system to construct a knowledge graph for intelligent manufacturing equipment
US8577823B1 (en) Taxonomy system for enterprise data management and analysis
CN103631882B (zh) 基于图挖掘技术的语义化业务生成系统和方法
CN108874878A (zh) 一种知识图谱的构建系统及方法
CN106919689A (zh) 基于术语释义知识单元的专业领域知识图谱动态构建方法
CN115357726A (zh) 基于知识图谱的故障处置预案数字化模型建立方法
CN111090730A (zh) 智能语音调度系统及方法
CN117271767B (zh) 基于多智能体的运维知识库的建立方法
CN113095050A (zh) 一种智能成票方法、系统、设备及存储介质
CN115438199A (zh) 一种基于智慧城市场景数据中台技术的知识平台系统
CN115794798A (zh) 一种市场监管信息化标准管理与动态维护系统及方法
CN115033705A (zh) 电网调控风险预警信息知识图谱设计方法及系统
CN114282010A (zh) 基于知识图谱的电网运行故障识别方法、系统及存储介质
CN113869040A (zh) 一种电网调度的语音识别方法
CN110633468B (zh) 一种关于对象特征提取的信息处理方法及装置
EP1351156A1 (en) System and method for automatically performing functional analyses of technical texts
CN115759253A (zh) 电网运维知识图谱构建方法及系统
CN115129890A (zh) 回馈数据图谱生成方法、生成设备、问答设备及冰箱
CN115619117A (zh) 基于值班系统的电网智能调度方法
CN114722159A (zh) 针对数控机床制造资源的多源异构数据处理方法及系统
Hu et al. A classification model of power operation inspection defect texts based on graph convolutional network
CN113360680A (zh) 一种基于电力审计制度的无监督知识图谱构建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination