CN113360641A - 一种基于深度学习的电网故障处置预案语义建模系统及方法 - Google Patents
一种基于深度学习的电网故障处置预案语义建模系统及方法 Download PDFInfo
- Publication number
- CN113360641A CN113360641A CN202110495901.2A CN202110495901A CN113360641A CN 113360641 A CN113360641 A CN 113360641A CN 202110495901 A CN202110495901 A CN 202110495901A CN 113360641 A CN113360641 A CN 113360641A
- Authority
- CN
- China
- Prior art keywords
- plan
- entity
- fault handling
- module
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000013135 deep learning Methods 0.000 title claims abstract description 19
- 238000000605 extraction Methods 0.000 claims abstract description 71
- 239000012634 fragment Substances 0.000 claims abstract description 36
- 238000013507 mapping Methods 0.000 claims abstract description 27
- 238000004458 analytical method Methods 0.000 claims description 19
- 238000013136 deep learning model Methods 0.000 claims description 19
- 238000012549 training Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 8
- 238000002372 labelling Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 4
- 238000013527 convolutional neural network Methods 0.000 claims description 3
- 230000002457 bidirectional effect Effects 0.000 claims description 2
- 238000003062 neural network model Methods 0.000 claims description 2
- 230000006798 recombination Effects 0.000 claims description 2
- 238000005215 recombination Methods 0.000 claims description 2
- 230000001105 regulatory effect Effects 0.000 claims description 2
- 239000013589 supplement Substances 0.000 claims 1
- 101150026173 ARG2 gene Proteins 0.000 description 12
- 101100260702 Mus musculus Tinagl1 gene Proteins 0.000 description 12
- 101150088826 arg1 gene Proteins 0.000 description 12
- 230000033228 biological regulation Effects 0.000 description 5
- 230000003993 interaction Effects 0.000 description 3
- 206010063385 Intellectualisation Diseases 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于深度学习的电网故障处置预案语义建模系统及方法,采用词向量模块完成故障处置预案文本向量化表示,采用预案实体识别模块和预案关系抽取模块完成对故障处置预案文本中全部实体成分提取,采用预案意图理解模块完成对故障处置预案中不同处置片段的意图判别,基于不同意图完成不同设备类型表的选择,进而完成设备快速映射。本发明各模块相互配合使用,能够快速、准确的实现故障处置预案中关键信息提取,解决了故障处置预案电子化时人工提取和智能化水平低的问题,在故障处置时依赖人工翻阅故障处置预案文档效率极低的问题,相比于一般的预案提取方式,更为合理,准确率得到很大的提升。
Description
技术领域
本发明涉及自然语言处理与电网调控交叉领域,尤其涉及一种基于深度学习的电网故障处置预案语义建模系统及方法。
背景技术
随着特高压交直流混联电网的迅速发展,电网规模不断扩大,运行方式灵活多变,电网调控业务越来越复杂,调控人员工作强度也越来越大,这对调控业务的自动化、智能化提出了更高的要求。特别是在电网发生故障的情况下,要求快速解决故障,保证供电稳定性,对电网故障处置系统提出了更高的要求。目前排查电网故障方式及解决方案主要依赖于调度人员根据电网故障处置预案结合调度自动化系统实时信息进行故障处置。
电网运行方式日益复杂,单一故障引发连锁故障风险增加、运行方式规定显著增多、人工处置风险增加、经验难以复用等问题增加了故障处置的难度。故障方式复杂多样,对调度人员经验性依赖严重,新进调度人员工作产生极大的压力。因此,需要快速准确的对故障预案关键信息进行抽取,实现故障处置智能化。故障预案关键信息的自动抽取能极大的减少调度人员的工作强度,降低人工操作风险和工作负荷。同时为后续的电网故障处置、预案校核等应用提供支撑。
发明内容
本发明的目的就是要提供一种基于深度学习的电网故障处置预案语义建模系统及方法,解决故障处置时主要依赖于人工经验,智能化水平低的问题,该系统能快速、准确的抽取电网故障预案中的关键信息,为后续的电网故障处置、预案校核等应用提供支撑。
为实现此目的,本发明所设计的一种基于深度学习的电网故障处置预案语义建模系统,包括预案概念模型模块、预案文本标记模块、词向量模型构建模块、预案实体识别模块、预案关系抽取模块、预案意图理解模块、实体设备映射模块和预案解析模块,所述预案概念模型模块用于定义故障处置预案实体类别和实体关系,并给出实体类别和实体关系的表示方式;所述预案文本标记模块根据所述预案概念模型模块定义的预案实体类别和实体关系的表示方式,对历史故障处置预案文本中的实体类别和实体关系进行标记,并根据标记结果中的触发词成分,将历史故障处置预案文本数据转化为多个处置片段的标签数据;所述词向量模型构建模块使用电力领域专业词汇数据集,训练word2vec语言模型构建电力领域词向量模型,用于将历史故障处置预案或待提取故障处置预案文本数据转化为历史故障处置预案或待提取故障处置预案词向量数据;所述预案实体识别模块使用所述预案文本标记模块输出的历史故障处置预案多个处置片段的标签数据及所述词向量模型构建模块输出的历史故障处置预案词向量数据,基于深度学习模型建立预案实体识别模型,用于对待提取故障处置预案文本中的实体成分进行提取;所述预案关系抽取模块使用所述预案文本标记模块输出的历史故障处置预案中前置宾语、宾语和后置宾语这些特定实体的标签数据及所述词向量模型构建模块输出的历史故障处置预案词向量数据,基于深度学习模型建立预案关系抽取模型,用于抽取待提取故障处置预案中前置宾语、宾语和后置宾语这些特定实体之间的主宾关系,重新组合生成完整宾语成分;所述预案意图理解模块使用历史故障处置预案的意图类别标签数据及所述词向量模型构建模块输出的历史故障处置预案词向量数据,基于深度学习模型建立预案意图理解模型,用于对待提取故障处置预案各处置片段的意图类别进行判定;所述实体设备映射模块通过预案实体识别模块和预案关系抽取模块提取故障处置预案文本中的独立实体宾语成分,对独立实体宾语成分进行映射标准化,通过预案意图理解模块获得独立实体宾语成分所属意图类别,基于意图类别确定设备类型表的选择,基于文本相似度计算的方式,实现所提取的独立实体宾语成分与设备类型表中标准名称映射,获得待提取故障处理预案文本对应的设备标准名称;所述预案解析模块基于词向量模型、预案实体识别模型、预案关系抽取模型、预案意图理解模型和实体设备映射模块完成待提取故障处置预案解析工作。
一种基于深度学习的电网故障处置预案语义建模方法,它包括如下步骤:
步骤1,预案概念模型模块定义预案实体类别和实体关系并给出对应的表示方式;
步骤2,预案文本标记模块根据步骤1确定的实体类别和实体关系,对故障处置预案文本进行标记,将故障处置预案文本数据转化为多个故障处置预案处置片段的标签数据;
步骤3,词向量模型构建模块构建电力领域词向量模型,用于将故障处置预案文本数据转化为故障处置预案词向量数据;
步骤4,预案实体识别模块使用步骤2得到的标签数据和步骤3输出的故障处置预案词向量数据,基于深度学习模型建立预案实体识别模型,用于对故障处置预案文本中不同类别的实体成分进行提取;
步骤5,预案关系抽取模块使用步骤2得到的标签数据和步骤3输出的故障处置预案词向量数据,基于深度学习模型建立预案关系抽取模型,用于抽取故障处置预案文本中前置宾语、宾语和后置宾语这些特定实体间的关系,获得特定实体之间的预案组合事件;
步骤6,预案意图理解模块建立预案意图理解模型使用意图类别标签数据及所述词向量模型构建模块输出的故障处置预案词向量数据,基于深度学习模型建立预案意图理解模型,用于对所述故障处置预案各处置片段的意图进行理解;
步骤7,实体设备映射模块通过预案实体识别模块和预案关系抽取模块提取故障处置预案文本中的独立实体宾语成分,对独立实体宾语成分进行映射标准化,通过预案意图理解模块获得独立实体宾语成分所属意图类别,基于意图类别确定设备类型表的选择,基于文本相似度计算的方式,实现所提取的独立实体宾语成分与设备类型表中标准名称映射,获取设备标准名称;
步骤8,预案解析模块利用步骤3构建的词向量模型将待提取故障处置预案文本数据转换为待提取故障处置预案词向量数据;
步骤9,将步骤8中生成的待提取故障处置预案词向量数据传入到步骤4构建得到的预案实体识别模型中,经过预案实体识别模型预测后,输出以BIO表示的待提取故障处置预案处置片段;
步骤10,将步骤8中生成的待提取故障处置预案词向量数据传入到步骤5构建得到的预案关系抽取模型中,经过预案关系抽取模型预测后,输出以BIO表示的待提取故障处置预案处置片段;
步骤11,经过步骤9预案实体识别模型提取和步骤10预案关系抽取模型实现关系匹配后,最终得到了待提取故障处置预案处置片段实体提取结果;
步骤12、将步骤8中生成的待提取故障处置预案词向量数据传入到步骤6构建的预案意图识别模型中,经过预案意图识别模型预测后,得到待提取故障处置预案每个处置片段的意图类别,再结合步骤11中得到的实体提取结果,将待提取故障处置预案每个处置片段表示形式中新增意图‘intention’字段;
步骤13,根据步骤12中待提取故障处置预案不同处置片段对应的不同意图类别,每个处置片段根据对应的意图到对应类型的设备类型表中匹配设备,通过文本相似度计算的方式实现预案提取实体和设备表中标准名称设备的映射,完成待提取故障处置预案解析流程,获得待提取故障处置预案文本的解析结果。
本发明的有益效果为:
1、本发明解决了故障处置时主要依赖于人工经验,智能化水平低的问题。构建的故障概念模型,对故障预案中实体类别与实体关系进行了定义,根据概念模型定义的实体类别和实体关系,对故障预案进行标记,相比于一般的预案提取方式,更为合理,准确率得到很大的提升。
2、本发明采用自然语言处理技术相关技术构建词向量模型,采用多种深度学习模型分别构建了实体识别模型,关系抽取模型和意图理解模型,几种模型的相互配合使用,能够实现高准确率的故障预案关键信息提取。
3、本发明中采用的意图判别模型使得提取到的故障预案关键信息带有意图信息,在实时处置故障时,能够根据实时信息,快速判别意图,辅助调度人员快速找到预案故障处置方法,有效提升了故障处置速度。
附图说明
图1为本发明系统结构图;
图2为本发明方法流程图;
其中,1-预案概念模型模块、2-预案文本标记模块、3-词向量模型构建模块、4-预案实体识别模块、5-预案关系抽取模块、6-预案意图理解模块、7-实体设备映射模块和8-预案解析模块。
具体实施方式
以下结合附图和具体实施例对本发明作进一步的详细说明:
本发明所设计的一种基于深度学习的电网故障处置预案语义建模系统,如图1所示,它包括预案概念模型模块1、预案文本标记模块2、词向量模型构建模块3、预案实体识别模块4、预案关系抽取模块5、预案意图理解模块6、实体设备映射模块7和预案解析模块8,所述预案概念模型模块1用于定义故障处置预案实体类别和实体关系,并给出实体类别和实体关系的表示方式;所述预案文本标记模块2根据所述预案概念模型模块1定义的预案实体类别和实体关系的表示方式,对历史故障处置预案文本中的实体类别和实体关系进行标记,并根据标记结果中的触发词成分,将历史故障处置预案文本数据转化为多个处置片段的标签数据;所述词向量模型构建模块3使用电力领域专业词汇数据集,训练word2vec语言模型构建电力领域词向量模型,用于将历史故障处置预案或待提取故障处置预案文本数据转化为历史故障处置预案或待提取故障处置预案词向量数据;所述预案实体识别模块4使用所述预案文本标记模块2输出的历史故障处置预案多个处置片段的标签数据及所述词向量模型构建模块3输出的历史故障处置预案词向量数据,基于深度学习模型建立预案实体识别模型,用于对待提取故障处置预案文本中的实体成分进行提取;所述预案关系抽取模块5使用所述预案文本标记模块2输出的历史故障处置预案中前置宾语、宾语和后置宾语这些特定实体的标签数据及所述词向量模型构建模块3输出的历史故障处置预案词向量数据,基于深度学习模型建立预案关系抽取模型,用于抽取待提取故障处置预案中前置宾语、宾语和后置宾语这些特定实体之间的主宾关系,重新组合生成完整宾语成分;所述预案意图理解模块6使用历史故障处置预案的意图类别标签数据及所述词向量模型构建模块3输出的历史故障处置预案词向量数据,基于深度学习模型建立预案意图理解模型,用于对待提取故障处置预案各处置片段的意图类别进行判定;所述独立实体中只有宾语成分为电力设备,而提取的独立实体宾语成分为非标准名称,因此需要对独立实体宾语成分所对应的非标准名称映射为电力设备标准名称,所述实体设备映射模块7通过预案实体识别模块4和预案关系抽取模块5提取故障处置预案文本中的独立实体宾语成分,对独立实体宾语成分进行映射标准化,通过预案意图理解模块6获得独立实体宾语成分所属意图类别,基于意图类别确定设备类型表的选择,基于文本相似度计算的方式,实现所提取的独立实体宾语成分与设备类型表中标准名称映射,获取设备标准名称;所述预案解析模块8基于词向量模型、预案实体识别模型、预案关系抽取模型、预案意图理解模型和实体设备映射模块7完成待提取故障处置预案解析工作。
上述技术方案中,所述实体类别包括独立实体(Indepent)和触发词实体(Action);所述实体关系包括独立实体与独立实体之间的关系和独立实体与触发词实体之间的关系,所述独立实体与独立实体之间的关系包括前置实体关系(start)和后置实体关系(end),所述独立实体与触发词实体之间的关系包括主语关系(subject)、宾语关系(object)、宾补关系(objectcomplement)、状语关系(adverbialend)、触发词同位关系(objectaction)和条件关系(condition)。
上述技术方案中,所述预案文本标记模块2的具体实现方法为:根据所述预案概念模型模块1定义的预案实体类别和预案实体关系,得到故障处置预案中的实体类别和实体关系匹配信息,以触发词实体为核心,以由该触发词控制的独立实体共同构成一个完整的处置片段,利用BIO标记法结合所述预案概念模型模块1定义的实体类别及实体关系的表示方式,将故障处置预案中的实体成分分类表示,并转换成标签数据;
当故障处置预案中的触发词实体没有控制任何独立实体时,对这种类型的触发词实体进行单独处理,将这种类型的触发词实体表示方式转换成标签数据:使用“NA”表示无需提取的触发词实体,“B-NA”表示抑,具体表示方式为:制触发词提取开始部分,“I-NA”表示抑制触发词提取其它部分。
上述技术方案中,所述实体成分分类表示共得到18种标签数据表示形式,非实体成分1种标签数据表示形式,共计19种标签数据表示形式,具体表示方式为:触发词实体开始部分表示为“B-action”,触发词实体其余部分表示为“I-action”,主语实体开始部分表示为“B-subject_Indepent”,主语实体其余部分表示为“I-subject_Indepent”,宾语实体开始部分表示为“B-object_Indepent”,宾语实体其余部分表示为“I-object_Indepent”,前置宾语实体开始部分表示为“B-object_Indepentstart”,前置宾语实体其余部分表示为“I-object_Indepentstart”,后置宾语实体开始部分表示为“B-object_Indepentend”,后置宾语实体其余部分表示为“I-object_Indepentend”,宾补实体开始部分表示为“B-objectcomplement_Indepent”,宾补实体其余部分表示为“I-objectcomplement_Indepent”,状语实体开始部分表示为“B-adverbialend_Indepent”,状语实体其余部分表示为“I-adverbialend_Indepent”,触发词同位实体开始部分表示为“B-objectaction_Indepent”,触发词同位实体其余部分表示为“I-objectaction_Indepent”,条件实体开始部分表示为“B-condition_Indepent”,条件实体其余部分表示为“I-condition_Indepent”,将非实体成分表示为“O”。
上述技术方案中,所述词向量模型构建模块3的具体实现方式为:使用电网调度规程、电网故障处置细则、电网故障预案和电网作业指导书中提炼出的电力领域专业词汇数据集,训练word2vec语言模型,在对word2vec语言模型建模过程中,通过不断自学习调整word2vec语言模型权重参数,使得word2vec语言模型能够较好地适应电力领域专业词汇,使用训练好的word2vec语言模型权重参数构建电力领域词向量模型,用于故障处置预案文本的向量化处理,将故障处置预案文本数据转化为故障处置预案词向量数据,在本发明中,文本中的每个字符将被映射为1*100维度的词向量。
上述技术方案中,所述预案实体识别模块4的具体实现方法为:通过预案文本标记模块2生成的故障处置预案标签数据和所述词向量模型构建模块3生成的故障处置预案词向量数据作为训练集数据,基于双向长短期记忆网络和条件随机场(Bi-LSTM+CRF)模型进行训练,训练后得到的实体识别模型用于对故障处置预案文本中的不同类别实体成分进行提取。
上述技术方案中,所述预案关系抽取模块5的具体实现方法为:通过预案文本标记模块2生成的故障处置预案部分标签数据和所述词向量模型构建模块3生成的故障处置预案词向量数据,基于卷积神经网络(CNN)进行训练,生成的预案关系抽取模型用于实现故障处置预案文本中实体关系匹配;
所述故障处置预案部分标签数据指的是宾语、前置宾语和后置宾语三种实体对应的6类标签“B-object_Indepent”、“I-object_Indepent”、“B-object_Indepentstart”、“I-object_Indepentstart”、“B-object_Indepentend”、“I-object_Indepentend”,此时其它成分都是用“O”标签表示,训练完成后的预案关系抽取模型用于提取故障处置预案中的宾语,前置宾语和后置宾语成分,然后依据三种成分关系进行拼接,实现宾语成分重新组合;所述三种成分的关系为“前置宾语-宾语-后置宾语”。
上述技术方案中,所述预案意图理解模块6的具体实现方法为:对预案文本标记模块2得到的故障处置预案各处置片段进行意图类别标记,构建意图类别标签数据集,使用词向量模型构建模块3得到的词向量模型,将各处置片段数据转换为词向量数据,基于文本卷积神经网络模型对故障处置预案中各意图进行分类训练,训练后生成的预案意图理解模型用于故障处置预案各处置片段的意图分类;
所述意图类别包括通知类、开停机类、调整出力类、控制潮流类、控制频率类和控制电压类。
上述技术方案中,所述实体设备映射模块7的具体实现方式为:将故障处置预案中的独立实体宾语成分定义为以下9个类别:1-区域、2-厂站、3-母线、4-机组、5-交流线段、6-变压器、7-断面、8-直流线路,9-其它,每种类型分别对应一个设备类型表,表中存储的信息为电力设备的标准名称,表中数据从智能调度控制系统(D5000系统)中获取;
通过预案意图理解模块6获得独立实体宾语成分所属意图类别,基于意图类别确定设备类型表的选择,不同意图类别的预案文本中实体对应的设备类型不同,具体对应关系如下:
所述意图类别为控制频率类时,实体对应的设备类型为1-区域,3-母线;
所述意图类别为调整出力类时,实体对应的设备类型为1-区域,2-厂站;
所述意图类别为控制潮流类时,实体对应的设备类型为5-交流线段,6-变压器,7-断面,8-直流线路;
所述意图类别为开停机类时,实体对应的设备类型为2-厂站,4-机组,5-交流线段,6-变压器。
所述意图类别为控制电压类时,实体对应的设备类型为1-区域,3-母线;
所述意图类别为通知类时,实体对应为9-其它;
根据意图类别得到相应的设备类型表,基于文本相似度计算的方式,实现所提取的独立实体宾语成分与设备类型表中标准名称映射,获取设备标准名称。一种基于深度学习的电网故障处置预案语义建模方法,其特征在于:它包括如下步骤:
步骤1,所述预案概念模型模块1根据故障处置预案应用需求,定义预案实体类别和实体关系并给出对应的表示方式;
下面将举例说明应用以上表示方式,如何对一个故障处置预案文本进行标注。预案原句为:
“立即采取送端减出力、受端加出力的方法,调整XX电厂、XX电厂、XX电厂出力,消除设备重载情况,调整过程中注意不使相关断面过稳定极限。”
故障处置预案数据实体成分定义示例:
故障处置预案实体关系定义示例:
关系序列 | 实体关系 | 实体1 | 实体2 |
R1 | object | Arg1:T1 | Arg2:T2 |
R2 | object | Arg1:T1 | Arg2:T3 |
R3 | object | Arg1:T1 | Arg2:T4 |
R4 | objectcomplement | Arg1:T1 | Arg2:T5 |
R5 | object | Arg1:T6 | Arg2:T7 |
R6 | objectcomplement | Arg1:T6 | Arg2:T8 |
R7 | object | Arg1:T9 | Arg2:T10 |
R8 | objectcomplement | Arg1:T9 | Arg2:T11 |
R9 | object | Arg1:T12 | Arg2:T13 |
R10 | objectcomplement | Arg1:T12 | Arg2:T14 |
R11 | object | Arg1:T15 | Arg2:T16 |
R12 | adverbialend | Arg1:T15 | Arg2:T17 |
步骤2,所述预案文本标记模块2根据步骤1确定的实体类别和实体关系,对故障处置预案文本进行标记,将故障处置预案文本数据转化为多个故障处置预案处置片段的标签数据;
本实施例包含的处置片段为:“送端减出力”、“受端加出力”、“调整XX电厂、XX电厂、XX电厂出力”、“消除设备重载情况”和“注意相关断面过稳定极限”。每个处置片段对应在原句中的标记表示如下:
处置片段1“送端减出力”对应在原句中的标记为:
["O","O","O","O","B-object_Indepent","I-object_Indepent","B-action","B-object_complement_Indepent","I-objectcomplement_Indepent","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O"]
处置片段2“受端加出力”对应在原句中的标记为:
["O","O","O","O","O","O","O","O","O","O","B-object_Indepent","I-object_Indepent","B-action","B-objectcomplement_Indepent","I-objectcomplement_Indepent","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O"]
处置片段3“调整XX电厂、XX电厂、XX电厂出力”对应在原句中的标记为:
["O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","B-action","I-action","B-object_Indepent","I-object_Indepent","I-object_Indepent","I-object_Indepent","O","B-object_Indepent","I-object_Indepent","I-object_Indepent","I-object_Indepent","O","B-object_Indepent","I-object_Indepent","I-object_Indepent","I-object_Indepent","B-objectcomplement_Indepent","I-objectcomplement_Indepent","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O"]
处置片段4“消除设备重载情况”对应在原句中的标记为:
["O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","B-action","I-action","B-object_Indepent","I-object_Indepent","B-objectcomplement_Indepent","I-objectcomplement_Indepent","I-objectcomplement_Indepent","I-objectcomplement_Indepent","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O"]
处置片段5“注意相关断面过稳定极限”对应在原句中的标记为:
["O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","B-action","I-action","O","O","B-object_Indepent","I-object_Indepent","I-object_Indepent","I-object_Indepent","B-adverbialend_Indepent","I-adverbialend_Indepent","I-adverbialend_Indepent","I-adverbialend_Indepent","I-adverbialend_Indepent","O"]。
当故障处置预案中的触发词实体没有控制任何独立实体时,该类型触发词实体在故障处置预案文本中没有实际意义,不需要对其进行提取,该类型触发词需要单独对其进行处理,对步骤1中预案原句无需提取的触发词实体标记如下:
抑制动词“调整”:
["O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","B-NA","I-NA","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O","O"]
步骤3,词向量模型构建模块3构建电力领域词向量模型,用于将故障处置预案文本数据转化为故障处置预案词向量数据;
步骤4,预案实体识别模块4使用步骤2得到的标签数据和步骤3输出的故障处置预案词向量数据,基于深度学习模型建立预案实体识别模型,用于对故障处置预案文本中不同类别的实体成分进行提取;
步骤5,预案关系抽取模块5使用步骤2得到的标签数据和步骤3输出的故障处置预案词向量数据,基于深度学习模型建立预案关系抽取模型,用于抽取故障处置预案文本中前置宾语、宾语和后置宾语这些特定实体间的关系,获得特定实体之间的预案组合事件;
步骤6,预案意图理解模块6建立预案意图理解模型使用意图类别标签数据及所述词向量模型构建模块3输出的故障处置预案词向量数据,基于深度学习模型建立预案意图理解模型,用于对所述故障处置预案各处置片段的意图进行理解;
所述步骤2中每个处置片段对应意图类别标记结果如下:
“送端减出力”:[调整出力类]
“受端加出力”:[调整出力类]
“调整XX电厂、XX电厂、XX电厂出力”:[调整出力类]
“消除设备重载情况”:[控制潮流类]
“注意不使相关断面过稳定极限”:[控制潮流类]
步骤7,实体设备映射模块7通过预案实体识别模块4和预案关系抽取模块5提取故障处置预案文本中的独立实体宾语成分,对独立实体宾语成分进行映射标准化,通过预案意图理解模块6获得独立实体宾语成分所属意图类别,基于意图类别确定设备类型表的选择,基于文本相似度计算的方式,实现所提取的独立实体宾语成分与设备类型表中标准名称映射,获取设备标准名称;
步骤8,预案解析模块8利用步骤3构建的词向量模型将待提取故障处置预案文本数据转换为待提取故障处置预案词向量数据;
选择需要待提取故障处置预案实施例为:“XX#3、#5机组全开方式,若500千伏XXⅡ线跳闸,控制XX断面不超155万。”,将待提取故障处置预案实施例转换为向量数据。
例如上述用例中字符“机”转换为词向量可表示为:
[0.170102 -0.832262 -0.281234 0.291540 0.217232 0.290143 -0.092888 -0.130614 0.202843 0.562578 -0.035426 0.226811 -0.224674 -0.607814 0.2897820.486445 0.385826 -0.160615 0.043471 0.098081 0.428678 0.065562 0.015697 -0.522103 -0.144591 0.219013 0.133267 0.281189 0.204774 -0.185558 0.224272 -0.030857 -0.274016 -0.033239 -0.424525 0.136114 0.169224 0.141312 0.318629 -0.342540 0.158911 0.083860-0.562955 0.026275 0.016840 -0.073589 -0.0574480.300841 0.269016 0.369717 -0.211455 0.433156 0.148747 0.100287 -0.217242 -0.049027 0.330630 0.144654 -0.261786 -0.257569 -0.311419 -0.167388 0.0100680.161580 0.051959 0.010868 -0.143416 -0.248380 0.394039-0.169838 0.3525560.128648 -0.191745 -0.300494 0.223729 0.094629 -0.216666 -0.043492 0.253626 -0.108560 0.099275 0.441120 -0.035251 0.075970 0.276398 -0.060985 -0.027600 -0.204556 -0.180156 -0.369619 -0.311356 -0.195622 0.431405 0.129717 -0.0579520.099833 0.115254 0.522951 0.169457 0.580028]
步骤9,将步骤8中生成的待提取故障处置预案词向量数据传入到步骤4构建得到的预案实体识别模型中,经过预案实体识别模型预测后,输出以BIO表示的待提取故障处置预案处置片段,如下所示:
处置片段1输出结果:
['B-object_Indepentstart','I-object_Indepentstart','B-object_Indepent','I-object_Indepent','O','B-object_Indepent','I-object_Indepent','B-object_Indepentend','I-object_Indepentend','B-action','I-action','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O']
处置片段2输出结果:
['O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','B-object_Indepent','I-object_Indepent','I-object_Indepent','I-object_Indepent','B-action','I-action','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O']
处置片段3输出结果:
['O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','B-action','I-action','B-object_Indepent','I-object_Indepent','I-object_Indepent','I-object_Indepent','I-object_Indepent','I-object_Indepent','B-adverbialend_Indepent','I-adverbialend_Indepent','I-adverbialend_Indepent','I-adverbialend_Indepent','I-adverbialend_Indepent','I-adverbialend_Indepent']
将对应的标签数据表示转化为文本数据得到:
处置片段1文本表示:
[{'word':'XX','type':'object_Indepentstart','offset':0,'length':2},{'word':'#3','type':'object_Indepent','offset':2,'length':2},{'word':'#5','type':'object_Indepent','offset':5,'length':2},{'word':'机组','type':'object_Indepentend','offset':7,'length':2},{'word':'全开','type':'action','offset':9,'length':2}]
处置片段2文本表示:
[{'word':'XXⅡ线','type':'object_Indepent','offset':20,'length':4},{'word':'跳闸','type':'action','offset':24,'length':2}]
处置片段3文本表示:
[{'word':'控制','type':'action','offset':27,'length':2},{'word':'XX断面','type':'object_Indepent','offset':29,'length':6},{'word':'不超155万','type':'adverbialend_Indepent','offset':35,'length':6}]
步骤10,将步骤8中生成的待提取故障处置预案词向量数据传入到步骤5构建得到的预案关系抽取模型中,经过预案关系抽取模型预测后,输出以BIO表示的待提取故障处置预案处置片段;如下所示:
['B-object_Indepentstart','I-object_Indepentstart','B-object_Indepent','I-object_Indepent','O','B-object_Indepent','I-object_Indepent','B-object_Indepentend','I-object_Indepentend','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O','O']
对上述输出结果进行实体解码,将对应的标签数据转化为文本数据表示,并进行宾语成分重新组合得到:
[{'word':'XX#3机组','type':'object_Indepent','object_Indepent':2,'length':2,'object_Indepentstart':0,'length':2,'object_Indepentend':7,'length':2},{'word':'XX#5机组','type':'object_Indepent','object_Indepentstart':5,'length':2,'object_Indepent':0,'length':2,'object_Indepentend':7,'length':2}]
步骤11,经过步骤9预案实体识别模型提取和步骤10预案关系抽取模型实现关系匹配后,最终得到了待提取故障处置预案处置片段实体提取结果,如下所示:
处置片段1实体提取结果:
{'object':[{'word':'XX#3机组'},{'word':'XX#5机组'}],'trigger':[{'word':'全开','start':9}],'text_id':0}
处置片段2实体提取结果:
{'object':[{'word':'XXⅡ线'}],'trigger':[{'word':'跳闸'}],'text_id':0}
处置片段3实体提取结果:
{'object':[{'word':'XX断面'}],'trigger':[{'word':'控制'}],'adverbialend':[{'word':'不超155万'}],'text_id':0'}
步骤12、将步骤8中生成的待提取故障处置预案词向量数据传入到步骤6构建的预案意图识别模型中,经过预案意图识别模型预测后,得到待提取故障处置预案每个处置片段的意图类别,再结合步骤11中得到的实体提取结果,将待提取故障处置预案每个处置片段表示形式中新增意图‘intention’字段;如下所示:
处置片段1:
{'object':[{'word':'XX#3机组'},{'word':'XX#5机组'}],'trigger':[{'word':'全开','start':9}],'text_id':0,‘intention’:[开停机类]}
处置片段2:
{'object':[{'word':'XXⅡ线'}],'trigger':[{'word':'跳闸'}],'text_id':0‘intention’:[开停机类]}
处置片段3
{'object':[{'word':'XX断面'}],'trigger':[{'word':'控制'}],'adverbialend':[{'word':'不超155万'}],'text_id':0',‘intention’:[控制潮流类]}
步骤13,根据步骤12中待提取故障处置预案不同处置片段对应的不同意图类别,每个处置片段根据对应的意图到对应类型的设备类型表中匹配设备,通过文本相似度计算的方式实现预案提取实体和设备表中标准名称设备的映射,完成待提取故障处置预案解析流程,获得待提取故障处置预案文本的解析结果。
[["开停机类",["XX省.XX厂.#3机","XX省.XX厂.#5机"],"全开"],["开停机类",["XX区.XXⅡ回线"],"跳闸"],["控制潮流类",["XX断面"],["0","1550MW"]]]
本说明书未作详细描述的内容属于本领域专业技术人员公知的现有技术。
Claims (10)
1.一种基于深度学习的电网故障处置预案语义建模系统,其特征在于:它包括预案概念模型模块(1)、预案文本标记模块(2)、词向量模型构建模块(3)、预案实体识别模块(4)、预案关系抽取模块(5)、预案意图理解模块(6)、实体设备映射模块(7)和预案解析模块(8),所述预案概念模型模块(1)用于定义故障处置预案实体类别和实体关系,并给出实体类别和实体关系的表示方式;所述预案文本标记模块(2)根据所述预案概念模型模块(1)定义的预案实体类别和实体关系的表示方式,对历史故障处置预案文本中的实体类别和实体关系进行标记,并根据标记结果中的触发词成分,将历史故障处置预案文本数据转化为多个处置片段的标签数据;所述词向量模型构建模块(3)使用电力领域专业词汇数据集,构建电力领域词向量模型,用于将历史故障处置预案或待提取故障处置预案文本数据转化为历史故障处置预案或待提取故障处置预案词向量数据;所述预案实体识别模块(4)使用所述预案文本标记模块(2)输出的历史故障处置预案多个处置片段的标签数据及所述词向量模型构建模块(3)输出的历史故障处置预案词向量数据,基于深度学习模型建立预案实体识别模型,用于对待提取故障处置预案文本中的实体成分进行提取;所述预案关系抽取模块(5)使用所述预案文本标记模块(2)输出的历史故障处置预案中前置宾语、宾语和后置宾语这些特定实体的标签数据及所述词向量模型构建模块(3)输出的历史故障处置预案词向量数据,基于深度学习模型建立预案关系抽取模型,用于抽取待提取故障处置预案中前置宾语、宾语和后置宾语这些特定实体之间的主宾关系,重新组合生成完整宾语成分;所述预案意图理解模块(6)使用历史故障处置预案的意图类别标签数据及所述词向量模型构建模块(3)输出的历史故障处置预案词向量数据,基于深度学习模型建立预案意图理解模型,用于对待提取故障处置预案各处置片段的意图类别进行判定;所述实体设备映射模块(7)通过预案实体识别模块(4)和预案关系抽取模块(5)提取故障处置预案文本中的独立实体宾语成分,对独立实体宾语成分进行映射标准化,通过预案意图理解模块(6)获得独立实体宾语成分所属意图类别,基于意图类别确定设备类型表的选择,基于文本相似度计算的方式,实现所提取的独立实体宾语成分与设备类型表中标准名称映射,获取设备标准名称;所述预案解析模块(8)基于词向量模型、预案实体识别模型、预案关系抽取模型、预案意图理解模型和实体设备映射模块(7)完成待提取故障处置预案解析工作。
2.基于权利要求1所述的基于深度学习的电网故障处置预案语义建模系统,其特征在于:
所述实体类别包括独立实体和触发词实体;所述实体关系包括独立实体与独立实体之间的关系和独立实体与触发词实体之间的关系,所述独立实体与独立实体之间的关系包括前置实体关系和后置实体关系,所述独立实体与触发词实体之间的关系包括主语关系、宾语关系、宾补关系、状语关系、触发词同位关系和条件关系。
3.基于权利要求1所述的基于深度学习的电网故障处置预案语义建模系统,其特征在于:所述预案文本标记模块(2)的具体实现方法为:
根据所述预案概念模型模块(1)定义的预案实体类别和预案实体关系,得到故障处置预案中的实体类别和实体关系匹配信息,以触发词实体为核心,以由该触发词控制的独立实体共同构成一个完整的处置片段,利用BIO标记法结合所述预案概念模型模块(1)定义的实体类别及实体关系的表示方式,将故障处置预案中的实体成分分类表示,并转换成标签数据;
当故障处置预案中的触发词实体没有控制任何独立实体时,对这种类型的触发词实体进行单独处理,将这种类型的触发词实体表示方式转换成标签数据:使用“NA”表示无需提取的触发词实体,“B-NA”表示抑,具体表示方式为:制触发词提取开始部分,“I-NA”表示抑制触发词提取其它部分。
4.基于权利要求3所述的基于深度学习的电网故障处置预案语义建模系统,其特征在于:所述实体成分分类表示共得到18种标签数据表示形式,非实体成分1种标签数据表示形式,共计19种标签数据表示形式,具体表示方式为:
触发词实体开始部分表示为“B-action”,触发词实体其余部分表示为“I-action”,主语实体开始部分表示为“B-subject_Indepent”,主语实体其余部分表示为“I-subject_Indepent”,宾语实体开始部分表示为“B-object_Indepent”,宾语实体其余部分表示为“I-object_Indepent”,前置宾语实体开始部分表示为“B-object_Indepentstart”,前置宾语实体其余部分表示为“I-object_Indepentstart”,后置宾语实体开始部分表示为“B-object_Indepentend”,后置宾语实体其余部分表示为“I-object_Indepentend”,宾补实体开始部分表示为“B-objectcomplement_Indepent”,宾补实体其余部分表示为“I-objectcomplement_Indepent”,状语实体开始部分表示为“B-adverbialend_Indepent”,状语实体其余部分表示为“I-adverbialend_Indepent”,触发词同位实体开始部分表示为“B-objectaction_Indepent”,触发词同位实体其余部分表示为“I-objectaction_Indepent”,条件实体开始部分表示为“B-condition_Indepent”,条件实体其余部分表示为“I-condition_Indepent”,将非实体成分表示为“O”。
5.基于权利要求1所述的基于深度学习的电网故障处置预案语义建模系统,其特征在于:所述词向量模型构建模块(3)的具体实现方式为:
使用电网调度规程、电网故障处置细则、电网故障预案和电网作业指导书中提炼出的电力领域专业词汇数据集,训练word2vec语言模型,在对word2vec语言模型建模过程中,通过不断自学习调整word2vec语言模型权重参数,使得word2vec语言模型能够较好地适应电力领域专业词汇,使用训练好的word2vec语言模型权重参数构建电力领域词向量模型,用于故障处置预案文本的向量化处理,将故障处置预案文本数据转化为故障处置预案词向量数据。
6.基于权利要求1所述的基于深度学习的电网故障处置预案语义建模系统,其特征在于:所述预案实体识别模块(4)的具体实现方法为:
通过预案文本标记模块(2)生成的故障处置预案标签数据和所述词向量模型构建模块(3)生成的故障处置预案词向量数据作为训练集数据,基于双向长短期记忆网络和条件随机场模型进行训练,训练后得到的实体识别模型用于对故障处置预案文本中的不同类别实体成分进行提取。
7.基于权利要求1所述的基于深度学习的电网故障处置预案语义建模系统,其特征在于:所述预案关系抽取模块(5)的具体实现方法为:
通过预案文本标记模块(2)生成的故障处置预案部分标签数据和所述词向量模型构建模块(3)生成的故障处置预案词向量数据,基于卷积神经网络进行训练,生成的预案关系抽取模型用于实现故障处置预案文本中实体关系匹配;
所述故障处置预案部分标签数据指的是宾语、前置宾语和后置宾语三种实体对应的6类标签“B-object_Indepent”、“I-object_Indepent”、“B-object_Indepentstart”、“I-object_Indepentstart”、“B-object_Indepentend”、“I-object_Indepentend”,此时其它成分都是用“O”标签表示,训练完成后的预案关系抽取模型用于提取故障处置预案中的宾语,前置宾语和后置宾语成分,然后依据三种成分关系进行拼接,实现宾语成分重新组合;所述三种成分的关系为“前置宾语-宾语-后置宾语”。
8.基于权利要求1所述的基于深度学习的电网故障处置预案语义建模系统,其特征在于:所述预案意图理解模块(6)的具体实现方法为:
对预案文本标记模块(2)得到的故障处置预案各处置片段进行意图类别标记,构建意图类别标签数据集,使用词向量模型构建模块(3)得到的词向量模型,将各处置片段数据转换为词向量数据,基于文本卷积神经网络模型对故障处置预案中各意图进行分类训练,训练后生成的预案意图理解模型用于故障处置预案各处置片段的意图分类;
所述意图类别包括通知类、开停机类、调整出力类、控制潮流类、控制频率类和控制电压类。
9.基于权利要求1所述的基于深度学习的电网故障处置预案语义建模系统,其特征在于:所述实体设备映射模块(7)的具体实现方式为:
将故障处置预案中的独立实体宾语成分定义为以下9个类别:区域、厂站、母线、机组、交流线段、变压器、断面、直流线路,其它,每种类型分别对应一个设备类型表,表中存储的信息为电力设备的标准名称;
通过预案意图理解模块(6)获得独立实体宾语成分所属意图类别,基于意图类别确定设备类型表的选择,不同意图类别的预案文本中实体对应的设备类型不同,具体对应关系如下:
所述意图类别为控制频率类时,实体对应的设备类型为区域,母线;
所述意图类别为调整出力类时,实体对应的设备类型为区域,厂站;
所述意图类别为控制潮流类时,实体对应的设备类型为交流线段,变压器,断面,直流线路;
所述意图类别为开停机类时,实体对应的设备类型为厂站,机组,交流线段,变压器;
所述意图类别为控制电压类时,实体对应的设备类型为区域,母线;
所述意图类别为通知类时,实体对应为其它;
根据意图类别得到相应的设备类型表,基于文本相似度计算的方式,实现所提取的独立实体宾语成分与设备类型表中标准名称映射,获取设备标准名称。
10.一种基于深度学习的电网故障处置预案语义建模方法,其特征在于:它包括如下步骤:
步骤1,预案概念模型模块(1)定义预案实体类别和实体关系并给出对应的表示方式;
步骤2,预案文本标记模块(2)根据步骤1确定的实体类别和实体关系,对故障处置预案文本进行标记,将故障处置预案文本数据转化为多个故障处置预案处置片段的标签数据;
步骤3,词向量模型构建模块(3)构建电力领域词向量模型,用于将故障处置预案文本数据转化为故障处置预案词向量数据;
步骤4,预案实体识别模块(4)使用步骤2得到的标签数据和步骤3输出的故障处置预案词向量数据,基于深度学习模型建立预案实体识别模型,用于对故障处置预案文本中不同类别的实体成分进行提取;
步骤5,预案关系抽取模块(5)使用步骤2得到的标签数据和步骤3输出的故障处置预案词向量数据,基于深度学习模型建立预案关系抽取模型,用于抽取故障处置预案文本中前置宾语、宾语和后置宾语这些特定实体间的关系,获得特定实体之间的预案组合事件;
步骤6,预案意图理解模块(6)建立预案意图理解模型使用意图类别标签数据及所述词向量模型构建模块(3)输出的故障处置预案词向量数据,基于深度学习模型建立预案意图理解模型,用于对所述故障处置预案各处置片段的意图进行理解;
步骤7,实体设备映射模块(7)通过预案实体识别模块(4)和预案关系抽取模块(5)提取故障处置预案文本中的独立实体宾语成分,对独立实体宾语成分进行映射标准化,通过预案意图理解模块(6)获得独立实体宾语成分所属意图类别,基于意图类别确定设备类型表的选择,基于文本相似度计算的方式,实现所提取的独立实体宾语成分与设备类型表中标准名称映射,获取设备标准名称;
步骤8,预案解析模块(8)利用步骤3构建的词向量模型将待提取故障处置预案文本数据转换为待提取故障处置预案词向量数据;
步骤9,将步骤8中生成的待提取故障处置预案词向量数据传入到步骤4构建得到的预案实体识别模型中,经过预案实体识别模型预测后,输出以BIO表示的待提取故障处置预案处置片段;
步骤10,将步骤8中生成的待提取故障处置预案词向量数据传入到步骤5构建得到的预案关系抽取模型中,经过预案关系抽取模型预测后,输出以BIO表示的待提取故障处置预案处置片段;
步骤11,经过步骤9预案实体识别模型提取和步骤10预案关系抽取模型实现关系匹配后,最终得到了待提取故障处置预案处置片段实体提取结果;
步骤12、将步骤8中生成的待提取故障处置预案词向量数据传入到步骤6构建的预案意图识别模型中,经过预案意图识别模型预测后,得到待提取故障处置预案每个处置片段的意图类别,再结合步骤11中得到的实体提取结果,将待提取故障处置预案每个处置片段表示形式中新增意图‘intention’字段;
步骤13,根据步骤12中待提取故障处置预案不同处置片段对应的不同意图类别,每个处置片段根据对应的意图到对应类型的设备类型表中匹配设备,通过文本相似度计算的方式实现预案提取实体和设备表中标准名称设备的映射,完成待提取故障处置预案解析流程,获得待提取故障处置预案文本的解析结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110495901.2A CN113360641B (zh) | 2021-05-07 | 2021-05-07 | 一种基于深度学习的电网故障处置预案语义建模系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110495901.2A CN113360641B (zh) | 2021-05-07 | 2021-05-07 | 一种基于深度学习的电网故障处置预案语义建模系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113360641A true CN113360641A (zh) | 2021-09-07 |
CN113360641B CN113360641B (zh) | 2023-05-30 |
Family
ID=77525892
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110495901.2A Active CN113360641B (zh) | 2021-05-07 | 2021-05-07 | 一种基于深度学习的电网故障处置预案语义建模系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113360641B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113987183A (zh) * | 2021-10-29 | 2022-01-28 | 广西电网有限责任公司南宁供电局 | 一种基于数据驱动的电网故障处置预案辅助决策方法 |
CN114462407A (zh) * | 2022-04-11 | 2022-05-10 | 电子科技大学长三角研究院(湖州) | 车载环境下语音交互意图识别及过程管理方法 |
CN114997168A (zh) * | 2022-05-27 | 2022-09-02 | 国家电网公司华中分部 | 一种基于神经化正则表达式的电网故障处置预案解析方法 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108509483A (zh) * | 2018-01-31 | 2018-09-07 | 北京化工大学 | 基于知识图谱的机械故障诊断知识库构建方法 |
CN111079430A (zh) * | 2019-10-21 | 2020-04-28 | 国家电网公司华中分部 | 一种组合深度学习和概念图谱的电力故障事件抽取方法 |
CN111428981A (zh) * | 2020-03-18 | 2020-07-17 | 国电南瑞科技股份有限公司 | 基于深度学习的电网故障预案信息提取方法和系统 |
CN111522997A (zh) * | 2020-03-12 | 2020-08-11 | 国电南瑞南京控制系统有限公司 | 一种基于模型和文件服务的预案编制与告警推送系统和方法 |
KR102143780B1 (ko) * | 2019-12-23 | 2020-08-12 | 셀렉트스타 주식회사 | 딥러닝 모델을 이용하여 텍스트 개체에 대한 레이블링을 검수하는 방법 및 그를 이용한 장치 |
CN111552804A (zh) * | 2020-04-08 | 2020-08-18 | 国电南瑞科技股份有限公司 | 一种电网故障处置预案的知识图谱构建方法 |
CN111737496A (zh) * | 2020-06-29 | 2020-10-02 | 东北电力大学 | 一种电力设备故障知识图谱构建方法 |
CN111860882A (zh) * | 2020-06-17 | 2020-10-30 | 国网江苏省电力有限公司 | 一种电网调度故障处理知识图谱的构建方法及装置 |
CN111985653A (zh) * | 2020-06-24 | 2020-11-24 | 国网江苏省电力有限公司 | 基于知识图谱的电网故障知识推荐与知识管理系统及方法 |
CN112036179A (zh) * | 2020-08-28 | 2020-12-04 | 南京航空航天大学 | 基于文本分类与语义框架的电力预案信息抽取方法 |
CN112100397A (zh) * | 2020-09-07 | 2020-12-18 | 南京航空航天大学 | 基于双向门控循环单元的电力预案知识图谱构建方法及系统 |
CN112463980A (zh) * | 2020-11-25 | 2021-03-09 | 南京摄星智能科技有限公司 | 一种基于知识图谱的预案智能推荐方法 |
CN112685570A (zh) * | 2020-12-15 | 2021-04-20 | 南京南瑞继保电气有限公司 | 一种基于多标签图的电网网架知识图谱的构建方法 |
CN112749549A (zh) * | 2021-01-22 | 2021-05-04 | 中国科学院电子学研究所苏州研究院 | 一种基于增量学习和多模型融合的中文实体关系抽取方法 |
-
2021
- 2021-05-07 CN CN202110495901.2A patent/CN113360641B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108509483A (zh) * | 2018-01-31 | 2018-09-07 | 北京化工大学 | 基于知识图谱的机械故障诊断知识库构建方法 |
CN111079430A (zh) * | 2019-10-21 | 2020-04-28 | 国家电网公司华中分部 | 一种组合深度学习和概念图谱的电力故障事件抽取方法 |
KR102143780B1 (ko) * | 2019-12-23 | 2020-08-12 | 셀렉트스타 주식회사 | 딥러닝 모델을 이용하여 텍스트 개체에 대한 레이블링을 검수하는 방법 및 그를 이용한 장치 |
CN111522997A (zh) * | 2020-03-12 | 2020-08-11 | 国电南瑞南京控制系统有限公司 | 一种基于模型和文件服务的预案编制与告警推送系统和方法 |
CN111428981A (zh) * | 2020-03-18 | 2020-07-17 | 国电南瑞科技股份有限公司 | 基于深度学习的电网故障预案信息提取方法和系统 |
CN111552804A (zh) * | 2020-04-08 | 2020-08-18 | 国电南瑞科技股份有限公司 | 一种电网故障处置预案的知识图谱构建方法 |
CN111860882A (zh) * | 2020-06-17 | 2020-10-30 | 国网江苏省电力有限公司 | 一种电网调度故障处理知识图谱的构建方法及装置 |
CN111985653A (zh) * | 2020-06-24 | 2020-11-24 | 国网江苏省电力有限公司 | 基于知识图谱的电网故障知识推荐与知识管理系统及方法 |
CN111737496A (zh) * | 2020-06-29 | 2020-10-02 | 东北电力大学 | 一种电力设备故障知识图谱构建方法 |
CN112036179A (zh) * | 2020-08-28 | 2020-12-04 | 南京航空航天大学 | 基于文本分类与语义框架的电力预案信息抽取方法 |
CN112100397A (zh) * | 2020-09-07 | 2020-12-18 | 南京航空航天大学 | 基于双向门控循环单元的电力预案知识图谱构建方法及系统 |
CN112463980A (zh) * | 2020-11-25 | 2021-03-09 | 南京摄星智能科技有限公司 | 一种基于知识图谱的预案智能推荐方法 |
CN112685570A (zh) * | 2020-12-15 | 2021-04-20 | 南京南瑞继保电气有限公司 | 一种基于多标签图的电网网架知识图谱的构建方法 |
CN112749549A (zh) * | 2021-01-22 | 2021-05-04 | 中国科学院电子学研究所苏州研究院 | 一种基于增量学习和多模型融合的中文实体关系抽取方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113987183A (zh) * | 2021-10-29 | 2022-01-28 | 广西电网有限责任公司南宁供电局 | 一种基于数据驱动的电网故障处置预案辅助决策方法 |
CN114462407A (zh) * | 2022-04-11 | 2022-05-10 | 电子科技大学长三角研究院(湖州) | 车载环境下语音交互意图识别及过程管理方法 |
CN114997168A (zh) * | 2022-05-27 | 2022-09-02 | 国家电网公司华中分部 | 一种基于神经化正则表达式的电网故障处置预案解析方法 |
CN114997168B (zh) * | 2022-05-27 | 2024-05-28 | 国家电网公司华中分部 | 一种基于神经化正则表达式的电网故障处置预案解析方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113360641B (zh) | 2023-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113360641A (zh) | 一种基于深度学习的电网故障处置预案语义建模系统及方法 | |
CN109359293B (zh) | 基于神经网络的蒙古文命名实体识别方法及其识别系统 | |
CN111260338B (zh) | 一种变电站操作票智能生成方法、装置及平台 | |
CN112599124A (zh) | 一种面向电网调度的语音调度方法及系统 | |
CN111090730B (zh) | 智能语音调度系统及方法 | |
CN115858758A (zh) | 一种多非结构化数据识别的智慧客服知识图谱系统 | |
CN114328950A (zh) | 配电网故障处置知识图谱构建、智能辅助决策系统及方法 | |
CN112036179B (zh) | 基于文本分类与语义框架的电力预案信息抽取方法 | |
CN113792538B (zh) | 一种配电网操作票快速生成方法及装置 | |
CN113140219A (zh) | 调控指令生成方法、装置、电子设备及存储介质 | |
CN116010581A (zh) | 一种基于电网隐患排查场景的知识图谱问答方法及系统 | |
CN104679733B (zh) | 一种语音对话翻译方法、装置及系统 | |
CN110399498A (zh) | 一种电力变压器运行规范知识图谱构建方法 | |
CN110705217A (zh) | 一种错别字检测方法、装置及计算机存储介质、电子设备 | |
CN112507117A (zh) | 一种基于深度学习的检修意见自动分类方法及系统 | |
CN117713377A (zh) | 调度自动化主站智能语音联调系统 | |
Hu | Research and implementation of railway technical specification question answering system based on deep learning | |
CN112420042A (zh) | 电力系统的控制方法及装置 | |
CN112257432A (zh) | 一种自适应意图识别方法、装置及电子设备 | |
CN115310429B (zh) | 一种多轮倾听对话模型中的数据压缩与高性能计算方法 | |
CN111553158A (zh) | 一种基于BiLSTM-CRF模型的电力调度领域命名实体识别方法及系统 | |
CN115203427A (zh) | 一种电力系统调控规程知识图谱管理系统、知识图谱生成方法及存储介质 | |
CN115357684A (zh) | 一种对话生成模型损失参数的确定方法和装置 | |
CN109543182B (zh) | 一种基于solr引擎的电力企业多轮交互语义分析方法 | |
CN105184514A (zh) | 一种基于序列标注的电网设计指标抽取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |