CN113987183A - 一种基于数据驱动的电网故障处置预案辅助决策方法 - Google Patents

一种基于数据驱动的电网故障处置预案辅助决策方法 Download PDF

Info

Publication number
CN113987183A
CN113987183A CN202111269357.6A CN202111269357A CN113987183A CN 113987183 A CN113987183 A CN 113987183A CN 202111269357 A CN202111269357 A CN 202111269357A CN 113987183 A CN113987183 A CN 113987183A
Authority
CN
China
Prior art keywords
plan
text
power grid
word
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111269357.6A
Other languages
English (en)
Inventor
习莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanning Power Supply Bureau of Guangxi Power Grid Co Ltd
Original Assignee
Nanning Power Supply Bureau of Guangxi Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanning Power Supply Bureau of Guangxi Power Grid Co Ltd filed Critical Nanning Power Supply Bureau of Guangxi Power Grid Co Ltd
Priority to CN202111269357.6A priority Critical patent/CN113987183A/zh
Publication of CN113987183A publication Critical patent/CN113987183A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及电网故障技术领域,提出了一种基于数据驱动的电网故障处置预案辅助决策方法,包括标记预案文本中预案实体和预案实体间的语法关系;将预案文本转化为可计算的词向量;将预案实体词向量输入到BiLSTM‑CRF模型,识别输出预案实体;将预案实体关系词向量输入到TextCNN模型,识别输出预案实体关系;建立预案特征与电网实时运行告警信息间的文本相似度计算模型;将预案特征和电网实时运行告警信息输入到文本相似度计算模型,选择相似值最高的预案特征所对应的预案事件作为故障处置的辅助决策。通过上述技术方案,为调度员快速处置故障提供了有效的辅助决策,保障了电网的安全稳定运行。解决电力调度文本中电网故障处置预案利用率较低的问题。

Description

一种基于数据驱动的电网故障处置预案辅助决策方法
技术领域
本发明涉及电网故障技术领域,具体的,涉及一种基于数据驱动的电网故障处置预案辅助决策方法。
背景技术
电力调度文本中含有大量保障电网安全稳定运行的知识,是指导调控运行人员工作的宝典。在我国特高压交直流混联大电网格局已经形成,各区域电网通过特高压连接为一个整体,呈现出电压等级高、输电便利、结构复杂、运行方式多变的态势,与此同时为调控人员带来严峻的技术和管理挑战,电网调度规程种类繁多、存在形式多样,如调度规程、故障处置预案、工作票、停电计划以及启动方案等。
其中故障处置预案变化频繁,表述复杂,但对电网故障处置预案,在线辅助决策等调度业务具有重要作用。故障处置预案包含电网在各种运行方式下重大故障和处置方式,对保障电网安全稳定运行至关重要。但是目前在处置电网业务中利用率低,其中宝贵的知识难以迭代复用,因此将现有电力调度规程文本电子化和可用知识化,对促进智能调控的发展具有重要战略意义。
发明内容
本发明提出一种基于数据驱动的电网故障处置预案辅助决策方法,将电网故障处置预案基于大数据和自然语言处理方法分析挖掘海量故障处置预案中的运行特征,通过感知电网实时状态快速推荐出电网故障情况下的参考预案,解决了现有电力调度文本中电网故障处置预案利用率较低的问题。
本发明的技术方案如下:
一种基于数据驱动的电网故障处置预案辅助决策方法,包括,
步骤100:输入电力调度文本故障处置预案,所述电力调度文本故障处置预案包括多个预案事件;
步骤200:提取预案事件中的有效成分作为预案文本,所述预案文本包括预案标题、电网故障前运行方式和电网故障后运行方式;
步骤300:标记预案文本中预案实体,并标记预案实体间的语法关系,所述预案实体包括名词实体和动词实体,其中动词实体作为预案文本的触发词;
步骤400:采用BERT模型将预案文本转化为可计算的词向量;
步骤500:将预案文本词向量输入到BiLSTM-CRF模型,识别输出预案实体词向量;
步骤600:将预案文本词向量输入到TextCNN模型,识别输出预案实体关系词向量;
步骤700将每一特征和电网实时运行告警信息转化成可计算的词向量,输入到文本相似度计算模型,输出相似值;选择相似值最高的预案特征所对应的预案事件作为故障处置的辅助决策。
本发明的工作原理及有益效果为:
1、本发明通过BERT模型预训练的动态词向量模型表征预案文本中的专业语言,加深其在语境中的表示能力。以电力调度文本故障处置预案为研究对象,提出触发词为中心的预案标记和事件抽取方法,采用BiLSTM-CRF训练名词实体和触发词识别模型,采用TextCNN训练触发词与各名词实体的关系抽取模型。通过构建文本相似度计算模型,将预案特征和电网实时运行告警信息转化成可计算的词向量,输入到文本相似度计算模型,选择相似值最高的预案特征所对应的预案事件作为故障处置的辅助决策。为调度员快速处置故障提供了有效的辅助决策,保障了电网的安全稳定运行。
2、因为预案文本中存在专业语言表述倒装、语序混杂以及电力设备实体表述不规范等问题。并且预案文本中的动词位置不固定,导致语法各成分位置不固定,基于规则和机器学习方法建立的实体识别模型难以较好地解析预案文本。本发明在标记时将执行动词作为触发词,再进行预案识别时,以触发词为中心,先识别触发词的位置和各名词实体的位置,然后通过识别触发词与各名词实体的语法关系,这样可以通过识别触发词将预案文本中所有的预案特征提取出来,提高预案识别准确率。
下面结合附图和具体实施方式对本发明作进一步详细的说明。
附图说明
图1为本发明的流程图;
图2为本发明的网络结构图。
具体实施方式
下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都涉及本发明保护的范围。
实施例1
如图1~图2所示,本实施例提出了一种基于数据驱动的电网故障处置预案辅助决策方法,包括,
步骤100:输入电力调度文本故障处置预案,所述电力调度文本故障处置预案包括多个预案事件;
步骤200:提取预案事件中的有效成分作为预案文本,所述预案文本包括预案标题、电网故障前运行方式和电网故障后运行方式;
步骤300:标记预案文本中预案实体,并标记预案实体间的语法关系,所述预案实体包括名词实体和动词实体,其中动词实体作为预案文本的触发词;
步骤400:采用BERT模型将预案文本转化为可计算的词向量;
步骤500:将预案文本词向量输入到BiLSTM-CRF模型,识别输出预案实体词向量;
步骤600:将预案文本词向量输入到TextCNN模型,识别输出预案实体关系词向量;
步骤700:建立预案特征与电网实时运行告警信息间的文本相似度计算模型,所述预案特征包括预案实体和预案实体关系,收集样本训练文本相似度计算模型;
步骤800将每一特征和电网实时运行告警信息转化成可计算的词向量,输入到文本相似度计算模型,输出相似值;选择相似值最高的预案特征所对应的预案事件作为故障处置的辅助决策。
本实施例基于BERT预训练模型的动态词向量将预案文本转化为可计算的词向量,采用BiLSTM-CRF网络框架建立预案实体识别模型,采用TextCNN建立预案实体关系抽取模型。
通过BERT模型将预案文本字符转化为768维向量,将预案实体词向量输入BiLSTM网络模型,采用前向和后向两个不同LSTM网络训练文本序列特征,通过CRF层提升预案实体触发词和名词的准确率。其中BiLSTM-CRF模型输入批处理大小为32,LSTM网络单元隐藏层状态维度为200,隐含层数为2,加入dropout层防止过拟合,系数为0.5。通过BiLSTM-CRF识别的预案实体种类主要为名词实体和动词实体,动词为文中所定义的预案事件触发词。同时将预案实体关系词向量输入到TextCNN网络实现实体关系抽取,通过词向量进行组合形成特征向量,采用卷积层和池化层进行特征提取,在网络卷积层中设定3个卷积核宽分别为1、3和5,卷积核数分别为30、40和50。采用时序最大池化处理各个通道数据,将各通道数据矩阵拉伸为一维向量,输入到全连接层中。
故障处置预案实体关系抽取本质是多分类问题,在全连接层后采用Softmax函数实现故障处置预案实体关系分类。预案实体关系依据触发词与各名词实体间语法划分为操作发起者(sub-object)、操作对象(object)、操作对象补语(com-object)、操作对象前置状语(pre-object)、操作对象后置状语(rea-object)。
故障处置预案表述事件较多且逻辑复杂,按照通常方法划分的预案实体和实体关系种类较多,通过建立命名实体识别和实体关系抽取模型难以准确地识别预案事件中所有事件要素和要素关系。通过分析故障处置预案语言特点,每条预案事件均含有执行动词,因此提出了以执行动词为触发词的故障处置预案标记方法,所有的预案名词实体与触发词存在着语法关系,这样可以通过识别触发词将预案事件中所有的事件要素提取出来,提高预案实体识别准确率和事件识别准确率。
以动词实体作为触发词的预案事件抽取方法可以解决预案专业语言表述倒装、语序混杂以及电力设备实体表述不规范等问题。预案事件中的动词位置不固定,导致语法各成分位置不固定,基于规则和机器学习方法建立的实体识别模型难以较好地解析预案,但是本实施例以触发词为中心的预案识别方法首先识别触发词位置和各名词实体位置,然后通过识别触发词与各名词实体的语法关系,可以将预案事件中各成分准确识别出来。
以“控制南湖电厂出力不超过100万千万”预案为例,首先识别“控制”触发词和“南湖电厂”、“不超过100万千万”名词实体,然后识别“控制”与“南湖电厂”间关系为操作对象,“控制”与“不超过100万千万”间关系为操作对象后置状语,只要在触发词识别准确的情况下,可以有效地实现预案事件抽取。对于电力设备实体表述不规范情况,如“东湖I、II线”一个名词实体包含两个电力实体“东湖I线”、“东湖II线”,先用模型识别“东湖I、II线”整个实体,再使用规则进行实体拆分。
实施例2
在实施例1的基础上,还包括BERT模型转换方法,
BERT预训练模型主要包括MASK文本预处理层、词嵌入层和双向Transformer特征编码层,Transformer编码层通过自注意力层Attention更好地获取自然语言文本在语境中的特征信息,生成动态词向量,克服一词多义问题。
BERT模型主要通过MASK文本预处理层和双向Transformer提升对自然语言特征表示能力。预案文本首先进入MASK预处理层,进行随机遮掩,采用非监督学习方法预测遮掩词汇,使语言模型能够利用上下文信息对当前词编码,加强BERT模型双向语言表征能力。
如调度专业语言文本“调减鄂豫断面潮流”中被MASK词汇为“潮流”,将输入文本转化为“[CLS]调减鄂豫断面[MASK][MASK][SEP]”,在使用BERT模型微调阶段需要尽量降低[MASK]标记带来的负面影响,可以利用同义特征词代替标记,如使用“功率”代替“潮流”,提升语言模型学习能力。
在训练过程中采用下一句预测(NSP)任务,使模型更好地理解上下文逻辑关系和因果关系。词嵌入层将预处理层向量转化为词向量、段向量以及位置向量,从不同维度提升自然语言文本表示能力。
双向Transformer由6个Encoder-Decoder结构组成,采用注意力机制和前馈神经网络建立,将词嵌入层中词向量、位置向量和段落向量作为输入,采用多头自注意力机制学习预案文本序列中的字词相互关系。多头注意力机制将多个自注意力机制融合,可以从不同角度学习更大的容量信息,计算表达式如下所示:
Figure BDA0003327583240000051
MutiHead(Q,P,V)=Concat(head1,...,headh)W0,式中:Q,P,V分别为字向量矩阵;DK表示词嵌入层维度;W0表示多头注意力拼接矩阵。
实施例3
在实施例1的基础上,还包括BiLSTM-CRF模型预案特征提取方法,
BiLSTM-CRF混合神经网络框架是经典的序列特征抽取模型,由双向LSTM和CRF组成。通过BiLSTM可以从不同方向更好地记忆文本序列中的信息,使特征信息更加完整,随后加入CRF可以高效地学习各文本实体类别间的特征,提高特征识别效果。
(1)LSTM原理
BiLSTM由前向LSTM和后向LSTM组成,前向网络从预案文本初始进行训练,后向网络预案文本末尾开始训练,双向网络的结合最大限度的保留文本序列特征,相比单层LSTM更适合文本序列特征识别任务。LSTM由输入门、遗忘门、输出门和储存记忆细胞组成,有效地解决了循环神经网络(RNN)训练时梯度消失和梯度爆炸问题,适合长文本序列信息建模。
输入门It用于控制当前时刻的输入如何输入到当前记忆细胞中,遗忘门Ft决定当前记忆细胞中上一时刻的信息保留多少,输出门Ot决定输出什么内容,对于当前时刻t,若Ot=1,则表示输出,若Ot=0,则表示不输出。表达式如下:
It=σ(Wi[ht-1,xt]+bi),
Ft=σ(Wf[ht-1,xt]+bf),
Ot=σ(Wo[ht-1,xt]+bo),
式中:Wi为输入门权重;ht-1为隐含状态;xt为输入数据;bi为输入门偏置项;σ为sigmoid函数;Wf为遗忘门权重;bf为遗忘门偏置项;Wo为遗忘门权重;bo为遗忘门偏置项。
Figure BDA0003327583240000052
为当前记忆细胞,存储历史记忆内容,在确定过去记忆与新内容的保留部分后,更新细胞,表达式如下所示:
Figure BDA0003327583240000053
式中:Wc为隐含状态权重;bc为隐含状态偏置项。
(2)CRF原理
CRF通过状态转移矩阵,可以得到整个预测序列的得分,得分函数公式为:
Figure BDA0003327583240000061
式中:
Figure BDA0003327583240000062
是CRF模型中相邻的状态转移矩阵分布值;
Figure BDA0003327583240000063
是BiLSTM模型的输出向量的分数值。
将分数值归一化后,获得模型的概率公式:
Figure BDA0003327583240000064
式中:YX表示所有可能的序列标注。
CRF使用对数概率进行正确标签序列的优化,对于训练样本有以下公式:
Figure BDA0003327583240000065
最后,通过极大似然估计函数获取最高得分的标签序列作为最终预测的输出序列,其公式如下:
Figure BDA0003327583240000066
实施例4
在实施例1的基础上,还包括TextCNN模型预案特征关系提取方法,
卷积神经网络(CNN)具有较强特征提取能力,TextCNN在CNN基础上提出,是一种典型的文本分类算法。TextCNN将文本数据看作一维时间序列,按照一维图像来处理,实现自然语言语义建模。
TextCNN网络在提取文本特征时分成以下步骤:
(1)定义多个一维卷积核,然后使用这些卷积核对输入进行卷积计算,不同长度的卷积核会抽取出多个邻近字(词)之间的相互关系。假设模型的输入数据为词向量矩阵N,输入的文本由m个字组成,神经网络中的权重为W,偏置为b,获得故障处置预案特征Ai的计算公式为:Ai=f(W·Ni:i+h-1+b)
式中:i=1,2,…,m-h+1,h是卷积核的长度,Ni:i+h-1是剧本N的第i行到第i+h-1行,f是一个非线性函数;
(2)使用时序最大池化对输出的所有通道提取代表性特征,然后将这些代表性特征拼接成一个新的特征向量;
(3)通过全连接层将拼接后的向量输出为概率最大的一个标签,通过计算预测与实际标签的损失函数,使用梯度下降算法对参数进行更新。
实施例5
在实施例1的基础上,还包括文本相似度计算模型,
建立预案特征与电网实时运行告警信息间的文本相似度计算模型,具体地采用残差向量-字词嵌入向量-编码向量(RE2)计算预案特征与电网实时运行告警信息间的关系。
RE2文本相似度匹配模型在充分考虑推理速度和匹配效果的基础上,充分融合了残差向量、初始字词嵌入向量、编码向量,大幅度简化了参数量和计算量,更适合落地应用到文本匹配等场景,两个文本序列的输入模型结构相同,模型组成主要包括:增强残差连接层、对齐层、融合层、预测层。
收集样本集进行训练,得到训练好的文本相似度计算模型。根据样本集文本字符、文档向量相似度等信息,构造区别度较高的文本相似度计算模型训练文本对(Textk,1,Textk,2,Ck),其中k代表第k个文本对,labelk为其对应的类别,Ck∈(0,1),如两个文本同属一个类别,则label设为1,否则置零,k∈(1,M),M代表训练集大小。
将电网实时运行告警信息和预案特征转化成可计算的词向量,输入到文本相似度计算模型,计算得到与电网故障匹配故障最佳的预案。
以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于数据驱动的电网故障处置预案辅助决策方法,其特征在于,包括,
步骤100:输入电力调度文本故障处置预案,所述电力调度文本故障处置预案包括多个预案事件;
步骤200:提取预案事件中的有效成分作为预案文本,所述预案文本包括预案标题、电网故障前运行方式和电网故障后运行方式;
步骤300:标记预案文本中预案实体,并标记预案实体间的语法关系,所述预案实体包括名词实体和动词实体,其中动词实体作为预案文本的触发词;
步骤400:采用BERT模型将预案文本转化为可计算的词向量;
步骤500:将预案文本词向量输入到BiLSTM-CRF模型,识别输出预案实体词向量;
步骤600:将预案文本词向量输入到TextCNN模型,识别输出预案实体关系词向量;
步骤700将每一特征和电网实时运行告警信息转化成可计算的词向量,输入到文本相似度计算模型,输出相似值;选择相似值最高的预案特征所对应的预案事件作为故障处置的辅助决策。
2.根据权利要求1所述的一种基于数据驱动的电网故障处置预案辅助决策方法,其特征在于,所述步骤200包括,
步骤201:对每个预案事件进行数据清洗;
步骤202:提取清洗后的预案事件中的有效成分,包括预案标题、电网故障前运行方式和电网故障后运行方式。
3.根据权利要求1所述的一种基于数据驱动的电网故障处置预案辅助决策方法,其特征在于,所述步骤400包括,
步骤401:将预案文本输入到BERT模型的预处理层进行随机遮掩,采用非监督学习方法预测遮掩词汇,输出预处理层向量;
步骤402:将预处理层向量输入到词嵌入层,输出词向量、段向量和位置向量;
步骤403:将词向量、段向量和位置向量输入到特征编码层,采用多头自注意力机制学习文本序列中的字词相互关系,输出预案文本的词向量。
4.根据权利要求1所述的一种基于数据驱动的电网故障处置预案辅助决策方法,其特征在于,所述步骤500包括,
步骤501:将预案文本的词向量输入到BiLSTM模型,输出BiLSTM模型的输出向量的分数值
Figure FDA0003327583230000026
步骤502:将预案文本的词向量输入到CRF模型,通过状态转移矩阵,可以得到整个预测序列的分数值,
Figure FDA0003327583230000021
其中,
Figure FDA0003327583230000027
是CRF模型中相邻的状态转移矩阵分布值,
Figure FDA0003327583230000025
是BiLSTM模型输出向量分数值;
步骤503:将分数值归一化,输出概率公式,
Figure FDA0003327583230000022
其中,YX表示所有可能的序列标注;
步骤504:对概率使用对数处理,进行正确标签序列的优化,得到
Figure FDA0003327583230000023
步骤505:通过极大似然数计算函数获取最终得分,
Figure FDA0003327583230000024
选择得分最高的标签序列作为最终预测的输出序列。
5.根据权利要求1所述的一种基于数据驱动的电网故障处置预案辅助决策方法,其特征在于,所述步骤600包括,
步骤601:定义多个一维卷积核,然后使用这些卷积核对输入的预案文本词向量进行卷积计算,Ai=f(W·Ni:i+h-1+b),其中,i=1,2,……,m-h+1,h是卷积核的长度,Ni:i+h-1是剧本N的第i行到第i+h-1行,f是一个非线性函数;
步骤602:使用时序最大池化对输出的所有通道提取代表性特征,然后将这些代表性特征拼接成一个新的特征向量。
CN202111269357.6A 2021-10-29 2021-10-29 一种基于数据驱动的电网故障处置预案辅助决策方法 Pending CN113987183A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111269357.6A CN113987183A (zh) 2021-10-29 2021-10-29 一种基于数据驱动的电网故障处置预案辅助决策方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111269357.6A CN113987183A (zh) 2021-10-29 2021-10-29 一种基于数据驱动的电网故障处置预案辅助决策方法

Publications (1)

Publication Number Publication Date
CN113987183A true CN113987183A (zh) 2022-01-28

Family

ID=79744141

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111269357.6A Pending CN113987183A (zh) 2021-10-29 2021-10-29 一种基于数据驱动的电网故障处置预案辅助决策方法

Country Status (1)

Country Link
CN (1) CN113987183A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114997168A (zh) * 2022-05-27 2022-09-02 国家电网公司华中分部 一种基于神经化正则表达式的电网故障处置预案解析方法
CN115170053A (zh) * 2022-05-24 2022-10-11 中睿信数字技术有限公司 一种基于聚类融合的事件分拨处置系统
CN116934127A (zh) * 2023-09-19 2023-10-24 中国铁塔股份有限公司吉林省分公司 基于智慧平台的应急预案生成方法及系统
CN117574159A (zh) * 2024-01-12 2024-02-20 北京华品博睿网络技术有限公司 一种预训练模型的训练方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428981A (zh) * 2020-03-18 2020-07-17 国电南瑞科技股份有限公司 基于深度学习的电网故障预案信息提取方法和系统
CN111860882A (zh) * 2020-06-17 2020-10-30 国网江苏省电力有限公司 一种电网调度故障处理知识图谱的构建方法及装置
CN112632972A (zh) * 2020-12-25 2021-04-09 浙江国际海运职业技术学院 一种电网设备故障报告内故障信息的快速提取方法
KR20210085158A (ko) * 2019-12-30 2021-07-08 한국과학기술원 문맥 정보를 고려한 개체명 인식 방법 및 장치
CN113157916A (zh) * 2021-03-10 2021-07-23 南京航空航天大学 一种基于深度学习的民航突发事件抽取方法
CN113283704A (zh) * 2021-04-23 2021-08-20 内蒙古电力(集团)有限责任公司乌兰察布电业局 基于知识图谱的电网故障智能处置系统及方法
CN113360641A (zh) * 2021-05-07 2021-09-07 内蒙古电力(集团)有限责任公司乌兰察布电业局 一种基于深度学习的电网故障处置预案语义建模系统及方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210085158A (ko) * 2019-12-30 2021-07-08 한국과학기술원 문맥 정보를 고려한 개체명 인식 방법 및 장치
CN111428981A (zh) * 2020-03-18 2020-07-17 国电南瑞科技股份有限公司 基于深度学习的电网故障预案信息提取方法和系统
CN111860882A (zh) * 2020-06-17 2020-10-30 国网江苏省电力有限公司 一种电网调度故障处理知识图谱的构建方法及装置
CN112632972A (zh) * 2020-12-25 2021-04-09 浙江国际海运职业技术学院 一种电网设备故障报告内故障信息的快速提取方法
CN113157916A (zh) * 2021-03-10 2021-07-23 南京航空航天大学 一种基于深度学习的民航突发事件抽取方法
CN113283704A (zh) * 2021-04-23 2021-08-20 内蒙古电力(集团)有限责任公司乌兰察布电业局 基于知识图谱的电网故障智能处置系统及方法
CN113360641A (zh) * 2021-05-07 2021-09-07 内蒙古电力(集团)有限责任公司乌兰察布电业局 一种基于深度学习的电网故障处置预案语义建模系统及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
廖涛,勾艳杰,张顺香: "融合注意力机制的BERT-BiLSTM-CRF中文命名实体识别", 《阜阳师范大学学报(自然科学版)》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115170053A (zh) * 2022-05-24 2022-10-11 中睿信数字技术有限公司 一种基于聚类融合的事件分拨处置系统
CN114997168A (zh) * 2022-05-27 2022-09-02 国家电网公司华中分部 一种基于神经化正则表达式的电网故障处置预案解析方法
CN114997168B (zh) * 2022-05-27 2024-05-28 国家电网公司华中分部 一种基于神经化正则表达式的电网故障处置预案解析方法
CN116934127A (zh) * 2023-09-19 2023-10-24 中国铁塔股份有限公司吉林省分公司 基于智慧平台的应急预案生成方法及系统
CN116934127B (zh) * 2023-09-19 2023-11-24 中国铁塔股份有限公司吉林省分公司 基于智慧平台的应急预案生成方法及系统
CN117574159A (zh) * 2024-01-12 2024-02-20 北京华品博睿网络技术有限公司 一种预训练模型的训练方法及系统
CN117574159B (zh) * 2024-01-12 2024-05-10 北京华品博睿网络技术有限公司 一种预训练模型的训练方法及系统

Similar Documents

Publication Publication Date Title
CN113987183A (zh) 一种基于数据驱动的电网故障处置预案辅助决策方法
CN111382565B (zh) 基于多标签的情绪-原因对抽取方法及系统
CN111966812B (zh) 一种基于动态词向量的自动问答方法和存储介质
CN115687626A (zh) 一种基于提示学习融合关键词的法律文书分类方法
CN107797987A (zh) 一种基于Bi‑LSTM‑CNN的混合语料命名实体识别方法
CN112084336A (zh) 一种高速公路突发事件的实体提取和事件分类方法及装置
CN112052319B (zh) 一种基于多特征融合的智能客服方法及系统
CN108536781B (zh) 一种社交网络情绪焦点的挖掘方法及系统
CN116341562A (zh) 一种基于Unilm语言模型的相似问题生成方法
CN115238693A (zh) 一种基于多分词和多层双向长短期记忆的中文命名实体识别方法
CN116842194A (zh) 一种电力语义知识图谱系统及方法
CN113886562A (zh) 一种ai简历筛选方法、系统、设备和存储介质
CN114881173A (zh) 基于自注意力机制的简历分类方法和装置
CN113722494A (zh) 一种基于自然语言理解的设备故障定位方法
CN113065352B (zh) 一种电网调度工作文本的操作内容识别方法
CN113177113A (zh) 任务型对话模型预训练方法、装置、设备及存储介质
CN117390189A (zh) 基于前置分类器的中立文本生成方法
CN116342167A (zh) 基于序列标注命名实体识别的智能成本度量方法和装置
CN114357166B (zh) 一种基于深度学习的文本分类方法
CN115840815A (zh) 基于指针关键信息的自动摘要生成方法
CN115936001A (zh) 基于BERT-BiLSTM-CRF模型和注意力的电网IT运维实体识别方法及系统
CN114912460A (zh) 基于文本挖掘的精细化拟合识别变压器故障方法及设备
Jing et al. Chinese text sentiment analysis based on transformer model
Zhang et al. Hierarchical attention networks for grid text classification
CN113849637A (zh) 一种低噪声干扰的有监督关系抽取方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination