CN113987183A

CN113987183A - 一种基于数据驱动的电网故障处置预案辅助决策方法

Info

Publication number: CN113987183A
Application number: CN202111269357.6A
Authority: CN
Inventors: 习莉
Original assignee: Nanning Power Supply Bureau of Guangxi Power Grid Co Ltd
Current assignee: Nanning Power Supply Bureau of Guangxi Power Grid Co Ltd
Priority date: 2021-10-29
Filing date: 2021-10-29
Publication date: 2022-01-28

Abstract

本发明涉及电网故障技术领域，提出了一种基于数据驱动的电网故障处置预案辅助决策方法，包括标记预案文本中预案实体和预案实体间的语法关系；将预案文本转化为可计算的词向量；将预案实体词向量输入到BiLSTM‑CRF模型，识别输出预案实体；将预案实体关系词向量输入到TextCNN模型，识别输出预案实体关系；建立预案特征与电网实时运行告警信息间的文本相似度计算模型；将预案特征和电网实时运行告警信息输入到文本相似度计算模型，选择相似值最高的预案特征所对应的预案事件作为故障处置的辅助决策。通过上述技术方案，为调度员快速处置故障提供了有效的辅助决策，保障了电网的安全稳定运行。解决电力调度文本中电网故障处置预案利用率较低的问题。

Description

一种基于数据驱动的电网故障处置预案辅助决策方法

技术领域

本发明涉及电网故障技术领域，具体的，涉及一种基于数据驱动的电网故障处置预案辅助决策方法。

背景技术

电力调度文本中含有大量保障电网安全稳定运行的知识，是指导调控运行人员工作的宝典。在我国特高压交直流混联大电网格局已经形成，各区域电网通过特高压连接为一个整体，呈现出电压等级高、输电便利、结构复杂、运行方式多变的态势，与此同时为调控人员带来严峻的技术和管理挑战，电网调度规程种类繁多、存在形式多样，如调度规程、故障处置预案、工作票、停电计划以及启动方案等。

其中故障处置预案变化频繁，表述复杂，但对电网故障处置预案，在线辅助决策等调度业务具有重要作用。故障处置预案包含电网在各种运行方式下重大故障和处置方式，对保障电网安全稳定运行至关重要。但是目前在处置电网业务中利用率低，其中宝贵的知识难以迭代复用，因此将现有电力调度规程文本电子化和可用知识化，对促进智能调控的发展具有重要战略意义。

发明内容

本发明提出一种基于数据驱动的电网故障处置预案辅助决策方法，将电网故障处置预案基于大数据和自然语言处理方法分析挖掘海量故障处置预案中的运行特征，通过感知电网实时状态快速推荐出电网故障情况下的参考预案，解决了现有电力调度文本中电网故障处置预案利用率较低的问题。

本发明的技术方案如下：

一种基于数据驱动的电网故障处置预案辅助决策方法，包括，

步骤100：输入电力调度文本故障处置预案，所述电力调度文本故障处置预案包括多个预案事件；

步骤200：提取预案事件中的有效成分作为预案文本，所述预案文本包括预案标题、电网故障前运行方式和电网故障后运行方式；

步骤300：标记预案文本中预案实体，并标记预案实体间的语法关系，所述预案实体包括名词实体和动词实体，其中动词实体作为预案文本的触发词；

步骤400：采用BERT模型将预案文本转化为可计算的词向量；

步骤500：将预案文本词向量输入到BiLSTM-CRF模型，识别输出预案实体词向量；

步骤600：将预案文本词向量输入到TextCNN模型，识别输出预案实体关系词向量；

步骤700将每一特征和电网实时运行告警信息转化成可计算的词向量，输入到文本相似度计算模型，输出相似值；选择相似值最高的预案特征所对应的预案事件作为故障处置的辅助决策。

本发明的工作原理及有益效果为：

1、本发明通过BERT模型预训练的动态词向量模型表征预案文本中的专业语言，加深其在语境中的表示能力。以电力调度文本故障处置预案为研究对象，提出触发词为中心的预案标记和事件抽取方法，采用BiLSTM-CRF训练名词实体和触发词识别模型，采用TextCNN训练触发词与各名词实体的关系抽取模型。通过构建文本相似度计算模型，将预案特征和电网实时运行告警信息转化成可计算的词向量，输入到文本相似度计算模型，选择相似值最高的预案特征所对应的预案事件作为故障处置的辅助决策。为调度员快速处置故障提供了有效的辅助决策，保障了电网的安全稳定运行。

2、因为预案文本中存在专业语言表述倒装、语序混杂以及电力设备实体表述不规范等问题。并且预案文本中的动词位置不固定，导致语法各成分位置不固定，基于规则和机器学习方法建立的实体识别模型难以较好地解析预案文本。本发明在标记时将执行动词作为触发词，再进行预案识别时，以触发词为中心，先识别触发词的位置和各名词实体的位置，然后通过识别触发词与各名词实体的语法关系，这样可以通过识别触发词将预案文本中所有的预案特征提取出来，提高预案识别准确率。

下面结合附图和具体实施方式对本发明作进一步详细的说明。

附图说明

图1为本发明的流程图；

图2为本发明的网络结构图。

具体实施方式

下面将结合本发明实施例，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都涉及本发明保护的范围。

实施例1

如图1～图2所示，本实施例提出了一种基于数据驱动的电网故障处置预案辅助决策方法，包括，

步骤400：采用BERT模型将预案文本转化为可计算的词向量；

步骤700：建立预案特征与电网实时运行告警信息间的文本相似度计算模型，所述预案特征包括预案实体和预案实体关系，收集样本训练文本相似度计算模型；

步骤800将每一特征和电网实时运行告警信息转化成可计算的词向量，输入到文本相似度计算模型，输出相似值；选择相似值最高的预案特征所对应的预案事件作为故障处置的辅助决策。

本实施例基于BERT预训练模型的动态词向量将预案文本转化为可计算的词向量，采用BiLSTM-CRF网络框架建立预案实体识别模型，采用TextCNN建立预案实体关系抽取模型。

通过BERT模型将预案文本字符转化为768维向量，将预案实体词向量输入BiLSTM网络模型，采用前向和后向两个不同LSTM网络训练文本序列特征，通过CRF层提升预案实体触发词和名词的准确率。其中BiLSTM-CRF模型输入批处理大小为32，LSTM网络单元隐藏层状态维度为200，隐含层数为2，加入dropout层防止过拟合，系数为0.5。通过BiLSTM-CRF识别的预案实体种类主要为名词实体和动词实体，动词为文中所定义的预案事件触发词。同时将预案实体关系词向量输入到TextCNN网络实现实体关系抽取，通过词向量进行组合形成特征向量，采用卷积层和池化层进行特征提取，在网络卷积层中设定3个卷积核宽分别为1、3和5，卷积核数分别为30、40和50。采用时序最大池化处理各个通道数据，将各通道数据矩阵拉伸为一维向量，输入到全连接层中。

故障处置预案实体关系抽取本质是多分类问题，在全连接层后采用Softmax函数实现故障处置预案实体关系分类。预案实体关系依据触发词与各名词实体间语法划分为操作发起者(sub-object)、操作对象(object)、操作对象补语(com-object)、操作对象前置状语(pre-object)、操作对象后置状语(rea-object)。

故障处置预案表述事件较多且逻辑复杂，按照通常方法划分的预案实体和实体关系种类较多，通过建立命名实体识别和实体关系抽取模型难以准确地识别预案事件中所有事件要素和要素关系。通过分析故障处置预案语言特点，每条预案事件均含有执行动词，因此提出了以执行动词为触发词的故障处置预案标记方法，所有的预案名词实体与触发词存在着语法关系，这样可以通过识别触发词将预案事件中所有的事件要素提取出来，提高预案实体识别准确率和事件识别准确率。

以动词实体作为触发词的预案事件抽取方法可以解决预案专业语言表述倒装、语序混杂以及电力设备实体表述不规范等问题。预案事件中的动词位置不固定，导致语法各成分位置不固定，基于规则和机器学习方法建立的实体识别模型难以较好地解析预案，但是本实施例以触发词为中心的预案识别方法首先识别触发词位置和各名词实体位置，然后通过识别触发词与各名词实体的语法关系，可以将预案事件中各成分准确识别出来。

以“控制南湖电厂出力不超过100万千万”预案为例，首先识别“控制”触发词和“南湖电厂”、“不超过100万千万”名词实体，然后识别“控制”与“南湖电厂”间关系为操作对象，“控制”与“不超过100万千万”间关系为操作对象后置状语，只要在触发词识别准确的情况下，可以有效地实现预案事件抽取。对于电力设备实体表述不规范情况，如“东湖I、II线”一个名词实体包含两个电力实体“东湖I线”、“东湖II线”，先用模型识别“东湖I、II线”整个实体，再使用规则进行实体拆分。

实施例2

在实施例1的基础上，还包括BERT模型转换方法，

BERT预训练模型主要包括MASK文本预处理层、词嵌入层和双向Transformer特征编码层，Transformer编码层通过自注意力层Attention更好地获取自然语言文本在语境中的特征信息，生成动态词向量，克服一词多义问题。

BERT模型主要通过MASK文本预处理层和双向Transformer提升对自然语言特征表示能力。预案文本首先进入MASK预处理层，进行随机遮掩，采用非监督学习方法预测遮掩词汇，使语言模型能够利用上下文信息对当前词编码，加强BERT模型双向语言表征能力。

如调度专业语言文本“调减鄂豫断面潮流”中被MASK词汇为“潮流”，将输入文本转化为“[CLS]调减鄂豫断面[MASK][MASK][SEP]”，在使用BERT模型微调阶段需要尽量降低[MASK]标记带来的负面影响，可以利用同义特征词代替标记，如使用“功率”代替“潮流”，提升语言模型学习能力。

在训练过程中采用下一句预测(NSP)任务，使模型更好地理解上下文逻辑关系和因果关系。词嵌入层将预处理层向量转化为词向量、段向量以及位置向量，从不同维度提升自然语言文本表示能力。

双向Transformer由6个Encoder-Decoder结构组成，采用注意力机制和前馈神经网络建立，将词嵌入层中词向量、位置向量和段落向量作为输入，采用多头自注意力机制学习预案文本序列中的字词相互关系。多头注意力机制将多个自注意力机制融合，可以从不同角度学习更大的容量信息，计算表达式如下所示：

MutiHead(Q,P,V)＝Concat(head₁,...,head_h)W⁰，式中：Q，P，V分别为字向量矩阵；D_K表示词嵌入层维度；W⁰表示多头注意力拼接矩阵。

实施例3

在实施例1的基础上，还包括BiLSTM-CRF模型预案特征提取方法，

BiLSTM-CRF混合神经网络框架是经典的序列特征抽取模型，由双向LSTM和CRF组成。通过BiLSTM可以从不同方向更好地记忆文本序列中的信息，使特征信息更加完整，随后加入CRF可以高效地学习各文本实体类别间的特征，提高特征识别效果。

(1)LSTM原理

BiLSTM由前向LSTM和后向LSTM组成，前向网络从预案文本初始进行训练，后向网络预案文本末尾开始训练，双向网络的结合最大限度的保留文本序列特征，相比单层LSTM更适合文本序列特征识别任务。LSTM由输入门、遗忘门、输出门和储存记忆细胞组成，有效地解决了循环神经网络(RNN)训练时梯度消失和梯度爆炸问题，适合长文本序列信息建模。

输入门I_t用于控制当前时刻的输入如何输入到当前记忆细胞中，遗忘门F_t决定当前记忆细胞中上一时刻的信息保留多少，输出门O_t决定输出什么内容，对于当前时刻t，若O_t＝1，则表示输出，若O_t＝0，则表示不输出。表达式如下：

I_t＝σ(W_i[h_t-1,x_t]+b_i)，

F_t＝σ(W_f[h_t-1,x_t]+b_f)，

O_t＝σ(W_o[h_t-1,x_t]+b_o)，

式中：W_i为输入门权重；h_t-1为隐含状态；x_t为输入数据；b_i为输入门偏置项；σ为sigmoid函数；W_f为遗忘门权重；b_f为遗忘门偏置项；W_o为遗忘门权重；b_o为遗忘门偏置项。

为当前记忆细胞，存储历史记忆内容，在确定过去记忆与新内容的保留部分后，更新细胞，表达式如下所示：

式中：W_c为隐含状态权重；b_c为隐含状态偏置项。

(2)CRF原理

CRF通过状态转移矩阵，可以得到整个预测序列的得分，得分函数公式为：

式中：

是CRF模型中相邻的状态转移矩阵分布值；

是BiLSTM模型的输出向量的分数值。

将分数值归一化后，获得模型的概率公式：

式中：Y_X表示所有可能的序列标注。

CRF使用对数概率进行正确标签序列的优化，对于训练样本有以下公式：

最后，通过极大似然估计函数获取最高得分的标签序列作为最终预测的输出序列，其公式如下：

实施例4

在实施例1的基础上，还包括TextCNN模型预案特征关系提取方法，

卷积神经网络(CNN)具有较强特征提取能力，TextCNN在CNN基础上提出，是一种典型的文本分类算法。TextCNN将文本数据看作一维时间序列，按照一维图像来处理，实现自然语言语义建模。

TextCNN网络在提取文本特征时分成以下步骤：

(1)定义多个一维卷积核，然后使用这些卷积核对输入进行卷积计算，不同长度的卷积核会抽取出多个邻近字(词)之间的相互关系。假设模型的输入数据为词向量矩阵N，输入的文本由m个字组成，神经网络中的权重为W，偏置为b，获得故障处置预案特征A_i的计算公式为：A_i＝f(W·N_i:i+h-1+b)

式中：i＝1,2,…,m-h+1，h是卷积核的长度，N_i:i+h-1是剧本N的第i行到第i+h-1行，f是一个非线性函数；

(2)使用时序最大池化对输出的所有通道提取代表性特征，然后将这些代表性特征拼接成一个新的特征向量；

(3)通过全连接层将拼接后的向量输出为概率最大的一个标签，通过计算预测与实际标签的损失函数，使用梯度下降算法对参数进行更新。

实施例5

在实施例1的基础上，还包括文本相似度计算模型，

建立预案特征与电网实时运行告警信息间的文本相似度计算模型，具体地采用残差向量-字词嵌入向量-编码向量(RE2)计算预案特征与电网实时运行告警信息间的关系。

RE2文本相似度匹配模型在充分考虑推理速度和匹配效果的基础上，充分融合了残差向量、初始字词嵌入向量、编码向量，大幅度简化了参数量和计算量，更适合落地应用到文本匹配等场景，两个文本序列的输入模型结构相同，模型组成主要包括：增强残差连接层、对齐层、融合层、预测层。

收集样本集进行训练，得到训练好的文本相似度计算模型。根据样本集文本字符、文档向量相似度等信息，构造区别度较高的文本相似度计算模型训练文本对(Text_k,1,Text_k,2,C_k)，其中k代表第k个文本对，label_k为其对应的类别，C_k∈(0,1)，如两个文本同属一个类别，则label设为1，否则置零，k∈(1,M)，M代表训练集大小。

将电网实时运行告警信息和预案特征转化成可计算的词向量，输入到文本相似度计算模型，计算得到与电网故障匹配故障最佳的预案。

以上仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。