CN113987183A - 一种基于数据驱动的电网故障处置预案辅助决策方法 - Google Patents
一种基于数据驱动的电网故障处置预案辅助决策方法 Download PDFInfo
- Publication number
- CN113987183A CN113987183A CN202111269357.6A CN202111269357A CN113987183A CN 113987183 A CN113987183 A CN 113987183A CN 202111269357 A CN202111269357 A CN 202111269357A CN 113987183 A CN113987183 A CN 113987183A
- Authority
- CN
- China
- Prior art keywords
- plan
- text
- power grid
- word
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 239000013598 vector Substances 0.000 claims abstract description 71
- 238000004364 calculation method Methods 0.000 claims abstract description 19
- 230000006870 function Effects 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000011176 pooling Methods 0.000 claims description 4
- 230000007704 transition Effects 0.000 claims description 4
- 230000000873 masking effect Effects 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 claims description 3
- 238000007476 Maximum Likelihood Methods 0.000 claims description 2
- 238000009826 distribution Methods 0.000 claims description 2
- 238000004140 cleaning Methods 0.000 claims 1
- 239000000126 substance Substances 0.000 claims 1
- 239000010410 layer Substances 0.000 description 25
- 238000000605 extraction Methods 0.000 description 12
- 238000012549 training Methods 0.000 description 11
- 230000002457 bidirectional effect Effects 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000033228 biological regulation Effects 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/258—Heading extraction; Automatic titling; Numbering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Economics (AREA)
- Probability & Statistics with Applications (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及电网故障技术领域,提出了一种基于数据驱动的电网故障处置预案辅助决策方法,包括标记预案文本中预案实体和预案实体间的语法关系;将预案文本转化为可计算的词向量;将预案实体词向量输入到BiLSTM‑CRF模型,识别输出预案实体;将预案实体关系词向量输入到TextCNN模型,识别输出预案实体关系;建立预案特征与电网实时运行告警信息间的文本相似度计算模型;将预案特征和电网实时运行告警信息输入到文本相似度计算模型,选择相似值最高的预案特征所对应的预案事件作为故障处置的辅助决策。通过上述技术方案,为调度员快速处置故障提供了有效的辅助决策,保障了电网的安全稳定运行。解决电力调度文本中电网故障处置预案利用率较低的问题。
Description
技术领域
本发明涉及电网故障技术领域,具体的,涉及一种基于数据驱动的电网故障处置预案辅助决策方法。
背景技术
电力调度文本中含有大量保障电网安全稳定运行的知识,是指导调控运行人员工作的宝典。在我国特高压交直流混联大电网格局已经形成,各区域电网通过特高压连接为一个整体,呈现出电压等级高、输电便利、结构复杂、运行方式多变的态势,与此同时为调控人员带来严峻的技术和管理挑战,电网调度规程种类繁多、存在形式多样,如调度规程、故障处置预案、工作票、停电计划以及启动方案等。
其中故障处置预案变化频繁,表述复杂,但对电网故障处置预案,在线辅助决策等调度业务具有重要作用。故障处置预案包含电网在各种运行方式下重大故障和处置方式,对保障电网安全稳定运行至关重要。但是目前在处置电网业务中利用率低,其中宝贵的知识难以迭代复用,因此将现有电力调度规程文本电子化和可用知识化,对促进智能调控的发展具有重要战略意义。
发明内容
本发明提出一种基于数据驱动的电网故障处置预案辅助决策方法,将电网故障处置预案基于大数据和自然语言处理方法分析挖掘海量故障处置预案中的运行特征,通过感知电网实时状态快速推荐出电网故障情况下的参考预案,解决了现有电力调度文本中电网故障处置预案利用率较低的问题。
本发明的技术方案如下:
一种基于数据驱动的电网故障处置预案辅助决策方法,包括,
步骤100:输入电力调度文本故障处置预案,所述电力调度文本故障处置预案包括多个预案事件;
步骤200:提取预案事件中的有效成分作为预案文本,所述预案文本包括预案标题、电网故障前运行方式和电网故障后运行方式;
步骤300:标记预案文本中预案实体,并标记预案实体间的语法关系,所述预案实体包括名词实体和动词实体,其中动词实体作为预案文本的触发词;
步骤400:采用BERT模型将预案文本转化为可计算的词向量;
步骤500:将预案文本词向量输入到BiLSTM-CRF模型,识别输出预案实体词向量;
步骤600:将预案文本词向量输入到TextCNN模型,识别输出预案实体关系词向量;
步骤700将每一特征和电网实时运行告警信息转化成可计算的词向量,输入到文本相似度计算模型,输出相似值;选择相似值最高的预案特征所对应的预案事件作为故障处置的辅助决策。
本发明的工作原理及有益效果为:
1、本发明通过BERT模型预训练的动态词向量模型表征预案文本中的专业语言,加深其在语境中的表示能力。以电力调度文本故障处置预案为研究对象,提出触发词为中心的预案标记和事件抽取方法,采用BiLSTM-CRF训练名词实体和触发词识别模型,采用TextCNN训练触发词与各名词实体的关系抽取模型。通过构建文本相似度计算模型,将预案特征和电网实时运行告警信息转化成可计算的词向量,输入到文本相似度计算模型,选择相似值最高的预案特征所对应的预案事件作为故障处置的辅助决策。为调度员快速处置故障提供了有效的辅助决策,保障了电网的安全稳定运行。
2、因为预案文本中存在专业语言表述倒装、语序混杂以及电力设备实体表述不规范等问题。并且预案文本中的动词位置不固定,导致语法各成分位置不固定,基于规则和机器学习方法建立的实体识别模型难以较好地解析预案文本。本发明在标记时将执行动词作为触发词,再进行预案识别时,以触发词为中心,先识别触发词的位置和各名词实体的位置,然后通过识别触发词与各名词实体的语法关系,这样可以通过识别触发词将预案文本中所有的预案特征提取出来,提高预案识别准确率。
下面结合附图和具体实施方式对本发明作进一步详细的说明。
附图说明
图1为本发明的流程图;
图2为本发明的网络结构图。
具体实施方式
下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都涉及本发明保护的范围。
实施例1
如图1~图2所示,本实施例提出了一种基于数据驱动的电网故障处置预案辅助决策方法,包括,
步骤100:输入电力调度文本故障处置预案,所述电力调度文本故障处置预案包括多个预案事件;
步骤200:提取预案事件中的有效成分作为预案文本,所述预案文本包括预案标题、电网故障前运行方式和电网故障后运行方式;
步骤300:标记预案文本中预案实体,并标记预案实体间的语法关系,所述预案实体包括名词实体和动词实体,其中动词实体作为预案文本的触发词;
步骤400:采用BERT模型将预案文本转化为可计算的词向量;
步骤500:将预案文本词向量输入到BiLSTM-CRF模型,识别输出预案实体词向量;
步骤600:将预案文本词向量输入到TextCNN模型,识别输出预案实体关系词向量;
步骤700:建立预案特征与电网实时运行告警信息间的文本相似度计算模型,所述预案特征包括预案实体和预案实体关系,收集样本训练文本相似度计算模型;
步骤800将每一特征和电网实时运行告警信息转化成可计算的词向量,输入到文本相似度计算模型,输出相似值;选择相似值最高的预案特征所对应的预案事件作为故障处置的辅助决策。
本实施例基于BERT预训练模型的动态词向量将预案文本转化为可计算的词向量,采用BiLSTM-CRF网络框架建立预案实体识别模型,采用TextCNN建立预案实体关系抽取模型。
通过BERT模型将预案文本字符转化为768维向量,将预案实体词向量输入BiLSTM网络模型,采用前向和后向两个不同LSTM网络训练文本序列特征,通过CRF层提升预案实体触发词和名词的准确率。其中BiLSTM-CRF模型输入批处理大小为32,LSTM网络单元隐藏层状态维度为200,隐含层数为2,加入dropout层防止过拟合,系数为0.5。通过BiLSTM-CRF识别的预案实体种类主要为名词实体和动词实体,动词为文中所定义的预案事件触发词。同时将预案实体关系词向量输入到TextCNN网络实现实体关系抽取,通过词向量进行组合形成特征向量,采用卷积层和池化层进行特征提取,在网络卷积层中设定3个卷积核宽分别为1、3和5,卷积核数分别为30、40和50。采用时序最大池化处理各个通道数据,将各通道数据矩阵拉伸为一维向量,输入到全连接层中。
故障处置预案实体关系抽取本质是多分类问题,在全连接层后采用Softmax函数实现故障处置预案实体关系分类。预案实体关系依据触发词与各名词实体间语法划分为操作发起者(sub-object)、操作对象(object)、操作对象补语(com-object)、操作对象前置状语(pre-object)、操作对象后置状语(rea-object)。
故障处置预案表述事件较多且逻辑复杂,按照通常方法划分的预案实体和实体关系种类较多,通过建立命名实体识别和实体关系抽取模型难以准确地识别预案事件中所有事件要素和要素关系。通过分析故障处置预案语言特点,每条预案事件均含有执行动词,因此提出了以执行动词为触发词的故障处置预案标记方法,所有的预案名词实体与触发词存在着语法关系,这样可以通过识别触发词将预案事件中所有的事件要素提取出来,提高预案实体识别准确率和事件识别准确率。
以动词实体作为触发词的预案事件抽取方法可以解决预案专业语言表述倒装、语序混杂以及电力设备实体表述不规范等问题。预案事件中的动词位置不固定,导致语法各成分位置不固定,基于规则和机器学习方法建立的实体识别模型难以较好地解析预案,但是本实施例以触发词为中心的预案识别方法首先识别触发词位置和各名词实体位置,然后通过识别触发词与各名词实体的语法关系,可以将预案事件中各成分准确识别出来。
以“控制南湖电厂出力不超过100万千万”预案为例,首先识别“控制”触发词和“南湖电厂”、“不超过100万千万”名词实体,然后识别“控制”与“南湖电厂”间关系为操作对象,“控制”与“不超过100万千万”间关系为操作对象后置状语,只要在触发词识别准确的情况下,可以有效地实现预案事件抽取。对于电力设备实体表述不规范情况,如“东湖I、II线”一个名词实体包含两个电力实体“东湖I线”、“东湖II线”,先用模型识别“东湖I、II线”整个实体,再使用规则进行实体拆分。
实施例2
在实施例1的基础上,还包括BERT模型转换方法,
BERT预训练模型主要包括MASK文本预处理层、词嵌入层和双向Transformer特征编码层,Transformer编码层通过自注意力层Attention更好地获取自然语言文本在语境中的特征信息,生成动态词向量,克服一词多义问题。
BERT模型主要通过MASK文本预处理层和双向Transformer提升对自然语言特征表示能力。预案文本首先进入MASK预处理层,进行随机遮掩,采用非监督学习方法预测遮掩词汇,使语言模型能够利用上下文信息对当前词编码,加强BERT模型双向语言表征能力。
如调度专业语言文本“调减鄂豫断面潮流”中被MASK词汇为“潮流”,将输入文本转化为“[CLS]调减鄂豫断面[MASK][MASK][SEP]”,在使用BERT模型微调阶段需要尽量降低[MASK]标记带来的负面影响,可以利用同义特征词代替标记,如使用“功率”代替“潮流”,提升语言模型学习能力。
在训练过程中采用下一句预测(NSP)任务,使模型更好地理解上下文逻辑关系和因果关系。词嵌入层将预处理层向量转化为词向量、段向量以及位置向量,从不同维度提升自然语言文本表示能力。
双向Transformer由6个Encoder-Decoder结构组成,采用注意力机制和前馈神经网络建立,将词嵌入层中词向量、位置向量和段落向量作为输入,采用多头自注意力机制学习预案文本序列中的字词相互关系。多头注意力机制将多个自注意力机制融合,可以从不同角度学习更大的容量信息,计算表达式如下所示:MutiHead(Q,P,V)=Concat(head1,...,headh)W0,式中:Q,P,V分别为字向量矩阵;DK表示词嵌入层维度;W0表示多头注意力拼接矩阵。
实施例3
在实施例1的基础上,还包括BiLSTM-CRF模型预案特征提取方法,
BiLSTM-CRF混合神经网络框架是经典的序列特征抽取模型,由双向LSTM和CRF组成。通过BiLSTM可以从不同方向更好地记忆文本序列中的信息,使特征信息更加完整,随后加入CRF可以高效地学习各文本实体类别间的特征,提高特征识别效果。
(1)LSTM原理
BiLSTM由前向LSTM和后向LSTM组成,前向网络从预案文本初始进行训练,后向网络预案文本末尾开始训练,双向网络的结合最大限度的保留文本序列特征,相比单层LSTM更适合文本序列特征识别任务。LSTM由输入门、遗忘门、输出门和储存记忆细胞组成,有效地解决了循环神经网络(RNN)训练时梯度消失和梯度爆炸问题,适合长文本序列信息建模。
输入门It用于控制当前时刻的输入如何输入到当前记忆细胞中,遗忘门Ft决定当前记忆细胞中上一时刻的信息保留多少,输出门Ot决定输出什么内容,对于当前时刻t,若Ot=1,则表示输出,若Ot=0,则表示不输出。表达式如下:
It=σ(Wi[ht-1,xt]+bi),
Ft=σ(Wf[ht-1,xt]+bf),
Ot=σ(Wo[ht-1,xt]+bo),
式中:Wi为输入门权重;ht-1为隐含状态;xt为输入数据;bi为输入门偏置项;σ为sigmoid函数;Wf为遗忘门权重;bf为遗忘门偏置项;Wo为遗忘门权重;bo为遗忘门偏置项。
式中:Wc为隐含状态权重;bc为隐含状态偏置项。
(2)CRF原理
CRF通过状态转移矩阵,可以得到整个预测序列的得分,得分函数公式为:
式中:YX表示所有可能的序列标注。
实施例4
在实施例1的基础上,还包括TextCNN模型预案特征关系提取方法,
卷积神经网络(CNN)具有较强特征提取能力,TextCNN在CNN基础上提出,是一种典型的文本分类算法。TextCNN将文本数据看作一维时间序列,按照一维图像来处理,实现自然语言语义建模。
TextCNN网络在提取文本特征时分成以下步骤:
(1)定义多个一维卷积核,然后使用这些卷积核对输入进行卷积计算,不同长度的卷积核会抽取出多个邻近字(词)之间的相互关系。假设模型的输入数据为词向量矩阵N,输入的文本由m个字组成,神经网络中的权重为W,偏置为b,获得故障处置预案特征Ai的计算公式为:Ai=f(W·Ni:i+h-1+b)
式中:i=1,2,…,m-h+1,h是卷积核的长度,Ni:i+h-1是剧本N的第i行到第i+h-1行,f是一个非线性函数;
(2)使用时序最大池化对输出的所有通道提取代表性特征,然后将这些代表性特征拼接成一个新的特征向量;
(3)通过全连接层将拼接后的向量输出为概率最大的一个标签,通过计算预测与实际标签的损失函数,使用梯度下降算法对参数进行更新。
实施例5
在实施例1的基础上,还包括文本相似度计算模型,
建立预案特征与电网实时运行告警信息间的文本相似度计算模型,具体地采用残差向量-字词嵌入向量-编码向量(RE2)计算预案特征与电网实时运行告警信息间的关系。
RE2文本相似度匹配模型在充分考虑推理速度和匹配效果的基础上,充分融合了残差向量、初始字词嵌入向量、编码向量,大幅度简化了参数量和计算量,更适合落地应用到文本匹配等场景,两个文本序列的输入模型结构相同,模型组成主要包括:增强残差连接层、对齐层、融合层、预测层。
收集样本集进行训练,得到训练好的文本相似度计算模型。根据样本集文本字符、文档向量相似度等信息,构造区别度较高的文本相似度计算模型训练文本对(Textk,1,Textk,2,Ck),其中k代表第k个文本对,labelk为其对应的类别,Ck∈(0,1),如两个文本同属一个类别,则label设为1,否则置零,k∈(1,M),M代表训练集大小。
将电网实时运行告警信息和预案特征转化成可计算的词向量,输入到文本相似度计算模型,计算得到与电网故障匹配故障最佳的预案。
以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种基于数据驱动的电网故障处置预案辅助决策方法,其特征在于,包括,
步骤100:输入电力调度文本故障处置预案,所述电力调度文本故障处置预案包括多个预案事件;
步骤200:提取预案事件中的有效成分作为预案文本,所述预案文本包括预案标题、电网故障前运行方式和电网故障后运行方式;
步骤300:标记预案文本中预案实体,并标记预案实体间的语法关系,所述预案实体包括名词实体和动词实体,其中动词实体作为预案文本的触发词;
步骤400:采用BERT模型将预案文本转化为可计算的词向量;
步骤500:将预案文本词向量输入到BiLSTM-CRF模型,识别输出预案实体词向量;
步骤600:将预案文本词向量输入到TextCNN模型,识别输出预案实体关系词向量;
步骤700将每一特征和电网实时运行告警信息转化成可计算的词向量,输入到文本相似度计算模型,输出相似值;选择相似值最高的预案特征所对应的预案事件作为故障处置的辅助决策。
2.根据权利要求1所述的一种基于数据驱动的电网故障处置预案辅助决策方法,其特征在于,所述步骤200包括,
步骤201:对每个预案事件进行数据清洗;
步骤202:提取清洗后的预案事件中的有效成分,包括预案标题、电网故障前运行方式和电网故障后运行方式。
3.根据权利要求1所述的一种基于数据驱动的电网故障处置预案辅助决策方法,其特征在于,所述步骤400包括,
步骤401:将预案文本输入到BERT模型的预处理层进行随机遮掩,采用非监督学习方法预测遮掩词汇,输出预处理层向量;
步骤402:将预处理层向量输入到词嵌入层,输出词向量、段向量和位置向量;
步骤403:将词向量、段向量和位置向量输入到特征编码层,采用多头自注意力机制学习文本序列中的字词相互关系,输出预案文本的词向量。
4.根据权利要求1所述的一种基于数据驱动的电网故障处置预案辅助决策方法,其特征在于,所述步骤500包括,
步骤504:对概率使用对数处理,进行正确标签序列的优化,得到
5.根据权利要求1所述的一种基于数据驱动的电网故障处置预案辅助决策方法,其特征在于,所述步骤600包括,
步骤601:定义多个一维卷积核,然后使用这些卷积核对输入的预案文本词向量进行卷积计算,Ai=f(W·Ni:i+h-1+b),其中,i=1,2,……,m-h+1,h是卷积核的长度,Ni:i+h-1是剧本N的第i行到第i+h-1行,f是一个非线性函数;
步骤602:使用时序最大池化对输出的所有通道提取代表性特征,然后将这些代表性特征拼接成一个新的特征向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111269357.6A CN113987183A (zh) | 2021-10-29 | 2021-10-29 | 一种基于数据驱动的电网故障处置预案辅助决策方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111269357.6A CN113987183A (zh) | 2021-10-29 | 2021-10-29 | 一种基于数据驱动的电网故障处置预案辅助决策方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113987183A true CN113987183A (zh) | 2022-01-28 |
Family
ID=79744141
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111269357.6A Pending CN113987183A (zh) | 2021-10-29 | 2021-10-29 | 一种基于数据驱动的电网故障处置预案辅助决策方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113987183A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114997168A (zh) * | 2022-05-27 | 2022-09-02 | 国家电网公司华中分部 | 一种基于神经化正则表达式的电网故障处置预案解析方法 |
CN115170053A (zh) * | 2022-05-24 | 2022-10-11 | 中睿信数字技术有限公司 | 一种基于聚类融合的事件分拨处置系统 |
CN116934127A (zh) * | 2023-09-19 | 2023-10-24 | 中国铁塔股份有限公司吉林省分公司 | 基于智慧平台的应急预案生成方法及系统 |
CN117574159A (zh) * | 2024-01-12 | 2024-02-20 | 北京华品博睿网络技术有限公司 | 一种预训练模型的训练方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111428981A (zh) * | 2020-03-18 | 2020-07-17 | 国电南瑞科技股份有限公司 | 基于深度学习的电网故障预案信息提取方法和系统 |
CN111860882A (zh) * | 2020-06-17 | 2020-10-30 | 国网江苏省电力有限公司 | 一种电网调度故障处理知识图谱的构建方法及装置 |
CN112632972A (zh) * | 2020-12-25 | 2021-04-09 | 浙江国际海运职业技术学院 | 一种电网设备故障报告内故障信息的快速提取方法 |
KR20210085158A (ko) * | 2019-12-30 | 2021-07-08 | 한국과학기술원 | 문맥 정보를 고려한 개체명 인식 방법 및 장치 |
CN113157916A (zh) * | 2021-03-10 | 2021-07-23 | 南京航空航天大学 | 一种基于深度学习的民航突发事件抽取方法 |
CN113283704A (zh) * | 2021-04-23 | 2021-08-20 | 内蒙古电力(集团)有限责任公司乌兰察布电业局 | 基于知识图谱的电网故障智能处置系统及方法 |
CN113360641A (zh) * | 2021-05-07 | 2021-09-07 | 内蒙古电力(集团)有限责任公司乌兰察布电业局 | 一种基于深度学习的电网故障处置预案语义建模系统及方法 |
-
2021
- 2021-10-29 CN CN202111269357.6A patent/CN113987183A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210085158A (ko) * | 2019-12-30 | 2021-07-08 | 한국과학기술원 | 문맥 정보를 고려한 개체명 인식 방법 및 장치 |
CN111428981A (zh) * | 2020-03-18 | 2020-07-17 | 国电南瑞科技股份有限公司 | 基于深度学习的电网故障预案信息提取方法和系统 |
CN111860882A (zh) * | 2020-06-17 | 2020-10-30 | 国网江苏省电力有限公司 | 一种电网调度故障处理知识图谱的构建方法及装置 |
CN112632972A (zh) * | 2020-12-25 | 2021-04-09 | 浙江国际海运职业技术学院 | 一种电网设备故障报告内故障信息的快速提取方法 |
CN113157916A (zh) * | 2021-03-10 | 2021-07-23 | 南京航空航天大学 | 一种基于深度学习的民航突发事件抽取方法 |
CN113283704A (zh) * | 2021-04-23 | 2021-08-20 | 内蒙古电力(集团)有限责任公司乌兰察布电业局 | 基于知识图谱的电网故障智能处置系统及方法 |
CN113360641A (zh) * | 2021-05-07 | 2021-09-07 | 内蒙古电力(集团)有限责任公司乌兰察布电业局 | 一种基于深度学习的电网故障处置预案语义建模系统及方法 |
Non-Patent Citations (1)
Title |
---|
廖涛,勾艳杰,张顺香: "融合注意力机制的BERT-BiLSTM-CRF中文命名实体识别", 《阜阳师范大学学报(自然科学版)》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115170053A (zh) * | 2022-05-24 | 2022-10-11 | 中睿信数字技术有限公司 | 一种基于聚类融合的事件分拨处置系统 |
CN114997168A (zh) * | 2022-05-27 | 2022-09-02 | 国家电网公司华中分部 | 一种基于神经化正则表达式的电网故障处置预案解析方法 |
CN114997168B (zh) * | 2022-05-27 | 2024-05-28 | 国家电网公司华中分部 | 一种基于神经化正则表达式的电网故障处置预案解析方法 |
CN116934127A (zh) * | 2023-09-19 | 2023-10-24 | 中国铁塔股份有限公司吉林省分公司 | 基于智慧平台的应急预案生成方法及系统 |
CN116934127B (zh) * | 2023-09-19 | 2023-11-24 | 中国铁塔股份有限公司吉林省分公司 | 基于智慧平台的应急预案生成方法及系统 |
CN117574159A (zh) * | 2024-01-12 | 2024-02-20 | 北京华品博睿网络技术有限公司 | 一种预训练模型的训练方法及系统 |
CN117574159B (zh) * | 2024-01-12 | 2024-05-10 | 北京华品博睿网络技术有限公司 | 一种预训练模型的训练方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113987183A (zh) | 一种基于数据驱动的电网故障处置预案辅助决策方法 | |
CN111382565B (zh) | 基于多标签的情绪-原因对抽取方法及系统 | |
CN111966812B (zh) | 一种基于动态词向量的自动问答方法和存储介质 | |
CN115687626A (zh) | 一种基于提示学习融合关键词的法律文书分类方法 | |
CN107797987A (zh) | 一种基于Bi‑LSTM‑CNN的混合语料命名实体识别方法 | |
CN112084336A (zh) | 一种高速公路突发事件的实体提取和事件分类方法及装置 | |
CN112052319B (zh) | 一种基于多特征融合的智能客服方法及系统 | |
CN108536781B (zh) | 一种社交网络情绪焦点的挖掘方法及系统 | |
CN116341562A (zh) | 一种基于Unilm语言模型的相似问题生成方法 | |
CN115238693A (zh) | 一种基于多分词和多层双向长短期记忆的中文命名实体识别方法 | |
CN116842194A (zh) | 一种电力语义知识图谱系统及方法 | |
CN113886562A (zh) | 一种ai简历筛选方法、系统、设备和存储介质 | |
CN114881173A (zh) | 基于自注意力机制的简历分类方法和装置 | |
CN113722494A (zh) | 一种基于自然语言理解的设备故障定位方法 | |
CN113065352B (zh) | 一种电网调度工作文本的操作内容识别方法 | |
CN113177113A (zh) | 任务型对话模型预训练方法、装置、设备及存储介质 | |
CN117390189A (zh) | 基于前置分类器的中立文本生成方法 | |
CN116342167A (zh) | 基于序列标注命名实体识别的智能成本度量方法和装置 | |
CN114357166B (zh) | 一种基于深度学习的文本分类方法 | |
CN115840815A (zh) | 基于指针关键信息的自动摘要生成方法 | |
CN115936001A (zh) | 基于BERT-BiLSTM-CRF模型和注意力的电网IT运维实体识别方法及系统 | |
CN114912460A (zh) | 基于文本挖掘的精细化拟合识别变压器故障方法及设备 | |
Jing et al. | Chinese text sentiment analysis based on transformer model | |
Zhang et al. | Hierarchical attention networks for grid text classification | |
CN113849637A (zh) | 一种低噪声干扰的有监督关系抽取方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |