CN113762716B

CN113762716B - 基于深度学习和注意力的台区运行状态评估方法及系统

Info

Publication number: CN113762716B
Application number: CN202110870930.2A
Authority: CN
Inventors: 张淞珲; 徐新光; 郭亮; 刘涛; 邢宇; 王者龙; 李哲; 郭腾炫; 陈子鉴; 董贤光; 张仲耀
Original assignee: State Grid Corp of China SGCC; State Grid Shandong Electric Power Co Ltd; Marketing Service Center of State Grid Shandong Electric Power Co Ltd
Current assignee: State Grid Corp of China SGCC; State Grid Shandong Electric Power Co Ltd; Marketing Service Center of State Grid Shandong Electric Power Co Ltd
Priority date: 2021-07-30
Filing date: 2021-07-30
Publication date: 2023-07-25
Anticipated expiration: 2041-07-30
Also published as: CN113762716A

Abstract

本发明提出了一种基于深度学习和注意力的台区运行状态评估方法及系统，包括：获取台区运行状态序列数据及潜在影响因素序列数据；基于所获取的数据进行特征提取，提取与台区运行状态评估变化关联度大于预设关联度阈值的特征，得到与台区状态变化相关的状态上下文特征；基于状态上下文特征进行联合分布嵌入，获得联合嵌入表征；基于联合嵌入表征进行融合注意力机制的深度学习模型训练，获得评估模型，基于该模型进行台区运行状态评估。

Description

基于深度学习和注意力的台区运行状态评估方法及系统

技术领域

本发明属于电力信息处理的技术领域，尤其涉及基于深度学习和注意力的台区运行状态评估方法及系统。

背景技术

本部分的陈述仅仅是提供了与本发明相关的背景技术信息，不必然构成在先技术。

随着智能电网的深入发展，用户对电能质量的要求也不断提高。部分台区由于配电网结构复杂、规模巨大、不确定因素较多等因素的影响，无法保证用户用电的质量。这些问题如果没有得到及时发现和解决，会对用户的用电体验造成很大的影响。如何准确评估台区的运行状态，为台区科学管理提供决策支撑，是需要解决的一个关键问题。

在对台区进行运行状态评估时，面临着一些问题和挑战，包括：

台区运行中产生大量的数据、指标等，这些运行数据从不同维度表征台区的运行状态，这些运行数据具有不同的物理意义，具有不同的含义，如何选择合适的运行数据对台区运行状态进行评估，是需要解决的首要问题。

另外，影响或表征台区运行状态的运行数据之间存在着复杂的关联关系，同时，这些运行数据影响或表征台区运行状态的重要程度不同，这些都对台区运行状态评估带来了困难。

同一运行数据在台区运行的不同时刻，表征着台区运行的运行状态，不同时刻运行数据对台区运行状态的影响权重是不同的。为实现对台区运行状态的准确评估，需要准确度量不同时刻不同因素的影响程度。

发明内容

为克服上述现有技术的不足，本发明提供了一种基于深度学习和注意力的台区运行状态评估方法，能够确保台区运行状态评估的准确性。

为实现上述目的，本发明的一个或多个实施例提供了如下技术方案：

第一方面，公开了一种基于深度学习和注意力的台区运行状态评估方法，包括：

获取表征台区运行状态的运行数据序列及影响台区运行的潜在影响因素序列数据；

基于所获取的数据进行特征提取，提取与台区运行状态评估变化关联度大于预设关联度阈值的特征，抽取得到与台区运行状态变化的相关的状态上下文特征；

基于状态上下文特征进行联合分布嵌入，获得联合嵌入表征；

基于联合嵌入表征进行融合注意力机制的深度学习模型训练，获得评估模型，基于该模型进行台区运行状态评估。

进一步的技术方案，基于所获取的台区运行数据序列数据及潜在影响因素序列数据，首先进行数据预定义，然后进行数据规范化处理，接着进行特征相关统计量计算，基于计算的统计量获取筛选特征，基于筛选特征获得与台区状态变化相关的状态上下文特征。

进一步的技术方案，针对在给定时间区间范围的台区运行状态序列数据和各个潜在影响因素的序列数据，基于Person相关选择影响台区运行状态评估变化的特征选择，消除特征的冗余并提取与台区运行状态评估变化高关联度的特征，在台区运行过程中，筛选特征与台区运行状态评估之间的相关统计量随着时间的变化而改变。

进一步的技术方案，通过公开数据服务，如天气预报网等，采集台区潜在影响因素序列数据，包括温度、雷雨、风力及雾霾影响因素；

对采集的上述影响因素数据进行向量化，转换为对应的影响因素向量，在一个时间间隔内的变化可构成一个轨迹数据。

进一步的技术方案，所述台区运行数据序列获取时，首先获得台区在某时刻产生的运行向量，以及其在一个时间区间内的变化可构成运行数据变化的轨迹数据。

进一步的技术方案，所述特征提取的具体过程是：

针对N个不同的台区，定义任一台区的运行状态向量变化，以及其对应的状态上下文标识；

对上述台区运行状态向量进行规范化处理；

给定一个包含N个台区的样本集合，对每一个样本基于Person相关计算其与上下文特征中不同影响因素的相关度；

设置阈值，抽取Person相关系数超过阈值的某影响因素，将相关统计量大于阈值的影响因素作为筛选特征，基于筛选特征数据，获得抽取的特征。

进一步的技术方案，构建台区运行状态的联合分布嵌入表征的过程是：

获取台区运行状态向量序列数据及上下文特征数据，将特征数据映射为索引表示，构建特征-索引映射矩阵，得到对应的低维稠密的向量集合；

基于低维特征向量集合，构建由输入门、候选记忆单元、输出门和遗忘门组成的长短期记忆网络；

基于构建的长短期记忆网络，计算出一系列正向隐状态；

基于长短期记忆网络的隐状态数据，采用数据加权求和获取最终台区运行状态向量和上下文状态向量的组合隐状态，从而获得台区运行状态的联合分布嵌入表征。

进一步的技术方案，基于联合嵌入表征进行融合注意力机制的深度学习模型训练，以不同台区的运行状态向量序列数据和上下文特征向量序列数据的嵌入表征作为输入，通过注意力机制，基于特征之间相互影响以及特征内部之间时间因素影响复杂关联关系的考虑进行协同建模。

进一步的技术方案，基于联合嵌入表征进行融合注意力机制的深度学习模型训练，训练过程为：

利用台区运行状态向量序列数据及状态上下文特征，对其进行联合嵌入表征；

将得到的联合嵌入表征输入到双向长短期记忆网络中进行训练，其得到隐藏状态；

对于隐藏状态，通过Attention机制进行学习，并通过Softmax函数得到目前时刻台区的二元运行状态良好、糟糕的概率；

通过不断迭代，直到模型收敛，或达到最大训练次数。

进一步的技术方案，针对某台区某一时间间隔内的运行状态向量序列和上下文序列，得到联合表征，然后输入评估模型，得到台区在此时间间隔结束时的运行状态。

第二方面，公开了一种基于深度学习和注意力的台区运行状态评估系统，包括：

特征提取模块，被配置为：基于所获取的数据进行特征提取，提取与台区运行状态评估变化关联度大于预设关联度阈值的特征，抽取得到与台区运行状态变化的相关的状态上下文特征，获取的数据为台区运行状态序列数据及潜在影响因素序列数据；

联合分布嵌入模块，被配置为：基于状态上下文特征进行联合分布嵌入，获得联合嵌入表征；

融合注意力机制的深度学习模块，被配置为：基于联合嵌入表征进行融合注意力机制的深度学习模型训练，学习台区运行状态序列数据和上下文特征的联合嵌入表征，获得评估模型；

台区运行状态评估模块，基于给定的台区运行状态序列和上下文状态序列，输入至评估模型，输出在序列结束时的台区运行状态评估结果。

以上一个或多个技术方案存在以下有益效果：

本发明通过基于深度学习的方法自动抽取与台区运行相关的特征，并通过注意力机制，实现对特征之间相互影响以及特征内部之间时间因素影响等复杂关联关系的协同建模，确保台区运行状态评估的准确性。

本发明通过对台区运行情况的分析，提取与台区运行状态评估变化相关的特征，将其作为台区运行状态评估的影响因素，将其与台区运行状态序列作为联合嵌入表征，以更好地表征台区运行状态的真实情况。

本发明通过双向长短期记忆网络深度学习方法，自动抽取与台区运行状态评估相关的特征，减少人工特征工程的不完备性。

本发明通过融合注意力机制，挖掘台区运行不同状态序列间相互影响，以及特征内部之间时间因素影响等复杂关联关系，提高台区运行状态评估的准确性。

本发明附加方面的优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

图1为本公开实施例提供的基于深度学习和注意力的台区运行状态评估方法的整体流程图；

图2为本公开实施例提供的基于Relief算法的台区运行状态评估相关联的特提取流程图；

图3为本公开实例提供的台区运行状态序列数据与运行上下文特征序列数据的联合嵌入表征流程图；

图4为公开实施例提供的基于深度学习和注意力机制的台区运行状态评估生成图；

图5为本公开实施例提供的基于深度学习和注意力机制的台区运行状态评估生成装置结构示意图。

具体实施方式

应该指出，以下详细说明都是示例性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。

在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

实施例一

如图1所示，本实施例公开了基于深度学习和注意力的台区运行状态评估方法，首先接收台区运行数据序列数据等运行状态信息和潜在影响台区运行状态评估的上下文特征序列数据，提取与台区运行状态评估变化关联度大于预设关联度阈值的特征，得到与台区运行状态变化相关的特征；

基于与台区运行状态评估变化相关的上下文特征，基于长短期记忆网络，构建台区运行状态的联合嵌入表征；

结合双向长短期记忆网络和注意力机制，构建台区运行状态评估模型，输入台区运行状态序列数据及其联合表征，输出为台区运行状态评估结果，对双向长短期记忆网络和注意力机制进行训练；

基于训练后的台区运行状态评估模型，输入台区运行的状态序列和上下文序列，得到台区运行状态评估。

具体步骤包括：

步骤A：采集台区运行的相关信息，包含台区运行中接收到的台区运行数据序列及台区设备运行环境数据，对获取的序列数据进行预处理，提取台区运行状态评估相关的特征数据。具体地，基于某台区为应用实例，将该台区某时间间隔内的台区运行的序列状态数据及台区运行的上下文数据作为训练样本。

特征提取的一般过程为：

A1.分析台区运行的各种影响因素。通过专家分析，从公开数据服务，如天气预报网等，得到如下潜在影响因素：温度、雷雨、风力、雾霾等。

表1台区运行的部分潜在影响因素

本发明对表1中的影响因素进行数据收集，并对其进行向量化，转换为对应的影响因素向量。对某台区c_x，某时刻t_i影响因素上下文可标识为

其在一个时间间隔[t_i,t_j]内的上下文变化可构成一个影响因素上下文序列，即轨迹数据

A2.台区运行状态数据收集及预处理。

为简便起见，对某台区c_x，假定其在某时刻t_i产生的运行状态向量为其在一个时间区间内的变化可构成状态变化的轨迹数据即台区状态向量序列为：

对于该台区，其评估状态序列为

A3.对不同台区的状态向量序列及对应的上下文序列进行规范化处理，进行影响因素的特征选择，消除特征的冗余并提取与台区运行状态评估变化高度关联的特征。

其中，对获取的台区状态向量序列进行预处理，包括缺失值处理、数据归一化，并采用卡方检验进行简单的相关性分析，消除重复影响因素及因子选择的任意性，降低问题的复杂度，从而消除台区运行状态评估影响因素特征的冗余。

针对在时间区间范围[t_i,t_j]的台区状态向量序列和各个潜在影响因素的变化/>基于Person相关选择影响台区运行状态评估变化的特征选择，消除特征的冗余并提取与台区运行状态评估变化高关联度的特征，在台区运行过程中，筛选特征与台区运行状态评估之间的相关统计量随着时间的变化而改变。

具体地，如图2所示，所述步骤A3中进行影响台区运行状态评估的特征选择的一般生成过程为：

A3.1.假定有N个不同的台区，第x个台区的状态向量变化定义为如公式(2)所示，其对应的状态上下文如公式(1)所示。

A3.2.对台区状态向量进行规范化处理，采用min-max标准化方法进行归一化处理，特征数据取值为[0,1]。

A3.3.给定一个包含N个台区的样本集合对每一个样本/>基于Person相关计算其与上下文特征/>中不同影响因素的相关度。

A3.4.设置阈值τ，抽取Person相关系数超过阈值τ的某影响因素将相关统计量大于阈值τ的影响因素作为筛选特征，记为/>基于选择数据，抽取的上下文特征数据为：

步骤B：

基于与台区运行状态变化相关的上下文特征，构建台区运行状态序列的联合分布嵌入表征，如图3所示，其构建台区运行状态的联合分布嵌入表征的一般过程为：

B1.基于步骤A获取台区运行状态向量序列数据及抽取的上下文特征数据采用embedding层将特征数据映射为索引表示，构建特征-索引映射矩阵A，通过embedding映射，得到对应的低维稠密的向量集合v＝{v_i,v_i+1,…,v_j}。

式中，K为embedding层的维度，K＝j-i，A∈R^|C|·K表示特征映射矩阵，C为中相关影响因素的个数。Φ为针对台区运行状态数据/>与上下文特征数据的聚合函数，可以采用不同的聚合函数。

B2.基于低维特征向量集合v，构建由输入门、候选记忆单元、输出门和遗忘门组成的长短期记忆网络LSTM，模型构建原理过程如下：

f_t＝sigmoid(W_f·[h_t-1,v_t]+b_f) (9)

i_t＝sigmoid(W_i·[h_t-1,v_t]+b_i) (10)

C_t＝tanh(W_c·[h_t-1,v_t]+b_c) (11)

C_t＝f_t×C_t-1+i_t×C_t (12)

o_t＝sigmoid(W_o·[h_t-1,v_t]+b_o) (13)

h_t＝o_t×tanh(C_t) (14)

式中，v_t表示t时刻的输入向量，h_t-1表示上一个时刻的输出向量，{W_f,W_i,W_c,W_o}为对应单元的权重系数矩阵，{b_f,b_i,b_c,b_o}为对应单元的偏移向量，sigmoid为激活函数，式(9)为遗忘门数据处理过程，t时刻遗忘门值由v_t和h_t-1计算获取，旨在对数据记录进行保留或遗弃；式(10)是以sigmoid函数激活W_i·[h_t-1,v_t]+b_i细胞状态的值，式(11)是获取候选记忆单元的值；式(12)是以f_t、i_t对候选记忆单元C_t-1、C_t进行取值调节；式(13)和式(14)是在t时刻由h_t-1和v_t进行的内部循环和更新，从而获取长短期记忆网络LSTM最后的隐状态的输出h_j；

基于构建的LSTM，LSTM读取从v_i到v_j序列计算出一系列正向隐状态

B3.基于长短期记忆网络的隐状态数据，采用数据加权求和获取最终台区运行状态向量和上下文状态向量的组合隐状态H_j，即台区运行状态向量和上下文状态向量的联合嵌入表征。

台区c_x运行状态的联合分布嵌入表征则为将其表征为：

式中，

步骤C：基于深度学习和注意力机制，构建台区运行状态评估学习模型，以不同台区的运行状态向量序列数据和上下文特征向量序列数据的嵌入表征作为输入，通过注意力机制，实现对特征之间相互影响以及特征内部之间时间因素影响等复杂关联关系的考虑和协同建模。如图4所示，基于深度学习和注意力机制的训练过程为：

C1.利用台区运行状态向量序列数据及状态上下文特征/>基于步骤B对其进行联合嵌入表征，得到/>

C2.将得到的联合嵌入表征输入到双向长短期记忆网络中进行训练，其得到隐藏状态{H_ti,H_ti+1,…,H_tj}。

C3.对于隐藏状态{H_ti,H_ti+1,…,H_tj}，通过Attention机制进行学习，并通过Softmax函数得到目前时刻t_j台区c_x的二元运行状态良好(Good,G)、糟糕(Bad,B)的概率，输出为Status。

C4.不断迭代，直到模型收敛，或达到最大训练次数Num。

步骤D：

通过基于深度学习和注意力机制的台区运行状态评估模型，输入某台区c_x某一时间间隔内的运行状态向量序列和上下文序列，得到联合表征，然后输入台区运行状态评估模型，得到台区在此时间间隔结束时的运行状态。其一般处理过程为：

D1.设台区c_x运行状态向量序列为和上下文序列将其输入到联合嵌入模块中，得到联合嵌入表征/>

D2.将联合嵌入表征输入到台区运行状态评估模块中，得到台区c_x在t_j的评估Evaluation。

如图5所示，本实施例提供了一种基于深度学习和注意力的台区运行状态评估装置，包括：

特征提取模块，其用于从潜在影响因素序列数据中提取与台区运行状态序列数据变化关联度大于预设阈值的特征；

联合分布嵌入模块，其用于将台区运行状态序列数据与其相关的上下文特征进行联合表征；

融合注意力机制的深度学习模块，其用于学习台区运行状态序列数据和上下文特征的联合嵌入表征；

台区运行状态评估模块，其用于基于给定的台区运行状态序列和上下文状态序列，输出在序列结束时的台区运行状态评估，该评估结果可用于提示管理者进行必要的介入提醒。

在另一实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如图1所示的基于深度学习和注意力的台区运行状态评估方法中的步骤。

在又一实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如图1所示的基于深度学习和注意力的台区运行状态评估方法中的步骤。

以上实施例的装置中涉及的各步骤与方法实施例一相对应，具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质；还应当被理解为包括任何介质，所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。

本领域技术人员应该明白，上述本发明的各模块或各步骤可以用通用的计算机装置来实现，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。

上述虽然结合附图对本发明的具体实施方式进行了描述，但并非对本发明保护范围的限制，所属领域技术人员应该明白，在本发明的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims

1.一种基于深度学习和注意力的台区运行状态评估方法，其特征是，包括：

获取台区运行状态序列数据及潜在影响因素序列数据；

基于所获取的数据进行特征提取，提取与台区运行状态评估变化关联度大于预设关联度阈值的特征，抽取得到与台区状态变化的相关的状态上下文特征；

基于联合嵌入表征进行融合注意力机制的深度学习模型训练，获得评估模型，基于该模型进行台区运行状态评估；

所述特征提取的具体过程是：

针对N个不同的台区，定义任一台区的状态向量变化，以及其对应的状态上下文标识；

对上述台区状态向量进行规范化处理；

设置阈值，抽取Person相关系数超过阈值的某影响因素，将相关统计量大于阈值的影响因素作为筛选特征，基于筛选特征数据，获得抽取的特征；

构建台区运行状态的联合分布嵌入表征的过程是：

基于构建的长短期记忆网络，计算出一系列正向隐状态；

基于长短期记忆网络的隐状态数据，采用数据加权求和获取最终台区运行状态向量和上下文状态向量的组合隐状态，从而获得台区运行状态的联合分布嵌入表征；

基于联合嵌入表征进行融合注意力机制的深度学习模型训练，以不同台区的运行状态向量序列数据和上下文特征向量序列数据的嵌入表征作为输入，通过注意力机制，基于特征之间相互影响以及特征内部之间时间因素影响复杂关联关系的考虑进行协同建模；

基于联合嵌入表征进行融合注意力机制的深度学习模型训练，训练过程为：

通过不断迭代，直到模型收敛，或达到最大训练次数。

2.如权利要求1所述的一种基于深度学习和注意力的台区运行状态评估方法，其特征是，基于所获取的台区运行状态序列数据及潜在影响因素序列数据，首先进行数据预定义，然后进行数据规范化处理，接着进行特征相关统计量计算，基于计算的统计量获取筛选特征，基于筛选特征获得与台区状态变化相关的状态上下文特征。

3.如权利要求1所述的一种基于深度学习和注意力的台区运行状态评估方法，其特征是，针对某台区某一时间间隔内的运行状态向量序列和上下文序列，得到联合表征，然后输入评估模型，得到台区在此时间间隔结束时的运行状态。

4.一种基于深度学习和注意力的台区运行状态评估系统，执行如权利要求1-3任一项所述的基于深度学习和注意力的台区运行状态评估方法，其特征是，包括：

特征提取模块，被配置为：基于所获取的数据进行特征提取，提取与台区运行状态评估变化关联度大于预设关联度阈值的特征，抽取得到与台区状态变化的相关的状态上下文特征，获取的数据为台区运行状态序列数据及潜在影响因素序列数据；

5.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1-3任一所述的基于深度学习和注意力的台区运行状态评估方法中的步骤。

6.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如权利要求1-3任一所述的基于深度学习和注意力的台区运行状态评估方法中的步骤。