CN114861977A

CN114861977A - 一种面向不均衡电力数据的蒸馏集成模式感知算法及系统

Info

Publication number: CN114861977A
Application number: CN202210344179.7A
Authority: CN
Inventors: 韩丁; 白宏坤; 王世谦; 王圆圆; 李秋燕; 宋大为; 卜飞飞; 华远鹏; 王涵; 贾一博; 刘洋
Original assignee: Sichuan University; State Grid Corp of China SGCC; Economic and Technological Research Institute of State Grid Henan Electric Power Co Ltd
Current assignee: Sichuan University; State Grid Corp of China SGCC; Economic and Technological Research Institute of State Grid Henan Electric Power Co Ltd
Priority date: 2022-03-31
Filing date: 2022-03-31
Publication date: 2022-08-05
Anticipated expiration: 2042-03-31
Also published as: CN114861977B

Abstract

本发明涉及一种面向不均衡电力数据的蒸馏集成模式感知算法，包括如下步骤：S1：采用基于DGS的过采样技术，对存在态势分布不均衡的电力数据进行态势空间重构处理；S2：采用模型压缩技术，并结合LN机制和Attention机制，构建基于CLSTM神经网络的电力数据深度学习模式感知模型；S3：提出蒸馏式集成学习策略并进行优化，解决基学习机集群的冗余问题。本发明具有算法效能稳定、效率高、规模小的特点，同时能够解决基学习机集群的冗余问题。

Description

一种面向不均衡电力数据的蒸馏集成模式感知算法及系统

技术领域

本发明属于电力数据挖掘技术领域，具体涉及一种面向不均衡电力数据的蒸馏集成模式感知算法及系统。

背景技术

随着智能电网和能源互联网发展的飞速发展，人工智能等现代信息技术与传统电网技术的融合进程也日趋加快，成为辅助电网管理人员快速感知电力系统多源数据内在规律、实施精准控制和决策的高效手段。当前以集成学习、深度学习为代表的前沿人工智能技术在电力系统安全与控制，设备运维与故障诊断以及负荷管理等方面展现出良好的应用价值，对提高电网运行可靠性、优化用户用能服务及推动我国能源转型具有技术支撑作用。长期以来，集成学习因良好的算法稳定性、准确性和鲁棒性被广泛应用到计算机视觉、生物、医学及工程等多个领域。电力数据广泛分布于电力系统“发输变配用”每个环节，采集实时性强，价值密度高。近年来，利用集成学习挖掘电力数据内在规律已在电网暂态稳定评估、变压器故障诊断、负荷预测、非侵入式负荷检测等领域展现出极高的利用价值。

不断提升集成学习性能是应对复杂多元数据处理任务的根本要求，对深入挖掘电力数据价值、支持电力信息化建设具有重要意义。然而，受基学习机差异性和准确度的制约，使得集成学习的性能提升也会受到限制。集成学习通过训练生成多个基学习机并以多数投票方式融合各个基学习机学习结果来提高算法精度。研究表明，基学习机训练集群中通常会存在性能冗余的个体，其学习能力与其它基分类器重合，致使基学习机集群内部差异性特质不足。当前，构建优质的差异化基学习机的典型方法包括异质基学习机集成、随机子空间集成以及Bagging和Boosting集成等，其中异质基学习机集成由于算法复杂度较高因此应用场景受限，随机子空间集成存在特征子空间冗余的问题，而Bagging和Boosting集成对生成差异化基学习机理论的研究尚不成熟。

传统集成学习利用弱学习器构建基学习机集群，其突出特点是训练速度较快，但准确度方面表现较差。集成以深度学习为代表的强学习机在算法准确度方面性能突出，然而随着数据挖掘应用对算法学习容量的要求不断提升，深度学习的算法效率、算法复杂度成为制约其数据和算法效能协同的关键因素。

态势分布不均衡天然存在于电网暂态稳定、变压器故障及电力负荷等数据中，该问题映射到分类模型层面会严重削弱模型对小类样本的识别能力，因此在电力数据模式感知等研究中引起广泛的关注。以SMOTE过采样算法为代表的态势空间重构方法，能避免将态势空间重构过程与模式辨识过程耦合，应用更为广泛，然而，传统SMOTE方法忽略了样本集的分布特性，重构后的态势空间容易失真，在高比例不均衡场景中算法难以保持稳定的采样效果，甚至干扰多数类样本的分类过程。通过学习电力数据态势分布规律，以生成对抗网络为代表的智能式生成模型能获取拟真度高的人工样本，但算法复杂度较高，计算开销成本大，难以满足实际应用需求。

发明内容

本发明的目的是为了克服现有技术的不足，而提供一种面向不均衡电力数据的蒸馏集成模式感知算法及系统，能够解决基学习机集群的冗余问题，具有算法效能稳定、准确度以及效率高、规模小的特点。

本发明采用的技术方案为：一种面向不均衡电力数据的蒸馏集成模式感知算法，包括如下步骤：

S1：采用基于DGS的过采样技术，对存在态势分布不均衡的电力数据进行态势空间重构处理；

S2：采用模型压缩技术，并结合LN机制和Attention机制，构建基于CLSTM神经网络的电力数据深度学习模式感知模型；

S3：提出蒸馏式集成学习策略并进行优化，解决基学习机集群的冗余问题。

具体的，所述步骤S1具体包括如下步骤：

S11：判别少数类日负荷序列样本，设日负荷序列样本集为D，按负荷模式类别差异划分为M类样本子集{D_m|m＝1,…,M}，若样本子集D_m的样本数量小于最大样本子集数量的1/5，则判定该类负荷样本子集为少数类，对其进行样本合成，得到少数类样本集D_m；

S12：对少数类样本集D_m实施DBSCAN聚类，得到若干聚类簇{D_m,c|c＝1,…,C}，并记录各聚类簇的聚类中心样本

S13：记录DBSCAN聚类后每个聚类簇D_m,c的密度直接可达图G(D_m,c,ρ,κ)；

S14：计算各聚类簇的样本数目分布比例，按比例在各聚类簇中合成新样本；

S15：搜索采样路径，每次合成新样本时在聚类簇D_m,c随机选定一个真实样本x_r，在G(D_m,c,ρ,κ)中采用Dijkstra算法搜索x_r到聚类中心

的最短加权图路径，其中

其中

和

表示x_r到聚类中心

最短加权图路径经过的样本点，

表示直接密度可达，将

作为本次的采样路径；

S16：进行新样本合成，在

中随机选择一段直接密度可达边

作为本次的采样区间，在采样区间内设定插值距离

另其服从均匀分布：

随机生成插值坐标θ：

为增强合成样本的多样性，对θ添加一随机扰动向量o，o的每一维度均服从如下正态分布：

式中σ表示相对标准差，

最后生成本次的新样本，表示如下：

S17：重复步骤S15-S16，直到少数类样本总数目达到最大样本子集数目的1/5。

具体的，所述步骤S2具体包括如下步骤：

S21：对LSTM单元进行改进，改进后的LSTM单元通过对网络参数降维投影来缩减模型参数规模；

S22：利用LN层对神经网络层参数进行归一化处理；

S23：Attention层的输入为LSTM网络层所有时间步的输出列向量

根据

对队列任务的贡献程度分配注意力权值参数。

具体的，在步骤S3中，所述蒸馏式集成学习策略，通过最小正则化经验风险函数来确定基学习机在分类决策中的权重系数ω，其基本目标函数由经验风险项和正则项构成，表示如下：

Γ(ω)＝λL(ω)+P(ω)

其中，L(ω)表示经验风险项，P(ω)表示正则项，λ为超参数。

具体的，所述经验风险项的构建过程如下：

令ω＝[ω₁,…,ω_n]^T，表示基学习机集群{h₁,…h_n}的权重系数，则集成基学习机决策模型对样本x_i的分类结果表示如下：

基于上式，定义集成边界m(x_i)：

其中，y_i为样本标签，m(x_*)∈{1,-1}，当分类正确时为1，分类错误时为-1，

基于集成边界，定义集成基学习机决策模型下所有样本的经验风险函数L：

对经验风险函数L进行优化，得到的经验风险函数L表示如下：

具体的，在对经验风险函数L进行优化时，采用代理损失优化方法，将改进huber函数作为L的代理优化函数，表示如下：

其中，参数δ用于调节函数对噪声样本的敏感性，按经验设为0.65。

具体的，所述正则项的构建过程如下：

将基学习机h_k和h_p对训练集的分类结果组织为向量形式，计算其互信息系数表示两基学习机学习结果的相似程度，公式表示如下：

其中，p(*,*)表示两变量的联合概率分布，p(*)表示变量的边缘概率，v表示基学习机{h}对训练集{x}的分类决策结果，其矩阵表达为：

其中，N表示训练集样本总数目，

将基学习机h_k与其他基学习机的互信息系数均值作为该基学习机的冗余度，表示如下：

其中，Ω_k表示基学习机集合，

定义基学习机h_k的贡献度，表示如下：

S(h_k)＝I(h_k,y)-R(h_k)

其中，y为训练集标签样本的标签向量，

将s(h_k)作为惩罚因子带入正则项，贡献度低的基学习机s(h_k)越大，被萃取的几率越小，计及基学习机贡献度的正则项p构建如下：

P＝ω^TS^-1ω

其中，S＝diag[S(h₁),…,S(h_n)]。

具体的，所述步骤S3具体为：基于蒸馏式集成学习策略，构建蒸馏式集成优化模型，采用多数投票法集成CLSTM分类模型，解决基学习机集群的冗余问题。

具体的，所述采用多数投票法集成CLSTM的具体步骤为：将CLSTM分类模型，通过标签样本集训练生成基分类器池，经过蒸馏式集成学习策略萃取去冗余后的CLSTM基学习机子集群，通过多数投票法对各基学习机的分类结果融合决策，得到最终分类结果。

一种面向不均衡电力数据的蒸馏集成模式感知系统，所述蒸馏集成模式感知系统被应用于所述的算法中，所述蒸馏集成模式感知系统包括压缩深度学习机，所述压缩深度学习机采用CLSTM分类模型，所述CLSTM分类模型包括依次级联的数据预处理模块、改进LSTM层、LN层、Relu非线性层、Attention层以及Softmax层，并通过Softmax层决策输出分类结果，表征数据样本隶属于各类别标签的概率。

本发明的有益效果：

1、本发明所提出的基于DGS过采样技术的算法，能自适应调节态势空间中不同分布区域的小类样本合成数量，经平衡处理后对样本的态势边界形态具有较好的保持效果，可有效改善电力数据的态势分布不均衡问题，对态势边界样本的重叠程度影响较小。

2、所提出的CLSTM分类模型及其感知算法，通过压缩模型参数使模型的算法规模得到缩减，模型的存储成本更低，且对电力数据具有更好的关键特征捕捉能力，学习速度显著提升，所需训练时长更少。

3、所提出的优化的蒸馏式集成学习策略，通过优质基学习机的模型萃取技术解决基学习机冗余问题，具有更强的算法准确度、算法效率以及算法稳定性。

4、本发明融合了电力数据态势空间重构算法、压缩深度学习机算法以及蒸馏式集成学习策略，充分考虑到了电力数据和感知算法之间的效能协同问题，从数据增强和算法增强两个层次综合提升电力数据模式感知的效能，具有更好的数据适应性和应用普适性。

附图说明

图1为本发明的流程步骤图；

图2为本发明的电力数据态势空间重构方法示意图；

图3为本发明的总体路线示意图；

图4为本发明所述LSTM神经元示意图；

图5为本发明所述CLSTM分类模型示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围，以下结合实施例具体说明。

如图1、2和3所示，一种面向不均衡电力数据的蒸馏集成模式感知算法，其具体步骤如下：

S1：采用基于DGS的过采样技术，对存在态势分布不均衡的电力数据进行态势空间重构处理，该技术基于样本空间密度采样，自适应调节态势空间中不同分布区域的少类样本合成数量，具体步骤如下：

S11：判别少数类日负荷序列样本

设日负荷序列样本集为D，按负荷模式类别差异划分为M类样本子集{D_m|m＝1,…,M}，若样本子集D_m的样本数量小于最大样本子集数量的1/5，则判定该类负荷样本子集为少数类，对其进行样本合成，得到少数类样本集D_m；

S12：对少数类样本密度聚类

对少数类样本集D_m实施DBSCAN聚类，得到若干聚类簇{D_m,c|c＝1,…,C}，并记录各聚类簇的聚类中心样本

S13：聚类簇构建直接密度可达图

记录DBSCAN聚类后每个聚类簇D_m,c的密度直接可达图G(D_m,c,ρ,κ)；

S14：确定每一聚类簇的样本合成数目

计算各聚类簇的样本数目分布比例，按比例在各聚类簇中合成新样本；

S15：搜索采样路径

每次合成新样本时在聚类簇D_m,c随机选定一个真实样本x_r，在G(D_m,c,ρ,κ)中采用Dijkstra算法搜索x_r到聚类中心

的最短加权图路径，其中

其中

和

表示x_r到聚类中心

最短加权图路径经过的样本点，

表示直接密度可达，将

作为本次的采样路径；

S16：进行新样本合成

在

中随机选择一段直接密度可达边

作为本次的采样区间，在采样区间内设定插值距离

另其服从均匀分布：

随机生成插值坐标θ：

式中σ表示相对标准差，

最后生成本次的新样本，表示如下：

S2：采用模型压缩技术，并结合LN机制和Attention机制，构建基于CLSTM神经网络的电力数据深度学习模式感知模型，具体步骤如下：

S21：LSTM通过精巧的“门”结构设计来控制LSTM单元中长时记忆信息的更新，针对LSTM参数复杂、计算效率低的不足，对LSTM单元进行改进，改进后的LSTM单元通过对网络参数降维投影来缩减模型参数规模，改进后的LSTM神经元的示意图如图4所示，其具体过程如下：

改进后的LSTM单元的投影层公式表示如下：

r_t＝W_rhh_t

y_t＝φ(W_yrr_t+b_y)

式中，r_t为转换矩阵W_rh缩减特征维度后的隐藏状态，φ为网络层的输出激活函数，这里采用Relu函数，改进后的LSTM单元的各“门”函数表示如下：

i_t＝δ(W_ixx_t+W_irr_t-1+W_icC_t-1+b_i)

f_t＝δ(W_fxx_t+W_frr_t-1+W_fcC_t-1+b_f)

C_t＝f_t C_t-1+i_t tanh(W_cxx_t+W_crr_t-1+b_c)

O_t＝δ(W_axx_t+W_orr_t-1+W_ocC_t-1+b_o)

其中，i_t、f_t和O_t分别为输入门、遗忘门和输出门，C_t为改进后的LSTM模型的长时记忆状态，经过投影层对模型参数进行降维投影后，模型参数缩减数量为：

n_R＝4n_c ²-5n_rn_c+n_cn_o-n_rn_o

其中，n_c表示隐层神经元数目，n_r表示投影层输出的特征维度，n_o等于y_t的输出特征维度。

S22：利用LN层对神经网络层参数进行归一化处理，能够提高模型对于数据的适应性，加快收敛，其采用的计算公式表示如下：

式中，U表示网络层中隐藏单元的数量，

表示网络层l神经元i的输出结果，未经非线性激活函数置换到[0,1]区间，均值μ和方差σ均为归一化参数，在LN机制中，网络层中的所有隐藏单元共享相同的归一化参数。

S23：Attention层的输入为LSTM网络层所有时间步的输出列向量

根据

对队列任务的贡献程度分配注意力权值参数，Attention层的计算公式如下：

c_t＝softmax(q^T·K)·V

V＝K^T

q＝K·W

其中，K和V^T表示Attention层中的键值对，W为权重矩阵，q表示Attention层的队列任务，softmax函数对注意力权值参数q^T·K进行归一化处理。

采用CLSTM的压缩深度学习机作为电力数据模式感知的基础学习机，CLSTM分类模型利用模型压缩技术的参数投影功能，压缩LSTM模型参数，降低其计算、存储开销，对于长时序数据处理具有明显效率优势；利用Attention机制快速捕捉序列关键特征，具有更快的训练速度；通过LN对网络层参数归一化处理，可加速LSTM模型训练过程，提升其学习泛化性能。

S3：提出蒸馏式集成学习策略并进行优化，解决基学习机集群的冗余问题

蒸馏式集成学习策略遵循如下原则：基学习机的冗余度越高，被萃取的可能性越小，此外，预测准确率高的基学习机具有优先萃取权，所提蒸馏式集成学习策略的步骤为：首先，构造评估集成学习误分类损失的正则化经验风险目标函数，使分类准确度高的基学习机能被优先萃取；其次，采用互信息系数MIC构建量化基学习机间相关性的冗余度指标，并基于该指标提出评估基学习机对集成学习贡献度的重要性指标，将重要性指标作为惩罚因子纳入优化问题的正则项中，目的是使DIL策略在尽量不牺牲CLSTM丢弃，保留权重不为零的个体集合，通过多数投票法参与集成。

具体如下：

所述蒸馏式集成学习策略，通过最小正则化经验风险函数来确定基学习机在分类决策中的权重系数ω，其基本目标函数由经验风险项和正则项构成，表示如下：

Γ(ω)＝λL(ω)+P(ω)

其中，L(ω)表示经验风险项，近似度量集成基学习机决策模型对训练样本集的错误分类损失，P(ω)表示正则项，λ为超参数，通过超参数λ调节二者的比例，控制集成基学习机决策模型的算法复杂度，提升模型泛化能力。

所述经验风险项的构建过程如下：

基于上式，定义集成边界m(x_i)：

鉴于L非凸、不连续的函数性质，传统优化方法难以处理，在对经验风险函数L进行优化时，采用代理损失优化方法，将改进huber函数作为L的代理优化函数，表示如下：

所述正则项的构建过程如下：

互信息系数可以反映变量间的相关度，将基学习机h_k和h_p对训练集的分类结果组织为向量形式，计算其互信息系数表示两基学习机学习结果的相似程度，公式表示如下：

其中，N表示训练集样本总数目，

其中，Ω_k表示基学习机集合，

标签样本分类准确率高且具有低冗余度的基学习机参与集成学习时可带来更好的精度增益，定义基学习机h_k的贡献度，表示如下：

S(h_k)＝I(h_k,y)-R(h_k)

其中，y为训练集标签样本的标签向量，

P＝ω^TS^-1ω

其中，S＝diag[S(h₁),…,S(h_n)]。

然后构建蒸馏式集成优化模型，表示如下：

采用多数投票法集成CLSTM分类模型，解决基学习机集群的冗余问题，具体为：将CLSTM分类模型，通过标签样本集训练生成基分类器池，经过蒸馏式集成学习策略萃取去冗余后的CLSTM基学习机子集群，通过多数投票法对各基学习机的分类结果融合决策，得到最终分类结果。

一种面向不均衡电力数据的蒸馏集成模式感知系统，所述蒸馏集成模式感知系统被应用于所述的算法中，所述蒸馏集成模式感知系统包括压缩深度学习机，所述压缩深度学习机采用CLSTM分类模型，如图5所示，所述CLSTM分类模型包括依次级联的数据预处理模块、改进LSTM层、LN层、Relu非线性层、Attention层以及Softmax层，并通过Softmax层决策输出分类结果，表征数据样本隶属于各类别标签的概率，其中，数据预处理模块采用三次样条插值来完成待处理数据的缺失重构。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的得同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims

1.一种面向不均衡电力数据的蒸馏集成模式感知算法，其特征在于，包括如下步骤：

2.根据权利要求1所述的一种面向不均衡电力数据的蒸馏集成模式感知算法，其特征在于，所述步骤S1具体包括如下步骤：

的最短加权图路径，其中

其中

和

表示x_r到聚类中心

最短加权图路径经过的样本点，

表示直接密度可达，将

作为本次的采样路径；

S16：进行新样本合成，在

中随机选择一段直接密度可达边

作为本次的采样区间，在采样区间内设定插值距离

另其服从均匀分布：

随机生成插值坐标θ：

式中σ表示相对标准差，

最后生成本次的新样本，表示如下：

3.根据权利要求1所述的一种面向不均衡电力数据的蒸馏集成模式感知算法，其特征在于，所述步骤S2具体包括如下步骤：

S22：利用LN层对神经网络层参数进行归一化处理；

S23：Attention层的输入为LSTM网络层所有时间步的输出列向量

根据

对队列任务的贡献程度分配注意力权值参数。

4.根据权利要求1所述的一种面向不均衡电力数据的蒸馏集成模式感知算法，其特征在于：在步骤S3中，所述蒸馏式集成学习策略，通过最小正则化经验风险函数来确定基学习机在分类决策中的权重系数ω，其基本目标函数由经验风险项和正则项构成，表示如下：

Γ(ω)＝λL(ω)+P(ω)

其中，L(ω)表示经验风险项，P(ω)表示正则项，λ为超参数。

5.根据权利要求4所述的一种面向不均衡电力数据的蒸馏集成模式感知算法，其特征在于，所述经验风险项的构建过程如下：

基于上式，定义集成边界m(x_i)：

6.根据权利要求5所述的一种面向不均衡电力数据的蒸馏集成模式感知算法，其特征在于：在对经验风险函数L进行优化时，采用代理损失优化方法，将改进huber函数作为L的代理优化函数，表示如下：

7.根据权利要求4所述的一种面向不均衡电力数据的蒸馏集成模式感知算法，其特征在于，所述正则项的构建过程如下：

其中，N表示训练集样本总数目，

其中，Ω_k表示基学习机集合，

定义基学习机h_k的贡献度，表示如下：

S(h_k)＝I(h_k,y)-R(h_k)

其中，y为训练集标签样本的标签向量，

P＝ω^TS^-1ω

其中，S＝diag[S(h₁),…,S(h_n)]。

8.根据权利要求4所述的一种面向不均衡电力数据的蒸馏集成模式感知算法，其特征在于，所述步骤S3具体为：基于蒸馏式集成学习策略，构建蒸馏式集成优化模型，采用多数投票法集成CLSTM分类模型，解决基学习机集群的冗余问题。

9.根据权利要求8所述的一种面向不均衡电力数据的蒸馏集成模式感知算法，其特征在于，所述采用多数投票法集成CLSTM分类模型的具体步骤为：将CLSTM分类模型，通过标签样本集训练生成基分类器池，经过蒸馏式集成学习策略萃取去冗余后的CLSTM基学习机子集群，通过多数投票法对各基学习机的分类结果融合决策，得到最终分类结果。

10.一种面向不均衡电力数据的蒸馏集成模式感知系统，其特征在于：所述蒸馏集成模式感知系统被应用于权利要求1-9中任一项权利要求所述的算法中，所述蒸馏集成模式感知系统包括压缩深度学习机，所述压缩深度学习机采用CLSTM分类模型，所述CLSTM分类模型包括依次级联的数据预处理模块、改进LSTM层、LN层、Relu非线性层、Attention层以及Softmax层，并通过Softmax层决策输出分类结果，表征数据样本隶属于各类别标签的概率。