CN114861977A - 一种面向不均衡电力数据的蒸馏集成模式感知算法及系统 - Google Patents

一种面向不均衡电力数据的蒸馏集成模式感知算法及系统 Download PDF

Info

Publication number
CN114861977A
CN114861977A CN202210344179.7A CN202210344179A CN114861977A CN 114861977 A CN114861977 A CN 114861977A CN 202210344179 A CN202210344179 A CN 202210344179A CN 114861977 A CN114861977 A CN 114861977A
Authority
CN
China
Prior art keywords
sample
learning machine
distillation
cluster
power data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210344179.7A
Other languages
English (en)
Other versions
CN114861977B (zh
Inventor
韩丁
白宏坤
王世谦
王圆圆
李秋燕
宋大为
卜飞飞
华远鹏
王涵
贾一博
刘洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
State Grid Corp of China SGCC
Economic and Technological Research Institute of State Grid Henan Electric Power Co Ltd
Original Assignee
Sichuan University
State Grid Corp of China SGCC
Economic and Technological Research Institute of State Grid Henan Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University, State Grid Corp of China SGCC, Economic and Technological Research Institute of State Grid Henan Electric Power Co Ltd filed Critical Sichuan University
Priority to CN202210344179.7A priority Critical patent/CN114861977B/zh
Publication of CN114861977A publication Critical patent/CN114861977A/zh
Application granted granted Critical
Publication of CN114861977B publication Critical patent/CN114861977B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Tourism & Hospitality (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Primary Health Care (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Vaporization, Distillation, Condensation, Sublimation, And Cold Traps (AREA)

Abstract

本发明涉及一种面向不均衡电力数据的蒸馏集成模式感知算法,包括如下步骤:S1:采用基于DGS的过采样技术,对存在态势分布不均衡的电力数据进行态势空间重构处理;S2:采用模型压缩技术,并结合LN机制和Attention机制,构建基于CLSTM神经网络的电力数据深度学习模式感知模型;S3:提出蒸馏式集成学习策略并进行优化,解决基学习机集群的冗余问题。本发明具有算法效能稳定、效率高、规模小的特点,同时能够解决基学习机集群的冗余问题。

Description

一种面向不均衡电力数据的蒸馏集成模式感知算法及系统
技术领域
本发明属于电力数据挖掘技术领域,具体涉及一种面向不均衡电力数据的蒸馏集成模式感知算法及系统。
背景技术
随着智能电网和能源互联网发展的飞速发展,人工智能等现代信息技术与传统电网技术的融合进程也日趋加快,成为辅助电网管理人员快速感知电力系统多源数据内在规律、实施精准控制和决策的高效手段。当前以集成学习、深度学习为代表的前沿人工智能技术在电力系统安全与控制,设备运维与故障诊断以及负荷管理等方面展现出良好的应用价值,对提高电网运行可靠性、优化用户用能服务及推动我国能源转型具有技术支撑作用。长期以来,集成学习因良好的算法稳定性、准确性和鲁棒性被广泛应用到计算机视觉、生物、医学及工程等多个领域。电力数据广泛分布于电力系统“发输变配用”每个环节,采集实时性强,价值密度高。近年来,利用集成学习挖掘电力数据内在规律已在电网暂态稳定评估、变压器故障诊断、负荷预测、非侵入式负荷检测等领域展现出极高的利用价值。
不断提升集成学习性能是应对复杂多元数据处理任务的根本要求,对深入挖掘电力数据价值、支持电力信息化建设具有重要意义。然而,受基学习机差异性和准确度的制约,使得集成学习的性能提升也会受到限制。集成学习通过训练生成多个基学习机并以多数投票方式融合各个基学习机学习结果来提高算法精度。研究表明,基学习机训练集群中通常会存在性能冗余的个体,其学习能力与其它基分类器重合,致使基学习机集群内部差异性特质不足。当前,构建优质的差异化基学习机的典型方法包括异质基学习机集成、随机子空间集成以及Bagging和Boosting集成等,其中异质基学习机集成由于算法复杂度较高因此应用场景受限,随机子空间集成存在特征子空间冗余的问题,而Bagging和Boosting集成对生成差异化基学习机理论的研究尚不成熟。
传统集成学习利用弱学习器构建基学习机集群,其突出特点是训练速度较快,但准确度方面表现较差。集成以深度学习为代表的强学习机在算法准确度方面性能突出,然而随着数据挖掘应用对算法学习容量的要求不断提升,深度学习的算法效率、算法复杂度成为制约其数据和算法效能协同的关键因素。
态势分布不均衡天然存在于电网暂态稳定、变压器故障及电力负荷等数据中,该问题映射到分类模型层面会严重削弱模型对小类样本的识别能力,因此在电力数据模式感知等研究中引起广泛的关注。以SMOTE过采样算法为代表的态势空间重构方法,能避免将态势空间重构过程与模式辨识过程耦合,应用更为广泛,然而,传统SMOTE方法忽略了样本集的分布特性,重构后的态势空间容易失真,在高比例不均衡场景中算法难以保持稳定的采样效果,甚至干扰多数类样本的分类过程。通过学习电力数据态势分布规律,以生成对抗网络为代表的智能式生成模型能获取拟真度高的人工样本,但算法复杂度较高,计算开销成本大,难以满足实际应用需求。
发明内容
本发明的目的是为了克服现有技术的不足,而提供一种面向不均衡电力数据的蒸馏集成模式感知算法及系统,能够解决基学习机集群的冗余问题,具有算法效能稳定、准确度以及效率高、规模小的特点。
本发明采用的技术方案为:一种面向不均衡电力数据的蒸馏集成模式感知算法,包括如下步骤:
S1:采用基于DGS的过采样技术,对存在态势分布不均衡的电力数据进行态势空间重构处理;
S2:采用模型压缩技术,并结合LN机制和Attention机制,构建基于CLSTM神经网络的电力数据深度学习模式感知模型;
S3:提出蒸馏式集成学习策略并进行优化,解决基学习机集群的冗余问题。
具体的,所述步骤S1具体包括如下步骤:
S11:判别少数类日负荷序列样本,设日负荷序列样本集为D,按负荷模式类别差异划分为M类样本子集{Dm|m=1,…,M},若样本子集Dm的样本数量小于最大样本子集数量的1/5,则判定该类负荷样本子集为少数类,对其进行样本合成,得到少数类样本集Dm
S12:对少数类样本集Dm实施DBSCAN聚类,得到若干聚类簇{Dm,c|c=1,…,C},并记录各聚类簇的聚类中心样本
Figure BDA0003576038820000031
S13:记录DBSCAN聚类后每个聚类簇Dm,c的密度直接可达图G(Dm,c,ρ,κ);
S14:计算各聚类簇的样本数目分布比例,按比例在各聚类簇中合成新样本;
S15:搜索采样路径,每次合成新样本时在聚类簇Dm,c随机选定一个真实样本xr,在G(Dm,c,ρ,κ)中采用Dijkstra算法搜索xr到聚类中心
Figure BDA0003576038820000032
的最短加权图路径,其中
Figure BDA0003576038820000033
其中
Figure BDA0003576038820000034
Figure BDA0003576038820000035
表示xr到聚类中心
Figure BDA0003576038820000036
最短加权图路径经过的样本点,
Figure BDA0003576038820000037
表示直接密度可达,将
Figure BDA0003576038820000038
作为本次的采样路径;
S16:进行新样本合成,在
Figure BDA0003576038820000039
中随机选择一段直接密度可达边
Figure BDA00035760388200000310
作为本次的采样区间,在采样区间内设定插值距离
Figure BDA00035760388200000311
另其服从均匀分布:
Figure BDA0003576038820000041
随机生成插值坐标θ:
Figure BDA0003576038820000042
为增强合成样本的多样性,对θ添加一随机扰动向量o,o的每一维度均服从如下正态分布:
Figure BDA0003576038820000043
式中σ表示相对标准差,
最后生成本次的新样本,表示如下:
Figure BDA0003576038820000044
S17:重复步骤S15-S16,直到少数类样本总数目达到最大样本子集数目的1/5。
具体的,所述步骤S2具体包括如下步骤:
S21:对LSTM单元进行改进,改进后的LSTM单元通过对网络参数降维投影来缩减模型参数规模;
S22:利用LN层对神经网络层参数进行归一化处理;
S23:Attention层的输入为LSTM网络层所有时间步的输出列向量
Figure BDA0003576038820000045
根据
Figure BDA0003576038820000046
对队列任务的贡献程度分配注意力权值参数。
具体的,在步骤S3中,所述蒸馏式集成学习策略,通过最小正则化经验风险函数来确定基学习机在分类决策中的权重系数ω,其基本目标函数由经验风险项和正则项构成,表示如下:
Γ(ω)=λL(ω)+P(ω)
其中,L(ω)表示经验风险项,P(ω)表示正则项,λ为超参数。
具体的,所述经验风险项的构建过程如下:
令ω=[ω1,…,ωn]T,表示基学习机集群{h1,…hn}的权重系数,则集成基学习机决策模型对样本xi的分类结果表示如下:
Figure BDA0003576038820000051
Figure BDA0003576038820000052
基于上式,定义集成边界m(xi):
Figure BDA0003576038820000053
其中,yi为样本标签,m(x*)∈{1,-1},当分类正确时为1,分类错误时为-1,
基于集成边界,定义集成基学习机决策模型下所有样本的经验风险函数L:
Figure BDA0003576038820000054
对经验风险函数L进行优化,得到的经验风险函数L表示如下:
Figure BDA0003576038820000055
具体的,在对经验风险函数L进行优化时,采用代理损失优化方法,将改进huber函数作为L的代理优化函数,表示如下:
Figure BDA0003576038820000061
其中,参数δ用于调节函数对噪声样本的敏感性,按经验设为0.65。
具体的,所述正则项的构建过程如下:
将基学习机hk和hp对训练集的分类结果组织为向量形式,计算其互信息系数表示两基学习机学习结果的相似程度,公式表示如下:
Figure BDA0003576038820000062
其中,p(*,*)表示两变量的联合概率分布,p(*)表示变量的边缘概率,v表示基学习机{h}对训练集{x}的分类决策结果,其矩阵表达为:
Figure BDA0003576038820000063
其中,N表示训练集样本总数目,
将基学习机hk与其他基学习机的互信息系数均值作为该基学习机的冗余度,表示如下:
Figure BDA0003576038820000064
其中,Ωk表示基学习机集合,
定义基学习机hk的贡献度,表示如下:
S(hk)=I(hk,y)-R(hk)
其中,y为训练集标签样本的标签向量,
将s(hk)作为惩罚因子带入正则项,贡献度低的基学习机s(hk)越大,被萃取的几率越小,计及基学习机贡献度的正则项p构建如下:
P=ωTS-1ω
其中,S=diag[S(h1),…,S(hn)]。
具体的,所述步骤S3具体为:基于蒸馏式集成学习策略,构建蒸馏式集成优化模型,采用多数投票法集成CLSTM分类模型,解决基学习机集群的冗余问题。
具体的,所述采用多数投票法集成CLSTM的具体步骤为:将CLSTM分类模型,通过标签样本集训练生成基分类器池,经过蒸馏式集成学习策略萃取去冗余后的CLSTM基学习机子集群,通过多数投票法对各基学习机的分类结果融合决策,得到最终分类结果。
一种面向不均衡电力数据的蒸馏集成模式感知系统,所述蒸馏集成模式感知系统被应用于所述的算法中,所述蒸馏集成模式感知系统包括压缩深度学习机,所述压缩深度学习机采用CLSTM分类模型,所述CLSTM分类模型包括依次级联的数据预处理模块、改进LSTM层、LN层、Relu非线性层、Attention层以及Softmax层,并通过Softmax层决策输出分类结果,表征数据样本隶属于各类别标签的概率。
本发明的有益效果:
1、本发明所提出的基于DGS过采样技术的算法,能自适应调节态势空间中不同分布区域的小类样本合成数量,经平衡处理后对样本的态势边界形态具有较好的保持效果,可有效改善电力数据的态势分布不均衡问题,对态势边界样本的重叠程度影响较小。
2、所提出的CLSTM分类模型及其感知算法,通过压缩模型参数使模型的算法规模得到缩减,模型的存储成本更低,且对电力数据具有更好的关键特征捕捉能力,学习速度显著提升,所需训练时长更少。
3、所提出的优化的蒸馏式集成学习策略,通过优质基学习机的模型萃取技术解决基学习机冗余问题,具有更强的算法准确度、算法效率以及算法稳定性。
4、本发明融合了电力数据态势空间重构算法、压缩深度学习机算法以及蒸馏式集成学习策略,充分考虑到了电力数据和感知算法之间的效能协同问题,从数据增强和算法增强两个层次综合提升电力数据模式感知的效能,具有更好的数据适应性和应用普适性。
附图说明
图1为本发明的流程步骤图;
图2为本发明的电力数据态势空间重构方法示意图;
图3为本发明的总体路线示意图;
图4为本发明所述LSTM神经元示意图;
图5为本发明所述CLSTM分类模型示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围,以下结合实施例具体说明。
如图1、2和3所示,一种面向不均衡电力数据的蒸馏集成模式感知算法,其具体步骤如下:
S1:采用基于DGS的过采样技术,对存在态势分布不均衡的电力数据进行态势空间重构处理,该技术基于样本空间密度采样,自适应调节态势空间中不同分布区域的少类样本合成数量,具体步骤如下:
S11:判别少数类日负荷序列样本
设日负荷序列样本集为D,按负荷模式类别差异划分为M类样本子集{Dm|m=1,…,M},若样本子集Dm的样本数量小于最大样本子集数量的1/5,则判定该类负荷样本子集为少数类,对其进行样本合成,得到少数类样本集Dm
S12:对少数类样本密度聚类
对少数类样本集Dm实施DBSCAN聚类,得到若干聚类簇{Dm,c|c=1,…,C},并记录各聚类簇的聚类中心样本
Figure BDA0003576038820000091
S13:聚类簇构建直接密度可达图
记录DBSCAN聚类后每个聚类簇Dm,c的密度直接可达图G(Dm,c,ρ,κ);
S14:确定每一聚类簇的样本合成数目
计算各聚类簇的样本数目分布比例,按比例在各聚类簇中合成新样本;
S15:搜索采样路径
每次合成新样本时在聚类簇Dm,c随机选定一个真实样本xr,在G(Dm,c,ρ,κ)中采用Dijkstra算法搜索xr到聚类中心
Figure BDA0003576038820000092
的最短加权图路径,其中
Figure BDA0003576038820000093
其中
Figure BDA0003576038820000094
Figure BDA0003576038820000095
表示xr到聚类中心
Figure BDA0003576038820000096
最短加权图路径经过的样本点,
Figure BDA0003576038820000097
表示直接密度可达,将
Figure BDA0003576038820000098
作为本次的采样路径;
S16:进行新样本合成
Figure BDA0003576038820000101
中随机选择一段直接密度可达边
Figure BDA0003576038820000102
作为本次的采样区间,在采样区间内设定插值距离
Figure BDA0003576038820000103
另其服从均匀分布:
Figure BDA0003576038820000104
随机生成插值坐标θ:
Figure BDA0003576038820000105
为增强合成样本的多样性,对θ添加一随机扰动向量o,o的每一维度均服从如下正态分布:
Figure BDA0003576038820000106
式中σ表示相对标准差,
最后生成本次的新样本,表示如下:
Figure BDA0003576038820000107
S17:重复步骤S15-S16,直到少数类样本总数目达到最大样本子集数目的1/5。
S2:采用模型压缩技术,并结合LN机制和Attention机制,构建基于CLSTM神经网络的电力数据深度学习模式感知模型,具体步骤如下:
S21:LSTM通过精巧的“门”结构设计来控制LSTM单元中长时记忆信息的更新,针对LSTM参数复杂、计算效率低的不足,对LSTM单元进行改进,改进后的LSTM单元通过对网络参数降维投影来缩减模型参数规模,改进后的LSTM神经元的示意图如图4所示,其具体过程如下:
改进后的LSTM单元的投影层公式表示如下:
rt=Wrhht
yt=φ(Wyrrt+by)
式中,rt为转换矩阵Wrh缩减特征维度后的隐藏状态,φ为网络层的输出激活函数,这里采用Relu函数,改进后的LSTM单元的各“门”函数表示如下:
it=δ(Wixxt+Wirrt-1+WicCt-1+bi)
ft=δ(Wfxxt+Wfrrt-1+WfcCt-1+bf)
Ct=ft Ct-1+it tanh(Wcxxt+Wcrrt-1+bc)
Ot=δ(Waxxt+Worrt-1+WocCt-1+bo)
其中,it、ft和Ot分别为输入门、遗忘门和输出门,Ct为改进后的LSTM模型的长时记忆状态,经过投影层对模型参数进行降维投影后,模型参数缩减数量为:
nR=4nc 2-5nrnc+ncno-nrno
其中,nc表示隐层神经元数目,nr表示投影层输出的特征维度,no等于yt的输出特征维度。
S22:利用LN层对神经网络层参数进行归一化处理,能够提高模型对于数据的适应性,加快收敛,其采用的计算公式表示如下:
Figure BDA0003576038820000111
Figure BDA0003576038820000112
式中,U表示网络层中隐藏单元的数量,
Figure BDA0003576038820000113
表示网络层l神经元i的输出结果,未经非线性激活函数置换到[0,1]区间,均值μ和方差σ均为归一化参数,在LN机制中,网络层中的所有隐藏单元共享相同的归一化参数。
S23:Attention层的输入为LSTM网络层所有时间步的输出列向量
Figure BDA0003576038820000121
根据
Figure BDA0003576038820000122
对队列任务的贡献程度分配注意力权值参数,Attention层的计算公式如下:
ct=softmax(qT·K)·V
Figure BDA0003576038820000123
V=KT
q=K·W
其中,K和VT表示Attention层中的键值对,W为权重矩阵,q表示Attention层的队列任务,softmax函数对注意力权值参数qT·K进行归一化处理。
采用CLSTM的压缩深度学习机作为电力数据模式感知的基础学习机,CLSTM分类模型利用模型压缩技术的参数投影功能,压缩LSTM模型参数,降低其计算、存储开销,对于长时序数据处理具有明显效率优势;利用Attention机制快速捕捉序列关键特征,具有更快的训练速度;通过LN对网络层参数归一化处理,可加速LSTM模型训练过程,提升其学习泛化性能。
S3:提出蒸馏式集成学习策略并进行优化,解决基学习机集群的冗余问题
蒸馏式集成学习策略遵循如下原则:基学习机的冗余度越高,被萃取的可能性越小,此外,预测准确率高的基学习机具有优先萃取权,所提蒸馏式集成学习策略的步骤为:首先,构造评估集成学习误分类损失的正则化经验风险目标函数,使分类准确度高的基学习机能被优先萃取;其次,采用互信息系数MIC构建量化基学习机间相关性的冗余度指标,并基于该指标提出评估基学习机对集成学习贡献度的重要性指标,将重要性指标作为惩罚因子纳入优化问题的正则项中,目的是使DIL策略在尽量不牺牲CLSTM丢弃,保留权重不为零的个体集合,通过多数投票法参与集成。
具体如下:
所述蒸馏式集成学习策略,通过最小正则化经验风险函数来确定基学习机在分类决策中的权重系数ω,其基本目标函数由经验风险项和正则项构成,表示如下:
Γ(ω)=λL(ω)+P(ω)
其中,L(ω)表示经验风险项,近似度量集成基学习机决策模型对训练样本集的错误分类损失,P(ω)表示正则项,λ为超参数,通过超参数λ调节二者的比例,控制集成基学习机决策模型的算法复杂度,提升模型泛化能力。
所述经验风险项的构建过程如下:
令ω=[ω1,…,ωn]T,表示基学习机集群{h1,…hn}的权重系数,则集成基学习机决策模型对样本xi的分类结果表示如下:
Figure BDA0003576038820000131
Figure BDA0003576038820000132
基于上式,定义集成边界m(xi):
Figure BDA0003576038820000133
其中,yi为样本标签,m(x*)∈{1,-1},当分类正确时为1,分类错误时为-1,
基于集成边界,定义集成基学习机决策模型下所有样本的经验风险函数L:
Figure BDA0003576038820000134
对经验风险函数L进行优化,得到的经验风险函数L表示如下:
Figure BDA0003576038820000141
鉴于L非凸、不连续的函数性质,传统优化方法难以处理,在对经验风险函数L进行优化时,采用代理损失优化方法,将改进huber函数作为L的代理优化函数,表示如下:
Figure BDA0003576038820000142
其中,参数δ用于调节函数对噪声样本的敏感性,按经验设为0.65。
所述正则项的构建过程如下:
互信息系数可以反映变量间的相关度,将基学习机hk和hp对训练集的分类结果组织为向量形式,计算其互信息系数表示两基学习机学习结果的相似程度,公式表示如下:
Figure BDA0003576038820000143
其中,p(*,*)表示两变量的联合概率分布,p(*)表示变量的边缘概率,v表示基学习机{h}对训练集{x}的分类决策结果,其矩阵表达为:
Figure BDA0003576038820000144
其中,N表示训练集样本总数目,
将基学习机hk与其他基学习机的互信息系数均值作为该基学习机的冗余度,表示如下:
Figure BDA0003576038820000151
其中,Ωk表示基学习机集合,
标签样本分类准确率高且具有低冗余度的基学习机参与集成学习时可带来更好的精度增益,定义基学习机hk的贡献度,表示如下:
S(hk)=I(hk,y)-R(hk)
其中,y为训练集标签样本的标签向量,
将s(hk)作为惩罚因子带入正则项,贡献度低的基学习机s(hk)越大,被萃取的几率越小,计及基学习机贡献度的正则项p构建如下:
P=ωTS-1ω
其中,S=diag[S(h1),…,S(hn)]。
然后构建蒸馏式集成优化模型,表示如下:
Figure BDA0003576038820000152
Figure BDA0003576038820000153
采用多数投票法集成CLSTM分类模型,解决基学习机集群的冗余问题,具体为:将CLSTM分类模型,通过标签样本集训练生成基分类器池,经过蒸馏式集成学习策略萃取去冗余后的CLSTM基学习机子集群,通过多数投票法对各基学习机的分类结果融合决策,得到最终分类结果。
一种面向不均衡电力数据的蒸馏集成模式感知系统,所述蒸馏集成模式感知系统被应用于所述的算法中,所述蒸馏集成模式感知系统包括压缩深度学习机,所述压缩深度学习机采用CLSTM分类模型,如图5所示,所述CLSTM分类模型包括依次级联的数据预处理模块、改进LSTM层、LN层、Relu非线性层、Attention层以及Softmax层,并通过Softmax层决策输出分类结果,表征数据样本隶属于各类别标签的概率,其中,数据预处理模块采用三次样条插值来完成待处理数据的缺失重构。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的得同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims (10)

1.一种面向不均衡电力数据的蒸馏集成模式感知算法,其特征在于,包括如下步骤:
S1:采用基于DGS的过采样技术,对存在态势分布不均衡的电力数据进行态势空间重构处理;
S2:采用模型压缩技术,并结合LN机制和Attention机制,构建基于CLSTM神经网络的电力数据深度学习模式感知模型;
S3:提出蒸馏式集成学习策略并进行优化,解决基学习机集群的冗余问题。
2.根据权利要求1所述的一种面向不均衡电力数据的蒸馏集成模式感知算法,其特征在于,所述步骤S1具体包括如下步骤:
S11:判别少数类日负荷序列样本,设日负荷序列样本集为D,按负荷模式类别差异划分为M类样本子集{Dm|m=1,…,M},若样本子集Dm的样本数量小于最大样本子集数量的1/5,则判定该类负荷样本子集为少数类,对其进行样本合成,得到少数类样本集Dm
S12:对少数类样本集Dm实施DBSCAN聚类,得到若干聚类簇{Dm,c|c=1,…,C},并记录各聚类簇的聚类中心样本
Figure FDA0003576038810000011
S13:记录DBSCAN聚类后每个聚类簇Dm,c的密度直接可达图G(Dm,c,ρ,κ);
S14:计算各聚类簇的样本数目分布比例,按比例在各聚类簇中合成新样本;
S15:搜索采样路径,每次合成新样本时在聚类簇Dm,c随机选定一个真实样本xr,在G(Dm,c,ρ,κ)中采用Dijkstra算法搜索xr到聚类中心
Figure FDA0003576038810000012
的最短加权图路径,其中
Figure FDA0003576038810000013
其中
Figure FDA0003576038810000014
Figure FDA0003576038810000015
表示xr到聚类中心
Figure FDA0003576038810000016
最短加权图路径经过的样本点,
Figure FDA0003576038810000017
表示直接密度可达,将
Figure FDA0003576038810000029
作为本次的采样路径;
S16:进行新样本合成,在
Figure FDA00035760388100000210
中随机选择一段直接密度可达边
Figure FDA0003576038810000021
作为本次的采样区间,在采样区间内设定插值距离
Figure FDA0003576038810000022
另其服从均匀分布:
Figure FDA0003576038810000023
随机生成插值坐标θ:
Figure FDA0003576038810000024
为增强合成样本的多样性,对θ添加一随机扰动向量o,o的每一维度均服从如下正态分布:
Figure FDA0003576038810000025
式中σ表示相对标准差,
最后生成本次的新样本,表示如下:
Figure FDA0003576038810000026
S17:重复步骤S15-S16,直到少数类样本总数目达到最大样本子集数目的1/5。
3.根据权利要求1所述的一种面向不均衡电力数据的蒸馏集成模式感知算法,其特征在于,所述步骤S2具体包括如下步骤:
S21:对LSTM单元进行改进,改进后的LSTM单元通过对网络参数降维投影来缩减模型参数规模;
S22:利用LN层对神经网络层参数进行归一化处理;
S23:Attention层的输入为LSTM网络层所有时间步的输出列向量
Figure FDA0003576038810000027
根据
Figure FDA0003576038810000028
对队列任务的贡献程度分配注意力权值参数。
4.根据权利要求1所述的一种面向不均衡电力数据的蒸馏集成模式感知算法,其特征在于:在步骤S3中,所述蒸馏式集成学习策略,通过最小正则化经验风险函数来确定基学习机在分类决策中的权重系数ω,其基本目标函数由经验风险项和正则项构成,表示如下:
Γ(ω)=λL(ω)+P(ω)
其中,L(ω)表示经验风险项,P(ω)表示正则项,λ为超参数。
5.根据权利要求4所述的一种面向不均衡电力数据的蒸馏集成模式感知算法,其特征在于,所述经验风险项的构建过程如下:
令ω=[ω1,…,ωn]T,表示基学习机集群{h1,…hn}的权重系数,则集成基学习机决策模型对样本xi的分类结果表示如下:
Figure FDA0003576038810000031
Figure FDA0003576038810000032
基于上式,定义集成边界m(xi):
Figure FDA0003576038810000033
其中,yi为样本标签,m(x*)∈{1,-1},当分类正确时为1,分类错误时为-1,
基于集成边界,定义集成基学习机决策模型下所有样本的经验风险函数L:
Figure FDA0003576038810000034
对经验风险函数L进行优化,得到的经验风险函数L表示如下:
Figure FDA0003576038810000035
6.根据权利要求5所述的一种面向不均衡电力数据的蒸馏集成模式感知算法,其特征在于:在对经验风险函数L进行优化时,采用代理损失优化方法,将改进huber函数作为L的代理优化函数,表示如下:
Figure FDA0003576038810000041
其中,参数δ用于调节函数对噪声样本的敏感性,按经验设为0.65。
7.根据权利要求4所述的一种面向不均衡电力数据的蒸馏集成模式感知算法,其特征在于,所述正则项的构建过程如下:
将基学习机hk和hp对训练集的分类结果组织为向量形式,计算其互信息系数表示两基学习机学习结果的相似程度,公式表示如下:
Figure FDA0003576038810000042
其中,p(*,*)表示两变量的联合概率分布,p(*)表示变量的边缘概率,v表示基学习机{h}对训练集{x}的分类决策结果,其矩阵表达为:
Figure FDA0003576038810000043
其中,N表示训练集样本总数目,
将基学习机hk与其他基学习机的互信息系数均值作为该基学习机的冗余度,表示如下:
Figure FDA0003576038810000044
其中,Ωk表示基学习机集合,
定义基学习机hk的贡献度,表示如下:
S(hk)=I(hk,y)-R(hk)
其中,y为训练集标签样本的标签向量,
将s(hk)作为惩罚因子带入正则项,贡献度低的基学习机s(hk)越大,被萃取的几率越小,计及基学习机贡献度的正则项p构建如下:
P=ωTS-1ω
其中,S=diag[S(h1),…,S(hn)]。
8.根据权利要求4所述的一种面向不均衡电力数据的蒸馏集成模式感知算法,其特征在于,所述步骤S3具体为:基于蒸馏式集成学习策略,构建蒸馏式集成优化模型,采用多数投票法集成CLSTM分类模型,解决基学习机集群的冗余问题。
9.根据权利要求8所述的一种面向不均衡电力数据的蒸馏集成模式感知算法,其特征在于,所述采用多数投票法集成CLSTM分类模型的具体步骤为:将CLSTM分类模型,通过标签样本集训练生成基分类器池,经过蒸馏式集成学习策略萃取去冗余后的CLSTM基学习机子集群,通过多数投票法对各基学习机的分类结果融合决策,得到最终分类结果。
10.一种面向不均衡电力数据的蒸馏集成模式感知系统,其特征在于:所述蒸馏集成模式感知系统被应用于权利要求1-9中任一项权利要求所述的算法中,所述蒸馏集成模式感知系统包括压缩深度学习机,所述压缩深度学习机采用CLSTM分类模型,所述CLSTM分类模型包括依次级联的数据预处理模块、改进LSTM层、LN层、Relu非线性层、Attention层以及Softmax层,并通过Softmax层决策输出分类结果,表征数据样本隶属于各类别标签的概率。
CN202210344179.7A 2022-03-31 2022-03-31 一种面向不均衡电力数据的蒸馏集成模式感知方法及系统 Active CN114861977B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210344179.7A CN114861977B (zh) 2022-03-31 2022-03-31 一种面向不均衡电力数据的蒸馏集成模式感知方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210344179.7A CN114861977B (zh) 2022-03-31 2022-03-31 一种面向不均衡电力数据的蒸馏集成模式感知方法及系统

Publications (2)

Publication Number Publication Date
CN114861977A true CN114861977A (zh) 2022-08-05
CN114861977B CN114861977B (zh) 2024-08-16

Family

ID=82629863

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210344179.7A Active CN114861977B (zh) 2022-03-31 2022-03-31 一种面向不均衡电力数据的蒸馏集成模式感知方法及系统

Country Status (1)

Country Link
CN (1) CN114861977B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116736713A (zh) * 2023-06-13 2023-09-12 天津国能津能滨海热电有限公司 基于narx预测模型的电厂燃烧控制系统及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104487839A (zh) * 2012-04-04 2015-04-01 西门子公司 考虑eifs不确定性使用超声检测数据的概率疲劳寿命预测
CN111582571A (zh) * 2020-04-30 2020-08-25 中国电力科学研究院有限公司 模型驱动和数据驱动融合的电网运行态势感知方法及系统
CN112598017A (zh) * 2019-10-01 2021-04-02 三星显示有限公司 用于对产品进行分类的系统和方法
CN113850362A (zh) * 2021-08-20 2021-12-28 华为技术有限公司 一种模型蒸馏方法及相关设备
US20220036194A1 (en) * 2021-10-18 2022-02-03 Intel Corporation Deep neural network optimization system for machine learning model scaling

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104487839A (zh) * 2012-04-04 2015-04-01 西门子公司 考虑eifs不确定性使用超声检测数据的概率疲劳寿命预测
CN112598017A (zh) * 2019-10-01 2021-04-02 三星显示有限公司 用于对产品进行分类的系统和方法
CN111582571A (zh) * 2020-04-30 2020-08-25 中国电力科学研究院有限公司 模型驱动和数据驱动融合的电网运行态势感知方法及系统
CN113850362A (zh) * 2021-08-20 2021-12-28 华为技术有限公司 一种模型蒸馏方法及相关设备
US20220036194A1 (en) * 2021-10-18 2022-02-03 Intel Corporation Deep neural network optimization system for machine learning model scaling

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李舟军;范宇;吴贤杰;: "面向自然语言处理的预训练技术研究综述", 计算机科学, no. 03, pages 162 - 173 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116736713A (zh) * 2023-06-13 2023-09-12 天津国能津能滨海热电有限公司 基于narx预测模型的电厂燃烧控制系统及方法

Also Published As

Publication number Publication date
CN114861977B (zh) 2024-08-16

Similar Documents

Publication Publication Date Title
CN110472817B (zh) 一种结合深度神经网络的XGBoost集成信用评价系统及其方法
Khan et al. Batteries state of health estimation via efficient neural networks with multiple channel charging profiles
CN112434848B (zh) 基于深度信念网络的非线性加权组合风电功率预测方法
CN116937579B (zh) 一种考虑时空相关性的风电功率区间预测及其可解释方法
CN114676742A (zh) 一种基于注意力机制和残差网络的电网异常用电检测方法
CN111460001B (zh) 一种配电网理论线损率评估方法及系统
CN107609671A (zh) 一种基于综合因素评价模型的短期电力负荷预测方法
CN113988215B (zh) 一种配电网计量柜状态检测方法及系统
CN111369045A (zh) 一种短期光伏发电功率预测的方法
Gu et al. Bayesian Takagi–Sugeno–Kang fuzzy model and its joint learning of structure identification and parameter estimation
CN114580262A (zh) 一种锂离子电池健康状态估计方法
CN112418476A (zh) 一种超短期电力负荷预测方法
CN113033596A (zh) 用户用电行为类别和典型用电模式精细化辨识方法
CN111222689A (zh) 基于多尺度时间特征的lstm负荷预测方法、介质及电子装置
CN113449919A (zh) 一种基于特征和趋势感知的用电量预测方法及系统
CN111461565A (zh) 一种电力调控下的电源侧发电性能评估方法
CN114861977A (zh) 一种面向不均衡电力数据的蒸馏集成模式感知算法及系统
Wang et al. Sustainable investment forecasting of power grids based on the deep restricted Boltzmann machine optimized by the lion algorithm
Mehta et al. A Comprehensive study of Machine Learning Techniques used for estimating State of Charge for Li-ion Battery
CN117522066A (zh) 一种基于调峰电源设备组合预测的联合优化方法及系统
CN117113086A (zh) 一种储能机组负荷预测方法、系统、电子设备及介质
CN114692513B (zh) 基于深度学习的新能源承载力评估方法、预警方法
CN113111588B (zh) 一种燃气轮机nox排放浓度预测方法及装置
Li et al. A short-term wind power forecasting method based on NWP wind speed fluctuation division and clustering
CN115021269A (zh) 基于数据驱动的两阶段最优潮流求解方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant