CN114861977A - 一种面向不均衡电力数据的蒸馏集成模式感知算法及系统 - Google Patents
一种面向不均衡电力数据的蒸馏集成模式感知算法及系统 Download PDFInfo
- Publication number
- CN114861977A CN114861977A CN202210344179.7A CN202210344179A CN114861977A CN 114861977 A CN114861977 A CN 114861977A CN 202210344179 A CN202210344179 A CN 202210344179A CN 114861977 A CN114861977 A CN 114861977A
- Authority
- CN
- China
- Prior art keywords
- sample
- learning machine
- distillation
- cluster
- power data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 46
- 238000004821 distillation Methods 0.000 title claims abstract description 41
- 230000008447 perception Effects 0.000 title claims abstract description 26
- 230000010354 integration Effects 0.000 title claims description 20
- 238000000034 method Methods 0.000 claims abstract description 37
- 238000009826 distribution Methods 0.000 claims abstract description 20
- 238000013135 deep learning Methods 0.000 claims abstract description 14
- 238000005516 engineering process Methods 0.000 claims abstract description 14
- 238000007906 compression Methods 0.000 claims abstract description 12
- 230000006835 compression Effects 0.000 claims abstract description 12
- 230000007246 mechanism Effects 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 claims abstract description 9
- 238000013528 artificial neural network Methods 0.000 claims abstract description 7
- 230000006870 function Effects 0.000 claims description 35
- 238000012549 training Methods 0.000 claims description 22
- 238000013145 classification model Methods 0.000 claims description 17
- 238000005070 sampling Methods 0.000 claims description 14
- 238000005457 optimization Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 10
- 230000015572 biosynthetic process Effects 0.000 claims description 7
- 238000003786 synthesis reaction Methods 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 5
- 230000009467 reduction Effects 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 4
- 230000035945 sensitivity Effects 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 238000009827 uniform distribution Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000007787 long-term memory Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000007786 learning performance Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Tourism & Hospitality (AREA)
- Life Sciences & Earth Sciences (AREA)
- Marketing (AREA)
- Probability & Statistics with Applications (AREA)
- Primary Health Care (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Vaporization, Distillation, Condensation, Sublimation, And Cold Traps (AREA)
Abstract
本发明涉及一种面向不均衡电力数据的蒸馏集成模式感知算法,包括如下步骤:S1:采用基于DGS的过采样技术,对存在态势分布不均衡的电力数据进行态势空间重构处理;S2:采用模型压缩技术,并结合LN机制和Attention机制,构建基于CLSTM神经网络的电力数据深度学习模式感知模型;S3:提出蒸馏式集成学习策略并进行优化,解决基学习机集群的冗余问题。本发明具有算法效能稳定、效率高、规模小的特点,同时能够解决基学习机集群的冗余问题。
Description
技术领域
本发明属于电力数据挖掘技术领域,具体涉及一种面向不均衡电力数据的蒸馏集成模式感知算法及系统。
背景技术
随着智能电网和能源互联网发展的飞速发展,人工智能等现代信息技术与传统电网技术的融合进程也日趋加快,成为辅助电网管理人员快速感知电力系统多源数据内在规律、实施精准控制和决策的高效手段。当前以集成学习、深度学习为代表的前沿人工智能技术在电力系统安全与控制,设备运维与故障诊断以及负荷管理等方面展现出良好的应用价值,对提高电网运行可靠性、优化用户用能服务及推动我国能源转型具有技术支撑作用。长期以来,集成学习因良好的算法稳定性、准确性和鲁棒性被广泛应用到计算机视觉、生物、医学及工程等多个领域。电力数据广泛分布于电力系统“发输变配用”每个环节,采集实时性强,价值密度高。近年来,利用集成学习挖掘电力数据内在规律已在电网暂态稳定评估、变压器故障诊断、负荷预测、非侵入式负荷检测等领域展现出极高的利用价值。
不断提升集成学习性能是应对复杂多元数据处理任务的根本要求,对深入挖掘电力数据价值、支持电力信息化建设具有重要意义。然而,受基学习机差异性和准确度的制约,使得集成学习的性能提升也会受到限制。集成学习通过训练生成多个基学习机并以多数投票方式融合各个基学习机学习结果来提高算法精度。研究表明,基学习机训练集群中通常会存在性能冗余的个体,其学习能力与其它基分类器重合,致使基学习机集群内部差异性特质不足。当前,构建优质的差异化基学习机的典型方法包括异质基学习机集成、随机子空间集成以及Bagging和Boosting集成等,其中异质基学习机集成由于算法复杂度较高因此应用场景受限,随机子空间集成存在特征子空间冗余的问题,而Bagging和Boosting集成对生成差异化基学习机理论的研究尚不成熟。
传统集成学习利用弱学习器构建基学习机集群,其突出特点是训练速度较快,但准确度方面表现较差。集成以深度学习为代表的强学习机在算法准确度方面性能突出,然而随着数据挖掘应用对算法学习容量的要求不断提升,深度学习的算法效率、算法复杂度成为制约其数据和算法效能协同的关键因素。
态势分布不均衡天然存在于电网暂态稳定、变压器故障及电力负荷等数据中,该问题映射到分类模型层面会严重削弱模型对小类样本的识别能力,因此在电力数据模式感知等研究中引起广泛的关注。以SMOTE过采样算法为代表的态势空间重构方法,能避免将态势空间重构过程与模式辨识过程耦合,应用更为广泛,然而,传统SMOTE方法忽略了样本集的分布特性,重构后的态势空间容易失真,在高比例不均衡场景中算法难以保持稳定的采样效果,甚至干扰多数类样本的分类过程。通过学习电力数据态势分布规律,以生成对抗网络为代表的智能式生成模型能获取拟真度高的人工样本,但算法复杂度较高,计算开销成本大,难以满足实际应用需求。
发明内容
本发明的目的是为了克服现有技术的不足,而提供一种面向不均衡电力数据的蒸馏集成模式感知算法及系统,能够解决基学习机集群的冗余问题,具有算法效能稳定、准确度以及效率高、规模小的特点。
本发明采用的技术方案为:一种面向不均衡电力数据的蒸馏集成模式感知算法,包括如下步骤:
S1:采用基于DGS的过采样技术,对存在态势分布不均衡的电力数据进行态势空间重构处理;
S2:采用模型压缩技术,并结合LN机制和Attention机制,构建基于CLSTM神经网络的电力数据深度学习模式感知模型;
S3:提出蒸馏式集成学习策略并进行优化,解决基学习机集群的冗余问题。
具体的,所述步骤S1具体包括如下步骤:
S11:判别少数类日负荷序列样本,设日负荷序列样本集为D,按负荷模式类别差异划分为M类样本子集{Dm|m=1,…,M},若样本子集Dm的样本数量小于最大样本子集数量的1/5,则判定该类负荷样本子集为少数类,对其进行样本合成,得到少数类样本集Dm;
S13:记录DBSCAN聚类后每个聚类簇Dm,c的密度直接可达图G(Dm,c,ρ,κ);
S14:计算各聚类簇的样本数目分布比例,按比例在各聚类簇中合成新样本;
S15:搜索采样路径,每次合成新样本时在聚类簇Dm,c随机选定一个真实样本xr,在G(Dm,c,ρ,κ)中采用Dijkstra算法搜索xr到聚类中心的最短加权图路径,其中其中和表示xr到聚类中心最短加权图路径经过的样本点,表示直接密度可达,将作为本次的采样路径;
随机生成插值坐标θ:
为增强合成样本的多样性,对θ添加一随机扰动向量o,o的每一维度均服从如下正态分布:
式中σ表示相对标准差,
最后生成本次的新样本,表示如下:
S17:重复步骤S15-S16,直到少数类样本总数目达到最大样本子集数目的1/5。
具体的,所述步骤S2具体包括如下步骤:
S21:对LSTM单元进行改进,改进后的LSTM单元通过对网络参数降维投影来缩减模型参数规模;
S22:利用LN层对神经网络层参数进行归一化处理;
具体的,在步骤S3中,所述蒸馏式集成学习策略,通过最小正则化经验风险函数来确定基学习机在分类决策中的权重系数ω,其基本目标函数由经验风险项和正则项构成,表示如下:
Γ(ω)=λL(ω)+P(ω)
其中,L(ω)表示经验风险项,P(ω)表示正则项,λ为超参数。
具体的,所述经验风险项的构建过程如下:
令ω=[ω1,…,ωn]T,表示基学习机集群{h1,…hn}的权重系数,则集成基学习机决策模型对样本xi的分类结果表示如下:
基于上式,定义集成边界m(xi):
其中,yi为样本标签,m(x*)∈{1,-1},当分类正确时为1,分类错误时为-1,
基于集成边界,定义集成基学习机决策模型下所有样本的经验风险函数L:
对经验风险函数L进行优化,得到的经验风险函数L表示如下:
具体的,在对经验风险函数L进行优化时,采用代理损失优化方法,将改进huber函数作为L的代理优化函数,表示如下:
其中,参数δ用于调节函数对噪声样本的敏感性,按经验设为0.65。
具体的,所述正则项的构建过程如下:
将基学习机hk和hp对训练集的分类结果组织为向量形式,计算其互信息系数表示两基学习机学习结果的相似程度,公式表示如下:
其中,p(*,*)表示两变量的联合概率分布,p(*)表示变量的边缘概率,v表示基学习机{h}对训练集{x}的分类决策结果,其矩阵表达为:
其中,N表示训练集样本总数目,
将基学习机hk与其他基学习机的互信息系数均值作为该基学习机的冗余度,表示如下:
其中,Ωk表示基学习机集合,
定义基学习机hk的贡献度,表示如下:
S(hk)=I(hk,y)-R(hk)
其中,y为训练集标签样本的标签向量,
将s(hk)作为惩罚因子带入正则项,贡献度低的基学习机s(hk)越大,被萃取的几率越小,计及基学习机贡献度的正则项p构建如下:
P=ωTS-1ω
其中,S=diag[S(h1),…,S(hn)]。
具体的,所述步骤S3具体为:基于蒸馏式集成学习策略,构建蒸馏式集成优化模型,采用多数投票法集成CLSTM分类模型,解决基学习机集群的冗余问题。
具体的,所述采用多数投票法集成CLSTM的具体步骤为:将CLSTM分类模型,通过标签样本集训练生成基分类器池,经过蒸馏式集成学习策略萃取去冗余后的CLSTM基学习机子集群,通过多数投票法对各基学习机的分类结果融合决策,得到最终分类结果。
一种面向不均衡电力数据的蒸馏集成模式感知系统,所述蒸馏集成模式感知系统被应用于所述的算法中,所述蒸馏集成模式感知系统包括压缩深度学习机,所述压缩深度学习机采用CLSTM分类模型,所述CLSTM分类模型包括依次级联的数据预处理模块、改进LSTM层、LN层、Relu非线性层、Attention层以及Softmax层,并通过Softmax层决策输出分类结果,表征数据样本隶属于各类别标签的概率。
本发明的有益效果:
1、本发明所提出的基于DGS过采样技术的算法,能自适应调节态势空间中不同分布区域的小类样本合成数量,经平衡处理后对样本的态势边界形态具有较好的保持效果,可有效改善电力数据的态势分布不均衡问题,对态势边界样本的重叠程度影响较小。
2、所提出的CLSTM分类模型及其感知算法,通过压缩模型参数使模型的算法规模得到缩减,模型的存储成本更低,且对电力数据具有更好的关键特征捕捉能力,学习速度显著提升,所需训练时长更少。
3、所提出的优化的蒸馏式集成学习策略,通过优质基学习机的模型萃取技术解决基学习机冗余问题,具有更强的算法准确度、算法效率以及算法稳定性。
4、本发明融合了电力数据态势空间重构算法、压缩深度学习机算法以及蒸馏式集成学习策略,充分考虑到了电力数据和感知算法之间的效能协同问题,从数据增强和算法增强两个层次综合提升电力数据模式感知的效能,具有更好的数据适应性和应用普适性。
附图说明
图1为本发明的流程步骤图;
图2为本发明的电力数据态势空间重构方法示意图;
图3为本发明的总体路线示意图;
图4为本发明所述LSTM神经元示意图;
图5为本发明所述CLSTM分类模型示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围,以下结合实施例具体说明。
如图1、2和3所示,一种面向不均衡电力数据的蒸馏集成模式感知算法,其具体步骤如下:
S1:采用基于DGS的过采样技术,对存在态势分布不均衡的电力数据进行态势空间重构处理,该技术基于样本空间密度采样,自适应调节态势空间中不同分布区域的少类样本合成数量,具体步骤如下:
S11:判别少数类日负荷序列样本
设日负荷序列样本集为D,按负荷模式类别差异划分为M类样本子集{Dm|m=1,…,M},若样本子集Dm的样本数量小于最大样本子集数量的1/5,则判定该类负荷样本子集为少数类,对其进行样本合成,得到少数类样本集Dm;
S12:对少数类样本密度聚类
S13:聚类簇构建直接密度可达图
记录DBSCAN聚类后每个聚类簇Dm,c的密度直接可达图G(Dm,c,ρ,κ);
S14:确定每一聚类簇的样本合成数目
计算各聚类簇的样本数目分布比例,按比例在各聚类簇中合成新样本;
S15:搜索采样路径
每次合成新样本时在聚类簇Dm,c随机选定一个真实样本xr,在G(Dm,c,ρ,κ)中采用Dijkstra算法搜索xr到聚类中心的最短加权图路径,其中其中和表示xr到聚类中心最短加权图路径经过的样本点,表示直接密度可达,将作为本次的采样路径;
S16:进行新样本合成
随机生成插值坐标θ:
为增强合成样本的多样性,对θ添加一随机扰动向量o,o的每一维度均服从如下正态分布:
式中σ表示相对标准差,
最后生成本次的新样本,表示如下:
S17:重复步骤S15-S16,直到少数类样本总数目达到最大样本子集数目的1/5。
S2:采用模型压缩技术,并结合LN机制和Attention机制,构建基于CLSTM神经网络的电力数据深度学习模式感知模型,具体步骤如下:
S21:LSTM通过精巧的“门”结构设计来控制LSTM单元中长时记忆信息的更新,针对LSTM参数复杂、计算效率低的不足,对LSTM单元进行改进,改进后的LSTM单元通过对网络参数降维投影来缩减模型参数规模,改进后的LSTM神经元的示意图如图4所示,其具体过程如下:
改进后的LSTM单元的投影层公式表示如下:
rt=Wrhht
yt=φ(Wyrrt+by)
式中,rt为转换矩阵Wrh缩减特征维度后的隐藏状态,φ为网络层的输出激活函数,这里采用Relu函数,改进后的LSTM单元的各“门”函数表示如下:
it=δ(Wixxt+Wirrt-1+WicCt-1+bi)
ft=δ(Wfxxt+Wfrrt-1+WfcCt-1+bf)
Ct=ft Ct-1+it tanh(Wcxxt+Wcrrt-1+bc)
Ot=δ(Waxxt+Worrt-1+WocCt-1+bo)
其中,it、ft和Ot分别为输入门、遗忘门和输出门,Ct为改进后的LSTM模型的长时记忆状态,经过投影层对模型参数进行降维投影后,模型参数缩减数量为:
nR=4nc 2-5nrnc+ncno-nrno
其中,nc表示隐层神经元数目,nr表示投影层输出的特征维度,no等于yt的输出特征维度。
S22:利用LN层对神经网络层参数进行归一化处理,能够提高模型对于数据的适应性,加快收敛,其采用的计算公式表示如下:
ct=softmax(qT·K)·V
q=K·W
其中,K和VT表示Attention层中的键值对,W为权重矩阵,q表示Attention层的队列任务,softmax函数对注意力权值参数qT·K进行归一化处理。
采用CLSTM的压缩深度学习机作为电力数据模式感知的基础学习机,CLSTM分类模型利用模型压缩技术的参数投影功能,压缩LSTM模型参数,降低其计算、存储开销,对于长时序数据处理具有明显效率优势;利用Attention机制快速捕捉序列关键特征,具有更快的训练速度;通过LN对网络层参数归一化处理,可加速LSTM模型训练过程,提升其学习泛化性能。
S3:提出蒸馏式集成学习策略并进行优化,解决基学习机集群的冗余问题
蒸馏式集成学习策略遵循如下原则:基学习机的冗余度越高,被萃取的可能性越小,此外,预测准确率高的基学习机具有优先萃取权,所提蒸馏式集成学习策略的步骤为:首先,构造评估集成学习误分类损失的正则化经验风险目标函数,使分类准确度高的基学习机能被优先萃取;其次,采用互信息系数MIC构建量化基学习机间相关性的冗余度指标,并基于该指标提出评估基学习机对集成学习贡献度的重要性指标,将重要性指标作为惩罚因子纳入优化问题的正则项中,目的是使DIL策略在尽量不牺牲CLSTM丢弃,保留权重不为零的个体集合,通过多数投票法参与集成。
具体如下:
所述蒸馏式集成学习策略,通过最小正则化经验风险函数来确定基学习机在分类决策中的权重系数ω,其基本目标函数由经验风险项和正则项构成,表示如下:
Γ(ω)=λL(ω)+P(ω)
其中,L(ω)表示经验风险项,近似度量集成基学习机决策模型对训练样本集的错误分类损失,P(ω)表示正则项,λ为超参数,通过超参数λ调节二者的比例,控制集成基学习机决策模型的算法复杂度,提升模型泛化能力。
所述经验风险项的构建过程如下:
令ω=[ω1,…,ωn]T,表示基学习机集群{h1,…hn}的权重系数,则集成基学习机决策模型对样本xi的分类结果表示如下:
基于上式,定义集成边界m(xi):
其中,yi为样本标签,m(x*)∈{1,-1},当分类正确时为1,分类错误时为-1,
基于集成边界,定义集成基学习机决策模型下所有样本的经验风险函数L:
对经验风险函数L进行优化,得到的经验风险函数L表示如下:
鉴于L非凸、不连续的函数性质,传统优化方法难以处理,在对经验风险函数L进行优化时,采用代理损失优化方法,将改进huber函数作为L的代理优化函数,表示如下:
其中,参数δ用于调节函数对噪声样本的敏感性,按经验设为0.65。
所述正则项的构建过程如下:
互信息系数可以反映变量间的相关度,将基学习机hk和hp对训练集的分类结果组织为向量形式,计算其互信息系数表示两基学习机学习结果的相似程度,公式表示如下:
其中,p(*,*)表示两变量的联合概率分布,p(*)表示变量的边缘概率,v表示基学习机{h}对训练集{x}的分类决策结果,其矩阵表达为:
其中,N表示训练集样本总数目,
将基学习机hk与其他基学习机的互信息系数均值作为该基学习机的冗余度,表示如下:
其中,Ωk表示基学习机集合,
标签样本分类准确率高且具有低冗余度的基学习机参与集成学习时可带来更好的精度增益,定义基学习机hk的贡献度,表示如下:
S(hk)=I(hk,y)-R(hk)
其中,y为训练集标签样本的标签向量,
将s(hk)作为惩罚因子带入正则项,贡献度低的基学习机s(hk)越大,被萃取的几率越小,计及基学习机贡献度的正则项p构建如下:
P=ωTS-1ω
其中,S=diag[S(h1),…,S(hn)]。
然后构建蒸馏式集成优化模型,表示如下:
采用多数投票法集成CLSTM分类模型,解决基学习机集群的冗余问题,具体为:将CLSTM分类模型,通过标签样本集训练生成基分类器池,经过蒸馏式集成学习策略萃取去冗余后的CLSTM基学习机子集群,通过多数投票法对各基学习机的分类结果融合决策,得到最终分类结果。
一种面向不均衡电力数据的蒸馏集成模式感知系统,所述蒸馏集成模式感知系统被应用于所述的算法中,所述蒸馏集成模式感知系统包括压缩深度学习机,所述压缩深度学习机采用CLSTM分类模型,如图5所示,所述CLSTM分类模型包括依次级联的数据预处理模块、改进LSTM层、LN层、Relu非线性层、Attention层以及Softmax层,并通过Softmax层决策输出分类结果,表征数据样本隶属于各类别标签的概率,其中,数据预处理模块采用三次样条插值来完成待处理数据的缺失重构。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的得同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
Claims (10)
1.一种面向不均衡电力数据的蒸馏集成模式感知算法,其特征在于,包括如下步骤:
S1:采用基于DGS的过采样技术,对存在态势分布不均衡的电力数据进行态势空间重构处理;
S2:采用模型压缩技术,并结合LN机制和Attention机制,构建基于CLSTM神经网络的电力数据深度学习模式感知模型;
S3:提出蒸馏式集成学习策略并进行优化,解决基学习机集群的冗余问题。
2.根据权利要求1所述的一种面向不均衡电力数据的蒸馏集成模式感知算法,其特征在于,所述步骤S1具体包括如下步骤:
S11:判别少数类日负荷序列样本,设日负荷序列样本集为D,按负荷模式类别差异划分为M类样本子集{Dm|m=1,…,M},若样本子集Dm的样本数量小于最大样本子集数量的1/5,则判定该类负荷样本子集为少数类,对其进行样本合成,得到少数类样本集Dm;
S13:记录DBSCAN聚类后每个聚类簇Dm,c的密度直接可达图G(Dm,c,ρ,κ);
S14:计算各聚类簇的样本数目分布比例,按比例在各聚类簇中合成新样本;
S15:搜索采样路径,每次合成新样本时在聚类簇Dm,c随机选定一个真实样本xr,在G(Dm,c,ρ,κ)中采用Dijkstra算法搜索xr到聚类中心的最短加权图路径,其中其中和表示xr到聚类中心最短加权图路径经过的样本点,表示直接密度可达,将作为本次的采样路径;
随机生成插值坐标θ:
为增强合成样本的多样性,对θ添加一随机扰动向量o,o的每一维度均服从如下正态分布:
式中σ表示相对标准差,
最后生成本次的新样本,表示如下:
S17:重复步骤S15-S16,直到少数类样本总数目达到最大样本子集数目的1/5。
4.根据权利要求1所述的一种面向不均衡电力数据的蒸馏集成模式感知算法,其特征在于:在步骤S3中,所述蒸馏式集成学习策略,通过最小正则化经验风险函数来确定基学习机在分类决策中的权重系数ω,其基本目标函数由经验风险项和正则项构成,表示如下:
Γ(ω)=λL(ω)+P(ω)
其中,L(ω)表示经验风险项,P(ω)表示正则项,λ为超参数。
7.根据权利要求4所述的一种面向不均衡电力数据的蒸馏集成模式感知算法,其特征在于,所述正则项的构建过程如下:
将基学习机hk和hp对训练集的分类结果组织为向量形式,计算其互信息系数表示两基学习机学习结果的相似程度,公式表示如下:
其中,p(*,*)表示两变量的联合概率分布,p(*)表示变量的边缘概率,v表示基学习机{h}对训练集{x}的分类决策结果,其矩阵表达为:
其中,N表示训练集样本总数目,
将基学习机hk与其他基学习机的互信息系数均值作为该基学习机的冗余度,表示如下:
其中,Ωk表示基学习机集合,
定义基学习机hk的贡献度,表示如下:
S(hk)=I(hk,y)-R(hk)
其中,y为训练集标签样本的标签向量,
将s(hk)作为惩罚因子带入正则项,贡献度低的基学习机s(hk)越大,被萃取的几率越小,计及基学习机贡献度的正则项p构建如下:
P=ωTS-1ω
其中,S=diag[S(h1),…,S(hn)]。
8.根据权利要求4所述的一种面向不均衡电力数据的蒸馏集成模式感知算法,其特征在于,所述步骤S3具体为:基于蒸馏式集成学习策略,构建蒸馏式集成优化模型,采用多数投票法集成CLSTM分类模型,解决基学习机集群的冗余问题。
9.根据权利要求8所述的一种面向不均衡电力数据的蒸馏集成模式感知算法,其特征在于,所述采用多数投票法集成CLSTM分类模型的具体步骤为:将CLSTM分类模型,通过标签样本集训练生成基分类器池,经过蒸馏式集成学习策略萃取去冗余后的CLSTM基学习机子集群,通过多数投票法对各基学习机的分类结果融合决策,得到最终分类结果。
10.一种面向不均衡电力数据的蒸馏集成模式感知系统,其特征在于:所述蒸馏集成模式感知系统被应用于权利要求1-9中任一项权利要求所述的算法中,所述蒸馏集成模式感知系统包括压缩深度学习机,所述压缩深度学习机采用CLSTM分类模型,所述CLSTM分类模型包括依次级联的数据预处理模块、改进LSTM层、LN层、Relu非线性层、Attention层以及Softmax层,并通过Softmax层决策输出分类结果,表征数据样本隶属于各类别标签的概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210344179.7A CN114861977B (zh) | 2022-03-31 | 2022-03-31 | 一种面向不均衡电力数据的蒸馏集成模式感知方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210344179.7A CN114861977B (zh) | 2022-03-31 | 2022-03-31 | 一种面向不均衡电力数据的蒸馏集成模式感知方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114861977A true CN114861977A (zh) | 2022-08-05 |
CN114861977B CN114861977B (zh) | 2024-08-16 |
Family
ID=82629863
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210344179.7A Active CN114861977B (zh) | 2022-03-31 | 2022-03-31 | 一种面向不均衡电力数据的蒸馏集成模式感知方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114861977B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116736713A (zh) * | 2023-06-13 | 2023-09-12 | 天津国能津能滨海热电有限公司 | 基于narx预测模型的电厂燃烧控制系统及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104487839A (zh) * | 2012-04-04 | 2015-04-01 | 西门子公司 | 考虑eifs不确定性使用超声检测数据的概率疲劳寿命预测 |
CN111582571A (zh) * | 2020-04-30 | 2020-08-25 | 中国电力科学研究院有限公司 | 模型驱动和数据驱动融合的电网运行态势感知方法及系统 |
CN112598017A (zh) * | 2019-10-01 | 2021-04-02 | 三星显示有限公司 | 用于对产品进行分类的系统和方法 |
CN113850362A (zh) * | 2021-08-20 | 2021-12-28 | 华为技术有限公司 | 一种模型蒸馏方法及相关设备 |
US20220036194A1 (en) * | 2021-10-18 | 2022-02-03 | Intel Corporation | Deep neural network optimization system for machine learning model scaling |
-
2022
- 2022-03-31 CN CN202210344179.7A patent/CN114861977B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104487839A (zh) * | 2012-04-04 | 2015-04-01 | 西门子公司 | 考虑eifs不确定性使用超声检测数据的概率疲劳寿命预测 |
CN112598017A (zh) * | 2019-10-01 | 2021-04-02 | 三星显示有限公司 | 用于对产品进行分类的系统和方法 |
CN111582571A (zh) * | 2020-04-30 | 2020-08-25 | 中国电力科学研究院有限公司 | 模型驱动和数据驱动融合的电网运行态势感知方法及系统 |
CN113850362A (zh) * | 2021-08-20 | 2021-12-28 | 华为技术有限公司 | 一种模型蒸馏方法及相关设备 |
US20220036194A1 (en) * | 2021-10-18 | 2022-02-03 | Intel Corporation | Deep neural network optimization system for machine learning model scaling |
Non-Patent Citations (1)
Title |
---|
李舟军;范宇;吴贤杰;: "面向自然语言处理的预训练技术研究综述", 计算机科学, no. 03, pages 162 - 173 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116736713A (zh) * | 2023-06-13 | 2023-09-12 | 天津国能津能滨海热电有限公司 | 基于narx预测模型的电厂燃烧控制系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114861977B (zh) | 2024-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110472817B (zh) | 一种结合深度神经网络的XGBoost集成信用评价系统及其方法 | |
Khan et al. | Batteries state of health estimation via efficient neural networks with multiple channel charging profiles | |
CN112434848B (zh) | 基于深度信念网络的非线性加权组合风电功率预测方法 | |
CN116937579B (zh) | 一种考虑时空相关性的风电功率区间预测及其可解释方法 | |
CN114676742A (zh) | 一种基于注意力机制和残差网络的电网异常用电检测方法 | |
CN111460001B (zh) | 一种配电网理论线损率评估方法及系统 | |
CN107609671A (zh) | 一种基于综合因素评价模型的短期电力负荷预测方法 | |
CN113988215B (zh) | 一种配电网计量柜状态检测方法及系统 | |
CN111369045A (zh) | 一种短期光伏发电功率预测的方法 | |
Gu et al. | Bayesian Takagi–Sugeno–Kang fuzzy model and its joint learning of structure identification and parameter estimation | |
CN114580262A (zh) | 一种锂离子电池健康状态估计方法 | |
CN112418476A (zh) | 一种超短期电力负荷预测方法 | |
CN113033596A (zh) | 用户用电行为类别和典型用电模式精细化辨识方法 | |
CN111222689A (zh) | 基于多尺度时间特征的lstm负荷预测方法、介质及电子装置 | |
CN113449919A (zh) | 一种基于特征和趋势感知的用电量预测方法及系统 | |
CN111461565A (zh) | 一种电力调控下的电源侧发电性能评估方法 | |
CN114861977A (zh) | 一种面向不均衡电力数据的蒸馏集成模式感知算法及系统 | |
Wang et al. | Sustainable investment forecasting of power grids based on the deep restricted Boltzmann machine optimized by the lion algorithm | |
Mehta et al. | A Comprehensive study of Machine Learning Techniques used for estimating State of Charge for Li-ion Battery | |
CN117522066A (zh) | 一种基于调峰电源设备组合预测的联合优化方法及系统 | |
CN117113086A (zh) | 一种储能机组负荷预测方法、系统、电子设备及介质 | |
CN114692513B (zh) | 基于深度学习的新能源承载力评估方法、预警方法 | |
CN113111588B (zh) | 一种燃气轮机nox排放浓度预测方法及装置 | |
Li et al. | A short-term wind power forecasting method based on NWP wind speed fluctuation division and clustering | |
CN115021269A (zh) | 基于数据驱动的两阶段最优潮流求解方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |