CN112200391B - 基于k-近邻互信息特征简化的配电网边缘侧负荷预测方法 - Google Patents

基于k-近邻互信息特征简化的配电网边缘侧负荷预测方法 Download PDF

Info

Publication number
CN112200391B
CN112200391B CN202011285879.0A CN202011285879A CN112200391B CN 112200391 B CN112200391 B CN 112200391B CN 202011285879 A CN202011285879 A CN 202011285879A CN 112200391 B CN112200391 B CN 112200391B
Authority
CN
China
Prior art keywords
load
value
data set
daily
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011285879.0A
Other languages
English (en)
Other versions
CN112200391A (zh
Inventor
李润秋
张鹭
罗迪
姚瑾
王威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Economic and Technological Research Institute of State Grid Shaanxi Electric Power Co Ltd
Original Assignee
Economic and Technological Research Institute of State Grid Shaanxi Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Economic and Technological Research Institute of State Grid Shaanxi Electric Power Co Ltd filed Critical Economic and Technological Research Institute of State Grid Shaanxi Electric Power Co Ltd
Priority to CN202011285879.0A priority Critical patent/CN112200391B/zh
Publication of CN112200391A publication Critical patent/CN112200391A/zh
Application granted granted Critical
Publication of CN112200391B publication Critical patent/CN112200391B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Primary Health Care (AREA)
  • Development Economics (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了基于k‑近邻互信息特征简化的配电网边缘侧负荷预测方法,通过补全缺失值以及对天气日期类型进行独热编码等预处理方式建立负荷预测训练及验证数据集,然后对日总负荷预测循环神经网络进行前向和后向传播的训练;得出预测日总负荷后,估计多维输入向量与输出向量之间的互信息,进行特征选择以简化运算节省边缘计算能耗,将特征简化后的天气、日期数据与日总负荷、分时刻负荷数据作为新的数据样本训练分时刻负荷预测网络;最后将预测日相关信息输入训练完成的分时刻负荷预测网络得出区域内某日的日总负荷以及分时刻负荷预测值。本发明实现方法整体化简,在一定程度上提高区域内部分边缘计算任务的效率,完善配电物联网的边缘计算架构。

Description

基于k-近邻互信息特征简化的配电网边缘侧负荷预测方法
技术领域
本发明涉及配电网短期负荷预测技术领域,具体涉及边缘计算架构下应用深度循环神经网络的配电物联网负荷预测方法,设计轻量化适用于边缘计算侧的日时双层神经网络预测模型,并对其进行简化特征变量的训练使其根据所划分能量自治区域内的历史负荷数据进行准确实时的短期负荷预测。
背景技术
我国电力物联网发展迅速,随着5G通信网络的逐渐展开其建设进程进一步加快,社会生产进步和人民生活水平提高,对电力系统安全的依赖性也不断加强,对配电网络安全稳定性的提升以及智能化的建设提出了更高要求。配电物联网建设过程中最为基础的感知层设备数量大幅增长,设备状态数据、运行环境信息等海量异构且不同传输带宽的数据爆炸式增长,给电力数据的传输存储以及运算处理工作带来了巨大压力。边缘计算技术可以就近处理仅对于本地更有价值的数据,也能够更近距离地储存和归档原始数据,进行简单的过滤、统计工作或通过上层云计算中心下发的数据处理模型对数据进行初步处理后再将结果上传,减少需要进行维护或送往云端和企业数据中心的数据量,从而节约时间成本和能耗成本,并为更重要更复杂的数据流处理节约有限的网络带宽,在配电物联网中合理设计边缘计算架构、应用边缘计算技术可以降低组网成本。
边缘计算架构下的配网数据处理工作要求利用边缘侧有限的计算资源和结构复杂的本地数据,进行有效的信息提取并尽量节约数据处理的能耗和传输时间,但配电物联网当前阶段采用的基于深度学习的负荷预测方法多适用于电力数据中心,网络结构复杂、占用大量计算资源不适合在边缘计算架构进行轻量化的计算和实时数据处理,而且普遍采用时间序列进行预测而很少计及天气和日期类型等信息的影响。
发明内容
针对配网数据中心现有负荷预测方法模型复杂不便于下发至边缘计算侧执行分区负荷预测任务的问题,本发明提出了一种适用于边缘计算架构的轻量化日时分层负荷预测神经网络模型,并同时提出基于此模型在能量自治区域边缘侧进行短期负荷预测的方法,提高利用边缘侧所采集数据进行区域负荷预测的效率并减轻边缘侧计算压力。
为达到上述目的,本发明采用如下技术方案:
基于k-近邻互信息特征简化的配电网边缘侧负荷预测方法,包括以下步骤:
步骤1:收集包含天气信息、具体日期、每隔十五分钟采集一次的历史分时刻负荷数据以及日总负荷的数据集作为负荷预测任务的原始数据集Ω0,对原始数据集Ω0进行缺失值补全、孤立点检测和剔除,对天气信息以及历史分时刻负荷数据进行归一化处理,对日期所属类型进行独热编码,预处理后得到数据集
Figure BDA0002782300310000021
其中,/>
Figure BDA0002782300310000022
表示日期信息,
Figure BDA0002782300310000023
表示天气信息,/>
Figure BDA0002782300310000024
表示历史负荷值,LD表示预测结果中的日总负荷值,将该数据集划分为日负荷训练集Td和日负荷验证集Vd
步骤2:利用步骤1得到的日负荷训练集Td对基于深度循环神经网络的日总负荷预测模型进行训练;
步骤3:将预测目标日的天气信息、具体日期、历史分时刻负荷数据作为日总负荷预测模型的输入,得到目标日的日总负荷预测值
Figure BDA0002782300310000037
步骤4:基于k-近邻互信息的特征匹配方法,计算高维输入变量中具体日期、天气信息各子集与日总负荷预测值之间的信息关联程度,保留原数据集中的强关联输入变量,筛除弱关联项组成分时刻负荷预测网络的层间过渡数据集
Figure BDA0002782300310000031
其中,/>
Figure BDA0002782300310000032
表示特征筛选后的日期信息,/>
Figure BDA0002782300310000033
表示特征筛选后的天气数据,/>
Figure BDA0002782300310000034
表示输出的预测日分时刻负荷序列,;
步骤5:利用步骤4得到的层间过渡数据集
Figure BDA0002782300310000035
训练基于深度循环神经网络的分时刻负荷预测模型;
步骤6:利用步骤2和步骤5中训练完成的日总负荷以及分时刻负荷预测双层模型,输入预测目标日的日期类型、天气信息和过去一周内历史负荷数据,对预测日的总负荷值和一天内每隔十五分钟的96个负荷值进行预测。
所述步骤2包括以下步骤:
S2.1:日总负荷预测模型的输入节点包括日最高温度、最低气温、日平均气温、相对湿度、降雨量、周几、是否节假日以及过去一周内每隔十五分钟采集一次的672个历史负荷值信息,输出节点为预测日的日总负荷;S2.2:日总负荷预测模型的隐藏层层数初始设置为5层,隐藏层每层的节点数根据经验公式设置初始值为30个,在训练过程中根据模型收敛情况以及预测效果对隐藏层和节点数进行试凑,节点数设置经验公式如下:
Figure BDA0002782300310000036
式中,n1代表初始隐藏层节点数,n代表预测网络输入层节点数679,m代表预测日总负荷网络输出层节点数1,c∈[1,10]的自然数;
S2.3:日总负荷预测模型的激活函数设置为tansig函数,初始化训练迭代次数为2000次,初始学习率设为0.1;
S2.4:日总负荷预测模型根据激活函数正向计算各层节点输入值和神经节点传播权重,根据反向传播算法反馈误差对神经节点传播权值进行更新优化,直到在超出迭代阈值之前神经网络的损失函数值收敛,则训练结束;
S2.5:日总负荷预测模型的损失函数Lossd为预测值与实际值的差。
所述步骤4包括以下步骤:
S4.1:首先将天气信息和具体日期表示为多维特征输入变量X=(X1,X2,...XM),输出历史分时刻负荷序列中的峰值为Y,输入变量每个维度变量Xi与输出Y之间的互信息值为MI(Xi,Y),根据k-近邻互信息的具体计算公式如下:
Figure BDA0002782300310000041
式中,ψ函数为Psi(Digamma)函数,其定义为
Figure BDA0002782300310000042
确定ψ函数的自变量k取值的具体步骤如S4.2所述,ψ函数的自变量n为X与Y合并数据集的总样本数量,nx(i)表示数据集X中距离X与Y合并数据集中第i个点xi严格小于/>
Figure BDA0002782300310000043
的近邻点数,di为xi与其k近邻之间的距离,ny(i)表示数据集Y中距离X与Y合并数据集中第i个点xi严格小于/>
Figure BDA0002782300310000044
的近邻点数;
S4.2:将(Xi,Y)随机分成s个互斥且近似的子集U1,U2,...,Us,依次去掉其中第j个子集Uj,由剩余子集组成数据集Ωremain_j,其中的输入为Xij,随机置换Y得到Yj,π,设定k∈[1,30],k为整数,根据S4.1中公式计算k取每一个值时,数据集Ωremain_j,j∈[1,s]中的Xij与Y之间的互信息MIk(Xj,Y)值,以及Xij与Yj,π之间的互信息MIk(Xj,Yj,π)值,并计算其分布,进行z检验,使zk最大的k即为第i维输入变量Xi对应的k值,z检验的具体公式如下:
Figure BDA0002782300310000051
式中,;μk和μk,π分别代表互信息MIk(Xj,Y)和MIk(Xj,Yj,π)的均值,σk和σk,π分别代表MIk(Xj,Y)和MIk(Xj,Yj,π)的标准差,N代表互信息值的个数;
S4.3:根据S4.1的互信息估计公式和S4.2确定的k值计算每个维度变量Xi与输出Y之间的互信息值MI(Xi,Y),按照互信息值降序排列,剔除弱相关输入变量。
所述步骤5包括以下步骤:
S5.1:将层间过渡数据集Ω2的90%作为训练集Tt,其余10%作为验证集Vt,训练时输入变量为特征提取后的日期数据
Figure BDA0002782300310000052
天气数据/>
Figure BDA0002782300310000053
过去一周内每隔十五分钟采集的历史分时刻负荷数据/>
Figure BDA0002782300310000054
以及日总负荷LD
S5.2:网络的输入节点数根据特征提取结果和负荷数据集而定,隐藏层层数和每层节点数利用试凑法得到;
S5.4:分时刻负荷预测模型的激活函数设置为tanh函数,初始化训练迭代次数为1000次,初始学习率设为0.1;
S5.5:根据反向传播算法反馈误差更新优化各层节点权值,重复训练过程直到损失函数Losst(s)收敛,则训练结束,用验证集Vt检测分时刻负荷预测模型预测准确率,当准确率在90%以上时表示模型训练达标,如果低于90%则返回步骤4重新对特征输入变量进行选择组成新的输入数据集,基于均方根误差的损失函数Losst具体计算公式如下:
Figure BDA0002782300310000061
式中,yi为预测时刻实际负荷值,
Figure BDA0002782300310000062
为预测时刻预测负荷值。
与现有技术相比,至少具有以下有益的技术效果:
该方法首次根据预测任务的复杂程度对深度循环神经网络的结构进行轻量化设计,并通过分层多次调用网络的方法将负荷预测任务分解为日总负荷预测任务和分时负荷预测任务;
该方法的输入为包含区域日期、天气及历史负荷的经过预处理的数据集,首先对总-分式双层负荷预测网络中的日总负荷层进行训练,有效预测出日总负荷,将多输入特征信息汇集到日总负荷中以达到简化分时负荷预测输入层的目的;
基于k-近邻估计互信息值的特征匹配方法建立输入特征变量与输出之间的关联,更新输入数据集对分时负荷层进行训练,在节省分时刻负荷预测网络训练以及预测时间的同时保持所提取出的特征信息与预测负荷量之间具有强有效关联;
在利用重组数据集训练分时刻负荷层的环节,根据预测精确度反复迭代对特征信息的提炼过程,使最终得到的重组数据集对分时刻负荷预测模型的训练效果是理想的,实现对能量自治区域内各时刻负荷更准确的负荷预测。
附图说明
图1为本发明预测方法流程图。
具体实施方式
为了使本发明的目的和技术方案更加清晰和便于理解。以下结合附图和实例,对本发明进行进一步的详细说明,此处所描述的具体实施例仅用于解释本发明,并非用于限定本发明。
下面结合“利用历史负荷数据集对区域性分时刻负荷进行预测”这一实例对本发明作更详细的说明。
如图1所示,本发明一种基于k-近邻互信息特征简化的配电网边缘侧负荷预测方法,步骤如下:
步骤1:收集包含天气信息、具体日期、每隔十五分钟采集一次的历史分时刻负荷数据以及日总负荷的数据集作为负荷预测任务的原始数据集Ω0,对原始数据集Ω0整体进行缺失值补全、孤立点的检测和剔除操作,对天气信息中包含的温度、湿度、降雨量数据以及历史分时刻负荷数据进行归一化处理,对日期是否为节假日、为周几进行独热编码,预处理后将数据集
Figure BDA0002782300310000071
划分为日负荷训练集Td和日负荷验证集Vd,其中/>
Figure BDA0002782300310000072
表示日期信息,/>
Figure BDA0002782300310000073
表示天气信息,/>
Figure BDA0002782300310000074
表示历史负荷值,LD表示预测结果中的日总负荷值,归一化公式如下式所示:
Figure BDA0002782300310000075
式中,ymax、ymin分别表示归一化后的最大最小值,默认为±1,xmax、xmin分别表示归一化前的原始数据范围;
步骤2:利用步骤1得到的日负荷训练集Td对基于深度循环神经网络的日总负荷预测模型进行训练,具体包括以下步骤:
S2.1:日总负荷预测模型的输入节点包括日最高温度、最低气温、日平均气温、相对湿度、降雨量、周几、是否节假日以及过去一周内每隔十五分钟采集一次的672个历史负荷值等信息,输出节点为预测日的日总负荷;
S2.2:日总负荷预测模型的隐藏层层数初始设置为5层,隐藏层每层的节点数根据经验公式设置初始值为30个,在训练过程中根据模型收敛情况以及预测效果对隐藏层和节点数进行试凑,节点数设置经验公式如下:
Figure BDA0002782300310000081
式中,n1代表初始隐藏层节点数,n代表预测网络输入层节点数679,m代表预测日总负荷网络输出层节点数1,c∈[1,10]的自然数;
S2.3:日总负荷预测模型的激活函数设置为tansig函数,初始化训练迭代次数为2000次,初始学习率设为0.1;
S2.4:日总负荷预测模型根据激活函数正向计算各层节点输入值和神经节点传播权重,根据反向传播算法反馈误差对权值进行更新优化,重复上述过程直到在超出迭代阈值之前神经网络的损失函数值收敛,则训练结束;
S2.5:日总负荷预测网络的损失函数Lossd为预测值与实际值的差;
步骤3:将预测目标日的天气信息、具体日期、历史分时刻负荷数据作为日总负荷预测模型的输入,得到目标日的日总负荷预测值
Figure BDA0002782300310000083
步骤4:基于k-近邻互信息的特征匹配方法,计算高维输入变量中具体日期、天气信息各子集与日总负荷预测值之间的信息关联程度,保留原数据集中的强关联输入变量,筛除弱关联项组成层间过渡数据集
Figure BDA0002782300310000082
以简化下一层分时刻负荷预测网络的训练样本,提高预测效率,其中,/>
Figure BDA0002782300310000091
表示特征筛选后的日期信息,/>
Figure BDA0002782300310000092
表示特征筛选后的天气数据,前四项为预测网络输入,/>
Figure BDA0002782300310000093
表示输出的预测日分时刻负荷序列,具体包括以下步骤:
S4.1:首先将天气信息和具体日期表示为多维特征输入变量X=(X1,X2,...XM),输出历史分时刻负荷序列中的峰值为Y,输入变量每个维度变量Xi与输出Y之间的互信息值为MI(Xi,Y),根据k-近邻互信息的具体计算公式如下:
Figure BDA0002782300310000094
式中,ψ函数为Psi(Digamma)函数,其定义为
Figure BDA0002782300310000095
确定ψ函数的自变量k取值的具体步骤如S4.2所述,ψ函数的自变量n为X与Y合并数据集的总样本数量,nx(i)表示数据集X中距离X与Y合并数据集中第i个点xi严格小于/>
Figure BDA0002782300310000096
的近邻点数,di为xi与其k近邻之间的距离,ny(i)表示数据集Y中距离X与Y合并数据集中第i个点xi严格小于/>
Figure BDA0002782300310000097
的近邻点数;
S4.2:将(Xi,Y)随机分成s个互斥且近似的子集U1,U2,...,Us,依次去掉其中第j个子集Uj,由剩余子集组成数据集Ωremain_j,其中的输入为Xij,随机置换Y得到Yj,π,设定k∈[1,30],k为整数,根据S4.1中公式计算k取每一个值时,数据集Ωremain_j,j∈[1,s]中的Xij与Y之间的互信息MIk(Xj,Y)值,以及Xij与Yj,π之间的互信息MIk(Xj,Yj,π)值,并计算其分布,进行z检验,使zk最大的k即为第i维输入变量Xi对应的k值,z检验的具体公式如下:
Figure BDA0002782300310000101
式中,;μk和μk,π分别代表互信息MIk(Xj,Y)和MIk(Xj,Yj,π)的均值,σk和σk,π分别代表MIk(Xj,Y)和MIk(Xj,Yj,π)的标准差,N代表互信息值的个数;
S4.3:根据S4.1的互信息估计公式和S4.2确定的k值计算每个维度变量Xi与输出Y之间的互信息值MI(Xi,Y),按照互信息值降序排列,剔除弱相关输入变量;
步骤5:利用步骤4得到的层间过渡数据集
Figure BDA0002782300310000102
训练基于深度循环神经网络的分时刻负荷预测模型,具体步骤如下:
S5.1:将层间过渡数据集Ω2的90%作为训练集Tt,其余10%作为验证集Vt,训练时输入变量为特征提取后的日期数据
Figure BDA0002782300310000103
天气数据/>
Figure BDA0002782300310000104
过去一周内每隔十五分钟采集的历史分时刻负荷数据/>
Figure BDA0002782300310000105
以及日总负荷LD
S5.2:网络的输入节点数根据特征提取结果和负荷数据集而定,隐藏层层数和每层节点数利用试凑法得到;
S5.4:分时刻负荷预测模型的激活函数设置为tanh函数,初始化训练迭代次数为1000次,初始学习率设为0.1;
S5.5:根据反向传播算法反馈误差更新优化各层节点权值,重复训练过程直到损失函数Losst(s)收敛,则训练结束,用验证集检测模型预测准确率,当准确率在90%以上时表示模型训练达标,如果低于90%则返回步骤4重新对特征输入变量进行选择组成新的输入数据集,基于均方根误差的损失函数Losst具体计算公式如下:
Figure BDA0002782300310000106
式中,yi为预测时刻实际负荷值,
Figure BDA0002782300310000111
为预测时刻预测负荷值;
步骤6:利用步骤2和步骤5中训练完成的日总负荷以及分时刻负荷预测双层模型,输入预测目标日的日期类型、天气信息和过去一周内历史负荷数据,对预测日的总负荷值和一天内每隔十五分钟的96个负荷值进行预测。
输入周一到周日7个预测目标日的日期类型、天气信息和每天对应的过去一周内历史负荷数据,对预测日的总负荷值和一天内每隔十五分钟的负荷值进行预测后,最终输出预测结果与实际情况相符的准确率为85.01%,符合配网边缘计算架构下对能量自治区域内短期负荷预测的要求。
以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。

Claims (3)

1.基于k-近邻互信息特征简化的配电网边缘侧负荷预测方法,其特征在于,包括以下步骤:
步骤1:收集包含天气信息、具体日期、每隔十五分钟采集一次的历史分时刻负荷数据以及日总负荷的数据集作为负荷预测任务的原始数据集Ω0,对原始数据集Ω0进行缺失值补全、孤立点检测和剔除,对天气信息以及历史分时刻负荷数据进行归一化处理,对日期所属类型进行独热编码,预处理后得到数据集
Figure FDA0004253604070000011
其中,/>
Figure FDA0004253604070000012
表示日期信息,/>
Figure FDA0004253604070000013
表示天气信息,/>
Figure FDA0004253604070000014
表示历史负荷值,LD表示预测结果中的日总负荷值,将该数据集划分为日负荷训练集Td和日负荷验证集Vd
步骤2:利用步骤1得到的日负荷训练集Td对基于深度循环神经网络的日总负荷预测模型进行训练;
步骤3:将预测目标日的天气信息、具体日期、历史分时刻负荷数据作为日总负荷预测模型的输入,得到目标日的日总负荷预测值
Figure FDA0004253604070000015
步骤4:基于k-近邻互信息的特征匹配方法,计算高维输入变量中具体日期、天气信息各子集与日总负荷预测值之间的信息关联程度,保留原数据集中的强关联输入变量,筛除弱关联项组成分时刻负荷预测网络的层间过渡数据集
Figure FDA0004253604070000016
其中,/>
Figure FDA0004253604070000017
表示特征筛选后的日期信息,/>
Figure FDA0004253604070000018
表示特征筛选后的天气数据,/>
Figure FDA0004253604070000019
表示输出的预测日分时刻负荷序列;
步骤5:利用步骤4得到的层间过渡数据集
Figure FDA00042536040700000110
训练基于深度循环神经网络的分时刻负荷预测模型;
步骤6:利用步骤2和步骤5中训练完成的日总负荷以及分时刻负荷预测双层模型,输入预测目标日的日期类型、天气信息和过去一周内历史负荷数据,对预测日的总负荷值和一天内每隔十五分钟的96个负荷值进行预测;
所述步骤2包括以下步骤:
S2.1:日总负荷预测模型的输入节点包括日最高温度、最低气温、日平均气温、相对湿度、降雨量、周几、是否节假日以及过去一周内每隔十五分钟采集一次的672个历史负荷值信息,输出节点为预测日的日总负荷;
S2.2:日总负荷预测模型的隐藏层层数初始设置为5层,隐藏层每层的节点数根据经验公式设置初始值为30个,在训练过程中根据模型收敛情况以及预测效果对隐藏层和节点数进行试凑,节点数设置经验公式如下:
Figure FDA0004253604070000021
式中,n1代表初始隐藏层节点数,n代表预测网络输入层节点数679,m代表预测日总负荷网络输出层节点数1,c∈[1,10]的自然数;
S2.3:日总负荷预测模型的激活函数设置为tansig函数,初始化训练迭代次数为2000次,初始学习率设为0.1;
S2.4:日总负荷预测模型根据激活函数正向计算各层节点输入值和神经节点传播权重,根据反向传播算法反馈误差对神经节点传播权值进行更新优化,直到在超出迭代阈值之前神经网络的损失函数值收敛,则训练结束;
S2.5:日总负荷预测模型的损失函数Lossd为预测值与实际值的差。
2.根据权利要求1所述的基于k-近邻互信息特征简化的配电网边缘侧负荷预测方法,其特征在于,所述步骤4包括以下步骤:
S4.1:首先将天气信息和具体日期表示为多维特征输入变量X=(X1,X2,...XM),输出历史分时刻负荷序列中的峰值为Y,输入变量每个维度变量Xi与输出Y之间的互信息值为MI(Xi,Y),根据k-近邻互信息的具体计算公式如下:
Figure FDA0004253604070000031
式中,ψ函数为Psi(Digamma)函数,其定义为
Figure FDA0004253604070000032
确定ψ函数的自变量k取值的具体步骤如S4.2所述,ψ函数的自变量n为X与Y合并数据集的总样本数量,nx(i)表示数据集X中距离X与Y合并数据集中第i个点xi严格小于/>
Figure FDA0004253604070000033
的近邻点数,di为xi与其k近邻之间的距离,ny(i)表示数据集Y中距离X与Y合并数据集中第i个点xi严格小于/>
Figure FDA0004253604070000034
的近邻点数;
S4.2:将(Xi,Y)随机分成s个互斥且近似的子集U1,U2,...,Us,依次去掉其中第j个子集Uj,由剩余子集组成数据集Ωremain_j,其中的输入为Xij,随机置换Y得到Yj,π,设定k∈[1,30],k为整数,根据S4.1中公式计算k取每一个值时,数据集Ωremain_j,j∈[1,s]中的Xij与Y之间的互信息MIk(Xj,Y)值,以及Xij与Yj,π之间的互信息MIk(Xj,Yj,π)值,并计算其分布,进行z检验,使zk最大的k即为第i维输入变量Xi对应的k值,z检验的具体公式如下:
Figure FDA0004253604070000035
式中;μk和μk,π分别代表互信息MIk(Xj,Y)和MIk(Xj,Yj,π)的均值,σk和σk,π分别代表MIk(Xj,Y)和MIk(Xj,Yj,π)的标准差,N代表互信息值的个数;
S4.3:根据S4.1的互信息估计公式和S4.2确定的k值计算每个维度变量Xi与输出Y之间的互信息值MI(Xi,Y),按照互信息值降序排列,剔除弱相关输入变量。
3.根据权利要求1所述的基于k-近邻互信息特征简化的配电网边缘侧负荷预测方法,其特征在于,所述步骤5包括以下步骤:
S5.1:将层间过渡数据集Ω2的90%作为训练集Tt,其余10%作为验证集Vt,训练时输入变量为特征提取后的日期数据
Figure FDA0004253604070000041
天气数据/>
Figure FDA0004253604070000042
过去一周内每隔十五分钟采集的历史分时刻负荷数据/>
Figure FDA0004253604070000043
以及日总负荷LD
S5.2:网络的输入节点数根据特征提取结果和负荷数据集而定,隐藏层层数和每层节点数利用试凑法得到;
S5.4:分时刻负荷预测模型的激活函数设置为tanh函数,初始化训练迭代次数为1000次,初始学习率设为0.1;
S5.5:根据反向传播算法反馈误差更新优化各层节点权值,重复训练过程直到损失函数Losst(s)收敛,则训练结束,用验证集Vt检测分时刻负荷预测模型预测准确率,当准确率在90%以上时表示模型训练达标,如果低于90%则返回步骤4重新对特征输入变量进行选择组成新的输入数据集,基于均方根误差的损失函数Losst具体计算公式如下:
Figure FDA0004253604070000044
式中,yi为预测时刻实际负荷值,
Figure FDA0004253604070000045
为预测时刻预测负荷值。
CN202011285879.0A 2020-11-17 2020-11-17 基于k-近邻互信息特征简化的配电网边缘侧负荷预测方法 Active CN112200391B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011285879.0A CN112200391B (zh) 2020-11-17 2020-11-17 基于k-近邻互信息特征简化的配电网边缘侧负荷预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011285879.0A CN112200391B (zh) 2020-11-17 2020-11-17 基于k-近邻互信息特征简化的配电网边缘侧负荷预测方法

Publications (2)

Publication Number Publication Date
CN112200391A CN112200391A (zh) 2021-01-08
CN112200391B true CN112200391B (zh) 2023-07-04

Family

ID=74033510

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011285879.0A Active CN112200391B (zh) 2020-11-17 2020-11-17 基于k-近邻互信息特征简化的配电网边缘侧负荷预测方法

Country Status (1)

Country Link
CN (1) CN112200391B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112949905A (zh) * 2021-01-28 2021-06-11 国网浙江省电力有限公司信息通信分公司 边缘域传感器数据预测方法及装置
CN116739831A (zh) * 2023-08-16 2023-09-12 深圳江行联加智能科技有限公司 虚拟电厂的电能调度方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2158332A1 (en) * 2007-05-24 2010-03-03 Pacific Edge Biotechnology Limited Prognosis prediction for melanoma cancer
CN105488590A (zh) * 2015-11-28 2016-04-13 广西电网有限责任公司电力科学研究院 一种基于季节卡尔曼滤波模型的电力负荷自适应预测方法
CN108830418A (zh) * 2018-06-14 2018-11-16 东北电力大学 一种短期电力负荷预测方法
CN110443417A (zh) * 2019-07-05 2019-11-12 上海电力大学 基于小波变换的多模型集成负荷预测方法
CN111160659A (zh) * 2019-12-31 2020-05-15 国家电网公司西南分部 一种考虑温度模糊化的电力负荷预测方法
WO2020140103A1 (en) * 2018-12-27 2020-07-02 Wang Yajuan Scalable system and engine for forecasting wind turbine failure

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11341513B2 (en) * 2018-02-20 2022-05-24 James R Jackson Systems and methods for generating a relationship among a plurality of datasets to generate a desired attribute value

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2158332A1 (en) * 2007-05-24 2010-03-03 Pacific Edge Biotechnology Limited Prognosis prediction for melanoma cancer
CN105488590A (zh) * 2015-11-28 2016-04-13 广西电网有限责任公司电力科学研究院 一种基于季节卡尔曼滤波模型的电力负荷自适应预测方法
CN108830418A (zh) * 2018-06-14 2018-11-16 东北电力大学 一种短期电力负荷预测方法
WO2020140103A1 (en) * 2018-12-27 2020-07-02 Wang Yajuan Scalable system and engine for forecasting wind turbine failure
CN110443417A (zh) * 2019-07-05 2019-11-12 上海电力大学 基于小波变换的多模型集成负荷预测方法
CN111160659A (zh) * 2019-12-31 2020-05-15 国家电网公司西南分部 一种考虑温度模糊化的电力负荷预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于动态电价的需求响应下短期负荷预测研究;刘文;张智晟;;电力系统及其自动化学报(第09期);第118-124页 *
基于高维k-近邻互信息的特征选择方法;周红标;乔俊飞;;智能系统学报(第05期);第595-600页 *
短期模型与长期模型相结合的预测方法;朱运法;葛新权;;数量经济技术经济研究(第08期);第23、38-42页 *

Also Published As

Publication number Publication date
CN112200391A (zh) 2021-01-08

Similar Documents

Publication Publication Date Title
CN108448610B (zh) 一种基于深度学习的短期风功率预测方法
CN101414366B (zh) 基于改进极端学习机方法的电力系统短期负荷预测方法
CN109063911A (zh) 一种基于门控循环单元网络的负荷聚合体分组预测方法
CN106251001A (zh) 一种基于改进模糊聚类算法的光伏功率预测方法
CN112200391B (zh) 基于k-近邻互信息特征简化的配电网边缘侧负荷预测方法
CN110674999A (zh) 基于改进聚类和长短期记忆深度学习的小区负荷预测方法
CN113313947A (zh) 短期交通预测图卷积网络的路况评估方法
CN108346293B (zh) 一种实时交通流短时预测方法
CN114912705A (zh) 一种联邦学习中异质模型融合的优化方法
CN110533484A (zh) 一种基于pca和改进bp神经网络的产品销量预测方法
CN109558897A (zh) 一种基于数据挖掘的电网规划多场景提取方法
CN109816177A (zh) 一种负荷聚合商短期负荷预测方法、装置及设备
CN112434848A (zh) 基于深度信念网络的非线性加权组合风电功率预测方法
CN110442143A (zh) 一种基于组合多目标鸽群优化的无人机态势数据聚类方法
CN109754122A (zh) 一种基于随机森林特征提取的bp神经网络的数值预测方法
CN113554466A (zh) 一种短期用电量预测模型构建方法、预测方法和装置
CN111832839B (zh) 基于充分增量学习的能耗预测方法
CN110070228A (zh) 一种神经元分支进化的bp神经网络风速预测方法
CN113780684A (zh) 一种基于lstm神经网络的智慧楼宇用户用能行为预测方法
CN106845696B (zh) 一种智能优化水资源配置方法
CN109840335A (zh) 基于强化t-s模糊神经网络的径向锻造凹坑预测优化方法
CN110570091A (zh) 基于改进F-score特征选择及粒子群BP神经网络的负荷辨识方法
CN114091776A (zh) 一种基于K-means的多分支AGCNN短期电力负荷预测方法
CN108073442B (zh) 基于深度模糊栈式自编码的仿真请求执行时间预测方法
CN117574776A (zh) 一种面向任务规划的模型自学习优化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant