CN112200391B - 基于k-近邻互信息特征简化的配电网边缘侧负荷预测方法 - Google Patents
基于k-近邻互信息特征简化的配电网边缘侧负荷预测方法 Download PDFInfo
- Publication number
- CN112200391B CN112200391B CN202011285879.0A CN202011285879A CN112200391B CN 112200391 B CN112200391 B CN 112200391B CN 202011285879 A CN202011285879 A CN 202011285879A CN 112200391 B CN112200391 B CN 112200391B
- Authority
- CN
- China
- Prior art keywords
- load
- value
- data set
- daily
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000009826 distribution Methods 0.000 title claims abstract description 21
- 238000012549 training Methods 0.000 claims abstract description 48
- 238000013528 artificial neural network Methods 0.000 claims abstract description 11
- 125000004122 cyclic group Chemical group 0.000 claims abstract description 9
- 238000004364 calculation method Methods 0.000 claims abstract description 7
- 238000012795 verification Methods 0.000 claims abstract description 6
- 238000007781 pre-processing Methods 0.000 claims abstract description 3
- 239000010410 layer Substances 0.000 claims description 47
- 230000006870 function Effects 0.000 claims description 39
- 230000004913 activation Effects 0.000 claims description 9
- 239000011229 interlayer Substances 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 9
- 230000007704 transition Effects 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 6
- 210000005036 nerve Anatomy 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 5
- 238000012360 testing method Methods 0.000 claims description 4
- 238000010200 validation analysis Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 3
- 230000008030 elimination Effects 0.000 claims description 3
- 238000003379 elimination reaction Methods 0.000 claims description 3
- 238000005265 energy consumption Methods 0.000 abstract description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- General Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Primary Health Care (AREA)
- Development Economics (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了基于k‑近邻互信息特征简化的配电网边缘侧负荷预测方法,通过补全缺失值以及对天气日期类型进行独热编码等预处理方式建立负荷预测训练及验证数据集,然后对日总负荷预测循环神经网络进行前向和后向传播的训练;得出预测日总负荷后,估计多维输入向量与输出向量之间的互信息,进行特征选择以简化运算节省边缘计算能耗,将特征简化后的天气、日期数据与日总负荷、分时刻负荷数据作为新的数据样本训练分时刻负荷预测网络;最后将预测日相关信息输入训练完成的分时刻负荷预测网络得出区域内某日的日总负荷以及分时刻负荷预测值。本发明实现方法整体化简,在一定程度上提高区域内部分边缘计算任务的效率,完善配电物联网的边缘计算架构。
Description
技术领域
本发明涉及配电网短期负荷预测技术领域,具体涉及边缘计算架构下应用深度循环神经网络的配电物联网负荷预测方法,设计轻量化适用于边缘计算侧的日时双层神经网络预测模型,并对其进行简化特征变量的训练使其根据所划分能量自治区域内的历史负荷数据进行准确实时的短期负荷预测。
背景技术
我国电力物联网发展迅速,随着5G通信网络的逐渐展开其建设进程进一步加快,社会生产进步和人民生活水平提高,对电力系统安全的依赖性也不断加强,对配电网络安全稳定性的提升以及智能化的建设提出了更高要求。配电物联网建设过程中最为基础的感知层设备数量大幅增长,设备状态数据、运行环境信息等海量异构且不同传输带宽的数据爆炸式增长,给电力数据的传输存储以及运算处理工作带来了巨大压力。边缘计算技术可以就近处理仅对于本地更有价值的数据,也能够更近距离地储存和归档原始数据,进行简单的过滤、统计工作或通过上层云计算中心下发的数据处理模型对数据进行初步处理后再将结果上传,减少需要进行维护或送往云端和企业数据中心的数据量,从而节约时间成本和能耗成本,并为更重要更复杂的数据流处理节约有限的网络带宽,在配电物联网中合理设计边缘计算架构、应用边缘计算技术可以降低组网成本。
边缘计算架构下的配网数据处理工作要求利用边缘侧有限的计算资源和结构复杂的本地数据,进行有效的信息提取并尽量节约数据处理的能耗和传输时间,但配电物联网当前阶段采用的基于深度学习的负荷预测方法多适用于电力数据中心,网络结构复杂、占用大量计算资源不适合在边缘计算架构进行轻量化的计算和实时数据处理,而且普遍采用时间序列进行预测而很少计及天气和日期类型等信息的影响。
发明内容
针对配网数据中心现有负荷预测方法模型复杂不便于下发至边缘计算侧执行分区负荷预测任务的问题,本发明提出了一种适用于边缘计算架构的轻量化日时分层负荷预测神经网络模型,并同时提出基于此模型在能量自治区域边缘侧进行短期负荷预测的方法,提高利用边缘侧所采集数据进行区域负荷预测的效率并减轻边缘侧计算压力。
为达到上述目的,本发明采用如下技术方案:
基于k-近邻互信息特征简化的配电网边缘侧负荷预测方法,包括以下步骤:
步骤1:收集包含天气信息、具体日期、每隔十五分钟采集一次的历史分时刻负荷数据以及日总负荷的数据集作为负荷预测任务的原始数据集Ω0,对原始数据集Ω0进行缺失值补全、孤立点检测和剔除,对天气信息以及历史分时刻负荷数据进行归一化处理,对日期所属类型进行独热编码,预处理后得到数据集其中,/>表示日期信息,表示天气信息,/>表示历史负荷值,LD表示预测结果中的日总负荷值,将该数据集划分为日负荷训练集Td和日负荷验证集Vd;
步骤2:利用步骤1得到的日负荷训练集Td对基于深度循环神经网络的日总负荷预测模型进行训练;
步骤4:基于k-近邻互信息的特征匹配方法,计算高维输入变量中具体日期、天气信息各子集与日总负荷预测值之间的信息关联程度,保留原数据集中的强关联输入变量,筛除弱关联项组成分时刻负荷预测网络的层间过渡数据集其中,/>表示特征筛选后的日期信息,/>表示特征筛选后的天气数据,/>表示输出的预测日分时刻负荷序列,;
步骤6:利用步骤2和步骤5中训练完成的日总负荷以及分时刻负荷预测双层模型,输入预测目标日的日期类型、天气信息和过去一周内历史负荷数据,对预测日的总负荷值和一天内每隔十五分钟的96个负荷值进行预测。
所述步骤2包括以下步骤:
S2.1:日总负荷预测模型的输入节点包括日最高温度、最低气温、日平均气温、相对湿度、降雨量、周几、是否节假日以及过去一周内每隔十五分钟采集一次的672个历史负荷值信息,输出节点为预测日的日总负荷;S2.2:日总负荷预测模型的隐藏层层数初始设置为5层,隐藏层每层的节点数根据经验公式设置初始值为30个,在训练过程中根据模型收敛情况以及预测效果对隐藏层和节点数进行试凑,节点数设置经验公式如下:
式中,n1代表初始隐藏层节点数,n代表预测网络输入层节点数679,m代表预测日总负荷网络输出层节点数1,c∈[1,10]的自然数;
S2.3:日总负荷预测模型的激活函数设置为tansig函数,初始化训练迭代次数为2000次,初始学习率设为0.1;
S2.4:日总负荷预测模型根据激活函数正向计算各层节点输入值和神经节点传播权重,根据反向传播算法反馈误差对神经节点传播权值进行更新优化,直到在超出迭代阈值之前神经网络的损失函数值收敛,则训练结束;
S2.5:日总负荷预测模型的损失函数Lossd为预测值与实际值的差。
所述步骤4包括以下步骤:
S4.1:首先将天气信息和具体日期表示为多维特征输入变量X=(X1,X2,...XM),输出历史分时刻负荷序列中的峰值为Y,输入变量每个维度变量Xi与输出Y之间的互信息值为MI(Xi,Y),根据k-近邻互信息的具体计算公式如下:
式中,ψ函数为Psi(Digamma)函数,其定义为确定ψ函数的自变量k取值的具体步骤如S4.2所述,ψ函数的自变量n为X与Y合并数据集的总样本数量,nx(i)表示数据集X中距离X与Y合并数据集中第i个点xi严格小于/>的近邻点数,di为xi与其k近邻之间的距离,ny(i)表示数据集Y中距离X与Y合并数据集中第i个点xi严格小于/>的近邻点数;
S4.2:将(Xi,Y)随机分成s个互斥且近似的子集U1,U2,...,Us,依次去掉其中第j个子集Uj,由剩余子集组成数据集Ωremain_j,其中的输入为Xij,随机置换Y得到Yj,π,设定k∈[1,30],k为整数,根据S4.1中公式计算k取每一个值时,数据集Ωremain_j,j∈[1,s]中的Xij与Y之间的互信息MIk(Xj,Y)值,以及Xij与Yj,π之间的互信息MIk(Xj,Yj,π)值,并计算其分布,进行z检验,使zk最大的k即为第i维输入变量Xi对应的k值,z检验的具体公式如下:
式中,;μk和μk,π分别代表互信息MIk(Xj,Y)和MIk(Xj,Yj,π)的均值,σk和σk,π分别代表MIk(Xj,Y)和MIk(Xj,Yj,π)的标准差,N代表互信息值的个数;
S4.3:根据S4.1的互信息估计公式和S4.2确定的k值计算每个维度变量Xi与输出Y之间的互信息值MI(Xi,Y),按照互信息值降序排列,剔除弱相关输入变量。
所述步骤5包括以下步骤:
S5.2:网络的输入节点数根据特征提取结果和负荷数据集而定,隐藏层层数和每层节点数利用试凑法得到;
S5.4:分时刻负荷预测模型的激活函数设置为tanh函数,初始化训练迭代次数为1000次,初始学习率设为0.1;
S5.5:根据反向传播算法反馈误差更新优化各层节点权值,重复训练过程直到损失函数Losst(s)收敛,则训练结束,用验证集Vt检测分时刻负荷预测模型预测准确率,当准确率在90%以上时表示模型训练达标,如果低于90%则返回步骤4重新对特征输入变量进行选择组成新的输入数据集,基于均方根误差的损失函数Losst具体计算公式如下:
与现有技术相比,至少具有以下有益的技术效果:
该方法首次根据预测任务的复杂程度对深度循环神经网络的结构进行轻量化设计,并通过分层多次调用网络的方法将负荷预测任务分解为日总负荷预测任务和分时负荷预测任务;
该方法的输入为包含区域日期、天气及历史负荷的经过预处理的数据集,首先对总-分式双层负荷预测网络中的日总负荷层进行训练,有效预测出日总负荷,将多输入特征信息汇集到日总负荷中以达到简化分时负荷预测输入层的目的;
基于k-近邻估计互信息值的特征匹配方法建立输入特征变量与输出之间的关联,更新输入数据集对分时负荷层进行训练,在节省分时刻负荷预测网络训练以及预测时间的同时保持所提取出的特征信息与预测负荷量之间具有强有效关联;
在利用重组数据集训练分时刻负荷层的环节,根据预测精确度反复迭代对特征信息的提炼过程,使最终得到的重组数据集对分时刻负荷预测模型的训练效果是理想的,实现对能量自治区域内各时刻负荷更准确的负荷预测。
附图说明
图1为本发明预测方法流程图。
具体实施方式
为了使本发明的目的和技术方案更加清晰和便于理解。以下结合附图和实例,对本发明进行进一步的详细说明,此处所描述的具体实施例仅用于解释本发明,并非用于限定本发明。
下面结合“利用历史负荷数据集对区域性分时刻负荷进行预测”这一实例对本发明作更详细的说明。
如图1所示,本发明一种基于k-近邻互信息特征简化的配电网边缘侧负荷预测方法,步骤如下:
步骤1:收集包含天气信息、具体日期、每隔十五分钟采集一次的历史分时刻负荷数据以及日总负荷的数据集作为负荷预测任务的原始数据集Ω0,对原始数据集Ω0整体进行缺失值补全、孤立点的检测和剔除操作,对天气信息中包含的温度、湿度、降雨量数据以及历史分时刻负荷数据进行归一化处理,对日期是否为节假日、为周几进行独热编码,预处理后将数据集划分为日负荷训练集Td和日负荷验证集Vd,其中/>表示日期信息,/>表示天气信息,/>表示历史负荷值,LD表示预测结果中的日总负荷值,归一化公式如下式所示:
式中,ymax、ymin分别表示归一化后的最大最小值,默认为±1,xmax、xmin分别表示归一化前的原始数据范围;
步骤2:利用步骤1得到的日负荷训练集Td对基于深度循环神经网络的日总负荷预测模型进行训练,具体包括以下步骤:
S2.1:日总负荷预测模型的输入节点包括日最高温度、最低气温、日平均气温、相对湿度、降雨量、周几、是否节假日以及过去一周内每隔十五分钟采集一次的672个历史负荷值等信息,输出节点为预测日的日总负荷;
S2.2:日总负荷预测模型的隐藏层层数初始设置为5层,隐藏层每层的节点数根据经验公式设置初始值为30个,在训练过程中根据模型收敛情况以及预测效果对隐藏层和节点数进行试凑,节点数设置经验公式如下:
式中,n1代表初始隐藏层节点数,n代表预测网络输入层节点数679,m代表预测日总负荷网络输出层节点数1,c∈[1,10]的自然数;
S2.3:日总负荷预测模型的激活函数设置为tansig函数,初始化训练迭代次数为2000次,初始学习率设为0.1;
S2.4:日总负荷预测模型根据激活函数正向计算各层节点输入值和神经节点传播权重,根据反向传播算法反馈误差对权值进行更新优化,重复上述过程直到在超出迭代阈值之前神经网络的损失函数值收敛,则训练结束;
S2.5:日总负荷预测网络的损失函数Lossd为预测值与实际值的差;
步骤4:基于k-近邻互信息的特征匹配方法,计算高维输入变量中具体日期、天气信息各子集与日总负荷预测值之间的信息关联程度,保留原数据集中的强关联输入变量,筛除弱关联项组成层间过渡数据集以简化下一层分时刻负荷预测网络的训练样本,提高预测效率,其中,/>表示特征筛选后的日期信息,/>表示特征筛选后的天气数据,前四项为预测网络输入,/>表示输出的预测日分时刻负荷序列,具体包括以下步骤:
S4.1:首先将天气信息和具体日期表示为多维特征输入变量X=(X1,X2,...XM),输出历史分时刻负荷序列中的峰值为Y,输入变量每个维度变量Xi与输出Y之间的互信息值为MI(Xi,Y),根据k-近邻互信息的具体计算公式如下:
式中,ψ函数为Psi(Digamma)函数,其定义为确定ψ函数的自变量k取值的具体步骤如S4.2所述,ψ函数的自变量n为X与Y合并数据集的总样本数量,nx(i)表示数据集X中距离X与Y合并数据集中第i个点xi严格小于/>的近邻点数,di为xi与其k近邻之间的距离,ny(i)表示数据集Y中距离X与Y合并数据集中第i个点xi严格小于/>的近邻点数;
S4.2:将(Xi,Y)随机分成s个互斥且近似的子集U1,U2,...,Us,依次去掉其中第j个子集Uj,由剩余子集组成数据集Ωremain_j,其中的输入为Xij,随机置换Y得到Yj,π,设定k∈[1,30],k为整数,根据S4.1中公式计算k取每一个值时,数据集Ωremain_j,j∈[1,s]中的Xij与Y之间的互信息MIk(Xj,Y)值,以及Xij与Yj,π之间的互信息MIk(Xj,Yj,π)值,并计算其分布,进行z检验,使zk最大的k即为第i维输入变量Xi对应的k值,z检验的具体公式如下:
式中,;μk和μk,π分别代表互信息MIk(Xj,Y)和MIk(Xj,Yj,π)的均值,σk和σk,π分别代表MIk(Xj,Y)和MIk(Xj,Yj,π)的标准差,N代表互信息值的个数;
S4.3:根据S4.1的互信息估计公式和S4.2确定的k值计算每个维度变量Xi与输出Y之间的互信息值MI(Xi,Y),按照互信息值降序排列,剔除弱相关输入变量;
S5.2:网络的输入节点数根据特征提取结果和负荷数据集而定,隐藏层层数和每层节点数利用试凑法得到;
S5.4:分时刻负荷预测模型的激活函数设置为tanh函数,初始化训练迭代次数为1000次,初始学习率设为0.1;
S5.5:根据反向传播算法反馈误差更新优化各层节点权值,重复训练过程直到损失函数Losst(s)收敛,则训练结束,用验证集检测模型预测准确率,当准确率在90%以上时表示模型训练达标,如果低于90%则返回步骤4重新对特征输入变量进行选择组成新的输入数据集,基于均方根误差的损失函数Losst具体计算公式如下:
步骤6:利用步骤2和步骤5中训练完成的日总负荷以及分时刻负荷预测双层模型,输入预测目标日的日期类型、天气信息和过去一周内历史负荷数据,对预测日的总负荷值和一天内每隔十五分钟的96个负荷值进行预测。
输入周一到周日7个预测目标日的日期类型、天气信息和每天对应的过去一周内历史负荷数据,对预测日的总负荷值和一天内每隔十五分钟的负荷值进行预测后,最终输出预测结果与实际情况相符的准确率为85.01%,符合配网边缘计算架构下对能量自治区域内短期负荷预测的要求。
以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。
Claims (3)
1.基于k-近邻互信息特征简化的配电网边缘侧负荷预测方法,其特征在于,包括以下步骤:
步骤1:收集包含天气信息、具体日期、每隔十五分钟采集一次的历史分时刻负荷数据以及日总负荷的数据集作为负荷预测任务的原始数据集Ω0,对原始数据集Ω0进行缺失值补全、孤立点检测和剔除,对天气信息以及历史分时刻负荷数据进行归一化处理,对日期所属类型进行独热编码,预处理后得到数据集其中,/>表示日期信息,/>表示天气信息,/>表示历史负荷值,LD表示预测结果中的日总负荷值,将该数据集划分为日负荷训练集Td和日负荷验证集Vd;
步骤2:利用步骤1得到的日负荷训练集Td对基于深度循环神经网络的日总负荷预测模型进行训练;
步骤4:基于k-近邻互信息的特征匹配方法,计算高维输入变量中具体日期、天气信息各子集与日总负荷预测值之间的信息关联程度,保留原数据集中的强关联输入变量,筛除弱关联项组成分时刻负荷预测网络的层间过渡数据集其中,/>表示特征筛选后的日期信息,/>表示特征筛选后的天气数据,/>表示输出的预测日分时刻负荷序列;
步骤6:利用步骤2和步骤5中训练完成的日总负荷以及分时刻负荷预测双层模型,输入预测目标日的日期类型、天气信息和过去一周内历史负荷数据,对预测日的总负荷值和一天内每隔十五分钟的96个负荷值进行预测;
所述步骤2包括以下步骤:
S2.1:日总负荷预测模型的输入节点包括日最高温度、最低气温、日平均气温、相对湿度、降雨量、周几、是否节假日以及过去一周内每隔十五分钟采集一次的672个历史负荷值信息,输出节点为预测日的日总负荷;
S2.2:日总负荷预测模型的隐藏层层数初始设置为5层,隐藏层每层的节点数根据经验公式设置初始值为30个,在训练过程中根据模型收敛情况以及预测效果对隐藏层和节点数进行试凑,节点数设置经验公式如下:
式中,n1代表初始隐藏层节点数,n代表预测网络输入层节点数679,m代表预测日总负荷网络输出层节点数1,c∈[1,10]的自然数;
S2.3:日总负荷预测模型的激活函数设置为tansig函数,初始化训练迭代次数为2000次,初始学习率设为0.1;
S2.4:日总负荷预测模型根据激活函数正向计算各层节点输入值和神经节点传播权重,根据反向传播算法反馈误差对神经节点传播权值进行更新优化,直到在超出迭代阈值之前神经网络的损失函数值收敛,则训练结束;
S2.5:日总负荷预测模型的损失函数Lossd为预测值与实际值的差。
2.根据权利要求1所述的基于k-近邻互信息特征简化的配电网边缘侧负荷预测方法,其特征在于,所述步骤4包括以下步骤:
S4.1:首先将天气信息和具体日期表示为多维特征输入变量X=(X1,X2,...XM),输出历史分时刻负荷序列中的峰值为Y,输入变量每个维度变量Xi与输出Y之间的互信息值为MI(Xi,Y),根据k-近邻互信息的具体计算公式如下:
式中,ψ函数为Psi(Digamma)函数,其定义为确定ψ函数的自变量k取值的具体步骤如S4.2所述,ψ函数的自变量n为X与Y合并数据集的总样本数量,nx(i)表示数据集X中距离X与Y合并数据集中第i个点xi严格小于/>的近邻点数,di为xi与其k近邻之间的距离,ny(i)表示数据集Y中距离X与Y合并数据集中第i个点xi严格小于/>的近邻点数;
S4.2:将(Xi,Y)随机分成s个互斥且近似的子集U1,U2,...,Us,依次去掉其中第j个子集Uj,由剩余子集组成数据集Ωremain_j,其中的输入为Xij,随机置换Y得到Yj,π,设定k∈[1,30],k为整数,根据S4.1中公式计算k取每一个值时,数据集Ωremain_j,j∈[1,s]中的Xij与Y之间的互信息MIk(Xj,Y)值,以及Xij与Yj,π之间的互信息MIk(Xj,Yj,π)值,并计算其分布,进行z检验,使zk最大的k即为第i维输入变量Xi对应的k值,z检验的具体公式如下:
式中;μk和μk,π分别代表互信息MIk(Xj,Y)和MIk(Xj,Yj,π)的均值,σk和σk,π分别代表MIk(Xj,Y)和MIk(Xj,Yj,π)的标准差,N代表互信息值的个数;
S4.3:根据S4.1的互信息估计公式和S4.2确定的k值计算每个维度变量Xi与输出Y之间的互信息值MI(Xi,Y),按照互信息值降序排列,剔除弱相关输入变量。
3.根据权利要求1所述的基于k-近邻互信息特征简化的配电网边缘侧负荷预测方法,其特征在于,所述步骤5包括以下步骤:
S5.2:网络的输入节点数根据特征提取结果和负荷数据集而定,隐藏层层数和每层节点数利用试凑法得到;
S5.4:分时刻负荷预测模型的激活函数设置为tanh函数,初始化训练迭代次数为1000次,初始学习率设为0.1;
S5.5:根据反向传播算法反馈误差更新优化各层节点权值,重复训练过程直到损失函数Losst(s)收敛,则训练结束,用验证集Vt检测分时刻负荷预测模型预测准确率,当准确率在90%以上时表示模型训练达标,如果低于90%则返回步骤4重新对特征输入变量进行选择组成新的输入数据集,基于均方根误差的损失函数Losst具体计算公式如下:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011285879.0A CN112200391B (zh) | 2020-11-17 | 2020-11-17 | 基于k-近邻互信息特征简化的配电网边缘侧负荷预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011285879.0A CN112200391B (zh) | 2020-11-17 | 2020-11-17 | 基于k-近邻互信息特征简化的配电网边缘侧负荷预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112200391A CN112200391A (zh) | 2021-01-08 |
CN112200391B true CN112200391B (zh) | 2023-07-04 |
Family
ID=74033510
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011285879.0A Active CN112200391B (zh) | 2020-11-17 | 2020-11-17 | 基于k-近邻互信息特征简化的配电网边缘侧负荷预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112200391B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112949905A (zh) * | 2021-01-28 | 2021-06-11 | 国网浙江省电力有限公司信息通信分公司 | 边缘域传感器数据预测方法及装置 |
CN116739831A (zh) * | 2023-08-16 | 2023-09-12 | 深圳江行联加智能科技有限公司 | 虚拟电厂的电能调度方法、装置、设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2158332A1 (en) * | 2007-05-24 | 2010-03-03 | Pacific Edge Biotechnology Limited | Prognosis prediction for melanoma cancer |
CN105488590A (zh) * | 2015-11-28 | 2016-04-13 | 广西电网有限责任公司电力科学研究院 | 一种基于季节卡尔曼滤波模型的电力负荷自适应预测方法 |
CN108830418A (zh) * | 2018-06-14 | 2018-11-16 | 东北电力大学 | 一种短期电力负荷预测方法 |
CN110443417A (zh) * | 2019-07-05 | 2019-11-12 | 上海电力大学 | 基于小波变换的多模型集成负荷预测方法 |
CN111160659A (zh) * | 2019-12-31 | 2020-05-15 | 国家电网公司西南分部 | 一种考虑温度模糊化的电力负荷预测方法 |
WO2020140103A1 (en) * | 2018-12-27 | 2020-07-02 | Wang Yajuan | Scalable system and engine for forecasting wind turbine failure |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019165000A1 (en) * | 2018-02-20 | 2019-08-29 | Jackson James R | Systems and methods for generating a relationship among a plurality of data sets to generate a desired attribute value |
-
2020
- 2020-11-17 CN CN202011285879.0A patent/CN112200391B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2158332A1 (en) * | 2007-05-24 | 2010-03-03 | Pacific Edge Biotechnology Limited | Prognosis prediction for melanoma cancer |
CN105488590A (zh) * | 2015-11-28 | 2016-04-13 | 广西电网有限责任公司电力科学研究院 | 一种基于季节卡尔曼滤波模型的电力负荷自适应预测方法 |
CN108830418A (zh) * | 2018-06-14 | 2018-11-16 | 东北电力大学 | 一种短期电力负荷预测方法 |
WO2020140103A1 (en) * | 2018-12-27 | 2020-07-02 | Wang Yajuan | Scalable system and engine for forecasting wind turbine failure |
CN110443417A (zh) * | 2019-07-05 | 2019-11-12 | 上海电力大学 | 基于小波变换的多模型集成负荷预测方法 |
CN111160659A (zh) * | 2019-12-31 | 2020-05-15 | 国家电网公司西南分部 | 一种考虑温度模糊化的电力负荷预测方法 |
Non-Patent Citations (3)
Title |
---|
基于动态电价的需求响应下短期负荷预测研究;刘文;张智晟;;电力系统及其自动化学报(第09期);第118-124页 * |
基于高维k-近邻互信息的特征选择方法;周红标;乔俊飞;;智能系统学报(第05期);第595-600页 * |
短期模型与长期模型相结合的预测方法;朱运法;葛新权;;数量经济技术经济研究(第08期);第23、38-42页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112200391A (zh) | 2021-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101414366B (zh) | 基于改进极端学习机方法的电力系统短期负荷预测方法 | |
CN106251001A (zh) | 一种基于改进模糊聚类算法的光伏功率预测方法 | |
CN109063911A (zh) | 一种基于门控循环单元网络的负荷聚合体分组预测方法 | |
CN112200391B (zh) | 基于k-近邻互信息特征简化的配电网边缘侧负荷预测方法 | |
CN110674999A (zh) | 基于改进聚类和长短期记忆深度学习的小区负荷预测方法 | |
CN113313947A (zh) | 短期交通预测图卷积网络的路况评估方法 | |
CN108346293B (zh) | 一种实时交通流短时预测方法 | |
CN114912705A (zh) | 一种联邦学习中异质模型融合的优化方法 | |
CN110533484A (zh) | 一种基于pca和改进bp神经网络的产品销量预测方法 | |
CN109558897A (zh) | 一种基于数据挖掘的电网规划多场景提取方法 | |
CN112434848A (zh) | 基于深度信念网络的非线性加权组合风电功率预测方法 | |
CN109816177A (zh) | 一种负荷聚合商短期负荷预测方法、装置及设备 | |
CN110442143A (zh) | 一种基于组合多目标鸽群优化的无人机态势数据聚类方法 | |
CN109754122A (zh) | 一种基于随机森林特征提取的bp神经网络的数值预测方法 | |
CN113554466A (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
CN110070228A (zh) | 一种神经元分支进化的bp神经网络风速预测方法 | |
CN113780684A (zh) | 一种基于lstm神经网络的智慧楼宇用户用能行为预测方法 | |
CN111832839B (zh) | 基于充分增量学习的能耗预测方法 | |
CN106845696B (zh) | 一种智能优化水资源配置方法 | |
CN116226689A (zh) | 一种基于高斯混合模型的配电网典型运行场景生成方法 | |
CN111723516A (zh) | 基于自适应dnn替代模型的多目标海水入侵管理模型 | |
CN110570091A (zh) | 基于改进F-score特征选择及粒子群BP神经网络的负荷辨识方法 | |
CN114510871A (zh) | 基于思维进化和lstm的云服务器性能衰退预测方法 | |
CN114091776A (zh) | 一种基于K-means的多分支AGCNN短期电力负荷预测方法 | |
CN108073442B (zh) | 基于深度模糊栈式自编码的仿真请求执行时间预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |