CN113657687B - 基于特征工程和多路深度学习的电力负荷预测方法 - Google Patents
基于特征工程和多路深度学习的电力负荷预测方法 Download PDFInfo
- Publication number
- CN113657687B CN113657687B CN202111007838.XA CN202111007838A CN113657687B CN 113657687 B CN113657687 B CN 113657687B CN 202111007838 A CN202111007838 A CN 202111007838A CN 113657687 B CN113657687 B CN 113657687B
- Authority
- CN
- China
- Prior art keywords
- data
- radial basis
- basis function
- load
- day
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000013135 deep learning Methods 0.000 title claims abstract description 18
- 230000006870 function Effects 0.000 claims abstract description 109
- 238000012549 training Methods 0.000 claims abstract description 39
- 210000002569 neuron Anatomy 0.000 claims abstract description 33
- 238000012360 testing method Methods 0.000 claims abstract description 20
- 238000012545 processing Methods 0.000 claims abstract description 9
- 239000013598 vector Substances 0.000 claims description 72
- 230000011218 segmentation Effects 0.000 claims description 10
- XOFYZVNMUHMLCC-ZPOLXVRWSA-N prednisone Chemical compound O=C1C=C[C@]2(C)[C@H]3C(=O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 XOFYZVNMUHMLCC-ZPOLXVRWSA-N 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 abstract description 7
- 230000000694 effects Effects 0.000 abstract description 2
- 230000005611 electricity Effects 0.000 description 5
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 3
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000013136 deep learning model Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
- G06F18/2414—Smoothing the distance, e.g. radial basis function networks [RBFN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Marketing (AREA)
- Computational Linguistics (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于特征工程和多路深度学习的电力负荷预测方法,包括步骤:S1.采集电力负荷数据以及气温数据;S2.依据目标特征对电力负荷数据以及气温数据进行处理,生成数据集;S3.对数据集进行切分得到N个数据子集;S4.将N个数据子集分别输入到N个径向基函数网络,进行训练,得到N个训练后的径向基函数网络;S5.采集测试数据;S6.从N个已训练的径向基函数网络中选取K个径向基函数网络,并将测试数据分别输入到K个径向基函数网络,输出K个电力负荷预测结果,将K个电力负荷预测结果的求和平均值作为最终的电力负荷预测结果。本发明能够减少神经网络中隐含层神经元的数量,学习效率高,泛化能力强,预测效果好。
Description
技术领域
本发明涉及电力负荷领域,具体涉及一种基于特征工程和多路深度学习的电力负荷预测方法。
背景技术
电力负荷预测是电网调控和规划的核心内容之一,分为短期负荷预测(short-term load forecasting,STLF)、中期负荷预测(medium-term load forecasting,MTLF)和长期负荷预测(long-term load forecasting,LTLF),各自的预测范围从几小时到几天、从几周到几个月以及从一年到几年。尽管MTLF和LTLF对电网建设规划和运维管理非常重要,但STLF在电力营销管理、电网运行调度、发电机组组织和能源期货交易等方面发挥着更重要的作用,是快速响应需求、实现成本效益的有利工具。
典型的电力负荷预测技术有统计预测法和人工智能(AI)技术两大类。由于能源消耗受天气、季节和社会经济条件影响,表现出典型的非线性特征,统计预测法的精度较低。基于人工智能的预测模型能利用各种机器学习的非线性特性,拟合、分类、识别看不见、理不清的模式,以人工神经网络(ANN)为基础的机器学习模型已在模式识别、信息处理和特征挖掘等领域获得了广泛的运用,且还在不断改进。相比于统计预测法,基于人工智能的预测模型利用历史数据对问题或对象“学习”,不仅能处理非线性问题,而且准确性高、鲁棒性好,适应性强,非常适合进行短期负荷预测。
虽然基于人工神经网络的深度学习模型在处理非线性学习问题上取得了巨大成功,但当应用于特征丰富的电力负荷预测时,一方面,随着隐含层神经元数量的增加,运算量随之增加。换言之,随着人工神经网络复杂度的增加,会产生巨大的处理时间开销。为了增强预测模型的时效性,必须减少输入特征数量,以降低处理开销,代价是牺牲了预测模型的泛化能力。另一方面,人工神经网络对训练数据中不可见模式进行拟合或学习的能力是选择和使用的主要驱动力,预测模型应容纳尽可能多的输入特征,以提高预测的准确性和鲁棒性。
发明内容
有鉴于此,本发明的目的是克服现有技术中的缺陷,提供基于特征工程和多路深度学习的电力负荷预测方法,减少神经网络中隐含层神经元的数量,提高学习效率和预测效果,增强泛化能力强。
本发明的基于特征工程和多路深度学习的电力负荷预测方法,包括如下步骤:
S1.采集电力负荷数据以及气温数据;
S2.设置目标特征,并依据目标特征对电力负荷数据以及气温数据进行处理,生成数据集;
S3.基于目标特征对数据集进行切分,得到N个数据子集;
S4.将N个数据子集分别作为N个径向基函数网络的输入,对网络进行训练,得到N个训练后的径向基函数网络;其中,所述N个数据子集与N个径向基函数网络一一对应;
S5.采集测试数据;所述测试数据包括电力负荷数据以及气温数据;
S6.从N个已训练的径向基函数网络中选取K个径向基函数网络,并将测试数据分别输入到K个径向基函数网络,输出K个电力负荷预测结果,将K个电力负荷预测结果的求和平均值作为最终的电力负荷预测结果。
进一步,所述目标特征包括η小时负荷量、ε点时间戳、星期、节假日、气温、φ天负荷平均值以及γ天负荷标准差。
进一步,步骤S2中,依据目标特征对电力负荷数据以及气温数据进行处理,生成数据集,具体包括:
S21.若η小时负荷量存在数据缺失,则将缺失数据的前后两点数据的加权平均值作为所述缺失数据;
S22.对η小时负荷量按照时间先后顺序排列形成负荷量序列E:
其中,为第m天的第i个时间戳的负荷量;M为采集的总天数;
S23.对ε点时间戳进行独热编码形成时间戳编码向量序列T:
其中,为第m天的第i个时间戳的时间戳编码向量,所述/>
S24.对星期进行独热编码形成星期编码向量序列B:
其中,为第n个星期周i的星期编码向量,所述/>
S25.对节假日进行独热编码形成节假日编码向量序列U:
U={u1,u2};
其中,u1,u2分别为是节假日和非节假日的编码向量,所述u1=[0,1]T,u2=[1,0]T;
S26.对气温数据按照时间顺序排列形成气温序列V:
V={v1,v2,…,vm,…};
其中,vm为第m天的气温数据;
S27.计算目标天的前φ天负荷量的平均值,形成φ天负荷平均值序列AE:
AE=[AE1,AE2,…,AEm,…,AEM];
其中,AEm为第m天的前φ天负荷量的平均值,所述
S28.计算目标天的前γ天负荷量的标准差,形成γ天负荷标准差序列△E:
△E=[△E1,△E2,…,△Em,…,△EM];
其中,△Em为第m天前γ天负荷量的标准差,所述
S29.分别对负荷量序列E、φ天负荷平均值序列AE和γ天负荷标准差序列△E进行归一化处理,得到如下表达式:
其中,μe,βe分别为负荷量序列E中所有M天数据的均值和方差;μAE,βAE分别为φ天负荷平均值序列AE中所有M天数据的均值和方差;μ△E,β△E分别为γ天负荷标准差序列△E中所有M天数据的均值和方差;
S210.生成如下形式的数据集x:
x={x1,x2,…,xm,…,xM};
其中,xm为数据集x的第m个数据向量;所述 为数据向量xm的第i个数据项,I为数据向量xm的维度。
进一步,步骤S21中,对于数据起点或数据终点的缺失数据,用所述缺失数据最近的数据作为所述缺失数据。
进一步,所述步骤S3,具体包括:
S31.统计目标特征,得到目标特征序列(λ1,λ2,…,λi…,λL);其中,λi为第i个目标特征,L为目标特征个数;
S32.从目标特征序列中选取特征λ1,计算数据集中所有数据向量关于特征λ1的中位数以中位数/>作为切分点对数据集进行切分,得到两个数据子集R1,R2;
S33.从目标特征序列中选取特征λ2,分别计算两个数据子集R1,R2所有数据向量关于特征λ2的中位数以中位数/>作为切分点对数据子集R1进行切分,得到两个数据子集R11,R12,以中位数/>作为切分点对数据子集R2进行切分,得到两个数据子集R21,R22;
S34.按照步骤S33类推,依次从目标特征序列中选取特征λi,分别计算上一步若干数据子集所有数据向量关于特征λi的中位数,以数据子集对应的中位数作为所述数据子集的切分点对所述数据子集进行切分,最终切分获得的数据子集的数量为2L个。
进一步,还包括步骤:
S35.从相邻数据子集中选择位于分界面边缘的数据与原数据子集共同构成扩展数据子集
S36.按照步骤S35类推,对所有相邻数据子集进行扩展处理,得到扩展数据子集的集合其中,所述N=2L。
进一步,步骤S4中,根据如下步骤训练径向基函数网络:
S41.确定径向基函数神经元的核函数θh(x):
其中,ch,σh分别为第h个径向基函数神经元的核函数中心和核函数宽度,所述ch=[ch,1,…,ch,I]T,||·||表示执行欧几里得范数运算;
S42.确定径向基函数网络的输出:
其中,wh为第h个径向基函数神经元的权值,w0为隐含层的偏置;
S43.计算径向基函数网络的输出与期望输出之间的误差ep:
其中,为第p个训练数据向量的期望输出;/>为第p个训练数据向量;I为径向基函数网络输入层中输入节点的个数,与数据向量的维度相同;
S44.利用训练数据集调整径向基函数神经元的权值、核函数中心以及核函数宽度,使得径向基函数网络的输出与期望输出之间的误差达到阈值范围,并将误差达到阈值范围时设置的权值、核函数中心以及核函数宽度作为径向基函数神经元的设定参数,完成径向基函数网络的训练。
进一步,步骤S44中,根据如下步骤调整径向基函数神经元的权值、核函数中心以及核函数宽度:
S441.将径向基函数网络中H个径向基函数神经元的权值向量w=[w0,w1,…,wH]、核函数中心c=[c1,…,ch,…,cH]和核函数宽度σ=[σ1,…,σh,…,σH]构成行向量Jp:
其中,h=1,2,…,H;i=1,2,…,I,
S442.确定H个径向基函数神经元的权值向量w、核函数中心c和核函数宽度σ的调整规则:
Δp+1=Δp-(Qp+μpI)-1gp;
其中,μp为组合系数;
进一步,根据如下公式从N个径向基函数网络中选取K个径向基函数网络:
其中,δK为K个径向基函数网络的集合;sn为第n个数据子集;S为数据子集的集合;xk为第k个数据向量;为测试数据向量;xp为训练数据向量;/>为/>与xp之间最小的欧氏距离。
本发明的有益效果是:本发明公开的一种基于特征工程和多路深度学习的电力负荷预测方法,通过利用用电信息采集系统采集的负荷数据序列和当地气象官网发布的气温数据序列构成原始数据集,并选择半小时负荷量、48点时间戳、星期、节假日、气温、7天负荷平均值和7天负荷标准差作为目标特征。在预测模型的训练阶段,首先采用K-D树算法将训练数据集切分为特征密度近似相同的N个数据子集,然后利用这N个数据子集独立并行训练N个RBFN,最后得到训练好的多路深度预测模型。在预测模型的预测阶段,首先由RBFN选择器采用K最近邻(KNN)算法选出K个执行预测的RBFN,然后利用这K个RBFN独立并行处理数据,得到K个预测输出结果,最后由输出组合器对这K个预测输出结果进行求和平均得到最终预测结果。
附图说明
下面结合附图和实施例对本发明作进一步描述:
图1为本发明的基于特征工程和多路深度学习的负荷预测模型示意图。
具体实施方式
以下结合说明书附图对本发明做出进一步的说明,如图所示:
本发明的基于特征工程和多路深度学习的电力负荷预测方法,包括如下步骤:
S1.采集电力负荷数据以及气温数据;其中,从用电信息采集系统提取来自智能电表计量的电力负荷数据,并从当地气象官网获取气温数据;
S2.设置目标特征,并依据目标特征对电力负荷数据以及气温数据进行处理,生成数据集;
S3.对数据集进行切分处理,得到N个数据子集;其中,所述数据集为训练数据集;
S4.将N个数据子集分别作为N个径向基函数网络的输入,对网络进行训练,得到N个训练后的径向基函数网络;其中,所述N个数据子集与N个径向基函数网络一一对应;
S5.采集测试数据;所述测试数据包括电力负荷数据以及气温数据;
S6.从N个径向基函数网络中选取K个径向基函数网络,并将测试数据分别输入到K个径向基函数网络,输出K个电力负荷预测结果,将K个电力负荷预测结果的求和平均值作为最终的电力负荷预测结果;其中,K≤N。
本实施例中,所述目标特征包括η小时负荷量、ε点时间戳、星期、节假日、气温、φ天负荷平均值以及γ天负荷标准差。其中,η取值为0.5,ε取值为48,φ取值为7,γ取值为7;通过设定48点时间戳可以获取以天为单位以半小时为采样时间间隔的负荷数据序列。
本实施例中,步骤S2中,依据目标特征对电力负荷数据以及气温数据进行处理,得到数据集,具体包括:
S21.若η小时负荷量存在数据缺失,则将缺失数据的前后两点数据的加权平均值作为所述缺失数据;也即是采用平滑处理法处理缺失数据:
其中,smooth(·)为平滑函数,若第m天第i个数据缺失,则用其前后2天数据点的几何平均填补该数据点。
S22.对η小时负荷量按照时间先后顺序排列形成负荷量序列E:
其中,为第m天的第i个时间戳的负荷量;M为采集的总天数;
S23.对ε点时间戳进行独热编码形成时间戳编码向量序列T:
其中,为第m天的第i个时间戳的时间戳编码向量,所述/>
S24.对星期进行独热编码形成星期编码向量序列B:
其中,为第n个星期周i的编码向量,所述/>
S25.对节假日进行独热编码形成节假日编码向量序列U:
U={u1,u2};
其中,u1,u2分别为是节假日和非节假日的编码向量,所述u1=[0,1]T,u2=[1,0]T;
S26.对气温数据按照时间顺序排列形成气温序列V:
V={v1,v2,…,vm,…};
其中,vm为第m天的气温数据;
S27.计算目标天的前7天负荷量的平均值,形成7天负荷平均值序列AE:
AE=[AE1,AE2,…,AEm,…,AEM];
其中,AEm为第m天的前7天负荷量的平均值,所述
S28.计算目标天的前7天负荷量的标准差,形成7天负荷标准差序列△E:
△E=[△E1,△E2,…,△Em,…,△EM];
其中,△Em为第m天前7天负荷量的标准差,所述
S29.分别对负荷量序列E、7天负荷平均值序列AE和7天负荷标准差序列△E进行数据归一化处理,得到如下式子:
其中,μe,βe分别为负荷量序列E中所有M天数据的均值和方差;μAE,βAE分别为7天负荷平均值序列AE中所有M天数据的均值和方差;μ△E,β△E分别为7天负荷标准差序列△E中所有M天数据的均值和方差;
S210.根据如下公式确定数据集x:
x={x1,x2,…,xm,…,xM};
其中,xm为数据集x的第m个数据向量;所述 为数据向量xm的第i个数据项,I为数据向量的维度。
本实施例中,步骤S21中,对于数据起点或数据终点的缺失数据,将与所述缺失数据最近的数据作为所述缺失数据。其中,由于无法填补位于数据集起点或终点的缺失数据,则采用最近数据点作为缺失数据点,即终点数据/>和起点数据/>M为数据集大小。
本实施例中,增加RBF神经元数量或隐含层层数虽然可以改善分离曲面的平滑度,提升RBFN的性能,但随着RBF神经元数量的增加,计算核函数耗时且占用内存资源。而K-D树算法不仅可以将大的训练数据集切分为多个小的数据子集,还可以避免出现零数据子集,保证每个数据子集的特征密度基本一致。K-D树算法利用每个目标特征的中位数将训练数据集切分为两个特征密度近似相等的数据子集。其中,训练数据集的特征密度是指在训练数据集中某类样本数量与所有样本数量之比;RBF(radial basis function)为径向基函数,RBFN(radial basis function network)为径向基函数网络。
所述步骤S3,具体包括:
S31.统计目标特征,得到目标特征序列(λ1,λ2,…,λi…,λL);其中,λi为第i个目标特征,L为目标特征的个数;所述目标特征共有7个,则L=7;
S32.从目标特征序列中选取特征λ1,计算数据集中所有数据向量关于特征λ1的中位数以中位数/>作为切分点对数据集进行切分,得到两个数据子集R1,R2;
S33.从目标特征序列中选取特征λ2,分别计算两个数据子集R1,R2所有数据向量关于特征λ2的中位数以中位数/>作为切分点对数据子集R1进行切分,得到两个数据子集R11,R12,以中位数/>作为切分点对数据子集R2进行切分,得到两个数据子集R21,R22;
S34.按照步骤S33类推,依次从目标特征序列中选取特征λi,分别计算上一步若干数据子集所有数据向量关于特征λi的中位数,以数据子集对应的中位数作为所述数据子集的切分点对所述数据子集进行切分,最终切分获得的数据子集的数量为2L个。其中,针对每个特征的切分操作都会成倍增加数据子集数量,对具有ξ=7个特征的训练数据集,切分获得的数据子集数量为N=27=128,每个数据子集都是以中位数为分界面,其特征密度近似相等。
本实施例中,还包括步骤:
S35.从相邻数据子集中选择位于分界面边缘的数据与原数据子集共同构成扩展数据子集通过生成扩展数据子集,增加数据子集的规模,提升RBFN的泛化能力;
S36.按照步骤S35类推,对所有相邻数据子集进行扩展处理,得到扩展数据子集的集合其中,所述N=2L。其中,利用N个扩展数据子集并行独立训练N个RBFN,最后得到训练好的多路深度预测模型。
本实施例中,径向基函数网络(RBFN)模型结构由输入层、隐含层和输出层三层构成。其中,输入层有I个输入节点,记为x=[x1,…,xI]T,隐含层有H个RBF神经元,记为θ=[θ1,…,θH],输出层有1个输出单元y。
步骤S4中,根据如下步骤对径向基函数网络进行训练:
S41.径向基函数神经元h=1,…,H均采用核函数θh(x):
其中,ch,σh分别为第h个径向基函数神经元的核函数中心和核函数宽度,所述ch=[ch,1,…,ch,I]T,||·||表示执行欧几里得范数运算;
S42.确定径向基函数网络的输出:
其中,wh为第h个径向基函数神经元的权值,w0为隐含层的偏置;上述式子表明,输出方程是一个线性函数,该函数将隐含层的所有输出加权求和作为RBFN的输出。
S43.RBFN利用训练数据集进行离线训练,P为训练数据集中训练数据向量的数量,则计算径向基函数网络的输出与期望输出之间的误差ep:
其中,为第p个训练数据向量的期望输出;/>为第p个训练数据向量;I为径向基函数网络输入层中输入节点的个数;
S44.利用训练数据集调整径向基函数神经元的权值、核函数中心以及核函数宽度,使得径向基函数网络的输出与期望输出之间的误差达到阈值范围,并将误差达到阈值范围时设置的权值、核函数中心以及核函数宽度作为径向基函数神经元的设定参数。其中,所述阈值范围可根据实际工况进行设置。
本实施例中,步骤S44中,在离线训练阶段,采用改进的LM算法调整径向基函数神经元的权值、核函数中心以及核函数宽度:
S441.将径向基函数网络中H个径向基函数神经元的权值向量w=[w0,w1,…,wH]、核函数中心c=[c1,…,ch,…,cH]和核函数宽度σ=[σ1,…,σh,…,σH]构成Jacobian行向量Jp:
其中,h=1,2,…,H;i=1,2,…,I,
S442.确定H个径向基函数神经元的权值向量w、核函数中心c和核函数宽度σ的调整规则:
Δp+1=Δp-(Qp+μpI)-1gp;
其中,μp为组合系数,所述μp=0.01;
利用训练数据集通过上述离线训练即可获得隐含层RBF神经元的参数{w,c,σ}。
本实施例中,步骤S6中,利用训练好的径向基函数网络执行短期负荷预测:
当测试数据向量到达时,RBFN选择器采用KNN算法计算测试数据向量与训练数据集各个数据向量x=[x1,…xp,…,xP]之间的欧氏距离,从训练数据集中选择K个最小欧氏距离的最近数据点,这些最近点分别属于K个数据子集。最小欧氏距离的计算如下:
其中,dK={d1,d2,…,dK},dk是测试数据向量与训练数据集x=[x1,…xp,…,xP]之间的第k个最小欧氏距离,/>分别是/>的第i个数据点。
通过基于K个最近点选择归属的K个数据子集对应的RBFN,其余N-K个RBFN不用,也就是根据如下公式从N个径向基函数网络中选取K个径向基函数网络:
其中,δK为K个径向基函数网络的集合;sn为第n个数据子集;S为数据子集的集合;xk为第k个数据向量;为待测数据向量;xp为网络训练过的数据向量;/>为/>与xp之间最小的欧氏距离。
将测试数据向量作为选择的K个RBFN的输入,由各个RBFN独立并行处理,产生K个输出/>第k个RBFN的输出结果为/>
其中,δk为由第k个数据子集训练的RBFN。
最后输出组合器对所有K个输出结果求和平均获得最终预测结果
为了能更好地理解本发明,下面对本发明进行举例验证:
利用2015年至2019年某地区用电信息采集系统采集的负荷数据序列和当地气象官网发布的气温数据序列构成原始数据集,选择半小时负荷量、48点时间戳、星期、节假日、气温、7天负荷平均值和7天负荷标准差等7个参数作为数据集特征。分别针对各类数据集特征,对原始数据集的数据进行补缺、归一化和编码处理后形成训练和测试数据集,其中,数据集的80%用于训练,20%用于测试。
采用平均绝对百分比误差(mean absolute percent error,MAPE)作为多路深度预测模型的评价指标,定义为:
其中,分别表示第i个测试数据向量的实际输出和预测输出,n为用于统计预测结果的数量。
数据集中数据向量维度分析:就数据向量而言,/>的维度分别为1和48,一天有48个数据点,i=1,…,48,共计25×48=1200;(bn)T的维度为7,的维度为2,/>的维度均为1,数据向量/>的维度为1212,意味着RBFN输入层的输入节点I=1212。
如前所述,增加RBF神经元数量虽然可以改善分离曲面的平滑度,提升RBFN的性能,但随着RBF神经元数量的增加,计算核函数耗时增加且占用内存资源。为此,RBF神经元设置应折中考虑。本实施例设置H=50。
选择半小时负荷量、48点时间戳、星期、节假日、气温、7天负荷平均值和7天负荷标准差作为目标特征,L=7,N=27=128,意味着K-D树算法将训练数据集切分为128个数据子集,多路深度预测模型的RBFN数量也是128个。
表1为采用本发明的电力负荷预测方法对两年负荷预测的MAPE,由此可知,只要合理划分数据子集,都能获得优异的MAPE性能。
表1
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (9)
1.一种基于特征工程和多路深度学习的电力负荷预测方法,其特征在于:包括如下步骤:
S1.采集电力负荷数据以及气温数据;
S2.设置目标特征,并依据目标特征对电力负荷数据以及气温数据进行处理,生成数据集;
S3.基于目标特征对数据集进行切分,得到N个数据子集;
S4.将N个数据子集分别作为N个径向基函数网络的输入,对网络进行训练,得到N个训练后的径向基函数网络;其中,所述N个数据子集与N个径向基函数网络一一对应;
S5.采集测试数据;所述测试数据包括电力负荷数据以及气温数据;
S6.从N个已训练的径向基函数网络中选取K个径向基函数网络,并将测试数据分别输入到K个径向基函数网络,输出K个电力负荷预测结果,将K个电力负荷预测结果的求和平均值作为最终的电力负荷预测结果。
2.根据权利要求1所述的基于特征工程和多路深度学习的电力负荷预测方法,其特征在于:所述目标特征包括η小时负荷量、ε点时间戳、星期、节假日、气温、φ天负荷平均值以及γ天负荷标准差。
3.根据权利要求2所述的基于特征工程和多路深度学习的电力负荷预测方法,其特征在于:步骤S2中,依据目标特征对电力负荷数据以及气温数据进行处理,生成数据集,具体包括:
S21.若η小时负荷量存在数据缺失,则将缺失数据的前后两点数据的加权平均值作为所述缺失数据;
S22.对η小时负荷量按照时间先后顺序排列形成负荷量序列E:
其中,为第m天的第i个时间戳的负荷量;M为采集的总天数;
S23.对ε点时间戳进行独热编码形成时间戳编码向量序列T:
其中,为第m天的第i个时间戳的时间戳编码向量,所述/>
S24.对星期进行独热编码形成星期编码向量序列B:
其中,为第n个星期周i的星期编码向量,所述/>
S25.对节假日进行独热编码形成节假日编码向量序列U:
U={u1,u2};
其中,u1,u2分别为是节假日和非节假日的编码向量,所述u1=[0,1]T,u2=[1,0]T;
S26.对气温数据按照时间顺序排列形成气温序列V:
V={v1,v2,…,vm,…};
其中,vm为第m天的气温数据;
S27.计算目标天的前φ天负荷量的平均值,形成φ天负荷平均值序列AE:
AE=[AE1,AE2,…,AEm,…,AEM];
其中,AEm为第m天的前φ天负荷量的平均值,所述
S28.计算目标天的前γ天负荷量的标准差,形成γ天负荷标准差序列△E:
△E=[△E1,△E2,…,△Em,…,△EM];
其中,△Em为第m天前γ天负荷量的标准差,所述
S29.分别对负荷量序列E、φ天负荷平均值序列AE和γ天负荷标准差序列△E进行归一化处理,得到如下表达式:
其中,μe,βe分别为负荷量序列E中所有M天数据的均值和方差;μAE,βAE分别为φ天负荷平均值序列AE中所有M天数据的均值和方差;μ△E,β△E分别为γ天负荷标准差序列△E中所有M天数据的均值和方差;
S210.生成如下形式的数据集x:
x={x1,x2,…,xm,…,xM};
其中,xm为数据集x的第m个数据向量;所述 为数据向量xm的第i个数据项,I为数据向量xm的维度。
4.根据权利要求3所述的基于特征工程和多路深度学习的电力负荷预测方法,其特征在于:步骤S21中,对于数据起点或数据终点的缺失数据,用所述缺失数据最近的数据作为所述缺失数据。
5.根据权利要求1所述的基于特征工程和多路深度学习的电力负荷预测方法,其特征在于:所述步骤S3,具体包括:
S31.统计目标特征,得到目标特征序列(λ1,λ2,…,λi…,λL);其中,λi为第i个目标特征,L为目标特征个数;
S32.从目标特征序列中选取特征λ1,计算数据集中所有数据向量关于特征λ1的中位数以中位数/>作为切分点对数据集进行切分,得到两个数据子集R1,R2;
S33.从目标特征序列中选取特征λ2,分别计算两个数据子集R1,R2所有数据向量关于特征λ2的中位数以中位数/>作为切分点对数据子集R1进行切分,得到两个数据子集R11,R12,以中位数/>作为切分点对数据子集R2进行切分,得到两个数据子集R21,R22;
S34.按照步骤S33类推,依次从目标特征序列中选取特征λi,分别计算上一步若干数据子集所有数据向量关于特征λi的中位数,以数据子集对应的中位数作为所述数据子集的切分点对所述数据子集进行切分,最终切分获得的数据子集的数量为2L个。
6.根据权利要求5所述的基于特征工程和多路深度学习的电力负荷预测方法,其特征在于:还包括步骤:
S35.从相邻数据子集中选择位于分界面边缘的数据与原数据子集共同构成扩展数据子集
S36.按照步骤S35类推,对所有相邻数据子集进行扩展处理,得到扩展数据子集的集合其中,所述N=2L。
7.根据权利要求1所述的基于特征工程和多路深度学习的电力负荷预测方法,其特征在于:步骤S4中,根据如下步骤训练径向基函数网络:
S41.确定径向基函数神经元的核函数θh(x):
其中,ch,σh分别为第h个径向基函数神经元的核函数中心和核函数宽度,所述ch=[ch,1,…,ch,I]T,||·||表示执行欧几里得范数运算;
S42.确定径向基函数网络的输出:
其中,wh为第h个径向基函数神经元的权值,w0为隐含层的偏置;
S43.计算径向基函数网络的输出与期望输出之间的误差ep:
其中,为第p个训练数据向量的期望输出;/>为第p个训练数据向量;I为径向基函数网络输入层中输入节点的个数,与数据向量的维度相同;
S44.利用训练数据集调整径向基函数神经元的权值、核函数中心以及核函数宽度,使得径向基函数网络的输出与期望输出之间的误差达到阈值范围,并将误差达到阈值范围时设置的权值、核函数中心以及核函数宽度作为径向基函数神经元的设定参数,完成径向基函数网络的训练。
8.根据权利要求7所述的基于特征工程和多路深度学习的电力负荷预测方法,其特征在于:步骤S44中,根据如下步骤调整径向基函数神经元的权值、核函数中心以及核函数宽度:
S441.将径向基函数网络中H个径向基函数神经元的权值向量w=[w0,w1,…,wH]、核函数中心c=[c1,…,ch,…,cH]和核函数宽度σ=[σ1,…,σh,…,σH]构成行向量Jp:
其中,h=1,2,…,H;i=1,2,…,I,
S442.确定H个径向基函数神经元的权值向量w、核函数中心c和核函数宽度σ的调整规则:
Δp+1=Δp-(Qp+μpI)-1gp;
其中,μp为组合系数;
9.根据权利要求1所述的基于特征工程和多路深度学习的电力负荷预测方法,其特征在于:根据如下公式从N个径向基函数网络中选取K个径向基函数网络:
其中,δK为K个径向基函数网络的集合;sn为第n个数据子集;S为数据子集的集合;xk为第k个数据向量;为测试数据向量;xp为训练数据向量;/>为/>与xp之间最小的欧氏距离。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111007838.XA CN113657687B (zh) | 2021-08-30 | 2021-08-30 | 基于特征工程和多路深度学习的电力负荷预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111007838.XA CN113657687B (zh) | 2021-08-30 | 2021-08-30 | 基于特征工程和多路深度学习的电力负荷预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113657687A CN113657687A (zh) | 2021-11-16 |
CN113657687B true CN113657687B (zh) | 2023-09-29 |
Family
ID=78482427
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111007838.XA Active CN113657687B (zh) | 2021-08-30 | 2021-08-30 | 基于特征工程和多路深度学习的电力负荷预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113657687B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115478574B (zh) * | 2022-10-31 | 2024-03-19 | 吉林大学 | 一种基于径向基函数神经网络的挖掘机负载预测方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105305426A (zh) * | 2015-10-20 | 2016-02-03 | 国网山东省电力公司菏泽供电公司 | 基于偏差控制机制的Mapreduce化两步法短期负荷预测方法 |
JP2016099738A (ja) * | 2014-11-19 | 2016-05-30 | 国立大学法人静岡大学 | 予測システム、予測方法、および予測プログラム |
CN105787126A (zh) * | 2016-03-29 | 2016-07-20 | Tcl集团股份有限公司 | k-d树生成方法和k-d树生成装置 |
CN107730041A (zh) * | 2017-10-12 | 2018-02-23 | 东华大学 | 基于改进的遗传小波神经网络的短期电力负荷预测方法 |
CN108734355A (zh) * | 2018-05-24 | 2018-11-02 | 国网福建省电力有限公司 | 一种应用于电能质量综合治理场景的短期电力负荷并行预测方法及系统 |
CN109255485A (zh) * | 2018-09-13 | 2019-01-22 | 中国地质调查局南京地质调查中心 | 基于rbfn机器学习的降雨型地质灾害预警预报模型及学习方法 |
CN110534101A (zh) * | 2019-08-27 | 2019-12-03 | 华中师范大学 | 一种基于多模融合深度特征的移动设备源识别方法及系统 |
CN112215426A (zh) * | 2020-10-16 | 2021-01-12 | 国网山东省电力公司信息通信公司 | 一种短期用电负荷预测方法 |
CN113052313A (zh) * | 2021-04-27 | 2021-06-29 | 北京航空航天大学 | 一种海量交通数据知识挖掘与并行处理方法 |
-
2021
- 2021-08-30 CN CN202111007838.XA patent/CN113657687B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016099738A (ja) * | 2014-11-19 | 2016-05-30 | 国立大学法人静岡大学 | 予測システム、予測方法、および予測プログラム |
CN105305426A (zh) * | 2015-10-20 | 2016-02-03 | 国网山东省电力公司菏泽供电公司 | 基于偏差控制机制的Mapreduce化两步法短期负荷预测方法 |
CN105787126A (zh) * | 2016-03-29 | 2016-07-20 | Tcl集团股份有限公司 | k-d树生成方法和k-d树生成装置 |
CN107730041A (zh) * | 2017-10-12 | 2018-02-23 | 东华大学 | 基于改进的遗传小波神经网络的短期电力负荷预测方法 |
CN108734355A (zh) * | 2018-05-24 | 2018-11-02 | 国网福建省电力有限公司 | 一种应用于电能质量综合治理场景的短期电力负荷并行预测方法及系统 |
CN109255485A (zh) * | 2018-09-13 | 2019-01-22 | 中国地质调查局南京地质调查中心 | 基于rbfn机器学习的降雨型地质灾害预警预报模型及学习方法 |
CN110534101A (zh) * | 2019-08-27 | 2019-12-03 | 华中师范大学 | 一种基于多模融合深度特征的移动设备源识别方法及系统 |
CN112215426A (zh) * | 2020-10-16 | 2021-01-12 | 国网山东省电力公司信息通信公司 | 一种短期用电负荷预测方法 |
CN113052313A (zh) * | 2021-04-27 | 2021-06-29 | 北京航空航天大学 | 一种海量交通数据知识挖掘与并行处理方法 |
Non-Patent Citations (1)
Title |
---|
基于改进遗传算法优化极限学习机的短期电力负荷预测;律方成;刘怡;亓彦;燕跃豪;张建涛;谢庆;;华北电力大学学报(自然科学版)(06);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113657687A (zh) | 2021-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mahmoud et al. | An advanced approach for optimal wind power generation prediction intervals by using self-adaptive evolutionary extreme learning machine | |
CN111199016B (zh) | 一种基于DTW的改进K-means的日负荷曲线聚类方法 | |
Tang et al. | Solar power generation forecasting with a LASSO-based approach | |
CN112564098B (zh) | 基于时间卷积神经网络的高比例光伏配电网电压预测方法 | |
CN112149879A (zh) | 一种计及宏观波动性分类的新能源中长期电量预测方法 | |
Xiao et al. | Online sequential extreme learning machine algorithm for better predispatch electricity price forecasting grids | |
CN112329990A (zh) | 一种基于lstm-bp神经网络的用户用电负荷预测方法 | |
CN114462718A (zh) | 基于时间滑动窗口的cnn-gru风电功率预测方法 | |
CN114897129A (zh) | 一种基于日相似聚类与Kmeans-GRA-LSTM的光伏电站短期功率预测方法 | |
CN113657687B (zh) | 基于特征工程和多路深度学习的电力负荷预测方法 | |
CN116014722A (zh) | 基于季节分解和卷积网络的次日光伏发电预测方法及系统 | |
CN114117852B (zh) | 一种基于有限差分工作域划分的区域热负荷滚动预测方法 | |
Aishwarya et al. | Prediction of time series data using GA-BPNN based hybrid ANN model | |
Mohamed et al. | Application of machine learning for prediction of solar microgrid system | |
Choudhary et al. | Soft computing applications in wind speed and power prediction for wind energy | |
Chen et al. | Ensemble methods for solar power forecasting | |
CN115907228A (zh) | 一种基于pso-lssvm的短期电力负荷预测分析方法 | |
CN116227677A (zh) | 一种考虑光伏功率爬坡特征的功率预测校正方法 | |
CN113393119B (zh) | 基于场景缩减-深度学习的梯级水电短期调度决策方法 | |
CN115496153A (zh) | 多头自注意力的深度卷积嵌入聚类风光荷联合场景方法 | |
Choudhary et al. | Estimation of wind power using different soft computing methods | |
Kartini et al. | Very short term load forecasting based on meteorological with modelling k-NN-feed forward neural network | |
Chen et al. | Short-term wind power forecasting based on spatial correlation and artificial neural network | |
Mitrentsis et al. | Open Source Tool for Probabilistic Short-Term PV and Wind Power Forecasting | |
Liu et al. | Ultra-short-term wind power forecasting based on stacking model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |