CN111861013B - 一种电力负荷预测方法及装置 - Google Patents
一种电力负荷预测方法及装置 Download PDFInfo
- Publication number
- CN111861013B CN111861013B CN202010717557.2A CN202010717557A CN111861013B CN 111861013 B CN111861013 B CN 111861013B CN 202010717557 A CN202010717557 A CN 202010717557A CN 111861013 B CN111861013 B CN 111861013B
- Authority
- CN
- China
- Prior art keywords
- data
- neural network
- updated
- group
- inferior
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000013528 artificial neural network Methods 0.000 claims abstract description 88
- 238000012549 training Methods 0.000 claims abstract description 77
- 238000012360 testing method Methods 0.000 claims abstract description 70
- 239000013598 vector Substances 0.000 claims abstract description 40
- 230000035772 mutation Effects 0.000 claims description 44
- 239000011159 matrix material Substances 0.000 claims description 36
- 230000006870 function Effects 0.000 claims description 25
- 238000011478 gradient descent method Methods 0.000 claims description 25
- 238000003062 neural network model Methods 0.000 claims description 24
- 210000002569 neuron Anatomy 0.000 claims description 21
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000005070 sampling Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 230000001186 cumulative effect Effects 0.000 claims description 6
- 230000002068 genetic effect Effects 0.000 description 10
- 230000007787 long-term memory Effects 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 6
- 230000006403 short-term memory Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000000306 recurrent effect Effects 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 206010010356 Congenital anomaly Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013100 final test Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Marketing (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Primary Health Care (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Physiology (AREA)
- Genetics & Genomics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种电力负荷预测方法及装置,所述方法包括:将原始数据集输入BP神经网络,遍历搜索获取缺失数据的位置,输出缺失数据值,进行缺失数据填充,获取完整数据集;对完整数据集进行参数寻优,输出最优超参数生成最优超参数向量;利用最优超参数向量构建LSTM神经网络,输入训练数据对LSTM神经网络进行训练得到LSTM模型;输入测试数据,对LSTM模型进行测试;向测试通过的LSTM模型输入特征值,进行电力负荷预测,其中,特征值包括气温、湿度、风速、历史数据以及预测时间点;本发明的优点在于:减少时间和资源,提高预测精度和真实性。
Description
技术领域
本发明涉及电力负荷预测领域,更具体涉及一种电力负荷预测方法及装置。
背景技术
在电力系统中,电网发电与用电之间存在着同时性。故电网管理调度部门需要提前做好发电预案。因此,电力负荷预测就成为电网调度部门的重要研究课题。短期负荷预测(Short Term Load Forecasting,STLF)的准确性直接关系到电力公司的运营成本。电力负荷的变化具有随机性,但在整体上又呈现一定的规律性。因此有越来越多的学者将更加智能的非线性模型应用于短期负荷预测中。如:长短期记忆人工神经网络(LSTM)。
LSTM属于循环神经网络(RNN)的一种特殊形式。RNN是一类用于处理序列数据的神经网络,序列数据指某变量随着另一个变量变化而变化的一类数据,且该类数据存在严格的顺序关系,即后面的数据与前面的数据相关。如时序数据就是典型的序列数据,在不同时间点上收集到的数据,这类数据反映了某一事物、现象等随时间的变化状态或程度。LSTM在细胞单元中增加了“遗忘门”的机制,它是一个能够判断历史信息是否值得继续保留的“判别器”。因此长短期记忆人工神经网络能够更好地处理长距离依赖问题。LSTM单元结构图如图1所示,其中σ为一个全连接层,激活函数为sigmoid函数。tanh也是一种激活函数,Ct表示经过当前时间点更新后的长期记忆。Ct-1表示经过上一个时间点更新的长期记忆。ht-1表示上一个时间点的输出,ht表示当前时间点的输出。
针对电力负荷预测,现有技术公开了以下方案:
【方案一】电网技术第43卷第6期《基于深度长短时记忆网络的区域级超短期负荷预测方法》:
该方法使用遗传算法优化LSTM权重参数的训练初值,LSTM单元权重值矩阵W=[Wix,Wih,Wfx,Wfh,Wcx,Wch,Wox,Woh,Wyh]。由于在神经网络训练过程中,网络权重参数初值的选定将在一定程度上影响模型的运行性能。因此作者提出了遗传算法与LSTM网络相结合的电力负荷预测方法:
①随机生成N个互不相同的权重值矩阵W,组成一个种群。
②计算种群中每个个体的适应度fiti。使用固定的实验数据加入模型进行实验,不同的个体代表了不同的权重初值,以实验最终的测试结果的平均绝对误差百分比来表示适应度,数值越低则表示适应程度越高:
③将适应程度高于某一阈值的个体组成一个新的种群,并进行交叉互换操作。
④以一定的概率在新的种群中选取若干个体进行变异操作,即对某个个体中的权值进行随机的修改,并以新个体的身份加入该种群。
⑤重复②到④直到适应度达到了实验预设要求。
⑥输出完成优化的权重值参数,并用这些参数作为初值训练LSTM神经网络进行实际的电力负荷预测工作。
【方案二】外文文献《Integrating Long Short-Term Memory and GeneticAlgorithm for Short-Term Load Forecasting》:
该文献介绍了LSTM网络模型具有记忆结构,可以很好地反映负荷数据在时间顺序上的联系。确定模型的输入输出变量,对输入输出数据集分别进行预处理,并将预处理后的数据集划分成为训练集、验证集以及测试集3个部分。构造深度LSTM负荷预测模型,利用训练集对模型进行训练,验证集判断模型在训练过程中的泛化能力,测试集判断模型对于未知数据的预测性能。寻找合适的超参数直到测试集预测误差达到最小。
但是现有技术存在以下缺点:
(1)在传统遗传算法中,变异操作的随机性往往导致了算法的不稳定。虽然变异操作在有些时候可以更快找到最优解,但同时增加了产生更劣等个体的可能性。因此算法即便经历了若干次交叉互换和变异,可能仍难以得到令人满意的结果,并且耗费了大量时间和资源。
(2)在现有电力负荷预测研究工作中,用于训练网络模型的原始数据,往往会出现数据缺失的意外情况。然而存在数据缺失的数据集不能直接用于模型的训练,否则将影响实验的精度和真实性。现有电力负荷预测方法对于数据缺失的情况没有阐述详细的应对方法。
发明内容
本发明所要解决的技术问题在于现有技术电力负荷预测方法存在耗费大量时间和资源以及预测精度和真实性不高的问题。
本发明通过以下技术手段实现解决上述技术问题的:一种电力负荷预测方法,所述方法包括:
步骤一:将原始数据集输入BP神经网络,遍历搜索获取缺失数据的位置,使用BP神经网络以缺失数据点前后3个时间点的负荷数据作为输入特征,输出缺失数据值,进行缺失数据填充,获取完整数据集;
步骤二:对完整数据集进行参数寻优,输出最优超参数生成最优超参数向量;
步骤三:利用最优超参数向量构建LSTM神经网络,输入训练数据对LSTM神经网络进行训练得到LSTM模型;
步骤四:输入测试数据,对LSTM模型进行测试;
步骤五:向测试通过的LSTM模型输入特征值,进行电力负荷预测,其中,特征值包括气温、湿度、风速、历史数据以及预测时间点。
本发明对原始数据集输入BP神经网络,遍历搜索获取缺失数据的位置,进行缺失数据填充,获取完整数据集,避免数据缺失导致模型训练不准,预测精度和真实性较高,同时,本发明避免在若干次交叉和变异操作后仍找不到最优解,对完整数据集进行参数寻优,输出最优超参数生成最优超参数向量,避免浪费时间和资源。
进一步地,所述步骤一包括:
步骤101:构建BP神经网络,其中,输入层为6个神经元,中间层为13个神经元,输出层为1个神经元,激活函数使用sigmoid函数;
步骤102:遍历搜索法搜索读取原始数据表中的一个数据单元,判断该单元是否缺失,若为缺失单元则将单元位置信息存入LocalInfor矩阵,若不是缺失单元则读取下一个数据单元,直到遍历完原始数据表,最后输出LocalInfor矩阵;
步骤103:在原始数据表中选取S个完整的、连续的、长度为7个采样点的数据序列{Li,Li+1,Li+2,Li+3,Li+4,Li+5,Li+6}作为S组标签数据,每组标签数据分为两组,一组为输入特征序列{Li、Li+1、Li+2、Li+4、Li+5、Li+6},另一组为标准输出Li+3,将S组标签数据按照7:3的比例随机划分为训练集和测试集;
步骤104:使用梯度下降法利用训练集对BP神经网络进行训练,训练学习率设置为0.1,训练收敛精度设置为0.002,测试精度设置为0.002,最终输出训练收敛的BP神经网络模型,并利用测试集对BP神经网络模型进行测试;
步骤105:初始化计数变量q=1,读取LocalInfor矩阵的第q行,得到缺失数据的行序列号LocalInforq1和列序列号LocalInforq2,以缺失数据位置的前、后3个采样点数据为输入特征序列输入测试完成的BP神经网络模型,将BP神经网络模型输出结果写入原始数据表中第LocalInforq1行、第LocalInforq2列,计数变量q自增1,重复上述过程直到遍历完LocalInfor矩阵;
步骤106:输出填补缺失数据以后的完整数据集。
进一步地,所述步骤二包括:
步骤201:对完整数据集用随机数初始化得到初始种群集合M={M1,M2,…,M10000}、初始优良组集合、初始劣等组集合,其中,Mi为种群中第i个个体;
步骤202:使用初始种群集合M中的每个个体对应的超参数构建初始LSTM神经网络,配合一组固定的输入数据对初始LSTM神经网络进行训练和测试,通过公式获取第i个个体的适应度,其中,K为测试样本的总数,j表示单个测试样本的编号,yj表示初始LSTM神经网络输出值,y′j表示样本标准值;
步骤203:更新初始优良组集合和初始劣等组集合并使用随机梯度下降法求解更新后的优良组集合的类中心以及更新后的劣等组集合的类中心;
步骤204:判断更新后的优良组集合是否满足收敛条件,若满足则输出最优超参数向量,若不满足则进入步骤205;
步骤205:对更新后的优良组集合进行随机交叉互换操作,将经随机交叉互换操作后的劣等组集合的类中心存储于类中心存储矩阵Store=[BC1,BC2,…,BCm],其中,m为累计迭代数,BCm为第m次迭代的劣等组集合的类中心,将经随机交叉互换操作后的优良组集合的类中心以及经随机交叉互换操作后的劣等组集合的类中心之间的欧式距离定义为优劣绝对距离,并存储于矩阵AbDist=[d1,d2,…,dm],dm为第m次迭代的优劣绝对距离;
步骤206:对更新后的优良组集合进行随机交叉互换操作后继续进行条件变异,每次变异时变异计数变量Count自增1,变异计数变量的值达到阈值时,停止变异,将最终经变异得到的优良组集合作为初始种群集合返回步骤202。
更进一步地,所述步骤202包括:将超参数编码成向量I=[ILR,ILU,ILY,ITS,IBS,IDT],一组超参数对应一种结构的LSTM神经网络,每个向量I即为一个个体,互不相同的向量I组成的集合为种群,其中,每个个体对应的超参数包括学习率ILR、隐层单元数量ILU、隐层数量ILY、时间步长ITS、每次训练的批次大小IBS以及正则化丢弃概率IDT。
更进一步地,所述步骤203包括:选取初始种群集合M中适应度的值排序前20%的个体归为更新后的优良组集合A{A1,A2,…,An},An为集合A中第n个个体;选取初始种群集合M中适应度的值排序后20%的个体归为更新后的劣等组集合B{B1,B2,…,Bm},Bm为集合B中第m个个体,使用随机梯度下降法求解更新后的优良组集合的类中心Ac及更新后的劣等组集合的类中心Bc,随机梯度下降法的损失函数为其中,L(Ak,AC)表示点AC与集合A中所有个体A1,A2,…,An欧式距离求和,当L(Ak,AC)取得最小值时的点AC即为更新后的优良组集合A的类中心,Ak为更新后的优良组集合中第K个个体,l为个体中第l个超参数,更新后的劣等组B的类中心Bc计算方法与更新后的优良组的类中心Ac计算方法相同。
更进一步地,所述步骤204中收敛条件为:更新后的优良组集合A中适应度的值大于预设值的个体的数量超过更新后的优良组集合A中个体总数的50%,其中,预设值为99.2%。
更进一步地,所述步骤206中条件变异必须满足的条件为:
条件一:新个体A′k与当前优良组集合的类中心的欧式距离不能大于对应优劣绝对距离的2/3;
条件二:新个体A′k与所有劣等组集合的类中心的欧氏距离不能小于对应优劣绝对距离的一半;
其中,第Count次变异的条件表达式为
本发明还提供一种电力负荷预测装置,所述装置包括:
缺失数据处理模块,用于将原始数据集输入BP神经网络,遍历搜索获取缺失数据的位置,使用BP神经网络以缺失数据点前后3个时间点的负荷数据作为输入特征,输出缺失数据值,进行缺失数据填充,获取完整数据集;
参数寻优模块,用于对完整数据集进行参数寻优,输出最优超参数生成最优超参数向量;
模型训练模块,用于利用最优超参数向量构建LSTM神经网络,输入训练数据对LSTM神经网络进行训练得到LSTM模型;
测试模块,用于输入测试数据,对LSTM模型进行测试;
预测模块,用于向测试通过的LSTM模型输入特征值,进行电力负荷预测,其中,特征值包括气温、湿度、风速、历史数据以及预测时间点。
进一步地,所述缺失数据处理模块还用于:
步骤101:构建BP神经网络,其中,输入层为6个神经元,中间层为13个神经元,输出层为1个神经元,激活函数使用sigmoid函数;
步骤102:遍历搜索法搜索读取原始数据表中的一个数据单元,判断该单元是否缺失,若为缺失单元则将单元位置信息存入LocalInfor矩阵,若不是缺失单元则读取下一个数据单元,直到遍历完原始数据表,最后输出LocalInfor矩阵;
步骤103:在原始数据表中选取S个完整的、连续的、长度为7个采样点的数据序列{Li,Li+1,Li+2,Li+3,Li+4,Li+5,Li+6}作为S组标签数据,每组标签数据分为两组,一组为输入特征序列{Li、Li+1、Li+2、Li+4、Li+5、Li+6},另一组为标准输出Li+3,将S组标签数据按照7:3的比例随机划分为训练集和测试集;
步骤104:使用梯度下降法利用训练集对BP神经网络进行训练,训练学习率设置为0.1,训练收敛精度设置为0.002,测试精度设置为0.002,最终输出训练收敛的BP神经网络模型,并利用测试集对BP神经网络模型进行测试;
步骤105:初始化计数变量q=1,读取LocalInfor矩阵的第q行,得到缺失数据的行序列号LocalInforq1和列序列号LocalInforq2,以缺失数据位置的前、后3个采样点数据为输入特征序列输入测试完成的BP神经网络模型,将BP神经网络模型输出结果写入原始数据表中第LocalInforq1行、第LocalInforq2列,计数变量q自增1,重复上述过程直到遍历完LocalInfor矩阵;
步骤106:输出填补缺失数据以后的完整数据集。
进一步地,所述参数寻优模块还用于:
步骤201:对完整数据集用随机数初始化得到初始种群集合M={M1,M2,…,M10000}、初始优良组集合、初始劣等组集合,其中,Mi为种群中第i个个体;
步骤202:使用初始种群集合M中的每个个体对应的超参数构建初始LSTM神经网络,配合一组固定的输入数据对初始LSTM神经网络进行训练和测试,通过公式获取第i个个体的适应度,其中,K为测试样本的总数,j表示单个测试样本的编号,yj表示初始LSTM神经网络输出值,yj′表示样本标准值;
步骤203:更新初始优良组集合和初始劣等组集合并使用随机梯度下降法求解更新后的优良组集合的类中心以及更新后的劣等组集合的类中心;
步骤204:判断更新后的优良组集合是否满足收敛条件,若满足则输出最优超参数向量,若不满足则进入步骤205;
步骤205:对更新后的优良组集合进行随机交叉互换操作,将经随机交叉互换操作后的劣等组集合的类中心存储于类中心存储矩阵Store=[BC1,BC2,…,BCm],其中,m为累计迭代数,BCm为第m次迭代的劣等组集合的类中心,将经随机交叉互换操作后的优良组集合的类中心以及经随机交叉互换操作后的劣等组集合的类中心之间的欧式距离定义为优劣绝对距离,并存储于矩阵AbDist=[d1,d2,…,dm],dm为第m次迭代的优劣绝对距离;
步骤206:对更新后的优良组集合进行随机交叉互换操作后继续进行条件变异,每次变异时变异计数变量Count自增1,变异计数变量的值达到阈值时,停止变异,将最终经变异得到的优良组集合作为初始种群集合返回步骤202。
更进一步地,所述步骤202包括:将超参数编码成向量I=[ILR,ILU,ILY,ITS,IBS,IDT],一组超参数对应一种结构的LSTM神经网络,每个向量I即为一个个体,互不相同的向量I组成的集合为种群,其中,每个个体对应的超参数包括学习率ILR、隐层单元数量ILU、隐层数量ILY、时间步长ITS、每次训练的批次大小IBS以及正则化丢弃概率IDT。
更进一步地,所述步骤203包括:选取初始种群集合M中适应度的值排序前20%的个体归为更新后的优良组集合A{A1,A2,…,An},An为集合A中第n个个体;选取初始种群集合M中适应度的值排序后20%的个体归为更新后的劣等组集合B{B1,B2,…,Bm},Bm为集合B中第m个个体,使用随机梯度下降法求解更新后的优良组集合的类中心Ac及更新后的劣等组集合的类中心Bc,随机梯度下降法的损失函数为其中,L(Ak,AC)表示点AC与集合A中所有个体A1,A2,…,An欧式距离求和,当L(Ak,AC)取得最小值时的点AC即为更新后的优良组集合A的类中心,Ak为更新后的优良组集合中第K个个体,l为个体中第l个超参数,更新后的劣等组B的类中心Bc计算方法与更新后的优良组的类中心Ac计算方法相同。
更进一步地,所述步骤204中收敛条件为:更新后的优良组集合A中适应度的值大于预设值的个体的数量超过更新后的优良组集合A中个体总数的50%,其中,预设值为99.2%。
更进一步地,所述步骤206中条件变异必须满足的条件为:
条件一:新个体A′k与当前优良组集合的类中心的欧式距离不能大于对应优劣绝对距离的2/3;
条件二:新个体A′k与所有劣等组集合的类中心的欧氏距离不能小于对应优劣绝对距离的一半;
其中,第Count次变异的条件表达式为
本发明的优点在于:
(1)本发明对原始数据集输入BP神经网络,遍历搜索获取缺失数据的位置,进行缺失数据填充,获取完整数据集,避免数据缺失导致模型训练不准,预测精度和真实性较高,同时,本发明避免在若干次交叉和变异操作后仍找不到最优解,对完整数据集进行参数寻优,输出最优超参数生成最优超参数向量,避免浪费时间和资源。
(2)本发明在进行条件变异时设置变异约束条件,个体的变异具有尽量往优化的方向发展并且避免变成劣等个体的特性。
附图说明
图1为本发明实施例1所公开的一种电力负荷预测方法的流程图;
图2为本发明实施例1所公开的一种电力负荷预测方法中步骤一的流程图;
图3为本发明实施例1所公开的一种电力负荷预测方法中步骤二的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
如图1所示,一种电力负荷预测方法,所述方法包括:
步骤S1:将原始数据集输入BP神经网络,遍历搜索获取缺失数据的位置,使用BP神经网络以缺失数据点前后3个时间点的负荷数据作为输入特征,输出缺失数据值,进行缺失数据填充,获取完整数据集;其中,原始数据集是从数据源直接获取且未经过任何处理的数据集,它包括一段时间的天气数据:气温、湿度、风速,以及对应的电力负荷数据。
如图2所示,所述步骤S1包括:
步骤101:构建BP神经网络,其中,输入层为6个神经元,中间层为13个神经元,输出层为1个神经元,激活函数使用sigmoid函数;
步骤102:遍历搜索法搜索读取原始数据表中的一个数据单元,判断该单元是否缺失,若为缺失单元则将单元位置信息存入LocalInfor矩阵,若不是缺失单元则读取下一个数据单元,直到遍历完原始数据表,最后输出LocalInfor矩阵;
步骤103:在原始数据表中选取S个完整的、连续的、长度为7个采样点的数据序列{Li,Li+1,Li+2,Li+3,Li+4,Li+5,Li+6}作为S组标签数据,每组标签数据分为两组,一组为输入特征序列{Li、Li+1、Li+2、Li+4、Li+5、Li+6},另一组为标准输出Li+3,将S组标签数据按照7:3的比例随机划分为训练集和测试集;
步骤104:使用梯度下降法利用训练集对BP神经网络进行训练,训练学习率设置为0.1,训练收敛精度设置为0.002,测试精度设置为0.002,最终输出训练收敛的BP神经网络模型,并利用测试集对BP神经网络模型进行测试;
步骤105:初始化计数变量q=1,读取LocalInfor矩阵的第q行,得到缺失数据的行序列号LocalInforq1和列序列号LocalInforq2,以缺失数据位置的前、后3个采样点数据为输入特征序列输入测试完成的BP神经网络模型,将BP神经网络模型输出结果写入原始数据表中第LocalInforq1行、第LocalInforq2列,计数变量q自增1,重复上述过程直到遍历完LocalInfor矩阵;
步骤106:输出填补缺失数据以后的完整数据集。
步骤S2:对完整数据集进行参数寻优,输出最优超参数生成最优超参数向量;
如图3所示,所述步骤S2包括:
步骤201:对完整数据集用随机数初始化得到初始种群集合M={M1,M2,…,M10000}、初始优良组集合、初始劣等组集合,其中,Mi为种群中第i个个体;
步骤202:使用初始种群集合M中的每个个体对应的超参数构建初始LSTM神经网络,配合一组固定的输入数据对初始LSTM神经网络进行训练和测试,通过公式获取第i个个体的适应度,其中,K为测试样本的总数,j表示单个测试样本的编号,yj表示初始LSTM神经网络输出值,y′j表示样本标准值;具体的:将超参数编码成向量I=[ILR,ILU,ILY,ITS,IBS,IDT],一组超参数对应一种结构的LSTM神经网络,每个向量I即为一个个体,互不相同的向量I组成的集合为种群,其中,每个个体对应的超参数包括学习率ILR、隐层单元数量ILU、隐层数量ILY、时间步长ITS、每次训练的批次大小IBS以及正则化丢弃概率IDT。
步骤203:更新初始优良组集合和初始劣等组集合并使用随机梯度下降法求解更新后的优良组集合的类中心以及更新后的劣等组集合的类中心;具体的:选取初始种群集合M中适应度的值排序前20%的个体归为更新后的优良组集合A{A1,A2,…,An},An为集合A中第n个个体;选取初始种群集合M中适应度的值排序后20%的个体归为更新后的劣等组集合B{B1,B2,…,Bm},Bm为集合B中第m个个体,使用随机梯度下降法求解更新后的优良组集合的类中心Ac及更新后的劣等组集合的类中心Bc,随机梯度下降法的损失函数为其中,L(Ak,AC)表示点AC与集合A中所有个体A1,A2,…,An欧式距离求和,当L(Ak,AC)取得最小值时的点AC即为更新后的优良组集合A的类中心,Ak为更新后的优良组集合中第K个个体,l为个体中第l个超参数,更新后的劣等组B的类中心Bc计算方法与更新后的优良组的类中心Ac计算方法相同。
步骤204:判断更新后的优良组集合是否满足收敛条件,若满足则输出最优超参数向量,若不满足则进入步骤205;其中,收敛条件为:更新后的优良组集合A中适应度的值大于预设值的个体的数量超过更新后的优良组集合A中个体总数的50%,其中,预设值为99.2%。
步骤205:对更新后的优良组集合进行随机交叉互换操作,将经随机交叉互换操作后的劣等组集合的类中心存储于类中心存储矩阵Store=[BC1,BC2,…,BCm],其中,m为累计迭代数,BCm为第m次迭代的劣等组集合的类中心,将经随机交叉互换操作后的优良组集合的类中心以及经随机交叉互换操作后的劣等组集合的类中心之间的欧式距离定义为优劣绝对距离,并存储于矩阵AbDist=[d1,d2,…,dm],dm为第m次迭代的优劣绝对距离;
步骤206:对更新后的优良组集合进行随机交叉互换操作后继续进行条件变异,每次变异时变异计数变量Count自增1,变异计数变量的值达到阈值时,停止变异,将最终经变异得到的优良组集合作为初始种群集合返回步骤202。
其中条件变异必须满足的条件为:
条件一:新个体A′k与当前优良组集合的类中心的欧式距离不能大于对应优劣绝对距离的2/3;
条件二:新个体A′k与所有劣等组集合的类中心的欧氏距离不能小于对应优劣绝对距离的一半;
其中,第Count次变异的条件表达式为
步骤S3:利用最优超参数向量构建LSTM神经网络,输入训练数据对LSTM神经网络进行训练得到LSTM模型;LSTM模型的训练属于现有技术,输入训练数据使用TensorFlow框架下的AdamOptimizer优化器对LSTM网络进行训练。损失函数使用平均绝对误差(MAE):
其中nm是输出预测值的总数,actual(t)表示第t个实际值,forecast(t)表示第t个预测值。网络模型通过训练,能够更加深刻地掌握历史特征值与负荷的变化关系。
步骤S4:输入测试数据,对LSTM模型进行测试;
步骤S5:向测试通过的LSTM模型输入特征值,进行电力负荷预测,其中,特征值包括气温、湿度、风速、历史数据以及预测时间点。
以下对一些技术术语进行统一解释说明:
神经网络超参数:属于神经网络参数的一种,是一类与神经网络结构及训练方式有关的参数,例如输入层神经元数量、隐藏层数量、隐藏层神经元数量、输出层神经元数量、时间步长、学习率等。
容错率低:超参数可能因为微小的变动而造成整个模型精度大幅度下降。
条件变异遗传算法:本发明提出的一种改进的遗传算法,通过在变异阶段添加一定条件,从而增加变异的稳定性。
时序数据:具有时间序列特征的数据,序列中每一个数据必须赋予时间意义。
短期负荷预测:未来几分钟到几小时的电力负荷预测称为短期负荷预测。
循环神经网络:是一类以序列(sequence)数据为输入,在序列的演进方向进行递归(recursion)且所有节点(循环单元)按链式连接的递归神经网络(recursive neuralnetwork)。是一类以序列(sequence)数据为输入,在序列的演进方向进行递归(recursion)且所有节点(循环单元)按链式连接的递归神经网络(recursive neural network)。
长距离依赖:某时刻数据和久远历史数据关系较强,而与近期历史数据关系较弱,成为长距离依赖。RNN模型很难理解长距离依赖数据,但LSTM模型可以解决该问题。
随机梯度下降法:一种快速参数寻优方法。
损失函数:是用来评估模型的输出值f(x)与真实值Y的差异程度,它是一个非负实值函数。损失函数越小,表示误差越小,模型的鲁棒性就越好。
通过以上技术方案,在传统基于神经网络的电力负荷预测方法中,神经网络超参数往往呈现出:维度多元、容错率低、参数选取困难等特点。研究者往往通过现有研究以及试探性实验来确定参数取值。然而由于神经网络超参数在很大程度上能够决定整个模型的性能,例如:超参数中一个值的微小改动可能导致整个模型精确度大幅下降。本发明针对如何确定长短期记忆人工神经网络超参数问题,在现有遗传算法的基础上,提出了一种条件变异遗传算法。该算法是一种参数寻优算法,在传统遗传算法的基础上给变异步骤添加了约束条件,克服了传统遗传算法变异的不定向性,提升了算法的稳定性和时效性。该方法能够更快地找到适合于网络模型的超参数,有助于提升网络模型的训练速度,以及预测精度。
在传统基于神经网络的电力负荷预测方法中,模型很难从时序数据中挖掘出变化规律,从而导致传统预测模型精度提升困难。而本发明针对传统模型处理时序数据能力欠佳的缺陷,提出结合长短期记忆人工神经网络(LSTM)的负荷预测方法。充分发挥了长短期记忆人工神经网络(LSTM)处理长期依赖性时序数据的先天优势,能够更精确地预测电力负荷变化趋势。
在传统基于神经网络的电力负荷预测方法中,原始数据往往出现个别数据缺失的情况。而数据缺失往往容易导致实验进行困难,或影响预测实验的真实性。本发明提出了一种基于BP神经网络的缺失数据处理方法,对原始数据表中不同缺失数据进行模拟填充,最终获得可以直接应用于电力负荷预测的完整数据集。
实施例2
与本发明实施例1相对应的,本发明实施例2还提供一种电力负荷预测装置,所述装置包括:
缺失数据处理模块,用于将原始数据集输入BP神经网络,遍历搜索获取缺失数据的位置,使用BP神经网络以缺失数据点前后3个时间点的负荷数据作为输入特征,输出缺失数据值,进行缺失数据填充,获取完整数据集;
参数寻优模块,用于对完整数据集进行参数寻优,输出最优超参数生成最优超参数向量;
模型训练模块,用于利用最优超参数向量构建LSTM神经网络,输入训练数据对LSTM神经网络进行训练得到LSTM模型;
测试模块,用于输入测试数据,对LSTM模型进行测试;
预测模块,用于向测试通过的LSTM模型输入特征值,进行电力负荷预测,其中,特征值包括气温、湿度、风速、历史数据以及预测时间点。
具体的,所述缺失数据处理模块还用于:
步骤101:构建BP神经网络,其中,输入层为6个神经元,中间层为13个神经元,输出层为1个神经元,激活函数使用sigmoid函数;
步骤102:遍历搜索法搜索读取原始数据表中的一个数据单元,判断该单元是否缺失,若为缺失单元则将单元位置信息存入LocalInfor矩阵,若不是缺失单元则读取下一个数据单元,直到遍历完原始数据表,最后输出LocalInfor矩阵;
步骤103:在原始数据表中选取S个完整的、连续的、长度为7个采样点的数据序列{Li,Li+1,Li+2,Li+3,Li+4,Li+5,Li+6}作为S组标签数据,每组标签数据分为两组,一组为输入特征序列{Li、Li+1、Li+2、Li+4、Li+5、Li+6},另一组为标准输出Li+3,将S组标签数据按照7:3的比例随机划分为训练集和测试集;
步骤104:使用梯度下降法利用训练集对BP神经网络进行训练,训练学习率设置为0.1,训练收敛精度设置为0.002,测试精度设置为0.002,最终输出训练收敛的BP神经网络模型,并利用测试集对BP神经网络模型进行测试;
步骤105:初始化计数变量q=1,读取LocalInfor矩阵的第q行,得到缺失数据的行序列号LocalInforq1和列序列号LocalInforq2,以缺失数据位置的前、后3个采样点数据为输入特征序列输入测试完成的BP神经网络模型,将BP神经网络模型输出结果写入原始数据表中第LocalInforq1行、第LocalInforq2列,计数变量q自增1,重复上述过程直到遍历完LocalInfor矩阵;
步骤106:输出填补缺失数据以后的完整数据集。
具体的,所述参数寻优模块还用于:
步骤201:对完整数据集用随机数初始化得到初始种群集合M={M1,M2,…,M10000}、初始优良组集合、初始劣等组集合,其中,Mi为种群中第i个个体;
步骤202:使用初始种群集合M中的每个个体对应的超参数构建初始LSTM神经网络,配合一组固定的输入数据对初始LSTM神经网络进行训练和测试,通过公式获取第i个个体的适应度,其中,K为测试样本的总数,j表示单个测试样本的编号,yj表示初始LSTM神经网络输出值,y′j表示样本标准值;
步骤203:更新初始优良组集合和初始劣等组集合并使用随机梯度下降法求解更新后的优良组集合的类中心以及更新后的劣等组集合的类中心;
步骤204:判断更新后的优良组集合是否满足收敛条件,若满足则输出最优超参数向量,若不满足则进入步骤205;
步骤205:对更新后的优良组集合进行随机交叉互换操作,将经随机交叉互换操作后的劣等组集合的类中心存储于类中心存储矩阵Store=[BC1,BC2,…,BCm],其中,m为累计迭代数,BCm为第m次迭代的劣等组集合的类中心,将经随机交叉互换操作后的优良组集合的类中心以及经随机交叉互换操作后的劣等组集合的类中心之间的欧式距离定义为优劣绝对距离,并存储于矩阵AbDist=[d1,d2,…,dm],dm为第m次迭代的优劣绝对距离;
步骤206:对更新后的优良组集合进行随机交叉互换操作后继续进行条件变异,每次变异时变异计数变量Count自增1,变异计数变量的值达到阈值时,停止变异,将最终经变异得到的优良组集合作为初始种群集合返回步骤202。
更具体的,所述步骤202包括:将超参数编码成向量I=[ILR,ILU,ILY,ITS,IBS,IDT],一组超参数对应一种结构的LSTM神经网络,每个向量I即为一个个体,互不相同的向量I组成的集合为种群,其中,每个个体对应的超参数包括学习率ILR、隐层单元数量ILU、隐层数量ILY、时间步长ITS、每次训练的批次大小IBS以及正则化丢弃概率IDT。
更具体的,所述步骤203包括:选取初始种群集合M中适应度的值排序前20%的个体归为更新后的优良组集合A{A1,A2,…,An},An为集合A中第n个个体;选取初始种群集合M中适应度的值排序后20%的个体归为更新后的劣等组集合B{B1,B2,…,Bm},Bm为集合B中第m个个体,使用随机梯度下降法求解更新后的优良组集合的类中心Ac及更新后的劣等组集合的类中心Bc,随机梯度下降法的损失函数为其中,L(Ak,AC)表示点AC与集合A中所有个体A1,A2,…,An欧式距离求和,当L(Ak,AC)取得最小值时的点AC即为更新后的优良组集合A的类中心,Ak为更新后的优良组集合中第K个个体,l为个体中第l个超参数,更新后的劣等组B的类中心Bc计算方法与更新后的优良组的类中心Ac计算方法相同。
更具体的,所述步骤204中收敛条件为:更新后的优良组集合A中适应度的值大于预设值的个体的数量超过更新后的优良组集合A中个体总数的50%,其中,预设值为99.2%。
更具体的,所述步骤206中条件变异必须满足的条件为:
条件一:新个体A′k与当前优良组集合的类中心的欧式距离不能大于对应优劣绝对距离的2/3;
条件二:新个体A′k与所有劣等组集合的类中心的欧氏距离不能小于对应优劣绝对距离的一半;
其中,第Count次变异的条件表达式为
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (4)
1.一种电力负荷预测方法,其特征在于,所述方法包括:
步骤一:将原始数据集输入BP神经网络,遍历搜索获取缺失数据的位置,使用BP神经网络以缺失数据点前后3个时间点的负荷数据作为输入特征,输出缺失数据值,进行缺失数据填充,获取完整数据集;
步骤二:对完整数据集进行参数寻优,输出最优超参数生成最优超参数向量;所述步骤二包括:
步骤201:对完整数据集用随机数初始化得到初始种群集合M={}、初始优良组集合、初始劣等组集合,其中,/>为种群中第i个个体;
步骤202:使用初始种群集合M中的每个个体对应的超参数构建初始LSTM神经网络,配合一组固定的输入数据对初始LSTM神经网络进行训练和测试,通过公式获取第/>个个体的适应度,其中,K为测试样本的总数,j表示单个测试样本的编号,/>表示初始LSTM神经网络输出值,/>表示样本标准值;
步骤203:更新初始优良组集合和初始劣等组集合并使用随机梯度下降法求解更新后的优良组集合的类中心以及更新后的劣等组集合的类中心;
步骤204:判断更新后的优良组集合是否满足收敛条件,若满足则输出最优超参数向量,若不满足则进入步骤205;
步骤205:对更新后的优良组集合进行随机交叉互换操作,将经随机交叉互换操作后的劣等组集合的类中心存储于类中心存储矩阵Store=[],其中,m为累计迭代数,/>为第m次迭代的劣等组集合的类中心,将经随机交叉互换操作后的优良组集合的类中心以及经随机交叉互换操作后的劣等组集合的类中心之间的欧式距离定义为优劣绝对距离,并存储于矩阵AbDist=[/>,/>],/>为第m次迭代的优劣绝对距离;
步骤206:对更新后的优良组集合进行随机交叉互换操作后继续进行条件变异,每次变异时变异计数变量Count自增1,变异计数变量的值达到阈值时,停止变异,将最终经变异得到的优良组集合作为初始种群集合返回步骤202;
所述步骤202包括:将超参数编码成向量,一组超参数对应一种结构的LSTM神经网络,每个向量I即为一个个体,互不相同的向量I组成的集合为种群,其中,每个个体对应的超参数包括学习率/>、隐层单元数量/>、隐层数量/>、时间步长/>、每次训练的批次大小/>以及正则化丢弃概率/>;
所述步骤203包括:选取初始种群集合M中适应度的值排序前20%的个体归为更新后的优良组集合A{},/>为集合A中第n个个体;选取初始种群集合M中适应度的值排序后20%的个体归为更新后的劣等组集合B{/>},/>为集合B中第m个个体,使用随机梯度下降法求解更新后的优良组集合的类中心/>及更新后的劣等组集合的类中心/>,随机梯度下降法的损失函数为/>,其中,/>表示点与集合A中所有个体/>欧式距离求和,当/>取得最小值时的点/>即为更新后的优良组集合A的类中心,/>为更新后的优良组集合中第K个个体,/>为个体中第/>个超参数,更新后的劣等组B的类中心/>计算方法与更新后的优良组的类中心/>计算方法相同;
所述步骤204中收敛条件为:更新后的优良组集合A中适应度的值大于预设值的个体的数量超过更新后的优良组集合A中个体总数的50%,其中,预设值为99.2%;
所述步骤206中条件变异必须满足的条件为:
条件一:新个体与当前优良组集合的类中心的欧式距离不能大于对应优劣绝对距离的2/3;
条件二:新个体与所有劣等组集合的类中心的欧氏距离不能小于对应优劣绝对距离的一半;
其中,第Count次变异的条件表达式为
;
步骤三:利用最优超参数向量构建LSTM神经网络,输入训练数据对LSTM神经网络进行训练得到LSTM模型;
步骤四:输入测试数据,对LSTM模型进行测试;
步骤五:向测试通过的LSTM模型输入特征值,进行电力负荷预测,其中,特征值包括气温、湿度、风速、历史数据以及预测时间点。
2.根据权利要求1所述的一种电力负荷预测方法,其特征在于,所述步骤一包括:
步骤101:构建BP神经网络,其中,输入层为6个神经元,中间层为13个神经元,输出层为1个神经元,激活函数使用sigmoid函数;
步骤102:遍历搜索法搜索读取原始数据表中的一个数据单元,判断该单元是否缺失,若为缺失单元则将单元位置信息存入矩阵,若不是缺失单元则读取下一个数据单元,直到遍历完原始数据表,最后输出/>矩阵;
步骤103:在原始数据表中选取S个完整的、连续的、长度为7个采样点的数据序列作为S组标签数据,每组标签数据分为两组,一组为输入特征序列{/>、/>、/>、/>、/>、/>},另一组为标准输出/>,将S组标签数据按照7:3的比例随机划分为训练集和测试集;
步骤104:使用梯度下降法利用训练集对BP神经网络进行训练,训练学习率设置为0.1,训练收敛精度设置为0.002,测试精度设置为0.002,最终输出训练收敛的BP神经网络模型,并利用测试集对BP神经网络模型进行测试;
步骤105:初始化计数变量q=1,读取LocalInfor矩阵的第q行,得到缺失数据的行序列号和列序列号/>,以缺失数据位置的前、后3个采样点数据为输入特征序列输入测试完成的BP神经网络模型,将BP神经网络模型输出结果写入原始数据表中第/>行、第/>列,计数变量q自增1,重复上述过程直到遍历完LocalInfor矩阵;
步骤106:输出填补缺失数据以后的完整数据集。
3.一种电力负荷预测装置,其特征在于,所述装置包括:
缺失数据处理模块,用于将原始数据集输入BP神经网络,遍历搜索获取缺失数据的位置,使用BP神经网络以缺失数据点前后3个时间点的负荷数据作为输入特征,输出缺失数据值,进行缺失数据填充,获取完整数据集;
参数寻优模块,用于对完整数据集进行参数寻优,输出最优超参数生成最优超参数向量;所述参数寻优模块还用于:
步骤201:对完整数据集用随机数初始化得到初始种群集合M={}、初始优良组集合、初始劣等组集合,其中,/>为种群中第i个个体;
步骤202:使用初始种群集合M中的每个个体对应的超参数构建初始LSTM神经网络,配合一组固定的输入数据对初始LSTM神经网络进行训练和测试,通过公式获取第/>个个体的适应度,其中,K为测试样本的总数,j表示单个测试样本的编号,/>表示初始LSTM神经网络输出值,/>表示样本标准值;
步骤203:更新初始优良组集合和初始劣等组集合并使用随机梯度下降法求解更新后的优良组集合的类中心以及更新后的劣等组集合的类中心;
步骤204:判断更新后的优良组集合是否满足收敛条件,若满足则输出最优超参数向量,若不满足则进入步骤205;
步骤205:对更新后的优良组集合进行随机交叉互换操作,将经随机交叉互换操作后的劣等组集合的类中心存储于类中心存储矩阵Store=[],其中,m为累计迭代数,/>为第m次迭代的劣等组集合的类中心,将经随机交叉互换操作后的优良组集合的类中心以及经随机交叉互换操作后的劣等组集合的类中心之间的欧式距离定义为优劣绝对距离,并存储于矩阵AbDist=[/>,/>],/>为第m次迭代的优劣绝对距离;
步骤206:对更新后的优良组集合进行随机交叉互换操作后继续进行条件变异,每次变异时变异计数变量Count自增1,变异计数变量的值达到阈值时,停止变异,将最终经变异得到的优良组集合作为初始种群集合返回步骤202;
所述步骤202包括:将超参数编码成向量,一组超参数对应一种结构的LSTM神经网络,每个向量I即为一个个体,互不相同的向量I组成的集合为种群,其中,每个个体对应的超参数包括学习率/>、隐层单元数量/>、隐层数量/>、时间步长/>、每次训练的批次大小/>以及正则化丢弃概率/>;
所述步骤203包括:选取初始种群集合M中适应度的值排序前20%的个体归为更新后的优良组集合A{},/>为集合A中第n个个体;选取初始种群集合M中适应度的值排序后20%的个体归为更新后的劣等组集合B{/>},/>为集合B中第m个个体,使用随机梯度下降法求解更新后的优良组集合的类中心/>及更新后的劣等组集合的类中心/>,随机梯度下降法的损失函数为/>,其中,/>表示点与集合A中所有个体/>欧式距离求和,当/>取得最小值时的点/>即为更新后的优良组集合A的类中心,/>为更新后的优良组集合中第K个个体,/>为个体中第/>个超参数,更新后的劣等组B的类中心/>计算方法与更新后的优良组的类中心/>计算方法相同;
所述步骤204中收敛条件为:更新后的优良组集合A中适应度的值大于预设值的个体的数量超过更新后的优良组集合A中个体总数的50%,其中,预设值为99.2%;
所述步骤206中条件变异必须满足的条件为:
条件一:新个体与当前优良组集合的类中心的欧式距离不能大于对应优劣绝对距离的2/3;
条件二:新个体与所有劣等组集合的类中心的欧氏距离不能小于对应优劣绝对距离的一半;
其中,第Count次变异的条件表达式为
;
模型训练模块,用于利用最优超参数向量构建LSTM神经网络,输入训练数据对LSTM神经网络进行训练得到LSTM模型;
测试模块,用于输入测试数据,对LSTM模型进行测试;
预测模块,用于向测试通过的LSTM模型输入特征值,进行电力负荷预测,其中,特征值包括气温、湿度、风速、历史数据以及预测时间点。
4.根据权利要求3所述的一种电力负荷预测装置,其特征在于,所述缺失数据处理模块还用于:
步骤101:构建BP神经网络,其中,输入层为6个神经元,中间层为13个神经元,输出层为1个神经元,激活函数使用sigmoid函数;
步骤102:遍历搜索法搜索读取原始数据表中的一个数据单元,判断该单元是否缺失,若为缺失单元则将单元位置信息存入矩阵,若不是缺失单元则读取下一个数据单元,直到遍历完原始数据表,最后输出/>矩阵;
步骤103:在原始数据表中选取S个完整的、连续的、长度为7个采样点的数据序列作为S组标签数据,每组标签数据分为两组,一组为输入特征序列{/>、/>、/>、/>、/>、/>},另一组为标准输出/>,将S组标签数据按照7:3的比例随机划分为训练集和测试集;
步骤104:使用梯度下降法利用训练集对BP神经网络进行训练,训练学习率设置为0.1,训练收敛精度设置为0.002,测试精度设置为0.002,最终输出训练收敛的BP神经网络模型,并利用测试集对BP神经网络模型进行测试;
步骤105:初始化计数变量q=1,读取LocalInfor矩阵的第q行,得到缺失数据的行序列号和列序列号/>,以缺失数据位置的前、后3个采样点数据为输入特征序列输入测试完成的BP神经网络模型,将BP神经网络模型输出结果写入原始数据表中第/>行、第/>列,计数变量q自增1,重复上述过程直到遍历完LocalInfor矩阵;
步骤106:输出填补缺失数据以后的完整数据集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010717557.2A CN111861013B (zh) | 2020-07-23 | 2020-07-23 | 一种电力负荷预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010717557.2A CN111861013B (zh) | 2020-07-23 | 2020-07-23 | 一种电力负荷预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111861013A CN111861013A (zh) | 2020-10-30 |
CN111861013B true CN111861013B (zh) | 2023-09-08 |
Family
ID=72949733
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010717557.2A Active CN111861013B (zh) | 2020-07-23 | 2020-07-23 | 一种电力负荷预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111861013B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112330073B (zh) * | 2020-11-30 | 2022-05-24 | 天津大学 | 长距离调水工程监测数据关键效应量预测方法 |
CN112464289B (zh) * | 2020-12-11 | 2023-01-17 | 广东工业大学 | 一种隐私数据的清洗方法 |
CN112734106A (zh) * | 2021-01-08 | 2021-04-30 | 深圳市国电科技通信有限公司 | 用于预测能源负荷的方法及装置 |
CN114065653A (zh) * | 2022-01-17 | 2022-02-18 | 南方电网数字电网研究院有限公司 | 电力负荷预测模型的构建方法与电力负荷预测方法 |
CN115473232B (zh) * | 2022-11-02 | 2023-03-24 | 广东电网有限责任公司中山供电局 | 一种负荷参数调整方法、系统、设备和存储介质 |
CN117261599B (zh) * | 2023-10-18 | 2024-05-03 | 北京航空航天大学 | 电动汽车的故障检测方法、装置、电子设备及电动汽车 |
CN117893139A (zh) * | 2024-03-15 | 2024-04-16 | 山东未来网络研究院(紫金山实验室工业互联网创新应用基地) | 一种基于产业链的物料配比方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107239859A (zh) * | 2017-06-05 | 2017-10-10 | 国网山东省电力公司电力科学研究院 | 基于串联长短期记忆循环神经网络的供热负荷预测方法 |
CN107844915A (zh) * | 2017-11-29 | 2018-03-27 | 信雅达系统工程股份有限公司 | 一种基于话务预测的呼叫中心的自动排班方法 |
CN110222883A (zh) * | 2019-05-22 | 2019-09-10 | 镇江市高等专科学校 | 基于风驱动优化bp神经网络的电力系统负荷预测方法 |
CN110852435A (zh) * | 2019-10-12 | 2020-02-28 | 沈阳航空航天大学 | 一种基于神经进化计算模型 |
CN111027772A (zh) * | 2019-12-10 | 2020-04-17 | 长沙理工大学 | 基于pca-dbilstm的多因素短期负荷预测方法 |
CN112116144A (zh) * | 2020-09-15 | 2020-12-22 | 山东科技大学 | 一种区域配电网短期负荷预测方法 |
CN113919871A (zh) * | 2021-09-29 | 2022-01-11 | 上海电力大学 | 一种基于改进lstm模型的碳交易价格预测方法 |
CN116526450A (zh) * | 2023-04-14 | 2023-08-01 | 三峡大学 | 计及误差补偿的两阶段短期电力负荷组合预测方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7058522B2 (en) * | 2003-05-13 | 2006-06-06 | Siemens Power Transmission & Distribution, Inc. | Very short term load prediction |
US11205103B2 (en) * | 2016-12-09 | 2021-12-21 | The Research Foundation for the State University | Semisupervised autoencoder for sentiment analysis |
-
2020
- 2020-07-23 CN CN202010717557.2A patent/CN111861013B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107239859A (zh) * | 2017-06-05 | 2017-10-10 | 国网山东省电力公司电力科学研究院 | 基于串联长短期记忆循环神经网络的供热负荷预测方法 |
CN107844915A (zh) * | 2017-11-29 | 2018-03-27 | 信雅达系统工程股份有限公司 | 一种基于话务预测的呼叫中心的自动排班方法 |
CN110222883A (zh) * | 2019-05-22 | 2019-09-10 | 镇江市高等专科学校 | 基于风驱动优化bp神经网络的电力系统负荷预测方法 |
CN110852435A (zh) * | 2019-10-12 | 2020-02-28 | 沈阳航空航天大学 | 一种基于神经进化计算模型 |
CN111027772A (zh) * | 2019-12-10 | 2020-04-17 | 长沙理工大学 | 基于pca-dbilstm的多因素短期负荷预测方法 |
CN112116144A (zh) * | 2020-09-15 | 2020-12-22 | 山东科技大学 | 一种区域配电网短期负荷预测方法 |
CN113919871A (zh) * | 2021-09-29 | 2022-01-11 | 上海电力大学 | 一种基于改进lstm模型的碳交易价格预测方法 |
CN116526450A (zh) * | 2023-04-14 | 2023-08-01 | 三峡大学 | 计及误差补偿的两阶段短期电力负荷组合预测方法 |
Non-Patent Citations (1)
Title |
---|
基于改进PSO-DBILSTM网络模型的短期负荷预测研究;胡让;中国优秀硕士学位论文全文数据库工程科技Ⅱ辑(第7期);C042-600 * |
Also Published As
Publication number | Publication date |
---|---|
CN111861013A (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111861013B (zh) | 一种电力负荷预测方法及装置 | |
CN111027772B (zh) | 基于pca-dbilstm的多因素短期负荷预测方法 | |
CN111860982A (zh) | 一种基于vmd-fcm-gru的风电场短期风电功率预测方法 | |
CN109324291B (zh) | 一种针对质子交换膜燃料电池寿命预测的预测方法 | |
CN113537600B (zh) | 一种全过程耦合机器学习的中长期降水预报建模方法 | |
CN109492748B (zh) | 一种基于卷积神经网络的电力系统的中长期负荷预测模型建立方法 | |
CN116596044B (zh) | 基于多源数据的发电负荷预测模型训练方法及装置 | |
CN116721537A (zh) | 基于gcn-ipso-lstm组合模型的城市短时交通流预测方法 | |
CN112434848A (zh) | 基于深度信念网络的非线性加权组合风电功率预测方法 | |
CN111401755A (zh) | 基于马尔科夫链的多新能源出力场景生成方法、装置及系统 | |
CN113449919B (zh) | 一种基于特征和趋势感知的用电量预测方法及系统 | |
CN113537469B (zh) | 一种基于LSTM网络和Attention机制的城市需水预测方法 | |
CN112686376A (zh) | 一种基于时序图神经网络的节点表示方法及增量学习方法 | |
CN113554466A (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
CN112232577A (zh) | 用于多芯智能表的电力负荷概率预测系统与方法 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN116757057A (zh) | 基于pso-ga-lstm模型的空气质量预测方法 | |
CN115600729A (zh) | 一种考虑多属性网格电网负荷预测方法 | |
CN113762591B (zh) | 一种基于gru和多核svm对抗学习的短期电量预测方法及系统 | |
AU2021106200A4 (en) | Wind power probability prediction method based on quantile regression | |
CN114611757A (zh) | 基于遗传算法与改进深度残差网络的电力系统短期负荷预测方法 | |
CN113033898A (zh) | 基于k均值聚类与bi-lstm神经网络的电负荷预测方法及系统 | |
CN112381664A (zh) | 电网短期负荷预测方法、预测装置及存储介质 | |
CN116911459A (zh) | 适应于虚拟电厂的多输入多输出超短期电力负荷预测方法 | |
CN115481788B (zh) | 相变储能系统负荷预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |