CN116050605A - 一种基于神经网络和随机森林法的电力负荷预测方法 - Google Patents
一种基于神经网络和随机森林法的电力负荷预测方法 Download PDFInfo
- Publication number
- CN116050605A CN116050605A CN202211741770.2A CN202211741770A CN116050605A CN 116050605 A CN116050605 A CN 116050605A CN 202211741770 A CN202211741770 A CN 202211741770A CN 116050605 A CN116050605 A CN 116050605A
- Authority
- CN
- China
- Prior art keywords
- prediction
- data
- model
- prediction result
- original
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 83
- 238000007637 random forest analysis Methods 0.000 title claims abstract description 53
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 19
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 38
- 238000013135 deep learning Methods 0.000 claims abstract description 8
- 238000003066 decision tree Methods 0.000 claims description 32
- 238000012549 training Methods 0.000 claims description 27
- 238000004458 analytical method Methods 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 9
- 238000004519 manufacturing process Methods 0.000 claims description 7
- 238000012360 testing method Methods 0.000 claims description 7
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 3
- 238000000354 decomposition reaction Methods 0.000 claims description 3
- 230000002015 leaf growth Effects 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 238000003860 storage Methods 0.000 claims description 3
- 238000007635 classification algorithm Methods 0.000 claims description 2
- 239000000284 extract Substances 0.000 claims description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 241000254032 Acrididae Species 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/003—Load forecast, e.g. methods or systems for forecasting future load demand
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2203/00—Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
- H02J2203/20—Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Operations Research (AREA)
- Primary Health Care (AREA)
- Life Sciences & Earth Sciences (AREA)
- Quality & Reliability (AREA)
- Biomedical Technology (AREA)
- Entrepreneurship & Innovation (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Power Engineering (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于神经网络和随机森林法的电力负荷预测方法。它包括如下步骤:步骤一:获取原始电力负荷数据;步骤二:建立LightBGM模型进行深度学习并不断调节参数;步骤三:使用LightBGM模型根据原始负荷数据进行预测;步骤四:将第一预测结果输入随机森林预测模型进行反向预测;步骤五:判断反向预测结果与原始负荷数据的偏差;判断第一次预测结果是否准确,预测负荷数据与原始负荷数据进行对比偏差小,则第一预测结果准确,直接输出第一预测结果,若预测负荷数据与原始负荷数据进行对比偏差大,调整LightGBM算法中的相关参数,然后重复进行预测以及反向预测在比较。本发明具有提高预测结果的精度的优点。
Description
技术领域
本发明涉及负荷预测技术领域,更具体地说它是一种基于神经网络和随机森林法的电力负荷预测方法。
背景技术
为适应社会快速发展的需要,电力系统逐渐转变成自愈式、大规模可再生能源接入、经济高效的智能电网,而负荷预测是智能电网规划运行的基础。负荷预测对如何安排调度计划、联络线交换功率、机组优化组合等有着重要意义。
近年来,短期负荷预测主要对未来几小时或几天的用电负荷进行预测,是电网合理调度和平稳运行的基础。近年来,智能测量设备为电力部门提供了数量更大、质量更高的负荷数据,现代气象预报技术提供了更高时空分辨率、更高精度的天气数据,为以人工智能为代表的新型负荷预测技术奠定了坚实的数据基础。
目前,关于短期负荷预测的方法主要有传统的统计学方法和基于机器学习的预测方法,其中,统计学方法主要有多元线性回归(MLR)时间序列分析法5和卡尔曼滤波法等,这类方法原理与建模简单,但当数据样本容量较大时,预测效果一般。另一类方法则基于机器学习算法,例如灰色系统、人工神经网络、支持向量机(SVM)以及高斯过程(GP)等。其中,反向传播(BP)神经网络和SVM的应用最为广泛,具体采用多层聚类法对输入数据进行预处理,然后使用改进的BP神经网络完成了负荷预测。现有技术分别采用蚱蜢算法和小波变异果蝇算法对SVM模型进行了改进,也取得了不错的预测效果。但上述方法缺少对时间序列相关性的考虑,并且当训练样本较多时存在无法有效收敛的问题,因此预测精度上仍有很大的上升空间。
综上所述,现有的电力负荷预测方法存在预测精度差,预测结果误差大的缺点,为此,开发一种预测精度高、预测结果误差小的的电力负荷预测方法很有必要。
发明内容
本发明的目的是为了提供一种基于神经网络和随机森林法的电力负荷预测方法,预测精度高、预测结果误差小,可以有效解决背景技术中现有的电力负荷预测方法存在预测精度差,预测结果误差大的缺点。
为了实现上述目的,本发明的技术方案为:一种基于神经网络和随机森林法的电力负荷预测方法,其特征在于:包括如下步骤,
步骤一:获取原始电力负荷数据;
获取待预测电力系统的以往原始负荷数据,并建立原始数据库进行存储,具体存储的内容包括时周期分量、日周期分量以及周周期分量;
步骤二:建立LightBGM模型进行深度学习并不断调节参数;
步骤三:使用LightBGM模型根据原始负荷数据进行预测、得到第一预测结果;
步骤四:将第一预测结果输入随机森林预测模型进行反向预测;
根据第一预测结果,计算机分析模块内部建立随机森林算法预测模型,使用第一预测结果进行反向预测,得到第二预测结果,所述第二预测结果为预测负荷数据,将作为预测负荷数据的第二预测结果与步骤一中的原始负荷数据进行对比,进而判断第一预测结果的准确性;
步骤五:判断反向预测结果与原始负荷数据的偏差;
设偏差为5000万千瓦到8000万千瓦;
若反向预测负荷数据与步骤一中的原始负荷数据进行对比偏差小,则第一预测结果准确,直接输出第一预测结果;
若反向预测负荷数据与步骤一中的原始负荷数据进行对比偏差大,则跳转至步骤二,调整LightGBM算法中的相关参数,然后重复步骤三以及步骤五。
在上述技术方案中,步骤S1还包括对原始数据库内存储的数据建立数据库防护系统,通过设置防火墙进行数据库防护。
在上述技术方案中,在步骤二中,建立LightBGM模型进行深度学习并不断调节参数,具体方法为:
将原始数据库内的原始负荷数据上传至计算机分析模块,计算机分析模块建立基于特征的LightGBM的电力负荷预测模型,通过调整LightGBM算法中的相关参数,以分配各个数据特征和因素的权重大小,然后利用数据库内海量的数据对LightGBM的电力负荷预测模型进行训练以及验证,得到最优超参数。
在上述技术方案中,在步骤三中,使用LightBGM模型根据原始负荷数据进行预测,具体方法为:
LightGBM模型经过海量数据训练以及验证的深度学习后,根据最优超参数以及根据测量模块实时监测到的电力负荷数据,进行预测下一时间区段电力负荷,得到第一预测结果,第一预测结果为后续一段时间内原始电力负荷数据。
将第一预测结果输入随机森林预测模型进行反向预测,具体方法为:
步骤S31:使用自举法从第一预测结果中随机提取i个重复样本数据集作为每个决策树的子样本集,每个样本大小与原始数据集相同,并且每次未被取样的数据构成袋外数据;
步骤S32:对各个子样本集分别建立分类回归树,构建i棵决策树,在构建过程中,对于决策树的各个节点,随机采样原始数据变量集,获得变量子集,根据基尼指数最小准则从子集中选取最优特征进行分裂;
步骤S33:每棵分类回归树从顶部到底部递归分枝生长,达到设置叶节点的最小尺寸后决策树停止生长,所有的决策树组合成为随机森林;
步骤S34:在随机森林模型中输入测试数据,利用i棵决策树分别对子测试样本集预测,取每个决策树预测结果的平均值为预测值,最终得到第二预测结果,第二预测结果为预测负荷数据。首先输入训练数据集D={(x1,y1),(x2,y2),...,(xn,yn)},样本集的个数T输出:最终的强分类器方f(x)对t=1,2,...,T,从原始样本集中随机的抽取m个样本点,得到一个训练集Dt;用训练集Dt训练一个CART决策树,这里在训练的过程中,对每个节点的切分规则是先从所有特征中随机的选择k个特征,然后在从这k个特征中选择最优的切分点在做左右子树的划分,如果是分类算法,则预测的最终类别为该样本点所到叶节点中投票数最多的类别;如果是回归算法,则最终的类别为该样本点所到叶节点的均值。
式中:F(x)为最终的输出值;fm(x)为第m棵弱回归树的输出值;
LightGBM模型的主要包括直方图算法和带深度限制的叶子生长(leaf-wise)策略,直方图算法将连续数据划分为K个整数,并构造宽度为K的直方图,遍历时将离散化的值作为索引在直方图中累积,进而搜索出最优的决策树分割点,而带深度限制的leaf-wise策略是指在每次分裂时,找到最大增益的叶子进行分裂并循环下去,同时,通过树的深度以及叶子数限制,减小模型的复杂度,防止出现过拟合,采用LightGBM模型在同一时刻预测两次得出两个负荷预测的结果之后,需要确定权重系数来进行线性组合,本发明采用最优加权组合的方法具体步骤如下,首先求出偏差矩阵E,即,
式中:N为负荷采样总数;e1和e2分别为LightGBM模型在t时刻的两次预测值与真实值的误差;
其次,通过拉格朗日乘子法可以求出最优权重,式中:和分别为两次LightGBM模型的权重系数,系数之和为1;R=[1,1]T。综上,可以得出最终的负荷预测结果为:y1为组合模型在t时刻的负荷预测结果;y1 0和y2 0分别为LSTM网络和LightGBM模型在t时刻的负荷预测结果,通过进行两次预测结果,在通过加权系数进行二次运算(运算公式为:),进一步提高预测结果预测的准确性。
其中,所述随机森林算法用N来表示训练用例(样本)的个数,M表示特征数目,输入特征数目m,用于确定决策树上一个节点的决策结果;其中m应远小于M;从N个训练用例中以有放回抽样的方式,取样N次,形成一个训练集,并用未抽到的用例(样本)作预测,评估其误差,对于每一个节点,随机选择m个特征,决策树上每个节点的决定都是基于这些特征确定的,根据这m个特征,计算其最佳的分裂方式,随机森林算法是一种基于Bagging的集成学习方法,能够很好地处理分类和回归的问题,通过设立随机森林算法,使得准确率极高,能够有效地在大数据集上运行,引入了随机性,不容易过拟合,随机森林有很好的抗噪声能力,但是在数据噪音比较大的情况下会过拟合,能处理很高维度的数据,而且不用降维,不仅能处理离散型数据,还能处理连续型数据,而且不需要将数据集规范化,具体的通过随机森林算法对数据进行迭代,则:
在上述技术方案中,在步骤五中,还包括对输出的预测结果进行实时存储,并将存储的预测结果发送至电力负荷控制部门,电力负荷控制部门根据预测结果及时调整电力生产,使得电力产能贴近预测结果,减少出现产能过剩以及传能不足的问题,通过预测结果对实际生产进行指导,提高实际生产的准确性。
在上述技术方案中,在步骤五中,还包括建立预测结果数据库,并将预测结果实时存储在预测结果数据库中,并对预测结果数据库进行安全防护。
与现有技术相比,本发明具有如下有益效果:
本发明中,通过设置两种预测模型(分别为LightBGM模型、随机森林预测模型),先根据原始负荷数据使用第一种预测模型(即LightBGM模型)进行结果预测、获取第一预测结果,根据第一预测结果使用第二种预测模型(即随机森林预测模型)进行反向预测,得到第二预测结果,将第二预测与原始负荷数据进行比较,判断第一次预测结果是否准确,实际使用中,其中(A1、A2、...、A12)为一天中每连续两个小时内用电量,具体的A1为0时至2时中间两个小时的用电量,其余同理,将(A1、A2、...、A12)输入最优参数的LightGBM模型,得到未来十二个小时内的电力负荷为(B1、B2、...、B6),同理B1为未来两个小时内用电负荷,且(B1、B2、...、B6)为第一预测结果,然后将(B1、B2、...、B6)附着在(A1、A2、...、A12)后方,然后使用(B6、B5、...、B1、A12、A11、...、A6)这十二个数据进行反向预测,将这十二个数据输入随机森林模型得到第二预测结果,第二预测结果为(C1、C2、...、C6),在通过判断(C1、C2、...、C6)与(A1、A2、...、A6)是否相同判断(B1、B2、...、B6)的准确性,若预测负荷数据与原始负荷数据进行对比偏差小,则第一预测结果准确,直接输出第一预测结果,若预测负荷数据与原始负荷数据进行对比偏差大,调整LightGBM算法中的相关参数,然后重复步骤三以及步骤五,进行重复预测,最终得到准确的预测结果,使得预测结果的准确性大大提高。
附图说明
图1为本发明所述基于神经网络和随机森林法的电力负荷预测方法的流程图。
图2为本发明中随机森林预测流程图。
具体实施方式
下面结合附图详细说明本发明的实施情况,但它们并不构成对本发明的限定,仅作举例而已。同时通过说明使本发明的优点更加清楚和容易理解。
在本发明的描述中,需要说明的是,术语“上”、“下”、“内”、“外”“前端”、“后端”、“两端”、“一端”、“另一端”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“设置有”、“连接”等,应做广义理解,例如“连接”,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
本发明中,通过设置两种预测模型(分别为LightBGM模型、随机森林预测模型),先根据原始负荷数据使用第一种预测模型(即LightBGM模型)进行结果预测、获取第一预测结果,根据第一预测结果使用第二种预测模型(即随机森林预测模型)进行反向预测,得到第二预测结果,将第二预测与原始负荷数据进行比较,判断第一次预测结果是否准确,若预测负荷数据与原始负荷数据进行对比偏差小,则第一预测结果准确,直接输出第一预测结果;若预测负荷数据与原始负荷数据进行对比偏差大,调整LightGBM算法中的相关参数,然后重复进行预测以及反向预测在比较。本发明基于神经网络和随机森林法的电力负荷预测方法,提高了预测结果的精度。
请参照图1-2所示,本发明为一种基于神经网络和随机森林法的电力负荷预测方法,包括以下步骤:
S1:首先获取待预测电力系统的以往原始负荷数据,并建立原始数据库进行存储,具体存储的内容包括时周期分量、日周期分量以及周周期分量;
S2:将原始数据库内的原始负荷数据上传至计算机分析模块,计算机分析模块建立基于特征的LightGBM的电力负荷预测模型,通过调整LightGBM算法中的相关参数,以分配各个数据特征和因素的权重大小,然后利用数据库内海量的数据对模型进行了训练以及验证,得到最优超参数;
S4:LightGBM模型经过海量数据训练以及验证的深度学习后,根据最优超参数以及根据测量模块实时监测到的电力负荷数据,进行预测下一时间区段电力负荷,得到第一预测结果,第一预测结果为后续一段时间内电力负荷数据;
S5:根据第一预测结果,计算机分析模块内部建立随机森林算法预测模型,使用第一预测结果进行反向预测,得到第二结果,第二结果为预测负荷数据,将预测负荷数据与原始负荷数据进行对比,进而判断第一预测结果的准确性;
S6:若预测负荷数据与原始负荷数据进行对比偏差小,则第一预测结果准确,直接输出第一预测结果,若预测负荷数据与原始负荷数据进行对比偏差大,调整LightGBM算法中的相关参数,然后重复步骤S4以及步骤S5。
其中,步骤S1中,原始数据库内存储的数据建立数据库防护系统,通过设置防火墙进行数据库防护。
其中,步骤S5中,根据第一预测结果使用随机森林算法预测模型进行反向预测的流程如下:
步骤S31:使用自举法从第一预测结果中随机提取i个重复样本数据集作为每个决策树的子样本集,每个样本大小与原始数据集相同,并且每次未被取样的数据构成袋外数据;
步骤S32:对各个子样本集分别建立分类回归树,构建i棵决策树,在构建过程中,对于决策树的各个节点,随机采样原始数据变量集,获得变量子集,根据基尼指数最小准则从子集中选取最优特征进行分裂;
步骤S33:每棵分类回归树从顶部到底部递归分枝生长,达到设置叶节点的最小尺寸后决策树停止生长,所有的决策树组合成为随机森林;
步骤S34:在随机森林模型中输入测试数据,利用i棵决策树分别对子测试样本集预测,取每个决策树预测结果的平均值为预测值,最终得到第二预测结果,第二预测结果为预测负荷数据。
其中,通过M棵弱回归树线性组合为强回归树,式中:F(x)为最终的输出值;fm(x)为第m棵弱回归树的输出值,LightGBM模型的主要包括直方图算法和带深度限制的叶子生长(leaf-wise)策略,直方图算法将连续数据划分为K个整数,并构造宽度为K的直方图,遍历时将离散化的值作为索引在直方图中累积,进而搜索出最优的决策树分割点,而带深度限制的leaf-wise策略是指在每次分裂时,找到最大增益的叶子进行分裂并循环下去,同时,通过树的深度以及叶子数限制,减小模型的复杂度,防止出现过拟合,采用LightGBM模型在同一时刻预测两次得出两个负荷预测的结果之后,需要确定权重系数来进行线性组合,本实施例采用最优加权组合的方法具体步骤如下,首先求出偏差矩阵E,即式中:N为负荷采样总数;e1和e2分别为LightGBM模型在t时刻的两次预测值与真实值的误差,通过拉格朗日乘子法可以求出最优权重,式中:和分别为两次LightGBM模型的权重系数,系数之和为1;R=[1,1]T综上,可以得出最终的负荷预测结果为:y1为组合模型在t时刻的负荷预测结果;y1 0和y2 0分别为LSTM网络和LightGBM模型在t时刻的负荷预测结果,通过进行两次预测结果,在通过加权系数进行二次运算,进一步提高预测结果预测的准确性。
其中,随机森林算法用N来表示训练用例(样本)的个数,M表示特征数目,输入特征数目m,用于确定决策树上一个节点的决策结果;其中m应远小于M。从N个训练用例中以有放回抽样的方式,取样N次,形成一个训练集,并用未抽到的用例(样本)作预测,评估其误差,对于每一个节点,随机选择m个特征,决策树上每个节点的决定都是基于这些特征确定的,根据这m个特征,计算其最佳的分裂方式,随机森林算法是一种基于Bagging的集成学习方法,能够很好地处理分类和回归的问题,通过设立随机森林算法,使得准确率极高,能够有效地在大数据集上运行,引入了随机性,不容易过拟合,随机森林有很好的抗噪声能力,但是在数据噪音比较大的情况下会过拟合,能处理很高维度的数据,而且不用降维,不仅能处理离散型数据,还能处理连续型数据,而且不需要将数据集规范化,具体的通过随机森林算法对数据进行迭代,则:得到迭代的每一步都有:式中,Cj=HCj-1;Dj=GCj-1,式中,φ1n、ψ1n为每个分支分别对应正交基,序列为原数据列的下降形式,和之间信息差异为D1,φ1k为经一级分解后的低频子空间的正交基。
其中,步骤S6中,对输出的预测结果进行实时存储,并将存储的预测结果发送至电力负荷控制部门,电力负荷控制部门根据预测结果及时调整电力生产,使得电力产能贴近预测结果,减少出现产能过剩以及传能不足的问题,通过预测结果对实际生产进行指导,提高实际生产的准确性。
其中,建立预测结果数据库,并将预测结果实时存储在预测结果数据库中,并对预测结果数据库进行安全防护。
本发明在实际使用中,例如以2小时为时间单位,其中(A1、A2、...、A12)为一天中每连续两个小时内用电量,具体的A1为0时至2时中间两个小时的用电量,其余同理,将(A1、A2、...、A12)输入最优参数的LightGBM模型,得到未来十二个小时内的电力负荷为(B1、B2、...、B6),同理B1为未来两个小时内用电负荷,且(B1、B2、...、B6)为第一预测结果,然后将(B1、B2、...、B6)附着在(A1、A2、...、A12)后方,然后使用(B6、B5、...、B1、A12、A11、...、A6)这十二个数据进行反向预测,将这十二个数据输入随机森林模型得到第二预测结果,第二预测结果为(C1、C2、...、C6),再通过判断(C1、C2、...、C6)与(A1、A2、...、A6)是否相同判断(B1、B2、...、B6)的准确性,若预测负荷数据与原始负荷数据进行对比偏差小,则第一预测结果准确,直接输出第一预测结果,若预测负荷数据与原始负荷数据进行对比偏差大,调整LightGBM算法中的相关参数、再利用次LightGBM模型得到未来十二个小时内的电力负荷、然后再次利用随机森林模型进行反向预测、并再次判断第一预测结果的准确性,如此循环,最终得到准确的预测结果。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
其它未说明的部分均属于现有技术。
Claims (7)
1.一种基于神经网络和随机森林法的电力负荷预测方法,其特征在于:包括如下步骤,
步骤一:获取原始电力负荷数据;
获取待预测电力系统的以往原始负荷数据,并建立原始数据库进行存储,具体存储的内容包括时周期分量、日周期分量以及周周期分量;
步骤二:建立LightBGM模型进行深度学习并不断调节参数;
步骤三:使用LightBGM模型根据原始负荷数据进行预测;
步骤四:将第一预测结果输入随机森林预测模型进行反向预测;
根据第一预测结果,计算机分析模块内部建立随机森林算法预测模型,使用第一预测结果进行反向预测,得到第二预测结果,所述第二预测结果为预测负荷数据,将作为预测负荷数据的第二预测结果与步骤一中的原始负荷数据进行对比,进而判断第一预测结果的准确性;
步骤五:判断反向预测结果与原始负荷数据的偏差;
设偏差为5000万千瓦到8000万千瓦;
若预测负荷数据与步骤一中的原始负荷数据进行对比偏差小,则第一预测结果准确,直接输出第一预测结果;
若预测负荷数据与步骤一中的原始负荷数据进行对比偏差大,则跳转至步骤二,调整LightGBM算法中的相关参数,然后重复步骤三以及步骤五。
2.根据权利要求1所述的基于神经网络和随机森林法的电力负荷预测方法,其特征在于:步骤S1还包括对原始数据库内存储的数据建立数据库防护系统,通过设置防火墙进行数据库防护。
3.根据权利要求1或2所述的基于神经网络和随机森林法的电力负荷预测方法,其特征在于:在步骤二中,建立LightBGM模型进行深度学习并不断调节参数,具体方法为:
将原始数据库内的原始负荷数据上传至计算机分析模块,计算机分析模块建立基于特征的LightGBM的电力负荷预测模型,通过调整LightGBM算法中的相关参数,以分配各个数据特征和因素的权重大小,然后利用数据库内海量的数据对模型进行训练以及验证,得到最优超参数。
4.根据权利要求3所述的基于神经网络和随机森林法的电力负荷预测方法,其特征在于:在步骤三中,使用LightBGM模型根据原始负荷数据进行预测,具体方法为:
LightGBM模型经过海量数据训练以及验证的深度学习后,根据最优超参数以及根据测量模块实时监测到的电力负荷数据,进行预测下一时间区段电力负荷,得到第一预测结果,第一预测结果为后续一段时间内原始电力负荷数据。
5.根据权利要求4所述的基于神经网络和随机森林法的电力负荷预测方法,其特征在于:在步骤四中,将第一预测结果输入随机森林预测模型进行反向预测,具体方法为:
步骤S31:使用自举法从第一预测结果中随机提取i个重复样本数据集作为每个决策树的子样本集,每个样本大小与原始数据集相同,并且每次未被取样的数据构成袋外数据;
步骤S32:对各个子样本集分别建立分类回归树,构建i棵决策树,在构建过程中,对于决策树的各个节点,随机采样原始数据变量集,获得变量子集,根据基尼指数最小准则从子集中选取最优特征进行分裂;
步骤S33:每棵分类回归树从顶部到底部递归分枝生长,达到设置叶节点的最小尺寸后决策树停止生长,所有的决策树组合成为随机森林;
步骤S34:在随机森林模型中输入测试数据,利用i棵决策树分别对子测试样本集预测,取每个决策树预测结果的平均值为预测值,最终得到第二预测结果,第二预测结果为预测负荷数据;首先输入训练数据集D={(x1,y1),(x2,y2),...,(xn,yn)},样本集的个数T输出:最终的强分类器方f(x)对t=1,2,...,T,从原始样本集中随机的抽取m个样本点,得到一个训练集Dt;用训练集Dt训练一个CART决策树,这里在训练的过程中,对每个节点的切分规则是先从所有特征中随机的选择k个特征,然后在从这k个特征中选择最优的切分点在做左右子树的划分,如果是分类算法,则预测的最终类别为该样本点所到叶节点中投票数最多的类别;如果是回归算法,则最终的类别为该样本点所到叶节点的均值;
式中:F(x)为最终的输出值;fm(x)为第m棵弱回归树的输出值;
LightGBM模型包括直方图算法和带深度限制的叶子生长策略,直方图算法将连续数据划分为K个整数,并构造宽度为K的直方图,遍历时将离散化的值作为索引在直方图中累积,进而搜索出最优的决策树分割点,而带深度限制的leaf-wise策略是指在每次分裂时,找到最大增益的叶子进行分裂并循环下去,同时,通过树的深度以及叶子数限制,减小模型的复杂度,防止出现过拟合,采用LightGBM模型在同一时刻预测两次得出两个负荷预测的结果之后,再通过确定权重系数来进行线性组合,采用最优加权组合的方法具体步骤如下,
式中:N为负荷采样总数;e1和e2分别为LightGBM模型在t时刻的两次预测值与真实值的误差;
最后,得出最终的负荷预测结果为:y1为组合模型在t时刻的负荷预测结果;y1 0和y2 0分别为LSTM网络和LightGBM模型在t时刻的负荷预测结果,通过进行两次预测结果,在通过加权系数进行二次运算,进一步提高预测结果预测的准确性;
其中,所述随机森林算法用N来表示训练样本的个数,M表示特征数目,输入特征数目m,用于确定决策树上一个节点的决策结果;其中m远小于M;从N个训练用例中以有放回抽样的方式,取样N次,形成一个训练集,并用未抽到的样本作预测,评估其误差,对于每一个节点,随机选择m个特征,决策树上每个节点的决定都是基于这些特征确定的,根据这m个特征,计算其最佳的分裂方式,具体的通过随机森林算法对数据进行迭代,则:
6.根据权利要求5所述的基于神经网络和随机森林法的电力负荷预测方法,其特征在于:在步骤五中,还包括对输出的预测结果进行实时存储,并将存储的预测结果发送至电力负荷控制部门,电力负荷控制部门根据预测结果及时调整电力生产,使得电力产能贴近预测结果。
7.根据权利要求6所述的基于神经网络和随机森林法的电力负荷预测方法,其特征在于:在步骤五中,还包括建立预测结果数据库,并将预测结果实时存储在预测结果数据库中,并对预测结果数据库进行安全防护。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211741770.2A CN116050605A (zh) | 2022-12-30 | 2022-12-30 | 一种基于神经网络和随机森林法的电力负荷预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211741770.2A CN116050605A (zh) | 2022-12-30 | 2022-12-30 | 一种基于神经网络和随机森林法的电力负荷预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116050605A true CN116050605A (zh) | 2023-05-02 |
Family
ID=86124990
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211741770.2A Pending CN116050605A (zh) | 2022-12-30 | 2022-12-30 | 一种基于神经网络和随机森林法的电力负荷预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116050605A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116401680A (zh) * | 2023-06-08 | 2023-07-07 | 北京网藤科技有限公司 | 基于梯度提升决策树算法的工控漏洞检测方法和系统 |
CN116738376A (zh) * | 2023-07-06 | 2023-09-12 | 广东筠诚建筑科技有限公司 | 一种基于振动或磁场唤醒的信号采集识别方法及系统 |
-
2022
- 2022-12-30 CN CN202211741770.2A patent/CN116050605A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116401680A (zh) * | 2023-06-08 | 2023-07-07 | 北京网藤科技有限公司 | 基于梯度提升决策树算法的工控漏洞检测方法和系统 |
CN116738376A (zh) * | 2023-07-06 | 2023-09-12 | 广东筠诚建筑科技有限公司 | 一种基于振动或磁场唤醒的信号采集识别方法及系统 |
CN116738376B (zh) * | 2023-07-06 | 2024-01-05 | 广东筠诚建筑科技有限公司 | 一种基于振动或磁场唤醒的信号采集识别方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116050605A (zh) | 一种基于神经网络和随机森林法的电力负荷预测方法 | |
CN108921339B (zh) | 基于分位数回归的遗传支持向量机光伏功率区间预测方法 | |
CN108205717A (zh) | 一种光伏发电功率多时间尺度预测方法 | |
CN108038300A (zh) | 基于改进的隶属度函数结合神经网络的光纤状态评估方法 | |
CN105046376A (zh) | 考虑指标相关性的水库群防洪调度方案优选方法 | |
CN112580174A (zh) | 一种基于遗传算法优化神经网络的配电网线损率计算方法 | |
CN112529147A (zh) | 断面水质中的氨氮含量预测方法及装置 | |
CN110766190A (zh) | 一种配电网负荷预测方法 | |
CN112307927A (zh) | 基于bp网络针对非合作通信中mpsk信号的识别研究 | |
CN114626487B (zh) | 基于随机森林分类算法的线变关系校核方法 | |
CN102680646A (zh) | 一种不饱和聚酯树脂反应釜中反应物浓度软测量方法 | |
CN115358437A (zh) | 基于卷积神经网络的供电负荷预测方法 | |
CN115169719A (zh) | 一种基于模糊聚类和bp神经网络的台区状态预测模型 | |
CN115204698A (zh) | 一种低压台区供电稳定性的实时分析方法 | |
CN106405683B (zh) | 基于g-l混合噪声特性核岭回归技术的风速预报方法及装置 | |
CN113033898A (zh) | 基于k均值聚类与bi-lstm神经网络的电负荷预测方法及系统 | |
CN117574776A (zh) | 一种面向任务规划的模型自学习优化方法 | |
CN112381667A (zh) | 一种基于深度学习的配网电气拓扑识别方法 | |
CN117034762A (zh) | 一种基于多算法加权和的复合模型锂电池寿命预测方法 | |
CN116167465A (zh) | 基于多变量时间序列集成学习的太阳辐照度预测方法 | |
CN112014757A (zh) | 一种容量增量分析与遗传小波神经网络融合的电池soh估计方法 | |
CN116596129A (zh) | 一种电动汽车充电场站短期负荷预测模型构建方法 | |
CN116822742A (zh) | 一种基于动态分解-重构集成处理的电力负荷预测方法 | |
Gao et al. | Establishment of economic forecasting model of high-tech industry based on genetic optimization neural network | |
CN112465253B (zh) | 一种城市路网中的链路预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |