CN114580763A - 一种基于改进蜻蜓与轻量级梯度提升树模型的电力负荷预测方法 - Google Patents
一种基于改进蜻蜓与轻量级梯度提升树模型的电力负荷预测方法 Download PDFInfo
- Publication number
- CN114580763A CN114580763A CN202210234580.5A CN202210234580A CN114580763A CN 114580763 A CN114580763 A CN 114580763A CN 202210234580 A CN202210234580 A CN 202210234580A CN 114580763 A CN114580763 A CN 114580763A
- Authority
- CN
- China
- Prior art keywords
- dragonfly
- individual
- formula
- algorithm
- histogram
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 241000238633 Odonata Species 0.000 title claims abstract description 95
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 29
- 238000003066 decision tree Methods 0.000 claims abstract description 13
- 238000012549 training Methods 0.000 claims abstract description 13
- 238000012360 testing method Methods 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 11
- 230000003044 adaptive effect Effects 0.000 claims abstract description 8
- 238000010606 normalization Methods 0.000 claims abstract description 7
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 239000013598 vector Substances 0.000 claims description 33
- 230000006399 behavior Effects 0.000 claims description 16
- 238000000926 separation method Methods 0.000 claims description 10
- 238000004220 aggregation Methods 0.000 claims description 5
- 230000002776 aggregation Effects 0.000 claims description 5
- 230000015572 biosynthetic process Effects 0.000 claims description 5
- 230000002431 foraging effect Effects 0.000 claims description 5
- 230000006870 function Effects 0.000 claims description 5
- 230000035772 mutation Effects 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 230000001133 acceleration Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 150000001875 compounds Chemical class 0.000 claims description 3
- 238000005755 formation reaction Methods 0.000 claims description 3
- 238000005295 random walk Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 230000024703 flight behavior Effects 0.000 claims description 2
- 230000019637 foraging behavior Effects 0.000 claims description 2
- 238000007689 inspection Methods 0.000 claims description 2
- 235000001968 nicotinic acid Nutrition 0.000 claims description 2
- 239000002245 particle Substances 0.000 claims description 2
- 238000011160 research Methods 0.000 claims description 2
- 238000010845 search algorithm Methods 0.000 claims description 2
- 238000013459 approach Methods 0.000 claims 1
- 230000003111 delayed effect Effects 0.000 claims 1
- 238000012217 deletion Methods 0.000 claims 1
- 230000037430 deletion Effects 0.000 claims 1
- 230000000694 effects Effects 0.000 claims 1
- 238000001914 filtration Methods 0.000 claims 1
- 238000011430 maximum method Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/003—Load forecast, e.g. methods or systems for forecasting future load demand
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Power Engineering (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Operations Research (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Entrepreneurship & Innovation (AREA)
- Primary Health Care (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于引入自适应学习因子和差分进化策略的蜻蜓与轻量级梯度提升树模型的电力负荷预测方法,涉及信息技术领域。首先进行数据预处理,包括缺失值处理、数据规范化、异常值处理和数据规范化。将改进后的蜻蜓算法对轻量级梯度提升决策树模型参数优化,将改进后的轻量级梯度提升树模型用于电力负荷预测。按照7∶3划分训练集与测试集,将训练集用于模型训练,用改进蜻蜓算法寻优,得到最优参数下的轻量级梯度提升树模型,通过测试集进行测试,在满足给定的预测误差情况下,对电力负荷进行预测。
Description
技术领域
本发明公开了一种基于改进蜻蜓与轻量级梯度提升树模型的电力负荷预测方法,涉及信息技术领域和电力负荷预测技术领域。
背景技术
目前,电力工业在我国飞速发展,但是其受限于目前技术无法对电能进行大规模存储,而过多生产电力会导致资源浪费,电力生产不足会影响到正常的经济生活。所以,设计一个高精度的电力负荷预测模型以预测未来用电量是要解决的技术问题之一。
现有技术中,主要有两大类方法可以实现电力负荷预测:一类是用时间序列方法来实现预测,其实质是对历史数据的拟合,一类是用机器学习方法预测,例如决策树、支持向量机等。但是上述传统预测方法存在一定缺陷,例如,时间序列方法无法使用多变量数据预测,机器学习方法需要寻求最优参数,并且寻参时容易陷入局部最优。
发明内容
本发明针对电力负荷预测精度不高的问题,提供一种基于改进蜻蜓与轻量级梯度提升树模型的电力负荷预测方法。为避免陷入局部最优,使用引入自适应学习因子和差分进化策略的蜻蜓算法对轻量级梯度提升树模型进行参数寻优,用寻优后的模型完成对电力负荷的预测。
为了解决上述技术问题,本发明提供了一种基于改进蜻蜓与轻量级梯度提升树模型的电力负荷预测方法,包括步骤:
S101:数据预处理包括缺失值处理、数据规范化、异常值处理以及数据离散化;
S102:本发明提出改进后的蜻蜓算法对轻量级梯度提升树模型的训练参数进行优化,并将改进的轻量级梯度提升树模型应用于电力负荷预测。
S1021:本发明提出低内存使用,可处理大规模数据的轻量级梯度提升树模型对电力负荷进行预测。
轻量级梯度提升树模型采用了基于直方图的决策树算法,首先把样本中连续的浮点特征离散化成k个整数,并构造一个宽度为k的直方图。然后在遍历数据的时候,把离散化后的值作为索引在直方图中积累统计量,一次遍历结束之后,直方图积累了需要的统计量,最后通过直方图的离散值遍历找出最佳的分割点;这样将大规模的数据放到了直方图中,使得内存占用更小,模型运算更快更加稳定。在此基础上,轻量级梯度提升树模型通过直方图做差加速,一个叶子的直方图可以由它的父亲节点和兄弟节点的直方图做差来获得,并且直方图的宽度都为k,在构造直方图时,遍历该叶子上的所有数据,可以通过直方图做差只需遍历k次,大大提升了运行速度;轻量级梯度提升树模型还可以通过先计算直方图小的叶子节点,然后通过做差来获得直方图大的兄弟节点,用较小的代价得到其他兄弟节点的直方图;
针对使用按层生长的Level-wise决策树生长策略效率低下的问题,轻量级梯度提升树模型采用了较高效的带有深度限制的按叶子生长Leaf-wise策略;Level-wise在进行遍历数据时可以同时分裂同一层的叶子,不易造成过拟合,但是在遍历时不加以区分同一层叶子的分裂增益,增大了计算开销;
Leaf-wise可以根据当前所有叶子中分裂增益最大的一个叶子进行分裂,并以此循环,这样在分裂次数相同的情况下,Leaf-wise可以降低误差,获得更高的精度;为避免模型生出较深的决策树而产生过拟合,轻量级梯度提升树模型在此基础上增加了最大深度限制,这样既保证了低误差、高效率,还可以防止过拟合;
S1022:蜻蜓算法是一种基于仿生学提出的启发式搜索算法,研究表明,在自然界中,蜻蜓的生活习性可以归纳为分离、结队、聚集、觅食和避敌五种行为;而群体的主要目标是为了生存,所以群体中个体都会被食物吸引,并躲避敌人。因此,该群体具有五种不同类型的行为来更新个体的位置,设五种行为的位置向量分别为Si,Ai,Ci,Fi,Ei,这些行为通过以下公式进行数学建模:
(1)、分离行为
式中,i=1,2,…,Np;j=1,2,…,N,Si是第i个蜻蜓个体分离后的位置。N指与第i个蜻蜓个体相邻的个体数,当两个蜻蜓的欧式距离小于搜索半径r,详见式(6),就表示这两个个体是相邻个体。Np表示群体的数量,X,Xj分别是目前的蜻蜓个体和第j个蜻蜓个体的位置;
(2)、结队行为
式中,Ai第i个蜻蜓个体结队后的位置,Vj表示第j个相邻蜻蜓个体的速度;
(3)、聚集行为
式中,Ci第i个蜻蜓个体聚集后的位置;
(4)、觅食行为
Fi=X+-X (4)
式中,Fi表示第i个蜻蜓个体食物源的位置,X+表示食物源的位置,也代表当前个体的最佳适应度值;
(5)、避敌行为
Ei=X+X- (5)
式中,Ei表示第i个蜻蜓个体敌人的位置X-表示敌人的位置,也代表当前个体的最差适应度值;
食物源的位置和敌人的位置分别是从当前蜻蜓发现的最佳适应度和最差适应度选择的。一旦蜻蜓的位置、敌人和食物来源得到更新,就需要更新相邻蜻蜓的半径,搜索半径的公式如式(6)所示。为了更新蜻蜓的位置并在搜索空间中模拟飞行行为,设置了两个向量:步长(ΔX)和位置(X),步长向量计算如式(7)所示:
r=(ub-lb)/4+((ub-lb)×(t/max_iteration)×2) (6)
ΔXt+1=ωXt+(sSi+aAi+cCi+fFi+eEi) (7)
式中,ub,lb为搜索半径的上下限,t表示当前迭代次数,max_iteration为最大迭代次数,s,a,c,f,e分别指分离权重、结队权重、聚集权重、觅食权重和避敌权重,ω表示惯性权重。
在附近有相邻蜻蜓个体的情况下,位置向量更新如式(8)所示:
Xt+1=Xt+ΔXt+1 (8)
当附近没有相邻蜻蜓个体时,将引入随机行走策略以增强搜索的随机性,计算如下:
Xt+1=Le′vy(d)×Xt+Xt (9)
式中,d表示蜻蜓个体位置矢量X的维度,Le′vy飞行策略可以这样描述:
式中,r1,r2是范围在[0,1]的随机数,β为常数,这里取默认值1.5,Γ(x)=(x-1)!。
S1023:改进的蜻蜓算法对LightGBM模型训练参数进行优化,通过以下两方面进行改进:
1.引入自适应学习因子:蜻蜓适应度的相对变化率定义如式(12)所示:
第t次迭代中第i蜻蜓的自适应学习因子表示如式(13)所示:
当附近有相邻蜻蜓个体时,第t次迭代中第i蜻蜓的位置矢量描述如式(14)所示:
当附近没有相邻蜻蜓个体时,第t次迭代中第i蜻蜓的位置矢量如(15)所示:
2.引入差分进化策略:这里通过利用差分算法在蜻蜓算法的迭代后期,对蜻蜓个体进行差分变异、交叉和选择操作,以便算法进行全局最优搜索。采用DE/best/1突变策略和动态比例因子,具体计算如式(16)所示:
式中,j=1,2,…,d,j0∈{1,2,…,d}是随机维度,pCR表示[0,1]范围内的交叉概率。
最后通过比较适应度值来更新种群,选择新位置矢量的策略如式(19)所示:
IDA算法的具体步骤如下:
步骤1:参数设置,包括最大迭代次数、种群数量、惯性权重ω和粒子的上下边界。
步骤2:初始化蜻蜓位置向量(X)和步长向量(ΔX)。
步骤3:开始迭代,更新分离、结队、聚集、觅食和避敌的权重系数s,a,c,f,e并评估种群适应度值,根据上述的初始化值随机初始化原始相邻半径r,然后更新食物和敌人的位置。
步骤4:分别更新Si,Ai,Ci,Fi,Ei的值,即第i个蜻蜓个体分离后、结对后、聚集后和食物源、天敌的位置,并更新步长向量。若当前蜻蜓个体附近没有相邻个体时,按照式(15)更新位置向量,否则按照式(14)更新位置向量。
步骤5:对每个蜻蜓个体执行差分进化策略。
步骤6:判断是否满足终止条件,若达到设定的最大迭代次数则停止迭代并输出最佳适应度值,否则迭代次数加1,返回步骤3。
本发明主要利用改进的蜻蜓算法算法对LightGBM模型的三个参数步长(learning_rate),决策树最大深度(max_depth)和最大叶子节点数(max_leaf_nodes)进行参数调优。训练集与实际值的误差作为适应度函数f(x),寻找最优参数下的LightGBM模型,在满足给定的预测误差情况下,对电力负荷进行预测。
附图说明
图1是本发明总体流程图;
图2是LightGBM算法示意图;
具体实施方式
结合图1,本发明基于改进蜻蜓与轻量级梯度提升树模型进行电力负荷预测,包括以下步骤:
A、采集数据处理,数据预处理包括缺失值处理、数据规范化、异常值处理以及数据离散化。并且划分训练集与测试集
B、LightGBM模型采用了基于直方图(Histogram)的决策树算法,首先把样本中连续的浮点特征离散化成k个整数,并构造一个宽度为k的直方图。然后在遍历数据的时候,把离散化后的值作为索引在直方图中积累统计量,一次遍历结束之后,直方图积累了需要的统计量,最后通过直方图的离散值遍历找出最佳的分割点。这样将大规模的数据放到了直方图中,使得内存占用更小,模型运算更快更加稳定。在此基础上,LightGBM模型通过直方图做差加速,一个叶子的直方图可以由它的父亲节点和兄弟节点的直方图做差来获得,并且直方图的宽度都为k,在构造直方图时,遍历该叶子上的所有数据,可以通过直方图做差只需遍历k次,大大提升了运行速度。LightGBM还可以通过先计算直方图小的叶子节点,然后通过做差来获得直方图大的兄弟节点,用较小的代价得到其他兄弟节点的直方图。
针对使用按层生长(Level-wise)的决策树生长策略效率低下的问题,LightGBM采用了较高效的带有深度限制的按叶子生长(Leaf-wise)策略。Level-wise在进行遍历数据时可以同时分裂同一层的叶子,不易造成过拟合,但是在遍历时不加以区分同一层叶子的分裂增益,增大了计算开销。
Leaf-wise可以根据当前所有叶子中分裂增益最大的一个叶子进行分裂,并以此循环,这样在分裂次数相同的情况下,Leaf-wise可以降低误差,获得更高的精度。为避免模型生出较深的决策树而产生过拟合,LightGBM在此基础上增加了最大深度限制,这样既保证了低误差、高效率,还可以防止过拟合。
改进的蜻蜓算法对LightGBM模型训练参数进行优化,其特征在于:
1.引入自适应学习因子:蜻蜓适应度的相对变化率定义如式(1)所示:
第t次迭代中第i蜻蜓的自适应学习因子表示如式(2)所示:
当附近有相邻蜻蜓个体时,第t次迭代中第i蜻蜓的位置矢量描述如式(3)所示:
当附近没有相邻蜻蜓个体时,第t次迭代中第i蜻蜓的位置矢量如(4)所示:
2.引入差分进化策略:这里通过利用DE算法在DA算法的迭代后期,对蜻蜓个体进行差分变异、交叉和选择操作,以便算法进行全局最优搜索。采用DE/best/1突变策略和动态比例因子,具体计算如式(5)所示:
式中,j=1,2,…,d,j0∈{1,2,…,d}是随机维度,pCR表示[0,1]范围内的交叉概率。
最后通过比较适应度值来更新种群,选择新位置矢量的策略如式(8)所示:
C、所述的测试集进行模型检验,在训练集上完成模型的训练后,用测试集进行评估,计算实际值与预测值的准确率,在满足给定的预测误差情况下,对电力负荷进行预测。
Claims (6)
1.一种基于改进蜻蜓与轻量级梯度提升树模型的电力负荷预测方法,其特征在于,所述方法包括:
S101:采集数据预处理,本发明的数据预处理包括缺失值处理、数据规范化、异常值处理、数据离散化;
S102:基于引入自适应学习因子和差分进化策略的蜻蜓算法对轻量级梯度提升树模型的训练参数进行优化,并将改进的轻量级梯度提升树模型应用于电力负荷预测;
S103:结合测试集进行模型检验,计算预测值与实际值的误差,验证模型的优良。
2.根据权利要求1所述的电力负荷预测方法,其特征在于:
S1011:本发明中对数据进行预处理时,对于缺失值处理的三种方法:直接删除法;替换插值;预测插补;常见的数据规范化有三种方法:最小最大法;log函数规范化;零-均值规范化;常见的特征选择类型分为三类:过滤式、包裹式、嵌入式。
3.根据权利要求1所述的电力负荷预测方法,其特征在于:
S1021:本发明提出低内存使用,可处理大规模数据的轻量级梯度提升树模型对电力负荷进行预测;
轻量级梯度提升树模型采用了基于直方图的决策树算法,首先把样本中连续的浮点特征离散化成k个整数,并构造一个宽度为k的直方图;然后在遍历数据的时候,把离散化后的值作为索引在直方图中积累统计量,一次遍历结束之后,直方图积累了需要的统计量,最后通过直方图的离散值遍历找出最佳的分割点。这样将大规模的数据放到了直方图中,使得内存占用更小,模型运算更快更加稳定;在此基础上,轻量级梯度提升树模型通过直方图做差加速,一个叶子的直方图可以由它的父亲节点和兄弟节点的直方图做差来获得,并且直方图的宽度都为k,在构造直方图时,遍历该叶子上的所有数据,可以通过直方图做差只需遍历k次,大大提升了运行速度。轻量级梯度提升树还可以通过先计算直方图小的叶子节点,然后通过做差来获得直方图大的兄弟节点,用较小的代价得到其他兄弟节点的直方图;
针对使用按层生长的Level-wise决策树生长策略效率低下的问题,轻量级梯度提升树采用了较高效的带有深度限制的按叶子生长的Leaf-wise策略;Level-wise在进行遍历数据时可以同时分裂同一层的叶子,不易造成过拟合,但是在遍历时不加以区分同一层叶子的分裂增益,增大了计算开销;
Leaf-wise可以根据当前所有叶子中分裂增益最大的一个叶子进行分裂,并以此循环,这样在分裂次数相同的情况下,Leaf-wise可以降低误差,获得更高的精度;为避免模型生出较深的决策树而产生过拟合,轻量级梯度提升树在此基础上增加了最大深度限制,这样既保证了低误差、高效率,还可以防止过拟合。
4.权利要求1所述的电力负荷预测方法,其特征在于:
S1022:蜻蜓算法是一种基于仿生学提出的启发式搜索算法,研究表明,在自然界中,蜻蜓的生活习性可以归纳为分离、结队、聚集、觅食和避敌五种行为;而群体的主要目标是为了生存,所以群体中个体都会被食物吸引,并躲避敌人;因此,该群体具有五种不同类型的行为来更新个体的位置,设五种行为的位置向量分别为Si,Ai,Ci,Fi,Ei,这些行为通过以下公式进行数学建模:
(1)、分离行为
式中,i=1,2,…,Np;j=1,2,…,N,Si是第i个蜻蜓个体分离后的位置。N指与第i个蜻蜓个体相邻的个体数,当两个蜻蜓的欧式距离小于搜索半径r,详见式(6),就表示这两个个体是相邻个体;Np表示群体的数量,X,Xj分别是目前的蜻蜓个体和第j个蜻蜓个体的位置;
(2)、结队行为
式中,Ai第i个蜻蜓个体结队后的位置,Vj表示第j个相邻蜻蜓个体的速度;
(3)、聚集行为
式中,Ci第i个蜻蜓个体聚集后的位置;
(4)、觅食行为
Fi=X+-X (4)
式中,Fi表示第i个蜻蜓个体食物源的位置,X+表示食物源的位置,也代表当前个体的最佳适应度值;
(5)、避敌行为
Ei=X+X- (5)
式中,Ei表示第i个蜻蜓个体敌人的位置X-表示敌人的位置,也代表当前个体的最差适应度值;
食物源的位置和敌人的位置分别是从当前蜻蜓发现的最佳适应度和最差适应度选择的。一旦蜻蜓的位置、敌人和食物来源得到更新,就需要更新相邻蜻蜓的半径,搜索半径的公式如式(6)所示;为了更新蜻蜓的位置并在搜索空间中模拟飞行行为,设置了两个向量:步长(ΔX)和位置(X),步长向量计算如式(7)所示:
r=(ub-lb)/4+((ub-lb)×(t/max_iteration)×2) (6)
ΔXt+1=ωXt+(sSi+aAi+cCi+fFi+eEi) (7)
式中,ub,lb为搜索半径的上下限,t表示当前迭代次数,max_iteration为最大迭代次数,s,a,c,f,e分别指分离权重、结队权重、聚集权重、觅食权重和避敌权重,ω表示惯性权重;
在附近有相邻蜻蜓个体的情况下,位置向量更新如式(8)所示:
Xt+1=Xt+ΔXt+1 (8)
当附近没有相邻蜻蜓个体时,将引入随机行走策略以增强搜索的随机性,计算如下:
Xt+1=Le′vy(d)×Xt+Xt (9)
式中,d表示蜻蜓个体位置矢量X的维度,Le′vy飞行策略可以这样描述:
式中,r1,r2是范围在[0,1]的随机数,β为常数,这里取默认值1.5,Γ(x)=(x-1)!。
5.根据权利要求1所述的电力负荷预测方法,其特征在于:
S1023:蜻蜓算法易于理解与实现,而且在一些系统优化方面表现比粒子群算法更有效果。但是蜻蜓算法在个体周围没有相邻个体时会减缓收敛趋势,并降低收敛精度,同时容易陷入局部最优,使得搜索过程停滞不前;本发明通过以下两方面进行改进:
(1)引入自适应学习因子
为了解决这个问题蜻蜓周围没有相邻个体时,个体将执行Le′vy随机游走策略,会减缓收敛趋势,并在有限的迭代次数下降低收敛精度的问题,引入了自适应学习因子;蜻蜓适应度的相对变化率定义如式(12)所示:
第t次迭代中第i蜻蜓的自适应学习因子表示如式(13)所示:
当附近有相邻蜻蜓个体时,第t次迭代中第i蜻蜓的位置矢量描述如式(14)所示:
当附近没有相邻蜻蜓个体时,第t次迭代中第i蜻蜓的位置矢量如(15)所示:
(2)引入差分进化策略
为了避免算法陷入局部最优,引入了差异进化策略(Differential Evolution,DE)来维持种群的多样性,确保种群的个体具有更强的搜索能力和适应性,更容易找到全局最优解;这里通过利用DE算法在DA算法的迭代后期,对蜻蜓个体进行差分变异、交叉和选择操作,以便算法进行全局最优搜索。采用DE/best/1突变策略和动态比例因子,具体计算如式(16)所示:
式中,j=1,2,…,d,j0∈{1,2,…,d}是随机维度,pCR表示[0,1]范围内的交叉概率;
最后通过比较适应度值来更新种群,选择新位置矢量的策略如式(19)所示:
本发明主要利用改进的蜻蜓算法算法对LightGBM模型的三个参数步长(learning_rate),决策树最大深度(max_depth)和最大叶子节点数(max_leaf_nodes)进行参数调优;训练集与实际值的误差作为适应度函数f(x),寻找最优参数下的LightGBM模型,提高模型的准确率。
6.据权利要求1所述的电力负荷预测方法,其特征在于:
S1031:训练完成后,通过测试集进行测试,在满足给定的预测误差情况下,对电力负荷进行预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210234580.5A CN114580763A (zh) | 2022-03-10 | 2022-03-10 | 一种基于改进蜻蜓与轻量级梯度提升树模型的电力负荷预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210234580.5A CN114580763A (zh) | 2022-03-10 | 2022-03-10 | 一种基于改进蜻蜓与轻量级梯度提升树模型的电力负荷预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114580763A true CN114580763A (zh) | 2022-06-03 |
Family
ID=81779776
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210234580.5A Pending CN114580763A (zh) | 2022-03-10 | 2022-03-10 | 一种基于改进蜻蜓与轻量级梯度提升树模型的电力负荷预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114580763A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115063415A (zh) * | 2022-08-08 | 2022-09-16 | 山东正阳科技有限公司 | 一种基于机器视觉的车桥焊接区域识别方法 |
CN116628425A (zh) * | 2023-06-01 | 2023-08-22 | 常州易宝网络服务有限公司 | 一种大数据实时监控系统及方法 |
-
2022
- 2022-03-10 CN CN202210234580.5A patent/CN114580763A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115063415A (zh) * | 2022-08-08 | 2022-09-16 | 山东正阳科技有限公司 | 一种基于机器视觉的车桥焊接区域识别方法 |
CN115063415B (zh) * | 2022-08-08 | 2022-11-01 | 山东正阳科技有限公司 | 一种基于机器视觉的车桥焊接区域识别方法 |
CN116628425A (zh) * | 2023-06-01 | 2023-08-22 | 常州易宝网络服务有限公司 | 一种大数据实时监控系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | Hybrid particle swarm optimization with spiral-shaped mechanism for feature selection | |
Varol Altay et al. | Performance analysis of multi-objective artificial intelligence optimization algorithms in numerical association rule mining | |
Luo et al. | Species-based particle swarm optimizer enhanced by memory for dynamic optimization | |
CN114580763A (zh) | 一种基于改进蜻蜓与轻量级梯度提升树模型的电力负荷预测方法 | |
CN116934220A (zh) | 一种基于智能数据分析和算法优化的智慧仓储布局方法 | |
Lei et al. | Improved artificial bee colony algorithm and its application in data clustering | |
CN113392983B (zh) | 自动机器学习的超参数自适应寻优优化系统和方法 | |
CN107783998A (zh) | 一种数据处理的方法以及装置 | |
Kuo et al. | An improved differential evolution with cluster decomposition algorithm for automatic clustering | |
Ducange et al. | Multi-objective evolutionary fuzzy systems | |
CN111079074A (zh) | 一种基于改进的正弦余弦算法构建预测模型的方法 | |
CN113139570A (zh) | 一种基于最优混合估值的大坝安全监测数据补全方法 | |
CN116993548A (zh) | 基于增量学习的LightGBM-SVM的教育培训机构信用评估方法及系统 | |
Pal et al. | ESOEA: Ensemble of single objective evolutionary algorithms for many-objective optimization | |
Guo et al. | Reducing evaluation cost for circuit synthesis using active learning | |
Liu et al. | Improved GWO and its application in parameter optimization of Elman neural network | |
CN107766887A (zh) | 一种局部加权的不完整数据混杂聚类方法 | |
Zheng et al. | Adaptive particle Swarm optimization algorithm ensemble model applied to classification of unbalanced data | |
Papasani et al. | A novel feature selection algorithm using multi-objective improved honey badger algorithm and strength pareto evolutionary algorithm-II | |
CN114564681A (zh) | 一种林地土壤无机盐含量数据分析方法 | |
Ma et al. | Feature selection using forest optimization algorithm based on contribution degree | |
Zhang et al. | Multi-objective optimization algorithm based on improved particle swarm in cloud computing environment | |
Yin et al. | An improved artificial bee colony algorithm for staged search | |
Zhang et al. | A multi-objective particle swarm optimization based on local ideal points | |
Singh et al. | Differential Evolution Algorithm for Multimodal Optimization: A Short Survey |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |