CN113496315B - 基于分位数梯度提升决策树的负荷区间预测方法及系统 - Google Patents

基于分位数梯度提升决策树的负荷区间预测方法及系统 Download PDF

Info

Publication number
CN113496315B
CN113496315B CN202111046819.8A CN202111046819A CN113496315B CN 113496315 B CN113496315 B CN 113496315B CN 202111046819 A CN202111046819 A CN 202111046819A CN 113496315 B CN113496315 B CN 113496315B
Authority
CN
China
Prior art keywords
quantile
decision tree
gradient
modal
load
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111046819.8A
Other languages
English (en)
Other versions
CN113496315A (zh
Inventor
黄园芳
段新辉
郑世明
李玲
林荣秋
吴莉琳
魏焱
刘云凯
彭显刚
付振宇
吴超成
陈宇钊
王志强
曹彦朝
谢卓均
李琦
王奕
张俊宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhanjiang Power Supply Bureau of Guangdong Power Grid Co Ltd
Original Assignee
Zhanjiang Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhanjiang Power Supply Bureau of Guangdong Power Grid Co Ltd filed Critical Zhanjiang Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority to CN202111046819.8A priority Critical patent/CN113496315B/zh
Publication of CN113496315A publication Critical patent/CN113496315A/zh
Application granted granted Critical
Publication of CN113496315B publication Critical patent/CN113496315B/zh
Priority to PCT/CN2022/079202 priority patent/WO2023035564A1/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Marketing (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Pure & Applied Mathematics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Primary Health Care (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请公开了一种基于分位数梯度提升决策树的负荷区间预测方法及系统,通过采用集总经验模态对原始配电网台区负荷序列进行分解,得到不同特征的模态分量,降低了后续分位数梯度提升决策树预测模型训练的复杂程度,提高了预测的准确性,并采用核密度估计方法得到概率密度函数,避免构造概率分布的主观性和先验性,提高了配电网台区负荷区间预测的可靠性和准确性,同时,利用决策树采样的随机性确保样本之间学习的多样化,使得分位数梯度提升决策树不易陷入过拟合风险,具有良好的泛化能力。

Description

基于分位数梯度提升决策树的负荷区间预测方法及系统
技术领域
本申请涉及电力负荷预测技术领域,尤其涉及一种基于分位数梯度提升决策树的负荷区间预测方法及系统。
背景技术
随着智能配电网的建设和大数据技术的快速发展,配电网台区海量数据的采集与存储问题在近年来得以解决,为实现配电网台区精细化管理提供了完备的数据基础和技术条件。然而配电网台区负荷直接与用户用电行为息息相关,相比系统级负荷,具有较高的不确定性,客观上直接影响传统配电网台区负荷预测的准确度,给配电网安全稳定运行造成较大的影响。传统配电网台区负荷预测采用点预测方法,仅仅给出单一的确定性数值,无法计及未来配电网台区负荷可能的概率分布,在涉及负荷不确定性分析的问题上难以满足实际需求。
而配电网台区负荷区间预测方法能够得到未来某一时间点上配电网台区负荷的置信区间,实现对负荷不确定性的有效量化,因此在配电网风险预警评估、精准规划与优化调度等方面具有一定的应用价值与研究意义。
而现有技术中,多是采用预测误差分布统计法、概率式预测方法或传统分位数回归方法,其中,预测误差分布统计法对历史数据质量要求较高,且划分统计区间存在一定的主观性,而且对参数的设定较为敏感,很大程度上影响构造历史预测误差分布的可靠性;概率式预测方法通常假定配电网台区负荷服从某种特定的分布,然而这种假定的有效性难以通过统计方法得到严格证明,容易与实际分布存在较大的偏差,从而影响配电网台区负荷区间预测的准确性。传统分位数回归方法大多基于浅层的机器学习算法如BP神经网络,容易在模型训练阶段陷入局部最优解,导致模型泛化能力不足。
发明内容
本申请提供了一种基于分位数梯度提升决策树的负荷区间预测方法及系统,用于解决上述预测的可靠性和准确性差且泛化能力不足的技术问题。
有鉴于此,本申请第一方面提供了一种基于分位数梯度提升决策树的负荷区间预测方法,包括以下步骤:
S1、采用集总经验模态对原始配电网台区负荷序列进行分解,得到若干个模态分量,对每个模态分量进行归一化处理;
S2、对每个模态分量分别建立分位数梯度提升决策树预测模型,得到各个模态分量在不同分位数条件下的预测值,将各个模态分量的预测值进行累加,得到预测值在预设的分位点时的条件分布;
S3、采用核密度估计方法在所述预测值在预设的分位点时的条件分布中得到未来配电网台区负荷的概率密度函数;
S4、通过所述概率密度函数计算求得满足预定的置信水平下的置信区间,从而输出配电网台区负荷区间预测结果。
优选地,所述步骤S1之前包括:
根据预设采样周期采集配电网台区负荷的原始数据,对所述原始数据进行数据清洗,得到原始配电网台区负荷序列,所述原始配电网台区负荷序列具有时序性,所述原始数据包括有功功率。
优选地,所述步骤S1具体包括:
S101、在所述原始配电网台区负荷序列中加入高斯白噪声得到新的配电网台区负荷序列,利用集总经验模态对所述新的配电网台区负荷序列进行分解,得到若干个模态分量,所述模态分量包括若干个本征模态分量和一个残差分量;
S102、重复M次步骤S101,从而每次向所述原始配电网台区负荷序列加入不同的高斯白噪声,以得到M组本征模态分量和残差分量;
S103、对M组本征模态分量和残差分量分别求取均值,从而得到若干个本征模态分量均值和一个残差分量均值,其中,所述本征模态分量均值表示为,
Figure 99283DEST_PATH_IMAGE001
所述残差分量均值表示为,
Figure 260268DEST_PATH_IMAGE002
式中,
Figure 373718DEST_PATH_IMAGE003
为第m组第i个本征模态分量,
Figure 236631DEST_PATH_IMAGE004
Figure 647890DEST_PATH_IMAGE005
为第m组残差分量;
对每个模态分量通过下式进行归一化处理,
Figure 647070DEST_PATH_IMAGE006
式中,
Figure 611047DEST_PATH_IMAGE007
Figure 23574DEST_PATH_IMAGE008
分别表示归一化前和归一化后的模态分量数值,
Figure 989256DEST_PATH_IMAGE009
Figure 357789DEST_PATH_IMAGE010
分别为模态分量数值中的最小值和最大值。
优选地,步骤S2具体包括:
S201、通过归一化后的若干个所述模态分量选取训练样本和测试样本以分别构建训练集和测试集;
S202、假设所述训练样本定义为
Figure 485145DEST_PATH_IMAGE011
,其中,
Figure 73384DEST_PATH_IMAGE012
Figure 639494DEST_PATH_IMAGE013
分别为训练样本的属性和标签,
Figure 878846DEST_PATH_IMAGE014
,R表示实数域,N表示维度,基于决策树算法对每个决策树依次采用Bootstrap策略有放回地随机抽取m个训练样本,则生成由n个决策树组合成的分位数梯度提升决策树,其中,n为预设的决策树数量;
S203、随机选择某个待切分属性j,将属性j上所有取值从小到大排序,记为
Figure 426371DEST_PATH_IMAGE015
,通过下式得到属性j上的候选划分点集合
Figure 813490DEST_PATH_IMAGE016
Figure 120974DEST_PATH_IMAGE017
S204、在候选划分点集合
Figure 697056DEST_PATH_IMAGE016
中随机选择某个待切分点s
Figure 494110DEST_PATH_IMAGE018
,根据
Figure 40629DEST_PATH_IMAGE019
将训练集切分为两部分;
S205、通过下式计算切分后的两部分训练集上对应标签的期望值,作为决策树待选的估计值:
Figure 401073DEST_PATH_IMAGE020
Figure 349437DEST_PATH_IMAGE021
式中,
Figure 317393DEST_PATH_IMAGE022
表示一部分训练集,也记作
Figure 101940DEST_PATH_IMAGE023
Figure 751228DEST_PATH_IMAGE024
,m1表示
Figure 803366DEST_PATH_IMAGE022
对应的模态分量集合,c1表示
Figure 942223DEST_PATH_IMAGE022
对应的期望值,
Figure 463335DEST_PATH_IMAGE025
表示一部分训练集,也记作
Figure 404396DEST_PATH_IMAGE026
Figure 389669DEST_PATH_IMAGE027
,m2表示
Figure 637111DEST_PATH_IMAGE025
对应的模态分量集合,c2表示
Figure 894786DEST_PATH_IMAGE025
对应的期望值;
S206、在遍历所有可能的解
Figure 885875DEST_PATH_IMAGE019
直到找到最优解
Figure 725655DEST_PATH_IMAGE028
使得下式对应的目标值最小,将最优解
Figure 894731DEST_PATH_IMAGE028
作为划分节点:
Figure 124855DEST_PATH_IMAGE029
S207、重复步骤S203~S206直到满足停止分裂条件,从而生成决策树,其中,停止分裂条件为所述目标值小于预设阈值或达到决策树的预设最大深度;
S208、采用弹球损失函数作为分位数梯度提升决策树预测模型的预测性能的评价模型,其中,弹球损失函数为,
Figure 168903DEST_PATH_IMAGE030
式中,
Figure 863190DEST_PATH_IMAGE031
表示弹球损失函数值,
Figure 452434DEST_PATH_IMAGE032
为预设的分位点,
Figure 183236DEST_PATH_IMAGE033
表示检查函数;
S209、假设分位数梯度提升决策树预测模型的输出值为
Figure 578446DEST_PATH_IMAGE034
,则
Figure 64922DEST_PATH_IMAGE034
的初始化表达式为,
Figure 339914DEST_PATH_IMAGE035
S210、设迭代次数
Figure 606947DEST_PATH_IMAGE036
,通过下式计算迭代t次后第i个训练样本的损失函数负梯度:
Figure 743531DEST_PATH_IMAGE037
式中,
Figure 835246DEST_PATH_IMAGE038
表示负梯度,
Figure 94189DEST_PATH_IMAGE039
表示分位数梯度提升决策树预测模型迭代t-1次时的负荷预测值;
S211、将
Figure 786201DEST_PATH_IMAGE040
替换为
Figure 710164DEST_PATH_IMAGE041
,根据步骤S203~S207将
Figure 171232DEST_PATH_IMAGE042
拟合得到第t个决策树,其对应的子叶节点区域为
Figure 601076DEST_PATH_IMAGE043
Figure 280187DEST_PATH_IMAGE044
,其中,
Figure 758573DEST_PATH_IMAGE045
为决策树子叶节点的个数;通过下式计算最佳估计值:
Figure 402044DEST_PATH_IMAGE046
式中,
Figure 924161DEST_PATH_IMAGE047
表示
Figure 590765DEST_PATH_IMAGE042
对应的最佳估计值;
S212、通过下式更新分位数梯度提升决策树预测模型的输出值
Figure 669580DEST_PATH_IMAGE034
Figure 855973DEST_PATH_IMAGE048
式中,
Figure 299724DEST_PATH_IMAGE049
表示为t次迭代时的更新分位数梯度提升决策树预测模型的输出值,
Figure 702892DEST_PATH_IMAGE050
表示阶跃函数;
S213、训练完成后,得到分位数梯度提升决策树预测模型的最终的输出值
Figure 585397DEST_PATH_IMAGE051
为,
Figure 875564DEST_PATH_IMAGE052
式中,
Figure 503598DEST_PATH_IMAGE053
表示T次迭代时的更新分位数梯度提升决策树预测模型的输出值;
S214、假设所述预设的分位点
Figure 941533DEST_PATH_IMAGE032
的取值为
Figure 299833DEST_PATH_IMAGE054
,当给定第w个模态分量的测试样本时,则对应有模态分量在分位点为
Figure 959353DEST_PATH_IMAGE055
时的预测值,将其记为
Figure 744907DEST_PATH_IMAGE056
S215、通过下式将各个模态分量的预测值进行累加,得到预测值在预设的分位点时的条件分布
Figure 358553DEST_PATH_IMAGE057
Figure 582861DEST_PATH_IMAGE058
优选地,所述概率密度函数为,
Figure 847620DEST_PATH_IMAGE059
式中,n为分位点的个数,
Figure 318922DEST_PATH_IMAGE060
表示高斯核函数,h为预置窗宽系数,y表示测试样本的标签。
优选地,步骤S4具体包括:
假设给定置信水平为
Figure 731448DEST_PATH_IMAGE061
,α表示显著性水平,α=0.01,0.05或0.1,则在所述概率密度函数中求得置信区间的下限L和上限U满足下式的条件:
Figure 431551DEST_PATH_IMAGE062
式中,s.t.表示约束条件,
Figure 304479DEST_PATH_IMAGE063
表示y落于置信区间[L,U]中的概率,其中,[L,U]为满足预定的置信水平下的置信区间,并将其作为配电网台区负荷区间预测结果进行输出。
第二方面,本发明还提供了一种基于分位数梯度提升决策树的负荷区间预测系统,包括:
模态分解模块,用于采用集总经验模态对原始配电网台区负荷序列进行分解,得到若干个模态分量,对每个模态分量进行归一化处理;
决策树预测模块,用于对每个模态分量分别建立分位数梯度提升决策树预测模型,得到各个模态分量在不同分位数条件下的预测值,将各个模态分量的预测值进行累加,得到预测值在预设的分位点时的条件分布;
概率密度计算模块,用于采用核密度估计方法在所述预测值在预设的分位点时的条件分布中得到未来配电网台区负荷的概率密度函数;
置信预测模块,用于通过所述概率密度函数计算求得满足预定的置信水平下的置信区间,从而输出配电网台区负荷区间预测结果。
第三方面,本发明还提供了一种计算机可读存储介质,其中存储有计算机程序,所述计算机程序被处理器加载执行时,实现如上述的基于分位数梯度提升决策树的负荷区间预测方法的步骤。
第四方面,本发明还提供了一种电子设备,包括:处理器及存储器;其中,
所述存储器用于存储计算机程序;
所述处理器用于加载执行所述计算机程序,以使所述电子设备执行如上述的基于分位数梯度提升决策树的负荷区间预测方法的步骤。
从以上技术方案可以看出,本发明具有以下优点:
本发明通过采用集总经验模态对原始配电网台区负荷序列进行分解,得到不同特征的模态分量,降低了后续分位数梯度提升决策树预测模型训练的复杂程度,提高了预测的准确性,并采用核密度估计方法得到概率密度函数,避免构造概率分布的主观性和先验性,提高了配电网台区负荷区间预测的可靠性和准确性,同时,利用决策树采样的随机性确保样本之间学习的多样化,使得分位数梯度提升决策树不易陷入过拟合风险,具有良好的泛化能力。
附图说明
图1为本申请实施例提供的一种基于分位数梯度提升决策树的负荷区间预测方法的流程图;
图2为本申请实施例提供的一种基于分位数梯度提升决策树的负荷区间预测系统的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在现有技术中,多是采用预测误差分布统计法、概率式预测方法或传统分位数回归方法,其中,预测误差分布统计法是根据历史配电网台区负荷预测的误差数据,通过配电网台区负荷水平和统计时段两个维度建立误差概率分布模型,然后以此为根据,结合确定性预测结果进行概率补偿修正,得到区间预测结果,但是,对历史数据质量要求较高,且划分统计区间存在一定的主观性,而且对参数的设定较为敏感,很大程度上影响构造历史预测误差分布的可靠性;
概率式预测方法是由贝叶斯理论发展起来的机器学习算法,多以核函数作为回归分析的基础,其中代表性的算法有高斯过程回归。高斯过程回归假定随机变量的方差服从高斯分布,主要用于求出预测量的期望值及其分布状况,进而得到配电网台区负荷任意置信水平下的区间预测结果,但是,通常假定配电网台区负荷服从某种特定的分布,然而这种假定的有效性难以通过统计方法得到严格证明,容易与实际分布存在较大的偏差,从而影响配电网台区负荷区间预测的准确性;
传统分位数回归方法大多基于浅层的机器学习算法如BP神经网络,容易在模型训练阶段陷入局部最优解,导致模型泛化能力不足。
为此,请参阅图1,本发明提供的一种基于分位数梯度提升决策树的负荷区间预测方法,包括以下步骤:
S1、采用集总经验模态对原始配电网台区负荷序列进行分解,得到若干个模态分量,对每个模态分量进行归一化处理;
S2、对每个模态分量分别建立分位数梯度提升决策树预测模型,得到各个模态分量在不同分位数条件下的预测值,将各个模态分量的预测值进行累加,得到预测值在预设的分位点时的条件分布;
S3、采用核密度估计方法在预测值在预设的分位点时的条件分布中得到未来配电网台区负荷的概率密度函数;
S4、通过概率密度函数计算求得满足预定的置信水平下的置信区间,从而输出配电网台区负荷区间预测结果。
本发明通过采用集总经验模态对原始配电网台区负荷序列进行分解,得到不同特征的模态分量,降低了后续分位数梯度提升决策树预测模型训练的复杂程度,提高了预测的准确性,并采用核密度估计方法得到概率密度函数,避免构造概率分布的主观性和先验性,提高了配电网台区负荷区间预测的可靠性和准确性,同时,利用决策树采样的随机性确保样本之间学习的多样化,使得分位数梯度提升决策树不易陷入过拟合风险,具有良好的泛化能力。
以下为本发明提供的一种基于分位数梯度提升决策树的负荷区间预测方法的实施例的具体描述。
本发明提供的一种基于分位数梯度提升决策树的负荷区间预测方法,包括以下步骤:
S0、根据预设采样周期采集配电网台区负荷的原始数据,对原始数据进行数据清洗,得到原始配电网台区负荷序列,原始配电网台区负荷序列具有时序性,原始数据包括有功功率。
需要说明的是,根据预设采样周期采集配电网台区负荷的原始数据,其原始数据是按时间先后顺序进行采样得到的,可得到负荷时间序列。
同时,在采样过程中由于一些原因可能出现数据缺失或异常的情况,通过对原始数据进行数据清洗,即可得到相对完整、正常的负荷时间序列。
S100、采用集总经验模态对原始配电网台区负荷序列进行分解,得到若干个模态分量,对每个模态分量进行归一化处理;
具体地,步骤S100具体包括:
S101、在原始配电网台区负荷序列中加入高斯白噪声得到新的配电网台区负荷序列,利用集总经验模态对新的配电网台区负荷序列进行分解,得到若干个模态分量,模态分量包括若干个本征模态分量和一个残差分量;
S102、重复M次步骤S101,从而每次向原始配电网台区负荷序列加入不同的高斯白噪声,以得到M组本征模态分量和残差分量;
S103、对M组本征模态分量和残差分量分别求取均值,从而得到若干个本征模态分量均值和一个残差分量均值,其中,本征模态分量均值表示为,
Figure 697414DEST_PATH_IMAGE064
残差分量均值表示为,
Figure 597237DEST_PATH_IMAGE065
式中,
Figure 350298DEST_PATH_IMAGE066
为第m组第i个本征模态分量,
Figure 324071DEST_PATH_IMAGE004
Figure 950224DEST_PATH_IMAGE005
为第m组残差分量;
对每个模态分量通过下式进行归一化处理,
Figure 25759DEST_PATH_IMAGE067
式中,
Figure 67664DEST_PATH_IMAGE068
Figure 410789DEST_PATH_IMAGE069
分别表示归一化前和归一化后的模态分量数值,
Figure 207844DEST_PATH_IMAGE009
Figure 754363DEST_PATH_IMAGE010
分别为模态分量数值中的最小值和最大值。
S200、对每个模态分量分别建立分位数梯度提升决策树预测模型,得到各个模态分量在不同分位数条件下的预测值,将各个模态分量的预测值进行累加,得到预测值在预设的分位点时的条件分布;
具体地,步骤S200具体包括:
S201、通过归一化后的若干个模态分量选取训练样本和测试样本以分别构建训练集和测试集;
一般示例中,按一定比例从数据集(模态分量)中抽取前70%~90%的数据作为训练样本,而其余的数据作为测试样本。
S202、假设训练样本定义为
Figure 613341DEST_PATH_IMAGE070
,其中,
Figure 624023DEST_PATH_IMAGE012
Figure 529662DEST_PATH_IMAGE013
分别为训练样本的属性和标签,
Figure 812744DEST_PATH_IMAGE014
,R表示实数域,N表示维度,基于决策树算法对每个决策树依次采用Bootstrap策略有放回地随机抽取m个训练样本,则生成由n个决策树组合成的分位数梯度提升决策树,其中,n为预设的决策树数量;
需要说明的是,若当前采样时刻记为t,样本的属性是指模态分量中N个采样时刻为t-p的数据,这里数据一般不唯一,p=1,2,…,k,k为任意自然数;样本的标签是指模态分量中单个采样时刻为t+q的数据,q=1,2,…,k。模态分量中的数据是按时间先后顺序分布的,通过一定的组合方式即可得到样本的属性和标签。
S203、随机选择某个待切分属性j,将属性j上所有取值从小到大排序,记为
Figure 258769DEST_PATH_IMAGE071
,通过下式得到属性j上的候选划分点集合
Figure 327219DEST_PATH_IMAGE016
Figure 154492DEST_PATH_IMAGE017
在本实施例中,若当前采样时刻记为t,样本的属性是指模态分量中N个采样时刻为t-p的数据,这里数据一般不唯一,p=1,2,…,k,k为任意自然数。根据数据的数值大小,对属性j上的所有取值进行从小到大的重新排序。
S204、在候选划分点集合
Figure 675603DEST_PATH_IMAGE016
中随机选择某个待切分点s
Figure 925319DEST_PATH_IMAGE018
,根据
Figure 97543DEST_PATH_IMAGE019
将训练集切分为两部分;
S205、通过下式计算切分后的两部分训练集上对应标签的期望值,作为决策树待选的估计值:
Figure 344985DEST_PATH_IMAGE072
Figure 415709DEST_PATH_IMAGE073
式中,
Figure 148742DEST_PATH_IMAGE022
表示一部分训练集,也记作
Figure 926206DEST_PATH_IMAGE023
Figure 593816DEST_PATH_IMAGE074
,m1表示
Figure 886257DEST_PATH_IMAGE022
对应的模态分量集合,c1表示
Figure 681038DEST_PATH_IMAGE022
对应的期望值,
Figure 63740DEST_PATH_IMAGE025
表示一部分训练集,也记作
Figure 715301DEST_PATH_IMAGE026
Figure 698301DEST_PATH_IMAGE075
,m2表示
Figure 280461DEST_PATH_IMAGE025
对应的模态分量集合,c2表示
Figure 766937DEST_PATH_IMAGE025
对应的期望值;
S206、在遍历所有可能的解
Figure 854978DEST_PATH_IMAGE019
直到找到最优解
Figure 807498DEST_PATH_IMAGE028
使得下式对应的目标值最小,将最优解
Figure 678502DEST_PATH_IMAGE028
作为划分节点:
Figure 534331DEST_PATH_IMAGE076
S207、重复步骤S203~S206直到满足停止分裂条件,从而生成决策树,其中,停止分裂条件为目标值小于预设阈值或达到决策树的预设最大深度;
S208、采用弹球损失函数作为分位数梯度提升决策树预测模型的预测性能的评价模型,其中,弹球损失函数为,
Figure 793274DEST_PATH_IMAGE077
式中,
Figure 219707DEST_PATH_IMAGE078
表示弹球损失函数值,
Figure 910714DEST_PATH_IMAGE032
为预设的分位点,
Figure 434099DEST_PATH_IMAGE033
表示检查函数;
需要说明的是,采用弹球损失函数可以评价不同分位点条件下模型(分位数梯度提升决策树)的预测值与样本的真实值之间的差异,损失函数表现越好,通常模型的性能越好。
S209、假设分位数梯度提升决策树预测模型的输出值为
Figure 536047DEST_PATH_IMAGE034
,则
Figure 964624DEST_PATH_IMAGE034
的初始化表达式为,
Figure 505326DEST_PATH_IMAGE079
S210、设迭代次数
Figure 820901DEST_PATH_IMAGE036
,通过下式计算迭代t次后第i个训练样本的损失函数负梯度:
Figure 112992DEST_PATH_IMAGE080
式中,
Figure 514017DEST_PATH_IMAGE038
表示负梯度,
Figure 858411DEST_PATH_IMAGE039
表示分位数梯度提升决策树预测模型迭代t-1次时的负荷预测值;
S211、将
Figure 543339DEST_PATH_IMAGE081
替换为
Figure 987090DEST_PATH_IMAGE041
,根据步骤S203~S207将
Figure 203308DEST_PATH_IMAGE082
拟合得到第t个决策树,其对应的子叶节点区域为
Figure 774229DEST_PATH_IMAGE043
Figure 64396DEST_PATH_IMAGE083
,其中,
Figure 928315DEST_PATH_IMAGE045
为决策树子叶节点的个数;通过下式计算最佳估计值:
Figure 366250DEST_PATH_IMAGE084
式中,
Figure 990129DEST_PATH_IMAGE085
表示
Figure 882605DEST_PATH_IMAGE086
对应的最佳估计值;
S212、通过下式更新分位数梯度提升决策树预测模型的输出值
Figure 996055DEST_PATH_IMAGE034
Figure 858969DEST_PATH_IMAGE087
式中,
Figure 270227DEST_PATH_IMAGE088
表示为t次迭代时的更新分位数梯度提升决策树预测模型的输出值,
Figure 534987DEST_PATH_IMAGE050
表示阶跃函数;
需要说明的是,分位数梯度提升决策树模型采用迭代方式训练,下一轮迭代利用负梯度测量前一轮基学习器的性能,通过拟合损失函数负梯度来校正之前出现的错误,最终找到能够无限逼近真实值的输出值。
S213、训练完成后,得到分位数梯度提升决策树预测模型的最终的输出值
Figure 819337DEST_PATH_IMAGE051
为,
Figure 654701DEST_PATH_IMAGE089
式中,
Figure 620383DEST_PATH_IMAGE090
表示T次迭代时的更新分位数梯度提升决策树预测模型的输出值;
S214、假设预设的分位点
Figure 801965DEST_PATH_IMAGE032
的取值为
Figure 444168DEST_PATH_IMAGE091
,当给定第w个模态分量的测试样本时,则对应有模态分量在分位点为
Figure 281674DEST_PATH_IMAGE055
时的预测值,将其记为
Figure 550848DEST_PATH_IMAGE092
S215、通过下式将各个模态分量的预测值进行累加,得到预测值在预设的分位点时的条件分布
Figure 586938DEST_PATH_IMAGE093
Figure 150774DEST_PATH_IMAGE094
S300、采用核密度估计方法在预测值在预设的分位点时的条件分布中得到未来配电网台区负荷的概率密度函数;
具体地,概率密度函数为,
Figure 459265DEST_PATH_IMAGE095
式中,n为分位点的个数,
Figure 829066DEST_PATH_IMAGE096
表示高斯核函数,h为预置窗宽系数,y表示测试样本的标签。
需要说明的是,可采用经验法则选取合适的窗宽系数。
S400、通过概率密度函数计算求得满足预定的置信水平下的置信区间,从而输出配电网台区负荷区间预测结果。
具体地,步骤S400具体包括:
假设给定置信水平为
Figure 922924DEST_PATH_IMAGE061
,α表示显著性水平,α=0.01,0.05或0.1,则在概率密度函数中求得置信区间的下限L和上限U满足下式的条件:
Figure 408394DEST_PATH_IMAGE097
式中,s.t.表示约束条件,
Figure 954913DEST_PATH_IMAGE099
表示y落于置信区间[L,U]中的概率,其中,[L,U]为满足预定的置信水平下的置信区间,并将其作为配电网台区负荷区间预测结果进行输出。
以上为本发明提供的一种基于分位数梯度提升决策树的负荷区间预测方法的实施例的描述,参考图2,本发明还提供了一种基于分位数梯度提升决策树的负荷区间预测系统,包括:
模态分解模块100,用于采用集总经验模态对原始配电网台区负荷序列进行分解,得到若干个模态分量,对每个模态分量进行归一化处理;
决策树预测模块200,用于对每个模态分量分别建立分位数梯度提升决策树预测模型,得到各个模态分量在不同分位数条件下的预测值,将各个模态分量的预测值进行累加,得到预测值在预设的分位点时的条件分布;
概率密度计算模块300,用于采用核密度估计方法在预测值在预设的分位点时的条件分布中得到未来配电网台区负荷的概率密度函数;
置信预测模块400,用于通过概率密度函数计算求得满足预定的置信水平下的置信区间,从而输出配电网台区负荷区间预测结果。
需要说明的是,本发明提供的一种基于分位数梯度提升决策树的负荷区间预测系统的工作过程与上述一种基于分位数梯度提升决策树的负荷区间预测方法的流程一致,在此不再赘述。
本发明提供的一种基于分位数梯度提升决策树的负荷区间预测系统,通过采用集总经验模态对原始配电网台区负荷序列进行分解,得到不同特征的模态分量,降低了后续分位数梯度提升决策树预测模型训练的复杂程度,提高了预测的准确性,并采用核密度估计方法得到概率密度函数,避免构造概率分布的主观性和先验性,提高了配电网台区负荷区间预测的可靠性和准确性,同时,利用决策树采样的随机性确保样本之间学习的多样化,使得分位数梯度提升决策树不易陷入过拟合风险,具有良好的泛化能力。
本发明还提供了一种计算机可读存储介质,其中存储有计算机程序,计算机程序被处理器加载执行时,实现如上述的基于分位数梯度提升决策树的负荷区间预测方法的步骤。
本发明还提供了一种电子设备,包括:处理器及存储器;其中,
存储器用于存储计算机程序;
处理器用于加载执行计算机程序,以使电子设备执行如上述的基于分位数梯度提升决策树的负荷区间预测方法的步骤。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以通过一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (8)

1.一种基于分位数梯度提升决策树的负荷区间预测方法,其特征在于,包括以下步骤:
S1、采用集总经验模态对原始配电网台区负荷序列进行分解,得到若干个模态分量,对每个模态分量进行归一化处理;
S2、对每个模态分量分别建立分位数梯度提升决策树预测模型,得到各个模态分量在不同分位数条件下的预测值,将各个模态分量的预测值进行累加,得到预测值在预设的分位点时的条件分布;
S3、采用核密度估计方法在所述预测值在预设的分位点时的条件分布中得到未来配电网台区负荷的概率密度函数;
S4、通过所述概率密度函数计算求得满足预定的置信水平下的置信区间,从而输出配电网台区负荷区间预测结果;
步骤S2具体包括:
S201、通过归一化后的若干个所述模态分量选取训练样本和测试样本以分别构建训练集和测试集;
S202、假设所述训练样本定义为
Figure 470955DEST_PATH_IMAGE001
,其中,
Figure 266742DEST_PATH_IMAGE002
Figure 174655DEST_PATH_IMAGE003
分别为训练样本的属性和标签,
Figure 123019DEST_PATH_IMAGE004
, R表示实数域,N表示维度,基于决策树算法对每个决策树依次采用Bootstrap策略有放回地随机抽取m个训练样本,则生成由n个决策树组合成的分位数梯度提升决策树,其中,n为预设的决策树数量;S203、随机选择某个待切分属性j,将属性j上所有取值从小到大排序,记为
Figure 90975DEST_PATH_IMAGE005
,通过下式得到属性j上的候选划分点集合
Figure 374058DEST_PATH_IMAGE006
Figure 85662DEST_PATH_IMAGE007
S204、在候选划分点集合
Figure 154112DEST_PATH_IMAGE006
中随机选择某个待切分点s
Figure 479920DEST_PATH_IMAGE008
,根据
Figure 797769DEST_PATH_IMAGE009
将训练集切分为两部分;
S205、通过下式计算切分后的两部分训练集上对应标签的期望值,作为决策树待选的估计值:
Figure 250747DEST_PATH_IMAGE010
Figure 422971DEST_PATH_IMAGE011
式中,
Figure 670413DEST_PATH_IMAGE012
表示一部分训练集,也记作
Figure 475558DEST_PATH_IMAGE013
,
Figure 715915DEST_PATH_IMAGE014
,m1表示
Figure 493379DEST_PATH_IMAGE012
对应的模态分量集合,c1表示
Figure 974038DEST_PATH_IMAGE012
对应的期望值,
Figure 719009DEST_PATH_IMAGE015
表示一部分训练集,也记作
Figure 248211DEST_PATH_IMAGE016
,
Figure 208077DEST_PATH_IMAGE017
,m2表示
Figure 46589DEST_PATH_IMAGE015
对应的模态分量集合,c2表示
Figure 826326DEST_PATH_IMAGE015
对应的期望值;
S206、在遍历所有可能的解
Figure 159218DEST_PATH_IMAGE009
直到找到最优解
Figure 160541DEST_PATH_IMAGE018
使得下式对应的目标值最小,将最优解
Figure 983003DEST_PATH_IMAGE018
作为划分节点:
Figure 187720DEST_PATH_IMAGE019
S207、重复步骤S203~S206直到满足停止分裂条件,从而生成决策树,其中,停止分裂条件为所述目标值小于预设阈值或达到决策树的预设最大深度;
S208、采用弹球损失函数作为分位数梯度提升决策树预测模型的预测性能的评价模型,其中,弹球损失函数为,
Figure 573571DEST_PATH_IMAGE020
式中,
Figure 180133DEST_PATH_IMAGE021
表示弹球损失函数值,
Figure 173496DEST_PATH_IMAGE022
为预设的分位点,
Figure 114776DEST_PATH_IMAGE023
表示检查函数;
S209、假设分位数梯度提升决策树预测模型的输出值为
Figure 55051DEST_PATH_IMAGE024
,则
Figure 578436DEST_PATH_IMAGE024
的初始化表达式为,
Figure 929652DEST_PATH_IMAGE025
S210、设迭代次数
Figure 108960DEST_PATH_IMAGE026
,通过下式计算迭代t次后第i个训练样本的损失函数负梯度:
Figure 836614DEST_PATH_IMAGE027
式中,
Figure 152188DEST_PATH_IMAGE028
表示负梯度,
Figure 752934DEST_PATH_IMAGE029
表示分位数梯度提升决策树预测模型迭代t-1次时的负荷预测值;
S211、将
Figure 364348DEST_PATH_IMAGE030
替换为
Figure 708741DEST_PATH_IMAGE031
,根据步骤S203~S207将
Figure 128090DEST_PATH_IMAGE032
拟合得到第t个决策树,其对应的子叶节点区域为
Figure 837420DEST_PATH_IMAGE033
Figure 975010DEST_PATH_IMAGE034
,其中,
Figure 857515DEST_PATH_IMAGE035
为决策树子叶节点的个数;通过下式计算最佳估计值:
Figure 147682DEST_PATH_IMAGE036
式中,
Figure 277181DEST_PATH_IMAGE037
表示
Figure 715115DEST_PATH_IMAGE032
对应的最佳估计值;
S212、通过下式更新分位数梯度提升决策树预测模型的输出值
Figure 338995DEST_PATH_IMAGE038
Figure 732936DEST_PATH_IMAGE039
式中,
Figure 846385DEST_PATH_IMAGE040
表示为t次迭代时的更新分位数梯度提升决策树预测模型的输出值,
Figure 709299DEST_PATH_IMAGE041
表示阶跃函数;
S213、训练完成后,得到分位数梯度提升决策树预测模型的最终的输出值
Figure 120558DEST_PATH_IMAGE024
为,
Figure 447634DEST_PATH_IMAGE042
式中,
Figure 404089DEST_PATH_IMAGE043
表示T次迭代时的更新分位数梯度提升决策树预测模型的输出值;
S214、假设所述预设的分位点
Figure 3566DEST_PATH_IMAGE022
的取值为
Figure 31565DEST_PATH_IMAGE044
,当给定第w个模态分量的测试样本时,则对应有模态分量在分位点为
Figure 150831DEST_PATH_IMAGE045
时的预测值,将其记为
Figure 793033DEST_PATH_IMAGE046
S215、通过下式将各个模态分量的预测值进行累加,得到预测值在预设的分位点时的条件分布
Figure 427277DEST_PATH_IMAGE047
Figure 931071DEST_PATH_IMAGE048
2.根据权利要求1所述的基于分位数梯度提升决策树的负荷区间预测方法,其特征在于,所述步骤S1之前包括:
根据预设采样周期采集配电网台区负荷的原始数据,对所述原始数据进行数据清洗,得到原始配电网台区负荷序列,所述原始配电网台区负荷序列具有时序性,所述原始数据包括有功功率。
3.根据权利要求1所述的基于分位数梯度提升决策树的负荷区间预测方法,其特征在于,所述步骤S1具体包括:
S101、在所述原始配电网台区负荷序列中加入高斯白噪声得到新的配电网台区负荷序列,利用集总经验模态对所述新的配电网台区负荷序列进行分解,得到若干个模态分量,所述模态分量包括若干个本征模态分量和一个残差分量;
S102、重复M次步骤S101,从而每次向所述原始配电网台区负荷序列加入不同的高斯白噪声,以得到M组本征模态分量和残差分量;
S103、对M组本征模态分量和残差分量分别求取均值,从而得到若干个本征模态分量均值和一个残差分量均值,其中,所述本征模态分量均值表示为,
Figure 419690DEST_PATH_IMAGE049
所述残差分量均值表示为,
Figure 983526DEST_PATH_IMAGE050
式中,
Figure 292017DEST_PATH_IMAGE051
为第m组第i个本征模态分量,
Figure 661818DEST_PATH_IMAGE052
Figure 755676DEST_PATH_IMAGE053
为第m组残差分量;
对每个模态分量通过下式进行归一化处理,
Figure 739682DEST_PATH_IMAGE054
式中,
Figure 348517DEST_PATH_IMAGE055
Figure 194114DEST_PATH_IMAGE056
分别表示归一化前和归一化后的模态分量数值,
Figure 391746DEST_PATH_IMAGE057
Figure 359702DEST_PATH_IMAGE058
分别为模态分量数值中的最小值和最大值。
4.根据权利要求1所述的基于分位数梯度提升决策树的负荷区间预测方法,其特征在于,所述概率密度函数为,
Figure 393517DEST_PATH_IMAGE059
式中,n为分位点的个数,
Figure 292072DEST_PATH_IMAGE060
表示高斯核函数,h为预置窗宽系数,y表示测试样本的标签。
5.根据权利要求4所述的基于分位数梯度提升决策树的负荷区间预测方法,步骤S4具体包括:
假设给定置信水平为
Figure 157259DEST_PATH_IMAGE061
,α表示显著性水平,α=0.01,0.05或0.1,则在所述概率密度函数中求得置信区间的下限L和上限U满足下式的条件:
Figure 233800DEST_PATH_IMAGE062
式中,s.t.表示约束条件,
Figure 4179DEST_PATH_IMAGE063
表示y落于置信区间[L,U]中的概率,其中,[L,U]为满足预定的置信水平下的置信区间,并将其作为配电网台区负荷区间预测结果进行输出。
6.一种基于分位数梯度提升决策树的负荷区间预测系统,其特征在于,包括:
模态分解模块,用于采用集总经验模态对原始配电网台区负荷序列进行分解,得到若干个模态分量,对每个模态分量进行归一化处理;
决策树预测模块,用于对每个模态分量分别建立分位数梯度提升决策树预测模型,得到各个模态分量在不同分位数条件下的预测值,将各个模态分量的预测值进行累加,得到预测值在预设的分位点时的条件分布;
概率密度计算模块,用于采用核密度估计方法在所述预测值在预设的分位点时的条件分布中得到未来配电网台区负荷的概率密度函数;
置信预测模块,用于通过所述概率密度函数计算求得满足预定的置信水平下的置信区间,从而输出配电网台区负荷区间预测结果;
决策树预测模块具体用于:
通过归一化后的若干个所述模态分量选取训练样本和测试样本以分别构建训练集和测试集;
假设所述训练样本定义为
Figure 457157DEST_PATH_IMAGE064
,其中,
Figure 176851DEST_PATH_IMAGE002
Figure 673560DEST_PATH_IMAGE003
分别为训练样本的属性和标签,
Figure 681968DEST_PATH_IMAGE004
, R表示实数域,N表示维度,基于决策树算法对每个决策树依次采用Bootstrap策略有放回地随机抽取m个训练样本,则生成由n个决策树组合成的分位数梯度提升决策树,其中,n为预设的决策树数量;随机选择某个待切分属性j,将属性j上所有取值从小到大排序,记为
Figure 735374DEST_PATH_IMAGE065
,通过下式得到属性j上的候选划分点集合
Figure 762105DEST_PATH_IMAGE006
Figure 180448DEST_PATH_IMAGE066
在候选划分点集合
Figure 738468DEST_PATH_IMAGE006
中随机选择某个待切分点s
Figure 516937DEST_PATH_IMAGE008
,根据
Figure 148907DEST_PATH_IMAGE009
将训练集切分为两部分;
通过下式计算切分后的两部分训练集上对应标签的期望值,作为决策树待选的估计值:
Figure 66047DEST_PATH_IMAGE010
Figure 32735DEST_PATH_IMAGE011
式中,
Figure 365628DEST_PATH_IMAGE012
表示一部分训练集,也记作
Figure 366950DEST_PATH_IMAGE013
,
Figure 189413DEST_PATH_IMAGE014
,m1表示
Figure 394129DEST_PATH_IMAGE012
对应的模态分量集合,c1表示
Figure 779980DEST_PATH_IMAGE012
对应的期望值,
Figure 448859DEST_PATH_IMAGE015
表示一部分训练集,也记作
Figure 379906DEST_PATH_IMAGE016
,
Figure 321186DEST_PATH_IMAGE017
,m2表示
Figure 58198DEST_PATH_IMAGE015
对应的模态分量集合,c2表示
Figure 519266DEST_PATH_IMAGE015
对应的期望值;
在遍历所有可能的解
Figure 136061DEST_PATH_IMAGE009
直到找到最优解
Figure 377687DEST_PATH_IMAGE018
使得下式对应的目标值最小,将最优解
Figure 590493DEST_PATH_IMAGE018
作为划分节点:
Figure 420915DEST_PATH_IMAGE019
直到满足停止分裂条件,从而生成决策树,其中,停止分裂条件为所述目标值小于预设阈值或达到决策树的预设最大深度;
采用弹球损失函数作为分位数梯度提升决策树预测模型的预测性能的评价模型,其中,弹球损失函数为,
Figure 693764DEST_PATH_IMAGE020
式中,
Figure 422686DEST_PATH_IMAGE021
表示弹球损失函数值,
Figure 688451DEST_PATH_IMAGE022
为预设的分位点,
Figure 124112DEST_PATH_IMAGE023
表示检查函数;
假设分位数梯度提升决策树预测模型的输出值为
Figure 82709DEST_PATH_IMAGE024
,则
Figure 33348DEST_PATH_IMAGE024
的初始化表达式为,
Figure 853536DEST_PATH_IMAGE025
设迭代次数
Figure 392971DEST_PATH_IMAGE026
,通过下式计算迭代t次后第i个训练样本的损失函数负梯度:
Figure 335519DEST_PATH_IMAGE027
式中,
Figure 711137DEST_PATH_IMAGE028
表示负梯度,
Figure 318704DEST_PATH_IMAGE029
表示分位数梯度提升决策树预测模型迭代t-1次时的负荷预测值;
Figure 791274DEST_PATH_IMAGE030
替换为
Figure 842407DEST_PATH_IMAGE031
,将
Figure 954588DEST_PATH_IMAGE032
拟合得到第t个决策树,其对应的子叶节点区域为
Figure 178896DEST_PATH_IMAGE033
Figure 178076DEST_PATH_IMAGE034
,其中,
Figure 462427DEST_PATH_IMAGE035
为决策树子叶节点的个数;通过下式计算最佳估计值:
Figure 61904DEST_PATH_IMAGE067
式中,
Figure 27586DEST_PATH_IMAGE037
表示
Figure 209169DEST_PATH_IMAGE032
对应的最佳估计值;
通过下式更新分位数梯度提升决策树预测模型的输出值
Figure 585792DEST_PATH_IMAGE038
Figure 423298DEST_PATH_IMAGE039
式中,
Figure 989409DEST_PATH_IMAGE040
表示为t次迭代时的更新分位数梯度提升决策树预测模型的输出值,
Figure 478028DEST_PATH_IMAGE041
表示阶跃函数;
训练完成后,得到分位数梯度提升决策树预测模型的最终的输出值
Figure 776285DEST_PATH_IMAGE024
为,
Figure 163404DEST_PATH_IMAGE042
式中,
Figure 720156DEST_PATH_IMAGE043
表示T次迭代时的更新分位数梯度提升决策树预测模型的输出值;
假设所述预设的分位点
Figure 548435DEST_PATH_IMAGE022
的取值为
Figure 345490DEST_PATH_IMAGE044
,当给定第w个模态分量的测试样本时,则对应有模态分量在分位点为
Figure 164714DEST_PATH_IMAGE045
时的预测值,将其记为
Figure 275889DEST_PATH_IMAGE046
通过下式将各个模态分量的预测值进行累加,得到预测值在预设的分位点时的条件分布
Figure 286571DEST_PATH_IMAGE047
Figure 441477DEST_PATH_IMAGE048
7.一种计算机可读存储介质,其中存储有计算机程序,其特征在于,所述计算机程序被处理器加载执行时,实现如权利要求1至5中任一所述的基于分位数梯度提升决策树的负荷区间预测方法的步骤。
8.一种电子设备,其特征在于,包括:处理器及存储器;其中,
所述存储器用于存储计算机程序;
所述处理器用于加载执行所述计算机程序,以使所述电子设备执行如权利要求1至5中任一所述的基于分位数梯度提升决策树的负荷区间预测方法的步骤。
CN202111046819.8A 2021-09-08 2021-09-08 基于分位数梯度提升决策树的负荷区间预测方法及系统 Active CN113496315B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202111046819.8A CN113496315B (zh) 2021-09-08 2021-09-08 基于分位数梯度提升决策树的负荷区间预测方法及系统
PCT/CN2022/079202 WO2023035564A1 (zh) 2021-09-08 2022-03-04 基于分位数梯度提升决策树的负荷区间预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111046819.8A CN113496315B (zh) 2021-09-08 2021-09-08 基于分位数梯度提升决策树的负荷区间预测方法及系统

Publications (2)

Publication Number Publication Date
CN113496315A CN113496315A (zh) 2021-10-12
CN113496315B true CN113496315B (zh) 2022-01-25

Family

ID=77997172

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111046819.8A Active CN113496315B (zh) 2021-09-08 2021-09-08 基于分位数梯度提升决策树的负荷区间预测方法及系统

Country Status (2)

Country Link
CN (1) CN113496315B (zh)
WO (1) WO2023035564A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113496315B (zh) * 2021-09-08 2022-01-25 广东电网有限责任公司湛江供电局 基于分位数梯度提升决策树的负荷区间预测方法及系统
CN116300774B (zh) * 2023-05-23 2023-08-08 蓝星智云(山东)智能科技有限公司 基于主元分析与核密度估计的间歇过程可视化监控方法
CN116432478B (zh) * 2023-06-15 2023-09-08 广东电网有限责任公司东莞供电局 一种电力系统的能量确定方法、装置、设备及介质
CN116544931B (zh) * 2023-06-27 2023-12-01 北京理工大学 基于集成片段变换和时间卷积网络的电力负荷分布预测方法
CN116596044B (zh) * 2023-07-18 2023-11-07 华能山东泰丰新能源有限公司 基于多源数据的发电负荷预测模型训练方法及装置
CN116646933B (zh) * 2023-07-24 2023-10-10 北京中能亿信软件有限公司 一种基于大数据的电力负荷调度方法及系统
CN117239731B (zh) * 2023-09-21 2024-02-27 山东工商学院 基于混合模型的节假日短期电力负荷预测方法
CN117290664B (zh) * 2023-09-27 2024-04-26 贵州大学 一种基于emd-blstm模型的刀盘扭矩实时动态预测方法及装置
CN117112857B (zh) * 2023-10-23 2024-01-05 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种适用于工业智能制造的加工路径推荐方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10366451B2 (en) * 2016-01-27 2019-07-30 Huawei Technologies Co., Ltd. System and method for prediction using synthetic features and gradient boosted decision tree
CN109978201A (zh) * 2017-12-27 2019-07-05 深圳市景程信息科技有限公司 基于高斯过程分位数回归模型的概率负荷预测系统及方法
CN108846517B (zh) * 2018-06-12 2021-03-16 清华大学 一种分位数概率性短期电力负荷预测集成方法
CN109242139A (zh) * 2018-07-23 2019-01-18 华北电力大学 一种电力日峰值负荷预测方法
CN109359778A (zh) * 2018-11-13 2019-02-19 中石化石油工程技术服务有限公司 基于优化经验模态分解的短期天然气负荷预测方法
CN109726865A (zh) * 2018-12-27 2019-05-07 国网江苏省电力有限公司电力科学研究院 基于emd-qrf的用户负荷概率密度预测方法、装置和存储介质
CN110969197B (zh) * 2019-11-22 2022-01-04 上海交通大学 一种基于实例迁移的风力发电的分位数预测方法
CN111523735A (zh) * 2020-05-09 2020-08-11 上海积成能源科技有限公司 一种基于轻量级梯度提升算法预测短期电力负荷的系统模型
CN112001439A (zh) * 2020-08-19 2020-11-27 西安建筑科技大学 基于gbdt的商场建筑空调冷负荷预测方法、存储介质及设备
CN112488352A (zh) * 2020-10-21 2021-03-12 上海旻浦科技有限公司 一种基于梯度提升回归的房价区间预测方法及系统
CN112926780A (zh) * 2021-03-01 2021-06-08 南方电网科学研究院有限责任公司 基于Sister预测的平均分位数回归的概率负荷预测方法
CN113496315B (zh) * 2021-09-08 2022-01-25 广东电网有限责任公司湛江供电局 基于分位数梯度提升决策树的负荷区间预测方法及系统

Also Published As

Publication number Publication date
CN113496315A (zh) 2021-10-12
WO2023035564A1 (zh) 2023-03-16

Similar Documents

Publication Publication Date Title
CN113496315B (zh) 基于分位数梯度提升决策树的负荷区间预测方法及系统
JP3209163B2 (ja) 分類装置
CN111966904B (zh) 基于多用户画像模型的信息推荐方法和相关装置
CN110910004A (zh) 一种多重不确定性的水库调度规则提取方法及系统
Bagirov et al. Nonsmooth nonconvex optimization approach to clusterwise linear regression problems
CN112365033B (zh) 一种风电功率区间预测方法、系统及存储介质
CN110796485A (zh) 一种提高预测模型的预测精度的方法及装置
CN114880482A (zh) 一种基于图嵌入的关系图谱关键人员分析方法及系统
CN112801231B (zh) 用于业务对象分类的决策模型训练方法和装置
Guillen et al. Minimising the delta test for variable selection in regression problems
CN117094535A (zh) 基于人工智能的能源补给管理方法及系统
Christen et al. On the analysis of accumulation curves
CN113782092B (zh) 一种生存期预测模型的生成方法及装置、存储介质
CN113298120B (zh) 基于融合模型的用户风险预测方法、系统和计算机设备
Chang et al. Bayesian networks applied to credit scoring
CN113064812A (zh) 一种项目开发过程质量缺陷预测方法、装置及介质
CN117235448B (zh) 数据清洗方法、终端设备及存储介质
CN117786444B (zh) 电池剩余使用寿命预测方法、装置、设备及存储介质
Prakash et al. Implementation of Hybrid Particle Swarm Optimization for Optimized Regression Testing.
CN115242482B (zh) 越权访问风险检测方法、装置、电子设备及可读存储介质
CN114676167B (zh) 用户存留模型的训练方法、用户存留预测方法和装置
Sagar et al. Rough Set and Genetic Based Approach for Maximization of Weighted Association Rules.
Lunagómez et al. Evaluating and optimizing network sampling designs: decision theory and information theory perspectives
Pedrielli et al. Stochastic Simulation Optimization with Optimal Computing Budget Allocation
CN117786444A (zh) 电池剩余使用寿命预测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant