CN113496315B - 基于分位数梯度提升决策树的负荷区间预测方法及系统 - Google Patents
基于分位数梯度提升决策树的负荷区间预测方法及系统 Download PDFInfo
- Publication number
- CN113496315B CN113496315B CN202111046819.8A CN202111046819A CN113496315B CN 113496315 B CN113496315 B CN 113496315B CN 202111046819 A CN202111046819 A CN 202111046819A CN 113496315 B CN113496315 B CN 113496315B
- Authority
- CN
- China
- Prior art keywords
- quantile
- decision tree
- gradient
- modal
- load
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Marketing (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Pure & Applied Mathematics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Primary Health Care (AREA)
- Computational Mathematics (AREA)
- Algebra (AREA)
- Probability & Statistics with Applications (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请公开了一种基于分位数梯度提升决策树的负荷区间预测方法及系统,通过采用集总经验模态对原始配电网台区负荷序列进行分解,得到不同特征的模态分量,降低了后续分位数梯度提升决策树预测模型训练的复杂程度,提高了预测的准确性,并采用核密度估计方法得到概率密度函数,避免构造概率分布的主观性和先验性,提高了配电网台区负荷区间预测的可靠性和准确性,同时,利用决策树采样的随机性确保样本之间学习的多样化,使得分位数梯度提升决策树不易陷入过拟合风险,具有良好的泛化能力。
Description
技术领域
本申请涉及电力负荷预测技术领域,尤其涉及一种基于分位数梯度提升决策树的负荷区间预测方法及系统。
背景技术
随着智能配电网的建设和大数据技术的快速发展,配电网台区海量数据的采集与存储问题在近年来得以解决,为实现配电网台区精细化管理提供了完备的数据基础和技术条件。然而配电网台区负荷直接与用户用电行为息息相关,相比系统级负荷,具有较高的不确定性,客观上直接影响传统配电网台区负荷预测的准确度,给配电网安全稳定运行造成较大的影响。传统配电网台区负荷预测采用点预测方法,仅仅给出单一的确定性数值,无法计及未来配电网台区负荷可能的概率分布,在涉及负荷不确定性分析的问题上难以满足实际需求。
而配电网台区负荷区间预测方法能够得到未来某一时间点上配电网台区负荷的置信区间,实现对负荷不确定性的有效量化,因此在配电网风险预警评估、精准规划与优化调度等方面具有一定的应用价值与研究意义。
而现有技术中,多是采用预测误差分布统计法、概率式预测方法或传统分位数回归方法,其中,预测误差分布统计法对历史数据质量要求较高,且划分统计区间存在一定的主观性,而且对参数的设定较为敏感,很大程度上影响构造历史预测误差分布的可靠性;概率式预测方法通常假定配电网台区负荷服从某种特定的分布,然而这种假定的有效性难以通过统计方法得到严格证明,容易与实际分布存在较大的偏差,从而影响配电网台区负荷区间预测的准确性。传统分位数回归方法大多基于浅层的机器学习算法如BP神经网络,容易在模型训练阶段陷入局部最优解,导致模型泛化能力不足。
发明内容
本申请提供了一种基于分位数梯度提升决策树的负荷区间预测方法及系统,用于解决上述预测的可靠性和准确性差且泛化能力不足的技术问题。
有鉴于此,本申请第一方面提供了一种基于分位数梯度提升决策树的负荷区间预测方法,包括以下步骤:
S1、采用集总经验模态对原始配电网台区负荷序列进行分解,得到若干个模态分量,对每个模态分量进行归一化处理;
S2、对每个模态分量分别建立分位数梯度提升决策树预测模型,得到各个模态分量在不同分位数条件下的预测值,将各个模态分量的预测值进行累加,得到预测值在预设的分位点时的条件分布;
S3、采用核密度估计方法在所述预测值在预设的分位点时的条件分布中得到未来配电网台区负荷的概率密度函数;
S4、通过所述概率密度函数计算求得满足预定的置信水平下的置信区间,从而输出配电网台区负荷区间预测结果。
优选地,所述步骤S1之前包括:
根据预设采样周期采集配电网台区负荷的原始数据,对所述原始数据进行数据清洗,得到原始配电网台区负荷序列,所述原始配电网台区负荷序列具有时序性,所述原始数据包括有功功率。
优选地,所述步骤S1具体包括:
S101、在所述原始配电网台区负荷序列中加入高斯白噪声得到新的配电网台区负荷序列,利用集总经验模态对所述新的配电网台区负荷序列进行分解,得到若干个模态分量,所述模态分量包括若干个本征模态分量和一个残差分量;
S102、重复M次步骤S101,从而每次向所述原始配电网台区负荷序列加入不同的高斯白噪声,以得到M组本征模态分量和残差分量;
S103、对M组本征模态分量和残差分量分别求取均值,从而得到若干个本征模态分量均值和一个残差分量均值,其中,所述本征模态分量均值表示为,
所述残差分量均值表示为,
对每个模态分量通过下式进行归一化处理,
优选地,步骤S2具体包括:
S201、通过归一化后的若干个所述模态分量选取训练样本和测试样本以分别构建训练集和测试集;
S202、假设所述训练样本定义为,其中,和分别为训练样本的属性和标签,,R表示实数域,N表示维度,基于决策树算法对每个决策树依次采用Bootstrap策略有放回地随机抽取m个训练样本,则生成由n个决策树组合成的分位数梯度提升决策树,其中,n为预设的决策树数量;
S205、通过下式计算切分后的两部分训练集上对应标签的期望值,作为决策树待选的估计值:
S207、重复步骤S203~S206直到满足停止分裂条件,从而生成决策树,其中,停止分裂条件为所述目标值小于预设阈值或达到决策树的预设最大深度;
S208、采用弹球损失函数作为分位数梯度提升决策树预测模型的预测性能的评价模型,其中,弹球损失函数为,
优选地,所述概率密度函数为,
优选地,步骤S4具体包括:
第二方面,本发明还提供了一种基于分位数梯度提升决策树的负荷区间预测系统,包括:
模态分解模块,用于采用集总经验模态对原始配电网台区负荷序列进行分解,得到若干个模态分量,对每个模态分量进行归一化处理;
决策树预测模块,用于对每个模态分量分别建立分位数梯度提升决策树预测模型,得到各个模态分量在不同分位数条件下的预测值,将各个模态分量的预测值进行累加,得到预测值在预设的分位点时的条件分布;
概率密度计算模块,用于采用核密度估计方法在所述预测值在预设的分位点时的条件分布中得到未来配电网台区负荷的概率密度函数;
置信预测模块,用于通过所述概率密度函数计算求得满足预定的置信水平下的置信区间,从而输出配电网台区负荷区间预测结果。
第三方面,本发明还提供了一种计算机可读存储介质,其中存储有计算机程序,所述计算机程序被处理器加载执行时,实现如上述的基于分位数梯度提升决策树的负荷区间预测方法的步骤。
第四方面,本发明还提供了一种电子设备,包括:处理器及存储器;其中,
所述存储器用于存储计算机程序;
所述处理器用于加载执行所述计算机程序,以使所述电子设备执行如上述的基于分位数梯度提升决策树的负荷区间预测方法的步骤。
从以上技术方案可以看出,本发明具有以下优点:
本发明通过采用集总经验模态对原始配电网台区负荷序列进行分解,得到不同特征的模态分量,降低了后续分位数梯度提升决策树预测模型训练的复杂程度,提高了预测的准确性,并采用核密度估计方法得到概率密度函数,避免构造概率分布的主观性和先验性,提高了配电网台区负荷区间预测的可靠性和准确性,同时,利用决策树采样的随机性确保样本之间学习的多样化,使得分位数梯度提升决策树不易陷入过拟合风险,具有良好的泛化能力。
附图说明
图1为本申请实施例提供的一种基于分位数梯度提升决策树的负荷区间预测方法的流程图;
图2为本申请实施例提供的一种基于分位数梯度提升决策树的负荷区间预测系统的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在现有技术中,多是采用预测误差分布统计法、概率式预测方法或传统分位数回归方法,其中,预测误差分布统计法是根据历史配电网台区负荷预测的误差数据,通过配电网台区负荷水平和统计时段两个维度建立误差概率分布模型,然后以此为根据,结合确定性预测结果进行概率补偿修正,得到区间预测结果,但是,对历史数据质量要求较高,且划分统计区间存在一定的主观性,而且对参数的设定较为敏感,很大程度上影响构造历史预测误差分布的可靠性;
概率式预测方法是由贝叶斯理论发展起来的机器学习算法,多以核函数作为回归分析的基础,其中代表性的算法有高斯过程回归。高斯过程回归假定随机变量的方差服从高斯分布,主要用于求出预测量的期望值及其分布状况,进而得到配电网台区负荷任意置信水平下的区间预测结果,但是,通常假定配电网台区负荷服从某种特定的分布,然而这种假定的有效性难以通过统计方法得到严格证明,容易与实际分布存在较大的偏差,从而影响配电网台区负荷区间预测的准确性;
传统分位数回归方法大多基于浅层的机器学习算法如BP神经网络,容易在模型训练阶段陷入局部最优解,导致模型泛化能力不足。
为此,请参阅图1,本发明提供的一种基于分位数梯度提升决策树的负荷区间预测方法,包括以下步骤:
S1、采用集总经验模态对原始配电网台区负荷序列进行分解,得到若干个模态分量,对每个模态分量进行归一化处理;
S2、对每个模态分量分别建立分位数梯度提升决策树预测模型,得到各个模态分量在不同分位数条件下的预测值,将各个模态分量的预测值进行累加,得到预测值在预设的分位点时的条件分布;
S3、采用核密度估计方法在预测值在预设的分位点时的条件分布中得到未来配电网台区负荷的概率密度函数;
S4、通过概率密度函数计算求得满足预定的置信水平下的置信区间,从而输出配电网台区负荷区间预测结果。
本发明通过采用集总经验模态对原始配电网台区负荷序列进行分解,得到不同特征的模态分量,降低了后续分位数梯度提升决策树预测模型训练的复杂程度,提高了预测的准确性,并采用核密度估计方法得到概率密度函数,避免构造概率分布的主观性和先验性,提高了配电网台区负荷区间预测的可靠性和准确性,同时,利用决策树采样的随机性确保样本之间学习的多样化,使得分位数梯度提升决策树不易陷入过拟合风险,具有良好的泛化能力。
以下为本发明提供的一种基于分位数梯度提升决策树的负荷区间预测方法的实施例的具体描述。
本发明提供的一种基于分位数梯度提升决策树的负荷区间预测方法,包括以下步骤:
S0、根据预设采样周期采集配电网台区负荷的原始数据,对原始数据进行数据清洗,得到原始配电网台区负荷序列,原始配电网台区负荷序列具有时序性,原始数据包括有功功率。
需要说明的是,根据预设采样周期采集配电网台区负荷的原始数据,其原始数据是按时间先后顺序进行采样得到的,可得到负荷时间序列。
同时,在采样过程中由于一些原因可能出现数据缺失或异常的情况,通过对原始数据进行数据清洗,即可得到相对完整、正常的负荷时间序列。
S100、采用集总经验模态对原始配电网台区负荷序列进行分解,得到若干个模态分量,对每个模态分量进行归一化处理;
具体地,步骤S100具体包括:
S101、在原始配电网台区负荷序列中加入高斯白噪声得到新的配电网台区负荷序列,利用集总经验模态对新的配电网台区负荷序列进行分解,得到若干个模态分量,模态分量包括若干个本征模态分量和一个残差分量;
S102、重复M次步骤S101,从而每次向原始配电网台区负荷序列加入不同的高斯白噪声,以得到M组本征模态分量和残差分量;
S103、对M组本征模态分量和残差分量分别求取均值,从而得到若干个本征模态分量均值和一个残差分量均值,其中,本征模态分量均值表示为,
残差分量均值表示为,
对每个模态分量通过下式进行归一化处理,
S200、对每个模态分量分别建立分位数梯度提升决策树预测模型,得到各个模态分量在不同分位数条件下的预测值,将各个模态分量的预测值进行累加,得到预测值在预设的分位点时的条件分布;
具体地,步骤S200具体包括:
S201、通过归一化后的若干个模态分量选取训练样本和测试样本以分别构建训练集和测试集;
一般示例中,按一定比例从数据集(模态分量)中抽取前70%~90%的数据作为训练样本,而其余的数据作为测试样本。
S202、假设训练样本定义为,其中,和分别为训练样本的属性和标签,,R表示实数域,N表示维度,基于决策树算法对每个决策树依次采用Bootstrap策略有放回地随机抽取m个训练样本,则生成由n个决策树组合成的分位数梯度提升决策树,其中,n为预设的决策树数量;
需要说明的是,若当前采样时刻记为t,样本的属性是指模态分量中N个采样时刻为t-p的数据,这里数据一般不唯一,p=1,2,…,k,k为任意自然数;样本的标签是指模态分量中单个采样时刻为t+q的数据,q=1,2,…,k。模态分量中的数据是按时间先后顺序分布的,通过一定的组合方式即可得到样本的属性和标签。
在本实施例中,若当前采样时刻记为t,样本的属性是指模态分量中N个采样时刻为t-p的数据,这里数据一般不唯一,p=1,2,…,k,k为任意自然数。根据数据的数值大小,对属性j上的所有取值进行从小到大的重新排序。
S205、通过下式计算切分后的两部分训练集上对应标签的期望值,作为决策树待选的估计值:
S207、重复步骤S203~S206直到满足停止分裂条件,从而生成决策树,其中,停止分裂条件为目标值小于预设阈值或达到决策树的预设最大深度;
S208、采用弹球损失函数作为分位数梯度提升决策树预测模型的预测性能的评价模型,其中,弹球损失函数为,
需要说明的是,采用弹球损失函数可以评价不同分位点条件下模型(分位数梯度提升决策树)的预测值与样本的真实值之间的差异,损失函数表现越好,通常模型的性能越好。
需要说明的是,分位数梯度提升决策树模型采用迭代方式训练,下一轮迭代利用负梯度测量前一轮基学习器的性能,通过拟合损失函数负梯度来校正之前出现的错误,最终找到能够无限逼近真实值的输出值。
S300、采用核密度估计方法在预测值在预设的分位点时的条件分布中得到未来配电网台区负荷的概率密度函数;
具体地,概率密度函数为,
需要说明的是,可采用经验法则选取合适的窗宽系数。
S400、通过概率密度函数计算求得满足预定的置信水平下的置信区间,从而输出配电网台区负荷区间预测结果。
具体地,步骤S400具体包括:
以上为本发明提供的一种基于分位数梯度提升决策树的负荷区间预测方法的实施例的描述,参考图2,本发明还提供了一种基于分位数梯度提升决策树的负荷区间预测系统,包括:
模态分解模块100,用于采用集总经验模态对原始配电网台区负荷序列进行分解,得到若干个模态分量,对每个模态分量进行归一化处理;
决策树预测模块200,用于对每个模态分量分别建立分位数梯度提升决策树预测模型,得到各个模态分量在不同分位数条件下的预测值,将各个模态分量的预测值进行累加,得到预测值在预设的分位点时的条件分布;
概率密度计算模块300,用于采用核密度估计方法在预测值在预设的分位点时的条件分布中得到未来配电网台区负荷的概率密度函数;
置信预测模块400,用于通过概率密度函数计算求得满足预定的置信水平下的置信区间,从而输出配电网台区负荷区间预测结果。
需要说明的是,本发明提供的一种基于分位数梯度提升决策树的负荷区间预测系统的工作过程与上述一种基于分位数梯度提升决策树的负荷区间预测方法的流程一致,在此不再赘述。
本发明提供的一种基于分位数梯度提升决策树的负荷区间预测系统,通过采用集总经验模态对原始配电网台区负荷序列进行分解,得到不同特征的模态分量,降低了后续分位数梯度提升决策树预测模型训练的复杂程度,提高了预测的准确性,并采用核密度估计方法得到概率密度函数,避免构造概率分布的主观性和先验性,提高了配电网台区负荷区间预测的可靠性和准确性,同时,利用决策树采样的随机性确保样本之间学习的多样化,使得分位数梯度提升决策树不易陷入过拟合风险,具有良好的泛化能力。
本发明还提供了一种计算机可读存储介质,其中存储有计算机程序,计算机程序被处理器加载执行时,实现如上述的基于分位数梯度提升决策树的负荷区间预测方法的步骤。
本发明还提供了一种电子设备,包括:处理器及存储器;其中,
存储器用于存储计算机程序;
处理器用于加载执行计算机程序,以使电子设备执行如上述的基于分位数梯度提升决策树的负荷区间预测方法的步骤。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以通过一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (8)
1.一种基于分位数梯度提升决策树的负荷区间预测方法,其特征在于,包括以下步骤:
S1、采用集总经验模态对原始配电网台区负荷序列进行分解,得到若干个模态分量,对每个模态分量进行归一化处理;
S2、对每个模态分量分别建立分位数梯度提升决策树预测模型,得到各个模态分量在不同分位数条件下的预测值,将各个模态分量的预测值进行累加,得到预测值在预设的分位点时的条件分布;
S3、采用核密度估计方法在所述预测值在预设的分位点时的条件分布中得到未来配电网台区负荷的概率密度函数;
S4、通过所述概率密度函数计算求得满足预定的置信水平下的置信区间,从而输出配电网台区负荷区间预测结果;
步骤S2具体包括:
S201、通过归一化后的若干个所述模态分量选取训练样本和测试样本以分别构建训练集和测试集;
S202、假设所述训练样本定义为,其中,和分别为训练样本的属性和标签,, R表示实数域,N表示维度,基于决策树算法对每个决策树依次采用Bootstrap策略有放回地随机抽取m个训练样本,则生成由n个决策树组合成的分位数梯度提升决策树,其中,n为预设的决策树数量;S203、随机选择某个待切分属性j,将属性j上所有取值从小到大排序,记为,通过下式得到属性j上的候选划分点集合,
S205、通过下式计算切分后的两部分训练集上对应标签的期望值,作为决策树待选的估计值:
S207、重复步骤S203~S206直到满足停止分裂条件,从而生成决策树,其中,停止分裂条件为所述目标值小于预设阈值或达到决策树的预设最大深度;
S208、采用弹球损失函数作为分位数梯度提升决策树预测模型的预测性能的评价模型,其中,弹球损失函数为,
2.根据权利要求1所述的基于分位数梯度提升决策树的负荷区间预测方法,其特征在于,所述步骤S1之前包括:
根据预设采样周期采集配电网台区负荷的原始数据,对所述原始数据进行数据清洗,得到原始配电网台区负荷序列,所述原始配电网台区负荷序列具有时序性,所述原始数据包括有功功率。
3.根据权利要求1所述的基于分位数梯度提升决策树的负荷区间预测方法,其特征在于,所述步骤S1具体包括:
S101、在所述原始配电网台区负荷序列中加入高斯白噪声得到新的配电网台区负荷序列,利用集总经验模态对所述新的配电网台区负荷序列进行分解,得到若干个模态分量,所述模态分量包括若干个本征模态分量和一个残差分量;
S102、重复M次步骤S101,从而每次向所述原始配电网台区负荷序列加入不同的高斯白噪声,以得到M组本征模态分量和残差分量;
S103、对M组本征模态分量和残差分量分别求取均值,从而得到若干个本征模态分量均值和一个残差分量均值,其中,所述本征模态分量均值表示为,
所述残差分量均值表示为,
对每个模态分量通过下式进行归一化处理,
6.一种基于分位数梯度提升决策树的负荷区间预测系统,其特征在于,包括:
模态分解模块,用于采用集总经验模态对原始配电网台区负荷序列进行分解,得到若干个模态分量,对每个模态分量进行归一化处理;
决策树预测模块,用于对每个模态分量分别建立分位数梯度提升决策树预测模型,得到各个模态分量在不同分位数条件下的预测值,将各个模态分量的预测值进行累加,得到预测值在预设的分位点时的条件分布;
概率密度计算模块,用于采用核密度估计方法在所述预测值在预设的分位点时的条件分布中得到未来配电网台区负荷的概率密度函数;
置信预测模块,用于通过所述概率密度函数计算求得满足预定的置信水平下的置信区间,从而输出配电网台区负荷区间预测结果;
决策树预测模块具体用于:
通过归一化后的若干个所述模态分量选取训练样本和测试样本以分别构建训练集和测试集;
假设所述训练样本定义为,其中,和分别为训练样本的属性和标签,, R表示实数域,N表示维度,基于决策树算法对每个决策树依次采用Bootstrap策略有放回地随机抽取m个训练样本,则生成由n个决策树组合成的分位数梯度提升决策树,其中,n为预设的决策树数量;随机选择某个待切分属性j,将属性j上所有取值从小到大排序,记为,通过下式得到属性j上的候选划分点集合,
通过下式计算切分后的两部分训练集上对应标签的期望值,作为决策树待选的估计值:
直到满足停止分裂条件,从而生成决策树,其中,停止分裂条件为所述目标值小于预设阈值或达到决策树的预设最大深度;
采用弹球损失函数作为分位数梯度提升决策树预测模型的预测性能的评价模型,其中,弹球损失函数为,
7.一种计算机可读存储介质,其中存储有计算机程序,其特征在于,所述计算机程序被处理器加载执行时,实现如权利要求1至5中任一所述的基于分位数梯度提升决策树的负荷区间预测方法的步骤。
8.一种电子设备,其特征在于,包括:处理器及存储器;其中,
所述存储器用于存储计算机程序;
所述处理器用于加载执行所述计算机程序,以使所述电子设备执行如权利要求1至5中任一所述的基于分位数梯度提升决策树的负荷区间预测方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111046819.8A CN113496315B (zh) | 2021-09-08 | 2021-09-08 | 基于分位数梯度提升决策树的负荷区间预测方法及系统 |
PCT/CN2022/079202 WO2023035564A1 (zh) | 2021-09-08 | 2022-03-04 | 基于分位数梯度提升决策树的负荷区间预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111046819.8A CN113496315B (zh) | 2021-09-08 | 2021-09-08 | 基于分位数梯度提升决策树的负荷区间预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113496315A CN113496315A (zh) | 2021-10-12 |
CN113496315B true CN113496315B (zh) | 2022-01-25 |
Family
ID=77997172
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111046819.8A Active CN113496315B (zh) | 2021-09-08 | 2021-09-08 | 基于分位数梯度提升决策树的负荷区间预测方法及系统 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113496315B (zh) |
WO (1) | WO2023035564A1 (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113496315B (zh) * | 2021-09-08 | 2022-01-25 | 广东电网有限责任公司湛江供电局 | 基于分位数梯度提升决策树的负荷区间预测方法及系统 |
CN116300774B (zh) * | 2023-05-23 | 2023-08-08 | 蓝星智云(山东)智能科技有限公司 | 基于主元分析与核密度估计的间歇过程可视化监控方法 |
CN116432478B (zh) * | 2023-06-15 | 2023-09-08 | 广东电网有限责任公司东莞供电局 | 一种电力系统的能量确定方法、装置、设备及介质 |
CN116544931B (zh) * | 2023-06-27 | 2023-12-01 | 北京理工大学 | 基于集成片段变换和时间卷积网络的电力负荷分布预测方法 |
CN116596044B (zh) * | 2023-07-18 | 2023-11-07 | 华能山东泰丰新能源有限公司 | 基于多源数据的发电负荷预测模型训练方法及装置 |
CN116646933B (zh) * | 2023-07-24 | 2023-10-10 | 北京中能亿信软件有限公司 | 一种基于大数据的电力负荷调度方法及系统 |
CN117239731B (zh) * | 2023-09-21 | 2024-02-27 | 山东工商学院 | 基于混合模型的节假日短期电力负荷预测方法 |
CN117290664B (zh) * | 2023-09-27 | 2024-04-26 | 贵州大学 | 一种基于emd-blstm模型的刀盘扭矩实时动态预测方法及装置 |
CN117112857B (zh) * | 2023-10-23 | 2024-01-05 | 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) | 一种适用于工业智能制造的加工路径推荐方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10366451B2 (en) * | 2016-01-27 | 2019-07-30 | Huawei Technologies Co., Ltd. | System and method for prediction using synthetic features and gradient boosted decision tree |
CN109978201A (zh) * | 2017-12-27 | 2019-07-05 | 深圳市景程信息科技有限公司 | 基于高斯过程分位数回归模型的概率负荷预测系统及方法 |
CN108846517B (zh) * | 2018-06-12 | 2021-03-16 | 清华大学 | 一种分位数概率性短期电力负荷预测集成方法 |
CN109242139A (zh) * | 2018-07-23 | 2019-01-18 | 华北电力大学 | 一种电力日峰值负荷预测方法 |
CN109359778A (zh) * | 2018-11-13 | 2019-02-19 | 中石化石油工程技术服务有限公司 | 基于优化经验模态分解的短期天然气负荷预测方法 |
CN109726865A (zh) * | 2018-12-27 | 2019-05-07 | 国网江苏省电力有限公司电力科学研究院 | 基于emd-qrf的用户负荷概率密度预测方法、装置和存储介质 |
CN110969197B (zh) * | 2019-11-22 | 2022-01-04 | 上海交通大学 | 一种基于实例迁移的风力发电的分位数预测方法 |
CN111523735A (zh) * | 2020-05-09 | 2020-08-11 | 上海积成能源科技有限公司 | 一种基于轻量级梯度提升算法预测短期电力负荷的系统模型 |
CN112001439A (zh) * | 2020-08-19 | 2020-11-27 | 西安建筑科技大学 | 基于gbdt的商场建筑空调冷负荷预测方法、存储介质及设备 |
CN112488352A (zh) * | 2020-10-21 | 2021-03-12 | 上海旻浦科技有限公司 | 一种基于梯度提升回归的房价区间预测方法及系统 |
CN112926780A (zh) * | 2021-03-01 | 2021-06-08 | 南方电网科学研究院有限责任公司 | 基于Sister预测的平均分位数回归的概率负荷预测方法 |
CN113496315B (zh) * | 2021-09-08 | 2022-01-25 | 广东电网有限责任公司湛江供电局 | 基于分位数梯度提升决策树的负荷区间预测方法及系统 |
-
2021
- 2021-09-08 CN CN202111046819.8A patent/CN113496315B/zh active Active
-
2022
- 2022-03-04 WO PCT/CN2022/079202 patent/WO2023035564A1/zh unknown
Also Published As
Publication number | Publication date |
---|---|
CN113496315A (zh) | 2021-10-12 |
WO2023035564A1 (zh) | 2023-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113496315B (zh) | 基于分位数梯度提升决策树的负荷区间预测方法及系统 | |
JP3209163B2 (ja) | 分類装置 | |
CN111966904B (zh) | 基于多用户画像模型的信息推荐方法和相关装置 | |
CN110910004A (zh) | 一种多重不确定性的水库调度规则提取方法及系统 | |
Bagirov et al. | Nonsmooth nonconvex optimization approach to clusterwise linear regression problems | |
CN112365033B (zh) | 一种风电功率区间预测方法、系统及存储介质 | |
CN110796485A (zh) | 一种提高预测模型的预测精度的方法及装置 | |
CN114880482A (zh) | 一种基于图嵌入的关系图谱关键人员分析方法及系统 | |
CN112801231B (zh) | 用于业务对象分类的决策模型训练方法和装置 | |
Guillen et al. | Minimising the delta test for variable selection in regression problems | |
CN117094535A (zh) | 基于人工智能的能源补给管理方法及系统 | |
Christen et al. | On the analysis of accumulation curves | |
CN113782092B (zh) | 一种生存期预测模型的生成方法及装置、存储介质 | |
CN113298120B (zh) | 基于融合模型的用户风险预测方法、系统和计算机设备 | |
Chang et al. | Bayesian networks applied to credit scoring | |
CN113064812A (zh) | 一种项目开发过程质量缺陷预测方法、装置及介质 | |
CN117235448B (zh) | 数据清洗方法、终端设备及存储介质 | |
CN117786444B (zh) | 电池剩余使用寿命预测方法、装置、设备及存储介质 | |
Prakash et al. | Implementation of Hybrid Particle Swarm Optimization for Optimized Regression Testing. | |
CN115242482B (zh) | 越权访问风险检测方法、装置、电子设备及可读存储介质 | |
CN114676167B (zh) | 用户存留模型的训练方法、用户存留预测方法和装置 | |
Sagar et al. | Rough Set and Genetic Based Approach for Maximization of Weighted Association Rules. | |
Lunagómez et al. | Evaluating and optimizing network sampling designs: decision theory and information theory perspectives | |
Pedrielli et al. | Stochastic Simulation Optimization with Optimal Computing Budget Allocation | |
CN117786444A (zh) | 电池剩余使用寿命预测方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |