CN105427194A - 一种基于随机森林回归的售电量预测方法及装置 - Google Patents

一种基于随机森林回归的售电量预测方法及装置 Download PDF

Info

Publication number
CN105427194A
CN105427194A CN201510967788.8A CN201510967788A CN105427194A CN 105427194 A CN105427194 A CN 105427194A CN 201510967788 A CN201510967788 A CN 201510967788A CN 105427194 A CN105427194 A CN 105427194A
Authority
CN
China
Prior art keywords
month
quarter
gdp
predicted value
predicted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510967788.8A
Other languages
English (en)
Inventor
程宏亮
卢耀宗
强劲
黄蓉
苟蛟龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xi'an Merit Data Technology Co Ltd
Original Assignee
Xi'an Merit Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xi'an Merit Data Technology Co Ltd filed Critical Xi'an Merit Data Technology Co Ltd
Priority to CN201510967788.8A priority Critical patent/CN105427194A/zh
Publication of CN105427194A publication Critical patent/CN105427194A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明公开了一种基于随机森林回归的售电量预测方法及装置,依据预设时长内的历史的月售电量数据,以及预先确定的若干影响因素指标,建立基于随机森林回归的月售电量预测模型。获取和计算待预测月的上述若干影响因素指标,代入月售电量预测模型,得到未来待预测月的月售电量预测结果。

Description

一种基于随机森林回归的售电量预测方法及装置
技术领域
本发明涉及电力行业的大数据分析技术领域,更具体的说,是涉及一种基于随机森林回归的售电量预测方法及装置。
背景技术
月度售电量预测是电力需求侧的管理重要的市场预测技术手段,精确的售电量预测对于合理安排电网供电计划、科学优化电力资源配置、提高用电管理效率、有效实施电力需求侧的管理和节能降耗战略有着十分重要的意义。
发明人在实现本发明的过程中发现,传统的预测电量的方法的运行效率和预测精度较低,尤其是预测问题面临成千上万的输入变量、训练数据存在缺失信息时。
发明内容
有鉴于此,本发明提供了一种基于随机森林回归的售电量预测方法及装置,以提高售电量预测结果的精度和效率。
为实现上述目的,本发明提供如下技术方案:
一种基于随机森林回归的售电量预测方法,包括:
获取预设时长内所述若干影响因素指标的历史数据;
获取预设时长内历史的月售电量实际数据;
根据所述若干影响因素指标的历史数据和历史月度售电量实际数据,建立基于随机森林回归的月售电量预测模型;
计算待预测月的各个影响因素指标,输入预置的月售电量预测模型,得到待预测月的售电量预测值;
其中,所述预置的月售电量预测模型依据预设时长内的历史月售电量实际数据以及预先获取的若干影响因素历史指标数据建立。
上述方法,优选的,还包括预置的月售电量预测模型为:
f 1 ( x 11 , ... , x 1 M ) = y 1 ... ... f k ( x k 1 , ... , x k M ) = y k
其中,xij(i=1,...,k,j=1,...,m)表示所述预设时长内的历史影响因素;y1,...,yk表示若干年度内月售电量的实际数据。
上述方法,优选的,所述月售电量预测模型依据随机森林回归预测方法建立。
上述方法,优选的,所述若干影响因素指标包括:当月GDP增速,当月最高温度,当月最低温度,当月降雨量,上月售电量,上年同月售电量和月节假日公休天数。
上述方法,优选的,计算当前年度内的月GDP增速的预测数据包括:
获取若干年内各个季度的GDP增速值;
计算当前年度各个季度的GDP增速的预测值,其中,第z个季度的GDP增速增值的预测值为所述若干年内,第z个季度的GDP增速值的加权平均值,z=1,2,3,4;
依据所述当前年度的各个季度的GDP增速的预测值计算当前年度各个月的GDP增速的预测值。
上述方法,优选的,所述依据所述当前年度的各个季度的GDP增速的预测值计算当前年度各个月的GDP增速的预测值包括:
将第z个季度最后一个月的GDP增速的预测值确定为第z个季度的GDP增速的预测值;GDP增速根据三次多项式公式确定:g(e)=a·e3+b·e2+c·e+d=E,将第z个季度最后一个月的GDP增速带入此三次多项式,得:
g ( e 13 ) = a · e 13 3 + b · e 13 2 + c · e 13 + d = E 13 g ( e 23 ) = a · e 23 3 + b · e 23 2 + c · e 23 + d = E 23 g ( e 33 ) = a · e 33 3 + b · e 33 2 + c · e 33 + d = E 33 g ( e 43 ) = a · e 43 3 + b · e 43 2 + c · e 43 + d = E 43
由此计算出a,b,c,d后,则第z个季度(z=1,2,3,4)其它月份的GDP增速为:g(ezn)=a·ezn 3+b·ezn 2+c·ezn+d=Ezn;其中,ezn表示第z个季度中第n个月份的月份值,n=1,2;Ezn表示第z个季度中第n个月份的GDP增速的预测值;
上述方法,优选的,计算当前年度内的月最高温度、最低温度的预测数据包括:
获取若干年内各个月的最高温度、最低温度值;
将所述若干年内同一个月份的最高温度、最低温度值的平均值确定为当前年度内的该月份的最高温度、最低温度的预测值。
上述方法,优选的,计算当前年度内的月降雨量的预测数据包括:
获取若干年内各个月的降雨量值;
将所述若干年内同一个月份的最降雨量的平均值确定为当前年度内的该月份的降雨量的预测值。
上述方法,优选的,计算当前年度内的上月售电量、当前年度的上一年同月的售电量预测值包括:
获取当前年度内的上月售电量、当前年度的上一年同月的售电量;
上述方法,优选的,计算当前年度内的月节假日公休天数的预测值包括:
获取若干年内各个月、当前年度内各个月的节假日公休天数;
一种基于随机森林回归的售电量预测装置,包括:
第一获取模块,用于获取若干年度内预设的若干影响因素指标的历史数据;
第二获取模块,用于获取若干年度内历史的月售电量指标的实际数据;
第一计算模块,用于将所述若干影响因素指标的历史数据和所述月售电量指标的实际数据输入预置的月售电量预测模型,得到基于随机森林回归的月售电量调整量;
第二计算模块,用于计算所述影响因素当前年度内各个月的预测值,将其输入月售电量预测模型,得到当前年度内的待预测月售电量预测值;
其中,所述预置的月售电量预测模型由模型建立模块依据预设时长内的月售电量实际数据以及预先确定的若干影响因素指标建立。
上述装置,优选的,所述第一计算模块为:
第一抽样单元,用于训练数据的行随机抽样;对于总样本量S,采取有放回的抽取k个训练样本;
第二抽样单元,用于训练数据的列属性修养;对于M列个属性,采取无放回的抽取m≤M;
第一计算单元,用于建立决策树;对于采样之后的数据使用完全分裂的方式建立出若干个决策树;
第二计算单元,用于结果确定;根据所述的若干个决策树的预测值,计算其平均值,得到月售电量预测值;
上述装置,优选的,所述若干影响因素指标包括:GDP增速、最高气温、最低气温、降雨量、上一月售电量、上一年同月售电量、当月节假日天数和当月售电量。
上述装置,优选的,所述第二计算模块包括:
第一获取单元,用于获取若干年内各个季度的GDP增速值;
第一计算单元,用于计算当前年度各个季度的GDP增速的预测值,其中,第z个季度的GDP增速增值的预测值为所述若干年内,第z个季度的GDP增速值的加权平均值,z=1,2,3,4;
第二计算单元,用于依据所述当前年度的各个季度的GDP增速的预测值计算当前年度各个月的GDP增速的预测值。将第z个季度最后一个月的GDP增速的预测值确定为为第z个季度的GDP增速的预测值;GDP增速根据三次多项式公式确定:g(e)=a·e3+b·e2+c·e+d=E,将第z个季度最后一个月的GDP增速带入此三次多项式,得:
g ( e 13 ) = a · e 13 3 + b · e 13 2 + c · e 13 + d = E 13 g ( e 23 ) = a · e 23 3 + b · e 23 2 + c · e 23 + d = E 23 g ( e 33 ) = a · e 33 3 + b · e 33 2 + c · e 33 + d = E 33 g ( e 43 ) = a · e 43 3 + b · e 43 2 + c · e 43 + d = E 43
第二获取单元,用于获取若干年内各个月的最高温度、最低温度值;
第一确定单元,用于将所述若干年内同一个月份的最高温度、最低温度值的平均值确定为当前年度内的该月份的最高温度、最低温度的预测值。
第三获取单元,用于获取若干年内各个月的降雨量值;
第二确定单元,用于将所述若干年内同一个月份的降雨量值的平均值确定为当前年度内的该月份的降雨量值的预测值。
第四获取单元,用于获取当前年度上月的售电量和当前年度上一年的同月的售电量数据;
第五获取单元,用于获取若干年内各个月节假日公休天数、当前年度各个月的节假日公休天数;
第一输入单元,将上述若干影响因素输入基于随机森林回归的售电量预测模型,得到若干个售电量预测结果;
第三确认单元,用于将获取得到的若干个售电量预测结果计算平均值,得到待预测月的售电量预测值;
经由上述的技术方案可知,本发明实施例公开的一种基于随机森林回归的售电量预测方法及装置,依据预设时长内的历史的月售电量实际数据以及预先确定的若干影响因素指标,获取基于随机森林回归的月售电量预测模型,将当前年度内上述若干影响因素指标的预测数据输入月售电量预测模型得到当前年度各个月售电量预测结果,提高了售电量预测结果的精度和效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的售电量预测方法的一种实现流程图;
图2为本申请实施例提供的基于随机森林回归方法针对训练集和测试集进行售电量预测的一种建模实现流程图。
图3为申请实施例提供的计算当前年度内的月GDP增速的预测数据的一种实现流程图;
图4为申请实施例提供的针对验证集根据月售电量模型进行待预测月的未来售电量预测的一种实现流程图;
图5为本申请实施例提供的售电量预测的装置的一种结构示意图;
图6为本申请实施例提供的第一计算模块的一种结构示意图;
图7为本申请实施例提供的第二计算模块的一种结构示意图;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的售电量预测方法,实验数据来自某地区2011年1月至2015年10月的月售电量信息、地区经济状况、天气信息和节假日信息,售电量信息采集频率是1month(共58行数据),天气信息为最高气温、最低气温、降雨量。系统对此地区的历史售电量数据的研究发现:这些数据呈现一种延续性、周期性、相关性特点。根据系统对确定样本属性为GDP增速、最高气温、最低气温、降雨量、上一月售电量、上一年同月售电量、当月节假日天数和当月售电量。样本数据如表1所示:
表1.样本数据
实验中数据量虽然没有达到大数据的规模,但可以用此实验数据进行算法正确性实验,随后对实验数据进行扩充达到大数据规模进行算法预测速率实验。进行反复多次的测试,取平均值为最终实验结果。
请参阅图1,图1为本发明实施例提供的售电量预测方法的一种实现流程图,可以包括:
步骤S11:获取当前年度内预设的若干影响因素指标的实际数据;
本发明实施例中,所述的若干影响因素指标是当月GDP增速,当月最高温度,当月最低温度,当月降雨量,上月售电量,上年同月售电量和月节假日公休天数。
步骤S12:获取当前年度内所述当前月售电量指标的实际数据;
本发明实施例中,步骤S11与步骤S12的具体执行过程不做具体限定,可以先执行步骤S11,再执行步骤S12,或者,先执行步骤S12,再执行步骤S11,或者,步骤S11与步骤S12同时执行。
步骤S13:将所述若干影响因素指标的历史数据和当年月售电量指标的实际数据作为输入,建立预置的基于随机森林回归的月售电量预测模型;
步骤S14:将所述各个影响因素指标的预测值,带入月售电量预测模型,得到当前月售电量预测值;
以该地区2011年1月至2014年12月的历史数据为训练样本数据集,以该地区2015年1月至2015年10月的预测数据为测试样本数据集,建立月售电量预测模型。
请参阅图2,图2为上述实施例中,可选的基于随机森林回归方法的针对训练集和测试集的售电量预测模型建立过程,可以包括:
步骤S21:用于训练数据的行随机抽样。对于总样本量S,采取有放回的抽取k个训练样本;
步骤S22:用于训练数据的列属性修养。对于M列个属性,采取无放回的抽取m<<M;根据样本数据中属性的个数M确定每个节点随机选择的属性个数m。一般地,分类模型中m为M的开方根,回归模型中m为M的1/3。计算m个属性中每个属性的信息量,选择最佳的属性进行分支;这里是随机森林回归方法,所以
步骤S23:用于建立决策树。对于采样之后的数据使用完全分裂的方式建立出若干个决策树;形成随机森林也就是把每个决策树分类器组合起来。
可选的,所述预置的月售电量预测模型可以为:
f ( x 11 , ... , x 1 M ) = y 1 ... ... f k ( x k 1 , ... , x k M ) = y k
即每个决策树都会产生一个结果,如果随机森林用来分类其最终结果为投票选取,当它用来回归预测时,k个树会给出k个预测值y1,...,yk
步骤S24:用于结果确定,根据所述的若干个决策树的预测值,计算其平均值,得到月售电量预测值。最终的待预测月的月售电量预测结果是k个决策树预测结果的平均值,记为可以表示成:且预测误差为其中yreal为待预测月售电量实际值;
本发明实施例以该地区2015年11月至2015年12月的预测数据为验证数据集,将2015年11月至2015年12月的上述GDP增速、最高温度、最低温度、降雨量、上一月售电量、当前年上一年同月售电量的预测结果代入预置的基于随机森林回归的月售电量预测模型,即可分别获得待预测月的2015年11月至2015年12月的月售电量预测值。
请参阅图3,图3为上述实施例中可选的,计算当前年度内的月GDP增速的预测数据的一种实现流程图,可以包括:
步骤S31:获取若干年内各个季度的GDP增速值;
步骤S32:计算当前年度各个季度的GDP增速的预测值,其中,第z个季度的GDP增速增值的预测值为所述若干年内,第z个季度的GDP增速值的加权平均值,z=1,2,3,4;
本发明实施例中,采用重近轻远的原则,对不同年份的GDP增速增值加以不同的权值,对近期数据(如)给予较大的权值,对远期数据(如)给予较小的权值。
举例说明上述步骤,假设获取了2011年至2014年4年中每年的各个季度的GDP增速值,则当前年度各个季度的GDP增速的预测值具体用公式可以表示为:
E 2015 , Q z = ( 4 * E 2014 , Q z + 3 * E 2013 , Q z + 2 * E 2012 , Q z + E 2011 , Q z ) 10
其中,表示2015年(即当前年度)第z个季度的GDP增速增值的预测值;表示2014年第z个季度的GDP增速增值的实际值;表示2013年第z个季度的GDP增速增值的实际值;表示2012年第z个季度的GDP增速增值的实际值;表示2011年第z个季度的GDP增速增值的实际值;z=1,2,3,4。
步骤S33:依据所述当前年度的各个季度的GDP增速的预测值计算当前年度各个月的GDP增速的预测值。本发明实施例中,先计算当前年度各个季度的GDP增速的预测值,再利用各个季度的GDP增速的预测值计算当前年度各个月的GDP增速的预测值。
可选的,依据所述当前年度的各个季度的GDP增速的预测值计算当前年度各个月的GDP增速的预测值的具体实现方式可以为:
将第z个季度最后一个月的GDP增速的预测值确定为第z个季度的GDP增速的预测值;
举例说明上述步骤,第一季度中,3月份的GDP增速的预测值为第一季度的GDP增速的预测值;第二季度中,6月份的GDP增速的预测值为第二季度的GDP增速的预测值;第三季度中,9月份的GDP增速的预测值为第三季度的GDP增速的预测值;第四季度中,12月份的GDP增速的预测值为第四季度的GDP增速的预测值。
GDP增速根据三次多项式公式确定:g(e)=a·e3+b·e2+c·e+d=E,将第z个季度最后一个月的GDP增速带入此三次多项式,得:
g ( e 13 ) = a · e 13 3 + b · e 13 2 + c · e 13 + d = E 13 g ( e 23 ) = a · e 23 3 + b · e 23 2 + c · e 23 + d = E 23 g ( e 33 ) = a · e 33 3 + b · e 33 2 + c · e 33 + d = E 33 g ( e 43 ) = a · e 43 3 + b · e 43 2 + c · e 43 + d = E 43
由此计算出a,b,c,d后,则第z个季度(z=1,2,3,4)其它月份的GDP增速为:g(ezn)=a·ezn 3+b·ezn 2+c·ezn+d=Ezn。其中,ezn表示第z个季度中第n个月份的月份值,n=1,2;Ezn表示第z个季度中第n个月份的GDP增速的预测值;
请参阅图4,图4为上述实施例中可选的,根据月售电量预测模型针对验证集进行待预测月售电量预测的一种实现流程图,可以包括:
步骤S41:获取待预测月的GDP增速的预测值;
步骤S42:可选的,计算的待测月最高温度、最低温度的预测值。
举例说明上述步骤,获2011年至2014年各个月的最高温度、最低温度值,2011年N月份的最高温度、最低温度的值为2012年N月份的最高温度、最低温度的温度值为2013年N月份的最高温度、最低温度的温度值为和2014年N月份的最高温度、最低温度的值为
将所述2011年至2014年同一个月份的最高温度、最低温度值的平均值分别确定为当前年2015年度内的该月份的最高温度、最低温度的预测值,即当前年度2015年的N月份的最高温度、最低温度的预测值具体用公式可以表示为:
T 2015 , N max = ( T 2011 , N max + T 2012 , N max + T 2013 , N max + T 2014 , N max ) 4 , T 2015 , N min = ( T 2011 , N min + T 2012 , N min + T 2013 , N min + T 2014 , N min ) 4
N=1,2,3,4,5,6,7,8,9,10,11,12。
步骤S43:可选的,计算当前年度内的月降雨量的预测数据的一种实现方式。
举例说明上述步骤,假设获取了2011年至2014年4年中每年的各个月的降雨量,2011年N月份的降雨量的值R2011,N,2012年N月份的降雨量的R2012,N,2013年N月份降雨量R2013,N的和2014年N月份的降雨量R2014,N
将所述2011年至2014年同一个月份的降雨量的平均值分别确定为当前年度2015年的该月份的降雨量的预测值。具体用公式可以表示为:
R 2015 , N = ( R 2011 , N + R 2012 , N + R 2013 , N + R 2014 , N ) 4
N=1,2,3,4,5,6,7,8,9,10,11,12。
步骤S44:可选的,获取当前年度内的上月售电量、当前年度上一年同月的售电量的预测值的一种实现方式。
步骤S45:可选的,获取当前年度内的月节假日公休天数的预测值的一种实现方式。
步骤S46:将上述步骤获得的若干影响因素的预测值代入基于随进森林回归的月售电量预测模型。
步骤S47:获得当前年度待预测月的售电量预测值结果。
与方法实施例相对应,本发明实施例还提供一种基于随机森林回归的售电量预测方法及装置。
请参阅图5,本发明实施例提供的售电量预测的装置的一种结构示意图如图5所示,可以包括:
第一获取模块51,第二获取模块52,第一计算模块53,第二计算模块54;其中,
第一获取模块51用于获取预设时长内的历史若干年度的若干影响因素指标的历史数据;
第二获取模块52用于获取预设时长内的历史若干年度内的月售电量指标的实际数据;
第一计算模块53用于建立基于随机森林回归的针对训练集和测试集的月售电量预测模型;
第二计算模块54用于将所述各个影响因素指标进行获取和计算,输入月售电量预测模型后,得到未来待预测月的月售电量结果预测值;
本发明实施例提供了一种月售电量预测的装置,是基于随机森林回归实现的。随机森林是一种集成学习方法,以决策树为基本学习单元,是多个决策树的集成学习方法,不仅可以克服决策树的一些不足,而且具有良好的可扩展性和并行性,能够有效解决大数据的快速处理问题,针对大数据环境下的电力公司售电量预测有较好的应用前景。
请参阅图6,可选的,第一计算模块53的一种结构示意图如图6所示,可以包括:
第一抽样单元61,用于训练数据的行随机抽样。对于总样本量S,采取有放回的抽取k个训练样本;
第二抽样单元62,用于训练数据的列属性修养。对于M列个属性,采取无放回的抽取;
第一计算单元63,用于建立决策树。对于采样之后的数据使用完全分裂的方式建立出若干个决策树;
第二计算单元64,用于结果确定。根据所述的若干个决策树的预测值,计算其平均值,得到月售电量预测值;
请参阅图7,可选的,第二计算模块54的一种结构示意图如图7所示,可以包括:
第一获取单元71,用于获取若干年内各个季度的GDP增速值;
第一计算单元72,用于计算当前年度各个季度的GDP增速的预测值,其中,第z个季度的GDP增速增值的预测值为所述若干年内,第z个季度的GDP增速值的加权平均值,z=1,2,3,4;
第二计算单元73,用于依据所述当前年度的各个季度的GDP增速的预测值计算当前年度各个月的GDP增速的预测值。将第z个季度最后一个月的GDP增速的预测值确定为为第z个季度的GDP增速的预测值;GDP增速根据三次多项式公式确定:g(e)=a·e3+b·e2+c·e+d=E,将第z个季度最后一个月的GDP增速带入此三次多项式,得:
g ( e 13 ) = a · e 13 3 + b · e 13 2 + c · e 13 + d = E 13 g ( e 23 ) = a · e 23 3 + b · e 23 2 + c · e 23 + d = E 23 g ( e 33 ) = a · e 33 3 + b · e 33 2 + c · e 33 + d = E 33 g ( e 43 ) = a · e 43 3 + b · e 43 2 + c · e 43 + d = E 43
由此计算出a,b,c,d后,则第z个季度(z=1,2,3,4)其它月份的GDP增速为:g(ezn)=a·ezn 3+b·ezn 2+c·ezn+d=Ezn。其中,ezn表示第z个季度中第n个月份的月份值,n=1,2;Ezn表示第z个季度中第n个月份的GDP增速的预测值;
第二获取单元73,用于获取若干年内各个月的最高温度、最低温度值;
第一确定单元74,用于将所述若干年内同一个月份的最高温度、最低温度值的平均值确定为当前年度内的该月份的最高温度、最低温度的预测值。
第三获取单元75,用于获取若干年内各个月的降雨量值;
第二确定单元76,用于将所述若干年内同一个月份的降雨量的平均值确定为当前年度内的该月份的降雨量的预测值。
第四获取单元78,用于获取当前年内待预测月的上一月的售电量、当前年上一年的待预测月同月的售电量;
第五获取单元79,用于获取当前年内待预测月的节假日公休天数;
第一输入单元710,用于将单元71至单元79得到的影响因素在待预测月的预测值输入预置模型中,进行待预测月售电量预测。
第三确定单元711,得到待预测月的售电量预测结果值。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的部分,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请实施例能够在除了这里图示的以外的顺序实施。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种基于随机森林回归的售电量预测方法其特征在于,包括:
获取预设时长内的若干影响因素指标的历史数据;
获取预设时长内的历史的月售电量实际数据;
根据预设时长内的所述若干影响因素指标的历史数据和历史的月度售电量实际数据,建立基于随机森林回归的月售电量预测模型;
计算待预测月的所述各个影响因素指标,输入预置的月售电量预测模型,得到待预测月的售电量预测值;
其中,所述预置的月售电量预测模型为:
其中,xij(i=1,…,k,j=1,…,m)表示所述预设时长内的历史影响因素;y1,…,yk表示预设时长内月售电量的实际数据;该模型依据预设时长内的历史月售电量实际数据以及获取的若干影响因素历史指标数据建立。
2.根据权利要求1所述的一种基于随机森林回归的售电量预测方法,其特征在于,所述若干影响因素指标包括:当月GDP增速,当月最高温度,当月最低温度,当月降雨量,上月售电量,上年同月售电量和月节假日公休天数。
3.根据权利要求2所述的一种基于随机森林回归的售电量预测方法,其特征在于,待预测月的所述各个影响因素指标中包括待预测月GDP增速的预测数据的获取:
获取历史若干年内各个季度的GDP增速值;
计算当前年度各个季度的GDP增速的预测值,其中,第z个季度的GDP增速增值的预测值为所述若干年内,第z个季度的GDP增速值的加权平均值,z=1,2,3,4;
依据所述当前年度的各个季度的GDP增速的预测值计算当前年度各个月的GDP增速的预测值。
4.根据权利要求3所述的方法,其特征在于,所述依据所述当前年度的各个季度的GDP增速的预测值计算当前年度各个月的GDP增速的预测值包括:
将第z个季度最后一个月的GDP增速的预测值确定为第z个季度的GDP增速的预测值;
GDP增速根据三次多项式公式确定:g(e)=a·e3+b·e2+c·e+d=E,将第z个季度最后一个月的GDP增速带入此三次多项式,得:
由此计算出a,b,c,d后,则第z个季度(z=1,2,3,4)其它月份的GDP增速为:g(ezn)=a·ezn+b·eznc·ezn+a=Ezn;其中,ezn表示第z个季度中第n个月份的月份值,n=1,2;Ezn表示第z个季度中第n个月份的GDP增速的预测值。
5.一种基于随机森林回归的售电量预测装置,其特征在于,包括:
第一获取模块,用于获取若干年度内预设时长内若干影响因素指标的历史数据;
第二获取模块,用于获取预设时长内若干年度内历史的月售电量指标的实际数据;
第一计算模块,用于将所述若干影响因素指标的历史数据和所述月售电量指标的实际数据输入预置的月售电量预测模型,得到基于随机森林回归的月售电量调整量;
第二计算模块,用于计算所述影响因素当前年度内各个月的预测值,将其输入月售电量预测模型,得到当前年度内的待预测月售电量预测值;
其中,所述预置的月售电量预测模型由模型建立模块依据预设时长内的月售电量实际数据以及预先确定的若干影响因素指标建立。
6.根据权利要求5所述的一种基于随机森林回归的售电量预测装置,其特征在于,所述第一计算模块包括:
第一抽样模块,用于训练数据的行随机抽样;对于总样本量S,采取有放回的抽取k个训练样本;
第二抽样模块,用于训练数据的列属性修养;对于M列个属性,采取无放回的抽取m≤M;
第一计算模块,用于建立决策树;对于采样之后的数据使用完全分裂的方式建立出若干个决策树;
第二计算模块,用于结果确定;根据所述的若干个决策树的预测值,计算其平均值,得到月售电量预测值。
7.根据权利要求5所述的一种基于随机森林回归的售电量预测装置,其特征在于,所述若干影响因素指标包括:当月GDP增速,当月最高温度,当月最低温度,当月降雨量,上月售电量,上年同月售电量和月节假日公休天数。
8.根据权利要求5所述的一种基于随机森林回归的售电量预测装置,其特征在于,所述第二计算模块包括:
第一获取单元。获取若干年内各个季度的GDP增速值;
第一计算单元。计算当前年度各个季度的GDP增速的预测值,其中,第z个季度的GDP增速增值的预测值为所述若干年内,第z个季度的GDP增速值的加权平均值,z=1,2,3,4;
第二计算单元依据所述当前年度的各个季度的GDP增速的预测值计算当前年度各个月的GDP增速的预测值。将第z个季度最后一个月的GDP增速的预测值确定为为第z个季度的GDP增速的预测值;
GDP增速根据三次多项式公式确定:g(e)=a·e3+b·e2+c·e+d=E,将第z个季度最后一个月的GDP增速带入此三次多项式,得:
g(e)=a·e3+b·e2+c·e+d=E
由此计算出a,b,c,d后,则第z个季度(z=1,2,3,4)其它月份的GDP增速为:g(ezn)=a·ezn 3+b·ezn 2c·ezn+a=Ezn。其中,ezn表示第z个季度中第n个月份的月份值,n=1,2;Ezn表示第z个季度中第n个月份的GDP增速的预测值;
第二获取单元,用于获取若干年内各个月的最高温度、最低温度值;
第一确定单元,用于将所述若干年内同一个月份的最高温度、最低温度值的平均值确定为当前年度内的该月份的最高温度、最低温度的预测值。
第三获取单元,用于获取若干年内各个月的降雨量值;
第二确定单元,用于将所述若干年内同一个月份的降雨量值的平均值确定为当前年度内的该月份的降雨量值的预测值。
第四获取单元,用于获取当前年度上月的售电量和当前年度上一年的同月的售电量数据;
第五获取单元,用于获取若干年内各个月节假日公休天数、当前年度各个月的节假日公休天数;
第一输入单元,将上述若干影响因素输入基于随机森林回归的售电量预测模型,得到若干个售电量预测结果;
第三确认单元,用于将获取得到的若干个售电量预测结果计算平均值,得到待预测月的售电量预测值。
CN201510967788.8A 2015-12-21 2015-12-21 一种基于随机森林回归的售电量预测方法及装置 Pending CN105427194A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510967788.8A CN105427194A (zh) 2015-12-21 2015-12-21 一种基于随机森林回归的售电量预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510967788.8A CN105427194A (zh) 2015-12-21 2015-12-21 一种基于随机森林回归的售电量预测方法及装置

Publications (1)

Publication Number Publication Date
CN105427194A true CN105427194A (zh) 2016-03-23

Family

ID=55505376

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510967788.8A Pending CN105427194A (zh) 2015-12-21 2015-12-21 一种基于随机森林回归的售电量预测方法及装置

Country Status (1)

Country Link
CN (1) CN105427194A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106372748A (zh) * 2016-08-29 2017-02-01 上海交通大学 一种硬岩掘进机的掘进效率预测方法
CN107798446A (zh) * 2016-09-07 2018-03-13 北京嘀嘀无限科技发展有限公司 富矿路线的评测处理方法及装置
CN107818382A (zh) * 2017-10-27 2018-03-20 中航信移动科技有限公司 航班到达时间预测方法
CN109242220A (zh) * 2018-11-16 2019-01-18 国家电网有限公司 充电站交易电量预测方法、装置、电子设备及存储介质
CN109961165A (zh) * 2017-12-25 2019-07-02 顺丰科技有限公司 件量预测方法、装置、设备及其存储介质
CN110019401A (zh) * 2017-12-25 2019-07-16 顺丰科技有限公司 件量预测方法、装置、设备及其存储介质
CN111275247A (zh) * 2020-01-14 2020-06-12 西安理工大学 一种基于多种影响因素的极限学习机月度电量预测方法
US10859387B2 (en) 2016-04-27 2020-12-08 Beijing Didi Infinity Technology And Development Co., Ltd. System and method for determining routes of transportation service
CN113125960A (zh) * 2019-12-31 2021-07-16 河北工业大学 一种基于随机森林模型的车载锂离子电池荷电状态预测方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10859387B2 (en) 2016-04-27 2020-12-08 Beijing Didi Infinity Technology And Development Co., Ltd. System and method for determining routes of transportation service
CN106372748A (zh) * 2016-08-29 2017-02-01 上海交通大学 一种硬岩掘进机的掘进效率预测方法
CN107798446A (zh) * 2016-09-07 2018-03-13 北京嘀嘀无限科技发展有限公司 富矿路线的评测处理方法及装置
CN107818382A (zh) * 2017-10-27 2018-03-20 中航信移动科技有限公司 航班到达时间预测方法
CN109961165A (zh) * 2017-12-25 2019-07-02 顺丰科技有限公司 件量预测方法、装置、设备及其存储介质
CN110019401A (zh) * 2017-12-25 2019-07-16 顺丰科技有限公司 件量预测方法、装置、设备及其存储介质
CN109961165B (zh) * 2017-12-25 2023-11-28 顺丰科技有限公司 件量预测方法、装置、设备及其存储介质
CN110019401B (zh) * 2017-12-25 2024-04-05 顺丰科技有限公司 件量预测方法、装置、设备及其存储介质
CN109242220A (zh) * 2018-11-16 2019-01-18 国家电网有限公司 充电站交易电量预测方法、装置、电子设备及存储介质
CN113125960A (zh) * 2019-12-31 2021-07-16 河北工业大学 一种基于随机森林模型的车载锂离子电池荷电状态预测方法
CN111275247A (zh) * 2020-01-14 2020-06-12 西安理工大学 一种基于多种影响因素的极限学习机月度电量预测方法
CN111275247B (zh) * 2020-01-14 2024-02-23 西安理工大学 一种基于多种影响因素的极限学习机月度电量预测方法

Similar Documents

Publication Publication Date Title
CN105427194A (zh) 一种基于随机森林回归的售电量预测方法及装置
CN102183621B (zh) 水产养殖溶解氧浓度在线预测方法及系统
CN109726865A (zh) 基于emd-qrf的用户负荷概率密度预测方法、装置和存储介质
CN105844371A (zh) 一种用电客户短期负荷需求预测方法及装置
CN103853106A (zh) 一种建筑能源供应设备的能耗预测参数优化方法
CN105678398A (zh) 基于大数据技术的电力负荷预测方法及基于该方法的研究应用系统
CN108171379B (zh) 一种用电负荷预测方法
CN110334732A (zh) 一种基于机器学习的空气质量预报方法和装置
CN111967696B (zh) 基于神经网络的电动汽车充电需求预测方法、系统及装置
CN104318332A (zh) 一种电力负荷预测方法和装置
CN106600037B (zh) 一种基于主成分分析的多参量辅助负荷预测方法
CN103310286A (zh) 一种具有时间序列特性的产品订单预测方法及装置
CN103942461A (zh) 基于在线贯序极限学习机的水质参数预测方法
CN107194495A (zh) 一种基于历史数据挖掘的光伏功率纵向预测方法
CN104865827B (zh) 一种基于多工况模型的抽油机采油优化方法
CN107748940B (zh) 一种节电潜力量化预测方法
CN112182720A (zh) 一种基于建筑能源管理应用场景的建筑能耗模型评价方法
CN105139080A (zh) 一种基于马尔可夫链的改进光伏功率序列预测方法
CN114819374B (zh) 区域新能源超短期功率预测方法及系统
CN110930282B (zh) 一种基于机器学习的局地降雨雨型分析方法
Gensler et al. An analog ensemble-based similarity search technique for solar power forecasting
CN111179108A (zh) 用电能耗的预测方法和装置
CN108154259B (zh) 热泵的负荷预测方法及装置、存储介质、处理器
CN105260944A (zh) 一种基于lssvm算法与关联规则挖掘的统计线损计算方法
CN110826196B (zh) 一种工业设备运行数据的处理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 710065 Shaanxi hi tech Zone, Xi'an science and technology zone, No. 68 Xi'an Software Park, Han Yun Ge C501

Applicant after: Merrill Lynch data technology Limited by Share Ltd

Address before: 710065 Shaanxi hi tech Zone, Xi'an science and technology zone, No. 68 Xi'an Software Park, Han Yun Ge C501

Applicant before: XI'AN MERIT DATA TECHNOLOGY CO., LTD.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160323