发明内容
为了能够处理多种类型的时间序列,本发明的目的是提供一种基于快速响应的工业用户负荷可行域预测方法及系统,以满足在用户负荷可行域预测领域的技术需求。
为了实现上述技术目的,本申请提供了一种基于快速响应的工业用户负荷可行域预测方法,包括以下步骤:
基于Prophet算法,通过采集工业用户的历史日负荷数据,进行训练,构建用于预测工业用户的负荷的预测模型;
基于工业用户的试点用户群的随机可变参考项的均值与方差,获取随机可变参考项的基准值与模糊值,作为试点用户群的行业共性特征;
基于试点用户群的日常用电曲线,获取用电特征指标值,作为试点用户群的个性特征;
基于预测模型,通过行业共性特征和个性特征,获取试点用户群的负荷的可行域进行预测。
优选地,在获取历史日负荷数据的过程中,将历史日负荷数据进行预处理后,作为训练的数据集,从而生成预测模型,其中,数据包括历史多日的用电负荷数据、是否节假日、是否停工停产;将历史多日的用电负荷数据、是否节假日、是否停工停产进行数据预处理,对历史数据中的异常值的平稳化以及缺失数据的补遗,针对异常数据,在进行分析数据时,将前后两个时间的负荷数据作为基准,设定待处理数据的最大变动范围,当待处理数据超过这个范围,就视为不良数据,采用平均值的方法平稳其变化。
优选地,在构建预测模型的过程中,基于Prophet算法,通过数据集构建预测模型,其中,预测模型用于将数据集中的用户的非周期变化趋势项类型,输入负荷数据进行拟合,得到预测用户的非周期变化趋势项;通过采用傅里叶级数拟合时间序列中包含天、周、月的多种周期类型的季节性变化趋势,以近似表达相关的周期变化属性,得到负荷的周期变化趋势项,给每个特殊日期制定一个时间变化窗口进行定义,并进行拟合得到负荷的特殊日期影响项;拟合三类数据得到用户的最终预测值。
优选地,在构建预测模型的过程中,预测模型表示为:
其中,表示增长函数,一般用来表示用户负荷拟合时间序列中的预测值的非周期性变化;/>是一个周期项用来表示一般用户负荷时序数据的周期性变化,/>是节假日项,用来表示假期、节日等特殊原因等对时序数据造成的影响,/>为误差项,表示模型未预测到的波动,服从高斯分布;k表示负荷随时间t变化的平均周期增长率,a(t)为拟定的特殊时段前负荷突变点发生变化的次数,δ是为负荷增长率变化量,m是偏移量,,与特殊时段导致的突变点选取有关,s为突变点,/>是a(t)的转置矩阵,为最大承载量;P表示时间序列的周期,2n表示模型中使用的周期的个数,/>、/>为傅里叶系数;N为Prophet自调节的傅里叶级数的阶数,表示模型中使用的周期的个数;i表示节假日,Di表示窗口期中包含的时间t,ki表示节假日对预测结果的影响,1表示Di当前取值。
优选地,在获取误差项的过程中,误差项/>包括:均方误差、均方根误差、平均绝对误差和平均绝对百分比误差,其中,
式中,实际值为,预测值为/>。
优选地,在获取试点用户群的随机可变参考项的均值与方差的过程中,将用户参与需求响应的用户参与度与电价刺激水平的关系表示为一个三段式的分段线性函数,其中,第一段表示电价刺激水平的响应下限区,第二段表示电价刺激水平的响应可行域,第三段表示电价刺激水平的响应上限区;
分段线性函数表示为:
式中,μ、σ、以及/>四个参数定义为描述用户响应潜力的指标,分别为均值、方差、均值模糊值以及方差模糊值,/>为电价刺激水平,/>表示给定电价刺激水平,为已知的确定参数,,μ0、σ0为随机可变参考项实际数据的均值与标准差、δi表示给定的激励强度、Δμ表示μ的误差量、Δσ表示σ的误差量。
优选地,在获取随机可变参考项的基准值与模糊值的过程中,基于均值与方差的取值,获取基准值和模糊值,其中,基准值和模糊值表示为:
式中,、/>为均值与方差的基准值,/>、/>为均值与方差的模糊值,/>和分别为/>、/>的误差量。
优选地,在获取个性特征的过程中,通过构建用电特征指标集,通过PCA进行指标降维,获取试点用户群的个性化确定参数,作为个性特征,其中,个性化确定参数的表达式为:
式中,表示提取出的用电曲线主成分,/>表示第k个主成分的贡献率,r为表示样本个数,/>为第k个主成分对应第l个指标的系数,/>为主成分的系数,xl表示第l个指标的取值。
本发明还公开了一种基于快速响应的工业用户负荷可行域预测系统,包括:
数据采集模块,用于工业用户的试点用户群的日负荷数据;
数据处理模块,用于获取日负荷数据的随机可变参考项;
第一数据分析模块,用于根据随机可变参考项的均值与方差,获取随机可变参考项的基准值与模糊值,作为试点用户群的行业共性特征;
第二数据分析模块,用于通过日负荷数据,获取试点用户群的日常用电曲线,生成用电特征指标值,作为试点用户群的个性特征;
负荷可行域预测模块,用于基于预测模型,通过行业共性特征和个性特征,获取试点用户群的负荷的可行域进行预测,其中,基于Prophet算法,通过采集工业用户的历史日负荷数据,进行训练,构建用于预测工业用户的负荷的预测模型。
本发明公开了以下技术效果:
本发明实现了对于工业用户负荷可行域的快速预测,快速响应了电力系统的变化,有效提高了电力系统的安全性和可靠性。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
如图1-2所示,本发明提供了一种基于快速响应的可行域预测研究方法,其特征在于,所述方法具体包括以下步骤:
(1)采集一般用户的历史日负荷数据并进行数据预处理,数据包括历史多日的用电负荷曲线、是否节假日、是否停工停产等。将历史多日的用电负荷数据、是否节假日、是否停工停产进行数据预处理,对历史数据中的异常值的平稳化以及缺失数据的补遗,针对异常数据,采用水平处理方法。数据的水平处理即在进行分析数据时,将前后两个时间的负荷数据作为基准,设定待处理数据的最大变动范围,当待处理数据超过这个范围,就视为不良数据,采用平均值的方法平稳其变化。
(2)对一般用户的负荷建立基于Prophet算法的预测模型,首先确定用户的非周期变化趋势项类型,输入负荷数据进行拟合,得到预测用户的非周期变化趋势项,然后通过采用傅里叶级数拟合时间序列中有可能包含天、周、月等多种周期类型的季节性变化趋势,以近似表达相关的周期变化属性,得到负荷的周期变化趋势项,再次给每个特殊日期制定一个时间变化窗口进行定义,并进行拟合得到负荷的特殊日期影响项,最后拟合三类数据得到一般用户的最终预测值。
(3)基于采集试点用户响应数据,计算试点用户群的随机可变参考项的均值与方差;
(4)计算该大工业用户随机可变参考项的基准值与模糊值,作为该行业的共性特征;
(5)基于试点用户群的日常用电曲线,计算用电特征指标值,得到该用户的确定参数值,作为该用户响应特性的个性特征。
(6)拟合基于Prophet算法得到的基线负荷和用户需求响应潜力得到快速响应的预测可行域
具体的过程如下:(1)从一般用户采集历史负荷数据以及历史多日的用电负荷曲线、是否节假日、是否停工停产等。对所采集数据进行预处理。首先对数据进行清洗,剔除错误值、重复值,补全缺失值,对历史数据中的异常值的平稳化以及缺失数据的补遗,针对异常数据,采用水平处理方法。数据的水平处理即在进行分析数据时,将前后两个时间的负荷数据作为基准,设定待处理数据的最大变动范围,当待处理数据超过这个范围,就视为不良数据,采用平均值的方法平稳其变化。
(2)构建Prophet基线负荷预测模型。Prophet算法的核心思想是对数据特征进行分解组合处理,将相关的时间序列数据分解为多项的组合,具体包括增长趋势、季节趋势、节假日项和剩余项,通过将这些特征项分别进行拟合,来预测数据的时间序列变化趋势,同时充分考虑对时间序列趋势变化点的检测,季节性、节假日以及突发事件等因素,因此其预测结果具有更好的拟合性。其中,节假日项可有效地分析时间序列中潜在的具有非固定周期的节假日对预测值造成的影响,而在一般用户的负荷预测中,停工停产、季节特征、节假日及恶劣天气等正是影响负荷最重要的因素,因此,本专利采用Prophet算法可以有效地针对大工业用户的日负荷数据进行模型分析,将影响负荷的停工停产、节假日、突发天气等特殊因素纳入节假日项进行综合考虑,并预测未来用户负荷的发展趋势。模型具体公式如下:
其中,表示增长函数,一般用来表示用户负荷拟合时间序列中的预测值的非周期性变化;/>是一个周期项用来表示一般用户负荷时序数据的周期性变化,/>是节假日项,用来表示假期、节日等特殊原因等对时序数据造成的影响,/>为误差项,表示模型未预测到的波动,服从高斯分布。
确定增长函数类型,一般用户负荷的非周期变化趋势项是算法模型的核心,主要用于用户负荷在相关时间序列上的增长特征及趋势,具体应用主要有两种模型形式:饱和式增长模型(非线性增长)及分段线性模型(线性增长)。其中,饱和式增长模型适应于当下负荷发展趋势达到一定的程度就会呈现饱和状态的行业,不会维持持续增长的状况,同时负荷的饱和值随着时间的变化而动态变化;分段线性模型为不可限定趋势,可以用来对数据的发展趋势进行描述。
线性增长通过使用分段线性函数来实现,其公式如下:
非线性增长使用逻辑函数来实现,其公式如下:
其中,k表示负荷随时间t变化的平均周期增长率,a(t)为拟定的特殊时段前负荷突变点发生变化的次数,δ是为负荷增长率变化量,m是偏移量,,与特殊时段导致的突变点选取有关,s为突变点,/>是a(t)的转置矩阵,/>为最大承载量,它定义了增长的最大值。
确定负荷变化周期项。由于时间序列中有可能包含天、周、月等多种周期类型的季节性变化趋势,因此可通过采用傅里叶级数进行拟合,以近似表达相关的周期变化属性,具体公式如下:
其中,P表示时间序列的周期,2n表示模型中使用的周期的个数。、/>为傅里叶系数;N为Prophet自调节的傅里叶级数的阶数,表示模型中使用的周期的个数,较大的N值可以拟合出更复杂的季节性函数。
确定特殊日期影响项。特殊日期如国庆节、春节等节假日期间,大部分人都放假,企业的生产和销售活动也会受到影响。这可能会导致在这些特殊日期之前或之后出现较大波动。节假日项/>能够将不同节假日在不同时点下看作独立的模型。通常节假日是一个时间跨度,并非只有一天,因此可以为每个节假日模型设立一个时间窗口。节假日模型可表示为:
其中,i表示节假日,Di表示窗口期中包含的时间t,ki表示节假日对预测结果的影响,1表示Di当前取值。
评估拟合出的大工业用户的基线负荷预测值。预测结果评价指标是经常采用一系列的指标来评价预测结果的精度。常用的预测结果评价指标主要有均方误差(MeanSquared Error,MSE),均方根误差(Root Mean Squard Error,RMSE),平均绝对误差(MeanAbsolute Error,MAE),平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)。设实际值为,预测值为/>,计算公式如下所示:
其中t表示预测数值个数,u表示第u个样本,MSE可以评价数据的变化程度,当预测值与真实值完全吻合时等于0,即完美模型;误差越大,该值越大。
RMSE可以用来衡量观测值与真实值之间的偏差,它的意义在于开个根号后,误差的结果就与数据是一个级别的,可以更好地来描述数据,比如RMSE=10,可以认为回归效果相比真实值平均相差10,预测值与真实值完全吻合时等于0,即完美模型;误差越大,该值越大。
MAE可以更好地反映预测值误差的实际情况,当预测值与真实值完全吻合时等于0,即完美模型;误差越大,该值越大。
MAPE为0%表示完美模型,MAPE大于100%则表示劣质模型,MAPE的值越小,说明预测模型拥有更好的精确度。
(3)采集大工业的试点用户群的历史参与响应数据,计算响应最低点和响应极限点,计算试点用户群的随机可变参考项的均值与方差。
大工业行业内的一般用户参与快速响应的用户参与程度和电价水平的关系可以描述为一个三段式的分段线性函数。在不同行业中,用户对电力成本的管理能力存在差异,因此他们的用电行为在面对电价波动和激励时的敏感程度也各不相同。由此可见,电力用户参与需求响应是有一定规律可循的。通常,我们将用户参与需求响应的用户参与度与电价刺激水平的关系表示为一个三段式的分段线性函数,如图1所示。
图1中,Ⅰ为电价刺激水平的响应下限区,Ⅱ为电价刺激水平的响应可行域,Ⅲ为电价刺激水平的响应上限区,红色曲线为大工业用户参与度的波动上限和下限。随着电价刺激水平的的不断增大,大工业用户参与度会经历由响应下限区到响应可行域再到响应上限区的变化。当电价刺激水平位于响应下限区与响应上限区时,大工业用户的参与度随机性较小,参与度一般呈现为一条常函数的形式;当电价刺激水平处于相应可行域时,大工业用户参与度的随机性呈现出先增大后减小的二次函数规律形式,可表达为如下的分段函数形式:
一般认为大工业用户只有在响应可行域具有明显的参与随机性,所以将响应下限区与响应上限区的相关参数建模为确定参数,包括响应下限区的横坐标a0、a1,响应下限区纵坐标p1,响应上限区的横坐标a2和纵坐标p2。而对于线性可行域,本发明将线性区响应曲线建模的二次函数形式:
其中,w、A与B为表征用户参与度函数的的三个特征参数,p为用户参与度,为电价刺激水平。若已知响应下限区的横坐标a0、a1,响应下限区纵坐标p1,响应上限区的横坐标a2和纵坐标p2,代入式中可得到关联特征参数的响应可行域函数关系式:
将w通过数学建模的方式定义为随机可变参考项,则根据w可刻画响应可行域的用户参与需求响应的响应随机特性。因此,用户参与度与电价刺激水平的需求响应关系模型最终由具体可得的参数与随机可变参考项w共同构建。用户的确定参数因为用户的特点和需求不同而不同,而随机可变参考项因为它们通常在同一行业或领域中出现而相似,因此通过确定参数去刻画不同大工业用户参与需求响应市场差异性,而对于同一用户,其参与需求响应积极程度的差异性主要分布在响应可行域,由随机可变参考项w刻画。
试点用户一般是与电网合作关系紧密并安装了高密度采集装置(如智能电表)的用户,可以通过用户调研和采集装置的量测数据分析来确定其具体的参数。认为大工业用户参与需求响应市场特性中的确定参数,可以直接通过用户调研、智能电表数据监测得到。具体来说/>为响应下限区最大值,通常可以根据终端销售收入中电能成本所占的比例来进行评估,一般情况下,这个电能成本所占的比例与/>呈现一种反比例函数形式;为响应上限区最大值横坐标,/>为响应上限区的纵坐标(对应最大负荷的转移效率),可以通过了解不同行业的生产特点和设备的用电特点来确定。此外,根据企业的安保、办公负荷以及调班、库存等方面的需求大小,也会对此产生影响,/>和/>越高说明大工业用户的响应可行域越大,也就是生产调节能力越强。对于随机可变参考项w服从/>的正态分布,采用模糊函数的形式对响应可行域的随机可变参考项w进行建模。
对于随机可变参考项w,其模糊矩阵形式如下:
其中,μ、σ分别为w的均值与方差;R为均值与方差参数的不确定集合,μ0、σ0为随机可变参考项实际数据的均值与标准差,μe、σe为模糊值对于大工业用户的每个历史参与需求响应的响应数据,代入对于线性可行域的二次函数形式,可得到对应的w值,则基于大工业用户的历史响应数据集可得到其随机可变参考项的历史值。响应可行域内的随机可变参考项满足正态分布,其模糊集可表示为:
式中,为已知的确定参数,w满足均值为/>、标准差为/>的正态分布,μ0与σ0根据w的历史值得到。对于给定电价刺激水平/>,用户参与度满足:
其中,δi表示给定的激励强度、Δμ表示μ的误差量、Δσ表示σ的误差量,将μ、σ、以及/>四个参数定义为描述用户响应潜力的指标,分别为均值、方差、均值模糊值以及方差模糊值,该四个指标共同反映了用户响应潜力的不确定性。
(4)计算大工业用户行业内的随机可变参考项的基准值与模糊值,作为该行业的共性特征。对于大工业内的一般用户,由于缺乏历史响应数据,无法直接得到其随机可变参考项的分布特征。考虑基于试点用户的历史响应分布去表征行业一般用户的随机可变参考项分布,作为该行业响应共性化特征。针对大工业下的一般用户,其随机可变参考项可直接通过查询该行业试点用户的随机可变参考项特性得到。
对于大工业内的一般用户,确定其随机可变参考项关键在于均值与方差的取值:
式中,、/>为大工业内一般用户满足的均值与方差基准值,/>、/>为均值与方差模糊值,/>和/>分别为/>、/>的误差量。
计算不同试点用户随机可变参考项的均值,求其平均值与标准差,并以此定义对应大工业一般用户随机可变参考项的均值的基准值与模糊值,即:
为该行业第i个试点用户随机可变参考项的均值。对于方差采取同样的处理方式,即:
/>
为该行业第i个试点用户随机参数的方差。
(5)基于试点用户日常用电曲线,计算用电特征指标值,得到该用户的确定参数值。基于数据驱动的思想间接获取一般用户响应特性确定参数。其基本思想是构建试点用户用电数据与确定参数之间的关系,并认为同类型的一般用户也满足这样的关系,最后结合一般用户的日常用电数据,得到其个性化确定参数。
① 用电特征指标集构建:
大工业电力用户的需求响应特性与其日常用电曲线具有密不可分的联系,因此构建用电特征指标集,旨在挖掘用户响应特性参数与其日常用电之间的内在联系。构建季度用电特征指标集,如表1所示。
表1
②基于PCA的指标降维:
考虑到所构建的指标集中的指标较多,并且存在重复的信息,即指标间的相关性较大。为了实现用电信息的有效提取,基于PCA对用电特征指标集进行降维。提取出相互独立的几个主成分,保证总贡献率达到90%以上,其与用电特征指标集的关系为:
其中,表示提取出的用电曲线主成分,/>表示第k个主成分的贡献率,r为表示样本个数,/>为第k个主成分对应第l个指标的系数,xl表示第l个指标的取值。分别计算各主成分的值,此时可认为提取出的主成分相互独立,并且包含了原指标集的绝大部分信息。
根据样本用户群参与的关键参数与用电特征主成分之间的最小二乘拟合,得到如下关系:
其中,为主成分的系数。式中的关系作为该类型用户的共性特征,可直接用于一般用户响应特性确定参数的求取。
(6)拟合基于Prophet算法得到的基线负荷和用户参与需求响应程度p得到快速响应的预测可行域。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
在本发明的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。