发明内容
有鉴于此,本发明所要解决的技术问题是提供一种针对冲击负荷的样本选取并对大波动电网负荷短期预测的方法。全面地考虑相似时刻的各种影响因素,准确地对历史数据进行筛选的方法。
本发明的目的是这样实现的:
本发明提供的大波动电网负荷短期预测方法,包括以下步骤:
S1:通过形数法筛选历史数据样本;
S2:运用谱系聚类法对历史数据样本进行分类;
S3:确定历史数据样本各时刻负荷值所处的状态;
S4:计算历史数据样本的状态概率
确定预测期负荷区间;
S5:判断随机过程是否具有马尔科夫性质,若是,继续步骤S6,若否,重新选取加权形状系数阀值,再进行S1至S4的步骤,直至该随机过程具有马尔科夫性质;
S6:
所对应的i为预测期负荷所处的状态,状态i的区间中值为随机项在预测点的预测值。
进一步,所述步骤S1的历史数据样本根据以下步骤来进行筛选:
S11:每日同时段的影响因素构成同时段向量
取待测时段的影响因素组成待测向量
S12:根据以下公式来计算同时段向量和待测向量的形系数:
xiTk=Pik-PTk,
0<α<1,
其中,
表示形系数,x
iTk表示两向量第k个指标之差,P
ik表示由历史数据组成的向量,P
Tk表示下一时刻的向量,e
iT表示两向量所有指标之差的值的平均值,m表示向量的指标的个数,α表示一个参数,w
k表示两向量每个指标之差值的权重;
S13:根据形系数来选取与被测时刻气象条件相似的历史数据;
判断形系数是否小于阀值φ,如果是,则确定为相似的历史数据,如果否,则不选择该历史数据。
进一步,所述步骤S12中的权值wk根据以下步骤来进行计算:
其中,ukl表示P矩阵的第k行第l列数据,wk表示两向量每个指标之差值的权重。进一步,所述步骤S1前还包括先通过主成分分析法来确认影响冲击负荷的观测时段m,所述m通过主成分分析法按以下步骤来进行计算:
S71:获取t时刻发电机机组工作状态信号;
S72:将工作状态信号组成矩阵数据;
其中,X表示对p个变量进行n次观测的数据;
S73:通过以下公式计算矩阵数据中两变量间的协方差,并构成协方差矩阵:
其中,
表示列向量X1的方差E[(X1-u1)(X1-u1)],
表示列向量X2的方差E[(X2-u2)(X2-u2)],cov(2,p)表示列向量X2和列向量Xp的协方差E[(X2-u2)(Xp-up)];
S74:按以下公式对协方差矩阵进行特征分解:
Z=UΛUt;
其中,Λ为Z的特征值组成的对角阵,U为Z的特征向量按列组成的正交阵;
S75:根据以下公式计算积累贡献率:
其中,μm表示第m个指标的积累贡献率,λp表示Z的p列特征向量所对应的特征值,λm表示Z的m列特征向量所对应的特征值;
S76:判断η
m时是否大于
如果是,则主成分数目为m。
本发明的优点在于:本发明根据冲击负荷和小水电负荷的特性,运用改进形状系数对历史数据向量进行筛选,全面地考虑相似时刻的各种影响因素,准确地对历史数据进行筛选的方法,降低了计算过程中需要的历史数据量,找出共线性的指标向量,并用矩阵实验室仿真计算出预测结果。解决了传统算法在数据预处理方面的缺陷,提高了预测精确度。基于数据挖掘融合改进马尔科夫链的负荷模型预测更加准确地预测出冲击负荷与小水电发电负荷,为大波动负荷的预测提供了设计依据。
本发明的其它优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其它优点可以通过下面的说明书,权利要求书,以及附图中所特别指出的结构来实现和获得。
具体实施方式
以下将结合附图,对本发明的优选实施例进行详细的描述;应当理解,优选实施例仅为了说明本发明,而不是为了限制本发明的保护范围。
本发明提供的大波动电网负荷短期预测方法,包括以下步骤:
S1:通过形数法筛选历史数据样本,具体通过以下步骤来进行筛选:
S11:每日同时段的影响因素构成同时段向量
取待测时段的影响因素组成待测向量
S12:根据以下公式来计算同时段向量和待测向量的形系数:
xiTk=Pik-PTk,
0<α<1,
所述步骤S12中的权值wk根据以下步骤来进行计算:
其中,表示形系数,xiTk表示两向量第k个指标之差,Pik表示由历史数据组成的向量(例如针对某流域的小水电负荷而言,向量的指标包括温度,降雨量,上游排水量,以及前n个时刻的上游排水量等等),PTk表示下一时刻的向量(例如针对某流域的小水电负荷而言,向量的指标包括由天气预报得到的温度,降雨量,和由别厂上报的上游排水量,以及前n个时刻的上游排水量等等),eiT表示两向量所有指标之差的值的平均值,m表示向量的指标的个数,α仅仅表示一个参数,wk表示两向量每个指标之差值的权重;
其中,z
k表示
这个公式得到的值,u
kl表示P矩阵的第k行第l列数据,w
k表示两向量每个指标之差值的权重。
S13:根据形系数来选取与被测时刻气象条件相似的历史数据;
判断形系数
是否小于阀值φ,如果是,则确定为相似的历史数据,如果否,则不选择该历史数据。阀值φ一般根据实际情况而定,本实施例取小于1。
S2:运用谱系聚类法对历史数据样本进行分类;
运用谱系聚类法对历史数据样本进行分类,具体步骤如下:
(1)n品n类,类间距离矩阵
(此时Dpq=dpq),
(2)在D(0)的左下角中,(i)选最小的dpq,(ii)则将Gp={xp},Gq={xq}合并为Gr,(iii)划去p行,q列,(iv)计算Gr与余下的n-2类之间距离,(v)与原类间距构成一个新的类间距离矩阵D(1);
(3)从D(1)出发,重复上述过程,直至为一大类;
(4)记录合并样品号,合并时距离(距离水平),确定序列;
找出影响冲击负荷与小水电负荷的物理因素,例如钢厂炼钢、轧钢的“节奏”,钢材的类型,小水电站所处地区上游来水量,温度和风力等,
同时,由于钢厂的冲击负荷也与炼钢和轧钢机组运行状态密切相关,所以假设在t时刻,某机组停运或者不处于工作状态,用0表示;相反,用1表示。
然后用各个影响因素组成的向量进行比对,找出与被测时刻相似的历史时刻。取每日同时段的影响因素构成
取待测时段的影响因素组成向量
根据分级标准将其分为几大类;
S3:确定历史数据样本各时刻负荷值所处的状态;
S4:计算历史数据样本的状态概率
确定预测期负荷区间;
S5:判断随机过程是否具有马尔科夫性质,若是,继续步骤S6,若否,重新选取加权形状系数阀值,再进行S1至S4的步骤,直至该随机过程具有马尔科夫性质;
用马尔可夫链模型进行短期预测的前提条件是随机过程必须具有马尔科夫性质:
①假设一共有m个可能状态,用fij表示指标值序列中从状态i经过一步转移到达状态j的频数,将边际概率表示为:
②卡方统计量为:
③给定置信度α,查表可得式x
2(m-1),如果
则该序列具备马氏性。
以三个样本为例来说明:这三个样本分别被归为1类,2类,1类,那么状态概率
对应的矩阵就是
最大值得出现在
的位置,那么1类样本数据的区间就是预测负荷所处区间。
多个样本时,选择最大状态概率
所对应的状态i为预测期负荷所处的状态,状态i的区间中值为预测点的预测值;
其中,
表示从状态i到状态k的转移矩阵,
表示从状态j到状态n的转移矩阵,
S6:
所对应的i为预测期负荷所处的状态,状态i的区间中值为随机项在预测点的预测值。
本发明提供的大波动电网负荷短期预测方法,还可以在所述步骤S1前增加一个步骤,即先通过主成分分析法来确认影响冲击负荷的观测时段m,所述m通过主成分分析法按以下步骤来进行计算:
S71:获取t时刻发电机机组工作状态信号;
S72:将工作状态信号组成矩阵数据;
其中,X表示对p个变量进行n次观测的数据;
S73:通过以下公式计算矩阵数据中两变量间的协方差,并构成协方差矩阵:
其中,协方差矩阵是一个
矩阵,其每个元素是各个向量元素之间的协方差。例如,在矩阵X中X1是以p个标量随机变量组成的列向量,并且μ1是其第1个元素的期望值,即,μ1=E(X11),其中,
表示E[(X1-u1)(X1-u1)],即列向量X1的方差,
表示E[(X2-u2)(X2-u2)],即列向量X2的方差,cov(2,p)表示E[(X2-u2)(Xp-up)],即列向量X2和列向量Xp的协方差,Z可以通过MATLAB语言求得。
S74:按以下公式对协方差矩阵进行特征分解:
Z=UΛUt;
其中,Λ为Z的特征值组成的对角阵,U为Z的特征向量按列组成的正交阵;
S75:根据以下公式计算积累贡献率:
其中,ηm表示第m个指标的积累贡献率,λp表示Z的p列特征向量所对应的特征值,λm表示Z的m列特征向量所对应的特征值;
S76:判断ηm时是否大于如果是,则主成分数目为m。
P矩阵特征向量为样本重要性排序:
其中,ukl为样本uk相对于样本ul的权重值,所述权重值ukl分别为:当样本uk相对于样本ul有同等重要性时取值为1,当样本uk相对于样本ul较为重要性时取值为3,当样本uk相对于样本ul强烈重要性时取值为7,当样本uk相对于样本ul极端重要性时取值为9。
对于大波动负荷而言,必须重视历史数据的筛选,否则无法得到准确的结果。
以上所述仅为本发明的优选实施例,并不用于限制本发明,显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。