CN102722642A

CN102722642A - 大波动电网负荷短期预测方法

Info

Publication number: CN102722642A
Application number: CN2012101667028A
Authority: CN
Inventors: 殷家敏; 欧勇; 罗建; 何茜; 任成君
Original assignee: CHANGSHOU POWER SUPPLY BUREAU OF CHONGQING ELECTRIC POWER CORP
Current assignee: CHANGSHOU POWER SUPPLY BUREAU OF CHONGQING ELECTRIC POWER Corp; State Grid Corp of China SGCC
Priority date: 2012-05-25
Filing date: 2012-05-25
Publication date: 2012-10-10
Anticipated expiration: 2032-05-25
Also published as: CN102722642B

Abstract

本发明公开了一种大波动电网负荷短期预测方法，包括以下步骤：首先通过形数法筛选历史数据样本，运用谱系聚类法确定序列的分级标准，确定各时刻负荷值所处的状态；然后计算待测期负荷的状态概率，选择最大状态概率所对应的状态为预测期负荷所处的状态，状态i的区间中值为预测点的预测值；本发明根据冲击负荷和小水电负荷的特性，运用改进形状系数对历史数据向量进行筛选，全面地考虑相似时刻的各种影响因素，准确地对历史数据进行筛选的方法，降低了计算过程中需要的历史数据量，找出共线性的指标向量，并用矩阵实验室仿真计算出预测结果。解决了传统算法在数据预处理方面的缺陷，提高了预测精确度，为大波动负荷的预测提供了设计依据。

Description

大波动电网负荷短期预测方法

技术领域

本发明涉及一种电网负荷预测方法，特别涉及一种大波动电网负荷短期预测方法。

背景技术

由于大波动性负荷的无规律性，负荷短期预测中最困难就是对波动性负荷的预测，国内外尚未有一个有效的短期负荷预测法来解决这一问题。大波动负荷是指相对于系统负荷而言，突然间变化很大的负荷。当负荷变化幅度相对于系统容量较大时，便有可能引起系统频率的连续振荡以及电压摆动，对电力系统影响很大。因此，对大波动负荷的事先有效估计，是对电力系统进行合理经济调度、降低生产成本、防止电网大面积停电或者电网崩溃的有力保障。例如，针对重庆市长寿区，引起负荷波动和影响负荷预测精度的原因为：炼钢、轧钢、电铁牵引负荷等冲击负荷(重钢和永航等大型炼钢企业处于该地区)；许多大型企业拥有自备电厂；径流式小水电群丰富。对小水电负荷的短期预测法通常运用的是多元线性回归模，对冲击负荷的预测运用的是基于修正的时间序列模型。但是现有技术中并未给出用以预测此类波动大的负荷的样本选取方法。

因为历史数据的筛选是选用模型准确地对大波动负荷进行预测的保障，是一项必不可少的环节，因此急需一种针对冲击负荷的样本选取并对大波动电网负荷短期预测的方法。

发明内容

有鉴于此，本发明所要解决的技术问题是提供一种针对冲击负荷的样本选取并对大波动电网负荷短期预测的方法。全面地考虑相似时刻的各种影响因素，准确地对历史数据进行筛选的方法。

本发明的目的是这样实现的：

本发明提供的大波动电网负荷短期预测方法，包括以下步骤：

S1：通过形数法筛选历史数据样本；

S2：运用谱系聚类法对历史数据样本进行分类；

S3：确定历史数据样本各时刻负荷值所处的状态；

S4：计算历史数据样本的状态概率

确定预测期负荷区间；

S5：判断随机过程是否具有马尔科夫性质，若是，继续步骤S6，若否，重新选取加权形状系数阀值，再进行S1至S4的步骤，直至该随机过程具有马尔科夫性质；

S6：

所对应的i为预测期负荷所处的状态，状态i的区间中值为随机项在预测点的预测值。

进一步，所述步骤S1的历史数据样本根据以下步骤来进行筛选：

S11：每日同时段的影响因素构成同时段向量

取待测时段的影响因素组成待测向量

P_{T}^{p} :

P_{i}^{p} = {p_{i 1}, P_{i 2}, . . . P_{im}},

P_{T}^{p} = {P_{T 1}, P_{T 2}, . . ., P_{Tm}};

S12：根据以下公式来计算同时段向量和待测向量的形系数：

{\tilde{S}}_{iT}^{p} = α Σ_{k = 1}^{m} w_{k} | x_{iTk} - e_{iT} |,

x_iTk＝P_ik-P_Tk，

e_{iT} = \frac{1}{m} Σ_{k = 1}^{m} x_{iTk},

0＜α＜1，

其中，

表示形系数，x_iTk表示两向量第k个指标之差，P_ik表示由历史数据组成的向量，P_Tk表示下一时刻的向量，e_iT表示两向量所有指标之差的值的平均值，m表示向量的指标的个数，α表示一个参数，w_k表示两向量每个指标之差值的权重；

S13：根据形系数来选取与被测时刻气象条件相似的历史数据；

判断形系数是否小于阀值φ，如果是，则确定为相似的历史数据，如果否，则不选择该历史数据。

进一步，所述步骤S12中的权值w_k根据以下步骤来进行计算：

z_{k} = \sqrt[m]{Π_{l = 1}^{m} u_{kl}},

w_{k} = \frac{z_{k}}{Σ_{k = 1}^{m} z_{k}},

其中，u_kl表示P矩阵的第k行第l列数据，w_k表示两向量每个指标之差值的权重。进一步，所述步骤S1前还包括先通过主成分分析法来确认影响冲击负荷的观测时段m，所述m通过主成分分析法按以下步骤来进行计算：

S71：获取t时刻发电机机组工作状态信号；

S72：将工作状态信号组成矩阵数据；

其中，X表示对p个变量进行n次观测的数据；

S73：通过以下公式计算矩阵数据中两变量间的协方差，并构成协方差矩阵：

其中，

表示列向量X1的方差E[(X1-u1)(X1-u1)]，

表示列向量X2的方差E[(X2-u2)(X2-u2)]，cov(2,p)表示列向量X2和列向量Xp的协方差E[(X2-u2)(Xp-up)]；

S74：按以下公式对协方差矩阵进行特征分解：

Z＝UΛU^t；

其中，Λ为Z的特征值组成的对角阵，U为Z的特征向量按列组成的正交阵；

S75：根据以下公式计算积累贡献率：

η_{m} = \frac{λ_{1} + λ_{2} + . . . + λ_{m}}{λ_{1} + λ_{2} + . . . + λ_{p}},

其中，μ_m表示第m个指标的积累贡献率，λ_p表示Z的p列特征向量所对应的特征值，λ_m表示Z的m列特征向量所对应的特征值；

S76：判断η_m时是否大于

如果是，则主成分数目为m。

本发明的优点在于：本发明根据冲击负荷和小水电负荷的特性，运用改进形状系数对历史数据向量进行筛选，全面地考虑相似时刻的各种影响因素，准确地对历史数据进行筛选的方法，降低了计算过程中需要的历史数据量，找出共线性的指标向量，并用矩阵实验室仿真计算出预测结果。解决了传统算法在数据预处理方面的缺陷，提高了预测精确度。基于数据挖掘融合改进马尔科夫链的负荷模型预测更加准确地预测出冲击负荷与小水电发电负荷，为大波动负荷的预测提供了设计依据。

本发明的其它优点、目标和特征在某种程度上将在随后的说明书中进行阐述，并且在某种程度上，基于对下文的考察研究对本领域技术人员而言将是显而易见的，或者可以从本发明的实践中得到教导。本发明的目标和其它优点可以通过下面的说明书，权利要求书，以及附图中所特别指出的结构来实现和获得。

附图说明

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步的详细描述，其中：

图1为本发明实施例提供的大波动电网负荷短期预测方法流程图。

具体实施方式

以下将结合附图，对本发明的优选实施例进行详细的描述；应当理解，优选实施例仅为了说明本发明，而不是为了限制本发明的保护范围。

S1：通过形数法筛选历史数据样本，具体通过以下步骤来进行筛选：

S11：每日同时段的影响因素构成同时段向量

取待测时段的影响因素组成待测向量

P_{T}^{p} :

P_{i}^{p} = {p_{i 1}, P_{i 2}, . . . P_{im}},

P_{T}^{p} = {P_{T 1}, P_{T 2}, . . ., P_{Tm}};

S12：根据以下公式来计算同时段向量和待测向量的形系数：

{\tilde{S}}_{iT}^{p} = α Σ_{k = 1}^{m} w_{k} | x_{iTk} - e_{iT} |,

x_iTk＝P_ik-P_Tk，

e_{iT} = \frac{1}{m} Σ_{k = 1}^{m} x_{iTk},

0＜α＜1，

所述步骤S12中的权值w_k根据以下步骤来进行计算：

z_{k} = \sqrt[m]{Π_{l = 1}^{m} u_{kl}},

w_{k} = \frac{z_{k}}{Σ_{k = 1}^{m} z_{k}},

其中，表示形系数，x_iTk表示两向量第k个指标之差，P_ik表示由历史数据组成的向量（例如针对某流域的小水电负荷而言，向量的指标包括温度，降雨量，上游排水量，以及前n个时刻的上游排水量等等），P_Tk表示下一时刻的向量（例如针对某流域的小水电负荷而言，向量的指标包括由天气预报得到的温度，降雨量，和由别厂上报的上游排水量，以及前n个时刻的上游排水量等等），e_iT表示两向量所有指标之差的值的平均值，m表示向量的指标的个数，α仅仅表示一个参数，w_k表示两向量每个指标之差值的权重；

其中，z_k表示

这个公式得到的值，u_kl表示P矩阵的第k行第l列数据，w_k表示两向量每个指标之差值的权重。

判断形系数

是否小于阀值φ，如果是，则确定为相似的历史数据，如果否，则不选择该历史数据。阀值φ一般根据实际情况而定，本实施例取小于1。

S2：运用谱系聚类法对历史数据样本进行分类；

运用谱系聚类法对历史数据样本进行分类，具体步骤如下：

(1)n品n类,类间距离矩阵

D_{(0)} = [\begin{matrix} 0 & d_{12} & . . . & d_{1 n} \\ d_{21} & 0 & . . . & d_{2 n} \\ . & . & . & . \\ . & . & . & . \\ . & . & . & . \\ d_{n 1} & d_{n 2} & . . . & 0 \end{matrix}],

(此时D_pq＝d_pq)，

(2)在D₍₀₎的左下角中,(i)选最小的d_pq,(ii)则将G_p＝{x_p},G_q＝{x_q}合并为G_r,(iii)划去p行,q列,(iv)计算G_r与余下的n-2类之间距离,(v)与原类间距构成一个新的类间距离矩阵D₍₁₎；

(3)从D₍₁₎出发,重复上述过程,直至为一大类；

(4)记录合并样品号,合并时距离(距离水平)，确定序列；

找出影响冲击负荷与小水电负荷的物理因素，例如钢厂炼钢、轧钢的“节奏”，钢材的类型，小水电站所处地区上游来水量，温度和风力等，

同时，由于钢厂的冲击负荷也与炼钢和轧钢机组运行状态密切相关，所以假设在t时刻，某机组停运或者不处于工作状态，用0表示；相反，用1表示。

然后用各个影响因素组成的向量进行比对，找出与被测时刻相似的历史时刻。取每日同时段的影响因素构成

取待测时段的影响因素组成向量

根据分级标准将其分为几大类；

S3：确定历史数据样本各时刻负荷值所处的状态；

S4：计算历史数据样本的状态概率

确定预测期负荷区间；

用马尔可夫链模型进行短期预测的前提条件是随机过程必须具有马尔科夫性质：

①假设一共有m个可能状态，用f_ij表示指标值序列中从状态i经过一步转移到达状态j的频数，将边际概率表示为：

P_{j} = \frac{Σ_{i = 1}^{m} f_{ij}}{Σ_{i = 1}^{m} Σ_{j = 1}^{m} f_{ij}}

②卡方统计量为：

{\hat{x}}^{2} = 2 Σ_{i = 1}^{m} Σ_{j = 1}^{m} f_{ij} \log | \frac{P_{ij}}{P_{j}} |;

③给定置信度α，查表可得式x²(m-1)，如果

则该序列具备马氏性。

以三个样本为例来说明：这三个样本分别被归为1类，2类，1类，那么状态概率

对应的矩阵就是

P = [\begin{matrix} 1 & \frac{1}{2} \\ \frac{1}{2} & 0 \end{matrix}],

最大值得出现在

的位置，那么1类样本数据的区间就是预测负荷所处区间。

多个样本时，选择最大状态概率

所对应的状态i为预测期负荷所处的状态，状态i的区间中值为预测点的预测值；

其中，

表示从状态i到状态k的转移矩阵，

表示从状态j到状态n的转移矩阵，

S6：

本发明提供的大波动电网负荷短期预测方法，还可以在所述步骤S1前增加一个步骤，即先通过主成分分析法来确认影响冲击负荷的观测时段m，所述m通过主成分分析法按以下步骤来进行计算：

S71：获取t时刻发电机机组工作状态信号；

S72：将工作状态信号组成矩阵数据；

其中，X表示对p个变量进行n次观测的数据；

其中，协方差矩阵是一个矩阵，其每个元素是各个向量元素之间的协方差。例如，在矩阵X中X1是以p个标量随机变量组成的列向量，并且μ1是其第1个元素的期望值,即,μ1=E(X11)，其中，

表示E[(X1-u1)(X1-u1)]，即列向量X1的方差，

表示E[(X2-u2)(X2-u2)]，即列向量X2的方差，cov(2,p)表示E[(X2-u2)(Xp-up)]，即列向量X2和列向量Xp的协方差，Z可以通过MATLAB语言求得。

S74：按以下公式对协方差矩阵进行特征分解：

Z＝UΛU^t；

S75：根据以下公式计算积累贡献率：

η_{m} = \frac{λ_{1} + λ_{2} + . . . + λ_{m}}{λ_{1} + λ_{2} + . . . + λ_{p}},

其中，η_m表示第m个指标的积累贡献率，λ_p表示Z的p列特征向量所对应的特征值，λ_m表示Z的m列特征向量所对应的特征值；

S76：判断η_m时是否大于如果是，则主成分数目为m。

P矩阵特征向量为样本重要性排序：

其中，u_kl为样本u_k相对于样本u_l的权重值，所述权重值u_kl分别为：当样本u_k相对于样本u_l有同等重要性时取值为1，当样本u_k相对于样本u_l较为重要性时取值为3，当样本u_k相对于样本u_l强烈重要性时取值为7，当样本u_k相对于样本u_l极端重要性时取值为9。

对于大波动负荷而言，必须重视历史数据的筛选，否则无法得到准确的结果。

以上所述仅为本发明的优选实施例，并不用于限制本发明，显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.大波动电网负荷短期预测方法，其特征在于：包括以下步骤：

S1：通过形数法筛选历史数据样本；

S2：运用谱系聚类法对历史数据样本进行分类；

S3：确定历史数据样本各时刻负荷值所处的状态；

S4：计算历史数据样本的状态概率

确定预测期负荷区间；

S6：

2.根据权利要求1所述的大波动电网负荷短期预测方法，其特征在于：所述步骤S1的历史数据样本根据以下步骤来进行筛选：

S11：每日同时段的影响因素构成同时段向量

取待测时段的影响因素组成待测向量

P_{T}^{p} :

P_{i}^{p} = {p_{i 1}, P_{i 2}, . . . P_{im}},

P_{T}^{p} = {P_{T 1}, P_{T 2}, . . ., P_{Tm}};

S12：根据以下公式来计算同时段向量和待测向量的形系数：

{\tilde{S}}_{iT}^{p} = α Σ_{k = 1}^{m} w_{k} | x_{iTk} - e_{iT} |,

x_iTk＝P_ik-P_Tk，

e_{iT} = \frac{1}{m} Σ_{k = 1}^{m} x_{iTk},

0＜α＜1，

其中，

判断形系数

是否小于阀值φ，如果是，则确定为相似的历史数据，如果否，则不选择该历史数据。

3.根据权利要求2所述的大波动电网负荷短期预测方法，其特征在于：所述步骤S12中的权值w_k根据以下步骤来进行计算：

z_{k} = \sqrt[m]{Π_{l = 1}^{m} u_{kl}},

w_{k} = \frac{z_{k}}{Σ_{k = 1}^{m} z_{k}},

其中，u_kl表示P矩阵的第k行第l列数据，w_k表示两向量每个指标之差值的权重。

4.根据权利要求1所述的大波动电网负荷短期预测方法，其特征在于：所述步骤S1前还包括先通过主成分分析法来确认影响冲击负荷的观测时段m，所述m通过主成分分析法按以下步骤来进行计算：

S71：获取t时刻发电机机组工作状态信号；

S72：将工作状态信号组成矩阵数据；

其中，X表示对p个变量进行n次观测的数据；

其中，

表示列向量X1的方差E[(X1-u1)(X1-u1)]，

S74：按以下公式对协方差矩阵进行特征分解：

Z＝UΛU^t；

S75：根据以下公式计算积累贡献率：

η_{m} = \frac{λ_{1} + λ_{2} + . . . + λ_{m}}{λ_{1} + λ_{2} + . . . + λ_{p}},

S76：判断η_m时是否大于如果是，则主成分数目为m。