CN112101614A

CN112101614A - 一种基于重抽样的配变重过载预测方法

Info

Publication number: CN112101614A
Application number: CN202010789326.2A
Authority: CN
Inventors: 黄晓曦; 虢韬; 王磊; 黄旭波; 杨皓; 方曦; 田飞龙; 龙燕; 张宇红; 张亚维; 禹天润; 吴寿长; 范春红; 王龙; 郑文; 颜世强; 邓华; 张旭; 沈正康; 杨小军
Original assignee: Guizhou Power Grid Co Ltd
Current assignee: Guizhou Power Grid Co Ltd
Priority date: 2020-08-07
Filing date: 2020-08-07
Publication date: 2020-12-18

Abstract

本发明公开了一种基于重抽样的配变重过载预测方法，以配变运行历史数据为样本，通过重抽样以及确定最佳抽样比例等方式结合C4.5决策树算法，构造配变短期负荷预测模型，得到一种精度较高的配变短期电力负荷的预测方法，能够有效解决直接通过原始样本数据构造预测模型进行配变短期负荷预测而造成的预测结果全部趋近于正常但重过载预测正确率较低问题，提升配变短期负荷预测精度。

Description

一种基于重抽样的配变重过载预测方法

技术领域

本发明涉及电网故障诊断技术领域，特别涉及一种基于重抽样的配变重过载预测方法。

背景技术

配电变压器(下文简称配变)是电力配网系统中重要供电设备，广东电网计量自动化系统已实现全省配变终端全覆盖，系统通过现场安装的计量自动化配变监测终端采集配变运行数据，监测运行状态。计量自动化系统配变监测终端在线率在98％以上，数据采集完整率在99％以上，数据采集的实时性和完整性为计量系统完成对配变运行状态监测打下了坚实基础。

目前，针对配变运行状态的重载、过载监测尚无有效方法，重过载预测仍为传统的人工分析、经验判断。同时，由于缺失配变实时负载率监控手段，配变异常停电后的原因分析准确性较低，效率低、误差大、可靠性低。

因此目前配变重载、过载只能依靠人工经验预测，且无法分析配变停电是否因长期重载、过载的情况是本领域技术人员需要解决的技术问题。随着社会生产、生活用电负荷的不断攀升，极易使配变处于重过载运行状态，影响电网的安全稳定运行。

发明内容

有鉴于此，本发明的第一方面的目的是以配变运行历史数据为样本，通过重抽样以及确定最佳抽样比例等方式结合C4.5决策树算法，构造配变短期负荷预测模型，提供一种精度较高的基于重抽样的配变重过载预测方法。

本发明的第一方面的目的是通过以下技术方案实现的：

该种基于重抽样的配变重过载预测方法，包括以下步骤：

步骤S1：从电力营销系统中，提取最近一年的配变历史数据作为样本数据，并计算配变负载率值；所述样本数据中包含每日的最高温和最低温度、每月的最高温和最低温度；

步骤S2：确定配变重过载预测模型；

步骤S3：对步骤1所述样本数据中包含的每日的最高温和最低温度、每月的最高温和最低温度以及配变的负载率值进行离散化处理；

步骤S4：利用步骤3离散化后的样本数据，对重过载、正常状态对应的子样本依次按照比例0.1，0.2，0.3，……，p进行K次重抽样，并确定最佳抽样比例，以最佳抽样比例对应的样本所够造的预测模型作为最终的预测模型；

步骤S5：根据步骤4得到的预测模型，将样本数据输入到模型中，完成结果预测。

特别地，所述步骤S1中，所述配变历史数据包括：每日的最高温和最低温度、每月的最高温和最低温度、天气状况、星期、季度、是否为节假日以及变压器0-24小时A、B、C三相电流和配变运行容量。

特别地，配变重过载预测模型由C4.5决策树算法构建而成。

特别地，利用C4.5决策树预测模型进行结果预测时，通过递归的过程由给定的样本数据产生一颗决策树，在每次的递归构造过程中，选取具有最大增益率的属性作为分裂属性，直至不能继续划分。

特别地，负载率是衡量配变状态的重要指标，其计算公式如下：

式中：A_i、B_i、C_i分别表示i时刻A、B、C三相电流，load_i表示i时刻配变负载率，capacity表示配变运行容量，i＝1，2，…，24。

特别地，所述步骤S3中，对各温度值进行离散化处理的步骤如下，对步骤1所述样本中日最高温度按从小到大的顺序进行排序，并记录为{T₁，T₂，…，T_n}，n为样本数量，分别计算以T₁，T₂，…，T_n为温度区间分割值时的信息增益Gain值，选取其中信息增益Gain值最大时对应的温度作为分割值，该温度记录为T_c，则日最高温度可划分为[T₁，T_c]与(T_c，T_n]，分别记录为1，2，当温度超过T_n时记录为+∞，低于T₁时记录为-∞；对于日最低温度以及每月的最高温度和最低温度，采用同样的方式进行离散。

特别地，所述步骤S4中，对样本数据进行重新抽样，并确定最佳抽样比例具体包括以下步骤：

步骤S41：假设D为步骤S1所述样本中运行状态为重、过载的样本集，数量为N_D；H为运行状态为正常的样本集，数量为N_H，D和H一起构成步骤1所述整个样本S；

步骤S41：利用组合公式对样本S进行重抽样，从样本集D中抽取M_D个不同的观测值，从H中抽取M_H个不同的观测值，共进行K次抽样，得到K个新的子样本，每个子样本均满足抽样比例为：MD/MH＝θ，θ为常数。从重抽样的K个子样本中，随机选取K-1个子样本，构建K-1个C4.5分类模型，剩余1个作为测试样本，最后以K-1个C4.5模型预测结果的众数作为对应抽样比例θ下的预测结果；

步骤S41：将测试样本的数据作为输入值带入上述预测模型中，进行结果预测，并对模型预测结果进行验证评估。采用配变重、过载运行状态预测准确率对预测结果进行评估，计算公式如下：

式中：D_predict为配变重过载状态预测天数，D_fact为配变重过载实际天数。

为了确定最佳的抽样比例θ，在充分保障计算效率以及预测精度的前提下，依次假设θ的值为0.1，0.2，0.3……，N，重复上述过程，共能得到10*N个预测模型，依次比较10*N个模型的accuracy值，则其中accuracy最大的模型对应的θ值即为最佳抽样比例，并将该模型作为最终的预测模型。

本发明的第二方面的目的是提供一种计算机装置，包括存储器、处理器及储存在存储器上并能够在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如前所述的方法。

本发明的第三方面的目的是提供一种计算机可读存储介质，其上储存有计算机程序，其特征在于：所述计算机程序被处理器执行时实现如前所述的方法。

本发明的有益效果是：本发明有效解决直接通过原始样本数据构造预测模型进行配变短期负荷预测而造成的预测结果全部趋近于正常但重过载预测正确率较低问题，提升配变短期负荷预测精度。

本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述，并且在某种程度上，基于对下文的考察研究对本领域技术人员而言将是显而易见的，或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书和前述的权利要求书来实现和获得。

附图说明

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步的详细描述，其中：

图1为本发明的步骤流程示意图。

具体实施方式

以下将参照附图，对本发明的优选实施例进行详细的描述。应当理解，优选实施例仅为了说明本发明，而不是为了限制本发明的保护范围。

如图1所示，本发明的一种基于重抽样的配变重过载预测方法，包括以下步骤：

步骤S1：从电力营销系统中，提取近一年配变历史数据作为样本数据，本实施例中，样本数据包括：每日的最高温和最低温度、每月的最高温和最低温度、天气状况、星期、季度、是否为节假日以及变压器0-24小时A、B、C三相电流和配变运行容量，并计算配变负载率值。

针对配变重过载预测的方法，主要是以配变运行历史数据作为依据，并计及气温、日期、天气状况等多种复杂因素对预测结果的影响。因而从电力营销系统提取近一年配变历史数据作为预测样本，主要构成如下表所示：

表1预测样本数据构成

注：表中括号内符号为对应数据的单位，i＝1，2，…，24

负载率是衡量配变状态的重要指标，其计算公式如下：

通过将表1中各时段A_i、B_i、C_i三相电流和配变运行容量带入公式(1)中即可求得对应配变在i时刻的配变负载率。

步骤S2：确定配变重过载预测模型：配变重过载预测模型由C4.5决策树算法构建而成。

本发明采用C4.5决策树算法构建配变重过载预测模型，其原理介绍如下：

设S是n个数据样本的集合，定义m个不同的H_i(i＝1，2，...，m)，每种类别H_i含有的样本数量为n_i。其中某属性A有v个不同的值，将S划分为v个子集{S₁，S₂，…，S_v}。

则将S划分为m个类别的信息熵为：

式中：p_i＝n_i/n。

按照属性A将S划分为v个类别后的条件熵为：

式中：|S_j|为子集S_j的观测数量，|S|为总样本的观测数量。

则属性A的信息增益可表示为：

Gain(A)＝info(S)-info_A(S)#(4)

分类信息值表示如下：

信息增益率定义如下：

利用C4.5决策树预测模型进行结果预测时，通过递归的过程由给定的样本数据产生一颗决策树，在每次的递归构造过程中，选取具有最大增益率的属性作为分裂属性，直至不能继续划分。具体可表述如下：

(1)首先，计算每个属性的信息增益和信息增益率；

(2)其次，选取信息增益率最大的属性作为分裂属性，以该属性作为节点，构造决策树分支，再划分样本。此时，如果节点中所有样本都在同一个类别中，则将该节点作为树叶。

(3)最后，对每个划分的子集递归执行上述(1)、(2)的操作，当子集中无属性划分或数据记录在主属性上的取值相同时停止，完成决策树构造。

步骤S3：对步骤1所述样本数据的每日的最高温和最低温度、每月的最高温和最低温度以及通过计算得到的负载率值进行离散化处理。

(1)首先，对各温度值进行离散化处理

对步骤1所述样本中日最高温度按从小到大的顺序进行排序，并记录为{T₁，T₂，…，T_n}，n为样本数量。分别计算以T₁，T₂，…，T_n为温度区间分割值时的信息增益Gain值，选取其中信息增益Gain值最大时对应的温度作为分割值，该温度记录为T_c。则日最高温度可划分为[T₁，T_c]与(T_c，T_n]，分别记录为1，2，当温度超过T_n时记录为+∞，低于T₁时记录为-∞。

同理，对于日最低温度以及每月的最高温度和最低温度，可采用同样的方式进行离散。

(2)其次，对配变负24小时载率值进行离散化处理，对于由步骤1计算得到的配变24小时负载率值，其离散划分方式如下表所示：

表2配变负载率离散值

步骤S4：利用步骤3离散化后的样本数据，对重过载、正常状态对应的子样本依次按照比例0.1，0.2，0.3，……，p进行K次重抽样，并确定最佳抽样比例，以最佳抽样比例对应的样本所够造的预测模型作为最终的预测模型。

在配变实际运行过程中，重载以及过载的发生属于小概率事件，如果直接使用配变历史运行数据作为预测样本数据，会造成配变运行状态预测结果趋近于全部为正常，缺乏实际意义。为避免预测结果缺乏实际意义，本发明对样本数据进行重新抽样，并确定最佳抽样比例，具体表述如下：

根据步骤S3所述方法，对步骤S1所述样本数据进行离散后，得到对应的配变状态类型分类情况。假设D为步骤S1所述样本中运行状态为重、过载的样本集，数量为N_D；H为运行状态为正常的样本集，数量为N_H，D和H一起构成步骤1所述整个样本S。

利用组合公式对样本S进行重抽样，从样本集D中抽取M_D个不同的观测值，从H中抽取M_H个不同的观测值，共进行K次抽样，得到K个新的子样本，每个子样本均满足抽样比例为：MD/MH＝θ，θ为常数。从重抽样的K个子样本中，随机选取K-1个子样本，构建K-1个C4.5分类模型，剩余1个作为测试样本，最后以K-1个C4.5模型预测结果的众数作为对应抽样比例θ下的预测结果。

将测试样本的数据作为输入值带入上述预测模型中，进行结果预测，并对模型预测结果进行验证评估。采用配变重、过载运行状态预测准确率对预测结果进行评估，计算公式如下：

为了确定最佳的抽样比例θ，在充分保障计算效率以及预测精度的前提下，依次假设θ的值为0.1，0.2，0.3……，N，重复上述过程，共能得到10*N个预测模型，依次比较10*N个模型的accuracy值，则其中accuracy最大的模型对应的θ值即为最佳抽样比例，并将该模型作为最终的预测模型。本实施例中，N取2，因此共能得到20个预测模型。

步骤S5：根据步骤4得到的预测模型，将预测数据每日的最高温和最低温度、每月的最高温和最低温度、天气状况、星期、季度、是否为节假日以及上一时刻的A、B、C三相电流和容量数据输入到模型中，完成结果预测。

通过步骤S4的操作可得到最佳抽样比例情况下对应的预测模型，并将该模型作为配变状态预测的最终模型。预测load_k时，将表1中序号1到8与A_m、B_m、C_m(m＝1，2，…，k-1)以及配变容量等数据输入到模型中，既可实现结果预测。

本发明所使用样本为贵州某市2019年1月初到2019年12月底15台配变的历史数据，样本数量共计130000条也即步骤S1所述样本S容量为130000。在模型构建过程中，重新抽样500个子样本，其中1个作为测试样本，每个子样本重过载数量为75。

本发明在流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。

最后说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本技术方案的宗旨和范围，其均应涵盖在本发明的权利要求范围当中。

Claims

1.一种基于重抽样的配变重过载预测方法，其特征在于：包括以下步骤：

步骤S2：确定配变重过载预测模型；

步骤S4：利用步骤3离散化后的样本数据，对重过载、正常状态对应的子样本依次按照比例0.1,0.2,0.3,……,p进行K次重抽样，并确定最佳抽样比例，以最佳抽样比例对应的样本所构造的预测模型作为最终的预测模型；

2.根据权利要求1所述的一种基于重抽样的配变重过载预测方法，其特征在于：所述步骤S1中，所述配变历史数据包括：每日的最高温和最低温度、每月的最高温和最低温度、天气状况、星期、季度、是否为节假日以及变压器0-24小时A、B、C三相电流和配变运行容量。

3.根据权利要求1或2所述的一种基于重抽样的配变重过载预测方法，其特征在于：配变重过载预测模型由C4.5决策树算法构建而成。

4.根据权利要求1或2或3所述的一种基于重抽样的配变重过载预测方法，其特征在于：利用C4.5决策树预测模型进行结果预测时，通过递归的过程由给定的样本数据产生一颗决策树，在每次的递归构造过程中，选取具有最大增益率的属性作为分裂属性，直至不能继续划分。

5.根据权利要求1或2或3所述的一种基于重抽样的配变重过载预测方法，其特征在于：负载率是衡量配变状态的重要指标，其计算公式如下：

6.根据权利要求1所述的一种基于重抽样的配变重过载预测方法，其特征在于：所述步骤S3中，对各温度值进行离散化处理的步骤如下，对步骤1所述样本中日最高温度按从小到大的顺序进行排序，并记录为{T₁，T₂，…，T_n}，n为样本数量，分别计算以T₁，T₂，…，t_N为温度区间分割值时的信息增益Gain值，选取其中信息增益Gain值最大时对应的温度作为分割值，该温度记录为T_c，则日最高温度可划分为[T₁，T_c]与(T_c，T_n]，分别记录为1，2，当温度超过T_n时记录为+∞，低于T₁时记录为-∞；对于日最低温度以及每月的最高温度和最低温度，采用同样的方式进行离散。

7.根据权利要求1或2或3所述的一种基于重抽样的配变重过载预测方法，其特征在于：所述步骤S4中，对样本数据进行重新抽样，并确定最佳抽样比例具体包括以下步骤：

为了确定最佳的抽样比例θ，在充分保障计算效率以及预测精度的前提下，依次假设θ的值为0.1,0.2,0.3……,N，重复上述过程，共能得到10*N个预测模型，依次比较10*N个模型的accuracy值，则其中accuracy最大的模型对应的θ值即为最佳抽样比例，并将该模型作为最终的预测模型。

8.一种计算机装置，包括存储器、处理器及储存在存储器上并能够在处理器上运行的计算机程序，其特征在于：所述处理器执行所述计算机程序时实现如权利要求1-7任一项所述的方法。

9.一种计算机可读存储介质，其上储存有计算机程序，其特征在于：所述计算机程序被处理器执行时实现如权利要求1-8任一项所述的方法。