CN112101614A - 一种基于重抽样的配变重过载预测方法 - Google Patents

一种基于重抽样的配变重过载预测方法 Download PDF

Info

Publication number
CN112101614A
CN112101614A CN202010789326.2A CN202010789326A CN112101614A CN 112101614 A CN112101614 A CN 112101614A CN 202010789326 A CN202010789326 A CN 202010789326A CN 112101614 A CN112101614 A CN 112101614A
Authority
CN
China
Prior art keywords
prediction
distribution transformer
resampling
sample
distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010789326.2A
Other languages
English (en)
Inventor
黄晓曦
虢韬
王磊
黄旭波
杨皓
方曦
田飞龙
龙燕
张宇红
张亚维
禹天润
吴寿长
范春红
王龙
郑文
颜世强
邓华
张旭
沈正康
杨小军
王志甫
赵胜
谢菲
杨锴
刘佳
杨昌碑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guizhou Power Grid Co Ltd
Original Assignee
Guizhou Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guizhou Power Grid Co Ltd filed Critical Guizhou Power Grid Co Ltd
Priority to CN202010789326.2A priority Critical patent/CN112101614A/zh
Publication of CN112101614A publication Critical patent/CN112101614A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Tourism & Hospitality (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于重抽样的配变重过载预测方法,以配变运行历史数据为样本,通过重抽样以及确定最佳抽样比例等方式结合C4.5决策树算法,构造配变短期负荷预测模型,得到一种精度较高的配变短期电力负荷的预测方法,能够有效解决直接通过原始样本数据构造预测模型进行配变短期负荷预测而造成的预测结果全部趋近于正常但重过载预测正确率较低问题,提升配变短期负荷预测精度。

Description

一种基于重抽样的配变重过载预测方法
技术领域
本发明涉及电网故障诊断技术领域,特别涉及一种基于重抽样的配变重过载预测方法。
背景技术
配电变压器(下文简称配变)是电力配网系统中重要供电设备,广东电网计量自动化系统已实现全省配变终端全覆盖,系统通过现场安装的计量自动化配变监测终端采集配变运行数据,监测运行状态。计量自动化系统配变监测终端在线率在98%以上,数据采集完整率在99%以上,数据采集的实时性和完整性为计量系统完成对配变运行状态监测打下了坚实基础。
目前,针对配变运行状态的重载、过载监测尚无有效方法,重过载预测仍为传统的人工分析、经验判断。同时,由于缺失配变实时负载率监控手段,配变异常停电后的原因分析准确性较低,效率低、误差大、可靠性低。
因此目前配变重载、过载只能依靠人工经验预测,且无法分析配变停电是否因长期重载、过载的情况是本领域技术人员需要解决的技术问题。随着社会生产、生活用电负荷的不断攀升,极易使配变处于重过载运行状态,影响电网的安全稳定运行。
发明内容
有鉴于此,本发明的第一方面的目的是以配变运行历史数据为样本,通过重抽样以及确定最佳抽样比例等方式结合C4.5决策树算法,构造配变短期负荷预测模型,提供一种精度较高的基于重抽样的配变重过载预测方法。
本发明的第一方面的目的是通过以下技术方案实现的:
该种基于重抽样的配变重过载预测方法,包括以下步骤:
步骤S1:从电力营销系统中,提取最近一年的配变历史数据作为样本数据,并计算配变负载率值;所述样本数据中包含每日的最高温和最低温度、每月的最高温和最低温度;
步骤S2:确定配变重过载预测模型;
步骤S3:对步骤1所述样本数据中包含的每日的最高温和最低温度、每月的最高温和最低温度以及配变的负载率值进行离散化处理;
步骤S4:利用步骤3离散化后的样本数据,对重过载、正常状态对应的子样本依次按照比例0.1,0.2,0.3,……,p进行K次重抽样,并确定最佳抽样比例,以最佳抽样比例对应的样本所够造的预测模型作为最终的预测模型;
步骤S5:根据步骤4得到的预测模型,将样本数据输入到模型中,完成结果预测。
特别地,所述步骤S1中,所述配变历史数据包括:每日的最高温和最低温度、每月的最高温和最低温度、天气状况、星期、季度、是否为节假日以及变压器0-24小时A、B、C三相电流和配变运行容量。
特别地,配变重过载预测模型由C4.5决策树算法构建而成。
特别地,利用C4.5决策树预测模型进行结果预测时,通过递归的过程由给定的样本数据产生一颗决策树,在每次的递归构造过程中,选取具有最大增益率的属性作为分裂属性,直至不能继续划分。
特别地,负载率是衡量配变状态的重要指标,其计算公式如下:
Figure BDA0002623190500000021
式中:Ai、Bi、Ci分别表示i时刻A、B、C三相电流,loadi表示i时刻配变负载率,capacity表示配变运行容量,i=1,2,…,24。
特别地,所述步骤S3中,对各温度值进行离散化处理的步骤如下,对步骤1所述样本中日最高温度按从小到大的顺序进行排序,并记录为{T1,T2,…,Tn},n为样本数量,分别计算以T1,T2,…,Tn为温度区间分割值时的信息增益Gain值,选取其中信息增益Gain值最大时对应的温度作为分割值,该温度记录为Tc,则日最高温度可划分为[T1,Tc]与(Tc,Tn],分别记录为1,2,当温度超过Tn时记录为+∞,低于T1时记录为-∞;对于日最低温度以及每月的最高温度和最低温度,采用同样的方式进行离散。
特别地,所述步骤S4中,对样本数据进行重新抽样,并确定最佳抽样比例具体包括以下步骤:
步骤S41:假设D为步骤S1所述样本中运行状态为重、过载的样本集,数量为ND;H为运行状态为正常的样本集,数量为NH,D和H一起构成步骤1所述整个样本S;
步骤S41:利用组合公式对样本S进行重抽样,从样本集D中抽取MD个不同的观测值,从H中抽取MH个不同的观测值,共进行K次抽样,得到K个新的子样本,每个子样本均满足抽样比例为:MD/MH=θ,θ为常数。从重抽样的K个子样本中,随机选取K-1个子样本,构建K-1个C4.5分类模型,剩余1个作为测试样本,最后以K-1个C4.5模型预测结果的众数作为对应抽样比例θ下的预测结果;
步骤S41:将测试样本的数据作为输入值带入上述预测模型中,进行结果预测,并对模型预测结果进行验证评估。采用配变重、过载运行状态预测准确率对预测结果进行评估,计算公式如下:
Figure BDA0002623190500000031
式中:Dpredict为配变重过载状态预测天数,Dfact为配变重过载实际天数。
为了确定最佳的抽样比例θ,在充分保障计算效率以及预测精度的前提下,依次假设θ的值为0.1,0.2,0.3……,N,重复上述过程,共能得到10*N个预测模型,依次比较10*N个模型的accuracy值,则其中accuracy最大的模型对应的θ值即为最佳抽样比例,并将该模型作为最终的预测模型。
本发明的第二方面的目的是提供一种计算机装置,包括存储器、处理器及储存在存储器上并能够在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如前所述的方法。
本发明的第三方面的目的是提供一种计算机可读存储介质,其上储存有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如前所述的方法。
本发明的有益效果是:本发明有效解决直接通过原始样本数据构造预测模型进行配变短期负荷预测而造成的预测结果全部趋近于正常但重过载预测正确率较低问题,提升配变短期负荷预测精度。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书和前述的权利要求书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步的详细描述,其中:
图1为本发明的步骤流程示意图。
具体实施方式
以下将参照附图,对本发明的优选实施例进行详细的描述。应当理解,优选实施例仅为了说明本发明,而不是为了限制本发明的保护范围。
如图1所示,本发明的一种基于重抽样的配变重过载预测方法,包括以下步骤:
步骤S1:从电力营销系统中,提取近一年配变历史数据作为样本数据,本实施例中,样本数据包括:每日的最高温和最低温度、每月的最高温和最低温度、天气状况、星期、季度、是否为节假日以及变压器0-24小时A、B、C三相电流和配变运行容量,并计算配变负载率值。
针对配变重过载预测的方法,主要是以配变运行历史数据作为依据,并计及气温、日期、天气状况等多种复杂因素对预测结果的影响。因而从电力营销系统提取近一年配变历史数据作为预测样本,主要构成如下表所示:
表1预测样本数据构成
Figure BDA0002623190500000041
注:表中括号内符号为对应数据的单位,i=1,2,…,24
负载率是衡量配变状态的重要指标,其计算公式如下:
Figure BDA0002623190500000042
式中:Ai、Bi、Ci分别表示i时刻A、B、C三相电流,loadi表示i时刻配变负载率,capacity表示配变运行容量,i=1,2,…,24。
通过将表1中各时段Ai、Bi、Ci三相电流和配变运行容量带入公式(1)中即可求得对应配变在i时刻的配变负载率。
步骤S2:确定配变重过载预测模型:配变重过载预测模型由C4.5决策树算法构建而成。
本发明采用C4.5决策树算法构建配变重过载预测模型,其原理介绍如下:
设S是n个数据样本的集合,定义m个不同的Hi(i=1,2,...,m),每种类别Hi含有的样本数量为ni。其中某属性A有v个不同的值,将S划分为v个子集{S1,S2,…,Sv}。
则将S划分为m个类别的信息熵为:
Figure BDA0002623190500000051
式中:pi=ni/n。
按照属性A将S划分为v个类别后的条件熵为:
Figure BDA0002623190500000052
式中:|Sj|为子集Sj的观测数量,|S|为总样本的观测数量。
则属性A的信息增益可表示为:
Gain(A)=info(S)-infoA(S)#(4)
分类信息值表示如下:
Figure BDA0002623190500000053
信息增益率定义如下:
Figure BDA0002623190500000054
利用C4.5决策树预测模型进行结果预测时,通过递归的过程由给定的样本数据产生一颗决策树,在每次的递归构造过程中,选取具有最大增益率的属性作为分裂属性,直至不能继续划分。具体可表述如下:
(1)首先,计算每个属性的信息增益和信息增益率;
(2)其次,选取信息增益率最大的属性作为分裂属性,以该属性作为节点,构造决策树分支,再划分样本。此时,如果节点中所有样本都在同一个类别中,则将该节点作为树叶。
(3)最后,对每个划分的子集递归执行上述(1)、(2)的操作,当子集中无属性划分或数据记录在主属性上的取值相同时停止,完成决策树构造。
步骤S3:对步骤1所述样本数据的每日的最高温和最低温度、每月的最高温和最低温度以及通过计算得到的负载率值进行离散化处理。
(1)首先,对各温度值进行离散化处理
对步骤1所述样本中日最高温度按从小到大的顺序进行排序,并记录为{T1,T2,…,Tn},n为样本数量。分别计算以T1,T2,…,Tn为温度区间分割值时的信息增益Gain值,选取其中信息增益Gain值最大时对应的温度作为分割值,该温度记录为Tc。则日最高温度可划分为[T1,Tc]与(Tc,Tn],分别记录为1,2,当温度超过Tn时记录为+∞,低于T1时记录为-∞。
同理,对于日最低温度以及每月的最高温度和最低温度,可采用同样的方式进行离散。
(2)其次,对配变负24小时载率值进行离散化处理,对于由步骤1计算得到的配变24小时负载率值,其离散划分方式如下表所示:
表2配变负载率离散值
Figure BDA0002623190500000061
步骤S4:利用步骤3离散化后的样本数据,对重过载、正常状态对应的子样本依次按照比例0.1,0.2,0.3,……,p进行K次重抽样,并确定最佳抽样比例,以最佳抽样比例对应的样本所够造的预测模型作为最终的预测模型。
在配变实际运行过程中,重载以及过载的发生属于小概率事件,如果直接使用配变历史运行数据作为预测样本数据,会造成配变运行状态预测结果趋近于全部为正常,缺乏实际意义。为避免预测结果缺乏实际意义,本发明对样本数据进行重新抽样,并确定最佳抽样比例,具体表述如下:
根据步骤S3所述方法,对步骤S1所述样本数据进行离散后,得到对应的配变状态类型分类情况。假设D为步骤S1所述样本中运行状态为重、过载的样本集,数量为ND;H为运行状态为正常的样本集,数量为NH,D和H一起构成步骤1所述整个样本S。
利用组合公式对样本S进行重抽样,从样本集D中抽取MD个不同的观测值,从H中抽取MH个不同的观测值,共进行K次抽样,得到K个新的子样本,每个子样本均满足抽样比例为:MD/MH=θ,θ为常数。从重抽样的K个子样本中,随机选取K-1个子样本,构建K-1个C4.5分类模型,剩余1个作为测试样本,最后以K-1个C4.5模型预测结果的众数作为对应抽样比例θ下的预测结果。
将测试样本的数据作为输入值带入上述预测模型中,进行结果预测,并对模型预测结果进行验证评估。采用配变重、过载运行状态预测准确率对预测结果进行评估,计算公式如下:
Figure BDA0002623190500000071
式中:Dpredict为配变重过载状态预测天数,Dfact为配变重过载实际天数。
为了确定最佳的抽样比例θ,在充分保障计算效率以及预测精度的前提下,依次假设θ的值为0.1,0.2,0.3……,N,重复上述过程,共能得到10*N个预测模型,依次比较10*N个模型的accuracy值,则其中accuracy最大的模型对应的θ值即为最佳抽样比例,并将该模型作为最终的预测模型。本实施例中,N取2,因此共能得到20个预测模型。
步骤S5:根据步骤4得到的预测模型,将预测数据每日的最高温和最低温度、每月的最高温和最低温度、天气状况、星期、季度、是否为节假日以及上一时刻的A、B、C三相电流和容量数据输入到模型中,完成结果预测。
通过步骤S4的操作可得到最佳抽样比例情况下对应的预测模型,并将该模型作为配变状态预测的最终模型。预测loadk时,将表1中序号1到8与Am、Bm、Cm(m=1,2,…,k-1)以及配变容量等数据输入到模型中,既可实现结果预测。
本发明所使用样本为贵州某市2019年1月初到2019年12月底15台配变的历史数据,样本数量共计130000条也即步骤S1所述样本S容量为130000。在模型构建过程中,重新抽样500个子样本,其中1个作为测试样本,每个子样本重过载数量为75。
本发明在流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (9)

1.一种基于重抽样的配变重过载预测方法,其特征在于:包括以下步骤:
步骤S1:从电力营销系统中,提取最近一年的配变历史数据作为样本数据,并计算配变负载率值;所述样本数据中包含每日的最高温和最低温度、每月的最高温和最低温度;
步骤S2:确定配变重过载预测模型;
步骤S3:对步骤1所述样本数据中包含的每日的最高温和最低温度、每月的最高温和最低温度以及配变的负载率值进行离散化处理;
步骤S4:利用步骤3离散化后的样本数据,对重过载、正常状态对应的子样本依次按照比例0.1,0.2,0.3,……,p进行K次重抽样,并确定最佳抽样比例,以最佳抽样比例对应的样本所构造的预测模型作为最终的预测模型;
步骤S5:根据步骤4得到的预测模型,将样本数据输入到模型中,完成结果预测。
2.根据权利要求1所述的一种基于重抽样的配变重过载预测方法,其特征在于:所述步骤S1中,所述配变历史数据包括:每日的最高温和最低温度、每月的最高温和最低温度、天气状况、星期、季度、是否为节假日以及变压器0-24小时A、B、C三相电流和配变运行容量。
3.根据权利要求1或2所述的一种基于重抽样的配变重过载预测方法,其特征在于:配变重过载预测模型由C4.5决策树算法构建而成。
4.根据权利要求1或2或3所述的一种基于重抽样的配变重过载预测方法,其特征在于:利用C4.5决策树预测模型进行结果预测时,通过递归的过程由给定的样本数据产生一颗决策树,在每次的递归构造过程中,选取具有最大增益率的属性作为分裂属性,直至不能继续划分。
5.根据权利要求1或2或3所述的一种基于重抽样的配变重过载预测方法,其特征在于:负载率是衡量配变状态的重要指标,其计算公式如下:
Figure FDA0002623190490000011
式中:Ai、Bi、Ci分别表示i时刻A、B、C三相电流,loadi表示i时刻配变负载率,capacity表示配变运行容量,i=1,2,…,24。
6.根据权利要求1所述的一种基于重抽样的配变重过载预测方法,其特征在于:所述步骤S3中,对各温度值进行离散化处理的步骤如下,对步骤1所述样本中日最高温度按从小到大的顺序进行排序,并记录为{T1,T2,…,Tn},n为样本数量,分别计算以T1,T2,…,tN为温度区间分割值时的信息增益Gain值,选取其中信息增益Gain值最大时对应的温度作为分割值,该温度记录为Tc,则日最高温度可划分为[T1,Tc]与(Tc,Tn],分别记录为1,2,当温度超过Tn时记录为+∞,低于T1时记录为-∞;对于日最低温度以及每月的最高温度和最低温度,采用同样的方式进行离散。
7.根据权利要求1或2或3所述的一种基于重抽样的配变重过载预测方法,其特征在于:所述步骤S4中,对样本数据进行重新抽样,并确定最佳抽样比例具体包括以下步骤:
步骤S41:假设D为步骤S1所述样本中运行状态为重、过载的样本集,数量为ND;H为运行状态为正常的样本集,数量为NH,D和H一起构成步骤1所述整个样本S;
步骤S41:利用组合公式对样本S进行重抽样,从样本集D中抽取MD个不同的观测值,从H中抽取MH个不同的观测值,共进行K次抽样,得到K个新的子样本,每个子样本均满足抽样比例为:MD/MH=θ,θ为常数。从重抽样的K个子样本中,随机选取K-1个子样本,构建K-1个C4.5分类模型,剩余1个作为测试样本,最后以K-1个C4.5模型预测结果的众数作为对应抽样比例θ下的预测结果;
步骤S41:将测试样本的数据作为输入值带入上述预测模型中,进行结果预测,并对模型预测结果进行验证评估。采用配变重、过载运行状态预测准确率对预测结果进行评估,计算公式如下:
Figure FDA0002623190490000021
式中:Dpredict为配变重过载状态预测天数,Dfact为配变重过载实际天数。
为了确定最佳的抽样比例θ,在充分保障计算效率以及预测精度的前提下,依次假设θ的值为0.1,0.2,0.3……,N,重复上述过程,共能得到10*N个预测模型,依次比较10*N个模型的accuracy值,则其中accuracy最大的模型对应的θ值即为最佳抽样比例,并将该模型作为最终的预测模型。
8.一种计算机装置,包括存储器、处理器及储存在存储器上并能够在处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序时实现如权利要求1-7任一项所述的方法。
9.一种计算机可读存储介质,其上储存有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1-8任一项所述的方法。
CN202010789326.2A 2020-08-07 2020-08-07 一种基于重抽样的配变重过载预测方法 Pending CN112101614A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010789326.2A CN112101614A (zh) 2020-08-07 2020-08-07 一种基于重抽样的配变重过载预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010789326.2A CN112101614A (zh) 2020-08-07 2020-08-07 一种基于重抽样的配变重过载预测方法

Publications (1)

Publication Number Publication Date
CN112101614A true CN112101614A (zh) 2020-12-18

Family

ID=73752735

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010789326.2A Pending CN112101614A (zh) 2020-08-07 2020-08-07 一种基于重抽样的配变重过载预测方法

Country Status (1)

Country Link
CN (1) CN112101614A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170124652A1 (en) * 2015-11-02 2017-05-04 Andrew Macleod Beaven Portfolio optimization by means of delta ratio quantified estimation error
CN107909230A (zh) * 2018-01-12 2018-04-13 国网福建省电力有限公司 一种农网配变重过载短期预警模型的建模方法
CN108920477A (zh) * 2018-04-11 2018-11-30 华南理工大学 一种基于二叉树结构的不平衡数据处理方法
CN109558543A (zh) * 2018-12-11 2019-04-02 拉扎斯网络科技(上海)有限公司 一种样本采样方法、样本采样装置、服务器和存储介质
CN111260490A (zh) * 2020-03-13 2020-06-09 上海远眸软件有限公司 基于树模型的车险快速理赔方法和系统
CN111382897A (zh) * 2019-10-25 2020-07-07 广州供电局有限公司 台区低压跳闸预测方法、装置、计算机设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170124652A1 (en) * 2015-11-02 2017-05-04 Andrew Macleod Beaven Portfolio optimization by means of delta ratio quantified estimation error
CN107909230A (zh) * 2018-01-12 2018-04-13 国网福建省电力有限公司 一种农网配变重过载短期预警模型的建模方法
CN108920477A (zh) * 2018-04-11 2018-11-30 华南理工大学 一种基于二叉树结构的不平衡数据处理方法
CN109558543A (zh) * 2018-12-11 2019-04-02 拉扎斯网络科技(上海)有限公司 一种样本采样方法、样本采样装置、服务器和存储介质
CN111382897A (zh) * 2019-10-25 2020-07-07 广州供电局有限公司 台区低压跳闸预测方法、装置、计算机设备及存储介质
CN111260490A (zh) * 2020-03-13 2020-06-09 上海远眸软件有限公司 基于树模型的车险快速理赔方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
汪凌: "《不确定信息的处理与知识挖掘》", 31 May 2015, 合肥:中国科学技术大学出版社 *
贺建章 等: ""基于随机森林理论的配电变压器重过载预测"", 《电网技术》, vol. 41, no. 8, pages 1 - 5 *

Similar Documents

Publication Publication Date Title
CN110097297B (zh) 一种多维度窃电态势智能感知方法、系统、设备及介质
CN108375715B (zh) 一种配电网线路故障风险日预测方法及系统
JP2003242212A (ja) ユーティリティの消費特性が類似する曜日を決定する装置および方法
CN113126019A (zh) 一种智能电表误差远程估计方法、系统、终端和存储介质
CN112308436A (zh) 一种配电网评估诊断分析方法、装置、设备及存储介质
CN112433907A (zh) 不间断电源的主机运行参量数据的处理方法、装置和电子装置
CN107862459B (zh) 一种基于大数据的计量设备状态评估方法及系统
CN111737249A (zh) 基于Lasso算法的异常数据检测方法及装置
CN116882804A (zh) 一种智能电力监控方法及系统
CN116011158A (zh) 一种低压台区的拓扑识别方法、系统及装置
Zhao et al. Evaluation of operating state for smart electricity meters based on transformer–encoder–BiLSTM
CN117148048B (zh) 基于数字孪生技术的配电网故障预测方法及系统
CN117113157B (zh) 一种基于人工智能的台区用电故障检测系统
CN111999695A (zh) 一种变电站计量装置状态评估与异常诊断方法
CN112345972A (zh) 基于停电事件的配电网线变关系异常诊断方法、装置及系统
CN116910655A (zh) 一种基于装置量测数据的智能电能表故障预测方法
CN112101614A (zh) 一种基于重抽样的配变重过载预测方法
CN116432524A (zh) 一种变压器油温预测方法、装置、设备及存储介质
CN113887676B (zh) 设备故障预警方法、装置、设备和存储介质
CN112256735B (zh) 一种用电监测方法、装置、计算机设备和存储介质
CN109871998B (zh) 一种基于专家样本库的配电网线损率预测方法及装置
CN115146715A (zh) 用电安全隐患诊断方法、装置、设备及存储介质
Diong et al. Establishing the foundation for energy management on university campuses via data analytics
Motepe et al. Determining South African distribution power system big data integrity using fuzzy logic: Power measurements data application
Guo et al. A Reliability Evaluation Model for Smart Meters Based on Survival Analysis Theory

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination