CN113506184A - 一种基于台区数据进行的配变负荷预测方法及系统 - Google Patents

一种基于台区数据进行的配变负荷预测方法及系统 Download PDF

Info

Publication number
CN113506184A
CN113506184A CN202110418853.7A CN202110418853A CN113506184A CN 113506184 A CN113506184 A CN 113506184A CN 202110418853 A CN202110418853 A CN 202110418853A CN 113506184 A CN113506184 A CN 113506184A
Authority
CN
China
Prior art keywords
distribution
distribution transformer
data
transformer load
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110418853.7A
Other languages
English (en)
Inventor
赵建利
杜晓东
陈泽
冯海燕
姬艳鹏
郭禹伶
董娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Hebei Electric Power Co Ltd
State Grid Hebei Energy Technology Service Co Ltd
Original Assignee
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Hebei Electric Power Co Ltd
State Grid Hebei Energy Technology Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Electric Power Research Institute of State Grid Hebei Electric Power Co Ltd, State Grid Hebei Energy Technology Service Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202110418853.7A priority Critical patent/CN113506184A/zh
Publication of CN113506184A publication Critical patent/CN113506184A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明属于配变负荷预测技术领域,公开了一种基于台区数据进行的配变负荷预测方法及系统,包括步骤:获取配变负荷数据,并对配变负荷数据进行统计;通过小提琴图筛选所述配变负荷数据中的异常数据,达到数据清洗的目的;基于拉索回归对清洗后的配变负荷数据进行训练,得到第一配变负荷模型;基于Xgboost对清洗后的配变负荷数据进行训练,得到第二配变负荷模型;将第一配变负荷模型与第二配变负荷模型进行融合,得到融合模型。本发明两个模型在预测时,数据与真实值偏差可以分为两种可能,一种是同向,一种是异向,在同向时,融合后的模型效果在两个模型效果之间,而异向时,融合后的效果要同时好于两个模型。

Description

一种基于台区数据进行的配变负荷预测方法及系统
技术领域
本发明属于配变负荷预测技术领域,具体涉及一种基于台区数据进行的配变负荷预测方法及系统。
背景技术
基于台区系统,采集5个变压器,在1972天内的数据,统计后发现每个变压器大约缺失15天。第一个点功率值P1缺失比例在3%到6%不等,大部分数据缺失P1的变压器存在缺失P2-P96的可能,可能无法简单的填充缺失值。第96个点功率值P96缺失情况最为严重,最高可达到60%左右。
另外,功率中存在不少数据为负的情况。其中一个变压器在相隔4天时间里功率值相差了最高500倍;数据中存在少量为0及空现象;温度变化在相同温度点,在不同的时段对负荷影响不一样。以26度为例,晚上变化一度相比白天,对负荷的影响更大一些。风速对负荷影响不明显;气压增高的,负荷有所上升;晚上没有光照,白天光照居中时,负荷最大,两端负荷较小;降雨量对负荷影响不明显;工作日负荷较非工作日负荷高;国庆第一天及国庆中负荷最低,国庆最后一天会有回升,国庆后第二天会达到高峰。综上,配变负荷与温度、气压、工作日以及节假日等因素均有关联。
目前现有的配变负荷预测方法在使用时,数据与真实值偏差较大。
发明内容
本发明的目的在于提供一种基于台区数据进行的配变负荷预测方法及系统,以解决现有的数据与真实值偏差较大的问题。
为实现上述目的,本发明提供如下技术方案:一种基于台区数据进行的配变负荷预测方法,包括步骤:
基于拉索回归对清洗后的配变负荷数据进行训练,得到第一配变负荷模型;
基于Xgboost对清洗后的配变负荷数据进行训练,得到第二配变负荷模型;
将第一配变负荷模型与第二配变负荷模型进行融合,得到融合模型。
作为本发明一种基于台区数据进行的配变负荷预测方法优选地,所述的基于Xgboost对清洗后的配变负荷数据进行训练,得到第二配变负荷模型具体包括步骤:
通过带权重来训练基分类器;
根据基分类器产生的学习误差来更新权重系数,以此来关注分类效果不好的弱分类器。
作为本发明一种基于台区数据进行的配变负荷预测方法优选地,在所述的根据基分类器产生的学习误差来更新权重系数,以此来关注分类效果不好的弱分类器之后包括步骤:
不断的迭代过程训练出k个弱分类器;
将k个分类器组合为一个强分类器。
作为本发明一种基于台区数据进行的配变负荷预测方法优选地,在所述的基于拉索回归对清洗后的配变负荷数据进行训练,得到第一配变负荷模型之前还包括步骤:
获取配变负荷数据,并对配变负荷数据进行统计。
作为本发明一种基于台区数据进行的配变负荷预测方法优选地,在所述的基于拉索回归对清洗后的配变负荷数据进行训练,得到第一配变负荷模型之前包括步骤:
通过小提琴图筛选所述配变负荷数据中的异常数据,达到数据清洗的目的。
作为本发明一种基于台区数据进行的配变负荷预测方法优选地,在所述的将第一配变负荷模型与第二配变负荷模型进行融合,得到融合模型之后包括步骤:
基于融合模型进行配变负荷预测。
本发明还提供一种基于台区数据进行的配变负荷预测系统,包括:
第一训练模块,用于基于拉索回归对清洗后的配变负荷数据进行训练,得到第一配变负荷模型;
第二训练模块,用于基于Xgboost对清洗后的配变负荷数据进行训练,得到第二配变负荷模型;
计算模块,用于将第一配变负荷模型与第二配变负荷模型进行融合,得到融合模型。
作为本发明一种基于台区数据进行的配变负荷预测方法优选地,还包括:获取模块,用于获取配变负荷数据,并对配变负荷数据进行统计。
作为本发明一种基于台区数据进行的配变负荷预测方法优选地,还包括:数据清洗模块,用于通过小提琴图筛选所述配变负荷数据中的异常数据,达到数据清洗的目的。
作为本发明一种基于台区数据进行的配变负荷预测方法优选地,还包括:预测模块,用于基于融合模型进行配变负荷预测。
本发明与现有技术相比,具有以下有益效果:本发明两个模型在预测时,数据与真实值偏差可以分为两种可能,一种是同向,一种是异向,在同向时,融合后的模型效果在两个模型效果之间,而异向时,融合后的效果要同时好于两个模型。综合融合后的模型效果要略好于两个单个模型。
附图说明
图1为本发明一种基于台区数据进行的配变负荷预测方法的流程图之一;
图2为本发明一种基于台区数据进行的配变负荷预测方法的流程图之三;
图3为本发明一种基于台区数据进行的配变负荷预测方法的流程图之四;
图4为本发明一种基于台区数据进行的配变负荷预测方法的流程图之五;
图5为本发明一种基于台区数据进行的配变负荷预测方法的小提琴数据图;
图6为本发明一种基于台区数据进行的配变负荷预测方法的Xgboost模型训练流程图。
图7为本发明采用Lasso模型、xgboost模型以及融合模型预测的数据对照表。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-图7所示,本发明提供如下技术方案:一种基于台区数据进行的配变负荷预测方法,包括步骤:
S100基于拉索回归对清洗后的配变负荷数据进行训练,得到第一配变负荷模型;
S200基于Xgboost对清洗后的配变负荷数据进行训练,得到第二配变负荷模型;
S300将第一配变负荷模型与第二配变负荷模型进行融合,得到融合模型。
本实施例中,Lasso回归有时也叫做线性回归的L1正则化,和Ridge回归的主要区别就是在正则化项,Ridge回归用的是L2正则化,而Lasso回归用的是L1正则化。
Lasso相对于Ridge回归:
Lasso回归使得一些系数变小,甚至还是一些绝对值较小的系数直接变为0,因此特别适用于参数数目缩减与参数的选择,因而用来估计稀疏参数的线性模型。
L1范数没有解析解,但L2范数有。这使得L2范数的解可以通过计算得到。然而,L1范数的解具有稀疏性,这使得它可以与稀疏算法一起使用,这使得在计算上更有效率。
Xgboost是一种集成提升算法,与传统的Gbdt有很多的不同,在函数优化方面Xgboost运用到了二阶泰勒展开式,优化过程中同时用到了一阶和二阶导数,并且将正则项加入了损失函数中,以此来降低模型的复杂度,用以防止过拟合现象,如图6所示,过带权重来训练基分类器,根据分类器产生的学习误差来更新权重系数,以此来关注那些分类效果不好的弱分类器,以此不断的迭代过程训练出k个弱分类器,再将k个分类器组合为一个强分类器。
具体地,所述的S200基于Xgboost对清洗后的配变负荷数据进行训练,得到第二配变负荷模型具体包括步骤:
S201通过带权重来训练基分类器;
S202根据基分类器产生的学习误差来更新权重系数,以此来关注分类效果不好的弱分类器;
S203不断的迭代过程训练出k个弱分类器;
S204将k个分类器组合为一个强分类器。
具体地,在所述的S100基于拉索回归对清洗后的配变负荷数据进行训练,得到第一配变负荷模型之前还包括步骤:
S10获取配变负荷数据,并对配变负荷数据进行统计。
具体地,在所述的S100基于拉索回归对清洗后的配变负荷数据进行训练,得到第一配变负荷模型之前包括步骤:
S20通过小提琴图筛选所述配变负荷数据中的异常数据,达到数据清洗的目的。
值得说明的是,小提琴图(Violin Plot)是用来展示多组数据的分布状态以及概率密度。这种图表结合了箱形图和密度图的特征,主要用来显示数据的分布形状。跟箱形图类似,但是在密度层面展示更好。在数据量非常大不方便一个一个展示的时候小提琴图特别适用。
如图5所示,其中Median为数据的中心点(即有一半数据大于中位数,一半数据小于中位数,在其位置之下)。
Interquartile range代表为四分位间距,黑色矩形是下四分位数到上四分位数的范围,矩形上边缘为上四分位数Q3,代表数据中有四分之一的数目大于上四分位数,下边缘为下四分位数Q1,代表数据中有四分之一的数目小于下四分位数,四分位间距IQR(上四分位数和下四分为数间距)长短代表非异常数据的分散和对称程度,长则分散,短则集中;
上下贯穿小提琴图的黑线代表最小非异常值min到最大非异常值max的区间,线上下端分别代表上限和下限,超出此范围为异常数据;
黑色矩形外部形状为核密度估计,图形纵轴方向长度代表数据弥散程度,横轴方向长度代表在某纵坐标位置数据分布量。
可以通过上述的小提琴图来筛选数据中的异常数据,达到数据清洗的目的。
具体地,在所述的S300将第一配变负荷模型与第二配变负荷模型进行融合,得到融合模型之后包括步骤:
S400基于融合模型进行配变负荷预测。
本发明还提供一种基于台区数据进行的配变负荷预测系统,包括:
第一训练模块,用于基于拉索回归对清洗后的配变负荷数据进行训练,得到第一配变负荷模型;
第二训练模块,用于基于Xgboost对清洗后的配变负荷数据进行训练,得到第二配变负荷模型;
计算模块,用于将第一配变负荷模型与第二配变负荷模型进行融合,得到融合模型。
具体地,还包括:获取模块,用于获取配变负荷数据,并对配变负荷数据进行统计。
具体地,还包括:数据清洗模块,用于通过小提琴图筛选所述配变负荷数据中的异常数据,达到数据清洗的目的。
具体地,还包括:预测模块,用于基于融合模型进行配变负荷预测。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (10)

1.一种基于台区数据进行的配变负荷预测方法,其特征在于,包括步骤:
S100基于拉索回归对清洗后的配变负荷数据进行训练,得到第一配变负荷模型;
S200基于Xgboost对清洗后的配变负荷数据进行训练,得到第二配变负荷模型;
S300将第一配变负荷模型与第二配变负荷模型进行融合,得到融合模型。
2.根据权利要求1所述的一种基于台区数据进行的配变负荷预测方法,其特征在于,所述的S200基于Xgboost对清洗后的配变负荷数据进行训练,得到第二配变负荷模型具体包括步骤:
S201通过带权重来训练基分类器;
S202根据基分类器产生的学习误差来更新权重系数,以此来关注分类效果不好的弱分类器。
3.根据权利要求2所述的一种基于台区数据进行的配变负荷预测方法,其特征在于,在所述的根据基分类器产生的学习误差来更新权重系数,以此来关注分类效果不好的弱分类器之后包括步骤:
S203不断的迭代过程训练出k个弱分类器;
S204将k个弱分类器组合为一个强分类器。
4.根据权利要求1所述的一种基于台区数据进行的配变负荷预测方法,其特征在于,在所述的S100基于拉索回归对清洗后的配变负荷数据进行训练,得到第一配变负荷模型之前还包括步骤:
S10获取配变负荷数据,并对配变负荷数据进行统计。
5.根据权利要求1所述的一种基于台区数据进行的配变负荷预测方法,其特征在于,在所述的S100基于拉索回归对清洗后的配变负荷数据进行训练,得到第一配变负荷模型之前包括步骤:
S20通过小提琴图筛选所述配变负荷数据中的异常数据,达到数据清洗的目的。
6.根据权利要求1所述的一种基于台区数据进行的配变负荷预测方法,其特征在于,在所述的S300将第一配变负荷模型与第二配变负荷模型进行融合,得到融合模型之后包括步骤:
S400基于融合模型进行配变负荷预测。
7.一种基于台区数据进行的配变负荷预测系统,其特征在于,包括:
第一训练模块,用于基于拉索回归对清洗后的配变负荷数据进行训练,得到第一配变负荷模型;
第二训练模块,用于基于Xgboost对清洗后的配变负荷数据进行训练,得到第二配变负荷模型;
计算模块,用于将第一配变负荷模型与第二配变负荷模型进行融合,得到融合模型。
8.根据权利要求6所述的一种基于台区数据进行的配变负荷预测系统,其特征在于,还包括:
获取模块,用于获取配变负荷数据,并对配变负荷数据进行统计。
9.根据权利要求7所述的一种基于台区数据进行的配变负荷预测系统,其特征在于,还包括:
数据清洗模块,用于通过小提琴图筛选所述配变负荷数据中的异常数据,达到数据清洗的目的。
10.根据权利要求7所述的一种基于台区数据进行的配变负荷预测系统,其特征在于,还包括:
预测模块,用于基于融合模型进行配变负荷预测。
CN202110418853.7A 2021-04-19 2021-04-19 一种基于台区数据进行的配变负荷预测方法及系统 Pending CN113506184A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110418853.7A CN113506184A (zh) 2021-04-19 2021-04-19 一种基于台区数据进行的配变负荷预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110418853.7A CN113506184A (zh) 2021-04-19 2021-04-19 一种基于台区数据进行的配变负荷预测方法及系统

Publications (1)

Publication Number Publication Date
CN113506184A true CN113506184A (zh) 2021-10-15

Family

ID=78008290

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110418853.7A Pending CN113506184A (zh) 2021-04-19 2021-04-19 一种基于台区数据进行的配变负荷预测方法及系统

Country Status (1)

Country Link
CN (1) CN113506184A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109376896A (zh) * 2018-08-29 2019-02-22 国网重庆市电力公司南岸供电分公司 一种基于多模融合的配电网短期负荷预测方法
CN110458323A (zh) * 2019-06-27 2019-11-15 广东工业大学 一种基于快速序列浮动特征选择的短期住宅负荷预测方法
CN110619107A (zh) * 2019-08-07 2019-12-27 南昌大学 一种Lstm与Gcforest算法混合强化学习的配网变压器负荷预测方法
CN112232373A (zh) * 2020-09-20 2021-01-15 华中师范大学 一种锅炉飞灰含碳量预测方法及系统
CN112330050A (zh) * 2020-11-20 2021-02-05 国网辽宁省电力有限公司营口供电公司 一种基于双层XGBoost考虑多特征的电力系统负荷预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109376896A (zh) * 2018-08-29 2019-02-22 国网重庆市电力公司南岸供电分公司 一种基于多模融合的配电网短期负荷预测方法
CN110458323A (zh) * 2019-06-27 2019-11-15 广东工业大学 一种基于快速序列浮动特征选择的短期住宅负荷预测方法
CN110619107A (zh) * 2019-08-07 2019-12-27 南昌大学 一种Lstm与Gcforest算法混合强化学习的配网变压器负荷预测方法
CN112232373A (zh) * 2020-09-20 2021-01-15 华中师范大学 一种锅炉飞灰含碳量预测方法及系统
CN112330050A (zh) * 2020-11-20 2021-02-05 国网辽宁省电力有限公司营口供电公司 一种基于双层XGBoost考虑多特征的电力系统负荷预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王景行: "基于回归的房价预测模型研究", 《全国流通经济》 *

Similar Documents

Publication Publication Date Title
Nie et al. Network traffic prediction based on deep belief network in wireless mesh backbone networks
CN111639787B (zh) 一种基于图卷积网络的时空数据预测方法
WO2018214629A1 (zh) 售电量预测方法及装置、计算机存储介质
US20170261646A1 (en) Self-correcting multi-model numerical rainfall ensemble forecasting method
AU2016325186A1 (en) Bus load forecasting method
CN107292478B (zh) 一种灾害对配电网影响态势的获取方法
CN112285807B (zh) 一种气象信息预测方法及装置
CN111382897A (zh) 台区低压跳闸预测方法、装置、计算机设备及存储介质
CN110782130A (zh) 一种基于多属性决策的区域电压质量综合评估方法
Matzkin Axioms of revealed preference for nonlinear choice sets
CN111538935A (zh) 基于地形特征和多源模式产品的精细化降水融合方法、系统、电子设备及存储介质
CN111882157A (zh) 一种基于深度时空神经网络的需求预测方法、系统及计算机可读存储介质
CN112116265A (zh) 一种电力数据驱动的行业景气指数构建方法
CN114091758A (zh) 一种中短期负荷预测方法、系统以及存储介质
CN114881286A (zh) 一种基于深度学习的短时降水预测方法
CN113506184A (zh) 一种基于台区数据进行的配变负荷预测方法及系统
CN113946796A (zh) 一种基于条件概率高时空分辨率的干旱传播时间计算方法
CN117592593A (zh) 基于改进二次模态分解和WOA优化BILSTM-attention的短期电力负荷预测方法
Pessanha et al. A methodology for joint data cleaning of solar photovoltaic generation and solar irradiation
Cabral et al. Space–time trends and dependence of precipitation extremes in North‐Western Germany
CN116758349A (zh) 基于多尺度超像素节点聚合图卷积残差网络的高光谱图像分类方法
CN109583095B (zh) 基于混合统计动力模型的西北太平洋台风延伸期预报方法
Zhao et al. Do trees grow with the economy? A spatial analysis of the determinants of forest cover change in Sichuan, China
CN111126714A (zh) 基于长租公寓租房场景下的退租预测系统及方法
CN116435984A (zh) 基于图卷积长短期记忆网络的分布式光伏出力预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20211015

RJ01 Rejection of invention patent application after publication