CN116632842B - 基于聚类特性的台区分布式光伏负荷概率预测方法及系统 - Google Patents

基于聚类特性的台区分布式光伏负荷概率预测方法及系统 Download PDF

Info

Publication number
CN116632842B
CN116632842B CN202310919039.2A CN202310919039A CN116632842B CN 116632842 B CN116632842 B CN 116632842B CN 202310919039 A CN202310919039 A CN 202310919039A CN 116632842 B CN116632842 B CN 116632842B
Authority
CN
China
Prior art keywords
load
clustering
distributed photovoltaic
prediction
platform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310919039.2A
Other languages
English (en)
Other versions
CN116632842A (zh
Inventor
梁云丹
黄怡
严莉
赵伟廷
呼海林
张闻彬
常英贤
邵志敏
王高洲
汤琳琳
郑海杰
潘法定
刘函
牛德玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Shandong Electric Power Co Ltd
Information and Telecommunication Branch of State Grid Shandong Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Shandong Electric Power Co Ltd
Information and Telecommunication Branch of State Grid Shandong Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Shandong Electric Power Co Ltd, Information and Telecommunication Branch of State Grid Shandong Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202310919039.2A priority Critical patent/CN116632842B/zh
Publication of CN116632842A publication Critical patent/CN116632842A/zh
Application granted granted Critical
Publication of CN116632842B publication Critical patent/CN116632842B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/003Load forecast, e.g. methods or systems for forecasting future load demand
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/27Regression, e.g. linear or logistic regression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/38Arrangements for parallely feeding a single network by two or more generators, converters or transformers
    • H02J3/381Dispersed generators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2123/00Data types
    • G06F2123/02Data types in the time domain, e.g. time-series data
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/20Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2300/00Systems for supplying or distributing electric power characterised by decentralized, dispersed, or local generation
    • H02J2300/20The dispersed energy generation being of renewable origin
    • H02J2300/22The renewable source being solar energy
    • H02J2300/24The renewable source being solar energy of photovoltaic origin
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Power Engineering (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于电力大数据领域,提供一种基于聚类特性的台区分布式光伏负荷概率预测方法及系统。为解决在空间上粗粒度天气信息限制下,台区分布式光伏负荷点预测精度低的问题,基于聚类特性的台区分布式光伏负荷概率预测方法包括对台区分布式光伏历史负荷进行聚类,确定负荷类别,分别构建一个相匹配的短期负荷预测模型;从台区分布式光伏历史负荷及天气信息中分别提取负荷统计特征及天气特征,利用预先训练好的负荷类别预测模型处理所述负荷统计特征及天气特征,预测出负荷标签;选取相匹配的短期负荷预测模型来对台区分布式光伏历史负荷及天气信息进行处理,得到短期负荷预测值。其能够在空间上粗粒度天气信息的限制下进一步提高负荷预测精度。

Description

基于聚类特性的台区分布式光伏负荷概率预测方法及系统
技术领域
本发明属于电力大数据领域,尤其涉及一种基于聚类特性的台区分布式光伏负荷概率预测方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
由于分布式光伏负荷呈现明显的随机性、波动性,分布式光伏的大范围接入台区对区域电网安全稳定运行带来极大挑战。精准的台区分布式光伏负荷预测可以为电力统筹调度提供数据依据,从而减少对电网安全稳定运行带来的影响。随着企业级数据中台的建设,可获取的数据更加丰富、延时更低。采用大数据分析技术对分布式光伏负荷预测,可以进一步提高预测精度,辅助电力统筹调度,降低电网运行风险。
区别于集中式光伏负荷预测,分布式光伏负荷预测一般缺乏空间上细粒度的气象信息,给分布式光伏负荷预测提供了不小的挑战。目前很多关于分布式光伏负荷预测的研究聚焦于解决气象信息缺失的问题,主要分为:一是获取精确的天气信息,二是采用相似日搜索方法,利用相关气象因素来选择相似日的发电功率来估算输出功率。然而,台区的空间范围是一种不规则的面积,无法用上述网格化插值方法来获取精确的细粒度光照幅度等天气数据。相似日搜索方法则是提取历史数据中与待预测日特征距离最小相似日的光伏功率作为模型输入。使用相似日搜索的方法,对于随机性或者人为因素干扰较强的台区来说,一般无法获得较高的预测精度,而且在空间上粗粒度天气信息限制下,台区分布式光伏负荷点预测精度较低。
发明内容
为了解决上述背景技术中存在的技术问题,本发明提供一种基于聚类特性的台区分布式光伏负荷概率预测方法及系统,其能够在空间上粗粒度天气信息的限制下进一步提高负荷预测精度。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供一种基于聚类特性的台区分布式光伏负荷概率预测方法。
一种基于聚类特性的台区分布式光伏负荷概率预测方法,其包括:
对台区分布式光伏历史负荷进行聚类,确定出负荷类别,并对每一类负荷分别构建一个相匹配的短期负荷预测模型;
从台区分布式光伏历史负荷及天气信息中分别提取负荷统计特征及天气特征,利用预先训练好的负荷类别预测模型处理所述负荷统计特征及天气特征,预测出负荷标签;
基于预测的负荷标签,选取相匹配的短期负荷预测模型来对台区分布式光伏历史负荷及天气信息进行处理,最终得到短期负荷预测值。
作为一种实施方式,所述短期负荷预测模型包括若干个串联的子网络。
作为一种实施方式,每个子网络包括输入全连接层、深度残差网络、分位数回归层和输出全连接层,所述输入全连接层用于将整合输入特征;所述深度残差网络用于学习拟合上一层网络输出的残差;所述分位数回归层用于产生负荷预测概率;所述输出全连接层用于输出负荷预测值。
作为一种实施方式,对台区分布式光伏历史负荷进行聚类之前,还包括预处理操作。
作为一种实施方式,所述深度残差网络包括若干层残差块构成,且从第二层残差块开始,每个残差块的输入是之前残差块遍历组合得到的。
作为一种实施方式,所述预处理操作包括缺失值补全、异常值处理和归一化处理。
作为一种实施方式,在对获取的数据进行负荷聚类的过程中,通过计算每日分布式光伏负荷的相似度,然后根据相似度大小将负荷聚为不同的类别。
作为一种实施方式,所述负荷类别预测模型基于集成学习的决策树框架中的LightGBM算法构建而成。
本发明的第二个方面提供一种基于聚类特性的台区分布式光伏负荷概率预测系统。
一种基于聚类特性的台区分布式光伏负荷概率预测系统,其包括:
符合聚类模块,其用于对台区分布式光伏历史负荷进行聚类,确定出负荷类别,并对每一类负荷分别构建一个相匹配的短期负荷预测模型;
负荷标签预测模块,其用于从台区分布式光伏历史负荷及天气信息中分别提取负荷统计特征及天气特征,利用预先训练好的负荷类别预测模型处理所述负荷统计特征及天气特征,预测出负荷标签;
短期负荷预测模块,其用于基于预测的负荷标签,选取相匹配的短期负荷预测模型来对台区分布式光伏历史负荷及天气信息进行处理,最终得到短期负荷预测值。
作为一种实施方式,所述短期负荷预测模型包括若干个串联的子网络。
作为一种实施方式,每个子网络包括输入全连接层、深度残差网络、分位数回归层和输出全连接层,所述输入全连接层用于将整合输入特征;所述深度残差网络用于学习拟合上一层网络输出的残差;所述分位数回归层用于产生负荷预测概率;所述输出全连接层用于输出负荷预测值。
作为一种实施方式,所述深度残差网络包括若干层残差块构成,且从第二层残差块开始,每个残差块的输入是之前残差块遍历组合得到的。
与现有技术相比,本发明的有益效果是:
(1)本发明将台区分布式光伏历史负荷进行负荷聚类,聚焦于负荷聚类特性分析,深入挖掘负荷在时间维度上的聚类特性作为标签输入模型,在空间上粗粒度天气信息的限制下进一步提高负荷预测精度;
(2)由于待预测日的负荷聚类标签未知,本发明综合历史负荷及天气信息,提出了台区分布式光伏负荷聚类标签预测模型,基于聚类特性分析,本发明采用深度残差网络和分位数回归的组合模型,提出与不同类别负荷一一对应的概率预测模型,基于负荷标签确定出相对应的短期负荷预测模型,进而对台区分布式光伏历史负荷及天气信息进行处理,提高了短期负荷预测值的准确性。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1是本发明实施例的基于聚类特性的台区分布式光伏负荷概率预测方法流程图;
图2是本发明实施例的LightGBM算法模块流程图;
图3是本发明实施例的基于ResNet(Residual Network, 深度残差网络)+QR(quantile regression, 分位数回归)的分布式光伏负荷预测模型图;
图4是本发明实施例的深度残差网络层结构图;
图5是本发明实施例的聚类类别数K与误差平方和的关系图;
图6是本发明实施例的K=3时负荷聚类分析图;
图7是本发明实施例的K=4时负荷聚类分析图;
图8是本发明实施例的K=5时负荷聚类分析图;
图9是本发明实施例所提模型的负荷预测值与真实值对比图;
图10是本发明实施例所提模型的负荷预测区间与真实值对比图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
本发明的目的是提供一种基于聚类特性的台区分布式光伏负荷概率预测方法,提高负荷预测精度。区别于已有方法,本发明综合历史负荷及天气信息,提出了台区分布式光伏负荷聚类标签预测模型。基于聚类特性分析,本发明采用深度残差网络(ResidualNetwork, ResNet)和分位数回归(quantile regression, QR)的组合模型,提出与不同聚类类别负荷一一对应的概率预测模型。
实施例一
如图1所示,本实施例提供了一种基于聚类特性的台区分布式光伏负荷概率预测方法,其具体包括如下步骤:
步骤1:对台区分布式光伏历史负荷进行聚类,确定出负荷类别,并对每一类负荷分别构建一个相匹配的短期负荷预测模型。
其中,历史负荷为与待预测日最邻近M天时间窗口内的负荷数据。
在具体实施过程中,对台区分布式光伏历史负荷进行聚类之前,还包括预处理操作。
通过数据预处理,解决负荷数据中存在缺失值、异常值的问题。同时,为了方便后续模型使用,本实施例对数据进行了归一化处理。
其中,所述预处理操作包括缺失值补全、异常值处理和归一化处理。
具体地,缺失值补全的处理过程如下:
由于分布式光伏负荷与天气信息(尤其是光照幅度、云量等)密切相关,本实施例考虑采用最近邻方法来填补缺失值。该方法的主要思想是计算样本之间的距离,寻找最近邻的K个样本,计算K个样本对应位置非空数值的加权均值来填补缺失的数值,如式(1)~(2)所示。
(1)
(2)
其中,表示样本x的缺失值,/>表示距离目标样本x的最邻近K个样本的集合。表示样本i在填补目标样本缺失值时的权重。权重/>与样本i到目标样本x之间的距离呈反比。距离/>一般可以用欧几里得距离来计算。
具体地,异常值处理的过程如下:
由于采集错误,分布式光伏负荷数据往往明显偏离正常值。针对这类问题,本实施例采用箱线图方法识别负荷数据中的异常值,然后,采用最近邻方法将异常值填补。
具体地,归一化处理的过程如下:
为了方便后续网络进行训练和预测,需对每个特征输入进行最大最小归一化处理,如式(3)所示。
(3)
其中,表示第n个特征输入的数据,/>表示经归一化处理后的特征输入数据。
在具体实施过程中,在对获取的数据进行负荷聚类的过程中,通过计算每日分布式光伏负荷的相似度,然后根据相似度大小将负荷聚为不同的类别。
具体步骤如下:
1)以日为单位,将每天24点台区分布式光伏负荷数据作为一个样本,随机选择K天负荷数据样本作为聚类中心;
2)基于欧式距离,以日为单位计算每个台区分布式负荷数据样本与K个聚类中心之间的相似度,如式(4)所示。
(4)
其中,为负荷数据样本i到聚类中心j的相似度,/>为负荷数据样本i的24点负荷,/>为聚类中心j对应p时刻的负荷,p为负荷数据样本的时刻(以小时为单位,每天共24点)。
3)根据样本与聚类中心之间的相似度,将每个负荷数据样本分配给相似度最高的聚类中心。
4)基于新的分配,按照式(5)重新计算聚类中心。
(5)
其中,为新聚类中心j在p时刻的负荷,/>为分配至第j类的负荷数据样本集合,/>为集合中样本数目。
5)重复步骤2)至步骤4),直至连续两次聚类中心的相似度小于某个阈值为止,相似度计算与式(4)类似。
作为无监督学习方法,K-means算法的关键问题是聚类类别数K的选择。本实施例采用手肘法,根据所有样本的聚类误差来确定聚类类别数K,如式(6)所示。
(6)
SSE表示所有负荷数据样本的聚类误差。聚类类别数K越大,样本划分越精细,误差平方和SSE越小。根据手肘法,SSE的下降幅度会随着K值增大而逐渐减小,SSE下降幅度较大(肘部)对应的K值即合适的聚类数。
步骤2:从台区分布式光伏历史负荷及天气信息中分别提取负荷统计特征及天气特征,利用预先训练好的负荷类别预测模型处理所述负荷统计特征及天气特征,预测出负荷标签。
其中,天气信息包含天气类别(晴、多云、阴、多云转晴/晴转多云、阴转多云/阴转晴等)、温湿度、光照辐射强度等特征。
统计特征为历史负荷时间窗口内的负荷均值、最大值、最小值以及标准差。
在本实施例中,所述负荷类别预测模型基于集成学习的决策树框架中的LightGBM算法构建而成。
与其他监督学习算法相比,LightGBM是一种高效的梯度提升决策树方法,可以满足台区分布式光伏海量数据的分析需求。如图2所示,算法采用梯度单边采样、互斥稀疏特征绑定来进行数据预处理,以减少样本量及其数据量,从而大大缩短模型训练时间。同时,算法使用直方图加速算法和多线程并行,减小内存消耗。为了有效避免过拟合问题,算法采用深度限制的叶子生长策略,有效提升预测准确率。
此处需说明的是,在其他实施例中,负荷类别预测模型也可采用其他算法模型来实现,此处不再详述。
步骤3:基于预测的负荷标签,选取相匹配的短期负荷预测模型来对台区分布式光伏历史负荷及天气信息进行处理,最终得到短期负荷预测值;
其中,所述短期负荷预测模型包括若干个串联的子网络,每个子网络包括输入全连接层、深度残差网络、分位数回归层和输出全连接层,所述输入全连接层用于将整合输入特征;所述深度残差网络用于学习拟合上一层网络输出的残差;所述分位数回归层用于产生负荷预测概率;所述输出全连接层用于输出负荷预测值。
基于负荷聚类特性分析,本实施例可通过优化不同类别负荷对应预测模型的网络参数,从而设计出与负荷类别一一对应的预测模型。模型结构如图3所示。结合深度残差网络和分位数回归方法,本实施例提出了台区分布式光伏短期负荷预测模型。模型的输入层和输出层由完全连接的神经网络层处理。模型中间层采用深度残差网络和分位数回归网络层传递权重。
以预测某台区次日h时的分布式光伏负荷为例,本实施例综合次日24小时负荷预测之间的时序关联性建立台区分布式光伏短期负荷预测模型。即对于h>1,需考虑次日h时前的预测输出。本实施例将次日h时前的预测网络依次连接,作为h时预测模型的输入。这样可以通过模型梯度向后传播来表征次日24小时负荷预测之间的时序关联性,使得模型在给定其余时间的输入和预测值的情况下调整次日每个小时的预测值。
其中,所述深度残差网络包括若干层残差块构成,且从第二层残差块开始,每个残差块的输入是之前残差块遍历组合得到的。
具体地,深度残差网络层旨在解决深层网络的梯度消失和退化问题。不同于一般的卷积神经网络,深度残差网络由一系列残差块构成。
每个残差块通过学习拟合上一层网络输出的残差,如式(7)所示。
(7)
其中,x表示每个残差块的输入,H(x)表示每个残差块的输出。表示残差块的权重参数。F(.)表示残差映射函数。
如图4所示,为了进一步提高深度残差网络的学习能力,本实施例考虑增加中间层残差块到后续层残差块的连接。从第二层开始,每个残差块的输入是之前残差块遍历组合得到的,如式(8)所示。
(8)
其中,和/>分别是深度残差网络的输入和输出。/>表示第/>个残差块的输入,/>表示第/>个残差块的权重参数。K为残差块的个数。
经过遍历组合前面残差块来作为下一残差块的输入,深度残差网络将会有更密集的残差连接,从而可以提高网络对特征的表示和损失反向传播的效率。综合考虑训练准确性和速度,定义损失函数如式(9)所示。
(9)
其中,为预测值与真实值之间的平均相对误差。/>为惩罚项。当预测值超出一定范围时对训练进行惩罚,使之摆脱训练异常并快速收敛。/>和/>的计算分别如式(10)和式(11)所示。
(10)
(11)
其中,表示预测值,/>表示真实值。
本实施例采用分位数回归方法实现台区分布式光伏负荷概率预测。分位数回归方法由Koenker和 Bassett提出。其主要设计理念是对损失函数进行改进,表征输入变量X与因变量Y的条件分位数之间的关系,数学描述如下。
假设随机变量的分布函数为/>。其分位数可以表示为式(12)。
(12)
其中,为满足/>的自变量最小值,/>为分位数,取值位于0-1内。假定样本序列满足分位数回归模型,其方程为
(13)
其中,为分位数回归系数,随着分位数/>的变化而变化。/>为随机变量。分位数回归的关键在于找到合适的/>,满足如式(14)所示
(14)
其中,为优化目标函数,具体表示为式(15)所示。
(15)
因此,分位数回归融合残差网络模型的损失函数可以定义为式(16)所示
(16)
其中,表示预测值,/>表示网络权重参数。
基于数据中台,本实施例获取山东省某市某台区分布式光伏负荷和当地天气数据作为原始数据集,时间范围为2022年1月1日至2022年5月10日。负荷数据分辨率为一小时,即每天24个点负荷数据。天气数据包含天气类别、光照辐射强度、温度、湿度、气压等字段信息。其中,天气类别信息以日为分辨率,其余字段信息以小时为分辨率。选取2022年5月4日至10日共计7天的数据作为测试集,用于验证模型的负荷预测效果,其余数据作为训练集。
本实施例采用网格搜索法确定LightGBM的最优组合参数,其初始参数设置为:基学习器的数量为256,最大叶子数为20,树深度为8,引入正则项的L1系数为0.8。所提预测模型输入层与输出层分别采用一层(128个神经元)、一层(24个神经元)全连接网络搭建。深度残差层模型输入大小为24,每个残差块包含20个隐藏节点。分位数回归层由128个神经元组成,损失函数分别设置不同的分位点。所有神经元使用缩放指数线性单元(SeLU)作为激活函数。模型使用Adam优化器进行训练。实验硬件配置为Intel Core i7-10700 CPU+8GB内存,软件配置为Python 3.6+Keras 2.1.6+Tensorflow 1.5.0
本实施例从点预测和概率预测两个方面评估模型预测效果。点预测方面,本实施例分别采用平均绝对误差(Mean Absolute Error, MAE)和均方根误差(Root MeanSquared Error, RMSE)作为负荷预测精度的评价指标。MAE与RMSE分别可以反映预测的绝对误差平均值与标准偏差。两者值越小,表明模型的预测性能越好。
为了衡量概率预测的预测效果,本实施例采用预测区间覆盖率、预测区间平均相对宽度、预测平均误差三种评价指标,其计算如下。
预测区间覆盖率计算如式(17)所示。
(17)
其中,为预测区间覆盖率,/>为所预测的数据个数,/>为第i个预测数据所对应的真实值,/>分别为预测区间的下限和上限。/>值越大,说明更多的实际负荷位于预测区间内,即预测效果越好。
预测区间平均相对宽度计算如式(18)所示。
(18)
其中,为预测区间平均相对宽度,/>分别为真实值的最大值和最小值。值越小,预测区间更贴近真实值,即预测效果越好。
预测平均误差计算如式(19)所示。
(19)
其中,为预测区间平均相对宽度。若真实值在预测区间内,则区间误差为零;若真实值不在预测区间内,则计算真实值到预测区间之间的相对距离。
图5展示了负荷聚类类别数K与对应误差平方和SSE之间的关系。由图5可知,SSE的下降幅度会随着聚类类别数K值增大而逐渐减小,且K值为3~5时SSE下降幅度较大。因此,本实施例可选择的聚类类别数K为3~5。
图6至图8分别展示了聚类类别数K为3、4、5时聚类后每一类对应的24点负荷曲线。经过对比,K=3时聚类后每一类负荷的峰值不同,K=4、5时聚类后每一类负荷的峰值以及峰值到达的时刻不同。与图7相比,图8的负荷聚类更为精细,能挖掘到聚类负荷更细致的特征。因此,本实施例选择聚类类别数为5。
图9对比了2022年5月4日至10日的台区分布式光伏24点负荷真实值和本实施例所提模型的预测值曲线。由图9可知,本实施例所提预测模型能很好贴近真实值,尤其是在峰谷等负荷变化较大的时段也能准确预测出负荷的变化规律。
表1对比了不同模型的台区分布式光伏负荷预测性能。所选取的预测时间范围为2022年5月4日至10日。所对比的模型包括SVR、XGBoost、CNN、GRU、LSTM、基于LSTM+CNN的组合预测方法和基于GRU+CNN的组合预测方法所提模型。其中,SVR、XGBoost、CNN、GRU、LSTM输入特征为历史负荷数据和天气信息。可以发现,本实施例所提模型相较于其他模型在MAE和RMSE方面均具有更好的预测性能。
表1不同模型点预测的实验结果
图10展示了2022年5月4日至11日的台区分布式光伏24点负荷真实值以及本实施例所提模型在不同置信概率下的预测区间。从图10可以看出,在负荷波动缓和部分和剧烈部分分别有较小和较大的预测区间。表2展示了在2022年5月4日至11日内本实施例所提模型在不同置信概率下每日预测的预测覆盖率、区间宽度以及误差。从表2可以看出,不同置信概率对应不同的预测覆盖率、区间宽度以及误差。置信概率越高,预测覆盖率越高,预测区间宽度越大,预测误差越大。
表2不同置信概率下的预测性能
表3对比了2022年5月4日至11日内不同模型下不同置信概率对应的平均预测性能。可以发现,与采用贝叶斯网络进行概率预测对比,本实施例所提模型有较高的预测覆盖率和较小的预测误差,同时本实施例所提模型的预测区间宽度较小,可以为调度系统决策提供更为精准的分布式光伏负荷预测数据。
表3概率预测下不同模型的预测性能
本实施例基于分布式光伏相似日特点,分析聚类特性,采用深度残差网络和分位数回归的组合方法,建立的台区分布式光伏负荷概率预测模型。与已有模型相比,本实施例所提的模型在点预测方面具有较小的平均绝对误差和均方根误差;区别于已有模型,本实施例所提的模型在概率预测方面具有较小的预测区间宽度和预测误差以及较高的预测覆盖率。
实施例二
本实施例提供了一种基于聚类特性的台区分布式光伏负荷概率预测系统,其具体包括如下模块:
符合聚类模块,其用于对台区分布式光伏历史负荷进行聚类,确定出负荷类别,并对每一类负荷分别构建一个相匹配的短期负荷预测模型;
负荷标签预测模块,其用于从台区分布式光伏历史负荷及天气信息中分别提取负荷统计特征及天气特征,利用预先训练好的负荷类别预测模型处理所述负荷统计特征及天气特征,预测出负荷标签;
短期负荷预测模块,其用于基于预测的负荷标签,选取相匹配的短期负荷预测模型来对台区分布式光伏历史负荷及天气信息进行处理,最终得到短期负荷预测值。
其中,所述短期负荷预测模型包括若干个串联的子网络,每个子网络包括输入全连接层、深度残差网络、分位数回归层和输出全连接层,所述输入全连接层用于将输入的特征进行整合;所述深度残差网络用于防止训练过拟合现象出现;分位数回归层用于产生负荷预测概率;输出全连接层用于输出负荷预测值。
在一个或多个实施例中,所述基于聚类特性的台区分布式光伏负荷概率预测系统,还包括:
预处理模块,其用于对台区分布式光伏历史负荷进行聚类之前进行预处理操作;其中,所述预处理操作包括缺失值补全、异常值处理和归一化处理。
此处需要说明的是,本实施例中的各个模块与实施例一中的各个步骤一一对应,其具体实施过程相同,此处不再累述。
实施例三
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的基于聚类特性的台区分布式光伏负荷概率预测方法中的步骤。
实施例四
本实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的基于聚类特性的台区分布式光伏负荷概率预测方法中的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种基于聚类特性的台区分布式光伏负荷概率预测方法,其特征在于,包括:
对台区分布式光伏历史负荷进行聚类,确定出负荷类别,并对每一类负荷分别构建一个相匹配的短期负荷预测模型;
所述短期负荷预测模型包括若干个串联的子网络;每个子网络包括输入全连接层、深度残差网络、分位数回归层和输出全连接层;所述输入全连接层用于将整合输入特征;所述深度残差网络用于学习拟合上一层网络输出的残差;所述分位数回归层用于产生负荷预测概率;所述输出全连接层用于输出负荷预测值;所述深度残差网络包括若干层残差块构成,且从第二层残差块开始,每个残差块的输入是之前残差块遍历组合得到的;
其中,和/>分别是深度残差网络的输入和输出,/>表示第/>个残差块的输入,表示第/>个残差块的权重参数,K为残差块的个数;
在具体实施过程中,在对获取的数据进行负荷聚类的过程中,通过计算每日分布式光伏负荷的相似度,然后根据相似度大小将负荷聚为不同的类别,具体步骤如下:
1)以日为单位,将每天24点台区分布式光伏负荷数据作为一个样本,随机选择K天负荷数据样本作为聚类中心;
2)基于欧式距离,计算每个台区分布式负荷数据样本与K个聚类中心之间的相似度,如式所示:
其中,为负荷数据样本i到聚类中心j的相似度,/>为负荷数据样本i的24点负荷,/>为聚类中心j对应p时刻的负荷,p为负荷数据样本的时刻;
3)根据样本与聚类中心之间的相似度,将每个负荷数据样本分配给相似度最高的聚类中心;
4)基于新的分配,重新计算聚类中心:
其中,为新聚类中心j在p时刻的负荷,/>为分配至第j类的负荷数据样本集合,为集合中样本数目;
5)重复步骤2)至步骤4),直至连续两次聚类中心的相似度小于某个阈值为止;
在对获取的数据进行负荷聚类的过程中,通过计算每日分布式光伏负荷的相似度,然后根据相似度大小将负荷聚为不同的类别;其中,关键问题是聚类类别数K的选择,通过采用手肘法,根据所有样本的聚类误差来确定聚类类别数K:
SSE表示所有负荷数据样本的聚类误差,聚类类别数K越大,样本划分越精细,误差平方和SSE越小,根据手肘法,SSE的下降幅度会随着K值增大而逐渐减小,SSE下降幅度较大肘部对应的K值即合适的聚类数;
从台区分布式光伏历史负荷及天气信息中分别提取负荷统计特征及天气特征,利用预先训练好的负荷类别预测模型处理所述负荷统计特征及天气特征,预测出负荷标签;
其中,所述负荷类别预测模型基于集成学习的决策树框架中的LightGBM算法构建而成;
基于预测的负荷标签,选取相匹配的短期负荷预测模型来对台区分布式光伏历史负荷及天气信息进行处理,最终得到短期负荷预测值。
2.如权利要求1所述的基于聚类特性的台区分布式光伏负荷概率预测方法,其特征在于,对台区分布式光伏历史负荷进行聚类之前,还包括预处理操作;所述预处理操作包括缺失值补全、异常值处理和归一化处理。
3.一种基于聚类特性的台区分布式光伏负荷概率预测系统,用于实现如权利要求1-2任一项权利要求所述的基于聚类特性的台区分布式光伏负荷概率预测方法,其特征在于,包括:
负荷聚类模块,其用于对台区分布式光伏历史负荷进行聚类,确定出负荷类别,并对每一类负荷分别构建一个相匹配的短期负荷预测模型;
负荷标签预测模块,其用于从台区分布式光伏历史负荷及天气信息中分别提取负荷统计特征及天气特征,利用预先训练好的负荷类别预测模型处理所述负荷统计特征及天气特征,预测出负荷标签;
短期负荷预测模块,其用于基于预测的负荷标签,选取相匹配的短期负荷预测模型来对台区分布式光伏历史负荷及天气信息进行处理,最终得到短期负荷预测值。
CN202310919039.2A 2023-07-26 2023-07-26 基于聚类特性的台区分布式光伏负荷概率预测方法及系统 Active CN116632842B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310919039.2A CN116632842B (zh) 2023-07-26 2023-07-26 基于聚类特性的台区分布式光伏负荷概率预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310919039.2A CN116632842B (zh) 2023-07-26 2023-07-26 基于聚类特性的台区分布式光伏负荷概率预测方法及系统

Publications (2)

Publication Number Publication Date
CN116632842A CN116632842A (zh) 2023-08-22
CN116632842B true CN116632842B (zh) 2023-11-10

Family

ID=87597710

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310919039.2A Active CN116632842B (zh) 2023-07-26 2023-07-26 基于聚类特性的台区分布式光伏负荷概率预测方法及系统

Country Status (1)

Country Link
CN (1) CN116632842B (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110929954A (zh) * 2019-12-05 2020-03-27 中国南方电网有限责任公司 负荷预测方法、装置、计算机设备和存储介质
CN110991700A (zh) * 2019-11-08 2020-04-10 北京博望华科科技有限公司 基于深度学习改进的天气与用电相关性预测方法及装置
WO2020239824A1 (en) * 2019-05-27 2020-12-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method, apparatus and computer program for training deep networks
CN112488395A (zh) * 2020-12-01 2021-03-12 湖南大学 一种配电网线损预测方法及系统
CN112508275A (zh) * 2020-12-07 2021-03-16 国网湖南省电力有限公司 一种基于聚类和趋势指标的配电网线路负荷预测方法和设备
CN112966970A (zh) * 2021-03-30 2021-06-15 国网冀北电力有限公司 一种基于Canopy-Kmedoids算法的台区线损数据处理方法、装置、介质
CN114091776A (zh) * 2021-11-29 2022-02-25 国网河南省电力公司经济技术研究院 一种基于K-means的多分支AGCNN短期电力负荷预测方法
CN114186733A (zh) * 2021-12-09 2022-03-15 国网四川省电力公司 一种短期负荷预测方法和装置
CN114722873A (zh) * 2022-04-14 2022-07-08 湘潭大学 一种基于残差卷积和注意力机制的非侵入式负荷分解方法
CN114881347A (zh) * 2022-05-25 2022-08-09 浙江能源天然气集团有限公司 一种采用加权残差聚类的天然气负荷预测区间估计方法
CN115549082A (zh) * 2022-10-26 2022-12-30 国网吉林省电力有限公司经济技术研究院 基于负荷挖掘和lstm神经网络的电力负荷预测方法
WO2023010759A1 (zh) * 2021-08-04 2023-02-09 国网江苏省电力有限公司南通供电分公司 基于配售电竞争态势下区域配电网网格化负荷区间预测方法
WO2023088212A1 (zh) * 2021-11-16 2023-05-25 西安热工研究院有限公司 一种基于集成学习的在线机组负荷预测方法
CN116307250A (zh) * 2023-04-07 2023-06-23 山东鲁软数字科技有限公司 一种基于典型日特征选择的短期负荷预测方法及系统

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020239824A1 (en) * 2019-05-27 2020-12-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method, apparatus and computer program for training deep networks
CN110991700A (zh) * 2019-11-08 2020-04-10 北京博望华科科技有限公司 基于深度学习改进的天气与用电相关性预测方法及装置
CN110929954A (zh) * 2019-12-05 2020-03-27 中国南方电网有限责任公司 负荷预测方法、装置、计算机设备和存储介质
CN112488395A (zh) * 2020-12-01 2021-03-12 湖南大学 一种配电网线损预测方法及系统
CN112508275A (zh) * 2020-12-07 2021-03-16 国网湖南省电力有限公司 一种基于聚类和趋势指标的配电网线路负荷预测方法和设备
CN112966970A (zh) * 2021-03-30 2021-06-15 国网冀北电力有限公司 一种基于Canopy-Kmedoids算法的台区线损数据处理方法、装置、介质
WO2023010759A1 (zh) * 2021-08-04 2023-02-09 国网江苏省电力有限公司南通供电分公司 基于配售电竞争态势下区域配电网网格化负荷区间预测方法
WO2023088212A1 (zh) * 2021-11-16 2023-05-25 西安热工研究院有限公司 一种基于集成学习的在线机组负荷预测方法
CN114091776A (zh) * 2021-11-29 2022-02-25 国网河南省电力公司经济技术研究院 一种基于K-means的多分支AGCNN短期电力负荷预测方法
CN114186733A (zh) * 2021-12-09 2022-03-15 国网四川省电力公司 一种短期负荷预测方法和装置
CN114722873A (zh) * 2022-04-14 2022-07-08 湘潭大学 一种基于残差卷积和注意力机制的非侵入式负荷分解方法
CN114881347A (zh) * 2022-05-25 2022-08-09 浙江能源天然气集团有限公司 一种采用加权残差聚类的天然气负荷预测区间估计方法
CN115549082A (zh) * 2022-10-26 2022-12-30 国网吉林省电力有限公司经济技术研究院 基于负荷挖掘和lstm神经网络的电力负荷预测方法
CN116307250A (zh) * 2023-04-07 2023-06-23 山东鲁软数字科技有限公司 一种基于典型日特征选择的短期负荷预测方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Load Forecasting Based on Improved K-means Clustering Algorithm;Wang Yanbo等;《2018 China International Conference on Electricity Distribution (CICED)》;全文 *
考虑用户用电行为聚类的电力负荷预测方法;黄薇等;《计算机仿真》;39卷(12期);全文 *

Also Published As

Publication number Publication date
CN116632842A (zh) 2023-08-22

Similar Documents

Publication Publication Date Title
Tang et al. Short‐term power load forecasting based on multi‐layer bidirectional recurrent neural network
Wang et al. Deep belief network based k-means cluster approach for short-term wind power forecasting
CN109063911B (zh) 一种基于门控循环单元网络的负荷聚合体分组预测方法
CN109754113B (zh) 基于动态时间规整与长短时间记忆的负荷预测方法
CN110969290B (zh) 一种基于深度学习的径流概率预测方法及系统
CN110674999A (zh) 基于改进聚类和长短期记忆深度学习的小区负荷预测方法
CN112116144B (zh) 一种区域配电网短期负荷预测方法
Dou et al. Hybrid model for renewable energy and loads prediction based on data mining and variational mode decomposition
Li et al. An integrated missing-data tolerant model for probabilistic PV power generation forecasting
CN106251001A (zh) 一种基于改进模糊聚类算法的光伏功率预测方法
CN116596044B (zh) 基于多源数据的发电负荷预测模型训练方法及装置
CN117498400B (zh) 一种分布式光伏与储能数据的处理方法及系统
CN114792156A (zh) 基于曲线特征指标聚类的光伏输出功率预测方法和系统
CN113554466A (zh) 一种短期用电量预测模型构建方法、预测方法和装置
CN111311001B (zh) 基于DBSCAN算法和特征选择的Bi-LSTM网络短期负荷预测方法
CN114298377A (zh) 一种基于改进极限学习机的光伏发电预测方法
CN115204698A (zh) 一种低压台区供电稳定性的实时分析方法
CN113780679B (zh) 一种基于泛在电力物联网的负荷预测方法及装置
CN114358449A (zh) 基于图神经网络的电动汽车充电负荷时空分布预测方法
CN110335160A (zh) 一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法及系统
CN116826710A (zh) 基于负荷预测的削峰策略推荐方法、装置及存储介质
CN117034762A (zh) 一种基于多算法加权和的复合模型锂电池寿命预测方法
CN115481788B (zh) 相变储能系统负荷预测方法及系统
CN116632842B (zh) 基于聚类特性的台区分布式光伏负荷概率预测方法及系统
CN116307111A (zh) 一种基于k均值聚类和随机森林算法的无功负荷预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant