CN115600729A - 一种考虑多属性网格电网负荷预测方法 - Google Patents

一种考虑多属性网格电网负荷预测方法 Download PDF

Info

Publication number
CN115600729A
CN115600729A CN202211181228.6A CN202211181228A CN115600729A CN 115600729 A CN115600729 A CN 115600729A CN 202211181228 A CN202211181228 A CN 202211181228A CN 115600729 A CN115600729 A CN 115600729A
Authority
CN
China
Prior art keywords
grid
data
load
clustering
power grid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211181228.6A
Other languages
English (en)
Inventor
张玉鸿
王超
周英
万明勇
陈晋勇
李倩
王倩
胡林
杨玺
刘函菁
罗皓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Sichuan Economic Research Institute
Original Assignee
State Grid Sichuan Economic Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Sichuan Economic Research Institute filed Critical State Grid Sichuan Economic Research Institute
Priority to CN202211181228.6A priority Critical patent/CN115600729A/zh
Publication of CN115600729A publication Critical patent/CN115600729A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/003Load forecast, e.g. methods or systems for forecasting future load demand
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/10Power transmission or distribution systems management focussing at grid-level, e.g. load flow analysis, node profile computation, meshed network optimisation, active network management or spinning reserve management
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/20Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Abstract

本发明涉及地区电网负荷精准确定技术领域,公开了一种考虑多属性网格电网负荷预测方法,包括:S1、识别影响地区电网负荷的影响要素,将地区电网分为不同的网格,并收集日前不同的网格电网的要素对电网负荷影响的数据,形成不同的网格电网的数据多域集;S2、对不同的网格电网的所述数据多域集进行整理;S3、针对日前的不同的网格电网数据集合进行聚类分析,得到日前的不同的网格的电网负荷的特性差异的聚类结果;S4、结合S3得到的聚类结果,基于前馈神经网络的概率负荷预测方法对日后的每个区块电网的负荷进行单独预测,然后再汇总到上层形成整个地区的概率负荷预测结果。本发明充分考量不同类型电网的特性,保证了负荷需求的预测结果科学合理。

Description

一种考虑多属性网格电网负荷预测方法
技术领域
本发明涉及地区电网负荷精准确定技术领域,具体涉及一种考虑多属性网格电网负荷预测方法。
背景技术
电力工业是国民经济的基础产业,电网企业投资策略的科学性、合理性是企业管理策略研究的核心内容之一。当前经济社会发展与内外部环境变化,给电网公司经营带来了严峻挑战。受宏观经济下行、负荷增速趋缓、电价空间收窄、国家出台阶段性降低用电成本政策等多重因素影响,公司盈利水平大幅下降,负债率维持高位运行,电网经营发展出现拐点,经营压力前所未有。因此结合负荷需求的增长,科学合理的确定投资规模,优化投资策略是重中之重,通过系统分析结合区域发展现状,结合不同类型预测方法,精准确定负荷需求,能够为资源的科学合理配置提供辅助决策支撑,实现投入产出成效清晰化、投资安排科学合理化、业务管理精益化。
目前,当前主要的区域电网负荷预测方法主要为传统预测方法和智能预测方法。传统预测方法主要有时间序列、回归模型、趋势外推等方法;智能预测方法主要有神经网络、支持向量机等。传统预测方法模型较为简单、模型的参数固定,难以对突变的负荷进行解释。以神经网络为代表的智能预测方法能够实现线性、非线性的复杂映射,目前应用较为广泛。但是,不管是传统预测方法还是智能预测方法,均未考虑不同区域电网特点,没有充分结合网格划分原理,结合不同类型电网负荷累加形成区域负荷预测结果,科学性与精准性不足。
发明内容
针对上述问题,本发明提供一种考虑多属性网格电网负荷预测方法,有效避免了相关方法模型单一的影响,充分考量不同类型电网的特性,保证了负荷需求的预测结果科学合理,提高其对智能电网的整体认知,为电网的下一步优化方案提供依据,在电网规划中具有重要意义。
本发明通过下述技术方案实现:
一种考虑多属性网格电网负荷预测方法,包括:
S1、识别影响地区电网负荷的影响要素,结合网格划分原则,将地区电网分为不同的网格,并收集日前不同的网格电网的要素对电网负荷影响的数据,形成不同的网格电网的数据多域集;
S2、对不同的网格电网的所述数据多域集进行整理,以形成不同的网格电网数据集合;
S3、基于聚类方法,针对日前的不同的网格电网数据集合进行聚类分析,将不同的网格电网划分成电网区块,得到日前的不同的网格的电网负荷的特性差异的聚类结果;
S4、结合S3得到的聚类结果,基于前馈神经网络的概率负荷预测方法对日后划分出来的每个区块电网的负荷进行单独预测,然后再将对每个网格电网的负荷进行单独预测的结果汇总到上层形成整个地区的概率负荷预测结果。
作为优化,所述影响要素包括经济要素、社会要素和电网运行要素。
作为优化,S2中,对所述数据多域集进行整理的具体方法包括:剔除异常的数据值、补充缺失的数据值以及删除重复的数据值中的其中一种或多种。
作为优化,采用基于重复模拟的缺失值处理法对缺失值进行处理,即从一个包含缺失值的数据多域集中采用蒙特卡洛方法来填补计算得到的缺失值,从而生成一组完整的数据多域集。
作为优化,估计缺失的所述数据值的具体方法为:
A1、接收连续的数据向量集QYc=[QY1,QY2,....,QYn],其中,所述数据向量集中的某一数据向量即为某一网格电网的数据多域集,所述数据向量集QYc包括完整数据向量QYwz和缺失数据向量QYqs,n为该数据向量集中的数据向量的数量,即数据多域集的数量;
A2、针对所述数据向量集中的第i项数据向量QY(i)=[Qyi(1),Qyi(2),.....,Qyi(D)],i∈[1, n],D为第i项数据向量中的样本数,设定高斯模型,其中所述高斯模型的参数空间为θ,将每个所述数据向量与对应的高斯模型的参数空间结合形成马尔科夫链,并根据所述参数空间θ的估计值θg计算所述数据向量集中的缺失数据发生的概率p(QYqs丨QYwz,θg);
A3、根据当前的完整数据向量与缺失数据向量的估计值计算所述参数空间θ的发生概率
Figure BDA0003866878400000021
并且重复该步骤对高斯模型的参数空间θ的估计值进行更新,直到得到的马尔科夫链
Figure BDA0003866878400000022
收敛时,估计缺失的所述数据值大小;
A4、缺失的所述数据值的计算公式为:
Figure BDA0003866878400000023
其中Nsample为数据向量中的总样本数量,NBurn-in为数据向量中的缺失样本数量,
Figure BDA0003866878400000024
为缺失的数据值的大小,
Figure BDA0003866878400000025
为第t项样本的缺失的数据值的大小。
作为优化,S3中,采用公平层次聚类法对网格电网进行分类,具体步骤为:
S3.1、将每个网格定义为样本,并将所述样本视为单个簇,计算各个样本之间的欧氏距离作为初始度量矩阵;
S3.2、计算本次参与聚类的所有簇的标准化基尼系数,判断是否大于设定的阈值;
S3.3、若标准化基尼系数小于设定的阈值,则采用不包含公平指标的单链接标准计算簇之间的度量距离,若标准化基尼系数大于阈值,则采用包含公平指标的单链接标准计算簇之间的度量距离;
S3.4、将度量距离最近的两个簇合并,成为新集合,并返回步骤S3.2;
S3.5、重复S3.2-S3.4,直到聚类结束,输出聚类结果。
作为优化,所述公平指标为:
Figure BDA0003866878400000031
其中,G(C(k))为第k次聚类的标准化基尼系数,
Figure BDA0003866878400000032
为基尼系数,其含义为在参与本次聚类的所有簇中,除去第p个簇后其他的所有簇构成的集合;
Figure BDA0003866878400000033
表示第k次聚类时,在参与本次聚类的所有簇中,除去第P个簇后的标准化基尼系数。
作为优化,包含公平指标的单链接标准为:
Figure BDA0003866878400000034
其中,n为簇的数量,
Figure BDA0003866878400000035
表示第k次聚类时,在参与本次聚类的所有簇中,除去第 P个簇后的标准化基尼系数,ci、cj分别为第i个簇和第j个簇。
作为优化,两个簇之间的最小度量距离为:
Figure BDA0003866878400000036
其中,
Figure BDA0003866878400000037
分别为第ci个簇和第cj个簇对应的公平指标,dist(x1,x2)为样本x1、样本x2之间的欧氏距离。
作为优化,还包括S5,根据整个地区的概率负荷预测结果,指导对该地区的投资规划。
本发明与现有技术相比,具有如下的优点和有益效果:
本发明首先对影响地区电网负荷的影响要素进行识别与分析,并对地区电网划分网格,进一步针对相应指标进行数据收集,然后结合相应方法对数据进行处理,构建不同的网格电网数据集合;进一步结合网格电网聚类,提出基于前馈神经网络的负荷预测方法,最后叠加形成区域的负荷预测结果,以助于投资规划的科学性与合理性,支撑投资科学决策。
附图说明
为了更清楚地说明本发明示例性实施方式的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。在附图中:
图1为本发明所述的一种考虑多属性网格电网负荷预测方法的流程图;
图2为前馈神经网络的结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例
一种考虑多属性网格电网负荷预测方法,包括:
S1、识别影响地区电网负荷的影响要素,结合网格划分原则,将地区电网分为不同的网格(电网的最小管理单元是网格,也就是区域下还会分不同的网格),并收集日前不同的网格电网的要素对电网负荷影响的数据,形成不同的网格电网的数据多域集。网格划分原则为:供电区域是依据地区行政级别及负荷发展情况,参考经济发达程度、用户重要性、用电水平、 GDP等因素,参照《配电网规划设计技术导则》技术标准要求,划定的条件相似的供电范围,分为A+、A、B、C、D、E六类。划分网格的好处是能够精确管理,提升管理细度。数据多域集是指某一网格电网中各要素对电网负荷的影响数据的集合。
结合负荷产生的实际特点,采用鱼骨图方法,对负荷的影响要素进行识别与分析。
具体的,影响要素包括经济要素、社会要素和电网运行要素。即结合鱼骨图方法,从社会、经济、自然等直接、间接方面对影响要素进行识别,为后续模型构建提供支撑与参考。
鱼骨图的应用分为两个步骤,一是分析因素,二是绘制鱼骨图。
(1)分析因素:
1)针对研究对象,选择分类方式,即大要因;
2)运用头脑风暴法、德尔菲法等分别找出各类大要因中所有可能的因素;
3)将因素进行整理,明确各因素的属性;
4)将因素进行简洁地描述;
(2)绘制鱼骨图:
目前很多专门的软件都可以用来绘制鱼骨图,如visio、XMind等。在Word和Excel中也可以绘制简单的鱼骨图。绘制方法如下:
将要研究的问题标识在鱼头上;
画出大骨,填写大要因;
在大骨上延伸出中骨、小骨,分别填写中要因、小要因;
如必要,对特殊因素进行简要说明,重要因素要用特殊符号标明。
大要因1:经济要素
中要因:
1.1、经济总量
经济总量是指在当前社会生产力情况下,经济整体运行状况的经济变量,是从经济总体的角度来看的经济变量,受经济波动的影响,电力需求亦表现出明显的波动性,GDP与电力消费之间存在着显著且稳定的正相关关系。
1.2、经济结构
经济结构是指指国民经济的组成和构造,经济结构是一个由许多系统构成的多层次、多因素的复合体,经济结构状况是衡量国家和地区经济发展水平的重要尺度,一般以工业为主的第二产业比重越大,电力需求也就越大,随着经济结构逐步调整,电力消费的弹性系数也会发生变化。
1.3、经济布局
经济布局指生产力布局、科技布局和流通布局的总和,也就是指生产力、商品流通、科技发展在空间的配置,经济布局影响到该地区的产业发展及升级情况,会间接对电网需求的发展产生影响。
大要因2:电网运行要素
中要因:
2.1、供电面积
供电面积是指某区域内电力系统所能覆盖的供电范围。供电面积的覆盖范围会直接驱动该区域内电力建设项目的实施,从而影响电力系统发展建设需求。
2.2、气象条件
气象条件包括气压、温度、降水量、相对湿度、风速、风向、日期类型等。
大要因3:社会要素
中要因:
3.1、居民收入与消费水准
经相关调研结果可知,居民可支配收入越低,则相应居民生活中的用电量也会变低,这反映了居民收入和用电量有着显著的正相关关系,居民的收入高低对人均用电量有直接影响。
3.2、人口规模
人口和经济之间存在紧密关联性,两者之间相互约束且相互影响。根据发达国家与城市电力负荷在饱和阶段的人口规模特征相关研究可知,在某个地区的社会经济处于饱和情况下,电力负荷也会随之进入较为稳定且缓慢的阶段,当人口规模保持较为稳定的状态之前,负荷与人口总量均经历了一个快速发展的阶段。
要素具体影响电网负荷的值是多少,可以进行人为定义,这里就不再赘述了。
S2、对不同的网格电网的所述数据多域集进行整理,以形成不同的网格电网数据集合。
本实施例中,对所述数据多域集进行整理的具体方法包括:剔除异常的数据值、补充缺失的数据值以及删除重复的数据值中的其中一种或多种。
一是结合相关实际要求构建数据缺失值、异常值、重复值处理模型;二是通过集成、变换手段针对数据多域集的数据开展合理有效的处理;三是以粒子群聚类算法为基础,对于数据多域集中的离群样本开展有效判断以及合理消除。首先结合数据收集情况对数据多域集中的数据进行预处理,其中包括缺失值处理、异常值处理、重复值处理。例如地区面积基本信息数据,出现了两条完全一样的,确定为数据重复,直接删除其中一条数据;针对某地区负荷数据,由于统计问题,出现数据缺失,其中缺失值处理采用基于重复模拟的缺失值处理法,即利用变量均值向量和方差-协方差阵作为先验信息,构建马尔科夫链,保证其元素的分布可以收敛到一个平稳分布,通过抽样反复模拟该马尔科夫链,得到平稳的后验分布,产生缺失数据的估计。即从一个包含缺失值的数据多域集中采用蒙特卡洛方法来填补计算得到的缺失值,从而生成一组完整的数据多域集,每个数据多域集中的缺失数据用蒙特卡洛方法来填补。
基于重复模拟的缺失值处理法产生缺失数据的估计的具体步骤为:
A1、接收连续的数据向量集QYc=[QY1,QY2,....,QYn],QYc包括实际数据QYwz和缺失数据 QYqs,其中,所述数据向量集中的某一数据向量即为某一网格电网的数据多域集,数据向量集包含了内部数据以及外部数据(即前述的影响要素),例如以线路电压缺失数据为例,其中第i个数据向量(即线路电压)可以表示为QY(i)=[Qyi(1),Qyi(2),.....,Qyi(D)],i∈[1,n],所述数据向量集QYc包括完整数据向量QYwz和缺失数据向量QYqs,n为该数据向量集中的数据向量的数量,即数据多域集的数量;
A2、针对所述数据向量集中的第i项数据向量QY(i)=[Qyi(1),Qyi(2),.....,Qyi(D)],i∈[1, n],D为第i项数据向量中的样本数,设定高斯模型,其中所述高斯模型的参数空间为θ,将每个所述数据向量与对应的高斯模型的参数空间结合形成马尔科夫链,并根据所述参数空间θ的估计值θg计算所述数据向量集中的缺失数据发生的概率p(QYqs丨QYwz,θg);
A3、根据当前的完整数据向量与缺失数据向量的估计值计算所述参数空间θ的发生概率
Figure BDA0003866878400000071
并且重复该步骤对高斯模型的参数空间θ的估计值进行更新,直到得到的马尔科夫链
Figure BDA0003866878400000072
收敛时,估计缺失的所述数据值大小,g为估计值对应的更新次数;
A4、缺失的所述数据值的计算公式为:
Figure BDA0003866878400000073
其中Nsample为数据向量中的总样本数量,NBurn-in为数据向量中的缺失样本数量,
Figure BDA0003866878400000074
为缺失的数据值的大小,
Figure BDA0003866878400000075
为第t项样本的缺失的数据值的大小。
S3、基于聚类方法,针对日前的不同的网格电网数据集合进行聚类分析,将不同的网格电网划分成电网区块,得到日前不同的网格的电网负荷的特性差异的聚类结果。
为了得到更为精准的日后的预测结果,利用改进的聚类算法划分电网区块。聚类算法基本运行原理为依据数据对象的属性,将数据划分成若干个类别,同时使类间差异度尽量大,类内的差异程度尽量小。本发明结合实际特点,采用基于公平层次聚类算法,开展网格电网聚类分析,具体过程如下所示。
S3.1、将每个网格定义为样本,并将所述样本视为单个簇,簇即为上述的电网区块,计算各个样本之间的欧氏距离作为初始度量矩阵D。
设X为样本集合,将样本X={x1,x2,...xn}划分为C={c1,c2,...cn},其中Ci={xi}且满足
Figure BDA0003866878400000076
x为样本,c代表簇。
进行样本间的距离度量计算,本文采用欧式距离进行计算。
Figure BDA0003866878400000077
其中,x1和x2代表样本1和样本2,
Figure BDA0003866878400000084
Figure BDA0003866878400000085
代表样本1和样本2的第i个特征向量(即A1中的数据向量);
进行簇之间的距离度量,采用单链接标准,构造距离度量n阶矩阵,
Figure BDA0003866878400000081
距离度量矩阵D中的元素dij意为第i个簇与第j个簇之间的距离度量,矩阵D对角线元素为簇与自己本身的距离度量,所以对角线元素为0,当dij越小时,说明两个簇应该被聚为一类。
S3.2、计算本次参与聚类的所有簇的标准化基尼系数,判断是否大于设定的阈值。
为了使基尼系数能够定量表示聚类过程中含样本不同的簇参与聚类的平等程度,首先将基尼系数标准化得到不包含公平指标的单链接标准:
Figure BDA0003866878400000082
其中,C(k)为参加第k次聚类的所有簇,n为本次聚类的所有簇的数量,ci为第i个数据多域集所包含的样本数量,将标准化的基尼系数应用于层次聚类可以判断参加本次聚类的全部簇的所含样本数量是否足够平均。
若计算得出本次聚类的标准化基尼系数低于设定的基尼系数风险阈值,则说明每个簇中所含样本个数相对平均,有较低的概率产生不平等聚类;若计算得出本次聚类的标准化基尼系数高于设定的基尼系数风险阈值,则说明在本次聚类中,有至少一个簇存在样本数量过多的问题,有可能产生不平等聚类使最终的层次聚类树状图倾斜以至于聚类结果不准确,此时需采用新的集合距离度量标准来选择合适的簇进行合并。
具体的,若标准化基尼系数小于设定的阈值,则采用不包含公平指标的单链接标准计算簇之间的度量距离,若标准化基尼系数大于阈值,则采用包含公平指标的单链接标准计算簇之间的度量距离。
为了使包含样本数量很多的集合在本次聚类中减小其不平等程度,定义公平指标:
Figure BDA0003866878400000083
其中,G(C(k))为第k次聚类的标准化基尼系数,
Figure BDA0003866878400000091
为基尼系数,其含义为在参与本次聚类的所有簇中,除去第p个簇后其他的所有簇构成的集合;
Figure BDA0003866878400000092
表示第k次聚类时,在参与本次聚类的所有簇中,除去第P个簇后的标准化基尼系数;
将公平指标引入后可得到新的公平单链接标准,即包含公平指标的单链接标准:
Figure BDA0003866878400000093
其中,n为簇的数量,
Figure BDA0003866878400000094
表示第k次聚类时,在参与本次聚类的所有簇中,除去第 P个簇后的标准化基尼系数,ci、cj分别为第i个簇和第j个簇。
计算两个簇之间的最小度量距离:
Figure BDA0003866878400000095
其中,
Figure BDA0003866878400000096
分别为第ci个簇和第cj个簇对应的公平指标,dist(x1,x2)为样本x1、样本x2之间的欧氏距离。
S3.4、将度量距离最近的两个簇合并,成为新集合,并返回步骤S3.2;
S3.5、重复S3.2-S3.4,直到聚类结束,输出聚类结果。结束的判定标准为基尼系数小于0.2,即当基尼系数小于0.2时,可以判定聚类结束。聚类结果就是指的合并后的网格电网集。
S4、结合S3得到的聚类结果,基于前馈神经网络的概率负荷预测方法对日后划分出来的每个网格电网的负荷进行单独预测,然后再将对每个网格电网的负荷进行单独预测的结果汇总到上层形成整个地区的概率负荷预测结果。
为了便于累加预测结果,本发明采用的概率预测方法得到的不是预测区间,而是参数化的预测值的分布(例如采用均值和方差参数化描述高斯分布)。之后通过累加后的这些参数估计地区整体的负荷预测值的概率分布,最终形成预测区间。
前馈神经网络是一类典型的多层网络,由一个输入层、一个输出层和多个隐含层。为了简单起见,本发明采用的前馈神经网络只有一个隐藏层,不同层的神经元之间存在完整的连接,同一层神经元间不存在连接,如图2所示。
给定一个包含N对输入与输出的训练集:
Figure BDA0003866878400000097
其中,xi=[xi1,xi2,.....xid]为输入,yi是训练集的目标,一个具有nr个隐藏节点和激活函数g()的前馈神经网络可以表示为:
Figure BDA0003866878400000101
其中wj=[wj1,wj2,.....wjd]T为连接第j个隐藏节点和输入节点的权重向量,βj为连接第j 个隐藏节点和输出节点的权重向量,bj为第j个隐藏节点的阈值,f(xi,w,b,β)为FNN的输出,激活函数g()是最常用的sigmoid函数。这里的输入即为某一区块电网日前若干天同一时刻的负荷大小,输出即为当天同一时刻的负荷的实际大小。
给定一个包含Ntest组输入输出的测试集
Figure BDA0003866878400000102
其中xt=[xt1,xt2,...,xtd]输入,yt为实际负荷值,Ntest为测试样本数。在输入xt的情况下,对实际负荷值yt的预测可以用f(xi,w,b,β) 表示。
在t时刻,实际负荷值yt可以被表示为预测值
Figure BDA0003866878400000103
和预测误差εt之和,这种关系可以被表示为:
Figure BDA0003866878400000104
其中的预测误差εt主要由模型误差和数据误差造成,εt可以被表示为以上两类误差的和,并写作:
εt=εm,td,t
其中εm,t是模型参数、结构带来的误差(与真实值比较计算得出),εd,t是数据噪声带来的误差。
模型误差与数据噪声误差是相互独立且负荷高斯分布的,那么这两类误差的方差和总的预测误差的方差之间的关系可以被表示为:
Figure BDA0003866878400000105
其中,
Figure BDA0003866878400000106
为对应的模型误差εm,t的方差,
Figure BDA0003866878400000107
为对应的数据噪声误差εd,t的方差。
为了估计模型误差的方差
Figure BDA0003866878400000108
首先采用由相同的数据集训练具有随机初始权重和初始阈值的B个网络来预测t时刻的负荷。假设
Figure BDA0003866878400000109
是第h个网络给出的预测值,那么所有B个网络给出的预测值的平均值可以表示为
Figure BDA00038668784000001010
Figure BDA0003866878400000111
历史数据中的噪声方差可估计为:
Figure BDA0003866878400000112
因为独立产生的不同网格的预测结果是相互独立且符合高斯分布的,那么可以通过分别累加预测分布均值和预测分布方差的方式来累加概率负荷预测结果:
Figure BDA0003866878400000113
Figure BDA0003866878400000114
其中某类网格的预测结果的均值,
Figure BDA0003866878400000115
代表误差均值,
Figure BDA0003866878400000116
为区域电网的负荷的预测结果。
负荷预测分布的方差可以被表示为:
Figure BDA0003866878400000117
Figure BDA0003866878400000118
为某类网格的预测结果的方差,
Figure BDA0003866878400000119
代表误差方差。
根据地区电网负荷预测分布的均值和方差,预测区间可表示为:
Figure BDA00038668784000001110
其中,
Figure BDA00038668784000001111
z1-α/2为标准高斯分布的临界值,其值主要取决于置信度100(1-α)%,预测区间即为预测结果。
最后,根据整个地区的概率负荷预测结果,指导对该地区的投资规划。(负荷预测高的地方多投资)
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种考虑多属性网格电网负荷预测方法,其特征在于,包括:
S1、识别影响地区电网负荷的影响要素,结合网格划分原则,将地区电网分为不同的网格,并收集日前不同的网格电网的要素对电网负荷影响的数据,形成不同的网格电网的数据多域集;
S2、对不同的网格电网的所述数据多域集进行整理,以形成不同的网格电网数据集合;
S3、基于聚类方法,针对日前的不同的网格电网数据集合进行聚类分析,将不同的网格电网划分成电网区块,得到日前的不同的网格的电网负荷的特性差异的聚类结果;
S4、结合S3得到的聚类结果,基于前馈神经网络的概率负荷预测方法对日后划分出来的每个区块电网的负荷进行单独预测,然后再将对每个网格电网的负荷进行单独预测的结果汇总到上层形成整个地区的概率负荷预测结果。
2.根据权利要求1所述的一种考虑多属性网格电网负荷预测方法,其特征在于,所述影响要素包括经济要素、社会要素和电网运行要素。
3.根据权利要求1所述的一种考虑多属性网格电网负荷预测方法,其特征在于,S2中,对所述数据多域集进行整理的具体方法包括:剔除异常的数据值、补充缺失的数据值以及删除重复的数据值中的其中一种或多种。
4.根据权利要求3所述的一种考虑多属性网格电网负荷预测方法,其特征在于,采用基于重复模拟的缺失值处理法对缺失值进行处理,即从一个包含缺失值的数据多域集中采用蒙特卡洛方法来填补计算得到的缺失值,从而生成一组完整的数据多域集。
5.根据权利要求4所述的一种考虑多属性网格电网负荷预测方法,其特征在于,估计缺失的所述数据值的具体方法为:
A1、接收连续的数据向量集QYc=[QY1,QY2,....,QYn],其中,所述数据向量集中的某一数据向量即为某一网格电网的数据多域集,所述数据向量集QYc包括完整数据向量QYwz和缺失数据向量QYqs,n为该数据向量集中的数据向量的数量,即数据多域集的数量;
A2、针对所述数据向量集中的第i项数据向量QY(i)=[Qyi(1),Qyi(2),.....,Qyi(D)],i∈[1,n],D为第i项数据向量中的样本数,设定高斯模型,其中所述高斯模型的参数空间为θ,将每个所述数据向量与对应的高斯模型的参数空间结合形成马尔科夫链,并根据所述参数空间θ的估计值θg计算所述数据向量集中的缺失数据发生的概率p(QYqs丨QYwz,θg);
A3、根据当前的完整数据向量与缺失数据向量的估计值计算所述参数空间θ的发生概率
Figure FDA0003866878390000021
并且重复该步骤对高斯模型的参数空间θ的估计值进行更新,直到得到的马尔科夫链
Figure FDA0003866878390000022
收敛时,估计缺失的所述数据值大小;
A4、缺失的所述数据值的计算公式为:
Figure FDA0003866878390000023
其中Nsample为数据向量中的总样本数量,NBurn-in为数据向量中的缺失样本数量,
Figure FDA0003866878390000024
为缺失的数据值的大小,
Figure FDA0003866878390000025
为第t项样本的缺失的数据值的大小。
6.根据权利要求1所述的一种考虑多属性网格电网负荷预测方法,其特征在于,S3中,采用公平层次聚类法对网格电网进行分类,具体步骤为:
S3.1、将每个网格定义为样本,并将所述样本视为单个簇,计算各个样本之间的欧氏距离作为初始度量矩阵;
S3.2、计算本次参与聚类的所有簇的标准化基尼系数,判断是否大于设定的阈值;
S3.3、若标准化基尼系数小于设定的阈值,则采用不包含公平指标的单链接标准计算簇之间的度量距离,若标准化基尼系数大于阈值,则采用包含公平指标的单链接标准计算簇之间的度量距离;
S3.4、将度量距离最近的两个簇合并,成为新集合,并返回步骤S3.2;
S3.5、重复S3.2-S3.4,直到聚类结束,输出聚类结果。
7.根据权利要求6所述的一种考虑多属性网格电网负荷预测方法,其特征在于,所述公平指标为:
Figure FDA0003866878390000026
其中,G(C(k))为第k次聚类的标准化基尼系数,
Figure FDA0003866878390000027
为基尼系数,其含义为在参与本次聚类的所有簇中,除去第p个簇后其他的所有簇构成的集合;
Figure FDA0003866878390000028
表示第k次聚类时,在参与本次聚类的所有簇中,除去第P个簇后的标准化基尼系数。
8.根据权利要求7所述的一种考虑多属性网格电网负荷预测方法,其特征在于,包含公平指标的单链接标准为:
Figure FDA0003866878390000029
其中,n为簇的数量,
Figure FDA0003866878390000031
表示第k次聚类时,在参与本次聚类的所有簇中,除去第P个簇后的标准化基尼系数,ci、cj分别为第i个簇和第j个簇。
9.根据权利要求7所述的一种考虑多属性网格电网负荷预测方法,其特征在于,两个簇之间的最小度量距离为:
Figure FDA0003866878390000032
其中,
Figure FDA0003866878390000033
分别为第ci个簇和第cj个簇对应的公平指标,dist(x1,x2)为样本x1、样本x2之间的欧氏距离。
10.根据权利要求1所述的一种考虑多属性网格电网负荷预测方法,其特征在于,还包括S5,根据整个地区的概率负荷预测结果,指导对该地区的投资规划,负荷预测高的地方多投资。
CN202211181228.6A 2022-09-27 2022-09-27 一种考虑多属性网格电网负荷预测方法 Pending CN115600729A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211181228.6A CN115600729A (zh) 2022-09-27 2022-09-27 一种考虑多属性网格电网负荷预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211181228.6A CN115600729A (zh) 2022-09-27 2022-09-27 一种考虑多属性网格电网负荷预测方法

Publications (1)

Publication Number Publication Date
CN115600729A true CN115600729A (zh) 2023-01-13

Family

ID=84845144

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211181228.6A Pending CN115600729A (zh) 2022-09-27 2022-09-27 一种考虑多属性网格电网负荷预测方法

Country Status (1)

Country Link
CN (1) CN115600729A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116031888A (zh) * 2023-03-27 2023-04-28 合肥工业大学 基于动态负荷预测的潮流优化方法、系统及存储介质
CN116955968A (zh) * 2023-09-21 2023-10-27 湖北华中电力科技开发有限责任公司 一种基于机器学习的用户用电行为分析方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116031888A (zh) * 2023-03-27 2023-04-28 合肥工业大学 基于动态负荷预测的潮流优化方法、系统及存储介质
CN116955968A (zh) * 2023-09-21 2023-10-27 湖北华中电力科技开发有限责任公司 一种基于机器学习的用户用电行为分析方法
CN116955968B (zh) * 2023-09-21 2023-12-12 湖北华中电力科技开发有限责任公司 一种基于机器学习的用户用电行为分析方法

Similar Documents

Publication Publication Date Title
CN111105104A (zh) 一种基于相似日和rbf神经网络的短期电力负荷预测方法
CN112132351A (zh) 电动汽车充电负荷聚类预测方法及装置
CN115600729A (zh) 一种考虑多属性网格电网负荷预测方法
CN115270965B (zh) 一种配电网线路故障预测方法和装置
CN111861013B (zh) 一种电力负荷预测方法及装置
CN111369070A (zh) 一种基于包络线聚类的多模融合光伏功率预测方法
CN113554466B (zh) 一种短期用电量预测模型构建方法、预测方法和装置
Zhang et al. Wind speed prediction research considering wind speed ramp and residual distribution
CN116596044B (zh) 基于多源数据的发电负荷预测模型训练方法及装置
CN112232561A (zh) 基于约束并行lstm分位数回归的电力负荷概率预测方法
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及系统
Ding et al. Serial-parallel dynamic echo state network: A hybrid dynamic model based on a chaotic coyote optimization algorithm for wind speed prediction
CN114897264A (zh) 一种基于迁移学习的小样本场景下光伏出力区间预测方法
CN112036598A (zh) 一种基于多信息耦合的充电桩使用信息预测方法
CN111882114A (zh) 一种短时交通流量预测模型构建方法及预测方法
CN111815039A (zh) 基于天气分类的周尺度风电功率概率预测方法及系统
CN115099511A (zh) 基于优化copula的光伏功率概率估计方法及系统
CN115660725A (zh) 多维度能源用户画像的刻画方法
CN115034473A (zh) 一种电价预测方法、系统及装置
CN116826745B (zh) 一种电力系统背景下的分层分区短期负荷预测方法及系统
CN113379116A (zh) 基于聚类和卷积神经网络的台区线损预测方法
CN111697560B (zh) 一种基于lstm预测电力系统负荷的方法及系统
CN113033898A (zh) 基于k均值聚类与bi-lstm神经网络的电负荷预测方法及系统
CN117674119A (zh) 电网运行风险评估方法、装置、计算机设备和存储介质
CN113344589A (zh) 一种基于vaegmm模型的发电企业串谋行为的智能识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination