CN115081533A - 基于两级聚类和mgru-at的客户侧负荷预测方法与系统 - Google Patents

基于两级聚类和mgru-at的客户侧负荷预测方法与系统 Download PDF

Info

Publication number
CN115081533A
CN115081533A CN202210778301.1A CN202210778301A CN115081533A CN 115081533 A CN115081533 A CN 115081533A CN 202210778301 A CN202210778301 A CN 202210778301A CN 115081533 A CN115081533 A CN 115081533A
Authority
CN
China
Prior art keywords
client side
load power
distance
load
power sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210778301.1A
Other languages
English (en)
Inventor
李波
杨斌
陈铭明
杨世海
段梅梅
孔月萍
陈宇沁
阮文骏
方凯杰
黄艺璇
陆婋泉
程含渺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Jiangsu Electric Power Co ltd Marketing Service Center
State Grid Jiangsu Electric Power Co Ltd
Original Assignee
State Grid Jiangsu Electric Power Co ltd Marketing Service Center
State Grid Jiangsu Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Jiangsu Electric Power Co ltd Marketing Service Center, State Grid Jiangsu Electric Power Co Ltd filed Critical State Grid Jiangsu Electric Power Co ltd Marketing Service Center
Priority to CN202210778301.1A priority Critical patent/CN115081533A/zh
Publication of CN115081533A publication Critical patent/CN115081533A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06312Adjustment or analysis of established resource schedule, e.g. resource or task levelling, or dynamic rescheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06313Resource planning in a project environment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/003Load forecast, e.g. methods or systems for forecasting future load demand

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Educational Administration (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Development Economics (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Power Engineering (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于两级聚类和MGRU‑AT的客户侧负荷预测方法,包括如下步骤:采集客户侧负荷瞬时有功功率的历史数据并进行预处理,得到可调节负荷功率序列;计算可调节负荷功率序列的样本间的DTW距离和欧氏距离,进而得到距离值;进而确定历史客户侧负荷功率序列的聚类中心样本集和簇群个数;根据历史客户侧负荷功率序列的聚类中心样本集,利用K‑Medoids算法,得到不同客户侧负荷的聚类结果;根据不同客户侧负荷的聚类结果,利用多通道循环神经网络模型,得到最终的MGRU‑AT预测模型。本发明利用基于改进Canopy和K‑Medoids两级聚类算法可以有效聚合客户侧负荷,防止因聚类簇过多或过少而导致的对原始数据的过划分和欠划分,且消除聚类中心点偏移的现象,提升聚类数据的合理性和相似性。

Description

基于两级聚类和MGRU-AT的客户侧负荷预测方法与系统
技术领域
本发明属于客户侧负荷预测技术领域,更具体的,涉及一种基于两级聚类和MGRU-AT的客户侧负荷预测方法与系统。
背景技术
现阶段,工业、商业、居民等多类型用户可调节负荷资源逐步参与到电网调度中,由于其数量较多,区域中的不同类型的用户负荷数据驳杂,亟需对其进行精确的分类,把握负荷特征,并在此基础上,对不同类型的客户侧负荷功率进行精准预测。因此,提出对客户侧负荷资源功率的精准预测问题进行研究。
现有技术中,负荷预测方法在一些模型的定阶、求解以及模型识别等问题上存在较大困难,同时模型的适应能力不强,导致经常会出现数据运算慢以及精度较低等问题。现有较为精确的预测方法主要有三类:统计法、物理法和组合预测法,其中基于物理法的可调节负荷功率单步预测的缺点在于NWP数据与真实负荷环境数据间存在着较大的误差,且NWP数据与可调节负荷场景存在着空间上的差异,这使物理法对可调节负荷功率单步的预测精度普遍偏低;统计法是基于预测值与真实值的误差来更新、调整模型权重和参数的可调节负荷功率预测方法,该方法通常又被分为概率统计模型、机器学习模型和深度学习模型,概率统计模型,相比于物理法能更好的跟随可调节负荷功率的变化趋势,但在多步预测中存在较大得到误差;机器学习模型的单步预测精度均优于传统概率模型;深度学习模型能充分挖掘输入序列的时间和空间特性,进一步提高可调节负荷功率单步预测的精度,由于其结构单一且对数据质量要求高,难以对随机性强、噪声信号明显的可调节负荷功率序列进行准确稳定的多步预测;组合预测法是结合各单一预测模型的优势而形成的一种预测精度更高,稳定性更好的可调节负荷功率预测方法,一般用于可调节负荷功率多步预测中,组合预测模型在多个时间尺度上的表现均优于其它模型,组合预测法相较于物理法和统计法有更好的预测性能。
另外,对于负荷的分类一般使用单一聚类方法,在聚类时可能对聚类簇群形成过划分或者欠划分,聚类中心可能会产生偏移,影响聚类的效果。因此,亟需综合考虑聚类簇群的划分方案以及聚类中心的精准定位,对负荷数据进行精确分类,已减小负荷预测前的基础数据的误差。
发明内容
为解决现有技术中存在的不足,本发明的目的在于,解决上述缺陷,进而提供一种基于两级聚类和MGRU-AT的客户侧负荷预测方法与系统。
本发明采用如下的技术方案。
一种基于两级聚类和MGRU-AT的客户侧负荷预测方法,包括如下步骤:
步骤1,采集客户侧负荷瞬时有功功率的历史数据并进行预处理,得到可调节负荷功率序列;
步骤2,计算可调节负荷功率序列的样本间的DTW距离和欧氏距离,并根据DTW距离和欧氏距离,归一化得到距离值;
步骤3,采用改进Canopy算法,根据可调节负荷功率序列与距离值,确定可调节负荷功率序列的聚类中心样本集和簇群个数;
步骤4,根据历史客户侧负荷功率序列的聚类中心样本集,利用K-Medoids 算法,得到不同客户侧负荷的聚类结果;
步骤5,根据不同客户侧负荷的聚类结果,利用多通道循环神经网络模型,得到最终的MGRU-AT预测模型。
进一步的,步骤1中采集客户侧负荷瞬时有功功率的历史数据的频率为 1/15min。
进一步的,可调节负荷功率序列由多类客户侧负荷在多个时段的负荷功率组成,步骤1中预处理包括:异常值处理、空缺值填补和归一化处理;具体为:
Figure BDA0003724813360000021
式中,i为客户侧负荷的类别,l为时间标度,j∈[1,2000],Xi,l为第i类客户侧负荷在l时段的负荷功率;xi,l为归一化后的第i类客户侧负荷在l时段的负荷功率。
进一步的,步骤2中计算可调节负荷功率序列的样本间的DTW距离和欧氏距离具体包括:
Figure BDA0003724813360000031
Figure BDA0003724813360000032
其中,xl为输入的第i个类型的客户侧负荷功率;xi,l为归一化后的第i类客户侧负荷在l时段的负荷功率,dDE表示欧氏距离;i,j为客户侧负荷的类别;dDTW,ij为DTW距离,dED,ij为欧式距离;n为可调节负荷功率序列的数量。
进一步的,步骤2中根据DTW距离和欧氏距离,归一化得到距离值具体包括:
dCN=dDTW+dED
dCN~N(μ,σ2)
其中,μ为距离dCN的均值,σ为距离dCN的方差,dDTW为DTW距离,dED为欧式距离,dCN为距离值。
进一步的,步骤3具体包括:
步骤3.1,采用改进Canopy算法,根据距离值dCN,计算阈值T1,T2;
步骤3.2,根据阈值T1,T2与可调节负荷功率序列,得到可调节负荷功率序列的聚类中心样本集和簇群个数。
进一步的,步骤3.1具体包括:
T1=max{μ,max_b,md}+σ
T2=min{μ,max_b,md}-σ
其中,max_b为dCN的最大值,md为距离值dCN的中位数,μ为距离dCN的均值,σ为距离dCN的方差。
进一步的,步骤3.2具体包括:
步骤3.2.1,令j=1,j=1,2,…表示步骤3.2所重复执行的次数;令样本集S拷贝所有的可调节负荷功率序列中的样本数据;并从Canopy算法在可调节负荷功率序列中进行随机挑选得出数据向量At;将数据向量At从S中删除,并将数据向量At加入到对应簇Cj中;其中,可调节负荷功率序列是一个n*m的矩阵,样本数据为可调节负荷功率序列的列向量,
步骤3.2.2,对S中任意一个样本数据Ak,计算其与S中其他样本数据的dCN,并从中选出最小距离dtk
步骤3.2.3,若dtk小于T2,从S中删除Ak,并将Ak加入到Cj中;若dtk小于T1且大于等于T2,则将Ak加入到Cj中;
步骤3.2.4,判断S是否为空,若是,步骤3.2结束,否则,令j=j+1,并返回步骤3.2.2。
进一步的,步骤4中K-Medoids算法的目标函数为:
Figure BDA0003724813360000041
Figure BDA0003724813360000042
Figure BDA0003724813360000043
Figure BDA0003724813360000044
Figure BDA0003724813360000045
Figure BDA0003724813360000046
Figure BDA0003724813360000047
ΔPL=PL,max-PL.min
其中,Cj为第j个对应簇,oj为Cj的聚类中心,xi为Cj中的样本数据, dCN(xi,oj)是xi和oj的归一化DTW距离与欧式距离的和,PL,max,PL.min分别为日最大,最小负荷,PL,ave为日平均负荷;d1,d2,d2,d2,d2,ηL,ΔPL均作为 K-Medoids算法的目标函数。
进一步的,步骤5具体包括:
步骤5.1,根据不同客户侧负荷的聚类结果,构建多通道循环神经网络模型,并提取聚类好的客户侧负荷序列的共有特征;
步骤5.2,利用注意力机制,对聚类好的客户侧负荷序列的共有特征赋予权重,并输出预测结果;
步骤5.3,将不同客户侧负荷的聚类结果,划分成训练集和测试集;
步骤5.4,利用训练集训练多通道循环神经网络模型,并结合测试集与预测结果,得到最终的MGRU-AT预测模型。
进一步的,步骤5.1中构建多通道循环神经网络(MGRU)模型具体包括:
rt=σ(Wrxt+Urht-1+br)
zt=σ(Wzxt+Uzht-1+bz)
其中,rt为重置门状态;σ()为Sigmoid函数;Wr,Ur为重置门状态的权重参数;br为重置门状态的偏移参数;ht-1为t-1时刻状态的记忆变量;Zt为更新门状态;Wz,Uz为更新门状态的权重参数;bz为更新门状态的偏移参数;xt为 t时刻输入的可调节负荷功率序列;
Figure BDA0003724813360000051
Figure BDA0003724813360000052
其中,
Figure BDA0003724813360000053
为更新中间状态;W,U为更新门中间状态的权重参数;b为更新门中间状态的偏移参数;ht为t时刻状态的记忆变量。
一种基于两级聚类和MGRU-AT的客户侧负荷预测系统,包括:采集模块、计算模块、Canopy算法算法模块、K-Medoids算法模块与多通道循环神经网络模块;
采集模块用于采集客户侧负荷瞬时有功功率的历史数据并进行预处理,得到可调节负荷功率序列;
计算模块用于计算可调节负荷功率序列的样本间的DTW距离和欧氏距离,并根据DTW距离和欧氏距离,归一化得到距离值;
Canopy算法算法模块用于确定可调节负荷功率序列的聚类中心样本集和簇群个数;
K-Medoids算法模块用于得到不同客户侧负荷的聚类结果;
多通道循环神经网络模块用于得到最终的MGRU-AT预测模型。
本发明的有益效果在于,与现有技术相比,本发明具有以下优点:
(1)利用基于改进Canopy和K-Medoids两级聚类算法可以有效聚合客户侧负荷,防止因聚类簇过多或过少而导致的对原始数据的过划分和欠划分,且消除聚类中心点偏移的现象,提升聚类数据的合理性和相似性;
(2)多通道循环神经网络模型可以有效提取客户侧负荷数据的共有特征,通过注意力机制得出更有效的输出分量,有效提高负荷预测的精度和稳定性。
附图说明
图1为本发明的基于两级聚类和MGRU-AT的客户侧负荷功率预测方法的步骤框图;
图2为本发明一实施例中两级聚类方法的流程图;
图3为本发明一实施例中单个GRU结构示意图;
图4为本发明一实施例中MGRU-AT模型结构示意图;
图5为本发明一实施例中工业用户负荷的聚类结果图;
图6为本发明一实施例中商业用户负荷的聚类结果图;
图7为本发明一实施例中居民用户负荷的聚类结果图
图8为本发明一实施例中客户侧负荷功率预测结果对比图。
具体实施方式
下面结合附图对本申请作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本申请的保护范围。
实施例1。
如图1至图4,基于两级聚类和MGRU-AT的客户侧负荷功率预测方法,包括步骤1至5,如下:
步骤1,采集客户侧负荷瞬时有功功率的历史数据并进行预处理,得到可调节负荷功率序列。
具体地,步骤1中,每15分钟为1个采样时刻,采集客户侧负荷瞬时有功功率的历史数据。
具体地,步骤1中,对客户侧负荷瞬时有功功率的历史数据进行预处理包括:异常值处理、空缺值填补和归一化处理;
异常值包括:负值,超出满载功率值,乱码;其中,负值的处理方式为直接置零的方式;超出满载功率值和乱码的处理方式为利用前后两个采样时刻的可调节负荷瞬时有功功率对超出满载功率值和乱码进行修正;
空缺值填补的方式为利用前后两个采样时刻的可调节负荷瞬时有功功率对空缺值进行填充。
Figure BDA0003724813360000071
式中,
Figure BDA0003724813360000072
为第i类负荷在l时刻的异常值。
Figure BDA0003724813360000073
式中,i为客户侧负荷的类别,l为时间标度,j∈[1,2000],Xi,l为第i类客户侧负荷在l时段的负荷功率;xi,l为归一化之后的负荷功率,即可调节负荷功率序列。
具体地,步骤2包括:
步骤2包括:
步骤2.1,计算可调节负荷功率序列的样本间的DTW距离和欧氏距离(EuclideanDistance,ED),计算公式如下所示:
Figure BDA0003724813360000074
Figure BDA0003724813360000075
式中,xi为输入的第i个类型的客户侧负荷功率;
j为客户侧负荷的类别;
dDE表示欧氏距离;
n为可调节负荷功率序列的样本的数量;
步骤2.2,将dDTW、dED进行归一化处理,再相加得到dCN,计算公式如下:
dCN=dDTW+dED
dCN~N(μ,σ2)
式中,dDTW与dED均为矩阵,而dDTW,ij与dED,ij分别为dDTW与dED中的元素。
μ为距离dCN的均值;
σ为距离dCN的方差。
具体地,步骤3包括:
步骤3.1,采用改进Canopy算法,根据距离评价指标计算阈值T1,T2:
T1=max{μ,max_b,md}+σ
T2=min{μ,max_b,md}-σ
式中,
max_b为dCN的最大值;
md为距离值dCN的中位数。
步骤3.2具体包括:
步骤3.2.1,令j=1,j=1,2,…表示步骤3.2所重复执行的次数;令样本集S拷贝所有的可调节负荷功率序列中的样本数据;并从Canopy算法在可调节负荷功率序列中进行随机挑选得出数据向量At;将数据向量At从S中删除,并将数据向量At加入到对应簇Cj中;
可以理解的是,由于可调节负荷功率序列是一个n*m的矩阵,因此,样本集(可调节负荷功率序列)中的每一个样本数据即为1*m的向量,样本数据的数量为n,数据向量At就是其中的一个样本数据。
步骤3.2.2,对S中任意一个样本数据Ak,计算其与S中其他样本数据的dCN,并从中选出最小距离dtk
步骤3.2.3,若dtk小于T2,从S中删除Ak,并将Ak加入到Cj中;若dtk小于T1且大于等于T2,则将Ak加入到Cj中;
可以理解的是,若dtk大于等于T1,则需要创建新的对应簇。
步骤3.2.4,判断S是否为空,若是,步骤3.2结束,否则,令j=j+1,并返回步骤3.2.2。
具体地,步骤4包括:
步骤4中,根据历史客户侧负荷功率序列的聚类中心样本集,利用K-Medoids 算法,得到不同客户侧负荷的聚类结果。
其中,K-Medoids算法的目标函数为:
Figure BDA0003724813360000081
Figure BDA0003724813360000082
Figure BDA0003724813360000083
Figure BDA0003724813360000091
Figure BDA0003724813360000092
Figure BDA0003724813360000093
Figure BDA0003724813360000094
ΔPL=PL,max-PL.min
其中,Cj为第j个对应簇,oj为Cj的聚类中心,xi为Cj中的样本数据, dCN(xi,oj)是xi和oj的归一化DTW距离与欧式距离的和,PL,max,PL.min分别为日最大,最小负荷,PL,ave为日平均负荷;
d1为不同类型客户侧负荷的日负荷率聚类距离;
d2为不同类型客户侧负荷的峰谷差聚类距离;
d3为不同类型客户侧日最大负荷的聚类距离;
d4为不同类型客户侧平均负荷聚类距离;
d5为不同类型客户侧负荷的标准差边界计算;
ηL为日负荷率,
ΔPL为日峰谷差。
具体地,步骤5包括:
步骤5包括:构建多通道循环神经网络和注意力机制(MGRU-AT)模型,输入不同客户侧负荷聚类结果,得出客户侧负荷功率预测结果,并对预测结果进行评价分析。
步骤5.1,以聚类后的客户侧负荷功率序列为输入数据集,并将输入数据集划分为训练集和测试集;
步骤5.2,构建多通道循环神经网络(MGRU)模型,提取聚类好的客户侧负荷序列的共有特征;
MGRU模型是通过将多个GRU模块进行组合,利用GRU模块分别对聚类好的客户侧负荷功率序列进行特征提取,GRU模型主要基于LSTM网络,将遗忘门和输入门合成为单一的重置门,有效降低训练参数数量,计算公式如下:
rt=σ(Wrxt+Urht-1+br)
zt=σ(Wzxt+Uzht-1+bz)
式中,
rt为重置门状态;
σ(*)为Sigmoid函数;
Wr,Ur为重置门状态的权重参数;
br为重置门状态的偏移参数;
ht-1为上一时刻状态的记忆变量;
Zt为更新门状态;
Wz,Uz为更新门状态的权重参数;
bz为更新门状态的偏移参数。
Figure BDA0003724813360000101
Figure BDA0003724813360000102
式中,
Figure BDA0003724813360000103
为更新中间状态;
tanh(*)为tanh函数;
W,U为更新门中间状态的权重参数;
b为更新门中间状态的偏移参数;
ht为时刻状态的记忆变量。
步骤5.3,利用注意力机制对各GRU通道的输出赋予权重,得到更加有效的输出分量,各注意力机制的输出被组合成维度为(1xK*n)的向量,经由全连接层输出预测结果;
注意力机制的输出如下式所示:
outAT,i=softmax(linear(Yi))T·Yi
式中,
Yi为第i个GRU模块的输出,其中i∈[1,K];
softmax(*)为softmax函数;
linear(*)为线性函数,·为点乘。
步骤5.4,利用划分出的训练集训练模型,以训练好的模型作为最终的MGRU-AT预测模型。
具体地,步骤5还包括:
步骤6还包括采用平均绝对误差和均方根误差对预测模型的性能进行评价,如下:
1)平均绝对误差MAE,满足如下关系式:
Figure BDA0003724813360000111
2)均方根误差MSE,满足如下关系式:
Figure BDA0003724813360000112
3)R2
Figure BDA0003724813360000113
式中,
yi
Figure BDA0003724813360000114
分别为i时刻的真实值和预测值;
Var(y)为测试集集合y的方差。
实施例2。
本实施例采用本发明提出的基于两级聚类和MGRU-AT的客户侧负荷预测方法,根据某地区典型客户侧负荷样本数据,对该区域的可调负荷进行预测;其中,前80%的样本数据作为训练集,后20%作为测试集。负荷聚类曲线如图5 到图7所示,客户侧负荷预测曲线如图8所示。
在实施例中,T1、T2的取值会影响Canopy的重叠率及粒度,当T1过大时,会使样本属于多个簇,各个簇区别不明显;当T2过大时,会减少簇个数;当T2过小时,会增加簇个数,同时增加计算时间。为此对样本点的选取和T1、T2的选取是优化的关键。在本节中,针对工业电负荷,取T1=6000,T2=5900;针对商业电负荷,取T1=600,T2=550;针对居民电负荷,取T1=120,T2=110。
如图5所示,按照不同季节工商居民用户负荷进行聚类分析,可以看出,在夏季时工业用户全天均需要电负荷,负荷曲线相对较为平稳,只有在其工作人员的交接班和用餐时段会有一些波动。此外,冬季和过渡季节的电负荷走势大体一致,分时段特点显著,各个时间段存在较为明显的负荷差异。夏季用电高峰集中在10:00到15:00之间,电负荷尖峰大约为5000kW,造成这一现象的原因是由于夏季室外温度高,室内的制冷系统处于满功率运行,其他时间段内,电负荷维持在一个较为平稳的水平。在其他季节,由于中午温度适中,而早晚温度变化较大,设备运行时间较长,需要开启空调降温,因此电负荷在晚间较大。
如图6所示,商业用户每天非连续使用电,其工作时间的范围通常是 8:00~23:00,每天的工作时间超过12小时,且全年几乎没有休息日,人员密度相对比较大;室内空间比较大,自然采光几乎不能满足户内光照需求,所以一般全天运行照明灯具,户内产生热量的因素多。从曲线可以看出,商业用户的电负荷相对集中并且保持在一定的范围内,不同季节典型日的电负荷走势相似,有十分明显的分时段特征。负荷用电高峰在8:00~22:00之间,电负荷一直处在800~1000kW之间。导致这种状况的原因是此时段内商业用户的照明、动力设备以及其他办公设备处于正常工作状态。除却工作时间后,商业用户的用电较少,仅需要维持一些必要的照明系统或者特定设备的运行,因此电负荷较小,相当于高峰时段的10%~15%。
如图7所示,冬季与过渡季节的电负荷均低于夏季的电负荷。在居民用户中,中午时间段,人员密度和光照以及设施有一部分会停止工作,此间的电负荷有所降低。晚间由于居民回家,导致晚间电负荷上升。22:00之后到第二天清晨,电负荷值达到最小,仅需要保证室内基础设施正常工作以及室外照明。居民用户负荷高峰日和工作日负荷差异很小。
选取工业用户的夏季典型电负荷数据集,划分75%训练集,25%测试集。运用CK-MGRU-AT模型对聚类结果进行特征提取和夏季典型客户侧负荷功率进行短期预测,预测结果如图8所示。性能指标如表1所示。相较于单一GRU模型, CK-MGRU-AT模型能够有效的提升负荷预测的精度,其预测结果的MSE至少降低了0.0003,MAE降低了0.0149。
表1性能指标
Figure BDA0003724813360000121
应当认识到,本发明的实施例可以由计算机硬件、硬件和软件的组合、或者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。所述方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存储介质在计算机程序中实现,其中如此配置的存储介质使得计算机以特定和预定义的方式操作——根据在具体实施例中描述的方法和附图。每个程序可以以高级过程或面向对象的编程语言来实现以与计算机系统通信。然而,若需要,该程序可以以汇编或机器语言实现。在任何情况下,该语言可以是编译或解释的语言。此外,为此目的该程序能够在编程的专用集成电路上运行。
此外,可按任何合适的顺序来执行本文描述的过程的操作,除非本文另外指示或以其他方式明显地与上下文矛盾。本文描述的过程(或变型和/或其组合)可在配置有可执行指令的一个或多个计算机系统的控制下执行,并且可作为共同地在一个或多个处理器上执行的代码(例如,可执行指令、一个或多个计算机程序或一个或多个应用)、由硬件或其组合来实现。所述计算机程序包括可由一个或多个处理器执行的多个指令。
进一步,所述方法可以在可操作地连接至合适的任何类型的计算平台中实现,包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计算环境、单独的或集成的计算机平台、或者与带电粒子工具或其它成像装置通信等等。本发明的各方面可以以存储在非暂时性存储介质或设备上的机器可读代码来实现,无论是可移动的还是集成至计算平台,如硬盘、光学读取和/或写入存储介质、 RAM、ROM等,使得其可由可编程计算机读取,当存储介质或设备由计算机读取时可用于配置和操作计算机以执行在此所描述的过程。此外,机器可读代码,或其部分可以通过有线或无线网络传输。当此类媒体包括结合微处理器或其他数据处理器实现上文所述步骤的指令或程序时,本文所述的发明包括这些和其他不同类型的非暂时性计算机可读存储介质。当根据本发明所述的方法和技术编程时,本发明还包括计算机本身。计算机程序能够应用于输入数据以执行本文所述的功能,从而转换输入数据以生成存储至非易失性存储器的输出数据。输出信息还可以应用于一个或多个输出设备如显示器。在本发明优选的实施例中,转换的数据表示物理和有形的对象,包括显示器上产生的物理和有形对象的特定视觉描绘。
如在本申请所使用的,术语“组件”、“模块”、“系统”等等旨在指代计算机相关实体,该计算机相关实体可以是硬件、固件、硬件和软件的结合、软件或者运行中的软件。例如,组件可以是,但不限于是:在处理器上运行的处理、处理器、对象、可执行文件、执行中的线程、程序和/或计算机。作为示例,在计算设备上运行的应用和该计算设备都可以是组件。一个或多个组件可以存在于执行中的过程和/或线程中,并且组件可以位于一个计算机中以及/或者分布在两个或更多个计算机之间。此外,这些组件能够从在其上具有各种数据结构的各种计算机可读介质中执行。这些组件可以通过诸如根据具有一个或多个数据分组(例如,来自一个组件的数据,该组件与本地系统、分布式系统中的另一个组件进行交互和/或以信号的方式通过诸如互联网之类的网络与其它系统进行交互)的信号,以本地和/或远程过程的方式进行通信。
本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施示例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。

Claims (12)

1.一种基于两级聚类和MGRU-AT的客户侧负荷预测方法,其特征在于,包括如下步骤:
步骤1,采集客户侧负荷瞬时有功功率的历史数据并进行预处理,得到可调节负荷功率序列;
步骤2,计算可调节负荷功率序列的样本间的DTW距离和欧氏距离,并根据DTW距离和欧氏距离,归一化得到距离值;
步骤3,采用改进Canopy算法,根据可调节负荷功率序列与距离值,确定可调节负荷功率序列的聚类中心样本集和簇群个数;
步骤4,根据历史客户侧负荷功率序列的聚类中心样本集,利用K-Medoids算法,得到不同客户侧负荷的聚类结果;
步骤5,根据不同客户侧负荷的聚类结果,利用多通道循环神经网络模型,得到最终的MGRU-AT预测模型。
2.根据权利要求1所述的一种基于两级聚类和MGRU-AT的客户侧负荷预测方法,其特征在于,步骤1中采集客户侧负荷瞬时有功功率的历史数据的频率为1/15min。
3.根据权利要求1所述的一种基于两级聚类和MGRU-AT的客户侧负荷预测方法,可调节负荷功率序列由多类客户侧负荷在多个时段的负荷功率组成,其特征在于,步骤1中预处理包括:异常值处理、空缺值填补和归一化处理;具体为:
Figure FDA0003724813350000011
式中,i为客户侧负荷的类别,l为时间标度,j∈[1,2000],Xi,l为第i类客户侧负荷在l时段的负荷功率;xi,l为归一化后的第i类客户侧负荷在l时段的负荷功率。
4.根据权利要求1所述的一种基于两级聚类和MGRU-AT的客户侧负荷预测方法,其特征在于,步骤2中计算可调节负荷功率序列的样本间的DTW距离和欧氏距离具体包括:
Figure FDA0003724813350000012
Figure FDA0003724813350000013
其中,xi为输入的第i个类型的客户侧负荷功率;xi,l为归一化后的第i类客户侧负荷在l时段的负荷功率,dDE表示欧氏距离;i,j为客户侧负荷的类别;dDTW,ij为DTW距离,dED,ij为欧式距离;n为可调节负荷功率序列的数量。
5.根据权利要求1所述的一种基于两级聚类和MGRU-AT的客户侧负荷预测方法,其特征在于,步骤2中根据DTW距离和欧氏距离,归一化得到距离值具体包括:
dCN=dDTW+dED
dCN~N(μ,σ2)
其中,μ为距离dCN的均值,σ为距离dCN的方差,dDTW为DTW距离,dED为欧式距离,dCN为距离值。
6.根据权利要求1所述的一种基于两级聚类和MGRU-AT的客户侧负荷预测方法,其特征在于,步骤3具体包括:
步骤3.1,采用改进Canopy算法,根据距离值dCN,计算阈值T1,T2;
步骤3.2,根据阈值T1,T2与可调节负荷功率序列,得到可调节负荷功率序列的聚类中心样本集和簇群个数。
7.根据权利要求6所述的一种基于两级聚类和MGRU-AT的客户侧负荷预测方法,其特征在于,步骤3.1具体包括:
T1=max{μ,max_b,md}+σ
T2=min{μ,max_b,md}-σ
其中,max_b为dCN的最大值,md为距离值dCN的中位数,μ为距离dCN的均值,σ为距离dCN的方差。
8.根据权利要求1所述的一种基于两级聚类和MGRU-AT的客户侧负荷预测方法,其特征在于,步骤3.2具体包括:
步骤3.2.1,令j=1,j=1,2,...表示步骤3.2所重复执行的次数;令样本集S拷贝所有的可调节负荷功率序列中的样本数据;并从Canopy算法在可调节负荷功率序列中进行随机挑选得出数据向量At;将数据向量At从S中删除,并将数据向量At加入到对应簇Cj中;其中,可调节负荷功率序列是一个n*m的矩阵,样本数据为可调节负荷功率序列的列向量,
步骤3.2.2,对S中任意一个样本数据Ak,计算其与S中其他样本数据的dCN,并从中选出最小距离dtk
步骤3.2.3,若dtk小于T2,从S中删除Ak,并将Ak加入到Cj中;若dtk小于T1且大于等于T2,则将Ak加入到Cj中;
步骤3.2.4,判断S是否为空,若是,步骤3.2结束,否则,令j=j+1,并返回步骤3.2.2。
9.根据权利要求1所述的一种基于两级聚类和MGRU-AT的客户侧负荷预测方法,其特征在于,步骤4中K-Medoids算法的目标函数为:
Figure FDA0003724813350000031
Figure FDA0003724813350000032
Figure FDA0003724813350000033
Figure FDA0003724813350000034
Figure FDA0003724813350000035
Figure FDA0003724813350000036
Figure FDA0003724813350000037
ΔPL=PL,max-PL.min
其中,Cj为第j个对应簇,oj为Cj的聚类中心,xi为Cj中的样本数据,dCN(xi,oj)是xi和oj的归一化DTW距离与欧式距离的和,PL,max,PL.min分别为日最大,最小负荷,PL,ave为日平均负荷;ηL1、ηL2分别为任意两个负荷功率序列的日负荷率,ΔPL1、ΔPL2分别为任意两个负荷功率序列的峰谷差,PL1,max、PL2,max分别为任意两个负荷功率序列的日最大负荷,
Figure FDA0003724813350000038
分别为任意两个负荷功率序列的日平均负荷,PL1、PL2分别为任意两个负荷功率序列的标准差;d1,d2,d2,d2,d2,ηL,ΔPL均作为K-Medoids算法的目标函数。
10.根据权利要求1所述的一种基于两级聚类和MGRU-AT的客户侧负荷预测方法,其特征在于,步骤5具体包括:
步骤5.1,根据不同客户侧负荷的聚类结果,构建多通道循环神经网络模型,并提取聚类好的客户侧负荷序列的共有特征;
步骤5.2,利用注意力机制,对聚类好的客户侧负荷序列的共有特征赋予权重,并输出预测结果;
步骤5.3,将不同客户侧负荷的聚类结果,划分成训练集和测试集;
步骤5.4,利用训练集训练多通道循环神经网络模型,并结合测试集与预测结果,得到最终的MGRU-AT预测模型。
11.根据权利要求1所述的一种基于两级聚类和MGRU-AT的客户侧负荷预测方法,其特征在于,步骤5.1中构建多通道循环神经网络模型具体包括:
rt=σ(Wrxt+Urht-1+br)
zt=σ(Wzxt+Uzht-1+bz)
其中,rt为重置门状态;σ()为Sigmoid函数;Wr,Ur为重置门状态的权重参数;br为重置门状态的偏移参数;ht-1为t-1时刻状态的记忆变量;Zt为更新门状态;Wz,Uz为更新门状态的权重参数;bz为更新门状态的偏移参数;xt为t时刻输入的可调节负荷功率序列;
Figure FDA0003724813350000041
Figure FDA0003724813350000042
其中,
Figure FDA0003724813350000043
为更新中间状态;W,U为更新门中间状态的权重参数;b为更新门中间状态的偏移参数;ht为t时刻状态的记忆变量。
12.一种基于两级聚类和MGRU-AT的客户侧负荷预测系统,应用在权利要求1-11所述的方法上,其特征在于,系统包括:采集模块、计算模块、Canopy算法算法模块、K-Medoids算法模块与多通道循环神经网络模块;
采集模块用于采集客户侧负荷瞬时有功功率的历史数据并进行预处理,得到可调节负荷功率序列;
计算模块用于计算可调节负荷功率序列的样本间的DTW距离和欧氏距离,并根据DTW距离和欧氏距离,归一化得到距离值;
Canopy算法算法模块用于确定可调节负荷功率序列的聚类中心样本集和簇群个数;
K-Medoids算法模块用于得到不同客户侧负荷的聚类结果;
多通道循环神经网络模块用于得到最终的MGRU-AT预测模型。
CN202210778301.1A 2022-06-30 2022-06-30 基于两级聚类和mgru-at的客户侧负荷预测方法与系统 Pending CN115081533A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210778301.1A CN115081533A (zh) 2022-06-30 2022-06-30 基于两级聚类和mgru-at的客户侧负荷预测方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210778301.1A CN115081533A (zh) 2022-06-30 2022-06-30 基于两级聚类和mgru-at的客户侧负荷预测方法与系统

Publications (1)

Publication Number Publication Date
CN115081533A true CN115081533A (zh) 2022-09-20

Family

ID=83258174

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210778301.1A Pending CN115081533A (zh) 2022-06-30 2022-06-30 基于两级聚类和mgru-at的客户侧负荷预测方法与系统

Country Status (1)

Country Link
CN (1) CN115081533A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115796559A (zh) * 2023-02-03 2023-03-14 国网江苏省电力有限公司营销服务中心 一种考虑需求响应场景的可调负荷排序方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115796559A (zh) * 2023-02-03 2023-03-14 国网江苏省电力有限公司营销服务中心 一种考虑需求响应场景的可调负荷排序方法及系统

Similar Documents

Publication Publication Date Title
CN106485262B (zh) 一种母线负荷预测方法
CN107392368B (zh) 一种基于气象预报的办公建筑动态热负荷组合预测方法
CN109598451B (zh) 一种基于pca与lstm神经网络的非侵入式负荷辨识方法
CN109376772B (zh) 一种基于神经网络模型的电力负荷组合预测方法
CN108376262B (zh) 一种风电出力典型特性的分析模型构建方法
CN108805213B (zh) 计及小波熵降维的电力负荷曲线双层谱聚类方法
CN111008504B (zh) 一种基于气象模式识别的风电功率预测误差建模方法
CN106022538B (zh) 基于k均值聚类改进广义天气的光伏发电预测方法
CN112186761B (zh) 一种基于概率分布的风电功率场景生成方法及系统
CN112734135A (zh) 一种电力负荷预测方法、智能终端及计算机可读存储介质
CN112183826A (zh) 基于深度级联生成对抗网络的建筑能耗预测方法及相关产品
CN116307944B (zh) 基于人工智能与物联网的配电箱远程监测系统
CN112524751A (zh) 一种动态空调系统能耗预测模型构建、预测方法及装置
CN114282730A (zh) 一种用于建筑负荷预测的数据完备性检验与特征学习方法
CN115081533A (zh) 基于两级聚类和mgru-at的客户侧负荷预测方法与系统
CN112288157A (zh) 一种基于模糊聚类与深度强化学习的风电场功率预测方法
CN114912720A (zh) 基于记忆网络电力负荷预测方法、装置、终端及存储介质
CN117272850B (zh) 配电网安全运行调度弹性空间分析方法
Xue et al. A framework for short-term energy consumption prediction based on room air conditioner group characteristics
CN111275238B (zh) 基于每时晴空指数的大规模电站光伏出力序列生成方法
CN110489893B (zh) 一种基于可变权值的母线负荷预测方法及系统
Das et al. A study on the application of artificial intelligence techniques for predicting the heating and cooling loads of buildings
KR102478684B1 (ko) 앙상블 학습을 이용한 에너지 소비 예측 방법 및 상기 방법을 수행하는 컴퓨팅 장치
CN116470491A (zh) 基于copula函数的光伏功率概率预测方法及系统
CN110781538B (zh) 基于实地监测的开窗仿真算法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination