CN110390440B - 一种基于聚类和深度神经网络的智能电表用户聚合负荷预测方法 - Google Patents

一种基于聚类和深度神经网络的智能电表用户聚合负荷预测方法 Download PDF

Info

Publication number
CN110390440B
CN110390440B CN201910691358.6A CN201910691358A CN110390440B CN 110390440 B CN110390440 B CN 110390440B CN 201910691358 A CN201910691358 A CN 201910691358A CN 110390440 B CN110390440 B CN 110390440B
Authority
CN
China
Prior art keywords
data
load
prediction
clustering
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910691358.6A
Other languages
English (en)
Other versions
CN110390440A (zh
Inventor
朱志良
徐腾腾
范珊珊
蔡壮
乔梁
Original Assignee
东北大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 东北大学 filed Critical 东北大学
Priority to CN201910691358.6A priority Critical patent/CN110390440B/zh
Publication of CN110390440A publication Critical patent/CN110390440A/zh
Application granted granted Critical
Publication of CN110390440B publication Critical patent/CN110390440B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/231Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Marketing (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Mathematical Physics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于聚类和深度神经网络的智能电表用户聚合负荷预测方法,包括:获取历史负荷数据并对其进行预处理;采用分裂层次聚类方法对预处理后的数据进行聚类,并分别对分组后的加载Pro文件进行预测并汇总,形成汇总负荷预测;对聚类处理后的数据进行训练,通过改变集群的数量来生成多个聚合负载预测数据;采用残差神经网络对生成的多个聚合负载预测数据进行测试,对比测试集和训练集的准确度是否一致,若一致,则对步骤4中测试后的聚合负载预测数据进行集成处理,得到最后的预测结果;若不一致,则返回训练。本发明的技术方案解决了现有技术中的用集成技术来提高预测精度等问题。

Description

一种基于聚类和深度神经网络的智能电表用户聚合负荷预测 方法
技术领域
本发明涉及电力系统负荷预测技术领域,具体而言,尤其涉及一种基于聚类和深度神经网络的智能电表用户聚合负荷预测方法。
背景技术
负荷预测的最新进展包括概率预测、层次预测、集合预测等。随着智能电表的普及,越来越多的细粒度子剖面可以被测量和采集。因此,对单个负荷预测的研究也逐步展开。对于聚合负载预测,已经提出一种基于智能电表数据的自底向上方法,为了提高预测过程的效率,又提出了一种基于聚类的聚合负载预测:首先根据不同的用户组的负载模式构建不同的用户组;然后分别预测每个用户组的负载;最后,对不同用户组的预测进行汇总,得到聚合负载预测,最佳簇数由交叉验证确定。结果表明,聚类分析方法优于直接预测方法。
除了上述单输出预测方法(即仅提供一个最终预测值)外,还对集成预测方法进行了一系列研究,该方法可以从不同的模型中生成多个预测。总体上来说,集成预测可以分为同质和异质方法,如引导带聚合法和支持向量机和神经网络相结合。现在面临的问题是利用集成技术和细粒度子剖面来进一步提高预测精度。
发明内容
根据上述提出的技术问题,而提供一种基于聚类和深度神经网络的智能电表用户聚合负荷预测方法。本发明主要采用分裂层次聚类、全连接等技术,得到多个聚合负荷预测,从而进一步提高预测精度。首先,采用层次聚类方法对经过预处理后的数据(子剖面)进行聚类,并分别对分组后的加载Pro文件进行预测并汇总,形成汇总负荷预测,通过改变集群的数量来获得多个聚合负载预测,而不是单个预测。最后,采用最优加权系综方法将这些预测结果进行集成处理,并给出最终结果。
本发明采用的技术手段如下:
一种基于聚类和深度神经网络的智能电表用户聚合负荷预测方法,包括:
步骤1:获取历史负荷数据并对其进行预处理;
步骤2:采用分裂层次聚类方法对步骤1中经过预处理后的数据进行聚类,并分别对分组后的加载Pro文件进行预测并汇总,形成汇总负荷预测;
步骤3:对步骤2中经过聚类处理后的数据进行训练,通过改变集群的数量来生成多个聚合负载预测数据;
步骤4:采用残差神经网络对生成的多个聚合负载预测数据进行测试,对比测试集和训练集的准确度是否一致,若一致,则进入步骤5,若不一致,则返回步骤3;
步骤5:对步骤4中测试后的聚合负载预测数据进行集成处理,得到最后的预测结果。
进一步地,所述步骤1中获取的历史负荷数据不包括对应的天气信息;所述预处理过程包括但不限于:缺失值均值插补、数据标准化、独热编码、时间戳转换。
进一步地,所述的步骤2中采用分裂层次聚类方法对预处理后的数据进行聚类的具体步骤如下:
步骤2.1:计算得出每周平均负荷曲线;
步骤2.2:将步骤2.1中得到的曲线归一化为[0,1]区间内,获得代表每个用户的曲线r代表负荷;
步骤2.3:根据欧几里得距离计算消费者之间的距离矩阵Dm×n公式如下:
其中,T表示一周内的时间段数。
进一步地,所述步骤3中的通过改变集群的数量来生成多个预测数据,其具体采用公式如下:
N=[log2 M]+1
其中,N表示预测集合,[.]是取整函数,M表示集群数量;对kn分组的负荷预测进行求和得到第n次的预测;其中kn表示如下:
kn=min{2n-1,M}。
进一步地,所述步骤5中的集成处理具体包括如下步骤:
步骤5.1:计算n个预测值的权重ω,并将其结合到最终的预测中用来避免产生过拟合现象;其目标函数为最小化平均绝对百分比误差,约束条件包括组合预测方程,所有权重的总和和权重的非负性,公式如下所示:
其中,Len,t代表t时刻的验证集;
步骤5.2:通过引入辅助决策变量ven,t,将目标函数的绝对值百分比误差转化为线性规划LP问题,公式如下所示:
较现有技术相比,本发明的有益效果:
本发明提供的一种基于聚类和深度神经网络的智能电表用户聚合负荷预测方法,通过改变集群的数量来产生多个预测,并搜索多种预测的最佳组合,灵活地应用于不同的数据集,从而解决了用集成技术来提高预测精度等问题。
基于上述理由本发明可在电力系统负荷预测等领域广泛推广。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的方法流程图。
图2为本发明智能电表用户聚合负荷预测的流程图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例
本发明对两个开放数据集(住宅负荷和变电站负荷)进行了案例研究,验证了该方法的有效性和优越性。
如图1所示,本发明提供了一种基于聚类和深度神经网络的智能电表用户聚合负荷预测方法,包括:
步骤1:获取历史负荷数据并对其进行预处理;本实施例中采用爱尔兰住宅负荷数据,该数据来自爱尔兰能源监管委员会发起的智能计量电力用户行为实验。数据包含超过5000名爱尔兰居民和中小企业的半小时用电数据。
如图2所示,本实施例提供的预处理过程为:将时间数据转化为数值型,对负荷进行标准化处理,对缺失的负荷值进行均值插补;判断数据划分是否符合要求,若符合,则将数据划分为训练集、验证集和测试集;若不符合,则找出误差最大的簇再进行划分。
步骤2:采用分裂层次聚类方法对步骤1中经过预处理后的数据进行聚类,并分别对分组后的加载Pro文件进行预测并汇总,形成汇总负荷预测;
步骤2中采用分裂层次聚类方法对预处理后的数据进行聚类的具体步骤如下:
步骤2.1:计算得出每周平均负荷曲线;
步骤2.2:将步骤2.1中得到的曲线归一化为[0,1]区间内,获得代表每个用户的曲线r代表负荷;
步骤2.3:根据欧几里得距离计算消费者之间的距离矩阵Dm×n公式如下:
其中,T表示一周内的时间段数。需要注意的是,在这个阶段需要对不同数量的组执行大量的集群过程,因此,本发明采用分裂层次聚类方法对客户进行聚类,因为该方法具有建立层次结构的能力,并且不需要重复操作。
步骤3:对步骤2中经过聚类处理后的数据进行训练,通过改变集群的数量来生成多个聚合负载预测数据;当集群数量为m时,预测基本上是自上而下的方法,当集群数量为1时,预测直接基于历史集合负荷数据进行,为了使结果多样化,我们用指数的形式改变了聚类数,因此,总共将获得n个预测,其具体采用公式如下:
N=[log2 M]+1
其中,N表示预测集合,[.]是取整函数,M表示集群数量;例如,当M=100时,N=7。对kn分组的负荷预测进行求和得到第n次的预测;其中kn表示如下:
kn=min{2n-1,M}。
步骤4:采用残差神经网络对生成的多个聚合负载预测数据进行测试,对比测试集和训练集的准确度是否一致,若一致,则进入步骤5,若不一致,则返回步骤3;
步骤5:对步骤4中测试后的聚合负载预测数据进行集成处理,得到最后的预测结果。
步骤5中的集成处理具体包括如下步骤:
步骤5.1:计算n个预测值的权重ω,并将其结合到最终的预测中用来避免产生过拟合现象;目的在于优化预测集合N,其目标函数为最小化平均绝对百分比误差,约束条件包括组合预测方程,所有权重的总和和权重的非负性,公式如下所示:
其中,Len,t代表t时刻的验证集;
步骤5.2:通过引入辅助决策变量ven,t,将目标函数的绝对值百分比误差转化为线性规划(LP)问题,公式如下所示:
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。

Claims (3)

1.一种基于聚类和深度神经网络的智能电表用户聚合负荷预测方法,其特征在于,包括:
步骤1:获取历史负荷数据并对其进行预处理;
步骤2:采用分裂层次聚类方法对步骤1中经过预处理后的数据进行聚类,并分别对分组后的加载Pro文件进行预测并汇总,形成汇总负荷预测;
步骤2中采用分裂层次聚类方法对预处理后的数据进行聚类的具体步骤如下:
步骤2.1:计算得出每周平均负荷曲线;
步骤2.2:将步骤2.1中得到的曲线归一化为[0,1]区间内,获得代表每个用户的曲线r代表负荷;
步骤2.3:根据欧几里得距离计算消费者之间的距离矩阵Dm×n公式如下:
其中,T表示一周内的时间段数;
步骤3:对步骤2中经过聚类处理后的数据进行训练,通过改变集群的数量来生成多个聚合负载预测数据;
步骤4:采用残差神经网络对生成的多个聚合负载预测数据进行测试,对比测试集和训练集的准确度是否一致,若一致,则进入步骤5,若不一致,则返回步骤3;
步骤5:对步骤4中测试后的聚合负载预测数据进行集成处理,得到最后的预测结果;
所述步骤5中的集成处理具体包括如下步骤:
步骤5.1:计算n个预测值的权重ω,并将其结合到最终的预测中用来避免产生过拟合现象;其目标函数为最小化平均绝对百分比误差,约束条件包括组合预测方程,所有权重的总和和权重的非负性,公式如下所示:
其中,Len,t代表t时刻的验证集;
步骤5.2:通过引入辅助决策变量ven,t,将目标函数的绝对值百分比误差转化为线性规划LP问题,公式如下所示:
2.根据权利要求1所述的基于聚类和深度神经网络的智能电表用户聚合负荷预测方法,其特征在于,所述步骤1中获取的历史负荷数据不包括对应的天气信息;所述预处理过程包括但不限于:缺失值均值插补、数据标准化、独热编码、时间戳转换。
3.根据权利要求1所述的基于聚类和深度神经网络的智能电表用户聚合负荷预测方法,其特征在于,所述步骤3中的通过改变集群的数量来生成多个预测数据,其具体采用公式如下:
N=[log2M]+1
其中,N表示预测集合,[.]是取整函数,M表示集群数量;对kn分组的负荷预测进行求和得到第n次的预测;其中kn表示如下:
kn=min{2n-1,M}。
CN201910691358.6A 2019-07-29 2019-07-29 一种基于聚类和深度神经网络的智能电表用户聚合负荷预测方法 Active CN110390440B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910691358.6A CN110390440B (zh) 2019-07-29 2019-07-29 一种基于聚类和深度神经网络的智能电表用户聚合负荷预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910691358.6A CN110390440B (zh) 2019-07-29 2019-07-29 一种基于聚类和深度神经网络的智能电表用户聚合负荷预测方法

Publications (2)

Publication Number Publication Date
CN110390440A CN110390440A (zh) 2019-10-29
CN110390440B true CN110390440B (zh) 2023-10-13

Family

ID=68287705

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910691358.6A Active CN110390440B (zh) 2019-07-29 2019-07-29 一种基于聚类和深度神经网络的智能电表用户聚合负荷预测方法

Country Status (1)

Country Link
CN (1) CN110390440B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111126445A (zh) * 2019-11-29 2020-05-08 国网辽宁省电力有限公司经济技术研究院 一种面向智能电表海量数据的多步聚合负荷预测方法
CN111291782B (zh) * 2020-01-13 2022-09-09 上海交通大学 一种基于信息累积k-Shape聚类算法的累积负荷预测方法
CN113447879A (zh) * 2021-05-27 2021-09-28 国网山东省电力公司营销服务中心(计量中心) 基于多应力影响的电能表计量误差预测方法、系统及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7970718B2 (en) * 2001-05-18 2011-06-28 Health Discovery Corporation Method for feature selection and for evaluating features identified as significant for classifying data
US7734629B2 (en) * 2006-04-29 2010-06-08 Yahoo! Inc. System and method using hierachical clustering for evolutionary clustering of sequential data sets
US10529451B2 (en) * 2015-03-12 2020-01-07 Wayne State University PINS: a perturbation clustering approach for data integration and disease subtyping
US20210169336A1 (en) * 2018-11-13 2021-06-10 Enspectra Health, Inc. Methods and systems for identifying tissue characteristics

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于集成智能方法的电力短期负荷预测;张群洪;;系统工程理论与实践(第02期);第84-92页 *

Also Published As

Publication number Publication date
CN110390440A (zh) 2019-10-29

Similar Documents

Publication Publication Date Title
CN110610280B (zh) 一种电力负荷短期预测方法、模型、装置及系统
CN110390440B (zh) 一种基于聚类和深度神经网络的智能电表用户聚合负荷预测方法
CN111967512B (zh) 一种异常用电检测方法、系统和存储介质
CN111612650B (zh) 一种基于dtw距离的电力用户分群方法及系统
Miraftabzadeh et al. K-means and alternative clustering methods in modern power systems
CN110321934B (zh) 一种检测用户用电异常数据的方法及系统
CN111860600A (zh) 一种基于最大相关最小冗余判据的用户用电特征选择方法
CN110930198A (zh) 基于随机森林的电能替代潜力预测方法、系统、存储介质及计算机设备
Lemes et al. Load disaggregation based on time window for HEMS application
CN111126663B (zh) 一种短期电力负荷预测方法
CN112149890A (zh) 基于用户用能标签的综合能源负荷预测方法及系统
Pei et al. Short-term regional wind power forecasting based on spatial–temporal correlation and dynamic clustering model
Yoon et al. Deep learning-based method for the robust and efficient fault diagnosis in the electric power system
CN110197296A (zh) 一种基于时间序列相似性的机组负荷预测方法
CN117200181A (zh) 一种基于DBSCAN-EM-GMM和Web技术的光伏发电量预测方法
Fatouh et al. New semi-supervised and active learning combination technique for non-intrusive load monitoring
CN115759393A (zh) 基于集成学习的累积负荷基线预测方法
CN102904252B (zh) 求解含分布式电源的配电网不确定性潮流的方法
Kang et al. A novel physical-feature-based approach for stochastic simulation of typical building electricity use profiles
CN111509782B (zh) 考虑充电负荷与光伏出力随机特性的概率潮流分析方法
CN116976927A (zh) 一种基于深度学习的短期电价预测方法、系统、计算机及存储介质
CN116777153A (zh) 考虑分布式能源接入的配电网灵活性归因分析方法
Li et al. The research of urban rail transit sectional passenger flow prediction method
CN114611272A (zh) 一种基于最小间隔动态分布的用电负荷曲线数据拟合方法
Bâra et al. Intelligent systems for predicting and analyzing data in power grid companies

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant