CN111832796B - 一种针对居民用电负荷模式的精细分类及预测方法及系统 - Google Patents

一种针对居民用电负荷模式的精细分类及预测方法及系统 Download PDF

Info

Publication number
CN111832796B
CN111832796B CN202010132437.6A CN202010132437A CN111832796B CN 111832796 B CN111832796 B CN 111832796B CN 202010132437 A CN202010132437 A CN 202010132437A CN 111832796 B CN111832796 B CN 111832796B
Authority
CN
China
Prior art keywords
electricity
distance
data
load
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010132437.6A
Other languages
English (en)
Other versions
CN111832796A (zh
Inventor
夏飞
张洁
张传林
龚春阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai University of Electric Power
Original Assignee
Shanghai University of Electric Power
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai University of Electric Power filed Critical Shanghai University of Electric Power
Priority to CN202010132437.6A priority Critical patent/CN111832796B/zh
Publication of CN111832796A publication Critical patent/CN111832796A/zh
Application granted granted Critical
Publication of CN111832796B publication Critical patent/CN111832796B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2113Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Economics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种针对居民用电负荷模式的精细分类及预测方法及系统,包括,采集居民的用电负荷数据及天气数据;基于贝叶斯信息准则对气象特征进行筛选;满足条件的气象特征构成气象特征库;对居民用电负荷数据行聚类分析,得到居民的用电模式;使用融合激活函数对LSTM网络进行改进;基于改进LSTM网络分别对不同用电模式下的居民用电负荷进行预测。本发明的有益效果:本发明提供的分类和预测方法能够对居民的用电模式进行更精确的分类,并根据分类结果得到更为精准的预测结果。

Description

一种针对居民用电负荷模式的精细分类及预测方法及系统
技术领域
本发明涉及用电预测的技术领域,尤其涉及一种针对居民用电负荷模式的精细分类及预测方法及系统。
背景技术
近年来,随着智能电网建设规模的不断扩大、电力系统中智能电表的广泛应用,电力公司相关部门积累了大量的用电数据,通过相应的数据挖掘技术可以挖掘出信息中隐藏的宝贵信息。目前,大量研究通过聚类分析的方法实现用电负荷曲线的模式识别。对居民用户的用电数据进行聚类,可以分析得到不同居民的用电习惯,从而总结出用电规律以及用电的特征等情况,为进一步的预测做打算。因此,对用户的用电负荷曲线进行聚类分析,挖掘其用电行为,已经成为智能用电大数据挖掘的关键。
负荷曲线聚类能够用于负荷预测、电网规划、需求侧响应等方面,有助于挖掘出用电数据中隐藏的重要信息,提取用户的用电行为特征。在聚类前需要先对数据进行降维处理,从而降低复杂度并提取相应的特征,目前,在负荷曲线的聚类算法中大多采用单一的欧氏距离为相似性度量,欧氏距离是根据几何平均距离来衡量样本间的相似性,其缺点是不能反映曲线形态及趋势的相似性;此外在特征聚类方面,通常采用传统的K-means算法,其对于用电高峰的识别较为准确,但是对于相同用电水平下的不同用电模式无法精准识别,即聚类的粒度不够,这些都会影响对居民用电负荷模式的分类和预测结果的准确度。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有存在的问题,提出了本发明。
因此,本发明解决的一个技术问题是:提出一种针对居民用电负荷模式的精细分类及预测方法,能够提高分类和预测结果的精度。
为解决上述技术问题,本发明提供如下技术方案:一种针对居民用电负荷模式的精细分类及预测方法,包括,采集居民的用电负荷数据及天气数据;基于贝叶斯信息准则对气象特征进行筛选;满足条件的气象特征构成气象特征库;对居民用电负荷数据行聚类分析,得到居民的用电模式;使用融合激活函数对LSTM网络进行改进;基于改进LSTM网络分别对不同用电模式下的居民用电负荷进行预测。
作为本发明所述的针对居民用电负荷模式的精细分类及预测方法的一种优选方案,其中:所述贝叶斯信息准则定义为,
Figure BDA0002396161900000021
Figure BDA0002396161900000022
Figure BDA0002396161900000023
其中,BIC为贝叶斯信息准则,k为模型参数的个数,
Figure BDA0002396161900000024
为似然函数,n为样本的数量,kln(n)为惩罚量,SSE为剩余平方和,SC和SC*分别表示聚类评价指标的最优值及实际输出的评价指标值。
作为本发明所述的针对居民用电负荷模式的精细分类及预测方法的一种优选方案,其中:所述特征筛选中通过轮廓系数指标进行聚类评价,包括,
假设数据集X被分为J个类簇:C={C1,C2,…,CJ},则数据集X中的某一样本i的轮廓系数指标定义为,
Figure BDA0002396161900000025
其中,数据集X为采集到的数据,a(xi)表示xi到同一簇内其他对象之间的平均距离,为所属类簇的内聚度,b(xi)表示xi到其余类簇的最小平均距离,为所属类簇与其他类簇的分离度,其计算公式分别为,
Figure BDA0002396161900000026
Figure BDA0002396161900000027
计算出所有样本ISC的均值作为数据集X的ISC,其取值范围为[-1,1]。
作为本发明所述的针对居民用电负荷模式的精细分类及预测方法的一种优选方案,其中:所述对居民用电数据进行聚类分析还包括,统计居民用电的用电曲线;计算曲线的加权皮尔逊距离;采用密度峰值法得到聚类结果。
作为本发明所述的针对居民用电负荷模式的精细分类及预测方法的一种优选方案,其中:所述加权皮尔逊距离的计算公式为,
D(L1,L2)=1-ρ(L1,L2)
Figure BDA0002396161900000031
其中,L1、L2为用电轨迹,D(L1,L2)为加权皮尔逊距离,ρ为加权皮尔逊系数,W为权值矩阵{wi},i=1,2,…,n,cov为协方差,且,
Figure BDA0002396161900000032
Figure BDA0002396161900000033
其中,m(L1)和m(L2)为对应用电曲线的均值,cov为协方差。
作为本发明所述的针对居民用电负荷模式的精细分类及预测方法的一种优选方案,其中:所述密度峰值法计算包括局部密度ρi,计算公式如下,
Figure BDA0002396161900000034
其中,dij为加权皮尔逊距离,dc为截断距离。
作为本发明所述的针对居民用电负荷模式的精细分类及预测方法的一种优选方案,其中:所述密度峰值法还包括与高密度点之间的距离δi,其计算公式如下,
Figure BDA0002396161900000035
其中,dij为加权皮尔逊距离,对于数据集中局部密度最大的样本点xi,距离δi的计算公式为,
δi=maxj(dij)
作为本发明所述的针对居民用电负荷模式的精细分类及预测方法的一种优选方案,其中:所述融合激活函数的计算公式为,
Figure BDA0002396161900000036
其导数函数为,
Figure BDA0002396161900000037
融合激活函数的输出均值接近于零,且x≥0时,导函数使人工神经网络保持梯度的递增;x<0时,对外部不同的输入进行筛选。
作为本发明所述的针对居民用电负荷模式的精细分类及预测方法的一种优选方案,其中:所述预测采用平均绝对百分误差和均方根误差作为预测误差,其计算公式分别为,
Figure BDA0002396161900000041
Figure BDA0002396161900000042
其中,n为测试样本的数量,yi为第i个测试样本的负荷真实值,
Figure BDA0002396161900000043
为第i个样本的负荷预测值。
本发明解决的另一个技术问题是:提供一种针对居民用电负荷模式的精细分类及预测系统,使上述方法能够依托于该系统实现。
为解决上述技术问题,本发明提供如下技术方案:一种针对居民用电负荷模式的精细分类及预测系统,包括,采集模块,所述采集模块用于采集用电负荷数据和天气数据;筛选模块,所述筛选模块能够对采集到的数据进行筛选;聚类分析模块,所述聚类分析模块对筛选后的数据进行聚类;预测模块,所述预测模块根据输入的数据进行分析后得到预测结果。
本发明的有益效果:本发明提供的分类和预测方法能够对居民的用电模式进行更精确的分类,并根据分类结果得到更为精准的预测结果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明第一种实施例所述针对居民用电负荷模式的精细分类及预测方法的整体流程示意图;
图2为本发明第一种实施例中所述居民日用电曲线的示意图;
图3为基于皮尔逊距离的密度峰值聚类结果;
图4为基于加权皮尔逊距离的密度聚类结果;
图5为基于欧氏距离K-means聚类结果的进行的负荷预测结果示意图;
图6为基于皮尔逊距离聚类结果进行的负荷预测结果示意图;
图7为基于加权皮尔逊距离聚类结果进行的负荷预测结果示意图;
图8为本发明第二种实施例所述针对居民用电负荷模式的精细分类及预测系统的整体结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例1
参照图1的示意,示意为本实施例提出的一种针对居民用电负荷模式的精细分类及预测方法的整体流程示意图,包括以下步骤,
S1:采集居民的用电负荷数据及天气数据。
进行数据采集时,不仅包括居民的用电日负荷数据,而且结合其对应的每日气象特征。其中,居民的用电负荷数据可以通过电力公司统计等渠道获取,如通过居民电表获取,天气数据可以通过气象局发布的数据进行获取,如气象网站,本实施例中采集的数据量为1年。
所述采集的天气数据包括最高温、最低温、平均温、压强、湿度、风向、雨水和风速指标的数据。
S2:基于贝叶斯信息准则对气象特征进行筛选。由于采集到的气象特征种类繁多,若将所有气象特征都用于聚类分析,不仅会增加聚类时间,而且降低了聚类效果。因此,本实施例中采用贝叶斯信息准则对采集到的气象特征进行筛选,选择满足一定条件的气象特征进入特征库。从而实现降低维度的目的,减少数据处理时间,既降低了复杂度,又提取了相应的特征,达到更好的聚类效果。
具体的,所述贝叶斯信息准则定义为,
Figure BDA0002396161900000061
Figure BDA0002396161900000062
Figure BDA0002396161900000063
其中,BIC为贝叶斯信息准则,k为模型参数的个数,
Figure BDA0002396161900000064
为似然函数,n为样本的数量,k ln(n)为惩罚量,SSE为剩余平方和,SC和SC*分别表示聚类评价指标的最优值及实际输出的评价指标值。
基于聚类评价指标的最优值及实际输出的评价指标值的剩余平方和为性能指标。本实施例中,筛选要求为SSE的值不大于8的特征,从而实现特征选择。
其中,所述特征筛选中通过轮廓系数指标进行聚类评价,包括,
假设数据集X被分为J个类簇:C={C1,C2,…,CJ},则数据集X中的某一样本i的轮廓系数指标定义为,
Figure BDA0002396161900000071
其中,数据集X为采集的数据,包括用电负荷和天气数据,a(xi)表示xi到同一簇内其他对象之间的平均距离,为所属类簇的内聚度,b(xi)表示xi到其余类簇的最小平均距离,为所属类簇与其他类簇的分离度,a(xi)的值越小表示簇越紧凑,b(xi)的值越大表示簇与簇间越分离,其计算公式分别为,
Figure BDA0002396161900000072
Figure BDA0002396161900000073
计算出所有样本ISC的均值作为数据集X的ISC,其取值范围为[-1,1],ISC的值越接近1,说明聚类效果越好。
S3:满足条件的气象特征构成气象特征库。
具体的,采集到的气象特征通过贝叶斯信息准则进行筛选,本实施例中选择BIC值小于或等于8的气象特征,将筛选出的气象特征指标数据作为分析时使用的气象特征库。
S4:对居民用电负荷数据行聚类分析,得到居民的用电模式。为了提高聚类的粒度,更精准的识别相同用电水平下的不同用电模式,本实施例采用改进的密度峰值算法对居民用电负荷进行精细聚类,在保证原始算法聚类质量的基础上,降低了人为主观性和算法的冗余性,使得聚类结果更加可靠,同时也为用户负荷预测提供了准确的用电模式。
具体的,所述对居民用电数据进行聚类分析还包括以下步骤,
S4-1:统计居民用电的用电轨迹。用电轨迹根据采集模块采集的数据得出,参照图2的示意,本实施例中统计的为居民的日用电曲线,即一日间不同时间段中居民的用电量变化曲线,采集间隔1小时。
假设统计后得到的两条用电轨迹为L1和L2,其中,L1={xi},i=1,2,…,n;L2={yi},i=1,2,…,n。
S4-2:计算轨迹的加权皮尔逊距离;
根据以上统计的用电轨迹为L1、L2计算其加权皮尔逊距离,具体的,所述加权皮尔逊距离的计算公式为,
D(L1,L2)=1-ρ(L1,L2)
Figure BDA0002396161900000081
其中,L1、L2为用电轨迹,D(L1,L2)为加权皮尔逊距离,ρ为加权皮尔逊系数,W为权值矩阵{wi},i=1,2,…,n,cov为协方差,且,
Figure BDA0002396161900000082
Figure BDA0002396161900000083
其中,m(L1)和m(L2)为对应用电曲线的均值,cov为协方差。
S4-3:采用密度峰值法得到聚类结果。由于居民用电数据规模较大,为了能够快速实现聚类分析,本实施例采用密度峰值算法进行聚类分析,该算法主要有两个需要计算的量,分别为局部密度以及与高密度点之间的距离。
具体的,所述局部密度ρi的计算公式如下,
Figure BDA0002396161900000084
Figure BDA0002396161900000085
其中,dij为加权皮尔逊距离,dc为截断距离,dc的取值会影响聚类结果的准确性,dc取值过大时,会导致实际聚类数比真实聚类簇多;dc取值过小时,会导致聚类数比真实簇类数少。本实施例中,选取的截断距离应确保每个数据点的平均邻居个数约为数据点总数的1%~2%。
为了减少dc对聚类结果的影响,本实施例采用高斯核函数对局部密度进行改进,改进后的公式为,
Figure BDA0002396161900000086
其中,dij为加权皮尔逊距离,dc为截断距离,
所述密度峰值法还包括与高密度点之间的距离δi,其计算公式如下,
Figure BDA0002396161900000091
其中,dij为加权皮尔逊距离,δi为每个样本点xi到更高密度点间的最小距离,对于数据集中局部密度最大的样本点xi,距离δi的计算公式为,
δi=maxj(dij)
在使用未加权的皮尔逊距离和密度峰值法时,局部密度的取值范围是[0,20.5],高密度点间距离的取值范围是[0,1.6];而使用加权的皮尔逊距离和密度峰值法时,局部密度的取值范围是[0,20],高密度点间距离的取值范围是[0,2]。因此结合加权皮尔逊距离和密度峰值算法,能够获取更为精确的聚类结果,
S5:使用融合激活函数对LSTM网络进行改进。其中,传统的LSTM网络存在长时间梯度消失的问题,本实施例采用融合激活函数对LSTM网络改进,融合激活函数的主要作用是提供网络的非线性建模能力,使LSTM网络具备分层的非线性映射学习能力,改善融合激活函数的饱和特性从而改善梯度消失。
所述融合激活函数的计算公式为,
Figure BDA0002396161900000092
本实施例采用的融合激活函数融合了双曲正弦函数函数和ReLU函数的优点,函数左侧具有软饱和性,右侧无饱和性,左侧的软饱和能够让融合激活函数对输入更鲁棒,而右侧线性部分使得其能够缓解梯度消失问题。
其导数函数为,
Figure BDA0002396161900000093
融合激活函数的输出均值接近于零,且x≥0时,导函数使人工神经网络保持梯度的逐渐递增;x<0时,对外部不同的输入进行筛选,具有自适应的特点。融合激活函数的输出均值接近于零,可以有效防止零点漂移,因此收敛速度更快。
S6:基于改进LSTM网络分别对不同用电模式下的居民用电负荷进行预测。
所述预测采用平均绝对百分误差和均方根误差作为预测误差,其计算公式分别为,
Figure BDA0002396161900000094
Figure BDA0002396161900000101
其中,n为测试样本的数量,yi为第i个测试样本的负荷真实值,
Figure BDA0002396161900000103
为第i个样本的负荷预测值。
本领域技术人员应当理解的是,改进LSTM网络在投入使用前需要经过训练,基于改进LSTM网络进行预测,输出结果为预测的用电负荷。
场景一:
传统的针对居民用电负荷模式的分类方法为直接采用居民负荷进行聚类,即使加入其它特征,通常也不会进行特征筛选,或是利用相关系数进行筛选。另外传统方法在进行聚类的时候,采用的是基于欧式距离的K-means算法。
为了验证本实施例提供的针对居民用电负荷模式的精细分类及预测方法相对于传统方法具有更高的精确性,选择某市一居民小区一年内的用电负荷及天气数据,并分别使用传统方法和本实施例提供方法进行分析,比较得到的结果。其中,居民用电负荷每一小时采集一次,每天共采集24个数据点;气象数据中包括最高温、最低温、平均温、压强、湿度、风向、雨水和风速数据。实验在单台CPU为2.6GHZ,内存为16GB,操作系统64位的计算机上完成,使用Matlab R2018a软件进行算法测试。
分别根据传统方法基于相关系数进行特征筛选,以及根据本施例提供的方法,基于贝叶斯信息准则对气象数据进行筛选,按照相关系数大于0.15进行特征选择,得到最高温、平均温、最低温、压强和风向作为气象特征,其特征指标的BIC值及相关系数计算结果如下表1所示,
表1:气象数据特征指标的BIC值及相关系数计算结果
Figure BDA0002396161900000102
从表2中可以看出,最低温的BIC值比平均温的BIC值更低,应该优先选择最低温,更符合负荷分析中的实际情况,即最高温和最低温比平均温对居民日负荷影响更大。根据BIC小于等于8的筛选原则,最终选择了最高温、最低温、平均温、压强和湿度作为居民用电分析的气象特征,用BIC值更优的湿度特征替换了传统的相关系数更佳的风向特征更加能够体现对负荷的影响。
本实施例提供的方法中采用加权皮尔逊距离度量方法并结合密度峰值法对居民每日负荷及气象特征进行聚类。皮尔逊距离作为相似性度量,更加突出了负荷曲线变化趋势的相似性。传统方法则采用单一的欧氏距离作为相似性度量,
利用皮尔逊距离和加权皮尔逊距离方法分别进行密度峰值聚类,结果分别如图3和图4所示。可以看出图3的类别4中的曲线实际上不是双峰特征,而是最高负荷出现在11点左右的单峰特征,因此该曲线出现在类别4是不够准确的;而通过加权皮尔逊距离的密度峰值聚类后,在图4中的类别4中有一条呈现出先大后小双峰特征的居民用电曲线。由此可知,采用加权皮尔逊距离的密度峰值法能够实现更加精细的居民用电模式划分。
居民用电模式划分后,最终需要对居民用电负荷进行预测,使用本实施例提出的改进LSTM网络分别对不同用电模式下的居民用电负荷进行预测,采用每一模式内的居民日负荷数据进行预测网络训练,然后对该模式下的一周居民用电负荷进行预测。
为了进行比较,分别对基于欧氏距离K-means聚类结果、基于加权皮尔逊距离密度峰值法得到的居民用电模式和基于皮尔逊距离密度峰值法得到的居民用电模式进行居民负荷预测,得到的结果如图5~7所示。
其中,对比图5和图6可以看出,使用欧氏距离K-means聚类结果进行负荷预测,预测误差指标MAPE=9.0658%,RMSE=73.1421;使用皮尔逊距离为相似性度量得到的聚类结果进行负荷预测,改进LSTM网络的训练时间为1521.7390s,预测误差指标MAPE=7.5555%,RMSE=62.3227;而使用加权皮尔逊距离为相似性度量,改进LSTM的训练时间为1516.6440s,得到的预测误差指标MAPE=6.6792%,RMSE=56.0085。其中,MAPE为平均绝对百分误差,RMSE为均方根误差,本实施例所采用的加权皮尔逊距离的密度峰值法聚类结果进行符合预测,缩短了深度神经网络的训练时间,降低了预测的平均绝对百分误差和均方根误差降低了。由此可知,通过本实施例提供的方法能够有效提高居民用电负荷的预测精度。
实施例2
参照图8的示意,示意为本实施例提出一种针对居民用电负荷模式的精细分类及预测系统的结构示意图,上述实施例提出的针对居民用电负荷模式的精细分类及预测方法,能够依托于本实施例的针对居民用电负荷模式的精细分类及预测系统实现。该系统包括采集模块100、筛选模块200、聚类分析模块300和预测模块400,其中,采集模块100用于采集用电负荷数据和天气数据;筛选模块200能够对采集到的数据进行筛选;聚类分析模块300对筛选后的数据进行聚类;预测模块400根据输入的数据进行分析后得到预测结果。
具体的,采集模块100用于获取用电负荷数据和对应的天气数据,用于后续的负荷模式分析;
筛选模块200用于天气特征筛选,通过该模块选择适合用于用户负荷模式分析的天气特征构成天气特征库;
聚类分析模块300用于居民用电数据的聚类分析,得到不同模式的居民用电分类;
预测模块400用于居民用电负荷的预测,根据居民用电负荷的不同类别,采用对应的预测模型预测该类居民的用电负荷。
使用该系统进行居民用电模式预测的流程如下:
步骤一:通过模块100,获取用电负荷数据和对应的每日天气数据;
步骤二:根据模块100获取的数据,输入模块200,根据筛选准则对天气特征进行筛选,确定用于后续聚类分析的天气特征;
步骤三:将选择的天气特征和每日居民用电负荷送入模块300,进行聚类分析,得到聚类结果;
步骤四:针对模块300得到的不同用负荷类别,分别采用LSTM预测网络构建该类别的预测模型;
步骤五:在模块400中构建好不同负荷类别的预测模型之后,采用模块400对属于对应类别的居民用电负荷进行预测,得到最终的预测结果。
应当认识到,本发明的实施例可以由计算机硬件、硬件和软件的组合、或者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。所述方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存储介质在计算机程序中实现,其中如此配置的存储介质使得计算机以特定和预定义的方式操作——根据在具体实施例中描述的方法和附图。每个程序可以以高级过程或面向对象的编程语言来实现以与计算机系统通信。然而,若需要,该程序可以以汇编或机器语言实现。在任何情况下,该语言可以是编译或解释的语言。此外,为此目的该程序能够在编程的专用集成电路上运行。
此外,可按任何合适的顺序来执行本文描述的过程的操作,除非本文另外指示或以其他方式明显地与上下文矛盾。本文描述的过程(或变型和/或其组合)可在配置有可执行指令的一个或多个计算机系统的控制下执行,并且可作为共同地在一个或多个处理器上执行的代码(例如,可执行指令、一个或多个计算机程序或一个或多个应用)、由硬件或其组合来实现。所述计算机程序包括可由一个或多个处理器执行的多个指令。
进一步,所述方法可以在可操作地连接至合适的任何类型的计算平台中实现,包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计算环境、单独的或集成的计算机平台、或者与带电粒子工具或其它成像装置通信等等。本发明的各方面可以以存储在非暂时性存储介质或设备上的机器可读代码来实现,无论是可移动的还是集成至计算平台,如硬盘、光学读取和/或写入存储介质、RAM、ROM等,使得其可由可编程计算机读取,当存储介质或设备由计算机读取时可用于配置和操作计算机以执行在此所描述的过程。此外,机器可读代码,或其部分可以通过有线或无线网络传输。当此类媒体包括结合微处理器或其他数据处理器实现上文所述步骤的指令或程序时,本文所述的发明包括这些和其他不同类型的非暂时性计算机可读存储介质。当根据本发明所述的方法和技术编程时,本发明还包括计算机本身。计算机程序能够应用于输入数据以执行本文所述的功能,从而转换输入数据以生成存储至非易失性存储器的输出数据。输出信息还可以应用于一个或多个输出设备如显示器。在本发明优选的实施例中,转换的数据表示物理和有形的对象,包括显示器上产生的物理和有形对象的特定视觉描绘。
如在本申请所使用的,术语“组件”、“模块”、“系统”等等旨在指代计算机相关实体,该计算机相关实体可以是硬件、固件、硬件和软件的结合、软件或者运行中的软件。例如,组件可以是,但不限于是:在处理器上运行的处理、处理器、对象、可执行文件、执行中的线程、程序和/或计算机。作为示例,在计算设备上运行的应用和该计算设备都可以是组件。一个或多个组件可以存在于执行中的过程和/或线程中,并且组件可以位于一个计算机中以及/或者分布在两个或更多个计算机之间。此外,这些组件能够从在其上具有各种数据结构的各种计算机可读介质中执行。这些组件可以通过诸如根据具有一个或多个数据分组(例如,来自一个组件的数据,该组件与本地系统、分布式系统中的另一个组件进行交互和/或以信号的方式通过诸如互联网之类的网络与其它系统进行交互)的信号,以本地和/或远程过程的方式进行通信。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (1)

1.一种针对居民用电负荷模式的精细分类及预测方法,其特征在于:包括,
采集居民的用电负荷数据及天气数据;
基于贝叶斯信息准则对气象特征进行筛选;
满足条件的气象特征构成气象特征库;
对居民用电负荷数据行聚类分析,得到居民的用电模式;
使用融合激活函数对LSTM网络进行改进;
基于改进LSTM网络分别对不同用电模式下的居民用电负荷进行预测;
所述贝叶斯信息准则定义为,
Figure FDA0003942952440000011
Figure FDA0003942952440000012
Figure FDA0003942952440000013
其中,BIC为贝叶斯信息准则,k为模型参数的个数,
Figure FDA0003942952440000014
为似然函数,n为样本的数量,kln(n)为惩罚量,SSE为剩余平方和,SC和SC*分别表示聚类评价指标的最优值及实际输出的评价指标值;
所述特征筛选中通过轮廓系数指标进行聚类评价,包括,
假设数据集X被分为J个类簇:C={C1,C2,…,CJ},则数据集X中的某一样本i的轮廓系数指标定义为,
Figure FDA0003942952440000015
其中,数据集X为采集到的数据,a(xi)表示xi到同一簇内其他对象之间的平均距离,为所属类簇的内聚度,b(xi)表示xi到其余类簇的最小平均距离,为所属类簇与其他类簇的分离度,其计算公式分别为,
Figure FDA0003942952440000016
Figure FDA0003942952440000017
计算出所有样本ISC的均值作为数据集X的ISC,其取值范围为[-1,1];
所述对居民用电数据进行聚类分析还包括,
统计居民用电的用电曲线;
计算曲线的加权皮尔逊距离;
采用密度峰值法得到聚类结果;
所述加权皮尔逊距离的计算公式为,
D(L1,L2)=1-ρ(L1,L2)
Figure FDA0003942952440000021
其中,L1、L2为用电轨迹,D(L1,L2)为加权皮尔逊距离,ρ为加权皮尔逊系数,W为权值矩阵{wi},i=1,2,…,n,cov为协方差,且,
Figure FDA0003942952440000022
Figure FDA0003942952440000023
其中,m(L1)和m(L2)为对应用电曲线的均值,cov为协方差;
所述密度峰值法计算包括局部密度ρi,计算公式如下,
Figure FDA0003942952440000024
其中,dij为加权皮尔逊距离,dc为截断距离;
所述密度峰值法还包括与高密度点之间的距离δi,其计算公式如下,
Figure FDA0003942952440000025
其中,dij为加权皮尔逊距离,对于数据集中局部密度最大的样本点xi,距离δi的计算公式为,
δi=maxj(dij)
所述融合激活函数的计算公式为,
Figure FDA0003942952440000026
其导数函数为,
Figure FDA0003942952440000027
融合激活函数的输出均值接近于零,且x≥0时,导函数使人工神经网络保持梯度的递增;x<0时,对外部不同的输入进行筛选;
所述预测采用平均绝对百分误差和均方根误差作为预测误差,其计算公式分别为,
Figure FDA0003942952440000031
Figure FDA0003942952440000032
其中,n为测试样本的数量,yi为第i个测试样本的负荷真实值,
Figure FDA0003942952440000033
为第i个样本的负荷预测值。
CN202010132437.6A 2020-02-29 2020-02-29 一种针对居民用电负荷模式的精细分类及预测方法及系统 Active CN111832796B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010132437.6A CN111832796B (zh) 2020-02-29 2020-02-29 一种针对居民用电负荷模式的精细分类及预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010132437.6A CN111832796B (zh) 2020-02-29 2020-02-29 一种针对居民用电负荷模式的精细分类及预测方法及系统

Publications (2)

Publication Number Publication Date
CN111832796A CN111832796A (zh) 2020-10-27
CN111832796B true CN111832796B (zh) 2022-12-23

Family

ID=72913621

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010132437.6A Active CN111832796B (zh) 2020-02-29 2020-02-29 一种针对居民用电负荷模式的精细分类及预测方法及系统

Country Status (1)

Country Link
CN (1) CN111832796B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112365164B (zh) * 2020-11-13 2023-09-12 国网江苏省电力有限公司扬州供电分公司 基于改进密度峰值快速搜索聚类算法的中大型能源用户用能特性画像方法
CN112488399B (zh) * 2020-12-04 2024-04-23 国网冀北电力有限公司计量中心 电力负荷预测方法及装置
CN112734135B (zh) * 2021-01-26 2022-07-15 吉林大学 一种电力负荷预测方法、智能终端及计算机可读存储介质
CN113159106B (zh) * 2021-02-26 2024-02-02 国网甘肃省电力公司 一种基于形态趋势特征的负荷曲线聚类方法、介质及设备
CN113361776A (zh) * 2021-06-08 2021-09-07 国网上海市电力公司 一种基于用户用电行为聚类的电力负荷概率预测方法
CN115455072A (zh) * 2022-08-02 2022-12-09 韩立军 基于区块链的能源电力供需系统
CN117154716B (zh) * 2023-09-08 2024-04-26 国网河南省电力公司 一种分布式电源接入配电网的规划方法及系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107016571A (zh) * 2017-03-31 2017-08-04 北京百分点信息科技有限公司 数据预测方法及其系统
CN107463751A (zh) * 2017-08-10 2017-12-12 山东师范大学 一种基于折半dbscan聚类算法的人群分组疏散仿真方法及系统
CN108416690A (zh) * 2018-01-19 2018-08-17 中国矿业大学 基于深度lstm神经网络的电网负荷预测方法
CN109002928A (zh) * 2018-08-13 2018-12-14 中国电力科学研究院有限公司 一种基于贝叶斯网络模型的电力负荷峰值预测方法和装置
CN109034244A (zh) * 2018-07-27 2018-12-18 国家电网有限公司 基于电量曲线特征模型的线损异常诊断方法及装置
CN109376772A (zh) * 2018-09-28 2019-02-22 武汉华喻燃能工程技术有限公司 一种基于神经网络模型的电力负荷组合预测方法
CN110414788A (zh) * 2019-06-25 2019-11-05 国网上海市电力公司 一种基于相似日和改进lstm的电能质量预测方法
CN110648026A (zh) * 2019-09-27 2020-01-03 京东方科技集团股份有限公司 预测模型构建方法、预测方法、装置、设备及介质
CN110674999A (zh) * 2019-10-08 2020-01-10 国网河南省电力公司电力科学研究院 基于改进聚类和长短期记忆深度学习的小区负荷预测方法
CN110852511A (zh) * 2019-11-13 2020-02-28 苏文电能科技股份有限公司 基于天气温度与k邻近理论的居民短期用电预测方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107016571A (zh) * 2017-03-31 2017-08-04 北京百分点信息科技有限公司 数据预测方法及其系统
CN107463751A (zh) * 2017-08-10 2017-12-12 山东师范大学 一种基于折半dbscan聚类算法的人群分组疏散仿真方法及系统
CN108416690A (zh) * 2018-01-19 2018-08-17 中国矿业大学 基于深度lstm神经网络的电网负荷预测方法
CN109034244A (zh) * 2018-07-27 2018-12-18 国家电网有限公司 基于电量曲线特征模型的线损异常诊断方法及装置
CN109002928A (zh) * 2018-08-13 2018-12-14 中国电力科学研究院有限公司 一种基于贝叶斯网络模型的电力负荷峰值预测方法和装置
CN109376772A (zh) * 2018-09-28 2019-02-22 武汉华喻燃能工程技术有限公司 一种基于神经网络模型的电力负荷组合预测方法
CN110414788A (zh) * 2019-06-25 2019-11-05 国网上海市电力公司 一种基于相似日和改进lstm的电能质量预测方法
CN110648026A (zh) * 2019-09-27 2020-01-03 京东方科技集团股份有限公司 预测模型构建方法、预测方法、装置、设备及介质
CN110674999A (zh) * 2019-10-08 2020-01-10 国网河南省电力公司电力科学研究院 基于改进聚类和长短期记忆深度学习的小区负荷预测方法
CN110852511A (zh) * 2019-11-13 2020-02-28 苏文电能科技股份有限公司 基于天气温度与k邻近理论的居民短期用电预测方法

Also Published As

Publication number Publication date
CN111832796A (zh) 2020-10-27

Similar Documents

Publication Publication Date Title
CN111832796B (zh) 一种针对居民用电负荷模式的精细分类及预测方法及系统
CN110648014B (zh) 一种基于时空分位数回归的区域风电预测方法及系统
CN110674841B (zh) 一种基于聚类算法的测井曲线识别方法
CN110929939B (zh) 一种基于聚类-信息量耦合模型下的滑坡灾害易发性空间预测方法
CN109299812B (zh) 一种基于深度学习模型和knn实时校正的洪水预测方法
CN108830423B (zh) 一种基于预报域的年径流预测方法
CN112381137A (zh) 新能源电力系统可靠性评估方法、装置、设备及存储介质
CN109150830B (zh) 一种基于支持向量机和概率神经网络的层次入侵检测方法
CN111861781A (zh) 一种居民用电行为聚类中的特征优选方法及系统
CN108133393A (zh) 数据处理方法及系统
CN112529638B (zh) 基于用户分类和深度学习的服务需求动态预测方法及系统
CN111985815A (zh) 一种能源电力运营评价指标的筛选方法及装置
CN113420506A (zh) 掘进速度的预测模型建立方法、预测方法及装置
CN116521764B (zh) 基于人工智能的环境设计数据处理方法
CN113240527A (zh) 基于可解释机器学习的债券市场违约风险预警方法
CN115269758A (zh) 面向乘客诱导的路网客流状态推演方法及系统
CN116992155B (zh) 一种利用nmf的不同活跃度用户长尾推荐方法与系统
CN117892162A (zh) 一种基于非负矩阵分解和机器学习的流域径流预报方法
CN116258279B (zh) 基于综合赋权的滑坡易发性评价方法和装置
CN113536373A (zh) 一种脱敏气象数据的生成方法
CN117493813A (zh) 一种城市碳强度的分析方法及相关设备
Noor et al. Prediction map of rainfall classification using random forest and inverse distance weighted (IDW)
CN111090679A (zh) 基于时序影响和图嵌入的时序数据表示学习方法
Xiang et al. Traffic state estimation of signalized intersections based on stacked denoising auto-encoder model
Ma The Research of Stock Predictive Model based on the Combination of CART and DBSCAN

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant