CN112330028A - 基于谱聚类和lstm神经网络的电动公交车充电负荷预测方法 - Google Patents
基于谱聚类和lstm神经网络的电动公交车充电负荷预测方法 Download PDFInfo
- Publication number
- CN112330028A CN112330028A CN202011235182.2A CN202011235182A CN112330028A CN 112330028 A CN112330028 A CN 112330028A CN 202011235182 A CN202011235182 A CN 202011235182A CN 112330028 A CN112330028 A CN 112330028A
- Authority
- CN
- China
- Prior art keywords
- daily load
- clustering
- curve
- data
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 36
- 230000003595 spectral effect Effects 0.000 title claims abstract description 28
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000012549 training Methods 0.000 claims abstract description 27
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 20
- 230000000877 morphologic effect Effects 0.000 claims abstract description 13
- 238000012545 processing Methods 0.000 claims abstract description 10
- 238000004140 cleaning Methods 0.000 claims abstract description 8
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 239000011159 matrix material Substances 0.000 claims description 52
- 230000000694 effects Effects 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 9
- 238000005259 measurement Methods 0.000 claims description 4
- 208000025174 PANDAS Diseases 0.000 claims description 3
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 claims description 3
- 235000016496 Panda oleosa Nutrition 0.000 claims description 3
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 238000004891 communication Methods 0.000 claims description 3
- 238000003064 k means clustering Methods 0.000 claims description 3
- 238000000926 separation method Methods 0.000 claims description 3
- 240000000220 Panda oleosa Species 0.000 claims 1
- 238000004088 simulation Methods 0.000 description 5
- 240000004718 Panda Species 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Strategic Management (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Marketing (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Tourism & Hospitality (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Development Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于谱聚类和LSTM神经网络的电动公交车充电负荷预测方法,该充电负荷预测方法包括:步骤一、电动公交车充电负荷数据处理及分析,即整理电动公交车充电负荷数据,并进行预处理与清洗,从而得到日负荷曲线,并分析日负荷曲线特征;步骤二、根据电动公交车日负荷曲线特征,利用考虑距离和形态特性的谱聚类算法对日负荷曲线进行聚类;步骤三、根据考虑距离和形态特性的谱聚类算法的负荷曲线聚类结果,对各类群体分别进行LSTM神经网络训练,确定最优网络参数,对预测日进行负荷预测。本发明通过聚类算法将具有相同特性的电动公交车划分为同一类簇,针对不同类簇进行LSTM神经网络建模分析,能提高总体负荷预测精度。
Description
技术领域
本发明属于电力负荷预测技术领域,涉及一种基于谱聚类和LSTM神经网络电动公交车充电负荷预测方法。
背景技术
随着电动汽车(EV)的发展,作为智能电网和智能交通网络集成关键环节的EV及其充电设施的应用研究正在如火如荼地进行中。其中公交车作为社会公共资源,在该领域的交通电力化得到了较好的推广和应用。目前电动公交车的渗透率较大,且充电频率和充电量较高,故而其充电负荷对电网运行与调度产生着不可忽略的影响。因此,电动公交车充电负荷预测研究具有重要的理论和现实意义。
随着分布式电源和EV等新型负荷类型大规模接入,对传统的负荷预测方法带来了极大挑战。近年来,人工智能方法广泛用于负荷预测领域,包括浅层网络和深度学习算法。然而,基于浅层网络的传统方法通常会陷入学习速度慢,收敛速度慢等问题。深度学习则具有出色的特征学习能力,并且可以用较少的参数表示复杂的功能。其中,长短期记忆网络(LSTM)神经网络模型作为时间循环神经网络可以有效解决EV充电的时间尺度问题,提高负荷预测的准确性。
另一方面,因为电力负荷与用户工作特性密切相关,通过聚类算法将具有相同特性的用户划分为同一类簇,对不同类簇进行建模分析,能提高总体负荷预测精度。目前的聚类方法多数仅将距离作为曲线相似度的判断依据,并且由于电动公交车较短的发车工作时间,其充电负荷具有间歇性,而不同线路公交车的充电负荷在时间和负荷量方面的差距较大,目前方法难以有效区分其充电负荷曲线。
发明内容
针对以上问题,考虑将聚类算法与充电负荷预测方法结合,采用基于距离与形态相似性度量的谱聚类算法对数据进行聚类处理,对聚类后的每簇数据进行建模分析,从而达到提高总体负荷预测精度的目的。
为了解决上述问题,本发明提出了一种基于谱聚类与LSTM神经网络的电动公交车充电负荷预测方法,包括如下步骤:
步骤一、电动公交车充电负荷数据处理及分析,即整理电动公交车充电负荷数据,对负荷数据进行预处理与清洗,从而得到日负荷曲线,并分析日负荷曲线特征;
步骤二、根据电动公交车日负荷曲线特征,利用考虑距离和形态特性的谱聚类算法对日负荷曲线进行聚类;包括:
步骤1、根据曲线距离特性,计算日负荷曲线i与j之间的欧氏距离di,j,并构建曲线距离相似度矩阵D:
式(3)和(4)中,di,j为日负荷曲线i与j之间的欧式距离;T为一日内的数据维数,也是时间间隔数;曲线自身相似度d11…dnn=0;
步骤2、根据曲线形态特性,计算日负荷曲线i与j之间的关联系数ξij(t)和关联度γij,并构建曲线形态特性相似度矩阵Y:
式(5)和(6)中,ξij(t)为日负荷曲线i与j之间的关联系数;ρ∈(0,1)为分辨系数;γij为关联度;
步骤3、结合以上曲线距离相似度矩阵D和曲线形态特性相似度矩阵Y,按权重构成新的谱聚类相似度矩阵W:
式(8)中,α,β分别为相似度矩阵D,Y的权重系数;
步骤4、基于谱聚类算法,对处理好的日负荷曲线进行聚类;
步骤三、根据考虑距离和形态特性的谱聚类算法的日负荷曲线聚类结果,对各类群体分别进行LSTM神经网络训练,确定最优网络参数,对预测日进行负荷预测。
进一步地,所述步骤一的具体步骤如下:
步骤1-1、根据充电桩后台采集到的电动公交车的充电数据,由交易电量和充电时间计算电动公交车充电负荷值,并以30min时间间隔得到日负荷值,从而得到其日负荷曲线;
步骤1-2、根据日负荷曲线的聚类主要依据日负荷曲线的形状、距离特征,而不是日负荷的实际大小,因此对数据进行标幺化处理,定义为:
式(1)中:xi(t)为日负荷曲线i在时间间隔t的实际日负荷值;xi′(t)为相应的标幺化值;xi,max与xi,min为日负荷曲线i中的最大日负荷值与最小日负荷值;
经标幺化的日负荷曲线数据为:
式(2)中:n为日负荷曲线个数;T为一日内的数据维数,也是时间间隔数;
步骤1-3、需要对由于数据丢失、通信错误或者用户操作不当造成的异常数据进行数据清洗,使用Pandas库中的isnull()函数判断缺失值,使用dropna()函数删除含有缺失值行。
进一步地,所述步骤二中步骤4的具体步骤如下:
步骤2-1、输入聚类所需的n×T维矩阵X,权重系数α=α0,权重系数β=β0和聚类数K=K0;
步骤2-2、由步骤1至步骤3确定距离与形态相似性度量函数,构造相似度矩阵W及度矩阵S;
根据式(9)可确定矩阵W,且矩阵W是n×n对称矩阵,如下所示:
式中:w11…wnn=0;
度矩阵S中元素si,可由式(10)求得:
利用上述元素,构造如下度矩阵S:
步骤2-3、构造拉普拉斯矩阵L:
L=S-W (12)
步骤2-4、计算标准化后的拉普拉斯矩阵L′,并取前K个最小特征值,计算特征向量:
步骤2-5、利用以上K个特征向量,组成新的矩阵Vn×K,构成特征向量空间;
步骤2-6、利用k-means聚类算法对特征向量空间Vn×K进行聚类,对应于原始数据的聚类,得到K簇的划分;
Bk={r1,r2,…,ru} (14)
式(14)中,Bk为第k簇的日负荷曲线编号集合,u为该簇日负荷曲线个数;
步骤2-7、选取SC(Silhouette Coefficient)指数和DBI(Davies-Bouldin Index)进行聚类结果评价,执行α=α+τ,β=1-α,τ为固定步长,重复步骤2-1至步骤2-7,直到满足终止条件;
其中,SC指数是指轮廓系数指数,SC指数结合内聚度和分离度两种因素评价聚类效果,SC指数越接近边界值表示聚类效果越好;DBI是指戴维森堡丁指数,又称为分类适确性指标,DBI表示类内距离平均值之和与类间距离之比的最大值,其值越小表示不同类相离越远,聚类效果越好;
终止条件如下:
①α=1;
②相邻两次SC指数或DBI变化小于阈值;
步骤2-8、执行K=K+1,重复步骤2-1至步骤2-8,直到根据SC指数和DBI,找到其
中一个最小值,从而确定日负荷曲线划分的簇数K;
步骤2-9、对最优聚类结果的日负荷曲线数据进行整理,为LSTM神经网络训练做准备。
进一步地,所述步骤三的具体步骤如下:
步骤3-1、确定LSTM神经网络训练时的输入特征,将输入特征标幺化,并转换成有监督学习;
步骤3-2、将准备好的输入数据按照一定比例pr划分为训练集和测试集;训练集用于训练LSTM神经网络,调整选取最优网络参数,测试集用于测试最终的网络性能;
步骤3-3、根据训练集数据对LSTM神经网络进行训练;
步骤3-4、在评价LSTM预测模型时,选择平均绝对百分误差(Mean AbsolutePercentage Error,MAPE)、平均绝对误差(Mean Absolute Error,MAE)以及均方根误差(Root Mean Square Error,RMSE)来描述预测效果。
与现有技术相比,本发明的有益效果是:
由于电动公交车EV使用中规模较大并且由于公交车工作性质,导致充电负荷具有间歇性的特征。本发明的充电负荷预测方法中将考虑距离与形态特性的谱聚类和LSTM神经网络预测相结合,将具有相同特性的电动公交车群体划分为一组,再进行LSTM神经网络负荷预测,能提高总体充电负荷预测精度。
附图说明
为了使本发明的优点更容易理解,将通过参考在附图中示出的具体实施方式更详细地描述上文简要描述的本发明。可以理解这些附图只描绘了本发明的典型实施方式,因此不应认为是对其保护范围的限制,通过附图以附加的特性和细节来描述和解释本发明。
图1是本发明充电负荷预测方法的流程图;
图2是某辆电动公交车日负荷曲线图;
图3是SC指数和DBI随聚类数K的变化趋势图;
图4是聚类中心线图;
图5是负荷预测模型对比图。
具体实施方式
在下文的描述中,给出了大量具体的细节以便提供对本发明更为彻底的理解。然而,对于本领域技术人员来说显而易见的是,本发明实施方式可以无需一个或多个这些细节而得以实施。在其他的例子中,为了避免与本发明实施方式发生混淆,对于本领域公知的一些技术特征未进行描述。
为了彻底了解本发明实施方式,将在下列的描述中提出详细的结构。显然,本发明实施方式的施行并不限定于本领域的技术人员所熟习的特殊细节。本发明的较佳实施方式详细描述如下,然而除了这些详细描述外,本发明还可以具有其他实施方式。
下面结合附图对本发明的实施例作进一步详细的说明:
本发明所提供的一种基于谱聚类和LSTM神经网络的电动公交车充电负荷预测方法,其流程如图1所示,主要包括电动公交车充电负荷数据处理及分析、基于双尺度谱聚类算法对电动公交车日负荷曲线进行聚类分析和对各类群体分别进行LSTM神经网络负荷预测;具体步骤如下:
步骤一、电动公交车充电负荷数据处理及分析,即整理电动公交车充电负荷数据,对负荷数据进行预处理与清洗,从而得到日负荷曲线,并分析日负荷曲线特征。
步骤1-1:根据充电桩后台采集到的电动公交车的充电数据,由交易电量和充电时间计算电动公交车充电负荷值,并以30min时间间隔得到日负荷值,从而得到其日负荷曲线,某辆电动公交车日负荷曲线如图2所示。
步骤1-2:对负荷数据进行简单的数据处理和数据清洗。
步骤1-2-1:根据日负荷曲线的聚类主要依据日负荷曲线的形状、距离特征,而不是日负荷的实际大小,因此对数据进行标幺化处理,定义为:
式(1)中:xi(t)为日负荷曲线i在时间间隔t的实际日负荷值;xi′(t)为相应的标幺化值;xi,max与xi,min为日负荷曲线i中的最大日负荷值与最小日负荷值;
经标幺化的日负荷曲线数据为:
式(2)中:n为日负荷曲线个数;T为一日内的数据维数,也是时间间隔数;
步骤1-2-2:需要对由于数据丢失、通信错误或者用户操作不当等造成的异常数据进行数据清洗,使用Pandas库中isnull()函数判断缺失值,使用dropna()函数删除含有缺失值行;
仿真算例中最后得到104辆电动公交车共31天数据,取30min间隔,一日内共48个数据维数,即n=3224,T=48,因此,日负荷曲线数据为X3224×48。
步骤二、根据电动公交车日负荷曲线特征,利用考虑距离和形态特性的谱聚类算法对日负荷曲线进行聚类。
步骤2-1:根据曲线距离特性,计算日负荷曲线i与j之间的欧氏距离di,j,并构建曲线距离相似度矩阵D:
式(3)和(4)中,di,j为日负荷曲线i与j之间的欧式距离;T为一日内的数据维数,也是时间间隔数;曲线自身相似度d11…dnn=0;
仿真算例中,n=3324,即D3324×3324为对角线为0的对称矩阵。
步骤2-2:根据曲线形态特性,计算日负荷曲线i与j之间的关联系数ξij(t)和关联度γij,并构建曲线形态特性相似度矩阵Y:
式(5)和(6)中,ξij(t)为负荷曲线i与j之间的关联系数;ρ∈(0,1)为分辨系数;γij为关联度;
仿真算例中,n=3324,即Y3324×3324为对角线为0的对称矩阵。
步骤2-3:结合以上曲线距离相似度矩阵D和曲线形态特性相似度矩阵Y,按权重构成新的谱聚类相似度矩阵W:
式(8)中,α,β分别为相似度矩阵D,Y的权重系数。
步骤2-4:输入聚类所需的3224×48维矩阵X,权重系数α=0.5,权重系数β=0.5和聚类数K=K0。
步骤2-5:由步骤2-1至步骤2-3确定距离与形态相似性度量函数,构造相似度矩阵W及度矩阵S。
根据式(9)可确定矩阵W,且矩阵W是3224×3224对称矩阵,如下所示:
式(9)中,w11…wnn=0;
度矩阵S中元素si,可由式(10)求得:
利用上述元素,构造如下度矩阵S:
步骤2-6:构造拉普拉斯矩阵L:
L=S-W (12)
步骤2-7:计算标准化后的拉普拉斯矩阵L′,并取前K个最小特征值,计算特征向量:
步骤2-8:利用以上K个特征向量,组成新的矩阵V3224×K,构成特征向量空间。
步骤2-9:利用k-means聚类算法对特征向量空间V3224×K进行聚类,对应于原始数据的聚类,得到K簇的划分;
BK={r1,r2,…,ru} (14)
式(14)中,BK为第K簇的负荷曲线编号集合,u为该簇负荷曲线个数。
步骤2-10:选取轮廓系数(Silhouette Coefficient,SC)指数和Davies-Bouldin指数(DBI)进行聚类结果评价;执行α=α+τ,β=1-α,τ为固定步长,重复步骤2-4至步骤2-10,直到满足终止条件;
其中,SC指数结合内聚度和分离度两种因素评价聚类效果,SC指数越接近边界值表示聚类效果越好;DBI表示类内距离平均值之和与类间距离之比的最大值,其值越小表示不同类相离越远,聚类效果越好;
终止条件如下:
①α=1;
②相邻两次SC指数或DBI变化小于阈值。
步骤2-11:执行K=K+1,重复步骤2-4至步骤2-11,直到根据SC指数和DBI,找到其中一个最小值,从而确定日负荷曲线划分的簇数K;
仿真算例中,得到K=13为最优聚类结果,其SC指数与DBI如图3所示。
步骤2-12:对最优聚类结果的日负荷曲线数据进行整理,为LSTM神经网络训练做准备。
步骤2-12-1:将步骤2-11所得的最终聚类结果数据导出,K簇数据按编号和日期按顺序排序。
步骤2-12-2:K簇数据按照相应日期和相应时刻点累加得到该簇实际充电负荷。
步骤三、根据考虑距离和形态特性的谱聚类算法的日负荷曲线聚类结果,对各类群体分别进行LSTM神经网络训练,确定最优网络参数,对预测日进行负荷预测。
步骤3-1-1:确定LSTM神经网络训练时的输入特征:
1)负荷点所属日期DATE;
2)负荷点所属时刻t,共T个时刻点;
3)负荷点所属星期类别e;
4)负荷点的温度Temp;
5)负荷点的降雨量Prci;
6)预测点前一时刻t-1的历史负荷。
步骤3-1-2:将以上输入特征构成输入特征矩阵In,In=[DATE t e Temp PrciCt-1],输出特征矩阵为Out,Out=[Ct]。
步骤3-1-3:由于输入数据的量纲不同,而LSTM神经网络要求输入在0~1之间,因此,将输入特征数据进行标幺化,得到标幺化输入特征矩阵In′。
步骤3-1-4:根据series_to_supervised()函数,将时间序列转换为监督学习问题。
步骤3-2:将准备好的输入数据按照一定比例pr划分为训练集和测试集;训练集用于训练LSTM神经网络,调整选取最优网络参数,测试集用于测试最终的网络性能。
步骤3-3:根据训练集数据对LSTM神经网络进行训练,LSTM神经网络的参数如下式(15)~式(20)更新:
ft=σ(Wf[ht-1,xt]+bf) (15)
it=σ(Wi[ht-1,xt]+bi) (16)
Ot=σ(Wo[ht-1,xt]+bo) (19)
一个LSTM单元有3个这样的门,分别是遗忘门、输入门、输出门;每个门由一个σ(sigmoid)神经网络层和一个乘法运算组成;σ函数的输出在0和1之间,指示输入数据信息的保持程度;0表示完全屏蔽,1表示完全通过;因此,通过将每个矢量相加并相乘,最终实现了充电负荷的输出。
步骤3-4:在评价LSTM预测模型时,选择平均绝对百分误差(Mean AbsolutePercentage Error,MAPE)、平均绝对误差(Mean Absolute Error,MAE)以及均方根误差(Root Mean Square Error,RMSE)来描述预测效果,计算公式如下:
仿真算例:
将本发明应用到某市电动公交车的充电负荷预测,来证明此充电负荷预测方法的可行性与有效性。
根据考虑距离与形态特性的谱聚类算法,得到电动公交车日负荷曲线聚类结果,最终聚类数K=13,聚类中心线如图4所示。
根据聚类结果得到K=13簇数据,对各簇进行LSTM神经网络训练,得到各簇预测日负荷,每簇的LSTM结构参数与预测性能如表1所示。
表1每簇的LSTM结构参数与预测性能
由表1可知,由于各类群体自身特征不同,预测性能也各不相同。将13簇的预测日结果累加,得到最终总日负荷预测结果。为验证本文所提方法有效性,将104辆电动公交车按相同日期累加得到日总负荷,再进行LSTM神经网络训练,对比结果如图5所示。预测模型MAPE误差对比如表2所示。
表2预测模型MAPE误差对比
预测日 | 12月27日 | 12月28日 | 12月29日 |
谱聚类-LSTM | 10.29% | 7.98% | 7.67% |
LSTM | 36.38% | 33.41% | 33.05% |
综上所述,本发明的内容并不局限在上述的实施例中,本领域的技术人员可以在本发明的技术指导思想之内提出其他的实施例,但这些实施例都包括在本发明的范围之内。
Claims (4)
1.一种基于谱聚类与LSTM神经网络的电动公交车充电负荷预测方法,其特征在于,包括如下步骤:
步骤一、电动公交车充电负荷数据处理及分析,即整理电动公交车充电负荷数据,对负荷数据进行预处理与清洗,从而得到日负荷曲线,并分析日负荷曲线特征;
步骤二、根据电动公交车日负荷曲线特征,利用考虑距离和形态特性的谱聚类算法对日负荷曲线进行聚类;包括:
步骤1、根据曲线距离特性,计算日负荷曲线i与j之间的欧氏距离di,j,并构建曲线距离相似度矩阵D:
式(3)和(4)中,di,j为日负荷曲线i与j之间的欧式距离;xi′(t)为日负荷曲线i在时间间隔t的实际日负荷值的标幺化值;xj′(t)为日负荷曲线j在时间间隔t的实际日负荷值的标幺化值;T为一日内的数据维数,也是时间间隔数;曲线自身相似度d11…dnn=0;
步骤2、根据曲线形态特性,计算日负荷曲线i与j之间的关联系数ξij(t)和关联度γij,并构建曲线形态特性相似度矩阵Y:
式(5)和(6)中,ξij(t)为日负荷曲线i与j之间的关联系数;ρ∈(0,1)为分辨系数;γij为关联度;
步骤3、结合以上曲线距离相似度矩阵D和曲线形态特性相似度矩阵Y,按权重构成新的谱聚类相似度矩阵W:
式(8)中,α,β分别为相似度矩阵D,Y的权重系数;
步骤4、基于谱聚类算法,对处理好的日负荷曲线进行聚类;
步骤三、根据考虑距离和形态特性的谱聚类算法的日负荷曲线聚类结果,对各类群体分别进行LSTM神经网络训练,确定最优网络参数,对预测日进行负荷预测。
2.根据权利要求1所述的基于谱聚类与LSTM神经网络的电动公交车充电负荷预测方法,其特征在于,所述步骤一的具体步骤如下:
步骤1-1、根据充电桩后台采集到的电动公交车的充电数据,由交易电量和充电时间计算电动公交车充电负荷值,并以30min时间间隔得到日负荷值,从而得到其日负荷曲线;
步骤1-2、根据日负荷曲线的聚类主要依据日负荷曲线的形状、距离特征,而不是日负荷的实际大小,因此对数据进行标幺化处理,定义为:
式(1)中:xi(t)为日负荷曲线i在时间间隔t的实际日负荷值;xi′(t)为日负荷曲线i在时间间隔t的实际日负荷值的标幺化值;xi,max与xi,min为日负荷曲线i中的最大日负荷值与最小日负荷值;
经标幺化的日负荷曲线数据为:
式(2)中:n为日负荷曲线个数;T为一日内的数据维数,也是时间间隔数;
步骤1-3、需要对由于数据丢失、通信错误或者用户操作不当造成的异常数据进行数据清洗,使用Pandas库中的isnull()函数判断缺失值,使用dropna()函数删除含有缺失值行。
3.根据权利要求1所述的基于谱聚类与LSTM神经网络的电动公交车充电负荷预测方法,其特征在于,所述步骤二中步骤4的具体步骤如下:
步骤2-1、输入聚类所需的n×T维矩阵X,权重系数α=α0,权重系数β=β0和聚类数K=K0;
步骤2-2、由步骤1至步骤3确定距离与形态相似性度量函数,构造相似度矩阵W及度矩阵S;
根据式(9)可确定矩阵W,且矩阵W是n×n对称矩阵,如下所示:
式中:w11…wnn=0;
度矩阵S中元素si,可由式(10)求得:
利用上述元素,构造如下度矩阵S:
步骤2-3、构造拉普拉斯矩阵L:
L=S-W (12)
步骤2-4、计算标准化后的拉普拉斯矩阵L′,并取前K个最小特征值,计算特征向量:
步骤2-5、利用以上K个特征向量,组成新的矩阵Vn×K,构成特征向量空间;
步骤2-6、利用k-means聚类算法对特征向量空间Vn×K进行聚类,对应于原始数据的聚类,得到K簇的划分;
Bk={r1,r2,…,ru} (14)
式(14)中,Bk为第k簇的日负荷曲线编号集合,u为该簇日负荷曲线个数;
步骤2-7、选取SC指数和DBI进行聚类结果评价,执行α=α+τ,β=1-α,τ为固定步长,重复步骤2-1至步骤2-7,直到满足终止条件;
其中,SC指数是指轮廓系数指数,SC指数结合内聚度和分离度两种因素评价聚类效果,SC指数越接近边界值表示聚类效果越好;DBI是指戴维森堡丁指数,DBI表示类内距离平均值之和与类间距离之比的最大值,其值越小表示不同类相离越远,聚类效果越好;
终止条件如下:
①α=1;
②相邻两次SC指数或DBI变化小于阈值;
步骤2-8、执行K=K+1,重复步骤2-1至步骤2-8,直到根据SC指数和DBI,找到其中一个最小值,从而确定日负荷曲线划分的簇数K;
步骤2-9、对最优聚类结果的日负荷曲线数据进行整理,为LSTM神经网络训练做准备。
4.根据权利要求1所述的基于谱聚类与LSTM神经网络的电动公交车充电负荷预测方法,其特征在于,所述步骤三的具体步骤如下:
步骤3-1、确定LSTM神经网络训练时的输入特征,将输入特征标幺化,并转换成有监督学习;
步骤3-2、将准备好的输入数据按照一定比例pr划分为训练集和测试集;训练集用于训练LSTM神经网络,调整选取最优网络参数,测试集用于测试最终的网络性能;
步骤3-3、根据训练集数据对LSTM神经网络进行训练;
步骤3-4、在评价LSTM预测模型时,选择平均绝对百分误差、平均绝对误差以及均方根误差来描述预测效果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011235182.2A CN112330028A (zh) | 2020-11-08 | 2020-11-08 | 基于谱聚类和lstm神经网络的电动公交车充电负荷预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011235182.2A CN112330028A (zh) | 2020-11-08 | 2020-11-08 | 基于谱聚类和lstm神经网络的电动公交车充电负荷预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112330028A true CN112330028A (zh) | 2021-02-05 |
Family
ID=74316393
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011235182.2A Pending CN112330028A (zh) | 2020-11-08 | 2020-11-08 | 基于谱聚类和lstm神经网络的电动公交车充电负荷预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112330028A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112990597A (zh) * | 2021-03-31 | 2021-06-18 | 国家电网有限公司 | 一种工业园区工厂用电负荷的超短期预测方法 |
CN113077122A (zh) * | 2021-03-12 | 2021-07-06 | 上海电力大学 | 一种基于电动汽车的时空分布充电负荷评估方法 |
CN113159106A (zh) * | 2021-02-26 | 2021-07-23 | 国网甘肃省电力公司 | 一种基于形态趋势特征的负荷曲线聚类方法、介质及设备 |
CN113159578A (zh) * | 2021-04-22 | 2021-07-23 | 杭州电子科技大学 | 基于强化学习的大型电动汽车充电站的充电优化调度方法 |
CN113780347A (zh) * | 2021-08-09 | 2021-12-10 | 上海电力大学 | 负荷曲线多重聚类集成方法、系统及存储介质 |
CN113988436A (zh) * | 2021-11-01 | 2022-01-28 | 广西电网有限责任公司 | 基于lstm神经网络和层级关系修正的用电量预测方法 |
CN114638440A (zh) * | 2022-05-17 | 2022-06-17 | 国网湖北省电力有限公司经济技术研究院 | 一种基于充电桩使用度的充电负荷超短期预测方法 |
CN116662629A (zh) * | 2023-08-02 | 2023-08-29 | 杭州宇谷科技股份有限公司 | 基于时序聚类的充电曲线检索方法、系统、装置和介质 |
CN116662629B (zh) * | 2023-08-02 | 2024-05-28 | 杭州宇谷科技股份有限公司 | 基于时序聚类的充电曲线检索方法、系统、装置和介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156895A (zh) * | 2016-07-29 | 2016-11-23 | 国网山东省电力公司经济技术研究院 | 一种基于模糊c均值聚类和分步网格搜索支持向量回归的电动汽车充电负荷预测方法 |
CN106570618A (zh) * | 2016-10-31 | 2017-04-19 | 国网福建省电力有限公司 | 一种基于聚类分析和神经网络的负荷同时系数预测方法 |
CN108710975A (zh) * | 2018-05-18 | 2018-10-26 | 国网江苏省电力有限公司徐州供电分公司 | 一种电动汽车负荷预测方法 |
CN108846530A (zh) * | 2018-09-28 | 2018-11-20 | 国网上海市电力公司 | 一种基于“聚类-回归”模型的短期负荷预测方法 |
CN109325631A (zh) * | 2018-10-15 | 2019-02-12 | 华中科技大学 | 基于数据挖掘的电动汽车充电负荷预测方法和系统 |
CN109325611A (zh) * | 2018-08-17 | 2019-02-12 | 华北电力大学 | 一种新型电动汽车充电站负荷预测方法 |
CN110889527A (zh) * | 2018-09-07 | 2020-03-17 | 国网甘肃省电力公司电力科学研究院 | 一种基于lstm神经网络的电动汽车充电负荷预测方法 |
CN111626514A (zh) * | 2020-05-29 | 2020-09-04 | 深圳供电局有限公司 | 一种电动汽车充电负荷预测方法及装置 |
-
2020
- 2020-11-08 CN CN202011235182.2A patent/CN112330028A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156895A (zh) * | 2016-07-29 | 2016-11-23 | 国网山东省电力公司经济技术研究院 | 一种基于模糊c均值聚类和分步网格搜索支持向量回归的电动汽车充电负荷预测方法 |
CN106570618A (zh) * | 2016-10-31 | 2017-04-19 | 国网福建省电力有限公司 | 一种基于聚类分析和神经网络的负荷同时系数预测方法 |
CN108710975A (zh) * | 2018-05-18 | 2018-10-26 | 国网江苏省电力有限公司徐州供电分公司 | 一种电动汽车负荷预测方法 |
CN109325611A (zh) * | 2018-08-17 | 2019-02-12 | 华北电力大学 | 一种新型电动汽车充电站负荷预测方法 |
CN110889527A (zh) * | 2018-09-07 | 2020-03-17 | 国网甘肃省电力公司电力科学研究院 | 一种基于lstm神经网络的电动汽车充电负荷预测方法 |
CN108846530A (zh) * | 2018-09-28 | 2018-11-20 | 国网上海市电力公司 | 一种基于“聚类-回归”模型的短期负荷预测方法 |
CN109325631A (zh) * | 2018-10-15 | 2019-02-12 | 华中科技大学 | 基于数据挖掘的电动汽车充电负荷预测方法和系统 |
CN111626514A (zh) * | 2020-05-29 | 2020-09-04 | 深圳供电局有限公司 | 一种电动汽车充电负荷预测方法及装置 |
Non-Patent Citations (1)
Title |
---|
马涛: ""组合预测方法研究及应用"", 《中国优秀博硕士学位论文全文数据库(博士)基础科学辑》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113159106A (zh) * | 2021-02-26 | 2021-07-23 | 国网甘肃省电力公司 | 一种基于形态趋势特征的负荷曲线聚类方法、介质及设备 |
CN113159106B (zh) * | 2021-02-26 | 2024-02-02 | 国网甘肃省电力公司 | 一种基于形态趋势特征的负荷曲线聚类方法、介质及设备 |
CN113077122A (zh) * | 2021-03-12 | 2021-07-06 | 上海电力大学 | 一种基于电动汽车的时空分布充电负荷评估方法 |
CN112990597A (zh) * | 2021-03-31 | 2021-06-18 | 国家电网有限公司 | 一种工业园区工厂用电负荷的超短期预测方法 |
CN112990597B (zh) * | 2021-03-31 | 2024-02-27 | 国家电网有限公司 | 一种工业园区工厂用电负荷的超短期预测方法 |
CN113159578B (zh) * | 2021-04-22 | 2022-05-20 | 杭州电子科技大学 | 基于强化学习的大型电动汽车充电站的充电优化调度方法 |
CN113159578A (zh) * | 2021-04-22 | 2021-07-23 | 杭州电子科技大学 | 基于强化学习的大型电动汽车充电站的充电优化调度方法 |
CN113780347A (zh) * | 2021-08-09 | 2021-12-10 | 上海电力大学 | 负荷曲线多重聚类集成方法、系统及存储介质 |
CN113780347B (zh) * | 2021-08-09 | 2024-03-01 | 上海电力大学 | 负荷曲线多重聚类集成方法、系统及存储介质 |
CN113988436A (zh) * | 2021-11-01 | 2022-01-28 | 广西电网有限责任公司 | 基于lstm神经网络和层级关系修正的用电量预测方法 |
CN113988436B (zh) * | 2021-11-01 | 2023-04-28 | 广西电网有限责任公司 | 基于lstm神经网络和层级关系修正的用电量预测方法 |
CN114638440A (zh) * | 2022-05-17 | 2022-06-17 | 国网湖北省电力有限公司经济技术研究院 | 一种基于充电桩使用度的充电负荷超短期预测方法 |
CN116662629A (zh) * | 2023-08-02 | 2023-08-29 | 杭州宇谷科技股份有限公司 | 基于时序聚类的充电曲线检索方法、系统、装置和介质 |
CN116662629B (zh) * | 2023-08-02 | 2024-05-28 | 杭州宇谷科技股份有限公司 | 基于时序聚类的充电曲线检索方法、系统、装置和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112330028A (zh) | 基于谱聚类和lstm神经网络的电动公交车充电负荷预测方法 | |
CN107529651A (zh) | 一种基于深度学习的城市交通客流预测方法和设备 | |
CN111091139A (zh) | 相似日聚类的光伏预测方法、装置、设备及可读存储介质 | |
Jiang et al. | Inbound tourism demand forecasting framework based on fuzzy time series and advanced optimization algorithm | |
CN111966823B (zh) | 一种面向标签噪声的图节点分类方法 | |
CN111144468A (zh) | 电力用户信息标签化方法和装置、电子设备以及存储介质 | |
CN111008726B (zh) | 一种电力负荷预测中类图片转换方法 | |
CN113255900A (zh) | 一种考虑改进谱聚类与Bi-LSTM神经网络的冲击性负荷预测方法 | |
CN111553510A (zh) | 一种短期风速预测方法 | |
CN110738232A (zh) | 一种基于数据挖掘技术的电网电压越限成因诊断方法 | |
CN114519514B (zh) | 一种低压台区合理线损值测算方法、系统及计算机设备 | |
CN113688253B (zh) | 一种层次感知的时态知识图谱表示学习方法 | |
CN111723257A (zh) | 基于用水规律的用户画像方法与系统 | |
CN113988426A (zh) | 一种基于fcm聚类和lstm的电动汽车充电负荷预测方法及系统 | |
CN115204035A (zh) | 基于多尺度时序数据融合模型的发电机组运行参数预测方法、装置及存储介质 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN113406503A (zh) | 基于深度神经网络的锂电池soh在线估算方法 | |
CN116435998A (zh) | 一种光伏发电功率的预测方法 | |
CN114880538A (zh) | 基于自监督的属性图社团检测方法 | |
CN113379116A (zh) | 基于聚类和卷积神经网络的台区线损预测方法 | |
CN113112177A (zh) | 一种基于混合指标的台区线损处理方法及系统 | |
CN114880754B (zh) | 基于bim的建筑能耗管理方法及系统 | |
CN116611702A (zh) | 一种面向楼宇综合能源管理的集成学习光伏发电预测方法 | |
CN106651630A (zh) | 关键用电行业识别方法和系统 | |
CN113393035B (zh) | 一种电动汽车日充放电功率预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210205 |
|
RJ01 | Rejection of invention patent application after publication |