CN112330028A

CN112330028A - 基于谱聚类和lstm神经网络的电动公交车充电负荷预测方法

Info

Publication number: CN112330028A
Application number: CN202011235182.2A
Authority: CN
Inventors: 王哲; 迟福建; 万宝; 李桂鑫; 孙阔; 董自帅; 凌天晗; 陈跃; 梁海深; 王庆彪; 徐福; 周建伟; 穆云飞; 董晓红; 邓友均; 唐舒懿
Original assignee: Tianjin University; State Grid Tianjin Electric Power Co Ltd; Binhai Power Supply Co of State Grid Tianjin Electric Power Co Ltd
Current assignee: Tianjin University; State Grid Tianjin Electric Power Co Ltd; Binhai Power Supply Co of State Grid Tianjin Electric Power Co Ltd
Priority date: 2020-11-08
Filing date: 2020-11-08
Publication date: 2021-02-05

Abstract

本发明公开了一种基于谱聚类和LSTM神经网络的电动公交车充电负荷预测方法，该充电负荷预测方法包括：步骤一、电动公交车充电负荷数据处理及分析，即整理电动公交车充电负荷数据，并进行预处理与清洗，从而得到日负荷曲线，并分析日负荷曲线特征；步骤二、根据电动公交车日负荷曲线特征，利用考虑距离和形态特性的谱聚类算法对日负荷曲线进行聚类；步骤三、根据考虑距离和形态特性的谱聚类算法的负荷曲线聚类结果，对各类群体分别进行LSTM神经网络训练，确定最优网络参数，对预测日进行负荷预测。本发明通过聚类算法将具有相同特性的电动公交车划分为同一类簇，针对不同类簇进行LSTM神经网络建模分析，能提高总体负荷预测精度。

Description

基于谱聚类和LSTM神经网络的电动公交车充电负荷预测方法

技术领域

本发明属于电力负荷预测技术领域，涉及一种基于谱聚类和LSTM神经网络电动公交车充电负荷预测方法。

背景技术

随着电动汽车(EV)的发展，作为智能电网和智能交通网络集成关键环节的EV及其充电设施的应用研究正在如火如荼地进行中。其中公交车作为社会公共资源，在该领域的交通电力化得到了较好的推广和应用。目前电动公交车的渗透率较大，且充电频率和充电量较高，故而其充电负荷对电网运行与调度产生着不可忽略的影响。因此，电动公交车充电负荷预测研究具有重要的理论和现实意义。

随着分布式电源和EV等新型负荷类型大规模接入，对传统的负荷预测方法带来了极大挑战。近年来，人工智能方法广泛用于负荷预测领域，包括浅层网络和深度学习算法。然而，基于浅层网络的传统方法通常会陷入学习速度慢，收敛速度慢等问题。深度学习则具有出色的特征学习能力，并且可以用较少的参数表示复杂的功能。其中，长短期记忆网络(LSTM)神经网络模型作为时间循环神经网络可以有效解决EV充电的时间尺度问题，提高负荷预测的准确性。

另一方面，因为电力负荷与用户工作特性密切相关，通过聚类算法将具有相同特性的用户划分为同一类簇，对不同类簇进行建模分析，能提高总体负荷预测精度。目前的聚类方法多数仅将距离作为曲线相似度的判断依据，并且由于电动公交车较短的发车工作时间，其充电负荷具有间歇性，而不同线路公交车的充电负荷在时间和负荷量方面的差距较大，目前方法难以有效区分其充电负荷曲线。

发明内容

针对以上问题，考虑将聚类算法与充电负荷预测方法结合，采用基于距离与形态相似性度量的谱聚类算法对数据进行聚类处理，对聚类后的每簇数据进行建模分析，从而达到提高总体负荷预测精度的目的。

为了解决上述问题，本发明提出了一种基于谱聚类与LSTM神经网络的电动公交车充电负荷预测方法，包括如下步骤：

步骤一、电动公交车充电负荷数据处理及分析，即整理电动公交车充电负荷数据，对负荷数据进行预处理与清洗，从而得到日负荷曲线，并分析日负荷曲线特征；

步骤二、根据电动公交车日负荷曲线特征，利用考虑距离和形态特性的谱聚类算法对日负荷曲线进行聚类；包括：

步骤1、根据曲线距离特性，计算日负荷曲线i与j之间的欧氏距离d_i,j，并构建曲线距离相似度矩阵D：

式(3)和(4)中，d_i,j为日负荷曲线i与j之间的欧式距离；T为一日内的数据维数，也是时间间隔数；曲线自身相似度d₁₁…d_nn＝0；

步骤2、根据曲线形态特性，计算日负荷曲线i与j之间的关联系数ξ_ij(t)和关联度γ_ij，并构建曲线形态特性相似度矩阵Y：

式(5)和(6)中，ξ_ij(t)为日负荷曲线i与j之间的关联系数；ρ∈(0,1)为分辨系数；γ_ij为关联度；

步骤3、结合以上曲线距离相似度矩阵D和曲线形态特性相似度矩阵Y，按权重构成新的谱聚类相似度矩阵W：

式(8)中，α，β分别为相似度矩阵D，Y的权重系数；

步骤4、基于谱聚类算法，对处理好的日负荷曲线进行聚类；

步骤三、根据考虑距离和形态特性的谱聚类算法的日负荷曲线聚类结果，对各类群体分别进行LSTM神经网络训练，确定最优网络参数，对预测日进行负荷预测。

进一步地，所述步骤一的具体步骤如下：

步骤1-1、根据充电桩后台采集到的电动公交车的充电数据，由交易电量和充电时间计算电动公交车充电负荷值，并以30min时间间隔得到日负荷值，从而得到其日负荷曲线；

步骤1-2、根据日负荷曲线的聚类主要依据日负荷曲线的形状、距离特征，而不是日负荷的实际大小，因此对数据进行标幺化处理，定义为：

式(1)中：x_i(t)为日负荷曲线i在时间间隔t的实际日负荷值；x_i′(t)为相应的标幺化值；x_i,max与x_i,min为日负荷曲线i中的最大日负荷值与最小日负荷值；

经标幺化的日负荷曲线数据为：

式(2)中：n为日负荷曲线个数；T为一日内的数据维数，也是时间间隔数；

步骤1-3、需要对由于数据丢失、通信错误或者用户操作不当造成的异常数据进行数据清洗，使用Pandas库中的isnull()函数判断缺失值，使用dropna()函数删除含有缺失值行。

进一步地，所述步骤二中步骤4的具体步骤如下：

步骤2-1、输入聚类所需的n×T维矩阵X，权重系数α＝α₀，权重系数β＝β₀和聚类数K＝K₀；

步骤2-2、由步骤1至步骤3确定距离与形态相似性度量函数，构造相似度矩阵W及度矩阵S；

根据式(9)可确定矩阵W，且矩阵W是n×n对称矩阵，如下所示：

式中：w₁₁…w_nn＝0；

度矩阵S中元素s_i，可由式(10)求得：

利用上述元素，构造如下度矩阵S：

步骤2-3、构造拉普拉斯矩阵L：

L＝S-W (12)

步骤2-4、计算标准化后的拉普拉斯矩阵L′，并取前K个最小特征值，计算特征向量：

步骤2-5、利用以上K个特征向量，组成新的矩阵V_n×K，构成特征向量空间；

步骤2-6、利用k-means聚类算法对特征向量空间V_n×K进行聚类，对应于原始数据的聚类，得到K簇的划分；

B_k＝{r₁,r₂,…,r_u} (14)

式(14)中，B_k为第k簇的日负荷曲线编号集合，u为该簇日负荷曲线个数；

步骤2-7、选取SC(Silhouette Coefficient)指数和DBI(Davies-Bouldin Index)进行聚类结果评价，执行α＝α+τ，β＝1-α，τ为固定步长，重复步骤2-1至步骤2-7，直到满足终止条件；

其中，SC指数是指轮廓系数指数，SC指数结合内聚度和分离度两种因素评价聚类效果，SC指数越接近边界值表示聚类效果越好；DBI是指戴维森堡丁指数，又称为分类适确性指标，DBI表示类内距离平均值之和与类间距离之比的最大值，其值越小表示不同类相离越远，聚类效果越好；

终止条件如下：

①α＝1；

②相邻两次SC指数或DBI变化小于阈值；

步骤2-8、执行K＝K+1，重复步骤2-1至步骤2-8，直到根据SC指数和DBI，找到其

中一个最小值，从而确定日负荷曲线划分的簇数K；

步骤2-9、对最优聚类结果的日负荷曲线数据进行整理，为LSTM神经网络训练做准备。

进一步地，所述步骤三的具体步骤如下：

步骤3-1、确定LSTM神经网络训练时的输入特征，将输入特征标幺化，并转换成有监督学习；

步骤3-2、将准备好的输入数据按照一定比例pr划分为训练集和测试集；训练集用于训练LSTM神经网络，调整选取最优网络参数，测试集用于测试最终的网络性能；

步骤3-3、根据训练集数据对LSTM神经网络进行训练；

步骤3-4、在评价LSTM预测模型时，选择平均绝对百分误差(Mean AbsolutePercentage Error，MAPE)、平均绝对误差(Mean Absolute Error，MAE)以及均方根误差(Root Mean Square Error，RMSE)来描述预测效果。

与现有技术相比，本发明的有益效果是：

由于电动公交车EV使用中规模较大并且由于公交车工作性质，导致充电负荷具有间歇性的特征。本发明的充电负荷预测方法中将考虑距离与形态特性的谱聚类和LSTM神经网络预测相结合，将具有相同特性的电动公交车群体划分为一组，再进行LSTM神经网络负荷预测，能提高总体充电负荷预测精度。

附图说明

为了使本发明的优点更容易理解，将通过参考在附图中示出的具体实施方式更详细地描述上文简要描述的本发明。可以理解这些附图只描绘了本发明的典型实施方式，因此不应认为是对其保护范围的限制，通过附图以附加的特性和细节来描述和解释本发明。

图1是本发明充电负荷预测方法的流程图；

图2是某辆电动公交车日负荷曲线图；

图3是SC指数和DBI随聚类数K的变化趋势图；

图4是聚类中心线图；

图5是负荷预测模型对比图。

具体实施方式

在下文的描述中，给出了大量具体的细节以便提供对本发明更为彻底的理解。然而，对于本领域技术人员来说显而易见的是，本发明实施方式可以无需一个或多个这些细节而得以实施。在其他的例子中，为了避免与本发明实施方式发生混淆，对于本领域公知的一些技术特征未进行描述。

为了彻底了解本发明实施方式，将在下列的描述中提出详细的结构。显然，本发明实施方式的施行并不限定于本领域的技术人员所熟习的特殊细节。本发明的较佳实施方式详细描述如下，然而除了这些详细描述外，本发明还可以具有其他实施方式。

下面结合附图对本发明的实施例作进一步详细的说明：

本发明所提供的一种基于谱聚类和LSTM神经网络的电动公交车充电负荷预测方法，其流程如图1所示，主要包括电动公交车充电负荷数据处理及分析、基于双尺度谱聚类算法对电动公交车日负荷曲线进行聚类分析和对各类群体分别进行LSTM神经网络负荷预测；具体步骤如下：

步骤一、电动公交车充电负荷数据处理及分析，即整理电动公交车充电负荷数据，对负荷数据进行预处理与清洗，从而得到日负荷曲线，并分析日负荷曲线特征。

步骤1-1：根据充电桩后台采集到的电动公交车的充电数据，由交易电量和充电时间计算电动公交车充电负荷值，并以30min时间间隔得到日负荷值，从而得到其日负荷曲线，某辆电动公交车日负荷曲线如图2所示。

步骤1-2：对负荷数据进行简单的数据处理和数据清洗。

步骤1-2-1：根据日负荷曲线的聚类主要依据日负荷曲线的形状、距离特征，而不是日负荷的实际大小，因此对数据进行标幺化处理，定义为：

经标幺化的日负荷曲线数据为：

步骤1-2-2：需要对由于数据丢失、通信错误或者用户操作不当等造成的异常数据进行数据清洗，使用Pandas库中isnull()函数判断缺失值，使用dropna()函数删除含有缺失值行；

仿真算例中最后得到104辆电动公交车共31天数据，取30min间隔，一日内共48个数据维数，即n＝3224，T＝48，因此，日负荷曲线数据为X_3224×48。

步骤二、根据电动公交车日负荷曲线特征，利用考虑距离和形态特性的谱聚类算法对日负荷曲线进行聚类。

步骤2-1：根据曲线距离特性，计算日负荷曲线i与j之间的欧氏距离d_i,j，并构建曲线距离相似度矩阵D：

仿真算例中，n＝3324，即D_3324×3324为对角线为0的对称矩阵。

步骤2-2：根据曲线形态特性，计算日负荷曲线i与j之间的关联系数ξij(t)和关联度γ_ij，并构建曲线形态特性相似度矩阵Y：

式(5)和(6)中，ξ_ij(t)为负荷曲线i与j之间的关联系数；ρ∈(0,1)为分辨系数；γ_ij为关联度；

仿真算例中，n＝3324，即Y_3324×3324为对角线为0的对称矩阵。

步骤2-3：结合以上曲线距离相似度矩阵D和曲线形态特性相似度矩阵Y，按权重构成新的谱聚类相似度矩阵W：

式(8)中，α，β分别为相似度矩阵D，Y的权重系数。

步骤2-4：输入聚类所需的3224×48维矩阵X，权重系数α＝0.5，权重系数β＝0.5和聚类数K＝K₀。

步骤2-5：由步骤2-1至步骤2-3确定距离与形态相似性度量函数，构造相似度矩阵W及度矩阵S。

根据式(9)可确定矩阵W，且矩阵W是3224×3224对称矩阵，如下所示：

式(9)中，w₁₁…w_nn＝0；

度矩阵S中元素s_i，可由式(10)求得：

利用上述元素，构造如下度矩阵S：

步骤2-6：构造拉普拉斯矩阵L：

L＝S-W (12)

步骤2-7：计算标准化后的拉普拉斯矩阵L′，并取前K个最小特征值，计算特征向量：

步骤2-8：利用以上K个特征向量，组成新的矩阵V_3224×K，构成特征向量空间。

步骤2-9：利用k-means聚类算法对特征向量空间V_3224×K进行聚类，对应于原始数据的聚类，得到K簇的划分；

B_K＝{r₁,r₂,…,r_u} (14)

式(14)中，B_K为第K簇的负荷曲线编号集合，u为该簇负荷曲线个数。

步骤2-10：选取轮廓系数(Silhouette Coefficient，SC)指数和Davies-Bouldin指数(DBI)进行聚类结果评价；执行α＝α+τ，β＝1-α，τ为固定步长，重复步骤2-4至步骤2-10，直到满足终止条件；

其中，SC指数结合内聚度和分离度两种因素评价聚类效果，SC指数越接近边界值表示聚类效果越好；DBI表示类内距离平均值之和与类间距离之比的最大值，其值越小表示不同类相离越远，聚类效果越好；

终止条件如下：

①α＝1；

②相邻两次SC指数或DBI变化小于阈值。

步骤2-11：执行K＝K+1，重复步骤2-4至步骤2-11，直到根据SC指数和DBI，找到其中一个最小值，从而确定日负荷曲线划分的簇数K；

仿真算例中，得到K＝13为最优聚类结果，其SC指数与DBI如图3所示。

步骤2-12：对最优聚类结果的日负荷曲线数据进行整理，为LSTM神经网络训练做准备。

步骤2-12-1：将步骤2-11所得的最终聚类结果数据导出，K簇数据按编号和日期按顺序排序。

步骤2-12-2：K簇数据按照相应日期和相应时刻点累加得到该簇实际充电负荷。

步骤3-1-1：确定LSTM神经网络训练时的输入特征：

1)负荷点所属日期DATE；

2)负荷点所属时刻t，共T个时刻点；

3)负荷点所属星期类别e；

4)负荷点的温度Temp；

5)负荷点的降雨量Prci；

6)预测点前一时刻t-1的历史负荷。

步骤3-1-2：将以上输入特征构成输入特征矩阵In，In＝[DATE t e Temp PrciC_t-1]，输出特征矩阵为Out，Out＝[C_t]。

步骤3-1-3：由于输入数据的量纲不同，而LSTM神经网络要求输入在0～1之间，因此，将输入特征数据进行标幺化，得到标幺化输入特征矩阵In′。

步骤3-1-4：根据series_to_supervised()函数，将时间序列转换为监督学习问题。

步骤3-2：将准备好的输入数据按照一定比例pr划分为训练集和测试集；训练集用于训练LSTM神经网络，调整选取最优网络参数，测试集用于测试最终的网络性能。

步骤3-3：根据训练集数据对LSTM神经网络进行训练，LSTM神经网络的参数如下式(15)～式(20)更新：

f_t＝σ(W_f[h_t-1,x_t]+b_f) (15)

i_t＝σ(W_i[h_t-1,x_t]+b_i) (16)

O_t＝σ(W_o[h_t-1,x_t]+b_o) (19)

一个LSTM单元有3个这样的门，分别是遗忘门、输入门、输出门；每个门由一个σ(sigmoid)神经网络层和一个乘法运算组成；σ函数的输出在0和1之间，指示输入数据信息的保持程度；0表示完全屏蔽，1表示完全通过；因此，通过将每个矢量相加并相乘，最终实现了充电负荷的输出。

步骤3-4：在评价LSTM预测模型时，选择平均绝对百分误差(Mean AbsolutePercentage Error，MAPE)、平均绝对误差(Mean Absolute Error，MAE)以及均方根误差(Root Mean Square Error，RMSE)来描述预测效果，计算公式如下：

式(21)至式(23)中：f_kt为第k簇在t时刻预测日的实际值，

为对应预测值。

仿真算例：

将本发明应用到某市电动公交车的充电负荷预测，来证明此充电负荷预测方法的可行性与有效性。

根据考虑距离与形态特性的谱聚类算法，得到电动公交车日负荷曲线聚类结果，最终聚类数K＝13，聚类中心线如图4所示。

根据聚类结果得到K＝13簇数据，对各簇进行LSTM神经网络训练，得到各簇预测日负荷，每簇的LSTM结构参数与预测性能如表1所示。

表1每簇的LSTM结构参数与预测性能

由表1可知，由于各类群体自身特征不同，预测性能也各不相同。将13簇的预测日结果累加，得到最终总日负荷预测结果。为验证本文所提方法有效性，将104辆电动公交车按相同日期累加得到日总负荷，再进行LSTM神经网络训练，对比结果如图5所示。预测模型MAPE误差对比如表2所示。

表2预测模型MAPE误差对比

预测日	12月27日	12月28日	12月29日
				谱聚类-LSTM	10.29％	7.98％	7.67％
LSTM	36.38％	33.41％	33.05％

综上所述，本发明的内容并不局限在上述的实施例中，本领域的技术人员可以在本发明的技术指导思想之内提出其他的实施例，但这些实施例都包括在本发明的范围之内。

Claims

1.一种基于谱聚类与LSTM神经网络的电动公交车充电负荷预测方法，其特征在于，包括如下步骤：

式(3)和(4)中，d_i,j为日负荷曲线i与j之间的欧式距离；x_i′(t)为日负荷曲线i在时间间隔t的实际日负荷值的标幺化值；x_j′(t)为日负荷曲线j在时间间隔t的实际日负荷值的标幺化值；T为一日内的数据维数，也是时间间隔数；曲线自身相似度d₁₁…d_nn＝0；

式(8)中，α，β分别为相似度矩阵D，Y的权重系数；

步骤4、基于谱聚类算法，对处理好的日负荷曲线进行聚类；

2.根据权利要求1所述的基于谱聚类与LSTM神经网络的电动公交车充电负荷预测方法，其特征在于，所述步骤一的具体步骤如下：

式(1)中：x_i(t)为日负荷曲线i在时间间隔t的实际日负荷值；x_i′(t)为日负荷曲线i在时间间隔t的实际日负荷值的标幺化值；x_i,max与x_i,min为日负荷曲线i中的最大日负荷值与最小日负荷值；

经标幺化的日负荷曲线数据为：

3.根据权利要求1所述的基于谱聚类与LSTM神经网络的电动公交车充电负荷预测方法，其特征在于，所述步骤二中步骤4的具体步骤如下：

根据式(9)可确定矩阵W，且矩阵W是n×n对称矩阵，如下所示：

式中：w₁₁…w_nn＝0；

度矩阵S中元素s_i，可由式(10)求得：

利用上述元素，构造如下度矩阵S：

步骤2-3、构造拉普拉斯矩阵L：

L＝S-W (12)

B_k＝{r₁,r₂,…,r_u} (14)

步骤2-7、选取SC指数和DBI进行聚类结果评价，执行α＝α+τ，β＝1-α，τ为固定步长，重复步骤2-1至步骤2-7，直到满足终止条件；

其中，SC指数是指轮廓系数指数，SC指数结合内聚度和分离度两种因素评价聚类效果，SC指数越接近边界值表示聚类效果越好；DBI是指戴维森堡丁指数，DBI表示类内距离平均值之和与类间距离之比的最大值，其值越小表示不同类相离越远，聚类效果越好；

终止条件如下：

①α＝1；

②相邻两次SC指数或DBI变化小于阈值；

步骤2-8、执行K＝K+1，重复步骤2-1至步骤2-8，直到根据SC指数和DBI，找到其中一个最小值，从而确定日负荷曲线划分的簇数K；

4.根据权利要求1所述的基于谱聚类与LSTM神经网络的电动公交车充电负荷预测方法，其特征在于，所述步骤三的具体步骤如下：

步骤3-3、根据训练集数据对LSTM神经网络进行训练；

步骤3-4、在评价LSTM预测模型时，选择平均绝对百分误差、平均绝对误差以及均方根误差来描述预测效果。