CN113255900A

CN113255900A - 一种考虑改进谱聚类与Bi-LSTM神经网络的冲击性负荷预测方法

Info

Publication number: CN113255900A
Application number: CN202110698758.7A
Authority: CN
Inventors: 李练兵; 李东颖; 张佳伟; 李脉; 董晓红; 李思佳; 李佳祺; 刘汉民; 刁嘉; 李明; 任杰; 王阳; 赵建华; 王海; 张文煜; 袁冬冬; 姚帅亮; 张海欣
Original assignee: State Grid Jibei Zhangjiakou Fengguang Storage And Transmission New Energy Co ltd; Hebei University of Technology
Current assignee: State Grid Jibei Zhangjiakou Fengguang Storage And Transmission New Energy Co ltd; Hebei University of Technology
Priority date: 2021-06-23
Filing date: 2021-06-23
Publication date: 2021-08-13

Abstract

本发明为一种考虑改进谱聚类与Bi‑LSTM神经网络的冲击性负荷预测方法。该方法考虑电动汽车充电负荷时序特征的不同，采用将改进谱聚类与Bi‑LSTM神经网络的冲击性负荷预测方法，选择DTW相似性度量的改进谱聚类算法对日负荷曲线进行聚类处理，对聚类后的每类曲线进行建模分析，从而达到提高总体负荷预测精度的目的。具体为通过对电动汽车充电负荷数据进行处理，得到日负荷曲线，并对曲线特征进行分析、选择DTW相似性度量的改进谱聚类算法对日负荷曲线进行聚类、根据负荷曲线聚类结果，对各类群体分别数据处理并进行Bi‑LSTM神经网络训练，从而对预测日进行充电负荷预测。

Description

一种考虑改进谱聚类与Bi-LSTM神经网络的冲击性负荷预测方法

技术领域

本发明属于电力负荷预测技术领域，涉及一种考虑改进谱聚类与Bi-LSTM神经网络的冲击性负荷预测方法。

背景技术

电动汽车(Electric Vehicle,EV)作为一种新型的电动化交通工具，其充电负荷在某些区域或时段整体负荷中的占比越来越高，接入电网时功率变化较大且持续时间较长，属于一种能量冲击性负荷。特别是包括电动公交车、电动出租车等充电频率高，充电功率大，对于区域供电能力的要求不断提高。因此，研究区域电动汽车短期充电负荷预测对于电网精准调度、提高能源利用率具有重要意义。

在众多负荷预测算法中，深度学习算法逐渐展现出其优势。其中，循环神经网络(Recurrent Neural Network，RNN)对时序数据非常有效，然而RNN具有有限的短期记忆信息能力，当相关信息与需要信息的位置之间的距离增加时，RNN则变得无法连接相关信息。而长短期记忆网络(LSTM)神经网络模型作为时间循环神经网络可以有效解决EV充电的时间尺度问题，提高负荷预测的准确性。

在现有EV充电负荷预测方法中，大多都将电动汽车总负荷数据进行简单处理后，直接作为输入进行建模预测，忽略了EV充电负荷不仅与天气、日类型等因素有关，还与用户充电行为有着密切关系。对不同充电行为模式的EV用户采用泛化的预测模型进行充电负荷预测时可能会导致精度不足。因此，对负荷特性聚类可将具有高相似度用电行为特性的用户进行归类，然后对不同类簇执行负荷预测，这样不仅能提高数据的纯净度，保证预测精度，还能大幅提高计算效率。在传统k-means算法的基础上，为提高对数据分布的适应性，提出了谱聚类算法来提高聚类效果。但随着对负荷曲线更精细分类的需求增加，谱聚类常用欧氏距离度量曲线的相似性，忽略了负荷曲线的形态特性。

发明内容

本发明的目的为针对当前技术中存在的问题，提供一种考虑改进谱聚类与Bi-LSTM神经网络的冲击性负荷预测方法。该方法考虑电动汽车充电负荷时序特征的不同，采用将改进谱聚类与Bi-LSTM神经网络的冲击性负荷预测方法，选择DTW相似性度量的改进谱聚类算法对日负荷曲线进行聚类处理，对聚类后的每类曲线进行建模分析，从而达到提高总体负荷预测精度的目的。具体为通过对电动汽车充电负荷数据进行处理，得到日负荷曲线，并对曲线特征进行分析、选择DTW相似性度量的改进谱聚类算法对日负荷曲线进行聚类、根据负荷曲线聚类结果，对各类群体分别数据处理并进行Bi-LSTM神经网络训练，从而对预测日进行充电负荷预测；

本发明的技术方案为：

一种考虑改进谱聚类与Bi-LSTM神经网络的冲击性负荷预测方法，包括如下步骤：

步骤一、处理电动汽车充电负荷数据，得到日负荷曲线，并分析日负荷曲线特征；

步骤二、根据电动汽车日负荷曲线，选择DTW相似性度量的改进谱聚类算法对日负荷曲线进行聚类处理；具体包括以下步骤：

步骤1、通过计算所有负荷曲线i与j之间的dtw距离，构造DTW相似性矩阵；

步骤2、基于考虑DTW相似性的改进谱聚类算法，对处理好的日负荷曲线进行聚类；

步骤三、根据考虑DTW相似性的改进谱聚类算法的负荷曲线聚类结果，对各类群体分别数据处理并建立Bi-LSTM神经网络模型，对预测日进行充电负荷预测；

进一步讲，上述步骤一中具体包括以下步骤：

步骤1-1：对电动汽车负荷数据进行数据筛选和处理；

步骤1-1-1：对数据进行预处理，利用Excel自带的筛选功能把用电量为零和充电状态显示故障的数据剔除；

步骤1-1-2：筛选有用的数据，包括有车辆编号VN、交易电量TP、充电开始时间C_st和充电结束时间C_et；

步骤1-1-3：将其余无用的数据剔除；

步骤1-2：根据预处理后电动汽车的负荷数据，计算电动汽车充电负荷值p，处理成15min时间间隔的日负荷值，从而得到其日负荷曲线；

通过公式(1)计算电动汽车充电负荷值p：

上述步骤二中考虑DTW相似性度量的改进谱聚类算法对日负荷曲线进行聚类具体包括以下步骤：

步骤2-1：改进谱聚类算法，首先输入负荷数据P，如式(2)所示：

式中，p₁(1)为第1条日负荷曲线的第1个时刻对应的负荷值；日负荷曲线i和j表示全部曲线中任意两条曲线，i,j∈{1,2,…,N}，N为日负荷曲线总条数；T为日负荷曲线i和j的负荷点个数；

步骤2-2：对日负荷曲线i和j，构造一个维数为T×T的矩阵D_ij，如式(3)所示：

式中，D_ij为对称矩阵，对角线元素均为0；T为日负荷曲线i和j的负荷点个数；d_ij(t₁,t₂)为矩阵元素，表示日负荷曲线i和j中任意两点之间的距离，可采用欧氏距离计算，如式(4)所示：

式中，t₁，t₂为负荷曲线i和j的时刻点，pⁱ _t1，p^j _t2为日负荷曲线i和j分别在t₁和t₂时刻对应的负荷值；

步骤2-3：将矩阵D_ij中元素按照行列下标数进行网格化处理，以左下角元素d_ij(1,1)为起点找到其相邻元素，依据单调性和连续性的约束条件，该点的下一点及其路径存在三种情况；这三种情况代表三条路径，具体为以起点为基础点的横纵斜三个方向，对应点分别为：d_ij(2,1)、d_ij(1,2)和d_ij(2,2)；

步骤2-4：根据步骤2-3得到的三条路径，任意选择其中一个点和相应路径，再按相同的方法继续寻找下一点及其路径，直到找到D_ij矩阵中右上角元素d_ij(T,T)为止；最终得到所有点，并构成弯曲路径PA；其中PA＝{pa₁,…pa_s,…,pa_K}，K为路径PA走的总步数，pa_s是路径上第s个点，其坐标为(t_1s,t_2s)；

步骤2-5：按照步骤2-3～2-4，能找到多条路径PA，某条路径中所有点对应的元素d_ij(pa_s)求和，即为该条路径距离；

步骤2-6：在所有路径PA中寻找最小距离即为负荷曲线i与j的动态时间弯曲距离dtw(i,j)，如式(5)所示：

步骤2-7：令i＝1,j＝1按照步骤2-2～2-6计算出dtw(1,1)，再令i＝1,j＝2计算出dtw(1,2)，已知i,j∈{1,2,…,N}，遍历所有i,j取值，循环步骤2-2～2-6，直到计算出dtw(N,N)；

步骤2-8：通过步骤2-7计算的所有负荷曲线i与j之间的dtw距离，构造DTW相似性矩阵：

式中，DTW相似性矩阵为对称矩阵，且对角线元素dtw(1,1)，…，dtw(N,N)均为0；

步骤2-9：由步骤2-8得到DTW矩阵中元素，计算度矩阵S中元素s_i，可由式(7)求得：

利用上述元素，构造如下度矩阵S：

步骤2-10：构造拉普拉斯矩阵L：

L＝S-DTW (9)

步骤2-11：计算标准化后的拉普拉斯矩阵L′，并取前k个特征值，计算特征向量：

步骤2-12：利用以上k个特征向量，组成新的矩阵V_N×k，构成特征向量空间；

步骤2-13：利用k-means++聚类算法对特征向量空间V_N×k进行聚类，对应于原始数据的聚类，得到k类的划分；

步骤2-14：选确定聚类数k时选择轮廓系数(Silhouette Coefficient，SC)与戴维森堡丁指数(Davies-Bouldin，DBI)对聚类效果进行评价，设置k上限值(k≤20)，判断k是否大于等于该值，是则执行步骤2-15，否则执行k＝k+1，并重复步骤2-11～2-14，直到k等于该值，则执行步骤2-15；

步骤2-15：通过步骤2-14将每次聚类结果的SC和DBI指标输出来，然后导出数据，画出SC和DBI曲线，找到一点，此时SC指值最大，DBI最小，此时指标即为最优，该点对应的聚类k为最终聚类数；

步骤2-16：将最优聚类结果的负荷曲线数据导出，k类数据按照相应日期和相应时刻点累加得到该类实际充电负荷，为Bi-LSTM神经网络训练做准备；

上述步骤三中根据考虑DTW相似性的改进谱聚类算法的负荷曲线聚类结果，对各类群体分别数据处理并建立Bi-LSTM神经网络模型，对预测日进行充电负荷预测具体步骤如下：

步骤3-1：分析影响电动汽车充电负荷因素，并对数据进行处理；

步骤3-1-1：分析影响电动汽车充电负荷因素，确定Bi-LSTM神经网络训练时的输入特征量，包括日期Day、星期Week、时间Time、工作日/休息日DT、温度Tem及历史负荷HL；

步骤3-1-2：将以上影响电动汽车充电负荷因素作为Bi-LSTM网络模型输入矩阵In，In＝[Day Week Time DT Tem HL]，输出矩阵OUT，OUT＝[y_pref]，y_pref为输出的预测值；

步骤3-1-3：将输入特征数据进行标准化处理，得到标准化矩阵In′；

步骤3-1-4：通过Python函数将时间序列数据转化为用于监督学习的数据，进而作为输入数据；

步骤3-2：将准备好的输入数据按照7:3比例划分为训练集和测试集。训练集用于训练Bi-LSTM神经网络参数，找到能使网络性能表现最佳的一组参数，确定为最终模型，测试集用于测试最终的网络性能，通过计算预测结果与真实数据间的误差大小来测试网络性能；

步骤3-3：根据训练集数据对Bi-LSTM神经网络进行训练，利用python中Keras包构建模型，将输入数据格式写成Bi-LSTM网络输入形式(样本、时间步长、特征)，分别设置好网络模型参数，包括优化器、损失函数、迭代次数epochs、批次batch_size、隐藏层神经元数量和全连接层；一个LSTM网络由多个LSTM单元组成，其个数等于时间步长数，且每个LSTM单元有三个主要组件负责遗忘、记忆和更新数据；这三个组件分别是输入门、遗忘门和输出门；其训练过程参数如下式(11)～式(16)：

f_t＝σ(W_f[y_t-1,In′_t]+b_f) (11)

i_t＝σ(W_i[y_t-1,In′_t]+b_i) (12)

O_t＝σ(W_o[y_t-1,In′_t]+b_o) (15)

式中，f_t为遗忘门输出；y_t-1为t-1时刻的输出；In′_t为t时刻的输入；i_t为输入门值；

为临时状态量；C_t为状态量；O_t为中间输出量；y_t为输出门值；b_f、b_i、b_c和b_o为偏置项；W_f、W_i、W_c和W_o为权值矩阵；σ为sigmoid函数；

步骤3-4：通过步骤3-3训练设置的网络模型参数，再输入测试集进行负荷预测，得到的y_t数据组，即为测试集的预测数据y_pref；

步骤3-5：输出预测结果，即为电动汽车预测日的负荷预测结果。

与现有技术相比，本发明的有益效果是：

针对电动汽车这种接入电网时功率变化较大且持续时间较长的能量冲击性负荷，在某些区域或时段整体负荷中的占比较高，且由于其充电时间及充电区域具有较强的随机性和不确定性，充电负荷曲线具有间歇性、波动性等特点。本发明冲击性负荷预测方法中将考虑DTW相似性的改进谱聚类和Bi-LSTM神经网络预测相结合，将具有相似特性的电动汽车群体划分为一组，再分别进行Bi-LSTM神经网络负荷预测，结合实施例预测结果表明，本发明所提方法预测值与真实值间MAPE误差在3.5％以下，3日平均MAPE误差比未进行聚类分析的Bi-LSTM神经网络算法降低3.53％，能提高充电负荷预测精度。

附图说明

图1是本发明规划方法的结构图；

图2是3条电动汽车日负荷曲线；

图3是改进谱聚类方法流程图；

图4是动态时间弯曲路径示意图；

图5是SC指数和DBI指数随聚类数k的变化趋势

图6是Bi-LSTM神经网络模型构建流程图；

图7是LSTM神经网络结构图；

图8是Bi-LSTM神经网络结构示意图；

图9是预测日结果图；

图10是负荷预测模型误差对比；

具体实施方式

以下结合附图对本发明实施方式作进一步详述。

为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案进行详细说明。

在本实施例中，该冲击性负荷预测方法的结构图如图1所示，包括对电动汽车充电负荷数据进行处理，得到日负荷曲线，并对曲线特征进行分析、选择DTW相似性度量的改进谱聚类算法对日负荷曲线进行聚类、根据负荷曲线聚类结果，对各类群体分别数据处理并进行Bi-LSTM神经网络训练，从而对预测日进行充电负荷预测；步骤如下：

步骤1-1：对海量电动汽车负荷数据进行数据筛选和处理，包括：车辆编号VN、订单创建时间OT、充电方式CM、充电桩编号CPN、充电站CS、交易电量TP、充电开始时间C_st和充电结束时间C_et；

步骤1-1-3：将其余无用的数据剔除；

步骤1-2：根据预处理后电动汽车的负荷数据，计算电动汽车充电负荷值p，处理成15min时间间隔的日负荷值，从而得到其日负荷曲线，图2是3条电动汽车日负荷曲线示意图；

计算电动汽车充电负荷值p：

本实施例中，包含103辆电动汽车共31天数据，取15min间隔，每日包含数据点数为96，即T＝96。图2可知，每一条电动汽车日负荷曲线数据是按时间顺序记录的数据列，每条曲线有96个数据点。这3条日负荷曲线为随机选取的包含不同特征的曲线，由图2可以看出，3条负荷曲线可以反应出电动汽车充电时的间歇性和波动性，曲线1反应该电动汽车在上午7点半开始充电，曲线2和曲线3所反应电动汽车集中在傍晚到凌晨进行充电，其中曲线3所表示电动汽车也在下午进行间歇充电；

步骤二、由步骤一中图2分析出电动汽车日负荷曲线具有典型的时序特征，采用能有效处理时序特性的DTW相似性度量的改进谱聚类算法对日负荷曲线进行聚类处理；具体包括以下步骤：

步骤2-1：改进谱聚类算法流程如图3所示，首先输入负荷数据P，如式(2)所示：

式中，p₁(1)为第1条日负荷曲线的第1个时刻对应的负荷值；日负荷曲线i和j表示全部曲线中任意两条曲线，i,j∈{1,2,…,N}，N为日负荷曲线总条数，本实施例中103辆电动汽车共31天数据，所以N＝103×31＝3193；T为日负荷曲线i和j的负荷点个数，T＝96；

步骤2-2：对日负荷曲线i和j，构造一个维数为T×T即(96×96)的矩阵D_ij，如式(3)所示：

式中，D_ij为对称矩阵，对角线元素均为0；d_ij(t₁,t₂)为矩阵元素，表示日负荷曲线i和j中任意两点之间的距离，可采用欧氏距离计算，如式(4)所示：

步骤2-3：将矩阵D_ij中元素按照行列下标数进行网格化处理，如图4所示，以左下角元素d_ij(1,1)为起点找到其相邻元素，依据单调性和连续性的约束条件，该点的下一点及其路径存在图中箭头所示三种情况，这三种情况代表三条路径，具体为以起点为基础点的横纵斜三个方向，对应点分别为：d_ij(2,1)、d_ij(1,2)和d_ij(2,2)；

步骤2-4：根据步骤2-3得到的三条路径，任意选择其中一条路径并得到下一点，再按相同的方法继续寻找下一点及其路径，直到找到D_ij矩阵中右上角元素d_ij(96,96)为止；最终得到所有点，并构成弯曲路径PA[邵翔,郭谋发,游林旭.基于改进DTW的接地故障波形互相关度聚类选线方法[J].电力自动化设备,2018,38(11):63-71+78]；其中PA＝{pa₁,…pa_s,…,pa_M}，M为路径PA走的总步数，pa_s是路径上第s个点，其坐标为(t_1s,t_2s)；

步骤2-5：按照步骤2-3～2-4，能找到多条路径PA，将某条路径中所有点对应的元素d_ij(pa_s)求和，即为该条路径距离；

即，以d_ij(1,1)为起点，下一步有三种情况，即d_ij(2,1)、d_ij(1,2)和d_ij(2,2)，三种路线都可以走，随机选择走d_ij(2,2)这一点，再以这个为起点按照以上步骤，再找到三种情况，即d_ij(3,2)、d_ij(2,3)和d_ij(3,3)，也是三种路线都可以走，同样随机选择d_ij(2,3)，再继续走，直到到达d_ij(96,96)。

步骤2-7：令i＝1,j＝1按照步骤2-2～2-6计算出dtw(1,1)，再令i＝1,j＝2计算出dtw(1,2)，已知i,j∈{1,2,…,3193}，遍历所有i,j取值，循环步骤2-2～2-6，直到计算出dtw(N,N)，即dtw(3193,3193)；

式中，DTW相似性矩阵为对称矩阵，且对角线元素dtw(1,1)，…，dtw(3193,3193)均为0；

步骤2-9：由步骤2-8得到DTW矩阵中元素，计算度矩阵S中对角线元素s_i，可由式(7)求得：

利用上述元素，构造如下度矩阵S：

步骤2-10：构造拉普拉斯矩阵L：

L＝S-DTW (9)

步骤2-11：计算标准化后的拉普拉斯矩阵L′，计算其全部特征值，设定初始聚类数k＝1，并取前k＝1个特征值，计算特征向量：

步骤2-12：利用以上k＝1个特征向量，组成新的矩阵V_3193×1，构成特征向量空间；

步骤2-13：在初始聚类中心的选取时，k-means随机在数据集中选取1个样本，一旦初始值选择不好，可能无法得到有效的聚类结果。为解决k-means算法对初始簇心比较敏感的问题，利用k-means++聚类算法对特征向量空间V_3193×1进行聚类，在数据集中随机选择一个样本作为第一个初始化聚类中心，计算样本中每一个样本点与已经初始化的聚类中心的距离，并选择其中最短的距离，以概率选择距离最大的点作为新的聚类中心，重复前两步直至选出k个聚类中心，对k个聚类中心使用k-means++算法计算最终的聚类结果，其聚类结果对应原始数据的聚类，得到k＝1类的划分；

步骤2-14：确定最终聚类数k时选择轮廓系数(Silhouette Coefficient，SC)与戴维森堡丁指数(Davies-Bouldin，DBI)对聚类效果进行评价，将聚类结果的SC和DBI指标输出来，由于对电动汽车进行聚类预测，分组过多反而增加预测工作量，降低效率，因此设置k值上限为20，判断k是否大于等于20，是则执行步骤2-15，否则执行k＝k+1，并重复步骤2-11～2-14，直到k＝20则执行步骤2-15；

在本实施例中，使用SC和DBI指标确定聚类数k，如图5所示，当k＝14时，SC与DBI达到最优值，因此，确定聚类数k＝14。

步骤三、根据考虑DTW相似性的改进谱聚类算法的负荷曲线聚类结果，对各类群体分别数据处理并建立Bi-LSTM神经网络模型，对预测日进行充电负荷预测，模型构建流程如图6所示，具体步骤如下：

步骤3-1-2：将以上影响电动汽车充电负荷因素按时间顺序排列作为Bi-LSTM网络模型输入矩阵In，In＝[Day Week Time DT Tem HL]，输出矩阵OUT，OUT＝[y_pref]，y_pref为输出的预测值；

步骤3-1-3：将输入特征数据按列进行标准化处理，得到标准化矩阵In′，为步骤3-1-4提供输入数据，标准化公式为：

式中in可分别表示为In中每一列中数据；

具体为使用Python函数中的series_to_supervised()函数将数据转换成有监督学习；

步骤3-2：将准备好的输入数据按照7:3比例划分为训练集和测试集；

训练集用于训练Bi-LSTM神经网络参数，找到能使网络性能表现最佳的一组参数，确定为最终模型，测试集用于测试最终的网络性能，通过计算预测结果与真实数据间的误差大小来测试网络性能；

步骤3-3：根据训练集数据对Bi-LSTM神经网络进行训练，利用python中Keras包构建模型，将输入数据格式写成Bi-LSTM网络输入形式(样本、时间步长、特征)，分别设置好网络模型参数，包括优化器(本实施例选择adam)、损失函数(本实施例选择mae)、迭代次数epochs、批次batch_size、隐藏层神经元数量、和全连接层；

Bi-LSTM神经网络结构是在LSTM网络基础上的改进，图7、图8分别为LSTM神经网络结构和Bi-LSTM神经网络结构示意图。由图7可知，一个LSTM网络由多个LSTM单元组成，其个数等于时间步长数，且每个LSTM单元有三个主要组件负责遗忘、记忆和更新数据。这三个组件分别是输入门、遗忘门和输出门。其网络内部训练过程参数如下式(12)～式(17)：

f_t＝σ(W_f[y_t-1,In′_t]+b_f) (12)

i_t＝σ(W_i[y_t-1,In′_t]+b_i) (13)

O_t＝σ(W_o[y_t-1,In′_t]+b_o) (16)

步骤3-5：由步骤3-4得到的测试集的预测值y_pref后，使用均方根误差(RMSE)及平均绝对百分比误差(MAPE)来评价预测结果；

一般当MAPE与RMSE误差值稳定在10％以下，就能达到模型预测可接受误差的标准，而预测值与真实值误差越小，MAPE与RMSE指标也越小，说明预测结果更准确；

具体公式如(18)-(19)：

其中，y_true、y_pred分别为标准化后的负荷真实值和预测值；

y_true为In′中测试集对应的预测日负荷数据；

RMSE与MAPE的数量级会根据负荷值的数量级变化，为量化分析比较预测精度，消除量纲对评估指标值的影响，因此选取以上标准化评价指标对所提模型性能进行评价。

本实施例中，给出12月27-29日的预测结果，对该3日预测结果进行评价，每日得到96个时刻的负荷预测值，将每一时刻的预测值和真实值代入公式(17)-(18)，可以计算出RMSE_Norm、MAPE_Norm值，具体数值见仿真算例部分表2，由表2可知预测结果误差较低，MAPE误差稳定在3.5％以下；

步骤3-6：输出预测结果，即为电动汽车预测日的负荷预测结果。

仿真算例：

本实施例应用到某市电动汽车的短期充电负荷预测，包含103辆电动汽车共31天数据，取15min间隔，每日包含数据点数为96，即T＝96，日负荷曲线共N＝3193条。通过本发明的一种考虑改进谱聚类与Bi-LSTM神经网络的冲击性负荷预测方法，进行电动汽车负荷预测，并与其它模型方法对比，来证明此冲击性负荷预测方法能提高负荷预测准确度，进而对电网精准调度提供准确数据支撑，以及对电动汽车这类能量冲击性负荷的接入做好应对的准备。

根据以上步骤二选取DTW相似性的改进谱聚类算法得到结果，在每类中包含不同车辆的不同日期的充电负荷曲线，具体每类包含日负荷曲线个数如表1所示：

表1 每类包含日负荷曲线个数

根据步骤三对k＝14类数据分别建立Bi-LSTM神经网络模型，得到各类预测日负荷。本实施例给出了12月27-29日的预测结果，其中包含对工作日与休息日的预测，具体如图9所示。由图9可以看出，利用本发明方法得到的充电负荷预测结果，在数值上，预测值与负荷真实值间差距较小；在负荷曲线形态上，能很好的追踪到峰值点和波动较大部分。表2给出了其预测结果评价指标。由表2可知采用本文方法的预测结果误差较低，MAPE误差稳定在3.5％以下。

表2 预测结果评价指标

为验证所提方法有效性，本实施例通过与双尺度谱聚类-LSTM神经网络、改进谱聚类-LSTM神经网络、单一的Bi-LSTM神经网络和LSTM神经网络进行对比，其中双尺度谱聚类选择欧氏距离和灰色关联度来计算相似度矩阵，而Bi-LSTM和LSTM两种网络模型，直接运用数据集中103辆车12月份的总日负荷及对应的时间、日类型和温度共同作为网络训练的输入，本发明所提方法与其他模型3日内每时刻的预测误差对比如图10所示，与其他模型预测结果评价指标对比如表3所示。

表3 与其他模型预测结果评价指标对比

未加谱聚类算法时，与LSTM神经网络方法相比，Bi-LSTM神经网络三日的预测结果MAPE和RMSE值均较低。结合图10可以看出，Bi-LSTM神经网络算法在27日的充电负荷预测中，误差分布比LSTM神经网络较为平缓，RMSE值分别为0.021和0.023；充电负荷在28日121-192间出现多次波动，此时Bi-LSTM神经网络能较好的跟踪预测，但在97-121间表现的不是很好，也就是此时Bi-LSTM神经网络可更好的跟踪波动频率较大的负荷，且总体上还是比LSTM神经网络的预测精度高。

加入谱聚类算法后，与Bi-LSTM神经网络算法相比，改进谱聚类-Bi-LSTM方法整体预测误差较稳定，平均MAPE值为0.0297；与LSTM神经网络算法相比，改进谱聚类-LSTM方法整体预测误差波动较小，局部跟踪也比较平稳；因此，将聚类方法与神经网络结合可以提高预测准确性及平稳性。在LSTM神经网络加入双尺度谱聚类时，由于28日预测误差波动较大，在数值和曲线形态不能较好的追踪，导致其平均MAPE值较LSTM神经网络仅降低0.009。因此，选择合适的度量相似性函数来计算曲线相似度对预测的准确性十分重要。

对于改进谱聚类-Bi-LSTM神经网络和改进谱聚类-LSTM神经网络方法，平均MAPE值分别为0.0163和0.0187，整体预测效果差距较小。从对每一时刻的预测误差可知，改进谱聚类-Bi-LSTM神经网络方法的预测精度更高，局部误差没有出现较大波动，有较好的平稳性。因此，本文所提的改进谱聚类-Bi-LSTM神经网络预测方法在一定程度上提高了短期负荷预测的准确度。

以上所述仅是本发明的一个应用场景，凡依本发明申请专利范围所做的均等变化，或者应用到其他电动汽车上，应属本发明的覆盖范围。

本发明未尽事宜为公知技术。

Claims

1.一种考虑改进谱聚类与Bi-LSTM神经网络的冲击性负荷预测方法，其特征为包括如下步骤：

步骤三、根据考虑DTW相似性的改进谱聚类算法的负荷曲线聚类结果，对各类群体分别数据处理并建立Bi-LSTM神经网络模型，对预测日进行充电负荷预测。

2.如权利要求1所述的考虑改进谱聚类与Bi-LSTM神经网络的冲击性负荷预测方法，其特征为所述的步骤一具体包括以下步骤：

步骤1-1：对电动汽车负荷数据进行数据筛选和处理；

步骤1-1-3：将其余无用的数据剔除；

通过公式(1)计算电动汽车充电负荷值p：

3.如权利要求1所述的考虑改进谱聚类与Bi-LSTM神经网络的冲击性负荷预测方法，其特征为所述的步骤二中考虑DTW相似性度量的改进谱聚类算法对日负荷曲线进行聚类具体包括以下步骤：

式中，t₁，t₂为负荷曲线i和j的时刻点，pⁱ _t1，pj_t2为日负荷曲线i和j分别在t₁和t₂时刻对应的负荷值；

利用上述元素，构造如下度矩阵S：

步骤2-10：构造拉普拉斯矩阵L：

L＝S-DTW (9)

步骤2-16：将最优聚类结果的负荷曲线数据导出，k类数据按照相应日期和相应时刻点累加得到该类实际充电负荷，为Bi-LSTM神经网络训练做准备。

4.如权利要求1所述的考虑改进谱聚类与Bi-LSTM神经网络的冲击性负荷预测方法，其特征为所述的步骤三具体步骤如下：

步骤3-1-3：将输入特征数据进行标准化处理，得到标准化矩阵In′,为步骤3-1-4提供输入数据，标准化公式为：

式中in可分别表示为In中每一列中数据；

步骤3-3：根据训练集数据对Bi-LSTM神经网络进行训练，利用python中Keras包构建模型，将输入数据格式写成Bi-LSTM网络输入形式(样本、时间步长、特征)，分别设置好网络模型参数，包括优化器、损失函数、迭代次数epochs、批次batch_size、隐藏层神经元数量、和全连接层。一个LSTM网络多个LSTM单元组成，其个数等于时间步长数，且每个LSTM单元有三个主要组件负责遗忘、记忆和更新数据，这三个组件分别是输入门、遗忘门和输出门，其训练过程参数如下式(12)～式(17)：

f_t＝σ(W_f[y_t-1,In_t′]+b_f) (12)

i_t＝σ(W_i[y_t-1,In_t′]+b_i) (13)

O_t＝σ(W_o[y_t-1,In_t′]+b_o) (16)

为临时状态量；C_t为状态量；O_t为中间输出量；h_t为输出门值；b_f、b_i、b_c和b_o为偏置项；W_f、W_i、W_c和W_o为权值矩阵；σ为sigmoid函数；

步骤3-4：通过步骤3-3训练设置的网络模型参数，再输入测试集进行负荷预测，得到的у_t数据组，即为测试集的预测数据y_pref；