一种基于K-means聚类与蝙蝠优化神经网络的负荷预测方法
技术领域
本发明涉及电力负荷预测技术领域,尤其涉及一种基于K-means聚类与蝙蝠优化神经网 络的负荷预测方法。
背景技术
电力负荷预测连接电网能源与用户需求,对于电能调度和绿色用电意义重大,精准的电 网短期电力负荷预测方法能够实现电网能量的精细管理,是居民稳定用电、经济稳定发展的 重要保障。
电网短期电力负荷是依靠历史电力负荷波动规律,结合外部环境因素的影响对未来几个 小时或者几天的负荷状态进行预测。时间序列是与电网相关的各种活动的综合结果,存在一 定的周期性,准确及时有效地对电力负荷进行预测可以辅助电网进行电力调度安排,防止出 现电力事故从而造成大规模停电或者严重的经济损失,同时BP神经网络是一种具由有泛化 能力、非线性映射能力、自学习以及强大的自适应能力预测方法。但是BP神经网络具有算 法收敛速度缓慢、容易陷入局部最优的缺点,会使得预测的结果存在预测精度和实用性低的 问题。
现有技术问题及思考:
如何解决电力负荷预测的技术问题。
发明内容
本发明所要解决的技术问题是提供一种基于K-means聚类与蝙蝠优化神经网络的负荷 预测方法,其通过S1数据采集及预处理、S2用K-means聚类分析获得电力负荷类型、S3确 定每类电力负荷群模型构建输入的数据特征集合、S4训练BA-BP神经网络预测模型及参数 优化和S5对聚类后的电力负荷群进行预测的步骤等,实现了电力负荷预测。
为解决上述技术问题,本发明所采取的技术方案是:一种基于K-means聚类与蝙蝠优化 神经网络的负荷预测方法包括S1数据采集及预处理、S2用K-means聚类分析获得电力负荷 类型、S3确定每类电力负荷群模型构建输入的数据特征集合、S4训练BA-BP神经网络预测 模型及参数优化和S5对聚类后的电力负荷群进行预测的步骤,所述S4训练BA-BP神经网络 预测模型及参数优化步骤包括S401初始化神经网络结构、S402初始化蝙蝠群参数、S403计 算BA优化的BP适应度函数、S404更新及计算参数值并且更新历史最优解及全局最优解、 S405计算适应度、S406调整当前全局最优个体和S407确定优化后的神经网络预测模型参数 并得出最终预测模型的步骤。
进一步的技术方案在于:在S4训练BA-BP神经网络预测模型及参数优化步骤中,训练 BA-BP神经网络预测模型及其参数优化具体如下:
S401初始化神经网络结构
初始化神经网络结构;
S402初始化蝙蝠群参数
初始化蝙蝠种群规模N,脉冲频率f
i,蝙蝠位置
以及
参数;
S403计算BA优化的BP适应度函数
计算适应度函数;引入蝙蝠算法对BP神经网络的初始值、阈值进行优化,BA优化的适 应度函数是式9:
式9中,Fitness(i)为BP神经网络的适应度函数,单位无;l代表样本个数;
为第i个样本对应输出点的预测值,单位为千瓦;y
i,j为第i个样本对应输出点的实际值,单 位为千瓦;
S404更新及计算参数值并且更新历史最优解及全局最优解
更新计算式1回声频率f
i、式2蝙蝠位置
和式3速度
并计算新的适应度值公式9,更新历史最优解和全局最优解;
式10中,
是蝙蝠个体i在t+1时刻的速度,单位无;
是蝙蝠个体i在t时刻 的速度,单位无;
为蝙蝠个体i在t时刻的位置,单位无;x
best为此时的所有蝙蝠的最 优位置,单位无;f
i为脉冲频率,单位hz;蝙蝠优化算法是仿生原理将种群数量为的蝙蝠 个体映射为D维问题空间中的NP个可行解,将优化过程和搜索模拟成种群蝙蝠个体移动过程 和搜寻猎物利用求解问题的适应度函数值来衡量蝙蝠所处位置的优劣,将个体的优胜劣汰过程类比为优化和搜索过程中用好的可行解替代较差可行解的迭代过程,参数没有单位;
fi=fmin+(fmax-fmin)β,β∈[0,1] (11)
式11中,fmin为最小可发声频率,单位khz;fmax为最大可发声频率,单位khz;β为 脉冲发射率,单位无;
其中,fi∈[fmin,fmax];
S405计算适应度
若随机数rand>r
i t,在当前个体中选择全局最优个体位置;其中,rand为随机数,单位无;
为脉冲发射率,单位无;
根据xnew=xold+θAt运用随机扰动产生一个局部个体,计算适应度值Fnew,其中,xnew为当前最优解,单位无;xold为上一时刻的最优解,单位无;θ代表[0,1]之间的随 机数;At是所有蝙蝠在t时刻的平均响度,单位无;
S406调整当前全局最优个体
若随机数
同时F
new优于之前的空间位置F
b,则把该解设为当前全局最优个体,并根据
和
调节
和
其中,
为t+1时刻响应度,单位无;F
new为新的空间位置,单位无;F
b为间位置, 单位无;
为t+1的脉冲发射率,单位无;
为脉冲发射率的初始值,单位无;μ为脉 冲发射率增加系数,单位无;
为t+1时刻响应度,单位无;a为脉冲响度衰减系数, 单位无;通常取a=μ=0.9;
S407确定优化后的神经网络预测模型参数并得出最终预测模型
判断算法是否满足终止条件确定神经网络的权值阈值参数。
进一步的技术方案在于:在S1数据采集及预处理步骤中,以样本时刻时间间隔t划分 电压数据和电流数据,计算每个样本时刻时间间隔t内的电压平均值和电流平均值,将每个 样本时刻时间间隔t的中间时刻作为样本时刻,将每个样本时刻时间间隔t内的电压平均值 和电流平均值作为样本时刻的电压值和电流值,将每个样本时刻电压值与电流值的乘积作为 样本时刻的功率值;每个电力检测设备对应一段由所有样本时刻的功率值组成的功率序列, 所有电力检测设备的功率序列组成功率训练样本为式1;
式1中,i为样本编号,范围从1~N,N为样本数量,xi为第i个样本值,单位是千 瓦;
对异常值进行处理,采用3σ准则进行异常点检测,若测量值满足下面式2或者式3中任意一个,则为异常值,将其剔除;
式2中,
为测量值历史数据的平均值,单位为千瓦;σ为测量值历史数据的标准差, 单位是千瓦;x
i为待测量值,单位是千瓦;
对异常数据进行修复;使用相邻时刻的数据进行插值填充,或者采用相邻天内的同一类 型同一时刻的数据的平均值进行填充。
进一步的技术方案在于:在S2用K-means聚类分析获得电力负荷类型步骤中,对整片 区域电力负荷进行K-means聚类分析,从而得出该地区整片区域的台区电力负荷类型1~q, 第q类台区电力负荷包含编号为1~q个台区。
进一步的技术方案在于:S2用K-means聚类分析获得电力负荷类型的步骤具体划分包 括以下步骤,
S201从数据集
中随机选取q个数据作为初始聚类中心,其中N为样本数量,q0={μ
1,μ
2,...,μ
q};q0为初始聚类中心集;q为初始聚类中心个数,单位为个;μ
q为 第q个初始聚类中心,单位为千瓦;
S202对数据集中的第i个样本点xi,计算其与每一聚类中心μj的欧氏距离,并获取样 例xi所属类别的标号:
式4中,μj(i)为样本数据,xi所属类别的标号μj(i),单位无;j为聚类中心编号,单位;μj为第j个聚类中心,单位无;q为聚类中心编号,单位无;
S203按照下述式5重新计算q个聚类中心:
式5中,Nj为第j类所含的用户数;
S204重复步骤S202和步骤S203,直到达到满足下面式6为止;
||q-q0||<r (6)
式6中,q0为初始聚类中心集的数据,单位为千瓦;r为设定的阈值,单位为千瓦;
上述步骤S202中所列的计算每一样本点与聚类中心距离是使用的欧氏距离,但是需要 说明的是,根据聚类的实际问题不同,在求解两两数据间距离时,可以选择不同的距离求解 公式;欧式距离、曼哈顿距离或者闵可夫斯基距离都可以作为算法中“距离”的度量;由于 欧式距离是K-means算法中最常用的距离,所以上述步骤中以欧氏距离作为样本数据距离进 行了描述,另外两种距离的计算公式如下:
a.曼哈顿距离:d(x,y)=|x1-y1|+|x2-y2|+...+|xn-yn| (7)
式7中,d(x,y)为两个样本之间值,单位无;x为数据所在的坐标轴的位置,单位无;y为另一个数据所在坐标轴的位置,单位无;n为维度空间,单位维;两个样本数据的位置 坐标表示x=(x1,x2,...xn),y=(y1,y2,...yn)
式8中,m为维度,单位无;
其中,在当m=2和m=1时,闵可夫斯基距离则分别与欧氏距离、曼哈顿距离相等;
从而得出q类台区电力负荷分类结果,第q类台区负荷包含Nq个台区。
进一步的技术方案在于:在S3确定每类电力负荷群模型构建输入的数据特征集合的步 骤中,对每类电力负荷进行构建模型输入的特征集合,根据具体的数据情况和地区实际用电 特点来确定。
进一步的技术方案在于:在S5对聚类后的电力负荷群进行预测的步骤中,对聚类后的 负荷群进行预测,即对聚类后的1~q类电力负荷进行数据预测获得负荷预测值。
进一步的技术方案在于:在S5对聚类后的电力负荷群进行预测的步骤中,使用确定了 BP神经网络的参数的预测模型对聚类后的q类台区负荷分别进行负荷预测:首先对每类台 区负荷的Nq个台区分别进行预测,得出每类台区总体电力负荷预测值sq;
式13中,sq为第q类台区集合的电力负荷预测总数值,单位千瓦;k为第q类台区集合中包含的台区编号,单位无;Nq为第q类台区集合所含台区数量,单位无;sk为台区 编号为k的负荷预测数值,单位;
sk=f(xk) (14)
式14中,xk为实际样本,单位无;f(xk)为负荷预测值,单位无。
进一步的技术方案在于:还包括S6确定整片区域的电力负荷预测值的步骤,确定整片 区域的电力负荷预测值s,综合每类台区负荷预测值得出整片区域的电力负荷预测值s。
进一步的技术方案在于:在S6确定整片区域的电力负荷预测值的步骤中,计算如式15;
式15中,s为电力负荷预测值,单位是千瓦;g为台区类型编号,范围是1~q;q为 聚类后台区最大集合数,单位无;sg为第g类台区集合预测值,单位无。
采用上述技术方案所产生的有益效果在于:
一种基于K-means聚类与蝙蝠优化神经网络的负荷预测方法包括S1数据采集及预处理、 S2用K-means聚类分析获得电力负荷类型、S3确定每类电力负荷群模型构建输入的数据特 征集合、S4训练BA-BP神经网络预测模型及参数优化和S5对聚类后的电力负荷群进行预测 的步骤,所述S4训练BA-BP神经网络预测模型及参数优化步骤包括S401初始化神经网络结 构、S402初始化蝙蝠群参数、S403计算BA优化的BP适应度函数、S404更新及计算参数值 并且更新历史最优解及全局最优解、S405计算适应度、S406调整当前全局最优个体和S407 确定优化后的神经网络预测模型参数并得出最终预测模型的步骤。其通过S1数据采集及预 处理、S2用K-means聚类分析获得电力负荷类型、S3确定每类电力负荷群模型构建输入的 数据特征集合、S4训练BA-BP神经网络预测模型及参数优化和S5对聚类后的电力负荷群进 行预测的步骤等,实现了电力负荷预测。
详见具体实施方式部分描述。
附图说明
图1是本发明的流程图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描 述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。以下对至少 一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本申请及其应用或使用的任何 限制。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的 所有其他实施例,都属于本申请保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本申请,但是本申请还可以采用其 他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做 类似推广,因此本申请不受下面公开的具体实施例的限制。
如图1所示,本发明公开了一种基于K-means聚类与蝙蝠优化神经网络的负荷预测方法 包括S1数据采集及预处理、S2用K-means聚类分析获得电力负荷类型、S3确定每类电力负 荷群模型构建输入的数据特征集合、S4训练BA-BP神经网络预测模型及参数优化、S5对聚 类后的电力负荷群进行预测和S6确定整片区域的电力负荷预测值的步骤,所述S4训练BA-BP 神经网络预测模型及参数优化步骤包括S401初始化神经网络结构、S402初始化蝙蝠群参数、 S403计算BA优化的BP适应度函数、S404更新及计算参数值并且更新历史最优解及全局最 优解、S405计算适应度、S406调整当前全局最优个体和S407确定优化后的神经网络预测模 型参数并得出最终预测模型的步骤。
S1数据采集及预处理
以样本时刻时间间隔t划分电压数据和电流数据,计算每个样本时刻时间间隔t内的电 压平均值和电流平均值,将每个样本时刻时间间隔t的中间时刻作为样本时刻,将每个样本 时刻时间间隔t内的电压平均值和电流平均值作为样本时刻的电压值和电流值,将每个样本 时刻电压值与电流值的乘积作为样本时刻的功率值;每个电力检测设备对应一段由所有样本 时刻的功率值组成的功率序列,所有电力检测设备的功率序列组成功率训练样本为式1。
式1中,i为样本编号,范围从1~N,N为样本数量,xi为第i个样本值,单位是千 瓦。
对异常值进行处理,采用3σ准则进行异常点检测,若测量值满足下面式2或者式3中任意一个,则为异常值,将其剔除。
式2中,
为测量值历史数据的平均值,单位为千瓦;σ为测量值历史数据的标准差,单位是千瓦;x
i为待测量值,单位是千瓦。
对异常数据进行修复。使用相邻时刻的数据进行插值填充,或者采用相邻天内的同一类 型同一时刻的数据的平均值进行填充。
S2用K-means聚类分析获得电力负荷类型
对整片区域电力负荷进行K-means聚类分析,从而得出该地区整片区域的台区电力负荷 类型1~q,第q类台区电力负荷包含编号为1~q个台区,具体步骤如下。
S201从数据集
中随机选取q个数据作为初始聚类中心,其中N为样本数量,q0={μ
1,μ
2,...,μ
q};q0为初始聚类中心集;q为初始聚类中心个数,单位为个;μ
q为 第q个初始聚类中心,单位为千瓦。
S202对数据集中的第i个样本点xi,计算其与每一聚类中心μj的欧氏距离,并获取样 例xi所属类别的标号:
式4中,μj(i)为样本数据,xi所属类别的标号μj(i),单位无;j为聚类中心编号,单位;μj为第j个聚类中心,单位无;q为聚类中心编号,单位无,与S201步骤中的一样。
S203按照下述式5重新计算q个聚类中心:
式5中,Nj为第j类所含的用户数。
S204重复步骤S202和步骤S203,直到达到满足下面式6为止。
||q-q0||<r (6)
式6中,q0为初始聚类中心集的数据,单位为千瓦;r为设定的阈值,单位为千瓦。
上述步骤S202中所列的计算每一样本点与聚类中心距离是使用的欧氏距离,但是需要 说明的是,根据聚类的实际问题不同,在求解两两数据间距离时,可以选择不同的距离求解 公式。欧式距离、曼哈顿距离或者闵可夫斯基距离都可以作为算法中“距离”的度量。由于 欧式距离是K-means算法中最常用的距离,所以上述步骤中以欧氏距离作为样本数据距离进 行了描述,另外两种距离的计算公式如下:
a.曼哈顿距离:d(x,y)=|x1-y1|+|x2-y2|+...+|xn-yn| (7)
式7中,d(x,y)为两个样本之间值,单位无;x为数据所在的坐标轴的位置,单位无;y为另一个数据所在坐标轴的位置,单位无;n为维度空间,单位维。两个样本数据的位置 坐标表示x=(x1,x2,...xn),y=(y1,y2,...yn)
式8中,m为维度,单位无。
其中,在当m=2和m=1时,闵可夫斯基距离则分别与欧氏距离、曼哈顿距离相等。
从而得出q类台区电力负荷分类结果,第q类台区负荷包含Nq个台区。
S3确定每类电力负荷群模型构建输入的数据特征集合
对每类电力负荷进行构建模型输入的特征集合,根据具体的数据情况和地区实际用电特 点来确定。
S4训练BA-BP神经网络预测模型及参数优化
训练BA-BP神经网络预测模型及其参数优化具体如下:
S401初始化神经网络结构;
S402初始化蝙蝠群参数
初始化蝙蝠种群规模N,脉冲频率f
i,蝙蝠位置
以及
参数。
S403计算BA优化的BP适应度函数
计算适应度函数。引入蝙蝠算法对BP神经网络的初始值、阈值进行优化,BA优化的适 应度函数是式9:
式9中,Fitness(i)为BP神经网络的适应度函数,单位无;l代表样本个数;
为第i个样本对应输出点的预测值,单位为千瓦;y
i,j为第i个样本对应输出点的实际值,单 位为千瓦。
S404更新及计算参数值并且更新历史最优解及全局最优解
更新计算式1回声频率f
i、式2蝙蝠位置
和式3速度
并计算新的适应度值公式9,更新历史最优解和全局最优解。
式10中,
是蝙蝠个体i在t+1时刻的速度,单位无;
是蝙蝠个体i在t时刻 的速度,单位无;
为蝙蝠个体i在t时刻的位置,单位无;x
best为此时的所有蝙蝠的最 优位置,单位无;f
i为脉冲频率,单位hz。蝙蝠优化算法是仿生原理将种群数量为的蝙蝠 个体映射为D维问题空间中的NP个可行解,将优化过程和搜索模拟成种群蝙蝠个体移动过程 和搜寻猎物利用求解问题的适应度函数值来衡量蝙蝠所处位置的优劣,将个体的优胜劣汰过程类比为优化和搜索过程中用好的可行解替代较差可行解的迭代过程,参数没有单位。
fi=fmin+(fmax-fmin)β,β∈[0,1] (11)
式11中,fmin为最小可发声频率,单位khz;fmax为最大可发声频率,单位khz;β为 脉冲发射率,单位无。
其中,fi∈[fmin,fmax]。
S405计算适应度
若随机数
在当前个体中选择全局最优个体位置。其中,rand为随机数, 单位无;
为脉冲发射率,单位无。
根据xnew=xold+θAt运用随机扰动产生一个局部个体,计算适应度值Fnew,其中,xnew为当前最优解,单位无;xold为上一时刻的最优解,单位无;θ代表[0,1]之间的随 机数;At是所有蝙蝠在t时刻的平均响度,单位无。
S406调整当前全局最优个体。
若随机数
同时F
new优于之前的空间位置F
b,则把该解设为当前全局最优个体,并根据
和
调节
和
其中,
为t+1时刻响应度,单位无;F
new为新的空间位置,单位无;F
b为间位置, 单位无;
为t+1的脉冲发射率,单位无;
为脉冲发射率的初始值,单位无;μ为脉 冲发射率增加系数,单位无;
为t+1时刻响应度,单位无;a为脉冲响度衰减系数, 单位无;通常取a=μ=0.9。
S407确定优化后的神经网络预测模型参数并得出最终预测模型
判断算法是否满足终止条件确定神经网络的权值阈值参数。
S5对聚类后的电力负荷群进行预测
对不同聚类后的负荷群进行预测。即对聚类后的1~q类电力负荷进行数据预测获得负荷 预测值。
使用确定了BP神经网络的参数的预测模型对聚类后的q类台区负荷分别进行负荷预测: 首先对每类台区负荷的Nq个台区分别进行预测,得出每类台区总体电力负荷预测值sq。
式13中,sq为第q类台区集合的电力负荷预测总数值,单位千瓦;k为第q类台区集合中包含的台区编号,单位无;Nq为第q类台区集合所含台区数量,单位无;sk为台区 编号为k的负荷预测数值,单位。
sk=f(xk) (14)
式14中,xk为实际样本,单位无;f(xk)为负荷预测值,单位无。
S6确定整片区域的电力负荷预测值
确定整片区域的电力负荷预测值s。综合每类台区负荷预测值得出整片区域的电力负荷 预测值s,计算如式15。
式15中,s为电力负荷预测值,单位是千瓦;g为台区类型编号,范围是1~q;q为 聚类后台区最大集合数,单位无;sg为第g类台区集合预测值,单位无。
本申请的目的:
针对现有技术存在的问题,本发明提供一种基于K-means聚类与蝙蝠优化神经网络的中 短期电力负荷预测方法,实现提升预测模型对电力负荷突变事件的敏感度和适应能力,蝙蝠 优化(BA)算法是一种对参数进行迭代优化的算法,该方法结合BP(神经网络)算法可以 克服传统的BP神经网络易陷入局部极值预测收敛速度慢等问题,同时可以提高短期电力负 荷预测的预测精度和稳定性,算法具有较强的实用性,本专利可以针对一整片区域的电力负 荷进行中短期预测。
本申请的技术贡献:
本申请的技术贡献:
为实现上述技术目的,本发明采用的技术方案为:
一种基于K-means聚类与蝙蝠优化神经网络的中短期电力负荷预测方法,包括以下步骤:
步骤S1,数据的采集及预处理。主要解决数据在采集和传输过程中经常出现的数据丢 失和数据异常的现象,保证数据的正确性和完整性。
步骤S2,K-means聚类分析得出不同负荷类型。对某大片区域的台区电力负荷进行K-means聚类分析,得出某地区整片区域的台区电力负荷类型1~q,第q类台区电力负荷包含编号为1~Nq个台区。
步骤S3,每类负荷群构建模型输入的特征集合。对每类电力负荷进行构建模型输入的 特征集合,负荷值以及主要包括外界因素,包括预测日的日类型、日最高温度、日最低温度 和天气状况等,可以根据具体的数据情况和地区实际用电特点来确定。
步骤S4,训练BA-BP神经网络预测模型及参数优化。建立BA-BP神经网络负荷预测模 型。综合步骤S3和S4针对每个类型电力负荷群进行BA-BP神经网络负荷预测模型的构建。
步骤S5,不同类型的负荷群预测。结合步骤S4得出的BA-BP神经网络负荷预测模型对 1~q类台区电力负荷进行数据预测获得负荷预测值。
步骤S6,整片区域的负荷预测。综合步骤S5的不同类台区预测数值进行求和,得出未 来几天到十几天的整片区域的中短期负荷预测值。
进一步地,可以得到某地区整片区域的台区的电力负荷值,并组成功率训练样本
进一步地,所述步骤S1的具体过程为:
为保证采集的数据是正确和完整的,需首先对异常值进行处理,否则会对模型训练产生 不必要的干扰。异常值的特点是偏离于大部分运行数据。可以采用3σ准则进行异常点检 测,若测量值满足下面两个公式中任意一个,则为异常值,将其剔除。其中
为测量值历史 数据的平均值,σ为测量值历史数据的标准差,x
i为待测量值。
其中,为了充分地利用采集到的数据,需要对异常数据进行修复。由于电力负荷数据具 有缓慢时变性,故使用相邻时刻的数据进行插值填充,且负荷变化具强的周期性,在不同日 类型负荷预测情况有明显差异,因此数据采用相邻几天内同一日类型同一时刻的数据的平均 值进行填充。
进一步地,所述步骤S2的具体过程为:
S201从数据集
中随机选取q个数据作为初始聚类中心,其中N为样本数量,
q0={μ1,μ2,...,μq};
S202对数据集中的第i个样本点xi,计算其与各聚类中心μj的欧氏距离,并获取样例 xi所属类别的标号:
S203按照下述公式重新计算q个聚类中心:
其中
是新的聚类中心集,其中N
j为第j类所含的用户数。
S204重复步骤S202和步骤S203,直到达到满足下面公式为止。
||q-q0||<r
其中,r为设定的很小的阈值。
上述步骤S202中所列的计算各样本点与聚类中心距离是使用的欧氏距离,但是需要说 明的是,根据聚类的实际问题不同,在求解两两数据间距离时,可以选择不同的距离求解公 式。欧式距离、曼哈顿距离或者闵可夫斯基距离都可以作为算法中“距离”的度量。由于欧 式距离是K-means算法中最常用的距离,所以上述步骤中以欧氏距离作为样本数据距离进行 了描述,另外两种距离的计算公式如下:
a.曼哈顿距离:d(x,y)=|x1-y1|+|x2-y2|+...+|xn-yn|
其中,在当q=2和q=1时,闵可夫斯基距离则分别与欧氏距离、曼哈顿距离相等。
从而得出q类台区电力负荷分类结果,第q类台区负荷包含Nq个台区。
进一步地,所述步骤S4的具体过程为:
步骤4训练BA-BP神经网络预测模型及参数优化中,首先采用单隐层的3层神经网络结 构,由聚类后的负荷值以及预测日的日类型、日最高温度、日最低温度和天气状况,共5个 输入变量,输出变量为预测日的负荷值。图1中引入简单的BP神经网络结构,同时引入蝙 蝠算法对BP神经网络的初始值、阈值进行优化用于最终的BA-BP预测模型。
针对聚类后每一类电力负荷,训练BA-BP(蝙蝠优化的BP)神经网络负荷预测模型的具 体步骤如下:
S401初始化神经网络结构;
S402初始化蝙蝠种群规模N,脉冲频率f
i,蝙蝠位置
以及
等参数;
S403计算适应度函数。引入蝙蝠算法对BP神经网络的初始值、阈值进行优化,BA优化 的适应度函数是:
l代表样本个数;
y
i,j分别代表了第i个样本对应输出点的预测值和实际值。
S404更新计算回声频率f
i、蝙蝠位置
和速度
并计算新的适应度值,更新历史最优解和全局最优解。
fi=fmin+(fmax-fmin)β,β∈[0,1]
其中,f
i∈[f
min,f
max];
与
代表蝙蝠个体i在t+1和t时刻的位置;
和
是蝙蝠个体i在t+1和t时刻的速度;x
best为此时的所有蝙蝠的最优位置。
S405若随机数
在当前个体中选择全局最优个体位置,根据 x
new=x
old+θA
t运用随机扰动产生一个局部个体,计算适应度值F
new,其中,θ代 表[0,1]之间的随机数;A
t是所有蝙蝠在t时刻的平均响度。
S406若随机数
同时F
new优于之前的空间位置F
b,则把该解设为当前全局最优个体,并根据
和
调节
和
其中,
是脉冲 发射率的初始值,
是t+1的脉冲发射率;a和μ别为脉冲响度衰减系数和脉冲发射率 增加系数,通常取a=μ=0.9。
S407判断算法是否满足终止条件确定神经网络的权值阈值参数得出模型f(x)=fM(x)。
进一步地,所述步骤S5的具体过程为:根据步骤S4的预测模型确定了BP神经网络的 参数的预测模型对聚类后的q类台区负荷分别进行负荷预测:对每类台区负荷的N
q个台区 分别进行预测,得出每类台区总体电力负荷预测值
s
k=f(x
k)。
进一步地,所述步骤S6的具体过程为:根据步骤S5中每类台区负荷预测值得出整片区 域的电力负荷预测值s。
技术方案说明:
下面对本发明的技术方案作进一步解释说明。
各用电单位的电压和电流历史数据由各自设置的电力检测设备以相同频率采集得到,所 述对电压和电流历史数据进行处理得到目标预测区域的功率训练样本的具体过程为:
步骤S1,数据的采集及预处理
采集数据并进行数据预处理,以保证数据的正确性和完整性。
以样本时刻时间间隔t划分电压数据和电流数据,计算每个样本时刻时间间隔t内的电 压平均值和电流平均值,将每个样本时刻时间间隔t的中间时刻作为样本时刻,将每个样本 时刻时间间隔t内的电压平均值和电流平均值作为样本时刻的电压值和电流值,将每个样本 时刻电压值与电流值的乘积作为样本时刻的功率值;每个电力检测设备对应一段由所有样本 时刻的功率值组成的功率序列,所有电力检测设备的功率序列组成功率训练样本为式1。
式1中,i为样本编号,范围从1~N,N为样本数量,xi为第i个样本值,单位是 千瓦。
为保证采集的数据是正确和完整的,需首先对异常值进行处理,否则会对模型训练产生 不必要的干扰。异常值的特点是偏离于大部分运行数据。可以采用3σ准则进行异常点检 测,若测量值满足下面式2或者式3中任意一个,则为异常值,将其剔除。
式2中,
为测量值历史数据的平均值,单位为千瓦;σ为测量值历史数据的标准差, 单位是千瓦;x
i为待测量值,单位是千瓦。
其中,为了充分地利用采集到的数据,需要对异常数据进行修复。由于电力负荷数据具 有缓慢时变性,故使用相邻时刻的数据进行插值填充,且负荷变化具强的周期性,在不同日 类型负荷预测情况有明显差异,因此数据采用相邻几天内同一日类型同一时刻的数据的平均 值进行填充。
步骤S2,对整片区域电力负荷进行K-means聚类分析。从而得出某地区整片区域的台 区电力负荷类型1~q,第q类台区电力负荷包含编号为1~个台区,具体步骤如下。
S201从数据集
中随机选取q个数据作为初始聚类中心,其中N为样本数量,q0={μ
1,μ
2,...,μ
q};
S202对数据集中的第i个样本点xi,计算其与各聚类中心μj的欧氏距离,并获取样例 xi所属类别的标号:
S203按照下述式5重新计算q个聚类中心:
其中
是新的聚类中心集,其中N
j为第j类所含的用户数。
S204重复步骤S202和步骤S203,直到达到满足下面式6为止。
||q-q0||<r (6)
其中,r为设定的很小的阈值。
上述步骤S202中所列的计算各样本点与聚类中心距离是使用的欧氏距离,但是需要说 明的是,根据聚类的实际问题不同,在求解两两数据间距离时,可以选择不同的距离求解公 式。欧式距离、曼哈顿距离或者闵可夫斯基距离都可以作为算法中“距离”的度量。由于欧 式距离是K-means算法中最常用的距离,所以上述步骤中以欧氏距离作为样本数据距离进行 了描述,另外两种距离的计算公式如下:
a.曼哈顿距离:d(x,y)=|x1-y1|+|x2-y2|+...+|xn-yn| (7)
其中,在当q=2和q=1时,闵可夫斯基距离则分别与欧氏距离、曼哈顿距离相等。
从而得出q类台区电力负荷分类结果,第q类台区负荷包含Nq个台区。
步骤S3,对每类电力负荷进行构建模型输入的特征集合,根据具体的数据情况和地区 实际用电特点来确定;
步骤S4,训练BA-BP神经网络预测模型及其参数优化:
S401初始化神经网络结构;
S402初始化蝙蝠种群规模N,脉冲频率f
i,蝙蝠位置
以及
等参数;
S403计算适应度函数。引入蝙蝠算法对BP神经网络的初始值、阈值进行优化,BA优化 的适应度函数是式9:
l代表样本个数;
y
i,j分别代表了第i个样本对应输出点的预测值和实际值。
S404更新计算式1回声频率f
i、式2蝙蝠位置
和式3速度
并计算新的适应度值公式9,更新历史最优解和全局最优解。
fi=fmin+(fmax-fmin)β,β∈[0,1] (11)
其中,f
i∈[f
min,f
max];
与
代表蝙蝠个体i在t+1和t时刻的位置;
和
是蝙蝠个体i在t+1和t时刻的速度;x
best为此时的所有蝙蝠的最优位置。
S405若随机数
在当前个体中选择全局最优个体位置,根据 x
new=x
old+θA
t运用随机扰动产生一个局部个体,计算适应度值F
new,其中,θ代表 [0,1]之间的随机数;A
t是所有蝙蝠在t时刻的平均响度。
S406若随机数
同时F
new优于之前的空间位置F
b,则把该解设为当前全局最优个体,并根据
和
调节
和
其中,
是脉 冲发射率的初始值,
是t+1的脉冲发射率;a和μ别为脉冲响度衰减系数和脉冲发射 率增加系数,通常取a=μ=0.9。
S407判断算法是否满足终止条件确定神经网络的权值阈值参数。
步骤S5,对不同聚类后的负荷群进行预测。即对聚类后的1~q类电力负荷进行数据预 测获得负荷预测值。
使用确定了BP神经网络的参数的预测模型对聚类后的q类台区负荷分别进行负荷预测: 首先对每类台区负荷的Nq个台区分别进行预测,得出每类台区总体电力负荷预测值sq。
sk=f(xk)
(14)
步骤S6,确定整片区域的电力负荷预测值s。综合每类台区负荷预测值得出整片区域的 电力负荷预测值s,计算如式15。
g为台区编号,范围是1~q,s为电力负荷预测值,单位是千瓦。
本申请保密运行一段时间后,现场技术人员反馈的有益之处在于:
本方案采取了K-means聚类方法,首先将电力负荷的数据进行相似日聚类分类,便于电 力负荷更好地进行预测,其中K-means聚类方法是聚类分析中的一种经典算法,整个算法思 路简单,容易理解,而且计算速度快,适合于处理大型数据集。因为它的复杂度是o(npt), 其中,n是所有数据样本的数目,p是聚类数,t是聚类运算时的迭代次数。聚类效果容易 评价。当最后的聚类结果中,各个类别之间区别明显,而类内数据相似性高,即可认为聚类 效果好,有助于电力负荷预测的精度提高,其次,效果好的聚类的基础上,对每一类电力负 荷分别进行预测,利用蝙蝠优化的神经网络方法进行更精准和平稳的预测。BP神经网络、 是一种按照误差逆向传播算法训练的多层前馈神经网络,工作信号始终正向流动,没有反馈 结构,在训练网络权值的过程当中,数据则沿着减少误差的方向传播其算法的鲁棒性强,具 有泛化能力、非线性映射能力、自学习以及强大的自适应能力。但是BP神经网络采用最速 下降法,是一种可微函数的最优化算法,由于优化的目标函数是非常复杂的,导致算法收敛 速度缓慢、容易陷入局部最优的缺点,所以要对神经网络的权值阈值优化,由于蝙蝠算法有 较强的鲁棒性、高效性和应用性,所以利用蝙蝠算法优化BP神经网络的初始权值与阈值从 而解决传统BP算法容易陷入局部极值和收敛慢等问题。本发明对比已有的负荷预测方法可 以明显提高负荷预测的精确度和稳定性,结合经典高效的聚类方法,又可以提升电力负荷预 测的效率,快速辅助电网调度判决,较少并及时预防电力事故的发生。