CN112819246A

CN112819246A - 基于布谷鸟算法优化神经网络的能源需求预测方法

Info

Publication number: CN112819246A
Application number: CN202110211620.XA
Authority: CN
Inventors: 吴伟杰; 吴杰康; 张伊宁; 郑敏嘉; 李逸新; 黄欣; 李猛
Original assignee: Guangdong Power Grid Co Ltd
Current assignee: Guangdong Power Grid Co Ltd
Priority date: 2021-02-25
Filing date: 2021-02-25
Publication date: 2021-05-18

Abstract

本发明公开了一种基于布谷鸟算法优化神经网络的能源需求预测方法，包括：获取待预测地区能源使用总量的历史数据并进行预处理，得到能源消费总量的历史数据矩阵；求解矩阵的各列相关系数，并结合预设阈值对历史数据进行初步聚类；采用改进K‑means均值聚类算法，对初步聚类的结果进行二次聚类；采用布谷鸟算法优化BP神经网络，直至BP神经网络具有最优的权值和阈值，并根据此时的BP神经网络构建初始预测模型；根据初始预测模型对所述二次聚类结果训练，得到目标预测模型，以预测待预测地区的能源需求。本发明提供的预测方法，能够综合考虑区域性差异对于能源需求的影响，有效降低建模数量及复杂性，同时准确预测区域能源需求。

Description

基于布谷鸟算法优化神经网络的能源需求预测方法

技术领域

本发明涉及深度学习技术领域，尤其涉及一种基于布谷鸟算法优化神经网络的能源需求预测方法。

背景技术

能源需求预测对于国家经济的发展来说有重要意义，目前在进行能源需求预测时，通常是参照能源消费总量的历史数据，结合BP神经网络进行预测。但是这种方式通常存在以下问题：第一，在数据建模上由于没有对于影响能源消费总量的影响因素进行具体分析，导致建模数量冗余，建模过程复杂；第二，利用BP神经网络进行预测时，容易出现由于初始权重和阈值的随机性而陷入局部最优解的问题，进而影响预测结果的准确性。因此，如何提供一种预测方法，以简单、准确预测区域的能源需求是本领域亟待解决的技术问题之一。

发明内容

本发明的目的在于提供一种基于布谷鸟算法优化神经网络的能源需求预测方法，能够综合考虑区域性差异对于能源需求的影响，有效降低建模数量及复杂性，同时准确预测区域能源需求。

为了克服上述现有技术中的缺陷，本发明实施例提供了一种基于布谷鸟算法优化神经网络的能源需求预测方法，包括：

获取待预测地区能源使用总量的历史数据并进行预处理，得到能源消费总量的历史数据矩阵；

根据所述历史数据矩阵，求解各列相关系数，并通过预设阈值与所述相关系数对所述历史数据进行初步聚类；

采用改进K-means均值聚类算法，对所述初步聚类的结果进行二次聚类，得到所述历史数据的均值聚类结果；

采用布谷鸟算法优化BP神经网络，直至所述BP神经网络具有最优的权值和阈值，并根据此时的BP神经网络构建初始预测模型；

根据所述初始预测模型对所述均值聚类结果训练，得到目标预测模型，根据所述目标预测模型预测待预测地区的能源需求。

作为优选地，所述根据所述目标预测模型预测待预测地区的能源需求，包括：

将待预测年份数据输入至所述改进K-means均值聚类算法，获得所述待预测年份的所属地区，根据并匹配与所属地区对应的地区预测模型；

对待预测年份数据进行归一化处理，将处理后的数据输入至所述地区预测模型，预测待预测年份的能源需求总量。

作为优选地，所述获取待预测地区能源使用总量的历史数据并进行预处理，得到能源消费总量的历史数据矩阵，包括：

获取待预测地区预设年度范围内的能源消费总量数据，以作为样本数据；其中，所述样本数据包括按照预设比例分配后得到的训练集与测试集；

对所述样本数据进行归一化、平均插值法处理，得到优化后的目标样本数据；

根据目标样本数据，构建所有待预测地区的能源消费总量历史数据矩阵；

将所述目标样本数据划分为N类，构建N类地区的能源消费总量历史数据矩阵。

作为优选地，所述采用改进K-means均值聚类算法，对所述初步聚类的结果进行二次聚类，得到所述历史数据的均值聚类结果，包括：

根据所述初步聚类的结果，从所有待预测地区的能源消费总量历史数据中选取K个样本，以作为聚类中心；

计算每个所述历史数据到K个聚类中心的距离，计算公式为：

式中，X_i为样本中某个点X的第u个地区的数值；X_j为某个聚类中心的数值(j＝1,...,k)；ω_i为第i个地区的权值，n为选取的地区的个数；

分别重新计算所述K个样本中的数据均值，得到新的K个聚类中心；

重复执行所述计算每个所述历史数据到K个聚类中心的距离步骤，直至K个聚类结果不发生改变，得到所述历史数据的均值聚类结果。

作为优选地，采用皮尔逊相关系数法求解所述相关系数。

本发明某一实施例还提供了一种基于布谷鸟算法优化神经网络的能源需求预测系统，包括：

矩阵构建模块，用于获取待预测地区能源使用总量的历史数据并进行预处理，得到能源消费总量的历史数据矩阵；

初步聚类模块，用于根据所述历史数据矩阵，求解各列相关系数，并通过预设阈值与所述相关系数对所述历史数据进行初步聚类；

二次聚类模块，用于采用改进K-means均值聚类算法，对所述初步聚类的结果进行二次聚类，得到所述历史数据的均值聚类结果；

模型训练模块，用于采用布谷鸟算法优化BP神经网络，直至所述BP神经网络具有最优的权值和阈值，并根据此时的BP神经网络构建初始预测模型；

预测模块，用于根据所述初始预测模型对所述均值聚类结果训练，得到目标预测模型，根据所述目标预测模型预测待预测地区的能源需求。

作为优选地，所述预测模块，还用于，

作为优选地，所述矩阵构建模块，还用于，

作为优选地，所述二次聚类模块，还用于，

计算每个所述历史数据到K个聚类中心的距离，计算公式为：

式中，X_i为样本中某个点X的第i个地区的数值；X_j为某个聚类中心的数值(j＝1,...,k)；ω_i为第i个地区的权值，n为选取的地区的个数；

作为优选地，所述初步聚类模块，还用于采用皮尔逊相关系数法求解所述相关系数。

本发明某一实施例还提供了一种计算机终端设备，包括：

一个或多个处理器；

存储器，与所述处理器耦接，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如上任一项所述的基于布谷鸟算法优化神经网络的能源需求预测方法。

本发明某一实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行实现如任一项所述的基于布谷鸟算法优化神经网络的能源需求预测方法。

相对于现有技术，本发明实施例至少具备如下有益效果：

本发明不仅可以有效的降低各地市分别建模的复杂性，提取各地市能源消费总量的相似信息，还可以克服神经网络预测模型存在的权重容易陷入局部最优解问题，提高模型的预测精度，对于提高地区能源利用效率、优化地区能源结构和提高地区能源运营管理效率具有重要意义。

附图说明

为了更清楚地说明本发明的技术方案，下面将对实施方式中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明某一实施例提供的基于布谷鸟算法优化神经网络的能源需求预测方法的流程示意图；

图2是本发明某一实施例提供的基于布谷鸟算法优化神经网络的能源需求预测系统的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，文中所使用的步骤编号仅是为了方便描述，不对作为对步骤执行先后顺序的限定。

应当理解，在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

第一方面：

请参阅图1，图1是本发明某一实施例提供的基于布谷鸟算法优化神经网络的能源需求预测方法的流程示意图。本实施例中，基于布谷鸟算法优化神经网络的能源需求预测方法包括以下步骤：

S10、获取待预测地区能源使用总量的历史数据并进行预处理，得到能源消费总量的历史数据矩阵；

在某一实施例中，以广东省为例，在此步骤中首先是收集各地市能源消费总量历史数据，数据间隔可以根据实际需要进行选取，在此优选为1年，共采集数据地年份也可以灵活调整，在此优选为20年的数据。其中，按照预设的比例分配这20年数据，以作为训练集和测试集，在此优选方式为：采用前17年的能源消费总量数据作为训练集，后3年的能源消费总量数据为测试集。

在某一实施例中，对于收集的历史数据，为确保各个地市的能源消费总量数据可以有效的进行聚类，将所有历史数据进行归一化，对于缺少或者错误的数据利用平均插值法进行处理。

需要说明的是，聚类分析也称群分析或点群分析，它是研究多要素事物分类问题的数量方法，是一种新兴的多元统计方法，是当代分类学与多元分析的结合。其基本原理是，根据样本自身的属性，用数学方法按照某种相似性或差异性指标，定量地确定样本之间的亲疏关系，并按这种亲疏关系程度对样本进行聚类。通过聚类分析能够将个体(样品)或者对象(变量)按相似程度(距离远近)划分类别，使得同一类中的元素之间的相似性比其他类的元素的相似性更强，使类间元素的同质性最大化和类与类间元素的异质性最大化。

具体地，在利用平均插值法进行处理时，可构建具体广东省各地市能源消费总量历史数据矩阵：

式中，m为采样中每年所对应的数据值；n为广东省不同地市；

同时，将广东省划分为粤西地区、粤北地区、粤东地区和珠三角地区四个地区，然后再构建能源消费总量历史数据矩阵为：

式中，m为采样中每年所对应的数据值，m＝20；n＝4。

其中，归一化的计算公式如下：

式中，

表示归一化值，x_i表示原地市能源需求总量值，x_min表示一个样本中原地市能源需求总量序列最小值，x_max表示一个样本中原地市能源需求总量序列最大值。

S20、根据所述历史数据矩阵，求解各列相关系数，并通过预设阈值与所述相关系数对所述历史数据进行初步聚类；

在某一实施例中，为确保聚类顺利进行，采用皮尔逊相关系数法分别计算每个地市能源消费总量矩阵C与四个地区能源消费总量矩阵D每列的相关系数，设置合适的阈值，选取相应的地市能源需求总量进行初步聚类，每个地市能源需求总量构成集合的表达如下：

X＝[X₁,...,X_i]；

式中，X_i表示第i个地市能源需求总量。

其中，将四个地区的能源需求总量统一表示为Y，则皮尔逊相关系数的计算公式为：

式中，∑X_i表示第i个地市能源需求总量取值的和，∑Y表示四个地区能源需求总量分别取值的和，N表示变量取值的个数。

此处皮尔逊相关系数的阈值取为0.6。

S30、采用改进K-means均值聚类算法，对所述初步聚类的结果进行二次聚类，得到所述历史数据的均值聚类结果；

在某一实施例中，针对K-means均值聚类中各个数据对象到距离中心的距离计算问题，提出来一种新的距离计算方式，新方法考虑不同地市能源需求总量的权值。改进K-means均值聚类具体步骤如下：

1)在步骤S20中通过皮尔逊相关系数方法对地市能源需求总量进行选取，计算了所选取地市能源需求总量的相关系数。利用归一化计算每个被选取地市能源需求总量的权值。计算公式为：

式中，ω_i为第i个地市能源需求总量的权值；

为第i个地市能源需求总量的相关系数，n为选取的地市能源需求总量个数。

2)将选取的地市能源需求总量数据作为输入，从中任意选择k个样本作为聚类中心，此时的聚类数目为k个。

3)计算每个对象到聚类中心的距离，根据最小距离划分每个对象数据所属类别。传统的距离计算没有考虑聚类过程中每个地市能源需求总量其本身权重的影响，提出来一种新的考虑地市能源需求总量权值的距离计算方法。计算公式为：

式中，X_i为样本中某个点X的第i个地市的数值；X_j为某个聚类中心的数值(j＝1,...,k)；ω_i为第i个地市能源需求总量的权值，n为选取的地区个数；

4)重新计算步骤3)中所确定的k个类别内所有样本的均值，并将得到的均值作为新的聚类中心。

5)通过重复步骤3)和步骤4)，直到每个聚类不再发生变化为止，此时得到的k个类别将作为最终的输入。

S40、采用布谷鸟算法优化BP神经网络，直至所述BP神经网络具有最优的权值和阈值，并根据此时的BP神经网络构建初始预测模型；

在某一实施例中，描述布谷鸟算法优化BP神经网络权重的过程和方法。BP神经网络的权重和阈值是随机确定的，存在容易陷入局部最优解的情况。布谷鸟算法作为一种启发式搜索算法，具有较强的寻优能力，其本身存在步长调节系数，并满足重尾的稳定分布，使得搜索寻优的效率大为提升。

具体地，布谷鸟寻优需满足以下三个规则。

a)对整个世界序列来说每只布谷鸟每次只下一个蛋，并随机的选取一个宿主进行孵化；

b)最好的宿主中的那只布谷鸟蛋可以保存到下一代；

c)宿主的总数保持不变。

进一步地，布谷鸟标准化公式为：

式中，

为点对点的乘法；a为步长控制量，主要控制步长的大小和方向；Levy(λ)为随机搜索变量，且步长服从下列公式的莱维分布：

Levy(s,λ)≈s^-λ；1<λ≤3；

式中，s为Levy飞行得到的随机步长。

进一步地，通过布谷鸟算法优化BP神经网络的参数，主要为优化网络的权重和阈值。

其中，初始权重和阈值的布谷鸟优化计算步骤为：

布谷鸟算法中Levy随机数的产生方法的计算公式为：

式中，β＝C为固定值，一般取值为1.5；

为概率分布，a为关系系数，u和v为标准正态分布的参数。

其中，

的概率分布的计算公式为：

式中，β＝C为固定值，一般取值为1.5；Γ为Γ分布

进一步地，初始权重和阈值产生的计算公式为：

式中，u＝0,n_in＝C,C为固定值，根据样本数量决定。

因此，布谷鸟优化初始权重和阈值的计算公式为：

式中，ω_i+1为更新后的权值和阈值；ω_i为初始权重值和阈值，

为概率分布，X_i为初始鸟巢的位置距离，X_best为最优鸟巢的位置距离，u和v为标准正态分布的参数，β＝C为固定值。

通过上述步骤，即可得到具有最优权重和阈值的优化BP神经网络，以作为初始预测模型。

S50、根据所述初始预测模型对所述均值聚类结果训练，得到目标预测模型，根据所述目标预测模型预测待预测地区的能源需求。

本发明实施例不仅可以有效的降低了各地市分别建模的复杂性，提取了各地市能源消费总量的相似信息，还可以克服神经网络预测模型存在的权重容易陷入局部最优解问题，提高模型的预测精度，因此可以辅助提高地区能源利用效率、优化地区能源结构和提高地区能源运营管理效率。

第二方面：

请参阅图2，本发明某一实施例还提供了一种基于布谷鸟算法优化神经网络的能源需求预测系统，包括：

矩阵构建模块01，用于获取待预测地区能源使用总量的历史数据并进行预处理，得到能源消费总量的历史数据矩阵；

初步聚类模块02，用于根据所述历史数据矩阵，求解各列相关系数，并通过预设阈值与所述相关系数对所述历史数据进行初步聚类；

二次聚类模块03，用于采用改进K-means均值聚类算法，对所述初步聚类的结果进行二次聚类，得到所述历史数据的均值聚类结果；

模型训练模块04，用于采用布谷鸟算法优化BP神经网络，直至所述BP神经网络具有最优的权值和阈值，并根据此时的BP神经网络构建初始预测模型；

预测模块05，用于根据所述初始预测模型对所述均值聚类结果训练，得到目标预测模型，根据所述目标预测模型预测待预测地区的能源需求。

可以理解的是，模块01-05分别用于执行步骤S10-S50，具体地：

式中，m为采样中每年所对应的数据值，m＝20；n＝4。

其中，归一化的计算公式如下：

式中，

X＝[X₁,...,X_i]；

式中，X_i表示第i个地市能源需求总量。

此处皮尔逊相关系数的阈值取为0.6。

式中，ω_i为第i个地市能源需求总量的权值；

具体地，布谷鸟寻优需满足以下三个规则。

b)最好的宿主中的那只布谷鸟蛋可以保存到下一代；

c)宿主的总数保持不变。

进一步地，布谷鸟标准化公式为：

式中，

Levy(s,λ)≈s^-λ；1<λ≤3；

式中，s为Levy飞行得到的随机步长。

其中，初始权重和阈值的布谷鸟优化计算步骤为：

布谷鸟算法中Levy随机数的产生方法的计算公式为：

式中，β＝C为固定值，一般取值为1.5；

为概率分布，a为关系系数，u和v为标准正态分布的参数。

其中，

的概率分布的计算公式为：

式中，β＝C为固定值，一般取值为1.5；Γ为Γ分布

进一步地，初始权重和阈值产生的计算公式为：

式中，u＝0,n_in＝C,C为固定值，根据样本数量决定。

因此，布谷鸟优化初始权重和阈值的计算公式为：

第三方面：

本发明某一实施例还提供了一种计算机终端设备，包括：

一个或多个处理器；

存储器，与所述处理器耦接，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如上所述的基于布谷鸟算法优化神经网络的能源需求预测方法。

处理器用于控制该计算机终端设备的整体操作，以完成上述的基于布谷鸟算法优化神经网络的能源需求预测方法的全部或部分步骤。存储器用于存储各种类型的数据以支持在该计算机终端设备的操作，这些数据例如可以包括用于在该计算机终端设备上操作的任何应用程序或方法的指令，以及应用程序相关的数据。该存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，例如静态随机存取存储器(Static RandomAccess Memory，简称SRAM)，电可擦除可编程只读存储器(Electrically ErasableProgrammable Read-Only Memory，简称EEPROM)，可擦除可编程只读存储器(ErasableProgrammable Read-Only Memory，简称EPROM)，可编程只读存储器(Programmable Read-Only Memory，简称PROM)，只读存储器(Read-Only Memory，简称ROM)，磁存储器，快闪存储器，磁盘或光盘。

计算机终端设备可以被一个或多个应用专用集成电路(Application Specific1ntegrated Circuit，简称AS1C)、数字信号处理器(Digital Signal Processor，简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device，简称PLD)、现场可编程门阵列(Field ProgrammableGate Array，简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行如上述任一项实施例所述的基于布谷鸟算法优化神经网络的能源需求预测方法，并达到如上述方法一致的技术效果。

本发明某一实施例还提供了一种包括程序指令的计算机可读存储介质，该程序指令被处理器执行时实现如上述任一项实施例所述的基于布谷鸟算法优化神经网络的能源需求预测方法的步骤。例如，该计算机可读存储介质可以为上述包括程序指令的存储器，上述程序指令可由计算机终端设备的处理器执行以完成如上述任一项实施例所述的基于布谷鸟算法优化神经网络的能源需求预测方法，并达到如上述方法一致的技术效果。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本发明的保护范围。

Claims

1.一种基于布谷鸟算法优化神经网络的能源需求预测方法，其特征在于，包括：

2.根据权利要求1所述的基于布谷鸟算法优化神经网络的能源需求预测方法，其特征在于，所述根据所述目标预测模型预测待预测地区的能源需求，包括：

3.根据权利要求1所述的基于布谷鸟算法优化神经网络的能源需求预测方法，其特征在于，所述获取待预测地区能源使用总量的历史数据并进行预处理，得到能源消费总量的历史数据矩阵，包括：

4.根据权利要求1所述的基于布谷鸟算法优化神经网络的能源需求预测方法，其特征在于，所述采用改进K-means均值聚类算法，对所述初步聚类的结果进行二次聚类，得到所述历史数据的均值聚类结果，包括：

计算每个所述历史数据到K个聚类中心的距离，计算公式为：

5.根据权利要求1所述的基于布谷鸟算法优化神经网络的能源需求预测方法，其特征在于，采用皮尔逊相关系数法求解所述相关系数。

6.一种基于布谷鸟算法优化神经网络的能源需求预测系统，其特征在于，包括：

7.根据权利要求6所述的基于布谷鸟算法优化神经网络的能源需求预测系统，其特征在于，所述预测模块，还用于，

8.根据权利要求6所述的基于布谷鸟算法优化神经网络的能源需求预测系统，其特征在于，所述矩阵构建模块，还用于，

9.根据权利要求6所述的基于布谷鸟算法优化神经网络的能源需求预测系统，其特征在于，所述二次聚类模块，还用于，

计算每个所述历史数据到K个聚类中心的距离，计算公式为：

10.根据权利要求6所述的基于布谷鸟算法优化神经网络的能源需求预测系统，其特征在于，所述初步聚类模块，还用于采用皮尔逊相关系数法求解所述相关系数。