CN112819246A - 基于布谷鸟算法优化神经网络的能源需求预测方法 - Google Patents
基于布谷鸟算法优化神经网络的能源需求预测方法 Download PDFInfo
- Publication number
- CN112819246A CN112819246A CN202110211620.XA CN202110211620A CN112819246A CN 112819246 A CN112819246 A CN 112819246A CN 202110211620 A CN202110211620 A CN 202110211620A CN 112819246 A CN112819246 A CN 112819246A
- Authority
- CN
- China
- Prior art keywords
- clustering
- historical data
- neural network
- predicted
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 66
- 241000544061 Cuculus canorus Species 0.000 title claims abstract description 57
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 57
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000005265 energy consumption Methods 0.000 claims abstract description 56
- 239000011159 matrix material Substances 0.000 claims abstract description 33
- 238000012549 training Methods 0.000 claims abstract description 19
- 238000007781 pre-processing Methods 0.000 claims abstract description 10
- 238000004364 calculation method Methods 0.000 claims description 26
- 238000005457 optimization Methods 0.000 claims description 17
- 238000010606 normalization Methods 0.000 claims description 8
- 238000012360 testing method Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 description 5
- 235000005770 birds nest Nutrition 0.000 description 4
- 238000007621 cluster analysis Methods 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 235000005765 wild carrot Nutrition 0.000 description 4
- 238000004590 computer program Methods 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000012447 hatching Effects 0.000 description 2
- 238000002789 length control Methods 0.000 description 2
- 238000012067 mathematical method Methods 0.000 description 2
- 238000000491 multivariate analysis Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 238000010845 search algorithm Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Economics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于布谷鸟算法优化神经网络的能源需求预测方法,包括:获取待预测地区能源使用总量的历史数据并进行预处理,得到能源消费总量的历史数据矩阵;求解矩阵的各列相关系数,并结合预设阈值对历史数据进行初步聚类;采用改进K‑means均值聚类算法,对初步聚类的结果进行二次聚类;采用布谷鸟算法优化BP神经网络,直至BP神经网络具有最优的权值和阈值,并根据此时的BP神经网络构建初始预测模型;根据初始预测模型对所述二次聚类结果训练,得到目标预测模型,以预测待预测地区的能源需求。本发明提供的预测方法,能够综合考虑区域性差异对于能源需求的影响,有效降低建模数量及复杂性,同时准确预测区域能源需求。
Description
技术领域
本发明涉及深度学习技术领域,尤其涉及一种基于布谷鸟算法优化神经网络的能源需求预测方法。
背景技术
能源需求预测对于国家经济的发展来说有重要意义,目前在进行能源需求预测时,通常是参照能源消费总量的历史数据,结合BP神经网络进行预测。但是这种方式通常存在以下问题:第一,在数据建模上由于没有对于影响能源消费总量的影响因素进行具体分析,导致建模数量冗余,建模过程复杂;第二,利用BP神经网络进行预测时,容易出现由于初始权重和阈值的随机性而陷入局部最优解的问题,进而影响预测结果的准确性。因此,如何提供一种预测方法,以简单、准确预测区域的能源需求是本领域亟待解决的技术问题之一。
发明内容
本发明的目的在于提供一种基于布谷鸟算法优化神经网络的能源需求预测方法,能够综合考虑区域性差异对于能源需求的影响,有效降低建模数量及复杂性,同时准确预测区域能源需求。
为了克服上述现有技术中的缺陷,本发明实施例提供了一种基于布谷鸟算法优化神经网络的能源需求预测方法,包括:
获取待预测地区能源使用总量的历史数据并进行预处理,得到能源消费总量的历史数据矩阵;
根据所述历史数据矩阵,求解各列相关系数,并通过预设阈值与所述相关系数对所述历史数据进行初步聚类;
采用改进K-means均值聚类算法,对所述初步聚类的结果进行二次聚类,得到所述历史数据的均值聚类结果;
采用布谷鸟算法优化BP神经网络,直至所述BP神经网络具有最优的权值和阈值,并根据此时的BP神经网络构建初始预测模型;
根据所述初始预测模型对所述均值聚类结果训练,得到目标预测模型,根据所述目标预测模型预测待预测地区的能源需求。
作为优选地,所述根据所述目标预测模型预测待预测地区的能源需求,包括:
将待预测年份数据输入至所述改进K-means均值聚类算法,获得所述待预测年份的所属地区,根据并匹配与所属地区对应的地区预测模型;
对待预测年份数据进行归一化处理,将处理后的数据输入至所述地区预测模型,预测待预测年份的能源需求总量。
作为优选地,所述获取待预测地区能源使用总量的历史数据并进行预处理,得到能源消费总量的历史数据矩阵,包括:
获取待预测地区预设年度范围内的能源消费总量数据,以作为样本数据;其中,所述样本数据包括按照预设比例分配后得到的训练集与测试集;
对所述样本数据进行归一化、平均插值法处理,得到优化后的目标样本数据;
根据目标样本数据,构建所有待预测地区的能源消费总量历史数据矩阵;
将所述目标样本数据划分为N类,构建N类地区的能源消费总量历史数据矩阵。
作为优选地,所述采用改进K-means均值聚类算法,对所述初步聚类的结果进行二次聚类,得到所述历史数据的均值聚类结果,包括:
根据所述初步聚类的结果,从所有待预测地区的能源消费总量历史数据中选取K个样本,以作为聚类中心;
计算每个所述历史数据到K个聚类中心的距离,计算公式为:
式中,Xi为样本中某个点X的第u个地区的数值;Xj为某个聚类中心的数值(j=1,...,k);ωi为第i个地区的权值,n为选取的地区的个数;
分别重新计算所述K个样本中的数据均值,得到新的K个聚类中心;
重复执行所述计算每个所述历史数据到K个聚类中心的距离步骤,直至K个聚类结果不发生改变,得到所述历史数据的均值聚类结果。
作为优选地,采用皮尔逊相关系数法求解所述相关系数。
本发明某一实施例还提供了一种基于布谷鸟算法优化神经网络的能源需求预测系统,包括:
矩阵构建模块,用于获取待预测地区能源使用总量的历史数据并进行预处理,得到能源消费总量的历史数据矩阵;
初步聚类模块,用于根据所述历史数据矩阵,求解各列相关系数,并通过预设阈值与所述相关系数对所述历史数据进行初步聚类;
二次聚类模块,用于采用改进K-means均值聚类算法,对所述初步聚类的结果进行二次聚类,得到所述历史数据的均值聚类结果;
模型训练模块,用于采用布谷鸟算法优化BP神经网络,直至所述BP神经网络具有最优的权值和阈值,并根据此时的BP神经网络构建初始预测模型;
预测模块,用于根据所述初始预测模型对所述均值聚类结果训练,得到目标预测模型,根据所述目标预测模型预测待预测地区的能源需求。
作为优选地,所述预测模块,还用于,
将待预测年份数据输入至所述改进K-means均值聚类算法,获得所述待预测年份的所属地区,根据并匹配与所属地区对应的地区预测模型;
对待预测年份数据进行归一化处理,将处理后的数据输入至所述地区预测模型,预测待预测年份的能源需求总量。
作为优选地,所述矩阵构建模块,还用于,
获取待预测地区预设年度范围内的能源消费总量数据,以作为样本数据;其中,所述样本数据包括按照预设比例分配后得到的训练集与测试集;
对所述样本数据进行归一化、平均插值法处理,得到优化后的目标样本数据;
根据目标样本数据,构建所有待预测地区的能源消费总量历史数据矩阵;
将所述目标样本数据划分为N类,构建N类地区的能源消费总量历史数据矩阵。
作为优选地,所述二次聚类模块,还用于,
根据所述初步聚类的结果,从所有待预测地区的能源消费总量历史数据中选取K个样本,以作为聚类中心;
计算每个所述历史数据到K个聚类中心的距离,计算公式为:
式中,Xi为样本中某个点X的第i个地区的数值;Xj为某个聚类中心的数值(j=1,...,k);ωi为第i个地区的权值,n为选取的地区的个数;
分别重新计算所述K个样本中的数据均值,得到新的K个聚类中心;
重复执行所述计算每个所述历史数据到K个聚类中心的距离步骤,直至K个聚类结果不发生改变,得到所述历史数据的均值聚类结果。
作为优选地,所述初步聚类模块,还用于采用皮尔逊相关系数法求解所述相关系数。
本发明某一实施例还提供了一种计算机终端设备,包括:
一个或多个处理器;
存储器,与所述处理器耦接,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上任一项所述的基于布谷鸟算法优化神经网络的能源需求预测方法。
本发明某一实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行实现如任一项所述的基于布谷鸟算法优化神经网络的能源需求预测方法。
相对于现有技术,本发明实施例至少具备如下有益效果:
本发明不仅可以有效的降低各地市分别建模的复杂性,提取各地市能源消费总量的相似信息,还可以克服神经网络预测模型存在的权重容易陷入局部最优解问题,提高模型的预测精度,对于提高地区能源利用效率、优化地区能源结构和提高地区能源运营管理效率具有重要意义。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明某一实施例提供的基于布谷鸟算法优化神经网络的能源需求预测方法的流程示意图;
图2是本发明某一实施例提供的基于布谷鸟算法优化神经网络的能源需求预测系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,文中所使用的步骤编号仅是为了方便描述,不对作为对步骤执行先后顺序的限定。
应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
第一方面:
请参阅图1,图1是本发明某一实施例提供的基于布谷鸟算法优化神经网络的能源需求预测方法的流程示意图。本实施例中,基于布谷鸟算法优化神经网络的能源需求预测方法包括以下步骤:
S10、获取待预测地区能源使用总量的历史数据并进行预处理,得到能源消费总量的历史数据矩阵;
在某一实施例中,以广东省为例,在此步骤中首先是收集各地市能源消费总量历史数据,数据间隔可以根据实际需要进行选取,在此优选为1年,共采集数据地年份也可以灵活调整,在此优选为20年的数据。其中,按照预设的比例分配这20年数据,以作为训练集和测试集,在此优选方式为:采用前17年的能源消费总量数据作为训练集,后3年的能源消费总量数据为测试集。
在某一实施例中,对于收集的历史数据,为确保各个地市的能源消费总量数据可以有效的进行聚类,将所有历史数据进行归一化,对于缺少或者错误的数据利用平均插值法进行处理。
需要说明的是,聚类分析也称群分析或点群分析,它是研究多要素事物分类问题的数量方法,是一种新兴的多元统计方法,是当代分类学与多元分析的结合。其基本原理是,根据样本自身的属性,用数学方法按照某种相似性或差异性指标,定量地确定样本之间的亲疏关系,并按这种亲疏关系程度对样本进行聚类。通过聚类分析能够将个体(样品)或者对象(变量)按相似程度(距离远近)划分类别,使得同一类中的元素之间的相似性比其他类的元素的相似性更强,使类间元素的同质性最大化和类与类间元素的异质性最大化。
具体地,在利用平均插值法进行处理时,可构建具体广东省各地市能源消费总量历史数据矩阵:
式中,m为采样中每年所对应的数据值;n为广东省不同地市;
同时,将广东省划分为粤西地区、粤北地区、粤东地区和珠三角地区四个地区,然后再构建能源消费总量历史数据矩阵为:
式中,m为采样中每年所对应的数据值,m=20;n=4。
其中,归一化的计算公式如下:
S20、根据所述历史数据矩阵,求解各列相关系数,并通过预设阈值与所述相关系数对所述历史数据进行初步聚类;
在某一实施例中,为确保聚类顺利进行,采用皮尔逊相关系数法分别计算每个地市能源消费总量矩阵C与四个地区能源消费总量矩阵D每列的相关系数,设置合适的阈值,选取相应的地市能源需求总量进行初步聚类,每个地市能源需求总量构成集合的表达如下:
X=[X1,...,Xi];
式中,Xi表示第i个地市能源需求总量。
其中,将四个地区的能源需求总量统一表示为Y,则皮尔逊相关系数的计算公式为:
式中,∑Xi表示第i个地市能源需求总量取值的和,∑Y表示四个地区能源需求总量分别取值的和,N表示变量取值的个数。
此处皮尔逊相关系数的阈值取为0.6。
S30、采用改进K-means均值聚类算法,对所述初步聚类的结果进行二次聚类,得到所述历史数据的均值聚类结果;
在某一实施例中,针对K-means均值聚类中各个数据对象到距离中心的距离计算问题,提出来一种新的距离计算方式,新方法考虑不同地市能源需求总量的权值。改进K-means均值聚类具体步骤如下:
1)在步骤S20中通过皮尔逊相关系数方法对地市能源需求总量进行选取,计算了所选取地市能源需求总量的相关系数。利用归一化计算每个被选取地市能源需求总量的权值。计算公式为:
2)将选取的地市能源需求总量数据作为输入,从中任意选择k个样本作为聚类中心,此时的聚类数目为k个。
3)计算每个对象到聚类中心的距离,根据最小距离划分每个对象数据所属类别。传统的距离计算没有考虑聚类过程中每个地市能源需求总量其本身权重的影响,提出来一种新的考虑地市能源需求总量权值的距离计算方法。计算公式为:
式中,Xi为样本中某个点X的第i个地市的数值;Xj为某个聚类中心的数值(j=1,...,k);ωi为第i个地市能源需求总量的权值,n为选取的地区个数;
4)重新计算步骤3)中所确定的k个类别内所有样本的均值,并将得到的均值作为新的聚类中心。
5)通过重复步骤3)和步骤4),直到每个聚类不再发生变化为止,此时得到的k个类别将作为最终的输入。
S40、采用布谷鸟算法优化BP神经网络,直至所述BP神经网络具有最优的权值和阈值,并根据此时的BP神经网络构建初始预测模型;
在某一实施例中,描述布谷鸟算法优化BP神经网络权重的过程和方法。BP神经网络的权重和阈值是随机确定的,存在容易陷入局部最优解的情况。布谷鸟算法作为一种启发式搜索算法,具有较强的寻优能力,其本身存在步长调节系数,并满足重尾的稳定分布,使得搜索寻优的效率大为提升。
具体地,布谷鸟寻优需满足以下三个规则。
a)对整个世界序列来说每只布谷鸟每次只下一个蛋,并随机的选取一个宿主进行孵化;
b)最好的宿主中的那只布谷鸟蛋可以保存到下一代;
c)宿主的总数保持不变。
进一步地,布谷鸟标准化公式为:
Levy(s,λ)≈s-λ;1<λ≤3;
式中,s为Levy飞行得到的随机步长。
进一步地,通过布谷鸟算法优化BP神经网络的参数,主要为优化网络的权重和阈值。
其中,初始权重和阈值的布谷鸟优化计算步骤为:
布谷鸟算法中Levy随机数的产生方法的计算公式为:
式中,β=C为固定值,一般取值为1.5;Γ为Γ分布
进一步地,初始权重和阈值产生的计算公式为:
式中,u=0,nin=C,C为固定值,根据样本数量决定。
因此,布谷鸟优化初始权重和阈值的计算公式为:
通过上述步骤,即可得到具有最优权重和阈值的优化BP神经网络,以作为初始预测模型。
S50、根据所述初始预测模型对所述均值聚类结果训练,得到目标预测模型,根据所述目标预测模型预测待预测地区的能源需求。
本发明实施例不仅可以有效的降低了各地市分别建模的复杂性,提取了各地市能源消费总量的相似信息,还可以克服神经网络预测模型存在的权重容易陷入局部最优解问题,提高模型的预测精度,因此可以辅助提高地区能源利用效率、优化地区能源结构和提高地区能源运营管理效率。
第二方面:
请参阅图2,本发明某一实施例还提供了一种基于布谷鸟算法优化神经网络的能源需求预测系统,包括:
矩阵构建模块01,用于获取待预测地区能源使用总量的历史数据并进行预处理,得到能源消费总量的历史数据矩阵;
初步聚类模块02,用于根据所述历史数据矩阵,求解各列相关系数,并通过预设阈值与所述相关系数对所述历史数据进行初步聚类;
二次聚类模块03,用于采用改进K-means均值聚类算法,对所述初步聚类的结果进行二次聚类,得到所述历史数据的均值聚类结果;
模型训练模块04,用于采用布谷鸟算法优化BP神经网络,直至所述BP神经网络具有最优的权值和阈值,并根据此时的BP神经网络构建初始预测模型;
预测模块05,用于根据所述初始预测模型对所述均值聚类结果训练,得到目标预测模型,根据所述目标预测模型预测待预测地区的能源需求。
可以理解的是,模块01-05分别用于执行步骤S10-S50,具体地:
S10、获取待预测地区能源使用总量的历史数据并进行预处理,得到能源消费总量的历史数据矩阵;
在某一实施例中,以广东省为例,在此步骤中首先是收集各地市能源消费总量历史数据,数据间隔可以根据实际需要进行选取,在此优选为1年,共采集数据地年份也可以灵活调整,在此优选为20年的数据。其中,按照预设的比例分配这20年数据,以作为训练集和测试集,在此优选方式为:采用前17年的能源消费总量数据作为训练集,后3年的能源消费总量数据为测试集。
在某一实施例中,对于收集的历史数据,为确保各个地市的能源消费总量数据可以有效的进行聚类,将所有历史数据进行归一化,对于缺少或者错误的数据利用平均插值法进行处理。
需要说明的是,聚类分析也称群分析或点群分析,它是研究多要素事物分类问题的数量方法,是一种新兴的多元统计方法,是当代分类学与多元分析的结合。其基本原理是,根据样本自身的属性,用数学方法按照某种相似性或差异性指标,定量地确定样本之间的亲疏关系,并按这种亲疏关系程度对样本进行聚类。通过聚类分析能够将个体(样品)或者对象(变量)按相似程度(距离远近)划分类别,使得同一类中的元素之间的相似性比其他类的元素的相似性更强,使类间元素的同质性最大化和类与类间元素的异质性最大化。
具体地,在利用平均插值法进行处理时,可构建具体广东省各地市能源消费总量历史数据矩阵:
式中,m为采样中每年所对应的数据值;n为广东省不同地市;
同时,将广东省划分为粤西地区、粤北地区、粤东地区和珠三角地区四个地区,然后再构建能源消费总量历史数据矩阵为:
式中,m为采样中每年所对应的数据值,m=20;n=4。
其中,归一化的计算公式如下:
S20、根据所述历史数据矩阵,求解各列相关系数,并通过预设阈值与所述相关系数对所述历史数据进行初步聚类;
在某一实施例中,为确保聚类顺利进行,采用皮尔逊相关系数法分别计算每个地市能源消费总量矩阵C与四个地区能源消费总量矩阵D每列的相关系数,设置合适的阈值,选取相应的地市能源需求总量进行初步聚类,每个地市能源需求总量构成集合的表达如下:
X=[X1,...,Xi];
式中,Xi表示第i个地市能源需求总量。
其中,将四个地区的能源需求总量统一表示为Y,则皮尔逊相关系数的计算公式为:
式中,∑Xi表示第i个地市能源需求总量取值的和,∑Y表示四个地区能源需求总量分别取值的和,N表示变量取值的个数。
此处皮尔逊相关系数的阈值取为0.6。
S30、采用改进K-means均值聚类算法,对所述初步聚类的结果进行二次聚类,得到所述历史数据的均值聚类结果;
在某一实施例中,针对K-means均值聚类中各个数据对象到距离中心的距离计算问题,提出来一种新的距离计算方式,新方法考虑不同地市能源需求总量的权值。改进K-means均值聚类具体步骤如下:
1)在步骤S20中通过皮尔逊相关系数方法对地市能源需求总量进行选取,计算了所选取地市能源需求总量的相关系数。利用归一化计算每个被选取地市能源需求总量的权值。计算公式为:
2)将选取的地市能源需求总量数据作为输入,从中任意选择k个样本作为聚类中心,此时的聚类数目为k个。
3)计算每个对象到聚类中心的距离,根据最小距离划分每个对象数据所属类别。传统的距离计算没有考虑聚类过程中每个地市能源需求总量其本身权重的影响,提出来一种新的考虑地市能源需求总量权值的距离计算方法。计算公式为:
式中,Xi为样本中某个点X的第i个地市的数值;Xj为某个聚类中心的数值(j=1,...,k);ωi为第i个地市能源需求总量的权值,n为选取的地区个数;
4)重新计算步骤3)中所确定的k个类别内所有样本的均值,并将得到的均值作为新的聚类中心。
5)通过重复步骤3)和步骤4),直到每个聚类不再发生变化为止,此时得到的k个类别将作为最终的输入。
S40、采用布谷鸟算法优化BP神经网络,直至所述BP神经网络具有最优的权值和阈值,并根据此时的BP神经网络构建初始预测模型;
在某一实施例中,描述布谷鸟算法优化BP神经网络权重的过程和方法。BP神经网络的权重和阈值是随机确定的,存在容易陷入局部最优解的情况。布谷鸟算法作为一种启发式搜索算法,具有较强的寻优能力,其本身存在步长调节系数,并满足重尾的稳定分布,使得搜索寻优的效率大为提升。
具体地,布谷鸟寻优需满足以下三个规则。
a)对整个世界序列来说每只布谷鸟每次只下一个蛋,并随机的选取一个宿主进行孵化;
b)最好的宿主中的那只布谷鸟蛋可以保存到下一代;
c)宿主的总数保持不变。
进一步地,布谷鸟标准化公式为:
Levy(s,λ)≈s-λ;1<λ≤3;
式中,s为Levy飞行得到的随机步长。
进一步地,通过布谷鸟算法优化BP神经网络的参数,主要为优化网络的权重和阈值。
其中,初始权重和阈值的布谷鸟优化计算步骤为:
布谷鸟算法中Levy随机数的产生方法的计算公式为:
式中,β=C为固定值,一般取值为1.5;Γ为Γ分布
进一步地,初始权重和阈值产生的计算公式为:
式中,u=0,nin=C,C为固定值,根据样本数量决定。
因此,布谷鸟优化初始权重和阈值的计算公式为:
通过上述步骤,即可得到具有最优权重和阈值的优化BP神经网络,以作为初始预测模型。
S50、根据所述初始预测模型对所述均值聚类结果训练,得到目标预测模型,根据所述目标预测模型预测待预测地区的能源需求。
第三方面:
本发明某一实施例还提供了一种计算机终端设备,包括:
一个或多个处理器;
存储器,与所述处理器耦接,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的基于布谷鸟算法优化神经网络的能源需求预测方法。
处理器用于控制该计算机终端设备的整体操作,以完成上述的基于布谷鸟算法优化神经网络的能源需求预测方法的全部或部分步骤。存储器用于存储各种类型的数据以支持在该计算机终端设备的操作,这些数据例如可以包括用于在该计算机终端设备上操作的任何应用程序或方法的指令,以及应用程序相关的数据。该存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static RandomAccess Memory,简称SRAM),电可擦除可编程只读存储器(Electrically ErasableProgrammable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(ErasableProgrammable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
计算机终端设备可以被一个或多个应用专用集成电路(Application Specific1ntegrated Circuit,简称AS1C)、数字信号处理器(Digital Signal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field ProgrammableGate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行如上述任一项实施例所述的基于布谷鸟算法优化神经网络的能源需求预测方法,并达到如上述方法一致的技术效果。
本发明某一实施例还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现如上述任一项实施例所述的基于布谷鸟算法优化神经网络的能源需求预测方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器,上述程序指令可由计算机终端设备的处理器执行以完成如上述任一项实施例所述的基于布谷鸟算法优化神经网络的能源需求预测方法,并达到如上述方法一致的技术效果。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (10)
1.一种基于布谷鸟算法优化神经网络的能源需求预测方法,其特征在于,包括:
获取待预测地区能源使用总量的历史数据并进行预处理,得到能源消费总量的历史数据矩阵;
根据所述历史数据矩阵,求解各列相关系数,并通过预设阈值与所述相关系数对所述历史数据进行初步聚类;
采用改进K-means均值聚类算法,对所述初步聚类的结果进行二次聚类,得到所述历史数据的均值聚类结果;
采用布谷鸟算法优化BP神经网络,直至所述BP神经网络具有最优的权值和阈值,并根据此时的BP神经网络构建初始预测模型;
根据所述初始预测模型对所述均值聚类结果训练,得到目标预测模型,根据所述目标预测模型预测待预测地区的能源需求。
2.根据权利要求1所述的基于布谷鸟算法优化神经网络的能源需求预测方法,其特征在于,所述根据所述目标预测模型预测待预测地区的能源需求,包括:
将待预测年份数据输入至所述改进K-means均值聚类算法,获得所述待预测年份的所属地区,根据并匹配与所属地区对应的地区预测模型;
对待预测年份数据进行归一化处理,将处理后的数据输入至所述地区预测模型,预测待预测年份的能源需求总量。
3.根据权利要求1所述的基于布谷鸟算法优化神经网络的能源需求预测方法,其特征在于,所述获取待预测地区能源使用总量的历史数据并进行预处理,得到能源消费总量的历史数据矩阵,包括:
获取待预测地区预设年度范围内的能源消费总量数据,以作为样本数据;其中,所述样本数据包括按照预设比例分配后得到的训练集与测试集;
对所述样本数据进行归一化、平均插值法处理,得到优化后的目标样本数据;
根据目标样本数据,构建所有待预测地区的能源消费总量历史数据矩阵;
将所述目标样本数据划分为N类,构建N类地区的能源消费总量历史数据矩阵。
4.根据权利要求1所述的基于布谷鸟算法优化神经网络的能源需求预测方法,其特征在于,所述采用改进K-means均值聚类算法,对所述初步聚类的结果进行二次聚类,得到所述历史数据的均值聚类结果,包括:
根据所述初步聚类的结果,从所有待预测地区的能源消费总量历史数据中选取K个样本,以作为聚类中心;
计算每个所述历史数据到K个聚类中心的距离,计算公式为:
式中,Xi为样本中某个点X的第i个地区的数值;Xj为某个聚类中心的数值(j=1,...,k);ωi为第i个地区的权值,n为选取的地区的个数;
分别重新计算所述K个样本中的数据均值,得到新的K个聚类中心;
重复执行所述计算每个所述历史数据到K个聚类中心的距离步骤,直至K个聚类结果不发生改变,得到所述历史数据的均值聚类结果。
5.根据权利要求1所述的基于布谷鸟算法优化神经网络的能源需求预测方法,其特征在于,采用皮尔逊相关系数法求解所述相关系数。
6.一种基于布谷鸟算法优化神经网络的能源需求预测系统,其特征在于,包括:
矩阵构建模块,用于获取待预测地区能源使用总量的历史数据并进行预处理,得到能源消费总量的历史数据矩阵;
初步聚类模块,用于根据所述历史数据矩阵,求解各列相关系数,并通过预设阈值与所述相关系数对所述历史数据进行初步聚类;
二次聚类模块,用于采用改进K-means均值聚类算法,对所述初步聚类的结果进行二次聚类,得到所述历史数据的均值聚类结果;
模型训练模块,用于采用布谷鸟算法优化BP神经网络,直至所述BP神经网络具有最优的权值和阈值,并根据此时的BP神经网络构建初始预测模型;
预测模块,用于根据所述初始预测模型对所述均值聚类结果训练,得到目标预测模型,根据所述目标预测模型预测待预测地区的能源需求。
7.根据权利要求6所述的基于布谷鸟算法优化神经网络的能源需求预测系统,其特征在于,所述预测模块,还用于,
将待预测年份数据输入至所述改进K-means均值聚类算法,获得所述待预测年份的所属地区,根据并匹配与所属地区对应的地区预测模型;
对待预测年份数据进行归一化处理,将处理后的数据输入至所述地区预测模型,预测待预测年份的能源需求总量。
8.根据权利要求6所述的基于布谷鸟算法优化神经网络的能源需求预测系统,其特征在于,所述矩阵构建模块,还用于,
获取待预测地区预设年度范围内的能源消费总量数据,以作为样本数据;其中,所述样本数据包括按照预设比例分配后得到的训练集与测试集;
对所述样本数据进行归一化、平均插值法处理,得到优化后的目标样本数据;
根据目标样本数据,构建所有待预测地区的能源消费总量历史数据矩阵;
将所述目标样本数据划分为N类,构建N类地区的能源消费总量历史数据矩阵。
10.根据权利要求6所述的基于布谷鸟算法优化神经网络的能源需求预测系统,其特征在于,所述初步聚类模块,还用于采用皮尔逊相关系数法求解所述相关系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110211620.XA CN112819246A (zh) | 2021-02-25 | 2021-02-25 | 基于布谷鸟算法优化神经网络的能源需求预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110211620.XA CN112819246A (zh) | 2021-02-25 | 2021-02-25 | 基于布谷鸟算法优化神经网络的能源需求预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112819246A true CN112819246A (zh) | 2021-05-18 |
Family
ID=75865597
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110211620.XA Pending CN112819246A (zh) | 2021-02-25 | 2021-02-25 | 基于布谷鸟算法优化神经网络的能源需求预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112819246A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114877250A (zh) * | 2022-05-05 | 2022-08-09 | 成都秦川物联网科技股份有限公司 | 一种汽化自控式lng分布式能源物联网智能供气方法及装置 |
CN116028838A (zh) * | 2023-01-09 | 2023-04-28 | 广东电网有限责任公司 | 一种基于聚类算法的能源数据处理方法、装置及终端设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110263915A (zh) * | 2019-05-31 | 2019-09-20 | 广东工业大学 | 一种基于深度信念网络的风电功率预测方法 |
CN110766200A (zh) * | 2019-09-23 | 2020-02-07 | 广东工业大学 | 一种基于K-means均值聚类的风电机组发电功率预测方法 |
-
2021
- 2021-02-25 CN CN202110211620.XA patent/CN112819246A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110263915A (zh) * | 2019-05-31 | 2019-09-20 | 广东工业大学 | 一种基于深度信念网络的风电功率预测方法 |
CN110766200A (zh) * | 2019-09-23 | 2020-02-07 | 广东工业大学 | 一种基于K-means均值聚类的风电机组发电功率预测方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114877250A (zh) * | 2022-05-05 | 2022-08-09 | 成都秦川物联网科技股份有限公司 | 一种汽化自控式lng分布式能源物联网智能供气方法及装置 |
CN114877250B (zh) * | 2022-05-05 | 2023-05-19 | 成都秦川物联网科技股份有限公司 | 一种汽化自控式lng分布式能源物联网智能供气方法及装置 |
CN116028838A (zh) * | 2023-01-09 | 2023-04-28 | 广东电网有限责任公司 | 一种基于聚类算法的能源数据处理方法、装置及终端设备 |
CN116028838B (zh) * | 2023-01-09 | 2023-09-19 | 广东电网有限责任公司 | 一种基于聚类算法的能源数据处理方法、装置及终端设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108108762B (zh) | 一种用于冠心病数据的核极限学习机及随机森林分类方法 | |
Ding et al. | Research on using genetic algorithms to optimize Elman neural networks | |
CN112686464A (zh) | 短期风电功率预测方法及装置 | |
He et al. | A combined model for short-term wind power forecasting based on the analysis of numerical weather prediction data | |
CN111967696B (zh) | 基于神经网络的电动汽车充电需求预测方法、系统及装置 | |
CN110674636B (zh) | 一种用电行为分析方法 | |
CN112819246A (zh) | 基于布谷鸟算法优化神经网络的能源需求预测方法 | |
CN107220311A (zh) | 一种利用局部嵌入话题建模的文本表示方法 | |
CN113361785A (zh) | 配电网短期负荷预测方法、装置、终端及存储介质 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN115099461A (zh) | 基于双分支特征提取的太阳辐射预测方法及系统 | |
CN116799796A (zh) | 一种光伏发电功率预测方法、装置、设备及介质 | |
CN114648170A (zh) | 基于混合深度学习模型的水库水位预测预警方法及系统 | |
CN113743453A (zh) | 一种基于随机森林的人口数量预测方法 | |
CN113222281A (zh) | 基于改进AlexNet-GRU模型的配电网短期负荷预测方法及装置 | |
CN113095511A (zh) | 一种在自动化主站实现操作到位的判断方法及装置 | |
CN117277312A (zh) | 一种基于灰色关联分析的电力负荷影响因素方法及设备 | |
CN116739172A (zh) | 一种基于爬坡识别的海上风电功率超短期预测方法及装置 | |
CN116595895A (zh) | 短时电量预测模型的训练方法及短时电量预测方法 | |
CN116706884A (zh) | 光伏发电量的预测方法、装置、终端及存储介质 | |
CN116415177A (zh) | 一种基于极限学习机的分类器参数辨识方法 | |
CN113705929B (zh) | 一种基于负荷特征曲线及典型特征值融合的春节假期负荷预测方法 | |
CN115270921A (zh) | 基于组合预测模型的电力负载预测方法、系统及存储介质 | |
CN114139783A (zh) | 基于非线性加权组合的风电短期功率预测方法及装置 | |
CN113762591A (zh) | 一种基于gru和多核svm对抗学习的短期电量预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210518 |