CN111582534A - 一种基于极限学习机的水力发电预测方法 - Google Patents
一种基于极限学习机的水力发电预测方法 Download PDFInfo
- Publication number
- CN111582534A CN111582534A CN202010156680.1A CN202010156680A CN111582534A CN 111582534 A CN111582534 A CN 111582534A CN 202010156680 A CN202010156680 A CN 202010156680A CN 111582534 A CN111582534 A CN 111582534A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- training
- hidden layer
- power generation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000010248 power generation Methods 0.000 title claims abstract description 31
- 238000012549 training Methods 0.000 claims abstract description 66
- 238000012360 testing method Methods 0.000 claims abstract description 27
- 238000011156 evaluation Methods 0.000 claims abstract description 14
- 238000002790 cross-validation Methods 0.000 claims abstract description 13
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 239000010410 layer Substances 0.000 claims description 79
- 239000011159 matrix material Substances 0.000 claims description 31
- 210000002569 neuron Anatomy 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 20
- 230000001932 seasonal effect Effects 0.000 claims description 19
- 230000004913 activation Effects 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 17
- 238000013528 artificial neural network Methods 0.000 claims description 14
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 claims description 8
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 claims description 8
- 230000007774 longterm Effects 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 6
- 238000013459 approach Methods 0.000 claims description 4
- 239000006185 dispersion Substances 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 claims description 4
- 230000001788 irregular Effects 0.000 claims description 4
- 230000000737 periodic effect Effects 0.000 claims description 4
- 239000002356 single layer Substances 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000000611 regression analysis Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000003618 cortical neuron Anatomy 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- ZZUFCTLCJUWOSV-UHFFFAOYSA-N furosemide Chemical compound C1=C(Cl)C(S(=O)(=O)N)=CC(C(O)=O)=C1NCC1=CC=CO1 ZZUFCTLCJUWOSV-UHFFFAOYSA-N 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000008239 natural water Substances 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005381 potential energy Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- Biophysics (AREA)
- General Business, Economics & Management (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于极限学习机的水力发电预测方法,该方法包括以下步骤:从水利发电系统中获取参数数据信息,预处理数据;分割数据成互斥的两部分,一部分进行数据训练,一部分进行数据测试;获取训练数据,并采用训练数据建立模型;采用交叉验证、网格搜索、模型评估的方法,模型训练,获得最优模型;采用训练好的最优ELM模型预测测试数据,获得并输出预测结果,其中,ELM为极限学习机模型;通过该方法,展示了更快的学习速度和更好的泛化能力;更准确有效地预测水力发电,降低了成本,提高了学习速率。
Description
技术领域
本发明涉及电力能源技术领域,具体来说,涉及一种基于极限学习机的水力发电预测方法。
背景技术
水利发电作为新能源的一种,主要是利用河流的落差,将高处的势能通过水轮机转换为电能。水利发电具有多种优势,是一种可再生能源,取之不尽用之不竭,同时节能环保,对环境影响较小,因此水利发电一直被大力推广。但同时,由于水利发电利用自然水流,对水流条件非常依赖,水流的流量不确定性,环境因素等都会导致水利发电的不稳定,影响发电效率,因此水利发电的预测研究尤为重要。
在实际运行中,由于水力系统存在不稳定性,且一般难以通过数据直接获取,目前很多专家学者采用了多种方法对水力发电进行预测。
时间序列法在短期的负荷预测中应用较为成熟,根据历史数据建立水电负荷的时序模型,对未来负荷进行预测,时间序列方法的优点是工作量小,计算速度较快,能反应负荷近期变换的连续性,但该方法的对序列的平稳性要求较高,且没有考虑影响负荷变化的因素,水资源系统本身存在自然上的嘈杂性,因此传统的时间序列方法在预测上的失误是无法避免的。
回归分析预测方法是根据历史数据的变化规律和影响负荷变化的因素,寻找自变量与因变量之间的相关关系及其回归方程式,确定模型参数,据此推断将来时刻的负荷值。回归分析法的优点是计算原理和结构形式简单,预测速度快,外推性能好,对于历史上没有出现的情况有较好的预测。存在的不足是对历史数据要求较高,采用线性方法描述比较复杂的问题,结构形式过于简单,精度较低;该模型无法详细描述各种影响负荷的因素,模型初始化难度较大,需要丰富的经验和较高的技巧。
支持向量机(SVM)是一种基于统计学习理论提出的能实现在有限样本条件下满足VC维理论和结构风险最小原理的机器学习方法,具有泛化能力强,全局最优和计算速度快等突出优点。但其自选参数和核函数的选择,通常情况下主要靠经验确定,有较大的人为因素。同时,其缺乏对模糊现象的处理能力,模型误差会造成预测值和实际值的较大差距。
神经网络是目前较为先进的负荷预测方法,由于理论的不断完善和其在其他领域的成功应用,大量基于人工神经网络的预测模型被提出。神经网络法选取历史负荷作为训练样本,构建网络结构,用训练算法对网络进行训练,使其满足精度要求,此神经网络作为负荷预测模型,实践证明人工神经网络短期预测有较好的精度。然而即使是最先进的基于人工神经网络的预测方法,一些固有的缺点仍然是不可避免的,比如过多的训练,操作成本偏高,学习速度较慢,容易陷入局部最优解等难题。其中关键缺点是学习算法慢以及需要不断迭代调整参数,因此该预测方法是无法通过改变算法结构和不断训练来提高预测效果的。
发明内容
针对相关技术中的上述技术问题,本发明提出一种基于极限学习机的水力发电预测方法,能够克服现有技术的上述不足。
为实现上述技术目的,本发明的技术方案是这样实现的:
一种基于极限学习机的水力发电预测方法,该方法包括以下步骤:
S1:从水利发电系统中获取参数数据信息,预处理数据;
S2:分割数据成互斥的两部分,一部分进行数据训练,一部分进行数据测试;
S3:获取训练数据,并采用训练数据建立模型;
S4:采用交叉验证、网格搜索、模型评估的方法,模型训练,获得最优模型;
S5:采用训练好的最优ELM模型预测测试数据,获得并输出预测结果,其中,ELM为极限学习机模型;
所述步骤S3进一步包括以下步骤:
S31:ELM的输入权值向量w和隐藏层节点b随机赋值,初始化参数,其中,在极限学习机中,给定任意Q个不同样本(xi,ti),xi=[xi1,xi2,...,xin]T∈Rn,ti=[ti1,ti2,...,tim]∈Rm,一个任意区间无限可微的激活函数g:R→R,对与具有Q个隐藏层神经元的SLFN,SLFN为单层前馈神经网络,在任意赋值wi∈Rn和bi∈R的情况下,隐藏层输出矩阵H可逆具有||Hβ-T`||=0,隐藏层与输出层的连接权值为β且给定任意小误差ε>0和一个任意区间无限可微的激活函数g:R→R,总存在一个含有K个隐藏层神经元的SLFN,K<=Q,任意赋值wi∈Rn和bi∈R的情况下,有||HN×MβM×N-T||<ε,隐藏层神经元个数与训练集样本个数相等时,对于任意的W和b,SLFN以零误差逼近训练,计算公式为
yj=[y1j,y2j,...,ymj]T(j=1,2,...,Q),
当训练样本个数Q较大时,隐藏层神经元个数K取值比Q小,SLFN的训练误误差逼近任一个ε>0即
当激活函数g无限可微时,SLFN的参数不需要全部调整,w和b在训练前随机选择,在训练过程中保持不变;
S32:计算隐藏层输出矩阵,其中,隐藏层和输出层的连接权值β通过求解以下方程组的最小二乘解获得,计算公式为
S33:计算并出权值矩阵,其中,结果为
H+为隐藏层输出矩阵H的Moore-Penrose广义阵;
所述步骤S4进一步包括以下步骤:
S41:交叉验证;
S42:网格搜索,预先设置模型参数范围,训练所有参数组合,获得若干模型,选择最优模型,其中,采用网格搜索模型的隐藏层数量和激活函数;
S43:模型评估;
所述步骤S43包括以下步骤:
S431:选取了平均绝对误差MAE、平均绝对相对误差MAPE和均方根误差RMSE三个指标作为模型评估标准,其中,RMSE为主要评估标准;
S432:采用MAE,表面预测值误差的实际情况,其中,公式为
S433:采用MAPE,表明测试结果的精密度,其中,公式为
S434:采用RMSE,反映数据集的离散程度和稳定性,其中,公式为
S435:确定最佳的极限学习模型结构。
进一步的,所述步骤S1包括以下步骤:
S11:获取、整理不同的数据源数据,并加载到一个新的数据源,合成训练数据集,综合分析数据信息;
S12:依据数据点之间的时间步长,校正为规则的时间步长;
S13:判断数据缺失情况,获取最健康的近似数据,替换缺失数据;
S14:采用波浪去噪技术,去除极端天气下的尖峰数据;
S15:去除季节性因素。
进一步的,所述步骤S15包括以下步骤:
S151:依据四个季度的水力时间序列数据,计算水力时间序列数据的移动平均值,获得长期趋势T;
S153:获取计算结果数据,依据各个年份同季度数据计算各季度平均值;
S154:计算并获得季节比率Si,其中,计算公式分子为各同季度平均数,分母为各季度算术平均数;
S155:计算T期的预测值,其中,公式为Yt=Tt×Si。
进一步的,所述步骤S41包括以下步骤:
S411:将数据集D分为k个大小相似的互斥数据集,其中,每个子集都尽可能保持数据分布的一致性;
S412:每次采用用k-1个子集的并集作为训练集,剩余的子集作为测试集,k次训练和测试,获得k个测试结果的均值。
进一步的,所述步骤S1中,获取涵盖所有情况的数据,获取时间信息、流速信息、流量信息、运行效率数据。
进一步的,所述步骤S13中,最健康数据为最近几个小时的历史数据或同一时间点最近几天的历史数据或采用波动规则估算的数据。
本发明的有益效果:通过该方法,产生了唯一的最优解;极限学习机及其变体应用在在一些回归和分类领域中的基准问题和工程,展示了更快的学习速度和更好的泛化能力;极限学习机可以随机选择多个迭代、输入权重和偏差,然后通过简单的矩阵计算确定输出权重,更准确有效地预测水力发电,降低了成本,提高了学习速率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例所述的一种基于极限学习机的水力发电预测方法的流程框图;
图2是根据本发明实施例所述的一种基于极限学习机的水力发电预测方法的去除季节性因素的流程框图;
图3是根据本发明实施例所述的一种基于极限学习机的水力发电预测方法的传统前馈神经网络结构图;
图4是根据本发明实施例所述的一种基于极限学习机的水力发电预测方法的极限学习机网络结构图;
图5是根据本发明实施例所述的一种基于极限学习机的水力发电预测方法的交叉验证的流程框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,根据本发明实施例所述的一种基于极限学习机的水力发电预测方法,包括以下步骤:
S1:从水利发电系统中获取参数数据信息,预处理数据;
S2:分割数据成互斥的两部分,一部分进行数据训练,一部分进行数据测试;
S3:获取训练数据,并采用训练数据建立模型;
S4:采用交叉验证、网格搜索、模型评估的方法,模型训练,获得最优模型;
S5:采用训练好的最优ELM模型预测测试数据,获得并输出预测结果,其中,ELM为极限学习机模型;
步骤S3进一步包括以下步骤:
S31:ELM的输入权值向量w和隐藏层节点b随机赋值,初始化参数,其中,在极限学习机中,给定任意Q个不同样本(xi,ti),xi=[xi1,xi2,...,xin]T∈Rn,ti=[ti1,ti2,...,tim]∈Rm,一个任意区间无限可微的激活函数g:R→R,对与具有Q个隐藏层神经元的SLFN,在任意赋值wi∈Rn和bi∈R的情况下,隐藏层输出矩阵H可逆具有||Hβ-T`||=0,隐藏层与输出层的连接权值为β且给定任意小误差ε>0和一个任意区间无限可微的激活函数g:R→R,总存在一个含有K个隐藏层神经元的SLFN,K<=Q,任意赋值wi∈Rn和bi∈R的情况下,有||HN×MβM×N-T′||<ε,隐藏层神经元个数与训练集样本个数相等时,对于任意的W和b,SLFN以零误差逼近训练,SLFN为单层前馈神经网络,计算公式为
当激活函数g无限可微时,SLFN的参数不需要全部调整,w和b在训练前随机选择,在训练过程中保持不变;
S32:计算隐藏层输出矩阵,其中,隐藏层和输出层的连接权值β通过求解以下方程组的最小二乘解获得,计算公式为
S33:计算并出权值矩阵,其中,结果为
H+为隐藏层输出矩阵H的Moore-Penrose广义阵;
步骤S4进一步包括以下步骤:
S41:交叉验证;
S42:网格搜索,预先设置模型参数范围,训练所有参数组合,获得若干模型,选择最优模型,其中,采用网格搜索模型的隐藏层数量和激活函数;
S43:模型评估;
步骤S43包括以下步骤:
S431:选取了平均绝对误差MAE、平均绝对相对误差MAPE和均方根误差RMSE三个指标作为模型评估标准,其中,RMSE为主要评估标准;
S432:采用MAE,表面预测值误差的实际情况,其中,公式为
S433:采用MAPE,表明测试结果的精密度,其中,公式为
S434:采用RMSE,反映数据集的离散程度和稳定性,其中,公式为
S435:确定最佳的极限学习模型结构。
步骤S1包括以下步骤:
S11:获取、整理不同的数据源数据,并加载到一个新的数据源,合成训练数据集,综合分析数据信息;
S12:依据数据点之间的时间步长,校正为规则的时间步长;
S13:判断数据缺失情况,获取最健康的近似数据,替换缺失数据;
S14:采用波浪去噪技术,去除极端天气下的尖峰数据;
S15:去除季节性因素。
步骤S15包括以下步骤:
S151:依据四个季度的水力时间序列数据,计算水力时间序列数据的移动平均值,获得长期趋势T;
S153:获取计算结果数据,依据各个年份同季度数据计算各季度平均值;
S154:计算并获得季节比率Si,其中,计算公式分子为各同季度平均数,分母为各季度算术平均数;
S155:计算T期的预测值,其中,公式为Yt=Tt×Si。
步骤S41包括以下步骤:
S411:将数据集D分为k个大小相似的互斥数据集,其中,每个子集都尽可能保持数据分布的一致性;
S412:每次采用用k-1个子集的并集作为训练集,剩余的子集作为测试集,k次训练和测试,获得k个测试结果的均值。
在本发明的一个具体实施例中,所述步骤S1中,获取涵盖所有情况的数据,获取时间信息、流速信息、流量信息、运行效率数据。
在本发明的一个具体实施例中,所述步骤S13中,最健康数据为最近几个小时的历史数据或同一时间点最近几天的历史数据或采用波动规则估算的数据。
为了方便理解本发明的上述技术方案,以下通过具体使用方式上对本发明的上述技术方案进行详细说明。
1:数据预处理
从水力发电系统中提取相关参数,收集数据时应尽可能谨慎,尽量使用涵盖所有情况的数据。包括时间,水流速度,水的流量、运行效率等。并对这些数据进行预处理。预处理中包括:
a.数据合并
把不同数据源数据收集整理加载到一个新的数据源,形成一个训练数据集,进行综合分析。
b.调整时间
针对数据点之间的时间步长不一致,则应将其校正为规则的时间步长。
c.填补缺失数据
如果有任何数据缺失,则用最健康的近似数据进行数据替换。可以根据过去几小时的历史水流速度,或同一时间点近几天内的历史水流速度以及波动规则来估计当前水流速度。
d.去除尖峰数据
运算时应将极端天气下的尖峰数据作为噪声去除,否则预测算法的结果会出现较大误差。但是尖峰值会对风速时间序列分析产生显著的影响,因此采用波浪去噪技术处理采集的数据样本。
e.去除季节性因素
通过观察收集到的关于水力的时间序列数据集发现其中包含非常明显的季节性因素,呈现一定规律性的波动,这种重复的循环可能会掩盖数据本身的客观变化规律,因此为了消除季节性因素对数据波动的影响,我们对收集到的数据集进行一定的去季节性处理。如图2所示,具体步骤如下:
首先按照四个季度来计算收集到的水力时间序列数据的移动平均值,获得长期趋势T。然后根据乘法模型其中S代表季节成分,C代表周期成分,I代表不规则成分,以此消除季节性因素对于长期趋势的影响。接着将所得值按照各个年份同季度来计算各季度平均值,再以各同季度平均数作为分子,各季度算术平均数作为分母,获得季节比率Si。最后对应T期的预测值即Yt=Tt×Si。
2:数据分割
把数据切割成互斥的两部分,一部分用于训练,一部分用于测试,利用训练数据进行建模,由于测试数据并未参与模型训练,因此训练出的模型泛化能力更强。
3:建立模型
参数初始化
对ELM的输入权值向量w和隐藏层节点b进行随机赋值,进行参数初始化。ELM从神经网络发展而来,传统前馈神经网络结构图,如图3所示。
传统的单隐含层前馈神经网络结构由输入层,隐含层和输出层组成,输入层与隐含层,隐含层与输出层神经元间全连接。其中,输入层有n个神经元,对应n个输入变量;隐含层有l个神经元;输出层有m个神经元,对应m个输出变量。在不失一般性的情况下,设输入层与隐含层间的连接权值W为
其中,wji表示输入层第i个神经元和隐藏层第j个神经元的连接权值。
隐藏层与输出层的连接权值为
其中,βjk表示隐藏层第j个神经元和输出层第k个神经元的连接权值。
隐藏层神经元的阈值b为
具有Q个样本的训练集输入居中X和输出居中Y分别为
设隐藏层神经元的激活函数为g,网络的输出T为
其中,
公式(5)可表示为
其中,T表示矩阵T的转置,H为神经网络的隐藏层输出矩阵,具体形式为:
而极限学习机网络结构图,如图4所示。
在极限学习机中,给定任意Q个不同样本(xi,ti),其中
xi=[xi1,xi2,...,xin]T∈Rn,ti=[ti1,ti2,...,tim]∈Rm。一个任意区间无限可微的激活函数g:R→R,则对与具有Q个隐藏层神经元的SLFN,在任意赋值wi∈Rn和bi∈R的情况下,其隐藏层输出矩阵H可逆具有||Hβ-T`||=0。
且给定任意小误差ε>0,和一个任意区间无限可微的激活函数g:R→R,则总存在一个含有K(K<=Q)个隐藏层神经元的SLFN,在任意赋值wi∈Rn和bi∈R的情况下,有||HN×MβM×N-T`||<ε。
若隐藏层神经元个数与训练集样本个数相等,则对于任意的W和b,SLFN都可以零误差逼近训练相比,即
其中,yj=[y1j,y2j,...,ymj]T(j=1,2,...,Q);
当训练样本个数Q较大时,为了减小计算量,隐藏层神经元个数K取值比Q小,SLFN的训练误差逼近任一个ε>0,即
因此,当激活函数g无限可微时,SLFN的参数不需要全部调整,w和b在训练前可以随机选择,在训练过程中保持不变。
a.计算隐藏层输出矩阵
隐藏层和输出层的连接权值β可以通过求解以下方程组的最小二乘解获得:
b.计算输出权值矩阵,其中,(10)式解为
其中,H+为隐藏层输出矩阵H的Moore-Penrose广义阵。
4:模型训练
为得到最优模型,在模型训练过程中采用了交叉验证、网格搜索、模型评估的方法。
a.交叉验证
在模型训练中,采用交叉验证法来提高模型的性能,如图5所示,交叉验证即将数据集D分为k个大小相似的互斥数据集,每个子集都尽可能保持数据分布的一致性,然后,每次用k-1个子集的并集作为训练集,剩余的子集作为测试集,因此可以进行k次训练和测试,返回k个测试结果的均值。交叉验证可以有效利用训练数据的信息,避免模型陷入“过拟合”状态,从而提高模型的泛化能力。
b.网格搜索
在模型训练中,预先设置模型参数范围,对于所有参数组合进行训练,得到多个模型,再从中选择最优模型,模型参数的网格搜索能够提高模型的准确率,在极限学习机训练过程中,对于模型的隐藏层数量和激活函数采用网格搜索。
c.模型评估
在模型训练中,训练的目标一般是最小化损失函数,损失函数的值作为模型评估的结果,在本次发明中,为了从训练模型中选出最优预测模型,选取了平均绝对误差(MAE)、平均绝对相对误差(MAPE)和均方根误差(RMSE)这三个指标作为模型评估标准,其中RMSE为主要标准。MAE能表面预测值误差的实际情况,MAPE表明测试结果的精密度,RMSE能反映数据集的离散程度和稳定性。
5:模型预测
将训练好的最优ELM模型对测试数据进行预测,输出预测结果,预测结果可以用于水利系统的短时优化调度,提高发电效率。
综上所述,借助于本发明的上述技术方案,通过该方法,产生了唯一的最优解;极限学习机及其变体应用在在一些回归和分类领域中的基准问题和工程,展示了更快的学习速度和更好的泛化能力;极限学习机可以随机选择多个迭代、输入权重和偏差,然后通过简单的矩阵计算确定输出权重,更准确有效地预测水力发电,降低了成本,提高了学习速率。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种基于极限学习机的水力发电预测方法,其特征在于,包括以下步骤:
S1:从水利发电系统中获取参数数据信息,预处理数据;
S2:分割数据成互斥的两部分,一部分进行数据训练,一部分进行数据测试;
S3:获取训练数据,并采用训练数据建立模型;
S4:采用交叉验证、网格搜索、模型评估的方法,模型训练,获得最优模型;
S5:采用训练好的最优ELM模型预测测试数据,获得并输出预测结果,其中,ELM为极限学习机模型;
所述步骤S3进一步包括以下步骤:
S31:ELM的输入权值向量w和隐藏层节点b随机赋值,初始化参数,其中,在极限学习机中,给定任意Q个不同样本(xi,ti),xi=[xi1,xi2,...,xin]T∈Rn,ti=[ti1,ti2,...,tim]∈Rm,一个任意区间无限可微的激活函数g:R→R,对与具有Q个隐藏层神经元的SLFN,SLFN为单层前馈神经网络,在任意赋值wi∈Rn和bi∈R的情况下,隐藏层输出矩阵H可逆具有||Hβ-T’||=0,隐藏层与输出层的连接权值为β且给定任意小误差ε>0和一个任意区间无限可微的激活函数g:R→R,总存在一个含有K个隐藏层神经元的SLFN,K<=Q,任意赋值wi∈Rn和bi∈R的情况下,有||HN×MβM×N-T’||<ε,隐藏层神经元个数与训练集样本个数相等时,对于任意的W和b,SLFN以零误差逼近训练,计算公式为
当训练样本个数Q较大时,隐藏层神经元个数K取值比Q小,SLFN的训练误误差逼近任一个ε>0,即
当激活函数g无限可微时,SLFN的参数不需要全部调整,w和b在训练前随机选择,在训练过程中保持不变;
S32:计算隐藏层输出矩阵,其中,隐藏层和输出层的连接权值β通过求解以下方程组的最小二乘解获得,计算公式为
S33:计算并出权值矩阵,其中,结果为
H+为隐藏层输出矩阵H的Moore-Penrose广义阵;
所述步骤S4进一步包括以下步骤:
S41:交叉验证;
S42:网格搜索,预先设置模型参数范围,训练所有参数组合,获得若干模型,选择最优模型,其中,采用网格搜索模型的隐藏层数量和激活函数;
S43:模型评估;
所述步骤S43包括以下步骤:
S431:选取了平均绝对误差MAE、平均绝对相对误差MAPE和均方根误差RMSE三个指标作为模型评估标准,其中,RMSE为主要评估标准;
S432:采用MAE,表面预测值误差的实际情况,其中,公式为
S433:采用MAPE,表明测试结果的精密度,其中,公式为
S434:采用RMSE,反映数据集的离散程度和稳定性,其中,公式为
S435:确定最佳的极限学习模型结构。
2.根据权利要求1所述的一种基于极限学习机的水力发电预测方法,其特征在于,所述步骤S1包括以下步骤:
S11:获取、整理不同的数据源数据,并加载到一个新的数据源,合成训练数据集,综合分析数据信息;
S12:依据数据点之间的时间步长,校正为规则的时间步长;
S13:判断数据缺失情况,获取最健康的近似数据,替换缺失数据;
S14:采用波浪去噪技术,去除极端天气下的尖峰数据;
S15:去除季节性因素。
4.根据权利要求1所述的一种基于极限学习机的水力发电预测方法,其特征在于,所述步骤S41包括以下步骤:
S411:将数据集D分为k个大小相似的互斥数据集,其中,每个子集都尽可能保持数据分布的一致性;
S412:每次采用用k-1个子集的并集作为训练集,剩余的子集作为测试集,k次训练和测试,获得k个测试结果的均值。
5.根据权利要求1所述的一种基于极限学习机的水力发电预测方法,其特征在于,所述步骤S1中,获取涵盖所有情况的数据,获取时间信息、流速信息、流量信息、运行效率数据。
6.根据权利要求1所述的一种基于极限学习机的水力发电预测方法,其特征在于,所述步骤S13中,最健康数据为最近几个小时的历史数据或同一时间点最近几天的历史数据或采用波动规则估算的数据。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010156680.1A CN111582534A (zh) | 2020-03-09 | 2020-03-09 | 一种基于极限学习机的水力发电预测方法 |
CN202010769698.9A CN111898828A (zh) | 2020-03-09 | 2020-08-04 | 一种基于极限学习机的水力发电预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010156680.1A CN111582534A (zh) | 2020-03-09 | 2020-03-09 | 一种基于极限学习机的水力发电预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111582534A true CN111582534A (zh) | 2020-08-25 |
Family
ID=72112967
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010156680.1A Withdrawn CN111582534A (zh) | 2020-03-09 | 2020-03-09 | 一种基于极限学习机的水力发电预测方法 |
CN202010769698.9A Pending CN111898828A (zh) | 2020-03-09 | 2020-08-04 | 一种基于极限学习机的水力发电预测方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010769698.9A Pending CN111898828A (zh) | 2020-03-09 | 2020-08-04 | 一种基于极限学习机的水力发电预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN111582534A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112257942A (zh) * | 2020-10-29 | 2021-01-22 | 中国特种设备检测研究院 | 一种应力腐蚀开裂预测方法及系统 |
CN112529240A (zh) * | 2020-09-14 | 2021-03-19 | 桂林电子科技大学 | 一种大气环境数据的预测方法、系统、装置及存储介质 |
CN112685962A (zh) * | 2021-01-22 | 2021-04-20 | 华东理工大学 | 一种基于机器学习的材料屈服强度预测方法 |
CN112758100A (zh) * | 2021-02-03 | 2021-05-07 | 洪丰 | 一种油门误踩的方法及装置 |
CN112784499A (zh) * | 2021-03-05 | 2021-05-11 | 云南电网有限责任公司电力科学研究院 | 一种基于深度学习替代有限元分析的电抗器磁场仿真方法 |
CN112951344A (zh) * | 2021-01-22 | 2021-06-11 | 华东理工大学 | 一种基于机器学习的材料均匀延伸率预测方法 |
CN113836815A (zh) * | 2021-09-30 | 2021-12-24 | 上海海洋大学 | 基于极限学习机的渔情预测方法 |
CN114299345A (zh) * | 2022-01-04 | 2022-04-08 | 北京理工大学 | 一种基于跟踪微分器的极限学习机的图像分类方法 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112860593A (zh) * | 2021-02-09 | 2021-05-28 | 山东英信计算机技术有限公司 | 一种存储系统的gc性能预测方法、系统、介质及设备 |
CN113344266A (zh) * | 2021-05-31 | 2021-09-03 | 中国核电工程有限公司 | 一种核电厂冗余仪表信号预测系统及方法 |
CN113344270A (zh) * | 2021-06-03 | 2021-09-03 | 上海交通大学 | 基于集成式极限学习机的风资源预测方法及系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104268651A (zh) * | 2014-09-28 | 2015-01-07 | 江南大学 | 基于小波多尺度三次指数平滑模型的季节性能耗数据预测方法 |
CN108846529A (zh) * | 2018-09-20 | 2018-11-20 | 贵州大学 | 一种发电量预测系统 |
CN109978236B (zh) * | 2019-03-04 | 2022-07-15 | 三峡大学 | 一种基于特征组合的小水电短期功率精细化预测方法 |
-
2020
- 2020-03-09 CN CN202010156680.1A patent/CN111582534A/zh not_active Withdrawn
- 2020-08-04 CN CN202010769698.9A patent/CN111898828A/zh active Pending
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112529240A (zh) * | 2020-09-14 | 2021-03-19 | 桂林电子科技大学 | 一种大气环境数据的预测方法、系统、装置及存储介质 |
CN112529240B (zh) * | 2020-09-14 | 2024-05-07 | 桂林电子科技大学 | 一种大气环境数据的预测方法、系统、装置及存储介质 |
CN112257942B (zh) * | 2020-10-29 | 2023-11-14 | 中国特种设备检测研究院 | 一种应力腐蚀开裂预测方法及系统 |
CN112257942A (zh) * | 2020-10-29 | 2021-01-22 | 中国特种设备检测研究院 | 一种应力腐蚀开裂预测方法及系统 |
CN112685962A (zh) * | 2021-01-22 | 2021-04-20 | 华东理工大学 | 一种基于机器学习的材料屈服强度预测方法 |
CN112951344A (zh) * | 2021-01-22 | 2021-06-11 | 华东理工大学 | 一种基于机器学习的材料均匀延伸率预测方法 |
CN112951344B (zh) * | 2021-01-22 | 2024-04-02 | 华东理工大学 | 一种基于机器学习的材料均匀延伸率预测方法 |
CN112685962B (zh) * | 2021-01-22 | 2024-03-29 | 华东理工大学 | 一种基于机器学习的材料屈服强度预测方法 |
CN112758100A (zh) * | 2021-02-03 | 2021-05-07 | 洪丰 | 一种油门误踩的方法及装置 |
CN112758100B (zh) * | 2021-02-03 | 2023-03-14 | 洪丰 | 一种油门误踩检测方法及装置 |
CN112784499A (zh) * | 2021-03-05 | 2021-05-11 | 云南电网有限责任公司电力科学研究院 | 一种基于深度学习替代有限元分析的电抗器磁场仿真方法 |
CN113836815A (zh) * | 2021-09-30 | 2021-12-24 | 上海海洋大学 | 基于极限学习机的渔情预测方法 |
CN114299345A (zh) * | 2022-01-04 | 2022-04-08 | 北京理工大学 | 一种基于跟踪微分器的极限学习机的图像分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111898828A (zh) | 2020-11-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111582534A (zh) | 一种基于极限学习机的水力发电预测方法 | |
Al-qaness et al. | Boosted ANFIS model using augmented marine predator algorithm with mutation operators for wind power forecasting | |
CN111860982B (zh) | 一种基于vmd-fcm-gru的风电场短期风电功率预测方法 | |
Cheng et al. | A new combined model based on multi-objective salp swarm optimization for wind speed forecasting | |
Jain et al. | Application of ANN for reservoir inflow prediction and operation | |
CN110309603B (zh) | 一种基于风速特性的短期风速预测方法及系统 | |
CN111144644B (zh) | 基于变分异方差高斯过程回归的短期风速预测方法 | |
CN114119273A (zh) | 一种园区综合能源系统非侵入式负荷分解方法及系统 | |
Zhang et al. | Interval prediction of ultra-short-term photovoltaic power based on a hybrid model | |
Cruz et al. | Neural network prediction interval based on joint supervision | |
CN116341717A (zh) | 一种基于误差补偿的风速预测方法 | |
CN116345555A (zh) | 一种基于cnn-isca-lstm模型的短期光伏发电功率预测方法 | |
CN117132132A (zh) | 基于气象数据的光伏发电功率预测方法 | |
CN116307211A (zh) | 一种风电消纳能力预测及优化方法及系统 | |
CN111815039A (zh) | 基于天气分类的周尺度风电功率概率预测方法及系统 | |
CN114298132A (zh) | 风电功率预测方法及装置、电子设备 | |
CN110033126A (zh) | 基于注意力机制与逻辑回归的长短期记忆网络预测方法 | |
CN117335425A (zh) | 一种基于ga-bp神经网络的潮流计算方法 | |
CN116663745A (zh) | 一种基于pca_ dwt的lstm流域水流量预测方法 | |
Kumar et al. | A Comparative Analysis of Time Series and Machine Learning Models for Wind Speed Prediction | |
Zhang et al. | Wind farm wind power prediction method based on CEEMDAN and DE optimized DNN neural network | |
Kraisangka et al. | Application of machine learning in daily reservoir inflow prediction of the Bhumibol Dam, Thailand | |
CN112183814A (zh) | 一种短期风速预测方法 | |
Wang et al. | An alternative method for estimating wind-power capacity credit based on reliability evaluation using intelligent search | |
Zhang et al. | Short-term power load forecasting based on wavelet transform and deep deterministic policy gradient |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20200825 |
|
WW01 | Invention patent application withdrawn after publication |