CN111898828A - 一种基于极限学习机的水力发电预测方法 - Google Patents

一种基于极限学习机的水力发电预测方法 Download PDF

Info

Publication number
CN111898828A
CN111898828A CN202010769698.9A CN202010769698A CN111898828A CN 111898828 A CN111898828 A CN 111898828A CN 202010769698 A CN202010769698 A CN 202010769698A CN 111898828 A CN111898828 A CN 111898828A
Authority
CN
China
Prior art keywords
data
model
training
hidden layer
power generation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010769698.9A
Other languages
English (en)
Inventor
刘刚
吴家乐
孟子涵
胡杨
张冲
宋锐
杜文博
薛文涛
曹哲铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaneng Sichuan Hydropower Co ltd
China Huaneng Group Co Ltd
Taiji Computer Corp Ltd
Original Assignee
Huaneng Sichuan Hydropower Co ltd
China Huaneng Group Co Ltd
Taiji Computer Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaneng Sichuan Hydropower Co ltd, China Huaneng Group Co Ltd, Taiji Computer Corp Ltd filed Critical Huaneng Sichuan Hydropower Co ltd
Publication of CN111898828A publication Critical patent/CN111898828A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Biophysics (AREA)
  • General Business, Economics & Management (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于极限学习机的水力发电预测方法,该方法包括以下步骤:从水利发电系统中获取参数数据信息,预处理数据;分割数据成互斥的两部分,一部分进行数据训练,一部分进行数据测试;获取训练数据,并采用训练数据建立模型;采用交叉验证、网格搜索、模型评估的方法,模型训练,获得最优模型;采用训练好的最优ELM模型预测测试数据,获得并输出预测结果,其中,ELM为极限学习机模型;通过该方法,展示了更快的学习速度和更好的泛化能力;更准确有效地预测水力发电,降低了成本,提高了学习速率。

Description

一种基于极限学习机的水力发电预测方法
技术领域
本发明涉及电力能源技术领域,具体来说,涉及一种基于极限学习机的水力发电预测方法。
背景技术
水利发电作为新能源的一种,主要是利用河流的落差,将高处的势能通过水轮机转换为电能。水利发电具有多种优势,是一种可再生能源,取之不尽用之不竭,同时节能环保,对环境影响较小,因此水利发电一直被大力推广。但同时,由于水利发电利用自然水流,对水流条件非常依赖,水流的流量不确定性,环境因素等都会导致水利发电的不稳定,影响发电效率,因此水利发电的预测研究尤为重要。
在实际运行中,由于水力系统存在不稳定性,且一般难以通过数据直接获取,目前很多专家学者采用了多种方法对水力发电进行预测。
时间序列法在短期的负荷预测中应用较为成熟,根据历史数据建立水电负荷的时序模型,对未来负荷进行预测,时间序列方法的优点是工作量小,计算速度较快,能反应负荷近期变换的连续性,但该方法的对序列的平稳性要求较高,且没有考虑影响负荷变化的因素,水资源系统本身存在自然上的嘈杂性,因此传统的时间序列方法在预测上的失误是无法避免的。
回归分析预测方法是根据历史数据的变化规律和影响负荷变化的因素,寻找自变量与因变量之间的相关关系及其回归方程式,确定模型参数,据此推断将来时刻的负荷值。回归分析法的优点是计算原理和结构形式简单,预测速度快,外推性能好,对于历史上没有出现的情况有较好的预测。存在的不足是对历史数据要求较高,采用线性方法描述比较复杂的问题,结构形式过于简单,精度较低;该模型无法详细描述各种影响负荷的因素,模型初始化难度较大,需要丰富的经验和较高的技巧。
支持向量机(SVM)是一种基于统计学习理论提出的能实现在有限样本条件下满足VC维理论和结构风险最小原理的机器学习方法,具有泛化能力强,全局最优和计算速度快等突出优点。但其自选参数和核函数的选择,通常情况下主要靠经验确定,有较大的人为因素。同时,其缺乏对模糊现象的处理能力,模型误差会造成预测值和实际值的较大差距。
神经网络是目前较为先进的负荷预测方法,由于理论的不断完善和其在其他领域的成功应用,大量基于人工神经网络的预测模型被提出。神经网络法选取历史负荷作为训练样本,构建网络结构,用训练算法对网络进行训练,使其满足精度要求,此神经网络作为负荷预测模型,实践证明人工神经网络短期预测有较好的精度。然而即使是最先进的基于人工神经网络的预测方法,一些固有的缺点仍然是不可避免的,比如过多的训练,操作成本偏高,学习速度较慢,容易陷入局部最优解等难题。其中关键缺点是学习算法慢以及需要不断迭代调整参数,因此该预测方法是无法通过改变算法结构和不断训练来提高预测效果的。
发明内容
针对相关技术中的上述技术问题,本发明提出一种基于极限学习机的水力发电预测方法,能够克服现有技术的上述不足。
为实现上述技术目的,本发明的技术方案是这样实现的:
一种基于极限学习机的水力发电预测方法,该方法包括以下步骤:
S1:从水利发电系统中获取参数数据信息,预处理数据;
S2:分割数据成互斥的两部分,一部分进行数据训练,一部分进行数据测试;
S3:获取训练数据,并采用训练数据建立模型;
S4:采用交叉验证、网格搜索、模型评估的方法,模型训练,获得最优模型;
S5:采用训练好的最优ELM模型预测测试数据,获得并输出预测结果,其中,ELM为极限学习机模型;
所述步骤S3进一步包括以下步骤:
S31:ELM的输入权值向量w和隐藏层节点b随机赋值,初始化参数,其中,在极限学习机中,给定任意Q个不同样本(xi,ti),xi=[xi1,xi2,…,xin]T∈Rn,ti=[ti1,ti2,…,tim]∈Rm,一个任意区间无限可微的激活函数g:R→R,对与具有Q个隐藏层神经元的SLFN,SLFN为单层前馈神经网络,在任意赋值wi∈Rn和bi∈R的情况下,隐藏层输出矩阵H可逆具有‖Hβ-T`‖=0,隐藏层与输出层的连接权值为β且给定任意小误差ε>0和一个任意区间无限可微的激活函数g:R→R,总存在一个含有K个隐藏层神经元的SLFN,K<=Q,任意赋值wi∈Rn和bi∈R的情况下,有‖HN×MβM×N-T`‖<ε,隐藏层神经元个数与训练集样本个数相等时,对于任意的W和b,SLFN以零误差逼近训练,计算公式为
Figure BDA0002616125510000031
当训练样本个数Q较大时,隐藏层神经元个数K取值比Q小,SLFN的训练误误差逼近任一个ε>0,即
Figure BDA0002616125510000032
当激活函数g无限可微时,SLFN的参数不需要全部调整,w和b在训练前随机选择,在训练过程中保持不变;
S32:计算隐藏层输出矩阵,其中,隐藏层和输出层的连接权值β通过求解以下方程组的最小二乘解获得,计算公式为
Figure BDA0002616125510000033
S33:计算并出权值矩阵,其中,结果为
Figure BDA0002616125510000034
H+为隐藏层输出矩阵H的Moore-Penrose广义阵;
所述步骤S4进一步包括以下步骤:
S41:交叉验证;
S42:网格搜索,预先设置模型参数范围,训练所有参数组合,获得若干模型,选择最优模型,其中,采用网格搜索模型的隐藏层数量和激活函数;
S43:模型评估;
所述步骤S43包括以下步骤:
S431:选取了平均绝对误差MAE、平均绝对相对误差MAPE和均方根误差RMSE三个指标作为模型评估标准,其中,RMSE为主要评估标准;
S432:采用MAE,表面预测值误差的实际情况,其中,公式为
Figure BDA0002616125510000041
S433:采用MAPE,表明测试结果的精密度,其中,公式为
Figure BDA0002616125510000042
S434:采用RMSE,反映数据集的离散程度和稳定性,其中,公式为
Figure BDA0002616125510000043
S435:确定最佳的极限学习模型结构。
进一步的,所述步骤S1包括以下步骤:
S11:获取、整理不同的数据源数据,并加载到一个新的数据源,合成训练数据集,综合分析数据信息;
S12:依据数据点之间的时间步长,校正为规则的时间步长;
S13:判断数据缺失情况,获取最健康的近似数据,替换缺失数据;
S14:采用波浪去噪技术,去除极端天气下的尖峰数据;
S15:去除季节性因素。
进一步的,所述步骤S15包括以下步骤:
S151:依据四个季度的水力时间序列数据,计算水力时间序列数据的移动平均值,获得长期趋势T;
S152:依据乘法模型
Figure BDA0002616125510000051
消除季节性因素对长期趋势的影响,其中,S代表季节成分,C代表周期成分,I代表不规则成分;
S153:获取计算结果数据,依据各个年份同季度数据计算各季度平均值;
S154:计算并获得季节比率Si,其中,计算公式分子为各同季度平均数,分母为各季度算术平均数;
S155:计算T期的预测值,其中,公式为Yt=Tt×Si
进一步的,所述步骤S41包括以下步骤:
S411:将数据集D分为k个大小相似的互斥数据集,其中,每个子集都尽可能保持数据分布的一致性;
S412:每次采用用k-1个子集的并集作为训练集,剩余的子集作为测试集,k次训练和测试,获得k个测试结果的均值。
进一步的,所述步骤S1中,获取涵盖所有情况的数据,获取时间信息、流速信息、流量信息、运行效率数据。
进一步的,所述步骤S13中,最健康数据为最近几个小时的历史数据或同一时间点最近几天的历史数据或采用波动规则估算的数据。
本发明的有益效果:通过该方法,产生了唯一的最优解;极限学习机及其变体应用在在一些回归和分类领域中的基准问题和工程,展示了更快的学习速度和更好的泛化能力;极限学习机可以随机选择多个迭代、输入权重和偏差,然后通过简单的矩阵计算确定输出权重,更准确有效地预测水力发电,降低了成本,提高了学习速率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例所述的一种基于极限学习机的水力发电预测方法的流程框图;
图2是根据本发明实施例所述的一种基于极限学习机的水力发电预测方法的去除季节性因素的流程框图;
图3是根据本发明实施例所述的一种基于极限学习机的水力发电预测方法的传统前馈神经网络结构图;
图4是根据本发明实施例所述的一种基于极限学习机的水力发电预测方法的极限学习机网络结构图;
图5是根据本发明实施例所述的一种基于极限学习机的水力发电预测方法的交叉验证的流程框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,根据本发明实施例所述的一种基于极限学习机的水力发电预测方法,包括以下步骤:
S1:从水利发电系统中获取参数数据信息,预处理数据;
S2:分割数据成互斥的两部分,一部分进行数据训练,一部分进行数据测试;
S3:获取训练数据,并采用训练数据建立模型;
S4:采用交叉验证、网格搜索、模型评估的方法,模型训练,获得最优模型;
S5:采用训练好的最优ELM模型预测测试数据,获得并输出预测结果,其中,ELM为极限学习机模型;
步骤S3进一步包括以下步骤:
S31:ELM的输入权值向量w和隐藏层节点b随机赋值,初始化参数,其中,在极限学习机中,给定任意Q个不同样本(xi,ti),xi=[xi1,xi2,…,xin]T∈Rn,ti=[ti1,ti2,…,tim]∈Rm,一个任意区间无限可微的激活函数g:R→R,对与具有Q个隐藏层神经元的SLFN,在任意赋值wi∈Rn和bi∈R的情况下,隐藏层输出矩阵H可逆具有‖Hβ-T`‖=0,隐藏层与输出层的连接权值为β且给定任意小误差ε>0和一个任意区间无限可微的激活函数g:R→R,总存在一个含有K个隐藏层神经元的SLFN,K<=Q,任意赋值wi∈Rn和bi∈R的情况下,有‖HN×MβM×N-T`‖<ε,隐藏层神经元个数与训练集样本个数相等时,对于任意的W和b,SLFN以零误差逼近训练,SLFN为单层前馈神经网络,计算公式为
Figure BDA0002616125510000071
当训练样本个数Q较大时,隐藏层神经元个数K取值比Q小,SLFN的训练误误差逼近任一个ε>0,即
Figure BDA0002616125510000072
当激活函数g无限可微时,SLFN的参数不需要全部调整,w和b在训练前随机选择,在训练过程中保持不变;
S32:计算隐藏层输出矩阵,其中,隐藏层和输出层的连接权值β通过求解以下方程组的最小二乘解获得,计算公式为
Figure BDA0002616125510000073
S33:计算并出权值矩阵,其中,结果为
Figure BDA0002616125510000084
H+为隐藏层输出矩阵H的Moore-Penrose广义阵;
步骤S4进一步包括以下步骤:
S41:交叉验证;
S42:网格搜索,预先设置模型参数范围,训练所有参数组合,获得若干模型,选择最优模型,其中,采用网格搜索模型的隐藏层数量和激活函数;
S43:模型评估;
步骤S43包括以下步骤:
S431:选取了平均绝对误差MAE、平均绝对相对误差MAPE和均方根误差RMSE三个指标作为模型评估标准,其中,RMSE为主要评估标准;
S432:采用MAE,表面预测值误差的实际情况,其中,公式为
Figure BDA0002616125510000081
S433:采用MAPE,表明测试结果的精密度,其中,公式为
Figure BDA0002616125510000082
S434:采用RMSE,反映数据集的离散程度和稳定性,其中,公式为
Figure BDA0002616125510000083
S435:确定最佳的极限学习模型结构。
步骤S1包括以下步骤:
S11:获取、整理不同的数据源数据,并加载到一个新的数据源,合成训练数据集,综合分析数据信息;
S12:依据数据点之间的时间步长,校正为规则的时间步长;
S13:判断数据缺失情况,获取最健康的近似数据,替换缺失数据;
S14:采用波浪去噪技术,去除极端天气下的尖峰数据;
S15:去除季节性因素。
步骤S15包括以下步骤:
S151:依据四个季度的水力时间序列数据,计算水力时间序列数据的移动平均值,获得长期趋势T;
S152:依据乘法模型
Figure BDA0002616125510000091
消除季节性因素对长期趋势的影响,其中,S代表季节成分,C代表周期成分,I代表不规则成分;
S153:获取计算结果数据,依据各个年份同季度数据计算各季度平均值;
S154:计算并获得季节比率Si,其中,计算公式分子为各同季度平均数,分母为各季度算术平均数;
S155:计算T期的预测值,其中,公式为Yt=Tt×Si
步骤S41包括以下步骤:
S411:将数据集D分为k个大小相似的互斥数据集,其中,每个子集都尽可能保持数据分布的一致性;
S412:每次采用用k-1个子集的并集作为训练集,剩余的子集作为测试集,k次训练和测试,获得k个测试结果的均值。
在本发明的一个具体实施例中,所述步骤S1中,获取涵盖所有情况的数据,获取时间信息、流速信息、流量信息、运行效率数据。
在本发明的一个具体实施例中,所述步骤S13中,最健康数据为最近几个小时的历史数据或同一时间点最近几天的历史数据或采用波动规则估算的数据。
为了方便理解本发明的上述技术方案,以下通过具体使用方式上对本发明的上述技术方案进行详细说明。
1:数据预处理
从水力发电系统中提取相关参数,收集数据时应尽可能谨慎,尽量使用涵盖所有情况的数据。包括时间,水流速度,水的流量、运行效率等。并对这些数据进行预处理。预处理中包括:
a.数据合并
把不同数据源数据收集整理加载到一个新的数据源,形成一个训练数据集,进行综合分析。
b.调整时间
针对数据点之间的时间步长不一致,则应将其校正为规则的时间步长。
c.填补缺失数据
如果有任何数据缺失,则用最健康的近似数据进行数据替换。可以根据过去几小时的历史水流速度,或同一时间点近几天内的历史水流速度以及波动规则来估计当前水流速度。
d.去除尖峰数据
运算时应将极端天气下的尖峰数据作为噪声去除,否则预测算法的结果会出现较大误差。但是尖峰值会对风速时间序列分析产生显著的影响,因此采用波浪去噪技术处理采集的数据样本。
e.去除季节性因素
通过观察收集到的关于水力的时间序列数据集发现其中包含非常明显的季节性因素,呈现一定规律性的波动,这种重复的循环可能会掩盖数据本身的客观变化规律,因此为了消除季节性因素对数据波动的影响,我们对收集到的数据集进行一定的去季节性处理。如图2所示,具体步骤如下:
首先按照四个季度来计算收集到的水力时间序列数据的移动平均值,获得长期趋势T。然后根据乘法模型
Figure BDA0002616125510000101
其中S代表季节成分,C代表周期成分,I代表不规则成分,以此消除季节性因素对于长期趋势的影响。接着将所得值按照各个年份同季度来计算各季度平均值,再以各同季度平均数作为分子,各季度算术平均数作为分母,获得季节比率Si。最后对应T期的预测值即Yt=Tt×Si
2:数据分割
把数据切割成互斥的两部分,一部分用于训练,一部分用于测试,利用训练数据进行建模,由于测试数据并未参与模型训练,因此训练出的模型泛化能力更强。
3:建立模型
参数初始化
对ELM的输入权值向量w和隐藏层节点b进行随机赋值,进行参数初始化。ELM从神经网络发展而来,传统前馈神经网络结构图,如图3所示。
传统的单隐含层前馈神经网络结构由输入层,隐含层和输出层组成,输入层与隐含层,隐含层与输出层神经元间全连接。其中,输入层有n个神经元,对应n个输入变量;隐含层有l个神经元;输出层有m个神经元,对应m个输出变量。在不失一般性的情况下,设输入层与隐含层间的连接权值W为
Figure BDA0002616125510000111
其中,wji表示输入层第i个神经元和隐藏层第j个神经元的连接权值。
隐藏层与输出层的连接权值为
Figure BDA0002616125510000112
其中,βjk表示隐藏层第j个神经元和输出层第k个神经元的连接权值。
隐藏层神经元的阈值b为
Figure BDA0002616125510000113
具有Q个样本的训练集输入居中X和输出居中Y分别为
Figure BDA0002616125510000121
设隐藏层神经元的激活函数为g,网络的输出T为
T=[t1,t2,…,tQ]m×Q (5)
Figure BDA0002616125510000122
其中,
wi=[wil,wi2,…,win]xj=[x1j,x2j,…,xnj]T
公式(5)可表示为
Hβ=T` (6),
其中,T表示矩阵T的转置,H为神经网络的隐藏层输出矩阵,具体形式为:
Figure BDA0002616125510000123
而极限学习机网络结构图,如图4所示。
在极限学习机中,给定任意Q个不同样本(xi,ti),其中xi=[xi1,xi2,…,xin]T∈Rn,ti=[ti1,ti2,…,tim]∈Rm。一个任意区间无限可微的激活函数g:R→R,则对与具有Q个隐藏层神经元的SLFN,在任意赋值wi∈Rn和bi∈R的情况下,其隐藏层输出矩阵H可逆具有‖Hβ-T`‖=0。
且给定任意小误差ε>0,和一个任意区间无限可微的激活函数g:R→R,则总存在一个含有K(K<=Q)个隐藏层神经元的SLFN,在任意赋值wi∈Rn和bi∈R的情况下,有‖HN×MβM×N-T`‖<ε。
若隐藏层神经元个数与训练集样本个数相等,则对于任意的W和b,SLFN都可以零误差逼近训练相比,即
Figure BDA0002616125510000131
其中,yj=[y1j,y2j,…,ymj]T(j=1,2,…,Q);
当训练样本个数Q较大时,为了减小计算量,隐藏层神经元个数K取值比Q小,SLFN的训练误差逼近任一个ε>0,即
Figure BDA0002616125510000132
因此,当激活函数g无限可微时,SLFN的参数不需要全部调整,w和b在训练前可以随机选择,在训练过程中保持不变。
a.计算隐藏层输出矩阵
隐藏层和输出层的连接权值β可以通过求解以下方程组的最小二乘解获得:
minβ‖Hβ-T`‖ (10);
b.计算输出权值矩阵,其中,(10)式解为
Figure BDA0002616125510000133
其中,H+为隐藏层输出矩阵H的Moore-Penrose广义阵。
4:模型训练
为得到最优模型,在模型训练过程中采用了交叉验证、网格搜索、模型评估的方法。
a.交叉验证
在模型训练中,采用交叉验证法来提高模型的性能,如图5所示,交叉验证即将数据集D分为k个大小相似的互斥数据集,每个子集都尽可能保持数据分布的一致性,然后,每次用k-1个子集的并集作为训练集,剩余的子集作为测试集,因此可以进行k次训练和测试,返回k个测试结果的均值。交叉验证可以有效利用训练数据的信息,避免模型陷入“过拟合”状态,从而提高模型的泛化能力。
b.网格搜索
在模型训练中,预先设置模型参数范围,对于所有参数组合进行训练,得到多个模型,再从中选择最优模型,模型参数的网格搜索能够提高模型的准确率,在极限学习机训练过程中,对于模型的隐藏层数量和激活函数采用网格搜索。
c.模型评估
在模型训练中,训练的目标一般是最小化损失函数,损失函数的值作为模型评估的结果,在本次发明中,为了从训练模型中选出最优预测模型,选取了平均绝对误差(MAE)、平均绝对相对误差(MAPE)和均方根误差(RMSE)这三个指标作为模型评估标准,其中RMSE为主要标准。MAE能表面预测值误差的实际情况,MAPE表明测试结果的精密度,RMSE能反映数据集的离散程度和稳定性。
5:模型预测
将训练好的最优ELM模型对测试数据进行预测,输出预测结果,预测结果可以用于水利系统的短时优化调度,提高发电效率。
综上所述,借助于本发明的上述技术方案,通过该方法,产生了唯一的最优解;极限学习机及其变体应用在在一些回归和分类领域中的基准问题和工程,展示了更快的学习速度和更好的泛化能力;极限学习机可以随机选择多个迭代、输入权重和偏差,然后通过简单的矩阵计算确定输出权重,更准确有效地预测水力发电,降低了成本,提高了学习速率。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于极限学习机的水力发电预测方法,其特征在于,包括以下步骤:
S1:从水利发电系统中获取参数数据信息,预处理数据;
S2:分割数据成互斥的两部分,一部分进行数据训练,一部分进行数据测试;
S3:获取训练数据,并采用训练数据建立模型;
S4:采用交叉验证、网格搜索、模型评估的方法,模型训练,获得最优模型;
S5:采用训练好的最优ELM模型预测测试数据,获得并输出预测结果,其中,ELM为极限学习机模型;
所述步骤S3进一步包括以下步骤:
S31:ELM的输入权值向量w和隐藏层节点b随机赋值,初始化参数,其中,在极限学习机中,给定任意Q个不同样本(xi,ti),xi=[xi1,xi2,...xin]T∈Rn,ti=[ti1,ti2,...,tim]∈Rm,一个任意区间无限可微的激活函数g:R→R,对与具有Q个隐藏层神经元的SLFN,SLFN为单层前馈神经网络,在任意赋值wi∈Rn和bi∈R的情况下,隐藏层输出矩阵H可逆具有||Hβ-T’||=0,隐藏层与输出层的连接权值为β且给定任意小误差ε>0和一个任意区间无限可微的激活函数g:R→R,总存在一个含有K个隐藏层神经元的SLFN,K<=Q,任意赋值wi∈Rn和bi∈R的情况下,有||HN×MβM×M-T’||<ε,隐藏层神经元个数与训练集样本个数相等时,对于任意的W和b,SLFN以零误差逼近训练,计算公式为
Figure FDA0002616125500000011
当训练样本个数Q较大时,隐藏层神经元个数K取值比Q小,SLFN的训练误误差逼近任一个ε>0,即
Figure FDA0002616125500000021
当激活函数g无限可微时,SLFN的参数不需要全部调整,w和b在训练前随机选择,在训练过程中保持不变;
S32:计算隐藏层输出矩阵,其中,隐藏层和输出层的连接权值β通过求解以下方程组的最小二乘解获得,计算公式为
Figure FDA0002616125500000022
S33:计算并出权值矩阵,其中,结果为
Figure FDA0002616125500000023
H+为隐藏层输出矩阵H的Moore-Penrose广义阵;
所述步骤S4进一步包括以下步骤:
S41:交叉验证;
S42:网格搜索,预先设置模型参数范围,训练所有参数组合,获得若干模型,选择最优模型,其中,采用网格搜索模型的隐藏层数量和激活函数;
S43:模型评估;
所述步骤S43包括以下步骤:
S431:选取了平均绝对误差MAE、平均绝对相对误差MAPE和均方根误差RMSE三个指标作为模型评估标准,其中,RMSE为主要评估标准;
S432:采用MAE,表面预测值误差的实际情况,其中,公式为
Figure FDA0002616125500000024
S433:采用MAPE,表明测试结果的精密度,其中,公式为
Figure FDA0002616125500000031
S434:采用RMSE,反映数据集的离散程度和稳定性,其中,公式为
Figure FDA0002616125500000032
S435:确定最佳的极限学习模型结构。
2.根据权利要求1所述的一种基于极限学习机的水力发电预测方法,其特征在于,所述步骤S1包括以下步骤:
S11:获取、整理不同的数据源数据,并加载到一个新的数据源,合成训练数据集,综合分析数据信息;
S12:依据数据点之间的时间步长,校正为规则的时间步长;
S13:判断数据缺失情况,获取最健康的近似数据,替换缺失数据;
S14:采用波浪去噪技术,去除极端天气下的尖峰数据;
S15:去除季节性因素。
3.根据权利要求1所述的一种基于极限学习机的水力发电预测方法,其特征在于,所述步骤S15包括以下步骤:
S151:依据四个季度的水力时间序列数据,计算水力时间序列数据的移动平均值,获得长期趋势T;
S152:依据乘法模型
Figure FDA0002616125500000033
消除季节性因素对长期趋势的影响,其中,S代表季节成分,C代表周期成分,I代表不规则成分;
S153:获取计算结果数据,依据各个年份同季度数据计算各季度平均值;
S154:计算并获得季节比率Si,其中,计算公式分子为各同季度平均数,分母为各季度算术平均数;
S155:计算T期的预测值,其中,公式为Yt=Tt×Si
4.根据权利要求1所述的一种基于极限学习机的水力发电预测方法,其特征在于,所述步骤S41包括以下步骤:
S411:将数据集D分为k个大小相似的互斥数据集,其中,每个子集都尽可能保持数据分布的一致性;
S412:每次采用用k-1个子集的并集作为训练集,剩余的子集作为测试集,k次训练和测试,获得k个测试结果的均值。
5.根据权利要求1所述的一种基于极限学习机的水力发电预测方法,其特征在于,所述步骤S1中,获取涵盖所有情况的数据,获取时间信息、流速信息、流量信息、运行效率数据。
6.根据权利要求1所述的一种基于极限学习机的水力发电预测方法,其特征在于,所述步骤S13中,最健康数据为最近几个小时的历史数据或同一时间点最近几天的历史数据或采用波动规则估算的数据。
CN202010769698.9A 2020-03-09 2020-08-04 一种基于极限学习机的水力发电预测方法 Pending CN111898828A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2020101566801 2020-03-09
CN202010156680.1A CN111582534A (zh) 2020-03-09 2020-03-09 一种基于极限学习机的水力发电预测方法

Publications (1)

Publication Number Publication Date
CN111898828A true CN111898828A (zh) 2020-11-06

Family

ID=72112967

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202010156680.1A Withdrawn CN111582534A (zh) 2020-03-09 2020-03-09 一种基于极限学习机的水力发电预测方法
CN202010769698.9A Pending CN111898828A (zh) 2020-03-09 2020-08-04 一种基于极限学习机的水力发电预测方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202010156680.1A Withdrawn CN111582534A (zh) 2020-03-09 2020-03-09 一种基于极限学习机的水力发电预测方法

Country Status (1)

Country Link
CN (2) CN111582534A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112860593A (zh) * 2021-02-09 2021-05-28 山东英信计算机技术有限公司 一种存储系统的gc性能预测方法、系统、介质及设备
CN113344270A (zh) * 2021-06-03 2021-09-03 上海交通大学 基于集成式极限学习机的风资源预测方法及系统
CN113344266A (zh) * 2021-05-31 2021-09-03 中国核电工程有限公司 一种核电厂冗余仪表信号预测系统及方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112529240B (zh) * 2020-09-14 2024-05-07 桂林电子科技大学 一种大气环境数据的预测方法、系统、装置及存储介质
CN112257942B (zh) * 2020-10-29 2023-11-14 中国特种设备检测研究院 一种应力腐蚀开裂预测方法及系统
CN112685962B (zh) * 2021-01-22 2024-03-29 华东理工大学 一种基于机器学习的材料屈服强度预测方法
CN112951344B (zh) * 2021-01-22 2024-04-02 华东理工大学 一种基于机器学习的材料均匀延伸率预测方法
CN112758100B (zh) * 2021-02-03 2023-03-14 洪丰 一种油门误踩检测方法及装置
CN112784499A (zh) * 2021-03-05 2021-05-11 云南电网有限责任公司电力科学研究院 一种基于深度学习替代有限元分析的电抗器磁场仿真方法
CN113836815A (zh) * 2021-09-30 2021-12-24 上海海洋大学 基于极限学习机的渔情预测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268651A (zh) * 2014-09-28 2015-01-07 江南大学 基于小波多尺度三次指数平滑模型的季节性能耗数据预测方法
CN108846529A (zh) * 2018-09-20 2018-11-20 贵州大学 一种发电量预测系统
CN109978236A (zh) * 2019-03-04 2019-07-05 三峡大学 一种基于特征组合的小水电短期功率精细化预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268651A (zh) * 2014-09-28 2015-01-07 江南大学 基于小波多尺度三次指数平滑模型的季节性能耗数据预测方法
CN108846529A (zh) * 2018-09-20 2018-11-20 贵州大学 一种发电量预测系统
CN109978236A (zh) * 2019-03-04 2019-07-05 三峡大学 一种基于特征组合的小水电短期功率精细化预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
成天乐等: "基于极限学习机方法的短期负荷预测", 《电力科学与工程》 *
袁翀等: "采用正则化极限学习机的短期风速预测", 《电网与清洁能源》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112860593A (zh) * 2021-02-09 2021-05-28 山东英信计算机技术有限公司 一种存储系统的gc性能预测方法、系统、介质及设备
CN113344266A (zh) * 2021-05-31 2021-09-03 中国核电工程有限公司 一种核电厂冗余仪表信号预测系统及方法
CN113344270A (zh) * 2021-06-03 2021-09-03 上海交通大学 基于集成式极限学习机的风资源预测方法及系统

Also Published As

Publication number Publication date
CN111582534A (zh) 2020-08-25

Similar Documents

Publication Publication Date Title
CN111898828A (zh) 一种基于极限学习机的水力发电预测方法
Jain et al. Application of ANN for reservoir inflow prediction and operation
CN110309603B (zh) 一种基于风速特性的短期风速预测方法及系统
CN111144644B (zh) 基于变分异方差高斯过程回归的短期风速预测方法
CN114462718A (zh) 基于时间滑动窗口的cnn-gru风电功率预测方法
CN111242353A (zh) 风电功率组合预测建模和预测方法
CN114119273A (zh) 一种园区综合能源系统非侵入式负荷分解方法及系统
Zhang et al. Interval prediction of ultra-short-term photovoltaic power based on a hybrid model
CN116307211A (zh) 一种风电消纳能力预测及优化方法及系统
Liu et al. Research on wind speed prediction of wind power system based on GRU deep learning
CN111815039A (zh) 基于天气分类的周尺度风电功率概率预测方法及系统
CN109408896B (zh) 一种污水厌氧处理产气量多元智能实时监控方法
CN114298132A (zh) 风电功率预测方法及装置、电子设备
CN117335425A (zh) 一种基于ga-bp神经网络的潮流计算方法
CN117132132A (zh) 基于气象数据的光伏发电功率预测方法
Bahij et al. A review on the prediction of energy consumption in the industry sector based on machine learning approaches
CN112417768B (zh) 一种基于藤结构Pair-Copula的风电相关性条件采样方法
Zhang et al. Wind farm wind power prediction method based on CEEMDAN and DE optimized DNN neural network
Kraisangka et al. Application of machine learning in daily reservoir inflow prediction of the bhumibol dam, Thailand
Wang et al. An alternative method for estimating wind-power capacity credit based on reliability evaluation using intelligent search
CN112183814A (zh) 一种短期风速预测方法
Zhang et al. Short-term power load forecasting based on wavelet transform and deep deterministic policy gradient
Kumar et al. A Comparative Analysis of Time Series and Machine Learning Models for Wind Speed Prediction
Gavrilas et al. An enhanced ANN wind power forecast model based on a fuzzy representation of wind direction
Hamberg Photovoltaic System Performance Forecasting Using LSTM Neural Networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201106