CN109726802A - 一种铁路和风电场环境风速机器学习预测方法 - Google Patents

一种铁路和风电场环境风速机器学习预测方法 Download PDF

Info

Publication number
CN109726802A
CN109726802A CN201811643479.5A CN201811643479A CN109726802A CN 109726802 A CN109726802 A CN 109726802A CN 201811643479 A CN201811643479 A CN 201811643479A CN 109726802 A CN109726802 A CN 109726802A
Authority
CN
China
Prior art keywords
wind speed
model
neural network
forecasting
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811643479.5A
Other languages
English (en)
Other versions
CN109726802B (zh
Inventor
刘辉
尹恒鑫
李燕飞
段铸
陈浩林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN201811643479.5A priority Critical patent/CN109726802B/zh
Publication of CN109726802A publication Critical patent/CN109726802A/zh
Application granted granted Critical
Publication of CN109726802B publication Critical patent/CN109726802B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种铁路和风电场环境风速机器学习预测方法,该方法选择多种神经网络模型,建立多种风速预测特征预选模型各100个,通过均方误差分析和相关性分析,选取性能好以及特征独立性强的模型各10个,然后建立多个风速预测集成模型,对风速预测特征进行集成处理,最后建立风速预测归一模型,对风速集成值进行归一处理,并计算预测风速向量与训练样本的风速向量之间的相关性,利用相关性强的对应时刻的风速噪声还原预测风速值,该方法能有效预测非平稳风速,对复杂,非线性风速值具有精准的预测效果。

Description

一种铁路和风电场环境风速机器学习预测方法
技术领域
本发明属于风速预测领域,特别涉及一种铁路和风电场环境风速机器学习预测方法。
背景技术
近年来,风速预测受到铁路相关安全部门和风电场领域越来越多的关注。风速具有随机多变、复杂非线性等特点,实现对风速超步长、超精准的预测能为恶劣大风环境下的列车运行提供更多提前预警处理时间,保证行车安全;同时风速精准预测能为风电场执行调度方案提供有力的数据支持,稳定发电功率,保证发电安全。
诸多学者投入了大量的精力研究风速变化规律,由于其复杂非线性特点,传统的统计方法和物理方法对风速预测具有较大局限性,很难准确找出风速变化特征,从而无法进行精准的风速预测。机器学习方法由于其较强的非线性数据处理能力被越来越多人使用,将其与风速预测相结合能更为准确地找出风速特征,发现风速变化规律,是风速预测的重要方法。
本发明提供了一种铁路和风电场环境风速机器学习预测方法,选择多种神经网络算法,建立多种风速预测特征预选模型各100个,通过均方误差分析和相关性分析,选取性能好以及特征独立性强的模型各10个,然后建立多个风速预测集成模型,对风速预测特征进行集成处理,最后建立风速预测归一模型,对风速集成值进行归一处理,并计算预测向量与训练样本之间的相关性,利用相关性强的对应时刻的风速噪声还原预测风速值,从而达到精准,有效的预测。
发明内容
本发明提供了一种铁路和风电场环境风速机器学习预测方法,其目的在于,依据机器学习算法,建立多种机器学习模型,找到铁路和风电场环境下的复杂、非平稳风速的风速特征,根据风速的不同特征对非平稳风速进行准确有效的预测。
一种铁路和风电场环境风速机器学习预测方法,包括以下步骤:
步骤1:建立测风站获取原始风速数据;
在铁路沿线或风电场待测风点设置测风站,设置指定采样时间间隔,采集原始风速数据集;
所述原始风速数据集为时间序列集,且包含Q个采样时刻的风速,所述Q至少大于500;
步骤2:构建风速模型训练样本和风速模型筛选样本;
使用无迹卡尔曼方程对原始风速数据集进行滤波,得到处理后的风速数据集和风速噪声集;
将风速数据集按照时间连续滚动规则分为多个长度为5的风速训练向量;其中1/2时间连续的风速训练向量组成风速模型训练样本,剩余1/2时间连续的风速训练向量组成风速模型筛选样本;
步骤3:选择N种不同神经网络,对每种神经网络的参数随机设置100种不同取值,构建N种基于神经网络的风速预测特征预选模型组;
依次将风速模型训练样本中所有风速训练向量内前4个时刻的风速值作为输入数据,第5个时刻的风速值作为输出数据,训练N种神经网络,每种神经网络的参数取100种不同取值,得到N种基于神经网络的风速预测特征预选模型组,每种神经网络的风速预测特征预选模型组包括100个基于相同神经网络的风速预测特征预选模型,即共得到100*N个风速预测特征预选模型;
所述风速预测特征预选模型输出值命名为风速特征预选值;
步骤4:基于均方误差分析和相关性分析模型筛选方法,将每种100个基于相同神经网络的风速预测特征预选模型筛选至10个,筛选后的模型命名为风速预测特征模型,得到N种基于神经网络的风速预测特征模型组,每种神经网络的风速预测特征模型组包括10个基于相同神经网络的风速预测特征模型;
所述10个基于相同神经网络的风速预测特征模型是由100个基于相同神经网络的风速预测特征预选模筛选后重新命名得来的;
所述风速预测特征模型输出值命名为风速特征值;
步骤5:基于风速模型训练样本和风速模型筛选样本输入至10*N个风速预测特征模型得到的输出数据,构建针对N种神经网络的N个风速预测集成模型训练样本;
依次将风速模型训练样本和风速模型筛选样本中所有风速训练向量内前4个时刻的风速值作为输入数据,分别输入至所有风速预测特征模型中,获得每个风速预测特征模型输出的第5个时刻的风速特征值;
利用每种基于相同神经网络的10个风速预测特征模型每次共输出10个风速特征值组成风速特征列向量,所有风速特征列向量组成10*M维数的矩阵,N种基于神经网络的风速预测特征模型组共得到N个10*M维数的矩阵;将所述N个10*M维数的矩阵定义为针对N种神经网络的N个风速预测集成模型训练样本;其中,M为风速预测特征模型运行次数;
步骤6:将步骤5得到的针对N种神经网络的N个风速预测集成模型训练样本中长度为10的风速特征列向量作为输入数据,风速模型训练样本和风速模型筛选样本中对应时刻的风速值作为输出数据,分别训练N个灰色神经网络,得到N个基于灰色神经网络的风速预测集成模型;
所述N个灰色神经网络在训练时所使用的样本分别为N个风速预测集成模型训练样本,每1个风速预测集成模型训练样本只用来训练1个灰色神经网络;
所述风速预测集成模型输出值命名为风速集成值;
步骤7:构建风速预测归一模型;
所述构建风速预测归一模型具体过程如下:
步骤B1:依次将风速模型筛选样本中所有风速训练向量内前4个时刻的风速值作为输入数据,分别输入到所有的风速预测特征模型,得到针对N种神经网络的N个10*P维数的矩阵,其中P为风速预测特征模型运行次数,进入步骤B2;
步骤B2:依次将步骤B1得到的N个10*P维数的矩阵中每个长度为10的列向量作为输入数据,输入至对应神经网络的N个风速预测集成模型,输出得到N个长度为P的风速集成行向量,进入步骤B3;
步骤B3:将N个长度为P的风速集成行向量作为行向量组成N*P维数的矩阵;依次将N*P维数的矩阵中每个长度为N的列向量作为输入数据,风速模型筛选样本中对应时刻的风速值作为输出数据,训练小波神经网络,得到基于小波神经网络的风速预测归一模型;
所述风速预测归一模型中的小波神经网络在训练时设置输入层节点个数为N,隐含层节点个数为2*N,输出层节点个数为1,最大迭代次数设置为500,训练学习率为0.02,阈值为0.05;
步骤8:实时预测风速;
设置和步骤1中原始风速数据集相同的采样时间间隔,通过测风站实时采集获取当前以及近期风速,获取长度至少为200的原始风速时间序列向量,然后进行实时预测风速,具体过程如下:
步骤C1:设置预测风速目标时间T,进入步骤C2;
步骤C2:对原始风速时间序列向量进行无迹卡尔曼滤波得到滤波后的风速时间序列向量,进入步骤C3;
步骤C3:将风速时间序列向量中与目标时间T最接近的4个时刻的风速值作为输入数据,分别输入至所有风速预测特征模型,得到N个长度为10的风速特征列向量,进入步骤C4;
步骤C4:依次将N个长度为10的风速特征列向量输入至对应的风速预测集成模型,得到N个风速集成值,进入步骤C5;
步骤C5:将N个风速集成值作为输入数据,输入至风速预测归一模型,得到风速归一值,进入步骤C6;
步骤C6:判断风速归一值所在时刻是否超过设置的预测风速目标时间T,若是,进入步骤C8,否则,进入步骤C7;
步骤C7:将步骤C5得到的风速归一值按时间顺序插入到风速时间序列向量中,更新风速时间序列向量,返回步骤C3;
步骤C8:计算风速时间序列向量中与目标时间T最接近的100个时刻风速值组成的向量与步骤2中的风速数据集任意时间连续的100个风速值组成的向量之间的皮尔逊相关系数,得到皮尔逊相关系数矩阵,找到皮尔逊相关系数最高的100个风速数据集中的风速值组成的向量,将其对应时刻的风速噪声集中100个连续噪声附加到风速时间序列向量中与目标时间T最接近的100个时刻风速值中,获得目标时间的实时风速预测值。
进一步地,所述时间连续滚动规则指的是时间序列数据中为每个时刻代表的数据都将作为一次分解向量的开始值,取连续5个时刻的风速值作为一个风速训练向量;
例如,时间序列数据集[a1,a2,a3,…,an]按照时间连续滚动规则分解成长度为5的向量则得到[a1,a2,a3,a4,a5],[a2,a3,a4,a5,a6],[a3,a4,a5,a6,a7],…,[an-4,an-3,an-2,an-1,an]共n-4个向量。
进一步地,所述N种基于神经网络的风速预测特征预选模型组至少包括:基于Elman神经网络的风速预测特征预选模型组、基于BP神经网络的风速预测特征预选模型组和基于小波神经网络的风速预测特征预选模型组。
进一步地,所述基于Elman神经网络的风速预测特征预选模型组内的所有风速预测特征预选模型中的Elman神经网络在训练时设置输入层节点个数为3,隐含层节点个数为7,输出层节点个数为2,承接层节点个数为7;隐含层函数采用Sigmoid函数,最大迭代次数设置为900,训练学习率取值范围为[0.001,0.05],阈值取值范围为[0.001,0.1];
所述基于BP神经网络的风速预测特征预选模型组内的所有风速预测特征预选模型中的BP神经网络在训练时设置输入层节点个数为3,隐含层节点个数取值范围为[5,10],输出层节点个数为2,最大迭代次数设置为800,训练学习率取值范围为[0.001,0.05],阈值取值范围为[0.001,0.1];
所述基于小波神经网络的风速预测特征预选模型组内的所有风速预测特征预选模型中的小波神经网络在训练时输入层节点个数为3,隐含层小波元个数取值范围为[5,10],输出层节点个数为2;隐层小波神经元采用Mexican Hat小波函数,输出层节点采用Sigmoid函数,训练过程中的最大迭代次数设置为800,训练学习率取值范围为[0.001,0.05],阈值取值范围为[0.001,0.1]。
进一步地,所述均方误差分析和相关性分析模型筛选方法具体过程如下:
步骤A1:依次将风速模型筛选样本中所有风速训练向量内前4个时刻的风速值作为输入数据,输入到所有的风速预测特征预选模型,输出第5个时刻的风速特征预选值,进入步骤A2;
步骤A2:将每个风速预测特征预选模型输出的风速特征预选值按时间次序排列作为风速特征预选向量,进入步骤A3;
步骤A3:计算每个模型的风速特征预选向量与风速模型筛选样本中对应风速值时间序列向量的均方误差,N种基于神经网络的风速预测特征预选模型组内分别淘汰均方误差较大的风速预测特征预选模型30个,每种基于神经网络的风速预测特征预选模型组内剩余70个风速预测特征预选模型,即剩余共70*N个风速预测特征预选模型,进入步骤A4;
步骤A4:分别计算N种基于神经网络的风速预测特征预选模型组内剩余的70个风速预测特征预选模型输出的风速特征预选向量两两之间的皮尔逊相关性系数,得到N个皮尔逊相关性系数矩阵,每个皮尔逊相关系数矩阵分别代表每种基于神经网络的风速预测特征预选模型组输出的风速特征预选向量两两之间的皮尔逊相关系数,进入步骤A5;
步骤A5:分别计算N种基于神经网络的风速预测特征预选模型组内每个风速预测特征预选模型输出的风速特征预选向量与其他模型输出的风速特征预选向量之间的皮尔逊相关系数的累加值,逐步淘汰皮尔逊相关系数累加值最大的模型,直到N种基于神经网络的风速预测特征预选模型组内均剩余10个风速预测特征预选模型,进入步骤A6;
步骤A6:每种基于神经网络的风速预测特征预选模型组内均剩余10个风速预测特征预选模型,命名为风速预测特征模型,将N种基于神经网络的风速预测特征预选模型组重新命名为N种基于神经网络的风速预测特征模型组。
进一步地,所述N个基于灰色神经网络的风速预测集成模型在训练时均设置输入层节点个数为10,隐含层节点个数为20,输出层节点个数为1,最大迭代次数设置为800,训练学习率为0.01,阈值为0.001。
有益效果
本发明提供了一种铁路和风电场环境风速机器学习预测方法,该方法针对铁路和风电场环境下的复杂、非线性、非平稳风速,选择多种神经网络算法,设立100组参数值,建立多种风速预测特征预选模型各100个,依据模型效果,为每种神经网络算法筛选出效果好的10个模型,对风速进行初步预测,然后建立10个风速预测集成模型,将每种神经网络的10个模型输出值集成为1个值,建立风速预测归一模型,将每种神经网络的集成值进行归一,最后通过相关性分析,还原风速的真实性;
该方法利用多种不同神经网络和神经网络参数的多种取值的模型对不同风速值进行预测,选择预测效果好的模型,可以避免风速值突然出现的非平稳变化而引起预测精度不准确的问题,能有效针对多种不同类型风速进行预测,提高预测精度,提高风速预测的泛化能力。
附图说明
图1为本发明所述方法的流程示意图。
具体实施方式
下面将结合附图和实例对本发明做进一步的说明。
如图1所示,一种铁路和风电场环境风速机器学习预测方法,包括以下步骤:
步骤1:建立测风站获取原始风速数据;
在铁路沿线或风电场待测风点设置测风站,设置指定采样时间间隔采集数量为Q的原始风速数据集w(t=[w(t=Δt),w(t=2*Δt),…,w(t=Q*Δt)];
所述原始风速数据集为时间序列集,且包含Q个采样时刻的风速,所述Q至少大于500;
步骤2:构建风速模型训练样本和风速模型筛选样本;
使用无迹卡尔曼方程对原始风速数据集进行滤波,得到处理后的风速数据集w′(t)=[w′(t=Δt),w′(t=2*Δt),…,w′(t=Q*Δt)]和风速噪声集no(t)=[no(t=Δt),no(t=2*Δt),…,no(t=Q*Δt)];
将风速数据集按照时间连续滚动规则分为多个长度为5的风速训练向量;其中1/2时间连续的风速训练向量组成风速模型训练样本,剩余1/2时间连续的风速训练向量组成风速模型筛选样本;
所述时间连续滚动规则指的是时间序列数据中为每个时刻代表的数据都将作为一次分解向量的开始值,取连续5个时刻的风速值作为一个风速训练向量;
例如,时间序列数据集[a1,a2,a3,…,an]按照时间连续滚动规则分解成长度为5的向量则得到[a1,a2,a3,a4,a5],[a2,a3,a4,a5,a6],[a3,a4,a5,a6,a7],…,[an-4,an-3,an-2,an-1,an]共n-4个向量;
所述风速模型训练样本A表达为:
所述风速模型筛选样本B表达为:
步骤3:选择Elman神经网络、BP神经网络和小波神经网络共3种神经网络,对每种神经网络的参数随机设置100种不同取值,构建3种基于神经网络的风速预测特征预选模型组;
依次将风速模型训练样本A中所有风速训练向量内前4个时刻的风速值作为输入数据,第5个时刻的风速值作为输出数据,分别训练Elman神经网络、BP神经网络和小波神经网络,每种神经网络的参数取100种不同取值,分别得到基于Elman神经网络的风速预测特征预选模型组、基于BP神经网络的风速预测特征预选模型组和基于小波神经网络的风速预测特征预选模型组,每种风速预测特征预选模型组包括100个风速预测特征预选模型,即共得到300个风速预测特征预选模型;
所述基于Elman神经网络的风速预测特征预选模型组表达为:EL={el11),…,elii),…,el100100)},其中,EL为基于Elman神经网络的风速预测特征预选模型组,elii)为第i个训练参数设置为γi的基于Elman神经网络的风速预测特征预选模型;
所述基于BP神经网络的风速预测特征预选模型组表达为:BP={bp11),…,bpii),…,bp100100)},其中,BP为基于BP神经网络的风速预测特征预选模型组,bpii)为第i个训练参数设置为εi的基于BP神经网络的风速预测特征预选模型;
所述基于小波神经网络的风速预测特征预选模型组表达为:WA={wa1(∈1),…,wai(∈i),…,wa100(∈100)},其中,WA为基于小波神经网络的风速预测特征预选模型组,wai(∈i)为第i个训练参数设置为∈i的基于小波神经网络的风速预测特征预选模型;
所述风速预测特征预选模型输出值命名为风速特征预选值;
所述基于Elman神经网络的风速预测特征预选模型组内的所有风速预测特征预选模型中的Elman神经网络在训练时设置输入层节点个数为3,隐含层节点个数为7,输出层节点个数为2,承接层节点个数为7;隐含层函数采用Sigmoid函数,最大迭代次数设置为900,训练学习率取值范围为[0.001,0.05],阈值取值范围为[0.001,0.1];
所述基于BP神经网络的风速预测特征预选模型组内的所有风速预测特征预选模型中的BP神经网络在训练时设置输入层节点个数为3,隐含层节点个数取值范围为[5,10],输出层节点个数为2,最大迭代次数设置为800,训练学习率取值范围为[0.001,0.05],阈值取值范围为[0.001,0.1];
所述基于小波神经网络的风速预测特征预选模型组内的所有风速预测特征预选模型中的小波神经网络在训练时输入层节点个数为3,隐含层小波元个数取值范围为[5,10],输出层节点个数为2;隐层小波神经元采用Mexican Hat小波函数,输出层节点采用Sigmoid函数,训练过程中的最大迭代次数设置为800,训练学习率取值范围为[0.001,0.05],阈值取值范围为[0.001,0.1];
步骤4:基于均方误差分析和相关性分析模型筛选方法,分别将3种风速预测特征预选模型组内的风速预测特征预选模型筛选至10个,筛选后的剩余的模型重新命名为风速预测特征模型,分别组合得到基于Elman神经网络的风速预测特征模型组、基于BP神经网络的风速预测特征模型组和基于小波神经网络的风速预测特征模型组,每种风速预测特征模型组包括10个风速预测特征模型;
所述基于Elman神经网络的风速预测特征模型组表达为:EL′={el1′(γ1′),…,li′(γi′),…,l10′(γ10′)},其中,EL′为基于Elman神经网络的风速预测特征模型组,eli′(γi′)为第i个训练参数设置为γi′的基于Elman神经网络的风速预测特征模型;
所述基于BP神经网络的风速预测特征模型组表达为:BP′={bp1′(ε1′),…,pii′),…,bp10′(ε10′)},其中,BP′为基于BP神经网络的风速预测特征模型组,bpi′(εi′)为第i个训练参数设置为εi′的基于BP神经网络的风速预测特征模型;
所述基于小波神经网络的风速预测特征模型组表达为:WA′={wa1′(∈1′),…,ai′(∈i′),…,wa10′(∈10′)},其中,WA′为基于小波神经网络的风速预测特征模型组,wai′(∈i′)为第i个训练参数设置为∈i′的基于小波神经网络的风速预测特征模型;
所述风速预测特征模型输出值命名为风速特征值;
所述均方误差分析和相关性分析模型筛选方法具体过程如下:
步骤A1:依次将风速模型筛选样本B中所有风速训练向量内前4个时刻的风速值作为输入数据,输入到所有的风速预测特征预选模型,输出第5个时刻的风速特征预选值,进入步骤A2;
步骤A2:将每个风速预测特征预选模型输出的风速特征预选值按时间次序排列作为风速特征预选向量,进入步骤A3;
步骤A3:计算每个模型的风速特征预选向量与风速模型筛选样本B中对应风速值时间序列向量的均方误差,3种风速预测特征预选模型组内分别淘汰均方误差较大的风速预测特征预选模型30个,每种风速预测特征预选模型组内均剩余70个风速预测特征预选模型,即剩余共70*3=210个风速预测特征预选模型,进入步骤A4;
步骤A4:分别计算3种风速预测特征预选模型组内剩余的70个风速预测特征预选模型输出的风速特征预选向量两两之间的皮尔逊相关性系数,得到3个皮尔逊相关性系数矩阵,每个皮尔逊相关系数矩阵分别代表每种基于神经网络的风速预测特征预选模型组输出的风速特征预选向量两两之间的皮尔逊相关系数,进入步骤A5;
所述3个皮尔逊相关性系数矩阵分别为PCCEL,PCCBP,PCCWA,表示为:
PCCπ=[pij]70*70
其中,π取值为EL,BP,WA得到的PCCEL,PCCBP,PCCWA分别表示基于Elman神经网络的风速预测特征预选模型组、基于BP神经网络的风速预测特征预选模型组和基于小波神经网络的风速预测特征预选模型组的皮尔逊相关系数,pij为第i个风速预测特征预选模型输出的风速特征预选向量和第j个风速预测特征预选模型输出的风速特征预选向量之间的皮尔逊相关系数;
步骤A5:分别计算3种风速预测特征预选模型组内每个风速预测特征预选模型输出的风速特征预选向量与其他模型输出的风速特征预选向量之间的皮尔逊相关系数累加值,逐步淘汰皮尔逊相关系数累加值最大的模型,直到3种基于神经网络的风速预测特征预选模型组内均剩余10个风速预测特征预选模型,进入步骤A6;
所述皮尔逊相关系数累加值计算方式为:
其中,π取值为EL,BP,WA分别表示基于Elman神经网络的风速预测特征预选模型组、基于BP神经网络的风速预测特征预选模型组和基于小波神经网络的风速预测特征预选模型组,Pπi为基于π神经网络的风速预测特征预选模型组内第i个风速预测特征预选模型的皮尔逊相关系数累加值,pij为第i个风速预测特征预选模型输出的风速特征预选向量和第j个风速预测特征预选模型输出的风速特征预选向量之间的皮尔逊相关系数;
步骤A6:每种风速预测特征预选模型组内均剩余10个风速预测特征预选模型,重新命名为风速预测特征模型,将3种风速预测特征预选模型组重新命名为基于Elman神经网络的风速预测特征模型组、基于BP神经网络的风速预测特征模型组和基于小波神经网络的风速预测特征模型组;
步骤5:基于风速模型训练样本A和风速模型筛选样本B输入至10*3=30个风速预测特征模型得到的输出数据,构建针对3种神经网络的3个风速预测集成模型训练样本;
依次将风速模型训练样本A和风速模型筛选样本B中所有风速训练向量内前4个时刻的风速值作为输入数据,分别输入至所有风速预测特征模型中,获得每个风速预测特征模型输出的第5个时刻的风速特征值;
每种风速预测特征模型组每次输出10个风速特征值组成风速特征列向量,所有风速特征列向量组成10*M维数的矩阵,3种风速预测特征模型组共得到3个10*M维数的矩阵;将所述3个10*M维数的矩阵定义为针对3种神经网络的3个风速预测集成模型训练样本;其中,M为风速预测特征模型运行次数;
所述3个风速预测集成模型训练样本分别为CEL,CBP,CWA,表示为:
Cπ=[y1,…,yi,…,yM]
其中,π取值为EL,BP,WA得到的CEL,CBP,CWA分别表示针对基于Elman神经网络的风速预测特征预选模型组的风速预测集成模型训练样本、针对基于BP神经网络的风速预测特征预选模型组的风速预测集成模型训练样本和针对基于小波神经网络的风速预测特征预选模型组的风速预测集成模型训练样本,yi为风速预测特征预选模型组第i次输出的长度为10的风速特征列向量,M为风速预测特征模型运行次数;
步骤6:将步骤5得到的针对3种神经网络的3个风速预测集成模型训练样本中长度为10的风速特征列向量[y1,…,yi,…,yM]作为输入数据,风速模型训练样本A和风速模型筛选样本B中对应时刻的风速值作为输出数据,分别训练3个灰色神经网络,得到3个基于灰色神经网络的风速预测集成模型;
所述3个灰色神经网络在训练时所使用的样本分别为3个风速预测集成模型训练样本,每1个风速预测集成模型训练样本只用来训练1个灰色神经网络;
所述风速预测集成模型输出值命名为风速集成值;
所述3个风速预测集成模型中的灰色神经网络在训练时均设置输入层节点个数为10,隐含层节点个数为20,输出层节点个数为1,最大迭代次数设置为800,训练学习率为0.01,阈值为0.001;
步骤7:构建风速预测归一模型;
所述构建风速预测归一模型具体过程如下:
步骤B1:依次将风速模型筛选样本中所有风速训练向量内前4个时刻的风速值作为输入数据,分别输入到所有的风速预测特征模型,得到针对3种神经网络的3个10*P维数的矩阵,其中P为风速预测特征模型运行次数,进入步骤B2;
步骤B2:依次将步骤B1得到的3个10*P维数的矩阵中每个长度为10的列向量作为输入数据,输入至对应神经网络的3个风速预测集成模型,输出得到3个长度为P的风速集成行向量,进入步骤B3;
步骤B3:将3个长度为P的风速集成行向量作为行向量组成3*P维数的矩阵;依次将3*P维数的矩阵中每个长度为3的列向量作为输入数据,风速模型筛选样本B中对应时刻的风速值作为输出数据,训练小波神经网络,得到基于小波神经网络的风速预测归一模型;
所述风速预测归一模型中的小波神经网络在训练时设置输入层节点个数为3,隐含层节点个数为6,输出层节点个数为1,最大迭代次数设置为500,训练学习率为0.02,阈值为0.05;
步骤8:实时预测风速;
设置和步骤1中原始风速数据集相同的采样时间间隔,通过测风站实时采集获取当前以及近期风速,获取长度至少为200的原始风速时间序列向量,然后进行实时预测风速,具体过程如下:
步骤C1:设置预测风速目标时间T,进入步骤C2;
步骤C2:对原始风速时间序列向量进行无迹卡尔曼滤波得到滤波后的风速时间序列向量,进入步骤C3;
步骤C3:将风速时间序列向量中与目标时间T最接近的4个时刻的风速值作为输入数据,分别输入至所有风速预测特征模型,得到3个长度为10的风速特征列向量,进入步骤C4;
步骤C4:依次将3个长度为10的风速特征列向量输入至对应的风速预测集成模型,得到3个风速集成值,进入步骤C5;
步骤C5:将3个风速集成值作为输入数据,输入至风速预测归一模型,得到风速归一值,进入步骤C6;
步骤C6:判断风速归一值所在时刻是否超过设置的预测风速目标时间T,若是,进入步骤C8,否则,进入步骤C7;
步骤C7:将步骤C5得到的风速归一值按时间顺序插入到风速时间序列向量中,更新风速时间序列向量,返回步骤C3;
步骤C8:计算风速时间序列向量中与目标时间T最接近的100个时刻风速值组成的向量与步骤2中的风速数据集w′(t)中任意时间连续的100个风速值组成的向量之间的皮尔逊相关系数,得到皮尔逊相关系数矩阵,找到皮尔逊相关系数最高的100个风速数据集中的风速值组成的向量,将其对应时刻的风速噪声集no(t)中100个连续噪声附加到风速时间序列向量中与目标时间T最接近的最近100个时刻风速值中,还原风速真实性,完成目标时间的实时风速预测。
以上所述仅是本发明技术的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本发明的保护范围。

Claims (6)

1.一种铁路和风电场环境风速机器学习预测方法,其特征在于,包括以下步骤:
步骤1:建立测风站获取原始风速数据;
在铁路沿线或风电场待测风点设置测风站,设置指定采样时间间隔,采集原始风速数据集;
所述原始风速数据集为时间序列集,且包含Q个采样时刻的风速,所述Q至少大于500;
步骤2:构建风速模型训练样本和风速模型筛选样本;
使用无迹卡尔曼方程对原始风速数据集进行滤波,得到处理后的风速数据集和风速噪声集;
将风速数据集按照时间连续滚动规则分为多个长度为5的风速训练向量;其中1/2时间连续的风速训练向量组成风速模型训练样本,剩余1/2时间连续的风速训练向量组成风速模型筛选样本;
步骤3:选择N种不同神经网络,对每种神经网络的参数随机设置100种不同取值,构建N种基于神经网络的风速预测特征预选模型组;
依次将风速模型训练样本中所有风速训练向量内前4个时刻的风速值作为输入数据,第5个时刻的风速值作为输出数据,训练N种神经网络,每种神经网络的参数取100种不同取值,得到N种基于神经网络的风速预测特征预选模型组,每种神经网络的风速预测特征预选模型组包括100个基于相同神经网络的风速预测特征预选模型;
所述风速预测特征预选模型输出值命名为风速特征预选值;
步骤4:基于均方误差分析和相关性分析模型筛选方法,将每种100个基于相同神经网络的风速预测特征预选模型筛选至10个,筛选后的模型命名为风速预测特征模型,得到N种基于神经网络的风速预测特征模型组,每种神经网络的风速预测特征模型组包括10个基于相同神经网络的风速预测特征模型;
所述风速预测特征模型输出值命名为风速特征值;
步骤5:基于风速模型训练样本和风速模型筛选样本输入至10*N个风速预测特征模型得到的输出数据,构建针对N种神经网络的N个风速预测集成模型训练样本;
依次将风速模型训练样本和风速模型筛选样本中所有风速训练向量内前4个时刻的风速值作为输入数据,分别输入至所有风速预测特征模型中,获得每个风速预测特征模型输出的第5个时刻的风速特征值;
利用每种基于相同神经网络的10个风速预测特征模型每次共输出10个风速特征值组成风速特征列向量,所有风速特征列向量组成10*M维数的矩阵,N种基于神经网络的风速预测特征模型组共得到N个10*M维数的矩阵;将所述N个10*M维数的矩阵定义为针对N种神经网络的N个风速预测集成模型训练样本;其中,M为风速预测特征模型运行次数;
步骤6:将步骤5得到的针对N种神经网络的N个风速预测集成模型训练样本中长度为10的风速特征列向量作为输入数据,风速模型训练样本和风速模型筛选样本中对应时刻的风速值作为输出数据,分别训练N个灰色神经网络,得到N个基于灰色神经网络的风速预测集成模型;
所述风速预测集成模型输出值命名为风速集成值;
步骤7:构建风速预测归一模型;
所述构建风速预测归一模型具体过程如下:
步骤B1:依次将风速模型筛选样本中所有风速训练向量内前4个时刻的风速值作为输入数据,分别输入到所有的风速预测特征模型,得到针对N种神经网络的N个10*P维数的矩阵,其中P为风速预测特征模型运行次数,进入步骤B2;
步骤B2:依次将步骤B1得到的N个10*P维数的矩阵中每个长度为10的列向量作为输入数据,输入至对应神经网络的N个风速预测集成模型,输出得到N个长度为P的风速集成行向量,进入步骤B3;
步骤B3:将N个长度为P的风速集成行向量作为行向量组成N*P维数的矩阵;依次将N*P维数的矩阵中每个长度为N的列向量作为输入数据,风速模型筛选样本中对应时刻的风速值作为输出数据,训练小波神经网络,得到基于小波神经网络的风速预测归一模型;
所述风速预测归一模型中的小波神经网络在训练时设置输入层节点个数为N,隐含层节点个数为2*N,输出层节点个数为1,最大迭代次数设置为500,训练学习率为0.02,阈值为0.05;
步骤8:实时预测风速;
设置和步骤1中原始风速数据集相同的采样时间间隔,通过测风站实时采集获取当前以及近期风速,获取长度至少为200的原始风速时间序列向量,然后进行实时预测风速,具体过程如下:
步骤C1:设置预测风速目标时间T,进入步骤C2;
步骤C2:对原始风速时间序列向量进行无迹卡尔曼滤波得到滤波后的风速时间序列向量,进入步骤C3;
步骤C3:将风速时间序列向量中与目标时间T最接近的4个时刻的风速值作为输入数据,分别输入至所有风速预测特征模型,得到N个长度为10的风速特征列向量,进入步骤C4;
步骤C4:依次将N个长度为10的风速特征列向量输入至对应的风速预测集成模型,得到N个风速集成值,进入步骤C5;
步骤C5:将N个风速集成值作为输入数据,输入至风速预测归一模型,得到风速归一值,进入步骤C6;
步骤C6:判断风速归一值所在时刻是否超过设置的预测风速目标时间T,若是,进入步骤C8,否则,进入步骤C7;
步骤C7:将步骤C5得到的风速归一值按时间顺序插入到风速时间序列向量中,更新风速时间序列向量,返回步骤C3;
步骤C8:计算风速时间序列向量中与目标时间T最接近的100个时刻风速值组成的向量与步骤2中的风速数据集任意时间连续的100个风速值组成的向量之间的皮尔逊相关系数,得到皮尔逊相关系数矩阵,找到皮尔逊相关系数最高的100个风速数据集中的风速值组成的向量,将其对应时刻的风速噪声集中100个连续噪声附加到风速时间序列向量中与目标时间T最接近的100个时刻风速值中,获得目标时间的实时风速预测值。
2.根据权利要求1所述的方法,其特征在于,所述时间连续滚动规则指的是时间序列数据中为每个时刻代表的数据都将作为一次分解向量的开始值,取连续5个时刻的风速值作为一个风速训练向量。
3.根据权利要求1所述的方法,其特征在于,所述N种基于神经网络的风速预测特征预选模型组至少包括:基于Elman神经网络的风速预测特征预选模型组、基于BP神经网络的风速预测特征预选模型组和基于小波神经网络的风速预测特征预选模型组。
4.根据权利要求3所述的方法,其特征在于:所述基于Elman神经网络的风速预测特征预选模型组内的所有风速预测特征预选模型中的Elman神经网络在训练时设置输入层节点个数为3,隐含层节点个数为7,输出层节点个数为2,承接层节点个数为7;隐含层函数采用Sigmoid函数,最大迭代次数设置为900,训练学习率取值范围为[0.001,0.05],阈值取值范围为[0.001,0.1];
所述基于BP神经网络的风速预测特征预选模型组内的所有风速预测特征预选模型中的BP神经网络在训练时设置输入层节点个数为3,隐含层节点个数取值范围为[5,10],输出层节点个数为2,最大迭代次数设置为800,训练学习率取值范围为[0.001,0.05],阈值取值范围为[0.001,0.1];
所述基于小波神经网络的风速预测特征预选模型组内的所有风速预测特征预选模型中的小波神经网络在训练时输入层节点个数为3,隐含层小波元个数取值范围为[5,10],输出层节点个数为2;隐层小波神经元采用Mexican Hat小波函数,输出层节点采用Sigmoid函数,训练过程中的最大迭代次数设置为800,训练学习率取值范围为[0.001,0.05],阈值取值范围为[0.001,0.1]。
5.根据权利要求1所述的方法,其特征在于,所述均方误差分析和相关性分析模型筛选方法具体过程如下:
步骤A1:依次将风速模型筛选样本中所有风速训练向量内前4个时刻的风速值作为输入数据,输入到所有的风速预测特征预选模型,输出第5个时刻的风速特征预选值,进入步骤A2;
步骤A2:将每个风速预测特征预选模型输出的风速特征预选值按时间次序排列作为风速特征预选向量,进入步骤A3;
步骤A3:计算每个模型的风速特征预选向量与风速模型筛选样本中对应风速值时间序列向量的均方误差,N种基于神经网络的风速预测特征预选模型组内分别淘汰均方误差较大的风速预测特征预选模型30个,即剩余共70*N个风速预测特征预选模型,进入步骤A4;
步骤A4:分别计算N种基于神经网络的风速预测特征预选模型组内剩余的70个风速预测特征预选模型输出的风速特征预选向量两两之间的皮尔逊相关性系数,得到N个皮尔逊相关性系数矩阵,进入步骤A5;
步骤A5:分别计算N种基于神经网络的风速预测特征预选模型组内每个风速预测特征预选模型输出的风速特征预选向量与其他模型输出的风速特征预选向量之间的皮尔逊相关系数的累加值,逐步淘汰皮尔逊相关系数累加值最大的模型,直到N种基于神经网络的风速预测特征预选模型组内均剩余10个风速预测特征预选模型,进入步骤A6;
步骤A6:每种基于神经网络的风速预测特征预选模型组内均剩余10个风速预测特征预选模型,命名为风速预测特征模型,将N种基于神经网络的风速预测特征预选模型组重新命名为N种基于神经网络的风速预测特征模型组。
6.根据权利要求1所述的方法,其特征在于,所述N个基于灰色神经网络的风速预测集成模型在训练时均设置输入层节点个数为10,隐含层节点个数为20,输出层节点个数为1,最大迭代次数设置为800,训练学习率为0.01,阈值为0.001。
CN201811643479.5A 2018-12-29 2018-12-29 一种铁路和风电场环境风速机器学习预测方法 Active CN109726802B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811643479.5A CN109726802B (zh) 2018-12-29 2018-12-29 一种铁路和风电场环境风速机器学习预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811643479.5A CN109726802B (zh) 2018-12-29 2018-12-29 一种铁路和风电场环境风速机器学习预测方法

Publications (2)

Publication Number Publication Date
CN109726802A true CN109726802A (zh) 2019-05-07
CN109726802B CN109726802B (zh) 2020-11-20

Family

ID=66299522

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811643479.5A Active CN109726802B (zh) 2018-12-29 2018-12-29 一种铁路和风电场环境风速机器学习预测方法

Country Status (1)

Country Link
CN (1) CN109726802B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110333325A (zh) * 2019-08-02 2019-10-15 中南大学 一种大气污染环境下列车运行防护方法及系统
CN110554995A (zh) * 2019-08-13 2019-12-10 武汉中海庭数据技术有限公司 一种深度学习模型的管理方法及系统
CN111175720A (zh) * 2020-01-15 2020-05-19 中国科学院国家空间科学中心 一种海面风场星上快速反演方法及系统
CN113935225A (zh) * 2020-06-29 2022-01-14 中国科学院大连化学物理研究所 一种基于机器学习的液流电池电堆优化和性能预测方法
CN115829140A (zh) * 2022-12-14 2023-03-21 广西电网有限责任公司 一种基于机器学习的风力发电场发电量预测方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140164306A1 (en) * 2012-12-12 2014-06-12 International Business Machines Corporation Pathway management using model analysis and forcasting
CN105117593A (zh) * 2015-08-18 2015-12-02 河海大学 基于小波变换和粒子群改进灰色模型的短期风速预测方法
CN105184416A (zh) * 2015-09-23 2015-12-23 上海大学 基于粒子群优化反向传播神经网络的脉动风速预测方法
CN105184391A (zh) * 2015-08-19 2015-12-23 国网山东省电力公司电力科学研究院 基于小波分解和支持向量机的风电场风速与功率预测方法
CN105320809A (zh) * 2015-09-30 2016-02-10 西安电子科技大学 一种针对风电场空间相关性的风速预测方法
CN106815773A (zh) * 2015-12-02 2017-06-09 中国电力科学研究院 一种风电场功率特性评估方法
CN108520269A (zh) * 2018-03-10 2018-09-11 华北电力大学(保定) 一种风速预测方法及风速预测系统
CN109034478A (zh) * 2018-07-27 2018-12-18 中南大学 一种高速铁路沿线大风迭代竞争高精度预测方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140164306A1 (en) * 2012-12-12 2014-06-12 International Business Machines Corporation Pathway management using model analysis and forcasting
CN105117593A (zh) * 2015-08-18 2015-12-02 河海大学 基于小波变换和粒子群改进灰色模型的短期风速预测方法
CN105184391A (zh) * 2015-08-19 2015-12-23 国网山东省电力公司电力科学研究院 基于小波分解和支持向量机的风电场风速与功率预测方法
CN105184416A (zh) * 2015-09-23 2015-12-23 上海大学 基于粒子群优化反向传播神经网络的脉动风速预测方法
CN105320809A (zh) * 2015-09-30 2016-02-10 西安电子科技大学 一种针对风电场空间相关性的风速预测方法
CN106815773A (zh) * 2015-12-02 2017-06-09 中国电力科学研究院 一种风电场功率特性评估方法
CN108520269A (zh) * 2018-03-10 2018-09-11 华北电力大学(保定) 一种风速预测方法及风速预测系统
CN109034478A (zh) * 2018-07-27 2018-12-18 中南大学 一种高速铁路沿线大风迭代竞争高精度预测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CHRISTOS STATHOPOULOS ET AL.: "Wind power prediction based on numerical and statistical models", 《ELSEVIER》 *
HUI LIU ET AL.: "A hybrid statistical method to predict wind speed and wind power", 《ELSEVIER》 *
KUILIN CHEN ET AL.: "Short-term wind speed prediction using an unscented Kalman filter", 《ELSEVIER》 *
MEHMET BILGILI ET AL.: "Application of artificial neural networks for the wind", 《ELSEVIER》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110333325A (zh) * 2019-08-02 2019-10-15 中南大学 一种大气污染环境下列车运行防护方法及系统
CN110554995A (zh) * 2019-08-13 2019-12-10 武汉中海庭数据技术有限公司 一种深度学习模型的管理方法及系统
CN111175720A (zh) * 2020-01-15 2020-05-19 中国科学院国家空间科学中心 一种海面风场星上快速反演方法及系统
CN111175720B (zh) * 2020-01-15 2022-03-08 中国科学院国家空间科学中心 一种海面风场星上快速反演方法及系统
CN113935225A (zh) * 2020-06-29 2022-01-14 中国科学院大连化学物理研究所 一种基于机器学习的液流电池电堆优化和性能预测方法
CN113935225B (zh) * 2020-06-29 2024-05-07 中国科学院大连化学物理研究所 一种基于机器学习的液流电池电堆优化和性能预测方法
CN115829140A (zh) * 2022-12-14 2023-03-21 广西电网有限责任公司 一种基于机器学习的风力发电场发电量预测方法及系统
CN115829140B (zh) * 2022-12-14 2023-07-25 广西电网有限责任公司 一种基于机器学习的风力发电场发电量预测方法及系统

Also Published As

Publication number Publication date
CN109726802B (zh) 2020-11-20

Similar Documents

Publication Publication Date Title
CN109726802A (zh) 一种铁路和风电场环境风速机器学习预测方法
Fan et al. Short term load forecasting based on phase space reconstruction algorithm and bi-square kernel regression model
Nayak et al. A survey on rainfall prediction using artificial neural network
CN108022025B (zh) 一种基于人工神经网络的风速区间预测方法与系统
CN107506692A (zh) 一种基于深度学习的密集人群计数与人员分布估计方法
CN110263479A (zh) 一种大气污染因子浓度时空分布预测方法及系统
CN109859469A (zh) 一种基于集成lstm神经网络的车流量预测方法
CN111127888A (zh) 一种基于多源数据融合的城市交通流预测方法
CN104778508B (zh) 一种基于多源数据融合的公共自行车租借预测方法
CN108133295B (zh) 一种针对目标路段的机动车尾气浓度连续时间预测方法
CN107169426A (zh) 一种基于深度神经网络的人群情绪异常检测和定位方法
CN104809230A (zh) 一种基于多分类器集成的卷烟感官质量评估方法
CN106919951A (zh) 一种基于点击与视觉融合的弱监督双线性深度学习方法
CN104899653B (zh) 基于专家系统及蓝藻生长机理时序模型的湖库蓝藻水华预测方法
CN113554466B (zh) 一种短期用电量预测模型构建方法、预测方法和装置
CN110175416A (zh) 基于主成分分析和神经网络的三峡水库水温预测方法
CN113362598A (zh) 一种高速公路服务区车流量预测方法
CN110070228A (zh) 一种神经元分支进化的bp神经网络风速预测方法
CN115689008A (zh) 基于集合经验模态分解的CNN-BiLSTM短期光伏功率预测方法及其系统
CN109948839A (zh) 架空输电线路舞动风险的预测和预警方法及系统
CN104050547A (zh) 一种油田开发规划方案非线性优选决策方法
CN107203827A (zh) 一种基于多尺度分析的风电机风速预测优化方法
CN110110794A (zh) 基于特征函数滤波的神经网络参数更新的图像分类方法
CN104915727B (zh) 多维度同构异质bp神经网络光功率超短期预测方法
Shamshiry et al. Comparison of artificial neural network (ANN) and multiple regression analysis for predicting the amount of solid waste generation in a tourist and tropical area—Langkawi Island

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant