CN110110921A - 一种考虑时滞效应的河流水位预测方法 - Google Patents
一种考虑时滞效应的河流水位预测方法 Download PDFInfo
- Publication number
- CN110110921A CN110110921A CN201910363381.2A CN201910363381A CN110110921A CN 110110921 A CN110110921 A CN 110110921A CN 201910363381 A CN201910363381 A CN 201910363381A CN 110110921 A CN110110921 A CN 110110921A
- Authority
- CN
- China
- Prior art keywords
- data
- component
- model
- value
- lag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000000694 effects Effects 0.000 title claims abstract description 15
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims abstract description 82
- 238000011144 upstream manufacturing Methods 0.000 claims abstract description 41
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 38
- 238000013528 artificial neural network Methods 0.000 claims abstract description 37
- 238000012549 training Methods 0.000 claims abstract description 26
- 238000004458 analytical method Methods 0.000 claims abstract description 10
- 238000013507 mapping Methods 0.000 claims abstract description 4
- 238000013459 approach Methods 0.000 claims description 14
- 230000005540 biological transmission Effects 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 230000003416 augmentation Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims description 2
- 239000004744 fabric Substances 0.000 claims 1
- 230000008901 benefit Effects 0.000 abstract description 5
- 238000012545 processing Methods 0.000 abstract description 5
- 230000008878 coupling Effects 0.000 abstract 1
- 238000010168 coupling process Methods 0.000 abstract 1
- 238000005859 coupling reaction Methods 0.000 abstract 1
- 230000006870 function Effects 0.000 description 15
- 238000009826 distribution Methods 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 4
- 241001269238 Data Species 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012876 topography Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种考虑时滞效应的河流水位预测方法,包括如下步骤,1:基于分布滞后模型确定上下游水位的滞后值;2:基于VMD模型分解水位数据;3:重构VMD分解分量得到分量组合;4:基于BP神经网络进行重构分量组合的训练及预测。分布滞后模型是基于时间序列的回归模型,可反映变量之间的滞后效应,为确定上下游水位的滞后值提供了一种有效的方法。变分模态分解方法是一种处理非线性、非平稳信号的分析方法,可依据信号的特点进行线性化和平稳化的处理。BP神经网络是一种对非线性函数进行权值训练的多层映射网络,具有较好的非线性拟合。该方法将三个模型结合起来,充分发挥各自的特点和优势,实现基于上游水位对下游水位的预测和预报,并取得较好的预测精度。
Description
技术领域
本发明涉及水资源管理技术领域,具体涉及一种集成分布滞后模型、变分模态分解和BP神经网络的河流水位预测方法。
背景技术
水位是反映流域水情最直观的因素,也是水文预报和水资源评价的重要指标。水位信息有助于了解河流水位的动态变化,对于防洪抗旱和水资源调度具有重要参考价值。河流水位预测有利于掌握水位信息及洪涝情况,提前做好预警工作,最大限度降低洪涝灾害造成的损失。同时,水位监测设备昂贵,水文监测站建设和管理需要耗费大量的资金和精力。结合上游水位数据预测下游水位信息,有利于指导水文站网的合理规划和优化配置,将大大减少水文监测站的建设和维护费用。
河流水位信息受到气候气象、地形地貌、植被覆盖和人类活动等多种因素的影响,具有复杂多变的特点,因而往往难以确定。对于同一河流,下游水位直接受到上游水位的影响。分布滞后模型(DLM)是基于时间序列的回归模型,可反映变量之间的滞后效应,广泛应用于经济、环境、地学等领域,为确定上下游水位的滞后值提供了一种有效的方法。
河流水位预测主要包含数据获取和方法建模两个环节。目前,水位预测对于数据源的选择主要从两个方面入手:(1)从水位的时间序列出发,通常是日水位、月水位时间序列,通过挖掘时间序列的多层次特征,建立水位预测数值模型。(2)从影响水位变化的因素中,寻求有效因素,如河流流量、降雨量、蒸发量等,建立与水位信息相关的经验、物理模型。然而,影响水位变化的因素众多,难以完全覆盖,且加入这些复杂的因素易导致模型的构建难度增大。
水位预测的方法通常有数理统计和智能方法两种。相比于数理统计,人工智能具有适用面广、预测精度较高的优点,成为目前研究的热点。为了提高水位预测精度,通常需要集成多种方法模型。Seo和Kim结合小波分解和数据驱动模型预测河流水位,结果表明小波分解提高了人工神经网络和ANFIS模型预测河流水位的精度。但小波分解的缺点之一是不同的母小波具有不同的分解性能。变分模态分解(VMD)在一定程度上克服了小波分解存在的问题,逐渐应用于分析非线性随机信号,其最大的特点是可以将信号分解为固定数量、包含原信号特征信息的有限宽带的本征模态函数(BLIMF),降低信号的波动性。
发明内容
本发明通过分析河流上下游水位之间的关联性和滞后性,提出了一种集成分布滞后模型、变分模态分解和BP神经网络的水位预测方法。该方法通过分布滞后模型分析上、下游水位的关联性和滞后性以确定模型的输入数据,并利用变分模态分解方法对数据序列进行平稳化处理,降低数据波动性,再利用BP神经网络进行训练及预测,实现基于上游水位对下游水位的预测和预报。
本发明中,分布滞后模型是基于时间序列的回归模型,可反映变量之间的滞后效应,可作为确定上下游水位的滞后值的有效方法。BP神经网络是一种按照误差逆向传播算法训练的多层前馈神经网络,具有易于构建、自适应和实时学习的特点,适合处理复杂、非线性的水位数据。VMD模型是一种新的信号分析方法,将复杂的、非线性、不对称的序列数据分解为多个相对平稳的、频率逐级变化的本征模态函数(BLIMF),适用于处理水位数据的波动性。
为解决上述技术问题,本发明公开的一种考虑时滞效应的河流水位预测方法,其特征在于,它包括如下步骤:
步骤1:基于分布滞后模型确定上下游水位的滞后值;
对上下游水文站的水位时间序列数据构建分布滞后模型,通过设置不同的滞后值,得到下游水位对应的分布滞后模型,并计算模型的赤池信息量准则、施瓦茨准则、汉南-奎因信息准则指标值(AIC(赤池信息量准则)、SC(施瓦茨准则)、HQ(汉南-奎因信息准则)),综合考虑三个指标值最小时的滞后值即为分布滞后模型的最佳滞后值n,该方法的目的是预测下游水文站的水位,因此输入数据是上游水位序列{x0(t),x1(t)...xn(t)},输出数据是下游水文站的水位y(t),其中xn(t)表示上游水文站前n+1天的第t个水位数据;y(t)表示对应下游水文站当天的第t个水位数据;
步骤2:基于VMD模型分解水位数据;
利用VMD模型对输入数据{x0(t),x1(t)...xn(t)}和输出数据y(t)分别进行平稳化处理,分解为表示输入数据和输出数据特征的多个分量{x0k(t),x1k(t)...xnk(t)},k={1,2,…,K}和yk(t),k={1,2,…,K},K代表最大分解个数,xnk(t)表示上游水文站前n+1天的第t个水位数据的第k个分量;yk(t)表示下游水文站第t个水位数据的第k个分量;
步骤3:重构VMD分解分量得到分量组合;
将输入数据和输出数据经过VMD分解得到的分解分量{x0k(t),x1k(t)...xnk(t)},k={1,2,…,K}和yk(t),k={1,2,…,K}按其对应的分解量进行重构,即输入数据和输出数据VMD分解的分量分别按第一分量、第二分量一直到第k分量的形式进行组合,形成如下公式所示的数据组合,Fk表示第k个分量组合,xnk表示第n+1个输入变量的第k个分量,yk表示输出变量的第k个分量;
步骤4:基于BP神经网络进行重构分量组合的训练及预测;
将重构分量组合{F1,F2,...Fk,k={1,2,…,K}分别进行BP神经网络训练,得到训练好的神经网络,之后将需要预测的下游水位数据对应的上游水位的输入数据输入到训练好的神经网络进行预测,得到每个分量组合的预测值Dk,之后将每个分量组合的预测值叠加得到最终的下游水位的预测值D,Dk表示第k个分量组合的预测值,D表示最终预测值;
D=D1+D2+…+Dk。
上述技术方案的步骤1中分布滞后模型确定滞后值的方法为:
步骤101:阿尔蒙变换;
对于分布滞后模型Yt为自变量;Xt-i为因变量X的第i期滞后;i表示滞后期;βi(i=1,2,…,s)为动态乘数或回归系数,表示Xt-i的变动对Yt影响的大小,s表示最大滞后期;α为截距项;μt是随机误差值,假定回归系数βi用一个关于滞后期i的适当阶数的多项式来表示,即
βi=α0+α1(i+1)+α2(i+1)2+…+αm(i+1)m i=1,2,…,s
其中α0,α1,α2,…,αm表示多项式表达式待估计的参数,m是多项式的次数且满足m<s-1;
对上述公式进行阿尔蒙变换,得到
之后定义新变量将上述公式模型转换为:
Yt=α+α0W0t+α1W1t+α2W2t+…+αmWmt+μt
其中W0t,W1t,W2t,…,Wmt表示定义的新变量;
步骤102:模型的最小二乘估计;
对转换后得到的公式Yt=α+α0W0t+α1W1t+α2W2t+…+αmWmt+μt进行最小二乘估计,得到新定义变量的参数估计值并将取代βi=α0+α1(i+1)+α2(i+1)2+…+αm(i+1)m中的α0,α1,α2,...αm,并求出对应的滞后分布模型参数的回归系数估计值得到最终的分布滞后模型;
步骤103:滞后值n的确定
设置不同的滞后值,依次从1-10之间进行设置,得到其对应的分布滞后模型,再根据滞后值的选取准则得到最佳滞后值n,根据滞后值个数确定方法的输入数据{x0k(t),x1k(t)…xnk(t)},即xnk(t)为滞后期为n的上游水位数据,
滞后值通常根据赤池信息量准则、施瓦茨准则、汉南-奎因信息准则指标值确定,三个指标值保持最小即为最佳滞后值。
上述技术方案的步骤2中VMD分解分量方法为:
步骤201:变分模态分解的构建;
初始化输入数据分解模态集合{xnk 1}、其对应的中心频率{ωnk 1}和循环算子n,构建变量xnk的约束变分公式:
式中,{xnk}:={xn1,...,xnk}是第n+1个变量分解的k个分量的集合,{ωnk}:={ωn1,…,ωnk}是第n+1个变量分解的分量对应的中心频率的集合,表示所有分量的和,xn是原始输入数据,即滞后期为n的上游水位数据,xnk(t)表示上游水文站前n+1天的第t个水位数据的第k个分量,表示对t求偏导数,t表示分析信号的个数,δ(t)表示脉冲函数,j表示叙述单位,*表示卷积,表示希尔伯特变换得到的分析信号的指数谐调项,xnk(t)表示上游水文站前n+1天的第t个水位数据的第k个分量;
步骤202:引入拉格朗日算子λn(t)和二次惩罚项α计算得到增广拉格朗日公式并初始化;采用交替方向乘子法迭代更新各分解模态及其中心频率并计算E,其中 表示xnk的第n次迭代结果,表示xnk对应的中心频率ωnk的第n次迭代结果;
步骤203:重复步骤202直到满足收敛条件E<ε,ε表示给定的判别精度(10-7),表示xnk的第m次迭代结果;
步骤204:输出集成方法输入数据的VMD分解组合{xn1,xn2,...,xnk},xnk表示第n+1个输入变量的第k个分量;
步骤205:输出集成方法输出数据的VMD分解组合{y1,y2,...,yk},yk表示输出变量的第k个分量。
上述技术方案的步骤4中BP神经网络的训练及预测的方法为:
步骤401:数据归一化;
对重构的分量组合进行归一化处理,消除单位差异和异常数据的影响,同时归一化处理可加快网络的收敛,减少运行时间,因为进行VMD分解后得到的有限宽带的本征模态函数中既有正数也有负数,因此将分解后得到的有限宽带的本征模态函数归一化映射到[-1,1];
步骤402:信号正向传播;
输入数据xnk进入BP神经网络的输入层,累加xnk与输入层和隐藏层之间的权值wnh和偏置值θn的乘积传入隐藏层,经过传递函数fS(x)的计算后得到隐藏层输出,之后与隐藏层与输出层的权值wh和偏置值θh的乘积后传入输出层,得到输出信号yk,上述传递函数fS(x)为双极S型函数,其中net为输入隐藏层的数据,sig(n)表示sig三角计算函数,e为自然对数;
步骤403:信号反向传播;
根据神经网络在训练的过程中产生的预测输出信号yk和对应的期望输出dk计算得到误差E,判断误差是否小于给定值ε,如果大于则将该误差反向传播给隐藏层求其误差梯度,更新权值和偏置值;并返回正向传播中进行计算,直到误差小于期望误差或者达到最大迭代次数,得到最终训练的网络;
步骤404:迭代;
重复上述步骤401~403分别得到每个分量组合训练后的网络;
步骤405:叠加得到预测值;
将需要预测的下游水位数据对应的上游水位的输入数据输入到对应的训练后的网络,得到每个组合的预测值Dk;将上述得到的预测值叠加得到最终的预测值;
D=D1+D2+…+Dk。
本发明的有益效果为:
1、分布滞后模型是基于时间序列的回归模型,可反映变量之间的滞后效应,为确定上下游水位的滞后值提供了一种有效的方法。
2、结合VMD在处理具有波动数据上的优势以及BP神经网络较好的非线性拟合能力,实现基于上游水位对下游水位的预测和预报,达到了提高预测精度的目的。
附图说明
图1为本发明的流程图;
图2为VMD模型流程;
图3为BP神经网络结构图;
图4为模型预测误差分布的箱线图。
具体实施方式
以下结合附图和具体实施例对本发明作进一步的详细说明:
本发明的一种考虑时滞效应的河流水位预测方法,如图1所示,它包括如下步骤:
步骤1:基于分布滞后模型确定上下游水位的滞后值
对上下游水文站的水位时间序列数据构建分布滞后模型。通过设置不同的滞后值,得到其对应的分布滞后模型,并计算模型的AIC(赤池信息量准则)、SC(施瓦茨准则)、HQ(汉南-奎因信息准则)指标值。综合考虑三个指标值最小时的滞后值即为模型的最佳滞后值n。该方法的目的是预测下游水文站的水位,因此输入数据是上游水位序列{x0(t),x1(t)...xn(t)},输出数据是下游水文站的水位y(t)。其中xn(t)表示上游水文站前n+1天的第t个水位数据;y(t)表示对应下游水文站当天的第t个水位数据。
步骤2:基于VMD模型分解水位数据
利用VMD模型对输入数据{x0(t),x1(t)…xn(t)}和输出数据y(t)分别进行平稳化处理,分解为表示输入数据和输出数据特征的多个分量{x0k(t),x1k(t)…xnk(t)},k={1,2,…,K}和yk(t),k={1,2,…,K}。xnk(t)表示上游水文站前n+1天的第t个水位数据的第k个分量;yk(t)表示下游水文站第t个水位数据的第k个分量。
步骤3:重构VMD分解分量得到分量组合{F1,F2,…Fk,k={1,2,…,K}
将输入数据和输出数据经过VMD分解得到的分解分量{x0k(t),x1k(t)…xnk(t)},k={1,2,…,K}和yk(t),k={1,2,…,K}按其对应的分解量进行重构,即输入数据和输出数据VMD分解的分量分别按第一分量、第二分量一直到第k分量的形式进行组合,形成如下公式所示的数据组合,Fk表示第k个分量组合,xnk表示第n+1个输入变量的第k个分量,yk表示输出变量的第k个分量。
步骤4:基于BP神经网络进行重构分量组合的训练及预测
将重构分量组合{F1,F2,...Fk,k={1,2,…,K}分别进行BP神经网络训练,得到训练好的神经网络。之后将需要预测的下游水位数据对应的上游水位的输入数据输入到训练好的神经网络进行预测,得到每个分量组合的预测值Dk,之后将每个分量组合的预测值叠加得到最终的下游水位的预测值D。Dk表示第k个分量组合的预测值,D表示最终预测值。
D=D1+D2+…+Dk
上述技术方案中步骤1的具体方法为:
步骤101:阿尔蒙变换
对于分布滞后模型假定其回归系数βi可用一个关于滞后期i的适当阶数的多项式来表示,即
对上述公式进行阿尔蒙变换,得到
之后定义新变量将上述公式模型转换为:
Yt=α+α0W0t+α1W1t+α2W2t+…+αmWmt+μt
步骤102:模型的OLS估计
对转换后得到的公式进行OLS估计。将得到的参数估计值代入上述公式,求出滞后分布模型参数的估计值得到最终的分布滞后模型。
步骤103:滞后值n的确定
设置不同的滞后值,得到其对应的分布滞后模型,再根据滞后值的选取准则得到最佳滞后值n,确定集成方法的输入数据{x0k(t),x1k(t)...xnk(t)}。
上述技术方案中步骤2的具体方法为:
步骤201:变分模态分解的构建
初始化输入数据分解模态集合{xnk 1}、其对应的中心频率{ωnk 1}和循环算子n,构建变量xnk的约束变分公式:
式中,{xnk}:={xn1,...,xnk}是第n+1个变量分解的k个分量的集合,{ωnk}:={ωn1,...,ωnk}是第n+1个变量分解的分量对应的中心频率的集合,表示所有分量的和,xn是原始输入数据,表示对t求偏导数,t表示分析信号的个数,δ(t)表示脉冲函数,j表示叙述单位,*表示卷积,表示希尔伯特变换得到的分析信号的指数谐调项;
步骤202:引入拉格朗日算子λn(t)和二次惩罚项α计算得到增广拉格朗日公式并初始化;采用交替方向乘子法迭代更新各分解模态及其中心频率并计算E,其中 表示xnk的第n次迭代结果,表示xnk对应的中心频率ωnk的第n次迭代结果;
步骤203:重复步骤202直到满足收敛条件E<ε,ε表示给定的判别精度,表示xnk的第次迭代结果;
步骤204:输出集成方法的输入数据的VMD分解组合{xn1,xn2,...,xnk},xnk表示第n+1个输入变量的第k个分量;
步骤205:输出集成方法的输出数据的VMD分解组合{y1,y2,…,yk},yk表示输出变量的第k个分量。
上述技术方案中步骤4的具体方法为:
步骤401:数据归一化
对重构的分量组合进行归一化处理,消除单位差异和异常数据的影响,同时归一化处理可加快网络的收敛,减少运行时间,因为进行VMD分解后得到的有限宽带的本征模态函数中既有正数也有负数,因此将分解后得到的有限宽带的本征模态函数归一化映射到[-1,1];
步骤402:信号正向传播
输入数据xnk进入BP神经网络的输入层,累加xnk与输入层和隐藏层之间的权值wnh和偏置值θn的乘积传入隐藏层,经过传递函数fS(x)的计算后得到隐藏层输出,之后与隐藏层与输出层的权值wh和偏置值θh的乘积后传入输出层,得到输出信号yk。上述传递函数fS(x)为双极S型函数,其中net为输入隐藏层的数据,e为自然对数;
步骤403:信号反向传播
根据神经网络在训练的过程中产生的预测输出信号yk和对应的期望输出dk计算得到误差E,判断误差是否小于给定值ε,如果大于则将该误差反向传播给隐藏层求其误差梯度,更新权值和偏置值;并返回正向传播中进行计算,直到误差小于期望误差或者达到最大迭代次数,得到最终训练的网络。
步骤404:迭代
重复上述步骤401~403分别得到每个分量组合训练后的网络;
步骤405:叠加得到预测值
将需要预测的下游水位数据对应的上游水位的输入数据输入到对应的训练后的网络,得到每个组合的预测值Dk;将上述得到的预测值叠加得到最终的预测值。
D=D1+D2+…+Dk
本实施例以长江干流螺山和汉口水文监测站2010-2013年共1350组日水位数据作为研究数据,随机选取135个(10%)数据作为测试数据,剩余的数据作为训练数据。
步骤1:基于分布滞后模型确定上下游水位的滞后值
分布滞后模型可以反映解释变量对被解释变量的影响,利用分布滞后模型分析上游螺山水文站和下游汉口水文站之间的水位关系,确定两站之间的滞后期,得到模型的输入数据。
计算分布滞后模型在不同滞后期下AIC、SC、HQ指标的值,其结果如表1所示。结合选取准则(AIC、SC、HQ值最小),最终确定模型最佳滞后值为3,即输入数据为螺山水文站当天水位、前一天水位、前两天水位、前三天水位。模型的目的是预测汉口水文站的水位,因此输出数据是汉口水文站当天水位。
表1分布滞后模型结果
步骤2:基于VMD模型分解水位数据
将步骤1得到的输入数据及输出数据分别进行VMD分解。为避免过多分解带来的误差以及减少后期BP神经网络的构建量,将输入数据和输出数据分解为三个分量,分别为反映原始数据基本趋势的趋势量、频率波动较低的低频量以及频率波动较大的高频量。VMD模型参数设计如表2所示。
表2 VMD主要参数
步骤3:重构VMD分解分量得到分量组合
将步骤2输入数据和输出数据分解的三个分量进行组合,形成表示趋势量、低频量、高频量的三组分量组合。
步骤4:基于BP神经网络进行重构分量组合的训练及预测
将训练数据的三组分量组合分别进行BP神经网络训练,BP神经网络的参数设计如表3所示。之后利用训练好的网络对测试数据进行预测,得到预测值,并与实测值进行比较,计算得到模型的RE(相对误差)、RMSE(均方根误差)、MAE(平均绝对误差)。
表3 BP神经网络主要参数
为检验集成方法的合理性和准确性,将结果与回归模型、单输入BP神经网络、多输入BP神经网络的预测结果进行比较,具体误差如表2所示。集成方法模型误差最小,其次是多输入BP神经网络模型,再之后是回归模型,单输入BP神经网络模型的效果最差。
表2模型误差比较
各方法对于13-18米、18-23米、23-28米不同水位段预测误差分布的箱线图如图4所示。可以看出,在不同水位段,集成方法的预测误差分布都最接近于0轴,表明集成方法预测精度最高。水位在13-18米,各个模型在低估误差分布比较接近,而集成方法在高估误差上分布更接近于0轴。水位在18-23米,各个模型在高估误差分布比较相似,集成方法在的低估预测上小于其他模型。水位在23-28米,模型在低估和高估误差上都比较接近。结果表明,集成方法相比于其他模型在中低水位预测上有较大的优势。
本说明书未作详细描述的内容属于本领域专业技术人员公知的现有技术。
Claims (4)
1.一种考虑时滞效应的河流水位预测方法,其特征在于,它包括如下步骤:
步骤1:基于分布滞后模型确定上下游水位的滞后值;
对上下游水文站的水位时间序列数据构建分布滞后模型,通过设置不同的滞后值,得到下游水位对应的分布滞后模型,并计算模型的赤池信息量准则、施瓦茨准则、汉南-奎因信息准则指标值,综合考虑三个指标值最小时的滞后值即为分布滞后模型的最佳滞后值n,该方法的目的是预测下游水文站的水位,因此输入数据是上游水位序列{x0(t),x1(t)...xn(t)},输出数据是下游水文站的水位y(t),其中xn(t)表示上游水文站前n+1天的第t个水位数据;y(t)表示对应下游水文站当天的第t个水位数据;
步骤2:基于VMD模型分解水位数据;
利用VMD模型对输入数据{x0(t),x1(t)...xn(t)}和输出数据y(t)分别进行平稳化处理,分解为表示输入数据和输出数据特征的多个分量{x0k(t),x1k(t)...xnk(t)},k={1,2,…,K}和yk(t),k={1,2,…,K},K代表最大分解个数,xnk(t)表示上游水文站前n+1天的第t个水位数据的第k个分量;yk(t)表示下游水文站第t个水位数据的第k个分量;
步骤3:重构VMD分解分量得到分量组合;
将输入数据和输出数据经过VMD分解得到的分解分量{x0k(t),x1k(t)...xnk(t)},k={1,2,…,K}和yk(t),k={1,2,…,K}按其对应的分解量进行重构,即输入数据和输出数据VMD分解的分量分别按第一分量、第二分量一直到第k分量的形式进行组合,形成如下公式所示的数据组合,Fk表示第k个分量组合,xnk表示第n+1个输入变量的第k个分量,yk表示输出变量的第k个分量;
步骤4:基于BP神经网络进行重构分量组合的训练及预测;
将重构分量组合{F1,F2,...Fk,k={1,2,…,K}分别进行BP神经网络训练,得到训练好的神经网络,之后将需要预测的下游水位数据对应的上游水位的输入数据输入到训练好的神经网络进行预测,得到每个分量组合的预测值Dk,之后将每个分量组合的预测值叠加得到最终的下游水位的预测值D,Dk表示第k个分量组合的预测值,D表示最终预测值;
D=D1+D2+…+Dk。
2.根据权利要求1所述的考虑时滞效应的河流水位预测方法,其特征在于:步骤1中分布滞后模型确定滞后值的方法为:
步骤101:阿尔蒙变换;
对于分布滞后模型Yt为自变量;Xt-i为因变量X的第i期滞后;i表示滞后期;βi(i=1,2,…,s)为动态乘数或回归系数,表示Xt-i的变动对Yt影响的大小,s表示最大滞后期;α为截距项;μt是随机误差值,假定回归系数βi用一个关于滞后期i的适当阶数的多项式来表示,即
βi=α0+α1(i+1)+α2(i+1)2+…+αm(i+1)m i=1,2,…,s
其中α0,α1,α2,…,αm表示多项式表达式待估计的参数,m是多项式的次数且满足m<s-1;
对上述公式进行阿尔蒙变换,得到
之后定义新变量将上述公式模型转换为:
Yt=α+α0W0t+α1W1t+α2W2t+…+αmWmt+μt
其中W0t,W1t,W2t,…,Wmt表示定义的新变量;
步骤102:模型的最小二乘估计;
对转换后得到的公式Yt=α+α0W0t+α1W1t+α2W2t+…+αmWmt+μt进行最小二乘估计,得到新定义变量的参数估计值并将取代βi=α0+α1(i+1)+α2(i+1)2+…+αm(i+1)m中的α0,α1,α2,...αm,并求出对应的滞后分布模型参数的回归系数估计值得到最终的分布滞后模型;
步骤103:滞后值n的确定
设置不同的滞后值,依次从1-10之间进行设置,得到其对应的分布滞后模型,再根据滞后值的选取准则得到最佳滞后值n,根据滞后值个数确定方法的输入数据{x0k(t),x1k(t)...xnk(t)},即xnk(t)为滞后期为n的上游水位数据,
滞后值通常根据赤池信息量准则、施瓦茨准则、汉南-奎因信息准则指标值确定,三个指标值保持最小即为最佳滞后值。
3.根据权利要求1所述的考虑时滞效应的河流水位预测方法,其特征在于:步骤2中VMD分解分量方法为:
步骤201:变分模态分解的构建;
初始化输入数据分解模态集合{xnk 1}、其对应的中心频率{ωnk 1}和循环算子n,构建变量xnk的约束变分公式:
式中,{xnk}:={xn1,...,xnk}是第n+1个变量分解的k个分量的集合,{ωnk}:={ωn1,...,ωnk}是第n+1个变量分解的分量对应的中心频率的集合,表示所有分量的和,xn是原始输入数据,即滞后期为n的上游水位数据,xnk(t)表示上游水文站前n+1天的第t个水位数据的第k个分量,表示对t求偏导数,t表示分析信号的个数,δ(t)表示脉冲函数,j表示叙述单位,*表示卷积,表示希尔伯特变换得到的分析信号的指数谐调项,xnk(t)表示上游水文站前n+1天的第t个水位数据的第k个分量;
步骤202:引入拉格朗日算子λn(t)和二次惩罚项α计算得到增广拉格朗日公式并初始化;采用交替方向乘子法迭代更新各分解模态及其中心频率并计算E,其中 表示xnk的第n次迭代结果,表示xnk对应的中心频率ωnk的第n次迭代结果;
步骤203:重复步骤202直到满足收敛条件E<ε,ε表示给定的判别精度,表示xnk的第m次迭代结果;
步骤204:输出集成方法输入数据的VMD分解组合{xn1,xn2,...,xnk},xnk表示第n+1个输入变量的第k个分量;
步骤205:输出集成方法输出数据的VMD分解组合{y1,y2,...,yk},yk表示输出变量的第k个分量。
4.根据权利要求1所述的考虑时滞效应的河流水位预测方法,其特征在于:步骤4中BP神经网络的训练及预测的方法为:
步骤401:数据归一化;
对重构的分量组合进行归一化处理,消除单位差异和异常数据的影响,同时归一化处理可加快网络的收敛,减少运行时间,因为进行VMD分解后得到的有限宽带的本征模态函数中既有正数也有负数,因此将分解后得到的有限宽带的本征模态函数归一化映射到[-1,1];
步骤402:信号正向传播;
输入数据xnk进入BP神经网络的输入层,累加xnk与输入层和隐藏层之间的权值wnh和偏置值θn的乘积传入隐藏层,经过传递函数fS(x)的计算后得到隐藏层输出,之后与隐藏层与输出层的权值wh和偏置值θh的乘积后传入输出层,得到输出信号yk,上述传递函数fS(x)为双极S型函数,其中net为输入隐藏层的数据,sig(n)表示sig三角计算函数,e为自然对数;
步骤403:信号反向传播;
根据神经网络在训练的过程中产生的预测输出信号yk和对应的期望输出dk计算得到误差E,判断误差是否小于给定值ε,如果大于则将该误差反向传播给隐藏层求其误差梯度,更新权值和偏置值;并返回正向传播中进行计算,直到误差小于期望误差或者达到最大迭代次数,得到最终训练的网络;
步骤404:迭代;
重复上述步骤401~403分别得到每个分量组合训练后的网络;
步骤405:叠加得到预测值;
将需要预测的下游水位数据对应的上游水位的输入数据输入到对应的训练后的网络,得到每个组合的预测值Dk;将上述得到的预测值叠加得到最终的预测值;
D=D1+D2+…+Dk。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910363381.2A CN110110921A (zh) | 2019-04-30 | 2019-04-30 | 一种考虑时滞效应的河流水位预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910363381.2A CN110110921A (zh) | 2019-04-30 | 2019-04-30 | 一种考虑时滞效应的河流水位预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110110921A true CN110110921A (zh) | 2019-08-09 |
Family
ID=67487856
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910363381.2A Pending CN110110921A (zh) | 2019-04-30 | 2019-04-30 | 一种考虑时滞效应的河流水位预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110110921A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110633859A (zh) * | 2019-09-18 | 2019-12-31 | 西安理工大学 | 一种两阶段分解集成的水文序列预测方法 |
CN111753965A (zh) * | 2020-06-30 | 2020-10-09 | 长江水利委员会水文局 | 一种基于深度学习的河流流量自动整编方法及系统 |
CN116562416A (zh) * | 2023-03-01 | 2023-08-08 | 福建中锐汉鼎数字科技有限公司 | 基于变模态与延时特征Transformer模型的水库水位预测方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030078901A1 (en) * | 2001-10-22 | 2003-04-24 | Coppola Emery J. | Neural network based predication and optimization for groundwater / surface water system |
CN108647807A (zh) * | 2018-04-10 | 2018-10-12 | 武汉理工大学 | 河流流量的预测方法 |
-
2019
- 2019-04-30 CN CN201910363381.2A patent/CN110110921A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030078901A1 (en) * | 2001-10-22 | 2003-04-24 | Coppola Emery J. | Neural network based predication and optimization for groundwater / surface water system |
CN108647807A (zh) * | 2018-04-10 | 2018-10-12 | 武汉理工大学 | 河流流量的预测方法 |
Non-Patent Citations (3)
Title |
---|
BERRIN GÜLTAY等: "Mean square error comparisons of the alternative estimators for the distributed lag models", 《HACETTEPE JOURNAL OF MATHEMATICS AND STATISTICS》 * |
丁俊君等: "多项式分布滞后模型阶数的确定及其应用", 《统计与决策》 * |
董文永等: "基于控制因子ADL模型的短期水位预测方法", 《计算机工程》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110633859A (zh) * | 2019-09-18 | 2019-12-31 | 西安理工大学 | 一种两阶段分解集成的水文序列预测方法 |
CN110633859B (zh) * | 2019-09-18 | 2024-03-01 | 西安理工大学 | 一种两阶段分解集成的水文序列预测方法 |
CN111753965A (zh) * | 2020-06-30 | 2020-10-09 | 长江水利委员会水文局 | 一种基于深度学习的河流流量自动整编方法及系统 |
CN116562416A (zh) * | 2023-03-01 | 2023-08-08 | 福建中锐汉鼎数字科技有限公司 | 基于变模态与延时特征Transformer模型的水库水位预测方法 |
CN116562416B (zh) * | 2023-03-01 | 2024-04-12 | 福建中锐汉鼎数字科技有限公司 | 基于变模态与延时特征Transformer模型的水库水位预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Research and application of a combined model based on multi-objective optimization for multi-step ahead wind speed forecasting | |
Li et al. | A hybrid model based on synchronous optimisation for multi-step short-term wind speed forecasting | |
Mahmoud et al. | An advanced approach for optimal wind power generation prediction intervals by using self-adaptive evolutionary extreme learning machine | |
Ata et al. | An adaptive neuro-fuzzy inference system approach for prediction of tip speed ratio in wind turbines | |
CN103577694B (zh) | 一种基于多尺度分析的水产养殖水质短期组合预测方法 | |
Haque et al. | A new strategy for predicting short-term wind speed using soft computing models | |
Luk et al. | A study of optimal model lag and spatial inputs to artificial neural network for rainfall forecasting | |
Ghoushchi et al. | An extended new approach for forecasting short-term wind power using modified fuzzy wavelet neural network: A case study in wind power plant | |
CN109299430A (zh) | 基于两阶段分解与极限学习机的短期风速预测方法 | |
CN107885951B (zh) | 一种基于组合模型的水文时间序列预测方法 | |
CN104037943B (zh) | 一种提高电网电压质量的电压监测方法及系统 | |
CN107704953A (zh) | Ewt分位数回归森林的短期风电功率概率密度预测方法 | |
CN105868853B (zh) | 一种短期风电功率组合概率预测方法 | |
CN110110921A (zh) | 一种考虑时滞效应的河流水位预测方法 | |
CN108647807B (zh) | 河流流量的预测方法 | |
CN111027775A (zh) | 基于长短期记忆网络的梯级水电站发电量预测方法 | |
CN105117593A (zh) | 基于小波变换和粒子群改进灰色模型的短期风速预测方法 | |
CN111582551A (zh) | 风电场短期风速预测方法、系统及电子设备 | |
CN109242265A (zh) | 基于误差平方和最小的城市需水量组合预测方法 | |
CN112163371A (zh) | 一种变压器套管状态评估方法 | |
CN105260615B (zh) | 一种粮食消费量预测方法 | |
Goli et al. | Application of improved artificial intelligence with runner-root meta-heuristic algorithm for dairy products industry: a case study | |
CN109408896B (zh) | 一种污水厌氧处理产气量多元智能实时监控方法 | |
CN107169612A (zh) | 基于神经网络的风电机有功功率预测及误差订正方法 | |
Kamel et al. | On the Performance Robustness of Artificial Neural Network Approaches and Gumbel Extreme Value Distribution for Prediction of Wind Speed |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190809 |
|
RJ01 | Rejection of invention patent application after publication |