CN114692993B - 融合季节ARIMA和BiLSTM的水利设施形变预测方法 - Google Patents
融合季节ARIMA和BiLSTM的水利设施形变预测方法 Download PDFInfo
- Publication number
- CN114692993B CN114692993B CN202210406662.3A CN202210406662A CN114692993B CN 114692993 B CN114692993 B CN 114692993B CN 202210406662 A CN202210406662 A CN 202210406662A CN 114692993 B CN114692993 B CN 114692993B
- Authority
- CN
- China
- Prior art keywords
- model
- bilstm
- prediction
- sequence
- seasonal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 17
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 title claims abstract 14
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims description 10
- 230000001932 seasonal effect Effects 0.000 claims abstract description 39
- 238000012544 monitoring process Methods 0.000 claims abstract description 11
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 8
- 238000013112 stability test Methods 0.000 claims abstract 2
- 238000012360 testing method Methods 0.000 claims description 16
- 238000012549 training Methods 0.000 claims description 11
- 238000010586 diagram Methods 0.000 claims description 10
- 238000012806 monitoring device Methods 0.000 claims description 7
- 241001123248 Arma Species 0.000 claims description 6
- 230000002457 bidirectional effect Effects 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000007689 inspection Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 3
- 230000004927 fusion Effects 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 241000728173 Sarima Species 0.000 claims 4
- 230000000694 effects Effects 0.000 description 6
- 238000006073 displacement reaction Methods 0.000 description 4
- 238000001744 unit root test Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Human Resources & Organizations (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种融合季节ARIMA和BiLSTM的水利设施形变预测方法,包括以下步骤:在SARIMA‑BiLSTM模型中,使用水电站引水涵洞实际形变监测数据进行缺失值补全、季节性分解以及平稳性检验,使用处理后的时序数据进行季节ARIMA建模得到原始数据线性部分的预测结果;将季节ARIMA模型预测结果与原数据求差得到残差,并将温度信息协变量共4个指标导入BiLSTM网络之中进行原始数据非线性部分的残差预测,最后将季节ARIMA模型的预测结果与BiLSTM网络残差预测结果进行叠加得到裂缝计开合度的预测值。本发明充分利用两种模型的优点,然后利用BiLSTM模型强大的自学习能力来拟合两种模型之间的复杂关系,从而提高时序预测的准确度。
Description
技术领域
本发明提供一种融合季节ARIMA和BiLSTM的水利设施形变预测,属于水利技术领域。
背景技术
目前,许多学者对水利设施变形数据预测算法进行了研究,提出了许多有效的预测算法,最常用的是自回归综合移动平均(ARIMA)模型。ARIMA算法是由Box等学者在上个世纪提出的算法模型和ARIMA模型,证明了ARIMA模型能更准确地预测时间序列数据。还有根据时间序列模型通过简单移动平均法,并采用多项式拟合和ARIMA时间序列模型进行建模预测,实现了对滑坡位移的短期滚动预测。可以看出,利用ARIMA模型对时间序列数据进行预测具有良好的效果。但由于模型不能准确反映变量之间的非线性特征,随着预测周期的增加,预测精度逐渐降低。随着计算机、人工智能技术的发展,大量研究者开始将目光放在神经网络模型用于形变预测的方法上,与传统的时间序列模型不同,神经网络在模拟和求解变量之间的非线性关系方面具有明显的优势。还有将BP神经网络应用于太和水库的预测。结果表明,由于BP模型具有良好的适应性,预测精度显著高于统计模型。改进的水利设施位移LSTM算法,展示了LSTM模型及其改进模型在水利设施径向位移预测中的性能。试验结果表明,LSTM模型能充分利用历史数据预测坝体位移,改进后的LSTM模型性能最佳。还有通过ARIMA模型和LSTM网络的互补优势有效去除了水位时间序列中的干扰因素,研究了水位时间序列的复杂规律,提高了水位预测精度。
但是传统的LSTM模型只能通过单向学习历史数据进行预测,准确性不高。
发明内容
为了获得更准确的预测结果,提出一种基于季节ARIMA和BiLSTM的预测模型,以解决无法充分挖掘数据中正向与反向的关联进行预测的问题。该模型采用季节性差分自回归移动平均(SARIMA)模型预测变形数据中的线性分量,采用双向长短期记忆(BiLSTM)模型预测变形数据中的非线性分量,使得模型能够更好地提取历史数据中的非线性关系以及正向与反向关系提高预测准确度。
具体的技术方案为:
融合季节ARIMA和BiLSTM的水利设施形变预测方法,在SARIMA-BiLSTM模型中,使用水电站引水涵洞实际形变监测数据进行缺失值补全、季节性分解以及平稳性检验,使用处理后的时序数据进行季节ARIMA建模得到原始数据线性部分的预测结果;将季节ARIMA模型预测结果与原数据求差得到残差,并将温度信息协变量共4个指标导入BiLSTM网络之中进行原始数据非线性部分的残差预测,最后将季节ARIMA模型的预测结果与BiLSTM网络残差预测结果进行叠加得到裂缝计开合度的预测值。
进一步的,具体包括以下步骤:
S1数据预处理
S1.1缺失值填充
单点位数据丢失利用监测序列时间维度相关的特性使用均值插值方法进行填充。
在一个测试点位有m个监测设备,单个传感器采集n个点,假设第i个监测设备的第j个值xij遗失(i≤m,j≤n),插值数值计算方法如式(1)所示。
S1.2时间序列的季节性分解与差分平稳化
在进行季节ARIMA建模前进行差分以消除序列中存在的季节性和趋势性,通过ADF检验来确定序列的平稳性,直到序列呈现平稳特征。
S2裂缝计开合度时序预测算法
S2.1季节ARIMA模型结构
把非平稳时间序列进行差分让序列变平稳,使用ARMA模型进行处理得到ARIMA模型,该模型表达式如式(2)所示:
y't=a+φ1y't-1+…+φpy't-p+θ1εt-1+…+θqεt-q+εt (2)
在上式中y't是通过差分后得到的趋于平稳的序列,它由以前时间点的误差数值和yt的观测值两部分组成。
ARIMA模型引入季节性成分后即建立季节ARIMA模型,p、d、q为模型的非季节性参数,P、D、Q为模型的季节性参数,对输入时间序列进行ADF检验来确保序列是平稳的,对于检验结果不平稳的序列需要进行差分直到满足平稳性要求,随后通过自相关与偏自相关图确定模型的最优参数,通过对模型进行模型及参数检验保证模型有效性。
S2.2 BiLSTM模型
双向长短期记忆网络依靠两个反方向的LSTM组合而成,即双向长短期记忆网络通过前向和后向两个方向进行数据信息读取,对两个方向得到的输出进行拼接的结果具有前后双向的信息特征表示。
S2.3融合SARIMA和BiLSTM预测模型
在SARIMA-BiLSTM模型中,将SARIMA模型的残差指标以及对开合度有重要影响的协变量作为BiLSTM神经网络的输入层;
主要流程如下:
(1)确定SARIMA(p1,d1,q1)×(p2,d2,q2,s)模型参数,根据前几步的差异次数,确定模型的差异次数为d1,从而将问题转化为ARMA模型参数的确定。然后,利用AIC最小信息化准则限制p1和q1的范围,然后将(p1,q1)的遍历方式代入AIC准则,找到一个值最小的组合。在确定了p1、d1、q1参数后构建模型再确定p2、d2、q2、s令混合模型AIC值最小,这就是模型的最优参数组合。
(2)根据最优组合参数构建SARIMA模型,训练模型,预测水利设施变形时间序列。然后得到预测值Lt,并计算残差序列et。
(3)对残差序列et和协变量数据进行归一化,生成新的训练数据集。对BiLSTM模型进行初始化,将生成的数据集输入网络进行训练,得到输出结果Nt作为残差的预测值,得到最后的预测值yt=Lt+Nt。
本发明提出了一种基于季节ARIMA和BiLSTM的组合模型进行水利设施形变数据地预测。对原始数据采用季节ARIMA模型进行预测得到时间序列的线性预测值,该模型在传统时间序列分析模型中具有较好的预测效果;季节ARIMA的预测结果与原序列的差值为残差,通过引入影响形变的关键指标对残差数据正向和反向同时学习来对未来某一时刻的残差值进行平滑预测,最后将线性部分与残差进行叠加,该模型在长期序列预测中表现较好。该模型可以充分利用两种模型的优点,然后利用BiLSTM模型强大的自学习能力来拟合两种模型之间的复杂关系,从而提高时序预测的准确度。
附图说明
图1为本发明的流程图;
图2为实施例的缺失值补全后数据;
图3为实施例的序列的季节性分解;
图4为实施例的一阶差分序列图;
图5为实施例的季节性ARIMA模型图;
图6为实施例的BiLSTM网络结构;
图7为实施例的裂缝计监测数据;
图8为实施例的直方图和估计密度;
图9为实施例的Q-Q图;
图10为实施例的自相关图;
图11为实施例的月平均温度;
图12为实施例的月最高温度;
图13为实施例的月最低温度;
图14为实施例的已有数据预测结果;
图15为实施例的未来三年预测结果;
图16为实施例的BP模型预测结果图;
图17为实施例的SARIMA模型预测结果;
图18为实施例的LSTM模型预测结果;
图19为实施例的分模型误差图;
图20为实施例的不确定度评估。
具体实施方式
结合实施例说明本发明的具体技术方案。
该复合模型的预测流程如图1所示,包括以下步骤:
S1数据预处理
S 1.1缺失值填充
在实际工程中数据采集大部分使用智能化采集设备。并且对于同一部位的不同点位安装多个监测设备。但是在实际运行当中,容易出现设备故障、信息传输出错的问题,因此会造成部分数据的丢失,在这一时刻的数据会变为零,这对于后续数据分析会造成较大不利影响。
监测数据的变化通常是迟缓的,单点位数据丢失可以充分利用监测序列时间维度相关的特性使用均值插值方法进行填充。
在一个测试点位有m个监测设备,单个传感器采集n个点,假设第i个监测设备的第j个值xij遗失(i≤m,j≤n),插值数值计算方法如式(1)所示。
对74以及76的位置进行缺失值补全后结果如图2所示,从图中可知进行数据补全后数据的整体变化规律不受影响且符合该组数据的局部特点,证明了该实验的有效性。
S 1.2时间序列的季节性分解与差分平稳化
水利设施检测序列具有非平稳的特点,因此在进行季节ARIMA建模前需要进行差分以消除序列中存在的季节性和趋势性,通过ADF检验来确定序列的平稳性,直到序列呈现平稳特征。
对原始序列进行季节性分解后如图3所示监测序列呈现出具有较为明显的季节性并且序列整体呈现下降趋势,因此需要对序列进行差分,如图4所示,由序列平稳的概念可知差分后的序列在0位置波动,可以认为该序列近似平稳。
S2裂缝计开合度时序预测算法
S2.1季节ARIMA模型结构
把非平稳时间序列进行差分可以让序列变平稳,使用ARMA模型进行处理可以得到ARIMA模型,该模型表达式如式(2)所示:
y't=a+φ1y't-1+…+φpy't-p+θ1εt-1+…+θqεt-q+εt (2)
在上式中y't是通过差分后得到的趋于平稳的序列,它由以前时间点的误差数值和yt的观测值两部分组成。
ARIMA模型引入季节性成分后即建立季节ARIMA模型,如图5所示,p、d、q为模型的非季节性参数,P、D、Q为模型的季节性参数,需要对输入时间序列进行ADF检验来确保序列是平稳的,对于检验结果不平稳的序列需要进行差分直到满足平稳性要求,随后通过自相关与偏自相关图确定模型的最优参数,通过对模型进行模型及参数检验保证模型有效性。
S 2.2 BiLSTM模型
LSTM能够通过各种门的控制学习到时序信息的特征信息,很好地解决了RNN网络梯度消失和梯度爆炸的问题,但是LSTM网络只能从输入的一个方向获取信息,而不能双向进行状态信息读取,但是双向长短期记忆网络能够弥补LSTM这方面的缺陷,双向长短期记忆网络依靠两个反方向的LSTM组合而成,其结构如图6所示,即双向长短期记忆网络通过前向和后向两个方向进行数据信息读取,对两个方向得到的输出进行拼接的结果具有前后双向的信息特征表示。
S 2.3融合SARIMA和BiLSTM预测模型
在预测水利设施变形时间序列时,单一的预测模型具有一定的局限性,因为该序列同时包含线性和非线性分量。组合模型是以科学的方式组合不同模型的复式模型。该模型既具有线性拟合能力,又具有非线性拟合能力,与单一模型相比,提高了预测精度。例如,天气信息在一定程度上也会作用于开合度变化。在SARIMA模型中,预测出的数据包含残差项,建立了BiLSTM模型可以更加准确的对开合度波动信息进行提取。基于上述原因,提出了一种基于ARIMA-BiLSTM的水利设施变形预测模型。在SARIMA-BiLSTM模型中,将SARIMA模型的残差指标以及对开合度有重要影响的协变量作为BiLSTM神经网络的输入层,如平均最高气温、平均最低气温以及平均温度。主要流程如下:
(1)确定SARIMA(p1,d1,q1)×(p2,d2,q2,s)模型参数,根据前几步的差异次数,可以确定模型的差异次数为d1,从而将问题转化为ARMA模型参数的确定。然后,利用AIC最小信息化准则限制p1和q1的范围,然后将(p1,q1)的遍历方式代入AIC准则,找到一个值最小的组合。在确定了p1、d1、q1参数后构建模型再确定p2、d2、q2、s令混合模型AIC值最小,这就是模型的最优参数组合。
(2)根据最优组合参数构建SARIMA模型,训练模型,预测水利设施变形时间序列。然后得到预测值Lt,并计算残差序列et。
(3)对残差序列et和协变量数据进行归一化,生成新的训练数据集。对BiLSTM模型进行初始化,将生成的数据集输入网络进行训练,得到输出结果Nt作为残差的预测值,得到最后的预测值yt=Lt+Nt。
本实施例数据取自某水电站4#引水涵洞2014年10至2020年10月的裂缝计监测数据,监测数据如图7所示。
1原序列平稳化验证
为了验证序列是否呈现平稳特征,对原始序列进行5%显著水平下的ADF单位根检验结果如表1所示。
表1序列ADF单位根检验
由ADF检验结果可知p-value值为0.780远大于5%,因此可以认定数据存在单位根不能拒绝原假设,所以原始监测数据是非平稳的。
为了检验对原始序列进行1阶12步差分后的序列平稳性,在5%的显著水平下单位根检验结果如表2所示。
表2差分序列ADF单位根检验
由表中结果可知p-value的值为0.016小于5%,因此可以判定时序数据中不存在单位根,拒绝原假设故而差分后的序列是平稳的。
2模型参数搜索
由图3可知裂缝计数据含有季节性成分,因此采用混合SARIMA(p1,d1,q1)×(p2,d2,q2,s)模型,时序数据明显呈现出以年为周期因此取s为12,采用赤池信息量准则(Akaikeinformation criterion,AIC)并通过网格搜索法进行参数搜索以求得使AIC最小的参数组合,分别确定参数p、d、q。设置各个参数的检索范围为p1、p2取0至4,d1、d2取0至2,q1取0至5,q2取0至2。分别进行两步参数搜索,参数搜索结果如表3,由表可知使得整体AIC值最小的参数组合和/>为(3,1,1)(3,1,1,12),因此可以得出效果最优的组合为SARIMA(3,1,1)×(3,1,1,12)。通过两阶段AIC值可以得出在初始ARIMA模型的基础上加入季节参数后AIC值明显减小,由此可得整体模型得到了较大地优化。
表3参数搜索结果
3模型检验
在建立了效果最优的SARIMA模型后对模型和参数进行了显著性检验,图8和图9显示残差信息已经和标准正态分布接近;图10可知残差所存在的相关性较低,对数据进行SARIMA模型拟合后的残差接近白噪声。
4模型检验
4.1环境因素数据预测
分别对某水电站2014年10月至2020年10月的平均温度、月最高温度、月最低温度进行季节ARIMA预测,得到2020年8月至2023年7月的相应预测数据,如图11至图13所示,将环境因素预测结果与裂缝计开合度残差导入BiLSTM网络中完成对开合度残差的预测。
4.2参数设置
将BiLSTM模型的学习率设置为0.001,batch_size设置为60,通过获取2020年8月至2023年7月SARIMA预测得到的开合度残差来进行残差预测,导入的数据中有4个变量,因此将模型输入设置为4,对残差信息输出因此将输出设置为1,以年为周期把学习步长设置为12,隐藏元维度设置为48,对训练集的训练次数设置为100。
5实验结果分析
求得SARIMA模型预测得出的2020年到2023年的预测结果与原始数据的差值作为残差以及三项温度数据的预测值作为BiLSTM模型的输入,得到未来三年的残差预测值并与SARIMA模型的预测值进行叠加作为SARIMA-BiLSTM模型的输出,如图14、图15所示。由图14至图18可知,SARIMA-BiLSTM模型预测结果的准确度要明显高于其它三个模型,从图中明显能够看出在2019年的7至9月份该组合模型对原始数据的拟合效果提升较大。并且该模型置信区间更窄,数据离散程度更小,从整体上来看预测结果与原始数据的趋势更加符合。
为了验证实验结果的准确性、更直观地表明各个模型的实际表现,分别对分模型的预测结果进行误差评估,分别采用均方误差、均方根误差和平均绝对误差指标对模型精度进行评价。由表4和图19可知,SARIMA-BiLSTM的MSE、RMSE、MAE的值分别为0.0153、0.1236、0.0924,相较于其它三个模型该复合模型的预测准确度最高,这也说明了该模型能够充分提取时间序列中的信息进行精准预测。
表5模型预测误差表
表6不同指标不确定度评估
为了进一步验证本模型对不同指标预测结果的不确定度,使用4#引水涵洞裂缝计开合度、渗透压力、应力指标数据进行预测,采用平均偏差与标准差对各个指标的预测结果进行评估,在95%置信水平下置信区间的计算公式为:其中μ为均值,σ为标准差,n为实验样本数量,实验结果如表5、图20所示,由实验结果可知各个指标的预测结果离散程度较小能较为精确、稳定的进行数据预测。
Claims (1)
1.融合季节ARIMA和BiLSTM的水利设施形变预测方法,其特征在于,包括以下步骤:在SARIMA-BiLSTM模型中,使用水电站引水涵洞实际形变监测数据进行缺失值补全、季节性分解以及平稳性检验,使用处理后的时序数据进行季节ARIMA建模得到原始数据线性部分的预测结果;将季节ARIMA模型预测结果与原数据求差得到残差,并将温度信息协变量导入BiLSTM网络之中进行原始数据非线性部分的残差预测,最后将季节ARIMA模型的预测结果与BiLSTM网络残差预测结果进行叠加得到裂缝计开合度的预测值;
具体包括以下步骤:
S1数据预处理
S1.1缺失值填充
单点位数据丢失利用监测序列时间维度相关的特性使用均值插值方法进行填充;
在一个测试点位有m个监测设备,单个传感器采集n个点,假设第i个监测设备的第j个值xij遗失,i≤m,j≤n,插值数值计算方法如式(1)所示;
S1.2时间序列的季节性分解与差分平稳化
在进行季节ARIMA建模前进行差分以消除序列中存在的季节性和趋势性,通过ADF检验来确定序列的平稳性,直到序列呈现平稳特征;
S2裂缝计开合度时序预测算法
S2.1季节ARIMA模型结构
把非平稳时间序列进行差分让序列变平稳,使用ARMA模型进行处理得到ARIMA模型,该模型表达式如式(2)所示:
y′t=a+φ1y′t-1+…+φpy′t-p+θ1εt-1+…+θqεt-q+εt (2)
在上式中y′t是通过差分后得到的趋于平稳的序列,它由以前时间点的误差数值和yt的观测值两部分组成;
ARIMA模型引入季节性成分后即建立季节ARIMA模型,p、d、q为模型的非季节性参数,P、D、Q为模型的季节性参数,对输入时间序列进行ADF检验来确保序列是平稳的,对于检验结果不平稳的序列需要进行差分直到满足平稳性要求,随后通过自相关与偏自相关图确定模型的最优参数,通过对模型进行模型及参数检验保证模型有效性;
S2.2 BiLSTM模型
双向长短期记忆网络依靠两个反方向的LSTM组合而成,即双向长短期记忆网络通过前向和后向两个方向进行数据信息读取,对两个方向得到的输出进行拼接的结果具有前后双向的信息特征表示;
S2.3融合SARIMA和BiLSTM预测模型
在SARIMA-BiLSTM模型中,将SARIMA模型的残差指标以及对开合度有重要影响的协变量作为BiLSTM神经网络的输入层进行预测;
S2.3包括以下步骤:
(1)确定SARIMA(p1,d1,q1)×(p2,d2,q2,s)模型参数,根据前几步的差异次数,确定模型的差异次数为d1,从而将问题转化为ARMA模型参数的确定;然后,利用AIC最小信息化准则限制p1和q1的范围,然后将(p1,q1)的遍历方式代入AIC准则,找到一个值最小的组合;在确定了p1、d1、q1参数后构建模型再确定p2、d2、q2、s令混合模型AIC值最小,这就是模型的最优参数组合;
(2)根据最优组合参数构建SARIMA模型,训练模型,预测水利设施变形时间序列;然后得到预测值Lt,并计算残差序列et;
(3)对残差序列et和协变量数据进行归一化,生成新的训练数据集;对BiLSTM模型进行初始化,将生成的数据集输入网络进行训练,得到输出结果Nt作为残差的预测值,得到最后的预测值yt=Lt+Nt。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210406662.3A CN114692993B (zh) | 2022-04-18 | 2022-04-18 | 融合季节ARIMA和BiLSTM的水利设施形变预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210406662.3A CN114692993B (zh) | 2022-04-18 | 2022-04-18 | 融合季节ARIMA和BiLSTM的水利设施形变预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114692993A CN114692993A (zh) | 2022-07-01 |
CN114692993B true CN114692993B (zh) | 2024-06-04 |
Family
ID=82143033
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210406662.3A Active CN114692993B (zh) | 2022-04-18 | 2022-04-18 | 融合季节ARIMA和BiLSTM的水利设施形变预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114692993B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115545112B (zh) * | 2022-10-17 | 2023-05-30 | 水利部信息中心 | 一种大量地下水实时自动监测数据自动识别和处理的方法 |
CN117009754A (zh) * | 2023-09-20 | 2023-11-07 | 中交四航局第一工程有限公司 | 一种下穿隧道施工期间对上部既有桥梁桩基的安全预警监控方法 |
CN117633494A (zh) * | 2023-11-20 | 2024-03-01 | 中国矿业大学 | 一种基于awc-lstm模型的煤矿地表形变预测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1182212A (zh) * | 1997-11-05 | 1998-05-20 | 中国水利水电科学研究院工程安全监测中心 | 土坝渗流通道及水库大坝地质隐患探查系统 |
AU2020102350A4 (en) * | 2020-09-21 | 2020-10-29 | Guizhou Minzu University | A Spark-Based Deep Learning Method for Data-Driven Traffic Flow Forecasting |
CN112598170A (zh) * | 2020-12-18 | 2021-04-02 | 中国科学技术大学 | 基于多组件融合时间网络的车辆尾气排放预测方法及系统 |
CN113516845A (zh) * | 2021-04-27 | 2021-10-19 | 中南大学 | 基于sarima-nar组合模型的道路月度交通量预测方法 |
CN114037138A (zh) * | 2021-11-04 | 2022-02-11 | 南京地铁建设有限责任公司 | 基于双层分解和深度学习的地铁短时进站客流预测系统及实施方法 |
-
2022
- 2022-04-18 CN CN202210406662.3A patent/CN114692993B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1182212A (zh) * | 1997-11-05 | 1998-05-20 | 中国水利水电科学研究院工程安全监测中心 | 土坝渗流通道及水库大坝地质隐患探查系统 |
AU2020102350A4 (en) * | 2020-09-21 | 2020-10-29 | Guizhou Minzu University | A Spark-Based Deep Learning Method for Data-Driven Traffic Flow Forecasting |
CN112598170A (zh) * | 2020-12-18 | 2021-04-02 | 中国科学技术大学 | 基于多组件融合时间网络的车辆尾气排放预测方法及系统 |
CN113516845A (zh) * | 2021-04-27 | 2021-10-19 | 中南大学 | 基于sarima-nar组合模型的道路月度交通量预测方法 |
CN114037138A (zh) * | 2021-11-04 | 2022-02-11 | 南京地铁建设有限责任公司 | 基于双层分解和深度学习的地铁短时进站客流预测系统及实施方法 |
Non-Patent Citations (1)
Title |
---|
基于多源数据融合的水利设施安全状态预测及评估;唐帅;《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》;20230115;第C037-127页 * |
Also Published As
Publication number | Publication date |
---|---|
CN114692993A (zh) | 2022-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114692993B (zh) | 融合季节ARIMA和BiLSTM的水利设施形变预测方法 | |
CN103592374B (zh) | 一种基于d-s证据理论的变压器油色谱数据预测方法 | |
CN111695521B (zh) | 一种基于Attention-LSTM的滚动轴承性能衰退预测方法 | |
Zhang et al. | Automatic deep extraction of robust dynamic features for industrial big data modeling and soft sensor application | |
CN115758290A (zh) | 一种基于lstm的风机齿轮箱高速轴温度趋势预警方法 | |
CN116245261B (zh) | 一种基于时序分布适配的风场风速预测方法 | |
CN115688579A (zh) | 一种基于生成对抗网络的流域多点水位预测预警方法 | |
CN116342657B (zh) | 一种基于编码-解码结构的tcn-gru船舶轨迹预测方法、系统、设备及介质 | |
CN111242351A (zh) | 基于自编码器和gru神经网络的热带气旋轨迹预测方法 | |
CN116415705A (zh) | 一种多因素水位预测方法、装置、电子设备和计算机介质 | |
CN112731890A (zh) | 一种电厂设备故障的检测方法和装置 | |
CN112735541A (zh) | 一种基于简单循环单元神经网络的污水处理水质预测方法 | |
CN115169724A (zh) | 一种基于时空图卷积神经网络的径流预测方法 | |
CN114781744A (zh) | 基于编码解码器的深度学习多步长辐照度预测方法 | |
CN116050281A (zh) | 一种基坑变形监测方法及系统 | |
CN117371543A (zh) | 一种基于时序扩散概率模型的增强软测量方法 | |
CN117313201A (zh) | 考虑堆石坝多测点复杂关联性时空融合的变形预测方法及系统 | |
CN117154680A (zh) | 一种基于非平稳Transformer模型的风电功率预测方法 | |
CN117171713A (zh) | 一种基于轴承寿命的交叉自适应深度迁移学习方法及系统 | |
CN116596169A (zh) | 一种电力系统预测方法、装置及存储介质 | |
CN116756498A (zh) | 一种基于lstm和分位数回归的径流概率预测算法 | |
CN113792919B (zh) | 一种基于迁移学习深度学习相结合的风电功率预测方法 | |
CN116070768A (zh) | 一种基于数据重构和TCN-BiLSTM的短期风电功率预测方法 | |
CN114510469A (zh) | 电力系统不良数据辨识方法、装置、设备及介质 | |
CN113780356A (zh) | 基于集成学习模型的水质预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |