CN112879024B - 一种盾构姿态动态预测方法、系统及设备 - Google Patents
一种盾构姿态动态预测方法、系统及设备 Download PDFInfo
- Publication number
- CN112879024B CN112879024B CN202110093904.3A CN202110093904A CN112879024B CN 112879024 B CN112879024 B CN 112879024B CN 202110093904 A CN202110093904 A CN 202110093904A CN 112879024 B CN112879024 B CN 112879024B
- Authority
- CN
- China
- Prior art keywords
- shield
- model
- layer
- prediction model
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000012549 training Methods 0.000 claims abstract description 97
- 230000002457 bidirectional effect Effects 0.000 claims abstract description 71
- 230000007246 mechanism Effects 0.000 claims abstract description 24
- 238000012360 testing method Methods 0.000 claims description 47
- 239000013598 vector Substances 0.000 claims description 47
- 230000014509 gene expression Effects 0.000 claims description 29
- 238000010276 construction Methods 0.000 claims description 28
- 230000015654 memory Effects 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 20
- 239000011159 matrix material Substances 0.000 claims description 14
- 230000002159 abnormal effect Effects 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 11
- 238000005457 optimization Methods 0.000 claims description 11
- 238000012795 verification Methods 0.000 claims description 9
- 238000012952 Resampling Methods 0.000 claims description 7
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 7
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 6
- 238000010998 test method Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000005641 tunneling Effects 0.000 description 25
- 239000002689 soil Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 241000512668 Eunectes Species 0.000 description 1
- 241000270295 Serpentes Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- 230000001808 coupling effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- E—FIXED CONSTRUCTIONS
- E21—EARTH OR ROCK DRILLING; MINING
- E21D—SHAFTS; TUNNELS; GALLERIES; LARGE UNDERGROUND CHAMBERS
- E21D9/00—Tunnels or galleries, with or without linings; Methods or apparatus for making thereof; Layout of tunnels or galleries
- E21D9/06—Making by using a driving shield, i.e. advanced by pushing means bearing against the already placed lining
- E21D9/093—Control of the driving shield, e.g. of the hydraulic advancing cylinders
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mining & Mineral Resources (AREA)
- Geochemistry & Mineralogy (AREA)
- General Life Sciences & Earth Sciences (AREA)
- Geology (AREA)
- Environmental & Geological Engineering (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种盾构姿态动态预测方法、系统及设备,包括构建盾构姿态预测模型;其中,盾构姿态预测模型采用双向LSTM‑Attention盾构姿态预测模型;获取样本数据集,对盾构姿态预测模型进行训练;将待预测时间段之前的一个时间段的盾构姿态数据,输入至训练后的盾构姿态模型,得到盾构姿态动态预测结果;本发明采用双向LSTM构建考虑姿态数据流演化规律的预测模型,引入注意力机制进行赋权处理,通过加权求和的方式输出最终预测结果;实现了在盾构姿态预测时同时利用过去时刻和未来时刻的姿态数据实现正、反双向数据流学习,并对隐含层各个节点的输出结果进行重要度区分,进而能够达到更高精度的盾构姿态预测,有效提高了模型的预测精度。
Description
技术领域
本发明属于盾构施工技术领域,特别涉及一种盾构姿态动态预测方法、系统及设备。
背景技术
盾构法施工因其具有掘进速度快、对地面交通影响较小及对自然环境危害较小等优势,在城市地铁建设过程中被广泛使用;盾构法施工主要是依靠盾构机向前掘进、刀盘切削土体、土仓内土体与掌子面水土压力平衡、盾尾管片拼装和同步注浆来形成整条隧道。在施工过程中,盾构机需沿隧道设计轴线向前掘进,但由于待掘进前方地层的不确定性、盾构司机操作水平的差异性及盾构机因自重导致的不良自稳性等原因,使得盾构掘进轴线往往与隧道设计轴线之间存在一定偏差,进而导致盾构机在实际施工过程中沿“蛇形”运动;当偏差较大时,可能会导致土体超挖、地面沉降及坍塌、地下管线的不均匀沉降等施工风险的发生,严重时甚至需要重新设计隧道轴线,带来了巨大的经济损失。因而,对盾构姿态进行科学合理控制十分关键;盾构姿态的预测能够帮助现场施工人员事先获取盾构姿态的演化规律,对于及时有效的进行姿态控制具有至关重要的作用。
中国专利申请“一种基于XGBoost的盾构掘进参数特征提取与姿态偏差预测方法”(公开号:CN111365015A)中,将数据分析和专家经验相结合进行影响盾构姿态的掘进参数特征选择,进而以特征提取后的掘进参数为输入、以盾构姿态参数为输出构建了基于XGBoost的盾构姿态偏差预测模型;中国专利申请“基于混合深度学习的盾构掘进位姿智能预测方法及系统”(公开号:CN110195592A)中,将若干影响盾构位姿的掘进参数作为输入变量、盾构位姿参数作为输出变量构建了基于WCNN-LSTM的盾构位姿混合深度学习预测模型。
上述公开文件中,所公开的盾构姿态预测方法均是从盾构姿态影响因素和盾构姿态响应参数之间的耦合作用出发,构建影响因素为输入、姿态响应参数为输出的预测模型;这种建模方式下确定合理的影响因素是保障模型预测精度的关键环节之一,但由于盾构掘进过程中影响姿态的因素较多、部分影响因素的实际施工数据获取困难等原因,会在一定程度上影响模型的预测精度;上述公开文件采用的XGBoost、长短期记忆神经网络等预测算法仅仅对过去时刻的信息(正向、单向数据流)加以利用来进行姿态预测,尚未同时融合过去和未来的时刻信息(正、反双向数据流)进行预测,导致其所构建的盾构姿态预测模型精度不高;同时,在构建盾构姿态预测模型时,隐含层单元输出的各个向量没有进行重要度区分,模型无法突出影响预测结果的重要信息;对于实际工程而言,不同时序数据对姿态预测结果的影响程度是不同的,因此,模型训练后从隐含层输出不作重要度区分式的预测其精度会受影响。
发明内容
针对现有技术中存在的技术问题,本发明提供了一种盾构姿态动态预测方法、系统及设备,以解决现有的盾构预测过程,预测模型的精度较低的技术问题。
为达到上述目的,本发明采用的技术方案为:
本发明提供了一种盾构姿态动态预测方法,包括以下步骤:
构建盾构姿态预测模型;其中,盾构姿态预测模型采用双向LSTM-Attention盾构姿态预测模型;
确定盾构姿态预测模型的输入参数和输出参数;其中,输入参数为过去t时刻至t-k1时刻盾构姿态数据;输出参数为未来t+1时刻至t+k2时刻对应的盾构姿态数据;
获取样本数据集,并将样本数据集划分为训练集和测试集;
利用训练集对盾构姿态预测模型进行训练,利用测试集对训练后的盾构姿态预测模型进行测试,得到训练好的盾构姿态预测模型;
将待预测时间段之前的k1+1个时刻的盾构姿态数据,输入至训练后的盾构姿态模型中,进行预测,得到待预测时间段的盾构姿态数据,即得到盾构姿态动态预测结果。
进一步的,双向LSTM-Attention盾构姿态预测模型包括输入层、隐含层及输出层;
其中,隐含层双向LSTM层、Attention层和Dense层;双向LSTM层,利用前向LSTM和后向LSTM对输入层发送的数据进行训练,得到两个相反时间序列的隐含层状态,并将两个相反的时序隐含层状态连接,得到双向LSTM层的每个时序对应的输出向量;Attention层,对双向LSTM层的每个时序对应的输出向量,进行赋权并求和,得到注意力机制赋权后的输出向量;Dense层为全连接层,用于将注意力机制赋权后的输出向量转换为模型输出变量的维度,发送至输出层,输出层输出模型的预测结果。
进一步的,两个相反时间序列的隐含层状态包括时序前向隐含层状态和时序后向隐含层状态;其中,前向LSTM和后向LSTM分别引入门机制,包括输入门、输出门及遗忘门;
其中,时序前向隐含层状态的表达式为:
其中,Ht-1为t-1时刻时序前向隐含层状态,Ht-2为t-2时刻时序前向隐含层状态,Xt-1为t-1时刻的输入参数,Ct-2为t-2时刻的记忆细胞;
时序后向隐含层状态的表达式为:
其中,Ht-1为t-1时刻时许后向隐含层状态,Ht为t时刻时序后向隐含层状态,Ct为t时刻的记忆细胞;
双向LSTM层t-1时刻的隐含层状态Ht-1的表达式为:
双向LSTM层t时刻的输出向量的表达式为:
O t=σ(XtWxo+Ht-1Who+bo)
Ht=Ot tanh(Ct)
Ft=σ(XtWxf+Ht-1Whf+bf)
It=σ(XtWxi+Ht-1Whi+bi)
其中,Ot为双向LSTM层t时刻的输出向量;It为双向LSTM层t时刻的输入向量;Ft为双向LSTM层t时刻的遗忘信息;为候选记忆细胞;⊙为矩阵乘法;σ为Sigmoid函数;Wxi、Wxf、Wxo、Wxc∈Rd×h和Whi、Whf、Who、Whc∈Rh×h均为权重参数,bi、bf、bo、bc∈R1×h为偏差参数;
注意力机制赋权后的输出向量的表达式为:
et=σ(WOt+b)
其中,W为权值矩阵,b为偏置矩阵,σ为Sigmoid函数,et为通过BP神经网络转换之后的输出向量,αt为各个输出向量占最终输出向量的权重。
进一步的,盾构预测模型的输入参数的表达式为:
{Yt+m-k1-k2-1,Yt+m-k1-k2-2,L,Yt+m-2k1-k2}
其中,m为第m个时刻,m=1,2,…,l;l为样本容量对应的时刻数,即l=n;
盾构预测模型的输出参数的表达式为:
{Yt+m-1-k1,Yt+m-2-k1,L,Yt+m-k1-k2}。
进一步的,获取样本数据集过程如下:
获取盾构施工过程的姿态数据集;其中,姿态姿态数据集为俯仰角、横摆角或滚动角;
采用箱形图法,对姿态信息的数据异常进行识别,并采用线性内插法,进行数据异常值替换及数据缺失值充填,得到预处理后的数据集;并按预设频率对预处理后的数据集进行重采样,得到重采样后的数据集;
根据样本数据集的预设容量,采用滑动窗口从重采样后的数据集中,选取对应的姿态数据,得到样本数据集。
进一步的,获取训练好的盾构姿态预测模型过程如下:
确定盾构姿态预测模型中的模型超参数;
采用试验法,确定模型超参数的取值范围;
利用训练集,采用交叉验证网格搜索方式,在模型超参数的取值范围内,进行超参数寻优,得到最优的超参数组合;
利用最优的超参数组合及训练集,对盾构姿态预测模型进行训练,得到训练后的盾构姿态预测模型;
利用测试集,对训练后的盾构姿态模型进行测试;将实测数据与预测结果进行对比,若偏差符合预设要求,则训练完毕,得到训练好的盾构姿态预测模型;否则,调整模型超参数,重新进行模型训练;
其中,模型训练误差评定标准为预测结果和实测数据的均方误差MSE及相关系数R2,模型优化算法为Adam算法;
当盾构姿态预测模型在训练集上的预测结果和实测数据的均方误差MSE<10-3,则训练后的盾构姿态预测模型训练完成;
当训练后的盾构姿态预测模型在测试集上的预测结果和实测数据的均方误差MSE<5%且相关系数R2>0.90时,则训练好的盾构姿态预测模型训练完成。
进一步的,模型超参数包括双向LSTM层节点数、Dense层节点数、模型迭代次数及学习率。
进一步的,预测结果和实测数据的均方误差MSE及相关系数R2的表达式分别为:
其中,yij为预测结果,Yij为实测数据,i为第i个样本,j为第j个时刻的预测值。
本发明还提供了一种盾构姿态动态预测系统,包括建模模块、参数模块、样本模块、训练模块及预测模块;
建模模块,用于构建盾构姿态预测模型;其中,盾构姿态预测模型采用双向LSTM-Attention盾构姿态预测模型;参数模块,用于确定盾构姿态预测模型的输入参数和输出参数;其中,输入参数为过去t时刻至t-k1时刻某个或多个盾构姿态数据;输出参数为未来t+1时刻至t+k2时刻对应的盾构姿态数据;样本模块,用于获取样本数据集,并将样本数据集划分为训练集和测试集;训练模块,用于利用训练集对盾构姿态预测模型进行训练,利用测试集对训练后的盾构姿态预测模型进行测试,得到训练好的盾构姿态预测模型;预测模块,用于将待预测时间段之前的k1+1个时刻的盾构姿态数据,输入至训练后的盾构姿态模型中,进行预测,得到待预测时间段的盾构姿态数据,即得到盾构姿态动态预测结果。
本发明还提供了一种盾构姿态动态预测设备,包括存储器、处理器及存储在所述存储器中并可在所述处理器中运行的可执行指令;所述处理器执行所述可执行指令时实现所述盾构姿态动态预测方法。
与现有技术相比,本发明的有益效果为:
本发明提供了一种盾构姿态动态预测方法、系统及设备,采用双向LSTM算法来构建盾构姿态预测模型,实现了预测姿态时同时考虑过去时刻和未来时刻从正、反双向数据流来刻画盾构姿态的演化情况,能够进行更为准确的姿态预测;采用双向LSTM算法进行盾构姿态预测,能够解决应用循环神经网络时出现的梯度衰减问题,可以提高预测的准确性;在构建双向LSTM预测模型的基础上引入了Attention机制,能够对隐含层各个节点的输出结果通过赋权的方式进行重要度区分,进而提高模型的预测精度;构建盾构姿态多步动态预测模型,能够实现对未来连续多个时刻的预测,有助于辅助现场施工人员把握未来一段时间的姿态演化趋势,相较于单时刻预测而言,其预测的应用价值更大;该预测方法能够弥补既有盾构姿态预测方法无法在预测时对未来信息加以考虑的不足。
本发明所述的预测方法、系统及设备,主要是基于实际施工过程中获得的盾构掘进姿态数据,采用双向长短期记忆神经网络构建考虑姿态数据流演化规律的动态多步深度学习预测模型,并引入注意力机制对隐含层各个节点的输出向量进行赋权处理,并通过加权求和的方式输出最终预测结果;通过双向LSTM-Attention算法实现了在盾构姿态预测时同时利用过去时刻和未来时刻的姿态数据实现正、反双向数据流学习,并对隐含层各个节点的输出结果进行重要度区分,进而能够达到更高精度的盾构姿态预测。
附图说明
图1为本发明所述的盾构姿态动态预测方法的工作流程图;
图2为本发明中的基于滑动窗口的模型样本集构建过程示意图;
图3为本发明中的双向LSTM-Attention网络结构图。
具体实施方式
为了使本发明所解决的技术问题,技术方案及有益效果更加清楚明白,以下具体实施例,对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如附图1所示,本发明提供了一种盾构姿态动态预测方法,包括以下步骤:
构建盾构姿态预测模型;其中,盾构姿态预测模型采用双向LSTM-Attention盾构姿态预测模型;双向LSTM-Attention盾构姿态预测模型包括输入层、隐含层及输出层。
其中,隐含层双向LSTM层、Attention层和Dense层;双向LSTM层,利用前向LSTM和后向LSTM对输入层发送的数据进行训练,得到两个相反时间序列的隐含层状态,并将两个相反的时序隐含层状态连接,得到双向LSTM层的每个时序对应的输出向量;Attention层,对双向LSTM层的每个时序对应的输出向量,进行赋权并求和,得到注意力机制赋权后的输出向量;Dense层为全连接层,用于将注意力机制赋权后的输出向量转换为模型输出变量的维度,发送至输出层,输出层输出模型的预测结果。
两个相反的时序隐含层状态包括时序前向隐含层状态和时序后向隐含层状态;其中,前向LSTM和后向LSTM分别引入门机制,包括输入门、输出门及遗忘门;
其中,时序前向隐含层状态的表达式为:
其中,Ht-1为t-1时刻时序前向隐含层状态,Ht-2为t-2时刻时序前向隐含层状态,Xt-1为t-1时刻的输入参数,Ct-2为t-2时刻的记忆细胞。
其中,Ht-1为t-1时刻时许后向隐含层状态,Ht为t时刻时序后向隐含层状态,Ct为t时刻的记忆细胞。
双向LSTM层t-1时刻的隐含层状态Ht-1的表达式为:
双向LSTM层t时刻的输出向量的表达式为:
O t=σ(XtWxo+Ht-1Who+bo)
Ht=Ot tanh(Ct)
Ft=σ(XtWxf+Ht-1Whf+bf)
It=σ(XtWxi+Ht-1Whi+bi)
其中,Ot为双向LSTM层t时刻的输出向量;It为双向LSTM层t时刻的输入向量;Ft为双向LSTM层t时刻的遗忘信息;为候选记忆细胞;⊙为矩阵乘法;σ为Sigmoid函数;Wxi、Wxf、Wxo、Wxc∈Rd×h和Whi、Whf、Who、Whc∈Rh×h均为权重参数,bi、bf、bo、bc∈R1×h为偏差参数。
注意力机制赋权后的输出向量的表达式为:
et=σ(WOt+b)
其中,W为权值矩阵,b为偏置矩阵,σ为Sigmoid函数,et为通过BP神经网络转换之后的输出向量,αt为各个输出向量占最终输出向量的权重。
确定盾构姿态预测模型的输入参数和输出参数;其中,输入参数为过去t时刻至t-k1时刻盾构姿态数据;输出参数为未来t+1时刻至t+k2时刻对应的盾构姿态数据。
盾构预测模型的输入参数的表达式为:
{Yt+m-k1-k2-1,Yt+m-k1-k2-2,L,Yt+m-2k1-k2}
其中,m为第m个时刻,m=1,2,…,l;l为样本容量对应的时刻数,即l=n;
盾构预测模型的输出参数的表达式为:
{Yt+m-1-k1,Yt+m-2-k1,L,Yt+m-k1-k2}。
获取样本数据集,并将样本数据集划分为训练集和测试集;其中,获取样本数据集过程如下:
获取盾构施工过程的姿态信息;其中,姿态信息为俯仰角、横摆角或滚动角。
采用箱形图法,对姿态信息的数据异常进行识别,并采用线性内插法,进行数据异常值替换及数据缺失值充填,得到预处理后的数据集;并按预设频率对预处理后的数据集进行重采样,得到重采样后的数据集。
根据样本数据集的预设容量,采用滑动窗口从重采样后的数据集中,选取对应的姿态数据,得到样本数据集。
利用训练集对盾构姿态预测模型进行训练,利用测试集对训练后的盾构姿态预测模型进行测试,得到训练好的盾构姿态预测模型;具体过程如下:
确定盾构姿态预测模型中的模型超参数;优选的,模型超参数包括双向LSTM层节点数、Dense层节点数、模型迭代次数及学习率。
采用试验法,确定模型超参数的取值范围;利用训练集,采用交叉验证网格搜索方式,在模型超参数的取值范围内,进行超参数寻优,得到最优的超参数组合;利用最优的超参数组合及训练集,对盾构姿态预测模型进行训练,得到训练后的盾构姿态预测模型。
利用测试集,对训练后的盾构姿态模型进行测试;将实测数据与预测结果进行对比,若偏差符合预设要求,则训练完毕,得到训练好的盾构姿态预测模型;否则,调整模型超参数,重新进行模型训练。
其中,模型训练误差评定标准为预测结果和实测数据的均方误差MSE及相关系数R2,模型优化算法为Adam算法。
当盾构姿态预测模型在训练集上的预测结果和实测数据的均方误差MSE<10-3,则训练后的盾构姿态预测模型训练完成。
当训练后的盾构姿态预测模型在测试集上的预测结果和实测数据的均方误差MSE<5%且相关系数R2>0.90时,则训练好的盾构姿态预测模型训练完成。
预测结果和实测数据的均方误差MSE及相关系数R2的表达式分别为:
其中,yij为模型预测值,Yij为工程实测值,i为第i个样本,j为第j个时刻的预测值。
将待预测时间段之前的k1+1个时刻的盾构姿态数据,输入至训练后的盾构姿态模型中,进行预测,得到待预测时间段的盾构姿态数据,即得到盾构姿态动态预测结果;本发明中,将待预测时间段之前的k1+1个时刻作为预测模型的输入变量,输入至训练好的盾构姿态预测模型中得到输出变量,即得到待预测时间段的盾构姿态数据,进而实现盾构姿态的动态预测结果;此处的预测特征是盾构姿态数据,例如:预测俯仰角时,采用在预测模型中输入过去k1+1个时刻的俯仰角数据,然后用训练好的盾构姿态预测模型去预测未来k2个时刻的俯仰角数据。
本发明还提供了一种盾构姿态动态预测系统,包括建模模块、参数模块、样本模块、训练模块及预测模块;
建模模块,用于构建盾构姿态预测模型;其中,盾构姿态预测模型采用双向LSTM-Attention盾构姿态预测模型;参数模块,用于确定盾构姿态预测模型的输入参数和输出参数;其中,输入参数为过去t时刻至t-k1时刻某个或多个盾构姿态数据;输出参数为未来t+1时刻至t+k2时刻对应的盾构姿态数据;样本模块,用于获取样本数据集,并将样本数据集划分为训练集和测试集;训练模块,用于利用训练集对盾构姿态预测模型进行训练,利用测试集对训练后的盾构姿态预测模型进行测试,得到训练好的盾构姿态预测模型;预测模块,用于将待预测时间段之前的k1+1个时刻的盾构姿态数据,输入至训练后的盾构姿态模型中,进行预测,得到待预测时间段的盾构姿态数据,即得到盾构姿态动态预测结果。
本发明还提供了一种盾构姿态动态预测设备,包括存储器、处理器及存储在所述存储器中并可在所述处理器中运行的可执行指令;所述处理器执行所述可执行指令时实现如下步骤:构建盾构姿态预测模型;其中,盾构姿态预测模型采用双向LSTM-Attention盾构姿态预测模型;参数模块,用于确定盾构姿态预测模型的输入参数和输出参数;其中,输入参数为过去t时刻至t-k1时刻某个或多个盾构姿态数据;输出参数为未来t+1时刻至t+k2时刻对应的盾构姿态数据;样本模块,用于获取样本数据集,并将样本数据集划分为训练集和测试集;训练模块,用于利用训练集对盾构姿态预测模型进行训练,利用测试集对训练后的盾构姿态预测模型进行测试,得到训练好的盾构姿态预测模型;预测模块,用于将待预测时间段之前的k1+1个时刻的盾构姿态数据,输入至训练后的盾构姿态模型中,进行预测,得到待预测时间段的盾构姿态数据,即得到盾构姿态动态预测结果。
本发明所述的一种盾构姿态动态预测系统及设备中相关部分的说明可以参见本发明所述的一种盾构姿态动态预测方法中对应部分的详细说明,在此不再赘述。
实施例
如附图1所示,本实施例提供了一种盾构姿态动态预测方法,包括以下步骤:
步骤1、姿态数据采集、预处理
从盾构机PLC系统上获取盾构施工过程中的盾构姿态数据,包括俯仰角Y1、横摆角Y2或滚动角Y3;盾构施工在地下进行,其施工环境较为恶劣,传感器等数据监测设备可能会由于操作人员误碰、其他施工设备误撞或盾构机掘进振动等原因而出现故障,致使采集到的盾构姿态数据存在异常数据和缺失数据。
本实施例中,为了保障盾构姿态预测的精度,在建模预测之前,首先对采集到的盾构数据进行预处理;采用箱形图法进行数据异常值识别,其中,箱形图法如式(1)所示;并采用线性内插的方式进行异常值替换和缺失值填充,以获得预处理后的数据集。
其中,U为上四分位数、L为下四分位数;IQR=U-L;Upper为上界,Lower为下界;当姿态数据大于Upper或小于Lower时,则判定为异常数据。
步骤2、数据重采样
盾构机PLC系统的数据采集频率为5s/次,较高的采集频率下,盾构姿态数据的变动较小,基于上述采集频率进行样本数据的收集,对于建模而言不仅无法提高模型的预测精度,同时会致使模型预测效率降低;因此,本实施例将从盾构机PLC系统中获取到的姿态数据进行重采样;具体的,按照设定采集频率为每隔3min,对预处理后的数据集进行一次重采样,得到重采样后的数据集,其为容量为n的预处理数据集;其中,n为预设重采样数据集的容量。
步骤3、确定预测模型的输入和输出参数,构建样本数据集
从盾构姿态演化趋势分析的角度出发,进行姿态预测模型的构建;即利用过去t时刻至t-k1时刻盾构姿态数据对未来的t+1时刻至t+k2时刻对应的盾构姿态数据进行预测,如式(2)所示。
其中,Y1 t,Y1 t-1,L,Y1 t-k1为用于俯仰角的预测模型的输入参数,Y1 t+k2,Y1 t+k2-1,L,Y1 t +1为用于俯仰角的预测模型的输出参数;为用于横摆角的预测模型的输入参数,为用于横摆角的预测模型的输出参数;为用于滚动角的预测模型的输入参数,为用于滚动角的预测模型的输出参数。
如图2所示,为实现数据资源的有效利用,本实施例采用滑动窗口的方式来建立模型的样本数据集;其中,窗口宽度w=k1+1,滑动步长为s=1,预测步长为k2。
基于附图2所示的的基于滑动窗口的样本数据集的构建方法,本实施例所构建的盾构姿态预测模型的样本数据集如式(3)所示;
其中,三个姿态参数的预测模型,其构建的样本数据集的容量Q均为n-k2-w+1,即n-k2-k1+2;a为第a个预测模型,即a=1,2或3,分别对应俯仰角Y1预测模型、横摆角Y2预测模型或滚动角Y3预测模型。
步骤4、划分训练集和测试集
为实现预测模型的训练和测试,将样本数据集按照8:2的比例划分训练集和测试集;考虑到训练集和测试集的取整问题,本实施例将俯仰角Y1预测模型、横摆角Y2预测模型及滚动角Y3预测模型的训练集容量均设定为int(0.8Q),测试集容量均设定为Q-int(0.8Q)。
步骤5,构建盾构姿态预测模型
本实施例中,构建双向LSTM-Attention盾构姿态预测模型,具体包括以下步骤:
1)双向LSTM-Attention盾构姿态预测模型的运行机理
双向LSTM(Bi-directional Long Short-Term Memory,Bi-LSTM)-Attention盾构姿态预测模型同时考虑了姿态数据的正向、反向数据流演化规律,并在此基础上引入注意力机制对隐含层各个节点输出结果通过赋权进行重要度区分,具有更高精度的预测效果;其运行机理是设定一个前向LSTM、一个后向LSTM以得到两个相反时序的隐含层状态,将二者连接进而得到一个输出,并对各个隐含层节点的输出向量通过注意力机制层进行赋权并求和进而得到最终输出。其中,前向LSTM及后向LSTM均通过引入门机制,包括输入门、输出门和遗忘门,来实现过去信息的选择性记忆与遗忘,能够解决循环神经网络模型运行过程中出现的梯度衰减问题;前向LSTM能够获取到输入时间序列的未来信息,相应的后向LSTM能够获取到输入时间序列的过去信息。
基于此,双向LSTM模型通过前向LSTM和后向LSTM实现了对姿态数据的过去信息和未来信息的融合,进而从正向、反向两个方向更加准确的把握了姿态数据的演化规律,能够实现更为精准的姿态预测;引入注意力机制是为了对各个隐含层节点进行重要度区分,相应的网络结构图如图3所示,其运算方式为:
时序前向隐含层状态的表达式为:
其中,Ht-1为t-1时刻时序前向隐含层状态,Ht-2为t-2时刻时序前向隐含层状态,Xt-1为t-1时刻的输入参数,Ct-2为t-2时刻的记忆细胞。
时序后向隐含层状态的表达式为:
其中,Ht-1为t-1时刻时许后向隐含层状态,Ht为t时刻时序后向隐含层状态,Ct为t时刻的记忆细胞;
双向LSTM层t-1时刻的隐含层状态Ht-1的表达式为:
双向LSTM层t时刻的输出向量的表达式为:
O1=σ(XtWxo+Ht-1Who+bo) (7)
Ht=Ot tanh(Ct) (8)
Ft=σ(XtWxf+Ht-1Whf+bf) (11)
It=σ(XtWxi+Ht-1Whi+bi) (12)
其中,Ot为双向LSTM层t时刻的输出向量;It为双向LSTM层t时刻的输入向量;Ft为双向LSTM层t时刻的遗忘信息;为候选记忆细胞;⊙为矩阵乘法;σ为Sigmoid函数;Wxi、Wxf、Wxo、Wxc∈Rd×h和Whi、Whf、Who、Whc∈Rh×h均为权重参数,bi、bf、bo、bc∈R1×h为偏差参数;h为隐藏单元个数,d为输入变量维度;σ为Sigmoid函数,σ和tanh分别为激活函数。
注意力机制赋权后的输出向量的表达式为:
et=σ(WOt+b)(15)
其中,W为权值矩阵,b为偏置矩阵,σ为Sigmoid函数,et为通过BP神经网络转换之后的输出向量,αt为各个输出向量占最终输出向量的权重。
1)基于训练集进行模型训练
在进行模型训练之前,首先需要确定模型的网络结构;本实施例中设计的双向LSTM-Attention盾构俯仰角预测模型、横摆角预测模型和滚动角预测模型的网络结构均包括1个输入层、1个输出层和隐含层;其中,隐含层包括1个Bi-LSTM层、1个Attention层和1个Dense层;其预测模型的输入参数为:
其中,m为第m个时刻,m=1,2,…,l;l为样本容量对应的时刻数,即l=n;
预测模型的输出参数为:
2)对模型中涉及的超参数进行预设确定
本实施例中,采用交叉验证网格搜索的方式对模型中涉及的超参数进行寻优确定;首先,对于三个姿态预测模型中均将双向LSTM隐含层节点数、Dense层节点数、模型迭代次数及学习率作为模型超参数;然后,采用试验法确定模型超参数的取值范围;最后,基于int(0.8Q)组训练集采用交叉验证网格搜索的方式进行超参数寻优。
采用确定的最优超参数组合和训练集数据分别进行三个预测模型的训练,得到训练后的盾构姿态预测模型,其模型训练的损失函数为均方误差MSE,初始权值和阈值矩阵随机取自标准正态分布,模型优化算法为Adam算法,采用Dropout技术来防止模型训练过程中的过拟合问题;优选的,Dropout取0.4;当模型在训练集上的预测结果和实测数据的均方误差MSE<10-3说明模型训练完成。
3)基于测试集进行模型验证
为验证所构建的盾构俯仰角预测模型、横摆角预测模型和滚动角预测模型的准确性和可靠性,分别采用三个姿态参数的Q-int(0.8Q)组测试集数据进行模型测试;分别将三个模型的预测结果和实测数据对比,若其MSE<5%且R2>0.90,说明模型构建成功。
4)定义模型评价标准
本实施例中,采用均方误差MSE作为模型在训练集上的误差评定标准,当MSE<10-3说明模型训练完成,反之,则返回2)重新进行模型训练。
将均方误差MSE和相关系数R2作为模型在测试集上的误差评定标准,当MSE<5%且R2>0.90,说明模型构建成功,说明本实施例所构建的双向LSTM-Attention盾构俯仰角、横摆角和滚动角预测模型能够实现盾构姿态的准确预测,反之,则返回步骤2)重新进行模型训练。
预测结果和实测数据的均方误差MSE及相关系数R2的表达式分别为:
其中,R2为相关系数,MSE为均方误差,yij为预测结果,Yij为实测数据,i为第i个样本,j为第j个时刻的预测值;均方误差越小、相关系数越大,说明模型预测性能越好。
5)与其他经典算法对比验证
将本实施例所述的双向LSTM-Attention盾构姿态预测模型的预测结果,与LSTM模型、BP模型以及SVR模型的预测结果进行对比,通过比较模型预测结果的评价指标均方误差MSE和相关系数R2来验证本实施例所公开的预测模型的优越性。
以下昆明地铁五号线六标广福路站-河尾村站盾构区间右线500~599环施工数据,对本实施例所述的盾构姿态动态预测方法及系统进行详细说明。
本实施例中,所使用的计算机配置和软件环境为:Intel(R)Core(TM)i7-10700FCP U,16.0GB内存;系统为Windows10(64位),程序语言版本为Python3.7.8,集成开发环境为Anaconda包中的spyder 4.1.4版本,在Keras库中以Tensorflow为后端实现。
具体包括以下步骤:
步骤1、从盾构机PLC系统中导出反映盾构姿态的俯仰角、横摆角和滚动角数据,得到72000*3组数据。
盾构施工在地下进行,其施工环境较为恶劣,传感器等数据监测设备可能会由于操作人员误碰、其他施工设备误撞、盾构机掘进振动等原因而出现故障,致使收集到的盾构掘进数据存在一些异常数据和缺失数据。为了保障掘进姿态预测的精度,本实施例在建模预测之前,首先对收集到的数据进行一系列预处理。即采用箱形图法进行数据异常值识别,并采用线性内插的方式进行异常值和缺失值填充。
步骤2、盾构机PLC系统的数据采集频率为5s/次,事实上,较高的采集频率下姿态数据的变动较小,倘若基于这一采集频率进行样本数据的收集,对于建模而言不仅无法提高模型的预测精度,同时会致使模型预测效率降低;因此,本实施例将从盾构机PLC系统中获取到的姿态数据进行重采样,设定采集频率为每3min,进行一次重采样。基于此,可分别得到3组样本数据,样本容量n均为2000。
步骤3,确定预测模型的输入和输出变量。从盾构姿态演化趋势分析的角度出发进行姿态预测模型的构建,本实施例利用过去10个时刻姿态数据对未来的三个时刻进行预测,其中,k1=9,k2=3,即:
为实现数据资源的有效利用,采用滑动窗口的方式来建立模型的样本数据集,本实施例中,窗口宽度w=10,滑动步长s=1。
本实施例所构建的盾构俯仰角预测模型、横摆角预测模型及滚动角预测模型的样本数据集如下式(20)所示,其中,三个姿态参数用于模型构建的样本容量Q均为1989组。
步骤4、为实现预测模型的训练和测试,将样本数据按照8:2的比例划分训练集和测试集。同时,考虑到训练集和测试集的取整问题,将俯仰角预测模型、横摆角预测模型及滚动角预测模型的训练集容量均为1591,测试集容量均为398。
步骤5、基于训练集进行双向LSTM盾构掘进姿态预测模型构建。
本实施例设计的盾构姿态Bi-LSTM的三个预测模型的网络结构均为1个输入层、1个输出层和隐含层。其中,隐含层包括1个Bi-LSTM层、1个Attention层和1个Dense层。对于本实施案例所构建的三个预测模型而言,其模型的输入变量为:
模型的输出变量为:
对模型中涉及的超参数进行人为确定,本实施例中采用试验法确定模型超参数的取值范围;最后,基于1591组训练集采用交叉验证网格搜索的方式进行超参数寻优。
其中,三个预测模型的取值范围相同,但超参数寻优结果不同,如表1所示。
表1预测模型超参数寻优
采用确定的最优超参数组合和训练集数据分别进行三个预测模型的训练,其模型训练的损失函数为均方误差MSE,初始权值和阈值矩阵随机取自标准正态分布,模型优化算法为Adam算法,采用Dropout技术来防止模型训练过程中的过拟合问题,Dropout取0.4。分别将三个模型在训练集上的预测结果和实测数据对比,经计算,模型Y1的MSE=0.0069,小于10-3;模型Y2的MSE=0.0054,小于10-3;模型Y3的MSE=0.0082,小于10-3,说明盾构俯仰角、横摆角和滚动角模型均构建成功。
为验证所构建的盾构俯仰角、横摆角和滚动角预测模型的准确性和可靠性,本实施例分别采用三个姿态参数的398组测试集数据进行模型测试。分别将三个模型的预测结果和实测数据对比,经计算,模型Y1的MSE=2.36%,小于5%且R2=0.95,大于0.90;模型Y2的MSE=2.17%,小于5%且R2=0.97,大于0.90;模型Y3的MSE=3.44%,小于5%且R2=0.93,大于0.90,说明盾构俯仰角、横摆角和滚动角模型均构建成功。
将本实施例的双向LSTM-Attention盾构掘进姿态动态多步预测模型的预测结果,与LSTM模型、BP模型以及SVR模型在本实施例下的预测结果进行对比,结果如表2所示。
表2预测模型对比
从表2中可以看出,本实施例所公开的预测模型的均方误差MSE最小,相关系数R2最大,说明本实施例所公开的预测模型在盾构掘进姿态预测方面较已有的盾构姿态预测模型有更高的预测精度,能够进一步丰富盾构姿态的理论体系,同时,可为盾构姿态控制提供辅助决策。
上述实施例仅仅是能够实现本发明技术方案的实施方式之一,本发明所要求保护的范围并不仅仅受本实施例的限制,还包括在本发明所公开的技术范围内,任何熟悉本技术领域的技术人员所容易想到的变化、替换及其他实施方式。
Claims (6)
1.一种盾构姿态动态预测方法,其特征在于,包括以下步骤:
构建盾构姿态预测模型;其中,盾构姿态预测模型采用双向LSTM-Attention盾构姿态预测模型;
确定盾构姿态预测模型的输入参数和输出参数;其中,输入参数为过去t时刻至t-k1时刻盾构姿态数据;输出参数为未来t+1时刻至t+k2时刻对应的盾构姿态数据;
获取样本数据集,并将样本数据集划分为训练集和测试集;
利用训练集对盾构姿态预测模型进行训练,利用测试集对训练后的盾构姿态预测模型进行测试,得到训练好的盾构姿态预测模型;
将待预测时间段之前的k1+1个时刻的盾构姿态数据,输入至训练后的盾构姿态模型中,进行预测,得到待预测时间段的盾构姿态数据,即得到盾构姿态动态预测结果;
获取样本数据集过程如下:
获取盾构施工过程的姿态数据集;其中,姿态数据集为俯仰角、横摆角或滚动角;
采用箱形图法,对姿态信息的数据异常进行识别,并采用线性内插法,进行数据异常值替换及数据缺失值充填,得到预处理后的数据集;并按预设频率对预处理后的数据集进行重采样,得到重采样后的数据集;
根据样本数据集的预设容量,采用滑动窗口从重采样后的数据集中,选取对应的姿态数据,得到样本数据集;
双向LSTM-Attention盾构姿态预测模型包括输入层、隐含层及输出层;
其中,隐含层双向LSTM层、Attention层和Dense层;双向LSTM层,利用前向LSTM和后向LSTM对输入层发送的数据进行训练,得到两个相反时间序列的隐含层状态,并将两个相反的时序隐含层状态连接,得到双向LSTM层的每个时序对应的输出向量;Attention层,对双向LSTM层的每个时序对应的输出向量,进行赋权并求和,得到注意力机制赋权后的输出向量;Dense层为全连接层,用于将注意力机制赋权后的输出向量转换为模型输出变量的维度,发送至输出层,输出层输出模型的预测结果;
获取训练好的盾构姿态预测模型过程如下:
确定盾构姿态预测模型中的模型超参数;
采用试验法,确定模型超参数的取值范围;
利用训练集,采用交叉验证网格搜索方式,在模型超参数的取值范围内,进行超参数寻优,得到最优的超参数组合;
利用最优的超参数组合及训练集,对盾构姿态预测模型进行训练,得到训练后的盾构姿态预测模型;
利用测试集,对训练后的盾构姿态模型进行测试;将实测数据与预测结果进行对比,若偏差符合预设要求,则训练完毕,得到训练好的盾构姿态预测模型;否则,调整模型超参数,重新进行模型训练;
其中,模型训练误差评定标准为预测结果和实测数据的均方误差MSE及相关系数R2,模型优化算法为Adam算法;
当盾构姿态预测模型在训练集上的预测结果和实测数据的均方误差MSE<10-3,则训练后的盾构姿态预测模型训练完成;
当训练后的盾构姿态预测模型在测试集上的预测结果和实测数据的均方误差MSE<5%且相关系数R2>0.90时,则训练好的盾构姿态预测模型训练完成;
模型超参数包括双向LSTM层节点数、Dense层节点数、模型迭代次数及学习率。
2.根据权利要求1所述的一种盾构姿态动态预测方法,其特征在于,两个相反的时序隐含层状态包括时序前向隐含层状态和时序后向隐含层状态;其中,前向LSTM和后向LSTM分别引入门机制,包括输入门、输出门及遗忘门;
其中,时序前向隐含层状态的表达式为:
其中,Ht-1为t-1时刻时序前向隐含层状态,Ht-2为t-2时刻时序前向隐含层状态,Xt-1为t-1时刻的输入参数,Ct-2为t-2时刻的记忆细胞;
时序后向隐含层状态的表达式为:
其中,Ht-1为t-1时刻时许后向隐含层状态,Ht为t时刻时序后向隐含层状态,Ct为t时刻的记忆细胞;
双向LSTM层t-1时刻的隐含层状态Ht-1的表达式为:
双向LSTM层t时刻的输出向量的表达式为:
Ot=σ(XtWxo+Ht-1Who+bo)
Ht=Ottanh(Ct)
Ft=σ(XtWxf+Ht-1Whf+bf)
It=σ(XtWxi+Ht-1Whi+bi)
其中,Ot为双向LSTM层t时刻的输出向量;It为双向LSTM层t时刻的输入向量;Ft为双向LSTM层t时刻的遗忘信息;为候选记忆细胞;⊙为矩阵乘法;σ为Sigmoid函数;Wxi、Wxf、Wxo、Wxc∈Rd×h和Whi、Whf、Who、Whc∈Rh×h均为权重参数,bi、bf、bo、bc∈R1×h为偏差参数;
注意力机制赋权后的输出向量的表达式为:
et=σ(WOt+b)
其中,W为权值矩阵,b为偏置矩阵,et为通过BP神经网络转换之后的输出向量,αt为各个输出向量占最终输出向量的权重。
3.根据权利要求1所述的一种盾构姿态动态预测方法,其特征在于,盾构预测模型的输入参数的表达式为:
其中,m为第m个时刻,m=1,2,…,l;l为样本容量对应的时刻数,即l=n;
盾构预测模型的输出参数的表达式为:
4.根据权利要求1所述的一种盾构姿态动态预测方法,其特征在于,预测结果和实测数据的均方误差MSE及相关系数R2的表达式分别为:
其中,yij为预测结果,Yij为实测数据,i为第i个样本,j为第j个时刻的预测值。
5.一种盾构姿态动态预测系统,其特征在于,包括建模模块、参数模块、样本模块、训练模块及预测模块;
建模模块,用于构建盾构姿态预测模型;其中,盾构姿态预测模型采用双向LSTM-Attention盾构姿态预测模型;
参数模块,用于确定盾构姿态预测模型的输入参数和输出参数;其中,输入参数为过去t时刻至t-k1时刻某个或多个盾构姿态数据;输出参数为未来t+1时刻至t+k2时刻对应的盾构姿态数据;
样本模块,用于获取样本数据集,并将样本数据集划分为训练集和测试集;
获取样本数据集过程如下:
获取盾构施工过程的姿态数据集;其中,姿态数据集为俯仰角、横摆角或滚动角;
采用箱形图法,对姿态信息的数据异常进行识别,并采用线性内插法,进行数据异常值替换及数据缺失值充填,得到预处理后的数据集;并按预设频率对预处理后的数据集进行重采样,得到重采样后的数据集;
根据样本数据集的预设容量,采用滑动窗口从重采样后的数据集中,选取对应的姿态数据,得到样本数据集。
训练模块,用于利用训练集对盾构姿态预测模型进行训练,利用测试集对训练后的盾构姿态预测模型进行测试,得到训练好的盾构姿态预测模型;
预测模块,用于将待预测时间段之前的k1+1个时刻的盾构姿态数据,输入至训练后的盾构姿态模型中,进行预测,得到待预测时间段的盾构姿态数据,即得到盾构姿态动态预测结果;
双向LSTM-Attention盾构姿态预测模型包括输入层、隐含层及输出层;
其中,隐含层双向LSTM层、Attention层和Dense层;双向LSTM层,利用前向LSTM和后向LSTM对输入层发送的数据进行训练,得到两个相反时间序列的隐含层状态,并将两个相反的时序隐含层状态连接,得到双向LSTM层的每个时序对应的输出向量;Attention层,对双向LSTM层的每个时序对应的输出向量,进行赋权并求和,得到注意力机制赋权后的输出向量;Dense层为全连接层,用于将注意力机制赋权后的输出向量转换为模型输出变量的维度,发送至输出层,输出层输出模型的预测结果;
获取训练好的盾构姿态预测模型过程如下:
确定盾构姿态预测模型中的模型超参数;
采用试验法,确定模型超参数的取值范围;
利用训练集,采用交叉验证网格搜索方式,在模型超参数的取值范围内,进行超参数寻优,得到最优的超参数组合;
利用最优的超参数组合及训练集,对盾构姿态预测模型进行训练,得到训练后的盾构姿态预测模型;
利用测试集,对训练后的盾构姿态模型进行测试;将实测数据与预测结果进行对比,若偏差符合预设要求,则训练完毕,得到训练好的盾构姿态预测模型;否则,调整模型超参数,重新进行模型训练;
其中,模型训练误差评定标准为预测结果和实测数据的均方误差MSE及相关系数R2,模型优化算法为Adam算法;
当盾构姿态预测模型在训练集上的预测结果和实测数据的均方误差MSE<10-3,则训练后的盾构姿态预测模型训练完成;
当训练后的盾构姿态预测模型在测试集上的预测结果和实测数据的均方误差MSE<5%且相关系数R2>0.90时,则训练好的盾构姿态预测模型训练完成;
模型超参数包括双向LSTM层节点数、Dense层节点数、模型迭代次数及学习率。
6.一种盾构姿态动态预测设备,其特征在于,包括存储器、处理器及存储在所述存储器中并可在所述处理器中运行的可执行指令;所述处理器执行所述可执行指令时实现如权利要求1-4任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110093904.3A CN112879024B (zh) | 2021-01-23 | 2021-01-23 | 一种盾构姿态动态预测方法、系统及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110093904.3A CN112879024B (zh) | 2021-01-23 | 2021-01-23 | 一种盾构姿态动态预测方法、系统及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112879024A CN112879024A (zh) | 2021-06-01 |
CN112879024B true CN112879024B (zh) | 2024-01-16 |
Family
ID=76050650
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110093904.3A Active CN112879024B (zh) | 2021-01-23 | 2021-01-23 | 一种盾构姿态动态预测方法、系统及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112879024B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113338972B (zh) * | 2021-07-02 | 2022-08-05 | 浙江大学 | 基于lstm的泥水盾构开挖面压力动态平衡自主控制方法 |
CN113569327B (zh) * | 2021-08-10 | 2024-02-09 | 同济大学 | 一种盾构机姿态优化方法、系统及模型训练方法、系统 |
CN114329810B (zh) * | 2021-11-16 | 2024-04-16 | 中国水利水电科学研究院 | 基于大数据的盾构机工作姿态实时预测方法 |
CN114117599B (zh) * | 2021-11-22 | 2024-08-13 | 中铁高新工业股份有限公司 | 一种盾构姿态位置偏差预测方法 |
CN114659520B (zh) * | 2022-03-18 | 2024-09-10 | Oppo广东移动通信有限公司 | 位姿确定方法、位姿确定装置、介质与电子设备 |
CN116702271A (zh) * | 2023-05-18 | 2023-09-05 | 天津大学 | 机器学习和改进遗传算法的盾构施工参数多目标优化方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110195592A (zh) * | 2019-04-30 | 2019-09-03 | 华中科技大学 | 基于混合深度学习的盾构掘进位姿智能预测方法及系统 |
CN111365015A (zh) * | 2020-03-05 | 2020-07-03 | 中建交通建设集团有限公司 | 一种基于XGBoost的盾构掘进参数特征提取与姿态偏差预测方法 |
CN111783960A (zh) * | 2020-07-09 | 2020-10-16 | 中国人民解放军国防科技大学 | 基于自动编码器和双向lstm的船舶轨迹预测方法及系统 |
-
2021
- 2021-01-23 CN CN202110093904.3A patent/CN112879024B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110195592A (zh) * | 2019-04-30 | 2019-09-03 | 华中科技大学 | 基于混合深度学习的盾构掘进位姿智能预测方法及系统 |
CN111365015A (zh) * | 2020-03-05 | 2020-07-03 | 中建交通建设集团有限公司 | 一种基于XGBoost的盾构掘进参数特征提取与姿态偏差预测方法 |
CN111783960A (zh) * | 2020-07-09 | 2020-10-16 | 中国人民解放军国防科技大学 | 基于自动编码器和双向lstm的船舶轨迹预测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112879024A (zh) | 2021-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112879024B (zh) | 一种盾构姿态动态预测方法、系统及设备 | |
Xiao et al. | Prediction of shield machine posture using the GRU algorithm with adaptive boosting: A case study of Chengdu Subway project | |
CN115544264B (zh) | 知识驱动的桥梁建造数字孪生场景智能构建方法及系统 | |
Fei et al. | Research on tunnel engineering monitoring technology based on BPNN neural network and MARS machine learning regression algorithm | |
Zhang et al. | Missing measurement data recovery methods in structural health monitoring: The state, challenges and case study | |
CN112464996A (zh) | 基于LSTM-XGBoost的智能电网入侵检测方法 | |
Falcone et al. | Artificial neural network for technical feasibility prediction of seismic retrofitting in existing RC structures | |
CN112187554A (zh) | 一种基于蒙特卡洛树搜索的运维系统故障定位方法和系统 | |
Li et al. | A data-driven building’s seismic response estimation method using a deep convolutional neural network | |
CN104732067A (zh) | 一种面向流程对象的工业过程建模预测方法 | |
CN117477544A (zh) | 融合时间模式特征的lstm超短期光伏功率预测方法及系统 | |
CN116894180B (zh) | 一种基于异构图注意力网络的产品制造质量预测方法 | |
CN113946790A (zh) | 一种导水裂隙带高度预测方法、系统、设备及终端 | |
CN117131979A (zh) | 基于有向超图及注意力机制的交通流速度预测方法及系统 | |
Shen et al. | A Markov data-based approach to system identification and output error covariance analysis for tensegrity structures | |
Zhao et al. | Predicting steel column stability with uncertain initial defects using bayesian deep learning | |
Sudhakar et al. | Faulty diagnostics model for wind power plant application using AI | |
Ngoc Phien et al. | A comparison between deep belief network and LSTM in chaotic time series forecasting | |
Li et al. | A New Strategy: Remaining Useful Life Prediction of Wind Power Bearings Based on Deep Learning under Data Missing Conditions | |
US11783194B1 (en) | Evolutionary deep learning with extended Kalman filter for modeling and data assimilation | |
CN105022798A (zh) | 一种基于预测关系的离散贝叶斯网络分类数据挖掘方法 | |
CN117217121B (zh) | 基于分布式并行topso-ewoa-de算法的岩体力学参数反演方法及系统 | |
Shi et al. | Digital twin method for intelligent lifting of cable structures under multi-collaborative mode | |
Morgenroth et al. | Comparison of Bayesian Belief Networks and Artificial Neural Networks for prediction of tunnel ground class | |
Gladstone et al. | ROBUST TOPOLOGY OPTIMIZATION USING MULTI-FIDELITY VARIATIONAL AUTOENCODERS |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |