CN115115129A

CN115115129A - 一种基于加权随机森林的tbm施工速度预测方法

Info

Publication number: CN115115129A
Application number: CN202210847956.XA
Authority: CN
Inventors: 杨风威; 闫长斌; 汪鹤健; 杨继华; 齐三红; 苗栋
Original assignee: Yellow River Engineering Consulting Co Ltd
Current assignee: Yellow River Engineering Consulting Co Ltd
Priority date: 2022-07-19
Filing date: 2022-07-19
Publication date: 2022-09-27

Abstract

本发明提供了一种基于加权随机森林的TBM施工速度预测方法，包括：构建考虑多源信息不确定性的TBM施工速度预测数据集；基于地质条件、掘进条件以及管理操作不确定性进行模型输入参数的筛选工作；利用加权随机森林方法向不同输入参数分配对应权重，并基于惩罚节点的错分来构建WRF算法框架；利用十折交叉验证与预测数据集对模型超参数进行优化，训练基于所述WRF算法框架的TBM施工速度预测模型；基于训练后的模型进行未知掘进段的TBM施工速度预测并对异常区段进行预警。保障TBM快速、安全施工。

Description

一种基于加权随机森林的TBM施工速度预测方法

技术领域

本发明属于TBM掘进性能预测的技术领域，具体涉及一种基于加权随机森林的TBM施工速度预测方法。

背景技术

随着经济的高速发展，近年来TBM在众多长大隧洞掘进工作中被广泛推广开来。TBM掘进隧道主要包括在掌子面处连续开挖掘进，岩渣运输与处理，围岩支护和衬砌施作等步骤，其高效率的智能化机械施工使得掘进速度达到传统钻爆法的3～10倍，隧道开挖形成流水型施工，大大降低人工劳动强度。TBM掘进性能的合理预测与评价决定着TBM施工的成败与效益，对TBM的掘进风险进行有效评估关乎基础建设的工期与成本控制。因此，基于现场实测的岩体参数，机械参数以及掘进参数等信息，建立精确有效的TBM施工速度预测与评价模型，成为TBM施工领域研究的重点与难点。

然而，受限于施工设备、施工时间、实验经费以及施工人员的操作失误等原因，地质条件和掘进参数的获取存在一定的不确定性，而大多数TBM施工速度的点预测模型无法识别出输入参数自身的不确定性。若施工过程中TBM的掘进参数未能跟随地质情况进行实时调整，常会导致施工效率低下、刀具磨损问题严重，甚至造成卡机事故等。鉴于施工过程的风险性、地质参数的不确定性和人为因素的不可控性，针对TBM施工速度展开合理预测存在一定的挑战。

因此，本发明采用不同权重赋值的方法优化超参数，建立加权随机森林模型来改进不同影响因素的协同关系，该模型训练速度较快，不容易出现过拟合且无需复杂的调参处理步骤，具有高精度、泛化性能强等优点，可为TBM施工工期估算和施工风险预警等提供科学参考。

发明内容

针对现有技术存在的缺陷，本发明提供了一种基于加权随机森林的TBM施工速度预测方法，该方法提出分簇表征围岩地质条件、TBM机械性能、施工管理因素的有效指标，并根据具体工程特点及预测指标筛选出具有强特征重要性的模型输入参数。通过赋值各输入参数以不同权重，提出基于加权随机森林的TBM施工速度预测模型，在模型训练时赋予合理的权值进行学习，各项指标能够相互自适应的调整，预测结果对于保障TBM快速、安全施工具有重要的指导意义。

本发明提供一种基于加权随机森林的TBM施工速度预测方法，包括：

步骤一：构建考虑多源信息不确定性的TBM施工速度预测数据集；

步骤二：基于地质条件、掘进条件以及管理操作不确定性进行模型输入参数的筛选工作；

步骤三：利用加权随机森林方法向不同输入参数分配对应权重，并基于惩罚节点的错分来构建WRF算法框架；

步骤四：利用十折交叉验证与预测数据集对模型超参数进行优化，训练基于所述WRF算法框架的TBM施工速度预测模型；

步骤五：基于训练后的模型进行未知掘进段的TBM施工速度预测并对异常区段进行预警。

优选的，TBM施工速度预测数据集包含：不同地质区段的TBM施工速度与地质条件、设备参数以及管理操作参数。

优选的，模型输入参数的筛选工作，包括：

步骤2.1：通过对不同地质区段的输入参数进行数理统计分析，基于3σ法则清除最低与最高阈值两端的无效数据；

步骤2.2：对历史TBM施工速度预测的模型进行统计，结合高频使用参数与现场参数获取的易得性进行综合筛选；

步骤2.3：根据综合筛选结果，确定模型输入参数。

优选的，利用加权随机森林方法向不同输入参数分配对应权重，并基于惩罚节点的错分来构建WRF算法框架，包括：

步骤3.1：基于所述预测数据集形成训练集D＝{X,Y}和测试集，其中X是由具有M个属性的N个样本组成，Y为唯一的目标向量；

步骤二：采用Bootstrap重抽样方法对输入训练集D进行k次有放回重复抽样，得到k个伪样本；

步骤三：构建CART树进行训练，随机取m个属性作为当前节点的子集，根据加权不纯度G(u_i,v_i)来寻找最优的节点分离值；

步骤四：每棵树在分裂生长时不进行剪枝，m值在整个训练过程中保持不变，待其满足终止条件后停止生长；

步骤五：将k棵回归树组合生成随机森林，将所述测试集输入到训练的随机森林中，对单棵回归树的预测值取平均作为模型的输出，进而得到WRF算法框架。

优选的，利用十折交叉验证与预测数据集对模型超参数进行优化，训练基于所述WRF算法框架的TBM施工速度预测模型，包括：

将预测数据集划分为互斥的10个子集；

按顺序选取其中一个子集作为模型验证集，剩余9个子集合作为训练集，基于训练集进行模型的学习并在验证集上进行测试，进而实现对模型的10次交叉验证；

通过比较10组的各个评价指标的平均值选取最优模型参数；

基于最优的模型超参数以及WRF算法框架训练TBM施工速度预测模型。

优选的，基于训练后的模型进行未知掘进段的TBM施工速度预测并对异常区段进行预警，包括：

将未知掘进区段的岩土体参数、TBM机械运行参数与人为管理参数输入训练后的模型，得到对应的TBM施工速度预测值；

基于所述预测值与标准值的比较，来确定是否存在异常，若存在，进行预警警示。

优选的，对历史TBM施工速度预测模型进行统计，结合高频使用参数与现场参数获取的易得性进行综合筛选，包括：

基于统计结果，将所有历史TBM施工速度预测模型按照时间-使用曲线，得到对应每个历史TBM施工速度预测模型在不同施工场景的使用概率分布；

获取每个历史TBM施工速度预测模型的历史自身参数集合，并对所述历史自身参数集合中的优势参数以及劣势参数进行第一划分，同时，获取历史TBM施工速度预测模型的历史优化因子集合，并按照优化影响程度，对所述历史优化因子集合的进行第二划分；

根据第一划分结果中第一划分单元的优势个数以及优势偏向属性、第二划分单元的劣势个数以及劣势偏向属性与第二划分结果中优势因子的等级划分向量，从校验数据库中匹配得到对应的校验模式；

基于所述校验模式，向所述第一划分结果中的第一划分单元设置特殊校验元素，对所述第一划分单元的优势参数进行执行时间校验，同时，向所述第二划分结果中的第二划分单元上设置补充校验元素，对所述第二划分单元的劣势参数进行替换时间校验；

根据执行时间校验结果以及替换时间校验结果，筛选得到待参考参数；

对所有待参考参数进行同参数分析，构建同参数出现列表，并对高出现频次的第一参数进行第一标定；

根据使用概率分布，预估同个历史TBM施工速度预测模型的高使用频次的第二参数，并基于所述同参数出现列表进行第二标定；

基于第一标定结果以及第二标定结果，筛选第一可用参数；

获取同个施工场景对应使用的模型个数，建立每个对应的使用的模型与所述施工场景的现场参数的第一映射关系；

基于所有第一映射关系进行交集求取，得到针对不同模型与现场参数的交次数，同时根据每个现场参数的参数权重，筛选第二可用参数；

基于第一可用参数与第二可用参数的参数适配度，综合筛选到第三可用参数。

优选的，对所述历史自身参数集合中的优势参数以及劣势参数进行第一划分之后，还包括：

获取每个历史TBM施工速度预测模型在运行过程中的历史工作日志，并得到对应劣势数据对应的分析数组；

对所述分析数组中的每个分析元素进行标准化，并将每两个分析元素进行组合编号，分析对应组合编号的分析元素的最大执行效力以及最小执行效力；

按照组合编号顺序，将所有最大执行效力构建成第一曲线以及将所有最小执行效力构建成第二曲线；

获取所述第一曲线与第二曲线的重叠点，当所述重叠点对应的执行效力大于预设效力时，将所述重叠点对应的组合编号保留；

同时，将所述第一曲线进行第一拟合以及将所述第二曲线进行第二拟合，确定基于第一曲线的第一离散点以及基于第二曲线的第二离散点并进行离散表征，且还获取第一拟合曲线与第二拟合曲线的最小拟合区间范围，并筛选所述第一曲线以及第二曲线中在所述最小拟合区间范围中的第一点，并将所述第一点对应的组合编号保留；

基于离散表征结果确定基于所示最小拟合区间范围的中间范围；

确定所述中间范围中每个点与最小拟合区间范围内每个点的第一距离；

从所有第一距离中筛选在预设距离内的第二距离，并将与第二距离匹配的第二点所对应的组合编号保留；

基于所有保留的组合编号，获取最终元素，作为对应劣势数据的劣势偏向参考依据。

优选的，基于训练后的模型进行未知掘进段的TBM施工速度预测并对异常区段进行预警的过程中，还包括：

分别记录未知掘进区段的岩土体参数、TBM机械运行参数以及人为管理参数基于训练后的模型的预测线程；

分别确定不同记录类型，对所述预测线程进行关键层的管理，并确定每个关键层在预测过程中的参与函数以及函数参与个数，计算每个关键层的预测可靠性；

其中，K1表示对应关键层的预测可靠性；N0表示对应关键层的函数参与预测的标准个数；N1表示对应关键层的函数参与预测的实际个数；e的取值为2.72；

表示对应关键层中第i1个参与函数的实际贡献因子；

表示对应关键层中第i1个参与函数的标准贡献因子；k_i1表示对应关键层中第i1个参与函数的预测权重；(k_i1)_max表示N0个参与函数中的最大预测权重；

表示N0个参与函数中的最大贡献因子；

表示与最大贡献因子匹配的预测权重；

当所有关键层的预测可靠性都大于对应的预设可靠性时，判定对应的训练后的模型合格；

否则，追溯预测可靠性不大于对应预设可靠性的第一关键层，并确定未参与函数，并按照所述第一关键层中未参与函数的第一运行内存与参与函数的第二运行内存的比值，确定第一预测空间；

获取所述参与函数与未参与函数的公共运行内存以及环境搭建内存，确定待增设空间；

当所述第一预测空间与待增设空间的和满足所述训练后的模型的可带动运行条件时，在对应关键曾的一侧增设与和结果相同的预测空间，来对未参与函数进行放置；

当不满足所述训练后的模型的可带动运行条件时，建立新的模型，并将所述未参与函数在所述新的模型进行放置；

根据对未参与函数的处理结果，实现对未知掘进区段的岩土体参数、TBM机械运行参数以及人为管理参数的再次输入，得到新的施工速度，并与原始施工速度进行对比；

根据对比结果，确定执行相应的报警操作。

本发明所产生的有益效果如下：

1、本发明首次提出分簇表征围岩地质条件、TBM机械性能、施工管理因素的有效指标，并根据具体工程特点及预测指标筛选出具有强特征重要性的模型输入参数，能够在一定程度上表征岩土体性质、机械设备和操作管理等多个方面的不确定性。

2、本发明通过赋值各输入参数以不同权重，首次提出加权随机森林的方法优化超参数，该模型训练速度较快，不容易出现过拟合且无需复杂的调参处理，具有高精度、泛化能力强等优点。

3、本发明通过分析预测模型的绝对误差异常值发现，预测模型的波动与超前地质预报结果或现场掘进过程中遭遇的地质风险相互印证，基于模型绝对误差提出的预警可在一定程度上降低地质灾害的影响程度，对于保障TBM快速、安全施工具有重要的指导意义。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1为本发明实施例中的预测流程图；

图2为本发明实施例中输入参数使用频次雷达图；

图3为本发明实施例中CART数量k对WRF模型性能的影响；

图4为本发明实施例中基于WRF模型的施工速度AR预测结果与绝对误差；

图5为本发明实施例中对一实施例应用中的典型洞段施工地质风险图；

图6为本发明实施例中一种基于加权随机森林的TBM施工速度预测方法的流程图；

图7为本发明实施例中组合编号确定的结构图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

实施例1：

本发明提出一种基于加权随机森林的TBM施工速度预测方法，如图1与6所示，包括以下步骤：

步骤一：构建考虑多源信息不确定性的TBM施工速度预测数据集，包括如下步骤；

依托兰州水源地建设工程输水隧洞项目，开展现场岩石取样、现场测试和室内岩石物理力学性质试验、岩石矿物成分鉴定和岩石耐磨性测试等试验工作。分别对不同岩性条件下TBM产生的岩碴中选取块状岩石(扰动损伤岩样)，并在现场相应地采取围岩取芯(完整岩样)进行点荷载试验，开展现场岩石强度测试。根据不同地质条件，在现场选择代表性岩性(范围涵盖火成岩、变质岩和沉积岩等三大岩性，并兼顾硬岩和软岩类型)，采取不同岩性的岩石试样，并在室内加工成试验所需尺寸，基于国际上通用的Cerchar磨蚀方法进行岩石耐磨性指标CAI测定以及岩石矿物成分鉴定，其中，TBM是英语Tunnel Boring Machine(隧洞掘进机)。

步骤二：基于地质条件、掘进条件以及管理操作不确定性进行模型输入参数的筛选工作：

对国内外关于TBM施工速度预测的模型进行统计，基于各指标的使用频次获得输入参数雷达图(图2)，根据相关参数统计与现场易得性分析，将岩体分级系统RMR、岩石磨蚀系数CAI和岩石矿物加权硬度H值作为影响AR的地质条件输入参数，以此量化不同地质环境下岩体条件的不确定性。选取能够主动控制的刀盘推力TF和转速RPM来量化施工过程中机械设备的不确定性，同时将其他因素停机ORD引入来表征设备和操作管理原因这两个方面的不确定性。将以上这些数据在不同地质单元中求得其平均值，可以建立不同地质条件下的TBM运行参数数据库，其中样本数据集输入、输出参数的描述性统计如表1所示：

表1模型样本数据集输入、输出参数描述性统计

其中，RMR值近似呈现正态分布，大部分位于40～60范围内，主要为Ⅲ类围岩。由于隧洞沿线仅涉及石英片岩、闪长岩、花岗岩、变质安山岩和砂岩等5种岩性，岩石磨蚀性指标CAI值与岩石矿物加权硬度值H分布均较为离散，取值范围分别为0.75～3.1和4～6。刀盘推力呈现左右双偏态分布，且大多数数值位于4000～5000kN以及8000～9000kN两个区间，刀盘转速近似呈现正态分布，主要分布于6r/min左右。其他停机时间ORD大致表现为正态分布，大部分处于30～40区间之内，而预测目标的实测值AR也近似呈现正态分布，主要分布在20至25范围内；

步骤三：利用加权随机森林方法向不同输入参数分配对应权重，并基于惩罚节点的错分来构建WRF算法框架，包括以下工作：

首先形成训练输入集D＝{X,Y}，其中X是由具有M个属性的N个样本组成，Y为唯一的目标向量。然后采用Bootstrap重抽样方法对输入训练样本集合D进行k次有放回重复抽样，得到k个伪样本。每个伪样本中的集合称为袋内数据，而每次未被抽中的数据被称为袋外数据。WRF通过袋外数据进行内部误差估计，以提升模型的泛化能力。进一步，构建CART树进行训练，随机取m个属性作为当前节点的子集，根据加权不纯度G(u_i,v_i)来寻找最优的节点分离值，G(u_i,v_i)值越小分离效果越好。每棵树在分裂生长时不进行剪枝，m值在整个训练过程中也保持不变，待其满足终止条件后停止生长。最后将k棵回归树组合生成随机森林，将预测集数据输入到训练的随机森林中，对单棵回归树的预测值取平均作为模型的输出，其最终预测结果为：

式中，f(x_i)为最终模型预测结果，h_i(x_i)为第i棵回归树得出的结果。

针对决策树中子节点分离的好坏，一般以切分后节点的加权不纯度G(u_i,v_i)来衡量。

式中，u_i和v_i分别为某一切分变量和其对应的切分值，N_S为当前节点所有训练样本个数，N_L,N_R分别为切分后左子节点和右子节点的训练样本个数，X_L,X_R分别为切分后左子节点和右子节点的训练样本集合，H(X)为衡量节点不纯度的函数，回归任务常采用平方平均误差MSE表达。

式中，X为当前节点的训练样本集合，y_i和

分别为当前节点样本目标变量的真实值和WRF对样本数据预测值的平均值。

由于WRF采用的是有放回重抽样方法，训练集样本的数据不尽相同且输入的属性随机选取，k个伪样本之间相互独立，进而整个集成模型的性能可以得到有效提高，其训练速度较快，不容易出现过拟合且无需复杂的调参处理。此外，由于OOB数据未参与模型回归树的构建，OOB数据可充当验证集。

步骤四：利用十折交叉验证与预测数据集对模型超参数进行优化，训练基于所述WRF算法框架的TBM施工速度预测模型：

基于兰州水源地输水隧洞工程的数据集建立模型，首先需要搜索相应的最优超参数，对于随机森林来说主要的超参数包含回归树棵树k和最大特征数m。k值太小模型容易欠拟合，太大时计算繁琐但不能显著提升模型的性能。选定WRF模型中k取值范围为[1,800]，迭代计算不同回归树棵树下验证集的均方误差，如图3所示，当k值大于500时，MSE降至趋于稳定，为减小模型的复杂度k取为500。m值决定着模型的扰动程度，一般根据经验公式确定。

m＝[log₂M]

式中，M为模型输入参数的总特征数，[]表示取整运算。本次建立的模型中输入参数具有6个属性，则根据经验公式估算m取2。

基于加权随机森林算法回归得到的AR预测值与实测AR值的对比情况如图4所示，可以发现AR预测值与真实值的散点分布相距不大，二者数值较为接近，经统计其平均绝对误差为1.31m/d，验证集决定系数达到0.95，表明模型具有良好的预测精度。而且预测值反映的整体趋势与真实值的走势类似，表明加权随机森林算法对于施工过程中的地质变异能够合理识别，不会出现与掘进区段内的现实地质条件相矛盾；

在执行步骤四之前，还包括：利用同样的训练集和验证集建立不同的机器学习模型，比对分析模型的泛化能力及鲁棒性，筛选最佳预测模型；

利用同样的训练集和验证集分别建立了随机森林回归模型RF、反向传播神经网络模型BPNN以及支持向量回归模型SVR。各模型在训练集和验证集下的RMSE、R²以及MAPE等相关评价指标见表2。

表2不同预测模型的评价指标对比表

其中，改进的加权随机森林模型预测结果精度较高，描述验证样本AR预测值和实测值之间偏差的RMSE值仅为1.59，MAPE值仅为0.11，说明WRF方法的预测性能最佳。训练和验证阶段的R²分别等于0.96与0.97，数值并未发生很大偏差，说明模型不存在欠拟合和过拟合现象。随机森林模型的预测性能逊于WRF模型，但较其他两种模型的误差偏小。然而，不论是训练集还是验证集，SVR模型的RMSE值与MAPE值都较大，R²值相较于其他模型明显偏低，说明超参数的敏感性较大，导致模型的预测精度稳定性差。此外，BPNN模型在训练集和验证集下的RMSE和R²值差异较大，表明模型的泛化能力及鲁棒性差。

通过该方式，来筛选WRF相关的模型进行后续速度的预测。

步骤五：基于训练后的模型进行未知掘进段的TBM施工速度预测并对异常区段进行预警：

从现场实际掘进结果分析，部分地质区间在施工过程中遭遇过多次重大地质风险，各种模型在对应风险区段的预测结果如表3所示；

表3典型地质区段内不同模型的预测结果

对于分布在桩号T4+550～T8+737m内的岩性地质单元5～7，该桩号范围内隧洞穿越f₂～f₃小断层(图5a所示)，基于该区段内收集的地质、机械以及施工管理参数建立的WRF模型预测结果分别为13.92m/d，11.13m/d和19.95m/d，其中编号6的掘进区段AR预测值的绝对误差达到2.97m/d，表现为异常的掘进状况，能够从侧面反映模型的输入参数具有表征TBM掘进过程中地质与机械异常信息的特点，模型的训练可以提取各项有效特征，对于不同掘进区段的风险划分起到提高精度与稳定性的作用。

对应掘进桩号位于T14+622～T15+100m的编号14地质区段在掘进过程中隧洞拱顶出现塌方风险，造成TBM前盾与围岩接触(如图5b所示)。WRF模型的预测结果为9.86m/d，该值与真实值之间的误差达到2.18m/d，波动范围较正常掘进段表现出异常，可以反应当前地质区段面临一定的施工风险，而对比其他三种模型发现WRF模型预测精度最优，说明模型训练时能够充分挖掘输入参数的信息，给予各种特征向量的权重实现了合理的反馈。。

编号18和19的地质区段突发卡机事故(图5c)，其掘进桩号位于T9+199～T9+331m之间：根据WRF模型的TBM施工速度预测结果分析发现，施工速度的输出目标分别为6.17m/d和10.34m/d，该值大小处于较低的范围，表明TBM在此地质区段内掘进性能不佳，而且AR预测值与实际值的绝对误差分别达到3.3m/d和4.8m/d，明显高于其他掘进段，即面临的施工不确定性较大，从而模型的预测结果可以在一定程度上与掘进过程中的风险性相互印证。

编号49的地质区段发生软弱围岩的挤出变形，其掘进桩号位于T14+080～T14+100m，其中顶拱的变形量超过了洞壁与护盾之间的间隙(约8cm)，围岩与护盾发生挤压接触(图5d)。针对WRF模型的预测结果来说，此掘进段内AR的预测值达到17.25m/d，单纯的点预测值并未隐含较强的风险信息，然而观察TBM施工速度的绝对误差可以发现明显异常，绝对误差达到3.09m/d，相对稳定的模型出现较大误差波动，能够反映出掘进过程中的变化。

根据现场掘进反馈得知编号53的地质区段T19+752～T19+647m掌子面和顶拱有严重塌方，TBM缓慢掘进通过了Ⅴ类围岩破碎带(图5e)。在该掘进段内基于WRF模型的TBM施工速度预测值为12.28m/d，绝对误差达到3.07m/d，其波动范围明显超过正常掘进区段，根据预测的绝对误差能够反馈出前方掌子面面临较大的施工不确定性，TBM掘进受阻或发生卡机的风险较大。

实施例2

基于实施例1的基础上，对历史TBM施工速度预测模型进行统计，结合高频使用参数与现场参数获取的易得性进行综合筛选，包括：

基于第一标定结果以及第二标定结果，筛选第一可用参数；

该实施例中，使用概率分布比如是针对场景1、场景2等场景进行使用时，其中的模型参数的参与概率，最后构建的使用概率分布。

该实施例中，自身参数集合指的是该模型在每次施工使用之前获取的该模型本身的各种参数，历史优化因子集合指的是模型在此每次施工使用之后或者是需要根据施工情况进行调整模型等，该情况下获取的调整参数，确定优化因子。

该实施例中，由于不同的参数集合中有些参数在该速度预测过程中起到的作用不大，或者是会降低预测的效率，此时，就将该类作为劣势参数，将剩余的作为优势参数。

该实施例中，由于不同的优化因子起到的优化程度是不一样的，因此，可以按照优化影响程度进行划分，得到等级划分向量。

该实施例中，优势个数指的是优势参数的个数，劣势个数指的是劣势参数的个数。

该实施例中，优势偏向属性指的是优势参数在预测过程中的预测优势，劣势偏向属性指的是劣势参数在预测过程中的预测劣势。

该实施例中，校验数据库中是包括不同偏向、等级划分向量以及对应的校验模式在内的，便于匹配到校验模式对不同的划分结果进行校验。

该实施例中，特殊校验元素与时间有关系，主要是为了设置一个校验条件，来校验优势参数的执行时间，且设置补充校验元素主要是为了确定如果对劣势参数进行替换的话，需要的替换时间，以此，根据时间来筛选待参考参数，一定程度上提高了预测效率。

该实施例中，比如：优势参数1、2、3，劣势参数4、5，最后得到的待参考参数为1、2、3、4。

该实施例中，由于每个模型都存在待参考参数，因此，进行同参数分析，并构建列表，对出现频次高的参数进行第一标定，且通过使用概率分布，可以有效的却地形出该使用频次的参数。

该实施例中，场景1，对应模型2和4，此时，存在第一映射关系，以此类推，来进行交集求取，也就是获取重复出现的次数，并与权重结合，来确定现场参数中的第二可用参数。

该实施例中，参数适配度越高对应筛选的第三可用参数的数量越多。

该实施例中，模型输入参数：为反映隧洞沿线地质条件的岩体分级系统RMR值、岩石耐磨性CAI值与硬度H值、反映TBM机械掘进效果的刀盘推力TF值和转速RPM值以及量化人为因素的其他因素停机ORD。

上述技术方案的有益效果是：通过获取模型本身的参数集合以及优化因子集合，来合理的匹配到校验模式，实现对参数执行时间与替换时间的校验，保证预测效率，且通过对参数进行列表的建立，便于对高频次参数进行第一标定，同时，根据使用概率分布，便于进行参数的第二标定，采用两种方式实现对模型参数的可靠筛选，且通过确定模型与场景的映射关系，进而确定第二可用参数，最后通过适配度，保证参数筛选的合理性，为后续模型输入提供精准基础，便于为各参数赋予准确的权重，保证了后续预测速度的精准性。

实施例3

基于实施例2的基础上，对所述历史自身参数集合中的优势参数以及劣势参数进行第一划分之后，还包括：

该实施例中，分析元素指的劣势数据中存在的各种参数的偏差抢矿、异常情况以及与优势数据的相似的情况等。

该实施例中，分子数组是各种分析元素在内的，且标准化指的是对元素进行值的标准转换，便于计算执行效力，且分析元素带来的无效作用越大，对应的执行效力越小。

该实施例中，重叠点指的是最大执行效力与最小执行效力相等的点。

该实施例中，如图7所示，A1表示第一拟合曲线，A2表示第二拟合曲线，C1表示中间范围，C2表示最小拟合范围，C3表示离散点。

上述技术方案的有益效果是：通过获取劣势数据的分析数组，并进行两两元素的组合编号，来确定执行效力，通过进行曲线构建、曲线拟合、点筛选，来确定组合编号，且还通过对离散表征构建中间范围，来对点进行再次筛选，丰富组合编号，最后获取最终元素，作为劣势偏向参考依据，为确定劣势偏向属性提供基础，间接的为参数的筛选提供基础，间接提高预测速度的精准性。

实施例4

基于实施例1的基础上，基于训练后的模型进行未知掘进段的TBM施工速度预测并对异常区段进行预警的过程中，还包括：

表示对应关键层中第i1个参与函数的实际贡献因子；

表示N0个参与函数中的最大贡献因子；

表示与最大贡献因子匹配的预测权重；

根据对比结果，确定执行相应的报警操作。

该实施例中，岩土体参数对应线程1，且线程1中包含关键层2和8，此时分别计算关键层2和8的预测可靠性。

该实施例中，比如关键层需要参与的函数为10个，但是实际参与的只有8个，那么还剩余2个未参与函数，通过确定内存比值、公共运行内存以及环境搭建内存，来确定待增设空间。

该实施例中，可带动运行条件是预先设置好的，主要是对未参与函数设置的。

该实施例中，新的模型是与已经训练好的模型综合进行对速度的预测的，保证速度预测的精准性。

该实施例中，报警操作是为了为施工人员提供一个参考，保证施工的高效性。

上述技术方案的有益效果是：在预测速度的过程中，通过对每个参数的线程进行记录，来确定每个线程中关键层的管理情况，通过确定同个线程中关键层的预测可靠性，为预测速度提供参考，具体的通过追溯参与函数与未参与函数的关系，来增设新的预测空间，保证后续预测速度的精准性，为施工提供有效参考。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种基于加权随机森林的TBM施工速度预测方法，其特征在于，包括：

2.根据权利要求1所述的一种基于加权随机森林的TBM施工速度预测方法，其特征在于，TBM施工速度预测数据集包含：不同地质区段的TBM施工速度与地质条件、设备参数以及管理操作参数。

3.根据权利要求1所述的一种基于加权随机森林的TBM施工速度预测方法，其特征在于，模型输入参数的筛选工作，包括：

步骤2.3：根据综合筛选结果，确定模型输入参数。

4.根据权利要求1所述的一种基于加权随机森林的TBM施工速度预测方法，其特征在于，利用加权随机森林方法向不同输入参数分配对应权重，并基于惩罚节点的错分来构建WRF算法框架，包括：

5.根据权利要求1所述的一种基于加权随机森林的TBM施工速度预测方法，其特征在于，利用十折交叉验证与预测数据集对模型超参数进行优化，训练基于所述WRF算法框架的TBM施工速度预测模型，包括：

将预测数据集划分为互斥的10个子集；

通过比较10组的各个评价指标的平均值选取最优模型参数；

6.根据权利要求1所述的一种基于加权随机森林的TBM施工速度预测方法，其特征在于，基于训练后的模型进行未知掘进段的TBM施工速度预测并对异常区段进行预警，包括：

7.根据权利要求3所述的一种基于加权随机森林的TBM施工速度预测方法，其特征在于，对历史TBM施工速度预测模型进行统计，结合高频使用参数与现场参数获取的易得性进行综合筛选，包括：

基于第一标定结果以及第二标定结果，筛选第一可用参数；

8.根据权利要求7所述的一种基于加权随机森林的TBM施工速度预测方法，其特征在于，对所述历史自身参数集合中的优势参数以及劣势参数进行第一划分之后，还包括：

9.根据权利要求1所述的一种基于加权随机森林的TBM施工速度预测方法，其特征在于，基于训练后的模型进行未知掘进段的TBM施工速度预测并对异常区段进行预警的过程中，还包括：

表示对应关键层中第i1个参与函数的实际贡献因子；

表示N0个参与函数中的最大贡献因子；

表示与最大贡献因子匹配的预测权重；

根据对比结果，确定执行相应的报警操作。