基于随机森林回归的盾构掘进参数偏差计算方法及系统
技术领域
本发明涉及盾构掘进领域,具体涉及一种基于随机森林回归的盾构掘进参数偏差计算方法及系统。
背景技术
在现阶段的盾构掘进过程中,由于地下施工环境是很复杂的,影响盾构掘进的因素非常多。盾构掘进参数可以反映出盾构掘进的效率和稳定性,对盾构掘进参数进行合理控制成为了盾构掘进过程的关键所在,这一直是盾构施工技术人员关心的问题。
通常,盾构掘进参数会受到盾构机施工状态的影响,还受到诸多外界因素的影响。目前,盾构机的掘进参数控制主要是由盾构施工技术人员根据以往施工经验对盾构掘进参数进行适当调整,以确保盾构机能够正常掘进。这种人为操作方法虽然能综合考虑各方因素,但由于过于依赖操作人员经验,掘进效果往往会因人而异。
传统的盾构参数研究中对于参数计算是通过参数之间的特性进行大量的实验得出的经验公式,然而,在现场的应用过程中,参数的实际值往往与理论计算值存在着一定的误差。现有的一些通过数据分析方法对盾构掘进参数进行的研究,虽然能够对掘进参数设定提供一些有效的参考,但是未能综合考虑施工地质环境、操作状态、装备结构等多种因素的影响,也未能与施工人员的操作进行实时的关联和偏差计算,存在与实际施工情况脱节等问题,难以为工程施工提供科学的参考依据,最终影响到盾构施工的质量。
发明内容
针对现有技术中的上述不足,本发明提供的一种基于随机森林回归的盾构掘进参数偏差计算方法及系统可以给出盾构机在掘进过程中的掘进参数偏差值,可以为工程施工提供参考依据,便于提高盾构施工的质量。
为了达到上述发明目的,本发明采用的技术方案为:
提供一种基于随机森林回归的盾构掘进参数偏差计算方法,其包括以下步骤:
S1、获取至少一个盾构机的设计参数、原始施工数据、原始故障数据和地质数据,并将其作为原始数据;
S2、对原始数据进行预处理,并按照盾构机机型、预处理后的故障数据和地质数据对预处理后的原始数据进行数据划分,得到同一盾构机型在同一地质数据下的施工数据;
S3、建立随机森林回归模型,并将同一盾构机型在同一地质数据下的施工数据作为随机森林回归模型的训练数据,得到训练后的回归模型;
S4、获取新盾构项目的掘进参数集并将其输入训练后的回归模型,得到回归模型预测值;
S5、获取新盾构项目的实时参数值,将实时参数值与对应的回归模型预测值进行偏差计算,得到盾构掘进参数的偏差值。
进一步地,步骤S2的具体方法包括以下子步骤:
S2-1、删除原始盾构施工数据和原始故障数据中的冗余数据,用“0”值替换空值数据,并处理异常环号数据,得到初步处理后的原始盾构施工数据和原始故障数据;
S2-2、将初步处理后的原始盾构施工数据和原始故障数据依据地质数据和报警数据打上对应的标签;
S2-3、从初步处理后的原始盾构施工数据中筛选出未打有报警标签的数据,并将其作为正常施工数据;
S2-4、筛除无地质数据的施工数据,并从正常施工数据中按照地质类型和盾构机机型进行数据分组,得到分组后的施工数据;
S2-5、从分组后的施工数据中筛选出刀盘转速大于0.5且推进速度大于0小于100的施工数据,得到同一盾构机型在同一地质数据下的施工数据;其中刀盘转速的单位为:转/分钟;推进速度的单位为:毫米/分钟。
进一步地,步骤S2-1中处理异常环号数据的具体方法为:
对于环号减小后直至项目结束都未恢复正常的环号数据,将减小的环号全统一为最后一个正常环号;
对于环号减小后恢复正常的环号数据,将减小的环号全统一为其两端第一个正常环号的均值向上取整所得到的数值;
对重复出现的故障数据进行清除至仅保留一条;
删除小于-10的环号所对应的施工数据和故障数据。
进一步地,步骤S3的具体方法包括以下子步骤:
S3-1、在同一盾构机型、同一地质数据下的施工数据中获取刀盘系统、螺机输送机系统、推进油缸系统和土仓压力系统中的各掘进参数,选取将要进行预测以及偏差计算的掘进参数作为初始目标参数,将剩下的掘进参数作为初始自变量;根据皮尔森相关系数算法获取两两掘进参数之间的相关系数;
S3-2、若两个初始目标参数的相关系数大于等于0.99且小于等于1,则任意舍弃其中一个;若两个初始自变量的相关系数大于等于0.99且小于等于1,则任意舍弃其中一个;若一个初始目标参数和一个初始自变量的相关系数大于等于0.99且小于等于1,则舍弃该初始自变量;得到预选后的目标参数和自变量;
S3-3、确定随机森林回归模型的特征变量个数和决策子树数量并建立初始随机森林回归模型;
S3-4、将同一盾构机型、同一地质数据下的目标参数和自变量作为一个训练样本集,并将自变量作为初始随机森林回归模型的输入,得到与自变量相对应的预测输出;
S3-5、根据公式
获取每个训练样本集的对应袋外数据的预测准确度MSE;其中q为每个训练样本集的对应袋外数据量;为目标参数Y第i次实际观测值;为目标参数Y第i次初始随机森林回归模型的预测值;i∈1,2,…,q;
S3-6、随机改变袋外数据中任一自变量Xj的值,采用与步骤S3-4和步骤S3-5相同的方法获取新的袋外预测准确度MSEj;
S3-7、根据公式
获取自变量Xj的重要性Q(Xj);
S3-8、判断自变量Xj的重要性Q(Xj)是否小于0.01,若是则剔除该自变量,并返回步骤S3-4;否则让随机森林回归模型的每棵决策子树自由生长,得到训练后的回归模型。
进一步地,步骤S3-3中确定随机森林回归模型的特征变量个数和决策子树数量的具体方法为:
根据公式
m=sqrt(M)或m=log2M或m=M
确定特征变量个数m的取值;其中sqrt(·)为sqrt函数;log为对数函数;M为当前训练样本集中自变量的数量;
从数值范围[30,50]中选取决策子树的数量。
进一步地,步骤S5的具体方法包括以下子步骤:
S5-1、根据公式
获取回归模型的整体均方根误差RMSE;其中n为训练样本数量;为目标参数Y的第a次实际观测值;为目标参数Y的第a次模型预测值,a∈1,2,…,n;
S5-2、根据公式
获取新盾构项目的实时参数值yp与对应预测值的偏差值δp;其中为新盾构项目的掘进参数集p在回归模型中的预测值。
提供一种基于随机森林回归的盾构参数偏差计算系统,其包括:
原始数据获取模块,用于获取至少一个盾构机的设计参数、原始施工数据、原始故障数据和地质数据,并将其作为原始数据;
数据预处理模块,用于对原始数据进行预处理,并按照盾构机机型、预处理后的故障数据和地质数据对预处理后的原始数据进行数据划分,得到同一盾构机型在同一地质数据下的施工数据;
随机森林回归模型训练模块,用于将同一盾构机型在同一地质数据下的施工数据作为随机森林回归模型的训练数据,对随机森林回归模型进行训练;
盾构掘进参数偏差计算模块,用于获取新盾构项目的实时参数值与掘进参数集,将掘进参数集作为回归模型的输入得到对应的预测值,将实时参数值与对应的预测值进行偏差计算,得到盾构掘进参数的偏差值。
进一步地,还包括掘进状态评定模块,所述掘进状态评定模块用于根据盾构掘进参数的偏差值对掘进的状态进行评定。
本发明的有益效果为:本发明通过对盾构掘进参数进行偏差计算,给出盾构机在掘进过程中的掘进参数偏差值,也可以进一步给出掘进状态数据,可以为工程施工提供参考依据,便于提高盾构施工的质量。本发明可以针对不同地质不同机型的多个盾构掘进参数进行偏差计算,可以有效解决以往仅能针对个别参数、单一地质环境、单一机型进行计算的适应性不强的问题,本发明还可以有效解决以往盾构掘进参数计算方法成本高、准确率低、过拟合等问题。
附图说明
图1为本发明的流程示意图;
图2为相关系数热力图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,该基于随机森林回归的盾构掘进参数偏差计算方法包括以下步骤:
S1、获取至少一个盾构机的设计参数、原始施工数据、原始故障数据和地质数据,并将其作为原始数据;
S2、对原始数据进行预处理,并按照盾构机机型、预处理后的故障数据和地质数据对预处理后的原始数据进行数据划分,得到同一盾构机型在同一地质数据下的施工数据;
S3、建立随机森林回归模型,并将同一盾构机型在同一地质数据下的施工数据作为随机森林回归模型的训练数据,得到训练后的回归模型;
S4、获取新盾构项目的掘进参数集并将其输入训练后的回归模型,得到回归模型预测值;
S5、获取新盾构项目的实时参数值,将实时参数值与对应的回归模型预测值进行偏差计算,得到盾构掘进参数的偏差值。
步骤S2的具体方法包括以下子步骤:
S2-1、删除原始盾构施工数据和原始故障数据中的冗余数据,用“0”值替换空值数据,并处理异常环号数据,得到初步处理后的原始盾构施工数据和原始故障数据;
S2-2、将初步处理后的原始盾构施工数据和原始故障数据依据地质数据和报警数据打上对应的标签;
S2-3、从初步处理后的原始盾构施工数据中筛选出未打有报警标签的数据,并将其作为正常施工数据;
S2-4、筛除无地质数据的施工数据,并从正常施工数据中按照地质类型和盾构机机型进行数据分组,得到分组后的施工数据;
S2-5、从分组后的施工数据中筛选出刀盘转速大于0.5且推进速度大于0小于100的施工数据,得到同一盾构机型在同一地质数据下的施工数据;其中刀盘转速的单位为:转/分钟;推进速度的单位为:毫米/分钟。
步骤S2-1中处理异常环号数据的具体方法为:对于跳环后直至项目结束都未恢复正常的环号数据,将跳环的环号全统一为最后一个正常环号;对于跳环后恢复正常的环号数据,将跳环的环号全统一为恢复正常后的第一个正常环号;对重复出现的故障数据进行清除至仅保留一条;删除小于-10的环号所对应的施工数据和故障数据。
对于环号减小后直至项目结束都未恢复正常的环号数据,将减小的环号全统一为最后一个正常环号;例如某环号数据为“1,1,1,2,2,3,6,-12,-14”,其中的“-12,-14”环号并未与“6”保持不变或增大,故均为异常环号,且直至结束都未恢复正常,因此将其全统一为“6”,则该环号数据最终处理为“1,1,1,2,2,3,6,6,6”。
对于环号减小后恢复正常的环号数据,将减小的环号全统一为其两端第一个正常环号的均值向上取整所得到的数值;例如某环号数据为“1,1,1,2,2,3,4,5,-3,-2,4,7”,其中的“-3,-2,4”环号并未与“5”保持不变或增大,而“7”相对于“5”为增大,因此“7”为正常环号,“-3,-2,4”均为异常环号,因此将异常环号“-3,-2,4”全统一为“5”和“7”的均值向上取整得到的数值6,则该环号数据最终处理为“1,1,1,2,2,3,4,5,6,6,6,7”。
步骤S3的具体方法包括以下子步骤:
S3-1、在同一盾构机型、同一地质数据下的施工数据中获取刀盘系统、螺机输送机系统、推进油缸系统和土仓压力系统中的各掘进参数,选取将要进行预测以及偏差计算的掘进参数作为初始目标参数,将剩下的掘进参数作为初始自变量;根据皮尔森相关系数算法获取两两掘进参数之间的相关系数;
S3-2、若两个初始目标参数的相关系数大于等于0.99且小于等于1,则任意舍弃其中一个;若两个初始自变量的相关系数大于等于0.99且小于等于1,则任意舍弃其中一个;若一个初始目标参数和一个初始自变量的相关系数大于等于0.99且小于等于1,则舍弃该初始自变量;得到预选后的目标参数和自变量;
S3-3、确定随机森林回归模型的特征变量个数和决策子树数量并建立初始随机森林回归模型;
S3-4、将同一盾构机型、同一地质数据下的目标参数和自变量作为一个训练样本集,并将自变量作为初始随机森林回归模型的输入,得到与自变量相对应的预测输出;
S3-5、根据公式
获取每个训练样本集的对应袋外数据的预测准确度MSE;其中q为每个训练样本集的对应袋外数据量;为目标参数Y第i次实际观测值;为目标参数Y第i次初始随机森林回归模型的预测值;i∈1,2,…,q;
S3-6、随机改变袋外数据中任一自变量Xj的值,采用与步骤S3-4和步骤S3-5相同的方法获取新的袋外预测准确度MSEj;
S3-7、根据公式
获取自变量Xj的重要性Q(Xj);
S3-8、判断自变量Xj的重要性Q(Xj)是否小于0.01,若是则剔除该自变量,并返回步骤S3-4;否则让随机森林回归模型的每棵决策子树自由生长,得到训练后的回归模型。
步骤S3-3中确定随机森林回归模型的特征变量个数和决策子树数量的具体方法为:
根据公式
m=sqrt(M)或m=log2M或m=M
确定特征变量个数m的取值,并优选m=M;其中sqrt(·)为sqrt函数;log为对数函数;M为当前训练样本集中自变量的数量;
从数值范围[30,50]中选取决策子树的数量,并优选40。
步骤S5的具体方法包括以下子步骤:
S5-1、根据公式
获取回归模型的整体均方根误差RMSE;其中n为训练样本数量;为目标参数Y的第a次实际观测值;为目标参数Y的第a次模型预测值,a∈1,2,…,n;
S5-2、根据公式
获取新盾构项目的实时参数值yp与对应预测值的偏差值δp;其中为新盾构项目的掘进参数集p在回归模型中的预测值。
该基于随机森林回归的盾构参数偏差计算系统包括:
原始数据获取模块,用于获取至少一个盾构机的设计参数、原始施工数据、原始故障数据和地质数据,并将其作为原始数据;
数据预处理模块,用于对原始数据进行预处理,并按照盾构机机型、预处理后的故障数据和地质数据对预处理后的原始数据进行数据划分,得到同一盾构机型在同一地质数据下的施工数据;
随机森林回归模型训练模块,用于将同一盾构机型在同一地质数据下的施工数据作为随机森林回归模型的训练数据,对随机森林回归模型进行训练;
盾构掘进参数偏差计算模块,用于获取新盾构项目的实时参数值与掘进参数集,将掘进参数集作为回归模型的输入得到对应的预测值,将实时参数值与对应的预测值进行偏差计算,得到盾构掘进参数的偏差值。
基于随机森林回归的盾构参数偏差计算系统还包括掘进状态评定模块,所述掘进状态评定模块用于根据盾构掘进参数的偏差值对掘进的状态进行评定。
在具体实施过程中,由于不同盾构机机型的参数设计不完全相同,本发明在训练过程中采用的是同一机型的掘进参数,例如开挖直径8630mm盾构机掘进参数可选取:刀盘总扭矩(KN·m)、刀盘转速(r/min)、刀盘总功率(Kw)、螺机转速(r/min)、推进速度(mm/min)、刀盘贯入度(mm/rev)、推进总推力(KN)、左上1#土压传感器压力(Bar)、左上2#土压传感器压力(Bar)、左上3#土压传感器压力(Bar)、左上4#土压传感器压力(Bar)、左上5#土压传感器压力(Bar)。
开挖直径6280mm盾构机掘进参数可选取:刀盘扭矩(KN·m)、刀盘转速(r/min)、刀盘功率(Kw)、螺机转速(r/min)、推进速度(mm/min)、总推进力(KN)、上部土仓压力(Bar)、左上土仓压力(Bar)、左下土仓压力(Bar)。
在本发明的一个实施例中,若δp≥0,则表明该条施工数据属于正常施工状态,符合以往的施工经验,无需进行调整;若则表明该条施工数据小于以往的施工经验,需要进一步观察;若则表明该条施工数据大于以往的施工经验,需要进一步观察。掘进状态评定模块可以根据这三种情况给出对应的说明。
为了便于更进一步观察,本发明可以对一段时间数据进行偏差计算分析。盾构机的掘进参数数据通常以秒为时间单位进行记录,所以每秒都会产生一条施工记录,也会对应产生一个δp,以10秒为一段数据进行实时偏差计算,即产生10个δp,同时绘制时间-偏差趋势图,进行趋势判断。
当δp≥0(p=1…10),说明该段施工数据均属于正常施工状态,符合以往的施工经验,无需进行调整。
当说明该段施工数据均小于以往的施工经验,需根据实际情况进行合理增大调整。
当说明该段施工数据均大于以往的施工经验,需根据实际情况进行合理减小调整。
当δp前半段小于0,然后持续上升至后半段大于0,说明该段数据趋于正常,无需进行调整。
当δp前半段大于0,然后持续下降至后半段小于0,说明该段数据趋于不正常,需根据实际情况进行合理调整。
当δp处于波浪线趋势,则说明该参数波动较大,需根据实际情况进行合理调整。掘进状态评定模块也可以根据这几种情况给出对应的说明。
在本发明的一个实施例中,采用原始数据获取模块获取开挖直径为8630mm的盾构机的某地铁项目施工原始数据,包括117717条施工数据、129条故障数据、3种地质情况。采用数据预处理模块对已有数据进行清洗以及预处理,有效地将异常数据排除,形成有效的数据集,并按照盾构机机型以及地质情况进行数据划分,该步完成后总数据量为109051条,其中中风化砂岩地质段数据总量为55927条,采用中风化砂岩地质数据进行后续计算。
在本实施例中,将推进速度作为将要进行预测以及偏差计算的目标参数,利用皮尔森相关系数算法获取两两掘进参数(刀盘总扭矩、刀盘转速、刀盘总功率、螺机转速、推进速度、刀盘贯入度、推进总推力、左上1#土压传感器压力、左上2#土压传感器压力、左上3#土压传感器压力、左上4#土压传感器压力、左上5#土压传感器压力)之间的相关系数,得到如图2所示的相关系数热力图。其中推进速度与刀盘贯入度之间的相关系数高达0.99,由于推进速度是目标参数,而刀盘贯入度是自变量,因此将刀盘贯入度舍去。则剩下的自变量数量为10,决策变量的个数可以取值为10,决策子树数量可以取值为40。
如表1所示,由于所有自变量的重要性都大于0.01,则不需要舍去其中的掘进参数,使得随机森林回归模型训练模块直接训练出来的随机森林回归模型即符合要求,盾构掘进偏差计算模块(通过训练后的回归模型)用于开挖直径为8630mm的盾构机在中风化砂岩地质下的盾构项目偏差计算中,掘进状态评定模块即可实时给出偏差值与偏差说明。
表1:重要性表
变量 |
重要性 |
刀盘总功率 |
0.137159957 |
刀盘总扭矩 |
0.052458474 |
刀盘转速 |
0.038918172 |
螺机转速 |
0.336811666 |
左上1#土压传感器压力 |
0.040256299 |
左上2#土压传感器压力 |
0.08938922 |
左下3#土压传感器压力 |
0.043814273 |
左下4#土压传感器压力 |
0.095359008 |
左下5#土压传感器压力 |
0.070317103 |
推进总推力 |
0.095515828 |
综上所述,本发明通过对盾构掘进参数进行偏差计算,给出盾构机在掘进过程中的掘进参数偏差值,也可以进一步给出掘进状态数据,可以为工程施工提供参考依据,便于提高盾构施工的质量。本发明可以针对不同地质不同机型的多个盾构掘进参数进行偏差计算,可以有效解决以往仅能针对个别参数、单一地质环境、单一机型进行计算的适应性不强的问题,本发明还可以有效解决以往盾构掘进参数计算方法成本高、准确率低、过拟合等问题。