CN112348278A - 一种基于XGBoost算法预测盾构机土仓压力的方法 - Google Patents

一种基于XGBoost算法预测盾构机土仓压力的方法 Download PDF

Info

Publication number
CN112348278A
CN112348278A CN202011296026.7A CN202011296026A CN112348278A CN 112348278 A CN112348278 A CN 112348278A CN 202011296026 A CN202011296026 A CN 202011296026A CN 112348278 A CN112348278 A CN 112348278A
Authority
CN
China
Prior art keywords
xgboost
regression
soil pressure
soil
pressure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011296026.7A
Other languages
English (en)
Inventor
贾连辉
李光
廉润泽
郑康泰
林福龙
孟祥波
王昆
谢荣灿
焦敬波
赵祥
陈力
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Railway Engineering Equipment Group Co Ltd CREG
Original Assignee
China Railway Engineering Equipment Group Co Ltd CREG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Railway Engineering Equipment Group Co Ltd CREG filed Critical China Railway Engineering Equipment Group Co Ltd CREG
Priority to CN202011296026.7A priority Critical patent/CN112348278A/zh
Publication of CN112348278A publication Critical patent/CN112348278A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/08Construction

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Software Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Excavating Of Shafts Or Tunnels (AREA)

Abstract

本发明提出了一种基于XGBoost算法预测盾构机土仓压力的方法,其步骤为:通过XGBoost算法筛掉与土仓压力变化相关性数值小的特征变量,选取与土仓压力变化关联的相关变量作为特征向量;将传感器采集的原始数据经特征提取并进行移位变换分成训练集和验证集;投喂训练集获得初始XGBoost回归模型,通过网格搜索方式得到最优模型参数;将验证集中的数据样本输入经参数优化后的XGBoost回归模型,得到最优的XGBoost土压回归模型;使用XGBoost土压回归模型计算出未来时段的土压值。本发明实现了预知盾构掘进施工中土仓压力的变化情况,为预警盾构施工中存在的土压异常及化解潜在的施工安全隐患提供了技术支持,提升盾构掘进施工的安全性。

Description

一种基于XGBoost算法预测盾构机土仓压力的方法
技术领域
本发明涉及预测盾构机掘进中土仓压力值的技术领域,尤其涉及一种基于XGBoost算法预测盾构机土仓压力的方法,使用XGBoost算法预测土压平衡盾构机掘进中土仓压力值并绘制土压预测曲线。
背景技术
盾构法隧道施工工艺由于具有安全性高、效率高、经济适用等优点,广泛应用于现代城市地下隧道的施工。在多种盾构机类型中,土压平衡盾构属于封闭式盾构,当盾构开启推进时,前端刀盘旋转掘削地层土体,切削下来的土体进入土仓;充满土体的土仓的内部被动土压与掘削面上的土压、水压基本平衡,即掘削面与盾构面处于稳定状态。土压平衡盾构机依靠螺旋输送机将掘削的渣土排送至土箱,运至地表,以此控制土仓内部压力,确保掘削面稳定。在盾构尾部拼接好管片并注浆成型,盾构掘进与拼接管片过程依次往复进行,完成整个隧道的施工。
土仓压力值作为施工中反映盾构运转状态的重要参量,可由位于土仓中的传感器实时采集和获得。在盾构施工中,土压传感器只能采集到当前土仓压力值,但通过土压传感器,无法预知未来时段内盾构土压的变化情况;伴随掘进过程,也会出现诸如盾构机械故障、土压传感器失灵、掘进地质条件改变等施工状况,将导致无法通过土压传感器采集到盾构土压值,同时未来时段土压值在施工指导阈值范围之外的后果,过压(土压值超过施工指导阈值范围上界限)严重时会导致施工区地面隆起,而欠压(土压值低于施工指导阈值范围下界限)会导致施工区地面塌陷。无法预知盾构施工中土压的变化情况,不仅有引发地质灾害的可能性,而且增长了隧道整体施工中的安全隐患。
综上所述,在盾构掘进施工中,存在对土仓压力值进行预测的技术需求。同时土压受到设备自身运转情况,盾构司机实际操纵以及掘进地质状况等诸多复杂因素的共同作用影响,直接基于盾构运转原理和地质情况,很难明确盾构土压值的机理预测模型。
发明内容
针对现有盾构掘进过程中,无法预知土仓压力在未来时段的变化情况,存在安全隐患的技术问题,本发明提出一种基于XGBoost算法预测盾构机土仓压力的方法,融合盾构施工数据、人工智能算法和数据处理技术,实现了提前获知盾构掘进中关键参量(土压值)的功能,为盾构安全掘进施工提供了技术保障。
为了达到上述目的,本发明的技术方案是这样实现的:一种基于XGBoost算法预测盾构机土仓压力的方法,其步骤如下:
步骤一:特征提取:通过XGBoost算法筛掉与土仓压力变化相关性数值小的特征变量,选取与土仓压力变化关联的相关变量,并将选取的所有相关变量汇集,作为表征土仓压力变化的特征向量;
步骤二:传感器采集的原始数据经步骤一的特征提取处理成为待分析数据集,将待分析数据集进行移位变换分成训练集和验证集;
步骤三:投喂步骤二获得的训练集以获得初始XGBoost回归模型,并通过网格搜索方式,得到最优模型参数;将验证集中的数据样本输入经参数优化后的XGBoost回归模型,对其预测性能进行评估,最后以文件形式保存得到最优的XGBoost土压回归模型;
步骤四:XGBoost土压回归模型进行盾构土压值预测:载入在步骤三中获得的XGBoost土压回归模型的文件,输入每时刻与土压相关的特征向量,使用XGBoost土压回归模型计算出未来时段的土压值,并绘制预测曲线。
所述步骤一中XGBoost算法的实现方法为:利用树集成的思想将K棵回归树的结果进行求和,作为最终的预测值:
数据集合表示为:
Figure BDA0002785432350000021
其中,数据集合D中样本条目数为n,xi为m维的特征向量,yi为第i个特征向量xi对应的土仓压力值,
Figure BDA0002785432350000022
为实数集,i为序号下标,且1<=i<=n;
XGBoost算法生成回归树的集合F为:
Figure BDA0002785432350000023
其中,q为一棵回归树结构的确定法则,即将m维的特征向量xi映射到T个叶子节点的数值,而T个叶子节点数值的权重由T维向量ω指定;f(x)表示某一棵回归树的映射关系,即由特征向量x映射至目标值f(x),Wq(x)为一棵回归树的确定法则q确定并将特征向量x映射至目标值;
一条数据样本的回归值由K棵回归树的计算结果的和确定:
Figure BDA0002785432350000024
其中,
Figure BDA0002785432350000025
表示第i个预测土压值,
Figure BDA0002785432350000026
表示映射特征向量xi得到的预测值,fk(xi)表示第k棵回归树对特征向量xi进行映射得到的回归数值,fk表示第k棵回归树的映射关系;
通过XGBoost算法对比使用不同特征变量的预测土压值与实际值的误差,并根据误差的大小判断不同的特征变量与盾构土压之间的相关程度,获得不同特征变量与盾构土压之间的相关性数值,选取误差最小的特征变量组合。
所述步骤二中移位变换的方法为:
使每时刻的特征向量一一对应未来时刻的盾构土压值Label,实现步骤为:
Step 1:将盾构土压值Label的列上移z个时间单位;
Step 2:删除分析数据集的最后z行。
所述训练集与验证集所包含数据样本数量的比例定为:3:1;采用交叉验证的方式,生成四轮用于XGBoost回归模型训练的训练集和验证的验证集的组合,即将移位变换后的数据集均分为4等份,每一轮依次选择一份数据样本用作验证集。
所述步骤三中训练初始XGBoost回归模型生成回归树集合时,使用带正则项的目标函数:
Figure BDA0002785432350000031
Figure BDA0002785432350000032
其中,L(φ)为目标函数,
Figure BDA0002785432350000033
是损失函数,
Figure BDA0002785432350000034
为初始XGBoost回归模型对训练集中第i个特征向量xi进行预测得到的预测土压值,yi为数据样本对应的真实目标值;Ω(f)是正则惩罚项,通过调节系数γ和λ的大小控制生成的K棵回归树的复杂度;fk表示第k棵回归树的映射关系,T表示每棵回归树叶子节点的数量,而||ω||2表示T个叶子节点权重的L2范数,即叶子节点的权重向量ω的欧式距离(Euclidean Distance),如下式所示:
Figure BDA0002785432350000035
其中,权重向量ω有n个维度,ωi为权重向量ω的第i个维度的取值。
所述步骤三中得到最优模型参数,即找到最优的回归树数目和树的最大深度;
所述网格搜索方式的设置方法为:设置搜索网格为:
生成回归树数目:[1,2,3,...,j-1,j],
回归树最大深度:[1,2,3,...,k-1,k];
遍历所有生成回归树数目和回归树最大深度的参数组合,依次选用每一种参数组合,计算在训练集上的土压值,当计算所得的土压值与真实土压值之间的误差最小时,对应的参数组合即为最优解,即获得最优的回归树数目和树的最大深度。
所述步骤三中对预测性能进行评估的方法为:
训练后的XGBoost回归模型的土压预测性能评估指标为:均方根误差RMSE和决定系数R2,且:
Figure BDA0002785432350000041
均方根误差RMSE为训练后的XGBoost回归模型进行n次盾构土压值预测后,平均每一次预测的数值偏差;
决定系数R2为:
Figure BDA0002785432350000042
Figure BDA0002785432350000043
Figure BDA0002785432350000044
训练后的XGBoost回归模型对n条数据样本进行预测,yi表示第i条数据样本的真实土压值,
Figure BDA0002785432350000045
是第i条数据样本的预测土压值,
Figure BDA0002785432350000046
为n条数据样本的真实土压平均值,SSE为残差平方和,SST为总体平方和。
所述步骤三中以文件形式保存得到最优的XGBoost土压回归模型的方法为:利用Python程序包joblib以pkl文件的形式保存获得的XGBoost土压回归模型。
所述步骤四中使用XGBoost土压回归模型计算出未来时段的土压值的方法为:
通过Python程序包joblib载入保存的XGBoost土压回归模型,利用该模型处理采集获得的盾构机施工数据,实现对未来时段的盾构土压值进行预测。
所述步骤四中绘制预测曲线的方法为利用Python中绘图库matplotlib进行土压预测结果的可视化呈现;以三种形式绘制预测曲线:动态生成预测土压变化曲线的方式、分别绘制土压真实情况和预测情况的方式、重叠绘制真实情况和预测情况的方式。
与现有技术相比,本发明的有益效果:
1.本发明解决了盾构施工中无法预知设备重要工作状态---土仓压力值的问题;本发明是一种数据驱动式,利用XGBoost机器学习算法实现盾构机的土压预测,通过本发明盾构司机或地面监控人员可以提前知晓施工中土仓压力的变化情况,进而及时对可能存在的土压异常做出处置,以保证掘进施工的安全。
2.获得的XGBoost土压回归模型具有很高的预测精度;且XGBoost土压回归模型预测土压实时性极佳(10秒内可预测8万余条数据样本);也可在土压传感器失效时正常工作,提高了系统容错性。并且,本发明的实施步骤简单,易于再现,可用于对不同土压平衡盾构机的土压值进行预测,泛用性强。本发明实现了预知盾构掘进施工中的重要参量——土仓压力的变化情况,为预警盾构施工中存在的土压异常及化解潜在的施工安全隐患提供了技术支持,提升盾构掘进施工的安全性;且具有较强的工程实用性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的流程图。
图2为本发明的数据移位的整形示意图。
图3为本申请设置交叉验证数据集的示意图。
图4为本发明动态生成预测土压曲线的示意图。
图5为本发明的真实和预测土压曲线上下排列示意图。
图6为本发明的真实和预测土压曲线重叠绘制示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明通过投喂与土压相关的变量数据,训练机器学习回归模型,预测盾构掘进中土压改变的情况,并在盾构施工设备UI(用户交互)界面上以变化曲线图的形式呈现,及时向盾构机司机和地面监控人员提出预警,为潜在安全问题的化解给予支持。本发明在Python编程语言环境下实现预测目标,是一种全新数据驱动式的求解。
如图1所示,一种基于XGBoost算法预测盾构机土仓压力的方法,其步骤如下:
步骤一:特征提取:通过XGBoost算法筛掉与土仓压力变化相关性数值小的特征变量,选取与土仓压力变化关联的相关变量,并将选取的所有相关变量汇集,作为表征土仓压力变化的特征向量;即通过XGBoost算法选取与土仓压力变化显著关联的特征变量,实现特征提取。
由于盾构机上的传感器采集变量种类繁多,采集数据量极大,首先需要通过XGBoost算法选取与目标变量土仓压力相关联的盾构施工参量,即筛选出与土压变化显著关联的特征变量,以确保后续训练所得回归模型能够拟合实际土压变化情况,同时减少模型训练耗时。
利用XGBoost算法筛选出与土仓压力变化显著关联的特征变量,利用这些特征变量拟合土压在未来时段内的变化情况,进行数据降维,缩短后续模型训练耗时。其中,XGBoost算法的原理如下:
XGBoost算法利用树集成的思想,将K棵回归树的结果进行求和,作为最终的预测值。一般地,分析的数据集合表示为:
Figure BDA0002785432350000061
其中,数据集合D中样本条目数为n,xi为m维的特征向量,yi为特征向量xi对应的目标值,在本发明中目标值即是土仓压力值,
Figure BDA0002785432350000062
表示实数集;i为序号下标,1<=i<=n,xi为第i个特征向量。
XGBoost算法生成回归树的集合F为:
Figure BDA0002785432350000063
其中,一棵回归树的结构由法则q确定,即将m维的特征向量xi映射到T个叶子节点的数值,而T个叶子节点数值的权重由T维向量ω指定;f(x)表示某一棵回归树的映射关系,即由特征向量x映射至目标值f(x),更为具体的表示形式即是Wq(x),为一棵回归树的结构由法则q确定,并将特征向量x映射至目标值Wq(x)。最终,一条数据样本的回归值由K棵回归树的计算结果的和确定:
Figure BDA0002785432350000064
其中,
Figure BDA0002785432350000065
表示第i个预测的目标值即预测土压值,
Figure BDA0002785432350000066
表示映射特征向量xi得到的预测值,fk(xi)表示第k棵回归树对特征向量xi进行映射得到的回归数值,fk表示第k棵回归树的映射关系,f(x)表示通用函数映射。
通过XGBoost算法对比使用不同特征变量(如盾构推进压力或推进速度,选用的特征变量数目和种类不同,即有不同的特征变量组合待选)的预测土压值与实际值的误差,并根据该误差的大小判断不同的特征变量与盾构土压之间的相关程度。最终目的是选取对应误差最小的特征变量组合,定为与盾构土压最为相关的变量,误差大,说明当前选用的特征变量与盾构土压的相关程度低;误差小,说明当前选用的特征变量与盾构土压的相关程度高。目标是选取误差最小时,所用的特征变量,这一过程就是特征提取。在XGBoost算法实现中,能够很方便地获得不同特征变量与盾构土压之间的相关性数值。相关性数值越大,表明一个特征变量与盾构土压越相关,应该优先选择;反之,相关性数值较小的特征变量,可以筛掉不计,以减少计算数据量,缩短后续回归模型训练时间。
步骤二:传感器采集的原始数据经步骤一的特征提取处理成为待分析数据集,将待分析数据集进行移位变换分成训练集和验证集。
准备用于训练和验证回归模型的数据集合。XGBoost回归模型输出为未来时段(比如每30秒后)的土压值,而处理传感器采集的数据样本后(特征提取),得到每时刻的特征变量值,对应本时刻的土压值,故需对处理后的数据集继续进行移位变换。之后划分变换后的数据集,得到用于回归模型训练的集合---训练集,以及用于模型拟合度调优的集合---验证集,验证集主要用于模型调优,也小部分用于模型预测性能测试,用于模型预测性能测试的数据是传感器采集的数据经过特征提取和移位变换得来。
构建用于土压预测模型训练的数据集合。具体方法是,使每时刻的特征向量一一对应未来时刻的盾构土压值Label,实现步骤为:
Step 1:将盾构土压值Label列上移z个时间单位;
Step 2:删除分析数据集最后z行;
其中,z可根据实际需求选定,由于上移操作使标签列最后z行出现了空白标记,故需删除分析数据集的最后z行。如图2的示例,展示的是将土压值列上移一个时间单位的操作,注意到最后一行的土压值出现了空白标记NaN,故将最后一行的数据样本删除。
划分经过上述整形变换的数据集,得到用于回归模型训练和验证的集合,训练集与验证集所包含数据样本数量的比例定为:3:1。为了避免训练的XGBoost回归模型出现过拟合的情况,采用交叉验证的方式,生成四轮用于XGBoost回归模型训练的训练集和验证的验证集的组合。如图3所示,将移位变换后的数据集划分为4等份(部分A、B、C、D),每一轮依次选择一份数据样本用作验证集,同时保证了训练集与验证集的比例为:3:1。
步骤三:生成初始XGBoost回归模型,使用步骤二获得的训练集训练初始XGBoost回归模型,通过网格搜索方式,得到最优模型参数,即最优的回归树数目和树的最大深度;将验证集中的数据样本输入经参数优化后的XGBoost回归模型,以均方根误差(RMSE)和决定系数(R2 Score)为指标对训练后的XGBoost回归模型的预测性能进行评估,并以文件形式保存得到最优的XGBoost土压回归模型,方便后续调取使用。
使用Python编程语言,并调用程序包scikit-learn提供的API,构建XGBoost回归模型。训练初始XGBoost回归模型生成回归树集合时,使用如下式所示的带正则项的目标函数:
Figure BDA0002785432350000071
Figure BDA0002785432350000072
该目标函数的第一项
Figure BDA0002785432350000081
是损失函数,这里选用MSE(均方误差),
Figure BDA0002785432350000082
为初始XGBoost回归模型对训练集中一条数据样本即第i个特征向量xi的进行预测得到的目标值,yi为该数据样本对应的真实目标值,i就是用于下标序号的代数符号,目标函数L(φ)的第一项计算初始XGBoost回归模型对所有数据样本的预测值与真实值的偏差之和;第二项Ω()是正则惩罚项,通过调节系数γ和λ的大小,控制生成的K棵回归树的复杂度,防止出现过拟合情况。f泛指某棵回归树的映射关系,fk表示第k棵回归树的映射关系。其中,T表示每棵回归树叶子节点的数量,而||ω||2表示T个叶子节点权重的L2范数,即叶子节点权重向量ω的欧式距离,如下式所示:
Figure BDA0002785432350000083
权重向量ω有n个维度,ωi为权重向量ω第i个维度的取值。使用上述目标函数的目的在于,在确保XGBoost回归模型能够拟合(预测与真实值之间的误差尽量小)盾构土压在未来时段内变化情况的同时,降低模型的复杂度(控制叶子节点数目,减少树分支),防止过拟合现象的产生。
在训练、验证XGBoost回归模型时,采用网格搜索的方式,调整初始XGBoost回归模型的两项参数:生成回归树数目和回归树的最大深度。下面是设置搜索网格的示例:
生成回归树数目:[1,2,3,...,j-1,j],
回归树最大深度:[1,2,3,...,k-1,k];
假设最大生成回归树数目为j,最大的回归树深度为k。可遍历所有生成回归树数目和回归树最大深度的组合(比如(2,3)和(1,4)是两种不同的组合,共计j×k种),依次选用每一种参数组合,计算在训练集上的土压值,当计算所得的土压值与真实土压值之间的误差最小时,对应的参数组合即为最优解,即获得最优的回归树数目和树的最大深度。
XGBoost回归模型土压预测性能评估指标定为:均方根误差RMSE和决定系数R2。其中,RMSE通过如下公式定义:
Figure BDA0002785432350000084
该指标指示回归模型进行n次盾构土压值预测后,平均每一次预测的数值偏差。R2系数通过下面的公式定义:
Figure BDA0002785432350000091
Figure BDA0002785432350000092
Figure BDA0002785432350000093
训练后的XGBoost回归模型对n条数据样本(特征向量)进行预测,yi表示第i条数据样本的真实土压值,
Figure BDA0002785432350000094
是第i条数据样本的预测土压值,
Figure BDA0002785432350000095
为n条数据样本的真实土压平均值。SSE为残差平方和,SST为总体平方和。R2系数反映未来时段盾构土压的变化情况能通过XGBoost回归模型被特征变量解释的比例(百分数形式,最大为100%),更为直观地,R2Score越高,XGBoost回归模型对土压值的预测结果就越接近真实情况。通过在多台土压平衡盾构机实际施工数据集上进行的测试实验,表明利用本发明训练得到的XGBoost回归模型,对土压值的预测精度达到量级:RMSE,0.09(bar,土压单位);R2 Score,90%~95%。最后,利用Python程序包joblib,以pkl文件的形式保存获得的XGBoost土压回归模型,通过如下语句实现:
import joblib;
joblib.dump(xgb_model,‘regression_model.pkl’)。
步骤四:使用步骤三得到的XGBoost土压回归模型进行盾构土压值预测:载入在步骤三中获得的XGBoost土压回归模型的文件,输入每时刻与土压相关的特征向量,使用XGBoost土压回归模型计算出未来时段的土压值,并绘制预测曲线。
并以三种形式绘制预测曲线,即动态生成方式分别绘制真实值和预测值及真实值与预测值的重叠对比的曲线。
通过Python程序包joblib载入保存的XGBoost土压回归模型并得到回归器regressor:
regressor=joblib.load(‘regression_model.pkl’);
反复调用回归器regressor,利用XGBoost土压回归模型处理采集获得的盾构机施工数据,实现对未来时段的盾构土压值进行预测:
predic_value=regressor.predict(sampling_data)
sampling_data是使用实际采集的数据,经特征提取(步骤一中确定)后形成的特征向量,predic_value为XGBoost土压模型输出的预测土压值。
利用Python中绘图库matplotlib进行土压预测结果可视化呈现。其中,如图4给出的示例,动态生成预测土压变化曲线的方式,根据XGBoost土压回归模型的实时输出,动态展现未来时段盾构土压的变化情况;如图5所示,分别绘制土压真实和预测情况的方式,适用于呈现XGBoost土压回归模型批量预测土压值,并与真实情况进行对照的场景;而重叠绘制真实情况和预测情况的方式,如图6的示例,能够明晰地对照出预测情况与真实情况的偏差。
本发明提供的盾构机土压预测及绘制土压预测曲线的方法,针对在盾构施工中无法预知重要参量土仓压力值的问题,利用盾构掘进施工数据,采用Python数据处理技术与XGBoost机器学习算法,生成预测土压值的回归模型,并通过不同的土压预测曲线绘制方式,有效实现了提前获得及可视化土仓压力变化情况的功能,为预防盾构施工中潜在的地质灾害,确保盾构机正常、安全地运转提供了可行的实现方法与技术支持。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于XGBoost算法预测盾构机土仓压力的方法,其特征在于,其步骤如下:
步骤一:特征提取:通过XGBoost算法筛掉与土仓压力变化相关性数值小的特征变量,选取与土仓压力变化关联的相关变量,并将选取的所有相关变量汇集,作为表征土仓压力变化的特征向量;
步骤二:传感器采集的原始数据经步骤一的特征提取处理成为待分析数据集,将待分析数据集进行移位变换分成训练集和验证集;
步骤三:投喂步骤二获得的训练集以获得初始XGBoost回归模型,并通过网格搜索方式,得到最优模型参数;将验证集中的数据样本输入经参数优化后的XGBoost回归模型,对其预测性能进行评估,最后以文件形式保存得到最优的XGBoost土压回归模型;
步骤四:XGBoost土压回归模型进行盾构土压值预测:载入在步骤三中获得的XGBoost土压回归模型的文件,输入每时刻与土压相关的特征向量,使用XGBoost土压回归模型计算出未来时段的土压值,并绘制预测曲线。
2.根据权利要求1所述的基于XGBoost算法预测盾构机土仓压力的方法,其特征在于,所述步骤一中XGBoost算法的实现方法为:利用树集成的思想将K棵回归树的结果进行求和,作为最终的预测值:
数据集合表示为:
Figure FDA0002785432340000011
其中,数据集合D中样本条目数为n,xi为m维的特征向量,yi为第i个特征向量xi对应的土仓压力值,
Figure FDA0002785432340000012
为实数集,i为序号下标,且1<=i<=n;
XGBoost算法生成回归树的集合F为:
Figure FDA0002785432340000013
其中,q为一棵回归树结构的确定法则,即将m维的特征向量xi映射到T个叶子节点的数值,而T个叶子节点数值的权重由T维向量ω指定;f(x)表示某一棵回归树的映射关系,即由特征向量x映射至目标值f(x),Wq(x)为一棵回归树的结构由法则q确定,并将特征向量x映射至目标值Wq(x);
一条数据样本的回归值由K棵回归树的计算结果的和确定:
Figure FDA0002785432340000014
其中,
Figure FDA0002785432340000015
表示第i个预测土压值,
Figure FDA0002785432340000016
表示映射特征向量xi得到的预测值,fk(xi)表示第k棵回归树对特征向量xi进行映射得到的回归数值,fk表示第k棵回归树的映射关系;
通过XGBoost算法对比使用不同特征变量的预测土压值与实际值的误差,并根据误差的大小判断不同的特征变量与盾构土压之间的相关程度,获得不同特征变量与盾构土压之间的相关性数值,选取误差最小的特征变量组合。
3.根据权利要求1或2所述的基于XGBoost算法预测盾构机土仓压力的方法,其特征在于,所述步骤二中移位变换的方法为:
使每时刻的特征向量一一对应未来时刻的盾构土压值Label,实现步骤为:
Step1:将盾构土压值Label的列上移z个时间单位;
Step2:删除分析数据集的最后z行。
4.根据权利要求3所述的基于XGBoost算法预测盾构机土仓压力的方法,其特征在于,所述训练集与验证集所包含数据样本数量的比例定为:3:1;采用交叉验证的方式,生成四轮用于XGBoost回归模型训练的训练集和验证的验证集的组合,即将移位变换后的数据集均分为4等份,每一轮依次选择一份数据样本用作验证集。
5.根据权利要求2所述的基于XGBoost算法预测盾构机土仓压力的方法,其特征在于,所述步骤三中训练初始XGBoost回归模型生成回归树集合时,使用带正则项的目标函数:
Figure FDA0002785432340000021
Figure FDA0002785432340000022
其中,L(φ)为目标函数,
Figure FDA0002785432340000023
是损失函数,
Figure FDA0002785432340000024
为初始XGBoost回归模型对训练集中第i个特征向量xi进行预测得到的预测土压值,yi为数据样本对应的真实目标值;Ω(f)是正则惩罚项,通过调节系数γ和λ的大小控制生成的K棵回归树的复杂度;fk表示第k棵回归树的映射关系,T表示每棵回归树叶子节点的数量,而||ω||2表示T个叶子节点权重的L2范数,即叶子节点的权重向量ω的欧式距离(Euclidean Distance),如下式所示:
Figure FDA0002785432340000025
其中,权重向量ω有n个维度,ωi为权重向量ω的第i个维度的取值。
6.根据权利要求1或5所述的基于XGBoost算法预测盾构机土仓压力的方法,其特征在于,所述步骤三中得到最优模型参数,即找到最优的回归树数目和树的最大深度;
所述网格搜索方式的设置方法为:设置搜索网格为:
生成回归树数目:[1,2,3,...,j-1,j],
回归树最大深度:[1,2,3,...,k-1,k];
最大生成回归树数目为j,最大的回归树深度为k;遍历所有生成回归树数目和回归树最大深度的参数组合,依次选用每一种参数组合,计算在训练集上的土压值,当计算所得的土压值与真实土压值之间的误差最小时,对应的参数组合即为最优解,即获得最优的回归树数目和树的最大深度。
7.根据权利要求1所述的基于XGBoost算法预测盾构机土仓压力的方法,其特征在于,所述步骤三中对预测性能进行评估的方法为:
训练后的XGBoost回归模型的土压预测性能评估指标为:均方根误差RMSE和决定系数R2,且:
Figure FDA0002785432340000031
均方根误差RMSE为训练后的XGBoost回归模型进行n次盾构土压值预测后,平均每一次预测的数值偏差;
决定系数R2为:
Figure FDA0002785432340000032
Figure FDA0002785432340000033
Figure FDA0002785432340000034
训练后的XGBoost回归模型对n条数据样本进行预测,yi表示第i条数据样本的真实土压值,
Figure FDA0002785432340000035
是第i条数据样本的预测土压值,
Figure FDA0002785432340000036
为n条数据样本的真实土压平均值,SSE为残差平方和,SST为总体平方和。
8.根据权利要求7所述的基于XGBoost算法预测盾构机土仓压力的方法,其特征在于,所述步骤三中以文件形式保存得到最优的XGBoost土压回归模型的方法为:利用Python程序包joblib以pkl文件的形式保存获得的XGBoost土压回归模型。
9.根据权利要求8所述的基于XGBoost算法预测盾构机土仓压力的方法,其特征在于,所述步骤四中使用XGBoost土压回归模型计算出未来时段的土压值的方法为:
通过Python程序包joblib载入保存的XGBoost土压回归模型,利用该模型处理采集获得的盾构机施工数据,实现对未来时段的盾构土压值进行预测。
10.根据权利要求1或9所述的基于XGBoost算法预测盾构机土仓压力的方法,其特征在于,所述步骤四中绘制预测曲线的方法为利用Python中绘图库matplotlib进行土压预测结果的可视化呈现;以三种形式绘制预测曲线:动态生成预测土压变化曲线的方式、分别绘制土压真实情况和预测情况的方式、重叠绘制真实情况和预测情况的方式。
CN202011296026.7A 2020-11-18 2020-11-18 一种基于XGBoost算法预测盾构机土仓压力的方法 Pending CN112348278A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011296026.7A CN112348278A (zh) 2020-11-18 2020-11-18 一种基于XGBoost算法预测盾构机土仓压力的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011296026.7A CN112348278A (zh) 2020-11-18 2020-11-18 一种基于XGBoost算法预测盾构机土仓压力的方法

Publications (1)

Publication Number Publication Date
CN112348278A true CN112348278A (zh) 2021-02-09

Family

ID=74363009

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011296026.7A Pending CN112348278A (zh) 2020-11-18 2020-11-18 一种基于XGBoost算法预测盾构机土仓压力的方法

Country Status (1)

Country Link
CN (1) CN112348278A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113326660A (zh) * 2021-06-17 2021-08-31 广西路桥工程集团有限公司 基于GA-XGBoost模型的隧道围岩挤压变形预测方法
CN113537336A (zh) * 2021-03-10 2021-10-22 沈阳工业大学 基于XGBoost的短临雷雨大风的预测方法
CN114235740A (zh) * 2021-11-12 2022-03-25 华南理工大学 一种基于XGBoost模型的废杂塑料光谱识别方法
CN114562236A (zh) * 2022-02-15 2022-05-31 中海油能源发展股份有限公司 一种基于集成学习模型的地质工程一体化井漏实时预警方法
CN114969953A (zh) * 2022-07-28 2022-08-30 华中科技大学 基于CatBoost-NSGA-Ⅲ的盾构下穿隧道优化设计方法及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108846521A (zh) * 2018-06-22 2018-11-20 西安电子科技大学 基于Xgboost的盾构施工不良地质类型预测方法
US20200184131A1 (en) * 2018-06-27 2020-06-11 Dalian University Of Technology A method for prediction of key performance parameter of an aero-engine transition state acceleration process based on space reconstruction
CN111365015A (zh) * 2020-03-05 2020-07-03 中建交通建设集团有限公司 一种基于XGBoost的盾构掘进参数特征提取与姿态偏差预测方法
CN111738482A (zh) * 2020-04-20 2020-10-02 东华大学 一种聚酯纤维聚合过程中的工艺参数的调节方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108846521A (zh) * 2018-06-22 2018-11-20 西安电子科技大学 基于Xgboost的盾构施工不良地质类型预测方法
US20200184131A1 (en) * 2018-06-27 2020-06-11 Dalian University Of Technology A method for prediction of key performance parameter of an aero-engine transition state acceleration process based on space reconstruction
CN111365015A (zh) * 2020-03-05 2020-07-03 中建交通建设集团有限公司 一种基于XGBoost的盾构掘进参数特征提取与姿态偏差预测方法
CN111738482A (zh) * 2020-04-20 2020-10-02 东华大学 一种聚酯纤维聚合过程中的工艺参数的调节方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113537336A (zh) * 2021-03-10 2021-10-22 沈阳工业大学 基于XGBoost的短临雷雨大风的预测方法
CN113326660A (zh) * 2021-06-17 2021-08-31 广西路桥工程集团有限公司 基于GA-XGBoost模型的隧道围岩挤压变形预测方法
CN113326660B (zh) * 2021-06-17 2022-11-29 广西路桥工程集团有限公司 基于GA-XGBoost模型的隧道围岩挤压变形预测方法
CN114235740A (zh) * 2021-11-12 2022-03-25 华南理工大学 一种基于XGBoost模型的废杂塑料光谱识别方法
CN114562236A (zh) * 2022-02-15 2022-05-31 中海油能源发展股份有限公司 一种基于集成学习模型的地质工程一体化井漏实时预警方法
CN114969953A (zh) * 2022-07-28 2022-08-30 华中科技大学 基于CatBoost-NSGA-Ⅲ的盾构下穿隧道优化设计方法及设备

Similar Documents

Publication Publication Date Title
CN112348278A (zh) 一种基于XGBoost算法预测盾构机土仓压力的方法
CN109635461B (zh) 一种应用随钻参数来自动识别围岩级别的方法和系统
Zhang et al. Multivariate adaptive regression splines and neural network models for prediction of pile drivability
CN109978226B (zh) 基于循环神经网络的盾构施工地面沉降预测方法
CN111160571B (zh) 一种基于土压平衡盾构机参数数据驱动反演地质的方法
Salimi et al. Evaluating the suitability of existing rock mass classification systems for TBM performance prediction by using a regression tree
EP3246858A1 (en) Computer implemented method for generating a field development plan (fdp) for the exploitation of oil and gas reservoirs
CN109447152B (zh) 一种基于蒙特卡洛树搜索和神经网络的故障预测方法
CN112966722A (zh) 基于半监督随机森林模型的区域滑坡易发性预测方法
CN112614021B (zh) 一种基于已建隧道信息智能识别的隧道围岩地质信息预测方法
Chen et al. Prediction of TBM tunneling parameters through an LSTM neural network
KR20180116922A (ko) 쉴드 tbm의 순굴진속도 예측 장치 및 그 방법
CN114036841A (zh) 基于半监督支持向量机模型的滑坡易发性预测方法及系统
CN114662699A (zh) 一种基于机器学习的盾构姿态预测方法
Zhang et al. Geological type recognition by machine learning on in-situ data of EPB tunnel boring machines
Song et al. Potential for vertical heterogeneity prediction in reservoir basing on machine learning methods
CN113323676B (zh) 用主成分分析-长短记忆模型确定盾构机刀盘扭矩的方法
CN110671092A (zh) 油气产能检测方法及系统
CN113762360A (zh) 一种基于smote+adacost算法的tbm掘进过程中的围岩等级预测方法
Zhou et al. Hybrid random forest-based models for predicting shear strength of structural surfaces based on surface morphology parameters and metaheuristic algorithms
CN111209528B (zh) 一种边坡累计位移分级预警阀值确定方法
CN116050285A (zh) 泥水平衡盾构机盾尾密封油脂消耗预测方法及系统
CN115859826A (zh) 一种基于集成学习的盾构设备故障融合预测方法
CN115773127A (zh) 一种泥水平衡盾构智能决策方法、系统、设备及介质
Wei et al. A symbolic tree model for oil and gas production prediction using time-series production data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210209