CN113901609A - 一种盾构机多源掘进参数关联性分析方法 - Google Patents

一种盾构机多源掘进参数关联性分析方法 Download PDF

Info

Publication number
CN113901609A
CN113901609A CN202111181541.5A CN202111181541A CN113901609A CN 113901609 A CN113901609 A CN 113901609A CN 202111181541 A CN202111181541 A CN 202111181541A CN 113901609 A CN113901609 A CN 113901609A
Authority
CN
China
Prior art keywords
parameters
tunneling
pressure
analyzing
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111181541.5A
Other languages
English (en)
Inventor
陈思斌
黄永亮
王伯芝
门燕青
刘凤洲
陈文明
邢慧堂
刘学增
曹玉鑫
丁爽
桑运龙
师刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Rail Transit Research Institute Co ltd
SHANGHAI TONGYAN CIVIL ENGINEERING TECHNOLOGY CO LTD
Jinan Rail Transit Group Co Ltd
Original Assignee
Shandong Rail Transit Research Institute Co ltd
SHANGHAI TONGYAN CIVIL ENGINEERING TECHNOLOGY CO LTD
Jinan Rail Transit Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Rail Transit Research Institute Co ltd, SHANGHAI TONGYAN CIVIL ENGINEERING TECHNOLOGY CO LTD, Jinan Rail Transit Group Co Ltd filed Critical Shandong Rail Transit Research Institute Co ltd
Priority to CN202111181541.5A priority Critical patent/CN113901609A/zh
Publication of CN113901609A publication Critical patent/CN113901609A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/17Mechanical parametric or variational design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/14Force analysis or force optimisation, e.g. static or dynamic forces

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Geometry (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Excavating Of Shafts Or Tunnels (AREA)

Abstract

本发明涉及一种盾构机多源掘进参数关联性分析方法,包括:步骤1:获取盾构机多源数据,并对数据进行预处理;步骤2:基于方差选择法进行掘进参数的初步筛选;步骤3:进行两两参数之间的线性关系分析;步骤4:进行两两参数之间的非线性关系分析;步骤5:基于多元线性回归模型进行被动参数与主动参数之间的线性关系分析;步骤6:基于多项式回归模型进行被动参数与主动参数之间的非线性关系分析;步骤7:经过步骤6筛选后剩余的参数,利用随机森林算法进行被动参数与主动参数之间的模型训练,并根据特征重要性选择最优参数组合。与现有技术相比,本发明具有准确性高、更加可靠、直观、效率高、分析能力强的等优点。

Description

一种盾构机多源掘进参数关联性分析方法
技术领域
本发明涉及盾构机参数处理技术领域,尤其是涉及一种盾构机多源掘进参数关联性分析方法。
背景技术
目前盾构施工仍然以人工操作为主,而面对大量的盾构机掘进参数操作员很难全面分析各参数并及时作出准确的调整,进而影响掘进效率。为了弥补人工操作的不足,机器学习成为解决盾构机掘进参数预测的重要手段,不少学者利用神经网络、LSTM、随机森林等机器学习算法进行模型训练并实现掘进参数的预测。对于机器学习而言,模型的选取和模型的输入量是决定预测效果的两大关键因素。本发明要解决的核心技术问题是提供一种有效分析盾构机多源掘进参数的关联性分析方法,同时给出了存在关联性的被动参数的经验公式,从而达到便捷确定训练模型合理输入量的目标。
中国专利CN110069893A公开了一种基于多项式回归的盾构机掘进参数的预测方法,该方法以部分掘进参数为输入量、关键掘进参数为输出量,利用神经网络算法进行模型训练与预测。其中,输入的部分掘进参数同样是基于Pearson相关系数进行了输出掘进参数与输入掘进参数的相关性分析,并选取相关性强的参数作为输入的掘进参数。中国专利CN110084322A中公开了一种基于神经网络的盾构机掘进参数的预测方法,该方法以部分掘进参数为输入量、关键掘进参数为输出量,利用神经网络算法进行模型训练与预测。其中,输入的部分掘进参数同样是基于Pearson相关系数进行了输出掘进参数与输入掘进参数的相关性分析,并选取相关性强的参数作为输入的掘进参数。中国专利CN111488694A公开了一种基于多元线性自回归的泥水盾构机掘进关键参数预测方法,该方法以当前时刻以及之前的一段时间内部分掘进参数为输入量,下一时刻关键的掘进参数为输出量,建立多元线性自回归模型,从而可实现未来掘进参数的预测。在进行输入量掘进参数的选取时,仍然采用Pearson相关系数进行相关性分析,选取与输出量相关性强的掘进参数作为输入量。
上述专利涉及的关联性分析主要是在机器学习模型训练之前,依据Pearson相关系数等线性关系分析结果选取掘进参数,分析方法十分简单、极容易忽略非线性相关的参数关联关系,且面临预测结果包含被动量、无法进行参数调整的缺陷。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种准确性高、更加可靠、直观、效率高、分析能力强的盾构机多源掘进参数关联性分析方法。
本发明的目的可以通过以下技术方案来实现:
一种盾构机多源掘进参数关联性分析方法,所述的关联性分析方法包括:
步骤1:获取盾构机多源数据,并对数据进行预处理;
步骤2:基于方差选择法进行掘进参数的初步筛选;
步骤3:进行两两参数之间的线性关系分析;
步骤4:进行两两参数之间的非线性关系分析;
步骤5:基于多元线性回归模型进行被动参数与主动参数之间的线性关系分析;
步骤6:基于多项式回归模型进行被动参数与主动参数之间的非线性关系分析;
步骤7:经过步骤6筛选后剩余的参数,利用随机森林算法进行被动参数与主动参数之间的模型训练,并根据特征重要性选择最优参数组合。
优选地,所述的盾构机多源数据包括盾构机主动参数和盾构机被动参数;所述的盾构机主动参数包括A组推进压力、B组推进压力、C组推进压力、D组推进压力、推进速度、刀盘转速和螺机转速。
更加优选地,所述的盾构机被动参数包括总功率、刀盘压力、总推进力、推进压力、滚动角、俯仰角、设备桥压力、铰接压力、螺机前部压力、螺机后部压力、螺机泵压力、螺机扭矩、左上土仓压力、左中土仓压力、左下土仓压力、右下土仓压力、右中土仓压力、顶部土仓压力、刀盘扭矩、A组推进位移、B组推进位移、C组推进位移、D组推进位移、左上铰接位移、左下铰接位移、右上铰接位移和右下铰接位移。
优选地,所述步骤1中的预处理方法为:
对盾构数据进行数据清洗,进行非掘进状态数据的检测以及起始阶段和平稳运行阶段数据的分离。
优选地,所述的步骤2具体为:
步骤2-1:计算各掘进参数的方差;
计算方法为:
Figure BDA0003297444620000031
其中,σ2为方差;xi为样本数据;x为样本均值。
步骤2-2:剔除方差小于0.01的参数。
优选地,所述的步骤3具体为:
利用Pearson相关系数对步骤2筛选后的数据进行两两之间的计算,Pearson相关系数的计算方法为:
Figure BDA0003297444620000032
其中,Cov(X,Y)为协方差;D(X)和D(Y)为特征参数分别对应的方差;
对相关性较强的参数进行一元线性回归分析,同时后续分析时线性相关性较强的两个参数只保留一个。
优选地,所述的步骤4具体为:
对经过步骤3筛选后的参数利用MIC来度量非线性关系,计算公式如下:
Figure BDA0003297444620000033
Figure BDA0003297444620000034
式中,B为常数,是一个经验值;
对相关性较强的参数进行一元非线性回归分析,同时后续分析时对相关性强的两个参数忽略因变量,只保留自变量。
优选地,所述的步骤5具体为:
基于多元线性回归模型进行被动参数与主动参数之间的线性关系分析,对于存在线性关系的给出回归模型公式,同时后续分析时忽略该被动参数。
优选地,所述的步骤6具体为:
基于多项式回归模型进行被动参数与主动参数之间的非线性关系分析,对于存在关联关系的给出多项式回归模型公式,同时后续分析时忽略该被动参数。
优选地,所述的步骤7中的模型训练方法为:
首先,根据预设比例将数据划分为训练集和测试集,采用R2进行模型评估,训练集和测试集的R2均大于预设阈值的参数表示能够通过随机森林建立关联,其余参数之间认为相互独立、无相关关系,直接舍弃。
与现有技术相比,本发明具有以下有益效果:
一、准确性高:本发明中的盾构机多源掘进参数关联性分析方法采用层层递进式关联性分析,可以更加高效、合理的确定机器学习训练模型输入量,提高输入样本的稳健性和质量,进而提高模型训练的效率和预测的精度。
二、更加可靠:本发明中的盾构机多源掘进参数关联性分析方法蕴含了所有重要的参数,公开了任意两两参数之间和多元参数之间的关联性分析方法,更有利于让操作员直观的了解如何更好的调整参数;更为重要的是,本发明有效区分了盾构机被动参数与主动参数、并公开了两类参数之间的关联性分析方法,可以帮助操作员更好地调节主动参数,如刀盘扭矩对掘进十分重要,但该参数无法直接调整,必须通过调整各组推进压力等主动参数来间接控制,而现有公开技术因未区分盾构机掘进的被动参数与主动控制参数,得到的是多个被动参数或多个主动参数之间的相关性,显然无法达到调整被动参数的目的。
三、更加直观:本发明中的盾构机多源掘进参数关联性分析方法为了让盾构机操作员更简单明了地理解各掘进参数之间的关联性,在进行关联性分析时尽快能利用简单的模型来进行回归分析,例如多项式拟合的被动参数如若利用随机森林算法、神经网络算法往往可以得到拟合优度更好的结果,但是这类机器学习模型的结果属于“黑匣子”,无法给出明确的关联公式,因此不够直观,也不利于操作员直接在实际工程中使用,因此,本发明优先考虑简单的模型来进行关联性分析,这样对于操作员可以更好地理解存在的关联性。
四、效率高:本发明中的盾构机多源掘进参数关联性分析方法采用了Pearson相关系数线性分析和MIC评估相结合,在进行回归拟合之前首先评估各参数间是否存在关联以及存在哪种关联,且优先进行线性分析,大幅调高了两两关联参数的分析效率;同时用层层递进的分析思路,提前判断关联类型,由简入繁、确定参数间关联性后即将该类参数数据剔除,大大减少了拟合次数,因此本发明可以分析更多的参数且分析效率更高。
五、分析能力强:本发明中的盾构机多源掘进参数关联性分析方法在被动参数与主动参数的多参数关联性分析方面,相比传统的多项式回归分析方法,本发明在考虑各参数不同多项式次数的基础上,采用各参数特征扩展的思路,增加了不同参数组成的耦合项分析,充分考虑了各参数的耦合作用,增强了多项式建模分析能力。
附图说明
图1为本发明中盾构机多源掘进参数关联性分析方法的流程示意图;
图2为本发明实施例中四个核心参数取值变化趋势图;
图3为本发明实施例中某环的起始点和终止点识别结果图;
图4为本发明实施例中筛选出的四个方差较小参数的取值变化趋势图,其中图4(a)为铰接压力参数的取值变化趋势图,图4(b)为顶部土仓压力参数的取值变化趋势图,图4(c)为螺机前部压力参数的取值变化趋势图;
图5为本发明实施例中存在线性关系的参数的散点图及拟合曲线;
其中,图5(a)为刀盘压力与刀盘扭矩参数的散点图及拟合曲线;
图5(b)为总功率与刀盘扭矩参数的散点图及拟合曲线;
图5(c)为D组推进位移与A组推进位移参数的散点图及拟合曲线;
图5(d)为B组推进位移与A组推进位移参数的散点图及拟合曲线;
图5(e)为C组推进位移与A组推进位移参数的散点图及拟合曲线;
图5(f)为推进压力与B组推进压力参数的散点图及拟合曲线;
图5(g)螺机泵压力与螺机扭矩参数的散点图及拟合曲线;
图5(h)为右中土仓压力与左上土仓压力参数的散点图及拟合曲线;
图5(i)为右下土仓压力与左上土仓压力参数的散点图及拟合曲线;
图5(j)为左下土仓压力与左上土仓压力参数的散点图及拟合曲线;
图6为本发明实施例中基于多元回归公式的总推进力预测值与实际值对比图;
图7为本发明实施例中基于多元回归公式的刀盘扭矩预测值与实际值对比图;
图8为本发明实施例中基于多项式回归公式的左上土仓压力、螺机后部压力、螺机扭矩预测值与实际值对比图,图8(a)、图8(b)和图8(c)分别对应左上土仓压力、螺机后部压力、螺机扭矩三个参数。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
现有技术进行掘进参数的关联性分析的基本步骤如下:
(1)选取推进速度、贯入度、刀盘扭矩、总推进力、刀盘转速、泥水仓压力(泥水盾构)或土仓压力(土压平衡盾构)6个掘进参数进行分析;
(2)每环的掘进过程分为掘进时间和非掘进时间,根据每环的刀盘扭矩、贯入度等多个掘进参数的数据为0来识别出非掘进时间内数据,删除每环的非掘进段数据,仅保留掘进段数据进行分析;
(3)利用3σ准则对每环6个参数的极端值进行检测,并以去除极端值后的各环6个参数的均值代表该环的掘进性能;
(4)两两参数之间的关联性分析,首先绘制两两参数之间的散点图,并分别用幂函数、指数函数、对数函数、线性函数、多项式等模型进行回归分析,并根据决定系数挑选较好的模型公式;
(5)多参数间多元线性回归模型分析,以推进速度为因变量,采用后退法计算模型,即最初将剩余的所有参数作为自变量进行回归拟合,每次剔除对因变量影响最不显著的自变量重新回归,直到方程中只有显著的变量为止;
(6)多参数间非线性模型分析,以推进速度为因变量,利用神经网络算法建立推进速度与其余五个参数的非线性模型。
上述方法的主要缺点是在进行多个参数的关联性分析时,仅对推进速度与其它参数的关联性进行了分析,对于大量隐藏的关联关系如刀盘扭矩与其它掘进参数的关联关系等没有挖掘出来,而刀盘扭矩的取值对盾构机平稳掘进是极其重要的。其次,上述方法根据调研结果仅仅分析了少量的几个掘进参数,而根据调研及盾构机施工现场操作人员交流,不同型号盾构机虽然有差别,但是不少型号的盾构机多达20个掘进参数(如刀盘转速、刀盘扭矩、土仓压力等)对盾构机安全平稳掘进有重要作用。再次,上述方法在进行各参数关联性分析时,由于各参数之间是否存在关联以及存在哪种关联不明确,因此研究者们采用了枚举法,即用所有常见的模型分别进行回归分析并对比结果,增大了工作量,分析效率较低。最后,上述方法没有明确区分主动参数、被动参数,而盾构机操作员只能调整主动参数,一些被动参数是随着主动参数的调整而不断发生变化的。前述常规方法选择的自变量中总推进力、刀盘扭矩都是不能直接调整的,因此基于该分析,操作员无法直观了解应当如何操作盾构机才能达到预设总推进力或者刀盘扭矩。
本发明在进行多参数间关联性分析时,所有被动参数与主动参数之间的关联性均进行了分析,充分挖掘了各参数之间的关联关系。另外本发明分析的参数多达30多个,蕴含了所有重要的参数。在进行两两参数之间的非线性分析时,通过计算两两参数之间的MIC,并选取取值较大的两个参数进行回归分析,避免了直接使用各种常见模型进行所有参数的回归分析,这样大大减少了工作量、提高了分析效率。部分被动参数是极其重要的、但是无法直接控制,必须通过主动参数间接控制,例如,刀盘扭矩如果取值过小,则盾构机将无法正常掘进,但该参数无法直接调整,只能通过主动参数的调整来间接控制。因此,研究被动参数与主动参数之间的关联性可以帮助盾构机操作员理解如何更精准地调整主动参数,既有公开技术显然无法解决这一问题,也没有提供解决的参考思路。
本发明提出的关联性分析方法一方面可以获得所有关系到盾构施工安全的主动参数与被动参数之间的定量关系,使操作员了解为了达成某种状态需要主动调整哪些参数、哪些参数会随之变化,从而直观、全面掌握盾构当前掘进的状态;另一方面有利于机器学习模型训练之前更高效、准确地筛选输入量,以提高后续训练的效率和预测的准确度。
一种盾构机多源掘进参数关联性分析方法,其流程如图1所示,包括:
步骤1:对盾构数据进行数据清洗,主要是非掘进状态数据的检测以及起始阶段和平稳运行阶段数据的分离;
步骤2:基于方差选择法进行掘进参数的初步筛选,将方差过小的参数直接忽略即可;
步骤3:经过步骤2筛选后剩余的参数,基于Pearson相关系数进行两两参数之间的线性关系分析,对相关性较强的参数进行一元线性回归分析,同时后续分析时线性相关性较强的两个参数保留一个即可;
步骤4:经过步骤3筛选后剩余的参数,基于MIC相关系数进行两两参数之间的非线性关系分析,对相关性较强的参数进行一元非线性回归分析,同时后续分析时对相关性强的两个参数忽略因变量,保留自变量即可;
步骤5:经过步骤4选后剩余的参数,基于多元线性回归模型进行被动参数与主动参数之间的线性关系分析,对于存在线性关系的给出回归模型公式,同时后续分析时忽略该被动参数;
步骤6:经过步骤5筛选后剩余的参数,基于多项式回归模型进行被动参数与主动参数之间的非线性关系分析,对于存在关联关系的给出多项式回归模型公式,同时后续分析时忽略该被动参数;
步骤7:经过步骤6筛选后剩余的参数,利用随机森林算法进行被动参数与主动参数之间的模型训练,并根据特征重要性选择最优参数组合。
下面提供一个具体应用案例:
步骤1:盾构机主动参数和被动参数列表及符号如下表1和表2:
表1盾构机主动参数
参数名称 符号 单位
A组推进压力 F<sub>A</sub> bar
B组推进压力 F<sub>B</sub> bar
C组推进压力 F<sub>C</sub> bar
D组推进压力 F<sub>D</sub> bar
推进速度 v mm/min
刀盘转速 n<sub>c</sub> r/min
螺机转速 n<sub>s</sub> r/min
表2盾构机被动参数
Figure BDA0003297444620000081
Figure BDA0003297444620000091
盾构机在掘进过程中,除正常掘进状态外还有一部分时间是处于关机状态(如处于日常维护状态)或者故障状态,此时产生的数据没有太多意义和价值,因此需要删除该部分数据样本,盾构机在非正常掘进状态应该满足下列条件之一:
a)推进速度为0(mm/min);
b)刀盘扭矩为0(kN·m);
c)刀盘转速为0(rpm);
d)总推进力为0(T)。
由于各核心盾构参数取值差别较大,为了能观察到各核心盾构参数在同一环内数据的演变,将各核心参数统一进行归一化处理,归一化范围到[0,1],计算公式如下:
Figure BDA0003297444620000101
观察图2可知,上述四个参数在非掘进状态时取值均为零,在掘进状态时四个参数取值均有明显变化。
盾构机在正常掘进时,可分为起始掘进段和平稳掘进段两部分,由于数据样本是连续均匀采集的,因此可通过剔除非正常掘进数据后相邻数据样本的时间节点是否连续来判断各掘进段的起始点和终止点,并将起始点以后的120s数据作为起始掘进段数据。图3给出了某环的起始点和终止点识别结果图。
步骤2:基于方差筛选法即计算各掘进参数的方差,并把方差极小(小于0.01)的即取值基本不变的参数直接剔除掉,下述表3和图4给出了方差极小的参数。
表3方差极小的参数
参数 方差
铰接压力 4.591553e-28
顶部土仓压力 0.000000
螺机前部压力 0.000000
步骤3:利用Pearson相关系数对经过步骤2筛选后的参数进行两两之间的计算,其中Pearson相关系数计算公式如下:
Figure BDA0003297444620000102
式中,Cov(X,Y)为协方差;D(X)和D(Y)为特征参数分别对应的方差。
Pearson相关系数可以很好地反映两变量之间的线性关系,且计算速度非常快。如果相关系数接近于1,则有很强的正相关性,如果相关系数接近于-1,则有很强的负相关性。表4给出了Pearson相关系数较大的两两参数,图5列出了存在线性关系的参数的散点图及拟合曲线。
表4 Pearson相关系数大于0.8的参数
Figure BDA0003297444620000103
Figure BDA0003297444620000111
观察表4、图5(a)和图5(b)可知,刀盘压力、总功率均与刀盘扭矩存在强线性关系,刀盘压力、总功率与刀盘扭矩的线性关系:
Fch=0.0347Tc+27.9786(R2=0.99)
Pt=0.1515Tc+313.0898(R2=0.71)
观察表4、图5(c)、图5(d)和图5(e)可知,各组推进位移存在着线性关系,可用A组推进位移来代替各组推进位移。各组推进位移与A组推进位移的关系:
SB=1.0079SA+11.6511(R2=0.99)
SC=1.0117SA+3.5451(R2=0.99)
SD=1.0024SA-8.1317(R2=0.99)
如图5(f)所示,推进压力与B组推进压力的关系:
Fp=0.9499FB+35.0682(R2=0.99)
如图5(g)所示,螺机泵压力与螺机扭矩的关系:
Fsp=1.5624Ts+25.9191(R2=0.96)
观察表4、图5(h)、图5(i)和图5(j)可知,各部分土仓压力均与左上土仓压力存在线性关系,可用左上土仓压力代替各部分土仓压力。各部分土仓压力与左上土仓压力的关系:
Frc=1.121Flu-0.0292(R2=0.88)
Frd=1.2093Flu+0.2066(R2=0.81)
Fld=0.6101Flu-0.0523(R2=0.67)
步骤4:对经过步骤3筛选后的参数利用MIC来度量非线性关系,计算公式如下:
Figure BDA0003297444620000121
Figure BDA0003297444620000122
式中,B为常数,是一个经验值,可取样本数量的0.6次方。
MIC能衡量各种类型的函数关系(如指数函数、幂函数、对数函数、三角函数等),且相关系数取值均接近于1,经过计算发现,两两参数之间没有明显的非线性关系。
步骤5:利用多元线性回归研究多参数之间的线性关系,这里以主动参数为自变量,研究各被动参数与主动参数之间的线性关联性。
如图6所示,总推进力与主动参数的多元线性关系:
Fs=31.7977FA+31.7993FB+31.8014FC+21.2169FD-0.6839(R2=0.99)
可见,总推进力由各组推进压力共同决。
如图7所示,刀盘扭矩与主动参数之间的线性关系:
Tc=5.4214FA+4.3150FB+3.8528FC+1.4900FD+7.006v+10.3335ns+30.2467
(R2=0.68)
步骤6:对步骤5剩余的状态参数继续利用多项式回归来挖掘关联关系,多项式回归能挖掘出一定的非线性关系,基本原理如下:
多元线性回归模型可用下式表示:
Figure BDA0003297444620000123
式中:w0~w7代表常数项及各参数项系数,x1~x7分别代表FA、FB、FC、FD、v、nc、ns
则最高次数为2的多项式回归模型如下:
Figure BDA0003297444620000124
式中,w0、wi、wi,j代表常数项及各参数项系数,xi和xj代表各个主动参数。
在建立多项式回归模型时,多项式最高次数是极其重要的超参数,这里选取多项式次数为2,而主动参数为7个,则扩展后的参数项有
Figure BDA0003297444620000125
参数项较多。为了方便叙述公式,计算结果将用表格的形式给出参数项及其对应系数,如表5所示,图8列出了基于多项式回归公式的左上土仓压力、螺机后部压力、螺机扭矩预测值与实际值对比图。
表5多项式回归各参数项系数计算结果
Figure BDA0003297444620000131
Figure BDA0003297444620000141
步骤7:对步骤6剩余的状态参数利用随机森林算法继续挖掘与主动参数的关联关系。在利用随机森林算法进行模型训练时,将70%的数据划分为训练集,30%的数据划分为测试集,采用R2进行模型评估,训练集和测试集R2均大于0.7的参数表示可通过随机森林建立关联,其余参数之间可认为相互独立、无相关关系,可以舍弃。经过步骤6后被动参数还有滚动角、俯仰角、设备桥压力、左中土仓压力、A组推进位移、左上铰接位移、左下铰接位移、右上铰接位移、右下铰接位移。结果发现剩余的被动参数无法与主动参数之间建立有效的模型。进一步研究上述剩余的被动参数发现,这些参数基本属于观测值,的确与主动参数之间无明显关联性。
本发明的主要创新点在于:
一、层层递进式关联性分析
面对较多的掘进参数,本发明提出了层层递进式的关联性分析思路,即从简到繁,层层筛选,同时充分考虑了在进行建模时模型尽可能简单而又不失准确性。1)本发明首先利用方差筛选法筛选掉部分参数,为后续分析简化了工作量。2)对上述剩余的掘进参数进行两两参数之间的关联性分析,基于Pearson相关系数进行两两参数之间线性关系评估,部分参数之间有较强的线性关联性,此时线性模型已经足够良好,因此对于这部分参数后续仅保留一个即可,进一步简化了分析的参数数量。3)对上述剩余的参数利用MIC进行非线性评估,对于非线性模型较好的,保留自变量即可,进一步简化了参数数量。4)同理对于被动参数与主动参数之间的多参数关联性分析时,依次利用多元线性回归分析、多项式回归分析,每层已经建立良好模型的参数后续不再分析,最后利用随机森林算法进行分析,此时参数已经比较少了。本发明提出的层层递进式关联性分析适合盾构机大量掘进参数的关联性分析。
二、基于MIC进行两两参数之间非线性评估
在进行两两参数之间的非线性分析时,常常使用的方法是利用常见的模型如指数函数、对数函数、多项式函数、幂函数等分别尝试建立模型,并对比模型之间的优良,而对于大量的掘进参数这种方法工作量太大。本发明提出了利用MIC来进行参数的初步筛选,该值可很好地评估上述各函数模型,因此仅对MIC取值较大的两个参数进行建立模型即可,大大简化了工作量。
三、Pearson相关系数和MIC联用分析线性和非线性关系
Pearson相关系数是用来评估两参数之间的线性关系,MIC可用来评估线性和非线性关系,因此本发明首先进行Pearson相关系数分析,并将存在强线性关系的参数筛除掉。由于存在线性关系的参数已经筛除掉,因此此时利用MIC分析的是非线性关系。本发明步骤3(Pearson)和步骤4(MIC)联用且步骤3在前,可高效地分析线性和非线性关系。
四、多参数间包含耦合项的多项式回归分析
在进行被动参数与主动参数的多参数间关联性分析时,本发明利用了多项式回归分析挖掘部分非线性关系。在传统方法上,利用多项式回归分析时仅考了各参数的不同多项式次数,而没有考虑不同参数组成的耦合项,而本发明在进行多项式回归分析时,首先对多项式进行了所有参数项的各独立项及耦合项扩展,充分考虑了各个变量的耦合作用,增强了多项式建模能力。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种盾构机多源掘进参数关联性分析方法,其特征在于,所述的关联性分析方法包括:
步骤1:获取盾构机多源数据,并对数据进行预处理;
步骤2:基于方差选择法进行掘进参数的初步筛选;
步骤3:进行两两参数之间的线性关系分析;
步骤4:进行两两参数之间的非线性关系分析;
步骤5:基于多元线性回归模型进行被动参数与主动参数之间的线性关系分析;
步骤6:基于多项式回归模型进行被动参数与主动参数之间的非线性关系分析;
步骤7:经过步骤6筛选后剩余的参数,利用随机森林算法进行被动参数与主动参数之间的模型训练,并根据特征重要性选择最优参数组合。
2.根据权利要求1所述的一种盾构机多源掘进参数关联性分析方法,其特征在于,所述的盾构机多源数据包括盾构机主动参数和盾构机被动参数;所述的盾构机主动参数包括A组推进压力、B组推进压力、C组推进压力、D组推进压力、推进速度、刀盘转速和螺机转速。
3.根据权利要求2所述的一种盾构机多源掘进参数关联性分析方法,其特征在于,所述的盾构机被动参数包括总功率、刀盘压力、总推进力、推进压力、滚动角、俯仰角、设备桥压力、铰接压力、螺机前部压力、螺机后部压力、螺机泵压力、螺机扭矩、左上土仓压力、左中土仓压力、左下土仓压力、右下土仓压力、右中土仓压力、顶部土仓压力、刀盘扭矩、A组推进位移、B组推进位移、C组推进位移、D组推进位移、左上铰接位移、左下铰接位移、右上铰接位移和右下铰接位移。
4.根据权利要求1所述的一种盾构机多源掘进参数关联性分析方法,其特征在于,所述步骤1中的预处理方法为:
对盾构数据进行数据清洗,进行非掘进状态数据的检测以及起始阶段和平稳运行阶段数据的分离。
5.根据权利要求1所述的一种盾构机多源掘进参数关联性分析方法,其特征在于,所述的步骤2具体为:
步骤2-1:计算各掘进参数的方差;
计算方法为:
Figure FDA0003297444610000021
其中,σ2为方差;xi为样本数据;
Figure FDA0003297444610000022
为样本均值。
步骤2-2:剔除方差小于0.01的参数。
6.根据权利要求1所述的一种盾构机多源掘进参数关联性分析方法,其特征在于,所述的步骤3具体为:
利用Pearson相关系数对步骤2筛选后的数据进行两两之间的计算,Pearson相关系数的计算方法为:
Figure FDA0003297444610000023
其中,Cov(X,Y)为协方差;D(X)和D(Y)为特征参数分别对应的方差;
对相关性较强的参数进行一元线性回归分析,同时后续分析时线性相关性较强的两个参数只保留一个。
7.根据权利要求1所述的一种盾构机多源掘进参数关联性分析方法,其特征在于,所述的步骤4具体为:
对经过步骤3筛选后的参数利用MIC来度量非线性关系,计算公式如下:
Figure FDA0003297444610000024
Figure FDA0003297444610000025
式中,B为常数,是一个经验值;
对相关性较强的参数进行一元非线性回归分析,同时后续分析时对相关性强的两个参数忽略因变量,只保留自变量。
8.根据权利要求1所述的一种盾构机多源掘进参数关联性分析方法,其特征在于,所述的步骤5具体为:
基于多元线性回归模型进行被动参数与主动参数之间的线性关系分析,对于存在线性关系的给出回归模型公式,同时后续分析时忽略该被动参数。
9.根据权利要求1所述的一种盾构机多源掘进参数关联性分析方法,其特征在于,所述的步骤6具体为:
基于多项式回归模型进行被动参数与主动参数之间的非线性关系分析,对于存在关联关系的给出多项式回归模型公式,同时后续分析时忽略该被动参数。
10.根据权利要求1所述的一种盾构机多源掘进参数关联性分析方法,其特征在于,所述的步骤7中的模型训练方法为:
首先,根据预设比例将数据划分为训练集和测试集,采用R2进行模型评估,训练集和测试集的R2均大于预设阈值的参数表示能够通过随机森林建立关联,其余参数之间认为相互独立、无相关关系,直接舍弃。
CN202111181541.5A 2021-10-11 2021-10-11 一种盾构机多源掘进参数关联性分析方法 Pending CN113901609A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111181541.5A CN113901609A (zh) 2021-10-11 2021-10-11 一种盾构机多源掘进参数关联性分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111181541.5A CN113901609A (zh) 2021-10-11 2021-10-11 一种盾构机多源掘进参数关联性分析方法

Publications (1)

Publication Number Publication Date
CN113901609A true CN113901609A (zh) 2022-01-07

Family

ID=79191343

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111181541.5A Pending CN113901609A (zh) 2021-10-11 2021-10-11 一种盾构机多源掘进参数关联性分析方法

Country Status (1)

Country Link
CN (1) CN113901609A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114578871A (zh) * 2022-01-30 2022-06-03 扬州地龙机械有限公司 基于工业数据智能分析的顶管机的压力补偿系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114578871A (zh) * 2022-01-30 2022-06-03 扬州地龙机械有限公司 基于工业数据智能分析的顶管机的压力补偿系统
CN114578871B (zh) * 2022-01-30 2022-11-08 扬州地龙机械有限公司 基于工业数据智能分析的顶管机的压力补偿系统

Similar Documents

Publication Publication Date Title
CN111488694B (zh) 基于多元线性自回归的泥水盾构机掘进关键参数预测方法
CN109918822A (zh) 基于随机森林回归的盾构掘进参数偏差计算方法及系统
CN111365015A (zh) 一种基于XGBoost的盾构掘进参数特征提取与姿态偏差预测方法
CN111079342A (zh) 一种基于在线岩体等级分类的tbm掘进性能预测方法
JP7119349B2 (ja) 判定装置,判定プログラム,判定方法
CN112396320A (zh) 一种基于ism与模糊贝叶斯网络的隧道坍塌风险评估方法
CN113901609A (zh) 一种盾构机多源掘进参数关联性分析方法
CN103512751A (zh) 一种基于概率神经网络的轴承健康状态识别方法
CN113806889A (zh) 一种tbm刀盘扭矩实时预测模型的处理方法、装置以及设备
CN111140244B (zh) 一种硬岩掘进机支护等级智能推荐方法
CN116644284A (zh) 一种地层分类特征因子确定方法、系统、电子设备及介质
CN117252086A (zh) 一种盾构机刀盘健康评估与退化预测方法、系统及设备
CN117271675A (zh) 基于大数据挖掘的tbm掘进岩体可掘性识别方法与装置
CN113043073A (zh) 一种刀具磨损及寿命预测方法及装置
CN110991363B (zh) 不同采煤工序下煤矿安全监控系统co涌出特征提取方法
Cao et al. Feature investigation on the ROP machine learning model using realtime drilling data
CN112948996A (zh) 基于故障树与改进层次分析法的刀盘故障风险分析方法
CN114036696B (zh) 一种基于神经网络模型微调的刀盘扭矩预测方法及系统
Samadi et al. Developing the empirical models for predicting the EPB operating parameters in strong Limestone
CN112000714A (zh) 一种提取教学知识点关联的挖掘方法
CN112598061B (zh) 一种隧道围岩聚类分级方法
Zimroz et al. Novel techniques of diagnostic data processing for belt conveyor maintenance
CN115438402A (zh) 基于岩-机互馈感知关系的tbm掘进岩体条件实时预测方法及装置
CN112434896A (zh) 一种地铁盾构施工风险及其发展趋势的预测方法
CN111993158B (zh) 刀具检测模型的生成方法、检测方法、系统、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination