CN113947309A - 基于建造大数据的盾构隧道施工标准工时测算及评分方法 - Google Patents

基于建造大数据的盾构隧道施工标准工时测算及评分方法 Download PDF

Info

Publication number
CN113947309A
CN113947309A CN202111213701.XA CN202111213701A CN113947309A CN 113947309 A CN113947309 A CN 113947309A CN 202111213701 A CN202111213701 A CN 202111213701A CN 113947309 A CN113947309 A CN 113947309A
Authority
CN
China
Prior art keywords
tunneling
geological
ring
construction
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111213701.XA
Other languages
English (en)
Other versions
CN113947309B (zh
Inventor
赖信君
黄金晓
林深和
严李洲
胡常伟
毛宁
陈庆新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN202111213701.XA priority Critical patent/CN113947309B/zh
Publication of CN113947309A publication Critical patent/CN113947309A/zh
Application granted granted Critical
Publication of CN113947309B publication Critical patent/CN113947309B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/08Construction

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于建造大数据的盾构隧道施工标准工时测算及评分方法,包括:确定对掘进参数的状态产生主要影响的客观因素;对掘进参数进行预处理;对预处理后的掘进参数进行聚类分析;制定标准工时和及格区间;建立逻辑回归模型并进行评分。本发明面向地质特征,合理制定盾构掘进的标准工时,面对多种复杂环境,建立科学合理的盾构施工评价指标,为盾构建设的进度规划及施工绩效考核提供考察依据,更加有针对性地考核施工队的盾构工作进度和绩效,帮助企业对多个施工队进行精准科学地考核。

Description

基于建造大数据的盾构隧道施工标准工时测算及评分方法
技术领域
本发明涉及工时测算及评价指标建立领域,具体涉及一种基于建造大数据的盾构隧道施工标准工时测算及评分方法。
背景技术
在地铁的隧道盾构过程中,施工部门会面临着多样复杂的工作环境,盾构施工的进度受到多个因素的影响,如地质条件、设备状态、政策变动等。目前企业大多数是根据工作经验或行业内的专家评分进行评价指标测算,其评价结果受到建造主观因素的影响,且对于评分的工作量也要求较高。
现有的地质分类方式主要是根据地质纵面图和地层分类标准,对地铁隧道中每种地质进行归类。该方法划分出的地层类别繁杂,各类别具有不同的盾构环境和施工条件,不利于制定工作标准和规划工程进度。
此外,工时测算一般依据企业相关人员的已有经验和专业知识,对不同地质条件下的标准工时进行粗略地制定,但难以从数据的角度完全验证及支撑最后选定的标准工时,且该方法难以考虑到施工现场的实际客观条件。
目前,研究的评价指标建立方法主要有模糊综合评价法、FHW法等。模糊综合评价法需制定出每个指标的评价标准和加分权重,计算复杂,对指标权重矢量的确定主观性较强;FHW法通过组织评分专家进行独立评价和交流后评价,评价过程繁锁且需要多人参与,建立评价指标的成本较高。
发明内容
本发明的目的是提供一种基于建造大数据的盾构隧道施工标准工时测算及评分方法,以建立客观的评价体系,给盾构施工提供科学依据,可用于对不同施工队进行科学合理的考核和选拔。
为了实现上述任务,本发明采用以下技术方案:
一种基于建造大数据的盾构隧道施工标准工时测算及评分方法,包括以下步骤:
步骤1,对盾构掘进参数产生影响的不同外界因素分别与掘进参数进行相关性检验,确定对掘进参数的状态产生主要影响的外界因素为地质因素;
步骤2,对应用相同盾构法的隧道区间对应的原始掘进参数进行标准化,在此基础上对其中的异常值进行界定及剔除;对剔除异常值后的掘进参数对应的地质类别符号进行统一;
步骤3,抽取掘进参数中的单环推进时间、停机时间以及单位时间内的推进环数作为聚类特征,利用聚类算法,得到各类掘进参数及其对应的地质类别最终的距离、分类内容以及分类数目;同时通过分析其显著性可以判断该聚类结果是否合理,若结果不显著,则需进一步调整聚类数目,再次聚类;
步骤4,首先根据聚类结果,将得到的每一种地质分类中的所有单环总时间数据进行描述,得到每一分类中单环总时间的各项特征参数,包括均值、标准差、中位数、间距;其次,运用直方图对每一分类中的单环总时间进行统计并得到统计分布;通过分析和比较各项分布特征,选择单环总时间的ω百分位数作为该分类的单环标准工时;
以制定的单环标准工时为分界,分别在每一类地层中划分出总工时的及格区间和不及格区间,其中及格/不及格样本为每一分类及格/不及格区间中的各环掘进参数及其对应的地质类别;
步骤5,建立逻辑回归模型得到每个变量的影响系数,进而利用评分卡转换得到最终的评分公式;运用评分公式计算出每环盾构掘进的实际工时对应的分数,通过分数反映不同施工队的管理水平并将其作为考核选拔的参考依据;其中所述变量为单环推进时间、单环停机时间、单环总时间、环数和地质类别。
进一步地,所述确定对掘进参数的状态产生主要影响的外界因素为地质因素,包括:
先设定β={β1,β2,β3,...,βn1}、γ={γ1,γ2,γ3,...,γn2}两总体,其中β为地质因素中的岩性因素对应的掘进数据总体;γ为地质因素中土的软硬度因素对应的掘进数据总体;掘进数据总体包括单环推进时间、单环停机时间、单环总时间、环数;在两数据总体中分别抽取容量为n1,n2的样本,且设两样本独立,并假定n1≠n2,现将这n1+n2的观察值放在一起,按自小到大的次序排列,每个实验值在序列中的次序叫做该值的秩,然后将属于第β组数据的秩相加,其和记为R1,同理可求得第γ组数据的R2,则R1和R2是离散型随机变量,且有
Figure BDA0003309870340000021
Figure BDA0003309870340000022
当两个样本容量都大于10时,秩和T的分布接近于正态分布,采用Z检验,其基本公式为:
Figure BDA0003309870340000031
T为容量较小样本的秩和;
最后对于给定的显著性水平,确定Z值的临界值,比较临界值和Z值的大小,判断两总体是否有显著性差别;若结果显著,则说明该地质因素的变化会影响掘进参数水平的状态,将其作为评分模型的变量。
进一步地,对原始掘进参数进行标准化采用Z-score方法,对异常值进行界定及剔除采用三倍标准差法;在地质类别符号进行统一的过程中,将异常值进行界定及剔除后剩余的掘进参数对应的地质类别符号逐一修改,统一同类地质的标注形式,确定所有地质类别不存在同类而不同标注符号的情况。
进一步地,所述聚类算法为:
输入:N个环样本的特征向量{x(1),x(2),…,x(N)},x(i)为第i环样本,环样本为步骤2处理后得到的掘进参数及其对应的地质类别;
输出:分类个数K和分类结果;
步骤a,指定需要划分的类的个数K;
步骤b,随机初始化K个聚类中心μj,j=1,2,...,K;
步骤c,将类划分为
Figure BDA0003309870340000032
t=1,2,…,K,Ct为同一类特征向量的集合;
步骤d,对于i=1,2,…m,计算样本x(i)和各个质心向量μj(j=1,2,…,K)的距离:
Figure BDA0003309870340000033
将x(i)标记最小的为dij所对应的类别λi,此时更新
Figure BDA0003309870340000034
Figure BDA0003309870340000035
步骤e,对于i=1,2,…K,对Cj中所有的样本点重新计算新的质心
Figure BDA0003309870340000036
Figure BDA0003309870340000037
步骤f,如果所有的K个质心向量都没有发生变化,则转到步骤c,有变化则转到步骤g;
步骤g,输出聚类结果,包括各分类的单环推进时间、单环停机时间、环数及单环总时间这些掘进参数以及其对应的地质类别。
进一步地,每一类地层中及格样本与不及格样本的比例为ω:1-ω;若i为及格样本,则及定义为yi=1;若i为不及格样本,则定义为yi=0。
进一步地,所述逻辑回归模型表示为:
设条件概率P(y=1|v)=p为根据观测量相对于某事件v发生的概率;那么逻辑回归模型可以表示为:
Figure BDA0003309870340000041
其中,v=(v1,v2,…,v5),向量vi为掘进参数:单环推进时间、单环停机时间、单环总时间、环数及地质类别,i=1,2,3,4,5;g(v)=w0+w1v1+…+w5v5,w0,w1,w2,w3,w4,w5为系数;那么在v条件下y不发生的概率为:
Figure BDA0003309870340000042
比值
Figure BDA0003309870340000043
称为事件的发生比,记为odds;对其取对数得到:
Figure BDA0003309870340000044
进一步地,评分公式为:Score=A-B*ln(odds),其中A与B是常数;评分卡的评分范围是0~1000;
通过以下两个式子计算得出A、B的值,得到最终的评分公式。
1000=A-B*ln(odds第一名)
0=A-B*ln(odds最后一名)
其中,odds第一名、odds最后一名为计算出的排名第一、最后的odds。
与现有技术相比,本发明具有以下技术特点:
1.本发明面向地质特征,合理制定盾构掘进的标准工时。地铁盾构隧道所经过的地层类别较为复杂,具有不同程度的施工难度,直接影响到工人的施工进度和效率。利用K-means等聚类方法,对不同岩性和软硬度的地层进行划分,得到清晰明确的地层聚类结果。在此基础上,可进一步分析各个地层类别的掘进数据分布,制定出对应的掘进标准时长,为盾构建设的进度规划及施工绩效考核提供考察依据。
2.本发明面对多种复杂环境,建立科学合理的盾构施工评价指标。在明确地质、设备等客观影响因素的基础上,建立施工绩效评价指标,引入Sigmoid函数和修改过的信用评分卡,根据不同地质特征得到相对应的评价公式,更加有针对性地考核施工队的盾构工作进度和绩效,帮助企业对多个施工队进行精准科学地考核。
附图说明
图1为本发明方法的流程示意图;
图2为实施例中聚类算法流程图;
图3为实施例中单环总时间直方图;
图4为实施例中及格样本分布图;
图5为实施例中不及格样本分布图。
具体实施方式
参见附图,本发明提出了一种基于建造大数据的盾构隧道施工标准工时测算及评分方法,包括以下步骤:
步骤1,确定对掘进参数的状态产生主要影响的客观因素
对掘进参数与外界影响因素进行相关性检验,确定对掘进参数的状态产生主要影响的客观因素;本实施例中该因素为地质因素,不同地质会对掘进施工产生不同的难度,导致掘进速率水平发生变化。
在地铁建设工程中,对盾构掘进参数产生影响作用的外界因素有多种。首先是盾构施工环境,包括地质因素(地质类别,例如地质的岩性和土的软硬度)、天气因素、经过的外界建筑物等客观因素;第二是施工队的管理水平,包括工程进度、设备材料供给等主观因素;最后是政策变动影响。这些因素的改变都可能对盾构施工的进度产生不同程度的影响。从大数据中得到的规律可发现,相关影响因素难以保证服从正态分布。因此,需将以上的几种外界影响因素与掘进参数做相关性分析和秩检验,分析数据之间的相关性关系,进而确定对掘进参数水平产生主要客观影响的外界影响因素。
本发明中采用的相关性检验方法如下:
先设定β={β1,β2,β3,...,βn1}、γ={γ1,γ2,γ3,...,γn2}两总体,其中β为地质影响因素中的岩性因素对应的掘进数据总体;γ为相同影响因素中土的软硬度因素对应的掘进数据总体。掘进数据总体包括单环推进时间、单环停机时间、单环总时间、环数。在两总体中分别抽取容量为n1,n2的样本,且设两样本独立,并假定n1≠n2,现将这n1+n2的观察值放在一起,按自小到大的次序排列,每个实验值在序列中的次序叫做该值的秩,然后将属于第β组数据的秩相加,其和记为R1,同理可求得第γ组数据的R2
显然,R1和R2是离散型随机变量,且确
Figure BDA0003309870340000061
当两个样本容量都大于10时,秩和T的分布接近于正态分布,因此可以用Z检验,其基本公式为:
Figure BDA0003309870340000062
T为容量较小样本的秩和。
最后对于给定的显著性水平,确定Z值的临界值,比较两者大小,判断两总体是否有显著性差别。若结果显著,则说明该外界因素的变化会影响掘进参数水平的状态,可将其作为评分模型的变量;若不显著,则忽略该因素对掘进参数水平的影响,重新选择影响因素。
由于天气、建筑物及政策因素影响作用不稳定,地质因素对盾构的影响较为明显且稳定;通过上述相关性检验方法,确定地质因素作为掘进速度的客观影响因素。
步骤2,对掘进参数进行预处理
本步骤先对应用相同盾构法的隧道区间对应的原始掘进参数进行标准化,在此基础上采用三倍标准差法对其中的异常值进行界定及剔除;另外,由于步骤1确定掘进参数的外界影响因素为地质因素,因此需对剔除异常值后的掘进参数对应的地质类别符号进行统一,避免由于标注符号的不一致导致多个相同地质类别在聚类时被识别为不同类别,出现错误的聚类结果。
2.1数据标准化处理
Z-score也叫标准分数,它是以标准差为尺子去度量某一原始分数偏离平均数的距离,从而确定这一数据在全体数据中的位置。在本方案中,为了准确界定掘进参数中的离群值所在范围,利用Z-score法将各环掘进参数进行标准化,其转化的公式为:
Figure BDA0003309870340000063
式中,X为原始掘进数据,包括单环推进时间、单环停机时间及单环总时间,
Figure BDA0003309870340000064
为平均数,σ为标准差。
标准化后,原始数据改为均值为0,方差为1的分布。
2.2异常值的界定及剔除
针对步骤2.1处理得到的掘进数据中,存在部分异常值,包括过大值、过小值、零值及空值。这些异常值的存在会改变接下来的相关数据处理结果,影响对数据处理结果的判断和分析,因此需要将其剔除。本方案采用的方法是工业工程中的三倍标准差法。筛选标准化后的两组Z数据,将不在-3σ到3σ范围内的盾构掘进数据界定为异常值,即剔除在-3至3范围之外的异常值。经计算,在各个区间中,被剔除的异常值所占原有总数据量的比例均在2.5%左右,说明异常值的界定范围选取恰当。
2.3地质标注符号的统一化
盾构施工每一环的工时与地质状况相关性较大。由于施工过程中的记录不当,收集到的地质类别数据中可能存在以下几种错误:同类地层所在不同环号的地质符号标注不统一;同类地层所在不同环号的多种地质符号标注顺序不同;同类地层所在同一环号的同类地质符号重复标注;同类地层所在不同环号的地质符号记录形式不一致等。
以上出现的掘进参数记录错误现象,导致同一类地层由于标注符号不统一而被划分到多个类别中,出现虚假的地质类别数。因此,需要将步骤2.3处理后剩余的掘进参数所对应的地质类别符号逐一修改,统一同类地质的标注形式,确定所有地质类别不存在同类而不同标注符号的情况,避免在步骤3地质聚类过程中出现错误的聚类结果。
步骤3,对预处理后的掘进参数进行聚类分析
根据地质领域知识对完成预处理的地质类别及其对应的掘进参数进行分类,在此基础上逐一对每个分类采用K-means算法,聚合掘进参数水平相同的所有地质类别及掘进参数,得到最终的掘进参数聚类结果。
3.1确定聚类特征
抽取掘进参数中的单环推进时间、停机时间以及单位时间内的推进环数作为聚类特征,能够体现盾构掘进速度的状态。在本发明中,已将其与地质因素、政策变动等几个外界因素进行相关性检验,检验结果发现三个聚类特征均与这几个影响因素存在显著性差别,说明盾构掘进速度的状态会随着地质因素变化、施工队的管理水平不同而发生改变,其中地质因素为客观影响因素,管理水平为主观影响因素。本发明是在相同客观影响因素的作用下,对施工水平进行评价,因此可将单环的推进时间、停机时间和单位时间内的推进环数作为聚类特征,对地质类别进行聚类,在分析聚类结果的过程中逐步去除偶然性因素,从而得出具有真实性、客观性的最终结果。
3.2聚类分析
盾构掘进速度分类是盾构施工标准工时制定研究的基本工作,聚类方法的合理性会影响最终结果的准确性。目前对盾构施工的研究,都是依据盾构掘进时间的特征对掘进速度进行分类,这种分类方法无法很好地保证后续盾构标准工时制定的正确性,因此要得到合理的掘进速度分类,则需要研究出一套面向地质特征的盾构掘进速度分类方法。本发明在初步确定适合实际情况的聚类数目,利用改进的K-means聚类算法,得到各类掘进参数及其对应的地质类别最终的距离,分类内容以及分类数目K。同时通过分析其显著性可以判断该聚类结果是否合理,若结果不显著,则需进一步调整聚类数目,再次聚类直至结果具有较高的显著性。
(1)K-means聚类
K-means聚类又称快速聚类,属于覆盖数据划分聚类算法。在K-means聚类结果中,每个样本点都属于唯一的类别。K-means聚类算法的变量是数值变量,其采用划分原则进行聚类。划分原则,就是将样本空间随机划分为多个区域,根据定义的中心距离,将全部样本点分配到“封闭”域中,形成初始聚类。通过反复计算各类别之间的中心距离,对样本点进行分类,得到最终的结果。
(2)改进的K-means聚类的算法为:
输入:N个环样本的特征向量{x(1),x(2),…,x(N)},x(i)为第i环样本,环样本为步骤2预处理后得到的掘进参数及其对应的地质类别。
输出:分类个数K和分类结果
步骤a:指定需要划分的类的个数K
步骤b:随机初始化K个聚类中心μj,j=1,2,...,K
步骤c:将类划分为
Figure BDA0003309870340000081
t=1,2,…,K,Ct为同一类特征向量的集合。
步骤d:对于i=1,2,…m,计算样本x(i)和各个质心向量μj(j=1,2,…,K)的距离:
Figure BDA0003309870340000091
将x(i)标记最小的为dij所对应的类别λi,此时更新
Figure BDA0003309870340000092
Figure BDA0003309870340000093
步骤e:对于i=1,2,…K,对Cj中所有的样本点重新计算新的质心
Figure BDA0003309870340000094
Figure BDA0003309870340000095
步骤f:如果所有的K个质心向量都没有发生变化,则转到步骤c,有变化则转到步骤g;
步骤g:输出聚类结果,包括各分类的单环推进时间、单环停机时间、环数及单环总时间等掘进参数以及其对应的地质类别。
步骤4,制定标准工时和及格区间
4.1制定标准工时
关于单环标准工时的测算,首先根据聚类结果,将得到的每一种地质分类中的所有单环总时间数据进行描述,得到每一分类中单环总时间的各项特征参数,包括均值、标准差、中位数、间距等参数。其次,运用直方图对每一分类中的单环总时间进行统计并得到统计分布。通过分析和比较各项分布特征,选择单环总时间的ω百分位数作为该分类的单环标准工时;ω为预设参数。
4.2定义及格区间
以制定的单环标准工时为分界,分别在每一类地层中划分出总工时的及格区间和不及格区间,其中及格(不及格)样本为每一分类及格(不及格)区间中的各环掘进参数及其对应的地质类别。每一类地层中及格样本与不及格样本的比例为ω:1-ω。若i为及格样本,则定义为yi=1;若i为不及格样本,则定义为yi=0。
步骤5,建立逻辑回归模型并进行评分
本发明评价的对象为施工单位的施工速度效率,反映施工效率的直接指标是盾构的单环总时间,而主要影响施工快慢的因素为地质情况、设备因素和施工队的管理水平,地质情况和设备因素是客观方面的影响因素,因此实际上需要评价的对象其实是施工队的管理水平。
步骤4制定了盾构隧道的单环标准工时,利用标准工时划分每一类掘进参数总体数据的及格区间和不及格区间,并定义及格样本不及格样本;在该步骤中,建立逻辑回归模型得到每个变量xi的影响系数B,进而利用评分卡转换得到最终的评分公式。运用该评分公式可计算出每环盾构掘进的实际工时对应的分数,通过分数反映不同施工队的管理水平并将其作为考核选拔的参考依据,具体如下:
目前,在设备条件相同的前提下,利用经过步骤4处理后得到的及格和不及格样本建立逻辑回归模型。其中,为了保证评分公式的合理性和公平性,经过步骤1分析确定,除了施工进度等主观影响因素及部分不稳定的客观影响因素,将单环推进时间、单环停机时间、单环总时间、环数等掘进参数和地质类别共5个变量纳入模型中。
5.1建立逻辑回归模型
逻辑回归模型其本身是一个非线性回归模型,经过logit转换(连接函数)将相应变量Y和线性自变量相联系,可以得到一个线性的形式,使用线性回归模型对参数进行估计,所以说逻辑回归模型是一个广义线性回归模型。
经过步骤4得到及格样本为yi=1;不及格样本为yi=0。
对于具有5个独立变量和地质类别的向量v=(v1,v2,…,v5),向量vi为掘进参数(单环推进时间、单环停机时间、单环总时间、环数)及地质类别。设条件概率P(y=1|v)=p为根据观测量相对于某事件v发生的概率。那么逻辑回归模型可以表示为:
Figure BDA0003309870340000101
这里
Figure BDA0003309870340000102
称为逻辑函数。其中g(v)=w0+w1v1+…+wnvn,那么在v条件下y不发生的概率为:
Figure BDA0003309870340000103
所以这个比值
Figure BDA0003309870340000104
称为事件的发生比,简记为odds。对odds取对数得到:
Figure BDA0003309870340000105
5.2评分卡转换
评分卡的背后逻辑是odds的变动与评分变动的映射(把odds映射为评分)。转换得到的评分公式为:Score=A-B*ln(odds),其中A与B是常数。本发明采用的评分卡的评分范围是0~1000。
通过以下两个式子计算得出A、B的值,得到最终的评分公式。
1000=A-B*ln(odds第一名)
0=A-B*ln(odds最后一名)
5.3合理性检验
本发明通过评分分布图和KS检验两个方面对模型进行合理性的检验。
(1)评分分布图
通过评分分布图可直观分析及格样本和不及格样本的分数分布情况。若两类样本的图象众数比较靠近,则说明该评分模型对两类样本的区分度高;若两者的图象众数之间存在较大的距离,则该模型的样本区分度不足。
(2)KS检验
本发明采用KS检验对该评分模型进行验证,KS检验是比较Fy=1(z)与Fy=0(z)两个样本分布的检验方法。
若检验结果显著,则说明两类样本服从不同分布,该评分模型对这两类样本具有较高的区分度,可反映实际施工水平;若不显著,则需对评分模型的变量进行调整,重新选择更能准确反映掘进参数实际水平的变量及对掘进参数产生客观的影响作用的因素。
通过该评分模型得到每环的实际施工分数,可反映不同施工队的管理水平,可将其作为工程队考核选拔的参考依据,进一步建立施工绩效评估系统;另外对施工水平的准确把握有利于工程进度的有效规划,降低项目成本。
实施例:
1.掘进速度影响因素分析
在地铁建设工程中,对盾构掘进参数产生影响作用的外界因素有多种,包括地质环境、设备状态及政策变动等。地层类别的不同会影响盾构掘进的速度;设备状态是否正常会影响施工进程;政策变动会影响原定的工程规划和进度,导致不同情况下的掘进工时不一。
采用秩检验的方法,将以上几个方面的影响因素与掘进数据,包括推进时间、停机时间等进行相关性检验,得到的结果如下表所示(以岩性的检验结果为例),说明四个影响因素与掘进数据之间均具有显著的相关性。
表1显著性分析结果(岩性-推进时间)
Figure BDA0003309870340000121
表2显著性分析结果(岩性-停机时间)
Figure BDA0003309870340000122
2.掘进数据预处理
2.1数据标准化处理
为了准确界定掘进数据中的离群值所在范围,本发明采用Z-score法对盾构掘进数据进行标准化处理。得到相对应的两组Z数据,包括“Z推进时间”、“Z停机时间”。标准化后的掘进数据变为均值为0,方差为1的分布。
2.2异常值的界定及剔除
在采集到所有掘进数据中,存在部分异常值,包括过大值、过小值、零值及空值。本发明采用“三倍标准差法”,对超出-3σ至3σ范围的数据界定为异常值,即在两组Z数据中,剔除数值大小超出-3至3范围的数据。经计算,最终被剔除的异常值所占原有总数据量的比例均在2.5%左右,说明异常值的界定范围选取恰当。
2.3地质标注符号的统一化
由于施工过程中的记录不当,收集到的地质类别数据中存在多种记录错误,导致同一类地层由于标注符号不统一而重复出现,被划分为多个类别,出现虚假的地质类别数。因此,需要将其记录形式统一化,减少重复的地质类别,最终确定所有区间的基本地质类别数为315种。
3.地质聚类分析
本方案进行聚类研究的数据是抽取相同盾构法对应区间的掘进参数。
根据领域知识将全部地层划分为6类,标记为一、二、…、六类。
按照上述聚类算法过程,对同一盾构法对应的每一类地层进行聚类分析,得到以下聚类结果:
表3最终聚类结果
Figure BDA0003309870340000131
由上表可知,在已有的6个地层分类维度的基础上分别对其地质类别进行逐一聚类,得到的最终聚类数共有14类。经分析,每一分类中各自包含的地质类别较为接近,且各个分类之间具有显著性差别,说明该聚类结果符合客观性和合理性等方面的要求。
4.标准工时的测算
4.1制定标准推进时间
推进时间描述:将第2类地层的推进时间数据进行描述统计,得到如下结果:
(1)描述统计
表4推进时间描述
Figure BDA0003309870340000141
(2)百分位数表
表5推进时间百分位数表
Figure BDA0003309870340000142
4.2统计推进时间分布
统计推进时间数据得到的统计分布如表5所示。
第2类地层的推进数据共有6128条,其推进时间的直方图如图3所示。
4.3标准推进时间的确定
通过分析工时的分布特征以及结合实际的盾构施工水平,最终选取推进时间的九十分位数作为标准推进工时,那么如上述分析可知,第2类地层的标准推进时间为49分钟/环。
4.4定义及格样本和不及格样本
确定第2类地层的标准工时后,则可划分出及格区间和不及格区间,两者比例为9∶1。由此可知在14类地层中,每类地层的及格样本y=1所占比例为90%,不及格样本y=0所占比例为10%。
5.评价指标的制定
5.1建立逻辑回归模型
在现有地层聚类结果的基础上,分别对各类地层划分及格样本与不及格样本,其中及格样本y=1;不及格样本y=0。将y作为因变量,单环推进时间、单环停机时间、单环总时间、地质类别及环数作为自变量,建立逻辑回归模型,结果如下表所示:
表6逻辑回归输出表
Figure BDA0003309870340000151
Figure BDA0003309870340000161
设推进时间为x1,停机时间为x2,总时间为x3,环数为x5
地质类别:
Figure BDA0003309870340000162
由下列公式:
ln(odds)=g(x)=w0+w1x1+w2x2+w3x3+w4x4+w5x5
可计算出每环odds的对数,方便接下来评分卡的转换,结果下表所示:
表7评分表
Figure BDA0003309870340000163
5.2评分卡转换
通过以下两个式子:
1000=A-B*ln(odds第一名)
0=A-B*ln(odds最后一名)
计算得出A、B的值,其中A=398.770,B=-2.796,得到最终的评分公式为:
Score=398.770-2.796
*(6.903+0.001x1-0.009x2-0.044x3+340.607x401
+83.597x402+158.693x403+254.954x404+3.639x405
+268.159x406+0.750x407+0.049x408+0*x409+237.798x410
+237.757x411+13.688x412+12.351x413+267.890x414
+1.285x5)
其中,x1为单环推进时间,x2为单环停机时间,x3为单环总时间,x401为第1类地层,x402为第2类地层,x403为第3类地层,x404为第4类地层,x405为第5类地层,x406为第6类地层,x407为第7类地层,x408为第8类地层,x409为第9类地层,x410为第10类地层,x411为第11类地层,x412为第12类地层,x413为第13类地层,x414为第14类地层,x5为单位时间内的环数。
对现有评价对象评分后的结果如下表所示:
表8评分结果
Figure BDA0003309870340000171
5.3模型的合理性检验
(1)评分分布图
不及格样本y=0和及格样本y=1所得分数的分布图如图4、图5所示。
通过对及格样本和不及格样本分数分布图的分析,可知两者分布图山峰距离较远,说明本模型具有较好的区分度。
(2)KS检验
对不及格样本y=0和及格样本y=1所得分数进行KS检验分析,得到的结果如下表所示:
表9KS检验结果
Figure BDA0003309870340000181
对KS检验结果进行分析后,可知显著性为0,不及格样本和及格样本服从不同的分布,具有显著性差异,说明本评分模型具有显著的区分度。
附录:
表10变量定义表
Figure BDA0003309870340000182
Figure BDA0003309870340000191

Claims (7)

1.一种基于建造大数据的盾构隧道施工标准工时测算及评分方法,其特征在于,包括以下步骤:
步骤1,对盾构掘进参数产生影响的不同外界因素分别与掘进参数进行相关性检验,确定对掘进参数的状态产生主要影响的外界因素为地质因素;
步骤2,对应用相同盾构法的隧道区间对应的原始掘进参数进行标准化,在此基础上对其中的异常值进行界定及剔除;对剔除异常值后的掘进参数对应的地质类别符号进行统一;
步骤3,抽取掘进参数中的单环推进时间、停机时间以及单位时间内的推进环数作为聚类特征,利用聚类算法,得到各类掘进参数及其对应的地质类别最终的距离、分类内容以及分类数目;同时通过分析其显著性可以判断该聚类结果是否合理,若结果不显著,则需进一步调整聚类数目,再次聚类;
步骤4,首先根据聚类结果,将得到的每一种地质分类中的所有单环总时间数据进行描述,得到每一分类中单环总时间的各项特征参数,包括均值、标准差、中位数、间距;其次,运用直方图对每一分类中的单环总时间进行统计并得到统计分布;通过分析和比较各项分布特征,选择单环总时间的ω百分位数作为该分类的单环标准工时;
以制定的单环标准工时为分界,分别在每一类地层中划分出总工时的及格区间和不及格区间,其中及格/不及格样本为每一分类及格/不及格区间中的各环掘进参数及其对应的地质类别;
步骤5,建立逻辑回归模型得到每个变量的影响系数,进而利用评分卡转换得到最终的评分公式;运用评分公式计算出每环盾构掘进的实际工时对应的分数,通过分数反映不同施工队的管理水平并将其作为考核选拔的参考依据;其中所述变量为单环推进时间、单环停机时间、单环总时间、环数和地质类别。
2.根据权利要求1所述的基于建造大数据的盾构隧道施工标准工时测算及评分方法,其特征在于,所述确定对掘进参数的状态产生主要影响的外界因素为地质因素,包括:
先设定β={β1,β2,β3,...,βn1}、γ={γ1,γ2,γ3,...,γn2}两总体,其中β为地质因素中的岩性因素对应的掘进数据总体;γ为地质因素中土的软硬度因素对应的掘进数据总体;掘进数据总体包括单环推进时间、单环停机时间、单环总时间、环数;在两数据总体中分别抽取容量为n1,n2的样本,且设两样本独立,并假定n1≠n2,现将这n1+n2的观察值放在一起,按自小到大的次序排列,每个实验值在序列中的次序叫做该值的秩,然后将属于第β组数据的秩相加,其和记为R1,同理可求得第γ组数据的R2,则R1和R2是离散型随机变量,且有
Figure FDA0003309870330000021
Figure FDA0003309870330000022
当两个样本容量都大于10时,秩和T的分布接近于正态分布,采用Z检验,其基本公式为:
Figure FDA0003309870330000023
T为容量较小样本的秩和;
最后对于给定的显著性水平,确定Z值的临界值,比较临界值和Z值的大小,判断两总体是否有显著性差别;若结果显著,则说明该地质因素的变化会影响掘进参数水平的状态,将其作为评分模型的变量。
3.根据权利要求1所述的基于建造大数据的盾构隧道施工标准工时测算及评分方法,其特征在于,对原始掘进参数进行标准化采用Z-score方法,对异常值进行界定及剔除采用三倍标准差法;在地质类别符号进行统一的过程中,将异常值进行界定及剔除后剩余的掘进参数对应的地质类别符号逐一修改,统一同类地质的标注形式,确定所有地质类别不存在同类而不同标注符号的情况。
4.根据权利要求1所述的基于建造大数据的盾构隧道施工标准工时测算及评分方法,其特征在于,所述聚类算法为:
输入:N个环样本的特征向量{x(1),x(2),…,x(N)},x(i)为第i环样本,环样本为步骤2处理后得到的掘进参数及其对应的地质类别;
输出:分类个数K和分类结果;
步骤a,指定需要划分的类的个数K;
步骤b,随机初始化K个聚类中心μj,j=1,2,...,K;
步骤c,将类划分为
Figure FDA0003309870330000024
Ct为同一类特征向量的集合;
步骤d,对于i=1,2,…m,计算样本x(i)和各个质心向量μj(j=1,2,…,K)的距离:
Figure FDA0003309870330000031
将x(i)标记最小的为dij所对应的类别λi,此时更新
Figure FDA0003309870330000032
Figure FDA0003309870330000033
步骤e,对于i=1,2,…K,对Cj中所有的样本点重新计算新的质心
Figure FDA0003309870330000034
Figure FDA0003309870330000035
步骤f,如果所有的K个质心向量都没有发生变化,则转到步骤c,有变化则转到步骤g;
步骤g,输出聚类结果,包括各分类的单环推进时间、单环停机时间、环数及单环总时间这些掘进参数以及其对应的地质类别。
5.根据权利要求1所述的基于建造大数据的盾构隧道施工标准工时测算及评分方法,其特征在于,每一类地层中及格样本与不及格样本的比例为ω:1-ω;若i为及格样本,则及定义为yi=1;若i为不及格样本,则定义为yi=0。
6.根据权利要求1所述的基于建造大数据的盾构隧道施工标准工时测算及评分方法,其特征在于,所述逻辑回归模型表示为:
设条件概率P(y=1|v)=p为根据观测量相对于某事件v发生的概率;那么逻辑回归模型可以表示为:
Figure FDA0003309870330000036
其中,v=(v1,v2,…,v5),向量vi为掘进参数:单环推进时间、单环停机时间、单环总时间、环数及地质类别,i=1,2,3,4,5;g(v)=w0+w1v1+…+w5v5,w0,w1,w2,w3,w4,w5为系数;那么在v条件下y不发生的概率为:
Figure FDA0003309870330000037
比值
Figure FDA0003309870330000038
称为事件的发生比,记为odds;对其取对数得到:
Figure FDA0003309870330000039
7.根据权利要求1所述的基于建造大数据的盾构隧道施工标准工时测算及评分方法,其特征在于,评分公式为:Score=A-B*ln(odds),其中A与B是常数;评分卡的评分范围是0~1000;
通过以下两个式子计算得出A、B的值,得到最终的评分公式。
1000=A-B*ln(odds第一名)
0=A-B*ln(odds最后一名)
其中,odds第一名、odds最后一名为计算出的排名第一、最后的odds。
CN202111213701.XA 2021-10-19 2021-10-19 基于建造大数据的盾构隧道施工标准工时测算及评分方法 Active CN113947309B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111213701.XA CN113947309B (zh) 2021-10-19 2021-10-19 基于建造大数据的盾构隧道施工标准工时测算及评分方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111213701.XA CN113947309B (zh) 2021-10-19 2021-10-19 基于建造大数据的盾构隧道施工标准工时测算及评分方法

Publications (2)

Publication Number Publication Date
CN113947309A true CN113947309A (zh) 2022-01-18
CN113947309B CN113947309B (zh) 2024-05-17

Family

ID=79331551

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111213701.XA Active CN113947309B (zh) 2021-10-19 2021-10-19 基于建造大数据的盾构隧道施工标准工时测算及评分方法

Country Status (1)

Country Link
CN (1) CN113947309B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117113573A (zh) * 2023-08-28 2023-11-24 南京工业大学 基于工程案例文本极性分析的盾构刀盘开口选型方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2017279838B1 (en) * 2017-11-28 2018-09-06 Institute Of Geology And Geophysics Chinese Academy Of Sciences Method for classifying deep rock geofacies based on data mining
CN108520350A (zh) * 2018-04-04 2018-09-11 上海隧道工程有限公司 超大直径盾构连续穿越建筑的风险评估方法
CN109886534A (zh) * 2019-01-09 2019-06-14 中国铁建重工集团有限公司 用于隧道围岩分级的辨识方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2017279838B1 (en) * 2017-11-28 2018-09-06 Institute Of Geology And Geophysics Chinese Academy Of Sciences Method for classifying deep rock geofacies based on data mining
CN108520350A (zh) * 2018-04-04 2018-09-11 上海隧道工程有限公司 超大直径盾构连续穿越建筑的风险评估方法
CN109886534A (zh) * 2019-01-09 2019-06-14 中国铁建重工集团有限公司 用于隧道围岩分级的辨识方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117113573A (zh) * 2023-08-28 2023-11-24 南京工业大学 基于工程案例文本极性分析的盾构刀盘开口选型方法
CN117113573B (zh) * 2023-08-28 2024-04-05 南京工业大学 基于工程案例文本极性分析的盾构刀盘开口选型方法

Also Published As

Publication number Publication date
CN113947309B (zh) 2024-05-17

Similar Documents

Publication Publication Date Title
CN106572493B (zh) Lte网络中的异常值检测方法及系统
CN113723595B (zh) 基于微震事件定量预测的煤矿冲击地压智能预警方法
CN110674841B (zh) 一种基于聚类算法的测井曲线识别方法
CN102789545B (zh) 基于退化模型匹配的涡轮发动机剩余寿命的预测方法
CN112506990B (zh) 一种基于时空信息的水文数据异常检测方法
CN106022477A (zh) 智能分析决策系统及方法
CN109977132B (zh) 一种基于无监督聚类模式的学生异常行为模式分析方法
US20090299646A1 (en) System and method for biological pathway perturbation analysis
CN115828140A (zh) 邻域互信息与随机森林相融合故障检测方法、系统及应用
CN106228190A (zh) 针对居民异常用水的决策树判别方法
CN113807004A (zh) 基于数据挖掘的刀具寿命预测方法、装置及系统
CN111582387A (zh) 一种岩石光谱特征融合分类方法及系统
CN114266289A (zh) 一种复杂装备健康状态评估方法
Qin et al. Evaluation of goaf stability based on transfer learning theory of artificial intelligence
CN113947309A (zh) 基于建造大数据的盾构隧道施工标准工时测算及评分方法
CN113284369B (zh) 一种基于ads-b实测航路数据的预测方法
Subali et al. A new model for measuring the complexity of SQL commands
CN113420506A (zh) 掘进速度的预测模型建立方法、预测方法及装置
CN117235510A (zh) 节理粗糙度预测方法与节理粗糙度预测模型训练方法
CN114818493A (zh) 一种隧道岩体完整程度定量评价的方法
CN112507455B (zh) 一种卫星遥测参数长周期数据的趋势分析方法
KR101629178B1 (ko) 다중 특허지표를 이용한 기술 수명 주기 분석 장치
CN108986554B (zh) 一种基于模糊综合评判的空域扇区拥挤程度动态识别方法
Wirawan et al. Application of data mining to prediction of timeliness graduation of students (a case study)
CN112526559A (zh) 一种多工况条件下的系统关联性状态监测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant