CN113065188B - 基于机器学习的沉桩过程评估方法、存储介质及电子设备 - Google Patents

基于机器学习的沉桩过程评估方法、存储介质及电子设备 Download PDF

Info

Publication number
CN113065188B
CN113065188B CN202110380281.8A CN202110380281A CN113065188B CN 113065188 B CN113065188 B CN 113065188B CN 202110380281 A CN202110380281 A CN 202110380281A CN 113065188 B CN113065188 B CN 113065188B
Authority
CN
China
Prior art keywords
pile sinking
model
pile
parameters
stage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110380281.8A
Other languages
English (en)
Other versions
CN113065188A (zh
Inventor
陈景忠
甘轶
万远收
庞国达
魏智健
王强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Shunrong Testing Technology Co.,Ltd.
Original Assignee
Foshan Shunde Construction Engineering Quality And Safety Supervision And Testing Center Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foshan Shunde Construction Engineering Quality And Safety Supervision And Testing Center Co ltd filed Critical Foshan Shunde Construction Engineering Quality And Safety Supervision And Testing Center Co ltd
Priority to CN202110380281.8A priority Critical patent/CN113065188B/zh
Publication of CN113065188A publication Critical patent/CN113065188A/zh
Application granted granted Critical
Publication of CN113065188B publication Critical patent/CN113065188B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/13Architectural design, e.g. computer-aided architectural design [CAAD] related to design of buildings, bridges, landscapes, production plants or roads
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Architecture (AREA)
  • Civil Engineering (AREA)
  • Structural Engineering (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Investigation Of Foundation Soil And Reinforcement Of Foundation Soil By Compacting Or Drainage (AREA)

Abstract

本申请涉及一种基于机器学习的沉桩过程评估方法、存储介质及电子设备,所述的沉桩过程评估方法包括以下步骤:采集特征参数——沉桩施工过程参数及桩身设计参数;利用所述的特征参数训练模型;基于所训练的模型,实时获得沉桩阶段信息和/或沉桩过程不同深度桩端土层的分类信息。本申请可以实时获得沉桩阶段信息和/或沉桩过程不同深度桩端土层的分类信息,克服了沉桩过程隐蔽性、未知性的问题,现场施工人员可以根据获得的沉桩阶段信息和/或沉桩过程不同深度桩端土层的分类信息来指导实际的沉桩操作,保证了沉桩后桩身的质量。

Description

基于机器学习的沉桩过程评估方法、存储介质及电子设备
技术领域
本申请涉及沉桩施工技术领域,尤其是涉及一种基于机器学习的沉桩过程评估方法、存储介质及电子设备。
背景技术
桩基础作为一种历史悠久而广泛应用于土木工程中的基础形式,在港口、桥梁、建筑等建设发展中也取得了蓬勃的发展。在建筑工程中,桩基础通过将上部分房屋建筑的荷载传递至地下持力层的方式,很好地解决和预防了房屋建筑不均匀沉降导致房屋倾覆坍塌的问题和风险,起到了对承受房屋建筑的土层进行加固和改善土层承受方式的作用。
然而,在桩身被打入地下后,因为其隐蔽性、未知性的施工特点,现场施工人员无法直接地观察其好坏及沉桩后的质量状况,因此一旦桩基出现桩身破坏、断裂等质量问题,后期的维护和加固处理就会出现难度。
发明内容
为了解决现场施工人员无法直接地观察桩身好坏及沉桩后的质量状况的问题,本申请提供一种基于机器学习的沉桩过程评估方法、存储介质及电子设备。
第一方面,本申请提供的一种基于机器学习的沉桩过程评估方法,采用如下的技术方案:
基于机器学习的沉桩过程评估方法,包括以下步骤:
采集特征参数——沉桩施工过程参数及桩身设计参数;
利用所述的特征参数训练模型;
基于所训练的模型,实时获得沉桩阶段信息和/或沉桩过程不同深度桩端土层的分类信息。
通过采用以上技术方案,尤其是通过利用所述的特征参数训练模型;然后基于所训练的模型,从而可以实时获得沉桩阶段信息和/或沉桩过程不同深度桩端土层的分类信息,克服了沉桩过程隐蔽性、未知性的问题,现场施工人员可以根据获得的沉桩阶段信息和/或沉桩过程不同深度桩端土层的分类信息来指导实际的沉桩操作,保证了沉桩质量。具体来说,桩基工程具有隐蔽性的特点,施工人员无法看到桩身没入土层部分的桩体情况,只能从打桩分析仪所采集到的力信号、速度信号等物理指标来衡量桩身结构是否因为过载而被破坏,而本申请中通过利用特征参数训练模型,基于所训练的模型,实时获得沉桩阶段信息和/或沉桩过程不同深度桩端土层的分类信息;训练模型时所学习的特征参数与实际沉桩过程中的物理指标高度相关,模型的输出指标是基于桩身受载情况而进行的不同阶段的划分或不同深度桩端土层的分类,因此可以通过阶段划分或不同深度桩端土层分类的方式间接判断沉桩质量的好坏。
优选的,还包括:从所述的特征参数中筛选子特征参数;利用所述的子特征参数来训练模型。
通过采用以上技术方案,从所述的特征参数中筛选子特征参数来训练模型,即在所有特征中选择出符合工程背景意义、对模型贡献度较高的特征进行训练,从而提高了模型的训练效率和最终模型的预测准确率。
前述的基于机器学习的沉桩过程评估方法,具体包括:
采集特征参数——沉桩施工过程参数及桩身设计参数;
从所述的特征参数中筛选子特征参数——锤型、桩径、壁厚、单位深度锤击能量、单位深度锤击数、累计锤击能量和累计锤击数;
利用所述的子特征参数训练模型,获得沉桩阶段预测模型;
基于所述的沉桩阶段预测模型,实时获得沉桩阶段信息。
通过采用以上技术方案,尤其是通过从所述的特征参数中筛选子特征参数——锤型、桩径、壁厚、单位深度锤击能量、单位深度锤击数、累计锤击能量和累计锤击数进行建模,来预测实时的沉桩阶段信息,从而可以大大提高模型预测的准确率和效率,增强了模型的泛化能力,减少了模型过拟合现象的发生。
优选的,在利用所述的子特征参数训练模型的步骤之前,还包括:
采用主成分分析法将带有相关性、耦合性的子特征参数进行合并,并对噪音信息进行滤除,将特征维度降为5。
通过采用以上技术方案,将特征维度降为5,模型准确率和降维前差不多,但是其损失函数梯度下降的情况更加稳定,而且可以进一步减少计算量,加速模型的收敛。
优选的,利用所述的子特征参数训练BP神经网络模型,获得沉桩阶段预测模型。
通过采用以上技术方案,利用所述的子特征参数训练BP神经网络模型,获得沉桩阶段预测模型,从而可以实现在较好的拟合数据集的同时,进一步提高模型预测的准确率。
优选的,利用所述的子特征参数训练BP神经网络模型,获得沉桩阶段预测模型后,还包括:
采用AdaBelief优化器对所述的沉桩阶段预测模型进行优化。
通过采用以上技术方案,针对沉桩数据参数在神经网络迭代过程中可能出现的易限于局部最优解和步长过大跳过最优解等问题,AdaBelief优化器兼具了Adam优化器的快速收敛特性和SGD的泛化特性,能够更好的解决实际应用中出现的上述问题,具体表现在该优化器能够针对迭代过程中小曲率、大梯度的问题,选择较为合适的步长,进而有效提高模型的迭代速度,同时更加接近最优解,从而提高沉桩数据阶段划分的准确性效果。
优选的,利用所述的子特征参数训练BP神经网络模型,获得沉桩阶段预测模型后,还包括:
采用改进的FocalLoss损失函数对所述的沉桩阶段预测模型进行优化。
所述的改进的FocalLoss损失函数为:
Figure 521630DEST_PATH_IMAGE001
其中,
Figure 267869DEST_PATH_IMAGE002
表示损失函数,n代表类别数量;
Figure 216103DEST_PATH_IMAGE003
表示变量0或1;
Figure 276463DEST_PATH_IMAGE004
表示该样本预测属于 类别i的概率,γ表示调制系数。
通过采用以上技术,改进的FocalLoss损失函数相较于传统的交叉熵损失函数能够更好的抑制损失函数的梯度爆炸情况,整体梯度浮动值变化更加平稳,并且收敛较快,从而能够更快的建立最优模型;另外,FocalLoss损失函数对少数类的捕捉能力相对于交叉熵损失函数更强,因此后续对于少数类的样本的预测准确率更高。
优选的,所述的调制系数γ的取值为2,γ越大,越容易调节多数类和少数类的权重,但过大(比如大于2)会对权重失去控制;当调制系数γ的取值为2时,对少数类的权衡更为适中合适,也不会忽略过多多数类信息,进而影响多数类数据的学习和拟合。
优选的,所述的沉桩阶段信息包括:未进入持力层阶段、刚进入持力层阶段、准备收锤阶段、可以收锤阶段。
通过采用以上技术方案,从而可以实现根据模型直接获得沉桩阶段信息,实时判断当前的沉桩阶段信息——未进入持力层阶段、刚进入持力层阶段、准备收锤阶段、可以收锤阶段,进而指导打桩施工,保证了桩身的质量。
优选的,前述的基于机器学习的沉桩过程评估方法,具体包括:
采集特征参数——沉桩施工过程参数及桩身设计参数;
从所述的特征参数中筛选子特征参数——锤型、桩径、壁厚、单位深度锤击能量、单位深度锤击数、累计锤击能量、累计锤击数和累计锤击能量/(入土深度-未响锤深度);
利用所述的子特征参数训练模型,获得机器学习土层识别预测模型;
基于所述的机器学习土层识别预测模型,实时获得沉桩过程不同深度桩端土层的分类信息。
通过采用以上技术方案,尤其是从所述的特征参数中筛选子特征参数——锤型、桩径、壁厚、单位深度锤击能量、单位深度锤击数、累计锤击能量、累计锤击数和累计锤击能量/(入土深度-未响锤深度)进行建模,来预测实时的土层分类信息,从而可以大大提高模型预测的准确率和效率,增强了模型的泛化能力,减少了模型过拟合现象的发生。
优选的,利用所述的子特征参数训练XGBoost模型,获得机器学习土层识别预测模型。
通过采用以上技术方案,从而可以进一步提高模型预测的准确率,获得更加准确的实时土层分类信息。
优选的,通过以下方法进行子特征参数选择:
对特征参数进行删减,获得不同特征参数影响下机器学习预测模型的预测准确率;
根据所述的不同特征参数影响下机器学习预测模型的预测准确率,最终确定出该预测模型的子特征参数。
通过采用以上技术方案,尤其是对特征参数进行删减,获得不同特征参数影响下机器学习预测模型的预测准确率,其结果会更加精确到模型的效用本身,使得最终确定出更加准确的、对模型比较关键的某几个特征,进而能够更好的提高模型的效果(比如提高模型的预测准确率以及模型迭代更新的效率)。
优选的,对特征参数进行删减之前还包括:
计算入岩阶段各特征参数对模型的贡献度;
根据贡献度的大小对各特征参数进行排序;
按照贡献度从小到大的顺序,依次对特征参数进行删减。
通过采用以上技术方案,从而可以减少实验次数和对特征的排列组合,从而更快的得到最优子特征。
更优选的,通过随机森林集成学习方法计算入岩阶段各特征参数对模型的贡献度。
通过采用以上技术方案,从而可以直观的获得不同特征参数对模型的贡献度大小情况,无需进行其他处理,方便用户查看。
优选的,从所述的特征参数中筛选子特征参数前,还包括:
对采集的特征参数进行数据清洗,剔除脏数据。
通过采用以上技术方案,对采集的特征参数进行数据清洗,剔除脏数据,从而能够增强数据的可分性和鲁棒性,减少数据中的噪音,最终提高预测模型的预测准确率。
优选的,还包括:对沉桩施工过程参数进行无量纲化处理。
对于沉桩施工过程参数,其主要为连续型变量,且各特征在数值上的大小、范围存在较大差异。因此,通过采用以上技术方案,对沉桩施工过程参数进行无量纲化处理,从而可以让各维度数据具有可比性,让后续算法模型能够更加公平的权衡和判断各特征对模型算法的影响。
更优选的,采取Z-score标准化方法对沉桩施工过程参数进行无量纲化处理,即将数据按均值中心化后,再按标准差进行缩放,数据就会服从均值为0、方差为1的正态分布;公式如下:
Figure 236328DEST_PATH_IMAGE005
其中,μ为所有样本数据的均值,
Figure 830166DEST_PATH_IMAGE006
为所有样本数据的标准差,x*表示标准化后的 沉桩参数,x表示原所有样本的沉桩参数。
通过采用以上技术方案,采取Z-score标准化方法对沉桩施工过程参数进行无量纲化处理,将沉桩数据各参数按均值中心化后,再按标准差进行缩放,让数据服从均值为0、方差为1的正态分布,从而更适用于本申请中的分类算法(预测模型最终的结果是进行分类)和使用差异来度量数据之间相似性的应用场景(分类问题就是通过数据之间的差异,也就是距离来作为区分的标志,本申请的应用场景归类从属于分类问题)。
第二方面,本申请提供一种计算机可读存储介质,采用如下的技术方案:
一种计算机可读存储介质,存储有能够被处理器加载并执行如前述任一种方法的计算机程序。
第三方面,本申请提供一种电子设备,采用如下的技术方案:
一种电子设备,包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行如前述任一种方法的计算机程序。
综上所述,本申请包括以下至少一种有益技术效果:
1.通过利用本申请中的特征参数训练模型;然后基于所训练的模型,从而可以实时获得沉桩阶段信息和/或沉桩过程不同深度桩端土层的分类信息,克服了沉桩过程隐蔽性、未知性的问题,现场施工人员可以根据获得的沉桩阶段信息和/或沉桩过程不同深度桩端土层的分类信息来指导实际的沉桩操作,保证了沉桩质量。
2.通过从所述的特征参数中筛选子特征参数——锤型、桩径、壁厚、单位深度锤击能量、单位深度锤击数、累计锤击能量和累计锤击数进行建模,来预测实时的沉桩阶段信息,从而可以大大提高模型预测的准确率和效率,增强了模型的泛化能力,减少了模型过拟合现象的发生。
附图说明
图1是本申请的一种实施例的方法流程图。
图2是本申请的一种实施例中进行子特征参数选择的方法原理图。
图3是入岩阶段中沉桩数据集各特征的重要性程度示意图。
图4为不剔除任何特征、保留全部11个特征时所建立模型的学习曲线图。
图5为剔除特征单位深度锤击能量变化率后所建立模型的学习曲线图。
图6为剔除单位深度锤击能量变化率、累计锤击能量/入土深度、累计锤击能量/(入土深度-未响锤深度)三个特征后所建立模型的学习曲线图。
图7为剔除单位深度锤击能量变化率、累计锤击能量/入土深度、累计锤击能量/(入土深度-未响锤深度)、入土深度四个特征后所建立模型的学习曲线图。
图8为剔除单位深度锤击能量变化率、累计锤击能量/入土深度、累计锤击能量/(入土深度-未响锤深度)、入土深度、锤型、桩径、壁厚七个特征后所建立模型的学习曲线图。
图9为采用降维算法将特征维度降为6时对应的BP神经网络学习曲线图。
图10为采用降维算法将特征维度降为5时对应的BP神经网络学习曲线图。
图11为采用降维算法将特征维度降为4时对应的BP神经网络学习曲线图。
图12为不同损失函数梯度下降曲线。
图13为不同损失函数下的准确率曲线。
图14为不同优化器作用下的损失函数梯度下降曲线。
图15为不同优化器作用下的准确率曲线。
具体实施方式
以下结合附图1-图15对本申请作进一步详细说明。
本申请实施例公开一种基于机器学习的沉桩过程评估方法。参照图1,基于机器学习的沉桩过程评估方法,包括以下步骤:
S1,采集特征参数——沉桩施工过程参数及桩身设计参数(包括:锤型、桩径、壁厚、入土深度、单位深度锤击数、单位深度锤击能量、累计锤击数、累计锤击能量、锤击频率、累计锤击能量/入土深度、累计锤击能量/(入土深度-未响锤深度)、单位深度锤击能量变化率等);
S2,利用所述的特征参数训练模型;
S3,基于所训练的模型,实时获得沉桩阶段信息和/或沉桩过程不同深度桩端土层的分类信息。
所述的未响锤深度是指锤击数为0时对应的深度值。
各特征参数的含义如下:
锤形、桩径、壁厚:该类参数属于桩锤设计参数,在施工工程中直接影响施工质量。以PHC-AB500(125)-11为例,其中AB是指桩身混凝土有效预压应力值,它的有效预压应力为6.0MPa,AB型桩相较于A型桩的抗弯性能更好,在穿过坚硬土层时在较大的锤击力下也不易打碎,500表示管桩的外直径为500mm,可分为300、400、500、600、700、800、1000、1200等规格;125是指管桩的壁厚为125mm;11是指管桩的长度为11米。不同规格的桩锤设计参数在沉桩施工过程的桩-土力学效应不同,故可作为沉桩状态的划分依据。
入土深度:桩身自沉以及在桩锤作用下的贯入土层累计深度。在施工试验过程中对入岩前后分别采用不同步长记录,入岩前阶段的参数可以以每米为单位记录一次数据,入岩后阶段桩体入土深度变化量小,故可以采取每10公分记录一次。通过不同阶段入土深度的变化量,可作为沉桩状态划分的依据。
单位深度锤击能量:锤击力作用下,桩身每下沉一个步长深度所消耗的锤击能量换算成每米所消耗的锤击能量。
累计锤击能量:桩身实时贯入到某一入土深度所消耗的总能量。锤体的能量输出可通过记录仪自动记录。桩头输入能量是影响贯入的直接因素,和桩-土之间的接触密不可分,因此可以作为沉桩状态的区分特征。
锤击频率:锤击力作用下,桩身每米经历的时长和锤击数换算成平均一分钟多少锤。在实际打桩过程中,锤击频率高低也直接影响锤击效率,能量高低和锤击频率高低可形成适宜的组合模式,对今后的自动控制有重要的作用。
单位深度锤击数:桩身每下沉一个步长的总锤击数换算成下沉每米的总锤击数。
累计锤击数:桩身实时贯入到某一入土深度的总锤击数。在施工试验过程中对入岩前后分别采用不同步长记录,入岩前阶段的参数可以以每米为单位记录一次数据,入岩后阶段桩体入土深度变化量小,单位深度可以采取每10公分记录一次。通过单位深度的锤击数变化,可以反映岩层的地质软硬程度,进而可作为沉桩状态划分的依据。可选的,还包括:从所述的特征参数中筛选子特征参数;利用所述的子特征参数来训练模型。
可选的,通过以下方法进行子特征参数选择:
对特征参数进行删减,获得不同特征参数影响下机器学习预测模型的预测准确率;
根据所述的不同特征参数影响下机器学习预测模型的预测准确率,最终确定出该预测模型的子特征参数。
可选的,对特征参数进行删减之前还可包括:
计算入岩阶段各特征参数对模型的贡献度;
根据贡献度的大小对各特征参数进行排序;
按照贡献度从小到大的顺序,依次对特征参数进行删减,获得不同特征参数影响下机器学习预测模型的预测准确率。
上述子特征参数选择的原理如图2所示。
在子特征选择前,可通过随机森林集成学习方法来计算出比如入岩阶段(即沉桩阶段)中各特征对模型的贡献度,对其重要性进行排序,如图3所示。
然后根据图3所示的各特征的贡献度由小到大,依次对特征进行删减,得出了不同特征数影响下模型表现情况优劣,结果如表1和图4-图8所示。
其中,图4中编号为1、2、3、4的曲线分别表示训练集的损失函数值变化曲线、测试集的损失函数值变化曲线、训练集的准确率变化曲线和测试集的准确率变化曲线。图5中编号为1、2、3、4的曲线分别表示训练集的损失函数值变化曲线、测试集的损失函数值变化曲线、训练集的准确率变化曲线和测试集的准确率变化曲线。图6中编号为1、2、3、4的曲线分别表示训练集的损失函数值变化曲线、测试集的损失函数值变化曲线、训练集的准确率变化曲线和测试集的准确率变化曲线。图7中编号为1、2、3、4的曲线分别表示训练集的损失函数值变化曲线、测试集的损失函数值变化曲线、训练集的准确率变化曲线和测试集的准确率变化曲线。图8中编号为1、2、3、4的曲线分别表示训练集的损失函数值变化曲线、测试集的损失函数值变化曲线、训练集的准确率变化曲线和测试集的准确率变化曲线。
由图3可知,桩锤设计参数(锤型、桩径、壁厚)的贡献度最小,从数据可以分析出这些特征自身的可分性、区分度对模型的贡献并不高,并不是作为分类的好特征,但是根据表1和图8可知,作为重要的设计参数,不同型号尺寸的桩锤在物理上对于桩-土效应有着很重要的意义,当删除参数——锤型、桩径、壁厚时,所得到的模型对训练集进行训练的准确率及对预测集进行预测的准确率都明显下降,因此,参数——锤型、桩径、壁厚不宜进行剔除。
另外,根据图3和表1可知,发明人增加了单位深度锤击能量变化率这一特征,但是该列特征对模型的影响也微乎其微,究其原因,一部分可能是单位深度锤击能量本身存在一定异常值,另一方面变化率对于分类效果的方差贡献度本身也很低,因此要予以剔除。
表1入岩阶段划分问题不同特征数对模型准确率的影响
Figure 282007DEST_PATH_IMAGE007
由表1及图4-图7可知,合理的筛选特征能够在较少计算量的同时一定程度上提高模型的表现,并且符合上述各特征重要性评估的结论。对比不同特征参数下模型对训练集和预测集准确率的表现,可以得知:随着对贡献度小的特征参数进行删减,预测集的准确率有了较好的提升,从87.12%增加到了90.51%,增强了模型的泛化能力,减少了模型的过拟合。分析其原因,主要是被删除特征与分类标签的相关性较小,不同类别对应的特征参数差异性不大,所以随着无关特征参数的减少,测试集的损失函数值变化更加平稳,在一定程度上抑制了梯度爆炸,加快了模型的收敛。但是,由图8可知,当再继续删减特征(锤型、桩径、壁厚)时,尽管损失函数梯度爆炸并没有很严重,但是由于特征参数过少,在剔除了无效信息的同时,在一定程度上也减少了有效信息,导致模型本身存在严重的欠拟合,因此模型在训练集和测试集的表现都不太好。综上所述,选择锤型、桩径、壁厚、单位深度锤击能量、单位深度锤击数、累计锤击能量和累计锤击数作为优选的子特征向量时,模型的预测准确率更高。
具体实施时,还可以采用过滤法(如方差过滤、相关性过滤)、包装法等进行子特征参数选择,即通过计算各特征对模型分类效果的贡献率,选择一个合适阈值对低于其阈值的特征进行剔除。
可选的,上述的基于机器学习的沉桩过程评估方法,具体包括:
采集特征参数——沉桩施工过程参数及桩身设计参数;
从所述的特征参数中筛选子特征参数——锤型、桩径、壁厚、单位深度锤击能量、单位深度锤击数、累计锤击能量和累计锤击数;
利用所述的子特征参数训练模型,获得沉桩阶段预测模型;
基于所述的沉桩阶段预测模型,实时获得沉桩阶段信息。
可选的,在利用所述的子特征参数训练模型的步骤之前,还包括:
采用主成分分析法将带有相关性、耦合性的子特征参数进行合并,并对噪音信息进行滤除,将特征维度降为5。
上述方法中,通过特征选择很好地剔除了无关特征和无区分度的特征,对模型特征矩阵进行了较好的降维。但是在高维数据中,必然有一些特征是不带有有效信息,或者特征之间并不相互独立,可能存在一定的线性相关和耦合效应。因此,发明人引入主成分分析,在既能够减少特征数量和减少模型计算量的同时,又保留大部分有效信息,将带有相关性、耦合性的特征进行合并,并对噪音信息进行滤除,进而创造出代表原特征矩阵大部分信息,特征数更少的新特征矩阵。
表2 主成分分析结果
Figure 942795DEST_PATH_IMAGE008
其中,图9中编号为1、2、3、4的曲线分别表示训练集的损失函数值变化曲线、测试集的损失函数值变化曲线、训练集的准确率变化曲线和测试集的准确率变化曲线。图10中编号为1、2、3、4的曲线分别表示训练集的损失函数值变化曲线、测试集的损失函数值变化曲线、训练集的准确率变化曲线和测试集的准确率变化曲线。图11中编号为1、2、3、4的曲线分别表示训练集的损失函数值变化曲线、测试集的损失函数值变化曲线、训练集的准确率变化曲线和测试集的准确率变化曲线。
由表1、表2、图9-图11可知:经过对主成分不同维度的测试,当特征维度为5时,相较于降维之前的模型(7维),模型准确率和降维前差不多,但是其损失函数梯度下降的情况更加稳定,而且可以进一步减少计算量。当进一步减少特征数至4维时,随着维度的减少过滤的信息增多,保留的有效信息也较少,因此模型出现了严重的欠拟合,所以模型准确率下降较为严重;当特征维度为6时,训练集和预测集的准确率相对于特征维度为5时也更低。因此,优选为,采用主成分分析法将带有相关性、耦合性的子特征参数进行合并,并对噪音信息进行滤除,优选的,将特征维度降为5。
可选的,利用所述的子特征参数训练BP神经网络模型,获得沉桩阶段预测模型。
具体实施时,输入层为经过数据预处理后的7个特征构成的特征矩阵。隐层为全连接层,每一层神经元都会对上一层的所有神经元赋予权重进行计算,经过线性的前向传播和激活函数计算后传递给下一层,通过损失函数来计算损失值进而通过优化器对损失函数进行梯度下降,通过反向传播来调整网络的权重和阈值至合适的参数,最后以概率的形式得出四个分类的概率结果,取其概率最大值对应的输出标签即为最后的输出结果。
在运用深度学习模型(比如BP神经网络模型)训练沉桩实测数据时,为了加强模型的泛化能力,防止对数据的过拟合,可以对数据集(包括特征参数和输出标签(即沉桩阶段划分的标签))进行随机打乱。由于神经网络模型具有很强的迭代记忆功能,固定的数据集顺序意味着固定的训练样本,也就意味着模型权重梯度下降更新的方向是固定的,从而严重抑制了梯度优化方向的可选择性,导致收敛点选择空间严重变小,容易陷入局部最优解,导致模型的过拟合,预测集表现效果差。因此,可以对训练集进行随机打乱。
具体实施时,BP神经网络的结构参数可优选设置如下:隐藏层层数为4层,每层神经元个数均为82,隐藏层每层激活函数采用selu激活函数,输出层是softmax激活函数。
另外,具体实施时,也可以根据当地的施工条件和采集数据,对模型的结构参数做一定的调整,获得相似的效果,比如参数调节可采用如下范围:隐藏层层数选择范围为3-6层,每层神经元个数选择范围在50-100,隐藏层每层激活函数还可以采用relu、tanh等激活函数。不过参数选择的越大,模型越复杂,对计算机的计算力和运算成本要求会更高。
可选的,利用所述的子特征参数训练BP神经网络模型,获得沉桩阶段预测模型后,还包括:
采用AdaBelief优化器对所述的沉桩阶段预测模型进行优化。
可选的,利用所述的子特征参数训练BP神经网络模型,获得沉桩阶段预测模型后,还包括:
采用改进的FocalLoss损失函数对所述的沉桩阶段预测模型进行优化;其中,所述的改进的FocalLoss损失函数为:
Figure 147380DEST_PATH_IMAGE009
其中,
Figure 438684DEST_PATH_IMAGE010
表示损失函数,n代表类别数量;
Figure 236876DEST_PATH_IMAGE011
表示变量0或1;
Figure 327454DEST_PATH_IMAGE012
表示该样本预测属于 类别i的概率,γ表示调制系数(优选为2)。
上述的基于机器学习的沉桩过程评估方法中,所述的沉桩阶段信息包括:未进入持力层阶段、刚进入持力层阶段、准备收锤阶段、可以收锤阶段。
在具体实施时,可以对沉桩过程入岩前以及入岩后不同程度划定分类标签(即对沉桩阶段划分标签)。
沉桩阶段划分标签:比如,可用“0”代表未进入持力层阶段,用“1”代表刚进入持力层阶段,用“2”代表准备收锤阶段,用“3”代表可以收锤阶段。入岩后不同层级的分类能够更好的对沉桩过程施工阶段进行预警,防止桩身被打坏。划分依据大致可采用以下逻辑,首先根据单位深度的耗能在入岩前后的明显变化进行划分,但是值得注意的是土层接壤部分存在一些差异,在该指标上不一定会呈现出明显的变化,可能会呈现一些反规律的波动。通常来说,比如“未进入持力层阶段”可以根据对土层的划分来获得,如X层以上的土层承载力都比较小,那么桩身在进入X层以上的土层时,可以都视为桩身处于“未进入持力层阶段”;当桩身处于X层以下时,则视为进入“刚进入持力层阶段”。然后对于入岩后的阶段,若桩身贯入度急剧减小,单位深度耗能的变化急剧增加,同时在保证不打坏桩的前提下,可以选择该位置作为“可以收锤阶段”的标志;另外,对于特别坚硬的土层,在锤击力作用下桩身无法继续下沉而导致单位深度耗能急剧增加,也可作为“可以收锤阶段”的标志;此外,若入岩后,随着桩身的下沉其能量值一直无明显的变化,但是入岩到一定深度,也可以作为“可以收锤阶段”的标志;此外,根据规范,一般而言,入岩后的深度为桩径的2-3倍时也可以判断为“可以收锤阶段”,此时已经满足对桩端的支撑力。在地质工程中,风化岩包括全风化岩、强风化岩、中风化岩和微风化岩,一般而言,沉桩过程可以贯入全风化岩和强风化岩,但无法贯穿中风化岩;有些时候全风化岩层厚度大,所以收锤阶段也可以收锤在全风化岩层,此时其侧摩阻也很大。对于比如桩身在X层以下、并且未符合上述“可以收锤阶段”的条件的,则视为桩身处于“准备收锤阶段”。
可选的,上述的基于机器学习的沉桩过程评估方法,具体包括:
采集特征参数——沉桩施工过程参数及桩身设计参数;
从所述的特征参数中筛选子特征参数——锤型、桩径、壁厚、单位深度锤击能量、单位深度锤击数、累计锤击能量、累计锤击数和累计锤击能量/(入土深度-未响锤深度);
利用所述的子特征参数训练模型,获得机器学习土层识别预测模型;
基于所述的机器学习土层识别预测模型,实时获得沉桩过程不同深度桩端土层的分类信息。
可选的,利用所述的子特征参数训练XGBoost模型,获得机器学习土层识别预测模型。
XGBoost算法支持列抽样和行抽样,所以既能降低过拟合的风险,又能降低计算量。它和随机森林算法一样,可以对各个特征变量对模型分类效果的影响进行重要性的排序,有助于特征的筛选。在运算速度上,该算法可以充分利用CPU多线程处理复杂数据集进行并行计算,极大的提高训练速度。
具体的,XGBoost算法的输出结果由预测函数决定,即:
Figure 934016DEST_PATH_IMAGE013
式中,
Figure 724117DEST_PATH_IMAGE014
为预测量(具体实施时,可以是对应的标签值);
Figure 868660DEST_PATH_IMAGE015
为输入特征变量;i为 样本;
Figure 136830DEST_PATH_IMAGE016
代表
Figure 863478DEST_PATH_IMAGE017
估计函数;n为样本个数;F为所有CARTS集合( CARTS集合是指所有树模型 的集合,因为XGBoost是基于决策树模型为弱评估器的集成算法模型,所有树模型一起作出 决策评估结果,因此简称为CARTS集合)。
具体实施时,可以在XGBoost算法中引入正则函数来减少算法过拟合的风险。因此,目标函数由损失函数和正则函数组成,可以表示为:
Figure 185000DEST_PATH_IMAGE018
式中,
Figure 692205DEST_PATH_IMAGE019
为损失函数对应预测值和真实值之间的偏差;
Figure 436170DEST_PATH_IMAGE020
是限 制算法复杂度的惩罚项,帮助算法平衡学习权重防止过拟合。
具体实施时,可以对沉桩过程不同深度桩端土层进行标签分类。通过地勘报告可以得到目标施工地的标准土层分布柱状图,根据地勘报告在学习阶段通过进行分类标识得到学习样本。
比如,通过对某地区的土质情况调研,对于土层的标识,具体如表3所示:
表3 土层分类标签
Figure 735433DEST_PATH_IMAGE022
在具体实施时,比如在已获得的22根沉桩数据集中,对于入岩阶段的划分问题,可以随机选取5根桩的完整数据作为测试集,其余数据作为训练集和验证集用于模型训练学习。
表4 数据集入岩阶段划分类别的分布统计
Figure 8282DEST_PATH_IMAGE023
但是,在具体实施时,对于土层识别分类问题,由于各土层类别样本数区别较大(如表4所示,由于建模的时候,模型会更倾向于样本数多的类别,导致模型预测不准确),对于部分少数类样本无法划分测试集,因此最终可以遴选包含9类土的4根桩的完整数据作为测试集,其余数据则作为训练集和验证集用于模型的训练学习。
可选的,从所述的特征参数中筛选子特征参数前,还包括:
对采集的特征参数进行数据清洗,剔除脏数据。
合理的数据清洗,能够通过剔除脏数据等异常值处理方法来增强数据的可分性和鲁棒性,减少数据中的噪音。比如在原始数据中,对于锤击频率,由于数据本身的可分性较差,与分类标签的相关性小,对模型的贡献度差,因此可以作为脏数据直接剔除。
可选的,从所述的特征参数中筛选子特征参数前,还包括:
对沉桩施工过程参数进行无量纲化处理。
可选的,采取Z-score标准化方法对沉桩施工过程参数进行无量纲化处理,即将数据按均值中心化后,再按标准差进行缩放,数据就会服从均值为0、方差为1的正态分布;公式如下:
Figure 2783DEST_PATH_IMAGE024
(3)
其中,μ为所有样本数据的均值,
Figure 35592DEST_PATH_IMAGE025
为所有样本数据的标准差,x*表示标准化后的 沉桩参数,x表示原所有样本的沉桩参数。
具体实施时,也可以采用最大最小值归一化的方法对沉桩施工过程参数进行无量纲化处理。
本申请实施例还公开一种计算机可读存储介质。一种计算机可读存储介质,存储有能够被处理器加载并执行如上述方法的计算机程序。
本申请实施例还公开一种电子设备。一种电子设备,包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行如上述任一种方法的计算机程序。
以上均为本申请的较佳实施例,并非依此限制本申请的保护范围,故:凡依本申请的方法、原理所做的等效变化,均应涵盖于本申请的保护范围之内。
为了验证本申请的技术效果,发明人还进行了大量的筛选试验:
一、模型的筛选:
针对沉桩数据集的分类模型特点,发明人引入了支持向量机(SVM)、K近邻算法(K-NN)、随机森林集成算法、XGBoost及BP神经网络来进行模型对比,根据模型对整体数据集的准确率、召回率、ROC曲线和AUC面积来综合评估模型的优劣,具体结果如表5-表10所示。
表5 不同模型评估结果
Figure 674515DEST_PATH_IMAGE026
表6 采用K-NN模型ROC曲线下的AUC面积
Figure 633113DEST_PATH_IMAGE027
表7采用SVM模型ROC曲线下的AUC面积
Figure 114910DEST_PATH_IMAGE028
表8采用随机森林模型ROC曲线下的AUC面积
Figure 403940DEST_PATH_IMAGE029
表9采用XGBoost模型ROC曲线下的AUC面积
Figure 710418DEST_PATH_IMAGE030
表10采用BP神经网络模型ROC曲线下的AUC面积
Figure 918546DEST_PATH_IMAGE031
由表6-表10可知,除了K近邻算法(即K-NN模型)的ROC曲线不合适外,其他模型均有较好的表现。从仿真曲线及表7-表10可以看出,ROC曲线是一个极偏左的情形,各类样本随着横轴假正率缓慢的增加,纵轴召回率的增加非常明显迅速,由此可以看出模型对少数类捕捉的能力较强,只需要牺牲极少数的多数类样本就可以获得大幅少数类样本预测正确率的提升。从ROC曲线下的AUC面积可以看出,少数类即入岩后的AUC面积均为90%以上,因此模型较为可靠。
另外,由表5-表10可知,五种模型对沉桩数据的训练准确度都是较高的,但是在测试集的表现各有优劣,其中BP神经网络模型和SVM模型对测试集预测的准确率以及召回率略高于另外三种模型。且对比K近邻算法(即K-NN模型)和XGBoost模型在训练集和测试集上的表现效果,可以明显观察到这两种模型的过拟合情况较为严重,导致模型复杂度高、泛化能力差,因此在测试集上的预测精度低于其他模型。
此外,由表5可知:SVM模型和BP神经网络模型对于沉桩阶段划分的分类效果在训练集和测试集上有相似的表现,整体来看BP神经网络的训练误差略小于SVM,而二者对测试集的预测精度以及ROC曲线的表现也较为相似,从指标评估效果上来看二者不分上下。但是发明人经研究发现:SVM模型属于传统机器学习流派中开发较为完整的模型,从模型的优化机制和发展上,很难有进一步提升优化的空间,只能通过调整传统的调优参数来优化模型,例如调整松弛系数的惩罚因子C和核函数系数gamma等。但是经过大量的调参试验,模型效果的提升是微乎其微的,而且在很大程度上增加了模型的复杂度,对于本申请的实际应用场景来说,运算速度慢,时间和算力上大量的牺牲来换算模型微乎其微效果的提升,性价比较低;另外,随着沉桩数据样本的增多,模型参数的调整需要更加长足的时间进行优化。而对于BP神经网络算法,该算法属于机器学习中深度学习支流,该模型的自定义程度高,模型的优化更为灵活,发展空间更大,可供调试选择的参数指标,如网络结构(层数、神经元数、连接方式)、损失函数的优化、优化器的选择等均能有效改善模型的效果,并且模型能够进行一定的轻量化处理,加快模型的运行速度,减少模型运行时消耗的算力,对于本申请的应用场景更适合。因此综上所述,针对沉桩阶段划分问题选择BP神经网络作为主要模型,可用于后续模型优化迭代的基础。
二、模型的优化:
发明人经研究发现:根据沉桩数据集入岩阶段分类标签和土层识别分类标签的分布特点,该分类问题属于样本极不均衡的分类问题,前者超过半数的数据为入岩前的特征数据,后者土层识别的种类多,且各类别的样本数从几个到几百个极不均衡。通常而言,对于分类模型的自身性质,会倾向于多数的类,让多数类更容易判断正确,少数类被牺牲掉。因为对于模型而言,样本量越多的标签可以学习到的信息越多,算法会更加依赖于从多数类中学到的信息来进行判断,而对于少数类的捕捉能力,即对入岩后沉桩数据和少样本数的土层类型预测的准确性,模型的预测效果会不好。另外,如果模型评估指标仅为准确率会失去意义,因为在这种分类情况下,即使模型不做调整都预测为入岩前和多样本数的土层类别标签,也能有一定的准确性。因此,对于模型评估指标的考量,不仅需要评估对整体数据预测的准确率,同时需要评估对少数类的捕捉能力,即追求捕获少数类的能力和将多数类判错后需要付出成本的平衡。为了评估后者这种能力,发明人引入了ROC曲线和AUC面积作为评估指标,可以更加有效的评估对样本极不均衡的分类问题的建模效果。
在ROC曲线图中,横轴为假正率(False Positive Rate),即模型将多数类判断错误的能力,假正率越高,代表模型将多数类判断错误的比例越大。纵轴为召回率(Recall),即模型捕捉少数类的能力,召回率越高,代表尽量捕捉出越多的少数类,在此横纵坐标构成的坐标图中,ROC曲线与正坐标轴围成的面积称为AUC面积。其中,AUC面积越大,其数值越接近于1,代表模型在牺牲较少多数类准确率的情况下尽可能更多的捕捉到了少数类。
1、损失函数的筛选:
对于BP神经网络模型的损失函数的筛选,发明人根据FocalLoss函数和交叉熵损失函数,对原有数据集进行了算法模型的尝试,分析结果如表11-13、图12-图13所示。
表11 不同损失函数评估结果
Figure 559743DEST_PATH_IMAGE032
表12 采用BP神经网络模型(FocalLoss损失函数)ROC曲线下的AUC面积
Figure 636152DEST_PATH_IMAGE033
表13采用BP神经网络模型(交叉熵损失函数)ROC曲线下的AUC面积
Figure 374301DEST_PATH_IMAGE034
其中,图12中编号为1、2、3、4的曲线分别表示使用交叉熵损失函数计算的训练集损失函数值变化曲线、使用FocalLoss损失函数计算的训练集损失函数值变化曲线、使用交叉熵损失函数计算的测试集损失函数值变化曲线和使用FocalLoss损失函数计算的测试集损失函数值变化曲线。图13中编号为1、2、3、4的曲线分别表示使用交叉熵损失函数计算的训练集准确率变化曲线、使用FocalLoss损失函数计算的训练集准确率变化曲线、使用交叉熵损失函数计算的测试集准确率变化曲线和使用FocalLoss损失函数计算的测试集准确率变化曲线。
由表11-13、图12-图13可知,FocalLoss损失函数相较于传统的交叉熵损失函数能够很好的抑制损失函数的梯度爆炸情况,整体梯度浮动值变化更加平稳,并且收敛较快。从准确性来看,传统交叉熵损失函数的准确性和FocalLoss的迭代结果差不多,但从表12和表13对应的ROC曲线图中可以看出:FocalLoss损失函数对少数类的捕捉能力相对于交叉熵损失函数更强,因此后续对于少数类的样本的预测准确率更高。因此综合考虑,选择FocalLoss损失函数作为BP神经网络模型的损失函数。比如在选定BP神经网络作为首选解决入岩阶段(即沉桩阶段)划分问题的模型方案后,为了进一步提高模型的稳定性和准确度,可以将FocalLoss损失函数应用于目标检测中正负样本严重失衡的问题中,原理是通过改变模型损失函数从而改变不同难易程度的样本对模型产生的贡献。
对于多分类样本不均衡问题,发明人对于多分类的FocalLoss损失函数改进如下:
Figure 425434DEST_PATH_IMAGE035
(4)
Figure 507921DEST_PATH_IMAGE036
表示损失函数,n代表类别数量(比如对于入岩阶段(即沉桩阶段)划分问题,n的 取值为4);y i表示变量0或1(即根据预测结果来看,如果是这个类别就是1,不是这个类别就 是0); QUOTE
Figure 997808DEST_PATH_IMAGE037
Figure 528147DEST_PATH_IMAGE037
表示该样本预测属于类别i的概率(经过神经网络正向传播计算后,最后 输出层的比如softmax激活函数会对输出结果转换成对于每一类的概率值)。因此,当该样 本预测值越接近1,意味预测值越接近真实标签,预测越准确,而且损失函数值在调制系数 γ(取值为2)的作用下会相应的变得更小,并且收敛速度更快。
此外,发明人经研究发现,对于本申请中的土层分类问题,训练XGBoost模型,获得机器学习土层识别预测模型,可优选的,采用交叉熵损失函数进行优化。
2、优化器的筛选:
建立沉桩阶段划分模型后,为了对模型进一步进行优化,发明人进一步探究了AdaBelief优化器、Adam优化器、SGD优化器对本申请所建立模型的影响,比如,对于BP神经网络模型分别优化后,分析结果如表14-表17所示。
表14 不同优化器评估结果
Figure 202711DEST_PATH_IMAGE038
表15采用BP神经网络模型(SGD优化器)ROC曲线下的AUC面积
Figure 818500DEST_PATH_IMAGE039
表16采用BP神经网络模型(Adam优化器)ROC曲线下的AUC面积
Figure 112078DEST_PATH_IMAGE040
表17采用BP神经网络模型(AdaBelief优化器)ROC曲线下的AUC面积
Figure 185338DEST_PATH_IMAGE041
由表14-表17可知,各类优化器对应的ROC曲线图中,AUC面积均达97%以上;但是如图14、图15所示,AdaBelief优化器相较于Adam和SGD优化器,能够更好的抑制损失函数的梯度爆炸情况(Adam和SGD优化器作用下的损失函数梯度爆炸较为严重),整体梯度浮动值变化更加平稳,并且收敛更快;另外,从准确性来看,AdaBelief优化器不仅能够随梯度变化来决定模型迭代速度,更能适应不同曲率变化的情形,因此在相同迭代次数下更容易接近全局最优点,进一步提高模型的准确性。具体的,从表15-表17中对应的ROC曲线图中可以看到,AdaBelief优化器对少数类的捕捉能力很好,而且可以将测试集预测准确率从90.51%(由表5可知)提高至92.54%(由表14可知),相对于Adam和SGD优化器作用下模型的预测准确率更高。因此,优选利用AdaBelief优化器来对本申请中建立的模型进行优化。
其中,图14中编号为1、2、3、4、5和6的曲线分别表示使用SGD优化器的训练集损失函数值变化曲线、使用SGD优化器的测试集损失函数值变化曲线、使用Adam优化器的训练集损失函数值变化曲线、使用Adam优化器的测试集损失函数值变化曲线、使用AdaBelief优化器的训练集损失函数值变化曲线、使用AdaBelief优化器的测试集损失函数值变化曲线。图15中编号为1、2、3、4、5和6的曲线分别表示使用SGD优化器的训练集准确率变化曲线、使用SGD优化器的测试集准确率变化曲线、使用Adam优化器的训练集准确率变化曲线、使用Adam优化器的测试集准确率变化曲线、使用AdaBelief优化器的训练集准确率变化曲线、使用AdaBelief优化器的测试集准确率变化曲线。
具体实施时,针对沉桩过程阶段划分问题,所采用的是AdaBelief优化器来实现神经网络反向传播过程权重参数的迭代,经过数次参数的调试,优化器内置参数如下:learning_rate=1e-3,epsilon=1e-14,rectify=False,print_change_log=False。针对沉桩数据参数在神经网络迭代过程中可能出现的易限于局部最优解和步长过大跳过最优解等问题,本模型所用优化器兼具了Adam优化器的快速收敛特性和SGD的泛化特性,能够更好的解决实际应用中出现的上述问题,具体表现在该优化器能够针对迭代过程中小曲率、大梯度的问题,选择较为合适的步长,进而有效提高模型的迭代速度,同时更加接近最优解,从而提高沉桩数据阶段划分的准确性效果。
三、机器学习土层识别预测模型的筛选及维度的确定
发明人结合PCA分析法和不同模型交叉分析比较了各模型的表现效果,如表18所示。
表18 土层识别问题各模型在降维算法作用下的准确率
Figure 843853DEST_PATH_IMAGE042
由表18可知,不同模型对于该问题本身的表现是不尽相同的,其中随机森林算法和XGBoost算法的表现最优(对训练集的训练准确度和对预测集的预测准确率均较高),而SVM模型的表现最差。随着降维算法主成分分析法的引入,有些模型的训练集训练准确率和预测集预测准确率有明显的优化,而部分模型的表现在下降。其中,随机森林算法在降维算法的引入下准确率从83%的提高到了86%以上,XGBoost算法在降维算法的引入下准确率从84%的提高到了86%以上,很好的通过降维算法滤除了部分噪音,并且对各特征进行了降维算法所设定维度的特征矩阵重建,让模型在保证准确率的同时增强了其鲁棒性和泛化能力。但XGBoost模型,当维度降低至7维时,由于有效信息的过多损失,模型的预测准确性也有所下降。对于K-NN模型和SVM模型,降维算法的引入并没有对模型起到优化作用。而BP神经网络对于此分类模型表现也没有优于集成学习模型,一方面各土层类别的标签数据太少,深度学习模型很难对较少有限的数据拟合出兼具准确性和泛化性的模型。因此BP神经网络模型和SVM、K-NN模型均不适合解决本申请的样本极不均衡的分类问题。
另外,发明人对XGBoost模型和随机森林模型的预测结果,结合ROC曲线来评估模型对各类别的捕捉能力,具体如表19所示。
表19
Figure 9255DEST_PATH_IMAGE043
由表19可知,XGBoost模型和随机森林模型效果均有较好的表现,对各类的捕捉能力都较强,AUC面积均达95%以上,模型的建模方向也贴合本申请的应用场景需求。但是相比而言,XGBoost模型应用的维度为8时,模型的预测准确率略高于随机森林模型,并且其维度比随机森林模型预测效果最好时采用的维度9要低,因此运算速度更快。因此,结合上述分析,选择XGBoost模型作为解决土层识别问题的模型,尤其是结合PCA分析法,其维度采用8时效果最好,最终确定的土层识别问题的模型的特征为:锤型、桩径、壁厚、单位深度锤击能量、单位深度锤击数、累计锤击能量、累计锤击数和累计锤击能量/(入土深度-未响锤深度)。

Claims (13)

1.基于机器学习的沉桩过程评估方法,其特征在于,包括以下步骤:
采集特征参数——沉桩施工过程参数及桩身设计参数;
从所述的特征参数中筛选子特征参数;
利用所述的子特征参数来训练模型;
基于所训练的模型,实时获得沉桩阶段信息和/或沉桩过程不同深度桩端土层的分类信息;
具体包括:
采集特征参数——沉桩施工过程参数及桩身设计参数;
从所述的特征参数中筛选子特征参数——锤型、桩径、壁厚、单位深度锤击能量、单位深度锤击数、累计锤击能量和累计锤击数;
利用所述的子特征参数训练模型,获得沉桩阶段预测模型;
基于所述的沉桩阶段预测模型,实时获得沉桩阶段信息;所述的沉桩阶段信息包括:未进入持力层阶段、刚进入持力层阶段、准备收锤阶段、可以收锤阶段。
2.根据权利要求1所述的基于机器学习的沉桩过程评估方法,其特征在于,在利用所述的子特征参数训练模型的步骤之前,还包括:
采用主成分分析法将带有相关性、耦合性的子特征参数进行合并,并对噪音信息进行滤除,将特征维度降为5。
3.根据权利要求1或2所述的基于机器学习的沉桩过程评估方法,其特征在于,利用所述的子特征参数训练BP神经网络模型,获得沉桩阶段预测模型。
4.根据权利要求3所述的基于机器学习的沉桩过程评估方法,其特征在于,利用所述的子特征参数训练BP神经网络模型,获得沉桩阶段预测模型后,还包括:采用AdaBelief优化器对所述的沉桩阶段预测模型进行优化。
5.根据权利要求3所述的基于机器学习的沉桩过程评估方法,其特征在于,利用所述的子特征参数训练BP神经网络模型,获得沉桩阶段预测模型后,还包括:采用改进的FocalLoss损失函数对所述的沉桩阶段预测模型进行优化;其中,所述的改进的FocalLoss损失函数为:
Figure FDA0003630138840000011
其中,Lfl表示损失函数,n代表类别数量;yi表示变量0或1;y′i表示样本预测属于类别i的概率,γ表示调制系数。
6.根据权利要求1所述的基于机器学习的沉桩过程评估方法,其特征在于,具体包括:
采集特征参数——沉桩施工过程参数及桩身设计参数;
从所述的特征参数中筛选子特征参数——锤型、桩径、壁厚、单位深度锤击能量、单位深度锤击数、累计锤击能量、累计锤击数和累计锤击能量/(入土深度-未响锤深度);
利用所述的子特征参数训练模型,获得机器学习土层识别预测模型;
基于所述的机器学习土层识别预测模型,实时获得沉桩过程不同深度桩端土层的分类信息。
7.根据权利要求6所述的基于机器学习的沉桩过程评估方法,其特征在于,利用所述的子特征参数训练XGBoost模型,获得机器学习土层识别预测模型。
8.根据权利要求1或6所述的基于机器学习的沉桩过程评估方法,其特征在于,通过以下方法进行子特征参数选择:
对特征参数进行删减,获得不同特征参数影响下机器学习预测模型的预测准确率;
根据所述的不同特征参数影响下机器学习预测模型的预测准确率,最终确定出该预测模型的子特征参数。
9.根据权利要求8所述的基于机器学习的沉桩过程评估方法,其特征在于,对特征参数进行删减之前还包括:
计算入岩阶段各特征参数对模型的贡献度;
根据贡献度的大小对各特征参数进行排序;
按照贡献度从小到大的顺序,依次对特征参数进行删减。
10.根据权利要求9所述的基于机器学习的沉桩过程评估方法,其特征在于:通过随机森林集成学习方法计算入岩阶段各特征参数对模型的贡献度。
11.根据权利要求1所述的基于机器学习的沉桩过程评估方法,其特征在于,从所述的特征参数中筛选子特征参数前,还包括:
对采集的特征参数进行数据清洗,剔除脏数据;
和/或对沉桩施工过程参数进行无量纲化处理;具体的,采取Z-score标准化方法对沉桩施工过程参数进行无量纲化处理,即将数据按均值中心化后,再按标准差进行缩放,数据服从均值为0、方差为1的正态分布;公式如下:
Figure FDA0003630138840000031
其中,μ为所有样本数据的均值,σ为所有样本数据的标准差,x*表示标准化后的沉桩施工过程参数,x表示原所有样本的沉桩施工过程参数。
12.一种计算机可读存储介质,其特征在于,存储有能够被处理器加载并执行如权利要求1至11中任一种方法的计算机程序。
13.一种电子设备,其特征在于,包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行如权利要求1至11中任一种方法的计算机程序。
CN202110380281.8A 2021-04-08 2021-04-08 基于机器学习的沉桩过程评估方法、存储介质及电子设备 Active CN113065188B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110380281.8A CN113065188B (zh) 2021-04-08 2021-04-08 基于机器学习的沉桩过程评估方法、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110380281.8A CN113065188B (zh) 2021-04-08 2021-04-08 基于机器学习的沉桩过程评估方法、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN113065188A CN113065188A (zh) 2021-07-02
CN113065188B true CN113065188B (zh) 2022-06-14

Family

ID=76566257

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110380281.8A Active CN113065188B (zh) 2021-04-08 2021-04-08 基于机器学习的沉桩过程评估方法、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN113065188B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114358091B (zh) * 2022-03-03 2022-06-10 中山大学 一种基于卷积神经网络的桩损伤识别方法、设备及介质
CN115266914B (zh) * 2022-03-28 2024-03-29 华南理工大学 基于声学信号处理的沉桩质量监测系统及监测方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111538282A (zh) * 2020-07-08 2020-08-14 上海雄程海洋工程股份有限公司 自动打桩控制系统和自动打桩的控制方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10443202B2 (en) * 2014-10-21 2019-10-15 Terracon Pile design optimization
US10823880B1 (en) * 2020-03-10 2020-11-03 Ramesh Chandra Gupta Subsurface exploration using load tests on short model piles at various depths of a soil deposit for determining load-settlement relationship and engineering properties of soils and intermediate geomaterials
CN111680341A (zh) * 2020-04-10 2020-09-18 中国能源建设集团浙江省电力设计院有限公司 一种坝上地区预钻孔沉桩桩基的承载力分析方法
CN111424661A (zh) * 2020-04-17 2020-07-17 杭州同睿工程科技有限公司 一种基于摄影测量技术的打桩施工监控方法和系统
CN111899225A (zh) * 2020-06-30 2020-11-06 烟台市计量所 基于多尺度金字塔结构的核电管道缺陷检测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111538282A (zh) * 2020-07-08 2020-08-14 上海雄程海洋工程股份有限公司 自动打桩控制系统和自动打桩的控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于人工神经网络的静力压桩沉桩阻力计算模拟;张明义等;《工程勘察》;20011122(第06期);全文 *

Also Published As

Publication number Publication date
CN113065188A (zh) 2021-07-02

Similar Documents

Publication Publication Date Title
CN113065188B (zh) 基于机器学习的沉桩过程评估方法、存储介质及电子设备
US20210302603A1 (en) Performance-level seismic motion hazard analysis method based on three-layer dataset neural network
CN113093552B (zh) 一种自动打桩控制方法
CN113807570B (zh) 基于XGBoost的水库大坝风险等级评估方法及系统
CN103336305B (zh) 一种基于灰色理论划分致密砂岩储层岩石物理相的方法
CN112529341B (zh) 一种基于朴素贝叶斯算法的钻井漏失机率预测方法
CN112966722A (zh) 基于半监督随机森林模型的区域滑坡易发性预测方法
CN106501465A (zh) 一种用于检测锚杆锚固质量的检测方法
CN114912798A (zh) 一种基于随机森林和震害大数据的地震损失评估系统
Bajolvand et al. Optimization of controllable drilling parameters using a novel geomechanics-based workflow
CN111753776A (zh) 基于回声状态与多尺度卷积联合模型的结构损伤识别方法
CN113780094B (zh) 基于混合高斯模型和隐马尔可夫模型的周界入侵识别方法
Rajabi et al. Sensitivity analysis of effective factors for estimating formation pore pressure using a new method: the LSSVM-PSO algorithm
CN117312919A (zh) 基于bo-cnn-lstm模型的冲击地压预警方法
CN117093922A (zh) 一种基于改进svm的不平衡样本油藏复杂流体识别方法
CN116882731A (zh) 一种基于斜坡单元的地质灾害危险性评估方法及系统
CN115019476B (zh) 一种基于多源信息融合的滑坡时空信息监测预警方法
CN115684363A (zh) 基于声发射信号处理的混凝土性能退化评估方法
CN114202020A (zh) 直推式支持向量机的落水洞检测方法、系统、终端及介质
Gu et al. Carbonate lithofacies identification using an improved light gradient boosting machine and conventional logs: a demonstration using pre-salt lacustrine reservoirs, Santos Basin
CN112987091A (zh) 储层检测方法、装置、电子设备和存储介质
CN115081706B (zh) 基于双向lstm网络的黄土塌陷预测方法及装置
Ching et al. Identification of soil degradation during earthquake excitations by Bayesian inference
CN116882548B (zh) 一种基于动态概率推理的掘进巷道煤与瓦斯突出预测方法
CN113888384B (zh) 一种滑坡灾害空间分布特征的分析方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 528000 No.1 Zhentong 1st Road, Sanzhou community, Lunjiao street, Shunde District, Foshan City, Guangdong Province

Patentee after: Guangdong Shunrong Testing Technology Co.,Ltd.

Address before: 528000 No.1 Zhentong 1st Road, Sanzhou community, Lunjiao street, Shunde District, Foshan City, Guangdong Province

Patentee before: Foshan Shunde construction engineering quality and safety supervision and Testing Center Co.,Ltd.