CN111985796A - 基于随机森林和智能算法预测混凝土结构耐久性的方法 - Google Patents

基于随机森林和智能算法预测混凝土结构耐久性的方法 Download PDF

Info

Publication number
CN111985796A
CN111985796A CN202010787552.7A CN202010787552A CN111985796A CN 111985796 A CN111985796 A CN 111985796A CN 202010787552 A CN202010787552 A CN 202010787552A CN 111985796 A CN111985796 A CN 111985796A
Authority
CN
China
Prior art keywords
model
random forest
variable
support vector
vector machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010787552.7A
Other languages
English (en)
Other versions
CN111985796B (zh
Inventor
吴贤国
杨赛
陈彬
王堃宇
陈虹宇
吴霁峰
张浩蔚
王雷
徐文胜
吴克宝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN202010787552.7A priority Critical patent/CN111985796B/zh
Publication of CN111985796A publication Critical patent/CN111985796A/zh
Application granted granted Critical
Publication of CN111985796B publication Critical patent/CN111985796B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/13Architectural design, e.g. computer-aided architectural design [CAAD] related to design of buildings, bridges, landscapes, production plants or roads
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • Computer Hardware Design (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Strategic Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Educational Administration (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Civil Engineering (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Structural Engineering (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Architecture (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)

Abstract

本发明属于混凝土结构抗渗性预测技术领域,并具体公开了一种基于随机森林和智能算法预测混凝土结构耐久性的方法。包括:构建混凝土抗渗性指标体系,建立原始样本集,将训练数集作为随机森林回归模型的输入,对抗渗性指标体系的影响因素进行重要性评价,选出随机森林回归模型误差最小的影响因素集合,将最优特征变量集作为所述最小二乘支持向量机模型的输入变量,混凝土氯离子扩散系数预测结果作为输出变量,对最小二乘支持向量机模型进行训练,然后采用所述测试数集验证训练后的最小二乘支持向量机模型的预测结果;对所述预测结果进行分析,验证最小二乘支持向量机模型预测混凝土结构抗渗性的效果。本发明方法预测速度快,预测结果精准可靠。

Description

基于随机森林和智能算法预测混凝土结构耐久性的方法
技术领域
本发明属于混凝土结构抗渗性预测技术领域,更具体地,涉及一种基于随机森林和智能算法预测混凝土结构耐久性的方法。
背景技术
近年来,在实际工程中因为混凝土耐久性不足而导致结构破坏的事件屡屡发生,混凝土作为一种广泛应用的建筑材料,其耐久性问题越来越受到国内外的广泛关注。混凝土的早期耐久性一般通过抗冻性、抗渗性、抗侵蚀性等指标反映,其中抗渗性是反映混凝土耐久性的重要指标之一,因此,对混凝土早期抗渗性进行快速有效的预测具有重要的工程应用价值。
目前国内外许多专家都对混凝土的抗渗性能进行了相关研究,但是大部分研究普遍采用的还是传统的实验方法,而传统的实验方法由于测量数据的随机性、系统误差等因素的影响,混凝土的渗透规律具有许多不确定性,采用一般的统计方法,试验观测数据的离散性较大,往往会造成分析结果失真,并且传统的实验方法往往是一项长期而复杂的过程,实验周期长,工作量巨大,研究效率比较低。
随着计算机技术的不断进步,一些专家也开始将目光转向智能算法领域,尝试结合智能算法来进行混凝土抗渗性的研究,但目前对于智能算法的应用还处于起步阶段,大多采用的是单一的卷积神经网络、BP神经网络等智能预测模型,虽然有效地解决了研究中出现的一些复杂问题,减小了误差,提高了研究效率,但是单一的智能模型存在高度依赖于数据库的准确性,收敛速度较慢,易陷入局部最优等固有缺陷,可能会导致不恰当和不可靠的预测结果。此外,混凝土抗渗性预测存在影响因素多、噪声干扰复杂等特点,需要有效地选择有用的影响因素,才能得到更为准确的预测结果。
基于上述缺陷和不足,本领域亟需提出一种新的预测混凝土结构抗渗性的方法,能够筛选出混凝土结构抗渗性的关键影响因素,并以此对混凝土结构抗渗性进行精准预测。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种基于随机森林和智能算法预测混凝土结构耐久性的方法,其中结合最小二乘支持向量机自身的特征及其混凝土结构抗渗性预测的工艺特点,相应的利用随机森林回归模型进行特征选择,能在过多影响因素中,剔除与预测值相关性小的变量,筛选出用于建模的关键变量得到最优变量组合,降低最小二乘支持向量机训练模型的维度,提高预测精度,得到更贴近实际的预测结果,用以解决实际工程中混凝土结构抗渗性快速预测问题。
为实现上述目的,本发明提出了一种基于随机森林和智能算法预测混凝土结构耐久性的方法,包括以下步骤:
S1根据影响混凝土结构抗渗性的原材料和配合比因素构建混凝土抗渗性指标体系,并采集该结构抗渗性指标体系的样本数据,建立原始样本集,将所述原始样本集按指定比例划分为训练数集和测试数集;
S2将所述训练数集作为随机森林回归模型的输入,以对构成所述混凝土抗渗性指标体系的影响因素进行重要性评价,根据该变量重要性评价的结果对影响因素进行特征选择,选出随机森林回归模型误差最小的影响因素集合,并将该影响因素集合作为最优特征变量集;
S3构建最小二乘支持向量机模型,将所述最优特征变量集作为所述最小二乘支持向量机模型的输入变量,对应混凝土氯离子扩散系数预测结果作为输出变量,对最小二乘支持向量机模型进行训练,然后采用所述测试数集验证训练后的最小二乘支持向量机模型的预测结果;
S4对所述预测结果进行分析,验证最小二乘支持向量机模型预测混凝土结构抗渗性的效果。
作为进一步优选的,步骤S1中,所述结构抗渗性指标体系包括结构抗渗性影响因素和结构抗渗性评价指标。
作为进一步优选的,所述结构抗渗性影响因素包括水泥强度、水泥用量、粉煤灰用量、减水剂用量、细集料用量、粗集料用量、混凝土强度、砂率、水胶比、水用量、碱含量、含泥量、针、片状颗粒总含量以及平均粒径,所述结构抗渗性评价指标包括氯离子扩散系数。
作为进一步优选的,所述训练数集与测试数集中样本总数量的比为2∶1~4∶1。
作为进一步优选的,步骤S2具体包括以下步骤:
S21根据随机森林回归模型中二叉树节点包含的特征数和决策树的棵数构建随机森林回归模型;
S22将所述训练数集作为随机森林回归模型的输入,对于随机森林回归模型中的每一棵决策树,采用该决策树相应的袋外数据计算其袋外数据误差;
S23随机将上述决策树相应的袋外数据中所有样本数据的某个变量作为特征X,并对该特征X加入噪声干扰,然后再次计算该决策树相应的袋外数据误差;
S24构建重要性计算模型,并根据所述重要性计算模型对上述特征X进行变量重要性评价;
S25重复步骤S22至步骤S24,直至输出所述训练数集中所有变量的变量重要性评价,然后绘制变量重要性评价的可视化绘图,并将所有变量的变量重要性评价按降序排列,并根据排序结果对变量进行重要性度量的初步筛选;
S26对初步筛选后得到的变量集,利用递归特征后向消除法从该变量集中逐次去除指定比例的变量,每次去除得到一个变量,对比除去该变量后,剩余变量对应的袋外误差率,将误差率最小的变量集作为最优特征变量集,并以此确定最优特征变量集中最优特征的数量。
其中,在计算袋外数据误差时,通过计算Bootsrap抽样中得到的袋外数据误差。在将有变量的变量重要性评价按降序排列时,以可视化指标均方残差减小量(%IncMSE)和模型精确度的减小量(IncNodePurity)初步衡量各变量的重要性,将该重要性作为对应变量的重要性评价,并将所有变量的变量重要性评价按降序排列。
作为进一步优选的,步骤S24中,所述重要性计算模型为:
Figure BDA0002622558840000041
其中,r1为随机森林回归模型中决策树相应的袋外数据的袋外误差,r2为对袋外数据中的某个特征X加入噪声干扰后再次计算得到的袋外误差,N为随机森林回归模型中决策树的棵数。
作为进一步优选的,步骤S3具体包括以下步骤:
S31选择高斯核函数构建最小二乘支持向量机模型;
S32将所述最优特征变量集作为最小二乘支持向量机模型的输入,对应混凝土氯离子扩散系数预测结果作为输出变量,采用十折交叉验证进行参数寻优,以确定最小二乘支持向量机模型的惩罚参数C和高斯核函数核宽度参数σ2的最优参数组合;
S33基于最优特征变量集采用最优参数组合的最小二乘支持向量机模型对测试数集进行预测,并输出预测结果以验证训练后的最小二乘支持向量机模型的预测结果。
作为进一步优选的,所述高斯核函数表达式如下:
Figure BDA0002622558840000051
其中,x为输入的变量,xi为第i个样本,xj为第j个样本,σ2为核宽度参数。
作为进一步优选的,步骤S4具体包括以下步骤:
构建模型性能参数均方根误和拟合优度的计算模型,并采用未进行影响因素特征选择的支持向量机模型以及人工神经网络预测模型的预测结果和对影响因素进行特征选择后的最小二乘支持向量机模型的预测结果进行误差分析,验证最小二乘支持向量机模型预测混凝土氯离子扩散系数的效果。
作为进一步优选的,所述模型性能参数均方根误的计算模型为:
Figure BDA0002622558840000052
所述拟合优度的计算模型为:
Figure BDA0002622558840000053
其中yobs为样本数据观测值,ypred为模型预测值,
Figure BDA0002622558840000054
为所有样本观测值的平均值,n为样本数。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,主要具备以下的技术优点:
1.本发明方法充分利用了随机森林能够有效处理有多个指标、噪声干扰的样本数据,筛选有用特征变量的特点,创新性地提高了最小二乘支持向量机模型的预测精度,使得混凝土氯离子扩散系数的预测结果更加准确、可靠。
2.本发明方法将随机森林与最小二乘支持向量机结合建立混合智能模型,充分利用了不同智能算法的特点,规避了现有方法的缺陷,降低模型维度,加快训练速度且解决了预测结果不稳定的问题,为实现混凝土结构抗渗性预测提供了一种快捷有效的工具。
3.本发明选用了LSSVM(最小二乘支持向量机)建立预测模型,对传统的SVM(支持向量机)进行了改进,RF-LSSVM模型算法将复杂的二次规划问题转变为线性方程组的求解,不仅解决了计算复杂度,还能降低错误率,使回归问题得到了更好的解决。
4.本发明通过误差分析验证了随机森林特征筛选的有效性和正确性。
5.本发明选用高斯核函数不仅性能较好且兼具了径向基核函数的优势,还具有良好的抗干扰能力。
附图说明
图1是本发明实施例涉及的一种基于随机森林和智能算法预测混凝土结构耐久性的方法的流程图;
图2是本发明实施例提供的一种基于随机森林和智能算法预测混凝土结构耐久性的方法中各变量重要性排序示意图。
图3是本发明实施例提供的一种基于随机森林和智能算法预测混凝土结构耐久性的方法中影响因素相关性大小图;
图4是本发明实施例提供的一种基于随机森林和智能算法预测混凝土结构耐久性的方法中不同变量组合时RMSE变化趋势图;
图5是本发明实施例提供的一种基于随机森林和智能算法预测混凝土结构耐久性的方法中LSSVM模型训练数集拟合结果示意图;
图6是本发明实施例提供的一种基于随机森林和智能算法预测混凝土结构耐久性的方法中LSSVM模型测试数集预测结果示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
如图1所示,本发明实施例提供的一种基于随机森林和智能算法预测混凝土结构耐久性的方法,包括以下步骤:
步骤一,根据影响混凝土结构抗渗性的原材料和配合比因素构建混凝土抗渗性指标体系,并采集该结构抗渗性指标体系的样本数据,建立原始样本集,将所述原始样本集按指定比例划分为训练数集和测试数集。其中,所述结构抗渗性指标体系包括结构抗渗性影响因素和结构抗渗性评价指标。所述结构抗渗性影响因素包括水泥强度、水泥用量、粉煤灰用量、减水剂用量、细集料用量、粗集料用量、混凝土强度、砂率、水胶比、水用量、碱含量、含泥量、针、片状颗粒总含量以及平均粒径,所述结构抗渗性评价指标包括氯离子扩散系数。
将指标体系中的不同影响因素作为随机森林回归模型的变量,收集统计相关数据,将对应的数据作为原始训练集。所述训练数集与测试数集中样本总数量的比为2∶1~4∶1。作为本发明的优选方案,随机将总样本数据的2/3为训练数集,用于随机森林回归模型的构建,以选取指标集;剩余1/3为测试数集用于最后模型预测性能的评估。
步骤二,将所述训练数集作为随机森林回归模型的输入,以对构成所述混凝土抗渗性指标体系的影响因素进行重要性评价,根据该变量重要性评价的结果对影响因素进行特征选择,选出随机森林回归模型误差最小的影响因素集合,并将该影响因素集合作为最优特征变量集。即根据随机森林回归模型中二叉树节点包含的特征数和决策树的棵数构建随机森林回归模型,将所述训练数集作为随机森林回归模型的输入,对于随机森林回归模型中的每一棵决策树,采用该决策树相应的袋外数据计算其袋外数据误差,随机将上述决策树相应的袋外数据中所有样本数据的某个变量作为特征X,并对该特征X加入噪声干扰,然后再次计算该决策树相应的袋外数据误差,构建重要性计算模型,并根据所述重要性计算模型对上述特征X进行变量重要性评价,输出所述训练数集中所有变量的变量重要性评价,然后绘制变量重要性评价的可视化绘图,并将所有变量的变量重要性评价按降序排列,并根据排序结果对变量进行重要性度量的初步筛选,对初步筛选后得到的变量集,利用递归特征后向消除法从该变量集中逐次去除指定比例的变量,每次去除得到一个变量,对比除去该变量后,剩余变量对应的袋外误差率,将误差率最小的变量集作为最优特征变量集,并以此确定最优特征变量集中最优特征的数量。
其中,重要性计算模型为:
Figure BDA0002622558840000081
在该模型中,r1为随机森林回归模型中决策树相应的袋外数据的袋外误差,r2为对袋外数据中的某个特征X加入噪声干扰后再次计算得到的袋外误差,N为随机森林回归模型中决策树的棵数。
更具体的,在步骤二中,首先,输入随机森林回归模型的两个参数:二叉树节点包含的特征数mtry和决策树的棵数Ntree,默认情况下mtry=P/3(回归模型),P为变量个数,Ntree=500,建随机森林回归模型并训练训练数集。
对随机森林袋外数据OOB的所有样本的特征加入噪声干扰,根据OBB误差率计算每个变量的重要性并降序排列,得出不同影响因素的重要性强弱程度。
对变量重要性评分输出可视化绘图,按降序排列,得出不同变量的重要性强弱程度,初步确定特征集里的重要性度量值较大的影响因素;利用递归特征后向消除(RFE)从指标集中逐次去除相应比例的不重要指标,每次去除得到一个指标集;对比得到的各指标集对应的袋外(OOB)误差率,将误差率最小的指标集作为最优指标集,确定最优特征的数量。
其中,通过计算Bootsrap抽样中得到的袋外(OOB)数据误差,以可视化指标均方残差减小量(%IncMSE)和模型精确度的减小量(IncNodePurity)初步衡量各变量的重要性并作降序排列。即在计算袋外数据误差时,通过计算Bootsrap抽样中得到的袋外数据误差。在将有变量的变量重要性评价按降序排列时,以可视化指标均方残差减小量(%IncMSE)和模型精确度的减小量(IncNodePurity)初步衡量各变量的重要性,将该重要性作为对应变量的重要性评价,并将所有变量的变量重要性评价按降序排列。
步骤三,构建最小二乘支持向量机模型,将所述最优特征变量集作为所述最小二乘支持向量机模型的输入变量,对应混凝土氯离子扩散系数预测结果作为输出变量,对最小二乘支持向量机模型进行训练,然后采用所述测试数集验证训练后的最小二乘支持向量机模型的预测结果。在本步骤中,首先选择高斯核函数构建最小二乘支持向量机模型,将所述最优特征变量集作为最小二乘支持向量机模型的输入,采用十折交叉验证进行参数寻优,以确定最小二乘支持向量机模型的惩罚参数C和高斯核函数核宽度参数σ2的最优参数组合,并输出最优参数组合下训练数集混凝土氯离子扩散系数的预测结果,基于最优特征变量集采用最优参数组合的最小二乘支持向量机模型对测试数集进行预测,并输出预测结果以验证训练后的最小二乘支持向量机模型的预测结果。具体如下:
(1)选择映射能力强、泛化性能优、适用性好的高斯核函数(RBF)建立最小二乘支持向量机(LSSVM)模型,高斯核函数表达式如下:
Figure BDA0002622558840000091
其中,x为输入的变量,xi为第i个样本,xj为第j个样本,σ2为核宽度参数。
(2)采用十折交叉验证进行参数寻优,确定模型的惩罚参数C和RBF核函数核宽度参数σ2的最优参数组合。
(3)基于最优特征集对样本的训练数集和测试数集进行训练预测,并输出预测结果以实际值和预测值拟合曲线表示。
步骤四,对所述预测结果进行分析,验证最小二乘支持向量机模型预测混凝土结构抗渗性的效果。
首先,选用模型性能参数均方根误差(RMSE)、拟合优度(R2)来评价模型的预测精度,对输出拟合曲线效果的进一步验证,表达式如下:
Figure BDA0002622558840000101
Figure BDA0002622558840000102
其中yobs为样本数据观测值,ypred为模型预测值,n为样本数。
其次,选择未进行特征选择的支持向量机、BP神经网络和小波神经网络预测模型的结果与之做对比分析,再次肯定了随机森林特征筛选的有效性和正确性。
实施例1
本发明提出的基于随机森林的最小二乘支持向量机预测混凝土结构抗渗性的方法,主要包括以下步骤:
(1)影响因素指标体系样本数据采集
以水泥强度、水泥用量、粉煤灰用量、减水剂用量、细集料用量、粗集料用量、混凝土强度、砂率、水胶比、水用量、碱含量、含泥量、针、片状颗粒总含量、平均粒径共14个因素,作为输入变量,以混凝土氯离子扩散系数作为输出变量,选取监测的33组数据作为原始训练数集,数据如表1:
表1样本数据
Figure BDA0002622558840000111
(2)随机森林特征选择
将全部数据样本划分为容量为22的训练数集和容量为11的测试数集两部分,输入mtry=6,Ntree=600,建立随机森林回归模型。
通过R软件中Random Forest程序包来实现Importance函数的重要性评价指标可视化绘图,并将不同变量的重要性降序排列,其排列分布如图2所示,节点纯度的增加值越大(IncNodePurity),说明该变量重要性越强;均方误差增加值越大(IncMSE),说明该变量重要性越强。由图3可知,水胶比、平均粒径、砂率、水泥用量、水用量、混凝土强度等因素重要性度量值比较大,说明这些变量对混凝土抗渗性有较大的影响。
利用Pearson函数分析影响因素与氯离子扩散系数之间的相关性,对上述的重要性排序做一个验证,如图3所示。Pearson相关系数取值范围为-1到1,圆的颜色越深,直径越大说明两个变量间的Pearson相关系数绝对值越大,则相关性越强,反之,则相关性越弱。由图3可以看出,水胶比、平均粒径、砂率、水泥用量、水用量、混凝土强度与氯离子扩散系数的相关性明显高于其他影响因素,与重要性排序大体一致,说明这些影响因素对氯离子扩散系数影响较大。
经过5折交叉验证重复10次得到不同变量组合的RMSE和R2的数值,如表2。
表2不同变量组合时RMSE和R2变化表
Variables RMSE R squared
1 13.06 0.8530
2 12.07 0.8973
3 11.69 0.9144
4 11.34 0.8906
5 11.26 0.9048
6 10.90 0.9005
7 10.84 0.8924
8 10.87 0.8962
9 10.94 0.8980
10 11.00 0.9053
11 10.94 0.8991
12 10.98 0.9079
13 11.04 0.8958
14 11.12 0.9001
根据表2作出均方根误差变化趋势折现图,如图4。当变量个数达到6个时,均方根误差值达到最小,拟合优度也达到了最小,此时模型精度最高。利用递归特征消除法(RFE)依托重要性排序,通过交叉组合,不断建立模型,依次剔除不重要变量,直到遍历所有的特征变量,最终得到最佳变量组合。确定最优指标集为水胶比、氯离子含量、水用量、平均粒径、水泥用量、砂率将用于最小二乘支持向量机模型的构建。
(3)最小二乘支持向量机建模和评估
随机选取22组数据作为支向量机的训练数集,剩余11组数据作为测试数集,以水胶比、氯离子含量、水用量、平均粒径、水泥用量、砂率等6个影响因素作为最小二乘支持向量机模型的输入变量,氯离子渗透系数作为输出变量。加载R语言中e1071 1.6-7程序,采用10-CV方法进行参数寻优,输出寻优结果如表3所示。
表3参数优选表
Figure BDA0002622558840000131
Figure BDA0002622558840000141
参数优化的结果为:best c=1,best g=10,CVmse=0.8417(最小),输入该参数建立最小二乘支持向量机模型,对训练样本训练拟合结果如图5所示,对测试样本的预测结果如图6所示。从图5可以看出,模拟值和实际值很接近,模拟效果较好。利用训练好的随机森林模型对测试集进行预测,如图6所示,可以看出随机森林模型测试集上的预测值曲线较贴近真实值。
(4)预测结果评价
为了检验随机森林融合最小二乘支持向量机模型(RF-LSSVM)的优越性,选择未进行特征选择的支持向量机、BP神经网络和小波神经网络进行建模并做对比分析,选用公式(3)均方根误差RMSE和公式(4)确定性系数R2和来衡量模型的预测精度,得到误差对比结果如表4。
表4误差比较
Figure BDA0002622558840000142
从结果显示可以看出RF-LSSVM模型预测结果的均方根误差无限接近于0且确定性系数最为接近1,说明RF-LSSVM模型的预测准确率优于单纯的支持向量机、BP神经网络和小波神经网络模型,在基于材料和配合比的混凝土结构抗渗性预测研究领域有良好应用前景。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于随机森林和智能算法预测混凝土结构耐久性的方法,其特征在于,包括以下步骤:
S1根据影响混凝土结构抗渗性的原材料和配合比因素构建混凝土抗渗性指标体系,并采集该结构抗渗性指标体系的样本数据,建立原始样本集,将所述原始样本集按指定比例划分为训练数集和测试数集;
S2将所述训练数集作为随机森林回归模型的输入,以对构成所述混凝土抗渗性指标体系的影响因素进行重要性评价,根据该重要性评价的结果对影响因素进行特征选择,选出随机森林回归模型误差最小的影响因素集合,并将该影响因素集合作为最优特征变量集;
S3构建最小二乘支持向量机模型,将所述最优特征变量集作为所述最小二乘支持向量机模型的输入变量,对应混凝土氯离子扩散系数预测结果作为输出变量,对最小二乘支持向量机模型进行训练,然后采用所述测试数集验证训练后的最小二乘支持向量机模型的预测结果;
S4对所述预测结果进行分析,验证最小二乘支持向量机模型预测混凝土结构抗渗性的效果。
2.根据权利要求1所述的一种基于随机森林和智能算法预测混凝土结构耐久性的方法,其特征在于,步骤S1中,所述结构抗渗性指标体系包括结构抗渗性影响因素和结构抗渗性评价指标。
3.根据权利要求2所述的一种基于随机森林和智能算法预测混凝土结构耐久性的方法,其特征在于,所述结构抗渗性影响因素包括水泥强度、水泥用量、粉煤灰用量、减水剂用量、细集料用量、粗集料用量、混凝土强度、砂率、水胶比、水用量、碱含量、含泥量、针、片状颗粒总含量以及平均粒径,所述结构抗渗性评价指标包括氯离子扩散系数。
4.根据权利要求1所述的一种基于随机森林和智能算法预测混凝土结构耐久性的方法,其特征在于,所述训练数集与测试数集中样本总数量的比为2∶1~4∶1。
5.根据权利要求1所述的一种基于随机森林和智能算法预测混凝土结构耐久性的方法,其特征在于,步骤S2具体包括以下步骤:
S21根据随机森林回归模型中二叉树节点包含的特征数和决策树的棵数构建随机森林回归模型;
S22将所述训练数集作为随机森林回归模型的输入,对于随机森林回归模型中的每一棵决策树,采用该决策树相应的袋外数据计算其袋外数据误差;
S23随机将上述决策树相应的袋外数据中所有样本数据的某个变量作为特征X,并对该特征X加入噪声干扰,然后再次计算该决策树相应的袋外数据误差;
S24构建重要性计算模型,并根据所述重要性计算模型对上述特征X进行变量重要性评价;
S25重复步骤S22至步骤S24,直至输出所述训练数集中所有变量的变量重要性评价,然后绘制变量重要性评价的可视化绘图,并将所有变量的变量重要性评价按降序排列,并根据排序结果对变量进行重要性度量的初步筛选;
S26对初步筛选后得到的变量集,利用递归特征后向消除法从该变量集中逐次去除指定比例的变量,每次去除得到一个变量,对比除去该变量后,剩余变量对应的袋外误差率,将误差率最小的变量集作为最优特征变量集,并以此确定最优特征变量集中最优特征的数量。
6.据权利要求4所述的一种基于随机森林和智能算法预测混凝土结构耐久性的方法,其特征在于,步骤S24中,所述重要性计算模型为:
Figure FDA0002622558830000031
其中,r1为随机森林回归模型中决策树相应的袋外数据的袋外误差,r2为对袋外数据中的某个特征X加入噪声干扰后再次计算得到的袋外误差,N为随机森林回归模型中决策树的棵数。
7.根据权利要求1所述的一种基于随机森林和智能算法预测混凝土结构耐久性的方法,其特征在于,步骤S3具体包括以下步骤:
S31选择高斯核函数构建最小二乘支持向量机模型;
S32将所述最优特征变量集作为最小二乘支持向量机模型的输入,对应混凝土氯离子扩散系数预测结果作为输出变量,采用十折交叉验证进行参数寻优,以确定最小二乘支持向量机模型的惩罚参数C和高斯核函数核宽度参数σ2的最优参数组合;
S33基于最优特征变量集采用最优参数组合的最小二乘支持向量机模型对测试数集进行预测,并输出预测结果以验证训练后的最小二乘支持向量机模型的预测结果。
8.根据权利要求7所述的一种基于随机森林和智能算法预测混凝土结构耐久性的方法,其特征在于,所述高斯核函数表达式如下:
Figure FDA0002622558830000032
其中,x为输入的变量,xi为第i个样本,xj为第j个样本,σ2为核宽度参数。
9.根据权利要求1所述的一种基于随机森林和智能算法预测混凝土结构耐久性的方法,其特征在于,步骤S4具体包括以下步骤:
构建模型性能参数均方根误和拟合优度的计算模型,并采用未进行影响因素特征选择的支持向量机模型以及人工神经网络预测模型的预测结果和对影响因素进行特征选择后的最小二乘支持向量机模型的预测结果进行误差分析,验证最小二乘支持向量机模型预测混凝土氯离子扩散系数的效果。
10.根据权利要求9所述的一种基于随机森林和智能算法预测混凝土结构耐久性的方法,其特征在于,所述模型性能参数均方根误的计算模型为:
Figure FDA0002622558830000041
所述拟合优度的计算模型为:
Figure FDA0002622558830000042
其中yobs为样本数据观测值,ypred为模型预测值,
Figure FDA0002622558830000043
为所有样本观测值的平均值,n为样本数。
CN202010787552.7A 2020-08-07 2020-08-07 基于随机森林和智能算法预测混凝土结构耐久性的方法 Active CN111985796B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010787552.7A CN111985796B (zh) 2020-08-07 2020-08-07 基于随机森林和智能算法预测混凝土结构耐久性的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010787552.7A CN111985796B (zh) 2020-08-07 2020-08-07 基于随机森林和智能算法预测混凝土结构耐久性的方法

Publications (2)

Publication Number Publication Date
CN111985796A true CN111985796A (zh) 2020-11-24
CN111985796B CN111985796B (zh) 2021-06-18

Family

ID=73446206

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010787552.7A Active CN111985796B (zh) 2020-08-07 2020-08-07 基于随机森林和智能算法预测混凝土结构耐久性的方法

Country Status (1)

Country Link
CN (1) CN111985796B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112489736A (zh) * 2020-12-09 2021-03-12 中国石油大学(北京) 一种矿物含量分析方法、装置、设备及存储介质
CN112801709A (zh) * 2021-02-05 2021-05-14 杭州拼便宜网络科技有限公司 一种用户流失预测方法、装置、设备及存储介质
CN113343558A (zh) * 2021-05-19 2021-09-03 东北石油大学 一种基于模糊神经网络的钻井参数优化方法
CN113435471A (zh) * 2021-05-17 2021-09-24 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 深度特征聚类的高排放移动源污染识别方法及系统
CN113743540A (zh) * 2021-11-04 2021-12-03 华能(天津)煤气化发电有限公司 一种基于多模型融合Stacking算法的煤质熔点预测方法
CN113778028A (zh) * 2021-08-12 2021-12-10 西安交通大学 基于边云协同与双增量的智能混凝算法
CN113869578A (zh) * 2021-09-26 2021-12-31 合肥通用机械研究院有限公司 常减压装置电脱盐系统脱后原油盐含量智能预测诊断方法
CN113868960A (zh) * 2021-10-18 2021-12-31 青岛农业大学 一种基于典型相关森林的土壤重金属特征选取方法及系统
CN114971092A (zh) * 2022-07-29 2022-08-30 华北电力大学 一种变电站主控楼混凝土用量预测方法和装置
CN116682505A (zh) * 2023-06-14 2023-09-01 东北大学 一种基于分位数回归森林的hrb400e钢材力学性能预测方法
CN116881652A (zh) * 2023-06-26 2023-10-13 成都理工大学 基于优选负样本和随机森林模型的滑坡易发性评价方法
CN117113230A (zh) * 2022-08-19 2023-11-24 南方电网数字电网研究院有限公司 面向新能源高精度预测的机器学习特征选择方法
CN117763701A (zh) * 2024-02-22 2024-03-26 四川省交通勘察设计研究院有限公司 一种钢拱桥钢混连接过渡面的强度预测方法及相关产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011157655A1 (en) * 2010-06-15 2011-12-22 Biocrates Life Sciences Ag Use of bile acids for prediction of an onset of sepsis
CN106503867A (zh) * 2016-11-14 2017-03-15 吉林大学 一种遗传算法最小二乘风电功率预测方法
CN106779755A (zh) * 2016-12-31 2017-05-31 湖南文沥征信数据服务有限公司 一种网络电商借贷风险评估方法及模型
CN111488713A (zh) * 2020-04-14 2020-08-04 中国交通建设股份有限公司吉林省分公司 一种混凝土早期碳化预测的方法、预测系统及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011157655A1 (en) * 2010-06-15 2011-12-22 Biocrates Life Sciences Ag Use of bile acids for prediction of an onset of sepsis
CN106503867A (zh) * 2016-11-14 2017-03-15 吉林大学 一种遗传算法最小二乘风电功率预测方法
CN106779755A (zh) * 2016-12-31 2017-05-31 湖南文沥征信数据服务有限公司 一种网络电商借贷风险评估方法及模型
CN111488713A (zh) * 2020-04-14 2020-08-04 中国交通建设股份有限公司吉林省分公司 一种混凝土早期碳化预测的方法、预测系统及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JUNFEI ZHANG等: "Evaluating the bond strength of FRP-to-concrete composite joints using metaheuristic-optimized least-squares support vector regression", 《NEURAL COMPUTING AND APPLICATIONS》 *
蒋妍: "基于最小二乘支持向量机的聚氯乙烯汽提过程预测模型", 《计算机辅助技术》 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112489736A (zh) * 2020-12-09 2021-03-12 中国石油大学(北京) 一种矿物含量分析方法、装置、设备及存储介质
CN112801709A (zh) * 2021-02-05 2021-05-14 杭州拼便宜网络科技有限公司 一种用户流失预测方法、装置、设备及存储介质
CN113435471A (zh) * 2021-05-17 2021-09-24 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 深度特征聚类的高排放移动源污染识别方法及系统
CN113343558A (zh) * 2021-05-19 2021-09-03 东北石油大学 一种基于模糊神经网络的钻井参数优化方法
CN113778028B (zh) * 2021-08-12 2023-09-26 西安交通大学 基于边云协同与双增量的智能混凝算法
CN113778028A (zh) * 2021-08-12 2021-12-10 西安交通大学 基于边云协同与双增量的智能混凝算法
CN113869578A (zh) * 2021-09-26 2021-12-31 合肥通用机械研究院有限公司 常减压装置电脱盐系统脱后原油盐含量智能预测诊断方法
CN113868960A (zh) * 2021-10-18 2021-12-31 青岛农业大学 一种基于典型相关森林的土壤重金属特征选取方法及系统
CN113868960B (zh) * 2021-10-18 2024-04-16 青岛农业大学 一种基于典型相关森林的土壤重金属特征选取方法及系统
CN113743540A (zh) * 2021-11-04 2021-12-03 华能(天津)煤气化发电有限公司 一种基于多模型融合Stacking算法的煤质熔点预测方法
CN114971092A (zh) * 2022-07-29 2022-08-30 华北电力大学 一种变电站主控楼混凝土用量预测方法和装置
CN114971092B (zh) * 2022-07-29 2022-10-18 华北电力大学 一种变电站主控楼混凝土用量预测方法和装置
CN117113230A (zh) * 2022-08-19 2023-11-24 南方电网数字电网研究院有限公司 面向新能源高精度预测的机器学习特征选择方法
CN116682505A (zh) * 2023-06-14 2023-09-01 东北大学 一种基于分位数回归森林的hrb400e钢材力学性能预测方法
CN116682505B (zh) * 2023-06-14 2023-11-21 东北大学 一种基于分位数回归森林的hrb400e钢材力学性能预测方法
CN116881652A (zh) * 2023-06-26 2023-10-13 成都理工大学 基于优选负样本和随机森林模型的滑坡易发性评价方法
CN116881652B (zh) * 2023-06-26 2024-04-05 成都理工大学 基于优选负样本和随机森林模型的滑坡易发性评价方法
CN117763701A (zh) * 2024-02-22 2024-03-26 四川省交通勘察设计研究院有限公司 一种钢拱桥钢混连接过渡面的强度预测方法及相关产品
CN117763701B (zh) * 2024-02-22 2024-05-07 四川省交通勘察设计研究院有限公司 一种钢拱桥钢混连接过渡面的强度预测方法及相关产品

Also Published As

Publication number Publication date
CN111985796B (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
CN111985796B (zh) 基于随机森林和智能算法预测混凝土结构耐久性的方法
CN112069567B (zh) 基于随机森林和智能算法预测混凝土抗压强度的方法
AU2020101854A4 (en) A method for predicting concrete durability based on data mining and artificial intelligence algorithm
CN112070356B (zh) 一种基于rf-lssvm模型预测混凝土抗碳化性能的方法
Oreta et al. Neural network modeling of confined compressive strength and strain of circular concrete columns
CN111507518A (zh) 一种基于随机森林的小波神径网络混凝土抗渗预测的方法
CN107169565B (zh) 基于烟花算法改进bp神经网络的纺纱质量预测方法
CN110544011B (zh) 一种智能化的体系作战效能评估和优化方法
CN112016244B (zh) 基于svm与智能算法的耐久性混凝土多目标配合比优化方法
CN111832101B (zh) 一种水泥强度预测模型的构建方法及水泥强度预测方法
CN112069656B (zh) 基于lssvm-nsgaii耐久性混凝土配合比多目标优化的方法
CN111488713A (zh) 一种混凝土早期碳化预测的方法、预测系统及存储介质
CN114969953B (zh) 基于CatBoost-NSGA-Ⅲ的盾构下穿隧道优化设计方法及设备
CN115948964A (zh) 一种基于ga-bp神经网络的路面平整度预测方法
CN112307536A (zh) 一种大坝渗流参数反演方法
CN114819178A (zh) 一种铁路施工进度指标预测和在线更新方法
CN116844670A (zh) 一种基于ctgan的预测混凝土极限抗压强度的方法
CN113762602A (zh) 一种风电场短期风速预测方法
CN112347670B (zh) 一种基于神经网络响应面的堆石料蠕变参数预测方法
CN112687351A (zh) 一种基于遗传算法-bp神经网络快速预测复合介质微波电磁性能的方法
CN111861264A (zh) 一种基于数据挖掘和智能算法预测混凝土耐久性方法
CN111310974A (zh) 一种基于ga-elm的短期需水预测方法
CN111178627B (zh) 一种基于spca的神经网络混合优化预测方法
CN111062118A (zh) 一种基于神经网络预测分层的多层软测量建模系统及方法
CN117592666B (zh) 基于企业数据的多维度碳排放数据采集核算系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant