CN117252107A - 可解释机器学习模型赋能的沥青混合料体积指标预测及设计优化方法 - Google Patents
可解释机器学习模型赋能的沥青混合料体积指标预测及设计优化方法 Download PDFInfo
- Publication number
- CN117252107A CN117252107A CN202311455650.0A CN202311455650A CN117252107A CN 117252107 A CN117252107 A CN 117252107A CN 202311455650 A CN202311455650 A CN 202311455650A CN 117252107 A CN117252107 A CN 117252107A
- Authority
- CN
- China
- Prior art keywords
- asphalt mixture
- volume index
- machine learning
- model
- asphalt
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000203 mixture Substances 0.000 title claims abstract description 109
- 239000010426 asphalt Substances 0.000 title claims abstract description 99
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000010801 machine learning Methods 0.000 title claims abstract description 29
- 238000013461 design Methods 0.000 title claims abstract description 27
- 238000005457 optimization Methods 0.000 title claims description 16
- 238000012549 training Methods 0.000 claims abstract description 23
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 22
- 239000000463 material Substances 0.000 claims abstract description 18
- 238000004458 analytical method Methods 0.000 claims abstract description 5
- 238000012360 testing method Methods 0.000 claims description 15
- 239000011800 void material Substances 0.000 claims description 15
- 238000012216 screening Methods 0.000 claims description 6
- 238000002790 cross-validation Methods 0.000 claims description 4
- 229910052500 inorganic mineral Inorganic materials 0.000 claims description 4
- 239000011707 mineral Substances 0.000 claims description 4
- 230000035515 penetration Effects 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 3
- 239000011148 porous material Substances 0.000 claims description 2
- 238000012938 design process Methods 0.000 abstract description 4
- 230000001105 regulatory effect Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 19
- 238000003066 decision tree Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000007637 random forest analysis Methods 0.000 description 8
- 238000012512 characterization method Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000000465 moulding Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011439 discrete element method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004570 mortar (masonry) Substances 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/02—Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A30/00—Adapting or protecting infrastructure or their operation
- Y02A30/30—Adapting or protecting infrastructure or their operation in transportation, e.g. on roads, waterways or railways
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Geometry (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
可解释机器学习模型赋能的沥青混合料体积指标预测及设计优化方法,本发明针对沥青混合料材料组成复杂导致难以建立其与体积指标相关关系的问题。沥青混合料体积指标预测及优化方法:一、建立材料组成和性能特征参数数据集和目标特征参数数据集;二、计算Spearman相关系数;三、基于XGBoost算法训练得到沥青混合料体积指标预测模型;四、采用SHAP算法对沥青混合料体积指标预测模型进行可解释性分析;五、选取SHAP值均值最大的多个特征参数作为典型特征参数;六、设计优化。本发明根据材料组成和性能预测沥青混合料的体积指标,根据可解释机器学习结果可以对沥青混合料设计进行指导调控,加快沥青混合料配合比设计进程。
Description
技术领域
本发明属于沥青混合料技术领域,具体涉及一种可解释机器学习模型赋能的沥青混合料体积指标预测及设计优化方法。
背景技术
沥青混合料的体积指标和力学性能会显著影响沥青路面的耐久性。沥青混合料体积指标(空隙率、矿料间隙率和饱和度)与材料组成比例和混合料性能相关性强。常用的配合比设计方法需要工程师根据经验来提供级配曲线和沥青用量,然后制作大量样品并通过试验来测定沥青混合料的体积参数,最终获得最佳的混合比例。这一过程耗费大量的人力、物力和时间,而且高度依赖工程师的经验。据估计,使用传统配合比设计方法进行一次设计将花费大约15个工作日。
开发高效准确的配合比设计方法最近从未停止过。研究人员基于颗粒堆积模型提出了贝雷法和体积设计法等级配设计方法来优化级配设计过程。这些方法量化了不同集料的骨架和填充作用,但是忽视了砂浆的影响,仍然需要结合试验结果进行配合比优化,并不能消除试验步骤或节省实验时间。另一方面,研究人员采用数值模拟辅助配合比设计,从而降低试验成本。但是由于计算成本的约束,离散元法生成的虚拟试件通常不包括1.18mm以下的颗粒,而且其仿真成型过程与实际试验存在差异,因此并不能完全替代室内试验。
相对于传统的配合比设计方法,机器学习具有预测精度高、运算速度快等特点。机器学习能够从海量、复杂的数据中提取有用信息的过程,旨在发现隐藏在数据背后的模式、关系和规律。机器学习借助不断积累的试验和仿真数据,以更快速地发现新材料、优化性能和降低成本。近些年,机器学习方法逐渐应用于道路领域,机器学习方法不仅可以提高预测的准确性,还能够更全面地考虑到影响混合料性能的因素,包括材料的性能、配比、成型条件等,然而机器学习模型在应用过程中仍然存在一些挑战。例如,机器学习模型是一种黑盒模型,缺乏解释性,这使得决策者很难理解模型的决策过程和预测依据。
发明内容
本发明针对沥青混合料材料组成复杂导致难以建立其与体积指标相关关系的问题,本发明提供了一种可解释机器学习模型赋能的沥青混合料体积指标预测及设计优化方法。
本发明可解释机器学习模型赋能的沥青混合料体积指标预测及设计优化方法按照以下步骤实现:
一、采集不同沥青混合料的沥青用量,沥青针入度,沥青软化点和集料不同筛孔的通过率作为材料组成和性能特征参数数据集,以不同沥青混合料的空隙率或者矿料间隙率(VMA)构建目标特征参数数据集;
二、计算组成和性能特征参数数据集与目标特征参数数据集的Spearman相关系数,去除与目标特征参数数据集的Spearman相关系数绝对值低于0.1~0.15的特征参数,得到筛选后的特征参数数据集;
三、基于XGBoost算法训练建立得到沥青混合料体积指标预测模型,将步骤二中筛选后的特征参数数据集和目标特征参数数据集分为训练集与测试集,采用训练集对沥青混合料体积指标预测模型进行训练,并采用贝叶斯优化法和五折交叉验证法优化模型参数,得到训练后的沥青混合料体积指标预测模型;
四、采用SHAP算法对训练后的沥青混合料体积指标预测模型进行可解释性分析,计算全体样本筛选后的特征参数对应的SHAP值,通过不同特征参数的SHAP值均值来表征不同特征对预测结果的影响程度;
五、选取SHAP值均值最大的3~4个特征参数作为典型特征参数,分析典型特征参数对沥青混合料体积指标结果的影响;
六、设定沥青混合料体积指标的目标值,将沥青混合料的初始材料组成和性能特征参数导入训练后的沥青混合料体积指标预测模型,并计算SHAP值,通过调整典型特征参数,使预测结果达到沥青混合料体积指标的目标值。
本发明采用XGBoost算法能快速准确的获取沥青混合料的体积指标,设计速度快,设计成本低,而且结合SHAP方法可以对XGBoost模型进行解释,确定关键特征及其影响规律,在设计过程中应用XGBoost算法结合SHAP方法,不仅可以得到不同配比的预测结果,而且可以解释不同特征对结果的影响,便于沥青混合料设计进行智能决策。
本发明根据材料组成和性能预测沥青混合料的体积指标,并且根据可解释机器学习结果可以对沥青混合料设计进行指导调控,能够加快沥青混合料配合比设计进程,对于指导沥青混合料逆向设计具有积极意义。
附图说明
图1为实施例的步骤二中各特征参数的Spearman相关系数图;
图2为实施例的步骤四中三种预测模型的评价指标图;
图3为实施例的步骤四中采用XGBoost模型的预测结果和拟合结果分布图;
图4为实施例的步骤五中绘制典型特征参数的SHAP值分布图;
图5为实施例的步骤五中SHAP值重要性排序图;
图6为实施例的步骤六中沥青用量SHAP值的分布图;
图7为实施例的步骤六中0.6mm通过率的SHAP值分布图;
图8为实施例的步骤六中0.3mm通过率的SHAP值分布图;
图9为实施例中的组合1-5的力度图。
具体实施方式
具体实施方式一:本实施方式可解释机器学习模型赋能的沥青混合料体积指标预测及设计优化方法按照以下步骤实现:
一、采集不同沥青混合料的沥青用量,沥青针入度,沥青软化点和集料不同筛孔的通过率作为材料组成和性能特征参数数据集,以不同沥青混合料的空隙率或者矿料间隙率(VMA)构建目标特征参数数据集;
二、计算组成和性能特征参数数据集与目标特征参数数据集的Spearman相关系数,去除与目标特征参数数据集的Spearman相关系数绝对值低于0.1~0.15的特征参数,得到筛选后的特征参数数据集;
三、基于XGBoost算法训练建立得到沥青混合料体积指标预测模型,将步骤二中筛选后的特征参数数据集和目标特征参数数据集分为训练集与测试集,采用训练集对沥青混合料体积指标预测模型进行训练,并采用贝叶斯优化法和五折交叉验证法优化模型参数,得到训练后的沥青混合料体积指标预测模型;
四、采用SHAP算法对训练后的沥青混合料体积指标预测模型进行可解释性分析,计算全体样本筛选后的特征参数对应的SHAP值,通过不同特征参数的SHAP值均值来表征不同特征对预测结果的影响程度;
五、选取SHAP值均值最大的3~4个特征参数作为典型特征参数,分析典型特征参数对沥青混合料体积指标结果的影响;
六、设定沥青混合料体积指标的目标值,将沥青混合料的初始材料组成和性能特征参数导入训练后的沥青混合料体积指标预测模型,并计算SHAP值,通过调整典型特征参数,使预测结果达到沥青混合料体积指标的目标值。
本实施方式步骤三中贝叶斯优化是指给定优化的目标函数(广义的函数,只需指定输入和输出即可,无需知道内部结构以及数学性质),通过不断地添加样本点来更新目标函数的后验分布,即高斯过程(GP),直到后验分布基本贴合于真实分布。
具体实施方式二:本实施方式与具体实施方式一不同的是步骤一中筛孔孔径依次为0.075mm,0.15mm,0.3mm,0.6mm,1.18mm,2.36mm,4.75mm,9.5mm,13.2mm,16mm和19mm。
具体实施方式三:本实施方式与具体实施方式一或二不同的是步骤一中材料组成和性能特征参数数据集的样本数量为800~2000。
本实施方式优选的样本数量大于1500组数据。
具体实施方式四:本实施方式与具体实施方式一至三之一不同的是步骤二中去除Spearman相关系数绝对值低于0.1的特征参数。
具体实施方式五:本实施方式与具体实施方式一至四之一不同的是步骤二中Spearman相关系数的计算公式如下:
式中,ρ为Spearman相关系数,n为样本数量,di为样本之间的等级差值。
本实施方式样本数值按照从小到大排列确定等级。
具体实施方式六:本实施方式与具体实施方式一至五之一不同的是步骤三中训练集与测试集的比例为8:2。
具体实施方式七:本实施方式与具体实施方式一至六之一不同的是步骤四中所述的SHAP算法表示为:
式中:g(·)为解释模型,f(·)为机器学习方法,x′为简化输入,和输入x存在映射关系;为机器学习方法在数据集上的预测均值;/>为第i个特征的贡献值(即SHAP值),M为特征的总数。
具体实施方式八:本实施方式与具体实施方式一至七之一不同的是步骤五中选取SHAP值均值最大的3个特征参数作为典型特征参数。
具体实施方式九:本实施方式与具体实施方式一至八之一不同的是步骤五中绘制典型特征参数的SHAP值分布图。
实施例:本实施例可解释机器学习模型赋能的沥青混合料体积指标预测及设计优化方法按照以下步骤实施:
一、采集不同沥青混合料的沥青用量,沥青针入度,沥青软化点和不同筛孔(0.075mm,0.15mm,0.3mm,0.6mm,1.18mm,2.36mm,4.75mm,9.5mm,13.2mm,16mm和19mm)的通过率作为材料组成和性能特征参数数据集,以相应的沥青混合料的空隙率构建目标特征参数数据集;特征参数的最大值、最小值和平均值汇总于下表1;
表1特征汇总表
二、计算材料组成和性能特征参数数据集的Spearman相关系数,空隙率与特征参数的相关性如图1所示,去除与空隙率Spearman相关系数绝对值低于0.1的特征参数,得到筛选后与空隙率相关的特征参数,如表2所示;
表2特征筛选后与空隙率相关的特征参数
三、基于XGBoost算法、随机森林算法和高斯核函数的支持向量回归算法分别训练建立得到沥青混合料体积指标预测模型,按照8:2的比例将筛选后与空隙率相关的特征参数数据集和目标特征参数数据集分为训练集与测试集,采用训练集对沥青混合料体积指标预测模型进行训练,并采用贝叶斯优化法和五折交叉验证法优化模型参数,得到训练后的沥青混合料体积指标预测模型;
四、基于测试集检验步骤三中训练后的沥青混合料体积指标预测模型,以平均绝对百分比误差(MAPE)、均方根误差(RMSE)或者拟合优度(R2)做为指标评价预测模型的准确性,确定最优的沥青混合料体积指标预测算法,评价指标如图2所示,本实施例确定的最优预测模型为XGBoost模型,其对应的预测值和实际值如图3所示;
五、采用SHAP算法对训练后的沥青混合料体积指标预测模型进行可解释性分析,计算全体样本筛选后的特征参数对应的SHAP值,SHAP值的和即为预测目标的结果,汇总了SHAP值并绘制分布图(图4),然后通过不同特征参数的SHAP值均值来表征不同特征对预测结果的影响程度,空隙率预测模型的特征重要度排序为沥青用量>0.6mm通过率>0.3mm通过率>0.15mm通过率>1.18mm通过率,如图5所示;
六、选取SHAP值均值最大的3个特征参数作为典型特征参数(沥青用量、0.6mm通过率和0.3mm通过率),绘制单个典型特征参数的SHAP值分布图分析重要特征参数的对混合料体积指标预测结果的影响,由图6-8可知,沥青用量、0.3mm通过率和0.6mm通过率的增加均会降低沥青混合料的空隙率;
七、基于上述模型和影响规律进行级配设计,首先确定混合料体积参数设计目标,目标空隙率为4±0.2%,选取初始沥青用量和不同筛孔的通过率组合1导入预测模型进行体积指标预测,如果符合设计要求,设计结束。如果不符合要求,结合SHAP值绘制预测结果如力度图9,根据步骤六中的重要特征参数对混合料体积指标的影响规律进行调整。组合1不符合要求,沥青用量提供的正向增益太强,因此需要提高沥青用量,进而选择了组合2、组合3和组合4,其中组合3和4沥青用量产生了较大的负向增益,使其满足空隙率要求,而组合5调整0.6mm通过率,使其产生一定的负向增益,降低了混合料的空隙率,但是仍不满足要求。
表3组合1-5的具体配比
本实施例中所述的XGBoost算法的原理如下:
XGBoost的核心原理是通过集成多个弱学习器(通常为决策树),逐步提升模型的预测性能。采用梯度提升方法,不断地拟合当前模型对残差的近似值,将多个弱学习器的预测结果进行加权相加,从而得到最终的预测结果。在每一轮迭代中,XGBoost优化目标函数,使得模型在训练数据上的损失最小化。这种自适应学习率能够使得在模型训练的早期,较大权重的弱分类器有更大的影响,而在训练后期,权重逐渐减小,从而增强模型的稳定性。通过引入正则化项,即树深度和叶节点权值。XGBoost采用了一种分层决策树生长技术来控制模型的复杂度,避免过拟合,从而提高模型的鲁棒性。
XGBoost的目标函数如式(1),现介绍其优化过程。
式中指第t轮迭代之后第i个样本的预测结果;yi指第i个样本的真实值;指模型的损失函数;Ω(fi)为第t轮迭代的正则项,表示第t轮增加的基学习器的复杂度。
式中正则项部分展开得到式(2)。
式中为前t-1轮正则项,在第t轮迭代时为固定值,记作constant。
第t轮模型预测值可以用第t-1轮模型预测值和第t轮构建基学习器的预测值表示如式(3)。
将式(2)、(3)带入式(1)得到(4)。
运用泰勒公式二阶展开近似表达损失函数如式(5)。
Δx对应第t颗树的模型ft(xi),x对应的是针对第i个样本前t-1棵树的预测值之和f(x)对应损失函数/>从而得到式(6)。
正则项从叶子节点个数和叶子节点的权重值w两个角度定义树的复杂程度,可以表示为式(7)。
式中γT为L1范数,γ为L1正则化项的权重reg_alpha,T为当前树模型叶子节点的个数;为L2范数,λ为L2正则化项的权重reg_lambda,ωj为叶子节点取值。
将式(6)、式(7)带入式(4)得到式(8)。
为第t-1轮损失函数,为固定值,记为constant’。
将叶子节点j所包含样本的一阶导数、二阶导数之和表示为式(9)、式(10)。
固定值不影响寻找目标函数极值,所以将式(8)进一步简化为式(11)。
对目标函数求导,导数等于0,得到叶子节点取值,完成目标函数的优化如式(12)。
本实施例步骤三中所述的随机森林算法原理如下:
随机森林是基于决策树方法的集成算法,算法思想为先用随机的方式建立一个森林,森林由没有相互关联的决策树组成,而所有样本均在决策树的根部,分裂时依据信息增益、基尼指数或均方差,选择最优的特征分类进行分裂以形成新的决策树,后续分叉的节点采用相同准则循环往复形成一片完整的随机森林。随机森林回归模型的每棵二叉树采用回归树,在分裂时采用最小均方差原则,输出的预测结果为所有决策树结果的平均值。随机森林能够有效地处理多样性的数据,通过多个决策树来捕捉特征间复杂的非线性关系,从而更好地拟合数据并提高预测性能。其次,由于随机性的引入,每棵决策树都具有不同的偏差和方差,从而减少了模型在训练集上的过拟合。这在数据量有限的情况下尤为重要,能够增加模型在未知数据上的泛化能力。
式中,为组合的随机森林模型;hi(x)为单个决策树模型;Y为输出变量;k为随机森林模型中决策树的数量。
本实施例步骤三中所述的高斯核函数的支持向量回归算法原理如下:
支持向量回归是一种基于统计学习理论和凸优化方法的机器学习算法。SVR的基本原理是通过寻找一个超平面,使得这个超平面与样本数据点之间的间隔最大化,这种距离通常称为间隔余量。SVR的目标是通过最小化样本数据点与超平面之间的误差,同时使得间隔余量最大化。SVR能够逼近数据点的分布,同时具有较好的泛化性能。采用高斯核函数代替线性方程中的线性项以达到数据升维的目的,并在二维或高维空间通过逼近结构风险函数的最小值实现最优回归直线或超平面的确定。高斯核函数的公式如下所示:
x′为核函数的中心;||x-x′||2为向量x和向量x′的欧式距离;σ为核函数的作用范围。
Claims (9)
1.可解释机器学习模型赋能的沥青混合料体积指标预测及设计优化方法,其特征在于该沥青混合料体积指标预测及设计优化方法按照以下步骤实现:
一、采集不同沥青混合料的沥青用量,沥青针入度,沥青软化点和集料不同筛孔的通过率作为材料组成和性能特征参数数据集,以不同沥青混合料的空隙率或者矿料间隙率构建目标特征参数数据集;
二、计算组成和性能特征参数数据集与目标特征参数数据集的Spearman相关系数,去除与目标特征参数数据集的Spearman相关系数绝对值低于0.1~0.15的特征参数,得到筛选后的特征参数数据集;
三、基于XGBoost算法训练建立得到沥青混合料体积指标预测模型,将步骤二中筛选后的特征参数数据集和目标特征参数数据集分为训练集与测试集,采用训练集对沥青混合料体积指标预测模型进行训练,并采用贝叶斯优化法和五折交叉验证法优化模型参数,得到训练后的沥青混合料体积指标预测模型;
四、采用SHAP算法对训练后的沥青混合料体积指标预测模型进行可解释性分析,计算全体样本筛选后的特征参数对应的SHAP值,通过不同特征参数的SHAP值均值来表征不同特征对预测结果的影响程度;
五、选取SHAP值均值最大的3~4个特征参数作为典型特征参数,分析典型特征参数对沥青混合料体积指标结果的影响;
六、设定沥青混合料体积指标的目标值,将沥青混合料的初始材料组成和性能特征参数导入训练后的沥青混合料体积指标预测模型,并计算SHAP值,通过调整典型特征参数,使预测结果达到沥青混合料体积指标的目标值。
2.根据权利要求1所述的可解释机器学习模型赋能的沥青混合料体积指标预测及设计优化方法,其特征在于步骤一中筛孔孔径依次为0.075mm,0.15mm,0.3mm,0.6mm,1.18mm,2.36mm,4.75mm,9.5mm,13.2mm,16mm和19mm。
3.根据权利要求1所述的可解释机器学习模型赋能的沥青混合料体积指标预测及设计优化方法,其特征在于步骤一中材料组成和性能特征参数数据集的样本数量为800~2000。
4.根据权利要求1所述的可解释机器学习模型赋能的沥青混合料体积指标预测及设计优化方法,其特征在于步骤二中去除Spearman相关系数绝对值低于0.1的特征参数。
5.根据权利要求1所述的可解释机器学习模型赋能的沥青混合料体积指标预测及设计优化方法,其特征在于步骤二中Spearman相关系数的计算公式如下:
式中,ρ为Spearman相关系数,n为样本数量,di为样本之间的等级差值。
6.根据权利要求1所述的可解释机器学习模型赋能的沥青混合料体积指标预测及设计优化方法,其特征在于步骤三中训练集与测试集的比例为8:2。
7.根据权利要求1所述的可解释机器学习模型赋能的沥青混合料体积指标预测及设计优化方法,其特征在于步骤四中所述的SHAP算法表示为:
式中:g(·)为解释模型,f(·)为机器学习方法,x′为简化输入,和输入x存在映射关系;为机器学习方法在数据集上的预测均值;/>为第i个特征的贡献值,M为特征的总数。
8.根据权利要求1所述的可解释机器学习模型赋能的沥青混合料体积指标预测及设计优化方法,其特征在于步骤五中选取SHAP值均值最大的3个特征参数作为典型特征参数。
9.根据权利要求1所述的可解释机器学习模型赋能的沥青混合料体积指标预测及设计优化方法,其特征在于步骤五中绘制典型特征参数的SHAP值分布图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311455650.0A CN117252107A (zh) | 2023-11-03 | 2023-11-03 | 可解释机器学习模型赋能的沥青混合料体积指标预测及设计优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311455650.0A CN117252107A (zh) | 2023-11-03 | 2023-11-03 | 可解释机器学习模型赋能的沥青混合料体积指标预测及设计优化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117252107A true CN117252107A (zh) | 2023-12-19 |
Family
ID=89135251
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311455650.0A Pending CN117252107A (zh) | 2023-11-03 | 2023-11-03 | 可解释机器学习模型赋能的沥青混合料体积指标预测及设计优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117252107A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117763213A (zh) * | 2023-12-25 | 2024-03-26 | 哈尔滨工业大学 | 一种沥青黏弹构效关系模型的可视化界面建立方法 |
CN117831682A (zh) * | 2024-01-04 | 2024-04-05 | 哈尔滨工业大学 | 一种基于深度学习的虚拟沥青生成方法 |
CN118277887A (zh) * | 2024-05-31 | 2024-07-02 | 深圳大学 | 基于机器学习的水泥基材料性能优化方法及系统 |
-
2023
- 2023-11-03 CN CN202311455650.0A patent/CN117252107A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117763213A (zh) * | 2023-12-25 | 2024-03-26 | 哈尔滨工业大学 | 一种沥青黏弹构效关系模型的可视化界面建立方法 |
CN117831682A (zh) * | 2024-01-04 | 2024-04-05 | 哈尔滨工业大学 | 一种基于深度学习的虚拟沥青生成方法 |
CN117831682B (zh) * | 2024-01-04 | 2024-07-23 | 哈尔滨工业大学 | 一种基于深度学习的虚拟沥青生成方法 |
CN118277887A (zh) * | 2024-05-31 | 2024-07-02 | 深圳大学 | 基于机器学习的水泥基材料性能优化方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117252107A (zh) | 可解释机器学习模型赋能的沥青混合料体积指标预测及设计优化方法 | |
CN112070356B (zh) | 一种基于rf-lssvm模型预测混凝土抗碳化性能的方法 | |
CN110782658B (zh) | 一种基于LightGBM算法的交通量预测方法 | |
CN108846526A (zh) | 一种二氧化碳排放量预测方法 | |
CN109754122A (zh) | 一种基于随机森林特征提取的bp神经网络的数值预测方法 | |
CN112765902B (zh) | 一种基于TentFWA-GD的RBF神经网络的农村生活污水处理过程中COD浓度的软测量建模方法 | |
CN111339478A (zh) | 基于改进模糊层次分析法的气象数据质量评估方法 | |
CN114004153A (zh) | 一种基于多源数据融合的侵彻深度预测方法 | |
Gandomi et al. | Intelligent modeling and prediction of elastic modulus of concrete strength via gene expression programming | |
CN116680976A (zh) | 基于机器学习的增材制造金属材料逆向设计方法 | |
CN115600492A (zh) | 一种激光切割工艺设计方法及系统 | |
CN110362911A (zh) | 一种面向设计过程的代理模型选择方法 | |
MolaAbasi et al. | Use of GMDH-type neural network to model the mechanical behavior of a cement-treated sand | |
CN110826714A (zh) | 一种岩质基坑爆破参数动态调控方法 | |
Jayawardena et al. | Rainfall-runoff modelling using genetic programming | |
CN117439053A (zh) | 一种Stacking集成模型电量预测方法、装置、存储介质 | |
CN116933631A (zh) | 一种基于神经网络优化算法的爆破块度预测方法 | |
Li et al. | A data-driven rutting depth short-time prediction model with metaheuristic optimization for asphalt pavements based on RIOHTrack | |
CN116759031A (zh) | 一种基于ann的污泥灰混凝土材料配合比的设计方法 | |
CN111144051A (zh) | 一种基于支持向量机和改进布谷鸟算法的地聚物混凝土强度预测方法 | |
Xiao et al. | A Comparison study of utilizing optimization algorithms and fuzzy logic for candidate-well selection | |
CN108596781A (zh) | 一种电力系统数据挖掘与预测整合方法 | |
CN115346622A (zh) | 一种水泥稳定碎石抗压强度的预测方法 | |
CN114065616A (zh) | 一种基于神经网络和灰关联的长期老化粘度预测方法 | |
Attoh-Okine | Application of genetic-based neural network to lateritic soil strength modeling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |