CN117010266A

CN117010266A - 一种基于XGBoost模型的膏体屈服应力预测方法及装置

Info

Publication number: CN117010266A
Application number: CN202310416311.5A
Authority: CN
Inventors: 李翠平; 李雪; 阮竹恩; 黄振华; 陈龙
Original assignee: University of Science and Technology Beijing USTB
Current assignee: University of Science and Technology Beijing USTB
Priority date: 2023-04-18
Filing date: 2023-04-18
Publication date: 2023-11-07

Abstract

本发明涉及膏体充填工艺技术领域，特别是指一种基于XGBoost模型的膏体屈服应力预测方法及装置。方法包括：获取膏体料浆的样本数据；将膏体料浆的样本数据划分为训练数据集和测试数据集；构建用于预测膏体屈服应力的初始XGBoost模型，通过网格搜索对初始XGBoost模型的超参数进行寻优，得到超参数的最优组合，将超参数的最优组合输入XGBoost模型，得到待训练XGBoost模型；将训练数据集输入待训练XGBoost模型进行训练，得到训练完毕的待测试XGBoost模型；将测试数据集输入待测试XGBoost模型进行测试，得到完成测试的XGBoost模型；获取待预测膏体料浆的参数，将待预测膏体料浆的参数输入到XGBoost模型，得到待预测膏体料浆的屈服应力。采用本发明，可以实现膏体精准化制备。

Description

一种基于XGBoost模型的膏体屈服应力预测方法及装置

技术领域

本发明涉及膏体充填工艺技术领域，特别是指一种基于XGBoost模型的膏体屈服应力预测方法及装置。

背景技术

矿山开采过程中产生采空区与尾矿库，大量尾砂堆积于地表对环境产生不利影响，采空区也会产生地质灾害。膏体充填工艺将处理后的尾砂填充至采空区，实现“一废治两害”的目标。搅拌是膏体充填工艺中的关键步骤，其目标是保证物料在混合过程中充分混合，混合良好的膏体具有较好的流动性，可以确保充填工艺的顺利进行。流变参数是膏体混合效果的宏观响应，静态屈服应力与动态屈服应力是表征膏体流变特性的重要参数，膏体流变学可以指导和优化搅拌设计。然而膏体流变特性受到多种因素影响，实验结果与影响因素之间的通常仅适用于特定矿山，而且开展流变实验费时费力，膏体流变学很难在矿山生产过程中有效应用。因此，膏体流变参数的预测是实现膏体流变学工业应用的关键。

基于以上问题，学者们开始尝试使用机器学习来解决膏体流变性能预测的问题，不过较少研究关注各因素对膏体流变性能的影响。同时研究中采用的机器学习方法仍然存在训练时间长、预测效果不理想等问题。

发明内容

本发明实施例提供了一种基于XGBoost模型的膏体屈服应力预测方法及装置。所述技术方案如下：

一方面，提供了一种基于XGBoost模型的膏体屈服应力预测方法，该方法由电子设备实现，该方法包括：

S1、获取膏体料浆的样本数据，所述样本数据包括样本输入数据和真实值，所述样本输入数据包括料浆浓度、灰砂比以及尾砂配比，所述真实值包括膏体料浆的静态屈服应力和动态屈服应力；

S2、将所述膏体料浆的样本数据划分为训练数据集和测试数据集；

S3、构建用于预测膏体屈服应力的初始XGBoost模型，通过网格搜索对初始XGBoost模型的超参数进行寻优，得到超参数的最优组合，将超参数的最优组合输入XGBoost模型，得到待训练XGBoost模型；

S4、将所述训练数据集输入所述待训练XGBoost模型进行训练，得到训练完毕的待测试XGBoost模型；

S5、将所述测试数据集输入所述待测试XGBoost模型进行测试，得到完成测试的XGBoost模型；

S6、获取待预测膏体料浆的参数，将所述待预测膏体料浆的参数输入到所述XGBoost模型，得到所述待预测膏体料浆的屈服应力；其中，所述待预测膏体料浆的参数包括待预测膏体料浆的料浆浓度、灰砂比以及尾砂配比，所述待预测膏体料浆的屈服应力包括待预测膏体料浆的静态屈服应力和动态屈服应力。

可选地，所述初始XGBoost模型的超参数，包括学习率、建立每个模型所需要的最小样本数、树的最大深度、给定模型所需的损失函数、用于确定训练模型的子样本占样本集合的比例、建立树时对特征随机采样的比例以及L1和L2正则化项。

可选地，所述通过网格搜索对初始XGBoost模型的超参数进行寻优，得到超参数的最优组合，包括：

列出一个超参数值域，建立参数值字典，建立网格搜索框架；

在所述参数值字典的所有参数选择中，通过循环遍历来尝试每一种可能性，最终确定出最优超参数。

可选地，所述将所述训练数据集输入所述待训练XGBoost模型进行训练，得到训练完毕的待测试XGBoost模型，包括：

构建待训练XGBoost模型基于a个自变量x_i的数据集，每个自变量x_i都有b个特征值，有x_i∈R^m，每个自变量都对应于一个因变量y_i，y_i∈R，待训练XGBoost模型的预测值如下式(1)：

其中，为模型的预测值，f_k表示自变量x_i对应的函数，F表示所有可能回归树的集合；

待训练XGBoost模型的预测函数包括损失函数和正则项，正则项负责度量模型的复杂程度，目标函数为如下公式(2)：

其中，E()表示自变量x_i的训练误差，即损失函数，H表示正则项，如下式(3)：

其中，γ是每片叶子复杂程度的正则项系数，T与ω_i分别代表叶子的数量与第i个叶子的权重，正则项用于避免过拟合，目标函数用于选择一个简单且具有预测能力的模型；

第t次迭代中表示为如下公式(4)：

第t次迭代模型由第t-1次迭代模型加上新的子模型f_t(x_i)构成，为了使目标函数G达到最小值，采用近似方法对目标函数进行优化，对目标函数泰勒二阶展开得到：

其中g_i为对/>的一阶导数，h_i为/>对/>的二阶导数；

定义I_j为叶子节点j的样本集，即落在叶子节点j上的所有样本，f_t(x_i)将样本划分到叶子节点，计算得到叶子节点的分数ω；当i∈I_j，用ω_j代替f_t(x_i)，简化式(5)并对ω_j求偏导，令偏导数为0，优先权重与目标函数最小值为：

采用贪心算法获得简化公式，假设I_L和I_R为分裂后左右子节点的样本集，I＝I_L∪I_R，节点分裂前后目标函数变化公式为：

M_split达到最大时将对应的分裂点确定为最有分裂点，通过不断迭代，最终得到最佳集成模型。

可选地，所述将所述测试数据集输入所述待测试XGBoost模型进行测试，得到完成测试的XGBoost模型，包括：

将所述测试数据集输入所述待测试XGBoost模型，得到测试输出值；

将所述测试输出值与所述测试数据集对应的真实值进行比较，计算得出所述待测试XGBoost模型的预测正确率，如果所述待测试XGBoost模型的预测正确率达到预设阈值，则将所述待测试XGBoost模型确定为完成测试的XGBoost模型。

可选地，所述方法还包括：

利用SHAP模型定量评价XGBoost模型的预测值，分析输入的样本中每个特征的SHAP值，SHAP值代表每个特征对于预测值的贡献。

可选地，所述利用SHAP模型定量评价XGBoost模型的预测值，分析输入的样本中每个特征的SHAP值，包括：

假设第i个样本为x_i，样本具有j个特征值，该样本的第j个特征为x_ij，该样本的预测值为y_i，则SHAP值如下：

y_i＝y_base+f(x_i1)+f(x_i2)+...+f(x_ij)

其中，y_base为模型基线，表示样本的目标变量均值，f(x_ij)为x_ij的SHAP值，代表第j个特征对预测值y_i的贡献值，当f(x_ij)>0，说明特征起到了正向作用；若f(x_ij)<0说明特征起到了反向作用，该特征使预测值降低。

另一方面，提供了一种基于XGBoost模型的膏体屈服应力预测装置，该装置应用于基于XGBoost模型的膏体屈服应力预测方法，该装置包括：

获取模块，用于获取膏体料浆的样本数据，所述样本数据包括样本输入数据和真实值，所述样本输入数据包括料浆浓度、灰砂比以及尾砂配比，所述真实值包括膏体料浆的静态屈服应力和动态屈服应力；

划分模块，用于将所述膏体料浆的样本数据划分为训练数据集和测试数据集；

构建模块，用于构建用于预测膏体屈服应力的初始XGBoost模型，通过网格搜索对初始XGBoost模型的超参数进行寻优，得到超参数的最优组合，将超参数的最优组合输入XGBoost模型，得到待训练XGBoost模型；

训练模块，用于将所述训练数据集输入所述待训练XGBoost模型进行训练，得到训练完毕的待测试XGBoost模型；

测试模块，用于将所述测试数据集输入所述待测试XGBoost模型进行测试，得到完成测试的XGBoost模型；

预测模块，用于获取待预测膏体料浆的参数，将所述待预测膏体料浆的参数输入到所述XGBoost模型，得到所述待预测膏体料浆的屈服应力；其中，所述待预测膏体料浆的参数包括待预测膏体料浆的料浆浓度、灰砂比以及尾砂配比，所述待预测膏体料浆的屈服应力包括待预测膏体料浆的静态屈服应力和动态屈服应力。

可选地，所述构建模块，用于：

可选地，所述训练模块，用于：

第t次迭代中表示为如下公式(4)：

其中g_i为对/>的一阶导数，h_i为/>对/>的二阶导数；

可选地，所述测试模块，用于：

可选地，所述装置还包括分析模块，所述分析模块用于：

可选地，所述分析模块用于：

y_i＝y_base+f(x_i1)+f(x_i2)+...+f(x_ij)

另一方面，提供了一种电子设备，所述电子设备包括处理器和存储器，所述存储器中存储有至少一条指令，所述至少一条指令由所述处理器加载并执行以实现上述基于XGBoost模型的膏体屈服应力预测方法。

另一方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令，所述至少一条指令由处理器加载并执行以实现上述基于XGBoost模型的膏体屈服应力预测方法。

本发明实施例提供的技术方案带来的有益效果至少包括：

本发明中，获取膏体料浆的样本数据，样本数据包括样本输入数据和真实值，样本输入数据包括料浆浓度、灰砂比以及尾砂配比，真实值包括膏体料浆的静态屈服应力和动态屈服应力；将膏体料浆的样本数据划分为训练数据集和测试数据集；构建用于预测膏体屈服应力的初始XGBoost模型，通过网格搜索对初始XGBoost模型的超参数进行寻优，得到超参数的最优组合，将超参数的最优组合输入XGBoost模型，得到待训练XGBoost模型；将训练数据集输入待训练XGBoost模型进行训练，得到训练完毕的待测试XGBoost模型；将测试数据集输入待测试XGBoost模型进行测试，得到完成测试的XGBoost模型；获取待预测膏体料浆的参数，将待预测膏体料浆的参数输入到XGBoost模型，得到待预测膏体料浆的屈服应力。通过本发明，可以构建影响因素与膏体流变参数的关系，同时解决机器学习训练时间长、预测效果不理想等问题，实现了膏体静态屈服应力与动态屈服应力的有效预测，并达到了量化评价不同因素对膏体流变特性影响的目标，从而实现膏体精准化制备的技术效果。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种基于XGBoost模型的膏体屈服应力预测方法流程图；

图2是本发明实施例提供的一种静态屈服应力预测模型的特征重要性SHAP分析图；

图3为本发明实施例提供的一种的静态屈服应力预测模型的特征密度散点图；

图4为本发明实施例提供的一种的静态屈服应力预测模型的SHAP决策图；

图5为本发明实施例提供的一种的动态屈服应力预测模型的特征重要性SHAP分析图；

图6为本发明实施例提供的一种的动态屈服应力预测模型的特征密度散点图；

图7为本发明实施例提供的一种的动态屈服应力预测模型的SHAP决策图；

图8是本发明实施例提供的一种基于XGBoost模型的膏体屈服应力预测装置框图；

图9是本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述。

本发明实施例提供了一种基于XGBoost模型的膏体屈服应力预测方法，该方法可以由电子设备实现，该电子设备可以是终端或服务器。如图1所示的基于XGBoost模型的膏体屈服应力预测方法流程图，该方法的处理流程可以包括如下的步骤：

S1、获取膏体料浆的样本数据，样本数据包括样本输入数据和真实值。

其中，样本输入数据包括料浆浓度、灰砂比以及尾砂配比，真实值包括膏体料浆的静态屈服应力和动态屈服应力。

一种可行的实施方式中，可以先构建膏体流变参数数据库，在构建该数据库时，可以采用已有的研究成果数据，也可以开展流变实验。需要说明的是，膏体的流变参数应该采用相同的流变实验方案得到。

S2、将膏体料浆的样本数据划分为训练数据集和测试数据集。

一种可行的实施方式中，在膏体料浆的样本数据中随机选取75％的实验数据作为训练数据集，用于训练模型；剩下的25％的实验数据作为测试数据集，用于评估屈服应力模型的预测性能。

S3、构建用于预测膏体屈服应力的初始XGBoost模型，通过网格搜索对初始XGBoost模型的超参数进行寻优，得到超参数的最优组合，将超参数的最优组合输入XGBoost模型，得到待训练XGBoost模型。

可选地，初始XGBoost模型的超参数，包括学习率、建立每个模型所需要的最小样本数、树的最大深度、给定模型所需的损失函数、用于确定训练模型的子样本占样本集合的比例、建立树时对特征随机采样的比例以及L1和L2正则化项。

一种可行的实施方式中，eta为学习率；Min＿child＿weight代表建立每个模型所需要的最小样本数；Max＿depth是树的最大深度；gamma给定模型所需损失函数；subsample用于确定训练模型的子样本占样本集合的比例；colsample＿bytree表示建立树时对特征随机采样的比例；lambda和alpha分别是L2和L1正则化项。

可选地，通过网格搜索对初始XGBoost模型的超参数进行寻优，得到超参数的最优组合，可以包括如下步骤：

在参数值字典的所有参数选择中，通过循环遍历来尝试每一种可能性，最终确定出最优超参数。

S4、将训练数据集输入待训练XGBoost模型进行训练，得到训练完毕的待测试XGBoost模型。

一种可行的实施方式中，利用训练数据集对待训练XGBoost模型进行训练，判定训练得到的参数是否为最优，并且通过适应度函数判断模型是否过拟合。可选地，相应的训练步骤具体可以如下：

第t次迭代中表示为如下公式(4)：

其中g_i为对/>的一阶导数，h_i为/>对/>的二阶导数；

需要说明的是，在上述的训练过程中，将适应度函数设置为RMSE(RootMeanSquared Error，均方根误差)以防止过拟合，随着迭代次数的增加，RMSE先下降更快再变慢的趋势。经过反复迭代，当训练集的RMSE收敛到最优解，超参数达到最优解，XGBoost模型没有过拟合。

S5、将测试数据集输入待测试XGBoost模型进行测试，得到完成测试的XGBoost模型。

可选地，评测的过程具体可以如下：

将测试数据集输入待测试XGBoost模型，得到测试输出值；

将测试输出值与测试数据集对应的真实值进行比较，计算得出待测试XGBoost模型的预测正确率，如果待测试XGBoost模型的预测正确率达到预设阈值，则将待测试XGBoost模型确定为完成测试的XGBoost模型。

需要说明的是，对待测试XGBoost模型的测试方法可以参照现有技术中常用的测试方法，本发明实施例在此不做赘述。

S6、获取待预测膏体料浆的参数，将待预测膏体料浆的参数输入到XGBoost模型，得到待预测膏体料浆的屈服应力。

其中，待预测膏体料浆的参数包括待预测膏体料浆的料浆浓度、灰砂比以及尾砂配比，待预测膏体料浆的屈服应力包括待预测膏体料浆的静态屈服应力和动态屈服应力。

一种可行的实施方式中，为了进一步验证XGBoost模型膏体屈服应力预测模型的性能，本发明与不同的预测模型对同样的流变数据进行预测的结果进行了对比分析，本发明选用了梯度提升决策树(GBDT)、自适应提升树算法(ADBT)和随机森林算法(RF)。选择了四个评估指标来评估XGBoost模型的充分性和有效性，包括确定系数(R2)、平均绝对误差(MAE)、均方根误差(RMSE)和解释方差分数(EVS)。R2描述回归模型方差分数，范围为(0，1]，值越大表示预测模型的准确性越高；MAE评估预测与真实数据集的接近程度，值越小拟合越好；RMSE解释预测误差的分布，RMSE较小代表预测分布的变化较小；EVS是在(0，1]范围内定义模型方差分数，数值越大越有效。

其中R2、MAE、RMSE和EVS的计算公式如下：

其中YS_pi是预测屈服应力值，YS_ti是真实屈服应力值，SSE是误差平方和，SST是总平方和，ME是平均残差。训练后的模型进入测试部分，得到评估值，如表1所示。

表1

从表1可以看出，相较于ADBT、GBDT和RF模型，本发明XGBoost预测模型的R²和EVS值较大(静态屈服应力预测模型的R²＝0.938，EVS＝0.940，动态屈服应力预测模型的R²＝0.935，EVS＝0.939)，而且MAE和RMSE值较小(静态屈服应力预测模型的MAE＝4.260，RMSE＝5.623，动态屈服应力预测模型的MAE＝3.115，RMSE＝4.334)。综合各项指标，XGBoost模型的预测效果较好。

S7、利用SHAP模型定量评价XGBoost模型的预测值，分析输入的样本中每个特征的SHAP值，SHAP值代表每个特征对于预测值的贡献。

可选地，利用SHAP模型定量评价XGBoost模型的预测值，分析输入的样本中每个特征的SHAP值，包括：

y_i＝y_base+f(x_i1)+f(x_i2)+...+f(x_ij)

一种可行的实施方式中，在步骤S6后，利用SHAP模型定量评价机器学习模型的输出。图2为静态屈服应力预测模型的特征重要性SHAP图，图中特征按照其对模型的影响大小的绝对值排序，特征重要性从大到小依次为料浆浓度、灰砂比与尾砂配比，料膏体浆的重要性远大于其他两个特征。图3为静态屈服应力预测模型的特征密度散点图，料浆浓度中高分红点的SHAP值大于0，这个特征对静态屈服应力预测起到正向作用；灰砂比对静态屈服应力预测的重要性更大，二者对静态屈服应力预测的贡献较小。图4为静态屈服应力预测模型的SHAP决策图，x轴为模型输出结果，y轴为SHAP值。每条折线都与样本对应，每条折线都是特征值累加的过程，更多样本的SHAP值在达到料浆浓度特征时显著增加，料浆浓度对预测值的贡献最大。图5为动态屈服应力预测模型的特征重要性图，料浆浓度的重要性最大，其平均SHAP的绝对值大于12，其次是灰砂比与尾砂配比。图6为动态屈服应力预测模型的特征密度散点图，料浆浓度对模型非常重要，料浆浓度高分红点的SHAP值大于0，料浆浓度对预测值产生了正向影响，而灰砂比与尾砂配比的样本分布大多在SHAP＝0的位置分布，说明这两个特征值对大部分样本影响较小。图7为动态屈服应力预测模型的SHAP决策图，折线在料浆浓度特征这部分得到显著增加。无论对于静态屈服应力与动态屈服应力预测模型，料浆浓度对预测值的贡献度最大，其次是灰砂比与尾砂配比。

图8是根据一示例性实施例示出的一种基于XGBoost模型的膏体屈服应力预测装置框图，该装置用于基于XGBoost模型的膏体屈服应力预测方法。参照图8，该装置包括：

获取模块810，用于获取膏体料浆的样本数据，所述样本数据包括样本输入数据和真实值，所述样本输入数据包括料浆浓度、灰砂比以及尾砂配比，所述真实值包括膏体料浆的静态屈服应力和动态屈服应力；

划分模块820，用于将所述膏体料浆的样本数据划分为训练数据集和测试数据集；

构建模块830，用于构建用于预测膏体屈服应力的初始XGBoost模型，通过网格搜索对初始XGBoost模型的超参数进行寻优，得到超参数的最优组合，将超参数的最优组合输入XGBoost模型，得到待训练XGBoost模型；

训练模块840，用于将所述训练数据集输入所述待训练XGBoost模型进行训练，得到训练完毕的待测试XGBoost模型；

测试模块850，用于将所述测试数据集输入所述待测试XGBoost模型进行测试，得到完成测试的XGBoost模型；

预测模块860，用于获取待预测膏体料浆的参数，将所述待预测膏体料浆的参数输入到所述XGBoost模型，得到所述待预测膏体料浆的屈服应力；其中，所述待预测膏体料浆的参数包括待预测膏体料浆的料浆浓度、灰砂比以及尾砂配比，所述待预测膏体料浆的屈服应力包括待预测膏体料浆的静态屈服应力和动态屈服应力。

可选地，所述构建模块，用于：

可选地，所述训练模块，用于：

第t次迭代中表示为如下公式(4)：

其中g_i为对/>的一阶导数，h_i为/>对/>的二阶导数；

可选地，所述测试模块，用于：

可选地，所述装置还包括分析模块，所述分析模块用于：

可选地，所述分析模块用于：

y_i＝y_base+f(x_i1)+f(x_i2)+...+f(x_ij)

图9是本发明实施例提供的一种电子设备900的结构示意图，该电子设备900可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(centralprocessing units，CPU)901和一个或一个以上的存储器902，其中，所述存储器902中存储有至少一条指令，所述至少一条指令由所述处理器901加载并执行以实现上述中文文本拼写检查方法的步骤。

在示例性实施例中，还提供了一种计算机可读存储介质，例如包括指令的存储器，上述指令可由终端中的处理器执行以完成上述中文文本拼写检查方法。例如，所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于XGBoost模型的膏体屈服应力预测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述初始XGBoost模型的超参数，包括学习率、建立每个模型所需要的最小样本数、树的最大深度、给定模型所需的损失函数、用于确定训练模型的子样本占样本集合的比例、建立树时对特征随机采样的比例以及L1和L2正则化项。

3.根据权利要求1所述的方法，其特征在于，所述通过网格搜索对初始XGBoost模型的超参数进行寻优，得到超参数的最优组合，包括：

4.根据权利要求1所述的方法，其特征在于，所述将所述训练数据集输入所述待训练XGBoost模型进行训练，得到训练完毕的待测试XGBoost模型，包括：

第t次迭代中表示为如下公式(4)：

其中g_i为对/>的一阶导数，h_i为/>对/>的二阶导数；

5.根据权利要求1所述的方法，其特征在于，所述将所述测试数据集输入所述待测试XGBoost模型进行测试，得到完成测试的XGBoost模型，包括：

6.根据权利要求1所述的方法，其特征在于，所述方法还包括：

7.根据权利要求6所述的方法，其特征在于，所述利用SHAP模型定量评价XGBoost模型的预测值，分析输入的样本中每个特征的SHAP值，包括：

y_i＝y_base+f(x_i1)+f(x_i2)+...+f(x_ij)

8.一种基于XGBoost模型的膏体屈服应力预测装置，其特征在于，所述装置包括：

9.根据权利要求8所述的装置，其特征在于，所述初始XGBoost模型的超参数，包括学习率、建立每个模型所需要的最小样本数、树的最大深度、给定模型所需的损失函数、用于确定训练模型的子样本占样本集合的比例、建立树时对特征随机采样的比例以及L1和L2正则化项。

10.根据权利要求8所述的装置，其特征在于，所述构建模块，用于：