CN113705110A

CN113705110A - 一种基于双重随机森林回归方法的爆破振动速度预测方法

Info

Publication number: CN113705110A
Application number: CN202111034324.3A
Authority: CN
Inventors: 武永博; 李光全; 李祥龙; 黄昭乐; 李永祥; 普庆红; 王建国; 左庭; 范天林; 陶子豪
Original assignee: Yunnan Copper Co ltd; Yuxi Mining Co ltd; Kunming University of Science and Technology
Current assignee: Yunnan Copper Co ltd; Yuxi Mining Co ltd; Kunming University of Science and Technology
Priority date: 2021-09-03
Filing date: 2021-09-03
Publication date: 2021-11-26

Abstract

本发明涉及一种基于双重随机森林回归方法的爆破振动速度预测方法，属于爆破技术领域。本发明将爆破试验测得的爆破振动速度值作为CART决策树模型的输出变量，相应爆破试验场次采集到测点距离D、炮孔个数N、孔距S、排距B、最大孔深H、总药量A、高程差I与作为CART决策树模型的输入变量，输出变量和输入变量组成预测数据集X和训练数据集

采用双重随机森林回归法进行爆破振动速度的预测，以解决现有技术中采用萨道夫斯基公式来预测爆破振动速度时仅考虑装药量、爆源距两个参数，从而导致参数取值粗糙，预测爆破振动速度精度不高的问题。

Description

一种基于双重随机森林回归方法的爆破振动速度预测方法

技术领域

本发明涉及一种基于双重随机森林回归方法的爆破振动速度预测方法，属于爆破技术领域。

背景技术

钻爆法是矿山开采和隧道修建经常采用的破岩方法之一，爆破作用在完成破岩的同时也带来了很多负面效应，如爆破震动、空气冲击波、飞石、噪音、粉尘等，其中爆破震动危害尤为显著。爆破规程采用速度来衡量震动强度，准确地预测爆破引起的质点振动速度能有效控制爆破震动的危害。国内常采用萨道夫斯基公式来预测爆破振动速度，但仅考虑装药量、爆源距两个参数，参数取值粗糙，预测爆破振动速度的精度不高。

发明内容

本发明针对现有技术中采用萨道夫斯基公式来预测爆破振动速度时仅考虑装药量、爆源距两个参数，从而导致参数取值粗糙，预测爆破振动速度精度不高的问题，提供一种基于双重随机森林回归方法的爆破振动速度预测方法，本发明将双重随机森林回归方法引入到爆破震动速度预测，可获得准确性更高、误差更小的预测爆破振动速度。

一种基于双重随机森林回归方法的爆破振动速度预测方法，该方法包括以下步骤：采集爆破设计参数、岩体信息参数、炸药信息参数；训练数据集；从测试样本集中随机抽取n个样本集；形成n棵CART决策树；随机选取特征；形成第一层随机森林；获取训练输出数据，训练后得到残差；训练残差形成新的训练集；新的训练集重抽样；重新形成n棵CART决策树；重新选取特征；形成第二层随机森林；双重随机森林输出求和得到最终的预测结果。

进一步为，本发明该方法包括的步骤具体为：

(1)将爆破试验测得的爆破振动速度值作为CART决策树模型的输出变量，相应爆破试验场次采集到测点距离D、炮孔个数N、孔距S、排距B、最大孔深H、总药量A、高程差I以及弹性模量E作为CART决策树模型的输入变量，输出变量和输入变量组成预测数据集X和训练数据集

(2)训练数据集

采用Bootstrap方法进行训练样本集重抽样，随机产生n个训练数据集

的子集D；

(3)各个子集D中，采用决策树算法，根据“基尼系数最小准则”，选择最优方式进行节点分裂，分裂过程中不剪枝；其中决策树采用二叉树形式，利用二分递归法将数据空间不断划分为不同子集；决策树采用GINI系数作为属性分裂的标准，选择基尼系数最低的特征作为根节点，选择其余特征基尼系数最小的作为叶节点，根据训练数据集，从根节点开始，递归地对每个节点进行操作，构建二叉决策树；

(4)重复构建二叉决策树，生成随机森林：每棵决策树由上而下递归分枝生长，满足分割终止条件后回归树停止生长形成回归树T_i，所有回归树T_i组合构成随机森林模型；

(5)将预测数据集X的参数向量x输入到随机森林模型中，对单棵回归树T_i的预测值y_i求算术平均值

(6)计算出第1层随机森林在训练样本集上的输出值

采用训练样本的实际值y_i减去输出值

得到训练残差

训练残差

代入原训练样本中构建一个新的数据集作为第2层随机森林的训练样本，使输入为x_i，期望输出为

第1层随机森林的训练残差构成第2层随机森林的训练数据集，并对训练残差数值进行归一化处理得到第2层随机森林的训练数据集；

(7)第2层随机森林的训练数据集构建第2层随机森林模型，计算出第2层随机森林模型的预测结果；

(8)第1层随机森林模型与第2层随机森林模型的输出依次叠加，即与第二层随机森林的标签值与相应的第一层随机森林的标签值求和，得到双重随机森林预测模型的爆破振动速度。

进一步为，本发明步骤(2)子集D为：

D＝{x_i1,x_i2,…,x_in,y_i}(i∈[1,m])，其中k远小于m。

进一步为，本发明步骤(3)决策树算法为

单棵决策树预测器h(X，θ_k)的预测结果为h_i(X)，随机森林回归模型的预测结果为：

RFP＝{Ntree,Mtry} (1)

式(1)随机森林回归算法建模过程参数集RFP，Ntree为模型中回归树棵数，Mtry为随机特征数目，式(2)为基于随机森林回归的爆破速度预测方法；

式中，X表示输入向量，θ_k是表示生成每棵树生长路径的向量，Ntree为模型中决策树树棵数，Mtry为从特征中随机抽取的特征数目；Mtry值为：

Mtry&＝[log₂M] (3)

Mtrv&＝[M/3] (4)

式中：M为模型输入参数的数量；[]表示向下取整运算。

进一步为，本发明二分递归法为：

分类时，设有K个类，样本点属于第K类的概率为P_k，概率分布的基尼指数为

式中：K为节点中特征样本的总种类数；P_k为属于节点中第k类特征样本的概率。

进一步为，本发明二叉决策树构建法为：

样本集合D根据特征A是否取值a，被分割成D₁和D₂两部分，D₁＝{(x,y)∈D|A(x)＝a},D₂＝D-D₁，则特征A的条件下，集合D的基尼指数定义为：

节点的训练集为D₁，计算出现有的特征对该数据集的基尼指数：对每一个特征A，根据样本点对A＝a的测试为“是”或“否”将D分割成D₁和D₂两部分，计算A＝a时的基尼指数，选择基尼指数最小的切分点作为切分点，依最优特征与最优切分点，从现切分点生成两个子节点，将训练数据集依特征分配到两个叶节点中去，对两个叶节点递归地调用5～10次。

进一步为，本发明训练残差数值的归一化处理法为：

式中：l_in为原始输入数据，l_min为原始输入数据中同类数据的最小值；l_max为原始输入数据中同类数据的最大值；l为归一化处理之后的输入数据。

上述方法的性能评测方法，所述的评测方法使用均方根误差(RMSE)、和R方(R²)两个指标构成模型的评价体系，RMSE为预测值与实测值之间的偏差，R²为预测值与实测值之间的相关程度，公式如下：

式中：O_i为模型输出的振速预测值；T_i为振速实测值；T为实测值平均值；n为预测值与实测值对数。

本发明的有益效果是：本发明针对现有技术中采用萨道夫斯基公式来预测爆破振动速度时仅考虑装药量、爆源距两个参数，从而导致参数取值粗糙，预测爆破振动速度精度不高的问题，将双重随机森林回归方法引入到爆破震动速度预测，可获得准确性更高、误差更小的预测爆破振动速度，并将随机森林模型预测的结果与传统方法预测的结果相比较，以期为爆破震速监测提供最优的预测方法。

附图说明

图1为本发明爆破振动速度预测流程图。

具体实施方式

下面结合具体实施方式对本发明作进一步详细说明，但本发明的保护范围并不限于所述内容。

一种基于双重随机森林回归方法的爆破振动速度预测方法，具体步骤如下：

(1)将爆破试验测得的爆破振动速度值作为CART决策树模型的输出变量，相应爆破试验场次采集到测点距离D、炮孔个数N、孔距S、排距B、最大孔深H、总药量A和高程差E作为CART决策树模型的输入变量，输出变量和输入变量组成预测数据集X和训练数据集

(2)训练数据集

的子集D；

(6)计算出第1层随机森林在训练样本集上的输出值

采用训练样本的实际值y_i减去输出值

得到训练残差

训练残差

(8)第1层随机森林模型与第2层随机森林模型的输出依次叠加，即与第二层随机森林的标签值与相应的第一层随机森林的标签值求和，得到双层随机森林预测模型的爆破振动速度。

所述步骤(2)子集D为D＝{x_i1,x_i2,…,x_in,y_i}(i∈[1,m])，其中k远小于m。

所述步骤(3)决策树算法为

单棵决策树预测器h(X，θ_k)的预测结果为h_i(X)，随机森林回归模型的预测结果为

RFP＝{Ntree,Mtry} (1)

式中，X表示输入向量，θ_k是表示生成每棵树生长路径的向量，Ntree为模型中决策树树棵数，Ntree值影响随机森林模型的训练度与精确度，为了得到最佳的评价结果，利用MATLAB脚本语言编写代码并进行不同决策树树棵树(Ntree)与模型均方误差(MSE)之间关系仿真计算；Mtry为从特征中随机抽取的特征数目，Mtry值控制了随机森林模型属性的扰动程度，直接影响模型的准确度；Mtry值估算法为

Mtry&＝[log₂M] (3)

Mtrv&＝[M/3] (4)

式中：M为模型输入参数的数量，模型中输入参数数量M根据实际输入的参数数量取值；[]表示向下取整运算。

进一步的，所述二分递归法为

所述二叉决策树构建法为

样本集合D根据特征A是否取值a，被分割成D₁和D₂两部分，D₁＝{(x,y)∈D|A(x)＝a},D₂＝D-D₁，则特征A的条件下，集合D的基尼指数定义为

节点的训练集为D₁，计算出现有的特征对该数据集的基尼指数：对每一个特征A，对其可能的每个取值a，根据样本点对A＝a的测试为“是”或“否”将D分割成D₁和D₂两部分，计算A＝a时的基尼指数，在所有可能的特征A和所有可能的切分点a中，选择基尼指数最小的切分点作为切分点，依最优特征与最优切分点，从现切分点生成两个子节点，将训练数据集依特征分配到两个叶节点中去，对两个叶节点递归地调用5～10次。

所述训练残差数值的归一化处理法为

评价基于随机森林回归算法的爆破振动速度预测模型的性能，选用均方根误差(RMSE)、和R方(R²)两个指标构成模型的评价体系，RMSE为预测值与实测值之间的偏差，R²为预测值与实测值之间的相关程度，公式如下：

实施例1：一种基于双重随机森林回归方法的爆破振动速度预测方法(见图1)，具体步骤如下：

(1)将爆破试验测得的爆破振动速度值作为CART决策树模型的输出变量，相应爆破试验场次采集到的测点距离(D)、炮孔个数(N)、孔距(S)、排距(B)、最大孔深(H)、总药量(A)高程差(I)和弹性模量(E)作为CART决策树模型的输入变量，输出变量和输入变量组成预测数据集X和训练数据集

(2)训练数据集

的子集D，D＝{x_i1,x_i2,…,x_in,y_i}(i∈[1,m])，(其中k<<m)；

Bootstrap方法可随机有放回的选择训练数据，构造分类器，再通过组合学习后的模型来增加整体的采集效果；

(3)各个子集D中，采用决策树算法，根据“基尼系数最小准则”，选择最优方式进行节点分裂，分裂过程中不剪枝：设单棵决策树预测器h(X，θ_k)的预测结果为h_i(X)，则随机森林回归模型的最终预测结果表示为：

RFP＝{Ntree,Mtry} (1)

式(1)为随机森林回归算法建模过程参数集RFP，Ntree为模型中回归树棵数，Mtry为随机特征数目；式(2)为基于随机森林回归的爆破速度预测方法；

式中：X为输入向量，θ_k为生成每棵树生长路径的向量，Ntree为模型中决策树树棵数，Ntree值影响随机森林模型的训练度与精确度；为了得到最佳的评价结果，利用MATLAB脚本语言编写代码并进行不同决策树树棵树(Ntree)与模型均方误差(MSE)之间关系仿真计算；Mtry为从特征中随机抽取的特征数目，Mtry值控制了随机森林模型属性的扰动程度，是模型中重要的参数；Mtry值会直接影响模型的准确度，Mtry值计算法为

Mtry&＝[log₂M] (3)

Mtrv&＝[M/3] (4)

式中：M为模型输入参数的数量，模型中输入参数数量M根据实际输入的参数数量取值；[]表示向下取整运算；

其中决策树采用二叉树形式，利用二分递归法将数据空间不断划分为不同子集；决策树采用GINI系数作为属性分裂的标准，选择基尼系数最低的特征作为根节点，选择其余特征基尼系数最小的作为叶节点，根据训练数据集，从根节点开始，递归地对每个节点进行操作，构建二叉决策树；

二分递归法为

式中，K为节点中特征样本的总种类数；P_k为属于节点中第k类特征样本的概率。

二叉决策树构建法为

节点的训练集为D₁，计算出现有的特征对该数据集的基尼指数：对每一个特征A，对其可能的每个取值a，根据样本点对A＝a的测试为“是”或“否”将D分割成D₁和D₂两部分，计算A＝a时的基尼指数，在所有可能的特征A和所有可能的切分点a中，选择基尼指数最小的切分点作为切分点，依最优特征与最优切分点，从现切分点生成两个子节点，将训练数据集依特征分配到两个叶节点中去，对两个叶节点递归地调用5～10次；

(6)计算出第1层随机森林在训练样本集上的输出值

采用训练样本的实际值y_i减去输出值

得到训练残差

训练残差

第1层随机森林的训练残差构成第2层随机森林的训练数据集，并对训练残差数值进行归一化处理得到第2层随机森林的训练数据集；其中训练残差数值的归一化处理法为

式中：l_in为原始输入数据，l_min为原始输入数据中同类数据的最小值；l_max为原始输入数据中同类数据的最大值；l为归一化处理之后的输入数据；

(8)第1层随机森林模型与第2层随机森林模型的输出依次叠加，即第二层随机森林的标签值与相应的第一层随机森林的标签值求和，得到双层随机森林预测模型的爆破振动速度；

实施例2：以某露天矿山爆破参数及相应的振动参数为例研究双重随机森林的可靠性；

一种基于双重随机森林回归方法的爆破振动速度预测方法(见图1)，具体步骤如下：

(1)利用已有的历史岩石振动相关参数作为样本属性(见表1)构建CART决策树模型，

表1预测样本的实测值

将爆破试验测得的爆破振动速度值作为CART决策树模型的输出变量，相应爆破试验场次采集到的测点距离(D)、炮孔个数(N)、孔距(S)、排距(B)、最大孔深(H)、总药量(A)高程差(E)与岩石的弹性模量(I)作为CART决策树模型的输入变量，输出变量和输入变量组成预测数据集X和训练数据集

(2)训练数据集

的子集D，D＝{x_i1,x_i2,…,x_in,y_i}(i∈[1,m])，(其中k<<m)；Bootstrap方法可随机有放回的选择训练数据，构造分类器，再通过组合学习后的模型来增加整体的采集效果；

RFP＝{Ntree,Mtry} (1)

Mtry&＝[log₂M] (3)

Mtrv&＝[M/3] (4)

二分递归法为

式中，K为节点中特征样本的总种类数；P_k为属于节点中第k类特征样本的概率；

二叉决策树构建法为

(6)计算出第1层随机森林在训练样本集上的输出值

采用训练样本的实际值y_i减去输出值

得到训练残差

训练残差

(8)第1层随机森林模型与第2层随机森林模型的输出依次叠加，即第二层随机森林的标签值与相应第一层随机森林的标签值求和，得到双层随机森林预测模型的爆破振动速度；

传统萨道夫斯基公式的爆破振动速度预测结果和双层随机森林预测模型的爆破振动速度预测结果见表2；

表2训练样本的爆破振动速度预测结果和误差

式中：O_i为模型输出的振速预测值；T_i为振速实测值；T为实测值平均值；n为预测值与实测值对数；

传统萨道夫斯基公式预测模型和双层随机森林预测模型的评价指标值见表3；

表3预测模型的评价指标值

评价指标	双重随机森林预测模型	传统方法预测模型
			RMSE	0.079371	0.129303
R<sup>2</sup>	0.957003	0.910249

从表2可知，双重随机森林预测模型震动速度相对误差比传统预测模型小，体现了其预测性能的优越性；从表3可知虽然双重随机森林预测模型大于与传统预测模型R方，说明双重随机森林更加稳定；在RMSE上双重随机森林模型预测远小于传统预测模型，说明双重随机森林的预测效果更加准确。所以，相比于传统预测模型，双重随机森林预测模型可靠度更高，预测结果更稳定，表明双重随机森岭预测模型更能有效准确的对爆破震动速度进行预测。

以上结合附图对本发明的具体实施方式作了详细说明，但是本发明并不限于上述实施方式，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims

1.一种基于双重随机森林回归方法的爆破振动速度预测方法，其特征在于，该方法包括以下步骤：采集爆破设计参数、岩体信息参数、炸药信息参数；训练数据集；从测试样本集中随机抽取n个样本集；形成n棵CART决策树；随机选取特征；形成第一层随机森林；获取训练输出数据，训练后得到残差；训练残差形成新的训练集；新的训练集重抽样；重新形成n棵CART决策树；重新选取特征；形成第二层随机森林；双重随机森林输出求和得到最终的预测结果。

2.根据权利要求1所述的基于双重随机森林回归方法的爆破振动速度预测方法，其特征在于，该方法包括的步骤具体为：