CN113705110A - 一种基于双重随机森林回归方法的爆破振动速度预测方法 - Google Patents
一种基于双重随机森林回归方法的爆破振动速度预测方法 Download PDFInfo
- Publication number
- CN113705110A CN113705110A CN202111034324.3A CN202111034324A CN113705110A CN 113705110 A CN113705110 A CN 113705110A CN 202111034324 A CN202111034324 A CN 202111034324A CN 113705110 A CN113705110 A CN 113705110A
- Authority
- CN
- China
- Prior art keywords
- random forest
- training
- model
- value
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007637 random forest analysis Methods 0.000 title claims abstract description 138
- 238000000034 method Methods 0.000 title claims abstract description 84
- 238000005422 blasting Methods 0.000 title claims abstract description 65
- 230000009977 dual effect Effects 0.000 title claims abstract description 27
- 238000012549 training Methods 0.000 claims abstract description 115
- 238000003066 decision tree Methods 0.000 claims abstract description 68
- 238000012360 testing method Methods 0.000 claims abstract description 19
- 230000011218 segmentation Effects 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 17
- 238000010606 normalization Methods 0.000 claims description 15
- 238000011156 evaluation Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 10
- 238000012952 Resampling Methods 0.000 claims description 7
- 238000004880 explosion Methods 0.000 claims description 7
- 239000011435 rock Substances 0.000 claims description 7
- 239000002360 explosive Substances 0.000 claims description 5
- 238000003672 processing method Methods 0.000 claims description 5
- 238000013138 pruning Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 4
- 238000013461 design Methods 0.000 claims description 2
- 238000002407 reforming Methods 0.000 claims description 2
- 238000005474 detonation Methods 0.000 abstract description 2
- 230000000694 effects Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005553 drilling Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- -1 noise Substances 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/02—Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
技术领域
本发明涉及一种基于双重随机森林回归方法的爆破振动速度预测方法,属于爆破技术领域。
背景技术
钻爆法是矿山开采和隧道修建经常采用的破岩方法之一,爆破作用在完成破岩的同时也带来了很多负面效应,如爆破震动、空气冲击波、飞石、噪音、粉尘等,其中爆破震动危害尤为显著。爆破规程采用速度来衡量震动强度,准确地预测爆破引起的质点振动速度能有效控制爆破震动的危害。国内常采用萨道夫斯基公式来预测爆破振动速度,但仅考虑装药量、爆源距两个参数,参数取值粗糙,预测爆破振动速度的精度不高。
发明内容
本发明针对现有技术中采用萨道夫斯基公式来预测爆破振动速度时仅考虑装药量、爆源距两个参数,从而导致参数取值粗糙,预测爆破振动速度精度不高的问题,提供一种基于双重随机森林回归方法的爆破振动速度预测方法,本发明将双重随机森林回归方法引入到爆破震动速度预测,可获得准确性更高、误差更小的预测爆破振动速度。
一种基于双重随机森林回归方法的爆破振动速度预测方法,该方法包括以下步骤:采集爆破设计参数、岩体信息参数、炸药信息参数;训练数据集;从测试样本集中随机抽取n个样本集;形成n棵CART决策树;随机选取特征;形成第一层随机森林;获取训练输出数据,训练后得到残差;训练残差形成新的训练集;新的训练集重抽样;重新形成n棵CART决策树;重新选取特征;形成第二层随机森林;双重随机森林输出求和得到最终的预测结果。
进一步为,本发明该方法包括的步骤具体为:
(1)将爆破试验测得的爆破振动速度值作为CART决策树模型的输出变量,相应爆破试验场次采集到测点距离D、炮孔个数N、孔距S、排距B、最大孔深H、总药量A、高程差I以及弹性模量E作为CART决策树模型的输入变量,输出变量和输入变量组成预测数据集X和训练数据集
(3)各个子集D中,采用决策树算法,根据“基尼系数最小准则”,选择最优方式进行节点分裂,分裂过程中不剪枝;其中决策树采用二叉树形式,利用二分递归法将数据空间不断划分为不同子集;决策树采用GINI系数作为属性分裂的标准,选择基尼系数最低的特征作为根节点,选择其余特征基尼系数最小的作为叶节点,根据训练数据集,从根节点开始,递归地对每个节点进行操作,构建二叉决策树;
(4)重复构建二叉决策树,生成随机森林:每棵决策树由上而下递归分枝生长,满足分割终止条件后回归树停止生长形成回归树Ti,所有回归树Ti组合构成随机森林模型;
(6)计算出第1层随机森林在训练样本集上的输出值采用训练样本的实际值yi减去输出值得到训练残差训练残差代入原训练样本中构建一个新的数据集作为第2层随机森林的训练样本,使输入为xi,期望输出为第1层随机森林的训练残差构成第2层随机森林的训练数据集,并对训练残差数值进行归一化处理得到第2层随机森林的训练数据集;
(7)第2层随机森林的训练数据集构建第2层随机森林模型,计算出第2层随机森林模型的预测结果;
(8)第1层随机森林模型与第2层随机森林模型的输出依次叠加,即与第二层随机森林的标签值与相应的第一层随机森林的标签值求和,得到双重随机森林预测模型的爆破振动速度。
进一步为,本发明步骤(2)子集D为:
D={xi1,xi2,…,xin,yi}(i∈[1,m]),其中k远小于m。
进一步为,本发明步骤(3)决策树算法为
单棵决策树预测器h(X,θk)的预测结果为hi(X),随机森林回归模型的预测结果为:
RFP={Ntree,Mtry} (1)
式(1)随机森林回归算法建模过程参数集RFP,Ntree为模型中回归树棵数,Mtry为随机特征数目,式(2)为基于随机森林回归的爆破速度预测方法;
式中,X表示输入向量,θk是表示生成每棵树生长路径的向量,Ntree为模型中决策树树棵数,Mtry为从特征中随机抽取的特征数目;Mtry值为:
Mtry&=[log2M] (3)
Mtrv&=[M/3] (4)
式中:M为模型输入参数的数量;[]表示向下取整运算。
进一步为,本发明二分递归法为:
分类时,设有K个类,样本点属于第K类的概率为Pk,概率分布的基尼指数为
式中:K为节点中特征样本的总种类数;Pk为属于节点中第k类特征样本的概率。
进一步为,本发明二叉决策树构建法为:
样本集合D根据特征A是否取值a,被分割成D1和D2两部分,D1={(x,y)∈D|A(x)=a},D2=D-D1,则特征A的条件下,集合D的基尼指数定义为:
节点的训练集为D1,计算出现有的特征对该数据集的基尼指数:对每一个特征A,根据样本点对A=a的测试为“是”或“否”将D分割成D1和D2两部分,计算A=a时的基尼指数,选择基尼指数最小的切分点作为切分点,依最优特征与最优切分点,从现切分点生成两个子节点,将训练数据集依特征分配到两个叶节点中去,对两个叶节点递归地调用5~10次。
进一步为,本发明训练残差数值的归一化处理法为:
式中:lin为原始输入数据,lmin为原始输入数据中同类数据的最小值;lmax为原始输入数据中同类数据的最大值;l为归一化处理之后的输入数据。
上述方法的性能评测方法,所述的评测方法使用均方根误差(RMSE)、和R方(R2)两个指标构成模型的评价体系,RMSE为预测值与实测值之间的偏差,R2为预测值与实测值之间的相关程度,公式如下:
式中:Oi为模型输出的振速预测值;Ti为振速实测值;T为实测值平均值;n为预测值与实测值对数。
本发明的有益效果是:本发明针对现有技术中采用萨道夫斯基公式来预测爆破振动速度时仅考虑装药量、爆源距两个参数,从而导致参数取值粗糙,预测爆破振动速度精度不高的问题,将双重随机森林回归方法引入到爆破震动速度预测,可获得准确性更高、误差更小的预测爆破振动速度,并将随机森林模型预测的结果与传统方法预测的结果相比较,以期为爆破震速监测提供最优的预测方法。
附图说明
图1为本发明爆破振动速度预测流程图。
具体实施方式
下面结合具体实施方式对本发明作进一步详细说明,但本发明的保护范围并不限于所述内容。
一种基于双重随机森林回归方法的爆破振动速度预测方法,具体步骤如下:
(1)将爆破试验测得的爆破振动速度值作为CART决策树模型的输出变量,相应爆破试验场次采集到测点距离D、炮孔个数N、孔距S、排距B、最大孔深H、总药量A和高程差E作为CART决策树模型的输入变量,输出变量和输入变量组成预测数据集X和训练数据集
(3)各个子集D中,采用决策树算法,根据“基尼系数最小准则”,选择最优方式进行节点分裂,分裂过程中不剪枝;其中决策树采用二叉树形式,利用二分递归法将数据空间不断划分为不同子集;决策树采用GINI系数作为属性分裂的标准,选择基尼系数最低的特征作为根节点,选择其余特征基尼系数最小的作为叶节点,根据训练数据集,从根节点开始,递归地对每个节点进行操作,构建二叉决策树;
(4)重复构建二叉决策树,生成随机森林:每棵决策树由上而下递归分枝生长,满足分割终止条件后回归树停止生长形成回归树Ti,所有回归树Ti组合构成随机森林模型;
(6)计算出第1层随机森林在训练样本集上的输出值采用训练样本的实际值yi减去输出值得到训练残差训练残差代入原训练样本中构建一个新的数据集作为第2层随机森林的训练样本,使输入为xi,期望输出为第1层随机森林的训练残差构成第2层随机森林的训练数据集,并对训练残差数值进行归一化处理得到第2层随机森林的训练数据集;
(7)第2层随机森林的训练数据集构建第2层随机森林模型,计算出第2层随机森林模型的预测结果;
(8)第1层随机森林模型与第2层随机森林模型的输出依次叠加,即与第二层随机森林的标签值与相应的第一层随机森林的标签值求和,得到双层随机森林预测模型的爆破振动速度。
所述步骤(2)子集D为D={xi1,xi2,…,xin,yi}(i∈[1,m]),其中k远小于m。
所述步骤(3)决策树算法为
单棵决策树预测器h(X,θk)的预测结果为hi(X),随机森林回归模型的预测结果为
RFP={Ntree,Mtry} (1)
式(1)随机森林回归算法建模过程参数集RFP,Ntree为模型中回归树棵数,Mtry为随机特征数目,式(2)为基于随机森林回归的爆破速度预测方法;
式中,X表示输入向量,θk是表示生成每棵树生长路径的向量,Ntree为模型中决策树树棵数,Ntree值影响随机森林模型的训练度与精确度,为了得到最佳的评价结果,利用MATLAB脚本语言编写代码并进行不同决策树树棵树(Ntree)与模型均方误差(MSE)之间关系仿真计算;Mtry为从特征中随机抽取的特征数目,Mtry值控制了随机森林模型属性的扰动程度,直接影响模型的准确度;Mtry值估算法为
Mtry&=[log2M] (3)
Mtrv&=[M/3] (4)
式中:M为模型输入参数的数量,模型中输入参数数量M根据实际输入的参数数量取值;[]表示向下取整运算。
进一步的,所述二分递归法为
分类时,设有K个类,样本点属于第K类的概率为Pk,概率分布的基尼指数为
式中:K为节点中特征样本的总种类数;Pk为属于节点中第k类特征样本的概率。
所述二叉决策树构建法为
样本集合D根据特征A是否取值a,被分割成D1和D2两部分,D1={(x,y)∈D|A(x)=a},D2=D-D1,则特征A的条件下,集合D的基尼指数定义为
节点的训练集为D1,计算出现有的特征对该数据集的基尼指数:对每一个特征A,对其可能的每个取值a,根据样本点对A=a的测试为“是”或“否”将D分割成D1和D2两部分,计算A=a时的基尼指数,在所有可能的特征A和所有可能的切分点a中,选择基尼指数最小的切分点作为切分点,依最优特征与最优切分点,从现切分点生成两个子节点,将训练数据集依特征分配到两个叶节点中去,对两个叶节点递归地调用5~10次。
所述训练残差数值的归一化处理法为
式中:lin为原始输入数据,lmin为原始输入数据中同类数据的最小值;lmax为原始输入数据中同类数据的最大值;l为归一化处理之后的输入数据。
评价基于随机森林回归算法的爆破振动速度预测模型的性能,选用均方根误差(RMSE)、和R方(R2)两个指标构成模型的评价体系,RMSE为预测值与实测值之间的偏差,R2为预测值与实测值之间的相关程度,公式如下:
式中:Oi为模型输出的振速预测值;Ti为振速实测值;T为实测值平均值;n为预测值与实测值对数。
实施例1:一种基于双重随机森林回归方法的爆破振动速度预测方法(见图1),具体步骤如下:
(1)将爆破试验测得的爆破振动速度值作为CART决策树模型的输出变量,相应爆破试验场次采集到的测点距离(D)、炮孔个数(N)、孔距(S)、排距(B)、最大孔深(H)、总药量(A)高程差(I)和弹性模量(E)作为CART决策树模型的输入变量,输出变量和输入变量组成预测数据集X和训练数据集
Bootstrap方法可随机有放回的选择训练数据,构造分类器,再通过组合学习后的模型来增加整体的采集效果;
(3)各个子集D中,采用决策树算法,根据“基尼系数最小准则”,选择最优方式进行节点分裂,分裂过程中不剪枝:设单棵决策树预测器h(X,θk)的预测结果为hi(X),则随机森林回归模型的最终预测结果表示为:
RFP={Ntree,Mtry} (1)
式(1)为随机森林回归算法建模过程参数集RFP,Ntree为模型中回归树棵数,Mtry为随机特征数目;式(2)为基于随机森林回归的爆破速度预测方法;
式中:X为输入向量,θk为生成每棵树生长路径的向量,Ntree为模型中决策树树棵数,Ntree值影响随机森林模型的训练度与精确度;为了得到最佳的评价结果,利用MATLAB脚本语言编写代码并进行不同决策树树棵树(Ntree)与模型均方误差(MSE)之间关系仿真计算;Mtry为从特征中随机抽取的特征数目,Mtry值控制了随机森林模型属性的扰动程度,是模型中重要的参数;Mtry值会直接影响模型的准确度,Mtry值计算法为
Mtry&=[log2M] (3)
Mtrv&=[M/3] (4)
式中:M为模型输入参数的数量,模型中输入参数数量M根据实际输入的参数数量取值;[]表示向下取整运算;
其中决策树采用二叉树形式,利用二分递归法将数据空间不断划分为不同子集;决策树采用GINI系数作为属性分裂的标准,选择基尼系数最低的特征作为根节点,选择其余特征基尼系数最小的作为叶节点,根据训练数据集,从根节点开始,递归地对每个节点进行操作,构建二叉决策树;
二分递归法为
分类时,设有K个类,样本点属于第K类的概率为Pk,概率分布的基尼指数为
式中,K为节点中特征样本的总种类数;Pk为属于节点中第k类特征样本的概率。
二叉决策树构建法为
样本集合D根据特征A是否取值a,被分割成D1和D2两部分,D1={(x,y)∈D|A(x)=a},D2=D-D1,则特征A的条件下,集合D的基尼指数定义为
节点的训练集为D1,计算出现有的特征对该数据集的基尼指数:对每一个特征A,对其可能的每个取值a,根据样本点对A=a的测试为“是”或“否”将D分割成D1和D2两部分,计算A=a时的基尼指数,在所有可能的特征A和所有可能的切分点a中,选择基尼指数最小的切分点作为切分点,依最优特征与最优切分点,从现切分点生成两个子节点,将训练数据集依特征分配到两个叶节点中去,对两个叶节点递归地调用5~10次;
(4)重复构建二叉决策树,生成随机森林:每棵决策树由上而下递归分枝生长,满足分割终止条件后回归树停止生长形成回归树Ti,所有回归树Ti组合构成随机森林模型;
(6)计算出第1层随机森林在训练样本集上的输出值采用训练样本的实际值yi减去输出值得到训练残差训练残差代入原训练样本中构建一个新的数据集作为第2层随机森林的训练样本,使输入为xi,期望输出为第1层随机森林的训练残差构成第2层随机森林的训练数据集,并对训练残差数值进行归一化处理得到第2层随机森林的训练数据集;其中训练残差数值的归一化处理法为
式中:lin为原始输入数据,lmin为原始输入数据中同类数据的最小值;lmax为原始输入数据中同类数据的最大值;l为归一化处理之后的输入数据;
(7)第2层随机森林的训练数据集构建第2层随机森林模型,计算出第2层随机森林模型的预测结果;
(8)第1层随机森林模型与第2层随机森林模型的输出依次叠加,即第二层随机森林的标签值与相应的第一层随机森林的标签值求和,得到双层随机森林预测模型的爆破振动速度;
评价基于随机森林回归算法的爆破振动速度预测模型的性能,选用均方根误差(RMSE)、和R方(R2)两个指标构成模型的评价体系,RMSE为预测值与实测值之间的偏差,R2为预测值与实测值之间的相关程度,公式如下:
式中:Oi为模型输出的振速预测值;Ti为振速实测值;T为实测值平均值;n为预测值与实测值对数。
实施例2:以某露天矿山爆破参数及相应的振动参数为例研究双重随机森林的可靠性;
一种基于双重随机森林回归方法的爆破振动速度预测方法(见图1),具体步骤如下:
(1)利用已有的历史岩石振动相关参数作为样本属性(见表1)构建CART决策树模型,
表1预测样本的实测值
将爆破试验测得的爆破振动速度值作为CART决策树模型的输出变量,相应爆破试验场次采集到的测点距离(D)、炮孔个数(N)、孔距(S)、排距(B)、最大孔深(H)、总药量(A)高程差(E)与岩石的弹性模量(I)作为CART决策树模型的输入变量,输出变量和输入变量组成预测数据集X和训练数据集
(2)训练数据集采用Bootstrap方法进行训练样本集重抽样,随机产生n个训练数据集的子集D,D={xi1,xi2,…,xin,yi}(i∈[1,m]),(其中k<<m);Bootstrap方法可随机有放回的选择训练数据,构造分类器,再通过组合学习后的模型来增加整体的采集效果;
(3)各个子集D中,采用决策树算法,根据“基尼系数最小准则”,选择最优方式进行节点分裂,分裂过程中不剪枝:设单棵决策树预测器h(X,θk)的预测结果为hi(X),则随机森林回归模型的最终预测结果表示为:
RFP={Ntree,Mtry} (1)
式(1)为随机森林回归算法建模过程参数集RFP,Ntree为模型中回归树棵数,Mtry为随机特征数目;式(2)为基于随机森林回归的爆破速度预测方法;
式中:X为输入向量,θk为生成每棵树生长路径的向量,Ntree为模型中决策树树棵数,Ntree值影响随机森林模型的训练度与精确度;为了得到最佳的评价结果,利用MATLAB脚本语言编写代码并进行不同决策树树棵树(Ntree)与模型均方误差(MSE)之间关系仿真计算;Mtry为从特征中随机抽取的特征数目,Mtry值控制了随机森林模型属性的扰动程度,是模型中重要的参数;Mtry值会直接影响模型的准确度,Mtry值计算法为
Mtry&=[log2M] (3)
Mtrv&=[M/3] (4)
式中:M为模型输入参数的数量,模型中输入参数数量M根据实际输入的参数数量取值;[]表示向下取整运算;
其中决策树采用二叉树形式,利用二分递归法将数据空间不断划分为不同子集;决策树采用GINI系数作为属性分裂的标准,选择基尼系数最低的特征作为根节点,选择其余特征基尼系数最小的作为叶节点,根据训练数据集,从根节点开始,递归地对每个节点进行操作,构建二叉决策树;
二分递归法为
分类时,设有K个类,样本点属于第K类的概率为Pk,概率分布的基尼指数为
式中,K为节点中特征样本的总种类数;Pk为属于节点中第k类特征样本的概率;
二叉决策树构建法为
样本集合D根据特征A是否取值a,被分割成D1和D2两部分,D1={(x,y)∈D|A(x)=a},D2=D-D1,则特征A的条件下,集合D的基尼指数定义为
节点的训练集为D1,计算出现有的特征对该数据集的基尼指数:对每一个特征A,对其可能的每个取值a,根据样本点对A=a的测试为“是”或“否”将D分割成D1和D2两部分,计算A=a时的基尼指数,在所有可能的特征A和所有可能的切分点a中,选择基尼指数最小的切分点作为切分点,依最优特征与最优切分点,从现切分点生成两个子节点,将训练数据集依特征分配到两个叶节点中去,对两个叶节点递归地调用5~10次;
(4)重复构建二叉决策树,生成随机森林:每棵决策树由上而下递归分枝生长,满足分割终止条件后回归树停止生长形成回归树Ti,所有回归树Ti组合构成随机森林模型;
(6)计算出第1层随机森林在训练样本集上的输出值采用训练样本的实际值yi减去输出值得到训练残差训练残差代入原训练样本中构建一个新的数据集作为第2层随机森林的训练样本,使输入为xi,期望输出为第1层随机森林的训练残差构成第2层随机森林的训练数据集,并对训练残差数值进行归一化处理得到第2层随机森林的训练数据集;其中训练残差数值的归一化处理法为
式中:lin为原始输入数据,lmin为原始输入数据中同类数据的最小值;lmax为原始输入数据中同类数据的最大值;l为归一化处理之后的输入数据;
(7)第2层随机森林的训练数据集构建第2层随机森林模型,计算出第2层随机森林模型的预测结果;
(8)第1层随机森林模型与第2层随机森林模型的输出依次叠加,即第二层随机森林的标签值与相应第一层随机森林的标签值求和,得到双层随机森林预测模型的爆破振动速度;
传统萨道夫斯基公式的爆破振动速度预测结果和双层随机森林预测模型的爆破振动速度预测结果见表2;
表2训练样本的爆破振动速度预测结果和误差
评价基于随机森林回归算法的爆破振动速度预测模型的性能,选用均方根误差(RMSE)、和R方(R2)两个指标构成模型的评价体系,RMSE为预测值与实测值之间的偏差,R2为预测值与实测值之间的相关程度,公式如下:
式中:Oi为模型输出的振速预测值;Ti为振速实测值;T为实测值平均值;n为预测值与实测值对数;
传统萨道夫斯基公式预测模型和双层随机森林预测模型的评价指标值见表3;
表3预测模型的评价指标值
评价指标 | 双重随机森林预测模型 | 传统方法预测模型 |
RMSE | 0.079371 | 0.129303 |
R<sup>2</sup> | 0.957003 | 0.910249 |
从表2可知,双重随机森林预测模型震动速度相对误差比传统预测模型小,体现了其预测性能的优越性;从表3可知虽然双重随机森林预测模型大于与传统预测模型R方,说明双重随机森林更加稳定;在RMSE上双重随机森林模型预测远小于传统预测模型,说明双重随机森林的预测效果更加准确。所以,相比于传统预测模型,双重随机森林预测模型可靠度更高,预测结果更稳定,表明双重随机森岭预测模型更能有效准确的对爆破震动速度进行预测。
以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。
Claims (8)
1.一种基于双重随机森林回归方法的爆破振动速度预测方法,其特征在于,该方法包括以下步骤:采集爆破设计参数、岩体信息参数、炸药信息参数;训练数据集;从测试样本集中随机抽取n个样本集;形成n棵CART决策树;随机选取特征;形成第一层随机森林;获取训练输出数据,训练后得到残差;训练残差形成新的训练集;新的训练集重抽样;重新形成n棵CART决策树;重新选取特征;形成第二层随机森林;双重随机森林输出求和得到最终的预测结果。
2.根据权利要求1所述的基于双重随机森林回归方法的爆破振动速度预测方法,其特征在于,该方法包括的步骤具体为:
(1)将爆破试验测得的爆破振动速度值作为CART决策树模型的输出变量,相应爆破试验场次采集到测点距离D、炮孔个数N、孔距S、排距B、最大孔深H、总药量A、高程差I以及弹性模量E作为CART决策树模型的输入变量,输出变量和输入变量组成预测数据集X和训练数据集
(3)各个子集D中,采用决策树算法,根据“基尼系数最小准则”,选择最优方式进行节点分裂,分裂过程中不剪枝;其中决策树采用二叉树形式,利用二分递归法将数据空间不断划分为不同子集;决策树采用GINI系数作为属性分裂的标准,选择基尼系数最低的特征作为根节点,选择其余特征基尼系数最小的作为叶节点,根据训练数据集,从根节点开始,递归地对每个节点进行操作,构建二叉决策树;
(4)重复构建二叉决策树,生成随机森林:每棵决策树由上而下递归分枝生长,满足分割终止条件后回归树停止生长形成回归树Ti,所有回归树Ti组合构成随机森林模型;
(6)计算出第1层随机森林在训练样本集上的输出值采用训练样本的实际值yi减去输出值得到训练残差训练残差代入原训练样本中构建一个新的数据集作为第2层随机森林的训练样本,使输入为xi,期望输出为第1层随机森林的训练残差构成第2层随机森林的训练数据集,并对训练残差数值进行归一化处理得到第2层随机森林的训练数据集;
(7)第2层随机森林的训练数据集构建第2层随机森林模型,计算出第2层随机森林模型的预测结果;
(8)第1层随机森林模型与第2层随机森林模型的输出依次叠加,即与第二层随机森林的标签值与相应的第一层随机森林的标签值求和,得到双重随机森林预测模型的爆破振动速度。
3.根据权利要求1所述基于双重随机森林回归方法的爆破振动速度预测方法,其特征在于,步骤(2)子集D为:
D={xi1,xi2,…,xin,yi}(i∈[1,m]),其中k远小于m。
4.根据权利要求1所述基于双重随机森林回归方法的爆破振动速度预测方法,其特征在于,步骤(3)决策树算法为:
单棵决策树预测器h(X,θk)的预测结果为hi(X),随机森林回归模型的预测结果为:
RFP={Ntree,Mtry} (1)
式(1)随机森林回归算法建模过程参数集RFP,Ntree为模型中回归树棵数,Mtry为随机特征数目,式(2)为基于随机森林回归的爆破速度预测方法;
式中,X表示输入向量,θk是表示生成每棵树生长路径的向量,Ntree为模型中决策树树棵数,Mtry为从特征中随机抽取的特征数目;Mtry值为:
Mtry&=[log2M] (3)
Mtrv&=[M/3] (4)
式中:M为模型输入参数的数量;[]表示向下取整运算。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111034324.3A CN113705110A (zh) | 2021-09-03 | 2021-09-03 | 一种基于双重随机森林回归方法的爆破振动速度预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111034324.3A CN113705110A (zh) | 2021-09-03 | 2021-09-03 | 一种基于双重随机森林回归方法的爆破振动速度预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113705110A true CN113705110A (zh) | 2021-11-26 |
Family
ID=78659649
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111034324.3A Pending CN113705110A (zh) | 2021-09-03 | 2021-09-03 | 一种基于双重随机森林回归方法的爆破振动速度预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113705110A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116230158A (zh) * | 2023-03-27 | 2023-06-06 | 中国医学科学院肿瘤医院 | 一种疼痛评估及用药预测系统及其使用方法 |
CN116884631A (zh) * | 2023-09-06 | 2023-10-13 | 杭州生奥信息技术有限公司 | 基于ai和相似患者分析的综合肝衰竭预测与治疗参考系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109146195A (zh) * | 2018-09-06 | 2019-01-04 | 北方爆破科技有限公司 | 一种基于cart树回归算法的爆破块度预测方法 |
KR20190022026A (ko) * | 2017-08-25 | 2019-03-06 | (주)뉴옵틱스 | 혈구 감별 장치 및 방법 |
-
2021
- 2021-09-03 CN CN202111034324.3A patent/CN113705110A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190022026A (ko) * | 2017-08-25 | 2019-03-06 | (주)뉴옵틱스 | 혈구 감별 장치 및 방법 |
CN109146195A (zh) * | 2018-09-06 | 2019-01-04 | 北方爆破科技有限公司 | 一种基于cart树回归算法的爆破块度预测方法 |
Non-Patent Citations (3)
Title |
---|
张吉勇等: ""基于随机森林算法的爆破振速预测研究"", 《化工矿物与加工》, vol. 47, no. 4, 31 December 2018 (2018-12-31), pages 34 - 37 * |
王仁超等: ""基于随机森林回归方法的爆破块度预测模型研究"", 《水力发电学报》, vol. 39, no. 1, 31 January 2020 (2020-01-31), pages 89 - 101 * |
邢书豪等: ""基于双层随机森林算法的短期负荷预测模型"", 《广东电力》, no. 9, 30 September 2019 (2019-09-30), pages 160 - 166 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116230158A (zh) * | 2023-03-27 | 2023-06-06 | 中国医学科学院肿瘤医院 | 一种疼痛评估及用药预测系统及其使用方法 |
CN116230158B (zh) * | 2023-03-27 | 2024-01-26 | 中国医学科学院肿瘤医院 | 一种疼痛评估及用药预测系统及其使用方法 |
CN116884631A (zh) * | 2023-09-06 | 2023-10-13 | 杭州生奥信息技术有限公司 | 基于ai和相似患者分析的综合肝衰竭预测与治疗参考系统 |
CN116884631B (zh) * | 2023-09-06 | 2023-12-12 | 杭州生奥信息技术有限公司 | 基于ai和相似患者分析的综合肝衰竭预测与治疗参考系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020125668A1 (zh) | 一种应用随钻参数来自动识别围岩级别的方法和系统 | |
CN112989708B (zh) | 一种基于lstm神经网络的测井岩性识别方法及系统 | |
CN112382352B (zh) | 基于机器学习的金属有机骨架材料结构特征快速评估方法 | |
CN110674841B (zh) | 一种基于聚类算法的测井曲线识别方法 | |
CN111783825A (zh) | 一种基于卷积神经网络学习的测井岩性识别方法 | |
Arbin et al. | Comparative analysis between k-means and k-medoids for statistical clustering | |
CN113705110A (zh) | 一种基于双重随机森林回归方法的爆破振动速度预测方法 | |
CN114241779B (zh) | 一种城市快速路交通流短时预测方法、计算机及存储介质 | |
CN110826618A (zh) | 一种基于随机森林的个人信用风险评估方法 | |
CN108710576B (zh) | 基于异构迁移的数据集扩充方法及软件缺陷预测方法 | |
CN109447249B (zh) | 一种基于深度卷积的对抗神经网络测井数据重建方法 | |
CN113344019A (zh) | 一种决策值选取初始聚类中心改进的K-means算法 | |
CN110568483A (zh) | 基于卷积神经网络的地震线性噪声压制效果自动评估方法 | |
CN110990784A (zh) | 一种基于梯度提升回归树的烟支通风率预测方法 | |
CN115481577B (zh) | 一种基于随机森林和遗传算法的油藏自动历史拟合方法 | |
CN108280289B (zh) | 基于局部加权c4.5算法的冲击地压危险等级预测方法 | |
CN112614021A (zh) | 一种基于已建隧道信息智能识别的隧道围岩地质信息预测方法 | |
CN102867104B (zh) | 一种电子设备的电磁环境影响因素的定量分析装置及方法 | |
CN114091333A (zh) | 一种基于机器学习的页岩含气量人工智能预测方法 | |
CN117272841B (zh) | 一种基于混合神经网络的页岩气甜点预测方法 | |
CN107194468A (zh) | 面向情报大数据的决策树增量学习方法 | |
CN110362911A (zh) | 一种面向设计过程的代理模型选择方法 | |
CN113762394B (zh) | 一种爆破块度预测方法 | |
CN117033912A (zh) | 一种设备故障预测方法、装置、可读存储介质及电子设备 | |
CN115270959B (zh) | 基于递归特征消除融合随机森林的页岩岩性识别法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |