CN113705110A - 一种基于双重随机森林回归方法的爆破振动速度预测方法 - Google Patents

一种基于双重随机森林回归方法的爆破振动速度预测方法 Download PDF

Info

Publication number
CN113705110A
CN113705110A CN202111034324.3A CN202111034324A CN113705110A CN 113705110 A CN113705110 A CN 113705110A CN 202111034324 A CN202111034324 A CN 202111034324A CN 113705110 A CN113705110 A CN 113705110A
Authority
CN
China
Prior art keywords
random forest
training
model
value
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111034324.3A
Other languages
English (en)
Inventor
武永博
李光全
李祥龙
黄昭乐
李永祥
普庆红
王建国
左庭
范天林
陶子豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yunnan Copper Co ltd
Yuxi Mining Co ltd
Kunming University of Science and Technology
Original Assignee
Yunnan Copper Co ltd
Yuxi Mining Co ltd
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yunnan Copper Co ltd, Yuxi Mining Co ltd, Kunming University of Science and Technology filed Critical Yunnan Copper Co ltd
Priority to CN202111034324.3A priority Critical patent/CN113705110A/zh
Publication of CN113705110A publication Critical patent/CN113705110A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/02Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于双重随机森林回归方法的爆破振动速度预测方法,属于爆破技术领域。本发明将爆破试验测得的爆破振动速度值作为CART决策树模型的输出变量,相应爆破试验场次采集到测点距离D、炮孔个数N、孔距S、排距B、最大孔深H、总药量A、高程差I与作为CART决策树模型的输入变量,输出变量和输入变量组成预测数据集X和训练数据集
Figure DDA0003246487230000011
采用双重随机森林回归法进行爆破振动速度的预测,以解决现有技术中采用萨道夫斯基公式来预测爆破振动速度时仅考虑装药量、爆源距两个参数,从而导致参数取值粗糙,预测爆破振动速度精度不高的问题。

Description

一种基于双重随机森林回归方法的爆破振动速度预测方法
技术领域
本发明涉及一种基于双重随机森林回归方法的爆破振动速度预测方法,属于爆破技术领域。
背景技术
钻爆法是矿山开采和隧道修建经常采用的破岩方法之一,爆破作用在完成破岩的同时也带来了很多负面效应,如爆破震动、空气冲击波、飞石、噪音、粉尘等,其中爆破震动危害尤为显著。爆破规程采用速度来衡量震动强度,准确地预测爆破引起的质点振动速度能有效控制爆破震动的危害。国内常采用萨道夫斯基公式来预测爆破振动速度,但仅考虑装药量、爆源距两个参数,参数取值粗糙,预测爆破振动速度的精度不高。
发明内容
本发明针对现有技术中采用萨道夫斯基公式来预测爆破振动速度时仅考虑装药量、爆源距两个参数,从而导致参数取值粗糙,预测爆破振动速度精度不高的问题,提供一种基于双重随机森林回归方法的爆破振动速度预测方法,本发明将双重随机森林回归方法引入到爆破震动速度预测,可获得准确性更高、误差更小的预测爆破振动速度。
一种基于双重随机森林回归方法的爆破振动速度预测方法,该方法包括以下步骤:采集爆破设计参数、岩体信息参数、炸药信息参数;训练数据集;从测试样本集中随机抽取n个样本集;形成n棵CART决策树;随机选取特征;形成第一层随机森林;获取训练输出数据,训练后得到残差;训练残差形成新的训练集;新的训练集重抽样;重新形成n棵CART决策树;重新选取特征;形成第二层随机森林;双重随机森林输出求和得到最终的预测结果。
进一步为,本发明该方法包括的步骤具体为:
(1)将爆破试验测得的爆破振动速度值作为CART决策树模型的输出变量,相应爆破试验场次采集到测点距离D、炮孔个数N、孔距S、排距B、最大孔深H、总药量A、高程差I以及弹性模量E作为CART决策树模型的输入变量,输出变量和输入变量组成预测数据集X和训练数据集
Figure BDA0003246487210000021
(2)训练数据集
Figure BDA0003246487210000022
采用Bootstrap方法进行训练样本集重抽样,随机产生n个训练数据集
Figure BDA0003246487210000023
的子集D;
(3)各个子集D中,采用决策树算法,根据“基尼系数最小准则”,选择最优方式进行节点分裂,分裂过程中不剪枝;其中决策树采用二叉树形式,利用二分递归法将数据空间不断划分为不同子集;决策树采用GINI系数作为属性分裂的标准,选择基尼系数最低的特征作为根节点,选择其余特征基尼系数最小的作为叶节点,根据训练数据集,从根节点开始,递归地对每个节点进行操作,构建二叉决策树;
(4)重复构建二叉决策树,生成随机森林:每棵决策树由上而下递归分枝生长,满足分割终止条件后回归树停止生长形成回归树Ti,所有回归树Ti组合构成随机森林模型;
(5)将预测数据集X的参数向量x输入到随机森林模型中,对单棵回归树Ti的预测值yi求算术平均值
Figure BDA0003246487210000024
(6)计算出第1层随机森林在训练样本集上的输出值
Figure BDA0003246487210000025
采用训练样本的实际值yi减去输出值
Figure BDA0003246487210000026
得到训练残差
Figure BDA0003246487210000027
训练残差
Figure BDA0003246487210000028
代入原训练样本中构建一个新的数据集作为第2层随机森林的训练样本,使输入为xi,期望输出为
Figure BDA0003246487210000029
第1层随机森林的训练残差构成第2层随机森林的训练数据集,并对训练残差数值进行归一化处理得到第2层随机森林的训练数据集;
(7)第2层随机森林的训练数据集构建第2层随机森林模型,计算出第2层随机森林模型的预测结果;
(8)第1层随机森林模型与第2层随机森林模型的输出依次叠加,即与第二层随机森林的标签值与相应的第一层随机森林的标签值求和,得到双重随机森林预测模型的爆破振动速度。
进一步为,本发明步骤(2)子集D为:
D={xi1,xi2,…,xin,yi}(i∈[1,m]),其中k远小于m。
进一步为,本发明步骤(3)决策树算法为
单棵决策树预测器h(X,θk)的预测结果为hi(X),随机森林回归模型的预测结果为:
RFP={Ntree,Mtry} (1)
Figure BDA0003246487210000031
式(1)随机森林回归算法建模过程参数集RFP,Ntree为模型中回归树棵数,Mtry为随机特征数目,式(2)为基于随机森林回归的爆破速度预测方法;
式中,X表示输入向量,θk是表示生成每棵树生长路径的向量,Ntree为模型中决策树树棵数,Mtry为从特征中随机抽取的特征数目;Mtry值为:
Mtry&=[log2M] (3)
Mtrv&=[M/3] (4)
式中:M为模型输入参数的数量;[]表示向下取整运算。
进一步为,本发明二分递归法为:
分类时,设有K个类,样本点属于第K类的概率为Pk,概率分布的基尼指数为
Figure BDA0003246487210000032
式中:K为节点中特征样本的总种类数;Pk为属于节点中第k类特征样本的概率。
进一步为,本发明二叉决策树构建法为:
样本集合D根据特征A是否取值a,被分割成D1和D2两部分,D1={(x,y)∈D|A(x)=a},D2=D-D1,则特征A的条件下,集合D的基尼指数定义为:
Figure BDA0003246487210000033
节点的训练集为D1,计算出现有的特征对该数据集的基尼指数:对每一个特征A,根据样本点对A=a的测试为“是”或“否”将D分割成D1和D2两部分,计算A=a时的基尼指数,选择基尼指数最小的切分点作为切分点,依最优特征与最优切分点,从现切分点生成两个子节点,将训练数据集依特征分配到两个叶节点中去,对两个叶节点递归地调用5~10次。
进一步为,本发明训练残差数值的归一化处理法为:
Figure BDA0003246487210000041
式中:lin为原始输入数据,lmin为原始输入数据中同类数据的最小值;lmax为原始输入数据中同类数据的最大值;l为归一化处理之后的输入数据。
上述方法的性能评测方法,所述的评测方法使用均方根误差(RMSE)、和R方(R2)两个指标构成模型的评价体系,RMSE为预测值与实测值之间的偏差,R2为预测值与实测值之间的相关程度,公式如下:
Figure BDA0003246487210000042
Figure BDA0003246487210000043
式中:Oi为模型输出的振速预测值;Ti为振速实测值;T为实测值平均值;n为预测值与实测值对数。
本发明的有益效果是:本发明针对现有技术中采用萨道夫斯基公式来预测爆破振动速度时仅考虑装药量、爆源距两个参数,从而导致参数取值粗糙,预测爆破振动速度精度不高的问题,将双重随机森林回归方法引入到爆破震动速度预测,可获得准确性更高、误差更小的预测爆破振动速度,并将随机森林模型预测的结果与传统方法预测的结果相比较,以期为爆破震速监测提供最优的预测方法。
附图说明
图1为本发明爆破振动速度预测流程图。
具体实施方式
下面结合具体实施方式对本发明作进一步详细说明,但本发明的保护范围并不限于所述内容。
一种基于双重随机森林回归方法的爆破振动速度预测方法,具体步骤如下:
(1)将爆破试验测得的爆破振动速度值作为CART决策树模型的输出变量,相应爆破试验场次采集到测点距离D、炮孔个数N、孔距S、排距B、最大孔深H、总药量A和高程差E作为CART决策树模型的输入变量,输出变量和输入变量组成预测数据集X和训练数据集
Figure BDA0003246487210000051
(2)训练数据集
Figure BDA0003246487210000052
采用Bootstrap方法进行训练样本集重抽样,随机产生n个训练数据集
Figure BDA0003246487210000053
的子集D;
(3)各个子集D中,采用决策树算法,根据“基尼系数最小准则”,选择最优方式进行节点分裂,分裂过程中不剪枝;其中决策树采用二叉树形式,利用二分递归法将数据空间不断划分为不同子集;决策树采用GINI系数作为属性分裂的标准,选择基尼系数最低的特征作为根节点,选择其余特征基尼系数最小的作为叶节点,根据训练数据集,从根节点开始,递归地对每个节点进行操作,构建二叉决策树;
(4)重复构建二叉决策树,生成随机森林:每棵决策树由上而下递归分枝生长,满足分割终止条件后回归树停止生长形成回归树Ti,所有回归树Ti组合构成随机森林模型;
(5)将预测数据集X的参数向量x输入到随机森林模型中,对单棵回归树Ti的预测值yi求算术平均值
Figure BDA0003246487210000054
(6)计算出第1层随机森林在训练样本集上的输出值
Figure BDA0003246487210000055
采用训练样本的实际值yi减去输出值
Figure BDA0003246487210000056
得到训练残差
Figure BDA0003246487210000057
训练残差
Figure BDA0003246487210000058
代入原训练样本中构建一个新的数据集作为第2层随机森林的训练样本,使输入为xi,期望输出为
Figure BDA0003246487210000059
第1层随机森林的训练残差构成第2层随机森林的训练数据集,并对训练残差数值进行归一化处理得到第2层随机森林的训练数据集;
(7)第2层随机森林的训练数据集构建第2层随机森林模型,计算出第2层随机森林模型的预测结果;
(8)第1层随机森林模型与第2层随机森林模型的输出依次叠加,即与第二层随机森林的标签值与相应的第一层随机森林的标签值求和,得到双层随机森林预测模型的爆破振动速度。
所述步骤(2)子集D为D={xi1,xi2,…,xin,yi}(i∈[1,m]),其中k远小于m。
所述步骤(3)决策树算法为
单棵决策树预测器h(X,θk)的预测结果为hi(X),随机森林回归模型的预测结果为
RFP={Ntree,Mtry} (1)
Figure BDA0003246487210000061
式(1)随机森林回归算法建模过程参数集RFP,Ntree为模型中回归树棵数,Mtry为随机特征数目,式(2)为基于随机森林回归的爆破速度预测方法;
式中,X表示输入向量,θk是表示生成每棵树生长路径的向量,Ntree为模型中决策树树棵数,Ntree值影响随机森林模型的训练度与精确度,为了得到最佳的评价结果,利用MATLAB脚本语言编写代码并进行不同决策树树棵树(Ntree)与模型均方误差(MSE)之间关系仿真计算;Mtry为从特征中随机抽取的特征数目,Mtry值控制了随机森林模型属性的扰动程度,直接影响模型的准确度;Mtry值估算法为
Mtry&=[log2M] (3)
Mtrv&=[M/3] (4)
式中:M为模型输入参数的数量,模型中输入参数数量M根据实际输入的参数数量取值;[]表示向下取整运算。
进一步的,所述二分递归法为
分类时,设有K个类,样本点属于第K类的概率为Pk,概率分布的基尼指数为
Figure BDA0003246487210000071
式中:K为节点中特征样本的总种类数;Pk为属于节点中第k类特征样本的概率。
所述二叉决策树构建法为
样本集合D根据特征A是否取值a,被分割成D1和D2两部分,D1={(x,y)∈D|A(x)=a},D2=D-D1,则特征A的条件下,集合D的基尼指数定义为
Figure BDA0003246487210000072
节点的训练集为D1,计算出现有的特征对该数据集的基尼指数:对每一个特征A,对其可能的每个取值a,根据样本点对A=a的测试为“是”或“否”将D分割成D1和D2两部分,计算A=a时的基尼指数,在所有可能的特征A和所有可能的切分点a中,选择基尼指数最小的切分点作为切分点,依最优特征与最优切分点,从现切分点生成两个子节点,将训练数据集依特征分配到两个叶节点中去,对两个叶节点递归地调用5~10次。
所述训练残差数值的归一化处理法为
Figure BDA0003246487210000073
式中:lin为原始输入数据,lmin为原始输入数据中同类数据的最小值;lmax为原始输入数据中同类数据的最大值;l为归一化处理之后的输入数据。
评价基于随机森林回归算法的爆破振动速度预测模型的性能,选用均方根误差(RMSE)、和R方(R2)两个指标构成模型的评价体系,RMSE为预测值与实测值之间的偏差,R2为预测值与实测值之间的相关程度,公式如下:
Figure BDA0003246487210000081
Figure BDA0003246487210000082
式中:Oi为模型输出的振速预测值;Ti为振速实测值;T为实测值平均值;n为预测值与实测值对数。
实施例1:一种基于双重随机森林回归方法的爆破振动速度预测方法(见图1),具体步骤如下:
(1)将爆破试验测得的爆破振动速度值作为CART决策树模型的输出变量,相应爆破试验场次采集到的测点距离(D)、炮孔个数(N)、孔距(S)、排距(B)、最大孔深(H)、总药量(A)高程差(I)和弹性模量(E)作为CART决策树模型的输入变量,输出变量和输入变量组成预测数据集X和训练数据集
Figure BDA0003246487210000083
(2)训练数据集
Figure BDA0003246487210000084
采用Bootstrap方法进行训练样本集重抽样,随机产生n个训练数据集
Figure BDA0003246487210000085
的子集D,D={xi1,xi2,…,xin,yi}(i∈[1,m]),(其中k<<m);
Bootstrap方法可随机有放回的选择训练数据,构造分类器,再通过组合学习后的模型来增加整体的采集效果;
(3)各个子集D中,采用决策树算法,根据“基尼系数最小准则”,选择最优方式进行节点分裂,分裂过程中不剪枝:设单棵决策树预测器h(X,θk)的预测结果为hi(X),则随机森林回归模型的最终预测结果表示为:
RFP={Ntree,Mtry} (1)
Figure BDA0003246487210000086
式(1)为随机森林回归算法建模过程参数集RFP,Ntree为模型中回归树棵数,Mtry为随机特征数目;式(2)为基于随机森林回归的爆破速度预测方法;
式中:X为输入向量,θk为生成每棵树生长路径的向量,Ntree为模型中决策树树棵数,Ntree值影响随机森林模型的训练度与精确度;为了得到最佳的评价结果,利用MATLAB脚本语言编写代码并进行不同决策树树棵树(Ntree)与模型均方误差(MSE)之间关系仿真计算;Mtry为从特征中随机抽取的特征数目,Mtry值控制了随机森林模型属性的扰动程度,是模型中重要的参数;Mtry值会直接影响模型的准确度,Mtry值计算法为
Mtry&=[log2M] (3)
Mtrv&=[M/3] (4)
式中:M为模型输入参数的数量,模型中输入参数数量M根据实际输入的参数数量取值;[]表示向下取整运算;
其中决策树采用二叉树形式,利用二分递归法将数据空间不断划分为不同子集;决策树采用GINI系数作为属性分裂的标准,选择基尼系数最低的特征作为根节点,选择其余特征基尼系数最小的作为叶节点,根据训练数据集,从根节点开始,递归地对每个节点进行操作,构建二叉决策树;
二分递归法为
分类时,设有K个类,样本点属于第K类的概率为Pk,概率分布的基尼指数为
Figure BDA0003246487210000091
式中,K为节点中特征样本的总种类数;Pk为属于节点中第k类特征样本的概率。
二叉决策树构建法为
样本集合D根据特征A是否取值a,被分割成D1和D2两部分,D1={(x,y)∈D|A(x)=a},D2=D-D1,则特征A的条件下,集合D的基尼指数定义为
Figure BDA0003246487210000092
节点的训练集为D1,计算出现有的特征对该数据集的基尼指数:对每一个特征A,对其可能的每个取值a,根据样本点对A=a的测试为“是”或“否”将D分割成D1和D2两部分,计算A=a时的基尼指数,在所有可能的特征A和所有可能的切分点a中,选择基尼指数最小的切分点作为切分点,依最优特征与最优切分点,从现切分点生成两个子节点,将训练数据集依特征分配到两个叶节点中去,对两个叶节点递归地调用5~10次;
(4)重复构建二叉决策树,生成随机森林:每棵决策树由上而下递归分枝生长,满足分割终止条件后回归树停止生长形成回归树Ti,所有回归树Ti组合构成随机森林模型;
(5)将预测数据集X的参数向量x输入到随机森林模型中,对单棵回归树Ti的预测值yi求算术平均值
Figure BDA0003246487210000101
(6)计算出第1层随机森林在训练样本集上的输出值
Figure BDA0003246487210000102
采用训练样本的实际值yi减去输出值
Figure BDA0003246487210000103
得到训练残差
Figure BDA0003246487210000104
训练残差
Figure BDA0003246487210000105
代入原训练样本中构建一个新的数据集作为第2层随机森林的训练样本,使输入为xi,期望输出为
Figure BDA0003246487210000106
第1层随机森林的训练残差构成第2层随机森林的训练数据集,并对训练残差数值进行归一化处理得到第2层随机森林的训练数据集;其中训练残差数值的归一化处理法为
Figure BDA0003246487210000107
式中:lin为原始输入数据,lmin为原始输入数据中同类数据的最小值;lmax为原始输入数据中同类数据的最大值;l为归一化处理之后的输入数据;
(7)第2层随机森林的训练数据集构建第2层随机森林模型,计算出第2层随机森林模型的预测结果;
(8)第1层随机森林模型与第2层随机森林模型的输出依次叠加,即第二层随机森林的标签值与相应的第一层随机森林的标签值求和,得到双层随机森林预测模型的爆破振动速度;
评价基于随机森林回归算法的爆破振动速度预测模型的性能,选用均方根误差(RMSE)、和R方(R2)两个指标构成模型的评价体系,RMSE为预测值与实测值之间的偏差,R2为预测值与实测值之间的相关程度,公式如下:
Figure BDA0003246487210000111
Figure BDA0003246487210000112
式中:Oi为模型输出的振速预测值;Ti为振速实测值;T为实测值平均值;n为预测值与实测值对数。
实施例2:以某露天矿山爆破参数及相应的振动参数为例研究双重随机森林的可靠性;
一种基于双重随机森林回归方法的爆破振动速度预测方法(见图1),具体步骤如下:
(1)利用已有的历史岩石振动相关参数作为样本属性(见表1)构建CART决策树模型,
表1预测样本的实测值
Figure BDA0003246487210000113
将爆破试验测得的爆破振动速度值作为CART决策树模型的输出变量,相应爆破试验场次采集到的测点距离(D)、炮孔个数(N)、孔距(S)、排距(B)、最大孔深(H)、总药量(A)高程差(E)与岩石的弹性模量(I)作为CART决策树模型的输入变量,输出变量和输入变量组成预测数据集X和训练数据集
Figure BDA0003246487210000121
(2)训练数据集
Figure BDA0003246487210000122
采用Bootstrap方法进行训练样本集重抽样,随机产生n个训练数据集
Figure BDA0003246487210000123
的子集D,D={xi1,xi2,…,xin,yi}(i∈[1,m]),(其中k<<m);Bootstrap方法可随机有放回的选择训练数据,构造分类器,再通过组合学习后的模型来增加整体的采集效果;
(3)各个子集D中,采用决策树算法,根据“基尼系数最小准则”,选择最优方式进行节点分裂,分裂过程中不剪枝:设单棵决策树预测器h(X,θk)的预测结果为hi(X),则随机森林回归模型的最终预测结果表示为:
RFP={Ntree,Mtry} (1)
Figure BDA0003246487210000124
式(1)为随机森林回归算法建模过程参数集RFP,Ntree为模型中回归树棵数,Mtry为随机特征数目;式(2)为基于随机森林回归的爆破速度预测方法;
式中:X为输入向量,θk为生成每棵树生长路径的向量,Ntree为模型中决策树树棵数,Ntree值影响随机森林模型的训练度与精确度;为了得到最佳的评价结果,利用MATLAB脚本语言编写代码并进行不同决策树树棵树(Ntree)与模型均方误差(MSE)之间关系仿真计算;Mtry为从特征中随机抽取的特征数目,Mtry值控制了随机森林模型属性的扰动程度,是模型中重要的参数;Mtry值会直接影响模型的准确度,Mtry值计算法为
Mtry&=[log2M] (3)
Mtrv&=[M/3] (4)
式中:M为模型输入参数的数量,模型中输入参数数量M根据实际输入的参数数量取值;[]表示向下取整运算;
其中决策树采用二叉树形式,利用二分递归法将数据空间不断划分为不同子集;决策树采用GINI系数作为属性分裂的标准,选择基尼系数最低的特征作为根节点,选择其余特征基尼系数最小的作为叶节点,根据训练数据集,从根节点开始,递归地对每个节点进行操作,构建二叉决策树;
二分递归法为
分类时,设有K个类,样本点属于第K类的概率为Pk,概率分布的基尼指数为
Figure BDA0003246487210000131
式中,K为节点中特征样本的总种类数;Pk为属于节点中第k类特征样本的概率;
二叉决策树构建法为
样本集合D根据特征A是否取值a,被分割成D1和D2两部分,D1={(x,y)∈D|A(x)=a},D2=D-D1,则特征A的条件下,集合D的基尼指数定义为
Figure BDA0003246487210000132
节点的训练集为D1,计算出现有的特征对该数据集的基尼指数:对每一个特征A,对其可能的每个取值a,根据样本点对A=a的测试为“是”或“否”将D分割成D1和D2两部分,计算A=a时的基尼指数,在所有可能的特征A和所有可能的切分点a中,选择基尼指数最小的切分点作为切分点,依最优特征与最优切分点,从现切分点生成两个子节点,将训练数据集依特征分配到两个叶节点中去,对两个叶节点递归地调用5~10次;
(4)重复构建二叉决策树,生成随机森林:每棵决策树由上而下递归分枝生长,满足分割终止条件后回归树停止生长形成回归树Ti,所有回归树Ti组合构成随机森林模型;
(5)将预测数据集X的参数向量x输入到随机森林模型中,对单棵回归树Ti的预测值yi求算术平均值
Figure BDA0003246487210000133
(6)计算出第1层随机森林在训练样本集上的输出值
Figure BDA0003246487210000141
采用训练样本的实际值yi减去输出值
Figure BDA0003246487210000142
得到训练残差
Figure BDA0003246487210000143
训练残差
Figure BDA0003246487210000144
代入原训练样本中构建一个新的数据集作为第2层随机森林的训练样本,使输入为xi,期望输出为
Figure BDA0003246487210000145
第1层随机森林的训练残差构成第2层随机森林的训练数据集,并对训练残差数值进行归一化处理得到第2层随机森林的训练数据集;其中训练残差数值的归一化处理法为
Figure BDA0003246487210000146
式中:lin为原始输入数据,lmin为原始输入数据中同类数据的最小值;lmax为原始输入数据中同类数据的最大值;l为归一化处理之后的输入数据;
(7)第2层随机森林的训练数据集构建第2层随机森林模型,计算出第2层随机森林模型的预测结果;
(8)第1层随机森林模型与第2层随机森林模型的输出依次叠加,即第二层随机森林的标签值与相应第一层随机森林的标签值求和,得到双层随机森林预测模型的爆破振动速度;
传统萨道夫斯基公式的爆破振动速度预测结果和双层随机森林预测模型的爆破振动速度预测结果见表2;
表2训练样本的爆破振动速度预测结果和误差
Figure BDA0003246487210000147
Figure BDA0003246487210000151
评价基于随机森林回归算法的爆破振动速度预测模型的性能,选用均方根误差(RMSE)、和R方(R2)两个指标构成模型的评价体系,RMSE为预测值与实测值之间的偏差,R2为预测值与实测值之间的相关程度,公式如下:
Figure BDA0003246487210000152
Figure BDA0003246487210000153
式中:Oi为模型输出的振速预测值;Ti为振速实测值;T为实测值平均值;n为预测值与实测值对数;
传统萨道夫斯基公式预测模型和双层随机森林预测模型的评价指标值见表3;
表3预测模型的评价指标值
评价指标 双重随机森林预测模型 传统方法预测模型
RMSE 0.079371 0.129303
R<sup>2</sup> 0.957003 0.910249
从表2可知,双重随机森林预测模型震动速度相对误差比传统预测模型小,体现了其预测性能的优越性;从表3可知虽然双重随机森林预测模型大于与传统预测模型R方,说明双重随机森林更加稳定;在RMSE上双重随机森林模型预测远小于传统预测模型,说明双重随机森林的预测效果更加准确。所以,相比于传统预测模型,双重随机森林预测模型可靠度更高,预测结果更稳定,表明双重随机森岭预测模型更能有效准确的对爆破震动速度进行预测。
以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (8)

1.一种基于双重随机森林回归方法的爆破振动速度预测方法,其特征在于,该方法包括以下步骤:采集爆破设计参数、岩体信息参数、炸药信息参数;训练数据集;从测试样本集中随机抽取n个样本集;形成n棵CART决策树;随机选取特征;形成第一层随机森林;获取训练输出数据,训练后得到残差;训练残差形成新的训练集;新的训练集重抽样;重新形成n棵CART决策树;重新选取特征;形成第二层随机森林;双重随机森林输出求和得到最终的预测结果。
2.根据权利要求1所述的基于双重随机森林回归方法的爆破振动速度预测方法,其特征在于,该方法包括的步骤具体为:
(1)将爆破试验测得的爆破振动速度值作为CART决策树模型的输出变量,相应爆破试验场次采集到测点距离D、炮孔个数N、孔距S、排距B、最大孔深H、总药量A、高程差I以及弹性模量E作为CART决策树模型的输入变量,输出变量和输入变量组成预测数据集X和训练数据集
Figure FDA0003246487200000011
(2)训练数据集
Figure FDA0003246487200000012
采用Bootstrap方法进行训练样本集重抽样,随机产生n个训练数据集
Figure FDA0003246487200000013
的子集D;
(3)各个子集D中,采用决策树算法,根据“基尼系数最小准则”,选择最优方式进行节点分裂,分裂过程中不剪枝;其中决策树采用二叉树形式,利用二分递归法将数据空间不断划分为不同子集;决策树采用GINI系数作为属性分裂的标准,选择基尼系数最低的特征作为根节点,选择其余特征基尼系数最小的作为叶节点,根据训练数据集,从根节点开始,递归地对每个节点进行操作,构建二叉决策树;
(4)重复构建二叉决策树,生成随机森林:每棵决策树由上而下递归分枝生长,满足分割终止条件后回归树停止生长形成回归树Ti,所有回归树Ti组合构成随机森林模型;
(5)将预测数据集X的参数向量x输入到随机森林模型中,对单棵回归树Ti的预测值yi求算术平均值
Figure FDA0003246487200000014
(6)计算出第1层随机森林在训练样本集上的输出值
Figure FDA0003246487200000015
采用训练样本的实际值yi减去输出值
Figure FDA0003246487200000021
得到训练残差
Figure FDA0003246487200000022
训练残差
Figure FDA0003246487200000023
代入原训练样本中构建一个新的数据集作为第2层随机森林的训练样本,使输入为xi,期望输出为
Figure FDA0003246487200000024
第1层随机森林的训练残差构成第2层随机森林的训练数据集,并对训练残差数值进行归一化处理得到第2层随机森林的训练数据集;
(7)第2层随机森林的训练数据集构建第2层随机森林模型,计算出第2层随机森林模型的预测结果;
(8)第1层随机森林模型与第2层随机森林模型的输出依次叠加,即与第二层随机森林的标签值与相应的第一层随机森林的标签值求和,得到双重随机森林预测模型的爆破振动速度。
3.根据权利要求1所述基于双重随机森林回归方法的爆破振动速度预测方法,其特征在于,步骤(2)子集D为:
D={xi1,xi2,…,xin,yi}(i∈[1,m]),其中k远小于m。
4.根据权利要求1所述基于双重随机森林回归方法的爆破振动速度预测方法,其特征在于,步骤(3)决策树算法为:
单棵决策树预测器h(X,θk)的预测结果为hi(X),随机森林回归模型的预测结果为:
RFP={Ntree,Mtry} (1)
Figure FDA0003246487200000025
式(1)随机森林回归算法建模过程参数集RFP,Ntree为模型中回归树棵数,Mtry为随机特征数目,式(2)为基于随机森林回归的爆破速度预测方法;
式中,X表示输入向量,θk是表示生成每棵树生长路径的向量,Ntree为模型中决策树树棵数,Mtry为从特征中随机抽取的特征数目;Mtry值为:
Mtry&=[log2M] (3)
Mtrv&=[M/3] (4)
式中:M为模型输入参数的数量;[]表示向下取整运算。
5.根据权利要求4所述基于双重随机森林回归方法的爆破振动速度预测方法,其特征在于,二分递归法为:
分类时,设有K个类,样本点属于第K类的概率为Pk,概率分布的基尼指数为
Figure FDA0003246487200000031
式中:K为节点中特征样本的总种类数;Pk为属于节点中第k类特征样本的概率。
6.根据权利要求5所述基于双重随机森林回归方法的爆破振动速度预测方法,其特征在于,二叉决策树构建法为:
样本集合D根据特征A是否取值a,被分割成D1和D2两部分,D1={(x,y)∈D|A(x)=a},D2=D-D1,则特征A的条件下,集合D的基尼指数定义为:
Figure FDA0003246487200000032
节点的训练集为D1,计算出现有的特征对该数据集的基尼指数:对每一个特征A,根据样本点对A=a的测试为“是”或“否”将D分割成D1和D2两部分,计算A=a时的基尼指数,选择基尼指数最小的切分点作为切分点,依最优特征与最优切分点,从现切分点生成两个子节点,将训练数据集依特征分配到两个叶节点中去,对两个叶节点递归地调用5~10次。
7.根据权利要求2所述基于双重随机森林回归方法的爆破振动速度预测方法,其特征在于,训练残差数值的归一化处理法为:
Figure FDA0003246487200000033
式中:lin为原始输入数据,lmin为原始输入数据中同类数据的最小值;lmax为原始输入数据中同类数据的最大值;l为归一化处理之后的输入数据。
8.如权利要求1至7任一所述方法的性能评测方法,其特征在于,所述的评测方法使用均方根误差(RMSE)、和R方(R2)两个指标构成模型的评价体系,RMSE为预测值与实测值之间的偏差,R2为预测值与实测值之间的相关程度,公式如下:
Figure FDA0003246487200000041
Figure FDA0003246487200000042
式中:Oi为模型输出的振速预测值;Ti为振速实测值;T为实测值平均值;n为预测值与实测值对数。
CN202111034324.3A 2021-09-03 2021-09-03 一种基于双重随机森林回归方法的爆破振动速度预测方法 Pending CN113705110A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111034324.3A CN113705110A (zh) 2021-09-03 2021-09-03 一种基于双重随机森林回归方法的爆破振动速度预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111034324.3A CN113705110A (zh) 2021-09-03 2021-09-03 一种基于双重随机森林回归方法的爆破振动速度预测方法

Publications (1)

Publication Number Publication Date
CN113705110A true CN113705110A (zh) 2021-11-26

Family

ID=78659649

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111034324.3A Pending CN113705110A (zh) 2021-09-03 2021-09-03 一种基于双重随机森林回归方法的爆破振动速度预测方法

Country Status (1)

Country Link
CN (1) CN113705110A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116230158A (zh) * 2023-03-27 2023-06-06 中国医学科学院肿瘤医院 一种疼痛评估及用药预测系统及其使用方法
CN116884631A (zh) * 2023-09-06 2023-10-13 杭州生奥信息技术有限公司 基于ai和相似患者分析的综合肝衰竭预测与治疗参考系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109146195A (zh) * 2018-09-06 2019-01-04 北方爆破科技有限公司 一种基于cart树回归算法的爆破块度预测方法
KR20190022026A (ko) * 2017-08-25 2019-03-06 (주)뉴옵틱스 혈구 감별 장치 및 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190022026A (ko) * 2017-08-25 2019-03-06 (주)뉴옵틱스 혈구 감별 장치 및 방법
CN109146195A (zh) * 2018-09-06 2019-01-04 北方爆破科技有限公司 一种基于cart树回归算法的爆破块度预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
张吉勇等: ""基于随机森林算法的爆破振速预测研究"", 《化工矿物与加工》, vol. 47, no. 4, 31 December 2018 (2018-12-31), pages 34 - 37 *
王仁超等: ""基于随机森林回归方法的爆破块度预测模型研究"", 《水力发电学报》, vol. 39, no. 1, 31 January 2020 (2020-01-31), pages 89 - 101 *
邢书豪等: ""基于双层随机森林算法的短期负荷预测模型"", 《广东电力》, no. 9, 30 September 2019 (2019-09-30), pages 160 - 166 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116230158A (zh) * 2023-03-27 2023-06-06 中国医学科学院肿瘤医院 一种疼痛评估及用药预测系统及其使用方法
CN116230158B (zh) * 2023-03-27 2024-01-26 中国医学科学院肿瘤医院 一种疼痛评估及用药预测系统及其使用方法
CN116884631A (zh) * 2023-09-06 2023-10-13 杭州生奥信息技术有限公司 基于ai和相似患者分析的综合肝衰竭预测与治疗参考系统
CN116884631B (zh) * 2023-09-06 2023-12-12 杭州生奥信息技术有限公司 基于ai和相似患者分析的综合肝衰竭预测与治疗参考系统

Similar Documents

Publication Publication Date Title
WO2020125668A1 (zh) 一种应用随钻参数来自动识别围岩级别的方法和系统
CN112989708B (zh) 一种基于lstm神经网络的测井岩性识别方法及系统
CN112382352B (zh) 基于机器学习的金属有机骨架材料结构特征快速评估方法
CN110674841B (zh) 一种基于聚类算法的测井曲线识别方法
CN111783825A (zh) 一种基于卷积神经网络学习的测井岩性识别方法
Arbin et al. Comparative analysis between k-means and k-medoids for statistical clustering
CN113705110A (zh) 一种基于双重随机森林回归方法的爆破振动速度预测方法
CN114241779B (zh) 一种城市快速路交通流短时预测方法、计算机及存储介质
CN110826618A (zh) 一种基于随机森林的个人信用风险评估方法
CN108710576B (zh) 基于异构迁移的数据集扩充方法及软件缺陷预测方法
CN109447249B (zh) 一种基于深度卷积的对抗神经网络测井数据重建方法
CN113344019A (zh) 一种决策值选取初始聚类中心改进的K-means算法
CN110568483A (zh) 基于卷积神经网络的地震线性噪声压制效果自动评估方法
CN110990784A (zh) 一种基于梯度提升回归树的烟支通风率预测方法
CN115481577B (zh) 一种基于随机森林和遗传算法的油藏自动历史拟合方法
CN108280289B (zh) 基于局部加权c4.5算法的冲击地压危险等级预测方法
CN112614021A (zh) 一种基于已建隧道信息智能识别的隧道围岩地质信息预测方法
CN102867104B (zh) 一种电子设备的电磁环境影响因素的定量分析装置及方法
CN114091333A (zh) 一种基于机器学习的页岩含气量人工智能预测方法
CN117272841B (zh) 一种基于混合神经网络的页岩气甜点预测方法
CN107194468A (zh) 面向情报大数据的决策树增量学习方法
CN110362911A (zh) 一种面向设计过程的代理模型选择方法
CN113762394B (zh) 一种爆破块度预测方法
CN117033912A (zh) 一种设备故障预测方法、装置、可读存储介质及电子设备
CN115270959B (zh) 基于递归特征消除融合随机森林的页岩岩性识别法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination