CN113868943A - 一种基于数据增强的神经网络的爆破块度预测方法 - Google Patents
一种基于数据增强的神经网络的爆破块度预测方法 Download PDFInfo
- Publication number
- CN113868943A CN113868943A CN202111077800.XA CN202111077800A CN113868943A CN 113868943 A CN113868943 A CN 113868943A CN 202111077800 A CN202111077800 A CN 202111077800A CN 113868943 A CN113868943 A CN 113868943A
- Authority
- CN
- China
- Prior art keywords
- network
- blasting
- data
- characteristic
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000005422 blasting Methods 0.000 title claims abstract description 85
- 238000000034 method Methods 0.000 title claims abstract description 75
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 30
- 238000012549 training Methods 0.000 claims abstract description 26
- 238000007637 random forest analysis Methods 0.000 claims abstract description 20
- 238000012216 screening Methods 0.000 claims abstract description 12
- 238000002790 cross-validation Methods 0.000 claims abstract description 9
- 238000005457 optimization Methods 0.000 claims abstract description 3
- 238000010276 construction Methods 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 6
- 230000002596 correlated effect Effects 0.000 claims description 5
- 238000012795 verification Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 4
- 238000012407 engineering method Methods 0.000 claims description 4
- 230000004927 fusion Effects 0.000 claims description 4
- 238000004140 cleaning Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 2
- 238000007500 overflow downdraw method Methods 0.000 claims 1
- 230000007547 defect Effects 0.000 abstract description 4
- 238000010200 validation analysis Methods 0.000 abstract description 3
- 238000003062 neural network model Methods 0.000 abstract description 2
- 238000005259 measurement Methods 0.000 abstract 1
- 239000011435 rock Substances 0.000 description 18
- 238000005553 drilling Methods 0.000 description 11
- 238000012360 testing method Methods 0.000 description 10
- 239000002360 explosive Substances 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 210000002569 neuron Anatomy 0.000 description 5
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 4
- 230000000903 blocking effect Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- RSWGJHLUYNHPMX-UHFFFAOYSA-N Abietic-Saeure Natural products C12CCC(C(C)C)=CC2=CCC2C1(C)CCCC2(C)C(O)=O RSWGJHLUYNHPMX-UHFFFAOYSA-N 0.000 description 2
- KHPCPRHQVVSZAH-HUOMCSJISA-N Rosin Natural products O(C/C=C/c1ccccc1)[C@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 KHPCPRHQVVSZAH-HUOMCSJISA-N 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000005474 detonation Methods 0.000 description 2
- 238000004880 explosion Methods 0.000 description 2
- 229910052742 iron Inorganic materials 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 239000004575 stone Substances 0.000 description 2
- KHPCPRHQVVSZAH-UHFFFAOYSA-N trans-cinnamyl beta-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OCC=CC1=CC=CC=C1 KHPCPRHQVVSZAH-UHFFFAOYSA-N 0.000 description 2
- 241000254158 Lampyridae Species 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000007873 sieving Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于数据增强的神经网络的爆破块度预测方法,包括:采集某地区矿山爆破产生的数据;利用特征工程选择重要的爆破特征;建立神经网络模型;基于数据增强、参数优化方法建模和分析。本专利提出基于随机森林、皮尔逊相关系数相结合的方法进行特征筛选,该方法不仅保留了和目标值特性相关性较强的特征,而且克服了随机森林对关联特征重要性度量不稳定的缺点;采用数据增强的方法,在训练过程中以K折交叉验证为基本框架,每一折交叉验证的过程中,仅对训练数据进行数据增强,验证集保持不变,保证了模型学习更多更充分的样本,增强了模型的鲁棒性。本发明克进一步提高了爆破块预测的准确性和可靠性。
Description
技术领域
本发明涉及工程爆破技术领域,特别是一种基于数据增强的神经网络的爆破块度预测方法。
背景技术
爆破在矿上生产中的地位十分重要。其中爆破块度是定量评价爆破质量的重要指标,因此对岩体爆破块度的研究具有重要的实际意义。为了减少爆破施工的成本,增加爆破施工的成功率,利用机器学习方法预先预测出不同参数所产生的爆破块度范围,能有效降低矿山开采的成本,因此构建出具有较强泛化能力的预测模型是亟待解决的问题。
早期爆破块度模型的构建主要依靠现场爆破试验、经验公式总结、岩体力学模型计算等方法。上世纪30年代起,Rosin和Rammler等开始对爆破料堆块度预测问题进行现场调查与相关爆破数据研究,总结并提出了以Rosin-Rammler命名的半经验公式;Kuznetsov等以Rosin-Rammler半经验公式为基础,提出了Kuznetsov公式,Cunningham结合RosinRammler公式与Kuznetsov公式的特点,提出了能够较好预测爆破块度的KUZ-RAM模型,Kuz-Ram模型是第一个台阶爆破块度预测方程,是一个用于计算筛分曲线遵循RR函数的台阶爆破圆的平均碎片尺寸和均匀性指数n的方程。
相关文献表明,决定岩石块度大小的因素与块度之间的关系往往是多维、非线性的,有时难于用统一公式表述。随着计算机科学与人工智能技术的创新与发展,针对传统爆破料堆块度预测方法的不足,可通过机器学习方法进行建模分析,诸多研究人员也开发了基于机器学习建模爆破块度预测方法。美国的Kulatilake和土耳其Hudaverdi等首先提出采用人工神经元网络(ANN)方法预测岩石爆破中碎石的平均块度,对多种算法模型对比,证明了神经网络模型的可行性,但该模型存在网络结构及训练参数多、收敛速度慢、预测结果稳定性弱等不足。随着如SVM,随机森林等方法在预测矿山爆破块度的成功,越来越多的研究人员开始研究该领域。2018年Hasanipanah等成功的发了粒子群优化-自适应神经模糊推理系统ANFIS,Asl等开发了萤火虫算法FFA-ANN模型都是从优化神经网络参数方向上做出了改进,结果表明这些算法预测值与试验实测值比较接近,但依旧存在泛化能力差,过拟合的问题。
上述预测方法都是针对单一的爆破区域提出的,但每一个爆破区域爆破数据获取难度大,爆破试验经费高、次数少,获取数据成本高。并且,较少的数据集训练模型,容易产生过拟合,模型泛化能力差。为了解决以上问题,本专利充分利用了相关论文和公开的数据集,即有效地扩充数据集,也节约了爆破试验的周期和开销。为了提高模型泛化能力,以适应不同矿场的地质条件,保证模型预测的准确度,提出了针对不同矿场条件进行优化的训练方法。
发明内容
本发明提供了一种数据增强的神经网络的爆破块度预测方法,用以预测矿山的爆破块度,该方法能够克服小样本学习容易产生的过拟合的缺点,同时能更好地适应不同矿山场景。
为达到上述目的,本发明按照以下技术方案实施:
步骤1获取爆破数据
获取原始数据,通过数据预处理,数据清理、统计校正获得原始爆破数据集。
利用相关专业领域的经验,对采集的数据进行整理,得到目标区域的爆破特征数据集合A;
步骤二 爆破特征筛选
2.1本专利利用随机森林方法对特征进行筛选,具体方法如下:
2.1.1特征重要性度量
1)对每一颗决策树,选择相应的袋外数据(out of bag,OOB)计算袋外数据误差,记为errOOB1;
2)随机对袋外数据OOB所有样本的特征X加入噪声干扰,再次计算袋外数据误差,记为errOOB2;
3)假设森林中有N棵树,则特征X的重要性记作:∑(errOOB2-errOOB1)/N;如果加入随机噪声后,袋外数据准确率大幅度下降,即errOOB2上升,说明这个特征对于样本的预测结果有很大影响,进而说明重要程度比较高;
2.2.2特征选择
1)根据特征重要性度量方法,计算每个特征的重要性值,归一化后进行排序;
2)实验确定最佳阈值,依据特征重要性数值,保留对应阈值内的特征,得到一个新的特征集;
3)用新的特征集重复上述过程,直到剩下m个特征,m为提前设定的值,记为特征数据集M;
2.2相关性分析
利用Pearson相关系数计算特征集合A中的特征值与目标值之间相关性,筛选出与目标值具有强相关的特征集合N,
Person相关系数检测方法原理:
X、Y分别为独立变量,Con(X,Y)为变量X、Y的协方差,Var(X),Var(Y)分别为X、Y的方差,ρ则为变量X、Y的皮尔逊相关系数,相关系数是两个随机变量的协方差与其标准差之积的比值,是在协方差的基础上进行了标准化,及无量纲化,可以反映出两个随机变量是否线性相关,ρ的取值在-1与1之间,取值为1时,表示两个变量之间呈完全正相关关系;取值为-1时,表示两个变量之间呈完全负相关关系;取值为0时,表示两个变量之间线性无关;
2.3特征工程方法融合
皮尔逊相关系数法只对线性关系敏感,如果关系是非线性的,即便两个变量具有一一对应的关系,Pearson相关性也可能会接近0,随机森林方法可以获取非线性关系,但一旦某个特征被选择之后,其他的关联特征重要度往往较低,在理解数据时,这就会造成误解,导致错误的认为先被选中的特征是很重要的,而其余的特征是不重要的,但实际上这些特征对目标值的作用是非常接近的;本专利取特征集合U=M∪N,采用Pearson相关系数计算特征集合U中各个特征之间的相关性,若特征x1∈U,x2∈U且x1、x2具有较强相关性,则删除其中一个特征,由于随机森林方法对关联特征的评估不稳定容易造成重要特征的丢失,若x3∈M且与N中多个特征具有强线性关系,则删除x3,保留N中多个特征,经过调整后,最终获得特征集合U1,通过结合两种不同特征工程方法,确定最终特征,保证了特征选择的稳定性;
步骤三 神经网络建模和模型调优
构建神经网络需要考虑网络层数,输入层节点的数量,隐含层节点的数量,输出层节点的数量,每层输出函数的选择以及训练函数的选取;
(1)输入层节点的数量
由上述特征工程融合法获得爆破影响因素集合U1决定了输入层节点个数;
(2)输出层节点数
选取平均块度X50作为输出参数来反映爆破的效果;
(3)网络层数目、隐含层节点数目;
Nguyen等人提出具备1、2、3层隐含层的神经网络可以解决大部分的分类和回归问题,目前,还没有文章在岩石粒度分布预测中使用超过3层的隐藏层;
通过调整隐藏层中神经元的数量来实现提高网络的训练精度到目前为止还没有一个具体的标准和规定,所选的神经元数量太少会导致网络的学习能力差,隐含层神经元数太多,网络会收集大量无用的偶然信息,延长了网络的训练时间,发生过度拟合,选择隐函数神经元个数的多少需要依靠实验加理论支撑;
本专利提出了一种通过实验确定隐藏层的数目和网络层数的方法,首先确定网络的输入输出,然后利用MSE作为评价指标,选择使MSE最小的隐层个数和隐层节点数作为网络层个数,该过程使用了网格搜索方法;
(4)神经网络建模和模型调优
第一步:基于5折交叉验证使用数据增强的方法对网络1进行模型调优;
选择矿山实际获得的重要特征数据集U1和引入Hudaverdi etal建立的包含全球多地爆破信息的数据库的数据为U2中相同的特征作为输入1,将U1中属于输入1的特征数据集拆分为5个子集,轮流合并其中4个子集并结合引入的U2作为新的训练集,剩余的1个子集作为验证集,该过程重复5次,得到5组模型参数;
第二步:构建神经网络2
单独使用U1数据集,使用网络1的参数初始化网络2中和网络1相同的结构部分。U1中其他特征作为输入2并引入网络1参数对应的网络输出结果和输入2同时接入全链接层,使用网格搜索方法确定全链接层的节点数完成网络2的训练和预测;
步骤三 模型验证与评估
将本专利训练得到的模型参数保存,分别记作模型i(i={1,2,3,4,5}),相同矿山数据作为输入,利用训练好的模型,完成对矿山爆破块度的预测,具体预测过程:使用模型i得到预测结果i,将i个预测结果取平均,作为最终的预测值。
本专利对比现有技术有四个优点:
(1)现提出的预测方法都是针对单一的爆破区域提出的,每一个爆破区域由于爆破数据获取难度大,爆破试验经费高、次数少,都只能获取小样本数据来训练,使得模型容易过拟合,泛化能力差。本专利除了使用要进行预测的爆破区域的数据,还提出了引入多源数据来扩充数据集的思想,不仅节约爆破试验的周期和开销,还能解决小样本导致模型训练过拟合的问题。
(2)本专利以交叉验证为整体框架,在每一折交叉验证的过程中,仅对训练数据进行数据增强,验证集保持不变,使模型在更好地适应不同区域采集数据分布的特点的同时学习到了更多更充分的样本。提出的这种新型的数据增强方法,进一步提高了爆破块预测的准确性和可靠性。
(3)早期的预测方法大多采用Hudaverdi提出的爆破设计参数的比率作为数据集进行试验,或者是根据实验和专家经验总结出的部分爆破参数作为数据集来训练和验证模型,本专利在广泛获取各种爆破参数的前提下,利用特征工程,最大限度地从原始数据中提取重要特征以供算法和模型使用,减少了专家经验的影响,提高了模型对于不可见数据的准确性。
(4)本专利提出使用随机森林和皮尔逊相关系数相结合的方法进行特征筛选。皮尔逊相关系数方法只对线性关系敏感。随机森林可以解决特征与目标值的非线性特征排序,但它对关联特征进行重要性度量时常常不稳定。通过结合两种不同特征工程方法,保证了特征选择的稳定性。
说明书附图
图1是特征筛选封装图;
图2是神经网络简易搭建示意图;
图3是基于5折交叉验证的数据示意图;增强图;
图4是随机森林方法筛选特征示意图;
图5是皮尔逊相关系数与目标值关系示意图。
具体实施方式
下面通过实施案例对本发明作进一步详细说明。
参考图1、图2、图3、图4、图5;以太原铁矿为例,选用太原铁矿半年爆破数据作为原始数据集,该数据集中包括:深孔药量计算表,爆破通知单,爆破通知单包含设计爆破岩体量及单耗,露天采场现状CAD,爆破中孔块段图,工程地质数据,每次爆破后石堆表面图片4张;利用爆破领域的相关经验和数据清洗方法,从该数据中提取相关的爆破数据,将其分为三组:
第一组:爆破设计参数
表1爆破设计参数表
1首排孔抵抗线W:从中孔块段图中获取,为采样的孔到爆破台阶坡顶线的距离;
2排距也为最小抵抗线B:从爆破中孔块段图中获取,测量两排之间垂直的距离;
3炮孔直径D:排距小于6米的孔径都是140毫米;
4不计超钻部分的装药长度L:实际的孔深减去超深减去填塞长度;
6台阶高度H:为深孔药量计算表中的阶段高度;
7钻孔精度标准差e:根据统计选取0.47,一般为0.3-0.6之间;
8底盘抵抗线Wd:头排孔到清理后的台阶坡底的距离,从现状CAD图中测量获取;
9孔间间距S:两个水平孔之间的距离,从CAD图测量获取;
10堵塞长度T:即为余高,从深孔药量计算表中获取。
第二组岩石信息参数;
所有参数均来自于矿山工程地质及岩体力学试验。
第三组炸药信息参数,
参数 | Pf | Q | EZ |
最大值 | 0.8 | 666.67 | 100 |
最小值 | 0.59 | 29 | 100 |
1炸药单耗pf:单次爆破所耗炸药与爆破岩体体积之比;
2单孔装药量Q:块度取样位置附近孔位每孔装药量均值;
3炸药相对重要威力EZ:采用乳化炸药,取值为100;
虽然爆破块度与装药结构、炸药类型、起爆网络顺序等均有较大影响,但现场试验均采用耦合装药结构、孔外延期排间起爆网络,控制上述因素的影响;
输出:平均块度X50
矿石平均块度:获取方法为,每次爆破后将一个直径为18.5cm的球取出放在石堆上做参照,用无人机拍摄4-5张照片,用split软件处理图像,获取每一张图像的X50,求平均值作为此次爆破平均块度。
步骤2:爆破数据特征筛选
通过随机森林方法筛选出前10个特征,由图可以看出,分别是底盘抵抗线Wd,间距系数m其中m为=B/s,钻孔排间距S,不计超钻部分的装药长度L,最小抵抗线距B,首排抵抗线W,容重,台阶高度H,内摩擦角,单孔装药量Q;
通过皮尔逊相关系数筛选特征,由图可以看出分别为底盘抵抗线Wd,岩石系数A,堵塞长度T,泊松比,钻孔直径D,炸药单耗pf,钻孔排间距S,台阶高度H,最小抵抗线距B,首排抵抗线W;
通过对两种方法获取的特征求并集,得到的特征:爆破设计参数:底盘抵抗线Wd,最小抵抗线距B,首排抵抗线W,钻孔排间距S,台阶高度H,钻孔直径D,堵塞长度T,不计超钻部分的装药长度L,间距系数m其中m为=B/S;炸药信息参数:炸药单耗pf、单孔装药量Q;岩石信息参数:容重,岩石系数A,泊松比,内摩擦角。
使用皮尔逊相关系数方法分析特征之间的相关性;
摘取相关数值如下:
表1 L和其他特征相关度分析
特征 | B | D | H | S | X50 |
L | -0.51349 | -0.50158 | 0.670642 | -0.49248 | -0.02591 |
X50 | 0.116617 | 0.147234 | 0.124767 | 0.144439 | 1 |
;
由表可以看出不计超钻部分的装药长度L与钻孔直径D,台阶高度H,最小抵抗线距B,钻孔排间距S都具较强相关性,L是由随机森林方法提取出来的重要特征且排名靠前,但正是由于随机森林方法固有的缺点,当L这个特征选中之后,其他与之关联且对X50有重要影响的特征都会受到影响。B、D、H、S是综合考虑两种方法选择出来的比较重要的特征,所以删除L,留下其他特征。表中负号表示负相关。
容重和泊松比相关性分析值为0.66744,具有强相关性,可删除一个;
表2 Pf和其他特征相关度分析
由表2可知,Pf与B、D等相关度较高,且与X50的相关度相对于其他特征基本一致。综合分析,可以删除Pf,用其他特征来代替他的影响。
表3 Q和其他特征相关度分析
特征 | B | D | X50 |
Q | 0.925457 | 0.921724 | 0.083649 |
X50 | 0.116617 | 0.147234 | 1 |
Q与B、D具有强相关性,且在随机森林和皮尔逊两种特征筛选的方法中都排名靠后,所以可以删除Q的影响,用B、D来代替。
m=B/S,可以用B和S来代替,删除m。
经过处理,最终选定的能够代表爆破效果的重要特征为底盘抵抗线Wd,最小抵抗线距B钻孔排间距S,台阶高度H,钻孔直径D,堵塞长度T,抵抗线W,容重,岩石系数A。
表4提取9个特征后的MSE值比较
方法 | RF | 皮尔逊 | 融合 |
MSE值 | 130.9922 | 129.8426 | 126.143 |
。
由表4可以看出,选取融合后的9个特征要比RF的9个特征和皮尔逊相关系数法的的9个特征的MSE值要低,并且融合后的特征更全面,更加稳定,鲁棒性更强。
步骤三 神经网络建模
(1)网络输入输出参数的确定
为了更好的将Hudaverdi et al.建立的包含全球多地爆破信息的数据库引入到本专利的神经网络结构中,本专利将不同数据集的相同特征:台阶高度与抵抗线距之比H/B、钻孔排间距与抵抗线距之比S/B、抵抗线距与钻孔直径之比B/D、堵塞长度与抵抗线距之比T/B作为神经网络1的输入记为输入1,本专利采集的矿山数据集其余的特征记为输入2。通过相关文献和矿山爆破过程的研究,Hudaverdiet等建立的全球数据库中提到的原位岩石块度X是通过爆破前岩石立面图像分割计算、现场钻孔取样、设计院地勘资料共同决定而形成的一个表征现场待爆岩石的特征参数,在实际爆破中很难获取,所以删除了。
(2)网络层数目、隐含层节点数目
首先确定网络1的结构。改变层数和每层的节点数,从1、2层开始尝试,通过网格搜索法比较MSE值来确定神经网络的隐含层数和隐含层节点数。部分实验结果如表5所示:
表5不同隐藏层选取对比表
由表5的结果显示,本研究经过多次尝试,初步确定网络1结构为4-8-11-6-1。
网络2的结构是在网络1的基础上构建,加入一层全链接层,通过网格搜索法确定神经元个数。
(3)神经网络建模和模型调优
第一步:基于5折交叉验证使用数据增强的方法对网络1进行模型调优通过对比实地采集的数据集和要引入的Hudaverdi et al.建立的包含全球多地爆破信息的数据库的数据确定输入1,在本实例中,输入1包含H/B、S/B、B/D、T/B,输出为X50,将采集的数据不重复抽样拆分为5个子集,轮流合并其中4个子集作为训练集,剩余的1个子集作为验证集得到5组数据集。在每一组数据集中,将Hudaverdi et al,建立的包含全球多地爆破信息的数据库的数据放入训练集中帮助训练,但并不放入验证集,保证验证集是由矿山实地采集的数据组成,这样既防止过拟合又保证模型更加适合本地矿山,训练后,保留5组训练好的模型参数;
第二步:构建神经网络2
确定好网络1后,去掉输出层,将网络其他层的网络参数和结构均复制给网络2中和网络1相同的部分,将剩下的特征底盘抵抗线Wd、容重、岩石系数A、抵抗线W和网络1输出的结果作为输入,输出为X50,经过训练,获得完整的神经网络2,完成网络2的训练和预测;
步骤三 模型验证与评估
将本专利训练得到的模型参数保存,分别记作模型i(i={1,2,3,4,5}),同一矿山爆破数据作为输入,利用训练好的模型,完成对矿山爆破块度的预测,具体预测过程:使用模型i得到预测结果i,将i个预测结果取平均,作为最终的预测值。
为了验证本发明对数值预测的精度已经模型的泛化能力,用新获取的数据对本发明进行了多组数值预测仿真试验,并将结果与其他预测模型简单的进行了对比,反正结果如表6、7所示:
表6数值预测对比
爆破真实值 | 0.3442 | 0.4312 | 0.25665 | 0.4274 | 0.3437 | 0.2049 | 0.30235 |
网络预测值 | 0.3502 | 0.4525 | 0.24889 | 0.3988 | 0.325 | 0.2122 | 0.2858 |
。
由表可以看出经过神经网络预测的爆破效果的数值和真实数值的误差在10-3到10-2的范围中,误差比较小。
表7多种方法对比
实验方法 | MSE(%) |
本发明 | 8.56 |
BP神经网络 | 9.23 |
XGboost | 12.25 |
。
由表7可以看出本专利的方法更适合矿山上的爆破块度预测。表6、表7显示本专利的方法不仅保持较高精度的预测,而且具有较强的泛化能力,在矿山爆破这种小样本数据中能进行很好的预测且具有较强的移植性,可以满足多数场景下的数值预测。
Claims (1)
1.一种基于数据增强的爆破块度预测方法,其特征在于,包括以下步骤:
步骤一 获取爆破特征数据:原始数据采集,数据预处理,包括:数据清理、统计、校正得出原始爆破特征数据集A;
步骤二 爆破数据特征筛选
2.1 随机森林特征选择
2.2 皮尔逊相关系数法特征选择
2.3 特征工程方法融合
取特征集合U=MN,采用Pearson相关系数计算特征集合A中各个特征之间的相关性,若特征,且、具有较强线性相关性,则删除其中一个特征,由于随机森林方法对关联特征的评估不稳定容易造成重要特征的丢失,若且与N中多个特征具有强线性关系,则删除,保留N中多个特征,经过调整后,最终获得特征集合,不仅包含了与目标值具有线性和非线性关系的特征,还避免了单独使用随机森林方法造成的重要关联特征丢失;
步骤三 神经网络建模和模型调优
构建神经网络需要考虑网络层数,输入层节点的数量,隐含层节点的数量,输出层节点的数量,每层输出函数的选择以及训练函数的选取;
输入层节点的数量
(2)输出层节点数
选取平均块度X50作为输出层参数来反映爆破的效果;
(3)网络层数目、隐含层节点数目
选取神经网络的网络层数据和隐含节点数目还没有一个具体的规定,本专利在确定神经网络的输入、输出之后,利用MSE作为评价指标,选择使MSE最小的隐层个数和隐层节点数作为网络层个数,该过程使用了网格搜索方法;
(5)神经网络建模和模型调优
本专利神经网络的分为网络1和网络2的构建;
第一步:基于K折交叉验证使用数据增强的方法对网络1进行模型构建和调优;
记引入的特征数据集为,和获取的中的特征不可能保持完全一致;选择和中相同的特征作为输入1,采用k折交叉验证的方式,将中属于输入1的特征数据集划分为k份,轮流合并其中k-1份作为训练集,将与训练集合并,中剩下的一份作为验证集,重复该过程k遍,完成k个网络1的训练,保留网络参数;
第二步:构建神经网络2
步骤四 模型验证与评估;
将本专利训练得到的模型参数保存,相同矿山或地质结构的数据作为输入,利用训练好的模型,完成对矿山爆破块度的预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111077800.XA CN113868943B (zh) | 2021-09-15 | 2021-09-15 | 一种基于数据增强的神经网络的爆破块度预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111077800.XA CN113868943B (zh) | 2021-09-15 | 2021-09-15 | 一种基于数据增强的神经网络的爆破块度预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113868943A true CN113868943A (zh) | 2021-12-31 |
CN113868943B CN113868943B (zh) | 2024-06-25 |
Family
ID=78995833
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111077800.XA Active CN113868943B (zh) | 2021-09-15 | 2021-09-15 | 一种基于数据增强的神经网络的爆破块度预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113868943B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114881181A (zh) * | 2022-07-12 | 2022-08-09 | 南昌大学第一附属医院 | 基于大数据的特征加权选择方法、系统、介质及计算机 |
CN115017810A (zh) * | 2022-06-10 | 2022-09-06 | 上海应用技术大学 | 一种改进后的bp神经网络预测轴温等级的方法 |
WO2024050637A1 (en) * | 2022-09-07 | 2024-03-14 | Teck Resources Limited | Method and apparatus for drilling and blasting with fragmentation modeling |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EA201800031A1 (ru) * | 2017-08-21 | 2019-02-28 | Азимхан КУРМАНКОЖАЕВ | Способ квалиметрической подготовки геологических запасов твердого ископаемого по горизонтам рудника |
AU2020101854A4 (en) * | 2020-08-17 | 2020-09-24 | China Communications Construction Co., Ltd. | A method for predicting concrete durability based on data mining and artificial intelligence algorithm |
CN111985796A (zh) * | 2020-08-07 | 2020-11-24 | 华中科技大学 | 基于随机森林和智能算法预测混凝土结构耐久性的方法 |
CN113011094A (zh) * | 2021-03-19 | 2021-06-22 | 哈尔滨工业大学 | 混合gbdt和随机森林算法的土压平衡盾构机渣土改良方法 |
CN113340164A (zh) * | 2021-06-21 | 2021-09-03 | 中铁十九局集团矿业投资有限公司 | 一种对岩体爆破块度预测的方法 |
-
2021
- 2021-09-15 CN CN202111077800.XA patent/CN113868943B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EA201800031A1 (ru) * | 2017-08-21 | 2019-02-28 | Азимхан КУРМАНКОЖАЕВ | Способ квалиметрической подготовки геологических запасов твердого ископаемого по горизонтам рудника |
CN111985796A (zh) * | 2020-08-07 | 2020-11-24 | 华中科技大学 | 基于随机森林和智能算法预测混凝土结构耐久性的方法 |
AU2020101854A4 (en) * | 2020-08-17 | 2020-09-24 | China Communications Construction Co., Ltd. | A method for predicting concrete durability based on data mining and artificial intelligence algorithm |
CN113011094A (zh) * | 2021-03-19 | 2021-06-22 | 哈尔滨工业大学 | 混合gbdt和随机森林算法的土压平衡盾构机渣土改良方法 |
CN113340164A (zh) * | 2021-06-21 | 2021-09-03 | 中铁十九局集团矿业投资有限公司 | 一种对岩体爆破块度预测的方法 |
Non-Patent Citations (4)
Title |
---|
JINGPING QIU 等: "A Hybrid Artificial Intelligence Model for Predicting the Strength of Foam-Cemented Paste Backfill", IEEE ACCESS, vol. 8, 18 May 2020 (2020-05-18), pages 84569 - 84583, XP011788051, DOI: 10.1109/ACCESS.2020.2992595 * |
刘翔 等: "基于改进随机森林算法的岩石爆破块度预测", 矿业研究与开发, vol. 42, no. 7, 31 July 2022 (2022-07-31), pages 25 - 29 * |
吴贤国;王雷;邓婷婷;胡毅;袁福银;李铁军;: "基于随机森林的混凝土早期碳化预测", 土木工程与管理学报, no. 02, 15 April 2020 (2020-04-15), pages 17 - 22 * |
邵良杉;赵琳琳;: "露天采矿爆破振动对民房破坏的旋转森林预测模型", 中国安全科学学报, no. 02, 15 February 2013 (2013-02-15), pages 60 - 65 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115017810A (zh) * | 2022-06-10 | 2022-09-06 | 上海应用技术大学 | 一种改进后的bp神经网络预测轴温等级的方法 |
CN114881181A (zh) * | 2022-07-12 | 2022-08-09 | 南昌大学第一附属医院 | 基于大数据的特征加权选择方法、系统、介质及计算机 |
WO2024050637A1 (en) * | 2022-09-07 | 2024-03-14 | Teck Resources Limited | Method and apparatus for drilling and blasting with fragmentation modeling |
Also Published As
Publication number | Publication date |
---|---|
CN113868943B (zh) | 2024-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113868943A (zh) | 一种基于数据增强的神经网络的爆破块度预测方法 | |
Xu et al. | Deep learning of rock images for intelligent lithology identification | |
Chen et al. | Machine learning-based classification of rock discontinuity trace: SMOTE oversampling integrated with GBT ensemble learning | |
CN111783825B (zh) | 一种基于卷积神经网络学习的测井岩性识别方法 | |
CN113344050B (zh) | 一种基于深度学习的岩性智能化识别方法及系统 | |
CN108846526A (zh) | 一种二氧化碳排放量预测方法 | |
CN113011094B (zh) | 混合gbdt和随机森林算法的土压平衡盾构机渣土改良方法 | |
CN111639878B (zh) | 一种基于知识图谱构建的滑坡风险预测方法及系统 | |
CN108280289B (zh) | 基于局部加权c4.5算法的冲击地压危险等级预测方法 | |
CN111079783B (zh) | 一种基于多核集成学习识别地层岩性参数的方法 | |
CN117252236B (zh) | 一种基于dbn-lstm-bwoa的隧道爆破振动峰值预测方法、系统、设备及介质 | |
CN117272841B (zh) | 一种基于混合神经网络的页岩气甜点预测方法 | |
CN117272181A (zh) | 采用机器学习建模来判别锆石宿主岩石和成矿环境的方法 | |
CN114881480A (zh) | 一种煤层气开发区块评价优选方法及系统 | |
CN114117898B (zh) | 一种基于机器学习算法的随钻伽马测井正演方法 | |
CN117766068B (zh) | 基于锆石成分预测斑岩型矿床类型和储量的机器学习方法 | |
CN113705110A (zh) | 一种基于双重随机森林回归方法的爆破振动速度预测方法 | |
CN107729942A (zh) | 一种结构化视图缺失数据的分类方法 | |
CN110717618A (zh) | 基于多指标综合要素的海底热液硫化物资源评价预测方法 | |
CN113762394B (zh) | 一种爆破块度预测方法 | |
CN115545342A (zh) | 一种企业电费回收的风险预测方法与系统 | |
CN109614584B (zh) | 一种资源测井数据的重建方法 | |
Liu et al. | Classifying Rock Fragments Produced by Tunnel Boring Machine Using Optimized Convolutional Neural Network | |
Wang et al. | Auto recognition of carbonate microfacies based on an improved back propagation neural network | |
Lu et al. | A Novel Rock Drillability Characterization and Prediction Method Based on Drilling Big Data and Unsupervised Clustering Algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |