CN113868943A

CN113868943A - 一种基于数据增强的神经网络的爆破块度预测方法

Info

Publication number: CN113868943A
Application number: CN202111077800.XA
Authority: CN
Inventors: 王挥云; 于洋; 王继野; 彭飞; 赵鑫
Original assignee: China Railway 19th Bureau Group Mining Investment Co Ltd
Current assignee: China Railway 19th Bureau Group Mining Investment Co Ltd
Priority date: 2021-09-15
Filing date: 2021-09-15
Publication date: 2021-12-31
Anticipated expiration: 2041-09-15
Also published as: CN113868943B

Abstract

本发明公开了一种基于数据增强的神经网络的爆破块度预测方法，包括：采集某地区矿山爆破产生的数据；利用特征工程选择重要的爆破特征；建立神经网络模型；基于数据增强、参数优化方法建模和分析。本专利提出基于随机森林、皮尔逊相关系数相结合的方法进行特征筛选，该方法不仅保留了和目标值特性相关性较强的特征，而且克服了随机森林对关联特征重要性度量不稳定的缺点；采用数据增强的方法，在训练过程中以K折交叉验证为基本框架，每一折交叉验证的过程中，仅对训练数据进行数据增强，验证集保持不变，保证了模型学习更多更充分的样本，增强了模型的鲁棒性。本发明克进一步提高了爆破块预测的准确性和可靠性。

Description

一种基于数据增强的神经网络的爆破块度预测方法

技术领域

本发明涉及工程爆破技术领域，特别是一种基于数据增强的神经网络的爆破块度预测方法。

背景技术

爆破在矿上生产中的地位十分重要。其中爆破块度是定量评价爆破质量的重要指标,因此对岩体爆破块度的研究具有重要的实际意义。为了减少爆破施工的成本，增加爆破施工的成功率，利用机器学习方法预先预测出不同参数所产生的爆破块度范围，能有效降低矿山开采的成本，因此构建出具有较强泛化能力的预测模型是亟待解决的问题。

早期爆破块度模型的构建主要依靠现场爆破试验、经验公式总结、岩体力学模型计算等方法。上世纪30年代起，Rosin和Rammler等开始对爆破料堆块度预测问题进行现场调查与相关爆破数据研究，总结并提出了以Rosin-Rammler命名的半经验公式；Kuznetsov等以Rosin-Rammler半经验公式为基础，提出了Kuznetsov公式，Cunningham结合RosinRammler公式与Kuznetsov公式的特点，提出了能够较好预测爆破块度的KUZ-RAM模型，Kuz-Ram模型是第一个台阶爆破块度预测方程，是一个用于计算筛分曲线遵循RR函数的台阶爆破圆的平均碎片尺寸和均匀性指数n的方程。

相关文献表明，决定岩石块度大小的因素与块度之间的关系往往是多维、非线性的，有时难于用统一公式表述。随着计算机科学与人工智能技术的创新与发展，针对传统爆破料堆块度预测方法的不足，可通过机器学习方法进行建模分析，诸多研究人员也开发了基于机器学习建模爆破块度预测方法。美国的Kulatilake和土耳其Hudaverdi等首先提出采用人工神经元网络(ANN)方法预测岩石爆破中碎石的平均块度，对多种算法模型对比，证明了神经网络模型的可行性，但该模型存在网络结构及训练参数多、收敛速度慢、预测结果稳定性弱等不足。随着如SVM，随机森林等方法在预测矿山爆破块度的成功，越来越多的研究人员开始研究该领域。2018年Hasanipanah等成功的发了粒子群优化-自适应神经模糊推理系统ANFIS，Asl等开发了萤火虫算法FFA-ANN模型都是从优化神经网络参数方向上做出了改进，结果表明这些算法预测值与试验实测值比较接近，但依旧存在泛化能力差，过拟合的问题。

上述预测方法都是针对单一的爆破区域提出的，但每一个爆破区域爆破数据获取难度大，爆破试验经费高、次数少，获取数据成本高。并且，较少的数据集训练模型，容易产生过拟合，模型泛化能力差。为了解决以上问题，本专利充分利用了相关论文和公开的数据集，即有效地扩充数据集，也节约了爆破试验的周期和开销。为了提高模型泛化能力，以适应不同矿场的地质条件，保证模型预测的准确度，提出了针对不同矿场条件进行优化的训练方法。

发明内容

本发明提供了一种数据增强的神经网络的爆破块度预测方法，用以预测矿山的爆破块度，该方法能够克服小样本学习容易产生的过拟合的缺点，同时能更好地适应不同矿山场景。

为达到上述目的，本发明按照以下技术方案实施：

步骤1获取爆破数据

获取原始数据，通过数据预处理，数据清理、统计校正获得原始爆破数据集。

利用相关专业领域的经验，对采集的数据进行整理，得到目标区域的爆破特征数据集合A；

步骤二爆破特征筛选

2.1本专利利用随机森林方法对特征进行筛选，具体方法如下：

2.1.1特征重要性度量

1)对每一颗决策树，选择相应的袋外数据(out of bag，OOB)计算袋外数据误差，记为errOOB1；

2)随机对袋外数据OOB所有样本的特征X加入噪声干扰，再次计算袋外数据误差，记为errOOB2；

3)假设森林中有N棵树，则特征X的重要性记作：∑(errOOB2-errOOB1)/N；如果加入随机噪声后，袋外数据准确率大幅度下降，即errOOB2上升，说明这个特征对于样本的预测结果有很大影响，进而说明重要程度比较高；

2.2.2特征选择

1)根据特征重要性度量方法，计算每个特征的重要性值，归一化后进行排序；

2)实验确定最佳阈值，依据特征重要性数值，保留对应阈值内的特征，得到一个新的特征集；

3)用新的特征集重复上述过程，直到剩下m个特征，m为提前设定的值，记为特征数据集M；

2.2相关性分析

利用Pearson相关系数计算特征集合A中的特征值与目标值之间相关性，筛选出与目标值具有强相关的特征集合N，

Person相关系数检测方法原理：

Pearson相关系数一般用于研究变量之间的线性关系，其公式如下

X、Y分别为独立变量，Con(X，Y)为变量X、Y的协方差，Var(X)，Var(Y)分别为X、Y的方差，ρ则为变量X、Y的皮尔逊相关系数，相关系数是两个随机变量的协方差与其标准差之积的比值，是在协方差的基础上进行了标准化，及无量纲化，可以反映出两个随机变量是否线性相关，ρ的取值在-1与1之间，取值为1时，表示两个变量之间呈完全正相关关系；取值为-1时，表示两个变量之间呈完全负相关关系；取值为0时，表示两个变量之间线性无关；

2.3特征工程方法融合

皮尔逊相关系数法只对线性关系敏感，如果关系是非线性的，即便两个变量具有一一对应的关系，Pearson相关性也可能会接近0，随机森林方法可以获取非线性关系，但一旦某个特征被选择之后，其他的关联特征重要度往往较低，在理解数据时，这就会造成误解，导致错误的认为先被选中的特征是很重要的，而其余的特征是不重要的，但实际上这些特征对目标值的作用是非常接近的；本专利取特征集合U＝M∪N，采用Pearson相关系数计算特征集合U中各个特征之间的相关性，若特征x₁∈U,x₂∈U且x₁、x₂具有较强相关性，则删除其中一个特征，由于随机森林方法对关联特征的评估不稳定容易造成重要特征的丢失，若x₃∈M且与N中多个特征具有强线性关系，则删除x₃，保留N中多个特征，经过调整后，最终获得特征集合U¹，通过结合两种不同特征工程方法，确定最终特征，保证了特征选择的稳定性；

步骤三神经网络建模和模型调优

构建神经网络需要考虑网络层数，输入层节点的数量，隐含层节点的数量，输出层节点的数量，每层输出函数的选择以及训练函数的选取；

(1)输入层节点的数量

由上述特征工程融合法获得爆破影响因素集合U¹决定了输入层节点个数；

(2)输出层节点数

选取平均块度X50作为输出参数来反映爆破的效果；

(3)网络层数目、隐含层节点数目；

Nguyen等人提出具备1、2、3层隐含层的神经网络可以解决大部分的分类和回归问题，目前，还没有文章在岩石粒度分布预测中使用超过3层的隐藏层；

通过调整隐藏层中神经元的数量来实现提高网络的训练精度到目前为止还没有一个具体的标准和规定，所选的神经元数量太少会导致网络的学习能力差，隐含层神经元数太多，网络会收集大量无用的偶然信息，延长了网络的训练时间，发生过度拟合，选择隐函数神经元个数的多少需要依靠实验加理论支撑；

本专利提出了一种通过实验确定隐藏层的数目和网络层数的方法，首先确定网络的输入输出，然后利用MSE作为评价指标，选择使MSE最小的隐层个数和隐层节点数作为网络层个数，该过程使用了网格搜索方法；

(4)神经网络建模和模型调优

第一步：基于5折交叉验证使用数据增强的方法对网络1进行模型调优；

选择矿山实际获得的重要特征数据集U¹和引入Hudaverdi etal建立的包含全球多地爆破信息的数据库的数据为U²中相同的特征作为输入1，将U¹中属于输入1的特征数据集拆分为5个子集，轮流合并其中4个子集并结合引入的U²作为新的训练集，剩余的1个子集作为验证集，该过程重复5次，得到5组模型参数；

第二步：构建神经网络2

单独使用U¹数据集，使用网络1的参数初始化网络2中和网络1相同的结构部分。U¹中其他特征作为输入2并引入网络1参数对应的网络输出结果和输入2同时接入全链接层，使用网格搜索方法确定全链接层的节点数完成网络2的训练和预测；

步骤三模型验证与评估

将本专利训练得到的模型参数保存，分别记作模型i(i＝{1，2，3，4，5})，相同矿山数据作为输入，利用训练好的模型，完成对矿山爆破块度的预测，具体预测过程：使用模型i得到预测结果i，将i个预测结果取平均，作为最终的预测值。

本专利对比现有技术有四个优点：

(1)现提出的预测方法都是针对单一的爆破区域提出的，每一个爆破区域由于爆破数据获取难度大，爆破试验经费高、次数少，都只能获取小样本数据来训练，使得模型容易过拟合，泛化能力差。本专利除了使用要进行预测的爆破区域的数据，还提出了引入多源数据来扩充数据集的思想，不仅节约爆破试验的周期和开销，还能解决小样本导致模型训练过拟合的问题。

(2)本专利以交叉验证为整体框架，在每一折交叉验证的过程中，仅对训练数据进行数据增强，验证集保持不变，使模型在更好地适应不同区域采集数据分布的特点的同时学习到了更多更充分的样本。提出的这种新型的数据增强方法，进一步提高了爆破块预测的准确性和可靠性。

(3)早期的预测方法大多采用Hudaverdi提出的爆破设计参数的比率作为数据集进行试验，或者是根据实验和专家经验总结出的部分爆破参数作为数据集来训练和验证模型，本专利在广泛获取各种爆破参数的前提下，利用特征工程，最大限度地从原始数据中提取重要特征以供算法和模型使用，减少了专家经验的影响，提高了模型对于不可见数据的准确性。

(4)本专利提出使用随机森林和皮尔逊相关系数相结合的方法进行特征筛选。皮尔逊相关系数方法只对线性关系敏感。随机森林可以解决特征与目标值的非线性特征排序，但它对关联特征进行重要性度量时常常不稳定。通过结合两种不同特征工程方法，保证了特征选择的稳定性。

说明书附图

图1是特征筛选封装图；

图2是神经网络简易搭建示意图；

图3是基于5折交叉验证的数据示意图；增强图；

图4是随机森林方法筛选特征示意图；

图5是皮尔逊相关系数与目标值关系示意图。

具体实施方式

下面通过实施案例对本发明作进一步详细说明。

参考图1、图2、图3、图4、图5；以太原铁矿为例，选用太原铁矿半年爆破数据作为原始数据集，该数据集中包括：深孔药量计算表，爆破通知单，爆破通知单包含设计爆破岩体量及单耗，露天采场现状CAD，爆破中孔块段图，工程地质数据，每次爆破后石堆表面图片4张；利用爆破领域的相关经验和数据清洗方法，从该数据中提取相关的爆破数据，将其分为三组：

第一组：爆破设计参数

表1爆破设计参数表

1首排孔抵抗线W：从中孔块段图中获取，为采样的孔到爆破台阶坡顶线的距离；

2排距也为最小抵抗线B：从爆破中孔块段图中获取，测量两排之间垂直的距离；

3炮孔直径D：排距小于6米的孔径都是140毫米；

4不计超钻部分的装药长度L：实际的孔深减去超深减去填塞长度；

5间距系数m：m为

即

6台阶高度H：为深孔药量计算表中的阶段高度；

7钻孔精度标准差e：根据统计选取0.47，一般为0.3-0.6之间；

8底盘抵抗线Wd：头排孔到清理后的台阶坡底的距离，从现状CAD图中测量获取；

9孔间间距S：两个水平孔之间的距离，从CAD图测量获取；

10堵塞长度T：即为余高，从深孔药量计算表中获取。

第二组岩石信息参数；

所有参数均来自于矿山工程地质及岩体力学试验。

第三组炸药信息参数，

参数	Pf	Q	EZ
				最大值	0.8	666.67	100
最小值	0.59	29	100

1炸药单耗pf：单次爆破所耗炸药与爆破岩体体积之比；

2单孔装药量Q：块度取样位置附近孔位每孔装药量均值；

3炸药相对重要威力EZ：采用乳化炸药，取值为100；

虽然爆破块度与装药结构、炸药类型、起爆网络顺序等均有较大影响，但现场试验均采用耦合装药结构、孔外延期排间起爆网络，控制上述因素的影响；

输出：平均块度X50

矿石平均块度：获取方法为，每次爆破后将一个直径为18.5cm的球取出放在石堆上做参照，用无人机拍摄4-5张照片，用split软件处理图像，获取每一张图像的X50，求平均值作为此次爆破平均块度。

步骤2:爆破数据特征筛选

通过随机森林方法筛选出前10个特征，由图可以看出，分别是底盘抵抗线Wd，间距系数m其中m为＝B/s，钻孔排间距S，不计超钻部分的装药长度L，最小抵抗线距B，首排抵抗线W，容重，台阶高度H，内摩擦角，单孔装药量Q；

通过皮尔逊相关系数筛选特征，由图可以看出分别为底盘抵抗线Wd，岩石系数A，堵塞长度T，泊松比，钻孔直径D，炸药单耗pf，钻孔排间距S，台阶高度H，最小抵抗线距B，首排抵抗线W；

通过对两种方法获取的特征求并集，得到的特征：爆破设计参数：底盘抵抗线Wd,最小抵抗线距B，首排抵抗线W，钻孔排间距S，台阶高度H，钻孔直径D，堵塞长度T，不计超钻部分的装药长度L，间距系数m其中m为＝B/S；炸药信息参数：炸药单耗pf、单孔装药量Q；岩石信息参数：容重，岩石系数A，泊松比，内摩擦角。

使用皮尔逊相关系数方法分析特征之间的相关性；

摘取相关数值如下：

表1 L和其他特征相关度分析

特征	B	D	H	S	X50
						L	-0.51349	-0.50158	0.670642	-0.49248	-0.02591
X50	0.116617	0.147234	0.124767	0.144439	1

；

由表可以看出不计超钻部分的装药长度L与钻孔直径D，台阶高度H，最小抵抗线距B，钻孔排间距S都具较强相关性，L是由随机森林方法提取出来的重要特征且排名靠前，但正是由于随机森林方法固有的缺点，当L这个特征选中之后，其他与之关联且对X50有重要影响的特征都会受到影响。B、D、H、S是综合考虑两种方法选择出来的比较重要的特征，所以删除L，留下其他特征。表中负号表示负相关。

容重和泊松比相关性分析值为0.66744，具有强相关性，可删除一个；

表2 Pf和其他特征相关度分析

由表2可知，Pf与B、D等相关度较高，且与X50的相关度相对于其他特征基本一致。综合分析，可以删除Pf，用其他特征来代替他的影响。

表3 Q和其他特征相关度分析

特征	B	D	X50
				Q	0.925457	0.921724	0.083649
X50	0.116617	0.147234	1

Q与B、D具有强相关性，且在随机森林和皮尔逊两种特征筛选的方法中都排名靠后，所以可以删除Q的影响，用B、D来代替。

m＝B/S，可以用B和S来代替，删除m。

经过处理，最终选定的能够代表爆破效果的重要特征为底盘抵抗线Wd,最小抵抗线距B钻孔排间距S，台阶高度H，钻孔直径D，堵塞长度T，抵抗线W，容重，岩石系数A。

表4提取9个特征后的MSE值比较

方法	RF	皮尔逊	融合
				MSE值	130.9922	129.8426	126.143

。

由表4可以看出，选取融合后的9个特征要比RF的9个特征和皮尔逊相关系数法的的9个特征的MSE值要低，并且融合后的特征更全面，更加稳定，鲁棒性更强。

步骤三神经网络建模

(1)网络输入输出参数的确定

为了更好的将Hudaverdi et al.建立的包含全球多地爆破信息的数据库引入到本专利的神经网络结构中，本专利将不同数据集的相同特征：台阶高度与抵抗线距之比H/B、钻孔排间距与抵抗线距之比S/B、抵抗线距与钻孔直径之比B/D、堵塞长度与抵抗线距之比T/B作为神经网络1的输入记为输入1，本专利采集的矿山数据集其余的特征记为输入2。通过相关文献和矿山爆破过程的研究，Hudaverdiet等建立的全球数据库中提到的原位岩石块度X是通过爆破前岩石立面图像分割计算、现场钻孔取样、设计院地勘资料共同决定而形成的一个表征现场待爆岩石的特征参数，在实际爆破中很难获取，所以删除了。

(2)网络层数目、隐含层节点数目

首先确定网络1的结构。改变层数和每层的节点数，从1、2层开始尝试，通过网格搜索法比较MSE值来确定神经网络的隐含层数和隐含层节点数。部分实验结果如表5所示：

表5不同隐藏层选取对比表

由表5的结果显示，本研究经过多次尝试，初步确定网络1结构为4-8-11-6-1。

网络2的结构是在网络1的基础上构建，加入一层全链接层，通过网格搜索法确定神经元个数。

(3)神经网络建模和模型调优

第一步：基于5折交叉验证使用数据增强的方法对网络1进行模型调优通过对比实地采集的数据集和要引入的Hudaverdi et al.建立的包含全球多地爆破信息的数据库的数据确定输入1，在本实例中，输入1包含H/B、S/B、B/D、T/B，输出为X50，将采集的数据不重复抽样拆分为5个子集，轮流合并其中4个子集作为训练集，剩余的1个子集作为验证集得到5组数据集。在每一组数据集中，将Hudaverdi et al，建立的包含全球多地爆破信息的数据库的数据放入训练集中帮助训练，但并不放入验证集，保证验证集是由矿山实地采集的数据组成，这样既防止过拟合又保证模型更加适合本地矿山，训练后，保留5组训练好的模型参数；

第二步：构建神经网络2

确定好网络1后，去掉输出层，将网络其他层的网络参数和结构均复制给网络2中和网络1相同的部分，将剩下的特征底盘抵抗线Wd、容重、岩石系数A、抵抗线W和网络1输出的结果作为输入，输出为X50，经过训练，获得完整的神经网络2，完成网络2的训练和预测；

步骤三模型验证与评估

将本专利训练得到的模型参数保存，分别记作模型i(i＝{1，2，3，4，5})，同一矿山爆破数据作为输入，利用训练好的模型，完成对矿山爆破块度的预测，具体预测过程：使用模型i得到预测结果i，将i个预测结果取平均，作为最终的预测值。

为了验证本发明对数值预测的精度已经模型的泛化能力，用新获取的数据对本发明进行了多组数值预测仿真试验，并将结果与其他预测模型简单的进行了对比，反正结果如表6、7所示：

表6数值预测对比

爆破真实值	0.3442	0.4312	0.25665	0.4274	0.3437	0.2049	0.30235
								网络预测值	0.3502	0.4525	0.24889	0.3988	0.325	0.2122	0.2858

。

由表可以看出经过神经网络预测的爆破效果的数值和真实数值的误差在10^-3到10^-2的范围中，误差比较小。

表7多种方法对比

实验方法	MSE(％)
		本发明	8.56
BP神经网络	9.23
		XGboost	12.25

。

由表7可以看出本专利的方法更适合矿山上的爆破块度预测。表6、表7显示本专利的方法不仅保持较高精度的预测，而且具有较强的泛化能力，在矿山爆破这种小样本数据中能进行很好的预测且具有较强的移植性，可以满足多数场景下的数值预测。