CN117669393B - 一种爆破块度不确定性预测方法及系统 - Google Patents
一种爆破块度不确定性预测方法及系统 Download PDFInfo
- Publication number
- CN117669393B CN117669393B CN202410142982.1A CN202410142982A CN117669393B CN 117669393 B CN117669393 B CN 117669393B CN 202410142982 A CN202410142982 A CN 202410142982A CN 117669393 B CN117669393 B CN 117669393B
- Authority
- CN
- China
- Prior art keywords
- model
- prediction
- blasting
- super
- block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005422 blasting Methods 0.000 title claims abstract description 187
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000013461 design Methods 0.000 claims abstract description 35
- 230000000694 effects Effects 0.000 claims abstract description 23
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 19
- 230000002068 genetic effect Effects 0.000 claims abstract description 18
- 238000010219 correlation analysis Methods 0.000 claims abstract description 12
- 238000012549 training Methods 0.000 claims description 28
- 238000005457 optimization Methods 0.000 claims description 20
- 238000007781 pre-processing Methods 0.000 claims description 15
- 230000002159 abnormal effect Effects 0.000 claims description 12
- 238000002790 cross-validation Methods 0.000 claims description 12
- 238000009826 distribution Methods 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 10
- 230000008030 elimination Effects 0.000 claims description 9
- 238000003379 elimination reaction Methods 0.000 claims description 9
- 238000012795 verification Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 26
- 238000011156 evaluation Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 108090000672 Annexin A5 Proteins 0.000 description 4
- 239000002360 explosive Substances 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000035772 mutation Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 239000011435 rock Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 208000025174 PANDAS Diseases 0.000 description 1
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种爆破块度不确定性预测方法及系统,涉及爆破工程技术领域,包括:获得爆破块度案例数据库;对爆破设计参数和爆破块度进行相关性分析,确定预测模型输入变量;将LightGBM模型设置为预测模型;通过引入分位数损失函数,生成预测模型的模型预测区间;使用遗传算法(GA)对预测模型的超参数进行寻优,获得寻优超参数;获得训练完成的GA‑QLightGBM模型;根据预测模型输入变量,获得预测样本数据;将预测样本数据输入GA‑QLightGBM模型,获得预测值。本发明解决了现有技术中常规模型不确定性对爆破块度预测造成误差的技术问题,达到了有效量化爆破块度预测不确定性的技术效果。
Description
技术领域
本发明涉及爆破工程技术领域,具体涉及一种爆破块度不确定性预测方法及系统。
背景技术
爆破技术是一种利用爆炸过程中炸药产生的巨大能量使围岩及其他原始结构产生变形、破坏和抛掷作用,来完成工程目的的工程技术。其中,爆破后碎块的大小对后续工程具有较大影响,准确预测爆破块度并对其可能范围进行合理控制至关重要。常规机器学习模型回归拟合的安全系数是一个定值,由于爆破块度各影响因素自身存在变异性、不确定性,对计算结果的影响较大,无法准确预测爆破块度。现有技术存在常规模型不确定性对爆破块度预测造成误差的技术问题。
发明内容
本申请通过提供一种爆破块度不确定性预测方法及系统,有效解决了现有技术中存在的常规模型不确定性对爆破块度预测造成误差的技术问题,达到了通过设置不同的分位数直接构建爆破块度的预测区间,有效量化爆破块度预测不确定性的技术效果。
本申请提供了一种爆破块度不确定性预测方法及系统,所述技术方案如下:
第一方面,本申请实施例提供了一种爆破块度不确定性预测方法,所述方法包括:
根据爆破设计参数和爆破块度采集爆破块度案例数据,构建历史爆破块度案例数据库;
对所述历史爆破块度案例数据库进行预处理,获得爆破块度案例数据库;
对所述爆破设计参数和所述爆破块度进行相关性分析,确定预测模型输入变量;
将LightGBM模型设置为预测模型;
根据分位数损失函数,生成所述预测模型的模型预测区间;
设置所述预测模型的区间预测超参数寻优目标为最小化分位数损失,设置所述预测模型的点预测超参数寻优目标为最大化R2,结合遗传算法和嵌套5折交叉验证对所述预测模型的超参数进行寻优,获得寻优超参数;
基于所述寻优超参数,根据所述爆破块度案例数据库对所述预测模型进行训练,获得训练完成的GA-QLightGBM模型;
根据所述预测模型输入变量,获得预测样本数据;
将所述预测样本数据输入所述GA-QLightGBM模型,获得预测值,其中,所述预测值包括、/>和/>,/>为所述GA-QLightGBM模型输出的爆破块度点预测值,/>为所述GA-QLightGBM模型输出的爆破块度预测区间上限,/>为所述GA-QLightGBM模型输出的爆破块度预测区间下限。
第二方面,本申请实施例提供了一种爆破块度不确定性预测系统,所述系统包括:
历史爆破块度案例数据库构建模块,所述历史爆破块度案例数据库构建模块用于根据爆破设计参数和爆破块度采集爆破块度案例数据;
爆破块度案例数据库获得模块,所述爆破块度案例数据库获得模块用于对所述历史爆破块度案例数据库进行预处理,获得爆破块度案例数据库;
预测模型输入变量确定模块,所述预测模型输入变量确定模块用于对所述爆破设计参数和所述爆破块度进行相关性分析,确定预测模型输入变量;
预测模型设置模块,所述预测模型设置模块用于将LightGBM模型设置为预测模型;
模型预测区间生成模块,所述模型预测区间生成模块用于根据分位数损失函数,生成所述预测模型的模型预测区间;
寻优超参数获得模块,所述寻优超参数获得模块用于设置所述预测模型的区间预测超参数寻优目标为最小化分位数损失,设置所述预测模型的点预测超参数寻优目标为最大化R2,结合遗传算法和嵌套5折交叉验证对所述预测模型的超参数进行寻优,获得寻优超参数;
GA-QLightGBM模型获得模块,所述GA-QLightGBM模型获得模块用于基于所述寻优超参数,根据所述爆破块度案例数据库对所述预测模型进行训练,获得训练完成的GA-QLightGBM模型;
预测样本数据获得模块,所述预测样本数据获得模块用于根据所述预测模型输入变量,获得预测样本数据;
预测值获得模块,所述预测值获得模块用于将所述预测样本数据输入所述GA-QLightGBM模型,获得预测值,其中,所述预测值包括、/>和/>,/>为所述GA-QLightGBM模型输出的爆破块度点预测值,/>为所述GA-QLightGBM模型输出的爆破块度预测区间上限,/>为所述GA-QLightGBM模型输出的爆破块度预测区间下限。
本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
本申请首先根据爆破设计参数和爆破块度采集爆破块度案例数据,构建历史爆破块度案例数据库,然后对所述历史爆破块度案例数据库进行预处理,获得爆破块度案例数据库,再对所述爆破设计参数和所述爆破块度进行相关性分析,确定预测模型输入变量。进而将LightGBM模型设置为预测模型,根据分位数损失函数,生成所述预测模型的模型预测区间,设置所述预测模型的区间预测超参数寻优目标为最小化分位数损失,设置所述预测模型的点预测超参数寻优目标为最大化R2,结合遗传算法和嵌套5折交叉验证对所述预测模型的超参数进行寻优,获得寻优超参数。继而基于所述寻优超参数,根据所述爆破块度案例数据库对所述预测模型进行训练,获得训练完成的GA-QLightGBM模型。再根据所述预测模型输入变量,获得预测样本数据,最后将所述预测样本数据输入所述GA-QLightGBM模型,获得预测值,其中,所述预测值包括、/>和/>,/>为所述GA-QLightGBM模型输出的爆破块度点预测值,/>为所述GA-QLightGBM模型输出的爆破块度预测区间上限,/>为所述GA-QLightGBM模型输出的爆破块度预测区间下限。有效解决了现有技术中存在的常规模型不确定性对爆破块度预测造成误差的技术问题,达到了通过设置不同的分位数直接构建爆破块度的预测区间,有效量化爆破块度预测不确定性的技术效果。
附图说明
图1为本申请实施例提供的一种爆破块度不确定性预测方法流程示意图;
图2为本发明实施例的数据样本相关性分析图;
图3为本发明实施例的超参数寻优嵌套5折交叉验证图;
图4为本发明实施例的GA优化迭代图;
图5为本申请实施例提供的一种爆破块度不确定性预测系统结构示意图;
图中:1-历史爆破块度案例数据库构建模块、2-爆破块度案例数据库获得模块、3-预测模型输入变量确定模块、4-预测模型设置模块、5-模型预测区间生成模块、6-寻优超参数获得模块、7-GA-QLightGBM模型获得模块、8-预测样本数据获得模块、9-预测值获得模块。
具体实施方式
本申请通过提供了一种爆破块度不确定性预测方法及系统,用于针对解决现有技术中存在的常规模型不确定性对爆破块度预测造成误差的技术问题。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整的描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块。
实施例1:如图1所示,本发明提供了一种爆破块度不确定性预测方法,用于通过设置不同的分位数直接构建爆破块度的预测区间,有效量化爆破块度预测的不确定性,为决策者对爆破参数优化提供有效信息,所述方法包括:
根据爆破设计参数和爆破块度采集爆破块度案例数据,构建历史爆破块度案例数据库,其中,所述爆破设计参数是爆破工程中用于描述特定爆破设计和施工的参数,包括孔间间距与排间间距之比(S/B)、炮孔孔深与排间间距之比(H/B)、排间间距与炮孔直径之比(B/D)、炮孔堵塞长度与排间间距之比(T/B)、炸药单耗(Pf)、现场原位岩石块度(XB)、弹性模量(E);所述爆破块度(X50)是指爆破后岩块的尺寸和形状,用于评价爆破效果。通过采用已有的研究成果数据,和/或在实际现场收集爆破设计参数和爆破块度数据,构建历史爆破块度案例数据库。
构建完历史爆破块度案例数据库后,对所述历史爆破块度案例数据库进行预处理,包括数据清洗、数据转换、特征选择、数据分组、数据格式化等,进而获得爆破块度案例数据库。
接下来对所述爆破设计参数和所述爆破块度进行相关性分析,通过计算相关系数、卡方检验、回归分析等方法分析爆破设计参数与爆破块度之间的相关性,通过相关性分析,筛选出对爆破块度影响较大的因素,根据分析结果,将与爆破块度相关性较高的参数作为预测模型的输入变量。
将LightGBM模型设置为预测模型,所述LightGBM模型是一个高效、快速、分布式梯度提升框架,用于处理大规模数据并应用于多种机器学习任务。将LightGBM库和其他必要的库导入,例如NumPy、Pandas等,用于后续进行数据处理和模型训练。
根据分位数损失函数,生成所述预测模型的模型预测区间,所述分位数损失函数是一种用于衡量预测结果与真实值之间差异的损失函数,其值越小表示预测结果越准确,包括平均绝对误差(MAE)、均方误差(MSE)和均方根误差(RMSE)等,根据预测模型,对每个样本进行预测,并计算预测结果与真实值之间的分位数损失函数的值,根据分位数损失函数的值,确定预测区间的范围,例如,对于一个给定的分位数损失函数值,可以计算出对应的置信水平,从而得到预测区间的上下限,最后通过表格或图形的形式将计算得到的预测区间输出。
设置所述预测模型的区间预测超参数寻优目标为最小化分位数损失,设置所述预测模型的点预测超参数寻优目标为最大化R2,就是预测模型的超参数包括区间预测超参数和点预测超参数,超参数包括学习率、树的最大深度、特征选择方法等。为了评估每个超参数组合的性能,构建两个适应度函数,对于区间预测,使用分位数损失函数作为适应度函数,所述分位数损失函数为:
;
其中,为分位数损失函数,/>为预测模型的预测值,/>为数据样本标签,/>为分位数;对于点预测,使用R2指标作为适应度函数,点预测超参数寻优目标最大化R2是指使用中位数回归模型设置不同超参数迭代出最大的R2,其中/>,/>为数据样本标签的平均值,即真实观测值的平均值。
结合遗传算法和嵌套5折交叉验证对所述预测模型的超参数进行寻优,获得寻优超参数。遗传算法(GA)是一种借鉴生物界自然选择和进化机制发展起来的高度并行、随机、自适应的全局优化概率搜索算法,它模拟了自然选择和遗传中发生的选择、交叉和变异等现象,先产生初始种群,通过选择、交叉和变异操作,产生一群更适合环境的个体,经过逐代进化,使种群最后收敛到一群最适合环境的个体,求得问题的最优解。遗传算法优化LightGBM模型在搜索超参数空间时具有全局搜索能力,有助于找到更优的模型配置,进而提高GA-QLightGBM爆破块度预测模型的性能和泛化能力,从而在实际应用中获得更好的预测准确性和效果。首先使用随机方法初始化种群,生成一组随机的超参数组合,然后使用遗传算法对种群进行优化,通过选择、交叉和变异等操作,不断迭代种群,逐步提高适应度函数的值,在每次迭代过程中,将种群中的每个超参数组合分别带入到嵌套5折交叉验证中,在每个交叉验证中,根据适应度函数的值对每个超参数组合进行评估和选择,再根据嵌套5折交叉验证的结果,选择适应度较高的超参数组合作为新的种群,并更新种群,最后根据预设的终止条件(例如达到最大迭代次数或适应度达到预设阈值),停止迭代并输出最优的超参数组合。
基于所述寻优超参数,根据所述爆破块度案例数据库对所述预测模型进行训练,从存储系统中加载爆破块度案例数据库对LightGBM模型进行训练,训练过程中,使用遗传算法对超参数进行寻优,并使用嵌套5折交叉验证评估模型的性能,训练完成后,得到GA-QLightGBM模型(结合了遗传算法GA和LightGBM模型的集成学习算法),使用测试集对GA-QLightGBM模型进行评估,计算区间预测的分位数损失函数值和点预测的R2值等评价指标,判断模型的性能,根据评估结果,对GA-QLightGBM模型进行优化,例如调整超参数、增加特征等,以提高模型的性能。
根据所述预测模型输入变量,获得预测样本数据,即根据上述确定的输入变量,准备相应的预测样本数据,这些预测样本数据是经过预处理和赋值后的数据,将所述预测样本数据输入所述GA-QLightGBM模型,在GA-QLightGBM模型中,输入变量作为模型的输入,经过训练后的模型根据这些输入变量进行预测,预测结果以预测值的形式输出,其中,所述预测值包括、/>和/>,/>为所述GA-QLightGBM模型输出的爆破块度点预测值,/>为所述GA-QLightGBM模型输出的爆破块度预测区间上限,/>为所述GA-QLightGBM模型输出的爆破块度预测区间下限。达到了通过设置不同的分位数直接构建爆破块度的预测区间,有效量化爆破块度预测不确定性的技术效果。
在本申请实施例提供的一种优选实施方式中,对所述历史爆破块度案例数据库进行预处理,包括:
获得多维预处理指标,其中,所述多维预处理指标包括重复数据剔除、缺失数据剔除和异常数据剔除。重复数据是指因重复收集,导致重复存在的数据样本;缺失数据是指数据样本存在因现场无法获得或统计遗漏的参数;异常数据是指数据样本存在因主观统计错误或现场统计客观存在异常的参数,一般为根据经验不可能存在的数据,包括炸药单耗非正数或爆破块度非正数等。
重复数据的剔除方法是确定每条数据记录的唯一标识符,例如时间戳、ID等,使用确定的标识符,对数据库中的数据进行检测,找出重复的数据记录,将重复的数据记录进行删除或合并,确保数据库中只包含唯一的数据记录。缺失数据的剔除方法是检查数据库中的每一条数据记录,找出存在缺失数据的位置,根据实际情况,选择方法对缺失数据进行填补,例如使用平均值、中位数、众数等统计方法,或使用前一个或后一个有效数据进行填补,如果缺失数据无法进行有效的填补,则将包含缺失数据的整个数据记录进行删除。异常数据的剔除方法是根据数据的特征和实际情况,制定判断异常数据的标准和范围,例如,根据统计学上的3σ原则或基于经验公式等方法确定异常数据的判断标准,使用确定的判断标准,对数据库中的数据进行检测,找出异常的数据记录,将异常的数据记录进行删除,确保数据库中只包含有效和可靠的数据记录。经过重复数据剔除、缺失数据剔除和异常数据剔除等步骤后,生成爆破块度案例数据库,该数据库如表1所示,其中爆破设计参数为数据样本特征,爆破块度为数据样本标签,数据库中的数据80%划分为预测模型的训练集,20%划分为预测模型的测试集。这一优选实施方式通过去除重复数据、填补缺失数据、修正异常数据,使得数据分析更加准确和可靠,达到了提高数据质量的技术效果。
表1 爆破块度案例数据库
在本申请实施例提供的另一种优选实施方式中,对所述爆破设计参数和所述爆破块度进行相关性分析,确定预测模型输入变量,包括:
计算各爆破设计参数间的Pearson相关系数,所述Pearson相关系数是一种衡量两个变量之间线性相关程度的统计量,Pearson相关系数计算公式为,式中,E(·)表示期望,A、B为数据样本两组不同的爆破设计参数特征,Pearson相关系数正负分别表示正相关和负相关,绝对值大小表示相关性大小,表示特征间无相关性,/>表示特征间呈弱相关性,表示特征间相关性良好,/>表示特征间呈强相关性。
统计所述爆破块度案例数据库内的爆破设计数据属性分布,统计数据集中爆破设计数据属性(特征和标签)的分布情况,检查属性的独立性,是指对数据集中的各个属性(特征和标签)进行统计,了解每个属性的取值范围、频数分布、缺失值情况等,并评估它们之间是否存在相关性或依赖关系,分别统计不小于和小于分界点的样本数据标签在各爆破设计参数特征分布情况。如图2所示,建立核密度估计图,图中对角线部分的核密度估计图为对应属性的密度估计,根据矩阵上三角部分可以更直观的通过相关系数R得到8个属性(7个特征和1个标签)的两两之间相关性。从相关系数R可以看出,炸药单耗(Pf)和排间间距与炮孔直径之比(B/D)之间呈弱相关性,其余属性之间无相关性,综合核密度估计图,各特征间存在独立性,无需进行数据样本特征降维。
根据所述Pearson相关系数和所述爆破设计数据属性分布,选择所述预测模型输入变量,是指通过综合考虑各爆破设计参数与爆破块度的相关性以及各参数的取值范围和分布特征,选择与爆破块度密切相关的关键因素作为预测模型的输入变量。这一优选实施方式全面、准确地了解了数据分布和相关性情况,并提供了易于理解的可视化结果,达到了提高预测模型的质量和可靠性的技术效果。
在本申请实施例提供的另一种优选实施方式中,根据所述爆破块度案例数据库对所述预测模型进行训练,包括:
当训练未完成时,根据所述遗传算法对所述预测模型的超参数进行选择、交叉、变异,获得更新预测模型的超参数。所述选择是指从当前候选解集合中挑选一部分解用于生成下一代,采用评估函数来衡量解的质量,根据解的质量进行概率性选择,确保较好的解有更高的机会被选中;所述交叉是指从两个或多个父代解中创建新的后代解,通过交叉操作,将不同父代解的一部分信息组合在一起,生成具有一些父代特征的新解;所述变异是指在新一代解中引入一些随机性或小幅度改变,以保持多样性,避免陷入局部最优解,并有机会发现全局最优解。当模型的训练过程没有满足评价指标时,使用遗传算法中的选择、交叉、变异操作更新预测模型的超参数,以获得更优的预测性能,本优选实施方式中,评价指标为点预测效果和区间预测效果,点预测效果评价指标选取(R2)和(MSE);区间预测评价效果指标选取区间覆盖概率(PICP)、区间归一化平均带宽(PINAW)和修正区间预测准确性(CPIA)。其中:
;
;
;
;
式中PICP表示真实值落入预测区间的概率大小,PICP越大,代表预测效果越好,Li代表预测区间的下限,Ui代表预测区间的上限;PINAW表示预测区间的平均宽度,PINAW越大,代表预测区间的平均宽度越大;CPIA综合式PINAW和式PICP两种可靠性准则指标,CPIA越大,代表区间预测效果越好。R表示目标值的极差,用于将预测区间宽度归一化处理。
对所述预测模型的超参数进行迭代寻优,获得迭代寻优超参数,本优选实施方式中,遗传算法初始种群个体共有3群,分别对应LightGBM的3个超参数(n_estimators、max_depth和learning_rate)。所述n_estimators表示要训练的梯度提升树的数量,即n_estimators指定了在训练过程中要构建的决策树的数量,这个参数直接影响到模型的复杂度和性能;所述max_depth用于控制每棵决策树的最大深度,定义了树中允许的最大分裂层数或节点深度;所述learning_rate是学习率,它控制了每次迭代中模型权重的调整幅度,决定了每棵树的贡献程度以及权重更新的大小。设置n_estimators对应的初始种群个体取值范围为(50, 500),设置max_depth对应的初始种群个体取值范围为(3, 20),设置learning_rate对应的初始种群个体取值范围为(0.01, 0.1),种群规模设置为50,最大代数为50。
本优选实施方式中,嵌套5折交叉验证的两个循环分别将预测模型训练集平均随机分为5份,分别是SET 1,SET 2,SET 3,SET 4和SET 5。依次取其中4份作为嵌套交叉验证训练集进行训练,得到爆破块度的不确定性预测模型和中位数回归模型,将剩余1份作为嵌套交叉验证测试集用于预测模型区间预测结果和点预测结果评估,共进行5次。如图 3所示,内层循环5次评价结果取平均值,作为最佳超参数取值,以该超参数对外层循环5次评价结果取平均值,作为该超参数的预测区间评价指标均值和点预测评价指标均值。其中,R2用于评价点预测效果,R2越接近1,表明模型预测越准确;分位数损失用于评价区间预测效果,分位数损失越接近0,表明模型预测越准确。图4中(a)为使用GA优化QLightGBM进行中位数预测的过程,当GA迭代到第12步时,产生最优的R2得分(= 0.880);图4中(b)为使用GA优化QLightGBM进行区间下限预测的过程,当GA迭代到第16步时,产生最优的分位数损失(=0.007);图4中(c)为使用GA优化QLightGBM进行区间上限预测的过程,当GA迭代到第24步时,产生最优的分位数损失(= 0.019)。
基于所述迭代寻优超参数,根据所述更新爆破块度案例数据库继续进行训练。本优选实施方式中,经过迭代寻优后,中位数回归模型的点预测最优超参数见表2,分位数回归模型的区间预测的区间上限和区间下限最优超参数见表3。使用经过优化得到的超参数配置和更新后的爆破块度案例数据库继续进行模型的训练和优化,进一步提高模型的性能和精度,并获得更好的预测结果。这一优选实施方式通过多次重复训练和优化,找到一组最优超参数配置,使模型在各种情况下都能保持较好的性能和精度,达到了提高模型的稳定性和鲁棒性的技术效果。
表2 中位数回归模型的点预测最优超参数
;
表3 分位数回归模型的区间预测的区间上限和区间下限最优超参数
;
在本申请实施例提供的另一种优选实施方式中,所述分位数损失函数为:
;
其中,为分位数损失函数,/>为预测模型的预测值,/>为数据样本标签,/>为分位数。通过设置不同分位数使预测模型生成不同预测值,不同组成的范围即为模型的预测区间,区间预测上限设置/>,区间预测下限设置/>。此外,称/>时的点预测模型为中位数回归模型。这一优选实施方式通过使用分位数损失函数,模型可以更好地适应各种数据类型,并提高预测精度,达到了提升模型性能的技术效果。
在本申请实施例提供的另一种优选实施方式中,所述嵌套5折交叉验证包括内层循环和外层循环,内层循环基于GA优化的最优超参数搜索,向外层循环提供最佳超参数,外层循环通过给内层循环提供数据样本以作训练,同时外层保留部分数据样本作为测试集,对内层循环模型效果进行测试。这一优选实施方式采用嵌套5折交叉验证用来防止过拟合的发生,并通过模型泛化误差估计进行超参数的搜索,达到了使模型获得最佳参数的技术效果。
实施例2:基于与前述实施例中一种爆破块度不确定性预测方法相同的发明构思,如图5所示,本申请提供了一种爆破块度不确定性预测系统,本申请实施例中的系统与方法实施例基于同样的发明构思。其中,所述系统包括:
历史爆破块度案例数据库构建模块1,所述历史爆破块度案例数据库构建模块1用于根据爆破设计参数和爆破块度采集爆破块度案例数据;
爆破块度案例数据库获得模块2,所述爆破块度案例数据库获得模块2用于对所述历史爆破块度案例数据库进行预处理,获得爆破块度案例数据库;
预测模型输入变量确定模块3,所述预测模型输入变量确定模块3用于对所述爆破设计参数和所述爆破块度进行相关性分析,确定预测模型输入变量;
预测模型设置模块4,所述预测模型设置模块4用于将LightGBM模型设置为预测模型;
模型预测区间生成模块5,所述模型预测区间生成模块5用于根据分位数损失函数,生成所述预测模型的模型预测区间;
寻优超参数获得模块6,所述寻优超参数获得模块6用于设置所述预测模型的区间预测超参数寻优目标为最小化分位数损失,设置所述预测模型的点预测超参数寻优目标为最大化R2,结合遗传算法和嵌套5折交叉验证对所述预测模型的超参数进行寻优,获得寻优超参数;
GA-QLightGBM模型获得模块7,所述GA-QLightGBM模型获得模块7用于基于所述寻优超参数,根据所述爆破块度案例数据库对所述预测模型进行训练,获得训练完成的GA-QLightGBM模型;
预测样本数据获得模块8,所述预测样本数据获得模块8用于根据所述预测模型输入变量,获得预测样本数据;
预测值获得模块9,所述预测值获得模块9用于将所述预测样本数据输入所述GA-QLightGBM模型,获得预测值,其中,所述预测值包括、/>和/>,/>为所述GA-QLightGBM模型输出的爆破块度点预测值,/>为所述GA-QLightGBM模型输出的爆破块度预测区间上限,/>为所述GA-QLightGBM模型输出的爆破块度预测区间下限。
进一步的,所述爆破块度案例数据库获得模块2用于执行如下方法:
获得多维预处理指标,其中,所述多维预处理指标包括重复数据剔除、缺失数据剔除和异常数据剔除;
根据所述多维预处理指标对所述历史爆破块度案例数据库进行数据清洗,生成所述爆破块度案例数据库。
进一步的,所述预测模型输入变量确定模块3用于执行如下方法:
计算各爆破设计参数间的Pearson相关系数;
统计所述爆破块度案例数据库内的爆破设计数据属性分布;
根据所述Pearson相关系数和所述爆破设计数据属性分布,选择所述预测模型输入变量。
进一步的,所述GA-QLightGBM模型获得模块7用于执行如下方法:
当训练未完成时,根据所述遗传算法对所述预测模型的超参数进行选择、交叉、变异,获得更新预测模型的超参数;
对所述预测模型的超参数进行迭代寻优,获得迭代寻优超参数;
基于所述迭代寻优超参数,根据所述更新预测模型的超参数继续进行训练。
进一步的,所述模型预测区间生成模块5用于执行如下方法:
所述分位数损失函数为:
;
其中,为分位数损失函数,/>为预测模型的预测值,/>为数据样本标签,/>为分位数。
进一步的,所述寻优超参数获得模块6用于执行如下方法:
所述嵌套5折交叉验证包括内层循环和外层循环,内层循环基于GA优化的最优超参数搜索,向外层循环提供最佳超参数,外层循环通过给内层循环提供数据样本以作训练,同时外层保留部分数据样本作为测试集,对内层循环模型效果进行测试。
需要说明的是,上述本申请实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
本说明书和附图仅仅是本申请的示例性说明,且视为已覆盖本申请范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的范围。这样,倘若本申请的这些修改和变型属于本申请及其等同技术的范围之内,则本申请意图包括这些改动和变型在内。
Claims (6)
1.一种爆破块度不确定性预测方法,其特征在于,所述方法包括:
根据爆破设计参数和爆破块度采集爆破块度案例数据,构建历史爆破块度案例数据库;
对所述历史爆破块度案例数据库进行预处理,获得爆破块度案例数据库;
对所述爆破设计参数和所述爆破块度进行相关性分析,确定预测模型输入变量;
将LightGBM模型设置为预测模型;
根据分位数损失函数,生成所述预测模型的模型预测区间;所述分位数损失函数为:
;
其中,为分位数损失函数,/>为预测模型的预测值,/>为数据样本标签,/>为分位数;
设置所述预测模型的区间预测超参数寻优目标为最小化分位数损失,设置所述预测模型的点预测超参数寻优目标为最大化R2,结合遗传算法和嵌套5折交叉验证对所述预测模型的超参数进行寻优,获得寻优超参数;
基于所述寻优超参数,根据所述爆破块度案例数据库对所述预测模型进行训练,获得训练完成的GA-QLightGBM模型;
根据所述预测模型输入变量,获得预测样本数据;
将所述预测样本数据输入所述GA-QLightGBM模型,获得预测值,其中,所述预测值包括、/>和/>,/>为所述GA-QLightGBM模型输出的爆破块度点预测值,/>为所述GA-QLightGBM模型输出的爆破块度预测区间上限,/>为所述GA-QLightGBM模型输出的爆破块度预测区间下限。
2.如权利要求1所述的方法,其特征在于,对所述历史爆破块度案例数据库进行预处理,包括:
获得多维预处理指标,其中,所述多维预处理指标包括重复数据剔除、缺失数据剔除和异常数据剔除;
根据所述多维预处理指标对所述历史爆破块度案例数据库进行数据清洗,生成所述爆破块度案例数据库。
3.如权利要求1所述的方法,其特征在于,对所述爆破设计参数和所述爆破块度进行相关性分析,确定预测模型输入变量,包括:
计算各爆破设计参数间的Pearson相关系数;
统计所述爆破块度案例数据库内的爆破设计数据属性分布;
根据所述Pearson相关系数和所述爆破设计数据属性分布,选择所述预测模型输入变量。
4.如权利要求1所述的方法,其特征在于,根据所述爆破块度案例数据库对所述预测模型进行训练,包括:
当训练未完成时,根据所述遗传算法对所述预测模型的超参数进行选择、交叉、变异,获得更新预测模型的超参数;
对所述预测模型的超参数进行迭代寻优,获得迭代寻优超参数;
基于所述迭代寻优超参数,根据所述更新预测模型的超参数继续进行训练。
5.如权利要求1所述的方法,其特征在于,所述嵌套5折交叉验证包括内层循环和外层循环,内层循环基于GA优化的最优超参数搜索,向外层循环提供最佳超参数,外层循环通过给内层循环提供数据样本以作训练,同时外层保留部分数据样本作为测试集,对内层循环模型效果进行测试。
6.一种爆破块度不确定性预测系统,其特征在于,所述系统包括:
历史爆破块度案例数据库构建模块,所述历史爆破块度案例数据库构建模块用于根据爆破设计参数和爆破块度采集爆破块度案例数据;
爆破块度案例数据库获得模块,所述爆破块度案例数据库获得模块用于对所述历史爆破块度案例数据库进行预处理,获得爆破块度案例数据库;
预测模型输入变量确定模块,所述预测模型输入变量确定模块用于对所述爆破设计参数和所述爆破块度进行相关性分析,确定预测模型输入变量;
预测模型设置模块,所述预测模型设置模块用于将LightGBM模型设置为预测模型;
模型预测区间生成模块,所述模型预测区间生成模块用于根据分位数损失函数,生成所述预测模型的模型预测区间;所述分位数损失函数为:
;
其中,为分位数损失函数,/>为预测模型的预测值,/>为数据样本标签,/>为分位数;
寻优超参数获得模块,所述寻优超参数获得模块用于设置所述预测模型的区间预测超参数寻优目标为最小化分位数损失,设置所述预测模型的点预测超参数寻优目标为最大化R2,结合遗传算法和嵌套5折交叉验证对所述预测模型的超参数进行寻优,获得寻优超参数;
GA-QLightGBM模型获得模块,所述GA-QLightGBM模型获得模块用于基于所述寻优超参数,根据所述爆破块度案例数据库对所述预测模型进行训练,获得训练完成的GA-QLightGBM模型;
预测样本数据获得模块,所述预测样本数据获得模块用于根据所述预测模型输入变量,获得预测样本数据;
预测值获得模块,所述预测值获得模块用于将所述预测样本数据输入所述GA-QLightGBM模型,获得预测值,其中,所述预测值包括
、/>和/>,/>为所述GA-QLightGBM模型输出的爆破块度点预测值,/>为所述GA-QLightGBM模型输出的爆破块度预测区间上限,/>为所述GA-QLightGBM模型输出的爆破块度预测区间下限。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410142982.1A CN117669393B (zh) | 2024-02-01 | 2024-02-01 | 一种爆破块度不确定性预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410142982.1A CN117669393B (zh) | 2024-02-01 | 2024-02-01 | 一种爆破块度不确定性预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117669393A CN117669393A (zh) | 2024-03-08 |
CN117669393B true CN117669393B (zh) | 2024-04-19 |
Family
ID=90086676
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410142982.1A Active CN117669393B (zh) | 2024-02-01 | 2024-02-01 | 一种爆破块度不确定性预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117669393B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111259601A (zh) * | 2020-01-16 | 2020-06-09 | 南华大学 | 基于随机ga-bp神经网络群的爆破块度预测方法、装置及介质 |
CN112711904A (zh) * | 2020-12-17 | 2021-04-27 | 玉溪矿业有限公司 | 一种基于sa-ga-bp的爆破振动特征参量预测方法 |
CN112800673A (zh) * | 2021-01-27 | 2021-05-14 | 昆明理工大学 | 一种基于sa-ga-bp算法预测爆破块度的方法 |
CN112926267A (zh) * | 2021-03-10 | 2021-06-08 | 山东大学 | 一种基于掘进参数反演的tbm隧道岩爆等级预测方法及系统 |
KR20220073453A (ko) * | 2020-11-26 | 2022-06-03 | 국방과학연구소 | 유전자 알고리즘 기반의 역설계 방법과, 이를 포함하고 인공지능 프로그램이 채용된 컴퓨터를 활용한 합금 설계방법, 및 유전자 알고리즘 기반의 역설계 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록매체 |
CN115980826A (zh) * | 2022-12-05 | 2023-04-18 | 云南驰宏锌锗股份有限公司 | 一种基于加权的元启发式组合模型的岩爆烈度预测方法 |
KR102573290B1 (ko) * | 2023-01-10 | 2023-09-01 | (주)유앤피플 | 터널에서 발생하는 소음, 진동, 침하 및 침수 센싱 데이터를 활용한 예측 모델 생성 장치 및 방법 |
-
2024
- 2024-02-01 CN CN202410142982.1A patent/CN117669393B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111259601A (zh) * | 2020-01-16 | 2020-06-09 | 南华大学 | 基于随机ga-bp神经网络群的爆破块度预测方法、装置及介质 |
KR20220073453A (ko) * | 2020-11-26 | 2022-06-03 | 국방과학연구소 | 유전자 알고리즘 기반의 역설계 방법과, 이를 포함하고 인공지능 프로그램이 채용된 컴퓨터를 활용한 합금 설계방법, 및 유전자 알고리즘 기반의 역설계 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록매체 |
CN112711904A (zh) * | 2020-12-17 | 2021-04-27 | 玉溪矿业有限公司 | 一种基于sa-ga-bp的爆破振动特征参量预测方法 |
CN112800673A (zh) * | 2021-01-27 | 2021-05-14 | 昆明理工大学 | 一种基于sa-ga-bp算法预测爆破块度的方法 |
CN112926267A (zh) * | 2021-03-10 | 2021-06-08 | 山东大学 | 一种基于掘进参数反演的tbm隧道岩爆等级预测方法及系统 |
CN115980826A (zh) * | 2022-12-05 | 2023-04-18 | 云南驰宏锌锗股份有限公司 | 一种基于加权的元启发式组合模型的岩爆烈度预测方法 |
KR102573290B1 (ko) * | 2023-01-10 | 2023-09-01 | (주)유앤피플 | 터널에서 발생하는 소음, 진동, 침하 및 침수 센싱 데이터를 활용한 예측 모델 생성 장치 및 방법 |
Non-Patent Citations (1)
Title |
---|
GA-LightGBM模型及其在车辆保险需求预测中应用;庄维嘉 等;《上海第二工业大学学报》;20221231;339-346 * |
Also Published As
Publication number | Publication date |
---|---|
CN117669393A (zh) | 2024-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111124840A (zh) | 业务运维中告警的预测方法、装置与电子设备 | |
CN110442666B (zh) | 一种基于神经网络模型的矿产资源预测方法及系统 | |
US20060106797A1 (en) | System and method for temporal data mining | |
CN112733997A (zh) | 基于woa-lstm-mc的水文时间序列预测优化方法 | |
CN111858328B (zh) | 一种基于有序神经网络的软件缺陷模块严重程度预测方法 | |
CN108961460B (zh) | 基于稀疏esgp与多目标优化的故障预测方法及装置 | |
EP4288966A1 (en) | Drug optimisation by active learning | |
CN110659672A (zh) | 一种风电机组出力分步不确定性预测方法及装置 | |
Torrado et al. | Optimal sequential drilling for hydrocarbon field development planning | |
CN115145817A (zh) | 一种软件测试方法、装置、设备及可读存储介质 | |
CN117593653B (zh) | 基于遥感监测的地质灾害预警方法 | |
CN115033591A (zh) | 一种电费数据异常智能检测方法、系统、存储介质及计算机设备 | |
CN117669393B (zh) | 一种爆破块度不确定性预测方法及系统 | |
CN112182056A (zh) | 一种数据检测方法、装置、设备及存储介质 | |
Roy et al. | Deep predictive coverage collection | |
CN113282747A (zh) | 一种基于自动机器学习算法选择的文本分类方法 | |
CN112380132B (zh) | 基于航天软件缺陷数据集类不平衡的对抗验证方法及装置 | |
CN115759263A (zh) | 一种基于因果推断的策略效果评估方法及装置 | |
CN109934352A (zh) | 智能模型的自动进化方法 | |
CN115936773A (zh) | 一种互联网金融黑产识别方法与系统 | |
US20230214668A1 (en) | Hyperparameter adjustment device, non-transitory recording medium in which hyperparameter adjustment program is recorded, and hyperparameter adjustment program | |
CN103942403A (zh) | 一种对海量变量进行筛选的方法及设备 | |
Rapley et al. | Model-based inferences from adaptive cluster sampling | |
US20220374569A1 (en) | Computational discovery of microstructure designs | |
Sadik et al. | Predicting Soil Liquefaction Potential Using XGBoost Algorithm with Bayesian Hyperparameters’ Optimization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |