CN113111928A - 一种基于地学数据库的半监督学习矿产资源定量预测方法 - Google Patents
一种基于地学数据库的半监督学习矿产资源定量预测方法 Download PDFInfo
- Publication number
- CN113111928A CN113111928A CN202110353244.8A CN202110353244A CN113111928A CN 113111928 A CN113111928 A CN 113111928A CN 202110353244 A CN202110353244 A CN 202110353244A CN 113111928 A CN113111928 A CN 113111928A
- Authority
- CN
- China
- Prior art keywords
- algorithm
- probability
- steps
- database
- prediction method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 73
- 229910052500 inorganic mineral Inorganic materials 0.000 title claims abstract description 35
- 239000011707 mineral Substances 0.000 title claims abstract description 35
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 36
- 238000005457 optimization Methods 0.000 claims abstract description 11
- 230000009286 beneficial effect Effects 0.000 claims abstract description 8
- 230000000694 effects Effects 0.000 claims abstract description 6
- 230000001186 cumulative effect Effects 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 8
- 238000007637 random forest analysis Methods 0.000 claims description 5
- 238000011160 research Methods 0.000 claims description 5
- 238000012706 support-vector machine Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 4
- 230000002349 favourable effect Effects 0.000 claims description 3
- 238000003672 processing method Methods 0.000 claims 1
- 230000007547 defect Effects 0.000 description 2
- 238000011234 economic evaluation Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000033558 biomineral tissue development Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005553 drilling Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Remote Sensing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Geophysics And Detection Of Objects (AREA)
Abstract
本发明公开了一种基于地学数据库的半监督学习矿产资源定量预测方法,处理方法包括:本方法由三部分组成,第一部分为基础算法;第二部分为贝叶斯超参数优化算法;第三部分为用于评价预测方法效果和圈定找矿有利靶区的概率‑面积/体积图法,本发明的有益效果:通过上述三种方法组成的基于地学数据库的半监督学习矿产资源定量预测方法,并通过电脑软件的输入上述的三类方法,最终能达到矿产资源勘查的准确性和效率提升。
Description
技术领域
本发明涉及矿产资源勘测领域,更具体地说,属于一种基于地学数据库的半监督学习矿产资源定量预测方法。
背景技术
矿产资源勘查是发现矿床并查明其中的矿体分布、矿产种类、质量、数量、开采利用条件、技术经济评价及应用前景等,满足国家建设或矿山企业需要的全部地质勘查工作。矿产资源埋藏于地下,具有稀少、隐蔽、复杂等特点,其勘查过程常常需要采用地质填图、物探、化探、遥感地质等方法,应用钻探、坑探等技术手段,需要进行测量、编录、取样、化验、实验、储量计算、技术经济评价和可行性研究等工作,需要大量的人力、物力和资金投入。且一个矿产资源地从发现、查明到开发需要经过很长的周期。因而,矿产资源勘查是一项极具风险的工作。由此可见,在矿产资源勘查阶段就开始贯彻循环经济的原则十分重要。
目前,矿产资源勘查不准确,且矿产资源勘查效率低下,因此针对这些不足需要设计一款全新矿产资源勘查的方法。
发明内容
针对现有应用及技术存在的不足,本发明提供了种基于地学数据库的半监督学习矿产资源定量预测方法。该方法能够很好地解决矿产资源勘查不准确,且矿产资源勘查效率低下。基于此方案,用户可以通过电脑软件输入程序,因此,用户可以放心的借助手机或电脑终端进行同步操作,对于矿产资源勘查的准确性和效率提升问题具有十分重要的意义。
为实现上述目的,本发明提供了如下技术方案:
一种基于地学数据库的半监督学习矿产资源定量预测方法,处理方法包括:本方法由三部分组成,第一部分为基础算法;第二部分为贝叶斯超参数优化算法;第三部分为用于评价预测方法效果和圈定找矿有利靶区的概率-面积/体积图法。
方法一:基础算法:以‘袋装法’为基础的正样本无标签学习算法;
其中,‘袋装法’该算法计算流程如下:
方法二:贝叶斯超参数优化算法,简要步骤总结如下:
步骤一:随机一些超参数x并训练得到模型,然后刻画这些模型的能力y,得到先验数据集合D=(x1,y1)、(x2,y2)、...、(xk,yk);
步骤二:通过先验数据D来拟合出高斯模型GM;
步骤三:通过采集函数找到在GM下的极大值,超参数x',并通过x'训练得到模型和刻画模型能力y',将(x',y')加入数据集D;
步骤四:重复2-3步,直至终止条件。
进一步的,方法三,用于评价预测方法效果和圈定找矿有利靶区的概率- 面积/体积图法,简要概括如下:概率体积图包含两条线,一条为所预测的累计概率对应的块体面积/体积占矿体的百分比,另一条为所预测的累计概率对应的块体面积/体积占研究区的百分比,两条线交点即为靶区对应的概率阈值,该交点越高代表算法表现越好。
进一步的,对于基础算法,本方法提供了二维、三维矿产资源定量预测中常用的随机森林,梯度提升树,支持向量机等算法。
本发明的有益效果:
本发明通过基础算法、贝叶斯超参数优化算法和用于评价预测方法效果和圈定找矿有利靶区的概率-面积/体积图法三种方法组合成的一种组成一个总的方法,其中基础算法以‘袋装法’为基础的正样本无标签学习算法,贝叶斯超参数优化算法以四个步骤构成:步骤一:随机一些超参数x并训练得到模型,然后刻画这些模型的能力y,得到先验数据集合D=(x1,y1)、(x2, y2)、...、(xk,yk);步骤二:通过先验数据D来拟合出高斯模型GM;步骤三:通过采集函数找到在GM下的极大值,超参数x',并通过x'训练得到模型和刻画模型能力y',将(x',y')加入数据集D;步骤四:重复2-3步,直至终止条件,用于评价预测方法效果和圈定找矿有利靶区的概率-面积/体积图法,简要概括如下:概率体积图包含两条线,一条为所预测的累计概率对应的块体面积/体积占矿体的百分比,另一条为所预测的累计概率对应的块体面积/ 体积占研究区的百分比,两条线交点即为靶区对应的概率阈值,该交点越高代表算法表现越好,通过上述三种方法组成的基于地学数据库的半监督学习矿产资源定量预测方法,并通过电脑软件的输入上述的三类方法,最终能达到矿产资源勘查的准确性和效率提升。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明贝叶斯超参数优化算法的同步英文流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如附图1所示的一种基于地学数据库的半监督学习矿产资源定量预测方法,处理方法包括:本方法由三部分组成,第一部分为基础算法;第二部分为贝叶斯超参数优化算法;第三部分为用于评价预测方法效果和圈定找矿有利靶区的概率-面积/体积图法。
方法一:基础算法:以‘袋装法’为基础的正样本无标签学习算法;
其中,‘袋装法’该算法计算流程如下:
方法二:贝叶斯超参数优化算法,简要步骤总结如下:
步骤一:随机一些超参数x并训练得到模型,然后刻画这些模型的能力y,得到先验数据集合D=(x1,y1)、(x2,y2)、...、(xk,yk);
步骤二:通过先验数据D来拟合出高斯模型GM;
步骤三:通过采集函数找到在GM下的极大值,超参数x',并通过x'训练得到模型和刻画模型能力y',将(x',y')加入数据集D;
步骤四:重复2-3步,直至终止条件。
优选的,方法三,用于评价预测方法效果和圈定找矿有利靶区的概率-面积/体积图法,简要概括如下:概率体积图包含两条线,一条为所预测的累计概率对应的块体面积/体积占矿体的百分比,另一条为所预测的累计概率对应的块体面积/体积占研究区的百分比,两条线交点即为靶区对应的概率阈值,该交点越高代表算法表现越好。
优选的,对于基础算法,本方法提供了二维、三维矿产资源定量预测中常用的随机森林,梯度提升树,支持向量机等算法。
本发明通过电脑软件在Anaconda3 Spyder4.1.4平台运行内部包含数据预处理、贝叶斯优化、基于‘袋装法’的正样本无标签学习及概率-面积/体积法等模块,其中两类正样本无标签学习的基础学习器包括目前在矿产资源定量预测与评价中应用最为广泛的Random Forest(RF),Gradient Boosting Decision Tree(GBDT)和Support VectorMachine(SVM),上述三种基础学习器利用机器学习库scikit-learn构建与训练构建和训练。
首先Spyder4.1.4,然后输入该软件的源数据(例)软件,要求分别输入:.csv格式,a.矿体地学信息数据库;b.无标签地学信息数据库;c.所有数据的X,Y,Z(即深度)坐标信息(按照先矿体后无标签的顺序)。此处注意矿体地学信息数据库和无标签地学信息数据库中的特征类别应该一致,上述数据均与软件放在同一运行目录下,运行‘袋装法’正样本无标签学习模块,运行P-V plot模块,最终得到数据结果,软件最终处理结果为:.csv格式的文件里面具有X Y Z和成矿概率,通过电脑软件的输入上述的三类方法,最终能达到矿产资源勘查的准确性和效率提升的目的。
在本发明创造的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以通过具体情况理解上述术语在本发明创造中的具体含义。
需要说明的是,在本文中,术语“上”、“下”、“内”、“外”“前端”、“后端”、“两端”、“一端”、“另一端”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (3)
1.一种基于地学数据库的半监督学习矿产资源定量预测方法,其特征在于,处理方法包括:本方法由三部分组成,第一部分为基础算法;第二部分为贝叶斯超参数优化算法;第三部分为用于评价预测方法效果和圈定找矿有利靶区的概率-面积/体积图法。
方法一:基础算法:以‘袋装法’为基础的正样本无标签学习算法;
其中,‘袋装法’该算法计算流程如下:
方法二:贝叶斯超参数优化算法,简要步骤总结如下:
步骤一:随机一些超参数x并训练得到模型,然后刻画这些模型的能力y,得到先验数据集合D=(x1,y1)、(x2,y2)、...、(xk,yk);
步骤二:通过先验数据D来拟合出高斯模型GM;
步骤三:通过采集函数找到在GM下的极大值,超参数x',并通过x'训练得到模型和刻画模型能力y',将(x',y')加入数据集D;
步骤四:重复2-3步,直至终止条件。
2.根据权利要求1所述的一种基于地学数据库的半监督学习矿产资源定量预测方法,其特征在于:方法三,用于评价预测方法效果和圈定找矿有利靶区的概率-面积/体积图法,简要概括如下:概率体积图包含两条线,一条为所预测的累计概率对应的块体面积/体积占矿体的百分比,另一条为所预测的累计概率对应的块体面积/体积占研究区的百分比,两条线交点即为靶区对应的概率阈值,该交点越高代表算法表现越好。
3.根据权利要求1所述的一种基于地学数据库的半监督学习矿产资源定量预测方法,其特征在于:对于基础算法,本方法提供了二维、三维矿产资源定量预测中常用的随机森林,梯度提升树,支持向量机等算法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110353244.8A CN113111928B (zh) | 2021-04-01 | 2021-04-01 | 一种基于地学数据库的半监督学习矿产资源定量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110353244.8A CN113111928B (zh) | 2021-04-01 | 2021-04-01 | 一种基于地学数据库的半监督学习矿产资源定量预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113111928A true CN113111928A (zh) | 2021-07-13 |
CN113111928B CN113111928B (zh) | 2023-12-29 |
Family
ID=76713790
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110353244.8A Active CN113111928B (zh) | 2021-04-01 | 2021-04-01 | 一种基于地学数据库的半监督学习矿产资源定量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113111928B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115859106A (zh) * | 2022-12-05 | 2023-03-28 | 中国地质大学(北京) | 一种基于半监督学习的矿产勘探方法、装置和存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109936582A (zh) * | 2019-04-24 | 2019-06-25 | 第四范式(北京)技术有限公司 | 构建基于pu学习的恶意流量检测模型的方法及装置 |
CN110084374A (zh) * | 2019-04-24 | 2019-08-02 | 第四范式(北京)技术有限公司 | 构建基于pu学习的模型的方法、装置及预测方法、装置 |
KR20190118937A (ko) * | 2018-04-11 | 2019-10-21 | 삼성에스디에스 주식회사 | 하이퍼파라미터의 최적화 시스템 및 방법 |
CN111105037A (zh) * | 2018-10-25 | 2020-05-05 | 罗伯特·博世有限公司 | 用于通过高斯过程进行机器学习的方法 |
CN111652317A (zh) * | 2020-06-04 | 2020-09-11 | 郑州科技学院 | 基于贝叶斯深度学习的超参数图像分割方法 |
CN112215365A (zh) * | 2020-10-28 | 2021-01-12 | 天津大学 | 一种基于朴素贝叶斯模型提供特征预测能力方法 |
CN112561082A (zh) * | 2020-12-22 | 2021-03-26 | 北京百度网讯科技有限公司 | 生成模型的方法、装置、设备以及存储介质 |
-
2021
- 2021-04-01 CN CN202110353244.8A patent/CN113111928B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190118937A (ko) * | 2018-04-11 | 2019-10-21 | 삼성에스디에스 주식회사 | 하이퍼파라미터의 최적화 시스템 및 방법 |
CN111105037A (zh) * | 2018-10-25 | 2020-05-05 | 罗伯特·博世有限公司 | 用于通过高斯过程进行机器学习的方法 |
CN109936582A (zh) * | 2019-04-24 | 2019-06-25 | 第四范式(北京)技术有限公司 | 构建基于pu学习的恶意流量检测模型的方法及装置 |
CN110084374A (zh) * | 2019-04-24 | 2019-08-02 | 第四范式(北京)技术有限公司 | 构建基于pu学习的模型的方法、装置及预测方法、装置 |
CN111652317A (zh) * | 2020-06-04 | 2020-09-11 | 郑州科技学院 | 基于贝叶斯深度学习的超参数图像分割方法 |
CN112215365A (zh) * | 2020-10-28 | 2021-01-12 | 天津大学 | 一种基于朴素贝叶斯模型提供特征预测能力方法 |
CN112561082A (zh) * | 2020-12-22 | 2021-03-26 | 北京百度网讯科技有限公司 | 生成模型的方法、装置、设备以及存储介质 |
Non-Patent Citations (7)
Title |
---|
J. C. BARSCE等: "Towards autonomous reinforcement learning: Automatic setting of hyper-parameters using Bayesian optimization", 《2017 XLIII LATIN AMERICAN COMPUTER CONFERENCE (CLEI)》 * |
MORDELET F等: "A bagging SVM to learn from positive and unlabeled examples", 《PATTERN RECOGNITION LETTERS》 * |
YOUSEFI M等: "Prediction–area (P–A) plot and C–A fractal analysis to classify and evaluate evidential maps for mineral prospectivity modeling", 《COMPUTERS & GEOSCIENCES》 * |
ZHANG W等: "Prediction of undrained shear strength using extreme gradient boosting and random forest based on Bayesian optimization", 《GEOSCIENCE FRONTIERS》 * |
ZHANG Z等: "Bagging-based positive-unlabeled learning algorithm with Bayesian hyperparameter optimization for three-dimensional mineral potential mapping", 《COMPUTERS & GEOSCIENCES》 * |
赵永翼等: "基于CART和PU算法的矿石矿物的智能识别", 《沈阳师范大学学报:自然科学版》 * |
马瑶等: "机器学习方法在矿产资源定量预测应用研究进展", 《地质科技通报》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115859106A (zh) * | 2022-12-05 | 2023-03-28 | 中国地质大学(北京) | 一种基于半监督学习的矿产勘探方法、装置和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113111928B (zh) | 2023-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110490100A (zh) | 基于深度学习的岩土自动识别定名方法及系统 | |
CN103487832A (zh) | 一种三维地震信号中的有监督波形分类方法 | |
MX2015003997A (es) | Analisis de datos microsismicos de un tratamiento de fractura. | |
CN116665067B (zh) | 基于图神经网络的找矿靶区优选系统及其方法 | |
CN113902861A (zh) | 一种基于机器学习的三维地质建模方法 | |
Yang et al. | Quantification of uncertainty associated with evidence layers in mineral prospectivity mapping using direct sampling and convolutional neural network | |
Chen et al. | Rock image classification using deep residual neural network with transfer learning | |
CN117576335B (zh) | 面向矿产区域勘查的三维空间模型数据处理方法及系统 | |
CN116245013A (zh) | 一种地质预测模型构建方法、建模方法、设备及存储介质 | |
US20240127039A1 (en) | Geologic learning framework | |
Zhang et al. | Comparison of 3D prospectivity modeling methods for Fe-Cu skarn deposits: A case study of the Zhuchong Fe-Cu deposit in the Yueshan orefield (Anhui), eastern China | |
CN112652066A (zh) | 一种基于三维地质模型的地质表征情况的评价方法及系统 | |
Krajnovich et al. | Uncertainty assessment for 3D geologic modeling of fault zones based on geologic inputs and prior knowledge | |
CN113111928A (zh) | 一种基于地学数据库的半监督学习矿产资源定量预测方法 | |
CN110490241A (zh) | 一种水平井参数优化方法及装置 | |
Pan et al. | Intelligent rock fracture identification based on image semantic segmentation: methodology and application | |
CN117893347A (zh) | 一种成矿预测方法及终端设备 | |
Tian et al. | A novel deep learning method based on 2-D CNNs and GRUs for permeability prediction of tight sandstone | |
CN116090662B (zh) | 基于知识图谱的境外铜矿潜力预测方法、系统及电子设备 | |
Kouadio et al. | K-Means Featurizer: A booster for intricate datasets | |
Cao et al. | Three-Dimensional Geological Modelling in Earth Science Research: An In-Depth Review and Perspective Analysis | |
Zhang et al. | Lithology identification technology of logging data based on deep learning model | |
Xu et al. | The use of 3D convolutional autoencoder in fault and fracture network characterization | |
Meng et al. | Generating Stochastic Structural Planes by Considering Parameter Correlations Using Deep Generative Adversarial Networks | |
CN117574269B (zh) | 陆相页岩储层天然裂缝智能识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |