CN111709189A - 一种铜矿矿床规模预测方法及系统 - Google Patents

一种铜矿矿床规模预测方法及系统 Download PDF

Info

Publication number
CN111709189A
CN111709189A CN202010573091.3A CN202010573091A CN111709189A CN 111709189 A CN111709189 A CN 111709189A CN 202010573091 A CN202010573091 A CN 202010573091A CN 111709189 A CN111709189 A CN 111709189A
Authority
CN
China
Prior art keywords
ore
copper ore
data
copper
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010573091.3A
Other languages
English (en)
Inventor
陈其慎
王琨
张艳飞
邢佳韵
胡乔青
郑国栋
龙涛
魏然
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Mineral Resources of Chinese Academy of Geological Sciences
Original Assignee
Institute of Mineral Resources of Chinese Academy of Geological Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Mineral Resources of Chinese Academy of Geological Sciences filed Critical Institute of Mineral Resources of Chinese Academy of Geological Sciences
Priority to CN202010573091.3A priority Critical patent/CN111709189A/zh
Publication of CN111709189A publication Critical patent/CN111709189A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种铜矿矿床规模预测方法及系统。所述方法包括获取现有的铜矿的项目数据和资料;根据所述项目数据和所述资料确定铜矿项目数据库;根据所述铜矿项目数据库,分析影响铜矿规模的关键因素,确定铜矿规模预测指标体系;对每项所述铜矿规模预测指标进行预处理,确定铜矿规模预测数据集;根据所述铜矿规模预测数据集,采用随机森林模型,确定预测模型;利用所述预测模型对待预测的铜矿矿床规模级别进行预测。本发明所提供的一种铜矿矿床规模预测方法及系统,实现对铜矿矿床规模的快速预测。

Description

一种铜矿矿床规模预测方法及系统
技术领域
本发明涉及矿床规模预测技术领域,特别是涉及一种铜矿矿床规模预测方法及系统。
背景技术
铜作为工业化建设的重要原料,是支撑电力、通讯、建筑、交通运输、机械制造、国防军工等产业发展的重要矿产资源。中国铜资源贫乏,国内铜原料供应远不能满足经济和社会发展的需要。如何在有限的数据资料条件下,快速对项目的优劣做出客观评价成为矿业公司面临的首要问题。
由于境外矿业项目存在公开信息资料少、距离远、工作程度低等问题,国内矿业公司很难出国收集资料,可获取的国外项目信息非常有限,数据非常凌乱,无法客观评估这些项目的好坏,增加了海外投资项目的风险。
另一方面,传统地质专家对铜矿矿床资源储量的评价需要系统的开展实地勘查工作,依赖钻探等勘查工程和长期实践经验,需要高昂的人力、经济和时间成本,无法在筛选项目初期,尚未开展系统勘查工作时,对目标矿床资源储量进行初步判断,预测目标项目是否可能成大矿的潜力和概率。
发明内容
本发明的目的是提供一种铜矿矿床规模预测方法及系统,实现对铜矿矿床规模的快速预测。
为实现上述目的,本发明提供了如下方案:
一种铜矿矿床规模预测方法,包括:
获取现有的铜矿的项目数据和资料;所述项目数据包括项目名称、所属国家、所属地区、经度、纬度、大地构造位置、成矿区带、矿床成因类型、成矿时代、成矿作用、赋矿地层、主岩、蚀变类型、矿石类型、矿体特征、累计查明资源储量、平均品位、成矿温度、成矿盐度和勘查程度;所述资料包括:矿区地质详查报告和钻探勘查报告;
根据所述项目数据和所述资料确定铜矿项目数据库;
根据所述铜矿项目数据库,分析影响铜矿规模的关键因素,确定铜矿规模预测指标体系;所述关键因素包括勘查程度、成矿区带、成矿时代、赋矿地层、主岩、蚀变类型和岩体出露面积;所述铜矿规模预测指标体系包括多项铜矿规模预测指标;所述铜矿规模预测指标为是否在俯冲带上、是否在汇聚型板块边缘、成矿时代、赋矿地层、主岩、蚀变种类、蚀变分带性、矿石类型、裂隙发育程度、岩体出露面积、成矿温度、成矿盐度、平均品位、勘查程度、构造复杂程度、矿体总数、主矿体形态或矿体平均埋深;
对每项所述铜矿规模预测指标进行预处理,确定铜矿规模预测数据集;所述预处理包括分类、标准化处理和离散化处理;
根据所述铜矿规模预测数据集,采用随机森林模型,确定预测模型;所述预测模型以所述铜矿规模预测数据集为输入,以矿床规模级别为输出;
利用所述预测模型对待预测的铜矿矿床规模级别进行预测。
可选的,所述对每项所述铜矿规模预测指标进行预处理,确定铜矿规模预测数据集,具体包括:
对所述铜矿规模预测指标进行分类,得到连续数据和离散数据;
对所述连续数据进行标准化处理;
对所述离散数据进行分类赋值;
根据标准化处理后的数据,利用ChiMerge算法进行离散化处理;
根据所述离散化处理后的数据和分类赋值后的数据确定所述铜矿规模预测数据集。
可选的,所述对所述连续数据进行标准化处理,具体包括:
利用公式
Figure BDA0002550357020000021
对所述连续数据进行标准化处理;其中,Xs为标准化变量,X为连续数据,Xmin为连续数据的最小值;Xmax为连续数据的最大值。
可选的,所述根据所述铜矿规模预测数据集,采用随机森林模型,确定预测模型,之前包括:
以所述铜矿规模预测数据集为输入,采用10折交叉验证方法确定初始随机森林模型;
根据所述铜矿规模预测数据集通过迭代确定随机森林模型。
一种铜矿矿床规模预测系统,包括:
数据获取模块,用于获取现有的铜矿的项目数据和资料;所述项目数据包括项目名称、所属国家、所属地区、经度、纬度、大地构造位置、成矿区带、矿床成因类型、成矿时代、成矿作用、赋矿地层、主岩、蚀变类型、矿石类型、矿体特征、矿床资源储量、平均品位、成矿温度、成矿盐度和勘查程度;所述资料包括:矿区地质详查报告和钻探勘查报告;
铜矿项目数据库确定模块,用于根据所述项目数据和所述资料确定铜矿项目数据库;
铜矿规模预测指标体系确定模块,用于根据所述铜矿项目数据库,分析影响铜矿规模的关键因素,确定铜矿规模预测指标体系;所述关键因素包括勘查程度、成矿区带、成矿时代、赋矿地层、主岩、蚀变类型和岩体出露面积;所述铜矿规模预测指标体系包括多项铜矿规模预测指标;所述铜矿规模预测指标为是否在俯冲带上、是否在汇聚型板块边缘、成矿时代、赋矿地层、主岩、蚀变种类、蚀变分带性、矿石类型、裂隙发育程度、岩体出露面积、成矿温度、成矿盐度、平均品位、勘查程度、构造复杂程度、矿体总数、主矿体形态或矿体平均埋深;
铜矿规模预测数据集确定模块,用于对每项所述铜矿规模预测指标进行预处理,确定铜矿规模预测数据集;所述预处理包括分类、标准化处理和离散化处理;
预测模型确定模块,用于根据所述铜矿规模预测数据集,采用随机森林模型,确定预测模型;所述预测模型以所述铜矿规模预测数据集为输入,以矿床规模级别为输出;
预测模块,用于利用所述预测模型对待预测的铜矿矿床规模级别进行预测。
可选的,所述铜矿规模预测数据集确定模块具体包括:
分类单元,用于对所述铜矿规模预测指标进行分类,得到连续数据和离散数据;
标准化处理单元,用于对所述连续数据进行标准化处理;
分类赋值单元,用于对所述离散数据进行分类赋值;
离散化处理单元,用于根据标准化处理后的数据,利用ChiMerge算法进行离散化处理;
铜矿规模预测数据集确定单元,用于根据所述离散化处理后的数据和分类赋值后的数据确定所述铜矿规模预测数据集。
可选的,所述标准化处理单元具体包括:
标准化处理子单元,用于利用公式
Figure BDA0002550357020000041
对所述连续数据进行标准化处理;其中,Xs为标准化变量,X为连续数据,Xmin为连续数据的最小值;Xmax为连续数据的最大值。
可选的,还包括:
初始随机森林模型确定模块,用于以所述铜矿规模预测数据集为输入,采用10折交叉验证方法确定初始随机森林模型;
随机森林模型确定模块,用于根据所述铜矿规模预测数据集通过迭代确定随机森林模型。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明所提供的一种铜矿矿床规模预测方法及系统,通过根据目前已有的铜矿项目数据信息,将矿床成矿理论与机器学习方法相结合,通过预测模型,即建立预测指标与矿床规模之间的关系模型,在大数据驱动下对目标铜矿矿床规模进行快速预测,对大量铜矿项目进行初步筛选,能大幅度节约时间成本,降低矿业投资风险,控制矿业投资规模,提高优质项目投资命中率。以解决矿业公司信息不对称、先验经验不足,面对无系统勘查数据的项目,无法对铜矿矿床规模进行预判的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所提供的一种铜矿矿床规模预测方法流程示意图;
图2为本发明所提供的一种铜矿矿床规模预测系统结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种铜矿矿床规模预测方法及系统,实现对铜矿矿床规模级别的预测。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明所提供的一种铜矿矿床规模预测方法流程示意图,如图1所示,本发明所提供的一种铜矿矿床规模预测方法,包括:
S101,获取现有的铜矿的项目数据和资料;所述项目数据包括项目名称、所属国家、所属地区、经度、纬度、大地构造位置、成矿区带、矿床成因类型、成矿时代、成矿作用、赋矿地层、主岩、蚀变类型、矿石类型、矿体特征、矿床资源储量、平均品位、成矿温度、成矿盐度和勘查程度;所述资料包括:矿区地质详查报告和钻探勘查报告;
S102,根据所述项目数据和所述资料确定铜矿项目数据库。
S103,根据所述铜矿项目数据库,分析影响铜矿规模的关键因素,确定铜矿规模预测指标体系;所述关键因素包括勘查程度、成矿区带、成矿时代、赋矿地层、主岩、蚀变类型和岩体出露面积;所述铜矿规模预测指标体系包括多项铜矿规模预测指标;所述铜矿规模预测指标为是否在俯冲带上、是否在汇聚型板块边缘、成矿时代、赋矿地层、主岩、蚀变种类、蚀变分带性、矿石类型、裂隙发育程度、岩体出露面积、成矿温度、成矿盐度、平均品位、勘查程度、构造复杂程度、矿体总数、主矿体形态或矿体平均埋深。
铜矿规模预测指标体系针对铜矿不同的成因类型会有一定的差异,所述指标体系主要针对斑岩型、矽卡岩型铜矿。
S104,对每项所述铜矿规模预测指标进行预处理,确定铜矿规模预测数据集;所述预处理包括分类、标准化处理和离散化处理。
S104具体包括:
对所述铜矿规模预测指标进行分类,得到连续数据和离散数据。
对所述连续数据进行标准化处理。利用公式
Figure BDA0002550357020000061
对所述连续数据进行标准化处理;其中,Xs为标准化变量,X为连续数据,Xmin为连续数据的最小值;Xmax为连续数据的最大值。
对所述离散数据进行分类赋值。
根据标准化处理后的数据,利用ChiMerge算法进行离散化处理。
根据资源储量数值大小进行排序,每个数值属于一个区间。计算每一对相邻区间的卡方值,计算方法如下:
Figure BDA0002550357020000062
Figure BDA0002550357020000063
Figure BDA0002550357020000064
Figure BDA0002550357020000065
Figure BDA0002550357020000071
其中,m=2,k为类的数量,Aij为第i区间第j类的实例数量,Eij为Aij的期望频率,Ri为第i区间的实例数量,N为总实例数量,Cj为第j类的实例数量。
根据所述离散化处理后的数据和分类赋值后的数据确定所述铜矿规模预测数据集。
S105,根据所述铜矿规模预测数据集,采用随机森林模型,确定预测模型。所述预测模型以所述铜矿规模预测数据集为输入,以矿床规模级别为输出。
在S105之前还包括:
以所述铜矿规模预测数据集为输入,采用10折交叉验证方法确定初始随机森林模型。
计算袋外数据(OOB)错误率作为随机森林模型的误差率,误差率最小值对应的参数即为模型的最优参数。根据自变量(除矿床资源储量之外的数据)的Gini指数对自变量重要性进行排序,保留80%数量的自变量,重新构建随机森林模型,重复这一过程直到自变量数量少于自变量总数的平方根。获得不同指标项组合和对应的随机森林模型误差率。
根据所述铜矿规模预测数据集通过迭代确定随机森林模型。所述随机森林模型的误差率最小。
所述随机森林模型具体为:
将原始训练集记为:S={(xi,yi),i=1,2,…,n},(X,Y)∈Rd×R,采用bootstrap方法从原始样本集S中随机抽样,样本集Sr={(xr,yr),r=1,2,…,B}。
使用Sr生成一颗不剪枝的树hi,对B棵树循环进行如下步骤生成一系列决策树h1(x),h2(x),hB(x)。
从p个自变量中随机选择Mtry个自变量。其中p为自变量个数,
Figure BDA0002550357020000072
在每个节点根据Gini指数选取最优的分裂变量和分裂点。
考虑分裂变量j和分裂点s,定义一对半平面如下:
R1(j,s)={X|Xj≤s},R2(j,s)={X|Xj>s}。
按下式求出分类变量j和分裂点s。
Figure BDA0002550357020000081
其中,目标变量分为K类,m1,mk,
Figure BDA0002550357020000083
代表属于mk类的样本占总样本的概率。
分裂直到树的叶子节点中包含的样本量为5。
得到B种分类结果,对每个记录进行投票表决决定最终分类。
Figure BDA0002550357020000082
其中,f(xt)为最终分类,hi(xt)为单个决策树分类模型,majorityvote为多数票。
最终分类f(xt)的误差率为误分个数占样本总数的比率。
S106,利用所述预测模型对待预测的铜矿矿床规模级别进行预测。
作为一个具体的实施例,获取了研究区265个斑岩型、矽卡岩型铜矿项目资料,由于本发明对铜矿矿床规模的预测基于不同成因类型铜矿大数据的综合分析,数据的数据和质量是影响预测准确度的重要因素。
建立铜矿规模预测指标体系,包括勘查程度、成矿区带、成矿时代、赋矿地层、主岩、蚀变种类、硅化、矽卡岩化、绿泥石化/绿帘石化、钾长石化、绢云母化、碳酸盐化、蚀变分带性、矿石类型、裂隙发育程度、岩体出露面积、成矿温度、成矿盐度、是否处在汇聚型板块边缘、是否在俯冲带上、矿体总数、构造复杂程度、主矿体形态、矿体平均埋深、累计查明资源储量等。
对铜矿规模预测指标进行预处理;对连续数据进行标准化处理,对离散数据进行分类赋值。如指标项是否在俯冲带上,在俯冲带上记为1,不在俯冲带上记为0。蚀变类型转化为硅化、矽卡岩化、绿泥石化/绿帘石化、钾长石化、绢云母化、碳酸盐化等指标,出现该蚀变特征记为1,未出现记为0。
将矿床资源储量确定为因变量(预测目标),其他数据项为自变量(影响因素)。矿床资源储量具体指矿床的累计资源储量。利用ChiMerge算法对连续变量进行离散化处理,将连续变量转化为不同值域区间的离散变量。建立铜矿规模预测数据集;
通过反复迭代构建随机森林模型,建立铜矿规模预测指标项和矿床规模之间的关系模型。
构建初始随机森林模型,根据袋外数据(OOB)错误率对自变量重要性进行排序,保留80%数量的自变量,重新构建随机森林模型,重复这一过程直到自变量数量少于自变量总数的平方根;例如初始参加计算的一共有24个自变量,构建初始随机森林模型,通过bootstrap抽样方式产生500个样本子集,每次从24个自变量中随机选择5个自变量进行训练,输出袋外数据错误率,对24个自变量的重要性进行排序,保留前19个自变量,构建新的随机森林模型,重复这一过程,直到自变量个数少于5个时,停止计算。
根据每个随机森林模型训练数据的错误率,筛选出最优的随机森林模型,利用随机森林模型构建预测模型对目标铜矿数据进行预测,得到目标铜矿项目的矿床规模级别和概率。
最优的随机森林模型包含12个自变量组合,具体为主岩、是否在俯冲带上、构造复杂程度、蚀变种类、赋矿地层、成矿温度、品位、勘查程度、裂隙发育程度、绿泥石化/绿帘石化、平均埋深和矿体形态。
本发明将矿床成矿理论与机器学习方法相结合,能够基于现有不同类型铜矿数据,对目标铜矿项目的矿床规模进行预判,通过验证数据证明本发明有较高的准确率和参考价值。
图2为本发明所提供的一种铜矿矿床规模预测系统结构示意图,如图2所示,本发明所提供的一种铜矿矿床规模预测系统,包括:数据获取模块201、铜矿项目数据库确定模块202、铜矿规模预测指标体系确定模块203、铜矿规模预测数据集确定模块204、预测模型确定模块205和预测模块206。
数据获取模块201用于获取现有的铜矿的项目数据和资料;所述项目数据包括项目名称、所属国家、所属地区、经度、纬度、大地构造位置、成矿区带、矿床成因类型、成矿时代、成矿作用、赋矿地层、主岩、蚀变类型、矿石类型、矿体特征、累计查明资源储量、平均品位、成矿温度、成矿盐度和勘查程度;所述资料包括:矿区地质详查报告和钻探勘查报告。
铜矿项目数据库确定模块202用于根据所述项目数据和所述资料确定铜矿项目数据库。
铜矿规模预测指标体系确定模块203用于根据所述铜矿项目数据库,分析影响铜矿规模的关键因素,确定铜矿规模预测指标体系;所述关键因素包括勘查程度、成矿区带、成矿时代、赋矿地层、主岩、蚀变类型和岩体出露面积;所述铜矿规模预测指标体系包括多项铜矿规模预测指标;所述铜矿规模预测指标为是否在俯冲带上、是否在汇聚型板块边缘、成矿时代、赋矿地层、主岩、蚀变种类、蚀变分带性、矿石类型、裂隙发育程度、岩体出露面积、成矿温度、成矿盐度、平均品位、勘查程度、构造复杂程度、矿体总数、主矿体形态或矿体平均埋深。
铜矿规模预测数据集确定模块204用于对每项所述铜矿规模预测指标进行预处理,确定铜矿规模预测数据集;所述预处理包括分类、标准化处理和离散化处理。
预测模型确定模块205用于根据所述铜矿规模预测数据集,采用随机森林模型,确定预测模型;所述预测模型以所述铜矿规模预测数据集为输入,以矿床规模级别为输出。
预测模块206用于利用所述预测模型对待预测的铜矿矿床规模级别进行预测。
所述铜矿规模预测数据集确定模块具体包括:分类单元、标准化处理单元、分类赋值单元、离散化处理单元和铜矿规模预测数据集确定单元。
分类单元用于对所述铜矿规模预测指标进行分类,得到连续数据和离散数据。
标准化处理单元用于对所述连续数据进行标准化处理。
分类赋值单元用于对所述离散数据进行分类赋值。
离散化处理单元用于根据标准化处理后的数据,利用ChiMerge算法进行离散化处理。
铜矿规模预测数据集确定单元用于根据所述离散化处理后的数据和分类赋值后的数据确定所述铜矿规模预测数据集。
所述标准化处理单元具体包括:标准化处理子单元
标准化处理子单元用于利用公式
Figure BDA0002550357020000111
对所述连续数据进行标准化处理;其中,Xs为标准化变量,X为连续数据,Xmin为连续数据的最小值;Xmax为连续数据的最大值。
本发明所提供的一种铜矿矿床规模预测系统还包括:初始随机森林模型确定模块和随机森林模型确定模块。
初始随机森林模型确定模块用于以所述铜矿规模预测数据集为输入,采用10折交叉验证方法确定初始随机森林模型。
随机森林模型确定模块用于根据所述铜矿规模预测数据集通过迭代确定随机森林模型。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (8)

1.一种铜矿矿床规模预测方法,其特征在于,包括:
获取现有的铜矿的项目数据和资料;所述项目数据包括项目名称、所属国家、所属地区、经度、纬度、大地构造位置、成矿区带、矿床成因类型、成矿时代、成矿作用、赋矿地层、主岩、蚀变类型、矿石类型、矿体特征、累计查明资源储量、平均品位、成矿温度、成矿盐度和勘查程度;所述资料包括:矿区地质详查报告和钻探勘查报告;
根据所述项目数据和所述资料确定铜矿项目数据库;
根据所述铜矿项目数据库,分析影响铜矿规模的关键因素,确定铜矿规模预测指标体系;所述关键因素包括勘查程度、成矿区带、成矿时代、赋矿地层、主岩、蚀变类型和岩体出露面积;所述铜矿规模预测指标体系包括多项铜矿规模预测指标;所述铜矿规模预测指标为是否在俯冲带上、是否在汇聚型板块边缘、成矿时代、赋矿地层、主岩、蚀变种类、蚀变分带性、矿石类型、裂隙发育程度、岩体出露面积、成矿温度、成矿盐度、平均品位、勘查程度、构造复杂程度、矿体总数、主矿体形态或矿体平均埋深;
对每项所述铜矿规模预测指标进行预处理,确定铜矿规模预测数据集;所述预处理包括分类、标准化处理和离散化处理;
根据所述铜矿规模预测数据集,采用随机森林模型,确定预测模型;所述预测模型以所述铜矿规模预测数据集为输入,以矿床规模级别为输出;
利用所述预测模型对待预测的铜矿矿床规模级别进行预测。
2.根据权利要求1所述的一种铜矿矿床规模预测方法,其特征在于,所述对每项所述铜矿规模预测指标进行预处理,确定铜矿规模预测数据集,具体包括:
对所述铜矿规模预测指标进行分类,得到连续数据和离散数据;
对所述连续数据进行标准化处理;
对所述离散数据进行分类赋值;
根据标准化处理后的数据,利用ChiMerge算法进行离散化处理;
根据所述离散化处理后的数据和分类赋值后的数据确定所述铜矿规模预测数据集。
3.根据权利要求2所述的一种铜矿矿床规模预测方法,其特征在于,所述对所述连续数据进行标准化处理,具体包括:
利用公式
Figure FDA0002550357010000021
对所述连续数据进行标准化处理;其中,Xs为标准化变量,X为连续数据,Xmin为连续数据的最小值;Xmax为连续数据的最大值。
4.根据权利要求1所述的一种铜矿矿床规模预测方法,其特征在于,所述根据所述铜矿规模预测数据集,采用随机森林模型,确定预测模型,之前包括:
以所述铜矿规模预测数据集为输入,采用10折交叉验证方法确定初始随机森林模型;
根据所述铜矿规模预测数据集通过迭代确定随机森林模型。
5.一种铜矿矿床规模预测系统,其特征在于,包括:
数据获取模块,用于获取现有的铜矿的项目数据和资料;所述项目数据包括项目名称、所属国家、所属地区、经度、纬度、大地构造位置、成矿区带、矿床成因类型、成矿时代、成矿作用、赋矿地层、主岩、蚀变类型、矿石类型、矿体特征、累计查明资源储量、平均品位、成矿温度、成矿盐度和勘查程度;所述资料包括:矿区地质详查报告和钻探勘查报告;
铜矿项目数据库确定模块,用于根据所述项目数据和所述资料确定铜矿项目数据库;
铜矿规模预测指标体系确定模块,用于根据所述铜矿项目数据库,分析影响铜矿规模的关键因素,确定铜矿规模预测指标体系;所述关键因素包括勘查程度、成矿区带、成矿时代、赋矿地层、主岩、蚀变类型和岩体出露面积;所述铜矿规模预测指标体系包括多项铜矿规模预测指标;所述铜矿规模预测指标为是否在俯冲带上、是否在汇聚型板块边缘、成矿时代、赋矿地层、主岩、蚀变种类、蚀变分带性、矿石类型、裂隙发育程度、岩体出露面积、成矿温度、成矿盐度、平均品位、勘查程度、构造复杂程度、矿体总数、主矿体形态或矿体平均埋深;
铜矿规模预测数据集确定模块,用于对每项所述铜矿规模预测指标进行预处理,确定铜矿规模预测数据集;所述预处理包括分类、标准化处理和离散化处理;
预测模型确定模块,用于根据所述铜矿规模预测数据集,采用随机森林模型,确定预测模型;所述预测模型以所述铜矿规模预测数据集为输入,以矿床规模级别为输出;
预测模块,用于利用所述预测模型对待预测的铜矿矿床规模级别进行预测。
6.根据权利要求5所述的一种铜矿矿床规模预测系统,其特征在于,所述铜矿规模预测数据集确定模块具体包括:
分类单元,用于对所述铜矿规模预测指标进行分类,得到连续数据和离散数据;
标准化处理单元,用于对所述连续数据进行标准化处理;
分类赋值单元,用于对所述离散数据进行分类赋值;
离散化处理单元,用于根据标准化处理后的数据,利用ChiMerge算法进行离散化处理;
铜矿规模预测数据集确定单元,用于根据所述离散化处理后的数据和分类赋值后的数据确定所述铜矿规模预测数据集。
7.根据权利要求6所述的一种铜矿矿床规模预测系统,其特征在于,所述标准化处理单元具体包括:
标准化处理子单元,用于利用公式
Figure FDA0002550357010000031
对所述连续数据进行标准化处理;其中,Xs为标准化变量,X为连续数据,Xmin为连续数据的最小值;Xmax为连续数据的最大值。
8.根据权利要求5所述的一种铜矿矿床规模预测系统,其特征在于,还包括:
初始随机森林模型确定模块,用于以所述铜矿规模预测数据集为输入,采用10折交叉验证方法确定初始随机森林模型;
随机森林模型确定模块,用于根据所述铜矿规模预测数据集通过迭代确定随机森林模型。
CN202010573091.3A 2020-06-22 2020-06-22 一种铜矿矿床规模预测方法及系统 Pending CN111709189A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010573091.3A CN111709189A (zh) 2020-06-22 2020-06-22 一种铜矿矿床规模预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010573091.3A CN111709189A (zh) 2020-06-22 2020-06-22 一种铜矿矿床规模预测方法及系统

Publications (1)

Publication Number Publication Date
CN111709189A true CN111709189A (zh) 2020-09-25

Family

ID=72542161

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010573091.3A Pending CN111709189A (zh) 2020-06-22 2020-06-22 一种铜矿矿床规模预测方法及系统

Country Status (1)

Country Link
CN (1) CN111709189A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115759815A (zh) * 2022-11-03 2023-03-07 中国科学院广州地球化学研究所 一种利用地壳成熟度指数判断斑岩铜矿类型的勘查方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109711597A (zh) * 2018-11-14 2019-05-03 东莞理工学院 一种基于分层随机森林模型的铜镍硫化物矿床成矿预测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109711597A (zh) * 2018-11-14 2019-05-03 东莞理工学院 一种基于分层随机森林模型的铜镍硫化物矿床成矿预测方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
向杰;陈建平;肖克炎;李诗;张志平;张烨;: "基于机器学习的三维矿产定量预测――以四川拉拉铜矿为例", 地质通报 *
吕鹏;陈建平;张路锁;朱鹏飞;曾敏;: "基于矿床规模模型的西南三江北段区域资源潜力定量预测与评价", 地质与勘探 *
张士红;肖克炎;: "基于随机森林的四川省会理地区"拉拉式"铜矿成矿预测", 地质与勘探 *
张野等: "基于金矿规格单元数据的机器学习方法在成矿建模分析中的应用", 大地构造与成矿学 *
徐仕琪;冯京;冯昌荣;张连昌;张帮禄;: "新疆西昆仑玛尔坎苏-穆呼锰矿带地质特征与定量预测", 新疆地质 *
钟婉婷等: "中国西南部乌蒙山区矿产地信息数据集", 中国地质 *
陈进;毛先成;刘占坤;邓浩;: "基于随机森林算法的大尹格庄金矿床三维成矿预测", 大地构造与成矿学 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115759815A (zh) * 2022-11-03 2023-03-07 中国科学院广州地球化学研究所 一种利用地壳成熟度指数判断斑岩铜矿类型的勘查方法
CN115759815B (zh) * 2022-11-03 2023-11-03 中国科学院广州地球化学研究所 一种利用地壳成熟度指数判断斑岩铜矿类型的勘查方法

Similar Documents

Publication Publication Date Title
CN100465998C (zh) 基于三维建模的立方体预测模型找矿方法
Namin et al. A literature review of Multi Criteria Decision-Making (MCDM) towards mining method selection (MMS)
CN113946950B (zh) 一种快速圈定金矿找矿靶区的方法
Isheyskiy et al. Prospects of applying MWD technology for quality management of drilling and blasting operations at mining enterprises
CN110619353B (zh) 一种基于深度学习的多尺度测井曲线自动识别方法
CN107038505B (zh) 基于机器学习的找矿模型预测方法
CN109800954B (zh) 基于测井数据的储层评价方法
Huang et al. Research on Piper-PCA-Bayes-LOOCV discrimination model of water inrush source in mines
CN113344050A (zh) 一种基于深度学习的岩性智能化识别方法及系统
CN103617147A (zh) 一种矿井突水水源层识别方法
CN110347720B (zh) 基于流程化的压裂选井选层方法
CN117272181B (zh) 采用机器学习建模来判别锆石宿主岩石和成矿环境的方法
CN107942383A (zh) 煤层顶板砂岩富水性等级预测方法
CN114925918A (zh) 一种海外金属矿产找矿靶区优选方法及系统
Zhou et al. Novel approach to evaluate rock mass fragmentation in block caving using unascertained measurement model and information entropy with flexible credible identification criterion
CN114638300A (zh) 一种识别页岩油气藏“甜点”的方法、装置及存储介质
CN111709189A (zh) 一种铜矿矿床规模预测方法及系统
CN118133104A (zh) 一种深层海相页岩气井岩相快速识别方法
Ji et al. Study on key technology of identification of mine water inrush source by PSO-LightGBM
Fillion et al. Quantifying influence of drilling additional boreholes on quality of geological model
CN111155980B (zh) 一种水流优势通道识别方法及装置
CN116500697A (zh) 一种水文地质勘察方法
Dominy et al. Sampling and testwork protocol development for geometallurgical characterisation of a sheeted vein gold deposit
Pauling et al. Geothermal Play Fairway Analysis Best Practices
Partington Exploration targeting using GIS: More than a digital light table

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200925