CN117216576A - 一种基于高斯混合聚类分析的石墨金矿找矿方法 - Google Patents
一种基于高斯混合聚类分析的石墨金矿找矿方法 Download PDFInfo
- Publication number
- CN117216576A CN117216576A CN202311398876.1A CN202311398876A CN117216576A CN 117216576 A CN117216576 A CN 117216576A CN 202311398876 A CN202311398876 A CN 202311398876A CN 117216576 A CN117216576 A CN 117216576A
- Authority
- CN
- China
- Prior art keywords
- gaussian mixture
- data
- unit
- graphite
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000000203 mixture Substances 0.000 title claims abstract description 94
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 title claims abstract description 75
- 239000010931 gold Substances 0.000 title claims abstract description 75
- 229910052737 gold Inorganic materials 0.000 title claims abstract description 75
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 title claims abstract description 73
- 239000010439 graphite Substances 0.000 title claims abstract description 72
- 229910002804 graphite Inorganic materials 0.000 title claims abstract description 72
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000009826 distribution Methods 0.000 claims abstract description 44
- 238000012549 training Methods 0.000 claims abstract description 29
- 230000002159 abnormal effect Effects 0.000 claims abstract description 17
- 238000007621 cluster analysis Methods 0.000 claims abstract description 15
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 238000002360 preparation method Methods 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 claims abstract description 5
- 238000001179 sorption measurement Methods 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 13
- 239000011435 rock Substances 0.000 claims description 12
- 238000005188 flotation Methods 0.000 claims description 11
- 229910052500 inorganic mineral Inorganic materials 0.000 claims description 11
- 238000011835 investigation Methods 0.000 claims description 11
- 239000011707 mineral Substances 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 9
- IZLAVFWQHMDDGK-UHFFFAOYSA-N gold(1+);cyanide Chemical compound [Au+].N#[C-] IZLAVFWQHMDDGK-UHFFFAOYSA-N 0.000 claims description 7
- 230000001276 controlling effect Effects 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 5
- 238000007476 Maximum Likelihood Methods 0.000 claims description 4
- 239000012736 aqueous medium Substances 0.000 claims description 4
- 230000001105 regulatory effect Effects 0.000 claims description 3
- 230000007613 environmental effect Effects 0.000 abstract description 2
- 230000000694 effects Effects 0.000 description 10
- 230000004075 alteration Effects 0.000 description 4
- 230000033558 biomineral tissue development Effects 0.000 description 3
- 239000012535 impurity Substances 0.000 description 3
- 238000003723 Smelting Methods 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000007480 spreading Effects 0.000 description 2
- 238000003892 spreading Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 239000013076 target substance Substances 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000005189 flocculation Methods 0.000 description 1
- 230000016615 flocculation Effects 0.000 description 1
- 238000000227 grinding Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- JQJCSZOEVBFDKO-UHFFFAOYSA-N lead zinc Chemical compound [Zn].[Pb] JQJCSZOEVBFDKO-UHFFFAOYSA-N 0.000 description 1
- 239000006028 limestone Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000005456 ore beneficiation Methods 0.000 description 1
- 230000033116 oxidation-reduction process Effects 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Landscapes
- Analysing Materials By The Use Of Radiation (AREA)
Abstract
本发明公开了一种基于高斯混合聚类分析的石墨金矿找矿方法,属于找矿领域,包括数据准备单元、数据预处理单元、高斯混合模型参数设置单元、模型训练单元、聚类单元、异常圈定单元和找矿预测单元,所述数据预处理单元用于处理收集的数据,所述高斯混合模型参数设置单元使用处理后的数据求出混合高斯分布的各个参数,所述模型训练单元使用EM算法进行训练计算后验概率,所述聚类单元根据模型训练单元中计算出的最大化后验概率完成类别判断,所述异常圈定单元用于圈定聚类单元中出现的异常点,所述找矿预测单元使用训练好的高斯混合模型对未知区域进行预测。本发明具有高效、准确、环保等优点,大大提高石墨金矿的找矿效率,降低找矿成本。
Description
技术领域
本发明涉及找矿技术领域,具体为一种基于高斯混合聚类分析的石墨金矿找矿方法。
背景技术
石墨金矿是一种含有石墨或其它形态碳物质的金矿,能够通过地球化学方法、物理勘探方法、遥感技术和综合找矿方法,同时结合成矿地质条件和区域矿产分布规律的地质信息,来对石墨金矿的分布和成矿潜力做出准确的评估和预测,然而这种方法在找矿效率较慢,且找矿的成本偏高。
现有的石墨金矿找矿方法存在的缺陷是:
1、在专利文件JP2015536457A中,通过电子与构成样品的原子相互作用并产生提供关于样品的表面形状、组成和其他性质的信息的信号,形成样品的表面结构的特征性三维外观,并没有考虑到现有的找矿方法的成本较高且较为复杂,找矿的效率较低;
2、在专利文件US20130105606A1中,主要是对矿物提取过程中的出现的杂质进行二次处理,提高资源利用率,降低能耗,并没有考虑到现有的找矿方法使用的模型的预测结果准确率低的问题;
3、在专利文件CN105277993B中,主要考虑如何有效地圈定和缩小找矿靶区,并没有考虑到现有的找矿方法在使用时数据较为单一,构件的模型拟合效果较差;
4、在专利文件CN113031105A中,主要通过地层岩性与岩相,以及地质构造等因素,能够较为准确的找出隐伏在地层下部的藻灰岩区域,从而确定隐伏铅锌矿,并没有根据矿石的结构不同选择不同的选矿方式,灵活性较差。
发明内容
本发明的目的在于提供一种基于高斯混合聚类分析的石墨金矿找矿方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于高斯混合聚类分析的石墨金矿找矿方法,包括数据准备单元、数据预处理单元、高斯混合模型参数设置单元、模型训练单元、聚类单元、异常圈定单元和找矿预测单元;
所述数据准备单元用于收集数据,所述数据预处理单元用于处理数据准备单元收集的数据,所述高斯混合模型参数设置单元使用数据预处理单元处理后的数据求出混合高斯分布的各个参数,所述模型训练单元使用EM算法进行训练计算后验概率,所述聚类单元根据模型训练单元中计算出的最大化后验概率完成类别判断,所述异常圈定单元用于圈定聚类单元中出现的异常点,所述找矿预测单元使用训练好的高斯混合模型对未知区域进行预测。
优选的,找矿方法如下:
S1、收集包含石墨金矿和不含石墨金矿的区域的地质数据;
S2、对这些数据进行清洗,标准化和归一化操作;
S3、使用已知的金矿数据即训练集来训练一个高斯混合模型(GMM),将数据点划分为多个“簇”,每个簇都是由一个高斯分布描述;
S4、观察两个概率值的接近程度来判断一个模型是否拟合良好,并通过EM算法反复迭代这个过程,直到两个概率值非常接近时停止更新并完成模型训练;
S5、通过选择最大化后延概率来完成聚类,并使用训练好的高斯混合模型(GMM)对未知数据进行聚类分析,得到不同的簇;
S6、找出步骤S5中聚类结果中的异常点,并将其圈定出来;
S7、将聚类结果可视化,根据不同簇的特征,以显示哪些数据点被归类为金矿。
优选的,在步骤S1中,还包括如下步骤:
收集的地质数据包括岩石类型、矿物组成、岩石化学分析和岩石物理特性中的一种或多种。
优选的,在步骤S4中,还包括如下步骤:
S4-1、两个概率分别为采样的概率值和模型概率值;
S4-2、在训练过程中,EM算法会尝试找到使所有数据点分配到最合适的簇的最佳参数;
S4-3、假设所有的数据样本X都是由某一个给定参数的多元高斯分布所生成的,一个高斯混合模型的概率密度函数可以由K个多元高斯分布组合成的混合分布表示:
其中,p(X|μ,∑)为服从高斯分布的n维随机向量X的概率密度函数
其中,μ为n维均值向量,Σ为n*n的协方差矩阵,(X-μ)T为(X-μ)的转置向量,μi和Σi为第i个高斯混合成分的参数;
高斯混合模型由K个不同的多元高斯分布共同组成,每一个分布被称为高斯混合模型中的一个成分,ωi为第i个多元高斯分布在混合模型中的权重,且有
假设已有一个存在的高斯混合模型,那么,样本空间中的样本的生成过程即:以ω1,ω2,……ωK作为概率,选择出一个混合成分,根据该混合成分的概率密度函数,采样产生出相应的样本;
那么,利用高斯混合模型(GMM)进行聚类的过程就是利用高斯混合模型(GMM)生成数据样本的“逆过程”:给定聚类簇数K,通过给定的m个数据样本,推导出每一个混合成分的参数,均值向量μ、协方差矩阵Σ和权重ω,每一个多元高斯分布成分即对应于聚类后的一个簇;
高斯混合模型在训练时使用了极大似然估计法,最大化以下对数似然函数:
然后进行EM算法迭代,步骤如下:
步骤一:根据给定的K值,初始化K个多元高斯分布以及其权重;
步骤二:根据贝叶斯定理,估计每个样本由每个成分生成的后验概率;
步骤三:根据均值,协方差的定义以及步骤二中求出的后验概率,更新均值向量、协方差矩阵和权重;
步骤四:重复步骤二和步骤三,直到似然函数增加值已小于收敛阈值,或达到最大迭代次数。
优选的,在步骤一中,还包括如下步骤:
输入样本集D={X1,X2,……,Xm},高斯混合成分个数K,初始化高斯混合分布的模型参数{(ωi,μi,Σi|(1≤i≤K))}。
优选的,在步骤二中,还包括如下步骤:
计算样本Xj由第i个混合成分生成的后验概率:
优选的,在步骤S6中,还包括如下步骤:
用EM算法来拟合数据,可以找到多维高斯模型概率分布的混合表示,从而拟合出任意形状的数据分布,算出每个数据点属于各个类的后验概率,并根据后验概率将异常点圈定出来。
优选的,在步骤S7中,还包括以下步骤:
使用训练好的高斯混合模型对未知区域进行预测,根据模型输出的概率值判断该区域是否有石墨金矿存在的可能性,对预测有石墨金矿存在的区域进行野外调查,验证预测结果的准确性,根据野外调查的结果,研究石墨金矿的成矿模式,指导下一步找矿工作。
优选的,在野外调查的过程中,在预测有石墨金矿存在区域的地方进行采样操作,并对采样出来的岩石进行处理,然后选矿,并根据选矿的结果确认是否存在石墨金矿。
优选的,在选矿时,根据矿石中石墨和金吸附方式的不同选择不同的选矿方式;
通过控制溶液pH值和矿浆浓度来调整矿物浮选所需溶液酸碱度;
控制水介质中金氰络合物的浓度和吸附时间来控制金氰络合物的吸附;
通过添加絮凝剂来吸附石墨,从而降低石墨的吸附性。
与现有技术相比,本发明的有益效果是:
1、本发明具有高效、准确、环保等优点,大大提高石墨金矿的找矿效率,降低找矿成本。
2、本发明使用训练好的高斯混合模型对未知区域进行预测,根据模型输出的概率值判断该区域是否有石墨金矿存在的可能性,对预测有石墨金矿存在的区域进行野外调查,验证预测结果的准确性,如果存在根据分析的结果判断矿床的类型和规模,研究各矿床地质特征、形成的地质构造环境,系统总结各矿床的空间分布、矿化蚀变特征及控矿因素、矿体产出及展布特征,为后续研究石墨金矿的质量和规模提供便利。
3、本发明通过收集多项地质数据,对这些数据进行处理和分析,以便更好地理解数据的特征和分布,提高数据质量,从而为后续的高斯模型参数设置提供便利,进而能够提高模型拟合的效果。
4、本发明通过矿石中,石墨和金吸附方式的不同选择不同的操作方法来分离矿石组分,确保石墨金矿选矿产品的质量。
附图说明
图1为本发明的流程图;
图2为本发明的样品采集的流程图;
图3为本发明的野外调查的流程图;
图4为本发明的找矿的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
请参阅图1,本发明提供的一种实施例:一种基于高斯混合聚类分析的石墨金矿找矿方法,包括数据准备单元、数据预处理单元、高斯混合模型参数设置单元、模型训练单元、聚类单元、异常圈定单元和找矿预测单元;
数据准备单元用于收集数据,数据预处理单元用于处理数据准备单元收集的数据,高斯混合模型参数设置单元使用数据预处理单元处理后的数据求出混合高斯分布的各个参数,模型训练单元使用EM算法进行训练计算后验概率,聚类单元根据模型训练单元中计算出的最大化后验概率完成类别判断,异常圈定单元用于圈定聚类单元中出现的异常点,找矿预测单元使用训练好的高斯混合模型对未知区域进行预测。
进一步,首先收集与石墨金矿相关的地质数据,如地层、构造、岩性、矿产等,对收集到的数据进行清洗、整理和标准化处理,以消除异常值和缺失值,并将数据转换为一个统一的格式,然后通过高斯混合模型参数设置将数据划分为不同的群组或类别,通过最大期望算法,估计高斯混合模型的参数,包括每个类别的均值、方差和权重,并利用适当的指标评估高斯混合模型的性能,根据高斯混合模型的聚类结果,评估各地区石墨金矿的找矿潜力,根据评估结果,制定找矿方案和实施计划。
实施例二
请参阅图1,本发明提供的一种实施例:一种基于高斯混合聚类分析的石墨金矿找矿方法,找矿方法如下:
S1、收集包含石墨金矿和不含石墨金矿的区域的地质数据;
S2、对这些数据进行清洗,标准化和归一化操作;
S3、使用已知的金矿数据即训练集来训练一个高斯混合模型(GMM),将数据点划分为多个“簇”,每个簇都是由一个高斯分布描述;
S4、观察两个概率值的接近程度来判断一个模型是否拟合良好,并通过EM算法反复迭代这个过程,直到两个概率值非常接近时停止更新并完成模型训练;
S5、通过选择最大化后延概率来完成聚类,并使用训练好的高斯混合模型(GMM)对未知数据进行聚类分析,得到不同的簇;
S6、找出步骤S5中聚类结果中的异常点,并将其圈定出来;
S7、将聚类结果可视化,根据不同簇的特征,以显示哪些数据点被归类为金矿。
在步骤S1中,还包括如下步骤:
收集的地质数据包括岩石类型、矿物组成、岩石化学分析和岩石物理特性中的一种或多种。
在步骤S6中,还包括如下步骤:
用EM算法来拟合数据,可以找到多维高斯模型概率分布的混合表示,从而拟合出任意形状的数据分布,算出每个数据点属于各个类的后验概率,并根据后验概率将异常点圈定出来。
进一步,数据预处理是为了提高数据的质量和可靠性,为后续的模型训练和评估提供更好的数据基础,数据的采集需要保证数据的全面性和准确性;数据清洗可以去掉无效数据和异常值,提高数据的质量,便于模型训练和评估。
实施例三
请参阅图1,本发明提供的一种实施例:一种基于高斯混合聚类分析的石墨金矿找矿方法,在步骤S4中,还包括如下步骤:
S4-1、两个概率分别为采样的概率值和模型概率值;
S4-2、在训练过程中,EM算法会尝试找到使所有数据点分配到最合适的簇的最佳参数;
S4-3、假设所有的数据样本X都是由某一个给定参数的多元高斯分布所生成的,一个高斯混合模型的概率密度函数可以由K个多元高斯分布组合成的混合分布表示:
其中,p(X|μ,∑)为服从高斯分布的n维随机向量X的概率密度函数
其中,μ为n维均值向量,Σ为n*n的协方差矩阵,(X-μ)T为(X-μ)的转置向量,μi和Σi为第i个高斯混合成分的参数;
高斯混合模型由K个不同的多元高斯分布共同组成,每一个分布被称为高斯混合模型中的一个成分,ωi为第i个多元高斯分布在混合模型中的权重,且有
假设已有一个存在的高斯混合模型,那么,样本空间中的样本的生成过程即:以ω1,ω2,……ωK作为概率,选择出一个混合成分,根据该混合成分的概率密度函数,采样产生出相应的样本;
那么,利用高斯混合模型(GMM)进行聚类的过程就是利用高斯混合模型(GMM)生成数据样本的“逆过程”:给定聚类簇数K,通过给定的m个数据样本,推导出每一个混合成分的参数,均值向量μ、协方差矩阵Σ和权重ω,每一个多元高斯分布成分即对应于聚类后的一个簇;
高斯混合模型在训练时使用了极大似然估计法,最大化以下对数似然函数:
然后进行EM算法迭代,步骤如下:
步骤一:根据给定的K值,初始化K个多元高斯分布以及其权重;
步骤二:根据贝叶斯定理,估计每个样本由每个成分生成的后验概率;
步骤三:根据均值,协方差的定义以及步骤二中求出的后验概率,更新均值向量、协方差矩阵和权重;
步骤四:重复步骤二和步骤三,直到似然函数增加值已小于收敛阈值,或达到最大迭代次数。
在步骤一中,还包括如下步骤:
输入样本集D={X1,X2,……,Xm},高斯混合成分个数K,初始化高斯混合分布的模型参数{(ωi,μi,Σi|(1≤i≤K))}。
在步骤二中,还包括如下步骤:
计算样本Xj由第i个混合成分生成的后验概率:
进一步,在后验概率计算中,高斯混合模型可以描述数据生成的机制和规律,帮助我们更好地理解和分析数据,并使用最大似然估计来对模型参数进行估计,以便更好地拟合数据和提高预测效果。
实施例四
请参阅图1,本发明提供的一种实施例:一种基于高斯混合聚类分析的石墨金矿找矿方法,在步骤S7中,还包括以下步骤:
使用训练好的高斯混合模型对未知区域进行预测,根据模型输出的概率值判断该区域是否有石墨金矿存在的可能性,对预测有石墨金矿存在的区域进行野外调查,验证预测结果的准确性,根据野外调查的结果,研究石墨金矿的成矿模式,指导下一步找矿工作。
进一步,使用训练好的高斯混合模型对未知区域进行预测,根据模型输出的概率值对各种现象、信息、数据进行综合分析、对比、研究,总结规律、建立成矿模式,确定找矿方向,圈定找矿靶区。
实施例五
请参阅图3和图4,本发明提供的一种实施例:一种基于高斯混合聚类分析的石墨金矿找矿方法,在野外调查的过程中,在预测有石墨金矿存在区域的地方进行采样操作,并对采样出来的岩石进行处理,然后选矿,并根据选矿的结果确认是否存在石墨金矿。
进一步,在野外调查的过程中,首先判断该区域内的岩石类型是否为变质岩类型,如果是,则在不同构造部位、不同成矿阶段、不同蚀变程度的围岩、矿石、脉岩、蚀变岩和构造岩中采集样品,并分析判断是否存在石墨金矿,如果存在根据分析的结果判断矿床的类型和规模,研究各矿床地质特征、形成的地质构造环境,系统总结各矿床的空间分布、矿化蚀变特征及控矿因素、矿体产出及展布特征,反之则结束找寻,当检测到该区域内的岩石类型并不是变质岩类型时,则分析判断该区域内的地质构造是否为断层褶皱地貌,如果是则分析判断是否存在石墨金矿,如果存在根据分析的结果判断矿床的类型和规模,反之则结束找寻,如果该区域内的地质构造并不是断层褶皱地貌则结束寻找,同时说明训练好的高斯混合模型存在较大误差,需重新调整。
实施例六
请参阅图2,本发明提供的一种实施例:一种基于高斯混合聚类分析的石墨金矿找矿方法,在选矿时,根据矿石中石墨和金吸附方式的不同选择不同的选矿方式;
通过控制溶液pH值和矿浆浓度来调整矿物浮选所需溶液酸碱度;
控制水介质中金氰络合物的浓度和吸附时间来控制金氰络合物的吸附;
通过添加絮凝剂来吸附石墨,从而降低石墨的吸附性。
进一步,将采样回来的矿石进行预处理操作,对原矿进行破碎筛分操作,以减小矿石的粒度和去除部分杂质,接着通过磨矿和选别来使矿石中的金矿和石墨充分解离,并去除其中的杂质;
在浮选时是利用金矿和石墨的密度差异进行分离,浮选一般采用浮选机设备,通过向矿浆中加入浮选药剂,使金矿上浮,而石墨则下沉,浮选效果的好坏直接影响着金矿和石墨的分离效果,在这一阶段需要注意控制浮选的条件,包括浮选温度、pH值、药剂种类和用量等,以保证浮选的效果;
金氰络合物的浓度越高,吸附效果通常越好,金氰络合物与目标物质的接触时间越长,吸附的效果也就越好,需要注意的是,过长的吸附时间可能会导致过度吸附或设备堵塞,在较高温度下,金氰络合物的分子热运动增强,增加了与目标物质碰撞的机会,有利于提高吸附效果,水介质中的离子强度、PH值、氧化还原电位同样影响金氰络合物的吸附效果;
絮凝剂能够选择性吸附石墨矿中的某种组分,并通过桥链作用产生絮凝沉淀,分离组分;
对选出的金矿进行冶炼操作使其转化为纯金,并在冶炼过程中注意控制温度、时间和酸碱度等条件,以保证金元素的回收率和纯度,并检测冶炼后金矿的化学成分和物理性能等方面,确保石墨金矿选矿产品的质量。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
Claims (10)
1.一种基于高斯混合聚类分析的石墨金矿找矿方法,其特征在于:包括数据准备单元、数据预处理单元、高斯混合模型参数设置单元、模型训练单元、聚类单元、异常圈定单元和找矿预测单元;
所述数据准备单元用于收集数据,所述数据预处理单元用于处理数据准备单元收集的数据,所述高斯混合模型参数设置单元使用数据预处理单元处理后的数据求出混合高斯分布的各个参数,所述模型训练单元使用EM算法进行训练计算后验概率,所述聚类单元根据模型训练单元中计算出的最大化后验概率完成类别判断,所述异常圈定单元用于圈定聚类单元中出现的异常点,所述找矿预测单元使用训练好的高斯混合模型对未知区域进行预测。
2.根据权利要求1所述的一种基于高斯混合聚类分析的石墨金矿找矿方法,其特征在于,找矿方法如下:
S1、收集包含石墨金矿和不含石墨金矿的区域的地质数据;
S2、对这些数据进行清洗,标准化和归一化操作;
S3、使用已知的金矿数据即训练集来训练一个高斯混合模型(GMM),将数据点划分为多个“簇”,每个簇都是由一个高斯分布描述;
S4、观察两个概率值的接近程度来判断一个模型是否拟合良好,并通过EM算法反复迭代这个过程,直到两个概率值非常接近时停止更新并完成模型训练;
S5、通过选择最大化后延概率来完成聚类,并使用训练好的高斯混合模型(GMM)对未知数据进行聚类分析,得到不同的簇;
S6、找出步骤S5中聚类结果中的异常点,并将其圈定出来;
S7、将聚类结果可视化,根据不同簇的特征,以显示哪些数据点被归类为金矿。
3.根据权利要求2所述的一种基于高斯混合聚类分析的石墨金矿找矿方法,其特征在于:在步骤S1中,还包括如下步骤:
收集的地质数据包括岩石类型、矿物组成、岩石化学分析和岩石物理特性中的一种或多种。
4.根据权利要求2所述的一种基于高斯混合聚类分析的石墨金矿找矿方法,其特征在于:在步骤S4中,还包括如下步骤:
S4-1、两个概率分别为采样的概率值和模型概率值;
S4-2、在训练过程中,EM算法会尝试找到使所有数据点分配到最合适的簇的最佳参数;
S4-3、假设所有的数据样本X都是由某一个给定参数的多元高斯分布所生成的,一个高斯混合模型的概率密度函数可以由K个多元高斯分布组合成的混合分布表示:
其中,p(X|μ,∑)为服从高斯分布的n维随机向量X的概率密度函数
其中,μ为n维均值向量,Σ为n*n的协方差矩阵,(X-μ)T为(X-μ)的转置向量,μi和Σi为第i个高斯混合成分的参数;
高斯混合模型由K个不同的多元高斯分布共同组成,每一个分布被称为高斯混合模型中的一个成分,ωi为第i个多元高斯分布在混合模型中的权重,且有
假设已有一个存在的高斯混合模型,那么,样本空间中的样本的生成过程即:以ω1,ω2,……ωK作为概率,选择出一个混合成分,根据该混合成分的概率密度函数,采样产生出相应的样本;
那么,利用高斯混合模型(GMM)进行聚类的过程就是利用高斯混合模型(GMM)生成数据样本的“逆过程”:给定聚类簇数K,通过给定的m个数据样本,推导出每一个混合成分的参数,均值向量μ、协方差矩阵Σ和权重ω,每一个多元高斯分布成分即对应于聚类后的一个簇;
高斯混合模型在训练时使用了极大似然估计法,最大化以下对数似然函数:
然后进行EM算法迭代,步骤如下:
步骤一:根据给定的K值,初始化K个多元高斯分布以及其权重;
步骤二:根据贝叶斯定理,估计每个样本由每个成分生成的后验概率;
步骤三:根据均值,协方差的定义以及步骤二中求出的后验概率,更新均值向量、协方差矩阵和权重;
步骤四:重复步骤二和步骤三,直到似然函数增加值已小于收敛阈值,或达到最大迭代次数。
5.根据权利要求4所述的一种基于高斯混合聚类分析的石墨金矿找矿方法,其特征在于:在步骤一中,还包括如下步骤:
输入样本集D={X1,X2,……,Xm},高斯混合成分个数K,初始化高斯混合分布的模型参数{(ωi,μi,Σi|(1≤i≤K))}。
6.根据权利要求4所述的一种基于高斯混合聚类分析的石墨金矿找矿方法,其特征在于:在步骤二中,还包括如下步骤:
计算样本Xj由第i个混合成分生成的后验概率:
7.根据权利要求2所述的一种基于高斯混合聚类分析的石墨金矿找矿方法,其特征在于:在步骤S6中,还包括如下步骤:
用EM算法来拟合数据,可以找到多维高斯模型概率分布的混合表示,从而拟合出任意形状的数据分布,算出每个数据点属于各个类的后验概率,并根据后验概率将异常点圈定出来。
8.根据权利要求2所述的一种基于高斯混合聚类分析的石墨金矿找矿方法,其特征在于:在步骤S7中,还包括以下步骤:
使用训练好的高斯混合模型对未知区域进行预测,根据模型输出的概率值判断该区域是否有石墨金矿存在的可能性,对预测有石墨金矿存在的区域进行野外调查,验证预测结果的准确性,根据野外调查的结果,研究石墨金矿的成矿模式,指导下一步找矿工作。
9.根据权利要求8所述的一种基于高斯混合聚类分析的石墨金矿找矿方法,其特征在于:在野外调查的过程中,在预测有石墨金矿存在区域的地方进行采样操作,并对采样出来的岩石进行处理,然后选矿,并根据选矿的结果确认是否存在石墨金矿。
10.根据权利要求9所述的一种基于高斯混合聚类分析的石墨金矿找矿方法,其特征在于:在选矿时,根据矿石中石墨和金吸附方式的不同选择不同的选矿方式;
通过控制溶液pH值和矿浆浓度来调整矿物浮选所需溶液酸碱度;
控制水介质中金氰络合物的浓度和吸附时间来控制金氰络合物的吸附;
通过添加絮凝剂来吸附石墨,从而降低石墨的吸附性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311398876.1A CN117216576B (zh) | 2023-10-26 | 2023-10-26 | 一种基于高斯混合聚类分析的石墨金矿找矿方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311398876.1A CN117216576B (zh) | 2023-10-26 | 2023-10-26 | 一种基于高斯混合聚类分析的石墨金矿找矿方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117216576A true CN117216576A (zh) | 2023-12-12 |
CN117216576B CN117216576B (zh) | 2024-03-29 |
Family
ID=89049404
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311398876.1A Active CN117216576B (zh) | 2023-10-26 | 2023-10-26 | 一种基于高斯混合聚类分析的石墨金矿找矿方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117216576B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117540332A (zh) * | 2024-01-10 | 2024-02-09 | 北京名道恒通信息技术有限公司 | 多工况离群点检测模型确定方法及多工况离群点检测方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130124167A1 (en) * | 2011-11-15 | 2013-05-16 | Chevron U.S.A. Inc. | Method for using multi-gaussian maximum-likelihood clustering and limited core porosity data in a cloud transform geostatistical method |
US10586165B1 (en) * | 2018-12-14 | 2020-03-10 | Sas Institute Inc. | Distributable clustering model training system |
US20200278467A1 (en) * | 2017-09-26 | 2020-09-03 | Schlumberger Technology Corporation | Apparatus and Methods for Improved Subsurface Data Processing Systems |
CN113946950A (zh) * | 2021-10-12 | 2022-01-18 | 青海省第三地质勘查院 | 一种快速圈定金矿找矿靶区的方法 |
US20220092455A1 (en) * | 2019-01-11 | 2022-03-24 | Nippon Telegraph And Telephone Corporation | Data analysis device, method, and program |
CN114997501A (zh) * | 2022-06-08 | 2022-09-02 | 河海大学 | 基于样本失衡的深度学习矿产资源分类预测方法及系统 |
CN115292933A (zh) * | 2022-08-05 | 2022-11-04 | 中国地质科学院地质力学研究所 | 分析成矿元素相关性的地理加权回归模型创建方法及装置 |
CN115983505A (zh) * | 2023-03-20 | 2023-04-18 | 山东黄金地质矿产勘查有限公司 | 一种固体矿产三维立体成矿预测方法及装置 |
CN116776949A (zh) * | 2023-06-30 | 2023-09-19 | 中国地质科学院矿产资源研究所 | 基于控矿要素制约的机器学习化探数据处理方法及系统 |
-
2023
- 2023-10-26 CN CN202311398876.1A patent/CN117216576B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130124167A1 (en) * | 2011-11-15 | 2013-05-16 | Chevron U.S.A. Inc. | Method for using multi-gaussian maximum-likelihood clustering and limited core porosity data in a cloud transform geostatistical method |
US20200278467A1 (en) * | 2017-09-26 | 2020-09-03 | Schlumberger Technology Corporation | Apparatus and Methods for Improved Subsurface Data Processing Systems |
US10586165B1 (en) * | 2018-12-14 | 2020-03-10 | Sas Institute Inc. | Distributable clustering model training system |
US20220092455A1 (en) * | 2019-01-11 | 2022-03-24 | Nippon Telegraph And Telephone Corporation | Data analysis device, method, and program |
CN113946950A (zh) * | 2021-10-12 | 2022-01-18 | 青海省第三地质勘查院 | 一种快速圈定金矿找矿靶区的方法 |
CN114997501A (zh) * | 2022-06-08 | 2022-09-02 | 河海大学 | 基于样本失衡的深度学习矿产资源分类预测方法及系统 |
CN115292933A (zh) * | 2022-08-05 | 2022-11-04 | 中国地质科学院地质力学研究所 | 分析成矿元素相关性的地理加权回归模型创建方法及装置 |
CN115983505A (zh) * | 2023-03-20 | 2023-04-18 | 山东黄金地质矿产勘查有限公司 | 一种固体矿产三维立体成矿预测方法及装置 |
CN116776949A (zh) * | 2023-06-30 | 2023-09-19 | 中国地质科学院矿产资源研究所 | 基于控矿要素制约的机器学习化探数据处理方法及系统 |
Non-Patent Citations (4)
Title |
---|
YUNHUI KONG ET AL.: "3D Mineral Prospectivity Mapping of Zaozigou Gold Deposit, West Qinling, CHina:Machine Learning-Based Mineral Prediction", 《MINERALS》, 26 October 2022 (2022-10-26), pages 1 - 31 * |
张亚光;陈建平;贾志杰;李诗;刘苏庆;张志平;张烨;: "基于循环神经网络的找矿模型构建与预测", 地质通报, no. 12, 15 December 2019 (2019-12-15), pages 99 - 108 * |
赖永炫: "Spark 2.1.0 入门:高斯混合模型(GMM)聚类算法", pages 1 - 4, Retrieved from the Internet <URL:https://dblab.xmu.edu.cn/blog/1456> * |
高鑫: "基于CNN及知识推理的找矿预测方法——以江西银坑-青塘地区为例", 《中国优秀硕士学位论文全文数据库基础科学辑》, 15 September 2023 (2023-09-15), pages 011 - 202 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117540332A (zh) * | 2024-01-10 | 2024-02-09 | 北京名道恒通信息技术有限公司 | 多工况离群点检测模型确定方法及多工况离群点检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117216576B (zh) | 2024-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gao et al. | Mapping mineral prospectivity for Cu polymetallic mineralization in southwest Fujian Province, China | |
Maepa et al. | Support vector machine and artificial neural network modelling of orogenic gold prospectivity mapping in the Swayze greenstone belt, Ontario, Canada | |
CN117216576B (zh) | 一种基于高斯混合聚类分析的石墨金矿找矿方法 | |
Huang et al. | Research on Piper-PCA-Bayes-LOOCV discrimination model of water inrush source in mines | |
Zhong et al. | Revealing the multi-stage ore-forming history of a mineral deposit using pyrite geochemistry and machine learning-based data interpretation | |
Khakmardan et al. | Copper oxide ore leaching ability and cementation behavior, mesgaran deposit in Iran | |
Liu et al. | Developments in quantitative assessment and modeling of mineral resource potential: an overview | |
Panahi et al. | Modelling lake sediment geochemical distribution using principal component, indicator kriging and multifractal power-spectrum analysis: a case study from Gowganda, Ontario | |
Cao et al. | Detection of geochemical anomalies related to mineralization using the Random Forest model optimized by the Competitive Mechanism and Beetle Antennae Search | |
CN114330841A (zh) | 一种基于机器学习的海底硫化物成矿定量预测方法 | |
Chen et al. | Detection of multivariate geochemical anomalies associated with gold deposits by using distance anomaly factors | |
Ghasemzadeh et al. | Recognition and incorporation of mineralization-efficient fault systems to produce a strengthened anisotropic geochemical singularity | |
Alipour Shahsavari et al. | Identification of geochemical anomalies using fractal and LOLIMOT neuro-fuzzy modeling in Mial area, Central Iran | |
CN116776949A (zh) | 基于控矿要素制约的机器学习化探数据处理方法及系统 | |
Ghannadpour et al. | Combination of separation methods and data mining techniques for prediction of anomalous areas in Susanvar, Central Iran | |
Ghannadpour et al. | An investigation of Pb geochemical behavior respect to those of Fe and Zn based on k-Means clustering method | |
Wang et al. | Determination of predictive variables in mineral prospectivity mapping using supervised and unsupervised methods | |
Chen et al. | Projection pursuit random forest for mineral prospectivity mapping | |
Chen et al. | Gold prospectivity modeling by combination of Laplacian eigenmaps and least angle regression | |
CN115272798B (zh) | 一种利用信息量扩充成矿预测训练正样本的方法及系统 | |
Singer et al. | Integrating spatial and frequency information in the search for kuroko deposits of the Hokuroku District, Japan | |
CN117313932A (zh) | 一种半监督矿产资源预测方法、装置、设备及存储介质 | |
Rezapour et al. | A clustering approach for mineral potential mapping: A deposit-scale porphyry copper exploration targeting | |
Dachri et al. | Predictive insights for copper recovery: A synergistic approach integrating variability data and machine learning in the geometallurgical study of the Tizert deposit, Morocco | |
Ranta et al. | SEM-based automated mineralogy (SEM-AM) and unsupervised machine learning studying the textural setting and elemental association of gold in the Rajapalot Au-Co area, northern Finland. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |