CN117370899A - 一种基于主成分-决策树模型的控矿因素权重确定方法 - Google Patents

一种基于主成分-决策树模型的控矿因素权重确定方法 Download PDF

Info

Publication number
CN117370899A
CN117370899A CN202311680776.8A CN202311680776A CN117370899A CN 117370899 A CN117370899 A CN 117370899A CN 202311680776 A CN202311680776 A CN 202311680776A CN 117370899 A CN117370899 A CN 117370899A
Authority
CN
China
Prior art keywords
decision tree
control factor
ore
weight
mine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311680776.8A
Other languages
English (en)
Other versions
CN117370899B (zh
Inventor
董坤
孔春芳
徐凯
吴冲龙
李岩
岳云锋
田宜平
武永进
向世泽
董阳
刘艨
王子杨
冯子恒
李瑜
赵思源
陈安琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Dida Quanty Technology Co ltd
China University of Geosciences
Original Assignee
Wuhan Dida Quanty Technology Co ltd
China University of Geosciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Dida Quanty Technology Co ltd, China University of Geosciences filed Critical Wuhan Dida Quanty Technology Co ltd
Priority to CN202311680776.8A priority Critical patent/CN117370899B/zh
Publication of CN117370899A publication Critical patent/CN117370899A/zh
Application granted granted Critical
Publication of CN117370899B publication Critical patent/CN117370899B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Agronomy & Crop Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Mining & Mineral Resources (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Animal Husbandry (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于主成分‑决策树模型的控矿因素权重确定方法,属于成矿预测技术领域,包括:S1、采集非矿点、已知矿点的地物化遥综合数据,对所有成矿预测控矿因素的特征量进行编码处理,生成向量空间,构建模型数据集;S2、采用改进CART算法,通过预剪枝操作建立决策树模型;S3、输入特征向量到决策树模型中构建决策树;S4、使用主成分分析法,提取矿点样本主特征,计算各个控矿因素在数据集上对应的信息权重;S5、将主成分分析法处理得到的信息权重加入到决策树节点中,通过信息权重和改进CART算法全局计算决策树中的每种控矿因素权重。本发明采用上述的一种基于主成分‑决策树模型的控矿因素权重确定方法,有效提高矿点预测的概率。

Description

一种基于主成分-决策树模型的控矿因素权重确定方法
技术领域
本发明涉及成矿预测技术领域,尤其是涉及一种基于主成分-决策树模型的控矿因素权重确定方法。
背景技术
矿产资源是人类社会生产与发展的重要物质基础,寻找未知矿产资源具有重要的社会和经济意义。控矿因素是控制矿床形成的地质因素,针对找矿预测过程诸多成矿条件与控矿因素,研究哪个因素更多地影响了成矿过程,对矿产资源的开发起到了至关重要的作用。
目前,面对众多的控矿因素与成矿条件,如何有针对性的做出选择,基本完全依赖专家知识,由经验丰富的地质专家给出指导性的意见,但是该方法人为干涉过多,主观性影响较强。随着信息化的发展,机器学习算法现已被广泛应用于各行各业,在对矿产资源进行的各项研究之中,各种学习算法也都起到了良好的辅助作用。鉴于此,通过机器学习算法来替代专家知识,对抽象的成矿预测控矿因素进行一个量化处理,可以更加直观的反映控矿因素对成矿过程的影响。
发明内容
本发明的目的是提供一种基于主成分-决策树模型的控矿因素权重确定方法,可以在众多成矿预测控矿因素中优先选出对成矿远景区具有重要影响的控矿因素,有效提高矿点预测的概率,在成矿预测领域具有重大意义。
为实现上述目的,本发明提供了一种基于主成分-决策树模型的控矿因素权重确定方法,包括以下步骤:
S1、采集非矿点、已知矿点的地物化遥综合数据,对所有成矿预测控矿因素的特征量进行编码处理,生成向量空间,构建模型数据集;
其中,非矿点数量与已知矿点数量比为100~120:1,已知矿点数量最少为100组;
S2、采用改进CART算法,通过预剪枝操作建立决策树模型;
S3、输入特征向量到决策树模型中,构建决策树;
S4、使用主成分分析法,提取矿点样本主特征,计算各个控矿因素在数据集上对应的信息权重;
S5、将主成分分析法处理得到的信息权重加入到决策树节点中,通过信息权重和改进CART算法全局计算决策树中的每种控矿因素权重。
优选的,步骤S1中,控矿因素来源于地物化遥综合数据;控矿因素特征量由钻孔数据提取和反距离插值计算得到;
设S为控矿因素的集合,为各个控矿因素,则/>;设/>为所取数据的标签集合,则总样本数据集合/>
优选的,步骤S1中,对所有成矿预测控矿因素的特征量进行编码处理,生成向量空间是指对原始的连续特征通过K-Means++聚类算法进行重分类。
优选的,步骤S2中,改进CART算法是通过改进基尼指数得到的,具体操作为:在传统的基尼指数前添加系数,用于解析基尼指数中矿点样本所占成分,改进基尼指数公式如下:
(1)
其中,为样本的某一个控矿因素;/>为矿点所占比例;数据集共有/>个类别;表示样本属于第/>个类别的概率。
优选的,步骤S2中,通过预剪枝操作建立决策树模型,具体操作为:通过设置预定义的停止条件来控制决策树的生长,以防止过拟合;
其中,预定义停止条件包括:max_depth、min_samples_split、min_samples_leaf;
max_depth为限制树的最大深度;min_samples_split为限制节点分裂所需要的最少样本数;min_samples_leaf为限制叶子节点必须包含的最少样本数。
优选的,步骤S3中,输入特征向量到决策树模型中,构建决策树,具体操作为:每个节点根据改进CART算法为依据进行分裂,选择分裂指标最小的控矿因素进行节点分裂,计算公式如下:
(2)
其中,为根据控矿因素/>对总样本集合/>进行划分的子集;/>为在子集/>中矿点所占比例。
优选的,步骤S5中,决策树的每个节点包括分裂条件、改进基尼指数、信息权重、该节点中的总样本数和正负样本数。
优选的,步骤S5中,根据信息权重和改进CART算法全局计算决策树中每种控矿因素权重,当某种控矿因素多次参与节点分裂,分别计算当前节点下控矿因素的权重,并求取平均值,最后进行归一化处理,给出各个控矿因素所对应的权重。
优选的,计算决策树中每种控矿因素权重,其中/>由控矿因素/>所在的节点重要性/>计算而来,/>由/>和/>组成,/>为基于改进CART算法计算的控矿因素重要性,/>为基于主成分分析计算的信息权重,/>为总样本数,/>为当前节点样本数,为右节点样本数,/>为左节点样本数,/>和/>分别为左右节点的改进基尼指数,和/>分别为左右节点的信息权重,/>具体公式如下:
(3)
当某种控矿因素多次参与节点分裂,设/>参与分裂次数为/>次,那么将会得到/>个/>,设为/>,则控矿因素/>的权重为:
(4)。
优选的,根据全局计算决策树中的每种控矿因素权重,对其进行归一化处理,给出各个特征所对应的权重,归一化公式如下:
(5)
其中,s表示依次取S中的属性。
因此,本发明采用上述一种基于主成分-决策树模型的控矿因素权重确定方法,可以在众多成矿预测控矿因素中优先选出对成矿远景区具有重要影响的控矿因素,有效提高矿点预测的概率,在成矿预测领域具有重大意义。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明一种基于主成分-决策树模型的控矿因素权重确定方法的流程图。
具体实施方式
以下通过附图和实施例对本发明的技术方案作进一步说明。
除非另外定义,本发明使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。
实施例一
在本实施例中,以贵州省毕节市猪拱塘铅锌矿试验园区为研究区域,对采集的地物化遥等多源数据进行成矿预测控矿因素权重确定。
如图1所示,为本发明一种基于主成分-决策树模型的控矿因素权重确定方法的流程图,具体包括以下步骤:
步骤S01,采集12000份非矿点,100份已知矿点的地物化遥综合数据,对原始的连续特征数据通过K-Means++聚类算法进行重分类,其他数据类型映射成离散型数字。
其他数据类型映射成离散型数字,处理具体步骤为:
(1)从数据集中随机选择一个样本点作为第一个初始聚类中心
(2)计算样本数据中每一个样本点到已经初始化的聚类中心之间的最短欧式距离/>
,/>,/>,/>为空间维度,在/>维空间下,两点之间的欧氏距离定义如下:
(1)
(3)计算样本中的每一个样本点与已经初始化的聚类中心之间的距离,选择最短距离/>
(4)计算每个样本点被选为下一个聚类中心的概率,最后选择最大概率值所对应的样本点作为下一个簇中心;概率计算公式如下:
(2)
(5)重复上述步骤(3)和步骤(4),直到k个聚类中心都被确定;
(6)计算每个样本中的连续特征值与k个聚类中心的距离,将样本划分到距离最短的簇中,并将每个簇映射成一个离散值,进行重分类。
将离散化后的多源数据形成多维向量空间,如下表1所示,数据表字段包括特征向量的id号、航磁、地化、地层、褶皱、标签,其中标签为1表示矿点,0为非矿点。
表1 部分离散数据展示
步骤S02,采用改进CART算法,通过预剪枝操作建立决策树模型。
通过改进基尼指数进而改进CART算法,在传统基尼指数前添加系数,用于解析基尼指数中矿点样本所占成分。改进基尼指数公式如下:
(3)
其中,为样本的某一个控矿因素,/>为矿点所占比例,数据集共有/>个类别,表示样本属于第/>个类别的概率。
在模型搭建之前,预定义停止条件来控制决策树的生长,随后进行网格化搜索,对max_depth(限制树的最大深度)、min_samples_split(限制节点分裂所需要的最少样本数)、min_samples_leaf(限制叶子节点必须包含的最少样本数)三组参数的可能取值组合进行枚举,逐一尝试每组组合对模型性能的影响,最终确定最佳预定义停止条件,完成模型构建。
将特征向量空间输入到决策树模型中,每个节点根据改进的基尼指数为依据进行分裂,选择分裂指标最小的控矿因素进行节点分裂。其计算公式如下:
(4)
其中,为总样本集合,/>为样本的某一个控矿因素,/>为矿点所占比例,/>为根据控矿因素/>对总样本集合/>进行划分的子集,/>为在子集/>中矿点所占比例。
步骤S03,使用主成分分析法,提取矿点样本主特征,计算各个控矿因素在数据集上对应的信息权重。
对于矿点样本数据,假设有M个样本,每个样本含有k个控矿因素,则,该样本空间为:
(5)
(1)中心化处理。设样本均值为,则更新坐标:
(6)
(2)计算协方差矩阵C与相关系数矩阵R:
(7)
其中为协方差,其公式如下:
(8)
(9)
其中为相关系数,其公式如下:
(10)
其中,,/>为/>,/>的方差。
(3)计算特征值与成分矩阵。
求解特征方程得出特征值/>和单位特征向量/>,使得特征值大小降序排列。
令特征值的累积贡献率/>,当/>,确定/>个主成分。
以重力、航磁、铅锌含量、地化、地层、褶皱为例,借助SPSS Statistics26软件进行相关系数矩阵和成分矩阵求解。
表2 相关系数矩阵
表3 相关系数矩阵的特征值及累积贡献率
表4 成分矩阵
(4)计算信息权重,具体步骤如下:
(4.1)设成分矩阵k为控矿因素个数,m为主成分个数),提取主成分特征值,特征值对应贡献率/>
(4.2)以列为单位遍历成分矩阵,设第/>列元素为/>,其中/>大小为/>,设中间过渡矩阵为/> ,其大小为/>
(4.3)重复步骤(4.2),直至遍历完所有列,将得到的过度矩阵进行拼接,得到矩阵/>
(4.4)以行为单位遍历矩阵,设第i行元素为,其中/>大小为/>
(4.5)设第i个控矿因素的信息权重为,其计算公式如下:
(11)
步骤S05,将计算得出的信息权重加入决策节点中,此时每个/>节点的基本结构为/>,其中/>为当前节点样本数,/>和/>为该特征对应的信息权重和改进基尼指数。
计算决策树中每种控矿因素权重,其中/>由控矿因素/>所在的节点重要性计算而来。
由/>和/>组成,/>为基于改进基尼指数计算的控矿因素重要性,/>为基于主成分分析计算的信息权重,N为总样本数,/>为当前节点样本数,/>为右节点样本数,/>为左节点样本数,/>和/>分别为左右节点的改进基尼指数,/>和/>分别左右节点的信息权重,具体公式如下:
(12)
当某种控矿因素多次参与节点分裂,设/>参与分裂次数为/>次,那么将会得到/>个/>,设为/>。则控矿因素/>的权重为:
(13)
根据全局计算决策树中的每种控矿因素权重,对其进行归一化处理,给出各个特征所对应的权重。归一化公式如下:
(14)。
因此,本发明采用上述一种基于主成分-决策树模型的控矿因素权重确定方法,可以在众多成矿预测控矿因素中优先选出对成矿远景区具有重要影响的控矿因素,有效提高矿点预测的概率,在成矿预测领域具有重大意义。
最后应说明的是:以上实施例仅用以说明本发明的技术方案而非对其进行限制,尽管参照较佳实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对本发明的技术方案进行修改或者等同替换,而这些修改或者等同替换亦不能使修改后的技术方案脱离本发明技术方案的精神和范围。

Claims (10)

1.一种基于主成分-决策树模型的控矿因素权重确定方法,其特征在于,包括以下步骤:
S1、采集非矿点、已知矿点的地物化遥综合数据,对所有成矿预测控矿因素的特征量进行编码处理,生成向量空间,构建模型数据集;
其中,非矿点数量与已知矿点数量比为100~120:1,已知矿点数量最少为100组;
S2、采用改进CART算法,通过预剪枝操作建立决策树模型;
S3、输入特征向量到决策树模型中,构建决策树;
S4、使用主成分分析法,提取矿点样本主特征,计算各个控矿因素在数据集上对应的信息权重;
S5、将主成分分析法处理得到的信息权重加入到决策树节点中,通过信息权重和改进CART算法全局计算决策树中的每种控矿因素权重。
2.根据权利要求1所述的一种基于主成分-决策树模型的控矿因素权重确定方法,其特征在于,步骤S1中,控矿因素来源于地物化遥综合数据;控矿因素特征量由钻孔数据提取和反距离插值计算得到;
设S为控矿因素的集合, 为各个控矿因素,则/>;设/>为所取数据的标签集合,则总样本数据集合/>
3.根据权利要求2所述的一种基于主成分-决策树模型的控矿因素权重确定方法,其特征在于,步骤S1中,对所有成矿预测控矿因素的特征量进行编码处理,生成向量空间是指对原始的连续特征通过K-Means++聚类算法进行重分类。
4.根据权利要求3所述的一种基于主成分-决策树模型的控矿因素权重确定方法,其特征在于,步骤S2中,改进CART算法是通过改进基尼指数得到的,具体操作为:在传统的基尼指数前添加系数,用于解析基尼指数中矿点样本所占成分,改进基尼指数公式如下:
(1)
其中,为样本的某一个控矿因素;/>为矿点所占比例;数据集共有/>个类别;/>表示样本属于第/>个类别的概率。
5.根据权利要求4所述的一种基于主成分-决策树模型的控矿因素权重确定方法,其特征在于,步骤S2中,通过预剪枝操作建立决策树模型,具体操作为:通过设置预定义的停止条件来控制决策树的生长,以防止过拟合;
其中,预定义停止条件包括:max_depth、min_samples_split、min_samples_leaf;
max_depth为限制树的最大深度;min_samples_split为限制节点分裂所需要的最少样本数;min_samples_leaf为限制叶子节点必须包含的最少样本数。
6.根据权利要求5所述的一种基于主成分-决策树模型的控矿因素权重确定方法,其特征在于,步骤S3中,输入特征向量到决策树模型中,构建决策树,具体操作为:每个节点根据改进CART算法为依据进行分裂,选择分裂指标最小的控矿因素进行节点分裂,计算公式如下:
(2)
其中,为根据控矿因素/>对总样本集合/>进行划分的子集;/>为在子集/>中矿点所占比例。
7.根据权利要求6所述的一种基于主成分-决策树模型的控矿因素权重确定方法,其特征在于,步骤S5中,决策树的每个节点包括分裂条件、改进基尼指数、信息权重、该节点中的总样本数和正负样本数。
8.根据权利要求7所述的一种基于主成分-决策树模型的控矿因素权重确定方法,其特征在于,步骤S5中,根据信息权重和改进CART算法全局计算决策树中每种控矿因素权重,当某种控矿因素多次参与节点分裂,分别计算当前节点下控矿因素的权重,并求取平均值,最后进行归一化处理,给出各个控矿因素所对应的权重。
9.根据权利要求8所述的一种基于主成分-决策树模型的控矿因素权重确定方法,其特征在于,计算决策树中每种控矿因素权重,其中/>由控矿因素/>所在的节点重要性计算而来,/>由/>和/>组成,/>为基于改进CART算法计算的控矿因素重要性,为基于主成分分析计算的信息权重,/>为总样本数,/>为当前节点样本数,/>为右节点样本数,/>为左节点样本数,/>和/>分别为左右节点的改进基尼指数,/>分别为左右节点的信息权重,/>具体公式如下:
(3)
当某种控矿因素多次参与节点分裂,设/>参与分裂次数为/>次,那么将会得到/>个/>,设为/>,则控矿因素/>的权重为:
(4)。
10.根据权利要求9所述的一种基于主成分-决策树模型的控矿因素权重确定方法,其特征在于,根据全局计算决策树中的每种控矿因素权重,对其进行归一化处理,给出各个特征所对应的权重,归一化公式如下:
(5)
其中,s表示依次取S中的属性。
CN202311680776.8A 2023-12-08 2023-12-08 一种基于主成分-决策树模型的控矿因素权重确定方法 Active CN117370899B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311680776.8A CN117370899B (zh) 2023-12-08 2023-12-08 一种基于主成分-决策树模型的控矿因素权重确定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311680776.8A CN117370899B (zh) 2023-12-08 2023-12-08 一种基于主成分-决策树模型的控矿因素权重确定方法

Publications (2)

Publication Number Publication Date
CN117370899A true CN117370899A (zh) 2024-01-09
CN117370899B CN117370899B (zh) 2024-02-20

Family

ID=89389681

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311680776.8A Active CN117370899B (zh) 2023-12-08 2023-12-08 一种基于主成分-决策树模型的控矿因素权重确定方法

Country Status (1)

Country Link
CN (1) CN117370899B (zh)

Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020052699A1 (en) * 2000-05-30 2002-05-02 General Electric Company Paper web breakage prediction using bootstrap aggregation of classification and regression trees
US6466877B1 (en) * 1999-09-15 2002-10-15 General Electric Company Paper web breakage prediction using principal components analysis and classification and regression trees
US20030061228A1 (en) * 2001-06-08 2003-03-27 The Regents Of The University Of California Parallel object-oriented decision tree system
US20090281981A1 (en) * 2008-05-06 2009-11-12 Chen Barry Y Discriminant Forest Classification Method and System
US20130064040A1 (en) * 2010-05-28 2013-03-14 Matthias G. Imhof Method for seismic hydrocarbon system analysis
CN107358569A (zh) * 2017-06-28 2017-11-17 中国地质大学(武汉) 一种基于数字水印技术的地质体三维模型版权保护的方法
US20170364795A1 (en) * 2016-06-15 2017-12-21 Akw Analytics Inc. Petroleum analytics learning machine system with machine learning analytics applications for upstream and midstream oil and gas industry
US20190034834A1 (en) * 2016-03-31 2019-01-31 Alibaba Group Holding Limited Method and apparatus for training model based on random forest
CN109711597A (zh) * 2018-11-14 2019-05-03 东莞理工学院 一种基于分层随机森林模型的铜镍硫化物矿床成矿预测方法
CN110175195A (zh) * 2019-04-23 2019-08-27 哈尔滨工业大学 基于极端随机树的混合气体检测模型构建方法
AU2020100709A4 (en) * 2020-05-05 2020-06-11 Bao, Yuhang Mr A method of prediction model based on random forest algorithm
CN111859811A (zh) * 2020-07-30 2020-10-30 中国地质科学院矿产资源研究所 一种基于模糊逻辑和机器学习的成矿预测方法及系统
WO2020233259A1 (zh) * 2019-07-12 2020-11-26 之江实验室 一种基于多中心模式下随机森林算法的特征重要性排序系统
CN112327168A (zh) * 2020-10-31 2021-02-05 国网河北省电力有限公司雄安新区供电公司 一种基于XGBoost的电动汽车电池消耗预测方法
CN115982722A (zh) * 2023-01-16 2023-04-18 浙江御安信息技术有限公司 一种基于决策树的漏洞分类检测方法
CN116087647A (zh) * 2022-12-22 2023-05-09 广东技术师范大学 基于pca和麻雀算法优化随机森林的建筑电气故障诊断方法
CN116307123A (zh) * 2023-02-23 2023-06-23 中国地质大学(武汉) 一种基于知识图谱驱动的矿产资源预测方法、存储介质
CN116432123A (zh) * 2023-03-16 2023-07-14 浙江工业大学 一种基于cart决策树算法的电能表故障预警方法
US20230386605A1 (en) * 2022-05-18 2023-11-30 Shanghai Institute Of Technology Predicting method of transcription factor binding sites based on weighted multi-granularity scanning
CN117152893A (zh) * 2023-10-31 2023-12-01 广州市林业和园林科学研究院 一种森林防灾方法及系统

Patent Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6466877B1 (en) * 1999-09-15 2002-10-15 General Electric Company Paper web breakage prediction using principal components analysis and classification and regression trees
US20020052699A1 (en) * 2000-05-30 2002-05-02 General Electric Company Paper web breakage prediction using bootstrap aggregation of classification and regression trees
US20030061228A1 (en) * 2001-06-08 2003-03-27 The Regents Of The University Of California Parallel object-oriented decision tree system
US20090281981A1 (en) * 2008-05-06 2009-11-12 Chen Barry Y Discriminant Forest Classification Method and System
US20130064040A1 (en) * 2010-05-28 2013-03-14 Matthias G. Imhof Method for seismic hydrocarbon system analysis
US20190034834A1 (en) * 2016-03-31 2019-01-31 Alibaba Group Holding Limited Method and apparatus for training model based on random forest
US20170364795A1 (en) * 2016-06-15 2017-12-21 Akw Analytics Inc. Petroleum analytics learning machine system with machine learning analytics applications for upstream and midstream oil and gas industry
CN107358569A (zh) * 2017-06-28 2017-11-17 中国地质大学(武汉) 一种基于数字水印技术的地质体三维模型版权保护的方法
CN109711597A (zh) * 2018-11-14 2019-05-03 东莞理工学院 一种基于分层随机森林模型的铜镍硫化物矿床成矿预测方法
CN110175195A (zh) * 2019-04-23 2019-08-27 哈尔滨工业大学 基于极端随机树的混合气体检测模型构建方法
WO2020233259A1 (zh) * 2019-07-12 2020-11-26 之江实验室 一种基于多中心模式下随机森林算法的特征重要性排序系统
AU2020100709A4 (en) * 2020-05-05 2020-06-11 Bao, Yuhang Mr A method of prediction model based on random forest algorithm
CN111859811A (zh) * 2020-07-30 2020-10-30 中国地质科学院矿产资源研究所 一种基于模糊逻辑和机器学习的成矿预测方法及系统
CN112327168A (zh) * 2020-10-31 2021-02-05 国网河北省电力有限公司雄安新区供电公司 一种基于XGBoost的电动汽车电池消耗预测方法
US20230386605A1 (en) * 2022-05-18 2023-11-30 Shanghai Institute Of Technology Predicting method of transcription factor binding sites based on weighted multi-granularity scanning
CN116087647A (zh) * 2022-12-22 2023-05-09 广东技术师范大学 基于pca和麻雀算法优化随机森林的建筑电气故障诊断方法
CN115982722A (zh) * 2023-01-16 2023-04-18 浙江御安信息技术有限公司 一种基于决策树的漏洞分类检测方法
CN116307123A (zh) * 2023-02-23 2023-06-23 中国地质大学(武汉) 一种基于知识图谱驱动的矿产资源预测方法、存储介质
CN116432123A (zh) * 2023-03-16 2023-07-14 浙江工业大学 一种基于cart决策树算法的电能表故障预警方法
CN117152893A (zh) * 2023-10-31 2023-12-01 广州市林业和园林科学研究院 一种森林防灾方法及系统

Non-Patent Citations (14)

* Cited by examiner, † Cited by third party
Title
APPROACHKAMADI V.S.R.P. VARMA等: "A computational intelligence technique for the effective diagnosis ofdiabetic patients using principal component analysis (PCA) andmodified fuzzy SLIQ decision tree approach", APPLIED SOFT COMPUTING, vol. 49, 27 June 2016 (2016-06-27), pages 137 - 145 *
CHUNFANG KONG等: "Landslide susceptibility assessment based on different machine-learning methods in Zhaoping County of eastern Guangxi", NATURAL HAZARDS AND EARTH SYSTEM SCIENCES, pages 1 - 41 *
CHUNFANG KONG等: "Landslide susceptibility assessment in Qinzhou based on rough set and semi‑supervised support vector machine", RESEARCH, 28 August 2023 (2023-08-28), pages 3163 - 3177 *
CHUNFANG KONG等: "Optimization of random forest model for assessing and predicting geological hazards susceptibility in Lingyun County", RESEARCH SQUARE, pages 1 - 32 *
JIANCHAO CAI: "Prediction and analysis of net ecosystem carbon exchange based on gradient boosting regression and random forest", APPLIED ENERGY, vol. 262, no. 114566, 10 February 2020 (2020-02-10), pages 1 - 14, XP086067946, DOI: 10.1016/j.apenergy.2020.114566 *
KAI XU等: "Identification of Hydrothermal Alteration Minerals for Exploring Gold Deposits Based on SVM and PCA Using ASTER Data: A Case Study of Gulong", REMOTE SENSING, vol. 11, no. 3003, 13 December 2019 (2019-12-13), pages 1 - 22 *
MOSHOOD ABIOLA HAMBALI等: "Heart Disease Prediction Using Principal Component Analysis and Decision Tree Algorithm", JOURNAL OF COMPUTER SCIENCE AND ENGINEERING, vol. 04, no. 01, pages 1 - 14 *
严修等: "基于Bootstrap-D...的公交线路运行效率评价方法", 交通信息与安全, vol. 01, no. 41, pages 161 - 168 *
刘思蒙: "基于决策树与随机森林的个人网络贷款违约行为研究", 中国优秀硕士学位论文全文数据库 经济与管理科学辑, no. 12, pages 157 - 71 *
张士红等: "基于随机森林的四川省会理地区"拉拉式"铜矿成矿预测", 地质与勘探, vol. 56, no. 02, pages 239 - 252 *
徐凯等: "黔东北伴生 - 次生矿物遥感数据组合式挖掘与隐伏锰矿信息提取", 地质科技通报, vol. 39, no. 04, 15 July 2020 (2020-07-15), pages 37 - 43 *
朱超等: "数据挖掘方法在未利用土地适宜性评价中的应用", 中国市场, no. 10, 12 March 2013 (2013-03-12), pages 52 - 54 *
荣菡等: "近红外光谱与决策树算法联用快速鉴别苍耳掺伪", 中成药, vol. 44, no. 08, 20 August 2022 (2022-08-20), pages 2739 - 2743 *
邵佳丽等: "基于证据权重法的江绍拼合带中西段成矿预测研究", 地质学刊, vol. 35, no. 02, 28 June 2011 (2011-06-28), pages 150 - 155 *

Also Published As

Publication number Publication date
CN117370899B (zh) 2024-02-20

Similar Documents

Publication Publication Date Title
CN110827921B (zh) 一种单细胞聚类方法、装置、电子设备及存储介质
CN112395487B (zh) 信息推荐方法、装置、计算机可读存储介质及电子设备
CN106202999B (zh) 基于不同尺度tuple词频的微生物高通量测序数据分析协议
CN113268669B (zh) 基于联合神经网络的面向关系挖掘的兴趣点推荐方法
CN109727637B (zh) 基于混合蛙跳算法识别关键蛋白质的方法
CN111462820A (zh) 基于特征筛选和集成算法的非编码rna预测方法
CN107992722A (zh) 基于对称不确定性和信息交互增益的特征选择方法
Zhou et al. Feature subset selection via an improved discretization-based particle swarm optimization
CN109086831A (zh) 基于模糊c-均值算法和人工蜂群聚类算法的混合聚类算法
CN111599406A (zh) 结合网络聚类方法的全局多网络比对方法
CN110909785B (zh) 基于语义层级的多任务Triplet损失函数学习方法
Cui et al. MMCO-Clus–an evolutionary co-clustering algorithm for gene selection
CN117370899B (zh) 一种基于主成分-决策树模型的控矿因素权重确定方法
CN109390032A (zh) 一种基于进化算法在全基因组关联分析的数据中探索与疾病相关的snp组合的方法
CN107194468A (zh) 面向情报大数据的决策树增量学习方法
CN112800111B (zh) 一种基于训练数据挖掘的位置预测方法
Guo et al. [Retracted] PLncWX: A Machine‐Learning Algorithm for Plant lncRNA Identification Based on WOA‐XGBoost
Lee et al. Survival prediction and variable selection with simultaneous shrinkage and grouping priors
Harifi et al. Using Metaheuristic Algorithms to Improve k-Means Clustering: A Comparative Study.
CN111539616A (zh) 一种基于混合型特征选择的新钻井潜力评价方法
CN111584010A (zh) 一种基于胶囊神经网络和集成学习的关键蛋白质识别方法
Agüero-Chapin et al. An alignment-free approach for eukaryotic ITS2 annotation and phylogenetic inference
CN115062236A (zh) 基于多目标优化的混合重排旅游推荐方法及其系统
Chowdhury et al. UICPC: centrality-based clustering for scRNA-seq data analysis without user input
CN114360642A (zh) 基于基因共表达网络分析的癌症转录组数据处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant