CN111340125A - 基于随机森林算法训练子宫内膜异位囊肿破裂数据的方法 - Google Patents

基于随机森林算法训练子宫内膜异位囊肿破裂数据的方法 Download PDF

Info

Publication number
CN111340125A
CN111340125A CN202010139668.XA CN202010139668A CN111340125A CN 111340125 A CN111340125 A CN 111340125A CN 202010139668 A CN202010139668 A CN 202010139668A CN 111340125 A CN111340125 A CN 111340125A
Authority
CN
China
Prior art keywords
data
random forest
training
decision tree
rupture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010139668.XA
Other languages
English (en)
Inventor
唐震洲
周铭琰
林凤
金楚
许方怡
易新凯
王岩
孔令剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wenzhou University
Original Assignee
Wenzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wenzhou University filed Critical Wenzhou University
Priority to CN202010139668.XA priority Critical patent/CN111340125A/zh
Publication of CN111340125A publication Critical patent/CN111340125A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于随机森林算法来训练子宫内膜异位囊肿破裂数据的方法,包括获取子宫内膜异位囊肿破裂和未破裂数据为样本数据并归一化处理后,划分出测试集和多个训练集;对每一个训练集进行决策树训练,得到相应CART决策树模型;对每一个CART决策树模型均通过基尼指数比对选出最优特征来进行分支处理,得到相应决策树并形成随机森林模型;采用粒子群算法对随机森林模型进行参数优化并导入训练集和测试集,得到训练好的随机森林模型;获取待测子宫内膜异位囊肿数据并导入训练好的随机森林模型中,区别出破裂或未破裂数据。实施本发明,可以处理连续、离散和混合的子宫内膜异位囊肿破裂数据集,克服数据缺少较多的情况下,准确度快速降低的问题。

Description

基于随机森林算法训练子宫内膜异位囊肿破裂数据的方法
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于随机森林算法来训练子宫内膜异位囊肿破裂数据的方法。
背景技术
在高速发展的互联网时代,机器学习的出现和应用正深刻改变着医疗行业。在此之前,医学数据的收集分析是一件充满挑战和困难的事。但如今,机器学习通过对数据的分析与处理,能够准确清晰的实现设定的方案并交付结果。
目前,国内外针对子宫内膜异位囊肿破裂数据的相关研究还比较少。数据预测采用的分类模型大多为KNN算法、神经网络算法、贝叶斯算法等等,但这些算法的精确度不是很理想,无法处理连续、离散和混合的大数据集,尤其是在缺失数据较多的情况下,准确度会随着数据缺失而快速降低。
因此,亟需一种行之有效的算法对子宫内膜异位囊肿破裂数据进行分析,可以处理连续、离散和混合的大数据集,能够克服数据缺少较多的情况下,准确度快速降低的问题。
发明内容
本发明实施例所要解决的技术问题在于,提供一种基于随机森林算法来训练子宫内膜异位囊肿破裂数据的方法,可以处理连续、离散和混合的子宫内膜异位囊肿破裂数据集,能够克服数据缺少较多的情况下,准确度快速降低的问题。
为了解决上述技术问题,本发明实施例提供了一种基于随机森林算法来训练子宫内膜异位囊肿破裂数据的方法,包括以下步骤:
步骤S1、获取子宫内膜异位囊肿破裂数据和子宫内膜异位囊肿未破裂数据形成样本数据,并对所获取到的样本数据进行归一化处理,且进一步将归一化处理后的样本数据划分出测试集和多个训练集;
步骤S2、选取决策树类型为CART分别对每一个训练集进行决策树训练,得到每一个训练集各自训练出的相应CART决策树模型;
步骤S3、对每一个CART决策树模型均通过基尼指数的比对选出最优特征来进行分支处理,得到每一个CART决策树模型各自经分支处理后的相应决策树,并进一步形成随机森林模型;其中,所选最优特征为子宫内膜异位囊肿破裂数据区别于子宫内膜异位囊肿未破裂数据的关键特征指标;
步骤S4、采用粒子群算法对所述随机森林模型进行优化,得到优化后的随机森林模型,并将所述训练集和测试集导入所述优化后的随机森林模型中,得到训练好的随机森林模型;
步骤S5、获取待测子宫内膜异位囊肿数据,并将所述待测子宫内膜异位囊肿数据导入所述训练好的随机森林模型中,区别出所述待测子宫内膜异位囊肿数据为子宫内膜异位囊肿破裂数据或子宫内膜异位囊肿未破裂数据。
其中,在所述步骤S1中,测试集和多个训练集的具体形成步骤为:
以所述归一化处理后的样本数据总量的25%随机组合为一份数据集作为测试集,剩下的75%作为训练数据,且进一步从训练数据中有放回随机采样选出n个样本为一份,占数据总量的50%来形成N个不相同的训练集。
其中,在所述步骤S3中,所述对每一个CART决策树模型均通过基尼指数的比对选出最优特征来进行分支处理的具体步骤包括:
在同一个CART决策树模型中,汇总出对应训练集中训练数据的所有特征,并计算出每个特征的基尼指数评分,且选出最小基尼指数评分的特征为最优特征后,将所选的最优特征及其对应的切分点作为根节点衍生的两个子节点,进一步将剩余的特征分配到上述两个子节点中,实现分支处理;其中,在分支过程中采取预剪枝处理,若当该树杈上的样本小于所设定的参数,则决策树就不再继续生长。
其中,特征Xj在某一个CART决策树模型中的基尼指数评分通过公式
Figure BDA0002398628690000031
来实现;其中,
Figure BDA0002398628690000032
k表示在具有m个节点的CART决策树模型中存在的类别个数;Pmk表示在具有m个节点的CART决策树模型中类别k所占的比例大小;GIm表示节点m的基尼指数;GIl表示特征Xj在节点m分支前的基尼指数;GIr表示特征Xj在节点m分支后的基尼指数。
其中,特征Xj在随机森林模型的基尼指数评分通过公式
Figure BDA0002398628690000033
来实现;其中,
Figure BDA0002398628690000034
表示特征Xj在第i个CART决策树模型中出现的节点包含在集合M中所对应的基尼指数评分;n为CART决策树模型的总数。
其中,在所述步骤S4中,所述采用粒子群算法对所述随机森林模型进行优化的具体步骤包括:
第一步、对粒子群算法进行部分调整,使其适用于离散值的算法优化;
第二步、设置粒子群算法的代价函数或者称之为适应度函数:
prob=fitness(max_depth,n_estimators,min_samples_split)
适应度函数的值等于上述随机森林算法得到的准确率;
第三步:设置最大迭代次数max_iter、目标函数的自变量个数pN、粒子的最大速度X、可行解的搜索空间、学习因子c1和c2、以及种群大小,并进一步构造一个随机群体:
Figure BDA0002398628690000035
Figure BDA0002398628690000036
第四步、对于群体中的每一个粒子,将粒子位置代入代价函数求出适应值,寻找个体极值为每个粒子找到的最优解。再根据这些个体极值最优解寻找到一个全局值最优解,最后将本次全局最优解与历史全局最优解比较,如果本次全局最优解结果较好则进行更新,以此寻找种群所经历过的最好位置gbest(g1,g2,g3.....gD);
第五步、更新速度和位置的公式;
Figure BDA0002398628690000041
Figure BDA0002398628690000042
第六步、重复执行第四步和第五步。当达到设定迭代次数或者代数之间的差值满足最小界限时终止迭代,将最佳参数代入随机森林算法,优化后的随机森林模型。
实施本发明实施例,具有如下有益效果:
本发明基于随机森林算法来训练子宫内膜异位囊肿破裂数据,可以处理连续、离散和混合的子宫内膜异位囊肿破裂数据集,能够克服数据缺少较多的情况下,准确度快速降低的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,根据这些附图获得其他的附图仍属于本发明的范畴。
图1为本发明实施例提出的一种基于随机森林算法来训练子宫内膜异位囊肿破裂数据的方法的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
如图1所示,为本发明实施例中,提出的一种基于随机森林算法来训练子宫内膜异位囊肿破裂数据的方法,包括以下步骤:
步骤S1、获取子宫内膜异位囊肿破裂数据和子宫内膜异位囊肿未破裂数据形成样本数据,并对所获取到的样本数据进行归一化处理,且进一步将归一化处理后的样本数据划分出测试集和多个训练集;
具体过程为,首先收集子宫内膜异位囊肿破裂和子宫内膜异位囊肿未破裂的患者医学数据,上述数据来源于手术过程中发现卵巢子宫内膜异位囊肿破裂的患者。
其次,将子宫内膜异位囊肿破裂数据和子宫内膜异位囊肿未破裂数据形成样本数据,并对所获取到的样本数据进行归一化处理,归一化公式如下:
xk=(xk-xmin)/(xmax-xmin)
最后,将归一化处理后的样本数据划分出测试集和多个训练集;例如,使用Bootstraping方法,以归一化处理后的样本数据总量的25%随机组合为一份数据集作为测试集,剩下的75%作为训练数据,且进一步从训练数据中有放回随机采样选出n个样本为一份,占数据总量的50%来形成N个不相同的训练集;其中,N为大于1的正整数。
步骤S2、选取决策树类型为CART分别对每一个训练集进行决策树训练,得到每一个训练集各自训练出的相应CART决策树模型;
具体过程为,决策树类型有ID3、C4.5、C5.0和CART这四种,在模型建立过程中,选择的是CART决策树,分别对每一个训练集进行决策树训练,得到每一个训练集各自训练出的相应CART决策树模型,即得到N个CART决策树模型。
步骤S3、对每一个CART决策树模型均通过基尼指数的比对选出最优特征来进行分支处理,得到每一个CART决策树模型各自经分支处理后的相应决策树,并进一步形成随机森林模型;其中,所选最优特征为子宫内膜异位囊肿破裂数据区别于子宫内膜异位囊肿未破裂数据的关键特征指标;
具体过程为,首先,在同一个CART决策树模型中,汇总出对应训练集中训练数据的所有特征,并计算出每个特征的基尼指数评分,且选出最小基尼指数评分的特征为最优特征后,将所选的最优特征及其对应的切分点作为根节点衍生的两个子节点,进一步将剩余的特征分配到上述两个子节点中,实现分支处理来得到每一个CART决策树模型各自经分支处理后的相应决策树;
最后,基于基尼指数,将所有决策树形成随机森林模型。
以单个CART决策树模型为例,将训练数据的所有特征的数量记为m,每次决策树分支时就可根据基尼指数选择特征进行分支,基尼指数越低,代表特征的相关性越大,因此通过基尼指数的比对可以选出最优特征。
用VIM来表示特征重要性评分(即基尼指数评分),用GI来表示基尼指数,假设现在有m个特征,目标是将每个特征Xj的基尼指数评分
Figure BDA0002398628690000061
计算出来,即第j个特征在随机森林内所有决策树中节点分裂不纯度的平均改变量。
此时,特征Xj在某一个CART决策树模型中的基尼指数评分的计算公式如下:
Figure BDA0002398628690000062
其中,
Figure BDA0002398628690000063
k表示在具有m个节点的CART决策树模型中存在的类别个数;Pmk表示在具有m个节点的CART决策树模型中类别k所占的比例大小;GIm表示节点m的基尼指数;GIl表示特征Xj在节点m分支前的基尼指数;GIr表示特征Xj在节点m分支后的基尼指数。
如果特征Xj在CART决策树模型i中出现的节点包含在集合M中,且随机森林总共n棵决策树,则特征Xj在随机森林模型的基尼指数评分的计算公式如下:
Figure BDA0002398628690000064
其中,
Figure BDA0002398628690000065
表示特征Xj在第i个CART决策树模型中出现的节点包含在集合M中所对应的基尼指数评分;n为CART决策树模型的总数。
最后,还可以对上述的基尼指数评分进行归一化处理,具体如下:
Figure BDA0002398628690000066
从基尼指数评分中,可以证实CA-125和CA19-9的特征重要性系数占比大,因此选取CA-125和CA19-9作为子宫内膜异位囊肿破裂数据分析的关键指标。
应当说明的是,每棵树都已知这样分裂下去,知道该节点的所有训练样例都属于同一类,在决策树的分裂过程中不需要后剪枝。
步骤S4、采用粒子群算法对所述随机森林模型进行优化,得到优化后的随机森林模型,并将所述训练集和测试集导入所述优化后的随机森林模型中,得到训练好的随机森林模型;
具体过程为,首先采用粒子群算法对随机森林模型进行优化,具体如下:
第一步、对粒子群算法进行部分调整,使其适用于离散值的算法优化;
第二步、设置粒子群算法的代价函数或者称之为适应度函数:
prob=fitness(max_depth,n_estimators,min_samples_split)
第三步:设置最大迭代次数max_iter、目标函数的自变量个数pN、粒子的最大速度X、可行解的搜索空间、学习因子c1和c2、以及种群大小;并构造一个随机群体。
Figure BDA0002398628690000071
Figure BDA0002398628690000072
第四步、对于群体中的每一个粒子,将粒子位置代入代价函数求出适应值,寻找个体极值为每个粒子找到的最优解。再根据这些个体极值最优解寻找到一个全局值最优解,最后将本次全局最优解与历史全局最优解比较,如果本次全局最优解结果较好则进行更新,以此寻找种群所经历过的最好位置gbest(g1,g2,g3.....gD);
第五步、更新速度和位置的公式;
Figure BDA0002398628690000073
Figure BDA0002398628690000074
第六步、重复执行第四步和第五步。当达到设定迭代次数或者代数之间的差值满足最小界限时终止迭代,将最佳参数代入随机森林算法,优化后的随机森林模型。
其次,将步骤S1中的训练集和测试集导入优化后的随机森林模型中,就能得到训练好的随机森林模型。
步骤S5、获取待测子宫内膜异位囊肿数据,并将所述待测子宫内膜异位囊肿数据导入所述训练好的随机森林模型中,区别出所述待测子宫内膜异位囊肿数据为子宫内膜异位囊肿破裂数据或子宫内膜异位囊肿未破裂数据。
具体过程为,获取待测子宫内膜异位囊肿数据并导入所述训练好的随机森林模型中,输出的类别若是最优特征(如CA-125和CA19-9),则说明待测子宫内膜异位囊肿数据为子宫内膜异位囊肿破裂数据;反之,则认为待测子宫内膜异位囊肿数据为子宫内膜异位囊肿未破裂数据。
实施本发明实施例,具有如下有益效果:
本发明基于随机森林算法来训练子宫内膜异位囊肿破裂数据,可以处理连续、离散和混合的子宫内膜异位囊肿破裂数据集,能够克服数据缺少较多的情况下,准确度快速降低的问题。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘、光盘等。
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (6)

1.一种基于随机森林算法来训练子宫内膜异位囊肿破裂数据的方法,其特征在于,包括以下步骤:
步骤S1、获取子宫内膜异位囊肿破裂数据和子宫内膜异位囊肿未破裂数据形成样本数据,并对所获取到的样本数据进行归一化处理,且进一步将归一化处理后的样本数据划分出测试集和多个训练集;
步骤S2、选取决策树类型为CART,分别对每一个训练集进行决策树训练,得到每一个训练集各自训练出的相应CART决策树模型;
步骤S3、对每一个CART决策树模型均通过基尼指数的比对选出最优特征来进行分支处理,得到每一个CART决策树模型各自经分支处理后的相应决策树,并进一步形成随机森林模型;其中,所选最优特征为子宫内膜异位囊肿破裂数据区别于子宫内膜异位囊肿未破裂数据的关键特征指标;
步骤S4、采用粒子群算法对所述随机森林模型进行优化,得到优化后的随机森林模型,并将所述训练集和测试集导入所述优化后的随机森林模型中,得到训练好的随机森林模型;
步骤S5、获取待测子宫内膜异位囊肿数据,并将所述待测子宫内膜异位囊肿数据导入所述训练好的随机森林模型中,区别出所述待测子宫内膜异位囊肿数据为子宫内膜异位囊肿破裂数据或子宫内膜异位囊肿未破裂数据。
2.如权利要求1所述的基于随机森林算法来训练子宫内膜异位囊肿破裂数据的方法,其特征在于,在所述步骤S1中,测试集和多个训练集的具体形成步骤为:
以所述归一化处理后的样本数据总量的25%随机组合为一份数据集作为测试集,剩下的75%作为训练数据,且进一步从训练数据中有放回随机采样选出n个样本为一份,占数据总量的50%来形成N个不相同的训练集。
3.如权利要求1所述的基于随机森林算法来训练子宫内膜异位囊肿破裂数据的方法,其特征在于,在所述步骤S3中,所述对每一个CART决策树模型均通过基尼指数的比对选出最优特征来进行分支处理的具体步骤包括:
在同一个CART决策树模型中,汇总出对应训练集中训练数据的所有特征,并计算出每个特征的基尼指数评分,且选出最小基尼指数评分的特征为最优特征后,将所选的最优特征及其对应的切分点作为根节点衍生的两个子节点,进一步将剩余的特征分配到上述两个子节点中,实现分支处理;其中,在分支过程中采取预剪枝处理,若当该树杈上的样本小于所设定的参数,则决策树就不再继续生长。
4.如权利要求3所述的基于随机森林算法来训练子宫内膜异位囊肿破裂数据的方法,其特征在于,特征Xj在某一个CART决策树模型中的基尼指数评分通过公式
Figure FDA0002398628680000021
来实现;其中,
Figure FDA0002398628680000022
k表示在具有m个节点的CART决策树模型中存在的类别个数;Pmk表示在具有m个节点的CART决策树模型中类别k所占的比例大小;GIm表示节点m的基尼指数;GIl表示特征Xj在节点m分支前的基尼指数;GIr表示特征Xj在节点m分支后的基尼指数。
5.如权利要求4所述的基于随机森林算法来训练子宫内膜异位囊肿破裂数据的方法,其特征在于,特征Xj在随机森林模型的基尼指数评分通过公式
Figure FDA0002398628680000023
来实现;其中,
Figure FDA0002398628680000024
Figure FDA0002398628680000025
表示特征Xj在第i个CART决策树模型中出现的节点包含在集合M中所对应的基尼指数评分;n为CART决策树模型的总数。
6.如权利要求1所述的基于随机森林算法来训练子宫内膜异位囊肿破裂数据的方法,其特征在于,在所述步骤S4中,所述采用粒子群算法对所述随机森林模型进行优化的具体步骤包括:
第一步、对粒子群算法进行部分调整,使其适用于离散值的算法优化;
第二步、设置粒子群算法的代价函数或者称之为适应度函数:
prob=fitness(max_depth,n_estimators,min_samples_split)
适应度函数的值等于上述随机森林算法得到的准确率;
第三步:设置最大迭代次数max_iter、目标函数的自变量个数pN、粒子的最大速度X、可行解的搜索空间、学习因子c1和c2、以及种群大小,并进一步构造一个随机群体:
Figure FDA0002398628680000031
Figure FDA0002398628680000032
第四步、对于群体中的每一个粒子,将粒子位置代入代价函数求出适应值,寻找个体极值为每个粒子找到的最优解;再根据这些个体极值最优解寻找到一个全局值最优解,最后将本次全局最优解与历史全局最优解比较,如果本次全局最优解结果较好则进行更新,以此寻找种群所经历过的最好位置gbest(g1,g2,g3.....gD);
第五步、更新速度和位置的公式;
Figure FDA0002398628680000033
Figure FDA0002398628680000034
第六步、重复执行第四步和第五步;当达到设定迭代次数或者代数之间的差值满足最小界限时终止迭代,将最佳参数代入随机森林算法,优化后的随机森林模型。
CN202010139668.XA 2020-03-03 2020-03-03 基于随机森林算法训练子宫内膜异位囊肿破裂数据的方法 Pending CN111340125A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010139668.XA CN111340125A (zh) 2020-03-03 2020-03-03 基于随机森林算法训练子宫内膜异位囊肿破裂数据的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010139668.XA CN111340125A (zh) 2020-03-03 2020-03-03 基于随机森林算法训练子宫内膜异位囊肿破裂数据的方法

Publications (1)

Publication Number Publication Date
CN111340125A true CN111340125A (zh) 2020-06-26

Family

ID=71184050

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010139668.XA Pending CN111340125A (zh) 2020-03-03 2020-03-03 基于随机森林算法训练子宫内膜异位囊肿破裂数据的方法

Country Status (1)

Country Link
CN (1) CN111340125A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114444738A (zh) * 2022-04-08 2022-05-06 国网浙江省电力有限公司物资分公司 一种电气设备保养周期生成方法
CN113837440B (zh) * 2021-08-20 2023-09-12 中国矿业大学(北京) 一种爆破效果预测方法、装置、电子设备和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107132268A (zh) * 2017-06-21 2017-09-05 佛山科学技术学院 一种用于识别肺癌组织的数据处理装置及系统
CN108108762A (zh) * 2017-12-22 2018-06-01 北京工业大学 一种用于冠心病数据分类的基于核极限学习机及并行化的随机森林分类方法
CN108830326A (zh) * 2018-06-21 2018-11-16 河南工业大学 一种mri图像的自动分割方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107132268A (zh) * 2017-06-21 2017-09-05 佛山科学技术学院 一种用于识别肺癌组织的数据处理装置及系统
CN108108762A (zh) * 2017-12-22 2018-06-01 北京工业大学 一种用于冠心病数据分类的基于核极限学习机及并行化的随机森林分类方法
CN108830326A (zh) * 2018-06-21 2018-11-16 河南工业大学 一种mri图像的自动分割方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
YI-FAN WANG等: "Mining Medical Data: A Case Study of Endometriosis", 《J MED SYST》 *
ZJUPECO: "利用随机森林对特征重要性进行评估", 《HTTPS://BLOG.CSDN.NET/ZJUPECO/ARTICLE/DETAILS/77371645?LOCATIONNUM=7&FPS=1》 *
商隽 等: "《Python机器学习实战》", 28 February 2018 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113837440B (zh) * 2021-08-20 2023-09-12 中国矿业大学(北京) 一种爆破效果预测方法、装置、电子设备和介质
CN114444738A (zh) * 2022-04-08 2022-05-06 国网浙江省电力有限公司物资分公司 一种电气设备保养周期生成方法

Similar Documents

Publication Publication Date Title
CN110851645B (zh) 一种基于深度度量学习下相似性保持的图像检索方法
CN106021364B (zh) 图片搜索相关性预测模型的建立、图片搜索方法和装置
CN111860576A (zh) 一种基于随机森林的子宫内膜肿瘤分类标记方法
CN105844300A (zh) 一种基于随机森林算法的优化分类方法及装置
CN110866134B (zh) 一种面向图像检索的分布一致性保持度量学习方法
CN109829478B (zh) 一种基于变分自编码器的问题分类方法和装置
CN110826618A (zh) 一种基于随机森林的个人信用风险评估方法
CN111914162B (zh) 一种基于知识图谱的个性化学习方案引导方法
Nababan et al. Attribute weighting based K-nearest neighbor using gain ratio
CN111340125A (zh) 基于随机森林算法训练子宫内膜异位囊肿破裂数据的方法
CN116010884A (zh) 基于主成分分析的SSA-LightGBM油浸式变压器的故障诊断方法
Raju et al. Predicting the outcome of english premier league matches using machine learning
CN112001480A (zh) 基于生成对抗网络的滑动定向数据小样本扩增方法
CN117131345A (zh) 一种基于数据深度学习计算的多源数据参数评估方法
Bressan et al. A decision tree approach for the musical genres classification
CN112116072A (zh) 一种量化神经网络中多个输入变量之间相互作用的方法
CN117035983A (zh) 信贷风险等级的确定方法、装置、存储介质及电子设备
CN116503147A (zh) 一种基于深度学习神经网络的金融风险预测方法
CN112465054B (zh) 一种基于fcn的多变量时间序列数据分类方法
CN113127464B (zh) 农业大数据环境特征处理方法、装置及电子设备
CN112132259B (zh) 神经网络模型输入参量降维方法及计算机可读存储介质
CN114757433A (zh) 一种饮用水源抗生素抗性相对风险快速识别方法
CN110955606B (zh) 一种基于随机森林的c语言源代码静态评分方法
CN113010673A (zh) 一种基于熵优化支持向量机的漏洞自动分类方法
CN111368069A (zh) 一种图谱推理规则的自动提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200626