CN110751257A - 一种基于饥饿游戏搜索算法构建预测模型的方法 - Google Patents

一种基于饥饿游戏搜索算法构建预测模型的方法 Download PDF

Info

Publication number
CN110751257A
CN110751257A CN201910944048.0A CN201910944048A CN110751257A CN 110751257 A CN110751257 A CN 110751257A CN 201910944048 A CN201910944048 A CN 201910944048A CN 110751257 A CN110751257 A CN 110751257A
Authority
CN
China
Prior art keywords
individual
fitness
gamma
value
hunger
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910944048.0A
Other languages
English (en)
Inventor
陈慧灵
杨宇涛
丁泽威
刘国民
罗云纲
赵学华
汪鹏君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wenzhou University
Original Assignee
Wenzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wenzhou University filed Critical Wenzhou University
Priority to CN201910944048.0A priority Critical patent/CN110751257A/zh
Publication of CN110751257A publication Critical patent/CN110751257A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于饥饿游戏搜索算法构建预测模型的方法,包括获取样本数据并对所获取到的样本数据进行归一化处理;利用基于饥饿游戏搜索算法优化支持向量机的惩罚因子C和核宽γ;基于所获得的惩罚因子C和核宽γ,利用所归一化处理后的数据来构建预测模型,并基于所构建的预测模型对待分类样本进行分类和预测。实施本发明,通过基于饥饿游戏搜索算法来优化SVM的惩罚因子和核宽,借助算法易收敛,收敛精度高,以及逃脱局部最优解的能力强的特点,找到更优的全局近似最优解以获得分类精度更高的SVM模型。

Description

一种基于饥饿游戏搜索算法构建预测模型的方法
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于饥饿游戏搜索(HGS)算法构建预测模型的方法。
背景技术
支持向量机(SVM)常用于构建预测模型来对数据进行分析,该支持向量机(SVM)最常用的两种参数优化方法包括网格搜索和梯度下降。在第一种参数优化方法中,网格搜索是一种穷举搜索方法,它一般是通过设置合理的区间上下限和间隔步长对指定参数空间进行划分,然后对每个网格节点代表的参数组合进行训练和预测,将这些预测结果中取值最高的一组参数作为最终SVM模型的最佳参数。该方法虽然在一定程度上能保证得到给定参数空间内最优的参数组合,然而随着参数空间增大,其搜索效率会大大降低,特别是设置合理的区间和间隔步长值往往非常困难,从而大大降低了其可行性,而且模型也非常容易陷入局部最优值;在第二种参数优化方法中,梯度下降方法虽然能克服网格搜索方法的缺陷,但是它对初始值非常敏感,特别是初始参数设置离最优解非常远的时候,模型很容易收敛到局部最优解。
近年来,由于元启发式的搜索算法凭借其独特的全局寻优能力而受到了学术和工业界的广泛关注,它们被普遍认为比传统寻优方法具有更大的机会找到全局最优解,因此提出多种基于元启发式算法的SVM训练算法来处理参数优化问题。
SVM在具体应用时,其性能主要受包括线性核函数、多项式核函数、径向基(RBF)核函数和sigmoid核函数等核函数影响,一般情况下选择基于RBF核函数的SVM。RBF核SVM主要涉及两个重要的参数C和γ。C是惩罚因子,它用于控制对错分样本惩罚的程度,起到控制训练误差和模型复杂度之间平衡的作用;C值越小,则对数据中误判样本的惩罚也越小,使得训练误差变大,因此结构风险也变大。相反,C值越大,对错分样本的约束程度就越大,这样会导致模型虽然对训练数据的误判率很低,但整体的泛化能力却很差,容易出现“过拟合”现象。参数γ代表RBF核函数中的核宽,它决定了核函数的宽度,直接影响SVM的性能。如果γ取得不恰当,SVM很难获得预期的学习效果。γ值太小会导致过拟合,γ值太大会使SVM的判别函数过于平缓。所以惩罚因子C和核宽γ从不同的角度影响着SVM的分类超平面。在实际应用中,它们取值过大或过小都会使SVM的泛化性能变差。
但是,采用现有的元启发式的搜索算法来处理SVM参数优化问题,还有待进一步提升算法的收敛速度和收敛精度,提升算法逃脱局部最优解的能力,从而找到更优的全局近似最优解。
发明内容
本发明实施例所要解决的技术问题在于,提供一种基于饥饿游戏搜索算法构建预测模型的方法,通过基于饥饿游戏搜索算法(HGS)来优化SVM的惩罚因子和核宽,借助算法易收敛,收敛精度高,以及逃脱局部最优解的能力强的特点,找到更优的全局近似最优解以获得分类精度更高的SVM模型。
为了解决上述技术问题,本发明实施例提供了一种基于饥饿游戏搜索算法构建预测模型的方法,所述方法包括以下步骤:
步骤S1:获取样本数据并对所获取到的样本数据进行归一化处理;
步骤S2、利用基于饥饿游戏搜索算法优化支持向量机的惩罚因子C和核宽γ,具体为:
步骤S2.1、参数初始化;其中,初始化的参数包括:种群个数N、最大迭代次数Max_iter、问题维度D、总饥饿度SHungry、C的搜索空间[Cmin,Cmax]和γ的搜索空间[γmin,γmax];
步骤S2.2、种群位置初始化:随机产生N个个体位置,其中第i个个体的位置为Xi=(xi1,xi2),i=1,2,……,N;其中,xi1表示个体i在当前位置时的C值,xi2表示个体i在当前位置时的γ值;
步骤S2.3、对N个个体计算其适应度fi,该适应度值是基于个体i当前位置的C和γ值;首先,根据公式(1)以内部K折交叉验证策略计算支持向量机的准确度ACC,并将该值作为个体i的适应度fi的值;然后,将适应度fi的值由大到小降序排序,取适应度值中最优的个体的适应度保存为bF,最差的个体的适应度值保存为wF,并根据公式(2)和(3)计算个体的饥饿感权重;最后,若bF优于全局最优适应度值DF,则将DF更新为bF,并将该个体位置保存至个体最佳位置bestPosition中;
Figure BDA0002223691000000032
Figure BDA0002223691000000033
其中,
Figure BDA0002223691000000034
Figure BDA0002223691000000035
UB和LB根据j的不同取值分别为步骤2.1中C和γ的最大、最小值;AllFitness(i)为存储了每个个体的适应度值的数组;r、r3、r4、r5、r6均表示介于0-1的随机数,l为一个常数;
其中,acck表示每一折数据上计算获得的准确度;
步骤S2.4、根据公式(4)~(6),计算出各个个体的新位置,并更新个体的位置;
E=sech(|AllFitness(i)-BF|) (4);
Figure BDA0002223691000000036
Figure BDA0002223691000000037
其中,r1、r2和rand均为[0,1]之间的随机数;Sech()为一个双曲函数,该函数表示为
Figure BDA0002223691000000041
Xb表示种群中最优个体的位置信息;
步骤S2.5、采取和步骤2.3中相同的C和γ编码方式后以内部K折交叉验证策略计算每一个个体的适应度;
步骤S2.6、判断是否超过最大迭代次数Max_iter;若否,则跳转至步骤S2.3;若是,则执行下一步骤S2.7;
步骤S2.7、输出个体最佳位置bestPosition及其对应的适应度,即最优的惩罚因子C和核宽γ值;
步骤S3、基于所获得的惩罚因子C和核宽γ,利用所归一化处理后的数据来构建下述公式(7)所示的预测模型,并基于所构建的预测模型对待分类样本进行分类和预测;其中,K(·)采用公式(8)所示;xj表示第j个归一化处理后的样本数据;xi(i=1...l)表示训练样本;yi(i=1...l)表示训练样本对应的标签,yi=1代表正类样本,yi=-1代表负类样本;b为阈值;αi是拉格朗日系数;
Figure BDA0002223691000000042
K(xi,xj)=exp(-r||xi-xj||2) (8)。
实施本发明实施例,具有如下有益效果:
本发明通过基于饥饿游戏搜索算法(HGS)将优化SVM的惩罚因子C和核宽γ编码为个体位置进行优化,并在优化过程中采用K折交叉验证,不仅使算法能快速收敛从而有效地找到最优值,还能防止算法陷入局部最优解。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,根据这些附图获得其他的附图仍属于本发明的范畴。
图1为本发明实施例提供的基于饥饿游戏搜索算法构建预测模型的方法的流程图;
图2为本发明实施例提供的基于饥饿游戏搜索算法构建预测模型的方法的应用场景中个体的位置编码示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
如图1所示,为本发明实施例中,提出的一种基于饥饿游戏搜索算法构建预测模型的方法,所述方法包括以下步骤:
步骤S1:获取样本数据并对所获取到的样本数据进行归一化处理;
具体过程为,样本数据来源于多种不同领域,可根据实际需要进行设计,如医疗领域、金融领域等,数据属性类别分为数据属性和类别属性。如针对乳腺癌疾病的数据单个样本属性,该数据属性值分为两大类即数据属性X1-X9表示了针对乳腺癌疾病的相关医学病理方面的属性,X10表示了该数据样本的类别:即是否患乳腺癌疾病,若样本患病:值为1,若样本健康:值为-1;又如,针对企业破产风险预测数据单个样本属性分布,会有X1-Xn个这样的相关金融指标如负债率、资产总额等属性指标,则Xn+1也是类别标签:即该企业在两年内是否有破产风险的存在,若有破产风险标签为1,没有破产风险标签为-1。
为了便于数据处理,会对所获取到的样本数据进行归一化处理。
步骤S2、利用基于饥饿游戏搜索算法优化支持向量机的惩罚因子C和核宽γ,具体为:
步骤S2.1、参数初始化;其中,初始化的参数包括:种群个数N、最大迭代次数Max_iter、问题维度D、总饥饿度SHungry、C的搜索空间[Cmin,Cmax]和γ的搜索空间[γmin,γmax];
步骤S2.2、种群位置初始化:随机产生N个个体位置,其中第i个个体的位置为Xi=(xi1,xi2),i=1,2,……,N;其中,xi1表示个体i在当前位置时的C值,xi2表示个体i在当前位置时的γ值,如图2所示;
步骤S2.3、对N个个体计算其适应度fi,该适应度值是基于个体i当前位置的C和γ值;首先,根据公式(1)以内部K折交叉验证策略计算支持向量机的准确度ACC,并将该值作为个体i的适应度fi的值;然后,将适应度fi的值由大到小降序排序,取适应度值中最优的个体的适应度保存为bF,最差的个体的适应度值保存为wF,并根据公式(2)和(3)计算个体的饥饿感权重;最后,若bF优于全局最优适应度值DF,则将DF更新为bF,并将该个体位置保存至个体最佳位置bestPosition中;
Figure BDA0002223691000000061
Figure BDA0002223691000000063
其中,
Figure BDA0002223691000000065
UB和LB根据j的不同取值分别为步骤2.1中C和γ的最大、最小值;AllFitness(i)为存储了每个个体的适应度值的数组;r、r3、r4、r5、r6均表示介于0-1的随机数,l为一个常数;
其中,acck表示每一折数据上计算获得的准确度;
步骤S2.4、根据公式(4)~(6),计算出各个个体的新位置,并更新个体的位置;
E=sech(|AllFitness(i)-BF|) (4);
Figure BDA0002223691000000067
其中,r1、r2和rand均为[0,1]之间的随机数;Sech()为一个双曲函数,该函数表示为
Figure BDA0002223691000000071
Xb表示种群中最优个体的位置信息;
步骤S2.5、采取和步骤2.3中相同的C和γ编码方式后以内部K折交叉验证策略计算每一个个体的适应度;
步骤S2.6、判断是否超过最大迭代次数Max_iter;若否,则跳转至步骤S2.3;若是,则执行下一步骤S2.7;
步骤S2.7、输出个体最佳位置bestPosition及其对应的适应度,即最优的惩罚因子C和核宽γ值;
步骤S3、基于所获得的惩罚因子C和核宽γ,利用所归一化处理后的数据来构建下述公式(7)所示的预测模型,并基于所构建的预测模型对待分类样本进行分类和预测;其中,K(·)采用公式(8)所示;xj表示第j个归一化处理后的样本数据;xi(i=1...l)表示训练样本;yi(i=1...l)表示训练样本对应的标签,yi=1代表正类样本,yi=-1代表负类样本;b为阈值;αi是拉格朗日系数;
Figure BDA0002223691000000072
K(xi,xj)=exp(-r||xi-xj||2) (8)。
在本发明实施例中,对基于饥饿游戏搜索算法构建预测模型的方法的应用场景做进一步说明:
采用乳腺癌数据作为样本数据,样本集合这样表示:(xi,yi),i=1......699,其中‘xi’表示9维的特征向量,y是值为1或-1的样本标签,‘1’代表该样本是患乳腺癌,‘-1’代表该患者是健康的。
首先,将待实验样本数据各个特征属性值进行标准化,利用公式
Figure BDA0002223691000000073
对样本数据进行标准化,其中Si代表样本中的属性的特征原始值,S′i是Si由公式所得到的标准化后的值,Smin表示对应的样本数据中的最小值,Smax表示对应的样本数据中的最大值;
随后,利用基于饥饿游戏搜索算法优化支持向量机的惩罚系数C和核宽γ,且在内部采用K折交叉策略进行优化(即将导入模型的样本进行K折切割,每一次都以其中的K-1折作为训练数据,且在训练的同时采用饥饿游戏搜索算法对于其中两个关键性的参数进行优化,期望获得最佳的智能分类模型,模型构建好后,在用剩余的数据作为测试数据,对于构建的智能决策模型的性能进行评估)。简而言之,就是针对不同的智能分类决策问题,我们需要采用具有全局搜索能力的饥饿游戏搜索算法去实现构造出针对此类问题最佳的分类决策模型,当然如之前论述:惩罚系数C和核宽γ是对该模型的性能具有重要的影响,也就是说,这两个参数的好坏将直接影响决策模型的性能的好坏,所以在此我们提出饥饿游戏搜索算法去完成对这两个参数的选择,不仅在性能上优于传统算法,有效避免了陷入局部极值点的情况,也在一定程度上使用了算法较好的收敛速度和精度。
输入训练样本(xi,yi),且依据Largrange对偶问题优化的问题变为:
Figure BDA0002223691000000081
Figure BDA0002223691000000082
然后对于以上的优化问题采用饥饿游戏搜索算法对C和γ(是径向基核函数参数核宽K(xi,xj)=exp(-γ||xi-xj||2))进行优化,并求解出最优解的值为:
a*=(a1 *,a2 *,...,a* 699)T
则有如下解:
Figure BDA0002223691000000083
那么最终的最优分类超平面函数为:
Figure BDA0002223691000000084
实施本发明实施例,具有如下有益效果:
本发明通过基于饥饿游戏搜索算法(HGS)将优化SVM的惩罚因子C和核宽γ编码,利用HGS的良好特性来对这两个参数进行优化,并在优化过程中采用K折交叉验证,以找到能实现更优分类性能的惩罚因子和核宽。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘、光盘等。
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (1)

1.一种基于饥饿游戏搜索算法构建预测模型的方法,其特征在于,所述方法包括以下步骤:
步骤S1:获取样本数据并对所获取到的样本数据进行归一化处理;
步骤S2、利用基于饥饿游戏搜索算法优化支持向量机的惩罚因子C和核宽γ,具体为:
步骤S2.1、参数初始化;其中,初始化的参数包括:种群个数N、最大迭代次数Max_iter、问题维度D、总饥饿度SHungry、C的搜索空间[Cmin,Cmax]和γ的搜索空间[γmin,γmax];
步骤S2.2、种群位置初始化:随机产生N个个体位置,其中第i个个体的位置为Xi=(xi1,xi2),i=1,2,……,N;其中,xi1表示个体i在当前位置时的C值,xi2表示个体i在当前位置时的γ值;
步骤S2.3、对N个个体计算其适应度fi,该适应度值是基于个体i当前位置的C和γ值;首先,根据公式(1)以内部K折交叉验证策略计算支持向量机的准确度ACC,并将该值作为个体i的适应度fi的值;然后,将适应度fi的值由大到小降序排序,取适应度值中最优的个体的适应度保存为bF,最差的个体的适应度值保存为wF,并根据公式(2)和(3)计算个体的饥饿感权重;最后,若bF优于全局最优适应度值DF,则将DF更新为bF,并将该个体位置保存至个体最佳位置bestPosition中;
Figure FDA0002223690990000012
Figure FDA0002223690990000013
其中,
Figure FDA0002223690990000014
UB和LB根据j的不同取值分别为步骤2.1中C和γ的最大、最小值;AllFitness(i)为存储了每个个体的适应度值的数组;r、r3、r4、r5、r6均表示介于0-1的随机数,l为一个常数;
其中,acck表示每一折数据上计算获得的准确度;
步骤S2.4、根据公式(4)~(6),计算出各个个体的新位置,并更新个体的位置;
E=sech(|AllFitness(i)-BF|) (4);
Figure FDA0002223690990000022
Figure FDA0002223690990000023
其中,r1、r2和rand均为[0,1]之间的随机数;Sech()为一个双曲函数,该函数表示为
Figure FDA0002223690990000024
Xb表示种群中最优个体的位置信息;
步骤S2.5、采取和步骤2.3中相同的C和γ编码方式后以内部K折交叉验证策略计算每一个个体的适应度;
步骤S2.6、判断是否超过最大迭代次数Max_iter;若否,则跳转至步骤S2.3;若是,则执行下一步骤S2.7;
步骤S2.7、输出个体最佳位置bestPosition及其对应的适应度,即最优的惩罚因子C和核宽γ值;
步骤S3、基于所获得的惩罚因子C和核宽γ,利用所归一化处理后的数据来构建下述公式(7)所示的预测模型,并基于所构建的预测模型对待分类样本进行分类和预测;其中,K(·)采用公式(8)所示;xj表示第j个归一化处理后的样本数据;xi(i=1...l)表示训练样本;yi(i=1...l)表示训练样本对应的标签,yi=1代表正类样本,yi=-1代表负类样本;b为阈值;αi是拉格朗日系数;
Figure FDA0002223690990000025
K(xi,xj)=exp(-r||xi-xj||2) (8)。
CN201910944048.0A 2019-09-30 2019-09-30 一种基于饥饿游戏搜索算法构建预测模型的方法 Pending CN110751257A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910944048.0A CN110751257A (zh) 2019-09-30 2019-09-30 一种基于饥饿游戏搜索算法构建预测模型的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910944048.0A CN110751257A (zh) 2019-09-30 2019-09-30 一种基于饥饿游戏搜索算法构建预测模型的方法

Publications (1)

Publication Number Publication Date
CN110751257A true CN110751257A (zh) 2020-02-04

Family

ID=69277660

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910944048.0A Pending CN110751257A (zh) 2019-09-30 2019-09-30 一种基于饥饿游戏搜索算法构建预测模型的方法

Country Status (1)

Country Link
CN (1) CN110751257A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114448319A (zh) * 2022-04-08 2022-05-06 华中科技大学 一种永磁同步电机参数辨识方法、装置、设备及存储介质
CN115344846A (zh) * 2022-07-29 2022-11-15 贵州电网有限责任公司 一种指纹检索模型及验证方法
CN115935859A (zh) * 2023-03-01 2023-04-07 成都前沿动力科技有限公司 一种基于svr-modea的型面结构优化方法、系统、设备及介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114448319A (zh) * 2022-04-08 2022-05-06 华中科技大学 一种永磁同步电机参数辨识方法、装置、设备及存储介质
CN114448319B (zh) * 2022-04-08 2022-06-17 华中科技大学 一种永磁同步电机参数辨识方法、装置、设备及存储介质
CN115344846A (zh) * 2022-07-29 2022-11-15 贵州电网有限责任公司 一种指纹检索模型及验证方法
CN115935859A (zh) * 2023-03-01 2023-04-07 成都前沿动力科技有限公司 一种基于svr-modea的型面结构优化方法、系统、设备及介质

Similar Documents

Publication Publication Date Title
CN110705640A (zh) 一种基于黏菌算法构建预测模型的方法
Gosselin et al. Active learning methods for interactive image retrieval
Alves et al. An artificial immune system for fuzzy-rule induction in data mining
CN110751257A (zh) 一种基于饥饿游戏搜索算法构建预测模型的方法
Gu et al. Bayesian Takagi–Sugeno–Kang fuzzy classifier
CN111079074A (zh) 一种基于改进的正弦余弦算法构建预测模型的方法
CN109697289A (zh) 一种改进的用于命名实体识别的主动学习方法
CN110738362A (zh) 一种基于改进的多元宇宙算法构建预测模型的方法
Yang et al. Margin optimization based pruning for random forest
JP7473511B2 (ja) 学習装置、学習方法および学習プログラム
CN111834010A (zh) 一种基于属性约简和XGBoost的COVID-19检测假阴性识别方法
Maliah et al. MDP-based cost sensitive classification using decision trees
CN110991494A (zh) 一种基于改进的飞蛾优化算法构建预测模型的方法
CN110222751A (zh) 一种基于正交多种群正余弦算法来构建预测模型的方法
CN110069817A (zh) 一种基于改进灰鲸优化算法来构建预测模型的方法
El Moutaouakil et al. Optimal entropy genetic fuzzy-C-means SMOTE (OEGFCM-SMOTE)
CN112215259A (zh) 基因选择方法和装置
Rustam et al. Classification of cancer data based on support vectors machines with feature selection using genetic algorithm and laplacian score
CN109948675A (zh) 基于前哨多种群机制果蝇优化算法来构建预测模型的方法
KR102577714B1 (ko) 불균형 데이터 학습 장치 및 방법
Arunadevi et al. Comparison of feature selection strategies for classification using rapid miner
CN112115969B (zh) 一种基于变异樽海鞘群算法优化fknn模型参数的方法及装置
CN113553778A (zh) 模型的参数优化方法以及电子设备、计算机可读存储介质
Sun et al. Radial-based undersampling approach with adaptive undersampling ratio determination
CN110598742A (zh) 基于量子旋转门及退火飞蛾优化算法构建预测模型的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200204