CN103400190A - 一种使用遗传算法优化极限学习机的集成框架方法 - Google Patents
一种使用遗传算法优化极限学习机的集成框架方法 Download PDFInfo
- Publication number
- CN103400190A CN103400190A CN201310351903XA CN201310351903A CN103400190A CN 103400190 A CN103400190 A CN 103400190A CN 201310351903X A CN201310351903X A CN 201310351903XA CN 201310351903 A CN201310351903 A CN 201310351903A CN 103400190 A CN103400190 A CN 103400190A
- Authority
- CN
- China
- Prior art keywords
- learning machine
- genetic algorithm
- extreme learning
- extremity
- hidden layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
本发明公开了一种使用遗传算法优化极限学习机的集成框架方法,在确定遗传算法框架中每个个体适应度时,使用的是从训练集中随机抽取的样例作为验证测试集,可以有效提高训练的网络的泛化性;完成迭代后,遗传算法中保留了一个训练误差较小的极限学习机种群,然后依据极限学习机的特点,选择出其中训练误差小并且输出权值范数小的优秀个体用于集成。该方法充分利用了极限学习训练速度快的特点,通过使用遗传算法的框架并使用较少的迭代次数优化极限学习机个体,并根据极限学习机理论制定了相应的选择机制,将训练误差小同时输出权值的范数小的极限学习机选择出来用于集成网络,在可接受的训练时间内,泛化能力和网络稳定性得到了显著提高。
Description
技术领域
本发明属于计算智能、神经网络技术领域,涉及一种使用遗传算法优化极限学习机的集成框架方法。
背景技术
极限学习机是一种简单而又有效的训练单隐层前馈神经网络的方法,与传统神经网络学习算法使用类似梯度下降之类的方法调整网络中参数不同的是,极限学习机随机产生输入参数及隐含层的阈值,然后输出权值通过Moore-Penrose广义逆矩阵计算出来。通过以上过程得到的极限学习机,不仅拥有很小的训练误差,同时也拥有很小的输出权值范数。根据Barlett的理论,在前馈神经网络中,当训练误差很小的时候,输出权值的范数越小,泛化能力越好。因此,极限学习机拥有良好的泛化能力。因为不需要调整参数,所以极限学习机的学习速度非常快。但是由于一些参数是随机产生的,不可避免的一些较为差的参数被随机出来从而影响整个极限学习的稳定性及泛化能力,而且使用整个训练集进行训练,有可能出现过适应问题。
神经网络的集成是通过使用多个神经网络共同对同一问题进行预测,它们通过不同的神经网络预测的结果通过一定方式组合起来作为最后的结果。实验及理论表明,通过集成许多神经网络共同作出预测,可以有效的避免单个神经网络的错误。现在应用较为广泛的集成方法如Bagging、Boost,都没有充分利用极限学习机的特点,而且实验结果表明通用的集成方法对极限学习机泛化能力的提升并不是那么明显。
发明内容
为解决上述极限学习机易随机出较差的随机参数及可能的过适应问题,本发明的目的在于提供一种使用遗传算法优化极限学习机的集成框架方法,利用遗传算法训练优化极限学习机并将其集成的计算框架,充分利用的极限学习机的特点,在可接受的训练时间内,泛化能力和网络稳定性得到了显著提高。
为实现上述目的,本发明的技术方案为:
一种使用遗传算法优化极限学习机的集成框架方法,包括如下步骤:
S10:将极限学习机随机产生的输入权值及隐含层节点阈值编码成遗传算法个体,使用遗传算法随机出初始种群;
S11:从整个训练集随机抽取出的一部分训练样本组成验证测试集,并使用验证测试集计算出每个个体的适应度;
S12:使用交叉变异等遗传操作,产生与父代种群数相同的新种群;
S13:从现有的两个种群中选择适应值优秀个体,进入下一代;
S14:判断是否达到迭代次数,如果未达到迭代次数,则跳转到步骤S11;
S15:将遗传算法留下种群中的个体按照适应值排序,保留集成数2倍的适应值优秀个体;
S16:将保留个体按照输出权值的范数进行排序,保留其中输出权值范数小的一半;
S17:将最终选择的极限学习机集成。
进一步地,步骤S10中,每个个体的格式为:
θ=[w11,w12,...,w1L,w21,...wn1,...,wnL,...,b1,b2,...,bL]
进一步地,步骤S11中,适应度公式为:
N为随机抽取的验证测试集中的样本个数,L为隐含层节点数,xj=[xj1,xj2,...,xjn]T为验证测试集中第j个样本的输入,n为样本的输入维度即输入层节点数,tj=[tj1,tj2,...,tjm]T为验证测试集中第j个样本的输出,m为样本输出的维度即输出层节点数,wi=[wi1,wi2,...,win]T为输入层节点与第i个隐含层节点的连接权值,bi=[bi1,bi2,...,biL]T为第i个隐含层节点的阈值,βi=[βi1,βi2,...,βim]T为输出层节点与第i个隐含层节点的连接权值;g(wi·xj+bi)为隐含层激活函数。
进一步地,步骤S17中,整个集成网络的最终输出结果是将每个极限学习得到的结果平均,分类问题通过投票机制,将每个极限学习机的分类结果相加,其中和最大的一维即为分类结果。
相较于现有技术,本发明一种使用遗传算法优化极限学习机的集成框架方法充分利用了极限学习训练速度快的特点,通过使用遗传算法使用较少的迭代次数优化极限学习机个体。并根据极限学习机理论制定了相应的选择机制,将训练误差小同时输出权值的范数小的极限学习机选择出来用于集成网络,在可接受的训练时间内,泛化能力和网络稳定性得到了显著提高。
附图说明
图1是本发明方法的流程图示。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,本发明一种使用遗传算法优化极限学习机的集成框架方法包括如下步骤:
S10:将极限学习机随机产生的输入权值及隐含层节点阈值编码成遗传算法个体,使用遗传算法随机出初始种群。
其中,每个个体的格式为:
θ=[w11,w12,...,w1L,w21,...w2L,wn1,...,wnL,...,b1,b2,...,bL]
S11:从整个训练集随机抽取出的一部分训练样本组成验证测试集,并使用验证测试集计算出每个个体的适应度。
其中,适应度公式为:
N为随机抽取的验证测试集中的样本个数,L为隐含层节点数,xj=[xj1,xj2,...,xjn]T为验证测试集中第j个样本的输入,n为样本的输入维度即输入层节点数,tj=[tj1,tj2,...,tjm]T为验证测试集中第j个样本的输出,m为样本输出的维度即输出层节点数,wi=[wi1,wi2,...,win]T为输入层节点与第i个隐含层节点的连接权值,bi为第i个隐含层节点的阈值,βi=[βi1,βi2,...,βim]T为输出层节点与第i个隐含层节点的连接权值;g(wi·xj+bi)为隐含层激活函数,适应值公式机为求得每个验证测试集个体的均方根误差。
S12:使用交叉变异等遗传操作,产生与父代种群数相同的新种群。
S13:从现有的两个种群中选择适应值优秀个体,进入下一代。
S14:判断是否达到迭代次数,如果未达到迭代次数,则跳转到步骤S11。
S15:将遗传算法留下种群中的个体按照适应值排序,保留集成数2倍的适
应值优秀的个体。
S16:将保留个体按照输出权值的范数(即||β||,输出权值向量中每个元素的平方和然后再开根号)进行排序,保留其中输出权值范数小的一半。
S17:将最终选择的极限学习机集成。
整个集成网络的最终输出结果是将每个极限学习得到的结果平均,其中针对分类问题使用投票机制,即在每个极限学习机产生的结果中预测的结果记为1,其他的记为0;最终投票结果是将他们相加,数字最大的即为分类结果。
本发明一种使用遗传算法优化极限学习机的集成框架方法充分利用了极限学习训练速度快的特点,通过使用遗传算法的框架并使用较少的迭代次数优化极限学习机个体。并根据极限学习机理论制定了相应的选择机制,将训练误差小同时输出权值的范数小的极限学习机选择出来用于集成网络。
在确定遗传算法框架中每个个体适应度的时候,使用的是从训练集中随机抽取的样例作为验证测试集,这种方法与交叉验证类似,可以有效提高训练的网络的泛化性。完成迭代后,遗传算法中保留了一个训练误差较小的极限学习机种群。然后依据极限学习机的特点,选择出其中训练误差小并且输出权值范数小的优秀个体用于集成。
作为本发明一实施例,选取通用的回归和分类测试集各一个,机器学习中普遍使用通用测试集检验算法的有效性,选取的两个通用测试集都来自UCI机器学习数据库,回归测试集为Boston Housing测试集;分类测试集为Vehicle测试集。Boston Housing回归测试集中由506个样例组成,每个样例的输入维度为13维,输出维度1维;Vehicle分类测试集中由846个样例组成,每个样例的输入维度为18维,分为4类,即输出维度为4维。
针对以上不同的测试集,种群数为100,这里种群即优化的极限学习机数目,采用实数编码;交叉率为0.95,变异率为0.05;最终集成极限学习的数目为10;迭代次数为20。在Boston Housing回归测试集中,训练集数目为356个样例,其中有100个样例会在每一次迭代中被随机抽取出来作为测试验证集,测试集为150个样例;在Vehicle分类测试集中,训练集数目为546个样例,其中有100个样例会在每一次迭代中被随机抽取出来作为测试验证集,测试集为300个样例。
具体地,采用本发明方法如下:
(1)随机出100个极限学习的输入权值和隐含层节点阈值(即种群中的个体),使用极限学习理论将输出权值计算出来,从而随机出100个完整的极限学习机。
(2)使用从训练集中随机出的验证测试集计算每个种群个体的适应值。
(3)通过交叉、变异生成一个含有100个新个体的新种群。
(4)从100个父代种群和100个新种群个体中选择100个优秀个体作为下一代进化的种群。
(5)迭代次数是否到达20代,如果未到达20代,则跳转到步骤(2);否则继续执行后续步骤(6)。
(6)将由遗传算法优化过的100个优秀个体按照适应值排序,选出前20个优秀个体。
(7)将由步骤(6)选出的20个优秀个体按照其输出权值的范数(即将输出权值向量中的每个元素取平方和后再开根号)从小到大排序,选其中输出权值范数较小的前10个。
(8)将这10个极限学习机集成。针对Boston Housing回归通用测试集,将集成中的每个极限学习预测的回归值求和取平均值作为整个集成神经网络的最终预测值;针对Vehicle分类通用测试集,使用集成中的每个极限学习分别对Vehicle分类测试集中的样例进行预测分类,对于每一个样例,将10个极限学习分别预测的值相加,其中拥有最大预测值的分类项作为整个集成神经网络的预测分类结果。
使用上述方法结合上述两个通用测试集对本发明进行性能测试,分别独立测试50次,并与传统的极限学习机进行性能对比,求得的结果统计如表1、表2所示:
测试集 | 测试算法 | 平均测试误差 | 测试标准差 |
Boston Housing | 本创作方法 | 0.0743 | 0.00405 |
Boston Housing | 极限学习机 | 0.1038 | 0.0168 |
表1:与极限学习机使用回归标准测试集实验结果
测试集 | 测试算法 | 平均测试精度 | 测试标准差 |
Vehicle | 本创作方法 | 85.262% | 0.00917 |
Vehicle | 极限学习机 | 78.942% | 0.01545 |
表2:与极限学习机使用分类标准测试集实验结果
由上表1、表2可见,采用本创作方法测试产生的误差小,测试精度高。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.一种使用遗传算法优化极限学习机的集成框架方法,其特征在于,包括如下步骤;
S10:将极限学习机随机产生的输入权值及隐含层节点阈值编码成遗传算法个体,使用遗传算法随机出初始种群;
S11:从整个训练集随机抽取出的一部分训练样本组成验证测试集,并使用验证测试集计算出每个个体的适应度;
S12:使用交叉变异等遗传操作,产生与父代种群数相同的新种群;
S13:从现有的两个种群中选择适应值优秀个体,进入下一代;
S14:判断是否达到迭代次数,如果未达到迭代次数,则跳转到步骤S11;
S15:将遗传算法留下种群中的个体按照适应值排序,保留集成数2倍的适应值优秀个体;
S16:将保留个体按照输出权值的范数进行排序,保留其中输出权值范数小的一半;
S17:将最终选择的极限学习机集成。
2.如权利要求1所述使用遗传算法优化极限学习机的集成框架方法,其特征在于:步骤S10中,每个个体的格式为:
θ=[w11,w12,...,w1L,w21,...w2L,wn1,...,wnL,...,b1,b2,...,bL]
L为隐含层节点数,n为样本输入的维度即输入层节点数,wij为极限学习机中第i个输入层节点与第j个隐含层节点的连接权值,bi为第i个隐含层节点的阈值。
3.如权利要求2所述使用遗传算法优化极限学习机的集成框架方法,其特征在于:步骤S11中,适应度公式为:
N为随机抽取的验证测试集中的样本个数,L为隐含层节点数,xj=[xj1,xj2,...,xjn]T为验证测试集中第j个样本的输入,n为样本的输入维度即输入层节点数,tj=[tj1,tj2,...,tjm]T为验证测试集中第j个样本的输出,m为样本输出的维度即输出层节点数,wi=[wi1,wi2,...,win]T为输入层节点与第i个隐含层节点的连接权值,bi为第i个隐含层节点的阈值,βi=[βi1,βi2,...,βim]T为输出层节点与第i个隐含层节点的连接权值;g(wi·xj+bi)为隐含层激活函数,适应值公式机为求得每个验证测试集个体的均方根误差。
4.如权利要求3所述使用遗传算法优化极限学习机的集成框架方法,其特征在于:步骤S17中,整个集成网络的最终输出结果是将每个极限学习得到的结果平均。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310351903XA CN103400190A (zh) | 2013-08-13 | 2013-08-13 | 一种使用遗传算法优化极限学习机的集成框架方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310351903XA CN103400190A (zh) | 2013-08-13 | 2013-08-13 | 一种使用遗传算法优化极限学习机的集成框架方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103400190A true CN103400190A (zh) | 2013-11-20 |
Family
ID=49563807
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310351903XA Pending CN103400190A (zh) | 2013-08-13 | 2013-08-13 | 一种使用遗传算法优化极限学习机的集成框架方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103400190A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104182622A (zh) * | 2014-08-12 | 2014-12-03 | 大连海事大学 | 基于极限学习机的隧道施工中的反馈分析方法及其装置 |
CN104503420A (zh) * | 2014-09-19 | 2015-04-08 | 北京化工大学 | 一种基于新型fde-elm和时延efsm的非线性过程工业故障预测方法 |
CN107346459A (zh) * | 2017-05-22 | 2017-11-14 | 天津科技大学 | 一种基于遗传算法改进的多模式污染物集成预报方法 |
CN107392235A (zh) * | 2017-07-06 | 2017-11-24 | 西华大学 | 一种基于ga‑elm的接触网设备分类方法 |
CN108664992A (zh) * | 2018-03-30 | 2018-10-16 | 广东工业大学 | 一种基于遗传优化和核极限学习机的分类方法及装置 |
CN108804764A (zh) * | 2018-05-07 | 2018-11-13 | 电子科技大学 | 一种基于极限学习机的锂电池老化趋势预测方法 |
CN108805346A (zh) * | 2018-06-04 | 2018-11-13 | 东北大学 | 一种基于多隐层极限学习机的热连轧轧制力预报方法 |
CN108876054A (zh) * | 2018-07-06 | 2018-11-23 | 国网河南省电力公司郑州供电公司 | 基于改进遗传算法优化极限学习机的短期电力负荷预测方法 |
CN109034191A (zh) * | 2018-06-19 | 2018-12-18 | 哈尔滨工业大学 | 基于elm的单维遥测数据异常判读方法 |
CN109766990A (zh) * | 2019-01-09 | 2019-05-17 | 西安建筑科技大学 | 一种基于aga-elm混合算法的海底管线腐蚀速率预测方法 |
CN110074775A (zh) * | 2019-04-30 | 2019-08-02 | 郑州大学 | 基于ga-elm混合模型的急性心肌梗死定位方法 |
CN111796519A (zh) * | 2020-06-14 | 2020-10-20 | 武汉理工大学 | 一种基于极限学习机的多输入多输出系统自动控制方法 |
-
2013
- 2013-08-13 CN CN201310351903XA patent/CN103400190A/zh active Pending
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104182622B (zh) * | 2014-08-12 | 2017-04-05 | 大连海事大学 | 基于极限学习机的隧道施工中的反馈分析方法及其装置 |
CN104182622A (zh) * | 2014-08-12 | 2014-12-03 | 大连海事大学 | 基于极限学习机的隧道施工中的反馈分析方法及其装置 |
CN104503420A (zh) * | 2014-09-19 | 2015-04-08 | 北京化工大学 | 一种基于新型fde-elm和时延efsm的非线性过程工业故障预测方法 |
CN104503420B (zh) * | 2014-09-19 | 2017-02-15 | 北京化工大学 | 一种基于新型fde‑elm和时延efsm的非线性过程工业故障预测方法 |
CN107346459B (zh) * | 2017-05-22 | 2020-09-18 | 天津科技大学 | 一种基于遗传算法改进的多模式污染物集成预报方法 |
CN107346459A (zh) * | 2017-05-22 | 2017-11-14 | 天津科技大学 | 一种基于遗传算法改进的多模式污染物集成预报方法 |
CN107392235A (zh) * | 2017-07-06 | 2017-11-24 | 西华大学 | 一种基于ga‑elm的接触网设备分类方法 |
CN108664992A (zh) * | 2018-03-30 | 2018-10-16 | 广东工业大学 | 一种基于遗传优化和核极限学习机的分类方法及装置 |
CN108664992B (zh) * | 2018-03-30 | 2022-02-15 | 广东工业大学 | 一种基于遗传优化和核极限学习机的分类方法及装置 |
CN108804764A (zh) * | 2018-05-07 | 2018-11-13 | 电子科技大学 | 一种基于极限学习机的锂电池老化趋势预测方法 |
CN108805346A (zh) * | 2018-06-04 | 2018-11-13 | 东北大学 | 一种基于多隐层极限学习机的热连轧轧制力预报方法 |
CN109034191A (zh) * | 2018-06-19 | 2018-12-18 | 哈尔滨工业大学 | 基于elm的单维遥测数据异常判读方法 |
CN109034191B (zh) * | 2018-06-19 | 2021-06-01 | 哈尔滨工业大学 | 基于elm的单维遥测数据异常判读方法 |
CN108876054A (zh) * | 2018-07-06 | 2018-11-23 | 国网河南省电力公司郑州供电公司 | 基于改进遗传算法优化极限学习机的短期电力负荷预测方法 |
CN108876054B (zh) * | 2018-07-06 | 2022-03-01 | 国网河南省电力公司郑州供电公司 | 基于改进遗传算法优化极限学习机的短期电力负荷预测方法 |
CN109766990A (zh) * | 2019-01-09 | 2019-05-17 | 西安建筑科技大学 | 一种基于aga-elm混合算法的海底管线腐蚀速率预测方法 |
CN109766990B (zh) * | 2019-01-09 | 2022-09-13 | 西安建筑科技大学 | 一种基于aga-elm混合算法的海底管线腐蚀速率预测方法 |
CN110074775A (zh) * | 2019-04-30 | 2019-08-02 | 郑州大学 | 基于ga-elm混合模型的急性心肌梗死定位方法 |
CN111796519A (zh) * | 2020-06-14 | 2020-10-20 | 武汉理工大学 | 一种基于极限学习机的多输入多输出系统自动控制方法 |
CN111796519B (zh) * | 2020-06-14 | 2022-05-06 | 武汉理工大学 | 一种基于极限学习机的多输入多输出系统自动控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103400190A (zh) | 一种使用遗传算法优化极限学习机的集成框架方法 | |
Kore et al. | A simplified description of fuzzy TOPSIS method for multi criteria decision making | |
CN104155574B (zh) | 基于自适应神经模糊推理系统的配电网故障分类方法 | |
CN103729678B (zh) | 一种基于改进dbn模型的水军检测方法及系统 | |
CN103166830B (zh) | 一种智能选择训练样本的垃圾邮件过滤系统和方法 | |
Wahono et al. | Metaheuristic optimization based feature selection for software defect prediction. | |
CN105160444B (zh) | 电力设备故障率确定方法及系统 | |
CN106874934A (zh) | 基于加权极限学习机集成算法的污水处理故障诊断方法 | |
CN106326984A (zh) | 用户意图识别方法和装置、自动应答系统 | |
CN102521656A (zh) | 非平衡样本分类的集成迁移学习方法 | |
Du et al. | Time series prediction using evolving radial basis function networks with new encoding scheme | |
CN105373606A (zh) | 一种改进c4.5决策树算法下的不平衡数据抽样方法 | |
CN110363230B (zh) | 基于加权基分类器的stacking集成污水处理故障诊断方法 | |
CN102707256A (zh) | 基于BP-AdaBoost神经网络的电子式电能表故障诊断方法 | |
CN107766929A (zh) | 模型分析方法及装置 | |
Kempa et al. | Investigation of bagging ensembles of genetic neural networks and fuzzy systems for real estate appraisal | |
CN106127242A (zh) | 基于集成学习的年极端降水预测系统及其预测方法 | |
CN103440493A (zh) | 基于相关向量机的高光谱影像模糊分类方法及装置 | |
CN106327357A (zh) | 一种基于改进概率神经网络的负载识别方法 | |
CN105956722A (zh) | 一种短期风电功率的预测方法及装置 | |
CN105975611A (zh) | 自适应组合降采样增强学习机 | |
CN108446214A (zh) | 基于dbn的测试用例进化生成方法 | |
CN106778838A (zh) | 一种预测空气质量的方法 | |
CN107947738A (zh) | 一种太阳能无人机电池板电压的预测方法 | |
CN109376179A (zh) | 一种数据挖掘中样本平衡化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20131120 |