CN104616030A - 一种基于极限学习机算法的识别方法 - Google Patents

一种基于极限学习机算法的识别方法 Download PDF

Info

Publication number
CN104616030A
CN104616030A CN201510029085.0A CN201510029085A CN104616030A CN 104616030 A CN104616030 A CN 104616030A CN 201510029085 A CN201510029085 A CN 201510029085A CN 104616030 A CN104616030 A CN 104616030A
Authority
CN
China
Prior art keywords
sigma
network
activation function
output
beta
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510029085.0A
Other languages
English (en)
Other versions
CN104616030B (zh
Inventor
孙艳丰
杨新东
胡永利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201510029085.0A priority Critical patent/CN104616030B/zh
Publication of CN104616030A publication Critical patent/CN104616030A/zh
Application granted granted Critical
Publication of CN104616030B publication Critical patent/CN104616030B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于极限学习机算法的识别方法,其提高网络的泛化性能,使解析求得的输出权值更加利于分类,从而大大提高了识别率。该方法包括训练阶段,对于给定训练集N={(xi,ti)|xi∈Rn,ti∈Rm,i=1,…,N},激活函数g(x)=log(1+ex),隐单元个数L,其包括步骤:(1)随机生成输入单元与隐单元之间的权值wj,隐单元的偏置bj,其中j=1,…,L;(2)计算隐单元的输出矩阵;(3)分别计算H中同一类别分量的类内距Sw和不同类别分量的类间距Sb对输出权值β求导中的S1,S2;(4)通过公式(20)计算隐单元到输出单元的输出权值β。

Description

一种基于极限学习机算法的识别方法
技术领域
本发明属于模式识别和神经网络的技术领域,具体地涉及一种基于极限学习机算法的识别方法。
背景技术
人工神经网络(Artificial Neural Network,ANN)拥有强大的自学习、自组织、自适应能力,一直以来都是机器学习领域中比较普遍且实用的方法。其中,单隐层的前馈神经网络(Single-hidden Layer FeedforwardNeural networks,SLFN)因为结构简单并且具有一致的逼近能力,成为了ANN模型中研究的热点。传统的SLFN普遍采用梯度下降算法来训练,其收敛速度慢,网络中所有的参数都要经过多次迭代求得,通常花费时间要几小时几天甚至更长,有时甚至还会陷入局部最优解。为了解决以上问题,G.B.Huang等人于2004年提出了一种新型的SLFN算法,被称为极限学习机(Extreme Learning Machine,ELM)。该算法不依赖于输入权值和隐单元偏置的选择,可以进行随机赋值,然后通过合适的激活函数得到隐含层的输出矩阵,网络的输出权值可由解析直接求得。整个算法中所有参数的确定无需迭代,无需微调,因此与传统的训练方法如BP算法相比,其学习速度更快,泛化性能更好。
在神经网络当中,激活函数的性能表现一直处于核心地位,如果激活函数选择不当,那么无论怎么改进网络结构和学习方法都难以达到很好的学习精度,甚至根本不可能完成学习任务。Hornik和Leshno已经证明:对于含有可加节点的SLFN,如果激活函数为连续的,有界的并且非常数的非多项式,则一定可以逼近任意连续的目标函数。因此如果能选择合适的激活函数对于优化网络性能具有重要作用。
同时,传统的ELM算法通过优化网络实际输出与理论输出误差解析求得输出权值,所以它能很好地表示输入信号。当将ELM算法应用于分类任务时,训练样本类别信息是可利用的,如何将样本的类别信息加入到网络的学习模型当中,使学到的网络在保证表示效果的同时对同类样本具有更好的聚集性,对不同类样本具有更好的可分性,这对于分类识别问题尤为必要。
发明内容
本发明的技术解决问题是:克服现有技术的不足,提供一种基于极限学习机算法的识别方法,其提高网络的泛化性能,使解析求得的输出权值更加利于分类,从而大大提高了识别率。
本发明的技术解决方案是:这种基于极限学习机算法的识别方法,该方法包括训练阶段,对于给定训练集N={(xi,ti)|xi∈Rn,ti∈Rm,i=1,…,N},激活函数g(x)=log(1+ex),隐单元个数L,其包括以下步骤:
(1)随机生成输入单元与隐单元之间的权值wj,隐单元的偏置bj,其中j=1,…,L;
(2)通过公式(3)计算隐单元的输出矩阵H,
(3)通过公式(15)、(16)分别计算H中同一类别分量的类内距Sw和不同类别分量的类间距Sb对输出权值β求导中的S1,S2
S 1 = Σ i = 1 n [ Σ j = 1 n i h ( x j ) i - 1 n i Σ k = 1 n i h ( x j ) i ] T [ Σ j = 1 n i h ( x j ) i - 1 n i Σ k = 1 n i h ( x k ) i ] - - - ( 15 )
S 2 = Σ i = 1 n [ 1 n i Σ j = 1 n i h ( x j ) i - 1 N Σ k = 1 N h ( x k ) ] T [ 1 n i Σ j = 1 n i h ( x j ) i - 1 N Σ k = 1 N h ( x k ) ] - - - ( 16 ) ;
(4)通过公式(20)计算隐单元到输出单元的输出权值β
β = ( I C + H T H + a * S 1 - b * S 2 ) - 1 H T T - - - ( 20 ) .
本发明首先提出了一种更加接近生物学的激活模型且具有一定稀疏能力的Softplus激活函数来替代传统最常用的Sigmoid函数,提高网络的泛化性能;其次,为了更好的利用训练样本的标签信息,使解析求得的输出权值更加利于分类,本发明又提出了基于改进Fisher判别约束的ELM算法;从而在一定程度上进一步提高识别率。
附图说明
图1是极限学习机算法ELM的网络结构示意图。
图2是Sigmoid函数图像的示意图。
图3是ReLU和Softplus函数图像的示意图。
具体实施方式
这种基于极限学习机算法的识别方法,该方法包括训练阶段,对于给定训练集N={(xi,ti)|xi∈Rn,ti∈Rm,i=1,…,N},激活函数g(x)=log(1+ex),隐单元个数L,其包括以下步骤:
(1)随机生成输入单元与隐单元之间的权值wj,隐单元的偏置bj,其中j=1,…,L;
(2)通过公式(3)计算隐单元的输出矩阵H,
(3)通过公式(15)、(16)分别计算H中同一类别分量的类内距Sw和不同类别分量的类间距Sb对输出权值β求导中的S1,S2
S 1 = Σ i = 1 n [ Σ j = 1 n i h ( x j ) i - 1 n i Σ k = 1 n i h ( x j ) i ] T [ Σ j = 1 n i h ( x j ) i - 1 n i Σ k = 1 n i h ( x k ) i ] - - - ( 15 )
S 2 = Σ i = 1 n [ 1 n i Σ j = 1 n i h ( x j ) i - 1 N Σ k = 1 N h ( x k ) ] T [ 1 n i Σ j = 1 n i h ( x j ) i - 1 N Σ k = 1 N h ( x k ) ] - - - ( 16 ) ;
(4)通过公式(20)计算隐单元到输出单元的输出权值β
β = ( I C + H T H + a * S 1 - b * S 2 ) - 1 H T T - - - ( 20 ) .
本发明首先提出了一种更加接近生物学的激活模型且具有一定稀疏能力的Softplus激活函数来替代传统最常用的Sigmoid函数,提高网络的泛化性能;其次,为了更好的利用训练样本的标签信息,使解析求得的输出权值更加利于分类,本发明又提出了基于改进Fisher判别约束的ELM算法;从而在一定程度上进一步提高识别率。
优选地,该方法包括测试阶段,对于给定测试集
和训练好的网络,其包括以下步骤:
(I)与训练时网络所有的参数一致,通过公式(21)记录每个测试样本由网络输出的类别向量:
o i = Σ j = 1 L β j g ( w j x i + b j ) , i = 1,2 , . . . N ^ - - - ( 21 ) ;
(I)通过公式(22)计算识别率:将网络输出的类别信息oi与样本对应的实际标签ti进行对比求得识别率:
P = 1 - 1 N ^ Σ i = 1 N ^ | | o i - t i | | 2 - - - ( 22 ) .
优选地,当是数字库(MNIST)时,输入单元节点为784,隐含单元节点为1000,输出单元结点分别为10,随机输入权值和隐单元偏置w,b∈(-1,1),激活函数为Sigmoid时C=0.1,激活函数为ReLU和Softplus时C=0.01,a=0.2,b=0.3。
优选地,当是人脸库(ORL、AR、Extended Yale B)时,输入单元节点都为784,隐含单元节点都为600,输出单元结点分别为40、120、38,随机输入权值和隐单元偏置w,b∈(-1,1),激活函数为Sigmoid时C=0.1,激活函数为ReLU和Softplus时C=0.01,a=0.2,b=0.8。
以下更详细地说明本发明:
1极限学习机算法(ELM)
ELM是一种新型的单层前馈神经网络算法,最早由Huang于2004年提出。该算法不依赖于输入权值和隐单元偏置的选择,可以进行随机赋值,然后通过合适的激活函数得到隐含层的输出矩阵,网络的输出权值可由解析直接求得。与传统神经网络相比,ELM的训练速度非常快,并且泛化性能更强。ELM包括三层:输入层、隐含层和输出层。网络结构如图1所示。
对于N个不同样本(xi,ti),其中xi=[xi1,xi2,…,xin]T表示第i个样本,ti=[xi1,xi2,…,xim]T表示第i个样本的实际标签,输入单元的个数n表示每个样本的维数,输出单元的个数m表示样本总的类别数目,给定L个可加型的隐含单元和激活函数g(x),则存在一组参数wj,bj和βj,使得该网络可以以零误差逼近这N个不同样本点,即
Σ j = 1 L β j g ( w j · x i + b j ) = t i , i = 1,2 , . . . , N - - - ( 1 )
其中wj=[wj1,wj2,…,wjn]T,表示第j个隐单元与输入单元之间的权值,bj表示第j个隐单元的偏置,βj=[βj1j2,…,βjm]T,表示第j个隐含单元到输出单元之间的权值。
对于上面N个等式可以写成下面的矩阵形式:
Hβ=T    (2)
其中
β = β 1 T . . . β L T L × m T = t 1 T . . . t N T N × m - - - ( 4 )
H是该神经网络隐含层的输出矩阵,H的第j列是第j个隐单元关于输入样本x1,x2,…,xN的输出。
然而,通常情况下隐单元的个数远小于训练样本的个数,即L<<N,此时H就不是方阵不可逆,因此对等式(2)的求解通常转化为求下式的最小二乘问题:
| | H β ^ - T | | = min β | | Hβ - T | | - - - ( 5 )
上面等式最小范数的唯一最小二乘解为:
β ^ = H + T - - - ( 6 )
其中H+表示矩阵H的伪逆矩阵,H+=(HTH)-1HT
为了防止过拟合,让算法具有鲁棒性并且泛化性能更好,正则化的ELM算法被提出,它将原来的算法加入一个关于β的正则项,原来的目标函数改为:
min β E 1 2 | | β | | 2 + C 2 | | Hβ - T | | 2 , - - - ( 7 )
由此可以求得
β ^ = ( I C + H T H ) - 1 H T T , - - - ( 8 )
其中I表示单位矩阵,C表示任意常系数。
2改进激活函数的ELM算法
激活函数在ELM网络当中的性能表现则处于核心地位,如果激励函数选择不当,那么无论怎么改进网络结构和学习方法都难以达到很好的学习精度,甚至根本不可能完成学习任务。反之,如果选择更好的激活函数则可以很明显的提高网络性能。
Sigmoid函数是一个良好的阈值函数,是连续光滑严格单调的S型函数。它在处理神经网络问题上有很大的优势,因此常被用来作为ANN中的激活函数。其函数定义为:
g ( x ) = 1 1 + e - x - - - ( 9 )
函数图像如图2所示。同样在ELM网络中,对可加型隐单元的激活函数通常也会选择它。而Hornik提出只要激活函数是连续的,有界的并且非常数,那么在紧凑集上含有可加节点的SLFN都可以逼近任意连续函数,即激活函数并不唯一。
近年来,在深度学习领域,一种新型的修正线性函数已经被广泛的运用于受限波尔兹曼机(RBM)和卷积神经网络(CNN)当中,逐渐代替Sigmoid激活函数成为主流。由该函数产生的单元被称为修正线性单元(RectifiedLinear units,ReLU),函数定义如下:
g(x)=max(0,x)    (10)
该函数的图像如图3所示。它的特点是如果计算出的值小于0,就让它等于0,否则保持原来的值不变。相比传统的Sigmoid逻辑函数,ReLU更接近生物学的激活模型,而且形式简单,由于没有用到幂运算和除法运算,因此ReLU运算速度更快,泛化性更好。同时,此激活函数具有一定的稀疏能力,它可以不通过任何预训练直接将网络内部规范化。
根据ReLU函数的性质,它的稀疏能力是通过一种简单粗暴地强制某些数据为0的方法所实现,且对于SLFN可以将大约50%的隐单元置0。然而,迫使太多的稀疏可能伤害其预测能力,减小了网络模型的平均性能。因此,本发明进一步提出了ReLU的近似平滑的Softplus函数,其函数定义为:
g(x)=log(1+ex)    (11)
该函数的图像如图3所示。Softplus函数是非线性的,其不但避免了ReLU函数的缺点,同时还继承了ReLU的优点,具有一定的稀疏功能,它可以将ELM网络内部那些对性能影响不大的隐单元区分开,从而使整个网络模型的平均性能更好。
3基于改进Fisher判别的ELM算法
本发明利用ELM算法的主要目的是进行识别分类,而训练样本的类别信息是可利用的,那么如何更好的利用这些信息从而使训练得到的网络更加利于分类则显得尤为重要。由此我们考虑在原始ELM算法的基础上加入一个含有类别信息的约束,使解析求得的输出权值能够保证对同类样本具有更好的聚集性,对异类样本具有更好的可分性。因此,本发明提出了基于改进Fisher判别的ELM算法,以利于提高了网络模型的识别性能。
定义:
Sw = 1 2 Σ i = 1 n [ Σ j = 1 n i h ( x j ) i β - m i ] 2 = 1 2 Σ i = 1 n [ Σ j = 1 n i h ( x j ) i β - 1 n i Σ k = 1 n i h ( x k ) i β ] 2 - - - ( 12 )
Sb = 1 2 Σ i = 1 n ( m i - m ‾ ) 2 = 1 2 Σ i = 1 n [ 1 n i Σ j = 1 n i h ( x j ) i β - 1 N Σ k = 1 N h ( x k ) β ] 2 - - - ( 13 )
其中Sw表示类内距,Sb表示类间距,N表示训练样本总数,n表示样本类别总数,ni表示第i类样本的个数,mi表示第i类样本的均值,h(xj)i表示属于i类的第j个样本的隐含层输出向量。
为了使得同类样本聚集性更近,异类样本距离更远,我们要保证类内距尽可能的小同时,类间距尽可能的大,因此加入改进Fisher判别的约束之后的ELM算法,原来的目标函数(7)变为:
min β E 1 2 | | β | | 2 + C 2 | | Hβ - T | | 2 + a * Sw - b * Sb - - - ( 14 )
其中H,β,T同公式(3)(4)所示,C表示任意常系数。其中a,b表示常系数,用来标明类内距和类间距约束作用所占的比例大小。
首先定义
S 1 = Σ i = 1 n [ Σ j = 1 n i h ( x j ) i - 1 n i Σ k = 1 n i h ( x j ) i ] T [ Σ j = 1 n i h ( x j ) i - 1 n i Σ k = 1 n i h ( x k ) i ] - - - ( 15 )
S 2 = Σ i = 1 n [ 1 n i Σ j = 1 n i h ( x j ) i - 1 N Σ k = 1 N h ( x k ) ] T [ 1 n i Σ j = 1 n i h ( x j ) i - 1 N Σ k = 1 N h ( x k ) ] - - - ( 16 )
于是由Sw,Sb分别对β求偏导数得:
∂ Sw ∂ β = Σ i = 1 n [ Σ j = 1 n i h ( x j ) i - 1 n i Σ k = 1 n i h ( x j ) i ] T [ Σ j = 1 n i h ( x j ) i - 1 n i Σ k = 1 n i h ( x k ) i ] β : = S 1 * - β - - ( 17 )
∂ Sb ∂ β = Σ i = 1 n [ 1 n i Σ j = 1 n i h ( x j ) i - 1 N Σ k = 1 N h ( x k ) ] T [ 1 n i Σ j = 1 n i h ( x j ) i - 1 N Σ k = 1 N h ( x k ) ] β : S 2 * - β - - ( 18 )
最后用公式(14)对β求偏导数等于0,即:
∂ E ∂ β = β + CH T ( Hβ - T ) + a * ∂ Sw ∂ β - b * ∂ Sb ∂ β = 0 - - - ( 19 )
由此得出:
β ^ = ( I C + H T H + a * S 1 - b * S 2 ) - 1 H T T - - - ( 20 )
其中I表示单位矩阵,S1,S2如公式(15)(16)中所示。
为了验证本发明算法的性能,特别是较原始ELM算法的改进效果,在公共的手写数字库和人脸库上进行了实验,通过比较识别率来说明本发明算法的优越性。
实验数据和设置
实验将在以下四个数据库上进行测试:
·MNIST手写数字库:该库中包含从0到9共10个手写数字,每个数字6000张训练和1000张测试,共60000个训练样本和10000个测试样本。样本大小为28×28。本发明实验将分别用60000和10000个样本做训练,用10000个样本做测试。
·ORL人脸库:该库中共有40个人400张人脸图像,包含了他们的不同姿态和面部饰物的变化,每人10张图像。该库人脸图像已进行过简单的对齐处理,大小为64×64。实验时,将其下采样为28×28维大小,并分别选择6和8张为训练样本,则剩余的4和2张为测试样本。
·AR人脸库:该库中共有120个人1680张人脸图像,包含了他们不同姿态、表情、以及关照下的变化,每人14张图像。该库人脸图像大小为40×50。实验时,将其下采样为28×28维大小,并分别选择8和10张为训练样本,则剩余的6和4张为测试样本。
·Extended Yale B人脸库:该库中共有38个人,包含了他们不同姿态、以及严格关照下的变化,由于该库部分人脸受到关照的影响比较严重,因此实验选择了其中每人40张共1520张人脸图像做测试。该库人脸图像大小为168×192。该库人脸图像已进行过简单的对齐处理。实验时,将其下采样为28×28维大小,并分别选择25和30张为训练样本,则剩余的15和10张为测试样本。
实验中ELM网络参数设置为:输入单元节点都为784,数字库和人脸库(ORL、AR、Extended Yale B)隐含单元节点分别为1000、600、600、600,输出单元结点分别为10、40、120、38。随机输入权值和隐单元偏置w,b∈(-1,1),算法中激活函数为Sigmoid时参数C=0.1,选择ReLU和Softplus激活函数时C=0.01,基于改进Fisher判别时类内类间距约束系数,对数字库和人脸库分别选择a=0.2,b=0.3和a=0.2,b=0.8。
识别结果及分析
由于ELM算法模型中初始的输入权值和隐单元偏置是随机赋值的,因此会对实验效果具有一定的影响。为了更好的说明原始ELM算法及改进后的效果,在每个数据库上进行10次实验,识别率取其平均值,并记录下这10组数据的标准差以说明算法的稳定性,结果如表1所示。
表1
上述结果表明,无论是在手写数字库还是人脸库上,当选择用一种更加接近生物学激活模型且具有稀疏性能的新型修正线性函数ReLU来替代传统标准的Sigmoid激活函数时,整个ELM算法的识别性能有了明显的提高。然而由于ReLU强制的稀疏能力可能会伤害其预测能力,减小网络模型的平均性能。因此本发明进一步引入它近似平滑的Softplus函数,从实验结果来看引入Softplus激活函数的ELM算法平均识别性能有了进一步提高,且使得算法的稳定性更好。
在此基础上,本发明又提出基于改进Fisher判别约束的ELM算法,使得其识别率再一次明显提升。由于加入了改进的Fisher判别约束之后,可以使训练的网络更加利于分类。而且,在每个数据库上都分别做了两组实验,由上述结果表明,当减少训练样本时,改进后的算法依然保持原有的优势。特别是本发明改进的算法在带有姿态、表情、光照等其他因素的不同人脸库上也都能有一个很好的识别率。
以上所述,仅是本发明的较佳实施例,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属本发明技术方案的保护范围。

Claims (4)

1.一种基于极限学习机算法的识别方法,其特征在于,该方法包括训练阶段,对于给定训练集N={(xi,ti)|xi∈Rn,ti∈Rm,i=1,…,N},激活函数g(x)=log(1+ex),隐单元个数L,其包括以下步骤:
(1)随机生成输入单元与隐单元之间的权值wj,隐单元的偏置bj,其中j=1,…,L;
(2)通过公式(3)计算隐单元的输出矩阵H,
通过公式(15)、(16)分别计算H中同一类别分量的类内距Sw和不同类别分量的类间距Sb对输出权值β求导中的S1,S2
S 1 = Σ i = 1 n [ Σ j = 1 n i h ( x j ) i - 1 n i Σ k = 1 n i h ( x j ) i ] T [ Σ j = 1 n i h ( x j ) i - 1 n i Σ k = 1 n i h ( x k ) i ] - - - ( 15 )
S 2 = Σ i = 1 n [ 1 n i Σ j = 1 n i h ( x j ) i - 1 N Σ k = 1 N h ( x k ) ] T [ 1 n i Σ j = 1 n i h ( x j ) i - 1 N Σ k = 1 N h ( x k ) ] - - - ( 16 ) ;
(3)通过公式(20)计算隐单元到输出单元的输出权值β
β = ( I C + H T H + a * S 1 - b * S 2 ) - 1 H T T - - - ( 20 ) .
2.根据权利要求1所述的基于极限学习机算法的识别方法,其特征在于,该方法包括测试阶段,对于给定测试集
N ^ = { ( x i , t i ) | x i ∈ R n , t i ∈ R m , i = 1 , . . . , N ^ } 和训练好的网络,其包括以下步骤:
(I)与训练时网络所有的参数一致,通过公式(21)记录每个测试样本由网络输出的类别向量:
o i = Σ j = 1 L β j g ( w j x i + b j ) , i = 1,2 , . . . N ^ - - - ( 21 ) ;
(II)通过公式(22)计算识别率:将网络输出的类别信息oi与样本对应的实际标签ti进行对比求得识别率:
P = 1 - 1 N ^ Σ i = 1 N ^ | | o i - t i | | 2 - - - ( 22 ) .
3.根据权利要求1所述的基于极限学习机算法的识别方法,其特征在于,当是数字库(MNIST)时,输入单元节点为784,隐含单元节点为1000,输出单元结点分别为10,随机输入权值和隐单元偏置w,b∈(-1,1),激活函数为Sigmoid时C=0.1,激活函数为ReLU和Softplus时C=0.01,a=0.2,b=0.3。
4.根据权利要求1所述的基于极限学习机算法的识别方法,其特征在于,当是人脸库(ORL、AR、Extended Yale B)时,输入单元节点都为784,隐含单元节点都为600,输出单元结点分别为40、120、38,随机输入权值和隐单元偏置w,b∈(-1,1),激活函数为Sigmoid时C=0.1,激活函数为ReLU和Softplus时C=0.01,a=0.2,b=0.8。
CN201510029085.0A 2015-01-21 2015-01-21 一种基于极限学习机算法的识别方法 Active CN104616030B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510029085.0A CN104616030B (zh) 2015-01-21 2015-01-21 一种基于极限学习机算法的识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510029085.0A CN104616030B (zh) 2015-01-21 2015-01-21 一种基于极限学习机算法的识别方法

Publications (2)

Publication Number Publication Date
CN104616030A true CN104616030A (zh) 2015-05-13
CN104616030B CN104616030B (zh) 2019-03-29

Family

ID=53150467

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510029085.0A Active CN104616030B (zh) 2015-01-21 2015-01-21 一种基于极限学习机算法的识别方法

Country Status (1)

Country Link
CN (1) CN104616030B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104850864A (zh) * 2015-06-01 2015-08-19 深圳英智源智能系统有限公司 一种基于卷积神经网络的非监督图像识别方法
CN105335763A (zh) * 2015-12-07 2016-02-17 东华大学 一种基于改进型极速学习机的织物疵点分类方法
CN105761488A (zh) * 2016-03-30 2016-07-13 湖南大学 基于融合的实时极限学习机短时交通流预测方法
CN106096543A (zh) * 2016-06-08 2016-11-09 东华大学 一种基于改进型极限学习机的手写数字识别方法
CN106650797A (zh) * 2016-12-07 2017-05-10 广东电网有限责任公司江门供电局 一种基于集成elm的配电网窃电嫌疑用户智能识别方法
CN107247609A (zh) * 2017-06-30 2017-10-13 江西博瑞彤芸科技有限公司 字库维护管理方法
CN107832610A (zh) * 2017-09-25 2018-03-23 暨南大学 基于组合特征模式的Android恶意软件检测方法
CN107911346A (zh) * 2017-10-31 2018-04-13 天津大学 一种基于极限学习机的入侵检测方法
CN108122004A (zh) * 2017-12-19 2018-06-05 杭州电子科技大学 基于Fisher判别稀疏超限学习机的脑电分类方法
CN109031228A (zh) * 2018-06-28 2018-12-18 浙江大学 一种敏捷的雷达海杂波预报系统
CN109784356A (zh) * 2018-07-18 2019-05-21 北京工业大学 基于Fisher判别分析的矩阵变量受限玻尔兹曼机图像分类方法
CN110341986A (zh) * 2019-07-16 2019-10-18 哈尔滨工业大学 基于rbm优化elm的飞机辅助动力装置性能参数多步预测方法
CN110837886A (zh) * 2019-10-28 2020-02-25 北京工业大学 一种基于elm-sl0神经网络的出水nh4-n软测量方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102944769A (zh) * 2012-10-18 2013-02-27 上海市电力公司 基于极限学习机的电力变压器故障诊断方法
CN103646255A (zh) * 2013-11-13 2014-03-19 扬州西岐自动化科技有限公司 一种基于Gabor特征和极限学习机的人脸检测方法
US20140187988A1 (en) * 2010-03-15 2014-07-03 Nanyang Technological University Method of predicting acute cardiopulmonary events and survivability of a patient

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140187988A1 (en) * 2010-03-15 2014-07-03 Nanyang Technological University Method of predicting acute cardiopulmonary events and survivability of a patient
CN102944769A (zh) * 2012-10-18 2013-02-27 上海市电力公司 基于极限学习机的电力变压器故障诊断方法
CN103646255A (zh) * 2013-11-13 2014-03-19 扬州西岐自动化科技有限公司 一种基于Gabor特征和极限学习机的人脸检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
柯海森等: "一种改进极限学习机方法的研究", 《第三十二届中国控制会议论文集(B卷)》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104850864A (zh) * 2015-06-01 2015-08-19 深圳英智源智能系统有限公司 一种基于卷积神经网络的非监督图像识别方法
CN105335763A (zh) * 2015-12-07 2016-02-17 东华大学 一种基于改进型极速学习机的织物疵点分类方法
CN105761488A (zh) * 2016-03-30 2016-07-13 湖南大学 基于融合的实时极限学习机短时交通流预测方法
CN106096543A (zh) * 2016-06-08 2016-11-09 东华大学 一种基于改进型极限学习机的手写数字识别方法
CN106650797B (zh) * 2016-12-07 2020-12-04 广东电网有限责任公司江门供电局 一种基于集成elm的配电网窃电嫌疑用户智能识别方法
CN106650797A (zh) * 2016-12-07 2017-05-10 广东电网有限责任公司江门供电局 一种基于集成elm的配电网窃电嫌疑用户智能识别方法
CN107247609A (zh) * 2017-06-30 2017-10-13 江西博瑞彤芸科技有限公司 字库维护管理方法
CN107832610A (zh) * 2017-09-25 2018-03-23 暨南大学 基于组合特征模式的Android恶意软件检测方法
CN107911346A (zh) * 2017-10-31 2018-04-13 天津大学 一种基于极限学习机的入侵检测方法
CN107911346B (zh) * 2017-10-31 2020-12-29 兵棋思学(天津)教育科技有限公司 一种基于极限学习机的入侵检测方法
CN108122004A (zh) * 2017-12-19 2018-06-05 杭州电子科技大学 基于Fisher判别稀疏超限学习机的脑电分类方法
CN109031228A (zh) * 2018-06-28 2018-12-18 浙江大学 一种敏捷的雷达海杂波预报系统
CN109784356A (zh) * 2018-07-18 2019-05-21 北京工业大学 基于Fisher判别分析的矩阵变量受限玻尔兹曼机图像分类方法
CN109784356B (zh) * 2018-07-18 2021-01-05 北京工业大学 基于Fisher判别分析的矩阵变量受限玻尔兹曼机图像分类方法
CN110341986A (zh) * 2019-07-16 2019-10-18 哈尔滨工业大学 基于rbm优化elm的飞机辅助动力装置性能参数多步预测方法
CN110837886A (zh) * 2019-10-28 2020-02-25 北京工业大学 一种基于elm-sl0神经网络的出水nh4-n软测量方法

Also Published As

Publication number Publication date
CN104616030B (zh) 2019-03-29

Similar Documents

Publication Publication Date Title
CN104616030A (zh) 一种基于极限学习机算法的识别方法
CN103544963B (zh) 一种基于核半监督判别分析的语音情感识别方法
Wan et al. Long-length legal document classification
CN108984745A (zh) 一种融合多知识图谱的神经网络文本分类方法
CN109190665A (zh) 一种基于半监督生成对抗网络的通用图像分类方法和装置
CN106446954A (zh) 一种基于深度学习的字符识别方法
CN108920445A (zh) 一种基于Bi-LSTM-CRF模型的命名实体识别方法和装置
CN111950630B (zh) 基于两阶段迁移学习的小样本工业产品缺陷分类方法
CN110009025A (zh) 一种用于语音测谎的半监督加性噪声自编码器
CN104636732A (zh) 一种基于序列深信度网络的行人识别方法
CN114239585A (zh) 一种生物医学嵌套命名实体识别方法
CN105574489A (zh) 基于层次级联的暴力群体行为检测方法
CN112766283B (zh) 一种基于多尺度卷积网络的两相流流型识别方法
CN107423820A (zh) 结合实体层次类别的知识图谱表示学习方法
CN105930792A (zh) 一种基于视频局部特征字典的人体动作分类方法
Lane et al. Combining low-level perception with expectations in CHREST
CN111598187A (zh) 一种基于核宽度学习系统的渐进式集成分类方法
CN105404858A (zh) 一种基于深度费舍尔网络的车型识别方法
CN111191033A (zh) 一种基于分类效用的开集分类方法
CN106650769A (zh) 基于线性表示多视图鉴别字典学习的分类方法
CN114241458A (zh) 一种基于姿态估计特征融合的驾驶员行为识别方法
CN101216878A (zh) 基于广义非线性判别分析的人脸识别方法
CN106960225A (zh) 一种基于低秩监督的稀疏图像分类方法
CN113516198B (zh) 一种基于记忆网络和图神经网络的文化资源文本分类方法
CN113516209B (zh) 一种用于少样本意图识别的对比任务适应学习方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant