CN104809502A - 一种受限玻尔兹曼机隐含层节点动态调整方法 - Google Patents

一种受限玻尔兹曼机隐含层节点动态调整方法 Download PDF

Info

Publication number
CN104809502A
CN104809502A CN201510258804.6A CN201510258804A CN104809502A CN 104809502 A CN104809502 A CN 104809502A CN 201510258804 A CN201510258804 A CN 201510258804A CN 104809502 A CN104809502 A CN 104809502A
Authority
CN
China
Prior art keywords
neuron
output
layer
liveness
hidden layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510258804.6A
Other languages
English (en)
Inventor
张可
柴毅
袁媛
刘建环
邱翊峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN201510258804.6A priority Critical patent/CN104809502A/zh
Publication of CN104809502A publication Critical patent/CN104809502A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections

Abstract

本发明属于控制领域,公开了一种受限玻尔兹曼机隐含层节点动态调整方法,该方法包括:选取初始数据;将初始数据作为输入,输入到第一层受限玻尔兹曼机中;计算第一层受限玻尔兹曼机隐含层神经元的活跃度,若其活跃度大于活跃度阀值,则分裂该神经元,调整网络结构,设定新神经元的初始参数;计算第一层受限玻尔兹曼机隐含层神经元和输出神经元间的连接强度,若小于阀值,则断开神经元间的连接;将该输出作为第二层玻尔兹曼机输入;以此类推至最后一层受限玻尔兹曼机的输出,得到调整后的网络结构。最后,并通过反向传播来微调网络结构。利用本发明提供的隐含层节点动态调节方法相比于固定节点的模型,实现了受限玻尔兹曼机结构和参数的自校正。

Description

一种受限玻尔兹曼机隐含层节点动态调整方法
本发明涉及控制领域,特别是涉及一种受限玻尔兹曼机隐含层节点动态调节方法
背景技术
目前,神经网络结构优化设计方法一直是一个开放性的问题。例如,基于进化算法对网络结构大小进行调整,进化算法是基于生物进化原理的搜索算法,具有很好的鲁棒性和全局搜索能力,但是遗传算法需要昂贵的计算代价;利用粒子群优化算法对网络结构进行优化,通过对隐含层神经元和连接权值进行调整,提高最终神经网络的性能,但是由于粒子群算法在训练过程中需要进行全局搜索,整个结构调整时间仍较长。
鉴于以上存在的问题,本文提出了一种利用隐含层神经元输出信息强度实现神经网络的增长,同时利用神经元间交互信息强度实现隐含层神经元的删除,利用梯度下降算法对其连接权值进行调整。该方法具有较好的非线性逼近能力,较快的训练速度以及紧凑的网络结构。
发明内容
有鉴于此,本申请提供一种受限玻尔兹曼机隐含层节点动态调节方法。该方法通过计算隐含层输出神经元的活跃度以及隐含层和输出层神经元连接强度来动态调节节点数。相比于固定节点的模型,可以实现网络结构和参数自校正。
本发明提出的一种玻尔兹曼机隐含层节点动态调节方法,包括以下步骤:
步骤一:选取初始数据;步骤二:将初始数据作为输入值,输入到第一层受限玻尔兹曼机RBM1中;步骤三:计算RBM1隐含层神经元的活跃度,如果其活跃度大于已知的活跃度阀值,则分裂该神经元,调整网络结构,根据相关公式设定新神经元的初始参数;步骤四:计算RBM1隐含层神经元和输出层神经元间的连接强度,如果小于阀值,则断开该神经元和输出神经元间的连接;步骤五:将RBM1的输出作为第二层RBM2输入;步骤六:计算RBM2隐含层神经元的活跃度,如果大于活跃度阀值,则分裂该神经元,调整网络结构,并根据相关公式设定新神经元的初始参数;步骤七:计算RBM2隐含层神经元和输出层神经元间的连接强度,如果小于阀值,则断开该神经元和输出神经元间的连接;步骤八:以此类推直至最后一层RBMn的输出,得到调整后的网络结构;步骤九:通过反向传播微调权值获得最佳网络结构。
进一步,在步骤二中包括以下步骤:21:RBM同层之间是无连接的,具有以下性质:给定可见层单元状态时,隐含单元的激活条件独立;给定隐含层单元状态,可见层单元激活条件也是独立的。θ={W,a,b}是RBM的参数,分别为权值,可见层偏移量和隐层偏移量向量,利用对比散度CD算法快速学习RBM,得到各参数的更新准则。
进一步,在步骤三中具体包括以下步骤:包括:31:利用隐含层神经元输出计算其活跃度函数其中,i=1,2,…,K,Afi是第i个隐含层神经元的活跃度,K是隐含层神经元数,θi是第i个隐含层神经元的输出,T是较小实数值,避免||x-μi||为零时活跃度函数无解,当x和μi较接近时,分母较小,活跃度值较大,此时神经元较活跃;反之,则不活跃;32:当神经元(称为第i个神经元)的活跃度Afi大于活跃度阀值Af0时(Af0=max{1/K,10er},er为期望误差),活跃神经元i和输出神经元断开连接,对其进行分 裂,并对新神经元初始中心及方差进行设定:
μi,l=αiμiii,l=αiδi其中,l=(1,2,…,Nnew),μi和δi分别是神经元i的中心和方差,μi,l和δi,l分别表示神经元i分裂的新神经元l的中心值和方差,Nnew是新增神经元数(Nnew=[Afi/Afav],取Afi/Afav的整数部分,Afav为隐含层神经元平均活跃度),根据神经元活跃度确定所增神经元数,新神经元与输出神经元间的连接权值设定为 其中,rl是第l个新神经元的分配参数,θi是结构调整前分裂神经元i的输出,θi,l(x)是新神经元l的输出,wi是分裂神经元i与输出层神经元的联结权值,e是结构调整前神经网络的输出误差。
进一步,在步骤四中具体包括:41:首先定义隐含层神经元j和输出层神经元y的交互信息函数:其中,p(j;y)是j和y的联合分布密度,p(j)和p(y)分别为j和y的概率密度;42:假设j和y是相互连接的神经元,神经元间交互信息强度M(j;y)依赖于神经元j和y间的信息强度,根据香农熵理论,神经元j和y间的连接强度可通过以下式计算:M(j;y)=H(j)-H(j|y)=H(y)-H(y|j)其中,H(j)为神经元j的熵,H(y|j)为神经元y在神经元j条件下的熵,,当神经元j和y相互独立时,M(j;y)的值为0;否则,M(j;y)为正数;43:规则化神经元间交互信息强度其中,0≤m(j;y)≤1,通过计算m,能够确定神经元j和y间信息交互较强,j和y间连接;当m(j;y)趋近0时,则表明神经元j和y间信息交互强度较弱,在网络结构调整时可忽略神经元j和y间的连接,从而降低神经网络的冗余度。
进一步,在步骤九中具体包括:71::利用梯度下降算法,并通过反向传播来微调网络结构。
附图说明
图1是本发明一种受限玻尔兹曼机隐含层节点动态调节方法的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
S1:选取初始数据;
S2:步骤S2,将初始数据作为输入,输入到第一层受限玻尔兹曼机RBM1中;
S3:利用隐含层神经元输出计算其活跃度函数
Af 1 ( x ) = θ 1 ( | | x - μ 1 | | + T ) + Σ k = 1 K θ k
计算RBM1的隐含层神经元的活跃度Af1(x)。当神经元的活跃度Af1(x)大于活跃度阀值Af0时,活跃神经元1和输出神经元断开连接,对其进行分裂,并对新神经元初始中心及方差进行设定:
μ1,l=α1μ11x
δ1,l=α1δ1
新神经元与输出神经元间的连接权值设定为
w 1 , l = r l w 1 θ 1 ( x ) - e θ 1 , l ( x ) Σ l = 1 N new r l = 1
S4:定义隐含层神经元j和输出层神经元y的交互信息函数:
M ( j ; y ) = Σ j ; y p ( j ; y ) lo g 2 p ( j ; y ) p ( j ) p ( y )
神经元j和y间的连接强度可通过以下式计算:
M(j;y)=H(j)-H(j|y)=H(y)-H(y|j)
规则化神经元间交互信息强度
m ( j ; y ) = M ( j ; y ) min ( H ( j ) ; H ( y ) )
通过计算m,能够确定神经元j和y间信息交互较强,j和y间有连接;当m(j;y)趋近0时,则表明神经元j和y间信息交互强度较弱,在网络结构调整时可忽略神经元j和y间的连接;
S5:将RBM1的输出作为第二层RBM2输入;
S6:利用隐含层神经元输出计算其活跃度函数
A f 2 ( x ) = θ 2 ( | | x - μ 2 | | + T ) Σ k = 1 K θ k
计算RBM2的隐含层神经元的活跃度Af2(x)。当神经元的活跃度Af2(x)大于活跃度阀值Af0时,活跃神经元2和输出神经元断开连接,对其进行分裂,并对新神经元初始中心及方差进行设定:
μ2,l=α2μ22x
δ2,l=α2δ2
新神经元与输出神经元间的连接权值设定为
w 2 , l = r l w 2 θ 2 ( x ) - e θ 2 , l ( x ) Σ l = 1 N new r l = 1
S7:定义隐含层神经元j和输出层神经元y的交互信息函数:
M ( j ; y ) = Σ j ; y p ( j ; y ) lo g 2 p ( j ; y ) p ( j ) p ( y )
神经元j和y间的连接强度可通过以下式计算:
M(j;y)=H(j)-H(j|y)=H(y)-H(y|j)
规则化神经元间交互信息强度
m ( j ; y ) = M ( j ; y ) min ( H ( j ) ; H ( y ) )
通过计算m,能够确定神经元j和y间信息交互较强,j和y间有连接;当m(j;y)趋近0时,则表明神经元j和y间信息交互强度较弱,在网络结构调整时可忽略神经元j和y间的连接;
S8:以此类推直至第四层RBM4的输出。得到调整后的网络。
S9:总体微调阶段,利用梯度下降算法,并通过反向传播调整权重来获得最佳网络结构。

Claims (7)

1.一种受限玻尔兹曼机隐含层节点动态调节方法,其特征在于,该方法包括以下步骤:
步骤一:选取初始数据;
步骤二:将初始数据作为输入值,输入到第一层受限玻尔兹曼机RBM1中;
步骤三:计算RBM1隐含层神经元的活跃度,如果其活跃度大于已知的活跃度阀值,则分裂该神经元,调整网络结构,根据相关公式设定新神经元的初始参数;
步骤四:计算RBM1隐含层神经元和输出层神经元间的连接强度,如果小于阀值,则断开该神经元和输出神经元间的连接;
步骤五:将RBM1的输出作为第二层RBM2输入;
步骤六:计算RBM2隐含层神经元的活跃度,如果大于活跃度阀值,则分裂该神经元,调整网络结构,并根据相关公式设定新神经元的初始参数;
步骤七:计算RBM2隐含层神经元和输出层神经元间的连接强度,如果小于阀值,则断开该神经元和输出神经元间的连接;
步骤八:以此类推直至最后一层RBMn的输出,得到调整后的网络结构。
步骤九:总体微调阶段,利用梯度下降算法,并通过反向传播来微调网络结构。
2.如权利要求1所述的方法,其特征在于,在步骤二中具体包括:21:RBM同层之间是无连接的,具有以下性质:给定可见层单元状态时,隐含单元的激活条件独立;给定隐含层单元状态,可见层单元激活条件也是独立的。θ={W,a,b}是RBM的参数,分别为权值,可见层偏移量和隐层偏移量向量,利用对比散度CD算法快速学习RBM,得到各参数的更新准则。
3.如权利要求1所述的方法,其特征在于,在步骤三中具体包括:31:利用输出信息强度判断神经元的活跃度,对活跃度较强的神经元进行分裂。
4.如权利要求3所述的方法,其特征在于,包括:41:利用隐含层神经元输出计算其活跃度函数其中,i=1,2,…,K,Afi是第i个隐含层神经元的活跃度,K是隐含层神经元数,θi是第i个隐含层神经元的输出,T是较小实数值,避免||x-μi||为零时活跃度函数无解,当x和μi较接近时,分母较小,活跃度值较大,此时神经元较活跃;反之,则不活跃;42:当神经元(称为第i个神经元)的活跃度Afi大于活跃度阀值Af0时(Af0=max{1/K,10er},er为期望误差),活跃神经元i和输出神经元断开连接,对其进行分裂,并对新神经元初始中心及方差进行设定:
μi,1=αiμiii,1=αiδi其中,l=(1,2,…,Nnew),μi和δi分别是神经元i的中心和方差,μi,1和σi,1分别表示神经元i分裂的新神经元l的中心值和方差,Nnew是新增神经元数(Nnew=[Afi/Afav],取Afi/Afav的整数部分,Afav为隐含层神经元平均活跃度),根据神经元活跃度确定所增神经元数,新神经元与输出神经元间的连接权值设定为其中,ri是第l个新神经元的分配参数,θi是结构调整前分裂神经元i的输出,θi,1(x)是新神经元l的输出,wi是分裂神经元i与输出层神经元的联结权值,e是结构调整前神经网络的输出误差。
5.如权利要求1所述的方法,其特征在于,在步骤四中具体包括:51:通过计算神经元间交互信息相关性函数,分析RBM隐含层神经元与输出层神经元间的连接强度,从而根据神经元间交互信息强度对网络结构进行修改。
6.如权利要求5所述的方法,其具体过程:61:首先定义隐含层神经元j和输出层神经元y的交互信息函数:其中,p(j;y)是j和y的联合分布密度,p(j)和p(y)分别为j和y的概率密度;62:假设j和y是相互连接的神经元,神经元间交互信息强度M(j;y)依赖于神经元j和y间的信息强度,根据香农熵理论,神经元j和y间的连接强度可通过以下式计算:M(j;y)=H(j)-H(j|y)=H(y)-H(y|j)其中,H(j)为神经元j的熵,H(y|j)为神经元y在神经元j条件下的熵,,当神经元j和y相互独立时,M(j;y)的值为0;否则,M(j;y)为正数;63:规则化神经元间交互信息强度其中,0≤m(j;y)≤1,通过计算m,能够确定神经元j和y间信息交互较强,j和y间连接;当m(j;y)趋近0时,则表明神经元j和y间信息交互强度较弱,在网络结构调整时可忽略神经元j和y间的连接,从而降低神经网络的冗余度。
7.如权利要求1所述的方法,其特征在于,在步骤九中具体包括:71::利用梯度下降算法,并通过反向传播来微调网络结构。
CN201510258804.6A 2015-05-19 2015-05-19 一种受限玻尔兹曼机隐含层节点动态调整方法 Pending CN104809502A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510258804.6A CN104809502A (zh) 2015-05-19 2015-05-19 一种受限玻尔兹曼机隐含层节点动态调整方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510258804.6A CN104809502A (zh) 2015-05-19 2015-05-19 一种受限玻尔兹曼机隐含层节点动态调整方法

Publications (1)

Publication Number Publication Date
CN104809502A true CN104809502A (zh) 2015-07-29

Family

ID=53694312

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510258804.6A Pending CN104809502A (zh) 2015-05-19 2015-05-19 一种受限玻尔兹曼机隐含层节点动态调整方法

Country Status (1)

Country Link
CN (1) CN104809502A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295874A (zh) * 2016-08-08 2017-01-04 上海交通大学 基于深信度网络的交通流参数预测方法
CN107392155A (zh) * 2017-07-25 2017-11-24 西安电子科技大学 基于多目标优化的稀疏受限玻尔兹曼机的手写体识别方法
CN107679859A (zh) * 2017-07-18 2018-02-09 中国银联股份有限公司 一种基于迁移深度学习的风险识别方法以及系统
CN107729860A (zh) * 2017-10-30 2018-02-23 广东欧珀移动通信有限公司 人脸识别计算方法及相关产品
CN108520301A (zh) * 2018-04-17 2018-09-11 重庆大学 一种基于深度置信网络的电路间歇故障诊断方法
US10909451B2 (en) 2016-09-01 2021-02-02 International Business Machines Corporation Apparatus and method for learning a model corresponding to time-series input data
US11574164B2 (en) 2017-03-20 2023-02-07 International Business Machines Corporation Neural network cooperation

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295874A (zh) * 2016-08-08 2017-01-04 上海交通大学 基于深信度网络的交通流参数预测方法
CN106295874B (zh) * 2016-08-08 2021-02-12 上海交通大学 基于深信度网络的交通流参数预测方法
US10909451B2 (en) 2016-09-01 2021-02-02 International Business Machines Corporation Apparatus and method for learning a model corresponding to time-series input data
US11574164B2 (en) 2017-03-20 2023-02-07 International Business Machines Corporation Neural network cooperation
US11593611B2 (en) 2017-03-20 2023-02-28 International Business Machines Corporation Neural network cooperation
CN107679859A (zh) * 2017-07-18 2018-02-09 中国银联股份有限公司 一种基于迁移深度学习的风险识别方法以及系统
WO2019015461A1 (zh) * 2017-07-18 2019-01-24 中国银联股份有限公司 一种基于迁移深度学习的风险识别方法以及系统
TWI769271B (zh) * 2017-07-18 2022-07-01 大陸商中國銀聯股份有限公司 基於遷移深度學習的風險識別方法以及系統
CN107392155A (zh) * 2017-07-25 2017-11-24 西安电子科技大学 基于多目标优化的稀疏受限玻尔兹曼机的手写体识别方法
CN107729860A (zh) * 2017-10-30 2018-02-23 广东欧珀移动通信有限公司 人脸识别计算方法及相关产品
CN107729860B (zh) * 2017-10-30 2019-06-14 Oppo广东移动通信有限公司 人脸识别计算方法及相关产品
CN108520301A (zh) * 2018-04-17 2018-09-11 重庆大学 一种基于深度置信网络的电路间歇故障诊断方法

Similar Documents

Publication Publication Date Title
CN104809502A (zh) 一种受限玻尔兹曼机隐含层节点动态调整方法
CN106600059B (zh) 基于改进rbf神经网络的智能电网短期负荷预测方法
CN102881019B (zh) 一种具备迁移学习能力的模糊聚类图像分割方法
CN110429652B (zh) 一种可拓展深宽度自适应动态规划的智能发电控制方法
CN110266021B (zh) 基于dfig虚拟惯量的微电网双维自适应动态频率控制方法
CN110162097A (zh) 基于能耗的无人机分布式编队控制方法
CN113110052B (zh) 一种基于神经网络和强化学习的混合能量管理方法
CN106789149B (zh) 采用改进型自组织特征神经网络聚类算法的入侵检测方法
CN104050505A (zh) 一种基于带学习因子蜂群算法的多层感知器训练方法
CN112330487B (zh) 一种光伏发电短期功率预测方法
CN107578101B (zh) 一种数据流负载预测方法
CN109144099B (zh) 基于卷积神经网络的无人机群行动方案快速评估方法
CN113408648A (zh) 一种结合深度学习的机组组合计算方法
CN110808581A (zh) 一种基于dbn-svm的主动配电网电能质量预测方法
Lucca et al. Analyzing the performance of different fuzzy measures with generalizations of the Choquet integral in classification problems
CN104527637A (zh) 混合动力汽车控制方法和系统
CN114707613B (zh) 基于分层的深度策略梯度网络的电网调控方法
CN102063640A (zh) 基于效用差分网络的机器人行为学习模型
Elragal Mamdani and Takagi-Sugeno fuzzy classifier accuracy improvement using enhanced particle swarm optimization
CN106444389A (zh) 一种废塑料裂解温度系统的模糊rbf网络优化pi控制方法
CN109193672B (zh) 一种优化与控制双层协同二级电压控制方法
Shi et al. Multi-UAV-assisted computation offloading in DT-based networks: A distributed deep reinforcement learning approach
Shao et al. Hybrid differential evolution/estimation of distribution algorithm based on adaptive incremental learning
CN115603342B (zh) 一种计及源网协同的微电网中混合储能规划方法及系统
Wang et al. Ensemble online weighted sequential extreme learning machine for class imbalanced data streams

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150729

WD01 Invention patent application deemed withdrawn after publication