CN107451660A - 模糊神经网络bp训练过程中的步长优化方法 - Google Patents
模糊神经网络bp训练过程中的步长优化方法 Download PDFInfo
- Publication number
- CN107451660A CN107451660A CN201710599093.8A CN201710599093A CN107451660A CN 107451660 A CN107451660 A CN 107451660A CN 201710599093 A CN201710599093 A CN 201710599093A CN 107451660 A CN107451660 A CN 107451660A
- Authority
- CN
- China
- Prior art keywords
- length
- layer
- variable
- neural network
- fuzzy neural
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Feedback Control In General (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明在批量梯度下降(BGD)的基础上,提出了一种步长优化的BP算法。在每次迭代中先使用反向传播算法计算代价函数的梯度;然后沿着梯度方向计算代价函数关于步长的二阶导数;最后利用一阶、二阶导数信息估计最优步长并进行参数调整。所提方法一方面免去了步长选择问题;另一方面,由于利用了二阶导数信息,能提高每次参数调整的效率。
Description
技术领域
本发明涉及模糊神经网络BP训练过程中的步长优化方法,属于优化算法领域。
背景技术
模糊神经网络是模糊系统同神经网络相结合的产物,作为模糊系统,能够很好地描述不确定信 息或定性的知识,能充分利用已有的知识来设计系统结构和配置初始值,且现在已能直接从检测数据中提 取模糊规则来初始化参数;作为神经网络,能利用BP算法进行自学习,并已证明能以很好的精度逼近期 望的模型。因此被广泛应用于智能控制与软测量建模等多个方面。
然而,标准的BP算法收敛速度通常较慢,其原因有几方面。首先,标准算法的计算代价过大, 需要对每一个样本进行计算后才能调整参数,实践中随机梯度下降法(SGD)是解决这一问题的主要方法 [9],每次迭代中仅根据小部分训练样本对模型参数进行调整,由于减小了每次参数调整的计算代价,当样 本信息高度冗余时能得到很快的收敛速度;其次,标准算法仅考虑了一阶导数信息,仅能得到小范围内的 最速下降方向但并不能确保方向一定最优,通常利用二阶导数信息,如高斯-牛顿法、柯西-牛顿法,能找 到更加合理的参数调整方向并得到更高的训练效率,但是这些类方法需要存储和处理Hessian矩阵,因此不适用于训练大型模型;除此之外,步长的选择也是影响BP算法收敛速度的关键因素,步长选择过大会 使训练过程发生振荡甚至不收敛,选择过小则会使训练收敛缓慢。
本发明在批量梯度下降(BGD)的基础上,提出了一种步长优化的BP算法。在每次迭代中先 使用反向传播算法计算代价函数的梯度;然后沿着梯度方向计算代价函数关于步长的二阶导数;最后利用 一阶、二阶导数信息估计最优步长并进行参数调整。所提方法一方面免去了步长选择问题;另一方面,由 于利用了二阶导数信息,能提高每次参数调整的效率。
发明内容
针对于模糊神经网络BP算法训练缓慢且步长难以选择,训练过程缓慢且不稳定的问题,本发 明提供一种步长优化方法。
在每次迭代中先使用反向传播算法计算代价函数的梯度;然后沿着梯度方向计算代价函数关于 步长的二阶导数;最后利用一阶、二阶导数信息估计最优步长并进行参数调整。
本发明的目的是通过以下技术方案实现的:
模糊神经网络BP训练过程中的步长优化方法,所述方法包括以下过程:首先使用反向传播算 法计算代价函数的梯度。
然后沿着梯度方向计算代价函数关于步长的二阶导数,最后利用一阶、二阶导数信息估计最优 步长并进行参数调整。
附图说明
图1是Mamdani模型的模糊神经网络;
图2是情况1下的步长估计示意图;
图3是情况2下的步长估计示意图;
图4是步长优化的BP算法流程图;
图5是数值仿真效果对比;
具体实施方式
图1是基于Mamdani模型的模糊神经网络结构示意图
模型参数的训练步骤如下:
步骤1:构造基于Mamdani模型的模糊神经网络,模型描述如下:
第一层:将精确集合上的输入变量X=[x1,…,xn]传入模糊神经网络。
该层节点数N1=n(输入变量的维数)
第二层:用mi个语言变量来描述精确变量xi,并输出xi隶属于语言变量的隶属度其 中i=1,2…n;li=1,2…mi。
该层节点数(语言变量总数量),涉及模型参数变量和(语言变量的中心位置和宽 度)。
第三层:计算模糊规则库中规则Rj对输入变量X的适用度zj(j=1,2…m;ji=1,2…mi)。规 则Rj的形式如下:
then f is Bj
其中f是模型的精确输出量,Bj是描述f的语言变量。用乘法推理机计算Rj的适用度
该层节点数N3=m(规则库中的规则数量)。
第四层:归一化计算
该层节点数N4=m。
第五层:解模糊计算,利用中心平均解模糊器得出模型的精确输出
由于设计的是MISO模糊神经网络,所以该层节点数N5=1。该层涉及模型参数wk,表示语言变量Bk的 中心。
定义模型参数θ、误差E(θ)和代价函数J(θ)分别为:
E(θ)≡(f(X)-y)2/2 (6)
步骤2:设置精度要求和步长的最大取值αmax
步骤3:利用BP算法求出代价函数关于模型参数的梯度,公式如下:
其中,α表示训练步长,θ(q)表示参数变量经过q次迭代后的取值,q为大于1的整数。
步骤4:估计最优步长并调整模型参数
首先定义负梯度为Δθ
将步长的确定转化为如下优化问题:
min J(α)=J(θ(q-1)+αΔθ(q-1))
s.t.α>0 (14)
利用负梯度Δθ(q-1)方向上代价函数关于步长α的一阶、二阶导数来估计每次迭代的最佳步长α,从 而提高参数调整的效率。
二次导数的求导步骤如下:
Step 1:首先定义和gj为
Step 2:逐层求导:
第1、2、3层:
第4、5层:
Step 3:求出代价函数关于步长的导数:
Step 4:确定步长:
如图(2)和图(3)所示,步长的确定分为两种情况:
情况一:
情况二:
Step 5:判断选取步长是否超过最大允许范围,若超过范围,则令α(q):=αmax
步骤5:利用梯度和所选步长调整模型参数
θ(q):=θ(q-1)+α(q)Δθ(q) (26)
步骤6:判断调整后的模型是否满足精度有求,若满足,则停止训练;否则跳回步骤3。
整个算法流程图如图(4)所示。图(5)是本方法在数值仿真中的训练误差曲线,并且与其他BP算 法的改进方法进行了比较。由图可知,本方法使BP算法的收敛速度得到了很大的提升。
Claims (2)
1.模糊神经网络BP训练过程中的步长优化方法,其特征在于,该方法步骤为:
步骤1:构造基于Mamdani模型的模糊神经网络,模型描述如下;
基于Mamdani模型的模糊神经网络的描述如下:
第一层:将精确集合上的输入变量X=[x1,…,xn]传入模糊神经网络;
该层节点数N1=n,n为输入变量的维数
第二层:用mi个语言变量来描述精确变量xi,并输出xi隶属于语言变量的隶属度其中i=1,2…n;li=1,2…mi;
该层节点数(语言变量总数量),涉及模型参数变量和(语言变量的中心位置和宽度);
第三层:计算模糊规则库中规则Rj对输入变量X的适用度zj(j=1,2…m;ji=1,2…mi);规则Rj的形式如下:
then f is Bj
其中f是模型的精确输出量,Bj是描述f的语言变量;用乘法推理机计算Rj的适用度
该层节点数N3=m(规则库中的规则数量);
第四层:归一化计算
该层节点数N4=m;
第五层:解模糊计算,利用中心平均解模糊器得出模型的精确输出
由于设计的是MISO模糊神经网络,所以该层节点数N5=1;该层涉及模型参数wk,表示语言变量Bk的中心;
步骤2:设置精度要求和步长的最大取值αmax
步骤3:利用BP算法求出代价函数关于模型参数的梯度,公式如下:
其中,α表示训练步长,θ(q)表示参数变量经过q次迭代后的取值,q为大于1的整数;
步骤4:估计最优步长并调整模型参数;
首先定义负梯度为Δθ
将步长的确定转化为如下优化问题:
min J(α)=J(θ(q-1)+αΔθ(q-1))
s.t.α>0 (11)
利用负梯度Δθ(q-1)方向上代价函数关于步长α的一阶、二阶导数来估计每次迭代的最佳步长α,从而提高参数调整的效率;二次导数的求导步骤如下:
Step 1:首先定义和gj为
Step 2:逐层求导:
第1、2、3层:
第4、5层:
Step 3:求出代价函数关于步长的导数:
Step 4:确定步长:
步长的确定分为两种情况处理:
情况一:
情况二:
Step 5:判断选取步长是否超过最大允许范围,若超过范围,则令α(q):=αmax
步骤5:利用梯度和所选步长调整模型参数
θ(q):=θ(q-1)+α(q)Δθ(q) (23)
步骤6:判断调整后的模型是否满足精度有求,若满足,则停止训练;否则跳回步骤3。
2.根据权利要求1所述的模糊神经网络BP训练过程中的步长优化方法,其特征在于,一方面免去了步长选择问题;另一方面,由于利用了二阶导数信息,能提高每次参数调整的效率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710599093.8A CN107451660A (zh) | 2017-07-21 | 2017-07-21 | 模糊神经网络bp训练过程中的步长优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710599093.8A CN107451660A (zh) | 2017-07-21 | 2017-07-21 | 模糊神经网络bp训练过程中的步长优化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107451660A true CN107451660A (zh) | 2017-12-08 |
Family
ID=60487331
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710599093.8A Pending CN107451660A (zh) | 2017-07-21 | 2017-07-21 | 模糊神经网络bp训练过程中的步长优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107451660A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109726763A (zh) * | 2018-12-29 | 2019-05-07 | 北京神州绿盟信息安全科技股份有限公司 | 一种信息资产识别方法、装置、设备及介质 |
CN110069985A (zh) * | 2019-03-12 | 2019-07-30 | 北京三快在线科技有限公司 | 基于图像的目标点位置检测方法、装置、电子设备 |
CN116128072A (zh) * | 2023-01-20 | 2023-05-16 | 支付宝(杭州)信息技术有限公司 | 一种风险控制模型的训练方法、装置、设备及存储介质 |
-
2017
- 2017-07-21 CN CN201710599093.8A patent/CN107451660A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109726763A (zh) * | 2018-12-29 | 2019-05-07 | 北京神州绿盟信息安全科技股份有限公司 | 一种信息资产识别方法、装置、设备及介质 |
CN110069985A (zh) * | 2019-03-12 | 2019-07-30 | 北京三快在线科技有限公司 | 基于图像的目标点位置检测方法、装置、电子设备 |
CN116128072A (zh) * | 2023-01-20 | 2023-05-16 | 支付宝(杭州)信息技术有限公司 | 一种风险控制模型的训练方法、装置、设备及存储介质 |
CN116128072B (zh) * | 2023-01-20 | 2023-08-25 | 支付宝(杭州)信息技术有限公司 | 一种风险控制模型的训练方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021196997A1 (zh) | 基于模糊神经网络的串联输水渠道水位预测与控制方法 | |
CN103676881B (zh) | 一种半导体生产线动态瓶颈分析方法 | |
CN107451660A (zh) | 模糊神经网络bp训练过程中的步长优化方法 | |
CN107728477A (zh) | 一种工厂化水产养殖水质溶解氧预测控制方法及系统 | |
CN106980897A (zh) | 一种基于变学习率的bp人工神经网络的喷射器性能参数预测方法 | |
CN109409614A (zh) | 一种基于贝叶斯正则化神经网络的电力负荷预测方法 | |
CN108287471A (zh) | Mimo偏格式无模型控制器基于系统误差的参数自整定方法 | |
CN109376850A (zh) | 一种基于改进bp神经网络状态估计中不良数据的检测方法 | |
CN107609769B (zh) | 一种基于故障基因表的智能配电网故障预警方法 | |
CN107257130B (zh) | 基于区域量测解耦的低压配电网损耗计算方法 | |
CN110390461B (zh) | 基于复杂网络的非线性模糊语言配电网节点脆弱性评价方法 | |
CN108599172A (zh) | 一种基于人工神经网络的输配网全局潮流计算方法 | |
CN108615097A (zh) | 一种风速预测方法、系统、设备及计算机可读存储介质 | |
WO2023207139A1 (zh) | 利用交流型樽海鞘算法求解拉伸/压缩弹簧参数的方法 | |
CN108326049A (zh) | 一种冷连轧轧制力的自学习方法 | |
CN111523728A (zh) | 一种四阶段混合短时风向预测方法 | |
CN113361214A (zh) | 一种基于水位流量数据的明渠控制模型参数辨识方法 | |
CN110942175B (zh) | 基于烟花爆炸人工蜂群算法的大规模电力系统经济调度问题优化方法 | |
CN116523086A (zh) | 基于长短时记忆深度神经网络的单井生产动态预测方法 | |
CN115048804A (zh) | 一种城市管网多传感器优化部署方法 | |
CN107807528A (zh) | 一种基于自适应优化控制节点的活塞流管式反应器最优控制系统 | |
CN117000780A (zh) | 一种自适应冷轧带材多通道板形预报方法 | |
CN106371321A (zh) | 一种焦化炉炉膛压力系统模糊网络优化pid控制方法 | |
CN102063640A (zh) | 基于效用差分网络的机器人行为学习模型 | |
CN109523386A (zh) | 一种gmm与lstm结合的投资组合风险预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20171208 |
|
WD01 | Invention patent application deemed withdrawn after publication |