WO2022141704A1

WO2022141704A1 - 神经元网络的反向传播算法的学习方法

Info

Publication number: WO2022141704A1
Application number: PCT/CN2021/073578
Authority: WO
Inventors: 孔繁生; 周华
Original assignee: 光华临港工程应用技术研发(上海)有限公司
Priority date: 2020-12-31
Filing date: 2021-01-25
Publication date: 2022-07-07
Also published as: CN113159311A

Abstract

本发明提供了一种神经元网络的反向传播算法的学习方法，包括如下步骤：提供一神经元网络，所述神经元网络包括输入层、隐藏层、和输出层，其中隐藏层为多层结构，包括第一隐藏层和第二隐藏层；为第一和第二隐藏层分别配置第一期待值和第二期待值；根据第一期待值对第一隐藏层执行训练，使第一隐藏层优化；保持第一隐藏层的优化结果，根据第二期待值对第二隐藏层执行训练，使第二隐藏层优化。本发明可以针对隐藏层中的每层进行单独的训练，保持上一隐藏层的优化结果的前提下，再对下面的隐藏层执行训练，逐层优化。这种优化方法可以不必在学习某一层的情况下，反复对其他层进行运算，因此可以节约总体的学习时间。

Description

神经元网络的反向传播算法的学习方法

技术领域

本发明涉及神经元网络领域，尤其涉及一种神经元网络的反向传播算法的学习方法。

背景技术

反向传播算法(即backpropagation算法)适合于多层神经元网络的一种学习算法，它建立在梯度下降法的基础上。BP网络的输入输出关系实质上是一种映射关系：一个n输入m输出的BP神经网络所完成的功能是从n维欧氏空间向m维欧氏空间中一有限域的连续映射，这一映射具有高度非线性。它的信息处理能力来源于简单非线性函数的多次复合，因此具有很强的函数复现能力。这是BP算法得以应用的基础。

反向传播算法的基本流程如图1所示，流程框图如图2所示，包括输入层(input layer)，隐藏层(hidden layer)和输出层(output layer)，输出层值与期待结果(desired value)，并将比较结果反向反馈给隐藏层，实现闭环的学习过程。为了提高神经元网络的计算能力，会对隐藏层设置为多层。层数越多整个网络的误差也就越小，但是会是整个网络复杂化，增加网络的训练时间，也有可能出现“过拟合”的情况。因此如何平衡层数和网络训练时间，是现有技术需要解决问题。

发明内容

本发明所要解决的技术问题是，提供一种神经元网络的反向传播算法的学习方法，可以降低学习时间。

为了解决上述问题，本发明提供了一种神经元网络的反向传播算法的学习方法，包括如下步骤：提供一神经元网络，所述神经元网络包括输入层、隐藏层、和输出层，其中隐藏层为多层结构，包括第一隐藏层和第二隐藏层；为第一和第二隐藏层分别配置第一期待值和第二期待值；根据第一期待值对第一隐藏层执行训练，使第一隐藏层优化；保持第一隐藏层的优化结果，根据第二期待值对第二隐藏层执行训练，使第二隐藏层优化。

本发明可以针对隐藏层中的每层进行单独的训练，保持上一隐藏层的优化结果的前提下，再对下面的隐藏层执行训练，逐层优化。这种优化方法可以不必在学习某一层的情况下，反复对其他层进行运算，因此可以节约总体的学习时间。

附图说明

附图1所示是现有技术中反向传播算法的基本流程。

附图2所示是现有技术中反向传播算法的流程框图。

附图3所示是本发明一具体实施方式所述方法的实施步骤示意图。

附图4所示是本发明一具体实施方式所述方法对应的神经元网络结构示意图。

具体实施方式

下面结合附图对本发明提供的一种神经元网络的反向传播算法的学习方法的具体实施方式做详细说明。

附图3所示是本具体实施方式所述方法的实施步骤示意图，包括：步骤S20，提供一神经元网络，所述神经元网络包括输入层、隐藏层、和输出层，其中隐藏层为多层结构，包括第一隐藏层和第二隐藏层；步骤S21，为第一和第二隐藏层分别配置第一期待值和第二期待值；步骤S22，根据第一期待值对第一隐藏层执行训练，使第一隐藏层优化；步骤S23，保持第一隐藏层的优化结果，根据第二期待值对第二隐藏层执行训练，使第二隐藏层优化。

附图4所示是上述方法对应的神经元网络结构示意图，所述神经元网络包括输入层X，隐藏层W1、W2、……Wn，输出层O1、O2、……On，以及期待值D1、D2、……Dn。对应于有n个隐藏层的网络，可以为每个隐藏层Wn都单独配置一个期待值Dn。

上述神经元网络进行学习训练时，可以针对隐藏层中的每层进行单独的训练，保持上一隐藏层的优化结果的前提下，再对下面的隐藏层执行训练，逐层优化。在每一层的学习过程中，仍然执行附图1和2所示的反向传播算法的执行流程。这种优化方法可以不必在学习某一层的情况下，反复对其他层进行运算，因此可以节约总体的学习时间。

作为一种优选的具体实施方式，在上述步骤执行之前，首先执行全局学习策略，即完整的循环迭代。至响应误差小于一预设范围后，开始执行所述逐层学习的步骤，以平衡学习时间和精度，达到最优效果。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

一种神经元网络的反向传播算法的学习方法，其特征在于，包括如下步骤：

提供一神经元网络，所述神经元网络包括输入层、隐藏层、和输出层，其中隐藏层为多层结构，包括第一隐藏层和第二隐藏层；

为第一和第二隐藏层分别配置第一期待值和第二期待值；

根据第一期待值对第一隐藏层执行训练，使第一隐藏层优化；

保持第一隐藏层的优化结果，根据第二期待值对第二隐藏层执行训练，使第二隐藏层优化。
根据权利要求1所述的方法，其特征在于，所述神经元网络还包括第三隐藏层；

为第三隐藏层配置第三期待值；

保持第一和第二隐藏层的优化结果，根据第三期待值对第三隐藏层执行训练，使第三隐藏层优化。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

执行全局学习策略，至相应误差小于一预设范围后，开始执行所述逐层学习的步骤。