WO2022134391A1

WO2022134391A1 - 融合神经元模型、神经网络结构及训练、推理方法、存储介质和设备

Info

Publication number: WO2022134391A1
Application number: PCT/CN2021/087524
Authority: WO
Inventors: 赵卫; 臧大伟; 程东; 杜炳政; 谢小平; 张佩珩; 谭光明; 姚宏鹏
Original assignee: 中国科学院西安光学精密机械研究所; 中国科学院计算技术研究所
Priority date: 2020-12-25
Filing date: 2021-04-15
Publication date: 2022-06-30
Also published as: CN112529166A

Abstract

本发明涉及人工神经元及神经网络，具体涉及一种融合神经元模型、神经网络结构及其推理方法和训练方法、计算机可读存储介质及计算机设备，融合神经元模型的每个突触连接权值是任意一个连续可导的非线性的函数，在突触权值上实现线性到非线性的映射，神经网络结构以融合神经元模型作为基本组成单位，构成层次化结构，推理方法是将输入数据代入连接的非线性权值函数中，计算出连接加权结果，再将该神经元所有的加权结果求和，直接传递到下一级神经元，依次前向传递，最后得到识别结果，训练方法是通过反向传播算法和梯度下降算法来优化神经元模型的参数，计算机可读存储介质及计算机设备能够实现推理方法和训练方法的具体步骤。

Description

融合神经元模型、神经网络结构及训练、推理方法、存储介质和设备

技术领域

本发明涉及人工神经元及神经网络，具体涉及一种融合神经元模型、神经网络结构及其推理方法和训练方法、计算机可读存储介质及计算机设备。

背景技术

在新科技革命浪潮的推动下，智能化成为未来社会形态演进的必然趋势，人工智能技术在信息化时代中发挥着越来越重要的作用。以人工神经网络为核心的数据处理技术成为现今人工智能的主流方法，它以一种模拟人脑的机制解释数据，并通过组合低层特征形成更加抽象的高层属性。当前，人工神经网络技术在模式识别、图像处理、智能控制、组合优化、金融预测、通信、机器人以及专家系统等领域得到广泛的应用，发挥了基础性的作用，并创造了巨大的经济价值。

人工神经网络是在现代神经科学的基础上提出和发展起来的，是一种反映人脑结构和功能的抽象数学模型。自1943年美国心理学家W.McCulloch和数学家W.Pitts提出形式神经元的抽象数学模型—MP模型以来，人工神经网络模型经过了50多年曲折的发展，相关的理论和方法已经发展成一门界于物理学、数学、计算机科学和神经生物学的交叉学科。所谓的神经网络是一类通过多层非线性变换对高复杂性数据建模的方法的合集，作为人工神经网络的基本组成单元，其中，人工神经元模型为

包含三个基本要素：(1)权值w _i，对应于生物神经元突触的一组连接，连接强度由各连接上的权值w _i表示，其中，权值w _i为正表示激活，权值w _i为负表示抑制；(2)求和单元，用于求取多个输入信号的加权求和；(3)非线性激活函数，向神经元引入了非线性因素，使得神经网络可以任意逼近任何非线性函数，并将神经元输出幅度限制在一定范围。在执行神经网络推理或者训练计算时，突触连接的权值与输入数据的相乘运算、求和单元的相加运算是一种线性模型，因此，求和之后需要一个非线性激活函数将线性模型计算的值映射到非线性空间，增强神经网络的描述能力。如果没有非线性激活函数，则神经网络只能进行线性变换。

这种基于线性模型+非线性激活的人工神经元及网络模型，在通用数字电子计算机中可以容易且快速的进行计算，但是，在光计算、DNA计算等模拟计算器件中却很难实现。由于数字电子计算机的通用性，对于线性乘加操作和非线性激活操作都可以转换为二进制的布尔逻辑形式，由CPU内部的逻辑运算单元完成计算操作。而在某些高能效的模拟计算结构中，实现该神经元模型却非常困难，例如，以光为载体的光子计算器件，在实现基于传统神经元模型的神经网络计算时需要两个过程：①利用光的非线性特性构建线性向量矩阵乘加结构，具体方法为将神经网络的权值矩阵采用SVD分解的方法分解成两个酉矩阵和一个对角阵，然后利用光传播过程中的自相似作用构造酉矩阵结构，并用强度调制器实现对角阵；②用电子计算机实现激活函数。

采用模拟计算器件实现传统人工神经元及网络计算模型时主要存在两个问题：首先，利用模拟信号的非线性特性将多个非线性模拟信号叠加成为线性信号，从而基于模拟器件实现线性向量矩阵乘加，不仅需要大量器件的组合，而且较容易受到环境的干扰产生漂移；其次，模型中常用的Sigmod、Relu等激活函数很难用模拟器件实现，因此，需要用电子计算机处理该类操作，降低了模拟计算组件的计算速度和能效。

发明内容

本发明为解决目前采用模拟计算器件实现传统人工神经元及网络计算模型时，存在所需模拟器件组合数量大，容易受到环境干扰产生漂移，以及部分激活函数难以采用模拟器件实现，需要借助电子计算机处理，降低了模拟计算组件的计算速度和能效的技术问题，提供一种融合神经元模型、神经网络结构及其推理方法和训练方法、计算机可读存储介质及计算机设备。

为实现上述目的，本发明提供如下技术方案：

一种融合神经元模型，用于模拟计算器件实现人工神经元及网络计算，其特殊之处在于，

每个突触连接的权值为连续可导的非线性函数φ(w _i,x _i)；

其中，i为神经元相应级数，为大于1的整数；x _i为前一级i-1级神经元输入至当前级i级神经元突触连接的输入值；

w _i为训练参数，通过以下步骤获得：

S1，为每一个突触的权值随机赋值，作为初始化训练参数w _i′；

S2，选取一个batch，代入神经元模型进行推理，得到推理结果；

S3，依据推理结果，根据损失函数，计算相应损失值；

S4，通过反向传播算法，根据权值非线性激活函数计算每一级权值的偏导数；

S5，通过梯度下降法，根据每一级权值的偏导数，将步骤S3得到的损失值最小化，并根据该最小化结果更新初始化训练参数w _i′；

S6，重复执行步骤S2至步骤S5，直至所有batch均被代入神经元模型进行推理，最后一个batch执行步骤S2至步骤S5后，得到的更新后的初始化训练参数，即为w _i。

进一步地，步骤S2具体为：

S2.1，选取一个batch，对该batch进行格式变换，形成一个一维向量；

S2.2，将所述一维向量输入至神经网络的输入层和隐藏层之间的传递矩阵，所述传递矩阵采用连续可导的非线性函数作为元素值，得到一个结果矩阵；

S2.3，将步骤S2.2得到的结果矩阵行向量依次相加，得到一个输出向量；

S2.4，将步骤S2.3得到的输出向量赋值给步骤S2.1形成的一维向量；

S2.5，重复执行S2.2至步骤S2.4，直至到达神经网络的输出层，推理结束，得到推理结果。

本发明还提供了一种神经网络结构，所述神经网络为前馈网络或反馈网络，其特殊之处在于，包括输入层、隐藏层和输出层；

所述输入层、隐藏层和输出层中每个层次均有至少一个神经元，所述神经元采用上述的融合神经元模型。

另外，本发明还提供了一种基于上述神经网络结构的推理方法，其特殊之处在于，包括以下步骤：

S1，对输入的batch进行格式变换，形成一个一维向量，输入至模拟计算器件；

S2，通过模拟计算器件，将所述一维向量中的每一个元素，按照对应关系输入至神经网络的输入层和隐藏层之间的传递矩阵，所述传递矩阵采用连续可导非线性函数作为元素值，得到一个矩阵；

S3，将步骤S2得到的矩阵行向量依次相加，得到一个输出向量；

S4，将步骤S3得到的输出向量赋值给步骤S1形成的一维向量；

S5，重复执行S2至步骤S4，直至到达神经网络的输出层，推理结束，得到推理输出结果。

再者，本发明还提供了一种基于上述神经网络结构的训练方法，其特殊之处在于，包括以下步骤：

S1，为神经网络结构中神经元的每一个突触连接的权值随机赋值；

S2，通过推理得到每一个突触权值的初始化输出S2.1，选取batch进行格式变换，形成一个一维向量；

S2.2，将所述一维向量输入至神经网络的输入层和隐藏层之间的传递矩阵，所述传递矩阵采用连续可导非线性函数作为元素值，得到一个矩阵；

S2.3，将步骤S2.2得到的矩阵行向量依次相加，得到一个输出向量；

S2.5，重复执行S2.2至步骤S2.4，直至到达神经网络的输出层，推理结束，得到每一个突触权值的初始化输出；

S3，根据每一个突触权值的初始化输出，通过损失函数，计算相应损失值；

S5，通过梯度下降法，根据每一级权值的偏导数，将步骤S3得到的损失值最小化，并根据该最小化结果更新每一个突触权值的初始化输出；

S6，重复执行步骤S2至步骤S5，直至所有batch均被代入神经元进行推理，最后一个batch执行步骤S2至步骤S5后得到的更新后的每一个突触权值的初始化输出，即为每一个突触权值的最终输出，完成训练；

S7，将每一个突触权值的最终输出代入模拟计算器件，基于神经网络执行推理。

同时，本发明还提供了一种计算机可读存储介质，其上存储有计算机程序，其特殊之处在于，该程序被处理器执行时可实现上述推理方法的步骤，或实现上述训练方法的步骤。

相应地，本发明还提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特殊之处在于，所述处理器执行所述程序时可实现上述推理方法的步骤，或实现上述训练方法的步骤。

与现有技术相比，本发明的有益效果是：

1.本发明融合神经元模型，将传统人工神经元中的连接权值与激活函数相融合，不再需要激活函数，不仅可以在数字电子计算机中实现，更适合于一些具有非线性特性的模拟计算器件来实现，可以直接实现器件的级连，避免了将模拟信号转换为数字信号，进行激活操作所引入的速度和能耗瓶颈；由于不再需要激活函数，规避了原有激活函数需要借助电子计算机处理的流程，有效提高了模拟计算组件的计算速度和能效。

2.本发明的神经网络结构，以上述融合神经元模型作为基本组成单位，构成层次化结构，可以实现图像识别、语音处理、自动驾驶等传统人工神经元网络所应用的领域，同时，还能够提高计算效率。

3.本发明神经网络结构的推理方法，首先将该连接的输入数据代入连接的非线性权值函数中，计算出连接加权结果，再将该神经元所有的加权结果求和，直接传递到下一层神经元，依次前向传递，最后得到识别结果，不再是向量矩阵乘加运算，推理结果更加高效准确，还可以嵌入到现有训练方法中。

4.本发明神经网络结构的训练方法，通过反向传播算法和梯度下降算法来优化神经元模型的参数，其中，参数的梯度通过对权值函数求偏导获得，训练中融合了前述的推理过程。

5.本发明的计算机可读存储介质和计算机设备，能够执行本发明的推理方法和训练方法，以程序的方式执行具体步骤，能够在应用中实现相应方法，便于推广应用。

附图说明

图1为传统人工神经元模型示意图；

图2为本发明融合神经元模型的示意图；

图3为本发明神经网络结构实施例的示意图；

图4为本发明神经网络结构推理方法流程示意图；

图5为本发明神经网络结构训练方法流程示意图。

具体实施方式

下面将结合本发明的实施例和附图，对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例并非对本发明的限制。

本发明的发明构思如下：

如何设计新的人工神经元及网络计算模型，以适应高能效的模拟计算器件的特性，是本专利所要解决的核心问题。

在进行新型模拟计算器件和人工神经元及网络计算模型协同研究时发现，线性模型+非线性激活的神经元及网络计算模型与模拟计算器件的物理特性不匹配，是产生所需模拟器件组合数量大，容易受到环境干扰产生漂移，以及部分激活函数难以采用模拟器件实现，需要借助电子计算机处理，降低了模拟计算组件的计算速度和能效等技术问题的根本原因。因此本申请提出一种线性模型与激活函数融合的新型人工神经元模型及网络结构，该模型将神经元间突触的连接权重用非线性函数表示，从而形成非线性空间中的权值矩阵，将人工神经元需要的非线性操作直接在权值矩阵中实现，从而可以直接利用光器件等模拟计算器件的非线性特性实现神经网络的功能。

针对传统线性模型+非线性激活的神经元及网络计算模型，与模拟计算器件的物理特性不匹配，而造成的规模问题、稳定性问题和功耗速度等问题，本发明提出了一种没有激活函数的非线性权值神经元及相应的网络计算模型，从而可以利用光、电等模拟信号的非线性效应直接实现神经网络结构，不仅可以减小器件的体积，而且可以充分发挥出模拟信号在速度和能效方面的优势。

传统神经网络是采用线性模型+非线性激活的神经元结构。其中，线性模型是指模型的输出为输入的线性加权和，假设一个模型的输出y和输入x _i满足

关系，则这个模型就是一个线性模型，其中，w _i和b都属于实数域。被称为线性模型是因为当模型的输入只有一个的时候，x _i和y形成了二维坐标系中的一条直线，类似的，当模型有n个输入时，向量x _i和向量y形成了 n+1维空间的一个平面。一个线性模型中，通过输入得到输出的函数称之为一个线性变换，其最大的特点是任意线性模型的组合仍然还是线性模型。另外，非线性激活是指将线性模型的计算结果映射到非线性空间，从而增强神经网络拟合非线性函数的能力。如果将每一个神经元的输出通过一个非线性函数，那么整个神经网络模型也就不再是线性的，该非线性函数可以是Sigmod、Relu、Tanh等常用的激活函数，也可以是任意的在二维平面上函数图像为曲线或折线的连续可导函数。

而本发明提出了一种突触连接权值与激活函数融合的人工神经元及相应网络结构，主要包括四个要点：第一，突触连接权值是一个非线性函数；第二，神经元及网络结构没有激活函数；第三，基于该模型的推理操作不再是向量矩阵乘加运算；第四，推理模型可以嵌入到现有训练方法中。

本发明提出的一种融合神经元模型，突触连接权值是一个非线性函数，具体是指神经元间突触连接的权值是一个非线性的函数φ(w _i,x _i)，而该突触的输入x _i作用到该突触连接权值上时，是非线性的输出，即对于输入x _i和相应的输出y _i，在二维坐标系中是一条曲线，此处，i为变量，为神经元相应技术，与神经元模型的每一级相对应。是一种突触权值与激活函数融合的神经元计算模型，该模型的神经元没有激活函数f，一个神经元的输入与非线性权值函数加权和后，直接作为结果输出到所连接的下一个神经元中。

同时，本发明还提出了一种基于融合模型的神经网络结构，以前述的融合神经元模型为基本组成单位，包括输入层、隐藏层和输出层，其中，输入层、隐藏层和输出层中每个层次均有至少一个神经元，神经元采用前述的融合神经元模型，是按照一定的规则构成的单层或者多层神经网络结构，每一层神经网络中神经元的数量、层次之间的连接关系根据任务的需要进行配置。

如下以一个实施例为例具体说明本发明融合神经元模型及神经网络结构：

如图1，是传统人工神经元模型示意图，传统人工神经元模型每个突触连接的权值w _i是一个实数，与输入的数据x _i作乘法运算后再累加，将累加结果送入激活函数f中，得到相应输出。图2是本实施例中的融合神经元模型，每个突触连接的权值是一个连续可导的非线性函数φ(w _i,x _i)，该非线性函数有两个参数分别为w _i和x _i，其中，参数w _i仅在训练过程中会进行调整，而在推理过程中保持固定，不再改变，参数w _i的获取方式后续将详细介绍，参数x _i是上一级神经元输入到该突触连接的值，同时，该模型在突触连接求和之后，直接输出给下一级神经元，中间没有激活函数。

如图3，是本发明的基于融合神经元模型的神经网络结构的一个实施例，该神经网络结构由输入层、隐藏层和输出层三个层次组成，每个层次有三个神经元，层次之间采用全连接的结构，实际应用时，基于本发明的融合神经元模型可以构建任意层次、任意连接关系的神经网络结构，可以是前馈网络，也可以是反馈网络等。

上述的神经网络结构在进行推理操作时，当一组数据(如图像、语音、文本等)进入到输入层神经元时，数据首先输入到非线性权值矩阵中，然后将结果矩阵中的行向量依次相加生成该层的计算结果，并作为下一层的输入，依次前向传递，最后得到识别结果。在进行训练操作时，通过反向传播算法和梯度下降算法调整神经网络中参数的取值，梯度下降算法主要用于优化单个参数的取值，而反向传播算法给出一个高效的方式在所有的参数上使用梯度下降算法，从而使神经网络模型在训练数据上的损失函数尽可能的小，参数的梯度通过对非线性权值函数求偏导的方式获得。

如下以实施例为例对推理和训练的具体方法进行说明：

前述图3中所示神经网络结构实施例中，输入层和隐藏层之间的传递矩阵T为：

该传递矩阵中共有9个元素，分别表示输入层网络与隐藏层网络的突触连接的权值，例如对于输入层的第一个神经元与隐藏层第一个神经元之间的连接权值为φ(w ₁₁,x ₁)，其中w ₁₁表示上一层的第一个元素和下一层第一个元素之间连接的权值，对于传递矩阵，如果两个神经元之间没有连接，那么该位置的元素值为0。

如图4，对该神经网络进行推理操作，具体步骤为：

(1)对输入的图片、语音等信息进行格式变换，形成一个一维向量 V＝[x ₁ x ₂ x ₃]，并将该一维向量输入到模拟计算器件，通过模拟计算器件输入至输入层神经元中，对于两个相邻的连接层次，将向量V输入到输入层和隐藏层之间的传递矩阵T中，获得结果矩阵T′；

(2)将结果矩阵T′中的行向量依次相加，获得一个输出向量V′；

(3)将输出向量V′的值赋值给一维向量V；

(4)判断是否已经到达输出层，如果到达输出层则输出向量V′就是推理的计算结果，否则将当前的输出向量V′输入到输入层和隐藏层之间的传递矩阵T中，再次获得一个结果矩阵，再重复执行(2)到(4)，直到到达输出层，完成推理，输出推理结果，结束推理。

能够基于上述推理方法对输入的图片、语音等信息进行识别。

如图5，对该神经网络进行训练操作，具体步骤为：

(1)对网络参数(权值)进行初始化，可以采用随机的方法使每个网络参数在0附近随机取值，实际应用中，随机取值也可以不在0附近，可进行随机取值；

(2)从训练数据中选取一个batch，其大小可以根据需要动态的改变；

(3)调用该神经网络的推理操作，进行推理操作，取得输出；

(4)根据损失函数，计算损失值；

(5)执行反向传播算法，计算所有网络参数的偏导数；

(6)使用梯度下降法，或者其它算法与反向传播算法相结合，将通过损失函数计算出的损失值最小化，并根据最小化结果更新所有相关的网络参数；

(7)判断是否还有batch需要注入模型参与训练，如果有则跳转到步骤(2)，重复执行步骤(2)至步骤(7)，直至所有batch均已注入模型参与训练；

(8)训练结束，输出训练出的网络参数，代入神经网络结构中，用于后续训练

本发明中融合神经元模型，每个突触连接的权值为连续可导的非线性函数φ(w _i,x _i)，w _i为训练参数，通过本发明神经网络结构的训练步骤获得：

S1，为每一级的权值随机赋值，得到初始化训练参数w _i′；

S2，选取一个batch，代入神经元模型进行推理；

S3，根据初始化训练参数w _i，通过损失函数，计算相应损失值；

S4，通过反向传播算法，计算每一级权值的偏导数；

S6，重复执行步骤S2至步骤S5，直至所有batch均被代入神经元模型进行推理，最后一个batch执行步骤S2至步骤S5后得到的更新后的初始化训练参数w _i′，即为w _i。

其中，步骤S2中的推理采用本发明的神经网络结构推理方法得到。

另外，本发明还提出了一种计算机可读存储介质和计算机设备，其中，计算机可读存储介质上存储有计算机程序，该程序被处理器执行时能够实现上述推理方法的步骤或训练方法的步骤。计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行该计算机程序时实现上述推理方法的步骤或训练方法的步骤。需要说明的是，本发明的推理方法和训练方法，除了能够通过计算机设备这种电子计算机实现，还适合于一些具有非线性特性的模拟计算器件来实现。

以上所述仅为本发明的实施例，并非对本发明保护范围的限制，凡是利用本发明说明书及附图内容所作的等效结构变换，或直接或间接运用在其他相关的技术领域，均包括在本发明的专利保护范围内。

Claims

一种融合神经元模型，用于模拟计算器件实现人工神经元及网络计算，其特征在于：

每个突触连接的权值为连续可导的非线性函数φ(w _i,x _i)；

其中，i为神经元相应级数，为大于1的整数；x _i为前一级i-1级神经元输入至当前级i级神经元突触连接的输入值；

w _i为训练参数，通过以下步骤获得：

S1，为每一个突触的权值随机赋值，作为初始化训练参数w _i′；

S2，选取一个batch，代入神经元模型进行推理，得到推理结果；

S3，依据推理结果，根据损失函数，计算相应损失值；

S4，通过反向传播算法，根据权值非线性激活函数计算每一级权值的偏导数；

S5，通过梯度下降法，根据每一级权值的偏导数，将步骤S3得到的损失值最小化，并根据该最小化结果更新初始化训练参数w _i′；

S6，重复执行步骤S2至步骤S5，直至所有batch均被代入神经元模型进行推理，最后一个batch执行步骤S2至步骤S5后，得到的更新后的初始化训练参数，即为w _i。
如权利要求1所述一种融合神经元模型，其特征在于：所述步骤S2具体为：

S2.1，选取一个batch，对该batch进行格式变换，形成一个一维向量；

S2.2，将所述一维向量输入至神经网络的输入层和隐藏层之间的传递矩阵，所述传递矩阵采用连续可导的非线性函数作为元素值，得到一个结果矩阵；

S2.3，将步骤S2.2得到的结果矩阵行向量依次相加，得到一个输出向量；

S2.4，将步骤S2.3得到的输出向量赋值给步骤S2.1形成的一维向量；

S2.5，重复执行S2.2至步骤S2.4，直至到达神经网络的输出层，推理结束，得到推理结果。
一种神经网络结构，所述神经网络为前馈网络或反馈网络，其特征在于：包括输入层、隐藏层和输出层；

所述输入层、隐藏层和输出层中每个层次均有至少一个神经元，所述神经元采用权利要求1或2所述的融合神经元模型。
一种基于权利要求3所述神经网络结构的推理方法，其特征在于，包括以下步骤：

S1，对输入的batch进行格式变换，形成一个一维向量，输入至模拟计算器件；

S2，通过模拟计算器件，将所述一维向量中的每一个元素，按照对应关系输入至神经网络的输入层和隐藏层之间的传递矩阵，所述传递矩阵采用连续可导非线性函数作为元素值，得到一个矩阵；

S3，将步骤S2得到的矩阵行向量依次相加，得到一个输出向量；

S4，将步骤S3得到的输出向量赋值给步骤S1形成的一维向量；

S5，重复执行S2至步骤S4，直至到达神经网络的输出层，推理结束，得到推理输出结果。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于：该程序被处理器执行时实现权利要求4所述方法的步骤。
一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于：所述处理器执行所述程序时实现权利要求4所述方法的步骤。
一种基于权利要求3所述神经网络结构的训练方法，其特征在于，包括以下步骤：

S1，为神经网络结构中神经元的每一个突触连接的权值随机赋值；

S2，通过推理得到每一个突触权值的初始化输出

S2.1，选取batch进行格式变换，形成一个一维向量；

S2.2，将所述一维向量输入至神经网络的输入层和隐藏层之间的传递矩阵，所述传递矩阵采用连续可导非线性函数作为元素值，得到一个矩阵；

S2.3，将步骤S2.2得到的矩阵行向量依次相加，得到一个输出向量；

S2.4，将步骤S2.3得到的输出向量赋值给步骤S2.1形成的一维向量；

S2.5，重复执行S2.2至步骤S2.4，直至到达神经网络的输出层，推理结束，得到每一个突触权值的初始化输出；

S3，根据每一个突触权值的初始化输出，通过损失函数，计算相应损失值；

S4，通过反向传播算法，根据权值非线性激活函数计算每一级权值的偏导数；

S5，通过梯度下降法，根据每一级权值的偏导数，将步骤S3得到的损失值最小化，并根据该最小化结果更新每一个突触权值的初始化输出；

S6，重复执行步骤S2至步骤S5，直至所有batch均被代入神经元进行推理，最后一个batch执行步骤S2至步骤S5后得到的更新后的每一个突触权值的初始化输出，即为每一个突触权值的最终输出；

S7，将每一个突触权值的最终输出代入模拟计算器件，基于神经网络执行推理。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于：该程序被处理器执行时实现权利要求7所述方法的步骤。
一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于：所述处理器执行所述程序时实现权利要求7所述方法的步骤。