WO2024092896A1

WO2024092896A1 - 一种神经网络训练及推理方法、装置、终端及存储介质

Info

Publication number: WO2024092896A1
Application number: PCT/CN2022/133546
Authority: WO
Inventors: 王伟; 李阳; 姜文峰; 汪令飞; 耿玓; 刘明
Original assignee: 鹏城实验室
Priority date: 2022-11-01
Filing date: 2022-11-22
Publication date: 2024-05-10
Also published as: CN115906936A

Abstract

本发明公开了一种神经网络训练及推理方法、装置、终端及存储介质，包括：对正向传播的网络节点信息进行映射处理，并根据映射后的数值进行伯努利过程采样，将得到的随机二值化数值作为下一层网络的输入；对激活函数的导数进行伯努利过程采样，得到随机二值化后的激活函数的导数；对下一层网络的反向传播的误差进行符号化处理，并根据符号化处理后的值和随机二值化后的导数计算本层网络的误差信息；根据本层网络的误差信息和上一层网络产生的随机二值化输出对本层网络进行训练；根据逐层传播的随机二值化数值进行神经网络的推理。本发明采用随机二值化的信号进行正向传播和符号化的误差进行反向传播的神经网络，降低计算资源且提高了识别精度。

Description

一种神经网络训练及推理方法、装置、终端及存储介质

技术领域

本发明涉及人工智能技术领域，尤其涉及的是一种神经网络训练及推理方法、装置、终端及存储介质。

背景技术

人工神经网络(Artificial Neural Network，以下简称神经网络)的技术进步是近年来科技发展的重要推动力。神经网络广泛应用于对图像、声音、文字等信息的处理过程中。

神经网络中通常包含多层相互连接的非线性网络节点，节点之间的连接强度称为权重。神经网络的所需处理的信息从输入节点输入，在神经网络中逐层传播，最终到达输出层，这一过程称为信息的正向传播。信息的正向传播是神经网络对输入信息的处理过程，又称推理过程。神经网络可以通过特定的算法和流程调整网络中连接各个节点之间的权重，从而使推理结果尽可能地准确，这一过程称为训练或学习过程。

误差反向传播(Error Backpropagation)和梯度下降算法(Gradient Descent)是实现神经网络训练的重要技术发明。基于误差反向传播和梯度下降算法的神经网络训练，包含以下4个步骤：

1)将训练集中的样本数据输入到神经网络中进行信息的正向传播，获得每个节点的状态信息，并获得最终输出结果；

2)输出结果与样本数据的标记信息进行对比，获得输出误差(Error)；

3)将输入误差从网络终端作为输入，由神经网络最后一层向第一层反向传播；

4)利用正向传播的信息和反向传播的误差，计算获得神经网络最终输出结果相对于网络中连接权重的梯度信息，并依据梯度下降算法调整网络中的连接权重。神经网络的推理过程仅包含上述第一个步骤，即信息的正向传播。

在传统神经网络训练和推理中，正向传播的信息和反向传播的误差需要采用高精度的数值来描述。但是，高精度数值在计算机中的存储和处理开销较大，造成了神经网络训练对算力和能耗的较高需求。算力和能耗问题成为神经网络进一步广泛应用的瓶颈。此外，当利用忆阻器阵列实现神经网络加速时，高精度数值所描述的信息和误差需要复杂的外围电路来完成，增加了硬件加速神经网络运算的成本和功耗。

为解决或缓解神经网络训练和推理过程中的算力瓶颈和能耗瓶颈问题，人们发明了多种技术方法。主要包括神经网络量化(Neural Network Quantization)技术和神经网络二值化(Neural Network Binarization)技术；其中，神经网络量化在一定程度上降低了神经网络推理过程中对算力的需求，但是降低了神经网络的识别精度，而二值化网络的训练过程中，反向传播的误差仍采用高精度的数值来描述，在加速训练的过程中仍然存在神经网络识别精度下降的问题。

因此，现有技术还有待改进。

发明内容

本发明要解决的技术问题在于，针对现有技术缺陷，本发明提供一种神经网络训练及推理方法、装置、终端及存储介质，以解决现有的神经网络训练和推理方法在算力瓶颈场景中存在的识别精度下降的技术问题。

本发明解决技术问题所采用的技术方案如下：

第一方面，本发明提供一种神经网络训练及推理方法，包括：

根据激活函数对正向传播的网络节点信息进行映射处理，并根据映射后的数值进行伯努利过程采样，得到本层网络产生的随机二值化数值，将得到的随机二值化数值作为下一层网络的输入；

对所述激活函数的导数进行伯努利过程采样，得到随机二值化后的激活函数的导数；

对所述下一层网络的反向传播的误差进行符号化处理，并根据符号化处理后的值和所述随机二值化后的激活函数的导数计算所述本层网络的误差信息；

根据所述本层网络的误差信息和上一层网络产生的随机二值化输出对本层网络进行训练；

根据逐层传播的随机二值化数值进行神经网络的推理。

在一种实现方式中，所述根据激活函数对正向传播的网络节点信息进行映射处理，之前包括：

获取上一层网络中连接到所述本层网络的各节点的输出信息，得到所有连接所述本层网络的节点的输入；其中，所述本层网络的节点的输入为所述上一层网络的经过随机二值化处理后的输出；

将所有连接所述本层网络的节点的输入与对应的权重进行相乘，并将得到的所有乘积进行求和，得到所述本层网络的节点的输入信息。

在一种实现方式中，所述根据激活函数对正向传播的网络节点信息进行映射处理，并根据映射后的数值进行伯努利过程采样，得到本层网络产生的随机二值化数值，将得到的随机二值化数值作为下一层网络的输入，包括：

根据所述激活函数对所述本层网络的输入信息进行映射处理，将所述本层网络的输入信息映射成0至1之间的数值；

以映射得到的数值为概率进行伯努利过程采样，获得对应的随机二值化网络节点的输出结果；其中，所述输出结果为所述本层网络产生的随机二值化数值；

将获得的随机二值化网络节点的输出结果作为所述下一层网络的输入。

在一种实现方式中，所述激活函数为挤压函数，包括：Logistic函数、误差函数、剪切式整流线性单元函数以及对称剪切式整流线性单元函数中的一种或组合。

在一种实现方式中，所述对所述激活函数的导数进行伯努利过程采样，得到随机二值化后的激活函数的导数，包括：

获取所述激活函数的导数；

以获得的导数为概率进行伯努利过程采样，获得对应的随机二值化网络节点的输出结果；

将获得的随机二值化网络节点的输出结果作为反向传播过程的误差信息计算值。

在一种实现方式中，所述以获得的导数为概率进行伯努利过程采样，获得对应的随机二值化网络节点的输出结果，之前包括：

对所述激活函数的导数的幅值进行等比例缩放或近似化处理。

在一种实现方式中，所述对所述下一层网络的反向传播的误差进行符号化处理，并根据符号化处理后的值和所述随机二值化后的激活函数的导数计算所述本层网络的误差信息，包括：

对所述下一层网络的反向传播的误差进行符号化处理，获得符号化的误差；

将获得的符号化的误差与所述随机二值化后的激活函数的导数相乘，得到所述本层网络的误差信息；

其中，所述本层网络的误差信息的取值为-1、0或1。

在一种实现方式中，所述根据所述本层网络的误差信息和上一层网络产生的随机二值化输出对本层网络进行训练，包括：

根据所述本层网络的误差信息和所述上一层网络产生的随机二值化输出，计算得到网络整体输出误差函数相对于所述本层网络中权重变化的梯度；

根据所述权重变化的梯度和梯度下降算法调整权重。

在一种实现方式中，还包括：

对正向传播的每层网络节点信息以确定性的方式获得取值为0或1的二值化数值；

将获取的二值化数值逐层正向传输到所述神经网络的最后一层，获得所述神经网络的推理结果。

在一种实现方式中，还包括：

进行多次重复随机二值化的正向传播过程，并根据多次推理结果的投票结果获得所述神经网络的最终推理结果。

第二方面，本发明提供一种神经网络训练及推理装置，包括：

正向信息随机二值化模块，用于根据激活函数对正向传播的网络节点信息进行映射处理，并根据映射后的数值进行伯努利过程采样，得到本层网络产生的随机二值化数值，将得到的随机二值化数值作为下一层网络的输入；

导数信息随机二值化模块，用于对所述激活函数的导数进行伯努利过程采样，得到随机二值化后的激活函数的导数；

误差符号化处理模块，用于对所述下一层网络的反向传播的误差进行符号化处理，并根据符号化处理后的值和所述随机二值化后的激活函数的导数计算所述本层网络的误差信息；

训练模块，用于根据所述本层网络的误差信息和上一层网络产生的随机二值化输出对本层网络进行训练；

推理模块，用于根据逐层传播的随机二值化数值进行神经网络的推理。

第三方面，本发明提供一种终端，包括：处理器以及存储器，所述存储器存储有神经网络训练及推理程序，所述神经网络训练及推理程序被所述处理器执行时用于实现如第一方面所述的神经网络训练及推理方法的操作。

第四方面，本发明还提供一种存储介质，所述存储介质为计算机可读存储介质，所述存储介质存储有神经网络训练及推理程序，所述神经网络训练及推理程序被处理器执行时用于实现如第一方面所述的神经网络训练及推理方法的操作。

第五方面，本发明还提供一种设备，包括：电路模块，所述电路模块用于实现如第一方面所述的神经网络训练及推理方法的操作。

本发明采用上述技术方案具有以下效果：

本发明在神经网络信息的正向传播过程中，通过映射处理及伯努利过程采样，使得每层输入变为二值化状态，大幅度降低了信息正向传播的算力需求；并且，在神经网络训练过程中，将每个网络节点的导数信息存储到特定的记忆单元中，使得需要存储的网络节点导数信息由高精度数值转变为二进制数值，大幅度降低了神经网络训练过程中的存储需求；以及在误差反向传播过程中，将每个网络节点的误差信息由高精度数值转变为符号化数值状态，大幅度降低了误差反向传播的算力需求；本发明在减少算力需求的情况下提高了神经网络的识别精度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图示出的结构获得其他的附图。

图1是本发明的一种实现方式中神经网络训练及推理方法的流程图。

图2是本发明的一种实现方式中神经网络训练过程中采用技术要素一、技术要素二以及技术要素三的示意图。

图3是本发明的一种实现方式中神经网络正向传播的挤压函数的示意图。

图4是本发明的一种实现方式中神经网络推理过程中采用技术要素四的两种等效方法示意图。

图5是本发明的一种实现方式中神经网络推理过程中采用技术要素五的流程图。

图6是本发明的一种实现方式中不同全周期组合技术方案的实施效果对比示意图。

图7是本发明的一种实现方式中终端的功能原理图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚、明确，以下参照附图并举实施例对本发明进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

示例性方法

针对上述技术问题，本实施例中提供了一种神经网络训练及推理方法，本实施例在神经网络信息的正向传播过程中，通过映射处理及伯努利过程采样，使得每层输入变为二值化状态，大幅度降低了信息正向传播的算力需求；并且，在神经网络训练过程中，将每个网络节点的导数信息存储到特定的记忆单元中，使得需要存储的网络节点导数信息由高精度数值转变为二进制数值，大幅度降低了神经网络训练过程中的存储需求；以及，在误差反向传播过程中，将每个网络节点的误差信息由高精度数值转变为符号化数值状态，大幅度降低了误差反向传播的算力需求；本实施例在减少算力需求的情况下提高了神经网络的识别精度。

如图1所示，本发明实施例提供一种神经网络训练及推理方法，包括以下步骤：

步骤S100，根据激活函数对正向传播的网络节点信息进行映射处理，并根据映射后的数值进行伯努利过程采样，得到本层网络产生的随机二值化数值，将得到的随机二值化数值作为下一层网络的输入。

在本实施例中，该神经网络训练及推理方法应用于终端上，该终端包括但不限于：计算机、计算机板卡、专用集成电路等设备；所述终端设置有基于神经网络训练及推理框架。

在本实施例中，采用随机二值化的信号进行正向传播和符号化的误差进行反向传播的神经网络，主要包含以下三个可应用于神经网络训练的技术要素：

技术要素一：对正向传播的网络节点信息，首先通过激活函数将其映射成0至1之间的数值，随后以此数值进行伯努利过程采样，获得二值化的随机状态，作为下一层网络的输入。

技术要素二：对激活函数的导数进行伯努利过程采样，获得二值化的随机状态，用于误差反向传播过程。

技术要素三：对反向传播的误差进行符号化处理，获得取值仅能为-1，0或1的符号化状态。

本实施例中的上述三个技术要素的独立应用或组合应用，有效降低了信息正向传播和误差反向传播过程中对算力的需求，同时，确保了训练结果的高准确度。

在本实施例中，主要还包含以下两个可应用于神经网络推理过程的技术要素：

技术要素四：对正向传播的网络节点信息，以确定性的方式获得取值为0或1的二值化状态，作为下一层网络的输入。

技术要素五：采用技术要素一中的随机二值化方法进行网络信息的正向传播，并采用多次正向传播后输出网络节点投票(Voting)的方式获得最终推理结果。

在本实施例中，采用技术要素四可大幅提高神经网络推理的计算效率并降低推理延迟，但是会造成推理准确度的下降。采用技术要素五，神经网络的推理过程随正向传播次数的增加而逐渐升高，可实现推理过程中计算资源消耗与推理准确度的平衡取舍。

单独应用技术要素一或技术要素四是既有技术方案。技术要素二、技术要素三和技术要素五为本实施例中所采用的技术要素。本实施例中同时提出组合应用技术要素一、技术要素二、技术要素三以及技术要素四或技术要素五的技术方案。在实施过程中，技术要素一、技术要素二、技术要素三可单独或组合应用，取代传统高精度计算模式，形成8种神经网络训练的组合技术方案；技术要素四和技术要素五与传统高精度推理过程形成3种神经网络推理的技术方案。

上述8种神经网络训练和3种神经网络推理方案组合，可形成24种神经网络全周期技术方案。传统高精度神经网络训练和推理方案、单独应用技术要素一的既有技术方案以及单独应用技术要素四的既有技术方案，是本实施例中的24种组合技术方案的特例。

在本实施例的一种实现方式中，包含三个可应用于神经网络训练的技术要素和两个可应用于神经网络推理过程的技术要素。这些技术要素相互组合，形成用于实现神经网络训练和推理的新技术方案。其中神经网络的训练，涉及技术要素一、技术要素二和技术要素三。下面对这三个技术要素进行详细说明。

在本实施例中，在神经网络训练的过程中，在实施技术要素一时，需要将正向传播信息进行映射处理和随机二值化处理，以减小正向传播过程的算力。

具体地，在本实施例的一种实现方式中，步骤S100之前包括以下步骤：

步骤S101a，获取上一层网络中连接到所述本层网络的各节点的输出信息，得到所有连接所述本层网络的节点的输入；

步骤S101b，将所有连接所述本层网络的节点的输入与对应的权重进行相乘，并将得到的所有乘积进行求和，得到所述本层网络的节点的输入信息。

在本实施例中，本层网络的节点的输入为上一层网络的经过随机二值化处理后的输出，即上一层网络的输出为经过本实施例中所述的方法进行了随机二值化处理。

如图2中101所示，在信息正向传播时，前一层网络节点的输出作为本层网络的输入，输入信息用

表示(104)。本层网络节点j的输入信息可表述为：

其中，

是前一层网络中连接到本层网络节点j(106)的第i个节点输出信息，上角标b表示前一层网络的输出信息已经按照本方法进行了随机二值化处理；w _ij为连接前一层网络中第i个网络节点和本层网络节点j的权重(105)；上式对所有连接到本层网络节点j的输入和权重的乘积进行求和。

具体地，在本实施例的一种实现方式中，步骤S100包括以下步骤：

步骤S101，根据所述激活函数对所述本层网络的输入信息进行映射处理，将所述本层网络的输入信息映射成0至1之间的数值；

步骤S102，以映射得到的数值为概率进行伯努利过程采样，获得对应的随机二值化网络节点的输出结果；其中，所述输出结果为所述本层网络产生的随机二值化数值；

步骤S103，将获得的随机二值化网络节点的输出结果作为所述下一层网络的输入。

在本实施例中，获得网络节点j的输入信息y _j后，可以采用激活函数(107)对其作用，获得结果z _j(108)：

z _j＝f(y _j)

其中，函数f(u)应为输出范围为0到1之间、单调递增的函数。

在本实施例中，这类函数又称挤压函数(SquashingFunction)：当输入值较小时，输出应接近0或等于0；当输入值较大时，输出应接近1或等于1；当输入值从较小的数值逐渐增加到较大的数值时，输出从0到1单调增加。

符合这些要求的典型挤压函数如图3所示，包括：

Logistic函数：

误差函数：

剪切式整流线性单元(ClippedReLU)函数：f(u)＝min(max(0,au),1)；

对称剪切式整流线性单元函数：

等，其中a为大于0的常数。

随后，本实施例中以z _j的数值作为概率进行伯努利过程采样(109)，获得随机二值化网络节点输出结果

(110)：

取值为1的概率为z _j；否则

取值为0

其中，

中上角标b表示输出结果信息已进行了随机二值化处理，即它的数值只能取0或1。采样结果

作为后一层神经网络的输入。

值得注意的是，当挤压函数的常数a趋于无穷大时，挤压函数变为阶跃函数，代表概率的z _j取值仅为0或1，随机二值化采样过程转变为确定性的二值化操作。因此，确定性二值化可以看做是随机二值化的特殊情况。

如图1所示，在本发明实施例的一种实现方式中，神经网络训练及推理方法还包括以下步骤：

步骤S200，对所述激活函数的导数进行伯努利过程采样，得到随机二值化后的激活函数的导数。

在本实施例中，在神经网络训练的过程中，在实施技术要素二时，需要将激活函数导数进行随机二值化处理，以将每个网络节点的导数信息存储到特定的记忆单元中，使得需要存储的网络节点导数信息由高精度数值转变为二进制数值，大幅度降低了神经网络训练过程中的存储需求。

具体地，在本实施例的一种实现方式中，步骤S200包括以下步骤：

步骤S201，获取所述激活函数的导数；

步骤S202，以获得的导数为概率进行伯努利过程采样，获得对应的随机二值化网络节点的输出结果；

步骤S203，将获得的随机二值化网络节点的输出结果作为反向传播过程的误差信息计算值。

在本实施例中，如图2中102所示，在信息正向传播的同时，可以获得激活函数的导数(Derivative)信息(111、112)：

随后，本实施例中以

的数值作为概率进行伯努利过程采样(113)，获得随机二值化网络节点输出结果

(114)：

取值为1的概率为

否则

取值为0

其中，

将用于误差反向传播过程。

原则上，本实施例中应选取导数取值范围为0到1之间的激活函数，以获得有效的导数采样结果；实践中发现，对激活函数的导数的幅值进行等比例地缩放或近似化处理，仅影响神经网络的收敛速度，不会影响神经网络最终训练结果。

具体地，在本实施例的一种实现方式中，步骤S202之前包括以下步骤：

步骤S202a，对所述激活函数的导数的幅值进行等比例缩放或近似化处理。

在本实施例中，当采用Logistic函数，设定常数a＝1时，激活函数为

它的导数取值区间为0到0.25。本实施例中有两种处理方式可供选择：(i)以此数值作为概率进行伯努利过程采样；(ii)将导数数值乘以4后作为概率进行伯努利过程采样。

当采用Logistic函数，设定常数a＝4时，激活函数为

它的导数取值区间为0到1。本实施例中不需要对其进行处理，可直接以此数值作为概率进行伯努利过程采样。

当采用Logistic函数，设定常数a＝8时，激活函数为

它的导数取值区间为0到2。本实施例中有两种处理方式可供选择：(i)将导数数值除以2后作为概率进行伯努利过程采样；(ii)将数值大于1的导数赋值为1，其他导数数值不变，然后进行伯努利过程采样。

当采用剪切式整流线性单元(Clipped ReLU)函数，设定常数a＝1时，它的导数取值仅可为0或1。导数的伯努利过程采样过程退化为确定性的二值化过程。

当采用剪切式整流线性单元(Clipped ReLU)函数，设定常数a＝2时，它的导数取值仅可为0或0.5。本实施例中有两种处理方式可供选择：(i)以此数值作为概率进行伯努利过程采样；(ii)将导数数值乘以2后作为概率进行伯努利过程采样过程(退化为确定性的二值化过程)。

当采用剪切式整流线性单元(ClippedReLU)函数，设定常数

时，它的导数取值仅可为0或2。本实施例中可以将数值除以2后，进行伯努利过程采样过程(退化为确定性的二值化过程)。

当采用Logistic函数作为正向传播的激活函数时，它的导数可以用剪切式整流线性单元(Clipped ReLU)函数来近似，并采用确定性二值化的方法获得用于误差反向传播过程的二值化导数信息。

步骤S300，对所述下一层网络的反向传播的误差进行符号化处理，并根据符号化处理后的值和所述随机二值化后的激活函数的导数计算所述本层网络的误差信息。

在本实施例中，在神经网络训练的过程中，在实施技术要素三时，需要将反向传播误差进行符号化处理，从而可以将每个网络节点的误差信息由高精度数值转变为符号化数值状态，大幅度降低了误差反向传播的算力需求。

具体地，在本实施例的一种实现方式中，步骤S300包括以下步骤：

步骤S301，对所述下一层网络的反向传播的误差进行符号化处理，获得符号化的误差；

步骤S302，将获得的符号化的误差与所述随机二值化后的激活函数的导数相乘，得到所述本层网络的误差信息。

在本实施例中，反向传播的误差进行符号化处理是指，反向传播的误差的取值为-1、0或1；如图2中103所示，在误差(Error)反向传播时，本实施例中对后一层反向传回的误差δz _j(115)进行符号化(Sign)处理(116)，获得符号化的误差(SignedError)

(117)：

当δz _j≥0时，

当δz _j<0时，

的上角标s表示误差信息已进行了符号化处理，其取值只能为-1或1。符号化的误差与随机二值化的激活函数的导数相乘(118)，获得本网络节点的误差信息

(119)：

表示此网络节点的误差信息为符号化信息，取值仅能为-1、0或1。符号化的误差将继续沿神经网络反向传播(119、105、120)。前一层神经网络中节点i的误差由连接到它的所有本层节点的误差与权重的乘积的和组成：

误差信息反向传输到本层后，结合正向传播过程中产生的二值化的节点状态信息，可以获得网络整体输出误差函数相对于本层神经网络中权重(105)变化的梯度，从而可以利用梯度下降算法，调整权重，完成一次神经网络训练。

步骤S400，根据所述本层网络的误差信息和上一层网络产生的随机二值化输出对本层网络进行训练。

在本实施例中，在神经网络训练中，可以独立地或组合地采用上述三种技术要素。上述三个技术要素对应神经网络训练的三个不可或缺的过程：信息的正向传播、激活函数导数的计算、误差的反向传播。其中的每个过程都可选择采用传统高精度计算模式或采用上述技术要素进行替代，形成2x2x2＝8种组合技术方案。

具体地，在本实施例的一种实现方式中，步骤S400包括以下步骤：

步骤S401，根据所述本层网络的误差信息和所述上一层网络产生的随机二值化输出，计算得到网络整体输出误差函数相对于所述本层网络中权重变化的梯度；

步骤S402，根据所述权重变化的梯度和梯度下降算法调整权重。

在本实施例中，在神经网络训练中，技术方案包括：

训练技术方案一：上述三种技术要素都不采用的情况，即全部采用高精度计算模式的情况，是传统神经网络的训练方法。

训练技术方案二：仅采用技术要素二，神经网络中正向传播的信息和反向传播的误差采用高精度数值。

训练技术方案三：仅采用技术要素三，神经网络中正向传播的信息和激活函数的导数采用高精度数值。

训练技术方案四：采用技术要素二和技术要素三，神经网络中正向传播的信息采用高精度数值。

训练技术方案五：仅采用技术要素一，神经网络中激活函数导数和反向传播的误差采用高精度数值，是现有二值化神经网络的计算方法。

训练技术方案六：采用技术要素一和技术要素二，神经网络中反向传播的误差采用高精度数值。

训练技术方案七：采用技术要素一和技术要素三，神经网络中激活函数的导数采用高精度数值。

训练技术方案八：采用技术要素一、技术要素二和技术要素三，神经网络中的所有节点信息无高精度数值。

在本实施例中，经过上述8种训练技术方案，即可得到训练后的神经网络，进而在实践过程中可以利用训练后的神经网络进行推理；其中，基于训练后的神经网络进行推理过程可以是传统的高精度推理过程，也可以是采用技术要素四和技术要素五的神经网络推理的技术方案。

步骤S500，根据逐层传播的随机二值化数值进行神经网络的推理。

神经网络训练完成后，神经网络的推理可采用传统高精度计算模式。为降低推理过程中的算力消耗，神经网络的推理过程也需要进行二值化处理。由于神经网络的推理过程与神经网络训练过程中的信息正向传播过程相同，可直接应用技术要素一实现随机二值化的神经网络推理。但是，由于随机性的存在以及二值化过程中信息的丢失，神经网络推理的准确度下降。可在推理过程中，选用下列技术要素四或技术要素五，以提高推理准确度：

具体地，在本发明实施例的一种实现方式中，神经网络推理方法还包括以下步骤：

步骤S601，对正向传播的网络节点信息以确定性的方式获得取值为0或1的二值化数值；

步骤S602，将获取的二值化数值传输到所述神经网络的最后一层，获得所述神经网络的推理结果。

在本实施例中，在神经网络推理的过程中，在实施技术要素四时，需要基于确定性二值化网络进行推理；在信息正向传播过程中，本实施例中不再以激活函数的输出数值作为概率进行采样，而是进行确定性的二值化处理，获得二值化网络节点输出结果(如图4所示的201、202)：

如果z _j≥0.5,则

否则

等效地，本实施例中可以省略掉激活函数，直接从本层网络节点j的输入信息y _j中获得二值化网络节点输出(如图4所示的203、204)：

如果z _j≥0,则

否则

二值化结果

作为后一层神经网络的输入。最终二值化信息传输到最后一层，获得神经网络的推理结果。

步骤S701，进行多次重复随机二值化的正向传播过程，并根据多次推理结果的投票结果获得所述神经网络的最终推理结果。

在本实施例中，在神经网络推理的过程中，在实施技术要素五时，需要基于重复式随机二值化网络结果进行推理：可多次重复随机二值化的正向传播过程，通过多次推理结果投票的形式获得最终推理结果(如图5所示)。不断增加随机二值化的正向传播推理过程的重复次数，可使推理准确度不断提高。

因此，在神经网络推理过程中，上述两种技术要素使我们有三种推理技术方案可供选择。

推理技术方案一：采用高精度正向传播进行神经网络推理(传统方案)。

推理技术方案二：采用技术要素四，即确定性二值化方法，进行神经网络推理(既有技术方案)。

推理技术方案三：采用技术要素五，即重复式随机二值化方法，进行神经网络推理。

在神经网络的全周期(即训练和推理)的应用过程中，上述8种训练技术方案和3种推理技术方案可相互组合，形成24种神经网络全周期技术方案。其中，采用训练技术方案一和推理技术方案一是传统高精度神经网络训练和推理方法。现有的神经网络量化或二值化方法，仅采用技术要素一或技术要素四，形成训练技术方案五和推理技术方案二的组合。

以下以多层感知器(Multi-layer perceptron,MLP)神经网络学习和识别手写数字的应用作为实例，展示上述技术要素和技术方案的实施方式和效果。

采用【784-500-200-10】结构的全连接的多层神经网络，对MNIST手写数字集进行学习和识别。MNIST手写数字集包括由60000个手写数字图像组成的训练集和10000个手写数字图像组成的测试集组成。训练集中的图像用于神经网络的训练(或学习)；测试集中的数据用于测试神经网络的识别精度(推理精度)。MNIST中每个数字图像由32x32像素点组成，对应神经网络第一层的784个输入节点；神经网络的最后一层的10个输出节点对应数字图像的10个分类(0,1，…,9)。神经网络训练还遵循下列设定：

(1)采用固定学习速率η＝0.1。

(2)采用小批量(Mini Batch)训练模式，训练集中的60000个样本图像划分为600个批次，每批次训练样本为100个。每批次中100个样本所获得的梯度的平均值用作权重更新。

(3)对训练集中的所有样本完成一次学习，为一个训练周期。每一个训练周期完成后，对测试集中的10000个样本图像按照推理技术方案一进行推理，获得识别精度(或推理错误率)。

(4)隐藏层采用参数a＝4的Logistic函数作为激活函数。

(5)输出层采用Softmax函数作为激活函数，采用Cross Entropy作为输出误差的目标函数。

从实施效果对比来看，采用正向传播的信息二值化(技术要素一)的训练方案(方案五至方案八)普遍优于采用高精度模式的信息正向传播的训练方案(方案一至方案四)。采用技术要素二、技术要素三的技术方案与没有采用技术要素二、技术要素三的技术方案相比，训练结果差别较小。

本实施例中列出了四种不同训练技术方案下三种不同推理技术方案的推理错误率结果。在单次推理情况下，推理方案一优于推理方案二，推理方案二优于推理方案三。推理方案一和推理方案二是确定性的推理过程，多次重复推理不会提高推理效果。推理方案三为随机性推理过程，增加推理过程的重复次数会不断提升推理效果；推理效果在几次重复推理后优于推理技术方案二的效果，并逼近或超越推理技术方案一的效果。

如图6所示，从不同训练方案和不同推理方案的组合效果来看，引入技术要素一、技术要素二、技术要素三的训练方案，在训练完成后不同推理效果普遍优于未引入技术要素一、技术要素二、技术要素三的训练方案。

本实施例仅作为应用本发明所提出的技术方案的示例性说明，不能作为本发明应用于神经网络训练和推理过程中的限制。

本发明所提出的技术方案可应用于卷积神经网络(convolutional neural network)、长短时记忆(long short-term memory)神经网络、反馈式神经网络(recurrent neural network)、强化学习(Reinforcement Learning)网络等多种采用误差反向传播和梯度下降算法作为基础算法的神经网络。这些神经网络可用于多种不同的应用场景，如图像识别、语音识别、自然语言处理、人机对弈、自动驾驶等多种应用场景。

本实施例通过上述技术方案达到以下技术效果：

本实施例在神经网络信息的正向传播过程中，技术要素一使得每层输入变为二值化状态，网络层的输入与权重的乘积运算由两个高精度数值的乘积变为取值为0或1的数值与另一个高精度数值的相乘，大幅度降低了信息正向传播的算力需求。另外，在神经网络的训练过程中，需要存储正向传播过程中每层网络的输入状态，用于误差反向传播到本层后权重梯度的计算。采用技术要素一，使得需要存储的网络节点状态由高精度数值转变为二进制数值，大幅度降低了神经网络训练过程中的存储需求。

本实施例在神经网络训练过程中，每个网络节点的导数信息也需要存储到特定的记忆单元中，用于误差反向传播过程。采用技术要素二，使得需要存储的网络节点导数信息由高精度数值转变为二进制数值，大幅度降低了神经网络训练过程中的存储需求。

本实施例在误差反向传播过程中，采用技术要素二和技术要素三，使得每个网络节点的误差信息由高精度数值转变为符号化数值状态，仅取值为-1,0或1。误差与权重的乘积运算由两个高精度数值的乘积变为取值为-1,0或1的数值与另一个高精度数值的相乘，大幅度降低了误差反向传播的算力需求。

本实施例中同时采用技术要素一、技术要素二、技术要素三，使得权重梯度的计算由两个高精度数值的乘积变为取值0或1的数值和取值-1,0或1的数值的乘积，降低了权重更新过程对算力的需求。并且，权重梯度的数值只能取值为-1,0或1,使权重的数值以确定的单位变化，利于权重的量化处理。神经网络的权重可以完全以固定点数型数值或整数型数值来描述。

通过采用本实施例中的技术方案，当利用忆阻器阵列实现神经网络加速时，技术要素一、技术要素二、技术要素三、技术要素四、技术要素五将有效降低忆阻器阵列外围电路的复杂度，有效降低硬件加速神经网络运算的所需的成本和功耗。

示例性设备

基于上述实施例，本发明还提供一种神经网络训练及推理装置，包括：

基于上述实施例，本发明还提供一种终端，其原理框图可以如图7所示。

该终端包括：通过系统总线连接的处理器、存储器、接口、显示屏以及通讯模块；其中，该终端的处理器用于提供计算和控制能力；该终端的存储器包括存储介质以及内存储器；该存储介质存储有操作系统和计算机程序；该内存储器为存储介质中的操作系统和计算机程序的运行提供环境；该接口用于连接外部设备，例如，移动终端以及计算机等设备；该显示屏用于显示相应的信息；该通讯模块用于与云端服务器或移动终端进行通讯。

该计算机程序被处理器执行时用以实现一种神经网络训练及推理方法的操作。

本领域技术人员可以理解的是，图7中示出的原理框图，仅仅是与本发明方案相关的部分结构的框图，并不构成对本发明方案所应用于其上的终端的限定，具体的终端可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种终端，其中，包括：处理器和存储器，存储器存储有神经网络训练及推理程序，神经网络训练及推理程序被处理器执行时用于实现如上的神经网络训练及推理方法的操作。

在一个实施例中，提供了一种存储介质，其中，存储介质存储有神经网络训练及推理程序，神经网络训练及推理程序被处理器执行时用于实现如上的神经网络训练及推理方法的操作。

在一个实施例中，提供了一种设备，包括：电路模块，所述电路模块用于实现如上的神经网络训练及推理方法的操作。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，计算机程序可存储于一非易失性存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本发明所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。

综上，本发明提供了一种神经网络训练及推理方法、装置、终端及存储介质，方法包括：根据激活函数对正向传播的网络节点信息进行映射处理，并根据映射后的数值进行伯努利过程采样，得到本层网络产生的随机二值化数值，将得到的随机二值化数值作为下一层网络的输入；对激活函数的导数进行伯努利过程采样，得到随机二值化后的激活函数的导数；对下一层网络的反向传播的误差进行符号化处理，并根据符号化处理后的值和随机二值化后的激活函数的导数计算本层网络的误差信息；根据本层网络的误差信息和上一层网络产生的随机二值化输出对本层网络进行训练；根据逐层传播的随机二值化数值进行神经网络的推理。本发明采用随机二值化的信号进行正向传播和符号化的误差进行反向传播的神经网络，降低计算资源且提高了识别精度。

应当理解的是，本发明的应用不限于上述的举例，对本领域普通技术人员来说，可以根据上述说明加以改进或变换，所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims

一种神经网络训练及推理方法，其特征在于，包括：

根据激活函数对正向传播的网络节点信息进行映射处理，并根据映射后的数值进行伯努利过程采样，得到本层网络产生的随机二值化数值，将得到的随机二值化数值作为下一层网络的输入；

对所述激活函数的导数进行伯努利过程采样，得到随机二值化后的激活函数的导数；

对所述下一层网络的反向传播的误差进行符号化处理，并根据符号化处理后的值和所述随机二值化后的激活函数的导数计算所述本层网络的误差信息；

根据所述本层网络的误差信息和上一层网络产生的随机二值化输出对本层网络进行训练；

根据逐层传播的随机二值化数值进行神经网络的推理。
根据权利要求1所述的神经网络训练及推理方法，其特征在于，所述根据激活函数对正向传播的网络节点信息进行映射处理，之前包括：

获取上一层网络中连接到所述本层网络的各节点的输出信息，得到所有连接所述本层网络的节点的输入；其中，所述本层网络的节点的输入为所述上一层网络的经过随机二值化处理后的输出；

将所有连接所述本层网络的节点的输入与对应的权重进行相乘，并将得到的所有乘积进行求和，得到所述本层网络的节点的输入信息。
根据权利要求1所述的神经网络训练及推理方法，其特征在于，所述根据激活函数对正向传播的网络节点信息进行映射处理，并根据映射后的数值进行伯努利过程采样，得到本层网络产生的随机二值化数值，将得到的随机二值化数值作为下一层网络的输入，包括：

根据所述激活函数对所述本层网络的输入信息进行映射处理，将所述本层网络的输入信息映射成0至1之间的数值；

以映射得到的数值为概率进行伯努利过程采样，获得对应的随机二值化网络节点的输出结果；其中，所述输出结果为所述本层网络产生的随机二值化数值；

将获得的随机二值化网络节点的输出结果作为所述下一层网络的输入。
根据权利要求1所述的神经网络训练及推理方法，其特征在于，所述激活函数为挤压函数，包括：Logistic函数、误差函数、剪切式整流线性单元函数以及对称剪切式整流线性单元函数中的一种或组合。
根据权利要求1所述的神经网络训练及推理方法，其特征在于，所述对所述激活函数的导数进行伯努利过程采样，得到随机二值化后的激活函数的导数，包括：

获取所述激活函数的导数；

以获得的导数为概率进行伯努利过程采样，获得对应的随机二值化网络节点的输出结果；

将获得的随机二值化网络节点的输出结果作为反向传播过程的误差信息计算值。
根据权利要求5所述的神经网络训练及推理方法，其特征在于，所述以获得的导数为概率进行伯努利过程采样，获得对应的随机二值化网络节点的输出结果，之前包括：

对所述激活函数的导数的幅值进行等比例缩放或近似化处理。
根据权利要求1所述的神经网络训练及推理方法，其特征在于，所述对所述下一层网络的反向传播的误差进行符号化处理，并根据符号化处理后的值和所述随机二值化后的激活函数的导数计算所述本层网络的误差信息，包括：

对所述下一层网络的反向传播的误差进行符号化处理，获得符号化的误差；

将获得的符号化的误差与所述随机二值化后的激活函数的导数相乘，得到所述本层网络的误差信息；

其中，所述本层网络的误差信息的取值为-1、0或1。
根据权利要求1所述的神经网络训练及推理方法，其特征在于，所述根据所述本层网络的误差信息和上一层网络产生的随机二值化输出对本层网络进行训练，包括：

根据所述本层网络的误差信息和所述上一层网络产生的随机二值化输出，计算得到网络整体输出误差函数相对于所述本层网络中权重变化的梯度；

根据所述权重变化的梯度和梯度下降算法调整权重。
根据权利要求1所述的神经网络训练及推理方法，其特征在于，还包括：

对正向传播的每层网络节点信息以确定性的方式获得取值为0或1的二值化数值；

将获取的二值化数值逐层正向传输到所述神经网络的最后一层，获得所述神经网络的推理结果。
根据权利要求1所述的神经网络训练及推理方法，其特征在于，还包括：

进行多次重复随机二值化的正向传播过程，并根据多次推理结果的投票结果获得所述神经网络的最终推理结果。
一种神经网络训练及推理装置，其特征在于，包括：

正向信息随机二值化模块，用于根据激活函数对正向传播的网络节点信息进行映射处理，并根据映射后的数值进行伯努利过程采样，得到本层网络产生的随机二值化数值，将得到的随机二值化数值作为下一层网络的输入；

导数信息随机二值化模块，用于对所述激活函数的导数进行伯努利过程采样，得到随机二值化后的激活函数的导数；

误差符号化处理模块，用于对所述下一层网络的反向传播的误差进行符号化处理，并根据符号化处理后的值和所述随机二值化后的激活函数的导数计算所述本层网络的误差信息；

训练模块，用于根据所述本层网络的误差信息和上一层网络产生的随机二值化输出对本层网络进行训练；

推理模块，用于根据逐层传播的随机二值化数值进行神经网络的推理。
一种终端，其特征在于，包括：处理器以及存储器，所述存储器存储有神经网络训练及推理程序，所述神经网络训练及推理程序被所述处理器执行时用于实现如权利要求1-10中任意一项所述的神经网络训练及推理方法的操作。
一种存储介质，其特征在于，所述存储介质为计算机可读存储介质，所述存储介质存储有神经网络训练及推理程序，所述神经网络训练及推理程序被处理器执行时用于实现如权利要求1-10中任意一项所述的神经网络训练及推理方法的操作。
一种设备，其特征在于，包括：电路模块，所述电路模块用于实现如权利要求1-10中任意一项所述的神经网络训练及推理方法的操作。