WO2021051556A1

WO2021051556A1 - 深度学习权值更新方法、系统、计算机设备及存储介质

Info

Publication number: WO2021051556A1
Application number: PCT/CN2019/117553
Authority: WO
Inventors: 王健宗
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-09-16
Filing date: 2019-11-12
Publication date: 2021-03-25
Also published as: CN110782030A

Abstract

一种基于参数重写的深度学习权值更新方法，包括步骤：根据多个神经元输出函数构建深度神经网络模型（S100）；对所述深度神经网络模型中的各个权值向量进行参数更新以得到更新后的各个权值向量（S102）；将训练样本输入至神经网络模型中，并从所述深度神经网络模型中获取计算输出（S104）；根据所述计算输出对所述各个权值向量进行更新（S106），能够对权值参数进行重写，避免了批量归一化对样本数量的限制的问题，同时，还提高了神经网络的收敛速度，加快了神经网络的训练过程。

Description

深度学习权值更新方法、系统、计算机设备及存储介质

本申请申明2019年09月16日递交的申请号为201910872174.X、名称为“深度学习权值更新方法、系统、计算机设备及存储介质”的中国专利申请的优先权，该中国专利申请的整体内容以参考的方式结合在本申请中。

技术领域

本申请实施例涉及人工神经网络领域，尤其涉及一种深度学习权值更新方法、系统、计算机设备及非易失性计算机可读存储介质。

背景技术

批量归一化是在对神经网络模型进行训练时常用的样本特征归一化方法，就是对样本数据进行减均值除方差，使得数据的分布优化，加快神经网络的训练速度。但是批量归一化对训练样本的数量有限制，当样本数量为1时，批量归一化就起不了作用。

发明人发现，使用批量归一化需要保存每个时间步长下，小批量的均值和方差，效率低且占内存，一定程度上会拖慢神经网络的收敛速度。

故，本申请旨在解决批量归一化对样本的限制和神经网络收敛速度慢的问题。

发明内容

有鉴于此，本申请实施例的目的是提供一种基于参数重写的深度学习权值更新方法、系统、计算机设备及非易失性计算机可读存储介质，能够不受批量归一化对样本数量的限制问题，加快神经网络模型的收敛速度。

为实现上述目的，本申请实施例提供了一种深度学习权值更新方法，所述方法包括：

根据多个神经元输出函数构建深度神经网络模型，其中，每个所述神经元的输出函数为y＝φ(WX+b)，其中y表示相应神经元的输出值，φ表示一个激励函数，X表示多维输入特征，W表示一个权值向量，b表示所述相应神经元的偏差标量；

对所述深度神经网络模型中的各个权值向量进行参数更新以得到更新后的各个权值向量，其中，用于参数更新的更新公式为：

其中，W _n表示相应神经元更新后的权值向量，v表示W _n的单位向量，g表示W _n的标量，所述g＝||W _n||，v _n-1表示对所述深度神经网络模型第n-1次训练时的所述各个权值向量的单位向量；

将训练样本输入至所述深度神经网络模型中，并从所述深度神经网络模型中获取计算输出；

根据所述计算输出对所述各个权值向量进行更新。

为了实现上述目的，本申请实施例还提供一种深度学习权值更新系统，包括：

构建模块，用于根据多个神经元输出函数构建深度神经网络模型，其中，每个所述神经元的输出函数为y＝φ(WX+b)，其中y表示相应神经元的输出值，φ表示一个激励函数，X表示多维输入特征，W表示一个权值向量，b表示所述相应神经元的偏差标量；

参数更新模块，用于对所述深度神经网络模型中的各个权值向量进行参数更新以得到更新后的各个权值向量，其中，用于参数更新的更新公式为：

训练模块，用于将训练样本输入至所述深度神经网络模型中，并从所述深度神经网络模型中获取计算输出；

更新模块，用于根据所述计算输出对所述各个权值向量进行更新。

为了实现上述目的，本申请实施例还提供一种计算机设备，所述计算机设备包括存储器、处理器以及存储在所述存储器上并可在处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现以下步骤：

根据所述计算输出对所述各个权值向量进行更新。

为了实现上述目的，本申请实施例还提供一种非易失性计算机可读存储介质，所述非易失性计算机可读存储介质内存储有计算机可读指令，所述计算机可读指令可被至少一个处理器所执行，以使所述至少一个处理器执行以下步骤:

根据所述计算输出对所述各个权值向量进行更新。

本申请实施例提供的深度学习权值更新方法、系统、计算机设备及非易失性计算机可读存储介质，基于参数重写对深度神经网络模型的权值进行更新，能够不受批量归一化对样本数量的限制问题，加快神经网络模型的收敛速度。

以下结合附图和具体实施例对本申请进行详细描述，但不作为对本申请的限定。

附图说明

图1为本申请实施例提供的深度学习权值更新方法的步骤流程图；

图2为本申请实施例提供的深度学习权值更新系统的程序模块示意图；

图3为本申请实施例提供的计算机设备的硬件结构示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本申请要求的保护范围之内。

以下实施例将以计算机设备2为执行主体进行示例性描述。

实施例一

请参阅图1，示出了本申请实施例一之深度学习权值更新方法的步骤流程图。可以理解，本方法实施例中的流程图不用于对执行步骤的顺序进行限定。下面以计算机设备为执行主体进行示例性描述，具体如下：

步骤S100，根据多个神经元输出函数构建深度神经网络模型。

具体的，每个神经元的输出函数为y＝φ(WX+b)，其中y表示所述神经元的输出值，φ表示一个激励函数，X表示多维输入特征，W表示一个权值向量，表示所述输入在所述神经元所占的权重，b表示所述神经元的偏差标量，当所述输入大于所述激励函数的阈值时，所述神经元才会产生输出。

常见地，一个神经网络由一个输入层、一个或多个隐藏层、一个输出层组成，所述深度神经网络隐藏层的层数大于或等于2。

在一较佳实施例中，根据多个神经元输出函数构建所述深度神经网络模型之前，对所述各个权值向量W和所述各个偏差标量b进行初始化，所述初始化指的是在预设值域内为所述各个权值向量W和所述各个偏置标量b随机取值。

步骤S102，对所述深度神经网络模型中的各个权值向量进行参数更新以得到更新后的各个权值向量。

具体的，用于参数更新的更新公式为：

其中，W _n表示相应神经元更新后的权值向量，v表示W _n的单位向量，g表示W _n的标量，所述g＝||W _n||，v _n-1表示对所述深度神经网络模型第n-1次训练时的所述各个权值向量的单位向量，

是单位向量v的初始值，同时

也是w _n的初始系数。在本实施例中，v ₀取初始化所述权值向量W时的v值。

步骤S104，将训练样本输入至所述深度神经网络模型中，并从所述深度神经网络模型中获取计算输出。

具体的，利用所述各个权值向量执行前向传播计算，获得计算输出。所述前向传播计算指的是所述训练样本经过所述深度神经网络模型一层一层地向前计算，然后由所述输出层输出计算输出。

在一较佳实施例中，根据所述计算输出对所述各个权值向量进行更新的步骤中，还将所述计算输出与预设的目标输出输入至预设的训练误差公式中以计算训练误差，所述训练误差公式为：

其中，W表示相应权值向量，J(W)表示训练误差，t _k表示第k次训练的目标输出，z _k表示第k次训练的计算输出，所述k为正整数，且所述k＝1，2…c。然后根据所述训练误差判断是否需要执行反向传播，当不需要执行所述反向传播时，将所述各个权值向量作为所述深度神经网络模型更新后的各个权值向量。示例性的，在第1次训练中，预设的目标输出为0.5，计算输出为0.4，则训练误差为

在另一较佳实施例中，根据所述训练误差判断是否需要执行反向传播之前，还将所述训练误差与预设期望值进行比较。如果所述训练误差大于所述预设期望值，则需要反向传播；如果所述训练误差不大于所述预设期望值，停止训练所述深度神经网络，并将所述各个权值向量作为所述深度神经网络模型更新后的各个权值向量。示例性的，在第1次训练中，训练误差为0.005，预设的期望值为0.1，经判断，训练误差不大于期望值，则停止训练所述深度神经网络，所述各个权值向量即为所述深度神经网络更新后的权值向量。

在另一较佳实施例中，如果所述训练误差大于所述预设期望值，则需要反向传播，并将所述各个权值向量根据权值更新公式进行更新，所述权值更新公式为：

其中，W(n)表示对所述深度神经网络模型第n次训练时的所述相应神经元的权值向量，W(n+1)表示对所述深度神经网络模型第n+1次训练时的所述相应神经元的权值向量，ΔW(n)表示对所述深度神经网络模型第n次训练时所述相应神经元的权值向量在梯度下降方向上的变化，η表示学习率，

表示所述相应神经元的权值向量的偏导函数。

需要说明的是，所述梯度下降方向指的是能使所述训练误差最快时间内小于所述期望值的训练方向。所述反向传播将所述训练误差返回到各层的各个神经元，并根据所述训练误差和所述各个神经元的权值对所述偏导函数求解，然后根据所述偏导函数的解更新所述各个权值向量。

在另一较佳实施例中，如果所述训练误差大于所述预设期望值，则需要反向传播，还可以根据所述向量v和所述标量g的变化值更新所述各个权值向量，其中，所述标量g在所述梯度下降方向上的变化值为：

其中

表示所述误差函数对所述参数g的偏导函数，

表示所述误差函数对所述权值W的偏导函数；所述向量v在所述梯度下降方向上的变化值为：

其中

表示所述误差函数对所述参数v的偏导。由于对所述权值W执行了参数重写，因此原本求权值W的变化可以转变成求参数v和g的变化。

示例性的，当执行所述反向传播计算时，通过对所述误差函数对所述参数g的偏导函数和所述误差函数对所述参数v的偏导函数进行求导，得到所述标量g的变化值和所述参数v的变化值。然后，用所述标量g的变化值和所述向量v的变化值更新标量g和向量v。最后，根据更新的标量g和向量v更新所述各个权值向量。

在另一较佳实施例中，当根据所述向量v和所述标量g的梯度更新所述各个权值向量之后，用所述各个权值向量继续训练所述深度神经网络模型，并获取相应的计算输出，然后将所述计算输出与目标输出根据所述训练误差公式重新计算对应的训练误差。当所述训练误差不大于所述预设期望值或者训练次数达到预设训练次数时，停止训练神经网络。

S106，根据所述计算输出对所述各个权值向量进行更新。

具体的，从所述深度神经网络模型中获取计算输出，然后根据所述计算输出对所述各个权值向量进行更新。

示例性的，利用深度神经网络对某一图像数据集中的蓝点和红点分类，当使用随机初始化时方法对权值向量进行取值时，需要从标准正态分布中取值赋予权值向量，然后用权值向量训练深度神经网络，得到的训练效果为：梯度下降速度为41.9968s，分类准确率为93％；当使用所述权值更新方法在深度神经网络的每一次迭代中对每个权值向量进行更新后，得到的训练效果为：梯度下降速度为40.8717s，比原来的梯度下降速度快了1.12秒，分类准确率为96％，比原来提高了3％。

本申请实施例基于参数重写对深度神经网络模型的权值进行更新，可以不受批量归一化对样本数量的限制问题，还可以加快神经网络模型的收敛速度。

实施例二

请继续参阅图2，示出了本申请实施例二之深度学习权值更新系统的程序模块示意图。在本实施例中，深度学习权值更新系统20可以包括或被分割成一个或多个程序模块，一个或者多个程序模块被存储于存储介质中，并由一个或多个处理器所执行，以完成本申请，并可实现上述深度学习权值更新方法。本申请实施例所称的程序模块是指能够完成特定功能的一系列计算机可读指令段。以下描述将具体介绍本实施例各程序模块的功能：

构建模块200，用于根据多个神经元输出函数构建深度神经网络模型。

具体的，每个所述神经元的输出函数为y＝φ(WX+b)，其中y表示所述神经元的输出值，φ是一个激励函数，X表示多维输入特征，W是一个权值向量，表示所述输入在所述神经元所占的权重，b表示所述神经元的偏差标量，当所述输入大于所述激励函数的阈值时，所述神经元才会产生输出。

参数更新模块202，用于对所述深度神经网络模型中的各个权值向量进行参数更新以得到更新后的各个权值向量。

具体的，用于参数更新的更新公式为：

是单位向量v的初始值，同时

训练模块204，用于将训练样本输入至所述深度神经网络模型中，并从所述深度神经网络模型中获取计算输出。

具体的，所述训练模块204利用所述各个权值向量执行前向传播计算，获得计算输出。所述前向传播计算指的是所述训练样本经过所述深度神经网络模型一层一层地向前计算，然后由所述输出层输出计算输出。

在一较佳实施例中，根据所述计算输出对所述各个权值向量进行更新的步骤中，所述训练模块204还将所述计算输出与预设的目标输出输入至预设的训练误差公式中以计算训练误差，所述训练误差公式为：

在另一较佳实施例中，根据所述训练误差判断是否需要执行反向传播之前，所述训练模块204还将所述训练误差与预设期望值进行比较。如果所述训练误差大于所述预设期望值，则需要反向传播；如果所述训练误差不大于所述预设期望值，停止训练所述深度神经网络，并将所述各个权值向量W作为所述深度神经网络模型更新后的权值向量。示例性的，在第1次训练中，训练误差为0.005，预设的期望值为0.1，经判断，训练误差不大于期望值，则停止训练所述深度神经网络，所述各个权值向量即为所述深度神经网络更新后的权值向量。

在另一较佳实施例中，如果所述训练误差大于所述预设期望值，则需要反向传播，所述训练模块204所述各个权值向量根据权值更新公式进行更新，所述权值更新公式为：

表示所述相应神经元的权值向量的偏导函数。

在另一较佳实施例中，如果所述训练误差大于所述预设期望值，则需要反向传播，所述训练模块204还可以根据所述向量v和所述标量g的变化值更新所述各个权值向量，其中，所述标量g在所述梯度下降方向上的变化值为：，其中

表示所述误差函数对所述参数g的偏导函数，

其中

示例性的，当执行所述反向传播计算时，所述训练模块204通过对所述误差函数对所述参数g的偏导函数和所述误差函数对所述参数v的偏导函数进行求导，得到所述标量g的变化值和所述参数v的变化值。然后，用所述标量g的变化值和所述向量v的变化值更新标量g和向量v。最后，根据更新的标量g和向量v更新所述各个权值向量。

在另一较佳实施例中，当根据所述向量v和所述标量g的梯度更新所述各个权值向量之后，所述训练模块204用所述各个权值向量继续所述训练所述深度神经网络模型，并获取相应的计算输出，然后将所述计算输出与目标输出根据所述训练误差公式重新计算对应的训练误差。当所述训练误差不大于所述预设期望值或者训练次数达到预设训练次数时，停止训练神经网络。

更新模块206，用于根据所述计算输出对所述各个权值向量进行更新。

具体的，所述更新模块206从所述深度神经网络模型中获取计算输出，然后根据所述计算输出对所述各个权值向量进行更新。

实施例三

参阅图3，是本申请实施例三之计算机设备的硬件架构示意图。本实施例中，所述计算机设备2是一种能够按照事先设定或者存储的指令，自动进行数值计算和/或信息处理的设备。该计算机设备2可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器，或者多个服务器所组成的服务器集群)等。如图3所示，所述计算机设备2至少包括，但不限于，可通过系统总线相互通信连接存储器21、处理器22、网络接口23、以及深度学习权值更新系统20。其中：

本实施例中，存储器21至少包括一种类型的非易失性计算机可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，存储器21可以是计算机设备2的内部存储单元，例如该计算机设备2的硬盘或内存。在另一些实施例中，存储器21也可以是计算机设备2的外部存储设备，例如该计算机设备2上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。当然，存储器21还可以既包括计算机设备2的内部存储单元也包括其外部存储设备。本实施例中，存储器21通常用于存储安装于计算机设备2的操作系统和各类应用软件，例如实施例二的深度学习权值更新系统20的程序代码等。此外，存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器22在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制计算机设备2的总体操作。本实施例中，处理器22用于运行存储器21中存储的程序代码或者处理数据，例如运行深度学习权值更新系统20，以实现实施例一的深度学习权值更新方法。

所述网络接口23可包括无线网络接口或有线网络接口，该网络接口23通常用于在所述计算机设备2与其他电子装置之间建立通信连接。例如，所述网络接口23用于通过网络将所述计算机设备2与外部终端相连，在所述计算机设备2与外部终端之间的建立数据传输通道和通信连接等。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication，GSM)、宽带码分多址(Wideband Code Division Multiple Access，WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。

需要指出的是，图3仅示出了具有部件20-23的计算机设备2，但是应理解的是，并不要求实施所有示出的部件，可以替代的实施更多或者更少的部件。

在本实施例中，存储于存储器21中的所述深度学习权值更新系统20还可以被分割为一个或者多个程序模块，所述一个或者多个程序模块被存储于存储器21中，并由一个或多个处理器(本实施例为处理器22)所执行，以完成本申请。

例如，图2示出了所述实现深度学习权值更新系统20的程序模块示意图，该实施例中，所述基于深度学习权值更新系统20可以被划分为构建模块200、参数更新模块202、训练模块204和更新模块206。其中，本申请所称的程序模块是指能够完成特定功能的一系列计算机可读指令段，比程序更适合于描述所述深度学习权值更新系统20在所述计算机设备2中的执行过程。所述程序模块200-206的具体功能在实施例二中已有详细描述，在此不再赘述。

实施例四

本实施例还提供一种非易失性计算机可读存储介质，如闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等，其上存储有计算机可读指令，程序被处理器执行时实现相应功能。本实施例的非易失性计算机可读存储介质用于存储深度学习权值更新系统20，被处理器执行如下步骤：

根据所述计算输出对所述各个权值向量进行更新。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种深度学习权值更新方法，所述方包括：

根据多个神经元输出函数构建深度神经网络模型，其中，每个所述神经元的输出函数为y＝Φ(WX+b)，其中y表示相应神经元的输出值，Φ表示一个激励函数，X表示多维输入特征，W表示一个权值向量，b表示所述相应神经元的偏差标量；

对所述深度神经网络模型中的各个权值向量进行参数更新以得到更新后的各个权值向量，其中，用于参数更新的更新公式为：
其中，W _n表示相应神经元更新后的权值向量，v表示W _n的单位向量，g表示W _n的标量，所述g＝||W _n||，v _n-1表示对所述深度神经网络模型第n-1次训练时的所述各个权值向量的单位向量；

将训练样本输入至所述深度神经网络模型中，并从所述深度神经网络模型中获取计算输出；

根据所述计算输出对所述各个权值向量进行更新。
根据权利要求1所述的深度学习权值更新方法，所述根据多个神经元输出函数构建深度神经网络模型的步骤之前，还包括：

对所述各个权值向量和各个偏差标量进行初始化。
根据权利要求1所述的深度学习权值更新方法，所述根据所述计算输出对所述各个权值向量进行更新，包括：

将所述计算输出与预设的目标输出按照训练误差公式计算训练误差，其中，所述训练误差公式为：
其中，J(W)表示训练误差，t _k表示对所述深度神经网络模型第k次训练的目标输出，z _k表示对所述深度神经网络模型第k次训练的计算输出，所述k为正整数，且所述k＝1，2…c；

根据所述训练误差判断是否需要执行反向传播；

当不需要执行所述反向传播时，将所述各个权值向量作为所述深度神经网络模型更新后的各个权值向量。
根据权利要求3所述的深度学习权值更新方法，所述根据所述训练误差判断是否需要执行反向传播，包括：

将所述训练误差与预设期望值进行比较；及

当所述训练误差大于所述预设期望值时，执行所述反向传播，以对所述各个权值向量进行更新。
根据权利要求4所述的深度学习权值更新方法，所述将所述训练误差与预设期望值进行比较的步骤之后，包括：

当所述训练误差不大于所述预设期望值时，则不需要执行所述反向传播，获取所述各个权值向量，并将所述各个权值向量作为所述深度神经网络模型更新后的各个权值向量。
根据权利要求4所述的深度学习权值更新方法，所述当所述训练误差大于所述预设期望值时，执行所述反向传播，以对所述各个权值向量进行更新，包括：

将所述各个权值向量根据权值更新公式进行更新，其中，所述权值更新公式为：W(n+1)＝W(n)+ΔW(n)，
W(n)表示对所述深度神经网络模型第n次训练时的所述相应神经元的权值向量，W(n+1)表示对所述深度神经网络模型第n+1次训练时的所述相应神经元的权值向量，ΔW(n)表示对所述深度神经网络模型第n次训练时所述相应神经元的权值向量在梯度下降方向上的变化，η表示学习率，
表示所述训练误差对所述相应神经元的权值向量的偏导函数。
根据权利要求1所述的深度学习权值更新方法，所述根据所述计算输出对所述各个权值向量进行更新，还包括：

计算所述深度神经网络模型的训练次数；

当所述训练次数不小于预设的期望训练次数时，停止训练所述深度神经网络模型。
一种深度学习权值更新系统，包括：

构建模块，用于根据多个神经元输出函数构建深度神经网络模型，其中，每个所述神经元的输出函数为y＝Φ(WX+b)，其中y表示相应神经元的输出值，Φ表示一个激励函数，X表示多维输入特征，W表示一个权值向量，b表示所述相应神经元的偏差标量；

参数更新模块，用于对所述深度神经网络模型中的各个权值向量进行参数更新以得到更新后的各个权值向量，其中，用于参数更新的更新公式为：
其中，W _n表示相应神经元更新后的权值向量，v表示W _n的单位向量，g表示W _n的标量，所述g＝||W _n||，v _n-1表示对所述深度神经网络模型第n-1次训练时的所述各个权值向量的单位向量；

训练模块，用于将训练样本输入至所述深度神经网络模型中，并从所述深度神经网络模型中获取计算输出；

更新模块，用于根据所述计算输出对所述各个权值向量进行更新。
一种计算机设备，所述计算机设备存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机可读指令，所述计算机可读指令被处理器执行时实现以下步骤：

根据多个神经元输出函数构建深度神经网络模型，其中，每个所述神经元的输出函数y＝Φ(WX+b)，其中y表示相应神经元的输出值，Φ表示一个激励函数，X表示多维输入特征，W表示一个权值向量，b表示所述相应神经元的偏差标量；

对所述深度神经网络模型中的各个权值向量进行参数更新以得到更新后的各个权值向量，其中，用于参数更新的更新公式为：
其中，W _n表示相应神经元更新后的权值向量，v表示W _n的单位向量，g表示W _n的标量，所述g＝||W _n||，v _n-1表示对所述深度神经网络模型第n-1次训练时的所述各个权值向量的单位向量；

将训练样本输入至所述深度神经网络模型中，并从所述深度神经网络模型中获取计算输出；

根据所述计算输出对所述各个权值向量进行更新。
根据权利要求9所述的计算机设备，所述计算机可读指令被所述处理器执行时还实现以下步骤：

对所述各个权值向量和各个偏差标量进行初始化。
根据权利要求9所述的计算机设备，所述计算机可读指令被所述处理器执行时还实现以下步骤：

将所述计算输出与预设的目标输出按照训练误差公式计算训练误差，其中，所述训练误差公式为：
其中，J(W)表示训练误差，t _k表示对所述深度神经网络模型第k次训练的目标输出，z _k表示对所述深度神经网络模型第k次训练的计算输出，所述k为正整数，且所述k＝1，2…c；

根据所述训练误差判断是否需要执行反向传播；

当不需要执行所述反向传播时，将所述各个权值向量作为所述深度神经网络模型更新后的各个权值向量。
根据权利要求11所述的计算机设备，所述计算机可读指令被所述处理器执行时还实现以下步骤：

将所述训练误差与预设期望值进行比较；及

当所述训练误差大于所述预设期望值时，执行所述反向传播，以对所述各个权值向量进行更新。
根据权利要求12所述的计算机设备，所述计算机可读指令被所述处理器执行时还实现以下步骤：

当所述训练误差不大于所述预设期望值时，则不需要执行所述反向传播，获取所述各个权值向量，并将所述各个权值向量作为所述深度神经网络模型更新后的各个权值向量。
根据权利要求12所述的计算机设备，所述计算机可读指令被所述处理器执行时还实现以下步骤：

将所述各个权值向量根据权值更新公式进行更新，其中，所述权值更新公式为：W(n+1)＝W(n)+ΔW(n)，
W(n)表示对所述深度神经网络模型第n次训练时的所述相应神经元的权值向量，W(n+1)表示对所述深度神经网络模型第n+1次训练时的所述相应神经元的权值向量，ΔW(n)表示对所述深度神经网络模型第n次训练时所述相应神经元的权值向量在梯度下降方向上的变化，η表示学习率，
表示所述训练误差对所述相应神经元的权值向量的偏导函数。
根据权利要求12所述的计算机设备，所述计算机可读指令被所述处理器执行时还实现以下步骤：

根据所述向量v和所述标量g的变化值更新所述各个权值向量，所述标量g在所述梯度下降方向上的变化值为：
其中
表示所述误差函数对所述参数g的偏导函数，所述向量v在所述梯度下降方向上的变化值为：

其中
表示所述误差函数对所述参数v的偏导。
一种非易失性计算机可读存储介质，所述非易失性计算机可读存储介质内存储有计算机可读指令，所述计算机可读指令可被至少一个处理器所执行，以使所述至少一个处理器执行以下步骤：

根据多个神经元输出函数构建深度神经网络模型，其中，每个所述神经元的输出函数y＝Φ(WX+b)，其中y表示相应神经元的输出值，Φ表示一个激励函数，X表示多维输入特征，W表示一个权值向量，b表示所述相应神经元的偏差标量；

对所述深度神经网络模型中的各个权值向量进行参数更新以得到更新后的各个权值向量，其中，用于参数更新的更新公式为：
其中，W _n表示相应神经元更新后的权值向量，v表示W _n的单位向量，g表示W _n的标量，所述g＝||W _n||，v _n-1表示对所述深度神经网络模型第n-1次训练时的所述各个权值向量的单位向量；

将训练样本输入至所述深度神经网络模型中，并从所述深度神经网络模型中获取计算输出；

根据所述计算输出对所述各个权值向量进行更新。
根据权利要求16所述的非易失性计算机可读存储介质，所述计算机可读指令被所述处理器执行时还实现以下步骤：

对所述各个权值向量和各个偏差标量进行初始化。
根据权利要求16所述的非易失性计算机可读存储介质，所述计算机可读指令被所述处理器执行时还实现以下步骤：

将所述计算输出与预设的目标输出按照训练误差公式计算训练误差，其中，所述训练误差公式为：
其中，J(W)表示训练误差，t _k表示对所述深度神经网络模型第k次训练的目标输出，z _k表示对所述深度神经网络模型第k次训练的计算输出，所述k为正整数，且所述k＝1，2…c；

根据所述训练误差判断是否需要执行反向传播；

当不需要执行所述反向传播时，将所述各个权值向量作为所述深度神经网络模型更新后的各个权值向量。
根据权利要求18所述的非易失性计算机可读存储介质，所述计算机可读指令被所述处理器执行时还实现以下步骤：

将所述训练误差与预设期望值进行比较；及

当所述训练误差大于所述预设期望值时，执行所述反向传播，以对所述各个权值向量进行更新。
根据权利要求19所述的非易失性计算机可读存储介质，所述计算机可读指令被所述处理器执行时还实现以下步骤：

当所述训练误差不大于所述预设期望值时，则不需要执行所述反向传播，获取所述各个权值向量，并将所述各个权值向量作为所述深度神经网络模型更新后的各个权值向量。