WO2020037512A1

WO2020037512A1 - 一种神经网络计算方法和装置

Info

Publication number: WO2020037512A1
Application number: PCT/CN2018/101598
Authority: WO
Inventors: 胡慧; 郑成林
Original assignee: 华为技术有限公司
Priority date: 2018-08-21
Filing date: 2018-08-21
Publication date: 2020-02-27
Also published as: CN111788584A

Abstract

本申请实施例公开了一种神经网络计算方法和装置，涉及通信技术领域，解决了现有技术中分块循环矩阵压缩神经网络时，分块大小很大时，训练难收敛，以及精度下降明显的问题。具体方案为：获取第一待处理网络层的输入向量；根据神经网络的参考随机向量和第一待处理网络层的随机向量的维数，获取第一待处理网络层的扰动向量，其中，扰动向量的维数等于第一待处理网络层的输入向量的维数；将第一待处理网络层的输入向量中的元素与扰动向量中对应位置的元素相乘，以获得第一待处理网络层的校正输入向量；基于校正输入向量和神经网络的计算模型，以获得第一待处理网络层的输出向量。

Description

一种神经网络计算方法和装置

技术领域

本申请实施例涉及通信技术领域，尤其涉及一种神经网络计算方法和装置。

背景技术

神经网络是一种模仿动物神经网络行为特征，进行分布式并行信息处理的算法数学模型，在多个领域都有较为广泛的应用。目前，结构化矩阵在神经网络的压缩和加速上取得了良好的效果，其中，分块循环矩阵是结构化矩阵的一种，分块循环矩阵被应用在卷积层、全连接层、长短期记忆层(Long Short-Term Memory，LSTM)上能实现高倍数的网络参数压缩。

但是，现有的分块循环矩阵压缩神经网络的方法，在分块的大小很大时，由于权重参数的结构化，引入了输出特征图像之间的相关性，从而引起信息的损失导致基于神经网络的应用任务的精度损失，使得训练收敛速度慢甚至不收敛，模型的性能降低。

发明内容

本申请实施例提供一种神经网络计算方法和装置，能够解决分块循环矩阵压缩神经网络时，分块大小很大时，训练难收敛，以及精度下降明显的问题。

为达到上述目的，本申请实施例采用如下技术方案：

本申请实施例的第一方面，提供一种神经网络计算方法，该神经网络包括多个网络层，该多个网络层中包括第一待处理网络层，上述方法包括：获取第一待处理网络层的输入向量；根据神经网络的参考随机向量和第一待处理网络层的随机向量的维数，获取所述第一待处理网络层的扰动向量，其中，该扰动向量的维数等于上述第一待处理网络层的输入向量的维数，该第一待处理网络层的随机向量的维数是基于第一待处理网络层的权重参数和第一待处理网络层的输入向量的维数确定的；将上述第一待处理网络层的输入向量中的元素与扰动向量中对应位置的元素相乘，以获得上述第一待处理网络层的校正输入向量；基于该校正输入向量和上述神经网络的计算模型，以获得上述第一待处理网络层的输出向量。当第一待处理网络层为神经网络的输入层时，上述获取所述第一待处理网络层的输入向量，包括将上述神经网络的输入向量作为上述第一待处理网络层的输入向量；当上述第一待处理网络层不为上述神经网络的输入层时，上述获取第一待处理网络层的输入向量，包括将上述第一待处理网络层的前一网络层的输出向量作为上述第一待处理网络层的输入向量。基于本方案，能够减小输出特征图像之间的相关性，加快训练收敛速度，减少精度损失。

结合第一方面和上述可能的实现方式，在另一种可能的实现方式中，上述第一待处理网络层的输入向量为{x1,x2…xn}，上述扰动向量为{y1,y2…yn}，上述第一待处理网络层的校正输入向量为{x1×y1,x2×y2…xn×yn}，其中，n为正整数。基于本方案，通过在第一待处理网络层的输入向量上加扰动向量，可以有效的降低该层投影矩阵的相关性。

结合第一方面和上述可能的实现方式，在另一种可能的实现方式中，上述神经网络计算模型包括：Y _j＝C _j×X _j+b _j，其中，Y _j为上述神经网络计算模型的输出向量，X _j为上述神经网络计算模型的输入向量，C _j为上述神经网络计算模型的权重参数，b _j为上述神经网络计算模型的预设偏置值，上述神经网络计算模型用于上述多个网络层中第j层的神经网络计算，j为整数。上述基于校正输入向量和神经网络的计算模型，以获得上述第一待处理网络层的输出向量，包括：将上述第一待处理网络层的权重参数和校正输入向量分别作为上述神经网络计算模型的权重参数和输入向量进行计算，以获得上述第一待处理网络层的输出向量。基于本方案，能够通过校正输入向量和权重参数计算第一待处理网络层的输出向量。

结合第一方面和上述可能的实现方式，在另一种可能的实现方式中，上述权重参数为分块结构化的矩阵对应的压缩矩阵，其中，上述分块结构化的矩阵由所述压缩矩阵唯一确定，在上述基于所述校正输入向量，通过神经网络计算，以获得上述第一待处理网络层的输出向量之前，上述方法还包括：将所述权重参数解压为所述压缩矩阵对应的分块结构化的矩阵。基于本方案，对权重参数为分块结构化的矩阵对应的压缩矩阵的第一待处理网络层，能够通过解压权重参数得到分块结构化矩阵再计算输出向量。

结合第一方面和上述可能的实现方式，在另一种可能的实现方式中，基于上述第一待处理网络层的权重参数和上述第一待处理网络层的输入向量的维数，确定上述第一待处理网络层的随机向量的维数，包括：确定目标区间，该目标区间的两个区间端点分别为上述第一待处理网络层的权重参数对应的分块结构化的矩阵的分块尺寸和上述第一待处理网络层的输入向量的维数；在该目标区间内随机确定上述第一待处理网络层的随机向量的维数。基于本方案，能够得到第一待处理网络层的随机向量的维数，而且该随机向量的维数小于输入向量的维数。

结合第一方面和上述可能的实现方式，在另一种可能的实现方式中，上述多个网络层包括多个第一待处理网络层，在上述根据上述神经网络的参考随机向量和上述第一待处理网络层的随机向量的维数，获取上述第一待处理网络层的扰动向量之前，还包括：确定全部上述第一待处理网络层的随机向量的维数中的最大值，作为上述神经网络的参考随机向量的维数；基于预设的随机数生成模型，生成满足上述参考随机向量的维数的随机数；将上述生成的随机数组成参考随机向量。基于本方案，能够根据全部上述第一待处理网络层的随机向量的维数确定参考随即向量的维数，且该参考随机向量的维数小于输入向量的维数。

结合第一方面和上述可能的实现方式，在另一种可能的实现方式中，根据上述神经网络的参考随机向量和上述第一待处理网络层的随机向量的维数，获取上述第一待处理网络层的扰动向量，包括：在上述参考随机向量中截取与上述第一待处理网络层的随机向量的维数相等的向量作为上述第一待处理网络层的随机向量；对上述第一待处理网络层的随机向量采用循环移位或者向量元素复制的方式生成与上述第一待处理网络层的输入向量的维数相等的向量作为上述第一待处理网络层的扰动向量。基于本方案，能够根据参考随机向量和第一待处理网络层的随机向量的维数通过截取和扩展的方式得到第一待处理网络层的扰动向量，因此仅需增加极少的存储资源和计算资源，即可保证神经网络的准确度不下降，收敛速度得到有效提升。

本申请实施例的第二方面，提供一种神经网络模型的训练方法，用于获得神经网络中每个网络层的权重参数，该方法包括：步骤1、初始化上述每个网络层的权重参数；步骤2、根据上述每个网络层对应的神经网络计算模型进行神经网络计算，以获得上述神经网络的临时输出向量，其中，上述神经网络计算模型的权重参数为初始化的权重参数，上述根据上述每个网络层对应的神经网络计算模型进行神经网络计算，包括根据上述第一方面或上述第一方面的任一实现方式的神经网络计算方法，对上述每个网络层中的一个或多个上述第一待处理网络层进行神经网络计算；步骤3、通过上述神经网络的反向传递，更新上述每个网络层的权重参数；以该更新后的每个网络层的权重参数作为上述每个网络层对应的神经网络计算模型的权重参数，重复步骤2和步骤3，直到上述临时输出向量和上述神经网络的预设输出向量的差异小于预设值；步骤4、获取上述每个网络层的权重参数。基于本方案，能够对神经网络的多个网络层进行训练，得到训练收敛时每个网络层的权重参数。

本申请实施例的第三方面，提供一种神经网络计算装置，该神经网络包括多个网络层，该多个网络层中包括第一待处理网络层，该装置包括：第一获取单元，用于获取上述第一待处理网络层的输入向量；第二获取单元，用于根据上述神经网络的参考随机向量和上述第一待处理网络层的随机向量的维数，获取上述第一待处理网络层的扰动向量，其中，该扰动向量的维数等于上述第一待处理网络层的输入向量的维数，上述第一待处理网络层的随机向量的维数是根据上述第一待处理网络层的权重参数和上述第一待处理网络层的输入向量的维数确定的；第一计算单元，用于将上述第一待处理网络层的输入向量中的元素与上述第二获取单元获取的上述扰动向量中对应位置的元素相乘，以获得上述第一待处理网络层的校正输入向量；第二计算单元，用于基于上述第一计算单元获得的上述校正输入向量和上述神经网络的计算模型，以获得上述第一待处理网络层的输出向量。当上述第一待处理网络层为上述神经网络的输入层时，上述获取单元具体用于获取上述神经网络的输入向量；当上述第一待处理网络层不为上述神经网络的输入层时，上述获取单元具体用于获取上述第一待处理网络层的前一网络层的输出向量。

结合第三方面和上述可能的实现方式，在另一种可能的实现方式中，上述第一待处理网络层的输入向量为{x1,x2…xn}，上述扰动向量为{y1,y2…yn}，上述第一待处理网络层的校正输入向量为{x1×y1,x2×y2…xn×yn}，其中，n为正整数。

结合第三方面和上述可能的实现方式，在另一种可能的实现方式中，上述神经网络计算模型包括：Y _j＝C _j×X _j+b _j，其中，Y _j为上述神经网络计算模型的输出向量，X _j为上述神经网络计算模型的输入向量，C _j为上述神经网络计算模型的权重参数，b _j为上述神经网络计算模型的预设偏置值，上述神经网络计算模型用于上述多个网络层中第j层的神经网络计算，j为整数。上述第二计算单元具体用于：将上述第一待处理网络层的权重参数和校正输入向量分别作为上述神经网络计算模型的权重参数和输入向量进行计算，以获得上述第一待处理网络层的输出向量。

结合第三方面和上述可能的实现方式，在另一种可能的实现方式中，上述权重参数为分块结构化的矩阵对应的压缩矩阵，其中，上述分块结构化的矩阵由上述压缩矩阵唯一确定，上述装置还包括解压单元，该解压单元，用于将上述权重参数解压为上述压缩矩阵对应的分块结构化的矩阵。

结合第三方面和上述可能的实现方式，在另一种可能的实现方式中，上述装置还包括第一确定单元，该第一确定单元，用于确定目标区间，该目标区间的两个区间端点分别为上述第一待处理网络层的权重参数对应的分块结构化的矩阵的分块尺寸和上述第一待处理网络层的输入向量的维数；上述第一确定单元，还用于在上述目标区间内随机确定上述第一待处理网络层的随机向量的维数。

结合第三方面和上述可能的实现方式，在另一种可能的实现方式中，上述多个网络层包括多个第一待处理网络层，上述装置还包括：第二确定单元和生成单元，该第二确定单元，还用于确定全部上述第一待处理网络层的随机向量的维数中的最大值，作为上述神经网络的参考随机向量的维数；上述生成单元，用于基于预设的随机数生成模型，生成满足上述参考随机向量的维数的随机数，将该生成的随机数组成上述参考随机向量。

结合第三方面和上述可能的实现方式，在另一种可能的实现方式中，上述第二获取单元，具体用于在上述参考随机向量中截取与上述第一待处理网络层的随机向量的维数相等的向量作为上述第一待处理网络层的随机向量；上述第二获取单元，具体用于对上述第一待处理网络层的随机向量采用循环移位或者向量元素复制的方式生成与上述第一待处理网络层的输入向量的维数相等的向量作为上述第一待处理网络层的扰动向量。

本申请实施例的第四方面，提供一种神经网络模型的训练装置，用于获得神经网络中每个网络层的权重参数，该装置包括：初始化单元，用于初始化上述每个网络层的权重参数；神经网络计算单元，用于根据上述每个网络层对应的神经网络计算模型进行神经网络计算，以获得上述神经网络的临时输出向量，其中，上述神经网络计算模型的权重参数为上述初始化的权重参数；上述神经网络计算单元，具体用于根据上述第一方面或上述第一方面的任一实现方式所述的神经网络计算方法，对上述每个网络层中的一个或多个上述第一待处理网络层进行神经网络计算；反向传递单元，用于通过上述神经网络的反向传递，更新上述每个网络层的权重参数；获取单元，用于获取上述每个网络层的权重参数，上述每个网络层的权重参数是在上述神经网络的临时输出向量和所述神经网络的预设输出向量的差异小于预设值时获取的。

上述第三方面以及第三方面的各种实现方式的效果描述可以参考第一方面相应效果的描述，上述第四方面的效果描述可以参考第二方面相应效果的描述，在此不再赘述。

本申请实施例的第五方面，提供了一种服务器，该服务器的结构中包括处理器和存储器，该存储器用于与处理器耦合，保存该服务器必要的程序指令和数据，该处理器用于执行存储器中存储的程序指令，使得该服务器执行上述方法。

本申请实施例的第六方面，提供一种计算机存储介质，所述计算机存储介质中存储有计算机程序代码，当所述计算机程序代码在处理器上运行时，使得所述处理器执行第一方面或第一方面的可能的实现方式中任一所述的神经网络计算方法，或者执行第二方面所述的神经网络模型的训练方法。

本申请实施例的第七方面，提供了一种计算机程序产品，该程序产品储存有上述处理器执行的计算机软件指令，该计算机软件指令包含用于执行上述方面所述方案的程序。

本申请实施例的第八方面，提供了一种装置，该装置以芯片的产品形态存在，该装置的结构中包括处理器和存储器，该存储器用于与处理器耦合，保存该装置必要的程序指令和数据，该处理器用于执行存储器中存储的程序指令，使得该装置执行上述方法中神经网络计算装置或者神经网络模型的训练装置的功能。

附图说明

图1为本申请实施例提供的一种神经网络计算的硬件架构示意图；

图2为本申请实施例提供的另一种神经网络计算的硬件架构示意图；

图3为本申请实施例提供的另一种神经网络计算的硬件架构示意图；

图4为本申请实施例提供的一种神经网络计算方法的流程图；

图5为本申请实施例提供的另一种神经网络计算方法的流程图；

图6为本申请实施例提供的另一种神经网络计算方法的流程图；

图7为本申请实施例提供的另一种神经网络计算方法的流程图；

图8为本申请实施例提供的另一种神经网络计算方法的流程图；

图9为本申请实施例提供的采用现有技术和本申请实施例中的神经网络计算方法得到的效果对比示意图；

图10为本申请实施例提供的一种神经网络模型的训练方法的流程图；

图11为本申请实施例提供的一种神经网络计算装置的组成示意图；

图12为本申请实施例提供的一种神经网络模型训练装置的组成示意图；

图13为本申请实施例提供的另一种神经网络计算装置的组成示意图；

图14为本申请实施例提供的另一种神经网络模型训练装置的组成示意图。

具体实施方式

为了解决现有技术中分块循环矩阵压缩神经网络时，分块大小很大时，训练难收敛，以及精度下降明显的问题，本申请实施例提供了一种神经网络计算方法，该方法能够减小输出特征图像之间的相关性，加快训练收敛速度，减少精度损失。

本申请实施例中的神经网络包括多个网络层，该多个网络层中包括一个或多个第一待处理网络层。其中，该第一待处理网络层为神经网络的输入层时，该第一待处理网络层的输入向量为神经网络的输入向量；该第一待处理网络层不为神经网络的输入层时，该第一待处理网络层的输入向量为该第一待处理网络层的前一网络层的输出向量。对于一个或多个待处理网络层中的任一网络层的计算方法可以应用于图1所示的硬件架构。

如图1所示，该硬件结构组成包括：第一获取模块101、第二获取模块102、第一计算模块103以及第二计算模块104。其中，第一获取模块101与第一计算模块103以及第二计算模块104依次连接，第二获取模块102与第一计算模块103以及第二计算模块104依次连接。

第一获取模块101，用于获取每个第一待处理网络层的输入向量。示例性的，对于第一个网络层，其输入向量为神经网络的输入向量；对于出第一个网络层以外的网络层，其输入向量为该网络层的前一网络层的输出向量。

第二获取模块102，用于根据输入的参考随机向量和第一待处理网络层的随机向量的维数，获取第一待处理网络层的扰动向量，该第一待处理网络层的扰动向量的维数可以等于该第一待处理网络层的输入向量的维数。示例性的，该第二获取模块可以包括cyclic shift模块或者copy模块。

第一计算模块103，用于在第一获取模块101获取的第一待处理网络层的输入向量的基础上加扰动，该扰动为第二获取模块102获取的扰动向量。示例性的，可以通过将第一待处理网络层的输入向量中的元素与扰动向量中对应位置的元素相乘的方式，得到该第一待处理网络层的校正输入向量。

第二计算模块104，用于根据上述第一计算模块103得到的校正输入向量和神经网络的计算模型，计算该第一待处理网络层的输出向量。示例性的，该神经网络的计算模型可以为：Y _j＝C _j×X _j+b _j，其中，Y _j为神经网络计算模型的输出向量，X _j为神经网络计算模型的输入向量，C _j为神经网络计算模型的权重参数，b _j为神经网络计算模型的预设偏置值，该神经网络计算模型用于多个网络层中第j层的神经网络计算，j为整数。示例性的，该第二计算模块可以采用快速计算方式计算第一待处理层的输出向量，例如，分块结构化矩阵为分块循环矩阵时，该第二计算模块104可以采用快速傅里叶变换计算第一待处理层的输出向量。

可理解的是，图1仅为示例性说明，实际应用中，神经网络计算装置的硬件架构可以包括比图1所示更多或者更少的部件。图1所示结构不对本申请实施例提供的硬件架构构成任何限制。

示例性的，本申请实施例中的硬件架构组成除图1所示的模块外，还可以包括图2所示的解压模块105，该解压模块105与第二计算模块104连接。

解压模块105，用于将权重参数解压为压缩矩阵对应的分块结构化的矩阵，并将该分块结构化的矩阵传输给第二计算模块104，用于计算网络层的输出向量。示例性的，当分块结构化的矩阵为分块循环矩阵时，该解压模块105可以为cyclic shift模块，通过cyclic shift模块将权重参数解压为分块循环矩阵，再采用第二计算模块104进行矩阵乘法运算，计算第一待处理层的输出向量。

如图3所示，本申请实施例还提供一种硬件结构，该硬件结构包括依次连接的第一确定模块301、第二确定模块302以及生成模块303。

第一确定模块301，用于根据输入向量的维数和权重参数确定第一待处理网络层的随机向量的维数。

第二确定模块302，用于根据一个或多个第一待处理网络层的随机向量的维数确定参考随机向量的维数。示例性的，该参考随机向量的维数可以为所有第一待处理网络层的随机向量的维数的最大值。

生成模块303，用于根据参考随机向量的维数生成与该参考随机向量的维数相同的参考随机向量。

可理解的是，图1-3仅为示例性说明，图1-图3所示结构不对本申请实施例提供的硬件架构构成任何限制。

结合图1、图2，如图4所示，对于神经网络包含的多个网络层中的任意一个第一待处理网络层，可以采用图4所示的计算方法计算该第一待处理网络层的输出向量。如图4所示，本申请实施例提供的神经网络计算方法可以包括步骤S401-S404。

S401、获取第一待处理网络层的输入向量。

可以理解的，可由图1中所示的第一获取模块101执行步骤S401。

示例性的，该第一待处理网络层是指神经网络的多个网络层中，权重参数为分块结构化的矩阵对应的压缩矩阵的网络层。其中，该分块结构化的矩阵可以由压缩矩阵唯一确定。

示例性的，上述分块结构化的矩阵是指该矩阵可以分为多个块，且每个分块均按照某种规律排列。该分块结构化的矩阵可以包括分块循环矩阵、分块特普利茨矩阵等，本申请实施例对于分块结构化的矩阵的具体类型并不进行限定，在此仅以分块循环矩阵为例进行说明。

例如，W为分块循环矩阵，该分块循环矩阵中每个分块的第二列是由第一列向下循环移位所得，第三列是由第二列再向下循环移位所得，该网络层的权重参数C为分块循环矩阵W对应的压缩矩阵。该压缩矩阵C由N个w_base组合成的矩阵表示，其中N是指分块循环矩阵的分块数，每个分块的w_base是唯一确定该分块的结构化矩阵的每个分块的最小元素集合(例如w_base可以为一个分块的第一行或第一列)。如下式中的分块循环矩阵W的压缩矩阵为C(权重参数)，该分块循环矩阵分为4块，该分块循环矩阵W可以由压缩矩阵C唯一确定。

可以理解的，本申请实施例中的神经网络可以包括一个或多个第一待处理网络层，该一个或多个待处理网络层中的一个网络层可以为神经网络的输入向量，当第一待处理为神经网络的第一个网络层时，该第一待处理网络层的输入向量为神经网络的输入向量；当该第一待处理网络层为除第一个网络层以外的任一网络层时，该第一待处理网络层的输入向量为该第一待处理网络层的前一网络层的输出向量。

示例性的，本申请实施例中的神经网络可以为深度神经网络(Deep Neural Network，DNN)、卷积神经网络(Convolutional Neural Network，CNN)等类型的神经网络，上述第一待处理网络层可以是卷积层(convolution layer)、LSTM层、全连接层(full connection layer)等。本申请实施例对于具体的神经网络类型和结构并不进行限定。

S402、根据神经网络的参考随机向量和第一待处理网络层的随机向量的维数，获取第一待处理网络层的扰动向量。

可以理解的，可由图1中所示的第二获取模块102执行步骤S402。

其中，该扰动向量的维数等于第一待处理网络层的输入向量的维数。

示例性的，上述步骤S402中获取第一待处理网络层的扰动向量可以包括：步骤S4021-S4022。

S4021、在参考随机向量中截取与第一待处理网络层的随机向量的维数相等的向量作为第一待处理网络层的随机向量。

示例性的，该参考随机向量可以为全部第一待处理网络层的随机向量的维数中的最大值，因此可以通过在参考随机向量中截取与第一待处理网络层的随机向量的维数相等的向量作为第一待处理网络层的随机向量。

示例性的，上述在参考随机向量中截取与第一待处理网络层的随机向量的维数相等的向量可以包括：从参考随机向量的某一位置(例如第一位)开始按顺序截取与第一待处理网络层的随机向量的维数相等的向量为该第一待处理网络层的随机向量，也可以按照一定的截取规则，例如从参考随机向量中的奇数位或偶数位截取与第一待处理网络层的随机向量的维数相等的向量为该第一待处理网络层的随机向量，本申请实施例对于从参考随机向量中截取第一待处理网络层的随机向量的具体截取位置和方式并不进行限定，在此仅是示例性说明。

S4022、对第一待处理网络层的随机向量采用循环移位或者向量元素复制的方式生成与第一待处理网络层的输入向量的维数相等的向量作为第一待处理网络层的扰动向量。

示例性的，该第一待处理网络层的随机向量的维数小于该第一待处理网络层的输入向量的维数，该第一待处理网络层的扰动向量的维数等于第一待处理网络层的输入向量的维数，因此，可以通过将第一待处理网络层的随机向量采用循环移位或者向量元素复制的方式进行扩展，得到与第一待处理网络层的输入向量的维数相等的向量作为第一待处理网络层的扰动向量。

例如，若第一待处理网络层的随机向量为A _i＝[1,-1,1,1,-1]，第一待处理网络层的输入向量的维数为15，采用循环移位方式获取的第一待处理网络层的扰动向量可以为A_L _i＝[1,-1,1,1,-1,-1,1,1,-1,1,1,1,-1,1,-1]；采用向量元素复制的方式获取的第一待处理网络层的扰动向量A_L _i可以为A_L _i＝[1,-1,1,1,-1,1,-1,1,1,-1,1,-1,1,1,-1]。本申请实施例对于根据第一待处理网络层的随机向量，具体采用何种方式获取第一待处理网络层的扰动向量并不进行限定。

可以理解的是，当采用循环移位的方式获取第一待处理网络层的扰动向量时，图1中的第二获取模块包括cyclic shift模块，当采用向量元素复制的方式获取第一待处理网络层的扰动向量时，图1中的第二获取模块包括copy模块。

需要说明的是，本申请实施例中仅需通过神经网络的参考随机向量和所有第一待处理网络层的随机向量的维数，即可采用步骤S402中的方式生成与输入向量维数相同的扰动向量，由于第一待处理网络层的随机向量的维数小于输入向量的维数，因此，仅需增加极少的存储资源和计算资源，即可保证神经网络的准确度不下降，收敛速度得到有效提升。

S403、将第一待处理网络层的输入向量中的元素与扰动向量中对应位置的元素相乘，以获得第一待处理网络层的校正输入向量。

可以理解的，可由图1中所示的第一计算模块103执行步骤S403。

示例性的，若第一待处理网络层的输入向量为{x1,x2…xn}，第一待处理网络层的扰动向量为{y1,y2…yn}，该第一待处理网络层的校正输入向量为{x1×y1,x2×y2…xn×yn}，其中，n为正整数。

需要说明的是，本申请实施例通过在第一待处理网络层的输入向量上加扰动向量，可以有效的降低该层投影矩阵的相关性。

S404、基于校正输入向量和神经网络的计算模型，以获得第一待处理网络层的输出向量。

可以理解的，可由图1中所示的第二计算模块104执行步骤S404。

示例性的，上述神经网络计算模型包括：Y _j＝C _j×X _j+b _j，其中，Y _j为神经网络计算模型的输出向量，X _j为神经网络计算模型的输入向量，C _j为神经网络计算模型的权重参数，b _j为神经网络计算模型的预设偏置值，“×”为矩阵乘法运算，该神经网络计算模型用于多个网络层中第j层的神经网络计算，j为整数。

可以理解的，本申请实施例提供的神经网络计算方法可以适用于计算模型能够转换成Y _j＝C _j×X _j+b _j的所有网络层。例如，对于全连接层，其计算模型和上述计算模型相同；对于LSTM层，可以由多个上述计算模型构成；对于卷积层，其原始计算模型为Y _j＝C _j*X _j+b _j，其中“*”为卷积运算，但是根据现有技术可以将卷积运算转化成矩阵乘法运算，即卷积层也可转化成上述计算模型。因此，本申请实施例中的神经网络计算方法可以适用于包括全连接层、卷积层、LSTM等网络层。

需要说明的是，对卷积层进行压缩时，将卷积运算转换成矩阵的乘法后，第一待处理网络层的输入向量的维数为根据卷积核大小经过im2col转换后的输入矩阵矩阵后的宽。该im2col是指将卷积核每次要处理的输入图像上的一个小窗的像素值展开到新矩阵的一行(列)，新矩阵的列(行)数，就是对于一副输入图像，卷积运算的次数(卷积核滑动的次数)。

示例性的，上述基于校正输入向量和神经网络的计算模型，以获得第一待处理网络层的输出向量，可以包括：将第一待处理网络层的权重参数和校正输入向量分别作为神经网络计算模型的权重参数和输入向量进行计算，以获得第一待处理网络层的输出向量。

示例性的，可以将加扰动向量后得到的校正输入向量X' _j和权重参数C _j作为神经网络计算模型的权重参数和输入向量进行计算，该神经网络计算模型的输出向量为Y _j＝C _j×X' _j+b _j，X' _j为神经网络计算模型的校正输入向量，Y _j为第一待处理网络层的输出向量。

本申请实施例提供的神经网络计算方法，通过获取第一待处理网络层的输入向量；根据神经网络的参考随机向量和第一待处理网络层的随机向量的维数，获取第一待处理网络层的扰动向量，其中，扰动向量的维数等于第一待处理网络层的输入向量的维数；将第一待处理网络层的输入向量中的元素与扰动向量中对应位置的元素相乘，以获得第一待处理网络层的校正输入向量；基于校正输入向量和神经网络的计算模型，以获得第一待处理网络层的输出向量。本申请实施例通过在第一待处理网络层的输入向量上加扰动向量，能够减小输出特征图像之间的相关性，加快训练收敛速度，减少精度损失。而且本申请实施例通过神经网络的参考随机向量和第一待处理网络层的随机向量的维数，可以生成与第一待处理网络层的输入向量维数相同的扰动向量，由于第一待处理网络层的随机向量的维数小于输入向量的维数，因此，仅需增加极少的存储资源和计算资源，即可保证神经网络的准确度和收敛速度得到有效提升。

本申请还提供一实施例，如图5所示，在上述步骤S404之前，还可以包括步骤S405。

S405、将第一待处理网络层的权重参数解压为压缩矩阵对应的分块结构化的矩阵。

可以理解的，可由图2中所示的解压模块105执行步骤S405。

示例性的，由于第一待处理网络的权重参数为分块结构化的矩阵对应的压缩矩阵，因此，在计算第一待处理网络层的输出向量之前，可以先将权重参数C _j解压，获得该权重参数(压缩矩阵)对应的分块结构化矩阵W _j，再采用该分块结构化的矩阵和输入向量进行矩阵相乘计算输出向量。

示例性的，上述第一待处理网络层的输出向量具体为：Y _m＝W _m×X' _m+b _m，其中，Y _m为第一待处理网络层的输出向量，X' _m为第一待处理网络层的校正输入向量，W _m为第一待处理网络层的权重参数对应的分块结构化的矩阵，b _m为第一待处理网络层的预设偏置值。

示例性的，若采用图2中的解压模块105将权重参数解压为分块结构化矩阵(如图5所示的计算方法)，可以通过图2中的第二计算模块104进行矩阵乘法运算，获取第一待处理网络层的输出向量。若不采用解压模块105(如图4所示的计算方法)，可以直接通过图1中的第二计算模块104采用快速傅里叶变换计算第一待处理网络层的输出向量。

本申请实施例提供的神经网络计算方法，通过获取第一待处理网络层的输入向量；根据神经网络的参考随机向量和第一待处理网络层的随机向量的维数，获取第一待处理网络层的扰动向量，其中，扰动向量的维数等于第一待处理网络层的输入向量的维数；将第一待处理网络层的输入向量中的元素与扰动向量中对应位置的元素相乘，以获得第一待处理网络层的校正输入向量；将第一待处理网络层的权重参数解压为压缩矩阵对应的分块结构化的矩阵；基于校正输入向量和神经网络的计算模型，以获得第一待处理网络层的输出向量。本申请实施例通过在第一待处理网络层的输入向量上加扰动向量，能够减小输出特征图像之间的相关性，加快训练收敛速度，减少精度损失。而且本申请实施例通过神经网络的参考随机向量和第一待处理网络层的随机向量的维数，可以生成与第一待处理网络层的输入向量维数相同的扰动向量，由于第一待处理网络层的随机向量的维数小于输入向量的维数，因此，仅需增加极少的存储资源和计算资源，即可保证神经网络的准确度和收敛速度得到有效提升。

本申请提供又一实施例，如图6所示，上述方法还可以包括步骤S601-S603。

S601、根据第一待处理网络层的权重参数和第一待处理网络层的输入向量的维数确定第一待处理网络层的随机向量的维数。

可以理解的，可由图3中所示的第一确定模块301执行步骤S601。

示例性的，上述基于第一待处理网络层的权重参数和第一待处理网络层的输入向量的维数，确定第一待处理网络层的随机向量的维数可以包括：确定目标区间，该目标区间的两个区间端点分别为第一待处理网络层的权重参数对应的分块结构化的矩阵的分块尺寸和第一待处理网络层的输入向量的维数；在该目标区间内随机确定第一待处理网络层的随机向量的维数。例如，若当前神经网络中第一待处理网络层的分块循环矩阵的分块尺寸为32，该神经网络的输入向量的维数为800，第一待处理网络层的随机向量的维数可以在(32，800)区间内随机选取一个整数，例如可以为40。

可以理解的，本申请实施例中的神经网络可以包括一个或多个第一待处理网络层，当神经网络包括多个第一待处理网络层时，该多个第一待处理网络层的随机向量的维数可以相同也可以不同，本申请实施例对此并不进行限定。

S602、确定全部第一待处理网络层的随机向量的维数中的最大值，作为神经网络的参考随机向量的维数。

可以理解的，可由图3中所示的第二确定模块302执行步骤S602。

示例性的，当神经网络的多个网络层包括多个第一待处理网络层时，确定所有第一待处理网络层的随机向量的维数中的最大值为神经网络的参考随机向量的维数。例如，神经网络包括5个第一待处理网络层时，这5个第一待处理网络层的随机向量的维数分别为：40、35、50、46、55，那么该神经网络的参考随机向量的维数为这5个第一待处理网络层的随机向量的维数的最大值，即为55。

S603、基于预设的随机数生成模型，生成满足参考随机向量的维数的随机数。

可以理解的，可由图3中所示的生成模块303执行步骤S603。

示例性的，可以根据预设的随机数生成模型和上述参考随机向量的维数，生成一组满足参考随机向量的维数的随机数，该满足参考随机向量的维数的随机数即为参考随机向量。例如，该随机数生成模型可以为服从二项分布的符号向量，若该参考随机向量的维数为55，可以生成一个维数为55的符号向量[1,-1,1,1,-1…1,-1]，参考随机向量可以记为A，A可以为A＝[1,-1,1,1,-1…1,-1]。本申请实施例对于该随机数生成模型的具体形式并不进行限定，任何一种随机数生成模型均在本申请实施例的保护范围内，在此仅是示例性说明。

需要说明的是，本申请实施例中的步骤S601-S603确定基础随机向量的过程可以是在下述神经网络模型训练之前执行，对神经网络进行前向计算时可以根据神经网络模型训练获取的每个网络层的权重参数、以及模型训练前生成的参考随机向量和第一待处理网络层的随机向量的维数采用步骤S401-S406的神经网络计算方法计算神经网络的输出向量。

本申请还提供又一实施例，在神经网络包含多个第一待处理网络层时，多个第一待处理网络层中不同的第一待处理网络层可以采用相同的计算方法(如图4或图5所示的计算方法)，也可以采用不同的计算方法。当多个不同的第一待处理网络层采用不同的计算方法时，其中一部分第一待处理网络层可以采用图5和图6所示的计算方法，另一部分第一待处理网络层可以采用图7所示的计算方法。如图7所示，该方法包括步骤S701-S703。

S701、获取第一待处理网络层的输入向量。

可以理解的，可由图1或图2中所示的第一获取模块101执行步骤S701。

S702、将第一待处理网络层的权重参数解压为压缩矩阵对应的分块结构化的矩阵。

可以理解的，可由图2中所示的解压模块105执行步骤S702。

示例性的，由于第一待处理网络的权重参数为分块结构化的矩阵对应的压缩矩阵，因此，在计算第一待处理网络层的输出向量之前，可以先将权重参数C _n解压，获得该权重参数(压缩矩阵)对应的分块结构化矩阵W _n。

S703、根据第一待处理网络层的输入向量和神经网络的计算模型，以获得第一待处理网络层的输出向量。

可以理解的，可由图1或图2中所示的第二计算模块104执行步骤S703。

示例性的，该第一待处理网络层的输出向量为Y _n＝W _n×X _n+b _n，其中，Y _n为第一待处理网络层的输出向量，X _n为第一待处理网络层的输入向量，W _n为第一待处理网络层的权重参数对应的分块结构化的矩阵，b _n为第一待处理网络层的预设偏置值。

需要说明的是，对于神经网络包含的一个或多个第一处理网络层中的哪些第一待处理网络层采用图5所示的计算方式计算该网络层的输出，哪些第一待处理网络层采用图7所示的计算方式计算该网络层的输出，本申请实施例并不进行限定，具体可根据实际的网络结构确定。但是，采用本申请实施例的神经网络计算方法时，至少应该有一个第一待处理网络层采用图5所示的计算方式计算该网络层的输出向量。

本申请还提供另一实施例，若神经网络包含的多个网络层中除第一待处理网络层以外，还包括一个或多个第二待处理网络层，对于该一个或多个第二待处理网络层可以通过本申请实施例中的计算方法计算任意一个第二待处理网络层的输出向量。如图8所示，该计算方法可以包括步骤S801-S802。

S801、获取第二待处理网络层的输入向量。

可以理解的，可由图1或图2中所示的第一获取模块101执行步骤S801。

该第二待处理网络层是指神经网络的多个网络层中，权重参数为无结构化的矩阵的网络层。该无结构化的矩阵是指该矩阵没有按照一定的规律排列，且不可以用唯一确定该结构化矩阵的最小元素集合表示。如下式中的矩阵A为无结构化的矩阵，无法进行压缩，也不存在压缩矩阵。

示例性的，该第二待处理网络层为神经网络的第一个网络层时，该第二待处理网络层的输入向量为神经网络的输入向量；当该第二待处理网络层为除第一个网络层以外的任一网络层时，该第二待处理网络层的输入向量为该第二待处理网络层的前一网络层的输出向量。

S802、根据第二待处理网络层的输入向量和神经网络的计算模型，以获得第二待处理网络的输出向量。

可以理解的，可由图1或图2中所示的第二计算模块104执行步骤S802。

示例性的，该第二待处理网络的输出向量为Y _i＝C _i×X _i+b _i，其中，Y _i为第二待处理网络层的输出向量，X _i为第二待处理网络层的输入向量，C _i为第二待处理网络层的权重参数，b _i为第二待处理网络层的预设偏置值。由于该第二待处理网络层的权重参数为无结构化的矩阵，C _i＝W _i，因此该第二待处理网络层的输出向量可以直接根据该第二待处理网络层的输入向量和权重参数以及预设偏置值进行计算，无需对权重参数进行解压处理。

如图9所示，为在MNIST数据库上采用2层卷积和1层全连接层构成的卷积神经网络上实验的效果图，其中，第二层卷积层为第一待处理网络层，第一层卷积层和第三层全连接层为第二待处理网络。图9中的横坐标表示迭代次数，纵坐标表示精度，×拦腰加直线表示分块循环矩阵的分块尺寸为32时，采用现有技术中不加符号向量的方式得到的效果图；直线表示分块循环矩阵的分块尺寸为32时，采用循环移位的方式获得扰动向量，对于第一待处理网络层采用图5所示的神经网络计算方法，对于第二待处理网络层采用图8所示的神经网络计算方法得到的效果图；三角拦腰加直线表示分块循环矩阵的分块尺寸为40时，采用向量元素复制(内容复制)的方式获得扰动向量，对于第一待处理网络层采用图5所示的神经网络计算方法，对于第二待处理网络层采用图8所示的神经网络计算方法得到的效果图；虚点线表示分块循环矩阵的分块尺寸为40时，采用循环移位的方式获得扰动向量，对于第一待处理网络层采用图5所示的神经网络计算方法，对于第二待处理网络层采用图8所示的神经网络计算方法得到的效果图。

结合图9所示，当分块尺寸为32时，由于分块尺寸较大，采用现有技术中不加符号向量的计算方式时，网络并不能收敛，因此不能实现32倍的压缩。而采用本申请实施例中循环移位获取第一待处理网络层的扰动符号向量，根据上述实施例的神经网络计算方法，能够使网络迅速收敛，相对于现有技术的有益效果是非常明显的。而且当分块尺寸为40时，采用本申请实施例中内容复制(向量元素复制)和内容循环移位的方式生成第一待处理网络层的扰动向量，并对上述网络层采用图5和图8所示的计算方法时，网络能够收敛，且采用循环移位时，网络的收敛速度更快，准确度较高。因此，采用本申请实施例中的神经网络计算方法对网络进行前向推理时，能够解决分块循环矩阵压缩神经网络时，分块大小很大时，训练难以收敛，以及精度下降明显的问题。

本申请实施例还提供一种神经网络模型的训练方法，用于在神经网络计算之前获得神经网络中每个网络层的权重参数，如图10所示，该神经网络模型的训练方法包括步骤S1001-S1004。

S1001、初始化每个网络层的权重参数。

示例性的，将神经网络包含的一个或多个第一待处理网络网络层以及一个或多个第二待处理网络层中的每个网络层的权重参数初始化。

S1002、根据每个网络层对应的神经网络计算模型进行神经网络计算，以获得神经网络的临时输出向量。

其中，该神经网络计算模型的权重参数为初始化的权重参数。

示例性的，上述根据每个网络层对应的神经网络计算模型进行神经网络计算，可以包括：

对于第一网络层集合中的第一待处理网络层，其临时输出向量为：Y _m0＝W _m0×X' _m+b _m，其中，Y _m0为第一待处理网络层的临时输出向量，X' _m为第一待处理网络层的校正输入向量，W _m0为第一待处理网络层的初始化的权重参数对应的分块结构化的矩阵，b _m为第一待处理网络层的预设偏置值。

对于第二网络层集合中的第一待处理网络层，其临时输出向量为：Y _n0＝W _n0×X _n+b _n，其中，Y _n0为第二网络层集合中的第一待处理网络层的临时输出向量，X _n为第二网络层集合中的第一待处理网络层的输入向量，W _n0为第二网络层集合中的第一待处理网络层的初始化的权重参数对应的分块结构化的矩阵，b _n为第二网络层集合中的第一待处理网络层的预设偏置值。

对于第二待处理网络层，其临时输出向量为：Y _i0＝C _i0×X _i+b _i，其中，Y _i为第二待处理网络层的临时输出向量，X _i为第二待处理网络层的输入向量，C _i为第二待处理网络层的初始化的权重参数，b _i为第二待处理网络层的预设偏置值。

示例性的，当神经网络的多个网络层中仅包含第一待处理网络时，可以根据图4或图5所示的计算方法，对每个网络层进行神经网络计算；或者，当神经网络的多个网络层中仅包含第一待处理网络时，也可以根据图4或图5所示的计算方法，以及图 7所示的计算方法，对相应网络层进行神经网络计算；或者，当神经网络的多个网络层中包含第一待处理网络层和第二待处理网络层时，可以根据图4或图5所示的计算方法，以及图8所述的计算方法，对相应网络层进行神经网络计算；或者，当神经网络的多个网络层中包含第一待处理网络层和第二待处理网络层时，也可以根据图4或图5所示的计算方法，以及图7和图8所述的计算方法，对相应网络层进行神经网络计算。具体采用上述何种计算方法可以根据实际应用的网络架构确定，在此并不进行限定。需要说明的是，本申请实施例在训练过程对每个网络层采用的计算方式与神经网络推理过程采用的计算方式应相同。

S1003、通过神经网络的反向传递，更新每个网络层的权重参数。

示例性的，以更新后的每个网络层的权重参数作为每个网络层对应的神经网络计算模型的权重参数，重复步骤S1002-S1003，直到神经网络的临时输出向量和神经网络的预设输出向量的差异小于预设值。

示例性的，神经网络的临时输出向量与神经网络的预设输出向量的差异小于预设值时，该神经网络的权重参数可以使得训练收敛。本申请实施例对于该预设值的取值并不进行限定，具体可以根据实际应用确定。

S1004、获取每个网络层的权重参数。

示例性的，神经网络训练收敛时的权重参数即为训练好的权重参数，采用该权重参数可以进行上述图4-图8所示的神经网络推理，能够实现更大的压缩比，使得神经网络快速收敛。

示例性的，本申请实施例提供的神经网络模型的训练方法在步骤S901之前，还可以包括步骤S601-S603，根据步骤S601-S603确定的参考随机向量和第一待处理网络层的随机向量的维数，采用步骤S1001-S1004的模型训练方法获取每个网络层的权重参数，再进行前述的神经网络计算流程。

本申请实施例提供的神经网络模型的训练方法，通过初始化每个网络层的权重参数；根据每个网络层对应的神经网络计算模型进行神经网络计算，以获得神经网络的临时输出向量；通过神经网络的反向传递，更新每个网络层的权重参数，并以更新后的每个网络层的权重参数作为每个网络层对应的神经网络计算模型的权重参数，重复计算，直至神经网络的临时输出向量和神经网络的预设输出向量的差异小于预设值，获取每个网络层的权重参数。本申请实施例的训练过程通过在第一待处理网络层的输入向量上加扰动向量获取校正输入向量，并通过校正输入向量进行神经网络训练，能够减小输出特征图像之间的相关性，加快训练收敛速度，减少精度损失。

上述主要从方法步骤的角度对本发明实施例提供的方案进行了介绍。可以理解的是，计算机为了实现上述功能，其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，本申请能够以硬件和计算机软件的结合形式来实现。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

本申请实施例可以根据上述方法示例对计算机进行功能模块的划分，例如，可以对应各个功能划分各个功能模块，也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。需要说明的是，本发明实施例中对模块的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

在采用对应各个功能划分各个功能模块的情况下，图11示出了上述实施例中所涉及的神经网络计算装置的一种可能的结构示意图，该神经网络计算装置1100包括：第一获取单元1101、第二获取单元1102、第一计算单元1103、第二计算单元1104以及解压单元1105。第一获取单元1101用于支持神经网络计算装置1100执行图4中的S401，或图7中的S701，或图8中的S801；第二获取单元1102用于支持神经网络计算装置1100执行图4中的S402；第一计算单元1103用于支持神经网络计算装置1100执行图4中的S403；第二计算单元1104用于支持神经网络计算装置1100执行图4中的S404，或图7中的S703，或图8中的S802；解压单元1105用于支持神经网络计算装置1100执行图5中的S405，或图7中的S702。其中，上述方法实施例涉及的各步骤的所有相关内容均可以援引到图1或图2所示的对应功能模块的功能描述，在此不再赘述。

在采用对应各个功能划分各个功能模块的情况下，图12示出了上述实施例中所涉及的神经网络模型训练装置的一种可能的结构示意图，该神经网络模型训练装置1200包括：初始化单元1201、第一确定单元1202、第二确定单元1203、生成单元1204、神经网络计算单元1205、反向传递单元1206以及获取单元1207。初始化单元1201用于支持神经网络模型训练装置1200执行图10中的S1001；第一确定单元1202用于支持神经网络模型训练装置1200执行图6中的S601；第二确定单元1203用于支持神经网络模型训练装置1200执行图6中的S602；生成单元1204用于支持神经网络模型训练装置1200执行图6中的S603；神经网络计算单元1205用于支持神经网络模型训练装置1200执行图10中的S1002；反向传递单元1206用于支持神经网络模型训练装置1200执行图10中的S1003；获取单元1207用于支持神经网络模型训练装置1200执行图10中的S1004。

在采用集成的单元的情况下，图13示出了上述实施例中所涉及的神经网络计算装置1300的一种可能的结构示意图。该神经网络计算装置1300包括：存储模块1301和处理模块1302。处理模块1302用于对计算机的动作进行控制管理，例如，处理模块1302用于支持神经网络计算装置1300执行图4中的S401-S404，或图5中的S401-S405，或图6中的S601-S603，或图7中的S701-S703，或图8中的S801-S802，和/或用于本文所描述的技术的其它过程。存储模块1301，用于存储计算机的程序代码和数据。另一种实现，上述实施例所涉及的神经网络计算装置的结构还可以为包括处理器和接口，处理器和接口通信，处理器用于执行本发明实施例。处理器可以是CPU，也可以是其他硬件，如现场可编程门阵列(Field－Programmable Gate Array，FPGA)等，或者两者的组合。

在采用集成的单元的情况下，图14示出了上述实施例中所涉及的神经网络模型训练装置1400的一种可能的结构示意图。该神经网络模型训练装置1400包括：存储模块1401和处理模块1402。处理模块1402用于对神经网络模型训练装置1400的动作进行控制管理，例如，处理模块1402用于支持神经网络模型训练装置1400执行图6中的S601-S703，或图10中的S1001-S1004，和/或用于本文所描述的技术的其它过程。存储模块1401，用于存储计算机的程序代码和数据。另一种实现，上述实施例所涉及的神经网络模型训练装置的结构还可以为包括处理器和接口，处理器和接口通信，处理器用于执行本发明实施例。处理器可以是CPU，也可以是其他硬件，如现场可编程门阵列(Field－Programmable Gate Array，FPGA)等，或者两者的组合。

结合本申请公开内容所描述的方法或者算法的步骤可以硬件的方式来实现，也可以是由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成，软件模块可以被存放于随机存取存储器(Random Access Memory，RAM)、闪存、可擦除可编程只读存储器(Erasable Programmable ROM，EPROM)、电可擦可编程只读存储器(Electrically EPROM，EEPROM)、寄存器、硬盘、移动硬盘、只读光盘(CD-ROM)或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器，从而使处理器能够从该存储介质读取信息，且可向该存储介质写入信息。当然，存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外，该ASIC可以位于核心网接口设备中。当然，处理器和存储介质也可以作为分立组件存在于核心网接口设备中。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质，其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本发明的保护范围之内。

Claims

一种神经网络计算方法，其特征在于，所述神经网络包括多个网络层，所述多个网络层中包括第一待处理网络层，所述方法包括：

获取所述第一待处理网络层的输入向量；

根据所述神经网络的参考随机向量和所述第一待处理网络层的随机向量的维数，获取所述第一待处理网络层的扰动向量，其中，所述扰动向量的维数等于所述第一待处理网络层的输入向量的维数，所述第一待处理网络层的随机向量的维数是基于所述第一待处理网络层的权重参数和所述第一待处理网络层的输入向量的维数确定的；

将所述第一待处理网络层的输入向量中的元素与所述扰动向量中对应位置的元素相乘，以获得所述第一待处理网络层的校正输入向量；

基于所述校正输入向量和所述神经网络的计算模型，以获得所述第一待处理网络层的输出向量。
根据权利要求1所述的神经网络计算方法，其特征在于，当所述第一待处理网络层为所述神经网络的输入层时，所述获取所述第一待处理网络层的输入向量，包括将所述神经网络的输入向量作为所述第一待处理网络层的输入向量；当所述第一待处理网络层不为所述神经网络的输入层时，所述获取所述第一待处理网络层的输入向量，包括将所述第一待处理网络层的前一网络层的输出向量作为所述第一待处理网络层的输入向量。
根据权利要求1或2所述的神经网络计算方法，其特征在于，所述第一待处理网络层的输入向量为{x1,x2…xn}，所述扰动向量为{y1,y2…yn}，所述第一待处理网络层的校正输入向量为{x1×y1,x2×y2…xn×yn}，其中，n为正整数。
根据权利要求1至3任一项所述的神经网络计算方法，其特征在于，所述神经网络计算模型包括：

Y _j＝C _j×X _j+b _j，其中，Y _j为所述神经网络计算模型的输出向量，X _j为所述神经网络计算模型的输入向量，C _j为所述神经网络计算模型的权重参数，b _j为所述神经网络计算模型的预设偏置值，所述神经网络计算模型用于所述多个网络层中第j层的神经网络计算，j为整数。
根据权利要求4所述的神经网络计算方法，其特征在于，所述基于所述校正输入向量和所述神经网络的计算模型，以获得所述第一待处理网络层的输出向量，包括：

将所述第一待处理网络层的权重参数和校正输入向量分别作为所述神经网络计算模型的权重参数和输入向量进行计算，以获得所述第一待处理网络层的输出向量。
根据权利要求4或5所述的神经网络计算方法，其特征在于，所述权重参数为分块结构化的矩阵对应的压缩矩阵，其中，所述分块结构化的矩阵由所述压缩矩阵唯一确定，在所述基于所述校正输入向量，通过神经网络计算，以获得所述第一待处理网络层的输出向量之前，所述方法还包括：

将所述权重参数解压为所述压缩矩阵对应的分块结构化的矩阵。
根据权利要求6所述的神经网络计算方法，其特征在于，基于所述第一待处理网络层的权重参数和所述第一待处理网络层的输入向量的维数，确定所述第一待处理网络层的随机向量的维数，包括：

确定目标区间，所述目标区间的两个区间端点分别为所述第一待处理网络层的权重参数对应的分块结构化的矩阵的分块尺寸和所述第一待处理网络层的输入向量的维数；

在所述目标区间内随机确定所述第一待处理网络层的随机向量的维数。
根据权利要求1至7任一项所述的神经网络计算方法，其特征在于，所述多个网络层包括多个第一待处理网络层，在所述根据所述神经网络的参考随机向量和所述第一待处理网络层的随机向量的维数，获取所述第一待处理网络层的扰动向量之前，还包括：

确定全部所述第一待处理网络层的随机向量的维数中的最大值，作为所述神经网络的参考随机向量的维数；

基于预设的随机数生成模型，生成满足所述参考随机向量的维数的随机数；

将所述生成的随机数组成所述参考随机向量。
根据权利要求1至8任一项所述的神经网络计算方法，其特征在于，根据所述神经网络的参考随机向量和所述第一待处理网络层的随机向量的维数，获取所述第一待处理网络层的扰动向量，包括：

在所述参考随机向量中截取与所述第一待处理网络层的随机向量的维数相等的向量作为所述第一待处理网络层的随机向量；

对所述第一待处理网络层的随机向量采用循环移位或者向量元素复制的方式生成与所述第一待处理网络层的输入向量的维数相等的向量作为所述第一待处理网络层的扰动向量。
一种神经网络模型的训练方法，用于获得神经网络中每个网络层的权重参数，其特征在于，所述方法包括：

步骤1、初始化所述每个网络层的权重参数；

步骤2、根据所述每个网络层对应的神经网络计算模型进行神经网络计算，以获得所述神经网络的临时输出向量，其中，所述神经网络计算模型的权重参数为所述初始化的权重参数，所述根据所述每个网络层对应的神经网络计算模型进行神经网络计算，包括根据权利要求1至9任一项所述的神经网络计算方法，对所述每个网络层中的一个或多个所述第一待处理网络层进行神经网络计算；

步骤3、通过所述神经网络的反向传递，更新所述每个网络层的权重参数；

以所述更新后的每个网络层的权重参数作为所述每个网络层对应的神经网络计算模型的权重参数，重复步骤2和步骤3，直到所述临时输出向量和所述神经网络的预设输出向量的差异小于预设值；

步骤4、获取所述每个网络层的权重参数。
一种神经网络计算装置，其特征在于，所述神经网络包括多个网络层，所述多个网络层中包括第一待处理网络层，所述装置包括：

第一获取单元，用于获取所述第一待处理网络层的输入向量；

第二获取单元，用于根据所述神经网络的参考随机向量和所述第一待处理网络层的随机向量的维数，获取所述第一待处理网络层的扰动向量，其中，所述扰动向量的维数等于所述第一待处理网络层的输入向量的维数，所述第一待处理网络层的随机向量的维数是根据所述第一待处理网络层的权重参数和所述第一待处理网络层的输入向量的维数确定的；

第一计算单元，用于将所述第一待处理网络层的输入向量中的元素与所述第二获取单元获取的所述扰动向量中对应位置的元素相乘，以获得所述第一待处理网络层的校正输入向量；

第二计算单元，用于基于所述第一计算单元获得的所述校正输入向量和所述神经网络的计算模型，以获得所述第一待处理网络层的输出向量。
根据权利要求11所述的神经网络计算装置，其特征在于，当所述第一待处理网络层为所述神经网络的输入层时，所述获取单元具体用于获取所述神经网络的输入向量；当所述第一待处理网络层不为所述神经网络的输入层时，所述获取单元具体用于获取所述第一待处理网络层的前一网络层的输出向量。
根据权利要求11或12所述的神经网络计算装置，其特征在于，所述第一待处理网络层的输入向量为{x1,x2…xn}，所述扰动向量为{y1,y2…yn}，所述第一待处理网络层的校正输入向量为{x1×y1,x2×y2…xn×yn}，其中，n为正整数。
根据权利要求11至13任一项所述的神经网络计算装置，其特征在于，所述神经网络计算模型包括：

Y _j＝C _j×X _j+b _j，其中，Y _j为所述神经网络计算模型的输出向量，X _j为所述神经网络计算模型的输入向量，C _j为所述神经网络计算模型的权重参数，b _j为所述神经网络计算模型的预设偏置值，所述神经网络计算模型用于所述多个网络层中第j层的神经网络计算，j为整数。
根据权利要求14所述的神经网络计算装置，其特征在于，所述第二计算单元具体用于：将所述第一待处理网络层的权重参数和校正输入向量分别作为所述神经网络计算模型的权重参数和输入向量进行计算，以获得所述第一待处理网络层的输出向量。
根据权利要求14或15所述的神经网络计算装置，其特征在于，所述权重参数为分块结构化的矩阵对应的压缩矩阵，其中，所述分块结构化的矩阵由所述压缩矩阵唯一确定，所述装置还包括解压单元，

所述解压单元，用于将所述权重参数解压为所述压缩矩阵对应的分块结构化的矩阵。
根据权利要求16所述的神经网络计算装置，其特征在于，所述装置还包括第一确定单元，

所述第一确定单元，用于确定目标区间，所述目标区间的两个区间端点分别为所述第一待处理网络层的权重参数对应的分块结构化的矩阵的分块尺寸和所述第一待处理网络层的输入向量的维数；

所述第一确定单元，还用于在所述目标区间内随机确定所述第一待处理网络层的随机向量的维数。
根据权利要求11至17任一项所述的神经网络计算装置，其特征在于，所述多个网络层包括多个第一待处理网络层，所述装置还包括：第二确定单元和生成单元，

所述第二确定单元，还用于确定全部所述第一待处理网络层的随机向量的维数中的最大值，作为所述神经网络的参考随机向量的维数；

所述生成单元，用于基于预设的随机数生成模型，生成满足所述参考随机向量的维数的随机数，将所述生成的随机数组成所述参考随机向量。
根据权利要求11至18任一项所述的神经网络计算装置，其特征在于，

所述第二获取单元，具体用于在所述参考随机向量中截取与所述第一待处理网络层的随机向量的维数相等的向量作为所述第一待处理网络层的随机向量；

所述第二获取单元，具体用于对所述第一待处理网络层的随机向量采用循环移位或者向量元素复制的方式生成与所述第一待处理网络层的输入向量的维数相等的向量作为所述第一待处理网络层的扰动向量。
一种神经网络模型的训练装置，用于获得神经网络中每个网络层的权重参数，其特征在于，所述装置包括：

初始化单元，用于初始化所述每个网络层的权重参数；

神经网络计算单元，用于根据所述每个网络层对应的神经网络计算模型进行神经网络计算，以获得所述神经网络的临时输出向量，其中，所述神经网络计算模型的权重参数为所述初始化的权重参数；

所述神经网络计算单元，具体用于根据权利要求1至9任一项所述的神经网络计算方法，对所述每个网络层中的一个或多个所述第一待处理网络层进行神经网络计算；

反向传递单元，用于通过所述神经网络的反向传递，更新所述每个网络层的权重参数；

获取单元，用于获取所述每个网络层的权重参数，所述每个网络层的权重参数是在所述神经网络的临时输出向量和所述神经网络的预设输出向量的差异小于预设值时获取的。
一种计算机存储介质，所述计算机存储介质中存储有计算机程序代码，其特征在于，当所述计算机程序代码在处理器上运行时，使得所述处理器执行如权利要求1-9任一项所述的神经网络计算方法，或执行权利要求10所述的神经网络模型的训练方法。