CN114662679B

CN114662679B - 一种基于神经网络的数据处理方法

Info

Publication number: CN114662679B
Application number: CN202210546510.3A
Authority: CN
Inventors: 袁学鹏; 凌明; 杨作兴; 艾国
Original assignee: Shenzhen MicroBT Electronics Technology Co Ltd
Current assignee: Shenzhen MicroBT Electronics Technology Co Ltd
Priority date: 2022-05-20
Filing date: 2022-05-20
Publication date: 2022-09-06
Anticipated expiration: 2042-05-20
Also published as: CN114662679A

Abstract

本发明提供了一种基于神经网络的输入数据预处理方法，神经网络包括第一处理层以及至少一个后级处理层，方法包括：由第一处理层获取并保存预先得到的神经网络训练过程中统计得到的训练图像数据的方差以及均值；根据该方差和均值，对原始的权重和偏置量进行更新；当第一处理层每次接收到待处理数据时，直接基于更新后的权重和更新后的偏置量对待处理数据进行计算，并得到计算结果；将计算结果输出至后级处理层；本发明将神经网络的数据预处理过程融合到神经网络的第一处理层中，达到等效的预处理效果，省略了每次输入数据时均需要的预处理操作，减小了运算资源的占用，同时也缩短了现有的预处理方法所产生的延时。

Description

一种基于神经网络的数据处理方法

技术领域

本发明涉及神经网络技术领域，具体地说，本发明涉及一种基于神经网络的输入数据预处理方法。

背景技术

神经网络在训练时，为了达到良好的训练效果，通常会对每个输入的数据做预处理，使其数据分布更有利于神经网络的训练。常见的预处理计算的算法如下式（1）所示：

(1)

其中，x表示待处理的输入数据，mean表示数据的均值，std表示数据的方差，

表示经预处理计算后的数据。

而在神经网络部署时，同样需要对每次要预测的输入数据做相同的预处理以确保输入数据分布与训练模型时对齐。

发明内容

有鉴于此，本发明旨在提供一种基于神经网络的输入数据预处理方法。

本发明提供了一种基于神经网络的输入数据预处理方法，所述神经网络包括第一处理层以及至少一个后级处理层，所述基于神经网络的输入数据预处理方法包括：由第一处理层获取并保存预先得到的所述神经网络训练过程中统计得到的训练图像数据的方差以及均值；根据所述训练图像数据的方差和均值，对原始的权重和偏置量进行更新，得到更新后的权重和更新后的偏置量；当所述第一处理层每次接收到待处理数据时，直接基于更新后的权重和更新后的偏置量对待处理数据进行计算，并得到计算结果；将所述计算结果输出至所述后级处理层。

在一个实施方式中，所述图像数据经由多个输入通道输入至所述第一处理层。

在一个实施方式中，所述多个输入通道包括分别表征R、G、B三色的三个输入通道。

在一个实施方式中，根据所述训练图像数据的方差和均值，对原始的权重和偏置量进行更新，得到更新后的权重和更新后的偏置量，包括：将原始的权重系数除以对应输入通道的所述训练图像数据的方差，得到更新后的权重系数；对于卷积层的每个卷积核，将该卷积核中各通道的更新后的权重系数与对应输入通道的所述训练图像数据的均值分别做乘法然后再进行累加运算得到运算结果，再由原始的偏置量减去所述运算结果，得到更新后的偏置量。

在一个实施方式中，所述的神经网络输入数据预处理方法，包括：所述第一处理层为卷积神经网络的卷积层；当所述第一处理层每次接收到待处理数据时，直接基于更新后的权重和更新后的偏置量对待处理数据进行计算，并得到计算结果，包括：当所述第一处理层为卷积层时，直接基于更新后的权重和更新后的偏置量对待处理数据进行卷积计算，并得到卷积计算结果。

在一个实施方式中，所述直接基于更新后的权重和更新后的偏置量对待处理数据进行卷积计算，并得到卷积计算结果，包括：用所述卷积层中每一卷积核中的全部更新后的权重与待处理数据做卷积运算，所得结果再与相应的更新后的偏置量相加，得到卷积计算结果。

本发明的另一方面提供了一种神经网络输入数据预处理装置，包括：接收单元，用于获取预先得到的所述神经网络训练过程中统计得到的训练图像数据的方差以及均值；存储单元，用于保存所述接收单元接收到的训练图像数据的方差以及均值；更新单元，用于根据所述训练图像数据的方差和均值，对原始的权重和偏置量进行更新，得到更新后的权重和更新后的偏置量；计算单元，用于在所述第一处理层每次接收到待处理数据时，直接基于更新后的权重和更新后的偏置量对待处理数据进行计算，并得到计算结果；发送单元，用于将所述计算结果输出至所述后级处理层。

本发明的另一方面提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的指令，所述处理器执行所述指令以实现上述任一项所述方法的步骤。

在一个实施方式中，所述处理器为神经网络处理器NPU。

由上面的技术方案可见，本发明将神经网络的输入数据预处理过程融合到神经网络的第一处理层中，达到等效的预处理效果，省略每次输入数据送给第一处理层之前均需要进行的预处理操作（在网络训练阶段和网络部署阶段均适用），进而减小了运算资源的占用，同时也缩短了现有的预处理方法所产生的延时。

附图说明

以下附图仅对本发明做示意性说明和解释，并不限定本发明的范围：

图1A是本领域常见的一种基于神经网络的输入数据预处理方式；

图1B是本领域常见的另一种基于神经网络的输入数据预处理方式；

图2是本发明提供的一种基于神经网络的输入数据预处理方法的实施例的流程示意图；

图3是本发明提供的一种基于神经网络的输入数据预处理方法的实施例的神经网络的结构示意图；

图4示出本发明实施例中的第一处理层的结构示意图；以及

图5是本发明提供的用于实现一种基于神经网络的数据处理方法的装置实施例的示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下参照附图并举实施例，对本发明作进一步详细说明。

在附图中，为了便于说明，已稍微夸大了物体的厚度、尺寸和形状。附图仅为示例而并非严格按比例绘制。

还应理解的是，用语“包括”、“包括有”、“具有”、“包含”和/或“包含有”，当在本说明书中使用时表示存在所陈述的特征、整体、步骤、操作、元件和/或部件，但不排除存在或附加有一个或多个其它特征、整体、步骤、操作、元件、部件和/或它们的组合。此外，当诸如“...中的至少一个”的表述出现在所列特征的列表之后时，修饰整个所列特征，而不是修饰列表中的单独元件。此外，当描述本申请的实施方式时，使用“可以”表示“本申请的一个或多个实施方式”。并且，用语“示例性的”旨在指代示例或举例说明。

如在本文中使用的，用语“基本上”、“大约”以及类似的用语用作表近似的用语，而不用作表程度的用语，并且旨在说明将由本领域普通技术人员认识到的、测量值或计算值中的固有偏差。

除非另外限定，否则本文中使用的所有用语（包括技术用语和科学用语）均具有与本申请所属领域普通技术人员的通常理解相同的含义。还应理解的是，用语（例如在常用词典中定义的用语）应被解释为具有与它们在相关技术的上下文中的含义一致的含义，并且将不被以理想化或过度正式意义解释，除非本文中明确如此限定。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

在预处理计算中，现在常见的技术方案包括：

1、参考图1A，在神经网络输入数据送入NPU前，由CPU来完成对每个数据的上述预处理计算。

2、参考图1B，将数据直接送入NPU，NPU中用单独的指令实现对数据的预处理计算，再将结果输出至神经网络结构中。

由上述现有技术可见，CPU（Central Processing Unit，中央处理器）或NPU（Neural-network Processing Unit，神经网络处理器）会对每个输入的数据进行一次预处理操作，该预处理过程消耗计算资源，在频繁的预测业务场景下，能耗是一笔需要重视的开销，同时产生的预测延时也会在一些应用场景带来较大负面影响。因此，如何简化现有的神经网络预处理步骤，达到节约能耗、减小计算资源的占用以及改善预测延时的效果，是本领域需要解决的一个问题。

图2示出了本发明提供的神经网络输入数据预处理方法的一个实施例流程示意图，神经网络包括第一处理层以及至少一个后级处理层，所述神经网络输入数据预处理方法包括：

S1，由第一处理层获取并保存预先得到的所述神经网络训练过程中统计得到的训练图像数据的方差以及均值；

S2，根据所述训练图像数据的方差和均值，对原始的权重和偏置量进行更新，得到更新后的权重和更新后的偏置量；

S3，当所述第一处理层每次接收到待处理数据时，直接基于更新后的权重和更新后的偏置量对待处理数据进行计算，并得到计算结果；

S4，将所述计算结果输出至所述后级处理层。

下面将分步骤详细介绍本发明的实施例所提供的方法。

S1，由第一处理层获取并保存预先得到的所述神经网络训练过程中统计得到的训练图像数据的方差以及均值。

在本发明提供的实施方式中，第一处理层可以为卷积神经网络的卷积层。

其中，本方案对于常规的卷积神经网络的卷积层，在计算机视觉领域如分类网络，例如轻量化网络mobilenet_v2, 深度残差网络resnet18、resnet50，轻量级网络shufflenet_v1，或检测网络yolov3、yolov5、yolox，以及分割网络pspnet等以及其他任务下的神经网络均适用。

在本发明提供的实施方式中，该图像数据可以经由三个输入通道输入至第一处理层。具体地，三个输入通道包括分别表征R、G、B三色的三个输入通道。

需要进一步说明的是，在本发明提供的实施方式中，图像数据是经由三个输入通道输入至第一处理层的，在网络训练过程中统计图像数据的方差以及均值时，是对每个输入通道单独进行统计，即每个输入通道都有一个与该输入通道的图像数据相对应的方差以及均值，其中包括各输入通道的对应的方差及均值分别相同的可能。

在一实施例中，根据所述训练图像数据的方差和均值，对原始的权重和偏置量进行更新，得到更新后的权重和更新后的偏置量，包括：

将原始的权重系数除以对应输入通道的所述训练图像数据的方差，得到更新后的权重系数；

对于卷积层的每个卷积核，将该卷积核中各通道的更新后的权重系数与对应输入通道的所述训练图像数据的均值分别做乘法然后再进行累加运算得到运算结果，再由原始的偏置量减去所述运算结果，得到更新后的偏置量。

在一实施例中，所述第一处理层为卷积神经网络的卷积层；

当所述第一处理层每次接收到待处理数据时，直接基于更新后的权重和更新后的偏置量对待处理数据进行计算，并得到计算结果，包括：

当所述第一处理层为卷积层时，直接基于更新后的权重和更新后的偏置量对待处理数据进行卷积计算，并得到卷积计算结果。

在一实施例中，所述直接基于更新后的权重和更新后的偏置量对待处理数据进行卷积计算，并得到卷积计算结果，包括：

用所述卷积层中每一卷积核中的全部更新后的权重与待处理数据做卷积运算，所得结果再与相应的更新后的偏置量相加，得到卷积计算结果。

下面将进行详细说明。本领域技术人员应该可以理解，下述实施例只是用于解释说明，不应理解为对本发明的限制。

如下式（2）所示：

y

+

(2)

其中，

表示参与一个卷积计算的滑窗区域里的待处理数据，W表示一个卷积核权重，

表示相应卷积核对应的偏置量，

是一个输出结果，表示该卷积计算一个输出通道上的一个输出结果。

表示一个卷积核一次卷积计算的乘累加过程，k表示卷积滑窗区域里的W、X各自的角标，卷积核shape是[channel_out,channel_in,kernel_h,kernel_w]，那么k 即是遍历n (channel_in*kernel_h*kernel_w - 1)的角标，k从0开始总共求和n次。

具体地，本发明提供的实施方式是基于方差和均值，以及原始的权重系数和原始的偏置量，计算得到用于卷积处理的更新后的权重系数以及更新后的偏置量。

在本发明提供的实施方式中，基于上式（1），可将公式（2）做如下推导：

y

（3）

（4）

（5）

+

）（6）

由上述公式（3）至公式（6）的推导，可得到的更新后的权重系数

以及更新后的偏置量

）。

在一些实施方式中，上述公式（2）可适用于通用公式（7），即，公式7是更精确的表示，比如y，w、x分别用角标标出相应位置以及累加范围，如下式所示：

+ ( -

) (7)

其中：

表示第

个输出通道索引；

、

分别表示输出在

平面上行及列索引；

表示输出的第

通道上，第

行，第

列的输出数值；

表示输入通道数；

表示某个卷积核的kernel空间上的索引，空间大小为

；

表示卷积滑窗区域中输入数据的索引。

基于与公式（2）至公式（6）的推导过程，在一些实施方式中，可以基于相同的思路对公式（7）做出类似的推导过程，以得到更新后的权重系数以及偏置量。

其中，公式（6）或者公式（7）是离线推导完成，将预处理的参数包括方差std以及均值mean融入相应层的参数中去，例如融入第一处理层中。本发明通过一次修改网络模型的方式，节省掉每次在推理输入图像数据前需要对其进行预处理所占用的计算资源。对于频繁调用模型的业务场景，可以起到降低能耗的作用，以及减少处理延时，而不损失精度。

示例性地，参考图3，待处理图像数据经由输入（Input）至第一处理层（Conv1）后，后级处理层可以是常规的卷积神经网络的某一层，其中，常规的分类网络，例如轻量化网络mobilenet_v2, 深度残差网络resnet18、resnet50，轻量级网络shufflenet_v1，或检测网络yolov3、yolov5、yolox，以及分割网络pspnet中的神经网络结构。上述的某一层，例如，卷积神经网络中的池化层（Pooling1）、卷积计算层（Conv2-10）、全连接层（Fullconnection1-2）。其具体结构可根据实施需要进行调整，本文对此将不做限制。

图4示出本发明实施例中的一种神经网络输入数据预处理装置的结构示意图，所述预处理装置可以设置在神经网络的第一处理层，包括：

接收单元，用于获取预先得到的所述神经网络训练过程中统计得到的训练图像数据的方差以及均值；

存储单元，用于保存所述接收单元接收到的训练图像数据的方差以及均值；

更新单元，用于根据所述训练图像数据的方差和均值，对原始的权重和偏置量进行更新，得到更新后的权重和更新后的偏置量；

计算单元，用于在所述第一处理层每次接收到待处理数据时，直接基于更新后的权重和更新后的偏置量对待处理数据进行计算，并得到计算结果；

发送单元，用于将所述计算结果输出至所述后级处理层。

在本发明一实施例中，所述图像数据经由多个输入通道输入至所述第一处理层。

在本发明一实施例中，所述多个输入通道包括分别表征R、G、B三色的三个输入通道。

在本发明一实施例中，所述更新单元将原始的权重系数除以对应输入通道的所述训练图像数据的方差，得到更新后的权重系数；

在本发明一实施例中，所述第一处理层为卷积神经网络的卷积层；所述计算单元用于在所述第一处理层为卷积层时，直接基于更新后的权重和更新后的偏置量对待处理数据进行卷积计算，并得到卷积计算结果。

在本发明一实施例中，所述计算单元用所述卷积层中每一卷积核中的全部更新后的权重与待处理数据做卷积运算，所得结果再与相应的更新后的偏置量相加，得到卷积计算结果。

参见图5，本发明的另一方面提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的指令，处理器执行上述指令以实现如上所述方法的步骤，该方法中的神经网络包括如上所述的第一处理层以及后级处理层。其内容与本发明提供的基于神经网络的输入数据预处理方法源于相同的思路，本文对此不再赘述。

本发明提供的实施例中，处理器可以为神经网络处理器NPU。

综上所述，本发明将神经网络的输入数据预处理过程融合到神经网络的第一计算层中，达到等效的预处理效果，省略了每次输入数据时均需要的预处理操作，减小了运算资源的占用，同时也缩短了现有的预处理方法所产生的延时。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。

Claims

1.一种神经网络输入数据预处理方法，其特征在于，神经网络硬件后端包括第一处理层以及至少一个后级处理层，所述第一处理层还用于神经网络输入数据预处理以省略用于神经网络输入数据预处理的处理器，所述第一处理层包括：

由第一处理层获取并保存预先得到的所述神经网络训练过程中统计得到的训练数据的方差以及均值；

根据所述训练数据的方差和均值，对所述第一处理层的权重和偏置量进行更新，得到更新后的权重和更新后的偏置量；

当所述第一处理层每次接收到待处理数据时，直接基于更新后的权重和更新后的偏置量对待处理数据进行计算，并得到计算结果；

将所述计算结果输出至所述后级处理层。

2.根据权利要求1所述的神经网络输入数据预处理方法，其特征在于，

所述训练数据为图像数据；

所述图像数据经由多个输入通道输入至所述第一处理层。

3.根据权利要求2所述的神经网络输入数据预处理方法，其特征在于，

所述多个输入通道包括分别表征R、G、B三色的三个输入通道。

4.根据权利要求1所述的神经网络输入数据预处理方法，其特征在于，根据所述训练数据的方差和均值，对原始的权重和偏置量进行更新，得到更新后的权重和更新后的偏置量，包括：

将原始的权重系数除以对应输入通道的所述训练数据的方差，得到更新后的权重系数；

对于卷积层的每个卷积核，将该卷积核中各通道的更新后的权重系数与对应输入通道的所述训练数据的均值分别做乘法然后再进行累加运算得到运算结果，再由原始的偏置量减去所述运算结果，得到更新后的偏置量。

5.根据权利要求1所述的神经网络输入数据预处理方法，其特征在于，包括：

所述第一处理层为卷积神经网络的卷积层；

6.根据权利要求5所述的神经网络输入数据预处理方法，其特征在于，所述直接基于更新后的权重和更新后的偏置量对待处理数据进行卷积计算，并得到卷积计算结果，包括：

7.一种神经网络输入数据预处理装置，其特征在于，神经网络硬件后端包括第一处理层以及至少一个后级处理层，该装置应用于第一处理层，用于神经网络输入数据预处理以省略用于神经网络输入数据预处理的处理器，包括：

接收单元，用于获取预先得到的所述神经网络训练过程中统计得到的训练数据的方差以及均值；

存储单元，用于保存所述接收单元接收到的训练数据的方差以及均值；

更新单元，用于根据所述训练数据的方差和均值，对第一处理层的权重和偏置量进行更新，得到更新后的权重和更新后的偏置量；

计算单元，用于在第一处理层每次接收到待处理数据时，直接基于更新后的权重和更新后的偏置量对待处理数据进行计算，并得到计算结果；

发送单元，用于将所述计算结果输出至后级处理层。

8.一种电子设备，其特征在于，包括存储器、处理器及存储在存储器上并可在处理器上运行的指令，所述处理器执行所述指令以实现如权利要求1至6任一项所述方法的步骤。

9.如权利要求8所述的电子设备，其特征在于，所述处理器为神经网络处理器NPU。