CN111860790A

CN111860790A - 一种提高深度残差脉冲神经网络精度以优化图像分类的方法及其系统

Info

Publication number: CN111860790A
Application number: CN202010772308.3A
Authority: CN
Inventors: 李丽; 陈沁雨; 傅玉祥; 何书专; 李伟
Original assignee: Nanjing University
Current assignee: Nanjing University
Priority date: 2020-08-04
Filing date: 2020-08-04
Publication date: 2020-10-30
Anticipated expiration: 2040-08-04
Also published as: CN111860790B

Abstract

本发明涉及一种提高深度残差脉冲神经网络精度以优化图像分类的方法及其系统，本发明所公开的方法以深度残差神经网络向深度残差脉冲神经网络的转化过程为优化对象，在转化过程中对网络层进行解析、标准化、转换，并进行针对性优化，证明了优化后的深度残差脉冲神经网络在复杂图像识别问题上的有效性；该优化方法提出了迭代平均标准化策略，解决了在对残差神经网络结构中的短路连接进行转化时所面临的标准化难题；该算法优化后的深度残差脉冲神经网络稀疏度高、无乘法的算法性质决定了计算的高效性和硬件友好性；在MNIST数据集上测试时，转化后生成的深度残差脉冲神经网络无精度损失，在CIFAR10数据集上测试的结果仅有1.3%的精度损失，优于现有技术水平。

Description

一种提高深度残差脉冲神经网络精度以优化图像分类的方法及其系统

技术领域

本发明涉及深度残差脉冲神经网络领域，具体涉及一种提高深度残差脉冲神经网络精度以优化图像分类的方法及其系统。

背景技术

随着深度学习技术的不断突破，以人工神经网络为核心的人工智能技术正在快速发展。第三代神经网络——脉冲神经网络目的在于填补当下神经科学和机器学习之间的理论差距，它使用最接近拟合生物神经元机制的模型进行计算。脉冲神经网络使用脉冲作为基本作用单元，这是一种发生在时间点上的离散事件。脉冲增强了神经网络对于时空数据处理的能力。空间层面上，神经元仅与附近的神经元连接，这样它们可以分别处理输入块,某种程度上类似于卷积神经网络的滤波器；时间层面上，脉冲随着时间而发生，这样允许我们在脉冲的信息中重新获取编码过程中可能丢失的信息。事实证明，脉冲神经元是比传统人工神经元更强大的计算单元。

经分析，深度神经网络往往是过参数化的，内部存储大量冗余信息，并不是所有的参数和结构都对产生深度神经网络高判别性起作用。对脉冲神经网络的训练依然存在困难，且从神经网络转换脉冲神经网络的研究仍局限于浅层神经网络。

现有技术中因缺乏有效地标准化处理，因深度残差脉冲神经网络的脉冲发射率有大小限制而深度残差神经网络的激活值无大小限制，容易导致所产生的线性不匹配。

发明内容

发明目的：针对深度残差神经网络向深度残差脉冲神经网络的转换过程进行优化，提出一种提高深度残差脉冲神经网络精度以优化图像分类的方法。进一步目的是提供一种执行上述方法的系统。

技术方案：一种提高深度残差脉冲神经网络精度以优化图像分类的方法，该方法是通过优化深度残差神经网络向深度残差脉冲神经网络的转化过程来实现，该转换过程包括：解析、标准化、转换三个步骤，即针对深度残差神经网络中特有的短路连接结构及其他网络结构进行解析、标准化和转换：

解析：构建深度残差神经网络，针对深度神经网络中的多种网络结构进行解析；

标准化：对网络模型中的参数进行标准化处理；

转换：将参数标准化的网络模型转换为深度残差脉冲神经网络。

在进一步的实施例中，所述的解析过程包括：建立深度残差脉冲神经网络的网络层，若对应的深度残差神经网络模型的某网络层具有参数，则将该层的参数加载到已建立的深度残差脉冲神经网络的网络层中。

在进一步的实施例中，在建立深度残差脉冲神经网络的网络层时，如若遇到批标准化层，则将批标准化层所有的参数吸收到上一层脉冲神经网络的卷积层的参数中，以解决脉冲神经网络中不包括批标准化层的限制问题。

在进一步的实施例中，在建立深度残差脉冲神经网络的网络层时，如若遇到深度残差神经网络中所特有的Add层，则对两个维度相同的网络层进行逐点相加。

在进一步的实施例中，对深度残差脉冲神经网络具有参数的网络层，如卷积层、全连接层，进行参数标准化，包括：权重标准化和偏置标准化，从而解决因深度残差脉冲神经网络的脉冲发射率有大小限制而深度残差神经网络的激活值无大小限制，所产生的线性不匹配的问题。

在进一步的实施例中，所述的权重标准化过程是由该层和上一层的缩放因子

所共同确定的，在标准化过程中，首先对参数乘以上一层缩放因子

以恢复大小，然后除以该层缩放因子

再进行缩小：

式中，

表示权重标准化前当前层的参数，

表示经过权重标准化后的参数；

表示当前层的缩放因子，

表示上一层的缩放因子。

在进一步的实施例中，所述的缩放因子通过该层激活值

分布的99.9%的大小来确定：

如若遇到深度残差神经网络的Add层时，将会有两个网络层同时进入该Add层进行运算，因在该层的上一层会同时有两个缩放因子，

和

，该方法将取

和

的中间值，如几何平均值作为上层的统一化缩放因子：

同时对

和

的值进行更新，该方法被称之为迭代平均标准化。所述的偏置标准化过程是通过分析该层的缩放因子所确定的，在标准化过程中，参数将除以该层缩放因子

：

式中，

表示偏置标准化前的当前层参数，

表示经过偏置标准化后的参数。

此时的权重标准化公式为：

为使所得到的深度残差脉冲神经网络精度更高，在遇到短路连接的结构时，对缩放因子加入两个超参数

进行精度补偿，

用于增大在短路结构恒等映射中卷积层的缩放因子，

用于减小在短路结构非恒等映射中卷积层的缩放因子。

基于上述提高深度残差脉冲神经网络精度以优化图像分类的方法，本发明进一步提出一种提高深度残差脉冲神经网络精度以优化图像分类的系统，该系统包括解析模块、标准化处理模块、以及转换处理模块。

在进一步的实施例中，所述解析模块用于建立深度残差脉冲神经网络的基本网络层，若对应的深度残差神经网络模型的某网络层具有参数，则将该网络层的参数加载到已建立的深度残差脉冲神经网络的网络层中；在建立深度残差脉冲神经网络的网络层时，若遇到网络模型中的批标准化层，则将批标准化层所有的参数吸收到上一层脉冲神经网络的卷积层参数中；若遇到深度残差神经网络中所特有的Add层，则对两个维度相同的网络层进行逐点相加；

在进一步的实施例中，所述标准化处理模块用于对深度残差脉冲神经网络中的卷积层和全连接层进行权重标准化和偏置标准化处理；权重标准化由该层和上一层的缩放因子共同确定，在权重标准化过程中，首先对该层的权重参数乘以上一层缩放因子

以恢复大小，然后除以该层缩放因子

再进行缩小：

式中，

表示权重标准化前当前层的参数，

表示经过权重标准化后的参数；

表示当前层的缩放因子，

表示上一层的缩放因子；

缩放因子通过该层激活值

分布的99.9%的大小来确定：

当遇到深度残差神经网络的Add层时，两个网络层同时进入该Add层进行运算，此时该层的上一层同时存在包括

和

在内的两个缩放因子；此时取

和

的几何平均值作为上层的统一化缩放因子：

随后对

和

的值进行更新；

此时的权重标准化公式为：

式中，各符合含义同上；

所述偏置标准化过程通过分析该层的缩放因子所确定，在标准化过程中，参数除以该层缩放因子

：

式中，

表示偏置标准化前的当前层参数，

表示经过偏置标准化后的参数；

在遇到短路连接的结构时，对缩放因子加入两个超参数

进行精度补偿；其中，

用于增大在短路结构恒等映射中卷积层的缩放因子，

用于减小在短路结构非恒等映射中卷积层的缩放因子。

有益效果：本发明涉及一种提高深度残差脉冲神经网络精度以优化图像分类的方法及其系统，通过对深度残差脉冲神经网络具有参数的网络层进行权重标准化和偏置标准化，从而解决因深度残差脉冲神经网络的脉冲发射率有大小限制而深度残差神经网络的激活值无大小限制，所产生的线性不匹配的问题。通过将批标准化层所有的参数吸收到上一层脉冲神经网络的卷积层的参数中，从而解决脉冲神经网络中不包括批标准化层的限制问题。在遇到短路连接的结构时，对缩放因子加入两个超参数

进行精度补偿，

用于增大在短路结构恒等映射中卷积层的缩放因子，

用于减小在短路结构非恒等映射中卷积层的缩放因子，从而使所得到的深度残差脉冲神经网络精度更高。

附图说明

图1是深度神经网络转换至脉冲神经网络流程示意图。

图2是具有三个残差模块的深度残差神经网络示意图。

图3是深度残差脉冲神经网络参数迭代平均标准化算法示意图。

图4是标准化算法使用前后的深度残差神经网络的激活值和深度残差脉冲神经网络的脉冲发射率的关联性对比示意图。

图5 是CIFAR10数据集上深度残差神经网络ResNet20全连接层的激活值分布示意图。

图6 是CIFAR10数据集上深度残差脉冲神经网络ResNet20全连接层的脉冲发射率分布示意图。

图7 是CIFAR10数据集上ResNet20全连接层的激活值和转换后的脉冲发射率差值示意图。

具体实施方式

在下文的描述中，给出了大量具体的细节以便提供对本发明更为彻底的理解。然而，对于本领域技术人员而言显而易见的是，本发明可以无需一个或多个这些细节而得以实施。在其他的例子中，为了避免与本发明发生混淆，对于本领域公知的一些技术特征未进行描述。

本发明涉及一种提高深度残差脉冲神经网络精度以优化图像分类的方法，该方法通过优化深度残差神经网络向深度残差脉冲神经网络的转化过程来实现，如图1所示，该转换过程包括：解析、标准化、转换三个步骤。具体来说，首先在神经网络计算框架Keras中建立一个深度残差神经网络，并对其进行训练，得到一个可进行有效图像识别的网络模型。然后对该网络进行解析，即针对深度神经网络中的多种网络结构进行解析。接着，对网络模型中的参数进行标准化。最后，将参数标准化的网络模型转换为深度残差脉冲神经网络。

所述的解析过程包括：首先根据所获得的深度残差神经网络模型确定深度残差脉冲神经网络中所对应的网络层。在此以包含三个残差结构（短路连接结构）的深度残差神经网络ResNet为例，如图2所示，该网络模型中包含输入层、卷积层、批标准化层、激活层、Add层（对两个维度相同的网络层进行逐点相加）、均值池化层、Flatten层（将多维输入一维化）和全连接层。接着，建立深度残差脉冲神经网络的网络层，若对应的深度残差神经网络某层具有参数，则将参数该层加载到已建立的深度残差脉冲神经网络的网络层。

具体来说，输入层、Flatten层、Add层和均值池化层保持功能不变，直接映射到对应的脉冲网络层；卷积层与全连接层将参数迁移到脉冲神经网络对应的脉冲卷积层和脉冲全连接层，以脉冲神经网络的前向推理方式进行计算；跳过激活层；批标准化层计算公式为

……………………………………………………………(1)

当遇到批标准化层时，将批标准化层所有的参数组合

，

分别以相乘和相加的方式吸收到上一层脉冲神经网络的卷积层的权重和偏置中。

对深度残差脉冲神经网络具有参数的网络层，如卷积层、全连接层，进行参数标准化，包括：权重标准化和偏置标准化。所述的权重标准化过程是通过分析该层和上一层的缩放因子

以恢复大小，然后除以该层缩放因子

再进行缩小。所述的缩放因子通过该层激活值

分布的99.9%的大小来确定，即

………………………………………(2)

权重标准化的公式为

………………………………………………………(3)

如若遇到深度残差神经网络的Add层时，如图2所示，将会有两个网络层同时进入该Add层进行运算，因在该层的上一层会同时有两个缩放因子，

和

，该方法取

和

的某中间值，如几何平均值作为统一的上层的缩放因子，即

…………………………………(4)

在该情况下的权重标准化的公式为

…………………………………………(5)

所述的偏置标准化过程是通过分析该层的缩放因子所确定的，在标准化过程中，参数将除以该层缩放因子

，偏置标准化的公式为

………………………………………………………………(6)

为了使得所得到的深度残差脉冲神经网络精度更高，在遇到短路连接的结构时，对缩放因子加入两个超参数

进行精度补偿，

用于增大在短路结构恒等映射中卷积层的缩放因子，

用于减小在短路结构非恒等映射中卷积层的缩放因子。即在恒等映射中，

……………………………(7)

在非恒等映射中，

…………………………(8)

如图3所示的深度残差脉冲神经网络权重标准化算法详细表述了该迭代平均标准化算法的步骤。首先，遍历每一层带有参数的网络层，对缩放因子进行初始化；然后，针对深度残差神经网络中所特有的残差结构，更新进入Add层的两个缩放因子。

使用上述方法，针对MNIST数据集，对ResNet8、ResNet14和ResNet20网络分别进行实验，实验所得结果表明转化无任何精度损失，并无需使用超参数；使用上述方法，针对CIFAR10数据集，对结构相对复杂的ResNet20网络进行实验，确定超参数

范围在1到1.1之间，

范围在1到1.2之间，实验结果表明转化后的深度残差脉冲神经网络ResNet20精度为90.28%，与原有的深度残差神经网络精度91.58%相比，仅有1.3%的精度损失，处于世界领先水平。相同实验条件下（CIFAR10数据集，网络模型为ResNet20），2019年发表在《Frontiersin Neuroscience》杂志上的 “Going Deeper in Spiking Neural Networks: VGG andResidual Architectures”中显示的精度损失为1.64%。

图4为该ResNet20网络模型的第三层卷积层在迭代平均标准化算法使用与否两种情况下，激活值和脉冲发射率关联性的对比，可见在未使用迭代平均标准化算法时，转化后大量的脉冲发射率发生了严重的溢出情况，将会导致精度下降。如图5、图6、图7所示，在ResNet20最后的全连接层输出的激活值分布与转化后的脉冲发射率分布基本相同，证明了转化后的深度残差脉冲神经网络进行图像分类任务的有效性。

该方法有效的提高了转化后深度残差脉冲神经网络的图像识别精度，实现了以更稀疏的网络来完成图像分类任务的目标。同时，该转化方法的意义还在于，在保证识别精度的前提下，转化后的脉冲神经网络可利用其稀疏度大、无乘法的特性实现高能效硬件友好的计算。

综上，本发明所公开的方法以深度残差神经网络向深度残差脉冲神经网络的转化过程为优化对象，在转化过程中对网络层进行解析、标准化、转换，并进行针对性优化，证明了优化后的深度残差脉冲神经网络在复杂图像识别问题上的有效性；该优化方法提出了迭代平均标准化策略，解决了在对残差神经网络结构中的短路连接进行转化时所面临的标准化难题；该算法优化后的深度残差脉冲神经网络稀疏度高、无乘法的算法性质决定了计算的高效性和硬件友好性；在MNIST数据集上测试时，转化后生成的深度残差脉冲神经网络无精度损失，在CIFAR10数据集上测试的结果仅有1.3%的精度损失，优于现有技术水平。

如上所述，尽管参照特定的优选实施例已经表示和表述了本发明，但其不得解释为对本发明自身的限制。在不脱离所附权利要求定义的本发明的精神和范围前提下，可对其在形式上和细节上做出各种变化。

Claims

1.一种提高深度残差脉冲神经网络精度以优化图像分类的方法，其特征在于包括如下步骤：

步骤1、解析：构建深度残差神经网络，针对深度神经网络中的多种网络结构进行解析；

步骤2、标准化：对网络模型中的参数进行标准化处理；

步骤3、转换：将参数标准化的网络模型转换为深度残差脉冲神经网络。

2.根据权利要求1所述的一种提高深度残差脉冲神经网络精度以优化图像分类的方法，其特征在于，步骤1中所述解析过程进一步包括建立深度残差脉冲神经网络的基本网络层，若对应的深度残差神经网络模型的某网络层具有参数，则将该网络层的参数加载到已建立的深度残差脉冲神经网络的网络层中。

3.根据权利要求1所述的一种提高深度残差脉冲神经网络精度以优化图像分类的方法，其特征在于，步骤1中所述解析过程进一步包括在建立深度残差脉冲神经网络的网络层时，若遇到网络模型中的批标准化层，则将批标准化层所有的参数吸收到上一层脉冲神经网络的卷积层参数中。

4.根据权利要求1所述的一种提高深度残差脉冲神经网络精度以优化图像分类的方法，其特征在于，步骤1中所述解析过程进一步包括在建立深度残差脉冲神经网络的网络层时，若遇到深度残差神经网络中所特有的Add层，则对两个维度相同的网络层进行逐点相加。

5.根据权利要求1所述的一种提高深度残差脉冲神经网络精度以优化图像分类的方法，其特征在于，步骤2中所述标准化过程进一步包括对深度残差脉冲神经网络中具有参数的网络层进行参数标准化。

6.根据权利要求5所述的一种提高深度残差脉冲神经网络精度以优化图像分类的方法，其特征在于，所述具有参数的网络层至少包括卷积层和全连接层；所述参数标准化至少包括权重标准化和偏置标准化；

所述权重标准化由该层和上一层的缩放因子共同确定，在权重标准化过程中，首先对该层的权重参数乘以上一层缩放因子

以恢复大小，然后除以该层缩放因子

再进行缩小：

式中，

表示权重标准化前当前层的参数，

表示经过权重标准化后的参数；

表示当前层的缩放因子，

表示上一层的缩放因子。

7.根据权利要求6所述的一种提高深度残差脉冲神经网络精度以优化图像分类的方法，其特征在于，所述缩放因子通过该层激活值

分布的99.9%的大小来确定：

和

在内的两个缩放因子；此时取

和

的几何平均值作为上层的统一化缩放因子：

随后对

和

的值进行更新；

此时的权重标准化公式为：

式中，各符合含义同上。

8.根据权利要求5所述的一种提高深度残差脉冲神经网络精度以优化图像分类的方法，其特征在于，所述偏置标准化过程通过分析该层的缩放因子所确定，在标准化过程中，参数除以该层缩放因子

：

式中，

表示偏置标准化前的当前层参数，

表示经过偏置标准化后的参数；

在遇到短路连接的结构时，对缩放因子加入两个超参数

进行精度补偿；其中，

用于增大在短路结构恒等映射中卷积层的缩放因子，

用于减小在短路结构非恒等映射中卷积层的缩放因子。

9.一种提高深度残差脉冲神经网络精度以优化图像分类的系统，其特征在于包括如下模块：

用于对深度神经网络中的多种网络结构进行解析的解析模块；

用于对网络模型中的参数进行标准化处理的标准化处理模块；

用于将参数标准化的网络模型转换为深度残差脉冲神经网络的转换处理模块。

10.根据权利要求9所述的一种提高深度残差脉冲神经网络精度以优化图像分类的系统，其特征在于，所述解析模块进一步用于建立深度残差脉冲神经网络的基本网络层，若对应的深度残差神经网络模型的某网络层具有参数，则将该网络层的参数加载到已建立的深度残差脉冲神经网络的网络层中；在建立深度残差脉冲神经网络的网络层时，若遇到网络模型中的批标准化层，则将批标准化层所有的参数吸收到上一层脉冲神经网络的卷积层参数中；若遇到深度残差神经网络中所特有的Add层，则对两个维度相同的网络层进行逐点相加；

所述标准化处理模块进一步用于对深度残差脉冲神经网络中的卷积层和全连接层进行权重标准化和偏置标准化处理；权重标准化由该层和上一层的缩放因子共同确定，在权重标准化过程中，首先对该层的权重参数乘以上一层缩放因子