CN114332545A

CN114332545A - 一种基于低比特脉冲神经网络的图像数据分类方法和装置

Info

Publication number: CN114332545A
Application number: CN202210261211.5A
Authority: CN
Inventors: 张徽; 时拓; 刘琦; 高丽丽; 王志斌; 顾子熙; 崔狮雨; 李一琪
Original assignee: Zhejiang Lab
Current assignee: Zhejiang Lab
Priority date: 2022-03-17
Filing date: 2022-03-17
Publication date: 2022-04-12
Anticipated expiration: 2042-03-17
Also published as: CN114332545B

Abstract

本发明提供一种基于低比特脉冲神经网络的图像数据分类方法和装置，该方法包括：步骤一，获取开源图像数据集，分为训练集和测试集，其中数据集包括计算机图像数据和神经形态数据；步骤二，构建包含隐含层的脉冲神经网络模型，再改进LIF神经元，构建基于改进后的LIF神经元的脉冲神经网络模型；步骤三，通过构建训练损失函数并进行各项梯度求解，对脉冲神经网络模型进行训练；步骤四，在训练集上使用梯度下降参数更新方法进行脉冲神经网络模型优化训练；步骤五，利用构建并训练好的脉冲神经网络模型，对测试集进行识别，得到预测的数据分类标签，实现分类任务。本发明的方法具有更低的功耗，同时与全精度网络模型有近似的准确率。

Description

一种基于低比特脉冲神经网络的图像数据分类方法和装置

技术领域

本发明属于机器学习、图像处理及神经形态计算技术领域，涉及一种基于低比特脉冲神经网络的图像数据分类方法和装置。

背景技术

在最近几年，脉冲神经网络SNN模型在图像数据分类的任务中由于计算上的低功耗优势受到了越来越多的关注。受启发于人脑中真实的神经元，拥有生物可行性的SNN模型的神经元之间通过发放脉冲信号进行信息传递，从而支持基于事件的计算方式，这能够在神经形态芯片上通过更少的能量消耗来实现。SNN模型可以处理计算机图像数据，同时也可以高效地处理神经形态的图像视觉数据。神经形态数据是模仿人类的视觉感知的一种基于脉冲事件的数据，可以通过神经形态照相机生成。然而，现有SNN网络中判断神经元是否发送脉冲的阈值设置均相同，导致网络脉冲发送速率可调节性较差。

尽管SNN在计算上与深度神经网络相比具有低功耗的优势，但其仍需要比较准确的浮点小数计算与存储开销，这对于计算资源有限、功耗预算紧张的神经形态芯片来说是非常具有挑战性的。为了将低功耗的SNN模型部署在芯片中，需要通过将SNN网络的权重由浮点小数转换为定点整数，实现较低比特计算和存储模型的权重，从而实现在资源受限的神经形态芯片上部署SNN模型。

发明内容

为了解决现有技术中存在的上述技术问题，本发明提出了一种基于低比特脉冲神经网络的图像数据分类方法和装置，应用于计算机图像数据和神经形态的图像视觉数据的分类，其具体技术方案如下：

一种基于低比特脉冲神经网络的图像数据分类方法，包括以下步骤：

步骤一，获取开源图像数据集，分为训练集和测试集，其中数据集包括计算机图像数据和神经形态数据；

步骤二，构建包含隐含层的脉冲神经网络模型，再改进LIF神经元，构建基于改进后的LIF神经元的脉冲神经网络模型；

步骤三，通过构建训练损失函数并进行各项梯度求解，对脉冲神经网络模型进行训练；

步骤四，在训练集上使用梯度下降参数更新方法进行脉冲神经网络模型优化训练；

步骤五，利用构建并训练好的脉冲神经网络模型，对测试集进行识别，得到预测的数据分类标签，由此实现图像数据分类。

进一步的，所述步骤一，具体为：所述开源图像数据集采用MNIST数据集和N-MNIST数据集，分别分出各自的训练集和测试集，其中MNIST数据集为计算机图像数据， N-MNIST数据集为神经形态数据。

进一步的，所述构建包含隐含层的神经网络模型，具体包括以下步骤：

步骤2.1，构建网络模型的输入层，将输入数据模拟量编码成脉冲时间序列；

步骤2.2，构建网络模型的隐含层，构建L组脉冲神经元作为不同的隐含层，其中输入层与隐含层、隐含层与隐含层、隐含层与输出层之间的连接均代表任意的线性操作，包括全连接的神经网络层、卷积神经网络层；

步骤2.3，构建网络模型的输出层，网络的输出层采用不会发放脉冲和重置膜电位的神经元，其数量与设置的时间步长数量相同；输出层即为网络最后的分类层，输出为：对隐含层的神经元放电量使用初始放电率加权平均，得到隐含层神经元放电率，表达式：

，

：一组脉冲神经元在T个时间步长时的放电向量；

：输入数据在每个时间步长期间的放电频率向量；

：时间步长数量。

进一步的，所述步骤2.1中的输入数据具体包括：若输入数据为计算机图像数据，对计算机图像数据进行编码成脉冲时间序列，其中时间步长为T，通过使用独立且同分布的伯努利采样，将每个归一化像素在每个时间步概率地转换为尖峰事件；若输入数据为神经形态数据，对神经形态数据进行预处理：累积脉冲数据以降低时间分辨率，时间步长为T，但不进行编码成脉冲时间序列的操作。

进一步的，所述改进LIF神经元，具体为构建阈值可调的LIF神经元，表达式为：

其中

是指对于该神经元共有

个来自于

层神经元的输入；

：LIF神经元的泄漏量；

：第

层脉冲神经元在第t个时间步的电压值；

：第

层脉冲神经元的阈值电压；

：第

层脉冲神经元在第t个时间步的脉冲值；

：第

层突触的全精度权重。

进一步的，所述步骤三，具体包括以下子步骤：

步骤3.1，构建训练中的损失函数，包括：均方差损失函数

，

表示脉冲神经网络模型的输出，

表示训练样本的标签，以及采用2-范数损失函数的低比特权重更新的损失函数；

因此训练中的损失函数可表示为：

：第

层量化后低比特突触的权重；

步骤3.2，基于LIF神经元计算公式求解权重的梯度：

其中

，

：梯度计算符号；

步骤3.3，基于计算得到的权重的梯度更新突触的权重

，更新低比特突触的权重

，具体表示式如下：

其中

表示第

层突触的整数权重，

表示第

层量化因子，初始化为

，

：量化的比特值。

一种基于低比特脉冲神经网络的图像数据分类装置，包括一个或多个处理器，用于实现所述的基于低比特脉冲神经网络的图像数据分类方法。

一种计算机可读存储介质，其上存储有程序，该程序被处理器执行时，实现所述的基于低比特脉冲神经网络的图像数据分类方法。

本发明的优点：

与现有的其他分类方法相比，本发明的神经元阈值可调的低比特脉冲神经网络模型在两种数据集上可以以较小的参数量、较小的时间步长和较低的比特权重取得类似的分类准确率，即具有更低的功耗，同时与全精度网络模型有近似的准确率。

附图说明

图1是本发明的方法流程示意图；

图2是本发明实施例的图像数据编码示意图；

图3是本发明的LIF神经元输入输出示意图；

图4是本发明的装置结构示意图。

具体实施方式

为了使本发明的目的、技术方案和技术效果更加清楚明白，以下结合说明书附图和实施例，对本发明作进一步详细说明。

如图1所示，本发明的一种基于低比特脉冲神经网络的图像数据分类方法，包括以下步骤：

步骤一，获取开源图像数据集，分为训练集和测试集，其中数据集包括计算机图像数据和神经形态数据：

具体的，本实施例所有数据集为MNIST数据集和N-MNIST数据集，其中MNIST数据集由70000张大小为28×28的计算机图像组成，其中训练集60000张，测试集10000 张，类别均为10类；N-MNIST数据集由70000个神经形态数据组成，空间分辨率大小为32×32 ，具有ON和OFF事件脉冲两个通道，时长300ms，分辨率1μs，其中训练集60000个样本，测试集10000个样本，类别为10类。

步骤二，构建包含隐含层的神经网络模型，再改进LIF神经元，构建基于改进后的LIF神经元的脉冲神经网络模型：

其中，包含隐含层的神经网络模型，具体包括以下子步骤：

步骤2.1，首先构建网络模型的输入层，将输入数据模拟量编码成脉冲时间序列；若输入数据为计算机图像数据，对计算机图像数据进行编码成脉冲时间序列，其中时间步长为30，通过使用独立且同分布的伯努利采样，将每个归一化像素在每个时间步，概率地转换为尖峰事件，采用“0”和“1”表示，如图2所示，若伯努利采样分布概率为0.34时，则概率转换为0，若为0.58则概率转换为1；若输入数据为神经形态数据，对神经形态数据进行预处理：累积10ms的脉冲数据以降低时间分辨率，时间步长为30，但不进行编码成脉冲时间序列的操作。

步骤2.2，构建网络模型的隐含层，构建L组脉冲神经元作为不同的隐含层，其中输入层与隐含层、隐含层与隐含层、隐含层与输出层之间的连接均代表任意的线性操作，包括全连接的神经网络层、卷积神经网络层。

，

：一组脉冲神经元在T个时间步长时的放电向量；

：输入数据在每个时间步长期间的放电频率向量；

：时间步长数量。

所述改进LIF神经元，具体为构建阈值可调的LIF神经元，具体表达式为：

其中

是指对于该神经元共有

个来自于

层神经元的输入，如图3所示；

：LIF神经元的泄漏量；

：第

层脉冲神经元在第t个时间步的电压值；

：第

层脉冲神经元的阈值电压；

：第

层脉冲神经元在第t个时间步的脉冲值；

：第

层突触的权重。

步骤三，通过构建训练损失函数并进行各项梯度求解，对脉冲神经网络模型进行训练。

基于步骤二中提出的改进后的LIF神经元，计算损失函数关于权重的梯度，对脉冲神经网络模型进行训练，包括如下步骤：

步骤3.1，构建模型训练的损失函数，即定义分类任务中的损失函数为：在步骤二中构建的网络输出o和样本的标签y之间的具体采用均方差损失函数

，低比特权重更新的损失函数采用2-范数损失函数。

因此训练中的损失函数可表示为：

：第

层量化后低比特突触的权重；

为超参数；

步骤3.2，基于步骤二中LIF神经元计算公式求解权重的梯度：

其中

，

：梯度计算符号；

步骤3.3，基于计算得到的权重的梯度更新权重

，更新低比特突触的权重

，具体表达式如下：

其中

表示第

层突触的整数权重，

表示第

层量化因子，初始化为

，

：量化的比特值。

步骤四，在训练集上使用梯度下降参数更新方法进行脉冲神经网络模型优化训练：

根据步骤三中求解得到的损失函数关于参数的梯度，在训练集上使用梯度下降参数更新方法进行脉冲神经网络优化训练；

步骤五，利用构建并训练好的脉冲神经网络模型，对测试集进行识别，得到预测的数据分类标签，由此实现分类任务。

下面结合仿真实验对本发明的效果做进一步的说明：

1. 仿真条件：

本发明的仿真实验是在Intel(R) Core(TM) i7-9700 CPU @ 3.00GH的硬件环境和Python3.5的软件环境下进行的。

2.仿真内容与结果分析：

本实施例中，对于MNIST数据集和N-MNIST数据集，本发明构建具有两层隐含层的脉冲神经网络：对于MNIST数据集，输入层到第一层隐含层的连接是输出通道数为256的全连接运算，第一层隐含层到第二层隐含层是输出维度为10的全连接层；对于N-MNIS数据集T，输入层到第一层隐含层的连接是卷积核大小为1，输出通道为256的卷积运算，第一层隐含层到第二层隐含层是卷积核大小为1，输出通道为10的卷积运算。

本实施例中使用带Nesterov动量的随机梯度下降算法进行模型的训练，动量为 0.9，权重衰减因子为0.0005。训练过程迭代100轮，批大小为128，即每128个样本为一个批次。对于MNIST和N-MNIST数据集，学习速率初始值为0.05，在31至60轮学习速率为0.005，在 61至90轮学习速率为0.0005，在91至100轮学习速率为0.00005，

初始化为2，对于LIF神经元的泄漏项

。

表1给出了使用经典LIF神经元与阈值可调的LIF神经元在MNIST数据集，N-MNIST数据集上的分类正确率，表2给出了本发明提出的脉冲神经网络模型在MNIST数据集，N-MNIST数据集上不同比特权重的分类正确率。

表1 MNIST数据集和N-MNIST数据集经典LIF神经元与阈值可调的LIF神经元比较结果：

表2 MNIST数据集和N-MNIST数据集全精度与低比特比较结果：

从表中可以看出，和其他的脉冲神经网络模型相比，本发明的方法训练的神经元阈值可调的低比特脉冲神经网络模型在两种数据集上可以以较小的参数量、较小的时间步长和较低的比特权重取得类似的分类准确率。这说明了本发明提出的模型和训练方法的有效性，训练得到的模型可用于高能效的图像数据的分类识别等任务。

与前述一种基于低比特脉冲神经网络的图像数据分类方法的实施例相对应，本发明还提供了一种基于低比特脉冲神经网络的图像数据分类装置的实施例。

参见图4，本发明实施例提供的一种基于低比特脉冲神经网络的图像数据分类装置，包括一个或多个处理器，用于实现上述实施例中的一种基于低比特脉冲神经网络的图像数据分类方法。

本发明一种基于低比特脉冲神经网络的图像数据分类装置的实施例可以应用在任意具备数据处理能力的设备上，该任意具备数据处理能力的设备可以为诸如计算机等设备或装置。装置实施例可以通过软件实现，也可以通过硬件或者软硬件结合的方式实现。以软件实现为例，作为一个逻辑意义上的装置，是通过其所在任意具备数据处理能力的设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言，如图4所示，为本发明一种基于低比特脉冲神经网络的图像数据分类装置所在任意具备数据处理能力的设备的一种硬件结构图，除了图4所示的处理器、内存、网络接口、以及非易失性存储器之外，实施例中装置所在的任意具备数据处理能力的设备通常根据该任意具备数据处理能力的设备的实际功能，还可以包括其他硬件，对此不再赘述。

上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程，在此不再赘述。

对于装置实施例而言，由于其基本对应于方法实施例，所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

本发明实施例还提供一种计算机可读存储介质，其上存储有程序，该程序被处理器执行时，实现上述实施例中的一种基于低比特脉冲神经网络的图像数据分类方法。

所述计算机可读存储介质可以是前述任一实施例所述的任意具备数据处理能力的设备的内部存储单元，例如硬盘或内存。所述计算机可读存储介质也可以是风力发电机的外部存储设备，例如所述设备上配备的插接式硬盘、智能存储卡（Smart Media Card，SMC）、SD卡、闪存卡（Flash Card）等。进一步的，所述计算机可读存储介质还可以既包括任意具备数据处理能力的设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述任意具备数据处理能力的设备所需的其他程序和数据，还可以用于暂时地存储已经输出或者将要输出的数据。

以上所述，仅为本发明的优选实施案例，并非对本发明做任何形式上的限制。虽然前文对本发明的实施过程进行了详细说明，对于熟悉本领域的人员来说，其依然可以对前述各实例记载的技术方案进行修改，或者对其中部分技术特征进行同等替换。凡在本发明精神和原则之内所做修改、同等替换等，均应包含在本发明的保护范围之内。

Claims

1.一种基于低比特脉冲神经网络的图像数据分类方法，其特征在于，包括以下步骤：

2.如权利要求1所述的一种基于低比特脉冲神经网络的图像数据分类方法，其特征在于，所述步骤一，具体为：所述开源图像数据集采用MNIST数据集和N-MNIST数据集，分别分出各自的训练集和测试集，其中MNIST数据集为计算机图像数据， N-MNIST数据集为神经形态数据。

3.如权利要求1所述的一种基于低比特脉冲神经网络的图像数据分类方法，其特征在于，所述构建包含隐含层的脉冲神经网络模型，具体包括以下步骤：

，

：一组脉冲神经元在T个时间步长时的放电向量；

：输入数据在每个时间步长期间的放电频率向量；

：时间步长数量。

4.如权利要求3所述的一种基于低比特脉冲神经网络的图像数据分类方法，其特征在于，所述步骤2.1中的输入数据具体包括：若输入数据为计算机图像数据，对计算机图像数据进行编码成脉冲时间序列，其中时间步长为T，通过使用独立且同分布的伯努利采样，将每个归一化像素在每个时间步概率地转换为尖峰事件；若输入数据为神经形态数据，对神经形态数据进行预处理：累积脉冲数据以降低时间分辨率，时间步长为T，但不进行编码成脉冲时间序列的操作。

5.如权利要求1所述的一种基于低比特脉冲神经网络的图像数据分类方法，其特征在于，所述改进LIF神经元，具体为构建阈值可调的LIF神经元，表达式为：