CN114118378A

CN114118378A - 基于阈值自适应神经元的硬件友好stdp学习方法和系统

Info

Publication number: CN114118378A
Application number: CN202111456234.3A
Authority: CN
Inventors: 陆宇婧; 唐华锦; 张宇豪; 洪朝飞; 王笑; 袁孟雯; 张梦骁; 黄恒; 赵文一
Original assignee: Zhejiang University ZJU; Zhejiang Lab
Current assignee: Zhejiang University ZJU; Zhejiang Lab
Priority date: 2021-12-02
Filing date: 2021-12-02
Publication date: 2022-03-01

Abstract

本发明属于脉冲神经网络技术领域，涉及一种基于阈值自适应神经元的硬件友好STDP学习方法和系统，该方法包括以下步骤：S1：采用频率编码将输入图片编码成脉冲序列并输入脉冲神经网络SNN；S2：SNN的兴奋层神经元接收输入脉冲，累积膜电位，当膜电压达到阈值时，发放脉冲且膜电位复位；S3：SNN抑制层与兴奋层神经元一对一连接，接收其输出脉冲并抑制兴奋层神经元；S4：根据STDP学习规则并采用硬件友好权重归一化方法，对输入层和兴奋层间的兴奋性突触权重进行更新；S5：学习完成后，利用兴奋层神经元的脉冲输出序列进行图像识别。本发明能够在保证准确率和稳定性的同时，降低算法在硬件实现的资源消耗。

Description

基于阈值自适应神经元的硬件友好STDP学习方法和系统

技术领域

本发明属于脉冲神经网络技术领域，涉及一种基于阈值自适应神经元的硬件友好STDP学习方法和系统。

背景技术

脉冲神经网络（Spiking Neural Network, SNN）被称为第三代人工神经网络，其中脉冲神经元将脉冲序列作为有效信息进行传输和计算，在神经元模型、突触模型以及脉冲发放机制等方面具有很强的生物合理性，与真实生物神经网络高度接近。Hebb学习规则表明突触的连接强度随着突触前和突触后神经元活动的变化而变化，而神经科学研究发现突触权值的变化与神经元发放脉冲的精确时间紧密相关，脉冲发放的相对时间差值对权重方向和大小的改变具有关键作用。这种基于突触前后脉冲发放时间相关的学习规则称为脉冲时间依赖可塑性（Spiking Timing Dependent Plasticity，STDP），属于一种无监督的局部学习规则，被认为是大脑学习与信息存储的重要机制。

STDP的标准权重归一化方法由于包含除法操作，硬件实现时需要消耗较多资源，难以在资源有限的专用硬件设备上高效部署。

发明内容

为了解决现有技术中存在的上述技术问题，本发明提出了一种基于阈值自适应神经元的硬件友好STDP学习方法和系统，其具体技术方案如下：

基于阈值自适应神经元的硬件友好STDP学习方法，包括以下步骤：

S1：采用频率编码将输入图片编码成脉冲序列并输入脉冲神经网络SNN；

S2：SNN的兴奋层神经元接收输入脉冲，累积膜电位，当膜电压达到阈值时，发放脉冲且膜电位复位；

S3：SNN抑制层与兴奋层神经元一对一连接，接收其输出脉冲并抑制兴奋层神经元；

S4：根据STDP学习规则并采用硬件友好权重归一化方法，对输入层和兴奋层间的兴奋性突触权重进行更新；

S5：学习完成后，利用兴奋层神经元的脉冲输出序列进行图像识别。

进一步的，所述步骤S1采用频率编码将输入图片按照其像素大小编码为特定频率的脉冲序列，其中，频率编码表达式为：

其中

表示均匀分布的随机数，c表示缩放因子，

表示归一化后的图像像素值。

进一步的，所述脉冲神经网络，输入层是输入图片经过编码后的脉冲序列，输入层和兴奋层是全连接，抑制层的神经元的个数和兴奋层一致，每一个兴奋神经元都和一个抑制神经元一对一连接，每个抑制神经元抑制除对应神经元以外的兴奋神经元。

进一步的，所述兴奋层神经元通过调高阈值以维持脉冲发放率的平衡，该神经元模型表达式为：

其中

表示t时刻神经元的膜电位，

表示复位电压，

表示输入神经元和输出神经元的连接权重，

表示阈值，

表示自适应参数，

和

分别表示神经元输入脉冲和输出脉冲，根据是否发放脉冲取值为0或1，

和

分别表示两个衰减常数，

表示阈值增加量。

进一步的，所述抑制层神经元是Leaky Integrate-And-Fire即LIF神经元模型，表达式为：

进一步的，所述步骤S4，具体为：首先基于STDP学习规则，表达式为：

其中，

表示突触前脉冲到达突触 j 的时刻，

表示突触后神经元的放电时间，

表示突触前和突触后的刺激引起的总权重变化量，

表示STDP的学习函数，即学习窗口，

和

分别表示时间常量，

，

表示学习率；对于STDP学习规则，如果突触前神经元发放的脉冲在突触后神经元发放之前到达，则突触增强；反之，突触减弱；

采取一种STDP在线学习方法，即当接收输入脉冲或者发放输出脉冲时会更新权重，公式如下：

其中，

和

分别表示t时刻的输入和输出神经元的脉冲轨迹，

表示轨迹衰减常数，

表示t时刻的权重更新量；

再进行归一化操作，得到STDP原始归一化公式为：

其中，

是归一化常数，

是指对于每一个突触后神经元，将它所有对应的突触前神经元的权重求和；

最后借鉴Oja对原始赫布规则的归一化以及改进方法，提出一种硬件友好的STDP归一化方法，具体表达式如下：

其中

和

取值趋近于0，取公式线性主部。

基于阈值自适应神经元的硬件友好STDP学习系统，包括：编码模块、兴奋模块、抑制模块、学习模块和输出模块，所述编码模块采用频率编码将输入图片编码成脉冲序列并输入脉冲神经网络；兴奋模块采用SNN兴奋层神经元接收输入脉冲，累积膜电位，当膜电压达到阈值时，发放脉冲且膜电位复位；抑制模块用于SNN抑制层与兴奋层神经元一对一连接，接收其输出脉冲并抑制兴奋层神经元；学习模块根据STDP学习规则并采用硬件友好权重归一化方法，对输入和兴奋层间的兴奋性突触权重进行更新；输出模块用于学习完成后，利用兴奋层神经元的脉冲输出序列进行图像识别。

有益效果：

本发明可以在保证准确率和稳定性的同时，降低算法在硬件实现的资源消耗。

附图说明

图1为根据本发明的实施例的基于阈值自适应神经元的硬件友好STDP学习方法的流程图；

图2 为根据本发明的实施例的阈值自适应神经元结构示意图；

图3为根据本发明的实施例的脉冲神经网络结构示意图；

图4为根据本发明实施例的STDP非监督学习算法流程图；

图5为根据本发明实施例的基于阈值自适应神经元的硬件友好STDP学习系统的结构示意图。

具体实施方式

为了使本发明的目的、技术方案和技术效果更加清楚明白，以下结合说明书附图，对本发明作进一步详细说明。

如图1所示，一种基于阈值自适应神经元的硬件友好STDP学习方法，包括以下步骤：

其中，频率编码的公式为：

其中

表示均匀分布的随机数，c表示缩放因子，

表示归一化后的图像像素值；根据MNIST输入像素强度大小，设定输入神经元的发放频率为63.75Hz，即

为0.06375。

如图2所示，兴奋层阈值自适应神经元通过调高阈值以维持脉冲发放率的平衡，防止出现先发放脉冲的神经元一直发放的现象，该神经元模型为：

其中

表示t时刻神经元的膜电位，

表示复位电压，表示输入神经元和输出神经元的连接权重，

表示阈值，

表示自适应参数，

和

和

分别表示两个衰减常数，

表示阈值增加量。

抑制层神经元是Leaky Integrate-And-Fire即LIF神经元模型：

其中，抑制作用可以使神经元对不同类别的样本产生不同的响应情况，从而可以学习到所有样本模式。

上述技术方案中的脉冲神经网络连接如图3所示，其中，输入层是输入图片经过编码后的脉冲序列，输入层和兴奋层是全连接，抑制层的神经元的个数和兴奋层一致，每一个兴奋神经元都和一个抑制神经元一对一连接，每个抑制神经元抑制除对应神经元以外的兴奋神经元。

S4：如图4所示，根据STDP学习规则并采用硬件友好权重归一化方法，对输入层和兴奋层间的兴奋性突触权重进行更新；

其中，STDP学习规则为：

其中，

表示突触前脉冲到达突触 j 的时刻，

表示突触后神经元的放电时间，

表示突触前和突触后的刺激引起的总权重变化量，

表示STDP的学习函数，即学习窗口，

和

分别表示时间常量，

，

表示学习率；对于STDP学习规则，如果突触前神经元发放的脉冲在突触后神经元发放之前到达，则突触增强；反之，突触减弱。

由于标准STDP学习方法需要寻找所有的脉冲时间差，不利于硬件实现，所以采取一种STDP在线学习方法，即当接收输入脉冲或者发放输出脉冲时会更新权重，公式如下：

其中，

和

分别表示t时刻的输入和输出神经元的脉冲轨迹，

表示轨迹衰减常数，

表示t时刻的权重更新量。

根据所述STDP规则，脉冲输出会增大权重值，而权重值的增大又会导致输出脉冲的增多。循环往复，通常情况下学习会导致权重发散，因此需要采用归一化操作，让权重分布在一定的范围区间内，防止权重发散而导致无法识别目标。

进一步地，STDP原始归一化公式为：

其中，

是归一化常数，

是指对于每一个突触后神经元，将它所有对应的突触前神经元的权重求和。

由于硬件实现除法操作资源消耗较多，难以在资源有限的专用硬件设备上高效部署。因此，本发明借鉴Oja对原始赫布规则的归一化以及改进方法，提出了一种硬件友好的STDP归一化方法，具体形式如下：

和

取值趋近于0，高阶无穷小量可以忽略不计，取公式线性主部。此外研究表明在训练过程中，将权重动态求和值与

同时约去可以使其收敛并省略除法计算，因此可以在硬件上高效实现。

如图5所示，该基于阈值自适应神经元的硬件友好STDP学习系统10包括：编码模块100、兴奋模块200、抑制模块300、学习模块400和输出模块500。

其中，编码模块100采用频率编码将输入图片编码成脉冲序列并输入脉冲神经网络；兴奋模块200采用SNN兴奋层神经元接收输入脉冲，累积膜电位，当膜电压达到阈值时，发放脉冲且膜电位复位；抑制模块300 用于SNN抑制层与兴奋层神经元一对一连接，接收其输出脉冲并抑制兴奋层神经元；学习模块400根据STDP学习规则并采用硬件友好权重归一化方法，对输入和兴奋层间的兴奋性突触权重进行更新；输出模块500用于学习完成后，利用兴奋层神经元的脉冲输出序列进行图像识别。

本发明中的上述方法和系统，一方面，采用了阈值自适应和抑制层的操作，能够有效训练并提升准确率；另一方面，提出了硬件友好的权重归一化方法，减少硬件实现的资源消耗，使之可以在资源有限的专用硬件设备上高效部署，对硬件实现深度SNN的无监督学习方法提供新思路。

以上所述，仅为本发明的优选实施案例，并非对本发明做任何形式上的限制。虽然前文对本发明的实施过程进行了详细说明，对于熟悉本领域的人员来说，其依然可以对前述各实例记载的技术方案进行修改，或者对其中部分技术特征进行同等替换。凡在本发明精神和原则之内所做修改、同等替换等，均应包含在本发明的保护范围之内。

Claims

1.基于阈值自适应神经元的硬件友好STDP学习方法，其特征在于，包括以下步骤：

2.如权利要求1所述的基于阈值自适应神经元的硬件友好STDP学习方法，其特征在于，所述步骤S1采用频率编码将输入图片按照其像素大小编码为特定频率的脉冲序列，其中，频率编码表达式为：

其中

表示均匀分布的随机数，c表示缩放因子，

表示归一化后的图像像素值。

3.如权利要求1所述的基于阈值自适应神经元的硬件友好STDP学习方法，其特征在于，所述脉冲神经网络，输入层是输入图片经过编码后的脉冲序列，输入层和兴奋层是全连接，抑制层的神经元的个数和兴奋层一致，每一个兴奋神经元都和一个抑制神经元一对一连接，每个抑制神经元抑制除对应神经元以外的兴奋神经元。

4.如权利要求1所述的基于阈值自适应神经元的硬件友好STDP学习方法，其特征在于，所述兴奋层神经元通过调高阈值以维持脉冲发放率的平衡，该神经元模型表达式为：

其中

表示t时刻神经元的膜电位，

表示复位电压，

表示输入神经元和输出神经元的连接权重，

表示阈值，

表示自适应参数，

和

和

分别表示两个衰减常数，

表示阈值增加量。

5.如权利要求4所述的基于阈值自适应神经元的硬件友好STDP学习方法，其特征在于，所述抑制层神经元是Leaky Integrate-And-Fire即LIF神经元模型，表达式为：

。

6.如权利要求1所述的基于阈值自适应神经元的硬件友好STDP学习方法，其特征在于，所述步骤S4，具体为：首先基于STDP学习规则，表达式为：

其中，

表示突触前脉冲到达突触 j 的时刻，

表示突触后神经元的放电时间，

表示突触前和突触后的刺激引起的总权重变化量，

表示STDP的学习函数，即学习窗口，

和

分别表示时间常量，

，

采取STDP在线学习方法，即当接收输入脉冲或者发放输出脉冲时会更新权重，公式如下：

其中，

和

分别表示t时刻的输入和输出神经元的脉冲轨迹，

表示轨迹衰减常数，

表示t时刻的权重更新量；

再进行归一化操作，得到STDP原始归一化公式为：

其中，

是归一化常数，

采用硬件友好的STDP归一化方法，具体表达式如下：

和

取值趋近于0，取公式线性主部。

7.基于阈值自适应神经元的硬件友好STDP学习系统，包括编码模块（100）、兴奋模块（200）、抑制模块（300）、学习模块（400）和输出模块（500），其特征在于：所述编码模块（100）采用频率编码将输入图片编码成脉冲序列并输入脉冲神经网络；兴奋模块（200）采用SNN兴奋层神经元接收输入脉冲，累积膜电位，当膜电压达到阈值时，发放脉冲且膜电位复位；抑制模块（300）用于SNN抑制层与兴奋层神经元一对一连接，接收其输出脉冲并抑制兴奋层神经元；学习模块（400）根据STDP学习规则并采用硬件友好权重归一化方法，对输入和兴奋层间的兴奋性突触权重进行更新；输出模块（500）用于学习完成后，利用兴奋层神经元的脉冲输出序列进行图像识别。