CN114118378A - 基于阈值自适应神经元的硬件友好stdp学习方法和系统 - Google Patents
基于阈值自适应神经元的硬件友好stdp学习方法和系统 Download PDFInfo
- Publication number
- CN114118378A CN114118378A CN202111456234.3A CN202111456234A CN114118378A CN 114118378 A CN114118378 A CN 114118378A CN 202111456234 A CN202111456234 A CN 202111456234A CN 114118378 A CN114118378 A CN 114118378A
- Authority
- CN
- China
- Prior art keywords
- pulse
- neuron
- neurons
- hardware
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 210000002569 neuron Anatomy 0.000 title claims abstract description 97
- 238000000034 method Methods 0.000 title claims abstract description 24
- 230000005284 excitation Effects 0.000 claims abstract description 51
- 230000005764 inhibitory process Effects 0.000 claims abstract description 25
- 239000012528 membrane Substances 0.000 claims abstract description 24
- 238000010606 normalization Methods 0.000 claims abstract description 22
- 238000001208 nuclear magnetic resonance pulse sequence Methods 0.000 claims abstract description 20
- 210000000225 synapse Anatomy 0.000 claims abstract description 17
- 238000013528 artificial neural network Methods 0.000 claims abstract description 15
- 230000002964 excitative effect Effects 0.000 claims abstract description 12
- 230000003044 adaptive effect Effects 0.000 claims description 17
- 230000001242 postsynaptic effect Effects 0.000 claims description 14
- 230000003518 presynaptic effect Effects 0.000 claims description 8
- 239000000126 substance Substances 0.000 claims description 8
- 210000002364 input neuron Anatomy 0.000 claims description 7
- 238000010304 firing Methods 0.000 claims description 6
- 210000004205 output neuron Anatomy 0.000 claims description 6
- 210000005215 presynaptic neuron Anatomy 0.000 claims description 6
- 230000002401 inhibitory effect Effects 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 4
- 238000012421 spiking Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 3
- 230000000638 stimulation Effects 0.000 claims description 3
- 230000001629 suppression Effects 0.000 claims description 3
- 238000013459 approach Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000946 synaptic effect Effects 0.000 description 2
- 240000002627 Cordeauxia edulis Species 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明属于脉冲神经网络技术领域,涉及一种基于阈值自适应神经元的硬件友好STDP学习方法和系统,该方法包括以下步骤:S1:采用频率编码将输入图片编码成脉冲序列并输入脉冲神经网络SNN;S2:SNN的兴奋层神经元接收输入脉冲,累积膜电位,当膜电压达到阈值时,发放脉冲且膜电位复位;S3:SNN抑制层与兴奋层神经元一对一连接,接收其输出脉冲并抑制兴奋层神经元;S4:根据STDP学习规则并采用硬件友好权重归一化方法,对输入层和兴奋层间的兴奋性突触权重进行更新;S5:学习完成后,利用兴奋层神经元的脉冲输出序列进行图像识别。本发明能够在保证准确率和稳定性的同时,降低算法在硬件实现的资源消耗。
Description
技术领域
本发明属于脉冲神经网络技术领域,涉及一种基于阈值自适应神经元的硬件友好STDP学习方法和系统。
背景技术
脉冲神经网络(Spiking Neural Network, SNN)被称为第三代人工神经网络,其中脉冲神经元将脉冲序列作为有效信息进行传输和计算,在神经元模型、突触模型以及脉冲发放机制等方面具有很强的生物合理性,与真实生物神经网络高度接近。Hebb学习规则表明突触的连接强度随着突触前和突触后神经元活动的变化而变化,而神经科学研究发现突触权值的变化与神经元发放脉冲的精确时间紧密相关,脉冲发放的相对时间差值对权重方向和大小的改变具有关键作用。这种基于突触前后脉冲发放时间相关的学习规则称为脉冲时间依赖可塑性(Spiking Timing Dependent Plasticity,STDP),属于一种无监督的局部学习规则,被认为是大脑学习与信息存储的重要机制。
STDP的标准权重归一化方法由于包含除法操作,硬件实现时需要消耗较多资源,难以在资源有限的专用硬件设备上高效部署。
发明内容
为了解决现有技术中存在的上述技术问题,本发明提出了一种基于阈值自适应神经元的硬件友好STDP学习方法和系统,其具体技术方案如下:
基于阈值自适应神经元的硬件友好STDP学习方法,包括以下步骤:
S1:采用频率编码将输入图片编码成脉冲序列并输入脉冲神经网络SNN;
S2:SNN的兴奋层神经元接收输入脉冲,累积膜电位,当膜电压达到阈值时,发放脉冲且膜电位复位;
S3:SNN抑制层与兴奋层神经元一对一连接,接收其输出脉冲并抑制兴奋层神经元;
S4:根据STDP学习规则并采用硬件友好权重归一化方法,对输入层和兴奋层间的兴奋性突触权重进行更新;
S5:学习完成后,利用兴奋层神经元的脉冲输出序列进行图像识别。
进一步的,所述步骤S1采用频率编码将输入图片按照其像素大小编码为特定频率的脉冲序列,其中,频率编码表达式为:
进一步的,所述脉冲神经网络,输入层是输入图片经过编码后的脉冲序列,输入层和兴奋层是全连接,抑制层的神经元的个数和兴奋层一致,每一个兴奋神经元都和一个抑制神经元一对一连接,每个抑制神经元抑制除对应神经元以外的兴奋神经元。
进一步的,所述兴奋层神经元通过调高阈值以维持脉冲发放率的平衡,该神经元模型表达式为:
其中表示t时刻神经元的膜电位,表示复位电压,表示输入神经元和输出
神经元的连接权重,表示阈值,表示自适应参数,和分别表示神经元输入脉
冲和输出脉冲,根据是否发放脉冲取值为0或1,和分别表示两个衰减常数,表示阈值增加量。
进一步的,所述抑制层神经元是Leaky Integrate-And-Fire即LIF神经元模型,表达式为:
进一步的,所述步骤S4,具体为:首先基于STDP学习规则,表达式为:
其中,表示突触前脉冲到达突触 j 的时刻,表示突触后神经元的放电时间,表示突触前和突触后的刺激引起的总权重变化量,表示STDP的学习函数,即学习
窗口,和分别表示时间常量,,表示学习率;对于STDP学习规则,如果突触前
神经元发放的脉冲在突触后神经元发放之前到达,则突触增强;反之,突触减弱;
采取一种STDP在线学习方法,即当接收输入脉冲或者发放输出脉冲时会更新权重,公式如下:
再进行归一化操作, 得到STDP原始归一化公式为:
最后借鉴Oja对原始赫布规则的归一化以及改进方法,提出一种硬件友好的STDP归一化方法,具体表达式如下:
基于阈值自适应神经元的硬件友好STDP学习系统,包括:编码模块、兴奋模块、抑制模块、学习模块和输出模块,所述编码模块采用频率编码将输入图片编码成脉冲序列并输入脉冲神经网络;兴奋模块采用SNN兴奋层神经元接收输入脉冲,累积膜电位,当膜电压达到阈值时,发放脉冲且膜电位复位;抑制模块用于SNN抑制层与兴奋层神经元一对一连接,接收其输出脉冲并抑制兴奋层神经元;学习模块根据STDP学习规则并采用硬件友好权重归一化方法,对输入和兴奋层间的兴奋性突触权重进行更新;输出模块用于学习完成后,利用兴奋层神经元的脉冲输出序列进行图像识别。
有益效果:
本发明可以在保证准确率和稳定性的同时,降低算法在硬件实现的资源消耗。
附图说明
图1为根据本发明的实施例的基于阈值自适应神经元的硬件友好STDP学习方法的流程图;
图2 为根据本发明的实施例的阈值自适应神经元结构示意图;
图3为根据本发明的实施例的脉冲神经网络结构示意图;
图4为根据本发明实施例的STDP非监督学习算法流程图;
图5为根据本发明实施例的基于阈值自适应神经元的硬件友好STDP学习系统的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和技术效果更加清楚明白,以下结合说明书附图,对本发明作进一步详细说明。
如图1所示,一种基于阈值自适应神经元的硬件友好STDP学习方法,包括以下步骤:
S1:采用频率编码将输入图片编码成脉冲序列并输入脉冲神经网络SNN;
其中,频率编码的公式为:
S2:SNN的兴奋层神经元接收输入脉冲,累积膜电位,当膜电压达到阈值时,发放脉冲且膜电位复位;
如图2所示,兴奋层阈值自适应神经元通过调高阈值以维持脉冲发放率的平衡,防止出现先发放脉冲的神经元一直发放的现象,该神经元模型为:
其中表示t时刻神经元的膜电位,表示复位电压,表示输入神经元和输出神
经元的连接权重,表示阈值,表示自适应参数,和分别表示神经元输入脉冲
和输出脉冲,根据是否发放脉冲取值为0或1,和分别表示两个衰减常数,表示阈值增加量。
S3:SNN抑制层与兴奋层神经元一对一连接,接收其输出脉冲并抑制兴奋层神经元;
抑制层神经元是Leaky Integrate-And-Fire即LIF神经元模型:
其中,抑制作用可以使神经元对不同类别的样本产生不同的响应情况,从而可以学习到所有样本模式。
上述技术方案中的脉冲神经网络连接如图3所示,其中,输入层是输入图片经过编码后的脉冲序列,输入层和兴奋层是全连接,抑制层的神经元的个数和兴奋层一致,每一个兴奋神经元都和一个抑制神经元一对一连接,每个抑制神经元抑制除对应神经元以外的兴奋神经元。
S4:如图4所示,根据STDP学习规则并采用硬件友好权重归一化方法,对输入层和兴奋层间的兴奋性突触权重进行更新;
其中,STDP学习规则为:
其中,表示突触前脉冲到达突触 j 的时刻,表示突触后神经元的放电时间,表示突触前和突触后的刺激引起的总权重变化量,表示STDP的学习函数,即学习
窗口,和分别表示时间常量,,表示学习率;对于STDP学习规则,如果突触前
神经元发放的脉冲在突触后神经元发放之前到达,则突触增强;反之,突触减弱。
由于标准STDP学习方法需要寻找所有的脉冲时间差,不利于硬件实现,所以采取一种STDP在线学习方法,即当接收输入脉冲或者发放输出脉冲时会更新权重,公式如下:
根据所述STDP规则,脉冲输出会增大权重值,而权重值的增大又会导致输出脉冲的增多。循环往复,通常情况下学习会导致权重发散,因此需要采用归一化操作,让权重分布在一定的范围区间内,防止权重发散而导致无法识别目标。
进一步地,STDP原始归一化公式为:
由于硬件实现除法操作资源消耗较多,难以在资源有限的专用硬件设备上高效部署。因此,本发明借鉴Oja对原始赫布规则的归一化以及改进方法,提出了一种硬件友好的STDP归一化方法,具体形式如下:
S5:学习完成后,利用兴奋层神经元的脉冲输出序列进行图像识别。
如图5所示,该基于阈值自适应神经元的硬件友好STDP学习系统10包括:编码模块100、兴奋模块200、抑制模块300、学习模块400和输出模块500。
其中,编码模块100采用频率编码将输入图片编码成脉冲序列并输入脉冲神经网络;兴奋模块200采用SNN兴奋层神经元接收输入脉冲,累积膜电位,当膜电压达到阈值时,发放脉冲且膜电位复位;抑制模块300 用于SNN抑制层与兴奋层神经元一对一连接,接收其输出脉冲并抑制兴奋层神经元;学习模块400根据STDP学习规则并采用硬件友好权重归一化方法,对输入和兴奋层间的兴奋性突触权重进行更新;输出模块500用于学习完成后,利用兴奋层神经元的脉冲输出序列进行图像识别。
本发明中的上述方法和系统,一方面,采用了阈值自适应和抑制层的操作,能够有效训练并提升准确率;另一方面,提出了硬件友好的权重归一化方法,减少硬件实现的资源消耗,使之可以在资源有限的专用硬件设备上高效部署,对硬件实现深度SNN的无监督学习方法提供新思路。
以上所述,仅为本发明的优选实施案例,并非对本发明做任何形式上的限制。虽然前文对本发明的实施过程进行了详细说明,对于熟悉本领域的人员来说,其依然可以对前述各实例记载的技术方案进行修改,或者对其中部分技术特征进行同等替换。凡在本发明精神和原则之内所做修改、同等替换等,均应包含在本发明的保护范围之内。
Claims (7)
1.基于阈值自适应神经元的硬件友好STDP学习方法,其特征在于,包括以下步骤:
S1:采用频率编码将输入图片编码成脉冲序列并输入脉冲神经网络SNN;
S2:SNN的兴奋层神经元接收输入脉冲,累积膜电位,当膜电压达到阈值时,发放脉冲且膜电位复位;
S3:SNN抑制层与兴奋层神经元一对一连接,接收其输出脉冲并抑制兴奋层神经元;
S4:根据STDP学习规则并采用硬件友好权重归一化方法,对输入层和兴奋层间的兴奋性突触权重进行更新;
S5:学习完成后,利用兴奋层神经元的脉冲输出序列进行图像识别。
3.如权利要求1所述的基于阈值自适应神经元的硬件友好STDP学习方法,其特征在于,所述脉冲神经网络,输入层是输入图片经过编码后的脉冲序列,输入层和兴奋层是全连接,抑制层的神经元的个数和兴奋层一致,每一个兴奋神经元都和一个抑制神经元一对一连接,每个抑制神经元抑制除对应神经元以外的兴奋神经元。
6.如权利要求1所述的基于阈值自适应神经元的硬件友好STDP学习方法,其特征在于,所述步骤S4,具体为:首先基于STDP学习规则,表达式为:
其中,表示突触前脉冲到达突触 j 的时刻,表示突触后神经元的放电时间,表
示突触前和突触后的刺激引起的总权重变化量,表示STDP的学习函数,即学习窗口,和分别表示时间常量,,表示学习率;对于STDP学习规则,如果突触前神经元
发放的脉冲在突触后神经元发放之前到达,则突触增强;反之,突触减弱;
采取STDP在线学习方法,即当接收输入脉冲或者发放输出脉冲时会更新权重,公式如下:
再进行归一化操作, 得到STDP原始归一化公式为:
采用硬件友好的STDP归一化方法,具体表达式如下:
7.基于阈值自适应神经元的硬件友好STDP学习系统,包括编码模块(100)、兴奋模块(200)、抑制模块(300)、学习模块(400)和输出模块(500),其特征在于:所述编码模块(100)采用频率编码将输入图片编码成脉冲序列并输入脉冲神经网络;兴奋模块(200)采用SNN兴奋层神经元接收输入脉冲,累积膜电位,当膜电压达到阈值时,发放脉冲且膜电位复位;抑制模块(300)用于SNN抑制层与兴奋层神经元一对一连接,接收其输出脉冲并抑制兴奋层神经元;学习模块(400)根据STDP学习规则并采用硬件友好权重归一化方法,对输入和兴奋层间的兴奋性突触权重进行更新;输出模块(500)用于学习完成后,利用兴奋层神经元的脉冲输出序列进行图像识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111456234.3A CN114118378A (zh) | 2021-12-02 | 2021-12-02 | 基于阈值自适应神经元的硬件友好stdp学习方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111456234.3A CN114118378A (zh) | 2021-12-02 | 2021-12-02 | 基于阈值自适应神经元的硬件友好stdp学习方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114118378A true CN114118378A (zh) | 2022-03-01 |
Family
ID=80369845
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111456234.3A Pending CN114118378A (zh) | 2021-12-02 | 2021-12-02 | 基于阈值自适应神经元的硬件友好stdp学习方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114118378A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116663631A (zh) * | 2023-07-28 | 2023-08-29 | 之江实验室 | 一种任务执行的方法、装置、存储介质及电子设备 |
-
2021
- 2021-12-02 CN CN202111456234.3A patent/CN114118378A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116663631A (zh) * | 2023-07-28 | 2023-08-29 | 之江实验室 | 一种任务执行的方法、装置、存储介质及电子设备 |
CN116663631B (zh) * | 2023-07-28 | 2024-05-14 | 之江实验室 | 一种任务执行的方法、装置、存储介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shrestha et al. | Stable spike-timing dependent plasticity rule for multilayer unsupervised and supervised learning | |
Zhang et al. | Fast and robust learning in spiking feed-forward neural networks based on intrinsic plasticity mechanism | |
CN112101535B (zh) | 脉冲神经元的信号处理方法及相关装置 | |
CN108304912B (zh) | 一种运用抑制信号实现脉冲神经网络监督学习的系统和方法 | |
CN114266351A (zh) | 基于无监督学习时间编码的脉冲神经网络训练方法及系统 | |
Zhang et al. | Information-theoretic intrinsic plasticity for online unsupervised learning in spiking neural networks | |
Xu et al. | Spike trains encoding and threshold rescaling method for deep spiking neural networks | |
CN114118383A (zh) | 基于多突触可塑性脉冲神经网络快速记忆编码方法和装置 | |
Zhang et al. | Efficient spiking neural networks with logarithmic temporal coding | |
CN111310816B (zh) | 基于无监督匹配追踪编码的仿脑架构图像识别方法 | |
Amari | Mathematical theory of neural learning | |
CN116796207A (zh) | 一种基于脉冲神经网络的自组织映射聚类方法 | |
CN114118378A (zh) | 基于阈值自适应神经元的硬件友好stdp学习方法和系统 | |
CN113628615B (zh) | 语音识别方法、装置、电子设备及存储介质 | |
CN107798384B (zh) | 一种基于可进化脉冲神经网络的鸢尾花卉分类方法和装置 | |
Zhang et al. | Introduction to artificial neural network | |
CN110874629A (zh) | 基于兴奋性与抑制性stdp的储备池网络的结构优化方法 | |
Deng et al. | Stdp and competition learning in spiking neural networks and its application to image classification | |
Paudel et al. | Resiliency of SNN on black-box adversarial attacks | |
Allred et al. | Stimulating stdp to exploit locality for lifelong learning without catastrophic forgetting | |
CN111582470B (zh) | 基于stdp的自适应非监督学习图像识别方法及系统 | |
Sun et al. | Simplified spike-timing dependent plasticity learning rule of spiking neural networks for unsupervised clustering | |
CN115879518A (zh) | 一种基于ai芯片的任务处理方法和装置 | |
KR20200094354A (ko) | 버스트 스파이크 기반한 스파이킹 신경망 생성 방법 및 스파이킹 신경망 기반 추론 장치 | |
Ravichandran et al. | Spiking neural networks with Hebbian plasticity for unsupervised representation learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |