CN111046865A

CN111046865A - 基于膜电压驱动的spiking神经元监督学习模型的光学字符识别方法

Info

Publication number: CN111046865A
Application number: CN201911289020.4A
Authority: CN
Inventors: 李建平; 顾小丰; 胡健; 蒋涛; 王青松; 陈强强; 贺喜; 李天凯
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2019-12-12
Filing date: 2019-12-12
Publication date: 2020-04-21

Abstract

本发明公开了一种基于膜电压驱动的spiking神经元监督学习模型的光学字符识别方法，该方法包括获取光学字符样本集，采用相位编码方法将采用相位编码方法脉冲序列，建立基于膜电压驱动的spiking神经元监督学习模型并进行训练，利用训练后的spiking神经元监督学习模型对待检测光学字符进行识别。本发明通过采用相位编码方法将采用相位编码方法脉冲序列，建立基于膜电压驱动的spiking神经元监督学习模型并进行训练，利用训练后的spiking神经元监督学习模型对待检测光学字符进行识别，显著提高了spiking神经元序列学习的效率，进一步提高了光学字符识别的效率和准确率。

Description

基于膜电压驱动的spiking神经元监督学习模型的光学字符识别方法

技术领域

本发明属于光学字符识别技术领域，具体涉及一种基于膜电压驱动的spiking神经元监督学习模型的光学字符识别方法。

背景技术

Spiking神经网络已经被广泛地用于解决分类问题。多数情况下，基于spiking神经网络计算模型的最终决策是基于单脉冲的激发时间或激发频率，而基于spiking神经网络激发脉冲序列相似度的分类却很少。

传统基于频率编码的神经网络假定生物神经元通过频率编码感知信息。但是，基于频率的编码不能有效地解释视觉，听觉和味觉的快速响应。在大脑的不同区域相继发现基于spike时间的神经活动，包括视网膜，外侧膝状核和视觉皮层。越来越多的研究人员相信生物神经系统的信息编码是通过精确的spike激发时间。为了模拟spike时间编码的特征，spiking神经网络作为“第三代神经网络”应运而生。理论证明基于时间编码的spiking神经元比传统基于频率编码的神经网络具有更加强大的计算能力。但是目前基于spiking神经元的应用还比较简单，其强大的时序信息处理能力并未得到有效利用，其中一个重要的原因是缺少一个高效，快速的学习算法来解决该问题。研究人员已经提出了许多针对Spiking神经网络的学习算法。

相比于无监督学习，spiking神经网络的监督学习算法目前有更多的研究成果。按照学习的机制可以分为脉冲驱动(spike-driven)和膜电压驱动(membrane potential-driven)两种方式。脉冲驱动学习算法是基于脉冲的目标激发时刻和实际激发时刻来调整权重，而膜电压驱动学习算法则以神经元在不同时刻的膜电压为信号进行权重调整。

脉冲驱动(spike-driven)的spiking神经元序列学习算法用目标激发时刻和实际激发时刻为信号去调整神经元的突触权重。SpikeProp是脉冲驱动的学习算法中最典型的一个。SpikeProp利用脉冲的目标激发时刻和实际激发时刻的差异作为误差函数，通过对spike激发函数进行合理的近似，进而将传统神经网络的BP(back-propagation)学习算法应用到spiking神经网络。实验证明该算法可以处理一些简单的分类任务，但是该算法要求spiking神经网络中的每个神经元必须且只能激发一个脉冲。如果网络中有神经元激发多次或不激发脉冲，那么该算法的训练效果会受很大影响，这是该算法的主要缺点。为了解决该问题，许多研究人员提出改进的方案，但是效果都欠佳。ReSuMe(RemoteSupervisedMethod)是另一种基于脉冲驱动的学习算法，该算法的学习过程包括两个部分：1)神经元在运行的过程中，如果当前时间是目标激发时刻点，那么就依据STDP(Spike-Timing-Dependent Plasticity)规则和输入脉冲来增强突触之间的强度；2)神经元在运行的过程中，如果当前时间是实际激发时刻点，那么就依据anti-STDP规则和输入脉冲来减弱突触之间的强度。但是ReSuMe的学习规则不符合BPBA(Bigger PSPs，Bigger Adjustment)原则，因此它的学习准确率和效率有待提高。为了提高ReSuMe的学习效率，DL-ReSuMe(Delay LearningReSuMe)及相关算法在ReSuMe的权重调整基础上加入了突触延迟调整策略。实验结果表明该延迟机制对ReSuMe学习算法的性能有所提高，但是DLReSuMe算法中的延迟调整策略仍然过于简单。特别的DL-ReSuMe算法中的延迟只能增加不能减弱，且每个神经突触的延迟只能调整一次。SPAN(Spike PatternAssociation Neuron)和Chronotron学习算法也是脉冲驱动学习算法的一种，它们先把离散的实际脉冲序列和离散的目标脉冲序列变成连续信号，然后基于连续时间代价函数去最小化实际输出与目标输出之间的差距。上述脉冲驱动的学习算法是用实际激发spike时刻和目标激发spike的时刻为信号来指导权重的调整。然而事实上，spiking神经元的突触权重是先影响膜电压，进而影响spiking神经元脉冲激发时刻。因此，通过脉冲激发时刻对权重的调整是间接的，不可避免地造成学习难度增加，学习的效率和准确率下降。

发明内容

针对现有技术中的上述不足，本发明提供了一种基于膜电压驱动的spiking神经元监督学习模型的光学字符识别方法，以期提高spiking神经元序列学习算法的效率和准确率，实现对光学字符的高效识别。

为了达到上述发明目的，本发明采用的技术方案为：

一种基于膜电压驱动的spiking神经元监督学习模型的光学字符识别方法，包括以下步骤：

S1、获取光学字符样本集；

S2、采用相位编码方法将步骤S1中的光学字符样本编码成具有时空信息的脉冲序列；

S3、建立基于膜电压驱动的spiking神经元监督学习模型，利用步骤S2得到的脉冲序列对spiking神经元监督学习模型进行训练；

S4、利用步骤S3训练后的spiking神经元监督学习模型对待检测光学字符进行识别。

进一步地，所述步骤S2中，相位编码方法具体为：

每一个编码单元包括一个正向激励神经元和一个负向激励神经元以及一个输出神经元；每一个编码单元对应一个像素点和一个波动函数SMO；第i个像素点对应的SMO_i定义如下：

其中，A是SMO_i波动函数的振幅，ω是该波动函数的角速度，

是第i个像素点的相位差。

进一步地，所述步骤S3中，基于膜电压驱动的spiking神经元监督学习模型包括两个学习过程：在目标激发时刻，调整突触的权重，使得膜电压可以达到激发阈值；在其它时刻，调整突触权重，使得膜电压低于激发阈值。

进一步地，所述基于膜电压驱动的spiking神经元监督学习模型在目标激发时刻的误差函数表示为：

其中θ和u_i(t)分别表示激发脉冲阈值和神经元的膜电压，t_d表示目标激发时刻；

权重更新公式表示为：

其中，β₁是控制权重调整大小的学习率，f是输入神经元激发的第f次脉冲，

表示的是脉冲

产生的突触后电势随时间的变化。

进一步地，所述基于膜电压驱动的spiking神经元监督学习模型在其它时刻的误差函数表示为：

其中，p是影响权重调整幅度的参数，N_td表示其它时刻；

权重更新公式表示为：

其中，β2是控制权重调整大小的学习率。

进一步地，所述步骤S3中，利用步骤S2得到的脉冲序列对spiking神经元监督学习模型进行训练具体为：

根据步骤S2得到的不同类别的脉冲序列设置对应数量的脉冲神经元，其中每一个神经元对应一个类别，输入脉冲序列到spiking神经元监督学习模型中，通过学习使其对应的神经元激发一个目标脉冲序列，同时训练其他的神经元保持静默状态。

进一步地，所述步骤S4利用步骤S3训练后的spiking神经元监督学习模型对待检测光学字符进行识别具体为：

将待检测光学字符编码后的脉冲序列输入到步骤S3训练后的spiking神经元监督学习模型中，并采用相对置信度方法根据激发的最接近目标序列的神经元判断脉冲序列对应待检测光学字符的类别，完成待检测光学字符识别。

本发明具有以下有益效果：本发明通过采用相位编码方法将采用相位编码方法脉冲序列，建立基于膜电压驱动的spiking神经元监督学习模型并进行训练，利用训练后的spiking神经元监督学习模型对待检测光学字符进行识别，显著提高了spiking神经元序列学习的效率，进一步提高了光学字符识别的效率和准确率。

附图说明

图1是本发明的基于膜电压驱动的spiking神经元监督学习模型的光学字符识别方法流程示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

如图1所示，本发明实施例提供了一种基于膜电压驱动的spiking神经元监督学习模型的光学字符识别方法，包括以下步骤S1至S4：

S1、获取光学字符样本集；

在本实施例中，本发明总共获取包括0-9十个数字图片，每张图片的大小是20×20黑/白像素。

在本实施例中，本发明采用的相位编码方法具体为：

每一个编码单元包括一个正向激励神经元(Pos)和一个负向激励神经元(Neg)以及一个输出神经元；每一个编码单元对应一个像素点和一个波动函数SMO；第i个像素点对应的SMO_i定义如下：

其中，A是SMO_i波动函数的振幅，ω是该波动函数的角速度，

是第i个像素点的相位差。

的计算如下

其中，

是初始的相位，

是相邻两个神经元的相位差。

Pos和Neg神经元分别只对正向激励和负向激励响应。Pos和Neg神经元对应的像素点会引起各自的SMO波动函数下降和上升。Pos或者Neg的神经元会激发一个脉冲当SMO波动函数在移动的过程中达到各自的激发阈值(Posthr和Negthr)。无论是Pos或者Neg的神经元激发脉冲都会导致out神经元立马激发脉冲。

通过上述相位编码方法，可以将步骤S1中的静态的图片编码成具有时空信息的脉冲序列。

在本实施例中，本发明采用SRM神经元模型，在SRM模型中，神经元i的膜电压是用u_i(t)来表示的。当没有脉冲输入的时候，神经元的膜电压处于静息电位u_rest＝0。当有输入脉冲传递到神经元i时，在其内部就会产生相应的PSP来改变膜电压。随着时间的积累和连续的spike到达，如果膜电压的值达到激发阈值，那么神经元i就会激发一个脉冲，并启动不应期函数。具体而言，神经元i的膜电压变化过程，可以表示成

其中

是第j个输入神经元激发的第f次脉冲，ω_ji是输入神经元j到输出神经元i之间的突触权重。

表示的是脉冲

产生的PSP随时间的变化，定义为

其中，τ是决定PSP形状的时间常量。不应期函数

定义为

其中τ_R是影响不应期函数持续的时间。

Spiking神经网络序列学习的目标是通过调整突触权重的大小使spiking神经元在目标时刻激发脉冲，同时在其他时刻保持沉默。因此，神经元的运行时间可以分为目标激发时间t_d(t_d＝{t_d(1),t_d(2),...,t_d(i),...})和其他时间N_td。基于这两种时间分类，MemPo-Learn包括两个学习过程：1)在t_d时刻，调整突触的权重，使得膜电压可以达到激发阈值；2)在N_td时刻，调整突触权重，使得膜电压低于激发阈值。

在目标激发脉冲时刻，为了激发脉冲，神经元的膜电压应该大于或等于激发阈值。MemPo-Learn通过利用梯度下降方法调整权重，使得膜电压u_i(t)在目标时刻增加直至不低于激发阈值。在t_d时刻，构建误差函数如下

其中θ和u_i(t)分别表示激发脉冲阈值和神经元的膜电压。为了消除错误点火的影响，

是目标激发脉冲的时间而不是实际脉冲激发的时刻，说明该操作以后的spiking神经元膜电压。依据梯度下降得规则，权重改变量可以表示成：

其中，β₁是控制权重调整大小的学习率。

在非目标激发时刻，为了不让神经元激发错误的脉冲，神经元的膜电压应该控制在激发阈值以下。同样采用梯度下降方法调整权重，使得膜电压在非目标激发时刻低于激发阈值。当膜电压高于激发阈值的时候，构造误差函数如下：

其中，参数p影响权重调整的幅度；

同理依据梯度下降的方法，权重更新的公式可以表示为：

其中，β₂是控制权重调整大小的学习率。

利用步骤S2得到的脉冲序列对spiking神经元监督学习模型进行训练具体为：

在本实施例中，本发明将待检测光学字符编码后的脉冲序列输入到步骤S3训练后的spiking神经元监督学习模型中，并采用相对置信度方法根据激发的最接近目标序列的神经元判断脉冲序列对应待检测光学字符的类别，完成待检测光学字符识别。

本领域的普通技术人员将会意识到，这里所述的实施例是为了帮助读者理解本发明的原理，应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合，这些变形和组合仍然在本发明的保护范围内。

Claims

1.一种基于膜电压驱动的spiking神经元监督学习模型的光学字符识别方法，其特征在于，包括以下步骤：

S1、获取光学字符样本集；

2.如权利要求1所述的基于膜电压驱动的spiking神经元监督学习模型的光学字符识别方法，其特征在于，所述步骤S2中，相位编码方法具体为：

其中，A是SMO_i波动函数的振幅，ω是该波动函数的角速度，

是第i个像素点的相位差。

3.如权利要求2所述的基于膜电压驱动的spiking神经元监督学习模型的光学字符识别方法，其特征在于，所述步骤S3中，基于膜电压驱动的spiking神经元监督学习模型包括两个学习过程：在目标激发时刻，调整突触的权重，使得膜电压可以达到激发阈值；在其它时刻，调整突触权重，使得膜电压低于激发阈值。

4.如权利要求3所述的基于膜电压驱动的spiking神经元监督学习模型的光学字符识别方法，其特征在于，所述基于膜电压驱动的spiking神经元监督学习模型在目标激发时刻的误差函数表示为：

权重更新公式表示为：

表示的是脉冲

产生的突触后电势随时间的变化。

5.如权利要求4所述的基于膜电压驱动的spiking神经元监督学习模型的光学字符识别方法，其特征在于，所述基于膜电压驱动的spiking神经元监督学习模型在其它时刻的误差函数表示为：

其中，p是影响权重调整幅度的参数，N_td表示其它时刻；

权重更新公式表示为：

其中，β2是控制权重调整大小的学习率。

6.如权利要求5所述的基于膜电压驱动的spiking神经元监督学习模型的光学字符识别方法，其特征在于，所述步骤S3中，利用步骤S2得到的脉冲序列对spiking神经元监督学习模型进行训练具体为：

7.如权利要求1所述的基于膜电压驱动的spiking神经元监督学习模型的光学字符识别方法，其特征在于，所述步骤S4利用步骤S3训练后的spiking神经元监督学习模型对待检测光学字符进行识别具体为：