CN113269313A

CN113269313A - 突触权重训练方法、电子设备和计算机可读介质

Info

Publication number: CN113269313A
Application number: CN202110625816.3A
Authority: CN
Inventors: 吴郁杰; 吴臻志; 马欣
Original assignee: Beijing Lynxi Technology Co Ltd
Current assignee: Beijing Lynxi Technology Co Ltd
Priority date: 2021-06-04
Filing date: 2021-06-04
Publication date: 2021-08-17
Anticipated expiration: 2041-06-04

Abstract

本公开提供了一种突触权重训练方法，包括：将脉冲信号输入至待训练的脉冲神经网络中；利用反向传播规则对脉冲神经网络中的目标突触权重进行学习，得出第一支路权重；以及，利用突触可塑性规则对目标突触权重进行学习，得出第二支路权重；根据第一支路权重和第二支路权重更新目标突触权重。本公开还提供了一种电子设备和计算机可读介质。

Description

突触权重训练方法、电子设备和计算机可读介质

技术领域

本公开涉及计算机技术领域，特别涉及一种突触权重训练方法、电子设备和计算机可读介质。

背景技术

相比传统的神经网络，脉冲神经网络(Spiking Neural Network，简称SNN)由于其更贴合实际的仿生设计，被应用于低功耗模式识别、图像处理和计算机视觉等多个领域。现阶段，针对脉冲神经网络，采用反向传播训练方法时训练所需样本多，计算量大，采用仿生训练方法时，难以达到理想精度。因此，单独的训练方案无法同时保证训练结果的有效性和训练开销。

发明内容

本公开提供一种突触权重训练方法、电子设备和计算机可读介质。

第一方面，本公开提供了一种突触权重训练方法，包括：

将脉冲信号输入至待训练的脉冲神经网络中；

利用反向传播规则对所述脉冲神经网络中的目标突触权重进行学习，得出第一支路权重；以及，利用突触可塑性规则对所述目标突触权重进行学习，得出第二支路权重；

根据所述第一支路权重和所述第二支路权重更新所述目标突触权重。

第二方面，本公开提供了一种电子设备，包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现上述的突触权重训练方法。

第三方面，本公开提供了一种电子设备，包括：

多个处理核；以及

片上网络，被配置为交互所述多个处理核间的数据和外部数据；

一个或多个所述处理核中存储有一个或多个指令，一个或多个所述指令被一个或多个所述处理核执行，以使一个或多个所述处理核能够执行上述的突触权重训练方法。

第四方面，本公开提供了一种计算机可读介质，其上存储有计算机程序，其中，所述计算机程序在被处理器执行时实现上述的突触权重训练方法中的步骤。

本公开所提供的突触权重训练方法、电子设备和计算机可读介质，利用反向传播规则训练获得第一支路权重，利用突触可塑性规则训练获得第二支路权重，根据第一支路权重和第二支路权重更新目标突触权重，分别利用反向传播规则和突触可塑性规则的优势训练目标突触权重，实现在保证权重训练结果的有效性的同时，快速且资源占用较少地进行突触权重的训练更新，提高突触权重训练效率。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用来提供对本公开的进一步理解，并且构成说明书的一部分，与本公开的实施例一起用于解释本公开，并不构成对本公开的限制。通过参考附图对详细示例实施例进行描述，以上和其他特征和优点对本领域技术人员将变得更加显而易见，在附图中：

图1为本公开实施例提供的一种突触权重训练方法的流程图；

图2a为本公开实施例提供的一种突触权重训练系统的结构示意图；

图2b为本公开实施例提供的另一种突触权重训练方法的流程图；

图3为本公开实施例中步骤S2的一种具体实施方法流程图；

图4a为本公开实施例提供的一种脉冲神经网络模型的结构示意图；

图4b为本公开实施例提供的一种神经元节点的结构示意图；

图5为本公开实施例中步骤S3的一种具体实施方法流程图；

图6为本公开实施例中步骤S301的一种具体实施方法流程图；

图7为本公开实施例中步骤S4的一种具体实施方法流程图；

图8为本公开实施例中步骤S4的另一种具体实施方法流程图；

图9为本公开实施例提供的一种电子设备的组成框图；

图10为本公开实施例提供的另一种脉冲神经网络模型的结构示意图；

图11为本公开实施例提供的另一种电子设备的组成框图；

图12为本公开实施例提供的一种计算机可读介质的组成框图。

具体实施方式

为使本领域的技术人员更好地理解本公开的技术方案，以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

在不冲突的情况下，本公开各实施例及实施例中的各特征可相互组合。

如本文所使用的，术语“和/或”包括一个或多个相关列举条目的任何和所有组合。

本文所使用的术语仅用于描述特定实施例，且不意欲限制本公开。如本文所使用的，单数形式“一个”和“该”也意欲包括复数形式，除非上下文另外清楚指出。还将理解的是，当本说明书中使用术语“包括”和/或“由……制成”时，指定存在所述特征、整体、步骤、操作、元件和/或组件，但不排除存在或添加一个或多个其它特征、整体、步骤、操作、元件、组件和/或其群组。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接，而是可以包括电性的连接，不管是直接的还是间接的。

除非另外限定，否则本文所用的所有术语(包括技术和科学术语)的含义与本领域普通技术人员通常理解的含义相同。还将理解，诸如那些在常用字典中限定的那些术语应当被解释为具有与其在相关技术以及本公开的背景下的含义一致的含义，且将不解释为具有理想化或过度形式上的含义，除非本文明确如此限定。

图1为本公开实施例提供的一种突触权重训练方法的流程图。如图1所示，该方法包括：

步骤S1、将脉冲信号输入至待训练的脉冲神经网络中。

其中，该脉冲信号即训练样本，可为脉冲序列及对应特定编码形式的脉冲信号等。

在一些实施例中，该脉冲神经网络的神经元模型采用LIF(Leaky Integrate-and-Fire)模型。

在一些实施例中，在将脉冲信号输入至待训练的脉冲神经网络中的步骤之前，还包括：将脉冲神经网络的各项参数进行初始化，包括突触权重、激活阈值等。

步骤S2、利用反向传播(Back Propagation，简称BP)规则对脉冲神经网络中的目标突触权重进行学习，得出第一支路权重。

在步骤S2中，针对目标突触权重利用反向传播规则进行更新，第一支路权重即反向传播规则对应的更新结果；其中，基于反向传播规则进行训练时训练效果较好，但训练计算量大，需要大量有标记样本。

步骤S3、利用突触可塑性规则对该目标突触权重进行学习，得出第二支路权重。

在步骤S3中，针对目标突触权重利用突触可塑性规则进行更新，第二支路权重即突触可塑性规则对应的更新结果。其中，突触可塑性规则可采用脉冲时序依赖可塑性(Spike Timing Dependent Plasticity，简称STDP)规则和赫布(Hebb)学习规则等仿生训练规则；在一些实施例中，脉冲时序依赖可塑性规则包括长期可塑性(Long TermPlasticity,简称LT)子规则、短期可塑性(Short Term Plasticity,简称STP)子规则和动态平衡(Homeostasis)子规则等；突触可塑性规则属于无监督学习方法，采用局部更新机制，训练量较小，不需要有标记样本，但训练效果有限。

在一些实施例中，步骤S2中利用反向传播规则进行学习的步骤和步骤S3中利用突触可塑性规则进行学习的步骤可先后执行或并行执行。

步骤S4、根据第一支路权重和第二支路权重更新目标突触权重。

在一些实施例中，通过验证样本对各支路权重进行验证评价，以从中确定目标突触权重的更新值；或者，在一些实施例中，通过将第一支路权重和第二支路权重输入预设的融合更新公式计算以得到目标突触权重的更新值，该融合更新公式可基于求平均、求和、加权平均和加权求和等多种整合方式进行设计。

本公开实施例提供了一种突触权重训练方法，该方法可用于利用反向传播规则训练获得第一支路权重，利用突触可塑性规则训练获得第二支路权重，根据第一支路权重和第二支路权重更新目标突触权重，分别利用反向传播规则和突触可塑性规则的优势训练目标突触权重，实现在保证权重训练结果的有效性的同时，快速且资源占用较少地进行突触权重的训练更新，提高突触权重训练效率。

图2a为本公开实施例提供的一种突触权重训练系统的结构示意图。如图2a所示，该突触权重训练系统包括：与反向传播计算通路连接的第一支路权重缓冲区、与突触可塑性计算通路连接的第二支路权重缓冲区、第一支路调控器、第二支路调控器、突触权重存储区一级加法器，其中，第一支路调控器与第一支路权重缓冲区相连接，第二支路调控器与第二支路权重缓冲区相连接。

图2b为本公开实施例提供的另一种突触权重训练方法的流程图。如图2b所示，该方法为基于图1所示方法的一种具体化可选实施方案。具体地，基于图2a所示的突触权重训练系统，该方法不仅包括步骤S1至步骤S3，还包括步骤S401至步骤S403，以及，在步骤S2之后还包括步骤S2a，在步骤S3之后还包括步骤S3a，其中，步骤S401至步骤S403为步骤S4的一种具体化可选实施方式。下面仅对步骤S2a、步骤S3a以及步骤S401至步骤S403进行详细描述。

在步骤S2，利用反向传播规则对脉冲神经网络中的目标突触权重进行学习，得出第一支路权重的步骤之后，还包括：步骤S2a。

步骤S2a、将第一支路权重写入第一支路权重缓冲区。

在步骤S3，利用突触可塑性规则对该目标突触权重进行学习，得出第二支路权重的步骤之后，还包括：步骤S3a。

步骤S3a、将第二支路权重写入第二支路权重缓冲区。

在上述步骤S2a和步骤S3a的基础上，步骤S4，根据第一支路权重和第二支路权重更新目标突触权重的步骤，包括：

步骤S401、从第一支路权重缓冲区中读取第一支路权重，从第二支路权重缓冲区中读取第二支路权重，以及从突触权重存储区中读取目标突触权重的当前值。

在一些实施例中，步骤S401包括：响应于第一支路权重缓冲区和第二支路权重缓冲区均存储有未读取过的支路权重的情况，从第一支路权重缓冲区中读取第一支路权重，从第二支路权重缓冲区中读取第二支路权重，以及从突触权重存储区中读取目标突触权重的当前值。

步骤S402、根据第一支路权重、第二支路权重和目标突触权重的当前值利用加法器更新目标突触权重。

步骤S403、输出更新后的目标突触权重，并将更新后的目标突触权重写入突触权重存储区。

由此，基于相应地突触权重训练系统完成一次目标突触权重的更新。

图3为本公开实施例中步骤S2的一种具体实施方法流程图。如图3所示，具体地，该反向传播规则为基于时间的反向传播(Back Propagation Through Time，简称BPTT)规则；步骤S2，利用反向传播规则对脉冲神经网络中的目标突触权重进行学习，得出第一支路权重的步骤，包括：

步骤S201、根据前向输出结果和反向误差得到第一支路权重。

在步骤S201中，基于前向传播阶段中本层的前向层的输出结果以及反向传播阶段中本层对应的反向误差，计算得到第一支路权重。其中，基于时间的反向传播规则实质上是反向传播规则，其针对输入数据为时间序列数据的情况进行设计；前向输出结果由前向层中对应的神经元节点基于其节点函数计算得出并输出；反向误差根据损失函数、实际计算输出和期望输出计算得到。

图4a为本公开实施例提供的一种脉冲神经网络模型的结构示意图。如图4a所示，具体地，脉冲神经网络的神经元模型采用LIF(Leaky Integrate-and-Fire)模型，该脉冲神经网络为递归网络，该结构示意图为将脉冲神经网络模型通过时域展开后得到的二维时空图，其中，纵向箭头表示脉冲神经网络的各层中时间步长的递进，横向箭头表示数据在各神经元节点所属的多个首尾连接的层中的传输方向，各神经元节点均对应有各自的节点函数，该节点函数基于膜电位和激活函数整合得出，对具体符号标识的解释参见图4b。

图4b为本公开实施例提供的一种神经元节点的结构示意图。如图4b所示，该神经元节点为图4a所示脉冲神经网络模型中的一个神经元节点。

对于该神经元节点，首先，针对输入数据，采用如下公式：

I^t＝X^l,t*W

进行突触整合，得出整合附加值I^t。其中，l表示层标识；t为当前时间步长；X^l,t表示时间步长为t时处于l层的神经元节点对应的激活值；W表示对应的突触权重；该突触整合过程可通过卷积或全连接等形式实现。

以及，采用如下公式：

计算得出该神经元节点当前对应的膜电位

其中，

表示前一个时间步长对应的膜电位，即相对的静息电位。

在一些实施例中，针对输出数据，通过模拟激活函数f()以及输出时对应的激活值X^l,t+1计算得出。在一些实施例中，该模拟激活函数f()对应如下公式：f(x)＝S(x-V_th)，其中，S()为阶跃函数，或称赫维赛德(Heaviside)函数。

再者，针对节点内部，该神经元节点对应的节点函数NF()可通过如下定义式进行描述：

其中，

表示该神经元节点在响应脉冲发射后对应的膜电位。

以及，在脉冲发射后对应的膜电位

与该神经元节点当前对应的膜电位

之间的关系函数τ()可通过如下定义式进行描述：

其中，V_th表示重置阈值，V_reset表示复位电位，若当前膜电位大于或等于重置阈值时，该神经元节点发射脉冲，并将膜电位重置至复位电位；α为乘性衰减系数，β为加性衰减系数。

另外，针对反向传播规则，由上式可得，在根据基于时间的反向传播规则进行突触权重计算时，根据链式法则，对于所涉及到的关系函数τ()，在

对

求偏导时有：

其中，δ()为狄拉克δ函数，该函数在除了零点以外的点函数值都等于零，其在整个定义域上的积分等于1。由于该函数在反向传播时不友好，因此为其引入了一个矩形窗口，以函数δ(x)为例，其矩形窗口

为：

其中，μ为正数。

需要说明的是，上述对根据前向输出结果和反向误差得到第一支路权重步骤以及相应脉冲神经网络模型、神经元节点的描述，仅为本公开实施例提供的一种具体实施方式，其不会对本公开的技术方案产生限制，其他根据相应参数计算得出第一支路权重的计算方式以及相应的神经网络模型同样适用于本公开的技术方案。

图5为本公开实施例中步骤S3的一种具体实施方法流程图。如图5所示，具体地，步骤S3，利用突触可塑性规则对目标突触权重进行学习，得出第二支路权重的步骤，包括：

步骤S301、利用突触可塑性规则下的长期可塑性(Long Term Plasticity,简称LT)子规则对目标突触权重进行学习，得出第二支路权重。

其中，突触可塑性规则采用脉冲时序依赖可塑性规则，由此，基于长期可塑性子规则进行目标突触权重的建模学习。

图6为本公开实施例中步骤S301的一种具体实施方法流程图。如图6所示，具体地，长期可塑性子规则包括长期抑制(Long Term Depression,简称LTD)子规则和长期增强(Long-Term Potentiation,简称LTP)子规则；步骤S301，利用突触可塑性规则下的长期可塑性子规则对目标突触权重进行学习，得出第二支路权重的步骤，包括：

步骤S3011、根据目标突触权重对应的前脉冲信息和后脉冲信息得到第一权重参数。

其中，考虑到突触前后神经元的相互作用，通过前脉冲信息和后脉冲信息计算得到第一权重参数。

具体地，在一些实施例中，基于赫布(Hebbian，简称HB)理论，通过局部变量trace跟踪单个神经元节点的先前活动和先前值，其中，先前活动体现为在上一个时间步长该神经元节点的膜电位变化情况以及脉冲发放情况，先前值体现为上一个时间步长的trace的值，使用x_i(t)表示突触前神经元i相关的trace，使用y_j(t)表示突触后神经元j相关的trace。由此，采用如下公式：

计算得出第一权重参数HB_±(t)。其中，t为时间变量；s_i(t)和s_j(t)分别表示前脉冲信息和后脉冲信息。

步骤S3012、根据学习率和目标突触权重的当前值得到第二权重参数。

其中，考虑到目标突触权重自身进行迭代更新，通过学习率和目标突触权重的当前值计算得到第二权重参数。

具体地，在一些实施例中，基于加性(additive)理论，采用如下公式：

计算得到第二权重参数WB_±(t)，其中，λ为学习率，η表示长期抑制子规则和长期增强子规则之间的比例系数。

步骤S3013、根据第一权重参数和第二权重参数确定与长期增强子规则对应的第三权重参数，并根据第一权重参数和第二权重参数确定与长期抑制子规则对应的第四权重参数。

在步骤S3013中，通过基于前脉冲信息和后脉冲信息得到的第一权重参数，以及基于学习率和目标突触权重的当前值得到的第二权重参数，得出长期增强子规则对应的第三权重参数和长期抑制子规则对应的第四权重参数。

具体地，在一些实施例中，采用如下公式：

w'(t)＝HB₊(t)*WB₊(t)

计算得出第三权重参数w'(t)。以及，采用如下公式：

w”(t)＝HB_-(t)*WB_-(t)

计算得出第四权重参数w”(t)。

步骤S3014、根据第三权重参数和第四权重参数得出第二支路权重。

其中，基于长期增强子规则对应的第三权重参数和长期抑制子规则对应的第四权重参数计算得出第二支路权重。

具体地，在一些实施例中，采用如下公式：

w(t)＝w(t-Δt)+w'(t)+w”(t)

计算得出第二支路权重w(t)。其中，Δt表示时间步长。

需要说明的是，上述对利用具体公式计算得出相应权重参数和权重的描述，仅为本公开实施例提供的一种具体实施方式，其不会对本公开的技术方案产生限制，其他根据相应参数计算得出权重和权重参数的计算方式同样适用于本公开的技术方案。

图7为本公开实施例中步骤S4的一种具体实施方法流程图。如图7所示，具体地，步骤S4，根据第一支路权重和第二支路权重更新目标突触权重的步骤，包括：

步骤S4a、对第一支路权重和第二支路权重进行加权求和，并根据加权求和结果更新目标突触权重。

在步骤S4a中，通过加权求和对第一支路权重和第二支路权重进行整合，实现对目标突触权重的融合更新。

在一些实施例中，进行加权求和时，第一支路权重对应第一加权系数，第二支路权重对应第二加权系数，其中，第一加权系数和第二加权系数均大于或等于0，且小于或等于1，第一加权系数和第二加权系数之和为1。

在一些实施例中，基于如图2a所示的系统，并结合步骤S401，步骤S4a，对第一支路权重和第二支路权重进行加权求和，并根据加权求和结果更新目标突触权重的步骤，包括：获取经第一支路调控器加权后输出的第一支路权重，以及获取经第二支路调控器加权后输出的第二支路权重；将加权后的第一支路权重、加权后的第二支路权重和目标突触权重的当前值输入至加法器，并根据加法器的输出结果更新目标突触权重。

图8为本公开实施例中步骤S4的另一种具体实施方法流程图。如图8所示，在图7所示的步骤S4a的基础上，具体地，步骤S4，根据第一支路权重和第二支路权重更新目标突触权重的步骤，还包括：

步骤S4b、根据目标突触权重对应的监督信号的置信度对第一支路权重对应的第一加权系数进行调整。

在一些实施例中，当对应的监督信号的置信度较高时，增大第一加权系数或保持第一加权系数不变；当对应的监督信号的置信度较低时，减小第一加权系数。

在一些实施例中，基于如图2a所示的系统，步骤S4b可体现为控制第一支路调控器根据目标突触权重对应的监督信号的置信度对第一支路权重对应的第一加权系数进行调整。

步骤S4c、根据调控信号对第二支路权重对应的第二加权系数进行调整。

其中，调控信号基于脉冲神经网络中的一层的脉冲信息，或称发放信息确定，在一些实施例中，该脉冲信息即为该层发放的脉冲序列。在一些实施例中，当该层出现发放过多或发放过少的情况时，可基于调控信号减小第二加权系数。

在一些实施例中，基于如图2a所示的系统，步骤S4c可体现为控制第二支路调控器根据调控信号对第二支路权重对应的第二加权系数进行调整。

需要说明的是，图8中所对应的步骤S4b和步骤S4c的组合实施仅为本公开实施例提供的一种具体实施方式，即，在偏重反向传播规则进行学习时可仅实施步骤S4b所对应的调整步骤，相应地，在偏重突触可塑性规则进行学习时可仅实施步骤S4c所对应的调整步骤。

在一些可选的实施例中，在执行步骤S4b和/或步骤S4c时，可以控制第一加权系数和第二加权系数之和为1。

示例性地，在执行步骤S4b以及步骤S4c时，可以分别确定根据监督信号的置信度确定的第一加权系数以及根据调控信号确定的第二加权系数，对根据监督信号的置信度确定的第一加权系数以及根据调控信号确定的第二加权系数执行归一化处理，得到调整后的第一加权系数和第二加权系数。

示例性地，在仅执行步骤S4b或步骤S4c时，例如，仅执行步骤S4b，根据监督信号的置信度，增大第一加权系数，并对应减小第二加权系数，以使第一加权系数和第二加权系数之和为1。

图9为本公开实施例提供的一种电子设备的组成框图。如图9所示，该电子设备包括：

多个处理核101；以及

片上网络102，被配置为交互该多个处理核101间的数据和外部数据；

一个或多个处理核101中存储有一个或多个指令，该一个或多个指令被一个或多个处理核102执行，以使一个或多个处理核101能够实现如上述实施例中任一的突触权重训练方法。

图10为本公开实施例提供的另一种脉冲神经网络模型的结构示意图。如图10所示，具体地，应用于众核系统，众核系统(或称众核处理器)中包括多个处理核；处理核又称为核、核心等，具备应用运行、任务处理等功能。其中，一个处理核上运行维护有一个或多个神经元单元；不同处理核，如处理核A、处理核B和处理核C上的神经元单元通过轴突缓冲区和突触连接，突触体现为轴突缓冲区与同处理核上的神经元单元之间连线的交点，例如d点，箭头指示神经元单元输出数据的方向。

图11为本公开实施例提供的另一种电子设备的组成框图。如图11所示，该电子设备包括：

一个或多个处理器201；

存储器202，其上存储有一个或多个程序，当该一个或多个程序被该一个或多个处理器执行，使得该一个或多个处理器201实现如上述实施例中任一的突触权重训练方法；

一个或多个I/O接口203，连接在处理器与存储器之间，配置为实现处理器与存储器的信息交互。

其中，处理器201为具有数据处理能力的器件，其包括但不限于中央处理器(CPU)等；存储器202为具有数据存储能力的器件，其包括但不限于随机存取存储器(RAM，更具体如SDRAM、DDR等)、只读存储器(ROM)、带电可擦可编程只读存储器(EEPROM)、闪存(FLASH)；I/O接口(读写接口)203连接在处理器201与存储器202间，能实现处理器201与存储器202的信息交互，其包括但不限于数据总线(Bus)等。

在一些实施例中，处理器201、存储器202和I/O接口203通过总线204相互连接，进而与计算设备的其它组件连接。

在一些实施例中，多个处理器201包括多个图形处理器(GPU)，其组合设置构成图形处理器阵列。

图12为本公开实施例提供的一种计算机可读介质的组成框图。该计算机可读介质上存储有计算机程序，其中，该计算机程序在被处理器执行时实现如上述实施例中任一的突触权重训练方法中的步骤。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中，在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分；例如，一个物理组件可以具有多个功能，或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器，如中央处理器、数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

本文已经公开了示例实施例，并且虽然采用了具体术语，但它们仅用于并仅应当被解释为一般说明性含义，并且不用于限制的目的。在一些实例中，对本领域技术人员显而易见的是，除非另外明确指出，否则可单独使用与特定实施例相结合描述的特征、特性和/或元素，或可与其他实施例相结合描述的特征、特性和/或元件组合使用。因此，本领域技术人员将理解，在不脱离由所附的权利要求阐明的本公开的范围的情况下，可进行各种形式和细节上的改变。

Claims

1.一种突触权重训练方法，其中，包括：

将训练样本对应的脉冲信号输入至待训练的脉冲神经网络中；

2.根据权利要求1所述的方法，其中，在所述利用反向传播规则对所述脉冲神经网络中的目标突触权重进行学习，得出第一支路权重的步骤之后，还包括：

将所述第一支路权重写入第一支路权重缓冲区；

在所述利用突触可塑性规则对所述目标突触权重进行学习，得出第二支路权重的步骤之后，还包括：

将所述第二支路权重写入第二支路权重缓冲区。

3.根据权利要求2所述的方法，其中，所述根据所述第一支路权重和所述第二支路权重更新所述目标突触权重的步骤，包括：

从所述第一支路权重缓冲区中读取所述第一支路权重，从所述第二支路权重缓冲区中读取所述第二支路权重，以及从突触权重存储区中读取所述目标突触权重的当前值；

根据所述第一支路权重、所述第二支路权重和所述目标突触权重的当前值利用加法器更新所述目标突触权重；

输出更新后的所述目标突触权重，并将更新后的所述目标突触权重写入所述突触权重存储区。

4.根据权利要求3所述的方法，其中，所述从所述第一支路权重缓冲区中读取所述第一支路权重，从所述第二支路权重缓冲区中读取所述第二支路权重，以及从突触权重存储区中读取所述目标突触权重的当前值的步骤，包括：

响应于所述第一支路权重缓冲区和所述第二支路权重缓冲区均存储有未读取过的支路权重的情况，从所述第一支路权重缓冲区中读取所述第一支路权重，从所述第二支路权重缓冲区中读取所述第二支路权重，以及从突触权重存储区中读取所述目标突触权重的当前值。

5.根据权利要求1所述的方法，其中，所述脉冲神经网络的神经元模型采用LIF模型。

6.根据权利要求1所述的方法，其中，所述反向传播规则为基于时间的反向传播规则；

所述利用反向传播规则对所述脉冲神经网络中的目标突触权重进行学习，得出第一支路权重的步骤，包括：

根据前向输出结果和反向误差得到所述第一支路权重。

7.根据权利要求1所述的方法，其中，所述利用突触可塑性规则对所述目标突触权重进行学习，得出第二支路权重的步骤，包括：

利用所述突触可塑性规则下的长期可塑性子规则对所述目标突触权重进行学习，得出所述第二支路权重。

8.根据权利要求7所述的方法，其中，所述长期可塑性子规则包括：长期抑制子规则和长期增强子规则；

所述利用所述突触可塑性规则下的长期可塑性子规则对所述目标突触权重进行学习，得出所述第二支路权重的步骤，包括：

根据所述目标突触权重对应的前脉冲信息和后脉冲信息得到第一权重参数；以及，根据学习率和所述目标突触权重的当前值得到第二权重参数；

根据所述第一权重参数和所述第二权重参数确定与所述长期增强子规则对应的第三权重参数，并根据所述第一权重参数和所述第二权重参数确定与所述长期抑制子规则对应的第四权重参数；

根据所述第三权重参数和所述第四权重参数得出所述第二支路权重。

9.根据权利要求1所述的方法，其中，所述根据所述第一支路权重和所述第二支路权重更新所述目标突触权重的步骤，包括：

对所述第一支路权重和所述第二支路权重进行加权求和，并根据加权求和结果更新所述目标突触权重。

10.根据权利要求9所述的方法，其中，所述根据所述第一支路权重和所述第二支路权重更新所述目标突触权重的步骤，还包括：

根据所述目标突触权重对应的监督信号的置信度对所述第一支路权重对应的第一加权系数进行调整。

11.根据权利要求9所述的方法，其中，所述根据所述第一支路权重和所述第二支路权重更新所述目标突触权重的步骤，还包括：

根据调控信号对所述第二支路权重对应的第二加权系数进行调整，其中，所述调控信号基于所述脉冲神经网络中的一层的脉冲信息确定。

12.一种电子设备，包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-11中任一所述的突触权重训练方法。

13.一种电子设备，包括：

多个处理核；以及

一个或多个所述处理核中存储有一个或多个指令，一个或多个所述指令被一个或多个所述处理核执行，以使一个或多个所述处理核能够执行如权利要求1-11中任一所述的突触权重训练方法。

14.一种计算机可读介质，其上存储有计算机程序，其中，所述计算机程序在被处理器执行时实现如权利要求1-11中任一所述的突触权重训练方法中的步骤。