CN105122278B

CN105122278B - 神经网络及编程方法

Info

Publication number: CN105122278B
Application number: CN201380075586.1A
Authority: CN
Inventors: 纳拉延·斯里尼瓦桑; 曹永官
Original assignee: HRL Laboratories LLC
Current assignee: HRL Laboratories LLC
Priority date: 2013-03-15
Filing date: 2013-08-30
Publication date: 2017-03-22
Anticipated expiration: 2033-08-30
Also published as: EP2973240A4; CN105122278A; EP2973240A1

Abstract

一种神经网络，其中所述神经网络的一部分包括：具有第一数量的神经元的第一阵列，其中第一阵列的每个神经元的树突被设置为对用于表示测量到的参数更接近指定给所述神经元的预定值的输入信号进行接收；以及具有第二数量的神经元的第二阵列，其中第二数量小于第一数量，第二阵列的每个神经元的树突与所述第一阵列的多个神经元的轴突一起形成兴奋的STDP突触；第二阵列的每个神经元的树突与第二阵列的相邻神经元的轴突一起形成兴奋的STDP突触。

Description

神经网络及编程方法

关于联邦资助研究的声明

本发明在美国政府的支持下基于美国国防高级研究计划局(DARPA)所授予的合同号HR0011-09-C-0001(SyNAPSE)进行。美国政府拥有本发明的特定权利。

相关申请的交叉引用

本申请要求于2013年3月15日提交的美国临时申请No.61/799,883以及于2013年8月30日提交的美国正式申请No.14/015,001的优先权，所述申请中的每一个以全文引用的方式并入本文中。

技术领域

本公开涉及例如计算机实现的神经网络，还涉及对此类网络进行编程的方法。具体地，本公开涉及能够对任意多种变换进行学习的容错性神经网络，以及对所述神经网络进行编程的方法。

背景技术

感官知觉与行为相互依存。对于人类和其他物种，行为可由当前情境触发，并且反映了其所处的即时环境条件。这类行为通常被称作刺激反应性反射。刺激与反应之间的相互依存性建立了行动感知循环(action perception cycle)，在该循环中，未出现过的刺激会触发出导致其自身的更好知觉或其所处的更好的即时环境条件的行动，然后该循环继续进行。

与利用刺激反应循环的独有控制相比，人类行为要灵活得多。基于智能的系统的一种属性即为在行动感知循环中对环境条件与适当的行为之间的新关系进行学习的能力。大脑中各神经元之间的通信的主要模式为：按照脉冲、动作电位或尖峰脉冲(spike)的形式进行编码。大脑由数十亿的神经元细胞构成，这些神经元细胞是嘈杂的、不精准且不可靠的模拟器件。神经元是经由突触在彼此之间建立连接的复杂的适应性结构。突触具有前突触部分和后突触部分，所述前突触部分包括神经元的轴突，其向所述突触输入尖峰脉冲，所述后突触部分包括神经元的树突，其对所述突触中进行接收的尖峰脉冲较为敏感。各突触可根据在所述突触任意一侧的神经元的尖峰脉冲行为而显著改变其功能。突触包括适应机制，其根据尖峰脉冲时序依赖可塑性(STDP)学习规则而对所述突触的权重或增益进行调整。

在STDP规则之下，如果神经元的输入尖峰脉冲在平均上倾向于在该神经元的输出尖峰脉冲之前即刻发生，则稍微加强这一特定输入。另一方面，如果输入尖峰在平均上倾向于在输入尖峰之后即刻发生，则稍微减弱这一特定输入，从而有“尖峰脉冲时序依赖可塑性”。因此，可使得有可能成为后突触神经元激励的起因的输入在未来更有可能做出贡献，而使得不是后突触神经元激励的起因的输入在未来更不可能做出贡献。持续所述过程，直到保留了各连接的初始集合的一个子集，同时其他所有连接的影响减至零。由于当神经元的许多输入在短时间内发生时所述神经元产生输出尖峰脉冲，因此所述保留的各输入的子集为倾向于在时间上相关的那些输入。另外，由于加强了在输出之前发生的输入，因此提供了相关性的最早指示的输入在最后成为神经元的最终输入。

由通过STDP使神经元和突触相互作用的组件构成的大脑结构可以实时地解决复杂任务和展示复杂行为，并且具有较高的精准度而具有非常低的功率。然而，在物理网络中对这种行为进行建模较为复杂。

已对利用模拟电路和数字电路以及计算机实现方法的神经网络进行了讨论，以实现STDP学习规则。然而，当前的模型不具备对在学习过程初期或在已进行部分初始学习之后引入的错误(即，感知输入信号或动作输入信号的部分缺失)的容忍能力。因此，已知的实现STDP学习规则的系统不能以容错的方式学习例如任意多种变换。

已体验过上述通信问题的通信系统的一些示例包括：T.P.Vogels、K.Rajan和L.F.Abbott的“Neural Network Dynamics”，Annual Review Neuroscience,vol.28,pp.357-376,2005；W.Gerstner和W.Kistler的“Spiking Neuron Models-SingleNeurons”,Populations,Plasticity,Cambridge University Press,2002；H.Markram、J.Lubke、M.Frotscher和B.Sakmann的“Regulation of synaptic efficacy bycoincidence of postsynaptic APs and EPSPs”,Science,vol.275,pp.213-215,1997；Bi、G.Q.和M.Poo的“Activity-induced synaptic modifications inhippocampalculture:dependence on spike timing,synaptic strength and cell type”,J.Neuroscience.vol.18,pp.10464-10472,1998；J.C.Magee和D.Johnston的“Asynaptically controlled,associative signal for Hebbian plasticity inhippocampal neurons”,Science vol.275,pp.209-213,1997；S.Song、K.D.Miller和L.F.Abbott的“Competitive Hebbian Learning Through Spike-Timing DependentSynaptic Plasticity”,Nature Neuroscience,vol.3pp.919-926,2000；A.P.Davison和Y.Fregnac的“Learning Cross-Modal Spatial Transformations through Spike-TimingDependent Plasticity”,Journal of Neuroscience,vol.26,no.2,pp.5604-5615,2006；Q.X.Wu、T.M.McGinnity、L.P.Maguire、A.Belatreche和B.Glackin的“2D co-ordinatetransformation based on a spike-timing dependent plasticity learningmechanism”，Neural Networks,vol.21,pp.1318-1327,2008；Q.X.Wu、T.M.McGinnity、L.P.Maguire、A.Belatreche和B.Glackin的“Processing visual stimuli usinghierarchical spiking neural networks”,International Journal ofNeurocomputing,vol.71,no.10,pp.2055-2068,2008。上述参考文献的每一篇以引用方式全文并入本文中。

图1示出了题为“Learning Cross-Modal Spatial Transformations throughSpike-Timing Dependent Plasticity”的上述参考文献中描述的网络模型。图1示出了这样的神经网络，其对具有1个自由度(df)的手臂的连接处的角度θ和该手臂末端的位置x的输入进行接收，所述角度和位置处于以视觉为中心的参考系中。在学习阶段之后，所述神经网络变为能够基于连接处的角度θ输出x。神经网络10包括输入神经元14的第一一维阵列12，每个输入神经元14产生尖峰脉冲，其激发率(firing rate)以与指定给所述神经元的角度更接近的角度θ的函数而增长。图1示出了关于角度θ给定值的阵列12的所有神经元14的激发率FR。神经网络10还包括输入神经元18的第二一维阵列16，每个输入神经元18产生尖峰脉冲，其激发率以更接近于指定给所述神经元的预定值的位置x的函数而增长。图1示出了关于位置x给定值的阵列16的所有神经元18的激发率FR。神经网络10包括神经元22的第三一维阵列20。

对从神经元14到神经元22的多对多连接(全连接)进行初始化，并且利用STDP对所述连接的强度进行修改。从神经元18到神经元22的连接是一对一的。这些非STPD(或非可塑性)的连接的强度固定。

在将对应于随机角度θ及其等价位置x的刺激发送至阵列20的学习阶段之后，阵列16停止向阵列20提供输入，并且阵列20响应于连接处的角度θ而输出位置x。图1示出了由阵列20的神经元22输出的激发率FR，其响应于学习阶段之后的角度θ的给定值。

图2以示意图的形式示出了图1的神经网络10，并且示出了完全连接至输出阵列/层20的输入阵列/层12以及一对一地连接至输出阵列/层20的训练阵列/层16。

图3示意了如上述参考文献中Wu等人的参考文献所公开的神经网络30。神经网络30包括一对一地连接至输出层20的训练层16，如图1详细示出的那样。此外，神经网络30包括两个输入层12，其在拓扑结构上与网络层32的输入连接，网络层32完全连接至输出层20的输入。如上所述，图1至图3的神经网络无法容忍在学习过程初期或在已发生一些初始学习之后引入的错误，例如传感输入信号或动作输入信号的部分缺失。

因此，存在对能够容错的神经网络的需求。

发明内容

严格来说，本文示出了一种对自实现网络的任意多种变换进行学习的尖峰脉冲模型。

本公开的一个实施例包括一种神经网络，其中所述神经网络的一部分包括：具有第一数量的神经元的第一阵列，其中所述第一阵列的每个神经元的树突被设置为对用于表示测量到的参数更接近指定给所述神经元的预定值的输入信号进行接收；具有第二数量的神经元的第二阵列，所述第二阵列的每个神经元的树突与所述第一阵列的多个神经元的轴突一起形成兴奋的STDP突触；所述第二阵列的每个神经元的树突与所述第二阵列的相邻神经元的轴突一起形成兴奋的STDP突触。

根据本公开的一个实施例，第二数量小于第一数量。

根据本公开的一个实施例，所述第二阵列还包括在所述第二阵列的各神经元之间分布的第三数量的中间神经元，其中所述第三数量小于所述第二数量，其中：所述第二阵列的每个神经元的轴突与所述第二阵列的相邻的中间神经元的树突一起形成兴奋的STDP突触；并且所述第二阵列的每个中间神经元的轴突与所述第二阵列的相邻的神经元和中间神经元的树突一起形成抑制的STDP突触。

根据本公开的一个实施例，所述第一阵列的每个神经元的树突被设置为接收输入信号，所述输入信号具有在测量到的参数更接近指定给所述神经元的预定值时增长的速率。

本公开的一个实施例包括一种神经网络，其具有如上所述的第一神经网络部分和第二神经网络部分以及第三阵列，所述第三阵列具有第四数量的神经元以及在所述第三阵列的各神经元之间分布的第五数量的中间神经元，其中第五数量小于第四数量，其中：所述第三阵列的每个神经元的轴突与所述第三阵列的相邻的中间神经元的树突一起形成兴奋的STDP突触；并且所述第三阵列的每个中间神经元的轴突与所述第三阵列的相邻的神经元和中间神经元的树突一起形成抑制的STDP突触；其中所述第一神经网络部分的第二阵列的每个神经元的轴突与所述第三阵列的多个神经元的树突一起形成兴奋的STDP突触；其中所述第二神经网络部分的第二阵列的每个神经元的轴突与所述第三阵列的多个神经元的树突一起形成兴奋的STDP突触。

根据本公开的一个实施例，所述第三阵列包括多行多列的神经元，其中所述第一神经网络部分的第二阵列的每个神经元的轴突与所述第三阵列的一行的多个神经元的树突一起形成兴奋的STDP突触；并且其中所述第二神经网络部分的第二阵列的每个神经元的轴突与所述第三阵列的一列的多个神经元的树突一起形成兴奋的STDP突触。

根据本公开的一个实施例，所述神经网络包括如上所述的第三神经网络部分以及第四阵列，所述第四阵列具有第二数量的神经元以及在所述第四阵列的各神经元之间分布的第三数量的中间神经元，其中：所述第四阵列的每个神经元的轴突与所述第四阵列的相邻的中间神经元的树突一起形成兴奋的STDP突触；并且所述第四阵列的每个中间神经元的轴突与所述第四阵列的相邻的神经元和中间神经元的树突一起形成抑制的STDP突触；其中所述第四阵列的每个神经元的树突与所述第三阵列的多个神经元的轴突一起形成兴奋的STDP突触；并且其中所述第四阵列的每个神经元的树突与所述第三神经网络的第二阵列的对应神经元的轴突一起形成兴奋的非STDP突触。

根据本公开的一个实施例，所述第一神经网络部分和所述第二神经网络部分的输入信号与可变参数有关，所述可变参数与所述第三神经网络的输入信号相关。

根据本公开的一个实施例，所述神经元第一阵列包括神经元的第一子阵列和第二子阵列，其分别被设置为接收与第一测量参数和第二测量参数相关的输入信号。

根据本公开的一个实施例，所述第二阵列包括多行多列的神经元；其中所述神经元第一子阵列的每个神经元的轴突与所述第二阵列的一行的多个神经元的树突一起形成兴奋的STDP突触；并且其中所述神经元第二子阵列的每个神经元的轴突与所述第二阵列的一列的多个神经元的树突一起形成兴奋的STDP突触。

根据本公开的一个实施例，所述第二阵列还包括在所述第二阵列的各神经元之间分布的第三数量的中间神经元，其中第三数量小于第二数量，其中：所述第二阵列的每个神经元的轴突与所述第二阵列的相邻的中间神经元的树突一起形成兴奋的STDP突触；并且所述第二阵列的每个中间神经元的轴突与所述第二阵列的相邻的神经元和中间神经元的树突一起形成抑制的STDP突触。

根据本公开的一个实施例，所述神经网络还包括：第三阵列，其具有第四数量的神经元以及在所述第三阵列的各神经元之间分布的第五数量的中间神经元，其中第五数量小于第四数量，其中：所述第三阵列的每个神经元的轴突与所述第三阵列的相邻的中间神经元的树突一起形成兴奋的STDP突触；并且所述第三阵列的每个中间神经元的轴突与所述第三阵列的相邻的神经元和中间神经元的树突一起形成抑制的STDP突触；其中所述第三阵列的每个神经元的树突与所述第二阵列的每个神经元的轴突一起形成兴奋的STDP突触。

根据本公开的一个实施例，所述神经网络包括与所述第三阵列的神经元数量相同的神经元，其中所述第四阵列的每个神经元的树突被设置为对用于表示测量到的参数更接近指定给所述神经元的预定值的输入信号进行接收；其中所述第四阵列的每个神经元的轴突与所述第三阵列的对应神经元的树突一起形成兴奋的非STDP突触。

根据本公开的一个实施例，所述神经元第一子阵列和所述神经元第二子阵列的输入信号与可变参数有关，所述可变参数与所述第四阵列的输入信号相关。

根据本公开的一个实施例，所述神经元的第四阵列为如上所述的另一神经网络的神经元子阵列。

本公开的另一实施例包括一种对神经网络进行编程的方法，所述方法包括步骤：提供第一神经网络部分，其包括具有第一数量的神经元的第一阵列以及具有第二数量的神经元的第二阵列，其中所述第二数量小于所述第一数量，所述第二阵列的每个神经元的树突与所述第一阵列的多个神经元的轴突一起形成兴奋的STDP突触；所述第二阵列的每个神经元的树突与所述第二阵列的相邻的神经元的轴突一起形成兴奋的STDP突触；以及向所述第一阵列的每个神经元的树突提供输入信号，该输入信号用于表示测量到的参数更接近指定给所述神经元的预定值。

根据本公开的一个实施例，所述方法还包括向所述第二阵列提供在所述第二阵列的各神经元之间分布的第三数量的中间神经元的步骤，其中所述第三数量小于所述第二数量，其中：所述第二阵列的每个神经元的轴突与所述第二阵列的相邻的中间神经元的树突一起形成兴奋的STDP突触；并且所述第二阵列的每个中间神经元的轴突与所述第二阵列的相邻的神经元和中间神经元的树突一起形成抑制的STDP突触。

根据本公开的一个实施例，所述方法包括向所述第一阵列的每个神经元的树突提供输入信号的步骤，所述输入信号具有在测量到的参数更接近指定给所述神经元的预定值时增长的速率。

根据本公开的一个实施例，所述方法包括步骤：提供第二神经网络部分，其具有与所述第一神经网络部分的结构相同的结构；以及提供第三阵列，其具有第四数量的神经元以及在所述第三阵列的各神经元之间分布的第五数量的中间神经元，其中第五数量小于第四数量，其中：所述第三阵列的每个神经元的轴突与所述第三阵列的相邻的中间神经元的树突一起形成兴奋的STDP突触；并且所述第三阵列的每个中间神经元的轴突与所述第三阵列的相邻的神经元和中间神经元的树突一起形成抑制的STDP突触；其中所述第一神经网络部分的第二阵列的每个神经元的轴突与所述第三阵列的多个神经元的树突一起形成兴奋的STDP突触；并且其中所述第二神经网络部分的第二阵列的每个神经元的轴突与所述第三阵列的多个神经元的树突一起形成兴奋的STDP突触；以及向所述第二神经网络部分的第一阵列的每个神经元的树突提供输入信号，该输入信号用于表示测量到的参数更接近指定给所述神经元的预定值。

根据本公开的一个实施例，所述方法包括步骤：提供第三神经网络部分，其具有与所述第一神经网络部分的结构相同的结构；提供第四阵列，其具有第二数量的神经元以及在所述第四阵列的神经元之间分布的第三数量的中间神经元，其中：所述第四阵列的每个神经元的轴突与所述第四阵列的相邻的中间神经元的树突一起形成兴奋的STDP突触；并且所述第四阵列的每个中间神经元的轴突与所述第四阵列的相邻的神经元和中间神经元的树突一起形成抑制的STDP突触；其中所述第四阵列的每个神经元的树突与所述第三阵列的多个神经元的轴突一起形成兴奋的STDP突触；并且其中所述第四阵列的每个神经元的树突与所述第三神经网络部分的第二阵列的对应神经元的轴突一起形成兴奋的非STDP突触；以及向所述第三神经网络部分的第一阵列的每个神经元的树突提供输入信号，该输入信号用于表示测量到的参数更接近指定给所述神经元的预定值。

根据本公开的一个实施例，所述第一神经网络部分和第二神经网络部分的输入信号与可变参数有关，所述可变参数与所述第三神经网络部分的输入信号相关。

根据本公开的一个实施例，向所述第一阵列的每个神经元的树突提供用于表示测量的参数更接近指定给所述神经元的预定值的输入信号的步骤包括：向所述第一阵列的神经元第一子集的每个神经元的树突提供输入信号，该输入信号用于表示第一测量参数更接近指定给所述神经元的预定值；向所述第一阵列的神经元第二子集的每个神经元的树突提供输入信号，该输入信号用于表示第二测量参数更接近指定给所述神经元的预定值。

根据本公开的一个实施例，提供具有第二数量的神经元的第二阵列的步骤包括提供具有多行多列的神经元的第二阵列，其中所述第一阵列的神经元第一子集的每个神经元的轴突与所述第二阵列的一行的多个神经元的树突一起形成兴奋的STDP突触；并且其中所述第一阵列的神经元第二子集的每个神经元的轴突与所述第二阵列的一列的多个神经元的树突一起形成兴奋的STDP突触。

根据本公开的一个实施例，所述方法还包括向所述第二阵列提供在所述第二阵列的各神经元之间分布的第三数量的中间神经元的步骤，其中所述第三数量小于所述第二数量，其中所述第二阵列的每个神经元的轴突与所述第二阵列的相邻的中间神经元的树突一起形成兴奋的STDP突触；并且所述第二阵列的每个中间神经元的轴突与所述第二阵列的相邻的神经元和中间神经元的树突一起形成抑制的STDP突触。

根据本公开的一个实施例，所述方法包括：提供第三阵列，其具有第四数量的神经元以及在所述第三阵列的各神经元之间分布的第五数量的中间神经元，其中第五数量小于第四数量，其中所述第三阵列的每个神经元的轴突与所述第三阵列的相邻的中间神经元的树突一起形成兴奋的STDP突触；并且所述第三阵列的每个中间神经元的轴突与所述第三阵列的相邻的神经元和中间神经元的树突一起形成抑制的STDP突触；其中所述第三阵列的每个神经元的树突与所述第二阵列的每个神经元的轴突一起形成兴奋的STDP突触；以及提供第四阵列，其包括与所述第三阵列的神经元数量相同的神经元，其中所述第四阵列的每个神经元的树突被设置为对用于表示测量到的参数更接近指定给所述神经元的预定值的输入信号进行接收；并且其中所述第四阵列的每个神经元的轴突与所述第三阵列的对应神经元的树突一起形成兴奋的非STDP突触；所述方法还包括向所述第四阵列的每个神经元的树突提供输入信号的步骤，所述输入信号用于表示测量到的参数更接近指定给所述神经元的预定值；其中神经元第一子集和神经元第第二子集的输入信号与可变参数有关，所述可变参数与所述第四阵列的输入信号相关。

本公开的另一实施例包括一种对如上所述的具有第一神经网络部分和第二神经网络部分的神经网络的输出进行解码的方法，所述方法包括步骤：向第一神经网络部分的第一阵列和第二神经网络部分的第一阵列提供第一输入信号和第二输入信号，该第一输入信号和该第二输入信号具有在测量到的参数更接近指定给各所述第一阵列的神经元的预定值时增加的速率；向所述神经元的第四阵列的每个神经元指定在1至N的范围内的增量位置值，N为所述第四阵列的神经元的数量；在任何给定的时间，对所述第四阵列的每个神经元的激发率进行测量；以及在所述任何给定的时间，将所述神经网络的输出估计为对应于所述第四阵列的一个神经元，该神经元的位置值等于：所述第四阵列的每个神经元的由其在所述任何给定时间的激发率进行加权的位置值之和除以所述第四阵列的每个神经元在所述任何给定时间的激发率的和得到的商。

根据本公开的一个实施例，所述方法包括步骤：如果所述第四阵列中部的神经元具有无效的激发率，则向更小的位置值的各神经元指定增加了值N的位置值。

本公开的另一实施例包括一种对如上所述的具有神经元第一子阵列和神经元第二子阵列的神经网络的输出进行解码的方法，所述方法包括步骤：向神经元第一子阵列和神经元第二子阵列提供第一输入信号和第二输入信号，该第一输入信号和该第二输入信号具有在测量到的参数更接近指定给所述神经元第一子阵列和神经元第二子阵列的神经元的预定值时增加的速率；向所述神经元的第三阵列的每个神经元指定在1至N的范围内的增量位置值，N为所述第三阵列的神经元的数量；在任何给定的时间，对所述第三阵列的每个神经元的激发率进行测量；以及在所述任何给定的时间，将所述神经网络的输出估计为对应于所述第三阵列的一个神经元，该神经元的位置值等于：所述第三阵列的每个神经元的由其在所述任何给定时间的激发率进行加权的位置值之和除以所述第三阵列的每个神经元在所述任何给定时间的激发率的和得到的商。

根据本公开的一个实施例，所述方法包括以下步骤：如果所述第三阵列中部的神经元具有无效的激发率，则向更小的位置值的各神经元指定增加了值N的位置值。

本公开的一个实施例包括一种神经网络，其包括：多个输入通道；神经元的中间层，其包括多个神经元之间的多个复发性连接；多个抑制的中间神经元，其连接至所述中间层的神经元；多个第一连接，其被配置为将所述中间层的神经元连接至预测层；以及多个第二连接，其被配置为将所述预测层连接至输出层。

根据本公开的一个实施例，所述输出层被配置为连接至另一层神经元，并且所述另一层神经元可通过一个或多个连接而连接至一个或多个附加预测层。所述一个或多个附加预测层可被配置为连接至一个或多个附加电路。所述中间层的神经元可通过多个电突触连接至所述多个抑制的中间神经元。所述输入通道可向所述神经元的第一层提供尖峰脉冲序列。

本公开的一个实施例包括一种永久的计算机可读存储介质，其用于在包括多个电路的系统中进行信号传递，所述介质含有计算机可读程序，其中在计算机上进行处理的所述程序使得所述计算机实现以下步骤：在神经元的第一层接收尖峰脉冲序列；将多个抑制的中间神经元传输至所述第一层的神经元；通过多个第一连接将所述第一层的神经元传递给预测层；以及通过多个第二连接将所述预测层耦接至输出电路。

本公开的一个实施例包括一种在包括有多个输入通道的系统中传递信号的方法，所述方法包括以下步骤：在神经元的第一层接收尖峰脉冲序列；将多个抑制的中间神经元传输至所述第一层的神经元；通过多个第一连接将所述第一层的神经元传递给预测层；以及通过多个第二连接将所述预测层耦接至输出电路。

附图说明

通过参照附图可以更好地理解本公开。附图中的元件无需符合比例，而是重点示出了本公开的原理。在附图中，相同的附图标记在不同视图中始终用于指代对应的部分。

图1示出了一种已知的神经网络模型。

图2是图1的模型的示意图。

图3是另一种已知的神经网络模型的示意图。

图4示出了根据本公开的一个实施例的神经网络模型的一部分。

图5示出了根据本公开的一个实施例的神经网络模型的一部分。

图6示出了根据本公开的一个实施例的神经网络模型的一部分。

图7示出了根据本公开的一个实施例的神经网络模型的示意图。

图8示出了将根据本公开的一个实施例的神经网络模型应用至2DL机器人手臂。

图9示出了在学习期间神经网络模型的各层之间的突触电导，其展示出图8的神经网络模型中各电导的拓扑结构的涌现。

图10A至图10B示出了层L₄ ^y的输出，其响应于图8的神经网络模型的层L₁ ^θ1和层L₁ ^θ2的输入。

图11A至图11C示出了图8的神经网络模型的渐进收敛作为学习函数。

图12A至图12D示出了关于Gaussian稀疏连接和随机稀疏连接的图8的神经网络模型的渐进收敛。

图13A至图13D示出了在损坏的神经元的程度发生变化时图8的神经网络模型的性能。

图14是根据本公开的实施例的神经网络模型的示意图。

图15是图14的神经网络模型的另一实施例的示意图。

图16是图14的神经网络模型的另一实施例的示意图。

具体实施方式

下文公开的每个附加特征和指教可以独立使用，或与其他特征和指教结合使用，以提供关于神经网络模型的对关于自实现网络的任意多种变换进行学习的计算机实现的装置、系统和/或方法。现在将参照附图更详细地描述本公开各实施例的典型示例，这些典型示例示出了以单独使用和结合使用这两种方式对多个所述附加特征和指教的使用。该具体描述仅旨在对本领域技术人员进行指教以实现本公开所指教的各个优选方面，并非旨在限制本公开的范围。因此，在以下具体描述中所公开的特征和步骤的结合可以不是必需的，以在最大范围内实现本公开的实施例，而进行这些公开只是为了对本公开所指教的典型示例进行特定描述。

以引用方式明确并入以下文献的全文：“Self-Organizing Spiking NeuralModel for Learning Fault-Tolerant Spatio-Motor Transformations”,IEEETransactions on Neural Networks and Learning Systems,Vol.23,No.10,October2012；于2012年11月16日提交的题为“Spike Domain Neuron Circuit with ProgrammableKinetic Dynamics,Homeostatic Plasticity and Axonal Delays”的美国专利申请No.13/679,727；于2012年3月8日提交的题为“Spike Timing Dependent PlasticityApparatus,System and Method”的美国专利申请No.13/415,812；以及于2012年12月7日提交的题为“Cortical Neuromorphic Network System and Method”的美国专利申请No.13/708,823。

本文对关于神经网络模型的装置、方法以及系统进行描述；具体而言，是能够对用于自实现网络(SRN)的任意多种变换进行学习的尖峰脉冲模型。所描述的系统和方法可用于研发自组织机器人平台(SORB)，其在现实世界互动期间或者从现实世界互动中自主发现并提取关键模式。在一些配置中，可在没有人类介入的情况下发生互动。所描述的SRN可被配置用于智能应用、监视应用以及勘察(ISR)应用的无人地面交通工具和无人空中交通工具。

图4示出了根据本公开的一个实施例的神经网络或神经网络模型40的一部分。根据本公开的一个实施例，输入阵列/层12包括第一数量的神经元14。输入阵列12的每个神经元14的树突被设置为接收对测量到的参数更接近指定给所述神经元的预定值进行表示的输入信号。

根据本公开的一个实施例，与测量到的参数有关的发送至每个神经元14的输入信号具有在所述测量参数更接近指定给所述神经元的预定值时增加的速率。图4示出了关于神经元14的位置值PV的各输入信号在给定时间的激发率FR。根据本公开的一个实施例，所述神经元是合成和激发的神经元(integrate and fire neuron)，或在合成和激发的神经元的模型下进行操作，并且所述神经网络或神经网络模型是尖峰脉冲神经网络或尖峰脉冲神经网络模型。

根据本公开的一个实施例，神经网络模型40的所述部分包括具有第二数量的神经元44的中间阵列/层42。根据本公开的一个实施例，第二数量小于第一数量。根据本公开的一个实施例，所述中间阵列的每个神经元44的树突与输入阵列12的多个神经元14的轴突一起形成兴奋的STDP突触。根据本公开的一个实施例，中间阵列42的每个神经元44的树突可与所述输入阵列的100至200个神经元14的轴突一起形成STDP突触。

根据本公开的一个实施例，中间阵列42的每个神经元44的树突与所述中间阵列42的相邻的神经元44的轴突一起形成兴奋的STDP突触46。根据本公开的一个实施例，相邻的神经元可以是在所述阵列的两个方向中最靠近的预定数量的神经元。根据本公开的一个实施例，中间阵列42还包括在各神经元44之间分布的第三数量的中间神经元48，其中第三数量小于第二数量。根据本公开的一个实施例，所述第三数量可为所述第二数量的约四分之一。根据本公开的一个实施例，一个阵列的各中间神经元48例如根据周期性概型或伪随机概型在各神经元44之间等概分布。根据本公开的一个实施例，中间阵列42的每个神经元44的轴突与所述中间阵列42的相邻的中间神经元48的树突一起形成兴奋的STDP突触50；并且所述中间阵列42的每个中间神经元48的轴突与所述中间阵列42的相邻的神经元44和中间神经元48的树突一起形成抑制的STDP突触52。所述中间层中的重现使得根据本公开的一个实施例的神经网络或神经网络模型能够容错。这是因为不从输入层的神经元接收输入的中间层中的神经元可以接收来自中间层的各神经元内的输入。这使得所述结构在没有前馈输入的情况下仍然能够插入网络行为。

图5示出了根据本公开的一个实施例的神经网络或神经网络模型60的一部分。根据本公开的一个实施例，神经网络模型60的所述部分包括两部分神经模型40和58，如同参照图4描述的那样。

根据本公开的一个实施例，神经网络模型60的所述部分还包括网络阵列62，其具有第四数量的神经元64以及在所述网络阵列的各神经元之间分布的第五数量的中间神经元68，其中第五数量小于第四数量。根据本公开的一个实施例，所述网络阵列的每个神经元64的轴突与网络阵列62的相邻的中间神经元68的树突一起形成兴奋的STDP突触70。根据本公开的一个实施例，网络阵列62的每个中间神经元68的轴突与网络阵列62的相邻的神经元64和中间神经元68的树突一起形成抑制的STDP突触72。根据本公开的一个实施例，第一神经网络部分40的中间阵列42的每个神经元44的轴突与网络阵列62的多个神经元64的树突一起形成兴奋的STDP突触74。根据本公开的一个实施例，第二神经网络部分58的第二阵列42的每个神经元44的轴突与所述网络阵列的多个神经元64的树突一起形成兴奋的STDP突触76。

根据本公开的一个实施例，网络阵列62包括多行多列的神经元64，第一神经网络部分40的第二阵列42的每个神经元44的轴突与网络阵列62的一行的多个神经元64的树突一起形成兴奋的STDP突触74。第二神经网络部分58的第二阵列42的每个神经元44的轴突则与网络阵列62的一列的多个神经元64的树突一起形成兴奋的STDP突触76。

根据本公开的一个实施例，第一神经网络部分40的第二阵列42的每个神经元44的轴突与网络阵列62的Gaussian邻域的多个神经元64的树突一起形成兴奋的STDP突触74；并且第二神经网络部分58的第二阵列42的每个神经元44的轴突与网络阵列62的Gaussian邻域的多个神经元64的树突一起形成兴奋的STDP突触76。

根据本公开的一个实施例，第一神经网络部分40的第二阵列42的每个神经元44的轴突与所述网络阵列的多个随机的神经元64的树突一起形成兴奋的STDP突触74；并且第二神经网络部分58的第二阵列42的每个神经元44的轴突与网络阵列42的多个随机的神经元64的树突一起形成兴奋的STDP突触76。

图6示出了根据本公开的一个实施例的神经网络或神经网络模型80的一部分，其包括参照图5描述的神经网络60的部分。为清楚起见，未示出部分40和部分58。根据本公开的一个实施例，神经网络80包括：如参照图4描述的包括有布置为接收输入信号的输入阵列(未示出)的第三神经网络部分82，以及具有各神经元44和各中间神经元48的中间阵列42。神经网络部分82为神经网络80的训练部分。根据本公开的一个实施例，神经网络80还包括输出阵列84，其具有与部分82的中间阵列42的神经元相同数量的神经元86。根据本公开的一个实施例，输出阵列84包括在各神经元86之间分布的中间神经元88。中间神经元88的数量可以与中间阵列42中的中间神经元的数量相等。根据本公开的一个实施例，所述输出阵列的每个神经元86的轴突与相邻的中间神经元88的树突一起形成兴奋的STDP突触90；并且所述输出阵列的每个中间神经元88的轴突与所述输出阵列的相邻的神经元86和中间神经元88的树突一起形成抑制的STDP突触92。根据本公开的一个实施例，所述输出阵列的每个神经元86的树突与网络阵列62的多个神经元64的轴突一起形成兴奋的STDP突触94；并且输出阵列84的每个神经元86的树突与神经网络部分82的中间阵列42的对应神经元44的轴突一起形成兴奋的非STDP突触96。

根据本公开的一个实施例，神经网络部分40和神经网络部分58的输入信号与可变参数有关，所述可变参数与训练周期期间的训练部分82的输入信号相关。

根据本公开的一个实施例，在训练周期之后，输入信号不再发送至训练部分82，并且所述输出阵列的神经元86的轴突处的信号向提供给神经网络部分40和神经网络部分58的输入信号提供神经网络80的输出。

图7示意了根据本公开的一个实施例的神经网络80。神经网络80包括训练部分82，其包括连接至中间阵列/层42的输入阵列/层12，如上所述连接至输出阵列/层36。神经网络80还包括两个输入部分40和58，其中的每一个具有连接至中间层42的输入阵列/层12；所述中间层连接至网络层62，网络层62自身连接至输出层84。根据本公开的一个实施例，输入部分40和58可以具有完全相同的大小或不同的大小。例如，具有大量的输入神经元的输入部分可用于以提高的精度观察参数，如此往复。

根据本公开的一个实施例，神经网络80可包括不止一个输出层84以及不止一个训练部分(例如训练部分82)。在神经网络80包括一个附加输出层以及一个或多个附加训练部分(其具有与输出层84和训练部分82的大小相同或不同的大小)的情况中，附加的输出层和训练部分可按照与输出层84和训练部分82一致的方式连接至网络层62。附加训练部分则将在所述训练周期期间对与输入至部分40和部分58的各参数相关的输入附加参数进行接收，并且所述附加输出层将在所述训练周期之后输出所述附加参数以响应于输入至部分40和部分58的所述参数。

根据本公开的一个实施例，神经网络80可包括唯一一个输入部分40或者比两个输入部分40和58更多的输入部分。在适当情况下，所述神经网络则可包括不止一个网络层62以及中间网络层62。可根据应用和期望的配置来使用任意数量的输入层。例如，所述层的数量可以达到100层或更多。

图8示出了将根据本公开的一个实施例的神经网络模型100应用于平面2DL机器人手臂102。根据本公开的一个实施例，2DL机器人手臂102包括第一手臂104，其能够关于在布置于手臂104第一端的平面连接处108的支承件106形成角度θ1。根据本公开的一个实施例，2DL机器人手臂102包括第二手臂110，其能够关于在布置于手臂104第二端的平面连接处112的第一手臂104形成与角度θ1处于同一平面的角度θ2。

根据本公开的一个实施例，神经网络模型100包括第一输入层L₁ ^θ1，其经由STDP突触以稀疏前馈配置耦接至第一中间层L₂ ^θ1，对应于图7的第一神经网络部分40的阵列12和阵列42。根据本公开的一个实施例，神经网络模型100包括第二输入层L₁ ^θ2和第二中间层L₂ ^θ2，对应于图7的第二神经网络部分58的阵列12和阵列42。

根据本公开的一个实施例，神经网络模型100包括网络层L₃，其对应于图7的阵列62并且连接至第一中间层L₂ ^θ1和第二中间层L₂ ^θ2。

根据本公开的一个实施例，神经网络模型100包括第一训练层L₁ ^x和第一中间层L₂ ^x，对应于图7的训练神经网络部分82的阵列12和阵列42。根据本公开的一个实施例，神经网络模型100包括第二训练层L₁ ^y和第二中间层L₂ ^y，对应于附加训练部分(图7未示出)的阵列12和阵列42，所述附加训练部分与图7的训练部分82一致。

根据本公开的一个实施例，神经网络模型100包括与图7的层84对应的第一输出层L₄ ^x。根据本公开的一个实施例，神经网络模型100包括与附加输出层(图7未示出)对应的第二输出层L₄ ^y，所述附加输出层与图7的输出层84一致。

下面的表(a)示出了根据本公开的一个实施例的用于神经网络模型100的多个不同的阵列/层的神经元的数量。

(a)

此外，下面的表(b)示出了神经网络模型100的多个不同的层的各神经元之间存在的各突触的类型和数量。根据本公开的实施例，电突触可表示在包括硬件、软件或二者的结合的各应用中使用的突触的数学模型。

(b)

根据本公开的一个实施例，输入层L₁ ^θ1和输入层L₁ ^θ2曾接收与角度θ1和角度θ2的值对应的输入信号，其具有例如在1Hz至100Hz的范围之内的尖峰脉冲频率(spiking rate)。例如，当连接处108的角度接近与神经元m关联的角位置θ_1m时，与层L₁ ^θ1对应的神经元m的尖峰脉冲频率较高。根据本公开的一个实施例，相邻神经元的尖峰脉冲频率以Gaussian方式响应于更加远离尖峰脉冲最大化的神经元的那些更低的尖峰脉冲频率。注意到根据本公开的一个实施例，各神经元可对感兴趣的变量(例如，对于L₁ ^θ1而言的θ1)的小范围内的值做出响应。例如，对应于θ1和θ2的信号例如利用本体感受产生，也即，从所述机器人手臂的内部状态产生。

根据本公开的一个实施例，训练层L₁ ^x和输入层L₁ ^y曾接收手臂110的动作计划中处于含有x轴和y轴的坐标系中的与该手臂末端的位置对应的输入信号。例如，对应于x和y的信号例如通过利用机器人手臂的图像捕获的过程产生，有：

x＝l₁cos(θ₁)+l₂cos(θ₁+θ₂)

y＝l₁sin(θ₁)+l₂sin(θ₁+θ₂)

其中l₁和l₂是机器人的两个手臂104和110的长度。在一个实施例中，连接角度(θ1，θ2)从0°变化到360°，同时x和y从-1变化到1。

根据本公开的一个实施例，随输入信号和训练信号的时间变化的激发率可由余弦曲线或类似曲线表示。激发率r可表示为如下形式：

其中R₀为最小激发率，R₁为最大激发率，σ表示用于Gaussian函数中的神经元位置的标准差，以根据神经元的位置对激发率进行加权，N为输入层中的神经元的总数量。

在一个实施例中，激发率可在1Hz至100Hz的范围内；优选地，在10Hz至80Hz的范围内，并且σ可为5。

根据本公开的一个实施例，为了对从连接角度空间到L₄的各输入层之间的多种不同的突触路径长度以及从位置空间到L₄的各输入层之间的多种不同的突触路径长度进行补偿(位置空间比连接角度空间具有更短的到层L₄的路径长度)，可使用所述反馈路径(也即，L₂ ^x至L₄ ^x)中的延时d。在生物学系统中，这种反馈可与本体感受性反馈中的延时类似，所述本体感受性反馈或来自视觉系统，或通过感觉皮层中的额外处理得到。

根据本公开的一个实施例，可使用漏合成和激发(leaky integrate and fire)神经元模型，其中神经元接收多个兴奋的输入电流信号(i₁,i₂,i₃等)，并且产生单个输出尖峰脉冲信号。输出信息可被编码到这些尖峰脉冲的时序(t₁,t₂等)中。可利用如下膜方程来确定所述漏合成和激发模型的电位V：

其中E_ex＝0mV，E_in＝0mV。当膜电位达到阈值电压V_thr时，所述神经元激发出动作电位，并且膜电压被重置为V_rest。

根据本公开的一个实施例，合成和激发的神经元细胞提供若干不同的变量来控制其膜电位，所述变量包括突触电导w(抑制突触电导和激发突触电导两者)、膜时间常数τ_m、关于电位的多种不同的常数(例如，E_ex)以及激发阈值。

神经元的突触输入可被配置为随瞬时上升时间的电导变化并且指数衰减，从而使在时间t的单个前突触尖峰脉冲产生兴奋突触的突触电导和抑制突触的突触电导如下：

其中τ_AMPA为兴奋的神经元的α-氨基-3-羟基-5-甲基-4-异恶唑丙酸受体(AMPA)，τ_GABA为抑制的突触的γ(gamma)-氨基丁酸GABA受体。

在这种配置中，神经元模型可以是自正则(self-normalizing)的，其中突触输入的倍增效应发生在其自身的膜电位(被称为分压)。这种神经元模型能够进行自身激发的自我调节，并且在生物学上稳定。激发的突触电导w_ex(t)(等式1中)由STDP确定。下面我们将概述STDP学习规则。

在一个示例中，突触可表示为两个互连的神经元之间的连接点。所述突触可包括两个端子。一个端子可与提供信息的神经元(该神经元被称作前突触神经元)的轴突关联。另一个端子可与接收所述信息的神经元(其被称作后突触神经元)的树突关联。

对于具有固定的突触电导w的突触，只需要输入端子和输出端子。在一个示例中，所述突触的电导可根据被称作尖峰脉冲时序依赖可塑性(或STDP)的学习规则来进行内部调整。

所述系统可利用STDP功能进行配置，该功能基于前突触神经元i和后突触神经元j的动作电位之间的时序差(ti_pre-tj_post)来调整突触电导w。对突触电导的调整存在两种可能性。如果时序差(ti_pre-tj_post)为正，则突触受到抑制。如果(ti_pre-tj_post)为负，则突触可受到增强作用。如果时序差在任一方向上过大，则不改变突触电导。在一个实施例中，时序差可为80ms。

STDP功能可包括控制功能形式的四种参数(A⁺、A^-、τ⁺和τ)。A⁺和A^-分别对应于用于增强和抑制的突触电导的最大变化。时间常数τ⁺和τ控制如图5(a)所示的曲线的增强部分和抑制部分的衰减速度。

在一种方法中，在增强或抑制的时间窗内可出现不止一个前突触尖峰脉冲或后突触尖峰脉冲。可使用加法STDP模型来执行对上述多个尖峰脉冲的计算，在所述加法STDP模型中，在突触处的增强P和抑制D的动力学可由下式确定：

每当后突触神经元激发出尖峰脉冲时，使得D相对于等式(6)所确定的值减少，其减少量为A-。类似地，每当突触从前突触神经元接收尖峰脉冲时，使得P相对于等式(7)所确定的值增加，其增量为A⁺。这些变化可总结为：

D＝D+A^- (6)

P＝P+A⁺ (7)

P和D的上述变化可影响突触电导的变化。如果后突触神经元激发出尖峰脉冲，则在该尖峰脉冲的持续时间内利用P在这一时刻的值P*使得突触电导增加Δw。类似地，如果前突触神经元激发出所述突触所见的尖峰脉冲，则在该尖峰脉冲的持续时间内利用D在这一时刻的值D*使得突触电导减少Δw。因此，净变化Δw可由下式给出：

Δw＝P^*-D^* (8)

由于STDP最终反应至突触电导w的改变可表示为：

w＝w+Δw (9)

在图8所示的一个实施例中，尖峰脉冲模型可被配置为从固定的一组输入尖峰脉冲序列中学习多种变换。如图6所示，一些预测层神经元624可耦接至或连接至其自身的训练输出614。预测层可表示输出的一组神经元622，其对机器人手臂的位置进行预测。在一个实施例中，图6中的模型可按照与图1所述的模型类似的方式运作。

在另一实施例中，下文所述的系统600可同步地学习输入尖峰脉冲序列的多种输出或变换。在一个示例中，所述尖峰脉冲模型使用相同的输入角(θ1，θ2)来利用下文中的等式10和等式11产生多种输出。

申请人已经示出的是，图8所示的模型可被配置为学习一些类型的功能，包括遗传早现(anticipation)、联络(association)、预测及反变换。在一个实施例中，所述系统可被配置为对用于输入-输出变换的多种可能的路径进行使用。如下文所讨论的那样，所述模型也可容错。

图9示出了在学习期间神经网络模型100的各层之间的突触电导，其展示出图8的神经网络模型中各电导的拓扑结构的涌现。

图10A示出了在神经网络100的训练周期已经完成之后的给定时间t的层L₄ ^y的输出，其响应于层L₁ ^θ1和L₁ ^θ2的输入。在y轴、θ1轴和θ2轴上的圆圈的直径随形成各轴的各神经元的激发率增加。仅示出了激发的各神经元。

根据本公开的一个实施例，对图7所示的神经网络80的输出进行解码包括以下步骤：

a.向第一神经网络40和第二神经网络58各自的第一阵列12提供第一输入信号和第二输入信号，该第一输入信号和该第二输入信号具有在测量到的参数更接近指定给所述第一阵列的神经元的预定值时增加的速率；

b.向神经元84的输出阵列的每个神经元指定在1至N的范围内的增量位置值，N为输出阵列84的神经元的数量；

c.在任何给定的时间对输出阵列84的每个神经元的激发率进行测量；以及

d.将所述任何给定时间的神经网络的输出估计为对应于输出阵列84的一个神经元，该神经元的位置值等于：所述输出阵列的每个神经元的由其在所述任何给定时间的激发率进行加权的位置值之和除以所述输出阵列的每个神经元在所述任何给定时间的激发率的和得到的商。

在其他方面，

其中y_p(i,j,t)为在给定的时间t的关于θ1和θ2的给定值i、j的经评估的输出位置；f_ijk(t)为神经元k在给定时间t的关于θ1和θ2的给定值i、j的激发率；以及y(i,j,k,t)为神经元k在时间t的关于θ1和θ2的给定值i、j的位置值。

图10B示出了在神经网络100的训练周期已经完成后的给定时间t的层L₄ ^y的输出，其响应于层L₁ ^θ1和L₁ ^θ2的输入，其中y轴上的输出环绕输出阵列的末端。根据本公开的一个实施例，对阵列84的输出进行测量的方法包括：如果输出阵列84中部的神经元具有无效激发率，则向具有更小的位置值的神经元指定增加了值N的位置值，N为输出阵列84的神经元的数量。根据本公开的一个实施例，参照图10A和图10B描述的方法还可用于对图14的例如层84的输出进行解码，在下文对其进行描述。

图11A至图11C示出了图8的神经网络模型的渐进收敛(incrementalconvergence)作为一种学习函数。具体地，图11A示出了在300秒的训练周期之后图8的神经网络模型的x和y输出；图11B示出了在600秒的训练周期之后图8的神经网络模型的x和y输出；图11C示出了在1500秒的训练周期之后图8的神经网络模型的x和y输出。图11A至图11C中使用的各输入所对应的x和y的真实值遵循阴影所示的扭结(pretzel)形轨迹。

图12A和图12B示出了在中间阵列42的神经元44与网络阵列62之间使用Gaussian稀疏连接时图8的神经网络模型的渐进收敛。

图12C和图12D示出了在中间阵列42的神经元44与网络阵列62之间使用随机稀疏连接时图8的神经网络模型的渐进收敛。

图13A至图13D示出了神经元的损坏程度发生变化时图8的神经网络模型的性能。图13A(a)示出了神经网络中5％的神经元损坏时L₁ ^θ1和L₂ ^θ1之间的各突触的神经行为或皮质编码。图13A(b)示出了神经网络中5％的神经元损坏时L₂ ^θ1内各突触的神经行为或皮质编码。图13A(c)示出了神经网络中5％的神经元损坏时的输出x、y，其与用于产生输出的输入所对应的x、y的真实值(较暗的圆圈)进行比较。

图13B(a)(b)(c)示出了神经网络中8％的神经元损坏时与图13A(a)(b)(c)所示数据种类相同的数据。

图13C(a)(b)(c)示出了神经网络中12％的神经元损坏时与图13A(a)(b)(c)所示数据种类相同的数据。

图13D(a)(b)(c)示出了神经网络中16％的神经元损坏时与图13A(a)(b)(c)所示数据种类相同的数据。

如图13A至图13D所示，根据本公开的实施例的神经网络对神经元损坏具有鲁棒性，并且即使在神经元受到明显损坏的情况下也能产生符合要求的输出。

图14示出了根据本公开的一个实施例的神经网络或神经网络模型118的一部分，其包括与神经元44和中间神经元48的中间阵列42耦接的神经元14的输入阵列12。根据本公开的一个实施例，输入阵列/层12包括神经元14的第一子阵列120和第二子阵列122。第一子阵列120的神经元14被设置为接收与第一测量参数有关的输入信号。第二子阵列122的神经元14被设置为接收与第二测量参数有关的输入信号。根据本公开的一个实施例，中间阵列42包括多行多列的神经元44；中间神经元48分布在各神经元之间，其中神经元第一子阵列120的每个神经元14的轴突与中间阵列42的一行的多个神经元44的树突一起形成兴奋的STDP突触；并且其中神经元第二子阵列122的每个神经元14的轴突与中间阵列42的一列的多个神经元44的树突一起形成兴奋的STDP突触。

根据本公开的一个实施例，可根据不包括多行多列的另一方案来布置中间阵列42的神经元44；或者可根据一个方案(例如稀疏且随机的连接方案)将第一子阵列102和第二子阵列122的神经元连接至中间阵列42的神经元，而不遵从中间阵列42的多行多列。根据本公开的一个实施例，中间阵列42的神经元44的一个树突可与所述输入阵列的100-200个神经元14的轴突一起形成STDP突触。根据本公开的一个实施例，子阵列120和122中的每一个可包括1000个神经元，并且中间阵列可包括2000个神经元。

根据本公开的一个实施例，输入阵列12可包括N个神经元子阵列(诸如120和122)，其分别设置为接收与N个关联的测量到的参数有关的输入信号。根据本公开的一个实施例，每个子阵列的每个神经元14被设置为接收这样的输入信号，该输入信号用于表示与所述子阵列关联的所述测量到的参数更接近指定给所述神经元的预定值。例如，当测量到的参数更接近指定给一个神经元的预定值时，可增大发送至所述神经元的信号的速率，如此往复。各子阵列的神经元的数量可以相同或者不同。

根据本公开的一个实施例，所述神经元为合成和激发的神经元，或在合成和激发的神经元的模型下进行操作，并且所述神经网络或神经网络模型是尖峰脉冲的神经网络或尖峰脉冲的神经网络模型。

根据本公开的一个实施例，神经网络118包括输出阵列84，其具有神经元86以及在神经元86之间分布的中间神经元88。根据本公开的一个实施例，输出阵列84可包括面向四个神经元86的一个中间神经元88。根据本公开的一个实施例，所述输出阵列的每个神经元86的轴突与相邻的中间神经元88的树突一起形成兴奋的STDP突触90；并且所述输出阵列的每个中间神经元88的轴突与所述输出阵列的相邻的神经元86和中间神经元88一起形成抑制的STDP突触92。

根据本公开的一个实施例，输出阵列84的每个神经元86的树突与中间阵列42的每个神经元44的轴突一起形成兴奋的STDP突触。

根据本公开的一个实施例，神经网络118包括训练阵列124，其包括与输出阵列84的神经元的数量相同数量的神经元126。

根据本公开的一个实施例，每个神经元126的树突被设置为接收这样的输入信号，该输入信号用于表示测量到的参数更接近指定给所述神经元的预定值。根据本公开的一个实施例，训练阵列124的每个神经元126的轴突与输出阵列84的对应神经元的树突一起形成兴奋的非STDP突触。

根据本公开的一个实施例，第一子阵列120和第二子阵列122的输入信号与可变参数有关，通过所述神经网络将所述可变参数与和训练阵列124的输入信号有关的参数相关。根据本公开的一个实施例，所述参数信号发送至第一子阵列120和第二子阵列122并且在训练周期期间发送至训练阵列124。例如，发送至第一子阵列120和第二子阵列122的信号例如可对应于针对诸如图8所示的两级自由度的机器人手臂以及所述手臂的随机位置而测量的两个角度，而发送至训练阵列124的信号可例如对应于如针对每个所述随机位置而测量的所述机器人手臂的末端位置的x或y坐标。

在训练周期之后，输入信号不再发送至训练阵列124，并且在输出阵列的神经元86的轴突处的各信号将神经网络118的输出提供至向输入阵列120和122提供的输入信号。

图15示出了图14的神经网络或神经网络模型118的所述部分，其包括附加输出层128和130，它们按照与输出层84相同的方式连接至中间层42。根据本公开的一个实施例，输出层84、128和130可包括相同数量的神经元或不同数量的神经元。根据本公开的一个实施例，附加输出层128和130连接至训练层132和134，其连接方式与输出层84连接至训练层124的方式相同。根据本公开的一个实施例，神经网络118可包括任意数量的附加输出层，每个输出层连接至如上所述的训练层。每个输出层的训练周期可具有相同的长度并且可以同步，或者各训练周期可具有不同长度以及/或者在不同时刻发生。

图16示出了神经网络或神经网络模型150的一部分，其包括图15的神经网络部分118。根据本公开的一个实施例，网络150包括与神经网络部分118类似的附加神经网络部分152、154和156，其中神经网络部分118的训练阵列134、124和132也来自各神经网络部分152、154和156的输入层或输入子阵列。根据本公开的一个实施例，神经网络部分152的训练阵列158形成了神经网络部分154的输入子阵列。神经网络部分118、152、154和156可具有相同的大小或不同的大小。网络150可包括任意数量的诸如神经网络部分118的神经网络部分。

在本公开的各实施例中，可利用共享的处理装置、独立的处理装置或多个处理装置来实现所述神经网络。此种处理装置可以是微处理器、微控制器、数字信号处理器、微计算机、中央处理单元、现场可编程门阵列、可编程逻辑器件、状态机、逻辑电路、模拟电路、数字电路和/或基于可执行指令对信号(模拟信号和/或数字信号)进行操作的任何装置。

可利用硬件、软件或其结合来实现本公开或者其任意一个(多个)部分或一个(多个)功能，并且可将其实现在一个或多个计算机系统或者其他处理系统中。用于执行本公开的操作并且能够执行本文所述的功能的计算机系统可包括：连接至通信基础设施(例如，通信总线、交叉接线器(cross-over bar)或网络)的一个或多个处理器。依照这样的示例性计算机系统对多种不同的软件实施例进行描述。在阅读所述描述后，对于本领域技术人员而言，如何利用其它计算机系统和/或结构实现本公开将是显而易见的。

已经以示意和描述为目的示出了本公开的优选实施例的上述描述。上述描述并非旨在穷尽或者将本公开限制为精确的形式或所公开的示例性实施例。显然，许多修改和变化对本领域技术人员而言将是显而易见的。类似地，所描述的任何过程步骤可与其目的在于实现相同结果的其他步骤进行互换。选择这些实施例并对其进行描述是为了最优地解释本公开的原理及其实际应用的最佳模式，进而能够使本领域其他技术人员理解本公开的多种不同的实施例以及对这些实施例所作出的适于预期的特定用途或实现的多种不同的修改。本公开的范围旨在由所附权利要求及其等价进行限定。除非明确地这样陈述，否则元件的单数表述并非旨在意指“一个且仅有一个”，而是与其相反地意指“一个或多个”。此外，本公开中的任何元件、部件或方法步骤均非旨在向公众公开，无论所述元件、部件或方法步骤是否在所附权利要求中明确叙述。本文权利要求中的所有元件均不基于美国法典35卷112节第六段进行理解，除非明确地使用短语“用于……的装置”来叙述所述元件。

应当理解的是，使本公开的功能和优点更加突出的所示附图仅为示例目的而呈现。本公开的结构足够灵活和可配置，使得所述结构可按照除附图所示方式之外的方式实现(和操作)。

此外，说明书摘要的目的为，通常使得美国专利与商标局和公众(尤其是不熟悉专利或法律的术语或措辞的本领域的学者、工程师和从业人员)能够通过粗略浏览而快速确定本申请的技术公开的本质与精髓。说明书摘要并非旨在以任何方式限制本公开的范围。应当理解的是，权利要求书中叙述的步骤和处理无需按照示出的顺序执行。

在不脱离本公开的情况下，可在不同的系统中实现本公开的各种特征。应当理解，上述实施例仅为示例，并且不应被理解为限制本公开。各实施例的描述仅旨在示意性的，并不是为了限制各权利要求的范围。因此，可以容易地将本指教应用于其他类型的设备，并且许多替换物、修改以及变化对本领域技术人员而言将是显而易见的。

优选地包括了本文所描述的所有元件、部分和步骤。应当理解的是，可用其他元件、部分和步骤来替代这些元件、部分和步骤中的任何一个，或者可将这些元件、部分和步骤一起删除，这对于本领域技术人员而言将是显而易见的。

构思

本文公开了至少以下构思。

构思1.一种神经网络，其中所述神经网络的一部分包括：

具有第一数量的神经元的第一阵列，其中所述第一阵列的每个神经元的树突被设置为对用于表示测量到的参数更接近指定给所述神经元的预定值的输入信号进行接收；

具有第二数量的神经元的第二阵列，所述第二阵列的每个神经元的树突与所述第一阵列的多个神经元的轴突一起形成兴奋的STDP突触；并且所述第二阵列的每个神经元的树突与所述第二阵列的相邻神经元的轴突一起形成兴奋的STDP突触。

构思2.根据构思1所述的神经网络，其中第二数量小于第一数量。

构思3.根据构思1或构思2所述的神经网络，其中所述第二阵列还包括在所述第二阵列的各神经元之间分布的第三数量的中间神经元，其中所述第三数量小于所述第二数量，其中：

所述第二阵列的每个神经元的轴突与所述第二阵列的相邻的中间神经元的树突一起形成兴奋的STDP突触；并且

所述第二阵列的每个中间神经元的轴突与所述第二阵列的相邻的神经元和中间神经元的树突一起形成抑制的STDP突触。

构思4.根据构思1至3所述的神经网络，其中所述第一阵列的每个神经元的树突被设置为接收输入信号，所述输入信号具有在测量到的参数更接近指定给所述神经元的预定值时增长的速率。

构思5.一种神经网络，其包括根据构思1至4所述的第一神经网络部分和第二神经网络部分；以及

第三阵列，其具有第四数量的神经元以及在所述第三阵列的各神经元之间分布的第五数量的中间神经元，其中第五数量小于第四数量，其中：

所述第三阵列的每个神经元的轴突与所述第三阵列的相邻的中间神经元的树突一起形成兴奋的STDP突触；并且

所述第三阵列的每个中间神经元的轴突与所述第三阵列的相邻的神经元和中间神经元的树突一起形成抑制的STDP突触；

其中所述第一神经网络部分的第二阵列的每个神经元的轴突与所述第三阵列的多个神经元的树突一起形成兴奋的STDP突触；并且

其中所述第二神经网络部分的第二阵列的每个神经元的轴突与所述第三阵列的多个神经元的树突一起形成兴奋的STDP突触。

构思6.根据构思5所述的神经网络，其中所述第三阵列包括多行多列的神经元，

其中所述第一神经网络部分的第二阵列的每个神经元的轴突与所述第三阵列的一行的多个神经元的树突一起形成兴奋的STDP突触；并且

其中所述第二神经网络部分的第二阵列的每个神经元的轴突与所述第三阵列的一列的多个神经元的树突一起形成兴奋的STDP突触。

构思7.根据构思5或6所述的神经网络，其包括根据构思1所述的第三神经网络部分以及第四阵列，所述第四阵列具有第二数量的神经元以及在所述第四阵列的各神经元之间分布的第三数量的中间神经元，其中：

所述第四阵列的每个神经元的轴突与所述第四阵列的相邻的中间神经元的树突一起形成兴奋的STDP突触；并且

所述第四阵列的每个中间神经元的轴突与所述第四阵列的相邻的神经元和中间神经元的树突一起形成抑制的STDP突触；

其中所述第四阵列的每个神经元的树突与所述第三阵列的多个神经元的轴突一起形成兴奋的STDP突触；并且

其中所述第四阵列的每个神经元的树突与所述第三神经网络的第二阵列的对应神经元的轴突一起形成兴奋的非STDP突触。

构思8.根据构思7所述的神经网络，其中所述第一神经网络部分和所述第二神经网络部分的输入信号与可变参数有关，所述可变参数与所述第三神经网络的输入信号相关。

构思9.根据构思1至4所述的神经网络，其中所述神经元第一阵列包括各神经元的第一子阵列和第二子阵列，其分别被设置为接收与第一测量参数和第二测量参数相关的输入信号。

构思10.根据构思9所述的神经网络，其中所述第二阵列包括多行多列的神经元；

其中所述神经元第一子阵列的每个神经元的轴突与所述第二阵列的一行的多个神经元的树突一起形成兴奋的STDP突触；并且

其中所述神经元第二子阵列的每个神经元的轴突与所述第二阵列的一列的多个神经元的树突一起形成兴奋的STDP突触。

构思11.根据构思9或构思10所述的神经网络，其中所述第二阵列还包括在所述第二阵列的各神经元之间分布的第三数量的中间神经元，其中第三数量小于第二数量，其中：

构思12.根据构思9至11所述的神经网络，还包括：

其中所述第三阵列的每个神经元的树突与所述第二阵列的每个神经元的轴突一起形成兴奋的STDP突触。

构思13.根据构思12所述的神经网络，包括第四阵列，其包括与所述第三阵列的神经元的数量相同数量的神经元，其中所述第四阵列的每个神经元的树突被设置为对用于表示测量到的参数更接近指定给所述神经元的预定值的输入信号进行接收；

其中所述第四阵列的每个神经元的轴突与所述第三阵列的对应神经元的树突一起形成兴奋的非STDP突触。

构思14.根据构思13所述的神经网络，其中所述神经元第一子阵列和所述神经元第二子阵列的输入信号与可变参数有关，所述可变参数与所述第四阵列的输入信号相关。

构思15.根据构思13所述的神经网络，其中所述神经元的第四阵列为根据构思9的另一神经网络的神经元子阵列。

构思16.一种对神经网络进行编程的方法，其包括步骤：

提供第一神经网络部分，其包括具有第一数量的神经元的第一阵列以及具有第二数量的神经元的第二阵列，所述第二阵列的每个神经元的树突与所述第一阵列的多个神经元的轴突一起形成兴奋的STDP突触；所述第二阵列的每个神经元的树突与所述第二阵列的相邻的神经元的轴突一起形成兴奋的STDP突触；以及

向所述第一阵列的每个神经元的树突提供输入信号，该输入信号用于表示测量到的参数更接近指定给所述神经元的预定值。

构思17.根据构思16所述的方法，还包括向所述第二阵列提供在所述第二阵列的各神经元之间分布的第三数量的中间神经元的步骤，其中所述第三数量小于所述第二数量，其中：

构思18.根据构思16或17所述的方法，包括向所述第一阵列的每个神经元的树突提供输入信号的步骤，所述输入信号具有在测量到的参数更接近指定给所述神经元的预定值时增长的速率。

构思19.根据构思16至18所述的方法，包括步骤：

提供第二神经网络部分，其具有与所述第一神经网络部分的结构相同的结构；以及

提供第三阵列，其具有第四数量的神经元以及在所述第三阵列的各神经元之间分布的第五数量的中间神经元，其中第五数量小于第四数量，其中：

其中所述第二神经网络部分的第二阵列的每个神经元的轴突与所述第三阵列的多个神经元的树突一起形成兴奋的STDP突触；以及

向所述第二神经网络部分的第一阵列的每个神经元的树突提供输入信号，该输入信号用于表示测量到的参数更接近指定给所述神经元的预定值。

构思20.根据构思19所述的方法，包括步骤：

提供第三神经网络部分，其具有与所述第一神经网络部分的结构相同的结构；

提供第四阵列，其具有第二数量的神经元以及在所述第四阵列的神经元之间分布的第三数量的中间神经元，其中：

其中所述第四阵列的每个神经元的树突与所述第三神经网络部分的第二阵列的对应神经元的轴突一起形成兴奋的非STDP突触；以及

向所述第三神经网络部分的第一阵列的每个神经元的树突提供输入信号，该输入信号用于表示测量到的参数更接近指定给所述神经元的预定值；其中所述第一神经网络部分和第二神经网络部分的输入信号与可变参数有关，所述可变参数与所述第三神经网络部分的输入信号相关。

构思21.根据构思16所述的方法，其中：

向所述第一阵列的每个神经元的树突提供用于表示测量到的参数更接近指定给所述神经元的预定值的输入信号的步骤包括：

向所述第一阵列的神经元第一子集的每个神经元的树突提供输入信号，该输入信号用于表示第一测量参数更接近指定给所述神经元的预定值；

向所述第一阵列的神经元第二子集的每个神经元的树突提供输入信号，该输入信号用于表示第二测量参数更接近指定给所述神经元的预定值。

构思22.根据构思21所述的方法，其中：

所述提供具有第二数量的神经元的第二阵列的步骤包括提供具有多行多列的神经元的第二阵列，

其中所述第一阵列的神经元第一子集的每个神经元的轴突与所述第二阵列的一行的多个神经元的树突一起形成兴奋的STDP突触；并且

其中所述第一阵列的神经元第二子集的每个神经元的轴突与所述第二阵列的一列的多个神经元的树突一起形成兴奋的STDP突触。

构思23.根据构思21或22所述的方法，还包括向所述第二阵列提供在所述第二阵列的各神经元之间分布的第三数量的中间神经元的步骤，其中所述第三数量小于所述第二数量，其中：

构思24.根据构思23所述的方法，包括：

提供第三阵列，其具有第四数量的神经元以及在所述第三阵列的各神经元之间分布的第五数量的中间神经元，其中第五数量小于第四数量，其中所述第三阵列的每个神经元的轴突与所述第三阵列的相邻的中间神经元的树突一起形成兴奋的STDP突触；并且所述第三阵列的每个中间神经元的轴突与所述第三阵列的相邻的神经元和中间神经元的树突一起形成抑制的STDP突触；其中所述第三阵列的每个神经元的树突与所述第二阵列的每个神经元的轴突一起形成兴奋的STDP突触；以及

提供第四阵列，其包括与所述第三阵列的神经元的数量相同数量的神经元，其中所述第四阵列的每个神经元的树突被设置为对用于表示测量到的参数更接近指定给所述神经元的预定值的输入信号进行接收；并且其中所述第四阵列的每个神经元的轴突与所述第三阵列的对应神经元的树突一起形成兴奋的非STDP突触；以及

向所述第四阵列的每个神经元的树突提供输入信号，该输入信号用于表示测量到的参数更接近指定给所述神经元的预定值；其中神经元第一子集和神经元第二子集的输入信号与可变参数有关，所述可变参数与所述第四阵列的输入信号相关。

构思25.一种对根据构思8所述的神经网络的输出进行解码的方法，所述方法包括：

向第一神经网络部分的第一阵列和第二神经网络部分的第一阵列提供第一输入信号和第二输入信号，该第一输入信号和该第二输入信号具有在测量到的参数更接近指定给各所述第一阵列的神经元的预定值时增加的速率；

向所述神经元的第四阵列的每个神经元指定在1至N的范围内的增量位置值，N为所述第四阵列的神经元的数量；

在任何给定的时间，对所述第四阵列的每个神经元的激发率进行测量；以及

在所述任何给定的时间，将所述神经网络的输出估计为对应于所述第四阵列的一个神经元，该神经元的位置值等于：所述第四阵列的每个神经元的由其在所述任何给定时间的激发率进行加权的位置值之和除以所述第四阵列的每个神经元在所述任何给定时间的激发率的和得到的商。

构思26.根据构思25所述的方法，包括步骤：如果所述第四阵列中部的神经元具有无效的激发率，则向更小的位置值的各神经元指定增加了值N的位置值。

构思27.一种对根据构思14所述的神经网络的输出进行解码的方法，所述方法包括：

向神经元第一子阵列和神经元第二子阵列提供第一输入信号和第二输入信号，该第一输入信号和该第二输入信号具有在测量到的参数更接近指定给所述神经元第一子阵列和神经元第二子阵列的神经元的预定值时增加的速率；

向所述神经元的第三阵列的每个神经元指定在1至N的范围内的增量位置值，N为所述第三阵列的神经元的数量；

在任何给定的时间，对所述第三阵列的每个神经元的激发率进行测量；以及

在所述任何给定的时间，将所述神经网络的输出估计为对应于所述第三阵列的一个神经元，该神经元的位置值等于：所述第三阵列的每个神经元的由其在所述任何给定时间的激发率进行加权的位置值之和除以所述第三阵列的每个神经元在所述任何给定时间的激发率的和得到的商。

构思28.根据构思27所述的方法，包括步骤：如果所述第三阵列中部的神经元具有无效的激发率，则向更小的位置值的各神经元指定增加了值N的位置值。

Claims

1.一种神经网络，其中所述神经网络的一部分包括：

具有第一数量的神经元的第一阵列，其中所述第一阵列的每个神经元的树突被设置为对用于表示测量到的参数接近指定给所述神经元的预定值的输入信号进行接收；

具有第二数量的神经元的第二阵列，所述第二阵列的每个神经元的树突与所述第一阵列的多个神经元的轴突一起形成兴奋的STDP突触；并且所述第二阵列的每个神经元的树突与所述第二阵列的相邻神经元的轴突一起形成兴奋的STDP突触；

其中所述神经元第一阵列包括各神经元的第一子阵列和第二子阵列，其分别被设置为接收与第一测量参数和第二测量参数相关的输入信号。

2.根据权利要求1所述的神经网络，其中所述第二阵列包括多行多列的神经元；

3.根据权利要求2所述的神经网络，其中所述第二阵列还包括在所述第二阵列的各神经元之间分布的第三数量的中间神经元，其中所述第三数量小于所述第二数量，其中：

4.根据权利要求3所述的神经网络，还包括：

第三阵列，其具有第四数量的神经元以及在所述第三阵列的各神经元之间分布的第五数量的中间神经元，其中所述第五数量小于所述第四数量，其中：

5.根据权利要求4所述的神经网络，包括第四阵列，其包括与所述第三阵列的神经元的数量相同数量的神经元，其中所述第四阵列的每个神经元的树突被设置为对用于表示测量到的参数接近指定给所述神经元的预定值的输入信号进行接收；

6.根据权利要求5所述的神经网络，其中所述神经元第一子阵列和所述神经元第二子阵列的输入信号与可变参数有关，所述可变参数与所述第四阵列的输入信号相关。

7.根据权利要求1所述的神经网络，其中所述第二数量小于所述第一数量。

8.根据权利要求1所述的神经网络，其中所述第二阵列还包括在所述第二阵列的各神经元之间分布的第三数量的中间神经元，其中所述第三数量小于所述第二数量，其中：

9.根据权利要求1所述的神经网络，其中所述第一阵列的每个神经元的树突被设置为接收输入信号，该输入信号具有在测量到的参数接近指定给所述神经元的预定值时增长的速率。

10.一种对根据权利要求6所述的神经网络的输出进行解码的方法，所述方法包括：

向神经元第一子阵列和神经元第二子阵列提供第一输入信号和第二输入信号，该第一输入信号和该第二输入信号具有在测量到的参数接近指定给所述神经元第一子阵列和神经元第二子阵列的神经元的预定值时增加的速率；

11.根据权利要求10所述的方法，包括步骤：如果所述第三阵列中部的神经元具有无效的激发率，则向小的位置值的各神经元指定增加了值N的位置值。

12.一种对神经网络进行编程的方法，其包括步骤：

向所述第一阵列的每个神经元的树突提供输入信号，该输入信号用于表示测量到的参数接近指定给所述神经元的预定值；

其中：

向所述第一阵列的每个神经元的树突提供用于表示测量的参数接近指定给所述神经元的预定值的输入信号的步骤包括：

向所述第一阵列的神经元第一子集的每个神经元的树突提供输入信号，该输入信号用于表示第一测量参数接近指定给所述神经元的预定值；

向所述第一阵列的神经元第二子集的每个神经元的树突提供输入信号，该输入信号用于表示第二测量参数接近指定给所述神经元的预定值。

13.根据权利要求12所述的方法，其中：

14.根据权利要求12所述的方法，还包括向所述第二阵列提供在所述第二阵列的各神经元之间分布的第三数量的中间神经元的步骤，其中所述第三数量小于所述第二数量，其中：

15.根据权利要求14所述的方法，包括：

提供第三阵列，其具有第四数量的神经元以及在所述第三阵列的各神经元之间分布的第五数量的中间神经元，其中所述第五数量小于所述第四数量，其中所述第三阵列的每个神经元的轴突与所述第三阵列的相邻的中间神经元的树突一起形成兴奋的STDP突触；并且所述第三阵列的每个中间神经元的轴突与所述第三阵列的相邻的神经元和中间神经元的树突一起形成抑制的STDP突触；其中所述第三阵列的每个神经元的树突与所述第二阵列的每个神经元的轴突一起形成兴奋的STDP突触；以及

提供第四阵列，其包括与所述第三阵列的神经元的数量相同数量的神经元，其中所述第四阵列的每个神经元的树突被设置为对用于表示测量到的参数接近指定给所述神经元的预定值的输入信号进行接收；并且其中所述第四阵列的每个神经元的轴突与所述第三阵列的对应神经元的树突一起形成兴奋的非STDP突触；以及

向所述第四阵列的每个神经元的树突提供输入信号，该输入信号用于表示测量到的参数接近指定给所述神经元的预定值；其中所述神经元第一子集和所述神经元第二子集的输入信号与可变参数有关，所述可变参数与所述第四阵列的输入信号相关。