CN105637539B - 用于修改神经动态的自动化方法 - Google Patents

用于修改神经动态的自动化方法 Download PDF

Info

Publication number
CN105637539B
CN105637539B CN201480054405.1A CN201480054405A CN105637539B CN 105637539 B CN105637539 B CN 105637539B CN 201480054405 A CN201480054405 A CN 201480054405A CN 105637539 B CN105637539 B CN 105637539B
Authority
CN
China
Prior art keywords
neuron
spike
dynamic
parameter
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201480054405.1A
Other languages
English (en)
Other versions
CN105637539A (zh
Inventor
A·莎拉
R·H·金博尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN105637539A publication Critical patent/CN105637539A/zh
Application granted granted Critical
Publication of CN105637539B publication Critical patent/CN105637539B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Neurology (AREA)
  • Image Analysis (AREA)
  • Separation Using Semi-Permeable Membranes (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种用于改进神经动态的方法包括获取原型神经元动态。该方法还包括修改神经元模型的参数以使得该神经元模型与原型神经元动态相匹配。该神经元动态包括膜电压和/或尖峰定时。

Description

用于修改神经动态的自动化方法
相关申请的交叉引用
本申请要求于2013年10月2日提交的题为“AUTOMATED METHOD FOR MODIFYINGNEURAL DYNAMICS(用于修改神经动态的自动化方法)”的美国临时专利申请No.61/885,950的权益,其公开内容通过援引全部明确纳入于此。
背景
领域
本公开的某些方面一般涉及神经系统工程,并且尤其涉及用于修改神经网络模型中的神经动态的系统和方法。
背景技术
可包括一群互连的人工神经元(即神经元模型)的人工神经网络是一种计算设备或者表示将由计算设备执行的方法。人工神经网络可具有生物学神经网络中的对应的结构和/或功能。然而,人工神经网络可为其中传统计算技术是麻烦的、不切实际的、或不胜任的某些应用提供创新且有用的计算技术。由于人工神经网络能从观察中推断出功能,因此这样的网络在因任务或数据的复杂度使得通过常规技术来设计该功能较为麻烦的应用中是特别有用的。
尖峰神经网络的研究者花费了相当多的时间来理解和设计尖峰神经元的数学模型。这些数学模型可能是任意复杂的并且需要手动调谐来产生某种期望行为。设计者将通常使用一组方程式以及用于那些方程式的参数来描述神经元。随后,将操纵这些参数以与现有或原型神经元的一些特性相匹配。例如,神经元模型可被设计成相对于已知存在于生物学中的神经元的时间来再现膜电压。研究者随后使用已知原型神经元随时间的电压作为参考并且尝试使用他自己的模型来复制那些动态。在呈现给与原型神经元相同的输入时,模型神经元意图在广泛的调谐之后产生对膜电压的准确逼近。
概述
在本公开的一个方面,公开了一种用于改进神经动态的方法。该方法包括获取原型神经元动态。该方法进一步包括修改神经元模型的参数以使得神经元模型与原型神经元动态相匹配。
本公开的另一方面涉及一种设备,包括用于获取原型神经元动态的装置。该设备进一步包括用于修改神经元模型的参数以使得神经元模型与原型神经元动态相匹配的装置。
在本公开的另一方面,公开了一种具有非瞬态计算机可读介质的用于改进神经动态的计算机程序产品。该计算机可读介质上记录有非瞬态程序代码,该程序代码在由(诸)处理器执行时使得(诸)处理器执行获取原型神经元动态的操作。该程序代码还使得(诸)处理器修改神经元模型的参数以使得神经元模型与原型神经元动态相匹配。
另一方面公开了一种具有存储器以及耦合至该存储器的至少一个处理器的用于改进神经动态的装置。该处理器被配置成获取原型神经元动态。该处理器被进一步配置成修改神经元模型的参数以使得神经元模型与原型神经元动态相匹配。
公开了一种用于优化神经动态的自动化方法。该方法利用分段式线性神经元模型并且自动地确定最佳匹配原型神经元的行为的参数。该过程获取原型神经动态。优化度量被定义并被用来对分段式线性模型与原型神经元的膜电压之差进行量化。最优参数随后基于优化度量来确定。
这已较宽泛地勾勒出本公开的特征和技术优势以便下面的详细描述可以被更好地理解。本公开的附加特征和优点将在下文描述。本领域技术人员应该领会,本公开可容易地被用作修改或设计用于实施与本公开相同的目的的其他结构的基础。本领域技术人员还应认识到,这样的等效构造并不脱离所附权利要求中所阐述的本公开的教导。被认为是本公开的特性的新颖特征在其组织和操作方法两方面连同进一步的目的和优点在结合附图来考虑以下描述时将被更好地理解。然而,要清楚理解的是,提供每一幅附图均仅用于解说和描述目的,且无意作为对本公开的限定的定义。
附图简述
在结合附图理解下面阐述的详细描述时,本公开的特征、本质和优点将变得更加明显,在附图中,相同附图标记始终作相应标识。
图1解说了根据本公开的某些方面的示例神经元网络。
图2解说了根据本公开的某些方面的计算网络(神经系统或神经网络)的处理单元(神经元)的示例。
图3解说了根据本公开的某些方面的尖峰定时依赖可塑性(STDP)曲线的示例。
图4解说了根据本公开的某些方面的用于定义神经元模型的行为的正态相和负态相的示例。
图5是根据本公开的一方面的用于将神经元模型的非线性函数的部分逼近为分段式线性函数的示例操作的流程图。
图6解说根据本公开的一方面的支配神经动态的分段式线性函数的示图的示例。
图7解说了根据本公开的某些方面的使用通用处理器来设计神经网络的示例实现。
图8解说了根据本公开的某些方面的设计其中存储器可以与个体分布式处理单元对接的神经网络的示例实现。
图9解说了根据本公开的某些方面的基于分布式存储器和分布式处理单元来设计神经网络的示例实现。
图10解说了根据本公开的某些方面的神经网络的示例实现。
图11是解说根据本公开的一方面的解说用于修改神经动态的方法的框图。
详细描述
以下结合附图阐述的详细描述旨在作为各种配置的描述,而无意表示可实践本文中所描述的概念的仅有的配置。本详细描述包括具体细节以便提供对各种概念的透彻理解。然而,对于本领域技术人员将显而易见的是,没有这些具体细节也可实践这些概念。在一些实例中,以框图形式示出众所周知的结构和组件以避免湮没此类概念。
基于本教导,本领域技术人员应领会,本公开的范围旨在覆盖本公开的任何方面,不论其是与本公开的任何其他方面相独立地还是组合地实现的。例如,可以使用所阐述的任何数目的方面来实现装置或实践方法。另外,本公开的范围旨在覆盖使用作为所阐述的本公开的各个方面的补充或者与之不同的其他结构、功能性、或者结构及功能性来实践的此类装置或方法。应当理解,所披露的本公开的任何方面可由权利要求的一个或多个元素来实施。
措辞“示例性”在本文中用于表示“用作示例、实例或解说”。本文中描述为“示例性”的任何方面不必被解释为优于或胜过其他方面。
尽管本文描述了特定方面,但这些方面的众多变体和置换落在本公开的范围之内。虽然提到了优选方面的一些益处和优点,但本公开的范围并非旨在被限定于特定益处、用途或目标。相反,本公开的各方面旨在能宽泛地应用于不同的技术、系统配置、网络和协议,其中一些作为示例在附图以及以下对优选方面的描述中解说。详细描述和附图仅仅解说本公开而非限定本公开,本公开的范围由所附权利要求及其等效技术方案来定义。
示例神经系统、训练及操作
图1解说了根据本公开的某些方面的具有多级神经元的示例人工神经系统100。神经系统100可具有神经元级102,该神经元级102通过突触连接网络104(即,前馈连接)来连接到另一神经元级106。为简单起见,图1中仅解说了两级神经元,尽管神经系统中可存在更少或更多级神经元。应注意,一些神经元可通过侧向连接来连接至同层中的其他神经元。此外,一些神经元可通过反馈连接来后向连接至先前层中的神经元。
如图1所解说的,级102中的每一个神经元可以接收可由前级的神经元(未在图1中示出)生成的输入信号108。信号108可表示级102的神经元的输入电流。该电流可在神经元膜上累积以对膜电位进行充电。当膜电位达到其阈值时,该神经元可激发并生成输出尖峰,该输出尖峰将被传递到下一级神经元(例如,级106)。此类行为可在硬件和/或软件(包括模拟和数字实现,诸如以下所述那些实现)中进行仿真或模拟。
在生物学神经元中,在神经元激发时生成的输出尖峰被称为动作电位。该电信号是相对迅速、瞬态的神经冲激,其具有约为100mV的振幅和约为1ms的历时。在具有一系列连通的神经元(例如,尖峰从图1中的一级神经元传递至另一级神经元)的神经系统的特定实施例中,每个动作电位都具有基本上相同的振幅和历时,并且因此该信号中的信息可仅由尖峰的频率和数目、或尖峰的时间来表示,而不由振幅来表示。动作电位所携带的信息可由尖峰、发放了尖峰的神经元、以及该尖峰相对于一个或数个其他尖峰的时间来确定。尖峰的重要性可由向各神经元之间的连接所应用的权重来确定,如以下所解释的。
尖峰从一级神经元向另一级神经元的传递可通过突触连接(或简称“突触”)网络104来达成,如图1中所解说的。关于突触104,级102的神经元可被视为突触前神经元,而级106的神经元可被视为突触后神经元。突触104可接收来自级102的神经元的输出信号(即,尖峰),并根据可调节突触权重 来按比例缩放那些信号,其中P是级102的神经元与级106的神经元之间的突触连接的总数,并且i是神经元级的指示符。例如,在图1的示例中,i表示神经元级102并且i+1表示神经元级106。此外,经按比例缩放的信号可被组合以作为级106中每个神经元的输入信号。级106中的每个神经元可基于对应的组合输入信号来生成输出尖峰110。可使用另一突触连接网络(图1中未示出)将这些输出尖峰110传递到另一级神经元。
生物学突触可被分类为电的或化学的。电突触主要用于发送兴奋性信号,而化学突触可调停突触后神经元中的兴奋性或抑制性(超极化)动作,并且还可用于放大神经元信号。兴奋性信号使膜电位去极化(即,相对于静息电位增大膜电位)。如果在某个时间段内接收到足够的兴奋性信号以使膜电位去极化到高于阈值,则在突触后神经元中发生动作电位。相反,抑制性信号一般使膜电位超极化(即,降低膜电位)。抑制性信号如果足够强则可抵消掉兴奋性信号之和并阻止膜电位到达阈值。除了抵消掉突触兴奋以外,突触抑制还可对自发活跃神经元施加强力的控制。自发活跃神经元是指在没有进一步输入的情况下(例如,由于其动态或反馈而)发放尖峰的神经元。通过压制这些神经元中的动作电位的自发生成,突触抑制可对神经元中的激发模式进行定形,这一般被称为雕刻。取决于期望的行为,各种突触104可充当兴奋性或抑制性突触的任何组合。
神经系统100可由通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其他可编程逻辑器件(PLD)、分立的门或晶体管逻辑、分立的硬件组件、由处理器执行的软件模块、或其任何组合来仿真。神经系统100可用在大范围的应用中,诸如图像和模式识别、机器学习、电机控制、及类似应用等。神经系统100中的每一神经元可被实现为神经元电路。被充电至发起输出尖峰的阈值的神经元膜可被实现为例如对流经其的电流进行积分的电容器。
在一方面,电容器作为神经元电路的电流积分器件可被除去,并且可使用较小的忆阻器元件来替代它。这种办法可应用于神经元电路中,以及其中大容量电容器被用作电流积分器的各种其他应用中。另外,每个突触104可基于忆阻器元件来实现,其中突触权重变化可与忆阻器电阻的变化有关。使用纳米特征尺寸的忆阻器,可显著地减小神经元电路和突触的面积,这可使得实现大规模神经系统硬件实现更为切实可行。
对神经系统100进行仿真的神经处理器的功能性可取决于突触连接的权重,这些权重可控制神经元之间的连接的强度。突触权重可存储在非易失性存储器中以在掉电之后保留该处理器的功能性。在一方面,突触权重存储器可实现在与主神经处理器芯片分开的外部芯片上。突触权重存储器可与神经处理器芯片分开地封装成可更换的存储卡。这可向神经处理器提供多种多样的功能性,其中特定功能性可基于当前附连至神经处理器的存储卡中所存储的突触权重。
图2解说了根据本公开的某些方面的计算网络(例如,神经系统或神经网络)的处理单元(例如,神经元或神经元电路)200的示例性示图202。例如,神经元202可对应于来自图1的级102和106的任何神经元。神经元202可接收多个输入信号2041-204N(X1-XN),这些输入信号可以是该神经系统外部的信号、或是由同一神经系统的其他神经元所生成的信号、或这两者。输入信号可以是实数值或复数值的电流或电压。输入信号可包括具有定点或浮点表示的数值。可通过突触连接将这些输入信号递送到神经元202,突触连接根据可调节突触权重2061-206N(W1-WN)对这些信号进行按比例缩放,其中N可以是神经元202的输入连接总数。
神经元202可组合这些经按比例缩放的输入信号,并且使用组合的经按比例缩放的输入来生成输出信号208(即,信号Y)。输出信号208可以是实数值或复数值的电流或电压。输出信号可以是具有定点或浮点表示的数值。随后该输出信号208可作为输入信号传递至同一神经系统的其他神经元、或作为输入信号传递至同一神经元202、或作为该神经系统的输出来传递。
处理单元(神经元)202可由电路来仿真,并且其输入和输出连接可由具有突触电路的电连接来仿真。处理单元202及其输入和输出连接也可由软件代码来仿真。处理单元202还可由电路来仿真,而其输入和输出连接可由软件代码来仿真。在一方面,计算网络中的处理单元202可以是模拟电路。在另一方面,处理单元202可以是数字电路。在又一方面,处理单元202可以是具有模拟和数字组件两者的混合信号电路。计算网络可包括任何前述形式的处理单元。使用这样的处理单元的计算网络(神经系统或神经网络)可用在大范围的应用中,诸如图像和模式识别、机器学习、电机控制、及类似应用等。
在神经网络的训练过程期间,突触权重(例如,来自图1的权重 和/或来自图2的权重2061-206N)可用随机值来初始化并根据学习规则而被增大或减小。本领域技术人员将领会,学习规则的示例包括但不限于尖峰定时依赖可塑性(STDP)学习规则、Hebb规则、Oja规则、Bienenstock-Copper-Munro(BCM)规则等。在某些方面,这些权重可稳定或收敛至两个值(即,权重的双峰分布)之一。该效应可被用于减少每个突触权重的位数、提高从/向存储突触权重的存储器读取和写入的速度、以及降低突触存储器的功率和/或处理器消耗。
突触类型
在神经网络的硬件和软件模型中,突触相关功能的处理可基于突触类型。突触类型可包括非可塑突触(对权重和延迟没有改变)、可塑突触(权重可改变)、结构化延迟可塑突触(权重和延迟可改变)、全可塑突触(权重、延迟和连通性可改变)、以及基于此的变型(例如,延迟可改变,但在权重或连通性方面没有改变)。多种类型的优点在于处理可以被细分。例如,非可塑突触可不执行可塑性功能(或等待此类功能完成)。类似地,延迟和权重可塑性可被细分成可一起或分开地、顺序地或并行地运作的操作。不同类型的突触对于适用的每一种不同的可塑性类型可具有不同的查找表或公式以及参数。因此,这些方法将针对该突触的类型来访问相关的表、公式或参数。对变化的突触类型的使用会向人工神经网络添加灵活性和可配置性。
还存在尖峰定时依赖结构化可塑性独立于突触可塑性而执行的暗示。结构化可塑性即使在权重幅值没有改变的情况下(例如,如果权重已达最小或最大值、或者其由于某种其他原因而不改变)也可执行,因为结构化可塑性(即,延迟改变的量)可以是前-后尖峰时间差的直接函数。替换地,结构化可塑性可被设为权重变化量的函数或者可基于与权重或权重变化的界限有关的条件来设置。例如,突触延迟可仅在权重变化发生时或者在权重到达0的情况下才改变,但在这些权重为最大值时则不改变。然而,具有独立函数以使得这些过程能被并行化从而减少存储器访问的次数和交叠可能是有利的。
突触可塑性的确定
神经元可塑性(或简称“可塑性”)是大脑中的神经元和神经网络响应于新的信息、感官刺激、发展、损坏、或机能障碍而改变其突触连接和行为的能力。可塑性对于生物学中的学习和记忆、以及对于计算神经元科学和神经网络是重要的。已经研究了各种形式的可塑性,诸如突触可塑性(例如,根据Hebbian理论)、尖峰定时依赖可塑性(STDP)、非突触可塑性、活跃性依赖可塑性、结构化可塑性和自稳态可塑性。
STDP是调节神经元之间的突触连接的强度的学习过程。连接强度是基于特定神经元的输出与收到输入尖峰(即,动作电位)的相对定时来调节的。在STDP过程下,如果至某个神经元的输入尖峰平均而言倾向于紧挨在该神经元的输出尖峰之前发生,则可发生长期增强(LTP)。于是使得该特定输入在一定程度上更强。另一方面,如果输入尖峰平均而言倾向于紧接在输出尖峰之后发生,则可发生长期抑压(LTD)。于是使得该特定输入在一定程度上更弱,并由此得名“尖峰定时依赖可塑性”。因此,使得可能是突触后神经元兴奋原因的输入甚至更有可能在将来作出贡献,而使得不是突触后尖峰的原因的输入较不可能在将来作出贡献。该过程继续,直至初始连接集合的子集保留,而所有其他连接的影响减小至无关紧要的水平。
由于神经元一般在其许多输入都在一短时段内发生(即,输入被累积到足以引起输出)时产生输出尖峰,因此通常保留下来的输入子集包括倾向于在时间上相关的那些输入。另外,由于在输出尖峰之前发生的输入被加强,因此提供对相关性的最早充分累积性指示的那些输入将最终变成至该神经元的最后输入。
STDP学习规则可因变于突触前神经元的尖峰时间tpre与突触后神经元的尖峰时间tpost之间的时间差(即,t=tpost-tpre)来有效地适配将该突触前神经元连接到该突触后神经元的突触的突触权重。STDP的典型公式是若该时间差为正(突触前神经元在突触后神经元之前激发)则增大突触权重(即,增强该突触),以及若该时间差为负(突触后神经元在突触前神经元之前激发)则减小突触权重(即,抑压该突触)。
在STDP过程中,突触权重随时间推移的改变可通常使用指数式衰退来达成,如由下式给出的:
其中k分别是针对正和负时间差的时间常数,a和a-是对应的比例缩放幅值,以及μ是可应用于正时间差和/或负时间差的偏移。
图3解说了根据STDP,突触权重因变于突触前(pre)和突触后(post)尖峰的相对定时而改变的示例性曲线图300。如果突触前神经元在突触后神经元之前激发,则可使对应的突触权重增大,如曲线图300的部分302中所解说的。该权重增大可被称为该突触的LTP。从曲线图部分302可观察到,LTP的量可因变于突触前和突触后尖峰时间之差而大致呈指数地下降。相反的激发次序可减小突触权重,如曲线图300的部分304中所解说的,从而导致该突触的LTD。
如图3中的曲线图300中所解说的,可向STDP曲线图的LTP(因果性)部分302应用负偏移μ。x轴的交越点306(y=0)可被配置成与最大时间滞后重合以考虑到来自层i-1的各因果性输入的相关性。在基于帧的输入(即,按尖峰或脉冲的特定历时的帧的形式的输入)的情形中,可计算偏移值μ以反映帧边界。该帧中的第一输入尖峰(脉冲)可被视为随时间衰退,要么如直接由突触后电位所建模地、要么以对神经状态的影响的形式而随时间衰退。如果该帧中的第二输入尖峰(脉冲)被视为与特定时间帧相关或有关,则该帧之前和之后的有关时间可通过使STDP曲线的一个或多个部分偏移以使得这些有关时间中的值可以不同(例如,对于大于一个帧为负,而对于小于一个帧为正)来在该时间帧边界处被分开并在可塑性意义上被不同地对待。例如,负偏移μ可被设为偏移LTP以使得曲线实际上在大于帧时间的pre-post时间处变得低于零并且它由此为LTD而非LTP的一部分。
神经元模型及操作
存在一些用于设计有用的尖峰发放神经元模型的一般原理。良好的神经元模型在以下两个计算态相(regime)方面可具有丰富的潜在行为:重合性检测和功能性计算。此外,良好的神经元模型应当具有允许时间编码的两个要素。例如,输入的抵达时间影响输出时间并且一致性检测能具有窄时间窗。另外,为了在计算上是有吸引力的,良好的神经元模型在连续时间上可具有闭合形式解,并且具有稳定的行为,包括在靠近吸引子和鞍点之处。换言之,有用的神经元模型是可实践且可被用于建模丰富的、现实的且生物学一致的行为并且可被用于对神经电路进行工程设计和反向工程两者的神经元模型。
神经元模型可取决于事件,诸如输入抵达、输出尖峰或其他事件,无论这些事件是内部的还是外部的。为了达成丰富的行为库,能展现复杂行为的状态机可能是期望的。如果事件本身的发生在撇开输入贡献(若有)的情况下能影响状态机并约束该事件之后的动态,则该系统的将来状态并非仅是状态和输入的函数,而是状态、事件和输入的函数。
在一方面,神经元n可被建模为尖峰带漏泄积分激发神经元,其膜电压vn(t)由以下动态来支配:
其中α和β是参数,wm,n是将突触前神经元m连接至突触后神经元n的突触的突触权重,以及ym(t)是神经元m的尖峰输出,其可根据Δtm,n被延迟达树突或轴突延迟直至抵达神经元n的胞体。
应注意,从建立了对突触后神经元的充分输入的时间直至突触后神经元实际上激发的时间之间存在延迟。在动态尖峰发放神经元模型(诸如Izhikevich简单模型)中,如果在去极化阈值vt与峰值尖峰电压vpeak之间有差量,则可引发时间延迟。例如,在该简单模型中,神经元胞体动态可由关于电压和恢复的微分方程对来支配,即:
其中v是膜电位,u是膜恢复变量,k是描述膜电位v的时间尺度的参数,a是描述恢复变量u的时间尺度的参数,b是描述恢复变量u对膜电位v的阈下波动的敏感度的参数,vr是膜静息电位,I是突触电流,以及C是膜的电容。根据该模型,神经元被定义为在v>vpeak时发放尖峰。
Hunzinger Cold模型
Hunzinger Cold神经元模型是能再现丰富多样的各种神经行为的最小双态相尖峰发放线性动态模型。该模型的一维或二维线性动态可具有两个态相,其中时间常数(以及耦合)可取决于态相。在阈下态相中,时间常数(按照惯例为负)表示漏泄通道动态,其一般作用于以生物学一致的线性方式使细胞返回到静息。阈上态相中的时间常数(按照惯例为正)反映抗漏泄通道动态,其一般驱动细胞发放尖峰,而同时在尖峰生成中引发等待时间。
如图4中所解说的,该模型400的动态可被划分成两个(或更多个)态相。这些态相可被称为负态相402(也可互换地称为带漏泄积分激发(LIF)态相(其与LIF神经元模型不同))以及正态相404(也可互换地称为抗漏泄积分激发(ALIF)态相,勿与ALIF神经元模型混淆)。在负态相402中,状态在将来事件的时间趋向于静息(v-)。在该负态相中,该模型一般展现出时间输入检测性质及其他阈下行为。在正态相404中,状态趋向于尖峰发放事件(vs)。在该正态相中,该模型展现出计算性质,诸如取决于后续输入事件而引发发放尖峰的等待时间。在事件方面对动态进行公式化以及将动态分成这两个态相是该模型的基础特性。
线性双态相二维动态(对于状态v和u)可按照惯例定义为:
其中qρ和r是用于耦合的线性变换变量。
符号ρ在本文中用于标示动态态相,在讨论或表达具体态相的关系时,按照惯例对于负态相和正态相分别用符号“-”或“+”来替换符号ρ。
模型状态由膜电位(电压)v和恢复电流u来定义。在基本形式中,态相在本质上是由模型状态来决定的。该精确和通用的定义存在一些细微却重要的方面,但目前考虑该模型在电压v高于阈值(v+)的情况下处于正态相404中,否则处于负态相402中。
态相相关时间常数包括负态相时间常数τ-和正态相时间常数τ+。恢复电流时间常数τu通常是与态相无关的。出于方便起见,负态相时间常数τ-通常被指定为反映衰退的负量,从而用于电压演变的相同表达式可用于正态相,在正态相中指数和τ+将一般为正,正如τu那样。
这两个状态元素的动态可在发生事件之际通过使状态偏离其零倾线(null-cline)的变换来耦合,其中变换变量为:
qρ=-τρβu-vρ (7)
r=δ(v+ε) (8)
其中δ、ε、β和v-、v是参数。vρ的两个值是这两个态相的参考电压的基数。参数v-是负态相的基电压,并且膜电位在负态相中一般将朝向v-衰退。参数v是正态相的基电压,并且膜电位在正态相中一般将趋向于背离v
v和u的零倾线分别由变换变量qρ和r的负数给出。参数δ是控制u零倾线的斜率的比例缩放因子。参数ε通常被设为等于-v-。参数β是控制这两个态相中的v零倾线的斜率的电阻值。τρ时间常数参数不仅控制指数式衰退,还单独地控制每个态相中的零倾线斜率。
该模型可被定义为在电压v达到值vS时发放尖峰。随后,状态可在发生复位事件(其可以与尖峰事件完全相同)之际被复位:
u=u+Δu (10)
其中和Δu是参数。复位电压通常被设为v-
依照瞬时耦合的原理,闭合形式解不仅对于状态是可能的(且具有单个指数项),而且对于到达特定状态所需的时间也是可能的。闭合形式状态解为:
因此,模型状态可仅在发生事件之际被更新,诸如在输入(突触前尖峰)或输出(突触后尖峰)之际被更新。还可在任何特定时间(无论是否有输入或输出)执行操作。
而且,依照瞬时耦合原理,可以预计突触后尖峰的时间,因此到达特定状态的时间可提前被确定而无需迭代技术或数值方法(例如,欧拉数值方法)。给定了先前电压状态v0,直至到达电压状态vf之前的时间延迟由下式给出:
如果尖峰被定义为发生在电压状态v到达vS的时间,则从电压处于给定状态v的时间起测量的直至发生尖峰前的时间量或即相对延迟的闭合形式解为:
其中通常被设为参数v+,但其他变型可以是可能的。
模型动态的以上定义取决于该模型是在正态相还是负态相中。如所提及的,耦合和态相ρ可基于事件来计算。出于状态传播的目的,态相和耦合(变换)变量可基于在上一(先前)事件的时间的状态来定义。出于随后预计尖峰输出时间的目的,态相和耦合变量可基于在下一(当前)事件的时间的状态来定义。
存在对该Cold模型、以及在时间上执行模拟、仿真、或建模的若干可能实现。这包括例如事件-更新、步阶-事件更新、以及步阶-更新模式。事件更新是其中基于事件或“事件更新”(在特定时刻)来更新状态的更新。步点更新是以间隔(例如,1ms)来更新模型的情况下的更新。这不一定要求迭代方法或数值方法。通过仅在事件发生于步阶处或步阶间的情况下才更新模型或即通过“步阶-事件”更新,基于事件的实现以有限的时间分辨率在基于步阶的模拟器中实现也是可能的。
修改神经动态
设计方程式以支配原型神经元的动态是困难的任务并且需要较高的数学能力。原型神经元是被期望与另一神经元相匹配的神经元。也就是说,在一种配置中,用户可期望将第一神经元的属性(诸如,尖峰定时和/或膜电压)与第二神经元相匹配。在此配置中,第二神经元是原型神经元。原型神经元还可包括神经网络中的全部或一些神经元。
用于将一神经元与原型神经元相匹配的相关联参数的手动调谐是繁重的并且可利用支配方程式的深入知识。也就是说,即使神经元被提供一组方程,尝试手动调谐那些方程的参数的研究者也可能需要理解支配原型神经元的方程式。相应地,将神经元与原型神经元相匹配是耗费时间且繁重的,因为可能需要高度的技能和/或知识来将一神经元与原型神经元相匹配。
所提议的解决方案是通过使用底层的分段式线性神经元模型来使方程式设计和相关联的参数调谐的过程自动化,该分段式线性神经元模型确定与原型神经元的行为基本相似的参数。
在一种配置中,指定分段式线性神经元模型。分段式线性神经元模型逼近电压依赖函数g(v),即,g(v)在区间Δv上等于常数。也就是说,分段式线性神经元模型提供了具有常数系数的线性微分方程组。一旦问题被如此公式化表示,就可在连续时间或离散时间中求解微分方程。
对于分段式线性神经元模型,每个时间步长处变量的更新对于复数输入包括六个乘法和四个加法。分段式线性神经元模型是灵活的,因为g(v)函数可被逼近,并且由此大多数(即使不是所有)模型可用相同的基本架构来实现以供变量更新。用于更新的系数可改变。仍然,系数可以被容易地预先计算并被存储在存储器中。此外,藉以逼近函数g(v)的解Δv是用来折衷准确度和存储要求的设计参数。
图5是根据本公开的一方面的用于使用分段式线性逼近来进行神经元建模的示例操作500的流程图。操作500可以硬件(例如由一个或多个处理单元,诸如神经元形态处理器)、以软件或以固件来执行。
操作500可开始于框502,基于非线性函数提供神经元模型。在一种配置中,该非线性函数包括膜电位(v)乘以电压依赖电导率(g(v))。非线性函数的一部分可以是电压依赖电导率。在一些情形中,神经元模型可包括Izhikevich简单模型、指数积分激发(EIF)模型、Fitzhugh-Nagumo模型、四次模型、和/或连续时间常微分方程(ODE)基于等待时间的动态(COLD)模型。该神经元模型可具有至少两个维度。在一种配置中,该非线性函数包括两个或更多个不同的操作态相。在另一配置中,该神经元模型包括用该非线性函数建模的一个或多个突触电流。
在框504,可用分段式线性函数逼近该非线性函数的一部分。在一种配置中,逼近非线性函数的该部分包括用分段式线性函数逼近电压依赖函数(F(v))。在此配置中,v是膜电位,并且该分段式线性函数的解包括关于每个量化区间(v(t))的斜率和截距。
在一种配置中,框504的逼近包括从存储器获取关于分段式线性函数的预定系数。在另一配置中,框504的逼近指定使用分段式线性函数线性化的神经元模型的闭合形式解。
在框506,可基于该逼近来确定神经元模型的状态。在一种配置中,该状态是通过神经元模型的膜电位(v)和恢复电流(u)来定义的。分段式线性函数可基于膜电位(v)的区间来量化。根据本公开的一方面,分段式线性函数在膜电位(v)的每个区间上是常数。在一种配置中,在506确定神经元模型的状态包括基于该逼近来使用无限脉冲响应(IIR)滤波器。
根据本公开的一方面,分段式线性函数的步长大小(量化区间)是不均匀的。在一种配置中,分段式线性函数的步长大小依赖于非线性函数。在另一配置中,神经元模型在时间上的量化是不均匀的。神经元模型在时间上的量化可以基于正被建模的神经元的类型。
根据本公开的另一方面,操作500可进一步包括基于该逼近和神经元模型的状态来确定神经元模型的另一状态。对于某些方面,这些操作可进一步包括将状态输出给显示器。
分段式线性神经元模型的神经动态可按状态-空间公式化的形式表达
y=v=Cx+vr (16)
在式(1)-(3)中,I是输入电流,v是膜电压,u是恢复变量并且vr是膜静息电压。函数g(v)定义了神经行为的某些特性。
式(1)-(3)是分段式线性神经动态的状态-空间的公式化。然而,离散时间解也可被指定以模拟和改进神经元动态。在一种配置中,在连续时间方程上假定零阶保持。因此,在本配置中,方程为:
x[n]=Gx[n-1]+HI[n-1] (18)
y[n]=v[n]=Cx[n]+vr (19)
G=eA (20)
H=A-1[G-I]B (21)
此外,在本配置中,用于膜电压v和恢复变量u的离散时间方程为:
v[n]=G11v[n-1]+G12u[n-1]+H1I[n-1]=vr (22)
u[n]=G21v[n-1]+G22u[n-1]+H2I[n-1] (23)
根据以上方程,将要调谐的神经元参数为a、b和c。这些参数可按矢量形式表达为:
θ=[abC]T (24)
在式(9)中,θ可被称为参数矢量。
图6解说了支配可被指定以确定参数值(诸如,v[n]和/或u[n])的神经动态的分段式线性函数的框图600。滤波器600可以基于式(22)和(23)。在一种配置中,滤波器600包括单位延迟602、604、606以延迟在每个延迟处接收到的输入。单位延迟602、604、606可以是具有延迟z-1的单个处理延迟。第一单位延迟602被指定成延迟v的先前值(即,(v-1)),第二单位延迟604被指定成延迟I的值,并且第三单位延迟606被指定成延迟u的值。
滤波器600还可包括乘法器608、610、612。第一乘法器608被指定成将G11的值与v的经延迟的先前值相乘。另外,第二乘法器610被指定成将H11的值与I的经延迟值相乘。此外,第三乘法器610被指定成将G12的值与u的经延迟值相乘。滤波器600还包括用以将第一乘法器608、第二乘法器610、第三乘法器612的输出和值vr相加的加法器614。滤波器600的输出为v。在此配置中,滤波器被指定成确定G11、H1、和G12的值。
为了执行对被指定用于分段式线性神经元模型的参数的优化,可定义度量来量化对原型神经元动态的拟合。在一种配置中,该度量被指定为均方误差(MSE):
在式(10)中,N是电压采样的总数,并且vp是原型神经元的膜电压。在此配置中,v对θ的隐式依赖性出于简明起见被省略。该度量(即,均方误差)对分段式线性神经元与原型神经元的膜电压之差进行了量化。
给定优化度量Ψ和参数矢量θ,可指定多种方法来找到各种参数,诸如举例而言,θ*。具体而言,θ*可被表达为:
θ*=argminθΨ(θ) (26)
在一种配置中,θ*可使用各种算法来确定,包括但不限于遗传算法、模式搜索、模拟退火和单纯性算法。然而,由于离散时间方程以闭合形式存在并且存在对矩阵指数(eA)的简单逼近,因此可分析地执行改进。
为了导出分析解,定义g(v)的构成。作为示例,g(v)的构成从Izhikevich神经元取得:
g(v)=k(v-vt) (27)
在式(12)中,vt是神经元的膜阈值电压,并且k是该原型模型的另一自由参数。在该情形中,参数矢量θ变成:
θ=[a b C k]T (28)
在一种配置中,θ*可通过计算在式(26)中定义的改进度量Ψ(θ)的最小值来确定。数学上,连续函数的最小值可在函数的梯度为零时确定。换言之,Ψ(θ)的最小值可如下确定:
梯度可通过下式确定:
相应地,在一种配置中,计算梯度指定了关于参数矢量θ中的每个变量确定式(22)的偏导数。在一种配置中,对式(20)中的矩阵指数的正向矩形规则逼近可被指定以用于计算梯度。使用此逼近,G和H的方程被指定为:
G=eA≈A+I (31)
H=A-1(G-I)B≈B (32)
在式(31)和(32)中,I是单位矩阵。式(30)的偏倒数为:
在式(34)-(36)中,根据式(16),x1[n]=v[n]-vr。梯度被用来迭代地更新参数矢量θ的值:
在式(37)中,α是更新速率。对θt的更新继续直至收敛或者当θt≈θ*时。
除了式(24)中定义的改进度量之外,还可使用其它度量。在一些情形中,膜电压的建模可能不是重要的。代替地,膜电压超过阈值的实际时间可能是重要的。超过阈值的膜电压可被称为尖峰。在一种配置中,度量可按尖峰时间的形式来定义。此度量可被定义为:
在式(38)中,t是分段式线性神经元模型的尖峰时间的矢量并且tp是原型神经元的尖峰时间的矢量。f(t;t,τ)可被定义为:
在式(39)中,N是x中元素的数目,h(·)是Heaviside阶跃函数,并且τ是时间常数。式(38)度量的度量可被用来量化尖峰时间差。
本公开的各方面不被限于匹配两个不同神经元的膜电压动态和/或尖峰时间。在一种配置中,本公开的各方面还可被用来设计浮点模型的定点实现。
在一些情形中,分段式线性神经元模型的参数可使用前述配置来确定。此外,在一个示例中,用户可将分段式线性神经元模型转换成定点实现。该转换可通过改变θ中的参数并且向优化度量添加额外项来发起。参数矢量变成:
θ=[n1n2K]T (40)
在式(40)中,n1是变量1所需的位数,n2是变量2所需的位数,以此类推。式(24)中公式化的度量可包括加法项以变成:
在式(41)中,β∈[0,1]控制这两项的相对重要性。
图7解说了根据本公开的某些方面的使用通用处理器702进行前述修改神经动态的示例实现700。与计算网络(神经网络)相关联的变量(神经信号)、突触权重、系统参数,延迟,和频率槽信息可被存储在存储器块704中,而在通用处理器702处执行的指令可从程序存储器706中加载。在本公开的一方面,加载到通用处理器702中的指令可以包括用于获得原型神经元动态和/或修改神经元模型的参数以使得该神经元模型与该原型神经元动态相匹配的代码。
图8解说了根据本公开的某些方面的前述修改神经动态的示例实现800,其中存储器802可以经由互连网络804与计算网络(神经网络)的个体(分布式)处理单元(神经处理器)806对接。与计算网络(神经网络)相关联的变量(神经信号)、突触权重、系统参数,延迟,和/或频率槽信息可被存储在存储器802中,并且可从存储器802经由互连网络804的连接被加载到每个处理单元(神经处理器)806中。在本公开的一方面,处理单元806可被配置成获得原型神经元动态和/或修改神经元模型的参数。
图9解说前述修改神经动态的示例实现900。如图9中所解说的,一个存储器组902可与计算网络(神经网络)的一个处理单元904直接对接。每一个存储器组902可存储与对应的处理单元(神经处理器)904相关联的变量(神经信号)、突触权重、和/或系统参数,延迟,以及频率槽信息。在本公开的一方面,处理单元904可被配置成获得原型神经元动态和/或修改神经元模型的参数。
图10解说了根据本公开的某些方面的神经网络1000的示例实现。如图10中所解说的,神经网络1000可具有多个局部处理单元1002,它们可执行上述方法的各种操作。每个局部处理单元1002可包括存储该神经网络的参数的局部状态存储器1004和局部参数存储器1006。另外,局部处理单元1002可具有带有局部(神经元)模型程序的存储器1008、带有局部学习程序的存储器1010、以及局部连接存储器1009。此外,如图10中所解说的,每个局部处理单元1002可与用于配置处理的单元1014对接并且与路由连接处理元件1016对接,用于配置处理的单元1014可提供对局部处理单元的局部存储器的配置,路由连接处理元件1016提供局部处理单元1002之间的路由。
在一种配置中,神经元模型被配置成用于获取原型神经元动态和/或修改神经元模型的参数。在一个方面,获取装置和/或修改装置可以是被配置成执行由映射和/或激发装置叙述的功能的通用处理器702、程序存储器706、存储器块704、存储器802、互连网络804、处理单元806、处理单元904、局部处理单元1002、和/或路由连接处理元件1016。在另一配置中,前述装置可以是被配置成执行由前述装置所叙述的功能的任何模块或任何设备。
根据本公开的某些方面,每个局部处理单元1002可被配置成基于神经网络的一个或多个期望功能性特征来确定神经网络的参数,以及随着所确定的参数被进一步适配、调谐和更新来使这一个或多个功能性特征朝着期望的功能性特征发展。
图11解说了用于修改神经动态的方法1100。在框1102,神经元模型获取原型神经元动态。此外,在框1104,神经元模型修改神经元模型的参数以使得神经元模型与原型神经元动态相匹配。
在一种配置中,神经网络(诸如本公开的各方面的神经网络)被配置成修改神经动态。神经网络可以包括用于获取的装置和用于修改的装置。在一个方面,获取装置和/或修改装置可以是被配置成执行由修改和/或获取装置叙述的功能的程序存储器706、存储器块1004、存储器802、互连网络804、处理单元806、处理单元904、本地处理单元1002、和/或路由连接处理元件1016。
在另一配置中,前述装置可以是被配置成执行由前述装置所叙述的功能的任何模块或任何设备。即,以上所描述的方法的各种操作可由能够执行相应功能的任何合适的装置来执行。这些装置可包括各种硬件和/或软件组件和/或模块,包括但不限于电路、专用集成电路(ASIC)、或处理器。一般而言,在存在图11中解说的操作的场合,那些操作可具有带相似编号的相应配对装置加功能组件。
如本文所使用的,术语“确定”涵盖各种各样的动作。例如,“确定”可包括演算、计算、处理、推导、研究、查找(例如,在表、数据库或其他数据结构中查找)、探知及诸如此类。而且,“确定”可包括接收(例如,接收信息)、访问(例如,访问存储器中的数据)及诸如此类。而且,“确定”还可包括解析、选择、选取、确立及类似动作。
如本文所使用的,引述一列项目中的至少一个摂的短语是指这些项目的任何组合,包括单个成员。作为示例,“a、b、或c中的至少一者”旨在涵盖a、b、c、a-b、a-c、b-c、以及a-b-c。
结合本公开所描述的各种解说性逻辑框、模块、以及电路可用设计成执行本文所描述功能的通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列信号(FPGA)或其他可编程逻辑器件(PLD)、分立的门或晶体管逻辑、分立的硬件组件或其任何组合来实现或执行。通用处理器可以是微处理器,但在替换方案中,处理器可以是任何市售的处理器、控制器、微控制器、或状态机。处理器还可以被实现为计算设备的组合,例如DSP与微处理器的组合、多个微处理器、与DSP核心协同的一个或多个微处理器、或任何其它此类配置。
结合本公开所描述的方法或算法的步骤可直接在硬件中、在由处理器执行的软件模块中、或在这两者的组合中体现。软件模块可驻留在本领域所知的任何形式的存储介质中。可使用的存储介质的一些示例包括随机存取存储器(RAM)、只读存储器(ROM)、闪存、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、CD-ROM,等等。软件模块可包括单条指令、或许多条指令,且可分布在若干不同的代码段上,分布在不同的程序间以及跨多个存储介质分布。存储介质可被耦合到处理器以使得该处理器能从/向该存储介质读写信息。替换地,存储介质可以被整合到处理器。
本文所公开的方法包括用于实现所描述的方法的一个或多个步骤或动作。这些方法步骤和/或动作可以彼此互换而不会脱离权利要求的范围。换言之,除非指定了步骤或动作的特定次序,否则具体步骤和/或动作的次序和/或使用可以改动而不会脱离权利要求的范围。
所描述的功能可在硬件、软件、固件或其任何组合中实现。如果以硬件实现,则示例硬件配置可包括设备中的处理系统。处理系统可以用总线架构来实现。取决于处理系统的具体应用和整体设计约束,总线可包括任何数目的互连总线和桥接器。总线可将包括处理器、机器可读介质、以及总线接口的各种电路链接在一起。总线接口可用于尤其将网络适配器等经由总线连接至处理系统。网络适配器可用于实现信号处理功能。对于某些方面,用户接口(例如,按键板、显示器、鼠标、操纵杆,等等)也可以被连接到总线。总线还可以链接各种其他电路,诸如定时源、外围设备、稳压器、功率管理电路以及类似电路,它们在本领域中是众所周知的,因此将不再进一步描述。
处理器可负责管理总线和一般处理,包括执行存储在机器可读介质上的软件。处理器可用一个或多个通用和/或专用处理器来实现。示例包括微处理器、微控制器、DSP处理器、以及其他能执行软件的电路系统。软件应当被宽泛地解释成意指指令、数据、或其任何组合,无论是被称作软件、固件、中间件、微代码、硬件描述语言、或其他。作为示例,机器可读介质可包括RAM(随机存取存储器)、闪存、ROM(只读存储器)、PROM(可编程只读存储器)、EPROM(可擦式可编程只读存储器)、EEPROM(电可擦式可编程只读存储器)、寄存器、磁盘、光盘、硬驱动器、或者任何其他合适的存储介质、或其任何组合。机器可读介质可被实施在计算机程序产品中。该计算机程序产品可以包括包装材料。
在硬件实现中,机器可读介质可以是处理系统中与处理器分开的一部分。然而,如本领域技术人员将容易领会的,机器可读介质或其任何部分可在处理系统外部。作为示例,机器可读介质可包括传输线、由数据调制的载波、和/或与设备分开的计算机产品,所有这些都可由处理器通过总线接口来访问。替换地或补充地,机器可读介质或其任何部分可被集成到处理器中,诸如高速缓存和/或通用寄存器文件可能就是这种情形。虽然所讨论的各种组件可被描述为具有特定位置,诸如局部组件,但它们也可按各种方式来配置,诸如某些组件被配置成分布式计算系统的一部分。
处理系统可以被配置为通用处理系统,该通用处理系统具有一个或多个提供处理器功能性的微处理器、以及提供机器可读介质中的至少一部分的外部存储器,它们都通过外部总线架构与其他支持电路系统链接在一起。替换地,该处理系统可以包括一个或多个神经元形态处理器以用于实现本文所述的神经元模型和神经系统模型。作为另一替代方案,处理系统可以用带有集成在单块芯片中的处理器、总线接口、用户接口、支持电路系统、和至少一部分机器可读介质的ASIC(专用集成电路)来实现,或者用一个或多个FPGA(现场可编程门阵列)、PLD(可编程逻辑器件)、控制器、状态机、门控逻辑、分立硬件组件、或者任何其他合适的电路系统、或者能执行本公开通篇所描述的各种功能性的电路的任何组合来实现。取决于具体应用和加诸于整体系统上的总设计约束,本领域技术人员将认识到如何最佳地实现关于处理系统所描述的功能性。
机器可读介质可包括数个软件模块。这些软件模块包括当由处理器执行时使处理系统执行各种功能的指令。这些软件模块可包括传送模块和接收模块。每个软件模块可以驻留在单个存储设备中或者跨多个存储设备分布。作为示例,当触发事件发生时,可以从硬驱动器中将软件模块加载到RAM中。在软件模块执行期间,处理器可以将一些指令加载到高速缓存中以提高访问速度。随后可将一个或多个高速缓存行加载到通用寄存器文件中以供处理器执行。在以下述及软件模块的功能性时,将理解此类功能性是在处理器执行来自该软件模块的指令时由该处理器来实现的。
如果以软件实现,则各功能可作为一条或多条指令或代码存储在计算机可读介质上或藉其进行传送。计算机可读介质包括计算机存储介质和通信介质两者,这些介质包括促成计算机程序从一地向另一地转移的任何介质。存储介质可以是能被计算机访问的任何可用介质。作为示例而非限定,此类计算机可读介质可包括RAM、ROM、EEPROM、CD-ROM或其他光盘存储、磁盘存储或其他磁存储设备、或能用于携带或存储指令或数据结构形式的期望程序代码且能被计算机访问的任何其他介质。任何连接也被正当地称为计算机可读介质。例如,如果软件是使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)、或无线技术(诸如红外(IR)、无线电、以及微波)从web网站、服务器、或其他远程源传送而来,则该同轴电缆、光纤电缆、双绞线、DSL或无线技术(诸如红外、无线电、以及微波)就被包括在介质的定义之中。如本文中所使用的盘(disk)和碟(disc)包括压缩碟(CD)、激光碟、光碟、数字多用碟(DVD)、软盘、和碟,其中盘(disk)常常磁性地再现数据,而碟(disc)用激光来光学地再现数据。因此,在一些方面,计算机可读介质可包括非瞬态计算机可读介质(例如,有形介质)。另外,对于其他方面,计算机可读介质可包括瞬态计算机可读介质(例如,信号)。上述的组合应当也被包括在计算机可读介质的范围内。
因此,某些方面可包括用于执行本文中给出的操作的计算机程序产品。例如,此类计算机程序产品可包括其上存储(和/或编码)有指令的计算机可读介质,这些指令能由一个或多个处理器执行以执行本文中所描述的操作。对于某些方面,计算机程序产品可包括包装材料。
此外,应当领会,用于执行本文中所描述的方法和技术的模块和/或其它恰适装置能由用户终端和/或基站在适用的场合下载和/或以其他方式获得。例如,此类设备能被耦合至服务器以促成用于执行本文中所描述的方法的装置的转移。替换地,本文所述的各种方法能经由存储装置(例如,RAM、ROM、诸如压缩碟(CD)或软盘等物理存储介质等)来提供,以使得一旦将该存储装置耦合至或提供给用户终端和/或基站,该设备就能获得各种方法。此外,可利用适于向设备提供本文所描述的方法和技术的任何其他合适的技术。
将理解,权利要求并不被限定于以上所解说的精确配置和组件。可在以上所描述的方法和装置的布局、操作和细节上作出各种改动、更换和变形而不会脱离权利要求的范围。

Claims (12)

1.一种用于改进存储在设备中的人工神经网络的神经动态的方法,包括:
从原型神经元获取原型神经元动态,所述神经元动态包括尖峰定时;以及
至少部分地基于对应于所述尖峰定时的目标函数来修改所述人工神经网络的神经元模型的参数以使得所述神经元模型的尖峰定时与所存储的原型神经元的尖峰定时相匹配。
2.如权利要求1所述的方法,其特征在于,所述参数基于所述神经元模型的期望功能性。
3.如权利要求1所述的方法,其特征在于,所述参数至少部分地基于对所述神经元模型的参数扫掠来修改。
4.如权利要求1所述的方法,其特征在于,所述目标函数使表示中的所需位数最小化。
5.如权利要求1所述的方法,其特征在于,所述目标函数降低模型复杂度。
6.一种人工神经网络,包括:
存储器单元;以及
耦合至所述存储器单元的至少一个处理器,所述至少一个处理器被配置成:
从原型神经元获取原型神经元动态,所述神经元动态包括尖峰定时;以及
至少部分地基于对应于所述尖峰定时的目标函数来修改所述人工神经网络的神经元模型的参数以使得所述神经元模型的尖峰定时与所述原型神经元的尖峰定时相匹配。
7.如权利要求6所述的人工神经网络,其特征在于,所述参数基于所述神经元模型的期望功能性。
8.如权利要求6所述的人工神经网络,其特征在于,所述至少一个处理器被进一步配置成至少部分地基于对所述神经元模型的参数扫掠来修改所述参数。
9.如权利要求6所述的人工神经网络,其特征在于,所述目标函数使表示中的所需位数最小化。
10.如权利要求6所述的人工神经网络,其特征在于,所述目标函数降低模型复杂度。
11.一种用于改进神经动态的设备,包括:
用于从原型神经元获取原型神经元动态的装置,所述神经元动态包括尖峰定时;以及
用于至少部分地基于对应于所述尖峰定时的目标函数来修改人工神经网络的神经元模型的参数以使得所述神经元模型的尖峰定时与所述原型神经元的尖峰定时相匹配的装置。
12.一种其上记录有程序代码的非瞬态计算机可读介质,所述程序代码包括:
用于从原型神经元获取原型神经元动态的程序代码,所述神经元动态包括至少尖峰定时;以及
用于至少部分地基于对应于所述尖峰定时的目标函数来修改人工神经网络的神经元模型的参数以使得所述神经元模型的尖峰定时与所述原型神经元的尖峰定时相匹配的程序代码。
CN201480054405.1A 2013-10-02 2014-08-21 用于修改神经动态的自动化方法 Active CN105637539B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361885950P 2013-10-02 2013-10-02
US61/885,950 2013-10-02
US14/066,599 US9305256B2 (en) 2013-10-02 2013-10-29 Automated method for modifying neural dynamics
US14/066,599 2013-10-29
PCT/US2014/052131 WO2015050641A2 (en) 2013-10-02 2014-08-21 Automated method for modifying neural dynamics

Publications (2)

Publication Number Publication Date
CN105637539A CN105637539A (zh) 2016-06-01
CN105637539B true CN105637539B (zh) 2018-03-27

Family

ID=52741128

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480054405.1A Active CN105637539B (zh) 2013-10-02 2014-08-21 用于修改神经动态的自动化方法

Country Status (8)

Country Link
US (1) US9305256B2 (zh)
EP (1) EP3053105A2 (zh)
JP (1) JP6092477B2 (zh)
KR (1) KR101700145B1 (zh)
CN (1) CN105637539B (zh)
BR (1) BR112016007313A2 (zh)
CA (1) CA2924048A1 (zh)
WO (1) WO2015050641A2 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10068170B2 (en) * 2013-09-23 2018-09-04 Oracle International Corporation Minimizing global error in an artificial neural network
WO2017068490A1 (en) * 2015-10-23 2017-04-27 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device and electronic device
EP3622447A1 (en) * 2017-05-08 2020-03-18 British Telecommunications Public Limited Company Interoperation of machine learning algorithms
US11216723B2 (en) * 2017-08-11 2022-01-04 Syntiant Pulse-width modulated multiplier
US11308382B2 (en) 2017-08-25 2022-04-19 International Business Machines Corporation Neuromorphic synapses
US10211856B1 (en) * 2017-10-12 2019-02-19 The Boeing Company Hardware scalable channelizer utilizing a neuromorphic approach
KR102249655B1 (ko) * 2018-12-19 2021-05-10 한양대학교 산학협력단 뉴런 및 이를 포함하는 뉴로모픽 시스템
KR102251765B1 (ko) * 2018-12-19 2021-05-14 한양대학교 산학협력단 뉴런 및 이를 포함하는 뉴로모픽 시스템
US20220343162A1 (en) * 2019-10-02 2022-10-27 Electronics And Telecommunications Research Institute Method for structure learning and model compression for deep neural network
US20220301688A1 (en) * 2019-10-09 2022-09-22 University Of Southrn California Geometric paradigm for nonlinear modeling and control of neural dynamics
KR102453336B1 (ko) * 2019-11-12 2022-10-12 한국전자기술연구원 스파이킹 뉴럴 네트워크를 위한 하이퍼 파라미터 최적화 방법과 장치 및 이를 이용한 연산 장치
CN111814973B (zh) * 2020-07-18 2022-06-21 福州大学 一种适用于神经常微分方程网络计算的存内计算系统
CN115939883A (zh) 2021-10-05 2023-04-07 泰科电子连接印度私有有限公司 用于增加拉出阻力的电缆保护盖

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1688872A2 (fr) * 2005-02-04 2006-08-09 Bernard Angeniol Outil informatique de prévision
CN101441728A (zh) * 2007-11-21 2009-05-27 新乡市起重机厂有限公司 起重机优化设计的神经网络方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5155843B2 (ja) * 2008-12-22 2013-03-06 シャープ株式会社 情報処理装置及びこれを用いたニューラルネットワーク回路
US8250010B2 (en) * 2009-05-21 2012-08-21 International Business Machines Corporation Electronic learning synapse with spike-timing dependent plasticity using unipolar memory-switching elements
US8346712B2 (en) 2009-11-24 2013-01-01 King Fahd University Of Petroleum And Minerals Method for identifying hammerstein models
US20120023051A1 (en) 2010-07-22 2012-01-26 Ramin Pishehvar Signal coding with adaptive neural network
US8473439B2 (en) * 2010-12-08 2013-06-25 International Business Machines Corporation Integrate and fire electronic neurons
US8706250B2 (en) 2010-12-23 2014-04-22 Boston Scientific Neuromodulation Corporation Neurostimulation system for implementing model-based estimate of neurostimulation effects
US9092735B2 (en) 2011-09-21 2015-07-28 Qualcomm Incorporated Method and apparatus for structural delay plasticity in spiking neural networks
US9111222B2 (en) * 2011-11-09 2015-08-18 Qualcomm Incorporated Method and apparatus for switching the binary state of a location in memory in a probabilistic manner to store synaptic weights of a neural network
US20130204814A1 (en) * 2012-02-08 2013-08-08 Qualcomm Incorporated Methods and apparatus for spiking neural computation

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1688872A2 (fr) * 2005-02-04 2006-08-09 Bernard Angeniol Outil informatique de prévision
CN101441728A (zh) * 2007-11-21 2009-05-27 新乡市起重机厂有限公司 起重机优化设计的神经网络方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Design exploration methodology for memristor-based spiking neuromorphic architectures with the Xnet event-driven simulator;O Bichler , D Roclin,C Gamrat,D Querlioz;《IEEE/ACM International Symposium on Nanoscale》;20120712;全文 *
Design study of efficient digital order-based STDP neuron implementations for extracting temporal features;D Roclin, O Bichler, C Gamrat,SJ Thorpe;《nternational Joint Conference on Neural Networks》;20130831;全文 *

Also Published As

Publication number Publication date
US9305256B2 (en) 2016-04-05
CN105637539A (zh) 2016-06-01
CA2924048A1 (en) 2015-04-09
BR112016007313A2 (pt) 2017-08-01
WO2015050641A3 (en) 2015-06-04
JP6092477B2 (ja) 2017-03-08
KR101700145B1 (ko) 2017-01-26
KR20160062052A (ko) 2016-06-01
JP2016536664A (ja) 2016-11-24
US20150095273A1 (en) 2015-04-02
EP3053105A2 (en) 2016-08-10
WO2015050641A2 (en) 2015-04-09

Similar Documents

Publication Publication Date Title
CN105637539B (zh) 用于修改神经动态的自动化方法
CN105229675B (zh) 尖峰网络的高效硬件实现
CN104781836B (zh) 分段线性神经元建模
CN106030620B (zh) 用于随机尖峰贝叶斯网络的基于事件的推断和学习
CN106030622B (zh) 原位神经网络协同处理
CN106663222A (zh) 神经网络中的分解卷积操作
CN107077637A (zh) 神经网络中的差分编码
US10339447B2 (en) Configuring sparse neuronal networks
CN105637541A (zh) 用于神经模拟器的共享存储器架构
CN105612492B (zh) 在人工神经系统中减少尖峰的方法、装置、设备及介质
CN105580031B (zh) 在多维范围上对包括可分离子系统的系统的评估
CN107077636A (zh) Cold神经元尖峰定时反向传播
CN106068519B (zh) 用于共用神经元模型的高效实现的方法和装置
CN105723383A (zh) 因果凸显性时间推断
WO2016018569A1 (en) Long short-term memory using a spiking neural network
CN105981055A (zh) 神经网络对当前计算资源的自适应
WO2015167765A2 (en) Temporal spike encoding for temporal learning
CN106133763B (zh) 可塑性突触管理
CN105659260B (zh) 动态地指派和检查突触延迟
CN106104585A (zh) 经由阈下调制的模拟信号重构和识别
CN106796667A (zh) 动态空间目标选择
WO2014172025A1 (en) Method for generating compact representations of spike timing-dependent plasticity curves
CN106030619A (zh) 用于坐标变换的相位编码
EP3117373A2 (en) Contextual real-time feedback for neuromorphic model development
CN106030621B (zh) 用于空间目标选择的失衡式交叉抑制性机制

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant