CN106030622B - 原位神经网络协同处理 - Google Patents
原位神经网络协同处理 Download PDFInfo
- Publication number
- CN106030622B CN106030622B CN201580009326.3A CN201580009326A CN106030622B CN 106030622 B CN106030622 B CN 106030622B CN 201580009326 A CN201580009326 A CN 201580009326A CN 106030622 B CN106030622 B CN 106030622B
- Authority
- CN
- China
- Prior art keywords
- neural network
- processing
- processing node
- core
- study
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/10—Interfaces, programming languages or software development kits, e.g. for simulating neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/061—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using biological neurons, e.g. biological neurons connected to an integrated circuit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Neurology (AREA)
- Microelectronics & Electronic Packaging (AREA)
- Image Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Image Processing (AREA)
- Feedback Control In General (AREA)
- Advance Control (AREA)
Abstract
一种用于在神经网络中执行协同处理的方法包括将该神经网络的一部分交换至第一处理节点达一时间段。该方法还包括用第一处理节点来执行神经网络的该部分。另外,该方法包括在该时间段之后将神经网络的该部分返回给第二处理节点。此外,该方法包括用第二处理节点来执行神经网络的该部分。
Description
相关申请的交叉引用
本申请要求于2014年2月21日提交且题为“IN SITU NEURAL NETWORK CO-PROCESSING(原位神经网络协同处理)”的美国临时专利申请No.61/943,155的权益,其公开内容通过援引全部明确纳入于此。
背景
领域
本公开的某些方面一般涉及神经系统工程,并且尤其涉及用于原位神经网络协同处理的系统和方法。
背景
可包括一群互连的人工神经元(即,神经元模型)的人工神经网络是一种计算设备或者表示将由计算设备执行的方法。人工神经网络可具有生物学神经网络中的对应的结构和/或功能。然而,人工神经网络可为其中传统计算技术是麻烦的、不切实际的、或不胜任的某些应用提供创新且有用的计算技术。由于人工神经网络能从观察中推断出功能,因此这样的网络在因任务或数据的复杂度使得通过常规技术来设计该功能较为麻烦的应用中是特别有用的。
概述
在本公开的一方面,公开了一种用于在神经网络中执行协同处理的方法。该方法包括将该神经网络的一部分交换至第一处理节点达一时间段。该方法还包括用第一处理节点来执行神经网络的该部分。另外,该方法包括在该时间段之后将神经网络的该部分返回给第二处理节点。该方法进一步包括用第二处理节点来执行神经网络的该部分。在本公开的另一方面,公开了一种用于在神经网络中执行协同处理的装置。该装置包括存储器以及耦合至该存储器的至少一个处理器。(诸)处理器被配置成将该神经网络的一部分交换至第一处理节点达一时间段。(诸)处理器还被配置成用第一处理节点来执行神经网络的该部分。另外,(诸)处理器被配置成在该时间段之后将神经网络的该部分返回给第二处理节点。(诸)处理器被进一步配置成用第二处理节点来执行神经网络的该部分。
在本公开的又一方面,公开了一种用于在神经网络中执行协同处理的设备。该设备具有用于将该神经网络的一部分交换至第一处理节点达一时间段的装置。该设备还具有用于用第一处理节点来执行神经网络的该部分的装置。另外,该设备具有用于在该时间段之后将神经网络的该部分返回给第二处理节点的装置。该设备进一步包括用于用第二处理节点来执行神经网络的该部分的装置。
在本公开的又一方面,公开了一种用于在神经网络中执行协同处理的计算机程序产品。该计算机程序产品包括其上编码有程序代码的非瞬态计算机可读介质。该程序代码包括用于将该神经网络的一部分交换至第一处理节点达一时间段的程序代码。该程序代码还包括用于用第一处理节点来执行神经网络的该部分的程序代码。另外,该程序代码包括用于在该时间段之后将神经网络的该部分返回给第二处理节点的程序代码。该程序代码进一步包括用于用第二处理节点来执行神经网络的该部分的程序代码。
这已较宽泛地勾勒出本公开的特征和技术优势以便下面的详细描述可以被更好地理解。本公开的附加特征和优点将在下文描述。本领域技术人员应该领会,本公开可容易地被用作修改或设计用于实施与本公开相同的目的的其他结构的基础。本领域技术人员还应认识到,这样的等效构造并不脱离所附权利要求中所阐述的本公开的教导。被认为是本公开的特性的新颖特征在其组织和操作方法两方面连同进一步的目的和优点在结合附图来考虑以下描述时将被更好地理解。然而,要清楚理解的是,提供每一幅附图均仅用于解说和描述目的,且无意作为对本公开的限定的定义。
附图简述
在结合附图理解下面阐述的详细描述时,本公开的特征、本质和优点将变得更加明显,在附图中,相同附图标记始终作相应标识。
图1解说了根据本公开的某些方面的示例神经元网络。
图2解说了根据本公开的某些方面的计算网络(神经系统或神经网络)的处理单元(神经元)的示例。
图3解说了根据本公开的某些方面的尖峰定时依赖可塑性(STDP)曲线的示例。
图4解说了根据本公开的某些方面的用于定义神经元模型的行为的正态相和负态相的示例。
图5解说了根据本公开的某些方面的使用通用处理器来设计神经网络的示例实现。
图6解说了根据本公开的某些方面的设计其中存储器可以与个体分布式处理单元对接的神经网络的示例实现。
图7解说了根据本公开的某些方面的基于分布式存储器和分布式处理单元来设计神经网络的示例实现。
图8解说了根据本公开的某些方面的神经网络的示例实现。
图9是解说根据本公开的各方面的神经网络的示例性架构的框图。
图10A-F是解说根据本公开的各方面的神经网络中的原位协同处理的示例性框图。
图11和12是解说根据本公开的各方面的用于在神经网络中执行协同处理的方法的框图。
详细描述
以下结合附图阐述的详细描述旨在作为各种配置的描述,而无意表示可实践本文中所描述的概念的仅有的配置。本详细描述包括具体细节以便提供对各种概念的透彻理解。然而,对于本领域技术人员将显而易见的是,没有这些具体细节也可实践这些概念。在一些实例中,以框图形式示出众所周知的结构和组件以避免湮没此类概念。
基于本教导,本领域技术人员应领会,本公开的范围旨在覆盖本公开的任何方面,不论其是与本公开的任何其他方面相独立地还是组合地实现的。例如,可以使用所阐述的任何数目的方面来实现装置或实践方法。另外,本公开的范围旨在覆盖使用作为所阐述的本公开的各个方面的补充或者与之不同的其他结构、功能性、或者结构及功能性来实践的此类装置或方法。应当理解,所披露的本公开的任何方面可由权利要求的一个或多个元素来实施。
措辞“示例性”在本文中用于表示“用作示例、实例或解说”。本文中描述为“示例性”的任何方面不必被解释为优于或胜过其他方面。
尽管本文描述了特定方面,但这些方面的众多变体和置换落在本公开的范围之内。虽然提到了优选方面的一些益处和优点,但本公开的范围并非旨在被限定于特定益处、用途或目标。相反,本公开的各方面旨在能宽泛地应用于不同的技术、系统配置、网络和协议,其中一些作为示例在附图以及以下对优选方面的描述中解说。详细描述和附图仅仅解说本公开而非限定本公开,本公开的范围由所附权利要求及其等效技术方案来定义。
示例神经系统、训练及操作
图1解说了根据本公开的某些方面的具有多级神经元的示例人工神经系统100。神经系统100可具有神经元级102,该神经元级102通过突触连接网络104(即,前馈连接)来连接到另一神经元级106。为简单起见,图1中仅解说了两级神经元,尽管神经系统中可存在更少或更多级神经元。应注意,一些神经元可通过侧向连接来连接至同层中的其他神经元。此外,一些神经元可通过反馈连接来后向连接至先前层中的神经元。
如图1所解说的,级102中的每一个神经元可以接收可由前级的神经元(未在图1中示出)生成的输入信号108。信号108可表示级102的神经元的输入电流。该电流可在神经元膜上累积以对膜电位进行充电。当膜电位达到其阈值时,该神经元可激发并生成输出尖峰,该输出尖峰将被传递到下一级神经元(例如,级106)。在一些建模办法中,神经元可以连续地向下一级神经元传递信号。该信号通常是膜电位的函数。此类行为可在硬件和/或软件(包括模拟和数字实现,诸如以下所述那些实现)中进行仿真或模拟。
在生物学神经元中,在神经元激发时生成的输出尖峰被称为动作电位。该电信号是相对迅速、瞬态的神经脉冲,其具有约为100mV的振幅和约为1ms的历时。在具有一系列连通的神经元(例如,尖峰从图1中的一级神经元传递至另一级神经元)的神经系统的特定实施例中,每个动作电位都具有基本上相同的振幅和历时,并且因此该信号中的信息可仅由尖峰的频率和数目、或尖峰的时间来表示,而不由振幅来表示。动作电位所携带的信息可由尖峰、发放了尖峰的神经元、以及该尖峰相对于一个或数个其他尖峰的时间来确定。尖峰的重要性可由向各神经元之间的连接所应用的权重来确定,如以下所解释的。
尖峰从一级神经元向另一级神经元的传递可通过突触连接(或简称“突触”)网络104来达成,如图1中所解说的。相对于突触104,级102的神经元可被视为突触前神经元,而级106的神经元可被视为突触后神经元。突触104可接收来自级102的神经元的输出信号(即,尖峰),并根据可调节突触权重来按比例缩放那些信号,其中P是级102的神经元与级106的神经元之间的突触连接的总数,并且i是神经元级的指示符。在图1的示例中,i表示神经元级102并且i+1表示神经元级106。此外,经按比例缩放的信号可被组合以作为级106中每个神经元的输入信号。级106中的每个神经元可基于对应的组合输入信号来生成输出尖峰110。可使用另一突触连接网络(图1中未示出)将这些输出尖峰110传递到另一级神经元。
生物学突触可以仲裁突触后神经元中的兴奋性或抑制性(超极化)动作,并且还可用于放大神经元信号。兴奋性信号使膜电位去极化(即,相对于静息电位增大膜电位)。如果在某个时间段内接收到足够的兴奋性信号以使膜电位去极化到高于阈值,则在突触后神经元中发生动作电位。相反,抑制性信号一般使膜电位超极化(即,降低膜电位)。抑制性信号如果足够强则可抵消掉兴奋性信号之和并阻止膜电位到达阈值。除了抵消掉突触兴奋以外,突触抑制还可对自发活跃神经元施加强力的控制。自发活跃神经元是指在没有进一步输入的情况下(例如,由于其动态或反馈而)发放尖峰的神经元。通过压制这些神经元中的动作电位的自发生成,突触抑制可对神经元中的激发模式进行定形,这一般被称为雕刻。取决于期望的行为,各种突触104可充当兴奋性或抑制性突触的任何组合。
神经系统100可由通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其他可编程逻辑器件(PLD)、分立的门或晶体管逻辑、分立的硬件组件、由处理器执行的软件模块、或其任何组合来仿真。神经系统100可用在大范围的应用中,诸如图像和模式识别、机器学习、电机控制、及类似应用等。神经系统100中的每一神经元可被实现为神经元电路。被充电至发起输出尖峰的阈值的神经元膜可被实现为例如对流经其的电流进行积分的电容器。
在一方面,电容器作为神经元电路的电流积分器件可被除去,并且可使用较小的忆阻器元件来替代它。这种办法可应用于神经元电路中,以及其中大容量电容器被用作电流积分器的各种其他应用中。另外,每个突触104可基于忆阻器元件来实现,其中突触权重变化可与忆阻器电阻的变化有关。使用纳米特征尺寸的忆阻器,可显著地减小神经元电路和突触的面积,这可使得实现大规模神经系统硬件实现更为切实可行。
对神经系统100进行仿真的神经处理器的功能性可取决于突触连接的权重,这些权重可控制神经元之间的连接的强度。突触权重可存储在非易失性存储器中以在掉电之后保留该处理器的功能性。在一方面,突触权重存储器可实现在与主神经处理器芯片分开的外部芯片上。突触权重存储器可与神经处理器芯片分开地封装成可更换的存储卡。这可向神经处理器提供多种多样的功能性,其中特定功能性可基于当前附连至神经处理器的存储卡中所存储的突触权重。
图2解说了根据本公开的某些方面的计算网络(例如,神经系统或神经网络)的处理单元(例如,神经元或神经元电路)202的示例性示图200。例如,神经元202可对应于来自图1的级102和106的任何神经元。神经元202可接收多个输入信号2041-204N,这些输入信号可以是该神经系统外部的信号、或是由同一神经系统的其他神经元所生成的信号、或这两者。输入信号可以是电流、电导、电压、实数值的和/或复数值的。输入信号可包括具有定点或浮点表示的数值。可通过突触连接将这些输入信号递送到神经元202,突触连接根据可调节突触权重2061-206N(W1-WN)对这些信号进行按比例缩放,其中N可以是神经元202的输入连接总数。
神经元202可组合这些经按比例缩放的输入信号,并且使用组合的经按比例缩放的输入来生成输出信号208(即,信号Y)。输出信号208可以是电流、电导、电压、实数值的和/或复数值的。输出信号可以是具有定点或浮点表示的数值。随后该输出信号208可作为输入信号传递至同一神经系统的其他神经元、或作为输入信号传递至同一神经元202、或作为该神经系统的输出来传递。
处理单元(神经元)202可由电路来仿真,并且其输入和输出连接可由具有突触电路的电连接来仿真。处理单元202及其输入和输出连接也可由软件代码来仿真。处理单元202还可由电路来仿真,而其输入和输出连接可由软件代码来仿真。在一方面,计算网络中的处理单元202可以是模拟电路。在另一方面,处理单元202可以是数字电路。在又一方面,处理单元202可以是具有模拟和数字组件两者的混合信号电路。计算网络可包括任何前述形式的处理单元。使用这样的处理单元的计算网络(神经系统或神经网络)可用在大范围的应用中,诸如图像和模式识别、机器学习、电机控制、及类似应用等。
在神经网络的训练过程期间,突触权重(例如,来自图1的权重 和/或来自图2的权重2061-206N)可用随机值来初始化并根据学习规则而被增大或减小。本领域技术人员将领会,学习规则的示例包括但不限于尖峰定时依赖可塑性(STDP)学习规则、Hebb规则、Oja规则、Bienenstock-Copper-Munro(BCM)规则等。在一些方面,这些权重可稳定或收敛至两个值(即,权重的双峰分布)之一。该效应可被用于减少每个突触权重的位数、提高从/向存储突触权重的存储器读取和写入的速度、以及降低突触存储器的功率和/或处理器消耗。
突触类型
在神经网络的硬件和软件模型中,突触相关功能的处理可基于突触类型。突触类型可以是非可塑突触(权重和延迟没有改变)、可塑突触(权重可改变)、结构化延迟可塑突触(权重和延迟可改变)、全可塑突触(权重、延迟和连通性可改变)、以及基于此的变型(例如,延迟可改变,但在权重或连通性方面没有改变)。多种类型的优点在于处理可以被细分。例如,非可塑突触可以不涉及可塑性功能的执行(或等待此类功能完成)。类似地,延迟和权重可塑性可被细分成可一起或分开地、顺序地或并行地运作的操作。不同类型的突触对于适用的每一种不同的可塑性类型可具有不同的查找表或公式以及参数。因此,这些方法将针对该突触的类型来访问相关的表、公式或参数。
还进一步牵涉到以下事实:尖峰定时依赖型结构化可塑性可独立于突触可塑性地来执行。结构化可塑性即使在权重幅值没有改变的情况下(例如,如果权重已达最小或最大值、或者其由于某种其他原因而不被改变)也可被执行,因为结构化可塑性(即,延迟改变的量)可以是pre-post(前-后)尖峰时间差的直接函数。替换地,结构化可塑性可被设为权重变化量的函数或者可基于与权重或权重变化的界限有关的条件来设置。例如,突触延迟可仅在权重变化发生时或者在权重到达0的情况下才改变,但在这些权重为最大值时则不改变。然而,具有独立函数以使得这些过程能被并行化从而减少存储器访问的次数和交叠可能是有利的。
突触可塑性的确定
神经元可塑性(或简称“可塑性”)是大脑中的神经元和神经网络响应于新的信息、感官刺激、发展、损坏、或机能障碍而改变其突触连接和行为的能力。可塑性对于生物学中的学习和记忆、以及对于计算神经元科学和神经网络是重要的。已经研究了各种形式的可塑性,诸如突触可塑性(例如,根据Hebbian理论)、尖峰定时依赖可塑性(STDP)、非突触可塑性、活跃性依赖可塑性、结构化可塑性和自稳态可塑性。
STDP是调节神经元之间的突触连接的强度的学习过程。连接强度是基于特定神经元的输出与收到输入尖峰(即,动作电位)的相对定时来调节的。在STDP过程下,如果至某个神经元的输入尖峰平均而言倾向于紧挨在该神经元的输出尖峰之前发生,则可发生长期增强(LTP)。于是使得该特定输入在一定程度上更强。另一方面,如果输入尖峰平均而言倾向于紧接在输出尖峰之后发生,则可发生长期抑压(LTD)。于是使得该特定输入在一定程度上更弱,并由此得名“尖峰定时依赖可塑性”。因此,使得可能是突触后神经元兴奋原因的输入甚至在将来作出贡献的可能性更大,而使得不是突触后尖峰的原因的输入在将来作出贡献的可能性更小。该过程继续,直至初始连接集合的子集保留,而所有其他连接的影响减小至无关紧要的水平。
由于神经元一般在其许多输入都在一短时段内发生(即,累积性足以引起输出)时产生输出尖峰,因此通常保留下来的输入子集包括倾向于在时间上相关的那些输入。另外,由于在输出尖峰之前发生的输入被加强,因此提供对相关性的最早充分累积性指示的那些输入将最终变成至该神经元的最后输入。
STDP学习规则可因变于突触前神经元的尖峰时间tpre与突触后神经元的尖峰时间tpost之间的时间差(即,t=tpost-tpre)来有效地适配将该突触前神经元连接到该突触后神经元的突触的突触权重。STDP的典型公式化是若该时间差为正(突触前神经元在突触后神经元之前激发)则增大突触权重(即,增强该突触),以及若该时间差为负(突触后神经元在突触前神经元之前激发)则减小突触权重(即,抑压该突触)。
在STDP过程中,突触权重随时间推移的改变可通常使用指数式衰退来达成,如由下式给出的:
其中k+和分别是针对正和负时间差的时间常数,a+和a-是对应的比例缩放幅值,并且μ是可应用于正时间差和/或负时间差的偏移。
图3解说了根据STDP,突触权重作为突触前(presynaptic)和突触后(postsynaptic)尖峰的相对定时的函数而改变的示例性示图300。如果突触前神经元在突触后神经元之前激发,则对应的突触权重可被增大,如曲线图300的部分302中所解说的。该权重增大可被称为该突触的LTP。从曲线图部分302可观察到,LTP的量可因变于突触前和突触后尖峰时间之差而大致呈指数式地下降。相反的激发次序可减小突触权重,如曲线图300的部分304中所解说的,从而导致该突触的LTD。
如图3中的曲线图300中所解说的,可向STDP曲线图的LTP(因果性)部分302应用负偏移μ。x轴的交越点306(y=0)可被配置成与最大时间滞后重合以考虑到来自层i-1的各因果性输入的相关性。在基于帧的输入(即,呈特定历时的包括尖峰或脉冲的帧的形式的输入)的情形中,可计算偏移值μ以反映帧边界。该帧中的第一输入尖峰(脉冲)可被视为要么如直接由突触后电位所建模地随时间衰退,要么在对神经状态的影响的意义上随时间衰退。如果该帧中的第二输入尖峰(脉冲)被视为与特定时间帧相关或有关,则该帧之前和之后的有关时间可通过使STDP曲线的一个或多个部分偏移以使得这些有关时间中的值可以不同(例如,对于大于一个帧为负,而对于小于一个帧为正)来在该时间帧边界处被分开并在可塑性意义上被不同地对待。例如,负偏移μ可被设为偏移LTP以使得曲线实际上在大于帧时间的pre-post时间处变得低于零并且它由此为LTD而非LTP的一部分。
神经元模型及操作
存在一些用于设计有用的尖峰发放神经元模型的一般原理。良好的神经元模型在以下两个计算态相(regime)方面可具有丰富的潜在行为:重合性检测和功能性计算。此外,良好的神经元模型应当具有允许时间编码的两个要素:输入的抵达时间影响输出时间,以及重合性检测能具有窄时间窗。最后,为了在计算上是有吸引力的,良好的神经元模型在连续时间上可具有闭合形式解,并且具有稳定的行为,包括在靠近吸引子和鞍点之处。换言之,有用的神经元模型是可实践且可建模丰富的、现实的且生物学一致的行为并且允许对神经电路进行工程设计和反向工程设计两者的神经元模型。
神经元模型可取决于事件,诸如输入抵达、输出尖峰或其他事件,无论这些事件是内部的还是外部的。为了达成丰富的行为库,能展现复杂行为的状态机可能是期望的。如果事件本身的发生在撇开输入贡献(若有)的情况下能影响状态机并约束该事件之后的动态,则该系统的将来状态并非仅是状态和输入的函数,而是状态、事件和输入的函数。
在一方面,神经元n可被建模为尖峰带漏泄积分激发神经元,其膜电压vn(t)由以下动态来支配:
其中α和β是参数,wm,n是将突触前神经元m连接至突触后神经元n的突触的突触权重,以及ym(t)是神经元m的尖峰发放输出,其可根据△tm,n被延迟达树突或轴突延迟才抵达神经元n的胞体。
应注意,从建立了对突触后神经元的充分输入的时间直至该突触后神经元实际上激发的时间存在延迟。在动态尖峰发放神经元模型(诸如Izhikevich简单模型)中,如果在去极化阈值vt与峰值尖峰电压vpeak之间有差量,则可引发时间延迟。例如,在该简单模型中,神经元胞体动态可由关于电压和恢复的微分方程对来支配,即:
其中v是膜电位,u是膜恢复变量,k是描述膜电位v的时间尺度的参数,a是描述恢复变量u的时间尺度的参数,b是描述恢复变量u对膜电位v的阈下波动的敏感度的参数,vr是膜静息电位,I是突触电流,以及C是膜的电容。根据该模型,神经元被定义为在v>vpeak时发放尖峰。
Hunzinger Cold模型
Hunzinger Cold神经元模型是能再现丰富多样的各种神经行为的最小双态相尖峰发放线性动态模型。该模型的一维或二维线性动态可具有两个态相,其中时间常数(以及耦合)可取决于态相。在阈下态相中,时间常数(按照惯例为负)表示漏泄通道动态,其一般作用于以生物学一致的线性方式使细胞返回到静息。阈上态相中的时间常数(按照惯例为正)反映抗漏泄通道动态,其一般驱动细胞发放尖峰,而同时在尖峰生成中引发等待时间。
如图4中所解说的,该模型400的动态可被划分成两个(或更多个)态相。这些态相可被称为负态相402(也可互换地称为带漏泄积分激发(LIF)态相,勿与LIF神经元模型混淆)以及正态相404(也可互换地称为抗漏泄积分激发(ALIF)态相,勿与ALIF神经元模型混淆)。在负态相402中,状态在将来事件的时间趋向于静息(v-)。在该负态相中,该模型一般展现出时间输入检测性质及其他阈下行为。在正态相404中,状态趋向于尖峰发放事件(vs)。在该正态相中,该模型展现出计算性质,诸如取决于后续输入事件而引发发放尖峰的等待时间。在事件方面对动态进行公式化以及将动态分成这两个态相是该模型的基础特性。
线性双态相二维动态(对于状态v和u)可按照惯例定义为:
其中qρ和r是用于耦合的线性变换变量。
符号ρ在本文中用于标示动态态相,在讨论或表达具体态相的关系时,按照惯例对于负态相和正态相分别用符号“-”或“+”来替换符号ρ。
模型状态由膜电位(电压)v和恢复电流u来定义。在基本形式中,态相在本质上是由模型状态来决定的。该精确和通用的定义存在一些细微却重要的方面,但目前考虑该模型在电压v高于阈值(v+)的情况下处于正态相404中,否则处于负态相402中。
态相相关时间常数包括负态相时间常数τ-和正态相时间常数τ+。恢复电流时间常数τu通常是与态相无关的。出于方便起见,负态相时间常数τ-通常被指定为反映衰退的负量,从而用于电压演变的相同表达式可用于正态相,在正态相中指数和τ+将一般为正,正如τu那样。
这两个状态元素的动态可在发生事件之际通过使状态偏离其零倾线(null-cline)的变换来耦合,其中变换变量为:
qρ=-τρβu-vρ (7)
r=δ(v+ε) (8)
其中δ、ε、β和v-、v+是参数。vρ的两个值是这两个态相的参考电压的基数。参数v-是负态相的基电压,并且膜电位在负态相中一般将朝向v-衰退。参数v+是正态相的基电压,并且膜电位在正态相中一般将趋向于背离v+。
v和u的零倾线分别由变换变量qρ和r的负数给出。参数δ是控制u零倾线的斜率的比例缩放因子。参数ε通常被设为等于-v-。参数β是控制这两个态相中的v零倾线的斜率的电阻值。τρ时间常数参数不仅控制指数式衰退,还单独地控制每个态相中的零倾线斜率。
该模型可被定义为在电压v达到值vS时发放尖峰。随后,状态可在发生复位事件(其可以与尖峰事件完全相同)之际被复位:
u=u+△u (10)
其中和△u是参数。复位电压通常被设为v-。
依照瞬时耦合的原理,闭合形式解不仅对于状态是可能的(且具有单个指数项),而且对于到达特定状态的时间也是可能的。闭合形式状态解为:
因此,模型状态可仅在发生事件之际被更新,诸如在输入(突触前尖峰)或输出(突触后尖峰)之际被更新。还可在任何特定时间(无论是否有输入或输出)执行操作。
而且,依照瞬时耦合原理,突触后尖峰的时间可被预计,因此到达特定状态的时间可提前被确定而无需迭代技术或数值方法(例如,欧拉数值方法)。给定了先前电压状态v0,直至到达电压状态vf之前的时间延迟由下式给出:
如果尖峰被定义为发生在电压状态v到达vS的时间,则从电压处于给定状态v的时间起测量的直至发生尖峰前的时间量或即相对延迟的闭合形式解为:
其中通常被设为参数v+,但其他变型可以是可能的。
模型动态的以上定义取决于该模型是在正态相还是负态相中。如所提及的,耦合和态相ρ可基于事件来计算。出于状态传播的目的,态相和耦合(变换)变量可基于在上一(先前)事件的时间的状态来定义。出于随后预计尖峰输出时间的目的,态相和耦合变量可基于在下一(当前)事件的时间的状态来定义。
存在对该Cold模型、以及在时间上执行模拟、仿真、或建模的若干可能实现。这包括例如事件-更新、步阶-事件更新、以及步阶-更新模式。事件更新是其中基于事件或“事件更新”(在特定时刻)来更新状态的更新。步阶更新是以间隔(例如,1ms)来更新模型的更新。这不一定涉及迭代方法或数值方法。通过仅在事件发生于步阶处或步阶间的情况下才更新模型或即通过“步阶-事件”更新,基于事件的实现以有限的时间分辨率在基于步阶的模拟器中实现也是可能的。
原位神经网络协同处理
本公开的各方面涉及神经网络模拟器,并且尤其涉及原位神经协同处理。
通常,神经网络模拟器在灵活性与性能(例如,模拟器的功率)之间作出折衷。例如,设计者可能往往被迫在创建使得能够实现学习、运行得较快、或消耗较少功率的芯片之间作出决定。由此,当学习被离线地实现时,在不支持学习的模拟器上实现的经训练神经网络可能不会经历与在支持学习的模拟器上实现的网络相同的输入。这可能是因为与学习相关联的网络的实时改变可能会影响神经网络的环境(经由与该神经网络相关联的受动器),该环境可能进而经由表示环境并且向网络提供输入的传感器来影响至该神经网络的输入。神经网络的环境还可指示下游神经网络,该下游神经网络可能同样通过反馈连接或非本地信号来导致该神经网络的改变。
根据本公开的各方面,多个模拟平台可被组合,以使得可在模拟器的正常操作期间作出折衷。例如,不利用学习的模拟可以在不提供此特征的模拟平台上运行。这可以是有益的,例如在第二模拟平台比第一模拟平台消耗更少功率时。
在本公开的一些方面,可以提供可彼此交换的神经协同处理器。在一些方面,神经协同处理器可以是具有有差别特征的神经处理单元或节点。例如,一个神经处理节点可被配置成执行学习操作,而另一处理核被配置有静态权重。
在一个示例性方面,特征较多的核(即,具有较多特征的核(例如,存储器或处理器))可接管或纳入特征较少的核(即,具有较少特征的核)的功能。功能的纳入可以按处理节点的“热交换”的形式进行。通过进行此“热交换”,可以增强灵活性和性能。
图5解说根据本公开的某些方面的前述使用通用处理器502来在神经网络中执行协同处理的示例实现500。与计算网络(神经网络)相关联的变量(神经信号)、突触权重、系统参数,延迟,频率槽信息,性能度量以及系统状态信息可被存储在存储器块504中,而在通用处理器502处执行的指令可从程序存储器506中加载。在本公开的一方面,加载到通用处理器502中的指令可包括用于将神经网络的一部分交换至第一处理节点达一时间段,用第一处理节点来执行神经网络的该部分,在该时间段之后将神经网络的该部分返回给第二处理节点,和/或用第二处理节点来执行神经网络的该部分的代码。
图6解说了根据本公开的某些方面的前述在神经网络中执行协同处理的示例实现600,其中存储器602可以经由互连网络604与计算网络(神经网络)的个体(分布式)处理单元(神经处理器)606对接。与计算网络(神经网络)相关联的变量(神经信号)、突触权重、系统参数,延迟,频率槽信息,性能度量和系统状态信息可被存储在存储器602中,并且可从存储器602经由互连网络604的连接被加载到每个处理单元(神经处理器)606中。在本公开的一方面,处理单元606可被配置成将神经网络的一部分交换至第一处理节点达一时间段,用第一处理节点来执行神经网络的该部分,在该时间段之后将神经网络的该部分返回给第二处理节点,和/或用第二处理节点来执行神经网络的该部分。
图7解说了前述在神经网络中执行协同处理的示例实现700。如图7中所解说的,一个存储器组702可与计算网络(神经网络)的一个处理单元704直接对接。每一个存储器组702可存储与对应的处理单元(神经处理器)704相关联的变量(神经信号)、突触权重、和/或系统参数,延迟,频率槽信息,性能度量和系统状态信息。在本公开的一方面,处理单元704可被配置成将神经网络的一部分交换至第一处理节点达一时间段,用第一处理节点来执行神经网络的该部分,在该时间段之后将神经网络的该部分返回给第二处理节点,和/或用第二处理节点来执行神经网络的该部分。
图8解说根据本公开的某些方面的神经网络800的示例实现。如图8中所解说的,神经网络800可具有多个局部处理单元802,它们可执行本文所描述的方法的各种操作。每个局部处理单元802可包括存储该神经网络的参数的局部状态存储器804和局部参数存储器806。另外,局部处理单元802可具有用于存储局部模型程序的局部(神经元)模型程序(LMP)存储器808、用于存储局部学习程序的局部学习程序(LLP)存储器810、以及局部连接存储器812。此外,如图8中所解说的,每个局部处理单元802可与用于提供对局部处理单元的局部存储器的配置的配置处理单元814对接,并且与提供各局部处理单元802之间的路由的路由连接处理元件816对接。
在一种配置中,神经元模型被配置成用于将神经网络的一部分交换至第一处理节点达一时间段,用第一处理节点来执行神经网络的该部分,在该时间段之后将神经网络的该部分返回给第二处理节点,和/或用第二处理节点来执行神经网络的该部分。该神经元模型包括交换装置、用于用第一处理节点来执行神经网络的该部分的装置、返回装置、以及用于用第二处理节点来执行神经网络的该部分的装置。在一个方面,交换装置、用于用第一处理节点来执行神经网络的该部分的装置、返回装置、和/或用于用第二处理节点来处理神经网络的该部分的装置可以是被配置成执行所叙述的功能的通用处理器502、程序存储器506、存储器块504、存储器602、互连网络604、处理单元606、处理单元704、局部处理单元802、和/或路由连接处理单元816。在另一种配置中,前述装置可以是被配置成执行由前述装置所叙述的功能的任何模块或任何装置。
在另一配置中,神经元模型被配置成通过初始在第一处理核处执行神经网络的一部分和/或将神经网络的该部分移至第二处理核以供进一步执行来协同定位离线学习。该神经元模型包括协同定位装置和移动装置。在一个方面,协同定位装置和/或移动装置可以是被配置成执行所叙述的功能的通用处理器502、程序存储器506、存储器块504、存储器602、互连网络604、处理单元606、处理单元704、局部处理单元802、和/或路由连接处理单元816。在另一种配置中,前述装置可以是被配置成执行由前述装置所叙述的功能的任何模块或任何装置。
根据本公开的某些方面,每个局部处理单元802可被配置成基于神经网络的一个或多个期望功能性特征来确定神经网络的参数,以及随着所确定的参数被进一步适配、调谐和更新来使这一个或多个功能性特征朝着期望的功能性特征发展。
图9是解说根据本公开的各方面的神经网络的示例性架构900的框图。架构900可包括协同处理器904,该协同处理器904可包括处理节点A 906和处理节点B 908。在一些方面,处理节点A 906和处理节点B 908可以被包括在相同的硬件核内。然而,这仅是示例性的,并且处理节点A 906和处理节点B 908可替换地在分开的硬件核中提供。
处理节点A 906和处理节点B 908可被有差别地配置。即,在一些方面,处理节点A906和处理节点B 908可具有适于高效地执行神经网络的功能特征的不同配置。在一些配置中,处理节点A 906可被配置有比处理节点B更大的资源。例如,处理节点A 906可被配置有比处理节点B 908更快和/或更大的处理能力(例如,多个处理器或更快的处理速度)。在第二示例中,处理节点B 908可被配置有更多和/或更快的存储器。
处理节点A 906和处理节点B 908可被配置成经由输入节点902来接收输入。处理节点A 906和处理节点B 908还可被配置成向输出节点910提供输出。输入902和输出910可包括传感器、致动器、以及其他输入/输出设备。
另外,处理节点A 906和处理节点B 908可被通信地彼此耦合以使得能在处理节点之间实现对神经网络的执行中的功能特征的热交换。即,在运行时间期间,具有较多特征的处理节点(例如,906、908)可纳入或者接管处理具有较少特征的核的功能。
在一些方面,处理节点A 906的状态可被复制并且经由通信路径912或任何其他通信路径提供给处理节点B 908。处理节点A 906的状态可以例如包括状态变量、连通性信息、以及其他状态信息。
处理节点B 908的资源可被分配用于从处理节点A 906接管对神经网络的功能特征的处理。另外,经由输入节点902提供的输入可被路由至处理节点B 908。基于来自处理节点A 906的状态信息以及这些输入,处理节点B 908可接管处理先前在由处理节点A 906处理的神经网络的功能特征。
在一些方面,处理节点A 906可继续经由输入节点902接收被提供给处理节点B908的相同输入。由此,处理节点A 906的输出可与处理节点B 908的输出进行比较以提供一致性检查。在一个示例中,处理节点B 908可被配置为调试核以标识和减少处理节点A 906中的缺陷或瑕疵。在本公开的其他方面,处理节点A 906可处理神经网络的其他功能特征。
处理节点B 908可继续处理神经网络的从处理节点A 906纳入的该部分达预定时间段或者在一些方面直至特定任务或任务集合完成。例如,处理节点B 908可被配置成实现学习并且可继续处理神经网络的从处理节点A 906纳入的该部分直至达成学习。在另一示例中,处理节点B 908可被配置成实现尖峰定时依赖可塑性。由此,处理节点B可处理所接收到的状态信息并且应用可塑性规则直至状态信息的更新(例如,权重更新)被确定。
在一些方面,特征较多的处理节点(例如,906、908)可基于系统性能度量来接管处理。例如,特征较多的处理节点可在特征较少的处理节点的系统性能低于阈值水平时纳入处理。在其他方面,可在电源被施加于系统时执行交换。当然,这些仅是示例性基础,并且其他系统和网络性能度量可提供用于将处理从特征较少的处理节点交换至特征较多的处理节点的基础。
在任务完成或者时间段期满之际,处理节点B 908的状态可被复制并且被提供给处理节点A 906作为经修改的核。在一些方面,神经网络的一部分的返回可基于系统性能度量来执行。例如,当系统性能高于阈值时,处理节点B 908的状态可被复制并且被提供给处理节点A 906。在第二示例中,返回可在电源被施加于系统(例如,系统插上电源)时发生。在一些方面,经由输入节点902提供的输入可被路由至处理节点A 906以使用包括来自处理节点B 908的状态信息的经修改的核来继续处理该神经网络的功能特征。
图10A-F是解说根据本公开的各方面的神经网络中的原位协同处理的示例性框图1000。每一个示例性框图示出包括静态核1008和学习核1006的协同处理器1004。静态核1008可被配置有用于执行与操作神经网络或其一部分相关联的功能的静态权重。学习核1006可被配置成实现学习和执行学习操作。例如,在一些方面,学习核1006可被配置成实现增强学习或其他学习模型。
在一些方面,学习核1006可被配置有比静态核1008更大的资源。例如,学习核1006可被配置有比静态核1008更快和/或更多的处理能力(例如,多个处理器或更快的处理速度)。在另一示例中,学习核1006可被配置有与静态核1008不同的存储器资源(例如,更多和/或更快的存储器)。不同类型的存储器资源可以例如使得能够实现关于参数(例如,权重)的更大(或更小)精度或提供用于捕捉尖峰历史的更多资源、使得能够实现对学习规则的访问、以及实现尖峰定时依赖可塑性和/或比特分配。当然,与处理和性能相关的这些特征仅是示例性的,并且与处理和性能相关的其他特征或者增强可以被有差别地包括在学习核1006和静态核1008中。
尽管图10A-F中所包括的每个框图仅示出了一个静态核1008和学习核1006,但是这仅是示例性的并且是出于便于解说的目的。取而代之的是,例如,出于设计效率的目的,可以包括任何数目的静态核1008和学习核1006。此外,静态核1008和学习核1006可以被包括在相同的处理核内或者可替换地在分开的处理核中提供。
静态核1008和学习核1006可选择性地经由输入节点1002接收输入并且向输出节点1010提供输出。在一些方面,静态核1008和学习核1006两者均可经由输入节点1002接收输入。同样,静态核1008和学习核1006两者均可向输出节点1010提供输出以使得能够实现一致性检查或处理验证。
在图10A中,来自输入节点1002的输入被提供给静态核1008而不是学习核1006。在此示例性方面,神经网络的操作可被流水线化以经由静态核1008来执行。在一些方面,可以不实现学习。
在图10B中,静态核1008的状态信息可被复制并且经由通信路径1012提供给学习核1006。该状态信息可以例如包括神经元状态变量、突触状态信息、连通性信息(例如,图或表)、以及权重信息。
在图10C中,经由输入节点1002的输入可被路由至学习核1006。在一些方面,输入可仅被提供给学习核1006。当然,输入可替换地被提供学习核1006和静态核1008两者。在此配置中,例如,可以执行验证技术以确保来自静态核1008和学习核1006的输出是一致的(例如,相等的)。
在图10D中,学习核1006纳入或接管处理与曾由静态核1008执行的神经网络(或其一部分)相关联的功能。学习核1006可接管处理达预定义时间段或者在特定任务或功能的执行期间接管处理。例如,在一些方面,学习核1006可从特征较少的静态核1008接管处理以实现STDP或学习模型(诸如结合神经网络或其部分的强化学习)。
在另一示例中,神经网络的由学习核1006纳入处理的部分可以是深度置信网络的层。深度置信网络是由多层随机潜伏变量构成的概率生成模型。在深度置信网络中,学习可例如以自顶向下的方式逐层实现。
学习可在线或离线地实现。当进行离线学习时,学习核1006的输入(例如,1002)和输出(例如,1010)可包括神经网络的其他层。此外,学习核1006的输入(例如,1002)和输出(例如,1010)还可包括传感器、致动器等。
在一些方面,静态核1008可继续接收输入。例如,静态核1008可作为监督核来操作以使得能够实现受监督学习。由此,静态核1008的输出可训练学习核1006。在其他方面,静态核1008可继续接收输入并且可被指派以执行与神经网络或其一部分的操作相关联的其他任务。在又一些方面,静态核1008可停止接收输入。
在图10E中,在预定义时间段期满之后或者在任务或所执行的功能完成(例如,达成学习)之际,学习核1006可发起将处理控制返回给静态核1008。学习核1006的状态信息可被复制并且经由通信路径1012被提供给静态核1008。在一些方面,学习核1006的状态信息可包括静态核1008的不同实例。例如,该不同实例可以是基于所达成的学习来增强的经修改静态核1008。在另一示例中,经修改静态核1008可包括基于STDP规则的实现对静态权重的更新。
在图10F中,学习核1006将控制返回给静态核1008以基于来自学习核1006的状态信息来继续执行与神经网络或其一部分的操作相关联的功能。
图11解说了用于在神经网络中执行协同处理的方法1100。在框1102,神经元模型将神经网络的一部分交换至第一处理节点达一时间段。在框1104,神经元模型用第一处理节点来执行神经网络的该部分。在框1106,神经元模型在该时间段之后将神经网络的该部分返回给第二处理节点。此外,在框1108,神经元模型用第二处理节点来执行神经网络的该部分。
图12解说了用于在神经网络中执行协同处理的方法1200。在框1202,神经元模型通过初始在第一处理核处执行神经网络的一部分来对离线学习进行协同定位。在框1204,神经元模型将神经网络的该部分移至第二处理核以供进一步执行。
以上所描述的方法的各种操作可由能够执行相应功能的任何合适的装置来执行。这些装置可包括各种硬件和/或软件组件和/或模块,包括但不限于电路、专用集成电路(ASIC)、或处理器。一般而言,在附图中有解说的操作的场合,那些操作可具有带相似编号的相应配对装置加功能组件。
如本文所使用的,术语“确定”涵盖各种各样的动作。例如,“确定”可包括演算、计算、处理、推导、研究、查找(例如,在表、数据库或其他数据结构中查找)、探知及诸如此类。另外,“确定”可包括接收(例如接收信息)、访问(例如访问存储器中的数据)、及类似动作。而且,“确定”可包括解析、选择、选取、确立及类似动作。
如本文所使用的,引述一列项目中的“至少一个”的短语是指这些项目的任何组合,包括单个成员。作为示例,“a、b或c中的至少一个”旨在涵盖:a、b、c、a-b、a-c、b-c、以及a-b-c。
结合本公开和附录A所描述的各种解说性逻辑框、模块、以及电路可用设计成执行本文所描述功能的通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列信号(FPGA)或其他可编程逻辑器件(PLD)、分立的门或晶体管逻辑、分立的硬件组件或其任何组合来实现或执行。通用处理器可以是微处理器,但在替换方案中,处理器可以是任何市售的处理器、控制器、微控制器、或状态机。处理器还可以被实现为计算设备的组合,例如DSP与微处理器的组合、多个微处理器、与DSP核心协同的一个或多个微处理器、或任何其它此类配置。
结合本公开和附录A描述的方法或算法的步骤可直接在硬件中、在由处理器执行的软件模块中、或在这两者的组合中实施。软件模块可驻留在本领域所知的任何形式的存储介质中。可使用的存储介质的一些示例包括随机存取存储器(RAM)、只读存储器(ROM)、闪存、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、寄存器、硬盘、可移动盘、CD-ROM,等等。软件模块可包括单条指令、或许多条指令,且可分布在若干不同的代码段上,分布在不同的程序间以及跨多个存储介质分布。存储介质可被耦合到处理器以使得该处理器能从/向该存储介质读写信息。在替换方案中,存储介质可以被整合到处理器。
本文所公开的方法包括用于实现所描述的方法的一个或多个步骤或动作。这些方法步骤和/或动作可以彼此互换而不会脱离权利要求的范围。换言之,除非指定了步骤或动作的特定次序,否则具体步骤和/或动作的次序和/或使用可以改动而不会脱离权利要求的范围。
本文中所描述的功能可以在硬件、软件、固件、或其任何组合中实现。如果以硬件实现,则示例硬件配置可包括设备中的处理系统。处理系统可以用总线架构来实现。取决于处理系统的具体应用和整体设计约束,总线可包括任何数目的互连总线和桥接器。总线可将包括处理器、机器可读介质、以及总线接口的各种电路链接在一起。总线接口可尤其将网络适配器等经由总线连接至处理系统。网络适配器可实现信号处理功能。对于某些方面,用户接口(例如,按键板、显示器、鼠标、操纵杆,等等)也可以被连接到总线。总线还可以链接各种其他电路,诸如定时源、外围设备、稳压器、功率管理电路以及类似电路,它们在本领域中是众所周知的,因此将不再进一步描述。
处理器可负责管理总线和一般处理,包括执行存储在机器可读介质上的软件。处理器可用一个或多个通用和/或专用处理器来实现。示例包括微处理器、微控制器、DSP处理器、以及其他能执行软件的电路系统。软件应当被宽泛地解释成意指指令、数据、或其任何组合,无论是被称作软件、固件、中间件、微代码、硬件描述语言、或其他。作为示例,机器可读介质可包括随机存取存储器(RAM)、闪存、只读存储器(ROM)、可编程只读存储器(PROM)、可擦式可编程只读存储器(EPROM)、电可擦式可编程只读存储器(EEPROM)、寄存器、磁盘、光盘、硬驱动器、或者任何其他合适的存储介质、或其任何组合。机器可读介质可被实施在计算机程序产品中。该计算机程序产品可以包括包装材料。
在硬件实现中,机器可读介质可以是处理系统中与处理器分开的一部分。然而,如本领域技术人员将容易领会的,机器可读介质或其任何部分可在处理系统外部。作为示例,机器可读介质可包括传输线、由数据调制的载波、和/或与设备分开的计算机产品,所有这些都可由处理器通过总线接口来访问。替换地或补充地,机器可读介质或其任何部分可被集成到处理器中,诸如高速缓存和/或通用寄存器文件可能就是这种情形。虽然所讨论的各种组件可被描述为具有特定位置,诸如局部组件,但它们也可按各种方式来配置,诸如某些组件被配置成分布式计算系统的一部分。
处理系统可以被配置为通用处理系统,该通用处理系统具有一个或多个提供处理器功能性的微处理器、以及提供机器可读介质中的至少一部分的外部存储器,它们都通过外部总线架构与其他支持电路系统链接在一起。替换地,该处理系统可以包括一个或多个神经元形态处理器以用于实现本文所述的神经元模型和神经系统模型。作为另一替换方案,处理系统可以用带有集成在单块芯片中的处理器、总线接口、用户接口、支持电路系统、和至少一部分机器可读介质的专用集成电路(ASIC)来实现,或者用一个或多个现场可编程门阵列(FPGA)、可编程逻辑器件(PLD)、控制器、状态机、门控逻辑、分立硬件组件、或者任何其他合适的电路系统、或者能执行本公开通篇所描述的各种功能性的电路的任何组合来实现。取决于具体应用和加诸于整体系统上的总设计约束,本领域技术人员将认识到如何最佳地实现关于处理系统所描述的功能性。
机器可读介质可包括数个软件模块。这些软件模块包括当由处理器执行时使处理系统执行各种功能的指令。这些软件模块可包括传送模块和接收模块。每个软件模块可以驻留在单个存储设备中或者跨多个存储设备分布。作为示例,当触发事件发生时,可以从硬驱动器中将软件模块加载到RAM中。在软件模块执行期间,处理器可以将一些指令加载到高速缓存中以提高访问速度。随后可将一个或多个高速缓存行加载到通用寄存器文件中以供处理器执行。在以下述及软件模块的功能性时,将理解此类功能性是在处理器执行来自该软件模块的指令时由该处理器来实现的。
如果以软件实现,则各功能可作为一条或多条指令或代码存储在计算机可读介质上或藉其进行传送。计算机可读介质包括计算机存储介质和通信介质两者,这些介质包括促成计算机程序从一地向另一地转移的任何介质。存储介质可以是能被计算机访问的任何可用介质。作为示例而非限定,这样的计算机可读介质可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁存储设备、或能携带或存储指令或数据结构形式的期望程序代码且能被计算机访问的任何其它介质。另外,任何连接也被正当地称为计算机可读介质。例如,如果软件是使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)、或无线技术(诸如红外(IR)、无线电、以及微波)从web网站、服务器、或其他远程源传送而来,则该同轴电缆、光纤电缆、双绞线、DSL或无线技术(诸如红外、无线电、以及微波)就被包括在介质的定义之中。如本文中所使用的盘(disk)和碟(disc)包括压缩碟(CD)、激光碟、光碟、数字多用碟(DVD)、软盘、和碟,其中盘(disk)常常磁性地再现数据,而碟(disc)用激光来光学地再现数据。因此,在一些方面,计算机可读介质可包括非瞬态计算机可读介质(例如,有形介质)。另外,对于其他方面,计算机可读介质可包括瞬态计算机可读介质(例如,信号)。上述的组合应当也被包括在计算机可读介质的范围内。
因此,某些方面可包括用于执行本文中给出的操作的计算机程序产品。例如,此类计算机程序产品可包括其上存储(和/或编码)有指令的计算机可读介质,这些指令能由一个或多个处理器执行以执行本文中所描述的操作。对于某些方面,计算机程序产品可包括包装材料。
此外,应当领会,用于执行本文中所描述的方法和技术的模块和/或其它恰适装置能由用户终端和/或基站在适用的场合下载和/或以其他方式获得。例如,此类设备能被耦合至服务器以促成用于执行本文中所描述的方法的装置的转移。替换地,本文所述的各种方法能经由存储装置(例如,RAM、ROM、诸如压缩碟(CD)或软盘等物理存储介质等)来提供,以使得一旦将该存储装置耦合至或提供给用户终端和/或基站,该设备就能获得各种方法。此外,可利用适于向设备提供本文所描述的方法和技术的任何其他合适的技术。
将理解,权利要求并不被限定于以上所解说的精确配置和组件。可在以上所描述的方法和装置的布局、操作和细节上作出各种改动、更换和变形而不会脱离权利要求的范围。
Claims (24)
1.一种在人工神经网络中执行协同处理的方法,包括:
在运行时间期间,将所述神经网络的一部分从第二处理节点热交换至第一处理节点达一预定义时间段;
用所述第一处理节点来执行所述神经网络的所述部分;
在所述预定义时间段之后将所述神经网络的所述部分返回给所述第二处理节点;以及
用所述第二处理节点来执行所述神经网络的所述部分,其中所述人工神经网络的所述部分包括深度置信网络的层。
2.如权利要求1所述的方法,其特征在于,所述第一处理节点包括来自所述第二处理节点的单独的硬件核。
3.如权利要求1所述的方法,其特征在于,所述第一处理节点包括学习处理核。
4.如权利要求3所述的方法,其特征在于,所述学习处理核被配置有比所述第二处理节点更多的资源。
5.如权利要求3所述的方法,其特征在于,学习是离线地实现的。
6.如权利要求1所述的方法,其特征在于:
所述第一处理节点包括学习处理核;
所述第二处理节点包括静态处理核;
交换包括:
将所述静态处理核的状态复制到所述学习处理核;以及
将输入路由至所述学习处理核,以使得所述学习处理核纳入所述静态处理核的功能;并且
返回包括:
将所述学习处理核的状态复制到所述静态处理核;以及
将控制返回给经修改的静态处理核。
7.如权利要求1所述的方法,其特征在于,所述交换包括分配所述第一处理节点的资源以用于从所述第二处理节点处理所述人工神经网络的所述部分。
8.如权利要求1所述的方法,其特征在于,所述第一处理节点包括调试核。
9.如权利要求1所述的方法,其特征在于,所述交换在系统性能低于阈值时被触发。
10.如权利要求1所述的方法,其特征在于,所述返回在系统性能高于阈值时被触发。
11.如权利要求1所述的方法,其特征在于,所述交换或返回在电源被施加于系统时被触发。
12.一种用于在人工神经网络中执行协同处理的装置,包括:
存储器;以及
耦合至所述存储器的至少一个处理器,所述至少一个处理器被配置成:
在运行时间期间,将所述神经网络的一部分从第二处理节点热交换至第一处理节点达一预定义时间段;
用所述第一处理节点来执行所述神经网络的所述部分;
在所述预定义时间段之后将所述神经网络的所述部分返回给所述第二处理节点;以及
用所述第二处理节点来执行所述神经网络的所述部分,其中所述人工神经网络的所述部分包括深度置信网络的层。
13.如权利要求12所述的装置,其特征在于,所述第一处理节点包括来自所述第二处理节点的单独的硬件核。
14.如权利要求12所述的装置,其特征在于,所述第一处理节点包括学习处理核。
15.如权利要求14所述的装置,其特征在于,所述学习处理核被配置有比所述第二处理节点更多的资源。
16.如权利要求14所述的装置,其特征在于,学习是离线地实现的。
17.如权利要求12所述的装置,其特征在于,所述第一处理节点包括学习处理核并且所述第二处理节点包括静态处理核,并且所述至少一个处理器被进一步配置成:
将所述静态处理核的状态复制到所述学习处理核;
将输入路由至所述学习处理核,以使得所述学习处理核纳入所述静态处理核的功能;
将所述学习处理核的状态复制到所述静态处理核;以及
将控制返回给经修改的静态处理核。
18.如权利要求12所述的装置,其特征在于,所述至少一个处理器被进一步配置成分配所述第一处理节点的资源以用于从所述第二处理节点处理所述人工神经网络的所述部分。
19.如权利要求12所述的装置,其特征在于,所述人工神经网络的所述部分包括深度置信网络的层。
20.如权利要求12所述的装置,其特征在于,所述至少一个处理器被进一步配置成在系统性能低于阈值时将所述神经网络的所述部分交换至所述第一处理节点。
21.如权利要求12所述的装置,其特征在于,所述至少一个处理器被进一步配置成在系统性能高于阈值时将所述神经网络的所述部分返回给所述第二处理节点。
22.如权利要求12所述的装置,其特征在于,所述至少一个处理器被进一步配置成在电源被施加于系统时将所述神经网络的所述部分交换至所述第一处理节点或者将所述神经网络的所述部分返回给所述第二处理节点。
23.一种用于在人工神经网络中执行协同处理的设备,包括:
用于在运行时间期间,将所述神经网络的一部分从第二处理节点热交换至第一处理节点达一预定义时间段的装置;
用于用所述第一处理节点来执行所述神经网络的所述部分的装置;
用于在所述预定义时间段之后将所述神经网络的所述部分返回给所述第二处理节点的装置;以及
用于用所述第二处理节点来执行所述神经网络的所述部分的装置,其中所述人工神经网络的所述部分包括深度置信网络的层。
24.一种其上编码有用于在人工神经网络中执行协同处理的程序代码的非瞬态计算机可读介质,所述程序代码被处理器处理并且包括:
用于在运行时间期间,将所述神经网络的一部分热交换至第一处理节点达一预定义时间段的程序代码;
用于用所述第一处理节点来执行所述神经网络的所述部分的程序代码;
用于在所述预定义时间段之后将所述神经网络的所述部分返回给第二处理节点的程序代码;以及
用于用所述第二处理节点来执行所述神经网络的所述部分的程序代码,其中所述人工神经网络的所述部分包括深度置信网络的层。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201461943155P | 2014-02-21 | 2014-02-21 | |
US61/943,155 | 2014-02-21 | ||
US14/273,214 | 2014-05-08 | ||
US14/273,214 US20150242741A1 (en) | 2014-02-21 | 2014-05-08 | In situ neural network co-processing |
PCT/US2015/015917 WO2015178977A2 (en) | 2014-02-21 | 2015-02-13 | In situ neural network co-processing |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106030622A CN106030622A (zh) | 2016-10-12 |
CN106030622B true CN106030622B (zh) | 2019-09-20 |
Family
ID=53882555
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580009326.3A Active CN106030622B (zh) | 2014-02-21 | 2015-02-13 | 原位神经网络协同处理 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20150242741A1 (zh) |
EP (1) | EP3108414A2 (zh) |
JP (1) | JP2017509982A (zh) |
CN (1) | CN106030622B (zh) |
WO (1) | WO2015178977A2 (zh) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3185184A1 (en) | 2015-12-21 | 2017-06-28 | Aiton Caldwell SA | The method for analyzing a set of billing data in neural networks |
US11922313B2 (en) | 2016-02-11 | 2024-03-05 | William Marsh Rice University | Partitioned machine learning architecture |
CN106897768B (zh) * | 2017-01-25 | 2020-04-21 | 清华大学 | 神经网络信息发送方法和系统 |
WO2018149217A1 (zh) * | 2017-02-17 | 2018-08-23 | 清华大学 | 神经网络计算核信息处理方法、系统和计算机设备 |
US11934945B2 (en) | 2017-02-23 | 2024-03-19 | Cerebras Systems Inc. | Accelerated deep learning |
WO2018156891A1 (en) * | 2017-02-24 | 2018-08-30 | Google Llc | Training policy neural networks using path consistency learning |
WO2018193352A1 (en) | 2017-04-17 | 2018-10-25 | Cerebras Systems Inc. | Dataflow triggered tasks for accelerated deep learning |
US11232347B2 (en) | 2017-04-17 | 2022-01-25 | Cerebras Systems Inc. | Fabric vectors for deep learning acceleration |
US11488004B2 (en) | 2017-04-17 | 2022-11-01 | Cerebras Systems Inc. | Neuron smearing for accelerated deep learning |
WO2019018809A1 (en) | 2017-07-21 | 2019-01-24 | The Regents Of The University Of California | ACOUSTIC WAVE ATOMIZER |
GB2566702B (en) * | 2017-09-20 | 2021-11-03 | Imagination Tech Ltd | Hardware implementation of a deep neural network with variable output data format |
JP7074777B2 (ja) * | 2017-11-20 | 2022-05-24 | シャンハイ カンブリコン インフォメーション テクノロジー カンパニー リミテッド | タスク並列処理方法、装置、システム、記憶媒体およびコンピュータ機器 |
US10803379B2 (en) | 2017-12-12 | 2020-10-13 | Amazon Technologies, Inc. | Multi-memory on-chip computational network |
US10846621B2 (en) * | 2017-12-12 | 2020-11-24 | Amazon Technologies, Inc. | Fast context switching for computational networks |
US11429862B2 (en) | 2018-03-20 | 2022-08-30 | Sri International | Dynamic adaptation of deep neural networks |
JP2019164793A (ja) * | 2018-03-19 | 2019-09-26 | エスアールアイ インターナショナル | ディープニューラルネットワークの動的適応 |
WO2020044152A1 (en) | 2018-08-28 | 2020-03-05 | Cerebras Systems Inc. | Scaled compute fabric for accelerated deep learning |
WO2020044238A1 (en) | 2018-08-29 | 2020-03-05 | Cerebras Systems Inc. | Processor element redundancy for accelerated deep learning |
WO2020044208A1 (en) | 2018-08-29 | 2020-03-05 | Cerebras Systems Inc. | Isa enhancements for accelerated deep learning |
TW202018596A (zh) * | 2018-11-09 | 2020-05-16 | 財團法人資訊工業策進會 | 分散式網路運算系統、分散式網路運算方法以及非暫態電腦可讀取記錄媒體 |
CN109901878B (zh) * | 2019-02-25 | 2021-07-23 | 北京灵汐科技有限公司 | 一种类脑计算芯片及计算设备 |
CN112418389A (zh) * | 2019-08-23 | 2021-02-26 | 北京希姆计算科技有限公司 | 数据处理方法、装置、电子设备及计算机可读存储介质 |
WO2022109593A1 (en) * | 2020-11-20 | 2022-05-27 | The Regents Of The University Of California | Error-triggered learning of multi-layer memristive spiking neural networks |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6804632B2 (en) * | 2001-12-06 | 2004-10-12 | Intel Corporation | Distribution of processing activity across processing hardware based on power consumption considerations |
CN102906767A (zh) * | 2010-06-30 | 2013-01-30 | 国际商业机器公司 | 用于时空联合存储器的标准尖峰神经网络 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6418423B1 (en) * | 1999-01-29 | 2002-07-09 | International Business Machines Corporation | Method and apparatus for executing neural network applications on a network of embedded devices |
US7219085B2 (en) * | 2003-12-09 | 2007-05-15 | Microsoft Corporation | System and method for accelerating and optimizing the processing of machine learning techniques using a graphics processing unit |
US7533071B2 (en) * | 2005-06-28 | 2009-05-12 | Neurosciences Research Foundation, Inc. | Neural modeling and brain-based devices using special purpose processor |
US9111224B2 (en) * | 2011-10-19 | 2015-08-18 | Qualcomm Incorporated | Method and apparatus for neural learning of natural multi-spike trains in spiking neural networks |
US8819489B2 (en) * | 2011-12-14 | 2014-08-26 | Ati Technologies Ulc | Accelerated processing unit debugging using a graphics processing unit centric debug core |
-
2014
- 2014-05-08 US US14/273,214 patent/US20150242741A1/en not_active Abandoned
-
2015
- 2015-02-13 WO PCT/US2015/015917 patent/WO2015178977A2/en active Application Filing
- 2015-02-13 EP EP15759970.5A patent/EP3108414A2/en not_active Ceased
- 2015-02-13 CN CN201580009326.3A patent/CN106030622B/zh active Active
- 2015-02-13 JP JP2016553381A patent/JP2017509982A/ja not_active Ceased
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6804632B2 (en) * | 2001-12-06 | 2004-10-12 | Intel Corporation | Distribution of processing activity across processing hardware based on power consumption considerations |
CN102906767A (zh) * | 2010-06-30 | 2013-01-30 | 国际商业机器公司 | 用于时空联合存储器的标准尖峰神经网络 |
Non-Patent Citations (1)
Title |
---|
ASYNCHRONOUS STOCHASTIC GRADIENT DESCENT FOR DNN TRAINING;Shanshan Zhang;《2013 IEEE Intl.Conf.on Acoustics,Speech,and Signal Processing》;20130531;摘要,第3.1-3.3节,图3 * |
Also Published As
Publication number | Publication date |
---|---|
WO2015178977A3 (en) | 2016-01-28 |
WO2015178977A2 (en) | 2015-11-26 |
EP3108414A2 (en) | 2016-12-28 |
CN106030622A (zh) | 2016-10-12 |
JP2017509982A (ja) | 2017-04-06 |
US20150242741A1 (en) | 2015-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106030622B (zh) | 原位神经网络协同处理 | |
CN105934766B (zh) | 用阴影网络来监视神经网络 | |
CN105229675B (zh) | 尖峰网络的高效硬件实现 | |
CN106030620B (zh) | 用于随机尖峰贝叶斯网络的基于事件的推断和学习 | |
CN105637541A (zh) | 用于神经模拟器的共享存储器架构 | |
US10339447B2 (en) | Configuring sparse neuronal networks | |
CN107077637B (zh) | 神经网络中的差分编码 | |
CN105612492B (zh) | 在人工神经系统中减少尖峰的方法、装置、设备及介质 | |
CN105637539B (zh) | 用于修改神经动态的自动化方法 | |
CN106068519B (zh) | 用于共用神经元模型的高效实现的方法和装置 | |
CN106663222A (zh) | 神经网络中的分解卷积操作 | |
EP3123405A2 (en) | Training, recognition, and generation in a spiking deep belief network (dbn) | |
JP2017515205A (ja) | Coldニューロンスパイクタイミングバックプロバゲーション | |
CN105659260B (zh) | 动态地指派和检查突触延迟 | |
CN106796667A (zh) | 动态空间目标选择 | |
CN106133763B (zh) | 可塑性突触管理 | |
CN106104586B (zh) | 神经元形态模型开发的上下文实时反馈 | |
WO2015127106A1 (en) | Stochastic delay plasticity | |
WO2014197175A2 (en) | Efficient implementation of neural population diversity in neural system | |
CN106030621B (zh) | 用于空间目标选择的失衡式交叉抑制性机制 | |
WO2015053908A2 (en) | Method and apparatus to control and monitor neural model execution remotely |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |