TW201602924A - 在尖峰神經網路中藉由全域標量值來調制可塑性 - Google Patents

在尖峰神經網路中藉由全域標量值來調制可塑性 Download PDF

Info

Publication number
TW201602924A
TW201602924A TW104109401A TW104109401A TW201602924A TW 201602924 A TW201602924 A TW 201602924A TW 104109401 A TW104109401 A TW 104109401A TW 104109401 A TW104109401 A TW 104109401A TW 201602924 A TW201602924 A TW 201602924A
Authority
TW
Taiwan
Prior art keywords
state variable
axon
synapse
spike
synaptic
Prior art date
Application number
TW104109401A
Other languages
English (en)
Inventor
利文傑佛瑞亞歷山大
劉吟吟
潘迪安山迪普
坎波司麥可
Original Assignee
高通公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 高通公司 filed Critical 高通公司
Publication of TW201602924A publication Critical patent/TW201602924A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • G06N3/065Analogue means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Neurology (AREA)
  • Image Analysis (AREA)
  • Feedback Control In General (AREA)

Abstract

一種用於在神經網路的突觸中維持狀態變數的方法包括在軸突中維持狀態變數。該軸突中的狀態變數可以基於第一預定事件的發生被更新。該方法亦包括基於該軸突中的狀態變數和第二預定事件的發生來更新該突觸中的狀態變數。

Description

在尖峰神經網路中藉由全域標量值來調制可塑性
本案的一些態樣大體係關於神經系統工程,並且更特定言之係關於用於在尖峰神經網路中藉由全域標量值來調制可塑性的系統和方法。
可包括一群互連的人工神經元(即神經元模型)的人工神經網路是一種計算設備或者表示將由計算設備執行的方法。人工神經網路可具有生物學神經網路中的對應的結構及/或功能。然而,人工神經網路可為其中傳統計算技術是麻煩的、不切實際的,或不勝任的一些應用提供創新且有用的計算技術。由於人工神經網路能從觀察中推斷出功能,因此此種網路在因任務或資料的複雜度使得藉由一般技術來設計該功能較為麻煩的應用中是特別有用的。
在本案的一態樣中,揭示一種用於在神經網路的突觸中維持狀態變數的方法。該方法包括在軸突中維持狀態變數。該軸突中的狀態變數基於第一預定事件的發生被更新。 該方法亦包括基於該軸突中的狀態變數和第二預定事件的發生來更新該突觸中的狀態變數。
在本案的另一態樣中,揭示一種用於在神經網路的突觸中維持狀態變數的裝置。該裝置具有記憶體以及耦合至該記憶體的至少一個處理器。該(諸)處理器被配置成在軸突中維持狀態變數。該軸突中的狀態變數基於第一預定事件的發生被更新。該處理器亦被配置成基於該軸突中的狀態變數和第二預定事件的發生來更新該突觸中的狀態變數。
在本案的又一態樣中,揭示一種用於在神經網路的突觸中維持狀態變數的裝置。該裝置包括用於在軸突中維持狀態變數的手段。該軸突中的狀態變數基於第一預定事件的發生被更新。該裝置亦包括用於基於該軸突中的狀態變數和第二預定事件的發生來更新該突觸中的狀態變數的手段。
在本案的又一態樣中,揭示一種用於在神經網路的突觸中維持狀態變數的電腦程式產品。該電腦程式產品包括其上編碼有程式碼的非瞬態電腦可讀取媒體。該程式碼包括用於在軸突中維持狀態變數的程式碼。該軸突中的狀態變數基於第一預定事件的發生被更新。該程式碼亦包括用於基於該軸突中的狀態變數和第二預定事件的發生來更新該突觸中的狀態變數的程式碼。
此已較寬泛地勾勒出本案的特徵和技術優勢以便下文的詳細描述可以被更好地理解。本案的其他特徵和優點將在下文描述。本領域技藝人士應該領會,本案可容易地被用作改動或設計用於實施與本案相同的目的的其他結構的基礎 。本領域技藝人士亦應認識到,此種等效構造並不脫離如所附申請專利範圍中所闡述的本案的教示。被認為是本案的特性的新穎特徵在其組織和操作方法兩方面連同進一步的目的和優點在結合附圖來考慮以下描述時將被更好地理解。然而,要清楚理解的是,提供每一幅附圖均僅用於圖示和描述目的,且無意作為對本案的限定的定義。
100‧‧‧人工神經系統
102‧‧‧神經元級
104‧‧‧突觸連接網路
106‧‧‧神經元級
1081‧‧‧輸入信號
1082‧‧‧輸入信號
108N‧‧‧輸入信號
1101‧‧‧輸出尖峰
1102‧‧‧輸出尖峰
110M‧‧‧輸出尖峰
200‧‧‧示圖
202‧‧‧處理單元/神經元
2041‧‧‧輸入信號
204i‧‧‧輸入信號
204N1‧‧‧輸入信號
2061‧‧‧突觸權重
206i‧‧‧突觸權重
206N‧‧‧突觸權重
208‧‧‧輸出信號
300‧‧‧示圖/曲線圖
302‧‧‧部分
304‧‧‧部分
306‧‧‧交越點
400‧‧‧模型
402‧‧‧負態相
404‧‧‧正態相
500‧‧‧實施
502‧‧‧通用處理器
504‧‧‧記憶體區塊
506‧‧‧程式記憶體
600‧‧‧實施
602‧‧‧記憶體
604‧‧‧互連網路
606‧‧‧處理單元
700‧‧‧實施
702‧‧‧記憶體組
704‧‧‧處理單元
800‧‧‧神經網路
802‧‧‧局部處理單元
804‧‧‧局部狀態記憶體
806‧‧‧局部參數記憶體
808‧‧‧局部模型程式(LMP)記憶體
810‧‧‧局部學習程式(LLP)記憶體
812‧‧‧局部連接記憶體
814‧‧‧配置處理單元
816‧‧‧連接處理元件
900‧‧‧時序圖
902‧‧‧前尖峰事件
902a‧‧‧前尖峰
904‧‧‧資格跡
904a‧‧‧資格跡被觸發
906‧‧‧神經調製劑信號
908‧‧‧權重改變
908a‧‧‧累積的權重改變
908b‧‧‧重置累積的權重改變為0
908c‧‧‧累積的權重改變
910‧‧‧神經模組
912a‧‧‧後尖峰
914a‧‧‧重放事件
914b‧‧‧下一重放事件
916‧‧‧突觸權重更新
916a‧‧‧步驟
916b‧‧‧突觸權重更新
918‧‧‧sd
918b‧‧‧sd變數
920‧‧‧突觸
922‧‧‧new_sd
924‧‧‧獎勵輸入
926‧‧‧多巴胺尖峰
1000‧‧‧時序圖
1006‧‧‧信號可被累積
1008‧‧‧影響累積的權重改變
1024‧‧‧接收到獎勵輸入
1026‧‧‧有多巴胺可用/多巴胺
1028‧‧‧保持高於閾值
1100‧‧‧方法
1102‧‧‧方塊
1104‧‧‧方塊
在結合附圖理解下文闡述的詳細描述時,本案的特徵、本質和優點將變得更加明顯,在附圖中,相同元件符號始終作相應標識。
圖1圖示根據本案的一些態樣的示例神經元網路。
圖2圖示根據本案的一些態樣的計算網路(神經系統或神經網路)的處理單元(神經元)的實例。
圖3圖示根據本案的一些態樣的尖峰時序依賴可塑性(STDP)曲線的實例。
圖4圖示根據本案的一些態樣的用於定義神經元模型的行為的正態相和負態相的實例。
圖5圖示根據本案的一些態樣的使用通用處理器來設計神經網路的示例實施。
圖6圖示根據本案的一些態樣的設計其中記憶體可以與個體的分散式處理單元對接的神經網路的示例實施。
圖7圖示根據本案的一些態樣的基於分散式記憶體和分散式處理單元來設計神經網路的示例實施。
圖8圖示根據本案的一些態樣的神經網路的示例實 施。
圖9和圖10圖示根據本案的各態樣用於在尖峰神經網路中調制可塑性的時序圖。
圖11是圖示根據本案的一態樣的用於在尖峰神經網路中調制可塑性的方法的方塊圖。
以下結合附圖闡述的詳細描述意欲作為各種配置的描述,而無意表示可實踐本文中所描述的概念的僅有的配置。本詳細描述包括特定細節以便提供對各種概念的透徹理解。然而,對於本領域技藝人士將顯而易見的是,沒有該等特定細節亦可實踐該等概念。在一些實例中,以方塊圖形式示出眾所周知的結構和元件以避免湮沒此類概念。
基於本教示,本領域技藝人士應領會,本案的範疇意欲覆蓋本案的任何態樣,不論其是與本案的任何其他態樣相獨立地還是組合地實施的。例如,可以使用所闡述的任何數目的態樣來實施裝置或實踐方法。另外,本案的範疇意欲覆蓋使用作為所闡述的本案的各個態樣的補充或者與之不同的其他結構、功能性,或者結構及功能性來實踐的此類裝置或方法。應當理解,所揭示的本案的任何態樣可由請求項的一或多個元素來體現。
措辭「示例性」在本文中用於表示「用作示例、實例或說明」。本文中描述為「示例性」的任何態樣不必被解釋為優於或勝過其他態樣。
儘管本文描述了特定態樣,但該等態樣的眾多變體 和置換落在本案的範疇內。儘管提到了優選態樣的一些益處和優點,但本案的範疇並非意欲被限定於特定益處、用途或目標。相反,本案的各態樣意欲能寬泛地應用於不同的技術、系統組態、網路和協定,其中一些作為示例在附圖以及以下對優選態樣的描述中解說。詳細描述和附圖僅僅解說本案而非限定本案,本案的範疇由所附申請專利範圍及其等效技術方案來定義。
示例神經系統、訓練及操作
圖1圖示根據本案的一些態樣的具有多級神經元的示例人工神經系統100。神經系統100可具有神經元級102,該神經元級102經由突觸連接網路104(亦即,前饋連接)來連接到另一神經元級106。為簡單起見,圖1中僅圖示了兩級神經元,儘管神經系統中可存在更少或更多級神經元。應注意,一些神經元可經由側向連接來連接至同層中的其他神經元。此外,一些神經元可經由回饋連接來後向連接至先前層中的神經元。
如圖1所圖示的,級102中的每一個神經元可以接收可由前級的神經元(未在圖1中示出)產生的輸入信號108。信號108可表示級102的神經元的輸入電流。該電流可在神經元膜上累積以對膜電位進行充電。當膜電位達到其閾值時,該神經元可激發並產生輸出尖峰,該輸出尖峰將被傳遞到下一級神經元(例如,級106)。在一些建模辦法中,神經元可以連續地向下一級神經元傳遞信號。該信號通常是膜電位的函數。此類行為可在硬體及/或軟體(包括類比和數位實施, 諸如以下該彼等實施)中進行仿真或模擬。
在生物學神經元中,在神經元激發時產生的輸出尖峰被稱為動作電位。該電信號是相對迅速、瞬態的神經脈衝,其具有約為100mV的振幅和約為1ms的歷時。在具有一系列連通的神經元(例如,尖峰從圖1中的一級神經元傳遞至另一級神經元)的神經系統的特定實施例中,每個動作電位皆具有基本上相同的振幅和歷時,並且因此該信號中的資訊可僅由尖峰的頻率和數目,或尖峰的時間來表示,而不由振幅來表示。動作電位所攜帶的資訊可由尖峰、發放了尖峰的神經元、以及該尖峰相對於一個或數個其他尖峰的時間來決定。尖峰的重要性可由向各神經元之間的連接所應用的權重來決定,如以下所解釋的。
尖峰從一級神經元向另一級神經元的傳遞可經由突觸連接網路(或簡稱「突觸」)104來達成,如圖1中所圖示的。相對於突觸104,級102的神經元可被視為突觸前神經元,而級106的神經元可被視為突觸後神經元。突觸104可接收來自級102的神經元的輸出信號(亦即,尖峰),並根據可調節突觸權重、......、來按比例縮放彼等信號,其中P是級102的神經元與級106的神經元之間的突觸連接的總數,並且i是神經元級的指示符。在圖1的實例中,i表示神經元級102並且i+1表示神經元級106。此外,經按比例縮放的信號可被組合以作為級106中每個神經元的輸入信號。級106之每一者神經元可基於對應的組合輸入信號來產生輸出尖峰110。可使用另一突觸連接網路(圖1中未圖示)將該等輸出尖峰110傳 遞到另一級神經元。
生物學突觸可以仲裁突觸後神經元中的興奮性或抑制性(超級化)動作,並且亦可用於放大神經元信號。興奮性信號使膜電位去極化(亦即,相對於靜息電位增大膜電位)。若在某個時間段內接收到足夠的興奮性信號以使膜電位去極化到高於閾值,則在突觸後神經元中發生動作電位。相反,抑制性信號一般使膜電位超極化(亦即,降低膜電位)。抑制性信號若足夠強則可抵消掉興奮性信號之和並阻止膜電位到達閾值。除了抵消掉突觸興奮以外,突觸抑制亦可對自發活躍神經元施加強力的控制。自發活躍神經元是指在沒有進一步輸入的情況下(例如,由於其動態或回饋而)發放尖峰的神經元。藉由壓制該等神經元中的動作電位的自發產生,突觸抑制可對神經元中的激發模式進行定形,此一般被稱為雕刻。取決於期望的行為,各種突觸104可充當興奮性或抑制性突觸的任何組合。
神經系統100可由通用處理器、數位訊號處理器(DSP)、特殊應用積體電路(ASIC)、現場可程式設計閘陣列(FPGA)或其他可程式設計邏輯設備(PLD)、個別閘門或電晶體邏輯、個別的硬體元件、由處理器執行的軟體模組,或其任何組合來仿真。神經系統100可用在大範圍的應用中,諸如圖像和模式辨識、機器學習、電機控制,及類似應用等。神經系統100中的每一神經元可被實施為神經元電路。被充電至發起輸出尖峰的閾值的神經元膜可被實施為例如對流經其的電流進行積分的電容器。
在一態樣,電容器作為神經元電路的電流積分設備可被除去,並且可使用較小的憶阻器元件來替代其。此種辦法可應用於神經元電路中,以及其中大容量電容器被用作電流積分器的各種其他應用中。另外,每個突觸104可基於憶阻器元件來實施,其中突觸權重變化可與憶阻器電阻的變化有關。使用奈米特徵尺寸的憶阻器,可顯著地減小神經元電路和突觸的面積,此可使得實施大規模神經系統硬體實施更為切實可行。
對神經系統100進行仿真的神經處理器的功能性可取決於突觸連接的權重,該等權重可控制神經元之間的連接的強度。突觸權重可儲存在非揮發性記憶體中以在掉電之後保留該處理器的功能性。在一態樣,突觸權重記憶體可實施在與主神經處理器晶片分開的外部晶片上。突觸權重記憶體可與神經處理器晶片分開地封裝成可更換的記憶卡。此可向神經處理器提供多種多樣的功能性,其中特定功能性可基於當前附連至神經處理器的記憶卡中所儲存的突觸權重。
圖2圖示根據本案的一些態樣的計算網路(例如,神經系統或神經網路)的處理單元(例如,神經元或神經元電路)202的示例性示圖200。例如,神經元202可對應於來自圖1的級102和106的任何神經元。神經元202可接收多個輸入信號2041-204N,該等輸入信號可以是該神經系統外部的信號,或是由同一神經系統的其他神經元所產生的信號,或該兩者。輸入信號可以是電流、電導、電壓、實數值的及/或複數值的。輸入信號可包括具有定點或浮點表示的數值。可經由突 觸連接將該等輸入信號遞送到神經元202,突觸連接根據可調節突觸權重2061-206N(W1-WN)對該等信號進行按比例縮放,其中N可以是神經元202的輸入連接總數。
神經元202可組合該等經按比例縮放的輸入信號,並且使用組合的經按比例縮放的輸入來產生輸出信號208(亦即,信號Y)。輸出信號208可以是電流、電導、電壓、實數值的及/或複數值的。輸出信號可以是具有定點或浮點表示的數值。隨後該輸出信號208可作為輸入信號傳遞至同一神經系統的其他神經元,或作為輸入信號傳遞至同一神經元202,或作為該神經系統的輸出來傳遞。
處理單元(神經元)202可由電路來仿真,並且其輸入和輸出連接可由具有突觸電路的電連接來模擬。處理單元202及其輸入和輸出連接亦可由軟體代碼來仿真。處理單元202亦可由電路來仿真,而其輸入和輸出連接可由軟體代碼來仿真。在一態樣,計算網路中的處理單元202可以是類比電路。在另一態樣,處理單元202可以是數位電路。在又一態樣,處理單元202可以是具有類比和數位元件兩者的混合信號電路。計算網路可包括任何前述形式的處理單元。使用此種處理單元的計算網路(神經系統或神經網路)可用在大範圍的應用中,諸如圖像和模式辨識、機器學習、電機控制,及類似應用等。
在神經網路的訓練過程期間,突觸權重(例如,來自圖1的權重、......、及/或來自圖2的權重2061-206N)可用隨機值來初始化並根據學習規則而被增大或減小。本 領域技藝人士將領會,學習規則的實例包括但不限於尖峰時序依賴可塑性(STDP)學習規則、Hebb規則、Oja規則、Bienenstock-Copper-Munro(BCM)規則等。在一些態樣,該等權重可穩定或收斂至兩個值(亦即,權重的雙峰分佈)之一。該效應可被用於減少每個突觸權重的位元數、提高從/向儲存突觸權重的記憶體讀取和寫入的速度、以及降低突觸記憶體的功率及/或處理器消耗。
突觸類型
在神經網路的硬體和軟體模型中,突觸相關功能的處理可基於突觸類型。突觸類型可以是非可塑突觸(權重和延遲沒有改變)、可塑突觸(權重可改變)、結構化延遲可塑突觸(權重和延遲可改變)、全可塑突觸(權重、延遲和連通性可改變)、以及基於此的變型(例如,延遲可改變,但在權重或連通性方面沒有改變)。多種類型的優點在於處理可以被細分。例如,非可塑突觸不會使用待執行的可塑性功能(或等待此類功能完成)。類似地,延遲和權重可塑性可被細分成可一起或分開地、順序地或並行地運作的操作。不同類型的突觸對於適用的每一種不同的可塑性類型可具有不同的查找表或公式以及參數。因此,該等方法將針對該突觸的類型來存取相關的表、公式或參數。
亦進一步牽涉到以下事實:尖峰時序依賴型結構化可塑性可獨立於突觸可塑性地來執行。結構化可塑性即使在權重幅值沒有改變的情況下(例如,若權重已達最小或最大值,或者其由於某種其他原因而不被改變)亦可被執行,因 為結構化可塑性(亦即,延遲改變的量)可以是前-後尖峰時間差的直接函數。替代地,結構化可塑性可被設為權重變化量的函數或者可基於與權重或權重變化的界限有關的條件來設置。例如,突觸延遲可僅在權重變化發生時或者在權重到達0的情況下才改變,但在該等權重為最大值時則不改變。然而,具有獨立函數以使得該等程序能被並行化從而減少記憶體存取的次數和交疊可能是有利的。突觸可塑性的決定
神經元可塑性(或簡稱「可塑性」)是大腦中的神經元和神經網路回應於新的資訊、感官刺激、發展、損壞,或機能障礙而改變其突觸連接和行為的能力。可塑性對於生物學中的學習和記憶、以及對於計算神經元科學和神經網路是重要的。已經研究了各種形式的可塑性,諸如突觸可塑性(例如,根據Hebbian理論)、尖峰時序依賴可塑性(STDP)、非突觸可塑性、活躍性依賴可塑性、結構化可塑性和自穩態可塑性。
STDP是調節神經元之間的突觸連接的強度的學習程序。連接強度是基於特定神經元的輸出與收到輸入尖峰(亦即,動作電位)的相對時序來調節的。在STDP程序下,若至某個神經元的輸入尖峰平均而言傾向於緊挨在該神經元的輸出尖峰之前發生,則可發生長期增強(LTP)。於是使得該特定輸入在一定程度上更強。另一方面,若輸入尖峰平均而言傾向於緊接在輸出尖峰之後發生,則可發生長期抑壓(LTD)。於是使得該特定輸入在一定程度上更弱,並由此得名「尖峰時序依賴可塑性」。因此,使得可能是突觸後神經元興奮原 因的輸入甚至在將來作出貢獻的可能性更大,而使得不是突觸後尖峰的原因的輸入在將來作出貢獻的可能性更小。該程序繼續,直至初始連接集合的子集保留,而所有其他連接的影響減小至無關緊要的水平。
由於神經元一般在其許多輸入皆在一短時段內發生(亦即,累積性足以引起輸出)時產生輸出尖峰,因此通常保留下來的輸入子集包括傾向於在時間上相關的彼等輸入。另外,由於在輸出尖峰之前發生的輸入被加強,因此提供對相關性的最早充分累積性指示的彼等輸入將最終變成至該神經元的最後輸入。
STDP學習規則可因變於突觸前神經元的尖峰時間t pre 與突觸後神經元的尖峰時間t post 之間的時間差(亦即,t=t post -t pre )來有效地適配將該突觸前神經元連接到該突觸後神經元的突觸的突觸權重。STDP的典型公式化是若該時間差為正(突觸前神經元在突觸後神經元之前激發)則增大突觸權重(亦即,增強該突觸),以及若該時間差為負(突觸後神經元在突觸前神經元之前激發)則減小突觸權重(亦即,抑壓該突觸)。
在STDP程序中,突觸權重隨時間推移的改變可通常使用指數式衰退來達成,如由下式提供的: 其中k +k - τ signt)分別是針對正和負時間差的時間常數,a +a -是對應的比例縮放幅值,並且μ是可應用於正時間差及/或負 時間差的偏移。
圖3圖示了根據STDP,突觸權重作為突觸前(presynaptic)和突觸後(postsynaptic)尖峰的相對時序的函數而改變的示例性示圖300。若突觸前神經元在突觸後神經元之前激發,則對應的突觸權重可被增大,如曲線圖300的部分302中所圖示的。該權重增大可被稱為該突觸的LTP。從曲線圖部分302可觀察到,LTP的量可因變於突觸前和突觸後尖峰時間之差而大致呈指數式地下降。相反的激發次序可減小突觸權重,如曲線圖300的部分304中所圖示的,從而導致該突觸的LTD。
如圖3中的曲線圖300中所圖示的,可向STDP曲線圖的LTP(因果性)部分302應用負偏移μ。x軸的交越點306(y=0)可被配置成與最大時間滯後重合以考慮到來自層i-1的各因果性輸入的相關性。在基於訊框的輸入(亦即,呈特定歷時的包括尖峰或脈衝的訊框的形式的輸入)的情形中,可計算偏移值μ以反映訊框邊界。該訊框中的第一輸入尖峰(脈衝)可被視為要麼如直接由突觸後電位所建模地隨時間衰退,要麼在對神經狀態的影響的意義上隨時間衰退。若該訊框中的第二輸入尖峰(脈衝)被視為與特定的時間訊框相關或有關,則該訊框之前和之後的有關時間可藉由使STDP曲線的一或多個部分偏移以使得該等有關時間中的值可以不同(例如,對於大於一個訊框為負,而對於小於一個訊框為正)來在該時間訊框邊界處被分開並在可塑性意義上被不同地對待。例如,負偏移μ可被設為偏移LTP以使得曲線實際上在大於訊框 時間的pre-post時間處變得低於零並且其由此為LTD而非LTP的一部分。
神經元模型及操作
存在一些用於設計有用的尖峰發放神經元模型的一般原理。良好的神經元模型在以下兩個計算態相(regime)方面可具有豐富的潛在行為:重合性偵測和功能性計算。此外,良好的神經元模型應當具有允許時間編碼的兩個要素:輸入的抵達時間影響輸出時間,以及重合性偵測能具有窄時間窗。最後,為了在計算上是有吸引力的,良好的神經元模型在連續時間上可具有封閉形式解,並且具有穩定的行為,包括在靠近吸引子和鞍點之處。換言之,有用的神經元模型是可實踐且可建模豐富的、現實的且生物學一致的行為並且允許對神經電路進行工程設計和反向工程設計兩者的神經元模型。
神經元模型可取決於事件,諸如輸入抵達、輸出尖峰或其他事件,無論該等事件是內部的還是外部的。為了達成豐富的行為戲目,能展現複雜行為的狀態機可能是期望的。若事件本身的發生在撇開輸入貢獻(若有)的情況下能影響狀態機並約束該事件之後的動態,則該系統的將來狀態並非僅是狀態和輸入的函數,而是狀態、事件和輸入的函數。
在一態樣,神經元n可被建模為尖峰帶洩漏積分激發神經元,其膜電壓v n (t)由以下動態來支配: 其中αβ是參數,w m,n 是將突觸前神經元m連接至突觸後神經元n的突觸的突觸權重,以及y m (t)是神經元m的尖峰發放輸出,其可根據Δt m,n 被延遲達樹突或軸突延遲才抵達神經元n的胞體。
應注意,從建立了對突觸後神經元的充分輸入的時間直至該突觸後神經元實際上激發的時間存在延遲。在動態尖峰神經元模型(諸如Izhikevich簡單模型)中,若在去極化閾值v t 與峰值尖峰電壓v peak 之間有差量,則可引發時間延遲。例如,在該簡單模型中,神經元胞體動態可由關於電壓和恢復的微分方程對來支配,即:
其中v是膜電位,u是膜恢復變數,k是描述膜電位v的時間尺度的參數,a是描述恢復變數u的時間尺度的參數,b是描述恢復變數u對膜電位v的閾下波動的敏感度的參數,v r 是膜靜息電位,I是突觸電流,以及C是膜的電容。根據該模型,神經元被定義為在v>v peak 時發放尖峰。
Hunzinger Cold模型
Hunzinger Cold神經元模型是能再現豐富多樣的各種神經行為的最小雙態相尖峰發放線性動態模型。該模型的一維或二維線性動態可具有兩個態相,其中時間常數(以及耦合)可取決於態相。在閾下態相中,時間常數(按照慣例為負)表示洩漏通道動態,其一般作用於以生物學一致的線 性方式使細胞返回到靜息。閾上態相中的時間常數(按照慣例為正)反映抗洩漏通道動態,其一般驅動細胞發放尖峰,而同時在尖峰產生中引發潛時。
如圖4中所圖示的,該模型400的動態可被劃分成兩個(或更多個)態相。該等態相可被稱為負態相402(亦可互換地稱為帶洩漏積分激發(LIF)態相,勿與LIF神經元模型混淆)以及正態相404(亦可互換地稱為抗洩漏積分激發(ALIF)態相,勿與ALIF神經元模型混淆)。在負態相402中,狀態在將來事件的時間趨向於靜息(v -)。在該負態相中,該模型一般展現出時間輸入偵測性質及其他閾下行為。在正態相404中,狀態趨向於尖峰發放事件(v s )。在該正態相中,該模型展現出計算性質,諸如取決於後續輸入事件而引發發放尖峰的潛時。在事件方面對動態進行公式化以及將動態分成該兩個態相是該模型的基礎特性。
線性雙態相二維動態(對於狀態vu)可按照慣例定義為:
其中q ρ r是用於耦合的線性變換變數。
符號ρ在本文中用於標示動態態相,在論述或表達特定態相的關係時,按照慣例對於負態相和正態相分別用符號「-」或「+」來替換符號ρ
模型狀態藉由膜電位(電壓)v和恢復電流u來定義。在基本形式中,態相在本質上是由模型狀態來決定的。該 精確和通用的定義存在一些細微卻重要的態樣,但目前考慮該模型在電壓v高於閾值(v +)的情況下處於正態相404中,否則處於負態相402中。
態相依賴型時間常數包括負態相時間常數τ -和正態相時間常數τ +。恢復電流時間常數τ u 通常是與態相無關的。出於方便起見,負態相時間常數τ -通常被指定為反映衰退的負量,從而用於電壓演變的相同運算式可用於正態相,在正態相中指數和τ +將一般為正,正如τ u 一般。
該兩個狀態元素的動態可在發生事件之際藉由使狀態偏離其零傾線(null-cline)的變換來耦合,其中變換變數為:q ρ =-τ ρ βu-v ρ (7)
r=δ(v+ε) (8)其中δεβv -v +是參數。v ρ 的兩個值是該兩個態相的參考電壓的基數。參數v -是負態相的基電壓,並且膜電位在負態相中一般將朝向v -衰退。參數v +是正態相的基電壓,並且膜電位在正態相中一般將趨向於背離v +
vu的零傾線分別由變換變數q ρ r的負數提供。參數δ是控制u零傾線的斜率的縮放因數。參數ε通常被設為等於-v -。參數β是控制該兩個態相中的v零傾線的斜率的電阻值。τ ρ 時間常數參數不僅控制指數式衰退,亦單獨地控制每個態相中的零傾線斜率。
該模型可被定義為在電壓v達到值v S 時發放尖峰。隨後,狀態可在發生重置事件(其可以與尖峰事件完全相同) 之際被重置:
u=uu (10)其中和Δu是參數。重置電壓通常被設為v -
依照暫態耦合的原理,封閉形式解不僅對於狀態是可能的(且具有單個指數項),而且對於到達特定狀態的時間亦是可能的。封閉形式狀態解為:
因此,模型狀態可僅在發生事件之際被更新,諸如在輸入(突觸前尖峰)或輸出(突觸後尖峰)之際被更新。亦可在任何特定的時間(無論是否有輸入或輸出)執行操作。
而且,依照暫態耦合原理,突觸後尖峰的時間可被預計,因此到達特定狀態的時間可提前被決定而無需反覆運算技術或數值方法(例如,歐拉數值方法)。給定了先前電壓狀態v 0,直至到達電壓狀態v f 之前的時間延遲由下式提供:
若尖峰被定義為發生在電壓狀態v到達v S 的時間,則從電壓處於給定狀態v的時間起量測的直至發生尖峰前的時間量或即相對延遲的封閉形式解為: 其中通常被設為參數v +,但其他變型可以是可能的。
模型動態的以上定義取決於該模型是在正態相還是負態相中。如所提及的,耦合和態相ρ可基於事件來計算。出於狀態傳播的目的,態相和耦合(變換)變數可基於在上一(先前)事件的時間的狀態來定義。出於隨後預計尖峰輸出時間的目的,態相和耦合變數可基於在下一(當前)事件的時間的狀態來定義。
存在對該Cold模型、以及在時間上執行模擬、仿真,或建模的若干可能實施。此包括例如事件-更新、步階-事件更新、以及步階-更新模式。事件更新是其中基於事件或「事件更新」(在特定時刻)來更新狀態的更新。步階更新是以間隔(例如,1ms)來更新模型的更新。此不一定利用反覆運算方法或數值方法。藉由僅在事件發生於步階處或步階間的情況下才更新模型或即藉由「步階-事件」更新,基於事件的實施以有限的時間解析度在基於步階的模擬器中實現亦是可能的。在尖峰神經網路中藉由全域標量值來調制可塑性
多巴胺(DA)是一種調制突觸的可塑性的神經調製劑。經多巴胺調制的可塑性將前尖峰和後尖峰事件與經延遲獎勵信號相關。前尖峰和後尖峰事件可被用來決定突觸是否有資格例如接受更新(諸如權重改變)。在一些態樣,前尖峰/後尖峰事件可觸發針對每個突觸的資格跡(eligibility trace) 。資格跡的幅值可以基於前尖峰事件和後尖峰事件的時序來計算。例如,該幅值可以使用查找表來計算,諸如尖峰時序依賴可塑性查找表(例如,STDP(t_(pre,post)))。相應地,該資格跡的幅值可由下式提供:tr(t)=tr(t-1)e^(-t/τ_trace)+STDP(t_(pre,post)) (15)
如此,該資格跡的幅值可根據下式隨時間衰退:tr(t)=tr(t-1)e^(-t/τ_trace) (16)
獎勵輸入可由神經調製劑水平改變來表示。在一個實例中,神經調製劑可以是多巴胺。然而,此僅是示例性的,而且亦可以使用其他神經調製劑。而且,亦可以使用多種類型的神經調製劑。例如,不同神經調製劑類型可以結合不同類型的神經元及/或突觸來使用。
獎勵輸入可以經由外部源提供並且可以是正的或負的。獎勵輸入可被累積並儲存在神經模組中,該神經模組可包括分開的暫存器或其他儲存器。例如,當獎勵輸入信號被接收時,獎勵輸入信號可被編碼為神經元群體中的尖峰並被提供給該神經模組以遞增累積獎勵信號(例如,神經調製劑信號,諸如多巴胺)。
在一些態樣,神經模組可包括Kortex調制器(KM),該Kortex調制器是與超神經元相關聯的記憶體單元。在其他態樣,該神經模組亦可包括軸突、神經元或超神經元。
一特殊突觸可被耦合在神經元群體與該神經模組之間。在一些態樣,對於每種神經調製劑類型可存在一特殊突觸。該特殊突觸可被用來遞增及/或遞減累積獎勵信號。相應 地,當突觸前神經元發放尖峰時,該神經模組內的合適神經調製劑變數可被遞增一神經調製劑值。神經調製劑遞增值可以是固定或可變值並且可以是正的或負的。從而,該神經模組可起到維持例如神經調製劑狀態變數(例如,神經調製劑信號)的特殊單元或神經元的作用。
在一些態樣,神經調製劑信號可包括狀態值,該狀態值可潛在被用於更新該神經網路中的突觸的狀態變數(例如權重)。而且,累積的神經調製劑信號可適用於或被用於更新神經網路中的所有突觸或其子集。從而,在一些態樣,累積的神經調製劑信號可以是全域值。
神經模組更新
神經模組(以及進而所包括的狀態變數)可在每步階基礎上被更新。例如,狀態變數可在每個時間步階(time step)(τ)處被更新。在一些態樣,神經模組狀態變數可在神經狀態更新的末尾被更新。在其他態樣,神經模組狀態變數可在基於尖峰事件(例如,尖峰或尖峰重放事件)的時序被更新。
權重改變可作為神經調製劑(例如多巴胺)水平和資格跡(其隨時間衰退)之積來決定。亦即,權重改變可根據下式被表達為累積神經調製劑信號(例如如下所示的多巴胺)和資格跡幅值的迴旋:Δw n (t)=tr(t).多巴胺(t) (17)其中tr(t)是資格跡的幅值,而多巴胺(t)是累積神經調製劑信號。
當存在獎勵輸入(r)時,可計算權重改變。權重改變可在每步(τ)被更新並累積。如此,累積的權重改變可被維持在神經模組中並在稍後時間被應用於突觸(例如,在發生尖峰重放事件之際)。
在一些態樣,神經模組狀態變數可以是可被該神經網路中的神經元子集存取的。例如,在一些態樣,僅有可存取該神經模組(例如,軸突、神經元或超神經元)的神經元子集才可存取神經模組狀態變數。可存取神經模組的神經元子集可以使用指定突觸或突觸類型(例如,為特定神經調製劑類型指定的突觸)來如此做。以此方式,狀態變數可被重置或受制於例如其他管理。
神經模組可包括可配置參數。例如,神經模組可包括輸入累積器參數,該參數可被配置成累積輸入以遞增(例如,當提供了正獎勵輸入時)或遞減(例如,當提供了負獎勵輸入時)神經模組狀態變數。
此外,在一些態樣,閾值(例如,高閾值及/或低閾值)亦可被指定並被配置成影響神經模組的狀態值(諸如神經調製劑信號)何時可影響例如權重改變。在一些態樣,該信號可以是可被應用於該神經網路中的突觸的全域信號或半全域信號。其他濾波器參數亦可被指定並配置,包括增益或衰退速率、內部濾波器速率(例如,連續變化的內部值)以及輸出值(例如,獎勵信號)等。
此外,神經模組可包括調控或控制神經模組輸出的參數。亦即,輸出參數可指定狀態值何時及/或如何可被輸出 並從而影響突觸的狀態變數何時可被更新。例如,在一些態樣,可針對連續模式設置該輸出參數,在連續模式中獎勵輸入尖峰可產生具有由輸入尖峰觸發的衰退的連續變化的神經調製劑(例如多巴胺)值。在一些態樣,該連續模式可以使用閾值來限界。例如,在雙軌模式中,連續神經調製劑(例如多巴胺)值可由低和高截止閾值來限界。
在一些態樣,可針對一尖峰模式設置該輸出參數。在該尖峰模式中,神經調製劑(例如多巴胺)值可以作為例如脈衝被輸出。神經狀態變數(例如,神經調製劑)可以在存在獎勵輸入尖峰時被更新。亦即,獎勵輸入尖峰可觸發神經調製劑尖峰。
另一態樣,可針對雙軌模式設置該輸出參數。在雙軌模式中,內部閾值(例如,高閾值和低閾值)可被配置成使得可在神經調製劑信號(例如多巴胺)跨越該閾值之一時輸出所定義的值。例如,在累積的獎勵信號高於閾值時,可以有多巴胺可供用於調制突觸的可塑性。當累積的獎勵信號落在該閾值以下時,多巴胺可以不再可用。如此,與其中多巴胺尖峰作為輸出被提供的尖峰模式相對比,雙軌模式提供類比多巴胺輸出。
在一些態樣,神經模組的輸出值可被偏置。亦即,該輸出狀態值可被配置成使得要使用的突觸的實際值輸出可被偏置或以其他方式被調制。
突觸更新
進而可基於神經模組狀態變數(例如,累積的權重 改變(獎勵-資格跡累積))來更新突觸的狀態變數。在一些態樣,可基於某些預定事件的發生來更新突觸的狀態變數。例如,可在尖峰事件及/或尖峰重放事件發生之際、根據指定時序或其他預定事件來更新突觸狀態變數。類似地,可基於尖峰事件來更新權重改變。以此方式,突觸的狀態變數可被更新,而不存在與在每個時間步階處更新該等狀態變數有關的負擔和低效。此對於例如具有大突觸扇入/扇出的網路而言可能是有利的。
在一些態樣,變數(多巴胺_en)可被指定以進一步控制突觸是否受制於經神經調製劑(例如多巴胺)調制的可塑性。多巴胺_en變數可因每個突觸而異並且可與突觸類型定義相關聯。例如,多巴胺_en變數可包括二元旗標,該二元旗標可針對特定突觸或突觸群來啟用或禁用神經調製劑。
此外,一變數(sd)可被應用於選通或以其他方式影響可能的權重改變的幅值。亦即,狀態變數更新(例如,權重)可基於sd值來決定。例如,在一些態樣,當神經調製劑可塑性被啟用(例如,多巴胺_en=已啟用)時,突觸權重更新可被表達為:Δw s (t)=sd * Δw n (t) (18)其中Δwn是來自神經模組的累積的權重更新。
換言之,在該實例中,當神經調製劑可塑性被啟用時,突觸權重更新可以基於sd的值和累積的權重更新。在另一實例中,當神經調製劑可塑性被禁用時,突觸權重更新可僅基於sd的值。
變數sd可使用STDP來更新並被用於確保存在前尖峰和後尖峰兩者。亦即,變數sd的幅值可基於前尖峰和後尖峰的時間鄰近度來決定。以此方式,sd變數可將後尖峰納入考慮。進一步,sd變數可選通及/或縮放突觸權重改變。例如,若前尖峰/後尖峰太遠,則sd變數可以是0以指示一突觸未被啟用以進行權重更新。
在一些態樣,可基於前神經元(pre-neuron)事件(例如,尖峰或尖峰重放)來更新突觸變數以區分來自同一前神經元的不同突觸。
相應地,對該神經網路中的諸突觸的狀態更新可在與該神經模組的狀態更新不同的時間基礎上進行,由此提高效率。對於具有大突觸扇入及/或大突觸扇出的大型網路,此可能是尤其有益的。
在一些態樣,神經模組的狀態變數和突觸的狀態變數可被儲存在不同的記憶體中以進一步提高神經網路效能。例如,在一些態樣,該神經模組中可被更頻繁地更新的狀態變數可被儲存在具有比突觸的狀態變數更快的存取速度的記憶體中。類似地,該神經模組的狀態變數和突觸的狀態變數可被儲存在不同位置。
突觸狀態變數記憶體的數量亦可大大超出軸突狀態變數記憶體的數量。例如,在一些態樣,突觸狀態變數記憶體的數量可以200比1的比率顯著超出軸突狀態變數記憶體的數量。當然,此僅是示例性的並且不是限定性的。
根據本案的某些態樣,前述在神經網路的突觸中維 持狀態變數的示例實施500使用通用處理器502。與計算網路(神經網路)相關聯的變數(神經信號)、突觸權重、系統參數,延遲,頻率槽資訊,資格跡資訊,獎勵資訊,及/或神經調製劑(例如,多巴胺)資訊可被儲存在記憶體區塊504中,而在通用處理器502處執行的指令可從程式記憶體506中載入。在本案的一態樣,載入到通用處理器502中的指令可包括用於基於第一預定事件的發生在軸突中維持狀態變數及/或基於該至少一個軸突狀態變數和第二預定事件的發生來更新該狀態變數的代碼。
圖6圖示了根據本案的一些態樣的前述在神經網路的突觸中維持狀態變數的示例實施600,其中記憶體602可經由互連網路604與計算網路(神經網路)的個體(分散式)處理單元(神經處理器)606對接。與計算網路(神經網路)相關聯的變數(神經信號)、突觸權重、系統參數,延遲,頻率槽資訊,資格跡資訊、獎勵資訊及/或神經調製劑(例如多巴胺)資訊可被儲存在記憶體602中,並且可從記憶體602經由互連網路604的(諸)連接被載入到每個處理單元(神經處理器)606中。在本案的一態樣,處理單元606可被配置成基於第一預定事件的發生在軸突中維持狀態變數及/或基於該至少一個軸突狀態變數和第二預定事件的發生來更新該狀態變數。
圖7圖示了前述在神經網路的突觸中維持狀態變數的示例實施700。如圖7中所圖示的,一個記憶體組702可與計算網路(神經網路)的一個處理單元704直接對接。每一個記 憶體組702可儲存與對應的處理單元(神經處理器)704相關聯的變數(神經信號)、突觸權重,及/或系統參數,延遲、頻率槽資訊、資格跡資訊、獎勵資訊,及/或神經調製劑(例如多巴胺)資訊。在本案的一態樣,處理單元704可被配置成基於第一預定事件的發生在軸突中維持狀態變數及/或基於該至少一個軸突狀態變數和第二預定事件的發生來更新該狀態變數。
圖8圖示根據本案的某些態樣的神經網路800的示例實施。如圖8中所圖示的,神經網路800可具有多個局部處理單元802,其可執行本案所描述的方法的各種操作。每個局部處理單元802可包括儲存該神經網路的參數的局部狀態記憶體804和局部參數記憶體806。另外,局部處理單元802可具有用於儲存局部模型程式的局部(神經元)模型程式(LMP)記憶體808、用於儲存局部學習程式的局部學習程式(LLP)記憶體810、以及局部連接記憶體812。此外,如圖8中所圖示的,每個局部處理單元802可與用於提供對局部處理單元的局部記憶體的配置的配置處理單元814對接,並且與提供各局部處理單元802之間的路由的路由連接處理元件816對接。
在一個配置中,神經元模型被配置用於基於第一預定事件的發生在軸突中維持狀態變數及/或基於該至少一個軸突狀態變數和第二預定事件的發生來更新該狀態變數。該神經元模型包括維持手段和更新手段。在一個態樣,該維持手段及/或更新手段可以是被配置成執行所敘述的功能的通用處理器502、程式記憶體506、記憶體區塊504、記憶體602、互 連網路604、處理單元606、處理單元704、局部處理單元802,及/或路由連接處理單元816。在另一配置中,前述手段可以是被配置成執行由前述手段所敘述的功能的任何模組或任何裝置。
根據本案的一些態樣,每一個局部處理單元802可被配置成基於神經網路的一或多個期望功能性特徵來決定神經網路的參數,以及隨著所決定的參數被進一步適配、調諧和更新來使該一或多個功能性特徵朝著期望的功能性特徵發展。
圖9圖示根據本案的各態樣用於在處於尖峰模式中的尖峰神經網路中調制可塑性的時序圖900。在圖9中,圖示神經模組910中的狀態變數以及突觸的狀態變數。在前尖峰事件902發生之際,觸發資格跡904。資格跡904(其是神經模組910中的狀態變數)在每個時間步階處被乘以神經調製劑(多巴胺(Da_F0))906以累積神經模組910中的權重改變908。
突觸920的狀態變數sd被示為sd 918和new_sd(新_sd)922。此是因為在經由圖9圖示的示例性態樣中,可經由移位緩衝器來更新狀態變數sd。如同上面指示的,sd狀態變數可區分例如來自同一前神經元的不同突觸。sd變數可確保前尖峰和後尖峰兩者均存在。sd的幅值可指示前尖峰和後尖峰在時間上有多靠近。
如圖9中所示,在發生重放事件914a之際,可基於前尖峰902a和後尖峰912a來決定狀態變數sd的新值(922)。在重放事件914的時間處,可計算突觸權重更新916。然而,因為 由狀態變數sd更新的突觸權重導致值0(918),所以該突觸無資格接受權重更新(916a)。新sd值(922)可被用來在下一重放事件914b發生之際更新狀態變數sd的值(參見(918b)。
在神經模組910中,在發生重放事件914a之際,累積的權重改變908a可被重置為0(908b)。資格跡被觸發(904a)並開始衰退。因為該神經模組是在尖峰模式中被操作的,所以當提供獎勵輸入924時,觸發了多巴胺尖峰926。神經調製劑信號(Da_F0)(906)可被累積且隨後開始衰退。神經調製劑信號可在每個時間步階被乘以資格跡以累積權重改變(908c)。
在發生下一重放事件(914b)之際,該突觸的sd狀態變數為非零(918b)。相應地,可基於來自神經模組910的累積的權重改變(908c)和sd變數(918b)來做出突觸權重更新(916b)。
圖10圖示根據本案的各態樣用於在處於雙軌模式中的尖峰神經網路中調制可塑性的時序圖1000。如圖10中所示,處於雙軌模式中的神經網路的操作類似於處於尖峰模式中的神經網路的操作。然而,與圖9中示出的尖峰操作相對比,在接收到獎勵輸入1024之際,有多巴胺可用1026且神經調製劑(獎勵)信號可被累積1006。多巴胺1026僅在正值神經調製劑信號保持高於閾值1028時可用。此進而影響累積的權重改變1008。
圖11圖示了用於在尖峰神經網路中的突觸中維持狀態變數的方法1100。在方塊1102中,該神經元模型基於第一 預定事件的發生在軸突中維持狀態變數。而且,在方塊1104中,該神經元模型基於該軸突狀態變數和第二預定事件的發生來更新該突觸中的狀態變數。
以上所描述的方法的各種操作可由能夠執行相應功能的任何合適的手段來執行。該等手段可包括各種硬體及/或軟體元件及/或模組,包括但不限於電路、特殊應用積體電路(ASIC),或處理器。一般而言,在附圖中有圖示的操作的場合,彼等操作可具有帶相似編號的相應配對手段功能元件。
如本文所使用的,術語「決定」涵蓋各種各樣的動作。例如,「決定」可包括演算、計算、處理、推導、研究、檢視(例如,在表、資料庫或其他資料結構中檢視)、探知及諸如此類。另外,「決定」可包括接收(例如接收資訊)、存取(例如存取記憶體中的資料),及類似動作。而且,「決定」可包括解析、選擇、選取、確立及類似動作。
如本文中所使用的,引述一列項目中的「至少一個」的用語是指該等項目的任何組合,包括單個成員。作為實例,「a、b或c中的至少一個」意欲涵蓋:a、b、c、a-b、a-c、b-c和a-b-c。
結合本案所描述的各種說明性邏輯區塊、模組、以及電路可用設計成執行本文所描述功能的通用處理器、數位訊號處理器(DSP)、特殊應用積體電路(ASIC)、現場可程式設計閘陣列信號(FPGA)或其他可程式設計邏輯設備(PLD)、個別閘門或電晶體邏輯、個別的硬體元件或其任何組合來實施或執行。通用處理器可以是微處理器,但在替代方案中 ,該處理器可以是任何市售的處理器、控制器、微控制器,或狀態機。處理器亦可以被實施為計算設備的組合,例如DSP與微處理器的組合、多個微處理器、與DSP核心協同的一或多個微處理器,或任何其他此類配置。
結合本案所描述的方法或演算法的步驟可直接在硬體中、在由處理器執行的軟體模組中,或在該兩者的組合中體現。軟體模組可常駐在本領域所知的任何形式的儲存媒體中。可使用的儲存媒體的一些實例包括隨機存取記憶體(RAM)、唯讀記憶體(ROM)、快閃記憶體、可抹除可程式設計唯讀記憶體(EPROM)、電子可抹除可程式設計唯讀記憶體(EEPROM)、暫存器、硬碟、可移除磁碟、CD-ROM,等等。軟體模組可包括單一指令,或許多數指令,且可分佈在若干不同的程式碼片段上,分佈在不同的程式間以及跨多個儲存媒體分佈。儲存媒體可被耦合到處理器以使得該處理器能從/向該儲存媒體讀寫資訊。替代地,儲存媒體可以被整合到處理器。
本文所揭示的方法包括用於實現所描述的方法的一或多個步驟或動作。該等方法步驟及/或動作可以彼此互換而不會脫離申請專利範圍的範疇。換言之,除非指定了步驟或動作的特定次序,否則特定步驟及/或動作的次序及/或使用可以改動而不會脫離申請專利範圍的範疇。
所描述的功能可在硬體、軟體、韌體或其任何組合中實施。若以硬體實施,則示例硬體設定可包括設備中的處理系統。處理系統可以用匯流排架構來實施。取決於處理系 統的特定應用和整體設計約束,匯流排可包括任何數目的互連匯流排和橋接器。匯流排可將包括處理器、機器可讀取媒體、以及匯流排介面的各種電路連結在一起。匯流排介面可尤其將網路配接器等經由匯流排連接至處理系統。網路配接器可實施信號處理功能。對於一些態樣,使用者介面(例如,小鍵盤、顯示器、滑鼠、操縱桿,等等)亦可以被連接到匯流排。匯流排亦可以連結各種其他電路,諸如時序源、周邊設備、穩壓器、功率管理電路以及類似電路,其在本領域中是眾所周知的,因此將不再進一步描述。
處理器可負責管理匯流排和一般處理,包括執行儲存在機器可讀取媒體上的軟體。處理器可用一或多個通用及/或專用處理器來實施。實例包括微處理器、微控制器、DSP處理器、以及其他能執行軟體的電路系統。軟體應當被寬泛地解釋成意指指令、資料,或其任何組合,無論是被稱作軟體、韌體、仲介軟體、微代碼、硬體描述語言,或其他。作為實例,機器可讀取媒體可包括隨機存取記憶體(RAM)、快閃記憶體、唯讀記憶體(ROM)、可程式設計唯讀記憶體(PROM)、可抹除可程式設計唯讀記憶體(EPROM)、電可抹除可程式設計唯讀記憶體(EEPROM)、暫存器、磁碟、光碟、硬驅動器,或者任何其他合適的儲存媒體,或其任何組合。機器可讀取媒體可被實施在電腦程式產品中。該電腦程式產品可以包括包裝材料。
在硬體實施中,機器可讀取媒體可以是處理系統中與處理器分開的一部分。然而,如本領域技藝人士將容易領 會的,機器可讀取媒體,或其任何部分可在處理系統外部。作為實例,機器可讀取媒體可包括傳輸線、由資料調制的載波,及/或與設備分開的電腦產品,所有該等皆可由處理器經由匯流排介面來存取。替代地或另外地,機器可讀取媒體,或其任何部分可被整合到處理器中,諸如快取記憶體及/或通用暫存器檔案可能就是此種情形。儘管所論述的各種元件可被描述為具有特定位置,諸如局部元件,但其亦可按各種方式來配置,諸如一些元件被配置成分散式運算系統的一部分。
處理系統可以被配置為通用處理系統,該通用處理系統具有一或多個提供處理器功能性的微處理器和提供機器可讀取媒體中的至少一部分的外部記憶體,其皆經由外部匯流排架構與其他支援電路系統連結在一起。替代地,該處理系統可以包括一或多個神經元形態處理器以用於實施本文所述的神經元模型和神經系統模型。作為另一替代方案,處理系統可以用帶有整合在單塊晶片中的處理器、匯流排介面、使用者介面、支援電路系統和至少一部分機器可讀取媒體的特殊應用積體電路(ASIC)來實施,或者用一或多個現場可程式設計閘陣列(FPGA)、可程式設計邏輯裝置(PLD)、控制器、狀態機、閘控邏輯、個別硬體元件,或者任何其他合適的電路系統,或者能執行本案通篇所描述的各種功能性的電路的任何組合來實施。取決於特定應用和加諸於整體系統上的整體設計約束,本領域技藝人士將認識到如何最佳地實施關於處理系統所描述的功能性。
機器可讀取媒體可包括數個軟體模組。該等軟體模組包括當由處理器執行時使處理系統執行各種功能的指令。該等軟體模組可包括傳輸模組和接收模組。每個軟體模組可以常駐在單個存放裝置中或者跨多個存放裝置分佈。作為實例,當觸發事件發生時,可以從硬驅動器中將軟體模組載入到RAM中。在軟體模組執行期間,處理器可以將一些指令載入到快取記憶體中以提高存取速度。隨後可將一或多個快取記憶體行載入到通用暫存器檔案中以供由處理器執行。在以下談及軟體模組的功能性時,將理解此類功能性是在處理器執行來自該軟體模組的指令時由該處理器來實施的。
若以軟體實施,則各功能可作為一或多數指令或代碼儲存在電腦可讀取媒體上或藉其進行傳送。電腦可讀取媒體包括電腦儲存媒體和通訊媒體兩者,該等媒體包括促成電腦程式從一地向另一地轉移的任何媒體。儲存媒體可以是能被電腦存取的任何可用媒體。作為示例而非限定,此種電腦可讀取媒體可包括RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存設備,或能攜帶或儲存指令或資料結構形式的期望程式碼且能被電腦存取的任何其他媒體。另外,任何連接亦被正當地稱為電腦可讀取媒體。例如,若軟體是使用同軸電纜、光纖電纜、雙絞線、數位用戶線(DSL),或無線技術(諸如紅外(IR)、無線電、以及微波)從web網站、伺服器,或其他遠端源傳送而來,則該同軸電纜、光纖電纜、雙絞線、DSL或無線技術(諸如紅外、無線電、以及微波)就被包括在媒體的定義之中。如本文中 所使用的盤(disk)和碟(disc)包括壓縮光碟(CD)、鐳射光碟、光碟、數位多功能光碟(DVD)、軟碟和藍光®光碟,其中盤(disk)常常磁性地再現資料,而碟(disc)用鐳射來光學地再現資料。因此,在一些態樣,電腦可讀取媒體可包括非瞬態電腦可讀取媒體(例如,有形媒體)。另外,對於其他態樣,電腦可讀取媒體可包括瞬態電腦可讀取媒體(例如,信號)。上述的組合應當亦被包括在電腦可讀取媒體的範圍內。
因此,一些態樣可包括用於執行本文中提供的操作的電腦程式產品。例如,此類電腦程式產品可包括其上儲存(及/或編碼)有指令的電腦可讀取媒體,該等指令能由一或多個處理器執行以執行本文中所描述的操作。對於一些態樣,電腦程式產品可包括包裝材料。
此外,應當領會,用於執行本文中所描述的方法和技術的模組及/或其他合適手段能由使用者終端及/或基地台在適用的場合下載及/或以其他方式獲得。例如,此類設備能被耦合至伺服器以促成用於執行本文中所描述的方法的手段的轉移。替代地,本文所述的各種方法能經由儲存裝置(例如,RAM、ROM、諸如壓縮光碟(CD)或軟碟等實體儲存媒體等)來提供,以使得一旦將該儲存手段耦合至或提供給使用者終端及/或基地台,該設備就能獲得各種方法。此外,可利用適於向設備提供本文中所描述的方法和技術的任何其他合適的技術。
將理解,申請專利範圍並不被限定於以上所說明的 精確配置和元件。可在以上所描述的方法和設備的佈局、操作和細節上作出各種改動、更換和變形而不會脫離申請專利範圍的範疇。
1100‧‧‧方法
1102‧‧‧方塊
1104‧‧‧方塊

Claims (30)

  1. 一種用於在一神經網路的一突觸中維持一狀態變數的方法,該方法包括以下步驟:在一軸突中維持至少一個狀態變數,該軸突中的該至少一個狀態變數至少部分基於一第一預定事件的一發生而被更新;及至少部分基於該軸突中的該至少一個狀態變數以及一第二預定事件的一發生而更新該突觸中的該狀態變數。
  2. 如請求項1所述之方法,其中該第一預定事件包括一軸突狀態更新。
  3. 如請求項2所述之方法,其中該軸突狀態更新是在每時間步階基礎上執行的。
  4. 如請求項1所述之方法,其中該第一預定事件包括一獎勵輸入事件。
  5. 如請求項1所述之方法,其中該第二預定事件包括一尖峰事件或一尖峰重放事件。
  6. 如請求項1所述之方法,其中該軸突中的該至少一個狀態變數隨時間衰退並且隨時間被迴旋以補償一時間差。
  7. 如請求項1所述之方法,其中該突觸中的該狀態變數包括一權重。
  8. 如請求項1所述之方法,其中該軸突中的該至少一個狀態變數包括一資格跡。
  9. 如請求項1所述之方法,其中該軸突中的該至少一個狀態變數包括一累積的權重。
  10. 如請求項1所述之方法,其中該軸突中的該至少一個狀態變數是影響複數個突觸的一全域值。
  11. 如請求項1所述之方法,其中該軸突中的該至少一個狀態變數和該突觸的該狀態變數被儲存在不同的記憶體中。
  12. 如請求項11所述之方法,其中該等不同的記憶體是在不同的位置中提供的。
  13. 如請求項11所述之方法,其中該等不同的記憶體具有不同的存取速度。
  14. 如請求項11所述之方法,其中儲存該突觸的該狀態變數的記憶體的數量顯著超出儲存該軸突中的該至少一個狀態變數的記憶體的數量。
  15. 如請求項1所述之方法,其中該更新步驟是至少部分基於突觸資格來選通的。
  16. 如請求項15所述之方法,其中該突觸資格是至少部分基於一突觸前尖峰和一突觸後尖峰的一時間鄰近度來決定的。
  17. 一種用於在一神經網路的一突觸中維持一狀態變數的裝置,包括:一記憶體;耦合到該記憶體的至少一個處理器,該至少一個處理器配置成:在一軸突中維持至少一個狀態變數,該軸突中的該至少一個狀態變數至少部分基於一第一預定事件的一發生而被更新;及至少部分基於該軸突中的該至少一個狀態變數以及一第二預定事件的一發生而更新該突觸中的該狀態變數。
  18. 如請求項17所述之裝置,其中該第一預定事件包括一軸突狀態更新。
  19. 如請求項18所述之裝置,其中該至少一個處理器被進一步配置成在一每時間步階基礎上執行該軸突狀態更新。
  20. 如請求項17所述之裝置,其中該第一預定事件包括一獎勵輸入事件。
  21. 如請求項17所述之裝置,其中該第二預定事件包括一尖峰事件或一尖峰重放事件。
  22. 如請求項17所述之裝置,其中該至少一個處理器被進一步配置成維持該軸突中的該至少一個狀態變數以使得該軸突中的該至少一個狀態變數隨時間衰退並且隨時間被迴旋以補償一時間差。
  23. 如請求項17所述之裝置,其中該突觸中的該狀態變數包括一權重且該軸突中的該至少一個狀態變數包括一累積的權重。
  24. 如請求項17所述之裝置,其中該軸突中的該至少一個狀態變數是影響複數個突觸的一全域值。
  25. 如請求項17所述之裝置,其中該軸突中的該至少一個狀態變數和該突觸的該狀態變數被儲存在不同的記憶體中。
  26. 如請求項25所述之裝置,其中該等不同的記憶體是在不同的位置中提供的或具有不同的存取速度。
  27. 如請求項25所述之裝置,其中儲存該突觸的該狀態變數的記憶體的數量顯著超出儲存該軸突中的該至少一個狀態變數的記憶體的數量。
  28. 如請求項17所述之裝置,其中該至少一個處理器被進一步配置成至少部分基於一突觸資格來選通該突觸中的該狀態變數的更新,該突觸資格是至少部分基於一突觸前尖峰和一突觸後尖峰的一時間鄰近度來決定的。
  29. 一種用於在一神經網路的一突觸中維持一狀態變數的裝置,包括:用於在一軸突中維持至少一個狀態變數的手段,該軸突中的該至少一個狀態變數至少部分基於一第一預定事件的一發生而被更新;及用於至少部分基於該軸突中的該至少一個狀態變數以及一第二預定事件的一發生而更新該突觸中的該狀態變數的手段。
  30. 一種用於在一神經網路的一突觸中維持一狀態變數的電腦程式產品,包括:一非瞬態電腦可讀取媒體,該非瞬態電腦可讀取媒體上編碼有程式碼,該程式碼包括:用於在一軸突中維持至少一個狀態變數的程式碼,該軸突中的該至少一個狀態變數至少部分基於一第一預定事件的 一發生而被更新;及用於至少部分基於該軸突中的該至少一個狀態變數以及一第二預定事件的一發生而更新該突觸中的該狀態變數的程式碼。
TW104109401A 2014-04-08 2015-03-24 在尖峰神經網路中藉由全域標量值來調制可塑性 TW201602924A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US14/248,211 US20150286925A1 (en) 2014-04-08 2014-04-08 Modulating plasticity by global scalar values in a spiking neural network

Publications (1)

Publication Number Publication Date
TW201602924A true TW201602924A (zh) 2016-01-16

Family

ID=53059393

Family Applications (1)

Application Number Title Priority Date Filing Date
TW104109401A TW201602924A (zh) 2014-04-08 2015-03-24 在尖峰神經網路中藉由全域標量值來調制可塑性

Country Status (8)

Country Link
US (1) US20150286925A1 (zh)
EP (1) EP3129921A2 (zh)
JP (1) JP2017519268A (zh)
KR (1) KR20160145636A (zh)
CN (1) CN106164940A (zh)
BR (1) BR112016023535A2 (zh)
TW (1) TW201602924A (zh)
WO (1) WO2015156989A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI653584B (zh) 2017-09-15 2019-03-11 中原大學 利用非揮發性記憶體完成類神經網路訓練的方法

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102499396B1 (ko) 2017-03-03 2023-02-13 삼성전자 주식회사 뉴럴 네트워크 장치 및 뉴럴 네트워크 장치의 동작 방법
CN108665061B (zh) * 2017-03-28 2021-06-15 华为技术有限公司 数据处理装置和用于卷积计算的计算设备
KR102592146B1 (ko) * 2017-11-06 2023-10-20 삼성전자주식회사 시냅스 가중치 학습을 위한 뉴런 회로, 시스템 및 방법
CN108009636B (zh) * 2017-11-16 2021-12-07 华南师范大学 深度学习神经网络进化方法、装置、介质和计算机设备
CN108388213B (zh) * 2018-02-05 2019-11-08 浙江天悟智能技术有限公司 基于局部可塑性回声状态网络的聚酯纺丝工艺控制方法
US10846593B2 (en) * 2018-04-27 2020-11-24 Qualcomm Technologies Inc. System and method for siamese instance search tracker with a recurrent neural network
CN109919305A (zh) * 2018-11-12 2019-06-21 中国科学院自动化研究所 基于自主决策脉冲神经网络的响应动作确定方法及系统
US11526735B2 (en) * 2018-12-16 2022-12-13 International Business Machines Corporation Neuromorphic neuron apparatus for artificial neural networks
US11727252B2 (en) 2019-08-30 2023-08-15 International Business Machines Corporation Adaptive neuromorphic neuron apparatus for artificial neural networks
CN113011573B (zh) * 2021-03-18 2024-04-16 北京灵汐科技有限公司 一种权重处理方法及装置、电子设备和可读存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5630024A (en) * 1994-01-19 1997-05-13 Nippon Telegraph And Telephone Corporation Method and apparatus for processing using neural network with reduced calculation amount
US7330369B2 (en) * 2004-04-06 2008-02-12 Bao Tran NANO-electronic memory array
US8200593B2 (en) * 2009-07-20 2012-06-12 Corticaldb Inc Method for efficiently simulating the information processing in cells and tissues of the nervous system with a temporal series compressed encoding neural network
US8892487B2 (en) * 2010-12-30 2014-11-18 International Business Machines Corporation Electronic synapses for reinforcement learning
US9424513B2 (en) * 2011-11-09 2016-08-23 Qualcomm Incorporated Methods and apparatus for neural component memory transfer of a referenced pattern by including neurons to output a pattern substantially the same as the referenced pattern
US8475063B1 (en) * 2012-01-02 2013-07-02 Chung Jen Chang Lens cap
US9208431B2 (en) * 2012-05-10 2015-12-08 Qualcomm Incorporated Method and apparatus for strategic synaptic failure and learning in spiking neural networks

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI653584B (zh) 2017-09-15 2019-03-11 中原大學 利用非揮發性記憶體完成類神經網路訓練的方法

Also Published As

Publication number Publication date
CN106164940A (zh) 2016-11-23
US20150286925A1 (en) 2015-10-08
WO2015156989A2 (en) 2015-10-15
WO2015156989A3 (en) 2015-12-03
JP2017519268A (ja) 2017-07-13
EP3129921A2 (en) 2017-02-15
BR112016023535A2 (pt) 2017-08-15
KR20160145636A (ko) 2016-12-20

Similar Documents

Publication Publication Date Title
TW201602924A (zh) 在尖峰神經網路中藉由全域標量值來調制可塑性
US9542643B2 (en) Efficient hardware implementation of spiking networks
US10339447B2 (en) Configuring sparse neuronal networks
US9330355B2 (en) Computed synapses for neuromorphic systems
US20150242741A1 (en) In situ neural network co-processing
US9558442B2 (en) Monitoring neural networks with shadow networks
US9886663B2 (en) Compiling network descriptions to multiple platforms
TWI585695B (zh) 用於定義多個神經元的動態的方法、設備及電腦可讀取媒體
US20150212861A1 (en) Value synchronization across neural processors
TW201541372A (zh) 使用尖峰發放神經元的人工神經網路和感知器學習
TW201541374A (zh) 用於隨機尖峰貝氏網路的基於事件的推斷和學習
US9959499B2 (en) Methods and apparatus for implementation of group tags for neural models
TW201533668A (zh) 基於突觸前尖峰的短期突觸記憶
TW201528162A (zh) 在尖峰神經網路中使用重放來實施突觸學習
US20150278685A1 (en) Probabilistic representation of large sequences using spiking neural network
TWI550530B (zh) 用於產生尖峰定時依賴可塑性曲線的緊湊表示的方法、設備、電腦可讀取媒體及電腦程式產品
TW201525883A (zh) 在多維範圍上評估包括可分離子系統的系統
US9460384B2 (en) Effecting modulation by global scalar values in a spiking neural network
US9342782B2 (en) Stochastic delay plasticity
US20140365413A1 (en) Efficient implementation of neural population diversity in neural system
US20150213356A1 (en) Method for converting values into spikes
TW201537475A (zh) 藉由對突觸後電位進行整形來實現的等效延遲
US20150242742A1 (en) Imbalanced cross-inhibitory mechanism for spatial target selection