JP2016536679A - ニューラルシミュレータ用の共有メモリアーキテクチャ - Google Patents

ニューラルシミュレータ用の共有メモリアーキテクチャ Download PDF

Info

Publication number
JP2016536679A
JP2016536679A JP2016521702A JP2016521702A JP2016536679A JP 2016536679 A JP2016536679 A JP 2016536679A JP 2016521702 A JP2016521702 A JP 2016521702A JP 2016521702 A JP2016521702 A JP 2016521702A JP 2016536679 A JP2016536679 A JP 2016536679A
Authority
JP
Japan
Prior art keywords
memory
artificial
neuron
allocating
nervous system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016521702A
Other languages
English (en)
Other versions
JP2016536679A5 (ja
Inventor
ランガン、ベンカト
ベングジン、ヤン・クシシュトフ
レビン、ジェフレイ・アレキサンダー
ダニエルス、ジョン・ポール
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2016536679A publication Critical patent/JP2016536679A/ja
Publication of JP2016536679A5 publication Critical patent/JP2016536679A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Neurology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Debugging And Monitoring (AREA)
  • Image Analysis (AREA)
  • For Increasing The Reliability Of Semiconductor Memories (AREA)

Abstract

本開示の態様は、ハードウェアに実装された人工神経系シミュレータにおいてメモリを割り振るための方法および装置を提供する。本開示の態様によれば、シミュレートされている人工神経系の1つまたは複数の構成要素のためのメモリリソース要件が決定され得、決定に基づいて、共有メモリプールの一部(オンチップおよび/またはオフチップRAMを含み得る)が構成要素に割り振られ得る。

Description

米国特許法第119条による優先権の主張
[0001]本出願は、2013年10月11日に出願された米国仮特許出願第61/889,682号、および2014年8月5日に出願された米国特許出願第14/451,954号の利益を主張し、その両方は、参照により全体が本明細書に組み込まれる。
[0002]本開示のいくつかの態様は、一般に人工神経系に関し、より詳細には、ハードウェアシミュレータにおいてそのような人工神経系の構成要素にメモリを割り振るために使用され得る方法および装置に関する。
[0003]人工ニューロン(すなわち、ニューラル処理ユニット)の相互結合されたグループを備え得る人工ニューラルネットワークは、計算デバイスであるか、または計算デバイスによって実行される方法を表す。人工ニューラルネットワークは、生物学的ニューラルネットワークにおける対応する構造および/または機能を有し得る。しかしながら、人工ニューラルネットワークは、従来の計算技法が厄介、実行不可能または不適切であるいくつかの適用例に革新的で有用な計算技法を提供することができる。人工ニューラルネットワークが観測から機能を推論することができるので、そのようなネットワークは、タスクまたはデータの複雑さが従来の技法による機能の設計を面倒にする適用例において、特に有用である。
[0004]1つのタイプの人工ニューラルネットワークはスパイキングニューラルネットワークであり、これは、それの動作モデルならびにニューロンおよびシナプスの状態に時間の概念を組み込み、それによって、ニューラルネットワークにおける計算機能の発生元となり得る挙動の豊かなセットを提供する。スパイキングニューラルネットワークは、ニューロンがニューロンの状態に基づいて特定の(1つまたは複数の)時間に発火する、または「スパイクする」という概念、および時間がニューロン機能にとって重要であるという概念に基づく。ニューロンが発火するとき、そのニューロンは、他のニューロンに進むスパイクを生成し、他のニューロンは、今度は、このスパイクが受信された時間に基づいてそれらの状態を調整することができる。言い換えれば、ニューラルネットワークにおけるスパイクの相対的タイミングまたは絶対的タイミングで情報が符号化され得る。
[0005]本開示のいくつかの態様は、一般に、ハードウェアに実装された人工神経系シミュレータにおいてメモリを割り振るための方法に関する。本方法は、一般に、シミュレートされている人工神経系の1つまたは複数の構成要素のためのメモリリソース要件を決定することと、決定に基づいて、共有メモリプールの一部を構成要素に割り振ることとを含む。
[0006]本開示のいくつかの態様はまた、上述の動作を実行するための様々な装置およびプログラム製品を提供する。
[0007]本開示のいくつかの態様は、ハードウェアに実装された人工神経系シミュレータにおいてメモリを割り振るための装置を提供する。本装置は、一般に、シミュレートされている人工神経系の1つまたは複数の構成要素のためのメモリリソース要件を決定して、決定に基づいて、共有メモリプールの一部を構成要素に割り振るように構成された処理システムを含む。
[0008]本開示のいくつかの態様は、ハードウェアに実装された人工神経系シミュレータにおいてメモリを割り振るための装置を提供する。本装置は、一般に、シミュレートされている人工神経系の1つまたは複数の構成要素のためのメモリリソース要件を決定するための手段と、決定に基づいて、共有メモリプールの一部を構成要素に割り振るための手段とを含む。
[0009]本開示のいくつかの態様は、記憶されたコンピュータによって実行可能な命令を有するコンピュータ可読媒体を提供する。本命令は、シミュレートされている人工神経系の1つまたは複数の構成要素のためのメモリリソース要件を決定して、決定に基づいて、共有メモリプールの一部を構成要素に割り振るために実行可能である。
[0010]本開示の上述の特徴が詳細に理解され得るように、添付の図面にその一部が示される態様を参照することによって、上記で簡単に要約された内容のより具体的な説明が得られ得る。ただし、その説明は他の等しく有効な態様に通じ得るので、添付の図面は、本開示のいくつかの典型的な態様のみを示し、したがって、本開示の範囲を限定するものと見なされるべきではないことに留意されたい。
[0011]本開示のいくつかの態様によるニューロンの例示的なネットワークを示す図。 [0012]本開示のいくつかの態様による、計算ネットワーク(ニューラルシステムまたはニューラルネットワーク)の例示的な処理ユニット(ニューロン)を示す図。 [0013]本開示のいくつかの態様による例示的なスパイクタイミング依存可塑性(STDP)曲線を示す図。 [0014]本開示のいくつかの態様による、ニューロンの挙動を定義するための正レジームと負レジームとを示す、人工ニューロンに関する状態の例示的なグラフ。 [0015]本開示のいくつかの態様による、ニューラルモデルのメモリを割り振るための例示的な動作の流れ図。 [0016]図5に示される動作を実行することが可能な例示的手段を示す図。 [0017]本開示のいくつかの態様による、汎用プロセッサを使用して人工神経系を操作するための例示的な実装形態を示す図。 [0018]本開示のいくつかの態様による、メモリが個々の分散処理ユニットとインターフェースされ得る人工神経系を操作するための例示的な実装形態を示す図。 [0019]本開示のいくつかの態様による、分散メモリおよび分散処理ユニットに基づいて人工神経系を操作するための例示的な実装形態を示す図。 [0020]本開示のいくつかの態様による、ニューラルネットワークの例示的な実装形態を示す図。 [0021]本開示のいくつかの態様による、人工神経系の例示的なハードウェア実装形態を示す図。
[0022]添付の図面を参照しながら本開示の様々な態様について以下でより十分に説明する。ただし、本開示は、多くの異なる形態で実施され得、本開示全体にわたって提示される任意の特定の構造または機能に限定されるものと解釈されるべきではない。むしろ、これらの態様は、本開示が周到で完全になり、本開示の範囲を当業者に十分に伝えるように与えられる。本明細書の教示に基づいて、本開示の範囲は、本開示の任意の他の態様とは無関係に実装されるにせよ、本開示の任意の他の態様と組み合わされるにせよ、本明細書で開示する本開示のいかなる態様をもカバーするものであることを、当業者なら諒解されたい。たとえば、本明細書に記載される態様をいくつ使用しても、装置は実装され得、または方法は実施され得る。さらに、本開示の範囲は、本明細書に記載される本開示の様々な態様に加えてまたはそれらの態様以外に、他の構造、機能、または構造および機能を使用して実施されるそのような装置または方法をカバーするものとする。本明細書で開示する本開示のいずれの態様も、請求項の1つまたは複数の要素によって実施され得ることを理解されたい。
[0023]「例示的」という単語は、本明細書では「例、事例、または例示の働きをすること」を意味するために使用される。「例示的」として本明細書で説明するいかなる態様も、必ずしも他の態様よりも好ましいまたは有利であると解釈されるべきであるとは限らない。
[0024]本明細書では特定の態様について説明するが、これらの態様の多くの変形および置換は本開示の範囲内に入る。好ましい態様のいくつかの利益および利点が説明されるが、本開示の範囲は特定の利益、使用、または目的に限定されるものではない。むしろ、本開示の態様は、様々な技術、システム構成、ネットワーク、およびプロトコルに広く適用可能であるものとし、そのうちのいくつかを例として図および好ましい態様についての以下の説明で示す。発明を実施するための形態および図面は、本開示を限定するものではなく説明するものにすぎず、本開示の範囲は添付の特許請求の範囲およびそれの均等物によって定義される。
例示的なニューラルシステム
[0025]図1は、本開示のいくつかの態様による、複数のレベルのニューロンをもつ例示的なニューラルシステム100を示す。ニューラルシステム100は、シナプス結合のネットワーク104(すなわち、フィードフォワード結合)を介してニューロンの別のレベル106に結合されたニューロンのあるレベル102を備え得る。簡単のために、図1には2つのレベルのニューロンのみが示されているが、典型的なニューラルシステムには、より少ないまたはより多くのレベルのニューロンが存在し得る。ニューロンのいくつかは、ラテラル結合を介して同じ層の他のニューロンに結合し得ることに留意されたい。さらに、ニューロンのいくつかは、フィードバック結合を介して前の層のニューロンに戻る形で結合し得る。
[0026]図1に示すように、レベル102における各ニューロンは、前のレベル(図1に図示せず)の複数のニューロンによって生成され得る入力信号108を受信し得る。信号108は、レベル102のニューロンへの入力(たとえば、入力電流)を表し得る。そのような入力は、膜電位を充電するためにニューロン膜上に蓄積され得る。膜電位がそれのしきい値に達すると、ニューロンは、発火し、ニューロンの次のレベル(たとえば、レベル106)に転送されるべき出力スパイクを生成し得る。そのような挙動は、アナログおよびデジタル実装形態を含むハードウェアおよび/またはソフトウェアでエミュレートまたはシミュレートされ得る。
[0027]生物学的ニューロンでは、ニューロンが発火するときに生成される出力スパイクは、活動電位と呼ばれる。電気信号は、約100mVの振幅と約1msの持続時間とを有する比較的急速で、一時的で、全か無かの神経インパルスである。一連の結合されたニューロンを有するニューラルシステムの特定の態様(たとえば、図1におけるあるレベルのニューロンから別のレベルのニューロンへのスパイクの転送)では、あらゆる活動電位が基本的に同じ振幅と持続時間とを有するので、信号における情報は、振幅によってではなく、スパイクの周波数および数(またはスパイクの時間)によってのみ表される。活動電位によって搬送される情報は、スパイク、スパイクしたニューロン、および1つまたは複数の他のスパイクに対するスパイクの時間によって決定される。
[0028]図1に示すように、あるレベルのニューロンから別のレベルのニューロンへのスパイクの転送は、シナプス結合(または単に「シナプス」)のネットワーク104によって達成され得る。シナプス104は、レベル102のニューロン(シナプス104に対するシナプス前ニューロン)から出力信号(すなわち、スパイク)を受信し得る。いくつかの態様では、これらの信号は、調整可能なシナプス重み
Figure 2016536679
(ここでPは、レベル102のニューロンとレベル106のニューロンとの間のシナプス結合の総数である)に従ってスケーリングされ得る。他の態様では、シナプス104は、いかなるシナプス重みをも適用しないことがある。さらに、(スケーリングされた)信号は、レベル106における各ニューロン(シナプス104に対するシナプス後ニューロン)の入力信号として合成され得る。レベル106におけるあらゆるニューロンは、対応する合成された入力信号に基づいて、出力スパイク110を生成し得る。出力スパイク110は、次いで、シナプス結合の別のネットワーク(図1には図示せず)を使用して、別のレベルのニューロンに転送され得る。
[0029]生物学的シナプスは、電気シナプスまたは化学シナプスのいずれに分類され得る。電気シナプスは、興奮性信号を送るために主に使用される一方、化学シナプスは、シナプス後ニューロンにおける興奮性活動または抑制性(過分極化)活動のいずれかを調停することができ、ニューロン信号を増幅する役目を果たすこともできる。興奮性信号は通常、膜電位を脱分極する(すなわち、静止電位に対して膜電位を増加させる)。しきい値を超えて膜電位を脱分極するために十分な興奮性信号が一定期間内に受信された場合、シナプス後ニューロンに活動電位が生じる。対照的に、抑制性信号は一般に、膜電位を過分極する(すなわち、低下させる)。抑制性信号は、十分に強い場合、興奮性信号のすべてを相殺し、膜電位がしきい値に達するのを防止することができる。シナプス興奮を相殺することに加えて、シナプス抑制は、自然に活発なニューロンに対して強力な制御を行うことができる。自然に活発なニューロンは、たとえば、それのダイナミクスまたはフィードバックに起因するさらなる入力なしにスパイクするニューロンを指す。これらのニューロンにおける活動電位の自然な生成を抑圧することによって、シナプス抑制は、一般にスカルプチャリングと呼ばれる、ニューロンの発火のパターンを形成することができる。様々なシナプス104は、望まれる挙動に応じて、興奮性シナプスまたは抑制性シナプスの任意の組合せとして働き得る。
[0030]ニューラルシステム100は、汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)もしくは他のプログラマブル論理デバイス(PLD)、個別ゲートもしくはトランジスタ論理、個別ハードウェア構成要素、プロセッサによって実行されるソフトウェアモジュール、またはそれらの任意の組合せによってエミュレートされ得る。ニューラルシステム100は、たとえば画像およびパターン認識、機械学習、モータ制御など、かなりの適用範囲において利用され得る。ニューラルシステム100における各ニューロンは、ニューロン回路として実装され得る。出力スパイクを開始するしきい値まで充電されるニューロン膜は、たとえば、そこを通って流れる電流を積分するキャパシタとして実装され得る。
[0031]一態様では、キャパシタは、ニューロン回路の電流積分デバイスとして除去され得、その代わりにより小さいメモリスタ(memristor)要素が使用され得る。この手法は、ニューロン回路において、ならびにかさばるキャパシタが電流積分器として利用される様々な他の適用例において適用され得る。さらに、シナプス104の各々は、メモリスタ要素に基づいて実装され得、シナプス重みの変化は、メモリスタ抵抗の変化に関係し得る。ナノメートルの特徴サイズのメモリスタを用いると、ニューロン回路およびシナプスの面積が大幅に低減され得、それによって、非常に大規模なニューラルシステムハードウェア実装形態の実装が実用的になり得る。
[0032]ニューラルシステム100をエミュレートするニューラルプロセッサの機能は、ニューロン間の結合の強さを制御し得る、シナプス結合の重みに依存し得る。シナプス重みは、パワーダウン後にプロセッサの機能を維持するために、不揮発性メモリに記憶され得る。一態様では、シナプス重みメモリは、主たるニューラルプロセッサチップとは別個の外部チップ上に実装され得る。シナプス重みメモリは、交換可能メモリカードとしてニューラルプロセッサチップとは別個にパッケージ化され得る。これは、ニューラルプロセッサに多様な機能を提供することができ、特定の機能は、ニューラルプロセッサに現在取り付けられているメモリカードに記憶されたシナプス重みに基づき得る。
[0033]図2は、本開示のいくつかの態様による、計算ネットワーク(たとえば、ニューラルシステムまたはニューラルネットワーク)の処理ユニット(たとえば、人工ニューロン202)の一例200を示す。たとえば、ニューロン202は、図1のレベル102のニューロンおよび106のニューロンのうちのいずれかに対応し得る。ニューロン202は、ニューラルシステムの外部にある信号、または同じニューラルシステムの他のニューロンによって生成された信号、またはその両方であり得る、複数の入力信号2041〜204N(x1〜xN)を受信し得る。入力信号は、電流または電圧、実数値または複素数値であり得る。入力信号は、固定小数点表現または浮動小数点表現をもつ数値を備え得る。これらの入力信号は、調整可能なシナプス重み2061〜206N(w1〜wN)に従って信号をスケーリングするシナプス結合を通してニューロン202に伝えられ得、Nはニューロン202の入力接続の総数であり得る。
[0034]ニューロン202は、スケーリングされた入力信号を合成し、合成された、スケーリングされた入力を使用して、出力信号208(すなわち、信号y)を生成し得る。出力信号208は、電流または電圧、実数値または複素数値であり得る。出力信号は、固定小数点表現または浮動小数点表現をもつ数値を備え得る。出力信号208は、次いで、同じニューラルシステムの他のニューロンへの入力信号として、または同じニューロン202への入力信号として、またはニューラルシステムの出力として伝達され得る。
[0035]処理ユニット(ニューロン202)は電気回路によってエミュレートされ得、それの入力接続および出力接続は、シナプス回路をもつワイヤによってエミュレートされ得る。処理ユニット、それの入力接続および出力接続はまた、ソフトウェアコードによってエミュレートされ得る。処理ユニットはまた、電気回路によってエミュレートされ得るが、それの入力接続および出力接続はソフトウェアコードによってエミュレートされ得る。一態様では、計算ネットワーク中の処理ユニットはアナログ電気回路を備え得る。別の態様では、処理ユニットはデジタル電気回路を備え得る。さらに別の態様では、処理ユニットは、アナログ構成要素とデジタル構成要素の両方をもつ混合信号電気回路を備え得る。計算ネットワークは、上述の形態のいずれかにおける処理ユニットを備え得る。そのような処理ユニットを使用した計算ネットワーク(ニューラルシステムまたはニューラルネットワーク)は、たとえば画像およびパターン認識、機械学習、モータ制御など、かなりの適用範囲において利用され得る。
[0036]ニューラルネットワークをトレーニングする過程で、シナプス重み(たとえば、図1の重み
Figure 2016536679
および/または図2の重み2061〜206N)がランダム値により初期化され得、学習ルールに従って増加または減少し得る。学習ルールのいくつかの例として、スパイクタイミング依存可塑性(STDP)学習ルール、Hebb則、Oja則、Bienenstock−Copper−Munro(BCM)則などがある。非常に多くの場合、重みは、2つの値のうちの1つに安定し得る(すなわち、重みの双峰分布)。この効果が利用されて、シナプス重み当たりのビット数を低減し、シナプス重みを記憶するメモリとの間の読取りおよび書込みの速度を上げ、シナプスメモリの電力消費量を低減し得る。
シナプスタイプ
[0037]ニューラルネットワークのハードウェアおよびソフトウェアモデルでは、シナプス関係機能の処理がシナプスタイプに基づき得る。シナプスタイプは、非塑性シナプス(non-plastic synapse)(重みおよび遅延の変化がない)と、可塑性シナプス(重みが変化し得る)と、構造遅延可塑性シナプス(重みおよび遅延が変化し得る)と、完全可塑性シナプス(重み、遅延および結合性が変化し得る)と、それの変形(たとえば、遅延は変化し得るが、重みまたは結合性の変化はない)とを備え得る。これの利点は、処理が再分割され得ることである。たとえば、非塑性シナプスは、可塑性機能を実行すること(またはそのような機能が完了するのを待つこと)を必要とし得ない。同様に、遅延および重み可塑性は、一緒にまたは別々に、順にまたは並列に動作し得る動作に再分割され得る。異なるタイプのシナプスは、適用される異なる可塑性タイプの各々の異なるルックアップテーブルまたは式およびパラメータを有し得る。したがって、本方法は、シナプスのタイプの関係するテーブルにアクセスすることになる。
[0038]また、スパイクタイミング依存構造可塑性がシナプス可塑性とは無関係に実行され得るという事実のさらなる含意がある。構造可塑性(すなわち、遅延量の変化)は前後スパイク時間差(pre-post spike time difference)の直接関数であり得るので、構造可塑性は、重みの大きさに変化がない場合(たとえば、重みが最小値または最大値に達したか、あるいはそれが何らかの他の理由により変更されない場合)でも実行され得る。代替的に、それは、重み変化量に応じて、または重みもしくは重み変化の限界に関係する条件に基づいて設定され得る。たとえば、重み変化が生じたとき、または重みが最大限に達するのではなく、重みがゼロに達した場合のみ、シナプス遅延が変化し得る。しかしながら、これらのプロセスが並列化され、メモリアクセスの数および重複を低減し得るように、独立した機能を有することが有利であり得る。
シナプス可塑性の決定
[0039]神経可塑性(または単に「可塑性」)は、脳内のニューロンおよびニューラルネットワークがそれらのシナプス結合と挙動とを新しい情報、感覚上の刺激、発展、損傷または機能不全に応答して変える能力である。可塑性は、生物学における学習および記憶にとって、また計算論的神経科学およびニューラルネットワークにとって重要である。(たとえば、Hebb則理論による)シナプス可塑性、スパイクタイミング依存可塑性(STDP)、非シナプス可塑性、活性依存可塑性、構造可塑性および恒常的可塑性など、様々な形の可塑性が研究されている。
[0040]STDPは、脳内の場合のようなニューロン間のシナプス結合の強さを調整する学習プロセスである。結合強度は、特定のニューロンの出力スパイクおよび受信入力スパイク(すなわち、活動電位)の相対的タイミングに基づいて調整される。STDPプロセスの下で、あるニューロンに対する入力スパイクが、平均して、そのニューロンの出力スパイクの直前に生じる傾向がある場合、長期増強(LTP)が生じ得る。その場合、その特定の入力はいくらか強くなる。対照的に、入力スパイクが、平均して、出力スパイクの直後に生じる傾向がある場合、長期抑圧(LTD)が生じ得る。その場合、その特定の入力はいくらか弱くなるので、「スパイクタイミング依存可塑性」と呼ばれる。したがって、シナプス後ニューロンの興奮の原因であり得る入力は、将来的に寄与する可能性がさらに高くなる一方、シナプス後スパイクの原因ではない入力は、将来的に寄与する可能性が低くなる。結合の初期セットのサブセットが残る一方で、その他の部分の影響がゼロまたはゼロの近くまで低減されるまで、このプロセスは続く。
[0041]ニューロンは一般に出力スパイクを、それの入力の多くが短い期間内に生じる(すなわち、出力をもたらすのに十分に累積している)ときに生成するので、通常残っている入力のサブセットは、時間的に相関する傾向のあった入力を含む。さらに、出力スパイクの前に生じる入力は強化されるので、最も早い十分に累積的な相関指示を提供する入力は結局、ニューロンへの最終入力となる。
[0042]STDP学習ルールは、シナプス前ニューロンのスパイク時間tpreとシナプス後ニューロンのスパイク時間tpostとの間の時間差(すなわち、t=tpost−tpre)に応じて、シナプス前ニューロンをシナプス後ニューロンに結合するシナプスのシナプス重みを効果的に適合させ得る。STDPの通常の公式化は、時間差が正である(シナプス前ニューロンがシナプス後ニューロンの前に発火する)場合にシナプス重みを増加させ(すなわち、シナプスを増強し)、時間差が負である(シナプス後ニューロンがシナプス前ニューロンの前に発火する)場合にシナプス重みを減少させる(すなわち、シナプスを抑制する)ことである。
[0043]STDPプロセスでは、経時的なシナプス重みの変化は通常、以下の式によって与えられるように、指数関数的減衰を使用して達成され得る。
Figure 2016536679
ここで、k+およびk-はそれぞれ、正の時間差および負の時間差の時間定数であり、a+およびa-は対応するスケーリングの大きさであり、μは正の時間差および/または負の時間差に適用され得るオフセットである。
[0044]図3は、STDPによる、シナプス前スパイクおよびシナプス後スパイクの相対的タイミングに応じたシナプス重み変化の例示的なグラフ300を示す。シナプス前ニューロンがシナプス後ニューロンの前に発火する場合、グラフ300の部分302に示すように、対応するシナプス重みは増加し得る。この重み増加は、シナプスのLTPと呼ばれ得る。グラフ部分302から、シナプス前スパイク時間とシナプス後スパイク時間との間の時間差に応じて、LTPの量がほぼ指数関数的に減少し得ることが観測され得る。グラフ300の部分304に示すように、発火の逆の順序は、シナプス重みを減少させ、シナプスのLTDをもたらし得る。
[0045]図3のグラフ300に示すように、STDPグラフのLTP(原因)部分302に負のオフセットμが適用され得る。x軸の交差306のポイント(y=0)は、層i−1(シナプス前層)からの原因入力の相関を考慮して、最大タイムラグと一致するように構成され得る。フレームベースの入力(すなわち、入力は、スパイクまたはパルスを備える特定の持続時間のフレームの形態である)の場合、オフセット値μは、フレーム境界を反映するように計算され得る。直接的にシナプス後電位によってモデル化されるように、またはニューラル状態に対する影響の点で、フレームにおける第1の入力スパイク(パルス)が経時的に減衰することが考慮され得る。フレームにおける第2の入力スパイク(パルス)が特定の時間フレームの相関したまたは関連したものと考えられる場合、フレームの前および後の関連する時間は、その時間フレーム境界で分離され、関連する時間の値が異なり得る(たとえば、1つのフレームよりも大きい場合は負、1つのフレームよりも小さい場合は正)ように、STDP曲線の1つまたは複数の部分をオフセットすることによって、可塑性の点で別様に扱われ得る。たとえば、曲線が、フレーム時間よりも大きい前後の時間で実際にゼロよりも下になり、結果的にLTPの代わりにLTDの一部であるようにLTPをオフセットするために負のオフセットμが設定され得る。
ニューロンモデルおよび演算
[0046]有用なスパイキングニューロンモデルを設計するための一般的原理がいくつかある。良いニューロンモデルは、2つの計算レジーム、すなわち、一致検出および関数計算の点で豊かな潜在的挙動を有し得る。その上、良いニューロンモデルは、時間コーディングを可能にするための2つの要素を有する必要がある。すなわち、入力の到着時間は出力時間に影響を与え、一致検出は狭い時間ウィンドウを有し得る。最後に、計算上魅力的であるために、良いニューロンモデルは、連続時間に閉形式解を有することができ、ニアアトラクター(near attractor)と鞍点とを含む安定した挙動を有し得る。言い換えれば、有用なニューロンモデルは、実用的なニューロンモデルであり、豊かで、現実的で、生物学的に一貫した挙動をモデル化するために使用され得、神経回路のエンジニアリングとリバースエンジニアリングの両方を行うために使用され得るニューロンモデルである。
[0047]ニューロンモデルは事象、たとえば入力の到着、出力スパイク、または内部的であるか外部的であるかを問わず他の事象に依存し得る。豊かな挙動レパートリーを実現するために、複雑な挙動を示すことができる状態機械が望まれ得る。入力寄与(ある場合)とは別個の事象の発生自体が状態機械に影響を与え、事象の後のダイナミクスを制限し得る場合、システムの将来の状態は、単なる状態および入力の関数ではなく、むしろ状態、事象および入力の関数である。
[0048]一態様では、ニューロンnは、下記のダイナミクスによって決定される膜電圧vn(t)によるスパイキングリーキー積分発火ニューロンとしてモデル化され得る。
Figure 2016536679
ここでαおよびβはパラメータであり、wm,nは、シナプス前ニューロンmをシナプス後ニューロンnに結合するシナプスのシナプス重みであり、ym(t)は、ニューロンnの細胞体に到着するまでΔtm,nに従って樹状遅延または軸索遅延によって遅延し得るニューロンmのスパイキング出力である。
[0049]シナプス後ニューロンへの十分な入力が達成された時間からシナプス後ニューロンが実際に発火する時間までの遅延があることに留意されたい。イジケヴィッチの単純モデルなど、動的スパイキングニューロンモデルでは、脱分極しきい値vtとピークスパイク電圧vpeakとの間に差がある場合、時間遅延が生じ得る。たとえば、単純モデルでは、電圧および復元のための1対の微分方程式、すなわち、
Figure 2016536679
Figure 2016536679
によってニューロン細胞体ダイナミクス(neuron soma dynamics)が決定され得る。ここでvは膜電位であり、uは、膜復元変数であり、kは、膜電位vの時間スケールを記述するパラメータであり、aは、復元変数uの時間スケールを記述するパラメータであり、bは、膜電位vのしきい値下変動に対する復元変数uの感度を記述するパラメータであり、vrは、膜静止電位であり、Iは、シナプス電流であり、Cは、膜のキャパシタンスである。このモデルによれば、ニューロンはv>vpeakのときにスパイクすると定義される。
Hunzinger Coldモデル
[0050]Hunzinger Coldニューロンモデルは、豊かな様々な神経挙動を再生し得る最小二重レジームスパイキング線形動的モデルである。モデルの1次元または2次元の線形ダイナミクスは2つのレジームを有することができ、時間定数(および結合)はレジームに依存し得る。しきい値下レジームでは、時間定数は、慣例により負であり、一般に生物学的に一貫した線形方式で静止状態に細胞を戻す役目を果たすリーキーチャネルダイナミクスを表す。しきい値上レジームにおける時間定数は、慣例により正であり、一般にスパイク生成のレイテンシを生じさせる一方でスパイク状態に細胞を駆り立てる反リーキーチャネルダイナミクスを反映する。
[0051]図4に示すように、モデルのダイナミクスは2つの(またはそれよりも多くの)レジームに分割され得る。これらのレジームは、負レジーム402(リーキー積分発火(LIF)ニューロンモデルと混同されないように互換的にLIFレジームとも呼ばれる)および正レジーム404(反リーキー積分発火(ALIF)ニューロンモデルと混同されないように互換的にALIFレジームとも呼ばれる)と呼ばれ得る。負レジーム402では、状態は将来の事象の時点における静止(v-)の傾向がある。この負レジームでは、モデルは一般に、時間的入力検出特性と他のしきい値下挙動とを示す。正レジーム404では、状態はスパイキング事象(vs)の傾向がある。この正レジームでは、モデルは、後続の入力事象に応じてスパイクにレイテンシを生じさせるなどの計算特性を示す。事象の点からのダイナミクスの公式化およびこれら2つのレジームへのダイナミクスの分離は、モデルの基本的特性である。
[0052]線形二重レジーム2次元ダイナミクス(状態vおよびuの場合)は、慣例により次のように定義され得る。
Figure 2016536679
Figure 2016536679
ここでqρおよびrは、結合のための線形変換変数である。
[0053]シンボルρは、ダイナミクスレジームを示すためにここで使用され、特定のレジームの関係を論述または表現するときに、それぞれ負レジームおよび正レジームについて符号「−」または「+」にシンボルρを置き換える慣例がある。
[0054]モデル状態は、膜電位(電圧)vおよび復元電流uによって定義される。基本形態では、レジームは基本的にモデル状態によって決定される。正確で一般的な定義の微妙だが重要な側面があるが、差し当たり、モデルが、電圧vがしきい値(v+)を上回る場合に正レジーム404にあり、そうでない場合に負レジーム402にあると考える。
[0055]レジーム依存時間定数は、負レジーム時間定数であるτ-と正レジーム時間定数であるτ+とを含む。復元電流時間定数τuは通常、レジームから独立している。便宜上、τuと同様に、指数およびτ+が一般に正となる正レジームの場合に、電圧発展(voltage evolution)に関する同じ表現が使用され得るように、減衰を反映するために負の量として負レジーム時間定数τ-が一般に指定される。
[0056]2つの状態要素のダイナミクスは、事象において、ヌルクラインから状態をオフセットする変換によって結合され得、ここで変換変数は、
Figure 2016536679
Figure 2016536679
であり、δ、ε、βおよびv-、v+はパラメータである。vρのための2つの値は、2つのレジームのための参照電圧のベースである。パラメータv-は、負レジームのためのベース電圧であり、膜電位は一般に、負レジームにおいてv-に減衰することになる。パラメータv+は、正レジームのためのベース電圧であり、膜電位は一般に、正レジームにおいてv+から離れる傾向となる。
[0057]vおよびuのためのヌルクラインは、それぞれ変換変数qρおよびrの負によって与えられる。パラメータδは,uヌルクラインの傾きを制御するスケール係数である。パラメータεは通常、−v-に等しく設定される。パラメータβは、両方のレジームにおいてvヌルクラインの傾きを制御する抵抗値である。τρ時間定数パラメータは、指数関数的減衰だけでなく、各レジームにおいて別個にヌルクラインの傾きを制御する。
[0058]モデルは、電圧vが値vsに達したときにスパイクするように定義される。続いて、状態は通常、(技術的に、スパイク事象と同じ1つのものであり得る)リセット事象でリセットされる。
Figure 2016536679
Figure 2016536679
ここで、
Figure 2016536679
およびΔuはパラメータである。リセット電圧
Figure 2016536679
は通常、v-にセットされる。
[0059]瞬時結合の原理によって、状態について(また、単一の指数項による)だけではなく、特定の状態に到達するために必要とされる時間についても、閉形式解が可能である。閉形式状態解は、次のとおりである。
Figure 2016536679
Figure 2016536679
[0060]したがって、モデル状態は、入力(シナプス前スパイク)または出力(シナプス後スパイク)などの事象に伴ってのみ更新され得る。また、演算が(入力があるか、出力があるかを問わず)任意の特定の時間に実行され得る。
[0061]その上、瞬時結合原理によって、反復的技法または数値解法(たとえば、オイラー数値解法)なしに、特定の状態に到達する時間が事前に決定され得るように、シナプス後スパイクの時間が予想され得る。前の電圧状態v0を踏まえ、電圧状態vfに到達するまでの時間遅延は、次の式によって与えられる。
Figure 2016536679
[0062]スパイクが、電圧状態vがvsに到達する時間に生じると定義される場合、電圧が所与の状態vにある時間から測定されたスパイクが生じるまでの時間量、または相対的遅延に関する閉形式解は、次のとおりである。
Figure 2016536679
ここで、
Figure 2016536679
は通常、パラメータv+にセットされるが、他の変形も可能であり得る。
[0063]モデルダイナミクスの上記の定義は、モデルが正レジームにあるか、それとも負レジームにあるかに依存する。上述のように、結合およびレジームρは、事象に伴って計算され得る。状態の伝搬のために、レジームおよび結合(変換)変数は、最後の(前の)事象の時間における状態に基づいて定義され得る。続いてスパイク出力時間を予想するために、レジームおよび結合変数は、次の(最新の)事象の時間における状態に基づいて定義され得る。
[0064]Coldモデルの、適時にシミュレーション、エミュレーションまたはモデルを実行するいくつかの可能な実装形態がある。これは、たとえば、事象更新モード、ステップ事象更新モード、およびステップ更新モードを含む。事象更新は、(特定の瞬間における)事象または「事象更新」に基づいて状態が更新される更新である。ステップ更新は、間隔(たとえば、1ms)をおいてモデルが更新される更新である。これは必ずしも、反復的技法または数値解法を必要とするとは限らない。また、事象がステップもしくはステップ間で生じる場合または「ステップ事象」更新によってモデルを更新するのみによって、ステップベースのシミュレータにおいて限られた時間分解能で事象ベースの実装形態が可能である。
ニューラルコーディング
[0065]図1の人工ニューロン102、106から構成されるニューラルネットワークモデルなどの有用なニューラルネットワークモデルは、一致コーディング、時間コーディングまたはレートコーディングなど、様々な好適なニューラルコーディング方式のうちのいずれかを介して情報を符号化することができる。一致コーディングでは、情報は、ニューロン集団の活動電位(スパイキング活動)の一致(または時間的近接度)で符号化される。時間コーディングでは、ニューロンは、絶対時間であるか相対時間であるかを問わず、活動電位(すなわち、スパイク)の正確なタイミングを通して情報を符号化する。したがって、情報は、ニューロン集団の間でスパイクの相対的タイミングで符号化され得る。対照的に、レートコーディングは、発火レートまたは集団発火レートでニューラル情報をコーディングすることを伴う。
[0066]ニューロンモデルは、時間コーディングを実行し得る場合、(レートは単に、タイミングまたはスパイク間の間隔の関数であるので)レートコーディングも実行し得る。時間コーディングを行うために、良いニューロンモデルは2つの要素を有する必要がある。すなわち、(1)入力の到着時間は出力時間に影響を与え、(2)一致検出は狭い時間ウィンドウを有し得る。時間パターンの要素を適切に遅延させることによって、要素はタイミング一致に組み込まれ得るので、結合遅延は、一致検出を時間パターン復号に拡大するための1つの手段を提供する。
到着時間
[0067]良いニューロンモデルでは、入力の到着の時間は、出力の時間に影響を与えるはずである。シナプス入力は、ディラックのデルタ関数であるか、成形シナプス後電位(PSP:shaped post-synaptic potential)であるかを問わず、興奮性(EPSP)であるか、抑制性(IPSP)であるかを問わず、到着時間(たとえば、デルタ関数またはステップもしくは他の入力関数の開始もしくはピークの時間)を有し、これは入力時間と呼ばれ得る。ニューロン出力(すなわち、スパイク)は、(細胞体、軸索に沿ったポイント、または軸索の端部など、どこで測定される場合でも)発生の時間を有し、これは出力時間と呼ばれ得る。出力時間は、スパイクのピークの時間、スパイクの開始の時間、または出力波形に関係する任意の他の時間であり得る。支配的原理は、出力時間が入力時間に依存することである。
[0068]一見したところ、すべてのニューロンモデルがこの原理に従うと思われるかもしれないが、これは一般には当てはまらない。たとえば、レートベースのモデルは、この特徴を有しない。多くのスパイキングモデルも、一般には適合しない。リーキー積分発火(LIF)モデルは、(しきい値を越えて)追加の入力がある場合にさらに速く発火することはない。その上、非常に高いタイミング分解能でモデル化された場合に適合する可能性があるモデルは多くの場合、タイミング分解能がたとえば1msのステップに限定されているときに適合しない。
入力
[0069]ニューロンモデルへの入力はディラックのデルタ関数、たとえば電流としての入力または伝導性ベースの入力を含み得る。後者の場合、ニューロン状態への寄与は連続的または状況依存的であり得る。
ニューラルシミュレータ用の例示的な共有メモリアーキテクチャ
[0070]ニューラルシミュレータ(図1の人工神経系100などの人工神経系をシミュレートするために使用されるハードウェアシステム)におけるランダムアクセスメモリ(RAM)などのメモリは貴重な資源であり、ハードウェア(HW)実装形態においては特に貴重である。そのような場合、RAM(または、他のタイプのメモリ)は、HWにコンパイルされ得るニューラルネットワークのサイズを決定する際の制限要因の1つであり得る。
[0071]人工神経系における様々な構成要素(たとえば、ニューロンおよび/またはシナプス)は、様々な量のメモリを必要とする場合がある。たとえば、シミュレーションにおける(人工)ニューロンは、それらが有し得る状態の数や、シナプスアキュムレータの数などの様々な要因に応じて、様々な量のメモリを必要とする場合がある。
[0072]本開示の態様は、HWに実装されたシミュレータが、必要に応じて各構成要素(たとえば、ニューロン/シナプス)にメモリを動的に割り振ることを可能にし得る技法を提供する。これは、典型的に、HWにマッピングされるニューラルユニットが、事前に割り振られたメモリに関連付けられる、ニューラルシミュレーションのための従来のシステムにおける割振りとは対照的であり、たとえば、フィールドプログラマブルゲートアレイ(FPGA)または特定用途向け集積回路(ASIC)が作成されると、それらの有用性を制限する。
[0073]本開示のいくつかの態様によれば、HWシミュレータは、必要に応じて様々な構成要素(たとえば、ニューロン/シナプス)に分配され得るメモリの共有プールを維持し得る。場合によっては、メモリプールは、メモリの大きな凝集したブロックとして実装され得る。本開示のある態様では、このメモリ割振りは、シミュレーションのコンパイル時間に実行され得、また、様々な構成要素のリソース要件に応じて動的に実行され得る。このように、シミュレートされている人工神経系内の構成要素のメモリフットプリント(使用量)は、利用されている異なるタイプのニューロンとともに変化し得る。
[0074]上述のように、典型的なニューラルネットワーク実装形態は、それらの動作のために様々な量のメモリを必要とする。たとえば、入力電流アキュムレータは、異なる数の入力チャネルを有する、異なるサイズの入力電流アキュムレータであり得る。さらに、ニューロン状態はニューラルタイプごとに異なっていてよい(異なる人工ニューロンモデルに基づいて)。たとえば、いくつかのニューロンタイプ(たとえば、ポアソン型ニューロン)は、状態を有する他のニューロンタイプ(たとえば、Izhikevichのニューロンモデルで表される人工ニューロン)と比較して、わずかなニューラル状態メモリを必要とする場合がある。上述のように、メモリサイズと数をハードコーディングすることは、ハードウェアの柔軟性を制限することになり、HWが構築された後、状態変数サイズへの変化に対応することができない。
[0075]本開示の態様は、シミュレートされている人工神経系内の構成要素にメモリを動的に割り振るために使用され得る方法および装置を提供する。いくつかの態様によれば、実行時間に各ニューロン(状態)にメモリを割り振るために、メモリプールアーキテクチャが提供され得る。場合によっては、メモリプールの一部は、メモリ制限を制御して無駄なスペースを避けるために、比較的微細な粒子(たとえば、32ビット)を割り振られ得る。特定の実装形態に応じて、メモリプールは、オンチップ(たとえば、シミュレーションを実行しているプロセッサと同じチップ上に)で実装されてもよく、オフチップで実装されてもよく、その両方の組合せとして実装されてもよい。いくつかの態様によれば、メモリは、ソフトウェアメモリ割振りコマンド(たとえば、mallocソフトウェアコマンド)で実行されるのと同様の方法で、ハードウェアに割り振られ得る。
[0076]場合によっては、メモリプールは、たとえばRAMバンクで構成される分散型アーキテクチャとして実装され得る。いくつかの態様によれば、書込みクライアントと読出しクライアントは、ルータを介してルーティングされたコマンドを介して、メモリプールにアクセスし得る。そのようなアーキテクチャは、実装形態における柔軟性のために高度にパラメータ化され得、オプションが領域と性能との間のトレードオフを達成することを可能にする。本開示のある態様では、クライアントから/へ(書込み/読出し)のルーティング輻輳は、ルータを介して最小化され得る。別の態様では、読出しおよび書込みのために何らかの形式のクロスバーアーキテクチャが使用され得る。
[0077]図5は、本開示のいくつかの態様による、ハードウェアに実装された人工神経系シミュレータにおいてメモリを割り振るための例示的な動作500の流れ図である。動作500は、たとえば、人工ニューラル処理システムをシミュレートするために使用されるハードウェアシミュレータの1つまたは複数の処理構成要素によって実行され得る。
[0078]動作500は、502で、シミュレートされている人工神経系の1つまたは複数の構成要素のためのメモリリソース要件を決定することによって開始する。504で、システムハードウェアシミュレータは、決定に基づいて、共有メモリプールの一部を構成要素に割り振る。
[0079]本開示のいくつかの態様によれば、共有メモリプールの割振りは、シミュレートされている人工神経系をコンパイルする時に実行され得る。いくつかの態様では、割り振ることは、メモリリソース要件が変更すると動的に実行され得る。さらに、上述のように、割り振ることは、決定に基づいて、構成要素に割り振られた共有メモリプールの量を変化させることを備え得る。本開示のある態様では、構成要素は人工ニューロンを備え得、また上述のように、メモリリソース要件を決定することは、人工ニューロンの状態またはタイプのうちの少なくとも1つに基づいてリソースを決定することを備え得る。
[0080]上述のように、共有メモリプールの少なくとも一部は、人工神経系シミュレータのプロセッサとは別のチップ上に配置されたメモリを備え得る。いくつかの態様によれば、共有メモリプールは、メモリバンクと、書込みクライアントと、読出しクライアントと、メモリバンクと書込みクライアントおよび読出しクライアントとをインターフェースするルータとを備える分散型アーキテクチャとして実装され得る。
[0081]図6は、本開示のいくつかの態様による、汎用プロセッサ602を使用して、複数の人工ニューロンを有する人工神経系を動作することが可能な構成要素の例示的なブロック図600を示している。計算ネットワーク(ニューラルネットワーク)に関連する変数(ニューラル信号)、シナプス重み、および/またはシステムパラメータは、メモリブロック1604に記憶され得る一方、汎用プロセッサ1602において実行される命令は、プログラムメモリ1606からロードされ得る。本開示のいくつかの態様では、汎用プロセッサ602にロードされた命令は、シミュレートされている人工神経系の1つまたは複数の構成要素のためのメモリリソース要件を決定するためのコードと、決定に基づいて、共有メモリプールの一部を構成要素に割り振るためのコードとを備え得る。
[0082]図7は、ハードウェアに実装された人工神経系シミュレータにおいてメモリを動的に割り振ることが可能な構成要素の例示的なブロック図700を示している。たとえば、本開示のいくつかの態様に従って、相互接続ネットワーク704の接続を介してメモリ702から各処理ユニット(ニューラルプロセッサ)706にロードされ得る、変数(ニューラル信号)、シナプス重み、および/または、計算ネットワーク(ニューラルネットワーク)に関連付けられるシステムパラメータのために、計算ネットワーク(ニューラルネットワーク)の個々の(分散された)処理ユニット(ニューラルプロセッサ)706は、共有メモリ702の一部を割り振り得る。
[0083]図8は、ハードウェアに実装された人工神経系シミュレータにおいてメモリを動的に割り振ることが可能な構成要素の例示的なブロック図800を示している。たとえば、本開示のいくつかの態様に従って、変数(ニューラル信号)、シナプス重み、および/または、計算ネットワーク(ニューラルネットワーク)に関連付けられるシステムパラメータのために、計算ネットワーク(ニューラルネットワーク)の個々の(分散された)処理ユニット(ニューラルプロセッサ)804は、分散された共有メモリ802の一部を割り振り得る。
[0084]図9は、本開示のいくつかの態様による、シミュレートされ得るニューラルネットワーク900の例示的な実装形態を示す。図9に示すように、ニューラルネットワーク900は、上述した方法の様々な動作を実行し得る複数のローカル処理ユニット902を備えることができる。各処理ユニット902は、ローカル状態メモリ904と、ニューラルネットワークのパラメータを記憶するローカルパラメータメモリ906とを備えることができる。さらに、処理ユニット902は、ローカル(ニューロン)モデルプログラムを有するメモリ908と、ローカル学習プログラムを有するメモリ910と、ローカル接続メモリ912とを備えることができる。さらに、図9に示すように、各ローカル処理ユニット902は、ローカル処理ユニットのローカルメモリのための設定を提供し得る設定処理のためのユニット914と、またローカル処理ユニット902間のルーティングを提供するルーティング接続処理要素916とインターフェースされ得る。図9に示される様々なメモリのためのリソースは、本明細書に記載されるように、共有メモリプールから割り振られ得る。
[0085]図10は、本開示のいくつかの態様による、人工神経系のための例示的なハードウェア実装形態のブロック図1000である。STDP更新は、上述のように、効果可塑性更新および再構築(Effect Plasticity Updates and Reassemble)ブロック1002で発生し得る。いくつかの態様では、更新されたシナプス重みは、キャッシュラインインターフェース1004を介して、オフチップメモリ(たとえば、ダイナミックランダムアクセスメモリ(DRAM)1006)に記憶され得る。
[0086]典型的な人工神経系には、人工ニューロンよりも多くのシナプスがあり、大規模なニューラルネットワークでは、効率的な方法でシナプスの更新を処理することが望ましい。多数のシナプスは、シナプス重みおよび他のパラメータをメモリ(たとえば、DRAM1006)に記憶することを示唆し得る。人工ニューロンが、いわゆる「スーパーニューロン(SN)」でスパイクを生成すると、ニューロンは、シナプス後ニューロンおよび対応するニューラル重みを決定するために、DRAMルックアップを通じてシナプス後ニューロンにそれらのスパイクを転送することができる。迅速および効率的なルックアップを可能にするために、シナプスの順序は、たとえばニューロンからのファンアウトに基づいて、メモリ内に連続的に維持され得る。後に、効果可塑性更新および再構築ブロック1002においてSTDP更新を処理する場合、DRAMまたは大規模なルックアップテーブルは、LTP更新のための逆マッピングを決定するために検索される必要がないので、効率は、このメモリレイアウトを与えられた前方ファンアウト(forward fan−out)に基づいて更新を処理することを指示し得る。図10に示される手法は、これを容易にする。効果可塑性更新および再構築ブロック1002は、シナプス前およびシナプス後のスパイク時間を取得するためにスーパーニューロンを照会し得、関連する状態メモリの量を再び減らす。図10に示されるDRAM1006のためのリソースは、本明細書に記載されるように共有メモリプールから割り振られ得る。
[0087]上述した方法の様々な動作は、対応する機能を実行することが可能な任意の好適な手段によって実行され得る。それらの手段は、限定はしないが、回路、特定用途向け集積回路(ASIC)、またはプロセッサを含む、様々なハードウェアおよび/またはソフトウェア構成要素および/またはモジュールを含み得る。たとえば、様々な動作は、図6〜図10に示す様々なプロセッサのうちの1つまたは複数によって実行され得る。概して、図に示されている動作がある場合、それらの動作は、同様の番号をもつ対応するカウンターパートのミーンズプラスファンクション構成要素を有し得る。たとえば、図5に示す動作500は、図5Aに示す手段500Aに対応する。
[0088]本明細書で使用する「決定」という用語は、多種多様なアクションを包含する。たとえば、「決定」は、計算すること、算出すること、処理すること、導出すること、調査すること、ルックアップすること(たとえば、テーブル、データベースまたは別のデータ構造においてルックアップすること)、確認することなどを含み得る。また、「決定」は、受信すること(たとえば、情報を受信すること)、アクセスすること(たとえば、メモリ中のデータにアクセスすること)などを含み得る。また、「決定」は、解決すること、選択すること、選定すること、確立することなどを含み得る。
[0089]本明細書で使用する、項目のリスト「のうちの少なくとも1つ」を指す句は、単一のメンバーを含む、それらの項目の任意の組合せを指す。一例として、「a、b、またはcのうちの少なくとも1つ」は、a、b、c、a−b、a−c、b−c、およびa−b−cを包含するものとする。
[0090]本開示に関連して説明した様々な例示的な論理ブロック、モジュール、および回路は、汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ信号(FPGA)または他のプログラマブル論理デバイス(PLD)、個別ゲートまたはトランジスタ論理、個別ハードウェア構成要素、あるいは本明細書で説明した機能を実行するように設計されたそれらの任意の組合せを用いて実装または実行され得る。汎用プロセッサはマイクロプロセッサであり得るが、代替として、プロセッサは、任意の市販のプロセッサ、コントローラ、マイクロコントローラまたは状態機械であり得る。プロセッサはまた、コンピューティングデバイスの組合せ、たとえば、DSPとマイクロプロセッサとの組合せ、複数のマイクロプロセッサ、DSPコアと連携する1つまたは複数のマイクロプロセッサ、あるいは任意の他のそのような構成として実装され得る。
[0091]本開示に関連して説明した方法またはアルゴリズムのステップは、ハードウェアで直接実施されるか、プロセッサによって実行されるソフトウェアモジュールで実施されるか、またはその2つの組合せで実施され得る。ソフトウェアモジュールは、当技術分野で知られている任意の形態の記憶媒体中に常駐し得る。使用され得る記憶媒体のいくつかの例としては、ランダムアクセスメモリ(RAM)、読取り専用メモリ(ROM)、フラッシュメモリ、EPROMメモリ、EEPROM(登録商標)メモリ、レジスタ、ハードディスク、リムーバブルディスク、CD−ROMなどを含む。ソフトウェアモジュールは、単一の命令、または多数の命令を備えることができ、いくつかの異なるコードセグメント上で、異なるプログラム間で、複数の記憶媒体にわたって分散され得る。記憶媒体は、プロセッサがその記憶媒体から情報を読み取ることができ、その記憶媒体に情報を書き込むことができるように、プロセッサに結合され得る。代替として、記憶媒体はプロセッサと一体化され得る。
[0092]本明細書で開示する方法は、説明した方法を達成するための1つまたは複数のステップまたはアクションを備える。本方法のステップおよび/またはアクションは、特許請求の範囲から逸脱することなく互いに交換され得る。言い換えれば、ステップまたはアクションの特定の順序が指定されない限り、特定のステップおよび/またはアクションの順序および/または使用は、特許請求の範囲から逸脱することなく変更され得る。
[0093]説明した機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ハードウェアで実装される場合、例示的なハードウェア構成はデバイス中に処理システムを備え得る。処理システムは、バスアーキテクチャを用いて実装され得る。バスは、処理システムの特定の適用例および全体的な設計制約に応じて、任意の数の相互接続バスとブリッジとを含み得る。バスは、プロセッサと、機械可読媒体と、バスインターフェースとを含む様々な回路を互いにリンクし得る。バスインターフェースは、ネットワークアダプタを、特に、バスを介して処理システムに接続するために使用され得る。ネットワークアダプタは、信号処理機能を実装するために使用され得る。いくつかの態様では、ユーザインターフェース(たとえば、キーパッド、ディスプレイ、マウス、ジョイスティックなど)もバスに接続され得る。バスはまた、タイミングソース、周辺機器、電圧調整器、電力管理回路などの様々な他の回路にリンクし得るが、それらは当技術分野でよく知られており、したがってこれ以上は説明されない。
[0094]プロセッサは、機械可読媒体に記憶されたソフトウェアの実行を含む、バスおよび一般的な処理を管理することを担当し得る。プロセッサは、1つまたは複数の汎用および/または専用プロセッサを用いて実装され得る。例としては、マイクロプロセッサ、マイクロコントローラ、DSPプロセッサ、およびソフトウェアを実行し得る他の回路を含む。ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語などの名称にかかわらず、命令、データ、またはそれらの任意の組合せを意味すると広く解釈されたい。機械可読媒体は、例として、RAM(ランダムアクセスメモリ)、フラッシュメモリ、ROM(読取り専用メモリ)、PROM(プログラマブル読取り専用メモリ)、EPROM(消去可能プログラマブル読取り専用メモリ)、EEPROM(電気消去可能プログラマブル読取り専用メモリ)、レジスタ、磁気ディスク、光ディスク、ハードドライブ、または任意の他の好適な記憶媒体、あるいはそれらの任意の組合せを含み得る。機械可読媒体はコンピュータプログラム製品において実施され得る。コンピュータプログラム製品はパッケージング材料を備え得る。
[0095]ハードウェア実装形態では、機械可読媒体は、プロセッサとは別個の処理システムの一部であり得る。しかしながら、当業者なら容易に理解するように、機械可読媒体またはその任意の部分は処理システムの外部にあり得る。例として、機械可読媒体は、すべてバスインターフェースを介してプロセッサによってアクセスされ得る、伝送線路、データによって変調された搬送波、および/またはデバイスとは別個のコンピュータ製品を含み得る。代替的に、または追加で、機械可読媒体またはその任意の部分は、キャッシュおよび/または汎用レジスタファイルがそうであり得るように、プロセッサに統合され得る。
[0096]処理システムは、すべて外部バスアーキテクチャを介して他のサポート回路と互いにリンクされる、プロセッサ機能を提供する1つまたは複数のマイクロプロセッサと、機械可読媒体の少なくとも一部分を提供する外部メモリとをもつ汎用処理システムとして構成され得る。代替的に、処理システムは、プロセッサをもつASIC(特定用途向け集積回路)と、バスインターフェースと、ユーザインターフェースと、サポート回路と、単一のチップに統合された機械可読媒体の少なくとも一部分とを用いて、あるいは1つまたは複数のFPGA(フィールドプログラマブルゲートアレイ)、PLD(プログラマブル論理デバイス)、コントローラ、状態機械、ゲート論理、個別ハードウェア構成要素、もしくは他の好適な回路、または本開示全体にわたって説明した様々な機能を実行し得る回路の任意の組合せを用いて、実装され得る。当業者なら、特定の適用例と、全体的なシステムに課される全体的な設計制約とに応じて、どのようにしたら処理システムについて説明した機能を最も良く実装し得るかを理解されよう。
[0097]機械可読媒体はいくつかのソフトウェアモジュールを備え得る。ソフトウェアモジュールは、プロセッサによって実行されたときに、処理システムに様々な機能を実行させる命令を含む。ソフトウェアモジュールは、送信モジュールと受信モジュールとを含み得る。各ソフトウェアモジュールは、単一の記憶デバイス中に常駐するか、または複数の記憶デバイスにわたって分散され得る。例として、トリガイベントが発生したとき、ソフトウェアモジュールがハードドライブからRAMにロードされ得る。ソフトウェアモジュールの実行中、プロセッサは、アクセス速度を高めるために、命令のいくつかをキャッシュにロードし得る。次いで、1つまたは複数のキャッシュラインが、プロセッサによる実行のために汎用レジスタファイルにロードされ得る。以下でソフトウェアモジュールの機能に言及する場合、そのような機能は、そのソフトウェアモジュールからの命令を実行したときにプロセッサによって実装されることが理解されよう。
[0098]ソフトウェアで実装される場合、機能は、1つまたは複数の命令またはコードとしてコンピュータ可読媒体上に記憶されるか、あるいはコンピュータ可読媒体を介して送信され得る。コンピュータ可読媒体は、ある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含む、コンピュータ記憶媒体と通信媒体の両方を含む。記憶媒体は、コンピュータによってアクセスされ得る任意の利用可能な媒体であり得る。限定ではなく例として、そのようなコンピュータ可読媒体は、RAM、ROM、EEPROM、CD−ROMまたは他の光ディスクストレージ、磁気ディスクストレージまたは他の磁気記憶デバイス、あるいは命令またはデータ構造の形態の所望のプログラムコードを搬送または記憶するために使用され得、コンピュータによってアクセスされ得る、任意の他の媒体を備えることができる。また、いかなる接続もコンピュータ可読媒体を適切に名づけられる。たとえば、ソフトウェアが、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線(DSL)、または赤外線(IR)、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、DSL、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。本明細書で使用するディスク(disk)およびディスク(disc)は、コンパクトディスク(disc)(CD)、レーザーディスク(登録商標)(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)、およびBlu−ray(登録商標)ディスク(disc)を含み、ディスク(disk)は、通常、データを磁気的に再生し、ディスク(disc)は、データをレーザーで光学的に再生する。したがって、いくつかの態様では、コンピュータ可読媒体は非一時的コンピュータ可読媒体(たとえば、有形媒体)を備え得る。さらに、他の態様では、コンピュータ可読媒体は一時的コンピュータ可読媒体(たとえば、信号)を備え得る。上記の組合せもコンピュータ可読媒体の範囲内に含まれるべきである。
[0099]したがって、いくつかの態様は、本明細書で提示する動作を実行するためのコンピュータプログラム製品を備え得る。たとえば、そのようなコンピュータプログラム製品は、本明細書で説明する動作を実行するために1つまたは複数のプロセッサによって実行可能である命令を記憶した(および/または符号化した)コンピュータ可読媒体を備え得る。いくつかの態様では、コンピュータプログラム製品はパッケージング材料を含み得る。
[0100]さらに、本明細書で説明した方法および技法を実行するためのモジュールおよび/または他の適切な手段は、適用可能な場合にデバイスによってダウンロードされ、および/または他の方法で取得され得ることを諒解されたい。たとえば、そのようなデバイスは、本明細書で説明した方法を実施するための手段の転送を可能にするためにサーバに結合され得る。代替的に、本明細書で説明した様々な方法は、デバイスが記憶手段をデバイスに結合または提供すると様々な方法を得ることができるように、記憶手段(たとえば、RAM、ROM、コンパクトディスク(CD)またはフロッピーディスクなどの物理記憶媒体など)によって提供され得る。その上、本明細書で説明した方法および技法をデバイスに与えるための任意の他の好適な技法が利用され得る。
[0101]特許請求の範囲は、上記で示した厳密な構成および構成要素に限定されないことを理解されたい。上記で説明した方法および装置の構成、動作および詳細において、特許請求の範囲から逸脱することなく、様々な改変、変更および変形が行われ得る。
[0101]特許請求の範囲は、上記で示した厳密な構成および構成要素に限定されないことを理解されたい。上記で説明した方法および装置の構成、動作および詳細において、特許請求の範囲から逸脱することなく、様々な改変、変更および変形が行われ得る。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[C1]
ハードウェアに実装された人工神経系シミュレータにおいてメモリを割り振るための方法であって、
シミュレートされている人工神経系の1つまたは複数の構成要素のためのメモリリソース要件を決定することと、
前記決定に基づいて、共有メモリプールの一部を前記構成要素に割り振ることと
を備える、方法。
[C2]
前記割り振ることが、シミュレートされている前記人工神経系をコンパイルする時に実行される、C1に記載の方法。
[C3]
前記割り振ることが、メモリリソース要件が変更すると動的に実行される、C1に記載の方法。
[C4]
前記共有メモリプールの少なくとも一部が、前記人工神経系シミュレータのプロセッサとは別のチップ上に配置されたメモリを備える、C1に記載の方法。
[C5]
前記構成要素が人工ニューロンを備え、
メモリリソース要件を決定することが、前記人工ニューロンの状態またはタイプのうちの少なくとも1つに基づいてリソースを決定することを備える、C1に記載の方法。
[C6]
前記共有メモリプールが、メモリバンクと、書込みクライアントと、読出しクライアントと、前記メモリバンクと前記書込みクライアントおよび前記読出しクライアントとをインターフェースするルータとを備える分散型アーキテクチャとして実装される、C1に記載の方法。
[C7]
前記割り振ることが、前記決定に基づいて、前記構成要素に割り振られた前記共有メモリプールの量を変化させることを備える、C1に記載の方法。
[C8]
ハードウェアに実装された人工神経系シミュレータにおいてメモリを割り振るための装置であって、
シミュレートされている人工神経系の1つまたは複数の構成要素のためのメモリリソース要件を決定して、
前記決定に基づいて、共有メモリプールの一部を前記構成要素に割り振るように構成された処理システムを備える、装置。
[C9]
前記処理システムが、シミュレートされている前記人工神経系をコンパイルする時に前記割振りを実行するように構成される、C8に記載の装置。
[C10]
前記処理システムが、メモリリソース要件が変更すると、前記割振りを動的に実行するように構成される、C8に記載の装置。
[C11]
前記共有メモリプールの少なくとも一部が、前記人工神経系シミュレータのプロセッサとは別のチップ上に配置されたメモリを備える、C8に記載の装置。
[C12]
前記構成要素が人工ニューロンを備え、
前記処理システムが、前記人工ニューロンの状態またはタイプのうちの少なくとも1つに基づいてリソースを決定するように構成される、C8に記載の装置。
[C13]
前記共有メモリプールが、メモリバンクと、書込みクライアントと、読出しクライアントと、前記メモリバンクと前記書込みクライアントおよび前記読出しクライアントとをインターフェースするルータとを備える分散型アーキテクチャとして実装される、C8に記載の装置。
[C14]
前記処理システムがまた、前記決定に基づいて、前記構成要素に割り振られた前記共有メモリプールの量を変化させるように構成される、C8に記載の装置。
[C15]
ハードウェアに実装された人工神経系シミュレータにおいてメモリを割り振るための装置であって、
シミュレートされている人工神経系の1つまたは複数の構成要素のためのメモリリソース要件を決定するための手段と、
前記決定に基づいて、共有メモリプールの一部を前記構成要素に割り振るための手段と
を備える、装置。
[C16]
前記割り振ることが、シミュレートされている前記人工神経系をコンパイルする時に実行される、C15に記載の装置。
[C17]
前記割り振ることが、メモリリソース要件が変更すると動的に実行される、C15に記載の装置。
[C18]
前記共有メモリプールの少なくとも一部が、前記人工神経系シミュレータのプロセッサとは別のチップ上に配置されたメモリを備える、C15に記載の装置。
[C19]
前記構成要素が人工ニューロンを備え、
メモリリソース要件を決定するための前記手段が、前記人工ニューロンの状態またはタイプのうちの少なくとも1つに基づいてリソースを決定するための手段を備える、C15に記載の装置。
[C20]
前記共有メモリプールが、メモリバンクと、書込みクライアントと、読出しクライアントと、前記メモリバンクと前記書込みクライアントおよび前記読出しクライアントとをインターフェースするルータとを備える分散型アーキテクチャとして実装される、C15に記載の装置。
[C21]
前記割り振ることが、前記決定に基づいて、前記構成要素に割り振られた前記共有メモリプールの量を変化させることを備える、C15に記載の装置。
[C22]
ハードウェアに実装された人工神経系シミュレータにおいてメモリを割り振るために、記憶されたコンピュータによって実行可能な命令を有するコンピュータ可読媒体であって、
シミュレートされている人工神経系の1つまたは複数の構成要素のためのメモリリソース要件を決定するための命令と、
前記決定に基づいて、共有メモリプールの一部を前記構成要素に割り振るための命令と
を備える、コンピュータ可読媒体。

Claims (22)

  1. ハードウェアに実装された人工神経系シミュレータにおいてメモリを割り振るための方法であって、
    シミュレートされている人工神経系の1つまたは複数の構成要素のためのメモリリソース要件を決定することと、
    前記決定に基づいて、共有メモリプールの一部を前記構成要素に割り振ることと
    を備える、方法。
  2. 前記割り振ることが、シミュレートされている前記人工神経系をコンパイルする時に実行される、請求項1に記載の方法。
  3. 前記割り振ることが、メモリリソース要件が変更すると動的に実行される、請求項1に記載の方法。
  4. 前記共有メモリプールの少なくとも一部が、前記人工神経系シミュレータのプロセッサとは別のチップ上に配置されたメモリを備える、請求項1に記載の方法。
  5. 前記構成要素が人工ニューロンを備え、
    メモリリソース要件を決定することが、前記人工ニューロンの状態またはタイプのうちの少なくとも1つに基づいてリソースを決定することを備える、請求項1に記載の方法。
  6. 前記共有メモリプールが、メモリバンクと、書込みクライアントと、読出しクライアントと、前記メモリバンクと前記書込みクライアントおよび前記読出しクライアントとをインターフェースするルータとを備える分散型アーキテクチャとして実装される、請求項1に記載の方法。
  7. 前記割り振ることが、前記決定に基づいて、前記構成要素に割り振られた前記共有メモリプールの量を変化させることを備える、請求項1に記載の方法。
  8. ハードウェアに実装された人工神経系シミュレータにおいてメモリを割り振るための装置であって、
    シミュレートされている人工神経系の1つまたは複数の構成要素のためのメモリリソース要件を決定して、
    前記決定に基づいて、共有メモリプールの一部を前記構成要素に割り振る
    ように構成された処理システムを備える、装置。
  9. 前記処理システムが、シミュレートされている前記人工神経系をコンパイルする時に前記割振りを実行するように構成される、請求項8に記載の装置。
  10. 前記処理システムが、メモリリソース要件が変更すると、前記割振りを動的に実行するように構成される、請求項8に記載の装置。
  11. 前記共有メモリプールの少なくとも一部が、前記人工神経系シミュレータのプロセッサとは別のチップ上に配置されたメモリを備える、請求項8に記載の装置。
  12. 前記構成要素が人工ニューロンを備え、
    前記処理システムが、前記人工ニューロンの状態またはタイプのうちの少なくとも1つに基づいてリソースを決定するように構成される、請求項8に記載の装置。
  13. 前記共有メモリプールが、メモリバンクと、書込みクライアントと、読出しクライアントと、前記メモリバンクと前記書込みクライアントおよび前記読出しクライアントとをインターフェースするルータとを備える分散型アーキテクチャとして実装される、請求項8に記載の装置。
  14. 前記処理システムがまた、前記決定に基づいて、前記構成要素に割り振られた前記共有メモリプールの量を変化させるように構成される、請求項8に記載の装置。
  15. ハードウェアに実装された人工神経系シミュレータにおいてメモリを割り振るための装置であって、
    シミュレートされている人工神経系の1つまたは複数の構成要素のためのメモリリソース要件を決定するための手段と、
    前記決定に基づいて、共有メモリプールの一部を前記構成要素に割り振るための手段と
    を備える、装置。
  16. 前記割り振ることが、シミュレートされている前記人工神経系をコンパイルする時に実行される、請求項15に記載の装置。
  17. 前記割り振ることが、メモリリソース要件が変更すると動的に実行される、請求項15に記載の装置。
  18. 前記共有メモリプールの少なくとも一部が、前記人工神経系シミュレータのプロセッサとは別のチップ上に配置されたメモリを備える、請求項15に記載の装置。
  19. 前記構成要素が人工ニューロンを備え、
    メモリリソース要件を決定するための前記手段が、前記人工ニューロンの状態またはタイプのうちの少なくとも1つに基づいてリソースを決定するための手段を備える、請求項15に記載の装置。
  20. 前記共有メモリプールが、メモリバンクと、書込みクライアントと、読出しクライアントと、前記メモリバンクと前記書込みクライアントおよび前記読出しクライアントとをインターフェースするルータとを備える分散型アーキテクチャとして実装される、請求項15に記載の装置。
  21. 前記割り振ることが、前記決定に基づいて、前記構成要素に割り振られた前記共有メモリプールの量を変化させることを備える、請求項15に記載の装置。
  22. ハードウェアに実装された人工神経系シミュレータにおいてメモリを割り振るために、記憶されたコンピュータによって実行可能な命令を有するコンピュータ可読媒体であって、
    シミュレートされている人工神経系の1つまたは複数の構成要素のためのメモリリソース要件を決定するための命令と、
    前記決定に基づいて、共有メモリプールの一部を前記構成要素に割り振るための命令と
    を備える、コンピュータ可読媒体。
JP2016521702A 2013-10-11 2014-09-08 ニューラルシミュレータ用の共有メモリアーキテクチャ Pending JP2016536679A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361889682P 2013-10-11 2013-10-11
US61/889,682 2013-10-11
US14/451,954 2014-08-05
US14/451,954 US10339041B2 (en) 2013-10-11 2014-08-05 Shared memory architecture for a neural simulator
PCT/US2014/054510 WO2015053889A2 (en) 2013-10-11 2014-09-08 Shared memory architecture for a neural simulator

Publications (2)

Publication Number Publication Date
JP2016536679A true JP2016536679A (ja) 2016-11-24
JP2016536679A5 JP2016536679A5 (ja) 2017-09-21

Family

ID=52810540

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016521702A Pending JP2016536679A (ja) 2013-10-11 2014-09-08 ニューラルシミュレータ用の共有メモリアーキテクチャ

Country Status (5)

Country Link
US (1) US10339041B2 (ja)
EP (1) EP3055812A2 (ja)
JP (1) JP2016536679A (ja)
CN (1) CN105637541B (ja)
WO (1) WO2015053889A2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020515990A (ja) * 2017-04-04 2020-05-28 ハイロ テクノロジーズ リミテッド ニューラルネットワークプロセッサにおける構成可能でプログラム可能なスライディングウィンドウベースのメモリアクセス
JP2020537785A (ja) * 2017-10-17 2020-12-24 ザイリンクス インコーポレイテッドXilinx Incorporated ホスト通信されるマージされた重みと層単位命令のパッケージとを使用するニューラルネットワークアクセラレータによる多層ニューラルネットワーク処理

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106529679B (zh) * 2016-10-14 2020-01-14 腾讯科技(上海)有限公司 一种机器学习方法及系统
US20180189646A1 (en) * 2016-12-30 2018-07-05 Intel Corporation Apparatus and method for configuring fan-in and fan-out connections in a neuromorphic processor
US11062203B2 (en) 2016-12-30 2021-07-13 Intel Corporation Neuromorphic computer with reconfigurable memory mapping for various neural network topologies
CN106934457B (zh) * 2017-03-08 2019-12-06 杭州领芯电子有限公司 一种可灵活时分复用的脉冲神经元实现架构
US11551028B2 (en) 2017-04-04 2023-01-10 Hailo Technologies Ltd. Structured weight based sparsity in an artificial neural network
US11615297B2 (en) 2017-04-04 2023-03-28 Hailo Technologies Ltd. Structured weight based sparsity in an artificial neural network compiler
US11238334B2 (en) 2017-04-04 2022-02-01 Hailo Technologies Ltd. System and method of input alignment for efficient vector operations in an artificial neural network
US11544545B2 (en) 2017-04-04 2023-01-03 Hailo Technologies Ltd. Structured activation based sparsity in an artificial neural network
CN109389215B (zh) * 2017-08-03 2020-07-31 杭州海康威视数字技术股份有限公司 一种深度学习网络的网络结构确定方法及装置
US11347998B2 (en) * 2018-02-26 2022-05-31 Fredric William Narcross Nervous system on a chip
CN108647155B (zh) * 2018-05-14 2020-08-21 瑞芯微电子股份有限公司 一种基于深度学习的多级cache共享的方法和装置
CN108830379B (zh) * 2018-05-23 2021-12-17 电子科技大学 一种基于参数量化共享的神经形态处理器
US11205125B2 (en) 2018-06-29 2021-12-21 International Business Machines Corporation Scheduler and simulator for an area-efficient, reconfigurable, energy-efficient, speed-efficient neural network
US20200117978A1 (en) * 2018-10-12 2020-04-16 Alibaba Group Holding Limited Systems and methods for efficiently mapping neural networks to programmable logic devices
US11263077B1 (en) 2020-09-29 2022-03-01 Hailo Technologies Ltd. Neural network intermediate results safety mechanism in an artificial neural network processor
US11237894B1 (en) 2020-09-29 2022-02-01 Hailo Technologies Ltd. Layer control unit instruction addressing safety mechanism in an artificial neural network processor
US11811421B2 (en) 2020-09-29 2023-11-07 Hailo Technologies Ltd. Weights safety mechanism in an artificial neural network processor
US11874900B2 (en) 2020-09-29 2024-01-16 Hailo Technologies Ltd. Cluster interlayer safety mechanism in an artificial neural network processor
US11221929B1 (en) 2020-09-29 2022-01-11 Hailo Technologies Ltd. Data stream fault detection mechanism in an artificial neural network processor
US20220374778A1 (en) * 2021-05-20 2022-11-24 Alibaba Singapore Holding Private Limited Efficient Computation for Bayesian Optimization
CN114781633B (zh) * 2022-06-17 2022-10-14 电子科技大学 一种融合人工神经网络与脉冲神经网络的处理器

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008545197A (ja) * 2005-06-28 2008-12-11 ニューロサイエンシーズ リサーチ ファンデーション インコーポレイテッド 神経モデリングのためのアドレス機構及び特殊目的プロセッサを使用する脳ベースの装置
JP2013529342A (ja) * 2010-05-19 2013-07-18 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア ニューラル処理ユニット
JP2013534017A (ja) * 2010-07-07 2013-08-29 クゥアルコム・インコーポレイテッド ニューロプロセッサにおける交換可能なシナプス荷重記憶装置に関する方法及びシステム
JP2013538396A (ja) * 2010-08-04 2013-10-10 クゥアルコム・インコーポレイテッド 報酬変調されたスパイクタイミング依存可塑性のための方法およびシステム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5136717A (en) * 1988-11-23 1992-08-04 Flavors Technology Inc. Realtime systolic, multiple-instruction, single-data parallel computer system
US5978583A (en) * 1995-08-07 1999-11-02 International Business Machines Corp. Method for resource control in parallel environments using program organization and run-time support
US5845271A (en) 1996-01-26 1998-12-01 Thaler; Stephen L. Non-algorithmically implemented artificial neural networks and components thereof
US20020126673A1 (en) * 2001-01-12 2002-09-12 Nirav Dagli Shared memory
US6954744B2 (en) 2001-08-29 2005-10-11 Honeywell International, Inc. Combinatorial approach for supervised neural network learning
US7496546B2 (en) 2003-03-24 2009-02-24 Riken Interconnecting neural network system, interconnecting neural network structure construction method, self-organizing neural network structure construction method, and construction programs therefor
GB2402758B (en) * 2003-06-12 2006-09-27 Sun Microsystems Inc Method,apparatus and computer program product for simulating a storage configuration for a computer system
US8725658B2 (en) * 2011-09-21 2014-05-13 Brain Corporation Elementary network description for efficient memory management in neuromorphic systems
US9104973B2 (en) 2011-09-21 2015-08-11 Qualcomm Technologies Inc. Elementary network description for neuromorphic systems with plurality of doublets wherein doublet events rules are executed in parallel
US9460387B2 (en) 2011-09-21 2016-10-04 Qualcomm Technologies Inc. Apparatus and methods for implementing event-based updates in neuron networks
US8712941B2 (en) 2011-09-21 2014-04-29 Brain Corporation Elementary network description for efficient link between neuronal models and neuromorphic systems
US8719199B2 (en) 2011-09-21 2014-05-06 Brain Corporation Systems and methods for providing a neural network having an elementary network description for efficient implementation of event-triggered plasticity rules

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008545197A (ja) * 2005-06-28 2008-12-11 ニューロサイエンシーズ リサーチ ファンデーション インコーポレイテッド 神経モデリングのためのアドレス機構及び特殊目的プロセッサを使用する脳ベースの装置
JP2013529342A (ja) * 2010-05-19 2013-07-18 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア ニューラル処理ユニット
JP2013534017A (ja) * 2010-07-07 2013-08-29 クゥアルコム・インコーポレイテッド ニューロプロセッサにおける交換可能なシナプス荷重記憶装置に関する方法及びシステム
JP2013538396A (ja) * 2010-08-04 2013-10-10 クゥアルコム・インコーポレイテッド 報酬変調されたスパイクタイミング依存可塑性のための方法およびシステム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020515990A (ja) * 2017-04-04 2020-05-28 ハイロ テクノロジーズ リミテッド ニューラルネットワークプロセッサにおける構成可能でプログラム可能なスライディングウィンドウベースのメモリアクセス
JP7170281B2 (ja) 2017-04-04 2022-11-14 ハイロ テクノロジーズ リミテッド ニューラルネットワークプロセッサにおける構成可能でプログラム可能なスライディングウィンドウベースのメモリアクセス
JP2020537785A (ja) * 2017-10-17 2020-12-24 ザイリンクス インコーポレイテッドXilinx Incorporated ホスト通信されるマージされた重みと層単位命令のパッケージとを使用するニューラルネットワークアクセラレータによる多層ニューラルネットワーク処理
JP7196167B2 (ja) 2017-10-17 2022-12-26 ザイリンクス インコーポレイテッド ホスト通信されるマージされた重みと層単位命令のパッケージとを使用するニューラルネットワークアクセラレータによる多層ニューラルネットワーク処理

Also Published As

Publication number Publication date
EP3055812A2 (en) 2016-08-17
CN105637541A (zh) 2016-06-01
WO2015053889A2 (en) 2015-04-16
WO2015053889A3 (en) 2015-06-11
US20150106317A1 (en) 2015-04-16
US10339041B2 (en) 2019-07-02
CN105637541B (zh) 2019-12-20

Similar Documents

Publication Publication Date Title
JP2016536679A (ja) ニューラルシミュレータ用の共有メモリアーキテクチャ
JP6130056B2 (ja) スパイキングネットワークの効率的なハードウェア実装
JP2017509982A (ja) 原位置ニューラルネットワークコプロセッシング
JP2017509951A (ja) スパースニューラルネットワークを構成すること
JP2016539414A (ja) スパイキングニューラルネットワークにおいてリプレーを使用するシナプス学習を実装すること
JP2017511936A (ja) 現在の計算リソースへのニューラルネットワーク適応
WO2015053864A1 (en) Compiling network descriptions to multiple platforms
JP2017510890A (ja) 一般的なニューロンモデルの効率的な実装のための方法および装置
WO2015020802A2 (en) Computed synapses for neuromorphic systems
JP2016536657A (ja) ニューラルモデルのためのグループタグの実装のための方法および装置
JP2017519268A (ja) スパイキングニューラルネットワークにおけるグローバルスカラ値によって可塑性を調節すること
JP2017513108A (ja) サブしきい値変調を介するアナログ信号再構築および認識
JP2016538633A (ja) 多次元範囲にわたって分離可能なサブシステムを含むシステムの評価
JP2017509980A (ja) 動的な空間ターゲット選択
JP6193509B2 (ja) 可塑性シナプス管理
JP2016537711A (ja) スパイキングニューロンのネットワークにおける輻輳回避
JP6219509B2 (ja) シナプス遅延を動的に割り当てることおおよび検査すること
JP2017509956A (ja) 値をスパイクに変換するための方法
WO2014197175A2 (en) Efficient implementation of neural population diversity in neural system
JP2016536676A (ja) ニューラルモデル実行をリモートで制御および監視するための方法および装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170810

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170810

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180724

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180731

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20190305