JP2019537093A - 極度のスループットのニューラル・ネットワークのためのスケーラブル・ストリーム・シナプス・スーパーコンピュータ - Google Patents

極度のスループットのニューラル・ネットワークのためのスケーラブル・ストリーム・シナプス・スーパーコンピュータ Download PDF

Info

Publication number
JP2019537093A
JP2019537093A JP2019514276A JP2019514276A JP2019537093A JP 2019537093 A JP2019537093 A JP 2019537093A JP 2019514276 A JP2019514276 A JP 2019514276A JP 2019514276 A JP2019514276 A JP 2019514276A JP 2019537093 A JP2019537093 A JP 2019537093A
Authority
JP
Japan
Prior art keywords
network
neurosynaptic
chip
core
board
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019514276A
Other languages
English (en)
Other versions
JP7216640B2 (ja
Inventor
モダ、ダーメンドラ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2019537093A publication Critical patent/JP2019537093A/ja
Application granted granted Critical
Publication of JP7216640B2 publication Critical patent/JP7216640B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs

Abstract

【課題】 極度のスループットのニューラル・ネットワークのためのスケーラブル・ストリーム・シナプス・スーパーコンピュータを提供すること。【解決手段】 第1のニューロシナプス・コアの複数のニューロンの発火状態が実質的に並列に判定される。複数のニューロンの発火状態が、少なくとも1つの付加的なニューロシナプス・コアに実質的に並列に送達される。【選択図】 図1

Description

本発明の実施形態は、ニューロモルフィック・システムに関し、より詳細には、極度のスループットのニューラル・ネットワークのためのスケーラブル・ストリーム・シナプス・スーパーコンピュータに関する。
ニューロモルフィック・システムは、神経生物学的システムによって触発された電子回路を含む超大規模集積(VLSI)システムである。既存のこのようなニューロモルフィック・システムの短所には、高いエネルギー消費(運転費用)及び面積(機器費用)が含まれる。
従って、当該分野において上記課題に対処することが必要とされている。
本開示の実施形態によれば、ニューラル・ネットワークを動作させる方法及びそのためのコンピュータ・プログラム製品が提供される。第1のニューロシナプス・コアの複数のニューロンの発火状態が、実質的に並列に判定される。複数のニューロンの発火状態が、少なくとも1つの付加的なニューロシナプス・コアに実質的に並列に送達される。
本開示の実施形態によれば、ニューロモルフィック・システムが提供される。システムは、複数のニューロシナプス・コアを含む。ニューロシナプス・コアは、複数の軸索、複数のシナプス、及び複数のニューロンを含む。コア間ネットワークが、複数のニューロシナプス・コアを接続する。コア間ネットワークは、複数のニューロシナプス・コアの第1のニューロシナプス・コアから少なくとも1つの付加的なニューロシナプス・コアに、第1のニューロシナプス・コアの複数のニューロンの発火状態を実質的に並列に送達する。
本開示の実施形態によれば、ニューラル・ネットワークをシミュレーションする方法及びそのためのコンピュータ・プログラム製品が提供される。複数のニューロシナプス・コアがシミュレーションされる。シミュレーションされるニューロシナプス・コアは、複数のシミュレーションされる軸索、複数のシミュレーションされるシナプス、及び複数のシミュレーションされるニューロンを含む。複数のシミュレーションされるニューロシナプス・コアを接続するネットワークがシミュレーションされる。シミュレーションされるニューロシナプス・コアのうちの第1のものの複数のシミュレーションされるニューロンの発火状態の実質的に並列な判定が、シミュレーションされる。複数のシミュレーションされるニューロンの発火状態の、シミュレーションされるニューロシナプス・コアのうちの少なくとも1つの付加的なものへの実質的に並列な送達が、シミュレーションされる。
本発明をここで、単に例示の目的で、以下の図面に示されるような好ましい実施形態を参照して説明する。
本開示の実施形態によるニューロシナプス・コアを示す。 本開示の実施形態によるニューロシナプス・コア及びメッシュ・ルータを示す。 本開示の実施形態によるニューロシナプス・コアの数学的表現を示す。 本開示の実施形態によるチップ間通信のための例示的なアーキテクチャを示す。 本開示の実施形態によるニューロシナプス・ネットワークを動作させるための例示的な方法を示す。 本開示の実施形態によるニューロシナプス・ネットワークをシミュレーションするための例示的な方法を示す。 本開示の実施形態によるニューロモルフィック・システムの例示的なレイアウトを示す。 本開示の実施形態によるニューロモルフィック・システムの例示的なレイアウトを示す。 本発明の実施形態によるコンピューティング・ノードを示す。
ニューロシナプス・コアと呼ばれる極度に低パワーのニューロシナプス処理ユニットのアレイは、エクサスケールのビッグデータ問題を解くアーキテクチャを提供する。これらのコアは、スパイクを用いて情報をコード化する。ニューロシナプス・コアのネットワークにおいて、各コア上のニューロンは、他のいずれかのニューロシナプス・コア(それ自体を含む)のいずれかの軸索と接続することができる。ニューロンは、スパイクすると、宛先コア上の標的軸索に送達されるスパイク・パケットを送る。
デジタル・スパイキング・ニューロモルフィック・システムにおいて、情報は、スパイクによって表され、かつ送達され、各スパイクは、1又はそれより多くのビットを運ぶ、情報のデジタル・パケットである。例えば、IBM(登録商標)TrueNorthチップは、デジタル・スパイキング・ニューロモルフィック・システムであり、各スパイクは単一ビットの情報を運ぶ(バイナリスパイク)。TrueNorthのようなスパイキング・ニューラル・ネットワークは、情報のパケットをスイッチ通信ワイヤ上で送達することに基づくものであり、これにより、必要とされる配線が著しく削減される。スパイクの存在は、1を受け取ったものとして処理され、その不存在は、0を表す。いくつかの異なるスパイクコード化スキームを用いて、より多くの値をバイナリスパイクにコード化することができる。IBMは、インターナショナル・ビジネス・マシーンズ・コーポレーションの商標であり、世界中の多くの管轄区域で登録されている。
ソースコア上のソース・ニューロンから宛先コア上の標的軸索へのスパイク通信は、宛先コア上の標的軸索に送達されるためには、水平若しくは垂直のいずれか又は両方の組合せで2Dグリッド内のルータを経由して特定の数のホップ(hop)をトラバースすることを事実上必要とする。スパイク・パケットが各ホップをトラバースするたびに、パワー及びエネルギーが消費される。
TrueNorthのような例示的なニューロモルフィック・システム内で、スパイクがそのソース・ニューロンからその宛先軸索まで移動するのに許される時間は固定量である。この固定窓は、チック(tick)と呼ばれる。スパイクがその行程(journey)に必要とする時間は、スパイクが移動しなければならない距離、並びにスパイクが横切って移動する2Dメッシュ・ルーティング、チップ及びボードのインタフェースの数に基づいて変化する。
各チックにおいて、コア内のニューロンが第1のニューロンから開始して最後のニューロンまで連続して逐次的に処理される。従って、上記で論じた伝送の遅延に加えて、各スパイクはまた、コア上のどのニューロンがそのスパイクを生成したかに基づいて、なんらかの付加的な固定量だけ遅延する。例えば、1コア当たり256個のニューロンを有するTrueNorthのような例示的なニューロモルフィック・システムにおいて、256番目のニューロンは、先行する255ニューロンが処理されるまで処理されない。
本開示の種々の実施形態によれば、ニューロシナプス・プログラムは、ニューロシナプス・ネットワークを表す。ニューロシナプス・プログラムは、ニューロシナプス・ネットワークに関連した情報を含む。いくつかの実施形態において、情報は、入力スパイクに対する電子的なニューロンの応答を決定する、ニューロンの性質及び動力学を含む。例えば、ニューロンの性質及び動力学は、閾値パラメータ、漏れパラメータ、遅延パラメータ、又はリセットパラメータを含むことができる。いくつかの実施形態において、ニューロシナプス・プログラム情報は、ニューロンのシナプス接続(例えば、シナプス・クロスバーによって作成されたシナプス接続)を含む。いくつかの実施形態において、ニューロシナプス・プログラム情報は、軸索の性質(例えば、軸索のタイプ)を含む。いくつかの実施形態において、ニューロシナプス・プログラム情報は、ニューロンの出力スパイクが送達されるべき1つ又は複数の宛先(例えば、標的軸索)を含む。
種々の実施形態によれば、ニューロシナプス・ネットワークは、ニューロシナプス・プログラムのインスタンス化を表す。ニューロシナプス・ネットワークは、ハードウェア、シミュレーション、又はその両方でインスタンス化することができる。例えば、ニューロシナプス・プログラムは、ニューロシナプス・ネットワークの1つ又は複数のインスタンスを生じさせることができ、インスタンスは、単一コア、多重コア、又は多重チップ上に存在することができる。
種々の実施形態によれば、ニューロモルフィック・コア回路は、ニューロシナプス・プログラムによって記述される例示的なニューロシナプス・ネットワークを表す。
種々の実施形態によれば、コアレット(corelet)又はCoreletプログラミング言語は、ニューロシナプス・プログラムの抽象化を提供するソフトウェアを表す。ニューロシナプス・プログラムの構成は、コアレットを構成することによって作成することができる。
TrueNorthプログラムは、その外部入力及び出力に加えてニューロシナプス・コアのネットワークの完全な仕様である。種々の実施形態において、分割統治(divide−and−conquer)手法が採用され、これによりニューロシナプス・コアの大型のネットワークは、ニューロシナプス・コアのより小型のネットワークの集合を相互接続することによって構築され、小型のネットワークの各々は、それ自体がさらに小型のネットワークの集合を相互接続することによって構築することができ、以下同様に、単一のニューロシナプス・コアから成るネットワークまで下降し、これが、基本的な非分割可能な構築ブロックである。このプログラミング・パラダイムは、Coreletプログラミングと呼ばれる。
本開示の実施形態によれば、ニューラル・ネットワークは、面積及びエネルギーの理論的下界に近づく一方で、スループットの理論的上界に近づくように最適化される。これらの3つの計量を同時に最小化することはできないことは明らかである。しかしながら、本明細書で示す方法によれば、2つを同時に最適化することができる。具体的には、エネルギー消費(これは運転費用に対応する)及び面積(これは機器費用に対応する)を可能な限り低く保つ一方で、ニューラル・ネットワーク内で利用可能な並列性を活用して、かつてないほどのスループットを生み出す。
エネルギー消費及び面積を最小化する一方で、可変の速度で能力及びスループットを生み出すことにより、資本、運転費用、及びプログラミング費用が同様に最小化される。
本開示の実施形態によれば、極度の並列性が、高スループットを可能にする。
図1を参照すると、本開示の実施形態によるニューロシナプス・コアが示される。いくつかの実施形態において、ニューロシナプス・コア100は、行で示される軸索101と、列で示される樹状突起102と、行と列との接合部で示されるシナプス103と、樹状突起からの入力を受けるニューロン104とを含む。いくつかの実施形態において、256個のシナプスと、256個の軸索と、256個のニューロンとが存在する。このような実施形態において、256×256=65,536シナプスが存在する。情報は、軸索101から、シナプス103によって変調されて、ニューロン104に流れる。
いくつかの実施形態において、複数のニューロシナプス・コアがチップ上にタイル状に配置される。例示的な実施形態において、64×64グリッドのコアがタイル状に配置されて4,096コアがもたらされ、合計で1,048,576ニューロン及び268,435,456シナプスである。このような実施形態において、ニューロン、シナプス、及び短距離接続性は、物理的である。長距離接続性は、論理的である。例示的な実施形態が図2に示される。メッシュ・ルータ201がコア間の通信を提供する。所与のコア上に、ニューロン対コア202及びコア対軸索203の通信リンクも提供される。
図3を参照すると、ニューロシナプス・コアの数学的表現が示される。数学的には、ニューロシナプス・コアは、シナプス302を介して軸索301をニューロン303に相互接続する二部グラフを実装する。各入力軸索は、1つのニューロン、すべてのニューロン、又はそれらの任意の部分集合に接続することができる。入力軸索の任意の集合からニューロンの任意の集合への接続をプログラムすることができ、フレキシブルで有能なニューラル・ネットワーク・モジュールを作り出す。
本開示の種々の実施形態によれば、ニューロシナプス・チップの新たなアーキテクチャが提供される。このようなアーキテクチャにおいて、ニューロシナプス・コアの集合がネットワーク・オンチップによって相互接続される。いくつかの実施形態において、ネットワークをスケール変更するために、チップ間接続機能が提供される。
いくつかのこのようなアーキテクチャにおいて、各時間ステップ(すなわちチック)内で、コア内のニューロンは、逐次的には処理されない。代わりに、コア内のすべてのニューロンが1つの軸索上で一度に並列に動作する。各ニューロンがチック内で発火したかどうかを示すベクトルが構築される。上記の例を採用すると、256個のニューロンを有するコアの発火状態は、256次元のバイナリ・ベクトルとしてコード化することができる。この発火ベクトルは、ニューロシナプス・コア間で通信される。いくつかの実施形態において、すべてのニューロンは、パイプライン化され、複数の軸索を高速動作のための待ち行列に入れることができる。
本開示の実施形態によれば、コア間の接続性を、置換の観点で考えることができる。例えば、N個のニューロン及びN個の軸索を各々が有するC個のコアを考える。ニューロン発火活動の合計ベクトルは、長さC×Nのバイナリ・ベクトルである。このC×Nベクトルは、C×N軸索に通信される。それゆえ、これはC×NニューロンからC×N軸索への置換として考えることができる。従って、種々の実施形態において、オンチップのネットワークは、置換ネットワーク、Closネットワーク、バタフライ・ネットワーク、平坦化バタフライ・ネットワーク(flattened butterfly network)、又は当該分野で知られた他のネットワークとして実装することができる。
ここで図4を参照すると、チップ間通信のための例示的なアーキテクチャが示されている。上述のような置換ネットワークとして実装された所与のチップ401は、5つの入りポート(incoming port)411・・・415と、5つの出ポート(outgoing port)421・・・425とを含む。それゆえ、オンチップ・ネットワークは、ウェスト(West)ポート、イースト(East)ポート、ノース(North)ポート、及びサウス(South)ポートから、並びにチップ内から、ニューロン発火のバイナリ・ベクトルを5つまで受け取る。これは、これら5つのバイナリ・ベクトルを5つまでの宛先、すなわちウェスト・ポート、イースト・ポート、ノース・ポート、及びサウス・ポート並びにチップ内のコアにルーティングする。いくつかの例示的な実施形態において、チップのレイアウトを説明するのに東西南北の方位が使用されているが、本開示はあらゆるチップレイアウトに適用可能であることが認識されるであろう。本開示は、4つより多い又は少ない隣接チップを有するアーキテクチャにも適用可能である。例えば、チップの3次元レイアウトは、6つまでの隣接チップを含むことができ、その結果、7つまでの入りポート及び7つまでの出ポートがもたらされる。
本開示の実施形態は、極度に高速のコア動作のために、コア内のニューロンの完全な並列性、並びにパイプライン化された動作を利用する。各コアは、データの局所性を提供する。コア間の通信は、極度に高速のネットワーク動作のために、時間に拘束された(time-bound)、かつ並列な様式で提供され、このことは、2Dメッシュルータ・アーキテクチャ内でメッセージをシリアル化する必要性を排除し、各コアの並列性を利用する。これら2つの利点を組み合わせることで、モジュール方式の、スケーラブルな、タイル状に配置可能な設計で、かつてないスループットを達成することが可能になる。
いくつかの実施形態において、各ニューロシナプス・コアは、時分割多重化される。いくつかの実施形態において、係数Tを適用して、コア当たり異なる軸索とコア当たり異なるニューロンとがコアを横断して同じシナプス行列を介して相互接続されたT個のコアを実装する。このような実施形態において、各時間ステップ(すなわちチック)は、T個のサブ時間ステップに分割される。同期的に、各サブ時間ステップt:0...T−1内で、各軸索は、送達されることを必要とするスパイクについてチェックされる。スパイクが送達されることを必要とする場合、ニューロンjごとに、その状態がシナプス重みsijの関数として更新される。ニューロンjごとに、その新たなニューロン状態が、その以前の状態、そのパラメータ、及びその入力の関数として計算され、次いでスパイクについてチェックされる。スパイクを有する場合、その宛先位置が探索され、スパイク・パケットが生成され、ニューロンjが静止状態に戻る前にネットワーク上で送られる。非同期的に、スパイク・パケットがネットワークから受け取られ、軸索バッファが更新される。
いくつかの実施形態において、所与のコア上の各ニューロンに対して同じパラメータが用いられ、それゆえストレージが低減される。いくつかの実施形態において、クロックゲーティングを用いた同期設計が使用される。高いネットワーク複雑性を有するいくつかの実施形態において、入力ポートの最大可能数mと、C個のコアとを有するオンチップ・ネットワークが提供される。このような実施形態において、コア当たりのニューロン回路の数は、m/Cである。
いくつかの実施形態において、16×16コア・アレイを有するネットワークが64分割の時分割多重化で提供される。しかしながら、種々の他の実施形態において、コアの数は、ネットワーキングに起因するオーバーヘッドが計算を圧倒しないように選択される。一般に、所与のネットワークの速度は、最長のワイヤの長さがボトルネックになるか又はそれによって制限される。同様に、ネットワークの速度は、種々のポートにおけるインタフェースの速度によって制限される。それゆえ、オフチップ・ネットワークとオンチップ・ネットワークとの間の速度の差がボトルネックとなり得る。
上記の説明から認識されるように、本開示の実施形態によれば、樹状突起手法の代わりに軸索手法が採用される。メッシュ・ルーティングから置換ネットワークへのシフトは、非同期回路をクロックゲーティングされた同期回路で置き換えることを可能にすることが認識されるであろう。このようにして、開発の時間及び労力が低減される。組込み及びその後の改訂の容易さが、このような実施形態を実質的により簡素にする。
ここで図5を参照すると、本開示の実施形態によるニューロシナプス・ネットワークを動作させるための例示的な方法が示される。501において、第1のニューロシナプス・コアの複数のニューロンの発火状態が判定される。いくつかの実施形態において、発火状態は、実質的に並列に判定される。502において、複数のニューロンの発火状態が、少なくとも1つの付加的なニューロシナプス・コアに送達される。いくつかの実施形態において、発火状態は、実質的に並列に送達される。いくつかの実施形態において、発火状態は、チップ内ネットワークを介して送達される。
図6を参照すると、本開示の実施形態によるニューロシナプス・ネットワークをシミュレーションするための例示的な方法が示される。601において、複数のニューロシナプス・コアがシミュレーションされる。いくつかの実施形態において、シミュレーションされるニューロシナプス・コアは、複数のシミュレーションされる軸索及び複数のシミュレーションされるニューロンを含む。602において、複数のシミュレーションされるニューロシナプス・コアを接続するコア間ネットワークが、シミュレーションされる。603において、シミュレーションされるニューロシナプス・コアのうちの第1のものの、複数のシミュレーションされるニューロンの発火状態が判定される。いくつかの実施形態において、発火状態は、実質的に並列に判定される。604において、複数のシミュレーションされるニューロンの発火状態は、シミュレーションされるニューロシナプス・コアのうちの少なくとも1つの付加的なものに送達される。いくつかの実施形態において、発火状態は、実質的に並列に送達される。いくつかの実施形態において、発火状態は、チップ内ネットワークを介して送達される。
図7及び図8を参照すると、本開示の実施形態によるニューロモルフィック・システムの例示的なレイアウトが示される。ボード701は、チップ702のような複数のチップを含む。チップ702のような各チップは、コア703のような複数のコアを含む。コア703のような各コアは、ネットワーク704によって接続され、これは上述のような置換ネットワークとすることができる。
ここで図9を参照すると、コンピューティング・ノードの例の模式図が示される。コンピューティング・ノード10は、好適なコンピューティング・ノードの一例にすぎず、本明細書で説明される本発明の実施形態の使用又は機能の範囲に関するなんらかの制限を示唆することを意図するものではない。上記に関係なく、コンピューティング・ノード10は、本明細書で上述された機能のいずれかを実装及び/又は実施することができる。
コンピューティング・ノード10内に、他の多数の汎用又は専用コンピューティング・システム環境又は構成で動作可能な、コンピュータ・システム/サーバ12が存在する。コンピュータ・システム/サーバ12と共に用いるのに好適であり得る周知のコンピューティング・システム、環境、及び/又は構成の例として、これらに限定されるものではないが、パーソナル・コンピュータ・システム、サーバ・コンピュータ・システム、シン・クライアント、シック・クライアント、手持ち式又はラップトップ型デバイス、マルチプロセッサ・システム、マイクロプロセッサ・ベースのシステム、セットトップボックス、プログラム可能民生電子機器、ネットワークPC、ミニコンピュータ・システム、メインフレーム・コンピュータ・システム、及び上記のシステム若しくはデバイス等のいずれかを含む分散型クラウド・コンピューティング環境が含まれる。
コンピュータ・システム/サーバ12は、コンピュータ・システムによって実行される、プログラム・モジュールなどのコンピュータ・システム実行可能命令の一般的な文脈で説明することができる。一般に、プログラム・モジュールは、特定のタスクを実行する又は特定の抽象データ型を実装する、ルーチン、プログラム、オブジェクト、コンポーネント、論理、データ構造などを含むことができる。コンピュータ・システム/サーバ12は、通信ネットワークを通じてリンクされた遠隔処理デバイスによってタスクが実行される分散型クラウド・コンピューティング環境で実施することができる。分散型クラウド・コンピューティング環境において、プログラム・モジュールは、メモリ・ストレージ・デバイスを含むローカル及び遠隔両方のコンピュータ・システム・ストレージ媒体に配置することができる。
図9に示されるように、コンピューティング・ノード10のコンピュータ・システム/サーバ12は、汎用コンピューティング・デバイスの形で示される。コンピュータ・システム/サーバ12のコンポーネントは、これらに限定されるものではないが、1つ又は複数のプロセッサ又は処理ユニット16、システム・メモリ28、及びシステム・メモリ28を含む種々のシステム・コンポーネントをプロセッサ16に結合するバス18を含むことができる。
バス18は、メモリ・バス又はメモリ・コントローラ、周辺バス、アクセラレーテッド・グラフィックス・ポート、及び種々のバス・アーキテクチャのいずれかを用いるプロセッサ又はローカル・バスを含む、いくつかのタイプのバス構造のうちのいずれかの1つ又は複数を表す。限定ではなく例としては、このようなアーキテクチャは、業界標準アーキテクチャ(Industry Standard Architecture、ISA)バス、マイクロ・チャネル・アーキテクチャ(Micro Channel Architecture、MCA)バス、Enhanced ISA(EISA)バス、Video Electronics Standards Association(VESA)ローカル・バス、及びPeripheral Component Interconnect(PCI)バスを含む。
コンピュータ・システム/サーバ12は、典型的には、種々のコンピュータ・システム可読媒体を含む。このような媒体は、コンピュータ・システム/サーバ12がアクセス可能ないずれかの利用可能媒体とすることができ、揮発性媒体及び不揮発性媒体の両方と、取り外し可能媒体及び取り外し不能媒体の両方とを含む。
システム・メモリ28は、ランダム・アクセス・メモリ(RAM)30及び/又はキャッシュ・メモリ32など、揮発性メモリの形のコンピュータ・システム可読媒体を含むことができる。コンピュータ・システム/サーバ12は、他の取り外し可能/取り外し不能、揮発性/不揮発性のコンピュータ・システム・ストレージ媒体をさらに含むことができる。単なる例として、取り外し不能の不揮発性磁気媒体(図示されておらず、典型的には「ハード・ドライブ」と呼ばれる)との間の読み出し及び書き込みのために、ストレージ媒体34を設けることができる。図示されていないが、取り外し可能な不揮発性磁気ディスク(例えば、「フロッピー・ディスク」)との間の読み出し及び書き込みのための磁気ディスク・ドライブと、CD−ROM、DVD−ROM又は他の光媒体などの取り外し可能な不揮発性光ディスクとの間の読み出し及び書き込みのための光ディスク・ドライブとを設けることができる。このような例においては、それぞれを、1つ又は複数のデータ媒体インタフェースによって、バス18に接続することができる。以下でさらに示され説明されるように、メモリ28は、本発明の実施形態の機能を実行するように構成されたプログラム・モジュールのセット(例えば、少なくとも1つ)を有する少なくとも1つのプログラム製品を含むことができる。
限定ではなく例として、メモリ28内に、プログラム・モジュール42のセット(少なくとも1つ)を有するプログラム/ユーティリティ40、並びにオペレーティング・システム、1つ又は複数のアプリケーション・プログラム、他のプログラム・モジュール、及びプログラム・データを格納することができる。オペレーティング・システム、1つ又は複数のアプリケーション・プログラム、他のプログラム・モジュール、及びプログラム・データ、又はそれらの何らかの組み合わせの各々は、ネットワーキング環境の実装を含むことができる。プログラム・モジュール42は、一般に、本明細書で説明される本発明の実施形態の機能及び/又は方法を実行する。
コンピュータ・システム/サーバ12は、キーボード、ポインティング・デバイス、ディスプレイ24等のような1つ又は複数の外部デバイス14;ユーザがコンピュータ・システム/サーバ12と対話することを可能にする1つ又は複数のデバイス;及び/又はコンピュータ・システム/サーバ12が1つ又は複数の他のコンピューティング・デバイスと通信することを可能にするいずれかのデバイス(例えば、ネットワーク・カード、モデム等)と通信することもできる。このような通信は、入力/出力(I/O)インタフェース22を経由して行うことができる。さらにまた、コンピュータ・システム/サーバ12は、ネットワーク・アダプタ20を介して、ローカル・エリア・ネットワーク(LAN)、汎用広域ネットワーク(WAN)、及び/又は公衆ネットワーク(例えば、インターネット)などの1つ又は複数のネットワークと通信することもできる。示されるように、ネットワーク・アダプタ20は、バス18を介して、コンピュータ・システム/サーバ12の他のコンポーネントと通信する。図示されないが、コンピュータ・システム/サーバ12と共に他のハードウェア及び/又はソフトウェア・コンポーネントを使用できることを理解されたい。例として、これらに限定されるものではないが、マイクロコード、デバイス・ドライバ、冗長処理ユニット、外部のディスク・ドライブ・アレイ、RAIDシステム、テープ・ドライブ、及びデータ・アーカイブ・ストレージ・システム等が含まれる。
本発明は、システム、方法、及び/又はコンピュータ・プログラム製品とすることができる。コンピュータ・プログラム製品は、プロセッサに、本発明の態様を実行させるためのコンピュータ可読プログラム命令をそこに有するコンピュータ可読ストレージ媒体(単数又は複数)を含むことができる。
コンピュータ可読ストレージ媒体は、命令実行デバイスにより使用される命令を保持し、格納することができる有形デバイスとすることができる。コンピュータ可読ストレージ媒体は、例えば、これらに限定されるものではないが、電子ストレージ・デバイス、磁気ストレージ・デバイス、光ストレージ・デバイス、電磁気ストレージ・デバイス、半導体ストレージ・デバイス、又は上記のいずれかの適切な組み合わせとすることができる。コンピュータ可読ストレージ媒体のより具体的な例の非網羅的なリストとして、以下のもの:即ち、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ(RAM)、読み出し専用メモリ(ROM)、消去可能なプログラム可能読み出し専用メモリ(EPROM又はフラッシュ・メモリ)、静的ランダム・アクセス・メモリ(SRAM)、ポータブルなコンパクト・ディスク読み出し専用メモリ(CD−ROM)、デジタル多用途ディスク(DVD)、メモリ・スティック、フロッピー・ディスク、パンチカード若しくはそこに命令が記録された溝内の隆起構造などの機械的符号化デバイス、及び上記のいずれかの適切な組み合わせが挙げられる。本明細書で使用される場合、コンピュータ可読ストレージ媒体は、電波又は他の自由に伝搬する電磁波、導波路若しくは他の伝送媒体を通じて伝搬する電磁波(例えば、光ファイバ・ケーブルを通る光パルス)、又は配線を通じて伝送される電気信号のような、一時的信号それ自体として解釈されるべきではない。
本明細書で説明されるコンピュータ可読プログラム命令は、コンピュータ可読ストレージ媒体からそれぞれのコンピューティング/処理デバイスに、又は、例えばインターネット、ローカル・エリア・ネットワーク、広域ネットワーク、及び/又は無線ネットワークなどのネットワークを介して外部コンピュータ若しくは外部ストレージ・デバイスに、ダウンロードすることができる。ネットワークは、銅製伝送ケーブル、光伝送ケーブル、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、及び/又はエッジ・サーバを含むことができる。各コンピューティング/処理デバイス内のネットワーク・アダプタ・カード又はネットワーク・インターフェースは、ネットワークからコンピュータ可読プログラム命令を受け取り、それぞれのコンピューティング/処理デバイス内のコンピュータ可読ストレージ媒体内に格納するためにコンピュータ可読プログラム命令を転送する。
本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セット・アーキテクチャ(ISA)命令、マシン命令、マシン依存命令、ミリコード、ファームウェア命令、状態設定データ、又はSmalltalk、C++等などのオブジェクト指向型プログラミング言語、及び、「C」プログラミング言語、若しくは同様のプログラミング言語のような従来の手続き型プログラミング言語を含む1つ又は複数のプログラミング言語のいずれかの組み合わせで書かれたソース・コード若しくはオブジェクト・コードのいずれかとすることができる。コンピュータ可読プログラム命令は、完全にユーザのコンピュータ上で実行される場合もあり、スタンドアロンのソフトウェア・パッケージとして、一部がユーザのコンピュータ上で実行される場合もあり、一部がユーザのコンピュータ上で実行され、一部が遠隔コンピュータ上で実行される場合もあり、又は完全に遠隔コンピュータ若しくはサーバ上で実行される場合もある。後者のシナリオにおいては、遠隔コンピュータは、ローカル・エリア・ネットワーク(LAN)若しくは広域ネットワーク(WAN)を含むいずれかのタイプのネットワークを通じてユーザのコンピュータに接続される場合もあり、又は外部コンピュータへの接続がなされる場合もある(例えば、インターネット・サービス・プロバイダを用いたインターネットを通じて)。いくつかの実施形態において、例えば、プログラム可能論理回路、フィールド・プログラマブル・ゲート・アレイ(FPGA)、又はプログラム可能論理アレイ(PLA)を含む電子回路は、本発明の態様を実施するために、コンピュータ可読プログラム命令の状態情報を用いて電子回路を個人化することによって、コンピュータ可読プログラム命令を実行することができる。
本発明の態様は、本発明の実施形態による方法、装置(システム)及びコンピュータ・プログラム製品のフローチャート図及び/又はブロック図を参照して、本明細書で説明される。フローチャート図及び/又はブロック図の各ブロック、並びにフローチャート図及び/又はブロック図内のブロックの組み合わせは、コンピュータ可読プログラム命令によって実装できることが理解されるであろう。
これらのコンピュータ可読プログラム命令を、汎用コンピュータ、専用コンピュータ、又は他のプログラム可能データ処理装置のプロセッサに与えてマシンを製造し、それにより、コンピュータ又は他のプログラム可能データ処理装置のプロセッサによって実行される命令が、フローチャート及び/又はブロック図の1つ又は複数のブロックにおいて指定された機能/動作を実装するための手段を作り出すようにすることができる。これらのコンピュータ可読プログラム命令を、コンピュータ、プログラム可能データ処理装置、及び/又は他のデバイスを特定の方式で機能させるように指示することができるコンピュータ可読媒体内に格納し、それにより、内部に命令が格納されたコンピュータ可読ストレージ媒体が、フローチャート及び/又はブロック図の1つ又は複数のブロックにおいて指定された機能/動作の態様を実装する命令を含む製品を含むようにすることもできる。
コンピュータ・プログラム命令を、コンピュータ、他のプログラム可能データ処理装置、又は他のデバイス上にロードして、一連の動作ステップをコンピュータ、他のプログラム可能データ処理装置、又は他のデバイス上で行わせてコンピュータ実装プロセスを生成し、それにより、コンピュータ、他のプログラム可能装置、又は他のデバイス上で実行される命令が、フローチャート及び/又はブロック図の1つ又は複数のブロックにおいて指定された機能/動作を実行するようにもできる。
図面内のフローチャート及びブロック図は、本発明の種々の実施形態によるシステム、方法及びコンピュータ・プログラム製品の可能な実装のアーキテクチャ、機能及び動作を示す。この点に関して、フローチャート又はブロック図内の各ブロックは、指定された論理機能を実装するための1つ又は複数の実行可能命令を含むモジュール、セグメント、又は命令の部分を表すことができる。いくつかの代替的な実装において、ブロック内に記載された機能は、図面内に記載された順序とは異なる順序で行われ得ることもある。例えば、連続して示された2つのブロックが、関与する機能に応じて、実際には、実質的に同時に実行されることもあり、又は、ときにはブロックが逆順に実行されることもある。また、ブロック図及び/又はフローチャート図の各ブロック、並びにブロック図及び/又はフローチャート図内のブロックの組み合わせは、指定された機能又は動作を行う専用ハードウェア・ベースのシステムによって、又は専用ハードウェアとコンピュータ命令との組み合わせによって実装できることにも留意されたい。
本発明の種々の実施形態の説明が例証の目的のために提示されたが、これらは、網羅的であること、又は本発明を開示された形態に制限することを意図するものではない。当業者には、説明される実施形態の範囲から逸脱することなく、多くの修正及び変形が明らかであろう。本明細書で用いられる用語は、実施形態の原理、実際の適用、又は市場で見られる技術に優る技術的改善を最もよく説明するため、又は、当業者が、本明細書に開示される実施形態を理解するのを可能にするために選択された。
10:コンピューティング・ノード
100:ニューロシナプス・コア
101、301:軸索
102:樹状突起
103、302:シナプス
104、303:ニューロン
201:メッシュ・ルータ
401:チップ
411、412、413、414、415:入りポート
421、422、423、424、425:出ポート
701:ボード
702:チップ
703:コア
704:ネットワーク

Claims (30)

  1. 第1のニューロシナプス・コアの複数のニューロンの発火状態を実質的に並列に判定することと、
    前記複数のニューロンの前記発火状態を少なくとも1つの付加的なニューロシナプス・コアに実質的に並列に送達することと、
    を含む、方法。
  2. 前記第1のニューロシナプス・コア及び前記少なくとも1つの付加的なニューロシナプス・コアが、第1のチップ上に位置する、請求項1に記載の方法。
  3. 実質的に並列な送達が、コア間ネットワークを介する、請求項2に記載の方法。
  4. 実質的に並列な送達が、置換ネットワーク、Closネットワーク、又はバタフライ・ネットワークによって行われる、請求項3に記載の方法。
  5. 前記複数のニューロンの前記発火状態をパイプライン化することをさらに含む、請求項1〜4のいずれか1項に記載の方法。
  6. 前記複数のニューロンの前記発火状態に対応するバイナリ・ベクトルを構築することと、
    前記バイナリ・ベクトルを前記少なくとも1つの付加的なニューロシナプス・コアに伝送することと、
    をさらに含む、請求項1〜5のいずれか1項に記載の方法。
  7. 前記第1のニューロシナプス・コアが第1のチップ上に位置し、前記少なくとも1つの付加的なニューロシナプス・コアが第2のチップ上に位置する、請求項1〜6のいずれか1項に記載の方法。
  8. 前記複数のニューロンの前記発火状態を、前記第1のチップと前記第2のチップとを接続するチップ間ネットワークを介して伝送すること、
    をさらに含む請求項7に記載の方法。
  9. 前記チップ間ネットワークは、前記第1のチップの出ポート及び前記第2のチップの入りポートを含む、請求項8に記載の方法。
  10. 前記チップ間ネットワークは、前記第1のチップの入りポートに接続された前記第1のチップの出ポートを含む、請求項8に記載の方法。
  11. 前記第1及び第2のチップが第1のボード上に位置する、請求項7から請求項10までのいずれか1項に記載の方法。
  12. 前記第1のチップが第1のボード上に位置し、前記第2のチップが第2のボード上に位置し、前記第1のボードと前記第2のボードとが接続されている、請求項7から請求項10までのいずれか1項に記載の方法。
  13. 前記第1のボード及び前記第2のボードを含む複数のボードが階層的に配置され、前記第1のボードと前記第2のボードとがルータの階層を介して接続される、請求項12に記載の方法。
  14. 複数のニューロシナプス・コアであって、前記ニューロシナプス・コアが、複数の軸索、複数のシナプス、及び複数のニューロンを含む、複数のニューロシナプス・コアと、
    前記複数のニューロシナプス・コアを接続する第1のコア間ネットワークと、
    を含むシステムであって、
    前記第1のコア間ネットワークは、前記複数のニューロシナプス・コアの第1のニューロシナプス・コアから少なくとも1つの付加的なニューロシナプス・コアに、前記第1のニューロシナプス・コアの前記複数のニューロンの発火状態を実質的に並列に送達するように適合された、
    システム。
  15. 前記コア間ネットワークが、置換ネットワーク、Closネットワーク、又はバタフライ・ネットワークを含む、請求項14に記載のシステム。
  16. 前記第1のコア間ネットワークは、第1のチップ上に位置し、第2のコア間ネットワークは、第2のチップ上に位置し、前記少なくとも1つの付加的なニューロシナプス・コアは、前記第2のコア間ネットワークに接続されている、請求項14又は請求項15のいずれか1項に記載のシステム。
  17. 前記第1のチップ及び前記第2のチップが隣接している、請求項16に記載のシステム。
  18. 前記第1のコア間ネットワークを前記第2のコア間ネットワークに接続するポートをさらに含む、請求項16又は請求項17のいずれか1項に記載のシステム。
  19. 前記第1のコア間ネットワークをそれ自体に接続するポートをさらに含む、請求項14から請求項18までのいずれか1項に記載のシステム。
  20. 前記第1及び第2のチップが第1のボード上に位置する、請求項16から請求項19までのいずれか1項に記載のシステム。
  21. 前記第1のチップが第1のボード上に位置し、前記第2のチップが第2のボード上に位置し、前記第1のボードと前記第2のボードとが接続されている、請求項16から請求項19までのいずれか1項に記載のシステム。
  22. 前記第1のボード及び前記第2のボードを含む複数のボードが階層的に配置され、前記第1のボードと前記第2のボードとがルータの階層を介して接続される、請求項21に記載のシステム。
  23. 複数のニューロシナプス・コアをシミュレーションすることであって、シミュレーションされるニューロシナプス・コアが、複数のシミュレーションされる軸索、複数のシミュレーションされるシナプス、及び複数のシミュレーションされるニューロンを含む、複数のニューロシナプス・コアをシミュレーションすることと、
    前記複数のシミュレーションされるニューロシナプス・コアを接続するネットワークをシミュレーションすることと、
    シミュレーションされるニューロシナプス・コアのうちの第1のものの、複数のシミュレーションされるニューロンの発火状態の判定をシミュレーションすることと、
    前記複数のシミュレーションされるニューロンの前記発火状態の、シミュレーションされるニューロシナプス・コアのうちの少なくとも1つの付加的なものへの送達をシミュレーションすることと、
    を含む、方法。
  24. シミュレーションされる前記ネットワークが、コア間ネットワークを含む、請求項23に記載の方法。
  25. シミュレーションされる前記ネットワークが、チップ間ネットワークを含む、請求項23に記載の方法。
  26. シミュレーションされる前記ネットワークが、ボード間ネットワークを含む、請求項23に記載の方法。
  27. ニューロシナプス・ネットワークを動作させるためのコンピュータ・プログラム製品であって、
    請求項1から請求項13までのいずれかに記載の方法を行うために処理回路によって実行される命令を格納した、前記処理回路によって可読のコンピュータ可読ストレージ媒体を含む、
    コンピュータ・プログラム製品。
  28. コンピュータ可読媒体上に格納された、デジタル・コンピュータの内部メモリにロードすることができるコンピュータ・プログラムであって、前記プログラムがコンピュータ上で実行されたときに請求項1から請求項13までのいずれか1項に記載の方法をコンピュータに実行させるソフトウェアコード部分を含む、コンピュータ・プログラム。
  29. ニューロシナプス・ネットワークをシミュレーションするためのコンピュータ・プログラム製品であって、
    請求項23から請求項26までのいずれか1項に記載の方法を行うために処理回路によって実行される命令を格納した、前記処理回路によって可読のコンピュータ可読ストレージ媒体を含む、
    コンピュータ・プログラム製品。
  30. コンピュータ可読媒体上に格納された、デジタル・コンピュータの内部メモリにロードすることができるコンピュータ・プログラムであって、前記プログラムがコンピュータ上で実行されたときに請求項23から請求項26までのいずれか1項に記載の方法をコンピュータに実行させるソフトウェアコード部分を含む、コンピュータ・プログラム。
JP2019514276A 2016-09-30 2017-09-26 極度のスループットのニューラル・ネットワークのためのスケーラブル・ストリーム・シナプス・スーパーコンピュータ Active JP7216640B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/282,705 US11270193B2 (en) 2016-09-30 2016-09-30 Scalable stream synaptic supercomputer for extreme throughput neural networks
US15/282,705 2016-09-30
PCT/IB2017/055830 WO2018060840A1 (en) 2016-09-30 2017-09-26 Scalable stream synaptic supercomputer for extreme throughput neural networks

Publications (2)

Publication Number Publication Date
JP2019537093A true JP2019537093A (ja) 2019-12-19
JP7216640B2 JP7216640B2 (ja) 2023-02-01

Family

ID=61758251

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019514276A Active JP7216640B2 (ja) 2016-09-30 2017-09-26 極度のスループットのニューラル・ネットワークのためのスケーラブル・ストリーム・シナプス・スーパーコンピュータ

Country Status (6)

Country Link
US (1) US11270193B2 (ja)
JP (1) JP7216640B2 (ja)
CN (1) CN109564637B (ja)
DE (1) DE112017002931T5 (ja)
GB (1) GB2569074B (ja)
WO (1) WO2018060840A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10810488B2 (en) * 2016-12-20 2020-10-20 Intel Corporation Neuromorphic core and chip traffic control
CN113241369B (zh) * 2021-04-29 2022-05-06 齐鲁工业大学 一种支持孤波传导的模拟神经纤维的pn微米线
CN113554162B (zh) * 2021-07-23 2022-12-20 上海新氦类脑智能科技有限公司 轴突输入扩展方法、装置、设备和存储介质
CN115099395B (zh) * 2022-08-25 2022-11-15 北京灵汐科技有限公司 神经网络构建方法及装置、设备、介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0652132A (ja) * 1992-07-28 1994-02-25 Mitsubishi Electric Corp 並列演算半導体集積回路装置およびそれを用いたシステム
US20120259804A1 (en) * 2011-04-08 2012-10-11 International Business Machines Corporation Reconfigurable and customizable general-purpose circuits for neural networks
US20140180984A1 (en) * 2012-12-21 2014-06-26 International Business Machines Corporation Time-division multiplexed neurosynaptic module with implicit memory addressing for implementing a universal substrate of adaptation
US20150262057A1 (en) * 2012-03-29 2015-09-17 International Business Machines Corporation Synaptic, dendritic, somatic, and axonal plasticity in a network of neural cores using a plastic multi-stage crossbar switching

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8676734B2 (en) 2010-07-07 2014-03-18 Qualcomm, Incorporated Methods and systems for replaceable synaptic weight storage in neuro-processors
US8510239B2 (en) * 2010-10-29 2013-08-13 International Business Machines Corporation Compact cognitive synaptic computing circuits with crossbar arrays spatially in a staggered pattern
US8515885B2 (en) 2010-10-29 2013-08-20 International Business Machines Corporation Neuromorphic and synaptronic spiking neural network with synaptic weights learned using simulation
US8812414B2 (en) * 2011-05-31 2014-08-19 International Business Machines Corporation Low-power event-driven neural computing architecture in neural networks
US9147156B2 (en) * 2011-09-21 2015-09-29 Qualcomm Technologies Inc. Apparatus and methods for synaptic update in a pulse-coded network
US8909576B2 (en) * 2011-09-16 2014-12-09 International Business Machines Corporation Neuromorphic event-driven neural computing architecture in a scalable neural network
US8996430B2 (en) * 2012-01-27 2015-03-31 International Business Machines Corporation Hierarchical scalable neuromorphic synaptronic system for synaptic and structural plasticity
EP2856386A1 (en) 2012-05-24 2015-04-08 Telefonaktiebolaget L M Ericsson (PUBL) Enhanced secure virtual machine provisioning
US9159020B2 (en) 2012-09-14 2015-10-13 International Business Machines Corporation Multiplexing physical neurons to optimize power and area
US9020867B2 (en) 2012-11-06 2015-04-28 International Business Machines Corporation Cortical simulator for object-oriented simulation of a neural network
US9477926B2 (en) 2012-11-20 2016-10-25 Qualcomm Incorporated Piecewise linear neuron modeling
US8990130B2 (en) 2012-11-21 2015-03-24 International Business Machines Corporation Consolidating multiple neurosynaptic cores into one memory
US10248675B2 (en) 2013-10-16 2019-04-02 University Of Tennessee Research Foundation Method and apparatus for providing real-time monitoring of an artifical neural network
US9798972B2 (en) 2014-07-02 2017-10-24 International Business Machines Corporation Feature extraction using a neurosynaptic system for object classification
US9881252B2 (en) * 2014-09-19 2018-01-30 International Business Machines Corporation Converting digital numeric data to spike event data
WO2016054441A1 (en) * 2014-10-01 2016-04-07 Thalchemy Corporation Efficient and scalable systems for calculating neural network connectivity in an event-driven way
US10552740B2 (en) * 2014-11-10 2020-02-04 International Business Machines Corporation Fault-tolerant power-driven synthesis
US10679120B2 (en) * 2014-11-10 2020-06-09 International Business Machines Corporation Power driven synaptic network synthesis
CN104615909B (zh) * 2015-02-02 2018-02-13 天津大学 基于FPGA的Izhikevich神经元网络同步放电仿真平台
US9984323B2 (en) * 2015-03-26 2018-05-29 International Business Machines Corporation Compositional prototypes for scalable neurosynaptic networks
CN105095967B (zh) * 2015-07-16 2018-02-16 清华大学 一种多模态神经形态网络核
CN105095961B (zh) * 2015-07-16 2017-09-29 清华大学 一种人工神经网络和脉冲神经网络的混合系统
CN105488565A (zh) * 2015-11-17 2016-04-13 中国科学院计算技术研究所 加速深度神经网络算法的加速芯片的运算装置及方法
CN105550749A (zh) * 2015-12-09 2016-05-04 四川长虹电器股份有限公司 一种新型网络拓扑结构的卷积神经网络的构造方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0652132A (ja) * 1992-07-28 1994-02-25 Mitsubishi Electric Corp 並列演算半導体集積回路装置およびそれを用いたシステム
US20120259804A1 (en) * 2011-04-08 2012-10-11 International Business Machines Corporation Reconfigurable and customizable general-purpose circuits for neural networks
US20150262057A1 (en) * 2012-03-29 2015-09-17 International Business Machines Corporation Synaptic, dendritic, somatic, and axonal plasticity in a network of neural cores using a plastic multi-stage crossbar switching
US20140180984A1 (en) * 2012-12-21 2014-06-26 International Business Machines Corporation Time-division multiplexed neurosynaptic module with implicit memory addressing for implementing a universal substrate of adaptation

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
ANARGYROS KRIKELIS: ""A novel massively associative processing architecture for the implementation of artificial neural n", PROCEEDINGS OF 1991 INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING (ICASSP 91), JPN6021044926, 17 April 1991 (1991-04-17), pages 1057 - 1060, XP010043385, ISSN: 0004639939, DOI: 10.1109/ICASSP.1991.150828 *
ARNON AMIR, ET AL.: ""Cognitive Computing Programming Paradigm: A Corelet Language for Composing Networks of Neurosynapti", PROCEEDINGS OF THE 2013 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN), JPN6021008618, 9 August 2013 (2013-08-09), pages 1 - 10, XP032542182, ISSN: 0004462969, DOI: 10.1109/IJCNN.2013.6707078 *
DJONES LETTNIN, ET AL.: ""Synthesis of Embedded SystemC Design: A Case Study of Digital Neural Networks"", PROCEEDINGS OF THE DESIGN, AUTOMATION AND TEST IN EUROPE CONFERENCE AND EXHIBITION DESIGNERS' FORUM, JPN6021008616, 20 February 2004 (2004-02-20), pages 1 - 6, ISSN: 0004462968 *
DMITRI VAINBRAND, ET AL.: ""Scalable network-on-chip architecture for configurable neural networks"", MICROPROCESSORS AND MICROSYSTEMS, vol. 35, no. 2, JPN6021044928, 13 August 2010 (2010-08-13), pages 152 - 166, XP028144876, ISSN: 0004639940, DOI: 10.1016/j.micpro.2010.08.005 *
PAUL MEROLLA, ET AL.: ""A Digital Neurosynaptic Core Using Embedded Crossbar Memory with 45pJ per Spike in 45nm"", PROCEEDINGS OF 2011 IEEE CUSTOM INTEGRATED CIRCUITS CONFERENCE (CICC), JPN6022055594, 21 September 2011 (2011-09-21), pages 1 - 4, XP055010659, ISSN: 0004958759, DOI: 10.1109/CICC.2011.6055294 *
RAQIBUL HASAN, ET AL.: ""A Reconfigurable Low Power High Throughput Architecture for Deep Network Training"", ARXIV:1603.07400V2, vol. version v2, JPN6021008619, 15 June 2016 (2016-06-15), pages 1 - 9, ISSN: 0004462970 *
ROBERT PREISSL, ET AL.: ""Compass: A scalable simulator for an architecture for Cognitive Computing"", PROCEEDINGS OF THE INTERNATIONAL CONFERENCE ON HIGH PERFORMANCE COMPUTING, NETWORKING, STORAGE AND A, JPN6022055596, 16 November 2012 (2012-11-16), pages 1 - 11, XP032337517, ISSN: 0004958758, DOI: 10.1109/SC.2012.34 *
STEVE K. ESSER, ET AL.: ""Cognitive Computing Systems: Algorithms and Applications for Networks of Neurosynaptic Cores"", PROCEEDINGS OF THE 2013 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN), JPN6021044931, 9 August 2013 (2013-08-09), pages 1 - 10, XP032542370, ISSN: 0004639938, DOI: 10.1109/IJCNN.2013.6706746 *

Also Published As

Publication number Publication date
WO2018060840A1 (en) 2018-04-05
CN109564637B (zh) 2023-05-12
CN109564637A (zh) 2019-04-02
DE112017002931T5 (de) 2019-03-14
US20180096242A1 (en) 2018-04-05
US11270193B2 (en) 2022-03-08
GB2569074B (en) 2022-03-23
GB201904766D0 (en) 2019-05-22
GB2569074A (en) 2019-06-05
JP7216640B2 (ja) 2023-02-01

Similar Documents

Publication Publication Date Title
US10782726B2 (en) Optimizing core utilization in neurosynaptic systems
EP3566185B1 (en) Area-efficient, reconfigurable, energy-efficient, speed-efficient neural network substrate
JP7216640B2 (ja) 極度のスループットのニューラル・ネットワークのためのスケーラブル・ストリーム・シナプス・スーパーコンピュータ
US10990872B2 (en) Energy-efficient time-multiplexed neurosynaptic core for implementing neural networks spanning power- and area-efficiency
CN107710238A (zh) 具有堆栈存储器的硬件加速器上的深度神经网络处理
US20190303741A1 (en) Defect resistant designs for location-sensitive neural network processor arrays
US20210295168A1 (en) Gradient compression for distributed training
US10838860B2 (en) Memory-mapped interface to message-passing computing systems
US10725494B2 (en) Optimizing neurosynaptic networks
CN113469355B (zh) 分布式系统中的多模型训练管道
US11586893B2 (en) Core utilization optimization by dividing computational blocks across cores
US20200117988A1 (en) Networks for distributing parameters and data to neural network compute cores
WO2019185634A1 (en) Block transfer of neuron output values through data memory for neurosynaptic processors
US20190236444A1 (en) Functional synthesis of networks of neurosynaptic cores on neuromorphic substrates
WO2022203925A1 (en) Resource allocation for reconfigurable processors
US20200117985A1 (en) Array-integrated upstream/downstream router for circuit switched parallel connectivity
US11645501B2 (en) Distributed, event-based computation using neuromorphic cores
US11200496B2 (en) Hardware-software co-design of neurosynaptic systems
CN116348890A (zh) 神经网络处理
US20200097801A1 (en) Low spike count ring buffer mechanism on neuromorphic hardware
US20220129769A1 (en) Modular neural network computing apparatus with distributed neural network storage
WO2023052287A1 (en) Implicit vector concatenation within 2d mesh routing
Chen FPGA Based Multi-core Architectures for Deep Learning Networks

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210316

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210604

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220210

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20220502

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220517

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220906

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20220906

C11 Written invitation by the commissioner to file amendments

Free format text: JAPANESE INTERMEDIATE CODE: C11

Effective date: 20220920

C12 Written invitation by the commissioner to file intermediate amendments

Free format text: JAPANESE INTERMEDIATE CODE: C12

Effective date: 20220920

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20221107

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20221108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230120

R150 Certificate of patent or registration of utility model

Ref document number: 7216640

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150