JP2017516192A

JP2017516192A - ニューラルネットワークにおける差分符号化

Info

Publication number: JP2017516192A
Application number: JP2016558315A
Authority: JP
Inventors: アンナプレディー、ベンカタ・スリーカンタ・レッディ; ジュリアン、デイビッド・ジョナサン; トワル、レーガン・ブライス; リウ、インイン
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2014-03-24
Filing date: 2015-03-17
Publication date: 2017-06-15
Also published as: WO2015148189A2; US20150269481A1; CN107077637B; KR20160136381A; EP3123404A2; WO2015148189A3; CN107077637A; BR112016022195A2

Abstract

ニューラルネットワークにおける差分符号化は、ニューロンの少なくとも１つの以前の活性化値に基づいて、ニューラルネットワークにおけるニューロンの活性化値を予測することを含む。符号化することは、予測された活性化値と、ニューラルネットワークにおけるニューロンの実際の活性化値との間の差分に基づいて値を符号化することをさらに含む。

Description

関連出願の相互参照
[0001]本出願は、米国特許法第１１９条（ｅ）の下で、２０１４年３月２４日に出願された「ＤＩＦＦＥＲＥＮＴＩＡＬＥＮＣＯＤＩＮＧＩＮＮＥＵＲＡＬＮＥＴＷＯＲＫＳ」と題する米国仮特許出願第６１／９６９，７４７号の利益を主張し、その開示は、参照によりその全体が本明細書に明示的に組み込まれる。

[0002]本開示のいくつかの態様は、一般にニューラルシステムエンジニアリングに関し、より詳細には、ニューラルネットワークにおける差分符号化のためのシステムおよび方法に関する。

[0003]人工ニューロン（すなわち、ニューロンモデル）の相互結合されたグループを備え得る人工ニューラルネットワークは、計算デバイスであるか、または計算デバイスによって実行される方法を表す。人工ニューラルネットワークは、生物学的ニューラルネットワークにおける対応する構造および／または機能を有し得る。しかしながら、人工ニューラルネットワークは、従来の計算技法が厄介、実行不可能または不適切であるいくつかの適用例に革新的で有用な計算技法を提供することができる。人工ニューラルネットワークは観測から関数を推測することができるので、そのようなネットワークは、タスクまたはデータの複雑さが従来の技法による関数の設計を煩わしくする用途において、特に有用である。

[0004]本開示のある態様による、ニューラルネットワークにおいて差分符号化を実行する方法は、ニューロンの少なくとも１つの以前の活性化値に基づいて、ニューラルネットワークにおけるニューロンの活性化値を予測することを含む。そのような方法は、予測された活性化値と、ニューラルネットワークにおけるニューロンの活性化値との間の差分に基づいて値を符号化することをさらに含む。

[0005]本開示のある態様による、ニューラルネットワークにおいて差分符号化を実行するための装置は、メモリと、メモリに結合された少なくとも１つのプロセッサとを含む。本プロセッサは、ニューロンの少なくとも１つの以前の活性化値に基づいて、ニューラルネットワークにおけるニューロンの活性化値を予測するように構成される。本プロセッサはまた、予測された活性化値と、ニューラルネットワークにおけるニューロンの活性化値との間の差分に基づいて値を符号化するように構成される。

[0006]本開示の別の態様による、スパイキングニューラルネットワークにおいて差分符号化を実行するための装置は、ニューロンの少なくとも１つの以前の活性化値に基づいて、ニューラルネットワークにおけるニューロンの活性化値を予測するための手段を含む。そのような装置は、予測された活性化値と、ニューラルネットワークにおけるニューロンの活性化値との間の差分に基づいて値を符号化するための手段をさらに含む。

[0007]本開示の別の態様による、スパイキングニューラルネットワークにおいて差分符号化を実行するためのコンピュータプログラム製品は、プログラムコードを符号化した非一時的コンピュータ可読媒体を含む。本プログラムコードは、ニューロンの少なくとも１つの以前の活性化値に基づいて、ニューラルネットワークにおけるニューロンの活性化値を予測するためのプログラムコードを含む。本プログラムコードはまた、予測された活性化値と、ニューラルネットワークにおけるニューロンの活性化値との間の差分に基づいて値を符号化するためのプログラムコードを含む。

[0008]これは、以下の詳細な説明がより良く理解され得るように、本開示の特徴および技術的利点をかなり広く概説したものである。本開示の追加の特徴および利点は、以下で説明される。この開示は、本開示と同じ目的を実行するための他の構造を修正または設計するための基礎として容易に変更され得ることが、当業者によって理解されるべきである。また、添付の特許請求の範囲に記載されるように、そのような等価な構成は本開示の教示から逸脱しないことが、当業者によって理解されるべきである。本開示の特徴と考えられる新規な特徴は、その構成と動作の方法との両方に関して、さらなる目的および利点とともに、添付の図面と関連して考慮されるとき以下の説明からより良く理解されるであろう。しかしながら、図面の各々は単に例示および説明の目的のために提供されているにすぎず、本開示の制限の定義として意図されていないことが、明確には理解されるべきである。

[0009]本開示の特徴、性質、および利点は、同様の参照文字が全体を通して相応して識別する図面を考慮した場合、以下に示される詳細な説明から、より明らかになるだろう。

[0010]本開示のいくつかの態様によるニューロンの例示的なネットワークを示す図。 [0011]本開示のいくつかの態様による、計算ネットワーク（ニューラルシステムまたはニューラルネットワーク）の処理ユニット（ニューロン）の一例を示す図。 [0012]本開示のいくつかの態様によるスパイクタイミング依存可塑性（ＳＴＤＰ）曲線の一例を示す図。 [0013]本開示のいくつかの態様による、ニューロンモデルの挙動を定義するための正レジームおよび負レジームの一例を示す図。 [0014]本開示のある態様による、汎用プロセッサを使用してニューラルネットワークを設計することの例示的な実装形態を示す図。 [0015]本開示のいくつかの態様による、メモリが個々の分散処理ユニットとインターフェースされ得るニューラルネットワークを設計する例示的な実装形態を示す図。 [0016]本開示のいくつかの態様による、分散メモリおよび分散処理ユニットに基づいてニューラルネットワークを設計する例示的な実装形態を示す図。 [0017]本開示のいくつかの態様による、ニューラルネットワークの例示的な実装形態を示す図。 [0018]本開示の態様による、差分符号化を実行するための方法を示す図。

[0019]添付の図面に関連して以下に示される詳細な説明は、様々な構成の説明として意図されたものであり、本明細書において説明される概念が実現され得る唯一の構成を表すことを意図されるものではない。詳細な説明は、様々な概念の完全な理解を提供する目的で、具体的な詳細を含む。しかしながら、これらの概念がこれらの具体的な詳細なしで実施され得ることは、当業者にとっては明らかであろう。いくつかの事例では、よく知られている構造および構成要素が、そのような概念を曖昧にするのを避けるために、ブロック図形式で示される。

[0020]本教示に基づいて、本開示の範囲は、本開示の任意の他の態様とは無関係に実装されるにせよ、本開示の任意の他の態様と組み合わされるにせよ、本開示のいかなる態様をもカバーするものであることを、当業者なら諒解されたい。たとえば、記載される態様をいくつ使用しても、装置は実装され得、または方法は実施され得る。さらに、本開示の範囲は、記載される本開示の様々な態様に加えてまたはそれらの態様以外に、他の構造、機能、または構造および機能を使用して実施されるそのような装置または方法をカバーするものとする。開示する本開示のいずれの態様も、請求項の１つまたは複数の要素によって実施され得ることを理解されたい。

[0021]「例示的」という単語は、本明細書では「例、事例、または例示の働きをすること」を意味するために使用される。「例示的」として本明細書で説明するいかなる態様も、必ずしも他の態様よりも好ましいまたは有利であると解釈されるべきであるとは限らない。

[0022]本明細書では特定の態様について説明するが、これらの態様の多くの変形および置換は本開示の範囲内に入る。好ましい態様のいくつかの利益および利点が説明されるが、本開示の範囲は特定の利益、使用、または目的に限定されるものではない。むしろ、本開示の態様は、様々な技術、システム構成、ネットワーク、およびプロトコルに広く適用可能であるものとし、そのうちのいくつかを例として図および好ましい態様についての以下の説明で示す。発明を実施するための形態および図面は、本開示を限定するものではなく説明するものにすぎず、本開示の範囲は添付の特許請求の範囲およびそれの均等物によって定義される。
例示的なニューラルシステム、トレーニングおよび動作
[0023]図１は、本開示のいくつかの態様による、複数のレベルのニューロンをもつ例示的な人工ニューラルシステム１００を示す。ニューラルシステム１００は、シナプス結合のネットワーク１０４（すなわち、フィードフォワード結合）を介してニューロンの別のレベル１０６に結合されたニューロンのあるレベル１０２を有し得る。簡単のために、図１には２つのレベルのニューロンのみが示されているが、ニューラルシステムには、より少ないまたはより多くのレベルのニューロンが存在し得る。ニューロンのいくつかは、ラテラル結合を介して同じ層の他のニューロンに結合し得ることに留意されたい。さらに、ニューロンのいくつかは、フィードバック結合を介して前の層のニューロンに戻る形で結合し得る。

[0024]図１に示すように、レベル１０２における各ニューロンは、前のレベル（図１に図示せず）のニューロンによって生成され得る入力信号１０８を受信し得る。信号１０８は、レベル１０２のニューロンの入力電流を表し得る。この電流は、膜電位を充電するためにニューロン膜上に蓄積され得る。膜電位がそれのしきい値に達すると、ニューロンは、発火し、ニューロンの次のレベル（たとえば、レベル１０６）に転送されるべき出力スパイクを生成し得る。いくつかのモデリング手法では、ニューロンは、信号をニューロンの次のレベルに継続的に転送し得る。この信号は、典型的には膜電位の関数である。そのような挙動は、以下で説明するものなどのアナログおよびデジタル実装形態を含むハードウェアおよび／またはソフトウェアでエミュレートまたはシミュレートされ得る。

[0025]生物学的ニューロンでは、ニューロンが発火するときに生成される出力スパイクは、活動電位と呼ばれる。電気信号は、約１００ｍＶの振幅と約１ｍｓの持続時間とを有する比較的急速で、一時的な神経インパルスである。一連の結合されたニューロンを有するニューラルシステムの特定の実施形態（たとえば、図１におけるあるレベルのニューロンから別のレベルのニューロンへのスパイクの転送）では、あらゆる活動電位が基本的に同じ振幅と持続時間とを有するので、信号における情報は、振幅によってではなく、スパイクの周波数および数、またはスパイクの時間によってのみ表され得る。活動電位によって搬送される情報は、スパイク、スパイクしたニューロン、および他の１つまたは複数のスパイクに対するスパイクの時間によって決定され得る。以下で説明するように、スパイクの重要性は、ニューロン間の接続に適用される重みによって決定され得る。

[0026]図１に示されるように、ニューロンのあるレベルから別のレベルへのスパイクの移動は、シナプス結合（または、単純に「シナプス」）１０４のネットワークを介して達成され得る。シナプス１０４に関して、レベル１０２のニューロンはシナプス前ニューロンと考えられ得、レベル１０６のニューロンはシナプス後ニューロンと考えられ得る。シナプス１０４は、レベル１０２のニューロンから出力信号（すなわち、スパイク）を受信して、調整可能なシナプスの重み

に応じてそれらの信号をスケーリングすることができ、上式で、Ｐはレベル１０２のニューロンとレベル１０６のニューロンとの間のシナプス結合の総数であり、ｉはニューロンレベルの指標である。図１の例では、ｉはニューロンレベル１０２を表し、ｉ＋１は、ニューロンレベル１０６を表す。さらに、スケーリングされた信号は、レベル１０６における各ニューロンの入力信号として合成され得る。レベル１０６におけるあらゆるニューロンは、対応する合成された入力信号に基づいて、出力スパイク１１０を生成し得る。出力スパイク１１０は、シナプス結合の別のネットワーク（図１には図示せず）を使用して、別のレベルのニューロンに転送され得る。

[0027]生物学的シナプスは、シナプス後ニューロンにおける興奮性活動または抑制性（過分極化）活動のいずれかを調停することができ、ニューロン信号を増幅する役目を果たすことができる。興奮性信号は、膜電位を脱分極する（すなわち、静止電位に対して膜電位を増加させる）。しきい値を超えて膜電位を脱分極するために十分な興奮性信号が一定の時間期間内に受信された場合、シナプス後ニューロンに活動電位が生じる。対照的に、抑制性信号は一般に、膜電位を過分極する（すなわち、低下させる）。抑制性信号は、十分に強い場合、興奮性信号のすべてを相殺し、膜電位がしきい値に達するのを防止することができる。シナプス興奮を相殺することに加えて、シナプス抑制は、自然に活発なニューロンに対して強力な制御を行うことができる。自然に活発なニューロンは、たとえば、それのダイナミクスまたはフィードバックに起因するさらなる入力なしにスパイクするニューロンを指す。これらのニューロンにおける活動電位の自然な生成を抑圧することによって、シナプス抑制は、一般にスカルプチャリングと呼ばれる、ニューロンの発火のパターンを形成することができる。様々なシナプス１０４は、望まれる挙動に応じて、興奮性シナプスまたは抑制性シナプスの任意の組合せとして働き得る。

[0028]ニューラルシステム１００は、汎用プロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）もしくは他のプログラマブル論理デバイス（ＰＬＤ）、個別ゲートもしくはトランジスタ論理、個別ハードウェア構成要素、プロセッサによって実行されるソフトウェアモジュール、またはそれらの任意の組合せによってエミュレートされ得る。ニューラルシステム１００は、たとえば画像およびパターン認識、機械学習、モータ制御、および似ているなど、かなりの適用範囲において利用され得る。ニューラルシステム１００における各ニューロンは、ニューロン回路として実装され得る。出力スパイクを開始するしきい値まで充電されるニューロン膜は、たとえば、そこを通って流れる電流を積分するキャパシタとして実装され得る。

[0029]一態様では、キャパシタは、ニューロン回路の電流積分デバイスとして除去され得、その代わりにより小さいメモリスタ（memristor）要素が使用され得る。この手法は、ニューロン回路において、ならびにかさばるキャパシタが電流積分器として利用される様々な他の適用例において適用され得る。さらに、シナプス１０４の各々は、メモリスタ要素に基づいて実装され得、シナプス重みの変化は、メモリスタ抵抗の変化に関係し得る。ナノメートルの特徴サイズのメモリスタを用いると、ニューロン回路およびシナプスの面積が大幅に低減され得、それによって、大規模なニューラルシステムハードウェア実装形態の実装がより実用的になり得る。

[0030]ニューラルシステム１００をエミュレートするニューラルプロセッサの機能は、ニューロン間の結合の強さを制御し得る、シナプス結合の重みに依存し得る。シナプス重みは、パワーダウン後にプロセッサの機能を維持するために、不揮発性メモリに記憶され得る。一態様では、シナプス重みメモリは、主たるニューラルプロセッサチップとは別個の外部チップ上に実装され得る。シナプス重みメモリは、交換可能メモリカードとしてニューラルプロセッサチップとは別個にパッケージ化され得る。これは、ニューラルプロセッサに多様な機能を提供することができ、特定の機能は、ニューラルプロセッサに現在取り付けられているメモリカードに記憶されたシナプス重みに基づき得る。

[0031]図２は、本開示のいくつかの態様による、計算ネットワーク（たとえば、ニューラルシステムまたはニューラルネットワーク）の処理ユニット（たとえば、ニューロンまたはニューロン回路）２０２の例示的な図２００を示す。たとえば、ニューロン２０２は、図１のレベル１０２のニューロンおよび１０６のニューロンのうちのいずれかに対応し得る。ニューロン２０２は、ニューラルシステムの外部にある信号、または同じニューラルシステムの他のニューロンによって生成された信号、またはその両方であり得る、複数の入力信号２０４₁〜２０４_Nを受信し得る。入力信号は、電流、コンダクタンス、電圧、実数値および／または複素数値であり得る。入力信号は、固定小数点表現または浮動小数点表現をもつ数値を備え得る。これらの入力信号は、調整可能なシナプス重み２０６₁〜２０６_N（ｗ₁〜ｗ_N）に従って信号をスケーリングするシナプス結合を通してニューロン２０２に伝えられ得、Ｎはニューロン２０２の入力接続の総数であり得る。

[0032]ニューロン２０２は、スケーリングされた入力信号を合成し、合成された、スケーリングされた入力を使用して、出力信号２０８（すなわち、信号ｙ）を生成し得る。出力信号２０８は、電流、コンダクタンス、電圧、実数値および／または複素数値であり得る。出力信号は、固定小数点表現または浮動小数点表現をもつ数値であり得る。出力信号２０８は、次いで、同じニューラルシステムの他のニューロンへの入力信号として、または同じニューロン２０２への入力信号として、またはニューラルシステムの出力として伝達され得る。

[0033]処理ユニット（ニューロン）２０２は電気回路によってエミュレートされ得、それの入力接続および出力接続は、シナプス回路をもつ電気接続によってエミュレートされ得る。処理ユニット２０２ならびにそれの入力接続および出力接続はまた、ソフトウェアコードによってエミュレートされ得る。処理ユニット２０２はまた、電気回路によってエミュレートされ得るが、それの入力接続および出力接続はソフトウェアコードによってエミュレートされ得る。一態様では、計算ネットワーク中の処理ユニット２０２はアナログ電気回路であり得る。別の態様では、処理ユニット２０２はデジタル電気回路であり得る。さらに別の態様では、処理ユニット２０２は、アナログ構成要素とデジタル構成要素の両方をもつ混合信号電気回路であり得る。計算ネットワークは、上述の形態のいずれかにおける処理ユニットを含み得る。そのような処理ユニットを使用した計算ネットワーク（ニューラルシステムまたはニューラルネットワーク）は、たとえば画像およびパターン認識、機械学習、モータ制御など、かなりの適用範囲において利用され得る。

[0034]ニューラルネットワークをトレーニングする過程で、シナプス重み（たとえば、図１の重み

および／または図２の重み２０６₁〜２０６_N）がランダム値により初期化され得、学習ルールに従って増加または減少し得る。学習ルールの例は、これに限定されないが、スパイクタイミング依存可塑性（ＳＴＤＰ）学習ルール、Ｈｅｂｂ則、Ｏｊａ則、Ｂｉｅｎｅｎｓｔｏｃｋ−Ｃｏｐｐｅｒ−Ｍｕｎｒｏ（ＢＣＭ）則等を含むことを当業者は理解するだろう。いくつかの態様では、重みは、２つの値のうちの１つに安定または収束し得る（すなわち、重みの双峰分布）。この効果が利用されて、シナプス重みごとのビット数を低減し、シナプス重みを記憶するメモリとの間の読取りおよび書込みの速度を上げ、シナプスメモリの電力および／またはプロセッサ消費量を低減し得る。
シナプスタイプ
[0035]ニューラルネットワークのハードウェアおよびソフトウェアモデルでは、シナプス関係機能の処理がシナプスタイプに基づき得る。シナプスタイプは、非塑性シナプス（non-plastic synapse）（重みおよび遅延の変化がない）、可塑性シナプス（重みが変化し得る）、構造遅延可塑性シナプス（重みおよび遅延が変化し得る）、完全可塑性シナプス（重み、遅延および結合性が変化し得る）、およびそれの変形（たとえば、遅延は変化し得るが、重みまたは結合性の変化はない）であり得る。複数のタイプの利点は、処理が再分割され得ることである。たとえば、非塑性シナプスは、可塑性機能を使用しないで実行される場合がある（またはそのような機能が完了するのを待つ）。同様に、遅延および重み可塑性は、一緒にまたは別々に、順にまたは並列に動作し得る動作に再分割され得る。異なるタイプのシナプスは、適用される異なる可塑性タイプの各々の異なるルックアップテーブルまたは式およびパラメータを有し得る。したがって、本方法は、シナプスのタイプについての関連する表、式、またはパラメータにアクセスする。

[0036]スパイクタイミング依存構造可塑性がシナプス可塑性とは無関係に実行され得るという事実のさらなる含意がある。構造可塑性は、重みの大きさに変化がない場合（たとえば、重みが最小値または最大値に達したか、あるいはそれが何らかの他の理由により変更されない場合）ｓ構造可塑性（すなわち、遅延量の変化）は前後スパイク時間差（pre-post spike time difference）の直接関数であり得ても実行され得る。代替的に、構造可塑性は、重み変化量に応じて、または重みもしくは重み変化の限界に関係する条件に基づいて設定され得る。たとえば、重み変化が生じたとき、または重みが最大値になるのではなく、重みがゼロに達した場合のみ、シナプス遅延が変化し得る。しかしながら、これらのプロセスが並列化され、メモリアクセスの数および重複を低減し得るように、独立した機能を有することが有利であり得る。
シナプス可塑性の決定
[0037]神経可塑性（または単に「可塑性」）は、脳内のニューロンおよびニューラルネットワークがそれらのシナプス結合と挙動とを新しい情報、感覚上の刺激、発展、損傷または機能不全に応答して変える能力である。可塑性は、生物学における学習および記憶にとって、また計算論的神経科学およびニューラルネットワークにとって重要である。（たとえば、Ｈｅｂｂ則理論による）シナプス可塑性、スパイクタイミング依存可塑性（ＳＴＤＰ）、非シナプス可塑性、活性依存可塑性、構造可塑性および恒常的可塑性など、様々な形の可塑性が研究されている。

[0038]ＳＴＤＰは、ニューロン間のシナプス結合の強さを調整する学習プロセスである。結合強度は、特定のニューロンの出力スパイクおよび受信入力スパイク（すなわち、活動電位）の相対的タイミングに基づいて調整される。ＳＴＤＰプロセスの下で、あるニューロンに対する入力スパイクが、平均して、そのニューロンの出力スパイクの直前に生じる傾向がある場合、長期増強（ＬＴＰ）が生じ得る。その場合、その特定の入力はいくらか強くなる。一方、入力スパイクが、平均して、出力スパイクの直後に生じる傾向がある場合、長期抑圧（ＬＴＤ）が生じ得る。その場合、その特定の入力はいくらか弱くなるので、「スパイクタイミング依存可塑性」と呼ばれる。したがって、シナプス後ニューロンの興奮の原因であり得る入力は、将来的に寄与する可能性がさらに高くなる一方、シナプス後スパイクの原因ではない入力は、将来的に寄与する可能性が低くなる。結合の初期セットのサブセットが残る一方で、その他の部分の影響がわずかなレベルまで低減されるまで、このプロセスは続く。

[0039]ニューロンは一般に出力スパイクを、それの入力の多くが短い期間内に生じる（すなわち、出力をもたらすのに十分な累積がある）ときに生成するので、通常残っている入力のサブセットは、時間的に相関する傾向のあった入力を含む。さらに、出力スパイクの前に生じる入力は強化されるので、最も早い十分に累積的な相関指示を提供する入力は結局、ニューロンへの最終入力となる。

[0040]ＳＴＤＰ学習ルールは、シナプス前ニューロンのスパイク時間ｔ_preとシナプス後ニューロンのスパイク時間ｔ_postとの間の時間差（すなわち、ｔ＝ｔ_post−ｔ_pre）に応じて、シナプス前ニューロンをシナプス後ニューロンに結合するシナプスのシナプス重みを効果的に適合させ得る。ＳＴＤＰの通常の公式化は、時間差が正である（シナプス前ニューロンがシナプス後ニューロンの前に発火する）場合にシナプス重みを増加させ（すなわち、シナプスを増強し）、時間差が負である（シナプス後ニューロンがシナプス前ニューロンの前に発火する）場合にシナプス重みを減少させる（すなわち、シナプスを抑制する）ことである。

[0041]ＳＴＤＰプロセスでは、経時的なシナプス重みの変化は通常、以下の式によって与えられるように、指数関数的減衰を使用して達成され得る。

ここで、ｋ₊およびｋ_-τ_sign(Δt)はそれぞれ、正の時間差および負の時間差の時間定数であり、ａ₊およびａ_-は対応するスケーリングの大きさであり、μは正の時間差および／または負の時間差に適用され得るオフセットである。

[0042]図３は、ＳＴＤＰによる、シナプス前スパイクおよびシナプス後スパイクの相対的タイミングに応じたシナプス重み変化の例示的な図３００を示す。シナプス前ニューロンがシナプス後ニューロンの前に発火する場合、グラフ３００の部分３０２に示すように、対応するシナプス重みは増加し得る。この重み増加は、シナプスのＬＴＰと呼ばれ得る。グラフ部分３０２から、シナプス前スパイク時間とシナプス後スパイク時間との間の時間差に応じて、ＬＴＰの量がほぼ指数関数的に減少し得ることが観測され得る。グラフ３００の部分３０４に示すように、発火の逆の順序は、シナプス重みを減少させ、シナプスのＬＴＤをもたらし得る。

[0043]図３のグラフ３００に示すように、ＳＴＤＰグラフのＬＴＰ（原因）部分３０２に負のオフセットμが適用され得る。ｘ軸の交差３０６のポイント（ｙ＝０）は、層ｉ−１からの原因入力の相関を考慮して、最大タイムラグと一致するように構成され得る。フレームベースの入力（すなわち、スパイクまたはパルスを備える特定の持続時間のフレームの形態である入力）の場合、オフセット値μは、フレーム境界を反映するように計算され得る。直接的にシナプス後電位によってモデル化されるように、またはニューラル状態に対する影響の点で、フレームにおける第１の入力スパイク（パルス）が経時的に減衰することが考慮され得る。フレームにおける第２の入力スパイク（パルス）が特定の時間フレームの相関したまたは関連したものと考えられる場合、フレームの前および後の関連する時間は、その時間フレーム境界で分離され、関連する時間の値が異なり得る（たとえば、１つのフレームよりも大きい場合は負、１つのフレームよりも小さい場合は正）ように、ＳＴＤＰ曲線の１つまたは複数の部分をオフセットすることによって、可塑性の点で別様に扱われ得る。たとえば、曲線が、フレーム時間よりも大きい前後の時間で実際にゼロよりも下になり、結果的にＬＴＰの代わりにＬＴＤの一部であるようにＬＴＰをオフセットするために負のオフセットμが設定され得る。
ニューロンモデルおよび演算
[0044]有用なスパイキングニューロンモデルを設計するための一般的原理がいくつかある。良いニューロンモデルは、２つの計算レジーム、すなわち、一致検出および関数計算の点で豊かな潜在的挙動を有し得る。その上、良いニューロンモデルは、時間コーディングを可能にするための２つの要素を有する必要がある：入力の到着時間は出力時間に影響を与え、一致検出は狭い時間ウィンドウを有し得る。最終的に、計算上魅力的であるために、良いニューロンモデルは、連続時間に閉形式解と、ニアアトラクター（near attractor）と鞍点とを含む安定した挙動とを有し得る。言い換えれば、有用なニューロンモデルは、実用的なニューロンモデルであり、豊かで、現実的で、生物学的に一貫した挙動をモデル化するために使用され得、神経回路のエンジニアリングとリバースエンジニアリングの両方を行うために使用され得るニューロンモデルである。

[0045]ニューロンモデルは事象、たとえば入力の到着、出力スパイク、または内部的であるか外部的であるかを問わず他の事象に依存し得る。豊かな挙動レパートリーを実現するために、複雑な挙動を示すことができる状態機械が望まれ得る。入力寄与（ある場合）とは別個の事象の発生自体が状態機械に影響を与え、事象の後のダイナミクスを制限し得る場合、システムの将来の状態は、単なる状態および入力の関数ではなく、むしろ状態、事象および入力の関数である。

[0046]一態様では、ニューロンｎは、下記のダイナミクスによって決定される膜電圧ｖ_n（ｔ）によるスパイキングリーキー積分発火ニューロンとしてモデル化され得る。

ここでαおよびβは、パラメータであり、ｗ_m,nは、シナプス前ニューロンｍをシナプス後ニューロンｎに結合するシナプスのシナプス重みであり、ｙ_m（ｔ）は、ニューロンｎの細胞体に到着するまでΔｔ_m,nに従って樹状遅延または軸索遅延によって遅延し得るニューロンｍのスパイキング出力である。

[0047]シナプス後ニューロンへの十分な入力が達成された時間からシナプス後ニューロンが実際に発火する時間までの遅延があることに留意されたい。イジケヴィッチの単純モデルなど、動的スパイキングニューロンモデルでは、脱分極しきい値ｖ_tとピークスパイク電圧ｖ_peakとの間に差がある場合、時間遅延が生じ得る。たとえば、単純モデルでは、電圧および復元のための１対の微分方程式、すなわち、

によってニューロン細胞体ダイナミクス（neuron soma dynamics）が決定され得る。ここでｖは膜電位であり、ｕは、膜復元変数であり、ｋは、膜電位ｖの時間スケールを記述するパラメータであり、ａは、復元変数ｕの時間スケールを記述するパラメータであり、ｂは、膜電位ｖのしきい値下変動に対する復元変数ｕの感度を記述するパラメータであり、ｖ_rは、膜静止電位であり、Ｉは、シナプス電流であり、Ｃは、膜のキャパシタンスである。このモデルによれば、ニューロンはｖ＞ｖ_peakのときにスパイクすると定義される。
ＨｕｎｚｉｎｇｅｒＣｏｌｄモデル
[0048]ＨｕｎｚｉｎｇｅｒＣｏｌｄニューロンモデルは、豊かな様々な神経挙動を再生し得る最小二重レジームスパイキング線形動的モデルである。モデルの１次元または２次元の線形ダイナミクスは２つのレジームを有することができ、時間定数（および結合）はレジームに依存し得る。しきい値下レジームでは、時間定数は、慣例により負であり、一般に生物学的に一貫した線形方式で静止状態に細胞を戻す役目を果たすリーキーチャネルダイナミクスを表す。しきい値上レジームにおける時間定数は、慣例により正であり、一般にスパイク生成のレイテンシを生じさせる一方でスパイク状態に細胞を駆り立てる反リーキーチャネルダイナミクスを反映する。

[0049]図４に示すように、モデル４００のダイナミクスは２つの（またはそれよりも多くの）レジームに分割され得る。これらのレジームは、負のレジーム（ｎｅｇａｔｉｖｅｒｅｇｉｍｅ）４０２（ｌｅａｋｙ−ｉｎｔｅｇｒａｔｅ−ａｎｄ−ｆｉｒｅ（ＬＩＦ）ニューロンモデルと混同されないように、交換可能にＬＩＦレジームとも呼ばれる）、および正のレジーム（ｐｏｓｉｔｉｖｅｒｅｇｉｍｅ）４０４（ａｎｔｉ−ｌｅａｋｙ−ｉｎｔｅｇｒａｔｅ−ａｎｄ−ｆｉｒｅ（ＡＬＩＦ）ニューロンモデルと混同されないように、交換可能にＡＬＩＦレジームとも呼ばれる）と呼ばれ得る。負レジーム４０２では、状態は将来の事象の時点における静止（ｖ_-）の傾向がある。この負レジームでは、モデルは一般に、時間的入力検出特性と他のしきい値下挙動とを示す。正レジーム４０４では、状態はスパイキング事象（ｖ_s）の傾向がある。この正レジームでは、モデルは、後続の入力事象に応じてスパイクにレイテンシを生じさせるなどの計算特性を示す。事象の点からのダイナミクスの公式化およびこれら２つのレジームへのダイナミクスの分離は、モデルの基本的特性である。

[0050]線形二重レジーム２次元ダイナミクス（状態ｖおよびｕの場合）は、慣例により次のように定義され得る。

ここでｑ_ρおよびｒは、結合のための線形変換変数である。

[0051]シンボルρは、ダイナミクスレジームを示すためにここで使用され、特定のレジームの関係を論述または表現するときに、それぞれ負レジームおよび正レジームについて符号「−」または「＋」にシンボルρを置き換える慣例がある。

[0052]モデル状態は、膜電位（電圧）ｖおよび復元電流ｕによって定義される。基本形態では、レジームは基本的にモデル状態によって決定される。正確で一般的な定義の微妙だが重要な側面があるが、差し当たり、モデルが、電圧ｖがしきい値（ｖ₊）を上回る場合に正レジーム４０４にあり、そうでない場合に負レジーム４０２にあると考える。

[0053]レジーム依存時間定数は、負レジーム時間定数であるτ_-と正レジーム時間定数であるτ₊とを含む。復元電流時間定数τ_uは通常、レジームから独立している。便宜上、τ_uと同様に、指数およびτ₊が一般に正となる正レジームの場合に、電圧発展（voltage evolution）に関する同じ表現が使用され得るように、減衰を反映するために負の量として負レジーム時間定数τ_-が一般に指定される。

[0054]２つの状態要素のダイナミクスは、事象において、ヌルクラインから状態をオフセットする変換によって結合され得、ここで変換変数は、

であり、δ、ε、βおよびｖ_-、ｖ₊はパラメータである。ｖ_ρのための２つの値は、２つのレジームのための参照電圧のベースである。パラメータｖ_-は、負レジームのためのベース電圧であり、膜電位は一般に、負レジームにおいてｖ_-に減衰する。パラメータｖ₊は、正レジームのためのベース電圧であり、膜電位は一般に、正レジームにおいてｖ₊から離れる傾向となる。

[0055]ｖおよびｕのためのヌルクラインは、それぞれ変換変数ｑ_ρおよびｒの負によって与えられる。パラメータδは，ｕヌルクラインの傾きを制御するスケール係数である。パラメータεは通常、−ｖ_-に等しく設定される。パラメータβは、両方のレジームにおいてｖヌルクラインの傾きを制御する抵抗値である。τ_ρ時間定数パラメータは、指数関数的減衰だけでなく、各レジームにおいて別個にヌルクラインの傾きを制御する。

[0056]モデルは、電圧ｖが値ｖ_sに達したときにスパイクするように定義され得る。続いて、状態は（スパイク事象と同じ１つのものであり得る）リセット事象でリセットされ得る。

ここで、

およびΔｕはパラメータである。リセット電圧

は通常、ｖ_-にセットされる。

[0057]瞬時結合の原理によって、状態について（また、単一の指数項による）だけではなく、特定の状態に到達するための時間についても、閉形式解が可能である。近い形式状態解は、次のとおりである。

[0058]したがって、モデル状態は、入力（シナプス前スパイク）または出力（シナプス後スパイク）などの事象に伴ってのみ更新され得る。また、演算が（入力があるか、出力があるかを問わず）任意の特定の時間に実行され得る。

[0059]その上、瞬時結合原理によって、反復的技法または数値解法（たとえば、オイラー数値解法）なしに、特定の状態に到達する時間が事前に決定され得るように、シナプス後スパイクの時間が予想され得る。前の電圧状態ｖ₀を踏まえ、電圧状態ｖ_fに到達するまでの時間遅延は、次の式によって与えられる。

[0060]スパイクが、電圧状態ｖがｖ_sに到達する時間に生じると定義される場合、電圧が所与の状態ｖにある時間から測定されたスパイクが生じるまでの時間量、または相対的遅延に関する閉形式解は、次のとおりである。

ここで、

は通常、パラメータｖ₊にセットされるが、他の変形も可能であり得る。

[0061]モデルダイナミクスの上記の定義は、モデルが正レジームにあるか、それとも負レジームにあるかに依存する。上述のように、結合およびレジームρは、事象に伴って計算され得る。状態の伝搬のために、レジームおよび結合（変換）変数は、最後の（前の）事象の時間における状態に基づいて定義され得る。続いてスパイク出力時間を予想するために、レジームおよび結合変数は、次の（最新の）事象の時間における状態に基づいて定義され得る。

[0062]Ｃｏｌｄモデルの、適時にシミュレーション、エミュレーションまたはモデルを実行するいくつかの可能な実装形態がある。これは、たとえば、事象更新モード、ステップ事象更新モード、およびステップ更新モードを含む。事象更新は、（特定の瞬間における）事象または「事象更新」に基づいて状態が更新される更新である。ステップ更新は、間隔（たとえば、１ｍｓ）をおいてモデルが更新される更新である。これは必ずしも、反復的技法または数値解法を利用するとは限らない。また、事象がステップもしくはステップ間で生じる場合または「ステップ事象」更新によってモデルを更新するのみによって、ステップベースのシミュレータにおいて限られた時間分解能で事象ベースの実装形態が可能である。
ニューラルネットワークにおける差分符号化
[0063]本開示の態様は、ニューラルネットワークにおける差分符号化を対象とする。

[0064]いくつかの態様では、ニューラルネットワークは、オブジェクト分類、音声認識、および手書き認識を含む多くの推論タスクを学習または解決する。多くのアプリケーションでは、ニューラルネットワークは、感覚情報の連続ストリームから「意味」を作成する。たとえば、限定としてではないが、ロボット（または、スマートフォン）は、一連の画像上に高レベルの機能またはカテゴリラベルを抽出するためにニューラルネットワークを使用し得る（すなわち、画像分類）。そのような場合、ニューラルネットワークは、入力データストリームの時間的な構造を利用し得る。データストリームは、インスタンスからインスタンスへとあまり変化しないので、または、たとえば運動予測などの予測可能な方法で変化するので、本開示は、むしろ、各インスタンスにおけるすべてのデータ値を送信するよりも、差分または差分結果を送信し得る。本開示はまた、機械学習ネットワークの差分符号化に適用され得る。たとえば、画像上のスケール不変特徴量変換（Scale-Invariant Feature Transform）（ＳＩＦＴ）特徴を計算することは、以前の画像への差分に基づいて、ＳＩＦＴ値および位置の差分符号化を使用してもよく、運動ベースの前方推定値に基づいてもよい。

[0065]ニューラルネットワークはニューロンの層を有し、底部層は生データを表し、上位層は特徴を表す。底部層はネットワークにおける下部層であり得、底部層から出力を受信する層はネットワークにおける上位層であり得る。たとえば、「底部」層は何らかの事前処理または初期特徴抽出を有した中間隠れレベルであり得、「上部」層は「底部」層から入力を受信する層であり得る。時間的な構造を有する感覚ストリームを推論すると、各ニューロンは、そのニューロンの活性化の履歴に基づいて活性化を予測し得る。そのような場合、他のニューロンに活性化値を伝搬することは、実際の活性化値と履歴に基づいて予測された値との間の差分（または、エラー）を送信することよりも効率が悪い。

[0066]予測がどのくらい良好かに応じて、ニューラルネットワークのレベル間の通信が低下する。ニューロン間の通信がバイナリ（すなわち、スパイクまたは非スパイク）である場合、本開示による差分／エラー手法は、差分符号化を通じてより少ないスパイクを伝播する。予測された値は、ニューロンの層で１００％の精度に近づくので、上位層のニューロンでは計算の必要性が少ない。ニューロンが非バイナリである場合、差分符号化は、活性化値の完全なセットを送信することと比較して同じレベルの精度を達成するためにより少数のビットを使用する。

[0067]本開示は符号化値を送信し得、符号化値は、ニューラルネットワークにおける層間の、予測された活性化値と活性化値との間の差分であり得る。さらに、本開示の態様では、ニューラルネットワークにおける層間で送信されている情報を変更する機会があり得る。活性化値は差分値であってもよく、活性化値自体であってもよく、他のデータであってもよい。どの活性化値、活性化値における差分、または一般的な値の決定は、多くの要因に基づき得る。これらの要因は、活性化値のビット数または活性化値における差分、ニューラルネットワークの層間で任意のデータが送信されたかどうかを決定するために使用されるしきい値、活性化値を決定するために使用される活性化関数、入力ニューロンへの入力の受信、活性化値のビット幅、または他の要因を含む。たとえば、しきい値は、ビット数に基づいて設定され得る。すなわち、差分が特定のニューロンのための通信のために利用可能なビット数に依存する特定の値を超えた場合、差分が送信される。

[0068]活性化値、ならびに予測された活性化値は、１つまたは複数の活性化関数を使用して決定され得る。活性化関数のうちの１つまたは複数は、非線形関数であり得る。活性化関数はフィルタを使用して実装され得、また活性化値および／または差分符号化された活性化値の符号化を決定し得る。

[0069]ニューラルネットワークにおけるデータの送信または他の分布は、継続的、定期的、または断続的であり得る。すなわち、状態情報はネットワークを介して定期的に（断続的に）同期され得る。さらに、活性化値および／または差分符号化された活性化値の符号化は、入力データの受信から遅延され得る。

[0070]差分符号化は、ニューラルネットワーク内で送信されるデータの量を減少し得るが、本開示はまた、設計オプションは、符号化のための計算を減少させるか、送信されるデータを決定しながら、ネットワーク内でより多くのデータを送信することを含み得ることを想定している。たとえば、活性化値の予測は送信されない場合があり、データが受信されるとシステムを通じて実際のデータが単に転送され得る。この手法は、大規模なデータスループットとわずかな計算をもたらす。設計上のトレードオフは、様々なニューラルネットワーク設計を満たすために、ニューラルネットワークにおけるデータ送信とデータ計算との間に行われ得る。

[0071]ニューラルネットワーク内で、いくつかのニューロンの活性化関数のいくつかは、ニューラルネットワークの動作中に「モード」を変更し得る。さらに、いくつかのニューロンは常に１つのモードで動作し得、他のニューロンは別のモードで動作する。たとえば、いくつかのニューロンは差分符号化データのみを送信し得、他のニューロンは活性化値全体を送信し得る。いくつかのニューロンはモードを切り替えることができ、たとえば、動作中、ある時点まで活性化値全体を送信して、次いで、その時点の後は差分符号化された活性化値を送信する。ニューラルネットワーク内で送信されているデータの変化は、ニューラルネットワークにおけるデータの分類、あるいは利用可能な計算能力、送信の信頼性、ニューラルネットワークの大きさ、または他の制約を含む他の要因に基づき得る。

[0072]図５は、本開示のいくつかの態様による、汎用プロセッサ５０２を使用する上述の差分符号化の例示的な実装形態５００を示す。計算ネットワーク（ニューラルネットワーク）、遅延、周波数ビン情報ノード状態情報、バイアス重み情報、接続重み情報、および／または発火率情報に関連付けられる、変数（ニューラル信号）、シナプス重み、システムパラメータは、メモリブロック５０４に記憶され得、汎用プロセッサ５０２で実行される命令はプログラムメモリ５０６からロードされ得る。本開示のある態様では、汎用プロセッサ５０２にロードされた命令は、確率論的ポイントプロセスによる出力イベントを生成するために、ノードで入力イベントを受信するための、中間値を取得するためにバイアス重みと接続重みとを入力イベントに適用するための、中間値に基づいてノード状態を決定するための、およびノード状態に基づいて事後確率を表す出力イベント率を計算するためのコードを備え得る。

[0073]図６は、本開示のいくつかの態様による、メモリ６０２が相互接続ネットワーク６０４を介して計算ネットワーク（ニューラルネットワーク）の個々の（分散型）処理ユニット（ニューラルプロセッサ）６０６とインターフェースされ得る、上述の差分符号化の例示的な実装形態６００を示す。計算ネットワーク（ニューラルネットワーク）遅延、周波数ビン情報、ノード状態情報、バイアス重み情報、接続重み情報、および／または発火率情報に関連付けられる、変数（ニューラル信号）、シナプス重み、システムパラメータは、メモリ６０２に記憶され得、またメモリ６０２から相互接続ネットワーク６０４の接続を介して各処理ユニット（ニューラルプロセッサ）６０６にロードされ得る。本開示のある態様では、処理ユニット６０６は、確率論的ポイントプロセスによる出力イベントを生成するために、ノードで入力イベントを受信して、中間値を取得するためにバイアス重みと接続重みとを入力イベントに適用して、中間値に少なくとも部分的に基づいてノード状態を決定して、ノード状態に基づいて事後確率を表す出力イベント率を計算するように構成され得る。

[0074]図７は、上述の差分符号化の例示的な実装形態７００を示している。図７に示されるように、１つのメモリバンク７０２は、計算ネットワーク（ニューラルネットワーク）の１つの処理ユニット７０４に直接インターフェースされ得る。各メモリバンク７０２は、対応する処理ユニット（ニューラルプロセッサ）７０４遅延、周波数ビン情報、ノード状態情報、バイアス重み情報、接続重み情報、および／または発火率情報に関連付けられる、変数（ニューラル信号）、シナプス重み、および／またはシステムパラメータを記憶し得る。本開示のある態様では、処理ユニット７０４は、確率論的ポイントプロセスによる出力イベントを生成するために、ノードで入力イベントを受信して、中間値を取得するためにバイアス重みと接続重みとを入力イベントに適用して、中間値に少なくとも部分的に基づいてノード状態を決定して、ノード状態に基づいて事後確率を表す出力イベント率を計算するように構成され得る。

[0075]図８は、本開示のいくつかの態様による、ニューラルネットワーク８００の例示的な実装形態を示す。図８に示すように、ニューラルネットワーク８００は、本明細書で説明する方法の様々な動作を実行し得る複数のローカル処理ユニット８０２を有することができる。各ローカル処理ユニット８０２は、ニューラルネットワークのパラメータを記憶する、ローカルステートメモリ８０４およびローカルパラメータメモリ８０６を備え得る。また、ローカル処理ユニット８０２は、ローカルモデルプログラムを記憶するためのローカル（ニューロン）モデルプログラム（ＬＭＰ）メモリ８０８、ローカル学習プログラムを記憶するためのローカル学習プログラム（ＬＬＰ）メモリ８１０、およびローカル接続メモリ８１２を有し得る。さらに、図８に示されるように、各ローカル処理ユニット８０２は、ローカル処理ユニットのローカルメモリの構成を提供するための設定プロセッサユニット８１４と、またローカル処理ユニット８０２間のルーティングを提供するルーティング接続処理ユニット８１６とインターフェースされ得る。

[0076]本開示のいくつかの態様によれば、各ローカル処理ユニット８０２は、ニューラルネットワークの所望の１つまたは複数の機能的特徴に基づいて、ニューラルネットワークのパラメータを決定して、決定されたパラメータがさらに適応され、同調され、更新されるにつれて、所望の機能的特徴に向けて１つまたは複数の機能的特徴を開発するように構成され得る。

[0077]本開示のある態様では、ニューラルネットワークにおける予測差分符号化の一般的なフレームワークは以下のとおりである。人工ニューロンは、入力ｘ（ｔ）を受信して出力ｙ（ｔ）を放出し、ｔは時間を表す。出力ｙ（ｔ）は、シグモイド関数などのｘ（ｔ）の非線形関数

でもよく、整流非線形関数(rectifier nonlinearity function)

でもよい。

[0078]ニューロンは、出力ｙ（ｔ）が１である確率として、シグモイド式、または他の式を使用することによって、バイナリ出力ｙ（ｔ）を確率論的に放出し得る。

[0079]入力ｘ（ｔ）は、他のニューロンの出力の重み付き線形結合であり得る。

[0080]上式で、ｗ_ijはｉ番目およびｊ番目のニューロンの重みを表し、ｊはｉ番目のニューロンに接続されたすべてのニューロンのインデックスである。

[0081]本開示のある態様は、予測差分符号化フレームワークが任意の人工ニューロンモデルと協働することを可能にする。人工ニューロンに状態変数を追加することによって、ニューロンが履歴ログを維持することが可能になる。関数ｓ（ｔ）は、状態変数または複数の状態変数を表す。各ニューロンは、状態変数を通じて履歴を追跡して、それが受信しようとしている入力ｘ＾（ｔ）と、放出しようとしている出力

とを予測する。予測は、ニューロン間の通信量を減少させる（すなわち、各ニューロンは現在、予測

におけるエラーのみを放出し、実際の出力ｙ（ｔ）は放出しない）。状態変数は、決定論的モデルの入力履歴、また、確率論的モデルの場合の出力履歴を記憶する。

[0082]ニューロンは予測におけるエラーを放出するので、ニューロンは現在、式（１６）のように、ｘ（ｔ）の代わりに予測ｚ（ｔ）におけるエラーの重み付けされた組合せを受信する。

[0083]ｚ（ｔ）が入力ｘ（ｔ）の予測におけるエラーにちょうど等しい場合、以下の式によってｘ（ｔ）が正確に再構築される。

[0084]δｘ（ｔ）＝ｘ（ｔ）−ｘ＾（ｔ）の場合を満たすための条件は、

である。

[0085]式（１６）において、ｚ（ｔ）はニューロンが受信するものであり、δｘ（ｔ）は、ニューロンが受信することを我々が望むものである。式（１９）が満足たされる場合、予測差分符号化方法は正確であるが、実際の出力値を放出する標準的な方法と比較して代替実装形態である。たとえ式（１９）が満たされなくても、予測差分符号化方法は、近似の実装形態を与える。

[0086]ｘ（ｔ）とｙ（ｔ）とを予測するために同じ線形関数が使用される場合、式（１９）が満たされる。本開示の予測差分符号化方法は、代替であるが、正確な実装方法になる。予測が線形である場合、近似が正確でなければならない。予測が非線形である場合、近似は正確ではない場合がある。

[0087]ニューロンは、履歴全体、または部分的な履歴のみを記憶し得る。Ｌはニューロンが記憶する履歴の量を表すものとする（すなわち、ニューロンは最後のＬ個の時間ステップを介して入力と出力とを追跡する）。これは、状態変数関数

を作成する。

[0088]ニューロンの入力−出力関係が決定論的である場合（すなわち、ｙ（ｔ）がｘ（ｔ）の決定論的関数である場合）、それは入力履歴のみを記憶するために十分である。決定論的アルゴリズムは、任意の所与の入力の一意の出力値で数学関数を計算して、アルゴリズムはこの特定の値を出力として生成する。

[0089]入力−出力関係が、制限ボルツマンマシン（ＲＢＭ）または深層信念ネット（ＤＢＮ）のように確率論的である場合、出力履歴も記憶される。確率過程は、確定過程とは異なり、いくつかの不確実性がある。たとえ初期状態（または、開始点）が知られていても、過程が進化し得るいくつかの（多くの場合、無限に多くの）方向がある。

[0090]本開示はまた、局所レベルおよび／またはグローバルレベルで差分符号化フレームワークを使用することを企図する。たとえば、画像の動きベクトル推定は、画像全体または画像の局所部分についてのいずれかの平均ベクトルの変化を決定するために使用され得る。グローバル情報またはローカル情報がニューロンのすべてに提供され得、次いで、シナプス前ニューロンとシナプス後ニューロンとの両方が、より良い予測を行うために、これらの局所差分／グローバル差分を使用し得る。さらに、シナプス後ニューロンは、差分フィードバックを提供し得る。そのような態様では、シナプス前ニューロンは、状態推定のためにシナプス後ニューロン差分出力を使用し得る。これは、ニューラルネットワークにおける層間の通信量を減少させ得る。

[0091]履歴ｓ（ｔ）があると、各ニューロンは、線形フィルタを使用して、時間ｔで入力と出力とを予測する。

[0092]この予測フレームワーク内で、式（１９）が満たされる。フィルタ係数α１、α２、・・・、αＬは継時的に学習されるか、先験的に選択され得る。たとえば、限定としてではないが、Ｌが１であり、α１＝１である（すなわち、各ニューロンが、以前の時間期間の入力および出力を最良の予測として使用する）場合、

である。別の例として、Ｌ＝２、α１＝２、α２＝−１である（すなわち、各ニューロンが、入力は直線的に変化していると仮定する）場合、

である。

[0093]異なるニューロンが異なる予測フィルタを使用する場合、式（１９）は満たされない。本開示の差分符号化方法で正確な予測に到達するために、ニューラルネットワーク全体で同じフィルタを使用することが望ましい場合がある。

[0094]各ニューロンは、ｘ＾（ｔ）とｙ＾（ｔ）とを予測するために、それぞれ異なるｘ−フィルタおよびｙ−フィルタを使用し得る。これらの予測フィルタは異なるニューロンにとって同じでもよく、異なっていてもよい。「実際の入力」のニューロンの再構築が正確であるために、ｘ−フィルタは、すべてのファンインニューロンのすべてのｙ−フィルタと一致する必要がある。一致を確実にする１つの方法は、ネットワーク全体で同じ予測フィルタを使用することである。階層型ニューラルネットワークでは、一致を達成するための別の方法は、１つの層内のすべてのニューロンに同じｘ−フィルタを使用して、前の層内のすべてのニューロンにｙ−フィルタと同じを使用することである。

[0095]これらの予測フィルタは固定でも適応でもよく、また線形でも非線形でもよい。非線形フィルタの場合、入力シナプスごとの予測が所望される。線形フィルタの場合、結合予測が提供され得る。一構成では、ベースラインソリューションは、すべてのニューロンの単一の固定されたフィルタを含む。別のソリューションは、オンラインでフィルタ係数値を推定する。別の態様では、フィルタは、屋内対屋外、または静的対移動などのフィルタのセットなどの異なる環境のために構成されてもよく、最適化さえされてもよい。これらのフィルタは、あらかじめ定義されたフィルタのコードブック、環境を決定する方法を有すること、および環境に基づいて特定のフィルタを選択することによって決定され得る。別の態様では、フィルタは、分類器（すなわち、ニューラルネットワーク）の出力に基づいて選択される。

[0096]一構成では、あらかじめ定義されたフィルタの形状は指数関数的である。指数関数的な形状は減衰係数を有し、それによってより多くのデルタ更新を強制する。一例では、０．９の係数が供給される。指数関数的な形状は、不安定性および長期エラー伝播を減少または排除さえし得る。指数関数的な形状はまた、非ゼロ入力が受信されたときのみ更新が発生するように、将来の値へのワンステップ更新を可能にする。減衰係数とビットレートとの間にトレードオフがある点に留意されたい。つまり、より高い減衰係数はより多くの通信をもたらすことになり、より低い減衰係数はより少ない送信をもたらす。一態様では、異なるニューロンは指数分布に異なる減衰係数を使用し得る。別の態様では、フィルタはオンラインで学習される。たとえば、ロボットは、高速移動している場合は高い減衰係数を使用して、静止しているか、ゆっくり移動している場合は低い減衰係数を使用し得る。

[0097]差分符号化は、ニューロン間の通信のためにリソースを節約する。しかしながら、差分符号化はまた、オーバーヘッドを追加する。追加のメモリは、状態変数または入力値／出力値の履歴を記憶する。追加の計算は、予測および予測におけるエラーを計算する。増加量は、指数フィルタ形状を使用することによって多少減少され得る。したがって、差分符号化のメリットと追加のオーバーヘッドとの間にトレードオフがある。

[0098]差分符号化は、ニューロンのサブセットのみに使用され得る。たとえば、ニューラルネットワークが複数のコア（または、マシン）を使用してシミュレートされて、異なるコアが異なるニューロンをシミュレートする場合を考慮する。通信のコストは、コアまたは複数のマシン間で通信するそれらのニューロンの方がより高い（すなわち、これらのニューロンは、他のコア内のニューロンを接続する入力シナプスまたは出力シナプスを有する）。この場合、差分符号化はコアまたはマシン間で通信しているニューロンのためのみに使用され得る。さらに、頻繁に変更するニューロンは、差分符号化に適した候補ではない場合がある。異なるニューロンはまた、通信、あるいは異なるフィルタのためにさえも、異なるビット幅を使用し得る。別の態様では、ニューロンはモードを変更し得、あるモードではニューロンは差分更新を送信して、別のモードではニューロンは実際の結果を送信する。モード変更はトリガに基づき得、たとえば、分類結果（すなわち、ニューラルネットワークからの出力）が納得のいくものであるかどうかに基づき得る。

[0099]各ニューロンが入力と出力とを予測する代わりに、ニューロンの集合が共同でそれらの集合的な入力と出力とを予測し得る。具体的には、階層型ニューラルネットワークでは、ニューロンの各層は、それらのベクトル入力と出力との共同履歴に基づいて、ベクトル入力とベクトル出力とを共同で予測し得る。線形予測フレームワークは、スカラフィルタ係数を行列と置き換えることによって、ベクトル入力／出力シナリオに自然に拡張され、すなわちα１、α２、・・・、αＬは現在行列である。

[00100]共同予測が個々の予測を超える利点を有する例示的なアプリケーションは、ビデオを介する推論のビジョンアプリケーションである。人またはオブジェクトが動いている、あるいは静止している環境の場合を考慮する。深層畳み込みネットワーク（ＤＣＮ）などの階層型ニューラルネットワークが使用され得、層内のニューロンの集合は空間応答マップを表す。この場合、フィルタ行列は、画像から画像への動きベクトルに基づいて選択される。これらの動きベクトルは、ビデオ圧縮文献（video compression literature）から入手可能な標準的な動き推定技法から、ボトムアップで取得され得る。あるいは、動きベクトルはＤＣＮの出力からトップダウンで取得され得る。ＤＣＮは、画像内のオブジェクトおよびそれらの位置を予測するためにトレーニングされ得る点に留意されたい。ニューロンは、動きベクトル、ならびにニューロンが情報を送信しているニューロンからのフィードバックなどの追加のグローバル入力に基づいて予測し得る。

[00101]図９は、本開示の態様による、ニューラルネットワークにおいて差分符号化を実行するための方法９００を示す。ブロック９０２で、ニューロンの少なくとも１つの以前の活性化値に基づいて、ニューラルネットワークにおけるニューロンの活性化値が予測される。ブロック９０４で、予測活性化値とニューラルネットワークにおけるニューロンの活性化値との間の差分に基づいて値が符号化される。

[00102]一構成では、差分符号化のための方法は、ニューロンの活性化値を予測するための手段と、エラーを符号化するための手段とを含む。一態様では、予測手段および／または符号化手段は、記載された機能を実行するように構成された汎用プロセッサ５０２、プログラムメモリ５０６、メモリブロック５０４、メモリ６０２、相互接続ネットワーク６０４、処理ユニット６０６、処理ユニット７０４、ローカル処理ユニット８０２、およびまたはルーティング接続処理要素８１６であり得る。別の構成では、上述の手段は、上記の手段によって記載された機能を実行するように構成された任意のモジュールまたは任意の装置であり得る。

[00103]本開示で説明したニューラルネットワークは、多層パーセプトロンネットワーク、深層畳み込みネットワーク、深層信念ネットワーク、およびリカレントニューラルネットワーク等を含む、任意のタイプのニューラルネットワークであり得る。さらに、履歴に基づいて自身の入力と出力とを予測して、そのニューロンの出力内のエラーのみを伝播するニューロンに関して説明したが、ニューロンは、それ自体の入力と出力とを予測するために、他のニューロンのエラーと予測とを使用し得る。

[00104]上述した方法の様々な動作は、対応する機能を実行することが可能な任意の好適な手段によって実行され得る。それらの手段は、限定はしないが、回路、特定用途向け集積回路（ＡＳＩＣ）、またはプロセッサを含む、様々なハードウェアおよび／またはソフトウェア構成要素および／またはモジュールを含み得る。概して、図に示されている動作がある場合、それらの動作は、同様の番号をもつ対応するカウンターパートのミーンズプラスファンクション構成要素を有し得る。

[00105]本明細書で使用する「決定」という用語は、多種多様なアクションを包含する。たとえば、「決定」は、計算すること、算出すること、処理すること、導出すること、調査すること、ルックアップすること（たとえば、テーブル、データベースまたは別のデータ構造においてルックアップすること）、確認することなどを含み得る。さらに、「決定」は、受信すること（たとえば、情報を受信すること）、アクセスすること（たとえば、メモリ中のデータにアクセスすること）などを含み得る。さらに、「決定」は、解決すること、選択すること、選定すること、確立することなどを含み得る。

[00106]本明細書で使用する、項目のリスト「のうちの少なくとも１つ」を指す句は、単一のメンバーを含む、それらの項目の任意の組合せを指す。一例として、「ａ、ｂ、またはｃのうちの少なくとも１つ」は、ａ、ｂ、ｃ、ａ−ｂ、ａ−ｃ、ｂ−ｃ、およびａ−ｂ−ｃを包含するものとする。

[00107]本開示に関連して説明した様々な例示的な論理ブロック、モジュール、および回路は、汎用プロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ信号（ＦＰＧＡ）または他のプログラマブル論理デバイス（ＰＬＤ）、個別ゲートまたはトランジスタ論理、個別ハードウェア構成要素、あるいは本明細書で説明した機能を実行するように設計されたそれらの任意の組合せを用いて実装または実行され得る。汎用プロセッサはマイクロプロセッサであり得るが、代替として、プロセッサは、任意の市販のプロセッサ、コントローラ、マイクロコントローラまたは状態機械であり得る。プロセッサはまた、コンピューティングデバイスの組合せ（たとえば、ＤＳＰとマイクロプロセッサとの組合せ、複数のマイクロプロセッサ、ＤＳＰコアと連携する１つまたは複数のマイクロプロセッサ、あるいは任意の他のそのような構成）として実装され得る。

[00108]本開示に関連して説明した方法またはアルゴリズムのステップは、ハードウェアで直接実施されるか、プロセッサによって実行されるソフトウェアモジュールで実施されるか、またはその２つの組合せで実施され得る。ソフトウェアモジュールは、当技術分野で知られている任意の形式の記憶媒体で存在し得る。使用され得る記憶媒体のいくつかの例は、ランダムアクセスメモリ（ＲＡＭ）、読出し専用メモリ（ＲＯＭ）、フラッシュメモリ、消去可能プログラマブル読出し専用メモリ（ＥＰＲＯＭ）、電気的消去可能プログラマブル読出し専用メモリ（ＥＥＰＲＯＭ（登録商標））、レジスタ、ハードディスク、リムーバブルディスク、ＣＤ−ＲＯＭなどを含む。ソフトウェアモジュールは、単一の命令、または多数の命令を備えることができ、いくつかの異なるコードセグメント上で、異なるプログラム間で、複数の記憶媒体にわたって分散され得る。記憶媒体は、プロセッサがその記憶媒体から情報を読み取ることができ、その記憶媒体に情報を書き込むことができるように、プロセッサに結合され得る。代替として、記憶媒体はプロセッサと一体化され得る。

[00109]本明細書で開示する方法は、説明した方法を達成するための１つまたは複数のステップまたはアクションを備える。本方法のステップおよび／またはアクションは、特許請求の範囲から逸脱することなく互いに交換され得る。言い換えれば、ステップまたはアクションの特定の順序が指定されない限り、特定のステップおよび／またはアクションの順序および／または使用は、特許請求の範囲から逸脱することなく変更され得る。

[00110]本明細書ならびに付属書類Ａおよび付属書類Ｂで説明された機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ハードウェアで実装される場合、例示的なハードウェア構成はデバイス中に処理システムを備え得る。処理システムは、バスアーキテクチャを用いて実装され得る。バスは、処理システムの特定の適用例および全体的な設計制約に応じて、任意の数の相互接続バスとブリッジとを含み得る。バスは、プロセッサと、機械可読媒体と、バスインターフェースとを含む様々な回路を互いにリンクし得る。バスインターフェースは、ネットワークアダプタを、特に、バスを介して処理システムに接続するために使用され得る。ネットワークアダプタは、信号処理機能を実装するために使用され得る。いくつかの態様では、ユーザインターフェース（たとえば、キーパッド、ディスプレイ、マウス、ジョイスティックなど）もバスに接続され得る。バスはまた、タイミングソース、周辺機器、電圧調整器、電力管理回路などの様々な他の回路にリンクし得るが、それらは当技術分野でよく知られており、したがってこれ以上は説明されない。

[00111]プロセッサは、機械可読媒体に記憶されたソフトウェアの実行を含む、バスおよび一般的な処理を管理することを担当し得る。プロセッサは、１つまたは複数の汎用および／または専用プロセッサを用いて実装され得る。例としては、マイクロプロセッサ、マイクロコントローラ、ＤＳＰプロセッサ、およびソフトウェアを実行し得る他の回路を含む。ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語などの名称にかかわらず、命令、データ、またはそれらの任意の組合せを意味すると広く解釈されたい。機械可読媒体は、一例として、ランダムアクセスメモリ（ＲＡＭ）、フラッシュメモリ、読出し専用メモリ（ＲＯＭ）、プログラマブル読出し専用メモリ（ＰＲＯＭ）、消去可能プログラマブル読出し専用メモリ（ＥＰＲＯＭ）、電気的消去可能プログラム可能読出し専用メモリ（ＥＥＰＲＯＭ）、レジスタ、磁気ディスク、光ディスク、ハードドライブ、または他の任意の適切な記憶媒体、あるいはそれらの任意の組合せを含み得る。機械可読媒体はコンピュータプログラム製品において実施され得る。コンピュータプログラム製品はパッケージング材料を備え得る。

[00112]ハードウェア実装形態では、機械可読媒体は、プロセッサとは別個の処理システムの一部であり得る。しかしながら、当業者なら容易に理解するように、機械可読媒体またはその任意の部分は処理システムの外部にあり得る。例として、機械可読媒体は、すべてバスインターフェースを介してプロセッサによってアクセスされ得る、伝送線路、データによって変調された搬送波、および／またはデバイスとは別個のコンピュータ製品を含み得る。代替的に、または追加で、機械可読媒体またはその任意の部分は、キャッシュおよび／または汎用レジスタファイルがそうであり得るように、プロセッサに統合され得る。論じた様々な構成要素は、ローカル構成要素などの特定の位置を有するものとして説明され得るが、それらはまた、分散コンピューティングシステムの一部として構成されているいくつかの構成要素などの様々な方法で構成され得る。

[00113]処理システムは、すべて外部バスアーキテクチャを介して他のサポート回路と互いにリンクされる、プロセッサ機能を提供する１つまたは複数のマイクロプロセッサと、機械可読媒体の少なくとも一部分を提供する外部メモリとをもつ汎用処理システムとして構成され得る。あるいは、処理システムは、本明細書に記載のニューロンモデルとニューラルシステムのモデルとを実装するための１つまたは複数のニューロモルフィックプロセッサを備え得る。別の代替として、処理システムは、プロセッサを有する特定用途向け集積回路（ＡＳＩＣ）と、バスインターフェースと、ユーザインターフェースと、サポート回路と、単一のチップに統合された機械可読媒体の少なくとも一部とを用いて、あるいは１つまたは複数のフィールドプログラマブルゲートアレイ（ＦＰＧＡ）、プログラマブル論理デバイス（ＰＬＤ）、コントローラ、状態機械、ゲート論理、個別ハードウェア構成要素、または他の任意の適切な回路、あるいは本開示全体を通じて説明した様々な機能を実行し得る回路の任意の組合せを用いて実装され得る。当業者なら、特定の適用例と、全体的なシステムに課される全体的な設計制約とに応じて、どのようにしたら処理システムについて説明した機能を最も良く実装し得るかを理解されよう。

[00114]機械可読媒体はいくつかのソフトウェアモジュールを備え得る。ソフトウェアモジュールは、プロセッサによって実行されたときに、処理システムに様々な機能を実行させる命令を含む。ソフトウェアモジュールは、送信モジュールと受信モジュールとを含み得る。各ソフトウェアモジュールは、単一の記憶デバイス中に常駐するか、または複数の記憶デバイスにわたって分散され得る。例として、トリガイベントが発生したとき、ソフトウェアモジュールがハードドライブからＲＡＭにロードされ得る。ソフトウェアモジュールの実行中、プロセッサは、アクセス速度を高めるために、命令のいくつかをキャッシュにロードし得る。次いで、１つまたは複数のキャッシュラインが、プロセッサによる実行のために汎用レジスタファイルにロードされ得る。以下でソフトウェアモジュールの機能に言及する場合、そのような機能は、そのソフトウェアモジュールからの命令を実行したときにプロセッサによって実装されることが理解されよう。

[00115]ソフトウェアで実装される場合、機能は、１つまたは複数の命令またはコードとしてコンピュータ可読媒体上に記憶されるか、あるいはコンピュータ可読媒体を介して送信され得る。コンピュータ可読媒体は、ある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含む、コンピュータ記憶媒体と通信媒体の両方を含む。記憶媒体は、コンピュータによってアクセスされ得る任意の利用可能な媒体であり得る。限定ではなく例として、そのようなコンピュータ可読媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、ＣＤ−ＲＯＭまたは他の光ディスクストレージ、磁気ディスクストレージまたは他の磁気記憶デバイス、あるいは命令またはデータ構造の形態の所望のプログラムコードを搬送または記憶するために使用され得、コンピュータによってアクセスされ得る、任意の他の媒体を備えることができる。さらに、いかなる接続もコンピュータ可読媒体を適切に名づけられる。たとえば、ソフトウェアが、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ）、または赤外線（ＩＲ）、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、ＤＳＬ、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。本明細書で使用するディスク（disk）およびディスク（disc）は、コンパクトディスク（disc）（ＣＤ）、レーザーディスク（登録商標）（disc）、光ディスク（disc）、デジタル多用途ディスク（disc）（ＤＶＤ）、フロッピー（登録商標）ディスク（disk）、およびＢｌｕ−ｒａｙ（登録商標）ディスク（disc）を含み、ディスク（disk）は、通常、データを磁気的に再生し、ディスク（disc）は、データをレーザーで光学的に再生する。したがって、いくつかの態様では、コンピュータ可読媒体は非一時的コンピュータ可読媒体（たとえば、有形媒体）を備え得る。さらに、他の態様では、コンピュータ可読媒体は一時的コンピュータ可読媒体（たとえば、信号）を備え得る。上記の組合せもコンピュータ可読媒体の範囲内に含まれるべきである。

[00116]したがって、いくつかの態様は、本明細書で提示する動作を実行するためのコンピュータプログラム製品を備え得る。たとえば、そのようなコンピュータプログラム製品は、本明細書で説明する動作を実行するために１つまたは複数のプロセッサによって実行可能である命令を記憶した（および／または符号化した）コンピュータ可読媒体を備え得る。いくつかの態様では、コンピュータプログラム製品はパッケージング材料を含み得る。

[00117]さらに、本明細書で説明した方法および技法を実行するためのモジュールおよび／または他の適切な手段は、適用可能な場合にユーザ端末および／または基地局によってダウンロードされ、および／または他の方法で取得され得ることを諒解されたい。たとえば、そのようなデバイスは、本明細書で説明した方法を実施するための手段の転送を可能にするためにサーバに結合され得る。代替的に、本明細書で説明した様々な方法は、ユーザ端末および／または基地局が記憶手段をデバイスに結合または提供すると様々な方法を得ることができるように、記憶手段（たとえば、ＲＡＭ、ＲＯＭ、コンパクトディスク（ＣＤ）またはフロッピーディスクなどの物理記憶媒体など）によって提供され得る。その上、本明細書で説明した方法および技法をデバイスに与えるための任意の他の好適な技法が利用され得る。

[00118]特許請求の範囲は、上記で示した厳密な構成および構成要素に限定されないことを理解されたい。上記で説明した方法および装置の構成、動作および詳細において、特許請求の範囲から逸脱することなく、様々な改変、変更および変形が行われ得る。

[00118]特許請求の範囲は、上記で示した厳密な構成および構成要素に限定されないことを理解されたい。上記で説明した方法および装置の構成、動作および詳細において、特許請求の範囲から逸脱することなく、様々な改変、変更および変形が行われ得る。
以下に本願発明の当初の特許請求の範囲に記載された発明を付記する。
[Ｃ１］
ニューラルネットワークにおいて差分符号化を実行する方法であって、
ニューロンの少なくとも１つの以前の活性化値に少なくとも部分的に基づいて、前記ニューラルネットワークにおける前記ニューロンの活性化値を予測することと、
前記予測された活性化値と、前記ニューラルネットワークにおける前記ニューロンの活性化値との間の差分に少なくとも部分的に基づいて値を符号化することと
を備える、方法。
[Ｃ２］
前記ニューラルネットワークの層間で前記符号化値を送信することをさらに備える、Ｃ１に記載の方法。
[Ｃ３］
前記送信された符号化値が、前記予測された活性化値と前記活性化値との間の前記差分、および前記予測された活性化値と前記活性化値との間のしきい値差分のうちの少なくとも１つである、Ｃ２に記載の方法。
[Ｃ４］
前記送信された符号化値が、前記符号化値のビット数に少なくとも部分的に基づいて選択される、Ｃ３に記載の方法。
[Ｃ５］
前記活性化値が非線形関数に少なくとも部分的に基づく、Ｃ１に記載の方法。
[Ｃ６］
前記活性化値を予測することが、入力の受信に少なくとも部分的に基づいて実行される、Ｃ１に記載の方法。
[Ｃ７］
前記値のビット幅に少なくとも部分的に基づいて前記値を符号化することをさらに備える、Ｃ１に記載の方法。
[Ｃ８］
前記符号化することが、ニューラルネットワーク出力ベースのトリガに少なくとも部分的に基づいて実行される、Ｃ１に記載の方法。
[Ｃ９］
前記符号化することが断続的に実行される、Ｃ１に記載の方法。
[Ｃ１０］
前記符号化することが、前記ニューラルネットワークへの入力に対して遅延される、Ｃ１に記載の方法。
[Ｃ１１］
前記符号化することが、前記ニューラルネットワークの出力にさらに少なくとも部分的に基づく、Ｃ１に記載の方法。
[Ｃ１２］
入力−出力関係が決定論的である場合、前記少なくとも１つの以前の活性化値が入力履歴を備える、Ｃ１に記載の方法。
[Ｃ１３］
入力−出力関係が確率論的である場合、前記少なくとも１つの以前の活性化値が入力履歴と出力履歴とを備える、Ｃ１に記載の方法。
[Ｃ１４］
予測された入力値に少なくとも部分的に基づいて、前記予測された活性化値を計算することをさらに備える、Ｃ１に記載の方法。
[Ｃ１５］
前記符号化値と前記予測された入力値とを組み合わせることによって、実際の入力値を計算することをさらに備える、Ｃ１４に記載の方法。
[Ｃ１６］
前記予測された入力値と前記予測された活性化値とを計算することが、前記ニューロンの複数の以前の入力値と複数の以前の活性化値との線形結合を使用することを備える、Ｃ１４に記載の方法。
[Ｃ１７］
前記ニューロンの前記予測された活性化値が、前記ニューロンの状態と前記ニューロンへの入力とに少なくとも部分的に基づく、Ｃ１に記載の方法。
[Ｃ１８］
前記ニューロンの前記状態が、以前の状態、入力値、出力値、予測された活性化値、および対象となる活性化値のうちの少なくとも１つに基づいて更新される、Ｃ１７に記載の方法。
[Ｃ１９］
前記ニューロンの前記状態が、入力履歴、出力履歴、予測された活性化値履歴、および対象となる活性化値履歴のうちの少なくとも１つを備える、Ｃ１７に記載の方法。
[Ｃ２０］
前記予測することが、別のニューロンの状態に少なくとも部分的に基づく、Ｃ１９に記載の方法。
[Ｃ２１］
前記予測された活性化値が、複数の以前の実際の活性化値の線形結合、または以前の入力値の線形結合に少なくとも部分的に基づく、Ｃ１に記載の方法。
[Ｃ２２］
前記活性化値を予測することが、前記ニューロンに提供された追加の値を使用することを備える、Ｃ１に記載の方法。
[Ｃ２３］
画像動き推定に少なくとも部分的に基づいて、前記追加の値を計算することをさらに備える、Ｃ２２に記載の方法。
[Ｃ２４］
前記追加の値が別のニューロンからのフィードバック信号を備える、Ｃ２２に記載の方法。
[Ｃ２５］
ニューラルネットワークにおいて差分符号化を実行するための装置であって、
メモリと、
前記メモリに結合された少なくとも１つのプロセッサとを備え、前記少なくとも１つのプロセッサが、
ニューロンの少なくとも１つの以前の活性化値に少なくとも部分的に基づいて、前記ニューラルネットワークにおける前記ニューロンの活性化値を予測し、
前記予測された活性化値と、前記ニューラルネットワークにおける前記ニューロンの活性化値との間の差分に少なくとも部分的に基づいて値を符号化する
ように構成される、装置。
[Ｃ２６］
スパイキングニューラルネットワークにおいて差分符号化を実行するための装置であって、
ニューロンの少なくとも１つの以前の活性化値に少なくとも部分的に基づいて、前記ニューラルネットワークにおける前記ニューロンの活性化値を予測するための手段と、
前記予測された活性化値と、前記ニューラルネットワークにおける前記ニューロンの活性化値との間の差分に少なくとも部分的に基づいて値を符号化するための手段と
を備える、装置。
[Ｃ２７］
スパイキングニューラルネットワークにおいて差分符号化を実行するためのコンピュータプログラム製品であって、
プログラムコードを符号化した非一時的コンピュータ可読媒体を備え、前記プログラムコードが、
ニューロンの少なくとも１つの以前の活性化値に少なくとも部分的に基づいて、前記ニューラルネットワークにおける前記ニューロンの活性化値を予測するためのプログラムコードと、
前記予測された活性化値と、前記ニューラルネットワークにおける前記ニューロンの活性化値との間の差分に少なくとも部分的に基づいて値を符号化するためのプログラムコードと
を備える、コンピュータプログラム製品。

Claims

ニューラルネットワークにおいて差分符号化を実行する方法であって、
ニューロンの少なくとも１つの以前の活性化値に少なくとも部分的に基づいて、前記ニューラルネットワークにおける前記ニューロンの活性化値を予測することと、
前記予測された活性化値と、前記ニューラルネットワークにおける前記ニューロンの活性化値との間の差分に少なくとも部分的に基づいて値を符号化することと
を備える、方法。
前記ニューラルネットワークの層間で前記符号化値を送信することをさらに備える、請求項１に記載の方法。
前記送信された符号化値が、前記予測された活性化値と前記活性化値との間の前記差分、および前記予測された活性化値と前記活性化値との間のしきい値差分のうちの少なくとも１つである、請求項２に記載の方法。
前記送信された符号化値が、前記符号化値のビット数に少なくとも部分的に基づいて選択される、請求項３に記載の方法。
前記活性化値が非線形関数に少なくとも部分的に基づく、請求項１に記載の方法。
前記活性化値を予測することが、入力の受信に少なくとも部分的に基づいて実行される、請求項１に記載の方法。
前記値のビット幅に少なくとも部分的に基づいて前記値を符号化することをさらに備える、請求項１に記載の方法。
前記符号化することが、ニューラルネットワーク出力ベースのトリガに少なくとも部分的に基づいて実行される、請求項１に記載の方法。
前記符号化することが断続的に実行される、請求項１に記載の方法。
前記符号化することが、前記ニューラルネットワークへの入力に対して遅延される、請求項１に記載の方法。
前記符号化することが、前記ニューラルネットワークの出力にさらに少なくとも部分的に基づく、請求項１に記載の方法。
入力−出力関係が決定論的である場合、前記少なくとも１つの以前の活性化値が入力履歴を備える、請求項１に記載の方法。
入力−出力関係が確率論的である場合、前記少なくとも１つの以前の活性化値が入力履歴と出力履歴とを備える、請求項１に記載の方法。
予測された入力値に少なくとも部分的に基づいて、前記予測された活性化値を計算することをさらに備える、請求項１に記載の方法。
前記符号化値と前記予測された入力値とを組み合わせることによって、実際の入力値を計算することをさらに備える、請求項１４に記載の方法。
前記予測された入力値と前記予測された活性化値とを計算することが、前記ニューロンの複数の以前の入力値と複数の以前の活性化値との線形結合を使用することを備える、請求項１４に記載の方法。
前記ニューロンの前記予測された活性化値が、前記ニューロンの状態と前記ニューロンへの入力とに少なくとも部分的に基づく、請求項１に記載の方法。
前記ニューロンの前記状態が、以前の状態、入力値、出力値、予測された活性化値、および対象となる活性化値のうちの少なくとも１つに基づいて更新される、請求項１７に記載の方法。
前記ニューロンの前記状態が、入力履歴、出力履歴、予測された活性化値履歴、および対象となる活性化値履歴のうちの少なくとも１つを備える、請求項１７に記載の方法。
前記予測することが、別のニューロンの状態に少なくとも部分的に基づく、請求項１９に記載の方法。
前記予測された活性化値が、複数の以前の実際の活性化値の線形結合、または以前の入力値の線形結合に少なくとも部分的に基づく、請求項１に記載の方法。
前記活性化値を予測することが、前記ニューロンに提供された追加の値を使用することを備える、請求項１に記載の方法。
画像動き推定に少なくとも部分的に基づいて、前記追加の値を計算することをさらに備える、請求項２２に記載の方法。
前記追加の値が別のニューロンからのフィードバック信号を備える、請求項２２に記載の方法。
ニューラルネットワークにおいて差分符号化を実行するための装置であって、
メモリと、
前記メモリに結合された少なくとも１つのプロセッサとを備え、前記少なくとも１つのプロセッサが、
ニューロンの少なくとも１つの以前の活性化値に少なくとも部分的に基づいて、前記ニューラルネットワークにおける前記ニューロンの活性化値を予測し、
前記予測された活性化値と、前記ニューラルネットワークにおける前記ニューロンの活性化値との間の差分に少なくとも部分的に基づいて値を符号化する
ように構成される、装置。
スパイキングニューラルネットワークにおいて差分符号化を実行するための装置であって、
ニューロンの少なくとも１つの以前の活性化値に少なくとも部分的に基づいて、前記ニューラルネットワークにおける前記ニューロンの活性化値を予測するための手段と、
前記予測された活性化値と、前記ニューラルネットワークにおける前記ニューロンの活性化値との間の差分に少なくとも部分的に基づいて値を符号化するための手段と
を備える、装置。
スパイキングニューラルネットワークにおいて差分符号化を実行するためのコンピュータプログラム製品であって、
プログラムコードを符号化した非一時的コンピュータ可読媒体を備え、前記プログラムコードが、
ニューロンの少なくとも１つの以前の活性化値に少なくとも部分的に基づいて、前記ニューラルネットワークにおける前記ニューロンの活性化値を予測するためのプログラムコードと、
前記予測された活性化値と、前記ニューラルネットワークにおける前記ニューロンの活性化値との間の差分に少なくとも部分的に基づいて値を符号化するためのプログラムコードと
を備える、コンピュータプログラム製品。