JP2023547800A

JP2023547800A - Ｒｐｕクロスバー・アレイ上の重み反復

Info

Publication number: JP2023547800A
Application number: JP2023522777A
Authority: JP
Inventors: ラッシュ、マルテ、ヨハネス; ゴクメン、タイフン
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2020-11-02
Filing date: 2021-10-28
Publication date: 2023-11-14
Also published as: GB2614687B; GB2614687A; CN116391192A; US20220138579A1; GB202306109D0; DE112021004941T5; WO2022090980A1

Abstract

人工ニューラル・ネットワーク訓練のための方法が提示される。方法は、抵抗処理ユニット（ＲＰＵ）デバイスのアレイに重み値を格納することであって、ＲＰＵデバイスのアレイが、重み行列を表す、格納することと、重み行列Ｗが長方形構成を有するように、入力次元より小さい出力次元を有するように重み行列を定義することと、フォワード・サイクル・パス中に、反復された重み要素の入力をコピーすること、反復された重み要素からの出力された計算結果を合計すること、逆伝搬された誤差に応じて、反復された重み要素のそれぞれを更新すること、または代替として、更新パス中に、１からゼロまでを除く全てのフォワード値をセットすることによって、反復された重み要素のうちのただ１つを更新することによって、バックワード・パス信号の信号強度を増強するために、重み行列の長方形構成を反復または連結することによって、長方形構成からより正方形の構成に重み行列を変換することとを含む。

Description

本発明は、一般に、抵抗処理ユニット（ＲＰＵ：resistive processing unit）デバイスのアナログ・クロスポイント・アレイを有する人工ニューラル・ネットワーク（ＡＮＮ：artificial neural network）に関し、より詳細には、ＲＰＵクロスポイント・アレイ上の重み反復により信号強度を増強することに関する。

機械学習は、データから学習する電子システムの主要な機能を広く表現するために使用される。機械学習および認知科学では、ＡＮＮは、生物神経回路および特に脳によって着想された統計学習モデルの系統である。ＡＮＮは、多くの入力に依存し、一般に未知の、システムおよび機能を推定または概算するために使用されることが可能である。ＡＮＮは、シミュレートされた「ニューロン」として機能し、電子信号の形で互いに、メッセージを交換する、相互接続されたプロセッサ要素のいわゆる「神経形態学的」システムとして具体化されることが多い。生体ニューロン間のメッセージを運ぶシナプス神経伝達物質接続のいわゆる「可塑性」と同様に、シミュレートされたニューロン間の電子メッセージを運ぶＡＮＮにおける接続は、所与の接続の強さまたは弱さに相当する数字の重みを提供される。重みは、経験に基づいて調節および調整されることが可能であり、ＡＮＮを入力に対して適応性があり、学習する能力があるものにする。

実施形態によれば、人工ニューラル・ネットワーク（ＡＮＮ）訓練のための方法が提供される。方法は、抵抗処理ユニット（ＲＰＵ）デバイスのアレイに重み値を格納することであって、ＲＰＵデバイスのアレイが、ＲＰＵデバイスの抵抗値としてｍ行ｎ列のＡＮＮの重み行列Ｗの重み値をアレイに格納することによって、重み行列Ｗを表す、格納することと、重み行列Ｗが長方形構成を有するように、入力次元より小さい出力次元を有するように重み行列Ｗを定義することと、フォワード・サイクル・パス中に、反復された重み要素の入力をコピーすること、１行毎に１つの出力を生じる反復された重み要素からの出力された計算結果を合計すること、および、逆伝搬された誤差に応じて、反復された重み要素のそれぞれを更新すること、または代替として、更新パス中に、１からゼロまでを除く全てのフォワード値をセットすることによって、反復された重み要素のうちのただ１つを更新することによって、バックワード・パス信号の信号強度を増強するために、重み行列Ｗの長方形構成を反復または連結することによって、長方形構成からほぼ正方形の構成に重み行列Ｗを変換することとを含む。

人工ニューラル・ネットワーク（ＡＮＮ）訓練のためのコンピュータ可読プログラムを含む非一過性コンピュータ可読ストレージ媒体が提示され、コンピュータ可読プログラムは、コンピュータで実行されると、抵抗処理ユニット（ＲＰＵ）デバイスのアレイに重み値を格納することであって、ＲＰＵデバイスのアレイが、ＲＰＵデバイスの抵抗値としてｍ行ｎ列のＡＮＮの重み行列Ｗの重み値をアレイに格納することによって、重み行列Ｗを表す、格納することと、重み行列Ｗが長方形構成を有するように、入力次元より小さい出力次元を有するように重み行列Ｗを定義することと、フォワード・サイクル・パス中に、反復された重み要素の入力をコピーすること、１行毎に１つの出力を生じる反復された重み要素からの出力された計算結果を合計すること、および、逆伝搬された誤差に応じて、反復された重み要素のそれぞれを更新すること、または代替として、更新パス中に、１からゼロまでを除く全てのフォワード値をセットすることによって、反復された重み要素のうちのただ１つを更新することによって、バックワード・パス信号の信号強度を増強するために、重み行列Ｗの長方形構成を反復または連結することによって、長方形構成からほぼ正方形の構成に重み行列Ｗを変換することとを行うステップをコンピュータに実施させる。

人工ニューラル・ネットワーク（ＡＮＮ）訓練のためのシステムが提示される。システムは、重み値を格納するための抵抗処理ユニット（ＲＰＵ）デバイスのアレイであって、ＲＰＵデバイスの抵抗値としてｍ行ｎ列のＡＮＮの重み行列Ｗの重み値をアレイに格納することによって、重み行列Ｗを表す、ＲＰＵデバイスのアレイと、アレイにおけるＲＰＵデバイス間の電圧を制御するためのプロセッサであって、重み行列Ｗが長方形構成を有するように、入力次元より小さい出力次元を有するように重み行列Ｗを定義し、バックワード・パス信号の信号強度を増強するために、重み行列Ｗの長方形構成を反復または連結することによって、長方形構成からほぼ正方形の構成に重み行列Ｗを変換する、プロセッサとを含む。

例示的実施形態は、種々の主題を参照しながら説明されることに留意されたい。特に、いくつかの実施形態は、方法タイプの請求項を参照しながら説明され、その一方で、他の実施形態は、装置タイプの請求項を参照しながら説明されてきた。それでも、当業者は、別途通知されない限り、１つのタイプの主題に属する特徴の任意の組合せに加えて、異なる主題に関する特徴の間の、特に、方法タイプの請求項の特徴と装置タイプの請求項の特徴との間の任意の組合せも、本文書内で説明されるものと考えられることを、上記および以下の説明から推測するであろう。

これらおよび他の特徴および利点は、添付の図面と共に読まれることになる、その例証的な実施形態の以下の詳細な説明から明らかになるであろう。

本発明は、以下の図を参照しながら、好ましい実施形態の以下の説明において詳細を提供する。

本発明の実施形態による、抵抗処理ユニット（ＲＰＵ）デバイスのアナログ・クロスポイント・アレイにおいて具体化された人工ニューラル・ネットワーク（ＡＮＮ）を示す図である。本発明の実施形態による、ＲＰＵアレイ上での例示的なアナログ・ベクトル行列乗算を示す図である。本発明の実施形態による、ＲＰＵアレイの長方形サブ領域が使用される、フォワード・パスにおける例示的な長方形ＲＰＵアレイを示す図である。本発明の実施形態による、正方形ＲＰＵアレイ全体が使用される、フォワード・パスにおける例示的な正方形ＲＰＵアレイを示す図である。本発明の実施形態による、ＲＰＵアレイの長方形サブ領域が使用される、バックワード・パスにおける例示的な長方形ＲＰＵアレイを示す図である。本発明の実施形態による、正方形ＲＰＵアレイ全体が使用され、各列が正確に一度反復されるように出力次元ｍが入力次元の半分である、バックワード・パスにおける例示的な長方形ＲＰＵアレイを示す図である。本発明の実施形態による、フォワード・パスおよびバックワード・パスにおいて使用される例示的な等式のブロック／流れ図である。本発明の実施形態による、ＲＰＵクロスバー・アレイ上の重み反復を演算的に実施するコンピューティング・デバイスを含むコンピューティング・システムの構成要素のブロック図である。本発明の実施形態による、ＲＰＵクロスバー・アレイ上の重み反復によって信号強度を増強するための方法の例示的ブロック／流れ図である。

図面の全体を通して、同じまたは同様の参照番号が、同じまたは同様の要素を表す。

本発明による例示的実施形態は、抵抗処理ユニット（ＲＰＵ）クロスバー・アレイ上の重み反復によってバックワード・パス信号の信号強度を増強するために提供される。特に、重み行列は、ＲＰＵクロスバー・アレイの列または行あるいはその両方の反復または複製によって修正される。これは、抵抗性デバイス・アレイ上でいくつかの重み要素を反復し、デジタル周辺（digital periphery）における反復された重み要素（すなわち、行または列あるいはその両方）の結果を集積して、バックワード・パス・サイクル中の出力信号強度を増強することによって達成され、これが、精度を高め、高分解能アナログ－デジタル・コンバータ（ＡＤＣ：analog-to-digital converter）の要件を下げる。その結果として、より低い精密さのＡＤＣを使用することが、アナログ・ハードウェア・チップの電力効率を向上させるのに役立ち、このことが、より良いノイズおよび境界管理を提供し、ニューラル・ネットワーク訓練性能を改善する。

クロスバー・アレイは、クロスポイント・アレイまたはクロスワイヤ・アレイとしても知られ、ＡＮＮアーキテクチャ、神経形態学的マイクロチップ、および超高密度不揮発性メモリを含む、様々な電子回路およびデバイスを形成するために使用される高密度低コスト回路アーキテクチャである。基本的なクロスバー・アレイ構成は、伝導行ワイヤのセット、および伝導行ワイヤのセットと交わるように形成された伝導列ワイヤのセットを含む。ワイヤの２つのセットの間の交点は、薄膜材料から形成され得る、いわゆるクロスポイント・デバイスによって隔てられる。

クロスポイント・デバイスは、事実上、ニューロン間のＡＮＮの重み付き接続として機能する。エネルギー効率が高いシナプス可塑性をエミュレートするために、例えば、「理想的な」伝導状態スイッチング特性を有するメモリスタのような、ナノスケール２端子素子がクロスポイント・デバイスとして使用されることが多い。理想的なメモリスタ材料の伝導状態（例えば、抵抗）は、行および列ワイヤのうちの個々のワイヤの間に印加された電圧を制御することによって変えられることが可能である。デジタル・データは、交点におけるメモリスタ材料の伝導状態を変化させて、高伝導状態または低伝導状態を実現することよって格納されることが可能である。メモリスタ材料は、さらに、材料の伝導状態を選択的にセットすることによって、２つ以上の別個の伝導状態を維持するようにプログラムされることが可能である。メモリスタ材料の伝導状態は、材料間に電圧を印加すること、および標的のクロスポイント・デバイスを通る電流を測定することによって、読み取られることが可能である。

それでも、アナログＲＰＵアレイなどのアナログ抵抗性クロスバー・アレイによるＡＮＮ訓練は、アナログ・ノイズにより、難しくなることがある。さらに、訓練プロセスは、ＲＰＵアレイのために使用されるアナログ－デジタル・コンバータ（ＡＤＣ）およびデジタル－アナログ・コンバータ（ＤＡＣ：digital-to-analog converter）の有界範囲によって制限される。ＡＤＣおよびＤＡＣは、ＲＰＵへのデジタル入力をアナログ信号に、およびＲＰＵからの出力をデジタル信号に、それぞれ変換するために使用される。アナログ・ノイズは、長方形重み行列のための出力信号を増加させることを伴うノイズ管理アプローチによって低減されることが可能である。

本発明の例示的実施形態は、１つの物理的なアナログ・クロスバー・アレイ上でディープ・ニューラル・ネットワーク（ＤＮＮ：deep neural network）ネットワークの重みを反復符号化して、バックワード・パス信号の出力信号を増加させることによって、アナログ・ノイズを有利に管理する方法およびシステムを開示する。本発明の例示的実施形態は、長方形重み行列をｎ回使用して、長方形重み行列をより正方形にし、したがって、物理的な正方形クロスバー・アレイにより良く合うものにする方法およびシステムをさらに開示する。本発明の例示的実施形態は、ＤＮＮ（例えば、畳み込みニューラル・ネットワーク（ＣＮＮ：convolutional neural network））ネットワーク層の重みを単一のアナログ・クロスバー・アレイ上に反復符号化し、次いで、正しいＤＮＮ／ＣＮＮネットワーク・アーキテクチャを維持するために、デジタル周辺における反復された行または列あるいはその両方の出力を合計（平均）するまたは分散させる（コピーする）方法およびシステムをさらに開示する。本発明の例示的実施形態は、ＤＮＮ／ＣＮＮネットワーク層の重みを単一のアナログ・クロスバー・アレイ上に反復符号化し、次いで、正しいＤＮＮ／ＣＮＮネットワーク・アーキテクチャを維持し、反復された重みのうちの、または全ての反復された重みのうちの（例えば、ランダムに選ばれた）ただ１つを同時にまたは並行して更新するために、デジタル周辺における反復された行または列あるいはその両方の出力を合計（平均）するまたは分散させる（コピーする）方法およびシステムをさらに開示する。

したがって、例示的な方法およびシステムは、改善されたニューラル・ネットワーク訓練性能を提供する。特に、バックワード・パス信号の弱い出力信号が著しく増加され、これは、正確なＡＤＣの要件を縮小させる。その上、アナログ要素のノイズは、反復により平均され、その結果、訓練精度が改善する。

本発明は、所与の例証的なアーキテクチャに関して説明されるが、他のアーキテクチャ、構造、基板材料、ならびにプロセス特徴およびステップ／ブロックが、本発明の範囲内で多様にされることが可能であることを理解されたい。分かりやすくするために特定の特徴を全ての図に示すことができないことに留意されたい。これは、いずれかの特定の実施形態、または例証、または特許請求の範囲の範囲の限定であると解釈されることを意図するものではない。

本発明の様々な例証的実施形態が下記で説明される。明瞭さのために、実際の実装形態の全ての特徴が、本明細書で説明されるわけではない。任意のこのような実際の実施形態の開発では、１つの実装形態から別の実装形態に感化することになる、システム関連およびビジネス関連の制約の遵守など、開発者の固有のゴールを達成するために、非常に多くの実装形態固有の判定が行われなければならないことが当然認識されよう。その上、このような開発努力は、複雑で時間のかかるものになることがあるが、それでも、本発明の利益を有する当業者にとって、いつもの仕事であることが理解されよう。

図１は、本発明の実施形態による、抵抗処理ユニット（ＲＰＵ）デバイスのアナログ・クロスポイント・アレイにおいて具体化された人工ニューラル・ネットワーク（ＡＮＮ）を示す図である。

図１に示されているように、アルゴリズム的（抽象的な）重み行列１０の各パラメータ（重みｗ_ｉｊ）が、ハードウェア上の単一のＲＰＵデバイス（ＲＰＵ_ｉｊ）、すなわち、ＲＰＵデバイスの物理的なクロスポイント・アレイ１２にマッピングされる。クロスポイント・アレイ１２は、一連の伝導行ワイヤ１４と、伝導行ワイヤ１４に直角に向けられ、伝導行ワイヤ１４と交わる一連の伝導列ワイヤ１６とを有する。伝導行ワイヤ１４と列ワイヤ１６の交点は、ＲＰＵデバイス１８によって隔てられ、ＲＰＵデバイス１８のクロスポイント・アレイ１２を形成する。各ＲＰＵデバイス１８は、第１の端子、第２の端子、および活性領域を含むことができる。活性領域の伝導状態は、ＲＰＵデバイス１８の重み値を識別し、重み値は、第１／第２の端子への信号の印加によって、更新／調節されることが可能である。さらに、３端子（またはことによると、これ以上の端子）デバイスが、追加の端子を制御することによって、２端子抵抗メモリ・デバイスとして効果的に機能することができる。

ｍ行ｎ列の行列Ｗは、通常、Ｍ列Ｎ行を有するＲＰＵアレイにマッピングされ、したがって、図における統合は、ＲＰＵアレイの列に沿って起こり、その一方で、合計は、Ｗの行に沿って数学的に起こる。したがって、ＲＰＵアレイへの数学的なＷのマッピングは、実際には、転置される。その結果として、表示の容易さのために、行列Ｗの数学的な行は、ＲＰＵアレイの列として表示される。例えば、クロスポイント・アレイ１２の最上部から最下部に、および左から右に進んで、第１の伝導行ワイヤ１４と第１の伝導列ワイヤ１６との交点におけるＲＰＵデバイス１８が、ＲＰＵ_１１と表され、第１の伝導行ワイヤ１４と第２の伝導列ワイヤ１６との交点におけるＲＰＵデバイス１８が、ＲＰＵ_１２と表される、などである。通常、慣例は、表示のために、ＲＰＵアレイの列と行を入れ替えることになるとはいえ、重み行列１０における重みパラメータの、クロスポイント・アレイ１２におけるＲＰＵデバイス１８へのマッピングは、同様の慣例に従う。例えば、重み行列１０の重みｗ_ｉ１は、クロスポイント・アレイ１２のＲＰＵ_１ｉにマッピングされ、重み行列１０の重みｗ_ｉ２は、クロスポイント・アレイ１２のＲＰＵ_２ｉにマッピングされる、などである。

クロスポイント・アレイ１２のＲＰＵデバイス１８は、ＡＮＮにおけるニューロン間の重み付き接続として機能する。ＲＰＵデバイス１８の抵抗は、個々の伝導行ワイヤ１４と伝導列ワイヤ１６との間に印加された電圧を制御することによって変えられることが可能である。抵抗を変えることは、例えば、高抵抗状態または低抵抗状態に基づいて、データがどのようにＲＰＵデバイス１８に格納されるかということである。ＲＰＵデバイス１８の抵抗状態は、電圧を印加すること、および標的のＲＰＵデバイス１８を通る電流を測定することによって読み取られる。重みを伴う動作の全てが、ＲＰＵデバイス１８によって完全に平行に実施される。

機械学習および認知科学では、ＡＮＮベースのモデルは、動物の生物神経回路および特に脳によって着想された統計学習モデルの系統である。これらのモデルは、多くの入力、および一般に未知の接続の重みに依存するシステムおよび認知機能を推定または概算するために使用されることが可能である。ＡＮＮは、電子信号（図８）の形で互いに「メッセージ」を交換するシミュレートされた「ニューロン」として機能する相互接続されたプロセッサ要素のいわゆる「神経形態学的な」システムとして具体化されることが多い。シミュレートされたニューロン間の電子メッセージを運ぶＡＮＮにおける接続は、所与の接続（図８）の強さまたは弱さに相当する数字の重みを提供される。これらの数字の重みは、経験に基づいて調節および調整されることが可能であり、ＡＮＮを入力に対して適応性があり、学習する能力があるものにする。例えば、手書き認識のためのＡＮＮは、入力画像のピクセルによって活性化されることが可能な入力ニューロンのセットで定義される。ネットワークの設計者によって決定された機能によって重みを付け、変形された後、これらの入力ニューロンの活性化は、その後、他の下流ニューロンに伝えられる。このプロセスは、出力ニューロンが活性化されるまで反復される。活性化された出力ニューロンは、どのキャラクタが読み取られたかを判定する。

ＡＮＮは、増分または確率勾配降下（ＳＧＤ：stochastic gradient descent）プロセスで訓練されることが可能であり、このプロセスでは、各パラメータ（重みｗ_ｉｊ）の誤差勾配が、逆伝搬を使用して計算される。逆伝搬は、フォワード・サイクル、バックワード・サイクル、および重み更新サイクルという３つのサイクルで実施され、これらのサイクルは、収束基準が満たされるまで複数回反復される。ＤＮＮベースのモデルは、抽象化の複数のレベルでデータの表現を学習する複数の処理層を含む。Ｎ個の入力ニューロンがＭ個の出力ニューロンに接続される単一の処理層に対して、フォワード・サイクルは、ベクトル－行列乗算（ｙ＝Ｗｘ）を計算することを伴い、ここで、長さＮのベクトルｘが入力ニューロンの活動を表現し、サイズＭ×Ｎの行列Ｗが入力ニューロンと出力ニューロンの各ペアの間の重み値を格納する。長さＭの結果として生じたベクトルｙは、抵抗性記憶素子のそれぞれに対して非線形活性化を実施することによってさらに処理され、次いで、次の層に伝えられる。

情報が最終的な出力層に達すると、バックワード・パス・サイクルは、誤差信号を計算すること、およびＡＮＮを通じて誤差信号を逆伝搬させることを伴う。単一層でのバックワード・パス・サイクルは、重み行列（ｚ＝Ｗ^Ｔδ）の転置（各行と対応する列を入れ替えること）に対するベクトル－行列乗算を伴い、ここで、長さＭのベクトルδが、出力ニューロンによって計算された誤差を表し、長さＮのベクトルｚが、ニューロン非線形性の導関数を使用してさらに処理され、次いで、前の層に伝えられる。

最後に、重み更新サイクルにおいて、重み行列Ｗは、フォワードおよびバックワード・パス・サイクルにおいて使用される２つのベクトルの外積を実施することによって更新される。２つのベクトルのこの外積は、しばしば、Ｗ←Ｗ＋η（δｘ^Ｔ）と表現され、ここで、ηは、全学習率（global learning rate）である。

この逆伝搬プロセス中に重み行列Ｗに対して実施される演算の全てが、対応する数のｍ行ｎ列を有するＲＰＵデバイス１８のクロスポイント・アレイ１２で実施されることが可能であり、ここで、クロスポイント・アレイ１２に格納されたコンダクタンス値は、行列Ｗを形成する。フォワード・サイクルでは、入力ベクトルｘは、伝導列ワイヤ１６のそれぞれを通じて電圧パルスとして伝送され、結果として生じたベクトルｙは、伝導行ワイヤ１４からの電流出力として読み取られる。同様に、電圧パルスが、バックワード・パス・サイクルへの入力として伝導行ワイヤ１４から供給されたとき、重み行列Ｗ^Ｔの転置に対してベクトル－行列積が計算される。最終的に、更新サイクルにおいて、ベクトルｘおよびδを表す電圧パルスが、伝導列ワイヤ１６および伝導行ワイヤ１４から同時に供給される。したがって、各ＲＰＵデバイス１８は、対応する伝導列ワイヤ１６および伝導行ワイヤ１４から来た電圧パルスを処理することによってローカル乗算および総和演算を実施し、したがって、増分重み更新を達成する。

ＲＰＵデバイスの抵抗値は、ＡＮＮ訓練のために使用されることが可能な重み範囲を限定する限界および有限状態分解能（limited and finite state resolution）を有する有界範囲に限定される。さらに、ＲＰＵアレイ上で実施される演算は、本質的にアナログであり、したがって様々なノイズ源になりやすい。ＲＰＵアレイへの入力値が、（バックワード・パスについてのように）小さいとき、出力信号ｙは、ノイズで埋もれるおそれがあり、したがって正しくない結果を生じる。訓練位相では、ＡＮＮ訓練は、逆伝搬を伴うＳＧＤプロセスを伴うことがある。

ＣＮＮ訓練は、バッチを使用して実施される。したがって、訓練のために使用されることになる入力データのバッチが選択される。入力マップおよび畳み込みカーネルを使用して、出力マップが生成される。出力マップの生成は、通常、「フォワード・パス」と呼ばれる。さらに、方法は、出力マップを使用して、予想されたキャラクタ認識およびＣＮＮにどれだけ近かったかまたは遠かったかを判定することを含む。ＣＮＮを含む行列のそれぞれに対する誤差の程度が、勾配降下などを使用して判定される。相対的な誤差の判定は、「バックワード・パス」と呼ばれる。方法は、誤差を調節するために、行列を修正または更新することをさらに含む。出力誤差情報に基づいて畳み込みカーネルを調節すること、およびこれを使用して各ニューラル・ネットワーク行列に対する修正を決定することは、「更新パス」と呼ばれる。

図２は、本発明の実施形態による、ＲＰＵアレイ上での例示的なアナログ・ベクトル行列乗算を示す。

アナログ・ベクトル行列乗算１００は、デジタル入力値（δ）１１０のセットを伴い、ここで、デジタル入力値（δ）１１０のそれぞれは、それぞれのアナログ信号パルス幅１２０で表される。アナログ信号パルス幅１２０は、アレイへの入力として提供され、生成された電流信号は、オペアンプ１３１の反転入力と、オペアンプ１３１の出力に（との間に）接続されたキャパシタ（Ｃ_ｉｎｔ）１３２と共に、オペアンプ１３１を有する、演算増幅器（オペアンプ）統合回路１３０に入力される。オペアンプ１３１の非反転入力は、地面に接続される。オペアンプ１３１の出力は、アナログ－デジタル・コンバータ（ＡＤＣ）１４０の入力にも接続される。ＡＤＣ１４０は、ＲＰＵアレイ上でのアナログ・ベクトル行列乗算１００の（デジタル化された）結果を表す信号ｙ_ｌを出力する。

完全積分時間の間、アナログ・ノイズが、オペアンプ１３１に集積される。入力値（δ）１１０が非常に小さくなると（例えば、バックワード・パスに対するように）、出力信号は、サイクル（ＳＮＲ～０）の間に統合されたノイズで埋もれ、正しくない結果を生み出す。

実際のパルス持続期間は完全積分時間よりはるかに短いが、ＡＤＣ１４０は、全サイクルがオペアンプ１３１からのアナログ出力を評価するのを待つ。アナログ・ノイズは、低減されることが望ましい。図３～図６は、フォワード・パス信号とバックワード・パス信号との間に対称の信号強度を提供することによってノイズを管理するための方法およびシステムを提示する。

図３は、本発明の実施形態による、ＲＰＵアレイの長方形サブ領域が使用される、フォワード・パスにおける例示的な長方形ＲＰＵアレイを示す図である。

各円２０２は、ＲＰＵハードウェア・システム２００への別個のデジタル入力ｘを表している。例えば、フォワード・サイクル・パスでは、デジタル入力ｘ（すなわち２０２）が、行列Ｗのｍ行に提供される。デジタル入力２０２は、ＲＰＵアレイ２００によって受信されたとき、デジタルＲＰＵ入力ｘ’（すなわち２０４）と表される。デジタルＲＰＵ入力２０４は、ノイズ／境界管理ユニットまたは構成要素２１０に送り込まれる。ＲＰＵアレイ２２５上で実施されるベクトル－行列乗算は、本質的にアナログであり、したがって様々なノイズ源になりやすい。したがって、ノイズ／境界管理ユニットまたは構成要素２１０は、ノイズ低減動作を実施する。（「ＤＡコンバータ２１２」とラベルを付けられた）デジタル－アナログ・コンバータは、アナログ・パルス幅２１５のような、ＲＰＵアレイ２２５への入力としてデジタルＲＰＵ入力ｘ′（すなわち２０４）を提供する。ＲＰＵアレイ２２５は、第１の領域２３０および第２の領域２３５を含む。第１の領域２３０は、使用されている長方形領域であり、その一方で、第２の領域２３５は、使用されていない領域である。「使用される」という用語によって、ＲＰＵがその重みに対応するコンダクタンスでロードされることが意味される。ＲＰＵアレイ２３０からの（アナログの）出力２４０は、（「ＡＤコンバータ２５０」とラベルを付けられた）アナログ－デジタル・コンバータによって、デジタルＲＰＵ出力ｙ′（すなわち２６０）のベクトルに変換される。デジタルＲＰＵ出力２６０は、別のノイズ／境界管理ユニットすなわち構成要素２７０に送り込まれる。さらに、ベクトル－行列乗算の結果はアナログ電圧であり、したがって結果は、回路によって課された信号限界によって有界である。したがって、ノイズ／境界管理ユニットすなわち構成要素２７０は、ノイズ低減動作を実施して、ＲＰＵアレイ２３０の出力における結果が確実に、常に受入れ可能な電圧振幅の範囲内にあるようにする。

結果として、抵抗性クロスバー素子の出力キャパシタは、（有限の出力境界ｂを生じる）有限のサイズであり、ゼロに近いアナログ出力信号が、有限のＡＤＣ分解能により、ゼロにセットされる。したがって、ＲＰＵアレイ２３０のアナログ出力が非常に小さい場合、デジタル出力は、全てゼロになることがある。この効果は、ＡＤＣ分解能が小さいとき、歓迎されない（例えば、出力境界ｂが変化しないままのとき、ＡＤＣビン・サイズが大きくなる）。この効果は、ＲＰＵアレイ２３０上に符号化された重み行列が、（図３に示されているような）正方形でない場合、特に歓迎されない。次いで、平均すると、フォワードおよびバックワード方向は、非常に異なる平均信号強度を有する。例えば、１０クラス分類ネットワークでは、最後の完全接続層は、通常、１０００×１０のオーダーのサイズである。したがって、平均で、バックワード方向の信号が少なくとも

倍少なくなる。バックワード信号が非常に小さい（例えば、最小ＡＤＣビン・サイズより小さい）場合、誤差は、ゼロにセットされ、学習が失敗する。対称のＲＰＵ（例えば、ＡＤＣ分解能および出力境界など、フォワードおよびバックワード方向に対して同じハードウェア・スペック）にとって、この効果は望ましくない。図４は、このような問題を軽減するための解決策を示している。

図４は、本発明の実施形態による、正方形ＲＰＵアレイ全体が使用される、フォワード・パスにおける例示的な正方形ＲＰＵアレイを示す図である。

図３と同様の要素は、明瞭さのために説明されない。ＲＰＵハードウェア・システム２００’は、重み行列Ｗ（２２５）の長方形の構成を、ほぼまたはおよそまたは実質的に正方形の構成に変換または修正するために追加の重み要素が使用されるように、重み行列Ｗ（２２５）がｋ回複製されているという点で、ＲＰＵハードウェア・システム２００（図３）とは異なる。ＲＰＵアレイ（２２５）は、常に物理的に正方形であることが指摘される。それでも、重み行列が長方形である場合、および重み行列の列の数がＲＰＵアレイの入力次元に合うと想定して、物理的に正方形のＲＰＵアレイの長方形サブ領域だけが使用されている。上述のように、「使用される」という用語によって、ＲＰＵがその重みに対応するコンダクタンスでロードされることが意味される。したがって、図３では、第２の領域２３５（ＲＰＵのいくつかの行または列あるいはその両方を含む）は、使用されていない。それでも、図４では、重み行列は、重み行列Ｗ（２２５）の長方形の構成を、実質的にまたはほぼ正方形の構成に変換または修正するために、ＲＰＵ４０５のより多くの行または列あるいはその両方を追加することによって、サイズが増加される。複製または反復された行または列あるいはその両方４０５は、長方形重み行列２２５をより正方形にする。複製または反復された行または列あるいはその両方は、ノイズ／境界管理ユニット２７０の後で２８０と表されており、合計され（２８２）、したがって、１行毎に１つの出力を生じる。反復された重み２８０の全てまたはただ１つの反復された重み２９０が更新される。ただ１つが更新された場合、反復された重み２９０は、ランダムに選ばれることも、順次選択されることも可能である。したがって、第２の実施形態では、反復された重みのうちの全てのサブセットだけが、同時にまたは並行して更新される。

システムは、全ての重み行列の反復の数を計算することによって、およそまたは実質的に正方形の構成を実現するためにどれだけの行／列を追加すべきかを知っている。全ての重み行列の反復の数を計算することによって、システムは、行列Ｗの出力次元ｍ（行の数）で行列Ｗの入力次元Ｎの数（列の数）を単純に割り、最大整数を得ることができ、例えば、ｒ＝ｆｌｏｏｒ（Ｎ／Ｍ）である。これは、全ての行／列がどれだけ反復されるかについての数である。例えば、Ｍ＝２５０およびＮ＝５１２の場合、ｒ＝２であり、結果として生じる重み行列は、サイズＮ＝５１２であり、Ｍ＝２５０＊ｒ＝５００である。この方法は、重み行列をおよそ正方形にするだけである。

したがって、図３に関して上述された問題を解決するために、行／列４０５が追加され、フォワード・パスとバックワード・パス両方の信号強度に対称性をもたらす。バックワード・パス信号強度は、フォワード・パス信号強度に正確にマッチする必要はないことが指摘される。それでも、入力次元がＲＰＵアレイ・サイズと同様であると想定される場合、バックワード・パス信号強度は最大化される。これは、物理的なＲＰＵレイアウトが実質的にまたはほぼ正方形なので、システムが、必要な行より多くの行を追加するのを防ぐはずである。

特に、正方形サイズのＲＰＵクロスバー・アレイを想定して、例示的実施形態は、行または列あるいはその両方の複製が長方形重み行列Ｗをより正方形にすることを可能にする。言い換えれば、物理的に、ＲＰＵアレイは常に正方形である。それでも、図３で詳しく述べるように、ＲＰＵアレイの長方形サブ領域だけが実際に使用されている。したがって、例示的実施形態は、より多くの利用可能なクロスポイントの使用を可能にし、したがって、反復された列を一緒に追加することによって、出力／入力処理がデジタルで追加される。

例えば、Ｗは、サイズｍ×ｎであることが想定される。多くのＤＮＮネットワークでは、ｍ＜＜ｎ、例えば、出力次元は入力次元よりはるかに小さい。

例示的実施形態は、サイズｋｍ×ｎのより大きい行列

を作成または構築し、

であり、例えば、Ｗは、ｋ回複製され、連結される。

フォワード・パスでは、

であり、したがって

であり、例えば、複製された出力は、（例えば、ＡＤＣ２５０の後、デジタル周辺において）合計される。

バックワード・パスでは、図５および図６を参照しながら、下記で詳しく説明される。

であり、ここで、

であり、ｊ＝０、．．．、ｋ－１である。

したがって、対応する新しいデルタ入力が元のデルタからコピーされる。

通常、複製の数ｋは、ｍｋ≒ｎであるように選ばれる（一方で、クロスバー・アレイの物理的なサイズ限界を超過しない）。追加として、ｋが、ｂ／ｗ_ｍａｘより小さいことが保証され、ここで、ｂは、出力境界（約１２）であり、ｗ_ｍａｘは、最大重み（約０．６）である。したがって、ｋは、ｍｋ≒ｎを実現するために最大化されるが、ｂ／ｗ_ｍａｘ（約２０）より大きくない。

更新パスでは、変化（可能な学習率適合を除く）も、代替として誤差

のランダムな分数

も、ゼロにセットされない。

図５は、本発明の実施形態による、ＲＰＵアレイの長方形サブ領域が使用される、バックワード・パスにおける例示的な長方形ＲＰＵアレイを示す図である。

ＲＰＵハードウェア・システム５００では、ＲＰＵアレイ５２５上で実施されるベクトル－行列乗算は、本質的にアナログであり、したがって様々なノイズ源になりやすい。したがって、ノイズ／境界管理ユニット５１０は、ノイズ低減動作を実施する。（「ＤＡコンバータ５１２」とラベルを付けられた）デジタル－アナログ・コンバータは、アナログ・パルス幅５１５のような、ＲＰＵアレイ５２５への入力としてデジタルＲＰＵ入力ｘ’（すなわち５６０、図６）を提供する。ＲＰＵアレイ５２５は、第１の領域５３０および第２の領域５３５を含む。第１の領域５３０は、使用されている長方形領域であり、その一方で、第２の領域５３５は、使用されていない領域である。「使用される」という用語によって、ＲＰＵがその重みに対応するコンダクタンスでロードされることが意味される。ＲＰＵアレイ５３０からの（アナログ）出力２４０は、（「ＡＤコンバータ２５０」とラベルを付けられた）アナログ－デジタル・コンバータによって、デジタルＲＰＵ出力ｙ’（すなわち２６０）のベクトルに変換される。デジタルＲＰＵ出力２６０は、別のノイズ／境界管理ユニット２７０に送り込まれる。さらに、ベクトル－行列乗算の結果は、アナログ電圧であり、したがって、結果は、回路によって課された信号限界によって有界である。したがって、ノイズ／境界管理ユニット２７０は、ノイズ低減動作を実施して、ＲＰＵアレイ５３０の出力における結果が確実に、受入れ可能な電圧振幅の範囲内であるようにする。デジタル出力２７２は、ノイズ／境界管理ユニット２７０から出力される。

上述のように、抵抗性クロスバー素子の出力キャパシタは、有限サイズ（有限の出力境界ｂになる）であり、ゼロに近いアナログ出力信号は、有限のＡＤＣ分解能により、ゼロにセットされる。したがって、ＲＰＵアレイ５３０のアナログ出力が非常に小さい場合、デジタル出力は全てゼロになることがある。この効果は、ＡＤＣ分解能が小さいとき、歓迎されない（例えば、ＡＤＣビン・サイズは、出力境界ｂが変化しないままであるとき、大きくなる）。この効果は、ＲＰＵアレイ５３０上に符号化された重み行列が、（図５に示されているような）正方形でない場合、特に歓迎されない。したがって、平均して、フォワードおよびバックワード方向は、平均信号強度が非常に異なる。バックワード信号が非常に小さい（例えば、最小のＡＤＣビン・サイズより小さい）場合、誤差がゼロにセットされ、学習が失敗する。対称のＲＰＵ（例えば、ＡＤＣ分解能および出力境界など、フォワードおよびバックワード方向に対して同じハードウェア・スペック）にとって、この効果は望ましくない。図６は、このような問題を軽減するための解決策を示す。

図６は、本発明の実施形態による、正方形ＲＰＵアレイ全体が使用され、各列が正確に一度反復されるように出力次元ｍが入力次元の半分である、バックワード・パスにおける例示的な長方形ＲＰＵアレイを示す図である。

バックワード・サイクル・パスでは、デジタル入力ｘ（すなわち５５０）は、行列Ｗ（５２５）のｎ列に提供される。ＲＰＵハードウェア・システム５００’は、重み行列Ｗ（５２５）の長方形の構成を実質的にまたはほぼ正方形の構成に変換または修正するために追加の重み要素が使用されるように、重み行列Ｗ（５２５）がｋ回複製されているという点でＲＰＵハードウェア・システム５００（図５）とは異なる。重み行列Ｗ（５２５）は、常に物理的に正方形であることが指摘される。それでも、物理的に正方形のＲＰＵアレイの長方形サブ領域だけが使用されている。上述のように、「使用される」という用語によって、ＲＰＵがその重みに対応するコンダクタンスでロードされることが意味される。したがって、図５では、（ＲＰＵのいくつかの行または列あるいはその両方を含む）第２の領域５３５は、使用されていない。それでも、図６では、重み行列は、重み行列Ｗ（５２５）の長方形の構成を実質的にまたはほぼ正方形の構成に変換または修正するために、ＲＰＵ６０５のより多くの行または列あるいはその両方を追加することによってサイズが増加される。複製または反復された行または列あるいはその両方６０５は、長方形重み行列５２５をより正方形にする。複製または反復された行または列あるいはその両方は、ノイズ／境界管理ユニット５１０の前で５６０と表されている。

図７は、本発明の実施形態による、フォワード・パスおよびバックワード・パスにおいて使用される例示的な等式７００のブロック／流れ図である。

結論として、例示的実施形態は、物理的なアナログ・クロスバー上にＤＮＮの長方形重み行列を複製／反復／連結し、フォワード・パス中に、反復された重み要素への入力をコピーする方法およびシステムを開示する。例示的実施形態は、物理的なアナログ・クロスバー上にＤＮＮの長方形重み行列を複製／反復／連結し、元の重み行列に対して１行毎に１つの出力を生じるように、反復された重み要素からの出力された計算結果を平均または合計する方法およびシステムをさらに開示する。例示的実施形態は、物理的なアナログ・クロスバー上にＤＮＮの長方形重み行列を複製／反復／連結し、逆伝搬誤差に応じて、各反復された重みを更新する方法およびシステムをさらに開示する。例示的実施形態は、物理的なアナログ・クロスバー上にＤＮＮの長方形重み行列を複製／反復／連結し、更新パス中に、１からゼロを除いて、バックワード・デルタ（またはフォワード値）の全てをセットすることによって、反復された重み要素のうちのただ１つを更新する方法またはシステムをさらに開示する。

図８は、コンピューティング・デバイス９０５を含むシステム９００の構成要素のブロック図を描写している。図８は、１つの実装形態の例証を提供しているにすぎず、異なる実施形態が実施されることが可能な環境に関するどのような限定も示唆していないことを理解されたい。描写された環境への多くの修正が行われることが可能である。

コンピューティング・デバイス９０５は、通信ファブリック９０２を含み、通信ファブリック９０２は、コンピュータ・プロセッサ９０４、メモリ９０６、永続ストレージ９０８、通信ユニット９１０、および入力／出力（Ｉ／Ｏ：input/output）インターフェース９１２の間の通信を提供する。通信ファブリック９０２は、プロセッサ（マイクロプロセッサ、通信およびネットワーク・プロセッサなど）、システム・メモリ、周辺デバイス、ならびに、システム内の任意の他のハードウェア構成要素の間でデータを伝えること、または情報を制御すること、あるいはその両方を行うようにデザインされた任意のアーキテクチャで実装されることが可能である。例えば、通信ファブリック９０２は、１つまたは複数のバスで実装されることが可能である。

メモリ９０６、キャッシュ・メモリ９１６、および永続ストレージ９０８は、コンピュータ可読ストレージ媒体である。本実施形態では、メモリ９０６は、ランダム・アクセス・メモリ（ＲＡＭ：random access memory）９１４を含む。一般に、メモリ９０６は、任意の適切な揮発性または不揮発性コンピュータ可読ストレージ媒体を含むことができる。

本発明のいくつかの実施形態では、深層学習プログラム９２５が含まれ、コンピューティング・デバイス９０５の構成要素としての神経形態学的チップ９２２によって動作される。他の実施形態では、深層学習プログラム９２５は、メモリ９０６の１つまたは複数のメモリを介した、それぞれのコンピュータ・プロセッサ９０４のうちの１つまたは複数と共に神経形態学的チップ９２２による実行のために、永続ストレージ９０８に格納される。本実施形態では、永続ストレージ９０８は、磁気ハードディスク・ドライブを含む。磁気ハードディスク・ドライブの代替として、またはこれに加えて、永続ストレージ９０８は、ソリッド・ステート・ハード・ドライブ、半導体ストレージ・デバイス、リード・オンリ・メモリ（ＲＯＭ）、消去可能プログラマブル・リード・オンリ・メモリ（ＥＰＲＯＭ）、フラッシュ・メモリ、または、プログラム命令もしくはデジタル情報を格納できる任意の他のコンピュータ可読ストレージ媒体を含むことができる。

永続ストレージ９０８によって使用される媒体は、さらに、取外し可能であることが可能である。例えば、取外し可能ハード・ドライブが、永続ストレージ９０８のために使用されることが可能である。他の例は、光および磁気ディスク、サム・ドライブ、ならびに、永続ストレージ９０８の一部でもある別のコンピュータ可読ストレージ媒体への転送のためにドライブに挿入されるスマート・カードを含む。

本発明のいくつかの実施形態では、神経形態学的チップ９２２は、コンピューティング・デバイス９０５に含まれ、通信ファブリック９０２に接続されている。

通信ユニット９１０は、これらの例では、分散データ処理環境のリソースを含む他のデータ処理システムまたはデバイスとの通信を提供する。これらの例では、通信ユニット９１０は、１つまたは複数のネットワーク・インターフェース・カードを含む。通信ユニット９１０は、物理通信リンクおよびワイヤレス通信リンクのどちらか一方または両方を使用した通信を提供することができる。深層学習プログラム９２５は、通信ユニット９１０を通じて永続ストレージ９０８にダウンロードされることが可能である。

Ｉ／Ｏインターフェース９１２は、コンピューティング・システム９００に接続されることが可能な他のデバイスとのデータの入力および出力を可能にする。例えば、Ｉ／Ｏインターフェース９１２は、キーボード、キーパッド、タッチ・スクリーン、または他のいくつかの適切な入力デバイス、あるいはその組合せなど、外部デバイス９１８への接続を提供することができる。外部デバイス９１８は、さらに、例えば、サム・ドライブ、ポータブル光または磁気ディスク、およびメモリ・カードなどの、ポータブル・コンピュータ可読ストレージ媒体を含むことができる。

ディスプレイ９２０は、ユーザにデータを表示するためのメカニズムを提供し、例えば、コンピュータ・モニタであることが可能である。

図９は、本発明の実施形態による、ＲＰＵクロスバー・アレイ上の重み反復によって信号強度を増強するための方法の例示的ブロック／流れ図である。

ブロック１０１０において、物理的なアナログ・クロスバー上にＤＮＮの長方形重み行列を複製または反復または連結する。

ブロック１０２０において、フォワード・パス中に、反復された重み要素への入力をコピーする。

ブロック１０３０において、元の重み行列に対して１行毎に１つの出力を生じる、反復された重み要素からの出力された計算結果を平均または合計する。

ブロック１０４０において、逆伝搬誤差に応じて、各反復された重みを更新すること、または代替として、更新パス中に、１からゼロを除いて、バックワード・デルタ（もしくはフォワード値）の全てをセットすることによって、反復された重み要素のうちのただ１つを更新することを行う。

本明細書で使用されるような「データ」、「内容」、「情報」という用語、および同様の用語は、様々な実例の実施形態に従って、キャプチャ、伝送、受信、表示、または格納、あるいはその組合せが行われることが可能なデータを指すよう、区別なく使用されることが可能である。したがって、任意のこのような用語の使用は、本開示の思想および範囲を限定するものと理解されるべきではない。さらに、コンピューティング・デバイスが、別のコンピューティング・デバイスからのデータを受信するように本明細書で説明される場合、データは、別のコンピューティング・デバイスから直接的に受信されることが可能であるか、あるいは、例えば、１つもしくは複数のサーバ、中継器、ルータ、ネットワーク・アクセス・ポイント、基地局、もしくは同様のもの、またはその組合せなど、１つまたは複数の中間コンピューティング・デバイスを介して間接的に受信されることが可能である。

ユーザとの対話を行うために、本明細書で説明される主題の実施形態は、ユーザに情報を表示するための、例えば、ＣＲＴ（陰極線管）またはＬＣＤ（液晶ディスプレイ）モニタのような、表示デバイスと、ユーザがコンピュータへの入力を行える、例えば、マウスまたはトラックボールのような、キーボードおよびポインティング・デバイスとを有するコンピュータで実施されることが可能である。同様にユーザとの対話を行うために、他の種類のデバイスが使用されることが可能であり、例えば、ユーザに対して行われるフィードバックは、例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバックのような、任意の形の感覚フィードバックであることが可能であり、ユーザからの入力は、音響、会話、または触覚入力を含む任意の形で受信されることが可能である。

本発明は、システム、方法、またはコンピュータ・プログラム製品、あるいはその組合せであることが可能である。コンピュータ・プログラム製品は、本発明の態様をプロセッサに実行させるためのコンピュータ可読プログラム命令を有するコンピュータ可読ストレージ媒体（または複数の媒体）を含むことができる。

コンピュータ可読ストレージ媒体は、命令実行デバイスによる使用のための命令を保持および格納できる有形デバイスであることが可能である。コンピュータ可読ストレージ媒体は、例えば、電子ストレージ・デバイス、磁気ストレージ・デバイス、光ストレージ・デバイス、電磁気ストレージ・デバイス、半導体ストレージ・デバイス、または前述の任意の適切な組合せが可能であるがこれらに限定されない。コンピュータ可読ストレージ媒体のより具体的な例の完全に網羅されていないリストは、ポータブル・コンピュータ・ディスケット、ハードディスク、ランダム・アクセス・メモリ（ＲＡＭ）、リード・オンリ・メモリ（ＲＯＭ）、消去可能プログラマブル・リード・オンリ・メモリ（ＥＰＲＯＭまたはフラッシュ・メモリ）、スタティック・ランダム・アクセス・メモリ（ＳＲＡＭ）、ポータブル・コンパクト・ディスク・リード・オンリ・メモリ（ＣＤ－ＲＯＭ）、デジタル・バーサタイル・ディスク（ＤＶＤ）、メモリ・スティック、フロッピー・ディスク、命令を記録したパンチ・カードまたは溝内隆起構造などの機械的にエンコードされたデバイス、および前述の任意の適切な組合せを含む。本明細書で使用されるようなコンピュータ可読ストレージ媒体は、電波もしくは他の自由に伝搬する電磁波、導波路もしくは他の伝送媒体を通じて伝搬する電磁波（例えば、光ファイバ・ケーブルを通過する光パルス）、またはワイヤを通じて伝送される電気信号など、本質的に一過性の信号であると解釈されるべきではない。

本明細書で説明されるコンピュータ可読プログラム命令は、コンピュータ可読ストレージ媒体からそれぞれの計算／処理デバイスに、あるいは、例えば、インターネット、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク、もしくはワイヤレス・ネットワーク、またはその組合せのような、ネットワークを介して外部コンピュータまたは外部ストレージ・デバイスにダウンロードすることができる。ネットワークは、銅伝送ケーブル、光伝送ファイバ、ワイヤレス伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、またはエッジ・サーバ、あるいはその組合せを含むことができる。各計算／処理デバイスのネットワーク・アダプタ・カードまたはネットワーク・インターフェースは、コンピュータ可読プログラム命令をネットワークから受け取り、それぞれの計算／処理デバイスのコンピュータ可読ストレージ媒体に格納するためにコンピュータ可読プログラム命令を転送する。

本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、インストラクション・セット・アーキテクチャ（ＩＳＡ）命令、機械語命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、または、Ｓｍａｌｌｔａｌｋ（Ｒ）、Ｃ＋＋、もしくは同様のものなどのオブジェクト指向プログラミング言語、および「Ｃ」プログラミング言語、もしくは類似のプログラミング言語などの従来の手続き型プログラミング言語を含む，１つもしくは複数のプログラミング言語の任意の組合せで書かれたソース・コードもしくはオブジェクト・コードであることが可能である。コンピュータ可読プログラム命令は、全面的にユーザのコンピュータ上で、または、部分的にユーザのコンピュータ上で、スタンド・アロン・ソフトウェア・パッケージとして，あるいは、部分的にユーザのコンピュータ上かつ部分的にリモート・コンピュータ上で、または全面的にリモート・コンピュータもしくはサーバ上で、実行することができる。後者のシナリオでは、リモート・コンピュータは、ローカル・エリア・ネットワーク（ＬＡＮ）またはワイド・エリア・ネットワーク（ＷＡＮ）を含む任意のタイプのネットワークを通じてユーザのコンピュータに接続されることが可能であるか、接続は、（例えば、インターネット・サービス・プロバイダを使用してインターネットを通じて）外部コンピュータに対して行われることが可能である。いくつかの実施形態では、例えば、プログラム可能ロジック回路、フィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡ）、またはプログラマブル・ロジック・アレイ（ＰＬＡ）を含む電子回路構成部分は、本発明の態様を実施するために、コンピュータ可読プログラム命令の状態情報を利用して、電子回路構成部分を個別化することによって、コンピュータ可読プログラム命令を実行することができる。

本発明の態様は、本発明の実施形態による方法、装置（システム）、およびコンピュータ・プログラム製品の流れ図またはブロック図あるいはその両方を参照しながら本明細書で説明される。流れ図またはブロック図あるいはその両方の各ブロック、および流れ図またはブロック図あるいはその両方におけるブロックの組合せは、コンピュータ可読プログラム命令によって実施できることが理解されよう。

これらのコンピュータ可読プログラム命令は、コンピュータまたは他のプログラム可能データ処理装置のプロセッサによって実行する命令が、流れ図またはブロック図あるいはその両方の１つまたは複数のブロックまたはモジュールで指定された機能／行為を実施するための手段を作り出すべく、汎用コンピュータ、専用コンピュータ、または機械を生み出すための他のプログラム可能データ処理装置の少なくとも１つのプロセッサに提供されることが可能である。これらのコンピュータ可読プログラム命令は、命令を格納したコンピュータ可読ストレージ媒体が、流れ図またはブロック図あるいはその両方の１つまたは複数のブロックまたはモジュールで指定された機能／行為の態様を実行する命令を含む製品を含むべく、コンピュータ、プログラム可能データ処理装置、または他のデバイス、あるいはその組合せに特定の様式で機能するように指図できるように、コンピュータ可読ストレージ媒体に格納されることも可能である。

コンピュータ可読プログラム命令は、コンピュータ、他のプログラム可能装置、または他のデバイス上で実行する命令が、流れ図またはブロック図あるいはその両方の１つまたは複数のブロックまたはモジュールで指定された機能／行為を実施するべく、コンピュータ実行プロセスを生み出すために、コンピュータ、他のプログラム可能装置または他のデバイスで一連の動作ブロック／ステップを実施するために、コンピュータ、他のプログラム可能データ処理装置、または他のデバイスにロードされることも可能である。

図中の流れ図およびブロック図は、本発明の様々な実施形態によるシステム、方法、およびコンピュータ・プログラム製品の可能な実装形態のアーキテクチャ、機能、および動作を示している。この点に関して、流れ図またはブロック図の中の各ブロックは、指定の論理機能を実施するための１つまたは複数の実行可能命令を含む、命令のモジュール、セグメント、または一部を表すことができる。いくつかの代替実装形態では、ブロックに記された機能は、図に記された順序とは異なって発生させることができる。例えば、連続して示された２つのブロックは、実際には、実質的に同時に実行されることが可能であり、またはブロックは、時には、含まれる機能に応じて、逆の順序で実行されることが可能である。ブロック図または流れ図あるいはその両方の各ブロック、および、ブロック図または流れ図あるいはその両方におけるブロックの組合せは、指定の機能もしくは行為を行うか、または、専用ハードウェアとコンピュータ命令の組合せを実行する専用ハードウェア・ベースのシステムによって実施されることが可能であることがさらに指摘される。

本原理の「１つの実施形態」または「実施形態」、およびその他の変形形態の本明細書における参照は、実施形態と共に説明された特定の特徴、構造、特性などが、本原理の少なくとも１つの実施形態に含まれることを意味する。したがって、本明細書の全体を通して様々な場所に現れる「１つの実施形態では」または「実施形態では」という句、および任意の他の変形形態の出現は、必ずしも同じ実施形態を全て指すわけではない。

以下の「／」、「および／または」、ならびに「のうちの少なくとも１つ」のいずれかの使用は、例えば、「Ａ／Ｂ」、「Ａおよび／またはＢ」、ならびに「ＡおよびＢのうちの少なくとも１つ」のケースでは、第１のリスト化されたオプション（Ａ）のみの選択、または第２のリスト化されたオプション（Ｂ）のみの選択、または両方のオプション（ＡとＢ）の選択を包含することを意図していることを認識されたい。さらなる例として、「Ａ、Ｂ、および／またはＣ」ならびに「Ａ、Ｂ、およびＣのうちの１つ少なくとも」のケースでは、このような言い回しは、第１のリスト化されたオプション（Ａ）のみの選択、または第２のリスト化されたオプション（Ｂ）のみの選択、または第３のリスト化されたオプション（Ｃ）のみの選択、または第１と第２のリスト化されたオプション（ＡとＢ）のみの選択、または第１と第３のリスト化されたオプション（ＡとＣ）のみの選択、または第２と第３のリスト化されたオプション（ＢとＣ）のみの選択、または３つのオプション全て（ＡとＢとＣ）の選択を包含することを意図している。これは、当業者によって容易に明らかなように、リスト化された同数の項目に対して拡張されることが可能である。

ＲＰＵクロスポイント・アレイ上での重み反復により信号強度を増強するためのシステムおよび方法の好ましい実施形態が説明されてきた（これは、例証であることを意図し、限定ではない）が、上記の教示の観点から当業者によって修正および変更が行われることが可能であることが指摘される。したがって、添付の特許請求の範囲で概説されるような、本発明の範囲内の、説明された特定の実施形態において変更が行われてもよいことを理解されたい。このように、詳細と共に、特許法で特に求められる、本発明の態様を説明したが、特許証によって保護される、請求されるものおよび望まれるものは、添付の特許請求の範囲に示されている。

Claims

人工ニューラル・ネットワーク（ＡＮＮ）訓練のための方法であって、
抵抗処理ユニット（ＲＰＵ）デバイスのアレイに重み値を格納することであって、前記ＲＰＵデバイスのアレイが、前記ＲＰＵデバイスの抵抗値としてｍ行ｎ列の前記ＡＮＮの重み行列Ｗの重み値を前記アレイに格納することによって、前記重み行列Ｗを表す、前記格納することと、
前記重み行列Ｗが長方形構成を有するように、入力次元より小さい出力次元を有するように前記重み行列Ｗを定義することと、
フォワード・サイクル・パス中に、反復された重み要素の入力をコピーすること、
１行毎に１つの出力を生じる前記反復された重み要素からの出力された計算結果を合計すること、および
逆伝搬された誤差に応じて、前記反復された重み要素のそれぞれを更新すること
によって、バックワード・パス信号の信号強度を増強するために、前記重み行列Ｗの長方形構成を反復または連結することによって、前記長方形構成からより正方形の構成に前記重み行列Ｗを変換することと
を含む、方法。
前記重み要素が、前記重み行列Ｗの前記ｍ行ｎ列である、請求項１に記載の方法。
前記重み行列Ｗに追加された前記反復された重み要素が、フォワード・パス信号と前記バックワード・パス信号との間の対称の信号強度を提供する、請求項１に記載の方法。
前記フォワード・サイクル・パスにおいて、デジタルＲＰＵ入力が、前記ＲＰＵデバイスのアレイによって受信される前に、第１のノイズ／境界測定構成要素およびデジタル－アナログ・コンバータ（ＤＡＣ）に送り込まれる、請求項１に記載の方法。
前記フォワード・サイクル・パスにおいて、前記反復された重み要素からの前記出力された計算結果が、アナログ－デジタル・コンバータ（ＡＤＣ）によって処理された後に、合計される、請求項４に記載の方法。
前記フォワード・サイクル・パスにおいて、

および

であり、

が、修正されたＲＰＵアレイ／重み行列からの直接の出力信号ベクトルであり、

が、前記ＲＰＵアレイに格納された修正された重み行列であり、ｘが、入力信号ベクトルであり、ｙ_ｉが、前記元の出力ベクトルのｉ番目の要素であり、ｋが、複製の数である、請求項５に記載の方法。
バックワード・サイクル・パスにおいて、

であり、ここで、

であり、ｊ＝０，．．．，ｋ－１であり、

が、前記ＲＰＵアレイに格納された転置された修正された重み行列であり、

が、前記バックワード・パス中の修正されたＲＰＵアレイ／重み行列への入力である修正された誤差信号ベクトルであり、

が、修正された誤差信号のｉ＋ｊｋ番目の要素である、請求項１に記載の方法。
人工ニューラル・ネットワーク（ＡＮＮ）訓練のためのコンピュータ可読プログラムを含む非一過性コンピュータ可読ストレージ媒体であって、前記コンピュータ可読プログラムが、コンピュータで実行されると、
抵抗処理ユニット（ＲＰＵ）デバイスのアレイに重み値を格納することであって、前記ＲＰＵデバイスのアレイが、前記ＲＰＵデバイスの抵抗値としてｍ行ｎ列の前記ＡＮＮの重み行列Ｗの重み値を前記アレイに格納することによって、前記重み行列Ｗを表す、前記格納することと、
前記重み行列Ｗが長方形構成を有するように、入力次元より小さい出力次元を有するように前記重み行列Ｗを定義することと、
フォワード・サイクル・パス中に、反復された重み要素の入力をコピーすること、
１行毎に１つの出力を生じる前記反復された重み要素からの出力された計算結果を合計すること、および
逆伝搬された誤差に応じて、前記反復された重み要素のそれぞれを更新すること
によって、バックワード・パス信号の信号強度を増強するために、前記重み行列Ｗの長方形構成を反復または連結することによって、前記長方形構成からより正方形の構成に前記重み行列Ｗを変換することと
を行うステップを前記コンピュータに実施させる、非一過性コンピュータ可読ストレージ媒体。
前記重み要素が、前記重み行列Ｗの前記ｍ行ｎ列である、請求項８に記載の非一過性コンピュータ可読ストレージ媒体。
前記重み行列Ｗに追加された前記反復された重み要素が、フォワード・パス信号と前記バックワード・パス信号との間の対称の信号強度を提供する、請求項８に記載の非一過性コンピュータ可読ストレージ媒体。
前記フォワード・サイクル・パスにおいて、デジタルＲＰＵ入力が、前記ＲＰＵデバイスのアレイによって受信される前に、第１のノイズ／境界測定構成要素およびデジタル－アナログ・コンバータ（ＤＡＣ）に送り込まれる、請求項８に記載の非一過性コンピュータ可読ストレージ媒体。
前記フォワード・サイクル・パスにおいて、前記反復された重み要素からの前記出力された計算結果が、アナログ－デジタル・コンバータ（ＡＤＣ）によって処理された後に、合計される、請求項１１に記載の非一過性コンピュータ可読ストレージ媒体。
前記フォワード・サイクル・パスにおいて、

および

であり、

が、修正されたＲＰＵアレイ／重み行列からの直接の出力信号ベクトルであり、

が、前記ＲＰＵアレイに格納された修正された重み行列であり、ｘが、入力信号ベクトルであり、ｙ_ｉが、前記元の出力ベクトルのｉ番目の要素であり、ｋが、複製の数である、請求項１２に記載の非一過性コンピュータ可読ストレージ媒体。
バックワード・サイクル・パスにおいて、

であり、ここで、

であり、ｊ＝０、．．．，ｋ－１であり、

が、前記ＲＰＵアレイに格納された転置された修正された重み行列であり、

が、前記バックワード・パス中の修正されたＲＰＵアレイ／重み行列への入力である修正された誤差信号ベクトルであり、

が、修正された誤差信号のｉ＋ｊｋ番目の要素である、請求項８に記載の非一過性コンピュータ可読ストレージ媒体。
人工ニューラル・ネットワーク（ＡＮＮ）訓練のためのシステムであって、
重み値を格納するための抵抗処理ユニット（ＲＰＵ）デバイスのアレイであって、前記ＲＰＵデバイスの抵抗値としてｍ行ｎ列の前記ＡＮＮの重み行列Ｗの重み値を前記アレイに格納することによって、前記重み行列Ｗを表す、前記ＲＰＵデバイスのアレイと、
前記アレイにおける前記ＲＰＵデバイス間の電圧を制御するためのプロセッサであって、
前記重み行列Ｗが長方形構成を有するように、入力次元より小さい出力次元を有するように前記重み行列Ｗを定義すること、および
バックワード・パス信号の信号強度を増強するために、前記重み行列Ｗの長方形構成を反復または連結することによって、前記長方形構成からより正方形の構成に前記重み行列Ｗを変換すること
を行う、前記プロセッサと
を備える、システム。
前記信号強度が、
フォワード・サイクル・パス中に、反復された重み要素の入力をコピーすること、
１行毎に１つの出力を生じる前記反復された重み要素からの出力された計算結果を合計すること、および
逆伝搬された誤差に応じて、前記反復された重み要素のそれぞれを更新すること、または代替として、更新パス中に、１からゼロまでを除く全てのフォワード値をセットすることによって、前記反復された重み要素のうちのただ１つを更新すること
によって、増強される、請求項１５に記載のシステム。
前記重み行列Ｗに追加された前記反復された重み要素が、フォワード・パス信号と前記バックワード・パス信号との間の対称の信号強度を提供する、請求項１６に記載のシステム。
前記フォワード・サイクル・パスにおいて、デジタルＲＰＵ入力が、前記ＲＰＵデバイスのアレイによって受信される前に、第１のノイズ／境界測定構成要素およびデジタル－アナログ・コンバータ（ＤＡＣ）に送り込まれる、請求項１７に記載のシステム。
前記フォワード・サイクル・パスにおいて、前記反復された重み要素からの前記出力された計算結果が、アナログ－デジタル・コンバータ（ＡＤＣ）によって処理された後に、合計される、請求項１８に記載のシステム。
前記更新された１つの反復された重み要素が、ランダムに選択される、請求項１６に記載のシステム。
人工ニューラル・ネットワーク（ＡＮＮ）訓練のための方法であって、
抵抗処理ユニット（ＲＰＵ）デバイスのアレイに重み値を格納することであって、前記ＲＰＵデバイスのアレイが、前記ＲＰＵデバイスの抵抗値としてｍ行ｎ列の前記ＡＮＮの重み行列Ｗの重み値を前記アレイに格納することによって、前記重み行列Ｗを表す、前記格納することと、
前記重み行列Ｗが長方形構成を有するように、入力次元より小さい出力次元を有するように前記重み行列Ｗを定義することと、
フォワード・サイクル・パス中に、反復された重み要素の入力をコピーすること、
１行毎に１つの出力を生じる前記反復された重み要素からの出力された計算結果を合計すること、および
更新パス中に、１からゼロまでを除く全てのフォワード値をセットすることによって、前記反復された重み要素のうちのただ１つを更新すること
によって、バックワード・パス信号の信号強度を増強するために、前記重み行列Ｗの長方形構成を反復または連結することによって、前記長方形構成からより正方形の構成に前記重み行列Ｗを変換することと
を含む、方法。
前記重み行列Ｗに追加された前記反復された重み要素が、フォワード・パス信号と前記バックワード・パス信号との間の対称の信号強度を提供する、請求項２１に記載の方法。
前記フォワード・サイクル・パスにおいて、デジタルＲＰＵ入力が、前記ＲＰＵデバイスのアレイによって受信される前に、第１のノイズ／境界測定構成要素およびデジタル－アナログ・コンバータ（ＤＡＣ）に送り込まれる、請求項２１に記載の方法。
前記フォワード・サイクル・パスにおいて、前記反復された重み要素からの前記出力された計算結果が、アナログ－デジタル・コンバータ（ＡＤＣ）によって処理された後に、合計される、請求項２３に記載の方法。
人工ニューラル・ネットワーク（ＡＮＮ）訓練のためのコンピュータ可読プログラムを含む非一過性コンピュータ可読ストレージ媒体であって、前記コンピュータ可読プログラムが、コンピュータで実行されると、
抵抗処理ユニット（ＲＰＵ）デバイスのアレイに重み値を格納することであって、前記ＲＰＵデバイスのアレイが、前記ＲＰＵデバイスの抵抗値としてｍ行ｎ列の前記ＡＮＮの重み行列Ｗの重み値を前記アレイに格納することによって、前記重み行列Ｗを表す、前記格納することと、
前記重み行列Ｗが長方形構成を有するように、入力次元より小さい出力次元を有するように前記重み行列Ｗを定義することと、
フォワード・サイクル・パス中に、反復された重み要素の入力をコピーすること、
１行毎に１つの出力を生じる前記反復された重み要素からの出力された計算結果を合計すること、および
更新パス中に、１からゼロまでを除く全てのフォワード値をセットすることによって、前記反復された重み要素のうちのただ１つを更新すること
によって、バックワード・パス信号の信号強度を増強するために、前記重み行列Ｗの長方形構成を反復または連結することによって、前記長方形構成からより正方形の構成に前記重み行列Ｗを変換することと
を行うステップを前記コンピュータに実施させる、非一過性コンピュータ可読ストレージ媒体。