JP7357079B2

JP7357079B2 - 相変化メモリの閉ループ・プログラミング

Info

Publication number: JP7357079B2
Application number: JP2021568981A
Authority: JP
Inventors: アンブロギオガリ、エステバン; バール、ジェフリー; マッキン、チャールズ; ツァイ、シドニー; ナラヤナン、プリティッシュ
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2019-05-22
Filing date: 2020-04-07
Publication date: 2023-10-05
Anticipated expiration: 2040-04-07
Also published as: GB2597000A; WO2020234658A1; US11347999B2; CN113874882A; GB202115312D0; DE112020000929T5; US20200372335A1; GB2597000B; JP2022533407A

Description

本発明は、概して、コンピュータ技術に関し、より詳細には、閉ループ・プログラミングを用いて相変化メモリ（ＰＣＭ）・セルをプログラミングすることに関する。

ＰＣＭは、別個の電気的特徴を有する２つの相の間で切り替える特性を有する材料の特徴を利用する。例えば、これらの材料は、（ｉ）不規則なアモルファス相と（ｉｉ）規則的な結晶相または多結晶相との間で切り替わることがあり、２つの相は、著しく異なる値の抵抗率に関連付けられている。さらに、材料がアモルファス相または結晶相へ部分的にのみ切り替わる中間構成が、抵抗率の中間値に関連付けられ得る。

１つまたは複数の実施形態によれば、コンピュータ実施方法は、人工ニューラル・ネットワークを実施するクロスバー・アレイ内のアナログ・シナプスに関連付けられた重み値を、アナログ・シナプスにパルス・シーケンスを送信することによって更新することを含む。各アナログ・シナプスは、コンダクタンス・ユニットを含み、アナログ・シナプスの重み値は、コンダクタンス・ユニットのコンダクタンス値に基づく。パルス・シーケンスは、コンダクタンス・ユニットのコンダクタンス値を変更する。方法は、アナログ・シナプスの重み値をアナログ・シナプスに関連付けられた目標重み値と比較することをさらに含む。方法は、比較に基づいてクロスバー・アレイからアナログ・シナプスのセットを選択することをさらに含む。選択は、アナログ・シナプスに関連付けられた選択フラグを用いて示される。方法は、選択されるアナログ・シナプスのセットからの各アナログ・シナプスの重み値を、変動期間の電気パルスのセットをアナログ・シナプスのセットに送信することによって更新することをさらに含む。電気パルスのセットが、アナログ・シナプスのセットに対応するコンダクタンス・ユニットのコンダクタンス値を変更する。

１つまたは複数の例において、アナログ・シナプスに送信されるパルス・シーケンスは、所定の期間のものであり、均一重みパルス・シーケンスが、振幅が減少する複数の電流パルスを含む。１つまたは複数の例において、コンダクタンス・ユニットが、不揮発性メモリ・デバイスのセットである。さらに、アナログ・シナプスに関連付けられた重み値が、不揮発性メモリ・デバイスのそれぞれのコンダクタンス値に基づいて計算される。１つまたは複数の例において、不揮発性メモリ・デバイスが、相変化メモリ・デバイスである。１つまたは複数の例において、不揮発性メモリ・デバイスが、抵抗変化型メモリ・デバイスである。

１つまたは複数の例において、不揮発性メモリ・デバイスのセットが、上位ペア（ＭＳＰ）および下位ペア（ＬＳＰ）を形成するように構成される、４つの不揮発性メモリ・デバイスを含む。アナログ・シナプスの重み値が、Ｗ＝Ｆｘ（Ｇ^＋－Ｇ^－）＋ｇ^＋－ｇ^－として計算され、Ｆが、スケール係数であり、Ｇ^＋およびＧ^－が、ＭＳＰのコンダクタンス値であり、ｇ^＋およびｇ^－が、ＬＳＰのコンダクタンス値である。

１つまたは複数の例において、コンダクタンス・ユニットのコンダクタンス値を変更することが、コンダクタンス値を更新するための所定の順序に従って、コンダクタンス・ユニットからの各不揮発性メモリ・デバイスのコンダクタンス値を変更することを含む。１つまたは複数の例において、所定の順序に従って、ＭＳＰのうちの不揮発性メモリ・デバイスのコンダクタンス値が、最初に更新される。さらに、所定の順序に従って、ＭＳＰのうちの不揮発性メモリ・デバイスのコンダクタンス値が、不揮発性メモリ・デバイスに関連付けられた符号フラグに従って更新される。

１つまたは複数の例において、アナログ・シナプスのセットを選択することが、重み値と目標値との間の差が所定の閾値よりも大きい、アナログ・シナプスのセットを選択することを含む。

１つまたは複数の例において、方法は、アナログ・シナプスのセットから第１のアナログ・シナプスを除去することをさらに含み、第１のアナログ・シナプスについての重み値と目標重み値との差が、所定の閾値範囲内である。例えば、第１のアナログ・シナプスが、第１のアナログ・シナプスの重み値が変動期間の電気パルスのセットによって更新されることに応答して、アナログ・シナプスのセットから除去される。

１つまたは複数の例において、変動期間の電気パルスのセットが、第１のアナログ・シナプスのための第１の電気パルスを含み、第１の電気パルスが、第１のアナログ・シナプスの重み値と目標重み値との間の第１の差に基づく。

上述の特徴は、また、実施態様の他の種類のなかでも、少なくともシステム、コンピュータ・プログラム製品、および機械によって提供され得る。本発明の１つまたは複数の実施形態によれば、システムは、プロセッサを含み、コプロセッサは、１つまたは複数のクロスバー・アレイを含み、プロセッサは、クロスバー・アレイを有する人工ニューラル・ネットワークの層をマッピングすることによって、コプロセッサを用いて人工ニューラル・ネットワークを実施するように構成される。１つまたは複数の実施形態によれば、コンピュータ・プログラム製品は、具現化されるプログラム命令を有するコンピュータ可読記憶媒体を含み、プログラム命令が、クロスバー・アレイを有する人工ニューラル・ネットワークの層をマッピングすることによって人工ニューラル・ネットワークを実施する方法を実行するように、処理回路によって実行可能である。

１つまたは複数の実施形態によれば、クロスバー・アレイは、複数の相変化メモリ・デバイスを含み、相変化メモリ・デバイスは、クロスバー・アレイ内の各クロスポイントにある。４つの相変化メモリ・デバイスの全てのセットは、コンダクタンス・ユニットを形成し、そのようなコンダクタンス・ユニットのセットは、人工ニューラル・ネットワークにおけるアナログ・シナプスのセットを表す。電気回路は、クロスバー・アレイ内の複数のアナログ・シナプスに対するパルス・シーケンスを受信することであって、アナログ・シナプスの重み値が、コンダクタンス・ユニットのコンダクタンス値に基づき、パルス・シーケンスがコンダクタンス・ユニットのコンダクタンス値を変更する、受信することを含む方法を実行することによって、相変化メモリ・デバイスのコンダクタンス値をプログラムする。方法は、選択されるアナログ・シナプスのセットからの各アナログ・シナプスの重み値を、変動期間の電気パルスのセットをアナログ・シナプスのセットについて受信することによって更新することをさらに含む。電気パルスのセットが、アナログ・シナプスのセットに対応するコンダクタンス・ユニットのコンダクタンス値を変更する。クロスバー・アレイからのアナログ・シナプスのセットは、複数のアナログ・シナプスの重み値をアナログ・シナプスに関連付けられた目標重み値と比較することに基づいて選択される。

１つまたは複数の実施形態によれば、コンピュータ実施方法は、クロスバー・アレイ内の相変化メモリ・デバイスのセットから、２つのペアの相変化メモリ・デバイスをコンダクタンス・ユニットとして構成することであって、コンダクタンス・ユニットのセットが、人工ニューラル・ネットワークにおける複数のアナログ・シナプスを表す、構成することを含む。方法は、クロスバー・アレイ内のアナログ・シナプスのセットにパルス・シーケンスを送信することであって、アナログ・シナプスの重み値がコンダクタンス・ユニットのコンダクタンス値に基づき、パルス・シーケンスがコンダクタンス・ユニットのコンダクタンス値を変更する、送信することをさらに含む。方法は、選択されるアナログ・シナプスのサブセットからの各アナログ・シナプスの重み値を、変動期間の電気パルスのセットをアナログ・シナプスのサブセットに送信することによって更新することをさらに含む。電気パルスのセットが、アナログ・シナプスのサブセットに対応するコンダクタンス・ユニットのコンダクタンス値を変更する。クロスバー・アレイからのアナログ・シナプスのサブセットは、アナログ・シナプスのセットの重み値をアナログ・シナプスに関連付けられた目標重み値と比較することに基づいて選択される。

追加の技術的特徴および利点が、本発明の技術を通して実現される。本発明の実施形態および態様が、本明細書において詳細に説明され、特許請求される主題の一部と考えられる。より良く理解するために、詳細な説明および図面を参照する。

本明細書で説明される排他的権利の詳細は、明細書の末尾における特許請求の範囲において詳細に指示され、明確に請求される。本発明の実施形態の、前述のおよびその他の特徴および利点は、添付図面と併せて用いられる以下の詳細な説明から明らかである。

深層ニューラル・ネットワークのブロック図を示す。本発明の１つまたは複数の実施形態による、アナログ・メモリのクロスバー・アレイを用いた深層ニューラル・ネットワークのブロック図を示す。本発明の１つまたは複数の実施形態による、アナログ・メモリのクロスバー・アレイを用いた深層ニューラル・ネットワークのブロック図を示す。本発明の１つまたは複数の実施形態による、アナログ・メモリのクロスバー・アレイを用いた深層ニューラル・ネットワークのブロック図を示す。本発明の１つまたは複数の実施形態による、相変化メモリ・アレイ・デバイスのブロック図を示す。本発明の１つまたは複数の実施形態による、複数のニューロンに連結されたクロスバー・アレイをネットワークとして用いて実施されるニューロモーフィック・システムの構造を示す。本発明の１つまたは複数の実施形態による、相変化メモリ・デバイスに重みをマッピングすることについての概要を示す。本発明の１つまたは複数の実施形態による、所望の重みをコンダクタンス・ユニットにマッピングすることの可視化を示す。本発明の１つまたは複数の実施形態による、減少する電流掃引の例を示す。本発明の１つまたは複数の実施形態による、コンダクタンス・ユニットに送信されるパルス・シーケンスを示す。本発明の１つまたは複数の実施形態による、クロスバー・アレイを用いて実施されるアナログ・シナプスへのニューラル・ネットワーク重みをプログラミングする方法のフローチャートを示す。

本明細書において示される図面は、例示である。本発明の範囲から逸脱することなく、図面またはそこで説明される動作に対して多くの変形が存在し得る。例えば、アクションは、異なる順序で実行されてもよく、またはアクションが、追加され、削除され、もしくは修正されてもよい。また、「連結される」という用語およびその変形は、２つの要素間に通信経路を有することを述べ、それらの間に介在する要素／接続を有しない要素間の直接接続を意味しない。これらの変形の全てが、明細書の一部と考えられる。

添付図面および開示される実施形態の以下の詳細な説明において、図面に示される様々な要素には、２桁または３桁の参照番号が与えられる。わずかな例外を除いて、各参照番号の左端の桁は、その要素が最初に示される図面に対応する。

本発明の様々な実施形態が、関連する図面を参照して本明細書において説明される。本発明の代替の実施形態は、この発明の範囲から逸脱することなく考案され得る。様々な接続および位置関係（例えば、上、下、隣接など）は、以下の説明および図面における要素間において述べられている。これらの接続または位置関係あるいはその両方が、特段の指定がない限り、直接または間接であってもよく、本発明は、この点に関して限定であることを意図するものではない。したがって、エンティティの連結は、直接連結または間接連結のいずれかを指してもよく、エンティティ間の位置関係は、直接または間接の位置関係であってもよい。さらに、本明細書において説明される様々なタスクおよび処理ステップは、本明細書で詳細に説明されない追加ステップまたは機能性を有する、より包括的な手続またはプロセスに組み込まれ得る。

以下の定義および略称は、特許請求の範囲および明細書の解釈のために使用されることとなる。本明細書において使用される、「備える」、「備えている」、「含む」、「含んでいる」、「有する」、「有している」、「包含する」、もしくは「包含している」という用語、またはそれらの任意の他の変形は、非排他的包含を含むように意図される。例えば、要素のリストを含む合成物、混合物、プロセス、方法、製品、または装置は、必ずしもそれらの要素だけに限定されず、明示的に列挙されない他の要素、またはそのような合成物、混合物、プロセス、方法、製品、もしくは装置に固有の他の要素を含み得る。

さらに、「例示的」という用語は、「例、事例、または例示として機能すること」を意味するために、本明細書において使用される。本明細書において「例示的」と説明される任意の実施形態または設計は、必ずしも他の実施形態または設計よりも好適または有利であると解釈されるべきではない。「少なくとも１つの」および「１つまたは複数の」という用語は、１以上の任意の整数、即ち、１、２、３、４などを含むように理解され得る。「複数の」という用語は、２以上の任意の整数、即ち、２、３、４、５などを含むように理解され得る。「接続」という用語は、間接「接続」および直接「接続」の両方を含み得る。

「約」、「実質的に」、「ほぼ」という用語およびそれらの変形は、本出願の出願時点に入手可能な機器に基づく特定の数量の測定値に関連する誤差の程度を含むように意図される。例えば、「約」は、所与の値の±８％、または５％、または２％の範囲を含み得る。

簡潔さのために、本発明の態様を作成し使用することに関連する従来技術は、本明細書において詳細に説明されてもされなくてもよい。特に、本明細書で説明される様々な技術的特徴を実施するコンピューティング・システムおよび特定のコンピュータ・プログラムの様々な態様が、よく知られている。それに応じて、簡潔にするために、多くの従来の実施の詳細は、本明細書で簡潔に述べられるだけであり、または周知のシステムまたはプロセスあるいはその両方の詳細を提供することなく完全に省略される。

前述の通り、相変化メモリ（ＰＣＭ）素子は、別個の電気的特徴を有する２つの相の間で切り替える特性を有する材料の特徴を利用する。現在、カルコゲナイドまたはカルコゲニック材料と呼ばれるＴｅまたはＳｅなどの、周期表の第６族の合金が、相変化セルにおいて有利に使用され得る。カルコゲナイドでは、材料がアモルファス相（抵抗率がより大きい）から結晶相（抵抗率がより小さい）へ、かつその逆へ移るときに、抵抗率が、２桁以上の大きさにより変化する。

そのような特徴は、デジタル・データ記憶のためのメモリ・セルおよびアレイを提供するために使用されるＰＣＭ素子を与える。特に、相変化メモリにおいて、カルコゲニック材料の一部が、プログラマブル・レジスタとして用いられ、カルコゲニック材料は、それぞれが第１の論理値および第２の論理値に関連付けられた、高抵抗状態と低抵抗状態との間で、およびその逆に切り替えるように、制御された電流によって電気的に加熱され得る。カルコゲナイドの状態は、顕熱を引き起こさないように十分に低い電圧をかけることによって、およびそれを横断する電流を測定することによって、読み出され得る。電流は、カルコゲニック材料のコンダクタンスに比例するため、２つの状態を区別することが可能である。例えば、Ｇｅ、Ｓｂ、およびＴｅの合金（Ｇｅ２Ｓｂ２Ｔｅ５、ＧＳＴ）によって形成されるカルコゲナイドは、コンピュータおよび他の種類のデジタル記憶デバイスなどにおいて、オーバライト可能なメモリ・デバイスに情報を記憶するために広く用いられている。

高抵抗性のアモルファス状態と高導電性の結晶状態との間の相遷移は、適当な振幅および期間の電流パルスを通して電気的に誘導され得る。特に、アモルファス状態（「リセット」）への遷移は、ジュール効果により融解点を超えてカルコゲナイドを加熱するのに十分な振幅の電流パルスを印加することによって得られる。用いられる電流パルスは、カルコゲナイドの冷却が結晶化を防止するほど高速であるように急峻なエッジを有し、例えば、矩形電流パルスである。結晶状態（「セット」）への遷移は、異なる技術を用いて誘導され得る。したがって、ＰＣＭデバイスの相のコンダクタンスが異なるため、これを用いてビットを記憶することが可能である。ビットが中間コンダクタンスを有する状態に入るように、温度を制御することも可能である。ビットを記憶することに加えて、これは、サブスレッショルド相変化の所定のグループ（またはセット）が段階的にビット反転になり得るため、計算を実行するために用いられ得る。

このように計算を行うことの利点は、動作がメモリ内で行われるためにそれがメモリとの行き来を回避すること、および動作が並列で行われ得ることの、２つの要素を持つ。これらの差異は、ニューロンの集団の挙動と本来の類似点を有し、それによって、ＰＣＭデバイスは、深層ニューラル・ネットワーク（ＤＮＮ）などの人工ニューラル・ネットワーク（ＡＮＮ）において使用するのに適当になる。

ＰＣＭは、ＤＮＮ（または他の種類のニューラル・ネットワーク）での使用にさらに適している。これは、ニューロンの活動はバイナリ、オール・オア・ナッシング状態ではなく、オンとオフとの間の中間的な挙動の範囲を採用し得るためである。したがって、１と０との間の状態を採用するＰＣＭデバイスの能力は、それがニューロンの挙動を直接的にモデル化することを可能にする。

訓練にこれを用いるために、ＰＣＭデバイス（ビット）のグリッド（またはアレイ）が、ＤＮＮの各層にマッピングされ得る。配線でできた通信ネットワークは、ニューロンがそれ自体の間で通信することを可能にする。その通信の強度は、メモリの状態によって設定され、その場合に、メモリの状態は、完全オンと完全オフとの間のスペクトル上にある。その状態は、同様に、それに流れ込む全てのビットによって設定される。通信ハードウェアは、可変強度信号を相変化ビットから異なる期間の信号に変換する。信号は、デジタル通信ネットワークと互換性がある。

典型的には、ＤＮＮを実施するために、従来のデジタル・メモリ・チップとプロセッサ・チップとの間のネットワークのための重みデータを移送する必要性、および常に重みをメモリに維持する必要性のために、前向き推論計算は、低速かつエネルギー多消費型であり得る。上述の通り、ＰＣＭベースのバイトを用いるアナログ不揮発性メモリは、重みデータの場所でアナログ・ドメインにおいて並列化された積和演算を実行すること、およびメモリ内に記憶された重みデータをリフレッシュする必要性を低下させることによって、前向き推論を高速化し、エネルギー消費を減少させ得る。このようなＤＮＮの実際の適用は、無制限であり、ＩｏＴデバイスのためのリアルタイム・センサ・データ処理および推論などを含み得る。

前向き推論の精度は、重みプログラミングの精度に強く依存する。しかしながら、所望のアナログ・コンダクタンス値に対してＰＣＭなどのアナログ・メモリをプログラミングすることは、特にアナログ・メモリ・アレイにおける可変性では、自明ではない。例えば、ＰＣＭデバイスは、メモリ・セルおよび下部電極のサイズに依存して異なる最大コンダクタンスを有し得る。したがって、１つの単一のプログラミング条件が、アレイ内の全てのＰＣＭデバイスを同じアナログ・コンダクタンス値にすることはできない。さらに、そのようなＰＣＭデバイス・ベースのＤＮＮの実際の実施態様において、いくつかの追加の技術的問題が存在する。例えば、ハードウェアは、ニューラル・ネットワークを有効にする１と０との間の状態の同一範囲を有しない。さらに、ＰＣＭデバイスがどのように応答するかにおいて、ビット毎の可変性が存在する。ＰＣＭのプログラミングでの別の技術的課題は、デバイス毎の反復が異なることがあり、かつ無限に長くかかる場合があることから、有限時間内に複数デバイスを同時にプログラミングすることである。

本発明の１つまたは複数の実施形態を用いた本明細書で説明される技術は、そのような技術的課題を克服する。本発明の１つまたは複数の実施形態は、定義済み時間フレーム内に複数のＰＣＭデバイスを特定のアナログ・コンダクタンス状態へ同時にプログラミングすることを容易にする。本発明の１つまたは複数の実施形態によってもたらされる他の利点および実際の用途は、本明細書の説明に基づいて当業者に明らかとなるであろう。

本発明の１つまたは複数の実施形態は、デバイス間可変性を克服することによって、ＰＣＭデバイスなどの不揮発性メモリ・デバイスの中間アナログ・コンダクタンス・プログラミングを容易にする。したがって、本発明の１つまたは複数の実施形態は、特定のアナログ・コンダクタンス状態への不揮発性メモリの行毎の閉ループ・プログラミングを提供する。本発明の１つまたは複数の実施形態の実験結果は、説明する技術が、デバイス可変性に対して堅牢であることを示しており、定義済み時間フレーム内で所望のプログラミング品質を達成する。

図１は、深層ニューラル・ネットワークのブロック図を示す。図示されるＤＮＮ１００は、入力層１１０、隠れ層１２０、および出力層１３０を有し、各層がニューロン１０５を含む。ＤＮＮは、生物学的ニューラル・ネットワークによって大まかな着想を得ている。ニューロン１０５は、可塑性シナプスによって相互接続される並列処理ユニットとして動作する。相互接続の重みを調節することによって、ＤＮＮ１００は、分類問題などのある問題を効率的に解決し得る。ＤＮＮ１００の訓練は、概して、典型的には逆伝播と呼ばれる、グローバル教師あり学習アルゴリズムに基づく。訓練の間、入力データは、ニューロン層１１０、１２０、および１３０を通って順伝播され、シナプス・ネットワークが積和演算を実行する。最終層（出力層１３０）の応答が、入力データ・ラベルと比較され、誤差が逆伝播される。順伝播および逆伝播の両方のステップが、行列ベクトル乗算のシーケンスを伴う。続いて、シナプス重みは、誤差を減少させるために更新される。非常に大きなニューラル・ネットワークに対して非常に大きなデータセット（複数ギガバイト）を用いてこれらの動作を繰り返し実行する必要があるため、このブルート・フォース最適化手法では、フォン・ノイマン機械上で最先端のネットワークを訓練するのに何日も、または何週間もかかることがある。したがって、本発明の１つまたは複数の実施形態では、ＰＣＭデバイスの複数のクロスバー・アレイを含むコプロセッサ、ならびに深層学習のそのようなステップを高速化するための他のアナログ通信リンクおよび周辺回路が用いられる。

図２Ａ、図２Ｂ、および図２Ｃは、本発明の１つまたは複数の実施形態による、アナログ・メモリのクロスバー・アレイを用いた深層ニューラル・ネットワークのブロック図を示す。シナプス重みは、クロスバー・アレイ２００に編成された不揮発性メモリ（ＮＶＭ）デバイス２１０のコンダクタンス値に関して、ＤＮＮ１００の各層（１１０、１２０、および１３０）に関連付けられる。ＮＶＭデバイス２１０は、ＰＣＭデバイス、抵抗変化型メモリ（ＲＲＡＭ）・デバイスなどであってもよい。図２Ａ、図２Ｂ、および図２Ｃにおいて、ＤＮＮ１００を実施する様々なフェーズ、図２Ａにおける順伝播、図２Ｂにおける逆伝播、および図２Ｃにおける重み更新が示されている。

１つまたは複数の例において、ＤＮＮ１００の複数の層（１１０、１２０、および１３０）のそれぞれに対応する複数のそのようなクロスバー・アレイが存在する。本発明の１つまたは複数の実施形態によれば、コプロセッサ／チップ／システムは、ニューロン活性化関数およびクロスバー・アレイ２００の間の通信を実施するための追加周辺回路と共に、そのようなクロスバー・アレイ２００を含む。

図３は、本発明の１つまたは複数の実施形態による、相変化メモリ・アレイ・デバイスのブロック図を示す。アーキテクチャは、チップ／システム３００上のフレキシブル・ルーティング・ネットワークによって接続された複数の同一のアレイ・ブロック３１０を示す。各アレイ・ブロック３１０は、ＮＶＭデバイス２１０のクロスバー・アレイ２００を表す。フレキシブル・ルーティング・ネットワークは、少なくとも３つのタスク、（１）チップ３００のエッジからデバイス・アレイ３１０へチップ入力（例データ、例ラベル、および重みオーバライドなど）を伝達すること、（２）アレイ３１０からチップ３００のエッジへチップ出力（推論された分類および更新された重みなど）を搬送すること、ならびに（３）多層ニューラル・ネットワークを実施するために様々なアレイ３１０を相互接続すること、を有する。各アレイ３１０は、シナプス接続１１５の高密度グリッドと接続された、入力ニューロン１１０（ここでは各アレイの「西」側に示される）、および出力ニューロン１３０（「南」側）を有する。周辺回路は、個々の行に割り当てられた回路（行回路３２０）および列に割り当てられた回路（列回路３３０）に分割され、回路は、いくつかの近隣の行および列の間で共有される。

本発明の１つまたは複数の実施形態によれば、クロスバー・アレイ２００は、ニューロモーフィック集積回路のためのスパイク・タイミング依存可塑性（ＳＴＤＰ）学習規則に基づいてスパイキング・ニューロン・ネットワークを含むニューロモーフィック・ネットワークを提供する。例えば、本発明の１つまたは複数の実施形態は、ＮＶＭデバイス２１０（例えば、ＰＣＭデバイス）などのナノスケール・メモリ・シナプスを通して互いに対話する、相補型金属酸化膜半導体（ＣＭＯＳ）電子ニューロンを用いたスパイクベース計算を提供する。

そのようなニューロモーフィック・ネットワークでは、電子ニューロンは、ＮＶＭデバイス２１０によって表されるプログラマブル電子シナプスを介して相互接続される。シナプス・コンダクタンスは、ＳＴＤＰの通り、シナプス前ニューロンおよびシナプス後ニューロンの相対スパイク時間の関数として時間と共に変化する。具体的には、ＳＴＤＰ学習規則は、そのシナプス前ニューロンが発火した後にそのシナプス後ニューロンが発火する場合にシナプスのコンダクタンスを増加させること、および２つの発火の順序が逆である場合にシナプスのコンダクタンスを減少させることによって、シナプス（ＮＶＭデバイス２１０）をプログラムする。学習規則はＳＴＤＰによって定義され、シナプス・コンダクタンスは、シナプス前ニューロンおよびシナプス後ニューロンの相対スパイク時間の関数として時間と共に変化する。シナプス・コンダクタンスの変化は、対応するシナプス後ニューロンおよびシナプス前ニューロンにおける発火イベントの間の精密遅延に依存する。遅延が長いほど、シナプス・コンダクタンスの大きさの変化が小さい。

図４は、本発明の１つまたは複数の実施形態による、複数のニューロンに連結されたクロスバー・アレイをネットワークとして用いて実施されるニューロモーフィック・システムの構造を示す。図示されるニューロモーフィック・システム４００は、クロスバー・アレイ２００を用いて相互接続された複数のニューロン４１４、４１６、４１８、および４２０を含む。一例では、クロスバー・アレイ２００は、約０．１ｎｍ～１０μｍの範囲内のピッチを有する。システム４００は、クロスバー・アレイ４１２のクロスポイント接合点において可変状態レジスタとして使用されるＮＶＭデバイス２１０を含むシナプス・デバイス４２２をさらに含む。シナプス・デバイス４２２は、軸索経路４２４および膜経路４２７が樹状突起４２６に直交するように、軸索経路４２４、樹状突起経路４２６、および膜経路４２７に接続される。「軸索経路」、「樹状突起経路」、および「膜経路」という用語は、それぞれ「軸索」、「樹状突起」、および「膜」と呼ばれることもある。

スパイキング電子ニューロンは、プログラマブルＮＶＭシナプス（例えば、ＰＣＭデバイス）を通して他のニューロンからの入力を統合し、統合された入力が所定の閾値を超えるときにスパイクする。例えば、バイナリ確率的ＳＴＤＰと呼ばれる、ニューロモーフィック・ネットワークにおけるＳＴＤＰの実施態様において、各電子ニューロンは、単純なレジスタ・キャパシタ（ＲＣ）回路を用いてその最後のスパイキング・イベントを覚えている。よって、電子ニューロンがスパイクするときに、後述のように、複数のイベントが発生する。一例では、スパイキング・ニューロンは、内部「メモリ」キャパシタをＶ_０に充電し、キャパシタにわたる電位は、Ｖ_ｔ＝Ｖ_０ｅ^{－ｔ／ＲＣ}、ＲＣ＝５０ｍｓに従って衰退する。

スパイキング・ニューロンは、その軸索および樹状突起上にナノ秒「アラート」パルスを送信する。軸索において生成されたアラート・パルスが電圧スパイクである場合、下流ニューロンが、（次いで下流ニューロンによって統合され得る）関与するニューロンの各ペア間のシナプス（ＰＣＭデバイス）のコンダクタンスによって重み付けされて、電流信号を受信する。樹状突起において生成されたアラート・パルスは、上流ニューロンによって統合されないが、ハンドシェーク信号としての役割をして、シナプスのためのプログラミング・パルスが差し迫っていることを示す情報をそれらのニューロンへ中継する。

有限遅延後、スパイキング・ニューロンは、本来はシナプス（ＰＣＭデバイス）のプログラミングを誘導できない、セミプログラミング・パルスを生成する。先にアラート・パルスを受信した上流ニューロンおよび下流ニューロンは、（内部キャパシタにおいて保持される各ニューロンの最後の発火後の経過時間に依存して）変調された振幅を有する適当なパルスを介して応答する。各応答パルスは、ＳＴＤＰを達成するために関与するニューロンのクロスポイント接合点において、各シナプス（ＰＣＭデバイス）をプログラムするためにセミプログラミング・パルスと結合する。シナプス後ニューロンは、矩形パルスを送信することによって応答し、矩形パルスは、シナプスの抵抗率を効果的に増大させ（即ち、コンダクタンスを減少させ）、シナプス前ニューロンは、三角パルスを送信することによって応答し、三角パルスは、シナプスの抵抗率を効果的に減少させる（即ち、コンダクタンスを増大させる）。

クロスバー・アレイ２００は、クロスポイント接合点においてＮＶＭデバイス２１０を含むナノスケール・クロスバー・アレイであってもよく、上記電子ニューロン間の任意接続および可塑性接続を実施するために利用される。各シナプス・デバイス４２２は、電界効果トランジスタ（ＦＥＴ）を含み得るアクセスまたは制御デバイス４２５をさらに含み、それは、あらゆるクロスバー接合点において、信号通信（ニューロン発火イベント）中のクロストークを防止するために、ならびに漏出および電力消費を最小化するために、ダイオードとして配線されない。他の実施形態では、他の種類の回路が制御デバイス４２５として用いられてもよく、ＦＥＴが１つの可能な例として本明細書での説明において用いられることに留意されたい。

電子ニューロン４１４、４１６、４１８、および４２０は、クロスバー・アレイ２００の周辺部において回路として構成される。設計および製造が単純であることに加えて、クロスバー・アーキテクチャは、利用可能な空間の効率的な使用をもたらす。完全なクロスバー・アレイに固有の完結したニューロン接続は、電気初期化または製造中に望ましくない場所でマスク・ステップを省略することによって、いずれかの任意接続に転換され得る。クロスバー・アレイ２００は、ニューロン間の通信をカスタマイズするように構成され得る（例えば、ニューロンは、決して別のニューロンと通信しない）。任意接続は、製造レベルにおいて、あるシナプスを遮断することによって得られ得る。したがって、システム４００のアーキテクチャ原理は、生物学的ニューロモーフィック・ネットワークにおいて観察される全ての直接配線結合を模倣し得る。

クロスバー・アレイ２００は、図４に示されるドライバ・デバイスＸ_２、Ｘ_３、およびＸ_４をさらに含む。デバイスＸ_２、Ｘ_３、およびＸ_４は、インターフェース・ドライバ・デバイスを含み得る。具体的には、樹状突起４２６は、クロスバー・アレイ２００の１つの側にドライバ・デバイスＸ_２を有し、クロスバー・アレイのもう１つの側にレベル変換器デバイス（例えば、センス増幅器）Ｘ_４を有する。軸索４２４は、クロスバー・アレイ２００の１つの側にドライバ・デバイスＸ_３を有する。ドライバ・デバイスは、「西」側および「南」側（図３）など、本明細書で説明された関数を実施するＣＭＯＳ論理回路を含み得る。

センス増幅器デバイスＸ_４は、興奮性スパイキング電子ニューロン（Ｎ_ｅ）４１４、４１６、および４１８に入り、同様に、軸索ドライバ・デバイスＸ_３および樹状突起ドライバ・デバイスＸ_２に接続する。ニューロン４２０は、阻害性スパイキング電子ニューロン（Ｎ_ｉ）である。概して、興奮性スパイキング電子ニューロンは、そのターゲット・ニューロンをより発火しやすくし、阻害性スパイキング電子ニューロンは、そのターゲット・ニューロンを発火しにくくする。スパイキング電子ニューロンの様々な実施態様が使用され得る。概して、そのようなニューロンは、ソース興奮性ニューロンからの入力が受信されるときに増加し、ソース阻害性ニューロンからの入力が受信されるときに減少する、カウンタを含む。増加または減少の量は、ソース・ニューロンからターゲット・ニューロンへの接続強度に依存する。カウンタがある閾値に達すると、ニューロンは、独自のスパイクを生成し（即ち、発火し）、カウンタは、基準値へのリセットを経験する。スパイキング電子ニューロンという用語は、本明細書では「電子ニューロン」と呼ばれる。

一例としてのシナリオでは、ニューロン４１４、４１６、４１８、および４２０は、樹状突起ニューロンである。各樹状突起ニューロンは、対応する変換器デバイスＸ_４から入力を受信する。ニューロン４１４、４１６、４１８、および４２０は、また、出力を含み、経路４１５および４１７に沿って複数のデバイスＸ_２、Ｘ_３にそれぞれ信号を生成する。よって、ニューロン４１４、４１６、４１８、および４２０は、軸索接続に沿って出力を生成するときに軸索ニューロンとして機能し得る。ニューロン４１４、４１６、４１８、および４２０のいずれかが発火するときに、それらは、それらの軸索接続およびそれらの樹状突起接続へパルスを送出する。

この例では、興奮性ニューロン４１４、４１６、４１８（Ｎｅ）のそれぞれが、統合および発火をもたらすように構成される。各阻害性ニューロン４２０（Ｎｉ）は、ネットワーク活動全体に依存して興奮性ニューロンの活動を調節するように構成される。当業者が認識するように、興奮性ニューロンおよび阻害性ニューロンの正確な数は、ニューロモーフィック・システム４００を用いて解く問題の性質に依存して変動し得る。

短期間のリード・スパイクが、通信のために軸索ドライバ・デバイスＸ３に印加され得る。延長パルスは、軸索ドライバ・デバイスＸ３に印加されてもよく、短い負パルスは、プログラミングのために軸索ドライバ・パルスを通る途中で樹状突起ドライバ・デバイスＸ２に印加されてもよい。このようにして、軸索ドライバ・デバイスＸ３は、長いプログラミング・パルスおよび通信スパイクを提供する。樹状突起ドライバ・デバイスＸ２は、遅延のあるプログラミング・パルスを提供する。ニューロン回路がアナログ論理回路を用いて実施される、本発明の１つまたは複数の実施形態において、対応するセンス増幅器Ｘ４は、統合のためにシナプス電流レベルをニューロン電流レベルに変換する。代替的に、または追加で、ニューロン回路がデジタル論理回路を用いて実施される場合に、対応するセンス増幅器Ｘ４は、統合のためにシナプス電流レベルをバイナリ・デジタル信号に変換する。

ＦＥＴ駆動シナプス・デバイス４２２は、時間フェーズ化様式でＳＴＤＰを実施する。そのような実施は、高密度電子スパイキング・ニューロン・ネットワークの実現を可能にし、ニューロンのスパイクは、ある時間フェーズまたはグローバル・タイミング基準に制限されて、フェーズ化されたシナプスにおけるプログラミング活動をもたらす。概して、本発明の実施形態によれば、軸索ニューロンは、それらが樹状突起入力接続から受信する入力が閾値を超えるときに、「スパイク」または「発火」する（パルスを送信する）。一例では、生物学的現象を模倣するために必要な典型的周波数は、約１０ｋＨｚであり、ナノスケール電子コンポーネントの通信およびプログラミングのために十分な時間ウィンドウを残す。

本発明の１つまたは複数の実施形態において、ニューロモーフィック・ネットワーク１０におけるシナプス重み更新および通信は、ＳＴＤＰを達成するために、グローバル・タイミング基準信号（即ち、グローバル・クロック）の特定のフェーズに制限される。ネットワークにおける通信が、グローバル・タイミング基準信号のあるフェーズに制限されると、ＦＥＴデバイス４２５は、シナプス（ＰＣＭデバイス）４２２におけるアクセスまたは制御デバイスとして使用される。ニューロンがスパイクするとき、スパイクは、Ｘ２およびＸ３ドライバに通信される。各Ｘ３ドライバは、２つの導電経路４２４および４２７をそれぞれ介して、対応するシナプス４２２におけるＦＥＴ４２５のソースおよびゲートを制御する。各シナプス４２２において、各ＦＥＴのゲート端子は、シナプス前ニューロンに接続される膜として用いられて、接続されたプログラマブル・レジスタを通して流れる電流に対する精密な制御を可能にする。

概して、クロスバー・アレイ４１２における発火ニューロンからのスパイキング信号に応答して、ドライバＸ２およびＸ３からの信号の結合されたアクションが、そのクロスバー・アレイ接合点におけるシナプス４２２のＮＶＭデバイス２１０に、発火ニューロンのスパイキング・タイミング・アクションに基づいて値を変更させる。これは、ＮＶＭデバイス２１０のプログラミングを提供する。ニューロンのアナログ実施態様において、各レベル変換器デバイスＸ４は、対応するニューロンによる統合のためにそれぞれの対応するシナプス４２２からの電流量を変換するように構成される回路を含む。ニューロンのデジタル実施態様の場合、各レベル変換器デバイスＸ４は、同一機能を果たすセンス増幅器である。

クロスバー・アレイ２００におけるニューロンからデバイスＸ２、Ｘ３、Ｘ４へ信号を配信するタイミング、および信号を生成する際のデバイスＸ２、Ｘ３、Ｘ４のタイミングは、シナプスのプログラミングを可能にする。一実施態様は、電子ニューロンの最後のスパイキングがＮＶＭデバイス２１０によって連結される軸索ドライバおよび樹状突起ドライバにスパイキング信号を発火してからの時間の関数として、ＮＶＭデバイス２１０のコンダクタンスを増加または減少させることによって、ＮＶＭデバイス２１０の状態を変更することを含む。概して、ニューロンは、スパイク信号を生成し、デバイスＸ２、Ｘ３、およびＸ４は、スパイク信号を解釈し、応答して、シナプス４２２をプログラムするために上述した信号を生成する。シナプスおよびニューロンは、アナログまたはデジタルであってもよい。

一例では、短期間のリード・スパイク（例えば、約０．１ｍｓの長さ）が、通信のために軸索ドライバ・デバイスＸ３に印加される。延長パルス（例えば、約２００ｍｓの長さ）は、軸索ドライバ・デバイスＸ３に印加される。短い負パルス（例えば、約５０ｎｓの長さ）は、シナプス４２２をプログラミングするために、軸索ドライバ・パルスを通るほぼ中間で樹状突起ドライバ・デバイスＸ２に印加される。このようにして、軸索ドライバ・デバイスＸ３は、長いプログラミング・パルスおよび通信スパイクを提供する。

これらのシグナリング技術は、図２Ａ、図２Ｂ、および図２Ｃに示されるように、クロスバー・アレイ２００を用いてＤＮＮ１００を実施する動作のために用いられる。図２Ａを参照すると、順伝播は、積和演算を実行するシナプス・ネットワークを有するニューロン層（１１０、１２０、および１３０）を通してデータを処理することを含む。前方パスに関連付けられた行列ベクトル乗算は、図示されるクロスバー・アレイ２００を用いてＯ（１）の複雑性で実施され得る。例えば、Ａが行列でｘおよびｂはベクトルである場合に、Ａｘ＝ｂを実行するために、Ａの成分が、クロスバー２００に編成されたＰＣＭデバイス２１０のコンダクタンス値に線形マッピングされる。ｘの値は、行に沿って印加される読み出し電圧の振幅または期間に符号化される。Ａの正の成分および負の成分は、減算回路と共に別々のデバイス上でコード化される。代替的には、１つまたは複数の例において、負のベクトル成分が、負の電圧として印加される。列に沿った結果となる電流は、結果ｂに比例する。入力が期間に符号化される場合、結果ｂは、合計の充電（例えば、時間にわたって積分された電流）である。用いられるＮＶＭデバイス２１０の特性は、多重レベルの記憶ケイパビリティおよびキルヒホッフの法則、オームの法則およびキルヒホッフの電流則である。

図２Ｂはクロスバー・アレイ２００によって実行される逆伝播を示す。同一のクロスバー構成が、Ａの転置行列との行列ベクトル乗算を実行するために使用され得る。このため、入力電圧は、列ラインに印加され、結果となる電流は、行に沿って測定される。したがって、逆伝播は、シナプス重みを表す行列の転置との乗算を伴い、それは、上述の順伝播について説明されたのと同じように、Ｏ（１）の複雑性で実現され得る。

図２Ｃは、重み更新を示しており、行列の成分がＮＶＭデバイス２１０のコンダクタンス値にマッピングされる。このようなマッピングは、本明細書で説明されるように、プログラミング曲線を用いて反復プログラミングを介して達成され得る。

クロスバー・アレイ２１０およびニューロモーフィック・システム４００の説明が１つの可能な例としての実施態様であること、ならびに本発明の１つまたは複数の実施形態が他の種類の実施態様において用いられ得ることに留意されたい。

典型的には、ＮＶＭデバイス２１０をプログラミングすること（重みを更新すること）は、コンプライアンス電流が安定的に増加するＳＥＴパルスを反復して印加することにより行われる。より低いコンダクタンス値への突然の遷移を引き起こし得るＲＥＳＥＴパルスとは異なり、部分的なＳＥＴパルスの連続的な印加は、ＮＶＭデバイス２１０のコンダクタンス値のより漸進的な増加をもたらすと考えられる。したがって、ＮＶＭデバイス２１０を用いたニューロモーフィック・システム４００の場合、既存の解決策では、部分的なＳＥＴパルスがシナプス可塑性規則を実施するために用いられる。

例えば、ＮＶＭデバイス２１０のアナログ・コンダクタンス調節のための典型的なプログラミング戦略は、目標アナログ・コンダクタンス値に到達するために、（パルス期間も潜在的に増加しつつ）コンプライアンス電流が安定的に増加するＳＥＴパルスを反復して印加することである。しかしながら、技術的な課題は、この技術と共に存在する。例えば、ある電流閾値に到達した後、ＮＶＭデバイス２１０のサブセットが、印加されたパルスの間、部分的にＲＥＳＥＴを得ることがあり、それによって、コンダクタンスが増加ではなく減少される。電流閾値は、ＰＣＭデバイス毎に異なり、よって、ＮＶＭデバイス２１０の数が増加するにつれてクロスバー・アレイに対する制御が困難である。

本発明の１つまたは複数の実施形態は、プログラミング技術を用いることによってそのような技術的課題に対処する。本発明の１つまたは複数の実施形態は、目標コンダクタンスに到達するために、（パルス期間も潜在的に増加しつつ）コンプライアンス電流が減少するＲＥＳＥＴパルスを反復して印加する戦略を用いる。コンプライアンス電流が、ＲＥＳＥＴのための電流閾値よりも降下するとき、パルスは、ＳＥＴパルスになるが、ＰＣＭコンダクタンス値は、プログラミング条件がもう有効でなくなっても最高コンダクタンス値またはその付近にとどまる。さらに、低コンダクタンス値における精密度は、実験によって述べるような既存技術と比較して実質的に改善される。本発明の１つまたは複数の実施形態を用いて実証されるプログラミング技術は、行毎のプログラミング方式と互換性があり、有限数のサイクルで完結され得る。プログラミング結果は、アレイ内のデバイス間可変性に耐性がある。さらに、本明細書で説明される技術は、重み毎に２つのビット、１つの関与ビットおよび１つの符号ビットだけを用いることによって、物理的実施態様に関連付けられた回路領域および電力コストを最小化する。本発明の１つまたは複数の実施形態の他の利点および実際の用途は、本明細書の説明から明らかとなるであろう。

本発明の１つまたは複数の実施形態は、可変性の存在下でＰＣＭデバイスのクロスバー・アレイにおいて所望のアナログ・コンダクタンス値を達成する、反復プログラミング・シーケンスを用いることによって、既存技術での技術的課題に対処する。プログラミング・シーケンスは、反復型であるが、制限された数のプログラミング・ステップを用いて、コンダクタンス値を目標アナログ・コンダクタンスからの所望の範囲内に持ってくる。

プログラミング・シーケンスは、全てのＮＶＭデバイスをソフト・リセット状態で初期化することで開始し、次いで、最初にリセット・パルス長をあるコンプライアンス電流において調節することによって反復してプログラミングし、次いで、ＮＶＭコンダクタンスが目標範囲内にあるまで、コンプライアンス電流を段階的に減少させる。コンプライアンス電流およびパルス期間などの正確なプログラミング・パラメータは、クロスバー・アレイに依存する。本発明の１つまたは複数の実施形態は、クロスバー・アレイ特徴を通してこれらのプログラミング・パラメータを判断する方法を容易にする。クロスバー・アレイにおけるプログラミングされた重みが、ＤＮＮについての、例えば前向き推論についての、合理的性能を達成するために示される。ＤＮＮにおいて１つの重みを表すためのコンダクタンスの複数のペアの使用は、プログラミングの精度も改善する。

図５は、本発明の１つまたは複数の実施形態による、相変化メモリ・デバイスに重みをマッピングすることについての概要を示す。クロスバー・アレイ２００からのＮＶＭ隣接デバイス２１０のセットは、「コンダクタンス・ユニット」５１０を形成するように構成される。コンダクタンス・ユニット５１０は、ＤＮＮ１００からの重み値を表すために用いられる。図５の示された例において、２つのペア（即ち、クロスバー・アレイ２００からの４つのＰＣＭデバイス２１０）が、コンダクタンス・ユニット５１０内の４つのＰＣＭデバイス２１０のコンダクタンス値をプログラムすることによって、重みにマッピングされる。重み合計（コンダクタンス、例えばμＳにおける）は、４つのＰＣＭコンダクタンス値の重み付けされた合計であり、それは、Ｆの重要度係数を有するコンダクタンス値の上位ペア（ＭＳＰ）５１２および下位ペア（ＬＳＰ）５１４に分割される。したがって、コンダクタンス・ユニット５１０に関連付けられた重みは、ＰＣＭデバイス２１０の２つのペアを含み、Ｗ＝Ｆ（Ｇ^＋－Ｇ^－）＋ｇ^＋－ｇ^－によって表され得る。（Ｇ＋、Ｇ－）は、ＭＳＰ５１２におけるＰＣＭデバイス２１０のコンダクタンス値であり、（ｇ＋、ｇ－）は、ＬＳＰ５１４におけるＰＣＭデバイス２１０のコンダクタンス値である。＋および－符号は、開始時にＰＣＭデバイス２１０に割り当てられる。ＭＳＰ／ＬＳＰの一部としてＰＣＭデバイス２１０を指定すること、およびさらにＰＣＭデバイス２１０に符号を割り当てることは、クロスバー・アレイ２００内の各ＰＣＭデバイス２１０に「役割」を割り当てることの一部であり得る。重要度係数Ｆは、所定の値であり、クロスバー・アレイ内のＰＣＭデバイス２１０の各列に関連付けられた異なる値であってもよい。

コンダクタンス・ユニットにおける重みは、次いでスケーリング係数αを用いてＤＮＮ１００のソフトウェア重み５２０にマッピングされる。例えば、ソフトウェア重みは、不揮発性メモリ・デバイス２１０によってサポートされる動的範囲にスケールされなければならない場合がある。動的範囲は、ＮＶＭデバイス２１０が、それが保持し得るデバイス・コンダクタンスの範囲に基づいて寄与し得る電流値の範囲を示している。区別可能な電流値のセットは、アナログ・メモリ・デバイスの有効ビット分解能を表す。動的範囲は、重み／コンダクタンスの目標セットにおいて発生する重みまたはコンダクタンスの最大値および最小値を反映する。有効ビット分解能は、読み出しおよび書き込みノイズなどのデバイス特徴によって判断される。コンダクタンスの動的範囲は、各アナログ・メモリ・デバイスのＦ係数およびコンダクタンス範囲に依存し、一方、ソフトウェア重みの動的範囲は、ソフトウェア訓練手続（例えば、ハイパーパラメータ、オプティマイザなど）に依存する。動的範囲は、プログラムされるべき事前訓練された重みの所与の数値範囲であってもよい。

重要度係数Ｆおよびスケーリング係数αは、「プログラミング不備の確率（Ｐｆａｉｌ）」と本明細書で呼ばれる設定可能な値を用いて最適化される。目標重みが低コンダクタンス範囲にマッピングされるとき、ＰＣＭデバイス２１０のコンダクタンス応答は粗い。一方、目標重みが高コンダクタンス範囲にマッピングされるとき、ＰＣＭデバイス２１０のコンダクタンス範囲が制限されることに起因して、Ｐｆａｉｌが増加する。高いＦは、ＭＳＰ５１２とＬＳＰ５１４との間の不均衡を表し、それは、クロスバー・アレイ内のＰＣＭデバイス２１０にわたる重み収束に悪影響を及ぼし得る。低いＦ（例えば、Ｆ＜１）は、ＭＳＰ５１２およびＬＳＰ５１４の役割を実際上逆にし、また、より高いＰｆａｉｌをもたらす。本発明の１つまたは複数の実施形態において、Ｐｆａｉｌは、目標コンダクタンス範囲内にない重みの数をカウントすることによって動的に計算される。

本発明の１つまたは複数の実施形態によれば、コンダクタンス・ユニット５１０は、コンダクタンス値の後続の更新のためのコンダクタンス・ユニット５１０の選択を示すために用いられる選択／関与フラグ５１６をさらに含む。例えば、選択フラグ５１６はビットであってもよく、ビットが１（または０）であることは、コンダクタンス・ユニット５１０が後続の反復において更新されることを示し得る。この場合、選択フラグ５１６を０（または１）にマークすることは、コンダクタンス・ユニット５１０を後続の反復において更新されることとなるコンダクタンス・ユニットのセットから除去することを示し得る。選択フラグ５１６は、ビットを用いる以外の任意の他のやり方で実施され得ると理解されたい。

図６は、本発明の１つまたは複数の実施形態による、所望の重みをコンダクタンス・ユニットにマッピングすることの可視化を示す。マッピングは、４つのフェーズ（６０２、６０４、６０６、および６０８）にわたって実行され、各フェーズにおいて、コンダクタンス・ユニット５１０からの４つのＰＣＭデバイス２１０のうちの１つのコンダクタンスが調整される。調整は、コンダクタンス・ユニット５１０について構成されるべき所望の重み（Ｗ_Ｄ）と、コンダクタンス・ユニット５１０の実際の重みＷとの間の誤差を減少させるために、閉ループ・プログラミングを用いて実行される。誤差＝Ｗ－Ｗ_Ｄである。代替的には、誤差は、Ｗ_Ｄ－Ｗ、またはその減算の絶対値として計算され得る。誤差閾値６２０は、調整されているコンダクタンス値が十分であるかどうか、またはコンダクタンス値に対するさらなる調整が必要であるかどうかをチェックするために用いられる。閉ループ・プログラミングは、計算された誤差が、所定の誤差閾値６２０の範囲内にあることを保証するために実行され、条件が満たされるまでコンダクタンス値が調整される。

閉ループ・プログラミングは、パルス幅変調およびコンプライアンス電流変調を含む。本発明の１つまたは複数の実施形態において、パルス幅変調が、目標とされている所定の閾値未満かつ所定の閾値より大きい、コンダクタンス・ユニット５１０を考慮するために用いられる。コンダクタンス・ユニット５１０が、所望の重みの所定の閾値６２０（例えば、±０．２５ｕＳ）の実質的な範囲内の重みを有する時点で、コンダクタンス・ユニット５１０は、後続の反復において調整されなければならないコンダクタンス・ユニットのセットから除去される。本発明の１つまたは複数の実施形態によれば、コンプライアンス電流は、それが所望の目標コンダクタンス付近に到達するまで段階的にＰＣＭコンダクタンスを増大させるために、ハードＲＥＳＥＴから部分的ＲＥＳＥＴを通して部分的ＳＥＴへ、ＰＣＭデバイス５１０をリセットするために降下される。ここで、「所望の目標コンダクタンス付近」は、コンダクタンス・ユニット５１０の重み（Ｗ）が目標重み（Ｗ_Ｄ）から閾値６２０の範囲内にあることを示す。

本発明の１つまたは複数の実施形態において、正の重みは、Ｗ＝ＦＧ^＋＋ｇ^＋を用いてマッピングされ、負の重みＧ^－およびｇ^－は、リセット状態で保持される。さらに、負の重みは、負の重みについて反対のやり方でマッピングされる。さらに、Ｇ^＋が、最初にプログラムされ、次いで、残余誤差が、ｇ^＋またはｇ^－を用いて補正される。Ｇ^＋（またはＧ^－）に対するそのようなプログラム動作は、Ｇ^－（またはＧ^＋）をリセット状態のままにして、対称ノイズ分布につながる。Ｇについてのプログラミング誤差は、Ｆ係数（例えば、Ｆ＝３）によって乗算される。

図７は、本発明の１つまたは複数の実施形態による、減少する電流掃引の例を示す。図示されたプロット７００は、各コンダクタンス・ユニット５１０が所定の期間（即ちパルス幅）、例えばｔ_ｐ＝２４ｎｓの間に減少する値（大きさ）のコンプライアンス電流を受信する場合に初期パルス・シーケンスとして実行される、減少する電流掃引を示す。各コンダクタンス・ユニット５１０によって受信されるコンプライアンス電流値は、均一目標、例えば２μＳに基づく。コンダクタンス・ユニット５１０について予め定められたパルス幅および均一目標は、他の実施形態では異なり得る。コンプライアンス電流値は、クロスバー・アレイ２００に基づく所定の値であってもよい。

コンプライアンス電流掃引のそのような第１のシーケンスの後、各コンダクタンス・ユニット５１０における誤差は、コンダクタンス・ユニット５１０のどれがそれらの目標重みに到達するかを判断するために計算される。計算された誤差に基づいて、あるコンダクタンス・ユニット５１０のみ、即ち、ＰＣＭデバイス２１０のあるグループが、後続のパルス掃引に関与するために選択される。「目標信頼性」の範囲内にうまく入るＰＣＭデバイス２１０は、後続パルスを受信するＰＣＭデバイス２１０のグループにおいて選択されない（グループから除去される）。ここで、「目標信頼性」の範囲は、前のプログラミング・パルスへのコンダクタンス応答およびコンダクタンス・ユニット５１０に基づく。同様に、目標重みと実際の重みとの間の誤差が、所定の閾値６２０の範囲内にあるときに、そのようなコンダクタンス・ユニットにおけるＰＣＭデバイスは、目標信頼性の範囲にあるとしてマークされる。さらに、様々な一定期間のパルスの複数のシーケンス（それぞれが高電流値から低電流値への完全掃引から構成される）が、選択されたコンダクタンス・ユニット５１０に印加される。

図８は、本発明の１つまたは複数の実施形態による、コンダクタンス・ユニットに送信されるパルス・シーケンスを示す。プロット８００において示されるように、所定の均一目標についての初期コンプライアンス電流掃引７００は、一定パルス期間において電流掃引が減少して完結する。初期電流掃引７００の後のコンダクタンス・ユニット５１０の目標信頼性範囲に基づいて、追加パルス・シーケンス８１０は、可変パルス幅で送信される。各パルス・シーケンス８１０のパルス幅は、そのパルス・シーケンスを受信するコンダクタンス・ユニット５１０における誤差に依存する。

可変幅パルス・シーケンス８１０の各セットの後、目標信頼性範囲内のコンダクタンス・ユニット５１０の選択は、コンダクタンス・ユニット５１０のそれぞれにおける誤差に基づいて実行される。目標信頼性範囲内にまだない、それらのコンダクタンス・ユニット５１０について、プロセスは、追加の可変幅パルス・シーケンス８１０を送信すること、および対応する誤差をチェックすることによって反復される。

クロスバー・アレイ２００におけるコンダクタンス・ユニット５１０をこの方式でプログラムすることによって、クロスバー・アレイ２００におけるデバイス可変性にもかかわらず、正確なコンダクタンス・プログラミングが達成される。さらに、１つまたは複数のコンダクタンス・ペアを用いて各重みを表す重みプログラミングは、単一デバイスからのコンダクタンス・プログラミング・ノイズと比較して低いノイズを示す。また、４つのＰＣＭデバイス２１０（ＰＣＭの２つのペア）に重みをマッピングすることは、本発明の１つまたは複数の実施形態において重み誤差を著しく減少させる。しかしながら、重みは、本発明の他の実施形態においてコンダクタンス・ユニット５１０として構成される異なる数のＰＣＭデバイス２１０にマッピングされ得ることに留意されたい。実行される様々な実験は、ソフトウェア等価精度が、本発明の１つまたは複数の実施形態における重みマッピングおよびプログラミング技術を用いて、ＤＮＮ、例えば、長短期記憶ネットワークについて達成されることを実証している。

図９は、本発明の１つまたは複数の実施形態による、クロスバー・アレイを用いて実施されるアナログ・シナプスへのニューラル・ネットワーク重みをプログラミングする方法のフローチャートを示す。この場合のシナプスは、コンダクタンス・ユニット５１０であり、クロスバー・アレイ２００内のＰＣＭデバイス２１０などの不揮発性メモリ・デバイスの１つまたは複数のペアである。方法は、９１０において、予期される読み出し電流を表す目標重み値のセットにニューラル・ネットワーク重みをマッピングすることを含む。マッピングは、シナプスにおいてどの電流値がどの重み値を表すかをＰＣＭデバイス２１０の動的範囲に基づいて較正することを含み得る。

方法は、９２０において、役割のセットのうちの１つに各アナログ・シナプス５１０内の各ＰＣＭデバイス２１０を割り当てることをさらに含み、各役割は、アナログ重要度および符号の両方によって一意に識別される。役割を設定することは、１つまたは複数のＰＣＭデバイス２１０のグループをコンダクタンス・ユニット５１０の一部として構成することを含み、コンダクタンス・ユニット５１０のコンダクタンスが、アナログ・シナプスの重み値を表す。言い換えると、コンダクタンス・ユニット５１０は、ＤＮＮ１００からのアナログ・シナプスを表す。さらに、役割を設定することは、ＭＳＰ５１２またはＬＳＰ５１４のいずれかの一部としてＰＣＭデバイス２１０とそれらのいずれかの位置とを関連付けることを含み得る。位置は、符号フラグ（例えば、ビット）を用いて設定され得る。符号フラグは、コンダクタンス・ユニット５１０におけるＰＣＭデバイス２１０が重み更新／プログラミングの間更新される順序を示す。

方法は、９３０において、シナプスを重みでプログラミングすることをさらに含む。シナプスをプログラミングすることは、９３２において、各行、列、またはアナログ・シナプスのクロスバー・アレイ２００の他のアドレス可能なサブセットから、ＰＣＭデバイス２１０のセットの対応するサブセットを表す目標重み値のベクトルを抽出することを含む。さらに、方法は、９３４において、その目標重み値の符号に対応する目標符号ビットをＰＣＭデバイス２１０のそれぞれに割り当てることを含む。さらに、方法は、９３６において、ペアのどのメンバがプログラムされるべきかの順序を識別する符号ビットを用いて、ＭＳＰ５１２からＬＳＰ５１４へ、アナログ・シナプスのベクトル内の各ＰＣＭデバイス２１０を反復してプログラムすることを含む。例えば、正（＋）のＰＣＭデバイス２１０は、本発明の１つまたは複数の実施形態において最初にプログラムされる。他の実施形態では、負（－）が割り当てられたＰＣＭデバイス２１０が、最初にプログラムされる。

さらに、９３８において、アクティブ・パルス期間を表すパルス期間のセットのそれぞれについて、関与ビットのベクトルが割り当てられ、各関与ビットが上記目標重みベクトル内のＰＣＭデバイス２１０のうちの１つに対応し、関与ビットは、各シナプス内でプログラムされているコンダクタンスの役割の追加プログラミングを必要とする、任意のシナプスについてアクティブ化される。関与ビットは、コンダクタンス値が１つまたは複数のパルス・シーケンスを用いてさらに調整されなければならないことを示す。

方法は、９４０において、シナプスのアクティブ・ベクトル内のアクティブ化された関与ビットを用いて、コンダクタンス・ユニット内の全てのＰＣＭデバイスにコンダクタンス・プログラミング・パルスを反復適用することをさらに含む。１つまたは複数の例において、パルス・シーケンスは、より高いプログラミング電流から開始すること、およびより低いプログラミング電流に向かって進むこと（減少すること）が適用される。各反復において、方法は、９４２において、アクティブ・シナプスのベクトルの各メンバの合計有効重みを測定することと、それを関連する目標重み値と比較することと、を含む。９４２において、比較に基づいて、アクティブ・シナプスについての関与ビットがクリアされる。ビットは、測定された重み値が関連する目標重み値に到達した、即ち、誤差が所定の閾値６２０よりも少ない（か、または等しい）シナプスについて、クリアされる。

上記プログラミング・ステップは、プログラミング・パルス・シーケンスを用いて繰り返されるが、（ｉ）９４４において、プログラムが不十分であったコンダクタンス値に対処するためのより長いパルス、および（ｉｉ）９４６において、過度にプログラムされたコンダクタンス値に対処するためのより短いパルスを用いて繰り返される。ここで、プログラムが不十分であることは、所望のコンダクタンスが実際のコンダクタンスよりも大きいことを示し、過度にプログラムされていることは、所望のコンダクタンスがＰＣＭデバイス２１０における実際のコンダクタンスよりも小さいことを示す。

プログラミングは、９５０において、クロスバー・アレイ２００にわたってより高い重要度からより低い重要度の順に、全てのコンダクタンスの役割が処理されるまで、繰り返される。

クロスバー・アレイ２００における不揮発性メモリ・デバイス２１０は、相変化メモリ（ＰＣＭ）・デバイス、抵抗変化型メモリ（ＲＲＡＭ）などのうちのいずれか１つであってもよい。

したがって、本発明の１つまたは複数の実施形態は、可変性の存在下でＰＣＭデバイスなどのＮＶＭデバイスのクロスバー・アレイにおいて所望のアナログ・コンダクタンス値を達成する、反復プログラミング・シーケンスを提供する。提供されるプログラミング・シーケンスは、反復型であり、制限された数のプログラミング・ステップを用いて、コンダクタンス値を目標アナログ・コンダクタンスからの所望の範囲内に持ってくる。詳細に説明されたように、プログラミング・シーケンスは、全てのＰＣＭデバイスをソフト・リセット状態で初期化することで開始し、次いで、最初にリセット・パルス長をあるコンプライアンス電流において調節することによって反復してプログラミングし、その後、ＰＣＭコンダクタンスが目標範囲内にあるまで、コンプライアンス電流を段階的に減少させる。コンプライアンス電流およびパルス期間などの正確なプログラミング・パラメータは、クロスバー・アレイに依存し、設定可能な所定のパラメータであってもよい。クロスバー・アレイにおいてプログラムされた重みは、前向き推論などについて、ＤＮＮを実施するために用いられ得る。

本発明の１つまたは複数の実施形態によれば、コンダクタンスの複数のペアが、プログラミング精度を改善するための、ＤＮＮにおける１つの重みを表すために用いられる。

本発明は、任意の可能な統合の技術的詳細レベルにおけるシステム、方法、またはコンピュータ・プログラム製品、あるいはそれらの組み合わせであってもよい。コンピュータ・プログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令をその上に有するコンピュータ可読記憶媒体（または複数の媒体）を含み得る。

コンピュータ可読記憶媒体は、命令実行デバイスにより使用するための命令を保持し、記憶し得る有形デバイスであり得る。コンピュータ可読記憶媒体は、例えば、電子記憶デバイス、磁気記憶デバイス、光学記憶デバイス、電磁気記憶デバイス、半導体記憶デバイス、または前述したものの任意の適当な組み合わせであってもよいが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例の非網羅的リストは、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、消去可能プログラマブル読み取り専用メモリ（ＥＰＲＯＭまたはフラッシュ・メモリ）、静的ランダム・アクセス・メモリ（ＳＲＡＭ）、ポータブル・コンパクト・ディスク読み取り専用メモリ（ＣＤ－ＲＯＭ）、デジタル多用途ディスク（ＤＶＤ）、メモリ・スティック、フロッピー（Ｒ）・ディスク、パンチカードまたは命令をその上に記録させる溝内の隆起構造などの機械的に符号化されたデバイス、および前述したものの任意の適当な組み合わせを含む。本明細書で用いられるコンピュータ可読記憶媒体は、本来、電波もしくは他の自由伝播する電磁波、導波管もしくは他の送信媒体を通って伝播する電磁波（例えば、光ファイバ・ケーブルを通過する光パルス）、または電線を通って送信される電気信号などの、一過性信号であると解釈されるべきではない。

本明細書で説明されるコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体からそれぞれのコンピューティング／処理デバイスに、あるいはネットワーク、例えば、インターネット、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク、もしくはワイヤレス・ネットワーク、またはその組み合わせを介して外部コンピュータまたは外部ストレージ・デバイスに、ダウンロードされ得る。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、またはエッジ・サーバ、あるいはそれらの組み合わせを含み得る。各コンピューティング／処理デバイス内のネットワーク・アダプタ・カードまたはネットワーク・インターフェースは、コンピュータ可読プログラム命令をネットワークから受信し、それぞれのコンピューティング／処理デバイス内のコンピュータ可読記憶媒体の記憶用にコンピュータ可読プログラム命令を転送する。

本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セット・アーキテクチャ（ＩＳＡ）命令、機械命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路用の構成データ、またはＳｍａｌｌｔａｌｋ（Ｒ）、Ｃ＋＋などのオブジェクト指向プログラム言語、および「Ｃ」プログラミング言語もしくは類似のプログラミング言語などの手続き型プログラミング言語を含む、１つもしくは複数のプログラミング言語の任意の組み合わせで書かれたソース・コードもしくはオブジェクト・コードのいずれかであってもよい。コンピュータ可読プログラム命令は、ユーザのコンピュータ上で完全に、ユーザのコンピュータ上で部分的に、スタンドアロン・ソフトウェア・パッケージとして、ユーザのコンピュータ上で部分的にかつリモート・コンピュータ上で部分的に、またはリモート・コンピュータもしくはサーバ上で完全に、実行してもよい。後者のシナリオでは、リモート・コンピュータは、ローカル・エリア・ネットワーク（ＬＡＮ）またはワイド・エリア・ネットワーク（ＷＡＮ）を含む任意の種類のネットワークを通して、ユーザのコンピュータに接続されてもよい。あるいは、接続は、（例えば、インターネット・サービス・プロバイダを使用してインターネットを通して）外部コンピュータに対して行われてもよい。いくつかの実施形態では、例えば、プログラマブル・ロジック回路、フィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡ）、またはプログラマブル・ロジック・アレイ（ＰＬＡ）を含む電子回路は、本発明の態様を実行するために、コンピュータ可読プログラム命令の状態情報を利用して電子回路を個別化することによって、コンピュータ可読プログラム命令を実行し得る。

本発明の態様は、発明の実施形態による、方法、装置（システム）、およびコンピュータ・プログラム製品のフローチャート図またはブロック図あるいはその両方を参照して、本明細書において説明される。フローチャート図またはブロック図あるいはその両方の各ブロック、ならびにフローチャート図またはブロック図あるいはその両方のブロックの組み合わせが、コンピュータ可読プログラム命令によって実施され得ると理解されたい。

コンピュータまたは他のプログラマブル・データ処理装置のプロセッサによって実行する命令が、フローチャートまたはブロック図あるいはその両方の１つまたは複数のブロックにおいて指定される機能／動作を実施する手段を作成するように、これらのコンピュータ可読プログラム命令は、汎用コンピュータ、専用コンピュータ、または機械を製造するための他のプログラマブル・データ処理装置のプロセッサに提供されてもよい。コンピュータ可読記憶媒体に記憶される命令を有するコンピュータ可読記憶媒体が、フローチャートまたはブロック図あるいはその両方の１つまたは複数のブロックにおいて指定される機能／動作の態様を実施する命令を含む製品を含むように、これらのコンピュータ可読プログラム命令は、また、コンピュータ、プログラマブル・データ処理装置、または他のデバイス、あるいはそれらの組み合わせに特定の方式で機能するように指示し得る、コンピュータ可読記憶媒体に記憶されてもよい。

コンピュータ、他のプログラマブル装置、または他のデバイス上で実行する命令が、フローチャートまたはブロック図あるいはその両方の１つまたは複数のブロックにおいて指定される機能／動作を実施するように、コンピュータ可読プログラム命令は、また、コンピュータ実施プロセスを作り出すために、コンピュータ、他のプログラマブル装置、または他のデバイス上で一連の動作ステップを実行させるコンピュータ、他のプログラマブル・データ処理装置、または他のデバイス上にロードされてもよい。

図面中のフローチャートおよびブロック図は、本発明の様々な実施形態によるシステム、方法、およびコンピュータ・プログラム製品の考えられる実施態様のアーキテクチャ、機能性、および動作を例示する。この点に関して、フローチャートまたはブロック図内の各ブロックは、指定された論理機能を実施するための１つまたは複数の実行可能命令を含む、モジュール、セグメント、または命令の一部を表し得る。いくつかの代替的実施態様において、ブロック内に記載された機能は、図面中に記載された順序以外で発生してもよい。例えば、連続して示される２つのブロックが、実際には、実質的に同時に実行されてもよく、または、ブロックが、関係する機能性次第で逆の順序で実行されることがあってもよい。ブロック図またはフローチャート図あるいはその両方の各ブロック、およびブロック図またはフローチャート図あるいはその両方におけるブロックの組み合わせが、指定された機能もしくは動作を実行し、または専用ハードウェアおよびコンピュータ命令の組み合わせを実行する専用ハードウェアベース・システムによって実施され得ることにも留意されたい。

本発明の様々な実施形態の説明は、例示の目的で提示されているが、網羅的であること、または開示された実施形態に限定することを意図したものではない。多くの修正および変形が、説明される実施形態の範囲から逸脱することなく当業者に明らかであろう。本明細書で使用される用語は、実施形態の原理、実際の用途、もしくは市場で発見される技術を超える技術的改善を最もよく説明するため、または他の当業者が本明細書で説明された実施形態を理解することを可能にするために、選択された。

本発明の例において、クロスバー・アレイ内の複数の相変化メモリ・デバイスから、相変化メモリ・デバイスの２つのペアをコンダクタンス・ユニットとして構成することであって、複数のコンダクタンス・ユニットが、人工ニューラル・ネットワークにおける複数のアナログ・シナプスを表す、構成することと、クロスバー・アレイ内の複数のアナログ・シナプスにパルス・シーケンスを送信することであって、アナログ・シナプスの重み値が、コンダクタンス・ユニットのコンダクタンス値に基づき、パルス・シーケンスがコンダクタンス・ユニットのコンダクタンス値を変更する、送信することと、アナログ・シナプスのセットに変動期間の電気パルスのセットを送信することによって、選択されるアナログ・シナプスのセットからのアナログ・シナプスのそれぞれの重み値を更新することであって、電気パルスのセットが、アナログ・シナプスのセットに対応するコンダクタンス・ユニットのコンダクタンス値を変更し、クロスバー・アレイからのアナログ・シナプスのセットが、複数のアナログ・シナプスの重み値をアナログ・シナプスに関連付けられた目標重み値と比較することに基づいて選択される、更新することと、を含む、コンピュータ実施方法が提供される。

本発明の別の例において、複数の相変化メモリ・デバイスであって、相変化メモリ・デバイスのうちの１つが、クロスバー・アレイ内の複数のクロスポイントのそれぞれに位置し、４つの相変化メモリ・デバイスの全てのセットがコンダクタンス・ユニットを形成し、複数のコンダクタンス・ユニットが、人工ニューラル・ネットワークにおける複数のアナログ・シナプスを表す、複数の相変化メモリ・デバイスと、クロスバー・アレイ内の複数のアナログ・シナプスに対するパルス・シーケンスを受信することであって、アナログ・シナプスの重み値が、コンダクタンス・ユニットのコンダクタンス値に基づき、パルス・シーケンスがコンダクタンス・ユニットのコンダクタンス値を変更する、受信すること、およびアナログ・シナプスのセットに対する変動期間の電気パルスのセットを受信することによって選択されるアナログ・シナプスのセットからのアナログ・シナプスのそれぞれの重み値を更新することであって、電気パルスのセットが、アナログ・シナプスのセットに対応するコンダクタンス・ユニットのコンダクタンス値を変更し、クロスバー・アレイからのアナログ・シナプスのセットが、複数のアナログ・シナプスの重み値をアナログ・シナプスに関連付けられた目標重み値と比較することに基づいて選択される、更新することを含む方法を実行することによって、相変化メモリ・デバイスのコンダクタンス値をプログラムするように構成される電気回路と、を含む、クロスバー・アレイが提供される。

Claims

コンピュータ実施方法であって、
人工ニューラル・ネットワークを実施するクロスバー・アレイ内の複数のアナログ・シナプスに関連付けられた初期重み値を、前記複数のアナログ・シナプスにパルス・シーケンスを送信することによって更新することであって、前記アナログ・シナプスのそれぞれがコンダクタンス・ユニットを含み、前記アナログ・シナプスの更新された重み値が、前記コンダクタンス・ユニットのコンダクタンス値に基づき、前記パルス・シーケンスが、前記コンダクタンス・ユニットの前記コンダクタンス値を変更する、前記更新することと、
前記複数のアナログ・シナプスの前記更新された重み値を前記アナログ・シナプスに関連付けられた目標重み値と比較することと、
前記比較に基づいて前記クロスバー・アレイからアナログ・シナプスのセットを選択することであって、前記選択が、前記アナログ・シナプスに関連付けられた選択フラグを用いて示される、前記選択することと、
選択される前記アナログ・シナプスのセットからの前記アナログ・シナプスのそれぞれの前記重み値を、変動期間の電気パルスのセットを前記アナログ・シナプスのセットに送信することによって更新することであって、前記電気パルスのセットが、前記アナログ・シナプスのセットに対応する前記コンダクタンス・ユニットの前記コンダクタンス値を変更する、前記更新することと、
を含む、方法。
前記複数のアナログ・シナプスに送信される前記パルス・シーケンスが、所定の期間のものであり、均一重みパルス・シーケンスが、振幅が減少する複数の電流パルスを含む、請求項１に記載の方法。
前記コンダクタンス・ユニットが、複数の不揮発性メモリ・デバイスを含む、請求項１に記載の方法。
前記アナログ・シナプスに関連付けられた重み値が、前記複数の不揮発性メモリ・デバイスのそれぞれのコンダクタンス値に基づいて計算される、請求項３に記載の方法。
前記不揮発性メモリ・デバイスが、相変化メモリ・デバイスである、請求項４に記載の方法。
前記不揮発性メモリ・デバイスが、抵抗変化型メモリ・デバイスである、請求項４に記載の方法。
前記複数の不揮発性メモリ・デバイスが、上位ペア（ＭＳＰ）および下位ペア（ＬＳＰ）を形成するように構成される、４つの不揮発性メモリ・デバイスを含む、請求項４に記載の方法。
前記アナログ・シナプスの重み値が、Ｗ＝Ｆｘ（Ｇ^＋－Ｇ^－）＋ｇ^＋－ｇ^－として計算され、Ｆが、スケール係数であり、Ｇ^＋およびＧ^－が、前記ＭＳＰのコンダクタンス値であり、ｇ^＋およびｇ^－が、前記ＬＳＰのコンダクタンス値である、請求項７に記載の方法。
コンダクタンス・ユニットの前記コンダクタンス値を変更することが、前記コンダクタンス値を更新するための所定の順序に従って、前記コンダクタンス・ユニットからの前記不揮発性メモリ・デバイスのそれぞれのコンダクタンス値を変更することを含む、請求項７に記載の方法。
前記所定の順序に従って、前記ＭＳＰのうちの前記不揮発性メモリ・デバイスの前記コンダクタンス値が、最初に更新される、請求項９に記載の方法。
前記所定の順序にさらに従って、前記ＭＳＰのうちの前記不揮発性メモリ・デバイスの前記コンダクタンス値が、前記不揮発性メモリ・デバイスに関連付けられた符号フラグに従って更新される、請求項１０に記載の方法。
前記アナログ・シナプスのセットを選択することが、重み値と目標値との間の差が所定の閾値よりも大きい、前記アナログ・シナプスのセットを選択することを含む、請求項１に記載の方法。
前記アナログ・シナプスのセットから第１のアナログ・シナプスを除去することをさらに含み、前記第１のアナログ・シナプスについての前記重み値と前記目標重み値との差が、所定の閾値範囲内である、請求項１に記載の方法。
前記第１のアナログ・シナプスが、前記第１のアナログ・シナプスの前記重み値が前記変動期間の電気パルスのセットによって更新されることに応答して、前記アナログ・シナプスのセットから除去される、請求項１３に記載の方法。
前記変動期間の電気パルスのセットが、第１のアナログ・シナプスのための第１の電気パルスを含み、前記第１の電気パルスが、前記第１のアナログ・シナプスの前記重み値と前記目標重み値との間の第１の差に基づく、請求項１に記載の方法。
システムであって、
プロセッサと、
１つまたは複数のクロスバー・アレイを含むコプロセッサと、を備え、
前記プロセッサが、クロスバー・アレイを有する人工ニューラル・ネットワークの層をマッピングすることによって前記コプロセッサを用いて前記人工ニューラル・ネットワークを実施するように構成され、前記人工ニューラル・ネットワークを実施することが、
人工ニューラル・ネットワークを実施するクロスバー・アレイ内の複数のアナログ・シナプスに関連付けられた初期重み値を、前記複数のアナログ・シナプスにパルス・シーケンスを送信することによって更新することであって、前記アナログ・シナプスのそれぞれがコンダクタンス・ユニットを含み、前記アナログ・シナプスの更新された重み値が、前記コンダクタンス・ユニットのコンダクタンス値に基づき、前記パルス・シーケンスが、前記コンダクタンス・ユニットの前記コンダクタンス値を変更する、前記更新することと、
前記複数のアナログ・シナプスの前記更新された重み値を前記アナログ・シナプスに関連付けられた目標重み値と比較することと、
前記比較に基づいて前記クロスバー・アレイからアナログ・シナプスのセットを選択することであって、前記選択が、前記アナログ・シナプスに関連付けられた選択フラグを用いて示される、前記選択することと、
選択される前記アナログ・シナプスのセットからの前記アナログ・シナプスのそれぞれの前記重み値を、変動期間の電気パルスのセットを前記アナログ・シナプスのセットに送信することによって更新することであって、前記電気パルスのセットが、前記アナログ・シナプスのセットに対応する前記コンダクタンス・ユニットの前記コンダクタンス値を変更する、前記更新することと、
を含む方法を含む、システム。
前記コンダクタンス・ユニットが、複数の不揮発性メモリ・デバイスを含む、請求項１６に記載のシステム。
前記アナログ・シナプスに関連付けられた重み値が、前記複数の不揮発性メモリ・デバイスのそれぞれのコンダクタンス値に基づいて計算される、請求項１７に記載のシステム。
前記複数の不揮発性メモリ・デバイスが、上位ペア（ＭＳＰ）および下位ペア（ＬＳＰ）を形成するように構成される、４つの不揮発性メモリ・デバイスを含み、前記アナログ・シナプスの重み値が、Ｗ＝Ｆｘ（Ｇ^＋－Ｇ^－）＋ｇ^＋－ｇ^－として計算され、Ｆが、スケール係数であり、Ｇ^＋およびＧ^－が、前記ＭＳＰのコンダクタンス値であり、ｇ^＋およびｇ^－が、前記ＬＳＰのコンダクタンス値である、請求項１８に記載のシステム。
具現化されるプログラム命令を有するコンピュータ可読記憶媒体を含むコンピュータ・プログラム製品であって、前記プログラム命令が、クロスバー・アレイを有する人工ニューラル・ネットワークの層をマッピングすることによって前記人工ニューラル・ネットワークを実施する方法を実行するように、処理回路によって実行可能であり、前記人工ニューラル・ネットワークを実施することが、
前記クロスバー・アレイ内の複数のアナログ・シナプスに関連付けられた重み値を、前記クロスバー・アレイ内の前記複数のアナログ・シナプスにパルス・シーケンスを送信することによって更新することであって、各アナログ・シナプスがコンダクタンス・ユニットを含み、前記アナログ・シナプスの重み値が、前記コンダクタンス・ユニットのコンダクタンス値に基づき、前記パルス・シーケンスが、前記コンダクタンス・ユニットの前記コンダクタンス値を変更する、前記更新することと、
前記複数のアナログ・シナプスの前記重み値を前記アナログ・シナプスに関連付けられた目標重み値と比較することと、
前記比較に基づいて前記クロスバー・アレイからアナログ・シナプスのセットを選択することであって、前記選択が、前記アナログ・シナプスに関連付けられた選択フラグを用いて示される、前記選択することと、
選択される前記アナログ・シナプスのセットからの前記各アナログ・シナプスの前記重み値を、変動期間の電気パルスのセットを前記アナログ・シナプスのセットに送信することによって更新することであって、前記電気パルスのセットが、前記アナログ・シナプスのセットに対応する前記コンダクタンス・ユニットの前記コンダクタンス値を変更する、前記更新することと、
を含む、コンピュータ・プログラム製品。
前記コンダクタンス・ユニットが、複数の不揮発性メモリ・デバイスを含む、請求項２０に記載のコンピュータ・プログラム製品。
前記アナログ・シナプスに関連付けられた重み値が、前記複数の不揮発性メモリ・デバイスのそれぞれのコンダクタンス値に基づいて計算される、請求項２１に記載のコンピュータ・プログラム製品。
前記複数の不揮発性メモリ・デバイスが、上位ペア（ＭＳＰ）および下位ペア（ＬＳＰ）を形成するように構成される、４つの不揮発性メモリ・デバイスを含み、前記アナログ・シナプスの重み値が、Ｗ＝Ｆｘ（Ｇ^＋－Ｇ^－）＋ｇ^＋－ｇ^－として計算され、Ｆが、スケール係数であり、Ｇ^＋およびＧ^－が、前記ＭＳＰのコンダクタンス値であり、ｇ^＋およびｇ^－が、前記ＬＳＰのコンダクタンス値である、請求項２２に記載のコンピュータ・プログラム製品。