JP2023545299A

JP2023545299A - ゲート・リカレント・ニューラル・ネットワークのためのゲート・ユニット

Info

Publication number: JP2023545299A
Application number: JP2023522341A
Authority: JP
Inventors: セバスティアン、アブ; ジョーシー、ヴィナイ; レガロ－ブルドー、マニュエル; スタニサヴリェヴィッチ、ミロス
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2020-10-20
Filing date: 2021-10-10
Publication date: 2023-10-27
Also published as: GB202306468D0; US12093802B2; CN116267023A; WO2022084794A1; GB2615911A; DE112021004664T5; US20220121901A1

Abstract

ゲート・リカレント・ニューラル・ネットワーク（ＲＮＮ）のための方法、コンピュータ・プログラム製品、およびコンピュータ・システムが提供される。本方法は、要素プロセッサを設けることと、隠れ状態ベクトルの１つまたは複数の要素のそれぞれのセットのための別個のメモリ・アレイを設けることと、１つまたは複数の要素のセットの計算を可能にする重み行列の列のグループをメモリ・アレイに格納することと、複数の活性化ベクトルの各々に関連付けられた列のグループのうちの１つまたは複数の列のセットを使用して、複数の活性化ベクトルの各々の１つまたは複数の要素を計算することと、要素プロセッサにより、計算された要素に対する要素ごとのゲート演算を実行して、１つまたは複数の要素のセットを得ることとを含むことができる。

Description

本発明は、デジタル・コンピュータ・システムの分野に関し、より詳細には、ゲート・リカレント・ニューラル・ネットワークのためのゲート・ユニットに関する。

ニューラル・ネットワークは、人工知能システムで使用される計算モデルである。ニューラル・ネットワークは、複数の人工ニューロンに基づく。各人工ニューロンは、１つまたは複数の他のニューロンに接続され、リンクは、隣接するニューロンの活性化状態を強化または抑制することができる。様々な認知タスクにおけるニューラル・ネットワークの精度は、ディープ・ニューラル・ネットワークの訓練または推論のためのハードウェア・アクセラレータの設計において大きな関心を集めている。ゲート・リカレント・ニューラル・ネットワーク（ＲＮＮ）、例えば長短期メモリ（ＬＳＴＭ）・ネットワークの訓練または推論において、要素ごとの演算のセットが次元ベクトルで計算される。しかしながら、これらの計算はリソース集約的である場合がある。

例示的な実施形態は、ゲート・リカレント・ニューラル・ネットワーク（ＲＮＮ）のための方法、コンピュータ・プログラム製品、およびコンピュータ・システムを開示している。例示的な実施形態は、要素プロセッサを設けることと、隠れ状態ベクトルの１つまたは複数の要素のそれぞれのセットについて別個のメモリ・アレイを設けることと、１つまたは複数の要素のセットの計算を可能にする重み行列の列のグループをメモリ・アレイに格納することと、複数の活性化ベクトルの各々に関連付けられた列のグループのうちの１つまたは複数の列のセットを使用して、複数の活性化ベクトルの各々の１つまたは複数の要素を計算することと、要素プロセッサにより、計算された要素に対する要素ごとのゲート演算を実行して、１つまたは複数の要素のセットを得ることとを含むことができる。

例として示され、例示的な実施形態をそれのみに限定するものではない、以下の詳細な説明は、添付図面と併せて最もよく理解されよう。

例示的な実施形態による電子システムを示す図である。例示的な実施形態による電子システムを示す図である。例示的な実施形態による電子システムを示す図である。例示的な実施形態による電子システムを示す図である。例示的な実施形態による電子システムを示す図である。例示的な実施形態によるメモリ・アレイを示す図である。例示的な実施形態によるメモリ・アレイを示す図である。例示的な実施形態による計算メモリを示す図である。例示的な実施形態による計算メモリを示す図である。例示的な実施形態による、隠れ状態ベクトルの要素を計算するための方法のフローチャートである。例示的な実施形態によるハードウェア・コンポーネントを示す例示的なブロック図である。例示的な実施形態によるクラウド・コンピューティング環境を示す図である。例示的な実施形態による抽象化モデル層を示す図である。

図面は必ずしも縮尺通りではない。図面は概略図に過ぎず、例示的な実施形態の特定のパラメータを表すことを意図していない。図面は、典型的な例示的実施形態のみを示すことを意図している。図中、同様の番号は同様の要素を示す。

本発明の様々な実施形態の説明は、例示の目的で提示されるが、網羅的であること、または開示される実施形態に限定されることは意図されていない。記載される実施形態の範囲から逸脱することなく、多くの修正および変形が当業者には明らかであろう。本明細書で使用される用語は、実施形態の原理、市場で見られる技術に対する実際の適用または技術的改善を最もよく説明するために、または当業者が本明細書に開示される実施形態を理解できるようにするために選択された。

リカレント・ニューラル・ネットワークは、ネットワークのノード間の接続が時系列に沿ってグラフ（例えば有向グラフ）を形成することができる、人工ニューラル・ネットワークであってよい。これにより、リカレント・ニューラル・ネットワークは、時間的に動的な挙動を示すことができる。リカレント・ニューラル・ネットワークは、連続層に組織化されたニューロン状ノードのネットワークであってよい。ノードは、入力ノード（ネットワーク外部からデータを受け取る）、出力ノード（結果を生み出す）、または隠れノード（データを入力から出力へ変更する）である。リカレント・ニューラル・ネットワークのノードは、１つまたは複数のゲート・ユニットを含むことができるため、ゲート・リカレント・ニューラル・ネットワークと呼ぶことができ、例えばノードのうちの各ノードがゲート・ユニットを含むことができる。ゲート・ユニットは、例えば、ゲート・リカレント・ユニット（ＧＲＵ）または長短期メモリ（ＬＳＴＭ）・ユニットを含むことができる。

ゲート・ユニットは、ｌ_Ｇ個のゲートを含むことができる。例えば、ゲート・リカレント・ユニットの場合、ｌ_Ｇ個のゲートは３個以下（ｌ_Ｇ≦３）であってよく、例えば、最小ゲート・ユニットの場合にｌ_Ｇ＝２、完全ゲート・ユニットの場合にｌ_Ｇ＝３であってよい。ｌ_Ｇ個のゲートのうちの各ゲートは、入力ベクトルを受け取ることができ、それに応答して、活性化ベクトルと呼ばれるそれぞれのベクトルを提供することができる。ゲート・ユニットは、時間ｔにおける入力信号ｘ_ｔと前の時間ステップｔ－１における隠れ状態ｈ_ｔ－１とを現在の隠れ状態ｈ_ｔにマッピングする非線形変換を可能にすることができる。入力信号ｘ_ｔおよび隠れ状態ｈ_ｔの各々は、ベクトルであってよい。ゲート・ユニットは、時間ｔにおけるベクトルＩ_ｔを入力として受け取ることができる。入力ベクトルＩ_ｔは、例えば、時間ｔの入力信号ベクトルｘ_ｔと時間ｔ－１における隠れ状態ベクトルｈ_ｔ－１との連結であってよい。隠れ状態ベクトルｈ_ｔは、活性化ベクトルの要素ごとのゲート演算によって定義され得る。ｌ_Ｇ個の活性化ベクトルの各々は、それぞれの重み行列Ｗの関数として定義され得る。例えば、ｌ_Ｇ個の活性化ベクトルの各々は、重み付けベクトルＰ_ｊの関数であってよい。時間ｔにおける重み付けベクトルＰ_ｊは、少なくとも、それぞれの入力ベクトルＩ_ｔに、活性化ベクトルに関連付けられた別個の重み行列Ｗ_ｊを乗算することによって得ることができる。

したがって、ｌ_Ｇ個の重み行列を使用して、本主題による隠れ状態ベクトルｈ_ｔの要素のセットを計算することができる。隠れ状態ベクトルｈ_ｔは、グループ
に属していてよい。入力信号ｘ_ｔは、グループ
に属していてよい。ｌ_Ｇ個の活性化ベクトルの各々は、グループ
に属していてよい。ｌ_Ｇ個の重み行列の各々は、グループ
に属していてよく、ここで、ｓは入力ベクトルＩ_ｔの大きさである。時間ｔにおける入力ベクトルＩ_ｔは、例えば、時間ｔにおける入力信号ベクトルｘ_ｔの要素と前の時間ステップｔ－１における隠れ状態ベクトルｈ_ｔ－１の要素とを含むことができ、したがって、ｓ＝ｋ＋ｄである。隠れ状態ベクトルｈ_ｔは、ｋ個の要素を含むことができる。隠れ状態ベクトルｈ_ｔの要素のうちの各要素ｈ_ｔ（ｉ）（ｉはｌ～ｋの間で変化する）は、例えばインデックスｉを示すそれぞれの要素位置を有することができる。

完全ゲート・ユニットの例に従って、ゲートは、リセット・ゲート、更新ゲート、および活性化ゲートを含むことができる。活性化ゲートは、候補隠れ状態ベクトルを提供することができる。リセット・ゲートの活性化ベクトルは、ｒ_ｔ＝σ_ｇ（Ｐ_ｒ）のように定義され得る。更新ゲートの活性化ベクトルは、ｚ_ｔ＝σ_ｇ（Ｐ_ｚ）のように定義され得る。活性化ゲートの活性化ベクトルは、
のように定義され得る。関数σ_ｇはシグモイド関数である。φ_ｈは双曲線正接関数である。Ｐ_ｒ、Ｐ_ｚ、およびＰ_ｈは重み付けベクトルである。例えば、重み付けベクトルの各々は、
、および
のように得られ、ここで、Ｗ_ｒ、Ｗ_ｚ、およびＷ_ｈは、活性化ベクトルｒ_ｔ、ｚ_ｔ、および
にそれぞれ関連付けられた重み行列である。
、および
は、リセット・ゲート、更新ゲート、および活性化ゲートのそれぞれに関連付けられた入力ベクトルであり、例えば、入力ベクトル
、および
の各々は、それぞれのゲートへの入力前に重み付けされ得る。入力ベクトル
は、入力信号ベクトルｘ_ｔと隠れ状態ベクトルｈ_ｔ－１との連結であってよい。入力ベクトル
は、入力信号ベクトルｘ_ｔと隠れ状態ベクトルｈ_ｔ－１との連結であってよい。入力ベクトル
は、入力信号ベクトルｘ_ｔと以下のベクトル
との連結であってよい。言い換えると、ゲートに関連付けられた入力ベクトルは、ゲート・ユニットにより変更されてよく、ｘ_ｔとｈ_ｔ－１との単なる連結ではなく、ｘ_ｔと、１つのゲートの出力およびベクトルｈ_ｔ－１の要素ごとの演算から得られる別のベクトルとの連結であるようになっている。別の例では、重み付けベクトルの各々が、以下のように得られる。
、および
、ここで、ｂ_ｒ、ｂ_Ｚ、およびｂ_ｈは、バイアス・ベクトルであってよい。
言い換えると、重み付けベクトルは、入力ベクトルに別個の重み行列を乗算し、バイアス・ベクトルを加算することとによって得られる。

したがって、そのようなゲート・リカレント・ニューラル・ネットワークの訓練または推論は、ベクトル
、および
などの高次元ベクトルの要素ごとの演算のセットを伴うことができる。しかしながら、高次元ベクトルの要素ごとの演算の計算は、以下の理由で、ハードウェア・アクセラレータにおける、コストのかかるハードウェア実装であり得る。第１に、ハードウェア実装をベクトルの大きさに合わせてスケーリングすることは、必要面積および必要電力に関して高価になる可能性があり得る。第２に、リソースに制約のある適用において、互いに離れたメモリ・ユニットに格納された大きいベクトルにより、多重化が困難になり得る。本主題は、要素ごとの演算のスケーリング可能および多重化可能なハードウェア実装の設計を容易にすることができる計算ユニットのアレイに、ゲート・リカレント・ニューラル・ネットワークのパラメータをマッピングすることによって、この問題に対処することができる。重み行列の列をメモリ・アレイのそれぞれの位置に選択的に格納することを、マッピングと呼ぶことができる。

本主題は、隠れ状態ベクトルの１つまたは複数の要素のセットを一度に計算することができるため、隠れ状態ベクトルの効率的な計算を可能にすることができる。これは、活性化ベクトルのあらゆる要素の計算が実行された後に、隠れ状態ベクトル全体の計算が一度に実行される、従来の方法とは対照的である。本主題により一度に計算された隠れ状態ベクトルの要素のセット（ＳＥＴと呼ぶ）は、ｎ個の要素を含むことができ、ここで、ｎは隠れ状態ベクトルの要素の数以下である（ｎ≦ｋ）。ｎ＝ｋの場合、本主題は、従来の方法に対する代替解決策を提供することができる。要素のセットのうちの要素の数ｎは、例えば、構成可能なパラメータであり得、例えば、要素の数ｎの値は、ユーザによって定義され得る。

隠れ状態ベクトルの要素は、Ｎ個の別個の要素のセットＳＥＴ_１、ＳＥＴ_２．．．ＳＥＴ_Ｎに分割され得る。要素のセットＳＥＴ_１、ＳＥＴ_２．．．ＳＥＴ_Ｎは、各々同じ数ｎの要素を含んでいても含んでいなくてもよい。一例において、要素の数ｎは、隠れ状態ベクトルの要素の総数ｋと要素のセットＳＥＴのうちの要素の数ｎとの比
が整数であるように定義され得る。要素のセットＳＥＴ_１は、例えば、位置／インデックスｉ、ｊ、ｌを有する隠れ状態ベクトルｈ_ｔの要素がセットＳＥＴ_１の要素であることを示すように、ｈ_ｔ（ｉ：ｊ：ｌ）と表記され得る。

方法は、要素のセットＳＥＴ_１、ＳＥＴ_２．．．ＳＥＴ_Ｎのうちの１つを一度に計算するように実行されてよい。隠れ状態ベクトルのすべての要素を計算するために、方法は、隠れ状態ベクトルの残りの計算されていない要素を計算するように繰り返されてよい。例えば、要素のセットＳＥＴ_１、ＳＥＴ_２．．．ＳＥＴ_Ｎを計算するために、方法をＮ－１回繰り返すことができる。方法の各反復において、要素のセットＳＥＴ_１、ＳＥＴ_２．．．ＳＥＴ_Ｎのうちの１つの別個のセットを、一度に計算することができる。一実施形態によれば、方法は、隠れ状態ベクトルのすべての要素が計算されるまで、隠れ状態ベクトルの要素の１つまたは複数の他の別個のセットのためのステップを繰り返すことをさらに含む。すなわち、要素のセットＳＥＴ_１、ＳＥＴ_２．．．ＳＥＴ_Ｎのうちの要素の各セットＳＥＴ_ｊについて、要素プロセッサ（ＥＰ_ｊ）とメモリ・アレイ（ＭＡ_ｊ）とを設けることができ、ここでｊはｌ～Ｎの間で変化する。例えば、Ｎ個の要素プロセッサとＮ個のメモリ・アレイとを備える電子ユニット（例えば集積回路）を設けて、要素のセットＳＥＴ_１、ＳＥＴ_２．．．ＳＥＴ_Ｎの計算が同時にまたは並行して実行され得るようにしてもよい。したがって、一実施形態によれば、ステップの繰返しは同時に実行される。

あるいは、要素のセットＳＥＴ_１、ＳＥＴ_２．．．ＳＥＴ_Ｎの計算の一部を連続して実行することができ、計算の別の部分を同時に実行することができる。そのために、Ｍ個の要素プロセッサを設けることができ、要素プロセッサの数Ｍは要素のセットの数Ｎよりも小さい（Ｍ＜Ｎ）。この場合、各要素プロセッサを、それぞれの要素のセットに割り当てることができる。要素プロセッサが２つ以上の要素のセットに関連付けられる場合、要素プロセッサを入力全体で多重化して、要素の１つのセットを一度に計算するようにしてもよい。しかしながら、ハードウェア実装の必要面積を最小限に抑えるために、要素プロセッサの数Ｍをできるだけ小さく選択することができる。したがって、一実施形態によれば、方法は、隠れ状態ベクトルのすべての要素が計算されるまで、隠れ状態ベクトルの要素の１つまたは複数の他の別個のセットのためのステップを繰り返すことをさらに含み、要素の１つのセットを一度に計算するように、（単一の）要素プロセッサに多重化機能が設けられる。

以下の実施形態により、要素プロセッサは、隠れ状態ベクトルの要素のそれぞれのセットを計算することができる。要素のセットのうちの各要素は、隠れ状態ベクトルにそれぞれの要素位置を有する。活性化ベクトルの計算された要素は、複数の活性化ベクトルの１つまたは複数の計算された要素の複数のセットをそれぞれ含む。計算された要素の各セットは、それぞれの活性化ベクトルに要素位置のセットを有する。複数の活性化ベクトルのうちの各活性化ベクトルについて、計算は、重み付けベクトルの要素のセット（結果要素と呼ぶ）を、それぞれ、入力ベクトルの値をメモリ・アレイで受け取り、関連付けられた１つまたは複数の列のセットから出力することであって、結果要素の前記セットが重み付けベクトルに要素位置のセットを有する、受け取り出力することと、結果要素のセットを要素プロセッサに送ることと、結果要素のセットを使用して、活性化ベクトルの計算された要素のセットの計算を実行することとを含む。

一実施形態によれば、メモリ・アレイは、行線と、行線に交差する列線と、行線および列線によって形成された接合点で行線と列線との間に結合された計算メモリとを含む。計算メモリのうちの各計算メモリは、列のそれぞれの要素の値を表す。列を格納することは、メモリ・アレイのそれぞれの単一の列線の計算メモリに各列のすべての要素を格納することを含む。

一実施形態によれば、計算メモリは、抵抗メモリ要素、ＳＲＡＭ、またはフラッシュ・メモリ要素のうちのいずれか１つである。

図１は、本主題の例による電子システム１００を示す図である。電子システム１００は、ゲート・リカレント・ニューラル・ネットワークのゲート・ユニットであってよい。ゲート・ユニットは、隠れ状態ベクトルｈ_ｔを有することができる。隠れ状態ベクトルｈ_ｔは、ｌ_Ｇ個の活性化ベクトル
の要素ごとのゲート演算によって定義され得る。ｌ_Ｇ個の活性化ベクトルの各々は、それぞれの重み行列Ｗ_ｊの関数として定義され得る。例えば、ｌ_Ｇ個の活性化ベクトルの各々は、重み付けベクトルＰ_ｊの関数であってよい。時間ｔにおける重み付けベクトルは、それぞれの入力ベクトルＩ_ｔに、活性化ベクトルに関連付けられた別個の重み行列Ｗ_ｊを乗算することによって得られる。しかしながら、隠れ状態ベクトルのすべての要素を一度に計算することは、ハードウェア実装にいくつかの制約を加えることがある。電子システム１００は、隠れ状態ベクトルｈ_ｔの単一の要素を計算するように構成されてよいため、これを解決することができる。隠れ状態ベクトルｈ_ｔの要素は、インデックスまたは要素位置ｉを有する要素ｈ_ｔ（ｉ）であってよい。

電子システム１００は、時間ｔにおける入力信号ｘ_ｔと前の時間ステップｔ－１における隠れ状態ｈ_ｔ－１とを現在の隠れ状態ｈ_ｔの要素ｈ_ｔ（ｉ）にマッピングする非線形変換を実行するように構成されてよい。隠れ状態ベクトルｈ_ｔは、グループ
に属していてよい。入力信号ｘ_ｔは、グループ
に属していてよい。ｌ_Ｇ個の活性化ベクトルの各々は、グループ
に属していてよい。ｌ_Ｇ個の重み行列の各々は、グループ
に属していてよく、ここで、ｓは入力ベクトルＩ_ｔの大きさである。時間ｔの入力ベクトルＩ_ｔは、例えば、時間ｔにおける入力信号ベクトルｘ_ｔの要素と前の時間ステップｔ－１における隠れ状態ベクトルｈ_ｔ－１の要素とを含むことができ、したがって、ｓ＝ｋ＋ｄである。別の例において、ゲートに関連付けられた入力ベクトルＩ_ｔは、（メモリ・アレイへの入力前に）ゲート・ユニットにより変更されてよく、ｘ_ｔとｈ_ｔ－１との単なる連結ではなく、ｘ_ｔと、要素プロセッサ１０３の１つのゲートの出力およびベクトルｈ_ｔ－１の要素ごとの演算から得られる別のベクトルとの連結であるようになっている。隠れ状態ベクトルｈ_ｔは、ｋ個の要素を含むことができる。隠れ状態ベクトルｈ_ｔの要素のうちの各要素ｈ_ｔ（ｉ）（ｉはｌ～Ｎで変化する）は、例えばインデックスｉを示すそれぞれの要素位置を有することができる。ｈ_ｔ（１）は、隠れ状態ベクトルｈ_ｔの第１の要素である。

電子システム１００は、メモリ・アレイ１０１と要素プロセッサ１０３とを備える。要素プロセッサ１０３は、活性化ベクトル
を時間ｔにおいてそれぞれ提供するｌ_Ｇ個のゲート１０５を含む。例えば、最小ゲート・ユニットの場合にｌ_Ｇ＝２、ＬＳＴＭの場合にｌ_Ｇ＝４である。ｌ_Ｇ個のゲート１０５のうちの各ゲートは、シグモイド関数σおよび双曲線正接関数φなどの活性化関数を有することができる。要素プロセッサ１０３は、ベクトルに対する要素ごとの演算を実行可能にし、活性化関数を適用可能にする他の電子素子１０６をさらに備えることができる。図１に示すように、電子素子１０６は、要素ごとの乗算、ベクトル加算、およびベクトル減算（負の値を用いたベクトル加算）を実行するように構成されてよい。

最小ゲート・ユニットの例に従って、要素プロセッサ１０３は、２つのゲートを含むことができ、対応する２つの活性化ベクトルは以下のように定義され得る。

この場合、隠れ状態ベクトルは、以下のように定義され得る。
重み付けベクトルＰ_１、Ｐ_２は、（時間ｔにおいて）ｗ_ｆｘ_ｔ＋ｕ_ｆｈ_ｔ－１＋ｂ_ｆおよび
にそれぞれ等しくてよい。重み行列はＷ_ｆおよびＷ_ｈであってよい。

メモリ・アレイ１０１は、ＧＲＰ_ｉと呼ぶ列のグループを格納することを可能にするいくつかの行および列を含む。列のグループは、活性化ベクトル
の要素
の決定をそれぞれ可能にする重み行列
の列を含む。例えば、要素
の計算は、入力ベクトルＩ_ｔと重み行列Ｗ_１の列番号ｉとを必要とし得る。重み行列Ｗ_１の列番号（または位置）ｉは、要素Ｗ_１（１，ｉ），Ｗ_１（２，ｉ）．．．Ｗ_１（ｓ，ｉ）を含むことができる。要素
の計算は、入力ベクトルＩ_ｔと重み行列Ｗ_２の列番号ｉとを必要とし得る。重み行列Ｗ_２の列番号ｉは、要素Ｗ_２（１，ｉ），Ｗ_２（２，ｉ）．．．Ｗ_２（ｓ，ｉ）などを含むことができる。したがって、要素ｈ_ｔ（ｉ）の計算を可能にする列のグループＧＲＰ_ｉは、重み行列
の位置ｉにおけるすべての列１０７を含むことができる。メモリ・アレイ１０１は、入力ベクトルＩ_ｔを受け取り、それぞれの重み付けベクトルＰ_ｊの位置ｉの要素Ｐ_ｊ（ｉ）を各列１０７で出力するように構成されてよい。

最小ゲート・ユニットの例に従って、要素ｈ_ｔ（ｉ）を計算するために、活性化ベクトル要素
およびｆ_ｔ（ｉ）を計算する必要がある。要素ｆ_ｔ（ｉ）を計算するために、重み行列Ｗ_ｆの位置ｉの列をメモリ・アレイ１０１の列に格納することができる。要素
を計算するために、重み行列Ｗ_ｈの位置ｉの列を、メモリ・アレイの別の連続した列に格納することができる。したがって、列のグループＧＲＰ_ｉは２つの列によって形成される。

列１０７の各々の重み付けベクトルＰ_ｊの要素Ｐ_ｊ（ｊ）は、要素プロセッサ１０３のそれぞれのゲート１０５への入力として提供され、ゲート１０５の各々の活性化関数をそれぞれの受け取った重み付けベクトル要素Ｐ_ｊ（ｊ）に適用できるようになっている。これにより、活性化ベクトル要素
が得られる。要素ｈ_ｔ（ｉ）を得ることを可能にする要素ごとの演算を実行するために、電子素子１０６を使用する要素プロセッサ１０３によって、活性化ベクトル要素
をさらに処理することができる。

最小ゲート・ユニットの例に従って、要素プロセッサ１０３は、
の計算を実行するように構成されてよい。この場合、要素ごとのゲート演算は要素ごとの乗算を含む。

図２は、本主題の例による電子システム２００を示す図である。電子システム２００は、現在の隠れ状態ｈ_ｔの２つの要素ｈ_ｔ（ｉ１：ｉ２）のセットを計算するように構成されてよい。電子システム２００は、時間ｔにおける入力信号ｘ_ｔと前の時間ステップｔ－１における隠れ状態ｈ_ｔ－１とを現在の隠れ状態ｈ_ｔの２つの要素ｈ_ｔ（ｉ１：ｉ２）のセットにマッピングする非線形変換を実行するように構成されてよい。

電子システム２００は、メモリ・アレイ２０１と要素プロセッサ２０３とを備える。メモリ・アレイ２０１は、活性化ベクトル
の要素
の決定をそれぞれに可能にする重み行列
の列のグループＧＲＰ_{ｉ１，ｉ２}を格納する。例えば、要素
の計算は、入力ベクトルＩ_ｔと重み行列Ｗ_１の位置ｉ１、ｉ２の２つの列とを必要とし得る。重み行列Ｗ_１の位置ｉ１の列は、要素Ｗ_１（１，ｉ１），Ｗ_１（２，ｉ１）．．．Ｗ_１（ｓ，ｉ１）を含むことができる。重み行列Ｗ_１の位置ｉ２の列は、要素Ｗ_１（１，ｉ２），Ｗ_１（２，ｉ２）．．．Ｗ_１（ｓ，ｉ２）などを含むことができる。同じ重み行列の列２０７が、メモリ・アレイに連続して格納される。これにより、ハードウェア実装の必要面積を最小限に抑えることができる。メモリ・アレイ２０１は、入力ベクトルＩ_ｔを受け取り、それぞれの重み付けベクトルＰ_ｊの位置ｉ１、ｉ２の要素Ｐ_ｊ（ｉ１：１２）を各列２０７で出力するように構成されてよい。

列２０７の各々の重み付けベクトルＰ_ｊの各対の要素Ｐ_ｊ（ｉ１：１２）は、要素プロセッサ２０３のそれぞれのゲート２０５への入力として提供され、ゲート２０５の各々の活性化関数をそれぞれの受け取った重み付けベクトル要素Ｐ_ｊ（ｉ１：１２）に適用できるようになっている。これにより、活性化ベクトル要素
が得られる。要素ｈ_ｔ（ｉ１：１２）のセットを得ることを可能にする要素ごとの演算を実行するために、電子素子２０６を使用する要素プロセッサ２０３によって、活性化ベクトル要素
をさらに処理することができる。

図３は、本主題の例による電子システム３００を示す図である。電子システム３００は、現在の隠れ状態ｈ_ｔのすべての要素を１つずつ計算するように構成されてよい。電子システム３００は、時間ｔにおける入力信号ｘ_ｔと前の時間ステップｔ－１における隠れ状態ｈ_ｔ－１とを現在の隠れ状態ｈ_ｔにマッピングする非線形変換を実行するように構成されてよい。そのために、電子システム３００は、いくつかの要素プロセッサ３０３．１～３０３．ｋ（隠れ状態ベクトルｈ_ｔの要素の数ｋに等しい）を備えることができ、要素プロセッサの各々が隠れ状態ベクトルｈ_ｔのそれぞれの要素を提供することができるようになっている。電子システム３００は、列のｋ個のグループＧＲＰ_１，ＧＲＰ_２，．．．ＧＲＰ_Ｋが格納されるメモリ・アレイ３０１をさらに備える。列のグループＧＲＰ_１，ＧＲＰ_２，．．．ＧＲＰ_Ｋが格納される領域を、別個のメモリ領域（または別個のメモリサブ領域）と呼ぶことができる。ｋ個の列のグループのうちの列の各グループが、連続して格納される。ｋ個の列のグループのうちの列の各グループは、隠れ状態ベクトルｈ_ｔのそれぞれの要素の計算を可能にする列である。例えば、列のグループＧＲＰ_１は、隠れ状態ベクトルｈ_ｔの要素ｈ_ｔ（１）の計算を可能にする列を含む。要素プロセッサ３０３．１～３０３．ｋの各々は、図１の要素プロセッサ１０３を参照して説明したように、隠れ状態ベクトルｈ_ｔのそれぞれの要素を計算するように構成されてよい。

図４は、本主題の例による電子システム４００を示す図である。電子システム４００は、現在の隠れ状態ｈ_ｔのすべての要素を１つずつ計算するように構成されてよい。電子システム４００は、時間ｔにおける入力信号ｘ_ｔと前の時間ステップｔ－１における隠れ状態ｈ_ｔ－１とを現在の隠れ状態ｈ_ｔにマッピングする非線形変換を実行するように構成されてよい。そのために、電子システム４００は、単一の要素プロセッサ４０３を備えることができる。電子システム４００のメモリ・アレイ４０１は、ｋ個の列のグループＧＲＰ_１，ＧＲＰ_２，．．．ＧＲＰ_Ｋが格納される図３のメモリ・アレイ３０３と同様であり、例えばｋ＝１２８である。電子システム４００は、単一の要素プロセッサ４０３を使用して異なるグループの出力を多重化することができるように構成されてよい。例えば、図４に示すように、単一の要素プロセッサ４０３は、すべてのグループにわたって多重化されて、１つの隠れ状態ベクトル要素を一度に計算する。この実装は、リソースに制約のある適用の場合に有利であり得る。

図４の実装の１つの発展は、グループの所望のセットにわたって多重化することのできる２つ以上の要素プロセッサを使用することであり得る。これは、例えば、２つの要素プロセッサ５０３．１、５０３．２が使用される図５に示されている。電子システム５００は、要素プロセッサ５０３．１を使用することによりグループのセットの出力を多重化することができ、要素プロセッサ５０３．２を使用することによりグループの別のセットの出力を多重化することができるように構成されてよい。例えば、図５に示すように、要素プロセッサ５０３．１は、グループＧＲＰ_１～ＧＲＰ_６０のすべてにわたって多重化されて、隠れ状態ベクトルｈ_ｔの最初の６０個の要素について、１つの隠れ状態ベクトル要素を一度に計算する。要素プロセッサ５０３．３は、グループＧＲＰ_６１～ＧＲＰ_１２８のすべてにわたって多重化されて、隠れ状態ベクトルｈ_ｔの後の６８個の要素について、１つの隠れ状態ベクトル要素を一度に計算する。

図６Ａは、本主題の例によるメモリ・アレイ６００を示す図である。メモリ・アレイ６００は、例えば、図１を参照して説明したものであってよい。

メモリ・アレイ６００は、メモリの動作を示す電圧シーケンスと共にローカル・データ・ストレージを提供する計算メモリのクロスバー・アレイであってよい。図６Ａは、例えば、行列ベクトル乗算を実行することのできる２次元（２Ｄ）クロスバー・アレイ６００の図である。クロスバー・アレイ６００は、行導電線６０２．１．．．６０２．ｓのセットと行導電線６０２．１．．．６０２．ｓのセットに交差する列導電線６０８．１．．．６０８．ｌ_Ｇのセットとから形成される。

列導電線を列線と呼ぶことができ、行導電線を行線と呼ぶことができる。線および列の数は、計算される隠れ状態ベクトルの要素の数に基づいて定義され得る。この場合、隠れ状態ベクトルの第１の要素を計算することができる。そのために、ｌ_Ｇ個の活性化ベクトルの各々の第１の要素を計算する必要があり得るため、メモリ・アレイは少なくともｌ_Ｇ個の列を含むことができる。線の数は、重み行列の各々の行の数、すなわちｓによって定義される。

行線のセットと列線のセットとの交点は、それぞれＷ（ｉ，ｊ）として示されるそれ自体の値を各々有する計算メモリによって分離され、ここで、ｉ＝１．．．ｓおよびｊ＝１．．．ｌ_Ｇである。図示を簡単にするために、図６Ａでは、１つの計算メモリ６２０のみに参照数字が付されている。例えば、メモリ・アレイの列６０８．１は、重み行列Ｗ_１の位置１の列の要素を格納する。メモリ・アレイの列６０８．２は、重み行列Ｗ_２の位置１の列の要素を格納する、などである。

入力電圧ｖ_１．．．ｖ_ｓが、行線６０２．１～６０２．ｓにそれぞれ加えられる。各列線６０８．１～６０８．ｋは、特定の列線に沿って各計算メモリにより発生する電流
を合計する。例えば、図６Ａに示すように、列線６０８．２により発生する電流Ｉ_２は、式Ｉ_２＝ｖ_１・Ｗ_２（１，１）＋ｖ_２・Ｗ_２（２，１）＋ｖ３・Ｗ３（３，１）＋・・・＋ｖ_ｓ・Ｗ_２（ｓ，１）による。したがって、アレイ６００は、計算メモリ６２０に格納された値に、電圧ｖ_１－ｖ_ｓにより定義された行線入力を乗算することによって、行列ベクトル乗算を計算する。したがって、乗算は、メモリ・アレイ自体とアレイ６００の該当する行線または列線とを使用して、アレイ６００の各計算メモリ６２０で局所的に実行されてよい。

図６Ｂは、本主題によるメモリ・アレイ７００を示す図である。メモリ・アレイ７００は、例えば、図１を参照して説明したものであってよい。メモリ・アレイ７００は、メモリスタ・デバイスのクロスバー・アレイであってよい。水平に配置されたｓ個の別個の平行線（Ｓ個の行）のセットおよびＳ個の線に垂直に配置された２ｌ_Ｇ個の別個の平行線（ｌ_Ｇ個の列）の別のセットについて、メモリスタ・デバイスがこれらの線のすべてのｓ×２ｌ_Ｇ個の交点に存在するように、メモリ・アレイ７００はＰＣＭデバイスのクロスバーを形成する。単一のメモリスタ・デバイスを通る電流は、メモリスタ・デバイスに加えられる電圧とそのコンダクタンス値との積である。コンダクタンスは常に正であるため、単一の列は、アレイにおいて符号付きの値を共に表す２本の縦線から構成され、それらの電流は、以下の式
から与えられる列の正味の電流を得るように減算され、ここで、
および
である。Ｗ^＋は重みの正部分を符号化することができ、Ｗ^－は重みの負部分を符号化することができる。例えば、重み行列Ｗが正であれば、Ｗ^＋＝ＷおよびＷ^－＝０であり、Ｗが負であれば、Ｗ^＋＝０およびＷ^－＝｜Ｗ｜である。

行列ベクトル乗算は、クロスバーの行に沿って電圧を加え、クロスバーの列に沿って電流を合計する（キルヒホフの電流法則を使用して）ことによって計算されてよい。正味の出力電流は、通常、さらなる計算のためのアナログ・デジタル・コンバータ（ＡＤＣ）を使用して測定される。ＡＤＣは、入力アナログ値が常に有界である限り、アナログ値をそのデジタル表現に変換することができるが、そうでなければＡＤＣ出力が飽和する。別の例では、単一のまたはより少ないＡＤＣをクロスバー・アレイごとに使用して、列電流をサンプリングすることができる。任意のグループの出力を、区間［－４，４］に境界付けることができる。これにより、すべての列にわたって多重化することのできる単一のまたは少数のＡＤＣの使用が容易になり得る。

メモリ・アレイの別の例は、計算メモリのデジタル・シストリック・アレイであってよい。シストリック・アレイは、密に結合された計算メモリの均一なアレイであってよい。各計算メモリは、パラメータ値を格納し、通常は論理演算を乗算および加算するためのメモリを有する。シストリック・アレイでは、入力データを一度だけ読み取ることができ、入力データは、いかなる中間レジスタにも戻されて格納されることなく、複数回再利用される。シストリック・アレイの隣接するデータ処理ユニットのみを、線を使用して結合することができ、これにより配線を短くしてエネルギー効率を良くする。このような実装は、ＧＰＵ／ＣＰＵと比べて行列乗算を加速することができる。特に、シストリック・アレイを使用して、ゲートＲＮＮを実装することができる。このような実装において、本マッピング技術を使用して、ゲート演算計算ユニットの設計をスケーリング可能および多重化可能にすることができる。

図６Ｃは、本主題による計算メモリ８００の例を示す。計算メモリ８００はＳＲＡＭセルであってよい。ＳＲＡＭセルは、メモリの１ビットを格納できる電子回路である。ＳＲＡＭセルのメモリ状態を変化させる能力により、ＳＲＡＭセルは計算メモリの適切な候補になる。図６Ｃは６－トランジスタのＳＲＡＭセルを示す。

図６Ｄは、本主題による計算メモリ８１０の例を示す。計算メモリ８１０はフラッシュ・メモリであってよい。フラッシュ・メモリ・デバイスは、メモリの１ビットを格納できる電子デバイスである。フラッシュ・デバイスのメモリ状態を変化させる能力により、フラッシュ・デバイスは計算メモリの適切な候補になる。

図７は、ゲート・リカレント・ニューラル・ネットワークの隠れ状態ベクトルの１つまたは複数の要素のセットを計算するための方法のフローチャートである。図１～図６を参照して説明したように、ゲートＲＮＮは少なくとも１つのゲート・ユニットを備える。

「要素のセット」という用語は、ベクトルにそれぞれの位置を有する、ベクトルの一定の数の要素を指す。説明を簡単にするために、要素のセットが３つの要素、例えば、位置１、２、３をそれぞれ有する要素を含むと仮定する。この場合、要素のセットは、位置１、２、３を有する３つの要素を指し、例えば、「ベクトルＸの要素のセット」という表現は、ベクトルＸに位置１、２、３を有する３つの要素を指す。すなわち、方法は、隠れ状態ベクトルｈ_ｔの要素ｈ_ｔ（１）、ｈ_ｔ（２）、ｈ_ｔ（３）（ｈ_ｔ（１：２：３）と表記する）を計算することを可能にし得る。説明を簡単にするために、ゲート・ユニットがＬＳＴＭユニットであるとさらに仮定する。すなわち、隠れ状態ベクトルｈ_ｔは、以下のように定義され得る。

ステップ９０１で、要素ｈ_ｔ（１：２：３）のセットの計算を可能にする重み行列の列のグループを、メモリ・アレイに格納することができる。要素のセットを計算するために、式Ｅｑ１～Ｅｑ４により定義される活性化ベクトルの対応する要素が必要とされ得る。すなわち、要素ｈ_ｔ（１：２：３）を計算するために、活性化ベクトル要素ｏ_ｔ（１：２：３）、ｆ_ｔ（１：２：３）、ｉ_ｔ（１：２：３）および
を計算することができる。例えば、要素ｆ_ｔ（１：２：３）を計算するために、重み行列Ｗ_ｆの位置１、２、３の列のサブグループｓｂ１を使用することができる。要素ｉ_ｔ（１：２：３）を計算するために、重み行列Ｗ_ｉの位置１、２、３の列のサブグループｓｂ２を使用することができる。要素ｏ_ｔ（１：２：３）を計算するために、重み行列Ｗ_ｏの位置１、２、３の列のサブグループｓｂ３を使用することができる。要素
を計算するために、重み行列Ｗ_ｃの位置１、２、３の列のサブグループｓｂ４を使用することができる。したがって、列のグループは、サブグループｓｂ１、ｓｂ２、ａｂ３、ｓｂ４によって形成され得る。列のグループは、重み行列Ｗ_ｆの３つの列、重み行列Ｗ_ｉの３つの列、重み行列Ｗ_ｏの３つの列、および重み行列Ｗ_ｃの３つの列を含むことができる。グループの各列は、メモリ・アレイのそれぞれの列に格納され得る。サブグループｓｂ１、ｓｂ２、ａｂ３、ｓｂ４のうちの各サブグループの列は、連続して格納され得る。図６Ａのクロスバー・アレイを使用して、列のサブグループｓｂ１は、連続した列６０８．１、６０８．２、６０８．３にそれぞれ格納され得る。列のサブグループｓｂ２は、連続した列６０８．４、６０８．５、６０８．６にそれぞれ格納され得る。列のサブグループｓｂ３は、連続した列６０８．７、６０８．８、６０８．９にそれぞれ格納され得る。列のサブグループｓｂ４は、連続した列６０８．１０、６０８．１１、６０８．１２にそれぞれ格納され得る。

ステップ９０３で、活性化ベクトルのうちの各活性化ベクトルの要素のセットを、列のサブグループｓｂ１、ｓｂ２、ａｂ３、ｓｂ４のうちのそれぞれの列のサブグループを使用して計算することができる。例えば、要素ｆ_ｔ（１：２：３）は、式Ｅｑ１によりサブグループｓｂ１を使用して計算することができる。要素ｉ_ｔ（１：２：３）は、式Ｅｑ２によりサブグループｓｂ２を使用して計算することができる。要素ｏ_ｔ（１：２：３）は、（式Ｅｑ３によりサブグループｓｂ３を使用して計算することができる。要素
は、式Ｅｑ４によりサブグループｓｂ４を使用して計算することができる。

ステップ９０５で、要素プロセッサは、式Ｅｑ５、Ｅｑ６により、計算された要素ｆ_ｔ（１：２：３）、ｉ_ｔ（１：２：３）、ｏ_ｔ（１：２：３）、および
に対する要素ごとのゲート演算を実行することができる。これにより、要素ｈ_ｔ（１：２：３）のセットが得られる。この例では、要素ごとのゲート演算は、要素ごとの乗算と活性化関数の適用とを含む。

図８は、例示的な実施形態による、ハードウェア・デバイスのブロック図を示す。図８は、一実装形態の例示を提供するものに過ぎず、異なる実施形態が実装され得る環境に関するいかなる限定も示唆するものではないことが理解されるべきである。図示する環境に対する多くの修正を行ってもよい。

本明細書で使用されるデバイスは、１つまたは複数のプロセッサ０２と、１つまたは複数のコンピュータ可読ＲＡＭ０４と、１つまたは複数のコンピュータ可読ＲＯＭ０６と、１つまたは複数のコンピュータ可読記憶媒体０８と、デバイス・ドライバ１２と、読出し／書込みドライブまたはインターフェース１４と、ネットワーク・アダプタまたはインターフェース１６とを含むことができ、これらはすべて通信ファブリック１８を通じて相互接続される。通信ファブリック１８は、データまたは制御情報あるいはその両方を、プロセッサ（マイクロプロセッサ、通信およびネットワークプロセッサなど）、システムメモリ、周辺デバイス、ならびにシステム内の他の任意のハードウェア・コンポーネントの間で渡すように設計された、任意のアーキテクチャで実装されてもよい。

１つまたは複数のオペレーティング・システム１０および１つまたは複数のアプリケーション・プログラム１１は、それぞれのＲＡＭ０４（一般的に、キャッシュ・メモリを含む）のうちの１つまたは複数を介して、プロセッサ０２のうちの１つまたは複数によって実行するために、コンピュータ可読記憶媒体０８のうちの１つまたは複数に格納される。図示の実施形態において、コンピュータ可読記憶媒体０８の各々は、内部ハード・ドライブの磁気ディスク記憶デバイス、ＣＤ－ＲＯＭ、ＤＶＤ、メモリ・スティック、磁気テープ、磁気ディスク、光学ディスク、ＲＡＭ、ＲＯＭ、ＥＰＲＯＭ、フラッシュ・メモリなどの半導体記憶デバイス、あるいはコンピュータ・プログラムおよびデジタル情報を格納することができる、他の任意のコンピュータ可読有形記憶デバイスであってよい。

本明細書で使用されるデバイスは、１つまたは複数の携帯型コンピュータ可読記憶媒体２６から読み出す、またはそれに書き込む、Ｒ／Ｗドライブまたはインターフェース１４を含んでもよい。前記デバイスのアプリケーション・プログラム１１は、携帯型コンピュータ可読記憶媒体２６のうちの１つまたは複数に格納され、それぞれのＲ／Ｗドライブまたはインターフェース１４を介して読み取られ、それぞれのコンピュータ可読記憶媒体０８にロードされてもよい。

本明細書で使用されるデバイスは、ＴＣＰ／ＩＰアダプタ・カードまたは無線通信アダプタ（ＯＦＤＭＡ技術を使用する４Ｇ無線通信アダプタなど）などの、ネットワーク・アダプタまたはインターフェース１６を含むこともできる。前記コンピューティング・デバイスのアプリケーション・プログラム１１は、ネットワーク（例えば、インターネット、ローカル・エリア・ネットワーク、もしくは他のワイド・エリア・ネットワーク、もしくは無線ネットワーク）およびネットワーク・アダプタまたはインターフェース１６を介して、外部コンピュータまたは外部記憶デバイスからコンピューティング・デバイスにダウンロードされてもよい。ネットワーク・アダプタまたはインターフェース１６から、プログラムがコンピュータ可読記憶媒体０８にロードされてもよい。ネットワークは、銅線、光ファイバ、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、またはエッジ・サーバ、あるいはその組合せを含むことができる。

本明細書で使用されるデバイスは、表示画面２０と、キーボードまたはキーパッド２２と、コンピュータ・マウスまたはタッチパッド２４とを含むこともできる。デバイス・ドライバ１２は、画像形成する表示画面２０に、キーボードもしくはキーパッド２２に、コンピュータ・マウスもしくはタッチパッド２４に、または英数文字エントリおよびユーザ選択を圧力感知する表示画面２０に、あるいはそれらの組み合わせに、インターフェース接続する。デバイス・ドライバ１２、Ｒ／Ｗドライブまたはインターフェース１４、およびネットワーク・アダプタまたはインターフェース１６は、ハードウェアおよびソフトウェア（コンピュータ可読記憶媒体０８、もしくはＲＯＭ０６、またはその両方に格納される）を含むことができる。

本明細書に記載のプログラムは、それらが例示的な実施形態のうちの特定の１つに実装されるアプリケーションに基づいて識別される。しかしながら、本明細書における任意の特定のプログラムの名称は、便宜上使用されるものに過ぎず、したがって、例示的な実施形態は、そのような名称によって識別もしくは示唆またはその両方がなされる、任意の特定のアプリケーションにおける使用のみに限定されるべきではないことを理解すべきである。

上記に基づいて、コンピュータ・システム、方法、およびコンピュータ・プログラム製品が開示されている。しかしながら、例示的な実施形態の範囲から逸脱することなく、多数の修正および置換を行うことができる。したがって、例示的な実施形態は、限定ではなく例として開示されている。

本開示は、クラウド・コンピューティングに関する詳細な説明を含むが、本明細書に記載される教示の実装はクラウド・コンピューティング環境に限定されるものではないことを理解されたい。むしろ、例示的な実施形態は、現在既知であるか、または今後開発される任意の他の種類のコンピューティング環境と共に実装することができる。

クラウド・コンピューティングは、最小限の管理労力またはサービスのプロバイダとの対話によって迅速にプロビジョニングおよびリリースされ得る構成可能なコンピューティング・リソース（例えば、ネットワーク、ネットワーク帯域幅、サーバ、処理、メモリ、ストレージ、アプリケーション、仮想マシン、およびサービス）の共用プールへの便利なオンデマンド・ネットワーク・アクセスを可能にするためのサービス配信のモデルである。このクラウド・モデルは、少なくとも５つの特徴と、少なくとも３つのサービス・モデルと、少なくとも４つの配備モデルとを含むことができる。

特徴は以下の通りである。

オンデマンド・セルフサービス：クラウド消費者は、サービスのプロバイダとの人的対話を必要とせずに、必要に応じて自動的に、サーバ時間およびネットワーク・ストレージなどのコンピューティング機能を一方的にプロビジョニングすることができる。

広帯域ネットワーク・アクセス：機能はネットワークを介して利用可能であり、異種のシンまたはシック・クライアント・プラットフォーム（例えば、携帯電話、ラップトップ、およびＰＤＡ）による使用を促進する標準機構を通じてアクセスされる。

リソース・プーリング：マルチテナント・モデルを使用して複数の消費者に対応するために、プロバイダのコンピューティング・リソースがプールされ、需要に応じて異なる物理リソースおよび仮想リソースが動的に割り当てられ、再割当てされる。消費者は一般に、提供されるリソースの正確な場所について制御することができないかまたは知ることができないが、より高い抽象化レベルの場所（例えば、国、州、またはデータセンタ）を指定できるという点で、場所の独立感がある。

迅速な順応性：機能は、迅速かつ順応的に、場合によっては自動的にプロビジョニングされて、迅速にスケール・アウトすることができ、かつ迅速にリリースされて、迅速にスケール・インすることができる。消費者にとって、プロビジョニングのために利用可能な機能は、多くの場合、無制限であるように見え、いつでも任意の量を購入することができる。

従量制サービス：クラウド・システムが、サービスの種類（例えば、ストレージ、処理、帯域幅、およびアクティブ・ユーザ・アカウント）に適切な何らかの抽象化レベルの計量機能を活用することによって、リソースの使用を自動的に制御し、最適化する。リソース使用量を監視、制御、および報告して、利用サービスのプロバイダおよび消費者の両方に透明性を提供することができる。

サービス・モデルは以下の通りである。

サービスとしてのソフトウェア（ＳａａＳ）：消費者に提供される機能は、クラウド・インフラストラクチャ上で実行されるプロバイダのアプリケーションを使用することである。アプリケーションは、ウェブ・ブラウザ（例えば、ウェブ・ベースの電子メール）などのシン・クライアント・インターフェースを通じて様々なクライアント・デバイスからアクセス可能である。消費者は、限られたユーザ固有アプリケーション構成設定を、可能な例外として、ネットワーク、サーバ、オペレーティング・システム、ストレージ、または個々のアプリケーション機能も含む、基礎となるクラウド・インフラストラクチャを管理または制御しない。

サービスとしてのプラットフォーム（ＰａａＳ）：消費者に提供される機能は、クラウド・インフラストラクチャ上に、プロバイダによってサポートされるプログラミング言語およびツールを使用して作成された、消費者作成アプリケーションまたは消費者取得アプリケーションを配備することである。消費者は、ネットワーク、サーバ、オペレーティング・システム、またはストレージを含む基礎となるクラウド・インフラストラクチャを管理または制御しないが、配備されたアプリケーションと、場合によってはアプリケーション・ホスティング環境構成とを制御することができる。

サービスとしてのインフラストラクチャ（ＩａａＳ）：消費者に提供される機能は、処理、ストレージ、ネットワーク、およびその他の基本的なコンピューティング・リソースをプロビジョニングすることであり、消費者は、オペレーティング・システムおよびアプリケーションを含み得る任意のソフトウェアを配備および実行することができる。消費者は、基礎となるクラウド・インフラストラクチャを管理または制御しないが、オペレーティング・システム、ストレージ、配備されたアプリケーションを制御することができ、場合によっては選択されたネットワーキング・コンポーネント（例えば、ホスト・ファイアウォール）の限定的な制御を行うことができる。

配備モデルは以下の通りである。

プライベート・クラウド：このクラウド・インフラストラクチャは、組織のためにのみ運用される。これは、組織または第３者によって管理されてよく、オンプレミスまたはオフプレミスで存在してよい。

コミュニティ・クラウド：このクラウド・インフラストラクチャは、いくつかの組織によって共用され、共通の関心事（例えば、任務、セキュリティ要件、ポリシ、およびコンプライアンス事項）を有する特定のコミュニティをサポートする。これは、組織または第３者によって管理されてよく、オンプレミスまたはオフプレミスで存在してよい。

パブリック・クラウド：このクラウド・インフラストラクチャは、一般人または大規模業界団体が利用することができ、クラウド・サービスを販売する組織によって所有される。

ハイブリッド・クラウド：このクラウド・インフラストラクチャは、２つ以上のクラウド（プライベート、コミュニティ、またはパブリック）の複合体であり、それらのクラウドは、固有のエンティティのままであるが、データおよびアプリケーションの移植性を可能にする標準化技術または専有技術（例えば、クラウド間のロード・バランシングのためのクラウド・バースティング）によって共に結合される。

クラウド・コンピューティング環境は、ステートレス性、疎結合性、モジュール性、および意味的相互運用性に焦点を合わせたサービス指向型である。クラウド・コンピューティングの核心にあるのは、相互接続されたノードのネットワークを含むインフラストラクチャである。

次に図９を参照して、例示的なクラウド・コンピューティング環境５０を示す。図示のように、クラウド・コンピューティング環境５０は、１つまたは複数のクラウド・コンピューティング・ノード４０を含み、この１つまたは複数のクラウド・コンピューティング・ノード４０と、例えば、パーソナル・デジタル・アシスタント（ＰＤＡ）もしくは携帯電話５４Ａ、デスクトップ・コンピュータ５４Ｂ、ラップトップ・コンピュータ５４Ｃ、または自動車コンピュータ・システム５４Ｎ、あるいはその組合せなどの、クラウド消費者によって使用されるローカル・コンピューティング・デバイスとが、通信することができる。ノード４０は相互に通信することができる。ノード４０は、前述したプライベート・クラウド、コミュニティ・クラウド、パブリック・クラウド、またはハイブリッド・クラウド、あるいはその組合せなどの１つまたは複数のネットワークにおいて、物理的または仮想的にグループ化（図示せず）され得る。これにより、クラウド・コンピューティング環境５０は、インフラストラクチャ、プラットフォーム、またはソフトウェア、あるいはその組合せを、クラウド消費者がそのためにローカル・コンピューティング・デバイス上でリソースを維持する必要がないサービスとして提供することができる。図９に示すコンピューティング・デバイス５４Ａ～５４Ｎの種類は、単なる例示であり、コンピューティング・ノード４０およびクラウド・コンピューティング環境５０が、（例えば、ウェブ・ブラウザを使用して）任意の種類のネットワークまたはネットワーク・アドレス可能接続あるいはその両方を介して任意の種類のコンピュータ化デバイスと通信することができるものと理解される。

次に図１０を参照して、クラウド・コンピューティング環境５０（図９）によって提供される１組の機能抽象化層を示す。図１０に示すコンポーネント、層、および機能は、単なる例示であり、例示的な実施形態はこれらに限定されないことを予め理解すべきである。図示のように、以下の層および対応する機能が提供される。

ハードウェアおよびソフトウェア層６０は、ハードウェア・コンポーネントおよびソフトウェア・コンポーネントを含む。ハードウェア・コンポーネントの例として、メインフレーム６１、縮小命令セット・コンピュータ（ＲＩＳＣ）・アーキテクチャ・ベースのサーバ６２、サーバ６３、ブレード・サーバ６４、ストレージ・デバイス６５、ならびにネットワークおよびネットワーク・コンポーネント６６が挙げられる。一部の実施形態において、ソフトウェア・コンポーネントとして、ネットワーク・アプリケーション・サーバ・ソフトウェア６７およびデータベース・ソフトウェア６８が挙げられる。

仮想化層７０は抽象化層を提供し、この抽象化層から、仮想エンティティの以下の例、すなわち、仮想サーバ７１、仮想ストレージ７２、仮想プライベート・ネットワークを含む仮想ネットワーク７３、仮想アプリケーションおよびオペレーティング・システム７４、ならびに仮想クライアント７５を提供することができる。

一例において、管理層８０は、以下に記載の機能を提供することができる。リソース・プロビジョニング８１は、クラウド・コンピューティング環境内でタスクを実行するために利用されるコンピューティング・リソースおよび他のリソースの動的調達を行う。計量および価格設定８２は、リソースがクラウド・コンピューティング環境内で利用されるときの費用追跡、およびこれらのリソースの消費に対する請求書発行すなわち代金請求を行う。一例において、これらのリソースは、アプリケーション・ソフトウェア・ライセンスを含むことができる。セキュリティは、クラウド消費者およびタスクの本人確認と、データおよび他のリソースの保護とを行う。ユーザ・ポータル８３は、消費者およびシステム管理者にクラウド・コンピューティング環境へのアクセスを提供する。サービス・レベル管理８４は、必要なサービス・レベルが満たされるように、クラウド・コンピューティング・リソース割当ておよび管理を行う。サービス品質保証契約（ＳＬＡ）の計画および履行８５は、将来の要件がＳＬＡに従って予測されるクラウド・コンピューティング・リソースの事前手配および調達を行う。

作業負荷層９０は、クラウド・コンピューティング環境をそのために利用することができる機能の例を提供する。この層から提供できる作業負荷および機能の例として、マッピングおよびナビゲーション９１、ソフトウェア開発およびライフサイクル管理９２、仮想教室教育配信９３、データ解析処理９４、トランザクション処理９５、およびニューラル・ネットワーク計算９６が挙げられる。

例示的な実施形態は、任意の可能な統合の技術的詳細レベルにおけるシステム、方法、またはコンピュータ・プログラム製品、あるいはその組合せであってよい。コンピュータ・プログラム製品は、プロセッサに例示的な実施形態の態様を実行させるためのコンピュータ可読プログラム命令を有する１つまたは複数のコンピュータ可読記憶媒体を含むことができる。

コンピュータ可読記憶媒体は、命令実行デバイスによって使用するための命令を保持し格納することができる有形デバイスであってよい。コンピュータ可読記憶媒体は、例えば、電子ストレージ・デバイス、磁気ストレージ・デバイス、光学ストレージ・デバイス、電磁ストレージ・デバイス、半導体ストレージ・デバイス、またはこれらの任意の適切な組合せであってよいが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例の非網羅的なリストには、以下のもの、すなわち、携帯型コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ（ＲＡＭ）、読取り専用メモリ（ＲＯＭ）、消去可能なプログラマブル読取り専用メモリ（ＥＰＲＯＭもしくはフラッシュ・メモリ）、スタティック・ランダム・アクセス・メモリ（ＳＲＡＭ）、携帯型コンパクト・ディスク読取り専用メモリ（ＣＤ－ＲＯＭ）、デジタル・バーサタイル・ディスク（ＤＶＤ）、メモリ・スティック、フロッピ（Ｒ）・ディスク、パンチカードもしくは命令が記録されている溝内の隆起構造などの機械的に符号化されたデバイス、およびこれらの任意の適切な組合せが含まれる。本明細書で使用されるコンピュータ可読記憶媒体は、電波もしくは他の自由に伝搬する電磁波、導波路もしくは他の伝送媒体を伝搬する電磁波（例えば光ファイバ・ケーブルを通過する光パルス）、または電線を介して伝送される電気信号などの、一過性の信号であるとは解釈されるべきではない。

本明細書に記載のコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体からそれぞれのコンピューティング／処理デバイスにダウンロードすることができ、または、ネットワーク、例えばインターネット、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク、または無線ネットワーク、あるいはその組合せを介して、外部コンピュータまたは外部ストレージ・デバイスにダウンロードすることができる。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、またはエッジ・サーバ、あるいはその組合せを含むことができる。各コンピューティング／処理デバイスにおけるネットワーク・アダプタ・カードまたはネットワーク・インターフェースが、ネットワークからコンピュータ可読プログラム命令を受信し、それらのコンピュータ可読プログラム命令を、それぞれのコンピューティング／処理デバイス内のコンピュータ可読記憶媒体に格納するために転送する。

例示的な実施形態の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セット・アーキテクチャ（ＩＳＡ）命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路の構成データ、あるいはＳｍａｌｌｔａｌｋ（Ｒ）、Ｃ＋＋などのオブジェクト指向プログラミング言語および「Ｃ」プログラミング言語もしくは同様のプログラミング言語などの手続き型プログラミング言語を含む、１つまたは複数のプログラミング言語の任意の組合せで書かれたソース・コードまたはオブジェクト・コードであってよい。コンピュータ可読プログラム命令は、全体的にユーザのコンピュータ上で、一部がユーザのコンピュータ上で、独立型ソフトウェア・パッケージとして、一部がユーザのコンピュータ上および一部がリモート・コンピュータ上で、または全体的にリモート・コンピュータもしくはサーバ上で実行することができる。後者の場合、リモート・コンピュータは、ローカル・エリア・ネットワーク（ＬＡＮ）もしくはワイド・エリア・ネットワーク（ＷＡＮ）を含む任意の種類のネットワークを介してユーザのコンピュータに接続することができ、または（例えば、インターネット・サービス・プロバイダを使用してインターネットを介して）外部コンピュータに接続することができる。一部の実施形態において、例示的な実施形態の態様を実行するために、例えば、プログラマブル論理回路、フィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡ）、またはプログラマブル・ロジック・アレイ（ＰＬＡ）を含む電子回路が、コンピュータ可読プログラム命令の状態情報を利用して電子回路をパーソナライズすることにより、コンピュータ可読プログラム命令を実行することができる。

例示的な実施形態による方法、装置（システム）、およびコンピュータ・プログラム製品のフローチャート図またはブロック図あるいはその両方を参照しながら、例示的な実施形態の態様について本明細書で説明している。フローチャート図またはブロック図あるいはその両方の各ブロック、およびフローチャート図またはブロック図あるいはその両方におけるブロックの組合せは、コンピュータ可読プログラム命令によって実装できることが理解されるだろう。

これらのコンピュータ可読プログラム命令は、コンピュータまたは他のプログラマブル・データ処理装置のプロセッサによって実行される命令が、フローチャートまたはブロック図あるいはその両方の１つまたは複数のブロックに指定される機能／動作を実施する手段を作り出すべく、汎用コンピュータ、専用コンピュータ、または他のプログラマブル・データ処理装置のプロセッサに提供されてマシンを作り出すものであってよい。これらのコンピュータ可読プログラム命令は、命令が格納されたコンピュータ可読記憶媒体が、フローチャートまたはブロック図あるいはその両方の１つまたは複数のブロックに指定される機能／動作の態様を実施する命令を含んだ製品を含むべく、コンピュータ可読記憶媒体に格納されて、コンピュータ、プログラマブル・データ処理装置、または他のデバイス、あるいはその組合せに特定の方式で機能するように指示できるものであってもよい。

コンピュータ可読プログラム命令は、コンピュータ、他のプログラマブル装置、または他のデバイスで実行される命令が、フローチャートまたはブロック図あるいはその両方の１つまたは複数のブロックに指定される機能／動作を実施するように、コンピュータによって実施されるプロセスを作り出すべく、コンピュータ、他のプログラマブル・データ処理装置、または他のデバイスにロードされ、コンピュータ、他のプログラマブル装置、または他のデバイス上で一連の動作ステップを実行させるものであってもよい。

図におけるフローチャートおよびブロック図は、様々な例示的実施形態による、システム、方法、およびコンピュータ・プログラム製品の可能な実装のアーキテクチャ、機能、および動作を示す。これに関して、フローチャートまたはブロック図における各ブロックは、指定された１つ（または複数の）論理機能を実施するための１つまたは複数の実行可能命令を含む、命令のモジュール、セグメント、または部分を表すことができる。一部の代替実装形態において、ブロックに記載された機能は、図に記載された順序以外で生じる場合がある。例えば、連続して示す２つのブロックは、実際には、実質的に同時に実行することができ、またはそれらのブロックは、時には、関与する機能に応じて、逆の順序で実行することができる。ブロック図またはフローチャート図あるいはその両方の各ブロック、およびブロック図またはフローチャート図あるいはその両方におけるブロックの組合せは、指定された機能もしくは動作を実行する、または専用ハードウェアとコンピュータ命令との組合せを実行する専用ハードウェア・ベースのシステムによって実施することができることにも留意されたい。

Claims

隠れ状態ベクトルを有するゲート・リカレント・ニューラル・ネットワーク（ＲＮＮ）のための方法であって、
前記隠れ状態ベクトルが、複数の活性化ベクトルの要素ごとのゲート演算によって定義され、前記複数の活性化ベクトルのうちの各活性化ベクトルが、重み付けベクトルの関数であり、前記重み付けベクトルが、入力ベクトルに、前記活性化ベクトルに関連付けられた別個の重み行列を乗算することによって得られ、
前記方法が、
要素プロセッサを設けることと、
前記隠れ状態ベクトルの１つまたは複数の要素のセットのそれぞれについて別個のメモリ・アレイを設けることと、
前記１つまたは複数の要素のセットの計算を可能にする重み行列の列のグループを、前記メモリ・アレイに格納することと、
前記複数の活性化ベクトルの各々に関連付けられた前記列のグループのうちの１つまたは複数の列のセットを使用して、前記複数の活性化ベクトルの各々の１つまたは複数の要素を計算することと、
前記要素プロセッサにより、前記計算された１つまたは複数の要素に対する前記要素ごとのゲート演算を実行して、前記１つまたは複数の要素のセットを得ることと
を含む、方法。
前記隠れ状態ベクトルの１つまたは複数の要素の他のセットのそれぞれについて他の別個のメモリ・アレイを設けることと、
前記１つまたは複数の要素の他のセットの計算を可能にする重み行列の他の列のグループを前記他のメモリ・アレイに格納することと、
前記複数の活性化ベクトルの各々に関連付けられた前記他の列のグループのうちの１つまたは複数の列の他のセットを使用して、前記複数の活性化ベクトルの各々の１つまたは複数の要素を計算することと、
前記要素プロセッサにより、前記計算された１つまたは複数の要素に対する前記要素ごとのゲート演算を実行して、前記１つまたは複数の要素の他のセットを得ることと
をさらに含む、請求項１に記載の方法。
前記他の列のグループを格納することと、前記複数の活性化ベクトルの各々の前記１つまたは複数の要素を計算することと、前記要素プロセッサにより、前記計算された要素に対する前記要素ごとのゲート演算を実行することとが、同時に実行される、請求項２に記載の方法。
前記他の別個のメモリ・アレイを設けるここと、前記他の列のグループを格納することと、前記複数の活性化ベクトルの各々の前記１つまたは複数の要素を計算することと、前記要素プロセッサにより、前記計算された要素に対する前記要素ごとのゲート演算を実行することとが、前記隠れ状態ベクトルのすべての要素が計算されるまで繰り返され、
要素の１つのセットを一度に計算するように、前記要素プロセッサに多重化機能が設けられる、請求項２に記載の方法。
前記１つまたは複数の要素のセットのうちの各要素が、前記隠れ状態ベクトルにそれぞれの要素位置を有し、
前記計算された１つまたは複数の要素が、前記複数の活性化ベクトルの前記計算された１つまたは複数の要素の複数のセットをそれぞれ含み、
前記１つまたは複数の計算された要素の各セットが、前記それぞれの活性化ベクトルに１つまたは複数の要素位置のセットを含み、
前記活性化ベクトルの各々の１つまたは複数の要素を計算することが、
前記入力ベクトルの値をメモリ・アレイで受け取り、前記重み付けベクトルの結果要素のセットを、それぞれ前記関連付けられた１つまたは複数の列のセットから出力することであって、前記結果要素のセットが前記重み付けベクトルに前記１つまたは複数の要素位置のセットを含む、前記受け取り出力することと、
前記結果要素のセットを前記要素プロセッサに送ることと、
前記結果要素のセットを使用して、前記活性化ベクトルの前記計算された１つまたは複数の要素のセットの計算を実行することと
を含む、請求項１に記載の方法。
前記メモリ・アレイが、行線と、前記行線に交差する列線と、前記行線および前記列線によって形成された接合点で前記行線と前記列線との間に結合された計算メモリとを含み、
前記計算メモリのうちの１つの計算メモリが、前記列のグループのうちの１つまたは複数の列の要素の値を表し、
前記列のグループを格納することが、前記メモリ・アレイのそれぞれの単一の列線の計算メモリに前記列のグループのうちの各列のすべての要素を格納することを含む、請求項１に記載の方法。
前記計算メモリが、抵抗メモリ要素、スタティック・ランダム・アクセス・メモリ（ＳＲＡＭ）要素、またはフラッシュ・メモリ要素のうちのいずれか１つである、請求項６に記載の方法。
隠れ状態ベクトルを有するゲート・リカレント・ニューラル・ネットワーク（ＲＮＮ）のためのコンピュータ・プログラム製品であって、
前記隠れ状態ベクトルが、複数の活性化ベクトルの要素ごとのゲート演算によって定義され、前記複数の活性化ベクトルのうちの各活性化ベクトルが、重み付けベクトルの関数であり、前記重み付けベクトルが、入力ベクトルに、前記活性化ベクトルに関連付けられた別個の重み行列を乗算することによって得られ、
前記コンピュータ・プログラム製品が、
１つまたは複数の非一過性コンピュータ可読記憶媒体と、
前記１つまたは複数の非一過性コンピュータ可読記憶媒体に格納された、方法を実行可能なプログラム命令と
を含み、
前記方法が、
要素プロセッサを設けることと、
前記隠れ状態ベクトルの１つまたは複数の要素のセットのそれぞれについて別個のメモリ・アレイを設けることと、
前記１つまたは複数の要素のセットの計算を可能にする重み行列の列のグループを、前記メモリ・アレイに格納することと、
前記複数の活性化ベクトルの各々に関連付けられた前記列のグループのうちの１つまたは複数の列のセットを使用して、前記複数の活性化ベクトルの各々の１つまたは複数の要素を計算することと、
前記要素プロセッサにより、前記計算された１つまたは複数の要素に対する前記要素ごとのゲート演算を実行して、前記１つまたは複数の要素の前記セットを得ることと
を含む、
コンピュータ・プログラム製品。
前記隠れ状態ベクトルの１つまたは複数の要素の他のセットのそれぞれについて他の別個のメモリ・アレイを設けることと、
前記１つまたは複数の要素の他のセットの計算を可能にする重み行列の他の列のグループを前記他のメモリ・アレイに格納することと、
前記複数の活性化ベクトルの各々に関連付けられた前記他の列のグループのうちの１つまたは複数の列の他のセットを使用して、前記複数の活性化ベクトルの各々の１つまたは複数の要素を計算することと、
前記要素プロセッサにより、前記計算された１つまたは複数の要素に対する前記要素ごとのゲート演算を実行して、前記１つまたは複数の要素の他のセットを得ることと
をさらに含む、請求項８に記載のコンピュータ・プログラム製品。
前記他の列のグループを格納することと、前記複数の活性化ベクトルの各々の前記１つまたは複数の要素を計算することと、前記要素プロセッサにより、前記計算された要素に対する前記要素ごとのゲート演算を実行することとが、同時に実行される、請求項９に記載のコンピュータ・プログラム製品。
前記他の別個のメモリ・アレイを設けることと、前記他の列のグループを格納することと、前記複数の活性化ベクトルの各々の前記１つまたは複数の要素を計算することと、前記要素プロセッサにより、前記計算された要素に対する前記要素ごとのゲート演算を実行することとが、前記隠れ状態ベクトルのすべての要素が計算されるまで繰り返され、
要素の１つのセットを一度に計算するように、前記要素プロセッサに多重化機能が設けられる、請求項９に記載のコンピュータ・プログラム製品。
前記１つまたは複数の要素のセットのうちの各要素が、前記隠れ状態ベクトルにそれぞれの要素位置を有し、
前記計算された１つまたは複数の要素が、前記複数の活性化ベクトルの前記計算された１つまたは複数の要素の複数のセットをそれぞれ含み、
前記１つまたは複数の計算された要素の各セットが、前記それぞれの活性化ベクトルに１つまたは複数の要素位置のセットを含み、
前記活性化ベクトルの各々の１つまたは複数の要素を計算することが、
前記入力ベクトルの値をメモリ・アレイで受け取り、前記重み付けベクトルの結果要素のセットを、それぞれ前記関連付けられた１つまたは複数の列のセットから出力することであって、前記結果要素のセットが前記重み付けベクトルに前記１つまたは複数の要素位置のセットを含む、前記受け取り出力することと、
前記結果要素のセットを前記要素プロセッサに送ることと、
前記結果要素のセットを使用して、前記活性化ベクトルの前記計算された１つまたは複数の要素のセットの計算を実行することと
を含む、請求項８に記載のコンピュータ・プログラム製品。
前記メモリ・アレイが、行線と、前記行線に交差する列線と、前記行線および前記列線によって形成された接合点で前記行線と前記列線との間に結合された計算メモリとを含み、
前記計算メモリのうちの１つの計算メモリが、前記列のグループのうちの１つまたは複数の列の要素の値を表し、
前記列のグループを格納することが、前記メモリ・アレイのそれぞれの単一の列線の計算メモリに前記列のグループのうちの各列のすべての要素を格納することを含む、請求項８に記載のコンピュータ・プログラム製品。
前記計算メモリが、抵抗メモリ要素、スタティック・ランダム・アクセス・メモリ（ＳＲＡＭ）要素、またはフラッシュ・メモリ要素のうちのいずれか１つである、請求項１３に記載のコンピュータ・プログラム製品。
隠れ状態ベクトルを有するゲート・リカレント・ニューラル・ネットワーク（ＲＮＮ）のためのコンピュータ・システムであって、
前記隠れ状態ベクトルが、複数の活性化ベクトルの要素ごとのゲート演算によって定義され、前記複数の活性化ベクトルのうちの各活性化ベクトルが、重み付けベクトルの関数であり、前記重み付けベクトルが、入力ベクトルに、前記活性化ベクトルに関連付けられた別個の重み行列を乗算することによって得られ、
前記コンピュータ・システムが、
１つまたは複数のコンピュータ・プロセッサと、
１つまたは複数のコンピュータ可読記憶媒体と、
前記コンピュータ可読記憶媒体のうちの１つまたは複数に格納された、方法を実行可能な前記１つまたは複数のプロセッサのうちの少なくとも１つにより実行するためのプログラム命令と
を含み、
前記方法が、
要素プロセッサを設けることと、
前記隠れ状態ベクトルの１つまたは複数の要素のセットのそれぞれについて別個のメモリ・アレイを設けることと、
前記１つまたは複数の要素のセットの計算を可能にする重み行列の列のグループを、前記メモリ・アレイに格納することと、
前記複数の活性化ベクトルの各々に関連付けられた前記列のグループのうちの１つまたは複数の列のセットを使用して、前記複数の活性化ベクトルの各々の１つまたは複数の要素を計算することと、
前記要素プロセッサにより、前記計算された１つまたは複数の要素に対する前記要素ごとのゲート演算を実行して、前記１つまたは複数の要素のセットを得ることと
を含む、
コンピュータ・システム。
前記隠れ状態ベクトルの１つまたは複数の要素の他のセットのそれぞれについて他の別個のメモリ・アレイを設けることと、
前記１つまたは複数の要素の他のセットの計算を可能にする重み行列の他の列のグループを前記他のメモリ・アレイに格納することと、
前記複数の活性化ベクトルの各々に関連付けられた前記他の列のグループのうちの１つまたは複数の列の他のセットを使用して、前記複数の活性化ベクトルの各々の１つまたは複数の要素を計算することと、
前記要素プロセッサにより、前記計算された１つまたは複数の要素に対する前記要素ごとのゲート演算を実行して、前記１つまたは複数の要素の他のセットを得ることと
をさらに含む、請求項１５に記載のコンピュータ・システム。
前記他の列のグループを格納することと、前記複数の活性化ベクトルの各々の前記１つまたは複数の要素を計算することと、前記要素プロセッサにより、前記計算された要素に対する前記要素ごとのゲート演算を実行することとが、同時に実行される、請求項１６に記載のコンピュータ・システム。
前記他の別個のメモリ・アレイを設けることと、前記他の列のグループを格納することと、前記複数の活性化ベクトルの各々の前記１つまたは複数の要素を計算することと、前記要素プロセッサにより、前記計算された要素に対する前記要素ごとのゲート演算を実行することとが、前記隠れ状態ベクトルのすべての要素が計算されるまで繰り返され、
要素の１つのセットを一度に計算するように、前記要素プロセッサに多重化機能が設けられる、請求項１６に記載のコンピュータ・システム。
前記１つまたは複数の要素のセットのうちの各要素が、前記隠れ状態ベクトルにそれぞれの要素位置を有し、
前記計算された１つまたは複数の要素が、前記複数の活性化ベクトルの前記計算された１つまたは複数の要素の複数のセットをそれぞれ含み、
前記１つまたは複数の計算された要素の各セットが、前記それぞれの活性化ベクトルに１つまたは複数の要素位置のセットを含み、
前記活性化ベクトルの各々の１つまたは複数の要素を計算することが、
前記入力ベクトルの値をメモリ・アレイで受け取り、前記重み付けベクトルの結果要素のセットを、それぞれ前記関連付けられた１つまたは複数の列のセットから出力することであって、前記結果要素のセットが前記重み付けベクトルに前記１つまたは複数の要素位置のセットを含む、前記受け取り出力することと、
前記結果要素のセットを前記要素プロセッサに送ることと、
前記結果要素のセットを使用して、前記活性化ベクトルの前記計算された１つまたは複数の要素のセットの計算を実行することと
を含む、請求項１５に記載のコンピュータ・システム。
前記メモリ・アレイが、行線と、前記行線に交差する列線と、前記行線および前記列線によって形成された接合点で前記行線と前記列線との間に結合された計算メモリとを含み、
前記計算メモリのうちの１つの計算メモリが、前記列のグループのうちの１つまたは複数の列の要素の値を表し、
前記列のグループを格納することが、前記メモリ・アレイのそれぞれの単一の列線の計算メモリに前記列のグループのうちの各列のすべての要素を格納することを含む、請求項１５に記載のコンピュータ・システム。