JP2023088730A

JP2023088730A - 演算システム

Info

Publication number: JP2023088730A
Application number: JP2021203643A
Authority: JP
Inventors: ラドゥベルダン; Berdan Radu; 大輔宮下; Daisuke Miyashita; 淳出口; Atsushi Deguchi
Original assignee: Kioxia Corp
Current assignee: Kioxia Corp
Priority date: 2021-12-15
Filing date: 2021-12-15
Publication date: 2023-06-27
Also published as: TWI827119B; TW202326405A; US20230185529A1; CN116263745A

Abstract

【課題】一つの実施形態は、複数の信号が効率的に利用可能である演算システムを提供することを目的とする。【解決手段】一つの実施形態によれば、複数の乗算素子と複数の加算素子と第１処理回路と第２処理回路とを有する演算システムが提供される。複数の乗算素子は、複数行及び複数列を構成するように配列される。複数の乗算素子は、複数の第１信号に重みを乗算して複数の計算結果を生成する。複数の加算素子は、複数列ごとに複数の計算結果のうちの各列の計算結果の和を計算して複数の第２信号を生成する。処理回路は、加算素子が生成した複数の第２信号を受ける。第１処理回路は、複数の第２信号のうちの一部の第２信号に対応する値を抽出する。第２処理回路は、複数の第２信号に対応する複数のアドレス回路を含む。第２処理回路は、複数のアドレス回路のうち一部の第２信号に対応するアドレス回路を選択的にイネーブルする。【選択図】図６

Description

本実施形態は、演算システムに関する。

演算システムでは、所定の演算を行い、演算結果として複数の信号が生成されることがある。演算システムでは、生成された複数の信号が効率的に利用可能であることが望まれる。

特許第６５６４３７５号公報国際公開第２０１９／１６０１３３号特許第６１６０９５８号公報

一つの実施形態は、複数の信号が効率的に利用可能である演算システムを提供することを目的とする。

一つの実施形態によれば、複数の乗算素子と複数の加算素子と第１処理回路と第２処理回路とを有する演算システムが提供される。複数の乗算素子は、複数行及び複数列を構成するように配列される。複数の乗算素子は、複数の第１信号に重みを乗算して複数の計算結果を生成する。複数の加算素子は、複数列ごとに複数の計算結果のうちの各列の計算結果の和を計算して複数の第２信号を生成する。処理回路は、加算素子が生成した複数の第２信号を受ける。第１処理回路は、複数の第２信号のうちの一部の第２信号に対応する値を抽出する。第２処理回路は、複数の第２信号に対応する複数のアドレス回路を含む。第２処理回路は、複数のアドレス回路のうち一部の第２信号に対応するアドレス回路を選択的にイネーブルする。

第１の実施形態におけるニューラルネットワークの概略構成を示す図。第１の実施形態における演算システムの具体的な構成を示す図。第１の実施形態における処理回路の構成を示す回路図。第１の実施形態における処理回路の動作を示す波形図。第１の実施形態におけるアドレス解決回路の入出力信号を示す図。第１の実施形態におけるアドレス解決回路の構成を示す図。第１の実施形態におけるアドレス回路及びレジスタ回路の構成を示す回路図。第１の実施形態における記憶回路の構成を示す回路図。第１の実施形態におけるトライステートインバータの構成を示す回路図。第１の実施形態におけるアドレス解決回路の動作を示す波形図。第１の実施形態におけるアドレス解決回路の動作の一例を示す回路図。第１の実施形態におけるアドレス解決回路の動作の他の一例を示す回路図。第２の実施形態における処理回路の構成を示す回路図。第２の実施形態における処理回路の動作を示す波形図。第２の実施形態におけるアドレス解決回路の入出力信号を示す図。第２の実施形態におけるアドレス解決回路の構成を示す図。第２の実施形態におけるアドレス解決回路の動作を示す波形図。

以下に添付図面を参照して、実施形態にかかる演算システムを詳細に説明する。なお、これらの実施形態により本発明が限定されるものではない。

（第１の実施形態）
第１の実施形態にかかる演算システム１は、例えば、ニューラルネットワークの処理の一部を実行する回路を含む。ニューラルネットワークは、図１に示すように、入力層Ｘと出力層Ｙとの間に複数の中間層Ｈを有する。図１は、演算システム１がその一部の処理を実行するニューラルネットワークの概略構成を示す図である。図１では、簡略化のため、中間層Ｈを１層で示している。図１に示すように出力層Ｙの各ニューロンには中間層Ｈの複数のニューロン（図１では全てのニューロン）からの信号が入力されて処理が行われる。各ニューロンにおける処理はそれぞれ並行して処理される。この一連の処理で行われる具体的な演算は、例えばベクトルと行列の積となる。また、ニューラルネットワークでは、ある層の複数のニューロンで計算された値のうち、上位Ｋ個の値を見つけるための演算を行うことがある。

図２は、本実施形態にかかる演算システム１の具体的な構成を示す図である。本実施形態にかかる演算システム１は、ニューラルネットワークにおけるある層の複数のニューロンの計算を並行して行い、計算された値からある上位Ｋ個の値を見つける処理を行い、さらに、上位Ｋ個の値のアドレスを見つける処理を行う。ニューラルネットワークにおけるある層の複数のニューロンの計算は、図２に示すような複数の乗算素子のクロスバーアレイ構成で実現可能であり、ニューロンデータの活性化が物理的な信号で演算可能である。

図２に示す演算システム１は、複数のワードラインＷＬｊ～ＷＬｊ＋３、複数のビットラインＢＬｉ～ＢＬｉ＋３、メモリ配列ＭＡ、処理回路２、アドレス解決回路３を有する。

メモリ配列ＭＡは、複数のメモリＭ（ｊ，ｉ）～Ｍ（ｊ＋３，ｉ＋３）を有する。メモリ配列ＭＡでは、複数のメモリＭ（ｊ，ｉ）～Ｍ（ｊ＋３，ｉ＋３）が、複数のワードラインＷＬｊ～ＷＬｊ＋３と複数のビットラインＢＬｉ～ＢＬｉ＋３とが交差する位置に行列状に配される（ｉ，ｊは１以上の整数）。なお、図２はｊ行からｊ＋３行、ｉ列からｉ＋３列（４行×４列）を示したものであるが、これに限定されず、任意の行数及び列数を有し得る。処理回路２は、複数のビットラインＢＬｉ～ＢＬｉ＋３の各一端に接続される。アドレス解決回路３は、複数のビットラインＢＬｉ～ＢＬｉ＋３と反対側で処理回路２に接続される。

各メモリＭ（ｊ，ｉ）～Ｍ（ｊ＋３，ｉ＋３）は、その一端がワードラインＷＬに接続され、その他端がビットラインＢＬに接続される。各メモリＭ（ｊ，ｉ）～Ｍ（ｊ＋３，ｉ＋３）は、例えば抵抗変化型メモリであり、その抵抗状態が重みＷ_ｊ，ｉ～Ｗ_{ｊ＋３，ｉ＋３}に応じた抵抗値に設定され得る。各メモリＭ（ｊ，ｉ）～Ｍ（ｊ＋３，ｉ＋３）の抵抗値は、例えば、１／Ｗ_ｊ，ｉ～１／Ｗ_{ｊ＋３，ｉ＋３}に設定され得る。各メモリＭ（ｊ，ｉ）～Ｍ（ｊ＋３，ｉ＋３）は、受けた信号に重みＷ_ｊ，ｉ～Ｗ_{ｊ＋３，ｉ＋３}を乗算して乗算結果の信号を生成する乗算素子として機能する。各メモリＭ（ｊ，ｉ）～Ｍ（ｊ＋３，ｉ＋３）は、ワードラインＷＬの電圧Ｘが一端に印加され、ワードラインＷＬの電圧Ｘ及び設定された重みＷに応じて、乗算結果として電流をビットラインＢＬに流す。各列のメモリＭの電流は、ビットラインＢＬ上で加算され加算結果の電流Ｙとなる。すなわち、各ビットラインＢＬｉ～ＢＬｉ＋３は、列方向に並ぶ複数のメモリＭからの信号を加算する加算素子として機能する。

例えば、図２に点線の矢印で示すように、ｊ行のワードラインＷＬｊの電圧ＸｊがメモリＭ（ｊ，ｉ）の一端に印加され、メモリＭ（ｊ，ｉ）の他端からｉ行のビットラインＢＬｉに電流Ｘ_ｊ×Ｗ_ｊ，ｉが流される。ｊ＋３行のワードラインＷＬ_ｊ＋３の電圧Ｘ_ｊ＋３がメモリＭ（ｊ＋３，ｉ）の一端に印加され、メモリＭ（ｊ＋３，ｉ）の他端からｉ行のビットラインＢＬｉに電流Ｘ_ｊ＋３×Ｗ_{ｊ＋３，ｉ}が流される。電流Ｘ_ｊ×Ｗ_ｊ，ｉ～Ｘ_ｊ＋３×Ｗ_{ｊ＋３，ｉ}がビットラインＢＬｉ上で加算されて加算結果としての電流Ｙ_ｉ（＝Ｘ_ｊ×Ｗ_ｊ，ｉ＋Ｘ_ｊ＋１×Ｗ_{ｊ＋１，ｉ}＋Ｘ_ｊ＋２×Ｗ_{ｊ＋２，ｉ}＋Ｘ_ｊ＋３×Ｗ_{ｊ＋３，ｉ}）となる。

あるいは、図示しないが、ｊ行のワードラインＷＬｊの電圧ＸｊがメモリＭ（ｊ，ｉ＋３）の一端に印加され、メモリＭ（ｊ，ｉ＋３）の他端からｉ＋３行のビットラインＢＬｉ＋３に電流Ｘ_ｊ×Ｗ_{ｊ，ｉ＋３}が流される。ｊ＋３行のワードラインＷＬ_ｊ＋３の電圧Ｘ_ｊ＋３がメモリＭ（ｊ＋３，ｉ＋３）の一端に印加され、メモリＭ（ｊ＋３，ｉ＋３）の他端からｉ＋３行のビットラインＢＬｉ＋３に電流Ｘ_ｊ＋３×Ｗ_{ｊ＋３，ｉ＋３}が流される。電流Ｘ_ｊ×Ｗ_{ｊ，ｉ＋３}～Ｘ_ｊ＋３×Ｗ_{ｊ＋３，ｉ＋３}がビットラインＢＬｉ＋３上で加算されて加算結果としての電流Ｙ_ｉ＋３（＝Ｘ_ｊ×Ｗ_{ｊ，ｉ＋３}＋Ｘ_ｊ＋１×Ｗ_{ｊ＋１，ｉ＋３}＋Ｘ_ｊ＋２×Ｗ_{ｊ＋２，ｉ＋３}＋Ｘ_ｊ＋３×Ｗ_{ｊ＋３，ｉ＋３}）となる。

処理回路２は、ビットラインＢＬｉ～ＢＬｉ＋３を介して電流Ｙ_ｉ～Ｙ_ｉ＋３が供給される。電流Ｙ_ｉ～Ｙ_ｉ＋３は、処理回路２への入力ノードに蓄積される電圧Ｖ_ｉ～Ｖ_ｉ＋３に対応している。各電圧Ｖ_ｉ～Ｖ_ｉ＋３は、列ごとの積和演算結果を示すアナログ信号である。処理回路２において、アナログ信号（電圧Ｖ）は、列ごとに、処理回路２でデジタル信号へＡＤ変換される。処理回路２は、複数列のデジタル信号のうち上位Ｋ個の値のデジタル信号を抽出し、複数の上位フラグ値を生成する。複数の上位フラグ値は、複数列のデジタル信号に対応する。各上位フラグ値は、上位Ｋ個の値のデジタル信号であるか否かを示す。

アドレス解決回路３は、複数列に対応する複数のアドレス回路を含む。各アドレス回路は、アドレス信号を出力可能に構成されている。アドレス信号は、対応する列のアドレスを示す。アドレス解決回路３は、複数の上位フラグ値を処理回路２から取得する。アドレス解決回路３は、複数の上位フラグ値に応じて、複数のアドレス回路のうち上位Ｋ個のデジタル信号に対応するアドレス回路を選択的にイネーブルする。アドレス解決回路３は、それぞれがイネーブルされたＫ個のアドレス回路から順次にアドレス信号を出力させる。

これにより、上位Ｋ個のデジタル信号について、Ｋサイクルの処理でアドレス解決でき、列数のサイクルの処理でアドレス解決する場合に比べて、効率的にアドレス解決を行うことができる。

次に、処理回路２の構成について図３を用いて説明する。図３は、処理回路２の構成を示す回路図である。

処理回路２は、複数のビットラインＢＬから受けた複数列の乗算結果に対応する信号に対して、複数のＳＡＲ型ＡＤ変換処理を並行して行いながら、それらの上位Ｋ個の信号の探索を行う。処理回路２は、複数のローカル回路２１－ｉ，２１－（ｉ＋１）、グローバル回路２２、及びコントローラ２３を有する。グローバル回路２２は、グローバルＳＡＲ用ＤＡＣ２２１及びパラレルカウンタ２２２を有する。

図３では、図示の簡略化のため、第ｉ列のローカル回路２１－ｉ、第ｉ＋１列のローカル回路２１－（ｉ＋１）を例示しているが、処理回路２は、乗算素子Ｍの配列の列数に応じて、任意の数のローカル回路が設けられ得る。

各列のローカル回路２１は、コンパレータ２１１及びロジック回路２１２を有する。ロジック回路２１２は、ＡＮＤゲート２１３、フリップフロップ２１４、及びＡＮＤゲート２１５を有する。各列のローカル回路２１は、共通の構成を有している。

コンパレータ２１１は、入力された信号Ｖ_ｉ，Ｖ_ｉ＋１と、グローバルＳＡＲ用ＤＡＣ２２１により供給されたグローバル参照信号Ｖ_ＤＡＣとを比較する。コンパレータ２１１は、クロックＣＬＫ１に応じて、比較結果として、２値（Ｌ／Ｈまたは０／１）化されたローカル信号ｙ_ｉ，ｙ_ｉ＋１を出力する。コンパレータ２１１は、ロジック回路２１２からディスエーブル信号ＤＩＳＡＢＬＥ_ｉ，ＤＩＳＡＢＬＥ_ｉ＋１を受ける。コンパレータ２１１は、ディスエーブル信号ＤＩＳＡＢＬＥ_ｉ，ＤＩＳＡＢＬＥ_ｉ＋１に応じて、ディスエーブルする。

ＡＮＤゲート２１３は、ローカル信号ｙ_ｉ，ｙ_ｉ＋１を論理反転させた信号とグローバル信号ＴＯＰ＿Ｋとの論理積を演算し、演算結果をフリップフロップ２１４へ出力する。ＡＮＤゲート２１５は、上位フラグＭＡＸ_ｉ，ＭＡＸ_ｉ＋１とクロックＣＬＫ２との論理積を演算し、演算結果をクロック信号としてフリップフロップ２１４へ出力する。フリップフロップ２１４は、ＡＮＤゲート２１３の演算結果をデータ入力端子Ｄで受け、ＡＮＤゲート２１５の演算結果をクロック入力端子で受ける。

フリップフロップ２１４は、処理回路２に入力される複数列の信号Ｖのうち対応する列の信号Ｖ_ｉ，Ｖ_ｉ＋１が最大レベルの信号であるか否かを示す上位フラグＭＡＸ_ｉ，ＭＡＸ_ｉ＋１を反転出力端子ｎＱから出力する。フリップフロップ２１４は、ラッチ回路であってもよい。フリップフロップ２１４は、対応する列の信号Ｖ_ｉ，Ｖ_ｉ＋１が最大レベルの信号でない場合にコンパレータ２１１をディスエーブルするためのディスエーブル信号ＤＩＳＡＢＬＥ_ｉ，ＤＩＳＡＢＬＥ_ｉ＋１を非反転出力端子Ｑから出力する。ディスエーブル信号ＤＩＳＡＢＬＥ_ｉ，ＤＩＳＡＢＬＥ_ｉ＋１は、処理回路２による逐次比較（ＳＡＲ）動作中に複数のコンパレータ２１１で消費される電力を制限する（ｐｏｗｅｒｇａｔｉｎｇ）ために用いられ得る。

フリップフロップ２１４は、ＡＮＤゲート２１５から出力されるクロック信号に同期して動作する。ＡＮＤゲート２１５は、上位フラグＭＡＸ_ｉ，ＭＡＸ_ｉ＋１がＬレベルであるときに、ディスエーブル信号ＤＩＳＡＢＬＥ_ｉ，ＤＩＳＡＢＬＥ_ｉ＋１の状態を変化させないようにクロックＣＬＫ２を制限する（ｃｌｏｃｋｇａｔｉｎｇ）ために設けられている。すなわち、コンパレータ２１１がディスエーブルされた列のフリップフロップ２１４は、上位フラグＭＡＸがＬレベルになっていることで、クロック入力端子で受けるクロック信号がＬレベル固定となることに応じて、ディスエーブル信号ＤＩＳＡＢＬＥをＨレベルに維持し、上位フラグＭＡＸをＬレベルに維持する。

各列のコンパレータ２１１の反転入力端子（－）は、グローバルＳＡＲ用ＤＡＣ２２１により並行して駆動され、ＳＡＲアルゴリズムに従って最上位ビット（ＭＳＢ）から最下位ビット（ＬＳＢ）まで信号Ｖがシーケンシャルに処理される。グローバルＳＡＲ用ＤＡＣ２２１は、グローバルＳＡＲレジスタ２２１ａ及びグローバルＤＡＣ２２１ｂを有する。グローバルＳＡＲレジスタ２２１ａは、複数段のレジスタを有するシフトレジスタであり、入力された値及び各段の値をクロックＣＬＫ１に同期してシフトさせる。グローバルＳＡＲレジスタ２２１ａは、その起動時に、最上段のレジスタに初期値として“１”を格納するように構成されている。グローバルＤＡＣ２２１ｂは、シフトレジスタの各段の値を受けてＤＡ変換し、変還後のアナログ電圧をグローバル参照信号Ｖ_ＤＡＣとして出力する。

なお、コントローラ２３は、各列に個別に設けられるローカルコントローラであってもよく、各列に共通に設けられるグローバルコントローラであってもよい。図３では、コントローラ２３がグローバルコントローラとして例示されている。コントローラ２３は、タイミング、リセット、状態遷移に関する処理を制御する。例えば、コントローラ２３は、クロックＣＬＫ１を生成して各列のコンパレータ２１１及びグローバルＳＡＲレジスタ２２１ａへ供給する。コントローラ２３は、クロックＣＬＫ２を生成して各列のＡＮＤゲート２１５へ供給する。クロックＣＬＫ２は、クロックＣＬＫ１が論理的に反転されたクロックである。

グローバルＳＡＲレジスタ２２１ａにおけるＳＡＲ遷移を決める入力は、パラレルカウンタ２２２により駆動される。

パラレルカウンタ２２２は、ＤＡ変換のサイクルごとに、各列のコンパレータ２１１から出力されたローカル信号ｙ_ｉ，ｙ_ｉ＋１のうちいくつの出力がＨレベル（又は１）であるかをカウントし、カウント値に応じてグローバル信号ＴＯＰ＿Ｋを各列のＡＮＤゲート２１３及びグローバルＳＡＲレジスタ２２１ａへ出力する。グローバルＳＡＲレジスタ２２１ａは、グローバル信号ＴＯＰ＿Ｋが供給されると、初段のレジスタにグローバル信号ＴＯＰ＿Ｋの値を格納するとともに各段のレジスタに保持された値をシフトさせる。

上位Ｋ個の値を探索する場合、パラレルカウンタ２２２は、カウント値がＫ以上であれば、グローバル信号ＴＯＰ＿Ｋ＝Ｈレベル（又は１）を出力し、カウント値がＫ未満であれば、グローバル信号ＴＯＰ＿Ｋ＝Ｌレベル（又は０）を出力する。パラレルカウンタ２２２の具体的な構成は、デジタル回路で実装されてもよいし、アナログ回路で実装されてもよい。

例えば、処理回路２は、図４に示すように動作する。図４は、処理回路２の動作を示す波形図である。図４の上図は、縦軸が電圧の大きさを表し、横軸が時間を表す。図４の下図は、縦軸が各信号のレベル（例えば、Ｈレベル又はＬレベル）を表し、横軸が時間を表す。図４の上図と図４の下図とは、横軸が同じ時間を表す。図４では、第０列～第７列の信号Ｖ_０～Ｖ_７を受けた処理回路２が、４ビットの精度でＡＤ変換を行いながら上位Ｋ＝４個の値を探索する動作について例示される。

タイミングｔ１において、グローバルＳＡＲ用ＤＡＣ２２１は、グローバル参照電圧Ｖ_ＤＡＣ＝Ｖ_ＲＥＦ／２に設定する。各列（第０列～第７列）のコンパレータ２１１は、信号Ｖ_０～Ｖ_７とグローバル参照電圧Ｖ_ＤＡＣ＝Ｖ_ＲＥＦ／２とを比較し、比較結果としてローカル信号（ｙ_０，ｙ_１，ｙ_２，ｙ_３，ｙ_４，ｙ_５，ｙ_６，ｙ_７）＝（０，１，０，１，０，１，１，１）を出力する。

タイミングｔ２において、パラレルカウンタ２２２は、値が１であるローカル信号の数をカウントし、カウント値＝４がＫ＝４以上であることに応じて、グローバル信号ＴＯＰ＿ＫをＬレベル（又は０）からＨレベル（又は１）へ遷移させる。

タイミングｔ３において、第０，２，４列（ｉ＝０，２，４）のロジック回路２１２は、ローカル信号ｙ_ｉ＝０でグローバル信号ＴＯＰ＿Ｋ＝１であり信号Ｖ_ｉが上位Ｋ個のうちの一つとなる可能性がないことに応じて、上位フラグＭＡＸ_ｉをＨ（又は１）からＬ（又は０）に変更し、ディスエーブル信号ＤＩＳＡＢＬＥ_ｉをＬ（又は０）からＨ（又は１）に変更する。これにより、第０，２，４列のコンパレータ２１１は、信号Ｖ_ｉの波形において点線で示すように、ディスエーブル信号ＤＩＳＡＢＬＥ_ｉ＝Ｈ（又は１）を受けて動作がディスエーブルされ、コンパレータ２１１による電力消費が停止（ｐｏｗｅｒｇａｔｉｎｇ）される。

一方、第１，３，５～７列（ｉ＝１，３，５～７）のロジック回路２１２は、ローカル信号ｙ_ｉ＝１でグローバル信号ＴＯＰ＿Ｋ＝１であり信号Ｖ_ｉが上位Ｋ個のうちの一つとなる可能性があることに応じて、上位フラグをＭＡＸ_ｉ＝Ｈ（又は１）に維持し、ディスエーブル信号をＤＩＳＡＢＬＥ_ｉ＝Ｌ（又は０）に維持する。

タイミングｔ４において、グローバルＳＡＲ用ＤＡＣ２２１は、グローバル参照電圧Ｖ_ＤＡＣ＝３Ｖ_ＲＥＦ／４に設定する。第１，３，５，６列（ｉ＝１，３，５，６）のコンパレータ２１１から出力されるローカル信号ｙｉ＝０であり、タイミングｔ５において、グローバル信号ＴＯＰ＿Ｋ＝０となる。このことは、Ｋ個未満の信号がグローバル参照信号Ｖ_ＤＡＣより高いことを意味している。この場合、複数の信号Ｖ_１，Ｖ_３，Ｖ_５～Ｖ_７のうちどの信号が上位Ｋ個の信号であるか判断できないので、判断が保留される。

タイミングｔ６において、グローバルＳＡＲ用ＤＡＣ２２１は、グローバル参照電圧Ｖ_ＤＡＣ＝５Ｖ_ＲＥＦ／８に設定する。第３，６列（ｉ＝３，６）のコンパレータ２１１から出力されるローカル信号ｙｉ＝１であるが、第１，５列（ｉ＝１，５）のコンパレータ２１１から出力されるローカル信号ｙｉ＝０であり、グローバル信号ＴＯＰ＿Ｋ＝０に維持される。このことは、依然として、Ｋ個未満の信号がグローバル参照信号Ｖ_ＤＡＣより高いことを意味している。この場合も、引き続き、判断が保留される。

タイミングｔ７において、グローバルＳＡＲ用ＤＡＣ２２１は、グローバル参照電圧Ｖ_ＤＡＣ＝９Ｖ_ＲＥＦ／１６に設定する。この時点でディスエーブルされていない各列（第１，３，５～７列）のコンパレータ２１１は、信号Ｖ_１，Ｖ_３，Ｖ_５～Ｖ_７とグローバル参照電圧Ｖ_ＤＡＣ＝９／１６Ｖ_ＲＥＦとを比較し、比較結果としてローカル信号（ｙ_１，ｙ_３，ｙ_５，ｙ_６，ｙ_７）＝（１，１，０，１，１）を出力する。

タイミングｔ８において、パラレルカウンタ２２２は、値が１であるローカル信号の数をカウントし、カウント値＝４がＫ＝４以上であることに応じて、グローバル信号ＴＯＰ＿ＫをＬレベル（又は０）からＨレベル（又は１）へ遷移させる。

タイミングｔ９において、第５列（ｉ＝５）のロジック回路２１２は、ローカル信号ｙ_ｉ＝０でグローバル信号ＴＯＰ＿Ｋ＝１であり信号Ｖ_ｉが上位Ｋ個のうちの一つとなる可能性がないことに応じて、上位フラグＭＡＸ_ｉをＨ（又は１）からＬ（又は０）に変更し、ディスエーブル信号ＤＩＳＡＢＬＥ_ｉをＬ（又は０）からＨ（又は１）に変更する。これにより、第５列のコンパレータ２１１は、信号Ｖ_ｉの波形において点線で示すように、ディスエーブル信号ＤＩＳＡＢＬＥ_ｉ＝Ｈ（又は１）を受けて動作がディスエーブルされ、コンパレータ２１１による電力消費が停止（ｐｏｗｅｒｇａｔｉｎｇ）される。

一方、第１，３，６，７列（ｉ＝１，３，６，７）のロジック回路２１２は、ローカル信号ｙ_ｉ＝１でグローバル信号ＴＯＰ＿Ｋ＝１であり信号Ｖ_ｉが上位Ｋ個のうちの一つとなる可能性があることに応じて、上位フラグをＭＡＸ_ｉ＝Ｈ（又は１）に維持し、ディスエーブル信号をＤＩＳＡＢＬＥ_ｉ＝Ｌ（又は０）に維持する。

変換の精度に応じたビット数をＢとするとき、Ｂ＝４サイクル後のタイミングｔ１０において、処理回路２は、上位Ｋ個の値を探索した結果として、上位フラグ（ＭＡＸ_０，ＭＡＸ_１，ＭＡＸ_２，ＭＡＸ_３，ＭＡＸ_４，ＭＡＸ_５，ＭＡＸ_６，ＭＡＸ_７）＝（０，１，０，１，０，０，１，１）をアドレス解決回路３へ出力する。この例では、探索した結果として、第０列～第７列の信号Ｖ_０～Ｖ_７のうち、第１，３，６，７列の信号Ｖ_１，Ｖ_３，Ｖ_６，Ｖ_７が上位Ｋ個の値として探索されたことが示されている。

図５に示すアドレス解決回路３は、上位フラグ（ＭＡＸ_０，ＭＡＸ_１，ＭＡＸ_２，ＭＡＸ_３，ＭＡＸ_４，ＭＡＸ_５，ＭＡＸ_６，ＭＡＸ_７）＝（０，１，０，１，０，０，１，１）を処理回路２から受け、クロックＣＬＫを外部（例えば、図示しないコントローラ）から受ける。図５は、アドレス解決回路３の入出力信号を示す図である。図５では、列の数が８である場合が例示される。アドレス解決回路３は、上位フラグＭＡＸを論理反転させて、反転上位フラグ（ＭＡＸ_０￣，ＭＡＸ_１￣，ＭＡＸ_２￣，ＭＡＸ_３￣，ＭＡＸ_４￣，ＭＡＸ_５￣，ＭＡＸ_６￣，ＭＡＸ_７￣）＝（１，０，１，０，１，１，０，０）を生成してもよい。アドレス解決回路３は、上位フラグＭＡＸ、反転上位フラグＭＡＸ￣、クロックＣＬＫを用いて、上位フラグＭＡＸ_０～ＭＡＸ_７に対応する信号のアドレス解決を行い、その結果として上位Ｋ個のアドレス信号をアドレスバスａｄｄｒ＜０：７＞へ順次に出力し得る。

アドレス解決回路３は、図６に示すように構成され得る。図６は、アドレス解決回路３の概略構成を示す回路図である。図６は、複数のメモリＭ（ｊ，ｉ）～Ｍ（ｊ＋３，ｉ＋３）の配列における第ｉからｉ＋３列（列の数が４）に対応した構成を例示しているが、これに限定されず、メモリＭの配列に応じて任意の列数に対応した構成を有し得る。

アドレス解決回路３は、図６に示すように、複数のアドレス回路３１－ｉ～３１－（ｉ＋３）に加えて、シフトレジスタ３３、出力回路３４、転送検知回路３５、グローバル回路３６を含む。

複数のアドレス回路３１－ｉ～３１－（ｉ＋３）のそれぞれは、メモリ配列ＭＡの複数列（第ｉ～（ｉ＋３）列）に対応する。シフトレジスタ３３は、複数のレジスタ回路３２－ｉ～３２－（ｉ＋３）を含む。複数のレジスタ回路３２－ｉ～３２－（ｉ＋３）は、入力ノード３３ａ及び出力ノード３３ｂ間に直列に接続される。各レジスタ回路３２は、レジスタ３２１を含む。レジスタ３２１は、フリップフロップで構成され得る。複数のレジスタ回路３２－ｉ～３２－（ｉ＋３）のそれぞれは、複数のアドレス回路３１－ｉ～３１－（ｉ＋３）に対応する。

グローバル回路３６は、外部からクロックＣＬＫを受け、クロックＣＬＫに応じてクロックＣＬＫ＿ＴＯＰＫ、イネーブル信号ＴＯＰＫ＿ＥＮ、パルスＴＯＰＫ＿ＳＴＡＲＴを生成する。グローバル回路３６は、クロックＣＬＫに同期して、イネーブル信号ＴＯＰＫ＿ＥＮをアクティブレベルにして出力回路３４へ供給する。出力回路３４は、イネーブル信号ＴＯＰＫ＿ＥＮがアクティブレベルであることに応じて活性化され、アドレスバスａｄｄｒ＜０：７＞上の信号をアドレス信号ａｄｄｒとして出力可能な状態になる。

グローバル回路３６は、イネーブル信号ＴＯＰＫ＿ＥＮがアクティブレベルになることに応じて、パルスＴＯＰＫ＿ＳＴＡＲＴをシフトレジスタ３３の先頭のレジスタ回路３２－ｉへ供給する。グローバル回路３６は、クロックＣＬＫを論理反転させてクロックＣＬＫ＿ＴＯＰＫを生成し、クロックＣＬＫ＿ＴＯＰＫを各レジスタ回路３２のレジスタ３２１へ供給する。

シフトレジスタ３３は、複数列の上位フラグＭＡＸｉに応じて、再構成可能である。アドレス解決回路３は、複数のレジスタ回路３２－ｉ～３２－（ｉ＋３）のうち、上位Ｋ個の上位フラグ値に対応するレジスタ回路３２で入力ノード３２ａ及び出力ノード３２ｂ間にレジスタ３２１を接続する。アドレス解決回路３は、残りのレジスタ回路３２で入力ノード３２ａ及び出力ノード３２ｂ間でレジスタ３２１をバイパスする。これにより、アドレス解決回路３は、シフトレジスタ３３を再構成する。

再構成されたシフトレジスタ３３は、単独で供給されるパルスＴＯＰＫ＿ＳＴＡＲＴが入力される。シフトレジスタ３３は、パルスＴＯＰＫ＿ＳＴＡＲＴを、上位Ｋ個の上位フラグ値に対応するレジスタ３２１間で順次にシフトさせて伝送させる。これに応じて、複数のアドレス回路３１－ｉ～３１－（ｉ＋３）のうち上位Ｋ個の上位フラグ値に対応するアドレス回路３１が選択的に順次にイネーブルされる。これにより、上位Ｋ個の上位フラグ値に対応するアドレス回路３１からアドレス信号が順次にアドレスバスａｄｄｒ＜０：７＞に出力される。すなわち、上位Ｋ個の信号に対応するＫ個のアドレス信号が、Ｋサイクルでアドレス解決されるようにシフトレジスタ３３を再構成できるので、アドレス解決回路３を上位の個数「Ｋ」に対してスケーラブルに構成できる。

レジスタ回路３２は、上位フラグＭＡＸｉ～ＭＡＸｉ＋３及び反転上位フラグＭＡＸｉ￣～ＭＡＸｉ＋３￣に応じて第１の接続状態と第２の接続状態とを切り替え可能である。第１の接続状態は、入力ノード３２ａ及び出力ノード３２ｂ間にレジスタ３２１が接続された状態である。第２の接続状態は、入力ノード３２ａ及び出力ノード３２ｂ間でレジスタ３２１がバイパスされた状態である。

転送検知回路３５は、最終のレジスタ回路３２－（ｉ＋３）からパルスＴＯＰＫ＿ＳＴＡＲＴを受けると、シフトレジスタ３３におけるパルスＴＯＰＫ＿ＳＴＡＲＴの転送が完了したことを示すパルスＴＯＰＫ＿ｎＳＴＯＰを生成してグローバル回路３６へ供給する。転送検知回路３５は、フリップフロップで構成され得る。グローバル回路３６は、パルスＴＯＰＫ＿ｎＳＴＯＰを受けると、イネーブル信号ＴＯＰＫ＿ＥＮをノンアクティブレベルにして出力回路３４へ供給する。出力回路３４は、イネーブル信号ＴＯＰＫ＿ＥＮをノンアクティブレベルであることに応じて非活性化され、アドレスバスａｄｄｒ＜０：７＞上の信号を出力しない状態になる。

複数のアドレス回路３１－ｉ～３１－（ｉ＋３）のそれぞれは、固定的にアドレス信号を保持可能であり、ハードワイアード回路を用いて構成されてもよい。各アドレス回路３１は、記憶回路３１１及びイネーブル回路３１２を有する。

記憶回路３１１は、アドレス信号を記憶する。記憶回路３１１は、アドレス信号を固定的に記憶してもよい。

イネーブル回路３１２は、上位フラグ値ＭＡＸｉ～ＭＡＸｉ＋３と対応するレジスタ回路３２の接続状態とに応じて、記憶回路３１１をイネーブル又はディスエーブルできる。記憶回路３１１がイネーブルされると、アドレス信号が記憶回路３１１からアドレスバスａｄｄｒ＜０：７＞に出力される状態になる。記憶回路３１１がディスエーブルされると、アドレス信号が記憶回路３１１からアドレスバスａｄｄｒ＜０：７＞に出力されない状態になる。

例えば、８ビットのアドレスを記憶する場合、第ｉ列の記憶回路３１１は、図７及び図８に示すように、ハードワイアード回路３１１ａを含んでもよい。図７は、第ｉ列に対応するアドレス回路３１及びレジスタ回路３２の構成を示す回路図である。アドレス解決回路３は複数列（図６の場合、第ｉ～ｉ＋３列）に対応する構成を含むが、図７は、その１列分の単位構成を示しているとみることもできる。図８は、記憶回路３１１の構成を示す回路図である。図８に示すハードワイアード回路３１１ａは、複数のトライステートインバータＩＶ０～ＩＶ７、複数のラインＢ０～Ｂ７、複数のラインｎＢ０～ｎＢ７、共通ラインＥ、共通ラインｎＥを有する。

複数のラインｎＢ０～ｎＢ７と複数のトライステートインバータＩＶ０～ＩＶ７と複数のラインＢ０～Ｂ７とは、それぞれ互いに対応する。ラインｎＢ０、トライステートインバータＩＶ０、ラインＢ０がアドレスのＬＳＢに対応し、ラインｎＢ７、トライステートインバータＩＶ７、ラインＢ７がアドレスのＭＳＢに対応する。共通ラインＥ及び共通ラインｎＥは、それぞれ、複数のトライステートインバータＩＶ０～ＩＶ７により共有される。複数のラインＢ０～Ｂ７のそれぞれは、アドレスバスに含まれる複数のアドレス線ａｄｄｒ＜０＞～ａｄｄｒ＜７＞に対応する。

各ラインｎＢ０～ｎＢ７は、ハードワイアード接続され、アドレス信号に応じた固定電位に接続される。図８の例では、記憶回路３１１がアドレス００００００１１ｂ（１０進表記では「３」）を固定的に記憶する場合が例示される。記憶回路３１１のハードワイアード回路３１１ａにおいて、ラインｎＢ０～ｎＢ１がグランド電位に固定的に接続され、ラインｎＢ２～ｎＢ７が電源電位Ｖｄｄに固定的に接続される。グランド電位がＬレベル又はレベル「０」に対応し、電源電位ＶｄｄがＨレベル又はレベル「１」に対応する。各ラインｎＢ０～ｎＢ７には、（ｎＢ０，ｎＢ１，ｎＢ２，ｎＢ３，ｎＢ４，ｎＢ５，ｎＢ６，ｎＢ７）＝（０，０，１，１，１，１，１，１）のレベルが設定されている。各ラインＢ０～Ｂ７は、対応するトライステートインバータＩＶを介して対応するラインｎＢに接続される。

各トライステートインバータＩＶ０～ＩＶ７は、図９に示すように構成され得る。図９は、トライステートインバータＩＶの構成を示す回路図である。

トライステートインバータＩＶは、ＮＭＯＳトランジスタＮＭ１、ＮＭＯＳトランジスタＮＭ２、ＰＭＯＳトランジスタＰＭ１、ＰＭＯＳトランジスタＰＭ２を有する。ＮＭＯＳトランジスタＮＭ１及びＰＭＯＳトランジスタＰＭ１は、インバータ接続され、共通の入力ノードＮ１と共通の出力ノードＮ２とを有する。ＮＭＯＳトランジスタＮＭ２及びＰＭＯＳトランジスタＰＭ２は、インバータ接続を活性化・非活性化するためのスイッチとしてインバータ接続の出力ノードＮ２に挿入されている。

ＮＭＯＳトランジスタＮＭ１は、グランド電位及びＮＭＯＳトランジスタＮＭ２の間に接続される。ＮＭＯＳトランジスタＮＭ２は、ＮＭＯＳトランジスタＮＭ１及びＰＭＯＳトランジスタＰＭ２の間に接続される。ＰＭＯＳトランジスタＰＭ２は、ＮＭＯＳトランジスタＮＭ２及びＰＭＯＳトランジスタＰＭ１の間に接続される。ＰＭＯＳトランジスタＰＭ１は、ＰＭＯＳトランジスタＰＭ２及び電源電位Ｖｄｄの間に接続される。

ＮＭＯＳトランジスタＮＭ１は、ソースがグランド電位に接続され、ドレインがＮＭＯＳトランジスタＮＭ２に接続され、ゲートが入力ノードＮ１を介してラインｎＢに接続される。

ＮＭＯＳトランジスタＮＭ２は、ソースがＮＭＯＳトランジスタＮＭ１に接続され、ドレインが出力ノードＮ２を介してラインＢに接続され、ゲートがラインＥに接続される。

ＰＭＯＳトランジスタＰＭ１は、ソースが電源電位に接続され、ドレインがＰＭＯＳトランジスタＰＭ２に接続され、ゲートが入力ノードＮ１を介してラインｎＢに接続される。

ＰＭＯＳトランジスタＰＭ２は、ソースがＰＭＯＳトランジスタＰＭ１に接続され、ドレインが出力ノードＮ２を介してラインＢに接続され、ゲートがラインｎＥに接続される。

各トライステートインバータＩＶ０～ＩＶ７は、共通ラインＥのレベルがアクティブレベル（例えば、Ｈレベル）に設定され、共通ラインｎＥがアクティブレベル（例えば、Ｌレベル）に設定された際に、活性化され、インバータとして動作する。図８に示す例では、共通ラインＥ，ｎＥがそれぞれアクティブレベルに設定された場合、ラインＢ０～Ｂ７は、それぞれ、（Ｂ０，Ｂ１，Ｂ２，Ｂ３，Ｂ４，Ｂ５，Ｂ６，Ｂ７）＝（１，１，０，０，０，０，０，０）のレベルをアドレス信号として、対応するアドレス線ａｄｄｒへ出力する。この例では、Ｂ０がＬＳＢに対応し、Ｂ７がＭＳＢに対応するので、アドレス値としては、２進表記で「００００００１１」であり、１０進表記で「３」である。

各トライステートインバータＩＶ０～ＩＶ７は、共通ラインＥのレベルがノンアクティブレベル（例えば、Ｌレベル）に設定され、共通ラインｎＥがノンアクティブレベル（例えば、Ｈレベル）に設定された際に、非活性化され、インバータとしての動作を停止する。図８に示す例では、共通ラインＥ，ｎＥがそれぞれノンアクティブレベルに設定された場合、ラインＢ０～Ｂ７は、それぞれ、（Ｂ０，Ｂ１，Ｂ２，Ｂ３，Ｂ４，Ｂ５，Ｂ６，Ｂ７）＝（ＨｉＺ，ＨｉＺ，ＨｉＺ，ＨｉＺ，ＨｉＺ，ＨｉＺ，ＨｉＺ，ＨｉＺ）のレベルになり、アドレス信号を出力しない。「ＨｉＺ」は、ハイインピーダンスを表す。

図７に戻って、第ｉ列のイネーブル回路３１２は、ＮＡＮＤゲート３１２ａ及びインバータ３１２ｂを有する。ＮＡＮＤゲート３１２ａは、処理回路２の第ｉ列のローカル回路２１－ｉに接続された入力ノード３１２ａ１と第ｉ列のレジスタ回路３２－ｉに接続された入力ノード３１２ａ２とノード３１２ｃに接続された出力ノード３１２ａ３とを有する。インバータ３１２ｂは、ノード３１２ｃに接続された入力ノード３１２ｂ１とラインＥに接続された出力ノード３１２ｂ２とを有する。ノード３１２ｃは、ＮＡＮＤゲート３１２ａ及びインバータ３１２ｂに接続されるとともにラインｎＥに接続される。

第ｉ列のレジスタ回路３２は、レジスタ３２１に加えて、信号ラインＬ１、バイパスラインＬ２、スイッチ３２２、スイッチ３２３、スイッチ３２４、スイッチ３２５を含む。レジスタ３２１－ｉは、フリップフロップで構成され得る。スイッチ３２２、スイッチ３２３、スイッチ３２４は、切替素子の一例であり、例えばトランジスタで構成される。

信号ラインＬ１及びバイパスラインＬ２は、入力ノード３２ａ及び出力ノード３２ｂの間で互いに並列に接続される。信号ラインＬ１は、入力ノード３２ａに接続される第１端と出力ノード３２ｂに接続される第２端とを有する。バイパスラインＬ２は、入力ノード３２ａに接続される第１端と出力ノード３２ｂに接続される第２端とを有する。

スイッチ３２２は、信号ラインＬ１上に配され、上位フラグＭＡＸｉに応じてオン・オフする。スイッチ３２２は、上位フラグＭＡＸｉがアクティブレベル（Ｈレベル又はレベル「１」）の際にオンすることで信号ラインＬ１の一部を活性化する。スイッチ３２２は、上位フラグＭＡＸｉがノンアクティブレベル（Ｌレベル又はレベル「０」）の際にオフすることで信号ラインＬ１の一部を非活性化する。スイッチ３２２は、入力ノード３２ａに接続される第１端とレジスタ３２１－ｉのデータ入力ノードＤに接続された第２端とを有する。

スイッチ３２３は、信号ラインＬ１上に配され、上位フラグＭＡＸｉに応じてオン・オフする。スイッチ３２２は、上位フラグＭＡＸｉがアクティブレベル（Ｈレベル又はレベル「１」）の際にオンすることで信号ラインＬ１の一部を活性化する。スイッチ３２２は、上位フラグＭＡＸｉがノンアクティブレベル（Ｌレベル又はレベル「０」）の際にオフすることで信号ラインＬ１の一部を非活性化する。スイッチ３２３は、レジスタ３２１－ｉの出力ノードＱに接続された第１端と出力ノード３２ｂに接続される第２端とを有する。

スイッチ３２４は、バイパスラインＬ２上に配され、反転上位フラグＭＡＸｉ￣に応じてオン・オフする。反転上位フラグＭＡＸｉ￣は、上位フラグＭＡＸｉが論理反転されて得られる。スイッチ３２４は、反転上位フラグＭＡＸｉ￣がアクティブレベル（Ｈレベル又はレベル「１」）の際にオンすることでバイパスラインＬ２を活性化する。スイッチ３２４は、反転上位フラグＭＡＸｉ￣がノンアクティブレベル（Ｌレベル又はレベル「０」）の際にオフすることでバイパスラインＬ２を非活性化する。スイッチ３２４は、入力ノード３２ａに接続される第１端と出力ノード３２ｂに接続される第２端とを有する。

スイッチ３２５は、信号ラインＬ１及びグランド電位の間に設定され、反転上位フラグＭＡＸｉ￣に応じてオン・オフする。スイッチ３２５は、反転上位フラグＭＡＸｉ￣がアクティブレベル（Ｈレベル又はレベル「１」）の際にオンすることで信号ラインＬ１をグランド電位（又は、Ｌレベル）に設定する。スイッチ３２５は、反転上位フラグＭＡＸｉ￣がノンアクティブレベル（Ｌレベル又はレベル「０」）の際にオフすることで信号ラインＬ１の電位設定を解除する。

例えば、アドレス解決回路３は、図１０に示すように動作する。図１０は、アドレス解決回路３の動作を示す波形図である。図１０では、処理回路２が図４に示すように動作する場合に対応する。図１０では、列の数が８（第０列～第７列）であり、アドレス解決回路３が処理回路２から上位フラグ（ＭＡＸ_０，ＭＡＸ_１，ＭＡＸ_２，ＭＡＸ_３，ＭＡＸ_４，ＭＡＸ_５，ＭＡＸ_６，ＭＡＸ_７）＝（０，１，０，１，０，０，１，１）を受けた場合の動作を例示する。

タイミングｔ１１において、グローバル回路３６（図６参照）は、クロックＣＬＫに同期して、イネーブル信号ＴＯＰＫ＿ＥＮをノンアクティブレベル（例えば、Ｌレベル）からアクティブレベル（例えば、Ｈレベル）へ遷移させ出力回路３４へ供給する。出力回路３４は、アドレスバスａｄｄｒ＜０：７＞上の信号を出力可能な状態になる。

グローバル回路３６は、クロックＣＬＫに同期して、クロックＣＬＫの１周期のパルス幅で単独のパルスＴＯＰＫ＿ＳＴＡＲＴを生成しシフトレジスタ３３の先頭のレジスタ回路３２－０へ供給する。

このとき、図１１（ａ）に示すように、上位フラグ（ＭＡＸ_０，ＭＡＸ_１，ＭＡＸ_２，ＭＡＸ_３，ＭＡＸ_４，ＭＡＸ_５，ＭＡＸ_６，ＭＡＸ_７）＝（０，１，０，１，０，０，１，１）に応じて、シフトレジスタ３３が再構成される。

上位フラグＭＡＸ_０＝０、反転上位フラグＭＡＸ_０￣＝１に応じて、レジスタ回路３２－０は、入力ノード３２ａ及び出力ノード３２ｂ間でレジスタ３２１がバイパスされた第２の接続状態に切り替えられる。

上位フラグＭＡＸ_１＝１、反転上位フラグＭＡＸ_１￣＝０に応じて、レジスタ回路３２－１は、入力ノード３２ａ及び出力ノード３２ｂ間にレジスタ３２１が接続された第１の接続状態に切り替えられる。

上位フラグＭＡＸ_２＝０、反転上位フラグＭＡＸ_２￣＝１に応じて、レジスタ回路３２－２は、入力ノード３２ａ及び出力ノード３２ｂ間でレジスタ３２１がバイパスされた第２の接続状態に切り替えられる。

上位フラグＭＡＸ_３＝１、反転上位フラグＭＡＸ_３￣＝０に応じて、レジスタ回路３２－３は、入力ノード３２ａ及び出力ノード３２ｂ間にレジスタ３２１が接続された第１の接続状態に切り替えられる。

上位フラグＭＡＸ_４＝０、反転上位フラグＭＡＸ_４￣＝１に応じて、レジスタ回路３２－４は、入力ノード３２ａ及び出力ノード３２ｂ間でレジスタ３２１がバイパスされた第２の接続状態に切り替えられる。

上位フラグＭＡＸ_５＝０、反転上位フラグＭＡＸ_５￣＝１に応じて、レジスタ回路３２－５は、入力ノード３２ａ及び出力ノード３２ｂ間でレジスタ３２１がバイパスされた第２の接続状態に切り替えられる。

上位フラグＭＡＸ_６＝１、反転上位フラグＭＡＸ_６￣＝０に応じて、レジスタ回路３２－６は、入力ノード３２ａ及び出力ノード３２ｂ間にレジスタ３２１が接続された第１の接続状態に切り替えられる。

上位フラグＭＡＸ_７＝１、反転上位フラグＭＡＸ_７￣＝０に応じて、レジスタ回路３２－７は、入力ノード３２ａ及び出力ノード３２ｂ間にレジスタ３２１が接続された第１の接続状態に切り替えられる。

図１１（ａ）の例では、アドレス解決回路３は、上位フラグＭＡＸ＝１に対応するレジスタ回路３２－１，３２－３，３２－６，３２－７で入力ノード及び出力ノード間にレジスタ３２１を接続する。またアドレス解決回路３は、上位フラグＭＡＸ＝０に対応するレジスタ回路３２－０，３２－２，３２－４，３２－５でレジスタ３２１をバイパスして入力ノード３２ａ及び出力ノード３２ｂ間を接続する。これにより、シフトレジスタ３３では、入力ノード３３ａ及び出力ノード３３ｂ間にレジスタ３２１－１，３２－３，３２－６，３２－７が選択的に接続された構成に、再構成される。レジスタ３２１－１，３２－３，３２－６，３２－７は、処理回路２で特定された上位Ｋ個の信号に対応する。

図１０に示すタイミングｔ１２において、クロックＣＬＫ＿ＴＯＰＫの立ち上がりエッジに応じて、再構成されたシフトレジスタ３３における先頭のレジスタ３２１－１でパルスＴＯＰＫ＿ＳＴＡＲＴが保持され、レジスタ３２１－１の出力が０から１になる。これに応じて、図１１（ｂ）に示すように、セレクト信号ＳＥＬ１が０から１になり、アドレス回路３１－１のイネーブル回路３１２が共通ラインＥをアクティブレベル（例えば、Ｈレベル）にし共通ラインｎＥをアクティブレベル（例えば、Ｌレベル）にする。これにより、アドレス回路３１－１の記憶回路３１１が活性化される。記憶回路３１１は、上位フラグＭＡＸ_１に対応する信号のアドレス値をアドレスバスａｄｄｒ＜０：７＞へ出力する。ラインＢ０～Ｂ７は、それぞれ、（Ｂ０，Ｂ１，Ｂ２，Ｂ３，Ｂ４，Ｂ５，Ｂ６，Ｂ７）＝（１，０，０，０，０，０，０，０）の値をアドレス信号として、対応するアドレス線ａｄｄｒへ出力する。この例では、Ｂ０がＬＳＢに対応し、Ｂ７がＭＳＢに対応するので、アドレス値としては、２進表記で「０００００００１」であり、１０進表記で「１」である。

図１０に示すタイミングｔ１３において、クロックＣＬＫ＿ＴＯＰＫの立ち上がりエッジに応じて、パルスＴＯＰＫ＿ＳＴＡＲＴが、再構成されたシフトレジスタ３３における先頭のレジスタ３２１－１から２番目のレジスタ３２１－４にシフトされ、レジスタ３２１－１の出力が１から０になるとともにレジスタ３２１－３の出力が０から１になる。

これに応じて、図１１（ｃ）に示すように、セレクト信号ＳＥＬ１が１から０になり、アドレス回路３１－１のイネーブル回路３１２が共通ラインＥをノンアクティブレベル（例えば、Ｌレベル）にし共通ラインｎＥをノンアクティブレベル（例えば、Ｈレベル）にする。これにより、アドレス回路３１－１の記憶回路３１１が非活性化される。

それとともに、セレクト信号ＳＥＬ３が０から１になり、アドレス回路３１－３のイネーブル回路３１２が共通ラインＥをアクティブレベル（例えば、Ｈレベル）にし共通ラインｎＥをアクティブレベル（例えば、Ｌレベル）にする。これにより、アドレス回路３１－３の記憶回路３１１が活性化される。記憶回路３１１は、上位フラグＭＡＸ_３に対応する信号のアドレス値をアドレスバスａｄｄｒ＜０：７＞へ出力する。ラインＢ０～Ｂ７は、それぞれ、（Ｂ０，Ｂ１，Ｂ２，Ｂ３，Ｂ４，Ｂ５，Ｂ６，Ｂ７）＝（１，１，０，０，０，０，０，０）のレベルをアドレス信号として、対応するアドレス線ａｄｄｒへ出力する。この例では、Ｂ０がＬＳＢに対応し、Ｂ７がＭＳＢに対応するので、アドレス値としては、２進表記で「００００００１１」であり、１０進表記で「３」である。

図１０に示すタイミングｔ１４において、クロックＣＬＫ＿ＴＯＰＫの立ち上がりエッジに応じて、パルスＴＯＰＫ＿ＳＴＡＲＴが、再構成されたシフトレジスタ３３における２番目のレジスタ３２１－４から３番目のレジスタ３２１－６にシフトされ、レジスタ３２１－３の出力が１から０になるとともにレジスタ３２１－６の出力が０から１になる。

これに応じて、図１２（ａ）に示すように、セレクト信号ＳＥＬ３が１から０になり、アドレス回路３１－３のイネーブル回路３１２が共通ラインＥをノンアクティブレベル（例えば、Ｌレベル）にし共通ラインｎＥをノンアクティブレベル（例えば、Ｈレベル）にする。これにより、アドレス回路３１－３の記憶回路３１１が非活性化される。

それとともに、セレクト信号ＳＥＬ６が０から１になり、アドレス回路３１－６のイネーブル回路３１２が共通ラインＥをアクティブレベル（例えば、Ｈレベル）にし共通ラインｎＥをアクティブレベル（例えば、Ｌレベル）にする。これにより、アドレス回路３１－６の記憶回路３１１が活性化される。記憶回路３１１は、上位フラグＭＡＸ_６に対応する信号のアドレス値をアドレスバスａｄｄｒ＜０：７＞へ出力する。ラインＢ０～Ｂ７は、それぞれ、（Ｂ０，Ｂ１，Ｂ２，Ｂ３，Ｂ４，Ｂ５，Ｂ６，Ｂ７）＝（０，１，１，０，０，０，０，０）のレベルをアドレス信号として、対応するアドレス線ａｄｄｒへ出力する。この例では、Ｂ０がＬＳＢに対応し、Ｂ７がＭＳＢに対応するので、アドレス値としては、２進表記で「０００００１１０」であり、１０進表記で「６」である。

図１０に示すタイミングｔ１５において、クロックＣＬＫ＿ＴＯＰＫの立ち上がりエッジに応じて、パルスＴＯＰＫ＿ＳＴＡＲＴが、再構成されたシフトレジスタ３３における３番目のレジスタ３２１－６から最終のレジスタ３２１－７にシフトされ、レジスタ３２１－６の出力が１から０になるとともにレジスタ３２１－７の出力が０から１になる。

これに応じて、図１２（ｂ）に示すように、セレクト信号ＳＥＬ６が１から０になり、アドレス回路３１－６のイネーブル回路３１２が共通ラインＥをノンアクティブレベル（例えば、Ｌレベル）にし共通ラインｎＥをノンアクティブレベル（例えば、Ｈレベル）にする。これにより、アドレス回路３１－６の記憶回路３１１が非活性化される。

それとともに、セレクト信号ＳＥＬ７が０から１になり、アドレス回路３１－７のイネーブル回路３１２が共通ラインＥをアクティブレベル（例えば、Ｈレベル）にし共通ラインｎＥをアクティブレベル（例えば、Ｌレベル）にする。これにより、アドレス回路３１－７の記憶回路３１１が活性化される。記憶回路３１１は、上位フラグＭＡＸ_７に対応する信号のアドレス値をアドレスバスａｄｄｒ＜０：７＞へ出力する。ラインＢ０～Ｂ７は、それぞれ、（Ｂ０，Ｂ１，Ｂ２，Ｂ３，Ｂ４，Ｂ５，Ｂ６，Ｂ７）＝（１，１，１，０，０，０，０，０）のレベルをアドレス信号として、対応するアドレス線ａｄｄｒへ出力する。この例では、Ｂ０がＬＳＢに対応し、Ｂ７がＭＳＢに対応するので、アドレス値としては、２進表記で「０００００１１１」であり、１０進表記で「７」である。

図１０に示すタイミングｔ１６において、クロックＣＬＫ＿ＴＯＰＫの立ち上がりエッジに応じて、パルスＴＯＰＫ＿ＳＴＡＲＴが、シフトレジスタ３３の最終のレジスタ３２１－７から転送検知回路３５へ転送され、レジスタ３２１－７の出力が１から０になるとともに転送検知回路３５の出力が０から１になる。

これに応じて、セレクト信号ＳＥＬ７が１から０になり、アドレス回路３１－７のイネーブル回路３１２が共通ラインＥをノンアクティブレベル（例えば、Ｌレベル）にし共通ラインｎＥをノンアクティブレベル（例えば、Ｈレベル）にする。これにより、アドレス回路３１－７の記憶回路３１１が非活性化される。それとともに、転送検知回路３５は、１になった出力をパルスＴＯＰＫ＿ｎＳＴＯＰとしてグローバル回路３６へ供給する。

パルスＴＯＰＫ＿ｎＳＴＯＰに応じて、タイミングｔ１７において、グローバル回路３６は、クロックＣＬＫに同期して、イネーブル信号ＴＯＰＫ＿ＥＮをアクティブレベル（例えば、Ｈレベル）からノンアクティブレベル（例えば、Ｌレベル）へ遷移させて出力回路３４へ供給する。出力回路３４は、アドレスバスａｄｄｒ＜０：７＞上の信号を出力しない状態になる。これにより、アドレス解決回路３からアドレスバスａｄｄｒ＜０：７＞へのアドレス信号の出力が完了する。

タイミングｔ１８において、転送検知回路３５の出力が１から０になり、転送検知回路３５からグローバル回路３６への通知が完了する。

演算システム１におけるアドレス解決は、次の（１）～（３）のシーケンスで行われる。

（１）複数行及び複数列を構成する複数のメモリ素子の配列において、各行に入力されたワードライン電圧と各メモリ素子の重みとの積が列ごとのビットライン電流として加算される積和演算が行われる。処理回路２は、複数列の積和演算結果の信号を処理するとともに、複数列に対応する複数の上位フラグＭＡＸを生成する。処理回路２は、複数列の積和演算結果のうち上位Ｋ個の積和演算結果に対応する上位フラグをＭＡＸ＝１とし、残りの上位フラグをＭＡＸ＝０とする。複数列の上位フラグＭＡＸは、処理回路２からアドレス解決回路３へ供給される。

（２）アドレス解決回路３は、複数列の上位フラグに応じて、複数列の積和演算結果のうち上位Ｋ個の積和演算結果の信号に対してアドレス解決を行う。すなわち、アドレス解決回路３は、複数列に対応しそれぞれがレジスタを含む複数のレジスタ回路のうち上位フラグＭＡＸ＝１に対応するレジスタ回路でレジスタを入出力ノード間に接続し上位フラグＭＡＸ＝０に対応するレジスタ回路でレジスタを入出力ノード間でバイパスさせる。これにより、アドレス解決回路３は、複数のレジスタ回路のレジスタのうち上位フラグＭＡＸ＝１に対応するＫ個のレジスタ３２１を選択的にシフトレジスタ３３の入出力ノード間に接続し、シフトレジスタ３３をＫビットのシフトレジスタとして再構成する。

（３）アドレス解決回路３は、再構成されたシフトレジスタ３３におけるＫ段のレジスタ３２１に１ビットのパルスを順次に伝搬させ、それに応じて、複数列に対応する複数のアドレス回路のうち上位Ｋ個に対応するＫ個のアドレス回路を順次に選択的にイネーブルする。イネーブルされたアドレス回路では、例えばハードワイアード接続で記憶されたアドレス信号がアドレスバスへ出力される。これにより、上位Ｋ個の積和演算結果に対応するアドレス値が順次に出力され、Ｋサイクルでのアドレス解決が実現される。

以上のように、第１の実施形態では、演算システム１のアドレス解決回路３において、複数のアドレス回路３１をメモリ配列ＭＡの複数列に対応して設け、複数列の上位フラグに応じて、複数列の積和演算結果のうち上位Ｋ個の積和演算結果に対応したアドレス回路３１を選択的に順次にイネーブルしてアドレス値を出力させる。これにより、（列数以下の）Ｋサイクルの動作で上位Ｋ個の信号に対するアドレス解決を行うことができ、上位Ｋ個の信号に対するアドレス解決を効率的に行うことができる。これにより、メモリ配列ＭＡの複数列から出力される複数の信号のうち上位Ｋ個を利用したい場合等に、複数の信号が効率的に利用可能である。

例えば、上位Ｋ個の信号に対するアドレス解決をリニアサーチで行う場合、複数列の各列を順次に選択する。選択された列の上位フラグ値を確認し、上位フラグＭＡＸ＝１であればアドレス値を出力させ、上位フラグＭＡＸ＝０であればアドレス値を出力させない処理を、複数列の各列について順次に行う。このため、列数のサイクルの動作でアドレス解決を行うことになる。

それに対して、第１の実施形態では、列数以下のＫサイクルの動作で上位Ｋ個の信号に対するアドレス解決を行うことができ、上位Ｋ個の信号に対するアドレス解決をより効率的に行うことができる。

また、第１の実施形態では、演算システム１のアドレス解決回路３において、複数のアドレス回路３１のそれぞれがハードワイアード構成でアドレス値を記憶し、シフトレジスタ３３が複数列の上位フラグに応じてＫ個のレジスタが選択的に用いられるように再構成される。これにより、上位Ｋ個の信号に対応するＫ個のアドレス信号がＫサイクルでアドレス解決されるようにシフトレジスタ３３を再構成できるので、アドレス解決回路３を上位の個数「Ｋ」に対してスケーラブルに構成できる。したがって、アドレス解決回路３の回路設計を容易化でき、アドレス解決回路３の面積を低減できる。

（第２の実施形態）
次に、第２の実施形態にかかる演算システム４０１について説明する。以下では、第１の実施形態と異なる部分を中心に説明する。

第１の実施形態では、上位Ｋ個の信号に対するアドレス解決のための構成及び動作が例示されるが、第２の実施形態では、下位Ｋ個の信号に対するアドレス解決のための構成及び動作が例示される。

演算システム４０１は、処理回路２及びアドレス解決回路３（図２参照）に代えて、処理回路４０２及びアドレス解決回路４０３を有する。処理回路４０２は、図１３に示すように、下位Ｋ個の値を探索するように構成される。処理回路４０２は、ＳＡＲ型ＡＤ変換処理を行いながら下位Ｋ個の値を探索する回路である。図１３は、第２の実施形態における処理回路４０２の構成を示す回路図である。

各列のローカル回路４２１－ｉ，４２１－（ｉ＋１）は、コンパレータ２１１（図３参照）の２つの入力端子が入れ替えられたコンパレータ４２１１を有する。コンパレータ４２１１は、信号Ｖ_ｉ，Ｖ_ｉ＋１を反転入力端子（－）で受け、グローバル参照信号Ｖ_ＤＡＣを非反転入力端子（＋）で受ける。

グローバル回路４２２において、パラレルカウンタ４２２２は、ＤＡ変換のサイクルごとに、各列のコンパレータ４２１１から出力されたローカル信号ｙ_ｉ，ｙ_ｉ＋１のうちいくつの出力がＨレベル（又は１）であるかをカウントし、カウント値に応じてグローバル信号ＢＯＴ＿Ｋを各列のＡＮＤゲート２１３及びグローバルＳＡＲレジスタ４２２１ａへ出力する。下位Ｋ個の値を探索する場合、パラレルカウンタ４２２２は、カウント値がＫ以上であれば、グローバル信号ＢＯＴ＿Ｋ＝Ｈレベル（又は１）を出力し、カウント値がＫ未満であれば、グローバル信号ＢＯＴ＿Ｋ＝Ｌレベル（又は０）を出力する。グローバルＳＡＲレジスタ４２２１ａは、グローバル信号ＢＯＴ＿Ｋが供給されると、グローバル信号ＢＯＴ＿Ｋの値を論理反転させた値を初段のレジスタに格納するとともに各段のレジスタに保持された値をシフトさせる。

この構成により、処理回路４０２は、図１４に示すように、ＳＡＲ型ＡＤ変換処理を行いながら下位Ｋ個の値を探索する。図１４は、第２の実施形態における処理回路４０２の動作を示す波形図である。図１４の上図は、縦軸が電圧の大きさを表し、横軸が時間を表す。図１４の下図は、縦軸が各信号のレベル（例えば、Ｈレベル又はＬレベル）を表し、横軸が時間を表す。図１４の上図と図１４の下図とは、横軸が同じ時間を表す。図１４では、Ｋ＝４の場合を例示している。

各列のコンパレータ４２１１は、信号Ｖ_ｉを反転入力端子（－）で受け、グローバル参照電圧Ｖ_ＤＡＣを非反転入力端子（＋）で受けるので、信号Ｖ_ｉがグローバル参照電圧Ｖ_ＤＡＣより低ければローカル信号ｙ_ｉ＝１を出力し、信号Ｖ_ｉがグローバル参照電圧Ｖ_ＤＡＣより高ければローカル信号ｙ_ｉ＝０を出力する。

例えば、タイミングｔ３１において、グローバルＳＡＲ用ＤＡＣ４２２１は、グローバル参照電圧Ｖ_ＤＡＣ＝Ｖ_ＲＥＦ／２に設定する。各列のコンパレータ４２１１は、信号Ｖ_０～Ｖ_７と参照電圧Ｖ_ＤＡＣ＝Ｖ_ＲＥＦ／２とを比較し、比較結果としてローカル信号（ｙ_０，ｙ_１，ｙ_２，ｙ_３，ｙ_４，ｙ_５，ｙ_６，ｙ_７）＝（１，０，１，０，１，０，０，０）を出力する。これに応じて、パラレルカウンタ４２２２は、値が１であるローカル信号ｙ_ｉの数をカウントし、カウント値＝３がＫ＝４未満であることに応じて、タイミングｔ３２において、グローバル信号ＢＯＴ＿ＫがＬレベル（又は０）になり、グローバル信号の反転信号ＢＯＴ＿Ｋ￣はＨレベル（又は１）になる。図１４では、反転信号ＢＯＴ＿Ｋ￣のレベルが示されている。このことは、Ｋ個未満の信号がグローバル参照信号Ｖ_ＤＡＣより低いことを意味している。

タイミングｔ３３において、グローバルＳＡＲ用ＤＡＣ４２２１は、グローバル参照電圧Ｖ_ＤＡＣ＝３Ｖ_ＲＥＦ／４に設定する。各列のコンパレータ４２１１は、信号Ｖ_０～Ｖ_７と参照電圧Ｖ_ＤＡＣ＝３Ｖ_ＲＥＦ／４とを比較し、比較結果としてローカル信号（ｙ_０，ｙ_１，ｙ_２，ｙ_３，ｙ_４，ｙ_５，ｙ_６，ｙ_７）＝（１，１，１，１，１，１，１，０）を出力する。パラレルカウンタ４２２２は、値が１であるローカル信号ｙ_ｉの数をカウントし、カウント値＝７がＫ＝４以上であることに応じて、タイミングｔ３４において、グローバル信号ＢＯＴ＿ＫがＨレベル（又は１）になり、グローバル信号の反転信号ＢＯＴ＿Ｋ￣はＬレベル（又は０）になる。この場合、複数の信号Ｖ_０～Ｖ_６のうちどの信号が下位Ｋ個の信号であるか判断できないので、判断が保留される。

タイミングｔ３５において、第０～６列（ｉ＝０～６）のローカル回路４２１では、コンパレータ４２１１から出力されるローカル信号ｙ_ｉ＝１でグローバル信号ＢＯＴ＿Ｋ＝１であり、フリップフロップ２１４が、その出力をもとの状態に維持する。すなわち、第０～６列のフリップフロップ２１４は、下位フラグをＭＩＮ_ｉ＝Ｈ（又は１）に維持し、ディスエーブル信号をＤＩＳＡＢＬＥ_ｉ＝Ｌ（又は０）に維持する。一方、第７列（ｉ＝７）のローカル回路４２１では、コンパレータ４２１１から出力されるローカル信号ｙ_ｉ＝０でグローバル信号ＢＯＴ＿Ｋ＝１であり、フリップフロップ２１４が、その出力をもとの状態から変更する。すなわち、第７列のフリップフロップ２１４は、下位フラグをＭＩＮ_ｉ＝Ｈ（又は１）からＭＩＮ_ｉ＝Ｌ（又は０）に変更し、ディスエーブル信号をＤＩＳＡＢＬＥ_ｉ＝Ｌ（又は０）からＤＩＳＡＢＬＥ_ｉ＝Ｈ（又は１）に変更する。

これにより、タイミングｔ３５以降において、第７列（ｉ＝７）のコンパレータ４２１１は、ディスエーブル信号ＤＩＳＡＢＬＥ_ｉ＝Ｈ（又は１）を受けて動作がディスエーブルされ、図１４にＶ_ｉの波形において点線で示すように、コンパレータ４２１１による電力消費が停止（ｐｏｗｅｒｇａｔｉｎｇ）される。

タイミングｔ３６において、グローバルＳＡＲ用ＤＡＣ４２２１は、グローバル参照電圧Ｖ_ＤＡＣ＝５Ｖ_ＲＥＦ／８に設定する。この時点でディスエーブルされていない各列（第０～６列）のコンパレータ４２１１は、信号Ｖ_０～Ｖ_６とグローバル参照電圧Ｖ_ＤＡＣ＝５Ｖ_ＲＥＦ／８とを比較し、比較結果としてローカル信号（ｙ_０，ｙ_１，ｙ_２，ｙ_３，ｙ_４，ｙ_５，ｙ_６）＝（１，１，１，０，１，１，０）を出力する。その後、パラレルカウンタ４２２２は、値が１であるローカル信号の数をカウントし、カウント値＝５がＫ＝４以上であることに応じて、グローバル信号ＢＯＴ＿ＫをＨレベル（又は１）に維持し、グローバル信号の反転信号ＢＯＴ＿Ｋ￣をＬレベル（又は０）に維持する。

タイミングｔ３７において、第０～２，４，５列（ｉ＝０～２，４，５）のローカル回路４２１では、コンパレータ４２１１から出力されるローカル信号ｙ_ｉ＝１でグローバル信号ＢＯＴ＿Ｋ＝１であり、フリップフロップ２１４が、その出力をもとの状態に維持する。すなわち、第０～２，４，５列のフリップフロップ２１４は、下位フラグをＭＩＮ_ｉ＝Ｈ（又は１）に維持し、ディスエーブル信号をＤＩＳＡＢＬＥ_ｉ＝Ｌ（又は０）に維持する。一方、第３，６列（ｉ＝３，６）のローカル回路４２１では、コンパレータ４２１１から出力されるローカル信号ｙ_ｉ＝０でグローバル信号ＢＯＴ＿Ｋ＝１であり、フリップフロップ２１４が、その出力をもとの状態から変更する。すなわち、第３，６列のフリップフロップ２１４は、下位フラグをＭＩＮ_ｉ＝Ｈ（又は１）からＭＩＮ_ｉ＝Ｌ（又は０）に変更し、ディスエーブル信号をＤＩＳＡＢＬＥ_ｉ＝Ｌ（又は０）からＤＩＳＡＢＬＥ_ｉ＝Ｈ（又は１）に変更する。

これにより、タイミングｔ３７以降において、第３，６列（ｉ＝３，６）のコンパレータ４２１１は、ディスエーブル信号ＤＩＳＡＢＬＥ_ｉ＝Ｈ（又は１）を受けて動作がディスエーブルされ、図１４にＶ_ｉの波形において点線で示すように、コンパレータ４２１１による電力消費が停止（ｐｏｗｅｒｇａｔｉｎｇ）される。

タイミングｔ３８において、グローバルＳＡＲ用ＤＡＣ４２２１は、グローバル参照電圧Ｖ_ＤＡＣ＝９Ｖ_ＲＥＦ／１６に設定する。この時点でディスエーブルされていない各列（第０～２，４，５列）のコンパレータ４２１１は、信号Ｖ_０～Ｖ_２，Ｖ_４，Ｖ_５とグローバル参照電圧Ｖ_ＤＡＣ＝９Ｖ_ＲＥＦ／１６とを比較し、比較結果としてローカル信号（ｙ_０，ｙ_１，ｙ_２，ｙ_４，ｙ_５）＝（１，０，１，１，１）を出力する。その後、パラレルカウンタ４２２２は、値が１であるローカル信号の数をカウントし、カウント値＝４がＫ＝４以上であることに応じて、グローバル信号ＢＯＴ＿ＫをＨレベル（又は１）に維持し、グローバル信号の反転信号ＢＯＴ＿Ｋ￣をＬレベル（又は０）に維持する。

タイミングｔ３９において、第０，２，４，５列（ｉ＝０，２，４，５）のローカル回路４２１では、コンパレータ４２１１から出力されるローカル信号ｙ_ｉ＝１でグローバル信号ＢＯＴ＿Ｋ＝１であり、フリップフロップ２１４が、その出力をもとの状態に維持する。すなわち、第０，２，４，５列のフリップフロップ２１４は、下位フラグをＭＩＮ_ｉ＝Ｈ（又は１）に維持し、ディスエーブル信号をＤＩＳＡＢＬＥ_ｉ＝Ｌ（又は０）に維持する。一方、第１列（ｉ＝１）のローカル回路４２１では、コンパレータ４２１１から出力されるローカル信号ｙ_ｉ＝０でグローバル信号ＢＯＴ＿Ｋ＝１であり、フリップフロップ２１４が、その出力をもとの状態から変更する。すなわち、第１列のフリップフロップ２１４は、下位フラグをＭＩＮ_ｉ＝Ｈ（又は１）からＭＩＮ_ｉ＝Ｌ（又は０）に変更し、ディスエーブル信号をＤＩＳＡＢＬＥ_ｉ＝Ｌ（又は０）からＤＩＳＡＢＬＥ_ｉ＝Ｈ（又は１）に変更する。

これにより、タイミングｔ３９以降において、第１列（ｉ＝１）のコンパレータ４２１１は、ディスエーブル信号ＤＩＳＡＢＬＥ_ｉ＝Ｈ（又は１）を受けて動作がディスエーブルされ、図１４にＶ_ｉの波形において点線で示すように、コンパレータ４２１１による電力消費が停止（ｐｏｗｅｒｇａｔｉｎｇ）される。

変換の精度に応じたビット数をＢとするとき、Ｂ＝４サイクル後のタイミングｔ３３において、処理回路４０２は、下位Ｋ個の値探索の結果として、下位フラグ（ＭＩＮ_０，ＭＩＮ_１，ＭＩＮ_２，ＭＩＮ_３，ＭＩＮ_４，ＭＩＮ_５，ＭＩＮ_６，ＭＩＮ_７）＝（１，０，１，０，１，１，０，０）を出力する。この例では、下位Ｋ個の値探索の結果は、第０列～第７列の信号Ｖ_０～Ｖ_７のうち、第０，２，４，５列の信号Ｖ_０，Ｖ_２，Ｖ_４，Ｖ_５が下位Ｋ個の値として探索されたことを示している。

図１５に示すアドレス解決回路４０３は、下位フラグ（ＭＩＮ_０，ＭＩＮ_１，ＭＩＮ_２，ＭＩＮ_３，ＭＩＮ_４，ＭＩＮ_５，ＭＩＮ_６，ＭＩＮ_７）＝（１，０，１，０，１，１，０，０）を処理回路４０２から受け、クロックＣＬＫを外部（例えば、図１３のコントローラ２３）から受ける。図１５は、アドレス解決回路４０３の入出力信号を示す図である。図１５では、列の数が８である場合が例示される。アドレス解決回路４０３は、下位フラグを論理反転させて、反転下位フラグ（ＭＩＮ_０￣，ＭＩＮ_１￣，ＭＩＮ_２￣，ＭＩＮ_３￣，ＭＩＮ_４￣，ＭＩＮ_５￣，ＭＩＮ_６￣，ＭＩＮ_７￣）＝（０，１，０，１，０，０，１，１）を生成してもよい。アドレス解決回路３は、下位フラグＭＩＮ、反転下位フラグＭＩＮ￣、クロックＣＬＫを用いて、下位フラグＭＩＮ_０～ＭＩＮ_７に対応する信号のアドレス解決を行い、その結果として下位Ｋ個のアドレス信号をアドレスバスａｄｄｒ＜０：７＞へ順次に出力し得る。

アドレス解決回路４０３は、図１６に示すように構成され得る。図１６は、アドレス解決回路４０３の概略構成を示す回路図である。

アドレス解決回路４０３は、図１６に示すように、グローバル回路３６（図６参照）に代えて、グローバル回路４３６を有する。グローバル回路４３６は、外部からクロックＣＬＫを受け、クロックＣＬＫに応じてクロックＣＬＫ＿ＢＯＴＫ、イネーブル信号ＢＯＴＫ＿ＥＮ、パルスＢＯＴＫ＿ＳＴＡＲＴを生成する。グローバル回路４３６は、イネーブル信号ＢＯＴＫ＿ＥＮを出力回路３４へ供給し、パルスＢＯＴＫ＿ＳＴＡＲＴをシフトレジスタ３３の先頭のレジスタ３２１へ供給し、クロックＣＬＫ＿ＢＯＴＫをシフトレジスタ３３の各レジスタ３２１へ供給する。

シフトレジスタ３３は、複数列の下位フラグに応じて、再構成可能である。アドレス解決回路４０３は、複数のレジスタ回路３２－ｉ～３２－（ｉ＋３）のうち、下位Ｋ個の下位フラグ値に対応するレジスタ回路３２で入力ノード３２ａ及び出力ノード３２ｂ間にレジスタ３２１を接続する。アドレス解決回路４０３は、残りのレジスタ回路３２で入力ノード３２ａ及び出力ノード３２ｂ間でレジスタ３２１をバイパスする。これにより、アドレス解決回路４０３は、シフトレジスタ３３を再構成する。

再構成されたシフトレジスタ３３は、単独で供給されるパルスＢＯＴＫ＿ＳＴＡＲＴが入力される。シフトレジスタ３３は、パルスＢＯＴＫ＿ＳＴＡＲＴを、下位Ｋ個の下位フラグ値に対応するレジスタ３２１間で順次にシフトさせて伝送させる。これに応じて、複数のアドレス回路３１－ｉ～３１－（ｉ＋３）のうち下位Ｋ個の下位フラグ値に対応するアドレス回路３１が選択的に順次にイネーブルされる。これにより、下位Ｋ個の下位フラグ値に対応するアドレス回路３１からアドレス信号が順次にアドレスバスａｄｄｒ＜０：７＞に出力される。すなわち、下位Ｋ個の信号に対応するＫ個のアドレス信号が、Ｋサイクルでアドレス解決されるようにシフトレジスタ３３を再構成できるので、アドレス解決回路３を下位の個数「Ｋ」に対してスケーラブルに構成できる。

例えば、アドレス解決回路４０３は、図１７に示すように動作する。図１７は、アドレス解決回路４０３の動作を示す波形図である。図１７では、処理回路４０２が図１４に示すように動作する場合に対応する。図１７では、列の数が８（第０列～第７列）であり、アドレス解決回路３が処理回路２から下位フラグ（ＭＩＮ_０，ＭＩＮ_１，ＭＩＮ_２，ＭＩＮ_３，ＭＩＮ_４，ＭＩＮ_５，ＭＩＮ_６，ＭＩＮ_７）＝（１，０，１，０，１，１，０，０）を受けた場合の動作を例示する。

タイミングｔ４１において、グローバル回路４３６（図１６参照）は、クロックＣＬＫに同期して、イネーブル信号ＢＯＴＫ＿ＥＮをノンアクティブレベル（例えば、Ｌレベル）からアクティブレベル（例えば、Ｈレベル）へ遷移させ出力回路３４へ供給する。出力回路３４は、アドレスバスａｄｄｒ＜０：７＞上の信号を出力可能な状態になる。

グローバル回路４３６は、クロックＣＬＫに同期して、クロックＣＬＫの１周期のパルス幅で単独のパルスＢＯＴＫ＿ＳＴＡＲＴを生成しシフトレジスタ３３の先頭のレジスタ回路３２－０へ供給する。

このとき、下位フラグ（ＭＩＮ_０，ＭＩＮ_１，ＭＩＮ_２，ＭＩＮ_３，ＭＩＮ_４，ＭＩＮ_５，ＭＩＮ_６，ＭＩＮ_７）＝（１，０，１，０，１，１，０，０）に応じて、シフトレジスタ３３が再構成される。例えば、アドレス解決回路４０３は、下位フラグＭＩＮ＝１に対応するレジスタ回路３２－０，３２－２，３２－４，３２－５（図１１（ａ）参照）で入力ノード及び出力ノード間にレジスタ３２１を接続する。またアドレス解決回路４０３は、下位フラグＭＩＮ＝０に対応するレジスタ回路３２－１，３２－３，３２－６，３２－７でレジスタ３２１をバイパスして入力ノード３２ａ及び出力ノード間３２ｂを接続する。これにより、シフトレジスタ３３では、入力ノード３３ａ及び出力ノード３３ｂ間にレジスタ３２１－０，３２－２，３２－４，３２－５が選択的に接続された構成に、再構成される。レジスタ３２１－０，３２－２，３２－４，３２－５は、処理回路４０２で特定された下位Ｋ個の信号に対応する。

タイミングｔ４２において、クロックＣＬＫ＿ＢＯＴＫの立ち上がりエッジに応じて、再構成されたシフトレジスタ３３における先頭のレジスタ３２１－０でパルスＢＯＴＫ＿ＳＴＡＲＴが保持され、レジスタ３２１－１の出力が０から１になる。これに応じて、セレクト信号ＳＥＬ０が０から１になり、アドレス回路３１－０のイネーブル回路３１２が共通ラインＥをアクティブレベル（例えば、Ｈレベル）にし共通ラインｎＥをアクティブレベル（例えば、Ｌレベル）にする。これにより、アドレス回路３１－０の記憶回路３１１が活性化される。記憶回路３１１は、下位フラグＭＩＮ_０に対応する信号のアドレス値をアドレスバスａｄｄｒ＜０：７＞へ出力する。ラインＢ０～Ｂ７は、それぞれ、（Ｂ０，Ｂ１，Ｂ２，Ｂ３，Ｂ４，Ｂ５，Ｂ６，Ｂ７）＝（０，０，０，０，０，０，０，０）のレベルをアドレス信号として、対応するアドレス線ａｄｄｒへ出力する。この例では、Ｂ０がＬＳＢに対応し、Ｂ７がＭＳＢに対応するので、アドレス値としては、２進表記で「００００００００」であり、１０進表記で「０」である。

タイミングｔ４３において、クロックＣＬＫ＿ＢＯＴＫの立ち上がりエッジに応じて、パルスＢＯＴＫ＿ＳＴＡＲＴが、再構成されたシフトレジスタ３３における先頭のレジスタ３２１－０から２番目のレジスタ３２１－２にシフトされ、レジスタ３２１－０の出力が１から０になるとともにレジスタ３２１－２の出力が０から１になる。

これに応じて、セレクト信号ＳＥＬ０が１から０になり、アドレス回路３１－０のイネーブル回路３１２が共通ラインＥをノンアクティブレベル（例えば、Ｌレベル）にし共通ラインｎＥをノンアクティブレベル（例えば、Ｈレベル）にする。これにより、アドレス回路３１－０の記憶回路３１１が非活性化される。

それとともに、セレクト信号ＳＥＬ２が０から１になり、アドレス回路３１－２のイネーブル回路３１２が共通ラインＥをアクティブレベル（例えば、Ｈレベル）にし共通ラインｎＥをアクティブレベル（例えば、Ｌレベル）にする。これにより、アドレス回路３１－２の記憶回路３１１が活性化される。記憶回路３１１は、下位フラグＭＩＮ_２に対応する信号のアドレス値をアドレスバスａｄｄｒ＜０：７＞へ出力する。ラインＢ０～Ｂ７は、それぞれ、（Ｂ０，Ｂ１，Ｂ２，Ｂ３，Ｂ４，Ｂ５，Ｂ６，Ｂ７）＝（０，１，０，０，０，０，０，０）のレベルをアドレス信号として、対応するアドレス線ａｄｄｒへ出力する。この例では、Ｂ０がＬＳＢに対応し、Ｂ７がＭＳＢに対応するので、アドレス値としては、２進表記で「００００００１０」であり、１０進表記で「２」である。

タイミングｔ４４において、クロックＣＬＫ＿ＢＯＴＫの立ち上がりエッジに応じて、パルスＢＯＴＫ＿ＳＴＡＲＴが、再構成されたシフトレジスタ３３における２番目のレジスタ３２１－２から３番目のレジスタ３２１－４にシフトされ、レジスタ３２１－２の出力が１から０になるとともにレジスタ３２１－４の出力が０から１になる。

これに応じて、セレクト信号ＳＥＬ２が１から０になり、アドレス回路３１－２のイネーブル回路３１２が共通ラインＥをノンアクティブレベル（例えば、Ｌレベル）にし共通ラインｎＥをノンアクティブレベル（例えば、Ｈレベル）にする。これにより、アドレス回路３１－２の記憶回路３１１が非活性化される。

それとともに、セレクト信号ＳＥＬ４が０から１になり、アドレス回路３１－４のイネーブル回路３１２が共通ラインＥをアクティブレベル（例えば、Ｈレベル）にし共通ラインｎＥをアクティブレベル（例えば、Ｌレベル）にする。これにより、アドレス回路３１－４の記憶回路３１１が活性化される。記憶回路３１１は、下位フラグＭＩＮ_４に対応する値のアドレス値をアドレスバスａｄｄｒ＜０：７＞へ出力する。ラインＢ０～Ｂ７は、それぞれ、（Ｂ０，Ｂ１，Ｂ２，Ｂ３，Ｂ４，Ｂ５，Ｂ６，Ｂ７）＝（０，０，１，０，０，０，０，０）のレベルをアドレス信号として、対応するアドレス線ａｄｄｒへ出力する。この例では、Ｂ０がＬＳＢに対応し、Ｂ７がＭＳＢに対応するので、アドレス値としては、２進表記で「０００００１００」であり、１０進表記で「４」である。

タイミングｔ４５において、クロックＣＬＫ＿ＢＯＴＫの立ち上がりエッジに応じて、パルスＢＯＴＫ＿ＳＴＡＲＴが、再構成されたシフトレジスタ３３における３番目のレジスタ３２１－４から最終のレジスタ３２１－５にシフトされ、レジスタ３２１－４の出力が１から０になるとともにレジスタ３２１－５の出力が０から１になる。

これに応じて、セレクト信号ＳＥＬ４が１から０になり、アドレス回路３１－５のイネーブル回路３１２が共通ラインＥをノンアクティブレベル（例えば、Ｌレベル）にし共通ラインｎＥをノンアクティブレベル（例えば、Ｈレベル）にする。これにより、アドレス回路３１－５の記憶回路３１１が非活性化される。

それとともに、セレクト信号ＳＥＬ５が０から１になり、アドレス回路３１－５のイネーブル回路３１２が共通ラインＥをアクティブレベル（例えば、Ｈレベル）にし共通ラインｎＥをアクティブレベル（例えば、Ｌレベル）にする。これにより、アドレス回路３１－５の記憶回路３１１が活性化される。記憶回路３１１は、下位フラグＭＩＮ_５に対応する値のアドレス値をアドレスバスａｄｄｒ＜０：７＞へ出力する。ラインＢ０～Ｂ７は、それぞれ、（Ｂ０，Ｂ１，Ｂ２，Ｂ３，Ｂ４，Ｂ５，Ｂ６，Ｂ７）＝（１，０，１，０，０，０，０，０）のレベルをアドレス信号として、対応するアドレス線ａｄｄｒへ出力する。この例では、Ｂ０がＬＳＢに対応し、Ｂ７がＭＳＢに対応するので、アドレス値としては、２進表記で「０００００１０１」であり、１０進表記で「５」である。

タイミングｔ４６において、クロックＣＬＫ＿ＢＯＴＫの立ち上がりエッジに応じて、パルスＢＯＴＫ＿ＳＴＡＲＴが、シフトレジスタ３３の最終のレジスタ３２１－５から転送検知回路３５へ転送され、レジスタ３２１－５の出力が１から０になるとともに転送検知回路３５の出力が０から１になる。

これに応じて、セレクト信号ＳＥＬ５が１から０になり、アドレス回路３１－５のイネーブル回路３１２が共通ラインＥをノンアクティブレベル（例えば、Ｌレベル）にし共通ラインｎＥをノンアクティブレベル（例えば、Ｈレベル）にする。これにより、アドレス回路３１－５の記憶回路３１１が非活性化される。それとともに、転送検知回路３５は、１になった出力をパルスＢＯＴＫ＿ｎＳＴＯＰとしてグローバル回路３６へ供給する。

パルスＢＯＴＫ＿ｎＳＴＯＰに応じて、タイミングｔ４７において、グローバル回路４３６は、クロックＣＬＫに同期して、イネーブル信号ＢＯＴＫ＿ＥＮをアクティブレベル（例えば、Ｈレベル）からノンアクティブレベル（例えば、Ｌレベル）へ遷移させて出力回路３４へ供給する。出力回路３４は、アドレスバスａｄｄｒ＜０：７＞上の信号を出力しない状態になる。これにより、アドレス解決回路４０３からアドレスバスａｄｄｒ＜０：７＞へのアドレス信号の出力が完了する。

タイミングｔ４８において、転送検知回路３５の出力が１から０になり、転送検知回路３５からグローバル回路４３６への通知が完了する。

以上のように、第２の実施形態では、列数以下のＫサイクルの動作で下位Ｋ個の信号に対するアドレス解決を行うことができ、下位Ｋ個の信号に対するアドレス解決をより効率的に行うことができる。これにより、メモリ配列ＭＡの複数列から出力される複数の信号のうち下位Ｋ個を利用したい場合等に、複数の信号が効率的に利用可能である。

本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。

１演算システム、２，４０２処理回路、３，４０３アドレス解決回路、２１，４２１ローカル回路、２２，３６，４２２，４３６グローバル回路、３１アドレス回路、３２レジスタ回路、３３シフトレジスタ、３４出力回路、３５転送検知回路。

Claims

複数行及び複数列を構成するように配列され、複数の第１信号に重みを乗算して複数の計算結果を生成する複数の乗算素子と、
前記複数列ごとに前記複数の計算結果のうちの各列の計算結果の和を計算して複数の第２信号を生成する複数の加算素子と、
前記加算素子が生成した前記複数の第２信号を受け、前記複数の第２信号のうちの一部の第２信号に対応する値を抽出する第１処理回路と、
前記複数の第２信号に対応する複数のアドレス回路を含み、前記複数のアドレス回路のうち前記一部の第２信号に対応するアドレス回路を選択的にイネーブルする第２処理回路と、
を備えた演算システム。
前記第２処理回路は、
前記複数のアドレス回路に対応する複数のレジスタ回路を含み再構成可能なシフトレジスタをさらに有する
請求項１に記載の演算システム。
前記第１処理回路は、
Ｋを２以上の整数とするとき、前記複数の第２信号ごとにそれぞれが前記複数の第２信号のうち上位Ｋ個のレベルの第２信号であるか否かを示す複数の上位フラグ値を生成し、
前記複数のレジスタ回路のそれぞれは、入力ノード、出力ノード、及びレジスタを含み、
前記第２処理回路は、前記複数のレジスタ回路のうち前記上位Ｋ個のレベルの第２信号であることを示す上位フラグ値に対応するレジスタ回路で入力ノード及び出力ノード間にレジスタを接続すると共に残りのレジスタ回路でレジスタをバイパスして入力ノード及び出力ノード間を接続することにより、前記シフトレジスタを再構成する
請求項２に記載の演算システム。
前記レジスタ回路は、
オンして前記レジスタを前記入力ノード及び前記出力ノード間に接続する第１の切替素子と、
オンして前記レジスタを前記入力ノード及び前記出力ノードの間でバイパスさせる第２の切替素子と、
をさらに含み、
前記アドレス回路は、
アドレスの値が格納され、イネーブル端子を有する記憶回路と、
前記上位フラグ値を受ける第１の入力ノードと前記レジスタの前記出力ノードに接続された第２の入力ノードと前記記憶回路の前記イネーブル端子に接続された出力ノードとを有するイネーブル回路と、
を有する
請求項３に記載の演算システム。
前記第１処理回路は、
Ｋを２以上の整数とするとき、前記複数の第２信号ごとにそれぞれが前記複数の第２信号のうち下位Ｋ個のレベルの第２信号であるか否かを示す複数の下位フラグ値を生成し、
前記複数のレジスタ回路のそれぞれは、入力ノード、出力ノード、及びレジスタを含み、
前記第２処理回路は、前記複数のレジスタ回路のうち前記下位Ｋ個のレベルの第２信号であることを示す下位フラグ値に対応するレジスタ回路で入力ノード及び出力ノード間にレジスタを接続すると共に残りのレジスタ回路でレジスタをバイパスして入力ノード及び出力ノード間を接続することにより、前記シフトレジスタを再構成する
請求項２に記載の演算システム。
前記レジスタ回路は、
オンして前記レジスタを前記入力ノード及び前記出力ノード間に接続する第１の切替素子と、
オンして前記レジスタを前記入力ノード及び前記出力ノードの間でバイパスさせる第２の切替素子と、
をさらに含み、
前記アドレス回路は、
アドレスの値が格納され、イネーブル端子を有する記憶回路と、
前記下位フラグ値を受ける第１の入力ノードと前記レジスタの前記出力ノードに接続された第２の入力ノードと前記記憶回路の前記イネーブル端子に接続された出力ノードとを有するイネーブル回路と、
を有する
請求項５に記載の演算システム。
前記記憶回路は、それぞれが固定電位に接続された複数のラインを含む
請求項４又は請求項６に記載の演算システム。