JP2017062865A

JP2017062865A - 複合マーチングメモリ、計算機システム及びマーチングメモリ用セル配列

Info

Publication number: JP2017062865A
Application number: JP2016210623A
Authority: JP
Inventors: 維男中村; Koreo Nakamura; ジェイフリンマイケル; J Flynn Michael
Original assignee: Individual
Current assignee: Individual
Priority date: 2012-02-13
Filing date: 2016-10-27
Publication date: 2017-03-30
Anticipated expiration: 2033-02-13
Also published as: JP6218294B2; TW201737251A; CN104040635A; KR20140102745A; EP3477645B1; CN107093463A; EP3477645A1; EP2815403A4; US11164612B2; KR101689939B1; US20140344544A1; KR20160116040A; CN107093463B; EP2815403B1; TW201337943A; JP6093379B2; EP2815403A1; TWI607454B; US20200152247A1; JP2015510216A

Abstract

【課題】プロセッサ・チップとメモリチップとの間のメモリ・ボトルネックのない高速低消費電力の計算機を提供する。
【解決手段】メモリユニットに格納されたバイト・サイズの情報をクロック信号に同期して、入力側のメモリユニットから出力側のメモリユニットに向けて行方向に逐次転送するセルマトリクス中のマーチングメモリ用セル配列である。ビットレベルの信号電荷を格納する第１のビットレベル・セルＭ_i(j-1)と、この第１のビットレベル・セルの出力端子に接続されたユニット間セルＢ_ijと、このユニット間セルの出力端子に接続された第２のビットレベル・セルＭ_ijを含む。ユニット間セルＢ_ijが、第１のビットレベル・セルＭ_i(j-1)の信号格納状態から、第２のビットレベル・セルＭ_ijの信号格納状態を分離する。
【選択図】図１３

Description

本発明は、低エネルギー消費で高速で動作する新しいメモリである複合マーチングメモリ、複合マーチングメモリを使用する新しい計算機システム、及び新しいメモリであるマーチングメモリに好適なマーチングメモリ用セル配列に関する。

フォン・ノイマンなどが６０年以上も前にプログラム内蔵電子計算機を開発したとき以来、根本的なメモリ・アクセス法の原理は変わっていない。計算機の処理速度は高性能計算（ＨＰＣ）アプリケーションの全体的な範囲において年を追って益々高まってきたが、それは、メモリ・アクセスを回避する（キャッシュの使用など）デバイス技術又はスキームのいずれかによって実現したものである。しかし、メモリ・アクセス時間が電子計算機の性能を制限する。現在、計算機システムは、図１に示すように、多数のプロセッサ１１と大規模な主記憶装置３３１とを使用している。

図１に示す計算機システムは、プロセッサ１１とキャッシュメモリ（３２１ａ、３２１ｂ）と主記憶装置３３１とを含む。プロセッサ１１は、クロック信号を生成するクロック発生回路１１３を有する制御装置１１１と、クロック信号に同期して演算論理動作を実行する演算論理装置（ＡＬＵ）１１２と、制御装置１１１に接続された命令レジスタ・ファイル（ＲＦ）３２２ａと、ＡＬＵ１１２に接続されたデータレジスタ・ファイル（ＲＦ）３２２ｂとを含む。キャッシュメモリ（３２１ａ、３２１ｂ）は、命令キャッシュメモリ３２１ａとデータキャッシュメモリ３２１ｂとを有する。主記憶装置３３１の一部と命令キャッシュメモリ３２１ａとは、メモリ・アクセス時間を制限する（又は、フォン・ノイマン・ボトルネックを有する）配線及び／又はバス３５１により電気的に接続している。主記憶装置３３１の残部と、データキャッシュメモリ３２１ｂとは、同様のメモリ・アクセス３５１を可能にするように電気的に接続している。更に、メモリ・アクセスを実現する配線及び／又はバス３５２は、データキャッシュメモリ３２１ｂと命令キャッシュメモリ３２１ａと、命令レジスタ・ファイル３２２ａとデータレジスタ・ファイル３２２ｂとの間を電気的に接続している。

ＨＰＣシステムは高速で低エネルギー消費で動作することが期待されているが、メモリ・アクセスのボトルネック３５１、３５２のために、速度制限がある。ボトルネック３５１、３５２はプロセッサ１１と主記憶装置３３１との間の配線に起因する。何故ならば、配線長が計算機に対するアクセスを遅延し、且つ、配線間に存在する浮遊容量（漂遊容量）が更なる遅延を招くからである。このような容量のために、プロセッサ１１のプロセッサ・クロック周波数に比例する更なる電力消費が必要となる。

現在、一部のＨＰＣプロセッサは、幾つかのベクトル演算パイプラインを用いて形成されている。このベクトル・プロセッサは、メモリの帯域幅を巧みに用いているので、ベクトル表現法で表現できるＨＰＣアプリケーションに適した優れたマシンになる。ベクトル命令は、ソース・プログラムのループから作られ、これらのベクトル命令のそれぞれが、ベクトル・プロセッサ又は並列プロセッサにおいて対応するユニットの演算パイプラインで実行される。これらの処理スキームの結果は、同じ結果を与えている。
しかし、ベクトル・プロセッサ・ベースのシステムも、メモリ・ボトルネック３５１、３５２をすべてのユニット間で有する。広いメモリと大きな帯域幅をもつ単一システムでも、同じボトルネック３５１、３５２が現れる。なおかつ、システムが並列プロセッサとして多数の同じユニットからなる場合、ボトルネック３５１、３５２は回避が難しくなる。

従来の計算機システムには、２つの本質的なメモリ・アクセスの問題がある。第１の問題は、メモリチップとキャッシュの間又はチップ上の２つのユニットの間だけでなく、メモリ・システムの内部に存在する配線である。チップ間、チップ／ユニット間のこれらの配線は、結果として、容量に起因する大きな動的電力消費と配線信号の時間遅延になる。これは、アクセス・ラインと残りの読出／書込ラインとに関連してメモリチップ内の内部配線の問題に進展する。したがって、メモリチップ間及びメモリチップ内の配線の両方に、これらの配線がもつ静電容量に起因するエネルギー消費が存在する。

第２の問題は、プロセッサ・チップとキャッシュとの間、キャッシュとメモリチップとの間のメモリ・ボトルネック３５１、３５２である。ＡＬＵはキャッシュ又はメモリの任意の部分にアクセスできるので、アクセス経路３５１、３５２は、長いグローバル配線から形成されている。これらのパスには、使用可能な配線の数にも制限がある。このようなボトルネックは、バスのようなハードウェアに起因すると思われる。特に、高速ＣＰＵと大容量メモリがあるときに、見かけのボトルネックが、これらの高速ＣＰＵと大容量メモリの間に基本的に存在する。

ボトルネックを除去する鍵は、ＣＰＵと同じメモリ・クロックサイクルを有することである。第１に、アドレス指定手順を作成して、メモリ・アクセスを改善しなければならない。第２に、より長い配線に起因する時間的な遅延を、メモリの内部とメモリの外部の両方で大幅に減少しなければならない。

これらの２つの課題を解決することによって、迅速な直接結合がメモリとＣＰＵの間で確立するので、メモリ・ボトルネックのない計算機が実際に可能になる。プロセッサとプロセッサの周辺部は、これらの問題のために総エネルギーの７０％を費やしており、これは、図５３に示すように、命令供給用の４２％とデータ用の２８％とに分割される。配線の問題は、電力消費だけでなく信号の時間的な遅延も誘発する。配線の問題を克服することは、データ／命令の流れを制限する、ボトルネック３５１、３５２の消滅を意味する。我々がチップ間及びチップ内の配線を除去できれば、電力消費と時間的な遅延とメモリ・ボトルネック３５１、３５２の問題が解決できることになる。

本発明の特徴は、それぞれのメモリユニットに格納されたバイト・サイズ又はワード・サイズの情報を、クロック信号に同期して、入力側のメモリユニットから出力側のメモリユニットに向けて行方向に逐次転送するセルマトリクスを構成するように、ビットレベル・セルの列方向１次元配列で定義されるメモリユニットの複数本を、それぞれ行方向に沿って順次配列してなるセルマトリクス中の１行をなす、ビットレベル・セルの行方向１次元配列としてのマーチングメモリ用セル配列に関する。本発明の特徴に係るマーチングメモリ用セル配列は、（イ）ビットレベルの信号電荷を格納する第１のビットレベル・セルと、（ロ）この第１のビットレベル・セルの出力端子に接続されたユニット間セルと、（ハ）このユニット間セルの出力端子に接続された第２のビットレベル・セルを含む。この発明の特徴に係るマーチングメモリ用セル配列において、ユニット間セルが、第１のビットレベル・セルの信号格納状態から、第２のビットレベル・セルの信号格納状態を分離する。例えば、第１のビットレベル・セルは、 (a)第１遅延素子を介してクロック信号供給線に接続した第１主電極、第１のビットレベル・セルの入力側に隣接して配列された前段のユニット間セルの出力端子に、第２遅延素子を介して接続された制御電極を有する転送トランジスタと、 (b)転送トランジスタの第２主電極に接続した第１主電極、クロック信号供給線に接続した制御電極、接地電位に接続した第２主電極を有するリセット・トランジスタと、 (c)リセット・トランジスタに並列接続され、ビットレベルの信号電荷を格納するコンデンサを備える。第１のビットレベル・セルの転送トランジスタの第２主電極とリセット・トランジスタの第１主電極を接続する出力ノードが、第１のビットレベル・セルの出力端子として機能し、且つ、出力端子は、ユニット間セルにコンデンサに格納されていた信号電荷を出力する。

ここで、第１主電極は、電界効果トランジスタ（ＦＥＴ）、静電誘導トランジスタ（ＳＩＴ）、高電子移動度トランジスタ（ＨＥＭＴ）などのソース電極又はドレイン電極である。第１主電極がＦＥＴ、ＳＩＴ、ＨＥＭＴなどのソース電極として選択された場合は、第２主電極がドレイン電極となる。逆に、第１主電極がドレイン電極として選択された場合は、第２主電極はソース電極となる。同様に、第１主電極はバイポーラ接合トランジスタ（ＢＪＴ）のエミッタ電極又はコレクタ電極である。第１主電極がＢＪＴ用のエミッタ電極として選択された場合は第２主電極がコレクタ電極になる。或いは、第１主電極がコレクタ電極として選択された場合は、第２主電極はエミッタ電極になる。そして、制御電極は、ＦＥＴ、ＳＩＴ、ＨＥＭＴなどのゲート電極であり、ＢＪＴ用のベース電極になる。

本発明の更なる特徴は、それぞれがランダムにアクセスされることが可能な複数のマーチング・メモリーブロックが空間的に配列された複合マーチングメモリであって、マーチング・メモリーブロックのそれぞれは、メモリユニットのそれぞれがバイト・サイズ又はワード・サイズの情報を格納するように、ビットレベル・セルの１次元配列で構成されたメモリユニットが複数個配列されたアレイを含んでいることである。この複合マーチングメモリのメモリユニットのそれぞれは、それぞれのマーチング・メモリーブロックの内部において、対応するマーチング・メモリーブロックの出力側のメモリユニットに向けて、対応するマーチング・メモリーブロックの入力側のメモリユニットからクロック信号に同期して、ステップごとに、バイト・サイズ又はワード・サイズの情報を転送して、ビットレベル・セルがランダムにアクセスされない動作をし、且つ、マーチング・メモリーブロックのそれぞれにおいて、対象とするマーチング・メモリーブロックのメモリユニットのそれぞれがランダムにアクセスできるように、マーチング・メモリーブロックのそれぞれがランダムにアクセスされることを特徴とする。

本発明の更なる特徴は、複数のマーチング・メモリーブロックが空間的に配列された複合マーチングメモリであって、マーチング・メモリーブロックのそれぞれは、メモリユニットのそれぞれがバイト・サイズ又はワード・サイズの情報を格納するように、ビットレベル・セルの１次元配列で構成されたメモリユニットが複数個配列されたアレイを含んでいることである。この複合マーチングメモリのメモリユニットのそれぞれは、それぞれのマーチング・メモリーブロックの内部において、対応するマーチング・メモリーブロックの第１の端部側のメモリユニットに向けて、対応するマーチング・メモリーブロックの第１の端部に対向する第２の端部側のメモリユニットから第１のクロック信号に同期して、ステップごとに、バイト・サイズ又はワード・サイズの情報を転送して、ビットレベル・セルがランダムにアクセスされない動作をする。又、この複合マーチングメモリのメモリユニットのそれぞれは、それぞれのマーチング・メモリーブロックの内部において、対応するマーチング・メモリーブロックの第２の端部側のメモリユニットに向けて、対応するマーチング・メモリーブロックの第１の端部側のメモリユニットから第２のクロック信号に同期して、ステップごとに、バイト・サイズ又はワード・サイズの情報を転送して、ビットレベル・セルがランダムにアクセスされない動作をする。更に、この複合マーチングメモリのマーチング・メモリーブロックのそれぞれにおいて、対象とするマーチング・メモリーブロックのメモリユニットのそれぞれがランダムにアクセスできるように、マーチング・メモリーブロックのそれぞれがランダムにアクセスされることを特徴とする。

本発明の更に他の特徴は、プロセッサと、格納されていた情報をプロセッサに能動的に逐次出力するマーチング主記憶装置とを備える計算機システムに関する。こので計算機システムのプロセッサは格納されていた情報により演算論理動作を実行でき、命令の移動の場合にはマーチング主記憶装置からプロセッサに向かう命令流が一方向だけであることを除いて、プロセッサにおける処理の結果がマーチング主記憶装置に送られる。この計算機システムのマーチング主記憶装置にはそれぞれがランダムにアクセスされることが可能な複数のマーチング・メモリーブロックが空間的に配列されている。マーチング・メモリーブロックのそれぞれは、メモリユニットのそれぞれがバイト・サイズ又はワード・サイズの情報を格納するように、ビットレベル・セルの１次元配列で構成されたメモリユニットが複数個配列されたアレイを含んでいる。こので計算機システムのマーチング・メモリーブロックのそれぞれにおいて、対象とするマーチング・メモリーブロックのメモリユニットのそれぞれがランダムにアクセスできるように、マーチング・メモリーブロックのそれぞれがランダムにアクセスされることを特徴とする。

本発明の更に他の特徴は、プロセッサと、格納されていた情報をプロセッサに能動的に逐次出力する双方向マーチング主記憶装置とを備える計算機システムに関する。この計算機システムのプロセッサは格納されていた情報により演算論理動作を実行でき、命令の移動の場合には双方向マーチング主記憶装置からプロセッサに向かう命令流が一方向だけであることを除いて、プロセッサにおける処理の結果が双方向マーチング主記憶装置に送られる。この計算機システムの双方向マーチング主記憶装置にはそれぞれがランダムにアクセスされることが可能な複数の双方向マーチング・メモリーブロックが空間的に配列されている。双方向マーチング・メモリーブロックのそれぞれは、メモリユニットのそれぞれがバイト・サイズ又はワード・サイズの情報を格納するように、ビットレベル・セルの１次元配列で構成されたメモリユニットが複数個配列されたアレイを含んでいる。この計算機システムのメモリユニットのそれぞれは、それぞれのマーチング・メモリーブロックの内部において、対応するマーチング・メモリーブロックの第１の端部側のメモリユニットに向けて、対応するマーチング・メモリーブロックの第１の端部に対向する第２の端部側のメモリユニットから第１のクロック信号に同期して、ステップごとに、バイト・サイズ又はワード・サイズの情報を転送して、ビットレベル・セルがランダムにアクセスされない動作をする。この計算機システムのメモリユニットのそれぞれは、それぞれのマーチング・メモリーブロックの内部において、対応するマーチング・メモリーブロックの第２の端部側のメモリユニットに向けて、対応するマーチング・メモリーブロックの第１の端部側のメモリユニットから第２のクロック信号に同期して、ステップごとに、バイト・サイズ又はワード・サイズの情報を転送して、ビットレベル・セルがランダムにアクセスされない動作をする。この計算機システムのマーチング・メモリーブロックのそれぞれにおいて、対象とするマーチング・メモリーブロックのメモリユニットのそれぞれがランダムにアクセスできるように、マーチング・メモリーブロックのそれぞれがランダムにアクセスされることを特徴とする。

従来の計算機システムの構成を示す概略的なブロック図である。本発明の第１の実施形態に係る計算機システムの基本構成を示す概略的なブロック図である。本発明の第１の実施形態に係る計算機システムに用いるマーチング主記憶装置を構成するメモリユニットのアレイと、マーチング主記憶装置における情報の転送の様子を示す図である。本発明の第１の実施形態に係る計算機システムに用いるマーチング主記憶装置のセル・アレイをトランジスタ・レベル表現で例示す図である。本発明の第１の実施形態に係る計算機システムに用いるマーチング主記憶装置のセル・アレイを拡大したトランジスタ・レベル表現であり、４つの隣接したビットレベル・セルに重点をおいて示す図である。本発明の第１の実施形態に係る計算機システムに用いるマーチング主記憶装置を構成する単一のビットレベル・セルを更に拡大して示すトランジスタ・レベル表現での図である。本発明の第１の実施形態に係る計算機システムに用いるマーチング主記憶装置に用いるクロック信号波形に対するトランジスタの応答の概略的な例を示し、信号“１”が前段から転送された場合の応答を示す図である。本発明の第１の実施形態に係る計算機システムに用いるマーチング主記憶装置に用いるクロック信号波形に対するトランジスタの応答の他の概略的な例を示し、信号“０”が前段から転送された場合の他の応答を示す図である。本発明の第１の実施形態に係る計算機システムに用いるマーチング主記憶装置に用いるクロック信号波形に対するトランジスタの応答の実例を示す図である。本発明の第１の実施形態に係る計算機システムのマーチング主記憶装置に用いるビットレベル・セルの詳細を例示的に示す図である。図８に示したビットレベル・セルを実現する場合の、実際の平面図を例示的に示す図である。図９に示した平面図をＡ−Ａ方向から見た断面図である。本発明の第１の実施形態の変形例に係る計算機システムで用いるマーチング主記憶装置に用いられる単一のビットレベル・セルを、ユニット間セルと組み合わせて示す、トランジスタ・レベル表現における他の拡大図である。図１１に示したビットレベル・セルを、実際に実現する際に必要な平面図の例である。本発明の第１の実施形態の変形に係る計算機システムのマーチング主記憶装置に用いるセル・アレイの拡大したトランジスタ・レベル表現であり、２つの隣接ビットレベル・セルに着目して、対応するユニット間セルと組み合わせて示した図である。図１４（ａ）は、図１３に示したビットレベル・セルのクロック信号の波形に対する応答のタイミング図を示し、図１４（ｂ）は、図１４（ａ）の次の段階のタイミング図であり、図１３に示した次段側のビットレベル・セルの次のクロック信号の波形に対する応答を示す図である。本発明の第１の実施形態の変形例に係る計算機システムのマーチング主記憶装置に用いるクロック信号波形に対するトランジスタの応答の実例を示す図である。図１６（ａ）〜（ｄ）は、本発明の第１の実施形態の変形例に係る計算機システムで用いるマーチング主記憶装置において、図１１及び図１３に示したビットレベル・セルに着目して、信号転送動作の４つのモードをそれぞれ示す図である。本発明の第１の実施形態の他の変形例（第２の変形例）に係る計算機システムのマーチング主記憶装置に用いられる単一のビットレベル・セルを、ユニット間セルと組み合わせて示す、更に他のトランジスタ・レベル表現での拡大図である。本発明の第１の実施形態の第２の変形例に係る計算機システムで用いるマーチング主記憶装置のセル・アレイを、２つの隣接ビットレベル・セルに着目して、対応するユニット間セルと組み合わせて示す、トランジスタ・レベル表現での拡大図である。本発明の第１の実施形態の更に他の変形例（第３の変形例）に係る計算機システムのマーチング主記憶装置に用いられる単一のビットレベル・セルを、ユニット間セルと組み合わせて示す、更に他のトランジスタ・レベル表現での拡大図である。本発明の第１の実施形態の第３の変形例に係る計算機システムで用いるマーチング主記憶装置のセル・アレイを、２つの隣接ビットレベル・セルに着目して、対応するユニット間セルと組み合わせて示す、トランジスタ・レベル表現での拡大図である。本発明の第１の実施形態の第３の変形例に係る計算機システムのマーチング主記憶装置に用いるクロック信号波形に対するトランジスタの応答の実例を示す図である。図２２（ａ）〜（ｄ）は、本発明の第１の実施形態の第３の変形に係る計算機システムで用いるマーチング主記憶装置において、図２０と図２１に示したビットレベル・セルに着目して、信号転送動作の４つのモードをそれぞれ示す図である。図４に示したセル・アレイのゲートレベル表現による図である。本発明の第１の実施形態に係る計算機システムで用いる逆方向マーチング主記憶装置と、逆方向マーチング主記憶装置における情報の逆方向の転送を実現するメモリユニットのアレイを示す図である。図２５（ａ）は、図２４に示した逆方向マーチング主記憶装置のｉ番目の行を構成するセル・アレイのトランジスタ・レベルでの回路構成の例を示し、図２５（ｂ）は、図２４に示した逆方向マーチング主記憶装置に用いるクロック信号波形に対するトランジスタの応答の例示す図である。図２５（ａ）に示した逆方向マーチング主記憶装置のｉ番目の行を構成するセル・アレイのゲートレベル表現による図である。本発明の第１の実施形態に係る計算機システムにおいて、マーチング主記憶装置のメモリユニット・ストリーム時間とプロセッサ（ＣＰＵ）のクロックサイクルの間の時間領域における関係を示す図である。本発明の第１の実施形態に係る計算機システムの構成を概略的に示すずである。本発明の第１の実施形態に係る計算機システムにおいて、プロセッサ（ＣＰＵ）と、マーチング主記憶装置を含むマーチングメモリ構造との間でメモリ・ボトルネックが消滅している。図２９（ａ）は、本発明の第１の実施形態に係る計算機システムにおいて、マーチング主記憶装置を含むマーチングメモリ構造からプロセッサ（ＣＰＵ）に流れる前方進行データ流と、プロセッサ（ＣＰＵ）からマーチングメモリ構造に流れる逆方向データ流を示すずである。図２９（ｂ）は、マーチングメモリ構造のメモリユニット・ストリーム時間がプロセッサ（ＣＰＵ）のクロックサイクルと等しいという理想的な条件のもとで、マーチングメモリ構造とプロセッサ（ＣＰＵ）の間に作られる帯域幅を示す図である。図３０（ａ）は、図３０（ｂ）に示した本発明の第１の実施形態に係る計算機システムと対応させて、超高速磁気テープ・システムを概略的に示す図である。図３１（ａ）は、情報の隊列進行状況（前方進行の隊列進行状況）の具体的なイメージを示す図で、情報は、１次元マーチング主記憶装置の右方向に向けて隊列進行（シフト）する。図３１（ｂ）は１次元マーチング主記憶装置の漂遊状態を示し、図３１（ｃ）は、情報の逆方向の隊列進行状況の具体的なイメージを示す図で、情報は本発明の第１の実施形態に係る計算機システムにおいて１次元マーチング主記憶装置の左方向に向けて隊列進行（シフト）している。図３１（ａ）〜（ｃ）に示した双方向転送状態を実行するように、命令又はスカラデータを格納して双方向に転送するように構成した、本発明の第１の実施形態に係る計算機システムの１次元マーチング主記憶装置のトランジスタ・レベルでの回路構成を例示的に示す図である。図３１（ａ）〜（ｃ）に示した双方向転送状態を実行するように、メモリユニット間に分離トランジスタを含み、命令又はスカラデータを格納して双方向に転送するように構成した、本発明の第１の実施形態に係る計算機システムの１次元マーチング主記憶装置のトランジスタ・レベルでの回路構成の一例示す図である。図３２に示した１次元マーチング主記憶装置のゲートレベルにおける回路構成を包括的に表現した図である。図３５（ａ）は、プロセッサに隣接する１次元マーチング主記憶装置における命令の双方向転送モードを示す図で、命令は、プロセッサに向かって移動するとともに、左側に配置された次段のメモリに出入する。図３５（ｂ）は、ＡＬＵに隣接する１次元マーチング主記憶装置においてスカラデータの双方向転送モードを示し、スカラデータは、ＡＬＵに向かって移動するとともに、次段のメモリに出入する。図３５（ｃ）は、パイプラインに隣接する１次元マーチング主記憶装置におけるベクトル／ストリーミング・データの双方向転送モードを示し、ベクトル／ストリーミング・データはパイプラインに向かって移動するとともに、次段のメモリに出入する。図３６（ａ）は、図３６（ｂ）と比較のために示す従来のメモリの内部構成を示す図で、各メモリユニットにはアドレスがラベル表示されている。図３６（ｂ）は、本発明に係る１次元マーチング主記憶装置の内部構成を示す図で、個々のメモリユニットの位置設定が、ベクトル／ストリーミング・データにおいて連続するメモリユニットのセットの始点と終点を識別するために少なくとも必要である。図３７（ａ）は、本発明に係る１次元マーチング主記憶装置の内部構成を示す図で、個々のメモリユニットの位置設定が、ベクトル命令において連続するメモリユニットのセットの始点と終点を識別するために少なくとも必要である。図３７（ｂ）はスカラデータ用の本発明に係る１次元マーチング主記憶装置の内部構成示す図である。図３７（ｃ）は、本発明に係る１次元マーチング主記憶装置の内部構成を示す図で、位置インデックスがベクトル／ストリーミング・データにおいて連続するメモリユニットのセットの視点と終点を識別するために少なくとも必要である。図３８（ａ）は、ベクトル／ストリーミング・データの場合に対して複数のページから構成する本発明に係るマーチング主記憶装置の全体構成の例を概略的に示す図である。図３８（ｂ）は、ページの中の一つの構成の例を概略的に示し、ページのそれぞれはベクトル／ストリーミング・データの場合に対して複数のファイルから構成する。図３８（ｃ）は、ファイルの中の一つの構成の例を概略的に示し、ファイルのそれぞれは、本発明の第１の実施形態に係る計算機システムにおいて、ベクトル／ストリーミング・データの場合に対して複数のメモリユニットから構成する図３９（ａ）は、プログラム／スカラデータの場合に対して複数のページから構成する本発明に係るマーチング主記憶装置の全体構成の一例を概略的に示す図で、それぞれページがそれ自体の位置インデックスをアドレスとして有する。図３９（ｂ）は、本発明の第１の実施形態に係る計算機システムのページの中の一つの構成とページの駆動位置の一例を、２進法の桁を用いて概略的に示し、ページのそれぞれはプログラム／スカラデータの場合に対して複数のファイルから構成され、それぞれファイルはそれ自体の位置インデックスをアドレスとして有する。図３９（ｃ）は、本発明の第１の実施形態に係る計算機システムのファイルの中の一つの構成とファイルの駆動位置の一例を、２進法の桁を用いて概略的に示す図である。ファイルのそれぞれはプログラム／スカラデータの場合に対して複数のメモリユニットから構成され、それぞれメモリユニットは、それ自体の位置インデックスをアドレスとして有する。図４０（ａ）は、従来のメモリの速度／処理能力を本発明の第１の実施形態に係る計算機システムで用いるマーチング主記憶装置と比較するために概略的に示す図である。図４０（ｂ）は、マーチング主記憶装置の速度／処理能力を、図４０（ａ）に示した従来のメモリのそれと比較して概略的に示す図である。図４１（ａ）は、スカラ命令用の従来型記憶装置の最悪の場合の速度／処理能力を、本発明の第１の実施形態に係る計算機システムに用いるマーチング主記憶装置のものと比較して概略的に示す図である。図４１（ｂ）は、マーチング主記憶装置の速度／処理能力を、図４１（ａ）に示した従来型記憶装置の最悪の場合と比較して概略的に示す図である。図４２（ａ）は、スカラ命令用の従来型記憶装置における一般的な場合の速度／処理能力を、本発明の第１の実施形態に係る計算機システムに用いるマーチング主記憶装置との比較を概略的に示す図である。図４２（ｂ）は、マーチング主記憶装置の速度／処理能力を、図４２（ａ）に示した従来型記憶装置における一般的な場合のものと比較して、概略的に示す図である。図４３（ａ）は、スカラデータの場合の、従来型記憶装置の一般的な場合の速度／処理能力を、本発明の第１の実施形態に係る計算機システムに用いるマーチング主記憶装置のものと比較して概略的に示す図である。図４３（ｂ）は、マーチング主記憶装置の速度／処理能力を、図４３（ａ）に示した従来型記憶装置のものと比較して概略的に示す図である。図４４（ａ）は、ストリーミング・データと並列データの場合の従来型記憶装置における最良の場合の速度／処理能力を、本発明の第１の実施形態に係る計算機システムに用いるマーチング主記憶装置のものとの比較を概略的に示す図である。図４４（ｂ）は、マーチング主記憶装置の速度／処理能力を、図４４（ａ）に示した従来型記憶装置における最良の場合のものと比較して概略的に示す図である。本発明の第１の実施形態に係る計算機システムに用いるマーチング主記憶装置を構成する２次元のメモリユニットのアレイの一例を示す図で、メモリユニットのそれぞれは、データ又は命令を格納し転送する。本発明の第１の実施形態に係る計算機システムに用いるマーチング主記憶装置を構成する２次元のメモリユニットのアレイの他の例を示す図で、メモリユニットのそれぞれは、データ又は命令を格納して転送する。本発明の第１の実施形態に係る計算機システムに用いるマーチング主記憶装置を構成する２次元のメモリユニットのアレイの更に他の例を示す図で、メモリユニットのそれぞれは、データ又は命令を格納して転送する。本発明の第１の実施形態に係る計算機システムに用いるマーチング主記憶装置を構成する２次元のメモリユニットのアレイの更に他の例を示す図で、メモリユニットのそれぞれは、データ又は命令を格納して転送する。本発明の第１の実施形態に係る計算機システムに用いるマーチング主記憶装置を構成する２次元のメモリユニットのアレイの更に他の例を示す図で、メモリユニットのそれぞれは、データ又は命令を格納して転送する。本発明の第１の実施形態に係る計算機システムに用いるマーチング主記憶装置を構成する２次元のメモリユニットのアレイの更に他の例を示す図で、メモリユニットのそれぞれは、データ又は命令を格納して転送する。本発明の第１の実施形態に係る計算機システムに用いるマーチング主記憶装置を構成する２次元のメモリユニットのアレイの更に他の例を示す図で、メモリユニットのそれぞれは、データ又は命令を格納して転送する。図５２（ａ）は、従来型マイクロプロセッサのデバイス・レベル・エネルギー消費を、静的と動的なエネルギー消費に分解して示す図である。図５２（ｂ）は、図５２（ａ）に示した動的なエネルギー消費の電力消費の正味（ネット）と付帯的な（オーバーヘッド）ものを示す図である。図５２（ｃ）は従来型マイクロプロセッサの正味のエネルギー消費を示す図である。ダリが評価した、レジスタとキャッシュとを含む従来のアーキテクチュアにおけるプロセッサ上の実際のエネルギー消費分布を示す図である。図５４（ａ）は、キャッシュを基礎とした従来のアーキテクチュアのエネルギー消費を、キャッシュメモリのエネルギー消費を静的と動的なエネルギー消費に分解して示す図である。図５４（ｂ）は、本発明の第３の実施形態に係る計算機システムにおけるエネルギー消費を、マーチング・キャッシュメモリのエネルギー消費を静的と動的なエネルギー消費に分解して示す図である。本発明の第２の実施形態に係る計算機システムの構成を示す概略的なブロック図である。本発明の第３の実施形態に係る計算機システムの構成を示す概略的なブロック図である。図５７（ａ）は、本発明の第３の実施形態に係る計算機システムにおける演算パイプラインとマーチング・レジスタ・ユニットの組み合わせを示す図である。図５７（ｂ）は本発明の第３の実施形態に係る計算機システムにおけるマーチング・キャッシュ・ユニットのアレイを示す図である。本発明の第３の実施形態の変形例に係り、単一のプロセッサ・コアとマーチング・キャッシュメモリとマーチング−レジスタ・ファイルとの組み合わせによって構成された計算機システムの構造の概略的なブロック図である。本発明の第３の実施形態の他の変形例に係り、単一の演算パイプラインとマーチング・キャッシュメモリとマーチング・ベクトルレジスタ・ファイルとの組み合わせによって構成された計算機システムの構造の概略的なブロック図である。本発明の第３の実施形態の更に他の変形例に係り、複数のプロセッサ・コアとマーチング・キャッシュメモリとマーチング−レジスタ・ファイルとの組み合わせによって構成された計算機システムの構造の概略的なブロック図である。本発明の第３の実施形態の更に他の変形例に係り、複数の演算パイプラインとマーチング・キャッシュメモリとマーチング・ベクトルレジスタ・ファイルとの組み合わせから構成された計算機システムの構造の概略的なブロック図である。図６２（ａ）は、複数の演算パイプライン、複数の従来型キャッシュメモリ、複数の従来型ベクトルレジスタ・ファイル（ＲＦｓ）及び従来型主記憶装置との組み合わせによって構成され、ボトルネックが従来型キャッシュメモリと従来型主記憶装置との間に発生している従来の計算機システムの構成の概略的なブロック図を示す図である。図６２（ｂ）は、本発明の第３の実施形態の更に他の変形例に係り、複数の演算パイプライン、複数のマーチング・キャッシュメモリ、複数のマーチング・ベクトルレジスタ・ファイル及びマーチング主記憶装置との組み合わせによって構成されたボトルネックが発生しない計算機システムの構造の概略的なブロック図である。本発明の第４の実施形態に係る高性能のコンピューティング（ＨＰＣ）システムの構成を示す概略的なブロック図である。本発明の第５の実施形態に係る計算機システムの構成を示す概略的なブロック図である。図６５（ａ）は、本発明の第５の実施形態に係る計算機システムに用いる３次元マーチング主記憶装置の断面図を示す図である。図６５（ｂ）は本発明の第５の実施形態に係る計算機システムに用いる３次元マーチング・キャッシュの断面図を示す図である。図６５（ｃ）は本発明の第５の実施形態に係る計算機システムに用いる３次元マーチング・レジスタ・ファイルの断面図である。本発明の第５の実施形態に係る計算機システムに用いる３次元構成の斜視図である。本発明の第５の実施形態に係る計算機システムに用いる他の３次元構成の斜視図である。図６７に示した３次元構成の断面図である。本発明の第５の実施形態に係る計算機システムに用いる他の３次元構成の断面図である。本発明の第５の実施形態に係る計算機システムにおいて制御経路（パス）を表すことによって、制御処理を実行する計算機システムの基本的なコアの３次元構成の断面図を概略的に示す図である。本発明の第５の実施形態に係る計算機システムにおいてスカラデータ用のデータ経路を表すことによって、スカラデータ処理を実行する計算機システムの基本的なコアの３次元構成の断面図を概略的に示す図である。本発明の第５の実施形態に係る計算機システムにおいてベクトル／ストリーミング・データ用のデータ経路を表し、ベクトル／ストリーミング・データ処理を実行する計算機システムの基本的なコアの３次元構成の断面図を概略的に示す図である。本発明の第５の実施形態に係る計算機システム用の制御経路とスカラデータ経路との組み合わせを表すことによって、計算機システムのスカラデータ部を実行する計算機システムの基本的なコアの３次元構成を、概略的に示す断面図である。パイプラインのＡＬＵが複数の処理装置（ＣＰＵ）に含まれることにより、複数の処理装置が、スカラデータだけでなくベクトル／ストリーミング・データも実行する。ＭＩＳＤアーキテクチュアのスカラ／ベクトル・データのビットレベル並列処理示す図である。ＳＩＭＤアーキテクチュアのベクトル・データの並列処理示す図である。ベクトル処理における一般的なチェイニング示す図である。ＭＩＳＤアーキテクチュアのスカラ／ベクトル・データの並列処理示す図である。ＭＩＳＤアーキテクチュアのスカラ／ベクトル・データの並列処理示す図である。図７９（ａ）は、単一の半導体チップ上に表した代表的な従来のＤＲＡＭの平面図である。図７９（ｂ）は、従来のＤＲＡＭの同一半導体チップ上に表した、複合マーチングメモリの概略的な内部レイアウトの対応する平面図である。図８０（ａ）は単一のマーチング・メモリーブロックの外形を示す図である。図８０（ｂ）は、１０００列（カラム）を有する、図８０（ａ）に示したマーチング・メモリーブロックの部分平面図を示す図で、マーチングメモリのアクセス時間（サイクル時間）は単一の列（カラム）に相応して定められていて、図８０（ｃ）は、従来のＤＲＡＭの１メモリ素子の記憶内容を書く又は読み出す従来のＤＲＡＭのメモリ・サイクル示す図である。複合マーチングメモリ・モジュールの概略的な平面図である。

本発明の様々な実施形態を、添付の図面を参照して説明する。図面の全体にわたって、同一又は類似の部品や素子には同一又は類似の符号を付し、同一又は類似の部品や素子の説明は省略又は単純化されていることに留意すべきである。一般的に、半導体装置の表現では普通のことであるが、様々な図面間において、尺度は異なっており、特に、層の厚みは図面を簡単に読み取れるようにするために適宜記してあることに留意すべきである。以降の説明では、本発明を十分に理解できるように、特定の材料や処理を用いて、具体的に説明されている。しかし、本発明は、これらの特定の詳細な説明がなくても、実施できることは、当業者には自明のこととである。言い換えれば、周知の製造材料や処理や装置は、本発明を不要に曖昧にしないように細々と説明されていない。「上に」、「上方に」、「下に」、「下方に」、「垂直に」のような前置詞は、基板が実際に保たれている方向と関係なしに、基板の平面を基準にして定められている。層の積層は、間に介在層がある場合でも、その層の上にあると表現される。

図４〜図６、図８、図１１、図１３、図１６〜２０、図２２、図２５、図３２などにおいて、ビットレベル・セルのトランジスタ・レベル表現で、転送トランジスタとリセット・トランジスタとしてｎＭＯＳトランジスタが図示されているが、クロック信号に反対の極性を採用する場合は、転送トランジスタとリセット・トランジスタとしてｐＭＯＳトランジスタが使用できる。

−− 第１の実施形態−−
（計算機システムの基本構成）
図２に示すように、本発明の第１の実施形態に係る計算機システムは、プロセッサ１１とマーチング主記憶装置３１とを備えている。プロセッサ１１は、クロック信号を生成するクロック発生回路１１３を有する制御装置１１１と、クロック信号に同期して演算論理動作を実行する演算論理装置（ＡＬＵ）１１２とを含む。図３に示すように、マーチング主記憶装置３１は、メモリユニットＵ_１、Ｕ_２、Ｕ_２、…….、Ｕ_n-1、Ｕ_ｎのアレイである。それぞれのメモリユニットＵ_１、Ｕ_２、Ｕ_２、…….、Ｕ_n-1、Ｕ_ｎは、ワード・サイズのデータ又は命令を含んだ情報のユニットを有する。マーチング主記憶装置３１は、更に、アレイの入力端子とアレイの出力端子とを有する。図３に示すように、マーチング主記憶装置３１は、ワード・サイズのデータ又は命令を含んだ情報をメモリユニットＵ_１、Ｕ_２、Ｕ_２、…….、Ｕ_n-1、Ｕ_ｎのそれぞれに格納する。このメモリユニットＵ_１、Ｕ_２、Ｕ_２、…….、Ｕ_n-1、Ｕ_ｎのそれぞれに格納された情報を、クロック信号に同期して、ステップごとに、出力端子の方向に、時系列に沿って逐次転送するので、格納された情報がプロセッサ１１に能動的に、且つ時系列で出力され、ＡＬＵ１１２は、マーチング主記憶装置３１に格納された情報により演算論理動作を実行する。

図２に示すように、マーチング主記憶装置３１とプロセッサ１１は複数の接合部材５４を介して電気的に接続している。例えば、接合部材５４のそれぞれは、マーチング主記憶装置３１に取り付けた第１のターミナル・ピンと、プロセッサ１１に取り付けた第２のターミナル・ピンと、第１と第２のターミナル・ピンの間に差し挟まれた導電性バンプとで形成されている。導電性バンプの材料として、半田ボール、金（Ａｕ）バンプ、銀（Ａｇ）バンプ、銅（Ｃｕ）バンプ、ニッケル−金（Ｎｉ−Ａｕ）合金バンプ、又はニッケル−金−インジウム（Ｎｉ−Ａｕ−Ｉｎ）合金バンプなどが使用できる。ＡＬＵ１１２のプロセスの最終データはマーチング主記憶装置３１に接合部材５４を介して出力される。したがって、双方向矢印Φ₁₂で表されるように、データは、接合部材５４を介してマーチング主記憶装置３１とプロセッサ１１との間で双方向に転送される。逆に、単一方向矢印η₁₁で表されるように、命令の移動については、マーチング主記憶装置３１からプロセッサ１１に向かう一方向だけの命令の流れになる。

図２に示すように、本発明の第１の実施形態に係る計算機システムの構成は、ディスクのような外部２次記憶装置４１と、入力装置６１と、出力装置６２と、入力／出力（Ｉ／Ｏ）インターフェース回路６３と、を更に備えている。従来のフォン・ノイマン型計算機と同様に、信号又はデータを入力装置６１が入力し、信号又はデータを出力装置６２が出力している。例えば、周知のキーボードや周知のマウスは、入力装置６１と見なすことができ、周知のモニターやプリンターは出力装置６２と見なすことができる。計算機間の通信用の周知のデバイスは、モデムやネットワーク・カードのように、入力装置６１と出力装置６２の両方で一般的に機能する。入力装置６１又は出力装置６２としてのデバイスの呼称は、全体像に依存することに留意すべきである。入力装置６１は、人間のユーザが呈する物理的な動きを入力とし、それを第１の実施形態に係る計算機システムが理解できる信号に変換する。例えば、入力装置６１は、入力したデータと命令とを、第１の実施形態に係る計算機システムが識別可能な２進コードの電気信号のパターンに変換し、入力装置６１からの出力は、マーチング主記憶装置３１にＩ／Ｏインターフェース回路６３を介して送信される。出力装置６２は、マーチング主記憶装置３１がＩ／Ｏインターフェース回路６３を介して提供する信号を入力とする。出力装置６２は、次に、これらの信号を、人間のユーザが見る又は読むことができる表現方式に変換し、入力装置６１の処理と逆の処理を行って、デジタル信号を、ユーザが判読可能な形式に変換する。Ｉ／Ｏインターフェース回路６３は、プロセッサ１１が入力装置６１と出力装置６２とを駆動するときに必ず必要になる。プロセッサ１１は、Ｉ／Ｏインターフェース回路６３を介して入力装置６１と出力装置６２とに通信できる。異なるデータ形式で交換された場合、Ｉ／Ｏインターフェース回路６３はシリアル・データをパラレル形式に、且つ逆の場合に逆方向に変換する。必要に応じて、プロセッサ１１による更なる処理のために、中断及び対応するタイプ番号を生成する方式もある。

２次記憶装置４１は、マーチング主記憶装置３１より更に長い時間的な基準でデータと情報とを格納する。マーチング主記憶装置３１は、今実行中のプログラムと、今採用中のデータの格納を主としているが、２次記憶装置４１は、計算機がオフに切り替えられても、又はプログラムを今実行していない場合でも、維持する必要のある任意のデータと情報を格納するように全体的に意図している。２次記憶装置４１の例は、周知のハードディスク（又はハード駆動）と周知の（ＣＤ−ＲＯＭ駆動のような）外部メディア−駆動である。これらの格納方法は、計算機のオペレーティング・システムと、ソフトウェアのユーザのコレクションと、ユーザが望む任意の他のデータとを格納するために最も広く用いられている。ハード駆動は半永久的な基準でデータとソフトウェアとを格納するために用いられ、外部メディア・駆動は他のデータを格納するために用いられるが、このセットアップは、入手可能な記憶装置の形式の違いと、それぞれを利用する際の便宜性に基づいて大きく変わる。双方向矢印Φ_１で表されるように、データは、現行の接続配線５３を介して２次記憶装置４１とマーチング主記憶装置３１とプロセッサ１１との間で双方向で転送される。

図示を省略しているが、図２に示す第１の実施形態に係る計算機システムで、プロセッサ１１は、マーチング主記憶装置３１から出力端子を介して格納情報を受信する複数の演算パイプラインを含むことができ、双方向矢印Φ₁₂で表されるように、データは、接合部材５４を介してマーチング主記憶装置３１と複数の演算パイプラインとの間で双方向に転送される。

従来の計算機システムにおいては配線又はバスがボトルネックをしているが、図２に示す第１の実施形態に係る計算機システムには、データバスやアドレスバス等のバスがない。計算機システム全体は、プロセッサ１１とマーチング主記憶装置３１との間で任意のデータ交換もグローバルな配線も必要としないからである。確かに、マーチング主記憶装置３１、又は対応するＡＬＵ１１２とマーチング主記憶装置３１との接続部分の内部には短い局部的な配線が存在しうる。しかし、これらの短い配線間には、時間的遅延と浮遊容量（漂遊容量）とを生成するグローバル配線が存在しないので、第１の実施形態に係る計算機システムは、更に高速の処理速度と小電力消費とを達成できる。

（マーチング主記憶装置を実現するセル・アレイの詳細な構成）
大半の従来の計算機では、アドレス決定の単位は、文字（例えば、バイト）又はワードである。単位がワードの場合、大量のメモリに、或るサイズのアドレスを用いてアクセスできる。他方で、単位がバイトの場合、個々の文字をアドレスできる（即ち、メモリ動作中に選択）。マシン命令は、通常は、アーキテクチュアのワード・サイズの分数又は倍数である。これは、命令とデータが通常は同じメモリ・サブシステムを共有するので、当然の選定になる。図４と図５は、図３に示すマーチング主記憶装置３１を実現するセル・アレイのトランジスタ・レベル表現に対応している。図２３は、図３に示すマーチング主記憶装置３１を実現するセル・アレイのゲートレベル表現に対応している。

図４で、ｍ×ｎマトリクスの第１列は、セルＭ₁₁、Ｍ₂₁、……、Ｍ_m-1,１、Ｍ_m1の垂直方向アレイで形成して、図３に示す第１のメモリユニットＵ_１を表現している。ここで、“ｍ”は、ワード・サイズで決まる整数である。ワード・サイズの選定は非常に重要であるが、計算機アーキテクチュアの設計時に、ワード・サイズは８ビットの倍数に自然になり、１６、３２、６４ビットが広く用いられている。同様に、ｍ×ｎマトリクスの第２列は、セルＭ₁₂、Ｍ₂₂、Ｍ₃₂、……、Ｍ_ｍ-1，２、Ｍ_m2の垂直方向アレイで形成して、第２のメモリユニットＵ_２を表現し、ｍ×ｎマトリクスの第３列は、セルＭ₁₃、Ｍ₂₃、Ｍ₃₃、……、Ｍ_m-1，３、Ｍ_m3の垂直方向アレイで形成して、第３のメモリユニットＵ_２を表現し、……、ｍ×ｎマトリクスの（ｎ−１）番目の列は、セルＭ_１,n-1、Ｍ_２,n-1、Ｍ_３,n-1、……、Ｍ_m-1，n-1、Ｍ_ｍ,n-1の垂直方向アレイで形成して、（ｎ−１）番目のメモリユニットＵ_n-1を表現し、ｍ×ｎマトリクスのｎ番目の列は、セルＭ_１,ｎ、Ｍ_２,ｎ、Ｍ_３,ｎ、……、Ｍ_m-1，ｎ、Ｍ_ｍ,ｎの垂直方向アレイで形成して、ｎ番目のメモリユニットＵ_ｎを表現する。

即ち、図４に示すように、ワード・サイズ・レベルの第１のメモリユニットＵ_１は、ｍ×ｎマトリクスの第１列のビットレベル・セルＭ₁₁、Ｍ₂₁、……、Ｍ_m-1,１、Ｍ_m1の垂直配列から形成している。第１行・第１列のセルＭ₁₁は、第１遅延素子Ｄ₁₁₁を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子Ｄ₁₁₂を経由して第１のビットレベル入力端子の出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ₁₁₁と、第１のｎＭＯＳトランジスタＱ₁₁₁のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ₁₁₂と、第２のｎＭＯＳトランジスタＱ₁₁₂に並列接続し、セルＭ₁₁の情報を格納するコンデンサＣ₁₁と、を備えており、そこでは、第１のｎＭＯＳトランジスタＱ₁₁₁のソース電極と第２のｎＭＯＳトランジスタＱ₁₁₂のドレイン電極とを接続する出力ノードは、次段のビットレベル・セルＭ₁₂に、コンデンサＣ₁₁に格納されていた信号を送るセルＭ₁₁の出力端子として機能する。第２行・第１列のセルＭ₂₁は、第１遅延素子Ｄ₂₁₁を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子Ｑ₂₁₂を経由して第２のビットレベル入力端子の出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ₂₁₁と、第１のｎＭＯＳトランジスタＱ₂₁₁のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ₂₁₂と、第２のｎＭＯＳトランジスタＱ₂₁₂に並列接続し、セルＭ₂₁の情報を格納するコンデンサＣ₂₁と、を備えており、そこでは、第１のｎＭＯＳトランジスタＱ₂₁₁のソース電極と第２のｎＭＯＳトランジスタＱ₂₁₂のドレイン電極とを接続する出力ノードは、次段のビットレベル・セルＭ₂₂に、コンデンサＣ₂₁に格納されていた信号を送るセルＭ₂₁の出力端子として機能する。第２行・第１列のセルＭ₂₁は、第１遅延素子Ｄ₂₁₁を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子Ｑ₂₁₂を経由して第２のビットレベル入力端子の出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ₂₁₁と、第１のｎＭＯＳトランジスタＱ₂₁₁のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ₂₁₂と、第２のｎＭＯＳトランジスタＱ₂₁₂に並列接続し、セルＭ₂₁の情報を格納するコンデンサＣ₂₁と、を備えており、そこでは、第１のｎＭＯＳトランジスタＱ₂₁₁のソース電極と第２のｎＭＯＳトランジスタＱ₂₁₂のドレイン電極とを接続する出力ノードは、次段のビットレベル・セルＭ₂₂に、コンデンサＣ₂₁に格納されていた信号を送るセルＭ₂₁の出力端子として機能する。第３行・第１列のセルは、第１遅延素子Ｄ₃₁₁を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子Ｄ₃₁₂を経由して第３のビットレベル入力端子の出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ₃₁₁と、第１のｎＭＯＳトランジスタＱ₃₁₁のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ₃₁₂と、第２のｎＭＯＳトランジスタＱ₃₁₂に並列接続し、セルの情報を格納するコンデンサＣ₃₁と、を備えており、そこでは、第１のｎＭＯＳトランジスタＱ₃₁₁のソース電極と第２のｎＭＯＳトランジスタＱ₃₁₂のドレイン電極とを接続する出力ノードは、次段のビットレベル・セルに、コンデンサＣ₃₁に格納されていた信号を送るセルの出力端子として機能する。（ｍ−１）行・第１列のセルＭ_(m-1)１は、第１遅延素子Ｄ_(m-1)11を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子Ｄ_(m-1)12を経由して（ｍ−１）番目のビットレベル入力端子の出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ_(m-1)11と、第１のｎＭＯＳトランジスタＱ_(m-1)11のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_(m-1)12と、第２のｎＭＯＳトランジスタＱ_(m-1)12に並列接続し、セルＭ_(m-1)１の情報を格納するコンデンサＣ_(m-1)１と、を備えており、そこでは、第１のｎＭＯＳトランジスタＱ_(m-1)11のソース電極と第２のｎＭＯＳトランジスタＱ_(m-1)12のドレイン電極とを接続する出力ノードは、次段のビットレベル・セルＭ(_m-1)２に、コンデンサＣ_(m-1)１に格納されていた信号を送るセルＭ_(m-1)１の出力端子として機能する。ｍ行・第１列のセルＭ_m1は、第１遅延素子ＤＭ₁₁を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子ＤＭ₁₂を経由してｍ番目のビットレベル入力端子の出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ_m1と、第１のｎＭＯＳトランジスタＱ_m11のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_m12と、第２のｎＭＯＳトランジスタＱ_m12に並列接続し、セルＭ_m1の情報を格納するコンデンサＣ_m1と、を備えており、そこでは、第１のｎＭＯＳトランジスタＱ_m11のソース電極と第２のｎＭＯＳトランジスタＱ_m12のドレイン電極とを接続する出力ノードは、次段のビットレベル・セルＭ_m2に、コンデンサＣ_m1に格納されていた信号を送るセルＭ_m1の出力端子として機能する

そして図４に示すように、ワード・サイズ・レベルの第２のメモリユニットＵ_２は、ｍ×ｎマトリクスの第２列のビットレベル・セルＭ₁₂、Ｍ₂₂、Ｍ₃₂、……、Ｍ_m-1,２、Ｍ_m2の垂直配列から形成している。第１行・第２列のセルＭ₁₂は、第１遅延素子Ｄ₁₂₁を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子Ｄ₁₂₂を経由して前段のビットレベル・セルＭ₁₁の出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ₁₂₁と、第１のｎＭＯＳトランジスタＱ₁₂₁のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ₁₂₂と、第２のｎＭＯＳトランジスタＱ₁₂₂に並列接続し、セルＭ₁₂の情報を格納するコンデンサＣ₁₂と、を備えており、そこでは、第１のｎＭＯＳトランジスタＱ₁₂₁のソース電極と第２のｎＭＯＳトランジスタＱ₁₂₂のドレイン電極とを接続する出力ノードは、次段のビットレベル・セルＭ₁₃に、コンデンサＣ₁₂に格納されていた信号を送るセルＭ₁₂の出力端子として機能する。第２行・第２列のセルＭ₂₂は、第１遅延素子Ｄ₂₂₁を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子Ｄ₂₂₂を経由して前段のビットレベル・セルＭ₂₁の出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ₂₂₁と、第１のｎＭＯＳトランジスタＱ₂₂₁のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ₂₂₂と、第２のｎＭＯＳトランジスタＱ₂₂₂に並列接続し、セルＭ₂₂の情報を格納するコンデンサＣ₂₂と、を備えており、そこでは、第１のｎＭＯＳトランジスタＱ₂₂₁のソース電極と第２のｎＭＯＳトランジスタＱ₂₂₂のドレイン電極とを接続する出力ノードは、次段のビットレベル・セルＭ₂₃に、コンデンサＣ₂₂に格納されていた信号を送るセルＭ₂₂の出力端子として機能する。第３行・第２列のセルＭ₃₂は、第１遅延素子Ｄ₃₂₁を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子Ｄ₃₂₂を経由して前段のビットレベル・セルの出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ₃₂₁と、第１のｎＭＯＳトランジスタＱ₃₂₁のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ₃₂₂と、第２のｎＭＯＳトランジスタＱ₃₂₂に並列接続し、セルＭ₃₂の情報を格納するコンデンサＣ₃₂と、を備えており、そこでは、第１のｎＭＯＳトランジスタＱ₃₂₁のソース電極と第２のｎＭＯＳトランジスタＱ₃₂₂のドレイン電極とを接続する出力ノードは、次段のビットレベル・セルＭ₃₃に、コンデンサＣ₃₂に格納されていた信号を送るセルＭ₃₂の出力端子として機能する。（ｍ−１）行・第２列のセルＭ_(m-1)２は、第１遅延素子Ｄ_(m-1)21を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子Ｄ(_m-1)22を経由して前段のビットレベル・セルＭ_(m-1)１の出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ_(m-1)21と、第１のｎＭＯＳトランジスタＱ_(m-1)21のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_(m-1)12と、第２のｎＭＯＳトランジスタＱ_(m-1)22に並列接続し、セルＭ_(m-1)２の情報を格納するコンデンサＣ_(m-1)２と、を備えており、そこでは、第１のｎＭＯＳトランジスタＱ_(m-1)21のソース電極と第２のｎＭＯＳトランジスタＱ_(m-1)22のドレイン電極とを接続する出力ノードは、次段のビットレベル・セルＭ_(m-1)３に、コンデンサＣ_(m-1)２に格納されていた信号を送るセルＭ_(m-1)２の出力端子として機能する。ｍ行・第２列のセルＭ_m2は、第１遅延素子ＤＭ₂₁を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子ＤＭ₂₂を経由して前段のビットレベル・セルＭ_m1の出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ_m21と、第１のｎＭＯＳトランジスタＱ_m21のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_m22と、第２のｎＭＯＳトランジスタＱ_m22に並列接続し、セルＭ_m2の情報を格納するコンデンサＣ_m2と、を備えており、そこでは、第１のｎＭＯＳトランジスタＱ_m21のソース電極と第２のｎＭＯＳトランジスタＱ_m22のドレイン電極とを接続する出力ノードは、次段のビットレベル・セルＭ_m3に、コンデンサＣ_m2に格納されていた信号を送るセルＭ_m2の出力端子として機能する

更に、図４に示すように、ワード・サイズ・レベルの第３のメモリユニットＵ_２は、ｍ×ｎマトリクスの第３列のビットレベル・セルＭ₁₃、Ｍ₂₃、Ｍ₃₃、……、Ｍ_m-1,3、Ｍ_m3の垂直配列から形成している。第１行・第３列のセルＭ₁₃は、第１遅延素子Ｄ₁₃₁を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子Ｄ₁₃₂を経由して前段のビットレベル・セルＭ₁₂の出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ₁₃₁と、第１のｎＭＯＳトランジスタＱ₁₃₁のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ₁₃₂と、第２のｎＭＯＳトランジスタＱ₁₃₂に並列接続し、セルＭ₁₃の情報を格納するコンデンサＣ₁₃と、を備えており、そこでは、第１のｎＭＯＳトランジスタＱ₁₃₁のソース電極と第２のｎＭＯＳトランジスタＱ₁₃₂のドレイン電極とを接続する出力ノードは、次段のビットレベル・セルに、コンデンサＣ₁₃に格納されていた信号を送るセルＭ₁₃の出力端子として機能する。第２行・第３列のセルＭ₂₃は、第１遅延素子Ｄ₂₃₁を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子Ｄ₂₃₂を経由して前段のビットレベル・セルＭ₂₂の出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ₂₃₁と、第１のｎＭＯＳトランジスタＱ₂₃₁のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ₂₃₂と、第２のｎＭＯＳトランジスタＱ₂₃₂に並列接続し、セルＭ₂₃の情報を格納するコンデンサＣ₂₃と、を備えており、そこでは、第１のｎＭＯＳトランジスタＱ₂₃₁のソース電極と第２のｎＭＯＳトランジスタＱ₂₃₂のドレイン電極とを接続する出力ノードは、次段のビットレベル・セルに、コンデンサＣ₂₃に格納されていた信号を送るセルＭ₂₃の出力端子として機能する。第３行・第３列のセルＭ₃₃は、第１遅延素子Ｄ₃₃₁を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子Ｄ₃₃₂を経由して前段のビットレベル・セルＭ₃₂の出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ₃₃₁と、第１のｎＭＯＳトランジスタＱ₃₃₁のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ₃₃₂と、第２のｎＭＯＳトランジスタＱ₃₃₂に並列接続し、セルＭ₃₃の情報を格納するコンデンサＣ₃₃と、を備えており、そこでは、第１のｎＭＯＳトランジスタＱ₃₃₁のソース電極と第２のｎＭＯＳトランジスタＱ₃₃₂のドレイン電極とを接続する出力ノードは、次段のビットレベル・セルに、コンデンサＣ₃₃に格納されていた信号を送るセルＭ₃₃の出力端子として機能する。（ｍ−１）行・第３列のセルＭ_(m-1)３は、第１遅延素子Ｄ_(m-1)31を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子Ｄ_(m-1)32を経由して前段のビットレベル・セルＭ_(m-1)２の出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ_(m-1)31と、第１のｎＭＯＳトランジスタＱ_(m-1)31のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_(m-1)32と、第２のｎＭＯＳトランジスタＱ_(m-1)32に並列接続し、セルＭ_(m-1)３の情報を格納するコンデンサＣ_(m-1)３と、を備えており、そこでは、第１のｎＭＯＳトランジスタＱ_(m-1)31のソース電極と第２のｎＭＯＳトランジスタＱ_(m-1)３のドレイン電極とを接続する出力ノードは、次段のビットレベル・セルに、コンデンサＣ_(m-1)３に格納されていた信号を送るセルＭ_(m-1)３の出力端子として機能する。ｍ行・第３列のセルＭ_m3は、第１遅延素子Ｄ_m31を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子ＤＭ₃₂を経由して前段のビットレベル・セルＭ_m2の出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ_m31と、第１のｎＭＯＳトランジスタＱ_m31のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_m32と、第２のｎＭＯＳトランジスタＱ_m32に並列接続し、セルＭ_m3の情報を格納するコンデンサＣ_m3と、を備えており、そこでは、第１のｎＭＯＳトランジスタＱ_m31のソース電極と第２のｎＭＯＳトランジスタＱＭ₃₂のドレイン電極とを接続する出力ノードは、次段のビットレベル・セルに、コンデンサＣ_m3に格納されていた信号を送るセルＭ_m3の出力端子として機能する

更に、図４に示すように、ワード・サイズ・レベルのｎ番目のメモリユニットは、ｍ×ｎマトリクスのｎ番目の列のビットレベル・セルＭ_１ｎ、Ｍ_２ｎ、Ｍ_3n、……、Ｍ_m-1,n、Ｍ_ｍｎの垂直配列から形成している。第１行のｎ番目の列のセルＭ₁₃は、第１遅延素子Ｄ_1n1を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子Ｄ_1n2を経由して前段のビットレベル・セルＭ_1(n-1)のビットレベル出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ_1n1と、第１のｎＭＯＳトランジスタＱ_1n1のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_1n2と、第２のｎＭＯＳトランジスタＱ_1n2に並列接続し、セルＭ_１ｎの情報を格納するコンデンサＣ_１ｎと、を備えており、そこでは、第１のｎＭＯＳトランジスタＱ_1n1のソース電極と第２のｎＭＯＳトランジスタＱ_1n2のドレイン電極とを接続する出力ノードは、次段のビットレベル出力端子に、コンデンサＣ１ｎに格納されていた信号を送るセルＭ_１ｎのビットレベル出力端子として機能する。第２行の第ｎ番目の列のセルＭ_２ｎは、第１遅延素子Ｄ_2n1を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子Ｄ_2n2を経由して前段のビットレベル・セルＭ_２(n-1)のビットレベル出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ_2n1と、第１のｎＭＯＳトランジスタＱ_2n1のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_2n2と、第２のｎＭＯＳトランジスタＱ_2n2に並列接続し、セルＭ_２ｎの情報を格納するコンデンサＣ_２ｎと、を備えており、そこでは、第１のｎＭＯＳトランジスタＱ_2n1のソース電極と第２のｎＭＯＳトランジスタＱ_2n2のドレイン電極とを接続する出力ノードは、第２のビットレベル出力端子に、コンデンサＣ_２ｎに格納されていた信号を送るセルＭ_２ｎの出力端子として機能する。第３行のｎ番目の列のセルＭ_3nは、第１遅延素子Ｄ_3n1を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子Ｄ_3n2を経由して前段のビットレベル・セルＭ_３(n-1)のビットレベル出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ_3n1と、第１のｎＭＯＳトランジスタＱ_3n1のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_3n2と、第２のｎＭＯＳトランジスタＱ_3n2に並列接続し、セルＭ_3nの情報を格納するコンデンサＣ_3nと、を備えており、そこでは、第１のｎＭＯＳトランジスタＱ_3n1のソース電極と第２のｎＭＯＳトランジスタＱ_3n2のドレイン電極とを接続する出力ノードは、第３のビットレベル出力端子に、コンデンサＣ_3nに格納されていた信号を送るセルＭ_3nのビットレベル出力端子として機能する。（ｍ−１）行のｎ番目の列のセルＭ_(m-1)ｎは、第１遅延素子Ｄ_(m-1)ｎ１を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子Ｄ_(m-1)ｎ２を経由して前段のビットレベル・セルＭ_(m-1)(n-1)のビットレベル出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ_(m-1)ｎ１と、第１のｎＭＯＳトランジスタＱ_(m-1)ｎ１のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_(m-1)ｎ２と、第２のｎＭＯＳトランジスタＱ_(m-1)ｎ２に並列接続し、セルＭ_(m-1)ｎの情報を格納するコンデンサＣ_(m-1)ｎと、を備えており、そこでは、第１のｎＭＯＳトランジスタＱ_(m-1)ｎ１のソース電極と第２のｎＭＯＳトランジスタＱ_(m-1)ｎ２のドレイン電極とを接続する出力ノードは、（ｍ−１）番目のビットレベル出力端子に、コンデンサＣ_(m-1)ｎに格納されていた信号を送るセルＭ_(m-1)ｎのビットレベル出力端子として機能する。ｍ行のｎ番目の列のセルＭ_ｍｎは、第１遅延素子Ｄ_ｍｎ１を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子Ｄ_ｍｎ２を経由して前段のビットレベル・セルＭ_ｍ(n-1)のビットレベル出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ_ｍｎ１と、第１のｎＭＯＳトランジスタＱ_ｍｎ１のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_ｍｎ２と、第２のｎＭＯＳトランジスタＱ_ｍｎ２に並列接続し、セルＭ_ｍｎの情報を格納するコンデンサＣ_ｍｎと、を備えており、そこでは、第１のｎＭＯＳトランジスタＱ_ｍｎ１のソース電極と第２のｎＭＯＳトランジスタＱ_ｍｎ２のドレイン電極とを接続する出力ノードは、ｍ番目のビットレベル出力端子に、コンデンサＣ_ｍｎに格納されていた信号を送るセルＭ_ｍｎの出力端子として機能する

図５に示すように、ｊ行・ｉ行のビットレベル・セルＭ_ijは、本発明の第１の実施形態に係る計算機システムで用いるマーチング主記憶装置の典型的な２×２セル・アレイにおいて、第１遅延素子Ｄ_ij1を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子Ｄ_ij2を経由して前段のビットレベル・セルの出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ_ij1と、第１のｎＭＯＳトランジスタＱ_ij1のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_ij2と、第２のｎＭＯＳトランジスタＱ_ij2に並列接続するビットレベル・セルＭ_ijの情報を格納するコンデンサＣ_ijと、を備えており、そこでは、第１のｎＭＯＳトランジスタＱ_ij1のソース電極と第２のｎＭＯＳトランジスタＱ_ij2のドレイン電極とを接続する出力ノードは、次段のビットレベル・セルＭ_i(j+1)に、コンデンサＣ_ijに格納されていた信号を送るビットレベル・セルＭ_ijの出力端子として機能する。

ｉ行・（ｊ＋１）列の列・ビットレベル・セルＭ_i(j+1)は、第１遅延素子Ｄ_i(j+1)１を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子Ｄ_i(j+1)2を経由して前段のビットレベル・セルＭ_ijの出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ_i(j+1)１と、第１のｎＭＯＳトランジスタＱ_i(j+1)１のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_i(j+1)2と、第２のｎＭＯＳトランジスタＱ_i(j+1)2に並列接続するビットレベル・セルＭ_i(j+1)の情報を格納するコンデンサＣ_i(j+1)と、を備えており、そこでは、第１のｎＭＯＳトランジスタＱ_i(j+1)１のソース電極と第２のｎＭＯＳトランジスタＱ_i(j+1)2のドレイン電極とを接続する出力ノードは、次段のセルに、コンデンサＣ_i(j+1)に格納されていた信号を送るビットレベル・セルＭ_i(j+1)の出力端子として機能する。

そして、（ｉ＋１）行・ｊ列のビットレベル・セルＭ_{（ｉ＋１）ｊ}は、第１遅延素子Ｄ_{（ｉ＋１）ｊ１}を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子Ｄ_{（ｉ＋１）ｊ２}を経由して前段のビットレベル・セルの出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ_{（ｉ＋１）ｊ１}と、第１のｎＭＯＳトランジスタＱ_{（ｉ＋１）ｊ１}のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_{（ｉ＋１）ｊ２}と、第２のｎＭＯＳトランジスタＱ_{（ｉ＋１）ｊ２}に並列接続するビットレベル・セルＭ_{（ｉ＋１）ｊ}の情報を格納するコンデンサＣ_{（ｉ＋１）ｊ}と、を備えており、そこでは、第１のｎＭＯＳトランジスタＱ_{（ｉ＋１）ｊ１}のソース電極と第２のｎＭＯＳトランジスタＱ_{（ｉ＋１）ｊ２}のドレイン電極とを接続する出力ノードは、次段のビットレベル・セルＭ_{（ｊ＋１）（ｉ＋１）}に、コンデンサＣ_{（ｉ＋１）ｊ}に格納されていた信号を送るビットレベル・セルＭ_{（ｉ＋１）ｊ}の出力端子として機能する。

更に、（ｉ＋１）行・（ｊ＋１）ｊ列のビットレベル・セルＭ_{（ｉ＋１）（ｊ＋１）}は、第１遅延素子Ｄ_{（ｉ＋１）（ｊ＋１）１}を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子Ｄ_{（ｉ＋１）（ｊ＋１）２}を経由して前段のビットレベル・セルＭ_{（ｉ＋１）ｊ}の出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ_{（ｉ＋１）（ｊ＋１）１}と、第１のｎＭＯＳトランジスタＱ_{（ｉ＋１）（ｊ＋１）１}のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_{（ｉ＋１）（ｊ＋１）２}と、第２のｎＭＯＳトランジスタＱ_{（ｉ＋１）（ｊ＋１）２}に並列接続するビットレベル・セルＭ_{（ｉ＋１）（ｊ＋１）}の情報を格納するコンデンサＣ_{（ｉ＋１）（ｊ＋１）２}と、を備えており、そこでは、第１のｎＭＯＳトランジスタＱ_{（ｉ＋１）（ｊ＋１）１}のソース電極と第２のｎＭＯＳトランジスタＱ_{（ｉ＋１）（ｊ＋１）２}のドレイン電極を接続する出力ノードは、次段のセルに、コンデンサＣ_{（ｉ＋１）（ｊ＋１）}に格納されていた信号を送るビットレベル・セルＭ_{（ｉ＋１）（ｊ＋１）}の出力端子として機能する。

図６に示すように、ｉ行のｊ番目のビットレベル・セルＭ_ijは、第１遅延素子Ｄ_ij1を経由してクロック信号供給線に接続するドレイン電極と第２遅延素子Ｄ_ij2を経由して前段のセルの出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ_ij1と、第１のｎＭＯＳトランジスタＱ_ij1のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_ij2と、第２のｎＭＯＳトランジスタＱ_ij2に並列接続するビットレベル・セルＭ_ijの情報を格納するコンデンサＣ_ijと、を備えている。

図６に示す回路構成において、第２のｎＭＯＳトランジスタＱ_ij2は、ハイレベル（又は“１”の論理レベル）のクロック信号が第２のｎＭＯＳトランジスタＱ_ij2のゲート電極に印加されて、コンデンサＣ_ijに既に格納していた信号電荷が排出（放電）すると、コンデンサＣ_ijに格納された信号電荷をリセットするリセット・トランジスタとして機能する。

図７Ａ及び図７Ｂは、本発明の第１の実施形態に係る計算機システムで用いるビットレベル・セルのクロック信号波形に対するトランジスタ・レベルの過渡応答の概略的な例を示している。即ち、図７Ａ及び図７Ｂは、ビットレベル・セルの一例として、図６に示すビットレベル・セルＭ_ijを採用し、破線で示すクロック信号波形に対するビットレベル・セルＭ_ijのトランジスタ・レベルの過渡応答を示している。破線で示すクロック信号は、クロック周期τ_clockによって、論理レベル“１”と“０”の間で定期的に振動している。図７Ａ及び図７Ｂにおいて、ｔ_１−ｔ_０（＝ｔ_２−ｔ_１＝ｔ_３−ｔ_２＝ｔ_４−ｔ_３）は、クロック周期τ_clockの１／４と定義されている（＝τ_clock／４）。

（ａ）図７Ａ（ａ）に示すように、時刻“ｔ_０”で、破線で示すハイレベルのクロック信号は第１の理想的な遅延素子Ｄ_ij1を経由して第１のｎＭＯＳトランジスタＱ_ij1のドレイン電極と第２のｎＭＯＳトランジスタＱ_ij2のゲート電極の両方に印加されるので、第２のｎＭＯＳトランジスタＱ_ij2は、第１のｎＭＯＳトランジスタＱ_ij1が時刻“ｔ１”でオン状態になるまでオフ状態を維持する。何故ならば、第１のｎＭＯＳトランジスタＱ_ij1のソース電極と第２のｎＭＯＳトランジスタＱ_ij2のドレイン電極との間を接続する出力ノードＮ_outの電位が浮遊状態であるため、時刻“ｔ₀₁”の間は“０”と“１”の論理レベルの間にあるからである。

（ｂ）第１の理想的な遅延素子Ｄ_ij1のために、第１のｎＭＯＳトランジスタＱ_ij1のターン・オン遷移がｔ_１−ｔ_０＝τ_clock／４だけ遅延し、第１のｎＭＯＳトランジスタＱ_ij1が時刻“ｔ_１”で転送トランジスタとして作動状態になり、出力ノードＮ_outの電位が論理レベル“１”になる。ここで、第１の理想的な遅延素子Ｄ_{i j1}は、急峻な立ち上がりエッジによりτ_clock／４の遅延が実現でき、立ち上がり時間が無視できると想定している。即ち、図７Ａ（ａ）で急峻な立ち上がりエッジと急峻な立ち下がりエッジとで示すように、時刻“ｔ_０”で印加したクロック信号は、ｔ_１−ｔ_０＝τ_clock／４だけ遅延する。そこで、図７Ａ（ｃ）〜（ｄ）に示すように、前段のビットレベル・セルＭ_i(j-1)に格納されていた信号が“１”の論理レベルになると、第２のｎＭＯＳトランジスタＱ_ij2がリセット・トランジスタとして作動状態になり、コンデンサＣ_ijに格納されていた信号電荷が、時刻“ｔ_２”で排出（放電）するように駆動される。

（ｃ）第１のｎＭＯＳトランジスタＱ_ij1は、第２の理想的な遅延素子Ｄ_ij2から決まる、所定の遅延時間ｔ_d2＝ｔ_２−ｔ_０＝τ_clock／２だけ遅延して、時刻“ｔ_２”で転送トランジスタとして完全に作動状態になる。ここで、第２の理想的な遅延素子Ｄ_ij2は、急峻な立ち上がりエッジによりτ_clock／２の遅延が実現でき、立ち上がり時間が無視できると想定している。次に、前段のビットレベル・セルＭ_i(j-1)に格納された“１”の論理レベルの信号が、ｉ行の前段のビットレベル・セルＭ_i(j-1)から、第１のｎＭＯＳトランジスタＱ_ij1のゲート電極に送られたとする。“１”の論理レベルの信号が、ゲート電極に送られると、時刻“ｔ_２”で、コンデンサＣ_ijに格納されていた信号電荷が完全に放電して、図７Ａ（ｂ）に示すように、“０”の論理レベルとなる。このように、第１のｎＭＯＳトランジスタＱ_ij1は、図７Ａ（ｃ）〜（ｄ）に示すように、マーチングＡＮＤゲートの動作を実行するように、前段のビットレベル・セルＭ_i(j-1)に格納された“１”の論理レベルの信号を、コンデンサＣ_ijに転送することを始める。即ち、クロック信号が提供する“１”の入力信号と、前段のビットレベル・セルＭ_i(j-1)が出力する他の“１”の入力信号とにより、
１＋１＝１
という従来の２入力ＡＮＤ動作が実行できる。なお、コンデンサＣ_ijに格納されていた信号電荷が“１”の論理レベルのとき、コンデンサＣ_ijは時刻“ｔ_０”で放電を開始できる。何故ならば、第２のｎＭＯＳトランジスタＱ_ij2は、第２のｎＭＯＳトランジスタＱ_ij2の動作に遅延がないと、時刻“ｔ_０”で第２のｎＭＯＳトランジスタＱ_ij2のゲート電極に印加された、破線で示すハイレベルのクロック信号により、リセット・トランジスタとして作動するからである。

（ｄ）代わりに、図７Ｂ（ｃ）〜（ｄ）に示すように、前段のビットレベル・セルＭ_i(j-1)に格納されていた信号が“０”の論理レベルの場合、第１のｎＭＯＳトランジスタＱ_ij1は、任意の時刻“ｔ_０”、“ｔ_１”、“ｔ_２”、“ｔ_３”でオフ状態を維持する。前述のように、コンデンサＣ_ijに格納されていた信号電荷が“１”の論理レベルのとき、第１のｎＭＯＳトランジスタＱ_ij1がオフしていても、コンデンサＣ_ijは時刻“ｔ_０”で放電を開始できる。何故ならば、第２のｎＭＯＳトランジスタＱ_ij2は、時刻“ｔ_０”で第２のｎＭＯＳトランジスタＱ_ij2のゲート電極に印加された、破線で示すハイレベルのクロック信号によりリセット・トランジスタとして作動するからである。
１＋０＝０
というマーチングＡＮＤゲートの動作が、クロック信号が提供する“１”の入力信号と前段のビットレベル・セルＭ_i(j-1)が出力する“０”の他の入力信号とにより、図７Ａ（ｃ）〜（ｄ）に示すようにして実行される。しかし、コンデンサＣ_ijに格納されていた信号電荷が“０”の論理レベルの場合、第１のｎＭＯＳトランジスタＱ_ij1と第２のｎＭＯＳトランジスタＱ_ij2の両方がオフ状態を維持するので、コンデンサＣ_ijは、任意の時刻“ｔ_０”、“ｔ_１”、“ｔ₂₃”において“０”の論理レベルを維持し、マーチングＡＮＤゲートの動作が、７Ａ（ｃ）〜（ｄ）に示すようにして実行される。第１のｎＭＯＳトランジスタＱ_ij1のソース電極と第２のｎＭＯＳトランジスタＱ_ij2のドレイン電極とを接続する出力ノードＮ_outは、ビットレベル・セルＭ_ijの出力端子として機能する。ビットレベル・セルＭ_ijの出力端子は、コンデンサＣ_ijに格納されていた信号を、ｉ行の次段のビットレベル・セルに出力する。

更に、図７Ｃは、図８に示すように、第１遅延素子Ｄ_ij1と第２遅延素子Ｄ_ij2の両方がＲ−Ｃ遅延回路からなる場合に、クロック信号波形に対する応答の実例を示す。マーチングメモリの正規の動作では、コンデンサＣ_ijに格納されていた信号電荷は“０”又は“１”の論理レベルのいずれかに実際になる。コンデンサＣ_ijに格納されていた信号電荷が“１”の論理レベルのとき、第１のｎＭＯＳトランジスタＱ_{i j1}が遮断状態であっても、コンデンサＣ_ijは時刻“ｔ_０”で放電を開始できる。何故ならば、第２のｎＭＯＳトランジスタＱ_ij2は、遅延のない第２のｎＭＯＳトランジスタＱ_ij2の理想的な動作がほぼ行える場合に、ハイレベルのクロック信号が第２のｎＭＯＳトランジスタＱ_ij2のゲート電極に印加されるときに、作動状態が開始されるからである。したがって、コンデンサＣ_ijに格納されていた信号電荷が実際に“１”の論理レベルであると、ハイレベルのクロック信号が第２のｎＭＯＳトランジスタＱ_ij2のゲート電極に印加され、コンデンサＣ_ijに格納されていた信号電荷が放電した後に、第１のｎＭＯＳトランジスタＱ_ij1は、Ｒ−Ｃ遅延回路により第１遅延素子Ｄ_ij1から定まる所定の遅延時間ｔ_ｄ１だけ遅れて、転送トランジスタとして作動する。そして、ｉ行の前段のビットレベル・セルＭ_i(j-1)に格納されていた信号が、ｉ行の前段のビットレベル・セルＭ_i(j-1)からｉ行の第１のｎＭＯＳトランジスタＱ_ij1のゲート電極に送られたとする。ビットレベル・セルＭ_i(j-1)に格納されていた信号がゲート電極に送られると、第１のｎＭＯＳトランジスタＱ_ij1は、前段のビットレベル・セルＭ_i(j-1)に格納されていた信号をコンデンサＣ_ijに、第２遅延素子Ｄ_ij2から決まる所定の遅延時間ｔ_d2だけ更に遅れて転送する。第１のｎＭＯＳトランジスタＱ_ij1のソース電極と第２のｎＭＯＳトランジスタＱ_ij2とを接続する出力ノードＮ_outはビットレベル・セルＭ_ijの出力端子として機能し、ビットレベル・セルＭ_ijの出力端子は、コンデンサＣ_ijに格納されていた信号をｉ行の次段のビットレベル・セルに出力する。

図７Ｃに示すように、クロック信号は、所定のクロック周期（クロックサイクル時間）τ_clockにより、“１”と“０”の論理レベルの間を定期的に振動する。クロック信号が“１”の論理レベルになると、第２のｎＭＯＳトランジスタＱ_ij2は、前段のクロックサイクルでコンデンサＣ_ijに既に格納していた信号電荷の放電を始める。そして、“１”の論理レベルのクロック信号が印加され、コンデンサＣ_ijに格納されていた信号電荷が“０”の論理レベルの電位に完全に放電した後、第１のｎＭＯＳトランジスタＱ_ij1は、第１遅延素子Ｄ_ij1から決まる所定の遅延時間ｔ_ｄ１だけ遅れて、転送トランジスタとして作動する。遅延時間ｔ_ｄ１は、好ましくは(１／４)τ_clockと等しく設定できる。その後、ｉ行の前段のビットレベル・セルＭ_i(j-1)に格納されていた信号が前段のビットレベル・セルＭ_i(j-1)から第１のｎＭＯＳトランジスタＱ_ij1のゲート電極に送られたとする。ビットレベル・セルＭ_i(j-1)に格納されていた信号がゲート電極に送られると、第１のｎＭＯＳトランジスタＱ_ij1は、前段のビットレベル・セルＭ_i(j-1)に格納されていた信号を、コンデンサＣ_ijに、Ｒ−Ｃ遅延回路により第２遅延素子Ｄ_ij2から決まる所定の遅延時間ｔ_d2だけ遅れて転送する。

例えば、ｉ行の前段のビットレベル・セルＭ_i(j-1)に格納された“１”の論理レベルが、前段のビットレベル・セルＭ_i(j-1)から第１のｎＭＯＳトランジスタＱ_ij1のゲート電極に送られたとする。“１”の論理レベルがゲート電極に送られると、第１のｎＭＯＳトランジスタＱ_ij1は導電状態になり、“１”の論理レベルがコンデンサＣ_ijに格納される。一方で、前段のビットレベル・セルＭ_i(j-1)に格納された“０”の論理レベルが、前段のビットレベル・セルＭ_i(j-1)から第１のｎＭＯＳトランジスタＱ_ij1のゲート電極に送られたとする。“０”の論理レベルがゲート電極に送られると、第１のｎＭＯＳトランジスタＱ_ij1は遮断状態になり、“０”の論理レベルがコンデンサＣ_ijに維持される。したがって、ビットレベル・セルＭ_ijは、“マーチングＡＮＤゲート”の動作を行うことができる。遅延時間ｔ_d2は遅延時間ｔ_ｄ１よりも長いことが好ましく、遅延時間ｔ_d2をを(１／２)τ_clockとすることが好ましい。

クロック信号はクロック周期τ_clockにより“１”と“０”の論理レベルの間を定期的に振動するので、時刻が(１／２)τ_clockを過ぎると、クロック信号は“０”の論理レベルになる。第１のｎＭＯＳトランジスタＱ_ij1のソース電極と第２のｎＭＯＳトランジスタＱ_ij2のドレイン電極とを接続する出力ノードＮ_outは、時刻が(１／２)τ_clockを過ぎると、前段のビットレベル・セルＭ_i(j-1)から転送された信号を次段のビットレベル・セルＭ_i(j+1)に更に転送できなくなる。信号が、第２遅延素子Ｄ_i(j+1)2から決まる遅延時間ｔ_d2＝(１／２)τ_clockだけ遅れて、次段の第１のｎＭＯＳトランジスタＱ_i(j+1)１のゲート電極への転送が阻止されるからである。クロック信号は、時刻がτ_clockを過ぎると再び“１”の論理レベルになり、第１のｎＭＯＳトランジスタＱ_ij1のソース電極と第２のｎＭＯＳトランジスタＱ_ij2のドレイン電極とを接続する出力ノードＮ_outは、ビットレベル・セルＭ_ijの出力端子として機能し、コンデンサＣ_ijに格納されていた信号を次段のビットレベル・セルＭ_i(j+1)に、次のクロックサイクルで送ることができる。

図４に戻り、図７Ａ（ａ）又は図７Ｃに示すクロック信号が“１”の論理レベルになると、第１のメモリユニットＵ_１に１次元配列された第２のｎＭＯＳトランジスタＱ₁₁₂、Ｑ₂₁₂、Ｑ₃₁₂、-----、Ｑ_m-1,12、Ｑ_m12は、前のクロックサイクルで第１のメモリユニットＵ_１で、それぞれ、コンデンサＣ₁₁、Ｃ₂₁、Ｃ₃₁、-----、Ｃ_m-1,1、Ｃ_m1に既に格納していた、それぞれの信号電荷の放電を始める。そして、“１”の論理レベルのクロック信号が、それぞれ、第２のｎＭＯＳトランジスタＱ₁₁₂、Ｑ₂₁₂、Ｑ₃₁₂、-----、Ｑ_m-1,12、Ｑ_m12の１次元配列のゲート電極に印加され、コンデンサＣ₁₁、Ｃ₂₁、Ｃ₃₁、-----、Ｃ_m-1,1、Ｃ_m1に格納されていた信号電荷が“０”の論理レベルの電位に完全に放電した後に、１次元配列された第１のｎＭＯＳトランジスタＱ₁₁₁、Ｑ₂₁₁、Ｑ₃₁₁、-----、Ｑ_m-1,11、Ｑ_m11は、それぞれ、第１遅延素子Ｄ₁₁₁、Ｄ₂₁₁、Ｄ₃₁₁、-----、Ｄ_m-1,11、Ｄ_m11から決まる遅延時間ｔ_ｄ１だけ遅れて、転送トランジスタとして作動する。その後、１６、32、６４ビットのように８ビットの倍数である、１次元に配列されたワード・サイズの信号が、１次元配列された第１のｎＭＯＳトランジスタＱ₁₁₁、Ｑ₂₁₁、Ｑ₃₁₁、-----、Ｑ_m-1,11、ＱＭ_m11のゲート電極に入ると、１次元配列された第１のｎＭＯＳトランジスタＱ₁₁₁、Ｑ₂₁₁、Ｑ₃₁₁、-----、Ｑ_m-1,11、Ｑ_m11は、それぞれ、第２遅延素子Ｄ₁₁₂、Ｄ₂₁₂、Ｄ₃₁₂、-----、Ｄ_m-1,12、Ｄ_m12から決まる遅延時間ｔ_d2だけ遅れて、コンデンサＣ₁₁、Ｃ₂₁、Ｃ₃₁、-----、Ｃ_m-1,1、Ｃ_m1に、１次元に配列されたワード・サイズの信号を転送する。

クロック信号が、時刻が(１／２)τ_clockを過ぎたときに“０”の論理レベルになると、第１のｎＭＯＳトランジスタＱ₁₁₁、Ｑ₂₁₁、Ｑ₃₁₁、-----、Ｑ_m-1,11、Ｑ_m11のソース電極と第２のｎＭＯＳトランジスタＱ₁₁₂、Ｑ₂₁₂、Ｑ₃₁₂、-----、Ｑ_m-1,12、Ｑ_m12のドレイン電極とを接続する出力ノードのそれぞれは、時刻が(１／２)τ_clockを過ぎると、次段のビットレベル・セルＭ₁₂、Ｍ₂₂、Ｍ₃₂、-----、Ｍ_m-1,2、Ｍ_m2に、第１のｎＭＯＳトランジスタＱ₁₁₁、Ｑ₂₁₁、Ｑ₃₁₁、-----、Ｑ_m-1,11、Ｑ_m11のゲート電極に入力している信号をもう送ることができない。信号のそれぞれが、第２遅延素子Ｄ₁₂₂、Ｄ₂₂₂、Ｄ₃₂₂、-----、Ｄ_m-1,22、Ｄ_m22から決まる遅延時間ｔ_d2＝(１／２)τ_clockだけ遅れて、次段の第１のｎＭＯＳトランジスタＱ₁₂₁、Ｑ₂₂₁、Ｑ₃₂₁、-----、Ｑ_m-1,21、Ｑ_m21のゲート電極への転送を阻止されるからである。

時刻がτ_clockを過ぎたときに、次のクロック信号が再び“１”の論理レベルになると、第２のメモリユニットＵ_２に１次元配列された第２のｎＭＯＳトランジスタＱ₁₂₂、Ｑ₂₂₂、Ｑ₃₂₂、-----、Ｑ_m-1,22、Ｑ_m22は、前のクロックサイクルで第２のメモリユニットＵ_２に、それぞれ、コンデンサＣ₁₂、Ｃ₂₂、Ｃ₃₂、-----、Ｃ_m-1,2、Ｃ_m2に既に格納していた、それぞれ、信号電荷の放電を始める。そして、“１”の論理レベルのクロック信号が、それぞれ、１次元配列された第２のｎＭＯＳトランジスタＱ₁₂₂、Ｑ₂₂₂、Ｑ₃₂₂、-----、Ｑ_m-1,22、Ｑ_m22のそれぞれのゲート電極に印加され、コンデンサＣ₁₂、Ｃ₂₂、Ｃ₃₂、-----、Ｃ_m-1,2、Ｃ_m2に格納されていた信号電荷が“０”の論理レベルの電位に完全に放電した後、１次元配列された第１のｎＭＯＳトランジスタＱ₁₂₁、Ｑ₂₂₁、Ｑ₃₂₁、-----、Ｑ_m-1,21、Ｑ_m21は、それぞれ、第１遅延素子Ｄ₁₂₁、Ｄ₂₂₁、Ｄ₃₂₁、-----、Ｄ_m-1,21、Ｄ_m21から決まる遅延時間ｔ_ｄ１だけ遅れて、転送トランジスタとして作動する。その後、前段のコンデンサＣ₁₁、Ｃ₂₁、Ｃ₃₁、-----、Ｃ_m-1,1、Ｃ_m1に１次元配列されて格納されたワード・サイズの信号が１次元配列された第１のｎＭＯＳトランジスタＱ₁₂₁、Ｑ₂₂₁、Ｑ₃₂₁、-----、Ｑ_m-1,21、Ｑ_m21のそれぞれのゲート電極に送られ、第１のｎＭＯＳトランジスタＱ₁₂₁、Ｑ₂₂₁、Ｑ₃₂₁、-----、Ｑ_m-1,21、Ｑ_m21は、コンデンサＣ₁₂、Ｃ₂₂、Ｃ₃₂、-----、Ｃ_m-1,2、Ｃ_m2に、第２遅延素子Ｄ₁₂₂、Ｄ₂₂₂、Ｄ₃₂₂、-----、Ｄ_m-1,22、Ｄ_m22から決まる遅延時間ｔ_d2だけ遅れて、１次元に配列されたワード・サイズの信号を送る。

クロック信号は、更に時刻が（１＋１／２）τ_clockを過ぎて“０”の論理レベルになると、第１のｎＭＯＳトランジスタＱ₁₂₁、Ｑ₂₂₁、Ｑ₃₂₁、-----、Ｑ_m-1,21、Ｑ_m21のソース電極と第２のｎＭＯＳトランジスタＱ₁₂₂、Ｑ₂₂₂、Ｑ₃₂₂、-----、Ｑ_m-1,22、Ｑ_m2のドレイン電極とを接続する出力ノードのそれぞれは、時刻が（１＋１／２）τ_clockを過ぎると、次段のビットレベル・セルＭ₁₂、Ｍ₂₂、Ｍ₃₂、-----、Ｍ_m-1,2、Ｍ_m2に、前段のビットレベル・セルＭ₁₁、Ｍ₂₁、-----、Ｍ_m-1,1、Ｍ_m1に格納されていた信号を送ることができない。信号のそれぞれが、第２遅延素子Ｄ₁₃₂、Ｄ₂₃₂、Ｄ₃₃₂、-----、Ｄ_m-1,32、Ｄ_m32から決まる遅延時間ｔ_d2＝(１／２)τ_clockだけ遅れ、次段の第１のｎＭＯＳトランジスタＱ₁₃₁、Ｑ₂₃₁、Ｑ₃₃₁、-----、Ｑ_m-1,31、Ｑ_m31のゲート電極への転送が阻止されるからである。

そして、更に時刻が２τ_clockが過ぎて、次のクロック信号が再び“１”の論理レベルになると、第３のメモリユニットＵ_２に１次元配列された第２のｎＭＯＳトランジスタＱ₁₃₂、Ｑ₂₃₂、Ｑ₃₃₂、-----、Ｑ_m-1,32、Ｑ_m32は、前のクロックサイクルで第３のメモリユニットＵ_２に、それぞれ、コンデンサＣ₁₃、Ｃ₂₃、Ｃ₃₃、-----、Ｃ_m-1,3、Ｃ_m3に既に格納していた、それぞれ、信号電荷の放電を始める。そして、“１”の論理レベルのクロック信号が、それぞれ、１次元配列された第２のｎＭＯＳトランジスタＱ₁₃₂、Ｑ₂₃₂、Ｑ₃₃₂、-----、Ｑ_m-1,32、Ｑ_m32のそれぞれのゲート電極に印加され、コンデンサＣ₁₃、Ｃ₂₃、Ｃ₃₃、-----、Ｃ_m-1,3、Ｃ_m3に格納されていた信号電荷が“０”の論理レベルの電位に完全に放電した後に、１次元配列された第１のｎＭＯＳトランジスタＱ₁₃₁、Ｑ₂₃₁、Ｑ₃₃₁、-----、Ｑ_m-1,31、Ｑ_m31は、それぞれ、第１遅延素子Ｄ₁₃₁、Ｄ₂₃₁、Ｄ₃₃₁、-----、Ｄ_m-1,31、Ｄ_m31から決まる遅延時間ｔ_ｄ１だけ遅れて、転送トランジスタとして作動する。その後、前段のコンデンサＣ₁₂、Ｃ₂₂、Ｃ₃₂、-----、Ｃ_m-1,2、Ｃ_m2に１次元配列されて格納されたワード・サイズの信号は、１次元配列された第１のｎＭＯＳトランジスタＱ₁₃₁、Ｑ₂₃₁、Ｑ₃₃₁、-----、Ｑ_m-1,31、Ｑ_m31のそれぞれのゲート電極に送られる。第１のｎＭＯＳトランジスタＱ₁₃₁、Ｑ₂₃₁、Ｑ₃₃₁、-----、Ｑ_m-1,31、Ｑ_m31は、コンデンサＣ₁₃、Ｃ₂₃、Ｃ₃₃、-----、Ｃ_m-1,3、Ｃ_m3に、第２遅延素子Ｄ₁₃₂、Ｄ₂₃₂、Ｄ₃₃₂、-----、Ｄ_m-1,32、Ｄ_m32から決まる遅延時間ｔ_d2だけ遅れて、１次元に配列されたワード・サイズの信号を転送する。

図８に示すように、第１遅延素子Ｄ_ij1と第２遅延素子Ｄ_ij2のそれぞれは、周知の“抵抗−容量性遅延”又は「Ｒ−Ｃ遅延」から形成できる。ＲＣ回路では、時定数の値（単位は秒）は、回路抵抗（単位はオーム）と回路容量（単位はファラッド）の積、即ち、ｔ_ｄ１、ｔ_d2＝Ｒ×Ｃに等しい。ＲＣ回路の構造は非常に単純なので、第１遅延素子Ｄ_ij1と第２遅延素子Ｄ_ij2をＲＣ回路に使用することが望ましい。しかし、ＲＣ回路は単なる例であり、第１遅延素子Ｄ_ij1と第２遅延素子Ｄ_ij2は、他の受動性遅延素子、又はトランジスタなどの能動性素子を含む様々な能動性遅延素子から形成できる。

図９は、図８に示すｉ行・ｊ列のビットレベル・セルＭ_ijの実際の平面パターンの上面図の例で、ＲＣ遅延回路で形成した第１遅延素子Ｄ_ij1と第２遅延素子Ｄ_ij2とを有している。図１０は、図９のＡ−Ａ線上で対応する断面図を示す。図９に示すように、第１遅延素子Ｄ_ij1は導電性配線の第１メアンダライン（蛇行線）９１から形成し、第２遅延素子Ｄ_ij2は導電性配線の第２メアンダライン（蛇行線）９７から形成している。

図９に示すように、第１のｎＭＯＳトランジスタＱ_ij1は、コンタクト・プラグ９６ａを経由して第１メアンダライン９１に接続するドレイン領域９３を有する。第１のｎＭＯＳトランジスタＱ_ij1のドレイン領域９３に接続する端部の反対側の第１メアンダライン９１の他端は、クロック信号供給線に接続している。第１のｎＭＯＳトランジスタＱ_ij1のゲート電極は、第２メアンダライン９７で形成されている。第１のｎＭＯＳトランジスタＱ_ij1のゲート電極として機能する端部の反対側の第２メアンダライン９７の他端は、前段のセルの出力端子に接続している。

第２のｎＭＯＳトランジスタＱ_ij2は、共通ｎ_＋半導体領域９４からなるドレイン領域をもつが、ｎ_＋半導体領域９４は第１のｎＭＯＳトランジスタＱ_ij1のソース電極領域としても機能している。第２のｎＭＯＳトランジスタＱ_ij2は、更に、コンタクト・プラグ９６ａを経由してクロック信号供給線に接続するゲート電極９８と、コンタクト・プラグ９６ｃを経由して接地電位に接続するソース電極領域９５を備える。ソース電極領域９５はｎ_＋半導体領域で形成されている。共通ｎ_＋半導体領域９４は、第１のｎＭＯＳトランジスタＱ_ij1のソース電極領域と第２のｎＭＯＳトランジスタＱ_ij2のドレイン領域とを接続する出力ノードなので、共通ｎ_＋半導体領域９４は、コンタクト・プラグ９６ｄを経由して表面配線９２ｂに接続している。共通ｎ_＋半導体領域９４は、ビットレベル・セルＭ_ijの出力端子として機能して、表面配線９２ｂを経由して次のビットレベル・セルに、コンデンサＣ_ijに格納されていた信号を送る。

図１０に示すように、ドレイン領域９３、共通ｎ_＋半導体領域９４及びソース電極領域９５は、ｐ型半導体基板８１の表面に接した上部に設けられている。ｐ型半導体基板８１の代わりに、ドレイン領域９３、共通ｎ_＋半導体領域９４及びソース電極領域９５は、半導体表面上に成長したｐウェル又はｐ型エピタキシャル層に設けることもできる。ｐ型半導体基板８１上に、素子分離絶縁体８２が、素子分離絶縁体８２に設けた窓部として、ｐ型半導体基板８１の活性領域（アクティブ・エリア）を画定するように設けられている。そして、ドレイン領域９３、共通ｎ_＋半導体領域９４及びソース電極領域９５は、素子分離絶縁体８２で囲われた活性領域（アクティブ・エリア）に設けられている。活性領域（アクティブ・エリア）の表面に接してゲート絶縁膜８３が設けられている。そして、第２メアンダライン９７で形成した第１のｎＭＯＳトランジスタＱ_ij1のゲート電極と、第２のｎＭＯＳトランジスタＱ_ij2のゲート電極９８が、ゲート絶縁膜８３上に設けられている。

図１０に示すように、第１の層間誘電膜８４が、第２メアンダライン９７とゲート電極９８の上に設けられている。第１の層間誘電膜８４の一部に、ビットレベル・セルＭ_ijの情報を格納するコンデンサＣ_ijの底部電極８５が設けられている。底部電極８５は導電膜で作られている。コンタクト・プラグ９６ｃが、底部電極８５とソース電極領域９５との間を接続するように第１の層間誘電膜８４に設けられている。そして、底部電極８５上に、キャパシタ絶縁膜８６が設けられている。

更に、キャパシタ絶縁膜８６上に、コンデンサＣ_ijの上部電極８７が、底部電極８５の上部を占めるように設けられている。上部電極８７は導電膜からなる。図１０に示す断面図では図示を省略しているが、上部電極８７は、コンデンサＣ_ijが第２のｎＭＯＳトランジスタＱ_ij2に並列接続する電気回路のトポロジーを実現するように、共通ｎ_＋半導体領域９４に電気的に接続している。様々な絶縁膜をキャパシタ絶縁膜８６として使用できる。微細化されたマーチング主記憶装置は、上部電極８７と対向する底部電極８５が小さな領域を占めることが要求される。しかし、マーチング主記憶装置が正規に機能するために、底部電極８５とキャパシタ絶縁膜８６を介して対向する上部電極８７の間の静電容量は、一定の値を有する必要がある。特に、最小線幅が約１００ｎｍ以下の微細化構造を有するマーチング主記憶装置では、酸化ケイ素（ＳｉＯ_２）より大きい誘電率ｅ_ｒもつ材料の使用が、底部電極８５と上部電極８７との間の蓄積容量を考慮すると好ましい。ＯＮＯ膜として、例えば、上層の酸化ケイ素膜、中間層の窒化ケイ素膜、下層の酸化ケイ素膜の厚み比率を選択することにより、約５〜５．５の誘電率ｅ_ｒを実現することができる。代わりに、ｅ_ｒ＝６の酸化ストロンチウム（ＳｒＯ）膜、ｅ_ｒ＝７の窒化ケイ素（Ｓi₃Ｎ_４）膜、ｅ_ｒ＝８〜１１の酸化アルミニウム（Ａｌ_２Ｏ_３）膜、ｅ_ｒ＝１０の酸化マグネシウム（ＭｇＯ）膜、ｅ_ｒ＝１６〜１７の酸化イットリウム（Ｙ_２Ｏ_３）膜、ｅ_ｒ＝２２〜２３の酸化ハフニウム（ＨｆＯ_２）膜、ｅ_ｒ＝２２〜２３の酸化ジルコニウム（ＺｒＯ_２）膜、ｅ_ｒ＝２５〜２７の酸化タンタル（Ｔａ_２Ｏ_５）膜、又はｅ_ｒ＝４０の酸化ビスマス（Ｂi₂Ｏ_３）膜の中の任意の一つから選択した単層膜、又はこれらの複数の層の中の少なくとも２つを含む複合膜を使用できる。Ｔａ_２Ｏ_５とＢi₂Ｏ_３は、ポリシリコンとの界面で熱安定性に欠けるという欠点がある。更に、酸化ケイ素膜とこれらの膜とからなる複合膜でもよい。複合膜は、三層構造以上の多層構造でもよい。言い換えれば、少なくともその一部に比誘電率ｅ_ｒ＝５〜６以上の材料を含む絶縁膜でよい。しかし、複合膜の場合、膜全体を測定したときに実効比誘電率ｒ_ｅｆｆ＝５〜６以上となる組み合わせを選択することが好ましい。更に、アルミン酸ハフニウム（ＨｆＡｌＯ）膜のような三元化合物の酸化膜からなる絶縁膜もある。

更に、第２の層間誘電膜８７が上部電極８７に設けられている。第１メアンダライン９１が第２の層間誘電膜８７に設けられている。図１０に示すように、コンタクト・プラグ９６ａが、第１メアンダライン９１とドレイン領域９３との間を接続するように、第１の層間誘電膜８４とキャパシタ絶縁膜８６と第２の層間誘電膜８７とを貫くように設けられている。

図９及び図１０に示すトポロジーで、ＲＣ遅延の静電容量Ｃは、第１メアンダライン９１と第２メアンダライン９７に伴う浮遊抵抗から生じる。ＲとＣは共に第１メアンダライン９１と第２メアンダライン９７の配線長に比例するので、遅延時間ｔ_ｄ１とｔ_d2は、第１メアンダライン９１の第２メアンダライン９７の配線長を選ぶと容易に設計できる。更に、我々は、遅延時間ｔ_ｄ１とｔ_d2が望ましい値ともつように、第１メアンダライン９１と第２メアンダライン９７の厚み、断面積及び抵抗率を設計できる。

例えば、遅延時間ｔ_d2が遅延時間ｔ_ｄ１の２倍とし、第１メアンダライン９１と第２メアンダライン９７が同じ厚み、同じ断面積及び同じ比抵抗率をもつ材料からなり、更にＲ−Ｃ遅延（＝Ｒ×Ｃ）の浮遊抵抗を生じる絶縁膜が同じ有効厚みと同じ実効誘電率であるとすると、第２メアンダライン９７の配線長は、第１メアンダライン９１の配線長の2_1／２として設計できる。しかし、第１メアンダライン９１と第２メアンダライン９７が異なる材料を用いると、第１メアンダライン９１と第２メアンダライン９７の配線長は、遅延時間ｔ_ｄ１とｔ_d2に必要な値を得るために、第１メアンダライン９１と第２メアンダライン９７の抵抗率に基づいて決定しなければならない。例えば、第２メアンダライン９７が多結晶シリコン製で、第１メアンダライン９１が多結晶シリコンより大きい抵抗率をもつタングステン（Ｗ）やモリブデン（Ｍｏ）やプラチナ（Ｐｔ）のような高融点金属材料からなるとき、第１メアンダライン９１と第２メアンダライン９７の配線長は、遅延時間ｔ_ｄ１とｔ_d2に必要な値を得るために、第１メアンダライン９１と第２メアンダライン９７の抵抗率に基づいて決まる。

更に、第１メアンダライン９１と第２メアンダライン９７を図９に示したが、図９に示す抵抗Ｒとして示す蛇行形状は単なる例であり、直線構成のような他のトポロジーも、抵抗ＲとコンデンサＣに必要な値に基づいて使用できる。超高速動作用マーチング主記憶装置３１では、寄生抵抗（浮遊抵抗）と寄生容量（浮遊容量）の値が必要な遅延時間ｔ_ｄ１とｔ_d2を達成するようになってくるので、そのような場合は、外部抵抗素子Ｒは省略できるようになってくる。

図４〜図６に示す構成の場合、ｉ行の（ｊ−１）番目のビットレベル・セルＭ_i,j-1の信号格納状態とｉ行のｊ番目のビットレベル・セルＭ_ijの信号格納状態の間の分離は、（ｊ−１）番目のビットレベル・セルＭ_i,j-1の出力端子とｊ番目のビットレベル・セルＭ_ijの第１のｎＭＯＳトランジスタＱ_ij1のゲート電極の間の信号伝搬経路における伝搬遅延で生じるが、伝搬遅延は第２遅延素子Ｄ_ij2の値に主として起因する。そこで、図１１及び図１３に示すように、（ｊ−１）番目のビットレベル・セルＭ_i,j-1とｊ番目のビットレベル・セルＭ_ijの間にユニット間セルＢ_ijを挿入することが好ましい。

ユニット間セルＢ_ijは（ｊ−１）番目のメモリユニットＵ_(j-1)の（ｊ−１）番目のビットレベル・セルＭ_i,j-1の信号格納状態から、ｊ番目のメモリユニットＵ_ｊのｊ番目のビットレベル・セルＭ_ijの信号格納状態を分離するために設けられている。ユニット間セルＢ_ijは、クロック信号供給線から供給されるクロック信号が設定した必要なタイミングで、ｊ番目のビットレベル・セルＭ_ijに対して、（ｊ−１）番目のビットレベル・セルＭ_i,j-1から信号を送る。ｊ番目のメモリユニットＵ_ｊは、ｊ番目のメモリユニットＵ_ｊに１次元配列されたビットレベル・セルにバイト・サイズ又はワード・サイズの情報を格納し、（ｊ−１）番目のメモリユニットＵ_ｊ−１は、（ｊ−１）番目のメモリユニットＵ_ｊ−１に１次元配列されたビットレベル・セルにバイト・サイズ又はワード・サイズの情報を格納しているので、メモリユニットＵ_ｊ−１及びメモリユニットＵ_ｊに対し平行に配列されたユニット間セルの１次元配列は、クロック信号供給線が供給するクロック信号の制御に準じて、バイト・サイズ又はワード・サイズの情報を転送する。したがって、１次元配列されたバイト・サイズ又はワード・サイズの情報は、所定の方向に沿って、同じ歩調で隊列をなして進行する。図１１及び図１３に示すように、ｉ行のｊ番目のビットレベル・セルＭ_ijの入力端子はユニット間セルＢ_ijに接続しているので、（ｊ−１）番目のビットレベル・セルＭ_i,j-1に格納されていた信号電荷は、必要なタイミングでユニット間セルＢ_ijを介して第２遅延素子Ｄ_ij2に送られ、信号電荷の転送動作は必要なタイミング以外の期間でオフになる。

図１１及び図１３には、（ｊ−１）番目のビットレベル・セルＭ_ijの出力端子に接続した第１主電極、ｊ番目のビットレベル・セルＭ_ijの入力端子に接続した第２主電極、及びクロック信号供給線に接続した制御電極を有する分離トランジスタＱ_ij3を備えたユニット間セルＢ_ijの例が示されているが、ユニット間セルＢ_ijの構造は図１１及び図１３に示す構成に限定されない。例えば、ユニット間セルＢ_ijは、（ｊ−１）番目のビットレベル・セルＭ_i,j-1からｊ番目のビットレベル・セルＭ_ijに、クロック信号が決める所定のタイミングで信号を転送できる、複数のトランジスタを有するクロック回路によっても実現できる。

図５に示した構成と同様に、ｊ番目のビットレベル・セルＭ_ijは、第１遅延素子Ｄ_ij1を介してクロック信号供給線に接続するドレイン電極と第２遅延素子Ｄ_ij2を介してユニット間セルＢ_ijに接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ_ij1と、第１のｎＭＯＳトランジスタＱ_ij1のソース電極に接続するドレイン電極とクロック信号供給線に接続するゲート電極と、接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_ij2と、第２のｎＭＯＳトランジスタＱ_ij2に並列接続してビットレベル・セルＭ_ijの情報を格納するコンデンサＣ_ijと、を含んでいる。

図９に既に示したビットレベル・セルＭ_ijの構成の他、ｎＭＯＳトランジスタからなる分離トランジスタＱ_ij3を備えたユニット間セルＢ_ijの平面構造の一例が、図１２に図示されている。図１２に示すビットレベル・セルＭ_ijには、ドレイン領域９３、コンタクト・プラグ９６ａを介してドレイン領域９３に接続する第１メアンダライン９１、ゲート電極を形成する第２メアンダライン９７を有する第１のｎＭＯＳトランジスタＱ_ij1と、ビットレベル・セルＭ_ijの出力端子となる共通ｎ_＋半導体領域９４をドレイン領域とする第２のｎＭＯＳトランジスタＱ_ij3が図示されている。

図１２で、ユニット間セルＢ_ijを構成する分離トランジスタＱ_ij3は、ｎ_＋半導体領域９０の左側で形成する第１主電極領域と、クロック信号供給線に接続するゲート電極９９と、ｎ_＋半導体領域９０の右側で形成する第２主電極領域とを有する。第２主電極領域は、第１のｎＭＯＳトランジスタＱ_ij1のゲート電極となる第２メアンダライン９７の一端に対向する、第２メアンダライン９７の他端に、コンタクト・プラグ９６ｅを介して接続している。第１主電極領域は、コンタクト・プラグ９６ｆを経由して前段のセルＭ_i,j-1の出力端子に接続している。図示は省略しているが、図１０に示す構造と同様に、第２メアンダライン９７に設けた層間誘電膜上に、例えば、ビットレベル・セルＭ_ijの情報を格納するコンデンサＣ_ijの平行平板構造が、第２のｎＭＯＳトランジスタＱ_ij2に並列接続するようにして設けられている。

図１３では、図１１に示す構成に加えて、他のユニット間セルＢ_i(j-1)が、（ｊ−２）番目のビットレベル・セルＭ_i(j-2)と（ｊ−１）番目のビットレベル・セルＭ_i(j-1)の間に設けられ、（ｊ−１）番目のメモリユニットＵ_j-1の（ｊ−１）番目のビットレベル・セルＭ_i(j-1)の信号格納状態を、（ｊ−２）番目のメモリユニットＵ_ｊ−２の（ｊ−２）番目のビットレベル・セルＭ_i(j-2)の信号格納状態から分離するとともに、信号を（ｊ−２）番目のビットレベル・セルＭ_i(j-2)から（ｊ−１）番目のビットレベル・セルＭ_i(j-1)に、クロック信号供給線からのクロック信号によって、必要なタイミングで転送するように構成している。図１３で、ｉ行の（ｊ−１）番目のビットレベル・セルＭ_i(j-1)の入力端子はユニット間セルＢ_i(j-1)に接続しているので、（ｊ−２）番目のビットレベル・セルＭ_i(j-2)に格納されていた信号電荷は、第２遅延素子Ｄ_i(j-1)2にユニット間セルＢ_i(j-1)を経由して必要なタイミングに送られる。信号電荷の転送動作は、この後にオフする。

図１３には（ｊ−２）番目のビットレベル・セルＭ_i(j-1)の出力端子に接続する第１主電極と、（ｊ−１）番目のビットレベル・セルＭ_i(j-1)の入力端子に接続する第２主電極と、クロック信号供給線に接続する制御電極を有する分離トランジスタＱ_i(j-1)3を備えるユニット間セルＢ_i(j-1)の一例が例示されている。ユニット間セルＢ_i(j-1)の構造は、図１３に示す構成に限定されない。ユニット間セルＢ_i(j-1)は、（ｊ−２）番目のビットレベル・セルＭ_i(j-2)から（ｊ−１）番目のビットレベル・セルＭ_i(j-1)に、クロック信号が決める所定のタイミングで信号を転送できる、複数のトランジスタを有するクロック回路で実現してもよい。

ｊ番目のビットレベル・セルＭ_ijの構成と同様に、（ｊ−１）番目のビットレベル・セルＭ_i(j-1)は、第１遅延素子Ｄ_i(j-1)1を介してクロック信号供給線に接続するドレイン電極及び第２遅延素子Ｄ_i(j-1)2を介してユニット間セルＢ_i(j-1)に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ_i(j-1)1と、第１のｎＭＯＳトランジスタＱ_i(j-1)1のソース電極に接続するドレイン電極、クロック信号供給線に接続するゲート電極及び接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_i(j-1)2と、第２のｎＭＯＳトランジスタＱ_i(j-1)2に並列接続してビットレベル・セルＭ_i(j-1)の情報を格納するコンデンサＣ_i(j-1)とを含んでいる。

図１１及び図１３に示す回路構成において、ビットレベル・セルＭ_ijの第２のｎＭＯＳトランジスタＱ_ij2は、ハイレベル（又は“１”の論理レベル）のクロック信号が第２のｎＭＯＳトランジスタＱ_ij2のゲート電極に印加され、コンデンサＣ_ijに既に格納されていた信号電荷を放電して、コンデンサＣ_ijに格納されていた信号電荷をリセットするリセット・トランジスタとして機能する。ビットレベル・セルＭ_i(j-1)の第２のｎＭＯＳトランジスタＱ_i(j-1)2は、ハイレベル（又は“１”の論理レベル）のクロック信号が第２のｎＭＯＳトランジスタＱ_i(j-1)2のゲート電極に印加され、コンデンサＣ_i(j-1)に既に格納されていた信号電荷を放電して、コンデンサＣ_i(j-1)に格納されていた信号電荷をリセットするリセット・トランジスタとして機能する。したがって、図１１及び図１３では分離トランジスタＱ_i(j-1)3及びＱ_ij3としてｎＭＯＳトランジスタのシンボルマークが用いられているが、分離トランジスタＱ_i(j-1)3及びＱ_ij3としては、第２のｎＭＯＳトランジスタＱ_i(j-1)2及びＱ_ij2と相補的に動作するｐＭＯＳトランジスタでもよい。即ち、第２のｎＭＯＳトランジスタＱ_i(j-1)2及びＱ_ij2がコンデンサＣ_i(j-1)及びＣ_ijに格納されていた信号電荷を放電する導通状態のときに、分離トランジスタＱ_i(j-1)3及びＱ_ij3は、メモリユニット間を分離するようにオフになる。第２のｎＭＯＳトランジスタＱ_i(j-1)2及びＱ_ij2がオフすると、分離トランジスタＱ_i(j-1)3及びＱ_ij3は、信号電荷をメモリユニット間に転送するように導通状態になる。

或いは、図１１及び図１３で示すトランジスタ記号のように、分離トランジスタＱ_i(j-1)3及びＱ_ij3がｎＭＯＳトランジスタの場合は、ゲート回路とゲート構造に依拠して大きな浮遊容量と大きな浮遊抵抗が付随した第２のｎＭＯＳトランジスタＱ_i(j-1)2及びＱ_ij2よりも、立ち上がり時間が短く、導通時間も短く、立ち下がり時間も短い高速トランジスタを分離トランジスタＱ_i(j-1)3及びＱ_ij3として採用することができる。この場合は、第２のｎＭＯＳトランジスタＱ_i(j-1)2及びＱ_ij2が依然としてオフ状態にあるときに、分離トランジスタＱ_i(j-1)3及びＱ_ij3が瞬時に導通状態になり、メモリユニット間に信号電荷が転送される。一方、第２のｎＭＯＳトランジスタＱ_i(j-1)2及びＱ_ij2がコンデンサＣ_i(j-1)及びＣ_ijに格納されていた信号電荷を放電するように、導通状態にゆっくり向かう間に、分離トランジスタＱ_i(j-1)3及びＱ_ij3は瞬時にオフして、メモリユニット間が分離される。このような高速トランジスタの候補として、ノーマリ・オフ型ＭＯＳ静電誘導トランジスタ（ＳＩＴ）を使用できる。ＭＯＳＳＩＴは３極真空管のようなＩ−Ｖ特性を呈する。ｎチャネルＭＯＳＳＩＴは、短チャネルｎＭＯＳＦＥＴの極限構造と考えることができる。３極真空管型Ｉ−Ｖ特性のために、ＭＯＳＳＩＴのオン状態は第１と第２主電極間におけるゲート電圧と電位差の両方に依存するので、非常に短いオン状態を実現できる。ＭＯＳＳＩＴの代わりに、ディラックのデルタ関数のような非常に短いオン状態が達成できるトンネルＳＩＴのような任意のノーマリ・オフ型スイッチング素子を使用できる。

図１４（ａ）は、図１３に示すビットレベル・セルＭ_i(j-1)の過渡応答のタイミング図を示す。そして、図１４（ｂ）は、図１３に示したビットレベル・セルＭ_i(j-1)の次段のビットレベル・セルＭ_ijについての、次のクロック信号波形に対する応答を示すタイミング図である。図１４（ａ）と（ｂ）において、クロック信号は、クロック周期τ_clockにより“１”と“０”の論理レベル間を定期的に振動すると想定している。左上がりの斜線でハッチングされた矩形領域は、それぞれ、コンデンサＣ_i(j-1)及びＣ_ijに格納されていた信号電荷のリセット・タイミングの時間領域を示す。更に、右上がりの斜線でハッチングされた矩形領域は、それぞれ、コンデンサＣ_i(j-1)及びＣ_ijに対する信号電荷のチャージ転送タイミングの時間領域を示す。

即ち、図１４（ａ）に示すように、コンデンサＣ_i(j-1)に格納されていた信号電荷が“１”の論理レベルのとき、第１のｎＭＯＳトランジスタＱ_i(j-1)1は依然としてオフしているが、コンデンサＣ_i(j-1)に格納されていた信号電荷は、左上がりの斜線でハッチングされた矩形領域の時間で、放電するように駆動される。コンデンサＣ_i(j-1)が放電を始めた後、右上がりの斜線でハッチングされた矩形領域の時間では、第１のｎＭＯＳトランジスタＱ_i(j-1)1は、Ｒ−Ｃ遅延回路により第１遅延素子Ｄ_i(j-1)1から決まる所定の遅延時間ｔ_ｄ１だけ遅れて転送トランジスタとして作動する。そして、前段のビットレベル・セルＭ_i(j-2)に格納されていた信号が第１のｎＭＯＳトランジスタＱ_i(j-1)1のゲート電極にユニット間セルＢ_i(j-1)を介して送られると、第１のｎＭＯＳトランジスタＱ_i(j-1)1は、前段のビットレベル・セルＭ_i(j-2)に格納されていた信号を、右上がりの斜線でハッチングされた矩形領域の時間に示すように、第２遅延素子Ｄ_i(j-1)2から決まる所定の遅延時間ｔ_d2だけ更に遅れてコンデンサＣ_i(j-1)に向けて転送する。

同様に、図１４（ｂ）に示すように、コンデンサに格納されていた信号電荷が“１”の論理レベルのとき、第１のｎＭＯＳトランジスタＱ_ij1は依然としてオフ状態であるが、コンデンサＣ_ijに格納されていた信号電荷は、左上がりの斜線でハッチングされた矩形領域の時間で、放電するように駆動される。コンデンサＣ_ijが放電を始めた後、右上がりの斜線でハッチングされた矩形領域の時間で示すように、第１のｎＭＯＳトランジスタＱ_ij1は、Ｒ−Ｃ遅延回路により第１遅延素子Ｄ_ij1から決まる所定の遅延時間_ij1だけ遅れて、転送トランジスタとして作動する。そして、前段のビットレベル・セルＭ_i(j-1)に格納されていた信号が第１のｎＭＯＳトランジスタＱ_ij1のゲート電極にユニット間セルＢ_ijを介して送られると、第１のｎＭＯＳトランジスタＱ_ij1は、前段のビットレベル・セルＭ_i(j-1)に格納されていた信号を、右上がりの斜線でハッチングされた矩形領域の時間において、第２遅延素子Ｄ_ij2から決まる所定の遅延時間ｔ_d2だけ更に遅れてコンデンサＣ_ijに向けて転送する。

図１５は、細い実線で示すクロック信号波形に対する、本発明の第１の実施形態に係る計算機システムに用いるビットレベル・セルの一つである図１３に示すビットレベル・セルＭ_i(j-1)の更に詳細な過渡応答を示す。ここで、図１３に示すビットレベル・セルＭ_i(j-1)の第１遅延素子Ｄ_i(j-1)1と第２遅延素子Ｄ_i(j-1)2の両方は、図１２に示すようなＲ−Ｃ遅延回路からなる。細い実線で示すクロック信号は、クロック周期τ_clockにより“１”と“０”の論理レベルの間を定期的に振動する。図１５で、時間間隔 τ_１＝τ_２＝τ_２＝τ_４は、クロック周期τ_clockの１／４に定められている（＝τ_clock／４）。

マーチングメモリの正規の動作において、コンデンサＣ_i(j-1)に格納されていた信号電荷は、図１６（ａ）〜（ｄ）に示すように、“０”又は“１”の論理レベルのいずれかに実際になる。コンデンサＣ_i(j-1)に格納されていた信号電荷が“１”の論理レベルのとき、図１６（ｃ）と（ｄ）に示すように、第１のｎＭＯＳトランジスタＱ_i(j-1)1は依然としてオフ状態であっても、コンデンサＣ_i(j-1)は時間間隔τ_１の開始時に放電を開始できる。何故ならば、第２のｎＭＯＳトランジスタＱ_i(j-1)2は近似的に遅延のない理想的な動作を行うことが想定されており、この想定のもとで、ハイレベルのクロック信号が第２のｎＭＯＳトランジスタＱ_i(j-1)2のゲート電極に印加されると、直ちに導通状態になるからである。したがって、コンデンサＣ_i(j-1)に格納されていた信号電荷が実際に“１”の論理レベルのとき、ハイレベルのクロック信号が、図１５の細い実線で示すように、第２のｎＭＯＳトランジスタＱ_i(j-1)2のゲート電極に印加されると、コンデンサＣ_i(j-1)に格納されていた信号電荷が放電し、その後、第１のｎＭＯＳトランジスタＱ_i(j-1)1が、Ｒ−Ｃ遅延回路により第１遅延素子Ｄ_i(j-1)1から決まる所定の遅延時間ｔ_ｄ１だけ遅れて導通状態となり、転送トランジスタとして作動する。図１５は、第１のｎＭＯＳトランジスタＱ_i(j-1)1のドレイン電極の電位の変化を一点鎖線で示す。

そして、図１５の細い実線で示すように、前段のビットレベル・セルＭ_i(j-2)に格納された“１”の信号レベルが、ｉ行の前段のビットレベル・セルＭ_i(j-2)からユニット間セルＢ_i(j-1)を介して第１のｎＭＯＳトランジスタＱ_i(j-1)1のゲート電極に送られたとする。“１”の信号レベルがゲート電極に送られると、第１のｎＭＯＳトランジスタＱ_i(j-1)1は、前段のビットレベル・セルＭ_i(j-2)に格納されていた“１”の信号レベルをコンデンサＣ_i(j-1)に、第２遅延素子Ｄ_i(j-1)2から決まる所定の遅延時間ｔ_d2だけ更に遅れて転送する。或いは、図１５の破線で示すように、前段のビットレベル・セルＭ_i(j-2)に格納されていた“０”の信号レベルが、前段のビットレベル・セルＭ_i(j-2)から第１のｎＭＯＳトランジスタＱ_i(j-1)1のゲート電極に送られたとする。“０”の信号レベルがゲート電極に送られると、第１のｎＭＯＳトランジスタＱ_i(j-1)1は、前段のビットレベル・セルＭ_i(j-2)に格納されていた“０”の信号レベルをコンデンサＣ_i(j-1)に、所定の遅延時間ｔ_d2だけ更に遅れて転送する。第１のｎＭＯＳトランジスタＱ_i(j-1)1のソース電極と第２のｎＭＯＳトランジスタＱ_i(j-1)2のドレイン電極とを接続する出力ノードＮ_outは、ビットレベル・セルＭ_i(j-1)の出力端子として機能する。出力端子は、コンデンサＣ_i(j-1)に格納されていた信号をｉ行の次段のビットレベル・セルに出力する。

図１５の細い実線で示すように、クロック信号が“１”の論理レベルになると、第２のｎＭＯＳトランジスタＱ_i(j-1)2は、前段のクロックサイクルで既にコンデンサＣ_i(j-1)に格納されていた信号電荷の放電を始める。そして、“１”の論理レベルのクロック信号が印加され、コンデンサＣ_i(j-1)に格納されていた信号電荷が“０”の論理レベルの電位に完全に放電した後、第１のｎＭＯＳトランジスタＱ_i(j-1)1は、第１遅延素子Ｄ_i(j-1)1から決まる所定の遅延時間ｔ_ｄ１だけ遅れて、転送トランジスタとして作動する。遅延時間ｔ_ｄ１は、好ましくは(１／４)τ_clock＝τ_１に等しく設定できる。

その後、前段のビットレベル・セルＭ_i(j-2)に格納されていた信号が、前段のビットレベル・セルＭ_i(j-2)から第１のｎＭＯＳトランジスタＱ_i(j-1)1のゲート電極にユニット間セルＢ_i(j-1)を介して送られると、細い実線と破線で示すように、第１のｎＭＯＳトランジスタＱ_i(j-1)1は、前段のビットレベル・セルＭ_i(j-2)に格納されていた信号をコンデンサＣ_i(j-1)に、Ｒ−Ｃ遅延回路により第２遅延素子Ｄ_i(j-1)2から決まる所定の遅延時間ｔ_d2だけ更に遅れて転送する。

例えば、前段のビットレベル・セルＭ_i(j-2)に格納されていた“１”の論理レベルが、細い実線で示すように第１のｎＭＯＳトランジスタＱ_i(j-1)1のゲート電極に前段のビットレベル・セルＭ_i(j-2)から送られると、第１のｎＭＯＳトランジスタＱ_i(j-1)1は、時間間隔τ_２の開始時に導通状態になり、“１”の論理レベルがコンデンサＣ_i(j-1)に格納される。一方で、前段のビットレベル・セルＭ_i(j-2)に格納されていた“０”の論理レベルが、破線で示すように第１のｎＭＯＳトランジスタＱ_i(j-1)のゲート電極に前段のビットレベル・セルＭ_i(j-2)から送られると、第１のｎＭＯＳトランジスタＱ_i(j-1)1はオフ状態を維持し、“０”の論理レベルがコンデンサＣ_i(j-1)に格納される。したがって、ビットレベル・セルＭ_i(j-1)は、“マーチングＡＮＤゲート”動作を実現できる。遅延時間ｔ_d2が遅延時間ｔ_ｄ１より長いとすると、遅延時間ｔ_d2は、好ましくは(１／２)τ_clockと等しく設定できる。

クロック信号が、細い実線で示すようにクロック周期τ_clockにより、“１”と“０”の論理レベルの間を定期的に振動すると、クロック信号は、時刻が(１／２)τ_clockを過ぎると又は時間間隔τ_２の開始時に、“０”の論理レベルになるので、第１のｎＭＯＳトランジスタＱ_i(j-1)1のドレイン電極の電位は、一点鎖線で示すように減衰を始める。現在のビットレベル・セルＭ_i(j-1)と次段のビットレベル・セルＭ_ijの間に挿入したユニット間セルＢ_ijがｎＭＯＳトランジスタからなる場合、現在のビットレベル・セルＭ_i(j-1)の出力端子と次段のビットレベル・セルＭ_ijの第１のｎＭＯＳトランジスタＱ_ij1のゲート電極との間の電気経路は、ｎＭＯＳトランジスタのゲート電極に印加されているクロック信号の“０”の論理レベルによりオフする。したがって、第１のｎＭＯＳトランジスタＱ_i(j-1)1のソース電極と第２のｎＭＯＳトランジスタＱ_i(j-1)2のドレイン電極とを接続する出力ノードＮ_outから、時間間隔τ_２及び時間間隔τ_４において、前段のビットレベル・セルＭ_i(j-2)から転送された信号を更に次段のビットレベル・セルＭ_ijに将棋倒しのようになぎ倒して送ることが阻止されるので、信号が次の第１のｎＭＯＳトランジスタＱ_ij1のゲート電極にドミノ転送されることが阻止される。第１のｎＭＯＳトランジスタＱ_i(j-1)1が時間間隔τ_２及び時間間隔τ_４でターン・オフするので、出力ノードＮ_outの電位は浮遊状態で維持され、コンデンサＣ_i(j-1)に格納されていた信号状態も維持される。

クロック信号が再び“１”の論理レベルになると、図１５に次段の列として示した枠内に、細い実線で示すように、第１のｎＭＯＳトランジスタＱ_i(j-1)1のソース電極と第２のｎＭＯＳトランジスタＱ_i(j-1)2のドレイン電極とを接続し、ビットレベル・セルＭ_i(j-1)の出力端子としても機能する出力ノードＮ_outは、コンデンサＣ_i(j-1)に格納されていた信号を次段のビットレベル・セルＭ_ijに、次のクロックサイクルで送ることができる。何故ならば、ユニット間セルＢ_ijが導通状態になり、第１のｎＭＯＳトランジスタＱ_i(j-1)1のドレイン電極の電位が、一点鎖線に示すように上昇するからである。

図１６（ａ）〜（ｄ）は、信号転送動作の４つのモードを、それぞれ、図１１及び図１３に示したビットレベル・セルＭ_ijに着目して説明する。ビットレベル・セルＭ_ijは、ｊ番目のメモリユニットＵ_ｊに連続して配列されているビットレベル・セルの中の一つである。ｊ番目のメモリユニットＵ_ｊは、ｊ番目のメモリユニットＵ_ｊに連続して１次元に配列されたビットレベル・セルにより、バイト・サイズ又はワード・サイズの情報を格納している。本発明の第１の実施形態に係る計算機システムにおいて、連続して１次元配列されたバイト・サイズ又はワード・サイズの情報は、前段のメモリユニットから次段のメモリユニットに、同じ歩調で隊列を整えて並んで行進する。クロック信号供給線ＣＬＯＣＫが電源線として機能しながら、クロック信号がクロック信号供給線ＣＬＯＣＫから供給される。図１６（ａ）〜（ｄ）で、クロック周期τ_clockによりクロック信号は“１”と“０”の論理レベルの論理レベル間を定期的に振動するように、クロック信号供給線ＣＬＯＣＫから供給される。

図１６（ａ）と（ｂ）は、“０”の論理レベルがコンデンサＣ_ijに前段のクロック信号によって格納される場合を示し、図１６（ｃ）と（ｄ）は、“１”の論理レベルがバイト・サイズ又はワード・サイズの１次元配列された一連の情報に含まれる信号の一つとしてコンデンサＣ_ijに前段のクロック信号によって格納される場合を示す。図１６（ａ）に示すように、コンデンサＣ_ijに既に格納されていた信号電荷が“０”の論理レベルのときに、隊列を整えて互いに連携して行進して転送されるバイト・サイズ又はワード・サイズの１次元配列された一連の情報に含まれる信号の一つとして、前段のビットレベル・セルＭ_i(j-1)に格納された“０”の論理レベルの信号が、前段のビットレベル・セルＭ_i(j-1)からユニット間セルＢ_ij（図示せず）を介して第１のｎＭＯＳトランジスタＱ_ij1のゲート電極に、コンデンサＣ_ijが格納する信号電荷が“０”の論理レベルを維持しているタイミングで送られると、第１のｎＭＯＳトランジスタＱ_ij1がオフしているので、第１のｎＭＯＳトランジスタＱ_ij1のソース電極と第２のｎＭＯＳトランジスタＱ_ij2のドレイン電極とを接続する出力ノードＮ_outは、クロック信号が呈する“１”の入力信号により０＋１＝１のマーチングＡＮＤゲートの動作を実行するように、ｉ行の次段のビットレベル・セルに、コンデンサＣ_ijに維持されている、“０”の信号レベルを送る。

同様に、図１６（ｂ）に示すように、コンデンサＣ_ijに既に格納されていた信号電荷が“０”の論理レベルのときに、前段のビットレベル・セルＭ_i(j-1)に格納されていた“１”の論理レベルの信号が、前段のビットレベル・セルＭ_i(j-1)からユニット間セルＢ_ijを介して第１のｎＭＯＳトランジスタＱ_ij1のゲート電極に、コンデンサＣ_ijに格納されていた信号電荷が“０”の論理レベルを維持しているタイミングで送られるとする。“１”の論理レベルの信号が送られると、第１のｎＭＯＳトランジスタＱ_ij1は、前段のビットレベル・セルＭ_i(j-1)に格納されていた“１”の論理レベルの信号をコンデンサＣ_ijに転送するようにタターンオン動作を開始し、“１”の論理レベルがコンデンサＣ_ijに格納できる。“１”の論理レベルがコンデンサＣ_ijに格納されると、出力ノードＮ_outは、クロック信号が呈する“１”の入力信号によりマーチングＡＮＤゲートの動作１＋１＝１を実行するように、ｉ行の次段のビットレベル・セルに、コンデンサＣ_ijに格納されていた“１”の信号レベルを送る。

逆に、図１６（ｃ）に示すように、コンデンサＣ_ijに既に格納されていた信号電荷が“１”の論理レベルのときに、前段のビットレベル・セルＭ_i(j-1)に格納された“０”の論理レベルの信号が、前段のビットレベル・セルＭ_i(j-1)からユニット間セルＢ_ijを介して第１のｎＭＯＳトランジスタＱ_ijのゲート電極に送られたとする。“０”の論理レベルの信号がゲート電極に送られると、コンデンサＣ_ijに格納されていた信号電荷が完全に放電して“０”の論理レベルになるタイミングの後に、第１のｎＭＯＳトランジスタＱ_ij1がターン・オフするので、出力ノードＮ_outは、クロック信号が呈する“１”の入力信号により０＋１＝０のマーチングＡＮＤゲートの動作を実行して、ｉ行の次段のビットレベル・セルに、コンデンサＣ_ijに格納されていた“０”の信号レベルを出力する。

同様に、図１６（ｄ）に示すように、コンデンサＣ_ijに既に格納されていた信号電荷が“１”の論理レベルのときに、前段のビットレベル・セルＭ_i(j-1)に格納されていた“１”の論理レベルの信号が、前段のビットレベル・セルＭ_i(j-1)からユニット間セルＢ_ijを介して第１のｎＭＯＳトランジスタＱ_ij1のゲート電極に送られたとする。“１”の論理レベルの信号がゲート電極に送られると、コンデンサＣ_ijに格納されていた信号電荷が完全に放電して“０”の論理レベルとなるタイミングの後、第１のｎＭＯＳトランジスタＱ_ij1は、コンデンサＣ_ijに前段のビットレベル・セルＭ_i(j-1)に格納されていた“１”の論理レベルの信号が転送されてターン・オン動作を始めるので、“１”の論理レベルがコンデンサＣ_ijに格納し、クロック信号が呈する“１”の入力信号によりマーチングＡＮＤゲートの動作１＋１＝１を実行する。そして、出力ノードＮ_outは、ｉ行の次段のビットレベル・セルに、コンデンサＣ_ijに格納されていた“１”の信号レベルを出力する。

図１１の構成と同様に、図１７に示す構成でも、ユニット間セルＢ_ijが（ｊ−１）番目のビットレベル・セルＭ_i(j-1)とｊ番目のビットレベル・セルＭ_ijの間に挿入されている。、ｊ番目のビットレベル・セルＭ_ijは、第１遅延素子Ｄ_ij1を介してクロック信号供給線に接続するドレイン電極及び第２遅延素子Ｄ_ij2を介してユニット間セルＢ_ijに接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ_ij1と、第１のｎＭＯＳトランジスタＱ_ij1のソース電極に接続するドレイン電極、クロック信号供給線に接続するゲート電極及び接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_ij2と、第２のｎＭＯＳトランジスタＱ_ij2に並列接続され、ビットレベル・セルＭ_ijの情報を格納するコンデンサＣ_ijとを含んでいる。しかしながら、第１遅延素子Ｄ_ij1は第１のダイオードＤ_１ａからなり、第２遅延素子Ｄ_ij2は第２のダイオードＤ_２ａと第３のダイオードＤ_３ａの直列接続からなるという特徴は、図１１に示す構成とは区別できる。

任意のｐ-ｎ接合ダイオードは、拡散抵抗、リード線抵抗、オーム性接触抵抗や広がり抵抗などを含めた直列抵抗を含む抵抗体と、接合容量又は拡散容量のようなダイオード容量を含めた容量とを含む等価回路で表現できる。そして、単一のダイオード又はダイオードの直列接続が、「抵抗−容量性遅延」又は「Ｒ−Ｃ遅延」として機能できる。何故ならば、「Ｒ−Ｃ遅延」の値が、図９及び図１２に示す第１メアンダライン９１と第２メアンダライン９７のような特化した専用のＲ−Ｃ素子が達成する値よりも遙かに小さくできるので、ユニット間セルＢ_ijに接続された、図１７に示すｊ番目のビットレベル・セルＭ_ijの動作は、図１２に示す構成の動作より好ましい動作を達成できる。即ち、ユニット間セルＢ_ijに接続されて図１７に示されたｊ番目のビットレベル・セルＭ_ijの動作は、立ち上がり時間と立ち下がり時間の図示が省略されてはいるが、理想的な方形で表現可能なパルスの波形が実現できるので、図７Ａ及び図７Ｂに示す理想的な遅延特性に近づくことができる。図１１及び図１２に示す構成による特性に加えて、第２のダイオードＤ_２ａと第３のダイオードＤ_３ａの直列接続が逆方向の電流の流れを効率的に阻止できるので、図１７に示すユニット間セルＢ_ijとｊ番目のビットレベル・セルＭ_ijの組み合わせからなる構成は、前段のビットレベル・セルＭ_i(j-1)に格納されていた“０”の信号、即ち低い論理レベルの信号がユニット間セルＢ_ijを介して第１のｎＭＯＳトランジスタＱ_ij1のゲート電極に送られる場合であっても、ｊ番目のビットレベル・セルＭ_i(j-1)の信号格納状態とｊ番目のビットレベル・セルＭ_ijの信号格納状態の間の分離が良好に達成できる。

図１７に示す構成に加えて、図１８では新たなユニット間セルＢ_i(j-1)が、（ｊ−２）番目のビットレベル・セルＭ_i(j-2)と（ｊ−１）番目のビットレベル・セルＭ_i(j-1)との間に設けられている。ユニット間セルＢ_i(j-1)は、（ｊ−１）番目のメモリユニットＵ_j-1の（ｊ−１）番目のビットレベル・セルＭ_i(j-1)の信号格納状態を、（ｊ−２）番目のメモリユニットＵ_ｊ−２の（ｊ−２）番目のビットレベル・セルＭ_i(j-2)の信号格納状態から分離し、クロック信号供給線から供給されるクロック信号が決める所定のタイミングで、（ｊ−２）番目のビットレベル・セルＭ_i(j-2)から（ｊ−１）番目のビットレベル・セルＭ_i(j-1)に、信号を転送するために設けられている。図１８で、（ｊ−１）番目のビットレベル・セルＭ_i(j-1)の入力端子がユニット間セルＢ_i(j-1)に接続しているので、（ｊ−２）番目のビットレベル・セルＭ_i(j-2)に格納されていた信号電荷は、必要なタイミングでユニット間セルＢ_i(j-1)を介して第２遅延素子Ｄ_i(j-1)2に送られる。その後、信号電荷の転送はオフする。

ｊ番目のビットレベル・セルＭ_ijの構成と同様に、（ｊ−１）番目のビットレベル・セルＭ_i(j-1)は、（ｊ−１）番目のビットレベル・セルＭ_i(j-1)は、第１遅延素子Ｄ_i(j-1)1を介してクロック信号供給線に接続するドレイン電極及び第２遅延素子Ｄ_i(j-1)2を介してユニット間セルＢ_i(j-1)に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ_i(j-1)1と、第１のｎＭＯＳトランジスタＱ_i(j-1)1のソース電極に接続するドレイン電極、クロック信号供給線に接続するゲート電極、及び接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_i(j-1)2と、第２のｎＭＯＳトランジスタＱ_i(j-1)2に並列接続され、ビットレベル・セルＭ_i(j-1)の情報を格納するコンデンサＣ_i(j-1)とを含んでいる。第１遅延素子Ｄ_i(j-1)1は第１のダイオードＤ１ｂで構成され、第２遅延素子Ｄ_i(j-1)2は第２のダイオードＤ_２ｂと第３のダイオードＤ_３ｂの直列接続で構成されている。

前述のように、単一のダイオード又はダイオードの直列接続は「抵抗−容量性遅延」又は「Ｒ−Ｃ遅延」として機能できるので、図１８に示すユニット間セルＢ_{ｉ（ｉ−１）}による（ｊ−１）番目のビットレベル・セルＭ_{ｉ（ｉ−１）}の動作は、図１３に示す構成の動作とほぼ同じである。図１３に示す構成による特性に加えて、第２のダイオードＤ_２ｂと第３のダイオードＤ_３ｂの直列接続は逆方向の電流の流れを効率的に阻止できるので、図１８に示すユニット間セルＢ_{ｉ（ｉ−１）}による（ｊ−１）番目のビットレベル・セルＭ_{ｉ（ｉ−１）}の組み合わせからなる構成は、前段のビットレベル・セルＭ_i(j-2)に格納されていた“０”の信号、即ち低い論理レベルの信号がユニット間セルＢ_{ｉ（ｉ−１）}を介して第１のｎＭＯＳトランジスタＱ_{ｉ（ｉ−１）}のゲート電極に送られても、（ｊ−２）番目のビットレベル・セルＭ_{ｉ（ｉ−２）}の信号格納状態と（ｊ−１）番目のビットレベル・セルＭ_{ｉ（ｉ−１）}の信号格納状態との間を良好に分離できる。

実際の半導体装置では、配線、ゲート構造、電極構造や接合構造に付随して多くの寄生抵抗（浮遊抵抗）と多くの寄生容量（浮遊容量）が内在している。よって、マーチング主記憶装置の超高速動作では、寄生抵抗と寄生容量だけでマーチング主記憶装置の動作速度に比し必要な遅延時間ｔ_ｄ１とｔ_d2を達成できるならば、外付けの抵抗素子や容量素子は、省略できる。したがって、図１１〜図１３及び図１６に示す構成の場合、第１遅延素子Ｄ_i(j-1)1及びＤ_ij1は、図１９、図２０及び図２２に示すように省略できる。

図１９には、本発明の第１の実施形態に係る計算機システムで用いるビットレベル・セルの他の一例としてｊ番目のビットレベル・セルＭ_ijを示す。ｊ番目のビットレベル・セルＭ_ijは、図１１に示した構成と同様に、第１のｎＭＯＳトランジスタＱ_ij1を有しているが、第１のｎＭＯＳトランジスタＱ_ij1は、クロック信号供給線に直接接続したドレイン電極を有している。図１１に示す構成で採用している第１遅延素子Ｄ_ij1は省略している。第１のｎＭＯＳトランジスタＱ_ij1が、図１１に示す第２遅延素子Ｄ_ij2に対応する信号遅延素子Ｄ_ijを介してユニット間セルＢ_ij1に接続するゲート電極を有し、第２のｎＭＯＳトランジスタＱ_ij2が、第１のｎＭＯＳトランジスタＱ_ij1のソース電極に接続するドレイン電極と、クロック信号供給線に接続するゲート電極と、接地電位に接続するソース電極と、第２のｎＭＯＳトランジスタＱ_ij2に並列接続され、ビットレベル・セルＭ_ijの情報を格納するコンデンサＣ_ijを有するという特徴は、図１１に示した構成とほぼ同じである。

図１９に示す第１の実施形態に係るビットレベル・セルの他の例では、図１１〜図１３及び図１６に示した構成と同様に、ユニット間セルＢ_ijは、ｊ番目のメモリユニットＵ_ｊのｊ番目のビットレベル・セルＭ_ijの信号格納状態を、（ｊ−１）番目のメモリユニットＵ_j-1の（ｊ−１）番目のビットレベル・セルＭ_i,j-1の信号格納状態から分離するように更に設けられている。更に、ユニット間セルＢ_ijは、信号を（ｊ−１）番目のビットレベル・セルＭ_i,j-1からｊ番目のビットレベル・セルＭ_ijに、クロック信号供給線から供給されるクロック信号が決める所定のタイミングで転送する。ｊ番目のメモリユニットＵ_ｊはｊ番目のメモリユニットＵ_ｊに１次元配列されたビットレベル・セルにそれぞれバイト・サイズ又はワード・サイズの情報を格納し、（ｊ−１）番目のメモリユニットＵ_j-1は（ｊ−１）番目のメモリユニットＵ_j-1に１次元配列されたビットレベル・セルにそれぞれバイト・サイズ又はワード・サイズの情報を格納するので、メモリユニットＵ_j-1及びメモリユニットＵ_ｊと平行に配列されたユニット間セルの１次元配列は、クロック信号供給線が供給するクロック信号による制御のもとでバイト・サイズ又はワード・サイズの情報を転送するので、バイト・サイズ又はワード・サイズの情報は、同じ歩調で所定の方向に沿って隊列を整えて並んで行進する。

図１９に示すように、ｉ行のｊ番目のビットレベル・セルＭ_ijの入力端子はユニット間セルＢ_ijに接続しているので、（ｊ−１）番目のビットレベル・セルＭ_i,j-1に格納されていた信号電荷は、必要なタイミングでユニット間セルＢ_ijを介して信号遅延素子Ｄ_ijに送られ、信号電荷の転送動作は必要なタイミング以外の期間でオフしている。

図２０では、図１９に示した構成に加えて、他のユニット間セルＢ_i(j-1)が、（ｊ−２）番目のビットレベル・セルＭ_i(j-2)と（ｊ−１）番目のビットレベル・セルＭ_i(j-1)との間に設けられ、（ｊ−１）番目のメモリユニットＵ_j-1の（ｊ−１）番目のビットレベル・セルＭ_i(j-1)の信号格納状態を、（ｊ−２）番目のメモリユニットＵ_ｊ−２の（ｊ−２）番目のビットレベル・セルＭ_i(j-2)の信号格納状態から分離して、（ｊ−２）番目のビットレベル・セルＭ_i(j-2)から（ｊ−１）番目のビットレベル・セルＭ_i(j-1)に、クロック信号供給線から供給されるクロック信号が決める所定のタイミングで信号を転送するように構成している。図２０で、ｉ行の（ｊ−１）番目のビットレベル・セルＭ_i(j-1)の入力端子がユニット間セルＢ_i(j-1)に接続しているので、ビットレベル・セルＭ_i(j-2)に格納されていた信号電荷は、必要なタイミングでユニット間セルＢ_i(j-1)を介して信号遅延素子Ｄ_i(j-1)に送られる。その後、信号電荷の転送動作はオフする。

ｊ番目のビットレベル・セルＭ_ijの構成と同様に、（ｊ−１）番目のビットレベル・セルＭ_i(j-1)は、クロック信号供給線に直接接続したドレイン電極及び信号遅延素子Ｄ_i(j-1)1を介してユニット間セルＢ_i(j-1)に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ_i(j-1)1と、第１のｎＭＯＳトランジスタＱ_i(j-1)1のソース電極に接続するドレイン電極、クロック信号供給線に接続するゲート電極、及び接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_i(j-1)2と、第２のｎＭＯＳトランジスタＱ_i(j-1)2に並列接続され、ビットレベル・セルＭ_i(j-1)の情報を格納するコンデンサＣ_i(j-1)と、を含んでいる。

この回路構成において、図１９及び図２０に示す第１の実施形態に係るビットレベル・セルの他の例の一つとして、ビットレベル・セルＭ_ijの第２のｎＭＯＳトランジスタＱ_ij2は、ハイレベル（又は“１”の論理レベル）のクロック信号が第２のｎＭＯＳトランジスタＱ_ij2のゲート電極に印加されて、コンデンサＣ_ijに既に格納されていた信号電荷が放電すると、コンデンサＣ_ijに格納されていた信号電荷をリセットするリセット・トランジスタとして機能する。又、ビットレベル・セルＭ_i(j-1)の第２のｎＭＯＳトランジスタＱ_i(j-1)2は、ハイレベル（又は“１”の論理レベル）のクロック信号が第２のｎＭＯＳトランジスタＱ_i(j-1)2のゲート電極に印加されて、コンデンサＣ_i(j-1)に既に格納されていた信号電荷が放電すると、コンデンサＣ_i(j-1)に格納されていた信号電荷をリセットするリセット・トランジスタとして機能する。

図１９及び図２０において、分離トランジスタＱ_i(j-1)3及びＱ_ij3は、ゲート回路とゲート構造のために大きな浮遊容量と大きな浮遊抵抗をもった第２のｎＭＯＳトランジスタＱ_i(j-1)2及びＱ_ij2よりも、立ち上がり時間が短く、導通状態の時間も短く、立ち下がり時間も短い高速トランジスタである。したがって、第２のｎＭＯＳトランジスタＱ_i(j-1)2及びＱ_ij2が依然としてオフ状態のときに、分離トランジスタＱ_i(j-1)3及びＱ_ij3は瞬時に導通状態になり、メモリユニット間で信号電荷の転送をする。又、第２のｎＭＯＳトランジスタＱ_i(j-1)2及びＱ_ij2がコンデンサＣ_i(j-1)及びＣ_ijに格納されていた信号電荷を放電する導通状態にゆっくり向かうときに、分離トランジスタＱ_i(j-1)3及びＱ_ij3は、瞬時にターン・オフしてメモリユニット間を分離する。

図２１は、本発明の第１の実施形態に係る計算機システムで用いるビットレベル・セルの他の例の一つである、図２０に示したビットレベル・セルＭ_i(j-1)の、細い実線で示すクロック信号波形に対する詳細な過渡応答を、信号遅延素子Ｄ_i(j-1)2がＲ−Ｃ遅延回路からなる場合に対して示す。細い実線で示すクロック信号は、クロック周期τ_clockにより“１”と“０”の論理レベルの間を定期的に振動している。図２１で、時間間隔τ_１＝τ_２＝τ_２＝τ４は、クロック周期τ_clock（＝τ_clock／４）の１／４に定められている。

マーチングメモリの正規な動作では、コンデンサＣ_i(j-1)に格納されていた信号電荷は、図２２（ａ）〜（ｄ）に示すように、“０”又は“１”の論理レベルのいずれかに実際になる。コンデンサＣ_i(j-1)に格納されていた信号電荷が“１”の論理レベルの場合、図２２（ｃ）と（ｄ）に示すように、第１のｎＭＯＳトランジスタＱ_i(j-1)1は依然としてオフ状態である。何故ならば、第１のｎＭＯＳトランジスタＱ_i(j-1)1のゲート電極の電位は信号遅延素子Ｄ_i(j-1)1のために遅れるので、コンデンサＣ_i(j-1)は、時間間隔τ_１の開始時に放電を開始できる。何故ならば、第２のｎＭＯＳトランジスタＱ_i(j-1)2は、ハイレベルのクロック信号は、第２のｎＭＯＳトランジスタＱ_i(j-1)2に遅延が実質的にないという理想的な条件下では、第２のｎＭＯＳトランジスタＱ_i(j-1)2のゲート電極に印加されるときに瞬時に導通状態になるからである。したがって、コンデンサＣ_i(j-1)に格納されていた信号電荷が実際に“１”の論理レベルならば、ハイレベルのクロック信号が図２１の細い実線で示すように、第２のｎＭＯＳトランジスタＱ_i(j-1)2のゲート電極に印加された後、コンデンサＣ_i(j-1)に格納されていた信号電荷は、“０”の論理レベルに放電する。ほぼ同時に、第１のｎＭＯＳトランジスタＱ_i(j-1)1は、浮遊抵抗と浮遊容量とからなる寄生素子から決まる実質的に無視できる短い遅延時間だけ遅れて、転送トランジスタとして作動する。図２１では、第１のｎＭＯＳトランジスタＱ_i(j-1)1のドレイン電極の電位の変化を一点鎖線で強調して描いている。

そして、図２１の太い実線で示すように、前段のビットレベル・セルＭ_i(j-2)に格納されていた“１”の信号レベルが、前段のビットレベル・セルＭ_i(j-2)からユニット間セルＢ_i(j-1)を介して第１のｎＭＯＳトランジスタＱ_i(j-1)1のゲート電極に送られたとする。“１”の信号レベルがゲート電極に送られると、第１のｎＭＯＳトランジスタＱ_i(j-1)1がオンして、第１のｎＭＯＳトランジスタＱ_i(j-1)1が、前段のビットレベル・セルＭ_i(j-2)に格納されていた“１”の信号レベルをコンデンサＣ_i(j-1)に、信号遅延素子Ｄ_i(j-1)から決まる所定の遅延時間ｔ_d2だけ遅れて転送する。或いは、図２１で破線で示すように、前段のビットレベル・セルＭ_i(j-2)に格納されていた“０”の信号レベルが、前段のビットレベル・セルＭ_i(j-2)から第１のｎＭＯＳトランジスタＱ_i(j-1)1のゲート電極に送られたとする。“０”の信号レベルがゲート電極に送られると、第１のｎＭＯＳトランジスタＱ_i(j-1)1はオフ状態を維持する。この瞬間、コンデンサＣ_i(j-1)は依然として“０”の論理レベルなので、第１のｎＭＯＳトランジスタＱ_i(j-1)1は、前段のビットレベル・セルＭ_i(j-2)に格納されていた“０”の信号レベルを等価的に転送する。ビットレベル・セルＭ_i(j-1)の出力端子として機能する出力ノードＮ_outは、コンデンサＣ_i(j-1)に格納されていた信号をｉ行の次段のビットレベル・セルに出力する。

クロック信号は、細い実線で示すようにクロック周期τ_clockにより、“１”と“０”の論理レベルの間を定期的に振動するので、クロック信号は、時刻が(１／２)τ_clockが過ぎると又は時間間隔τ_２の開始時に“０”の論理レベルになり、第１のｎＭＯＳトランジスタＱ_i(j-1)1のドレイン電極の電位は、一点鎖線で強調表示するように瞬時に減衰し始める。現在のビットレベル・セルＭ_i(j-1)と次段のビットレベル・セルＭ_ijの間に挿入したユニット間セルＢ_ijがｎＭＯＳトランジスタからなる場合、現在のビットレベル・セルＭ_i(j-1)の出力端子と次段のビットレベル・セルＭ_ijの第１のｎＭＯＳトランジスタＱ_ij1のゲート電極との間の電気経路は、ｎＭＯＳトランジスタのゲート電極に印加されているクロック信号の“０”の論理レベルのためにオフする。したがって、出力ノードＮ_outは、前段のビットレベル・セルＭ_i(j-2)から転送された信号を、時間間隔τ_２及び時間間隔τ_４で将棋倒しのように次段のビットレベル・セルＭ_ijに更に送ることができないので、次の第１のｎＭＯＳトランジスタＱ_ij1のゲート電極への信号のドミノ転送が阻止される。第１のｎＭＯＳトランジスタＱ_i(j-1)1が時間間隔τ_２及び時間間隔τ_４でターン・オフするので、出力ノードＮ_outの電位は浮遊状態に維持され、コンデンサＣ_i(j-1)に格納されていた信号状態は保たれる。

クロック信号が再び“１”の論理レベルになると、図２１に次段の列として示した枠内に細い実線で示すように、第１のｎＭＯＳトランジスタＱ_i(j-1)1のソース電極と第２のｎＭＯＳトランジスタＱ_i(j-1)2のドレイン電極とを接続する出力ノードＮ_outは、ビットレベル・セルＭ_i(j-1)の出力端子として機能し、コンデンサＣ_i(j-1)に格納されていた信号を次段のビットレベル・セルＭ_ijに次のクロックサイクルで送ることができる。何故ならば、ユニット間セルＢ_ijが導通状態になり、第１のｎＭＯＳトランジスタＱ_i(j-1)1のドレイン電極の電位が一点鎖線で強調表示するように高くなるからである。

図２２（ａ）〜（ｄ）は、図１９及び図２０に示したビットレベル・セルＭ_ijに着目して、それぞれ、信号転送動作の４つのモードを示す。ビットレベル・セルＭ_ijは、ｊ番目のメモリユニットＵ_ｊに連続して１次元配列されたビットレベル・セルの中の一つである。ｊ番目のメモリユニットＵ_ｊは、ｊ番目のメモリユニットＵ_ｊに連続して１次元配列されたビットレベル・セルにそれぞれバイト・サイズ又はワード・サイズの情報を格納している。本発明の第１の実施形態に係る計算機システムでは、連続して１次元配列されたバイト・サイズ又はワード・サイズの情報は、前段のメモリユニットから次段のメモリユニットに、同じ歩調で隊列を整えて並んで行進する。クロック信号供給線ＣＬＯＣＫが電源線として機能するので、図２２（ａ）〜（ｄ）で、クロック信号はクロック周期τ_clockにより“１”と“０”の論理レベルの間を定期的に振動するように、クロック信号供給線ＣＬＯＣＫから供給される。

図２２（ａ）及び（ｂ）は、“０”の論理レベルがコンデンサＣ_ijに前段のクロック信号によって格納される場合を示し、図２２（ｃ）及び（ｄ）は、“１”の論理レベルがバイト・サイズ又はワード・サイズの１次元配列された一連の情報に含まれる信号の一つとしてコンデンサＣ_ijに前段のクロック信号によって格納される場合を示す。図２２（ａ）に示すように、コンデンサＣ_ijに既に格納されていた信号電荷が“０”の論理レベルのときに、隊列を整えて互いに連携して行進して転送されるバイト・サイズ又はワード・サイズの１次元配列された情報に含まれる信号の一つとして、前段のビットレベル・セルＭ_i(j-1)に格納されていた“０”の論理レベルの信号が、前段のビットレベル・セルＭ_i(j-1)からユニット間セルＢ_ij（図示せず）を介して第１のｎＭＯＳトランジスタＱ_ij1のゲート電極に送られたとする。“０”の論理レベルの信号がゲート電極に送られると、第１のｎＭＯＳトランジスタＱ_ij1は、オフになる。このとき、コンデンサＣ_ijは依然として“０”の論理レベルを維持しているので、第１のｎＭＯＳトランジスタＱ_i(j-1)1は、“０”の論理レベルをコンデンサＣ_ijに等価的に転送する。そこで、出力ノードＮ_outは、コンデンサＣ_ijに維持されている“０”の信号レベルを、図２２（ａ）に示すように、次段のビットレベル・セルに出力する。

同様に、図２２（ｂ）に示すように、コンデンサＣ_ijに既に格納されていた信号電荷が“０”の論理レベルのときに、前段のビットレベル・セルＭ_i(j-1)に格納されていた“１”の論理レベルの信号が、前段のビットレベル・セルＭ_i(j-1)からユニット間セルＢ_ijを介して第１のｎＭＯＳトランジスタＱ_ij1のゲート電極に、コンデンサＣ_ijに格納されていた信号電荷が“０”の論理レベルを維持しているタイミングで送られたとする。“１”の論理レベルの信号がゲート電極に送られると、第１のｎＭＯＳトランジスタＱ_ij1は、前段のビットレベル・セルＭ_i(j-1)に格納されていた“１”の論理レベルの信号をコンデンサＣ_ijに転送するようにターン・オン動作を開始して、“１”の論理レベルをコンデンサＣ_ijに格納する。そして、出力ノードＮ_outは、コンデンサＣ_ijに格納されていた“１”の信号レベルを次段のビットレベル・セルに、図２２（ｂ）に示すようにして出力する。

逆に、図２２（ｃ）に示すように、コンデンサＣ_ijに既に格納されていた信号電荷が“１”の論理レベルのときに、前段のビットレベル・セルＭ_i(j-1)に格納されていた“０”の論理レベルの信号が、前段のビットレベル・セルＭ_{i(j -1)}からユニット間セルＢ_ijを介して第１のｎＭＯＳトランジスタＱ_ijのゲート電極に送られたとする。“０”の論理レベルの信号がゲート電極に送られると、コンデンサＣ_ijに格納されていた信号電荷が完全に放電して“０”の論理レベルになるタイミングの後まで、第１のｎＭＯＳトランジスタＱ_ij1がオフ状態を維持する。そこで、出力ノードＮ_outは、コンデンサＣ_ijに格納されていた“０”の信号レベルを次段のビットレベル・セルに、図２２（ｃ）に示すように出力する。

同様に、図２２（ｄ）に示すように、コンデンサＣ_ijに既に格納されていた信号電荷が“１”の論理レベルのときに、前段のビットレベル・セルＭ_i(j-1)に格納されていた“１”の論理レベルの信号が、前段のビットレベル・セルＭ_i(j-1)からユニット間セルＢ_ijを介して第１のｎＭＯＳトランジスタＱ_ij1のゲート電極に送られたとする。“１”の論理レベルの信号がゲート電極に送られると、コンデンサＣ_ijに格納されていた信号電荷が完全に放電して“０”の論理レベルとなるタイミングの後に、第１のｎＭＯＳトランジスタＱ_ij1がオンして、第１のｎＭＯＳトランジスタＱ_ij1が、前段のビットレベル・セルＭ_i(j-1)に格納されていた“１”の論理レベルの信号をコンデンサＣ_ijに転送する。そこで、出力ノードＮ_outは、コンデンサＣ_ijに格納されていた“１”の信号レベルを次段のビットレベル・セルに、図２２（ｄ）に示すように出力する。

このように、クロック信号が呈する“１”を一方の入力信号とし、前段のビットレベル・セルＭ_i(j-1)が呈する“１”又は“０”を他方の入力信号として、ビットレベル・セルＭ_ijは、下記の“マーチングＡＮＤゲート”動作を実現できる：
１＋１＝１
１＋０＝１

そして、クロック信号が呈する“０”を一方の入力信号とし、前段のビットレベル・セルＭ_i(j-1)が呈する“１”又は“０”を他方の入力信号として、ビットレベル・セルＭ_ijは、下記の“マーチングＡＮＤゲート”動作を実現できる：
０＋１＝０
０＋０＝０

したがって、図４に示すマーチング主記憶装置３１に対応したセル・アレイのゲートレベル表現を図２３に示すと、第１行の最左端に配置され且つ入力端子Ｉ_１に接続する第１のセルＭ₁₁は、情報を格納するコンデンサＣ₁₁と、コンデンサＣ₁₁に接続した一方の入力端子、クロック信号が供給される他方の入力端子、第１行において隣接する第２のセルＭ₁₂に設けた次段のＡＮＤゲートＧ₁₂の一方の入力端子に接続した出力端子を有するＡＮＤゲートＧ₁₁と、を備えている。クロック信号波形に対する応答の一例が図７Ｃに図示されている。クロック信号の”１”の論理値がマーチングＡＮＤゲートＧ₁₁の他方の入力端子に送られると、コンデンサＣ₁₁に格納されていた情報が、隣接する第２のセルＭ₁₂に設けたコンデンサＣ₁₂に転送され、コンデンサＣ₁₂が情報を格納する。即ち、マーチング主記憶装置３１を形成するセル・アレイのゲートレベル表現の第１行の第２のセルＭ₁₂は、コンデンサＣ₁₂と、コンデンサＣ₁₂に接続した一方の入力端子、クロック信号が供給される他方の入力端子、第１行において隣接する第３のセルＭ₁₃に設けた次段のマーチングＡＮＤゲートＧ₁₃の一方の入力端子に接続された出力端子を有するＡＮＤゲートＧ₁₂とを含んでいる。同様に、マーチング主記憶装置３１を形成するセル・アレイのゲートレベル表現の第１行の第３のセルＭ₁₃は、情報を格納するコンデンサＣ₁₃と、コンデンサＣ₁₃に接続した一方の入力端子、クロック信号が供給される他方の入力端子、隣接する第４のセルに設けた次段のマーチングＡＮＤゲートの一方の入力端子に接続した出力端子とを有するマーチングＡＮＤゲートＧ₁₃と、を備えている。但し、第４のセルの図示は省略されている。したがって、”１”の論理値がマーチングＡＮＤゲートＧ₁₂の他方の入力端子に送られると、コンデンサＣ₁₂に格納されていた情報が第３のセルＭ₁₃に設けたコンデンサＣ₁₃に転送されて、コンデンサＣ₁₃が情報を格納する。“１”の論理値がマーチングＡＮＤゲートＧ₁₃の他方の入力端子に送られると、コンデンサＣ₁₃に格納されていた情報が第４のセルに設けたコンデンサに転送される。更に、マーチング主記憶装置３１を形成するセル・アレイのゲートレベル表現の第１行の（ｎ−１）番目のセルＭ_1,n-1は、情報を格納するコンデンサＣ_1,n-1と、コンデンサＣ_1,n-1に接続した一方の入力端子、クロック信号が供給される他方の入力端子、隣接するｎ番目のセルＭ_１ｎに設けた次段のマーチングＡＮＤゲートＧ_１ｎの一方の入力端子に接続した出力端子とを有するマーチングＡＮＤゲートＧ_1,n-1と、を備えている。次段のマーチングＡＮＤゲートＧ_１ｎは、第１行の最右端に配置され、且つ出力端子Ｏ_１に接続している。したがって、セルＭ₁₁、Ｍ₁₂、Ｍ₁₃、……、Ｍ_1,n-1、Ｍ_１ｎのそれぞれは、情報を格納し、情報をクロック信号と同期して、ステップごとに、出力端子Ｏ_１に向けて転送するので、格納されていた情報がプロセッサ１１に能動的に逐次出力され、ＡＬＵ１１２は、格納されていた情報により演算論理動作を実行できる。

同様に、図２３に示すマーチング主記憶装置３１を形成するセル・アレイのゲートレベル表現において、第２行の最左端に配置し且つ入力端子Ｉ_２に接続した第１のセルＭ₂₁は、コンデンサＣ₂₁と、コンデンサＣ₂₁に接続した一方の入力端子、クロック信号が供給される他方の入力端子、第２行において隣接する第２のセルＭ₂₁に設けた次段のマーチングＡＮＤゲートＧ₂₁の一方の入力端子に接続した出力端子を有するＡＮＤゲートＧ₂₁とを含んでいる。マーチング主記憶装置３１を形成するセル・アレイのゲートレベル表現の第２行の第２のセルＭ₂₂は、コンデンサＣ₂₂と、コンデンサＣ₂₂に接続した一方の入力端子、クロック信号が供給される他方の入力端子、第２行において隣接する第３のセルＭ₂₃に設けた次段のマーチングＡＮＤゲートＧ₂₃の一方の入力端子に接続した出力端子を有するＡＮＤゲートＧ₂₂と、を備えている。同様に、マーチング主記憶装置３１を形成するセル・アレイのゲートレベル表現において、第２行の第３のセルＭ₂₃は、コンデンサＣ₂₃と、コンデンサＣ₂₃に接続した一方の入力端子、クロック信号が供給される他方の入力端子、隣接する第４のセルに設けた次段のマーチングＡＮＤゲートの一方の入力端子に接続した出力端子とを有するマーチングＡＮＤゲートＧ₂₃と、を備えている。更に、マーチング主記憶装置３１を形成するセル・アレイのゲートレベル表現の第２行の（ｎ−１）番目のセルＭ_２,n-1は、コンデンサＣ_２,n-1と、コンデンサＣ_２,n-1に接続した一方の入力端子、クロック信号が供給される他方の入力端子、次段のマーチングＡＮＤゲートＧ_１ｎの一方の入力端子に接続した出力端子とを有するマーチングＡＮＤゲートＧ_２,n-1と、を備えている。マーチングＡＮＤゲートＧ_２,n-1は、第２行の最右端に配置され、且つ出力端子Ｏ₂に接続している。したがって、第２行のセルＭ₂₁、Ｍ₂₂、Ｍ₂₃、……、Ｍ_２,n-1、Ｍ_１ｎのそれぞれは、情報を格納し、情報をクロック信号と同期して、ステップごとに、出力端子Ｏ_１に向けて転送するので、格納されていた情報がプロセッサ１１に能動的且つ逐次的に出力され、ＡＬＵ１１２は、格納されていた情報により演算論理動作を実行する。

第３行には、最左端に配置し且つ入力端子Ｉ_３に接続した第１のセルＭ₃₁と、第１のセルに隣接した第２のセルＭ₃₂と、第２のセルＭ₃₂に隣接した第３のセルＭ₃₃と、……、（ｎ−１）番目のセルＭ_３,n-1と、第３行で最右端に配置され、且つ出力端子Ｏ３に接続したｎ番目のセルＭ_3nが配列されている。そして、第３行のセル、Ｍ₃₂、Ｍ₃₃、……、Ｍ_３,n-1、Ｍ_3nのそれぞれは、情報を格納し、情報をクロック信号と同期して、ステップごとに、出力端子Ｏ_３に向けて転送するので、格納されていた情報がプロセッサ１１に能動的且つ逐次的に出力され、ＡＬＵ１１２は格納されていた情報により演算論理動作を実行する。

（ｍ−１）番目の行には、最左端に配置し且つ入力端子Ｉ_m-1に接続した第１のセルＭ_(m-1),１と、第１のセルＭ_(m-1),１に隣接した第２のセルＭ_(m-1),2と、第２のセルＭ_(m-1),2に隣接した第３のセルＭ_(m-1),3と、……、（ｎ−１）番目のセルＭ_(m-1),n-1と、（ｍ−１）番目の行で最右端に配置され、且つ出力端子Ｏ_m-1に接続するｎ番目のセルＭ_(m-1),nが配列されている。そして、（ｍ−１）番目の行のセルＭ_(m-1),１、Ｍ_(m-1),2、Ｍ_(m-1),3、……、Ｍ_(m-1),n-1、Ｍ_(m-1),nのそれぞれは、情報を格納し、情報をクロック信号と同期して、ステップごとに、出力端子Ｏ_m-1に転送し、格納されていた情報がプロセッサ１１に能動的且つ逐次的に出力され、ＡＬＵ１１２は格納された情報により演算論理動作を実行する。

ｍ番目の行には、最左端に配置され、且つ入力端子Ｉ_mに接続した第１のセルＭ_m1と、第１のセルＭ_m1に隣接した第２のセルＭ_m2と、第２のセルＭ_m2に隣接した第３のセルＭ_m3と、……、（ｎ−１）番目のセルＭ_ｍ(n-1)と、ｍ番目の行で最右端に配置され、且つ出力端子Ｏ_ｍに接続しているｎ番目のセルＭ_ｍｎが、配列されている。そして、ｍ番目の行のセルＭ_m１、Ｍ_m2、Ｍ_m3、……、Ｍ_ｍ(n-1)、Ｍ_ｍｎのそれぞれは、情報を格納し、情報をクロック信号と同期して、ステップごとに出力端子Ｏ_ｍに転送し、格納されていた情報がプロセッサ１１に能動的且つ逐次的に出力され、ＡＬＵ１１２は格納された情報により演算論理動作を実行する。

マーチングＡＮＤゲートＧ_ijのトランジスタ・レベル構成の一例が図６に示してあるが、第１の実施形態に係る計算機システムのマーチング主記憶装置３１を形成するセル・アレイに適用できるマーチングＡＮＤゲートには、マーチングＡＮＤゲートを構成する様々な回路構成がある。マーチング主記憶装置３１を形成するセル・アレイに適用できるマーチングＡＮＤゲートＧ_ijの他の例として、ＣＭＯＳＮＡＮＤゲートと、ＣＭＯＳＮＡＮＤゲートの出力端子に接続するＣＭＯＳインバータと、を備える構成がある。ＣＭＯＳＮＡＮＤゲートは２つのｎＭＯＳトランジスタと２つのｐＭＯＳトランジスタを必要とし、ＣＭＯＳインバータは一つのｎＭＯＳトランジスタと一つのｐＭＯＳトランジスタを必要とするので、ＣＭＯＳＮＡＮＤゲート及びＣＭＯＳインバータと、を備える構成は６個のトランジスタを必要とする。更に、マーチングＡＮＤゲートＧ_ijは、ＡＮＤロジックの機能を有する、抵抗−トランジスタ・ロジックのような他の回路構成、又は半導体素子、磁気素子、超導電素子、単一量子素子などで形成できる。

図２３に示すように、マーチング主記憶装置３１を形成するセル・アレイのゲートレベル表現は、ＤＲＡＭの構成のように単純である。ここで、ビットレベル・セルＭ_ij（ｉ＝１〜ｍ；ｊ＝１〜ｎ）のそれぞれは、一つのコンデンサと一つのマーチングＡＮＤゲートから表現される。第１のメモリユニットＵ_１を形成するマーチングＡＮＤゲートＧ₁₁、Ｇ₂₁、Ｇ₃₁、-----、Ｇ_m-1,1、Ｇ_m1の垂直方向１次元配列のそれぞれは、信号の１次元配列を、入力端子Ｉ_１、Ｉ_２、Ｉ_３、-----、Ｉ_n-1、Ｉ_ｎから右側に行方向に沿って又は水平方向に、図７Ｃに示すクロックに基づいてシフトする。そして、第２のメモリユニットＵ_２を形成するマーチングＡＮＤゲートＧ₁₂、Ｇ₂₂、Ｇ₃₂、-----、Ｇ_m-1,2、Ｇ_m2の垂直方向１次元配列のそれぞれは、１次元に配列されたワード・サイズの信号を、左から右に行方向に沿って、クロックに基づいて移動する。第３のメモリユニットＵ_２を形成するマーチングＡＮＤゲートＧ₁₃、Ｇ₂₃、Ｇ₃₃、-----、Ｇ_m-1,3、Ｇ_m3の垂直方向１次元配列のそれぞれは、１次元に配列されたワード・サイズの信号を、左から右に行方向に沿って、クロックに基づいて移動する。（ｎ−１）番目のメモリユニットＵ_n-1を形成するマーチングＡＮＤゲートＧ_1,n-1、Ｇ_２,n-1、Ｇ_３,n-1、-----、Ｇ_m-1,n-1、Ｇ_ｍ、n-1の垂直方向１次元配列のそれぞれは、１次元に配列されたワード・サイズの信号を、左から右に行方向に沿ってクロックに基づいて移動する。ｎ番目のメモリユニットＵ_ｎを形成するマーチングＡＮＤゲートＧ_1,n、Ｇ_２,n、Ｇ_３,n、-----、Ｇ_m-1,n、Ｇ_ｍ、nの垂直方向１次元配列のそれぞれは、１次元に配列されたワード・サイズの信号を、左から右に出力端子Ｏ_１、Ｏ_２、Ｏ_３、-----、Ｏ_n-1、Ｏ_ｎに、クロックに基づいて図７Ｃに示すようにして移動する。特に、マーチングＡＮＤゲートＧ_ij（ｉ＝１〜ｍ；ｊ＝１〜ｎ）のそれぞれの時間遅延ｔ_ｄ１とｔ_d2は、マーチング主記憶装置３１のすべてのメモリユニットの隊列行進移動の動作を適正に適切に行うために重要である。

（逆方向マーチング主記憶装置）
図３〜図２３は、情報をメモリユニットＵ_１、Ｕ_２、Ｕ_２、……、Ｕ_n-1、Ｕ_ｎのそれぞれに格納し、情報をクロック信号と同期してステップごとに入力端子から出力端子に転送する、マーチング主記憶装置を示すが、図７は他のマーチング主記憶装置を示す。
図２４において、メモリユニットＵ_１、Ｕ_２、Ｕ_２、……、Ｕ_n-1、Ｕ_ｎのそれぞれは、ワード・サイズのデータ又は命令を含む情報を格納し、プロセッサ１１から供給された情報を、ＡＬＵ１１２で実行した最終データと共に、図２４の出力端子側となる方向に向けて、ステップごとに、クロック信号と同期して、逆方向に転送する。

図２５（ａ）は、図２４に示す他のマーチング主記憶装置のセル−レベル表現におけるｍ×ｎマトリクス（ここで、ｍはワード・サイズで決まる整数）のｉ行のアレイを示していて、ビットレベルの情報をセルＭ_i1、Ｍ_i2、Ｍ_i3、……、Ｍ_i,n-1、Ｍ_i,nに格納し、情報をクロック信号と同期して、ステップごとに、図３〜図２３に示すマーチング主記憶装置と逆方向、即ち、出力端子ＯＵＴから入力端子ＩＮに向けて転送する。

図２５（ａ）に示すように、逆方向マーチング主記憶装置では、ｉ行の最右端に配置し且つ入力端子ＩＮに接続した、ｉ行・ｎ列のビットレベル・セルＭ_ｉｎは、第１遅延素子Ｄ_in1を介してクロック信号供給線に接続したドレイン電極、第２遅延素子Ｄ_in2を介して入力端子ＩＮに接続したゲート電極を有する第１のｎＭＯＳトランジスタＱ_in1と、第１のｎＭＯＳトランジスタＱ_in1のソース電極に接続したドレイン電極、クロック信号供給線に接続したゲート電極、接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_in2と、第２のｎＭＯＳトランジスタＱ_in2に並列接続され、ビットレベル・セルＭ_ｉｎの情報を格納するコンデンサＣ_ｉｎと、を有している。ビットレベル・セルＭ_ｉｎでは、第１のｎＭＯＳトランジスタＱ_in1のソース電極と第２のｎＭＯＳトランジスタＱ_in2のドレイン電極とを接続する出力ノードは、コンデンサＣ_ｉｎに格納されていた信号を次段のビットレベル・セルＭ_i2に転送するようにビットレベル・セルＭ_ｉｎの出力端子として機能する。

図２５（ｂ）に示すように、クロック信号は、所定のクロック周期τ_clockにより、“１”と“０”の論理レベルの間を定期的に振動する。クロック信号が“１”の論理レベルになると、第２のｎＭＯＳトランジスタＱ_in2は、前段のクロックサイクルでコンデンサＣ_ｉｎに既に格納されていた信号電荷の放電を開始する。そして、“１”の論理レベルのクロック信号が印加され、コンデンサＣ_ｉｎに格納されていた信号電荷が完全に放電して“０”の論理レベルになった後に、第１のｎＭＯＳトランジスタＱ_in1は、第１遅延素子Ｄ_in1から決まる所定の遅延時間ｔ_ｄ１だけ遅れて、転送トランジスタとして作動する。遅延時間ｔ_ｄ１は、好ましくは(１／４)τ_clockと等しく設定できる。その後、信号が入力端子ＩＮから第１のｎＭＯＳトランジスタＱ_in1のゲート電極に送られると、第１のｎＭＯＳトランジスタＱ_in1は、前段のビットレベル・セルＭ_in2に格納されていた信号をコンデンサＣ_ｉｎに、第２遅延素子Ｄ_in2から決まる所定の遅延時間ｔ_d2だけ更に遅れて転送する。例えば、“１”の論理レベルが入力端子ＩＮから第１のｎＭＯＳトランジスタＱ_in1のゲート電極に送られたとする。“１”の論理レベルがゲート電極に送られると、第１のｎＭＯＳトランジスタＱ_in1は導通状態になり、“１”の論理レベルがコンデンサＣ_ｉｎに格納される。他方、“０”の論理レベルが入力端子ＩＮから第１のｎＭＯＳトランジスタＱ_in1のゲート電極に送られたとする。“０”の論理レベルがゲート電極に送られると、第１のｎＭＯＳトランジスタＱ_in1はオフ状態を維持し、“０”の論理レベルがコンデンサＣ_ｉｎに維持される。したがって、ビットレベル・セルＭ_ｉｎは「マーチングＡＮＤゲート」の動作を実現できる。遅延時間ｔ_d2が遅延時間ｔ_ｄ１より長いとすると、遅延時間ｔ_d2は、好ましくは(１／２)τ_clockに設定できる。クロック信号は時刻が(１／２)τ_clockを過ぎて“０”の論理レベルになると、第１のｎＭＯＳトランジスタＱ_in1と第２のｎＭＯＳトランジスタＱ_in2のドレイン電極とを接続する出力ノードは、第１のｎＭＯＳトランジスタＱ_in1のゲート電極に入力する信号を、時刻が(１／２)τ_clockを過ぎると、次段のビットレベル・セルＭ_i2に更に送ることができない。第２遅延素子Ｄ_ｉ22から決まる遅延時間ｔ_d2＝(１／２)τ_clockだけ遅れ、次段の第１のｎＭＯＳトランジスタＱ_ｉ21のゲート電極に信号が転送されることが阻止されるためである。

図２５（ａ）に示すように、逆方向マーチング主記憶装置では、ｉ行で右から２番目に位置する、ｉ行・（ｎ−１）列のビットレベル・セルＭ_i(n-1)は、第１遅延素子Ｄ_i(n-1)1を介してクロック信号供給線に接続したドレイン電極、第２遅延素子Ｄ_i(n-1)2を介してビットレベル・セルＭ_ｉｎの出力端子に接続したゲート電極を有する第１のｎＭＯＳトランジスタＱ_i(n-1)1と、第１のｎＭＯＳトランジスタＱ_i(n-1)1のソース電極に接続したドレイン電極、クロック信号供給線に接続したゲート電極、接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_i(n-1)2と、第２のｎＭＯＳトランジスタＱ_i(n-1)2に並列接続され、ビットレベル・セルＭ_i(n-1)の情報を格納するコンデンサＣ_i(n-1)とを含んでいる。クロック信号が“１”の論理レベルになると、第２のｎＭＯＳトランジスタＱ_i(n-1)2は、所定のクロックサイクルでコンデンサＣ_i(n-1)に既に格納されていた信号電荷の放電を開始する。そして、図２５（ｂ）に示すように、“１”の論理レベルがコンデンサＣ_i(n-1)に時刻“ｔ”から“ｔ＋１”にかけて維持される。“１”の論理レベルのクロック信号が印加され、コンデンサＣ_i(n-1)に格納されていた信号電荷が完全に放電して“０”の論理レベルになると、第１のｎＭＯＳトランジスタＱ_i(n-1)1は、第１遅延素子Ｄ_i(n-1)1から決まる遅延時間ｔ_ｄ１だけ遅れて、転送トランジスタとして作動する。その後、信号がビットレベル・セルＭ_ｉｎの出力端子から第１のｎＭＯＳトランジスタＱ_i(n-1)1のゲート電極に送られると、第１のｎＭＯＳトランジスタＱ_i(n-1)1は、前段のビットレベル・セルＭ_ｉｎに格納されていた信号をコンデンサＣ_i(n-1)に、第２遅延素子Ｄ_i(n-1)2から決まる遅延時間ｔ_d2だけ更に遅れて転送する。クロック信号は時刻が(１／２)τ_clockを過ぎて“０”の論理レベルになると、第１のｎＭＯＳトランジスタＱ_i(n-1)1のソース電極と第２のｎＭＯＳトランジスタＱ_i(n-1)2のドレイン電極とを接続する出力ノードは、第１のｎＭＯＳトランジスタＱ_i(n-1)1のゲート電極に入力する信号を次段のビットレベル・セルＭ_i(n-2)に、時刻が(１／２)τ_clockを過ぎると更に送ることができない。第２遅延素子Ｄ_i(n-2)2（図示を省略）から決まる遅延時間ｔ_d2＝(１／２)τ_clockだけ遅れると次段の第１のｎＭＯＳトランジスタＱ_i(n-2)1（図示を省略）のゲート電極への信号の転送が阻止されるからである。

同様に、逆方向マーチング主記憶装置のｉ行の左から３番目のセルＭ_i3は、第１遅延素子Ｄ_i31を介してクロック信号供給線に接続するドレイン電極、第２遅延素子Ｄ_i32を介してビットレベル・セルＭ_i4（図示を省略）の出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ_i31と、第１のｎＭＯＳトランジスタＱ_i31のソース電極に接続するドレイン電極、クロック信号供給線に接続するゲート電極、接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_i32と、第２のｎＭＯＳトランジスタＱ_i32に並列接続され、ビットレベル・セルＭ_i3の情報を格納するコンデンサＣ_i3と、を含んでいる。クロック信号が“１”の論理レベルになると、第２のｎＭＯＳトランジスタＱ_i32は、前段のクロックサイクルでコンデンサＣ_i3に既に格納されていた信号電荷の放電を開始する。“１”の論理レベルのクロック信号が印加され、コンデンサＣ_i3に格納されていた信号電荷が完全に放電して“０”の論理レベルになると、第１のｎＭＯＳトランジスタＱ_i31は、第１遅延素子Ｄ_i31から決まる遅延時間ｔ_ｄ１だけ遅れて、転送トランジスタとして作動する。その後、信号がビットレベル・セルＭ_i4の出力端子から第１のｎＭＯＳトランジスタＱ_i31のゲート電極に送られると、第１のｎＭＯＳトランジスタＱ_i31は、前段のビットレベル・セルＭ_i4に格納されていた信号をコンデンサＣ_i3に、第２遅延素子Ｄ_i32から決まる遅延時間ｔ_d2だけ更に遅れて転送する。クロック信号が、時刻が(１／２)τ_clockが過ぎて“０”の論理レベルになると、第１のｎＭＯＳトランジスタＱ_i31のソース電極と第２のｎＭＯＳトランジスタＱ_i32のドレイン電極とを接続する出力ノードは、第１のｎＭＯＳトランジスタＱ_i31のゲート電極に入力する信号を、更に次段のビットレベル・セルＭ_i2に、時刻が(１／２)τ_clockが過ぎると送ることができない。第２遅延素子Ｄ_ｉ22から決まる遅延時間ｔ_d2＝(１／２)τ_clockだけ遅れると次段の第１のｎＭＯＳトランジスタＱ_i21のゲート電極への信号の転送が阻止されるからである。

そして、図２５（ａ）に示すように、逆方向マーチング主記憶装置において、ｉ行で左から２番目のビットレベル・セルＭ_i2は、第１遅延素子Ｄ_i21を介してクロック信号供給線に接続するドレイン電極、第２遅延素子Ｄ_i22を介してビットレベル・セルＭ_i3の出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ_i21と、第１のｎＭＯＳトランジスタＱ_i21のソース電極に接続するドレイン電極、クロック信号供給線に接続するゲート電極、接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_i22と、第２のｎＭＯＳトランジスタＱ_i22に並列接続され、ビットレベル・セルＭ_i2の情報を格納するコンデンサＣ_i2と。を含んでいる。クロック信号が“１”の論理レベルになると、第２のｎＭＯＳトランジスタＱ_i22は、前段のクロックサイクルでコンデンサＣ_i2に既に格納されていた信号電荷の放電を開始する。“１”の論理レベルのクロック信号が印加され、コンデンサＣ_i2に格納されていた信号電荷が完全に放電して“０”の論理レベルになると、第１のｎＭＯＳトランジスタＱ_i21は、第１遅延素子Ｄ_i21から決まる遅延時間ｔ_d1だけ遅れて、転送トランジスタとして作動する。その後、信号がビットレベル・セルＭ_i3の出力端子から第１のｎＭＯＳトランジスタＱ_i21のゲート電極に送られると、第１のｎＭＯＳトランジスタＱ_i21は、前段のビットレベル・セルＭ_i3に格納されていた信号をコンデンサＣ_i2に、第２遅延素子Ｄ_i22から決まる遅延時間ｔ_d2だけ更に遅れて転送する。クロック信号が、時刻が(１／２)τ_clockが過ぎて“０”の論理レベルになると、第１のｎＭＯＳトランジスタＱ_i21のソース電極と第２のｎＭＯＳトランジスタＱ_i22のドレイン電極とを接続する出力ノードは、第１のｎＭＯＳトランジスタＱ_i21のゲート電極に入力する信号を、時刻が(１／２)τ_clockを過ぎると更に次段のビットレベル・セルＭ_i1に送ることができない。第２遅延素子Ｄ_i12から決まる遅延時間ｔ_d2＝(１／２)τ_clockだけ遅れると次段の第１のｎＭＯＳトランジスタＱ_ｉ11のゲート電極への信号の転送が阻止されるからである。

図２５（ａ）に示すように、逆方向マーチング主記憶装置において、ｉ行の最左端に配置され且つ出力端子ＯＵＴに接続する、ｉ行・１列のビットレベル・セルＭ_i1は、第１遅延素子Ｄ_i11を介してクロック信号供給線に接続するドレイン電極、第２遅延素子Ｄ_i12を介してビットレベル・セルＭ_i2の出力端子に接続するゲート電極を有する第１のｎＭＯＳトランジスタＱ_i11と、第１のｎＭＯＳトランジスタＱ_i11のソース電極に接続するドレイン電極、クロック信号供給線に接続するゲート電極、接地電位に接続するソース電極を有する第２のｎＭＯＳトランジスタＱ_i12と、第２のｎＭＯＳトランジスタＱ_i12に並列接続され、ビットレベル・セルＭ_i1の情報を格納するコンデンサＣ_i1とを含んでいる。クロック信号が“１”の論理レベルになると、第２のｎＭＯＳトランジスタＱ_i12は、前段のクロックサイクルでコンデンサＣ_i1に既に格納されていた信号電荷の放電を開始する。“１”の論理レベルのクロック信号が印加され、コンデンサＣ_i1に格納されていた信号電荷が完全に放電して“０”の論理レベルになると、第１のｎＭＯＳトランジスタＱ_i11は、第１遅延素子Ｄ_i11から決まる遅延時間ｔ_d1だけ遅れて、転送トランジスタとして作動する。その後、信号がビットレベル・セルＭ_i2の出力端子から第１のｎＭＯＳトランジスタＱ_i11のゲート電極に送られると、第１のｎＭＯＳトランジスタＱ_i11は、前段のビットレベル・セルＭ_i2に格納されていた信号をコンデンサＣ_i1に、第２遅延素子Ｄ_i12から決まる遅延時間ｔ_d2だけ更に遅れて転送する。第１のｎＭＯＳトランジスタＱ_i11のソース電極と第２のｎＭＯＳトランジスタＱ_i12のドレイン電極とを接続する出力ノードは、コンデンサＣ_i1に格納されていた信号を出力端子ＯＵＴに送る。

図２４、図２５（ａ）及び図２５（ｂ）に示す第１の実施形態に係る逆方向１次元のマーチング主記憶装置３１によれば、メモリユニットＵ_１、Ｕ_２、Ｕ_２、-----、Ｕ_n-1、Ｕ_ｎのそれぞれに対するアドレス指定は消滅し、必要な情報は、メモリのエッジに接続するその宛先のヘッディングになる。第１の実施形態に係る逆方向１次元のマーチング主記憶装置３１にアクセスする機構は、まさしく、情報を読み取り／書き込むアドレス指定モードを基礎とする従来のメモリ・スキームの真の代替え的スキームとなるものである。したがって、第１の実施形態に係る逆方向１次元のマーチング主記憶装置３１が提供するアドレス指定モードのないメモリ・アクセスは、従来のメモリ・スキームより非常に単純になる。

前述のように、ビットレベル・セルＭ_ijは、「マーチングＡＮＤゲート」の動作を実現できる。したがって、図２６に示すように、図２５（ａ）に示す逆方向マーチング主記憶装置３１に対応するセル・アレイのゲートレベル表現において、ｉ行の最右端に配置され入力端子ＩＮに接続する、ｎ番目のビットレベル・セルＭ_i,nは、情報を格納するコンデンサＣ_ｉｎと、コンデンサＣ_ｉｎに接続した一方の入力端子、クロック信号が供給される他方の入力端子、及びｉ行において（ｎ−１）番目の隣接するビットレベル・セルＭ_i,n-1に位置するマーチングＡＮＤゲートＧ_i,(n-1)の一方の入力端子に接続する出力端子を有するマーチングＡＮＤゲートＧ_ｉｎと、を含んでいる。“１”の論理レベルがマーチングＡＮＤゲートＧ_ｉｎの他方の入力端子に送られると、コンデンサＣ_ｉｎに格納されていた情報が、ｉ行において（ｎ−１）番目の隣接するビットレベル・セルＭ_i,n-1に位置するコンデンサＣ_i,n-1に転送され、コンデンサＣ_i,n-1は情報を格納する。即ち、逆方向マーチング主記憶装置のｉ行の（ｎ−１）番目のビットレベル・セルＭ_i,n-1は、コンデンサＣ_i,n-1と、コンデンサＣ_i,n-1に接続した一方の入力端子、クロック信号が供給される他方の入力端子、及びｉ行において右から３番目の位置に配置されて隣接するビットレベル・セルＭ_i,n-2（図示を省略）のマーチングＡＮＤゲートＧ_i,n-2の一方の入力端子に接続した出力端子を有するマーチングＡＮＤゲートＧ_i,n-1とを含んでいる。

同様に、逆方向マーチング主記憶装置のｉ行において左から３番目のビットレベル・セルＭ_i3は、情報を格納するコンデンサＣ_i3と、コンデンサＣ_i3に接続した一方の入力端子、クロック信号が供給される他方の入力端子、ｉ行の左から２番目の位置に配置されて隣接するビットレベル・セルＭ_i2に設けられたマーチングＡＮＤゲートＧ_i2の一方の入力端子に接続する出力端子を有するマーチングＡＮＤゲートＧ_i3とを含んでいる。したがって、“１”の論理レベルがマーチングＡＮＤゲートＧ_i3の他方の入力端子に送られると、コンデンサＣ_i3に格納されていた情報が、左から２番目の位置に配置されて隣接するビットレベル・セルＭ_i2に位置するコンデンサＣ_i2に転送され、コンデンサＣ_i2は情報を格納する。

更に、逆方向マーチング主記憶装置のｉ行の左から２番目の位置に配置されたビットレベル・セルＭ_i2は、情報を格納するコンデンサＣ_i2と、コンデンサＣ_i2に接続した一方の入力端子、クロック信号が供給される他方の入力端子、及びｉ行の最左端の位置に配置され出力端子ＯＵＴに接続している、ｉ行の左から１番目のビットレベル・セルＭ_i1に設けられたマーチングＡＮＤゲートＧ_i1の一方の入力端子に接続する出力端子を有するマーチングＡＮＤゲートＧ_i2とを含んでいる。

第１の実施形態に係る計算機システムに用いるマーチング主記憶装置３１の概念図が、図２７に示されている。マーチング主記憶装置３１は、マーチング主記憶装置３１を構成するメモリユニットＵ_１、Ｕ_２、Ｕ_２、……、Ｕ_n-1、Ｕ_ｎに情報／データを格納し、メモリユニットＵ_１、Ｕ_２、Ｕ_２、……、Ｕ_n-1、Ｕ_ｎに格納された情報／データのすべてが隊列を整えて行進し、すべての情報／データがメモリユニットＵ_１、Ｕ_２、Ｕ_２、……、Ｕ_n-1、Ｕ_ｎを介して転送されるように設計されているので、従来の計算機用記憶装置とは異なる。マーチング記憶装置は、プロセッサ（ＣＰＵ）１１に、プロセッサ１１の処理速度と同じ速度で情報／データを供給する。図２７の時間領域での関係に示すように、マーチング主記憶装置３１を構成するメモリユニットＵ_１、Ｕ_２、Ｕ_２、……、Ｕ_n-1、Ｕ_ｎのうちの一つメモリユニットについての、情報／データの転送に必要なメモリユニット・ストリーミング時間Ｔ_musは、プロセッサ１１のクロックサイクルＴ_ccと等しい。マーチング主記憶装置３１は、情報／データをメモリユニットＵ_１、Ｕ_２、Ｕ_２、……、Ｕ_n-1、Ｕ_ｎのそれぞれに格納し、クロック信号と同期して、ステップごとに、出力端子の方向に格納された情報／データを転送し、情報／データをプロセッサ１１に出力するので、演算論理装置１１２は、メモリユニットＵ_１、Ｕ_２、Ｕ_２、……、Ｕ_n-1、Ｕ_ｎのそれぞれに格納された情報／データにより演算論理動作を実行する。

したがって、図２８に示すように、マーチング記憶装置構造３は、第１の実施形態に係るマーチング主記憶装置３１を含む。ここで、「マーチング記憶装置構造３」という用語は、第１の実施形態に係る計算機システムに用いるマーチング主記憶装置３１に加え、次の第２の実施形態で更に説明するＡＬＵ１１２に接続したマーチング命令レジスタ・ファイル（ＲＦ）２２ａ及びマーチング−データレジスタ・ファイル（ＲＦ）２２ｂや、後述する第３の実施形態で更に説明するマーチング命令キャッシュメモリ２１ａ及びマーチング・データキャッシュメモリ２１ｂをも含む、メモリ構造の総称的な上位概念を意味する語である。

図２９（ａ）は、マーチング記憶装置構造３からプロセッサ１１に流れる前方進行データ流Ｓ_ｆと、プロセッサ１１からマーチング記憶装置構造３に流れる後方進行データ流（逆方向データ流）Ｓ_ｂを示し、図２９（ｂ）は、マーチング記憶装置構造３のメモリユニット・ストリーミング時間Ｔ_musがプロセッサ１１のクロックサイクルＴ_ccと等しいと想定した場合に、マーチング記憶装置構造３とプロセッサ１１の間に作られる帯域幅を示す。

マーチング主記憶装置３１のスキームは、図３０（ａ）に示す磁気テープと似ていると考えることができる。これは、磁気テープ５０３と、磁気テープ５０３を巻き取る巻き取りリール５０２と、磁気テープ５０３の再巻き取りとリリースをする供給リール５０１と、磁気テープ５０３からの情報／データの読み取り、又は磁気テープ５０３に情報／データを書き込む読取／書込ヘッダ５０４と、読取／書込ヘッダ５０４に接続したプロセッサ１１とを含んでいる。巻き取りリール５０２が供給リール５０１からリリースされた磁気テープ５０３を巻き取ると、磁気テープ５０３は、巻き取りリール５０２に向けて供給リール５０１から高速で移動する。磁気テープ５０３に格納されていた情報／データは、高速で磁気テープ５０３の動きに伴って転送され、読取／書込ヘッダ５０４によって読み取られる。そして、読取／書込ヘッダ５０４に接続したプロセッサ１１は、磁気テープ５０３から読み取った情報／データにより演算論理動作を実行できる。或いは、プロセッサ１１の処理の結果は、読取／書込ヘッダ５０４を介して磁気テープ５０３に送られる。

図３０（ａ）に示す磁気テープ・システムの構成を半導体技術によって製造すると仮定する。即ち、図３０（ｂ）に示すように、超高速磁気テープ・システムが半導体シリコン・チップ上に仮想的に構築されるとすると、図３０（ａ）に示す超高速磁気テープ・システムは、第１の実施形態に係るマーチング主記憶装置３１を含めた正味のマーチング記憶装置構造３に対応することになる。図３０（ｂ）に示す正味のマーチング記憶装置構造３は、情報／データをシリコン・チップ上の複数のメモリユニットのそれぞれに格納し、クロック信号に同期して、ステップごとに、巻き取りリール５０２に向けて複数のメモリユニットのそれぞれに格納された情報／データを転送するので、複数のメモリユニットのそれぞれに格納された情報／データが、プロセッサ１１に能動的に逐次出力され、プロセッサ１１は複数のメモリユニットのそれぞれに格納された情報／データにより演算論理動作を実行できて、プロセッサ１１の処理の結果は正味のマーチング記憶装置構造３に送られる。

（双方向マーチング主記憶装置）
図３１（ａ）〜（ｃ）に示すように、第１の実施形態に係るマーチング主記憶装置３１は、情報／データの双方向の転送を達成できる。即ち、図３１（ａ）は、情報／データが前方に隊列進行する状況を示し、情報／データが１次元のマーチング主記憶装置３１において右方向（前方）に隊列進行（移動）する。図３１（ｂ）は、１次元のマーチング主記憶装置３１の漂遊状態を示す。図３１（ｃ）は、情報／データが逆方向に隊列進行する状況（後方に隊列進行する状況）を示し、情報／データが１次元のマーチング主記憶装置３１の左方向（逆方向）に隊列進行（移動）している。

図３２及び図３３は、図３１（ａ）〜（ｃ）に示す双方向の状況を達成できる、それぞれ、双方向マーチング主記憶装置３１のセル・アレイのトランジスタ・レベル表現におけるｍ×ｎマトリクス（ここで、”ｍ”はワード・サイズで決まる整数）のｉ行の代表的なアレイの２つの例を示す。双方向マーチング主記憶装置３１は、ビットレベルの情報／データを、セルＭ_i1、Ｍ_i2、Ｍ_i3、-----、Ｍ_i,n-1、Ｍ_i,nのそれぞれに格納し、第１のＩ／Ｏセレクタ５１２と第２のＩ／Ｏセレクタ５１３との間で、前方向及び／又は反対方向（後方向）に、ステップごとに、クロック信号に同期して情報／データを双方向に転送する。

図３２及び図３３において、セルＭ_i1、Ｍ_i2、Ｍ_i3、-----、Ｍ_i,n-1、Ｍ_i,nのそれぞれは、メモリユニットＵ_１、Ｕ_２、Ｕ_２、-----、Ｕ_n-1、Ｕ_ｎに、それぞれ割り当てられている。即ち、セルＭ_i1は第１のメモリユニットＵ_１において第１のビットレベル・セルとして割り当てられ、第１のメモリユニットＵ_１は、第１のメモリユニットＵ_１に配列されたビットレベル・セルの１次元配列にそれぞれバイト・サイズ又はワード・サイズの情報を格納する。同様に、セルＭ_i2は、第２のメモリユニットＵ_２において第２のビットレベル・セルとして割り当てられる。セルＭ_i3は、第３のメモリユニットＵ_２において第３のビットレベル・セルとして割り当てられ、-----、セルＭ_i,n-1は、（ｎ−１）番目のメモリユニットＵ_n-1において（ｎ−１）番目のビットレベル・セルとして割り当てられる。セルＭ_i,nは、ｎ番目のメモリユニットＵ_ｎにおいてｎ番目のビットレベル・セルとして割り当てられる。そして、メモリユニットＵ_２、Ｕ_２、-----、Ｕ_n-1、Ｕ_ｎは、それぞれ、メモリユニットＵ_２、Ｕ_２、-----、Ｕ_n-1、Ｕ_ｎに配列されたビットレベル・セルの１次元配列にそれぞれバイト・サイズ又はワード・サイズの情報を格納する。したがって、双方向マーチング主記憶装置３１では、バイト・サイズ又はワード・サイズの情報／データがセルＵ_１、Ｕ_２、Ｕ_２、-----、Ｕ_n-1、Ｕ_ｎのそれぞれに格納され、バイト・サイズ又はワード・サイズの情報／データがそれぞれ互いに歩調を合わせて、前方向及び／又は反対方向（後方向）に、第１のＩ／Ｏセレクタ５１２と第２のＩ／Ｏセレクタ５１３の間で双方向にクロック信号に同期して揃って転送される。

クロック・セレクタ５１１は、第１のクロック信号供給線ＣＬ１と第２のクロック信号供給線ＣＬ２とを選択する。第１のクロック信号供給線ＣＬ１は前方データ流を駆動し、第２のクロック信号供給線ＣＬ２は後方データ流を駆動する。第１のクロック信号供給線ＣＬ１と第２のクロック信号供給線ＣＬ２のそれぞれは、“１”と“０”の論理値を出力する。

図３２に示すマーチング主記憶装置３１を形成するセル・アレイのトランジスタ・レベル表現において、第１のＩ／Ｏセレクタ５１２に接続し、ｉ行の最左端に配置された第１のビットレベル・セルＭ_i1は、第１の前方転送遅延素子Ｄ_i11fを介して第１のクロック信号供給線ＣＬ１に接続するドレイン電極、第２の前方転送遅延素子Ｄ_i12fを介して第１のＩ／Ｏセレクタ５１２に接続するゲート電極を有する第１の前方転送ｎＭＯＳトランジスタＱ_i11fと、第１の前方転送ｎＭＯＳトランジスタＱ_i11fのソース電極に接続するドレイン電極、第１のクロック信号供給線に接続するゲート電極、接地電位に接続するソース電極を有する第２の前方転送ｎＭＯＳトランジスタＱ_i12fと、第２の前方転送ｎＭＯＳトランジスタＱ_i12fに並列接続し、セルＭ_i1の前方伝搬情報／データを格納する前方転送コンデンサＣ_i1fと、を備える。そして、第１の前方転送ｎＭＯＳトランジスタＱ_i11fのソース電極と第２の前方転送ｎＭＯＳトランジスタＱ_i12fのドレイン電極とを接続する出力ノードは、次段のビットレベル・セルＭ_i2に前方転送コンデンサＣ_i1fに格納されていた信号を転送するようにセルＭ_i1の前方転送出力端子として機能している。第１のビットレベル・セルＭ_i1は、第１の後方遅延素子Ｄ_i11bを介して第２のクロック信号供給線に接続するドレイン電極、第２の後方遅延素子Ｄ_i12bを介してビットレベル・セルＭ_i2の後方転送出力端子に接続するゲート電極を有する第１の後方転送ｎＭＯＳトランジスタＱ_i11bと、第１の後方転送ｎＭＯＳトランジスタＱ_i11bのソース電極に接続するドレイン電極、第２のクロック信号供給線に接続するゲート電極、接地電位に接続するソース電極を有する第２の後方転送ｎＭＯＳトランジスタＱ_i12bと、第２の後方転送ｎＭＯＳトランジスタＱ_i12bに並列接続し、セルＭ_i1の後方伝搬情報／データを格納する後方転送コンデンサＣ_i1bと、を更に備える。そして、第１の後方転送ｎＭＯＳトランジスタＱ_i11bのソース電極と第２の後方転送ｎＭＯＳトランジスタＱ_i12bのドレイン電極とを接続する出力ノードは、後方転送コンデンサＣ_i1bに格納されていた信号を第１のＩ／Ｏセレクタ５１２方向に転送するようにセルＭ_i1の後方転送出力端子として機能する。

ビットレベル・セルＭ_i1に接続し且つｉ行の左から２番目に位置する第２のビットレベル・セルＭ_i2は、第１の前方転送遅延素子Ｄ_i21fを介して第１のクロック信号供給線ＣＬ１に接続するドレイン電極、第２の前方転送遅延素子Ｄ_i22fを介してビットレベル・セルＭ_i1の前方転送出力端子に接続するゲート電極を有する第１の前方転送ｎＭＯＳトランジスタＱ_i21fと、第１の前方転送ｎＭＯＳトランジスタＱ_i21fのソース電極に接続するドレイン電極、第１のクロック信号供給線ＣＬ１に接続するゲート電極、接地電位に接続するソース電極を有する第２の前方転送ｎＭＯＳトランジスタＱ_i22fと、第２の前方転送ｎＭＯＳトランジスタＱ_i22fに並列接続され、セルＭ_i2の前方伝搬情報／データを格納する前方転送コンデンサＣ_i2fと、を備える。そして、第１の前方転送ｎＭＯＳトランジスタＱ_i21fのソース電極と第２の前方転送ｎＭＯＳトランジスタＱ_i22fのドレイン電極とを接続する出力ノードは、次段のビットレベル・セルＭ_i3に前方転送コンデンサＣ_i2fに格納されていた信号を転送するようにセルＭ_i2の前方転送出力端子として機能している。第２のビットレベル・セルＭ_i2は、第１の後方遅延素子Ｄ_i21bを介して第２のクロック信号供給線ＣＬ２に接続するドレイン電極、第２の後方遅延素子Ｄ_i22gを介してビットレベル・セルＭ_i3の後方転送出力端子に接続するゲート電極を有する第１の後方転送ｎＭＯＳトランジスタＱ_i21bと、第１の後方転送ｎＭＯＳトランジスタＱ_i21bのソース電極に接続するドレイン電極、第２のクロック信号供給線ＣＬ２に接続するゲート電極、接地電位に接続するソース電極を有する第２の後方転送ｎＭＯＳトランジスタＱ_i22gと、第２の後方転送ｎＭＯＳトランジスタＱ_i22gに並列接続され、セルＭ_i2の後方伝搬情報／データを格納する後方転送コンデンサＣ_i2gと、を更に備える。そして、第１の後方転送ｎＭＯＳトランジスタＱ_i21bのソース電極と第２の後方転送ｎＭＯＳトランジスタＱ_i22gのドレイン電極とを接続する出力ノードは、後方転送コンデンサＣ_i2gに格納されていた信号を次段のビットレベル・セルＭ_i1に転送するようにセルＭ_i2の後方転送出力端子として機能する。

ビットレベル・セルＭ_i2に接続し且つｉ行の左から３番目に位置する第３のビットレベル・セルＭ_i3は、第１の前方転送遅延素子Ｄ_i31fを介して第１のクロック信号供給線ＣＬ１に接続するドレイン電極、第２の前方転送遅延素子Ｄ_i32fを介してビットレベル・セルＭ_i2の前方転送出力端子に接続するゲート電極を有する第１の前方転送ｎＭＯＳトランジスタＱ_i31fと、第１の前方転送ｎＭＯＳトランジスタＱ_i31fのソース電極に接続するドレイン電極、第１のクロック信号供給線ＣＬ１に接続するゲート電極、接地電位に接続するソース電極を有する第２の前方転送ｎＭＯＳトランジスタＱ_i32fと、第２の前方転送ｎＭＯＳトランジスタＱ_i32fに並列接続され、セルＭ_i3の前方伝搬情報／データを格納する前方転送コンデンサＣ_i3fと、を備える。そして、第１の前方転送ｎＭＯＳトランジスタＱ_i31fのソース電極と第２の前方転送ｎＭＯＳトランジスタＱ_i32fのドレイン電極とを接続する出力ノードは、次段のビットレベル・セルＭ_i4（図示を省略）に前方転送コンデンサＣ_i3fに格納されていた信号を転送するようにセルＭ_i3の前方転送出力端子として機能している。第３のビットレベル・セルＭ_i3は、第１の後方遅延素子Ｄ_i31gを介して第２のクロック信号供給線ＣＬ２に接続するドレイン電極、第２の後方遅延素子Ｄ_i32gを介してビットレベル・セルＭ_i4の後方転送出力端子に接続するゲート電極を有する第１の後方転送ｎＭＯＳトランジスタＱ_i31gと、第１の後方転送ｎＭＯＳトランジスタＱ_i31gのソース電極に接続するドレイン電極、第２のクロック信号供給線ＣＬ２に接続するゲート電極、接地電位に接続するソース電極を有する第２の後方転送ｎＭＯＳトランジスタＱ_i32gと、第２の後方転送ｎＭＯＳトランジスタＱ_i32gに並列接続され、セルＭ_i3の後方伝搬情報／データを格納する後方転送コンデンサＣ_i3gと、を更に備える。そして、第１の後方転送ｎＭＯＳトランジスタＱ_i31gのソース電極と第２の後方転送ｎＭＯＳトランジスタＱ_i32gのドレイン電極とを接続する出力ノードは、後方転送コンデンサＣ_i3gに格納されていた信号を次段のビットレベル・セルＭ_i2に転送するようにセルＭ_i3の後方転送出力端子として機能する。

ｉ行の右から２番目に位置する（ｎ−１）番目のビットレベル・セルＭ_i(n-1)は、第１の前方転送遅延素子Ｄ_i(n-1)1fを介して第１のクロック信号供給線ＣＬ１に接続するドレイン電極、第２の前方転送遅延素子Ｄ_i(n-1)2fを介してビットレベル・セルＭ_i(n-2)（図示を省略）の前方転送出力端子に接続するゲート電極を有する第１の前方転送ｎＭＯＳトランジスタＱ_i(n-1)1fと、第１の前方転送ｎＭＯＳトランジスタＱ_i(n-1)1fのソース電極に接続するドレイン電極、第１のクロック信号供給線ＣＬ１に接続するゲート電極、接地電位に接続するソース電極を有する第２の前方転送ｎＭＯＳトランジスタＱ_i(n-1)2fと、第２の前方転送ｎＭＯＳトランジスタＱ_i(n-1)2fに並列接続され、セルＭ_i(n-1)の前方伝搬情報／データを格納する前方転送コンデンサＣ_i(n-1)fと、を備える。そして、第１の前方転送ｎＭＯＳトランジスタＱ_i(n-1)1fのソース電極と第２の前方転送ｎＭＯＳトランジスタＱ_i(n-1)2fのドレイン電極とを接続する出力ノードは、次段のビットレベル・セルＭ_ｉｎに前方転送コンデンサＣ_i(n-1)fに格納されていた信号を転送するようにセルＭ_i(n-1)の前方転送出力端子として機能している。（ｎ−１）番目のビットレベル・セルＭ_i(n-1)は、第１の後方遅延素子Ｄ_i(n-1)1bを介して第２のクロック信号供給線ＣＬ２に接続するドレイン電極、第２の後方遅延素子Ｄ_i(n-1)2bを介して次段のビットレベル・セルＭ_inの後方転送出力端子に接続するゲート電極を有する第１の後方転送ｎＭＯＳトランジスタＱ_i(n-1)1bと、第１の後方転送ｎＭＯＳトランジスタＱ_i(n-1)1bのソース電極に接続するドレイン電極、第２のクロック信号供給線ＣＬ２に接続するゲート電極、接地電位に接続するソース電極を有する第２の後方転送ｎＭＯＳトランジスタＱ_i(n-1)2bと、第２の後方転送ｎＭＯＳトランジスタＱ_i(n-1)2bに並列接続され、セルＭ_i(n-1)の後方伝搬情報／データを格納する後方転送コンデンサＣ_i(n-1)bと、を更に備える。そして、第１の後方転送ｎＭＯＳトランジスタＱ_i(n-1)1bのソース電極と第２の後方転送ｎＭＯＳトランジスタＱ_i(n-1)2bのドレイン電極とを接続する出力ノードは、後方転送コンデンサＣ_i(n-1)bに格納されていた信号を次段のビットレベル・セルＭ_i(n-2)（図示を省略）に転送するようにセルＭ_i(n-1)の後方転送出力端子として機能する。

ｉ行の最右端に位置するｎ番目のビットレベル・セルＭ_inは、第１の前方転送遅延素子Ｄ_in1fを介して第１のクロック信号供給線ＣＬ１に接続するドレイン電極、第２の前方転送遅延素子Ｄ_in2fを介してビットレベル・セルＭ_i(n-1)の前方転送出力端子に接続するゲート電極を有する第１の前方転送ｎＭＯＳトランジスタＱ_in1fと、第１の前方転送ｎＭＯＳトランジスタＱ_in1fのソース電極に接続するドレイン電極、第１のクロック信号供給線ＣＬ１に接続するゲート電極、接地電位に接続するソース電極を有する第２の前方転送ｎＭＯＳトランジスタＱ_in2fと、第２の前方転送ｎＭＯＳトランジスタＱ_in2fに並列接続され、セルＭ_inの前方伝搬情報／データを格納する前方転送コンデンサＣ_infと、を備える。そして、第１の前方転送ｎＭＯＳトランジスタＱ_in1fのソース電極と第２の前方転送ｎＭＯＳトランジスタＱ_in2fのドレイン電極とを接続する出力ノードは、第２のＩ／Ｏセレクタ５１３に前方転送コンデンサＣ_infに格納されていた信号を転送するようにセルＭ_inの前方転送出力端子として機能している。ｎ番目のビットレベル・セルＭ_inは、第１の後方遅延素子Ｄ_in1bを介して第２のクロック信号供給線ＣＬ２に接続するドレイン電極、第２の後方遅延素子Ｄ_in2bを介して第２のＩ／Ｏセレクタ５１３に接続するゲート電極を有する第１の後方転送ｎＭＯＳトランジスタＱ_in1bと、第１の後方転送ｎＭＯＳトランジスタＱ_in1bのソース電極に接続するドレイン電極、第２のクロック信号供給線ＣＬ２に接続するゲート電極、接地電位に接続するソース電極を有する第２の後方転送ｎＭＯＳトランジスタＱ_in2bと、第２の後方転送ｎＭＯＳトランジスタＱ_in2bに並列接続され、セルＭ_inの後方伝搬情報／データを格納する後方転送コンデンサＣ_inbと、を更に備える。そして、第１の後方転送ｎＭＯＳトランジスタＱ_in1bのソース電極と第２の後方転送ｎＭＯＳトランジスタＱ_in2bのドレイン電極とを接続する出力ノードは、後方転送コンデンサＣ_inbに格納されていた信号を次段のビットレベル・セルＭ_i(n-1)に転送するようにセルＭ_inの後方転送出力端子として機能する。

第１のクロック信号供給線ＣＬ１から供給されたクロック信号が“１”の論理レベルになると、第１のメモリユニットＵ_１に割り当てられた第２の前方転送ｎＭＯＳトランジスタＱ_i12fは、前段のクロックサイクルで第１のメモリユニットＵ_１の前方転送コンデンサＣ_i1fに既に格納されていた信号電荷の放電を開始する。そして、第１のクロック信号供給線ＣＬ１から供給された“１”の論理レベルのクロック信号が第２の前方転送ｎＭＯＳトランジスタＱ_i12fに供給され、前方転送コンデンサＣ_i1fに格納されていた信号電荷が“０”の論理レベルになった後に、第１の前方転送ｎＭＯＳトランジスタＱ_i11fは、第１の前方転送遅延素子Ｄ_i11fから決まる遅延時間ｔ_d1だけ遅れて、転送トランジスタとして作動する。その後、ビットレベルの情報／データが第１のＩ／Ｏセレクタ５１２から第１の前方転送ｎＭＯＳトランジスタＱ_i11fのゲート電極に入力すると、第１の前方転送ｎＭＯＳトランジスタＱ_i11fは、情報／データを前方転送コンデンサＣ_i1fに、第２の前方転送遅延素子Ｄ_i12fから決まる遅延時間ｔ_d2だけ遅れて出力する。第１のクロック信号供給線ＣＬ１から供給されたクロック信号は、時刻が(１／２)τ_clockを過ぎたときに“０”の論理レベルになると、第１の前方転送ｎＭＯＳトランジスタＱ_i11fのソース電極と第２の前方転送ｎＭＯＳトランジスタＱ_i12fのドレイン電極とを接続する出力ノードは、第１のＩ／Ｏセレクタ５１２から第１の前方転送ｎＭＯＳトランジスタＱ_i11fに入力する情報／データを、(１／２)τ_clockが過ぎたタイミングでは次段のビットレベル・セルＭ_i2に更に送ることができない。情報／データが、第２の前方転送遅延素子Ｄ_i22fから決まる遅延時間ｔ_d2＝(１／２)τ_clockだけ遅れて、次段の第１の前方転送ｎＭＯＳトランジスタＱ_i21fのゲート電極へ転送されることが阻止されるからである。

第２のクロック信号供給線ＣＬ２から供給されたクロック信号が“１”の論理レベルになると、第２の後方転送ｎＭＯＳトランジスタＱ_i12ｂは、前段のクロックサイクルで後方転送コンデンサＣ_i1bに既に格納されていた信号電荷の放電を開始する。第２のクロック信号供給線ＣＬ２から供給された“１”の論理レベルのクロック信号が供給され、後方転送コンデンサＣ_i1bに格納されていた信号電荷が完全に放電して“０”の論理レベルになった後、第１の後方転送ｎＭＯＳトランジスタＱ_i11bは、第１の後方遅延素子Ｄ_i11bから決まる遅延時間ｔ_d1だけ遅れて、転送トランジスタとして作動する。その後、情報／データがビットレベル・セルＭ_i2の後方転送出力端子から第１の後方転送ｎＭＯＳトランジスタＱ_i11bのゲート電極に送られたとする。情報／データがゲート電極に送られると、第１の後方転送ｎＭＯＳトランジスタＱ_i11bは、前段となるビットレベル・セルＭ_i2に格納されていた情報／データを後方転送コンデンサＣ_i1bに、第２の後方遅延素子Ｄ_i12ｂから決まる遅延時間ｔ_d2だけ更に遅れて送る。第１の後方転送ｎＭＯＳトランジスタＱ_i11bのソース電極と第２の後方転送ｎＭＯＳトランジスタＱ_i12ｂのドレイン電極とを接続する出力ノードは、後方転送コンデンサＣ_i1bに格納されていた情報／データを第１のＩ／Ｏセレクタ５１２に送る。

そして、第１のクロック信号供給線ＣＬ１から供給されたクロック信号が“１”の論理レベルになると、第２のメモリユニットＵ_２に割り当てられた第２の前方転送ｎＭＯＳトランジスタＱ_i22fは、前段のクロックサイクルで第２のメモリユニットＵ_２の前方転送コンデンサＣ_i2fに既に格納されていた信号電荷の放電を開始する。そして、第１のクロック信号供給線ＣＬ１から供給された“１”の論理レベルのクロック信号が第２の前方転送ｎＭＯＳトランジスタＱ_i22fに供給され、前方転送コンデンサＣ_i2fに格納されていた信号電荷が完全に放電して“０”の論理レベルになった後に、第１の前方転送ｎＭＯＳトランジスタＱ_i21fは、第１の前方転送遅延素子Ｄ_i21fから決まる遅延時間ｔ_d1だけ遅れて、転送トランジスタとして作動する。その後、前段の前方転送コンデンサＣ_i1fに格納されていたビットレベルの情報／データが第１の前方転送ｎＭＯＳトランジスタＱ_i21fのゲート電極に送られたとする。ビットレベルの情報／データがゲート電極に送られると、第１の前方転送ｎＭＯＳトランジスタＱ_i21fは、情報／データを前方転送コンデンサＣ_i2fに、第２の前方転送遅延素子Ｄ_i22fから決まる遅延時間ｔ_d2だけ遅れて出力する。第１のクロック信号供給線ＣＬ１から供給されたクロック信号が時刻が(１／２)τ_clockが過ぎたときに“０”の論理レベルになると、第１の前方転送ｎＭＯＳトランジスタＱ_i21fのソース電極と第２の前方転送ｎＭＯＳトランジスタＱ_i22fのドレイン電極とを接続する出力ノードは、第１の前方転送ｎＭＯＳトランジスタＱ_i21fに入力する情報／データを時刻が(１／２)τ_clockが過ぎたタイミングで次段のビットレベル・セルＭ_i3に更に送ることができない。情報／データが、第２の前方転送遅延素子Ｄ_i32fから決まる遅延時間ｔ_d2＝(１／２)τ_clockだけ遅れて、次段の第１の前方転送ｎＭＯＳトランジスタＱ_i31fのゲート電極へ転送されることが阻止されるからである。

第２のクロック信号供給線ＣＬ２から供給されたクロック信号が“１”の論理レベルになると、第２の後方転送ｎＭＯＳトランジスタＱ_i22bは、前段のクロックサイクルで後方転送コンデンサＣ_i2bに既に格納されていた信号電荷の放電を開始する。“１”の論理レベルの第２のクロック信号供給線ＣＬ２から供給されたクロック信号が印加され、後方転送コンデンサＣ_i2bに格納されていた信号電荷が完全に放電して“０”の論理レベルになった後、第１の後方転送ｎＭＯＳトランジスタＱ_i21bは、第１の後方遅延素子Ｄ_i21bから決まる遅延時間ｔ_d1だけ遅れて、転送トランジスタとして作動する。その後、情報／データがビットレベル・セルＭ_i3の後方転送出力端子から第１の後方転送ｎＭＯＳトランジスタＱ_i21bのゲート電極に送られたとする。情報／データがゲート電極に送られると、第１の後方転送ｎＭＯＳトランジスタＱ_i21bは、前段となるビットレベル・セルＭ_i3に格納されていた情報／データを後方転送コンデンサＣ_i2bに、第２の後方遅延素子Ｄ_i22bから決まる遅延時間ｔ_d2だけ更に遅れて送る。第２のクロック信号供給線ＣＬ２から供給したクロック信号が(１／２)τ_clockが過ぎるときに“０”の論理レベルになると、第１の後方転送ｎＭＯＳトランジスタＱ_i21bのソース電極と第２の後方転送ｎＭＯＳトランジスタＱ_i22bのドレイン電極とを接続する出力ノードは、第１の後方転送ｎＭＯＳトランジスタＱ_i21bのゲート電極に入力する情報／データを、(１／２)τ_clockが過ぎたタイミングで、次段のビットレベル・セルＭ_i1に更に送ることができない。情報／データが、第２の後方遅延素子Ｄ_i12ｂから決まる遅延時間ｔ_d2＝(１／２)τ_clockだけ遅れて、次段の後方転送ｎＭＯＳトランジスタＱ_i11bのゲート電極に転送されることが阻止されるからである。

そして、第１のクロック信号供給線ＣＬ１から供給された次のクロック信号が“１”の論理レベルになると、第３のメモリユニットＵ₃に割り当てられた第３の前方転送ｎＭＯＳトランジスタＱ_i32fは、前段のクロックサイクルで第３のメモリユニットＵ₃の前方転送コンデンサＣ_i3fに既に格納されていた信号電荷の放電を開始する。そして、第１のクロック信号供給線ＣＬ１から供給された“１”の論理レベルのクロック信号が第２の前方転送ｎＭＯＳトランジスタＱ_i32fに供給され、前方転送コンデンサＣ_i3fに格納されていた信号電荷が完全に放電して“０”の論理レベルになった後に、第１の前方転送ｎＭＯＳトランジスタＱ_i31fは、第１の前方転送遅延素子Ｄ_i31fから決まる遅延時間ｔ_d1だけ遅れて、転送トランジスタとして作動する。その後、前段の前方転送コンデンサＣ_i2fに格納されていたビットレベルの情報／データが第１の前方転送ｎＭＯＳトランジスタＱ_i31fのゲート電極に送られたとする。ビットレベルの情報／データがゲート電極に送られると、第１の前方転送ｎＭＯＳトランジスタＱ_i31fは、情報／データを前方転送コンデンサＣ_i3fに、第２の前方転送遅延素子Ｄ_i32fから決まる遅延時間ｔ_d2だけ遅れて出力する。第１のクロック信号供給線ＣＬ１から供給されたクロック信号が(１／２)τ_clockが過ぎたときに“０”の論理レベルになると、第１の前方転送ｎＭＯＳトランジスタＱ_i31fのソース電極と第２の前方転送ｎＭＯＳトランジスタＱ_i32fのドレイン電極とを接続する出力ノードは、第１の前方転送ｎＭＯＳトランジスタＱ_i31fのゲート電極に入力する情報／データを、時刻が(１／２)τ_clockが過ぎたタイミングでは次段のビットレベル・セルＭ_i4（図示を省略）に更に送ることができない。情報／データが、第２の前方転送遅延素子Ｄ_i4２ｆ（図示を省略）から決まる遅延時間ｔ_d2＝(１／２)τ_clockだけ遅れて、次段の第１の前方転送ｎＭＯＳトランジスタＱ_i4１ｆ（図示を省略）のゲート電極へ転送されることが阻止されるからである。

第２のクロック信号供給線ＣＬ２から供給されたクロック信号が“１”の論理レベルになると、第２の後方転送ｎＭＯＳトランジスタＱ_i32bは、前段のクロックサイクルで後方転送コンデンサＣ_13bに既に格納されていた信号電荷の放電を開始する。“１”の論理レベルの第２のクロック信号供給線ＣＬ２から供給されたクロック信号が印加され、後方転送コンデンサＣ_i32bに格納されていた信号電荷が完全に放電して“０”の論理レベルになった後、第１の後方転送ｎＭＯＳトランジスタＱ_i31bは、第１の後方遅延素子Ｄ_i31bから決まる遅延時間ｔ_d1だけ遅れて、転送トランジスタとして作動する。その後、情報／データがビットレベル・セルＭ_i3の後方転送出力端子から第１の後方転送ｎＭＯＳトランジスタＱ_i31bのゲート電極に送られたとする。情報／データがゲート電極に送られると、第１の後方転送ｎＭＯＳトランジスタＱ_i31bは、前段のビットレベル・セルＭ_i3に格納されていた情報／データを後方転送コンデンサＣ_13bに、第２の後方遅延素子Ｄ_i32bから決まる遅延時間ｔ_d2だけ更に遅れて送る。第２のクロック信号供給線ＣＬ２から供給したクロック信号は、時刻が(１／２)τ_clockが過ぎるときに“０”の論理レベルになると、第１の後方転送ｎＭＯＳトランジスタＱ_i31bのソース電極と第２の後方転送ｎＭＯＳトランジスタＱ_i32bのドレイン電極とを接続する出力ノードは、第１の後方転送ｎＭＯＳトランジスタＱ_i31bのゲート電極に入力する情報／データを、時刻が(１／２)τ_clockが過ぎたタイミングで、次段のビットレベル・セルＭ_i2に更に送ることができない。情報／データが、第２の後方遅延素子Ｄ_i22bから決まる遅延時間ｔ_d2＝(１／２)τ_clockだけ遅れて、次段の後方転送ｎＭＯＳトランジスタＱ_i21bのゲート電極に転送されることが阻止されるからである。

そして、第１のクロック信号供給線ＣＬ１から供給された次のクロック信号が“１”の論理レベルになると、第３のメモリユニットＵ_(n-1)に割り当てられた第２の前方転送ｎＭＯＳトランジスタＱ_i(n-1)2fは、前段のクロックサイクルで第３のメモリユニットＵ_(n-1)の前方転送コンデンサＣ_i(n-1)fに既に格納されていた信号電荷の放電を開始する。そして、第１のクロック信号供給線ＣＬ１から供給された“１”の論理レベルのクロック信号が第２の前方転送ｎＭＯＳトランジスタＱ_i(n-1)2fに供給され、前方転送コンデンサＣ_i(n-1)fに格納されていた信号電荷が完全に放電して“０”の論理レベルになった後に、第１の前方転送ｎＭＯＳトランジスタＱ_i(n-1)1fは、第１の前方転送遅延素子Ｄ_i(n-1)1fから決まる遅延時間ｔ_d1だけ遅れて、転送トランジスタとして作動する。その後、前段の前方転送コンデンサに格納されていたビットレベルの情報／データが第１の前方転送ｎＭＯＳトランジスタＱ_i(n-1)1fのゲート電極に送られたとする。ビットレベルの情報／データがゲート電極に送られると、第１の前方転送ｎＭＯＳトランジスタＱ_i(n-1)1fは、情報／データを前方転送コンデンサＣ_i(n-1)fに第２の前方転送遅延素子Ｄ_i(n-1)2fから決まる遅延時間ｔ_d2だけ遅れて出力する。第１のクロック信号供給線ＣＬ１から供給されたクロック信号は時刻が(１／２)τ_clockを過ぎたときに“０”の論理レベルになると、第１の前方転送ｎＭＯＳトランジスタＱ_i(n-1)1fのソース電極と第２の前方転送ｎＭＯＳトランジスタＱ_i(n-1)2fのドレイン電極とを接続する出力ノードは、第１の前方転送ｎＭＯＳトランジスタＱ_i(n-1)1fのゲート電極に入力する情報／データを、時刻が(１／２)τ_clockを過ぎたタイミングでは次段のビットレベル・セルＭ_inに更に送ることができない。情報／データを、第２の前方転送遅延素子Ｄin_2fから決まる遅延時間ｔ_d2＝(１／２)τ_clockだけ遅れて、次段の第１の前方転送ｎＭＯＳトランジスタＱ_in1fのゲート電極へ転送することが阻止されるからである。

第２のクロック信号供給線ＣＬ２から供給されたクロック信号が“１”の論理レベルになると、第２の後方転送ｎＭＯＳトランジスタＱ_i(n-1)2bは、前段のクロックサイクルで後方転送コンデンサＣ_i(n-1)bに既に格納されていた信号電荷の放電を開始する。“１”の論理レベルの第２のクロック信号供給線ＣＬ２から供給されたクロック信号が印加され、後方転送コンデンサＣ_i(n-1)2bに格納されていた信号電荷が完全に放電して“０”の論理レベルになった後、第１の後方転送ｎＭＯＳトランジスタＱ_i(n-1)1bは、第１の後方遅延素子Ｄ_i(n-1)1bから決まる遅延時間ｔ_d1だけ遅れて、転送トランジスタとして作動する。その後、情報／データがビットレベル・セルＭ_i(n-1)の後方転送出力端子から第１の後方転送ｎＭＯＳトランジスタＱ_i(n-1)1bのゲート電極に送られたとする。情報／データがゲート電極に送られると、第１の後方転送ｎＭＯＳトランジスタＱ_i(n-1)1bは、前段のビットレベル・セルＭ_i(n-1)に格納されていた情報／データを後方転送コンデンサＣ_i(n-1)bに、第２の後方遅延素子Ｄ_i(n-1)2bから決まる遅延時間ｔ_d2だけ更に遅れて送る。第２のクロック信号供給線ＣＬ２から供給されたクロック信号は、時刻が(１／２)τ_clockを過ぎるときに“０”の論理レベルになると、第１の後方転送ｎＭＯＳトランジスタＱ_i(n-1)1bのソース電極と第２の後方転送ｎＭＯＳトランジスタＱ_i(n-1)2bのドレイン電極とを接続する出力ノードが、第１の後方転送ｎＭＯＳトランジスタＱ_i(n-1)1bのゲート電極に入力する情報／データを、時刻が(１／２)τ_clockを過ぎたタイミングで、次段のビットレベル・セルＭ_i(n-2)（図示を省略）に更に送ることができないからである。情報／データが、第２の後方遅延素子Ｄ_i(n-2)2b（図示を省略）から決まる遅延時間ｔ_d2＝(１／２)τ_clockだけ遅れて、次段の後方転送ｎＭＯＳトランジスタＱ_i(n-2)1b（図示を省略）のゲート電極に転送されることが阻止されるからである。

そして、第１のクロック信号供給線ＣＬ１から供給された次のクロック信号が“１”の論理レベルになると、第３のメモリユニットＵ_ｎに割り当てられた第２の前方転送ｎＭＯＳトランジスタＱ_in2fは、前段のクロックサイクルで第３のメモリユニットＵ_ｎの前方転送コンデンサＣ_infに既に格納されていた信号電荷の放電を開始する。そして、第１のクロック信号供給線ＣＬ１から供給された“１”の論理レベルのクロック信号が第２の前方転送ｎＭＯＳトランジスタＱ_in2fに印加され、前方転送コンデンサＣ_infに格納されていた信号電荷が完全に放電して“０”の論理レベルになった後に、第１の前方転送ｎＭＯＳトランジスタＱ_in1fは、第１の前方転送遅延素子Ｄ_in1fから決まる遅延時間ｔ_d1だけ遅れて、転送トランジスタとして作動する。その後、前段の前方転送コンデンサＣ_i2fに格納されていたビットレベルの情報／データが第１の前方転送ｎＭＯＳトランジスタＱ_in1fのゲート電極に送られたとする。ビットレベルの情報／データがゲート電極に送られると、第１の前方転送ｎＭＯＳトランジスタＱ_in1fは、情報／データを前方転送コンデンサＣ_infに、第２の前方転送遅延素子Ｄ_in2fから決まる遅延時間ｔ_d2だけ遅れて出力する。第１の前方転送ｎＭＯＳトランジスタＱ_in1fのソース電極と第２の前方転送ｎＭＯＳトランジスタＱ_in2fのドレイン電極とを接続する出力ノードは、第１の前方転送ｎＭＯＳトランジスタＱ_in1fのゲート電極に入力する情報／データを、第２のＩ／Ｏセレクタ５１３に出力する。

第２のクロック信号供給線ＣＬ２から供給されたクロック信号が“１”の論理レベルになると、第２の後方転送ｎＭＯＳトランジスタＱ_in2bは、前段のクロックサイクルで後方転送コンデンサＣ_inbに既に格納されていた信号電荷の放電を開始する。“１”の論理レベルの第２のクロック信号供給線ＣＬ２から供給されたクロック信号が印加され、後方転送コンデンサＣ_inbに格納されていた信号電荷が完全に放電して“０”の論理レベルになった後、第１の後方転送ｎＭＯＳトランジスタＱ_in1bは、第１の後方遅延素子Ｄ_in1bから決まる遅延時間ｔ_d1だけ遅れて、転送トランジスタとして作動する。その後、情報／データが第２のＩ／Ｏセレクタ５１３から第１の後方転送ｎＭＯＳトランジスタＱ_in1bのゲート電極に送られたとする。情報／データがゲート電極に送られると、第１の後方転送ｎＭＯＳトランジスタＱ_in1bは、第２のＩ／Ｏセレクタ５１３から受信した情報／データを、後方転送コンデンサＣ_inbに、第２の後方遅延素子Ｄ_in2bから決まる遅延時間ｔ_d2だけ更に遅れて送る。第２のクロック信号供給線ＣＬ２から供給されたクロック信号は時刻が(１／２)τ_clockを過ぎるときに“０”の論理レベルになると、第１の後方転送ｎＭＯＳトランジスタＱ_in1bのソース電極と第２の後方転送ｎＭＯＳトランジスタＱ_in2bのドレイン電極とを接続する出力ノードは、第１の後方転送ｎＭＯＳトランジスタＱ_in1bのゲート電極に入力する情報／データを、時刻が(１／２)τ_clockを過ぎたタイミングで、次段のビットレベル・セルＭ_i(n-1)に更に送ることができない。情報／データが、第２の後方遅延素子Ｄ_i(n-1)2bから決まる遅延時間ｔ_d2＝(１／２)τ_clockだけ遅れて、次段の後方転送ｎＭＯＳトランジスタＱ_i(n-1)1bのゲート電極に転送されることが阻止されるからである。

したがって、図３２に示す双方向マーチング主記憶装置では、双方向マーチング主記憶装置のｉ行のセルＭ_i1、Ｍ_i2、Ｍ_i3、-----、Ｍ_i,n-1、Ｍ_i,nのそれぞれが、情報／データを格納し、第１のＩ／Ｏセレクタ５１２と第２のＩ／Ｏセレクタ５１３の間で、ステップごとに、第１のクロック信号供給線ＣＬ１と第２のクロック信号供給線ＣＬ２から、それぞれ、供給されたクロック信号と同期して、情報／データを双方向に転送する。既に述べたように、セルＭ_i1、Ｍ_i2、Ｍ_i3、-----、Ｍ_i,n-1、Ｍ_i,nのそれぞれが、メモリユニットＵ_１、Ｕ_２、Ｕ_２、-----、Ｕ_n-1、Ｕ_ｎに、それぞれ割り当てられ、且つ、メモリユニットＵ_２、Ｕ_２、-----、Ｕ_n-1、Ｕ_ｎは、メモリユニットＵ_２、Ｕ_２、-----、Ｕ_n-1、Ｕ_ｎに、それぞれ割り当てられたビットレベル・セルの１次元配列にそれぞれバイト・サイズ又はワード・サイズの情報を格納するので、図３２に示す双方向のマーチング主記憶装置３１は、バイト・サイズ又はワード・サイズの情報／データを、セルＵ_１、Ｕ_２、Ｕ_２、-----、Ｕ_n-1、Ｕ_ｎのそれぞれに格納し、バイト・サイズ又はワード・サイズの情報／データを、クロック信号に同期し、互いに横一列に並んで、第１のＩ／Ｏセレクタ５１２と第２のＩ／Ｏセレクタ５１３の間で、前方方向及び／又は反対方向（後方向）に双方向に転送するのでバイト・サイズ又はワード・サイズの格納されていた情報／データが能動的且つ逐次的にプロセッサ１１に提供され、ＡＬＵ１１２は、格納されていた情報により演算論理動作を実行できる。

図３３に示すように、前方転送分離トランジスタＱ_i23fは、第２のメモリユニットＵ_ｎに割り当てられた２番目のビットレベル・セルＭ_i2の信号格納状態を、第１のメモリユニットＵ_１に割り当てられた第１のビットレベル・セルＭ_i1の信号格納状態から分離するために設けられ、前方転送分離トランジスタＱ_i23fは、信号を、第１のビットレベル・セルＭ_i1から２番目のビットレベル・セルＭ_i2に、第１のクロック信号供給線ＣＬ１を介して供給されるクロック信号が決める所定のタイミングで前方に転送する。そして、後方転送分離トランジスタＱ_i13bは、第１のメモリユニットＵ_１に割り当てられた第１のビットレベル・セルＭ_i1の信号格納状態を、第２のメモリユニットＵ_２に割り当てられた２番目のビットレベル・セルＭ_i2の信号格納状態から分離するために設けられ、後方転送分離トランジスタＱ_i13bは、信号を、２番目のビットレベル・セルＭ_i2から第１のビットレベル・セルＭ_i1に、第２のクロック信号供給線ＣＬ２を介して供給されるクロック信号が決める所定のタイミングで後方に転送する。すると、メモリユニットＵ_１及びメモリユニットＵ_２に平行にそれぞれ配列された前方転送分離トランジスタＱ_i23f（ｉ＝１〜ｍ；“ｍ”はバイト・サイズ又はワード・サイズに対応する整数）の１次元配列は、第１のクロック信号供給線ＣＬ１を介して供給されたクロック信号の制御のもとで、バイト・サイズ又はワード・サイズの情報を前方に転送するので、バイト・サイズ又はワード・サイズの情報を、前方方向に沿って同じ歩調で隊列を整えて行進することができる。そして、メモリユニットＵ_１及びメモリユニットＵ_２に平行にそれぞれ配列された後方転送分離トランジスタＱ_i13b（ｉ＝１〜ｍ）の１次元配列は、バイト・サイズ又はワード・サイズの情報を、第２のクロック信号供給線ＣＬ２を介して供給されたクロック信号の制御のもとで後方に転送するので、バイト・サイズ又はワード・サイズの情報は、後方向に沿って同じ歩調で隊列を整えて行進することができる。

そして、同様に、後方転送分離トランジスタＱ_i23bは、第２のメモリユニットＵ_２に割り当てられた２番目のビットレベル・セルＭ_i2の信号格納状態を、第３のメモリユニットＵ₃に割り当てられた第３のビットレベル・セルＭ_i3（図示を省略）の信号格納状態から分離するために設けられている。後方転送分離トランジスタＱ_i23bは、信号を、第３のビットレベル・セルＭ_i3から２番目のビットレベル・セルＭ_i2に、第３のクロック信号供給線ＣＬ２を介して供給されるクロック信号が決める所定のタイミングで後方に転送する。そして、メモリユニットＵ_２及びメモリユニットＵ_２に平行にそれぞれ配列された後方転送分離トランジスタＱ_i23b（ｉ＝１〜ｍ）の１次元配列は、クロック信号供給線ＣＬ２を介して供給されたクロック信号の制御のもとで、バイト・サイズ又はワード・サイズの情報を後方に転送するので、バイト・サイズ又はワード・サイズの情報は、後方方向に沿って同じ歩調で隊列を整えて行進することができる。

更に、図３３に示すように、前方転送分離トランジスタＱ_i(n-1)3fは、（ｎ−１）番目のメモリユニットＵ_n-1に割り当てられた（ｎ−１）番目のビットレベル・セルＭ_i(n-1)の信号格納状態を、（ｎ−２）番目のメモリユニットＵ_ｎ−２（図示を省略）の（ｎ−２）番目のビットレベル・セルＭ_in−２（図示を省略）の信号格納状態から分離するために設けられている。前方転送分離トランジスタＱ_i(n-1)3fは、信号を、（ｎ−２）番目のビットレベル・セルＭ_i(n-2)から（ｎ−１）番目のビットレベル・セルＭ_i(n-1)に、第１のクロック信号供給線ＣＬ１を介して供給されるクロック信号が決める所定のタイミングで前方に転送する。すると、メモリユニットＵ_ｎ−２及びメモリユニットＵ_n-1に平行にそれぞれ配列された前方転送分離トランジスタＱ_i(n-1)3f（ｉ＝１〜ｍ）の１次元配列は、クロック信号供給線ＣＬ１を介して供給されたクロック信号の制御のもとで、バイト・サイズ又はワード・サイズの情報を転送するので、バイト・サイズ又はワード・サイズの情報は、前方方向に沿って、同じ歩調で隊列を整えて行進することができる。

そして、前方転送分離トランジスタＱ_in3fは、ｎ番目のメモリユニットＵ_ｎに割り当てられたｎ番目のビットレベル・セルＭ_inの信号格納状態を、（ｎ−１）番目のメモリユニットＵ_n-1に割り当てられた（ｎ−１）番目のビットレベル・セルＭ_i,(n-1)の信号格納状態から分離するために設けられている。前方転送分離トランジスタＱ_in3fは、信号を、（ｎ−１）番目のビットレベル・セルＭ_i,(n-1)からｎ番目のビットレベル・セルＭ_inに、第１のクロック信号供給線ＣＬ１を介して供給されるクロック信号が決める所定のタイミングで前方に転送する。そして、後方転送分離トランジスタＱ_in3bは、（ｎ−１）番目のメモリユニットＵ_n-1に割り当てられた（ｎ−１）番目のビットレベル・セルＭ_i,(n-1)の信号格納状態を、ｎ番目のメモリユニットＵ_ｎに割り当てられたｎ番目のビットレベル・セルＭ_inの信号格納状態から分離するために設けられている。後方転送分離トランジスタＱ_in3bは、信号を、ｎ番目のビットレベル・セルＭ_inから（ｎ−１）番目のビットレベル・セルＭ_i,(n-1)に、第２のクロック信号供給線ＣＬ２を介して供給されるクロック信号が決める所定のタイミングで後方に転送する。すると、メモリユニットＵ_n-1及びメモリユニットＵ_ｎに平行にそれぞれ配列された前方転送分離トランジスタＱ_in3f（ｉ＝１〜ｍ）の１次元配列は、クロック信号供給線ＣＬ１を介して供給されたクロック信号の制御のもとで、バイト・サイズ又はワード・サイズの情報を転送するので、バイト・サイズ又はワード・サイズの情報は、前方方向に沿って同じ歩調で隊列を整えて行進することができる。そして、メモリユニットＵ_n-1及びメモリユニットＵ_ｎに平行にそれぞれ配列された後方転送分離トランジスタＱ_in3b（ｉ＝１〜ｍ）の１次元配列は、バイト・サイズ又はワード・サイズの情報を、クロック信号供給線ＣＬ２を介して供給されたクロック信号の制御のもとで転送するので、バイト・サイズ又はワード・サイズの情報は、後方向に沿って同じ歩調で隊列を整えて行進することができる。

図３２及び図３３に示す双方向マーチング主記憶装置の構成で、前方転送コンデンサＣ_ijfと後方転送コンデンサＣ_ijbは、高い局在性でランダムアクセス・モードを形成するために、好ましくは単一の共通コンデンサに併合できる。図３４は、双方向マーチング主記憶装置３１のゲートレベル表現において、ｍ×ｎ（ここで、“ｍ”はワード・サイズから決まる整数）のｉ行のアレイを示しており、図３１（ａ）〜（ｃ）に示す双方向形態でランダムアクセス・モードを実現できる。

図３４に示すように、２種類のマーチングＡＮＤゲートが、ランダムアクセス・モードで情報／データの双方向転送を構築するために、ｉ行のセルＭ_i1、Ｍ_i2、Ｍ_i3、-----、Ｍ_ｉ,(n-1)、Ｍ_i,nのそれぞれに割り当てられている。双方向マーチング主記憶装置３１は、ビットレベルの情報／データをセルＭ_i1、Ｍ_i2、Ｍ_i3、-----、Ｍ_i,n-1、Ｍ_i,nのそれぞれに格納し、情報／データをクロック信号と同期して、前方向及び／又は反対方向（後方向）でステップごとに、第１のＩ／Ｏセレクタ５１２と第２のＩ／Ｏセレクタ５１３の間で双方向に転送する。

図３４に示すマーチング主記憶装置３１を形成するセルＭ_i1、Ｍ_i2、Ｍ_i3、-----、Ｍ_i,n-1、Ｍ_i,nのゲートレベル表現において、ｉ行の最左端に配置され第１のＩ／Ｏセレクタ５１２に接続する１番目のビットレベル・セルＭ_i1は、情報／データを格納する共通コンデンサＣ_i1と、共通コンデンサＣ_i1に接続する一方の入力端子、第１のクロック信号供給線ＣＬ１に接続される他方の入力端子、ｉ行で隣接する２番目のビットレベル・セルＭ（ｉ＋１）１に設けた次段の前方転送マーチングＡＮＤゲートＧ_i2fの一方の入力端子に接続した出力端子を有する前方転送マーチングＡＮＤゲートＧ_i1fと、共通コンデンサＣ_i1に接続する一方の入力端子、第２のクロック信号供給線ＣＬ２に接続される他方の入力端子、第１のＩ／Ｏセレクタ５１２に接続する出力端子を有する後方転送マーチングＡＮＤゲートＧ_i1bとを含んでいる。

前方データ流を駆動する第１のクロック信号供給線ＣＬ１と後方データ流を駆動する第２のクロック信号供給線ＣＬ２は、クロック・セレクタ５１１によって、それぞれ、選択される。第１のクロック信号供給線ＣＬ１と第２のクロック信号供給線ＣＬ２のそれぞれは、“１”と“０”の論理値を出力する。第１のクロック信号供給線ＣＬ１の“１”の論理値が前方転送マーチングＡＮＤゲートＧ_i1の他方の入力端子に送られると、共通コンデンサＣ_i1に格納されていた情報／データは、隣接する２番目のビットレベル・セルＭ_i2に配置した共通コンデンサＣ_i2に転送される。共通コンデンサＣ_i2は情報／データを格納する。

双方向マーチング主記憶装置３１のｉ行に割り当てられた２番目のビットレベル・セルＭ_i2は、情報／データを格納する共通コンデンサＣ_i2と、共通コンデンサＣ_i2に接続する一方の入力端子、第１のクロック信号供給線ＣＬ１に接続される他方の入力端子、ｉ行において隣接する第３のビットレベル・セルＭ_i3に設けた次段の前方転送マーチングＡＮＤゲートＧ_i3の一方の入力端子に接続する出力端子を有する前方転送マーチングＡＮＤゲートＧ_i2fと、共通コンデンサＣ_i2に接続する一方の入力端子、第２のクロック信号供給線ＣＬ２に接続した他方の入力端子、ｉ行では左から数えると先行した位置になる後方転送マーチングＡＮＤゲートＧ_i1の一方の入力端子に接続した出力端子を有する後方転送マーチングＡＮＤゲートＧ_i2bとを含んでいる。

同様に、ｉ行の３番目のビットレベル・セルＭ_i3は、情報／データを格納する共通コンデンサＣ_i3と、共通コンデンサＣ_i3に接続する一方の入力端子、第１のクロック信号供給線ＣＬ１に接続した他方の入力端子、４番目のビットレベル・セルの図示は省略しているが、隣接する４番目のビットレベル・セルに配置された次段の前方転送マーチングＡＮＤゲートの一方の入力端子に接続した出力端子を有する前方転送マーチングＡＮＤゲートＧ_i3fと、共通コンデンサＣ_i3に接続する一方の入力端子、第２のクロック信号供給線ＣＬ２に接続した他方の入力端子、隣接する２番目のビットレベル・セルＭ_i2に配置され、ｉ行では左から数えると先行した位置になる後方転送マーチングＡＮＤゲートＧ_i2bの一方の入力端子に接続した出力端子を有する後方転送マーチングＡＮＤゲートＧ_13bとを含んでいる。したがって、第１のクロック信号供給線ＣＬ１の“１”の論理値が前方転送マーチングＡＮＤゲートＧ_i2fの他方の入力端子に送られると、共通コンデンサＣ_i2格納されていた情報／データは、３番目のビットレベル・セルＭ_i3に配置した共通コンデンサＣ_i3に転送され、共通コンデンサＣ_i3は情報／データを格納する。第１のクロック信号供給線ＣＬ１の“１”の論理値が前方転送マーチングＡＮＤゲートＧ_i13fの他方の入力端子に送られると、共通コンデンサＣ_i3に格納されていた情報／データが、４番目のビットレベル・セルに配置したコンデンサに転送される。

更に、ｉ行の（ｎ−１）番目のビットレベル・セルＭ_ｉ,(n-1)は、情報／データを格納する共通コンデンサＣ_ｉ,(n-1)と、共通コンデンサＣ_ｉ,(n-1)に接続する一方の入力端子、第１のクロック信号供給線ＣＬ１に接続される他方の入力端子、ｉ行の最右端に配置され第２のＩ／Ｏセレクタ５１３に接続され、ビットレベル・セルＭ_ｉ,(n-1)に隣接のｎ番目のビットレベル・セルＭ_i,nに配置された次段の前方転送マーチングＡＮＤゲートＧ_i,nfの一方の入力端子に接続した出力端子を有する前方転送マーチングＡＮＤゲートＧ_i,(n-1)fと、共通コンデンサＣ_ｉ,(n-1)に接続する一方の入力端子、第２のクロック信号供給線ＣＬ２に接続される他方の入力端子、右から数えると３番目となる隣接するビットレベル・セルＭ_i,(n-2)b（図示を省略）に配置され、ｉ行では左から数えると先行した位置になる後方転送マーチングＡＮＤゲートＧ_i,(n-2)bの一方の入力端子に接続した出力端子を有する後方転送マーチングＡＮＤゲートＧ_ｉ,(n-1)ｂとを含んでいる。

ｉ行の最右端に配置され第２のＩ／Ｏセレクタ５１３に接続されたｎ番目のビットレベル・セルＭ_i,nは、情報／データを格納する共通コンデンサＣ_i,nと、共通コンデンサＣ_i,nに接続する一方の入力端子、第２のクロック信号供給線ＣＬ２に接続される他方の入力端子、ｉ行において（ｎ−１）番目の隣接するビットレベル・セルＭ_i,n-1に配置され、ｉ行では左から数えると先行した位置になる後方転送マーチングＡＮＤゲートＧ_i(n-1)bの一方の入力端子に接続した出力端子を有する後方転送マーチングＡＮＤゲートＧ_i1nbと、共通コンデンサＣ_i,nに接続する一方の入力端子、第１のクロック信号供給線ＣＬ１に接続される他方の入力端子、及び第２のＩ／Ｏセレクタ５１３に接続する出力端子を有する前方転送マーチングＡＮＤゲートＧ_i,nfと、を含んでいる。

第２のクロック信号供給線ＣＬ２の“１”の論理値が後方転送マーチングＡＮＤゲートＧ_inbの他方の入力端子に送られると、共通コンデンサＣ_inに格納されていた情報／データは、ｉ行において（ｎ−１）番目の隣接するビットレベル・セルＭ_ｉ,(n-1)に配置した共通コンデンサＣ_ｉ,(n-1)に転送され、共通コンデンサＣ_ｉ,(n-1)が情報／データを格納する。同様に、第２のクロック信号供給線ＣＬ２の“１”の論理値が後方転送マーチングＡＮＤゲートＧ_i13bの他方の入力端子に送られると、共通コンデンサＣ_i3に格納されていた情報／データが、２番目のビットレベル・セルＭ_i2に配置した共通コンデンサＣ_i2に転送され、共通コンデンサＣ_i2が情報／データを格納する。更に、第２のクロック信号供給線ＣＬ２の“１”の論理値が後方転送マーチングＡＮＤゲートＧ_i2bの他方の入力端子に送られると、共通コンデンサＣ_i2に格納されていた情報／データは、左から１番目のビットレベル・セルＭ_i1に配置した共通コンデンサＣ_i1に転送され、共通コンデンサＣ_i1が情報／データを格納する。第２のクロック信号供給線ＣＬ２の“１”の論理値が後方転送マーチングＡＮＤゲートＧ_i1bの他方の入力端子に送られると、共通コンデンサＣ_i1に格納されていた情報／データが第１のＩ／Ｏセレクタ５１２に転送される。

したがって、双方向マーチング主記憶装置のｉ行のセルＭ_i1、Ｍ_i2、Ｍ_i3、-----、Ｍ_ｉ,(n-1)、Ｍ_i,nのそれぞれが、情報／データを格納し、情報／データを、第１のクロック信号供給線ＣＬ１と第２のクロック信号供給線ＣＬ２からそれぞれ供給されたクロック信号と同期して、ステップごとに、第１のＩ／Ｏセレクタ５１２と第２のＩ／Ｏセレクタ５１３の間で双方向に転送する。セルＭ_i1、Ｍ_i2、Ｍ_i3、-----、Ｍ_i,n-1、Ｍ_i,nのそれぞれがメモリユニットＵ_１、Ｕ_２、Ｕ_２、-----、Ｕ_n-1、Ｕ_ｎにそれぞれ割り当てられていて、メモリユニットＵ_２、Ｕ_２、-----、Ｕ_n-1、Ｕ_ｎが、メモリユニットＵ_２、Ｕ_２、-----、Ｕ_n-1、Ｕ_ｎにそれぞれ１次元配列されたビットレベル・セルに、それぞれバイト・サイズ又はワード・サイズの情報を格納を格納している。図３４に示す双方向マーチング主記憶装置３１は、バイト・サイズ又はワード・サイズの情報をセルＵ_１、Ｕ_２、Ｕ_２、-----、Ｕ_n-1、Ｕ_ｎのそれぞれに格納し、バイト・サイズ又はワード・サイズの情報／データを、クロック信号に同期して、同じ歩調で、第１のＩ／Ｏセレクタ５１２と第２のＩ／Ｏセレクタ５１３の間で前方向及び／又は反対方向（後方向）に双方向で転送するので、バイト・サイズ又はワード・サイズの格納情報が能動的且つ逐次的にプロセッサ１１に提供され、ＡＬＵ１１２は、格納されていた情報／データにより演算論理動作を実行できる。

（位置指定法）
図３５（ａ）は、プロセッサに隣接する１次元マーチング主記憶装置の命令の双方向転送モードを示しており、命令は、プロセッサに向けて移動したり、次段の記憶装置から出たり、次段の記憶装置に向かったりしている。図３５（ｂ）は、ＡＬＵ１１２に隣接する１次元マーチング主記憶装置のスカラデータの双方向転送モードを示す。スカラデータは、ＡＬＵに向けて移動したり、次段の記憶装置から出たり、次段の記憶装置に向かったりしている。図３５（ｃ）は、後述する第３の実施形態で説明される、パイプライン１１７に隣接する１次元マーチング主記憶装置におけるベクトル／ストリーミング・データの単一方向転送モードを示す。ベクトル／ストリーミング・データは、パイプライン１１７に向けて移動したり、次段の記憶装置から出たり、次段の記憶装置に向かったりしている。

第１の実施形態に係る計算機システムに用いるマーチング主記憶装置３１は、ベクトル／ストリーミング・データにおいて、連続するメモリユニットＵ_１、Ｕ_２、Ｕ_２、……、Ｕ_n-1、Ｕ_ｎのセットの始点と終点とを識別するために、位置指定機能を用いる。他方で、プログラムとスカラデータとに対して、それぞれアイテムは、従来のアドレスと同様の位置インデックスを有していなければならない。図３６（ａ）は、すべてのメモリユニットＵ_１、Ｕ_２、Ｕ_２、……、Ｕ_n-1、Ｕ_ｎが、アドレスＡ_１、Ａ_２、Ａ_３、……、Ａ_n-1、Ａ_ｎによりラベル表示されている従来型主記憶装置の構成を示す。図３６（ｂ）は、１次元マーチング主記憶装置の構成を示している。マーチング主記憶装置においては、個々のメモリユニットＵ_１、Ｕ_２、Ｕ_２、……、Ｕ_n-1、Ｕ_ｎの位置指定機能は、常には、必ずしも必要ではないものであるが、ベクトル／ストリーミング・データにおいて連続するメモリユニットのセットの始点と終点とを識別するためには、個々のメモリユニットＵ_１、Ｕ_２、Ｕ_２、……、Ｕ_n-1、Ｕ_ｎの位置指定機能が少なくとも必要になる。図３７（ａ）は、本発明の１次元マーチング主記憶装置の内部構成を示す。本発明の１次元マーチング主記憶装置では、従来の計算機システムに用いられているアドレスのような位置インデックスはスカラ命令Ｉ_ｓに必要でないが、個々のメモリユニットの位置指定機能は、斜線を付した円で示すように、ベクトル命令Ｉ_ｖで連続するメモリユニットのセットの始点と終点を識別するために少なくとも必要である。図３７（ｂ）は、本発明の１次元マーチング主記憶装置の内部構成を示し、位置インデックスはスカラデータ”ｂ”と”ａ”に対して必要でない。しかし、図３７（ｃ）に示すように、位置インデックスは、斜線を付した円で示すように、ベクトル／ストリーミング・データ”ｏ”、”ｐ”、”ｑ”、”ｒ”、”ｓ”、”ｔ”、……で連続するメモリユニットのセットの始点と終点を識別するために少なくとも必要である。

第１の実施形態に係る計算機システムに用いる「マーチング記憶装置ファミリ」は、次の第２の実施形態で説明するＡＬＵ１１２に接続したマーチング命令レジスタ・ファイル２２ａ及びマーチング・データレジスタ・ファイル２２ｂと、後述する第３の実施形態で説明するマーチング命令キャッシュメモリ２１ａ及びマーチング・データキャッシュメモリ２１ｂとを、マーチング主記憶装置３１の他に含む。マーチング記憶装置ファミリにおいて、主記憶装置、レジスタ・ファイル及びキャッシュメモリとの間の関係には、基準となる局在性の特性に基づく、それらの主記憶装置、レジスタ・ファイル及びキャッシュメモリ自体の位置指定法がある。

図３８（ａ）は、ベクトル／ストリーミング・データの場合に複数のページＰ_i-1,j-1、Ｐ_i,j-1、Ｐ_i+1,j-1、Ｐ_i+2,j-1、Ｐ_i-1,j、Ｐ_i,j、Ｐ_i+1,j、Ｐ_i+2,jからなる本発明のマーチング主記憶装置の全体的な構成の一例を概略的に示す。図３８（ｂ）は、ベクトル／ストリーミング・データベクトル・データの場合に複数のファイルＦ_１、Ｆ_２、Ｆ_３、Ｆ_４からなる、斜線を付して示すページＰ_i,jの構成の一例を概略的に示し、ページＰ_i-1,j-1、Ｐ_i,j-1、Ｐ_i+1,j-1、Ｐ_i+2,j-1、Ｐ_i-1,j、Ｐ_i,j、Ｐ_i+1,j、Ｐ_i+2,jのそれぞれは、第３の実施形態に係るマーチング・キャッシュメモリ２１ａ及びマーチング・キャッシュメモリ２１ｂに使用できる。図３８（ｃ）は、斜線を付して示すファイルＦ_３の構成の一例を概略的に示し、ファイルＦ_１、Ｆ_２、Ｆ_３、Ｆ_４のそれぞれは、ベクトル／ストリーミング・データの場合に対して複数のメモリユニットＵ_１、Ｕ_２、Ｕ_２、……、Ｕ_n-1、Ｕ_ｎからなり、ファイルＦ_１、Ｆ_２、Ｆ_３、Ｆ_４のそれぞれは、第２の実施形態に係るマーチング・レジスタ・ファイル２２ａ及びマーチング・レジスタ・ファイル２２ｂに使用できる。

同様に、図３９（ａ）は、ベクトル／ストリーミング・データの場合に、複数のページＰ_r-1,s-1、Ｐ_r,s-1、Ｐ_r+1,s-1、Ｐ_r+2,s-1、Ｐ_r-1,s、Ｐ_r,s、Ｐ_r+1,s、Ｐ_r+2,sからなる本発明のマーチング主記憶装置の全体的な構成の一例を概略的に示し、各ページはそれ自体の位置インデックスをアドレスとして有している。図３９（ｂ）は、２進法のデジットを用いて、斜線を付して示すページＰ_r-1,sの構成とページＰ_r-1,sの駆動位置の一例を概略的に示し、ページＰ_r-1,s-1、Ｐ_r,s-1、Ｐ_r+1,s-1、Ｐ_r+2,s-1、Ｐ_r-1,s、Ｐ_r,s、Ｐ_r+1,s、Ｐ_r+2,sのそれぞれは、プログラム／スカラデータの場合に複数のファイルＦ_１、Ｆ_２、Ｆ_３、Ｆ_４からなる。ページＰ_r-1,s-1、Ｐ_r,s-1、Ｐ_r+1,s-1、Ｐ_r+2,s-1、Ｐ_r-1,s、Ｐ_r,s、Ｐ_r+1,s、Ｐ_r+2,sのそれぞれは、第３の実施形態に係るマーチング・キャッシュメモリ２１ａ及びマーチング・キャッシュメモリ２１ｂに使用できて、ファイルＦ_１、Ｆ_２、Ｆ_３、Ｆ_４のそれぞれが、それ自体の位置インデックスをアドレスとして有している。図３９（ｃ）は、２進法のデジット０、１、２、３を用いて、斜線を付して示すファイルＦ_３の構成とファイルＦ３の駆動位置の一例を概略的に示し、ファイルＦ_１、Ｆ_２、Ｆ_３、Ｆ_４のそれぞれは、プログラム／スカラデータの場合に複数のメモリユニットＵ_１、Ｕ_２、Ｕ_２、……、Ｕ_ｎ、Ｕ_n+1、Ｕ_n+2、Ｕ_n+3、Ｕ_n+4、Ｕ_n+5からなる。ファイルＦ_１、Ｆ_２、Ｆ_３、Ｆ_４のそれぞれは、第２の実施形態に係るマーチング・レジスタ・ファイル２２ａ及びマーチング・レジスタ・ファイル２２ｂに使用できて、それぞれのメモリユニットＵ_１、Ｕ_２、Ｕ_２、……、Ｕ_ｎ、Ｕ_n+1、Ｕ_n+2、Ｕ_n+3、Ｕ_n+4、Ｕ_n+5は、それ自体の位置インデックスｎ＋４、ｎ＋３、ｎ＋２、……、５、４、３、２、１、０をアドレスとして有している。図３９（ｃ）は、２進法のデジットによる場合のすべてに対して位置指定法を表している。

図３９（ｃ）に示すように、ｎの２進数は、マーチング・レジスタ・ファイルのサイズに対応する等価サイズを有するメモリ構造では、それぞれ、２_ｎのメモリユニットの中で単一のメモリユニットを識別する。そして、図３９（ｂ）に示すように、一枚のページの構造は、４つのファイルＦ_１、Ｆ_２、Ｆ_３、Ｆ_４を識別する２桁で表される、マーチング・キャッシュメモリのサイズに対応する等価サイズを有するが、一つのマーチング主記憶装置の構造は、図３９（ａ）に示すように、マーチング主記憶装置の８枚のページＰ_r-1,s-1、Ｐ_r,s-1、Ｐ_r+1,s-1、Ｐ_r+2,s-1、Ｐ_r-1,s、Ｐ_r,s、Ｐ_r+1,s、Ｐ_r+2,sを識別する、３桁で表現されている。

（速度／処理能力）
従来の計算機システムにおけるメモリ・アクセス時間とＣＰＵサイクル時間の間の速度ギャップは、例えば、１：１００である。しかし、マーチング記憶装置アクセス時間の速度は、第１の実施形態に係る計算機システムのＣＰＵサイクル時間と等しい。図４０は、キャッシュのない従来の計算機システムの速度／処理能力を、第１の実施形態に係る計算機システムに用いるマーチング主記憶装置３１の速度／処理能力と比較したものである。即ち、図４０（ｂ）は、１００個のメモリユニットＵ_１、Ｕ_２、Ｕ_３……、Ｕ₁₀₀からなるマーチング主記憶装置３１の速度／処理能力を概略的に示し、図４０（ａ）に示した従来型記憶装置の速度／処理能力と比較している。マーチング主記憶装置３１のデータを使用するに必要な処理装置を有していれば、マーチング主記憶装置３１の中の９９個のメモリユニットを更に同時動作させてサポートできることが分かる。したがって、従来の計算機システムの一つのメモリユニット時間Ｔ_musが、第１の実施形態に係るマーチング主記憶装置３１に含まれる１００個のメモリユニット・ストリーミング時間Ｔ_musに等価であると評価される。

そして、図４１は、最悪の場合において、スカラデータ又はプログラム命令に対する従来型記憶装置の速度／処理能力を、第１の実施形態に係る計算機システムに用いるマーチング主記憶装置３１の速度／処理能力と比較したものである。即ち、図４１（ｂ）の斜線部分は、１００個のメモリユニットＵ_１、Ｕ_２、Ｕ_２、……、Ｕ₁₀₀からなるマーチング主記憶装置３１の速度／処理能力を概略的に示し、図４１（ａ）に示す従来型記憶装置の最悪の場合の速度／処理能力と比較したものである。最悪の場合では、我々は、マーチング主記憶装置３１の９９個のメモリユニットを読み出すことができるが、それらはスカラ・プログラムの規定のために使用できない。

更に、図４２は、スカラデータ又はプログラム命令に対する従来型記憶装置における一般的な場合の速度／処理能力を、第１の実施形態に係る計算機システムに用いるマーチング主記憶装置３１の速度／処理能力と比較したものである。即ち、図４２（ｂ）は、１００個のメモリユニットＵ_１、Ｕ_２、Ｕ_２、……、Ｕ₁₀₀からなるマーチング主記憶装置３１の速度／処理能力を概略的に示し、図４２（ａ）に示す従来型記憶装置における一般的な場合の速度／処理能力と比較したものである。一般的な場合で、我々は、９９個のメモリユニットを読み出すことができる。しかし、幾つかのメモリユニットだけが、スカラ・プログラムの推測的なデータ作成により、従来型記憶装置の斜線を付して特定したメモリユニットで示すように使用できる。

図４３は、スカラデータの場合に対する従来型記憶装置の一般的な場合の速度／処理能力を、第１の実施形態に係る計算機システムに用いるマーチング主記憶装置３１の速度／処理能力と比較したものである。即ち、図４３（ｂ）は、１００個のメモリユニットＵ_１、Ｕ_２、Ｕ_２、……、Ｕ₁₀₀からなるマーチング主記憶装置３１の速度／処理能力を概略的に示して、図４３（ａ）に示す従来型記憶装置の速度／処理能力と比較したものである。図３４（ａ）〜（ｂ）に示した場合と同様に、一般的な場合で、我々は、９９個のメモリユニットを読み出すことができる。しかし、幾つかのメモリユニットを、マルチスレッド並列処理におけるスカラデータ又はプログラム命令の推測的なデータ作成により、従来型記憶装置の斜線を付して特定したメモリユニットで示すように使用できるだけである。

図４４は、ストリーミング・データ、ベクトル・データ又はプログラム命令の場合に対する従来型記憶装置における最良の場合の速度／処理能力を、第１の実施形態に係る計算機システムに用いるマーチング主記憶装置３１の速度／処理能力と比較したものである。即ち、図４４（ｂ）は、１００個のメモリユニットＵ_１、Ｕ_２、Ｕ_２、……、Ｕ₁₀₀からなるマーチング主記憶装置３１の速度／処理能力を概略的に示し、図４４（ａ）に示す従来型記憶装置における最良の場合の速度／処理能力と比較したものである。最良の場合で、我々は、マーチング主記憶装置３１の１００個のメモリユニットが、ストリーミング・データとデータ・パラレルに対して使用できることが分かる。

（２次元のマーチング主記憶装置）
メモリユニットは、図４５〜５１に示すようにチップ上に２次元で配置できるので、様々なモードの動作が、スイッチ／ネットワークなしに実現できる。図４５〜５１に示す第１の実施形態に係る２次元のマーチング主記憶装置３１によれば、メモリユニットＵ₁₁、Ｕ₁₂、Ｕ₁₃、……、Ｕ_1,v-1、Ｕ_1,v；Ｕ₁₂、Ｕ₂₂、Ｕ₂₃、……、Ｕ_2,v-2、Ｕ_2,v； ……；Ｕ_u,1、Ｕ_u,2、Ｕ_u,3、……、Ｕ_u,v-1、Ｕ_u,vはリフレッシュが要求されない。何故ならば、メモリユニットＵ₁₁、Ｕ₁₂、Ｕ₁₃、……、Ｕ_1,v-1、Ｕ_1,v；Ｕ₁₂、Ｕ₂₂、Ｕ₂₃、……、Ｕ_2,v-2、Ｕ_2,v； ……；Ｕ_u,1、Ｕ_u,2、Ｕ_u,3、……、Ｕ_u,v-1、Ｕ_u,vのすべては、通常は、情報移動スキーム（情報隊列行進スキーム）により自動的にリフレッシュされるからである。そして、メモリユニットＵ₁₁、Ｕ₁₂、Ｕ₁₃、……、Ｕ_1,v-1、Ｕ_1,v；Ｕ₁₂、Ｕ₂₂、Ｕ₂₃、……、Ｕ_2,v-2、Ｕ_2,v； ……；Ｕ_u,1、Ｕ_u,2、Ｕ_u,3、……、Ｕ_u,v-1、Ｕ_u,vのそれぞれに対するアドレス指定が消滅し、必要な情報は、メモリの端部に接続する、その宛先となるユニットの見出しになる。第１の実施形態の２次元のマーチング主記憶装置３１にアクセスする機構は、従来の計算機システムでは情報を読み出し及び書き込みためのアドレス指定モードから始まる従来型記憶装置スキームの真の代わりとなるものである。したがって、第１の実施形態の２次元のマーチング主記憶装置３１によれば、第１の実施形態に係る計算機システムでは、アドレス指定モードのないメモリ−アクセス処理が、従来の計算機システムの従来型記憶装置スキームと比べると非常に単純になる。

（エネルギー消費）
第１の実施形態に係る計算機システムのアーキテクチュア、デザイン及び構想の改善点を明確にするために、エネルギー消費の改善について説明する。図５２（ａ）は、マイクロプロセッサのエネルギー消費が、静的電力消費と動的電力消費に分割できることを示している。図５２（ａ）に示す動的電力消費では、電力消費の正味（ネット）と付帯的（オーバーヘッド）なものが図５２（ｂ）に示すように顕著である。図５２（ｃ）に示すように、正味のエネルギー部分だけが計算機システムの或るジョブの動作に実際に必要になるので、この純粋なエネルギー部分が、計算機システムを実施する上での最小のエネルギー消費になる。これは、最短の処理時間が、図５２（ｃ）に示す正味のエネルギー消費で実現できることを意味する。

幾つかの試みがアーキテクチュア、デザイン及び構想を具体化するためにプロセッサに導入されてはいるが、図１に示した従来のアーキテクチュアにはボトルネックがある。従来のアーキテクチュアには、下記のように、フォン・ノイマン型計算機に様々な課題がある。
１）プログラムが、メモリのデータのように格納される。
２）すべての処理が、単一のプロセッサにおいて基本的に逐次的に行われる。
３）プログラムの動作は、命令の逐次的な遂行にすぎない。
４）ベクトル・データは、ベクトル命令によりＣＰＵで逐次的に処理される。
５）ストリーミング・データは、スレッドで逐次的に処理される。
６）プログラムには、スレッドが逐次的に配置されている。
７）データ・パラレルは、ベクトルとしてのデータの配置からなる。
８）ストリーミング・データは、データの流れである。

従来の計算機の特性から、我々は、プログラムとデータの格納は基本的に逐次的に連続配置した形式になると結論づけた。この事実は、命令の規則的な配置がプログラムと対応するデータに存在することを意味する。

図２に示す第１の実施形態に係る計算機システムにおいて、マーチング主記憶装置３１で命令のアクセスは必要でない。何故ならば、一連の命令が、それら自体でプロセッサ１１に能動的にアクセスするからである。同様に、マーチング主記憶装置３１におけるデータのアクセスは、一連のデータが、それら自体でプロセッサ１１に能動的にアクセスするので不要である。

図５３は、ウィリアム（William）Ｊ．ダリ（Dally）らが『効率のよい埋め込み型コンピューティング（Efficient Embedded Computing)』、計算機（Computer）、第４１巻、第７号,２００８年，ｐｐ２７〜32で評価した、従来のアーキテクチュアにおけるレジスタとキャッシュを含めた、プロセッサ全体での実際のエネルギー消費分布を示す。図５３に、チップ間の配線を除いた、チップ全体だけの電力消費分布の評価が開示している。ダリらにより、命令供給の電力消費が４２％、データ供給の電力消費は２８％、クロック及び制御ロジックの電力消費は２４％、演算電力消費は６％と評価されている。したがって、我々は、命令供給とデータ供給の電力消費は、クロック／制御ロジックの電力消費と演算の電力消費より比較的大きいことが分かる。これらの原因は、メモリ、キャッシュ及びレジスタのすべてがリフレッシュされないことに加えて、これらのキャッシュとレジスタのアクセス方式に起因して大量の配線が必要であり、一部のソフトウェアの付帯的要因（オーバーヘッド）によるキャッシュ／レジスタ・アクセスの非効率性に起因すると理解できる。

命令供給の電力消費とデータ供給の電力消費の比は３：２であり、クロック及び制御ロジックの電力消費と演算の電力消費の比は４：１なので、図２に示した第１の実施形態に係る計算機システムに従って、我々は、マーチング主記憶装置３１を少なくとも部分的に用いることにより、データ供給の電力消費を２０％に容易に減少できる。このため、命令供給の電力消費が３０％になり、我々は演算の電力消費を１０％に増加できるので、クロック及び制御ロジックの電力消費が４０％になる。このことは、命令供給の電力消費とデータ供給の電力消費の合計を５０％にでき、クロック及び制御ロジックの電力消費と演算の電力消費の合計を５０％にできることを意味する。

我々がデータ供給の電力消費を１０％に減らすと、命令供給の電力消費が１５％になる。我々が演算の電力消費を１５％に増加すると、クロック及び制御ロジックの電力消費が６０％になる。これは、命令供給の電力消費とデータ供給の電力消費の合計を３５％にできて、クロック及び制御ロジックの電力消費と演算の電力消費の合計を７５％にできることを意味する。

従来の計算機システムでは、図５４（ａ）に示すようにエネルギーを消耗し、メモリユニットをアドレス指定して読み取り／書き込むために比較的大きな平均作動時間が配線の遅延時間のために生じる。これに対し、本発明の実施形態に係る計算機システムによれば、図５４（ｂ）に示すように、より僅かなエネルギーを消耗するだけである。何故ならば、本発明の実施形態に係る計算機システムでは、マーチング記憶装置により、短い平均的な滑らかな作動時間になるからである。我々は、僅かなエネルギーで、従来の計算機システムより迅速に同じデータを処理できる。

− 第２の実施形態 −
図５５に示すように、本発明の第２の実施形態に係る計算機システムは、プロセッサ１１とマーチング主記憶装置３１と、を備えている。プロセッサ１１は、クロック信号を生成するクロック発生回路１１３を有する制御装置１１１と、クロック信号に同期して演算論理動作を実行する演算論理装置（ＡＬＵ）１１２と、制御装置１１１に接続したマーチング命令レジスタ・ファイル（ＲＦ）２２ａと、ＡＬＵ１１２に接続したマーチング・データレジスタ・ファイル（ＲＦ）２２ｂとを含む。

図示を省略しているが、図３〜図２４、図２５（ａ）、図２５（ｂ）、図２６，図４５〜図５１に示したマーチング主記憶装置３１と非常に類似した状態で、マーチング命令レジスタ・ファイル２２ａは、命令レジスタ・ユニットのアレイ（第３のアレイ）と、第３のアレイの入力端子となる命令レジスタ入力端子と、第３のアレイの出力端子となる命令レジスタ出力端子を有している。命令レジスタ入力端子は、マーチング主記憶装置３１からマーチング主記憶装置３１に格納された命令を受信する。マーチング命令レジスタ・ファイル２２ａは、一連の命令を命令レジスタ・ユニットのそれぞれに格納する。そして、命令レジスタ入力端子に隣接する入力側の命令レジスタ・ユニットから、命令レジスタ出力端子に隣接した出力側の命令レジスタ・ユニットの方向に向かい、クロック信号に同期して、それぞれの命令レジスタ・ユニットから、それぞれの命令レジスタ・ユニットに隣接する命令レジスタ・ユニットに、それぞれの命令レジスタ・ユニットに格納したそれぞれの命令を、連続的且つ周期的に転送するように構成している。この結果、マーチング命令レジスタ・ファイル２２ａのそれぞれの命令レジスタ・ユニットに格納された命令からなる一連の命令を、命令レジスタ出力端子を介して制御装置１１１に能動的且つ逐次的に出力し、制御装置１１１は命令を用いて処理を実行する。

更に、図３〜図２４、図２５（ａ）、図２５（ｂ）、図２６，図４５〜図５１に示したマーチング主記憶装置３１と同様に、マーチング・データレジスタ・ファイル２２ｂは、データレジスタ・ユニットのアレイ（第４のアレイ）と、第４のアレイの入力端子となるデータレジスタ入力端子と、第４のアレイの出力端子となるデータレジスタ出力端子を有している。データレジスタ入力端子は、マーチング主記憶装置３１から、マーチング主記憶装置３１に格納されたデータを受信する。マーチング・データレジスタ・ファイル２２ｂは、一連のデータをデータレジスタ・ユニットのそれぞれに格納する。マーチング・データレジスタ・ファイル２２ｂの詳細な説明は省略しているが、データレジスタ入力端子に隣接する入力側のデータレジスタ・ユニットから、データレジスタ出力端子に隣接した出力側のデータレジスタ・ユニットの方向に向かい、クロック信号に同期して、それぞれのデータレジスタ・ユニットから、それぞれのデータレジスタ・ユニットに隣接するデータレジスタ・ユニットに、それぞれのデータレジスタ・ユニットに格納したそれぞれのデータを、連続的且つ周期的に転送するように構成している。この結果、マーチング・データレジスタ・ファイル２２ｂのそれぞれのデータレジスタ・ユニットに格納されたデータからなる一連のデータを、データレジスタ出力端子を介してＡＬＵ１１２に能動的且つ逐次的に出力し、ＡＬＵ１１２は入力されたデータを用いて処理を実行する。

図５５に示すように、マーチング主記憶装置３１の一部とマーチング命令レジスタ・ファイル２２ａは複数の接合部材５４を介して電気的に接続し、マーチング命令レジスタ・ファイル２２ａに接続した部分以外となるマーチング主記憶装置３１の残部とマーチング・データレジスタ・ファイル２２ｂとは、他の複数の接合部材５４を介して電気的に接続している。

ＡＬＵ１１２における処理の最終データは、マーチング・データレジスタ・ファイル２２ｂに送られる。したがって、双方向矢印Φ₂₄で表されるように、データは、マーチング・データレジスタ・ファイル２２ｂとＡＬＵ１１２の間で双方向に転送される。更に、マーチング・データレジスタ・ファイル２２ｂに格納したデータは、マーチング主記憶装置３１に接合部材５４を介して送られる。したがって、双方向矢印Φ₂₃で表されるように、データは、マーチング主記憶装置３１とマーチング・データレジスタ・ファイル２２ｂとの間を接合部材５４を介して双方向に転送される。

逆に、単一方向矢印η₂₂とη₂₃で表されるように、命令の移動については、マーチング主記憶装置３１からマーチング命令レジスタ・ファイル２２ａに、及びマーチング命令レジスタ・ファイル２２ａから制御装置１１１に向かう一方向の命令流だけである。

図５５に示す第２の実施形態に係る計算機システムには、データバスやアドレスバス等のバスはない。何故ならば、全体的な計算機システムには、マーチング主記憶装置３１とマーチング命令レジスタ・ファイル２２ａの間、マーチング主記憶装置３１とマーチング・データレジスタ・ファイル２２ｂの間、マーチング命令レジスタ・ファイル２２ａと制御装置１１１の間、マーチング・データレジスタ・ファイル２２ｂとＡＬＵ１１２の間に、任意のデータ交換でも配線が存在しないからである。これに対して、配線又はバスが、従来の計算機システムでボトルネックを生じていた。これらの配線間に、時間的遅延と票遊容量とを生じるグローバルな配線が存在しないので、第２の実施形態に係る計算機システムは、非常に高速の処理速度と低い電力消費とを達成できる。

第２の実施形態に係る計算機システムの他の機能、構成や動作方法等は、第１の実施形態で既に説明した他の機能、構成や動作方法等と実質的に類似しているので、重複した冗長な説明は省略する。

− 第３の実施形態 −
図５６に示すように、本発明の第３の実施形態に係る計算機システムは、プロセッサ１１とマーチング・キャッシュメモリ（２１ａ、２１ｂ）とマーチング主記憶装置３１と、を備えている。第２の実施形態と同様に、プロセッサ１１は、クロック信号を生成するクロック発生回路１１３を有する制御装置１１１と、クロック信号と同期して演算論理動作を実行する演算論理装置（ＡＬＵ）１１２と、制御装置１１１に接続したマーチング命令レジスタ・ファイル（ＲＦ）２２ａと、ＡＬＵ１１２に接続したマーチング・データレジスタ・ファイル（ＲＦ）２２ｂとを含む。

マーチング・キャッシュメモリ（２１ａ、２１ｂ）は、マーチング命令キャッシュメモリ２１ａ及びマーチング・データキャッシュメモリ２１ｂと、を備えている。図示を省略しているが、図３〜図２４、図２５（ａ）、図２５（ｂ）、図２６，図４５〜図５１に示すマーチング主記憶装置３１と非常に類似して、マーチング命令キャッシュメモリ２１ａ及びマーチング・データキャッシュメモリ２１ｂのそれぞれは、情報のユニットを構成するそれぞれの情報の位置に対応して割り当てられたキャッシュメモリユニットのアレイと、マーチング主記憶装置３１から格納された情報を受信するアレイのキャッシュ入力端子と、アレイのキャッシュ出力端子とを有している。キャッシュ入力端子は、マーチング主記憶装置３１から、マーチング主記憶装置３１に格納された情報を受信する。マーチング命令キャッシュメモリ２１ａ及びマーチング・データキャッシュメモリ２１ｂは、情報をキャッシュメモリユニットのそれぞれに格納するとともに、クロック信号に同期して、ステップごとに、情報を隣接するキャッシュメモリユニットにそれぞれ転送する。この結果、マーチング命令キャッシュメモリ２１ａ及びマーチング・データキャッシュメモリ２１ｂに格納されていた情報が、プロセッサ１１に能動的に逐次出力され、ＡＬＵ１１２は演算論理動作を、マーチング命令キャッシュメモリ２１ａ及びマーチング・データキャッシュメモリ２１ｂに格納されていた情報を用いて実行できる。

図５６に示すように、マーチング主記憶装置３１の一部とマーチング命令キャッシュメモリ２１ａは複数の接合部材５２によって電気的に接続し、マーチング命令キャッシュメモリ２１ａに接続された箇所以外のマーチング主記憶装置３１の残部とマーチング・データキャッシュメモリ２１ｂは他の複数の接合部材５２を介して電気的に接続している。更に、マーチング命令キャッシュメモリ２１ａとマーチング命令レジスタ・ファイル２２ａは複数の接合部材５１を介して電気的に接続し、マーチング・データキャッシュメモリ２１ｂとマーチング・データレジスタ・ファイル２２ｂは他の複数の接合部材５１を介して電気的に接続している。

ＡＬＵ１１２が実行した最終データは、マーチング・データレジスタ・ファイル２２ｂに送られ、双方向矢印Φ₃₄で表されるように、データは、マーチング・データレジスタ・ファイル２２ｂとＡＬＵ１１２との間で双方向に転送される。更に、マーチング・データレジスタ・ファイル２２ｂに格納したデータは、マーチング・データキャッシュメモリ２１ｂに接合部材５１を介して送られ、双方向矢印Φ₃₃で表されるように、データは、マーチング・データキャッシュメモリ２１ｂとマーチング・データレジスタ・ファイル２２ｂの間で接合部材５１を介して双方向に転送される。更に、マーチング・データキャッシュメモリ２１ｂに格納したデータは、マーチング主記憶装置３１に接合部材５２を介して出力され、双方向矢印Φ₃₂で表されるように、データは、マーチング主記憶装置３１とマーチング・データキャッシュメモリ２１ｂとの間で接合部材５２を介して双方向に転送される。

逆に、単一方向矢印η₃₁とη₃₂で表されるように、命令の転送については、マーチング主記憶装置３１からマーチング命令キャッシュメモリ２１ａに、マーチング命令キャッシュメモリ２１ａからマーチング命令レジスタ・ファイル２２ａに、及びマーチング命令レジスタ・ファイル２２ａから制御装置１１１に向かう一方向の命令の流れだけである。

図５６に示す第３の実施形態に係る計算機システムには、データバスやアドレスバス等のバスはない。何故ならば、全体的な計算機システムにおいて、マーチング主記憶装置３１とマーチング命令キャッシュメモリ２１ａの間、マーチング命令キャッシュメモリ２１ａとマーチング命令レジスタ・ファイル２２ａの間、マーチング主記憶装置３１とマーチング・データキャッシュメモリ２１ｂの間、マーチング・データキャッシュメモリ２１ｂとマーチング・データレジスタ・ファイル２２ｂの間、マーチング命令レジスタ・ファイル２２ａと制御装置１１１の間、及びマーチング・データレジスタ・ファイル２２ｂとＡＬＵ１１２の間における任意のデータ交換においてグローバルな配線が存在しないからである。従来の計算機システムにおいては、配線やバスが、従来の計算機システムにボトルネックを生じさせていた。従来の計算機システムのような配線間に時間的な遅延や浮遊容量を生じるグローバルな配線が存在しないので、第３の実施形態の計算機システムは、非常に高速な処理速度と低い電力消費とを達成できる。

第３の実施形態に係る計算機システムの他の機能、構成や動作方法等は、第１及び第２の実施形態で既に説明した他の機能、構成や動作方法等と実質的に類似しているので、重複した冗長な説明は省略する。図５７（ａ）に示すように、第３の実施形態に係る計算機システムのＡＬＵ１１２は、マーチング・レジスタ・ユニットＲ₁₁、Ｒ₁₂、Ｒ₁₃、……、Ｒ_１ｎ；Ｒ₂₂、Ｒ₂₂、Ｒ₂₃、……、Ｒ_2nを介して、格納された情報を受信する複数の演算パイプラインＰ_１、Ｐ_２、Ｐ_３、……、Ｐ_ｎを含んでいて、データは演算パイプラインＰ_１、Ｐ_２、Ｐ_３、……、Ｐ_ｎの配列方向と平行に移動する。ベクトル・データが格納される場合に、マーチング・ベクトルレジスタ・ユニットＲ₁₁、Ｒ₁₂、Ｒ₁₃、……、Ｒ_１ｎ；Ｒ₂₂、Ｒ₂₂、Ｒ₂₃、……、Ｒ_2nを使用できる。

更に、図５７（ｂ）に示すように、複数のマーチング・キャッシュ・ユニットＣ₁₁、Ｃ₁₂、Ｃ₁₃、……、Ｃ_１ｎ；Ｃ₂₁、Ｃ₂₂、Ｃ₂₃、……、Ｃ_2n；Ｃ₃₁、Ｃ₃₂、Ｃ₃₃、……、Ｃ_3nを平行に配列できる。

図５８に示すように、第３の実施形態に係る計算機システムを構成するＡＬＵ１１２は、単一のプロセッサ・コア１１６を含む。横方向の矢印で示すように、情報は、マーチング・キャッシュメモリ２１からマーチング・レジスタ・ファイル２２に、及びマーチング・レジスタ・ファイル２２からプロセッサ・コア１１６に移動できる。プロセッサ・コア１１６における処理の最終データは、マーチング・レジスタ・ファイル２２に送られるので、データはマーチング・レジスタ・ファイル２２とプロセッサ・コア１１６の間で双方向に転送される。更に、マーチング・レジスタ・ファイル２２に格納したデータはマーチング・キャッシュメモリ２１に送られるので、データは、マーチング・キャッシュメモリ２１とマーチング・レジスタ・ファイル２２の間で双方向に転送される。命令の移動の場合、処理情報の反対方向に沿う流れはない。

図５９に示すように、第３の実施形態に係る計算機システムのＡＬＵ１１２は、単一の演算パイプライン１１７を含む。横方向の矢印で示すように、情報は、マーチング・キャッシュメモリ２１からマーチング・ベクトルレジスタ・ファイル２２vに、及びマーチング・ベクトルレジスタ・ファイル２２vから演算パイプライン１１７に移動できる。演算パイプライン１１７における処理の最終データはマーチング・ベクトルレジスタ・ファイル２２vに送られるので、データは、マーチング・ベクトルレジスタ・ファイル２２vと演算パイプライン１１７の間で双方向に転送される。更に、マーチング・ベクトルレジスタ・ファイル２２vに格納したデータはマーチング・キャッシュメモリ２１に送られるので、データは、マーチング・キャッシュメモリ２１とマーチング・ベクトルレジスタ・ファイル２２vの間で双方向に転送される。命令の移動の場合、処理情報の反対方向に沿う流れはない。

図６０に示すように、第３の実施形態に係る計算機システムのＡＬＵ１１２は、複数のプロセッサ・コア１１６_-1、１１６_-2、１１６_-3、１１６_-4、……、１１６_-mを含んでいる。横方向の矢印で示すように、情報は、マーチング・キャッシュメモリ２１からマーチング・レジスタ・ファイル２２に、及びマーチング・レジスタ・ファイル２２からプロセッサ・コア１１６_-1、１１６_-2、１１６_-3、１１６_-4、……、１１６_ｍに移動できる。プロセッサ・コア１１６_-1、１１６_-2、１１６_-3、１１６_-4、……、１１６_-mにおける処理の最終データはマーチング・レジスタ・ファイル２２に出力されるので、データは、マーチング・レジスタ・ファイル２２とプロセッサ・コア１１６_-1、１１６_-2、１１６_-3、１１６_-4、……、１１６_-mの間で双方向に転送される。更に、マーチング・レジスタ・ファイル２２に格納したデータはマーチング・キャッシュメモリ２１に送られるので、データは、マーチング・キャッシュメモリ２１とマーチング・レジスタ・ファイル２２の間で双方向に転送される。命令の移動の場合、処理情報の反対方向に沿う流れはない。

図６１に示すように、第３の実施形態に係る計算機システムのＡＬＵ１１２は、複数の演算パイプライン１１７_-1、１１７_-2、１１７_-3、１１７_-4、……、１１７_-mを含んでいる。横方向の矢印で示すように、情報は、マーチング・キャッシュメモリ２１からマーチング・ベクトルレジスタ・ファイル２２vに、及びマーチング・ベクトルレジスタ・ファイル２２vから演算パイプライン１１７_-1、１１７_-2、１１７_-3、１１７_-4、……、１１７_-mに移動できる。演算パイプライン１１７_-1、１１７_-2、１１７_-3、１１７_-4、……、１１７_-mにおける処理の最終データは、マーチング・ベクトルレジスタ・ファイル２２vに送られるので、データは、マーチング・ベクトルレジスタ・ファイル２２vと演算パイプライン１１７_-1、１１７_-2、１１７_-3、１１７_-4、……、１１７_-mとの間で双方向に転送される。更に、マーチング・ベクトルレジスタ・ファイル２２vに格納したデータはマーチング・キャッシュメモリ２１に送られるので、データは、マーチング・キャッシュメモリ２１とマーチング・ベクトルレジスタ・ファイル２２vとの間で双方向に転送される。命令の移動の場合、処理情報の反対方向に沿う流れはない。

図６２（ｂ）に示すように、第３の実施形態に係る計算機システムのＡＬＵ１１２は複数の演算パイプライン１１７_-1、１１７_-2、１１７_-3、１１７_-4、……、１１７_-mを含んでいて、複数のマーチング・キャッシュメモリ２１_-1、２１_-2、２１_-3、……、２１_-mは、マーチング主記憶装置３１に電気的に接続している。ここで、第１のマーチング・ベクトルレジスタ・ファイル２２v_-1は第１のマーチング・キャッシュメモリ２１_-1に接続し、第１の演算パイプライン１１７_-1は第１のマーチング・ベクトルレジスタ・ファイル２２v_-1に接続している。そして、第２のマーチング・ベクトルレジスタ・ファイル２２v_-2は第２のマーチング・キャッシュメモリ２１_-2に接続し、第２の演算パイプライン１１７_-2は第２のマーチング・ベクトルレジスタ・ファイル２２v_-2に接続している。第３のマーチング・ベクトルレジスタ・ファイル２２v_-3は第３のマーチング・キャッシュメモリ２１_-3に接続し、第３の演算パイプライン１１７_-3は第３のマーチング・ベクトルレジスタ・ファイル２２v_-3に接続している、……。ｍ番目のマーチング・ベクトルレジスタ・ファイル２２v_-mはｍ番目のマーチング・キャッシュメモリ２１_-mに接続し、ｍ番目の演算パイプライン１１７_-mはｍ番目のマーチング・ベクトルレジスタ・ファイル２２v_-mに接続している。

情報は、マーチング主記憶装置３１からマーチング・キャッシュメモリ２１_-1、２１２_-2、２１_-3、……、２１_-mに並列に、マーチング・キャッシュメモリ２１_-1、２１２_-2、２１_-3、……、２１_-mからマーチング・ベクトルレジスタ・ファイル２２v_-1、２２v_-2、２２v_-3、２２v_-4、……、２２v_-mに並列に、及びマーチング・ベクトルレジスタ・ファイル２２v_-1、２２v_-2、２２v_-3、２２v_-4、……、２２v_-mから演算パイプライン１１７_-1、１１７_-2、１１７_-3、１１７_-4、……、１１７_-mに並列に移動する。演算パイプライン１１７_-1、１１７_-2、１１７_-3、１１７_-4、……、１１７_-mにおける処理の最終データはマーチング・ベクトルレジスタ・ファイル２２v_-1、２２v_-2、２２v_-3、２２v_-4、……、２２v_-mに送られるので、データは、マーチング・ベクトルレジスタ・ファイル２２v_-1、２２v_-2、２２v_-3、２２v_-4、……、２２v_-mと演算パイプライン１１７_-1、１１７_-2、１１７_-3、１１７_-4、……、１１７_-mとの間で双方向に転送される。更に、マーチング・ベクトルレジスタ・ファイル２２v_-1、２２v_-2、２２v_-3、２２v_-4、……、２２v_-mに格納したデータはマーチング・キャッシュメモリ２１_-1、２１２_-2、２１_-3、……、２１_-mに送られるので、データは、マーチング・キャッシュメモリ２１_-1、２１２_-2、２１_-3、……、２１_-mとマーチング・ベクトルレジスタ・ファイル２２v_-1、２２v_-2、２２v_-3、２２v_-4、……、２２v_-mとの間で双方向に転送され、マーチング・キャッシュメモリ２１_-1、２１２_-2、２１_-3、……、２１_-mに格納したデータはマーチング主記憶装置３１に送られるので、データは、マーチング主記憶装置３１とマーチング・キャッシュメモリ２１_-1、２１２_-2、２１_-3、……、２１_-mとの間で双方向に転送される。命令の移動の場合、処理情報の反対方向に沿う流れはない。

逆に、図６２（ａ）に示すように、複数の演算パイプライン１１７_-1、１１７_-2、１１７_-3、１１７_-4、……、１１７_-mを含む従来の計算機システムのＡＬＵ１１２では、複数の従来型キャッシュメモリ３２１_-1、３２１_-2、３２１_-3、３２１_-4、……、３２１_-mが、フォン・ノイマン・ボトルネック３２５を形成する配線及び／又はバスを介して従来型主記憶装置３３１に電気的に接続している。そこで、情報は、従来型主記憶装置３３１から従来型キャッシュメモリ３２１_-1、３２１_-2、３２１_-3、３２１_-4、……、３２１_-mに並列にフォン・ノイマン・ボトルネック３２５を介して、従来型キャッシュメモリ３２１_-1、３２１_-2、３２１_-3、３２１_-4、……、３２１_-mから従来型ベクトルレジスタ・ファイル（ＲＦｓ）３２２v_-1、３２２v_-2、３２２v_-3、３２２v_-4、……、３２２v_-mに並列に、及び従来型ベクトルレジスタ・ファイル３２２v_-1、３２２v_-2、３２２v_-3、３２２v_-4、……、３２２v_-mから演算パイプライン１１７_-1、１１７_-2、１１７_-3、１１７_-4、……、１１７_-mに並列に移動する。

図６２（ｂ）に示す第３の実施形態に係る計算機システムには、データバスやアドレスバス等のバスはない。何故ならば、全体的なシステムに、演算パイプライン１１７_-1、１１７_-2、１１７_-3、１１７_-4、……、１１７_-mとマーチング主記憶装置３１の間の任意のデータ交換でもグローバルな配線が存在しないからである。ところが、図６２（ａ）に示す従来の計算機システムには配線又はバスがボトルネックを形成している。図６２（ｂ）に示す計算機システムの配線間には時間的な遅延と浮遊容量を生じるグローバルな配線がないので、第３の実施形態に係る計算機システムは、非常に高速の処理速度と低い電力消費が達成できる。

− 第４の実施形態 −
図６３に示すように、第４の実施形態に係る計算機システムは、従来型主記憶装置３１ｓと、従来型主記憶装置３１ｓに接続したマザー・マーチング主記憶装置３１_-0と、グラフィック処理装置（ＧＰＵ）を基礎とした汎用計算に使用できる、高性能コンピューティング（ＨＰＣ）システムを形成するためにマザー・マーチング主記憶装置３１_-0と通信する複数の処理装置１２_-1、１２_-2、１２_-3、……とを含んでいる。図示を省略しているが、第４の実施形態のＨＰＣシステムは、クロック信号を生成するクロック発生回路１１３を有する制御装置１１１と、複数の処理装置１２_-1、１２_-2、１２_-3、……の動作を切り替えて制御するフィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡ）とを含んでおり、並列で動作することにより高速処理計算の流れを最適化して、帯域幅消費の管理と運営を支援することを意図している。ＦＰＧＡは、或るタスクのために自らを書き換えることができる、本質的には、計算機チップである。ＦＰＧＡは、ＶＨＤＬ又はヴェリログ(Verilog)のようなハードウェア記述言語でプログラム化できる。

第１の処理装置１２_-1は、第１の分岐マーチング主記憶装置３１_-1と、第１の分岐マーチング主記憶装置３１_-1に、それぞれ、電気的に接続した複数の第１のマーチング・キャッシュメモリ２１_-11、２１_-12、……、２１_-1pと、第１のマーチング・キャッシュメモリ２１_-11、２１_-12、……、２１_-1pに、それぞれ、電気的に接続した複数の第１のマーチング・ベクトルレジスタ・ファイル２２v_-11、２２v_-12、……、２２v_-1pと、第１のマーチング・ベクトルレジスタ・ファイル２２v_-11、２２v_-12、……、２２v_-1pにそれぞれ電気的に接続した複数の第１の演算パイプライン１１７_-11、１１７_-12、……、１１７_-1pと、を含んでいる。

図３〜図２４、図２５（ａ）、図２５（ｂ）、図２６，図４５〜図５１などに示す構成と同様に、マザー・マーチング主記憶装置３１_-0、第１の分岐マーチング主記憶装置３１_-1、第１のマーチング・キャッシュメモリ２１_-11、２１_-12、……、２１_-1p及び第１のマーチング・ベクトルレジスタ・ファイル２２v_-11、２２v_-12、……、２２v_-1pのそれぞれは、メモリユニットのアレイ、このアレイの入力端子及びアレイの出力端子と、を備える。マザー・マーチング主記憶装置３１_-0、第１の分岐マーチング主記憶装置３１_-1、第１のマーチング・キャッシュメモリ２１_-11、２１_-12、……、２１_-1p及び第１のマーチング・ベクトルレジスタ・ファイル２２v_-11、２２v_-12、……、２２v_-1pのそれぞれは、情報をメモリユニットのそれぞれに格納し且つクロック信号に同期して、ステップごとに、入力端子側から出力端子側の方向に転送するように構成している。

マザー・マーチング主記憶装置３１_-0、第１の分岐マーチング主記憶装置３１_-1、第１のマーチング・キャッシュメモリ２１_-11、２１_-12、……、２１_-1p及び第１のマーチング・ベクトルレジスタ・ファイル２２v_-11、２２v_-12、……、２２v_-1pのそれぞれの動作はＦＰＧＡで制御するので、情報は、マザー・マーチング主記憶装置３１_-0から第１の分岐マーチング主記憶装置３１_-1に、第１の分岐マーチング主記憶装置３１_-1から第１のマーチング・キャッシュメモリ２１_-11、２１_-12、……、２１_-1pに並列に、第１のマーチング・キャッシュメモリ２１_-11、２１_-12、……、２１_-1pから第１のマーチング・ベクトルレジスタ・ファイル２２v_-11、２２v_-12、……、２２v_-1pに並列に、及び第１のマーチング・ベクトルレジスタ・ファイル２２v_-11、２２v_-12、……、２２v_-1pから第１の演算パイプライン１１７_-11、１１７_-12、……、１１７_-1pに並列に移動する。第１の演算パイプライン１１７_-11、１１７_-12、……、１１７_-1pにおける処理の最終データは、第１のマーチング・ベクトルレジスタ・ファイル２２v_-11、２２v_-12、……、２２v_-1pに送られるので、データは、第１のマーチング・ベクトルレジスタ・ファイル２２v_-11、２２v_-12、……、２２v_-1pと第１の演算パイプライン１１７_-11、１１７_-12、……、１１７_-1pの間で双方向に転送される。更に、第１のマーチング・ベクトルレジスタ・ファイル２２v_-11、２２v_-12、……、２２v_-1pに格納したデータが、第１のマーチング・キャッシュメモリ２１_-11、２１_-12、……、２１_-1pに送られるので、データは、第１のマーチング・キャッシュメモリ２１_-11、２１_-12、……、２１_-1pと第１のマーチング・ベクトルレジスタ・ファイル２２v_-11、２２v_-12、……、２２v_-1pの間で双方向で転送され、第１のマーチング・キャッシュメモリ２１_-11、２１_-12、……、２１_-1pに格納したデータは第１の分岐マーチング主記憶装置３１_-1に送られるので、データは第１の分岐マーチング主記憶装置３１_-1と第１のマーチング・キャッシュメモリ２１_-11、２１_-12、……、２１_-1pの間で双方向に転送される。しかし、ＦＰＧＡは、第１の処理装置１２_-1で処理情報の反対方向に沿う流れがないように、命令の移動を制御する。

第２の処理装置１２_-2は、第２の分岐マーチング主記憶装置３１_-2と、第２の分岐マーチング主記憶装置３１_-2にそれぞれ電気的に接続した複数の第２のマーチング・キャッシュメモリ２１_-21、２１_-22、……、２１_-2pと、第２のマーチング・キャッシュメモリ２１_-21、２１_-22、……、２１_-2pに、それぞれ、電気的に接続した複数の第２のマーチング・ベクトルレジスタ・ファイル２２v_-21、２２v_-22、……、２２v_-2pと、第２のマーチング・ベクトルレジスタ・ファイル２２v_-21、２２v_-22、……、２２v_-2pに、それぞれ、電気的に接続した複数の第２の演算パイプライン１１７_-21、１１７_-22、……、１１７_-2pと、を含んでいる。第１の処理装置１２_-1と同様に、マザー・マーチング主記憶装置３１_-0、第２の分岐マーチング主記憶装置３１_-2、第２のマーチング・キャッシュメモリ２１_-21、２１_-22、……、２１_-2p及び第２のマーチング・ベクトルレジスタ・ファイル２２v_-21、２２v_-22、……、２２v_-2pのそれぞれは、メモリユニットのアレイ、このアレイの入力端子及びアレイの出力端子と、を備える。マザー・マーチング主記憶装置３１_-0、第２の分岐マーチング主記憶装置３１_-2、第２のマーチング・キャッシュメモリ２１_-21、２１_-22、……、２１_-2p及び第２のマーチング・ベクトルレジスタ・ファイル２２v_-21、２２v_-22、……、２２v_-2pのそれぞれは、情報をメモリユニットのそれぞれに格納し且つクロック信号に同期して、ステップごとに、入力端子側から出力端子側の方向に転送するように構成している。マザー・マーチング主記憶装置３１_-0、第２の分岐マーチング主記憶装置３１_-2、第２のマーチング・キャッシュメモリ２１_-21、２１_-22、……、２１_-2p及び第２のマーチング・ベクトルレジスタ・ファイル２２v_-21、２２v_-22、……、２２v_-2pのそれぞれの動作はＦＰＧＡで制御するので、情報は、マザー・マーチング主記憶装置３１_-0から第２の分岐マーチング主記憶装置３１_-2に、第２の分岐マーチング主記憶装置３１_-2から第２のマーチング・キャッシュメモリ２１_-21、２１_-22、……、２１_-2pに並列に、第２のマーチング・キャッシュメモリ２１_-21、２１_-22、……、２１_-2pから第２のマーチング・ベクトルレジスタ・ファイル２２v_-21、２２v_-22、……、２２v_-2pに並列に、及び第２のマーチング・ベクトルレジスタ・ファイル２２v_-21、２２v_-22、……、２２v_-2pから第２の演算パイプライン１１７_-21、１１７_-22、……、１１７_-2pに並列に移動する。第２の演算パイプライン１１７_-21、１１７_-22、……、１１７_-2pにおける処理の最終データは、第２のマーチング・ベクトルレジスタ・ファイル２２v_-21、２２v_-22、……、２２v_-2pに送られるので、データは、第２のマーチング・ベクトルレジスタ・ファイル２２v_-21、２２v_-22、……、２２v_-2pと第２の演算パイプライン１１７_-21、１１７_-22、……、１１７_-2pの間で双方向に転送される。更に、第２のマーチング・ベクトルレジスタ・ファイル２２v_-21、２２v_-22、……、２２v_-2pに格納したデータが、第２のマーチング・キャッシュメモリ２１_-21、２１_-22、……、２１_-2pに送られるので、データは、第２のマーチング・キャッシュメモリ２１_-21、２１_-22、……、２１_-2pと第２のマーチング・ベクトルレジスタ・ファイル２２v_-21、２２v_-22、……、２２v_-2pの間で双方向で転送され、第２のマーチング・キャッシュメモリ２１_-21、２１_-22、……、２１_-2pに格納したデータは第２の分岐マーチング主記憶装置３１_-2に送られるので、データは第２の分岐マーチング主記憶装置３１_-2と第２のマーチング・キャッシュメモリ２１_-21、２１_-22、……、２１_-2pの間で双方向に転送される。しかし、ＦＰＧＡは、第２の処理装置１２_-2で処理情報の反対方向に沿う流れがないように、命令の移動を制御する。

例えば、ソース・プログラムのループから生成したベクトル命令は、マザー・マーチング主記憶装置３１_-0から第１の処理装置１２_-1と第２の処理装置１２_-2と第３の処理装置１２_-3、……、とに並列に転送されるので、これらのベクトル命令の並列処理は、第１の処理装置１２_-1と第２の処理装置１２_-2と第３の処理装置１２_-3、……のそれぞれにおいて、演算パイプライン１１７_-11、１１７_-12、……、１１７_-1p、１１７_-21、１１７_-22、……、１１７_-2q……によって実行できる。

従来の計算機システムに用いられているＦＰＧＡ制御ＨＰＣシステムは大量の配線資源を必要とするので、時間的な遅延と浮遊容量がこれらの配線間で発生してボトルネックが発生する。これに対し、図６３に示す第４の実施形態に係るＨＰＣシステムにはこのようなボトルネックが発生しない。何故ならば、第４の実施形態に係るＨＰＣシステムにおいては、任意のデータ交換のためのデータバスやアドレスバスのようなバスが、第１のマーチング・ベクトルレジスタ・ファイル２２v_-11、２２v_-12、……、２２v_-1pと第１の演算パイプライン１１７_-11、１１７_-12、……、１１７_-1pの間、第１のマーチング・キャッシュメモリ２１_-11、２１_-12、……、２１_-1pと第１のマーチング・ベクトルレジスタ・ファイル２２v_-11、２２v_-12、……、２２v_-1pの間、第１の分岐マーチング主記憶装置３１_-1と第１のマーチング・キャッシュメモリ２１_-11、２１_-12、……、２１_-1pの間、第２のマーチング・ベクトルレジスタ・ファイル２２v_-21、２２v_-22、……、２２v_-2pと第２の演算パイプライン１１７_-21、１１７_-22、……、１１７_-2pの間、第２のマーチング・キャッシュメモリ２１_-21、２１_-22、……、２１_-2pと第２のマーチング・ベクトルレジスタ・ファイル２２v_-21、２２v_-22、……、２２v_-2pの間、第２の分岐マーチング主記憶装置３１_-2と第２のマーチング・キャッシュメモリ２１_-21、２１_-22、……、２１_-2pの間、マザー・マーチング主記憶装置３１_-0と第１の分岐マーチング主記憶装置３１_-1の間、及びマザー・マーチング主記憶装置３１_-0と第２の分岐マーチング主記憶装置３１_-2の間に存在しないからである。このため、図６３に示す第４の実施形態に係るＦＰＧＡ制御ＨＰＣシステムは、従来の計算機システムに用いられているＦＰＧＡ制御ＨＰＣシステムより、非常に高速の処理と低い電力消費とを実現できる。処理装置１２_-1、１２_-2、１２_-3、……の数を増やすと、第４の実施形態に係るＦＰＧＡ制御ＨＰＣシステムは、例えば、数千以上のスレッドを同時に非常に高速で実行できるので、高い計算機スループットを大量のデータに対して達成可能になる。

− 第５の実施形態 −
図６４に示すように、本発明の第５の実施形態に係る計算機システムは、プロセッサ１１と、プロセッサ１１に接続した３次元マーチング・レジスタ・ファイルを形成するマーチング・レジスタ・ファイル２２_-1、２２_-2、２２_-3、……のスタック（積層体）と、３次元マーチング・レジスタ・ファイル（２２_-1、２２_-2、２２_-3、……）に接続した３次元マーチング・キャッシュメモリを構成するマーチング・キャッシュメモリ２１_-1、２１_-2、２１_-3、……のスタック（積層体）と、３次元マーチング・キャッシュ（２１_-1、２１_-2、２１_-3、……）に接続した３次元マーチング主記憶装置を形成するマーチング主記憶装置３１_-1、３１_-2、３１_-3、……のスタック（積層体）と、を備えている。プロセッサ１１は、クロック信号を生成するクロック発生回路１１３を有する制御装置１１１と、クロック信号に同期して演算論理動作を実行する演算論理装置（ＡＬＵ）１１２とを含んでいる。

３次元マーチング・レジスタ・ファイル（２２_-1、２２_-2、２２_-3、……）において、第１のマーチング・レジスタ・ファイル２２_-1は、制御装置１１１に接続した第１のマーチング命令レジスタ・ファイル２２ａ_-1とＡＬＵ１１２に接続した第１のマーチング・データレジスタ・ファイル２２ｂ_-1とを含み、第２のマーチング・レジスタ・ファイル２２_-2は、制御装置１１１に接続した第２のマーチング命令レジスタ・ファイルとＡＬＵ１１２に接続した第２のマーチング・データレジスタ・ファイルとを含み、第３のマーチング・レジスタ・ファイル２２_-3は、制御装置１１１に接続した第３のマーチング命令レジスタ・ファイルとＡＬＵ１１２に接続した第３のマーチング・データレジスタ・ファイルを含み、以下同様である。３次元マーチング・キャッシュ（２１_-1、２１_-2、２１_-3、……）において、第１のマーチング・キャッシュメモリ２１_-1は、第１のマーチング命令キャッシュメモリ２１ａ-1と第１のマーチング・データキャッシュメモリ２１ｂ_-1とを含み、第２のマーチング・キャッシュメモリ２１_-2は、第２のマーチング命令キャッシュメモリと第２のマーチング・データキャッシュメモリとを含み、第３のマーチング・キャッシュメモリ２１_-3は、第３のマーチング命令キャッシュメモリと第３のマーチング・データキャッシュメモリとを含み、……（以下同様。）……。

図示を省略しているが、図４５〜図５１に示したマーチング主記憶装置３１と極めて類似しているが、マーチング主記憶装置３１_-1、３１_-2、３１_-3、……のそれぞれが、情報のユニットをそれぞれ格納したメモリユニットを２次元に配列した主記憶装置のアレイと、主記憶装置のアレイの入力端子と、主記憶装置のアレイの出力端子とを有している。マーチング主記憶装置３１_-1、３１_-2、３１_-3、……のそれぞれは、情報をメモリユニットのそれぞれに格納し、且つ、クロック信号に同期して、ステップごとに、主記憶装置のアレイの出力端子に向けて転送するので、格納されていた情報が３次元マーチング・キャッシュ（２１_-1、２１_-2、２１_-3、……）に能動的に逐次出力される。マーチング・キャッシュメモリ２１_-1，２１_-2、２１_-3、……のそれぞれは、キャッシュメモリユニットを２次元に配列したマーチング・キャッシュ・アレイと、マーチング・キャッシュ・アレイのキャッシュ入力端子と、マーチング・キャッシュ・アレイのキャッシュ出力端子とを有する。マーチング・キャッシュ・アレイのキャッシュ入力端子は、３次元マーチング主記憶装置（３１_-1、３１_-2、３１_-3、……）からマーチング主記憶装置（３１_-1、３１_-2、３１_-3、……）に格納されていた情報を受信する。マーチング・キャッシュメモリ２１_-1、２１_-2、２１_-3、……のそれぞれは、情報をキャッシュメモリユニットのそれぞれに格納し、且つ、クロック信号に同期して、ステップごとに、情報を隣接するキャッシュメモリユニットに転送して、最終的に、格納されていた情報が３次元マーチング・レジスタ・ファイル（２２_-1、２２_-2、２２_―３、……）に能動的且つ逐次的に送られる。マーチング・レジスタ・ファイル２２_-1、２２_-2、２２_-3、……のそれぞれは、情報のユニットをそれぞれ格納したレジスタ・ユニットを２次元に配列したレジスタ・アレイと、レジスタ・アレイの入力端子と、レジスタ・アレイの出力端子とを有する。レジスタ・アレイの入力端子は、３次元マーチング・キャッシュ（２１_-1、２１_-2、２１_-3、……）からマーチング・キャッシュ（２１_-1、２１_-2、２１_-3、……）に格納されていた情報を受信する。マーチング・レジスタ・ファイル２２_-1、２２_-2、２２_-3、……のそれぞれは、情報をレジスタ・ユニットのそれぞれに格納し、且つ、クロック信号に同期して、ステップごとに、レジスタ・アレイの出力端子に向けて転送し、最終的に、格納されていた情報がプロセッサ１１に能動的に逐次出力される。プロセッサ１１は、マーチング・レジスタ・ファイル２２_-1、２２_-2、２２_-3、……のそれぞれに格納されていた情報を用いて演算論理動作を実行する。

マーチング主記憶装置３１_-1，３１_-2、３１_-3、……のそれぞれは、半導体チップの表面にパターニングされたメモリユニットの２次元アレイで構成されている。複数の半導体チップが、図６５（ａ）に示すように垂直に積層され、３次元マーチング主記憶装置（３１_-1，３１_-2、３１_-3、……）を形成するように、複数の半導体チップの間に放熱板５８ｍ_-1、５８ｍ_-2、５８ｍ_-3、……を挟んでいる。放熱板５８ｍ_-1、５８ｍ_-2、５８ｍ_-3、……は、ダイアモンドのように高い熱伝導率を有する材料から製作することが好ましい。同様に、マーチング・キャッシュメモリ２１_-1、２１_-2、２１_-3、……のそれぞれは、半導体チップの表面にパターニングされたメモリユニットの２次元アレイで構成されている。複数の半導体チップが、図６５（ｂ）に示すように垂直に積層され、３次元マーチング・キャッシュ（２１_-1、２１_-2、２１_-3、……）を形成するように、複数の半導体チップの間に放熱板５８ｃ_-1、５８ｃ_-2、５８ｃ_-3、……を挟んでいる。マーチング・レジスタ・ファイル２２_-1、２２_-2、２２_-3、……のそれぞれは、半導体チップの表面にパターニングされたメモリユニットの２次元アレイで構成されている。複数の半導体チップが、図６５（ｃ）に示すように垂直に積層され、３次元マーチング・レジスタ・ファイル（２２_-1、２２_-2、２２_-3、……）を形成するように、複数の半導体チップの間に放熱板５８ｒ_-1、５８ｒ_-2、５８ｒ_-3、……を挟んでいる。放熱板５８ｃ_-1、５８ｃ_-2、５８ｃ_-3、……、５８ｒ_-1、５８ｒ_-2、５８ｒ_-3、……は、ダイアモンドのような高い熱伝導率を有する材料から製作することが好ましい。図６５（ａ）〜（ｃ）及び図６６に示す３次元構成では、半導体チップの表面の内部に接続配線がないので、放熱板５８ｃ_-1、５８ｃ_-2、５８ｃ_-3、……、５８ｃ_-1、５８ｃ_-2、５８ｃ_-3、……、５８ｒ_-1、５８ｒ_-2、５８ｒ_-3、……を半導体チップ間に挿入することが容易になる。図６５（ａ）〜（ｃ）及び図６６に示す構成は、任意の数の半導体チップをもつ積層構造に拡大できる。従来のアーキテクチュアでは、基本的に、従来の半導体チップを直接的に重ねるときに、熱問題のために、重ねる半導体チップの数に限界がある。第５の実施形態に係る計算機システムにおいては、図６５（ａ）〜（ｃ）及び図６６に示すサンドイッチ構造によって、計算している活性な半導体チップからシステムの外部に向けての熱の流れを、放熱板５８ｃ_-1、５８ｃ_-2、５８ｃ_-3、……、５８ｃ_-1、５８ｃ_-2、５８ｃ_-3、……、５８ｒ_-1、５８ｒ_-2、５８ｒ_-3、……を介して、より効率的に達成することができる。したがって、第５の実施形態に係る計算機システムでは、これらの半導体チップを、システムの規模に応じて積層することができる。又、図６５（ａ）〜（ｃ）及び図６６に示すように、マーチング主記憶装置３１_-1、３１_-2、３１_-3、……と、マーチング・キャッシュメモリ２１_-1、２１_-2、２１_-3、……と、マーチング・レジスタ・ファイル２２_-1、２２_-2、２２_-3、……とを含む複数の半導体チップを重ねて３次元構造を容易に実現できるので、拡張性のある計算機システムを構成して、システムの温度をより低温に維持することが容易にできる。

図示を省略しているが、３次元マーチング主記憶装置（３１_-1，３１_-2、３１_-3、……）と３次元マーチング・キャッシュ（２１_-1、２１_-2、２１_-3、……）は複数の接合部材で電気的に接続される。３次元マーチング・キャッシュ（２１_-1、２１_-2、２１_-3、……）と３次元マーチング・レジスタ・ファイル（２２_-1、２２_-2、２２_-3、……）は複数の接合部材で電気的に接続され、３次元マーチング・レジスタ・ファイル（２２_-1、２２_-2、２２_-3、……）とプロセッサ１１は他の複数の接合部材で電気的に接続される。ＡＬＵ１１２における処理の最終データは、３次元マーチング・レジスタ・ファイル（２２_-1、２２_-2、２２_-3、……）に接合部材を介して出力されるので、データは、３次元マーチング・レジスタ・ファイル（２２_-1、２２_-2、２２_-3、……）とＡＬＵ１１２との間で双方向に転送される。更に、３次元マーチング・レジスタ・ファイル（２２_-1、２２_-2、２２_-3、……）に格納したデータは、３次元マーチング・キャッシュ（２１_-1、２１_-2、２１_-3、……）に接合部材を介して出力されるので、データは、３次元マーチング・キャッシュ（２１_-1、２１_-2、２１_-3、……）と３次元マーチング・レジスタ・ファイル（２２_-1、２２_-2、２２_-3、……）との間で双方向に転送される。更に、３次元マーチング・キャッシュ（２１_-1、２１_-2、２１_-3、……）に格納したデータは、３次元マーチング主記憶装置（３１_-1，３１_-2、３１_-3、……）に接合部材を介して出力されるので、データは、３次元マーチング主記憶装置（３１_-1，３１_-2、３１_-3、……）と３次元マーチング・キャッシュ（２１_-1、２１_-2、２１_-3、……）との間で双方向に転送される。

逆に、３次元マーチング主記憶装置（３１_-1，３１_-2、３１_-3、……）から３次元マーチング・キャッシュ（２１_-1、２１_-2、２１_-3、……）に、３次元マーチング・キャッシュ（２１_-1、２１_-2、２１_-3、……）から３次元マーチング・レジスタ・ファイル（２２_-1、２２_-2、２２_-3、……）に、及び３次元マーチング・レジスタ・ファイル（２２_-1、２２_-2、２２_-3、……）から制御装置１１１に向かい、命令の流れは１方向だけである。例えば、ソース・プログラムのループから生成したベクトル命令は、３次元マーチング主記憶装置（３１_-1、３１_-2、３１_-3、……）から３次元マーチング・キャッシュ（２１_-1、２１_-2、２１_-3、……）へ転送される。そして、３次元マーチング・キャッシュ（２１_-1、２１_-2、２１_-3、……）を介して３次元マーチング・レジスタ・ファイル（２２_-1、２２_-2、２２_-3、……）へ転送され、３次元マーチング・レジスタ・ファイル（２２_-1、２２_-2、２２_-3、……）を介して制御装置１１１に転送される。この結果、これらの転送されたベクトル命令のそれぞれを、制御装置１１１の演算パイプラインで実行できる。図６４に示す第５の実施形態に係る計算機システムには、任意のデータ交換におけるデータバスやアドレスバス等のバスが、３次元マーチング主記憶装置（３１_-1，３１_-2、３１_-3、……）と３次元マーチング・キャッシュ（２１_-1、２１_-2、２１_-3、……）との間にも、３次元マーチング・キャッシュ（２１_-1、２１_-2、２１_-3、……）と３次元マーチング・レジスタ・ファイル（２２_-1、２２_-2、２２_-3、……）との間にも、及び３次元マーチング・レジスタ・ファイル（２２_-1、２２_-2、２２_-3、……）とプロセッサ１１との間にも、いずれも存在しない。一方、従来の計算機システムでは、配線又はバスがボトルネックを形成している。第５の実施形態に係る計算機システムによれば、バス間に時間的な遅延と浮遊容量を生じるグローバルな配線がないので、従来の計算機システムより遙かに高速の処理と低い電力消費とを実現できる。更に、計算機システムの温度を従来の計算機システムより低い温度に維持できるので、第５の実施形態に係る計算機システムによれば、ダイアモンドのように高い熱伝導率を有する材料からなり、且つ半導体チップ間に設けた、放熱板５８ｃ_-1、５８ｃ_-2、５８ｃ_-3、……、５８ｃ_-1、５８ｃ_-2、５８ｃ_-3、……、５８ｒ_-1、５８ｒ_-2、５８ｒ_-3、……を採用することにより、「クールな（冷却された）計算機」を構築できる。第５の実施形態に係るクールな計算機は従来の計算機とは異なるものである。何故ならば、クールな計算機は、平均すると、３０％もエネルギー消費が少なく且つ１００００％もサイズが小さく、例えば、１００倍の速度を得るように検討され、設計されているからである。

第５の実施形態に係る計算機システムの他の機能、構成や動作方法等は、第１〜第３の実施形態で既に説明した機能、構成や方式等と実質的に類似しているので、重複した冗長な説明は省略する。

（種々の３次元構成）
図６４、図６５（ａ）、図６５（ｂ）及び図６５（ｃ）に示す３次元構成は単なる例であり、拡張性のある計算機システムの構成を実現する３次元構造を達成する方法として、種々の方式や組み合わせがある。

例えば、図６６に示すように、複数の演算パイプライン１１７と複数のマーチング・レジスタ・ファイル２２とを集積化した第１のチップ（上段のチップ）と、マーチング・キャッシュメモリ２１を集積化した第２のチップ（中間のチップ）と、マーチング主記憶装置３１を集積化した第３のチップ（下段のチップ）を、垂直に積層することができる。演算パイプライン１１７のそれぞれはベクトル処理装置を含むことができ、マーチング・レジスタ・ファイル２２のそれぞれはマーチング・ベクトルレジスタを含むことができる。第１と第２のチップ間に、複数の接合部材５５ａが挿入され、第２と第３のチップ間に、複数の接合部材５５ｂが挿入される。例えば、接合部材５５ａと５５ｂのそれぞれは、半田ボール、金（Ａｕ）バンプ、銀（Ａｇ）バンプ、銅（Ｃｕ）バンプ、ニッケル−金（Ｎｉ−Ａｕ）合金バンプ、又はニッケル−金−インジウム（Ｎｉ−Ａｕ−Ｉｎ）合金バンプなどのような導電性バンプで形成できる。図示を省略しているが、放熱板は、図６５（ａ）〜（ｃ）及び図６６に示す構成と同様に、「クールなチップ」を実現するように、第１と第２のチップ間及び第２と第３のチップ間に挿入できる。

或いは、図６７及び図６８に示すように、第１の上段チップ、第１の中間チップ及び第１の下段チップを含む第１の３次元（３Ｄ）スタックと、第２の上段チップ、第２の中間チップ及び第２の下段チップとを含む第２の３Ｄスタックは、同じ基板又は同じ回路基板上に２次元状に設けて、マルチプル・プロセッサとの並列計算が可能になる。図６７及び図６８に示す構造では、第１の３Ｄスタックと第２の３Ｄスタックが、ブリッジ５９ａ及びブリッジ５９ｂによって互いに接続されている。

第１の３Ｄスタックでは、複数の第１の演算パイプライン１１７_-1と複数の第１のマーチング・レジスタ・ファイル２２_-1を集積化した第１の上段チップと、第１のマーチング・キャッシュメモリ２１_-1を集積化した第１の中間チップと、第１のマーチング主記憶装置３１_-1を集積化した第１の下段チップが、垂直に３Ｄで積層されている。第１の演算パイプライン１１７_-1のそれぞれがベクトル処理装置を含み、第１のマーチング・キャッシュ・ファイル２２_-1のそれぞれはマーチング・ベクトルレジスタを含んでいる。第１の上段チップと第１の中間チップの間に複数の接合部材５５ａ_-1が挿入され、第１の中間チップと第１の下段チップの間に複数の接合部材５５ｂ_-1が挿入されている。例えば、接合部材５５ａ_-1と５５ｂ_-1のそれぞれは、半田ボール、金（Ａｕ）バンプ、銀（Ａｇ）バンプ、銅（Ｃｕ）バンプ、ニッケル−金（Ｎｉ−Ａｕ）合金バンプ、又はニッケル−金−インジウム（Ｎｉ−Ａｕ−Ｉｎ）合金バンプなどのような導電性バンプで形成できる。同様に、第２の３Ｄスタックでは、複数の第２の演算パイプライン１１７_-2と複数の第２のマーチング・レジスタ・ファイル２２_-2を集積化した第２の上段チップと、第２のマーチング・キャッシュメモリ２１_-2を集積化した第２の中間チップと、第２のマーチング主記憶装置３１_-2を集積化した第２の下段チップが、垂直に３Ｄで積層されている。第２の演算パイプライン１１７_-2のそれぞれがベクトル処理装置を含み、第２のマーチング・キャッシュ・ファイル２２_-2のそれぞれがマーチング・ベクトルレジスタを含んでいる。第２の上段チップと第２の中間チップの間に複数の接合部材５５ａ_-2が挿入され、第２の中間チップと第２の下段チップの間に複数の接合部材５５ｂ_-2が挿入されている。例えば、例えば、接合部材５５ａ_-2と５５ｂ_-2のそれぞれは、半田ボール、金（Ａｕ）バンプ、銀（Ａｇ）バンプ、銅（Ｃｕ）バンプ、ニッケル−金（Ｎｉ−Ａｕ）合金バンプ、又はニッケル−金−インジウム（Ｎｉ−Ａｕ−Ｉｎ）合金バンプなどのような導電性バンプで形成できる。図示を省略しているが、放熱板は、第１の上段チップと第１の中間チップの間、第１の中間チップと第１の下段チップの間、第２の上段チップと第２の中間チップの間、及び第２の中間チップと第２の下段チップの間に、図６５（ａ）〜（ｃ）及び図６６に示す構成と同様に挿入して、「クールなチップ」を達成できる。

第４の実施形態に係る計算機システムと同様に、フィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡ）は、ベクトル処理のスレッド又はチェイニングを第１の演算パイプライン１１７_-1と第２の演算パイプライン１１７_-2上で移行して、ＨＰＣシステムを形成することにより、第１の３Ｄスタックと第２の３Ｄスタックの動作を切り替えて制御できるので、これは、ＧＰＵを基礎とした汎用計算に使用できる。

更に代わりに、図６９に示すように、複数の演算パイプライン１１７を集積化した第１のチップ（最上段チップ）と、複数のマーチング・レジスタ・ファイル２２を集積化した第２のチップと、マーチング・キャッシュメモリ２１を集積化した第３のチップと、第１のマーチング主記憶装置３１_-1を集積化した第４のチップと、マーチング主記憶装置３１_-2を集積化した第５のチップと、第３のマーチング主記憶装置３１_-3を集積化した第６のチップ（最下段チップ）とを、垂直に重ねることができる。演算パイプライン１１７のそれぞれはベクトル処理装置を含み、マーチング・レジスタ・ファイル２２のそれぞれはマーチング・ベクトルレジスタを含むので、ソース・プログラムのループから生成したベクトル命令は、ベクトル処理装置で実行できる。第１の放熱板５８_-1が第１と第２のチップ間に挿入され、第２の放熱板５８_-2が第２と第３のチップ間に挿入され、第３の放熱板５８_-1が第３と第４のチップ間に挿入され、第４の放熱板５８_-4が第４と第５のチップ間に挿入され、第５の放熱板５８_-5が第５と第６のチップ間に挿入されて、「クールなチップ」が実現する。図６９に示す３次元構成のこれらのクールなチップの表面の内部に接続配線がないので、ダイアモンド・チップのような放熱板５８_-1、５８_-2、５８_-3、５８_-4、５８_-5を、これらの６個のチップ間に交互に挿入することが容易になる。

図６９に示すクールなチップの構成は、６個のチップの場合に限定されない。任意の数のチップをもつ３次元の積層構造に拡大できる。何故ならば、図６９に示すサンドイッチ構造は、熱の流れを、計算を実行中の活性なチップから、放熱板５８_-1、５８_-2、５８_-3、５８_-4、５８_-5を介してクールな計算機システムの外部に向けて、より効果的に確立するのに適しているからである。したがって、第５の実施形態に係る計算機システムにおけるクールなチップの数は、計算機システムの規模に比例して増加できる。

図７０〜図７２は、本発明の第５の実施形態に係る計算機システムの基本的なコアの一部を形成する、３次元（３Ｄ）スタックの様々な例を示す。３Ｄスタックのそれぞれは、半導体メモリチップ３ａと半導体メモリチップ３ｂの間に挿入したダイアモンド板のような放熱板５８をもつ冷却技術によって実現されている。半導体メモリチップ３ａ及び半導体メモリチップ３ｂには、マーチング記憶装置ファミリとして分類されたマーチング記憶装置の少なくとも一つが集積化されている。「マーチング記憶装置ファミリ」という用語は、第２の実施形態で説明したＡＬＵ１１２に接続するマーチング命令レジスタ・ファイル２２ａとマーチング・データレジスタ・ファイル２２ｂと、第３の実施形態で説明したマーチング命令キャッシュメモリ２１ａ及びマーチング・データキャッシュメモリ２１ｂとを、第１の実施形態で説明されたマーチング主記憶装置３１に加えて含んだ上位概念を示す語である。

即ち、図７０に示すように、本発明の第５の実施形態に係る計算機システムの基本的なコアの一部を形成する３Ｄスタックは、マーチング記憶装置ファミリに含まれるマーチング記憶装置の少なくとも一つを集積化した第１の半導体メモリチップ３ａと、第１の半導体メモリチップ３ａの下に設けた放熱板５８と、マーチング記憶装置ファミリに含まれるマーチング記憶装置の少なくとも一つを集積化した放熱板５８の下に設けた第２の半導体メモリチップ３ｂと、放熱板５８の側面に設けたプロセッサ１１と、を備えている。図７０では、プロセッサ１１の位置が一例として図示してあるが、プロセッサ１１は、３Ｄスタックの設計の選択に基づいて、３Ｄスタックの構造内又は３Ｄスタックの外部の任意の必要な、若しくは適当な場所に設けることができる。例えば、プロセッサ１１は、第１の半導体メモリチップ３ａと同じ水平レベル又は第２の半導体メモリチップ３ｂのレベルにおくことができる。第１の半導体メモリチップ３ａ上に集積化したマーチング記憶装置と第２の半導体メモリチップ３ｂ上に集積化したマーチング記憶装置は、それぞれ、プログラム命令を格納している。第１の半導体メモリチップ３ａと放熱板５８と第２の半導体メモリチップ３ｂが垂直に積層されている図７０に示す３Ｄ構成において、第１の制御経路（パス）が第１の半導体メモリチップ３ａとプロセッサ１１との間に設けられ、第２の制御経路（パス）が第２の半導体メモリチップ３ｂとプロセッサ１１の間に設けられているので、プロセッサ１１による制御処理の実行を促進することができる。更なるデータの伝搬経路が、第１の半導体メモリチップ３ａと第２の半導体メモリチップ３ｂとの間に設けられているので、第１の半導体メモリチップ３ａと第２の半導体メモリチップ３ｂとの間におけるプログラム命令の直接な通信を促進することができる。

そして、図７１に示すように、本発明の第５の実施形態に係る計算機システムの基本的なコアの一部を形成する他の３Ｄスタックは、マーチング記憶装置ファミリに含まれるマーチング記憶装置の少なくとも一つを集積化した第１の半導体メモリチップ３ａと、第１の半導体メモリチップ３ａの下に設けた放熱板５８と、マーチング記憶装置ファミリに含まれるマーチング記憶装置の少なくとも一つを集積化した放熱板５８の下に設けた第２の半導体メモリチップ３ｂと、放熱板５８の側面に設けたＡＬＵ１１２と、を備えている。ＡＬＵ１１２の位置は図７１に示す場所に限定されない、そして、ＡＬＵ１１２は、３Ｄスタックの設計の選択に基づいて、第１の半導体メモリチップ３ａと同じ水平レベルで又は第２の半導体メモリチップ３ｂのレベルでおかれた場所のように、３Ｄスタックの構造内で又は３Ｄスタックの外部で、任意の必要な又は適当な場所に設けることができる。第１の半導体メモリチップ３ａ上に集積化したマーチング記憶装置と第２の半導体メモリチップ３ｂ上に集積化したマーチング記憶装置は、それぞれ、スカラデータの読取／書き込みを行う。第１の半導体メモリチップ３ａと放熱板５８と第２の半導体メモリチップ３ｂが垂直に積層されている、図７１に示す３Ｄ構成では、第１のデータの伝搬経路が第１の半導体メモリチップ３ａとＡＬＵ１１２との間に設けられ、第２のデータの伝搬経路が第２の半導体メモリチップ３ｂとＡＬＵ１１２の間に設けられているので、ＡＬＵ１１２によるスカラデータ処理の実行を促進することができる。更なるデータの伝搬経路が、第１の半導体メモリチップ３ａと第２の半導体メモリチップ３ｂとの間に設けられているので、第１の半導体メモリチップ３ａと第２の半導体メモリチップ３ｂとの間におけるスカラデータの直接な通信を促進できる。

更に、図７２に示すように、本発明の第５の実施形態に係る計算機システムの基本的なコアの一部を形成する更に他の３Ｄスタックは、マーチング記憶装置ファミリに含まれるマーチング記憶装置の少なくとも一つを集積化した第１の半導体メモリチップ３ａと、第１の半導体メモリチップ３ａの下に設けた放熱板５８と、マーチング記憶装置ファミリに含まれるマーチング記憶装置の少なくとも一つを集積化し且つ放熱板５８の下に設けた第２の半導体メモリチップ３ｂと、放熱板５８の側面に設けた演算パイプライン１１７と、を備えている。図６２と６３に示す形状と同様に、演算パイプライン１１７の位置は図７２に示す場所に限定されない、そして、演算パイプライン１１７は、任意の必要な又は適当な場所に設けられることができる。第１の半導体メモリチップ３ａ上に集積化したマーチング記憶装置と第２の半導体メモリチップ３ｂ上に集積化したマーチング記憶装置は、それぞれ、ベクトル・データ又はストリーミング・データの読取／書き込みを行う。第１の半導体メモリチップ３ａと放熱板５８と第２の半導体メモリチップ３ｂが垂直に積層されている、図７２に示す３Ｄ構成において、第１のデータの伝搬経路が第１の半導体メモリチップ３ａと演算パイプライン１１７との間に設けられ、第２のデータの伝搬経路が第２の半導体メモリチップ３ｂと演算パイプライン１１７との間に設けられているので、演算パイプライン１１７によるベクトル／ストリーミング・データ処理の実行を促進できる。更なるデータの伝搬経路が、第１の半導体メモリチップ３ａと第２の半導体メモリチップ３ｂとの間に設けられているので、第１の半導体メモリチップ３ａと第２の半導体メモリチップ３ｂとの間におけるベクトル／ストリーミング・データの直接的な通信を促進できる。

図７３に示すように、第５の実施形態に係る３Ｄハイブリッド計算機システムは、マーチング記憶装置ファミリに含まれるマーチング記憶装置の少なくとも一つを集積化した第１の左側チップ（最上部の左側チップ）３ｐ_-1と、マーチング記憶装置ファミリに含まれるマーチング記憶装置の少なくとも一つを集積化した第２の左側チップ３ｐ_-2と、マーチング記憶装置ファミリに含まれるマーチング記憶装置の少なくとも一つを集積化した第３の左側チップ３ｐ_-3と、マーチング記憶装置ファミリに含まれるマーチング記憶装置の少なくとも一つを集積化した第４の左側チップ３ｐ_-4と、マーチング記憶装置ファミリに含まれるマーチング記憶装置の少なくとも一つを集積化した第５の左側チップ３ｐ_-5と、マーチング記憶装置ファミリに含まれるマーチング記憶装置の少なくとも一つを集積化した第６の左側チップ（最下部の左側チップ）３ｐ_-6と、を備え、第１の左側チップ３ｐ_-1〜第６の左側チップ３ｐ_-6は、垂直に積層されている。第１の左放熱板５８ａ_-1は第１の左側チップ３ｐ_-1と第２の左側チップ３ｐ_-2との間に挿入され、第２の左放熱板５８ａ_-2は第２の左側チップ３ｐ_-2と第３の左側チップ３ｐ_-3との間に挿入され、第３の左放熱板５８ａ_-1は第３の左側チップ３ｐ_-3と第４の左側チップ３ｐ_-4との間に挿入され、第４の左放熱板５８ａ_-4は第４の左側チップ３ｐ_-4と第５の左側チップ３ｐ_-5との間に挿入され、第５の左放熱板５８ａ_-5は第５の左側チップ３ｐ_-5と第６の左側チップ３ｐ_-6との間に挿入されているので、「クールな左側チップ」を実現できる。

そして、マーチング記憶装置ファミリに含まれるマーチング記憶装置の少なくとも一つを集積化した第１の右側チップ（最上部の右側チップ）３ｑ_-1と、マーチング記憶装置ファミリに含まれるマーチング記憶装置の少なくとも一つを集積化した第２の右側チップ３ｑ_-2と、マーチング記憶装置ファミリに含まれるマーチング記憶装置の少なくとも一つを集積化した第３の右側チップ３ｑ_-3と、マーチング記憶装置ファミリに含まれるマーチング記憶装置の少なくとも一つを集積化した第４の右側チップ３ｑ_-4と、マーチング記憶装置ファミリに含まれるマーチング記憶装置の少なくとも一つを集積化した第５の右側チップ３ｑ_-5と、マーチング記憶装置ファミリに含まれるマーチング記憶装置の少なくとも一つを集積化した第６の右側チップ（最下部の右側チップ）３ｑ_-6とが、垂直に積層されている。第１の右放熱板５８ｂ_-1は第１の右側チップ３ｑ_-1と第２の右側チップ３ｑ_-2との間に挿入され、第２の右放熱板５８ｂ_-2は第２の右側チップ３ｑ_-2と第３の右側チップ３ｑ_-3との間に挿入され、第３の右放熱板５８ｂ_-1は第３の右側チップ３ｑ_-3と第４の右側チップ３ｑ_-4との間に挿入され、第４の右放熱板５８ｂ_-4は第４の右側チップ３ｑ_-4と第５の右側チップ３ｑ_-5との間に挿入され、第５の右放熱板５８ｂ_-5は第５の右側チップ３ｑ_-5と第６の右側チップ３ｑ_-6との間に挿入されているので、「クールな右側チップ」を実現できる。

第１の処理装置１１ａが第１の左放熱板５８ａ_-1と第１の右放熱板５８ｂ_-1との間に設けられ、第２の処理装置１１ｂが第３の左放熱板５８ａ_-3と第３の右放熱板５８ｂ_-3との間に設けられ、第３の処理装置１１ｃが第５の左放熱板５８ａ-5と第５の右放熱板５８ｂ_-5との間に設けられ、そして、パイプラインのＡＬＵは、処理装置１１ａ、１１ｂ、１１ｃに、それぞれ、含まれている。

スカラデータの伝搬経路と制御経路（パス）は第１の左側チップ３ｐ_-1と第２の左側チップ３ｐ_-2の間に構築され、スカラデータの伝搬経路と制御経路は第２の左側チップ３ｐ_-2と第３の左側チップ３ｐ_-3の間に構築され、スカラデータの伝搬経路と制御経路は第３の左側チップ３ｐ_-3と第４の左側チップ３ｐ_-4の間に構築され、スカラデータの伝搬経路と制御経路は第４の左側チップ３ｐ_-4と第５の左側チップ３ｐ_-5の間に構築され、スカラデータの伝搬経路と制御経路は第５の左側チップ３ｐ_-5と第６の左側チップ３ｐ_-6の間に構築され、スカラデータの伝搬経路と制御経路は第１の右側チップ３ｑ_-1と第２の右側チップ３ｑ_-2の間に構築され、スカラデータの伝搬経路と制御経路は第２の右側チップ３ｑ_-2と第３の右側チップ３ｑ_-3の間に構築され、スカラデータの伝搬経路と制御経路は第３の右側チップ３ｑ_-3と第４の右側チップ３ｑ_-4の間に構築され、スカラデータの伝搬経路と制御経路は第４の右側チップ３ｑ_-4と第５の右側チップ３ｑ_-5の間に構築され、スカラデータの伝搬経路と制御経路は第５の右側チップ３ｑ_-5と第６の右側チップ３ｑ_-6の間に構築される。図７３に示す３Ｄ計算機システムは、スカラデータだけでなくベクトル／ストリーミング・データも、計算機システムのためにスカラデータの伝搬経路と制御経路の組み合わせを介して実行できる。

図７３に示す３Ｄ構成では、これらのクールなチップの表面の内部に接続配線がないので、ダイアモンド左側チップのような放熱板５８ａ_-1、５８ａ_-2、５８ａ_-3、５８ａ_-4、５８ａ_-5を、これらの６個の左側チップの間に交互に挿入することが容易になり、且つダイアモンド右側チップのような放熱板５８ｂ_-1、５８ｂ_-2、５８ｂ_-3、５８ｂ_-4、５８ｂ_-5を、これらの６個の右側チップの間に交互に挿入することが容易になる。

−その他の実施形態 −
様々な変形例が、本件の開示の示唆事項から、その趣旨から逸脱せずに、当業者に可能と思われる。

図４〜図６、図８、図１１、図３１、図１６〜２０、図２２、図２５、図３２において、ｎＭＯＳトランジスタがビットレベル・セルのトランジスタ・レベル表現における転送トランジスタとリセット・トランジスタとして、それぞれ、配置してあるが、図４〜図６、図８、図１１、図３１、図１６〜２０、図２２、図２５、図３２の図示を単なる概略的な例なので、ｐＭＯＳトランジスタが、クロック信号の逆の極性を採用する場合に、転送トランジスタとリセット・トランジスタとして使用できる。更に、窒化ケイ素膜、ＯＮＯ膜、ＳｒＯ膜、Ａｌ_２Ｏ_３膜、ＭｇＯ膜、Ｙ_２Ｏ_３膜、ＨｆＯ_２膜、ＺｒＯ_２膜、Ｔａ_２Ｏ_５膜、Ｂ_i2Ｏ_３膜、ＨｆＡｌＯ膜などからなるゲート絶縁膜を有するＭＩＳトランジスタ又は絶縁ゲート・トランジスタを、転送トランジスタやリセット・トランジスタに使用できる。

ビットレベル、命令レベル、データ、タスクの並列処理のような並列計算に関して幾つかの異なる形態がある。「フリンの分類法」として知られているように、プログラムと計算機は、それらが命令の単一セット又は多重セットを用いて動作しているかについて、これらの命令がデータの単一又は多重セットを用いているかどうかにかかわらず区分けされている。

例えば、図７４に示すように、マーチング・レジスタ・ファイルとマーチング・キャッシュメモリとマーチング主記憶装置とを既に第１〜第５の実施形態で述べたように含むマーチング記憶装置は、多重命令単一データ（ＭＩＳＤ）アーキテクチュアにおけるスカラ／ベクトル・データのビットレベル並列処理を実施できる。それにより、第１のプロセッサ１１_-1、第２のプロセッサ１１_-2、第３のプロセッサ１１_-3、第４のプロセッサ１１_-4、……に対して垂直に設けた多数の独立した命令の流れが、プロセッサ１１_-1、１１_-2、１１_-3、１１_-4のシストリック・アレイにより一回でデータの単一の水平の流れ上で平行に動作する。

或いは、既に第１〜第５の実施形態で述べたマーチング・レジスタ・ファイルとマーチング・キャッシュメモリとマーチング主記憶装置とを単一命令多重データ（ＳＩＭＤ）アーキテクチュアで含むマーチング記憶装置により、図７５に示す演算レベル並列処理が実現できる。図７５では、単一命令流が第１のプロセッサ１１_-1と第２のプロセッサ１１_-2と第３のプロセッサ１１_-3と第４のプロセッサ１１_-4とに呈せられるので、単一命令流は、プロセッサ１１_-1、１１_-2、１１_-3、１１_-4のアレイにより、一度にデータの多重垂直流で動作できる。

更に代わりに、既に第１〜第５の実施形態で述べたマーチング・レジスタ・ファイルとマーチング・キャッシュメモリとマーチング主記憶装置とを含むマーチング記憶装置は、図７６に示すように、第１の命令Ｉ₁と第２の命令Ｉ₂と第３の命令Ｉ₃と第４の命令Ｉ₄によって、第１のプロセッサ１１_-1と第２のプロセッサ１１_-2と第３のプロセッサ１１_-3と第４のプロセッサ１１_-4におけるベクトル処理での一般的なチェイニングを形成できる。

更に、図７７に示すように、既に第１〜第５の実施形態で述べたマーチング・レジスタ・ファイルとマーチング・キャッシュメモリとマーチング主記憶装置とを含むマーチング記憶装置は、第１のプロセッサ１１_-1と第２のプロセッサ１１_-2と第３のプロセッサ１１_-3と第４のプロセッサ１１_-4とにより、ＭＩＳＤアーキテクチュアにおけるスカラ／ベクトル・データの単一水平流の並列処理を実行できる。

更に、既に第１〜第５の実施形態で述べたマーチング・レジスタ・ファイルとマーチング・キャッシュメモリとマーチング主記憶装置とを含むマーチング記憶装置は、図７８に示すように、乗算を実行する第１のプロセッサ１１_-1と、加算を実行する第２のプロセッサ１１_-2と、乗算を実行する第３のプロセッサ１１_-3と、加算を実行する第４のプロセッサ１１_-4とにより、ＭＩＳＤアーキテクチュアにおけるスカラ／ベクトル・データの単一水平流の並列処理を実行できる。

更に、処理レベル並列処理については、単一スレッド流及びデータ流アーキテクチュア、単一スレッド流及び多重データ流アーキテクチュア、多重スレッド流及び単一データ流アーキテクチュア、多重スレッド流及び多重データ流アーキテクチュアが、既に第１〜第５の実施形態で述べたマーチング・レジスタ・ファイルとマーチング・キャッシュメモリとマーチング主記憶装置とを含むマーチング記憶装置により実現できる。

図４１を参照して、スカラデータ又はプログラム命令に対する従来型記憶装置の最悪の場合の速度／処理能力を、マーチング主記憶装置３１の速度／処理能力と比較した。図４１（ｂ）の斜線部分は、１００個のメモリユニットＵ_１、Ｕ_２、Ｕ_２、……、Ｕ₁₀₀からなるマーチング主記憶装置３１の速度／処理能力を概略的に示し、図４１（ａ）に示す従来型記憶装置の最悪の場合の速度／処理能力と比較した。最悪の場合で、我々は、マーチング主記憶装置３１の９９個のメモリユニットを読み出せるが、それらはスカラ・プログラムの規定のために使用できないと述べた。しかし、図７９（ｂ）に示す「複合マーチングメモリ」スキームにより、我々は、スカラデータ又はプログラム命令に対するマーチングメモリの速度／処理能力を改善できる。そして、複数のマーチング・メモリーブロックＭＭ₁₁、ＭＭ₁₂、ＭＭ₁₃，-----、ＭＭ₁₆；ＭＭ₂₁、ＭＭ₂₂、ＭＭ₂₃、-----、ＭＭ₂₆；ＭＭ₃₁、ＭＭ₃₂、ＭＭ₃₃、-----、ＭＭ₃₆；-----、；ＭＭ₅₁、ＭＭ₅₂、ＭＭ₅₃、-----、ＭＭ₅₆が、２次元で配列され、単一半導体チップ６６上に集積化している。指定のマーチング・メモリーブロックＭＭ_ij（ｉ＝１〜５；ｊ＝１〜６）が、複数のマーチング・メモリーブロックＭＭ₁₁、ＭＭ₁₂、ＭＭ₁₃，-----、ＭＭ₁₆；ＭＭ₂₁、ＭＭ₂₂、ＭＭ₂₃、-----、ＭＭ₂₆；ＭＭ₃₁、ＭＭ₃₂、ＭＭ₃₃、-----、ＭＭ₃₆；-----、；ＭＭ₅₁、ＭＭ₅₂、ＭＭ₅₃、-----、ＭＭ₅₆から、ダイナミック・ランダムアクセス・メモリ（ＤＲＡＭ）アーキテクチュアに採用しているランダムアクセス方式と同様にランダムにアクセスできる。

図７９（ａ）に示すように、従来のＤＲＡＭでは、メモリアレイ領域６６１と、行デコーダ用周辺回路６６２と、感知増幅器用周辺回路６６３と、列デコーダ用周辺回路６６４が、単一半導体チップ６６上に集積化されている。複数のメモリセルが、メモリアレイ領域６６１の行と列からなるアレイに配置してあるので、メモリセルの各行は共通の「ビット」ラインを共有し、セルの各列が共通「ビット」ラインを共有し、アレイのメモリセルの位置が、その「ワード」と「ビット」ラインの交点と定められている。「書き込み」動作中に、書き込むべきデータ（‘１’又は‘０’）が列デコーダ６６４から「ビット」線に記され、「ワード線」が、行デコーダ６６２からアサートされるので、メモリセルのアクセス・トランジスタがオンする。コンデンサは、ビット・ラインの状態に基づいて充電又は放電が可能になる。「読取」動作中に、「書き込み」ラインも、行デコーダ６６２からアサートされるので、アクセス・トランジスタがオンする。使用可能なトランジスタにより、コンデンサの電圧を、「ビット」ラインを介して感知増幅器６６３から読み取ることができる。感知増幅器６６３は、‘１’又は‘０’がメモリセルに格納してあるかどうかについて、感知したコンデンサ電圧と閾値を比較して決定できる。

複雑な図面になることを避けるために、図７９（ｂ）では６×５＝３０個のマーチング・メモリーブロックＭＭ₁₁、ＭＭ₁₂、ＭＭ₁₃，-----、ＭＭ₁₆；ＭＭ₂₁、ＭＭ₂₂、ＭＭ₂₃、-----、ＭＭ₂₆；ＭＭ₃₁、ＭＭ₃₂、ＭＭ₃₃、-----、ＭＭ₃₆； -----、；ＭＭ₅₁、ＭＭ₅₂、ＭＭ₅₃、-----、ＭＭ₅₆を半導体チップ６６に描いたが、図面は便宜上の模式表現にすぎない。５１２ＭビットのＤＲＡＭチップ技術を図７９（ｂ）に示す複合マーチングメモリ方式の製造技術として想定し、一方向マーチングメモリを配列すると仮定すると、実際には、千個の２５６ｋビットの容量のマーチング・メモリーブロックＭＭ_ij（ｉ＝１〜ｓ；ｊ＝１〜ｔ；及びｓ×ｔ＝１０００）が同一半導体チップ６６上に配列できる。即ち、２５６ｋビットの容量を有するマーチング・メモリーブロックＭＭ_ijのそれぞれをモノリシックに半導体チップ６６に集積化するために必要な領域として、５１２ｋビットＤＲＡＭブロックと等価な領域が必要になる。何故ならば、図４〜図６に示すように、一方向マーチング・メモリーブロックのそれぞれが２個のトランジスタと１個のコンデンサからなるビットレベル・セルで形成されているからである。これに対して、ＤＲＡＭメモリセルは、コンデンサがペアになっている１個だけのトランジスタから構成している。或いは、一方向マーチングメモリのアレイについて、１２８ｋビット容量の千個のマーチング・メモリーブロックＭＭ_ijを、５１２ＭビットＤＲＡＭチップの同一半導体チップ６６に採用できる。即ち、１２８ｋビット容量を有するマーチング・メモリーブロックＭＭ_ijのそれぞれをモノリシックに集積化する領域として、５１２ｋビットＤＲＡＭブロックに対して等価な領域が必要になる。何故ならば、ＤＲＡＭメモリセルは１個のトランジスタと１個のコンデンサだけからなるが、一方向のマーチング・メモリーブロックは、図３２に示すように、４個のトランジスタと２個のコンデンサからなるビットレベル・セルで形成されているからである。１個のＧビットＤＲＡＭチップ技術を想定した場合は、２５６ｋビット容量の千個の一方向マーチング・メモリーブロックＭＭ_ijが、２５６Ｍビットのマーチングメモリチップを形成するのに必要なＤＲＡＭチップ６６の上に配列できる。

したがって、千個のマーチング・メモリーブロックＭＭ_ij又は千個のマーチングメモリ・コアが、図７９（ｂ）に示すように、半導体チップ６６の上にモノリシックに集積化できる。単一のマーチング・メモリーブロックＭＭ_ij又は「単一のマーチングメモリ・コア」が、例えば、千個のマーチングメモリ・カラム、即ち、千個のマーチングメモリユニットＵ_k（ｋ＝１〜１０００）を有している。そして、１個のマーチングメモリユニットＵ_kは、１０００×３２バイト・ベースのアドレスを有するので、１メモリユニットＵ_kは２５６ビットレベル・セルを有している。即ち、千個のマーチング・メモリーブロックＭＭ_ijを有する複合マーチングメモリチップにより、３２バイト（又は２５６ビット）の千個のマーチングメモリユニットＵ_k（ｋ＝１〜１０００）が、従来のＤＲＡＭアクセスの１サイクル以内でのアクセスを可能にする。

図８０（ａ）及び図８０（ｂ）は、３２バイト（又は２５６ビット）の千個のマーチングメモリユニットＵ_k（ｋ＝１〜ｎ；ｎ＝１００）を有する２５６ｋビットのマーチング・メモリーブロックＭＭ_ijの一例を示す。複合マーチングメモリ方式では、図８０（ｂ）に示すように、位置インデックスＴ_k（ｋ＝１〜１０００）又は位置タグが、カラム（列）Ｕ_kのそれぞれのトークンとして、マーチングメモリユニットＵｋのそれぞれの列上に、それぞれラベル表示されてカラム・バイトの最初のアドレスを意味している。図８０（ｂ）では、図７Ｃに示すクロック周期（クロックサイクル時間）τ_clockが、「マーチングメモリのメモリ・サイクルｔ_Ｍ」として記されている。

第１〜第５の実施形態で述べたことを鑑みれば、従来のＤＲＡＭとマーチングメモリとの間には、図８０（ｃ）に示すような大きな速度差があることが分かる。図８０（ｃ）に示すように、従来のＤＲＡＭの１メモリ素子の中味を読み取り、又は書き込むためのメモリ・サイクルｔ_Ｃに対し、マーチングメモリのメモリ・サイクルｔ_Ｍは下記のように評価できる：
ｔ_Ｃ＝１０００ｔ_Ｍ（１）

したがって、図７９（ｂ）に示す複合マーチングメモリ方式により、我々は、スカラデータ又はプログラム命令の速度／処理能力を改善できる。その場合には、ＤＲＡＭアーキテクチュアで採用するランダムアクセス方式と同様に、特定のマーチング・メモリーブロックＭＭ_ij（ｉ＝１〜ｓ；ｊ＝１〜ｔ、そしてｓ×ｔ＝１０００）を千個のマーチングメモリの配列の中からランダムに指定してアクセスできる。

図７９（ｂ）では図示を省略しているが、複数の２５６ｋビットのマーチング・メモリーブロックＭＭ_ijが半導体チップ６６の上に２次元マトリクス状に配置できる。この２次元マトリクス状に配置では、マーチング・メモリーブロックＭＭ_ijのそれぞれの水平配列が共通の水平コア・ラインを共有し、マーチング・メモリーブロックＭＭ_ijのそれぞれの垂直配列が共通の垂直コア・ラインを共有する。又、２次元マトリクスで指定されたマーチング・メモリーブロックＭＭ_ijの位置は、その水平コア・ラインと垂直コア・ラインの交点として、２層ヒエラルキー（階層）でアクセスされる。２層ヒエラルキーを用いて対象となるマーチング・メモリーブロックＭＭ_ijのすべての列が低レベルのアドレスでアクセスされ、すべてのマーチング・メモリーブロックＭＭ_ijが、それ自体のアドレスで、高レベルのアドレスでそれぞれマーチング・メモリーブロックＭＭ_ijに対して直接アクセスされる。

或いは、仮想記憶機構を、複合マーチングメモリのアクセス方式に使用できる。仮想記憶機構では、マーチング・メモリーブロックＭＭ_ij（ｉ＝１〜ｓ；ｊ＝１〜ｔ）、又は用いるマーチングメモリ・コアを、仮想メモリのページのようにスケジュールする。スケジューリングは、任意の場合で、コンパイル実行ランで決まる。例えば、マルチレベル・キャッシュ・アーキテクチュアでは、通常、マルチレベル・キャッシュの最小レベル（Ｌ１）キャッシュを最初にチェックすることから動作が開始する。仮にＬ１キャッシュがヒットすればプロセッサは高速で処理を進行させる。小さなＬ１キャッシュをミスすると、次に大きいキャッシュ（Ｌ２）がチェックされる。このより小さなレベルのキャッシュがミスしたら次に大きいレベルのキャッシュがチェックされる手順が、外部メモリがチェックされるまで進行する。複合マーチングメモリのアクセス方式として、Ｌ２キャッシュのようなメモリが、仮想インデックス指定機構をサポートできる。何故ならば、Ｌ２キャッシュのサイズが複合マーチングメモリのサイズに対応し、マーチング・メモリーブロックＭＭ_ijのサイズが最小のＬ１キャッシュのサイズに対応しているからである。

このように、千個のマーチング・メモリーブロック又は千個のコアを備える複合マーチングメモリが比較的簡単に構築できるので、複合マーチングメモリにおいては、任意の列のアクセスがＣＰＵのクロック・レートで基本的に使用でき、最悪の場合でも、複合マーチングメモリの速度は、従来のＤＲＡＭの速度を維持できる。

回路基板の図示を省略しているが、更に、複数の複合マーチングメモリチップ又は複数のマクロ複合マーチング・メモリーブロックＭＭＭ_１、ＭＭＭ_２、-----、ＭＭＭ_ｋが、図８１に示す「複合マーチングメモリ・モジュール」又は複合マーチングメモリのマルチチップ・モジュールを形成するために、外部接続ピンＰ_１、Ｐ_２、-----、Ｐ_s-1、Ｐ_ｓ（“ｓ”は、バイトの単位又はワード・サイズから決まる任意の整数）を有する第１の回路基板に実装できる。マクロ複合マーチング・メモリーブロックＭＭＭ_１、ＭＭＭ_２、-----、ＭＭＭ_ｋの混成実装において、第１のマクロ複合マーチング・メモリーブロックＭＭＭ_１は、例えば、第１の半導体チップに千個のマーチング・メモリーブロックＭＭ₁₁₁、ＭＭ₁₂₁、ＭＭ₁₃₁、-----、ＭＭ_1(t-1)1、ＭＭ_1t1；ＭＭ₂₁₁、-----；ＭＭ_(s-1)11----；ＭＭ_s11、ＭＭ_s21、-----、ＭＭ_s(t-1)1；ＭＭ_st1をモノリシックに集積化できる。第２のマクロ複合マーチング・メモリーブロックＭＭＭ_２は、第２の半導体チップに千個のマーチング・メモリーブロックＭＭ₁₁₂、ＭＭ₁₂₂、ＭＭ₁₃₂、-----、ＭＭ_1(t-1)2、ＭＭ_1t2；ＭＭ₂₁₂、-----；ＭＭ_(s-1)12 -----；ＭＭ_s12、ＭＭ_s22、-----、ＭＭ_s(t-1)2；ＭＭ_st2をモノリシックに集積化できる ------、そして、ｋ番目の複合マーチング・メモリーブロックＭＭＭ_ｋは、ｋ番目の半導体チップに千個のマーチング・メモリーブロックＭＭ_11k、ＭＭ_12k、ＭＭ_13k、-----、ＭＭ_1(t-1)k、ＭＭ_1tk；ＭＭ_21k-----；ＭＭ_(s-1)1k -----；ＭＭ_s1k、ＭＭ_s2k、-----、ＭＭ_s(t-1)k；ＭＭ_stkをモノリシックに集積化できる。そして、マクロ複合マーチング・メモリーブロックＭＭＭ_１、ＭＭＭ_２、-----、ＭＭＭ_ｋをハイブリッドで実装している第１の複合マーチングメモリ・モジュールは、外部接続ピンＰ_１、Ｐ_２、-----、Ｐ_s-1、Ｐ_ｓを介して第２の回路基板上に、マクロ複合マーチング・メモリーブロックＭＭＭ_k+1などをハイブリッドに実装している第２の複合マーチングメモリ・モジュールに接続できる。ここで、マクロ複合マーチング・メモリーブロックＭＭＭ_ｋ＋１は、例えば、半導体チップに、千個のマーチング・メモリーブロックＭＭ_11(k+1)、ＭＭ_12(k+1)、ＭＭ_13(k+1)、-----、ＭＭ_1(t-1)(k+1)、MＭ_1t(k+1)；ＭＭ_21(k+1)、-----；ＭＭ_(s-1)1(k+1)-----；ＭＭ_s1(k+1)、ＭＭ_s2(k+1)、-----、ＭＭ_s(t-1)(k+1)；ＭＭ_st(k+1)をモノリシックに集積化できる。そのうえ、マクロ複合マーチング・メモリーブロックの混成実装のデュアル・ラインを形成できるならば、複合マーチングメモリのデュアル・インライン・モジュールを構築できる。

図８１に示す複合マーチングメモリ・モジュールの構成において、３層ヒエラルキー（階層）を用いれば、最低レベルの階層のアドレスで、対象とするマーチング・メモリーブロックＭＭ_ijｕ（ｕ＝１〜ｋ；“ｋ”は２以上の任意の整数）のすべての列がアクセスされる。中間レベルの階層では、すべてのマーチング・メモリーブロックＭＭ_ijｕがそれ自体のアドレスでそれぞれマーチング・メモリーブロックＭＭ_ijに対してアクセスされる。最高レベルの階層では、すべてのマクロ・マーチング・メモリーブロックＭＭＭ_ｕ（ｕ＝１〜ｋ）がそれ自体のアドレスで直接アクセスできる。したがって、３層ヒエラルキーを用いれば、スカラデータ又はプログラム命令に対してマーチングメモリの離れたカラム（列）に対するアクセスを促進することができる。

或いは、同じランク内のＤＲＡＭチップを同時にアクセスするＤＲＡＭランク・アーキテクチュアと非常に類似した状態で、複数のマクロ複合マーチング・メモリーブロックＭＭＭ_１、ＭＭＭ_２、-----、ＭＭＭ_ｋを同時にランダムにアクセスしてもよい。ＤＲＡＭランク・アーキテクチュアでは、メモリのコマンドに対してロックステップ方式で動作するＤＲＡＭチップのセットを備える。又、前述の２層ヒエラルキー方式により、対象とするマーチング・メモリーブロックＭＭ_ijｕ（ｕ＝１〜ｋ）のすべての列が、最低レベルのアドレスでアクセスされ、すべてのマーチング・メモリーブロックＭＭ_ijｕが、それ自体のアドレスで、より高いレベルの階層でそれぞれマーチング・メモリーブロックＭＭ_ijｕに対してアクセスされるようにしてもよい。

更に代わりに、仮想記憶機構は、用いるマーチングメモリ・コアを仮想メモリのページのようにしてスケジュールする、複合マーチングメモリのアクセス方式に使用できる。スケジューリングは、任意の場合に、コンパイル実行ランで決めることができる。

マーチング主記憶装置３１とプロセッサ１１の間のデータ転送は非常に高速で行われるので、従来の計算機システムで採用されているキャッシュメモリは不要であり、キャッシュメモリは本来的に省略できる。しかし、図５６に示す構成と同様に、複合マーチングメモリ方式からなるマーチング・データキャッシュメモリ２１ｂは、より小さいサイズのマーチング・メモリーブロック、又は更に小さいサイズのマーチングメモリ・コアで使用できる。例えば、１ｋビット、５１２ビット、又は２５６ビット容量の複数のマーチングメモリ・コアを、マーチング・データキャッシュメモリ２１ｂを形成するために半導体チップに採用できる。したがって、２５６ｋビット容量の複数のマーチングメモリ・コアＭＭ_ij（ｉ＝１〜ｓ；ｊ＝１〜ｔ、そしてｓ×ｔ＝１０００）を、マーチング主記憶装置３１を形成するために半導体チップ６６に採用してもよい。こうすれば、例えば、仮想記憶機構により、マーチングメモリ・コアのそれぞれがランダムでアクセスできる。

或いは、半導体チップ上で、マーチング・メモリーブロック又はマーチングメモリ・コアの１次元アレイを垂直方向に配列してマーチング・キャッシュメモリを構成してもよい。ここで、マーチングメモリ・コアのそれぞれは、メモリユニットを水平方向に一列配列した構造を含んでいる。この水平方向に配列するメモリユニットの数は、マーチング主記憶装置３１用のマーチングメモリ・コアで配列されるメモリユニットの数より少ない。そして、例えば、仮想記憶機構により、マーチングメモリ・コアのそれぞれをランダムでアクセスできる。

更に、複数のマーチング・メモリーブロック又は複数のマーチングメモリ・コアを半導体チップ上に垂直方向に配列して構成してもよい。この場合、マーチング・メモリーブロックのそれぞれは単一のメモリユニットから構成される。そして、メモリユニットのそれぞれは、ビットレベル・セルの１次元配列を有し、複合マーチングメモリ方式によるマーチング・レジスタ・ファイルを作るために、バイト・サイズ又はワード・サイズの情報を格納する。

マーチングメモリ・コアを微細化した極限構造は、最小サイズ又は１ビット容量の複数のマーチングメモリ・コアを複合マーチングメモリ方式により半導体チップ上に配列した構造になる。この微細化の極限構造は、従来のＳＲＡＭの構造に対応するものである。したがって、１ビット・マーチングメモリ・コアからなるマーチング・データレジスタ・ファイル２２ｂは、図５５及び図５６に示す構成と同様に、ＡＬＵ１１２に接続できる。そこで、ＳＲＡＭの動作と非常に類似した状態で、１ビット・マーチングメモリ・コアのそれぞれがランダムにアクセスできる。

したがって、本発明は、上記の説明で詳述してない様々な実施形態と変形例など含むことは勿論である。よって、本発明の技術的範囲は上記の説明から妥当な特許請求の範囲に係る発明特定事項によってのみ定められるものである。

本発明は、より高速で低い電力消費を必要とする、様々な計算機システムの産業分野に適用できる。

Claims

それぞれがランダムにアクセスされることが可能な複数のマーチング・メモリーブロックが空間的に配列された複合マーチングメモリであって、
前記マーチング・メモリーブロックのそれぞれは、メモリユニットのそれぞれがバイト・サイズ又はワード・サイズの情報を格納するように、ビットレベル・セルの１次元配列で構成されたメモリユニットが複数個配列されたアレイを含んでおり、
前記メモリユニットのそれぞれは、それぞれのマーチング・メモリーブロックの内部において、対応するマーチング・メモリーブロックの出力側のメモリユニットに向けて、前記対応するマーチング・メモリーブロックの入力側のメモリユニットからクロック信号に同期して、ステップごとに、前記バイト・サイズ又はワード・サイズの情報を転送して、前記ビットレベル・セルがランダムにアクセスされない動作をし、且つ、
前記マーチング・メモリーブロックのそれぞれにおいて、対象とするマーチング・メモリーブロックのメモリユニットのそれぞれがランダムにアクセスできるように、前記マーチング・メモリーブロックのそれぞれがランダムにアクセスされることを特徴とする複合マーチングメモリ。
前記ビットレベル・セルのそれぞれは、
前記クロック信号を供給するクロック信号供給線に第１遅延素子を介して接続され第１主電極と、前記メモリユニットのアレイの入力側に隣接して配列された前記メモリユニットに割り当てられたビットレベル・セルの一つである第１の隣接ビットレベル・セルの出力端子に、第２遅延素子を介して接続された制御電極を有する転送トランジスタと、
前記転送トランジスタの第２主電極に接続した第１主電極、前記クロック信号供給線に接続した制御電極、接地電位に接続した第２主電極を有するリセット・トランジスタと、
前記リセット・トランジスタに並列接続され、前記ビットレベル・セルの情報を格納するコンデンサと、を備え、
前記転送トランジスタの前記第２主電極と前記リセット・トランジスタの前記第１主電極を接続する出力ノードが、前記ビットレベル・セルの出力端子として機能し、且つ、前記出力端子は、前記メモリユニットのアレイの出力側に隣接して配列されたメモリユニットに割り当てられたビットレベル・セルの一つである第２の隣接ビットレベル・セルに、前記コンデンサに格納されていた信号を出力することを特徴とする請求項１に記載の複合マーチングメモリ。
前記ビットレベル・セルのそれぞれにおいて、前記クロック信号が前記リセット・トランジスタの前記制御電極に印加されると、前記リセット・トランジスタは、前記コンデンサに既に格納していた信号電荷を放電することを特徴とする請求項２に記載の複合マーチングメモリ。
前記ビットレベル・セルのそれぞれにおいて、前記コンデンサに格納されていた信号電荷が放電した後に、前記転送トランジスタは前記第１遅延素子が規定する第１の遅延時間だけ遅れて作動し、且つ、
前記第１の隣接ビットレベル・セルに格納されていた信号が前記転送トランジスタの前記制御電極に送られると、前記転送トランジスタは、前記第１の隣接ビットレベル・セルに格納されていた前記信号を前記コンデンサに、前記第２遅延素子が規定する第２の遅延時間だけ更に遅れて転送することを特徴とする請求項２に記載の複合マーチングメモリ。
それぞれがランダムにアクセスされることが可能な複数のマーチング・メモリーブロックが空間的に配列された複合マーチングメモリであって、
前記マーチング・メモリーブロックのそれぞれは、メモリユニットのそれぞれがバイト・サイズ又はワード・サイズの情報を格納するように、ビットレベル・セルの１次元配列で構成されたメモリユニットが複数個配列されたアレイを含んでおり、
前記メモリユニットのそれぞれは、それぞれのマーチング・メモリーブロックの内部において、対応するマーチング・メモリーブロックの第１の端部側のメモリユニットに向けて、前記対応するマーチング・メモリーブロックの前記第１の端部に対向する第２の端部側のメモリユニットから第１のクロック信号に同期して、ステップごとに、前記バイト・サイズ又はワード・サイズの情報を転送して、前記ビットレベル・セルがランダムにアクセスされない動作をし、
前記メモリユニットのそれぞれは、それぞれのマーチング・メモリーブロックの内部において、対応するマーチング・メモリーブロックの前記第２の端部側のメモリユニットに向けて、前記対応するマーチング・メモリーブロックの前記第１の端部側のメモリユニットから第２のクロック信号に同期して、ステップごとに、前記バイト・サイズ又はワード・サイズの情報を転送して、前記ビットレベル・セルがランダムにアクセスされない動作をし、
前記マーチング・メモリーブロックのそれぞれにおいて、対象とするマーチング・メモリーブロックのメモリユニットのそれぞれがランダムにアクセスできるように、前記マーチング・メモリーブロックのそれぞれがランダムにアクセスされることを特徴とする複合マーチングメモリ。
前記ビットレベル・セルのそれぞれは、
第１の前方転送遅延素子を介して第１のクロック信号供給線に接続した第１主電極、第２の前方転送遅延素子を介して前記メモリユニットのアレイの一方の側に隣接して位置する前記メモリユニットに割り当てられたビットレベル・セルの一つである第１の隣接ビットレベル・セルの前方転送出力端子に接続された制御電極を有する前方転送トランジスタと、
前記前方転送トランジスタの第２主電極に接続した第１主電極、前記第１のクロック信号供給線に接続した制御電極、接地電位に接続した第２主電極を有する前方転送リセット・トランジスタと、
第１の後方遅延素子を介して第２のクロック信号供給線に接続した第１主電極、第２の後方遅延素子を介して第２の隣接ビットレベル・セルの後方転送出力端子に接続された制御電極を有する後方転送トランジスタと、
前記後方転送トランジスタの第２主電極に接続した第１主電極、前記第２のクロック信号供給線に接続した制御電極、前記接地電位に接続した第２主電極を有する後方転送リセット・トランジスタと、
前記前方転送リセット・トランジスタと前記後方転送リセット・トランジスタとに並列接続され、前記ビットレベル・セルの情報を格納する共通コンデンサとを有し、
前記前方転送トランジスタの前記第２主電極と前記前方転送リセット・トランジスタの前記第１主電極を接続する出力ノードが、前記ビットレベル・セルの前方転送出力端子として機能し、
前記前方転送出力端子は、前記共通コンデンサに格納されていた前記信号を、前記メモリユニットのアレイの他方の側に隣接して位置する前記メモリユニットに割り当てられたビットレベル・セルの一つである前記第２の隣接ビットレベル・セルに出力し、
前記後方転送トランジスタの前記第２主電極と前記後方転送リセット・トランジスタの前記第１主電極を接続する出力ノードが前記ビットレベル・セルの後方転送出力端子として機能し、前記ビットレベル・セルの前記後方転送出力端子は、前記共通コンデンサに格納されていた前記信号を、前記第１の隣接ビットレベル・セルに出力することを特徴とする請求項５に記載の複合マーチングメモリ。
前記ビットレベル・セルのそれぞれにおいて、前記第１のクロック信号供給線からの前記第１のクロック信号が前記前方転送リセット・トランジスタの前記制御電極に印加されると、前記前方転送リセット・トランジスタは前記共通コンデンサに既に格納されていた信号電荷を放電し、且つ、
前記第２のクロック信号供給線からの前記第２のクロック信号が前記後方転送リセット・トランジスタの前記制御電極に印加されると、前記後方転送リセット・トランジスタは、前記共通コンデンサに既に格納されていた信号電荷を放電することを特徴とする請求項６に記載の複合マーチングメモリ。
前記ビットレベル・セルのそれぞれにおいて、
前記共通コンデンサに格納されていた前記信号電荷が放電した後、前記前方転送トランジスタは、前記第１の前方転送遅延素子が規定する第１の前方遅延時間だけ遅れて作動し、
前記第１の隣接ビットレベル・セルに格納されていた前記信号が前記前方転送トランジスタの前記制御電極に送られると、前記前方転送トランジスタは、前記第１の隣接ビットレベル・セルに格納されていた信号を前記共通コンデンサに、前記第２の前方転送遅延素子が規定する第２の前方遅延時間だけ更に遅れて転送し、
前記共通コンデンサに格納されていた前記信号電荷が放電した後、前記後方転送トランジスタは、前記第１の後方遅延素子が規定する第１の後方遅延時間だけ遅れて作動し、
前記第１の隣接ビットレベル・セルに格納されていた前記信号が前記後方転送トランジスタの前記制御電極に送られると、前記後方転送トランジスタは、前記第１の隣接ビットレベル・セルに格納されていた信号を前記共通コンデンサに、前記第２の後方遅延素子が規定する第２の後方遅延時間だけ更に遅れて転送することを特徴とする請求項６に記載の複合マーチングメモリ。
プロセッサと、格納されていた情報を前記プロセッサに能動的に逐次出力するマーチング主記憶装置と、を備える計算機システムであって、
前記プロセッサは前記格納されていた情報により演算論理動作を実行でき、命令の移動の場合には前記マーチング主記憶装置から前記プロセッサに向かう命令流が一方向だけであることを除いて、前記プロセッサにおける処理の結果が前記マーチング主記憶装置に送られ、
前記マーチング主記憶装置は、それぞれがランダムにアクセスされることが可能な複数のマーチング・メモリーブロックが空間的に配列され、
前記マーチング・メモリーブロックのそれぞれは、メモリユニットのそれぞれがバイト・サイズ又はワード・サイズの情報を格納するように、ビットレベル・セルの１次元配列で構成されたメモリユニットが複数個配列されたアレイを含んでおり、
前記マーチング・メモリーブロックのそれぞれにおいて、対象とするマーチング・メモリーブロックのメモリユニットのそれぞれがランダムにアクセスできるように、前記マーチング・メモリーブロックのそれぞれがランダムにアクセスされることを特徴とする計算機システム。
前記ビットレベル・セルのそれぞれは、
前記クロック信号を供給するクロック信号供給線に第１遅延素子を介して接続され第１主電極と、前記メモリユニットのアレイの入力側に隣接して配列された前記メモリユニットに割り当てられたビットレベル・セルの一つである第１の隣接ビットレベル・セルの出力端子に、第２遅延素子を介して接続された制御電極を有する転送トランジスタと、
前記転送トランジスタの第２主電極に接続した第１主電極、前記クロック信号供給線に接続した制御電極、接地電位に接続した第２主電極を有するリセット・トランジスタと、
前記リセット・トランジスタに並列接続され、前記ビットレベル・セルの情報を格納するコンデンサと、を備え、
前記転送トランジスタの前記第２主電極と前記リセット・トランジスタの前記第１主電極を接続する出力ノードが、前記ビットレベル・セルの出力端子として機能し、且つ、前記出力端子は、前記メモリユニットのアレイの出力側に隣接して配列されたメモリユニットに割り当てられたビットレベル・セルの一つである第２の隣接ビットレベル・セルに、前記コンデンサに格納されていた信号を出力することを特徴とする請求項９に記載の計算機システム。
プロセッサと、格納されていた情報を前記プロセッサに能動的に逐次出力する双方向マーチング主記憶装置と、を備える計算機システムであって、
前記プロセッサは前記格納されていた情報により演算論理動作を実行でき、命令の移動の場合には前記双方向マーチング主記憶装置から前記プロセッサに向かう命令流が一方向だけであることを除いて、前記プロセッサにおける処理の結果が前記双方向マーチング主記憶装置に送られ、
前記双方向マーチング主記憶装置には、それぞれがランダムにアクセスされることが可能な複数の双方向マーチング・メモリーブロックが空間的に配列され、
前記双方向マーチング・メモリーブロックのそれぞれは、メモリユニットのそれぞれがバイト・サイズ又はワード・サイズの情報を格納するように、ビットレベル・セルの１次元配列で構成されたメモリユニットが複数個配列されたアレイを含んでおり、
前記メモリユニットのそれぞれは、それぞれのマーチング・メモリーブロックの内部において、対応するマーチング・メモリーブロックの第１の端部側のメモリユニットに向けて、前記対応するマーチング・メモリーブロックの前記第１の端部に対向する第２の端部側のメモリユニットから第１のクロック信号に同期して、ステップごとに、前記バイト・サイズ又はワード・サイズの情報を転送して、前記ビットレベル・セルがランダムにアクセスされない動作をし、
前記メモリユニットのそれぞれは、それぞれのマーチング・メモリーブロックの内部において、対応するマーチング・メモリーブロックの前記第２の端部側のメモリユニットに向けて、前記対応するマーチング・メモリーブロックの前記第１の端部側のメモリユニットから第２のクロック信号に同期して、ステップごとに、前記バイト・サイズ又はワード・サイズの情報を転送して、前記ビットレベル・セルがランダムにアクセスされない動作をし、
前記マーチング・メモリーブロックのそれぞれにおいて、対象とするマーチング・メモリーブロックのメモリユニットのそれぞれがランダムにアクセスできるように、前記マーチング・メモリーブロックのそれぞれがランダムにアクセスされることを特徴とする計算機システム。
前記ビットレベル・セルのそれぞれは、
第１の前方転送遅延素子を介して第１のクロック信号供給線に接続した第１主電極、第２の前方転送遅延素子を介して前記メモリユニットのアレイの一方の側に隣接して位置する前記メモリユニットに割り当てられたビットレベル・セルの一つである第１の隣接ビットレベル・セルの前方転送出力端子に接続された制御電極を有する前方転送トランジスタと、
前記前方転送トランジスタの第２主電極に接続した第１主電極、前記第１のクロック信号供給線に接続した制御電極、接地電位に接続した第２主電極を有する前方転送リセット・トランジスタと、
第１の後方遅延素子を介して第２のクロック信号供給線に接続した第１主電極、第２の後方遅延素子を介して第２の隣接ビットレベル・セルの後方転送出力端子に接続された制御電極を有する後方転送トランジスタと、
前記後方転送トランジスタの第２主電極に接続した第１主電極、前記第２のクロック信号供給線に接続した制御電極、前記接地電位に接続した第２主電極を有する後方転送リセット・トランジスタと、
前記前方転送リセット・トランジスタと前記後方転送リセット・トランジスタとに並列接続され、前記ビットレベル・セルの情報を格納する共通コンデンサとを有し、
前記前方転送トランジスタの前記第２主電極と前記前方転送リセット・トランジスタの前記第１主電極を接続する出力ノードが、前記ビットレベル・セルの前方転送出力端子として機能し、
前記前方転送出力端子は、前記共通コンデンサに格納されていた前記信号を、前記メモリユニットのアレイの他方の側に隣接して位置する前記メモリユニットに割り当てられたビットレベル・セルの一つである前記第２の隣接ビットレベル・セルに出力し、
前記後方転送トランジスタの前記第２主電極と前記後方転送リセット・トランジスタの前記第１主電極を接続する出力ノードが前記ビットレベル・セルの後方転送出力端子として機能し、
前記ビットレベル・セルの前記後方転送出力端子は、前記共通コンデンサに格納されていた前記信号を、前記第１の隣接ビットレベル・セルに出力することを特徴とする請求項１１に記載の計算機システム。
前記ビットレベル・セルのそれぞれにおいて、前記第１のクロック信号供給線からの前記第１のクロック信号が前記前方転送リセット・トランジスタの前記制御電極に印加されると、前記前方転送リセット・トランジスタは前記共通コンデンサに既に格納されていた信号電荷を放電し、且つ、
前記第２のクロック信号供給線からの前記第２のクロック信号が前記後方転送リセット・トランジスタの前記制御電極に印加されると、前記後方転送リセット・トランジスタは、前記共通コンデンサに既に格納されていた信号電荷を放電することを特徴とする請求項１２に記載の計算機システム。
前記プロセッサは、前記双方向マーチング主記憶装置から前記格納されていた情報を受信する複数の演算パイプラインを更に含むことを特徴とする請求項１０又は１２に記載の計算機システム。
前記計算機システムは、
情報のユニットにそれぞれに対応する位置に配置されたキャッシュメモリユニットのアレイと、
前記双方向マーチング主記憶装置から前記格納されていた情報を受信する前記キャッシュメモリユニットのアレイのキャッシュ入力端子と、
前記キャッシュメモリユニットのアレイのキャッシュ出力端子を有するマーチング・キャッシュメモリを更に備え、
情報をキャッシュメモリユニットのそれぞれに格納し、且つ、前記キャッシュメモリユニットのそれぞれに格納した情報を、前記クロック信号に同期して、前記情報をそれぞれ隣接するキャッシュメモリユニットにステップごとに逐次転送して、能動的且つ逐次的に前記格納されていた情報を前記プロセッサに出力し、
前記プロセッサの演算論理装置は前記演算論理動作を前記格納されていた情報を用いて実行し、命令の移動については処理すべき前記情報の流れの反対方向の流れは存在しないが、前記演算論理装置における処理結果が前記双方向マーチング主記憶装置に送られることを特徴とする請求項１０又は１２に記載の計算機システム。
前記複数の演算パイプラインは、複数のベクトル処理装置又は複数のスカラ機能装置のいずれかを含んでいることを特徴とする請求項１５に記載の計算機システム。
前記計算機システムは、
キャッシュメモリユニットの第２のアレイと、
前記双方向マーチング主記憶装置から前記格納されていた情報を受信する前記第２のアレイのキャッシュ入力端子と、
前記第２のアレイのキャッシュ出力端子と、を有するマーチング・キャッシュメモリを更に備え、
情報をキャッシュメモリユニットのそれぞれに格納し、且つ、前記キャッシュメモリユニットのそれぞれに格納した情報を、前記クロック信号に同期して隣接するキャッシュメモリユニットにステップごとに逐次転送して、能動的且つ逐次的に前記格納されていた情報を前記プロセッサに出力し、
前記プロセッサの演算論理装置は前記演算論理動作を前記格納されていた情報を用いて実行し、命令の移動については処理すべき前記情報の流れの反対方向の流れは存在しないが、前記演算論理装置における処理結果が前記双方向マーチング主記憶装置に送られることを特徴とする請求項１０又は１２に記載の計算機システム。
それぞれのメモリユニットに格納されたバイト・サイズ又はワード・サイズの情報を、クロック信号に同期して、入力側のメモリユニットから出力側のメモリユニットに向けて行方向に逐次転送するセルマトリクスを構成するように、
ビットレベル・セルの列方向１次元配列で定義されるメモリユニットの複数本を、それぞれ行方向に沿って順次配列してなる前記セルマトリクス中の１行をなす、ビットレベル・セルの行方向１次元配列としてのマーチングメモリ用セル配列であって、
ビットレベルの信号電荷を格納する第１のビットレベル・セルと、
該第１のビットレベル・セルの出力端子に接続されたユニット間セルと、
該ユニット間セルの出力端子に接続された第２のビットレベル・セルと、
を含み、前記ユニット間セルが、前記第１のビットレベル・セルの信号格納状態から、前記第２のビットレベル・セルの信号格納状態を分離することを特徴とするマーチングメモリ用セル配列。
前記第１のビットレベル・セルは、
第１遅延素子を介してクロック信号供給線に接続した第１主電極、前記第１のビットレベル・セルの入力側に隣接して配列された前段のユニット間セルの出力端子に、第２遅延素子を介して接続された制御電極を有する転送トランジスタと、
前記転送トランジスタの第２主電極に接続した第１主電極、前記クロック信号供給線に接続した制御電極、接地電位に接続した第２主電極を有するリセット・トランジスタと、
前記リセット・トランジスタに並列接続され、前記ビットレベルの信号電荷を格納するコンデンサと、を備え、
前記転送トランジスタの前記第２主電極と前記リセット・トランジスタの前記第１主電極を接続する出力ノードが、前記第１のビットレベル・セルの出力端子として機能し、且つ、前記出力端子は、前記ユニット間セルに前記コンデンサに格納されていた信号電荷を出力することを特徴とする請求項１８に記載のマーチングメモリ用セル配列。
前記ユニット間セルは、前記クロック信号供給線から供給される前記クロック信号が設定した必要なタイミングで、前記第２のビットレベル・セルに対して、前記第１のビットレベル・セルから信号を送ることを特徴とする請求項１９に記載のマーチングメモリ用セル配列。
前記ユニット間セルは、前記第１のビットレベル・セルから前記第２のビットレベル・セルに前記クロック信号が決める所定のタイミングで信号を転送するように動作する、単一のトランジスタを有するクロック回路であることを特徴とする請求項１８〜２０のいずれか１項に記載のマーチングメモリ用セル配列。
前記ユニット間セルは、前記第１のビットレベル・セルから前記第２のビットレベル・セルに前記クロック信号が決める所定のタイミングで信号を転送するように動作する、複数のトランジスタを有するクロック回路であることを特徴とする請求項１８〜２０のいずれか１項に記載のマーチングメモリ用セル配列。