JPH01500306A

JPH01500306A - マルチプロセッサコンピュータ用メモリアーキテクチャ

Info

Publication number: JPH01500306A
Application number: JP50216887A
Authority: JP
Inventors: モッターズヘッド，クリストファー　ジョン
Original assignee: ザ　ブリテイッシュ　ピトローリアム　コンパニー　ピー．エル．シー．
Priority date: 1986-04-04
Filing date: 1987-04-02
Publication date: 1989-02-02
Also published as: WO1987006039A1; EP0240354A1; GB8608312D0

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】マルチプロセッサコンピュータ用メモリアーキテクチャ技術分野本発明はマルチプロセッサコンピュータのメモリ組織の改良に関する。

従来技術データ処理を処理ステップを同時に遂行する複数の処理要素の間で、分割することによって複合データ処理を実行できる速度を向上することが従来より提案されている。同一命令を異なるデータについて同時に実行したり（ＳＩＭＤ−単一命令、複数データストリームのデータ処理方式）、異なる命令を異なるデータについて同時に実行したり（ＭＩＭＤ−複数命令、複数データストリームのデータ処理方式）するｖｉ器が提案されている。

ＳＩＭＤ機とＭＩＭＤ機の詳細については、ストーン外層「コンピュータアーキテクチャ序説」、サイエンス　リサーチ　アソシエーツ社、１９７５年発行、３２７〜３５４頁（ＳＩＭＤ）および３５５〜３７２頁（ＭＩＭＤ）を参照されたい。

マルチプロセッサとして従来より提案されている構成の一つは、制御コンピュータもしくはホストコンピュータと称される従来形のコンピュータで、該コンピュータがコントローラに接続され前記コントローラ自体は複数の独立の処理要素を往復するデータと命令の移送を制御するようになったものから構成される。制御コンピュータもしくはホストコンピュータは、ディスクメモリ、キーボード、プリンタ等の周辺装置を制御し、コントローラを経由して処理要素へプログラムとデータを移送する働きを行う。

コントローラは命令とデータを個々の処理要素へ送る働きをする。個々の処理要素が相互接続される方法によって、コントローラは個々の処理要素同士の間のデータの転送を行うことができる。

複数の処理要素からなる何れのシステムにとっても、重要な考慮事項は、処理要素同士の間でデータやメツセージを通信させたり、処理要素同士の間でデータを共をすることができるようにすることである。

システムの制御が、コントローラに集中しているようなシステムの場合、コントローラを介して処理要素間の連絡用に使用される通信路が存在する。この通信方法は、メツセージが処理要素からコントローラへ移送された後、受信処理要素へ至るという点で間接的である。更に、かかるメツセージは、一度には処理要素間を唯１（ＩｉＬか送ることができない、このことはかかるシステムの並行性、従ってその演算速度を低下させることになる。

複数の処理要素を有するシステムの使用に成功したもう一つの方法は、各処理要素にデータ転送レジスタを設けることである。各データ転送レジスタは、相互接続バスに接続され、同バス自身は独立の処理要素の各々の上に個々のデータ転送レジスタをリンクして処理要素間でぶントワークを形成する。

かかるシステムの場合、データもしくはメツセージは、同しデータもしくはメツセージをデータ転送レジスタ内へ配置した後、それらをデータ転送レジスタ間をホップさせて相互接続ネットワークを通って送ることによって転送先処理要素へ送られる。データもしくはメツセージを処理要素間で転送するこの方法は、コントローラを使用した以前の方法と異なり、複数の処理要素全体に並行して使用することができる。しかしながら、この方法の欠点は、複数処理要素の各々に特別のデータ転送レジスタが必要となり、これらデータ転送レジスタ間に相互接続バスが必要となる点である。更に、このデータまたはメンセージ通信システムは、処理要素間でデータを共用することが困難である。処理要素間でデータを共用するためには、データのコピーをこれらレジスタと接続バスを介してデータを共有する必要のある個々の処理要素へ送らなければならない、この状況は、個々の処理要素が厳密な意味でデータを共有するものではないということを意味する。なぜならば、それぞれの処理要素はそれ自身のデータのコピーを有することになるからである。データがコピーされる場合には、種々のコピーとマスクコピーとの間の一致を確保する必要が常に存在する。「大規模並行処理用相互接続ネットワーク」エイチ。ジェイ、シーゲル著、レキシントンブ、クス１９８５年発行、１４．１８−２０頁には、かかる構成が開示されている。

米国特許第４３２５１１６号（フランツ外）は、２個のプロセッサと２個のメモリを備えたコンピュータシステムを開示している。前記メモリのうちの一つは、２冊のプロセッサにより共有される。一つのプロセッサによりこのメモリ中に配置されたデータは、他のプロセッサにより該メモリから直接検索することができる。

米国特許第４３２５１１６号の２つのプロセッサは、並行に動作して計算を実行する独立の同一処理要素の簗合体の一部ではない。２つのプロセッサは異なる機能を遂行している。

一つのマルチプロセッサコンピュータ中の処理要素同士の間でデータを共有することが望ましいであろう、その場合には、複数の独立の同一処理要素が共働して演算を実行することになり、特別のレジスフを設ける必要がない。

本発明によれば、複数の同一の処理要素を格納するマルチプロセッサコンピュータが提供され、前記処理要素はそれぞれプロセッサと、該プロセッサがアドレス指定できるローカルメモリと、他の処理要素から前記ローカルメモリへのアクセスを制御するための裁定手段とから成る。そして、前記処理要素の少なくとも一つは、Ｘ個の隣接処理要素（但しＸは少なくとも１である整数）に接続され、処理要素内のプロセッサによりアドレス指定可能なメモリスペースは少なくともＸ＋１個の領域に分割され、前記領域の一つをアドレス指定すると処理要素のローカルメモリ中のデータをアクセスすることができる。さらに、前記領域の他の一つをそれぞれアドレス指定すると、前記Ｘ個の隣接処理要素のうち異なった一つのローカルメモリ内のデータをアクセスすることができる。

所定の処理要素の隣接処理要素は、前記所定の処理要素が恒久的に接続されることによりて、所定の処理要素が接続された処理要素のローカルメモリにアクセスすることができるようになっている。複数の処理要素の任意の一つを、全ての処理要素がアクセスする共通ハスによって、その他の何れの処理要素にも接続することができるようなマルチプロセッサコンピュータが今日知られている。全ての処理要素に対して共通のバスによってはじめて相互接続される処理要素は、本明細書の目的とする隣接処理要素ではない。

複数の処理要素の一つを、何れも処理要素同士の間に介在させた交換網により、もう一つの処理要素と連絡させることができるようなマルチプロセッサコンビニーりもまた知られている。かかるマルチプロセッサコンピュータは、データのコピーを一つのローカルメモリから別のメモリへ交換網を経て送ることによって、処理要素同士の間にデータを移送させる。処理要素同士は、処理要素の一つのローカルメモリ内に配置された同一のデータを共同アクセスすることはない、第２の処理要素と共にそのローカルメモリ内に保持されたデータに共同アクセスしない第１の処理要素は、第２処理要素には隣接しない。

一般的に、もしある処理要素（例えばＡで示す）が別の処理要素（例えばＢで示す）の隣接処理要素であれば、ＢもまたＡの隣接処理要素である。しかしながら、ＡのプロセッサはＢのローカルメモリにアクセスできるが、ＢのプロセッサはＡのローカルメモリにアクセスできないような構成を考えることもできる。かかる状況においては、ＢはＡの隣接処理要素であるがＡはＢの隣接処理要素ではないことになる。

複数の処理要素が存在することによって、その各々が隣接処理要素を一つ備えると共に一つの処理要素の隣接処理要素であることが望ましい０例えば、一連の処理要素でその各々が当該一連の処理要素以降の一個の処理要素のローカルメモリにアクセスできるが、その一連の処理要素以上の一個の処理要素のローカルメモリにはアクセスできないようになったものを考えることができる。しかしながら、隣接処理要素を有するそれぞれの処理要素自体は、前記隣接処理要素に対して隣接する処理要素であることが望ましい、かくして、もしある処理要素人が処理要素Ｂに対する隣接処理要素であれば、ＢはＡの隣接処理要素でもあることが望ましい。

処理要素の総数につき全処理要素が隣接処理要素となる程の十分に小さなマルチプロセッサコンピュータを考えることが可能である。

しかしながら、一般的に、任意の所定の処理要素に対する隣接処理要素の最大数は、コンピュータ内の処理要素の総数よりも少ないであろう。

隣接処理要素は、それらが取付けられる囲い内に互いに物理的に隣接していることが、一般的に便利であろうが、このことは本質的要件ではない、処理要素は、例えば単一の回路板上に単一のユニットとして構成するのが便利である。メモリが同一の回路板上にあるか、あるいは特定のプロセッサと関連し合っていることが明らかである場合には、そのメモリはローカルメモリと考えることができる。

メモリは、プロセッサから隔たって取付けることによって、所定のメモリが所定のプロセッサと物理的に明らかに関連しないようにすることができる。かかる場合にば、ローカルメモリの選択は随意である。それぞれのプロセッサからそのローカルメモリとその隣接処理要素へのアドレス線およびデータ線の配線は、正規のユニプロセッサにおけると同じである。プロセッサとメモリ同士は、交換網により接続せずに、何れのプロセッサも例えばバケット交換網によって任意のメモリと交信することができるようにする。

全ての処理要素は、同数の隣接処理要素に接続する必要はない、標準的な設計の処理要素をもつためには、所定数（Ｘｍａｘ　）の処理要素に対して接続できるようにして、少なくとも若干の処理要素をＸ　ｍａｘ個未満の数の隣接処理要素に接続するのが便利であるかもしれない。

処理要素同士は、規則的な構成を与えるために共に接続する必要はない。しかしながら、一般的には、成る種の規則的構成をもつことが望ましかろう。かくして、処理要素は２進トリーの形に接続することができよう。２進トリーの場合、根処理要素は隣接処理要素を２つしか有しないであろう、２進トリーの末端（葉）の処理要素は隣接処理要素を１つしがもたないであろう、２進トリー内のその他の処理要素は、隣接処理要素を３つ有することになろう。

２進トリーの位相形に処理要素同士が接続される場合の隣接処理要素の数に関する前記事項は、根と葉の両方向にローカルメモリに対する等しいアクセスが存在することを想定している。もし、葉の方向へ２つの処理要素のローカルメモリにアクセスすることが許されて、根の方向への処理要素のローカルメモリに対するアクセスが許されないのであれば、葉の処理要素は本明細書の目的とする隣接処理要素は有しない。

なぜならば、それらはその他のどの処理要素のメモリもアクセスできないからである。他の処理要素は、全て隣接処理要素を２つ有する。なぜならば、それらはそれぞれ他の２つの処理要素のメモリを葉の方向にアクセスすることができるからである。

もう一つの接続方法は、それぞれの処理要素が４つの隣接処理要素を有するトールスの形をしている。しかし、もう一つの可能な接続法は超立方体の形をしている。

それぞれの相互接続された処理要素上でアドレス指定可能な記憶空間は、Ｘ　＋　２　ＩＩＩの領域に分割され、追加的な領域が共通のコン］・ローラにリンクされることによって、この追加的領域内のアドレスがコントローラ内のメモリにアクセスするようになっている。かくして、本出願人の国際出願ＰＣＴ／ＧＢ８７１０００９３　（整理番号６１４７／６３２６）に対応する同時係ス出願には、ＳＩＭＤモードで動作しコントローラ内の命令メモリから処理要素へ命令を伝えるマルチプロセッサコンピュータが記載されている０個々の処理要素上にメモリアドレスを配列して、コントローラにアクセスすることによって処理要素は、そのプロセッサ内で実行されるべきコントローラから命令を得ることができる。

前記メモリの追加領域内のアドレスは、直接コントローラには通さない方が望ましい、そうではなく、関連範囲のアドレスを全て単一のアドレスとして処理することが望ましく、その場合、その単一のアドレス自体は直接コントローラには通されずに、ある回路によって信号をコントローラに通して、処理要素がコントローラからのデータもしくは（より普通の）命令を必要とすることを示すようにする。

処理要素が規則的な位相形で共に接続される場合には、メモリ領域の割当てが首尾一貫するようにすることが望ましい。

複数の処理要素で、その各々が位相幾何学的に区別された位置に隣接しあう処理要素を存する場合を考察してみよう。処理要素は全て同じ範囲のアドレスによって所定の位相幾何学的位置で隣接する処理要素のメモリにアクセスすることが望ましい。

２進トリーの形をしたコンピュータで逐次的により高いアドレス範囲をを効にカバーするラベルｎＯ，ｎ１．ｎ２．ｎ３゜ｎ４により識別される複数の領域に分割された各処理要素と関連する記憶空間ををするものを考えてみよう、かかるコンビニーりの場合、例えばｎｏのアドレスが常に根の方向の処理要素のメモリにアクセスし、ｎ２のアドレスが常に立技の処理要素のメモリにアクセスし、ｎ３のアドレスが常に右枝の処理要素のメモリにアクセスし、更にｎ４のアドレスがコントローラと関連するようにすることが望ましい。

以下の本発明の説明において、記号＊は乗箆記号として用い、記号十は加算記号として用い、どの記号もプール演算子のＡＮＤやＯＲを表示するためには使用されない。

循環接続（トールス）される処理要素の矩形配列に適用した本発明の一般論を以下に示す、かかる配列の場合、処理要素は全て４つの隣接処理要素を有する。

しかしながら、前記の如く、その伯の構成も可能である。

例えば、前記の如く処理要素を３つ有する２進トリーの形に処理要素を配列することもできよう。アドレス空間を仕切る同様の原理も依然使用できる。

コントローラの制御下にあるａ＊ｂ処理要素より成る処理要素の矩形配列の場合を考えてみよう、但し、（ａとｂ）は正の整数である。

ａ＊ｂ処理要素は、３行す列の矩形状に配列される。この配列による独立した一つの処理要素は、４つの隣接処理要素を有する。これらは、Ｐ　（Ｎ）すなわち北、Ｐ　（Ｅ）すなわち東、Ｐ　（Ｓ）すなわち南およびＰ　（Ｗ）すなわち西のラベルを付与することができる。

ラベルＰ　（Ｎ）　、Ｐ　（Ｓ）　、Ｐ　（Ｗ）およびＰ　（Ｅ）は何ら物理的重要性をもつものではなく、“ｕｐ”、“ｄｏｗｎ”。

”１ｅｆｔ”および”ｒｉｇｈｔ”もしくは”ｇｒｅｅｎ’。

”ｂｌｕｅ″、”ｒｅｄ″、“ｙ　ｅ　Ｉ　１．　ｏ　ｗ　”のラベルに置き換えても差支えない、この処理要素の配列の独立した一つの処理要素は、Ｐ　（ｔ、ｊ）により表わすことができる。但し、ｉは処理要素が位置する行でｊは列である。４つの隣接処理要素は次のように！識別することができる。

Ｐ　（Ｎ）はＰ（ｉ−１，ｊ）。

Ｐ　（Ｅ）はＰ　（ｉ、ｊ＋１）。

Ｐ　（Ｓ）はＰ　（ｉ＋１．ｊ）およびＰ　（Ｗ）はＰ（ｉ、ｊ−１）。

より厳密には、隣接処理要素は次のように識別することができる。

Ｐ　（Ｎ）は（Ｐ　（１＋　（（ｉ−２）　ｍｏｄ　ｂ）　、　ｊ））Ｐ　（Ｅ）は（Ｐ　ｃｉ、　１　＋　（ｊｍｏｄ　ａ）　）　）Ｐ　（Ｓ）は（Ｐ　（１＋　（ｉｍｏｄ　ｂ＞　、　ｊ））Ｐ　（Ｗ）は（Ｐ　（ｉ、　ｌ＋　（（Ｊ　２）　＋ｍｏｄ　ａ）　））各処理要素内のプロセッサは、ｈｏ−Ｈの範囲の記憶空間にアドレス指定することができる。但し、ｈＯとＨはプロセッサがアドレス指定できる最下位と最上位のアドレスを示す。

これら処理要素のＰ（ｉ、ｊ）は、それぞれローカルメモリのＭ（ｉ、ｊ）を有する。ローカルメモリは、プロセンサのアドレス空間全体の一部で占めるだけである。ローカルメモリは、ｈＯ−ｈｌ−１の範囲にアドレス指定できる。更に、プロセッサはその４つの隣接処理要素のローカルメモリに対してｈ１〜ｈ２−１．ｈ２〜ｈ３−１．ｈ３〜ｈ４−１．　もしくはｈ４〜ｈ５−１の範囲のアドレスを用いてアドレス指定することができる。但し、前記第１番目の範囲は処理要素Ｐ　（Ｎ）を、第２番目の範囲はＰ　（Ｅ）のローカルメモリを、第３番目の範囲はＰ　（Ｓ）のローカルメモリを、そして第４番目の範囲はＰ　（Ｗ）のローカルメモリをそれぞれアドレス指定するものである。コントローラは、ｈ５もしくはそれ以上のアドレスを使用するａ＊ｂ処理要素の何れかによってアドレス指定できる。処理要素内のプロセッサがアドレス指定できる記憶空間は、かくしてＸ＋２の領域に分割される（隣接処理要素の数であるＸは、この場合４である）、領域同士は重なり合っていないが、必ずしも隣接しているとは躍らない、前記用語法を用いて処理要素の記憶領域を識別すると、範囲ｈＯ〜ｈｌ−１のアドレスは領域ｎｏに相当し、範囲ｈ１〜ｈ２−１のアドレスは領域ｎ１に相当し、範囲ｈ２〜ｈ３−１のアドレスは領域ｎ２に相当し、範囲ｈ３〜ｈ４−１のアドレスはｆＩ域ｎ３に相当し、範囲ｈ４〜ｈ５−１のアドレスは領域ｎ４に相当し、範囲ｈ５〜Ｈのアドレスは領域ｎ５に相当する（Ｈはプロセッサが生成させることのできる最上位のアドレスである）。

０００００−ＦＦＦＦＦの範囲の１６進アドレスを生成させることのできるプロセッサの場合には、各処理要素のローカルメモリはｏｏｏｏｏ〜ＯＦＦＦＦのアドレス範囲をもつことができ、その隣接処理要素のローカルメモリは、それぞれＰ　（Ｎ）　、Ｐ　（Ｅ）　、　Ｐ　（Ｓ）およびＰ　（Ｗ）について、１００００〜ｌＦＦＦＦ、２００００〜２ＦＦＦＦ、３００００〜３ＦＦＦＦおよび４００００〜４ＦＦＦＦの範囲の１６進アドレスによりアクセスすることができる（すなわち、今述べたアドレス範囲と隣接しないアドレス範囲である）。

処理要素Ｐ（ｉ、ｊ）のプロセッサからローカルメモリＭ（ｉ、ｊ）に対するアクセスは、ローカルバスＢ（ｉ、ｊ）を介して転送される。メモリＭ（ｉ、ｊ）に対するアクセスは、全てローカルアドレス裁定回路Ｄ（ｉ、ｊ）により散定すレる。Ｄ（ｉ、ｊ）が処理要素Ｐ　（ｉ、ｊ）のローカルプロセッサによりＭ（ｉ、ｊ）に対してアクセスすることができるためには、Ｐ　（ｉ、ｊ）のローカルプロセッサによって発せられるアドレスは、前記特殊例の場合、ローカルメモリに付与された範囲、例えば１６進ｏｏｏｏｏ〜０ＦＦＦＦの範囲になければならない。

処理要ＤＰ　（ｉ、ｊ）のプロセッサもまたローカルハスＢ（ｉ、ｊ）を介して隣接処理要素のローカルメモリＭ　（Ｎ）　。

Ｍ　（Ｅ）　、　Ｍ　（Ｓ）およびＭ　（Ｗ）にアクセスすることができる、これら隣接するローカルメモリに対するアクセスは、対応するローカルアドレス裁定回路、すなわちＤ　（Ｎ）　。

Ｄ　（Ｅ）　、　Ｄ　（Ｓ）およびＤ　（Ｗ）により裁定される。Ｐ（ｉ、ｊ）のローカルプロセッサが、これら隣接ローカルメモリにアクセスできるためには、Ｐ（ｉ、ｊ）のローカルプロセッサは前記特殊例の場合、適当な範囲内のアドレス、例えばそれぞれ１００００〜ｌＦＦＦＦ、２００００〜２ＦＦＦＦ、３００００〜３ＦＦＦＦおよび４００００〜４ＦＦＦＦの範囲のアドレスを使用しなければならない。

逆に、ローカルメモリＭ（ｉ、ｊ）は、Ｄ（ｉ、ｊ）により裁定される各ローカルバス上に配置されたアドレスを介して隣接する処理要素のプロセッサによりアクセスすることができる。処理要素のプロセッサＰ　（Ｎ）　、　Ｐ　（Ｅ）　、　Ｐ　（Ｓ）およびＰ　（Ｗ）が、ローカルメモリＭ（ｉ、ｊ）にアクセスすることができるためには、これらのプロセッサは前記特殊例の場合、それぞれ１６進アドレス範囲３００００〜３ＦＦＦＦ、４００００〜４ＦＦＦＦ、１００００〜ｌＦＦＦＦもしくは２００００〜２ＦＦＦＦでこのメモリにアクセスすることになろう。

Ｐ（ｉ−１，３）がＰ　（ｉ、３）上のローカルメモリにアクセスする場合には、それはＰ（ｉ−１，ｊ）から考えられるＰ　（Ｓ）の処理要素をアクセスすることになる。Ｐ（ｉ−１、ｊ）からＰ（ｉ、３）のローカルメモリにアクセスするために使用されるアドレスは、かくしてＰ　（Ｓ）のアドレス、すなわち３００００〜３ＦＦＦＦということになる。

このようなデバイスにより、ａ＊ｂ処理要素は何れもその隣接処理要素とデータを共有することができる。

ローカルアドレス裁定装置Ｄ（ｉ、ｊ）は、１つのローカルプロセッサから、４つは隣接処理要素上のブロモ、すから全部で５つの入力接続部と、ローカルメモリＭ（ｉ、ｊ）への１つの出力接続部とを備える。各入力は、異なる領域にあるアドレスを受け取る。入力は、ｎｏ、ｎｌ、ｎ２．ｎ３およびｎ４の領域のアドレスを受けとる。一つの入力がアドレスを１個受は取ると、該入力はローカルメモリに対する出力である＠２のアドレスＭ（ｉ、ｊ）にそのアドレスをマフピングすることによって、ローカルメモリ内の物理的メモリロケーションをアクセスする。前記特殊例の場合、受は取られたアドレスはアドレスの最大を効１６進桁を無視することによりマツピングされる。

かくして、例えばもし処理要素のプロセンサＰ（ｉ、ｊ）が、ローカルメモリＭ（ｉ、ｊ）内の１６進アドレス０１２３Ａのデータにアクセスできれば、処理要＠Ｐ　（Ｎ）のプロセッサはメモリＭ（ｉ、ｊ）内の１６進アドレス３１２３Ａの同一データにアクセスでき、処理要素Ｐ　（Ｅ）のプロセッサはメモリＭ（ｉ、ｊ）内の１６進アドレス４１２３Ａの同一データにアクセスでき、処理要素Ｐ　（Ｓ）のプロセンサはメモリＭ（ｉ、ｊ）内の１６進アドレス１１２３Ａの同一データにアクセスでき、更に処理要素Ｐ　（Ｗ）のプロセッサはメモリＭ（ｉ、ｊ）内の１６進アドレス２１２３Ａの同一データにアクセスすることができる。

コントローラは、グローバルバスＧ上にある。ローカルバスＢ（ｉ、ｊ）上に配置されたアドレスは、ローカル−グローバルアドレスマンピング回路ヲ介してグローバルバスへ発することができる。処理要素Ｐ（ｉ、ｊ）がコントローラにアドレス指定することができるためには、ローカルバスＢ（ｉ、ｊ）上にｈ５より大きいかもしくはそれに等しいアドレス（例えば、１６進ＦＯＯＯＯ〜ＦＦＦＦＦ）を配置しなければならない、範囲ｈ５〜Ｈのアドレスは、全て単一のアドレスに７７ピングするように構成するのが便利であると思われる。例えば、ローカル−グローバルアドレスマツピング回路は、単一のアドレスに対して１６進アドレス範囲ＦＯＯ００〜ＦＦＦＦＦ内のアドレスをマツピングしてもよく、さらに唯一つのアドレスだけしかグローバルバス上には置かれないから、その単一のアドレスを単一の信号によって置き換えることができる。更に、データをコントローラに転送せずに、コントローラから処理要素により読み取るようにすることが望ましい、この手段によって、全プロセッサＰ　（ｉ、ｊ）がＳＩＭＤモードで動作している場合、それらに対して命令コードを「同報通信」させることができる。

本発明により必要とされる裁定ならびにアトＩ／スマソビング回路は、当業者によって設計することが容易であろう。

添付図面を参照して本発明を説明する。

第１図は、４つの隣接処理要素に接続するための手段を備えた一つの独立した処理要素の線図、および第２図は４つの隣接処理要素に接続された独立の処理要素の線図である。

第１図は、とりわけメモリアドレス裁定装置とバスから成る処理要素の全体構造を示したものである０図示した付加的バスは、複数の処理要素の場合の隣接処理要素上にある同様のバスから派生する。

プロセッサ１は、０〜ＦＦＦＦＦの範囲の１６進アドレスを生成させることのできるものであれば、従来より市販されているマルチプロセンサでよく、これはアドレス／データバス２に接続される。プロセッサによるメモリ要求はこのローカルバスを介して転送される。処理要素は、複数の処理要素のうちの一つを表わす。

ローカルバス２もまた、ローカルアドレス裁定装置３．ローカル−グローバルアドレスマンピング装置９および４つの隣接処理要素のアドレス裁定装置に接続される。従って、プロセッサ１により発せられるアドレスは、バス２を介して隣接処理要素のローカルアドレス裁定装置へ向かう。

逆に、ローカルアドレス裁定装置３は、ローカルバス２へ接続されるほか、４つの隣接処理要素のローカルバスにも接続される。裁定装Ｗ、３の働きは、異なるアドレス範囲を用いてローカルメモリ４を分岐することである。ローカルアドレス裁定装置３は、当業者により標準的部品から製作することができる。この装置は、プロセッサ１によりローカルバス２上に配置された１６進アドレス範囲ｏｏｏｏｏ〜０ＦＦＦＦのアドレスを受けとり、１６進アドレス範囲００００〜ＦＦＦＦでローカルメモリ４をアクセスすることができる。該装置３は、隣接処理要素のバス５．６．７．８上にそれぞれ置かれた１６進範囲１００００〜ｌＦＦＦＦ、２００００〜２ＦＦＦＦ、３００００〜３ＦＦＦＦおよび４００００〜４ＦＦＦＦのアドレスを受け取る。これらのアドレスは、００００〜ＦＦＦＦの１６進アドレス範囲にマンピングされ、ローカルメモリ４へのアクセスが可能になる。

アイテム１１は、ローカル裁定装置からローカルメモリへ至る単なるアドレス／データバスである。

装置３が受け取ったアドレスは、装置３に提示されたアドレスの４つの下位１６進ｔｉｊにより識別されるアドレスで、ローカルメモリ４内のデータをアドレノンングすることになる。

ローカル−グローバルアドレスマツピング装τ９は、ローカルバス２に接続される。ＦＯＯＯＯ〜ＦＦＦＦＦの範囲のアドレスは、装置９によりグローバルバス１０上の単一（，３号にマツピングされる。この装置は、当業者により標準的部品から製作することができる。

グローバルバスは、任意数の複数処理要素により同時にアクセスすることのできる命令・データバスであり、コントローラに接続される。

グローバルバスは、処理要素による読み取りサイクル用にだけ使用される。複数処理要素は、グローバルバスを使用してＳＩＭＤ操作用の命令コードを受けとる。

これは、複数処理要素が全て同時にグローバルバスをアトレンジングする場合に行われる。

第２図は、単一処理要素１１をその隣接処理要素１２゜１３．１４．１５の裁定装置に隣接接続したものを示したものである。各処理要素は、隣接処理要素を４つもっており、更にグローバルバス、従ってコントローラへ接続される。

一般に、その他の相互接続、形が必要な場合には、一つの処理要素は前記以下の数の処理要素もしくは数多く隣接するために拡大した裁定装置へ接続することができる。

どＦＩ６．２、−−−−、、−−−、、−、、−、、−−−−　Ｗｊ〒／ｌ’：ｌｊｌ　Ｒ７／ｎＯ）１１Ｉ剛−一書−＾紳−約−ｓ、、ＰＣτ／ＧＢ　８７１００２３１

Claims

【特許請求の範囲】

１．複数の同一処理要素でその各処理要素が、プロセッサと，同プロセッサによりアドレッシング可能なローカルメモリと、その他の処理要素からの前記ローカルメモリに対するアクセスを制御するための裁定装置とから構成され、前記処理要素の少なくとも一つがデータを共有するためにＸ個の隣接処理要素（但しＸは少なくとも１の整数）に接続され、処理要素内のプロセッサによりアドレッシングされる記憶空間が少なくともＸ＋１個の領域に分割され、前記領域のうちのアドレッシング中のものによって処理要素のローカルメモリ中のデータがアクセス可能になり、前記領域の他の一つをそれぞれアドレッシングすることによって前記Ｘ個の隣接処理要素のうちの異なった一つのローカルメモリ内でデータをアクセスすることを可能とするマルチプロセッサコンピュータ。
２．複数の処理要素でその各々が１個の隣接処理要素を備えると共に１個の処理要素の隣接処理要素である請求の範囲第１項に記載のマルチプロセッサコンピュータ。
３．１個の隣接処理要素を有する処理要素がそれぞれそれ自身前記隣接処理要素の隣接処理要素である請求の範囲第２項に記載のマルチプロセッサ。
４．処理要素の動作を制御し処理要素を往復するデータの転送を制御するためのコントローラを備え、それぞれの相互接続された処理要素上でアドレッシング可能な記憶空間がＸ＋２個の領域に分割され、記憶空間領域が前記コントローうと連絡するため前記記憶空間領域内のアドレスにアクセスすることにより処理要素にコントローラ内のメモリにアクセスさせるようにした請求の範囲第１項ないし第３項の何れかに記載のマルチプロセッサコンピュータ。
５．コントローラにリンクした記憶空間領域内のアドレスが全て単一のアドレスにマッピングされ、このアドレスに照会することによって回路に対して信号をコントローラに送らせ、処理要素がデータもしくは命令を必要としていることを指示する請求の範囲第４項に記載のマルチプロセッサコンピュータ。
６．コントローラと関連するメモリロケーションにアクセスする処理要素が、コントローラと無関係のメモリロケーション内のアドレスにアクセスすることになるまで、同様にコントローラと関連したアドレスにアクセスする他の処理要素と共にＳＩＭＤモードで動作する請求の範囲第４項または第５項に記載のマルチプロセッサコンピュータ。
７．処理要素同士が共に規則的位相形に接続される請求の範囲第１項ないし第６項の何れかに記載のマルチプロセッサコンピュータ。
８．処理要素同士が２進トリ−として接続される請求の範囲第７項に記載のマルチプロセッサ。
９．処理要素同士がトールスとして共に接続される請求の範囲第７項に記載のマルチプロセッサコンピュータ。
１０．処理要素同士が超立方体形に接続される請求の範囲第７項に記載のマルチプロセッサ。
１１．複数の処理要素でその各々が位相的に識別される位置に隣接処理要素を備え、その全てが同一範囲のアドレス群により所定の位相幾何学的位置にある隣接処理要素のメモリをアクセスする請求の範囲第７項ないし第１０項の何れかに記載のマルチプロセッサ。
１２．所定の処理要素に対する隣接処理要素の数が、複数の処理要素全体に亘って一定である請求の範囲第１項ないし第１１項の何れかに記載のマルチプロセッサコンピュータ。
１３．処理要素がそれぞれ４つの最も近接する隣接処理要素を有する請求の範囲第１２項に記載のマルチプロセッサ。