JPS63503015A - デ−タ処理コンピュ−タシステム - Google Patents

デ−タ処理コンピュ−タシステム

Info

Publication number
JPS63503015A
JPS63503015A JP62501488A JP50148887A JPS63503015A JP S63503015 A JPS63503015 A JP S63503015A JP 62501488 A JP62501488 A JP 62501488A JP 50148887 A JP50148887 A JP 50148887A JP S63503015 A JPS63503015 A JP S63503015A
Authority
JP
Japan
Prior art keywords
processor
memory
circuit
pem
processors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62501488A
Other languages
English (en)
Inventor
モハメッド アリ,カイリ,エイ.
ファ−レン,レンナ−ト イ−.
Original Assignee
シユテイフテルセン インスチチュ−テット フオル ミクロフエ−クシユ テクニク ビド テクニスカ ホグスコ−ラン イ ストックホルム
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by シユテイフテルセン インスチチュ−テット フオル ミクロフエ−クシユ テクニク ビド テクニスカ ホグスコ−ラン イ ストックホルム filed Critical シユテイフテルセン インスチチュ−テット フオル ミクロフエ−クシユ テクニク ビド テクニスカ ホグスコ−ラン イ ストックホルム
Publication of JPS63503015A publication Critical patent/JPS63503015A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/173Interprocessor communication using an interconnection network, e.g. matrix, shuffle, pyramid, star, snowflake
    • G06F15/17356Indirect interconnection networks
    • G06F15/17368Indirect interconnection networks non hierarchical topologies
    • G06F15/17375One dimensional, e.g. linear array, ring

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multi Processors (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Communication Control (AREA)
  • Devices For Executing Special Programs (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】 データ処理コンぜユータシステム 本発明はサーチツリー形式のプログラムの興行、いわゆるOR並列冥行を目的と するデータ処理コンぜユータシステムK11mするものである。
近年、プログラム興行順序會サーチツリー形式で書くことができる数種の異なる プログラム言語およびプログラム構造が開発されている。その−例としてム言語 がある。この種のプログラムは逆さにしたツリー1−根元から順にコンピュータ で検索して行くところって各分岐点で1つの分枝が選択、チェックされた後、分 岐点に戻って他の分枝がチェックでれる。したがって、この種のプログラムの冥 行時には多くの異なる分枝がチェックされる。分岐点において2つのコンピュー タを並列に動作させ、それぞれのコンピュータで1個ずつの゛分枝のチェックを 行なうことができる。しかし、これは両方のコンピュータにメモリが含まれ、そ のメモリ内容が分岐点の環境状態と呼ばれる分岐点決定情報および分岐点関連デ ータで更@でれること前提としている。いわゆる分岐A1たは分割点環境状態を 形取するデ、−夕含ひ情報の範囲は非常に広い。
したがって、サーチツリーを高速で検索するためには、1つのコンピュータが1 つの分枝を興行するように数個のコンピュータ會並列動作させる必要がおる。
このような処理?するために数個のコンぎユータを備えたコンピュータシステム については、1985年7月マンチェスタで開催された第5世代コンtユータ構 造に関する会議で報告されたY、ソー7、K、サトウ、K、クモン、H,マサズ ワ、A、イタシキ共署の論文「順次処理に基づく新しい平行干渉機構」七の他に 記載されている。
上記種類のコンピュータシステムについては、周知のコンピュータシステムのシ ステム徊屡を示す添付第1図を参照しながら以下に簡単に脱明する。
本発明の詳細は付図に示す各実施例にしたがって後述する。付図において、纂2 図は第1笑励例によるコンピュータシステム會示す図、第6図は第2笑施例によ るコンピュータシステムを示す図、第4図は第2囚のコンピュータシステムの簡 略ブロック図、第5図は第4図のコンピュータシステムの部分的詳細図、第6図 は第5図の回路網の物理的構造を詳細に示す回路図、第7図は変形実施例による コンピュータ、システムを示す囚、第8図は第7図のプロセッサ要素(PEM  )の詳細図、第9図は第7@の回路網の物理的mgを詳細に示す図である。
第1図のコンピュータシステムは16個のプロセッサ丁なわちいわゆる処理要素 (PE)を備えており、さらに、「データ回路網」として図示されたデータ回路 網と、異なるコンピュータPEi制御する「制御回路網」として図示された制御 回路網を備えている。各プロセッサPEKは、それ自身の内部メモリが含まれ、 そこにプログラムコードの複写とプログラム実行に必要な各種情報が格納されて いる。上記制御回路網に大体矢印の方向に信号を分配するためのものであり、そ れにより各プロセッサPEの動作状態勿知ることができる。第1プロセツサPE が窒であって、第2プロセツサPRがサーチツリーの分岐点にあれば、制御回路 網七介して信号が供給され、その信号で第1プロセツサを制御することによって 分岐点の彼の1つの分枝に対する実行が開始される。この実行に除して、上記デ ータ回路網は丁べての所要清報およびデータ、丁なわち上記環境状r3ヲ第2プ ロセップのメモリから第1プロセツサのメモリへ複写するために使用される。そ の後、これら2つのプロセッサによってサーチツリーの各分枝が実行される。こ の手順にその後も、プロセッサが分岐点に達するごとに反復される。各コンピュ ータは当然、1つの分枝が完了すれば開放され、他の分枝の実行に備える。
しかし、2つのプロセッサ間で動作が分担されるように環境状態全更新するため に笑際の環境状態?1っのプロセッサから他のプロセッサへ転送する時間が長過 ぎて、許容し難いことが多い。これは上記種類のプログラムの実行時間に関する 大きな制約となる。実際の環境状態を1つのプロセッサから他のプロセッサへ複 写するためには、時間を要するばかりでなく、複写に要する時間中はコンぎユー タによる実行動作が不能になる。
本発明は上記問題を完全に解決し、高速のFOR並列干渉装置」と称するコンピ ュータシステム會提供するものであり、それにより、順次処理に伴う利点を維持 ながら、実行作業?2つまたは6つのコンピュータに分割するための時間が最小 化される。
このように、本発明はいわゆるサーチツリー形式で記述可能なプログラムの実行 、いわゆる○R型並列冥実行主目的とし、複数のコンピュータまfcはプロセッ サとメモリ上方するコンピュータシステムに関するものである。すなわち、各プ ロセッサは回路網を介してメモリモジュールに接続可能であり、各プロセッサに 割り当てられたメモリモジュール群の曹込み入力に各プロセッサを同時に接続す る機能を上記回路網が備えていることにより、接続メモリモジュール群に対して 同時に上記プロセッサによる情報書込みが可能になり、前記回路網はまた、前記 プロセッサ?@記メモリモジュール群の中のメモリモジュールの阻−の読出し出 力端に接続する機n巨を備えており、さらに、プロセッサ間ヨびメモリモジュー ルの動作状態を走査するための制御部材を設け、例えば第17′′ロセツサが実 行プログラムのサーチツリーの分岐点に達したときのような所定の状況で制御部 材によって前記回路網を制御することにより、実行中でない他のプロセッサが1 つのメモリモジュールの読出し出力端と、第1プロセツサに接続されていた書込 み入力端とに接続され、分岐点に至るまでの実行時のデータが供給されること’ kW似とするコンピュータシステムに関するものである。fた、2つのメモリモ ジュールにアクセス可能な場合、制御部材で前記回路網を制御することによって 前記最後に述べたメモリモジュール群の誉込み入力端の中の少なくとも別の1つ に第2プロセツサが接続されることにより、前記第2プロセツサによる後続興行 期間中にこれらデータがv’a込まれるようにすることが好ましい。
上記記述において、コンピュータまたはプロセッサという述語上使用しているが 、コンピュータとは各糧メモリ?備えたプロセッサであって、数個のプロセッサ ユニツ)7含むことが可能でちるものとする。また、プロセッサは単純形式のコ ンピュータで、CPU形式の単なる処理装置とする。
第2図にブロック図で示す。このシステムは一連のプロセッサPEl、PE2、 P E 3−・・、PEn1備えており、これらプロセッサは一連のメモリモジ ュールMM1、MM2、M M 3、MM4、・M M nに接続される。メモ リモジュールの個数はプロセッサの個数より多いことが好ましい。
各プロセッサPEには、実際のプログラムコードとインタゾリテータを格納する 内部メモリが含まれる。
コードがコンパイル済みの場合にはインタゾリテータは不要である。プロセッサ は周知の適切なプロセッサ、例えばモ)o−ラ社bMc68000″rtsgす ることかできる。
メモリモジュールもまた、例えば64 K RAM等、周知の適切な装置で構厖 することができる。
さらに、第1回路網「群分配回路網J ()BNが設けられ、この回路網GBN  上方してプロセッサPEとメモリモジュールMMが接続される。本発明による 回路網GBNによって、各プロセッサは同時にメモリモジュール群に接続可能で 勘って、七の接欣点が各メモリモジュールの書込み人力Wになる。それはメモリ モジュール群M M K接続された7°ロ七ンサPEが同時にメモリモジュール 群MMの各モジュールに情報tv@込む目的を持っている。
また、第1回路網1 (GBN )により、各プロセッサPE’i(上記メモリ モジュール群の111のメモリモジュールMMの読出し出力端RK接続すること ができる。
したがって、回路網1(()BN )によって、例えばPE1tメモリモジユ一 ル群MMi、MM2、MM3の瞥込み人力Wに接続すると同時に、PE1にメモ リモジュールMM1の読出し出力端Rに接続することが可能また、回路網1 ( GBN )を制御部材2「プールマネジャーJ(PM)によって制御することが 可能であり、それにより、いずれかのプロセッサPE1i個以上のメモリモジュ ールMMK接続することが可能である。
制御i材2(pM)はコンtユータまたはプロセッサで構成され、このコンtユ ータによってプロセッサII(PE1〜pEn)およびメモリモジュール群(M M1〜MMn)の制御が可能であり、また、このコンぎユータで第1回路網1  (GBN ) k制御することによってプロセッサ(PE)とメモリモジュール 群MMの間の異なる組合セ接続や、各プロセッサPEの動作開始・停止操作、さ らに各プロセッサPRの動作状態の定食が可能になる。
制御部材PMとして特別なプロセッサを使用する代わりに1個または数個のプロ セッサPEk利用することが可能である。
したがって、本発明によれば、上記制御部材は特別なプロセッサ2、あるいは1 個ま7′cは数個のプロセッサPR″r:agされる。その構成とは関係なく、 制御部材はN接または間接的に各プロセッサPEK接続され、さらに各メモリモ ジュールと上記回路網の制御入力に接続される。
本発明によれば、第1プロセツサPEがサーチツリー形式のプログラムの実行時 に分岐点に達し、そのプロセッサから信号が発生すると、実行中でない纂2プロ セッサが制御部材2(PM)によって作動開始する。
この第2プロセツサは第1プロセツサによる前記分岐点に到るまでの実行中のデ ータを受けていた唯一のメ(GBN ) k介して接続されるようになっている 。また、好適実施例によれば、前記最後に述べたメモリモジュール群の書込み入 力端の中の少なくとも別の1つに回路+l4i(oBN)を介して第2プロセツ サが接続されることにより、後続実行期間中にこれらのメモリモジュールにデー タが誓き込まれる。
回路網を介してプロセッサとメモリモジュールの異なる組合せ接続時にIIJ御 部材2から回路網に制御信号が供給され、それによって接続が行なわれる。
しかし、1つの条件として、分岐点まで第1プロセツサに接続され、第2プロセ ツサと共用の少なくとも2個のメモリモジュールが必要でちる。
−実施例によれは、第2回路網3「インタープロセッサ回路網JINが設けられ 、この回路網はプロセッサPEのそれぞれ、に接続され、異なるプロセッサ間の 通信チャンネルを形成する。この回路網を介して2個以上のプロセッサPRが互 いに同期され、実行の開始または停止が行なわれる。
別の実施例によれば、追加のメモリ4「グローバルメモリ」が設けられており、 これは各プロセッサPRに接続される。上記メモリ4には、プロセッサPEの実 行情報と、実行時に各プロセッサから得られる解が記憶される。例えば各プロセ ッサ間に分配された作業から、おる個数の解が必要な場合、どのプロセッサが実 行中であるかという情報がメモリGMに記憶される。
ここで得られた各解はまた、どのプロセッサからその解が得られたかという情報 とともにメモリ4(GM)に記憶される。必要個数の鱗が得られると、例えば、 プールマネジャーから実行中のプロセッサPEに対して停止信号が送られる。そ して、停止したプロセッサから制御部材2 (PM )に信号が送られ、七のプ ロセッサは再びプログラムの他の部分t−冥性行可能状態になる。
このように、メモリ(GM)によって実行処理が同期化され、効率が増す。しか し、本発明の簡略笑め例では、第2回路網3(IN)もメモリ4も不灸である。
また、メモリ4は制御部材2とともに集積回路化することか可能である。
メモリ()Mは個別装置でおる必要はなく、メモリモジュール群のうちの1個ま 九は数個で構成することが可能でおり、あるいは、プロセッサの1個またはte aの内部メモリで#l取することも可能である。
一実施例において、サーチツリー形式で記述されたプログラムの実行は原則的に 次のように行なわれる。
まず、制御部材2PMからプロセッサPEに実行開始のために信号が送られる。
プロセッサPE1は第1回路網1 (GBN ) %−介して、例えば全メモリ モジュールMMの曹込み入力端Wと、1つのメモリモジュールMM1の読出し出 力端Rに接続される。PEIが分岐点に達すると、分岐点到達を示す信号がPE iから制御部材2(PM)に送られる。制御部材2(PM)によって空きのプロ セッサPE2が選択され、そのPE2に制御部材2から信号が送られる。PE2 は例えば、メモリモジュール群MMの半数の瞥込み入力@Wに接続されるが、読 出し出力端R1−P R1に接続したメモリモジュールMMiには接続されず、 PE2に接続されたメモリモジュールのうちの1つの読出し出力端Rには接続さ れる。また、PE2とメモリモジュールの接続を可能にするため、PE1とメモ リモジュールの接!5!を解除する信号が制御部材2からPE1に送られる。P E2に接続されていたメモリモジュールにPRlから情報およびデータが書き込 まれると、分岐点の環境状態がPE2に対して読出し可能になり、したが間にP E2は分岐点後の別の分枝を実行開始することかできる。このような実行作業の 分担は各分岐点で行なわれ、接続されるプロセッサの数が順次増加する。
プロセッサPEが分岐点におって、ただ1個の空きメモリモジュールに接続され ている場合は、制御部材2がそのプロセッサPEi次に全くメモリモジュールに 接続することにより、分岐点の環境状態?含むメモリモジュールからその接続メ モリモジュールに情報およびデータが周知の方法で誉き込まれる。七の後プロセ ッサが空き、七のプロセッサがメモリモジュール群の中の1個の読出し出力に接 続されて分岐点の環境状態がそのメモリモジュールに複写され次第、実行作業の 分割が行なわれる。しかし、このような状況はプロセッサが実行中にただ11@ のメモリモジュールにアクセスして分岐点に達した場合以外には生じない。
プロセッサが1つの分枝の実行?完了したとさ、プロセッサから?1iiJ%部 材2に信号が送られ、そして適切な時期にメモリ4(GM)にも送られ、それに より、接続メモリモジュール老メモリモジュールのプールに戻丁ための信号が制 e11部材2からプロセッサに送られる。その後プロセッサもまたプロセッサの プールに入る。
各プロセッサから一連のメモリモジュールに薔込みが行なわれ、実行中に1個の メモリモジュールからだけ読出しが行なわれるときには、読み誓き動作の相互順 序を維持する必要がある。さもなけれは、メモリモジュールから無効データが読 み出される可能性がある。
実行プロセッサが読み出す1個以外の全メモリモジュールに対する書き込み動作 はもちろんj順序?遅らせることが可能である。
制御部材2はまた、プロセッサが数個のメモリモジュールに同時に接続され、実 行を開始するプロセッサに対してメモリモジュールが1価しか割り当てられない 場合に、前者のプロセッサから1個または数個のメモリモジュールを接ffch 除して後者のプロセッサに接続する機能を持っている。
上記説明から明らかなように、当該コンピュータシステムは、複数のプロセッサ が異なる分枝で同時に動作するようなサーチツリー形式プログラムの実行に特に 適しており、分岐点の環境状態の書込み動作が完全に、あるいはほぼ完全に除去 される。誉込み動作の除去によってプログラムの実行速度が著しく速くなる。
これは本発明システムすなわち、上述のようにプロセッサが2個以上のメモリモ ジュールの簀込み入力に接続されるとともに、それらのメモリモジュールのうち の1個だけの読出し出力端に接続されるように設計した当該コンピュータシステ ムによって可能になった。
ここに引用した種類のコンピュータシステムに関するもう1つの問題はメモリモ ジュールとプロセッサの間の接続が複雑なため、メモリモジュールなどのメモリ からの読比し動作に比較的長い時間がかかることである。
プロセッサとメモリモジュールの個数が例えハ10個程度と少ない場合は、上記 読出し時間は光分に短くすることかでさる。しかし、フ0ロセッサとメモリモジ ュールの数がかなり多く、例えば100イ固にもなると、読出し時間が長くなっ て満足し得ない。
本発明のもう1つの実施例によれば、この読出し時間?充分に短くすることがで きる。その実施例を第3と呼ばれる一連の複合ユニットヲ備えている。各クラス タにはvI数のプロセッサPEとメモリモジュールMMが含まれ、各クラスタご とにプロセッサとメモリモジュールが前記糧堵の第3回路網5.6,7(スイッ チング回路網)SWに接続される。各クラスタに含まれるプロセッサとメモリモ ジュールの個数は比較的少なりシ、回路網5,6.7に適当な複雑さを持九せて 上記処理装置内のアクセス時間を短くするようになっている。メモリモジュール の個数はプロセッサの個数より多い方が好ましい。回路網5,6.7(SW)は 第2図の上記第1回路網1(()BN )に応答し、そして、それら回路網によ って同一クラスタ内の2価以上のメモリモジュールに各プロセッサPEが接続さ れ、それらのメモリモジュールのうちの1個だけの読出し入力端にプロセッサが 長続される。
この実施的では、あるクラスタに望きメモリモジュールがない場合に他のクラス タ内の箪キメモリモジュロ、7によって追加の第4共通回路網8「インタークラ スタ切換回路網J (INS ) f制御し、1つのクラスタの回路網5,6. γと他のクラスタの回!+!網5,6゜γと?結合することが可能である。
好適実施例によれば、共通回路網8と各クラスタ内の回路網5.6.7によって 、あるクラスタ内のプロセッサ?他のクラスタ内の1個以上のメモリモジュール の誓込み入力に接続することか可能である。
さらに、謳5回路網9「プロセッサ間回路網J (IN)が設けられており、こ の回路網は稟2図と関連して記述し7’C第2回路網3(IN)と全く同一でお る。纂2図のコンぎユータシステムと同様に、制御部材10「プールマネジャー J(PM)とメモリ11 「グローバルメモIJJ(GM)が設けられている。
制御部材10の動作形態は第2図の制御部材2に関連して記述しfc動作と同一 である。また、制御部材10Kに、どのプロセッサとどのメモリモジュールが各 クラスタに属しているかという情報が記憶される。上記と同様に、制御部材10 には沓らに、どのメモリモジュールがどのプロセッサに接続され、その各メモリ モジュールにどんな環境状態が格納されているかという情報が記憶される。制御 部材10に用いてプロセッサおよび回路網を制御することにより、第1のクラス タ内の第1プロセツサと第2のクラスタ内の第2プaセツtが分岐点で実行作東 を分担することが可能であplその条件として、糖2のクラスタにメモリモジュ ールが含まれ、分岐点に至るまでの実行中の情報およびデータ、丁なわち分岐点 の環境状態がそのメモリモジュールに書き込まれていることが必要である。
実際の環境状態を記憶しているメモリモジュールがない場合は、実際の環境状態 上記憶しているメモリモジュールから空キメモリモジュールへの書込みt周知の 方法で行なう必要がある。その場合、制御部材10から書込み命令が発住し、あ るメモリモジュールから他のメモリモジュールへの書込みが指示される。:fF ′@込1れる方のメモリモジュールが同一のクラスタに属していれば、曹込みは 1つのクラスタ内の回路網5゜6.7(SW)’に介して行なわれる。:i1@ 込まれる方のメモリモジュールが別のクラスタに属している場合は、関連の処理 ユニットの回路網5.6.7(SW)と前記第4の回路網8(INS ) f介 して警込みが行なわれる。第31のコンピュータシステムにおいてアクセス時r ai k長くしないためには、1つのクラスタ内のプロセッサおよびメモリモジ ュールのイー数音あまり多くしないことである。
各クラスタ内では信号路を短くするために、異なるプロセッサとメモリモジュー ルがそれぞれ近接して配置される。
第3図の実施例の非常に好ましい特長は、前記回路1)表器63−503015  (6) 1つのクラスタから他のクラスタへの曹込み時間を比較的長く、例えば数百マイ クロ秒程度にすることがでに維持することは重要である。処理装置内のプロセッ サが常に同一処理装置内のメモリモジュールから読み出すため、簀込み動作時間 が比較的長くても実行時間が影響を受けることはない。
上記回路網1,3.5.6.7,8.9すなわち「群分配回路網J(GBN)、 上記「インタープロセッサ回路網J(IN)、上記「インタクラスタ切快回路網 J (INS )、上記「スイッチング回路網J(SW)は周知の技術を利用し て種々の設計が可能である。例えば、これらの回路網として、いわゆるシャツフ ル交侠回路網や、光学形式などの高速バス、VME多1多口プロセッサバスロス バー接続などが使用可能である。
また、プロセッサおよびメモリモジュールの個I!が少ない場合はもちろんポイ ントコネクション用として従来のポイントコネクションを利用することが可能で ある。
基本的な特長は、第1回路網1 (()BN )によって、すべてのプロセッサ を任意の1個以上のメモリモジュールに接伏し得ることである。これはクラスタ 内のプロセッサおよびメモリモジュールに対する第3回路網5.6.7の関係に ついても同様に適用される0第2回路網3(IN)および第5回路網9の場合は 、各プロセッサ間の通信チャンネルおよび制御チャンネルとして機能するように 設計することが必要である。第4回路網8 (INS )の主な特長は、異なる クラスタの内部回路網5.6.7(SW)間の通信チャンネルとして機能するこ とである。
以下に簡単に述べる2つの実施例において、異なるプロセッサまたは異なるメモ リモジュール?相互接続する回路網構成についてより詳細に説明する。
第4図は第2図とほぼ同様に徊厄されたコンピュータシステム會簡単なブロック 図で示し友ものであるが、8個のプロセッサPQ−P7と16個のメモリモジュ ールMO〜M15が群分配回路網と呼はれる回路網12に接続されている。回路 網12に2組の入力出力端、丁なわちプロセッサPO〜P7に接続される入力出 力端と、メモリモジュールMO〜M15に接続される入力出力端を備えている。
第5図は第4図の回路網14の一部13に示している。この回路は1ビット分荀 示すものであるので、回路網12は第5図の回路32個に32ビツトのアドレス /データバスで接続した構成になる。各回路には、プロセッサPEとメモリモジ ュールMMの間の1ビットを接続する回路13 (ICNスライス)が含まれる 。
各プロセッサPEは2つの端子を介して回路13に接続される。この2つの端子 のうち、工10で示す一方の端子14はアドレスおよびデータ用、R/Wで示す 他方の端子15は読み書き制御用である。第6図は回路13の詳細を示している 。第6図では、入出端I10は参照符号14、制御入力端R/ Wは参照符号1 5で示されている。
各メそリモジュールMMは、Wrで示す誉込み入力端16とRaで示す読出し出 力端r介して回路13に接続される。
回路13の具体的な槽底要素として下記のようなTTL回路が使用可能でおる。
D、R,はデータレジスタを示しており、74F374が使用可能である。
S、Rはシフトレジスタを示しており、74F299が使用可能である。選択は 選択回路を示しており、74F251が伴用可能である。これらの回路は米国フ ェアチャイルド社その他で製造されている。バッファおよびBfで示すバッファ 回路または駆動回路18゜19が設けられており、これらは例えばTTL回路7 −F244で構成することが可能でおり、この部品2個で駆動回路が構成される 。
このように上記回路網は複数の選択回路を有し几結合回路を備えており、制御入 力を介して制御部材によ會メモリモジュールの誉込み入力と読出し出力に接続す るようになっている。この回路はさらに、一連のシフトレジスタkgflえてお り、各プロセッサと各メモリモジュール間で行なわれる回j15接続に関する情 報を含ひ一連のデータビットが、制@部材によって順次このシフトレジスタ円に 記障される。また、複数のデータレジスタが設けられており、シフトレジスタか らこのデータレジスタへの情報転送は制御部材によって制御され、並列転送が行 なわれる。データレジスタの出力は選択回路に接続され、前記接続が行なわれる 。
第4図および第5因にも、プールマネジャー20が示されており、これはいわゆ るバス21を介して各プロセッサPEおよびメモリモジュールMMK接続される 。このプールマネジャーは上記バス21會介してプロセッサPEの開始・停止制 御を行なう。メモリモジュールMMの動作状態の同期もまた、上記バス21を介 して行なわれる。
上記プールマネジャー20は6つの制御入力端22〜27を介して各回路13に 接続される。この入力端のうち、22〜24はプロセッサPEからメモリモジュ ールMMの誉込み入力端(Wr)への接続に利用され、制御入力端25〜27は メモリモジュールM Mの読出し出力端(Rd )からプロセッサPEへの接続 に利用される。回路13の接続は次のように行なわれる。
例えばメモリモジュールMM3の薔込み入力端がプロセッサPE4に接続される と、入力22上のビットが入力23上の信号によってクロック制御され、シフト レジスタS、R,に取り込まれ、その後も、回路13の前記接続を示す48ビッ ト全部が供給されるまでこの動作は継続する。その後、この情報は入力端23上 の信号によってシフトレジスタS、R,からデータレジスタD、R,へ並列に転 送される。メモリモジュールMM3に対応するデータレジスタD、R,において は、4誉プロセツサ(PE4)に対応するビット4が2進形式で入る。データレ ジスタD、R,の出力端は選択回路(選択)の選択入力端に接続され、したがっ て、MM3に対応する選択回路の4誉入力端12その選択回路の出力に接続され 、その出力はMM3に接続される。上記の4番人刃端はPE4に接続される。メ モリモジュールの読出し出力端(M )からプロセッサ(PE)への接続は制御 入力端25〜27’(+−介して行なう場合と同様でちる。
データレジスタD、R,k用いることにより、現在の按続七縁持てるとともに、 新しい接続を回路のシフトレジスタに導入することができる。
参照符号28は周知の反転回路を示しており、178選択回路に’/1e選択回 路として機能させるための回路である。この回路としては74FO4が適切であ る。
メモリモジュールMO−M15のどの警込み入力(Wr)とどのプロセッサPO −P7に接続すべきか、また、どのメモリモジュールからプロセッサへ読出丁べ きか、ということは上記制御入力端22〜27’(r介して上記プールマネジャ ー20によって制御される。
したがって、回路網12によって、プロセッサ71個または数個のメモリモジュ ールの簀込み入力端に接続し、プロセッサ71個のメモリモジュールの読出し出 力端に接続することが可能でちる。
前述したように、メモリモジュールの個数はプロセッサの個数より多い方が好ま しい。しかし、両者が同数でもよい。第7図は16(固の〕0ロセツサ要素(P EM)?備えた実施例?示しており、各プロセッサにはプロセッサとメモリモジ ュールが1個ずつ含まれる。第8図はプロセッサ要素(PEM)の詳細?示して おり、r CPU Jはプロセッサ292茨わし、「メモリ」はメモリモジュー ル30を我わ丁。プロセッサ29とメモリモジュール30との間にはローカルバ ス31が設けられ、インタフェース32に接続される。そのインタフェース32 には4@のシフトレジスタ33〜36が接続され、それらシフトレジスタには、 それら各シフトレジスタの入力および出力55〜58?介してそれぞれのプロセ ッサ要素PEMを相互接続するための回路網に接続される。この回路網は4つの 回路38〜41r ICNスライス」?備えており、そのうちの1個の詳細が第 9図に示されている。各要素PEMには、プールマネジャー43に接続された制 御ループ42 r PEM制御バス」が接続される。
制御ループ42を介して上記プールマネジャー43によってプロセッサ要素の動 作状態?制御することにより、各プロセッサ29の停止・開始制御ケ行なうこと ができる。制御ループ42は第4図のバス21と同じ動きをする。
各回路38〜41は前述したような構成要素S、 R,、D、 R,、B、 F 、と、選択回路MPX ’7備えてオフ、TTL。
回路74F251で構成することが可能である。
参照誉号50は第6図の反転回路28と薗様な反転回路であって、74FO4で 構逗することができる。
各回路38〜41は入力端および出力名44.45を備えており、それら入出力 端は第7図および第9図に示すように、それぞれ対応のプロセッサ要素PEMに 接続される。
各回路38〜41は制振入力端46〜48を儂えている。各回路38〜41の匍 Ja入力端46.47゜48は互いに並列に接続され、上記プールマネジャー4 3に接続される。読出し動作−1P譬込み動作が指示されているか否かに応じて 、プールマネジャー43はこれらの制御入力46〜48にしたがって実際の接続 方法および方向ヲfftlJaする。追加の端子49!a、グローバルクロック 回路用のクロック入力(パイプラインクロック)會形底する。このクロック回路 は前記プールマネジャー43内にe<iすることができる。その機能125 M H2〜’l Q MH2程屓の高い周波数で回路38〜41r介してデータのク ロック制御を行なうことであり、パイプライン機能と呼はする。
この設計の騨」点は1つのプロセッサ要素PEMかう他のプロセッサ要素への誉 込み時に住じる最高転送速度に回路網の帯域を整合さセることが可能であって、 それと同時に接@詠の本数が纂4図、第5図、第6図の実施例よりも大幅に少な くなる点である。第7図の回路網は、いわゆる4ピツ) ICNプロセッサであ る。
上記整合は回路38〜41の数を増減しても可能である。例えば、2つのPEM 間の最高転送速度が40Mビット/秒であって、各回路38〜41の帯域が10 Mビット/秒とすると、4つの回路38〜41が必要である。
第9図に示す回路38〜41の扱馳は第6図の前記回路13と基本的に同一であ る。しかし、回路38〜41は異なるプロセッサ快紫PEM 會相互にアップカ ップリングする几めに利用されるのに対し、回路13はプロセッサPEiメモリ モジュールMMにアップカップリングするため(C利用される。
椰7図の実施例では、あるプロセッサ挾素PEM内のプロセッサ2Sは回路網: s8〜41に介して他の11市または数個のプロセッサ要素のメモリの誓込み入 力に接続される。上記プロセッサ29はプロセッサ要素PEMの内部メモリ30 の誉込み入力、読出し出力の双方に接続される。
あるプロセッサユニツ) PEMと他のプロセッサユニツ) PEMが接続され る場合、入力端48上のビットが入力端47上のクロックパルスによって制御さ れ、シ詩表器63−503015 (8) フトレジスタS、R,に取り込まれる。10個のシフトレジスタに合計80ビツ トが取り込まれたとき、それらは入力端46上の信号によってデータレジスタD 。
Roへ並列に転送される。選択回路MPXは16個の入力端および出力端44. 45のうちの1個を残りの15個の入力端および出力端44.45のうちの1個 に接続するように槽底されており、それにより、おるP−と他のPEMが上記8 0ビツトで衣わされるアップカップリングに従って接続される。データレジスタ 51.52はバッファ回路Bf K接続され、七のバッファ回路上制御する。バ ッファ回路Bf Kよってデータレジスタ5.5t54の出力?入力端および出 力端44.45の端子に接続することによp1上記端子に関する入力ま7’Cは 出力が決定される。
第3図の前記第3回路網は第51¥11纂6図および第7図、第9図に関して説 明した回路網の実施例にしたがって設計することができる。第6囚の前記第4回 路網8も同様に設計することが可能でおる。
以上に本発明の実施例ケいくつか例示したが、さらに別の実施例も可能である。
し7’Cかって、本発明は上記実施例に制限されるものではなく、添付の請求の 範囲円で修正が可能である。
浄1’(Pi容に変更なし) lIJv口HI網 浄書(内容:こ変更なし) 浄書(内容に変更なし) 浄書(内容に変更なし) 浄書(内容に変更なし) 手 余光 ネ百j 正 書(方式) 国際調査報告

Claims (8)

    【特許請求の範囲】
  1. 1.いわゆるサーチツリー形式で記述されたプログラムの実行、いわゆるOR型 並列案行を主目的とし、複数のコンピユータまたはプロセツサとメモリを有する コンピユータシステムにおいて、各プロセツサ(PE1〜PEn、PE、PEO 〜PE7、PEM)は回路網(1,5〜7,8,12,38〜41)を介してメ モリモジユール(MM1〜MMn、MM、MMO〜MM15、PEM)に接続可 能であり、それぞれのプロセツサに割り当てられたメモリモジユールの書込み入 力群(W、Wr)に各プロセツサを同時に接線する機能を上記回路網が備えてい ることにより、接続メモリモジユール群に対して上記プロセツサによる情報書込 みが可能になり、前記回路網にまた、前記プロセツサを前記メモリモジユール群 の中のメモリモジユールの唯一の読出し出力端(R、Rd)に接続する機能を備 えていることを特徴とし、さらに当該コンピユータシステムにおいて、該プロセ ツサ(PE1〜PEn、PE、PEO〜PE7、PEM)および該メモリモジユ ール(MM1〜MMn、MM、MMO〜MM15、PEM)の動作状態を走査す るための制御部材(2,10,20,43)が設けられ、第1プロセツサが実行 プログラムのサーチツリーの分岐点に達したときのようた所定の状況で前記制御 部材(2,10,20,43)によつて前記回路網(1,5〜7,8,12,3 8〜41)を制御することにより、実行中でない他のプロセツサが1つのメモリ モジユールの読出し出力端(R、Rd)と、第1プロセツサに接続されていた書 込み入力端(W、Wr)とに接続され、分岐点に至るまでの実行時のデータが供 結されることを特徴とするコンピユータシステム。
  2. 2.請求の範囲第1項において、2つのメモリモジユールにアクセス可能な場合 、前記制御部材(2,10,20,43)で前記回路網(1,5〜7,8,12 ,38〜41)を制御することによつて前記最後に述べたメモリモジユール群の 書込み入力端(W、Wr)の中の少なくとも別の1つに第2プロセツサが接続さ れることにより、前記第2プロセツサによる後続実行期間中に同一データが書き 込まれることを特徴とするコンピユータシステム。
  3. 3.請求の範囲第1項または第2項において、前記制御部材に1個以上のプロセ ツサ(2,10,20,43)が含まれ、前記制御部材が前記各プロセツサ(P E1〜PEn、PEO〜PE7、PEM)と前記メモリモジユール(MM1〜M Mn、MMO〜MM15、PEM)に接続され、さらに前記回路網の制御入力端 (22〜27,46〜48)に接続されていることを特徴とするコンピユータシ ステム。
  4. 4.請求の範囲第1項、第2項または第3項において、実際のプログラムコード のコピーとインタプリテータを格納するための内部メモリを備えた一連の個別プ ロセツサ(PE1〜PEn、PE、PEO〜PE7)と、前記プロセツサの個数 より多い個別メモリモジユール(MM1〜MMn、MMO〜MM15)が含まれ 、それらプロセツサおよびメモリモジユールが前記回路網(1,5〜8,12) に接続されていることを特徴とするコンピユータシステム。
  5. 5.請求の範囲第1項、第2項または第3項において、複数のプロセツサ要素( PEM)が含まれ、各プロセツサ要素にはプロセツサ(29)とメモリモジユー ル(30)が含まれ、前記プロセツサ要素(PEM)が前記回路網(38〜41 )に接続されていることを特徴とするコンピユータシステム。
  6. 6.請求の範囲第1項、第2項、第3項、第4項または第5項において、複数の プロセッサPEと複数のメモリモジユール(MM)と前記種類の回路網(5〜7 )とを備えた2個以上のクラスタが含まれ、クラスタ内の各プロセツサ(PE) と各メモリモジユール(MM)が回路網(5〜7)によつて接続され、各クラス タに対応する回路網(5〜7)に接続された共通回路網(8)によつて前記クラ スタ間の相互接続が行なわれ、各クラスタ内の共通回路網(8)および回路網( 5〜7)がクラスタ内のプロセツサ(PE)を他のクラスタ内の1個以上のメモ リモジユール(MM)の書込み入力端に接続する機能を備えていることを特徴と するコンピユータシステム。
  7. 7.請求の範囲第1項、第2項、第3項、第4項、第5項または第6項において 、前記回路網(1,5〜8,12,38〜41)が複数の選択回路(選択、MP X)を含む接続回路(13,38〜41)を備えており、その選択回路を介して 前記制御部材(20,43)によつて回路の前記制御入力端(22〜27,46 〜48)を制御することにより、各プロセツサ(PEO〜PE7、PEM)が各 メモリモジユール(MMO〜MM7、PEM)の書込み入力端および読出し出力 端に接続されることを特徴とするコンピユータシステム。
  8. 8.請求の範囲第7項において、回路(13,38〜41)に複数のシフトレジ スタ(S.R.)と複数のデータレジスタ(D.R.)が含まれ、各プロセツサ (PEO〜PE7、PEM)とメモリモジユール(MMO〜MM15、PEM) の間の回路(13,38〜41)の接続予定を示す複数のビットが制御部材(2 0,43)によつて直列に前記シフトレジスタに記憶され、前記選択回路(選択 、MPX)に接続されたシフトレジスタ(S.R.)からデータレジスタ(D. R.)への転送が前記制御部材によつて行なわれることを特徴とするコンピユー タシステム。
JP62501488A 1986-03-05 1987-02-24 デ−タ処理コンピュ−タシステム Pending JPS63503015A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE8601018-8 1986-03-05
SE8601018A SE451219B (sv) 1986-03-05 1986-03-05 Dataanordning fremst avsedd for exekvering av program i form av soktred, s k or parallel execution

Publications (1)

Publication Number Publication Date
JPS63503015A true JPS63503015A (ja) 1988-11-02

Family

ID=20363705

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62501488A Pending JPS63503015A (ja) 1986-03-05 1987-02-24 デ−タ処理コンピュ−タシステム

Country Status (7)

Country Link
US (1) US4949243A (ja)
EP (1) EP0274476B1 (ja)
JP (1) JPS63503015A (ja)
AT (1) ATE60150T1 (ja)
DE (1) DE3767464D1 (ja)
SE (1) SE451219B (ja)
WO (1) WO1987005418A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5088048A (en) * 1988-06-10 1992-02-11 Xerox Corporation Massively parallel propositional reasoning
US5136717A (en) * 1988-11-23 1992-08-04 Flavors Technology Inc. Realtime systolic, multiple-instruction, single-data parallel computer system
DE68928980T2 (de) * 1989-11-17 1999-08-19 Texas Instruments Inc. Multiprozessor mit Koordinatenschalter zwischen Prozessoren und Speichern
EP0509055A4 (en) * 1990-01-05 1994-07-27 Maspar Computer Corp Parallel processor memory system
US5537593A (en) * 1990-02-12 1996-07-16 Fmc Corporation Method for solving enumerative search problems using message passing on parallel computers
US5325500A (en) * 1990-12-14 1994-06-28 Xerox Corporation Parallel processing units on a substrate, each including a column of memory
US5379438A (en) * 1990-12-14 1995-01-03 Xerox Corporation Transferring a processing unit's data between substrates in a parallel processor
US5291611A (en) * 1991-04-23 1994-03-01 The United States Of America As Represented By The Secretary Of The Navy Modular signal processing unit
JP2766217B2 (ja) * 1994-06-14 1998-06-18 甲府日本電気株式会社 並列処理装置
US5793660A (en) * 1997-04-14 1998-08-11 Hewlett-Packard Company Circuit for finding m modulo n
DE69720002T2 (de) * 1997-12-11 2003-10-16 Bull S.A., Louveciennes Methode um Daten in einem Multiprozessorrechner über einen Crossbarschalter zu übertragen
JP3742250B2 (ja) * 1999-06-04 2006-02-01 富士通株式会社 パケットデータ処理装置及びそれを用いたパケット中継装置
US7225320B2 (en) * 2000-12-28 2007-05-29 Koninklijke Philips Electronics N.V. Control architecture for a high-throughput multi-processor channel decoding system
US7174536B1 (en) * 2001-02-12 2007-02-06 Iowa State University Research Foundation, Inc. Integrated interactive software visualization environment
EP1883240B1 (en) * 2005-05-18 2014-04-02 Nippon Telegraph And Telephone Corporation Distributed multi-media server system, multi-media information distribution method, program thereof, and recording medium
EP1936515A1 (en) * 2006-12-22 2008-06-25 Telefonaktiebolaget LM Ericsson (publ) Method and apparatus for generating a data vector
EP2115629B1 (en) * 2006-12-22 2014-06-18 Telefonaktiebolaget LM Ericsson (publ) Parallel processor
US11669613B2 (en) 2020-05-29 2023-06-06 EnSoft Corp. Method for analyzing and verifying software for safety and security

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4368514A (en) * 1980-04-25 1983-01-11 Timeplex, Inc. Multi-processor system
US4414624A (en) * 1980-11-19 1983-11-08 The United States Of America As Represented By The Secretary Of The Navy Multiple-microcomputer processing
DE3266636D1 (en) * 1981-05-29 1985-11-07 Gen Electric Co Plc Telecommunications system
US4691280A (en) * 1982-06-28 1987-09-01 The Singer Company High performance multi-processor system
JPS5941064A (ja) * 1982-08-31 1984-03-07 Nec Corp プロログ処理装置
US4608631A (en) * 1982-09-03 1986-08-26 Sequoia Systems, Inc. Modular computer system
US4757442A (en) * 1985-06-17 1988-07-12 Nec Corporation Re-synchronization system using common memory bus to transfer restart data from non-faulty processor to failed processor

Also Published As

Publication number Publication date
SE451219B (sv) 1987-09-14
US4949243A (en) 1990-08-14
EP0274476B1 (en) 1991-01-16
SE8601018D0 (sv) 1986-03-05
DE3767464D1 (de) 1991-02-21
ATE60150T1 (de) 1991-02-15
EP0274476A1 (en) 1988-07-20
WO1987005418A1 (en) 1987-09-11

Similar Documents

Publication Publication Date Title
JPS63503015A (ja) デ−タ処理コンピュ−タシステム
CN101452400B (zh) 处理多处理器系统中事务缓冲器溢出的方法和系统
JP3645281B2 (ja) 共用メモリを有するマルチプロセッサ・システム
CN1983196B (zh) 用于将执行线程分组的系统和方法
CN104699631A (zh) Gpdsp中多层次协同与共享的存储装置和访存方法
CN105404592A (zh) 管理消息队列
US7386689B2 (en) Method and apparatus for connecting a massively parallel processor array to a memory array in a bit serial manner
EP0090026A1 (en) CACHE STORAGE USING A LOWEST PRIORITY REPLACEMENT.
EP0571395A1 (en) DISTRIBUTED MULTIPLE COMPUTER COMMUNICATION SYSTEM.
JPH02168341A (ja) データ処理システム
CN101546275B (zh) 一种获取多处理器硬件信号量的方法
JPS62502151A (ja) 大型コンピユ−タシステムのコンピユ−タ機能をシミユレ−トするための配列
JPH01500377A (ja) 2個のシステムクロックサイクルを利用する書込み動作をもったキャッシュメモリユニットを供与する装置及び方法
KR100719872B1 (ko) 병렬 컴퓨터 및 이를 이용한 정보처리유닛
JP2001092772A (ja) 同期固定レイテンシループを使用するデータバス
CN87103852A (zh) 部分写控制装置
US20070100918A1 (en) Multiple computer system with enhanced memory clean up
US5526487A (en) System for multiprocessor communication
CN109656868A (zh) 一种cpu与gpu之间的内存数据转移方法
TW200527207A (en) Cache bank interface unit
US8209393B2 (en) Multiple machine architecture with overhead reduction
Istavrinos et al. A process and memory model for a parallel distributed-memory machine
US7073004B2 (en) Method and data processing system for microprocessor communication in a cluster-based multi-processor network
Civera et al. The μ Project: An Experience with a Multimicroprocessor System.
RU2198422C2 (ru) Асинхронная синергическая вычислительная система