JPH04503416A

JPH04503416A - データフローマルチプロセサシステム

Info

Publication number: JPH04503416A
Application number: JP2500668A
Authority: JP
Inventors: パパドポウロス，グレゴリィ，エム．; カラー，デビッド，イー．; アービンド
Original assignee: マサチューセッツインスチチュートオブテクノロジー
Priority date: 1988-11-18
Filing date: 1989-11-16
Publication date: 1992-06-18
Also published as: DE68925646D1; EP0444088B1; DE68925646T2; US5241635A; EP0444088A1; WO1990005950A1

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】データフローマルチプロセサシステム（発明の背景）現在のデータ処理システムは、それらが１列処理化を使用するために選ぶレベルによ、り分類されることができる。システム内の並列化の程度はその固有の特性よりもどのようにシステムがグログシムされるかより大いに左右される。単一インストラクション単一データストリーム（Ｓ工ＳＤ　）システムにおいては、唯一っのインストラクションが一時に実行され、かつ唯一っのデータストリームが使用される。そのようなシステムにおいてインストラクションの実行時の並列処理用は最小でおる。単一インストラクション多重のデータストリーム（Ｓ工ＭＤ　）システムでも一時に単一のイン。

ストラクションを実行する。しかしながら、それらは多重データストリームを有し、かつ多数のオペランド上で並列に慟〈。結果として、これらのシステムはＳ工ＳＤシステムよりも実行における高いレベルの並列処理を経験する、より高いレベルの並列処理は多重−インストラクション−多数の一データー流（、ＭＩＭＤ　）方式において両データ内にて実現されるし、指示は平行に処理される。

ＭＩＭＤ方式は更に方式が並列処理を抽出するレベルにより分類さｎる。特に、該システムは平列に実施する計算のユニットの寸法により分類されうる。粗い粒状のシステムは計算の比較的大きなユニットが並列に実施されるものである。計算のユロットが並列に実施されるが、実行は未だ各ユニット内でシーケンス的に処理する。微細粒システムは、逆に、並列に計算の小さなユニット１−実行する。微細粒システム内の並列に実行される計算のユニットは粗い粒の方式よりもずっと小さいので、より少なｔｎ操作はシーケンス的に実行され、かつ並列処理用の固有のポテンシャルはずっと大きい。

この分類計画を与えられて、並列活動用の最大の固有ポテンシャルはＭ工■システム次第である。更に、ＭＩＭＤ方式の中で、並列活動用の最大固有ポテンシャルは微細粒システムにより発見される。該システムは計算の小型のユニットヲ有し、簡単な計算を与える。

単に、計算の微細粒上ＩＣＩＩ＜処理要素は、マルチグロセサンステムに容易に構成される。前記微細粒システムを効率的に履行する問題は、しかしながら、システムの並列活動の大量の量を効果的に制御することであり、特に仕事同志の通信における劇的な上昇における並列主義においての増大からである。並列主義における増大は又同期問題を計画する結合計算を表わす。

Ｍ工ＭＤマシンにてデートするための努力は緩やかな勇気づける結果のみを創出した。概して、前記マシンは、しみ込まぜる並列主義のための一次的な道具として、ソフトウェアを使用した。前記ソフトウェアをプログラムするのに、プログラムはどこに並列主義を備えるかを決定したし、マシンによりプログラムの雛しめ相互活動のために計算することを要した。結果として、グログラマーはいかに並列実行をなしとげるかを決定するために負目の主力ｔａんだ。これら決定の複雑で混同する性質を与えて、ＭｘＭＤマシ／は、はとんどのユーザーにアピールしないことを実証した。更に、でき上ったソフトウェアはデバッグするのが困龜な傾向にあり、信頼性がなくかつ、卓上型ではない。事をより悪くするために、これらマシンはマシンを操作スるに必要な努力のレベルにも拘らず期待した程働かなかったし、データフローマシンは、データ処理システム内のデータフローのモデルを実行するために試ミる微細粒マシンの特別のパイプインである。これらモデルはデータフロー図として矧られる。データフロー図はノード（ｎｏｄｅｓ　）とエツジ（ｅｃＬｇｅｓ　）から成る。

ノードは指示を表わし、エツジはデータ依存性を表わす。よｒ）精密には、ノードは演算器（ｏｐｅｒａｆｏｒ　）を表わし、エツジはオペランドラ表わす。データフローマシンはオペランド（ｏｐｅｒａｎａ　）　ｆ処理して働く。

データフロー図は実行の部分オーダーのみを課する。

インストラクションは図が必要とするオペランドが入手可能な時はいつでもデータフローマシン内で実行される。従ってデータフローマシンは、シーケンシャルマシン内にて見つかる実行の剛性な総オーダーにより、無理をしない。この弾力性によりデータフローマシンは非同期的にインストラクションの実行を計画する。

逆に、フオンノイマン（Ｖａｎ、　Ｎｏｕｍａｒｎ　）モデルに基づく、シーケンシャルマシンは、インストラクション目盛がインストラクションを指した時にのみ、インストラクションを実行する。非同期的計画の主利点は潜在的並列主義のより大きい露呈である。

データフローマシンは更に二つの範躊に分類できる。

即ちダイナミックとスタティックである。ダイナミックデータフローマシンは、動的に機能の実証（Ｌｒ５ｓｔａｘｃｅ　）を計数できるようなマシンである。

即ち、機能の実証に必要なメモリは予め計画される必要はなく、むしろ機能を実施したときに計数される。ｊ１！ＩＣ、スタティックデータフローマシンは、機能の実証を静的にのみ計算できる。前記の如く、マシンは実行前に機能の各実証に必要な記憶（ｓｔｏｒａｇｅ　）　ｔ’予め計画することを要する。

マサチューセッツ・インステイテユート・オプ・テクノロジー（Ｍａｓｓａｃｈｕｓｅｔｔｓ工ｎ５ｔ１ｔｕｔｅ　ｏｆＴｅｃｈｎｏｌｏｇｙ）にて開発されたタグドーＴｏｋｅｎデータフローアーキテクチャ−（Ｔａｇｇｅ４−Ｔｏｋｅｎ　Ｄａｔａ　Ｆｌｏｗ　Ａｒｃｈｉｔｅｃｔｕｒｅ　）はダイナミックフローマシンの先端的例である。それはアービン、Ｓ　、Ａ、プローブスト及びＧ−に、 ”ｆ　−（ＡｒｖｉｎｃＬ。

Ｓ、Ａ、　Ｂｒｏｂｓｔ、　Ｇ、に、　Ｍａａ　）著の１９８８年コンピューターサイエンス用のＭ工Ｔ研究所のテクニクカルリポートＣ８Ｇメモの”Ｍ工Ｔタグトート−クンデータフロープロジェクトの評価”に記載しである。

タグトド−クンデータフローマシンｔａｗｙｆクスト識別子が属する機能の実行を特定するコ汗りスト識別社より各オペランドをタグして、機能の同時適用を許す。

タグトート−クンデータフローアーキテクチャにおいて、タグ（ｔａｇ　）とオペランドの組み合せはトークン（ｔｏｋｅｎ　）　を構成する。二つのトーク／のタグは、それらが同じインストラクションに予定している場合には、マツチレなければならなり０従って、タグトド−クンアーキテクチャは、タグを正しくマツチングする手段を有しなければならない。連結するメモリはマツチングメカニズムとして信頼された。

（発明の要約）望ましい実施例のデータ処理システムは、少なくとも一個の処理要素と複数個のメモリロケーションとから成る。処理要素は４段の処理パイプラインを含む。

第１段はトークン上にて働くメモリからのインストラクションを掴む。バイ１ライ／の第２段は掴えたインストラクションによシ示される如くのトークン上にオペランドマツチングを実行する。第３段は掴えたインストラクションにより特定されるＡＬＵ操作を実行してトークン上に処理を続行する。最後に、バイグラインの第４段はＡＬＵ操作と掴えたインストラクションの結果から一個の新しいトークン又は複数のトークンを形成する。このデータ処理システムは、望ましくは、多重プロセサデータフロー処理システムである。

上記に参照したトークンは二つのフィールドから成るデータ目的である。

第一のフィールドは、作動フレームの始期にポインタと、インストラクションにポインタを含むタグである。作動フレームは、インストラクションのブロックを実行するに必要な情報をメモリするために使用されるメモリロケーションの連続的ブロックである。特に、フレームは、同じデータフローノードに向うオペランドをマツチするために出合いグラウンドとして働く。

インストラクション〆インタ（ｐｏｉｎｔｅｒ　）は、所与のトークンが処理要素のパイプラインにおりて処理される時に実行されるインストラクションにインストラクションする。トタンの第２フイールドは単にデータ値でるる。データフローモデルの定義にて、このデータ値は典型的にオペランド値ｔ″表わす。

各処理要素は処理バイグラインばかりでなく、トークンバッファー（ｔｏｋｅｎ　ｂｕｆｆｅｒ　）　ｔ−も含む。このバッファーは、トークンが処理バイグライン内にて処理されるように待ってｂる間に、メモリされる。各処理要素はそれ自身のトークンバッファーを有する。

更に処理要素の各々は、その相手方と並列に実行するのが望ましい。トークンがより低論優先スタックを始める前に、パイプライン用のより高い優先スタックを残すように、優先される複数個のスタックから、トークンバッファは放ることが望ましい。バッファはスタックとして組織されているので、バッファは先出しくＬＩＦＯ）最後入ペース上に慟〈。しかしながら、バッファはこの態様で働く必要がないことに留意すべきでラシ、むしろバッファは先出し先入（Ｆ工ＰＯ）ベースで働く。しかしながらＬＩＦＯはよ夕効率的な実行を与える。

上述の如く、作動フレームは、同じデータフローノードに向けられるオペランドのためのオペランドのマツチングのための場所として働く。

作動フレームメモリロケーションは、それらの構造の故に、オペランドマツチングを与えることができる。

特に、作動フレーム内の各メモリロケーションは、メモリロケーションの現在状況を示す状況フィールドと、値を保泣する僅フィールドを含む。状況フィールドは多くの異るタイプ情報を示す。例えば、それは値フィールド内の値のデータタイプを示す。同様に、それは値が値フィールド内にメモリされたかを示す。それはマツチング機能を果すために利用されるインストラクションのこの第２のタイプでるる。

マツチング機能は、データ処理方式内の数学的／論理的インストラクションの実行の重要な部分である。

数学的／論理的インストラクションの実行のコース１屯インストラクシヨンを掴むことにより始まる。一度インストラクションを掴まえると、インストラクションにより示されたメモリロケーションはアクセスされる。

典型的には、このメモリロケーションは作動フレーム内にある。一度メモリロケーションがアクセスされると、状況フィールドは試論され、そして値フィールドは、数学的／論理的インストラクションと、状況フィールド内の現在値により決定される如くに作動する。

一度状況フイールドと僅フィールドが作動されると、数学的／論理的インストラクションは実行されるか又は、実行されず、それにメモリロケーションをインストラクションとの現在状況による。

状況フィールドと値フィールド上に実行される操作は、トークンによりエンコードされるオペランドがメモリロケーションに到着する時間に大巾に決定される。

イベントの典型的コースにおいて、インストラクションの第１のオペランドは、メモリロケーションが空のときに、メモリロケーション内にメモリされる。それが一度メモリロケーション内にメモリされると、インストラクションのオペランドがメモリロケーション内にメモリされることを反影するように、状況フィールドは変わる。次いで、インストラクションの第２オペランドが受領される。この第２のオペランドをロケーション決めすると、第１オペランドが内にメモリされたかを見るために、メモリロケーションはチェックされる。第１オペランドが既にメモリロケーション内にメモリされるので、そｔ′Ｌはメモリロケーションから読み出され、更に処理されるために第２の可能なオペランドと共に送られる。

メモリロケーションから第１の可能なオペランドを除去した後に、メモリロケーションの状況がメモリロケーションが空であることを示すために変えられる。上記のアプローチはダイナミック操作に適用できる。しかしながら、単位操作がインストラクションにより特定されると、現在のトークンのオペランドの値は、メモリロケーションの内容を試験する必要なしに、処理要素に送られる。

上述の如く、各トークンはそのタグフィールド内にインストラクションポインタを含む。トークンがパイプラインの第１段（即ち、インストラクション掴み段）に入ると、このポインタは特定のインストラクションを探すために利用される。

各インストラクションはオペランドをマツチングするためにマツチングルーｈｆ含む。各インストラクションは又、マツチングルールが作動するストレージロケーションの有効アドレスを計算するためのルールを含む。更に、インストラクションは、データ処理システムのＡＬＵによｐ実行されるＡＬＵ操作を含み、最後にインストラクションの実施から来る新しいトークンを形成するためのトークン形成ルールを含む。二値及び単位（−値）マツチングルールは上述の如く論じたが、スティッキング（ｓｔｉｃｋｘｎ６）マツチングルールは未だ論じてない。

スティッキングマツチングルールは、ロケーションの状況フィールドが他の僅が存在しないことを示す場合に、ロケーションの値フィールド内に、トークンの値を書くためのシステムを述べる。システムが前記値を書くと、システムは値が今存在することを示すために状況フィールドロケーションを変更する。他方、トークンの値が定数であると、この値は値フィールド内に書きこ′！ｊ、るが、状況フィールドは、正規の値が存在するが、むしろ定数値が存在することを示すために、変更される。正規値が埴フィールド内に存在し、定数値が次いで到着すると、定数値は正規値のために交換される。

更に、定数値が埴フィールド内に８＠こまれると、定数（ｉＩは明示的にクリアされる迄除去されない。そのポイント後のメモリロケーションへの全てのアクセスに単に、メモリロケーションから定数値を読むだけである。

インストラクションによｐ％定される如くメモリロケーションの有効アドレスを計算するルールは三つの可能なアドレスアプローチの一つを選択する。これらオプションの第一において、メモリロケーションは、インスト２クシヨン内に含まれるオフセットによシ示される絶対アドレスにて特定される。第二のオプションにおいて、メモリロケーションは、インスト２クシヨン内に含まれるオフセットによりタグオフセットの作動フレームポインタにより特定されるアドレスにロケーションしたアドレスである。第三のオプションは更に他のアプローチを利用する。この最後のアプローチにおいて、メモリロケーションは、インストラクション内に含まれるオフセットにより、インストラクションオフセットへのポインタによシコイントされたアドレスにある。

・　インストラクションによシ示されたＡＬＵ操作は、オペランド上にＡＬＵにより実行される操作が何であるかをシステムに述べる。例えば、ＡＬ［Ｊ操作が、パイプラインの、ＡＬＪｌ操作段が所与のトークン上に働くときに追加操作として特定されるのでそれに通過した二個のオペランドを加える。インストラクションによシ特定される最後のルールはトークン形成ルールである。このルールは、既に実行された操作から新しい出カドークンをいかに形成するかを、システム（ｓｙｓｔｅｍ　）に述べる。このルールは、トークン形成段におけると共鳴ＡＬσ操作のタグ形成部分内に利用される。

処理パイプラインは例外を取扱う能力を含むことが望ましい。使用される一つの方法は、トークンがバイグラインに入るに連れて記録されたトークンと連結する各動作を有することである。例外が起ると、レジスタ（ｒｅｇｉｓｔｅｒ　）内の値は、例外が解決される迄、変らない。例外の解決は、例外取扱いトークンを出して実施される。この例外取扱−トークンはしゃ断されないのが望ましい。並列に働く処理要素間に何ら衝突がないことを保証するために、各処理要素は、作動フレームエンコードがその処理要素と共にメモリされるメモリの所与の域に与えられるのが望まし論。トークンは処理要素を示し、そのために、それはタグ内に処理要素指定をエンコードして予定しておく。

（図面の簡単な説明）本発明の前記及び他の目的、特徴及び利点は、添付図面に示す如く、本発明の望ましい実施例の下記の特定記述から明らかとなろう。

第１図はサンプルデータフロー図である。

第２図はデータフローマンンの主要部分を示す。

第３図はデータフローマンンのグロセサの主要部分を示す。

第４図はトークン、インストラクション及び作動フレーム間の関係を示す。

第５図は数学的マツチングルール用の状況転位図を示す。

第６図はステインキーマッチングルール用の状況転位図を示す。

第７図は三つの基礎的トークン形底ルールの効果を示す。

第８図はバイグラインのトークン形成段の主要部分を示す。

第９図は処理要素間のメモリの間仕切計画を示す。

第１０図はインターリ−ビン戦略を示す。

第１１図はトークンのフィールドを示す。

第１２図はタグのフィールドを示ス。

第１３図はマツプフィールドのサブフィールドに示し、かついかにインターリ− ピング戦略がエンコードされるかを示す。

第１４図はインストラクションのフィールドを示す。

第１５図はデコーディング戦略を示す。

（好適実施例の説明）本発明の好適実施例はデータフローマルチプロセサシステムヲ含む。前述の如く、データフローシステムはデータフロー図を実行する。サンプルデータフロー図を第１図に示す。特に、第１図は（ＡＸＢ）＋（ＣＸＤ）用のデータフロー図を示す。オペランド（即ち、Ａ、Ｂ、Ｃ及びＤ）はエツジとして表わされ、オペランド（即ち、×及び＋）はノードとして表わされる。

ノード１０は乗算を表わす。そのノード１０は２個の入力エツジ１４と１６ｔ− 有し、それらＩ’Ｌ　ＡとＢで夫々表わされる。ノード１０からの出力エツジ１８は値Ａ×Ｂを有する。同様に、乗算を表わすノード１２は、入力エツジ２０と２２ｔ−有し、それらはＣとＤで夫々表わされる。出力エツジ２４は値ＣＸＩ）ｉ有する。次いでこれらのノード１０と１２からの２個の出力エツジ１８と２４は力り算ノード２６に入る。その結果の出力エツジ２８は（ＡｘＢ）＋ｃｃｘＤ）ｔ−ｉゎｆ。

伝統的なシーケンシャルマシンにおいてはノードにより表わされる演算の各々は順番に実行される。第１図に示した例（Ｃおいて、マシンは先ずＡＸＢを計算し次いでＣＸＩ）を計算し、最後に積ＡＸＢ＋ＣＸＤを計算する。しかしながら、オペランドが使用可能ならば、そのような順番を課す理由はな−、従って、並列処理データフローマシンにお論て、オペラン）”、Ａ、Ｂ。

Ｃ及びＤが使用可能な場合には、演算ＡＸＢとＣＸＤは同時に実行される。その結果の積は次いで加算される。このように演算することによシブ−タフローマシンは前記演算に課せられた任意の順番を、それら自身の演算により課せられた順番に置き換える。

本発明の好適実施例の主要部分を第２図に示す。特に、本発明は複数個の処理要素３とグローバルメモリユニット２′ｆ、含む。各処理要素はメモリ４の割当てられた領域と関連付けられている。論理回路から成る相互接続ネットワーク１は、グローバルメモリユニット２と処理要素３の間と共に、処理要素３間の通信を行なうために設けられている。各処理要素３はグローバルメモリユニット２のいずれもアクセスすることができ、他の処理要素３と並列に動作する。

第３図は典型的な処理要素３の詳細を示す。第３図から明らかなように、各処理要素３は処理パイプライン３６を含む。又、処理を待つトークンを格納するためのトークンキュー３４が含まれる。グローバルメモリの割当られたローカル部分４は、活性フレーム４５と処理用のコー）Ｆ３２を格納するために割当てられる。

例外取扱い能力を提供するために、例外ハンｒラー４３と一組のレジスタ４が、処理要素３内に設けられメモリ４は７オン・ノイマンモデルに従って構成された伝統的マシンのメモリとはつきりと区別される。

値を単に格納する代りに、本発明のメモリロケーションの各々は二つのフィールドから成る。即ち存在フィールドと値フィールｒである。本発明のメモリ構成は意義がある。理由は、それが一般的なメモリーは値を格納するためのロケーションにすぎないという一般的観点を変えるからである。本発明においてメモリ４の動的に割当部分は、存在状態と一つの値両方を有する。

存在状態は値の意義に影響を与えることができると共に、その値についてのインストラクションの実行をも変える。更に、存在フィールドは値フィールドから独立して処理されることができる。メモリのこのような設計によシ後述からよシ明らかとなるように、よシパワフルな道具となる。

メモ！ｊ４は活性７レーム４５、ヒーゾストレーシ６及びツー２部３２を格納するために使用される。代わりに、コーｖ３２と活性フレーム４５用に別のメモリが設けられてもよい。活性フレーム４５は機能の実施又はコードブロックに必要な全てのロケーションと見なすことができる。それらは本発明において特に重要な役割を演じる。理由はそれらがマツチングタグを有するトークンが出会う作業メモリを構成するからである。トークンは以下に詳述する。

本発明において、トークン２０（第３図）はオ（ランｒ値ばかりでなく、それらが属するインストラクションの特定の活性化を識別する修飾されたオペランｒと同様である。特にトークン３０は、タグ（Ｃ０５ｐ　）と値（ｖ）とから成るタプル（ｔｕｐｌｅ　）と見なされることができる。

トルクン３０は、従って、タプル、（Ｃ−８ｐ、Ｖ　）である。タグは、トークンが表わすオペランドと関連するインストラクションと活動を識別する。タグは三つのフィールドから成る。コンチクストポインタ（Ｃ）。

ステートメント番号（Ｓ）、及びボートインディケータ（ｐ）である。コンチクストポインタ（ｃ）は、トークンにより表わされるオペランばかマツチされる活性化フレーム４５の先頭を示す。ステートメント番号（Ｓ）は、オペランドのインストラクションが格納された、特定メモリロケーションを示し、ボート（ｐ）は、トークンがインストラクションを表わすノードの左入力エツジ又は右入力エツジに入るかを示す。

第３図の処理要素２は、おそらくトークン処理システムとして最も容易に見なされるものである。それはトークン３０を処理し、インストラクション３２を実行させる。データフローモデルによれば、このシステムはオペランドを処理し、データフロー図を実行する。

システムは停止を告げられる迄オペランげの処理を続ける。より正確には、トークンは、パイプライン３６内で実行される動作のプロセスＫ　）　リガをかける。

システムの動作中に、各処理要素２内では、トークン３０はトークン・キュー３４を離れ、処理パイプライン３６に入る。多数のトークンは一般にある時刻にはパイプラインのどこかのステージに存在する。そのようなトークンはパイプライン内で他のトークンと並列に処理される。故に、このパイプラインは本発明内の並列処郵第二のレベルを表わし、これはマルチプロセッサの同時計算に貢献する並列処理とははつき）と異なる。

一個以上のトークン３０が一時にパイプラインに入り得るが、概して一個のトークンのみが一時にパイプラインに入る。パイプライン３６に同時に入シ得るトークン３０の数は、採用された特定の設計の多重処理能力によシ決まる、即ち、各処理要素は並列に多数のトークンの演算を行なうことができる。処理パイプライン３６の第一ステージはインストラクション・７エツチ・ステージ３８である。

このステージでは、システムは入カドークン３０のタグに含まれるステートメント番号を参照する。このステートメント番号（ｓ）は、のメモリロケーションに対応する。ステートメント番号が決定された後、システムはそのロケーションのインストラクションを取り出す（第４図の矢印３１にて指示されているメモリロケーションヲ参照）。

本発明のインストラクションはタプルと見なされことができる。特に、インストラクションは（Ｅ、ｒ、Ｗ、Ａ。

Ｔ、ａ）に等しく、ここで、Ｅｒはマツチングルールが働く格納ロケーションの有効アｒレスを決定すｂ方法を特定し、Ｗはそのマツチングルールを特定し、ＡはＡＬＵの動作を特定し、Ｔ、ｄはトークン形成ルールを特定する。タプルのこれら要素は別のオペコードによジエンコードされる必要はなく、むしろ全ては後述される単一のオペコードによ）エンコードされてもよい。

好適実施例では、インストラクションは多くて二個のオペランドに限定されている。このようＫして、二個以上のオペランドを伝統的に有するインストラクションは、多くて２個のオペランドを有するインストラクションの組み合せに細分化されなければならない。

インストラクション３２が一旦フエッチされると、インストラクション３２からのトークン３０と情報は、パイプライン３６のオペランド・マツチング・ステージ４０に通される。このステージでは、システムは同じノーｖ宛のオペランＩＦ（、ｔ？−）に関してのみ異なる似たタグを有するもの）をマツチさせるように調べる。

このステージは、インストラクション３２の実行に必要な全てのオにランドが可能状態・にあるか否かをシステムがチェックするための部分である。オペランドが可能状態にあるならば、インストラクション３２は実行される。もしそれらが不可能な状態にあるならば、トークンにより特定されたオペランｒは一般にマツチングロケーション内に書き込まれる。何が起こるかの特定事項は以下に詳述する。

次いで処理はパイプライン３６の次のステージ内にて続く。ＡＬＵ演算ステージ４２はタグ形成器４２ＡとＡＬＵ　４２　Ｂから成る。一般に、タグ形成器４２Ａは出カドークンのタグ部を形成し、ＡＬＵ４２Ｂは出力トーク／の値部を形成する。このステージ４２では、インの結果に対する新しいタグがタグ形成器４２Ａによシ形成される。タグ形成器４２ＡとＡＬｏ　４２　Ｂは全体の性能をバランスさせるように、更にサブステージにパイプライン化されてもよい。タグは実行されるインストラクションのトークン形成ルールに従って形成される。このステージ４２からの出力は、トークン形成ステージ４４に入り、そこでは出カドークンが形成され一般に演算の結果を運ぶ、結果的出カドークンは、その後多くの異なるロケーションに伝播する。第一に、トークンはトークン・キュー３４に又はパイプライン３６に処理要素２内を伝播することができる。第二に、トークンは他の処理要素３へ伝播し、第三に、トークンはメモリユニット２に伝播する。

トークンがどこに伝播するかは各化カドークンのタグ部によシ指示される。理由は、タグは以下に述べるように、特定の処理要素２又はメモリユニット３を特定するからである。

化カドークン３０がメモリユニット２へ伝播していくと、化カドークンのタグはどのメモリユニット２がアクセスされるべきかを特定する。化カドークン３０は又メモリロケーション上で実行されるべき動作（即ち、リード動作又はライト動作）を特定する。メモリユニット２のメモリコントローラは所望の動作を実行するために動作仕様書を使用する。リード動作が要求されると、メモリユニット２はメモリユニット２からのデータリーげとある処理要素を特定するタグとから成るトークン３０を生成する。一旦生成されると、このトークン３０は適当な処理要素へ伝播し、そこでトークンがその宛先処理要素によシ処理されるべき他のトークン３０と結合する。

化カドークン３０は、又上述の如く、他の処理要素３に伝播する。特に、出力トーク／を生成する処理要素３のパイプライン３６の出力時に、化カドークン３０は相互接続ネットワークに導かれ、そこでトークン３０のタグによシ特定された処理要素３へ伝播する。

そこで一旦、トークンは処理要素３にて他のトークンと結合し、処理される。

単一の処理要素３内の全てのトークンは同じ処理要素３を特定するタグを有する。

化カドークン３０が従うことができる多くの異なるパスに留意すると、本発明にて使用可能な通信オプションの多様性と、そのような通信が実行される容易さを認めるＫちがいない。各処理要素３は全ての他の処理要素と及びいかなるメモリユニット２とも通信できる。そのような構成要素と通信するためには、宛てられた処理要素３又はメモリユニット２を特定するタグを有する化カドークンを発生することが必要なだけで゛ある。更に、そのような通信は進行中の計算と並列に実行されることができる。理由は処理要素３は通信に対する応答を待つ必要がないからである。

上記に照らして、本発明内では多くの動作が並列に起夛うることは明らかである。適切な同期を維持するためには、あるグラウンドルール（ｇｒｏｕｎｄ　ｒｕｌｅ　）に従う必要がある。グラウンドルールの一つは活性フレームは使用される前に先ず割当てられなければならないということである。このようにして、活性フレームは実行される各ルーチン毎に割当てられる。特に、ルーチンが一旦呼出されるべきであると、活性フレームは割当てられる。この割当はオペレーティングシステムによシ実行される。オペレーティングシステムは、自由な活性７レームのリストを維持し、新しい活性フレームの要求を受取ると、その自由゛リストから活性フレームを単にはじき出し、そのルーチンのコールにそれを割当てる。更に、ルーチンのコールが完了すると、活性７レームは再び自由リストに追加される。そのような割当と追加を実行する際に、オペレーティングシステムは同じ活性フレームが同時に複数のルーチンコールに割当てられていないことを確認する。

好適システムにおいて、各活性フレームは特定の処理要素によシ処理され、そして各処理要素には数千の活性フレームが割当てられる。活性フレームは要求された時割当てられ、先行するコードブロックの実行によシ要求されるので、処理要素はコードの実行につれ動的に呼び出される。

ルーチンはコードブロックであシ、そのようなルーチンへのコールは先行コードブロックによりなされる。

これらコードブロックは、データフローグラフのどのノードがコードブロックを構成し、従って単一の活性７レームを共有するかを決定するコンパイ２によシ定義される。コンパイ２は、従って、プロセスのゾロセサ間粒状物を構成する。

よシ小さなコードブロックはノロセサ間通信の増大につれて並列処理のための潜在能力が高まる微粒子システムを特徴づける。

本実施例では、コードは共有されない。むしろ各処理要素３はその割当メモリ４内にコード全体の写しを有する。コード内にエンコードされたインストラクションの全て各処理要素によシ実行されるわけではない。

その代シに、ある要素３によ）処理されるトークンによシ指示されるインストラクションのみがその処理要素３によシ実行される。従ってコード全体の該当部分のみが一般に処理要素により実行される。代シにキャシュシステムが必要によシコードをローＶするために使用されてもよい。

一旦、割当フレームが割当てられ、コードブロックが定義されると、システムはオペランＶのマツチングを実行するように見ることができる。特に、オペ２ンｒ・マツチング・ステージ４０は、実行されるべきインストラクション３２が含まれるＥ、ｒフィールドと見られる。Ｅ、ｒフィールドは３つの有効アドレスモードの一つを特定する。一つの可能な有効アドレスモードはフレーム関連七−ｒである。フレーム関連モードでは、メモリロケーションのアドレスはオフセラ）　（ｒ）を、トークン３０のタグ内に含まれるコンテキストポインタ（ｃ）に加算することによシ活性フレーム４５内にされる。この手法を第４図に示す。第４図で、Ｃからの矢印３５は活性フレーム４５の先頭を示し他の矢印３３はコンテキスト（Ｃ）プラスオフセラ）　（ｒ）によシ特定されるロケーションを示すことに注意。対照的に、絶対モーｒは絶対アドレス（ｒ）としてのアドレスを特定する。最後に、コード関連モーＰでは、アドレスはタグプラスオフセラ）　（ｒ）からのステートメント番号によシ特定される。

一旦、マツチングルールが実行されるアドレスを決めると、処理要素３はマツチングルールを実行する。

マツチングルールは基本的には動作開始の手段である。

図示の目的のために、動作はタプル（ｃ、ｓ、ｖよ、”／ｒ、　Ａ　、Ｔ　。

ｄ）と考えられ、ここでｃ、ｓはマツチングトークンにより共有されるタグからのステートメント番号とコンテクスト〆インタである、Ｖ工は左側ボート上のトークンの値であり、ｖｒは右側ボート上のトークンの値であシ。ＡはＡＬＵ演算であシ、　Ｔ、ｄはトークン形成ルールである。

どのマツチングルールが適用されるかはインストラクションに規定された処理とオペランドに依る二最も一般的に使用されるマツチングルールは２個のオペランドについての演算である。このルールはＷａｙａ、ａよ。とじて参照される。このルールを実行すると、システムそりロケーションを見て、存在フィールドをチェックする。値が値フィールド内に現在存在すると、存在フィールドは”存在” に等しい。値がそこに現在存在しないと存在フィールドは“空”に等しい。

ロケーションの存在フィルｒが”空”状態４８（第５図）にあることを示すと、システム５０はそのメモリロケーションの値フィールｒ内にトークンの値を書き込み、存在フィールドを”存在”状態５２に変更する。他方、存在フィールドが頭初”存在”状態５２にあると、メモリロケーションの値フィールｒが読み取られ、動作が発行される５４、発行された動作（活動度）がどのように発生されるかは下記式によ）説明される。

（Ｃ，５１１ｖ１）、（仁ａｒ、Ｍｒ）　→（ｃ、ｓ、ｖｌ、ｖｒ＋Ａ、Ｔ、ｄ）但しＡとＴ、ｄは関連するインストラクショ／から導かれ、ＣＳ　、’／１　、’Ｖｒはトークン３０から導かれる。動作の発行に加えて、ルールは存在状態を“存在”状態５２から１空”状態４８へ変更する。

この手法はダイアディック処理においてオペランＶをマツチングさせるタスクを大巾に単純化する：もはや高価な連想メモリを必要としない。更に、一つのオにランｒが他のオペランドの前に到着しても、それは失なわれない。むしろ、そのオペランドは他゛のオペランドが可能状態になる迄単に待つ。この手法のこの観点はインストラクションの実行のスケジューリングの非同期的性質を反映する。

更に、活性フレーム内のロケーションは値と状態を格納するために十分大きいことを要するにすぎない。第一のトークンのλカタグは、到着する第２のトークンのタグから再構築されることができるので、放棄される。

一つの演算子を特定すると、異なるマツチングルールが適用される。このルールはＷｍｏｎａｄｉ。ト表わされる。従来から、左側入力ボートはモナデイソク処理の入力用に使用される。マツチングルールに従がって、左側入力ビート上のトークンの値フィールｒは読み取られ、動作は発行される。存在状態は影響されない。

動作は左側入力メート上の入カドークンのコンチクスト（ｃ）ステートメント番号（Ｓ）、値（■、）を受け入れる。特に、（ｃ、ｓｌ、ｖｌ）　−（ｃ、ｓｌ、ｖｌ、ｖｌ、Ａ、Ｔ、ｄ）他の可能性は、ダイアディックオペ２ンドが特定されるが定数オペランド付きであるということである。もしそうならば、Ｗｓｔｉｃｋｙとして表わされるスティンキー・マツチング・ルールが適用される。それはスティンキー・マツチングルールと称される。なぜならば、定数がロケーションに一旦書き込まれると、後続のアクセス時にそれは抽出されないからである。

このルールが適用される定数オペランドには２つのタイプがある。第一のタイプはコンパイレーンコンの時に知られたものである文字定数である。第二のタイプは、フレーム定数であり、これらの定数はコードブロックのある実施内で多くの動作にょシ共有される活性フレーム内に生成されることができる値である。

第６図はＷｓｔ工。ｋｙの状態遷位図を示す。定数の到着前に有効アドレスによシ特定されるロケーションに単一のアクティブオペランドが書き込まれるのが許される。

特に、存在状態が”空”状態５６であシ、かつアクティブオペランドがマツチングステージにあると、オ（ランｒの値はロケーションに書き込まれ６２、存在状態は”存在”状態５８に変更される。アクティブオペランドは左側メート入力にあることを要することに注意。定数がアクティブオペランドの後に到着すると（即ち右側？−ト上に入力オペランｒが続いて到着すると）、定数の値はロケーションのオぜランｒの値色交換され、動作は発行される６６゜存在状態は”定数” 状態６０に変更される。

他方、ロケーションが当初“空”状態５６にあり、定数が左側ボート入力のアクティブオペランドに先立定数は特定のメモリロケーション６４に書き込まれ、存在状態は”定数”状態６０に変更される。定数が一度メモリロケーションに書き込まれると、左側ボート入力に後続アクティブオペランドが到着しても存在状態は変更されず、代りに、定数を読み出しと動作の発行６８となる。この実施例においてこのルールが有効に働くためには、定数は右側ボートに入ることを要し、非定数は左側−一トに入ることを要する。

存在状態は値の存在又は不存在をエンコーｒすることに限定される必要はなく、むしろ存在状態は又データタイプのような他の情報をエンコーｒするものでもよい。

更に、存在状態はインストラクションの実行を動的に変えてもよい。例えば、インストラクションがステイキー・マツチング・ルールを特定すると、マツチングルールが働くメモリロケーションにて実行される演算処理は存在状態によシ決定される。従って、インストラクションは存在状態で条件づけられ、異なる操作、所与の異なる存在状態を実行する。

動作（処理）が一度発生されると、処理はパイプライン３６の次のステージ即Ａ、ＬＵ演算ステージ４２に送られる。このステージの中心目的はトークン形成ステージ４４に送られるタグと値を生成することである。

このステージはインストラクション３２上のＡ及びＴ、ｄフィルドがシステム動作を導くことを当てたする。

ＡＬＵ演算ステージ４２において、トークン形成ルール、Ｔ、ｄはどのようにして新しいタグと値が形成されるかを特定する。形成されたタグは大部分トークン形成ルールのｄフィールドによシ決定される。ｄフィールドは新しく形成されたトークンに与えられる宛先アドレスを特徴する特に、ｄは（Ｓよイ、５２．　ｐｔｔ）と等しい。第一に新しく形成されたトークンのタグは一般にＣ，８’ｐ’ 　であシ、ここでｓ’　−ｓ　十Ｓｔ　、である。第２のトークンのタグは一般にｃ、　Ｂ　、／／　であシ、ここでＳ／／ｘｓ＋ｓ２　である。

三つの基本的なトークン形成ルールがある（第７図参照）。第一は’ｒａｒ□ｔｈと表わされる数学的ルールである。それは出力値（Ｖ′）を発生するように動作中に２つの値（ｖｌ、ｖｒ）にＡＬＵ演算（Ａ）を適用するようにＡＬＵ演算ステージを導く。少なくとも一個のトークンが生成され、第二のトークン（第７図のカッコ内に注記）が生成されてもよい。トークン（Ｃ０ｓ’ｐ’とｃ　、ｓ／′ｐ／／）の出力タグは入力タグに含まれるステートメント番号に増大（ｓｌとｓ２　）を与え、かつトークン形成ルールのｄフィールげによシ特定されるように、新しいボート（ｐ′とｐ“）を提供することによシ生成される。こ（Ｄｋ −ルの下ではこれら出カドークンはオリジナルトークンと同じコンテキストを有する。

第ニド−クン形成ルール、送シルールはＴ８１ａ　ｎｄとして表わされる。このルールは出カドークンタグを、データタイプＴＡＧである動作の左側値（ｖｌ）と等しく設定し、出カドークン値を動作の右側値（ｖｒ）と等しく設定する。必要ならば他のトークンを発生できるが、増分をステートメント番号に加算することによシ数学的ルールにおいて発生されるのと同様にして新しいトークンのタグを発生する。第２出カド−クンの値フィールドは右側ボート値（ｖ　ｒ　）と等しく設定される。このルールの主目的は異なるコンテキストに値を送ることである。そのようにルールは動作量通信能力を提供する。

第三かつ最後の基本的ルールは抽出ルール、Ｔｅｘｔｒａｃｔであシ、それは現在のコンテキスト内のインストラクションに現在のコンテキストに等しい値を送る。

ルールは一つの出カドークンを発生するだけである。

ルールは数学的ルール内にて行われるように８に増分（ｓｌと８２　）を加算することによ）、活性タグ（ｃ、ｓ）る。第一に発生したタグ（ｃ、ｓ’ｐ’　）は出カドークンタグとして使用され、第二のタグ（Ｃ，８／／　、／／　）は出カドークンの値として使用される。

これら三つの基本的形成ルールは又付加的な）・−クン形成ルールを生成することに関連して使用される。

例えば、抽出ルールと送信ルールは組み合わされて、他のコンテキスト（勺へのアーギュメントとし°ての、一つのコンテキス）　（Ｃ）内からタグを送信する抽出送信ルールを形成する。特に、ｖｌが新しいコンテキストを特定するタグ（ｃ−鈴）に等しいと、出カドークンは下記に等しい。

組み合せトークン形成ルールの他の例Ｔ工。。−８−ｓａｎｄとして表わされるｉｎｃ　−ｓ　−５ｅｎｄルールでアル。第二の増分（ｓ２）とｄフィールＶの第二〆一トインヂイクータ（ｐ″）を使用して、新しい８フイールｒの調整を許す。等式において％　Ｔｉｎ。−５−ｓｅｎｄは下記により表わされる。

（ｃ、ｓ　、Ｃ−Ｃ５，’／ｒ　、Ａ、Ｔｉｎｃ−ｓ−ｓｅｎｄ−ｄ）−（？ｌ ’、（９十６２）１〃、ｖ、）このインストラクションはアーギュメントと結果を通過するために主に使用される。

他の組み合せトークン形成ルールはＴｆｅｔｃｌｌルールである。このルールは基本的なトークン形成ルールの三つ全てを組み合せる。このルールは配列から要素を読み込むために使用され、ここでＣはベースアｆレスでアシ、ｖｒはインデックスである。特に、（Ｃ−８、’；ａ、Ｇ’ｐ＋Ｖｒ、　１ｎｃ−Ｃ、Ｔｆｅｔｃｈ−（１）→（（Ｃ＋Ｖｒ）−’ａｐｔｌ＋ｃ、Ｂ’ｐ〆）。

又、述べる価値があるのはＴｓｗｉｔｃｈとして表わされる、特に定義されるスイッチ・マツチング・ルールである。このルールは下記に詳述されるスイッチインストラクションと一致するように動作する。特に、（ｃ、ｓ　＋Ｖ１　、ＴＲＵｇ、Ａ、Ｔ５ｗｉｔｃｂ、ｄ）　−ｅ　（ｃ　、ｓ’ｐ’　、ｖｌ　）　ａｎｃｌ（ｃ　、ｓ　、Ｖｌ　、ＦＡＬＳＥ、Ａ、ＴＢｙｌ　ｔｃｈ　、ａ）　→（ｃ　、Ｂ”ｐｔｔ　、　Ｖｌ　）　。

数学的ルールが適用される時にのみ、インストラクションのＡＬＵ　フィールド（Ａ）はトークン形成フロセスにて大きな意義を有する。全ての他の場合において、トークン形成ルールは出力タグと出力値を規定する。更に、トークン形成ステージ４４とＡＬＵ演算ステージ４２との間の密接な関係があることに注目すべきである。両方共トークン形成ルール（Ｔ、ａ）に依存している。両ステージ間の差異は、ＡＬＵ演算ステージ４２が非集合出力タグと出力値を生成するだけである点にある。出カドークンを生成するためにこれらの出力の組み合せはトークン形成ステージ４４によシ遂行される。

トークン形成ステージ４４は多くのマルチプレクサ−（７６，７８、第８図）の助けによシ実行される。

特にＡＬＵ演算処理によシ生成される値とタグは、トーク／形成ルール（Ｔ、ａ　）によシ規定されるように適切な組み合せを選択するマルチプレクサ−に送られる。

トークン３０のタグ部用のマルチプレクサ−Ｔ６と、トークン３０の値部用のマルチプレクサγ８がある。

マルチプレクサの選択ラインはインストラクションのオペコード（Ｔ、ａ　）により制御される。オペコードは下記に詳述される。

トークン形成ステージ４４によシ発生されるトークン３０は一般にパイプライン３６を出てトーク／キュー３４に戻る。トークンは次いでパイプライン３６によシ処理される。

従って、動作が完了する迄パイプラインを介して連続的に流れる。トークンは、しかしながら、他の宛先へ伝播スる。トークン形成ステージ４４は、出カドークンの宛先がどこか知るために出カドークンを調べ、また従って出カドークンをルートづける。ロジックを含む。

出カドークンが伝播する他の宛先は他の処理要素３とメモリユニット２を含む。

変更タグインストラクション（後述する）が実行されるときに、他の処理要素に、出カドークンは伝播し、それは異なる処理要素３と関連する新しいコンテキストに出カドークンを送る。

更に、出カドークンは、メモリアクセスインストラクションがタグによシ特定されるときに、メモリユニット２へ伝播する。前記メモリアクセスインストラクション（例えばリード、ライト）はメモリユニット２によシ非同期に取シ扱われる。

メモリアクセスが実行される間、処理要素は待つ必要はなく、むしろ、それは処理を続ける。実際のメモリアクセスは、アクセスされる特定のメモリユニット２内のコントローラによシ実行される。

適切な場合には、メモリアクセスが完了すると、トークンはある処理要素３に、メモリユニット２によシ送シ戻される。この非同期メモリアクセスは本発明の平行処理の第三のレベルを構成する。理由はメモリアクセスは、種々の処理要素３のパイプライン３６の計算と並列に実行されるからである。

ここ迄は、トークンキュー３４についてほんの少ししか述べていない。伝統的なキューを使用するが、一つの最適化は一連のスタック（第３図参照）から成るキューのためである。スタックの使用の背後のアイデアは一種のキャッシュ・キューを作シ出すことを試みることである。ＦＩＦＯバッファは有益であるが本目的のためには実用的でない。ＦＩＦＯは優先度によるスケジュールを容易に提供しない。理由はＦＩＦ○手法においては、全てのトークンは処理される順番を待つ必要があるからである。更に、ＦＩＦＯは誤った方法で並列処理を制御する。実行されるべきタスクは木として見なされ、そこにおいて、他のタスクが実行されることができるように実行プロセス内にて早く実行される必要があるタスクは、木の頂上近くにあり、ＦＩＦＯ手法は広さ第一法でその木を解き放すであろう。

望まれるのは深さ第一法にて木の解放を制御できる技法である。

ＬＩＦＯ技法は前記深さ第一法にて解放を制御できる。

ＩＪ　ＦＯ技法はＦＩＦＯ技法よシも局部性に優れる。更に重要なことは、　ＦＩＦＯキューはローカルメモリからキャシュされることができ、他方ＦＩＦ○キューはキャシュすることが難しい。

好適実施例は優先度によシ構成されるスタックを使用する。トークン３０は、それが空になる迄最高優先度スタックγ０（第３図）から除去される。一度量高優先度スタック７０が空になると、トークン３０は次の最高優先度スタックγ２から除去される。これは実行が完了する迄続く。望ましい実行は唯２個のスタックを利用することである。はとんどのトークンは最高優先度スタックＴＯに入るが、幾つかのトークンはそれらの処理を遅延するように、次の最高優先度スタック γ２内におかれる。トークン３０がどのスタックに入るかを決定するために優先度を決定するために使用される一つのオプションは、タグの一部としてトークン３０内の優先度をエンコードすることである。このオプションは動的であるという利点を有するが、システムを複雑にするという結果となる。前記技法は動的に優先度をエンコードすることができるが、静的な制御をも可能にする。

他のオシジョンは、インストラクションのトーク／形成ルールのｄフィールｒによシ特定される宛先内にエンコードされる優先権を有することである。このオプションはタグ内に優先度をエンコードするととよシ、よ）静的であるが、容易に実行できるという利点を有このスタッキング法は迅速に処理されるべき高い優先度のトークン３０を考慮に入れ、インストラクションの実行において早く考慮に入れることとなる。この特徴によシ、待ちインストラクションの実行用のパスを自由にするように実行プロセスにおいて早く完全に実行される多くの待ちインストラクションの実行に先立つ条件であるインストラクションを許す。正味の結果は表わされた並列処理についてのより大きな制御である。

本発明内で具体化された他の最適化はパイプライン３６からの出力をパイプライン３６の入力に戻す直接パス（第３図の７４）を提供することである。この直接パス７４はトークン列をバイパスする。結果として、単一のボートキューのみを必要とする。理由は、一つの出力又は一つの入力のみがある周期に対して必要とされるからである。パイプライン３６により２つの出カドークンが生成されると、トークン３０の一つはバイパス路７４に従い、パイプライン３６内に再循環される。他のト−クンはトークンキュー３４に入る。パイプライン３６により一つの出カドークンのみが生成されると、トークンはバイパス路７４に従う。何らトークンが生成されないと、トークンはトークンキューから除去され、パイプライン３６内に挿入される。

本発明は又例外取扱い用の最適化に関する。本発明に含まれるシステムは特別のレジスタセット（第３図の４１）を含む。このレジスタセット４１はパイプライン３６内の実行を記録する。特に、レジスタセットはパイプライン３６内の各動作のタグを記録し、左側は例外が起こるときのシステム２動作を図式化する。

例外は演算中のミスマツチしたデータ型式、零ニょシ割算する試み、などの事象である。

例外が起ると、それはＡＬＵ出力内に注記される。システムは例外を起した動作の値をレジスタ４１内に凍結し、例外を起した動作にフラグを立てる。インターラブドされないトークンは生成されて、例外取扱い演算を呼ぶ。この新しいトークンはバイパス路に従って直接パイプライン３６に戻ル。

新しいトークンは、攻撃インストラクションを翻訳するか再起動するかを決めるために、レジスタ４１内にて凍結された動作を調べる例外ハンドラ４３ｔ−作動させる。例外ハンドラ４３が決定した後に、処理は通常のように続く。

上記詳細な説明から明白なように、インストラクションセットはシステム演算において特に重要な役割を果す。インストラクションセットはインストラクションの幾つかの異なるクラスから成る。インストラクションの主要クラスの一つはダイアディック算術インストラクションクラスである。インストラクションのクラスは２つの入力オペランドについての算術演算を実行する。ダイアディック算術インストラクションの典型的例は加算インストラクションである。

このインストラクションは下記の如く要約できる。

ＣＣ−８ｒｒ　ｖｒ）　Ｃ，ＣＣ，Ｓ”ｐｉｔ　、　ｖ１＋　ｖρ〕指示は２つの入力オペランドの和である値を出力する。他の例はｆｇｅｑインストラクションである。

このインストラクションは下記の如く要約できる。

ｇｅｑ（Ｃ，Ｓ　Ｉ　Ｖ　）　（（Ｃ，Ｓ”ｐ７／　、　Ｖｌ　〉’ｔｙρ　ｒ第一のオペランドが第二のオペランドより大きいか又は等しい場合に、ＴＲＵＥの値を戻し、さもなければＦＡＬＳＦ：を戻す。

インストラクションの第二のクラスは算術インストラクションセラトラ充放する。この第二のクラスはモナディツク算術インストラクションとして知られる。

それらのダイアディックな相手方のように、インストラクションは算術演算を実行する。しかしながら２個のオペランドに対向して一つのオペランド上で働くのみである。モナディック算術インストラクションの先導例はフロートインストラクションである。このインストラクションは下記の如く要約される。

（ｃ−ｓｌ＋　ｖｌ）　（Ｃ，Ｓ’ｐ／　、　ｆｌｏａｔ（ｖｌ））（（Ｃ，Ｓ ″ｐ／／　、　ｆｌｏａｔ（ｖｌ）））Ａ　＝　ｆｌｏａｔＴ−Ｔａｒよ、ｈインストラクションは整数オペランドを浮動小数点数に変換する。

同定インストラクションはインストラクションの付加的クラスを表わす。このクラスの主要なインストラクションは同定インストラクションである。このインストラクションは下記の如く要約される。

同定Ａ　−ｎｏｐＴ″″Ｔａｒｉｔｈ同定インストラクションは入カオ（ランドの［ｔ−他のコンテキストへ通す。逆にｒ−）インストラクションは下記の如く要約できる。

（ｃ−ｓｒ＋　ｘ）　ＣＣｃ、ｓ″ｐｕ　、　ｖｌ））ｒ−トインストラクションはインストラクションが左側入力ポートのオにラン−をコピーシ、トリカド呼ばれる値が右側入力ボートに受信される時にその値を送る点で異なる。

条件インストラクションは条件付き実行を指図するために使用される。使用される唯一の条件インストラクションはスイッチインストラクションである。それは二つの入力オペランドを要求する。入力オペランドの一方は値であることを要し、他方の入力はプール値であることを要する。それはある入力に対して二つの出力値の一方を選択することを可能とする。どちらの出力値を選ぶかはプール値入力による。プール値入力が真（ＴＲＵＥ）ならば第一の出力が選ばれる。。

入力　出力（ｃ、ｓｒ、　ＴＲＵＥ）プール値入力が誤（ＦＡＬＳＥ）ならば、第二出カド−クンが選ばれる。

（ｃ　−ｓ　ｒ　＊　ＦＡＬ　Ｓ　”’　）タグ処理はタグ処理インストラクションの特別クラスにより実行される。このクラスは三つの基本的インストラクションを含む。第一のインストラクションは変更タグであり下記の如く要約できる。

（Ｃ−Ｓ　Ｌ　ｌ　’；！　−２６）　（ｅ　−９Ｓ　＊　ｖｒ）（Ｃ０Ｓｒ＋　ｖｒ　）　（（ｃ　−ｓ”　ｐ〃ｒ　ｖｒ　）　）Ａ　ｗ　ｎｏｐＴ″−Ｔｓ８ｎｄコンチクスト間の通信値においてそれは有益である。

注記した如く、それは２つの入力を要する。左側久方の値が新コンテクス）１示し、右側大刀の値は新コンチクストへ送られる値に等しくなる。これら二つの入力［’ｅ−諸にしたものが出カドークンを構成。更に、右側の入力［−有する現在のコンチクストにおいて、第二）出カドークンを虫取するオプションがある。

抽出タグは逆に下記の如く要約できる。

抽出−タグそれは単一の出力に限定される。その結果としての出カドークンは入カオベランドと共にコンチクストロ共有するタグを有する。それはステートメント番号を有し、それは、入力のステート番号と増分の和である。

更に、出カドークンの値フィールドは入力と同じコンチクストにおけるタグと等しいが、ステートメント番号と追加的増分との和であるステートメント番号を有する。

調整オフセットインストラクションは下記の如く要約できる。

調整−オフセット（ｃ、ｓｚ、　ｃ、ｓＡ）　（ｃ、ｓ’　ｔ　、包（つ＋１）＾）ｐ　ｐ　ｐインストラクションはよシ複雑な演算を提供する。

それは二つの入力を利用する。第一の入力の値は新しいタグを特定し、第二の入力の値はオフセットを特定する。このインストラクションは二つまでの出カドークン生成する。第一の出カドークンは入力と同じコンチクスト内にアシ、第二の入力の値による第一の入力値のオフセットに等しい値を有する。第二の出方）　 −クンも又、同じ値を有し、入力と同じコンチクストを共有するが、そのステートメント番号はオフセットである。

他のインストラクションクラスも存在するが、しかしそれらは本議論では重要ではない。

にも拘らず、本発明はここで議論されたインストラクションにのみ限定されるものではなく、むしろ、議論されたクラスによシ具体化されるインストラクションセット全体を含む。

本システムはループのような、反復の循環を容易に与える。システムはループの各反復に新しいコンテクスト全割当てることによりループを実行する。それは次いで現在の反復に対して、以前の反復からのトークンを送るように新コンチクストに対し変更タグインストラクションを使用する。

反復が完了すると、反復はコンチフストラ自由にするので、コンチクストは次の反復に割当てられることができる。そのようにして、族コンチクストは次から次へと反復に通される。従って、Ｎ個の活性フレームの尾部循環として、実行中にループは開く、ここでＮはルーズ内の反復数である。この技法において効率を維持するために、ループで使用された活性フレームはリサイクルされる。

一般に、活性フレームは処理がコールされる度に割当てられる。データフロー処理システムのオペレーティングシステムは自由な活性フレームのリストを維持する。手続きがコールされると、それは自由リストから活性フレームをはじき出す。同様に、手続コールが完了すると、それはもはや活性フレームを必要とせず、従ってそれが使用した活性フレームは自由リストに戻される。

本発明の好適実施例はマルチプロセサシステムである。従ってそれは処理要素３間で容易に通信できることを必要する。好適実施例ではトークンが自由に一つの処理要素から他の処理要素へ流れることができるようにしてこの能力を与える。

更に本発明は個々つ処理要素から容易に成る。同じ実体はプロセッサ間のトラヒックと共に、プロセッサ内トラヒックのためなので、マルチプロセサシステム内の多数の処理要素は容易に実現される。更に、並列に実行される計算の微粒子的特性は同様に、単一の処理要素２をマルチプロセサシステムで非常に容易に、構成することを許す。システムの微粒子的特性は又コードのコンパイルを容易にする利点を与える。

本発明はマルチプロセサシステムであるので、種々の処理要素２間にて間仕切りプロセスの手段であらねばならない。単純で作業可能な技法は各処理要素をメモリ斌に割当てることである（第９図参照）。タグによりあるコンチクストに割当てられた処理要素を、トークンが特定する。特に、コンチクストポインタの２つの先頭ビットは適切な処理要素を示す。この技法はプロセサ間の競合の可能性を除去し、メモリへの急速なアクセスを与える利点がある。メモリ空間の割当は必ずしも固定されない。従って、一つの処理要素２により活性フレームのために使用された空間は、次いで他の処理要素にも使用されることができる。従って、技法は間仕切を動的に再割当できるという新たな利点を有する。

アドレス空間を間仕切する一つの欠点は大きなデータ構造の割当に関する如きものである。本システムは大きなデータ構造をマルチプロセサにインターリーブし、ネットワークのトラヒックとプロセサの負荷を等しく分配する。このインターリーブはワード単位で実行される。非インターリープ技法とインターリープ技法は概念的にアドレス空間全多数の領域に分割し、そこではコンチクストへの増分は特定される副領域に依存してプロセッサ内又はプロセッサ間で進む。

副領域は２　個の処理要素の集合であり、Ｎはトークンのタグにより生成されるＮフィールド内で特定される（デコーディング記述に関して後述される）。Ｎ− 〇の場合に、Ｃへのいかなる増分も同じ処理要素にマツプする（第１０図参照）。しかしながらＮ＝１の場合には、Ｃへのいかなる増分も２つの処理要素間にて交換する。Ｎ＝２の場合には、Ｃへの増分は４つの処理要素間にて交換する、以下同様である。第１０図はこの技法の基本的操作を示す。

各プロセサが排他的活性フレームに割当てられると、コードも共有されるかという疑問が生じる。一般に、各コードブロック用のコードのコピーが、そのコードブロックを実行する各α埋要素上に存在するということが望ましい。従って、宛先インストラクションはローカｋ　Ｔあり、ノンブロッキングである。結果は、より大きなメモＩＪ　＝ｉ最小のコストで設計するための単純性を高めるということである。代案的に、キャッシュシステムも利用される。

各メモリロケーションが存在ビットと関連するということは以前に注記した。これらの大量の存在ビットが単一のインストラクションと共に同時に変更される場合には手助けとなる。この能力を実現するために、隣りのロケーション用の存在ビットはマシン語に等しいサイズの語に合体される。好適実施例において、各メモリロケーション用に二つの存在ビットがある。

３２ビツトが一語を構成する。従って、１６セツトの存在ビットが一語として格納される。

システムを実現する他の方法は選ばれる語長である。

好適実施例では７２ビツト語を利用し、そこでは６４ビツトが愼フィールドであり、８ビツトはタイプフィールドである。トークンは二語から成る（第１１図参照）。第一の語はタグであり、第二の語は値部分である。タグはデータタイプＴＡＧである。他方儀部分は、ＴＡＧＸＦＬＴ　（フローティングポイント）、ＩＮＴ　（指麹及びＢＩＴＳ　（符号なし整数）を含む幾つかのデータタイプである。

タグは多くのフィールドに単に細分化される（第１２図参照）。タグの先頭ビットはオペランドの部分を示す。零（０）は左側ポートを示し、１は右側ボートを示す。次の７ビツトはＭＡＰフィールドである（第１６図参照）。ＭＡＰフィールドの最初の２ビツトは、インターリーブ格納を選択する・・ツシュ（ＨＡＩＲ）インストしである。他の５ビツトはＮフィールドであり、２を底とする副領域内のプロセサの数の対数と等しい。

ＭＡＰフィールドに従うのは２４ビツトのＩＰフィールドであり、それはプロセサ要素、ＰＥ１　フィールドにより特定されるプロセサ番号上のインストラクションのインストラクションポインタアドレスを与える。

メモリアクセストークンでは、ＰＥは処理要素よりはむしろメモリユニット２を実際に特定する。ＰＥはインストラクションポインタ、ＩＰ、フィールドに従ｂ１それはメモリ内のインストラクションを示し、１０ビツトの長さである。タグの最後のフィールドはＦＰフィールドである。それはフレームポインタであり、２２ビツト長である。それは特定の副領域に割当てられたフレームのうちの特定のものを示す。

タグ”５ＵＰＥ、ＦＰ及びＩＰフィールドから主に形成される。特に、ＣはフレームポインタＦＰと、処理要素指定ｐｇとからなシ、ＰＥはＣのＭＳＢからなり、ＦＰはＣのり、ＳＢからなる。更に、ＳはｐＥとＩＰから底る。ＰＥはＳのＭＳＢから放り、ＩＰは５ＱＬＳＢから成る。

インストラクションに３２ビツト長のみであり、４つのフィールド、０ＰＣＯＤＥ、　ｒ、　ＰＯＲＴ及びＳのみから放る（第１４図参照）。０ＰＣＯＤＥは１０ビツト長であシ、インストラクションｏｐＬｏＤｇ　ｔ　％定する。又１０ビツト長はｒである。それはオペランドの有効アドレスを計算するために使用される符号なしのオフセットであで宛先タグの一つである。あるインストラクションでは２つの宛先タグが要求されると、第二のタグは、入力ＩＰに１を加算し、設定ボートに１を加算して、発生する。

タグ、トークン及びインストラクション用のフォーマットｔ−知れば、よシ詳細にパイプライン３６のオペランドマツチングステージ４０を知ることができる。

特に、オペランドマツチングステージ４０は三つのサブステージに分割される。

第一のサブステージ８０は、オペランドマツチングが発生するメモリロケーシコンノ有効アドレスを計算する。第二のサブステージ８２は存在ビットに対して働き、第三のサブステージ８４ハ有効アドレスのオペランドを７エツチし、又は格納ＤｅＣＯｄ８　ｋ参照）、１０ビツトの０ＰＣＯＤＥ　９０のフイールトハ第一のレベルデコード表への、アドレスとして使用される。第一レベルデコード表へのエントリー１０９は四つのフィールドを有する。ＢＡＢｇフィールド９２は第２レベルデコード内のエントリー用の基本アドレスを特定する。他方、ＴＭＡＰフィールド９４は３２個のタイプマツプの一つを特定する。更に、ＰＭＡＰフィールド９６は６４個の存在マツプの一つを特定し、最後に、ＥＡフィールド９８は有効アドレス発生モードを特定する。

０ＰＣＯＤＥ　９０は第一レベルデコード表エントリ１０９ｔ−調べるために使用され、エントリーのＥＡフィールド９８はテストされる。それは２ビツト長である。両ビットが０であると、アドレスはＦＰ十ｒに等しく、両ビットが１であると、アドレスはｒに等しくなり、先頭ビットが１であり、後続ビットがＯであると、アドレスはＩＰ＋ｒに等しい。

第一サグステージ８０（第３図）の間に、ＴＭＡＰ（第１５図の９４）フィールドは又テストされた。上述の如く、ＴＭＡＰフィールド９４は３２個のタイプマツプの一つを選ぶ。タイプマツプはサイ７：２５６Ｘ２の二次元配列である。各エントリは２ビツトを有する。これらの２ビツトはボートからのマツピングを表わし、かつ第一サブステージのトークンの値のデータタイプを表わす。サブステージを結論するために、トークン、有効アドレス及びタイプコードは次のサブステージ８２（第３図）に通される。

第２のサブステージ８２は存在ビットサブステージである。このサブステージ８２において、システムは特定のアドレスによシ特定されるメモリロケーションを見る。そのロケーションからそれは２つの存在ビラトラ読み取る。サブステージ内のトークンのボートと共にこれらビットを使用し、タイプコードビット１００はタイプマツプと、第一レベルコードエントリーのｐｍｐフィールド９６とから読み取られ存在マツプ表内のコントリー１１０ｔ−ｖ４べろ。存在マツプ表は６４のエントリーを有し、各エントリーは４フイールドを有する。

ＢＲＡフィールド１０２は４路ブランチコントロールであり、後述する。ＦＺフィールド１０４はフォース・ツウ・ゼロオーバーライドが行なわれるかを決定する。

それも同様に後述する。ＦＯＰフィールド１０６は、どのオペランｒのフェッチ／格納動作が実行されるべきか（即ち、読み取、書き取、交換又は交換減小）ｔ −特定する。最後のフィールド１０８は存在ビットの新しいＭｋ特定する。それはＮ　ＥＸＴとして表わされる。

ＦＯＰが特定する第三かつ最後のサブステージ８４において、フェッチ／格納動作は実行される。有効アドレスにより特定されるロケーションの内容は、パイプラインの次のステージに通される。更に、存在マツプのＢＲＡフィールド１０２と、第一レベルデコードエントリーのＢＡＳｇフィールド９２はＯＲされ、第ニレベルデコード内にアドレスを生成する。第二レベルデコード表エントリーは、システムの処理に使用される係数を特定するために使用される。ＦＺフィールドが１であるとＢＡＳＥフィールド９２はＯＲされる前にＯにされる。

正味の結果は、第二レベルデロード表エントリー１１１が絶対アドレス０，１．２又は３として設定されることである。

上述のシステムは、データ処理システム内の並列処理をしみ込ませる困難な仕事をプログラマから解放する。平行主義は指示セットにおいて固有のものであるので、かつハードウェアを介して割当てられるので、このシステムは、現在の平行処理マシンよりもずっと使用が容易である。マツチング機構は単純化されて、連結するメモリシステム内に見られる生来の複雑性を除去する。特異なメモリ設計は減少した頭上のために主に責任がある。

更に、本システムの微粒子特性は多くの利点を与える。第一に、本システムは平行主義の最大量全露呈する。第二に、メモリ潜在性を容易に緩和する。理由はメモリアクセス要求が働いている間に他のトークンを逸埋できるからである。第三に、粗粒子システムよシも編集容易である。加えて、本発明は、実行特性、単純性及び原価有効性を最適化する。

本発明は望ましい実施例に関して特に図示、詳述したが、当業者にとって形状と詳細の各種変更は添付請求の範囲に規定した本発明の精神と範囲から逸脱せずになされるものと理解されよう。

第１図第２図第４図第５図算術ルール　ルールを送る　ルールを抽出第７図格納部第９区国際調査報告１＋″″″″Ａｌ＃１ｍ、　、、、、、、、　、Ｑ、ｎζ＋ｎｃ国際調査報告

Claims

【特許請求の範囲】１．下記構成要素から成ることを特徴とするデータ処理システム。（ア）数学的／論理的インストラクシヨンを処理するための少なくとも一つのプロセサ。（イ）前記少なくとも一つのプロセサにより処理された数学的／論理的インストラクシヨンのオペランドをマッチするため、データ処理システムの少なくとも一つのプロセサにより各々アクセスされる複数個のメモリロケーション。（ウ）オペランドがオペランドの適切なマッチングを実行するようにメモリロケーシヨンに存在するか否かを決定するために、少なくとも一つのプロセサによりアクセスされるメモリロケーシヨンの現状を検出するための論理手段。２．各メモリロケーシヨンは唯一のロケーシヨンであり、そこでインストラクシヨンの特定の実行のオペランドのマッチングが起り、かつ各メモリロケーシヨンは、値フィールドの重要性が状態フィールドに従うようにして、値フィールドと共に状態フィールドを含むことを特徴とする上記第１項記載のデータ処理システム。３．上記第１項記載のデータ処理システムであって、各プロセサは下記構成要素を含むことを特徴とすること。（ア）処理されるためにトークンの待ちとしてオペランドを表わすトークンもメモリするバツフア。（イ）バツフア内にメモリされたトークンを処理するためのバツフアとメモリロケーションと通信する処理パイプラインであって下記要素から成るもの。（ｉ）パイプライン内にてトークンを調整するために、インストラクシヨンを掴むためのインストラクシヨン掴み段。（ｉｉ）掴んだインストラクションに応答するオペランドをマッチングするためのオペランドマッチング段。（ｉｉｉ）掴んだインストラクシヨンにより特定される操作を実行するための操作段。（ｉｖ）掴んだインストラクシヨンにより特定された操作の結果を運ぶ、新しいトークンを形成するためのトークン形成段。４．各トークンは作動フレームと共にトークン上に働くインストラクシヨン用のアドレスを示すためのタグから成り、かつ又データ片をメモリするための値から成ることを特徴とする、上記第３項記載のデータ処理システム。５．掴んだインストラクシヨンは、マッチングオペランド用のマッチングルール、マッチングルールが操作するメモリロケーションの有効アドレスを計算するためのルール、データ処理システムのＡＬＵにより実行されるＡＬＵ操作、及びインストラクションの実施から来る新しいトークンを形成するトークン形成ルールとるエンコードすることを特徴とする上記第３項記載のデータ処理システム。６データ処理システムは平行マルチプロセサシステムであることを特徴とする上記第１、２、３、４又は５項記載のデータ処理システム。７．データ処理システムはデータフロー処理システムであることを特徴とする上記第１、２、３、４又は５項記載のデータ処理システム。８．データ処理システムはオペランドをマッチングするための非連結メモリを当てにするタタグドトークンデータ処理システムであり、そこにおいてオペランドをマッチングするために、システムは分担したメモリロケーションにオペランドを向けることを特徴とする、上記第１項記載のデータ処理システム。９．処理パイプラインと、メモリとを有し、オペランドをマツチングするための非連結メモリを当てにし、そこにおいてオペランドをマッチングするために、方式は分担したメモリ位置にオペランドを向けることを特徴とするタグドデータ処理システムであるデータ処理システム。１０．例外が起ると、例外を起こした実行が可能になるように、パイプラインの各段にてトークンと連結する実行を記録するための複数個のレジスタ、及び起る各例外用の実行を見つけるために複数個のレジスタを試験するパイプライフ内に起る例外を解決する例外ハンドラとから成ることを特徴とする、上記第３項又は９項記載のデータ処理システム。１１．各分担されたメモリロケーションは値フィールドと状態フィールドとを含むことを特徴とする、上記第９項記載のデータ処理システム。１２．方式は、ロケーシヨンの状態フィールドが他の値が存在しないことを示す場合にメモリロケーションの値フィールド内にトークンの値を書き込むために該システムに述べるスライツキーマツチングルールを含むマツチングルールに従がい、トークンの値が定数でない場合に、値が存在することを示すためにロケーションの状態フィールドを変更し、かつトークンの値が定数である場合に定数が存在することを示すために、ロケーションの状態フィールドを変更することを特徴とする、上記第２項又は１１項記載データ処理システム。１３．オペランドのロケーションは前記オペランドの容易なマッチングを実行させるためにオペランドのマッチング前に知られるので、オペランドのマッチング前にインストラクションはデコードされることを特徴とする、上記第３項又は１１項記載のデータ処理システム。１４．データ処理システムにおいて、下記工程から成ることを特徴とする数学的／論理的インストラクションを実行する方法。（ア）数学的／論理的インストラクシヨンを掴むこと。（イ）数学的／論理的インストラクシヨンの実行に使用されるオペランドを探すために数学的／論理的インストラクションにより示されるメモリロケーションをアクセスすること。（ウ）メモリロケーションの現在状態を試験して、数学的／論理的インストラクションを実行するか否かを決定すること。１５．データフロー処理システムにおいて下記工程から成ることを特徴とする方法。（ア）トークンを与えること、各トークンはフレームポインタ、インストラクションポインタと値から成り、インストラクションポインタは同一のフレームポインタと同一のインストラクシヨンポインタによりトークンの値を処理するインストラクションにポイントすること。（イ）トークンに応答してフレームポインタとインストラクションポインタにより識別されるメモリ内にメモリロケーシヨンをアドレスすること。（ウ）値がアドレスしたメモリロケーション内にメモリされたか否かを决定すること。（エ）値がメモリされると、メモリされた値と、新しいトークンを作るためのトークンの値上にインストラクシヨンポインタにより決定される操作を実行すること。（オ）値がメモリされないと、メモリロケーションにトークンの値をメモリすること。１６．データ処理システムにかいて、下記工程から成ることを特徴とする単一のインストラクションのオペランドをマツチングする方法。（ア）空のメモリロケーション内に、インストラクシヨンの第一の可能なオペランドをメモリすること。（イ）インストラクションのオペランドがメモリロケーシヨンにメモリされることを反映させるためにメモリロケーションの状態を変更すること。（ウ）インストラクシヨンの第二可能なオペランドを探すこと。（エ）インストラクシヨン第一の可能なオペランドが内にメモリされるか否かを見るために、メモリロケーションをチエックすること。（オ）メモリロケーシヨンから第一の可能なオペランドを読み取り、インストラクシヨンを実行するために、処理手段へオペランドを送ること。１７．上記第１６項記載の方法は更に、処理手段へオペランドを送る工程後に、メモリロケーションが空であることを示すために、メモリロケーションの状態を変更することから成ることを特徴とすること。１８．データ処理システムはマルチプロセサシステムであることを特徴とする上記第１６項記載の方法。１９．下記工程から成ることを特徴とするパイプラインしたデータ処理システム内の例外を取扱う方法。（ア）実行がパイプラインに入るに連れ、レジスタ内に実行をメモリすること。（イ）例外が起きたときに実行をフラッギングすること。（ウ）実行の処理を休止させること。（エ）実行の値が変更されないか又は交換されるので、レジスタ内の実行の値を凍結すること。（オ）例外をなすしや断できない例外実行と実行を交換すること。（カ）例外実行を処理すること。（キ）実行の処理を続行すること。２０．タグドトークンデータフロー処理方式において、トークンデータ目的は下記構成要素から成ること。（ア）作動フレームの始期に対するポインタ及びインストラクションに対するポインタ。（イ）値。