JPH0778738B2

JPH0778738B2 - ディジタル・コンピュータ・システム

Info

Publication number: JPH0778738B2
Application number: JP3096093A
Authority: JP
Inventors: リチャード・ジェームス・エイケメヤ; スタマティス・バシリアディス; バソロメウ・ブラナ
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1990-06-06
Filing date: 1991-04-03
Publication date: 1995-08-23
Anticipated expiration: 2010-08-23
Also published as: CA2038264C; US5459844A; PL165585B1; SK93491A3; CZ280269B6; JPH04232532A; RU2109333C1; HUT57920A; HU911101D0; US5355460A; CZ93491A3; EP0463296A2; BR9102128A; EP0463296A3; PL289724A1

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明はディジタルコンピュータ
およびディジタルデータプロセッサに係り、特に２つ以
上の命令を並列に実行できるディジタルコンピュータお
よびデータプロセッサに関する。

【０００２】

【従来の技術】命令シーケンスを受け、これを一度に１
命令ずつ実行するコンピュータは従来から知られてい
る。これらのコンピュータにより実行される命令は単一
値の対象に対して動作し、従って“スカラ”と呼ばれて
いる。

【０００３】このような従来のスカラコンピュータの動
作速度は、回路技術やコンピュータ機構，およびコンピ
ュータアーキテクチュアの進歩により、その限界まで改
善されている。しかしながら、競合マシンが新たに開発
されるにつけ、従来のスカラマシンには新たな加速機構
が要求されている。

【０００４】ユニプロセッサの計算速度を加速する最近
の機構は、非常に簡単な命令の制限されたセットを用い
る低減命令セットアーキテクチュアに見られる。他の加
速機構としては、複雑なマルチオペランド命令の最小セ
ットに基づく複雑な命令セットアーキテクチュアが知ら
れている。これらの方法のいずれかを既存スカラコンピ
ュータに適用するには、命令セットおよびマシンアーキ
テクチュアを基本的に変更する必要がある。このような
広範囲な変更は費用，時間がかかり、またマシンの信頼
性と有効性が初期の段階で減少するという問題がある。

【０００５】命令セットの低減と共に実現される利点の
幾つかをスカラマシンに適用しようとする試みの中で、
いわゆる“スーパスカラ”コンピュータが開発されてい
る。これらのマシンは、これらが単一スカラ命令のシー
ケンスを含む命令ストリームから一度に１つ以上の命令
を実行するように構成することにより性能が増加する本
質的にスカラマシンである。これらのマシンは、通常
は、スカラ命令のシーケンスの２つ以上の命令が並列に
実行できるか否かを命令実行時に判定している。この判
定は、命令のオペレーションコードに、また命令間に存
在するデータ依存性に基づいてなされる。オペレーショ
ンコードとは、命令に必要な計算ハードウェアを意味す
る。一般に、同じハードウェア（ハードウェア依存性）
または同じオペランド（データ依存性）を利用する２つ
以上の命令を同時に実行することは可能ではない。これ
らのハードウェア依存性およびデータ依存性は、幾つか
の命令の組合せの並列実行を阻害するものである。これ
らの場合には、影響される命令はシリアルに実行され
る。これは、当然スーパスカラマシンの性能を低減させ
るものである。

【０００６】スーパスカラコンピュータには、これを小
形にすることが望ましいという問題点がある。この場
合、具体的な時間量が、どの命令が並列に実行できるか
を命令実行時に判定する際に消費される。この時間は、
他のマシン動作と重ねることにより容易にマスクするこ
とはできない。このような問題は、命令セットアーキテ
クチュアの複雑さが増すにつれ一層著しくなる。更に、
並列実行の判定は同じ命令が実行される毎に反復されな
ければならない。

【０００７】既存スカラコンピュータの有用な寿命時間
を延長する際には、加速実行の全ての手段が不可欠であ
る。しかしながら、低減された命令セットアーキテクチ
ュアや複雑な命令セットアーキテクチュア、またはスー
パスカラ法による加速は、既存スカラマシンを考慮する
には潜在的には非常にコスト高であり、決定が多過ぎ
る。このようなコンピュータの実行速度を、命令セット
の変更やマシンアーキテクチュアの変更、または命令実
行に必要な時間の拡張を要求することなしに既存命令セ
ットにおける並列または同時的な命令の実行により加速
することが好適である。

【０００８】

【課題を解決するための手段】米国特許出願第５１９，
３８４号明細書においては、スカラブル複合命令セット
マシン（ＳＣＩＳＭ）アーキテクチュアが提案されてお
り、これによれば、命令レベルの並列性は、命令実行以
前の時点でスカラ命令のシーケンスを解析して並列実行
が可能なシーケンスの既存命令の隣接グループ分けによ
り形成される複合命令を発生することにより達成され
る。タグの形態の関連する制御情報が、複合命令がどこ
で始まるかを示すと共に、複合命令に取り込まれる既存
命令の数を示す命令ストリームに付加される。なお、用
語“複合化（ｃｏｍｐｏｕｎｄｉｎｇ）”は、命令のシ
ーケンスに含まれる命令のグループ分けに係り、このグ
ループ分けはグループ分けされた命令の同時または並列
実行を目的とするものである。少なくとも、複合化は同
時実行のための２つの命令の“対化（ｐａｉｒｉｎ
ｇ）”により満足される。複合化された命令は、これら
がスカラ実行のために与えられた形態から変更されない
ことが好適である。以下に説明するように、複合化され
た命令は、複合化タグ命令、即ち並列実行のための命令
のグループ分けを示す、グループ分けされた命令に付加
されたビットにより伴われる。

【０００９】複数の命令を並列に実行する手段を備える
ディジタルコンピュータシステムにおいて、本発明の特
に好適な実施例は、命令の発生および実行前に命令を複
合化するメモリアーキテクチュアに基づいて与えられ
る。このようなメモリは、コンピュータのＣＰＵ（中央
処理ユニット）に命令を与える階層的メモリ構造の要素
をなしている。通常、このような構造は、頻繁にアクセ
スされる命令を含む高速キャッシュ記憶装置、これに接
続された低速主メモリまたは一次記憶装置、および低速
大容量補助記憶装置を備えている。

【００１０】また通常は、キャッシュおよび主記憶装置
は、実行のために直接参照できる命令を有している。補
助記憶装置の命令に対するアクセスは、主メモリと補助
記憶装置の間に接続された入出力（Ｉ／Ｏ）アダプタを
通してなされる。

【００１１】階層的記憶構成を有するスカラコンピュー
タにおいて、本発明は、二次記憶装置から、実行のため
の命令のシーケンスに与える入出力インタフェースと、
前記命令のシーケンスに応じて、並列に実行されてよい
シーケンスの命令を示す複合タグ情報を発生する命令複
合機構と、前記入出力インタフェース並びに前記命令複
合機構に接続されて複合タグ情報を有する命令シーケン
スを記憶する主記憶装置とを備える組合せ装置を提供す
る。

【００１２】主メモリは、知られているように、実行の
ための参照のためにＣＰＵに直ちにアクセスできるデー
タおよび命令を記憶するものである。適切に設計された
階層的記憶システム自身に主メモリを使用する目的は、
スカラコンピュータの全体にわたる性能を改善すること
にある。本発明においては、主メモリに命令が記憶され
ている限りは、主メモリに複合タグ情報を記憶すること
によりこの情報を繰り返し使用することが可能になる。
更に、主メモリ内の命令は、一旦キャッシュに与えられ
ると、一度以上使用するのに十分な時間キャッシュ内に
残る。

【００１３】

【実施例】図１は本発明により構成されたディジタルコ
ンピュータシステムまたはディジタルデータ処理システ
ムの要部の１実施例を示す図である。このコンピュータ
システムは２つ以上の命令を並列に実行することができ
る。また、このコンピュータシステムは、Ｉ／Ｏバスを
介して補助または二次記憶装置がコンピュータに接続さ
れる階層構成の記憶システムを備えている。コンピュー
タは、メモリバスに接続されるアダプタを通してＩ／Ｏ
バスとインタフェースする。主メモリおよび高速キャッ
シュは、メモリバスに接続される。

【００１４】上記階層性によりコンピュータシステムの
計算要素は、主メモリおよびキャッシュの内容に直接ア
クセスまたは参照することが通常可能になり、一方アダ
プタは補助記憶装置へのアクセスを与える。現在のコン
ピュータ演算をサポートするためにアクセスまたは参照
されなければならない命令とデータは、メモリ内に保持
される。これらの命令およびデータは、不要になると、
アダプタを介して補助メモリに戻され、一方新たな命令
とデータが主メモリに記憶される。キャッシュは、ＣＰ
Ｕによる高速アクセスをサポートし、また現在使用され
ておりまたはＣＰＵにより次に使用される可能性の大き
な命令とデータを記憶するために使用される。このよう
な階層記憶構造はＤｅｉｔｅｌ’ｓＯＰＥＲＡＴＩＮ
ＧＳＹＳＴＥＭＳ，１９９０年，第２版，第７章に詳
細に説明されている。

【００１５】ここで図１を参照すると、階層的に構成さ
れたメモリ構造を有するディジタルコンピュータシステ
ムの要部の１実施例が本発明に従って説明されている。
このコンピュータシステムは２つ以上の命令を並列に処
理することができる。またこのコンピュータシステム
は、処理されるべきデータと命令を記憶する第１記憶機
構を備えている。この記憶機構は、主メモリ１０として
与えられる。主メモリ１０は、アドレスを有するメモリ
バス９，コマンドバス９ａおよびテキストバス９ｂに接
続されている。主メモリ１０は、命令とデータをメモリ
バスを経てＩ／Ｏアダプタ８と交換する。Ｉ／Ｏアダプ
タ８は、メモリバス９およびＩ／Ｏバス７に接続され
る。なお、１つ以上の補助記憶装置（図示せず）が、Ｉ
／Ｏバス７に結合されるものとする。アダプタ８は、プ
ログラム情報を補助記憶装置に記憶し、またこのプログ
ラム情報を同じ記憶装置から得ることにより、Ｉ／Ｏバ
ス７を経てデータを転送する。更にこのアダプタ８は、
命令とデータを、バス９を経て主メモリに与え、またそ
れらを主メモリから受けることにより、メモリバス９上
のプログラムデータを主メモリ１０と交換する。更にこ
のアダプタ８は、異なる速度とフォーマットを有するバ
ス７と９の間で命令とデータをバッファする。最後に、
このアダプタ８は、エラーをチェック機能を有してい
る。参照番号８により示されるＩ／Ｏアダプタは、例え
ば、ＩＢＭコーポレーションから得られるモデル３０９
０コンピュータシステムのチャネル化されたＩ／Ｏサブ
システムに見られる。

【００１６】主メモリ１０は比較的大容量で中速度の記
憶機構であり、これはメモリバス９を介して低容量高速
キャッシュに接続されている。このキャッシュは、複合
命令キャッシュ１２として与えられる。

【００１７】図１のコンピュータシステムは更に、アダ
プタ８から命令を受けると共に、これらの命令と、これ
らの命令のいずれが並列に処理可能かを示すタグフィー
ルドの形態の複合タグ情報に関係づける命令複合化機構
１１を備えている。この命令複合化機構は、命令複合化
ユニット１１により示される。この複合化ユニット１１
は入力命令を解析してどの命令が並列に処理され得るか
を判定する。更に、命令複合化ユニット１１は、解析さ
れた命令に対して、どの命令が互いに並列処理可能か、
不可能かを示すタグフィールドの形態の複合化タグ情報
を発生する。

【００１８】図１において、命令は、アダプタ８，命令
複合化ユニット１１，および主メモリ１０を介して補助
記憶装置から計算システムに与えられる。主メモリ１０
は解析された命令およびそれらの関連するタグフィール
ドを受け、記憶する。主メモリ１０は、次に解析された
命令およびそれらの関連するタグフィールドを複合命令
キャッシュ１２に与える。キャッシュ１２は主メモリ１
０より小さな容量と大きな速度を持ち、主メモリ１０へ
のアクセスの頻度を減らすことによりコンピュータシス
テムの性能率を改善するために一般に使用される種類の
ものである。

【００１９】図１のコンピュータシステムは、更に複数
の機能命令処理ユニットを備えている。これらの機能命
令処理ユニットは、機能ユニット１３，１４，１５など
により表わされる。これらの機能ユニット１３〜１５は
同時的に互いに動作し、また各々はそれ自身で１種以上
のマシンレベル命令を処理することができる。使用され
得る機能ユニットとしては、例えば、算術・論理ユニッ
ト（ＡＬＵ）およびアドレス発生形ＡＬＵ，米国特許出
願第５０４，９１０号明細書に示されたタイプのデータ
依存性解消ＡＬＵ，分岐命令処理ユニット，データシフ
トユニット，浮動小数点処理ユニットなどがある。ある
コンピュータシステムは、上記のような機能ユニットの
あるものの２つ以上を備える。例えば、あるコンピュー
タシステムは、２つ以上の汎用ＡＬＵを備えている。更
に、あるコンピュータシステムは、異なるタイプの機能
ユニットの各々および全てを備えることができる。機能
ユニットの特定の構成は、考慮される特定のコンピュー
タシステムの性質に依存する。

【００２０】図１のコンピュータシステムは、複合命令
キャッシュ１２に結合されて、このキャッシュに記憶さ
れた隣接命令を、命令タグフィールドが上記命令が並列
に処理されてよいことを示すとき、機能命令処理ユニッ
ト１３〜１５のそれぞれに供給する命令取出し送出機構
を備えている。この機構は、命令取出送出ユニット１６
により表わされる。この命令取出し・送出ユニット１６
は、キャッシュ１２から命令を取り出し、それらのタグ
フィールドおよびオペレーションコードフィールドを検
討し、このような検討に基づいて命令を機能ユニット１
３〜１５の適切なものに送出する。所望の命令が複合命
令キャッシュ１２中にあるときは、適切なアドレスがキ
ャッシュ１２に送られ、これから所望の命令を取り出
す。これは“キャッシュヒット”と呼ばれることがあ
る。要求された命令がキャッシュ１２中にないときは、
この命令は主メモリ１０から取り出され、キャッシュ１
２に与えられなければならない。これは“キャッシュミ
ス”と呼ばれることがある。このようなミスが生じたと
きは、要求された命令のアドレスが主メモリ１０に供給
されなければならない。これに応じて、主メモリ１０
は、要求された命令を含む命令ラインについて、これら
の命令のタグフィールドと共に、転送または読出しを開
始する。

【００２１】キャッシュミスにより主メモリ１０に対し
て参照がなされ、要求された命令がメモリ１０に含まれ
るか否かを判定する。ここで、命令は一般に“ページ”
と呼ばれるブロックをなして主メモリに記憶され、また
計算システムのメモリ・管理ファシリティ（図示せず）
は、要求された命令から、これを含むページが主メモリ
にあるか否かを判定することができる。ページが主メモ
リ中にあるときは、命令を含むラインは主メモリ１０か
ら読み出され、キャッシュ１２に転送される。しかし、
要求された命令を含むページが主メモリ１０にないとき
は、“ページフォールト”が発生し、ミスページが補助
記憶装置から“取り出され”、主メモリ１０に記憶され
ることを要求する。ページが取り出されると、ミスペー
ジの識別情報がアダプタ８に送られ、アダプタはその信
号を検索し、次にメモリバス９を経て主メモリ１０に記
憶させる。

【００２２】本発明においては、主メモリ１０の記憶装
置から取り出されたページは、命令複合化ユニット１１
の入力に転送され、このユニットはこれらの入力命令を
解析し、各々の命令毎に適切なタグフィールドを発生す
る。その後、これらのタグと命令は主メモリ１０に送ら
れ、そこに記憶され、必要に応じて複合命令キャッシュ
１２への引き続く記憶に供される。

【００２３】図１において命令複合化ユニット１１は、
アダプタ８と主メモリ１０の間に接続されるものとして
示されたが、このユニットはメモリバス９上の個別の要
素であってもよく、または主メモリ１０に入力で接続さ
れてもよいものとする。

【００２４】主メモリ１０への複合命令の記憶は一連の
方法で実施することができ、それらのいくつかを図２
（Ａ）〜（Ｄ）に示す。これらの図の例においては、８
バイト幅のテキストバス９ｂと、タグ情報用の臨時のラ
インが仮定される。一般に、主メモリ１０と複合命令キ
ャッシュ１２の間の基本メモリ転送には６４バイトキャ
ッシュラインが用いられ、命令テキストの２バイト毎に
１タグビットが与えられるものとする。図２（Ａ）〜
（Ｄ）の例の各々には１キャッシュラインが示してあ
る。一般に、タグビット数は複合化されるべき命令の最
大数および命令複合化ユニット１１に対して得られる情
報により決定される。これらの点は米国特許出願第５１
９，３８２号明細書および第５０４，９１０号明細書に
示されている。

【００２５】制御の観点からのタグ記憶を実現する最も
簡単な例が図２（Ａ）に示されている。複合化が２つの
命令に限定されているとすると、命令テキストの２バイ
ト毎に最小１ビットタグが要求される。従って、図２
（Ａ）のメモリに記憶された命令ラインに対して毎６４
ビットは（即ち毎８バイト）４ビットの複合化タグ情報
を要求する。図２（Ａ）に示したように、この情報の記
憶には６４ビットから６８ビットまでのワードサイズの
拡張が含まれる。他のオプションとしてのタグビットが
あれば、拡張ワードのサイズは更に増加される。

【００２６】図２（Ｂ）には、得られるメモリ技術に対
して更にコンパティブルな第２の方法が示してある。図
２（Ｂ）において、個別のテキストとタグメモリが命令
および関係する複合化タグ情報の記憶により与えられ
る。図２（Ｂ）においては、タグメモリはテキストメモ
リに対して並列に動作する。図２（Ｂ）のメモリ構造に
おいては、メモリバス８上にタグバスを形成してテキス
トおよびタグメモリの並列動作を与える臨時のタグライ
ンのセットに対する要件が暗黙に与えられている。これ
は図２（Ａ）の拡張ワード法に対して幾つかの利点を有
している。先ず、タグメモリは主メモリ中のワードの一
部のみをカバーすることができる。演算システムはデー
タページに対してのみ（命令ページに対向するように）
メモリのある部分を使用し、タグはこれらの部分にわた
って必ずしも必要ではない。データページと命令ページ
との区別は、ハードウェアで判定することができ、ある
いはソフトウェアおよびあるページがデータのみを含む
ことを示すタグメモリに対するコマンドにより行うこと
ができ、従ってメモリページアドレスがこれらのページ
に対するタグメモリアドレスにマップされることを要求
しない。第２の利点は、タグメモリが予定通り除去され
てより低コストのシステムを生成できることにある。こ
れはコンピュータのファミリで可能な性能範囲を広げる
ものである。２方向以上の複合化に対して要求されるよ
うに、より多くのタグビットが必要とされるときは、新
しいタグメモリが、主メモリ設計の変化を要求すること
なしに図２（Ｂ）のタグメモリに置き代えられる。更
に、各々のメモリはそれ自身のエラー訂正を与えること
ができる。

【００２７】図２（Ａ）〜（Ｄ）に関して、複合化タグ
は、複合化ユニットにより生成されると、複合化タグ
は、命令ストリーム中に織り込まれるか、そのセクショ
ンに付加されるか、それと並列に維持されるかについて
メモリ中に命令ストリームを伴うことが主張される。

【００２８】タグの記憶を実現する他の方法が図２
（Ｃ）および図２（Ｄ）に示される。図２（Ｃ）におい
て、主メモリの第１のセクションはタグテーブルおよび
命令テキストページの第２の記憶装置を含んでいる。こ
の例においては、演算システムのサポートはメモリのテ
ーブル部分およびタグページを有する対メモリページを
留保することが要求される。図２（Ｄ）において、各々
のページの一部はタグのために留保される。これはコン
パイラにおいてページ構成に対する能力を要求する。例
えば、６４バイトのキャッシュラインが与えられると、
コンパイラは命令のために６０バイトを使用し、タグの
ために４バイトを使用することになる。図２（Ｄ）にお
いて、タグは、ＣＰＵにより要求されると命令キャッシ
ュにおいて命令バイトと対になされる。

【００２９】図１のコンピュータシステムの意味は、命
令複合化ユニット１１が、バスアダプタ８の一部を形成
することができることにある。このようにして、任意の
ページがＩ／Ｏシステムの形態にもたらされると、この
ページはユニット１１において暗黙の複合化プロセスに
課され、またメモリバス９上を主メモリ１０に移動され
る。この点から、図２（Ａ）によるページ構造は、テキ
ストバス９ｂが６８ビット幅であり、主メモリが図２
（Ａ）に示したもののようなページを記憶するために構
成され、制御されることを意味すると仮定される。勿
論、複合命令キャッシュ１２は図２（Ａ）に示したよう
に拡張ワードを含むラインを受けるように構成され、制
御される。

【００３０】ページフォールトに際しては、ページはア
ダプタ８内のページバッファにロードされ、また以下に
説明するように命令複合化ユニット１１に与えられる。
図３において、２つのページバッファ１８ａ，１８ｂは
ページのシーケンスを命令複合化ユニット１１に送出
し、このユニットは複合化タグ情報をページ命令に付加
することにより複合化動作を行う。複合化ユニットによ
り処理されるページは、複合ページバッファ１９ａ，１
９ｂを通して主メモリ１０に供給される。図４が示すよ
うに、複合化ユニットは時間を要求されるものに付加し
て補助記憶装置からテキストセグメントを取り出し、こ
れを主メモリ１０に入力する。しかしながら、付加され
る時間は要求される全時間に比べて小さく、またＣＰＵ
に対して非同期である。図４において、各々のセグメ
ントｉはディスクドライブなどの補助記憶装置からペー
ジバッファ１８ａまたは１８ｂの１つに転送される。時
間セグメントｂ_i の各々はページバッファから主メモリ
１０へ、テキストセグメントを転送するのに必要な時間
を示す。このようにして、テキストセグメントｉは、ど
のテキストセグメントｉ＋１がバッファの他方に転送さ
れるかに従って、時間ａ_i 内でページバッファ１８ａま
たは１８ｂの１つに転送される。複合化がないと、セグ
メントｉはページバッファから時間ｂ_i 内で転送され、
そこでセグメントｉは一般に主メモリに記憶される。図
４に示すように、この時間はバッファ１８ａまたは１８
ｂの一方にページを取り出すのに必要な時間よりかなり
短い。本発明を実施する場合、ページバッファの１つの
テキストセグメントに対して複合化ユニット１１の動作
が行われるのに必要な時間プラス複合バッファ１９ａま
たは１９ｂで費やされる時間は、複合化時間ｃ_i により
表わされる。ここで、図４において、時間ｂ_i はページ
バッファから複合化ユニット１１へテキストセグメント
ｉを転送するのに必要なものである。次に、複合化時間
ｃ_i が与えられ、一方テキストセグメントｉが複合化ユ
ニット１１のプロセスに課される。図４に示すように、
時間ｂ_i とｃ_i の和は時間ａ_i 以下である。スカラマシ
ンは命令実行時間において、命令が並列に実行され得る
か否かを判定しなければならないことが想定される。こ
の判定は命令の実行においてディスクリートなステップ
であり、従ってスーパスカラマシンにおける実行時間に
実質的に付加するものである。一方、図４に示すよう
に、図１のコンピュータシステムにおける複合化は、コ
ンピュータ動作を行うのに要求される時間を有意には延
長しないものである。従って，命令複合化ユニット１１
は、命令実行ユニットに配置された複合化器より一層高
い性能を提供する。

【００３１】図３および図４は、主メモリにおける複合
化の２つの主要な利点を示す図である。先ず、複合化は
非同期ページフォールトプロセスを完了する時間を延長
することなしに、そのプロセスの一部にすることができ
る。第２に、ページなどの命令テキストの大きなブロッ
クの複合化は、より最適な複合化をもたらすことができ
る複合化に対するより大きな検討の範囲を提供する。こ
の結果、図１に示したもののようなイン・メモリ命令複
合化ユニットは、ＣＰＵが複合化された命令を常に実行
し、また複合化が命令テキストのより小さなセクション
に対して同期的に行われるときより一層最適化できるこ
とから、性能の利点を与えることになる。

【００３２】ここで、図５（Ａ）を参照して命令複合化
ユニットの動作について先ず説明する。図５（Ａ）は、
複合化またはタグを付された命令が図１の命令複合化ユ
ニット１１の出力に現われたときの、これらの命令の流
れの要部を示す図である。図示のように、各々の命令
は、命令複合化ユニット１１によりそれに付加されたタ
グフィールドを有する。タグ付き命令は、図５（Ａ）に
示したように、命令を含むページに対してページブロッ
クをなして主メモリに記憶される。これらの主メモリ１
０に記憶されたタグ付き命令は、必要に応じて、“ミ
ス”が生じたときにキャッシュ１２に転送される。その
後、キャッシュ１２のタグ付き命令は命令取出し送出ユ
ニット１６により取り出される。タグ付き命令が取出し
送出ユニット１６により受信されると、それらのタグ付
きフィールドが検討され、それらが並列に処理され得る
か否かが判定され、またそれらのオペレーションコード
フィールドが検討され、使用する機能ユニットのどれが
それらの処理に最も適しているかが判定される。タグフ
ィールドが、２つ以上の命令が並列処理に適しているこ
とを示すときは、それらの命令はそれらのオペレーショ
ンコードフィールドの符号化に従って機能ユニットの適
切なものに送出される。次に、このような命令は、それ
らのそれぞれの機能ユニットにより互いに同時に処理さ
れる。

【００３３】並列処理に適さない命令が生じたときは、
これはそのオペレーションコードにより決定されるよう
に適切な機能ユニットに送られ、その際選択された機能
ユニットにより単独でそれ自身により処理される。

【００３４】複数の命令が常に並列に処理されている最
も完全な場合には、コンピュータシステムの命令実行速
度は、Ｎを並列に処理されているグループの命令の数と
すると、命令が一度に１つ実行される場合のＮ倍にな
る。

【００３５】図５（Ａ）のタグ付き命令ストリームは、
もしどこで命令が始まるかを示す既知の基準点が存在す
るときは、命令複合化ユニットによる処理が容易になさ
れる。このような基準点は、命令境界が生じる場所につ
いての正確な知識を与える。多くのコンピュータシステ
ムにおいては、命令境界はコンパイル時間においてコン
パイラによってのみ、また命令が取り出されるときＣＰ
Ｕによってのみ特に知られる。境界基準点は、特殊な境
界基準方式が採用されないときはコンパイル時間と命令
取出しの間で未知である。このような方式は、図５
（Ｂ）に命令境界ビットＢにより示してある。図５
（Ｂ）に示したように、境界ビットはコンパイル時にコ
ンパイラにより命令ストリーム内に配置され、複合化の
直前に命令アラインメントの基準を与える。一般に、
“スカラブル複合命令セットマシンアーキテクチュア”
および“命令レベル並列プロセッサ用汎用複合化装置”
と題する前記特許出願では、命令境界が不定のテキスト
流との複合化についての検討がなされている。テキスト
流が命令のみを含み、全ての命令が同じ長さの場合のよ
うに命令境界がテキスト流から決定し得る場合は、境界
の定義は不要なことは勿論である。

【００３６】図６の命令複合化ユニットの説明図６は本発明による命令複合化ユニットの実施例の内部
構成を詳細に示す図である。この命令複合化ユニット２
０は、図１の命令複合化ユニット１１として使用するの
に適している。図６の命令複合化ユニット２０は、ある
時点で最大２つの命令が並列に処理される場合に対して
設計されている。しかし、これは本発明を対状複合化に
のみ限定することを意味するものではない。この例にお
いては、１ビットタグフィールドが使用される。タグビ
ット値“１”は命令が“第１命令”であることを意味し
ている。タグビット値“０”は、命令が“第２”命令で
あり、先行する第１命令と並列に実行されることを意味
する。タグビット値１を持つ命令は、次の命令に対する
タグビット値に依存して、それ自身によるかまたは同時
にそしてこのような次の命令と並列に、のいずれかによ
り実行される。

【００３７】タグビット値１を持つ命令とタグビット値
０を持つ命令との各々の対化により並列実行のための複
合命令が形成され、即ちこのような対をなす命令が互い
に並列に処理される。２つの続く命令に対するタグビッ
トがそれぞれ１の値を有するときは、これらの命令の第
１は非並列的にそれ自身により実行される。最悪の場合
には、シーケンス中の命令の全てはタグビット値１を有
する。この最悪の場合には、命令の全ては非並列的に一
度に１つずつ実行されることになる。

【００３８】命令複合化ユニット２０に対する入力にお
いて、命令アラインメントユニットは複合化されるべき
命令ストリームをＩ／Ｏアダプタから受信する。この命
令ストリームは図５（Ｂ）に示すように境界ビットＢを
有する。この場合、命令アラインメントは、単に境界ビ
ットを検出し、命令オペレーションコードを復号する問
題になる。既知のように、ＩＢＭシステム／３７０命令
セットにおいては、オペレーションコードはバイトまた
はハーフワードでの命令長を与えるビットを有してい
る。従って、境界ビットＢが命令に対して識別されてい
ると、次の命令は境界ビットからバイトまたはハーフワ
ードの数を計数することにより一意に識別することがで
きる。命令アラインメントは本発明の特徴ではなく、命
令境界は境界ビットの使用を含む既知の方法により識別
される。

【００３９】図６の命令複合化ユニット２０は、アダプ
タのページバッファ１８ａ，１８ｂから複数の逐次命令
を受ける複数命令命令レジスタ２１を備えている。命令
複合化ユニット２０は更に複数の規則ベース命令解析機
能を備えている。各々のこのような命令解析機構は、命
令レジスタ２１の異なる対の並列命令を解析し、その対
の２つの命令が並列処理可能か否かを示す複合可能性信
号を発生する。図６においては複数の複合解析ユニット
２２〜２５が示してある。これらの複合解析ユニット２
２〜２５の各々は、丁度言及した命令解析機構の２つを
備えている。このようにして、これらの解析ユニット２
２〜２５の各々は複合可能性信号の２つを発生する。例
えば，第１の複合解析ユニット２２は、命令０および１
が並列に処理され得るか否かを示す第１の複合可能性信
号を発生する。複合解析ユニット２０は更に、命令１お
よび２が並列に処理され得るか否かを示す第２の複合可
能性信号Ｍ１２を発生する。

【００４０】同様にして、第２複合解析ユニット２３
は、命令２および３が並列に処理され得るか否かを示す
第１複合可能性信号Ｍ２３と、命令３および４が並列に
処理され得るか否かを示す第２複合可能性信号Ｍ３４を
発生する。第３複合解析器２４は、命令４および５が並
列に処理され得るか否かを示す第１複合可能性信号Ｍ４
５と、命令５および６が並列に処理され得るか否かを示
す第２複合可能性信号Ｍ５６を発生する。第４複合解析
器２５は、命令６および７が並列に処理され得るか否か
を示す第１複合可能性信号Ｍ６７と、命令７および８が
並列に処理され得るか否かを示す第２複合可能性信号Ｍ
７８を発生する。

【００４１】命令複合化ユニット２０は更に、解析ユニ
ット２２〜２５の出力に生じる複合可能性信号に応じ
て、命令レジスタ２１内の各々の命令に対して個別タグ
フィールドを発生するタグ発生機構２６を備えている。
これらのタグフィールドＴ０，Ｔ１，Ｔ２・・・は、命
令自身の場合と同様にタグ付き命令レジスタ２７に供給
され、後者の命令は入力命令レジスタ２１から得られ
る。このようにして、複合化ユニット出力レジスタ２７
には、命令０に対してタグフィールドＴ０、命令１に対
してタグフィールドＴ１などが与えられる。

【００４２】本実施例においては、各々のタグフィール
ドＴ０，Ｔ１，Ｔ２・・・は単一２進ビットから構成さ
れる。タグビット値“１（ｏｎｅ）”は、それが付加さ
れる直ぐ次の命令が“第１”命令であることを示す。タ
グビット値“０（ｚｅｒｏ）”は、直ぐ次の命令が“第
２”命令であることを示す。０のタグビット値を有する
命令が続く１のタグビット値を有する命令は、これらの
２つの命令が互いに並列に実行されることを示す。複合
化ユニット出力レジスタ２７のタグ付き命令は、図３の
複合バッファ１９ａまたは１９ｂの一方または他方を介
して図１の主メモリ１０の入力に供給される。複合命令
は、主メモリ１０に記憶される。

【００４３】ここで図７を参照すると、図６の複合解析
ユニット２２に使用する内部構成が詳細に示してある。
その他の複合解析ユニット２３〜２５も、類似の構成を
有している。図７に示したように、複合解析器２２は命
令０のオペレーションコードおよび命令１のオペレーシ
ョンコードを検討し、これらの２つのオペレーションコ
ードが並列実行に対してコンパティブルであるかを決定
する命令コンパティビリティ論理３０を備える。この論
理３０は、オペレーションコードのどの対が並列実行に
対してコンパティブルかを選択する所定の規則に従って
構成される。即ち、論理３０は、当該コンパイラシステ
ムに使用される特定のハードウェア構成において、どの
タイプの命令が並列実行に対してコンパティブルである
かを定める規則を実現する論理回路を備えている。命令
０および２に対するオペレーションコードがコンパティ
ブルのときは、論理３０はその出力に２進１レベル信号
を発生する。それらがコンパティブルでないときは、論
理３０はその出力ライン上に２進０値を発生する。

【００４４】複合解析器２２は更に、命令１および２の
オペレーションコードを検討し、それらが並列実行に対
してコンパティブルであるか否かを決定する第２命令コ
ンパティビリティ論理３１を備える。論理３１は論理３
０に使用するものと同じ所定に規則に従って論理３０と
同様に構成されて、オペレーションコードのどの対が命
令１および２の場合に対する並列実行のためにコンパテ
ィブルであるかを選択する。このようにして、論理３１
は、どのタイプの命令が並列実行に対してコンパティブ
ルであるかを定め、論理３０で使用したものと同じの規
則を実現する論理回路を備えている。命令１および２に
対するオペレーションコードがコンパティブルのとき
は、論理３１は２進１レベル信号を発生する。さもなけ
れば、それは２進０レベル出力を発生する。

【００４５】複合解析器２２は更に、命令０および１の
Ｒ１およびＲ２フィールドにより指示される汎用レジス
タの使用時に生じる対立（ｃｏｎｆｌｉｃｔ）を検出す
る第１レジスタ依存性論理３２を備える。これらの汎用
レジスタを以下で詳細に説明する。特に、依存性論理３
２は、第２命令（命令１）が先行命令（命令０）の実行
により得られる結果を使用することを必要とするデータ
依存性状態の発生を検出するように構成される。この場
合、第２命令は依存性解消ハードウェアにより実行さ
れ、従って第１命令と並列に実行され得るか、第２命令
の実行は先行命令の実行完了を待たなければならず、従
って先行命令と並列に実行され得ないかのいずれかであ
る。（この種の幾つかのデータ依存性を解消する方法
は、以下で説明する。）命令０および１の並列実行を防
止するレジスタ依存性が存在しないときは、論理３２の
出力ラインは２進１の値が与えられる。依存性があると
きは、それは２進０の値が与えられる。

【００４６】複合解析器２２は更に、命令１および２の
Ｒ１およびＲ２フィールドにより指示される汎用レジス
タの使用時の対立を検出する第２レジスタ依存性論理３
３を備える。この論理３３は既に示した論理３２と同じ
構成のものであり、レジスタ依存性が存在しないかこの
レジスタ依存性がデータ依存性解消ハードウェアにより
実行可能なときは２進１レベル出力を、そもなければ２
進０レベル出力を発生する。

【００４７】命令コンパティビリティ論理３０およびレ
ジスタ依存性論理３２からの出力ラインは、ＡＮＤ回路
３４の２つの入力に接続される。ＡＮＤ回路３４の出力
ラインは、問題の２つのオペレーションコードがコンパ
ティブルであり、レジスタ依存性が存在しないときは２
進１値を有する。ＡＮＤ回路３４の出力ライン上のこの
２進１値は、問題の２つの命令がコンパティブル、即ち
並列に実行可能であることを示す。一方、ＡＮＤ回路３
４の出力ラインが０の２進値を持つときは、２つの命令
は複合可能ではない。このようにして、ＡＮＤ回路３４
の出力ライン上には、命令０および１が並列に処理され
得るか否かを示す第１複合可能性信号Ｍ０１が発生され
る。

【００４８】第２コンパティビリティ論理３１および第
２依存性論理３３からの出力ラインは、ＡＮＤ回路３５
の２つの入力に接続される。ＡＮＤ回路３５はその出力
ライン上に第２複合可能性信号Ｍ１２を発生し、この信
号は、問題の２つのオペレーションコード（命令１およ
び２に対応するオペレーションコード）がコンパティブ
ルであり、また命令１および２に対するレジスタ依存性
が存在しないかまたはデータ依存性解消ハードウェアに
より実行できるレジスタ依存性が存在しないときは、２
進１の値を有するものである。さもなければ、ＡＮＤ回
路３５の出力ラインは２進０の値を有する。ＡＮＤ回路
３５からの出力ラインはタグ発生器２６の第２入力に連
なっている。

【００４９】図６に示したその他の複合解析器２３〜２
５は、第１複合解析器に対して図７に示したものと同じ
内部構成をなしている。

【００５０】ここで、図８を参照すると、複合解析器２
２および初めの３つのタグ、ＴＡＧ０，ＴＡＧ１，およ
びＴＡＧ２を生成するために使用されるタグ発生器２６
の要部を実現するために使用できる論理回路の一例を示
す図である。図５（Ａ）および図５（Ｂ）の例に対し
て、カテゴリＡおよびカテゴリＢとして指示される命令
の２つのカテゴリが存在すると仮定される。これらの命
令のカテゴリを複合化する規則は次のように仮定され
る。（１）Ａは常にＡと複合化することができる。（２）ＡはＢと決して複合化することはできない。（３）ＢはＢと決して複合化することはできない。（４）Ｂは常にＢと複合化することができる。（５）規則（４）は規則（１）に優先する。これらの規則は命令の発生順序に敏感である。更に、こ
れらの規則は、これらが観察されたとき、何らかのイン
タロックが存在する場合に、このようなインタロックは
データ依存性解消ハードウェアにより常に実行可能であ
ることをこれらの規則が暗黙に示すためにレジスタ依存
性に対する問題は存在しないように、与えられるものと
する。換言すれば、図８の例に対して、図７のレジスタ
依存性論理３２および３３は必要ではないと仮定され
る。このような場合、ＡＮＤ回路３４および３５も必要
とされず、論理３０の出力はＭ０１信号になり、論理３
１の出力はＭ１２信号になる。

【００５１】これらの仮定に対して、図８は、命令コン
パティビリティ論理３０および図７の命令コンパティビ
リティ論理３１に対して使用される内部論理回路を示す
図である。図８を参照すると、命令コンパティビリティ
論理３０は、デコーダ４０，４１，ＡＮＤ回路４２，４
３，およびＯＲ回路４４を備えている。第２命令コンパ
ティビリティ論理３１は、デコーダ４１，４５，ＡＮＤ
回路４６，４７，およびＯＲ回路４８を備えている。中
間のデコーダ４１は、両論理３０，３１により共有され
る。

【００５２】第１論理３０は、命令０および１のオペレ
ーションコードＯＰ０およびＯＰ１を検討して、並列実
行に対するそれらのコンパティビリティを決定する。こ
れは上記の規則（１）〜（４）に従ってなされる。デコ
ーダ４０は、第１命令のオペレーションコードを検討
し、カテゴリＡのオペレーションコードのときはデコー
ダ４０のＡ出力ラインは１レベルに設定される。ＯＰ０
がカテゴリＢのオペレーションコードのときは、デコー
ダ４０のＢ出力ラインは１レベルに設定される。ＯＰ０
がカテゴリＡまたはカテゴリＢのいずれにも属さないと
きは、デコーダ４０の両出力は２進０レベルにある。第
２デコーダ４１は、第２オペレーションコードＯＰ１に
対して同様の復号処理を行う。

【００５３】ＡＮＤ回路４２は上記規則（１）を実現す
るＯＰ０がカテゴリＡのオペレーションコードであり、
ＯＰ１もカテゴリＡのオペレーションコードであるとき
は、ＡＮＤ回路４２は１レベル出力を発生する。さもな
ければ、ＡＮＤ回路４２の出力は２進０レベルである。
ＡＮＤ回路４３は上記規則（４）を実現する。第１オペ
レーションコードがカテゴリＢのオペレーションコード
であり、第２オペレーションコードがカテゴリＡのオペ
レーションコードのときは、ＡＮＤ回路４３は１レベル
出力を発生する。さもなければ、それは０レベル出力を
発生する。ＡＮＤ回路４２またはＡＮＤ回路４３のいず
れかが１レベル出力を発生すると、これはＯＲ回路４４
の出力を１レベルに駆動し、その場合複合可能性信号Ｍ
０１は１の値を有することになる。この１の値は、第１
および第２命令（命令０および１）が並列実行に対して
コンパティブルであることを示すものである。

【００５４】デコーダ４０および４１によりオペレーシ
ョンコードカテゴリの他の何らかの組合せが検出される
と、ＡＮＤ回路４２および４３の出力は０レベルのまま
であり、また複合可能性信号Ｍ０１は０の非複合可能性
表示値を有することになる。このようにして、上記規則
（２）および（３）により示される組合せの発生はＡＮ
Ｄ回路４２，４３を満足せず、Ｍ０１は０レベルのまま
になる。カテゴリＡおよびＢの他にオペレーションコー
ドの他のカテゴリが存在すると、命令ストリーム中での
それらの発生はデコーダ４０および４２の出力を活性化
しない。従って、それらは同様に０値のＭ０１複合可能
性信号をもたらす。

【００５５】第２命令コンパティビリティ論理３１は、
第２および第３命令（命令１および２）に対して同様の
オペレーションコード解析を行う。第２オペレーション
コードＯＰ１がカテゴリＡのオペレーションコードであ
り、第３オペレーションコードＯＰ２がカテゴリＡのオ
ペレーションコードのときは、規則（１）によりＡＮＤ
回路４６は１レベルの出力を発生し、また第２複合可能
性信号Ｍ１２が複合可能性表示２進１レベルに駆動され
る。一方、ＯＰ１がカテゴリＢのオペレーションコード
であり、ＯＰ２がカテゴリＡのオペレーションコードの
ときは、規則（４）によりＡＮＤ回路４７が活性化され
て第２複合可能性信号Ｍ１２に対して２進１レベルを発
生する。規則（１）および（４）で定められたもの以外
の任意のオペレーションコードの組合せに対して、Ｍ１
２信号は０の値を有する。

【００５６】Ｍ０１およびＭ１２複合可能性信号は、タ
グ発生器２６に供給される。図８は、タグ発生器２６で
用いられてＭ０１およびＭ１２複合可能性信号に応答し
てＴＡＧ０，１，および２に対して所望のタグビット値
を発生することができる論理回路を示している。タグビ
ット値１は、関連する命令が並列実行に対して“第１”
命令であることを示している。タグビット値０は、関係
する命令が並列実行に対して“第２”命令であることを
示している。対をなす唯一の命令は、０のタグビット値
を有する。１のタグビット値を持つ他の命令を伴う１の
タグビット値を持つ命令は、それ自身により単独で、次
の命令と並列ではなく実行される。

【００５７】図９の第１行の場合、３つの全てのタグビ
ットは１の値を有する。これは、命令０および１の各々
が単独で非並列的に実行されることを意味する。図９の
第２行の場合、ＴＡＧ０は要求された１の値を持ち、Ｔ
ＡＧ１は要求された０の値を持つことから、命令０およ
び１は並列に実行される。図９の第３行の場合、命令０
は単独で実行されるが、命令１および２は互いに並列に
実行される。第４行に対しては、命令０および１は互い
に並列に実行される。

【００５８】ＴＡＧ２が１の２進値を持つ場合、その関
係する命令２のステータスはＴＡＧ３に対する２進値に
依存する。ＴＡＧ３が０の２進値を持つときは、命令２
および３が並列に実行される。一方、ＴＡＧ３が１の２
進値を持つときは、命令２が単独で非並列的に実行され
る。タグ発生器２６に対して実現される論理は、０の２
進値を持つ２つの連続するタグビットの発生を許容しな
いことがわかる。

【００５９】図９の検討から、図８に示したタグ発生器
２６の要部により実現される必要のある論理が明らかに
なる。図９に示されるように、ＴＡＧ０は常に１の２進
値を有する。これは、１の一定２進値をＴＡＧ０出力ラ
インを構成するタグ発生器出力ライン５０に与えること
により実現される。図９の検討から、ＴＡＧ１に対する
ビット値は常にＭ０１複合可能性信号のビット値の逆で
あることが明らかになる。この結果は、ＴＡＧ１に対す
る出力ライン５１を、入力がＭ０１信号ラインに接続さ
れるＮＯＴ回路５２の出力に接続することにより実現さ
れる。

【００６０】ＴＡＧ２の出力ライン５３上の２進レベル
は、ＯＲ回路５４およびＮＯＴ回路５３により決定され
る。ＯＲ回路５４の１入力は、Ｍ０１ラインに接続され
る。Ｍ０１が１の値を持つときは、ＴＡＧ２は値１を持
つ。これは、図９の第２および第４行のＴＡＧ２値に注
目したものである。ＯＲ回路５４の他の入力は、ＮＯＴ
回路４４によりＭ１２信号ラインに接続される。Ｍ１２
が０の２進値を持つときは、この値はＮＯＴ５５により
反転されてＯＲ５４の第２入力に２進１の値を供給す
る。これにより、ＴＡＧ２の出力ライン５３は２進１の
値を持つようになる。これは、図９の行１に対するＴＡ
Ｇ２値を考慮したものである。行３の場合に対しては、
ＴＡＧ２は０の値を持たなくてはならない。これは、こ
の場合、Ｍ０１が０の値を持ち、Ｍ１２がＮＯＴ回路５
５により反転されてＯＲ回路５４の第２入力において０
を発生する１の値を有することから発生する。

【００６１】図９の論理においては、Ｍ０１およびＭ１
２の各々が１の２進値を持つ行４の場合に対する優先規
則が暗黙に仮定される。この行４の場合は、ＢＡＡの命
令カテゴリシーケンスにより発生可能である。これは、
図９に示したように１０１のタグシーケンスにより、ま
たは１１０のタグシーケンスにより実現することができ
る。本実施例においては、規則５が次に続き、図９に示
した１０１シーケンスが選択される。換言すれば、ＢＡ
対化がＡＡ対化に対して優先されることになる。

【００６２】Ｍ０１およびＭ１２に対する１，１パター
ンも、ＡＡＡのオペレーションコードシーケンスにより
生成可能である。この場合、図９の１０１タグシーケン
スが再び選択される。これは、１０１タグシーケンスが
ＴＡＧ２に対して１の値を与え、従って潜在的に命令２
が、これが命令３とコンパティブルのときは命令３と複
合されることを可能にすることから、より良好である。

【００６３】図１４の実施例の説明図１０を参照すると、本発明の複合タグを用いてマシン
レベルコンピュータ命令の並列処理を与えるためにコン
ピュータシステムが如何に構成できるかの方法を詳細に
示す例が与えられている。図１０で使用される命令複合
化ユニット２０は、図６に示したタイプであると仮定さ
れ、従ってそれは、各々の命令に１ビットタグフィール
ドを付加する。これらのタグフィールドは、命令のどの
対が並列に処理され得るかを識別するために使用され
る。これらのタグ付き命令を含むページは主メモリ１０
に供給され、それに記憶される。タグ付き命令が必要と
されるときは、それらは読み出され、またはキャッシュ
１２に転送される。取出し送出制御ユニット６０は、必
要に応じてキャッシュ１２からタグ付き命令を取り出
し、複数の機能命令処理ユニット６１，６２，６３およ
び６４の適切な１つまたはそれ以上によるそれらの処理
に対して配列する。取出し送出ユニット６０は、取り出
された命令のタグフィールドおよびオペレーションコー
ドフィールドを検討する。タグフィールドが、２つの連
続する命令が並列に処理されることを示すときは、取出
し送出ユニット６０は、それらをそれらのオペレーショ
ンコードにより決定されるように機能ユニット６１〜６
４の適切なものに割り当て、またそれらは選択された機
能ユニットにより並列に処理される。タグフィールド
が、特定の命令が単独で非並列的に処理されるべきこと
を示すときは、取出し送出ユニッ６０は、それを、その
オペレーションコードにより決定されるように、またそ
れがそれ自身により処理または実行されるように、特定
の機能ユニットにそれを割り当てる。

【００６４】第１機能ユニット６１は、分岐形命令を処
理する分岐命令処理ユニットである。第２機能ユニット
６２は、オペランドを記憶装置に、またはそれから転送
する命令に対して記憶アドレスを計算するために使用さ
れる３入力アドレス発生算術論理ユニット（ＡＬＵ）で
ある。第３機能ユニット６３は、数学的・論理的演算を
実施するために使用される汎用算術論理ユニット（ＡＬ
Ｕ）である。本実施例における第４機能ユニット６４
は、上記引用の米国特許出願第５０５，９１０号明細書
に示された種類のデータ依存性解消ＡＬＵである。この
依存性解消ＡＬＵ６４は、単一マシンサイクルで２つの
算術論理演算を行うことができる３入力ＡＬＵである。

【００６５】図１０のコンピュータシステムの実施例は
更に、マシンレベル命令の幾つかを実行する際に使用す
る１組の汎用レジスタ６５を備えている。通常は、これ
らの汎用レジスタ６５は、データオペランドおよびアド
レスオペランドを一時記憶するために使用され、または
カウンタとして、または他のデータ処理のために使用さ
れる。通常のコンピュータシステムでは、１６個のこの
ような汎用レジスタが設けられる。本実施例において
は、汎用レジスタ６５は、２つ以上のレジスタが同時に
アクセスできるマルチポート形のものとされる。

【００６６】図１０のコンピュータシステムは更に、上
位記憶ユニット１０から得られるデータオペランドを記
憶する高速データキャッシュ記憶機構６６を備えてい
る。キャッシュ記憶機構６６中のデータはまた主メモリ
１０に送出される。データキャッシュ６６は既知のもの
であり、また主メモリ１０に対するその動作は既知の方
法で行われる。

【００６７】図１１は、図１０のコンピュータシステム
により処理される複合またはタグ付命令シーケンスの例
を示す図である。図１１の例は、次のシーケンスの次の
命令、即ちＬｏａｄ，Ａｄｄ，Ｃｏｍｐａｒｅ，Ｂｒａ
ｎｃｈｏｎＣｏｎｄｉｔｉｏｎａｎｄＳｔｏｒ
ｅで構成される。これらは、それぞれ命令Ｉ１〜Ｉ５と
して識別される。これらの命令に対するタグビットは、
それぞれ１，１，０，１および０である。図１０に示し
たマシンの構成ため、Ｌｏａｄ命令はそれ自身により単
独で処理される。ＡｄｄおよびＣｏｍｐａｒｅ命令は複
合命令として扱われ、互いに並列に処理される。Ｂｒａ
ｎｃｈａｎｄｓｔｏｒｅ命令も複合命令として扱わ
れ、互いに並列に処理される。

【００６８】図１２の表は更に、図１１の命令の各々に
対する情報を与える。図１２のＲ／Ｍ列は、第１オペラ
ンドを含む汎用レジスタ６５の特定のものを識別するた
めに通常使用される各々の命令の第１フィールドの内容
を示している。Ｒ／Ｍフィールドが条件コードマスクを
含むＢｒａｎｃｈｏｎｃｏｎｄｉｔｉｏｎ命令の場
合は、例外である。図１２のＲ／Ｘ列は、汎用レジスタ
６５の第２のものを識別するために通常使用される各々
の命令の第２フィールドの内容を示している。このよう
なレジスタは第２オペランドを収容してもよく、または
アドレスインデックス値（Ｘ）を収容してもよい。図１
２のＢ列は、基本アドレス値を収容する汎用レジスタ６
５の特定のものを識別する各々の第３の可能なフィール
ドの内容を示している。Ｂ列の０は、Ｂフィールドの欠
如またはＢフィールドの対応するアドレス要素の欠如を
示している。図１２のＤフィールドは、アドレス発生の
ために使用されるとき、アドレス変位値を含む各々の命
令の他のフィールドの内容を示している。Ｄ列の０はま
た、問題の特定の命令の対応するフィールドの欠如ある
いは０のアドレス変位値を示している。

【００６９】ここで、図１１のＬｏａｄ命令の処理につ
いて考えると、取出し送出制御ユニット６０は、このＬ
ｏａｄ命令に対するタグビットおよび次のＡｄｄ命令か
ら、Ｌｏａｄ命令がそれ自身により単独で処理されるべ
きであることを判定する。このＬｏａｄ命令により行わ
れる作用は、記憶装置、この場合はデータキャッシュ６
６からオペランドを取り出し、さらにこのようなオペラ
ンドをＲ２汎用レジスタに記憶させることにある。この
オペランドが取り出される記憶装置のアドレスは、レジ
スタＸがインデックス値，レジスタＢの基本値，および
変位値Ｄを加算することにより決定される。取出し送出
制御ユニット６０は、このアドレス発生動作をアドレス
発生ＡＬＵ６２に割り当てる。この場合は、ＡＬＵ６２
は、レジスタＸのアドレスインデックス値（本例では０
の値）、汎用レジスタＲ７に収容された基本アドレス
値、および命令自身に含まれる変位アドレス値（本例に
おいては０の値）を共に加算する。ＡＬＵ６２の出力に
現れる記憶アドレスの得られた計算値は、データキャッ
シュ６６のアドレス入力に供給されて所望のオペランド
にアクセスする。このアクセスされたオペランドはレジ
スタセット６５のＲ２汎用レジスタにロードされる。

【００７０】ここで、Ａｄｄａｎｄｃｏｍｐａｒｅ
命令の処理について考えると、これらの命令は取出し送
出制御ユニット６０により取り出される。制御ユニット
６０は、これらの２つの命令に対する複合タグを検討
し、それらが並列実行可能であることを知る。図１２に
示したように、Ｃｏｍｐａｒｅ命令は、Ｒ３が比較可能
になる前にＡｄｄ命令を完了させなければならないの
で、Ａｄｄ命令に対して明瞭なデータ依存性を有する。
しかし、この依存性はデータ依存性解消ＡＬＵ６４によ
り処理することができる。従って、これらの２つの命令
は図１０の構成において並列に処理することができる。
特に、制御ユニット６０はＡｄｄ命令の処理をＡＬＵ６
３に割り当て、さらにＣｏｍｐａｒｅ命令の処理を依存
性解消ＡＬＵ６４に割り当てる。

【００７１】ＡＬＵ６３は、Ｒ２汎用レジスタの内容を
Ｒ３汎用レジスタの内容に加算し、さらに加算結果をＲ
３汎用レジスタに再び記憶させる。同時に、依存性解消
ＡＬＵ６４は次の数学的演算、Ｒ３＋Ｒ２−Ｒ４を実施する。この演算の結果に対する条件コードは、分
岐ユニット６１に配置された条件コードレジスタに送ら
れる。データ依存性は、実際にはＡＬＵ６４がＲ３＋Ｒ
２の和を計算し、次にこの和をＲ４と比較して条件コー
ドを決定するので、解消される。このようにして、ＡＬ
Ｕ６４はＡｄｄ命令を行っているＡＬＵ６３からの結果
を待機する必要がないことになる。この特定の場合にお
いては、ＡＬＵ６４により計算され、ＡＬＵ６４の出力
に現れる数値結果は、汎用レジスタ６５に戻されない。
この場合、ＡＬＵ６４は条件コードを単に設定するだけ
である。

【００７２】ここで、図１１に示したＢｒａｎｃｈ命令
およびＳｔｏｒｅ命令の処理について考えると、これら
の命令は取出し送出制御ユニット６０により複合命令キ
ャッシュ１２から取り出される。制御ユニット６０は、
これらの命令に対するタグビットから、それらが互いに
並列に処理可能であることを判定する。更に制御ユニッ
ト６０は、２つの命令のオペレーションコードから、Ｂ
ｒａｎｃｈ命令が分岐ユニット６１により処理されるべ
きであり、またＳｔｏｒｅ命令がアドレス発生ＡＬＵ６
２により処理されるべきであることを判定する。この判
定に従って、Ｂｒａｎｃｈ命令のマスクフィールドＭお
よび変位フィールドＤは、分岐ユニット６１に供給され
る。同様に、このＢｒａｎｃｈ命令に対するレジスタＸ
のアドレスインデックス値およびレジスタＢのアドレス
基本値が汎用レジスタ６５から得られ、分岐ユニット６
１に供給される。本例においては、Ｘ値は０であり、基
本値はＲ７汎用レジスタから得られる。変位値Ｄは２０
の１６進値を持ち、一方マスクフィールドＭは、８のマ
スク位置の値を有する。

【００７３】分岐ユニット６１は潜在的分岐アドレス
（０＋Ｒ７＋２０）の計算を開始し、同時に前回のＣｏ
ｍｐａｒｅ命令から得られた条件コードを条件コードマ
スクＭと比較する。条件コード値がマスクコード値と同
じのときは、必要な分岐条件が得られ、その際分岐ユニ
ット６１により計算された分岐アドレスは制御ユニット
６０の命令カウンタにロードされる。この命令カウンタ
は、複合命令キャッシュ１２からの命令の取り出しを制
御する。一方、条件が満足されないときは（即ち、前回
の命令により設定された条件コードは８の値を有さな
い。）、如何なる分岐も取られず、また制御ユニット６
０の命令カウンタには如何なるアドレスも供給されな
い。

【００７４】分岐ユニット６１は、Ｂｒａｎｃｈ命令に
対するその処理作用を実施してビジーであると同時に、
アドレス発生ＡＬＵ６２は、Ｓｔｏｒｅ命令に対するア
ドレス計算（０＋Ｒ７＋０）を行ってビジーである。Ａ
ＬＵ６２により計算されたアドレスは、データキャッシ
ュ６６に供給される。分岐ユニット６１により分岐が取
られないときは、Ｓｔｏｒｅ命令が動作してＲ３汎用レ
ジスタのオペランドを、データキャッシュ６６のＡＬＵ
６２により計算されたアドレスに記憶する。一方、分岐
条件が得られ、分岐が取られたときは、Ｒ３汎用レジス
タの内容はデータキャッシュ６６には記憶されない。

【００７５】図１１の上記命令シーケンスは、例示のみ
を意図したものである。図１０のコンピュータシステム
の実施例は、他の各種の命令シーケンスを同様に処理す
ることができる。しかし、図１１の例は命令のどの対が
互いに並列に処理され得るかを判定する際の複合命令タ
グの効用を明らかに示すものである。

【００７６】１のタグビット値を有する命令と０のタグ
ビット値を有する続く命令との各々の対化は、並列実行
のための複合命令を形成し、即ちこのような対における
命令は互いに並列に処理可能である。２つの続く命令に
対するタグビットがそれぞれ１の値を持つときは、これ
らの命令の第１のものはそれ自身により非並列的に実行
される。最悪な場合には、シーケンス中の命令の全ては
１のタグビット値を有することになる。この最悪の場合
には、命令のすべては一度に１つずつ非並列的に実行さ
れる。

【００７７】本発明の好適な実施例に関連して上記に示
したハードウェアの例は、小さな範囲にわたって複合す
るものである。この点で、隣接命令の各々に対が解析さ
れてどの対が並列に実行され得るかを判定している。実
際、メモリ複合化は２つ以上のメモリにわたって多くの
複合化を検討し、採用のグループ分けを選択する可能性
を提供する。

【００７８】上記の例においては更に、命令がどこで始
まるかについての知識を仮定する複合方法を用いてい
る。一般的な場合は、命令境界は、上記のようにコンパ
イラにより、または実行前の命令復号化により識別する
ことができる。

【００７９】最後に、命令複合化ユニットは、特にＩ／
Ｏアダプタとメモリバスの間に配置されるものとして示
されている。この例は、メモリ複合化ユニットが動作し
得るメモリ内の他の位置を排除することを意味するもの
ではない。例えば、それはＩ／Ｏアダプタ内に吸収させ
ることができ、メモリバス９上の個別ユニットとして
（この位置では、それは主メモリ１０または複合メモリ
キャッシュ１２のいずれかで複合化することができる）
動作することができ、またはそれは主メモリバス９を介
してアクセスできない専用メモリポートを通して主メモ
リにのみ装着されたユニットで構成することができる。

【図面の簡単な説明】

【図１】本発明に従って構成されたディジタル・コンピ
ュータ・システムの要部の実施例を示す図である。

【図２】主メモリに複合タグ情報を記憶する実現法を示
す図である。

【図３】図１のコンピュータ・システムにおけるＩ／Ｏ
アダプタと主メモリの間のデータストリーム構造の詳細
を示す図である。

【図４】図３のデータストリーム構造における命令の転
送のためのタイミング図である。

【図５】命令に係る複合タグまたはタグフィールドを有
する命令ストリームの長さ、および命令に係る命令境界
フィールドを有する命令ストリームの長さを示す図であ
る。

【図６】図１のコンピュータシステムに使用可能な命令
複合化ユニットの実施例の内部構成の詳細を示す図であ
る。

【図７】図３の複合解析ユニットの各々に対する内部構
成を詳細に示す図である。

【図８】命令ストリームの初めの３つの命令に対する複
合タグを発生する図６の複合解析器およびタグ発生器を
実現するために使用される論理回路を例示する図であ
る。

【図９】図８の例の動作を説明する際に使用する表を示
す図である。

【図１０】ディジタル・コンピュータ・システムの要部
である多重機能命令処理ユニットにより複合命令が並列
に処理される方法を説明するために用いられる実施例を
示す図である。

【図１１】図１０のコンピュータシステムにより処理さ
れる特定の命令シーケンスの一例を示す図である。

【図１２】図１０のコンピュータシステムによる図１１
の命令シーケンスの処理を説明する際に使用する表を示
す図である。

【符号の説明】

１Ｉ／Ｏバス８アダプタ９（９ａ，９ｂ）メモリバス１０主メモリ１１，２０メモリ複合化ユニット１２複合メモリキャッシュ１３，１４，１５機能ユニット１６命令取出し送出ユニット２２〜２５複合解析器２６タグ発生器３０，３１命令コンパティビリティ論理３２，３３レジスタ依存性論理４０，４１，４５デコーダ６０取出し送出制御ユニット６１分岐ユニット６２アドレス発生ＡＬＵ６４依存性解消ＡＬＵ６５汎用レジスタ６６データキャッシュ

フロントページの続き (72)発明者スタマティス・バシリアディスアメリカ合衆国ニューヨーク州ベスタルベスタルロード 717 (72)発明者バソロメウ・ブラナアメリカ合衆国ニューヨーク州ニワークバレイダントンドライブ（番地なし) (56)参考文献特開平２−130635（ＪＰ，Ａ) 特開昭53−108254（ＪＰ，Ａ)

Claims

【特許請求の範囲】

【請求項１】複数の命令を並列に実行する手段を有する
ディジタル・コンピュータ・システムにおいて、被処理命令のグループを与える入出力インタフェース
と、複数の連続する命令を受ける複数命令の命令レジスタ
と、各々が命令レジスタ内の特定対の相並ぶ命令を解析
すると共に、前記対の２つの命令が並列に処理され得る
か否かを示す複合可能性信号を発生する複数の規則ベー
ス命令解析機構と、前記複合可能性信号に応答して前記
命令レジスタ中の各々の命令に対して複数のタグフィー
ルドからなる個別タグフィールドを発生するタグ発生機
構と、前記入出力インタフェース並びに前記命令複合化機構に
接続されて、前記複合化タグ情報を有する前記命令のグ
ループを記憶する主記憶装置とを備えるディジタル・コ
ンピュータ・システム。
【請求項２】特定の命令処理構成を有し、また各々の命
令解析機構は、当該コンピュータシステムに対して使用
される特定の命令処理構成における並列実行に対してど
のタイプの命令がコンパティブルであるかを定める規則
を実現する論理回路を備えており、この論理回路は解析
機構に対して複合可能性信号を発生する請求項１記載の
ディジタル・コンピュータ・システム。
【請求項３】２つ以上の命令を並列処理可能なディジタ
ル・コンピュータ・システムにおいて、被処理命令シーケンス中の命令グループを受信する手段
と、この受信する手段に接続され、前記命令のグループを受
信すると共に前記命令のグループのどの命令が並列処理
され得るかを示す複合化タグフィールドを前記命令のグ
ループに関係づける命令複合化機構と、前記命令複合化機構に結合され、前記命令のグループと
前記関係づけられた複合化タグフィールドとを受信する
共に記憶する記憶機構と、互いに並列に動作する複数の機能命令処理ユニットと、前記記憶機構に結合され、この記憶機構に記憶された命
令を、それらのタグフィールドが命令が並列に処理され
得ることを示すとき各々の機能命令処理ユニットに供給
する命令発生機構と、を備えるディジタル・コンピュータ・システム。
【請求項４】前記記憶機構は、前記命令を含む情報のブ
ロックを記憶する主メモリと、この主メモリに接続され
ると共に前記命令発生機構に接続されたキャッシュ記憶
機構とを備える請求項３記載のディジタル・コンピュー
タ・システム。
【請求項５】２つ以上の命令を並列処理可能なディジタ
ル・コンピュータ・システムにおいて、被処理命令シーケンス中の命令グループを受信する手段
と、この受信する手段に接続され、前記命令のグループを受
信すると共に前記命令のグループのどの命令が並列処理
され得るかを示す複合化タグフィールドを前記命令のグ
ループに関係づける命令複合化機構と、前記命令複合化機構に結合され、前記命令のグループと
前記関係づけられた複合化タグフィールドとを受信する
と共に記憶し、前記複合化タグフィールドを前記命令グ
ループの命令に付加するのに十分なワードサイズを有す
る主メモリを有する記憶機構とを備えるディジタル・コ
ンピュータ・システム。
【請求項６】２つ以上の命令を並列処理可能なディジタ
ル・コンピュータ・システムにおいて、被処理命令シーケンス中の命令グループを受信する手段
と、この受信する手段に接続され、前記命令のグループを受
信すると共に前記命令のグループのどの命令が並列処理
され得るかを示す複合化タグフィールドを前記命令のグ
ループに関係づける命令複合化機構と、前記命令複合化機構に結合され、前記命令のグループと
前記関係づけられた複合化タグフィールドとを受信する
と共に記憶し、前記命令グループを記憶する主メモリと
前記複合化タグフィールドを記憶するタグメモリとを有
する記憶機構とを備えるディジタル・コンピュータ・シ
ステム。
【請求項７】２つ以上の命令を並列処理可能なディジタ
ル・コンピュータ・システムにおいて、被処理命令シーケンス中の命令グループを受信する手段
と、この受信する手段に接続され、前記命令のグループを受
信すると共に前記命令のグループのどの命令が並列処理
され得るかを示す複合化タグフィールドを前記命令のグ
ループに関係づける命令複合化機構と、前記命令複合化機構に結合され、前記命令のグループと
前記関係づけられた複合化タグフィールドとを受信する
と共に記憶し、前記複合化タグフィールドのためのタグ
テーブルと複数の前記命令グループを記憶する個別セク
ションとを備える主メモリを有する、記憶機構とを備え
るディジタル・コンピュータ・システム。
【請求項８】２つ以上の命令を並列処理可能なディジタ
ル・コンピュータ・システムにおいて、被処理命令シーケンス中の命令グループを受信する手段
と、この受信する手段に接続され、前記命令のグループを受
信すると共に前記命令のグループのどの命令が並列処理
され得るかを示す複合化タグフィールドを前記命令のグ
ループに関係づける命令複合化機構と、前記命令複合化機構に結合され、前記命令のグループと
前記関係づけられた複合化タグフィールドとを受信する
と共に記憶し、前記命令グループを記憶する第１セクシ
ョンと前記複合化タグフィールドを記憶する第２セクシ
ョンとを有するページセクションを備える主メモリを有
する、記憶機構とを備えるディジタル・コンピュータ・
システム。
【請求項９】２つ以上の命令を並列処理可能なディジタ
ル・コンピュータ・システムにおいて、被処理命令シーケンス中の命令グループを受信する手段
と、この受信する手段に接続され、前記命令のグループを受
信すると共に前記命令のグループのどの命令が並列処理
され得るかを示す複合化タグフィールドを前記命令のグ
ループに関係づける命令複合化機構と、前記命令複合化機構に結合され、前記命令のグループと
前記関係づけられた複合化タグフィールドとを受信する
と共に記憶する記憶機構とを備え、前記命令グループは命令のページであるディジタル・コ
ンピュータ・システム。
【請求項１０】２つ以上の命令を並列処理可能なディジ
タル・コンピュータ・システムにおいて、被処理命令シーケンス中の命令グループを受信する手段
と、この受信する手段に接続され、前記命令のグループを受
信すると共に前記命令のグループのどの命令が並列処理
され得るかを示す複合化タグフィールドを前記命令のグ
ループに関係づける命令複合化機構と、前記命令複合化機構に結合され、前記命令のグループと
前記関係づけられた複合化タグフィールドとを受信する
と共に記憶する記憶機構と、前記記憶機構に接続され、複数の命令を取り出し、また
前記複合化タグフィールドに応じて複数の命令を並列に
実行する命令実行手段と、を備えるディジタル・コンピュータ・システム。
【請求項１１】前記命令実行手段は、前記命令複合化機
構と非同期的に動作する請求項１０記載のディジタル・
コンピュータ・システム。
【請求項１２】同時に複数の命令を実行できるディジタ
ル・コンピュータ・システムにおいて、所定グループの実行命令を記憶するメモリ機構と、このメモリ機構に接続され、同時に実行されるべき所定
の命令グループにおける命令を識別する複合化タグ情報
を発生する命令複合化ユニットと、前記メモリ機構に設けられると共に前記命令複合化ユニ
ットに接続され、複合化タグ情報を記憶する複合化タグ
情報記憶手段と、前記メモリ機構に接続され、複合化タグ情報に応じて単
独でまたは同時に命令を実行する命令実行手段とを備
え、前記命令複合化ユニットは、前記命令実行手段と非同期
であるディジタル・コンピュータ・システム。
【請求項１３】前記複合化タグ情報記憶手段は、タグメ
モリである請求項１２記載のディジタル・コンピュータ
・システム。
【請求項１４】前記複合タグ情報記憶手段は、タグテー
ブルである請求項１２記載のディジタル・コンピュータ
・システム。
【請求項１５】前記複合タグ情報記憶手段は、前記所定
命令グループに付加されたメモリ機構空間を備える請求
項１２記載のディジタル・コンピュータ・システム。