JPH04505823A

JPH04505823A - データ処理装置

Info

Publication number: JPH04505823A
Application number: JP3507370A
Authority: JP
Inventors: アイカーマイヤー、リチヤード・ジエームズ; ヴアシリイデイス、スタマテイス
Original assignee: インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン
Priority date: 1990-05-04
Filing date: 1991-03-29
Publication date: 1992-10-08
Anticipated expiration: 2009-10-12
Also published as: EP0545927B1; PL166513B1; DE69132271T2; HU216990B; WO1991017495A1; HU9200024D0; WO1991017496A1; JPH0679273B2; JPH04506878A; EP0545927A1; EP0545927A4; EP0481031A1; HUT60048A; PL293182A1; ATE194236T1; DE69132271D1; JPH0680489B2; EP0481031A4

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】異なる参照点情報を有するテキスト及びデータ処理用の装置と複合命令用の逆方向複合化装置とを有する異なる属性を有する命令プロセッサ用の命令を複合化するためのシステム関連特許出願の相互参照本出願は、優先権を請求し、１９９０年５月４日出願の米国特許出願第０７１５１９３８４号、１９９０年６月２６日出願ノ米国特許出願第０７１５４３４５８号、１９９１年１月１５日出願の米国特許出願第０７／６４２０１１号および１９９０年５月４日出願の米国特許出願第０７１５１９３８２号に対する米国一部継続出願に当たる。

本米国特許出願は、下記の同時係属の米国特許出願に関連している。

（１）１９９０年５月４日出願の発明の名称がｒｓｃａｌａｂｌｅＣｏｍｐｏｕｎｄ　Ｉｎ５ｔｒｕｃｔｉｏｎ　Ｓｅｔ　Ｍａｃｈｉｎｅ　Ａｒｃｈｉｔｅｃｔｕｒｅ」で、発明者がスタマティス・バシリアディス（ＳｔａｍａｔｉｓＶａｓｓｉｌｉａｄｉｓ）他の米国特許出願第０７１５１９３８４号（よりＭド’ｙ− ット番％ＥＮ９−９０−０２０）（２）１９９０年５月４日出願の発明の名称がｒ　ＧｅｎｅｒａｌＰｕｒｐｏｓｅ　Ｃｏｍｐｏｕｎｄ　Ｔｅｃｈｎｉｑｕｅ　Ｆｏｒ　Ｉｎ５ｔｒｕｃｔｉｏｎ−ＬｅｖｅｌＰａｒａｌｌｅｌ　ＰｒｏｃｅｓｓｏｒｓＪで、発明者がリチャード・Ｊ−アイケマイヤ−（Ｒｉｃｈａｒｄ　Ｊ、　Ｅｉｃｋｅｍｅｙｅｒ）他の米国特許出願第Ｏ７７５１９３８２号（Ｉ　ＢＭドケット番号ＥＮ９−９０−０１（３）１９９０年４月４日出願の発明の名称がｒＤａｔａＤｅｐｅｎｄｅｎｃｙ　ＣＣｏ１１ａｐｓｉｎ　Ｈａｒｄｗａｒｅ　ＡｐｐａｒａｔｕｓＪで、発明者がタマティス・バシリアディス他の米国特杆出願第０７１５０４９１０号（ＩＢＭドケット番号ＥＮ９−９０−０１４）（４）１９９０年５月１０日出願の発明の名称がｒｃｏｍｐｏｕｎｄｉｎｇ　Ｐｒｅｐｒｏｃｅｓｓｏｒ　Ｆｏｒ　Ｃａｃｈｅ−Ｊで、発明者がバーソロミュー・プラナ−（Ｂａｒｔｈｏｌｏｍｅｗ　Ｂｌａｎｅｒ）他の米国特許出願第０７１５２２２１９号（Ｉ　ＢＭドケット番号ＥＮ９−（５）１９９０年６月２６日出願の発明の名称がｒＡｎＩｎ−Ｍｅｍｏｒｙ　Ｐｒｅｐｒｏｃｅｓｓｏｒ　ｆｏｒ　ａ　５ｃａｌａｂｌｅ　ＣｏｍｐｏｕｎｄＩｎｓｔｒｕｃｔｉｏｎ　Ｓｅｔ　Ｍａｃｈｉｎｅ　Ｐｒｏｃｅｓｓｏｒ４で、発明者がリチャード・アイケマイヤー他の米国特許出願第０７１５４３４６４号（ＩＢＭドケット番号ＥＮ９−９０ −０１８）（６）１９９０年６月２６日出願の発明の名称がｒ　ＭｅｍｏｒｙＭａｎａｇｅｍｅｎｔ　ｆｏｒ　５ｃａｌａｂｌｅ　Ｃｏｍｐｏｕｎｄ　Ｉｎ５ｔｒｕｃｔｉｏｎ　ＳｅｔＭａｃｈｉｎｅｓ　Ｗｉｔｈ　Ｉｎ−Ｍｅｍｏｒｙ　Ｃｏｍｐｏｕｎｄｉｎｇ」で、発明者がリチャード・Ｊ・アイケマイヤー他の米国特許出願第０７１５４３４５８号（Ｉ　ＢＭドケット番号ＥＮ９−９０−０４２）（７）１９９０年１１月２８日出願の発明の名称がｒｏｖｅｒｆｌｏｗ　Ｄｅｔｅｒｍｉｎａｔｉｏｎ　ｆｏｒ　Ｔｈｒｅｅ−Ｏｐｅｒａｎｄ　ＡＬＵＳ　ｉｎ　ａＳｃａｌａｂｌｅ　Ｃｏｍｐｏｕｎｄ　Ｉｎ５ｔｒｕｃｔｉｏｎ　Ｓｅｔ　ＭａｃｈｉｎｅＪで、発明者がスタマティス・バシリアディス他の米国特詐出願第０７／６１９８６８号（ＩＢＭドケット番号ＥＮ９−９０−０３３）（８）１９９１年１月１５日出願の発明の名称がｒｃｏｍｐｏｕｎｄｉｎｇ　Ｐｒｅｐｒｏｃｅｓｓｏｒ　ｆｏｒ　ＣａｃｈｅＪで、発明者がスタマティス・バシリアディス他の米国特許出願第０７／６４２０１１号（ＩＢＭドケット番号ＥＮ９− ９０−０４９）（９）−一年一月一日出願の発明の名称がｒｓｙｓｔｅｍ　ｆｏｒＰｒｅｐａｒｉｎｇ　Ｉｎ５ｔｒｕｃｔｉｏｎｓ　ｆｏｒ　Ｉｎ５ｔｒｕｃｔｉｏｎ　Ｐｒｏｃｅｓｓｏｒ　ａｎｄＳｙｓｔｅｕ　ＷｉｔｈＭｅｃｈａｎｉｓｍ　ｆｏｒ　Ｂｒａｎｃｈｉｎｇ　ｉｎ　ｔｈｅ　Ｍｉｄｄｌｅ　ｏｆ　ａＣｏｍｐｏｕｎｄ　Ｉｎ５ｔｒｕｃｔｉｏｎＪで、発明者がスタマティス・バシリアディス他の米国特許出願節−−−−−−−−−号（ＩＢＭドケット番号ＥＮ９− ９０−０４０）これらの同時係属の特許出願及び本出願は、同一の譲受人、すなわち米国ニューヨーク州アーモンクのインターナショナル・ビジネス・マシーンズ・コーポレーション（Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｂｕｓｉｎｅｓｓ　Ｍａｃｈｉｎｅｓ　Ｃｏｒｐｏｒａｔｉｏｎ）が所有する。これら同時係属の特許出願に記述された記載を、引用により本明細書に合体する。

これら関連ケースを再検討すると、第１図および第２図は１９９０年５月４日出願の米国特許出願第０７１５１９３８４号に図示され、第３図は、１９９０年６月２６日出願の米国特奸出願第０７１５４３４５８号に記載され、第４Ｂ図は、１９９１年１月１５日畠願ノ米国特許ａ願第０７／６４２０１１号に一般的に記載され、第５図ないし第７図は、１９９０年５月４日出願の米国特許出願第０７１５１９３８２号に図示されていることがわかる。

口技術分野］本発明は、デジタル・コンピュータ及びデジタル・データ・プロセッサに関し、特に、２つ以上の命令を並列に実行することができるデジタル・コンピュータ及びデータ・プロセッサに関するものであり、命令とデータを別々に処理するアーキテクチャを使用するプロセッサ、命令とデータが混在できるプロセッサ、命令を識別する基準表示を有するプロセッサ及びこれを有さないプロセッサを含めて、様々な命令プロセッサ用の命令を複合化するシステム及び技法を詳述し、可変ワード長の命令を複合化するための逆方向複合化装置を提供するものである。さらに、２つまたはそれ以上の長さの複数命令の複合化が提供される。

［背景技術］命令のシーケンスを受け取り、１回に１命令ずつそのシーケンスを実行する従来型コンピュータは公知である。これらのコンピュータによって実行される命令は、単一の値のオブジェクトで作動し、したがって、これらのコンピュータには、「スカラー」という名称が用いられる。

従来型のスカラ一式コンピュータの動作速度は、回路技術、コンピュータ機構及びコンピュータ・アーキテクチャの進歩によって、その限界まで高速化されてきた。しかしながら、計算機の新しい世代ごとに、従来型のスカラ一式計算機用の新しい加速機構が発見されなければならない。

単一プロセッサの計算速度を加速するための最近の機構は、限られた非常に単純な命令セットを使用する縮小命令セット・アーキテクチャに見られる。もう１つの加速機構は、最小限の１組の複雑な多重オペランド命令セットに基づく、複合命令セット・アーキテクチャである。これらのどちらかの手法を既存のスカラ一式コンピュータに適用するには、計算機の命令セットとアーキテクチャを根本的に変更する必要がある。このような広範囲に及ぶ変更は、出費と停止時間を伴い、当初は計算機の信頼性と可用性が低下する恐れがある。

命令セットの縮小によって実現される利益のいくつかをスカラ一式計算機に適用しようとする努力の中で、いわゆる「スーパースカラー」コンピュータが開発された。これらの計算機は、基本的にはスカラ一式計算機であるが、単一スカラー命令のシーケンスを含む命令ストリームから複数の命令を同時に実行するよう適合させることによって、その性能を向上させたものである。通常、これらの計算機は、スカラー命令のシーケンス中の２つ以上の命令を並列に実行できるか否かを、命令実行時に判断する。この判断は、その命令の命令コードと、命令間に存在するデータ依存性に基づいて行われる。命令コードは、ある命令に必要な計算ハードウェアを示す。一般に、同一のハードウェア（ハードウェア依存性）または同一のオペランド（データ依存性）を利用する２つ以上の命令を同時に実行することはできない。これらのハードウェア依存性とデータ依存性のため、ある種の命令の組合せの並列実行が妨げられる。これらの場合、影響を受ける命令は、逐次実行される。そのため、もちろん、スーパースカラー計算機の性能は低下する。

スーパースカラー計算機にはいくつかの短所があり、それらを最小限に抑えることが望ましい。どの命令が並列に実行できるかを命令実行時に判断する際に、一定量の時間が消費される。この時間は、他の計算機動作とオーバーラツプさせることによって容易に解消できない。この欠点は、命令セット・アーキテクチャの複雑さが増加するにつれて顕著になる。

また、同一の命令を実行しようとするたびに並列実行の判断を繰り返さなければならない。

既存のスカラ一式計算機の耐用寿命を伸ばすには、実行を加速するためのあらゆる手段が重要である。しかし、縮小命令セット・アーキテクチャ、複合命令セット・アーキテクチャ、またはスーパースカラー技法による加速は、既存のスカラー計算機用としては、潜在的にコストが高すぎるか、不利益が多すぎる。命令セットの変更や、計算機アーキテクチャの変更や、命令実行に必要な時間の延長を必要とせず、既存の命令セット中の命令を並列にまたは同時に実行することによってこのような計算機の実行速度を加速することが好ましい。

［発明の概要コ本発明者等は本明細書及び参照された特許出願で、それらのシステム及び技法が既存のプロセッサの機能強化及びその更に進んだ開発を可能にすると同時に、機能強化されたプロセッサがその先行プロセッサ用に開発されたコードをより効率的に実行できるようにすることを前提とする、命令プロセッサ用の命令の複合化に関する諸発明について詳述した。しかしながら、本明細書に記述するこれら諸発明の背景に焦点を当てる時、本発明者等及び他の著者が他所で記述したこれらすべての開発において、本明細書に記載の諸発明の利益を適用しなければ、コンピュータによって実行される命令セットまたはプログラムの処理中に、どのように命令を組み合わせればこれら諸発明が適用できる可能な様々なアーキテクチャ用の複合命令にすることができるかを判断する必要が満たされないままになることが認識されるべきである。現在、ＲＩＳＣやＳ／３７０を含めて多（の種類のアーキテクチャがあり、データが命令と混在するものと、そうでないものがあり、可変長命令を有するものと、そうでないものがある。将来の計算機にも、２つの並列命令だけを処理できるものと、より長い命令を処理できるものがあろう。

これらの相違のゆえに多くの問題を解決する必要があるが、これらの問題は、本明細書で対象とし詳述する諸発明によって解決された。

本明細書に記載の諸発明は、元のプログラムを、命令の並列処理が可能な計算機によって実行できるように実施された元のプログラム機能に適合する並列および単一の命令として処理できるシステムによってこの目的を達成する。本発明者等は、既存の高水準言語で記述された既存のプログラムまたは既存のアセンブリ言語プログラムを、プリプロセッサによって処理する方法を提供した。このブリプロセッサは、複合命令を命令として並列に実行できるように設計されたコンピュータ内で、単一の複合命令として実行できる命令シーケンスを識別することができる。

この命令プロセッサは、スカラー計算機の一連の基本命令に対する複合化復号を実行し、一連の複合命令を生成し、複合命令の取出しと、取り出された複合命令及び必要な単一命令の復号を実行し、複合命令を含むプログラムがシステム上で実行される時にスカラー計算機の基本命令のスカラー実行を元のままに保つ複合命令プログラムを提供する。このシステムは、複合命令の途中で分岐するための機構も提供する。

複合命令の途中で分岐する場合、制御ビットが付加されているかどうか複合命令を検査する。複合命令の途中に分岐が存在し、それがプログラムの内部関係に応じて記録された結果に悪影響を及ぼす場合に、正しさに影響を及ぼす複合命令の命令単位の実行を無効にする無効化機構が提供される。

本明細書に詳述する諸発明は、基本アーキテクチャが異なる属性を有する場合に、実行されるプログラム内の命令に制御情報を付加する方法を教示する。本明細書に記載の諸発明が対象とするのはこの目的である。本発明者等は、複合命令を実行できるように設計されたコンピュータ内で単一の複合命令として実行できる命令のシーケンスを識別できるソフトウェアによって、既存の高水準言語で記述された既存プログラムまたは既存のアセンブリ言語プログラムを処理する方法を提供した。

本明細書に開示する複合化を達成するための基本装置は、スケーラプル複合命令セット計算機に関する前記の同時係属の諸特許出願に詳述されているが、システム上で複合化を実施するに当っては困難な問題が存在する。「好ましい実施例の詳細な説明」の項で好ましい基本システムを詳述した後に、システム・ハードウェアと複合化ファシリティを相互に接続して、それを広範囲のシステムに適用できるようにする進歩について述べる。前記システムのうちの１つが、ＩＢＭＳ／３７ｏアーキテクチャであり、親基本命令プロセッサとして働き、その後、アーキテクチャ内にオーバーラツプ式命令セットを有する後続プロセッサと共に使用することができる。

したがって、このより新しい命令プロセッサは、本システムに関連して企図される特定の複合化規則セットを有することができる。複合化全般について本発明者等が対象とした問題は、入ってくる命令とデータを、複合化ファシリティによって検査される連続するバイト・ストリームとして処理する方法に関するものである。複合化ファシリティは、命令プロセッサ上で実行される複合命令セット・プログラムを生成する。

遭遇する可能性のあるある種の問題を解決するために、本発明者等は、異なる部分的な参照点情報を有し、異なる属性を有するアーキテクチャ、及びテキストとデータを処理するアーキテクチャを扱うための、本明細書で詳細に説明する装置を備えた、本明細書で詳述する新しいシステム・ハードウェアを作成した。

この「発明の概要」の項では、下記の「好ましい実施例の詳細な説明」の項で説明する新システムを作成する際に発見し、処理した相互関係の種類を説明する。

本発明者等の研究は、現在異なるアーキテクチャを使用している諸システムのための解決策をもたらした。

このようなシステムの１つは、複合化すべきバイト列がその命令ストリング内にデータ・バイトを含まないことが公知であり、最初の命令の命令コードなど、参照点の位置が公知のシステムである。この種のシステムは、現在では通常、ＲＩＳＣアーキテクチャ計算機であるが、他の特定のケースも存在し得る。この状況は、元のプログラムのコンパイルに特定のコンパイラを使用した結果生じることがある。さらにテキストの短い部分で有用な仮定として使用される場合、ここで説明する技術はこの問題を解決する。

この問題に対する本発明者等の解決策は、この技法とシステムを利用した結果、命令とデータの両方が元のテキスト・バイト・ストリーム内にあるが、それらが既知の境界にあるケースも解決されるので、最善のケースの解決策となった。

したがって、本発明者等は、特定のアーキテクチャに対して複合化できる命令のクラスが提供されるアーキテクチャ的複合化規則を有するシステムを提供した。

適用可能な複合化規則を基本命令シーケンスの命令のバイト・ストリームに適用し、基本命令シーケンスのバイト・ストリームを命令コードを含むかどうか検査し、複合化規則を適用しながらそのストリームを走査する。この複合化動作の間、命令長コードの検査の後に複合化ファシリティの命令複合化ユニットが各命令を識別し、１組の複合化された命令の先頭の複合命令を示す複合命令用のタグ・ビット情報を生成し、複合化ファシリティが複合化を継続する際に、その出力が、複合命令の複合シーケンスを複合プログラムとして供給する。命令プロセッサがこれを使って、従来の計算機ではスカラー命令として実行されたはずの命令である複合命令部の単位を並列に実行できるようにし、それと同時に、データと命令の混在に関連する問題、古典的手段による未知の境界、及び現代のより洗練されたアーキテクチャが遭遇する他の問題を処理する。

いくつかの状況では、命令内に存在するハーフワードは、そのハーフワードが最初の複合命令ではないことを示すように初期設定される。前記の複合化規則に従って、複合化に最適の対を選ぶ。複合化を排除する状況が発生することが発見されると、本システムは、複合化できない命令を含み、複合化すべき命令を選択する技法を使用し、検査されるある種の命令にタグを付けて、特定の命令が最初の命令でないことを示し、検査中の１組の命令中の最初の命令が最初の複合命令として適切でない場合には、その命令が最初の命令ではないことを示すマークをその命令に付ける。本システムは、検査し終えたばかりのグループ内の次の逐次命令を含む後続の命令グループの検査を続行する。

命令が非命令またはデータと混在している時は、本システムは各ハーフワードに、命令の第１バイトを含むとのマークまたは複合命令の第１バイトを含まないとのマークのいずれかを付け、複合化処理の際に、複合命令の第１バイトを含まないとマークを付けた命令を飛び越す。

「詳細な説明」の項を読めば、参照点のない複合命令が存在する場合、すなわち複合化がより複雑になる場合に、本システムで何が行われるかが理解されよう。

検査中の基本命令セット・ストリーム内に複合化すべき命令部の境界があり、それぞれが複数の可能な命令シーケンスを有する場合には、各シーケンスごとに可能な境界が決定され、複数の可能なシーケンスの論理和をとる新しいハードウェアによって、複数のシーケンスが単一のビット・シーケンスに縮がされる。

通常、Ｓ／３７０型システムには、潜在的な境界を有する３つの可能な命令のシーケンスがあり、そのそれぞれが異なる複合化ビットのシーケンスを生じる。したがって、新システムは、論理和をとると単一のシーケンスを生じる３ビツト・シーケンスを処理して、現命令が命令プロセッサによって複合化されるか否かを判定することができる。

本発明者等は、バイト境界上で収れんするかどうか複数の可能なシーケンスを実験的に試し、収れんが検出された時は、１つのシーケンスだけが残るまで、収れんするシーケンスを１つずつ除去してシーケンスの数を減らすシステムを提供した。

認識する必要のある第２のより高水準の問題は、非ＲＩＳＣアーキテクチャを有する計算機では、１つのバイト・ストリーム内に命令とデータを混在させることが可能である。その結果、複合命令バイト・ストリームは、追加情報なしで正しく複合化されることができる。これは、命令とデータが混在するバイト・ストリームが存在し、命令がどこから始まるかが不明である場合に発生する最悪の場合であると本発明者等は考える。本発明者等の提供するハードウェアは、この種のシステムに対応できる。従来のより一般的な例と同様に、収れんテストを行い、収れんが発生し、あるシーケンスが収れんによって除去される場合には、収れんによって除去されたシーケンスの代わりに新しいシーケンスが開始される。この場合も、シーケンスはあらゆるハーフワードで開始する。

１組の命令を検査し、複合化ビットを決定し、シーケンス内のあるバイト数だけ後からこの検査プロセスを繰り返して、各シーケンスからの複合化ビットの論理和をとって合成複合ビット命令を形成する。

さらに、ＩＢＭ　Ｓ／３７０型のアーキテクチャなどより進んだ命令プロセッサ・アーキテクチャは、可変長命令を処理することができる。このアーキテクチャを有するより進んだ計算機用のプログラムを形成するための命令複合化は、困難であり、最高次の最悪の場合の代表と見なすことができる。

というのは、バイトの列が命令だけを含んでいることがわかっているとしても、その列のある命令の先頭をどうすれば識別できるかが明らかではないからである。このような状況は、現在のＳ／３７０命令プロセツサの特徴である。というのは、このような命令プロセッサは、命令取出しプロセス中にキャッシュ内の命令を識別する手段を有するからである。

本明細書に記載の好ましいシステムでは、Ｓ／３７０と同様にキャッシュを有する複合化ファシリティが設けられ、好ましいシステムは、キャッシュを有し、キャッシュ・ミスまたはある行のまだ複合化されていない部分への分岐が可能なので、複数の命令が、命令の複合化なしに前記命令プログラムを介して中央処理装置に供給される。

上記のＳ／３７０システム・アーキテクチャ複合化ファシリティは、バイト・ストリームを検査し、データに遭遇すると、そのデータが命令からなるかのようにデータを複合化する。しかし、Ｓ／３７０アーキテクチヤの計算機は、データを実行することができない命令プロセッサを有するので、したがって、複合命令プログラムを正しく実行する。検査される命令に特定の命令が最初の命令でないことを示すタグをつけ、検査中の１組の命令中の最初の命令が最初の複合命令として適切でない場合には、その命令が最初の命令ではないことを示すマークをその命令に付ける。本明細書で詳述するシステムは、検査を終えたばかりのグループ内の次の逐次命令を含む後続の命令群を検査する。この複合化ファシリティは、複合化プロセスで、複合命令の第１バイトを含まないとのマークを付けた命令をスキップする。

また本発明者等が発見したもう１つの技法は、複合化がより複雑になる、参照点のない命令を複合化する方法である。

Ｓ／３７０型プロセツサは参照点を有することができるが、可変長命令を予想しているプログラムが可能であり、したがって、最初の命令の参照点が存在しない可能性がある。検査中の基本命令セット・ストリーム内のどこに命令境界があるかが不明で、命令の可能なシーケンスが複数存在する場合には、各シーケンスが複合化ファシリティ・ハードウェアで処理されて、その可能な境界が決定され、得られた複数のシーケンスが、複数の可能なシーケンスの論理和をとることによって、単一のビット・シーケンスに縮小される。Ｓ／３７０型命令プロセツサの場合、システムが３ビツト・シーケンスをもたらし、これらの論理和をとって単一のシーケンスを生成して、現命令が本明細書で詳述する命令プロセッサによって複合化されるか否かを判定することが好ましい。

複合化ファシリティ用の基本命令処理装置を使用して、メモリから命令群を取り出すプロセスで、検索の直後、検査の前に、それらの命令が命令であってデータではないとのマークを付ける。さらに、複合化ファシリティは、複合グループ命令を構成する命令の数を示す命令の複合ビットを提供する。

これを用いると、２個だけでなく、より進んだ計算機用の複数の複合命令を処理することができる。各複合命令内で、その複合命令に対して提供されるタグ情報が、その複合命令のメンバ命令単位に適用可能なビット情報を有し、その特定のメンバ単位が後続の命令と複合化されるか否かを示す。

本システムに組み込まれることができる追加の他の実施例もある。システム命令プロセッサの中央演算処理装置は、実行中に複合命令の第１命令部のタグ情報以外のすべてのタグ情報を無視することができる。検査の間に、実行されないバイトに未検査のマークを付けることができ、その場合、そのコードが後で命令プロセッサによって実行できるのであれば、それらを再検査する。検査中、実行されないバイトを検査済み状態に残しておき、それらが実行中に無視されるか実行されない場合であっても、位置の正しさを示すことができる。

検査中、後で他のシーケンスを検査できるように、バイト群を一部検査済みシーケンスの状態に残しておくこともできる。

上記及びその他の改良は、以下の詳細な説明に詳述されている。本発明及びその利点と特徴とをよりよく理解するため、詳細な背景について、関連特許を参照されたい。さらに、特に本明細書に記載の改良については、以下の説明及び添付の図面を参照されたい。

［図面の簡単な説明］第１図は、同時実行のためスカラー命令のシーケンス内の命令を複合化することのできる高水準計算機システムの概略図である。

第２図は、複合命令ストリーム内で選択的にグループ化された命令群の並列実行を示す単一プロセッサの動作タイミング図である。

第３図は、動作環境の好ましい他の実施例として示されたインメモリ処理を有するスケーラプル複合命令セット計算機の階層的メモリ機構のブロック図である、。

第４Ａ図は、複合命令を実行するように設計されたコンピュータ内で単一の複合命令として実行されることができる命令のシーケンスを識別するために既存プログラムを処理する手段を提供する高水準処理の概略図である。

第４Ｂ図は、本発明の好ましい動作環境と、その環境内での本発明の位置を示す図である。

第５図は、元のプログラム・コードから実際の実行までにプログラムが取る経路を示す図である。

第６図は、アセンブリ言語プログラムからの複合命令セット・プログラムの生成を示す流れ図である。

第７図は、複合命令セットの実行を示す流れ図である。

第８図は、複合命令実行エンジンを示す図である。

第９図は、複合命令プログラムを示す図である。

第１０図は、分岐先が複合命令の先頭または途中にある状況を示す図である。

第１１図は、複合化が最善の場合の例を示す図である。

第１２図は、参照点を有する例を示す図である。

第１３図は、好ましい実施例による複合化が最悪の場合の例を示す図である。

第１４図は、最悪の場合の複合化装置の論理的実施様態とハードウェア実施様態を示す図である。

第１５図は、逆方向複合化を示す図である。

第１６図は、グループ当たり４個の命令を有する最悪の場合の複合化の例を示す図である。

［好ましい実施例の詳細な説明コ第１図を参照すると、本発明に従って構成されたデジタル・データ処理システム月のデジタル・コンピュータ・システムの一部分の代表的な実施例が示されている。このコンピュータ・システムは、２個以上の命令を並列に実行することができる。このシステムは、並列または同時実行のために命令を複合化する能力を備える。これに関連して、「複合化」とは、スカラー命令のシーケンス内の複数の命令をグループ化することを指し、グループ化のサイズは、１からＮまでスケーラプルである。例えば、このスカラー命令のシーケンスは、ＩＢＭ　システム／３７ｏ製品で使用されるものなど既存の１組のスカラー命令から引き出すことができる。

最高Ｎ個の命令からなるグループの同時実行をサポートするため、このコンピュータ・システムは、同時に並列に動作し、それぞれが独自に１つまたは複数のタイプの機械レベル命令を処理できる複数の命令実行ユニットを含む。

一般に第１図に示すように、命令複合化ユニット２ｏは、２進スカラー命令のストリーム２１を受け取り、隣接するスカラー命令の一部を選択的にグループ化して、コード化された複合命令を形成する。したがって、その結果得られる複合化された命令ストリーム２２は、単独で実行されるスカラー命令、または並列に実行されるスカラー命令のグループによって形成される複合命令を供給する。スカラー命令が命令処理ユニット２４に提示される時、それが複数の実行ユニットのうちの適当な１つに経路指定されて、逐次実行される。複合命令が命令処理ユニット２４に提示される時は、そのスカラー構成要素が、それぞれ適当な実行ユニットに経路指定されて、同時に並列に実行される。典型的な機能ユニットには、演算論理装置（ＡＬＵ）２６及び２８、浮動小数点演算装置（ＦＰ）３０．及びメモリ・アドレス生成装置（ＡＵ）３２が含まれるが、それだけに限られるものではない。

複合化は、サイクルごとに複数の命令を処理できるすべてのコンピュータ・アーキテクチャで、命令の並列の発行及び実行を容易にするように意図されていることを理解されたい。

第２図を参照すると、複合化は、各機能ユニットがスカラー命令（Ｓ）または複合命令（Ｃ３）を実行する単一プロセッサ環境で実施することができる。図に示すように、スカラー命令と複合化スカラー命令のシーケンスを含む命令ストリーム３３は、各複合命令に関連する制御タグ（Ｔ）を有する。

したがって、第１のスカラー命令３４は、サイクル１で機能ユニットＡによって単独に実行でき、タグＴ３で識別される３つ組の複合命令３６は、サイクル２で機能ユニットＡ、　Ｃ及びＤによってその３つの複合化スカラー命令が並列に実行でき、タグＴ２で識別されるもう１つの複合命令３８は、サイクル３で機能ユニットＡ及び已によってその２つの複合化スカラー命令が並列に実行でき、第２のスカラー命令４０は、サイクル４で機能ユニットＣによって単独に実行でき、大きなグループの複合命令４２は、サイクル５で機能ユニットＡないしＤによってその４つの複合化スカラー命令が並列に実行でき、第３のスカラー命令４４は、サイクル６で機能ユニットＡによって単独に実行できる。

複合命令を処理するために適合させることのできるコンピュータ・アーキテクチャの１例は、ＩＢＭ　システム／３７０命令レベル・アーキテクチャである。このアーキテクチャでは、各マシン・サイクル内で複数のスカラー命令を発行して、実行させることができる。これに関連して、マシン・サイクルとは、１スカラー命令を実行するのに必要な単一のパイプライン段を指す。命令ストリームが複合化される時、隣接するスカラー命令は、同時または並列に実行するために選択的にグループ化される。

一般に、命令複合化ファシリティは、並列に実行できる命令クラスを探す。互換性のある命令のシーケンスが見つかった時、複合命令が生成される。

複合化技法は、他の特許出願で検討されている。複合化を一般的に理解するには、１９９０年５月４日出願の米国特許出願第０７１５１９３８４号（ＩＢＭドケット番号ＥＮ９−９０−０２０）及び１９９０年５月４日出願の発明の名称力ｒＧＥＮＥＲＡＬ　ＰＵＲＰＯ５Ｅ　ＣＯＭＰＯＵＮＤＩＮＧ　ＴＥＣＨＮＩＱＵＥ　ＦＯＲＩＮＳＴＲＵＣＴＩＯＮ−ＬＥＶＥＬ　ＰＡＲＡＬＬＥＬ　ＰＲＯＣＥＳＳＯＲ５Ｊ　テア６米’５ｎ許出願第０７１５１９３８２号（ＩＢＭドケット番号ＥＮ９−９０−０１９）を参照されたい。１対ずつの複合化用の命令複合化ユニットの例が、１９９０年６月２６日出願の米国特許出願第０７１５４３４６４号（Ｉ　ＢＭドケット番号ＥＮ９−９０−０１８）に示されている。

一般に、命令発行前のある時点で複合化を行って、何回も実行される１つまたは複数の命令に対してこの処理が１回で済むようにすることが有用である。コンパイルの後、命令発行の前にハードウェアでの複合化を実施するために、コンピュータ・システムの実記憶域内に命令複合化機能を置くことが提案されている。このような複合化は、本明細書に記載の他の代替案よりも対する好ましい代替案と考えられ、これを「インメモリ複合化」と称する。これは、１９９０年５月１０日出願の米国特許出願第０７１５２２２１９号（Ｉ　ＢＭドケット番号ＥＮ９− ９０−０１２）　と、１９９０年６月２６日出願の米国特許出願第０７１５４３４６４号（ＩＢＭドケット番号ＥＮ９−９０−０１８）及びその第３図に示されている。また、背景として本明細書に記載するメモリ管理は、１９９０年６月２６日出願の発明の名称がｒＭＥＭＯＲＹＭＡＮＡＧＥＭＥＮＴ　ＦＯＲ５ＣＡＬＡＢＬＥ　ＣＯＭＰＯＵＮＤ　ｌＮ５ＴＲＵＣＴＩＯＮ　ＳＥＴＭＡＣＨＩＮＥＳ　ＷＩＴＨＩＮ　ＭＥＭＯＲＹ　ＣＯＭＰＯＵＮＤＩＮＧＪである米国特許出願第０７１５４３４５８号（Ｉ　ＢＭドケット番号ＥＮ９−９０−０４２）にも記載されている。

インメモリ複合化は、第３図に全体的に示されている。第３図で、階層的メモリ機構は、補助記憶装置及びコンピュータの実メモリとインターフェースする入出力アダプタ４０を含んでいる。この機構の実メモリには、中速で比較的大容量の主記憶装置４６と、高速で比較的小容量の命令キャッシュ４８が含まれる。（本明細書では、主記憶装置とキャッシュを総称して、「実メモリ」、「実記憶域」または単に「メモリ」と称する。）命令のストリームは、補助記憶装置から入出力アダプタ４０によって取り込まれ、主記憶装置４６内の「ページ」と称するブロックに記憶される。「行」と称する隣接したＩＭの命令が、主記憶装置４６から命令キャッシュ４８に移動され、そこで命令取出し／発行ユニット５ｏによる処理のため高速参照に使用できる。キャッシュから取り出された命令は、発行され、５２で復号された後に、実行のため機能ユニット５６．５８１４０１．６０に渡される。

実行中、プログラム内にある命令に対する参照が行われる時、その命令のアドレスがキャッシュ管理ユニット６２に供給される。キャッシュ管理ユニット６２は、このアドレスを使って、アドレスされた命令を含む１つまたは複数の命令を命令キャッシュ４８から取り出してユニット５０内の待ち行列に入れる。アドレスされた命令がキャッシュ内にある場合は、キャッシュ「ヒツト」が発生する。そうでない場合は、キャッシュ「ミス」が発生する。キャッシュ・ミスの場合、キャッシュ管理ユニット６２は、要求された命令の行アドレスを記憶管理機能群６４に送る。この記憶管理機能群６４には、たとえば、キャッシュ管理ユニット６２の供給する行アドレスを使って、アドレスされた行を含むページが主記憶装置４６内にあるか否かを判定する実記憶管理機能を含めることができる。そのページが実メモリ内にある場合、実記憶管理機能は、その行アドレスを使って、キャッシュ・ミスになっている命令を含む行を、主記憶装置４６から命令キャッシュ４８に転送する。要求された命令を含む行が主記憶装置内にない場合は、オペレーティング・システムが別の記憶管理機能を活動化し、必要な行を含むページの識別をそれに供給する。上記の記憶管理機能は、その行を含むページを識別するアドレスを入出力アダプタ４ｏに送る。入出力アダプタ４０は、補助記憶装置からそのページを取り込み、それを主記憶装置４６に供給する。取り出されたページ用の場所をあけるために、記憶管理機能は、取り出されたページで置換すべき主記憶装置４６内のページを選択する。ＳＣｌ５Ｍアーキテクチャでは、置換されたページは、タグ情報を複合化せずに入出力アダプタを介して補助記憶装置に返すことが企図されている。このようにして、ある命令シーケンスの実行中に即座に必要になる可能性の最も高い命令群が、命令キャッシュ４８内の機能ユニットに隣接する位置にくる。この階層的メモリ機構は、必要とされるがキャッシュ内にない命令を高速に検索する能力を提供する。

ＳＣｌ５Ｍアーキテクチャの環境では、インメモリ命令複合化は、命令複合化ユニット７０によって提供されることができる。この命令複合化ユニット７０は、機能的に入出力アダプタ４ｏと主記憶装置４６間にあり、従って、スカラー命令ストリームの複合化を、主記憶装置４６への入力または主記憶装置４６内で行うことができる。この記憶位置では、ページ取出し進行中に命令は複合化されることができる。

代りに、命令複合化ユニットは、主記憶装置４６と命令キャッシュ４８間の位置７２を占有することができ、複合命令は、命令キャッシュ４８から取り出される際に、行ごとに形成される。これは、好ましい実施例と見なせる。

分岐を伴う複合命令の実行分岐の存在する複合命令を、他の命令と同様に命令を静的に解析した後に実行することを含めて、処理後に複合命令を実行する必要が存在する。本発明者等は、前もって命令を復号し、プログラム内の実行すべき命令に制御情報を付加する。

さらに、複合命令プログラムを形成するためのプログラム複合化規則を提供してこの目的を達成すると同時に、現代のコンパイラに供給されるものに匹敵するアーキテクチャ情報が供給される。

解析中に、ある分岐クラスのすべてのメンバを他の命令と同様に静的に解析して、計算機で実行中に作動することが保証される命令の複合実行を実現する。分岐を処理する好ましい方法については、後で第９図及び第１０図を参照しながら説明する。その環境を理解するには、複合化の好ましい方法について考察することが適切である。

どんな複合化の技法を使用するかは、設計上の選択の問題である。しかし、例示のため、隣接するスカラー命令から形成される複合命令を生成する１つの技法について説明する。

これは、前記の米国特許出願第０７１５４３４５８号に示されたものである。例えば、命令は、テキストの６バイト（３ハーフワード）、４バイト（２ハーフワード）または２バイト（１ハーフワード）を占めることができる。この例では、可変長命令を含む命令セットを複合化するための規則が、長さ２バイトまたは４バイトのすべての命令が、互いに複合化可能であると規定している。すなわち、２バイト命令は、この特定の例では、別の２バイト命令または別の４バイト命令と並列に実行することができ、４バイト命令は、別の２バイト命令または別の４バイト命令と並列に実行することができる。この規則はさらに、６バイト長の命令は、すべて複合化できないと規定している。したがって、６バイト命令は、単独でしか実行できない。もちろん、複合化は、この規則の例に制限されるものではなく、所定のコンピュータ・アーキテクチャ用の特定の構成内に存在する命令を並列に実行するための判定基準を規定する複数の規則を含むことができる。

この例で使用する命令セットは、システム／３７０アーキテクチヤから採ったものである。各命令の命令コードを検査することによって、その命令コード内の命令長コード（ＩＬＣ）から、各命令の長さを決定することができる。さらに、命令のタイプは、他の命令コード・ビット内に規定されている。命令のタイプと長さが決定されると、特定の命令が並列実行のために他の１つまたは複数の命令と複合化されるか、それとも単独で実行されるかを示すためにその特定の命令用のタグ・ビットを含む複合化タグが生成される。

この例（限定されていない）では、２つの隣接する命令が複合化できる場合、メモリ内で生成されるタグ・ビットは、複合化された最初の命令では”１″、複合化された第２の命令では″Ｏｕとなる。しかし、第１および第２の命令が複合化できない場合は、最初の命令のタグ・ビットが１７０７′になり、その後に第２および第３の命令が、複合化できるかどうか検討される。選択された複合化技法に従って命令バイト・ストリームが処理され、様々なスカラー命令に対する複合化ビットがコード化された後、命令のより大きなグループを見るためのより大きなウィンドウを使用し、複合化に最善のＮ個の命令の組合せを取り上げることによって、並列実行を達成するためにより最適な結果を得ることができる。

しかしながら、本明細書で解決される問題の例として上記の例を取り上げると、一般に、第４図に全体的に示したシステム及び処理を提供する必要があると考えられる。第５図に関して述べる既存の高水準言語で記述された既存のプログラム、または第６図に関して説明されたように処理すべき既存のアセンブリ言語プログラムを処理する必要がある。そこで本発明者等は、複合命令を実行できるように設計されたコンピュータ内で単一の複合命令として実行できる命令のシーケンスを識別する能力を有するシステムを提供した。

第４図に移ると、システムとハードウェア・アーキテクチャの両方に反映する１組の規則に基づいて複合命令プログラムを作成する複合化ファシリティに、プログラムが入力として供給されるシーケンスが図示されている。好ましい複合化ファシリティは、１９９１年１月１５日出願の米国特許出願第０７／６４２０’ｌ１号（Ｉ　ＢＭドケット番号ＥＮ９−９０−０４９）に示されている。これらの規則を、以下では複合化規則と称する。複合化ファシリティによって作成されたプログラムは、その後、第８図に全体的に示す複合命令実行エンジンによって直接実行されることができる。

しかしながら、第５図は、あるプログラムがたどる高水準ソース・コードから実際の実行までの典型的な経路を示しており、第４図で示唆される可能な機構の１つと見なすことができる。アセンブリ水準プログラムに関する他の例については、第６図に関して説明する。

第５図を参照すると、コンピュータ・システム内には、ソフトウェアとハードウェアの両方で、複合化が発生できる位置が多数あり得ることが理解されよう。そのそれぞれに独自の長所と短所がある。第５図に示すように、プログラムがソース・コードから実際の実行までに典型的にたどる様々な段階がある。コンパイル段階の間に、ソース・プログラムが機械コードに変換され、ディスク４６に記憶される。実行段階の間に、そのプログラムがディスク４６から読み出され、特定のコンピュータ・システム構成５０の主記憶装置４８にロードされる。コンピュータ・システム構成５０内では、適当な命令処理ユニット５２．５４．５６によって命令が実行される。複合化は、この経路上のどこでも行うことができる。

一般に、複合化を行う位置が命令処理ユニットまたはＣＰＵに近ければ近いほど、時間の制約が厳しくなる。複合化の位置がＣＰＵから遠ければ、それだけ多くの命令を大きなサイズの命令ストリーム・ウィンドウ内で検査して、複合化のための最善のグループ化を決定し、実行性能を向上させることができる。しかしながら、このような早期の複合化は、必要な開発労力と費用が増す点で、システム設計の残りの部分に及ぼす影響が大きくなる傾向がある。

第６図の流れ図は、システムとハードウェア・アーキテクチャの両方に反映する１組のカストマイズされた複合化規則５８に従ってアセンブリ言語プログラムから複合命令セット・プログラムの生成を示す図である。このアセンブリ言語プログラムは、複合命令プログラムを作成するソフトウェア複複合化ファシリティ５９への入力として供給される。所定の長さを有する連続した命令ブロックが、ソフトウェア複合化ファシリティ５９によって解析される。複合化が考えられている命令群を含むバイト・ストリーム内の各ブロック６０．６２．６４の長さは、複合化ファシリティの複雑さに応じて変わる。

第６図に示されるように、この特定の複合化ファシリティは、各ブロック内の” 　ｍ　”個の固定長命令について２元複合化を考慮するように設計されている。

第１ステツプは、第１および第２の命令が複合化可能な対をなすか否かを検討し、次に第２および第３の命令が複合化可能な対をなすか否かを検討し、次に第３および第４の命令が複合化可能な対をなすか否かを検討し、そのブロックの終りまでこれを繰り返すことである。様々な可能な複合化可能対０１〜Ｃ５が識別された後、複合化ファシリティは、複合化された命令の好ましいシーケンスを選択し、フラグまたは識別子ビットを使って、複合命令の最適シーケンスを識別することができる。

最適シーケンスが存在しない場合は、複合化可能な隣接するスカラー命令のすべてを識別して、様々な複合命令の間に位置する目標への分岐で、遭遇する複合化されたどの対をも活用できるようにすることができる（第１４図参照）、複数の複合化ユニットが利用できる場合、命令ストリーム内の複数の連続したブロックを同時に複合化することができる。

もちろん、命令の先頭を示すための既知の参照点が既に存在する場合には、複合命令を生成する目的で命令ストリームを前処理することも簡単である。本明細書では、参照点とは、テキストのどのバイトが命令の第１バイトであるかの知識を意味する。この知識は、命令境界の位置に関する情報を提供するマーキング・フィールドまたは他の標識によって得ることができる。多くのコンピュータ・システムでは、このような参照点は、コンパイル時にコンパイラによって、また命令取出し時にＣＰＵによってのみ明白に知られている。このような参照点は、特殊な基準タグ付は方式を採用しない限り、コンパイル時から命令取出しまでの間は知られていない。

第７図の流れ図は、ハードウェア・プリプロセッサ６６またはソフトウェア・ブリプロセッサ６７によって生成された複合命令セット・プログラムの実行を示す図である。複合命令を有するバイト・ストリームは、複合命令（ＣＩ）キャッシュ６８に流れ込む。このキャッシュ６８は、記憶バッファとして役立つ複合命令に対する高速アクセスを実現するＣＩ発行論理回路６９が、ＣＩキャッシュから複合命令を取り出し、個々の複合化された命令を適当な機能ユニットに発行して、並列に実行させる。

複合命令コンピュータ・システム内のＡＬＵ群などの命令実行ユニット（ＣＩ　ＥＵ）７１は、スカラー命令を単独で１回に１つ実行するか、または複合化されたスカラー命令を他の複合化されたスカラー命令と並列に実行する能力を有することを強調する必要がある。また、上記の並列実行は、コンピュータのアーキテクチャ及び特定のコンピュータ・システム構成に応じて、ＡＬＵ、浮動小数点（ＦＰ）ユニット７３、記憶アドレス生成ユニット（ＡＵ）７５などの異なるタイプの実行ユニット内で、または複数の同一タイプのユニット（ＦＰＩ、ＦＰ２など）内で行うことができる。

コンパイル後に複合化が行われる時は、コンパイラは、タグを用いて、どのバイトが命令の第１バイトを含み、どれがデータを含んでいるかを示すことができる。この余分の情報は、正確な命令位置がわかるので、より効率的な複合化装置をもたらす。もちろん、コンパイラは、複合化機構に命令境界を示す情報を提供するために、他の形で命令とデータを区別することになる。

典型的な本発明の２元複合化の実施例では、複合化情報が、テキストの２バイト（命令とデータ）ごとに１ビツトとして、命令ストリームに付加される。一般に、制御情報を含むタグは、複合化されたバイト・ストリーム内の各命令に、すなわち複合化されないスカラー命令、ならびに対、３つ組、またはそれより大きな複合化されたグループとして含まれる複合化された各スカラー命令に付加されることができる。本明細書では、識別子ビットとは、複合化されたグループを形成する複合化されたスカラー命令を識別し、複合化された命令プログラム内に残っており、取り出されると単独で実行される、複合化されていないスカラー命令からそれを区別するのに特に使用されるタグの部分を指す。

４バイトの命令がすべて４バイト境界上で整列されるシステムでは、テキストの４バイトごとに１つのタグが関連づけられる。同様に、命令が任意に整列されることができる場合は、テキストのバイトごとにタグが必要である。

せいぜい２個の命令を複合化するケースは、複合命令を形成するためのスカラー命令の最小のグループ化を提供する。

この場合、識別子ビットに対して下記の好ましいコード化手順が使用される。システム／３７ｏのす、べての命令は、長さが２バイトまたは４バイトまたは６バイトのハーフワード（２バイト）境界上で整列されるので、各ハーフワードごとに、識別子ビットを有するタグが１つ必要である。この小さなグループ化の例では、識別子ビット″１”は、検討中のバイトから始まる命令が次の命令と複合化されることを示し、一方、１１０２１は、検討中のバイトから始まる命令が複合化されないことを示す。命令の第１バイトを含まないハーフワードに関連づけられた識別子ビットは、無視される。複合化された対の第２の命令の第１バイトに対する識別子ビットも、無視される。その結果、識別子ビットに対するこのコード化手順は、最も単純な場合には、複合化された命令を識別するために、実行中のＣＰＵが１ビツトの情報しか必要としないことを意味する。

３個以上のスカラー命令をグループ化して複合命令を形成できる場合、追加の識別子ビットが必要になる。実際に複合化された特定のスカラー命令数を示すのに必要な識別子ビットの最小数は、グループ化して複合命令を形成することのできるスカラー命令の最大数の２を底とする対数（を最も近い整数に切り上げた値）である。例えば、最大値が２であれば、各複合命令ごとに１つの識別子ビットが必要である。最大値が３または４であれば、各複合命令ごとに２つの識別子ビットが必要である。最大値が５．６．７または８であれば、各複合命令ごとに３つの識別子ビットが必要である。このコード化方式を、下記の表１に示す。

表１識別子　複合化されビット　コード化された意味　る命令の数ｏＯこの命令は次の命令と複合化さ　なしれない０１　この命令は次の１つの命令と複　２合化される１ｏ　この命令は次の２つの命令と複　３合化される１１　この命令は次の３つの命令と複　４合化されるしたがって、各ハーフワードにタグが必要であるが、ｃＰＵは、実行される命令ストリームの最初の命令のタグ以外のすべてのタグを無視することが理解されよう。言いかえれば１バイトを調べて、その識別子ビットを検査することによって、それが複合命令であるか否かを判定する。それが複合命令の先頭でない場合、その識別子ビットは０である。そのバイトが２つのスカラー命令を含む複合命令の先頭である場合第１の命令の識別子ビットはＩＩ　１”であり、第２の命令の識別子ビットは”０７１である。そのバイトが３つのスカラー命令を含む複合命令の先頭である場合、第１の命令の識別子ビットは２″′であり、第２の命令の識別子ビットは７１１１１であり、第３の命令の識別子ビットはｆｌｏｌｌである。言いかえれば、各ハーフワードの識別子ビットは、この特定のバイトが複合命令の先頭であるか否かを識別すると同時に、その複合化されたグループを構成する命令数を示す。

この複合命令をコード化する方法は、３つの命令を複合化して３つ組のグループを形成する場合、第２および第３の命令も複合化されて対のグループを形成することを前提としている。言いかえると、３つ組のグループの第２の命令への分岐が発生する場合、第２の命令の識別子ビットｌ１ｌ）ｌは、その３つ組のグループの第１の命令が実行されなかった場合でも、第２および第３の命令が複合化された対として並列に実行されることを示している。

本発明では、特定のコンピュータ・システム構成について１回だけ命令ストリームを複合化すればよ（、その後、複合化された命令が取り出されると、それに関連する識別子ビットも取り出されることは、当業者にとって明白であろう。これによって、いわゆるスーパースカラー計算機で実行のために同一のまたは異なる命令が取り出されるごとに、並列実行のために最後の瞬間に特定のスカラー命令の非効率な判定と選択を繰り返し行うことが不要になる。

命令ストリームの複合化のあらゆる長所にもかかわらず、特定のコンピュータ・アーキテクチャの下でこれを行うことは、バイト・ストリングにおける命令境界を決定する技法が開発されない限り、困難になる。このような決定は、可変長命令が許容される時は複雑になり、データと命令が混在できる時にはさらに複雑になる。もちろん、実行時には、適切な実行を可能にするために命令境界がわかっていなければならない。しかし、複合化は、命令実行よりも十分に前の時点で行うことが好ましいので、命令がどこから始まるかの知識もどのバイトがデータであるかの知識もない状態で命令を複合化する技法が必要である。この技法は、命令が通常は固定長でありデータと混在しないＲＩＳＣ（縮小命令セット・コンピュータ）アーキテクチャを含めて、広く受け入れられているタイプのすべてのアーキテクチャに適用できることが必要である。

本発明の技法には、複合化中の特定の命令ストリームに関して既に入手可能である情報に応じて、多数のバリエーションがある。典型的な関連情報の様々な組合せを、下記の表２表２ケース　命令長　データの混在　参照点Ａ　固定　なし　ありＢ　可変　なし　ありＣ固定または可変　あり　ありＤ　固定　なし　なしＥ　可変　なし　なしＦ　固定　あり　なしＧ　可変　あり　なしいくつかの場合、固定長命令と可変長命令が、異なるケースとして識別されていることに留意されたい。これは、参照点がわかっていない場合、可変長命令が存在すると不確定性が増し、それによって多くの可能な複合化ビットが生成されるためである。言いかえると、本発明の技法によって提供される可能な命令シーケンスの生成時には、どの固定長命令でも、その途中のバイトに対する複合化識別子タグは存在しない。また、好ましいコード化方式の下で必要とされる識別子タグの総数は、より少ない（すなわち、４バイトの固定長を有する命令では、識別子タグは４バイトごとに１つ）。それにもかかわらず、本発明のユニークな技法は、固定長命令でも可変長命令でも同様に良好に機能する。というのは、ある命令の起点がわかる（または仮定される）と、何らかの方法でその命令内のどこかでその長さを必ず見つけることができるからである。システム／３７０命令では、その長さが命令コード内でコード化され、他のシステムでは、多分、長さがオペランド内でコード化される。

命令が固定長でデータが混在せず、命令コードの参照点位置がわかっているケースＡでは、その特定のコンピュータ構成に適用できる規則に従って複合化を進めることができる。

固定長なので、スカラー命令のシーケンスは容易に決定され。

シーケンス内の各命令を、次の命令と共に並列に実行するための可能な候補と見なすことができる。制御タグ内の第１のコード化された値は、その命令が次の命令と複合化できないことを示し、制御タグ内の第２のコード化された値は、その命令が並列実行のために次の命令と複合化できることを示す。

同様に、命令が可変長でデータが混在せず、命令の参照点が（したがって、命令長コードの参照点も）わかっているケースＢでは、通常の形で複合化を進めることができる。命令コードは、たとえば次のような命令シーケンスを示す。最初の命令は長さ６バイトであり、第２および第３の命令はそれぞれ２バイト、第４の命令は４バイト、第５の命令は２バイト、第６の命令は６バイト、第７および第８の命令はそれぞれ２バイトである。

説明の都合上、たとえば第６図に示すように、図示の命令コードの例は、可変長でも固定長でもよいものとする。

この説明では、スカラー命令の隣接する対から形成される複合命令の生成、ならびにスカラー命令のより大きなグループから形成される複合命令の生成について、複合化の技法を示す。図面に示した実施例のための規則の例は、さらに、長さ２バイトまたは４バイトのすべての命令が、互いに複合化できる（すなわち、この特定のコンピュータ構成では、２バイト命令が別の２バイト命令または別の４バイト命令と並列に実行できる）と規定するものと定義されている。さらに、この規則では、システム／３７ｏ環境で長さ６バイトのすべての命令が、全（複合化できない（すなわち、この特定のコンピュータ構成では、６バイト命令は単独でしか実行できない）と規定される。もちろん、本発明は、この複合化規則の例だけに限定されるものではなく、所定のコンピュータ・アーキテクチャ用の特定の構成内の既存の命令を並列に実行するための判定基準を規定するいかなる１組の複合化規則にも適用可能である。

本発明のこれらの複合化技法の例で使用する命令セットは、システム／３７０から採ったものである。以下で詳細に説明するように、各命令に対する命令コードを検査することによって、各命令のタイプと長さを決定することができ、その後、その特定の命令に対する識別子ビットを含む制御タグが生成される。もちろん、本発明は、特定のアーキテクチャまたは命令セットだけに限定されるものではなく、前述の複合化規則は例として示したものにすぎない。

次に、これらの実施例における複合命令のための好ましいコード化について説明する。隣接する２つの命令が複合化できる場合、記憶するために生成されるその識別子ビットは、第１の複合化された命令では＋＋１＋＋であり、その後、第２および第３の命令が、複合化できるかどうか検討される。本技法に従って命令バイト・ストリームが前処理され、様々なスカラー命令に対する識別子ビットがコード化された後、より大きな命令のグループを表示するためにより大きなウィンドウを使用し、複合化に最適な隣接する対の組合せを取り上げることによって、並列実行を実現するためのより最適な結果を得ることができる。

本発明に関連して、第４Ａ図に関して全般的に述べる諸タスクの実行は、１９９０年５月４日出願の米国特許出願第０７１５１９３８２号に全般的に記載されている種類の複合命令実行エンジンの助けを得て、他の環境で実施される。

一般に、好ましい動作環境は、第４Ｂ図に示した動作環境で代表される。複合化ファシリティは、ソフトウェア・エンティティでもよいが、１９９１年１月１６日出願の米国特許出願第０７／６４２０１１号に詳細に記載された命令複合化ユニットによって複合化ファシリティを実施することもできる。第４Ｂ図を参照すると、本発明に従って構成された、キャッシュ管理ユニット１４４を有するデジタル・コンピュータ・システムまたはデジタル・データ処理システムの一部分の代表的な実施例が示されている。このコンピュータ・システムは、２つまたはそれ以上の命令を並列に処理する能力を有する。このコンピュータ・システムは、処理すべきである命令およびデータを、スカラー計算機用の１連の基本命令の形で記憶するための第１の記憶機構を含んでいる。この記憶機構は、高水準記憶装置１３６として識別される。この記憶装置（「主記憶装置」でもある）は、大容量で低速の記憶機構であり、たとえば、大容量システム記憶装置、または包括的な階層的記憶システムの下位部分とすることができる。

第４Ｂ図のコンピュータ・システムはまた、高水準記憶装置１３６から命令を受け取り、かつこれらの命令に、これらの命令のうちのどれが互いに並列に実行できるかを示すタグの形の複合情報を関連づける命令複合化ファシリティまたは機構も含んでいる。適当な命令複合化ユニットは、命令複合化ユニット１３７によって表される。この命令複合化ユニット１３７は、入って（る命令を解析して、そのどれが並列に処理できるかを判定する。さらに、命令複合化ユニット１３７は、これらの解析された命令に対して、どの命令が互いに並列に処理でき、どの命令が互いに並列に処理できず単独で処理しなければならないかを示す、タグ・ビットを生成する。

第４Ｂ図のシステムはさらに、命令複合化ユニット１３７に結合され、解析された命令とそれらに関連するタグ・フィールドを受け取り、かつこれらの記憶された複合化された命令が取り出せるようにそれらのタグ・フィールドを記憶するための第２の記憶機構を含んでいる。この第２または第３以降の記憶機構は、複合命令キャッシュ１３８で代表される。

複合命令キャッシュ１３８は、低速の記憶機構１３６にアクセスする頻度を低下させてコンピュータ・システムの性能を改良するのに一般的に使用される種類の小容量で、高速の記憶機構である。

第４図のシステムはさらに、互いに並列に動作する複数の命令処理機能ユニットを含んでいる。これらの命令処理機能ユニット１３９．１４０，１４１などは、互いに並列に同時に動作し、それぞれが、それ自体で１つまたは複数のタイプの機械レベル命令を処理する能力を有する。使用される機能ユニットの例には、汎用演算論理装置（ＡＬＵ）、アドレス生成型ＡＬＵ、データ依存性縮小式（ｄａｔａ　ｄｅｐｅｎｄｅｎｃｙｃｏｌｌａｐｓｉｎｇ）　Ａ　Ｌ　Ｕ　（１９９０年４月４日出願の同時継続の米国特許出願第０７１５０４９１０号に開示されている好ましいタイプのもの）、分岐命令処理ユニット、データ・シフタ・ユニット、浮動小数点処理ユニットなどがある。所定のコンピュータ・システムは、可能な機能ユニットのいくつかを含むことができる。例えば、所定のコンピュータ・システムは、汎用ＡＬＵを２個以上含むことができる。また、所定のコンピュータ・システムは、これら異なるタイプの機能ユニットのすべてを含む必要はない。どんな構成をとるかは、検討中の特定のコンピュータ・システムの性質によって決まる。

第４Ｂ図のコンピュータ・システムはまた、複合命令キャッシュ１３８に結合され、そこに記憶された隣接する命令が並列に処理できることを命令タグ・ビット指示する時、命令処理機能ユニット１３９〜１４１のうちの異なるユニットにそれらの命令を供給する命令取出し／発行機構も含んでいる。

この機構はまた、並列実行が不可能であり、命令を単独で処理しなければならないことをタグ・ビットが指示する時は、単一の命令を個々の機能ユニットに供給する。この機構は、命令取出し／発行ユニット１４２で代表される。命令取出し／発行ユニット１４２は、複合命令キャッシュ１３８から命令を取り出し、タグ・ビットと命令コード・フィールドを検査すると同時に復号機能を実行し、このような検査に基づいて、検討中の命令を機能ユニット１３９〜１４１のうちの適当なユニットに送る。

３０１３Ｍアーキテクチャの環境では、命令複合化ユニット１３７によってインキャッシュ命令複合化を行い、その結果、各キャッシュ行の複合化が、複合命令キャッシュ１３８の入力部で行えるようになる。すなわち、各キャッシュ行が主記憶装置１３６から取り出されてキャッシュ１３８に入れられる時、その行は、ユニット１３７内で複合化できるかどうか解析され、複合化情報タグ・ビットと共に渡されて、複合命令キャッシュ１３８に記憶される。

キャッシュ化の前に、行は、命令複合化ユニット１３７で複合化される。このユニット１３７はタグ・ビット・セットを生成する。これらのタグ・ビットは、それらと関連する命令に直接付加できる。また、それらの命令自体と並列にタグ・ビットを供給することもできる。いずれの場合でも、これらのビットは、その命令の行と共にキャッシュ１３８に記憶するために供給される。必要に応じて、キャッシュ１３８の複合化された命令は、命令取出し／発行ユニット１４２によって、そのタグ・ビット情報と共に取り出される。命令取出し／発行ユニット１４２は、命令を受け取ると、それらのタグ・ビットを検査して、復号検査によってそれらが並列に処理できるか否かを判定し、命令コード・フィールドを検査して、使用可能な機能ユニットのうちのどれがそれらの処理に最も適しているかを決定する。２つ以上の命令が並列処理に適しているとタグ・ビットが示す場合には、それらの命令は、その命令コード・フィールドのコード化に応じて、機能ユニットのうちの適当なユニットに送られる。その後、これらの命令は、それぞれの機能ユニットによって互いに並列に処理される。

並列処理に適さない命令に遭遇した時には、命令コードによって決定される適当な機能ユニットにその命令を送り、その後、この命令は、選択された機能ユニット内で単独に処理される。

複数の命令が常に並列に処理される最も完全な場合には、このコンピュータ・システムの命令実行率が、１回に１命令が実行される場合のＮ倍になるはずである。ただし、Ｎは、並列に処理されるグループの命令数である。

第８図は、複合命令の途中で分岐を実行できる複合命令実行エンジンを示す図である。複合命令は、記憶装置からＣＩキャッシュ（複合命令に対する高速アクセスを実現する記憶バッファ）へ流れる。Ｃ１行論理回路は、ＣＩキャッシュから複合命令を取り出し、それらを適当な機能ユニットに発行する。機能ユニットの組は、・ＥＵ　−実行ユニット、ＡＬｔＪ・ＡＵ　−記憶アドレス生成ユニット・ＦＰ　−浮動小数点演算ユニット、その他などの従来型の機能ユニットからなるが、各ユニットが複合命令ならびに単一のスカラー命令を実行できる点で、従来のものとは異なる。したがって、各ユニットの名前の前にＬＬＣ１′″を付けて、それが複合命令を実行できることを示す。すなわち、第８図に示すように、Ｊ／　Ｅ　Ｕ　ｐｐの代りに”ＣＩＥＵ″′となる。

いくつかの命令を単一の複合命令に結合すると、コンピュータの命令処理ユニットは、これらの命令を効果的に復号し並列に処理することができるようになるので、性能が改善される。命令を並列に復号し実行するという概念は、当技術分野で周知であり、本明細書の導、入部で論じたが、本発明で使用する通常の技法は、命令ストリームが命令復号ハードウェアに入力される時点でその命令ストリームを動的に復号して、その命令が並列に実行できるか否かを判定するというものである。この判定は、各命令セット・アーキテクチャ、ならびにその基礎となる任意の所定の命令プロセッサでのそのアーキテクチャの実施態様に関して一義的である。動的復号（導入部で説明されているような動的スケジューリング）は、しばしばアーキテクチャの複雑さによって制限される。アーキテクチャが複雑なために、並列に実行できる命令の組合せを判定する論理が複雑になり、したがって、命令プロセッサのサイクル・タイムが増加する可能性があるためである。本発明の教示する命令プロセッサの復号は、前記命令プロセッサで複合命令フォーマット・テキストの実行を可能にする制御ビットを付加された命令フォーマット・テキストを伴う一連の複合命令を生成することによって、スカラー計算機の一連の基本命令に対する複合命令を提供する。この複合命令フォーマット・テキストを取り出して復号すると、命令プロセッサの演算論理装置が複合命令及び単一命令として実行されることができる複合命令及び単一命令を決定することができる。

もともと記憶域内にあったスカラー計算機の基本命令のスカラー実行は、そのままに保たれる。これによって、既存のプログラムの正しい実行の必要条件として、複合命令の実行の結果は、それらの命令を個別に実行した場合に得られる結果と同じであるが、複合化された命令ストリームが並列な性質のため、一般に高速で実行できることが保証される。

複合化ファシリティは、ソフトウェア・エンティティでもよい。このソフトウェアの設計は、その詳細が所定の命令セット・アーキテクチャ及びその基礎となる実施態様に独特であり、かつこのようなプログラムの設計が、特定の計算機アーキテクチャに基づいて命令のスケジューリング及びその他の最適化を行う現代のコンパイラに概念上多少類似しているので、本明細書では説明しない。すなわち、入力プログラムと、システム（命令セット）及びハードウェア・アーキテクチャ（すなわち、実施態様の構造的様態）が与えられると、出力プログラムが作成される。現代のコンパイラの場合、出力は、最適化された命令のシーケンスである。本発明の場合、出力は、必要な制御ビットを伴う一連の複合命令、すなわち複合命令プログラムである。前述のように、複合命令プログラムを形成するための基礎は、現代のコンパイラに供給される情報に匹敵するアーキテクチャ情報を供給する、複合化規則セットである。

複合命令プログラムを第９図に示す。図では、複合化ファシリティは、ｎ個のコード・ブロックまたは複合化可能な単位を、様々な長さのｎ個の複合命令に組み立てる。各複合命令中には、可変長の元の命令がある。各複合命令中には、第９図に示すように、各命令に制御フィールドＴが付加された元の命令が入力プログラムにある。

第９図のビットＴは、特定の意味を示すように規定されている。１つの実施例では、以下に示すように、ｔｏビットが命令の先頭をマークする。どの場合でも、０は確定されていないことを意味する。どの場合でも、複合命令が確実に取り出されることが好ましい。したがって、取り出すために選択されるビット数は、その並列な複合化された命令を実行しているターゲット計算機の最大命令長の命令に含まれ、それと共に実行できる最大のビット数である。したがって、この取出しシステムは、最大長の取出しを行う。

１つの好ましい実施例では、第６図および第９図にＴ′″で示される複合命令の開始を示すタグを利用する。しかしながら、好ましい実施例では、Ｔは、複合命令の一部と見なされる次の命令の数を表すものと理解される。したがって、Ｏが単一の命令を表すように、１は、その複合命令中にもう１つ命令があることを示し、２は２つの命令、３はもう３つの命令が、現命令と複合化されることを示す。

したがって、装置内で、各複合命令は、その命令に付加された複合命令に関するタグ情報を表すタグＩｔ　Ｔ　Ｉ＋を有し、この情報のある値は、その命令を別の複合命令または単一命令の一部ではなく、単一の命令と見なすべきことを示し、一方、このタグ情報の別の値は、付加された命令単位が複合命令の一部であることを示す。タグ情報の値は、複合命令の長さと、実行すべき複合命令内の命令単位数に関連する。

本発明の好ましい実施例では、取り出された′複合命令は、後続の命令数をカウント値として示すタグ情報を有し、その同じ複合命令の後続の命令は、その複合命令のメンバ単位に付加された副カウント・タグによって供給される副カウント情報を有する。以下の好ましい実施例の説明は、タグ値を使って命令が複合命令の一部であることを示すことに関するものであり、タグの値１は両方の実施例に共通するが、２個より長い命令では、この値が複合命令の命令単位数に関連することに留意されたい。

前述したように、制御フィールドは、複合命令の実行に関連する情報を含み、また、特定の実施態様に有効と見なされるだけの情報を含むことができる。たとえば、制御フィールドは、８ビツト・フィールドとして次のように規定される。

ｔ□　ｔｌ　ｔ２　ｔ３　℃４　ｔ、　ｔ６　℃７ビツト　機能し。　１ならば、この命令は、複合命令の先頭にマークを付ける。

ｔｌ　１ならば、２つの複合命令を並列に実行する。

℃２　１ならば、この複合命令は、複数の実行サイクルを有する。

ｔ、　ｌならば、パイプライン化を中断する。

ｔ４　命令が分岐でこのビットが１ならば、分岐を取ると予測される。

ｔ５　１ならば、この命令は、前の複合命令からの記憶インターロックを有する。

ｔ６　１ならば、動的命令発行をイネーブルする。

ｔ７　１ならば、この命令はＡＬＵを使用する。

℃０ビットは、上記のすべてのビットのうちでこれだけが不可欠なので、さらに検討に値する。このビットの目的は、複合命令の先頭の命令を識別することである。論理１が、２つの命令を並列に実行することを意味し、Ｏが、単一命令の実行を意味するものと規定すると、ハードウェアは、複合命令を構成する命令数を容易に検出することができる。

一般に、複合化ファシリティは、並列に実行される命令のクラスを捜し、ハードウェアによって処理されることができない複合命令のメンバ間のインターロックが存在しないことを確認する。互換性のある命令のシーケンスが見つかった時、複合命令が生成される。例えば、システム／３７０アーキテクチヤは、下記のクラスに分割できる。

１、ＲＲ−フォーマット　ロード、論理演算、算術演算、比較・Ｌ　ＣＲ−−Ｌｏａｄ　Ｃｏｍｐｌｅｍｅｎｔ　（補数ロード）・Ｌ　Ｐ　Ｒ −−Ｌｏａｄ　Ｐｏ５ｉｔｉｖｅ　（正数ロード）−Ｌ　Ｎ　Ｒ−−Ｌｏａｄ　Ｎｅｇａｔｉｖｅ　（負数ロード）−ＬＲ−−ＬｏａｄＲｅｇｉｓｔｅｒ（レジスタ・ロード）・ＬＴＲ−−Ｌｏａｄ　ａｎｄ　Ｔｅ５ｔ　（ロードおよびテスト）・ＮＲ−−ＡＮＤ（論理積）・０Ｒ−−ＯＲ（論理和）・ＸＲ−−ＥｘｃｌｕｓｉｖｅＯＲ（排他的論理和）・ＡＲ−−Ａｄｄ（加算）・ＳＲ−−５ｕｂｔｒａｃｔ　（減算）・ＡＬＲ−−ＡｄｄＬｏｇｉｃａｌ（論理加算）・Ｓ　Ｌ　Ｒ−−５ｕｂｔｒａｃｔ　Ｌｏｇｉｃａｌ　（論理減算）・ＣＬ　Ｒ−−Ｃｏｍｐａｒｅ　Ｌｏｇｉｃａｌ　（論理比較）・ＣＲ−−Ｃｏｍｐａｒｅ（比較）２、Ｒ８−フォーマット　シフト（記憶アクセスなし）・Ｓ　ＲＬ　−−５ｈｉｆｔ　Ｒｉｇｈｔ　Ｌｏｇｉｃａｌ　（論理右シフト）−Ｓ　Ｌ　Ｌ　−−５ｈｉｆｔ　Ｌｅｆｔ　Ｌｏｇｉｃａｌ　（論理左シフト）・Ｓ　ＲＡ　−−５ｈｉｆｔ　Ｒｉｇｈｔ　Ａｒｉｔｈｍｅｔｉｃ（算術右シフト）・Ｓ　ＬＡ　−−５ｈｉｆｔ　Ｌｅｆｔ　Ａｒｉｔｈｍｅｔｉｃ（算術左シフト）・Ｓ　ＲＤ　Ｌ　−−５ｈｉｆｔ　Ｒｉｇｈｔ　Ｌｏｇｉｃａｌ　（論理右シフト）・Ｓ　Ｌ　Ｄ　Ｌ　−−５ｈｉｆｔ　Ｌｅｆｔ　Ｌｏｇｉｃａｌ　（論理左シフト）・Ｓ　ＲＤ　Ａ　−−５ｈｉｆｔ　Ｒｉｇｈｔ　Ａｒｉｔｈｍｅｔｉｃ（算術右シフト）・Ｓ　ＬＤＡ　−−５ｈｉｆｔ　ＬｅｆｔΔｒｉｔｈｍｅｔｉｃ（算術左シフト）３、分岐　−一　カウント及びインデックスによる分岐・　Ｂ　ＣＴ　−−Ｂｒａｎｃｈ　ｏｎ　Ｃｏｕｎｔ（カウント分岐、ＲＸフォーマット）ＩＢＣＴＲ−−Ｂｒａｎｃｈ　ｏｎ　Ｃｏｕｎｔ（カウント分岐、ＲＲフォーマット）・Ｂ　ＸＨ−−Ｂｒａｎｃｈ　ｏｎ　Ｉｎｄｅｘ　Ｈｉｇｈ（高位インデックス分岐、ＲＳフォーマット）・Ｂ　Ｘ　Ｌ　Ｅ　−−Ｂｒａｎｃｈ　ｏｎ　Ｉｎｄｅｘ　Ｌｏｗ（低位インデックス分岐、ＲＳフォーマット）４、分岐　−一　条件分岐・Ｂ　Ｃ−−Ｂｒａｎｃｈ　ｏｎ　Ｃｏｎｄｉｔｉｏｎ（条件分岐、ＲＸフォーマット） −Ｂ　ＣＲ−−Ｂｒａｎｃｈ　ｏｎ　Ｃｏｎｄｉｔｉｏｎ（条件分岐、ＲＲフォーマット）５、分岐−分岐およびリンク・Ｂ　Ａ　Ｌ　−−Ｂｒａｎｃｈ　ａｎｄ　Ｌｉｎｋ（分岐およびリンク、ＲＸフォーマット）・Ｂ　Ａ　Ｌ　Ｒ−−Ｂｒａｎｃｈ　ａｎｄ　Ｌｉｎｋ（分岐およびリンク、ＲＲフォーマット）φＢ　Ａ　Ｓ　−−Ｂｒａｎｃｈ　ａｎｄ　５ａｖｅ（分岐およびセーブ、ＲＸフォーマット）・Ｂ　Ａ　Ｓ　Ｒ−−Ｂｒａｎｃｈ　ａｎｄ　５ａｖｅ（分岐およびセーブ、ＲＲフォーマット）６、記憶命Ｓ　ＴＣＭ　−−５ｔｏｒｅ　Ｃｈａｒａｃｔｅｒｓ　Ｕｎｄｅｒ　Ｍａｓｋ（マスク下文字記憶、０−４バイト記憶、ＲＳフォーマット） −ＭＶＩ　−−ＭｏｖｅＩｍｍｅｄｉａｔｅ（即値移動、１バイト、ＳＩフォーマット）・ＳＴ　−−３ｔｏｒｅ　（記憶、４バイト）・Ｓ　Ｔ　Ｃ−−３ｔｏｒｅ　Ｃｈａｒａｃｔｅｒ（文字記憶、１バイト）一３ＴＨ−−５ｔｏｒｅＨａｌｆ（ハーフ記憶、２バイト）７、ロード・Ｌ　Ｈ−−Ｌｏａｄ　Ｈａｌｆ　（ハーフ　・ロード、２バイト）−Ｌ−−Ｌｏａｄ（ロード、４バイト）８、　ＬＡ　−−ＬｏａｄＡｄｄｒｅｓｓ　（アドレス−０−ド）９、、ＲＸフォーマット　算術演算、論理演算、挿入、比較・Ａ　−−Ａｄｃｌ（加算）・ＡＨ−−Ａｄｄ　Ｈａｌｆ　（半加算）・Ａ　Ｌ　−−Ａｄｄ　Ｌｏｇｉｃａｌ　（論理加算）・Ｎ　−−ＡＮＤ（論理積）・〇　−−ＯＲ（論理和） −Ｓ−−５ｕｂｔｒａｃｔ　（減算）・Ｓ　Ｈ−−５ｕｂｔｒａｃｔ　Ｈａｌｆ　（半減界）・Ｓ　Ｌ　−−５ｕｂｔｒａｃｔ　Ｌｏｇｉｃａｌ　（論理減算）・Ｘ　−−Ｅｘｃｌｕｓｉｖｅ　ＯＲ（排他的論理和）−Ｉ　Ｃ−−Ｉｎ５ｅｒｔ　Ｃｈａｒａｃｔｅｒ　（文字挿入）−Ｉ　ＣＭ　−−Ｉｎ５ｅｒｔ　Ｃｈａｒａｃｔｅｒ　Ｕｎｄｅｒ　Ｍａｓｋ（マスク下の文字挿入、０−４バイト取出し） −Ｃ−−Ｃｏｍｐａｒｅ　（比較）・ＣＨ−−Ｃｏｍｐａｒｅ’　Ｈａｌｆ　（半比較）・ＣＬ　−−Ｃｏｍｐａｒｅ　Ｌｏｇｉｃａｌ　（論理比較）・ＣＬ　Ｉ　−−Ｃｏｍｐａｒｅ　Ｌｏｇｉｃａｌ　Ｉｍｍｅｄｉａｔｅ（即値論理比較）６ＣＬＭ　−−Ｃｏｍｐａｒｅ　Ｌｏｇｉｃａｌ　Ｃｈａｒａｃｔｅｒ　Ｕｎｄｅｒ　Ｍａｓｋ（マスク下文字論理比較）１０、　ＴＭ　−−Ｔｅ５ｔ　Ｕｎｄｅｒ　Ｍａｓｋ　（マスク下のテスト）システム／３７０命令の残りの命令は、本発明では、実行のために複合化されるとは見なされない。これによって、これらの命令が、将来の複合命令実行エンジン上で複合化されることが排除されるわけではない。複合命令の実行に必要なハードウェア構造は、水平マイクロコードによって容易に制御することができ、残りの命令に含まれる並列性を利用して性能を向上できることに留意されたい。

プログラムでの最も一般的なシーケンスの１つは、ＴＭまたはＲＸフォーマットの比較クラスの命令を実行することである。その結果は、その直後に続く条件分岐型命令の実行を制御するのに使用される。ＣＯＭＰＡＲＥ命令およびＢＲＡＮＣＨ命令を並列に実行することによって性能が改善でき、これは、高性能命令プロセッサでは時として動的に行われる。典型的なアーキテクチャでは、ＣＯＭＰＡＲＥクラスの命令の様々なメンバのすべてとＢＲＡＮＣＨクラスの命令のメンバのすべてを命令復号処理中にすばやく識別することには、多少の困難が伴う。

この困難は、本発明によって回避される。というのは、諸クラスの全メンバの解析が前もって行われ、動作することが保証された複合命令が生成されるためである。

ハードウェアの設計に応じて、多くのクラスの命令を並列に実行することができる。上述のＣＯＭＰＡＲＥとＢＲＡＮＣＨの複合命令に加えて、ＬＯＡＤ命令とＲＲフォーマット命令、ＢＲＡＮＣＨ命令とＬＯＡＤ　ＡＤＤＲＥＳＳ命令など、他の複合命令が考えられる。

プロセッサが必要な実行ユニットを有する場合には、複合命令に、例えばＲＲフォーマットの算術演算など、同一クラスの複数の命令を含めることもできる。

実現可能などの命令プロセッサにも、複合命令を構成できる命令数に上限が存在する。複合命令を生成することによって実行可能命令を生成しつつある複合化ファシリティに対してこの上限ｍを指定して、複合化ファシリティの生成する複合命令が、基礎となるハードウェアの最大能力を超えないようにしなければならない。厳密にいえば、ｍは、ハードウェア実施態様の結果であることに留意されたい。これは、ソフトウェアによって所定のコード・シーケンスで複合化するために解析される命令の範囲を制限するものではない。一般に、解析の範囲が広いほど、複合化ファシリティによってより有利な複合化が認識されるので、それだけ大きな並列性が得られる。例として、以下のシーケンスを検討する。

Ｘｌ；何らかの複合化可能な命令Ｘ２；何らかの複合化可能な命令ＬＯＡＤ　Ｒ１，（Ｘ）　；Ｒ１ヲメモ’）位ｔ　Ｘ　カラ０−）’ｔルＡＤＤ　Ｒ３，Ｒ１；Ｒ３＝　Ｒ３＋　ＲＩＳＵＢ　Ｒ１，Ｒ２、Ｒ１＝Ｒ１−Ｒ２ＣＯＭＰ　Ｒ１，Ｒ３；Ｒ１とＲ３とを比較するＸ３　；何らかの複合化可能な命令Ｘ４；何らかの複合化可能な命令ハードウェアによって課される複合化の上限がｍ＝２である場合、複合化ファシリティの有効範囲に応じて、この命令のシーケンスを複合化する方法がいくつか存在する。この有効範囲が４に等しい場合、複合化ソフトウェアは、＜−ＸＩ＞＜Ｘ２　ＬＯＡＤ＞　＜ＡＤＤ　ＳＵＢ＞　＜ＣＯＭＰ　Ｘ３＞　＜Ｘ４−＞　トイう対を作成して、ＬＯＡＤとＡＤＤの間及びＳＵＢとＣＯＭＰの間の障害を完全に取り除（。一方、ｍ＝２のスーパースカラー計算機は、その命令発行論理回路内で、厳密に先入れ先出し方式で命令を対にすルノテ、＜Ｘｉ　Ｘ２＞　＜ＬＯＡＤ　ＡＤＤ＞　＜ＳＵＢ　ＣＯＭＰ＞　＜Ｘ３　Ｘ４＞　トイう対を作成するはずであり、インターロックを発生させる命令の不利益を完全にこうむる。

残念ながらＡＤＤにはＬＯＡＤの結果が必要なので、このＬＯＡＤとＡＤＤを並列に実行することはできない。同様に、ＳＵＢとＣＯＭＰを並列に実行することもできない。したがって、性能向上が得られない。

通常は、複合命令の途中への分岐が発生しないという保証はない。これは、第１０図に示すように、ハードウェアによって容易に処理される。第１０図では、複合化タグの表現でＴ＝１を使用して、値が１の次のタグまで延びるが、それを含まない複合命令の先頭をマークする。このハードウェアは、命令を取り出す時、必ず正確に分岐目標アドレスから始まる最大長の複合命令を記憶装置から取り出し、次いで、命令テキストで、次の複合命令の先頭を示すし。＝１の命令に遭遇する位置にいたるまで、１ｏ＝０のすべての命令を複合命令として実行する。分岐目標のｔ０ビットが１である場合、それは複合命令の先頭であり、直接実行できる。第１ｏ図はこの状況Ｔフィールドを、ｔ０ビットだけに縮小しである。また、複合命令の最大長は３である。Ｃ１１の第２の命令は、分岐命令であり、この例では、２つの可能な目標経路ａ及びｂを有する。

ａ経路はＣＩｊの途中に分岐するが、ｂ経路はＣＩｊの先頭に分岐する。分岐が経路ａに従う場合、ハードウェアは、最大長の複合命令すなわち３個の命令を取り出し、その後、■１□とＸｉ３を複合命令として実行する。取出しの残りの部分すなわち１に、は、次の複合命令の先頭として認識され、ＣＩにの残りが次の実行のために取り出される間、保存される。

この分岐命令が、ｂ経路を取ってＣＩ、の先頭に分岐する場合、ハードウェアは、やはり最大長の複合命令を取り出し、この場合は、完全な複合命令、すなわちＩｊｏ、■１□及びｌｊ３をもたらす。第１０図に示すように、その複合命令の実行は、直接に進行する。

異なる属性を有するアーキテクチャおよび逆方向複合化を有命令を複合化する一般的な方法は、命令レベルの並列プロセッサを有する計算機に適用できるが、これらのアーキテクチャは、ＲＩＳＣなど様々なタイプのものであり得、Ｓ／３７０型の基本プロセッサ、及び本明細書で詳述するシステム属性を有するその将来の世代の拡張版を使用することが好ましい。複合化は、前述の説明で詳述したように、隣接する命令を同時実行のためにグループ化する処理であり、前記で参照した関連特許出願に記載された変形を含む。Ｎ、Ｐ、ジュッピ（Ｊｏｕｐｐｉ）の論文”Ｔｈｅ　Ｎｏｎｕｎｉｆｏｒｍ　Ｄｉｓｔｒｉｂｕｔｉｏｎ　ｏｆＩｎｓｔｒｕｃｔｉｏｎ−Ｌｅｖｅｌ　ａｎｄＭａｃｈｉｎｅ　Ｐａｒａｌｌｅｌｉｓｍ　ａｎｄ　ＩｔｓＥｆｆｅｃｔ　ｏｎ　Ｐｅｒｆｏｒｍａｎｃｅ”、　ＩＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　Ｃｏｍｐｕｔｅｒｓ。

Ｖｏｌ、　３８．　Ｎｏ、　１２．　１９８９年１２月、　ｐｐ、１６４５−１６５８に記載された種類のスーパースカラー計算機と比較して、複合命令実施態様は、次の理由からより高速度をもたらすことができる。

１、並列実行のための命令のグループ化が、ハードウェアの利用に関して最適化される。

２．テキストが前処理され、たとえばメモリ・インターロックなど、一部のインターロックが除去できる。

３、それぞれが単一サイクルで複数の逐次命令を実行できる機能ユニットを複数用いると、第１図〜第１０図に関連して説明し、米国特許出願第０７１５１９３８４号に記載されているように、並列の命令実行とレジスタ依存性の縮ｔＪｚとによる性能向上が得られる。

複合化の処理で、実行のためＣＰＵに提示される命令ストリームにグループ化情報が追加される。命令の元の内容は破壊されず、目標計算機上で直接にまたは記憶された形で複合命令プログラムとして実行されるプログラムとして出力される。解決する必要のある問題は、異なる属性を有する様々な可能なアーキテクチャでどのようにすれば複合化を達成できるかである。

可変長の命令を有するアーキテクチャでは、一般に、バイト・ストリングを検査することによって命令境界を決定することができない。データと命令が混在でき、命令ストリームが修正できるアーキテクチャでは、複合化はさらに複雑になる。適切に実行できるためには、実行時に命令境界がわかっていなければならない。複合化は、命令実行の前に行うことができるので、命令がどこで開始するかと、どのバイトがデータであるかの知識なしで、命令を複合化するシステムが必要である。本発明は、このような装置を記述する。例えば、ｒ　ＩＢＭ　Ｅｎｔｅｒｐｒｉｓｅ　Ｓｙｓｔｅｍｓ　Ａｒｃｈｉｔｅｃｔｕｒｅ／３７０　Ｐｒ１ｎｃｉｐｌｅｓｏｆ　０ｐｅｒａｔｉｏｎ」と題するＩＢＭ刊行物、資料番号５Ａ２２−７２００−］：詳述され６　Ｓ／３７０など（７）ＣＩＳＣアーキテクチャに、これらの問題が存在する。ＩＢＭによって最初に開発され、その後、バークレイその他で様々な商業的実施態様、たとえばＩＢＭの製品ＲＩＳＣ６０００に関して開発が統けられているＲＩＳＣアーキテクチャでは、たとえばり、　Ａ、バダーリン（Ｐａｔｔｅｒｓｏｎ）の論文ｒ　ＲｅｄｕｃｅｄＩｎｓｔｒｕｃｔｉｏｎ　Ｓｅｔ　Ｃｏｍｐｕｔｅｒｓ」、　Ｃｏｍｍｕｎｉｃａｔｉｏｎｓ　ｏｆ　ｔｈｅ　ＡＣＭ。

Ｖｏｌ、　２８．　Ｎｏ、　１．　１９８５年１月、　ｐｐ、８−２１に記載されているように、命令は通常、固定長であり、データは命令と混在しない。したがって、複合化は簡単である。ここに提案する装置を実例で説明するためにＳ／３７０に適用できる例を示したが、ここに提案する装置は、他のアーキテクチャにも適用可能である。さらに、本明細書の例は、異なる部分的な基準に対する解決策を記述したものであり、後で逆方向複合化装置についても述べる。

Ｓ／３７０命令セツト・アーキテクチャには、複合化処理を複雑にする３つの難点がある。まず、命令ストリームへの書込みによって、前の複合化が無効になることがある。簡単な解決策は、その命令（または命令バッファ、命令キャッシュの行など）を無効にすることである。その後、無効になったテキストに対して複合化処理を繰り返すか、あるいは複合化せずにそのテキストを実行することができる。命令ストリームへの書込みによって、通常はデータ一貫性の維持により性能が低下するので、複合化を伴わない実行による追加の性能低下も許容できよう。１９９０年５月１０日出願の発明の名称がｒｃｏｍｐｏｕｎｄｉｎｇ　Ｐｒｅｐｒｏｃｅｓｓｏｒ　ｆｏｒ　ＣａｃｈｅＪの米国特許出願第０７１５２２２１９号に詳述されているように、キャッシュを用いてこれを多少最適化することが可能である。Ｓ／３７ｏの第２の難点は、命令とデータが混在できることである。本発明では、この問題を記述し、追加の情報なしでバイト・ストリングを正しく複合化できる解決策を提案する。

Ｓ／３７０の第３の難点は、命令が可変長であることである。

可能な長さが３種（２，４、または６バイト）だけ存在し、それが命令の命令コードの最初の２ビツトに示される。固定長ではないので、そのストリングが命令だけを含むことがわかっている場合でも、バイト・ストリングの命令の先頭を識別することはできない。本明細書に記載の装置は、この問題に対する解決策も提供する。

以下では、上記の諸問題に対する一般的な解決策を詳述する。説明を簡単にするため、１対の命令を複合化するという特別な場合について詳しく述べる。３個以上の命令の複合化は、このシステムで使用する技法及びアルゴリズムの拡張であり、それについても論じる。コンピュータ・システムには、命令複合化ユニット（ＩＣＵ）と称する、複合化の発生する可能な位置が複数存在する。これらの問題の議論は、例えば米国特許出願筒０７　／　５４３４６４号に出ている。ただし、本明細書に記載のシステム技法及びアルゴリズムは、他のアーキテクチャにも適用可能である。実際、これらは、アーキテクチャがすべての命令に対して単一の長さを有するか、あるいは命令とデータが混在されることができない時、例えばＲＩＳＣでは簡単になる。

複合命令の表現本明細書では、複合化情報が、テキスト（命令とデータ）の２バイトごとに１ビツトとして、命令ストリームに追加される。一般に、第１図〜第１０図に関して詳述し、上記で参照した米国特許出願第０７１５１９３８４号でも例として記載されているように、制御情報を含むタグを各命令に追加することができる。本明細書では、「複合化ビット」とは、特に複合命令のグループを識別するのに使用されるタグの部分を指す。せいぜい２個の命令を複合化する場合では、下記の手順を使用して、複合化が行われる位置を示す。すべての命令はハーフワード（２バイト）境界上で整列され、長さは２．４または６バイトのいずれかであるので、各ハーフワードごとに１つの複合化タグが必要である。複合か否かを示すには、１ビツトのタグで十分である。特に、１は、検討中のバイトから始まる命令が、次の命令と複合化されることを示す、０は、複合化が行われないことを示す。

命令の第１バイトを含まないハーフワードに関連する複合化ビットは、無視される。

複合対の第２の命令のバイトの複合化ビットも無視される。

その結果、複合化された命令を正しく実行するために実行中ＣＰＵが必要とする情報は、１ビツトだけである。システムが、３個以上の命令を複合化できる時は、複合化情報を表すための異なる方法が必要である。これについては、３個以上の命令に対する拡張について説明する部分で述べる。

命令対の処理方法どの情報が利用可能かに応じて、基本的複合化に対するいくつかの変形が存在し得る。テキストの既知の内容と、命令境界（参照点）がわかっているか否かによって、ケースは区別される。下記のケースを検討する。

１、テキストは命令だけを含み、参照点は既知である。

２、テキストは既知の境界で命令とデータを含む。

３、テキストは命令だけを含むが、参照点は未知である。

４、テキストは未知の参照点を有する命令とデータを含む。

５、テキストは部分参照点情報を有する命令とデータを含む。

ケース１および２この最も簡単なケースでは、命令ストリームにデータ・バイトがないことがわかっており、最初の命令の命令コードの位置が既知である時に、バイト・ストリングが複合化される。

これは、特定のコンパイラの結果として、またはテキストの短い部分での有用な仮定として、現代のアーキテクチャに当てはまることがある。各バイトが所属する命令は、すべての場合に、命令コードの長さビットを使用し、バイト・ストリングによって順次前進することによって、正確に決定できる。

複合規則を検査する間にある命令から次の命令に移動することによって、命令を複合化することができる。

命令を対として並列に実行することができる計算機用の２元命令複合化を仮定すると、複合化規則を適用して、命令を対として検査することができる。第１１図は、特定の長さが既知である場合の、最善の場合の複合化の例を示す図である。

好ましい実施例は、この場合、ならびに中間の場合と最悪の場合を処理する。このケースでは、命令複合化ユニット（ＩＣＵ）は、各命令の命令コードに含まれる命令長コード（工ＬＣ）を検査することによって、各命令を識別することができる。１が複合対の最初を示すタグ・ビットが生成される。

命令の先頭を含まないハーフワードは、０に初期設定され、修正されない。説明を簡単にするため、この例では、２バイトと４バイトの命令が、目標アーキテクチャのために複合化可能であり、６バイト命令は複合化不能であると仮定する。

これは、目標計算機および適用可能な複合化規則に応じて変わる。どの命令が複合化できるかを判定するのに使用される特定の規則は、命令セットのアーキテクチャおよびＣＰＵの設計によって変わるので、本明細書ではそれについては詳述しない。２つの命令が複合化できる場合、タグは、それぞれ１とＯになる。その後、次の２つの命令が検討される。しかしながら、この２つの命令が複合化できない場合は、第１の命令のタグが０になる。その後、第２の命令及びその次の命令が複合化できるかどうか検討され、システムは、入力データのバイト・ストリームの検査中、この事象に順次前進する。

これよりわずかに複雑な状況は、命令が非命令と混在しているが、各ハーフワードが、命令の第１バイトを含むあるいは含まないものとして（多分タグを用いて）識別される場合である。この場合も、各バイトが識別でき、複合化は簡単である。この識別子ビットは、コンパイラによって作成できる。

これに関連して米国特許出願第０７１５４３４６４号に詳述されているような問題がここで調査されることができる。ここでの相違は、非命令の複合化は試みられないことである。

非命令バイトをスキップするのに余分の時間を要する場合、システムは、検査中のバイト・ストリームに含まれる非命令バイト量に比例した量だけ低速になる。

しかし、この出力によって実施する複合化は誤ってはおらず、命令プロセッサは、より低速であるとはいえ、このコードを実行する。

ケース３：参照点なしの命令の複合化あるバイト・ストリームは命令バイトだけを含むことがわかっているが、最初の命令の始点が未知である時は、複合化はより複雑になる。命令の最大長は６であるが、２バイトの境界上で整列されているので、このストリームの最初の命令の開始点は３つあり得る。このストリームには命令だけが存在することがわかっているので、このシステム用の簡単なスチップ・アルゴリズムは、バイト０が命令の先頭であるかのように、そこから開始し、複合化を進めるものである。次に、バイト２から開始し、ストリームを複合化する。最後に、バイト４から開始し、ストリームを複合化する。

第１２図は、３つの異なる命令のシーケンスが考慮される例である。各シーケンスごとに、命令境界が決定され、最善の場合の説明と同様に、複合化ビットが割り当てられる。可能な命令境界の３つのシーケンス（第１２図（ｂ））のそれぞれが、異なる複合化ビットのシーケンスを生ずる。この好ましいシステムが、テキストの２バイトごとに３ビツトを必要とするアルゴリズムを使用すると仮定すると、この３つのシーケンスを単一のビット・シーケンスに縮小して、ビット数を最善の場合以下になるようにすることが望ましい。必要な情報は、所定のバイトに対して複合命令を構成する命令の最大数だけであり、２個の命令からなる複合命令では最大値が論理和に等しいことがわかっているので、３つのビット・シーケンスの論理和をとって、単一のシーケンスを生成することができる（第１２図（Ｃ））。

第１２図（Ｃ）の合成複合化ビットは、第１２図（ｂ）の３つのシーケンスと等価である。第１２図（Ｃ）のｒｃｃベクトル」を考慮されたい。逐次実行または分岐のため、バイト○から始まるバイト群が実行するかどうか検討される場合、プロセッサは、その命令とタグ・ビットを取り出す。複合化ビットが０なので、この命令は、単一命令として実行される。

その後、バイト６から始まる次の命令が、実行するかどうか検討される。ＣＰｔＪが、その命令とタグを取り出す。複合化ビットが１なので、第２の命令も取り出される（その複合ビットは無視される。）。この２つの命令が、同時に実行される。この命令のシーケンスは、第１２図（ｂ）に示した最初のシーケンスであることに留意されたい。実際の命令境界がどこにあるかは未知なので、バイトＯではなくバイト２が命令の始点である可能性がある。バイト２が実行するかどうか検討される時、その命令とタグが取り出される。複合ビットが１なので、もう１つの命令が取り出され、この２つが１対として実行される。この実行は、第１２図（ｂ）の第２のシーケンスに対応する。同様に、最初の命令がバイト４から始まる場合には、第３のシーケンスが実行される。複合ビットを用いると、３つの可能なシーケンスのどれについても、複合化を伴う実行が可能になる。バイト８への分岐が発生する場合には、バイト８が命令の先頭でなければならない。そうでない場合は、そのプログラムにエラーがある。バイト８に関連するタグが使用され、逐次実行を進めることができる。

これによって、分岐目標によってアドレスされる時、複数の有効な複合化ビット・シーケンスが選択される可能性が出てくる。この能力を最善の場合に追加するのも有用であり、最も完全な実施例はこのアルゴリズムを含む。

可能な命令の３つの異なるシーケンスは、１つの独自のシーケンスに収れんすることがあり得る。収れん速度は、特定のビットに依存し、収れんが起こらない場合もある。まず、同一の命令境界への収れんは、複合化の位相がずれた状態で発生し得る。これは、最初の複合化不能な命令またはそれ以前に訂正される。第１２図では、３つのシーケンスが、バイト８にある命令境界上で収れんしていることに留意されたい。

また、追加のシーケンスが６．８．１０などから開始される場合にも、すぐに収れんするであろうことに留意されたい。

シーケンス２と３は、バイト４にある命令境界上で収れんしているが、バイト１６までの複合化では位相がずれる。すなわち、この２つのシーケンスは、同一の命令のシーケンスからの異なる命令の対を考慮したものである。バイト１６は、複合化不能な命令の始点である（複合化アルゴリズムが同時に３個以上の命令を見る場合、同じ最適の組合せを選択することによって、それらのシーケンスがより早く収れんすることもあり得る）。この収れんのため、この場合の複合化アルゴリズムは、３つの異なるシーケンスを試行するフロント・エンドを有することができる。収れんが検出されると、シーケンス数は２に縮小され、その後１に縮小される。この時点から、最善の場合のアルゴリズムが使用できる。単一の複合化装置が使用される場合、収れん検出は、長さが既知のアーキテクチャについて説明した最善の場合よりも、活動シーケンス数に等しい倍率だけ遅くなる。収れんが速い場合、複合化速度が漸近的に等しくなる。収れん速度がデータに依存すると仮定すると、様々な収れん速度の確率に関する統計をとることかできる。しかしながら、例えば、長さシーケンス（４，４，４１，、、）などの収れんが発生する前のバイト数に上限を設けることはできない。

ケース４：最悪の場合の複合化発生し得る最悪の場合は、命令とデータが混在するバイト・ストリームを有し、命令の始まる位置がわかっていない場合である。これは、参照点がわかっていない時にメモリ内または命令キャッシュ内のページを複合化する際に起こり得る。

このケースを扱う方法は、命令のみの場合と同様に始まるが、１つの重要な相違点がある。収れんが起こる場合、収れんによって取り除かれた各シーケンスの代わりに、新しいシーケンスを開始しなければならない。これは、収れんがデータを含むバイト中で発生し得、その結果、３つのシーケンスがすべて、「命令」境界の悪いシーケンスに収れんし得るからである。これは、実命令のシーケンスに出会った時、収れんが起こるのと同じ形で訂正できる（テキストが命令だけを含む場合は、第１２図のように、最終的にすべての複合化シーケンスが同一の命令境界に収れんする）。その結果得られるシーケンスは、それでも正しく実行されるが、検出される複合対が減り、ＣＰＵ性能が低下することになる。１９９０年５月４日出願の米国特許出願第０７１５１９３８２号を参照さことである。最善の場合と同様、２つの命令を検査し、複合ビットを決定する。２バイト後ろからこれを繰り返す。第１３図分例は第１２図の例を前提としており、第１２図と第１３図の複合シーケンスの結果、同じプログラムを実行する。

最悪の場合は、最善の場合または命令のみの場合よりも多数の可能な命令シーケンスの検査を行う手段を有するシステムによって対処される。この場合、タグを生成するのに、より多くの時間またはより多くの複合化装置が必要となる。テキストの使用に関する既知の情報がないので、最大の複合化を達成するのにこれが必要である。複合化の程度を下げてもよければ、上記のシーケンスに修正を加えることができる。

ケース５：混合のケース実際の実施態様では、ＩＣＵの位置、命令セットのアーキテクチャ、およびコンパイラに応じて、上記のうちの任意のケースがＩＣＵに与えられる。興味深いケースは、キャッシュで命令を複合化するものである。これは、複合ビットをキャッシュに保持されることができることが好ましいからである。典型的な命令キャッシュ・ヒツト率は、他の著者等も認めているように高イ（Ａ、　Ｊ、　スミｘ　（Ｓｍｉｔｈ）の論文”ＣａｃｈｅＭｅｍｏｒｉｅｓ、”Ｃｏｍｐｕｔｉｎｇ　５ｕｒｖｅｙｓ、　Ｖｏｌ、　１４．　Ｎｏ、　３．１９８２年９月、　ｐｐ、４７３を参照されたい）。したがって、既に複合化されていて、再び複合化する必要のない命令の再使用が多いことが理解されよう。これは、命令が実行された後に複合化情報が失われる、命令バッファまたはスタックでの複合化とは対照的である。ただし、場合によっては後者を使用してもよい。Ｓ／３７０では、命令とデータが混在できるが、キャッシュは、どのバイトが命令であるか多少の知識を有する。これは、ＣＰｔＪが命令取出し時にこれらのバイトを指定できるからである。上記参照の米国特許出願筒０７１５２２２１９号によれば、迅速に実行するために、キャッシュ・ミス時またはまだ複合化されていない行の一部への分岐時に、少数（多分１個または２個）の命令を、複合化を試みずにＣＰＵに送ることが提案された。ＩＣＵは、このような命令を複合化し、その結果をセーブする。その後、ＩＣＵは、その命令がどこで始まるかの知識を用いて、次の命令から複合化を開始する。ＩＣＵは、少なくともＣＰＵの実行と同じ速さで命令を処理する。その結果、ＣＰＵは、その時点から（次のキャッシュ・ミスまたは分岐が発生するまで）複合命令を受け取る。

このシナリオの下で発生し得る少数の異なる状況がある。

ＩＣＵとＣＰＵが同じ速度で命令を処理する場合、ＩＣＵは、（キャッシュ行のまだ複合化されていない部分への分岐、またはキャッシュ・ミスが発生するまで）ｃｐｕよりわずかに先に進んでいる。データに出会うと、ＩＣＵは、それが命令であるかのようにそのバイトを複合化する。これらのバイトは実行できないので、プログラムは正しく実行される。データ・バイト数が少なく、その後に命令が続いている場合は、ＣＰＵがそのデータの前後で分岐したことをＩＣＵが認識するまで、少数の命令が誤って複合化される可能性がある。しかしながら、生成された複合化情報は、依然として正しい実行をもたらす。ＣＰＵが分岐したとＩＣｔＪが判定する時、実行されなかったことをＩＣＵが知っているバイトに対してとることのできる措置がいくつかある。ＩＣＵは、どのバイトが複合化できるかどうか検査されており、どのバイトが検査されていないかの情報を維持しているものと仮定する。

１、実行されないバイトには、「未検査」のマークを付けることができる。この場合、後でそのコードが実行される場合に、これらのバイトは再検査される。

２、このバイトを、「検査済みｊ状態に残しておくことが可能である。最大の複合化は達成されないであろうが、複合ビットは、実行時に無視されるかもしれないが、正しい。

３、このバイトを、「一部検査済み」状態に残してお（ことが可能である。この状態は、最悪の場合の複合化アルゴリズムの１つのシーケンスと等価である。他のシーケンスは、後で検査できる。

どのアルゴリズムを選択するかは、ハードウェアの考慮点とプログラムの特性に応じて変わる。

ＣＰＵ実行速度は、データ・キャッシュ・ミス、マイクロコード化命令、またはパイプラインのストールなどによって低下し得るので、ＩＣＵがＣＰＵよりかなり前に行くことがあり得る。この距離は、コードの特性に依存する。分岐の発往頻度が低いと、この距離が大きくなり得る。ＩＣＵはＣＰＵより先に進んでいるので、データの存在のためにＩＣＵが命令境界の参照点を見失う可能性が常に存在する。距離が大きくなるほど、この可能性が大きくなる。この状況は、上述のように処理できるが、正しくない命令境界を使って複合化されるバイトの数が多くなるにつれて、性能に及ぼす影響が大きくなり得る。１つの解決策は、複合化の速度を低下させることである。最悪の場合の複合化は、実際の命令をすべて複合化できるかどうか検査する。ＩＣＵがＣＰＵの前方である閾値よりも遠くなる時には、ＩＣＵは、ＣＰｔＪが追いつくまで、最悪の場合の解決プログラム及び多重検査要素に切り替える。閾値の値は、実施上の判断による。

ＣＰＵが、前もって複合化された命令を実行している場合、ＩＣＵは不要である。実施上の選択肢の１つは、コードの他の部分が将来実行できるようになった場合に、ＩＣＵを使用してその部分を複合化することである。コードの部分としては、下記のものが挙げられよう。

木取り出された命令キヤツシユ行の実行されない部分、＊予め取出されたキャッシュ行、＊複合化されずにＣＰＵに直接送られた、分岐目標にある以前に実行された命令、または＊複合化されたかもしれないが、実行されなかったのでデータと区別できない、実際に取った分岐に続く逐次バイト。

まだ実行しなければならない行の部分を複合化する時、ＩＣＵは、検査しているバイト使用の知識を有していないので、最悪の場合のシステムを使用しなければならない。

可能なＩＣＵ機構ＩＣＵには、その位置とテキスト内容の知識に応じて、多くの可能な設計がある。本節では、１つの可能な実施態様の論理的な説明を行う。第１４図は、最悪の場合のアルゴリズムの実施に使用される３つの複合化装置を示す図である。この数は任意であり、テキスト・バッファのハーフワード数と同じ大きさにすることができる。複合化装置は、それぞれバイト０，２、及び４から開始する。可能な命令シーケンスを完了すると、前のシーケンスから６バイトだけオフセットされる。各複合化装置は、タグの内部状態を保存し、テキストの各ハーフワードごとに複合ビットを生成する。３つのシーケンスの論理和をとり、その結果得られる複合シーケンスをテキストと共に記憶する。

もう１度、キャッシュの例を検討する。ある実施態様は、第１４図に示すように複数の複合化装置を有することができる。第１４図で、要素１６０，１６１及び１６２は、命令ファシリティの検査によって識別されるシーケンスのための別々の複合化装置を備えている。これらの複合化装置の出力は、論理和要素１６４にも結合されていることに留意されたい。

ある複合化装置は、最善の場合の長さカウントを使って複合化を行い、ＣＰＵより先に進んでいる。もう１つの複合化装置は、最悪の場合のシステム（最善の場合と組み合わせることができる）を使用し、同一のキャッシュ行の他の部分を複合化する。例えば、第２の複合化装置が、その行の末尾から開始して、その行を逆方向に複合化することができる。

逆方向複合化装置第１５図は、逆方向複合化を示す図である。最後のハーフワードから始めて、前の３つのハーフワードの命令長コードが、−貫した命令境界をもつかどうか検査される。その内の２つが逐次命令であり得る場合には、通常の規則に従って複合化ビットが生成される。このシステム処理には、１ハーフワード後向きに移動しながら繰り返す逐次式の装置が設けられている。この場合も複合化ビットの論理和をとる。第１５図では、バイト２４の可能な命令が検査される。バイト２２だけが、可能な先行命令である。バイト２２が検査される時、バイト２０．１８及び１６のいずれも、それぞれ長さが２．４及び６であるため、可能な先行命令である。バイト２０の検査時には、可能な命令が見つからない。

３個以上の命令を複合化する方法複合化される命令の数を示すのに必要な情報の最小量は、複合化できる数の最大値の対数である。最大値が２の場合、各複合命令ごとに１ビツトが必要である。

最大値が４の場合、３．２．１、または０個の命令を所定の１命令と複合化することができるので、２ビツトが必要である。前述したように、各ハーフワードごとにタグが必要であるが、ＣＰＵは、最初の命令のタグ以外のすべてのタグを無視する。

もう１度、最悪の場合のアルゴリズムを検討する。ただし、今回は４元複合化を行うアルゴリズムである。第１６図を参照されたい。１バイトが、命令であるかのように検査される。

それが複合化できない場合は、その複合化ビットがＯになる。

それが他の命令と複合化できる場合は、第１の命令の複合化ビットは１、第２の命令の複合化ビットは０になる。同様に、３つの命令が複合化される場合、複合化ビットは、それぞれ２．１及びＯになる。この方法では、命令Ａ、Ｂ及びＣを３つ組として複合化できる場合、ＢとＣが対として複合化できるものと仮定している。これは、有効な仮定であると思われる。したがって、Ｂへの分岐が発生する場合には、ＢとＣが複合対として実行される。

前記と同様に、各ハーフワードから始まるバイトを、可能な命令境界をもつかどうか検査しなければならない。より多くの情報が利用できる場合には、命令のみまたは最善の場合のアルゴリズムを使用できる。検査された各シーケンスから、複合化ビットのシーケンスが生成される。この複合シーケンスは、それらのシーケンスによって生成される個々の複合化ビットの最大値をとることによって形成される。複合グループが実行される時、ＣＰＵは、そのグループの第１バイト以外のバイトに関連するすべての複合ビットを無視する。これらの複合ビットは、複合グループを構成する命令数を示す。

実際に使用する複合化規則に応じて、このアルゴリズムに対する何らかの最適化が存在し得る。例えば、第１６図（ｂ）の第５のシーケンス（バイト８から始まる）では、長さが２．４．２及び６の命令が仮定されている。この例では、６バイト命令は絶対に複合化できないので、それ以外の３つの命令（バイト１０，１２．１４）から始めて複合化を試みても利益はない。というのは、この３個の命令は既に可能な限り複合化されているからである。この例が簡単であることから、バイト１４以降から始まる可能なシーケンスは、検査されな転送するビット数を減らすため、複合情報の他の表現があり得る。キャッシュから複合命令が要求された時、複合ビットを異なるフォーマットに変換することができる。例えば、ｔＬ　Ｉ　ＩＩは次の命令と複合化することを意味し、ＩＩ　ＯＩＩは次の命令と複合化しないことを意味するという１命令当たり１ビツトのコード化を用いる。４つの複合化された命令のグループは、コード化ビット（１，１，１，Ｏ）を有するはずである。好ましい実施例では、４つの複合化された命令のグループは、値３．２．１．０を有するものとして表される命令メンバ単位用のコード化タグを有する。命令コードを含まなし１ハーフワードに関連する複合化ビットは、無視される。

命令のグループを複合化するための汎用装置を提示したカ（、検査中のバイトの用途の知識のない最悪の場合の状況で動作する装置を有するシステムを提供することが好ましい。テキスト内容の何らかの知識が利用できる時は、上述のより単純化されたアーキテクチャのように、この装置を単純化することができる。複合グループの命令の最大数が２より大きい時は、基本的長さカウントに対する拡張を使用することができる。

明らかに、本発明を実施するための最善の態様の例として以上で述べた本発明は、プロセッサ性能の潜在的な大きな成長の基礎を提供するものである。したがって、当業者なら本開示の発明を理解すれば気付くであろう様々な修正及び改良を現在及び将来に加えることができることが、本実施例及び他の実施例の再検討の後に、当業者には理解されよう。上記の修正及び将来の改良は、本発明を最初に発明した本発明者等の権利を保護するものと解釈すべき特許請求の範囲に含まれるものであることを理解されたい。

ムーＦＩＧ、４ＡＦＩＧ、４８＝ｒ−−−−−−−−−−−−コＦＩＧ、７記憶ＦＩＧ、８バイト　０　２　４　６　８　１０１２１４１６１８２０２２２４バ　イ　上＊テキストのカワントシーケンスキプログラム命令長シーケンスＣベクトル寓２バイトごとの複合化ビットＦＩＧ、１１（ａ）　゛（ｂ）（Ｃ）長　さ；２バイトごとの命令長コードバ　イ　トコテキストのカワントシーケンス＝可能なプログラム命令！にレーケンスＣベクトル＝２バイトごとの複合化ピットＣＣベクトル冨２バイトごとの合成複合化ビットＦＩＧ、１２ｏ＋＋＋＋＋ｏｏｏ＋＋＋。

置と複合命令の逆方向複合化装置とを有する、異なる属性を有する命令プロセッサ用の命令を複合化するためのシステム開示の要約Ｃｌ５ＣアーキテクチヤおよびＲＩＳＣを含む他の属性を有するアーキテクチャのための命令の複合化に使用できる装置を有するシステムが開示される。複合化が命令実行の前に行われ、適当な命令実行ハードウェア上で並列に実行できる複合命令プログラムをもたらす。特に、本明細書で提案する装置は、命令とデータが混在でき、可変長の命令を含み、命令ストリームが修正できるアーキテクチャに対して複合化能力を提供する。このシステムは、異なる部分的な参照点情報に対処できる。ここに提案する装置の１実施例は、どのテキスト・バイトが命令であり、どれがデータであるかがわからない最悪の場合の状況を扱う。何らかの情報がわかっている場合は、システムを単純化することができる。ここに提示する装置は、任意の命令数に対して複合化能力を提供する。このシステムは、特に、そのい（つかの例を示したＳ／３７０命令セツトを用いる計算機用に開発されている。逆方向複合化装置が提供される。複数の複合ユニットと、シーケンスの論理和演算が、より困難な機構に対するシステム・サポートを提供する。

国際調査報告

Claims

【特許請求の範囲】

１．適用可能な複合化規則を、基本命令シーケンスの命令のバイト・ストリームに適用するための規則手段と、命令コードに対して命令長コードとして割り当てられた固定長のピット・セットの基本命令シーケンス・バイト・ストリームを検査し、複合化規則を適用しながら、ある命令から次の命令へと基本命令バイト・ストリームを逐次走査するための検査手段と、命令長コードの検査の後に、命令複合化ユニットに各命令を識別させるための境界識別手段と、複合化された命令セットの最初の複合命令を示す複合命令のためのタグ・ビット情報を生成するための生成手段と、複合化処理を継続し、複合命令の複合シーケンスを複合プログラムとして提供するための出力手段とを備えたことを特徴とする特定のアーキテクチャに対して複合化できる命令のクラスを規定したアーキテクチャ的複合化規則を有するシステム。
２．命令に存在するハーフワードは、そのハーフワードが最初の複合命令でないことを示すように初期設定されることを特徴とする請求項１記載のシステム。
３．命令は、対になつているかどうか検査されることを特徴とする請求項１記載のシステム。
４．対になっているかどうかの検査で、基本命令の隣接する命令コードより大きいグループを調べ、前記複合化規則に従って、複合化に最適の対を採りあげることを特徴とする請求項１記載のシステム。
５．検査手段は、複合化されることができない命令を含む複合化すべき命令を処理し、検査された命令に、前記生成手段によって、特定の命令が最初の命令でないことを示すタグが付けられ、検査中の組の最初の命令が最初の複合命令として適切でない場合は、その命令に最初の命令ではないことを示すマークが付けられ、検査手段が、検査し終えたばかりのグループの次の逐次命令を含む後続の命令グループを検査することを特徴とする請求項１に記載のシステム。
６．検査されるべき命令は、非命令またはデータと混合されており、前記生成手段は、各ハーフワードに、命令の第１バイトを含むとのマーク、または複合命令の第１バイトを含まない命令とのマークを付け、前記出力手段は、複合化処理の際に、複合命令の第１バイトを含まないとのマークを付けられた命令をスキップすることを特徴とする請求項１記載のシステム。
７．検査中の基本命令セット・ストリームのどこに複数の可能な命令シーケンスとの境界が存在するかがわかっていない場合に各シーケンスごとに可能な境界を決定するための決定手段が設けられ、前記複数の可能なシーケンスの最大値を計算することによって複数のシーケンスを単一のシーケンスに縮小するための論理和手段が設けられていることを特徴とする請求項１記載のシステム。
８．可能な境界を有する３つの可能な命令シーケンスが存在し、そのそれぞれが異なる複合化ビットのシーケンスを生成し、現命令が命令プロセッサによって複合化されるか否かを判定するため、前記論理和手段が、３ビット・シーケンスの論理和をとって、単一のシーケンスを生成することを特徴とする請求項７記載のシステム。
９．可能な境界を有するいくつかの可能な命令シーケンスが存在し、そのそれぞれが異なる複合化ビットのシーケンスを生成し、バイト境界上で収れんするかどうか複数の可能なシーケンスを実験的に試行し、複合化のための収れん手段が設けられ、収れんが検出された時は、収れんしているシーケンスのうちの１つが除去されることを特徴とする請求項１記載のシステム。
１０．単一のシーケンスが残るまで、シーケンス数を縮小させる縮小手段が設けられていることを特徴とする請求項９記載のシステム。
１１．基本命令シーケンスの入力情報のバイト・ストリームで命令とデータが混在している可能性があり、どこで命令が始まるかの知識がない場合に、収れんが発生し、収れんによつてシーケンスが除去された場合、前記収れん手段が、収れんによつて除去されたシーケンスの代わりに新しいシーケンスを開始する手段を含むことを特徴とする請求項９記載のシステム。
１２．各シーケンスは各ハーフワードから開始されることを特徴とする請求項１１記載のシステム。
１３．前記検査手段は命令セットを検査し、前記決定手段によつてシーケンスに対する複合化ビットが決定され、この検査と決定の技法をシーケンス内であるバイト数だけ後から繰り返し、前記論理和手段が、各シーケンスからの複合化ビットの論理和をとって、合成複合ビット命令を形成するように結合されていることを特徴とする請求項７記載のシステム。
１４．中央処理装置、キャッシュ、メモリを有する命令プロセッサと、システムが、スカラー命令の入力シーケンスを処理でき、複合命令の複合メンバ単位のうちの少なくとも一部が、目標命令プロセッサによって並列に実行可能である複合命令プログラムに前記スカラー命令に変換できる複数の複合化ユニットを含む複合化ファシリティと、特定のアーキテクチャに対して複合化できる命令のどれかのクラスでアーキテクチャ的複合化規則をチェックするための検査手段と、適用可能な複合化規則を、基本命令シーケンスの命令のバイト・ストリームに適用するための規則手段と、ビット・セットの基本命令シーケンス・バイト・ストリームを命令コードのために検査し、複合化規則を適用しながら、ある命令から次の命令へと基本命令バイト・ストリームを逐次走査するための検査手段と、命令複合化ユニットに複合命令の命令単位メンバを識別させるための境界手段と、複合化された命令セットの最初の複合命令を示す複合命令のためのタグ・ビット情報を生成するための生成手段と、複合命令の複合シーケンスを、前記命令プロセッサによって実行される複合プログラムとして提供するための出力手段とを備えたことを特徴とする基本命令シーケンスの構成命令を並列に実行できる目標命令プロセッサによって命令を処理し、基本命令のうちの少なくとも一部を並列に実行できるように基本命令シーケンスを複合化するためのシステム。
１５．前記出力手段は、複数の命令が命令を複合化せずに前記命令プログラムを介して中央処理装置に提供されるようにするキャッシュ・ミスまたはまだ複合化されていない行の一部への分岐に対応する手段は、前記複合化ファシリティに設けられていることを特徴とする請求項１４記載のシステム。
１６．複合化ファシリティがバイト・ストリームを検査してデータに出会った場合、複合化ファシリティの出力手段は、それが命令からなるかのようにデータを複合化し、データを実行することができない命令プロセッサは、したがって、複合命令プログラムを正しく実行することを特徴とする請求項１４記載のシステム。
１７．命令に存在するハーフワードは、前記生成手段によって、そのハーフワードが最初の複合命令でないことを示すように初期設定されることを特徴とする請求項１４記載のシステム。
１８．命令が対になっているかどうか検査されることを特徴とする請求項１４記載のシステム。
１９．前記検査手段による対になっているかどうかの検査で、基本命令バイト・ストリームの隣接する命令コードよりも大きいグループを調べ、前記複合化規則に従って、複合化に最適の対を採りあげるための最適化手段が設けられることを特徴とする請求項１８記載のシステム。
２０．検査手段は、複合化できない命令を検査し、このような検査された命令に、前記生成手段によって、特定の命令が最初の命令でないことを示すマークが付けられ、前記生成手段は、検査中の組の最初の命令が最初の複合命令として適切でない場合に、その命令にマークを付け、出力手段は、実行中の命令プロセッサに対してそれが最初の命令であると示さないようにし、前記命令が最初の命令でないとのマークを付けられたので、検査を継続して、検査したばかりのグループの次の逐次命令を含む後続の命令グループを検査することを特徴とする請求項１４記載のシステム。
２１．命令は、非命令またはデータと混合されており、複合命令の命令メンバが、各ハーフワードに、命令の第１のバイトを含むとのマーク、または複合命令の第１のバイトを含まないとのマークを付けられ、前記出力手段は、複合化処理の際に、複合命令の第１のバイトを含まないとのマークを付けられた命令をスキップすることを特徴とする請求項２０記載のシステム。
２２．検査中の基本命令セット・ストリームのどこに複数の可能な命令シーケンスとの境界が存在するかがわかっていない場合に各シーケンスごとに可能な境界を決定するための決定手段が設けられ、前記複数の可能なシーケンスの論理和をとることによって複数のシーケンスを単一のシーケンスに縮小するための論理和手段が設けられていることを特徴とする請求項１４記載のシステム。
２３．可能な境界を有する３つの可能な命令シーケンスが存在し、そのそれぞれが異なる複合化ビットのシーケンスを生成し、現命令が命令プロセッサによって複合化されるか否かを判定するため、前記論理和手段は、３ビット・シーケンスの論理和をとって、単一のシーケンスを生成することを特徴とする請求項２２記載のシステム。
２４．可能な境界を有する複数の可能な命令シーケンスが存在し、そのそれぞれが異なる複合化ビットのシーケンスを生成し、バイト境界上で収れんするかどうか複数の可能なシーケンスを実験的に試行し、複合化のための収れん手段が設けられ、収れんが検出された時は、収れんしているシーケンスのうちの１つが除去されることを特徴とする請求項１４記載のシステム。
２５．単一のシーケンスが残るまで、シーケンス数を縮小させる縮小手段が設けられていることを特徴とする請求項２４記載のシステム。
２６．基本命令シーケンスの入力情報のバイト・ストリームに命令とデータが混在している可能性があり、どこで命令が始まるかの知識がない場合に、収れんが発生し、収れんによってシーケンスが除去された場合、前記収れん手段は、収れんによって除去されたシーケンスの代わりに新しいシーケンスを開始する手段を含むことを特徴とする請求項２４記載のシステム。
２７．各シーケンスはハーフワードごとに開始されることを特徴とする請求項２６記載のシステム。
２８．前記検査手段は命令セットを検査し、前記決定手段によって、シーケンスに対する複合化ビットが決定され、この検査と決定の技法をシーケンスであるバイト数だけ後から繰り返し、前記論理和手段が、各シーケンスからの複合化ビットの論理和をとって、合成複合ピット命令を形成するように結合されていることを特徴とする請求項２２記載のシステム。
２９．複合化ファシリティによって処理されつつある基本命令シーケンスの入力情報のバイト・ストリームで命令とデータが混在している可能性があり、どこで命令が始まるかの知識がない場合に、収れんが発生し、収れんによってシーケンスが除去された場合、収れんによって除去されたシーケンスの代わりに新しいシーケンスが開始されることを特徴とする請求項９記載のシステム。
３０．各シーケンスはハーフワードごとに開始されることを特徴とする請求項２９記載のシステム。
３１．命令セットの１グループが検査され、複合化ビットが決定された後に、検査手段は、再びあるグループに対してシーケンスであるバイト数だけ後から検査のための処理を繰り返し、各シーケンスからの複合化ビットの論理和をとって合成複合ビット命令が形成されることを特徴とする請求項２９記載のシステム。
３２．複数の複合化ユニットが設けられ、それぞれが合成複合ベクトルとして組み合わされる出力を有する前記複数の別々の複合化ユニットによって、命令セットが検査され、複合化ビットが決定され、シーケンスが検査されることを特徴とする請求項１４記載のシステム。
３３．前記複数の複合化ユニットに結合された論理和ユニットが設けられ、命令セットが検査され、前記出力手段によって、前記論理和ユニットと前記複合化ユニットの出力に基づいて、合成複合ベクトルが生成されることを特徴とする請求項３２記載のシステム。
３４．複合命令の２つの命令メンバ単位は、命令プロセッサによって並列に実行できる１対の命令を形成することを特徴とする請求項１４記載のシステム。
３５．メモリからの命令取り出しの処理中命令が識別され、検索の後、検査の前に、これらが命令であってデータでないとのマークを付けられることを特徴とする請求項１４記載のシステム。
３６．命令の複合ビットは、複合グループ命令を構成する命令数を示すことを特徴とする請求項１記載のシステム。
３７．複合命令のメンバ単位が複数存在し、複合命令に対して、複合命令のメンバ命令単位に適用される、それが次の命令と複合化されるか否かを示す情報が供給されることを特徴とする請求項１記載のシステム。
３８．実行中のシステム命令プロセッサの中央処理装置は、複合命令の第１の命令メンバのタグ情報以外のすべてのタグ情報を無視することを特徴とする請求項１記載のシステム。
３９．検査中に、実行されないバイトが未検査のマークを付けられ、その場合に、そのコードが後で命令プロセッサによって実行できるようになった場合、これらのバイトが再検査されることを特徴とする請求項１記載のシステム。
４０．検査中に、実行されないバイトが検査済みの状態に残されて、これらが実行中に無視され、あるいは実行されなくても、位置が正しいことを示すことを特徴とする請求項１記載のシステム。
４１．検査中に、他のシーケンスが後で検査できるように、バイトは部分的に検査済みのシーケンスの状態に残されることを特徴とする請求項１記載のシステム。
４２．命令の複合ビットは、複合グループ命令を構成する命令数を示すことを特徴とする請求項１４記載のシステム。
４３．複数の複合命令のメンバ単位が存在し、複合命令に対して、複合命令のメンバ命令単位に適用される、それが次の命令と複合化されるか否かを示す情報が供給されることを特徴とする請求項１４記載のシステム。
４４．実行中のシステム命令プロセッサの中央処理装置は、複合命令の第１の命令メンバのタグ情報以外のすべてのタグ情報を無視することを特徴とする請求項１４記載のシステム。
４５．検査中に、実行されないバイトは未検査のマークを付けられ、その場合に、そのコードが後で命令プロセッサによって実行できるようになった場合、これらのバイトが再検査されることを特徴とする請求項１４記載のシステム。
４６．検査中に、実行されないバイトは検査済みの状態に残されて、これらが実行中に無視され、あるいは実行されなくても、位置が正しいことを示すことを特徴とする請求項１４記載のシステム。
４７．検査中に、他のシーケンスが後で検査できるように、バイトは部分的に検査済みのシーケンスの状態に残されることを特徴とする請求項１４記載のシステム。
４８．複数の逆方向複合化ユニットを含む逆方向複合化ファシリティと、それらが命令の先頭であるかのように候補のビット・セットを検査し、命令ストリームを逆方向に移動して、命令の先頭と見なされる時、複合命令を判定するための規則手段に適用される他のすべてのビット・セットを見つけ、ある命令から前の命令へと命令ストリームを逆方向に進むための検査手段と、チェック、規則、境界、生成及び出力の手段とを備えたことを特徴とする命令を複合化するためのシステム。
４９．最後のハーフワードから始めて、一貫した命令境界をもつかどうか前の３つのハーフワードの命令長コードを検査しチェックする手段と、２つの命令を、あるアーキテクチャに適用される複合化規則に従って生成される複合化ビットを伴う逐次命令として処理する手段と、検査とチェックを１ハーフワード後方に移動させる手段と、その後、複合化ビットの論理和をとって複合命令を提供するための比較手段とを含む逆方向複合化手段を備えたことを特徴とする命令を複合化するためのシステム。
５０．転送するビット数を減らすために、複合情報の代りの表現があり得、複合命令が要求される時、複合ビットを異なるフォーマットに変換できることを特徴とする請求項１記載のシステム。
５１．命令あたり１ビットは次の命令と複合化されることを意味する値と、次の命令と複合化されないことを意味する値０の符号化に用いることを特徴とする請求項５０記載のシステム。
５２．命令が対になっているかどうか検査されることを特徴とする請求項４９記載のシステム。
５３．ハーフワードが検査されることを特徴とする請求項４９記載のシステム。
５４．複数の前記逆方向複合化手段は、結果を組み合わせることを特徴とする請求項４９記載のシステム。
５５．複合化の結果は、論理和に結合されることを特徴とする請求項５４記載のシステム。
５６．３つの前のビット・セットは、複合化できるかどうか検討されることを特徴とする請求項４９記載のシステム。
５７．順方向複合化と逆方向複合化の両方が行われることを特徴とする請求項１４記載のシステム。
５８．前記複合化ファシリティに、使用可能な参照点情報に応じて複数の動作モードを提供するための制御手段が設けられていることを特徴とする請求項１４記載のシステム。
５９．前記制御手段は動作モード間で動的に切り替えられることを特徴とする請求項５２記載のシステム。
６０．検査中の基本命令セット・ストリームのどこに複数の可能な命令シーケンスとの境界があるかがわかっていない場合に各シーケンスごとに可能な境界を決定するための決定手段が設けられ、前記複数の可能なシーケンスの論理和をとることによって複数のシーケンスを単一のシーケンスに縮小するための論理和手段が設けられていることを特徴とする請求項７記載のシステム。