JP2949857B2

JP2949857B2 - パイプライン型データプロセッサにおける命令キューを満たす方法

Info

Publication number: JP2949857B2
Application number: JP2418553A
Authority: JP
Inventors: ラッセル・レーニンガー; ウィリアム・ビー・レッドベター・ジュニア
Original assignee: Motorola Inc
Current assignee: Motorola Solutions Inc
Priority date: 1990-01-02
Filing date: 1990-12-28
Publication date: 1999-09-20
Anticipated expiration: 2014-09-20
Also published as: EP0436341B1; US5317701A; EP0436341A2; DE69030648T2; EP0436341A3; KR910014804A; DE69030648D1; JPH05324317A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、一般的にデータ処理装
置に関する。さらに詳しくは命令パイプラインを有する
データ処理装置に関する。

【０００２】

【従来の技術】今日の高性能データ処理装置は、各命令
が一連の単純な機械操作から構成されている、複雑な組
合せの命令を実行する。特にこれらのデータ処理装置は
長さの可変する（複数の機械操作）命令と、実行時間
（命令毎に複数のクロック・サイクル）とを有してい
る。これらの可変長命令は、さまざまなアドレス・モー
ドで動作する多くの命令によってなされるメモリ・アク
セスを容易にする。

【０００３】従来のパイプラインを持たないデータ処理
装置では、各命令は、次の命令が始まる前に最後まで実
行される。全体の性能を高めながら、機械操作の効率を
向上させるためには、従来のデータ処理装置設計にパイ
プラインを有するデータ処理装置が実現された。これら
のパイプラインを有するデータ処理装置は、継続する命
令のサブ操作を重ね合わせることにより、いくつかの命
令を平行に実行することができる。パイプラインを有す
るデータ処理装置が１つの新しい命令を取り出し、クロ
ック・サイクル毎に他の命令の実行を完了させることが
最適である。このため、複雑な命令に必要な実際の実行
時間は変化するが、全体的な実行速度はクロック・サイ
クル毎の１個の命令に近づくことになる。その結果、パ
イプラインを有する処理装置を用いることにより、デー
タ処理装置の全体的な性能が著しく向上する。

【０００４】１個のサイクル命令実行を行うためには、
命令先取り（プリフェッチ）ユニット（ＩＰＵ：Ｉｎｓ
ｔｒｕｃｔｉｏｎＰｒｅｆｅｔｃｈＵｎｉｔ）は、
クロック・サイクル毎に必要な数の命令を命令パイプラ
イン（ＩＰ：ＩｎｓｔｒｕｃｔｉｏｎＰｉｐｅｌｉｎ
ｅ）にロードすることのできる命令の流れを保たなけれ
ばならない。もしＩＰＵが、必要な命令の流れを維持す
ることができなければ、そしてＩＰに必要な数の命令語
がロードされなければ、パイプラインの機能停止が起こ
る。従来の技術では、一時的に複数の命令（たとえば４
ないし８個の命令）を記憶する命令キュー（所定数のバ
ッファ）を持つＩＰＵもある。命令キューは、ディスパ
ッチャとして機能し、ＩＰに対して一連の命令を発す
る。プログラム実行中は、命令キューのバッファは、定
期的に空にされる。そのため、バッファを再び満たす機
構が必要である。通常は、追加の論理回路が先取り命令
キューに付加されて、その中に記憶されている各命令か
ら必要な情報を引き出し、命令キューが空になるとそれ
を再び満たす。このような追加の論理回路を導入するこ
とにより、チップ・エリアの有効利用が図られる。

【０００５】

【発明が解決しようとする課題】再び満たすための機構
は、任意の組合せの１，２または３語の命令をクロック
・サイクル毎にＩＰにロードできるように、命令の流れ
を維持しなければならない。そのうえ、再び満たすため
の機構は、フロー変化命令（たとえば分岐点など）に対
処して、命令キューが必要な命令の流れによって満たさ
れているようにしなければならない。

【０００６】従って、本発明の目的は、改良されたデー
タ処理装置先取り機構を提供することである。

【０００７】本発明の他の目的は、格納装置内の命令の
もっとも早い廃棄点を検出することのできる、改良され
たデータ処理装置先取り機構を提供することである。

【０００８】本発明のさらに他の目的は、命令順序決定
装置によって、命令の使用率に基づき、命令キューを再
び満たすことのできる、改良されたデータ処理装置先取
り機構を提供することである。

【０００９】本発明の上記およびその他の目的は、以下
に説明する方法を行うことにより達成される。その方法
は、メモリから命令シーケンスを先取りする先取りコン
トローラを有するデータ・プロセッサにおいて、パイプ
ライン命令ユニットが調べる命令語数に基づき命令キュ
ーを満たす方法であって、各命令は１以上の命令語から
成り、先取りコントローラはメモリに結合され命令キュ
ーに所定数の命令語をロードし、命令キューは所定数の
バッファを有し、バッファは所定の命令語境界を有しメ
モリから取り出された整数個の命令語を格納し、当該方
法は：マシン・サイクルの所定の第１期間において先取
りコントローラ内のキュー・ポインタ（ｑｕｅｕｅｐ
ｏｉｎｔｅｒ）により命令キューに与えられる第１制御
信号に応答して、命令シーケンスに含まれる１以上の命
令語から成る第１命令をパイプライン命令ユニットにロ
ードする段階；パイプライン命令ユニットにおいて第１
命令をデコードして第１命令の命令語数を調べる段階で
あって、命令語数は、第１命令がロードされた後パイプ
ライン命令ユニットが調べるパイプ移動量の値に対応す
る、段階；パイプライン命令ユニットにより、マシンサ
イクルの所定の第２期間において第２制御信号を先取り
コントローラに与える段階であって、第２制御信号は第
１命令の命令語数を指示する、段階；先取りコントロー
ラが第２制御信号を受信したことに応答して、キュー・
ポインタの現在値をパイプライン命令ユニットのパイプ
移動量の値に対応する量だけインクリメントする段階で
あって、キュー・ポインタはパイプライン命令ユニット
にロードされる第２命令を指示し、第２命令は命令キュ
ーに格納される１以上の命令語から成る、段階；および
メモリから次の命令シーケンスを取り出して命令キュー
を満たす取出段階から構成され、取出段階は：キュー・
ポインタの現在値と第１命令がロードされた後パイプラ
イン命令ユニットが調べるパイプ移動量とを結合したも
のが、命令キュー内の所定数のバッファ内の１つにおい
て、格納された命令シーケンスにおける最後の命令語を
示す場合又は命令語境界を越えたことを示す場合にメモ
リから次の命令シーケンスを取り出して命令キューを満
たす段階から構成される。

【００１０】

【実施例】図１は、本発明の好適な実施例による、デー
タ処理装置１０の構造を図解したブロック図である。デ
ータ処理装置１０は、整数ユニット１２，命令メモリユ
ニット１４，データ・メモリ・ユニット１６．バス・イ
ンターフェース・ユニット（ＢＩＵ：ＢｕｓＩｎｔｅ
ｒｆａｃｅＵｎｉｔ）１８，システム・バス２０．メ
モリ２２．内部命令データバス２４，内部ワードデータ
バス２６およびバッファ２８，３０とから構成されてい
る。本発明の好適な実施例においては、整数ユニット１
２は、命令ユニット３２と命令先取りユニット（ＩＰ
Ｕ）３４とから構成されている。命令メモリ・ユニット
１４は、命令キャッシュコントローラ３６．命令キャッ
シュ３８および命令変換ルックアサイド・バッファ（Ｉ
ＴＬＢ：ＩｎｓｔｒｕｃｔｉｏｎＴｒａｎｓｌａｔｉ
ｏｎＬｏｏｋ−ａｓｉｄｅＢｕｆｆｅｒ）４０とか
ら構成されている。同様に、データ・メモリ・ユニット
１６は、データ・キャッシュ・コントローラ４２．デー
タ変換ルックアサイド・バッファ（ＤＴＬＢ：Ｄａｔａ
ＴｒａｎｓｌａｔｉｏｎＬｏｏｋ−ａｓｉｄｅＢｕ
ｆｆｅｒ）４４およびデータ・キャッシュ４６とから構
成されている。命令キャッシュ・コントローラ３６は、
ＩＴＬＢ４０と、命令キャッシュ３８とを管理する。同
様に、データ・メモリ・コントローラ２２はＤＴＬＢ４
４とデータ・キャッシュ４６とを管理する。好適な実施
例においては、命令キャッシュ３８とデータ・キャッシ
ュ４６とは、４種セット連想キャッシュで、それぞれ４
ＫＢのキャッシュ記憶容量に対し、４個の１６バイトラ
インからなる６４セットを有している。

【００１１】図２に示すのは、本発明によるデータ処理
装置１０の命令先取りユニット（ＩＰＵ）３４の内部構
造を図解したブロック図である。ＩＰＵ３４は、バッフ
ァ・デマルチプレクサ（ＢＤＥＭＵＸ）４８，命令キュ
ー５０，バッファ５４および先取りコントローラ５６と
から構成されている。好適な実施例においては、命令キ
ュー５０は８個の命令語（１２８ビット）を持ち、２個
の４語キューバッファＱＵＥＵＥＺＥＲＯ，ＱＵＥＵ
ＥＯＮＥ５１ａ，５１ｂおよび命令マルチプレクサ
（ＩＭＵＸ）５２とから構成されている。従って、ＱＵ
ＥＵＥＺＥＲＯ５１ａとＱＵＥＵＥＯＮＥ５１ｂ
とは、それぞれ６４ビットの広さで、それぞれ４個の命
令語を記憶する。

【００１２】動作中は、ＩＮＵ３２は、バッファ５４を
介してＩＭＵＸ５２から命令を受け取る。ＩＮＵ３２
は、受け取った命令の長さ（パイプ移動量）と、その命
令が実行操作すべき内容を解読する。先取りコントロー
ラ５６内のプログラム・カウンタ（ＰＣ）は、現在の命
令語を指し示し、キュー・ポインタとして機能する。命
令の解読が終了すると、ＩＮＵ３２は命令パイプライン
移動を先取りコントローラ５６に転送し、先取りコント
ローラ５６はそのパイプ移動を現在のＰＣに追加する。
先取りコントローラ５６は、ＰＣの下位のｎビット（た
とえばｎ＝３）を用いてＩＭＵＸ５２から新しい命令語
を選択する。本発明においては、８個のキュー・ポイン
タのうちの１つがラッピング・ファンネル・シフタ（ｗ
ｒａｐｐｉｎｇｆｕｎｎｅｌｓｈｉｆｔｅｒ −
図３参照）を通じて、ＩＭＵＸ５２のキューから３個の
命令語を選択し、その３個の命令語はバッファ５４に転
送される。先取りコントローラ５６からＣＯＮＴＲＯＬ
（制御）信号を受信するとすぐに、バッファ５４はＩＮ
Ｕ３２に新しい命令をロードする。この命令の長さは
１，２または３語である。ＩＮＵ３２は再び命令を解読
して実行操作および命令長を割り出し、パイプライン移
動（０ないし３語）を先取りコントローラ５６に転送す
る。先取りコントローラ５６はＰＩＰＥ移動の量だけ、
ＰＣを進めて、キュー・ポインタがＰＣの下位３ビット
を用いてＩＭＵＸ５２から新しい命令を選択する。

【００１３】命令パイプラインの移動が、ＱＵＥＵＥ
ＺＥＲＯ５１ａまたはＱＵＥＵＥＯＮＥ５１ｂのい
ずれかに記憶されていた命令語を排出すると、先取りコ
ントローラ５６はメモリからの命令語読み取りリクエス
トを起動させて、排出されたキュー・バッファ５１ａま
たは５１ｂを満たす。好適な実施例においては、先取り
コントローラ５６は、次の命令語のためのＲＥＡＤＲ
ＥＱＵＥＳＴ（リクエスト読み取り）信号を命令メモリ
ユニツト１４に発する。命令メモリユニット１４は、リ
クエストされた命令が命令キヤツシユ３８内にあるかど
うかを判定する。要求された一連の命令語が命令キヤツ
シユ３８内にある場合は、キャッシュの「ヒット」が起
こり、命令メモリユニツト１４は適当な半直線（６４ビ
ット）を、命令キャッシュ３８からＢＤＥＭＵＸ４８に
転送する。半直線とは後述するように１つのキャッシュ
・ラインに含まれるものの半分のものを意味する。先取
りコントローラ５６は、ＬＯＡＤ（ロード）信号をＢＤ
ＥＭＵＸ４８に転送し、それによってＱＵＥＵＥＺＥ
ＲＯ５１ａとＱＵＥＵＥＯＮＥ５１ｂのローディン
グを交互に行う。たとえば（図３Ｂに示されるよう
に）、ＢＤＥＭＵＸ４８は、現在の命令サイクル中に、
キャッシュ・ラインｎの後半の部分をＱＵＥＵＥＯＮ
Ｅ５１ｂにロードして、次の命令サイクル中に、キ
ャッシュ・ラインｎ＋１の前半部分をＱＵＥＵＥＯＮ
Ｅ５１ｂにロードする。このように、命令キュー５０
に対する書き込みが、ＱＵＥＵＥＺＥＲＯ５１ａとＱ
ＵＥＵＥＯＮＥ５１ｂとの間で、メモリアクセスに無関
係に、交互に行われる。

【００１４】通常、命令キャッシュ３８は１回の命令サ
イクル中に、命令キュー５０をロードする。もし必要な
命令が命令キャッシュ３８内にないときは、命令キャッ
シュコントローラ３６が、命令の先取り中にキャッシュ
「ミス」の発生を判定して、（ＢＩＵ２０を介して）メ
モリ２２に対しＢＵＲＳＴＲＥＱＵＥＳＴ（リクエ
ストのバースト）信号を発する。ＢＵＲＳＴＲＥＱＵ
ＥＳＴ信号に応答して、ＢＩＵ２０はメモリ２２から
リクエストされたキャッシュ・ライン全体を検索して、
そのキャッシュ・ラインを命令キャッシュ３８にロード
する。次に命令メモリユニット１４が適当なキャッシュ
半直線をＢＤＥＭＵＸ４８に転送して、命令キュー５０
内に転送させる。

【００１５】本発明においては、最適化された命令（た
とえば、移動、シフトおよび演算／論理命令など）は、
最大３語の長さを有している。与えられた合令の長さは
ＩＮＵ３２が命令を解読するまでは未知であるので、Ｉ
ＮＵＸ５２はＩＮＵ３２に対して（バッファ５４を介
し）、クロック・サイクル毎に３個の命令語をロードす
る。従って先取りコントローラ５６は、命令キュー５０
内に、ＩＮＵ３２にクロック・サイクル毎に３語の最適
化された命令をロードするのに十分な情報を維持してい
る。このタスクを実行するためには、先取りコントロー
ラ５６はＱＵＥＵＥＺＥＲＯ５１ａまたはＱＵＥＵ
ＥＯＮＥ５１ｂのデータがいつ排出されるのかを判
定して、それにしたがって、空になったキュー・バッフ
ァＱＵＥＵＥＺＥＲＯ５１ａまたはＱＵＥＵＥＯ
ＮＥ５１ｂを満たさなければならない。本発明では、
命令キュー５０にロードするために用いられる方法は、
プログラム・カウンタ（キュー・ポインタ）と、命令解
読または命令実行により指定される、命令の流れ（キュ
ー）の移動とに基づいている。特に、命令キュー５０
は、現在のキュー・ポインタと命令パイプライン（ＰＩ
ＰＥ）移動が、（１）ＱＵＥＵＥＺＥＲＯ５１ａま
たはＱＵＥＵＥＯＮＥ５１ｂの最後のワードである
か、（２）４語のバッファ境界を越えて、現在のポイン
タによってアクセスされたキュー・バッファ（ＱＵＥＵ
ＥＺＥＲＯ５１ａまたはＱＵＥＵＥＯＮＥ５１
ｂ）を排出させたときに、再び満たされる。

【００１６】図３Ａおよび図３Ｂは、１０個の命令サイ
クル期間に渡る、ＱＵＥＵＥＺＥＲＯ５１ａとＱＵＥ
ＵＥＯＮＥ５１ｂのローディングと、命令キャッシ
ュ３８の内容とを図解している。１０個の命令サイクル
中には、ＩＮＵ３２には命令キュー５０から、ＩＭＵＸ
６６を介して、各サイクル毎に３語がロードされる。図
３Ａは、命令キャッシュ３８のキャッシュ・ラインｎか
らｎ＋３までのメモリ内容を図示したものである。たと
えばラインｎは、８個の命令語「ＡＡＡＢＢＢＣＣ」
を含んでいる。図３Ｂに示すのは、命令キュー５０（Ｑ
ＵＥＵＥＺＥＲＯ５１ａおよびＱＵＥＵＥＯＮＥ
５１ｂ）のローディングと、命令キャッシュ３８の内容
および命令ユニット３２のパイプライン（ＰＩＰＥ）の
ローディングである。図３Ｂでは、アスタリスクは、命
令サイクル中に、ＱＵＥＵＥＺＥＲＯ５１ａとＱＵＥ
ＵＥＯＮＥ５１ｂのいずれのキュー・バッファがキ
ャッシュ半直線を受け取ったかを表す。

【００１７】本発明においては、先取りコントローラ５
６は２つのモード、すなわち、逐次モードと、フロー変
化モードで操作することができる。逐次モードでの操作
中は、先取りコントローラ５６は、前述したようにＱＵ
ＥＵＥＺＥＲＯ５１ａとＱＵＥＵＥＯＮＥ５１ｂ
とのローディングを交替に行う。特に逐次モードの操作
では、先取りコントローラ５６は、ＩＮＵ３２のローデ
ィング後、命令キュー５０に残っているワード数に基づ
いて、メモリＲＥＡＤＲＥＱＵＲＥＳＴ（読み取りリ
クエスト）信号を発する。逆に、フロー変化モードの操
作中は、先取りコントローラ５６は、命令キュー５０内
に残っているワード数とは関わりなく、ＱＵＥＵＥＺ
ＥＲＯ５１ａとＱＵＥＵＥＯＮＥ５１ｂとの両方
に、命令キャッシュ３８（または外部メモリ２２）から
ロードする。このため、ＩＮＵ３２が現在ある命令がフ
ロー変化（ＣＯＦ）命令であると判定すると、ＩＮＵ３
２は先取りコントローラ５６に対してＣＯＦ信号を送
る。ＣＯＦ信号に応答して、先取りコントローラ５６は
たとえばＱＵＥＵＥＺＥＲＯ５１ａをロードして、Ｑ
ＵＥＵＥＺＥＲＯ５１ａのローディング後ただちに、
ＱＵＥＵＥＯＮＥ５１ｂをロードする。このような
先取りによって、命令キュー５０は、あたかも、ターゲ
ット命令（たとえば分岐点）にインライン命令実行を通
じて到達した場合と同じ状態になる。

【００１８】図解の目的のみのために描かれた図３Ｂに
示すように、先取りコントローラ５６は命令メモリユニ
ット１４に対してＲＥＡＤＲＥＱＵＥＳＴ信号を発し
て、それにより、命令メモリユニット１４はＱＵＥＵＥ
ＺＥＲＯ５１ａおよびＱＵＥＵＥＯＮＥ５１ｂ
に、キャッシュ・ラインｎの内容をロードする。したが
って、ＲＥＡＤＲＥＱＵＥＳＴ信号に応答して、命令
メモリユニット１４は、アスタリスクで示されるよう
に、ＱＵＥＵＥＺＥＲＯ５１ａに命令語「ＡＡＡＢ」
をロードし、ＱＵＥＵＥＯＮＥ５１ｂには語「ＢＢ
ＣＣ」をロードする。最初の命令サイクルの前半で、Ｉ
ＮＵ３２はＰＩＰＥ内にある現在の命令を解読して（現
在の命令は図３Ｂには示されていない）、０ないし３語
のＰＩＰＥ移動を先取りコントローラ５６に転送する。
つぎにＩＮＵ３２は、命令の実行を従来の方法で進め
る。最初の命令サイクルの後半で、先取りコントローラ
５６は所定のＰＩＰＥ移動に基づきＰＣを進めて、ＩＭ
ＵＸ６６から次のセットの語を選択する。従ってキュー
・ポインタはＩＭＵＸ６６から３語を選択し（「ＡＡ
Ａ」）、それはＩＮＵ３２（ＰＩＰＥ）にロードされ
る。

【００１９】第２命令サイクルの前半で、ＩＮＵ３２は
「ＡＡＡ」命令を解読して、先取りコントローラ５６に
応答し、命令語長が３であることを知らせる。先取りコ
ントローラ５６は、ＰＩＰＥ移動によって現在のキュー
・ポインタを増分させてから、ＱＵＥＵＥＺＥＲＯ
５１ａ内には（ＰＩＰＥのロード後は）１語しか残って
いないことを判定する。この判定の結果に基づいて先取
りコントローラ５６は第２命令サイクルの前半におい
て、キャッシュ・ラインｎ＋１の前半部分（「ＣＤＤ
Ｄ」）をＱＵＥＵＥＺＥＲＯ５１ａにロードするた
め（矢印で示されるように）、ＲＥＡＤＲＥＱＵＥＳ
Ｔ信号を命令メモリ・ユニット１４に発する。上記に説
明したように、先取りコントローラ５６は命令キャッシ
ュ３８のアクセスにかかわらず、ＱＵＥＵＥＺＥＲＯ
５１ａとＱＵＥＵＥＯＮＥ５１ｂのローディングを
交互に行う。第２の命令サイクルの後半で、先取りコン
トローラ５６はＰＣを３だけ進めて、命令キュー５０か
ら他のセットの語を選択する。したがって、キュー・ポ
インタはＩＭＵＸ６６から３語を選択し（「ＢＢ
Ｂ」）、それは第２命令サイクルの後半でＰＩＰＥにロ
ードされる。

【００２０】第３の命令サイクルの前半で、ＩＮＵ３２
は「ＢＢＢ」命令を解読して、上述のように、先取りコ
ントローラ５６に再び応答する。第３命令サイクルの後
半で、先取りコントローラ５６はＰＣを進めて、ＩＭＵ
Ｘ６６から次の命令語のセット（「ＣＣＣ」）を選択し
て、それがＰＩＰＥにロードされる。第４命令サイクル
の前半で、ＩＮＵ３２は「ＣＣＣ」命令を解読して、先
取りコントローラ５６に対して命令語長が３であること
を応答する。先取りコントローラ５６は、ＰＩＰＥ移動
が４語バッファ境界を越えていることを確認して、それ
によってＱＵＥＵＥＯＮＥ５１ｂに格納されている
データを排出する。その結果、先取りコントローラ５６
はＲＥＡＤＲＥＱＵＥＳＴ信号を命令メモリ・ユニッ
ト１４に発して、キャッシュ・ラインｎ＋１の後半
（「ＥＥＥＦ」）を、矢印で示されるように、次のサイ
クル中（第５命令サイクルの前半）にＱＵＥＵＥＯＮ
Ｅ５１ｂにロードする。第４命令サイクルの後半で
は、先取りコントローラ５６はＰＣを進めて、ＩＭＵＸ
６６から次のセットの語（「ＤＤＤ」）を選択して、そ
れがＰＩＰＥにロードされる。この逐次の先取り方法
は、ＩＮＵ３２がフロー変化命令を検出するまで継続さ
れる。

【００２１】本発明では、先取りコントローラ５６は、
フロー変化命令（たとえば分岐点命令）に応答して、２
回または３回の４語先取りを行う。前述したように、Ｉ
ＮＵ３２は各命令の命令長および／またはパイプ移動と
を解読して実行操作を行う。フロー変化命令を検出する
と、ＩＮＵ３２は、フロー変化（ＣＯＦ）信号と、命令
アドレスとを先取りコントローラ５６に転送する。ＣＯ
Ｆ信号に応答して、先取りコントローラ５６は必要な数
の命令先取りサイクル（２回または３回の４語先取り）
を、命令の一部として開始する。

【００２２】本発明においては、ＩＮＵ３２はクロック
・サイクルの前半で、ＰＩＰＥ移動の量（たとえば０な
いし３語）を先取りコントローラ５６に応答する。先取
りコントローラ５６は、クロック・サイクルの後半を使
って、プログラム・カウンタ（キュー・ポインタ）を進
めて、命令キュー５０から他のセットの語を選択する。
命令キュー５０を満たす方法は、プログラム・カウンタ
と、命令解読または命令実行の後にＩＮＵ３２によって
指定される命令ストリーム移動とに基づいている。キュ
ーを満たす方法のモデルを以下に図解する。

【００２３】

【００２４】したがって、本発明においては、キューを
満たす方法は、３語の最適化された命令がＩＮＵＥ３２
（ＰＩＰＥ）にロードされた後、および命令キュー５０
が命令キャッシュ３８からロードされる前に、命令キュ
ー５０内に残っている語数によって決まる。上記のケー
ス１および２に示したように、ＰＩＰＥロード後に命令
キュー内に３語以上が残っていると、先取りコントロー
ラ５６は命令メモリ・ユニット１４に対して、ＲＥＡＤ
ＲＥＱＵＥＳＴを発しない。同様に、すべてのケース
で説明したように、ＰＩＰＥ移動がゼロの場合は、先取
りコントローラ５６はＲＥＡＤＲＥＱＵＥＳＴ信号を
発しない。そのため、命令の先取りは起こらない。キュ
ー・ポインタ（ＰＣ）と、ＰＩＰＥ移動（ＭＯＶＥ）
が、４語バッファ境界を越えると、次の命令サイクル中
に必要な命令語が先取りされる（ケース３および４）。
ケース４では、キュー・ポインタはまず命令キューバッ
ファＱＵＥＵＥＺＥＲＯ５１ａおよびＱＵＥＵＥＯ
ＮＥ５１ｂの最後の語を指し示す。その結果、先取り
コントローラ５６は、ＰＩＰＥ移動の量に関わらずＲＥ
ＡＤＲＥＱＵＥＳＴ信号を発しない。これは、命令キ
ャッシュ３８からの必要な半直線がすでに検索されてい
るからである（図３Ｂ参照）。

【００２５】好適な実施例において本発明を解説してき
たが、開示された発明は、多くの方法に改変することが
でき、上記に特定されたもの以外のさまざまな実施例を
前提とするものであることは、当業者には明白であろ
う。たとえば、キューを満たす方法を改変して、３語よ
り大きい最適化された命令を、クロック・サイクル毎に
命令ＰＩＰＥにロードすることもできる。特に、命令キ
ュー５０を、たとえば１６命令語（２５６ビット）まで
対応できるような大きさにすると、ＰＩＰＥからの全キ
ャッシュ・ラインのアクセスが可能となる。さらに、Ｉ
ＭＵＸ６６を改変して、３語より大きいセットの語をク
ロック・サイクル毎に命令ＰＩＰＥ内にロードできるよ
うにすることもできる。同様に、ＩＰＵ３４はＩＮＵ３
２に対して、一語長の複数の命令をディスパッチするこ
ともできる。このように、ＩＰＵ３４は、クロック・サ
イクル毎にさまざまな長さの命令を与えたり、さまざま
な数の命令を与えることができ、さらに、ＩＮＵ３２に
よる命令の使用数に応じて、命令キューを満たすことが
できる。したがって、添付された請求項は、本発明の信
念と範囲内に当てはまる全ての修正を含むものとする。

【図面の簡単な説明】

【図１】本発明によるデータ処理装置システムのブロッ
ク図である。

【図２】図１のデータ処理装置の命令先取りユニットの
ブロック図である。

【図３Ａ】命令キューをロードする図１の命令キャッシ
ュの４本のラインのメモリ内容を、命令形式で図解した
ものである。

【図３Ｂ】図２の命令先取りユニットの命令キューのロ
ーディングを図解した表である。

【符号の説明】

１０データ処理装置１２整数ユニット１４命令メモリ・ユニット１６データ・メモリ・ユニット１８バス・インターフェース・ユニット２０システム・バス２２メモリ２４内部命令データ・バス２６内部ワードデータ・バス２８・３０バッファ３２命令ユニット３４命令先取りユニット３６命令キャッシュ・コントローラ３８命令キャッシュ４０命令変換ルックアサイド・バッファ４２データ・キャッシュ・コントローラ４４データ変換ルックアサイド・バッファ

フロントページの続き (56)参考文献特開昭61−214029（ＪＰ，Ａ) 特開昭63−24327（ＪＰ，Ａ) 特開昭56−27455（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁶，ＤＢ名) G06F 9/38 G06F 9/32

Claims

(57)【特許請求の範囲】

【請求項１】メモリから命令シーケンスを先取りする
先取りコントローラを有するデータ・プロセッサにおい
て、パイプライン命令ユニットが調べる命令語数に基づ
き命令キューを満たす方法であって、各命令は１以上の
命令語から成り、前記先取りコントローラは前記メモリ
に結合され命令キューに所定数の命令語をロードし、前
記命令キューは所定数のバッファを有し、前記バッファ
は所定の命令語境界を有し前記メモリから取り出された
整数個の命令語を格納し、当該方法は：マシン・サイクルの所定の第１期間において前記先取り
コントローラ内のキュー・ポインタにより前記命令キュ
ーに与えられる第１制御信号に応答して、前記命令シー
ケンスに含まれる１以上の命令語から成る第１命令を前
記パイプライン命令ユニットにロードする段階；前記パイプライン命令ユニットにおいて前記第１命令を
デコードして前記第１命令の命令語数を調べる段階であ
って、前記命令語数は、前記第１命令がロードされた後
パイプライン命令ユニットが調べるパイプ移動量の値に
対応する、段階；前記パイプライン命令ユニットにより、前記マシンサイ
クルの所定の第２期間において第２制御信号を前記先取
りコントローラに与える段階であって、前記第２制御信
号は前記第１命令の命令語数を指示する、段階；前記先取りコントローラが前記第２制御信号を受信した
ことに応答して、前記キュー・ポインタの現在値を前記
パイプライン命令ユニットの前記パイプ移動量の値に対
応する量だけインクリメントする段階であって、前記キ
ュー・ポインタは前記パイプライン命令ユニットにロー
ドされる第２命令を指示し、前記第２命令は前記命令キ
ューに格納される１以上の命令語から成る、段階；およ
び前記メモリから次の命令シーケンスを取り出して前記
命令キューを満たす取出段階から構成され、前記取出段
階は：前記キュー・ポインタの現在値と前記第１命令がロード
された後前記パイプライン命令ユニットが調べるパイプ
移動量とを結合したものが、前記命令キュー内の前記所
定数のバッファ内の１つにおいて、格納された命令シー
ケンスにおける最後の命令語を示す場合、又は前記キュ
ー・ポインタの現在値と前記第１命令がロードされた後
前記パイプライン命令ユニットが調べるパイプ移動量と
を結合したものが、前記命令キュー内の前記所定数のバ
ッファ内の１つにおいて、命令語境界を越えたことを示
す場合に前記メモリから次の命令シーケンスを取り出し
て前記命令キューを満たす段階から構成される方法。
【請求項２】メモリから所定数の命令語を先取りして
命令キューに格納させる先取りコントローラを有するデ
ータ・プロセッサにおいて、所定数の命令語をロードし
た後パイプライン命令ユニットが調べるパイプ移動量に
基づき前記命令キューを満たす方法であって、前記命令
キューは所定数のバッファを有し、前記バッファは所定
の命令語境界を有し前記メモリから取り出された整数個
の命令語を格納し、各命令は１以上の命令語から成り、
前記先取りコントローラは前記命令キューから前記パイ
プライン命令ユニットに所定数の命令語を提供し、当該
方法は：前記パイプライン命令ユニットにおいて所定数の命令語
から成る第１命令をデコードして前記パイプライン命令
ユニットのパイプ移動量を調べる段階であって、前記パ
イプ移動量は、マシンサイクルの所定の第１期間におい
て前記パイプライン命令ユニットで使用される前記第１
命令の命令語数に対応する、段階；前記先取りコントローラが、マシンサイクルの所定の第
２期間において前記パイプライン命令ユニットから第１
制御信号を受信したことに応答して、前記先取りコント
ローラにおけるキュー・ポインタの現在値を前記パイプ
ライン命令ユニットのパイプ移動量に対応する量だけイ
ンクリメントする段階であって、前記第１制御信号は、
前記パイプライン命令ユニットのパイプ移動量を示す、
段階；および前記メモリから次の所定数の命令語を取り
出して前記命令キューを満たす取出段階から構成され、
前記取出段階は：前記キュー・ポインタの現在値と前記第１命令がロード
された後前記パイプライン命令ユニットが調べるパイプ
移動量とを結合したものが、前記命令キュー内の前記所
定数のバッファ内の１つにおいて、格納された命令シー
ケンスにおける最後の命令語を示す場合、又は前記キュ
ー・ポインタの現在値と前記第１命令がロードされた後
前記パイプライン命令ユニットが調べるパイプ移動量と
を結合したものが、前記命令キュー内の前記所定数のバ
ッファ内の１つにおいて、命令語境界を越えたことを示
す場合に前記メモリから次の所定数の命令語を取り出し
て前記命令キューを満たす段階から構成される方法。
【請求項３】メモリから命令シーケンスを先取りする
先取りコントローラを有するデータ・プロセッサにおい
て、前記パイプライン命令ユニットが使用する命令語数
に応じて前記パイプライン命令ユニットが調べるパイプ
移動量に基づき命令キューを満たす方法であって、前記
命令シーケンスは長さが可変である命令から成り、各命
令は１以上の命令語から成り、前記命令キューは所定数
のバッファを有し前記メモリから取り出された整数個の
命令語を格納し、当該方法は：マシン・サイクルの所定の第１期間において前記パイプ
ライン命令ユニットが所定数の命令語をデコードし、命
令の長さと、該命令を前記パイプライン命令ユニットが
実行した結果生じるパイプライン命令ユニットのパイプ
移動量とを調べる段階；前記パイプライン命令ユニットが、前記パイプ移動量を
示す第１制御信号を前記先取りコントローラに与える段
階であって、前記パイプ移動量は実行される命令の長さ
の値に対応する、段階；マシンサイクルの所定の第２期間において前記パイプ移
動量に基づいて前記命令キューから次の所定数の命令語
を特定するため、前記先取りコントローラにおいてキュ
ー・ポインタの現在値を進める段階；および前記メモリ
から次の命令シーケンスを取り出して前記命令キューを
満たす取出段階から構成され、前記取出段階は：前記キュー・ポインタの現在値と所定数の命令語がロー
ドされた後前記パイプライン命令ユニットが調べるパイ
プ移動量とを結合したものが、前記命令キュー内の前記
所定数のバッファ内の１つにおいて、格納された命令シ
ーケンスにおける最後の命令語を示す場合、又は前記キ
ュー・ポインタの現在値と所定数の命令語がロードされ
た後前記パイプライン命令ユニットが調べるパイプ移動
量とを結合したものが、前記命令キュー内の前記所定数
のバッファ内の１つにおいて、命令語境界を越えたこと
を示す場合に前記メモリから次の命令シーケンスを取り
出して前記命令キューを満たす段階から構成される方
法。
【請求項４】メモリから所定数の命令語を先取りして
命令キューに格納させる先取りコントローラを有するデ
ータ・プロセッサにおいて、所定数の命令語をロードし
た後パイプライン命令ユニットが調べる命令語数に基づ
き命令キューを満たす方法であって、各命令は１以上の
命令語から成り、前記命令キューは所定数のバッファを
有し、前記バッファは所定の命令語境界を有し、前記先
取りコントローラは前記命令キューからパイプライン命
令ユニットに所定数の命令語を提供させ、当該方法は：前記パイプライン命令ユニットにおいて所定数の命令語
から成る第１命令をデコードして前記パイプライン命令
ユニットのパイプ移動量を調べる段階であって、前記パ
イプ移動量は、マシンサイクルの所定の第１期間におい
て前記パイプライン命令ユニットで調べられた第１命令
の命令語数に対応する、段階；前記マシンサイクルの所定の第２期間において前記パイ
プライン命令ユニットから第１制御信号を受信したこと
に応答して、前記先取りコントローラにおけるキュー・
ポインタの現在値を前記パイプライン命令ユニットのパ
イプ移動量だけインクリメントする段階であって、前記
第１制御信号は前記パイプライン命令ユニットのパイプ
移動量に対応する、段階；前記キュー・ポインタによりインクリメントした値に基
づき前記マシンサイクルの次のマシンサイクルにおい
て、前記命令キューから次の所定数の命令語を選択して
前記パイプライン命令ユニットにロードする段階；およ
び前記メモリから次の所定数の命令語を取り出して前記
命令キューを満たす取出段階から構成され、前記取出段
階は：前記キュー・ポインタの現在値と前記第１命令がロード
された後前記パイプライン命令ユニットが調べるパイプ
移動量とを結合したものが、前記命令キュー内の前記所
定数のバッファ内の１つにおいて、格納された命令シー
ケンスにおける最後の命令語を示す場合、又は前記キュ
ー・ポインタの現在値と前記第１命令がロードされた後
前記パイプライン命令ユニットが調べるパイプ移動量と
を結合したものが、前記命令キュー内の前記所定数のバ
ッファ内の１つにおいて、命令語境界を越えたことを示
す場合に前記メモリから次の所定数の命令語を取り出し
て前記命令キューを満たす段階から構成される方法。