JP2003521761A

JP2003521761A - マイクロプロセッサ用遅延スロット制御メカニズム

Info

Publication number: JP2003521761A
Application number: JP2001500949A
Authority: JP
Inventors: リブカブラム，; メニーヤンニ，
Original assignee: インフィネオンテクノロジーズアクチェンゲゼルシャフト
Priority date: 1999-05-26
Filing date: 2000-04-27
Publication date: 2003-07-15
Anticipated expiration: 2020-04-27
Also published as: CN1153131C; KR20020003882A; JP3639557B2; WO2000073896A1; KR100479281B1; CN1382274A; EP1190308A1; US6275929B1

Abstract

(57)【要約】動作中のマイクロプロセッサによって、動的な数の内在的なノップ命令を挿入する方法。内在的なノップ命令は、プログラム自体に実際のノップ命令を入れることなしに、マイクロプロセッサによって実行される動作なし命令である。本発明の方法は、適切な数の内在的なノップ命令が、多重サイクル命令が起こるごとに、自動的に計算および実行されることを可能にする。以下、ノップ命令という用語は、プログラマまたは高水準言語コンパイラの直接的な介入なしに自動的に起こるプロセスを示す。適切な数の内在的なノップ命令は、必要な遅延スロットの総数から、ＩＤＳＩ数を減算することによって、自動的にマイクロプロセッサによって計算される。ＩＤＳＩ数は好適にはアセンブラによって判定され、次いでマイクロプロセッサにとって利用可能となる。

Description

【発明の詳細な説明】

【０００１】（発明の分野および背景）本発明は、種々の数の有用な命令を遅延スロットに挿入する方法に関し、具体
的には、有用な命令が遅延スロットに入れられることを可能にしながら、実質的
には実際のノップ（ｎｏｐ）（動作なし）命令をプログラム自体に入れることな
しに、多重サイクル命令を実行するために、自動的且つ様々に遅延スロットに挿
入されるべき追加のノップ命令数を判定する方法に関する。本発明の方法は、フ
ェッチ動作数が減少するため、消費電力を節約すると共に、プログラムを格納す
るのに必要なメモリ内の空間の量を減らす。これらの利点は、依然遅延スロット
が使用されることを可能にしながら達成される。

【０００２】マイクロプロセッサは、約２５年前に導入されて、多くの異なるタイプの技術
において急速に増加してきた。リアルタイムのマイクロプロセッサ技術の進歩は
、特に通信産業においては、携帯電話、留守番電話およびオーディオシステムな
どの高度なデバイスの大量生産を後押ししてきた。開発および生産のコストを下
げながら、技術の性能を上げるために、これらのデバイスの生産のより効率的な
方法が、継続的に追求されている。

【０００３】マイクロプロセッサは、人間のプログラマまたはコードジェネレータによって
書かれるプログラムコードから得られる機械コード命令を実行する。現代のマイ
クロプロセッサの命令のほとんどは、シングルクロックサイクル内で実行される
。しかしながら、いくつかの命令は、実行するために１より多いクロックサイク
ルを必要とし、多重サイクル命令と呼ばれる。典型的な多重サイクル命令は、条
件付きブランチ命令、およびその他のプログラムフロー命令を含む。多重サイク
ル命令が効力を発する前に経過するクロックサイクルが浪費される。これらのク
ロックサイクルは、遅延スロットと呼ばれる。

【０００４】図１は、多重サイクル命令１４に必要な３つの空のサイクル１２を挿入するこ
とによって浪費される時間を示す、従来技術のプログラムの命令シーケンス１０
を示す。各空のサイクル１２は、シングルサイクル命令１６を実行するという結
果をもたらさず、多重サイクル命令１４の実行を可能にするためにのみ挿入され
る。明らかに、命令シーケンス１０は、多重サイクル命令１４の実行を可能にす
る、相対的に非能率的な方法を表す。

【０００５】マイクロプロセッサのパイプラインアーキテクチャは、より高い効率のために
より多い命令を平行して実行するように開発された。パイプライン化されたマイ
クロプロセッサは、いくつかの命令を同時に実行することが可能であるため、マ
イクロプロセッサが空のタイムスロット中にアイドル状態になるということがな
い。多重サイクル命令の実行に必要な、以前には浪費されていた時間を使用する
ために、他の命令が人間のプログラマによって遅延スロットに挿入され得る。マ
イクロプロセッサは、遅延スロット中にこれらの遅延スロット命令を個々にフェ
ッチし、これらの命令をパイプにロードし、次いで命令を同時に実行する。これ
らの挿入された命令は通常、遅延スロットが元々生成された多重サイクル命令に
関係しない。代わりに、これらの命令は、制御という仕事、続く命令のロードの
登録など、その他のタスクを実行する。

【０００６】図２は、従来技術によるパイプライン化されたアーキテクチャを有するマイク
ロプロセッサによって実行されるように書き換えられた、図１のプログラムを示
す。ここで、プログラムの命令シーケンス１８は、多重サイクル命令１４用の遅
延スロット中に、サイクル４、５、６において実行される３つの命令２０を特徴
とする。それゆえ、図２のプログラムは、図１のプログラムに比べ、より効率的
に実行される。

【０００７】しかしながら、現在パイプライン化されているマイクロプロセッサアーキテク
チャは、多数の弱点を有している。例えば、有用な命令が遅延スロットに挿入さ
れない場合には、時間とプログラムを保持するメモリ空間の双方が、多重サイク
ル命令によって浪費される。すべてではなく一部の遅延スロットのみが有用な命
令によって満たされる場合には、現在使用されていない遅延スロットがノップ（
動作なし）命令をロードされる必要がある。ノップ命令は、メモリ空間を必要と
するが、いかなる有用な機能をも実行しない。このようなノップ命令が頻繁に必
要とされるため、遅延スロットの問題は単に減少するのみであり、解決はされな
い。それゆえ、追加のメモリ空間の必要性と浪費される時間量との間のバランス
という問題がある。

【０００８】浪費される時間とメモリ空間の問題に加えて、プログラマの必要性もまた考慮
されなければならない。プログラマは、性能を最適化するために、できるだけ多
くの遅延スロットを有用な命令で満たすべきであるが、有用な命令を見つけるこ
とが簡単であることはほとんどない。有用な命令をすべての遅延スロットに挿入
するプロセスは、時間がかかるものであり、文書化および維持することが困難で
ある。プログラマは、多くの時間を、有用な命令を探して遅延スロットに入れる
ことに費やす。さらに、Ｃコンパイラなどの高水準言語コンパイラもまた、遅延
スロットを有用な命令で満たそうと試みる必要がある。最適化アルゴリズムをも
ってしても、このようなコンパイラは、しばしばすべての遅延スロットを使用す
ることができず、それゆえにプログラムを格納するために必要な追加の空間を浪
費している。

【０００９】プログラムフロー命令は、このような多重サイクル命令の１例であって、典型
的な通信用途において、平均、１８シングルサイクル命令ごとに、１プログラム
フロー命令の割合で起こる。この割合は、平均的なプログラムフロー命令が、以
下の式１によって、３つの必要なノップ命令を生成することを知りながら、予測
される浪費されるメモリ量を計算するために使用され得る。

【００１０】

【数１】式１は、例えば、サイズが１８Ｋｂであるプログラムが、他のタイプの多重サ
イクル命令によって浪費されるメモリを含まずに、３Ｋｂのメモリを浪費してい
ることを示す。このようなメモリの浪費は、生産コストを増加させるとともに、
関連のデバイスの動作の効率を下げる。それゆえ、多重サイクル命令は、時間お
よびプログラムメモリを浪費すること、および遅延スロットを命令に使用しよう
とする際に、プログラマによって要求される時間量を増やすことを含め、３股の
問題をもたらす。

【００１１】多重サイクル命令が起こる相対的に高い割合は、パイプライン化されたマイク
ロプロセッサアーキテクチャの欠点を強調させる。現在、多重サイクル命令を処
理する２つの異なる方法が、従来技術において利用可能である。第１の方法は、
いかなる遅延スロットをも使用せず、それゆえに時間を浪費するがメモリを節約
することを含む。これはマイクロプロセッサが、プログラムにノップ命令を明示
的に含ませることなしに、ノップ命令を実行し得るからである。第２の方法は、
実際の命令またはノップ命令を挿入することにより、すべての遅延スロットが使
用されることを必要とする。ノップ命令が挿入される場合には、必要とされるメ
モリ空間が増加する。しかしながら、実際の命令が効率的に挿入される場合、プ
ログラムを実行するのに必要な時間量が減少する。

【００１２】第１の従来技術の方法は、プログラムの実行に高度な性能（時間に関して）が
必要とされない場合に、選択される。プログラムの実行の性能、そしてそれゆえ
にプログラムが実行されるのに必要な時間量ではなく、メモリの節約とプログラ
マによるプログラミングの容易さが優先される。第２の従来技術の方法は、効率
的に実行される必要がある、高度な性能のアプリケーション向けに設計される。
したがって、プログラムの急速で効率的な実行に興味のあるプログラマは、有用
な命令をすべての遅延スロットに挿入する必要がある。このタスクは、長ったら
しく退屈なタスクであるが、高い実行効率を得る可能性がある。したがって、こ
のタスクは、すべての遅延スロットが使用される場合には、プログラムを実行す
るのに必要な時間量を減少させ得、すべての遅延スロットが有用に使用されるわ
けではない場合には、プログラムを格納するのに必要なメモリ量が増大するとい
う不利益を生じさせ得る。遅延スロットのすべてを使用することに失敗した場合
、ノップ命令が残りの使用されていない遅延スロットのすべてに挿入されること
になる。それゆえ、多重サイクル命令を処理する従来技術の方法のうち、３つす
べての利点、すなわちスピード、メモリの経済的且つ効率的な使用、およびプロ
グラミングの容易さを提供するものはない。

【００１３】それ故に、人間のプログラマまたは高水準言語コンパイラによって、有用な命
令のみを明示的に遅延スロットに挿入させることで、遅延スロットをより効率的
に処理する方法であって、同時に、性能を改善し、開発時間およびコストを下げ
、このような有用な命令を保持する追加のメモリ空間の必要性とプログラム実行
中にこのような内在的なノップ命令によって浪費される時間量との最適なバラン
スを提供する方法が必要とされ、それを有することが有用である。これらの方法
を用いて、内在的なノップ命令が、マイクロプロセッサの動作中に実質的に自動
のプロセスに残っている遅延スロット数を補完するために挿入され、かつマイク
ロプロセッサに関連付けられたメモリ空間がより効果的に使用される。

【００１４】（発明の要旨）本発明は、動作中のマイクロプロセッサによって、動的な数の内在的なノップ
命令を挿入する方法に関する。内在的なノップ命令は、プログラム自体に実際の
ノップ命令を入れることなしに、マイクロプロセッサによって実行される動作な
し命令である。本発明の方法は、適切な数の内在的なノップ命令が、多重サイク
ル命令が起こるごとに、自動的に計算および実行されることを可能にする。以下
、ノップ命令という用語は、プログラマまたはコードジェネレータの直接的な介
入なしに起こるプロセスを自動的に示す。適切な内在的なノップ命令数は、必要
な遅延スロットの総数から、挿入された遅延スロット命令（ＩＤＳＩ）数を減算
することによって、自動的にマイクロプロセッサによって計算される。

【００１５】本発明の方法は、プログラムを格納するのに必要なメモリ内の空間量を減少さ
せると共に、フェッチ動作数が減少するために、消費電力を節約するという利点
を有する。さらに、本発明は、このような有用な命令を保持する追加のメモリ空
間の必要性と、プログラム実行中に浪費される時間量との最適なバランス、およ
びノップ命令の挿入と、人間のプログラマが有用な遅延スロット命令を挿入する
のに必要な追加の時間とのバランスを提供する。挿入された遅延スロット命令数
は、好適にはアセンブラによってカウントされ、次いでマイクロプロセッサにと
って利用可能となる。より好適には、この数は、アセンブラによってコード化さ
れた命令内の遅延スロットフィールド内に入れられ、次いでマイクロプロセッサ
によって遅延スロットフィールドから取り出される。それゆえに、本発明の方法
によって、マイクロプロセッサは、図１の従来技術とは対照的に、追加のメモリ
リソースを必要とせず、そしてプログラマまたは高水準言語コンパイラなどのコ
ードジェネレータに、使用されていない遅延スロットの各々にノップ命令を挿入
させることを強制することなしに、自動的に必要数の内在的なノップ命令を挿入
し、多重サイクル命令が効力を発するのに必要なサイクルを満たすことが可能に
なる。多重サイクル命令用に挿入された遅延スロット命令（ＩＤＳＩ）は、内在
的か内在的でないかに関わらず、ノップ命令ではないという点で有用な命令であ
る。

【００１６】本発明によると、複数の命令を実行中に、マイクロプロセッサによって必要数
のノップ（動作なし）命令を自動的に挿入する方法が提供される。複数の命令は
、少なくとも１つの多重サイクル命令を含み、遅延スロットの総数が、少なくと
も１つの多重サイクル命令に必要である。本方法は、（ａ）少なくとも１つの多
重サイクル命令に関連した、挿入された遅延スロット命令（ＩＤＳＩ）数を判定
する工程と、（ｂ）遅延スロットの総数からＩＤＳＩ数を、マイクロプロセッサ
によって減算することによって、必要数のノップ命令を計算する工程と、（ｃ）
マイクロプロセッサによって必要数のノップ命令を実行する工程とを含む。

【００１７】好適には、少なくとも１つの多重サイクル命令に必要な遅延スロットの総数は
、ハードウェア依存型である。また好適には、本方法は、複数の命令を受け取る
アセンブラを提供し、複数の命令をマイクロプロセッサによる実行のために準備
する工程をさらに含み、アセンブラを提供する工程が工程（ａ）が実行される前
に実行され、工程（ａ）は、（ｉ）アセンブラによってＩＤＳＩ数をカウントす
る工程と、（ｉｉ）ＩＤＳＩ数をマイクロプロセッサに伝達する工程とをさらに
含む。より好適には、ＩＤＳＩ数をマイクロプロセッサに伝達する伝達する工程
が、（Ｉ）少なくとも１つの多重サイクル命令内に遅延スロットフィールドを提
供する工程と、（ＩＩ）アセンブラによってＩＤＳＩ数を遅延スロットフィール
ドに入れる工程と、（ＩＩＩ）マイクロプロセッサによってＩＤＳＩ数を遅延ス
ロットフィールドから取り出す工程とをさらに含む。

【００１８】本発明の別の実施形態によると、複数の命令を実行中に、マイクロプロセッサ
によって、必要数のノップ命令を自動的に挿入する方法が提供される。複数の命
令は、少なくとも１つの多重サイクル命令を含み、本方法は、（ａ）複数の命令
を受け取るアセンブラを提供する工程と、（ｂ）マイクロプロセッサに、少なく
とも１つの多重サイクル命令に必要な遅延スロットの総数を提供する工程と、（
ｃ）アセンブラによって、少なくとも１つの多重サイクル命令に関連したＩＤＳ
Ｉ数を判定する工程と、（ｄ）ＩＤＳＩ数をマイクロプロセッサに伝達する工程
と、（ｅ）遅延スロットの総数からＩＤＳＩ数を、マイクロプロセッサによって
減算することによって、必要数のノップ命令を計算する工程と、（ｆ）マイクロ
プロセッサによって必要数のノップ命令を実行する工程とを含む。以下、高水準
言語コンパイラという用語は、アセンブリプログラミング言語よりハイレベルな
、ＣまたはＣ⁺⁺などのプログラミング言語のためのコンパイラを示す。

【００１９】上述およびその他の目的、局面、利点は、図面を参照しながら、以下の本発明
の好適な実施形態の詳細な説明から、よりよく理解される。

【００２０】（発明の詳細な説明）本発明は、動作中のマイクロプロセッサによって、動的な数の内在的なノップ
命令を挿入する方法に関する。内在的なノップ命令は、プログラム自体に実際の
ノップ命令を入れることなしに、マイクロプロセッサによって実行される動作な
し命令である。本発明の方法は、適切な数の内在的なノップ命令が、多重サイク
ル命令が起こるごとに、自動的に計算および実行されることを可能にする。以下
、ノップ命令という用語は、プログラマまたは高水準言語コンパイラの直接的な
介入なしに自動的に起こるプロセスを示す。適切な内在的なノップ命令数は、必
要な遅延スロットの総数から、挿入された遅延スロット命令（ＩＤＳＩ）数を減
算することによって、自動的にマイクロプロセッサによって計算される。

【００２１】ＩＤＳＩ数は好適にはアセンブラによってカウントされ、次いでマイクロプロ
セッサにとって利用可能となる。より好適には、この数は、アセンブラによって
コード化された命令内の遅延スロットフィールド内に入れられ、次いでマイクロ
プロセッサによって遅延スロットフィールドから取り出される。それゆえに、本
発明の方法によって、マイクロプロセッサは、追加のメモリリソースを必要とせ
ず、そしてプログラマまたは高水準言語コンパイラに、使用されていない遅延ス
ロットの各々にノップ命令を挿入させることを強制することなしに、自動的に必
要数の内在的なノップ命令を挿入することが可能になる。

【００２２】本発明による、効率的な遅延スロット使用方法の原理および動作は、図面およ
び添付の記載を参照してよりよく理解され得る。これらの図面は、説明の目的の
みに提示され、発明を限定するものではないことが理解されるべきである。

【００２３】ここで図面を参照すると、図３は、本発明による、効率的な遅延スロットを使
用する例示的な方法の模式的ブロック図である。図示されるように、プログラム
の少なくとも一部を表す、例示的な命令シーケンス２２は、多重サイクル命令２
４を特徴とする。命令シーケンス２２は、多重サイクル命令２４の遅延スロット
中に実行されるただ１つの挿入された遅延スロット命令（ＩＤＳＩ）２６を特徴
とする。残りの遅延スロットは、動的な数の内在的なノップ命令で満たされる。
内在的なノップ命令は、プログラム内に入れられないノップ命令であり、ゆえに
、使用されていない遅延スロットは、ノップ命令をメモリ内に挿入することを必
要としない。内在的なノップ命令数は、使用されていない遅延スロット数と同等
になるように様々に変化する。それ故に、人間のプログラマまたは高水準言語コ
ンパイラは、ＩＤＳＩまたはノップ命令ですべての遅延スロットを満たすように
強制されない。

【００２４】動的な数の内在的なノップ命令を挿入する利点は、所望するだけ多くの有用な
遅延スロット命令のみを挿入し、それにより、浪費されるサイクルを最小化させ
る一方、プログラムに必要なメモリ量を減少させる能力を含む。その上、人間の
プログラマは、より速やかに且つ効率的に命令をプログラム且つデバッグするこ
とが可能である。なぜならば、有用な遅延スロット命令は遅延スロットの一部し
か使用せず、それにより特定の製品を開発するために必要な開発時間量および人
時間量が減少するからである。

【００２５】対照的に、このような多重サイクル命令を実行する現在利用可能な従来技術の
方法は、著しく効率が劣る。例えば、図４は、従来技術による模式的ブロック図
であり、図３の命令を示しているが、本発明の方法を実施してはいない。図示さ
れるように、例示的命令シーケンス２８は、再度多重サイクル命令２４および１
つの遅延スロット命令２６を特徴とする。しかしながら、従来技術の方法は、多
重サイクル命令２４のための遅延スロットの所定の数を満たすために、２つのノ
ップ命令３０の挿入を必要とし、それゆえに２つの遅延スロットを浪費する。そ
のため、明らかに図４の従来技術の方法は、本発明の方法ほど効率がよくない。

【００２６】図５Ａは、マイクロプロセッサによる動作のための、本発明の方法の１例を説
明するフローチャートである。マイクロプロセッサが多重サイクル命令を実行す
るには、マイクロプロセッサは、遅延スロットごとに遅延スロット命令またはノ
ップ命令を挿入する必要がある。本発明において、ノップ命令は様々に決定され
た数の内在的なノップ命令であって、図５Ａに示される方法によって決定される
。

【００２７】簡単に言えば、多重サイクル命令に必要な遅延スロット（ＴＤＳ）の総数が、
ステップ１に示されるように、マイクロプロセッサにとって利用可能である。必
要な遅延スロットの総数は、ハードウェア依存型である。ステップ２において、
アセンブラは、多重サイクル命令用に挿入された遅延スロット命令（ＩＤＳＩ）
数を判定する。これらは、内在的か内在的でないかに関わらず、ノップ命令では
ないという点で有用な命令である。内在的なノップ命令の目的は、多重サイクル
命令実行中に、ＩＤＳＩに使用されない時間を満たすことである。

【００２８】好適には、アセンブラは、多重サイクル命令用に挿入された有用な各遅延スロ
ット命令をカウントすることによって、挿入された遅延スロット命令数（ＩＤＳ
Ｉ数）を判定する。

【００２９】ステップ３において、好適には、アセンブラは、ＩＤＳＩ数（使用された遅延
スロット数）をコード化された多重サイクル命令内の遅延スロットフィールド内
に入れる。命令の遅延スロットフィールドは、ＩＤＳＩ数を格納する追加の好適
なフィールドであり、典型的には（必ずしもそうではないが）２〜３ビット長で
ある。

【００３０】ステップ４において、多重サイクル命令のＩＤＳＩ数は、アセンブラによって
マイクロプロセッサに与えられる。好適には、マイクロプロセッサは、動作中に
、コード化された命令の遅延スロットフィールドを調査することによってＩＤＳ
Ｉ数を取得し、必要な内在的なノップ命令数（使用されていない遅延スロット数
であるＵＵＤＳ数）を計算する。

【００３１】ステップ５において、マイクロプロセッサは、式２：ＵＵＤＳ＝ＴＤＳ−ＩＤＳＩに示されるように、ＴＤＳ数（必要な遅延スロットの総数）からＩＤＳＩ数（挿
入された遅延スロット命令数）を減算することによってＵＵＤＳ数を計算する。

【００３２】ステップ６において、マイクロプロセッサは、多重サイクル命令の実行中に、
必要数の内在的なノップ命令を挿入する。

【００３３】図５Ａの方法を動作する１例は、図５Ｂを参照して記載される。図５Ｂは、メ
インプログラム３４およびルーチン３６を備えたプログラム３２の一部を示す。
複数のシングルスロット命令３８もまた示される。ｒｏｕｔｉｎｅ＿ｎａｍｅと
いう名前を有するルーチン３６（第２のプログラム）を引き起こす、コール命令
４０が示されている。ルーチン３６の動作は、リターン命令４２によって終了す
る。例えば、分岐する前に現在の環境を格納するコール命令４０は、コール命令
４０が効力を発する前に４つのクロックサイクルを必要とする。１つのクロック
サイクルが、コール命令４０のコードに必要であり、３つのクロックサイクルが
３つの遅延スロットに必要である。メインプログラム３４が制御を再開する前に
、環境を回復する必要があるリターン命令４２は、例えば６つのクロックサイク
ルを必要とする。１つのクロックサイクルが、リターン命令４２のコードに必要
であり、５つのクロックサイクルが５つの遅延スロットに必要である。それゆえ
に、コール命令４０およびリターン命令４２の双方が、多重サイクル命令である
。

【００３４】コール命令４０およびリターン命令４２の動作に必要な内在的なノップ命令数
を計算するには、マイクロプロセッサは、多重サイクル命令が起こるごとに遅延
スロットに挿入されてきた遅延スロット命令数を知る必要がある。図５Ａに関し
て記載されるように、マイクロプロセッサは、コード化された命令の遅延スロッ
トフィールドからこの数を取り出す。

【００３５】この例において、１つの有用な遅延スロット命令（ＩＤＳＩ）４４は、プログ
ラマによって、３つの必要な遅延スロットのうちの、コール命令４０用に挿入さ
れている。２つの有用な遅延スロット命令４４は、５つの必要な遅延スロットの
うちのリターン命令４２用に挿入されている。

【００３６】コンパイルするプログラム３２のプロセス中において、アセンブラはコール命
令４０用に挿入された遅延スロット命令４４の数をカウントする。これはこの例
においては番号１である。したがって、アセンブラは、番号１をコール命令４０
の遅延スロットフィールドにロードする。この情報は、実行中にマイクロプロセ
ッサとの通信のためにメモリにロードされる。３つの遅延スロットが必要である
ため、マイクロプロセッサは、図５Ａに関して記載されるように、２つの内在的
なノップ命令を実行する。

【００３７】同様に、アセンブラはまた、リターン命令４２用に挿入された遅延スロット命
令４４の数をカウントする。これはこの例においては番号２である。したがって
、アセンブラは、番号２をリターン命令４２の遅延スロットフィールドにロード
する。５つの遅延スロットが必要であるため、マイクロプロセッサは、ここでも
図５Ａに関して記載されるように、３つの内在的なノップ命令を実行する。

【００３８】それゆえに、本発明の遅延スロット制御メカニズムの方法は、以下の利点を有
する。第１に、本発明の方法は、プログラムの性能とプログラムに必要なメモリ
空間量をトレードオフする。代わりに、本発明は、このような有用な命令を保持
する追加のメモリ空間の必要性と、プログラム動作中に浪費される時間量との最
適なバランス、およびノップ命令の挿入と、人間のプログラマが有用な遅延スロ
ット命令を挿入するのに必要な追加の時間とのバランスを提供する。

【００３９】第２に、本発明の方法は、人間のプログラマ、高水準言語コンパイラまたはそ
の他の自動機械語コードプログラミングツールが、有用な遅延スロット命令を含
まない遅延スロットごとに、ノップ命令を挿入する必要性の不利益を避け、それ
によりプログラマは、プログラムに必要なだけ、有用な遅延スロット命令を挿入
し得る。それゆえに、ＩＤＳＩですべての遅延スロットを満たさない不利益を避
けることと、同時にＩＤＳＩに利用可能な遅延スロットの少なくとも一部を使用
する利益を受けることとのバランスが維持される。

【００４０】上記の記載は例としてのみ与えられ、多くの別の実施形態が本発明の精神およ
び範囲内で可能であることが理解される。

【図面の簡単な説明】

【図１】図１は、遅延スロットなしに、多重サイクル命令を処理する第１の例示的な従
来技術の方法の模式的ブロック図である。

【図２】図２は、遅延スロットなしに、多重サイクル命令を処理する第２の例示的な従
来技術の方法の模式的ブロック図である。

【図３】図３は、本発明による、効率的な遅延スロット使用の例示的な方法の模式的ブ
ロック図である。

【図４】図４は、図２に示されるアーキテクチャに類似のアーキテクチャを介して、す
べての遅延スロットを使用せずに、図３の命令を実行する、効率が劣る従来技術
の方法の模式的ブロック図である。

【図５Ａ】図５Ａは、本発明による、ノップ遅延スロットを挿入する例示的な方法のフロ
ーチャートである。

【図５Ｂ】図５Ｂは、図５Ａに示される方法による構築された例示的なプログラムの一部
の表示である。

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ０６Ｆ 9/45 Ｇ０６Ｆ 9/30 ３２０Ａ 9/44 ３２２ＦＦターム(参考） 5B013 AA11 AA12 5B033 AA01 AA02 AA10 AA13 BB00 BC02 BE06 BE07 5B081 AA07 BB03 CC21 CC24

Claims

【特許請求の範囲】

【請求項１】複数の命令を実行中に、マイクロプロセッサによって必要数
のノップ（動作なし）命令を自動的に挿入する方法であって、該複数の命令が少
なくとも１つの多重サイクル命令を含み、遅延スロットの総数が該少なくとも１
つの多重サイクル命令に必要であり、該方法が、（ａ）該少なくとも１つの多重サイクル命令に関連した、挿入された遅延スロ
ット命令（ＩＤＳＩ）数を判定する工程と、（ｂ）該遅延スロットの総数から該ＩＤＳＩ数を、該マイクロプロセッサによ
って減算することによって、該ノップ命令の必要数を計算する工程と、（ｃ）該マイクロプロセッサによって該必要数のノップ命令を実行する工程と
、を包含する方法。
【請求項２】前記少なくとも１つの多重サイクル命令に必要な前記遅延ス
ロットの総数が、ハードウェア依存型である、請求項１に記載の方法。
【請求項３】前記複数の命令を受け取るアセンブラを提供し、該複数の命
令を前記マイクロプロセッサによる実行のために準備する工程をさらに包含し、
該アセンブラを提供する工程が工程（ａ）が実行される前に実行され、工程（ａ
）が、（ｉ）該アセンブラによって前記ＩＤＳＩ数をカウントする工程と、（ｉｉ）該ＩＤＳＩ数を該マイクロプロセッサに伝達する工程と、をさらに包含する、請求項１に記載の方法。
【請求項４】前記ＩＤＳＩ数を前記マイクロプロセッサに伝達する工程が
、（Ｉ）前記少なくとも１つの多重サイクル命令内に遅延スロットフィールドを
提供する工程と、（ＩＩ）前記アセンブラによって該ＩＤＳＩ数を該遅延スロットフィールドに
入れる工程と、（ＩＩＩ）該マイクロプロセッサによって該ＩＤＳＩ数を該遅延スロットフィ
ールドから取り出す工程と、をさらに包含する、請求項３に記載の方法。
【請求項５】複数の命令を実行中に、マイクロプロセッサによって必要数
のノップ命令を自動的に挿入する方法であって、該複数の命令が、少なくとも１
つの多重サイクル命令を含み、該方法は、（ａ）該複数の命令を受け取るアセンブラを提供する工程と、（ｂ）該マイクロプロセッサに、該少なくとも１つの多重サイクル命令に必要
な遅延スロットの総数を提供する工程と、（ｃ）前記アセンブラによって、該少なくとも１つの多重サイクル命令に関連
したＩＤＳＩ数を判定する工程と、（ｄ）該ＩＤＳＩ数を該マイクロプロセッサに伝達する工程と、（ｅ）該マイクロプロセッサによって、該遅延スロットの総数から該ＩＤＳＩ
数を、該マイクロプロセッサによって減算することによって、該ノップ命令の必
要数を計算する工程と、（ｆ）該マイクロプロセッサによって該必要数のノップ命令を実行する工程と
、を包含する方法。
【請求項６】前記少なくとも１つの多重サイクル命令に必要な前記遅延ス
ロットの総数が、ハードウェア依存型である、請求項５に記載の方法。
【請求項７】工程（ａ）が、（ｉ）前記アセンブラによって前記ＩＤＳＩ数をカウントする工程をさらに包含する、請求項５に記載の方法。
【請求項８】前記ＩＤＳＩ数を前記マイクロプロセッサに伝達する工程が、（ｉ）前記少なくとも１つの多重サイクル命令内に遅延スロットフィールドを
提供する工程と、（ｉｉ）前記アセンブラによって該ＩＤＳＩ数を該遅延スロットフィールドに
入れる工程と、（ｉｉｉ）該マイクロプロセッサによって該ＩＤＳＩ数を該遅延スロットフィ
ールドから取り出す工程と、をさらに包含する、請求項７に記載の方法。