JPH05503381A

JPH05503381A - 算術パイプラインをオペレーティングする方法及びデータプロセッシング装置

Info

Publication number: JPH05503381A
Application number: JP2505555A
Authority: JP
Inventors: オルソン，スティーヴン・ダブリュー; マクドナルド，ジェームズ・ビー
Original assignee: エルジー・セミコン・カンパニー・リミテッド
Priority date: 1989-09-11
Filing date: 1990-03-28
Publication date: 1993-06-03
Anticipated expiration: 2013-12-24
Also published as: WO1991003784A1; DE69027932D1; AU5353990A; DE69027932T2; JP2840444B2; US5123108A; CA2064819C; CA2064819A1; EP0491693A1; AU643432B2; EP0491693B1

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】更新／アクセスアドレス比較においてレジスタファイルバイパスを有する改良されたＣＰＵパイプライン発明の分野本発明は一般にデータプロセッシングの装置及び方法に関連し、特に、レジスタファイル更新アドレスがレジスタファイルアクセスアドレスに等しいときに、レジスタファイルバイパスを用いる改良された速度及び効率の中央処理装置（ＣＰＵ）の算術／論理パイプラインに関する。

本発明の背景レジスタファイルは多くのデータプロセッシングユニットで見られ、それは算術／論理ユニット（ＡＬＵ）に結合された複数のレジスタからなり、そのＩノジスタは、浮動小数点オベレー・ノヨン、多種の制御オペレーション等のような算術又は論理オペレーションのオペランド又は結果を記憶するのに用いられる。レジスタファイルは高速、高性能ランダムアクセスメモリ（ＲＡＭ）のローカル記憶装置又はキャッシュと考えてもよい。レジスタファイル内のレジスタの数が多いと、ＣＰＵ自身の中に記憶されているであろうデータの量も多い。従って、レジスタファイルがより大きく作られると、典型的な遅いシステムメモリには、オペランドを検索しＡＬＵオペレーションの結果を記憶するようにさせるのに、より少ないアクセスが要求される。そのように、レジスタファイル及びＡＬＵのオペレーションに関して達成された速度及び効率におけるいずれの改良も、ＣＰＵの全体的な速度及びプロセッシングの効率への直接の影響を有する、ということが理解される。

いくつかの形式のシステムでは、レジスタファイルは１つのＣＰＵ命令サイクルの間にアクセス（読み取り）され更新（書き込み）される。しかしながら、ＣＰＵサイクル時間が減らされると、レジスタにはＡＬＵオペレーションに対してアクセスされる十分な時間がなく、同じサイクルの間にＡＬＵオペレーションの結果がレジスタファイルに書き戻される、という点で問題が発生する。この問題に対する１つの解決法は、最初のＣＰＵサイクル（サイクルＮ）の間にレジスタファイルをアクセスし、次の連続するＣＰＵサイクル（サイクルＮ＋１）の開にレジスタファイルを更新することである。

しかしながら、サイクルＮの間に生成される結果が、サイクルＮ＋１の間にレジスタファイルに書き戻されるために要求され、そしてまたサイクルＮ＋１の間にオペランドとして使用されることが要求されるような、これらの形式のＣＰＵ命令に対して、この解決法は問題を生じる。このような状態は、先行の第１の命令の実行が完了される前に第２の命令が開始されるというように、命令の実行がオーバーラツプされているパイプライン化されたＣＰＵで発生する。

Ｅｉｏｌａはマルチプレクサ（ＭＵＸ）２を有する従来のＣＰＵＩパイプラインの一部分をブロック図形式で示している。ＭＵＸ２は、ＣＰＵデータバスから第１　。

の入力を、そしてＡＬＵ４の結果（Ｒ）出力から第２の入力を受信する。ＭＵＸ２とＡＬＵ４の間にレジスタファイル３が配置されている。レジスタファイル３は、１６．６４．１２８、又は２５６レジスタの様な、複数のレジスタからなる。

多種のデータ経路のビットの数（ｍ）及び個々のレジスタの幅は、装置間で変化し、通常は８乃至１２８ビツトの範囲内である。レジスタファイル３は、サイクルＮの間に更新レジスタアドレスを、サイクルＮ＋１の間にアクセスレジスタアドレスを受信する。更新アドレスはレジスタを選択するアドレスであり、そのレジスタにはＡＬＵ４の結果が書き込まれている。アクセスアドレスは、Ａボート又はＢポートの何れか及びその後ＡＬＵ４の対応する入力に読み出されるレジスタを選択するアドレスである。ＡＬＵの結果（Ｒ）出力は、レジスタファイル内のレジスタを更新するためにマルチプレクサの入力に戻される。もちろん、ＡＬＵのＲ出力は、典型的には、図１の単純化されたブロック図では示されていない多数の他の回路にも送られる。

この従来のシステムに従いそして図１ｂを参照すると、形式Ａ十Ｂ＝Ｂを有する第１−の命令が示されている。即ち、レジスタファイル位置Ｂ内に記憶されたオペランドは、レジスタファイル位置Ｂ内に記憶されたオペランドに加えられ、結果がレジスタファイル位置Ｂに書き戻しく更新）される。次の命令は形式Ｃ＋Ｂ＝Ｄであり、オペランドの１つ（Ｂ）は前の命令からの更新されたレジスタ内に含まれいる。この場合、オペレージタンはＣＰＵ内でパイプラインされ、そして互いにオーバーラツプする状態で実行されるので、第１のオペレーションの結果は、第２のオペレーションが開始された時には、レジスタファイル内でまだ更新されていないかもしれない。例によると、Ｃ＋Ｄ＝Ｄに後続される形式Ａ＋Ｃ＝Ｃの命令は、更新されるレジスタファイル位置（Ｃ）もまた第２のバイブラインされた命令に対するオペランドとして要求される、という点で同じ問題を提示する。

従って、本発明の目的は、ＡＬＵの結果が、レジスタファイル内で最初に更新されることな（すぐ後のバイブラインされたオペレーションの間にオペランドとして直接的に提供される、改良されたＣＰＵ算術／論理パイプラインを提供することである。

本発明の他の目的は、ローカルオペランド記憶装置内の位置を更新するためにＡＬＵの結果が要求されるサイクルの間にＡＬＵの結果がＡＬＵへの入力として要求されるときに、ローカルオペランド記憶装置をバイパスするための回路、を含む改良されたＣＰＵ算術／論理パイプラインを提供することである。

本発明の概要前のオペレーションの結果で更新されるように、そして次のオペレーションのためのオペランドを提供するために同時にアクセスされるようにレジスタファイル位置又は作業レジスタなどの記憶装置エレメントが要求されるこれらの形式のオペレーションに対して、大幅な速度の改良を提供する装置及び方法によって、前記の問題は克服され本発明の目的は実現される。本発明はこのような状況を検出し、最初に更新し次に続いて記憶装置エレメントにアクセスするために要求される更なる遅延を招（ことな（、前のオペレーションの出力を直接ＡＬＵに提供するように働く。

特定の一実施例に従うと、レジスタファイルのＡ出力とＢ出力とはそれぞれ関連のマルチプレクサに提供される。各マルチプレクサはＡＬＵからの結果を運ぶ更なる入力としてバスを有する。マルチプレクサの出力は、ＡＬＵの対応するＡ又はＳ入力に提供される。各マルチプレクサは関連するレジスタファイルアドレスコンパレータによって制御される。アドレスコンパレータの各々は、入力として、対応するレジスタファイルＡ及びＢアクセスアドレス及びレジスタ更新アドレスを有する。、アドレスコンパレータは、アクセスのために選択されたレジスタファイルレジスタが更新のために選択されたレジスタファイルレジスタと等しいかどうかを決定するように、それらの関連するレジスタファイル更新アドレスとアクセスアドレスとを比較する。もしこれら２つのアドレスが等しいということが見いだされたならば、命令サイクルＮの間のＡＬＵオペレーションの結果がサイクルＮ＋１の間のＡＬＵオペレーションのためのオペランドとして用いられる、ということが示される。この状況が検出されるとき、関連するアドレスコンパレータの出力は、対応するマルチプレクサ選択入力がＡＬＵの結果を直接的にＡＬＵの対応する入力にゲートすることを可能にし、それによって効率的にレジスタファイルをバイパスする。

図面の簡単な説明前記及び他の本発明の特徴は添付の図面と関連して次の本発明の詳細な説明を読むとより明確にされる。

図１ａは、従来のレジスタファイル／ＡＬＵ相互連結を示すブロック図である。

図１ｂは、サイクルＮ＋１の間に前のＡＬＵの結果がレジスタファイル位置を更新するために要求され、そしてまた現在のＡＬＵオペレーションのためのオペランドとして要求される形式を有する２つのパイプライン命令のグラフ的な説明図である。

図２は、本発明に従って構成されそして動作するバイパス回路を有するレジスタファイルを示す詳細なブロック図である。

本発明の詳細な説明次の説明は各３２ビット幅の１２８レジスタを有するレジスタファイルを背景にされる。しかしながら、本発明は何れの実用的な深さ及び幅のレジスタファイルでも実施でき、以下の特定の例によるオペレーションに制限するものではないことに留意されたい。

図２は、本発明に従って構成され且つ動作する中央処理装置（ＣＰＵ）１０の一部分を示すブロック図である。ＣＰＵｌ０は、これらの物に制限しないがマイクロプロセッサ、マイクロコンピュータ及びメインフレームコンピュータを含む多数の異なる形式のハードウェア具体物において実施され得る。例えばＣＰＵｌ０はＶＳタイプのコンピュータ、特定的にはマサチューセッツのローウェルのウォングラボラトリーズ社によって製造されているＶＳ−８０００コンピユータで有り得る。ＣＰＵｌ０は両方向バッファ１２を通じてマルチプレクサ（ＭＵＸ）１４の第１の入力に結合された３２ビツトデータバスＤＢＯＯ：　３１を含む。ＭＵＸ１４の第２の入力は３２ビツトＣバス（ＣＢＯＯ：　３１）に結合されている。

ＭＵＸＩ４を通ｅ７Ｍ！；合のため１７）ＤＢＯＯ：　３１又１ｔＣＢＯＯ：　３１のａ択は、ＭＵＸ１４の選択（Ｓ）入力へのＲＥＧ　ＦＩＬＥ　５ＥＬＥＣＴ入力によってなされる。選択された３２ビツトバスはＭＵＸ１４の出力に送られ、１２８Ｘ３２レジスタフアイル（ＲＥＧ　ＦＩＬＥ）１６として実施されているローカルオペランド記憶装置の入力に提供される。ＲＥＧ　ＦＩＬＥ１６はまた、アクセスされる（読み取られる）ＲＥＧ　ＦＩＬＥ１６内の１２８レジスタの特定のものを識別するために、入力として７ビツトＡアクセスアドレスバス及び７ビツトＢアクセスバスを有する。ＲＥＧ　ＦＩＬＥ１６はまた、更新される（書き込まれる）レジスタを識別するために、入力として７ビツト更新アドレスバスを有する。

更新アドレスバスはＢアクセスパスの記録又は遅延されたバージョンである。即ち、サイクルＮの間に、更新アドレスバスはＢアクセスアドレスによってサイクルＮ−１の間にアクセスされたレジスタを更新する。ＲＥＧ　ＦＩＬＥ１６はまた、３２ビツトＡ出力及び３２ビツトＢ出力を含む。Ａ出力に現れるデータはＡアクセスバスによってアドレス及びアクセスされ、そしてＢ出力に現れるデータはＢアクセスバスによってアドレス及びアクセスされる。

図１ａで示されるようなシステムのような、従来のシステムでは、３２ビツトＡ及びＢ出力はＡ、　Ｌ　Ｕに直接結合されるであろう。しかしながら、そして本発明に従うと、ＲＥＧ　ＦＩＬＥ１６の３２ビツトＡ出力及び３２ビツトＢ出力は代わりにそれぞれ関連するＭＵＸ１８及びＭＵＸ２０に各々提供される。ＭＵＸＩ８及びＭＵＸ２０各々は更なる入力ＣＢＯＯ：３１を有する。ＭＵＸ１８の出力はＡＬＵ２２のＡ入力に提供され、ＭＵＸ２０の出力はＡＬＵ２２のＳ入力に提供される。ＭＵＸ１８及びＭＵＸ２０はそれぞれ関連するアドレスコンパレータ（ＡＤＤＲＣＯＭＰ）２４及び２６によって各々制御される。アドレスコンパレータ２４及び２６の各々はＲＥＧ　ＦＩＬＥ１６アクセスアドレス及び更新アドレスに対応する入力を有する。アドレスコンパレータ２４及び２６は、アクセスのために現在のサイクルの間に選択されたＲＥＧ　ＦＩＬＥ１６のレジスタがこのサイクルの間に更新するために選択されたＲＥＧ　ＦＩＬＥ１６のレジスタと等しいかどうかを決定するために、これらＲＥＧ　ＦＩＬＥ１６のアドレスを比較する。もしこれら２つのアドレスが等しいと見いだされたならば、命令サイクルＮの間のＡＬＵオペレーションの結果が次のサイクルＮ＋１の間にＡＬＵオペレーションのためのオペランドとして用いられることが、示される。この状態が検出されるとき、関連するアドレスコンパレータ２４及び２６の出力は、対応するマルチプレクサＭＵＸ１８又はＭＵＸ２０選択の（Ｓ）入力がＣＢＯＯ：　３１のＡＬＵ２２の結果を直接ＡＬＵ２２の対応する入力にゲートすることを可能にし、それによって効果的にＲＥＧ　ＦＩＬＥ１６をバイパスする。

もし更新アドレスが対応するＡ又はＢアクセスアドレスと等しくなければ、ＭＵＸ１８及びＭＵＸ２０へのＳ入力は断定（ａｓｓｅｒｔ）されず、これらのマルチプレクサは代わりにＲＥＧ　ＦＩＬＥ１６の対応する出力をＡＬＵ２２のためのデータのソースとして選択する。例えば、オペレーションＡ＋Ｄ＝Ｅが後に続くオペレーションＡ十Ｂ＝Ｃは、第１の命令の結果としてｊｌＩ２の命令の何れのオペランド（八又はＤ）も更新されないから、ＲＥＧ　ＦＩＬＥ１６がバイパスされる結果とはならない。

図２に示されたＣＰＵｌ０の部分の説明を続けると、ＡＬＵ２２の出力はラッチ２８ａへ、そしてラッチ２８ａからＡＬＵシフタ２８へ提供される。シフタ２８はシフト制御論理ブロック３０の制御のもとにある。ＡＬＵシフタ２８は、もし要求されたならば、ラッチされたＡＬＵの結果をその結果がＣＢＯＯ：３１バスに提供される前に位置付けるように、従来の様式で動作する。

更に本発明に従うと、Ａ作業レジスタ（ＷＲ−Ａ）３２のため及びＢ作業レジスタ（ＷＲ−Ｂ）３４のためのバイパスもまた提供される。この場合、作業レジスタは特定の算術／論理オペレーションのために用いられる一時的レジスタである。本発明に従うと、作業レジスタの出力は関連するマルチプレクサＡＭＵＸ３６又はＢＭＵＸ３８の入力に提供される。ＡＭＵＸ３６及びＢＭＵＸ３８の両方への第２の入力は、シフタ２８からＡＬＵ２２の結果を運ぶＣＢＯＯ：３１バスである。マルチプレクサ３６及び３８の各々は関連するコンパレータ４０及び４２の出力に結合された選択入力をそれぞれ有する。オペレーションのソースがＷＲ −Ａ３２　（ＡＣＣＥＳＳ　（アクセス）　ＷＲＡ）であり、また、同じサイクルの間にＷＲＡ３２がＡＬＵ２２から更新されていることを、論理信号の状態が示すときに、コンパレータ４０は、ＡＭＵＸ３６がＷＲ−Ａ３２出力の代わりにＣＢＯＯ：３１人力を選択するようにさせるように、出力を生成する。コンパレータ４２はデータをＡＬＵ２２のＢポートに提供するのと同じ形で動作する。従っテＡＭＵＸ　３６及’Ｃｊコニ／／＜Ｌ／−９４０（１）＊ヘレー’ｉ　ｇ　ンハ、ＲＥＧ　ＦＩＬＥＩ６について前に説明されたのと類似の様式で、ＷＲ− Ａ３２が同じサイクルで更新及びアクセスされることを要求されることが決定されたときに、ＷＲ−Ａ３２の周りに速いバイパスを提供するように働く。同様にＢＭＵＸ３８及びコンパレータ４２のオペレーションは、ＷＲ−８３４が同じサイクルで更新及びアクセス号が作業レジスタに対するアクセス信号に関連して断定されたかどうかを、本発明のこの面は検出し、そして、もしそうならば、作業レジスタはバイパスされ、ＡＬＵ２２出力はＡＬＵ２２人力に結合され戻される。

ＲＥＧ　ＦＩＬＥ１６又は作業レジスタのうちの１つがバイパスされる前記で説明されたケースについては、ＡＬＵ２２の結果をもってのレジスタの更新はサイクル（Ｎ＋１）の間に好ましくなお発生する。しかしながら、ＡＬＵ２２は更新されたデータが同時に与えられ、従ってＲＥＧ　ＦＩＬＥ１６又は作業レジスタの更新されるのを待つことが要求されない。

ＣＰＵｌ０は更に、マイクロ命令を復号するため、そしてＣＰＵ命令サイクルクロック（ＣＬＫ）と関連してＣＰＵｌ０のオペレーションに要求される多種の制御及びアドレス信号を生成するために使用可能な、制御論理ブロック４４を含む。

前記の説明に従うと、本発明は、レジスタファイル位置又は作業レジスタの様な記憶装置エレメントが、前のオペレーションの結果で更新されそして次のオペレーションのためのオペランドを提供するように同時にアクセスされることが要求されるこれらの形式のオペレーションに対して、大きな速度の改良を提供することが理解される。

本発明は、好ましい実施例に関して特定的に示され説明されたが、形式または詳細の変更は本発明の範囲と精神から離れることなくその中でなされるであろうことが、当業者には理解されるであろう。

浄書（内容に変更なし）ＦＩＧ・１ａ　＜従来技術）命令１捕丁婁の社説す理由書挙Ｍ＆（特許法第１８４条の７第１項）ｌｃ１条補正補正の範囲１、　オペランドを記憶するための複数の位置を有するローカルのアドレス指定可能記憶手段と、オペランドへのオペレーションの一時的な結果を記憶するために記憶手段から別々にアクセスされる作業レジスタ手段を含む記憶手段とを含む形式の算術パイプラインであって、前記記憶手段から第１のオペランドと第２のオペランドとを受けるための入力を有するＡＬＵ手段であって前記第１のオペランドと前記第２のオペランドとに行われたオペレーションの結果を表すための出力を有するＡＬＵ手段を更に備える算術パイプラインをオペレーティングする方法が、第１の時間間隔の間に、前記第１のオペランドと前記第２のオペランドとを前記記憶手段から検索するように前記記憶装置をアドレスするステップ、ドと前記第２のオペランドとを前記ＡＬＵ手段のＡ人力に及びＢ入力に、それぞれ、加えるステップ、第２の時間間隔の間に、次のオペレーションが前記第１の時間間隔の開に生成された前記結果又は前記一時的結果を第１のオペランド又は第２のオペランドの何れかのために要求するかどうかを決定するステップ、及びもし前記第１の時間間隔の間に生成された前記結果又は前記一時的結果が前記第１のオペランド又は前記第２のオペランドの何れかの次のオペレーションのために要求されるように決定されると、前記方法は、前記ＡＬＵ手段のＡ入力又はＢ入力の何れかを前記記憶装置から非結合するステップ及び前記ＡＬＵ手段の出力を前記ＡＬＵ手段のＡ入力又はＢ入力の何れかに結合するステップを含む、ステップ、を備える方法。

２、　前記第２の時間間隔の間に決定するステップは、前記記憶手段に関連した更新アドレスと前記記憶手段に関連したアクセスアドレスとを比較し前記２つのアドレスは等しいかどうかを検出する、比較ステップを含む、請求の範囲第１項に記載の方法。

３、　前記結合するステップ及び非結合するステップは、前記ＡＬＵ手段の結果を有する入力をマルチプレクサ手段の出力に結合するために、前記マルチプレクサ手段に結合された前記ＡＬＵ結果を有する入力を選択するように該マルチプレクサ手段を活動化するステップであって、前記マルチプレクサ手段の前記出力は前記ＡＬＵ手段の入力に結合されている、活動化ステップを含む、請求の範囲第１項に記載の方法。

４、　前記第２の時開間隔の間に決定するステップは、前記作業レジスタ手段に対する更新信号が前記作業レジスタ手段に対するアクセス信号に関連して断定されたかどうかを検出するステップを含む、請求の範囲第１項に記載の方法。

５、　オペランドを記憶するための複数の位置を有するローカルのアドレス指定可能記憶手段を含む形式の算術パイプラインを備えるデータプロセッシング装置であって、前記記憶手段から第１のオペランドと第２のオペランドとを受けるための入力を有するＡＬＵ手段であって前記第１のオペランドと前記第２のオペランドとに行われたオペレーションの結果を表すための出力を有するＡＬＵ手段を更に備える前記バイブライン手段を備えるデータプロセッシング装置が、オペランドへのオペレーションの一時的な結果を記憶するために記憶手段から別々にアクセスされる作業レジスタ手段であって、前記ＡＬＵ手段の前記出力に結合された入力と前記ＡＬＵ手段の第１の入力に及び第２の人力に結合された出力とを有する作業レジスタ手段、前記第１のオペランドと前記第２のオペランドとを前記記憶手段から検索するように第１の時間間隔の間に前記記憶装置をアドレスする手段、ＡＬＵ手段出力で結果又は一時的結果を生成するように前記第１のオペランド及び前記第２のオペランドを前記ＡＬＵ手段の前記第１の入力に及び前記第２の入力に、それぞれ、加える手段、前記ＡＬＵ手段が前記第１の時間間隔の間に生成された前記結果又は前記一時的結果を第１のオペランド又は第２のオペランドの何れかのために要求するかどうかを第２の時間間隔の間に決定する手段、及び前記決定する手段に結合されそして応答し、もし次のオペレーションが前記第１の時間間隔の間に生成された前記結果又は前記一時的結果を前記第１のオペランド又は前記第２のオペランドの何れかのために要求するならば前記ＡＬＵ手段出力を前記ＡＬＵ手段のＡ入力又はＢ入力の何れかに結合するための手段、を備えるデータプロセッシング装置。

６、　前記決定する手段は、前記記憶手段に関連した更新アドレスと前記記憶手段に関連したアクセスアドレスとを比較し前記２つのアドレスは等しいかどうかを検出する比較器手段を備える、請求の範囲第５項に記載のデータプロセッシング装置。

７、　前記結合する手段は、マルチプレクサ手段の入力に結合された前記ＡＬＵ手段出力を有する前記マルチプレクサ手段であって、前記マルチプレクサ手段の出力は前記ＡＬＵ手段の入力の１つに結合されている、マルチプレクサ手段を備える、請求の範囲第５項に記載のデータプロセッシング装置。

８、　前記決定する手段は、前記作業レジスタ手段に対する更新信号が前記作業レジスタ手段に対するアクセス信号に関連して断定されたかどうかを検出するための手段を備える、請求の範囲第５項に記載のデータプロセッシング装置。

９、　前記記憶手段は、各々がｍビットからなるｎ個の位置として編成されたレジスタファイル手段からなり、前記ｎ個の位置のうちの独特の１つはレジスタファイル更新アドレスによってモして／またはレジスタファイルアクセスアドレスによって指定される、請求の範囲第５項に記載のデータプロセッシング装置。

１０、前記記決定する手段は命令に関連するマイクロ命令の内容に応答する、請求の範囲第５項に記載のデータプロセッシング装置。

１、事件の表示ＰＣＴ／ＵＳ９０１０１６４Ｂ平成２年特許願第５０５５５５号２、発明の名称更新／アクセスアドレス比較においてレジスタファイルバイパスを有する改良されたＣＰＵパイプラインＩ３、補正をする者事件との関係　特許出願人名　称　ウォング・ラボラトリーズ・インコーホレーテッド４、代理人住　所　東京都千代田区大手町二丁目２番１号新大手町ビル　２０６区６、補正の対象（１）委任状及び翻訳文国除調査報告８；；；二二ｒ：：′シーニー１＝！；舎ｕ；Ｈ’、ｈ　＋ｈｔ？：二；、二二二°二’１４ｍ１二７二；；７；；　フ７．７＋＋　ｅｉｌg“°２°−〜ラー ’ｒＮｓ°ン°（）８”ａａ＋＋＋ｌ　＊−““７ｔＭＩｕｒｅｐ＋＃ＰｐＨＨ＋６１１＋ｅ１１ＲＭｗｈｆＩｌｌ・（臂揃嘗Ｔｈｎ師慶Ｍ＋ｃｗｌ−デ１＋＋ｎｃ＋ｔｓｒｓ＋ｓ書＋ｗｌＹ翌月s１１−響”＋ｍｐ＋ｕｌ−−−１ｍｍ喝ｉｌｙ！−一−菅−〇−１

Claims

【特許請求の範囲】

１．オペランドを記憶するための位置を有するローカルのアドレス指定可能記憶装置と、前記記憶装置から第１のオペランドと第２のオペランドとを受けるための入力を有するＡＬＵであって前記第１のオペランドと前記第２のオペランドとに行われたオペレーションの結果を表すための出力を有するＡＬＵ、とを有する形式のＣＰＵパイプラインをオペレーティングする方法が、第１の時間間隔の間に、前記第１のオペランドと前記第２のオペランドとを前記記憶装置から検索するように前記記憶装置をアドレスするステップ、ＡＬＵ出力で結果を生成するように前記第１のオペランドと前記第２のオペランドとを前記ＡＬＵのＡ入力に及びＢ入力に、それぞれ、加えるステップ、第２の時間間隔の間に、次のオペレーションが前記第１の時間間隔の間に生成された前記結果を第１のオペランド又は第２のオペランドの何れかのために要求するかを決定するステップ、及びもし前記第１の時間間隔の間に生成された前記結果が前記第１のオペランド又は前記第２のオペランドの何れかの次のオペレーションのために要求されるように決定されるならば、前記方法は、前記ＡＬＵのＡ入力又はＢ入力の何れかを前記記憶装置から非結合するステップ及び前記ＡＬＵ出力を前記ＡＬＵのＡ入力又はＢ入力の何れかに結合するステップを含む、ステップ、を備える方法。
２．前記第２の時間間隔の間に決定するステップは、前記記憶装置に関連した更新アドレスと前記記憶装置に関連したアクセスアドレスとを比較し前記２つのアドレスは等しいかどうかを検出する、比較ステップを含む、請求の範囲第１項に記載の方法。
３．前記結合するステップ及び非結合するステップは、前記ＡＬＵ結果を有する入力をマルチプレクサ手段の出力に結合するために、前記マルチプレクサ手段に結合された前記ＡＬＵ結果を有する入力を選択するように該マルチプレクサ手段を活動化するステップであって、前記マルチプレクサ手段の前記出力は前記ＡＬＵの入力に結合されている、活動化ステップを含む、請求の範囲第１項に記載の方法。
４．前記第２の時間間隔の間に決定するステップは、作業レジスタ手段に対する更新信号が前記作業レジスタ手段に対するアクセス信号に関連して断定されたかを検出するステップを含む、請求の範囲第１項に記載の方法。
５．オペランドを記憶するための記憶位置を有するローカルのアドレス指定可能記憶装置と、前記記憶装置からＡオペランドとＢオペランドとを受けるために前記記憶装置に結合されたＡＬＵであって前記第１のオペランドと前記第２のオペランドとに行われたオペレーションの結果を示すための出力を有するＡＬＵ、とを有する形式の算術パイプラインを用いる装置が、前記第１のオペランドと前記第２のオペランドとを前記記憶装置から検索するように第１の時間間隔の間に前記記憶装置をアドレスする手段、ＡＬＵ出力で結果を生成するように前記第１のオペランドと前記第２のオペランドとをＡＬＵのＡ入力にそしてＢ入力に、それぞれ、加える手段、前記第１の時間間隔の間に生成された前記結果が前記記憶装置に書き戻されることが要求されるかどうかを第２の時間間隔の間に決定するため、及び前記ＡＬＵが前記第１の時間間隔の間に生成された前記結果を第１のオペランド又は第２のオペランドの何れかのために要求するかどうかを第２の時間間隔の間に決定するための手段、及び前記決定する手段に結合されそして応答し、前記第１の時間間隔の間に生成された結合が前記記憶装置に書き戻されされるように要求されるように決定されたとき及び次のオペレーションが前記第１の時間間隔の間に生成された前記結果を前記第１のオペランド又は前記第２のオペランドのために要求するときのみ前記ＡＬＵ出力を前記ＡＬＵのＡ入力又はＢ入力の何れかに結合するための手段、を備える装置。
６．前記決定する手段は、前記記憶装置に関連した更新アドレスと前記記憶装置に関連したアクセスアドレスとを比較し前記２つのアドレスは等しいかどうかを検出する比較器手段を備える、請求の範囲第５項に記載の装置。
７．前記結合する手段は、マルチプレクサ手段の入力に結合された前記ＡＬＵ結果を有する前記マルチプレクサ手段であって、前記マルチプレクサ手段の出力は前記ＡＬＵの入力に結合されているマルチプレクサ手段を備える、請求の範囲第５項に記載の装置。
８．前記決定する手段は、作業レジスタ手段に対する更新信号が前記作業レジスタ手段に対するアクセス信号に関連して断定されたかどうかを検出するための手段を備える、請求の範囲第５項に記載の装置。
９．前記記憶装置は、各々がｍビットからなるｎ個の位置として編成されたレジスタファイル手段からなり、前記ｎ個の位置のうちの独特の１つはレジスタファイル更新アドレスによってそして／またはレジスタファイルアクセスアドレスによって指定される、請求の範囲第５項に記載の装置。
１０．前記記決定する手段は命令に関連するマイクロ命令の内容に応答する、請求の範囲第５項に記載の装置。