JP2539974B2

JP2539974B2 - 情報処理装置におけるレジスタの読出制御方式

Info

Publication number: JP2539974B2
Application number: JP3304895A
Authority: JP
Inventors: 達己中田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1991-11-20
Filing date: 1991-11-20
Publication date: 1996-10-02
Anticipated expiration: 2011-10-02
Also published as: EP0543415B1; EP0543415A2; JPH05143328A; DE69228360D1; US5638526A; EP0543415A3; DE69228360T2

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は情報処理装置におけるレ
ジスタの読出制御方式に関し、特に演算処理の低下を来
すことなくレジスタの読出ポート数の削減が可能な方式
に関する。

【０００２】

【従来の技術】近年における情報処理装置における高速
化手法、たとえばスーパスカラー方式、ＶＬＩＷ（VERY
-LONG-INSTRUCTION-WORD）方式、スーパパイプライン方
式等では、１サイクル間に複数の命令を実行することが
可能となっている。

【０００３】この種のバイパス機能（演算回路出力バイ
パス（ＢＰＳ））を有するパイプライン処理の一例を図
に基づいて説明する。パイプライン処理におけるステー
ジ動作は、図２に示すように、プログラムカウンタ（Ｐ
Ｃ）に基づいて、命令キャッシュデータ（ＩＣＡＣＨ
Ｅ）を取り込む命令フェッチステージ（ＩｎｓｔＦｅ
ｔｃｈ）と、命令を解析するデコードステージ（Ｄｅｃ
ｏｄｅ）と、レジスタファイル（ＲＥＧ）の内容をオペ
ランドレジスタ（ＯＰ）に取り込み加算器（ＡＬＵ）で
演算を行う実行ステージ（Ｅｘｅｃｕｔｅ）と、演算結
果を前記レジスタファイル（ＲＥＧ）に書き込む書き込
みステージ（Ｗｒｉｔｅ）とからなる。

【０００４】このように、命令を複数のステージに分割
して他命令と並列処理することにより、処理の高速化を
図っている。そして、同図に示すように、加算器（ＡＬ
Ｕ）の結果を、後続命令でのオペランドレジスタ（Ｏ
Ｐ）に演算回路出力バイパス（ＢＰＳ）を通じてバイパ
ス転送させることによって、前命令の演算結果を用いる
後続命令の処理等を高速化していた。

【０００５】

【発明が解決しようとする課題】ところで、前記パイプ
ライン処理では、命令の並列動作数が増加するにしたが
って図３に示すようにレジスタファイル（ＲＥＧ）から
の読出ポート（ＰＴ）も増加し（同図では４ポート構成
となっている）、ハードウエア量が増加し、これにとも
ない、レジスタファイル（ＲＥＧ）の中に設けられたセ
レクタ（ＳＥＬ）の処理遅延時間が大きくなり、コスト
高のみならず、処理効率・処理速度ともに低下する懸念
があった。

【０００６】本発明はこのような点に鑑みてなされたも
のであり、その目的は、レジスタファイル（ＲＥＧ）に
おける読出ポートを増加させることなく、少ないハード
ウエア量で複数命令の演算処理を効率かつ高速化できる
技術を提供することにある。

【０００７】

【課題を解決するための手段】本発明は、パイプライン
処理により複数の命令を並列して逐次実行する際に、レ
ジスタファイル（ＲＥＧ）と、一時格納レジスタ（Ｃ
Ｒ）と、セレクタ（ＳＥＬ）と、演算回路（１）と、レ
ジスタキャッシュパス（ＲＣＰＳ）と、一致検出回路
（ＣＯＭＰ）とを有する構成として、この一致検出回路
（ＣＯＭＰ）において、前命令の一時格納レジスタ（Ｃ
Ｒ）の保持データと後続命令でのオペランドとの一致を
検出した場合には、前記セレクタ（ＳＥＬ）を制御して
セレクタの入力として前記レジスタキャッシュパス（Ｒ
ＣＰＳ）を選択し、前記一時格納レジスタ（ＣＲ）の保
持データをレジスタキャッシュパス（ＲＣＰＳ）を経由
して当該一時格納レジスタ（ＣＲ）に直接帰還入力する
こととした。

【０００８】

【作用】たとえば、ある命令で読み出しを行ったレジス
タは後続の命令でも読み出しをする可能性が高い。具体
例として、フレームポインタ、セグメントベースレジス
タ、ループ変数（これらは計算機のアーキテクチャやコ
ンパイラ、プログラムによっても変化する）を考える
と、サブプログラム間のパラメータやローカル変数をス
タックフレーム上に作成するようなソフトウエアシステ
ムでは、フレームポインタが数命令に１度はアクセスさ
れる可能性が高い。

【０００９】本発明では、原理図である図１（ａ）に示
すように、演算回路１（たとえばＡＬＵ）において、一
時格納レジスタ（ＣＲ）を設け、この保持データが後続
命令で使用されるデータと一致する場合は、レジスタキ
ャッシュパス（ＲＣＰＳ）を通じて演算回路（ＡＬＵ）
に保持データを出力する。

【００１０】また、図１（ｂ）では、オペランドレジス
タ（ＯＰ）を一時格納レジスタ（ＣＲ）として用いてい
る。そして演算回路１（ＡＬＵ）において演算を行う際
に、一致回路（ＣＯＭＰ）において前命令と後続命令と
でレジスタデータを比較する。ここで同じレジスタデー
タを用いることを検出した場合には、演算入力セレクタ
（ＳＥＬ）を制御して、一時格納レジスタ（ＣＲ）のデ
ータを演算入力セレクタ（ＳＥＬ）に戻して演算回路
（ＡＬＵ）に再入力させる。

【００１１】このように、レジスタのキャッシュを可能
としたことにより、レジスタファイル（ＲＥＧ）からの
読み出し回数が大幅に低減でき、レジスタファイル（Ｒ
ＥＧ）の読出ポート（ＰＴ）を増加させることなく、効
率的かつ高速な演算処理を実現できる。

【００１２】なお、一時格納レジスタ（ＣＲ）は、キャ
ッシュ専用のレジスタであってもよいし、図１に示した
ような演算回路１（ＡＬＵ）のオペランドを保持するオ
ペランドレジスタ（ＯＰ）であってもよい。

【００１３】

【実施例】図４は本発明の一実施例を示すブロック図で
あり、本発明はたとえば同図に示す回路構成で実現され
る。なお同図では２ポート構成（ＰＴ１，ＰＴ２）のレ
ジスタシステムを例にしている。

【００１４】同図において、命令レジスタ（ＩＲ）は第
１命令部（ＯＰ１）と、第２命令部（ＯＰ２）とに区分
され、さらに各命令部（ＯＰ１・ＯＰ２）は、第１レジ
スタ部（Ｒ１１，Ｒ２１）と第２レジスタ部（Ｒ２１，
Ｒ２２）とに分割されている。

【００１５】前記各レジスタ部からの出力は、命令レジ
スタ出力用セレクタ（ＩＳＥＬ１・ＩＳＥＬ２）を経て
レジスタファイル（ＲＥＧ）に入力される。また、命令
レジスタ内あるいは命令レジスタ外には前レジスタデー
タ保持部（ＯＲ１１・ＯＲ２１）が設けられており、後
述のオペランドレジスタ（ＯＰ１１・ＯＰ２１）の読み
出しが行われたレジスタデータ（アドレス）が格納され
る。

【００１６】前レジスタデータ保持部（ＯＲ１１・ＯＲ
２１）と前記各レジスタ部の値は、一致検出回路（ＣＯ
ＭＰ）に出力され、両保持値が比較される。そしてこの
一致検出回路（ＣＯＭＰ）の判定値によって演算入力セ
レクタ（ＳＥＬ）が制御される。この制御については後
述する。

【００１７】レジスタファイル（ＲＥＧ）は、汎用レジ
スタ、浮動小数点レジスタ等のレジスタ群からなる記憶
回路で構成されており、一対の演算回路（ＡＬＵ１・Ａ
ＬＵ２）に対してそれぞれ１個ずつの出力ポート（ＰＴ
１，ＰＴ２）を備えている。

【００１８】演算回路（ＡＬＵ１・ＡＬＵ２）のそれぞ
れの前段には、一対ずつのオペランドレジスタ（ＯＰ１
１−ＯＰ１２，ＯＰ２１−ＯＰ２２）が設けられてお
り、このオペランドレジスタの前段には、前述の演算入
力セレクタ（ＳＥＬ：ＳＥＬ１１−ＳＥＬ２２）が設け
られている。この演算入力セレクタ（ＳＥＬ）のうち、
ＳＥＬ１１とＳＥＬ２１には、演算回路（ＡＬＵ）から
の出力と、レジスタファイル（ＲＥＧ）からの出力と、
一時格納レジスタ（ＣＲ）としてのオペランドレジスタ
（ＯＰ）からのレジスタキャッシュパス（ＲＣＰＳ１・
ＲＣＰＳ２）とが接続され、演算回路（ＡＬＵ）からの
出力、レジスタファイル（ＲＥＧ）からの出力またオペ
ランドレジスタ（ＯＰ１１，ＯＰ２２）のいずれかを選
択的にオペランドレジスタ（ＯＰ）に入力させる機能を
有している。

【００１９】前記演算入力セレクタ（ＳＥＬ）の制御は
前述の一致検出回路（ＣＯＭＰ）によって行われる。す
なわち、一致検出回路（ＣＯＭＰ）によって、前レジス
タデータ保持部（ＯＲ１１・ＯＲ２１）の保持値と、後
続の命令の中のレジスタアドレスとが一致する場合に
は、演算入力セレクタ（ＳＥＬ）の入力として前記レジ
スタキャッシュパス（ＲＣＰＳ）を選択する。これによ
り、レジスタキャッシュが実現され、レジスタファイル
（ＲＥＧ）からの読み出し処理を経ることなく、前命令
のオペランドを後続命令においてもそのまま用いること
が可能となる。

【００２０】一致検出のタイミング、すなわち一致検出
回路（ＣＯＭＰ）の配置位置としては、下記の３通りの
構成が可能である。（構成１）第１の構成は、パイプライン処理において、
デコード処理に送られる信号をそのまま用いて一致・不
一致を検出する方法で、この場合、図５および図６に示
す回路構成となる。

【００２１】図５は、前述の図４のハードウエア構成を
簡略化したものである。すなわち、命令レジスタ（Ｉ
Ｒ）の出力側に一致検出回路（ＣＯＭＰ）を配置して、
命令レジスタ（ＩＲ）から命令を読み出す際に、命令の
レジスタ指示フィールドがレジスタキャッシュとしての
前レジスタデータ保持部（ＯＲ）に保持されている内容
と一致しているか否かが検出される。

【００２２】また、この種の情報処理装置では、ハード
ウエア構成において、命令レジスタ（ＩＲ）を用いるこ
となく、直接命令バッファ（ＩＢ）から命令を読み出す
場合があるが、この場合には図６に示すように、命令バ
ッファ（ＩＢ）の出力側に一致検出回路（ＣＯＭＰ）を
配置することができる。この時には、命令バッファ（Ｉ
Ｂ）から命令を読み出す際に、命令のレジスタ指示フィ
ールドがレジスタキャッシュとしての前レジスタデータ
保持部（ＯＲ）に保持されている内容と一致するか否か
を検出する。（構成２）第２の構成はデコードステージよりも前の段階で一致・
不一致を検出する方法で、図７に示す回路構成となる。

【００２３】すなわち、命令レジスタ（ＩＲ）の入力側
に一致検出回路（ＣＯＭＰ）を配置して、命令バッファ
（ＩＢ）から命令レジスタ（ＩＲ）に命令を引き渡すの
に同期して、現時点で命令レジスタ（ＩＲ）に引き渡し
ている命令の直前のサイクルに実行された命令のレジス
タアドレス（すなわち現時点で命令レジスタ（ＩＲ）内
に格納されている命令のレジスタ指示フィールド）と、
命令バッファ（ＩＢ）の中の命令が参照するレジスタア
ドレスとを比較する。

【００２４】本構成をパイプライン処理において概念的
に示したものが図１３である。すなわち、前述の「命令
レジスタ（ＩＲ）に引き渡している命令の直前のサイク
ルに実行された命令」とは、現時点（前命令）でデコー
ドステージにおいて命令レジスタ（ＩＲ）に入っている
命令である。後続命令では自身の次のデコードステージ
（Ｄ）で命令レジスタ（ＩＲ）に格納すべきレジスタ指
示フィールドを、前記前命令の命令レジスタ（ＩＲ）に
格納されている命令のレジスタ指示フィールドと比較し
ている。

【００２５】この構成によれば、デコードステージより
も前の段階で一致・不一致の判定が完了しているため、
比較的高速な演算処理を実現できる。（構成３）第３の構成は、図８に示すように、命令バッファ（Ｉ
Ｂ：ＩＢ０〜ＩＢ２）のそれぞれについてその命令中に
含まれるレジスタアドレスを、デコードされた命令中に
含まれるレジスタアドレスと一致検出回路（ＣＯＭＰ）
で比較して一致・不一致を検出する。また、一致検出回
路（ＣＯＭＰ）において一致を検出した場合には、当該
レジスタアドレスを命令バッファ（ＩＢ：ＩＢ０〜ＩＢ
２）に再度格納される。このように図８に示した構成
は、命令レジスタ（ＩＲ）を有しない命令バッファだけ
のハードウエア構成である場合に極めて高速な演算処理
を実現できる。

【００２６】すなわち、命令バッファ（ＩＢ）の前段に
一致検出回路（ＣＯＭＰ）を設け、この一致検出回路
（ＣＯＭＰ）の一方の入力は命令バッファ（ＩＢ）中に
保持されているレジスタアドレスとし、他方の入力は現
在デコード中のレジスタアドレスとする。この一致検出
回路（ＣＯＭＰ）で現在デコード中のレジスタアドレス
と命令バッファ（ＩＢ）の保持するレジスタアドレスと
の一致が検出された場合には、一致検出信号が一旦命令
バッファ（ＩＢ）に格納された後、図中において破線で
示す経路を経て、次のステージに同期して演算入力セレ
クタ（ＳＥＬ）を直接作動させる。なお図中において符
号３１および３２はセレクタである。

【００２７】この第３の構成では、パイプライン処理に
おいて、デコードステージよりも前のステージ段階で、
その時点では使用されていない命令バッファ（ＩＢ）の
タイミングでレジスタ番号の一致・不一致を検出してお
くため、次のデコード処理を全く遅延させることなくレ
ジスタのキャッシュを実現できる。

【００２８】なお、図示は省略したが、本実施例では従
来のバイパス処理を行う制御システムも併有している。
すなわち、演算回路（ＡＬＵ）の結果が後続命令で参照
しようとしているレジスタに格納されているか否かを検
出する回路（図示省略）を有しており、この回路から出
力される一致信号によって、演算入力セレクタ（ＳＥ
Ｌ）はその入力として演算回路出力バイパス（ＢＰＳ）
を選択する。これによって、本システムでは従来技術に
おけるバイパス処理も可能となっている。この場合、演
算入力セレクタ（ＳＥＬ）はバイパス処理とレジスタキ
ャッシュ処理とで共有可能であるため、ハードウエア構
成が増加することはない。

【００２９】次に、図４および図９〜図１２を用いて、
演算入力セレクタ（ＳＥＬ）の制御について場合分けを
して説明する。図９は、オペランドレジスタ（ＯＰ１
１）の入力側に配置された演算入力セレクタ（ＳＥＬ）
の動作を示している。

【００３０】まず、一般的なパイプライン処理の場合の
バイパス処理を説明する。選択条件として、命令レジス
タ（ＩＲ）の第１レジスタ部（Ｒ１１）に格納されてい
るレジスタアドレスが現在実行ステージ（Ｅｘｅｃｕｔ
ｅ）を実行している命令の１番目のディストネーション
オペランド（ＯＤＲ１）のレジスタアドレスを示してい
る場合、演算入力セレクタ（ＳＥＬ１１）には演算回路
（ＡＬＵ１）の出力、すなわち演算回路出力バイパス
（ＢＰＳ１）を選択的に取り込む。また、第２番目のデ
ィストネーションオペランド（ＯＤＲ２）のレジスタア
ドレスを示している場合には、演算回路（ＡＬＵ２）側
の演算回路出力バイパス（ＢＰＳ２）を選択する。以上
はパイプライン処理における一般的なバイパス処理であ
る。これらの選択条件の判断回路等については、本実施
例では説明を省略する。

【００３１】次に、本実施例のレジスタキャッシュ処理
の場合を説明する。命令レジスタ（ＩＲ）の第１レジス
タ部（Ｒ１１）のレジスタアドレスが実行ステージにお
ける命令の第１番目のソースオペランドのレジスタアド
レス（ＯＲ１１に格納されているＯＰ１１のレジスタア
ドレス）を示している場合、演算入力セレクタ（ＳＥＬ
１１）にはオペランドレジスタ（ＯＰ１１）の出力、す
なわちレジスタキャッシュパス（ＲＣＰＳ１１）を選択
する。

【００３２】最後に、前記バイパス処理およびレジスタ
キャッシュ処理以外の場合は、演算入力セレクタ（ＳＥ
Ｌ１１）は通常の処理（レジスタファイルの読み込み処
理）として、レジスタファイル（ＲＥＧ）からの第１ポ
ート（ＰＴ１）の出力を選択する。

【００３３】図１０は、オペランドレジスタ（ＯＰ１
２）の入力側に配置された演算入力セレクタ（ＳＥＬ１
２）の動作、図１１はペランド入力セレクタ（ＳＥＬ２
１）の動作、図１２は演算入力セレクタ（ＳＥＬ２２）
の動作をそれぞれ示している。なお、図４では、オペラ
ンドレジスタ（ＯＰ１１）の保持値が他の３個のオペラ
ンドレジスタ（ＯＰ１２，ＯＰ２１，ＯＰ２２）でキャ
ッシュ可能であり、オペランドレジスタ（ＯＰ２１）の
保持値がオペランドレジスタ（ＯＰ２１・ＯＰ２２）で
キャッシュ可能となっているが、レジスタキャッシュの
組み合わせはこれに限定されない。

【００３４】次に、本実施例によりレジスタポート数が
低減できる具体例として、シーケンシャル探索のプログ
ラム（Ｃ言語で記述）を下記の（数１）式で示す。

【００３５】

【数１】この（数１）をＶＬＩＷの疑似アセンブラ言語を使って
コーディングしたものが下記の（数２）である。

【００３６】

【数２】前記（数２）では、ＬＯＡＤ命令の待ち等で無駄時間が
発生するため、ｌｏｏｐ−ｕｎｒｏｌｌｉｎｇ処理とし
た（数３）。ループの処理時間は１τ増加しただけであ
るが、２エレメントずつのサーチが可能となる。またポ
インタ更新用の定数８，１６は予め「GR」に割当られて
いるものとする。下記の（数３）において説明の便宜の
ため行番号を付してある。また、各行の右端に示されて
いる数字は、左側が従来のバイパス処理のみの場合で必
要となるレジスタポート数、右側が従来のバイパス処理
と本実施例のレジスタキャッシュ方式を併用した場合に
必要となるポート数である。

【００３７】

【数３】 01 G1=0 G9=8 02 LOOP: 03 G4=LOAD(G8+G1) G1=G1+G9 ;2 2 04 CMP G1,G3 G5=LOAD(G8+G1) ;2 1 05 BGE EXIT CMP G4,G6 ;1 1 06 BEQ FOUND CMP G5,G6 ;1 0 07 BNE LOOP G1=G1+G9 ;2 2 08 FOUND: 09 G1=G1-G9 10 BR (G31) G1=G1/G9 11 EXIT: 12 BR (G31) G1= -1 前記（数３）において、第０３行目では、「G8」と「G
9」の読み込みのために２ポート必要である。また、「G
1」は第０１行目または第０７行目により、バイパス処
理が可能である。第０４行目ではバイパス処理の場合、
「G1」が前命令からバイパスされるため、「G3」と「G
8」のための２ポートとなる。これに対して、本実施例
のレジスタキャッシュを併用した場合、「G8」がキャッ
シュされるため、「G3」の読み込みのみとなり１ポート
で足りる。

【００３８】また、第０６行目では「G6」がキャッシュ
されるため、また「G5」はバイパス処理が可能なのでポ
ートを使用しない。ここで、ダミー命令を追加すること
により、さらに効率的な処理が可能となる。

【００３９】

【数４】 01 G1=0 G9=8 02 LOOP: 03 G4=LOAD(G8+G1) G1=G1+G9 ;2 1 04 CMP G1,G3 G5=LOAD(G8+G1) ;2 1 05 BGE EXIT CMP G4,G6 ;1 1 06 BEQ FOUND G1=G1 CMP G5,G6 ;2 1 07 BNE LOOP G1=G1+G9 ;1 1 前記（数４）において、第０３行目では、第０７行目か
らのループ帰還の場合、従来技術のバイパス処理では、
「G1」がバイパス処理可能なためレジスタファイル（Ｒ
ＥＧ）からの読み込みは「G8」と「G9」、すなわち２ポ
ートが必要である。

【００４０】しかし、本実施例のレジスタキャッシュを
併用した場合には、「G9」は第０７行目からキャッシュ
されるため、「G8」のみの読み込み、すなわち１ポート
のみで足りる。

【００４１】また第０４行目では、「G1」が従来のバイ
パス処理、「G8」が本実施例でのレジスタキャッシュ処
理が可能であるため、レジスタファイル（ＲＥＧ）から
の読み込みは「G3」のみの１ポートで足りる。

【００４２】また第０５行目では、ＬＯＡＤ命令からの
バイパス処理が可能であるため、「G6」を読み込むため
の１ポートでよい。さらに第０６行目では、「G5」をＬ
ＯＡＤ命令からバイパス処理できるため、「G6」および
「G1」の読み込みのみでよいが、本実施例によれば「G
6」についてはレジスタキャッシュが可能であるため、
「G1」の読み込みのみ、すなわち１ポートのみが必要と
なる。

【００４３】このように、（数４）のようにプログラム
を僅かに手直し（ダミー命令を追加：第０６行目「G1=G
1」）するだけで１ポートのみでシーケンシャル探索の
全プログラムの実行が可能となっている。

【００４４】次に、本実施例によりレジスタポート数が
低減できる別の具体例として、データ転送プログラムを
説明する。

【００４５】

【数５】DO I=1,N B(I)=A(I) CONTINUE 前記（数５）式を疑似アセンブラで記述した例を下記の
（数６）式で示す。なお説明の便宜上（数６）式には各
行に行番号を付してある。また各行の右端に示されてい
る数字は、前記と同様に左側が従来のバイパス処理のみ
の場合で必要となるレジスタポート数、右側が従来のバ
イパス処理と本実施例のレジスタキャッシュ方式を併用
した場合に必要となるポート数である。

【００４６】

【数６】 01 ; G2=(I-1)*4 02 G5=(N-1)*4 03 G3=top address of A G4=top address of B-4 04 G2=0 05 LOOP:G1=LOAD(G3+G2) G2=G2+4 ;3 1 06 CMP G2,G5 ;1 1 07 STORE(G4+G2)=G1 BNE LOOP ;2 1 前記の例において、第０５行目では、サブ命令との並列
処理を行うためには、従来のバイパス処理のみの場合、
レジスタファイル（ＲＥＧ）より「G3」，「G2」，「G
2」を読み出さなければならない。このときループから
分岐してくる場合には「G2」に直接書き込みは行わない
ので「G2」をバイパス処理することはできない場合がほ
とんどである。しかし本実施例では、前の第０７行目に
おいてSTOREのアドレス生成のためにレジスタ読み出し
を行っているので、「G2」の内容はキャッシュされるた
め、レジスタファイル（ＲＥＧ）からは「G3」のみを読
み出せばよい。

【００４７】第０６行目では、「G2」は従来方法のバイ
パス処理が行われるため、レジスタファイル（ＲＥＧ）
からの読み出しは「G5」のみとなる。第０７行目では、
「G2」も「G4」もバイパス処理ができない。しかし、本
実施例では第０６行目の処理で使用された「G2」がキャ
ッシュされるため、本実施例では「G4」のみを読み出せ
ばよい。

【００４８】このように、本実施例ではレジスタキャッ
シュ方式と従来のバイパス処理とを併用することにより
ハードウエア量を大幅に低減できる。すなわち、従来の
バイパス処理のみので対応する場合には最低３ポートな
ければレジスタの読み出し待ちが必要であった処理を、
本実施例のレジスタキャッシュ処理との併用により同一
の処理を１ポートで実現できるという極めて顕著な効果
を有している。

【００４９】このような処理を図４で示したハードウエ
ア構成で行った場合、２ポート（ＰＴ１，ＰＴ２）の
内、いずれか一方のポートが完全に空き時間となるた
め、この空き時間を利用して非同期または優先度の低い
レジスタ読み出し等を行うことができる。

【００５０】なお、演算入力セレクタ（ＳＥＬ）の別の
制御方法として、当該セレクタ（ＳＥＬ）はレジスタフ
ァイル（ＲＥＧ）のポート出力（ＰＴ）を選択できない
ようにしてもよい。この場合には、先行命令の参照また
は更新したレジスタデータをバイパス処理することのみ
が可能なハードウエア構成となる。このような構成であ
っても本発明は実現可能である。なぜならば、サブ命令
に対して２つのソースレジスタの指定が可能であるが、
多くの場合一方のレジスタ指示しか必要ない場合や、本
実施例のレジスタキャッシュや従来のバイパス処理が併
用可能な場合が多く、レジスタ番号は指示したものの、
レジスタファイル（ＲＥＧ）から実際に読み込む必要が
無い場合が多く存在するためである。

【００５１】また、前記実施例では演算回路としてＡＬ
Ｕを用いた例で説明したが、演算回路としては、シフト
あるいは浮動小数演算器等を用いた構成としてもよい。

【００５２】

【発明の効果】本発明によれば、演算処理性能の低下を
来すことなくレジスタの読み出しポート数を低減し、こ
れによって少ないハードウエア構成で高速かつ効率的な
演算処理が可能な情報処理装置を実現することができ
る。

【図面の簡単な説明】

【図１】本発明の原理図

【図２】従来技術におけるパイプライン処理を示す説明
図

【図３】従来技術におけるパイプライン処理を示す説明
図

【図４】本発明の一実施例を示すブロック図

【図５】実施例における一致検出回路の配置構成を示す
説明図

【図６】実施例における一致検出回路の配置構成を示す
説明図

【図７】実施例における一致検出回路の配置構成を示す
説明図

【図８】実施例における一致検出回路の配置構成を示す
説明図

【図９】実施例におけるセレクタ（ＳＥＬ）の動作条件
を示す説明図

【図１０】実施例におけるセレクタ（ＳＥＬ）の動作条
件を示す説明図

【図１１】実施例におけるセレクタ（ＳＥＬ）の動作条
件を示す説明図

【図１２】実施例におけるセレクタ（ＳＥＬ）の動作条
件を示す説明図

【図１３】実施例（構成２）におけるパイプライン処理
の動作を示す説明図

【符号の説明】

１・・演算回路（ＡＬＵ）ＲＥＧ・・レジスタファイルＯＰ・・オペランドレジスタ（命令部、ＣＲ：一時格納
レジスタ）ＳＥＬ・・演算入力セレクタＣＯＭＰ・・一致検出回路ＯＲ・・前レジスタ番号保持部ＩＢ・・命令バッファＲＣＰＳ・・レジスタキャッシュパスＰＴ・・読み出しポート

Claims

(57)【特許請求の範囲】

【請求項１】命令の一部にオペランドとなるレジスタ
データを選択する情報を有しているパイプライン処理の
情報処理装置であって、前記レジスタデータを記憶するレジスタファイル（ＲＥ
Ｇ）と、このレジスタファイル（ＲＥＧ）から出力されたレジス
タデータを一時格納する一時格納レジスタ（ＣＲ）と、データを取り込んで演算処理を行う演算回路（１）と、前記レジスタファイル（ＲＥＧ）と演算回路（１）との
間に介装された演算入力セレクタ（ＳＥＬ）と、前記一時格納レジスタ（ＣＲ）の出力と前記演算入力セ
レクタ（ＳＥＬ）の入力を結ぶレジスタキャッシュパス
（ＲＣＰＳ）と、一時格納レジスタ（ＣＲ）に格納されたデータと、後続
命令が使用するレジスタデータとの一致を検出する一致
検出回路（ＣＯＭＰ）と、前記レジスタファイル（ＲＥＧ）の前段に設けられ前記
一時格納レジスタ（ＣＲ）のデータを読み出すのに使用
したレジスタ指示データを保持する前レジスタデータ保
持部（ＯＲ）と、命令バッファ（ＩＢ）と命令レジスタ
（ＩＲ）とを有し、前記一致検出回路（ＣＯＭＰ）は、前記命令バッファ
（ＩＢ）から命令レジスタ（ＩＲ）に命令を引き渡すの
に同期してその時点においてデコードされているレジス
タ指示情報、すなわち命令レジスタ（ＩＲ）内のレジス
タ指示情報と、命令バッファ（ＩＢ）内のレジスタ指示
情報との一致・不一致を検出し、一致する場合には、演
算入力セレクタ（ＳＥＬ）を制御して該セレクタの入力
として前記レジスタキャッシュパス（ＲＣＰＳ）を選択
し、前記一時格納レジスタ（ＣＲ）のレジスタデータが
レジスタキャッシュパス（ＲＣＰＳ）を経由して演算回
路（１）に入力されるようにしたことを特徴とする情報
処理装置。
【請求項２】命令の一部にオペランドとなるレジスタ
データを選択する情報を有しているパイプライン処理の
情報処理装置であって、前記レジスタデータを記憶するレジスタファイル（ＲＥ
Ｇ）と、このレジスタファイル（ＲＥＧ）から出力されたレジス
タデータを一時格納する一時格納レジスタ（ＣＲ）と、データを取り込んで演算処理を行う演算回路（１）と、前記レジスタファイル（ＲＥＧ）と演算回路（１）との
間に介装された演算入力セレクタ（ＳＥＬ）と、前記一時格納レジスタ（ＣＲ）の出力と前記演算入力セ
レクタ（ＳＥＬ）の入力を結ぶレジスタキャッシュパス
（ＲＣＰＳ）と、前記レジスタファイル（ＲＥＧ）の前段に設けられた命
令バッファ（ＩＢ）と、前記命令バッファ（ＩＢ）のさらに前段に設けられ前記
命令バッファ（ＩＢ）に保持されているレジスタ指示デ
ータとデコードされているレジスタ指示データとの一致
を検出する一致検出回路（ＣＯＭＰ）とを有し、前記一致検出回路（ＣＯＭＰ）において両値の一致が検
出された場合には、この一致検出回路（ＣＯＭＰ）から
出力される一致検出信号は前記命令バッファ（ＩＢ）に
一旦格納された後、次のステージに同期して演算入力セ
レクタ（ＳＥＬ）を直接制御して、前記一時格納レジス
タ（ＣＲ）のレジスタデータがレジスタキャッシュパス
（ＲＣＰＳ）を経由して演算回路（１）に入力されるよ
うにしたことを特徴とする情報処理装置。