JP2001188670A

JP2001188670A - 演算装置

Info

Publication number: JP2001188670A
Application number: JP2000000246A
Authority: JP
Inventors: Tomochika Kaneki; 朋睦鹿子木
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 2000-01-05
Filing date: 2000-01-05
Publication date: 2001-07-10

Abstract

(57)【要約】【課題】複数のデータタイプを扱う演算装置におい
て、ハードウェア増加を押さえつつ、高速なデータフォ
ワーディングを実行する演算装置を提供することを目的
とする。【解決手段】３ステージから成るパイプライン演算器
は、演算結果データとそのデータに対するデータタイプ
を並列に求め出力する。パイプライン演算器の出力を次
の演算で使用する場合、データと併せデータタイプのフ
ォワーディングを行う。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、浮動小数点演算
等、複数のデータタイプを持つ演算装置に関する。

【０００２】

【従来の技術】近年、パソコンや家庭用端末といった分
野において、３次元グラフィクス処理は欠かせない処理
となってきている。この３次元グラフィクス処理におい
て、必須の演算に浮動小数点演算がある。浮動小数点演
算は、マイクロプログラムによりソフトウェア的に実現
することも可能であるが、この場合、処理に多くのサイ
クル数がかかってしまう。先に述べた分野においては、
非常に高速な浮動小数点演算が要求されるため、近年の
マイクロプロセッサは、浮動小数点演算を高速に実行す
る浮動小数点演算ユニット（ＦＰＵ）を備えている。浮
動小数点演算ユニットは、高速動作を実現するため、い
くつかのパイプラインステージにわけて演算を実行す
る。

【０００３】図１０に３つ実行ステージ（ＥＸ１〜ＥＸ
３）を持つ従来の浮動小数点演算ユニットの構成図を示
す。同図において、１０１はレジスタファイル、１０２
〜１０４は３ステージで１つの演算を完了するパイプラ
イン演算器、１０５は演算における例外を判定する例外
判定部、１０８、１０９はレジスタファイルから読み出
したデータを入力とし、ＩＥＥＥ７５４（the Institut
e of Electrical andElectronics Engineers, Inc.）に
示されたデータタイプを判定するデータタイプチェック
器、１１０、１１１はそれぞれデータタイプチェック器
１０８、１０９の出力を保持するパイプラインレジス
タ、１１２、１１３はレジスタファイル１０１から読み
出したデータを保持するパイプラインレジスタ、１１
４、１１５はそれぞれパイプライン演算器１０２、１０
３の出力を保持するパイプラインレジスタである。

【０００４】従来の浮動小数点演算ユニットについて、
単一命令を実行した場合の動作について説明する。

【０００５】まず、データタイプチェック器１０８、１
０９は、レジスタファイル１０１から読み出した２つの
データを入力とし、データタイプの判定を行い、パイプ
ラインレジスタ１１０、１１１はそれぞれデータタイプ
チェック器１０８、１０９の出力を保持する。パイプラ
インレジスタ１１２、１１３はレジスタファイル１０１
から読み出したデータを保持する。例外判定部１０５
は、演算対象データのデータタイプによりＩＥＥＥ７５
４に示された例外を判定し、その結果をＣＰＵへ通知す
る。パイプライン演算器１０２はパイプラインレジスタ
１１２、１１３に保持されたデータを入力として演算を
実行し、演算における第１の中間データを出力する。パ
イプラインレジスタ１１４はパイプライン演算器１０２
の出力である第１の中間データを保持する。パイプライ
ン演算器１０３はパイプラインレジスタ１１４に保持さ
れたデータを入力として演算を実行し、演算における第
２の中間データを出力する。パイプラインレジスタ１１
５はパイプライン演算器１０３の出力である第２の中間
データを保持する。パイプライン演算器１０４はパイプ
ラインレジスタ１１５に保持されたデータを入力として
演算を実行し、演算結果を出力する。レジスタファイル
１０１にパイプライン演算器１０４の出力を書き込み、
演算を完了する。

【０００６】以上のような従来の浮動小数点演算ユニッ
トにおいて、レジスタハザードが起こった場合について
説明する。

【０００７】連続する２つの命令において、後続命令で
データハザードを起こす命令を図８に示す。図８におい
て、先行命令ＦＡＤＤはレジスタＦＳ１とＦＳ２に格納
されたデータに対し、浮動小数加算を実行し加算結果を
ＦＳ２に格納する命令である。また、後続命令ＦＡＤＤ
はレジスタＦＳ３とＦＳ２に格納されたデータに対し、
浮動小数加算を実行し加算結果をＦＳ２に格納する命令
である。後続命令は先行命令の演算結果を演算データと
して使用するため、レジスタＦＳ２に関してデータハザ
ードを起こし、先行命令が完了（レジスタへの書き込み
が完了）するまで演算開始を待たされてしまう。このと
きのタイミング図を図１１に示す。

【０００８】レジスタハザードによるペナルティの削減
方法として、データフォワーディング機能が一般的に知
られている。

【０００９】データフォワーディング機能は、レジスタ
ファイルから読み出したデータとパイプライン演算器１
０４の出力である演算結果を選択するセレクタを新たに
設けることで実装できる。

【００１０】データフォワーディング機能を実装した浮
動小数点ユニットの構成を図１２に、また、図８に示す
命令実行時におけるタイミング図を図１３に示す。

【００１１】

【発明が解決しようとする課題】データフォワーディン
グ機能がない場合の１クロックサイクルをＴとし、デー
タフォワーディング機能追加により増加した遅延時間を
αとすると、図８に示した命令を完了するのにかかる時
間は図１２及び図１４に示すように、データフォワーデ
ィング機能がない場合は９Ｔであり、データフォワーデ
ィング機能がある場合は８（Ｔ＋α）である。

【００１２】したがって、αがＴに対して非常に小さい
場合は、データフォワーディング機能によりレジスタハ
ザードのペナルティを削減する効果がある。

【００１３】しかし、データタイプがいくつもあるよう
なデータを扱う演算装置において、データフォワーディ
ング機能を実装しようとすると、図９に示すように、パ
イプライン演算器１０４、セレクタ１０６（又は１０
７）、データタイプチェック器１０８（又は１０９）と
いうクリティカルパスができてしまい、１クロックサイ
クルが大きくなってしまう。

【００１４】これにより、データフォワーディングによ
るペナルティの削減効果が薄れてしまうとの課題があっ
た。

【００１５】

【課題を解決するための手段】この課題を解決するため
に、請求項１記載の本発明は、少なくとも２つ以上のデ
ータタイプを持ち、Ｎステージのパイプラインステージ
から成る演算装置において、演算を実行し演算結果を出
力するＭ（Ｍ＜Ｎ）ステージのパイプライン演算器と、
前記パイプライン演算器の演算結果に対するデータタイ
プをパイプラインのいずれかのステージで検出し、その
結果を出力するデータタイプ検出器を備え、前記パイプ
ライン演算器の演算結果を演算データとして用いる場
合、前記データタイプ検出器の出力をデータタイプとし
て用いることを特徴とする演算装置を備えたものであ
る。

【００１６】請求項２記載の本発明は、請求項１記載の
発明において、少なくとも２つ以上のデータタイプを持
ち、Ｎステージのパイプラインステージから成る演算装
置において、演算データを保持するレジスタファイル
と、Ｍ（Ｍ＜Ｎ）ステージのパイプライン演算器と、少
なくとも前記レジスタファイルから読み出したデータと
前記パイプライン演算器の演算結果を入力として任意の
入力データを選択的に出力する第１のセレクタと、前記
第１のセレクタの出力を入力としてデータタイプを判定
する第１の判定器と、前記パイプライン演算器の演算に
おける中間データを入力としてデータタイプを判定する
第２の判定器と、少なくとも前記第１の判定器の出力と
前記第２の判定器の出力とを入力として任意の入力デー
タタイプを選択的に出力する第２のセレクタとを備え、
前記パイプライン演算器の演算結果を前記レジスタファ
イルの入力とし、前記第１のセレクタの出力を前記パイ
プライン演算器の入力とし、前記第１のセレクタが前記
パイプライン演算器の演算結果を選択する場合、前記第
２のセレクタは前記第２の判定器の出力をデータタイプ
として選択することを特徴とする演算装置を備えたもの
である。

【００１７】請求項３記載の本発明は、請求項１記載の
発明において、少なくとも２つ以上のデータタイプを持
ち、Ｎステージのパイプラインステージから成る演算装
置において、演算データを保持するレジスタファイル
と、Ｍ（Ｍ＜Ｎ）ステージのパイプライン演算器と、少
なくとも前記レジスタファイルから読み出したデータと
前記パイプライン演算器の演算結果を入力として任意の
入力データを選択的に出力する第１のセレクタと、前記
第１のセレクタの出力を入力としてデータタイプを判定
する判定器と、データタイプを保持する記憶素子と、少
なくとも前記判定器の出力と前記記憶素子に保持された
データタイプを入力として任意の入力データタイプを選
択的に出力する第２のセレクタとを備え、前記パイプラ
イン演算器の演算結果を前記レジスタファイルの入力と
し、前記第１のセレクタの出力を前記パイプライン演算
器の入力とし、前記第２のセレクタの出力を前記記憶素
子の入力とし、前記第１のセレクタが前記パイプライン
演算器の演算結果を選択する場合、前記第２のセレクタ
は前記記憶素子に保持されたデータを選択することを特
徴とする演算装置を備えたものである。

【００１８】請求項４記載の本発明は、請求項１記載の
発明において、少なくとも２つ以上のデータタイプを持
ち、Ｎステージのパイプラインステージから成る演算装
置において、演算データを保持するレジスタファイル
と、演算データに対してのデータタイプを保持するタイ
プファイルと、Ｍ（Ｍ＜Ｎ）ステージのパイプライン演
算器と、少なくとも前記レジスタファイルから読み出し
たデータと前記パイプライン演算器の演算結果を入力と
して任意の入力データを選択的に出力する第１のセレク
タと、前記パイプライン演算器の演算における中間デー
タを入力として、データタイプを判定する判定器と、少
なくとも前記タイプファイルから読み出したデータと前
記判定器の出力を入力として任意の入力データを選択的
に出力する第２のセレクタとを備え、前記パイプライン
演算器の演算結果を前記レジスタファイルの入力とし、
前記判定器の出力を前記タイプファイルの入力とし、前
記第１のセレクタの出力を前記パイプライン演算器の入
力とし、前記第１のセレクタが前記パイプライン演算器
の演算結果を選択する場合、前記第２のセレクタは前記
判定器の出力を選択することを特徴とする演算装置を備
えたものである。

【００１９】

【発明の実施の形態】以下、本発明の実施の形態につい
て、図１〜図７を用いて説明する。

【００２０】（実施の形態１）図１は、本発明の一実施
の形態に係る演算装置の概略構成を示したものである。
図１において、１０１はレジスタファイル、１０２〜１
０４は３ステージで１つの演算を完了し、演算結果デー
タとデータタイプを出力するパイプライン演算器、１０
５は演算における例外を判定する例外判定部、１０６、
１０７はレジスタファイルから読み出したデータとパイ
プライン演算器１０４のデータ出力のどちらかを選択し
その結果を出力するセレクタ、１０８、１０９はそれぞ
れセレクタ１０６、１０７の出力を入力とし、データタ
イプを判定するデータタイプチェック器、１１６はデー
タタイプチェック器１０８の出力とパイプライン演算器
１０４のデータタイプ出力のどちらか一方を選択し出力
するセレクタ、１１７はデータタイプチェック器１０９
の出力とパイプライン演算器１０４のデータタイプ出力
のどちらか一方を選択し出力するセレクタ、１１０、１
１１はそれぞれセレクタ１１６、１１７の出力を保持す
るパイプラインレジスタ、１１２、１１３はそれぞれセ
レクタ１０６、１０７の出力を保持するパイプラインレ
ジスタ、１１４、１１５はそれぞれパイプライン演算器
１０２、１０３の出力を保持するパイプラインレジスタ
である。

【００２１】まず、データタイプチェック器１０８、１
０９の詳細な構成について説明する。データタイプチェ
ック器１０８、１０９の詳細な構成を図３に示す。

【００２２】図３において、３１〜３３は比較器であ
る。比較器３１〜３３は、それぞれ入力データと無限
大、ゼロ、非数との比較を行い、一致した場合に１を出
力する。

【００２３】次に、例外判定部１０５について説明す
る。

【００２４】例外判定部１０５は、ＩＥＥＥ７５４に示
された例外を検出するブロックである。本実施の形態で
は説明の便宜上、検出する例外を無効演算例外とする。
無効演算は、演算に使用しているデータタイプにより検
出し、無効演算を検出した場合、無効演算信号は１とな
り、ＣＰＵとパイプライン演算器に出力する。

【００２５】次に、パイプライン演算器１０２〜１０４
の詳細な構成とその動作について以下説明する。

【００２６】パイプライン演算器１０２〜１０４の詳細
な構成を図２に示す。図２において、２１は２つの演算
データの指数部の大きいものを選択し出力するセレク
タ、２２は２つの演算データの仮数部に対して桁合わせ
を行うシフタ、２３は桁合わせされた２つの仮数部の加
算を行う加算器、２４は加算器２３の加算結果を正規化
する正規化器、２５は正規化による指数部の補正を行う
加算器、２６は正規化器２４の出力を入力として丸め処
理を行う丸め器、２７は加算器２５の加算結果を入力と
して演算結果がオーバーフローの時はオーバーフロー信
号を１にし、アンダーフローの時はアンダーフロー信号
を１にして出力する判定器、２８は判定器２７の出力と
例外判定部１０５から無効演算であることを示す信号を
制御信号として、オーバーフロー信号が１の場合は無限
大、アンダーフロー信号が１の場合はゼロ、無効演算信
号が１の場合は非数、それ以外の場合は丸め器２６及び
加算器２５の演算結果を出力するセレクタである。

【００２７】以上のように構成されたパイプライン演算
器について、２つのデータＡ=3.75とＢ=0.8125の浮動小
数加算を例にしてその動作を説明する。

【００２８】２つのデータＡ、Ｂは指数を用いた形式で
表現することができ、説明の都合上、指数部は１０進
数、仮数部は２進数で表現すると、正規化した表現で
は、Ａ=1.111x2^(1)とB=1.101x2^(-1)となる。

【００２９】ここで正規化とは、仮数部の整数部が”
１”となるようにすることを意味する。正規化された２
つの演算データＡ、Ｂの指数部はそれぞれ”１”と”−
１”であり、仮数部はそれぞれ”1.111”と”1.101”で
ある。

【００３０】説明の都合上、仮数部の有効桁は４ビット
（整数部と小数点以下３位まで）とし、最大値は1.111x
2^(9)、最小値は1.000x2^(-9)として以下説明する。

【００３１】セレクタ２１は指数部の大きいほうを選択
し出力するので、”１”を出力する。シフタ２２は、
Ａ、Ｂの指数の差だけ仮数部をデータシフトするので、
Ａ、Ｂそれぞれの仮数部は、”1.111”と”0.01101”
（1.101を2ビット右シフトした値）となる。これにより
２つの演算データは、A=1.111x2^(1)、B=0.01101x2^(1)
となりパイプライン演算器１０２は桁合わせを完了す
る。

【００３２】桁合わせされた演算の中間データはパイプ
ラインレジスタ１１４に保持される。

【００３３】パイプライン演算器１０３は、パイプライ
ンレジスタ１１４に保持された中間データに対して加算
を行う。指数部に関しては、桁合わせがすでに行われて
いるので、そのまま”１”を出力する。仮数部は”1.11
1”と”0.01101”の加算を行い、加算結果”10.01001”
を出力する。

【００３４】演算の中間データはパイプラインレジスタ
１１５に保持される。

【００３５】パイプライン演算器１０４は、パイプライ
ンレジスタ１１５に保持された中間データについて正規
化、丸め、オーバフロー及びアンダーフローの判定を行
い、最終的な演算結果を求める。

【００３６】仮数部の加算結果は”10.01001”であり、
これを正規化器２４で正規化すると1.001001x2^(1)とな
る。したがって、正規化器２４は、仮数”1.001001”と
指数補正”１”を出力する。

【００３７】加算器２５は正規化器２４からの指数補正
データ”１”とパイプラインレジスタ１１５に保持され
た指数データ”１”との加算を行うので、加算器２５の
出力は”２”となる。

【００３８】丸め器２６は正規化器２４の出力である仮
数”1.001001”に対し丸め処理を行う。ここで丸め処理
は有効桁（４ビット）以外を切捨てるとすると、丸め器
２６の出力は、”1.001”となる。

【００３９】以上により、演算の中間結果として仮数
部”1.001”と指数部”２”を得る。

【００４０】オーバーフロー及びアンダーフローを判定
する判定器２７において、入力されたデータと最大値及
び最小値の指数部の比較と行う。最大値、最小値の指数
部はそれぞれ”９”と”−９”である。判定器２７は、
入力されたデータが”９”より大きい場合はオーバーフ
ロー信号を１とし、”−９”より小さい場合はアンダー
フロー信号を１として出力する。浮動小数加算の中間結
果の指数部である加算器２５の出力は”２”なので、判
定器２７はオーバーフロー信号、アンダーフロー信号を
ともに０として出力する。

【００４１】ここで、浮動小数加算は正規化数どうしの
加算であり、ＩＥＥＥ７５４に示された無効演算ではな
いので、例外判定部１０５は無効演算信号を０として出
力する。

【００４２】オーバーフロー信号、アンダーフロー信
号、無効演算信号がすべて０なので、セレクタ２８は、
加算器２５と丸め器２６の演算結果（指数部２、仮数部
1.001）を選択し出力する。これにより浮動小数加算結
果1.001x2^(2)（=4.5)を得る。

【００４３】以上のように、パイプライン演算器１０２
〜１０４は浮動小数演算を実行し、演算結果を出力す
る。また、パイプライン演算器１０４のセレクタ２８で
使用している制御信号を浮動小数演算結果のデータタイ
プとして出力する。

【００４４】以上のように構成された演算装置におい
て、データフォワーディング時の動作について、以下説
明する。

【００４５】ここで、連続する２つの命令において、後
続の命令でデータハザードを起こす命令は図８に示した
ものとする。

【００４６】まず、１サイクル目、レジスタファイル１
０１より先行演算で使用するＦＳ１、ＦＳ２を読み出
す。

【００４７】セレクタ１０６、１０７はレジスタファイ
ル１０１より読み出したデータを選択し出力し、パイプ
ラインレジスタ１１２、１１３はセレクタ１０６、１０
７の出力を保持する。データタイプチェック器１０８、
１０９はレジスタファイルから読み出したＦＳ１、ＦＳ
２について、データタイプを判定し、その結果をパイプ
ラインレジスタ１１０、１１１に保持する。

【００４８】２サイクル目、パイプライン演算器１０２
はレジスタファイルより読み出したデータについて桁合
わせ処理を行い、パイプラインレジスタ１１４は先行演
算における中間データを保持する。また、同サイクルに
おいて、後続演算で使用するＦＳ３、ＦＳ２をレジスタ
ファイル１０１より読み出そうとする。しかし、先行演
算によりＦＳ２が確定していないので、図示していない
制御部によりデータ読み出しが停止させられる。

【００４９】３サイクル目、パイプライン演算器１０３
はパイプラインレジスタ１１４に保持されたデータにつ
いて加算を行い、パイプラインレジスタ１１５は先行演
算における中間データを保持する。同サイクルにおい
て、後続演算のデータ読み出しは停止されたままであ
る。

【００５０】４サイクル目、パイプライン演算器１０４
はパイプラインレジスタ１１５に保持されたデータにつ
いて正規化、丸め、オーバーフロー及びアンダーフロー
チェックを行い、先行演算の浮動小数加算結果を出力す
る。この時点で浮動小数加算結果が確定（ＦＳ２の値が
確定）するので、セレクタ１０７はパイプライン演算器
１０４の出力を選択することでデータフォワーディング
を行い、ＦＳ２のデータ読み出しを行う。また、ＦＳ３
はレジスタファイルから読み出し、後続演算におけるデ
ータ読み出しを完了する。データタイプチェック器１０
８はレジスタファイルから読み出したＦＳ３のデータタ
イプを判定し、セレクタ１１６はデータタイプチェック
器１０８の出力を選択し、その結果をパイプラインレジ
スタ１１０が保持する。セレクタ１１７はパイプライン
演算器１０４から出力されたデータタイプを選択し、そ
の結果をパイプラインレジスタ１１１が保持する。

【００５１】５サイクル目、先行演算の浮動小数加算結
果はレジスタファイル１０１に格納され、先行演算は完
了する。また、パイプライン演算器１０２で後続演算の
桁合わせ処理を行う。

【００５２】６サイクル目、７サイクル目でパイプライ
ン演算器１０３、１０４は後続演算を実行し、８サイク
ル目で後続演算の浮動小数加算結果をレジスタファイル
１０１に格納し、後続演算は完了する。

【００５３】以上のように、データフォワーディングに
おいて、後続演算で使用するデータ自身とそのデータタ
イプも併せてフォワーディングするので、従来必要であ
ったフォワーディングしたデータに対してのデータタイ
プ判定が必要なくなる。このため、浮動小数点演算ユニ
ットの遅延時間は図４に示すようになり、高速なデータ
フォワーディング機能を実装できる。

【００５４】（実施の形態２）図５は、本発明の一実施
の形態に係る演算装置の概略構成を示したものである。
図５において、１０１はレジスタファイル、１０２〜１
０４は３ステージで１つの演算を完了し、演算結果デー
タを出力するパイプライン演算器、１０５は演算におけ
る例外を判定する例外判定部、１０６、１０７はレジス
タファイルから読み出したデータとパイプライン演算器
１０４のデータ出力のどちらかを選択しその結果を出力
するセレクタ、１０８、１０９はそれぞれセレクタ１０
６、１０７の出力を入力とし、データタイプを判定する
データタイプチェック器、１１６はデータタイプチェッ
ク器１０８の出力とパイプラインレジスタ１１９に保持
されたデータのどちらか一方を選択し出力するセレク
タ、１１７はデータタイプチェック器１０９の出力とパ
イプラインレジスタ１１９に保持されたデータのどちら
か一方を選択し出力するセレクタ、１１０、１１１はそ
れぞれセレクタ１１６、１１７の出力を保持するパイプ
ラインレジスタ、１１２、１１３はそれぞれセレクタ１
０６、１０７の出力を保持するパイプラインレジスタ、
１１４、１１５はそれぞれパイプライン演算器１０２、
１０３の出力を保持するパイプラインレジスタ、１１８
はパイプラインレジスタ１１１の出力を保持し、パイプ
ラインレジスタ１１９へ出力するパイプラインレジスタ
である。

【００５５】以上のように構成された演算装置におい
て、データフォワーディング時の動作について、以下説
明する。

【００５６】ここで、連続する２つの命令において、後
続の命令でデータハザードを起こす命令を図６に示す。
図６において、先行命令ＦＭＯＶはレジスタＦＳ１に格
納されたデータとゼロの浮動小数点加算を実行し結果を
ＦＳ２に格納する命令である。また、後続命令ＦＡＤＤ
はレジスタＦＳ３とＦＳ２に格納されたデータに対し、
浮動小数加算を実行し加算結果をＦＳ２に格納する命令
である。

【００５７】まず、１サイクル目、レジスタファイル１
０１より先行演算で使用する数値ゼロとＦＳ１に保持さ
れたデータを読み出す。セレクタ１０６、１０７はレジ
スタファイル１０１より読み出したデータを選択し出力
し、パイプラインレジスタ１１２、１１３はそれぞれセ
レクタ１０６、１０７の出力を保持する。データタイプ
チェック器１０８、１０９はそれぞれゼロとＦＳ１につ
いて、データタイプを判定し、その結果をパイプライン
レジスタ１１０、１１１に保持する。

【００５８】２サイクル目、パイプライン演算器１０２
はレジスタファイルより読み出したデータについて桁合
わせ処理を行い、パイプラインレジスタ１１４は先行演
算における中間データを保持する。また、パイプライン
レジスタ１１１に保持されたＦＳ１のデータタイプをパ
イプラインレジスタ１１８が保持する。同サイクルにお
いて、後続演算で使用するＦＳ３、ＦＳ２をレジスタフ
ァイル１０１より読み出そうとする。しかし、先行演算
によりＦＳ２が確定していないので、図示していない制
御部によりデータ読み出しが停止させられる。

【００５９】３サイクル目、パイプライン演算器１０３
はパイプラインレジスタ１１４に保持されたデータにつ
いて加算処理を行い、パイプラインレジスタ１１５は先
行演算における中間データを保持する。また、パイプラ
インレジスタ１１８に保持されたＦＳ１のデータタイプ
をパイプラインレジスタ１１９が保持する。同サイクル
において、後続演算のデータ読み出しは停止されたまま
である。

【００６０】４サイクル目、パイプライン演算器１０４
はパイプラインレジスタ１１５に保持されたデータにつ
いて正規化、丸め、オーバーフロー及びアンダーフロー
チェックを行い、先行演算の浮動小数加算結果を出力す
る。この時点で浮動小数加算結果が確定（ＦＳ２の値が
確定）するので、セレクタ１０７はパイプライン演算器
１０４の出力を選択することでデータフォワーディング
を行い、ＦＳ２のデータ読み出しを完了する。また、Ｆ
Ｓ３はレジスタファイルから読み出し、後続演算におけ
るデータ読み出しを完了する。データタイプチェック器
１０８はレジスタファイルから読み出したＦＳ３のデー
タタイプを判定し、セレクタ１１６はデータタイプチェ
ック器１０８の出力を選択し、その結果をパイプライン
レジスタ１１０が保持する。セレクタ１１７はパイプラ
インレジスタ１１９に保持されたデータタイプを選択
し、その結果をパイプラインレジスタ１１１が保持す
る。

【００６１】５サイクル目、先行演算の浮動小数加算結
果はレジスタファイル１０１に格納され、先行演算は完
了する。また、パイプライン演算器１０２で後続演算の
桁合わせ処理を行う。

【００６２】６サイクル目、７サイクル目でパイプライ
ン演算器１０３、１０４は後続演算を実行し、８サイク
ル目で後続演算結果をレジスタファイル１０１に格納
し、後続演算を完了する。

【００６３】以上のように、データフォワーディングに
おいて、後続演算で使用するデータ自身とそのデータタ
イプも併せてフォワーディングするので、従来必要であ
ったフォワーディングしたデータに対してのデータタイ
プ判定が必要なくなる。

【００６４】（実施の形態３）図７は、本発明の一実施
の形態に係る演算装置の概略構成を示したものである。
図７において、１０１はレジスタファイル、１２０はレ
ジスタファイルに格納されたデータに対してのデータタ
イプを保持するタイプファイル、１０２〜１０４は３ス
テージで１つの演算を完了し、演算結果データとデータ
タイプを出力するパイプライン演算器、１０５は演算に
おける例外を判定する例外判定部、１０６、１０７はレ
ジスタファイルから読み出したデータとパイプライン演
算器１０４のデータ出力のどちらかを選択しその結果を
出力するセレクタ、１１６はタイプファイルから読み出
したデータとパイプライン演算器１０４のデータタイプ
出力のどちらか一方を選択し出力するセレクタ、１１７
はタイプファイルから読み出したデータとパイプライン
演算器１０４のデータタイプ出力のどちらか一方を選択
し出力するセレクタ、１１０、１１１はそれぞれセレク
タ１１６、１１７の出力を保持するパイプラインレジス
タ、１１２、１１３はそれぞれセレクタ１０６、１０７
の出力を保持するパイプラインレジスタ、１１４、１１
５はそれぞれパイプライン演算器１０２、１０３の出力
を保持するパイプラインレジスタである。

【００６５】以上のように構成された演算装置におい
て、データフォワーディング時の動作について、以下説
明する。

【００６６】ここで、連続する２つの命令において、後
続の命令でデータハザードを起こす命令を図８に示す。

【００６７】まず、１サイクル目、レジスタファイル１
０１より先行演算で使用するＦＳ１、ＦＳ２を読み出
し、タイプファイル１２０からレジスタＦＳ１、ＦＳ２
のデータタイプを読み出す。セレクタ１０６、１０７は
レジスタファイル１０１より読み出したデータを選択
し、パイプラインレジスタ１１２、１１３はセレクタ１
０６、１０７の出力を保持する。また、セレクタ１１
６、１１７はタイプファイル１２０から読み出したデー
タを選択し、パイプラインレジスタ１１０、１１１はセ
レクタ１１６、１１７の出力を保持する。

【００６８】２サイクル目、パイプライン演算器１０２
はレジスタファイルより読み出したデータについて桁合
わせ処理を行い、パイプラインレジスタ１１４は先行演
算における中間データを保持する。また同サイクルにお
いて、後続演算で使用するＦＳ３、ＦＳ２をレジスタフ
ァイル１０１より読み出そうとする。しかし、先行演算
によりＦＳ２が確定していないので、図示していない制
御部によりデータ読み出しが停止させられる。

【００６９】３サイクル目、パイプライン演算器１０３
はパイプラインレジスタ１１４に保持されたデータにつ
いて加算処理を行い、パイプラインレジスタ１１５は先
行演算における中間データを保持する。同サイクルにお
いて、後続演算のデータ読み出しは停止されたままであ
る。

【００７０】４サイクル目、パイプライン演算器１０４
はパイプラインレジスタ１１５に保持されたデータにつ
いて正規化、丸め、オーバーフロー及びアンダーフロー
チェックを行い、先行演算の浮動小数加算結果を出力す
る。この時点で浮動小数加算結果が確定（ＦＳ２の値が
確定）するので、セレクタ１０７はパイプライン演算器
１０４の出力を選択することでデータフォワーディング
を行い、ＦＳ２のデータ読み出しを完了する。また、Ｆ
Ｓ３はレジスタファイルから読み出し、後続演算におけ
るデータ読み出しを完了する。セレクタ１１６はタイプ
ファイルから読み出したＦＳ３のデータタイプを選択
し、その結果をパイプラインレジスタ１１０が保持す
る。セレクタ１１７はパイプライン演算器１０４から出
力されたデータタイプを選択し、その結果をパイプライ
ンレジスタ１１１が保持する。

【００７１】５サイクル目、先行演算結果はレジスタフ
ァイル１０１に格納され、先行演算結果のデータタイプ
はタイプファイル１２０に格納され先行演算は完了す
る。また、同サイクルにおいて、パイプライン演算器１
０２は後続演算の桁合わせ処理を行う。

【００７２】６サイクル目、７サイクル目でパイプライ
ン演算器１０３、１０４は後続演算を実行し、８サイク
ル目で後続演算結果をレジスタファイル１０１に格納
し、後続演算結果のデータタイプをタイプファイル１２
０に格納し、後続演算は完了する。

【００７３】以上のように、データフォワーディングに
おいて、後続演算で使用するデータ自身とそのデータタ
イプも併せてフォワーディングするので、従来必要であ
ったフォワーディングしたデータに対してのデータタイ
プ判定が必要なくなる。

【００７４】

【発明の効果】本発明の演算装置では、データフォワー
ディングにおいて、データ自身とそのデータタイプも併
せてフォワーディングするので、高速なフォワーディン
グを行える。また、実施の形態１において、フォワーデ
ィングするデータに対するデータタイプ情報として、パ
イプライン演算器内部で使用している制御信号を利用す
るので、パイプライン演算器のハードウェアは増加する
ことはないとの有利な効果がある。実施の形態２におい
て、データをスルーさせる演算においてはオーバーフロ
ー、アンダーフローの判定が必要ないため、パイプライ
ンステージの早いステージでデータ及びデータタイプを
フォワーディングすることができ、レジスタハザードに
おけるペナルティを更に削減することができるとの有利
な効果がある。また、命令デコード、レジスタからのデ
ータ読み出し、データタイプチェック処理を１サイクル
で実行するプロセサにおいて、命令拡張により命令体系
が複雑化するにつれ、命令デコード処理に時間がかかっ
てしまい、このパスがクリティカルパスとなってしま
う。実施の形態３では、レジスタファイルからデータ、
タイプファイルからデータタイプを読み出すので、レジ
スタファイルから読み出したデータに対してのデータタ
イプチェック処理が必要なくなり、高速なデータ読み出
しが行える。これにより、命令拡張によって増える命令
デコード処理にかかる時間を隠蔽することができ、プロ
セッサ全体の動作速度低下を防ぐことができるとの有利
な効果がある。

【図面の簡単な説明】

【図１】本発明の実施の形態１に係る演算装置の概略構
成図

【図２】本発明の実施の形態１に係るパイプライン演算
器の詳細な構成図

【図３】本発明の実施の形態１に係るデータタイプチェ
ック器の詳細な構成図

【図４】本発明の実施の形態１に係る演算装置の遅延時
間を示す図

【図５】本発明の実施の形態２に係る演算装置の概略構
成図

【図６】本発明の実施の形態２に係る演算装置で実行す
る命令を示す図

【図７】本発明の実施の形態３に係る演算装置の概略構
成図

【図８】演算装置で実行する命令を示す図

【図９】従来の演算装置の遅延時間を示す図

【図１０】従来の演算装置の概略構成図

【図１１】従来の演算装置のタイミング図

【図１２】従来の演算装置の概略構成図

【図１３】従来の演算装置のタイミング図

【符号の説明】

１０１レジスタファイル１０２、１０３、１０４パイプライン演算器１０５例外判定部１０６、１０７、１１６、１１７セレクタ１０８、１０９データタイプチェック器１１０、１１１、１１２、１１３、１１４、１１５パ
イプラインレジスタ

Claims

【特許請求の範囲】

【請求項１】少なくとも２つ以上のデータタイプを持
ち、Ｎステージのパイプラインステージから成る演算装
置において、演算を実行し演算結果を出力するＭ（Ｍ＜
Ｎ）ステージのパイプライン演算器と、前記パイプライ
ン演算器の演算結果に対するデータタイプをパイプライ
ンのいずれかのステージで検出し、その結果を出力する
データタイプ検出器を備え、前記パイプライン演算器の
演算結果を演算データとして用いる場合、前記データタ
イプ検出器の出力をデータタイプとして用いることを特
徴とする演算装置。
【請求項２】少なくとも２つ以上のデータタイプを持
ち、Ｎステージのパイプラインステージから成る演算装
置において、演算データを保持するレジスタファイル
と、Ｍ（Ｍ＜Ｎ）ステージのパイプライン演算器と、少
なくとも前記レジスタファイルから読み出したデータと
前記パイプライン演算器の演算結果を入力として任意の
入力データを選択的に出力する第１のセレクタと、前記
第１のセレクタの出力を入力としてデータタイプを判定
する第１の判定器と、前記パイプライン演算器の演算に
おける中間データを入力としてデータタイプを判定する
第２の判定器と、少なくとも前記第１の判定器の出力と
前記第２の判定器の出力とを入力として任意の入力デー
タタイプを選択的に出力する第２のセレクタとを備え、
前記パイプライン演算器の演算結果を前記レジスタファ
イルの入力とし、前記第１のセレクタの出力を前記パイ
プライン演算器の入力とし、前記第１のセレクタが前記
パイプライン演算器の演算結果を選択する場合、前記第
２のセレクタは前記第２の判定器の出力をデータタイプ
として選択することを特徴とする請求項１記載の演算装
置。
【請求項３】少なくとも２つ以上のデータタイプを持
ち、Ｎステージのパイプラインステージから成る演算装
置において、演算データを保持するレジスタファイル
と、Ｍ（Ｍ＜Ｎ）ステージのパイプライン演算器と、少
なくとも前記レジスタファイルから読み出したデータと
前記パイプライン演算器の演算結果を入力として任意の
入力データを選択的に出力する第１のセレクタと、前記
第１のセレクタの出力を入力としてデータタイプを判定
する判定器と、データタイプを保持する記憶素子と、少
なくとも前記判定器の出力と前記記憶素子に保持された
データタイプを入力として任意の入力データタイプを選
択的に出力する第２のセレクタとを備え、前記パイプラ
イン演算器の演算結果を前記レジスタファイルの入力と
し、前記第１のセレクタの出力を前記パイプライン演算
器の入力とし、前記第２のセレクタの出力を前記記憶素
子の入力とし、前記第１のセレクタが前記パイプライン
演算器の演算結果を選択する場合、前記第２のセレクタ
は前記記憶素子に保持されたデータを選択することを特
徴とする請求項１記載の演算装置。
【請求項４】少なくとも２つ以上のデータタイプを持
ち、Ｎステージのパイプラインステージから成る演算装
置において、演算データを保持するレジスタファイル
と、演算データに対してのデータタイプを保持するタイ
プファイルと、Ｍ（Ｍ＜Ｎ）ステージのパイプライン演
算器と、少なくとも前記レジスタファイルから読み出し
たデータと前記パイプライン演算器の演算結果を入力と
して任意の入力データを選択的に出力する第１のセレク
タと、前記パイプライン演算器の演算における中間デー
タを入力として、データタイプを判定する判定器と、少
なくとも前記タイプファイルから読み出したデータと前
記判定器の出力を入力として任意の入力データを選択的
に出力する第２のセレクタとを備え、前記パイプライン
演算器の演算結果を前記レジスタファイルの入力とし、
前記判定器の出力を前記タイプファイルの入力とし、前
記第１のセレクタの出力を前記パイプライン演算器の入
力とし、前記第１のセレクタが前記パイプライン演算器
の演算結果を選択する場合、前記第２のセレクタは前記
判定器の出力を選択することを特徴とする請求項１記載
の演算装置。