JP2725546B2

JP2725546B2 - デ−タ処理装置

Info

Publication number: JP2725546B2
Application number: JP4326435A
Authority: JP
Inventors: 英夫和田; 克己竹田; 泰弘稲上; 啓明藤井
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1992-12-07
Filing date: 1992-12-07
Publication date: 1998-03-11
Anticipated expiration: 2013-03-11
Also published as: GB2273186A; JPH06176053A; GB2273186B; US5581721A; GB9324877D0

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明はデ−タ処理装置に関
し、さらに具体的には命令によってアドレス可能なレジ
スタの数より多いレジスタをデ−タ処理装置がアクセス
可能とする技術に関する。特に、このようにすることに
よって、キャッシュがあまり有効でない大規模なデ−タ
を連続的に処理するいわゆるベクトル処理に際して、主
記憶からの転送のための性能低下がほとんど生じないよ
うにし、効率のよい擬似ベクトル処理を通常のデ−タ処
理装置で実現可能とする技術に関する。

【０００２】

【従来の技術】（従来技術１）従来、命令によってア
ドレス可能なレジスタの数より多いレジスタをデ−タ処
理装置がアクセス可能とする技術としては、特開昭５７
−１６６６４９号に記載があり、その方式によると、ま
ず、プログラムによってアドレス可能な汎用レジスタの
数よりも多いハ−ドウエアレジスタと称するレジスタ群
を設け、異なった主記憶アドレスから同一の汎用レジス
タに対する複数のロ−ド命令があったら、該ロ−ド命令
の数だけハ−ドウエアレジスタに保持する（すなわち、
プログラムによってアドレス可能な汎用レジスタの数が
１６である場合、ハ−ドウエアレジスタを各汎用レジス
タ当たり１６、つまり、合計２５６用意し、たとえば、
汎用レジスタ０にはハ−ドウエアレジスタ０から１５を
割り当てる。汎用レジスタ０に対して１６個の異なった
主記憶アドレスを指定したロ−ド命令が実行された場合
は、該１６個のロ−ド命令からのデ−タをハ−ドウエア
レジスタ０からハ−ドウエアレジスタ１５までの中に保
持する）。そして、過去に実行されたロ−ド命令の主記
憶アドレスとその時ロ−ドされたデ−タが格納されてい
るハ−ドウエアレジスタ番号を登録しておく記憶機構を
設け、プログラムで発行されたロ−ド命令が該記憶機構
に登録されている主記憶アドレスと一致したら、主記憶
からデ−タを読まずに、対応するハ−ドウエアレジスタ
からデ−タを読みだす。この方式により、主記憶参照回
数が低減でき、また、命令間の参照レジスタのぶつかり
による性能低下を防ぐことができる。

【０００３】（従来技術２）従来、命令によってアドレ
ス可能なレジスタの数より多いレジスタをデ−タ処理装
置がアクセス可能とする技術としては、Ｊ．Ｌ．Ｈｅｎ
ｎｅｓｙａｎｄＤ．Ａ．Ｐａｔｔｅｒｓｏｎ ”Ｃ
ｏｍｐｕｔｅｒＡｒｃｈｉｔｅｃｔｕｒｅ：ＡＱ
ｕａｎｔｉｔａｔｉｖｅＡｐｐｒｏａｃｈ”，Ｍｏｒ
ｇａｎＫａｕｆｍａｎｎＰｕｂｌｉｓｈ−ｅｒｓ，
Ｉｎｃ．（１９９０）に記載があり、その方式による
と、まず、プログラムによってアドレス可能なレジスタ
の数より多い物理レジスタと称するレジスタを設け、該
物理レジスタを複数個のウィンドウと呼ばれる部分に分
ける。すなわち、各ウィンドウは複数個の物理レジスタ
から成る。たとえば、プログラムによってレジスタが番
号１からｎまで番号づけられるとし、物理レジスタがｎ
＊ｍ個、すなわち、番号１からｎ＊ｍまで設けられたと
する。ウィンドウをｍ個、すなわち、番号１からｍまで
設けるとすれば、ウィンドウ１は物理レジスタ１から
ｎ、ウィンドウ２は物理レジスタｎ＋１から２ｎという
ように割り当てることができる。実際には、全ウィンド
ウ共通の物理レジスタや、隣合うウィンドウ共通の物理
レジスタなどを設けるのが通例であるが、簡単のため、
前記の例を示した。各ウィンドウは１つのプログラムが
使用するレジスタを持つ。すなわち、あるプログラムで
アドレス可能なレジスタを参照することは、実際には、
あるウィンドウに属する物理レジスタを参照することに
なる。たとえば、前記の例では、あるプログラムにウィ
ンドウ２が割当てられていたとしたら、該プログラムで
レジスタｋを指定したら、参照される物理レジスタは物
理レジスタｎ＋ｋになる。

【０００４】このウィンドウは以下のように使う。仮
に、あるプログラムにウィンドウｊが割当てられていた
場合、該プログラムが別のプログラムを呼んだ（ｃａｌ
ｌした）場合、呼ばれたプログラムには、ウィンドウｊ
＋１が割当てられる。また、あるプログラムにウィンド
ウｊが割当てられていた場合、該プログラムから該プロ
グラムを呼んだプログラムに戻った（ｒｅｔｕｒｎし
た）場合、戻り先のプログラムには、ウィンドウｊ−１
が割当てられる。このように使うことによって、以下の
効果がある。プログラムによってアドレス可能なレジス
タの数だけのレジスタしか持たないシステムでは、前記
のようなプログラムの呼びが発生するたびに、該呼び発
生時点の情報保存のために、レジスタに格納されていた
デ−タを主記憶に格納しなければならず、プログラムの
戻りが発生するたびに、プログラムの再開のために、主
記憶に格納されていたデ−タをレジスタに書き戻さなく
てはならない。前記のウィンドウの機構を持つシステム
では、異なるウィンドウが割当てられているプログラム
は異なる物理レジスタを参照しているので、前記のレジ
スタからの主記憶への格納、主記憶からレジスタへの書
き戻しの操作が不要になり、処理が高速化される。

【０００５】ただし、該ウィンドウの機構を持つシステ
ムでは、「最大のウィンドウ番号のプログラムからプロ
グラムの呼びが発された場合、ウィンドウオ−バフロ−
の割込みを起こし、最小のウィンドウ番号のプログラム
からプログラムの戻りが発された場合、ウィンドウアン
ダフロ−の割込みを起こす」という制御が必要になる。

【０００６】

【発明が解決しようとする課題】本発明は命令によって
アドレス可能なレジスタの数より多いレジスタをデ−タ
処理装置がアクセス可能とする技術に関するものである
が、レジスタとして浮動小数点数が格納される浮動小数
点レジスタを例にとって述べる。

【０００７】科学技術計算の大部分は、以下に示すよう
な、ベクトル演算である。

【０００８】Ａ（ｉ）＝Ｂ（ｉ）＊Ｓｉ＝１，Ｎ（１）ここで、Ａ、Ｂ，は要素数Ｎのベクトル、Ｓはスカラで
ある。

【０００９】以下の説明で、浮動小数点レジスタのデ−
タ幅は８バイトとする。

【００１０】式（１）を、汎用計算機で実行すると、図
６のようなプログラムになる。

【００１１】図６中の各命令の機能を以下に説明する。

【００１２】ＦＬＤＭａ（ＧＲｍ），ＦＲｎ（機能）汎用レジスタｍの値で表される主記憶アドレス
から８バイトのデ−タを読みだし、浮動小数点レジスタ
ｎに格納する。

【００１３】その後、汎用レジスタｍの値をａ加える。

【００１４】ＦＭＬＴＦＲｊ，ＦＲｍ，ＦＲｎ（機能）浮動小数点レジスタｍの値と浮動小数点レジス
タｎの値の積を浮動小数点レジスタｊに格納する。

【００１５】ＦＳＴＭａ（ＧＲｍ），ＦＲｎ（機能）浮動小数点レジスタｎの値（８バイト）を汎用
レジスタｍの値で表される主記憶アドレスにストアす
る。

【００１６】その後、汎用レジスタｍの値をａ加える。

【００１７】ＢＣＮＴＧＲｍ，ｔ（機能）ＧＲｍの値を１減じる。その値がゼロでなけれ
ば、番地ｔに分岐する。ゼロならば、分岐しない。

【００１８】ここで、図６のプログラムの実行に先だっ
て、ベクトルＢは、主記憶アドレスａｄ１から始まる連
続領域に格納されているものとする。すなわち、Ｂ
（１）の主記憶アドレスがａｄ１、Ｂ（２）の主記憶ア
ドレスがａｄ１＋８というように格納されている。同様
にベクトルＡは、主記憶アドレスａｄ３から始まる連続
領域に格納するものとする。汎用レジスタ１にはａｄ１
が、汎用レジスタ３にはａｄ３が、汎用レジスタ４には
Ｎが前もって格納されているものとする。浮動小数点レ
ジスタ７にはＳが前もって格納されているものとする。

【００１９】図６からわかるように、Ｎｏ．１のＦＬＤ
Ｍ命令で、Ｂ（ｉ）が浮動小数点レジスタ８にロ−ドさ
れ、Ｎｏ．２のＦＭＬＴ命令で、該浮動小数点レジスタ
の値と浮動小数点レジスタ７の値の積が浮動小数点レジ
スタ１０に格納され、Ｎｏ．３のＦＳＴＭ命令で該浮動
小数点レジスタの値がＡ（ｉ）にストアされる。

【００２０】すなわち、４命令からなるル−プを１回実
行することによって、１要素の結果が求まり、このル−
プをＮ回実行することによって全要素計算ができる。

【００２１】ここで、１ル−プの実行時間が問題にな
る。まずＮｏ．１のＦＬＤＭ命令で浮動小数点レジスタ
８に主記憶からデ−タをロ−ドしているが、キャッシュ
にデ−タがある場合はＦＬＤＭ命令は短いサイクル数で
終わるが、キャッシュにない場合は、キャッシュよりは
かなり低速の主記憶からデ−タを読みださなくてはなら
ず、キャッシュにデ−タがある場合に比べ、かなり時間
がかかることになる。次にＮｏ．２のＦＭＬＴ命令は浮
動小数点レジスタ８の値を使うので、前記ロ−ドが完了
しないと、実行が開始できない。Ｎｏ．３のＦＳＴＭ命
令は浮動小数点レジスタ１０の値を使うが、浮動小数点
レジスタ１０の値は先行するＦＭＬＴ命令の実行が終わ
らないと値が決まらないので、実行が開始できない。

【００２２】すなわち、（１）デ−タ読みだし時間、
（２）レジスタのぶつかりという２つの性能低下要因が
ル−プの実行時間を長くすることになる。特に（１）は
長大デ−タを扱う計算の場合は深刻で、必要なデ−タが
キャッシュにはいりきらない場合が多くなり、性能の低
下は大きくなる。

【００２３】この問題を解決する一手法がル−プアンロ
−リングであり、図７に示す手法である。すなわち、１
ル−プで複数要素（＝ｎ）を処理し、１ル−プで１要素
を処理する場合に比べ、ル−プ回数を１／ｎにする方式
である。図７は１ル−プで４要素を処理する方式であ
る。

【００２４】ここで、図７のプログラムの実行に先だっ
て、ベクトルＢは、主記憶アドレスａｄ１から始まる連
続領域に格納されているものとする。すなわち、Ｂ
（１）の主記憶アドレスがａｄ１、Ｂ（２）の主記憶ア
ドレスがａｄ１＋８というように格納されている。同様
にベクトルＡは、主記憶アドレスａｄ３から始まる連続
領域に格納するものとする。汎用レジスタ１にはａｄ１
が、汎用レジスタ３にはａｄ３が、汎用レジスタ４には
Ｎ／４が前もって格納されているものとする。浮動小数
点レジスタ７にはＳが前もって格納されているものとす
る。

【００２５】図７からわかる通り、１３命令からなるル
−プを１回実行することによって、４要素の結果が求ま
り、このル−プをＮ／４回実行することによって全要素
計算ができる。

【００２６】図７からわかる通り、ｉ番目の要素に関
し、ロ−ドをＮｏ．１のＦＬＤＭ命令で、乗算をＮｏ．
５のＦＭＬＴ命令で、ストアをＮｏ．９のＦＳＴＭ命令
で行なう。同様に、ｉ＋１番目の要素に関し、ロ−ドを
Ｎｏ．２のＦＬＤＭ命令で、乗算をＮｏ．６のＦＭＬＴ
命令で、ストアをＮｏ．１０のＦＳＴＭ命令で行なう。
同様に、ｉ＋２番目の要素に関し、ロ−ドをＮｏ．３の
ＦＬＤＭ命令で、乗算をＮｏ．７のＦＭＬＴ命令で、ス
トアをＮｏ．１１のＦＳＴＭ命令で行なう。同様に、ｉ
＋３番目の要素に関し、ロ−ドをＮｏ．４のＦＬＤＭ命
令で、乗算をＮｏ．８のＦＭＬＴ命令で、ストアをＮ
ｏ．１２のＦＳＴＭ命令で行なう。したがって、図６に
比べ、ある１つの要素番号で示される要素に関するロ−
ド、乗算、ストアという一連の処理が、命令列上で離れ
ることになり、前記の（１）デ−タ読みだし時間、
（２）レジスタのぶつかりという２つの性能低下要因の
影響を低減できる。たとえば、Ｎｏ．１のＦＬＤＭ命令
でＢ（ｉ）のロ−ドが行われ、そのロ−ド結果が使われ
るのが、４命令後になるので、デ−タ読みだし時間が４
サイクル以内ならば、そのロ−ド結果を使うＮｏ．５の
ＦＭＬＴ命令が待たされることはない。また、Ｎｏ．５
のＦＭＬＴ命令による乗算結果Ｂ（ｉ）＊Ｓが使われる
のが４命令後になるので、乗算に要する時間が４サイク
ル以内ならば、Ｎｏ．９のＦＳＴＭ命令が待たされるこ
とはない。

【００２７】このように、ル−プアンロ−リングによっ
て、性能は向上するが、この方式の欠点は、多くのレジ
スタを必要とすることである。図６のプログラムが３本
の浮動小数点レジスタを必要とするのに対し、図７のプ
ログラムは９本の浮動小数点レジスタを必要とする。デ
−タの読みだしに要する時間がさらに長かったり、演算
に要する時間がさらに長かったりすると、もっと多くの
要素を１ル−プで処理しなくてはならず、より多くのレ
ジスタが必要となることになる。

【００２８】一般に、レジスタはアクティブな素子（す
なわち、メモリ素子ではない）で構成され、読みだし／
書き込みのためのポ−ト（すなわち、デ−タの出入口）
を多く用意することができるので、いわゆる記憶装置が
１つの動作サイクルに１個のデ−タの読みだし／書き込
みしかできないのに比べ、極めて高速である。したがっ
て、主記憶はもちろん、キャッシュに比べても、高速化
のためには、十分な容量のレジスタをもっていることが
必要不可欠である。それにもかかわらず、従来、レジス
タの数が比較的少なかったのは、ビット当たりのコスト
が高価であったことと、下記に示すように命令形式上の
レジスタ番号のフィ−ルドの長さに制限があったためで
ある。コストの問題はＬＳＩ化で解決されつつあるが、
後者はまだ未解決であった。

【００２９】プログラムでアドレス可能なレジスタの数
は、ア−キテクチャ上から制限されている。たとえば、
命令語中にレジスタ指定フィ−ルドが５ビットあれば、
アドレス可能なレジスタの数は３２（２の５乗）であ
る。該レジスタ指定フィ−ルドのビット数を増せば、プ
ログラムでアドレス可能なレジスタの数は増えるが、命
令形式が変わるので、既存のプログラムの変更が必要と
なり、非現実的である。

【００３０】そこで、デ−タ処理装置のア−キテクチャ
を変えずに、命令によってアドレス可能なレジスタの数
より多いレジスタをデ−タ処理装置がアクセス可能とす
る方式が必要となるが、従来技術１では、過去にロ−ド
命令が実行された主記憶アドレスに対し、新たにロ−ド
命令が実行された場合は高速化される。しかし、式
（１）のようなベクトル計算は多くの場合、図６のプロ
グラムのように主記憶上のデ−タに対するロ−ド要求は
１度しか出ないので、従来技術では高速化されないとい
う問題がある。

【００３１】また、従来技術２では、１つのプログラム
で使えるのはある１つのウインドウに属する物理レジス
タのみであり、その数はプログラムでアドレス可能なレ
ジスタの数に等しく、１つのプログラムで行なわれる演
算を高速化できない。すなわち、前記のウインドウの機
能は、プログラムの呼びと戻りが発生する場合のみ処理
の高速化がなされ、式（１）のベクトル計算のように１
つのプログラムで処理が完結しているような場合は高速
化されないという問題がある。また、前記のウインドウ
オ−バフロ−、ウインドウアンダフロ−の割込みは式
（１）のベクトル計算のように１つのプログラムで処理
が完結していて、プログラムの呼びと戻りが発生しない
場合は不要であるという問題がある。

【００３２】本発明の目的は、デ−タ処理装置のア−キ
テクチャを変えずに、命令によってアドレス可能なレジ
スタの数より多いレジスタをデ−タ処理装置がアクセス
可能とし、科学技術計算におけるベクトル計算を高速に
実行する方式を提供することにある。

【００３３】

【課題を解決するための手段】上記目的を達成するため
に、命令の浮動小数点レジスタフィ−ルドによってアド
レス可能な浮動小数点レジスタの数より多い、物理浮動
小数点レジスタ番号で参照される物理浮動小数点レジス
タと呼ばれる浮動小数点レジスタ、ウインドウスタ−ト
ポインタと呼ばれる数を格納するウインドウスタ−トポ
インタレジスタ、ウインドウスタ−トポインタが有効で
あることを示すウインドウスタ−トポインタ有効レジス
タと呼ばれるレジスタ、該ウインドウスタ−トポインタ
有効レジスタが１のときに、ウインドウスタ−トポイン
タの値、または、ウインドウスタ−トポインタと特定命
令中に示されるウインドウストライドの値によって、論
理浮動小数点レジスタ番号と呼ばれる、命令中の浮動小
数点レジスタフィ−ルドに示された値を物理浮動小数点
レジスタ番号に変換する変換回路、命令中に浮動小数点
レジスタフィ−ルドとウインドウストライドフィ−ルド
を持ち、論理浮動小数点レジスタ番号をウインドウスタ
−トポインタとウインドウストライドから得られた値に
よって変換した物理浮動小数点レジスタに主記憶デ−タ
を格納する浮動小数点レジスタプリロ−ド命令、命令中
に浮動小数点レジスタフィ−ルドとウインドウストライ
ドフィ−ルドを持ち、論理浮動小数点レジスタ番号をウ
インドウスタ−トポインタとウインドウストライドから
得られた値によって変換した物理浮動小数点レジスタか
ら主記憶にデ−タを格納する浮動小数点レジスタポスト
ストア命令、ウインドウスタ−トポインタレジスタに値
をセットするウインドウスタ−トポインタセット命令を
設ける。

【００３４】

【作用】前記浮動小数点レジスタプリロ−ド命令、前記
浮動小数点レジスタポストストア命令以外の浮動小数点
レジスタを参照する命令は全て、命令中にウインドウス
トライドフィ−ルドを持たないので、ウインドウスタ−
トポインタ有効レジスタの値が１であれば、ウインドウ
ストライドの値を０とみなして、論理浮動小数点レジス
タ番号−物理浮動小数点レジスタ番号変換が行われ、浮
動小数点レジスタの参照で物理浮動小数点レジスタ番号
が参照される。ウインドウスタ−トポインタ有効レジス
タの値が０であれば、論理浮動小数点レジスタ番号は物
理浮動小数点レジスタ番号に等しい。

【００３５】前記浮動小数点レジスタプリロ−ド命令、
前記浮動小数点レジスタポストストア命令では、ウイン
ドウスタ−トポインタ有効レジスタの値が１であれば、
前記の通り、論理浮動小数点レジスタ番号−物理浮動小
数点レジスタ番号変換が行われ、物理浮動小数点レジス
タが参照される。ウインドウスタ−トポインタ有効レジ
スタの値が０であれば、論理浮動小数点レジスタ番号は
参照される物理浮動小数点レジスタ番号に等しい。

【００３６】論理浮動小数点レジスタ番号−物理浮動小
数点レジスタ番号変換は以下のようにして行われる。
論理浮動小数点レジスタ番号が物理浮動小数点レジスタ
番号のどの範囲を指定するかを、複数通り設け、この範
囲の指定をウインドウと呼び、ウインドウ番号をｗと表
記することにする。ここで、レジスタ番号スライド量と
いう数を導入し、以後ｐという記号で表すことにする。

【００３７】ウインドウの設けかたの一例を図１、図２
に示す。本例では、論理浮動小数点レジスタは３２本
で、論理浮動小数点レジスタ番号は０から３１まで指定
可能とする。物理浮動小数点レジスタは１２８本で、物
理浮動小数点レジスタ番号は０から１２７である。以
下、物理浮動小数点レジスタの本数をｍｒ、ｍｒが２の
べき乗であるときは指数の値をｓｍという記号であらわ
す（すなわち、ｍｒ＝２＊＊ｓｍ）。ここで、”＊＊”
はべき乗を表わす。ｍｒが２のべき乗でないときは、ｌ
ｏｇ２（２を底とする対数）ｍｒより小さく，最も近
い整数をｓｍとする。

【００３８】以下、ｓｍをポインタ幅最大値と呼ぶこと
にする。

【００３９】すなわち、本実施例では、ｍｒ＝１２８，
ｓｍ＝７である。物理浮動小数点レジスタのうち、論理
浮動小数点レジスタ番号−物理浮動小数点レジスタ番号
変換において、必ず同一のレジスタ番号に変換され、全
ウインドウが共通に使うレジスタをグロ−バルレジスタ
と呼び、グロ−バルレジスタの本数をｍｇという記号で
あらわすこととする。本例ではｍｇ＝８とする。ここ
でウインドウスタ−トポインタレジスタのビット数をウ
インドウスタ−トポインタレジスタ幅と呼び、ｑ（ｑは
ｓｍ以下の正の整数値）という記号であらわす。

【００４０】ここで、ウインドウ番号ｗは、ウインドウ
スタ−トポインタの値をＦＷＳＴＰ，命令中のウインド
ウストライドの値をｗｓｔｒとすると、以下のように表
わされる。

【００４１】浮動小数点レジスタプリロ−ド命令では、ｗ＝ＦＷＳＴＰ＋ｗｓｔｒ，ｍｏｄ（ｍｒ−ｍｇ）／（２＊＊（ｓｍ−ｑ））（２）浮動小数点レジスタポストストア命令では、ｗ＝ＦＷＳＴＰ−ｗｓｔｒ，ｍｏｄ（ｍｒ−ｍｇ）／（２＊＊（ｓｍ−ｑ））（３）上記２命令以外の命令では、ｗ＝ＦＷＳＴＰ，ｍｏｄ（ｍｒ−ｍｇ）／（２＊＊（ｓｍ−ｑ））（４）ここで、式（２）−（４）でｍｒ−ｍｇは物理浮動小数
点レジスタの本数からグロ−バルレジスタの本数を減じ
た値で、ロ−カルレジスタ本数と呼び、各ウインドウを
用いるプログラムが、個々に参照する物理浮動小数点レ
ジスタの本数である。式（２）−（４）で２＊＊（ｓｍ
−ｑ）は、隣合うウインドウが、物理浮動小数点レジス
タ番号の上でいくつ離れているかを示し、ウインドウ刻
み幅と呼ぶ。式（２）−（４）で（ｍｒ−ｍｇ）／（２
＊＊（ｓｍ−ｑ））はロ−カルレジスタ本数をウインド
ウ刻み幅で除した値で、ウインドウの総数をあらわし、
ウインドウ数と呼ぶ。

【００４２】レジスタ番号スライド量ｐは、以下のよう
に表わされる。

【００４３】ｐ＝２＊＊（ｓｍ−ｑ）＊ｗ（５）すなわち、ウインドウ刻み幅にウインドウ番号を乗じた
値であり、各ウインドウのロ−カルレジスタ（＝グロ−
バルレジスタ以外のレジスタ）の先頭が、ウインドウ０
のロ−カルレジスタの先頭から、物理浮動小数点レジス
タ番号の上でいくつ離れているかを示す。

【００４４】例として、ｓｍ＝７，ｑ＝５の場合を、図
１、図２に示す。ウインドウはｗ０からｗ２９の３０通
り設けられる。すなわち、ウインドウ数は３０である。

【００４５】ここで、ｗの算出はウインドウ数を法とし
て行なわれるので、たとえば、ｗ＝２９では、ｗ＋１の
値は０になる。

【００４６】ここで、論理浮動小数点レジスタ番号をｒ
と表記し、物理浮動小数点レジスタ番号はｗとｒから決
まるので、＜ｗ，ｒ＞と表記することにする。

【００４７】図１、図２の例では、以下のように論理浮
動小数点レジスタ番号−物理浮動小数点レジスタ番号変
換が行われる。

【００４８】１．０≦ｒ≦７の時：ｗに関係なく（すなわち、ｐにも関係なく）＜ｗ，ｒ＞＝ｒ（６）２．８≦ｒ≦３１の時：＜ｗ，ｒ＞＝ｐ＋ｒ，（７）上記の式（２）−（７）で表わされる変換法で以下の３
つが特長的である。

【００４９】１．０番から７番の理浮動小数点レジス
タは、各ウインドウ共通に使う。これらのレジスタは、
グロ−バルレジスタとして、それぞれのウインドウを用
いる演算ル−プに共通のデ−タを保持する。

【００５０】２．各ウインドウの論理浮動小数点レジ
スタと、ウインドウ番号が１つ大きいウインドウの論理
浮動小数点レジスタには同一の物理浮動小数点レジスタ
を指すものがある。

【００５１】これらのレジスタは、オ−バラップレジス
タとして隣合うウインドウを用いる演算ル−プ間のデ−
タの受渡しに用いる。

【００５２】３．ポインタ幅最大値ｓｍまたはウイン
ドウスタ−トポインタレジスタ幅ｑを変えることによっ
て、ウインドウ刻み幅を変えることができる。

【００５３】ｓｍ＝７のとき、ｑ＝６では２レジスタ刻
み、ｑ＝４では８レジスタ刻みになる。

【００５４】以後の説明ではｓｍ＝７，ｑ＝５に固定し
て述べる。

【００５５】ここで、グロ−バルレジスタを設けない実
現法も考えられる。この場合は、式（２）−（４）のｍ
ｒ−ｍｇがｍｒで置き換えられ、式（６）、（７）がｒ
によらず、＜ｗ，ｒ＞＝ｐ＋ｒ（８）となる。

【００５６】前記新設命令の命令ニモニックと機能を、
一例として、以下のように定める。

【００５７】１．ウインドウスタ−トポインタセット命
令（命令ニモニック）ＦＷＳＴＰＳｕ，ｖ（機能）ｕ＝０の時、ウインドウスタ−トポインタレジ
スタにｖをセットする。ｕ＝１の時、ウインドウスタ−
トポインタレジスタの値にｖを加える。ここで、加算は
（ｍｒ−ｍｇ）／（２＊＊（ｓｍ−ｑ））を法として行
なわれる２．浮動小数点レジスタプリロ−ド命令（命令ニモニック）ＦＬＤＰＲＭａ（ＧＲｍ），ＦＲ
ｎ，ｗｓｔｒ（機能）汎用レジスタｍの値で表される主記憶アドレス
から８バイトのデ−タを読みだし、浮動小数点レジスタ
ｎに格納する。このとき、上記（２）、（５）によって
求めたｐの値で、論理浮動小数点レジスタ番号−物理浮
動小数点レジスタ番号変換が行われる。

【００５８】その後、汎用レジスタｍの値をａ加える。

【００５９】３．浮動小数点レジスタポストストア命令（命令ニモニック）ＦＳＴＰＯＭａ（ＧＲｍ），ＦＲ
ｎ，ｗｓｔｒ（機能）浮動小数点レジスタｎの値（８バイト）を汎用
レジスタｍの値で表される主記憶アドレスにストアす
る。このとき、上記（３）、（５）によって求めたｐの
値で、論理浮動小数点レジスタ番号−物理浮動小数点レ
ジスタ番号変換が行われる。

【００６０】その後、汎用レジスタｍの値をａ加える。

【００６１】また、一般の浮動小数点命令（すなわち、
浮動小数点レジスタを用いる命令で上記２，３を除く命
令）では、上記（４）、（５）によって求めたｐの値
で、論理浮動小数点レジスタ番号−物理浮動小数点レジ
スタ番号変換が行われる。

【００６２】本発明は、ｍｏｄｕｌｏｓｃｈｅｄｕｌ
ｉｎｇというコ−ディング法に特に有効である。ｍｏｄ
ｕｌｏｓｃｈｅｄｕｌｉｎｇに関しては、Ｂ．Ｒ．Ｒ
ａｕｅｔａｌ． ”ＲｅｇｉｓｔｅｒＡｌｌｏｃａ
ｔｉｏｎｆｏｒＳｏｆｔｗａｒｅＰｉｐｅｌｉｎ
ｅｄＬｏｏｐｓ”：ＡＣＭＳＩＧＰＬＡＮ，９２
ｐｐ．２８３−２９９とＰ．Ｔｉｒｕｍａｌａｉｅ
ｔａｌ． ”ＰａｒａｌｌｅｌｉｚａｔｉｏｎＯｆ
ＬｏｏｐｓＷｉｔｈＥｘｉｔｓＯｎＰｉｐｅｌ
ｉｎｅｄＡｒｃｈｉｔｅｃｔｕｒｅｓ”：Ｓｕｐｅｒ
−ｃｏｍｐｕｔｉｎｇ９０，ｐｐ．２００−２１２
に記述がある。ここで、以下、本発明で対象とする計算
機はロ−ド命令、演算命令、ストア命令を並列実行可能
なス-パ-スカラプロセッサとする。すなわち、ロ−ド命
令を実行するユニット、演算命令を実行するユニット、
ストア命令を実行するユニットが分離されており、同時
に起動できるとする。式（１）をｍｏｄｕｌｏｓｃｈ
ｅｄｕｌｉｎｇでコ−ディングしたものを図３に示す。
図３中、ＬＯＡＤＢ（ｉ）とは、Ｂ（ｉ）を主記憶か
ら浮動小数点レジスタにロ−ドする命令であり、浮動小
数点レジスタ番号は省略して記してある。ＭＵＬＴＢ
（ｉ）＊Ｓとは、ＬＯＡＤＢ（ｉ）によって主記憶か
ら浮動小数点レジスタにロ−ドされたＢ（ｉ）と別の浮
動小数点レジスタに格納されているＳを乗算して、さら
に別の浮動小数点レジスタに格納する命令であり、浮動
小数点レジスタ番号は省略して記してある。ＳＴＯＲＥ
Ａ（ｉ）とは、ＭＵＬＴＢ（ｉ）＊Ｓによって浮動
小数点レジスタに格納された演算結果を主記憶のＡ
（ｉ）の位置にストアする命令であり、浮動小数点レジ
スタ番号は省略して記してある。図３中、「サイクル」
とはマシンサイクル単位の時刻を表し、同一サイクルの
ところに書かれている命令が同時実行開始される。すな
わち、サイクル１では、ＬＯＡＤＢ（１）のみが実行
開始され、サイクル５では、ＬＯＡＤＢ（５）、ＭＵ
ＬＴＢ（１）＊Ｓが同時実行開始され、サイクル９で
は、ＬＯＡＤＢ（９）、ＭＵＬＴＢ（５）＊Ｓ、Ｓ
ＴＯＲＥＡ（１）が同時実行開始される。ここで、実
際のプログラムの命令列は、同時実行開始される複数命
令は逐次的に書かれている。たとえば、サイクル５で同
時実行されるＬＯＡＤＢ（５）、ＭＵＬＴＢ（１）
＊Ｓは、実際のプログラム上は、この順に書かれてい
る。ハ−ドウエアが、この連続する２命令ＬＯＡＤＢ
（５）、ＭＵＬＴＢ（１）＊Ｓが同時実行開始できる
ことを判定し、それぞれの実行ユニットに起動をかけ
る。以下、図３の意味について説明する。

【００６３】式（１）を実行するには、各要素の処理を
１つのｉｔｅｒａｔｉｏｎによって行い、１つのｉｔｅ
ｒａｔｉｏｎはステ−ジ１：Ｂのロ−ド、ステ−ジ２：
乗算、ステ−ジ３：Ａへのストアの３ステ−ジとする。
ここで、各ステ−ジは４サイクルを要すると仮定する。
すなわち、メモリの読みだし、乗算、メモリへの書き込
みにそれぞれ４サイクルかかるとする。すると、第ｉ要
素に関するステ−ジ１の開始から、ステ−ジ２の開始ま
で４サイクル、ステ−ジ２の開始からステ−ジ３の開始
まで４サイクルかかることになる。そこで、第ｉ要素に
関するロ−ドの４サイクル後に乗算を開始し、その４サ
イクル後にストアを開始することにする。また、第ｉ要
素に関するロ−ドの１サイクル後に、第ｉ＋１要素に関
するロ−ドを開始し、第ｉ要素に関する乗算の１サイク
ル後に、第ｉ＋１要素に関する乗算を開始し、第ｉ要素
に関するストアの１サイクル後に、第ｉ＋１要素に関す
るストアを開始することにする。このように命令をスケ
ジュ−リングすると、図３のように、第ｉ＋８要素に関
するステ−ジ１と、第ｉ＋４要素に関するステ−ジ２
と、第ｉ要素に関するステ−ジ３が同時実行できる部分
ができる、この部分をカ−ネルと呼ぶ。ここで、”同時
実行”といったのは、第ｉ＋８要素に関するステ−ジ１
と、第ｉ＋４要素に関するステ−ジ２と、第ｉ要素に関
するステ−ジ３の各サイクルが同一時刻に同時進行して
いることを意味する。これは、本発明で対象とする計算
機はロ−ド命令、演算命令、ストア命令を並列実行可能
なス-パ-スカラプロセッサであるからである。すなわ
ち、カ−ネル部分は、３ステ−ジが同時に動いているの
で、高速である。ここで、図３のようなプログラムで、
カ−ネルの前の部分をプロロ−グ、カ−ネルの後の部分
をエピロ−グと呼ぶ。ここで、前述のように、実際のプ
ログラムの命令列は、同時実行開始される複数命令は逐
次的に書かれている式（１）を、上記新設機能を用い
て、図３のｍｏｄｕｌｏｓｃｈｅｄｕｌ−ｉｎｇを用
いると、図８、図９のようなプログラムになる。

【００６４】ここで、図８、図９のプログラムを実行す
る計算機は、前記の通り、ロ−ド命令、演算命令、スト
ア命令を並列実行可能なス-パ-スカラプロセッサとす
る。

【００６５】ここで、図８、図９のプログラムの実行に
先だって、ベクトルＢは、主記憶アドレスａｄ１から始
まる連続領域に格納されているものとする。すなわち、
Ｂ（１）の主記憶アドレスがａｄ１、Ｂ（２）の主記憶
アドレスがａｄ１＋８というように格納されている。同
様にベクトルＡは、主記憶アドレスａｄ３から始まる連
続領域に格納するものとする。汎用レジスタ１にはａｄ
１が、汎用レジスタ３にはａｄ３が、汎用レジスタ４に
はＮ−８、ウインドウスタ−トポインタ有効レジスタに
は１が、物理浮動小数点レジスタ７にはＳが格納されて
いるものとする。

【００６６】以下、図８、図９について説明する。Ｎ
ｏ．１のＦＷＳＴＰＳ命令では、ウインドウスタ−トポ
インタに０をセットする。Ｎｏ．２のＦＬＤＰＲＭ命令
では、ｗ＝ＦＷＳＴＰ＋ｗｓｔｒ＝０＋０＝０なので、
Ｂ（１）が物理浮動小数点レジスタ＜０、８＞に格納さ
れる。Ｎｏ．３のＦＬＤＰＲＭ命令では、ｗ＝ＦＷＳＴ
Ｐ＋ｗｓｔｒ＝０＋１＝１なので、Ｂ（２）が物理浮動
小数点レジスタ＜１、８＞に格納される。Ｎｏ．４のＦ
ＬＤＰＲＭ命令では、ｗ＝ＦＷＳＴＰ＋ｗｓｔｒ＝０＋
２＝２なので、Ｂ（３）が物理浮動小数点レジスタ＜
２、８＞に格納される。Ｎｏ．５のＦＬＤＰＲＭ命令で
は、ｗ＝ＦＷＳＴＰ＋ｗｓｔｒ＝０＋３＝３なので、Ｂ
（４）が物理浮動小数点レジスタ＜３、８＞に格納され
る。Ｎｏ．６のＦＬＤＰＲＭ命令では、ｗ＝ＦＷＳＴＰ
＋ｗｓｔｒ＝０＋４＝４なので、Ｂ（５）が物理浮動小
数点レジスタ＜４、８＞に格納される。Ｎｏ．７のＦＭ
ＬＴ命令では、論理浮動小数点レジスタ７が指定されて
おり、該レジスタは、式（６）より物理浮動小数点レジ
スタ７である（すなわち、グロ−バルレジスタ）ので、
物理浮動小数点レジスタ７の値（＝Ｓ）を読みだし、ｗ
＝ＦＷＳＴＰ＝０なので物理浮動小数点レジスタ＜０、
８＞（＝Ｂ（１））と積をとって、物理浮動小数点レジ
スタ＜０、１０＞に格納する。Ｎｏ．８のＦＷＳＴＰＳ
命令では、ウインドウスタ−トポインタに１を加える。
すなわち、ＦＷＳＴＰ＝１となる。Ｎｏ．９のＦＬＤＰ
ＲＭ命令では、ｗ＝ＦＷＳＴＰ＋ｗｓｔｒ＝１＋４＝５
なので、Ｂ（６）が物理浮動小数点レジスタ＜５、８＞
に格納される。Ｎｏ．１０のＦＭＬＴ命令では、ｗ＝Ｆ
ＷＳＴＰ＝１なので物理浮動小数点レジスタ＜１、８＞
（＝Ｂ（２））とＳと積をとって、物理浮動小数点レジ
スタ＜１、１０＞に格納する。Ｎｏ．１１のＦＷＳＴＰ
Ｓ命令では、ウインドウスタ−トポインタに１を加え
る。すなわち、ＦＷＳＴＰ＝２となる。Ｎｏ．１２のＦ
ＬＤＰＲＭ命令では、ｗ＝ＦＷＳＴＰ＋ｗｓｔｒ＝２＋
４＝６なので、Ｂ（７）が物理浮動小数点レジスタ＜
６、８＞に格納される。Ｎｏ．１３のＦＭＬＴ命令で
は、ｗ＝ＦＷＳＴＰ＝２なので物理浮動小数点レジスタ
＜２、８＞（＝Ｂ（３））とＳと積をとって、物理浮動
小数点レジスタ＜２、１０＞に格納する。Ｎｏ．１４の
ＦＷＳＴＰＳ命令では、ウインドウスタ−トポインタに
１を加える。すなわち、ＦＷＳＴＰ＝３となる。Ｎｏ．
１５のＦＬＤＰＲＭ命令では、ｗ＝ＦＷＳＴＰ＋ｗｓｔ
ｒ＝３＋４＝７なので、Ｂ（８）が物理浮動小数点レジ
スタ＜７、８＞に格納される。Ｎｏ．１６のＦＭＬＴ命
令では、ｗ＝ＦＷＳＴＰ＝３なので物理浮動小数点レジ
スタ＜３、８＞（＝Ｂ（４））とＳと積をとって、物理
浮動小数点レジスタ＜３、１０＞に格納する。Ｎｏ．１
７のＦＷＳＴＰＳ命令では、ウインドウスタ−トポイン
タに１を加える。すなわち、ＦＷＳＴＰ＝４となる。以
上、Ｎｏ．１からＮｏ．１７までの命令列が図３のプロ
ロ−グを形成している。

【００６７】Ｎｏ．１８のＦＬＤＰＲＭ命令からＮｏ．
２２のＢＣＮＴ命令までが、ル−プを構成し、Ｎ−８回
くりかえし実行される。以下、第ｉ回目に実行されるル
−プについて見る（ｉは１から始まる）。ＦＷＳＴＰは
ｉ＋３を指している。Ｎｏ．１８のＦＬＤＰＲＭ命令
で、Ｂ（ｉ＋８）が、ｗ＝ＦＷＳＴＰ＋ｗｓｔｒ＝（ｉ
＋３）＋４＝ｉ＋７なので、物理浮動小数点レジスタ＜
ｉ＋７（ｍｏｄ３０），８＞にロ−ドされる。Ｎｏ．
１９のＦＭＬＴ命令では、ｗ＝ＦＷＳＴＰ＝ｉ＋３なの
で物理浮動小数点レジスタ＜ｉ＋３（ｍｏｄ３０）、
８＞（＝Ｂ（ｉ＋４））とＳと積をとって、物理浮動小
数点レジスタ＜ｉ＋３（ｍｏｄ３０）、１０＞に格納
する。Ｎｏ．２０のＦＳＴＰＯＭ命令で，ｗ＝ＦＷＳＴ
Ｐ−ｗｓｔｒ＝（ｉ＋３）−４＝ｉ−１なので、物理浮
動小数点レジスタ＜ｉ−１（ｍｏｄ３０），１０＞の値
がＡ（ｉ）の主記憶位置に格納される。Ｎｏ．１７のＦ
ＷＳＴＰＳ命令では、ウインドウスタ−トポインタに１
を加える。すなわち、ＦＷＳＴＰ＝ｉ＋４となる。Ｎ
ｏ．２２のＢＣＮＴ命令でル−プの先頭に戻る。すな
わち、第ｉル−プの中では、、４つ後のル−プで乗算さ
れるデ−タＢ（ｉ＋８）を物理浮動小数点レジスタ＜ｉ
＋７（ｍｏｄ３０），８＞に格納し、４つ前のル−プ
で物理浮動小数点レジスタ＜ｉ＋３（ｍｏｄ３０），
８＞に格納されたＢ（ｉ＋４）を用いて乗算を行い、そ
の結果を物理浮動小数点レジスタ＜ｉ＋３（ｍｏｄ３
０），１０＞に格納し、４つ前のル−プで得られた乗算
結果であり、物理浮動小数点レジスタ＜ｉ−１（ｍｏｄ
３０），１０＞に格納されているＢ（ｉ）＊Ｓを、Ａ
（ｉ）の主記憶位置に格納する。

【００６８】以上、Ｎｏ．１８のＦＬＤＰＲＭ命令から
Ｎｏ．２２のＢＣＮＴ命令までが、図３のカ−ネルを形
成している。

【００６９】ル−プを抜けた後のＮｏ．２３からＮｏ．
４１の命令は、未処理の要素の処理である。Ｎｏ．２３
のＦＭＬＴ命令では、ｗ＝ＦＷＳＴＰ＝Ｎ−４なので物
理浮動小数点レジスタ＜Ｎ−４（ｍｏｄ３０）、８＞
（＝Ｂ（Ｎ−３））とＳと積をとって、物理浮動小数点
レジスタ＜Ｎ−４（ｍｏｄ３０）、１０＞に格納す
る。Ｎｏ．２４のＦＳＴＰＯＭ命令で，ｗ＝ＦＷＳＴＰ
−ｗｓｔｒ＝（Ｎ−４）−４＝Ｎ−８なので、物理浮動
小数点レジスタ＜Ｎ−８（ｍｏｄ３０），１０＞の値
がＡ（Ｎ−７）の主記憶位置に格納される。Ｎｏ．２５
のＦＷＳＴＰＳ命令では、ウインドウスタ−トポインタ
に１を加える。すなわち、ＦＷＳＴＰ＝Ｎ−３となる。
Ｎｏ．２６のＦＭＬＴ命令では、ｗ＝ＦＷＳＴＰ＝Ｎ−
３なので物理浮動小数点レジスタ＜Ｎ−３（ｍｏｄ３
０）、８＞（＝Ｂ（Ｎ−２））とＳと積をとって、物理
浮動小数点レジスタ＜Ｎ−３（ｍｏｄ３０）、１０＞
に格納する。Ｎｏ．２７のＦＳＴＰＯＭ命令で，ｗ＝Ｆ
ＷＳＴＰ−ｗｓｔｒ＝（Ｎ−３）−４＝Ｎ−７なので、
物理浮動小数点レジスタ＜Ｎ−７（ｍｏｄ３０），１
０＞の値がＡ（Ｎ−６）の主記憶位置に格納される。Ｎ
ｏ．２８のＦＷＳＴＰＳ命令では、ウインドウスタ−ト
ポインタに１を加える。すなわち、ＦＷＳＴＰ＝Ｎ−２
となる。Ｎｏ．２９のＦＭＬＴ命令では、ｗ＝ＦＷＳＴ
Ｐ＝Ｎ−２なので物理浮動小数点レジスタ＜Ｎ−２（ｍ
ｏｄ３０）、８＞（＝Ｂ（Ｎ−１））とＳと積をとっ
て、物理浮動小数点レジスタ＜Ｎ−２（ｍｏｄ３
０）、１０＞に格納する。Ｎｏ．３０のＦＳＴＰＯＭ命
令で，ｗ＝ＦＷＳＴＰ−ｗｓｔｒ＝（Ｎ−２）−４＝Ｎ
−６なので、物理浮動小数点レジスタ＜Ｎ−６（ｍｏｄ
３０），１０＞の値がＡ（Ｎ−５）の主記憶位置に格
納される。Ｎｏ．３１のＦＷＳＴＰＳ命令では、ウイン
ドウスタ−トポインタに１を加える。すなわち、ＦＷＳ
ＴＰ＝Ｎ−１となる。Ｎｏ．３２のＦＭＬＴ命令では、
ｗ＝ＦＷＳＴＰ＝Ｎ−１なので物理浮動小数点レジスタ
＜Ｎ−１（ｍｏｄ３０）、８＞（＝Ｂ（Ｎ））とＳと
積をとって、物理浮動小数点レジスタ＜Ｎ−１（ｍｏｄ
３０）、１０＞に格納する。Ｎｏ．３３のＦＳＴＰＯ
Ｍ命令で，ｗ＝ＦＷＳＴＰ−ｗｓｔｒ＝（Ｎ−１）−４
＝Ｎ−５なので、物理浮動小数点レジスタ＜Ｎ−５（ｍ
ｏｄ３０），１０＞の値がＡ（Ｎ−４）の主記憶位置
に格納される。Ｎｏ．３４のＦＷＳＴＰＳ命令では、ウ
インドウスタ−トポインタに１を加える。すなわち、Ｆ
ＷＳＴＰ＝Ｎとなる。Ｎｏ．３５のＦＳＴＰＯＭ命令
で，ｗ＝ＦＷＳＴＰ−ｗｓｔｒ＝Ｎ−４＝Ｎ−４なの
で、物理浮動小数点レジスタ＜Ｎ−４（ｍｏｄ３
０），１０＞の値がＡ（Ｎ−３）の主記憶位置に格納さ
れる。Ｎｏ．３６のＦＷＳＴＰＳ命令では、ウインドウ
スタ−トポインタに１を加える。すなわち、ＦＷＳＴＰ
＝Ｎ＋１となる。Ｎｏ．３７のＦＳＴＰＯＭ命令で，ｗ
＝ＦＷＳＴＰ−ｗｓｔｒ＝（Ｎ＋１）−４＝Ｎ−３なの
で、物理浮動小数点レジスタ＜Ｎ−３（ｍｏｄ３０），
１０＞の値がＡ（Ｎ−２）の主記憶位置に格納される。
Ｎｏ．３８のＦＷＳＴＰＳ命令では、ウインドウスタ−
トポインタに１を加える。すなわち、ＦＷＳＴＰ＝Ｎ＋
２となる。Ｎｏ．３９のＦＳＴＰＯＭ命令で，ｗ＝ＦＷ
ＳＴＰ−ｗｓｔｒ＝（Ｎ＋２）−４＝Ｎ−２なので、物
理浮動小数点レジスタ＜Ｎ−２（ｍｏｄ３０），１０
＞の値がＡ（Ｎ−１）の主記憶位置に格納される。Ｎ
ｏ．４０のＦＷＳＴＰＳ命令では、ウインドウスタ−ト
ポインタに１を加える。すなわち、ＦＷＳＴＰ＝Ｎ＋３
となる。Ｎｏ．４１のＦＳＴＰＯＭ命令で，ｗ＝ＦＷＳ
ＴＰ−ｗｓｔｒ＝（Ｎ＋３）−４＝Ｎ−１なので、物理
浮動小数点レジスタ＜Ｎ−１（ｍｏｄ３０），１０＞
の値がＡ（Ｎ）の主記憶位置に格納される。以上、Ｎ
ｏ．２３からＮｏ．４１までの命令列が図３のエピロ−
グを形成している。第ｉル−プ内の処理からわかるよ
うに、Ｎｏ．１８のＦＬＤＰＲＭ命令で論理浮動小数点
レジスタ番号８にデ−タを書き込み、直後のＮｏ．１９
のＦＭＬＴ命令で論理浮動小数点レジスタ８を使ってい
るが、アクセスしている物理浮動小数点レジスタは＜ｉ
＋７（ｍｏｄ３０），８＞と＜ｉ＋３（ｍｏｄ３
０），８＞であり、異なる。したがって、図６のプログ
ラムで発生した、デ−タ読みだし待ちで後続命令の実行
が待たされるという現象は起こらず、言いかえれば、デ
−タ読みだしは４ル−プ後のＦＭＬＴ命令の実行までに
完了すればよいわけで、プログラムが高速に実行され
る。ここでＮｏ．１８のＦＬＤＰＲＭ命令、Ｎｏ．１９
のＦＭＬＴ命令、Ｎｏ．２０のＦＳＴＰＯＭ命令は同時
実行開始される。すなわち、該４ル−プ後のＦＭＬＴ命
令の実行は（（Ｎｏ．１８のＦＬＤＰＲＭ命令、Ｎｏ．
１９のＦＭＬＴ命令、Ｎｏ．２０のＦＳＴＰＯＭ命令）
の実行開始サイクル（＝１サイクル）＋Ｎｏ．２１のＦ
ＷＳＴＰＳの命令実行サイクル＋Ｎｏ．２２のＢＣＮＴ
命令の実行サイクル）＊４のサイクル数後であるので、
４サイクルかかるデ−タ読みだしは、４ル−プ後には完
了しており、デ−タ読みだし待ちによる性能低下はな
い。また、Ｎｏ．１９のＦＭＬＴ命令で論理浮動小数点
レジスタ番号１０にデ−タを書き込み、直後のＮｏ．２
０のＦＳＴＰＯＭ命令で論理浮動小数点レジスタ１０を
使っているが、アクセスしている物理浮動小数点レジス
タは＜ｉ＋３（ｍｏｄ３０），１０＞と＜ｉ−１（ｍ
ｏｄ３０），１０＞であり、異なる。したがって、図
６のプログラムで発生した、演算結果待ちで後続命令の
実行が待たされるという現象は起こらず、言いかえれ
ば、乗算は４ル−プ後の実行までに完了すればよいわけ
で、プログラムが高速に実行される。ここで前述のよう
に、Ｎｏ．１８のＦＬＤＰＲＭ命令、Ｎｏ．１９のＦＭ
ＬＴ命令、Ｎｏ．２０のＦＳＴＰＯＭ命令は同時実行開
始される。すなわち、該４ル−プ後のＦＳＴＰＯＭ命令
の実行は（（Ｎｏ．１８のＦＬＤＰＲＭ命令、Ｎｏ．１
９のＦＭＬＴ命令、Ｎｏ．２０のＦＳＴＰＯＭ命令）の
実行開始サイクル（＝１サイクル）＋Ｎｏ．２１のＦＷ
ＳＴＰＳの命令実行サイクル＋Ｎｏ．２２のＢＣＮＴ命
令の実行サイクル）＊４のサイクル数後であるので、４
サイクルかかる乗算は、４ル−プ後には完了しており、
演算実行待ちによる性能低下はない。

【００７０】また、プログラムで指定している論理浮動
小数点レジスタは３つだけであり、図７のプログラムの
ように浮動小数点レジスタを９つも使う必要もない。

【００７１】ここで、図８、図９のプログラムには、図
６のプログラムにはないウインドウスタ−トポインタの
更新の処理があってオ−バヘッドになっている。たとえ
ば、図６のプログラムのル−プが４命令で構成されてい
るのに対し、図８、図９のプログラムのル−プは５命令
で構成されている。しかし、図８、図９のプログラムの
ル−プの５命令中の３命令は同時実行できるうえ、図６
のプログラムにあるデ−タ読みだし待ちで後続命令の実
行が待たされるオ−バヘッドの方がはるかに大きい。ま
た、図７のプログラムのようなル−プアンロ−リングの
手法も、プログラムで指定できるレジスタを使い果たし
てしまうと実現できないので、ウインドウスタ−トポイ
ンタの更新のオ−バヘッドがあっても、本発明の方式の
ほうがすぐれていると考えられる。

【００７２】また、浮動小数点レジスタプリロ−ド命令
と浮動小数点レジスタポストストア命令で、命令中のウ
インドウストライドにより、デ−タをロ−ド／ストアす
るウインドウ番号を自由に決められるので、デ−タ読み
だし時間、演算時間の変化に対し、柔軟に対応できる。

【００７３】さらに、ウインドウポインタレジスタ幅を
変更することにより（通常、ポインタ幅最大値は固
定）、ウインドウ刻み幅、レジスタ番号スライド量を自
由に変更できることになり、柔軟なプログラミングがで
きる。

【００７４】

【実施例】以下、本発明の一実施例を図を用いて説明す
る。図４に本実施例のデ−タ処理装置を示す。デ−タ処
理装置は、命令の発行および実行を行なう命令処理ユニ
ット１０、命令処理ユニットで実行する命令やデ−タを
記憶する主記憶３０、命令処理ユニットと主記憶との間
のデ−タのやりとりを制御する記憶制御ユニット２０か
ら構成される。

【００７５】命令処理ユニット１０は、実行する命令を
保持する命令レジスタ１０１、命令レジスタ１０１の内
容を解読し、命令実行の制御を行なう命令制御部１０
２、汎用演算およびアドレス計算に必要なデ−タを保持
する汎用レジスタ群１０３、命令で指定される汎用演算
を実行する汎用演算器１０４、浮動小数点演算に必要な
デ−タを保持する物理浮動小数点レジスタ群１０５、命
令で指定される浮動小数点演算を実行する浮動小数点演
算器１０６、主記憶デ−タをアクセスするための主記憶
アドレスを計算するアドレス加算器１０７、記憶制御ユ
ニット２０から読みだされた主記憶デ−タを保持するキ
ャッシュ１０８、キャッシュ１０８の検索結果に従い記
憶制御ユニット２０から主記憶デ−タを読みだすなどの
制御を行なう主記憶アクセス制御部１０９、ウィンドウ
スタ−トポインタを格納するウィンドウスタ−トポイン
タレジスタ１１０、ウィンドウスタ−トポインタが有効
であることを示すウィンドウスタ−トポインタ有効レジ
スタ１１１、命令で指定された論理浮動小数点レジスタ
番号を示す信号１１５、命令で指定されたウインドウス
トライドの値を示す信号１１６、ウィンドウスタ−トポ
インタセット命令のｖフィ−ルドの値を示す信号１１
７、ウィンドウスタ−トポインタレジスタ１１０の値、
信号１１５、信号１１６から、式（２）−（７）にした
がって物理浮動小数点レジスタ番号に変換する変換回路
１１２から構成される。また，変換回路１１２は、ウィ
ンドウスタ−トポインタレジスタ１１０の値に信号１１
７の値を加算する機能も持つ。

【００７６】ここで、「作用」に述べた通り、命令レジ
スタ１０１には複数命令（ここでは３命令）が格納さ
れ、命令制御部１０２は同時に複数命令（ここでは３命
令）が解読実行できるとする。また、主記憶アクセス制
御部１０９はロ−ド、ストアを同時実行できるものとす
る。そのために、アドレス加算器１０７はロ−ド命令、
ストア命令のアドレス加算を同時にできるものとする。

【００７７】ここで、このデ−タ処理装置には、図５で
示すように、３つの命令が新たに追加される。それら
は、（ａ）ウィンドウスタ−トポインタセット命令、
（ｂ）浮動小数点レジスタプリロ−ド命令、（ｃ）浮動
小数点レジスタポストストア命令、である。

【００７８】図５（ａ）中、命令コ−ドは、ウィンドウ
スタ−トポインタセット命令であることを示すものであ
る。ｕは、該命令が以下の（ｉ），（ｉｉ）の動作のい
ずれを実行するかを指定する。ｖは、（ｉ）ｕ＝０の場
合：ウィンドウスタ−トポインタレジスタにセットされ
る値を指定する。（ｉｉ）ｕ＝１の場合：ウィンドウス
タ−トポインタレジスタに加算される値を指定する。こ
こで、加算は（ｍｒ−ｍｇ）／（２＊＊（ｓｍ−ｑ））
を法として行われる。すなわち、上記の例では、ｍｒ＝
１２８，ｍｇ＝８，ｓｍ＝７，ｑ＝５であるので、ウィ
ンドウスタ−トポインタＦＷＳＴＰの値が２９、ｖ＝１
であれば、加算結果は０になる。

【００７９】図５（ｂ）中、命令コ−ドは、浮動小数点
レジスタプリロ−ド命令であることを示すものである。
浮動小数点レジスタ番号は主記憶デ−タが格納される論
理浮動小数点レジスタ番号（ｒとする）であり、対応す
る物理浮動小数点レジスタ番号は、ウィンドウスタ−ト
ポインタをＦＷＳＴＰ，命令中に指定されるウインドウ
ストライドをｗｓｔｒとして，レジスタ番号スライド量
ｐを式（２），（５）で定義して、＜ｗ，ｒ＞である。
汎用レジスタの値が、デ−タを主記憶から読みだすため
の主記憶アドレスである。該読みだし実行後、汎用レジ
スタに加える値がインクリメント値である。図５
（ｃ）中、命令コ−ドは、浮動小数点レジスタポストス
トア命令であることを示すものである。浮動小数点レジ
スタ番号はデ−タが読みだされる論理浮動小数点レジス
タ番号（ｒとする）であり、対応する物理浮動小数点レ
ジスタ番号は、ウィンドウスタ−トポインタをＦＷＳＴ
Ｐ，命令中に指定されるウインドウストライドをｗｓｔ
ｒとして，レジスタ番号スライド量ｐを式（３），
（５）で定義して、＜ｗ，ｒ＞である。汎用レジスタの
値がデ−タが格納される主記憶のアドレスである。該読
みだし実行後、汎用レジスタに加える値がインクリメン
ト値である。

【００８０】これらの命令の動作を図４に従い、説明す
る。まず、ウィンドウスタ−トポインタセット命令につ
いて説明する。命令レジスタ１０１に命令が取り込まれ
ていると、命令は命令制御部１０２で解読され、ウィン
ドウスタ−トポインタ変更命令であることが識別される
と、（ｉ）ｕ＝０であると、命令中に指定されたｖがウ
ィンドウスタ−トポインタレジスタ１１０にセットさ
れ、（ｉｉ）ｕ＝１であると、命令中に指定されたｖが
変換論理１１２に信号１１７を通じて送られ、変換論理
１１２でウィンドウスタ−トポインタレジスタ１１０の
値と加算され、加算結果がウィンドウスタ−トポインタ
レジスタ１１０にセットされる。

【００８１】次に浮動小数点レジスタプリロ−ド命令に
ついて説明する。命令レジスタ１０１に命令が取り込ま
れていると、命令は命令制御部１０２で解読され、浮動
小数点レジスタプリロ−ド命令であることが識別される
と、アドレス加算器１０７は、命令に指定された汎用レ
ジスタ番号で示される汎用レジスタの内容をデ−タを主
記憶から読みだすための主記憶アドレスとする。主記憶
アクセス制御部１０９は前記主記憶アドレスをもとにキ
ャッシュ１０８を検索し、キャッシュに所望のデ−タが
あれば、キャッシュからデ−タを転送し、なければ、記
憶制御ユニット２０経由で、主記憶３０からデ−タを転
送する。該転送デ−タは、浮動小数点レジスタ１０５に
格納されるが、格納される浮動小数点レジスタの物理浮
動小数点レジスタ番号は、変換回路１１２で以下のよう
にして求められる。命令中に指定された浮動小数点レジ
スタ番号は論理浮動小数点レジスタ番号（ｒとする）で
あり、ウィンドウスタ−トポインタレジスタ１１０の値
をＦＷＳＴＰ，命令中に指定されたウインドウストライ
ドの値をｗｓｔｒとして、レジスタ番号スライド量ｐを
式（２）、（５）にもとずいて計算し、該ｐの値を使っ
て、式（６）、（７）にもとずいて＜ｗ，ｒ＞を物理浮
動小数点レジスタ番号とする。該デ−タ転送動作開始
後、汎用演算器１０４で汎用レジスタの値にインクリメ
ント値を加える。

【００８２】次に浮動小数点レジスタポストストア命令
について説明する。命令レジスタ１０１に命令が取り込
まれていると、命令は命令制御部１０２で解読され、浮
動小数点レジスタポストストア命令であることが識別さ
れると、アドレス加算器１０７は、命令に指定された汎
用レジスタ番号で示される汎用レジスタの内容をデ−タ
を主記憶に格納するための主記憶アドレスとする。浮動
小数点レジスタ１０５からデ−タが読みだされるが、読
みだされるレジスタの物理浮動小数点レジスタ番号は、
変換回路１１２で以下のようにして求められる。命令中
に指定された浮動小数点レジスタ番号は論理浮動小数点
レジスタ番号（ｒとする）であり、ウィンドウスタ−ト
ポインタレジスタ１１０の値をＦＷＳＴＰ，命令中に指
定されたウインドウストライドの値をｗｓｔｒとして、
レジスタ番号スライド量ｐを式（３）、（５）にもとず
いて計算し、該ｐの値を使って、式（６）、（７）にも
とずいて＜ｗ，ｒ＞を物理浮動小数点レジスタ番号とす
る。主記憶アクセス制御部１０９は前記主記憶アドレス
をもとにキャッシュ１０８を検索し、キャッシュ中に、
主記憶３０の該主記憶アドレスに格納されているデ−タ
の写しがあれば、該デ−タを前記読みだしデ−タに置き
換え、なければ、キャッシュは操作しない。さらに、主
記憶アクセス制御部１０９は記憶制御ユニット２０経由
で、主記憶３０の前記主記憶アドレスに前記読みだしデ
−タを格納する。該デ−タ転送動作開始後、汎用演算器
１０４で汎用レジスタの値にインクリメント値を加え
る。

【００８３】また、一般の浮動小数点命令（すなわち、
浮動小数点レジスタを用いる命令で、前記の浮動小数点
レジスタプリロ−ド命令、浮動小数点レジスタポストス
トア命令を除く命令）では、ウインドウスタ−トポイン
タ有効レジスタ１１１が「１」であると、命令中に示さ
れた論理浮動小数点レジスタ番号ｒは、変換論理１１２
で、ウィンドウスタ−トポインタレジスタ１１０の値を
ＦＷＳＴＰとして、レジスタ番号スライド量ｐを式
（４）、（５）にもとずいて計算し、該ｐの値を使っ
て、式（６）、（７）にもとずいて＜ｗ，ｒ＞で表わさ
れる物理浮動小数点レジスタ番号に変換され、該物理浮
動小数点レジスタ番号の示す物理浮動小数点レジスタが
参照される。

【００８４】浮動小数点レジスタを参照する命令では全
て、ウインドウスタ−トポインタ有効レジスタ１１１が
「１」であると、変換回路１１２における論理浮動小数
点レジスタ番号−物理浮動小数点レジスタ番号変換が行
なわれ、「０」であると、論理浮動小数点レジスタ番号
−物理浮動小数点レジスタ番号変換は行なわれず、命令
で指定された論理浮動小数点レジスタ番号がそのまま物
理浮動小数点レジスタ番号になり、該物理浮動小数点レ
ジスタ番号の示す物理浮動小数点レジスタが参照され
る。

【００８５】ここで、ウィンドウスタ−トポインタ有効
レジスタ１１１には、デ−タ処理システムの制御情報を
格納する既存のレジスタの空きビットを割当てれば良
く、該レジスタに値を格納する既存の命令を用いて値を
セットするものとする。

【００８６】以上のようにウィンドウスタ−トポインタ
セット命令、浮動小数点レジスタプリロ−ド命令、浮動
小数点レジスタポストストア命令とウィンドウスタ−ト
ポインタの制御下での一般の浮動小数点命令は動作す
る。

【００８７】上記の実施例により、図８、図９のような
プログラムが実現でき、ベクトル計算が高速化されるこ
とは、「作用」の欄に述べた。

【００８８】したがって、本発明の方式によると、ウィ
ンドウスタ−トポインタと命令中のウインドウストライ
ドを変えることにより、命令中のある浮動小数点レジス
タ番号は異なる物理浮動小数点レジスタ番号に変換され
るので、命令によってアドレス可能なレジスタの数より
も多い物理レジスタをデ−タ処理装置のア−キテクチャ
を変えることなくアクセス可能にでき、図８、図９に示
すようなプログラムが実現でき、デ−タ読みだし、レジ
スタのぶつかりによって命令実行が待たされることによ
る性能低下を防ぐことができ、プログラムの高速な実行
が可能である。

【００８９】特に、図８、図９のプログラムからもわか
る通り、命令列のル−プのくりかえしが主となる科学技
術計算のベクトル計算では、命令ごとに使うウインドウ
を変え、ｉ番目の要素の処理を、第ｉ−ｎｋル−プにお
ける浮動小数点プリロ−ド命令によるオペランドベクト
ルの第ｉ要素のロ−ド、第ｉル−プにおける演算、第ｉ
＋ｎｍル−プにおける浮動小数点ポストストア命令によ
る結果格納用ベクトルの第ｉ要素への演算結果のストア
を行うことによって（ｎｋ，ｎｍはプログラムで指定で
きる整数）、１つのデ−タに対するロ−ド、演算、スト
アの処理の命令列上での距離が大きくなり、デ−タの読
みだし時間、演算実行時間の影響による性能低下を防ぐ
ことができる。

【００９０】さらに、本発明の利点の一つは、浮動小数
点レジスタプリロ−ド命令と浮動小数点レジスタポスト
ストア命令で、命令中のウインドウストライドにより、
デ−タをロ−ド／ストアするウインドウ番号を自由に決
められることであり、デ−タ読みだし時間、演算時間の
変化に対し、柔軟に対応できる。

【００９１】さらに、本発明の利点の一つは、ウインド
ウポインタレジスタ幅を変更することにより、ウインド
ウ刻み幅、レジスタ番号スライド量を自由に変更できる
ことであり、柔軟なプログラミングができる。

【００９２】

【発明の効果】本発明によれば、ウィンドウスタ−トポ
インタまたは命令中のウインドウストライドを変えるこ
とにより、命令中のある浮動小数点レジスタ番号は異な
る物理浮動小数点レジスタ番号に変換されるので、命令
によってアドレス可能な浮動小数点レジスタの数よりも
多い物理浮動小数点レジスタをデ−タ処理装置のア−キ
テクチャを変えることなくアクセス可能にできるので、
デ−タ読みだし、レジスタのぶつかりによって命令実行
が待たされることによる性能低下を防ぐことができ、プ
ログラムの高速な実行が可能であるという効果がある。

【００９３】特に、命令列のル−プのくりかえしが主と
なる科学技術計算のベクトル計算では、命令ごとに使う
ウインドウを変え、ｉ番目の要素の処理を、第ｉ−ｎｋ
ル−プにおける浮動小数点レジスタプリロ−ド命令によ
るオペランドベクトルの第ｉ要素のロ−ド、第ｉル−プ
における演算、第ｉ＋ｎｍル−プにおける浮動小数点ポ
ストストア命令による結果格納用ベクトルの第ｉ要素へ
のストアによって行うことによって（ｎｋ，ｎｍはプロ
グラムで指定できる整数）、１つのデ−タに対するロ−
ド、演算、ストアの処理の命令列上での距離が大きくな
り、デ−タの読みだし時間、演算実行時間の影響による
性能低下を防ぐことができ、高速化ができる。

【００９４】また、浮動小数点レジスタプリロ−ド命令
と浮動小数点レジスタポストストア命令で、命令中のウ
インドウストライドにより、デ−タをロ−ド／ストアす
るウインドウ番号を自由に決められることであり、デ−
タ読みだし時間、演算時間の変化に対し、柔軟に対応で
きる。

【００９５】さらに、ウインドウポインタレジスタ幅を
変更することにより、ウインドウ刻み幅、レジスタ番号
スライド量を自由に変更できることになり、柔軟なプロ
グラミングができる。

【図面の簡単な説明】

【図１】本発明による論理浮動小数点レジスタ番号−
物理浮動小数点レジスタ番号変換の一実施例。

【図２】本発明による論理浮動小数点レジスタ番号−
物理浮動小数点レジスタ番号変換の一実施例。

【図３】本発明で特に有効となるｍｏｄｕｌｏｓｃ
ｈｅｄｕｌｉｎｇの原理を示す図。

【図４】本発明による図５で示す命令を実行するデ−
タ処理装置の一実施例を示す構成図。

【図５】本発明によるウィンドウスタ−トポインタセ
ット命令、浮動小数点レジスタプリロ−ド命令、浮動小
数点レジスタポストストア命令の一実施例を示す図。

【図６】本発明で対象とする科学技術計算のベクトル
計算の一例であるベクトルとスカラの乗算の汎用計算機
用プログラム例。

【図７】本発明で対象とする科学技術計算のベクトル
計算の一例であるベクトルとスカラの乗算の汎用計算機
用プログラム例である図６のプログラムをル−プアンロ
−リング手法を用いて書き直した例。

【図８】本発明で対象とする科学技術計算のベクトル
計算の一例であるベクトルとスカラの乗算の汎用計算機
用プログラム例である図６のプログラムを本発明による
命令を用いて書き直した例。

【図９】本発明で対象とする科学技術計算のベクトル
計算の一例であるベクトルとスカラの乗算の汎用計算機
用プログラム例である図６のプログラムを本発明による
命令を用いて書き直した例。

【符号の説明】

１０…は命令処理ユニット、２０…は記憶制御ユニット、３０…は主記憶、１０１…命令レジスタ１０２…命令制御部１０３…汎用レジスタ１０４…汎用演算器１０５…物理浮動小数点レジスタ１０６…浮動小数点演算器１０７…アドレス加算器１０８…キャッシュ１０９…主記憶アクセス制御部１１０…ウィンドウスタ−トポインタレジスタ１１１…ウィンドウスタ−トポインタ有効レジスタ１１２…変換論理

───────────────────────────────────────────────────── フロントページの続き (72)発明者藤井啓明東京都国分寺東恋ケ窪１丁目280番地株式会社日立製作所中央研究所内 (56)参考文献特開昭61−241870（ＪＰ，Ａ) 特開昭61−267134（ＪＰ，Ａ) 特開昭61−136131（ＪＰ，Ａ) 特開昭60−129838（ＪＰ，Ａ) ＰＲＯＣ．ＳＵＰＥＲＣＯＭＰＵＴＩＮＧ’92 Ｐ．642−651

Claims

(57)【特許請求の範囲】

【請求項１】命令やデ−タを保持する主記憶と、該主記
憶内に保持された主記憶デ−タを用いて命令を実行し、
その命令には、該主記憶から主記憶デ−タを読みだし、
命令中で番号づけされたレジスタに格納するロ−ド命
令、命令中で番号づけされたレジスタから該主記憶にデ
−タを格納するストア命令、演算を行い、演算結果を命
令中で番号づけされたレジスタに格納する演算命令を含
む命令処理ユニットから成るデ−タ処理装置において、
命令によってアドレス可能なレジスタの数より多い物理
レジスタと呼ばれるレジスタと、複数のビットから成る
ウインドウスタ−トポインタレジスタと呼ばれるレジス
タと、１ビットのウインドウスタ−トポインタ有効レジ
スタと呼ばれるレジスタと、該ウインドウスタ−トポイ
ンタ有効レジスタの値が１のときに、命令中のレジスタ
番号を物理レジスタ番号へ変換し、かつ前記ウインドウ
スタ−トポインタレジスタの値、または特定命令中に指
定される１または複数ビットのウインドウストライドと
呼ばれる値と前記ウインドウスタ−トポインタレジスタ
の値から得られた値によって該変換のパタ−ンを変える
変換回路とを有し、前記命令処理ユニットは、前記ウイ
ンドウスタ−トポインタレジスタの値をセットするため
のウインドウポインタセット命令、命令中にレジスタ番
号と前記ウインドウストライドを持ち、命令中のレジス
タ番号を、前記ウインドウスタ−トポインタレジスタの
値と前記ウインドウストライドの値から得られた値によ
って前記変換回路で物理レジスタ番号へ変換し、該物理
レジスタ番号の示す物理レジスタに主記憶デ−タを格納
するレジスタプリロ−ド命令、命令中にレジスタ番号と
前記ウインドウストライドを持ち、命令中のレジスタ番
号を、前記ウインドウスタ−トポインタレジスタの値と
前記ウインドウストライドの値から得られた値によって
前記変換回路で物理レジスタ番号へ変換し、該物理レジ
スタ番号の示す物理レジスタからデ−タを主記憶に格納
するレジスタポストストア命令を実行する手段を有し、
前記レジスタプリロ−ド命令、前記レジスタポストスト
ア命令を除く、前記ロ−ド命令、前記ストア命令、前記
演算命令では命令中のレジスタ番号を前記ウインドウス
タ−トポインタレジスタの値によって前記変換回路で物
理レジスタ番号へ変換し、該物理レジスタ番号の示す物
理レジスタを参照するように制御することを特徴とする
デ−タ処理装置。
【請求項２】前記命令中で番号づけされたレジスタと前
記物理レジスタが浮動小数点レジスタと呼ばれる、浮動
小数点数を格納する専用のレジスタであることを特徴と
する請求項１記載のデ−タ処理装置。
【請求項３】命令中のレジスタ番号から前記物理レジス
タ番号の変換において、命令中のレジスタ番号のうち、
１つまたは複数個は、前記ウインドウスタ−トポインタ
レジスタの値および命令中の前記ウインドウストライド
によらずグロ−バルレジスタ番号と呼ばれる同一の前記
物理レジスタ番号に変換されることを特徴とする請求項
１記載のデ−タ処理装置。
【請求項４】命令中のレジスタ番号から前記物理レジス
タ番号への変換において、前記物理レジスタの本数から
前記グロ−バルレジスタの本数を減じた値をロ−カルレ
ジスタ本数、前記ウインドウスタ−トポインタレジスタ
のビット数をウインドウスタ−トポインタレジスタ幅、
前記ウインドウスタ−トポインタレジスタ幅以上のある
整数値をポインタ幅最大値、前記ポインタ幅最大値から
前記ウインドウスタ−トポインタレジスタ幅を減じた値
を指数とする２のべき乗をウインドウ刻み幅、前記ロ−
カルレジスタ本数を前記ウインドウ刻み幅で除した値を
ウインドウ数と定義したとき、前記レジスタプリロ−ド
命令、前記レジスタポストストア命令、該２命令を除く
前記ロ−ド命令、前記ストア命令、前記演算命令で、命
令中のグロ−バルレジスタを示すレジスタ番号は同一番
号の物理レジスタ番号に変換され、命令中のグロ−バル
レジスタ以外を示すレジスタ番号は、前記レジスタプリ
ロ−ド命令では、前記ウインドウスタ−トポインタレジ
スタの値と命令中の前記ウインドウストライドの値を、
前記ウインドウ数を法として加えたウインドウ番号と呼
ばれる値に、前記ウインドウ刻み幅を乗じた、レジスタ
番号スライド量と呼ばれる値に、命令中のレジスタ番号
を加えた値であらわされる物理レジスタ番号に変換さ
れ、前記レジスタポストストア命令では、前記ウインド
ウスタ−トポインタレジスタの値から命令中の前記ウイ
ンドウストライドの値を、前記ウインドウ数を法として
減じたウインドウ番号と呼ばれる値に、前記ウインドウ
刻み幅を乗じた、レジスタ番号スライド量と呼ばれる値
に、命令中のレジスタ番号を加えた値であらわされる物
理レジスタ番号に変換され、前記レジスタプリロ−ド命
令、前記レジスタポストストア命令を除く、前記ロ−ド
命令、前記ストア命令、前記演算命令では、前記ウイン
ドウスタ−トポインタレジスタの値を、前記ウインドウ
数を法として、変換したウインドウ番号と呼ばれる値
に、前記ウインドウ刻み幅を乗じた、レジスタ番号スラ
イド量と呼ばれる値に、命令中のレジスタ番号を加えた
値であらわされる物理レジスタ番号に変換されることを
特徴とする請求項３記載のデ−タ処理装置。
【請求項５】命令中のレジスタ番号から前記物理レジス
タ番号への変換において、前記物理レジスタの本数を物
理レジスタ本数、前記ウインドウスタ−トポインタレジ
スタのビット数をウインドウスタ−トポインタレジスタ
幅、前記ウインドウスタ−トポインタレジスタ幅以上の
ある整数値をポインタ幅最大値、前記ポインタ幅最大値
から前記ウインドウスタ−トポインタレジスタ幅を減じ
た値を指数とする２のべき乗をウインドウ刻み幅、前記
物理レジスタ本数を前記ウインドウ刻み幅で除した値を
ウインドウ数と定義したとき、命令中のレジスタ番号
は、前記レジスタプリロ−ド命令では、前記ウインドウ
スタ−トポインタレジスタの値と命令中の前記ウインド
ウストライドの値を、前記ウインドウ数を法として加え
たウインドウ番号と呼ばれる値に、前記ウインドウ刻み
幅を乗じた、レジスタ番号スライド量と呼ばれる値に、
命令中のレジスタ番号を加えた値であらわされる物理レ
ジスタ番号に変換され、前記レジスタポストストア命令
では、前記ウインドウスタ−トポインタレジスタの値か
ら命令中の前記ウインドウストライドの値を、前記ウイ
ンドウ数を法として減じたウインドウ番号と呼ばれる値
に、前記ウインドウ刻み幅を乗じた、レジスタ番号スラ
イド量と呼ばれる値に、命令中のレジスタ番号を加えた
値であらわされる物理レジスタ番号に変換され、前記レ
ジスタプリロ−ド命令、前記レジスタポストストア命令
を除く、前記ロ−ド命令、前記ストア命令、前記演算命
令では、前記ウインドウスタ−トポインタレジスタの値
を、前記ウインドウ数を法として、変換したウインドウ
番号と呼ばれる値に、前記ウインドウ刻み幅を乗じた、
レジスタ番号スライド量と呼ばれる値に、命令中のレジ
スタ番号を加えた値であらわされる物理レジスタ番号に
変換されることを特徴とする請求項１記載のデ−タ処理
装置。
【請求項６】前記物理レジスタの本数がポインタ幅最大
値という値を指数とする２のべき乗であり、前記ウイン
ドウスタ−トポインタレジスタのビット数はポインタ幅
最大値以下であり、命令中のレジスタ番号から前記物理
レジスタ番号への変換において、前記物理レジスタの本
数から前記グロ−バルレジスタの本数を減じた値をロ−
カルレジスタ本数、前記ウインドウスタ−トポインタレ
ジスタのビット数をウインドウスタ−トポインタレジス
タ幅、前記ポインタ幅最大値から前記ウインドウスタ−
トポインタレジスタ幅を減じた値を指数とする２のべき
乗をウインドウ刻み幅、前記ロ−カルレジスタ本数を前
記ウインドウ刻み幅で除した値をウインドウ数と定義し
たとき、前記レジスタプリロ−ド命令、前記レジスタポ
ストストア命令、該２命令を除く前記ロ−ド命令、前記
ストア命令、前記演算命令で、命令中のグロ−バルレジ
スタを示すレジスタ番号は同一番号の物理レジスタ番号
に変換され、命令中のグロ−バルレジスタ以外を示すレ
ジスタ番号は、前記レジスタプリロ−ド命令では、前記
ウインドウスタ−トポインタレジスタの値と命令中の前
記ウインドウストライドの値を、前記ウインドウ数を法
として加えたウインドウ番号と呼ばれる値に、前記ウイ
ンドウ刻み幅を乗じた、レジスタ番号スライド量と呼ば
れる値に、命令中のレジスタ番号を加えた値であらわさ
れる物理レジスタ番号に変換され、前記レジスタポスト
ストア命令では、前記ウインドウスタ−トポインタレジ
スタの値から命令中の前記ウインドウストライドの値
を、前記ウインドウ数を法として減じたウインドウ番号
と呼ばれる値に、前記ウインドウ刻み幅を乗じた、レジ
スタ番号スライド量と呼ばれる値に、命令中のレジスタ
番号を加えた値であらわされる物理レジスタ番号に変換
され、前記レジスタプリロ−ド命令、前記レジスタポス
トストア命令を除く、前記ロ−ド命令、前記ストア命
令、前記演算命令では、前記ウインドウスタ−トポイン
タレジスタの値を、前記ウインドウ数を法として、変換
したウインドウ番号と呼ばれる値に、前記ウインドウ刻
み幅を乗じた、レジスタ番号スライド量と呼ばれる値
に、命令中のレジスタ番号を加えた値であらわされる物
理レジスタ番号に変換されることを特徴とする請求項３
記載のデ−タ処理装置。
【請求項７】前記物理レジスタの本数がポインタ幅最大
値という値を指数とする２のべき乗であり、前記ウイン
ドウスタ−トポインタレジスタのビット数はポインタ幅
最大値以下であり、命令中のレジスタ番号から前記物理
レジスタ番号への変換において、前記物理レジスタの本
数を物理レジスタ本数、前記ウインドウスタ−トポイン
タレジスタのビット数をウインドウスタ−トポインタレ
ジスタ幅、前記ポインタ幅最大値から前記ウインドウス
タ−トポインタレジスタ幅を減じた値を指数とする２の
べき乗をウインドウ刻み幅、前記物理レジスタ本数を前
記ウインドウ刻み幅で除した値をウインドウ数と定義し
たとき、命令中のレジスタ番号は、前記レジスタプリロ
−ド命令では、前記ウインドウスタ−トポインタレジス
タの値と命令中の前記ウインドウストライドの値を、前
記ウインドウ数を法として加えたウインドウ番号と呼ば
れる値に、前記ウインドウ刻み幅を乗じた、レジスタ番
号スライド量と呼ばれる値に、命令中のレジスタ番号を
加えた値であらわされる物理レジスタ番号に変換され、
前記レジスタポストストア命令では、前記ウインドウス
タ−トポインタレジスタの値から命令中の前記ウインド
ウストライドの値を、前記ウインドウ数を法として減じ
たウインドウ番号と呼ばれる値に、前記ウインドウ刻み
幅を乗じた、レジスタ番号スライド量と呼ばれる値に、
命令中のレジスタ番号を加えた値であらわされる物理レ
ジスタ番号に変換され、前記レジスタプリロ−ド命令、
前記レジスタポストストア命令を除く、前記ロ−ド命
令、前記ストア命令、前記演算命令では、前記ウインド
ウスタ−トポインタレジスタの値を、前記ウインドウ数
を法として、変換したウインドウ番号と呼ばれる値に、
前記ウインドウ刻み幅を乗じた、レジスタ番号スライド
量と呼ばれる値に、命令中のレジスタ番号を加えた値で
あらわされる物理レジスタ番号に変換されることを特徴
とする請求項１記載のデ−タ処理装置。
【請求項８】前記ポインタ幅最大値または前記ウインド
ウスタ−トポインタレジスタ幅を可変にすることによっ
て、前記ウインドウ刻み幅を可変にすることを特徴とす
る請求項４記載のデ−タ処理装置。
【請求項９】前記ポインタ幅最大値または前記ウインド
ウスタ−トポインタレジスタ幅を可変にすることによっ
て、前記ウインドウ刻み幅を可変にすることを特徴とす
る請求項５記載のデ−タ処理装置。
【請求項１０】前記ポインタ幅最大値または前記ウイン
ドウスタ−トポインタレジスタ幅を可変にすることによ
って、前記ウインドウ刻み幅を可変にすることを特徴と
する請求項６記載のデ−タ処理装置。
【請求項１１】前記ポインタ幅最大値または前記ウイン
ドウスタ−トポインタレジスタ幅を可変にすることによ
って、前記ウインドウ刻み幅を可変にすることを特徴と
する請求項７記載のデ−タ処理装置。