JPH07182169A

JPH07182169A - 並列処理型コンピュータ

Info

Publication number: JPH07182169A
Application number: JP32780693A
Authority: JP
Inventors: Yayoi Abe; 弥生安部; Yoichiro Takeuchi; 陽一郎竹内
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1993-12-24
Filing date: 1993-12-24
Publication date: 1995-07-21

Abstract

(57)【要約】【目的】並列処理型コンピュータにおいてメモリにロー
ドされるプログラムサイズを小さくしてメモリのフリー
エリアを増やす。【構成】複数フィールドからなる並列処理命令の命令記
述部から無実行命令ＮＯＰ部分を適宜取り除くことによ
り、メモリ１０にロードされるプログラムの命令コード
部分のサイズを圧縮しておく。このプログラムの並列処
理命令を実行する際に、圧縮された命令コードが１命令
のみであるかどうかを命令記述情報部１４の内容から判
断する。１命令のみであれば、命令復元部２０によりそ
の命令以外の並列処理命令フィールドをＮＯＰで埋めて
実行すべき並列処理命令を復元する。復元された命令は
命令キャッシュ３０に一旦格納され、キャッシュ３０内
の復元された並列処理命令が実行ユニット６０で順次実
行される。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は、ベリーロングインス
トラクションワード（以下ＶＬＩＷと略記する）型など
の並列処理型コンピュータにおいて、メインメモリにロ
ードされるプログラムの命令コード部分のサイズを圧縮
しておき、メインメモリにロードされたプログラムの各
命令が実行される時点で圧縮された命令コードを復元す
るシステムに関する。

【０００２】

【従来の技術】たとえばＶＬＩＷ型並列処理コンピュー
タにおいて実行されるシーケンシャルな命令コードに
は、命令記述以外の部分に無実行命令（以下ＮＯＰと略
記する）が埋め込まれる。

【０００３】

【発明が解決しようとする課題】並列処理プログラムに
おけるシーケンシャルなコードでは、命令実行を行なわ
ないＮＯＰが多くなるために、プログラムの機能の割に
命令記述部のサイズが大きくなる。

【０００４】大規模なプログラムの場合、メインメモリ
にロードされたプログラム中のＮＯＰ部分がメモリを無
駄食いするから、プログラム実行時に多くのメモリが必
要となる。すると、プログラム実行中に使用できる残り
のメモリ容量が少なくなり（つまりメモリが圧迫さ
れ）、必要な処理ができなくなるという問題が起こり得
る。

【０００５】たとえばメインメモリ４メガバイトを装備
したコンピュータにおいて、オペレーティングシステム
（以下ＯＳと略記する）が起動したあとのメモリのフリ
ーエリアが２．５メガバイトであったとする。このコン
ピュータのＯＳ上でＮＯＰを多く含むプログラムを起動
したところメモリのフリーエリアが１．８メガバイトし
か残らなかったとしたら、このプログラムで２メガバイ
トのフリーエリアを必要とする処理は行なうことができ
ない（０．２メガバイトのメモリ不足）。

【０００６】とくにプログラム開発中において、デバッ
グ等のためにコードの大部分がシーケンシャル実行用に
なっていてプログラム中に存在するＮＯＰの割合が多い
場合に、上記メモリ不足が起きやすい。このメモリ不足
が起きた場合、コンピュータ本体のメモリを増設しない
限り（そのコンピュータ自体およびＯＳがそのメモリ増
設に対応していることが前提）、デバッグができず、プ
ログラム開発が中断してしまう。

【０００７】またデバッグ終了後のプログラムに対して
は、その起動後にユーザが使えるメモリのフリーエリア
サイズは大きいほど望ましい。この発明の目的は、メモ
リにロードされるプログラムサイズを小さくしてメモリ
のフリーエリアを増やすことのできる並列処理型コンピ
ュータを提供することである。

【０００８】

【課題を解決するための手段】複数フィールドからなる
並列処理命令の命令記述部から無実行命令ＮＯＰ部分を
適宜取り除くことにより、メモリにロードされるプログ
ラムの命令コード部分のサイズを圧縮しておく。このプ
ログラムの並列処理命令を実行する際に、圧縮された命
令コードが１命令のみであるかどうかを命令記述情報部
の内容から判断する。１命令のみであれば、命令復元部
により、その命令以外の並列処理命令フィールドをＮＯ
Ｐで埋めて実行すべき並列処理命令を復元する。復元さ
れた命令は命令キャッシュまたは命令バッファに一旦格
納され、キャッシュまたはバッファ内の復元された並列
処理命令が実行ユニットで順次実行される。

【０００９】

【作用】メモリにロードされるプログラムは圧縮されて
いるから、圧縮された分だけメモリのフリーエリアは広
くなっている。圧縮された命令はそのままでは実行でき
ないので、実行前に除去されたＮＯＰを再挿入する復元
が行なわれる。実行の度に（実行直前に）圧縮命令を逐
次復元するようにしたから、並列処理命令の実行に差し
障りはない一方で、メモリのフリーエリアをより広くで
きる。

【００１０】

【実施例】図１は、この発明の一実施例に係るＶＬＩＷ
型並列処理コンピュータ１００の構成を示すブロック図
である。このコンピュータ１００は、メインメモリ１
０、命令キャッシュ３０、命令レジスタ群４０、命令デ
コーダ５０、命令実行ユニット６０、レジスタファイル
（汎用レジスタ群）７０、およびデータキャッシュ８０
を備えている。

【００１１】命令実行ユニット６０は、たとえば、最大
４命令を並列処理するために４つの命令実行ユニット
（フィールド＃１〜＃４）を備えている。実行ユニット
６０の各フィールド＃１〜＃４では、レジスタファイル
７０を利用しながら与えられた命令が別々に実行され、
その実行結果がデータキャッシュ８０あるいはメモリ１
０のデータ格納部１６に書き込まれるようになってい
る。

【００１２】コンピュータ１００で並列処理されるプロ
グラムは、そのプログラムを使用するときに、外部記憶
装置（ハードディスクなど）９０からインターフェイス
（Ｉ／Ｆ）９２を介してメインメモリ１０に読み込まれ
る。

【００１３】この際、外部記憶装置９０に格納されたプ
ログラム中の命令群が予めコンパイラ等により圧縮され
ているときは、このプログラムはそのままメモリ１０に
読み込まれる。しかし、このプログラム中の命令群がま
だ圧縮されていないときは、このプログラムをメモリ１
０に読み込む過程において、たとえばＯＳに組み込まれ
バックグラウンドで走っている圧縮処理プログラムある
いはコンピュータ１００自体に組み込まれた圧縮処理ロ
ジック回路により、プログラム中の命令群を圧縮しなが
ら、メモリ１０にロードする。（圧縮の方法は図５を参
照して後述する。）メインメモリ１０は、命令格納部１
２、命令記述情報部１４、およびデータ格納部１６を含
んでいる。上記プログラムの圧縮された命令はメモリ１
０の命令格納部１２に格納され、命令の圧縮状態に関す
る情報は命令記述情報部１４に格納され、このプログラ
ムで使用されるデータはデータ格納部１６に格納され
る。データ格納部１６に格納されたデータＤ１０は、適
宜、データキャッシュ８０を介して、あるいは直接に、
命令実行ユニット６０に供給される。

【００１４】メモリ１０にロードされた命令は圧縮され
ているので、命令格納部１２および命令記述情報部１４
で消費されるメモリの量は、圧縮しない場合よりも少な
くなっている。すなわち、命令圧縮によりメモリが節約
されている。（もとのプログラムがＮＯＰを多く含めば
含むほど、メモリ節約量は大きくなる。）メモリ１０に
ロードされた圧縮されている命令は、その実行前に元の
形に復元しなければならない（そうしないと正常な並列
処理が行なわれず、エラーがでる）。この命令復元を行
なうために、コンピュータ１００は、命令復元部２０お
よび命令記述復元割込発生部２２を備えている。

【００１５】すなわち、命令記述情報部１４の内容に対
応して圧縮された命令の実行時に、割込発生部２２が、
割り込みＤ２２を発生させる。すると命令復元部２０
は、命令記述情報部１４からの情報Ｄ１４に基づき命令
格納部１２からの圧縮された命令Ｄ１２を元の形に復元
し、復元された命令Ｄ２０を命令キャッシュ３０（ある
いは命令レジスタ群４０）に格納する。

【００１６】命令キャッシュ３０に格納された復元命令
Ｄ２０は、命令レジスタ群（命令バッファ）４０の命令
パイプに投入され、ここから順に命令Ｄ４０が命令デコ
ーダ５０に送り出される。

【００１７】命令Ｄ４０はデコーダ３０によりデコード
される。デコードされた命令（適宜ＮＯＰを含む４つの
並列処理命令）Ｄ５０は実行ユニット６０のフィールド
＃１〜＃４に同時に投入され、並列処理される。

【００１８】実行ユニット６０での処理結果Ｄ６０はデ
ータキャッシュ８０あるいはデータ格納部１６に書き込
まれる。こうして、命令キャッシュ３０あるいは命令レ
ジスタ群４０に詰め込まれた（圧縮復元後の）命令群
が、実行ユニット６０のフィールド＃１〜＃４において
次々と並列実行される。

【００１９】図５は、図１の並列処理コンピュータが扱
う命令の圧縮処理を説明するフローチャートである。こ
の命令圧縮は、実行プログラムを生成する際のコンパイ
ラによる処理（リンクを行なう前後の処理）でもよい
し、コンピュータ１００がプログラムをメモリ１０にロ
ードする時に行なう処理でもよい。また図６は、４つの
命令フィールド＃１〜＃４からなるＶＬＩＷ命令１〜５
がどのように圧縮されるかの一例を示している。

【００２０】ここでは、デバッグを行なうため高級言語
のソースプログラム（Ｃ言語で記載されたソースコード
等）をシーケンシャルな命令コードになるようにコンパ
イルしリンクした場合を想定している。

【００２１】まず、並列実行型ＶＬＩＷマシンのシーケ
ンシャル実行用命令コード（ロードモジュール）が入力
され（ステップＳＴ４０）、入力された命令コード中に
同時実行する命令がいくつあるかがチェックされる（ス
テップＳＴ４２）。

【００２２】例えば図６の命令１で示すように同時実行
する命令が１つ（ＡＤＤ）だけの場合（ステップＳＴ４
４、イエス）、命令記述情報部１４には「１命令のみ実
行」を示すとともにこの１命令の位置をビット「１」で
示す情報「１０００」が書き込まれる（ステップＳＴ４
６）。

【００２３】同時実行する命令が１つの場合、命令記述
情報部１４の４ビット情報の各ビットの和（Σ＃１〜＃
４）は１であり、これが「１命令のみ実行」を示す。ま
た命令記述情報部１４の４ビット情報「１０００」中の
「１」の位置が同時実行する命令（ＡＤＤ）のフィール
ド＃１を示し、「０」の位置が命令復元時に無実行命令
ＮＯＰが挿入されるフィールド＃２〜＃４を示す。

【００２４】命令記述情報部１４に「１命令のみ実行」
を示す情報「１０００」が書き込まれると、入力された
命令コードからＮＯＰを取り除いた命令（ＡＤＤ）だけ
が命令格納部１２に格納される（ステップＳＴ４８）。
こうして命令１の圧縮（ＮＯＰの除去）が終了する。

【００２５】命令１は入力された命令コードの最終命令
ではないので（ステップＳＴ５２、ノー）次の命令２が
取り込まれ（ステップＳＴ５４）、その命令の同時実行
命令数がチェックされる（ステップＳＴ４２）。この場
合も同時実行命令は１つだけ（ＳＵＢ）である（ステッ
プＳＴ４４、イエス）。すると図６に示すように、命令
記述情報部１４には「１命令のみ実行」を示すとともに
この１命令の位置をビット「１」で示す情報「００１
０」が書き込まれる（ステップＳＴ４６）。

【００２６】命令記述情報部１４に「１命令のみ実行」
を示す情報「００１０」が書き込まれると、入力された
命令コードからＮＯＰを取り除いた命令（ＳＵＢ）だけ
が命令格納部１２に格納される（ステップＳＴ４８）。
こうして命令２の圧縮（ＮＯＰの除去）が終了する。

【００２７】同様に、図６の命令３に対する命令圧縮処
理が行なわれる（情報部１４には「１０００」が書き込
まれ、格納部１２にはＳＵＢが格納される）。一方、図
６の命令４で示すように同時実行する命令が複数（ＡＤ
ＤとＭＵＬ）の場合（ステップＳＴ４４、ノー）、命令
記述情報部１４には、複数の「並列実行命令あり（つま
り同時実行命令が２以上）」を示すとともにこれら複数
命令の位置をビット「１」で示す情報「０１１０」が書
き込まれる（ステップＳＴ５６）。

【００２８】命令記述情報部１４に［複数命令同時実
行」を示す情報「０１１０」が書き込まれると（和Σ＃
１〜＃４は２以上）、入力された命令４そのもの（ＮＯ
Ｐ、ＡＤＤ、ＭＵＬ、ＮＯＰ）がメモリ１０（命令格納
部１２）の所定アドレス（０Ｘ１０００〜０Ｘ１００
３）に格納される（ステップＳＴ５８）。この場合は命
令４の圧縮（ＮＯＰの除去）は行なわれず、命令記述情
報部１４には命令４を格納した場所の先頭アドレス（０
Ｘ１０００）が書き込まれる（ステップＳＴ６０）。

【００２９】あるいは、命令記述情報部１４に［複数命
令同時実行」を示す情報「０１１０」を書き込んだあと
（和Σ＃１〜＃４は２以上）、入力された命令４からＮ
ＯＰを取り除いたもの（ＡＤＤ、ＭＵＬ）をメモリ１０
の所定アドレス（０Ｘ１０００〜０Ｘ１００１）に格納
するようにしてもよい（ステップＳＴ５８）。この場合
は命令４の圧縮（ＮＯＰの除去）が行なわれており、命
令記述情報部１４には命令４の実行命令本体（ＡＤＤ、
ＭＵＬ）を格納した場所の先頭アドレス（０Ｘ１００
０）が書き込まれる（ステップＳＴ６０）。

【００３０】なお、ステップＳＴ４４でノーとなる場合
（同時実行命令が１命令のみでない場合）としては、同
時実行命令が複数ある場合に限定はされない。たとえば
ＯＳがスーパバイザモードで使用する特殊な長い命令
（通常の命令が３２ビット固定長命令である場合に特種
命令が３２〜１２８ビットの可変長命令であるときな
ど）の場合、「１命令のみの実行」としては扱かわれず
（ステップＳＴ４４、ノー）、この特殊命令の格納先が
命令記述情報部１４に格納され（ステップＳＴ５６）、
そのあとこの特殊命令がメモリ１０の所定箇所に格納さ
れる（ステップＳＴ６０）。

【００３１】命令４は入力された命令コードの最終命令
ではないので（ステップＳＴ５２、ノー）次の命令５が
取り込まれ（ステップＳＴ５４）、その命令の同時実行
命令数がチェックされる（ステップＳＴ４２）。この場
合は同時実行命令は１つだけ（ＡＤＤ）であり（ステッ
プＳＴ４４、イエス）、命令記述情報部１４には「１命
令のみ実行」を示すとともにこの１命令の位置をビット
「１」で示す情報「１０００」が書き込まれる（ステッ
プＳＴ４６）。命令記述情報部１４に情報「１０００」
が書き込まれると、入力された命令コードからＮＯＰを
取り除いた命令（ＡＤＤ）だけが命令格納部１２に格納
される（ステップＳＴ４８）。こうして命令５の圧縮
（ＮＯＰの除去）が終了する。

【００３２】命令５が最終命令であれば（ステップＳＴ
５２、イエス）命令の圧縮処理は終了する。図５のステ
ップＳＴ４０〜ＳＴ６０の処理が済むと、図６の左側に
示した非圧縮並列処理命令１〜５（３２ビット命令を４
つ並列に処理する１２８ビットＶＬＩＷ命令）は図６の
右側に示すように圧縮され、圧縮された命令とその命令
記述情報がメモリ１０に格納される。

【００３３】図５の処理の結果として命令格納部１２に
格納される命令コードの合計サイズは、削除したＮＯＰ
の分、元の並列処理命令コードの合計サイズよりも小さ
くなる。命令記述情報部１４のビットサイズは命令格納
部１２に格納されなかったＮＯＰよりも小さいので、命
令記述情報部１４の存在によるメモリ１０の消費量より
も、ＮＯＰを格納しなかったことによるメモリ１０の節
約量の方が大きい。

【００３４】また、命令記述情報部１４の４ビットを命
令格納部１２に格納される３２ビット命令の一部として
取り込めば、命令記述情報部１４によるメモリの消費は
なくなり（この場合、各命令は２８ビットで記述される
ことになる）、ＮＯＰ削除によるメモリ節約分がそのま
まフリーエリアとしてメインメモリ１０に残る。

【００３５】図２は、図１の並列処理コンピュータ１０
０において実行される処理を説明するフローチャートで
ある。また図３は、図２におけるＮＯＰ復元処理の一例
を示すフローチャートである。この処理は、命令復元部
２０内のハードウエアロジックまたはコンピュータ１０
０のマイクロコードで実行できる。

【００３６】まず、圧縮された命令１（図６参照）が命
令復元部２０に取り込まれ（ステップＳＴ１０）、引き
続き取り込んだ命令１の命令記述情報部１４の内容がチ
ェックされる（ステップＳＴ１２）。

【００３７】４ビット情報部１４の各ビット中の「１」
の和Σ＃１〜＃４が１ならば、圧縮された命令１は同時
実行命令数が１つだけであると判定され（ステップＳＴ
１４、イエス）、命令１に対応する命令格納部１２の内
容（命令ＡＤＤ）が読み出される（ステップＳＴ１
６）。

【００３８】すると、ＮＯＰ復元処理に入る（ステップ
ＳＴ１８）。すなわち図３に示すように、まず命令記述
情報部１４のビット１の位置に該当するフィールド＃１
が検出される（ステップＳＴ１８１）。続いて、図７に
示すように、検出されたビット１の位置に該当するフィ
ールド＃１に読み出された命令ＡＤＤが配置され、残り
のフィールド＃２〜＃４にＮＯＰが挿入される（ステッ
プＳＴ１８２）。

【００３９】こうして正規の並列処理命令（１２８ビッ
トＶＬＩＷ命令）に復元された命令１は、命令キャッシ
ュ３０（または命令レジスタ群４０）にロードされる
（ステップＳＴ２０）。

【００４０】命令１が最終命令でないときは（ステップ
ＳＴ２２、ノー）、次の命令２が命令復元部２０に取り
込まれ（ステップＳＴ２４）、取り込んだ命令２の命令
記述情報部１４の内容がチェックされる（ステップＳＴ
１２）。

【００４１】４ビット情報部１４の各ビット中の「１」
の和Σ＃１〜＃４が１なので、圧縮された命令２は同時
実行命令数が１つだけであると判定され（ステップＳＴ
１４、イエス）、命令２に対応する命令格納部１２の内
容（命令ＳＵＢ）が読み出される（ステップＳＴ１
６）。

【００４２】すると、命令２のＮＯＰが復元され（ステ
ップＳＴ１８）、復元された並列処理命令２は、命令キ
ャッシュ３０（または命令レジスタ群４０）にロードさ
れる（ステップＳＴ２０）。

【００４３】同様にして、命令３のＮＯＰが復元され
（ステップＳＴ１８）、復元された並列処理命令３は、
命令キャッシュ３０（または命令レジスタ群４０）にロ
ードされる（ステップＳＴ２０）。

【００４４】次に、非圧縮命令４（図６参照）が命令復
元部２０に取り込まれ（ステップＳＴ１０）、取り込ん
だ命令４の命令記述情報部１４の内容がチェックされる
（ステップＳＴ１２）。

【００４５】ここでは４ビット情報部１４の各ビット中
の「１」の和Σ＃１〜＃４が２なので、命令４は同時実
行命令数が２つあると判定される（ステップＳＴ１４、
ノー）。すると図１の命令記述復元割込発生部２２によ
り割り込みが発生する（ステップＳＴ２６）。

【００４６】この割り込みが生じると、命令復元部２０
は、命令格納部１２の内容（０ｘ１０００）から、命令
４の格納先アドレス（０ｘ１０００から連続する４アド
レス分）を算出する（ステップＳＴ２８）。すると図７
に示す命令４の格納先アドレス（０ｘ１０００〜０ｘ１
００３）から命令４の内容（ＮＯＰ、ＡＤＤ、ＭＵＬ、
ＮＯＰ）が読み出される（ステップＳＴ３０）。

【００４７】こうして読み出された並列処理命令４は、
命令キャッシュ３０（または命令レジスタ群４０）にロ
ードされる（ステップＳＴ３２）。なお、命令４もＮＯ
Ｐ除去の圧縮を受けている場合は（つまり４ビット情報
部１４の各ビット中の「１」の和Σ＃１〜＃４が３以下
の場合は）、命令４中の実行命令（ＡＤＤ、ＭＵＬ）を
その格納先アドレス（図６下中央の０ｘ１０００〜０ｘ
１００１）から読み出してから（ステップＳＴ３０）、
読み出された実行命令（ＡＤＤ、ＭＵＬ）にＮＯＰを付
加する復元処理（図３のステップＳＴ１８１〜ＳＴ１８
２）を行なってもよい。

【００４８】この場合、情報部１４中で最初にビット
「１」が立っているフィールド（＃２）に最初の格納先
アドレス（０ｘ１０００）の命令（ＡＤＤ）が配置さ
れ、情報部１４中で２番目にビット「１」が立っている
フィールド（＃３）に次の格納先アドレス（０ｘ１００
１）の命令（ＭＵＬ）が配置され、情報部１４中ビット
「０」のフィールド（＃１、＃４）にＮＯＰが配置され
る。

【００４９】命令４が最終命令でないときは（ステップ
ＳＴ２２、ノー）、次の命令５が命令復元部２０に取り
込まれ（ステップＳＴ２４）、取り込んだ命令５の命令
記述情報部１４の内容がチェックされる（ステップＳＴ
１２）。４ビット情報部１４の各ビット中の「１」の和
Σ＃１〜＃４は１なので、圧縮された命令５は同時実行
命令数が１つだけであると判定され（ステップＳＴ１
４、イエス）、命令５に対応する命令格納部１２の内容
（命令ＡＤＤ）が読み出される（ステップＳＴ１６）。
すると、命令５のＮＯＰが復元され（ステップＳＴ１
８）、復元された並列処理命令５が、命令キャッシュ３
０（または命令レジスタ群４０）にロードされる（ステ
ップＳＴ２０）。

【００５０】命令５が最終命令であるときは（ステップ
ＳＴ２２、イエス）、命令キャッシュ３０（または命令
レジスタ群４０）にロードされた命令１〜５が順次図１
の命令デコーダ５０でデコードされ、デコードされた命
令１〜５が実行ユニット６０のフィールド＃１〜＃４で
並列に同時処理される（ステップＳＴ３４）。

【００５１】図２の処理の結果、メインメモリ１０に読
み込まれた命令１〜５が圧縮された命令（サイズ小）で
あっても、命令キャッシュ３０あるいは命令レジスタ群
４０に書き込まれた実行直前の命令１〜５は、図１０に
示すような非圧縮の復元命令となっている。命令実行ユ
ニット６０は、この復元命令１〜５をフィールド＃１〜
＃４で並列実行する。

【００５２】なお、復元された命令１〜５が全て命令キ
ャッシュ３０に格納され終わるまで待つのではなく、適
当な数の復元命令がキャッシュ３０（又はレジスタ４
０）に溜まったら実行ユニット６０で命令実行（ステッ
プＳＴ３４）を開始するようにしてもよい。この場合は
ステップＳＴ２２の前に命令実行ステップが挿入され
る。

【００５３】また、命令キャッシュ３０あるいは命令レ
ジスタ群４０に書き込まれた復元命令１〜５はその実行
後は消滅してもエラーは生じない。したがって、復元さ
れた後続命令（命令６以降）を次々と命令キャッシュ３
０あるいは命令レジスタ群４０に書き込んで、命令キャ
ッシュ３０あるいは命令レジスタ群４０内の実行済み旧
命令（命令１〜５）をどんどん消去することができる。
このため命令キャッシュ３０あるいは命令レジスタ群４
０が多数の復元命令でオーバーフローしてエラーを出す
ことはない。

【００５４】もし、コンピュータ１００が４キロバイト
の命令キャッシュ３０を備えており、実行ユニット６０
のフィールド＃１〜＃４で実行される各命令が３２ビッ
ト（４バイト）固定長であるとすれば、キャッシュ３０
は復元後の３２ビット命令を最大１０００個持つことが
できる。コンピュータ１００で処理しようとするプログ
ラムモジュール中の命令数が１０００個以内（４ワード
構成のＶＬＩＷ命令で数えれば２５０個以内）ならば、
復元後の非圧縮命令は全て命令キャッシュ３０に収まっ
てしまう。この場合は上記復元命令のオーバーフローは
生じない。

【００５５】必要な復元命令が全て命令キャッシュ３０
に収まったあとは、もはや命令復元処理は不要となるか
ら、命令復元のためにコンピュータ１００全体の処理速
度が落ちることはない。このことから、コンピュータ１
００で実行されるプログラム中の命令数に対して、命令
キャッシュ３０は十分な記憶容量を持っていることが望
ましい。

【００５６】なお、コンピュータ１００が汎用レジスタ
（または命令レジスタ）を豊富に持っており、これらの
レジスタ中に必要な復元命令の大部分を保持できるな
ら、大容量の命令キャッシュ３０は必ずしも必要ではな
い。

【００５７】図６の例では命令記述情報部１４を命令実
行ユニット６０のフィールド数と同数のビット構成と
し、圧縮命令のフィールド位置情報も情報部１４に含ま
せている。このため図８に示すような圧縮前の命令１〜
５が圧縮された後これを復元すると、図１０に示すよう
に元通りの命令１〜５が得られる。

【００５８】ここで、命令１のようにＶＬＩＷ命令が実
行命令を１つしか含まないときは、この実行命令（ＡＤ
Ｄ）がフィールド＃１〜＃４のどこで実行されても、ソ
フトウエア上は、その処理結果は同じになる（ハードウ
エア上では、同一フィールドでの連続命令実行に伴いハ
ザードの問題が起きる可能性があるが、ここではハザー
ドは起きないと仮定する）。この場合、命令記述情報部
１４は必ずしも実行命令（ＡＤＤ）のフィールド位置情
報を含んでいる必要はない。

【００５９】そのような場合では、命令記述情報部１４
は「ＶＬＩＷ命令が実行命令を１つしか含まない」かど
うかを区別する情報だけを持てばよく、情報部１４を１
ビットフラグで構成することができる。

【００６０】図８は、命令記述情報部１４を１ビットフ
ラグで構成した場合に、ＶＬＩＷ命令がどのように圧縮
されるかを例示している。すなわち、命令１では実行命
令が１つだけであるから（図５のステップＳＴ４４、イ
エス）、情報部１４のフラグが「０」とされ（ステップ
ＳＴ４６）、命令格納部１２に実行命令（ＡＤＤ）が格
納される（ステップＳＴ４８）。

【００６１】一方、命令４では実行命令が１つだけでは
ないから（ステップＳＴ４４、ノー）、情報部１４のフ
ラグが「１」とされ（ステップＳＴ５６）、命令格納部
１２に命令４の格納先先頭アドレス（０ｘ１０００）が
格納される（ステップＳＴ５８）。このあとこの先頭ア
ドレスから連続する４アドレス（０ｘ１０００〜０ｘ１
００３）に命令４がそのまま格納される（ステップＳＴ
６０）。

【００６２】図４は、図８の例におけるＮＯＰ復元処理
の例を示している。すなわち、命令１の情報部１４のフ
ラグが「０」である場合（図２のステップＳＴ１６）、
格納部１２から実行命令（ＡＤＤ）を取り出してこれを
所定フィールド、たとえばフィールド＃１におく。しか
る後に残りフィールド＃２〜＃４をＮＯＰで埋めて（ス
テップＳＴ１８）、図９に示すように命令１を復元す
る。復元された命令１は、命令キャッシュ３０または命
令レジスタ４０に転送される（ステップＳＴ２０）。

【００６３】一方、命令４の情報部１４のフラグが
「１」である場合、命令復元割込を発生させる（図２の
ステップＳＴ２６）。続いてメモリ１０のアドレス０ｘ
１０００〜０ｘ１００３を計算し（ステップＳＴ２
８）、そのアドレスから実行命令（ＮＯＰ、ＡＤＤ、Ｍ
ＵＬ、ＮＯＰ）を取り出して（ステップＳＴ３０）、こ
れをフィールド＃１〜＃４に配置する。こうして得られ
た図９に示すような命令４は、命令キャッシュ３０また
は命令レジスタ４０に転送される（ステップＳＴ３
２）。

【００６４】図８のように命令記述情報部１４が１ビッ
ト構成の例では、ＶＬＩＷ命令中の実行命令が１つだけ
の場合、実行命令（命令１のＡＤＤ、命令２のＳＵＢな
ど）のフィールド位置を特定できない。したがって、こ
の場合の命令復元処理においては、命令復元に一定の規
則を設けておく必要が生じる。

【００６５】図１１は、第１の命令復元規則にしたがっ
て復元されたＶＬＩＷ命令群の例である。ここでは、フ
ィールド＃１に１クロック処理命令（ＡＤＤ、ＳＵＢ）
を集め、フィールド＃２にＮＯＰまたは２クロック処理
命令（ＭＵＬ）を集め、フィールド＃３〜＃４にＮＯＰ
または図示しない３クロック以上の処理命令を集めてい
る。この例ではフィールド＃１での連続命令処理におい
てハザードが生じないことを仮定している。

【００６６】図１２は、第２の命令復元規則にしたがっ
て復元されたＶＬＩＷ命令群の例である。ここでは、フ
ィールド＃１にＮＯＰまたは第１の命令（ＡＤＤ）を集
め、フィールド＃２にＮＯＰまたは第２の命令（ＳＵ
Ｂ）を集め、フィールド＃３にＮＯＰまたは第３の命令
（ＭＵＬ）を集め、フィールド＃４にＮＯＰまたは図示
しない第４の命令（割り算命令ＤＩＶなど）を集めてい
る。

【００６７】図１３は、第３の命令復元規則にしたがっ
て復元されたＶＬＩＷ命令群の例である。ここでは、４
命令（命令１〜４）処理を１サイクルとし、各フィール
ドは１サイクル中で１回はＮＯＰ以外の命令を実行する
ようにしている。

【００６８】なお前述した実施例においては、４ビット
（または１ビット）命令記述部１４は３２ビット命令格
納部１２の他に用意されているが、この命令記述部１４
は３２ビット命令格納部１２の一部に組み込んでもよ
い。たとえば３２ビット中４ビット（または１ビット）
を命令記述部１４のために用い、残り（２８ビット〜３
１ビット）をＡＤＤ、ＳＵＢなどの命令記述のために用
いるようにしてもよい。

【００６９】上述した実施例によれば、ＶＬＩＷ型コン
ピュータでシーケンシャルなコードを実行する場合に命
令記述部分を圧縮できるので、大規模なプログラムのシ
ーケンシャルな実行を少ない実メモリで実行できる。

【００７０】この際、並列度の高い命令（デバッグ時の
シーケンシャルコードではＮＯＰが多くなる）ほどサイ
ズ圧縮効果は高い。なお、この発明は、ＶＬＩＷ型に限
らず、命令コード中に適宜ＮＯＰが挿入されたプログラ
ムを実行時にメモリに読み込む他方式の並列処理型コン
ピュータ（スーパースカラ型コンピュータ等）にも応用
可能である。

【００７１】

【発明の効果】この発明によれば、メモリにロードされ
る並列処理プログラムの命令コードは圧縮されているか
ら、圧縮された分だけメモリのフリーエリアは広くなっ
ている。圧縮された命令は、その実行の度に本来の命令
に逐次復元される。このため、並列処理命令の実行に差
し障りはない一方で、広いフリーエリアがメモリに確保
できる。換言すれば、並列処理コンピュータおける大規
模プログラムのシーケンシャルな実行を、より少ないメ
モリで行なうことができる。

【図面の簡単な説明】

【図１】図１は、この発明の一実施例に係るＶＬＩＷ型
並列処理コンピュータの構成を示すブロック図。

【図２】図２は、図１の並列処理コンピュータにおいて
実行される処理を説明するフローチャート。

【図３】図３は、図２におけるＮＯＰ復元処理の一例を
説明するフローチャート。

【図４】図４は、図２におけるＮＯＰ復元処理の他例を
説明するフローチャート。

【図５】図５は、図１の並列処理コンピュータが扱う命
令の圧縮処理を説明するフローチャート。

【図６】図６は、４つの命令フィールドからなるＶＬＩ
Ｗ命令がどのように圧縮されるかの一例を説明する図。

【図７】図７は、図６の例において圧縮されたＶＬＩＷ
命令がどのように復元されるかを説明する図。

【図８】図８は、４つの命令フィールドからなるＶＬＩ
Ｗ命令がどのように圧縮されるかの他例を説明する図。

【図９】図９は、図８の例において圧縮されたＶＬＩＷ
命令がどのように復元されるかを説明する図。

【図１０】図１０は、４つの命令フィールドからなるＶ
ＬＩＷ命令がオリジナル通りに復元された場合を例示す
る図。

【図１１】図１１は、４つの命令フィールドからなるＶ
ＬＩＷ命令が第１の所定規則（フィールド１に１クロッ
ク処理命令を集める）に従い復元された場合を例示する
図。

【図１２】図１２は、４つの命令フィールドからなるＶ
ＬＩＷ命令が第２の所定規則（同じ演算命令は同じフィ
ールドに集める）に従い復元された場合を例示する図。

【図１３】図１３は、４つの命令フィールドからなるＶ
ＬＩＷ命令がモディファイされて復元された場合を例示
する図。

【符号の説明】

１０…メインメモリ、１２…命令格納部、１４…命令記
述情報部、１６…データ格納部、２０…命令復元部、２
２…命令記述復元割込発生部、３０…命令キャッシュ、
４０…命令レジスタ群（命令バッファ）、５０…命令デ
コーダ、６０…命令実行ユニット（４並列処理）、７０
…レジスタファイル（汎用レジスタ群）、８０…データ
キャッシュ、９０…外部記憶装置、９２…インターフェ
イス、１００…ＶＬＩＷ型並列処理コンピュータ。

Claims

【特許請求の範囲】

【請求項１】無実行命令以外の命令を含む情報を格納
する命令格納部および無実行命令を付加するかどうかを
示す情報を格納する命令記述情報部を記憶するメモリ
と；前記命令記述情報部の内容が無実行命令の付加を示
す場合に、前記命令格納部の命令に無実行命令を付加し
て複数命令からなる命令コードを生成する命令生成手段
と；複数の命令実行フィールドを持ち、これらの命令実
行フィールドにおいて、前記命令生成手段で生成された
命令コードを並列に実行する命令実行手段とを具備した
ことを特徴とする並列処理型コンピュータ。
【請求項２】前記メモリは、無実行命令以外の命令を
複数含む命令コードを格納する複数命令領域を持ち、前記命令生成手段は、前記命令記述情報部の内容が無実
行命令の付加以外を示す場合に前記複数命令領域に格納
された命令コードを取り出す命令取出手段を含み、前記命令実行手段が、前記命令生成手段により生成され
た命令コードとともに前記命令取出手段により取り出さ
れた命令コードを実行するように構成されることを特徴
とする請求項１に記載の並列処理型コンピュータ。
【請求項３】複数命令からなる並列処理命令コードが
無実行命令以外の命令を１つだけ含む場合に、この並列
処理命令コードから無実行命令を取り除くことによりこ
の並列処理命令コードのコードサイズを圧縮し、コードサイズが圧縮されたことを示す命令記述情報をこ
の圧縮された並列処理命令コードとともに保存し、前記命令記述情報が、保存された前記並列処理命令コー
ドはコードサイズが圧縮されていることを示す場合に、
この圧縮された命令コードに無実行命令を付加すること
により並列処理命令コードを復元しながら実行するよう
に構成したことを特徴とする並列処理型コンピュータシ
ステム。
【請求項４】命令記述情報部および命令格納部を具備
し、並列処理命令コードから無実行命令部分を適宜取り除く
ことによりこの並列処理命令コードのコードサイズを圧
縮し、このコードサイズが圧縮されたことに関する情報を前記
命令記述情報部に記述し、このコードサイズが圧縮された命令コードを前記命令格
納部に記述することを特徴とする並列処理型コンピュー
タシステム。
【請求項５】命令記述情報部、命令格納部、命令記述
復元割込部および命令復元部を具備し、並列処理命令コ
ードから無実行命令部分を適宜取り除くことによりこの
並列処理命令コードのコードサイズを圧縮し、このコードサイズが圧縮されたことに関する情報を前記
命令記述情報部に記述し、このコードサイズが圧縮された命令コードを前記命令格
納部に記述し、前記命令記述情報部に記述された情報に基づき前記命令
格納部に記述された圧縮命令コードに無実行命令を挿入
することで元の並列処理命令コードを復元し、前記復元された元の並列処理命令コードを逐次実行する
ことを特徴とする並列処理型コンピュータシステム。