JPH01213721A

JPH01213721A - コンパイラ方式

Info

Publication number: JPH01213721A
Application number: JP63039235A
Authority: JP
Inventors: Eiji Nunohiro; 布広　永示; Giichi Tanaka; 義一田中; Yasuhiro Inagami; 稲上　泰弘
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1988-02-22
Filing date: 1988-02-22
Publication date: 1989-08-28

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、ソースプログラムを解析して実行効率のよい
目的プログラムを生成するコンパイラ方式に係り、特に
ベクトル化ループと並列実行可能なスカラ部分を検出し
、スカラ処理ユニットとベクトル処理ユニットとの並列
化効率のよい目的プログラムを生成するのに好適なコン
パイラ方式に関する。

（従来の技術〕科学技術計算等で頻繁に出現する配列同志の演算を高速
に処理する計算機にベクトルプロセッサがある。

ベクトルプロセッサは、順序付けられた一連の配列デー
タ（ベクトルデータ）に対してパイプラインで高速に処
理するベクトル処理機構をもつ。

たゾし、１個のプログラムを全部ベクトル処理できるの
ではなく、従来の汎用計算機のような逐次処理（これを
スカラ処理と呼ぶ）せざるを得ない部分も生じる。従っ
て、ベクトルプロセッサは、ベクトルデータをパイプラ
インで高速処理するべクトル処理機構の他に、従来の汎
用計算機相当の機能を実現するスカラ処理機構を合わせ
持つ。ベクトルプロセッサ内のベクトル処理機構とスカ
ラ処理機構の関係の持たせ方についてはいくつかの方式
が考えられるが、物理的には分離している場合が多い。

上述のような、ベクトル処理機構およびスカラ処理機構
をもつベクトルプロセッサは、例えば特開昭５８−１１
４２７４号公報に示されている。

なお、二＼に示されているベクトルプロセッサでは、ス
カラ処理機構に相当するスカラ処理ユニットと、ベクト
ル処理機構に相当するベクトル処理ユニットから成る。

第１０図は、このようなベクトルプロセッサの構成図を
示す。第１０図において、４００は主記憶、４１０は主
記憶制御部、４２０はスカラ処理ユニット、４３０はベ
クトル処理ユニットである。

４２１はキャッシュで主記憶の１部の写しを持つ高速メ
モリである。４２２はレジスタ群で、例えば汎用レジス
タ１６本、浮動小数点レジスタ１６本などより構成され
る。４２３は演算器群で、スカラ処理ユニット４２０内
の演算処理を受けもつ。

４２４はスカラ命令制御部で、従来の汎用計算機の命令
に相当するスカラ命令の読出し、解読、実行制御を行う
。４３１はベクトル処理ユニット４３０内にあるレジス
タ群で、例えばベクトルレジスタ群およびスカラレジス
タ群から成る。ベクトルレジスタ群は例えば３２本のベ
クトルレジスタから成り、１本のベクトルレジスタでは
例えば２５６要素から成るベクトルデータを保持するこ
とができる。スカラレジスタ群は例えば３２本のスカラ
レジスタから成り、１本のスカラレジスタは、スカラ処
理ユニット内にある汎用レジスタや浮動小数点レジスタ
と同様、スカラデータを保持するものである。４３２は
ベクトル演算器群であり、ベクトルレジスタあるいはス
カラレジスタから読出したデータをパイプラインで処理
して、結果をベクトルレジスタあるいはスカラレジスタ
に格納するものである。ベクトル演算器としては例えば
加算器や乗算器などがある。４３３はベクトルアドレス
レジスタ群であり、ベクトル処理ユニット４３０が主記
憶制御部４１０を介し、主記憶４゜Ｏを参照してベクト
ルデータを読出したり書込んだりするときに、主記憶４
００のベクトルデータの位置を示すのに用いる複数のア
ドレスレジスタより成る。ベクトルアドレスレジスタと
しては、ベクトルデータの先頭番地を保持するために使
用するベクトルベースレジスタ（ＶＢＲ）およびベクト
ルデータの要素間隔を保持するベクトルインクリメント
レジスタ（Ｖ　Ｉ　Ｒ）から成る。４３４はベクトル命
令実行制御部であり、ベクトル命令の読出し、解読、実
行制御を行う。

次に、プログラムを処理実行するときに、スカラ処理ユ
ニットおよびベクトル処理ユニットがどのように動作す
るかについて説明する。なお、これについては、例えば
雑誌日経エレクトロニクス１９８３年４月１１日号のペ
ージ１７２〜１７３に示されているので、こぎでは簡単
に説明する。

ベクトル処理を行うには、主記憶からベクトルデータを
取出すときに使用するベクトルアドレスレジスタ群への
値の事前設定等の前処理を行う必要がある。第１０図に
示した従来のベクトルプロセッサにおいては、次の手順
でベクトル処理が遂行される。

手順１スカラ処理ユニットにおいて、ベクトル処理に必要なベ
クトルアドレスレジスタ類、スカラレジスタに所定の値
をベクトル処理開始前に設定する。

手順２スカラ処理ユニットにより、実行するベクトル処理を記
述しているベクトル命令列の格納されている主記憶の先
頭番地や処理するベクトルの要素数等をベクトル処理ユ
ニットに通告して、ベクトル処理ユニットを起動する。

主版ｌ起動されたベクトル処理ユニットは、スカラ処理ユニッ
トから通知された情報に従ってベクトル命令を順次読出
し、実行して、ベクトル処理を遂行する。

手順４ベクトル処理ユニットを起動した後、スカラ処理ユニッ
トは例えば次のベクトル処理の準備など、ベクトル処理
と並行して別のスカラ処理が独立に処理できる。

手順５ベクトル処理ユニットにおけるベクトル処理の終了は、
スカラ処理ユニットからベクトル処理ユニットの状態を
テストするか、あるいはベクトル処理ユニットからスカ
ラ処理ユニットへ割込みの形式で通知するかのいずれか
の形で扱われる。

上記のように、スカラ処理ユニットとベクトル処理ユニ
ットの関係は、スカラ処理ユニットが主、ベクトル処理
ユニットが従の主従関係にあり、スカラ処理ユニットか
らの指令でベクトル処理ユニットがベクトル処理を遂行
するという形で処理が進む。

従来、このようなプロセッサにおいて、スカラ処理ユニ
ットとベクトル処理ユニットとの同期、通信を行うため
に用意されている命令について第１１図に示す、これら
の命令はすべで主ユニットであるスカラ処理ユニットで
解読・実行されるものである。

次に、簡単なＦ　ＯＲＴ　ＲＡ　Ｎのプログラムの処理
を例に、従来技術でスカラ処理ユニットとベクトル処理
ユニットがどのように同期、通信して処理を行っている
か説明する。

第１２図はＦＯＲＴＲＡＮのプログラム例を示したもの
である。第１２図のプログラムにおいて文識別番号２〜
６のＤｏループはベクトル処理ユニットで処理され、そ
の他の文はスカラ処理ユニットで処理される。

第１３図は、第１２図のＦＯＲＴＲＡＮプログラム（ソ
ースプログラム）に対応するオブジェクトプログラム（
目的プログラム）で、コンパイラにより生成される。オ
ブジェクトプログラムは、スカラ処理ユニットで実行さ
れるスカラオブジェクト（第１３図（ａ））と、ベクト
ル処理ユニットで実行されるベクトルオブジェクト（第
１３図（ｂ）とから成る。

第１３図（ａ）のスカラオブジェクトにおいて、スカラ
命令ＩＤがＳｌからＳｌｌの１１命令はベクトル処理前
の準備処理に関するものである。このうち、Ｓ２からＳ
ｌｌの１０命令は、第１２図のプログラムにある配列Ａ
、Ｂ、Ｃ，Ｐ、Ｑのアドレス情報をベクトル処理ユニッ
ト内のベクトルベースレジスタ（ＶＢＲ）、ベクトルイ
ンクリメントレジスタ（ＶＩＲ）にセットするものであ
る。

また、Ｓｌの命令は第１２図のプログラムの変数Ｓの初
期値０．０をベクトル処理ユニット内のスカラレジスタ
にセットするものである。スカラ命令ＩＤが３１２の命
令はベクトル処理ユニットを起動する命令であり、第１
３図（ｂ）に示したベクトルオブジェクトが格納されて
いる主記憶のアドレスなどを通知してベクトル処理ユニ
ットを起動する（詳細は略す）。これにより、ベクトル
処理ユニットは第１３図（ｂ）に示したベクトルオブジ
ェクトにある命令を順次実行する。

スカラ命令ＩＤが８１３の命令は、ベクトル処理ユニッ
トが動作中かあるいは非動作中かをテストし、結果を条
件コードに反映させる命令（Ｔｅａｔ　Ｖ　ｅｃｔｏｒ
　Ｐ　ｒｏｃｅｓｓｉｎｇ命令）である。ベクトル処理
ユニットが動作中ならば、起動したベクトル処理が未だ
完了していないということで、Ｓ１４のＢＣ命令（Ｂ　
ｒａｎｃｈ　ｏｎ　Ｃｏｎｄｉｔｉｏｎ命令）で８１３
と３１４をループし、ベクトル処理の完了を待つ。ベク
トル処理ユニットの実行が終了すると、スカラ処理ＩＤ
の８１５が実行されて、ベクトル処理ユニット内のスカ
ラレジスタ０番に求まっている総和演算結果（第１２図
のプログラムの変数Ｓ）がスカラ処理ユニット内の浮動
小数点レジスタ０番に取出されて後続の演算（第１２図
のプログラムの文識別番号７）に使用される。

【発明が解決しようとする課題〕

第１１図に示したスカラ処理ユニットとベクトル処理ユ
ニットとの同期、通信を行うために用意されている従来
の命令では、次のような問題がある。

ベクトル処理ユニットで計算された結果をスカラ処理ユ
ニットで参照する場合、スカラ処理ユニットではベクト
ル処理ユニットが結果を書込んだかどうかをテストする
必要があるが、スカラ処理ユニットはベクトル処理ユニ
ットが動作中か非動作中かのいずれの状態にあるかしか
チエツクできない。したがって、先に示した第１３図の
例では、ベクトル命令ｖ４で配列Ａの総和演算結果が求
まっているもか＼わらず、ベクトル命令ｖ５〜■８がす
べて完了するまでスカラ処理ユニットで値を参照するこ
とができない。

このように、従来のコンパイラ方式においては、生成さ
れたスカラオブジェクトとベクトルオブジェクトの処理
を、スカラ処理ユニットとベクトル処理ユニットで各々
並列的に行う場合、両者の間で、ベクトル処理起動から
終了までの間はベクトル命令の実行状態を調べることが
できず、並列化効率の悪い処理となっていた。

本発明の目的は、上述のスカラ処理ユニットとベクトル
処理ユニットからなるベクトルプロセッサのように、主
と従の関係にある複数のプロセッサ間において、効率の
よい並列化処理を実現するコンパイラ方式を提供するこ
とにある。

〔課題を解決するための手段〕

上記目的を達成するため、本発明のコンパイラ方式にお
いては、ソースプログラムの中のベクトル化ループおよ
びそれ以外のスカラ部分を検出し、このベクトル化ルー
プとスカラ部分とのデータ依存関係を調べて並列化可能
部分及び並列化不可能部分に分離し、目的プログラム生
成の際、ベクトル化ループの中の並列化不可能部分の処
理完了を示す命令をベクトル命令群の中に挿入し、ベク
トル化ループの中の並列化不可能部分の処理が完了した
か否かをテストする命令をスカラ命令群の中に挿入する
ことを特徴とする。

〔作　用〕

二＼で、ベクトル処理ユニットで実行されているベクト
ル命令の完了をベクトル命令単位でスカラ処理ユニット
に通告する同期制御機能をシグナル機能と呼ぶことにす
る。

一般にプロセッサはプログラム状態語（ＰＳＷ）を有し
、当該プロセッサの動作状態や次命令のアドレス等の重
要な情報を集中保持している。第１０図に示したベクト
ル処理ユニットにおいてもＰＳＷが存在する。こ＼では
、ベクトル処理ユニットのＰＳＷを特にｖｐｐｓｗと呼
ぶことにする。

ｖｐｐｓｗの書式の詳細は本発明とは直接関係ないので
省略するが、シグナル機能を実現するために、ｖｐｐｓ
ｗに対して事象表示ビット（Ｓ　ｉｇｎａｌビット、Ｓ
ビットと略す）を追加する。本ビットは、指定されたベ
クトル処理ユニットにおける命令の処理が完了したとき
に“１″となるものとする。

ベクトル命令群の中に挿入される先の命令をＶＳｉＧ命
令と呼ぶことにする。本命令は、本命令の次に実行され
る命令の処理が完了したときに、ｖｐｐｓｗのＳビット
を“１″にする。一方、スカラ命令群の中に挿入される
先の命令をＴＲ８命令（Ｔｅｓｔ　＆　Ｒｅ５ｅｔ　５
−ｂｉｔ命令）と呼ぶことにする。本命令は、ｖｐｐｓ
ｗのＳビットをテストし、Ｓビットの値が“１″ならば
“０″にリセットして終了する。Ｓビットの値が“０″
であった場合は“１”になるまで待ち、（（１７１にな
ったら０″にリセットして終了する。

コンパイラでは、ソースプログラムの中のベクトル化ル
ープおよびその前後のスカラ部分における配列要素（ま
たは変数）の定義・参照関係を調べ、ベクトル処理ユニ
ットで計算された結果をスカラ処理ユニットで参照する
場合を検出する。そして、ベクトル処理ユニットで計算
された結果をスカラ処理ユニットで参照する場合、結果
を定義するベクトル命命の直前にＶＳｉＧ命令を設定し
、その値を参照するスカラ命令の直前にＴＲ８命令を設
定する。

このようにすることにより、第１３図の例では、ベクト
ル命令■４の直前にＶＳｉＧ命令、およびスカラ命令Ｓ
１３のかわりにＴＲ８命令が設定され、ベクトル命令ｖ
４の実行が完了した直後にスカラ命令Ｓ１５の実行が可
能となり、ベクトル命令ｖ５〜ｖ８とスカラ命令とは並
列化可能となる。

（実施例〕以下、本発明の一実施例を第１図乃至第９図を用いて説
明する。

第１図に本発明が適用されるコンパイラの一実施例の全
体構成図を示す。コンパイラ１はソースプログラム解析
部４、中間語最適化部５、ストレージ割付は部６．レジ
スタ割付は部７及び目的プログラム出力部８に大別され
る。

ソースプログラム解析部４は、大容量記憶装置２内のソ
ースプログラムを読込み、それを中間語表現（図示せず
）に変換する。中間語最適化部５は、中間語表現の構造
やデータ参照関係の解析を行い。実行効率のよう構造に
変換する。ストレージ割付は部６は、目的プログラムの
実行に必要な領域の割付けを行い、レジスタ割付は部７
は、汎用レジスタと浮動小数点レジスタの割当てを行う
。

目的プログラム出力部８は、機械命令語の列からなる目
的プログラムを大容量記憶装置３へ出力する。

こ＼で、中間語最適化部５は、制御フロー解析部１０、
データフロー解析部２０、ループ解析部３０、ベクトル
化ループ解析部４０、冗長性削除部５０及びスカラ・ベ
クトル並列化部６０よりなる。以下、これらについて詳
述する。

制御フロー解析部１０は、中間表現に対してその中の制
御の流れを解析し、条件構造やループ構造を見つける。

データフロー解析部２０は、変数の定義参照関係を解析
する。すなわち、ある変換に対して設定された値（定義
）が、他の場所でのその変数の使用（参照）まで引継が
れるものか否かを、制御フロー解析部１０での制御フロ
ー解析結果を利用して解析する。このデータフロー解析
部２０でデータ依頼テーブル３００が作成される。

ループ解析部３０は、制御フロー解析部１０で見つけた
ループ構造の各々について、データフロー解析部２０の
データフロー解析結果を用いて解析を行う。

ベクトル化ループ解析部４０は、中間語ループ構造をベ
クトル化向きの中間語ループ構造上に変換する。このと
きループ情報テーブル２００が作成される。

冗長性削除部５０は、共通式の削除や不用コードの削除
を行う。

スカラ・ベクトル並列化部６０は、データフロー解析部
２０の解析結果とベクトル化ループ解析部４０の解析結
果とを用いて、ベクトル化ループ外のスカラで実行され
る部分を、ベクトル化ループと並列に実行することがで
きる部分、および並列に実行できない部分に分離する。

本発明は、特にこの部分に係わる。

第２図はスカラ・ベクトル並列化部６０の詳細構成で、
並列化処理候補検出部６１、依存関係解析部６２、シグ
ナル機能利用処理部６３及び並列化可能部分分離部６４
よりなる。

並列化処理候補検出部６１は、ベクトル化ループ解析部
４０の作成したループ情報テーブル２００を入力し、ベ
クトル化ループに対して並列化処理の候補となる部分を
検出する。ループ情報テーブル２００の構成は、第４図
に示すように次の４つのフィールドからなる。

（１）ループ属性２１０ベクトル化ループかそうでないかを示す。

（２）親ループへのポインタ２２０（３）同レベルで直後のループへのポインタ２３０（４
）ループ構成ブロックリストへのポインタ該ループ制御
内のブロックを示し、ベクトル化対象となる所である。

二＼で、ブロックとは制御の流れる方向が変化しない部
分の集合である。

依存関係解析部６２は、データフロー解析部２０の作成
したデータ依存情報テーブル３００を入力し、ベクトル
化ループと並列化可能な部分を解析する。データ依存情
報テーブル３００の構成は第５図に示すように、参照エ
ントリテーブル、依存エントリテーブルの２つのテーブ
ルよりなり、各々次のフィールドからなる。

（ａ）　　参照エントリテーブル（１）依存エントリ°テーブルへのポインタ３１０（２
）参照エントリの属する文へのポインタ３２０（３）参
照点の種別３３０変数が定義されているか、参照されているかの種別を示
す。

（ｂ）　　依存エントリテーブル（１）依存種別３４０変数の定義・参照チエイン、参照・定義チエインの種別
を示す。

（２）参照エントリテーブルへのポインタ３５０定義さ
れた変数がどの文で参照されているか、あるいは参照さ
れた変数がどの文で定義されているかを示す。

シグナル機能利用処理部６３は、本発明の中心をなす多
部分であり、データフロー解析部２０の作成したデータ
依存情報テーブル３００とベクトル化ループ解析部４０
の作成した中間語ループ構造１００とを用いて、ベクト
ル化ループに対して並列化処理の候補とするスカラ部分
において、シグナル機能が適用できる部分を検出する。

並列化可能部分分離部６４は、依存関係解析部６２でベ
クトル化ループと並列化可能であると検出された文と並
列化可能部分との間に並列化不可能な文がある場合、文
と文とを結んでいるチエインを張替えることにより、並
列化可能であると検出された文を並列化不可能部分の前
に移動する。

第３図はシグナル機能利用処理部６３の処理フローを示
したものである。

まず、ベクトル化ループに対して並列化処理候補となる
スカラ部分に含まれる文（Ｓｉ）内の変数の依存種別を
調べる（処理６３１）。第６図はこれを説明する図であ
る。

次に、文（Ｓｉ）内の変数の依存種別が使用（ｕ）され
ており、その変数の依存光がベクトル化ループを示し、
ベクトル化ループ内の文＜Ｖｊ＞で定義（ｄ）されてい
る場合、その定義（ｄ）の直前にＶＳｉＧ命令を設定す
る（処理６３２）。

第７図はこれを説明する図である。

次に、上記スカラ部分における使用（ｕ）の直前にＴＲ
３命令を設定する（処理６３３）。第８図はこれを説明
する図である。

以上の処理を行うことによって、第９図に示すように文
＜Ｖｊ＞の実行完了後、ベクトル化ループのベクトル部
分（ｖ２）とスカラ部分（Ｓ２）とは並列に実行するこ
とが可能となる。

以上、本発明の一実施例を説明したが、本実施例によれ
ば、ベクトル化ループと並列実行可能なスカラ部分を拡
大することができる。この結果、スカラ処理ユニットと
ベクトル処理ユニットとの並列化効率を向上することが
でき、目的プログラムの実行時間を短縮することが出来
る。

〔発明の効果〕

以上説明したように、本発明のコンパイラ方式によれば
、生成された目的プログラムは、ベクトル化ループ外の
スカラ部分において、ベクトル化ループと並列実行可能
なスカラ部分を拡大することができるので、スカラ処理
ユニットとベクトル処理ユニットとの並列化効率を向上
することができ、目的プログラムの実行時間を短縮する
ことができるという効果がある。

【図面の簡単な説明】

第１図は本発明の適用されるコンパイラの一実施例の全
体構成図、第２図は第１図におけるスカラ・ベクトル並
列化部の詳細構成図、第３図は第２図におけるシグナル
機能利用処理部の処理フロー図、第４図は第１図のベク
トル化ループ解析部で生成されるループ情報テーブルの
一例を示す図、第５図は第１図のデータフロー解析部で
生成されるデータ依存情報テーブルの一例を示す図、第
６図乃至第９図はシグナル機能利用処理部の処理を説明
する図、第１０図はベクトルプロセッサの構成例を示す
図、第１１図乃至第１３図は従来技術を説明する図であ
る。１°°・コンパイラ構成、　　２・・・ソースプログラ
ム、３・・・目的プログラム、　４・・・ソースプログ
ラム解析部、　５・・・中間語最適化部、６・・・ストレージ割付は部、　　７・・・レジスタ割
付は部、　８・・・目的プログラム出方部、６０・・・
スカラ・ベクトル並列化部、６１・・・並列化処理候補
検出部、６２・・・依存関係解析部、　６３・・・シグナル機能
利用処理部、　６４・・・並列化可能部分分離部。第　　１　　図第２図第　　６　　図００２０　　Ｋｍｌ、　　Ｎ乏１０　　Ｃ０ＮＴＩＮＬＩＥ２０　ＣｏＮＴＬＮｕＥ第　　７　　図りＴＯＣｏＮ７１ＮＬＩＥ２０　　ＣｏＮＴＩＮｕＥりＳｉ　ン＜Ｖ３＞ン１ｏ　ＣｏＮＴＩＮＬＩＥ２０　ＣｏＮＴＩＮｕＥ２０　　ＣＯＮＴＩＮｔＪＥ第１０図文鐵゛プリ戸己３１　　　　　　　　Ｓ２　　　　　　　　　Ｄ。３　　　　　　　ＡＰｆＯＣｏＮ７　　　　　　　Ｘ＝二〇、０１０　Ｉ　＝　１．　１００（Ｅ）　＝　８（Ｉ、）　十〇（Ｉ）＝ＳｔＡ（１）ＣＩ）＝Ｓ本Ｑ（１）丁ＩＮｔＪＥＩＳ＋ｚスカライ虻々　　　　　　４卜やより本末　ＳｌコＺントフ１−肛ＶホＴ ζ　；　ン象勤、ＩＩ数！、レジ゛スタ（：　人ηう゛
レジ゛スク

Claims

【特許請求の範囲】

（１）ソースプログラムを解析し、スカラ処理ユニット
とベクトル処理ユニットとで並列処理を可能とする目的
プログラムを生成するコンパイラ方式において、ソースプログラムの中のベクトル化ループおよびそれ以
外のスカラ部分を検出し、前記ベクトル化ループとスカラ部分とのデータ依存関係
を調べ、並列化可能部分及び並列化不可能部分に分離し
、目的プログラム生成の際、ベクトル化ループの中の並列
化不可能部分の処理完了を示す命令をベクトル命令群の
中に挿入し、ベクトル化ループの中の並列化不可能部分
の処理が完了したか否かをテストする命令をスカラ命令
群の中に挿入することを特徴とするコンパイラ方式。