JPS62206668A

JPS62206668A - 目的プログラムの並列化処理方式

Info

Publication number: JPS62206668A
Application number: JP4839786A
Authority: JP
Inventors: Eiji Nunohiro; 布広　永示; Shigemi Yamada; 山田　重巳; Akio Aoyama; 青山　明夫; Giichi Tanaka; 義一田中; Shinobu Sato; 忍佐藤
Original assignee: Hitachi Software Engineering Co Ltd; Hitachi Ltd
Current assignee: Hitachi Software Engineering Co Ltd; Hitachi Ltd
Priority date: 1986-03-07
Filing date: 1986-03-07
Publication date: 1987-09-11
Also published as: JPH0514300B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、ソースプログラムを解析して実行効率のよい
目的プログラムを生成するコンパイラ方式に係り、特に
ベクトル化ループと並列実行可能なスカラ部分を検出し
、スカラプロセサ・ベクトルプロセサの並列化効率のよ
い目的プログラムを生成するのに好適なコンパイラ方式
に関する。

〔従来の技術〕

スーパーコンピュータにおいて、演算器はスカラプロセ
サとベクトルプロセサとで構成されている。そしてハー
ドウェア上では、スカラプロセサとベクトルプロセサと
は並列に動作することが出来る１文献「スーパーコンピ
ュータＨＩＴＡＣ３−８１０，ＦＯＲＴＲＡＮ　　コン
パイラ“ＶＯ５３ＦＯＲＴ７７／ＨＡＰＪ日立評論　第
６５巻８号（１９８３）の第５５１頁から第５５５頁で
は、並列化のためにＥ　Ｘ　Ｖ　Ｐ　（ｅｘｅｃｕｔｅ
　ｖｅｃｔｏｒ　ｐｒｏｃｅｓｓｉｎｇ）命令とＴ　Ｖ
　Ｐ　（ｔｅｓｔ　ｖｅｃｔｏｒ　ｐｒｏｃｅｓｓｉｎ
ｇ）命令（準備命令）とがあり、ある目次のべクトル命
令の実行と、その次のベクトル命令に対する準備命令と
を並列に実行できることがあると記されている。ここに
、準備命令とはベクトルプロセサ用のレジスタ群への初
期設定を行うための命令群のことである。

〔発明が解決しようとする問題点〕

上記従来技術は、スカシ部分とベクトル化ループとの並
列化を行う場合−ベクトル処理と準備命令による処理と
の並列化に限られていた。

本発明の目的は、ベクトル化ループの外にある準備命令
以外のスカシ部分の中に、ベクトル化ループと並列実行
可能な部分がある場合、スカシ部分を並列化可能部分と
並列化不可能部分とに分離し、並列化可能部のスカシプ
ロセサでの実行とベクトル化ループのベクトルプロセサ
での実行とを並列に動作させることができる目的プログ
ラムを生成することである。

〔問題点を解決するための手段〕１　　上記目的は、コンパイラにおいて、（１）並列化
処理の候補となるスカシ部分を検出する並列化処理候補
検出手段、（２）ベクトル化ループ外のスカシ部分とベ
クトル化ループとのデータ依存関係を調べる依存関係解
析手段、（３）上記スカシ部分をベクトル化ループ並列
化可能な部分と不可能な部分とに分離する並列化可能部
分分離手段からなるスカシ・ベクトル並列化機能を設け
ることによって達成される。

［作用〕スカシ・ベクトル並列化部は、ソースプログラム中のベ
クトル化ループおよびその前後のスカシ部分に対して動
作する。スカシ・ベクトル並列化部の中の各構成要素は
以下のように動作する。

（１）並列化処理候補検出手段は、ベクトル化ループに
対して並列化処理の候補となるスカシ部分を検出する。

（２）依存関係解析手段は、ベクトル化ループと上記で
検出されたスカシ部分との間のデータ依存関係を調べ、
並列化可能な部分を抽出する。

（３）並列化可能部分分離手段は、スカシ部分を構成す
る文の中で、上記で抽出された並列化可能な部分の移動
を行い、並列化可能部分と並列化不可能部分とに分離し
、並列化可能部分のスカシプロセサでの実行とベクトル
化ループのベクトルプロセサでの実行を並列に動作させ
ることができる目的プログラムを生成する。

〔実施例〕

以下１本発明の実施例を、第１図から第８図を用いて説
明する。

第３図に、本発明が適用されたコンパイラの構成を示す
、コンパイラ１は次のよ、うに動作する。

ソース・プログラム解析部４は、大容量記憶装置２内の
ソース・プログラムを読み込み、それを中間語表現（図
示せず）に変換する。

中間語ループ構造１００はここで出力される。

中間語ループ構造は第１０図に示すように次の３つの部
分からなる。

（１）ループヘッダ　　　１１０ループ長の設定を行う部分。

（２）ループ本体　　　　１２０ループ内の実行対象となるプログラムの実行を行う部分
。

（３）ループエンド　　　１３０ループ制御変数の更新、ループ終了判定を行う部分。

中間語最適化部５は、中間語表現の構造やデータ参照関
係の解析を行い、実行効率のよい構造に変換する。この
詳細は後述する。

ストレージ割付は部６は、目的プログラムの実行に必要
な領域の割付けを行い、レジスタ割付は部７は、汎用レ
ジスタと浮動小数点レジスタの割当てを行う、目的プロ
グラム出力部８は、機械命令語の列からなる目的プログ
ラムを大容量記憶装置３へ出力する。

中間語最適化部５の構成と動作を次に説明する。

制御フロー解析部１０は、中間語表現に対してその中の
制御の流れを解析し、条件構造やループ構造を見つける
。

ロック：他のブロックへの処理の移りや他からの戻りが
ないもの）かつ、ループを抽出する。

データフロー解析部２０は、変数の定義参照関係を解析
する。すなわち、ある変数に対して設定された値（定義
）が、他の場所でのその変数の使用（参照）まで引き継
がれるものか否かを、上記制御フロー解析結果を利用し
て解析する。

そしてデータ依存情報テーブル３００を作成する。この
構成については第６図により後で詳述する。

ループ解析部３０は、制御フロー解析部１０で見つけた
ループ構造の各々について、データフロー解析部２０の
結果を用いて解析を行う。

ベクトル化ループ解析部４０は、中間語ループ構造をベ
クトル化向きの中間語ループ構造に変換する。

そして各ループに対応してループ情報テーブル２００を
作る。

この構成については第４図により後で詳述する。

冗長性削除部５０は、共通式の削除や不用コードの削除
を行う。

スカシ・ベクトル並列化部６０は、本発明の適用される
部分であり、データフロー解析部２ｏの解析結果とベク
トル化ループ解析部４０の解析結果とを用いて、ベクト
ル化ループ外のスカシで実行される部分を、ベクトル化
ループと並列に実行することができる部分とできない部
分とに分離し。

並列化可能部のスカシプロセサでの実行とベクトル化ル
ープのベクトルプロセサでの実行とを並列に動作させる
ことができる目的プログラムを生成する。

次に、本発明が適用されるスカシ・ベクトル並列化部の
構成を第１図に、各構成部の動作を第２図に示す。この
処理は先に検出されたループのそれぞれについて繰り返
して実行されるものであり、そのループ近傍のスカラ部
が並行処理できるかどうかを求める。

並列化処理候補検出部６１は、第２図６４に示す如く、
ベクトル化ループ解析部４０の作成した処理対象のルー
プ情報テーブル２００を入力し。

親ループへのポインタ２２０、同レベルで直後のループ
へのポインタ２３０そしてループ構成ブロックリストへ
のポインタ２４０とを用いて、各ベクトル化ループに対
して並列化処理の候補となる部分を検出する。ここに、
ループ情報テーブル２００の構成は第４図に示すように
次の４つのフィールドからなる。

（１）ループ属性　２１０ベクトル化ループかそうでないかを示す。

（２）親ループへのポインタ　２２０該ループ制御内のブロックを示し、ベクトル化対象とな
る所である。ここで、ブロックとは制御の流れる方向が
変化しない部分の集合である。

並列化処理候補検出部６１は、該ループ情報テーブル２
００のループ属性２１０により、該ループがベクトル化
ループであるか否かを認識し、ベクトル化ループである
場合、以下の処理を行う。

即ち、該ループ情報テーブル２００の中の同レベルで直
後のループへのポインタ２３０により、直後のループへ
のポインタがｎ１ｌ（次へのポインタがない意）でない
場合、並列ループが存在すると認識し、並列ループが存
在すると認識すると、第５図（Ａ）のように並列化処理
の候補となるスカシ部分を検出する。

また、直後のループへのポインタがｎｉｌである（並列
ループが存在しない）場合、親ループへのポインタがｎ
ｉｌでないと親ループが存在すると認識し、第５図（Ｂ
）のように並列化処理の候補となるスカシ部分を検出す
る。

検出方法と並列化処理候補部分を第５図を用いて以下に
説明する。ここで、第５図において、ループ構成ブロッ
ク巳は、ベクトル化ループ（Ｖ）で実行する実行部分を
有するブロックで構成されており、第１０図においてル
ープ本体に対応する。並列化処理候補部分のブロック＝
コはベクトル化ループ内の構成ブロック以外のプロッり
であり、スカラ部分を示す。

簡単のため、第５図（Ｂ）では二重ループの場合を挙げ
たが、三重ループ以上の場合の処理に関しては並列化処
理における並列化効率の向上はほとんどないので、三重
ループ以上の場合、最内側の二重ループのみ処理する。

第５図（Ａ）の場合、並列化処理の候補となるスカラ部
分として、ループ構成ブロック２４０の直後のブロック
２０１から検出を始め、同レベルで直後のループへのポ
インタの指すループ情報テーブルのループ構成ブロック
の直前のブロック２０２までを検出する。そして、その
範囲内のブロックを全て並列化処理候補部分とする。第
５図（Ｂ）の場合、並列化処理の候補となるスカラ部分
として２箇所を調べる。１つは、ループ構成ブロック２
４０の直後のブロック２０３から親ループへのポインタ
２２０の指すループ情報テーブルのループ構成ブロック
の最後のブロック２０４までであり、もう一つは、親火
−プへのポインタ２２０の指すループ情報テーブルのル
ープ構成ブロックの最初のブロック２０５から、ループ
構成ブロック２４０の直前のブロック２０６までである
。そして、２つの部分の範囲内のブロックを全て並列化
処理候補部分とする。

以上がステップ６４における処理である。

依存関係解析部６２は、第２図６５に示した如く、デー
タフロー解析部２０の作成したデータ依存情報テーブル
３００を入力し、該ベクトル化ループと並列化可能な部
分を解析する。ここに、データ依存情報テーブル３００
の構成は第６図に示すように、参照エントリテーブル、
依存エントリテーブルの２つのテーブルより成り、各々
次のフィールドからなる。

（ａ）参照エントリテーブル（１）依存エントリテーブルへのポインタ（２）参照エ
ントリの属する文へのポインタ（３）参照点の種別　　
３３０変数が定数されているか、参照されているかの種別を示
す。

（ｂ）依存エントリテーブル（１）依存種別　　３４０変数の定義・参照チェイン、参照・定義チェインの種別
を示す。

（２）参照エントリテーブルへのポインタ定義された変
数がどの文で参照されているか、あるいは参照された変
数がどの文で定義されているかを示す。

ここで、参照エントリは、任意の変数ごとに、各変数が
定義、参照されている文に対してチェインが張られる。

また、依存エントリは、任意の変数に対する参照エント
リごとに、各参照エントリでの定義、参照と依存関係を
持つ参照エントリに対してチェインが張られる。

プログラム中で使用されているすべての変数について、
それぞれに参照エントリテーブルと依存エントリテーブ
ルが作成されている。

そして、各変数には参照エントリテーブルへのポインタ
が作られている。ある参照エントリテーブルがポイント
されると、その依存エントリテーブルへのポインタ３１
０から依存エントリテーブルの１つが参照される。ここ
には他の参照エントリテーブルへのポインタ３５０があ
り、これによって参照エントリテーブルが調べられる。

参照エントリテーブルにはその参照エントリの属する文
へのポインタ３２０があり、図示されていない文とその
文が所属するループの対応が記載されているテーブルが
検索され、その文の属するループが分かる。

従って、スカラ部分のある変数から第６図によって上記
の処理を行い、それに関係するループ名を調べ、そのル
ープ名がいま第２図の処理を行っているループと違って
いればその変数に関しては独立に並行して処理が可能で
ある。並行処理候補のスカラ部のすべての変数について
同様に第２図の処理中のループと関係ないことが分かれ
ばそのスカラ部は並行処理可能なものと判定される。

依存関係解析部６２は、データ依存情報テーブル３００
を利用して、並列化処理対象部分に含まれる変数に対し
てベクトル化ループ内の変数との依存関係を検出し、変
数の属する文がベクトル化ループと並列化可能であるか
を調べる。すなわち。

第７図（Ａ）に示す二重ループの場合１次の２つのどち
らの条件が成立するのかの解析を行う。第７図（Ａ）は
第５図（Ｂ）の１例である。

（１）並列化処理候補部分に含まれる文（Ｓｉ）内の変
数の依存種別が定義（ｄ）であり（定義（ｄ）とは文Ｓ
ｉで代入されている文の左辺に当たるという意である。

）その変数の依存チェインがベクトル化ループを示し、
ループ内の文（Ｖｉ）で参照（ｕ）されている場合（第
８図（Ａ）参照）。

（２）並列化処理候補部分に含まれる文（Ｓｉ）内の変
数の依存種別が使用（ｕ）されており、その変数の依存
チェインがベクトル化ループを示し。

ループ内の文（Ｖ　ｉ　）で定義（ｄ）されている場合
（第８図（Ｂ）参照）。

次に（１）、　（２）に対して並列化可能か否かを調べ
る。その条件をそれぞれ（ａ）、（ｂ）に示す。

（ａ）　（１）の場合、文（Ｓｉ）で定義される変数が
。

文（Ｖｉ）で使用された後に文（Ｓｉ）で定義され、か
つ、（Ｓ　ｉ）より前の並列化不可能な部分で使用され
ない時１文（Ｓｉ）は並列化できる。

（ｂ）　（２）の場合、文（Ｓｉ）で使用される変数が
、文（Ｖｉ）で定義された後に文（Ｓｉ）で使用され、
かつ、（Ｓｉ）より前の並列化不可能な部分で定義され
ない時、文（Ｓｉ）は並列化できる。

第７図（Ａ）に示した以外の二重ループあるいは並列ル
ープの場合も同様に考えることが出来る。

並列化可能部分分離部６３は、第２図６６に示す如く、
依存関係解析部でベクトル化ループと並列化可能である
と検出された文と並列化可能部分との間に並列化不可能
な文がある場合、文と文とを結んでいるチェインを張り
替えることにより、並列化可能であると検出された文を
並列化不可能部分の前に移動する。即ち、第７図（Ａ）
において、文くＳ□＞　、　＜８３＞　、　＜ｓｓ＞　
　がベクトル化ループと並列化可能である場合における
並列化可能部分分離部の動作は第９図のようになる。第
７図（Ｂ）に文の移動を行い、並列化可能部分と並列化
不可能部分を分離した結果を示す。

以上、本発明の一実施例を説明した。本実施例によれば
、ベクトル化ループ外のスカシ部分を、ベクトル化ルー
プと並列に実行することが可能である並列化可能部分と
不可能である並列化不可能部分とに分離できる。この結
果、スカシプロセサとベクトルプロセサとの並列化効率
を向上することができ、目的プログラムの実行時間を短
縮することが可能となる。

〔発明の効果〕

本発明によれば、ベクトル化ループ外のスカシ部分を、
ベクトル化ループと並列化可能な部分と並列化不可能な
部分に分離することができるので。

スカシプロセサとベクトルプロセサとの並列化効率を向
上することができ、目的プログラムの実行時間を短縮す
ることができるという効果がある。

【図面の簡単な説明】

第１図は本発明の技術手段であるスカシ・ベクトル並列
化部の構成図、第２図はスカシ・ベクトル並列化部の処
理の流れ図、第３図は本発明の適用されるコンパイラの
全体構成図、第４図はループ情報テーブル、第５図は並
列化処理候補検出方法の説明図、第６図はデータ依存情
報テーブル。第７図は並列化可能部分分離結果の説明図、第８図は依
存関係解析方法の説明図、第９図は並列化可能部分分離
動作の説明図、第１０図は中間語ループ構造の詳細図。１・・・コンパイラ構成、２・・・大容量記憶装置内の
ソースプログラム、３・・・大容量記憶装置内の目的プ
ログラム、４・・・ソースプログラム解析部、５・・・
中間語最適化部、６・・・ストレージ割付は部、７・・
・レジスタ割付は部、８・・・目的プログラム出力部。６ｏ・・・スカシ・ベクトル並列化部、６１・・・並列
処理候補検出部、６２・・・依存関係解析部、６３・・
・並列化可能部分分離部。躬　３国第４０躬５の第　６犯躬　ｑ　国（Ａ　）　　　　　　　　　　　　　　　　　　　（Ｂ
）ロ：笠ｆ’囮匙理候孫舒介　　　　　　　ロニ１デｊ
化可北郁令躬　８国（Ａ）　　　　　　　　　　　　　　　　　　ＣＢ）ｏ
ｓ　ｚｏ　Ｋｅｔ、　Ｎ　　　　　　　　　　　ｏｙ　
ｚｏ　ｘ＝１．　ＨＤドｌＯＬ＝ＬＮ　　　　　　　　
　　　　　０６１０　Ｌ＝ＬＮ７０　Ｃ３ＮＴＬＮυＥ
　　　　　　　　　　　！ＯＱ５ＮＴＩＮＩｎ２ｏ　Ｃ
３ＮＴ工ＮＵＥ　　　　　　　　　　　　２ｏ　Ｃ３ｒ
ｒｒｘＮＵＥ第　９閃

Claims

【特許請求の範囲】

１、スカラプロセサとベクトルプロセサとが並列に動作
することが出来るスカラプロセサとベクトルプロセサか
らなる計算機システムにおいて動作する目的プログラム
を生成するコンパイラであり、かつ与えられたソースプ
ログラムを解析し配列要素（または変数）の値の定義・
参照関係を示したループ依存関係の検出を行うコンパイ
ラにおいて、並列化処理の候補となるスカラ部分を検出
し、ベクトル化ループ内の配列要素（または変数）とス
カラ部内の配列要素（または変数）とのデータ依存関係
を調べ、上記スカラ部分を、ベクトル化ループ部分と並
列に実行できる並列化可能部分とベクトル化ループ部分
と並列に実行できない並列化不可能部分とに分離するこ
とを特徴とする目的プログラムの並列化処理方式。