JPH07152576A

JPH07152576A - アレイ関数をもつプログラミング言語におけるインライン展開方法

Info

Publication number: JPH07152576A
Application number: JP5296269A
Authority: JP
Inventors: Hideaki Komatsu; 秀昭小松
Original assignee: IBM Japan Ltd
Current assignee: IBM Japan Ltd
Priority date: 1993-11-26
Filing date: 1993-11-26
Publication date: 1995-06-16
Anticipated expiration: 2013-09-10
Also published as: US5640568A; JP2794523B2

Abstract

(57)【要約】【目的】ＡＰＬやＦＯＲＴＲＡＮ９０などのアレイ関
数をもつプログラミング言語において、アレイ関数や配
列演算の複合した様々な式に対して、個別のテンプレー
トあるいはマクロを用意することなく、汎用的に適用可
能なインライン展開方法を提供すること。【構成】本発明によれば、次の手順で、ＴＩＦ（組み
込みアレイ変換関数）をインライン展開する手順は以下
のようになる。 (1) ＴＩＦを仮想配列化する。この際に、ＴＩＦをマク
ロ拡張し、実配列へのマッピングを生成する。 (2) 仮想配列のままインライン展開する。 (3) 仮想配列を実際の配列に逆変換する。本発明の方法は、コンパイル時にＴＩＦ式を解析して、
インライン展開のためのテンプレートを生成する。この
インライン展開のテンプレートが実配列へのマッピング
であり、これを生成する際にマクロ処理を用いる。この
方法によれば、マクロ・テンプレートはＴＩＦ１つに対
して１つ用意するだけで、任意の組み合わせのＴＩＦを
インライン展開できる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は、一般的にはコンパイ
ラの最適化方法に関し、より詳しくは、ＡＰＬ、ＦＯＲ
ＴＲＡＮ９０などのような、アレイ操作関数を有するプ
ログラミング言語におけるインライン展開方法に関す
る。

【０００２】

【従来の技術】一般的なプログラミング言語は、操作対
照がスカラ変数であろうと、配列や構造体であろうと、
それらの要素のデータ（単一な値を持つ）を操作するこ
とによって記述される。これに対し、ＡＰＬやＦＯＲＴ
ＲＡＮ９０などでは、配列の１要素だけでなく、配列全
体の操作を記述することができる。以下にＦＯＲＴＲＡ
Ｎ９０におけるスカラによる表現、及びそれと同一のア
レイ表現を示す。

【０００３】スカラ表現による配列の処理

【数１】

【０００４】アレイ表現による配列の処理

【数２】A(10:90) = B(11:91)

【０００５】このアレイ表現を用いることの利点は、以
下の２点である。・操作を簡略かつ論理的に記述することができる。・処理の持つ並列性を自然に記述することができる。

【０００６】前者の利点によって、プログラムの記述お
よび解読が容易になる。さらに、後者の利点によって、
ベクトル計算機や、並列計算機のように、並列処理が可
能な計算機にとって、プログラムをより並列化する機会
を与えるものである。

【０００７】一般的な並列処理の機能を持っていないス
カラ・プロセッサでは、並列化のメリットは得られな
い。さらに、スカラ処理のためにプログラムの変換を行
わないと効率が悪くなる場合がある。このアレイ表現で
記述されたプログラムをスカラ・プロセッサで効率的に
なるよう変換することをスカラー化（Scalarize）と呼
ぶ。

【０００８】スカラー化の最適化は以下のように分類さ
れる。（１）組み込み関数（Intrinsic Functions）のインラ
イン展開（２）アレイ・テンポラリの削減（３）ループの効率化

【０００９】（１）の組み込み関数のインライン展開
は、既存のコンパイラでも行われている最適化であり、
サブルーチンを呼ぶ代わりにインライン展開されたコー
ドを実行することで高速化を図るものである。

【００１０】（２）アレイ・テンポラリの削減に関し
て、アレイ表現を単純にスカラライズすると、式の右辺
のアレイ値を記憶しておくためのアレイ・テンポラリが
必要になる。依存性を解析して、ループを反転させるこ
とによって、このアレイ・テンポラリを削減することが
可能となる。その例を以下に示す。

【００１１】もとのアレイ表現

【数３】A(10:90) = A(1:81) - B(10:90)

【００１２】単純にスカラー化されたコード

【数４】 DO I=10,90 T(I) = A(I-9) - B(I) ここでアレイ・テンポラリに代入 END DO DO I=10,90 A(I) = T(I) 本来のアレイに代入 END DO

【００１３】ループ反転によるアレイ・テンポラリの削
減

【数５】

【００１４】（３）のループの効率化は複数のアレイ表
現を１つのループで実行することによって、ループのオ
ーバーヘッドを削減するものである。

【００１５】これらの３つの最適化のうちもっとも効果
の高いのが、組み込み関数のインライン展開である。通
常の組み込み関数に加えてＦＯＲＴＲＡＮ９０などのア
レイ表現をサポートする言語では、組み込み変換関数
（Transformational Intrinsic Functions：ＴＩＦ）や
組み込み簡約関数（Reduction Intrinsic Functions：
ＲＩＦ）などのインライン展開が必要である。ＴＩＦは
シフト、回転、転置、拡大、マージ、パックなどのアレ
イの変換を行うものであり、ＲＩＦはアレイを入力とし
て合計、最大、最少、カウントなどのスカラ値を返すも
のである。以下に、組み込み関数のインライン展開の例
を示す。

【００１６】このプログラムはまず、配列Ｂを３次元方
向に拡張し、１０×１００×２００の配列を生成する。
また、配列Ｃを２次元方向に拡張し、同じサイズの３次
元配列を生成する。これらの加算を求め、それを１次元
方向に合計を求め２次元配列（サイズは１００×２００
となる）を生成し、配列Ａに代入する。

【００１７】このプログラムを単純に変換すると、３つ
の３次元のテンポラリ配列が必要となる。一方、最適に
インライン展開されたプログラムでは、これらのテンポ
ラリがまったく必要なくなるため、メモリの使用量が劇
的に少なくなる。さらに、非常に多くのデータの複写が
削減されるため、かなりの高速化が見込まれる。

【００１８】ソースプログラム：

【数６】 A(1:100,1:200) = SUM( SPREAD( B(1:10,1:100), 3, 200 ) + SPREAD( C(1:10,1:200), 2, 100 ), 1 )

【００１９】単純に変換したプログラム：

【数７】 T1(1:10,1:100,1:200) = SPREAD( B(1:10,1:100), 3, 200 ) T2(1:10,1:100,1:200) = SPREAD( C(1:10,1:200), 2, 100 ) T3(1:10,1:100,1:200) = T1(1:10,1:100,1:200) + T2(1:10,1:100,1:200) A(1:100,1:200) = SUM( T2(1:10, 1:100, 1:200), 1 )

【００２０】最適にインライン変換されたプログラム：

【数８】

【００２１】ここで、SUM、SPREADは、ＦＯＲＴＲＡＮ
９０の組み込み関数であり、次のような意味をもつ。

【００２２】先ず、SPREADは、SPREAD( SOURCE, DIM, N
COPIES ) という形式であり、SOURCEで指定された配列
のDIM次元のNCOPYの分だけコピーして、次元拡張した配
列を作るものである。例えば、上記の例で、T1(1:10,1:
100,1:200) = SPREAD( B(1:10,1:100), 3, 200 )という
式は、B(1:10,1:100)という配列の第３の次元を拡張し
て２００個のコピーを行い、T1(1:10,1:100,1:200)とい
う配列を作るものであるが、その結果、i=1〜10,j=1〜1
00,k=1〜200の範囲で、T1(i,j,k)は、B(i,j)と同じ値を
もつことになる。一方、T2(1:10,1:100,1:200) = SPREA
D( C(1:10,1:200), 2, 100 )という式は、C(1:10,1:20
0)という配列の第２の次元を拡張して１００個のコピー
を行い、T2(1:10,1:100,1:200)という配列を作るもので
あるが、その結果、i=1〜10,j=1〜100,k=1〜200の範囲
で、T1(i,j,k)は、C(i,k)と同じ値をもつことになる。

【００２３】次に、SUMは、SUM( ARRAY, DIM, MASK )
という形式であり、ターゲットのARRAYのDIMで指定され
た次元のMASKが真になった要素の合計を求め、次元縮小
した配列を生成する。DIM, MASKは、オプションであ
り、何も指定しないと、ARRAY全体の要素の和を求め、
スカラの値を返す。例えば、上記の例で、A(1:100,1:20
0)= SUM( T2(1:10, 1:100, 1:200), 1 )は、配列 T2(1:
10, 1:100, 1:200)の１次元目の要素を合計し、その結
果、i=1〜100,j=1〜200の範囲で、A(i,j)には、T2(1,i,
j)+T2(2,i,j)+ … +T2(10,i,j)の値が格納される。

【００２４】ところで、これまでのインライン展開はイ
デオム認識（パターンマッチ）によるものがほとんどで
あった。この方式は、マッチング・テンプレートとその
展開型をそれぞれ用意し、テンプレートにマッチするも
のをその展開型で置換するものである。

【００２５】このパターンマッチ方式の欠点は、パター
ンとして登録パターンに登録されていないような記述
や、登録されているパターンを複合して記述するような
ものに対してインライン展開されたコードを生成できな
い点である。

【００２６】現実的には、すべてＴＩＦや配列に対する
演算の組み合わせをパターンとしてを登録しておくこと
は不可能である。

【００２７】これをある程度緩和するためにマクロ展開
方式がある。これは、マッチング・テンプレートの記述
に柔軟性を持たせ、かつ、展開型をプログラムによって
指定できる。この方式では、単純なパターンマッチによ
るものより、強力な記述が行なえるけれども、本質的な
問題点、すなわち、すべでのパターンを用意しなければ
ならないことを解決してはいない。

【００２８】特公昭６３−１９９０８号公報は、スカラ
配列化による並列処理化処理方式、特に、複数の並列演
算部を備えたベクトル処理プロセッサに対して、与えら
れたソース・プログラムから目的プログラムを生成する
コンパイラにおいて、単純変数をもつループに関して、
その単純変数についてループの入口と出口とにおけるビ
ジー状態を調べて分類を行い、その分類に基づいてそれ
ぞれの並列処理化のための処理を行うようにした、スカ
ラ配列化による並列化処理方式を開示する。しかし、こ
の刊行物には、配列演算の展開自体については、何も記
載されていない。

【００２９】

【発明が解決しようとする課題】この発明の目的は、組
み込み配列操作関数や配列演算の複合した様々な式に対
して、個別のテンプレートあるいはマクロを用意するこ
となく、汎用的に適用可能なインライン展開方法を提供
することにある。

【００３０】

【課題を解決するための手段】本発明は、ＴＩＦのテン
プレートマッチングやマクロ処理による置換でなく、プ
ログラムの意味を保持しながら統一的に処理する手法を
提供する。この技法によれば、統一的に処理するため、
いかなるＴＩＦ、ＲＩＦや配列演算の複合した式であっ
ても、最適なインライン展開が可能ならしめられる。

【００３１】本発明では、ＴＩＦの式をインライン展開
としてコンパイルするために、ＴＩＦの式全体を仮想配
列として表現する。仮想配列は以下の情報より構成され
ている。

【００３２】・仮想的な次元数及び各インデックスの範
囲インライン展開されるＴＩＦ式全体の結果となるテンポ
ラリ配列の次元数とインックスの範囲を記述する。

【００３３】・仮想的な配列及びインデックスと実際の
配列及びインデックスのマッピング仮想配列が実際の配列のどのような式で実現されるかを
記述する。

【００３４】・仮想配列の表現式（ソースプログラム情
報）ソースプログラムにおけるＴＩＦ式の情報であり、イン
ライン展開ができない場合この情報によりＴＩＦに対応
するサブルーチンを呼び出すように変換される。

【００３５】ＴＩＦをインライン展開する手順は以下の
ようになる。 (1) ＴＩＦを仮想配列化する。 (2) 仮想配列のままインライン展開する。 (3) 仮想配列を実際の配列に逆変換する。まず最初に実行されるのが、(1)のＴＩＦの仮想配列化
である。この際に、ＴＩＦをマクロ拡張し、実配列への
マッピングを生成する。

【００３６】ユーザの記述全体をマクロ処理によってイ
ンライン展開する従来の方法と、本発明の方法が用いて
いるマクロ処理が決定的に異なっているのは、これまで
の方法が、あらかじめ様々なＴＩＦを組み合わせた、テ
ンプレートを用意するのに対し、本発明の方法では、コ
ンパイル時にＴＩＦ式を解析して、インライン展開のた
めのテンプレートを生成することである。このインライ
ン展開のテンプレートが実配列へのマッピングであり、
これを生成する際にマクロ処理を用いる。本方式では、
マクロ・テンプレートはＴＩＦ１つに対して１つ用意す
るだけで、任意の組み合わせのＴＩＦをインライン展開
できる。

【００３７】次に示す式は、仮想配列による SPREAD 関
数の単純な場合の変換例を示す。ここで $1 は仮想配列
の名前である。実配列へのマッピングの右側の式 A($$
1) はコンパイル時に生成されたマクロ・テンプレート
である。

【数９】 X(1:100,1:10) = SPREAD( A(1:100), 2 , 10 ) X(1:100,1:10) = $1(1:100, 1:10) （仮想配列の名前とサイズ） [ $1($$1,$$2) -> A($$1) ] （実配列へのマッピング） [ SPREAD( A(1:100), 2, 10 ) ]（ソースプログラム）

【００３８】次に、(2)の仮想配列のままのインライン
展開を行なう。仮想配列を単純な配列と見なして、実際
のループコードを生成する。このフェーズにおいてＲＩ
Ｆや配列演算子などはインライン展開される。次の式
は、上記式のプログラムを仮想配列のままインライン展
開したものである。

【数１０】

【００３９】最後に、(1) の段階で生成したテンプレー
トを用いて、インライン展開されたコードに含まれる仮
想配列を、実際の配列に対するマッピングに変換する。
図６のマクロ展開に示されるように、仮想配列は実際の
配列Ａへのアクセスに展開される。さらに、全体のプロ
グラムは以下のようになる。

【００４０】マクロ展開：

【数１１】$1(I1,I2) -> A(I1)

【００４１】インライン展開の結果：

【数１２】

【００４２】

【実施例】以下、プログラミング言語としてＦＯＲＴＲ
ＡＮ９０を使用するものとして説明を行う。尚、ＦＯＲ
ＴＲＡＮ９０自体のより詳しい仕様については、Jeanne
C. Adams et al. "FORTRAN90 HANDBOOK Complete ANS
I/ISO Reference", McGrawHill Inc.などに記載されて
いる。本発明の原理１．仮想配列先ず、用意する仮想配列の次元、及び、配列の開始及び
終了の数を決定する規則について説明する。

【００４３】仮想配列の次元およびそのインデックスの
値は、アレイ関数の動作と引数となっている配列によっ
て決定する。実際には、関数１つずつに仮想配列を生成
するプログラムを作成する必要がある。この機能は、・仮想配列の次元の決定・仮想配列と実配列のインデックスの対応・インデックスの正規化の３つである。

【００４４】例えば、SPREAD 関数は、次に示すよう
に、１次元だけ、次元拡張するため、引数の配列の次元
に１を足したものが仮想配列の次元となる。

【数１３】SPREAD( A(100:200), 2 , 10 )

【００４５】また、次元対応は、拡張される次元だけを
考慮すればよく、この拡張される次元が変数であった場
合は、このプログラムのインライン展開に失敗するの
で、インライン展開は行わない。その場合は、通常の関
数呼び出しが行われることになる。定数である場合は簡
単で、インライン展開が行われる。拡張次元までは、引
数のままであり、拡張次元以降は１加えたものとなる。

【００４６】この例の SPREAD 関数の引数は１次元配列
なので、仮想配列の次元は２となる。また、各次元のイ
ンデックスは、１を開始値とするように正規化するた
め、１次元目は 1:100 ２次元目は 1:10 である。

【００４７】このインデックスの正規化は、必ずしも必
要でないが、入れ子になった複雑なアレイ関数をループ
にまとめる際に、正規化しておいた方が効率的である。

【００４８】２．マクロ・テンプレートの生成マクロ・テンプレートは、入れ子になったアレイ関数の
内側から生成される。まず、もっとも内側の仮想配列と
マッピング（テンプレート）が生成される。次により外
側のテンプレートが生成される。この際に、外側のテン
プレートを内側のテンプレートをもちいて合成する。こ
の合成を外側にむかって再帰的に適用していくことによ
って、どのような入れ子構造のマクロ・テンプレートで
も、生成可能となる。

【００４９】アレイ関数が入れ子になっていなければ、
この仮想配列とマッピングはそのままマクロ・テンプレ
ートとなる。ここでは、アレイ関数 MERGE を用いて、
マクロ・テンプレートの生成の例を説明する。因に、ME
RGE の定義は、次のとおりである。

【数１４】MERGE( TSOURCE, ISOURCE, MASK )

【００５０】すなわち、２つの配列TSOURCE、ISOURCEを
マージして１つの配列を生成する。要素の値は対応する
MASK が真なら TSOURCE の要素の値となり、偽なら ISO
URCEの値となる。

【数１５】 X(201:300) = MERGE( MERGE( A(1:100), B(1:100), M1(1:100)), MERGE( C(2:101), D(0:99), M2(3:102), M3(1:100) )

【００５１】このプログラムに対して、まずもっとも内
側の MERGE 関数

【数１６】MERGE( A(1:100), B(1:100), M1(1:100) )

【００５２】に対して、テンプレートが生成される。こ
のような生成規則は、個別のアレイ関数毎に、予め用意
しておく必要がある。

【数１７】

【００５３】となる。これは、MERGE 関数のテンプレー
ト生成プログラムによって行なわれる。

【００５４】内側の２つめの MERGE 関数

【数１８】MERGE( C(2:101), D(0:99), M2(1:100) )

【００５５】によって同様に以下のテンプレートが生成
される。

【数１９】

【００５６】仮想配列のインデックスは１から開始する
ように正規化されるため、配列Ｃ及び配列Ｄへのアクセ
スはこのように記述される。

【００５７】さらに以下のような外側のテンプレートが
展開されて、

【数２０】

【００５８】この際、$1 及び $2 が仮想配列なので、
マクロ展開される。結果的に、次のようなテンプレート
が最終的に生成される。

【数２１】

【００５９】このテンプレートの生成は外側のテンプレ
ートから行なっても可能である。

【００６０】このテンプレートによって生成されるルー
プは１つだけである。（ $$ のループ変数が１つだけ）

【００６１】さらにこのテンプレートをインライン展開
する際に、左辺のインデクスも正規化しなければならな
い。こうして、

【数２２】を得る。

【００６２】以下、具体的な例に基づき、本発明につい
て説明する。具体例として、ＦＯＲＴＲＡＮ９０におけ
る典型的な複合したＴＩＦの使用例を示す。これらの例
はこれまでの、あらかじめテンプレートを用意しておく
方式では、インライン展開できないものである。例１： SPREAD 関数＋ SPREAD 関数を SUM で reduc
tion する。この例は比較的単純なマクロ・テンプレートを生成する
だけで、インライン展開が可能な例である。１つめの S
PREAD 関数の結果である仮想配列 $1($$1,$$2,$$3)が、
実際には B($$1,$$2) のアクセスによって置換される。
また、２つめのSPREAD 関数の結果である仮想配列は同
様に C($$1, $$2 ) によって置換される。このテンプレ
ートの生成が（１）の段階で行なわれる。ソースプログ
ラム：

【数２３】 A(1:100,1:200) = SUM( SPREAD( B(1:10,1:200), 2, 100 ) + SPREAD( C(1:10,1:100), 3, 200 ), 1 )

【００６３】（１）仮想配列化されたプログラム：

【数２４】 A(1:100,1:200) = SUM( $1(1:10,1:100,1:200) [ $1($$1,$$2,$$3) -> B($$1,$$3) ] [ SPREAD( B(1:10,1:200), 2, 100 ) ] + $2(1:10,1:100,1:200) [ $2($$1,$$2,$$3) -> C($$1,$$2) ] [ SPREAD( C(1:10,1:200), 3, 200 ) ] , 1 )

【００６４】（２）仮想配列のままインライン展開され
たコード：

【数２５】 DO I2=1,200 DO I1=1,100 $SUM = 0 DO ISUM=1,10 $SUM = $SUM + $1(ISUM,I1,I2) + $2(ISUM,I1,I2) END DO A(I1,I2) = $SUM END DO END DO

【００６５】ここで、$SUM という仮変数があらわれる
のは、ソース・コードに SUM が含まれているからであ
り、関数SUMの値を格納するために＄SUMが用意される。

【００６６】（３）実配列へ逆変換されたインライン展
開コード：

【数２６】 DO I2=1,200 DO I1=1,100 $SUM = 0 DO ISUM=1,10 $SUM = $SUM + B(ISUM,I1) + C(ISUM,I2) END DO A(I1,I2) = $SUM END DO END DO

【００６７】（２）では、reduction 関数である SUM
関数のインライン展開がおこなわれる。

【００６８】実際の仮想配列は次のようなインデックス
を用いるように展開されているので、本方式の最終段階
（３）では、

【数２７】$1(ISUM,I1,I2) -> B(ISUM,I2) $2(ISUM,I1,I2) -> C(ISUM,I1)

【００６９】のようにマクロ展開され、最終的に最適に
インライン展開されたコードを得る。

【００７０】例２: 配列を斜め方向にシフトする（ cs
hift of cshift ) 次の例では、（１）の段階において、より複雑なテンプ
レートの生成がおこなわれる。入れ子になった TIF 関
数は内側のものより評価される。因に、cshiftの定義は
次のとおりである。

【数２８】CSHIFT( ARRAY, SHIFT, DIM )

【００７１】これは、要素の Circular Shift 関数であ
り、ターゲットの ARRAY の DIMで指定された次元を SH
IFT で指定された数だけ、シフトする。端の部分は、循
環する（ぐるっと回る）。

【００７２】ソースプログラム：

【数２９】 X(1:100,1:200) = CSHIFT( CSHIFT( Y(1:100,1:200), dim=2, shift=1 ), dim=1, shift=-1 )

【００７３】（１）仮想配列化されたプログラム：

【数３０】 X(1:100,1:200) = $1( 1:100,1:200 ) ) [ $1($$1,$$2) -> if( $$1-1 < 1 ) if( $$2+1 > 100 ) Y(100, 1) Y(100, $$2+1) if( $$2+1 > 100 ) Y($$1-1, 1) Y($$1-1, $$2+1) ] [ CSHIFT( CSHIFT( Y(1:100,1:200), dim=2, shift=1 ), dim=1, shift=-1 ) ]

【００７４】（２）仮想配列のままインライン展開され
たコード：

【数３１】

【００７５】（３）実配列へ逆変換されたインライン展
開コード：

【数３２】

【００７６】この式で、

【数３３】CSHIFT( Y(1:100,1:200), dim=2, shift=1 ) に対して

【００７７】ここで用いられている if オペレータは条
件を記述するためのものであり、指定された条件が真な
ら１つめの値を持ち、偽なら２つめの値をもつもので
る。この例では、２次元めのインデックスを１シフトし
て１００を越えるならインデックスを１として、配列Ｙ
をアクセスすることを意味する。

【００７８】このマクロ・テンプレートに対して、さら
に外側の CSHIFT 関数によって

【数３４】

【００７９】という複雑なマクロ・テンプレートが合成
される。このテンプレートによって（３）の段階で、最
適にインラインされたコードが生成される。

【００８０】例３：４つの配列をトーナメント式に３
つのマスクを用いてマージする。次の例でも同様に入れ
子構造をもったＴＩＦ関数 MERGE が用いられてい
る。

【００８１】ソースプログラム：

【数３５】 X(1:100) = MERGE( MERGE( A(1:100), B(1:100), M1(1:100) ), MERGE( C(1:100), D(1:100), M2(1:100) ), M3(1:100) )

【００８２】（１）仮想配列化されたプログラム：

【数３６】 X(1:100) = $1(1:100) [ $1($$1) -> if( M3($$1) ) if( M1($$1) ) A($$1) B($$1) if( M2($$1) ) C($$1) D($$1) ] [ MERGE( MERGE( A(100), B(100), M1(100) ), MERGE( C(100), D(100), M2(100) ), M3(100) ) ]

【００８３】（２）仮想配列のままインライン展開され
たコード：

【数３７】

【００８４】（３）実配列へ逆変換されたインライン展
開コード：

【数３８】

【００８５】この例について説明すると、内側の１つめ
の MERGE 関数によって以下のテンプレートが生成され
る。

【数３９】

【００８６】内側の２つめの MERGE 関数によって同様
に以下のテンプレートが生成される。

【数４０】

【００８７】さらに以下のような外側のテンプレートが
展開されて、

【数４１】

【００８８】次のようなテンプレートが最終的に生成さ
れる。

【数４２】

【００８９】尚、上記の例では、SPREAD、SUM、MERGE、
CSHIFT というＦＯＲＴＲＡＮ９０の配列操作関数に関
して説明を行ったが、本発明は、これらの関数に限定さ
れるものではなく、次元減少関数としての ALL, ANY, C
OUNT, MAXVAL, MINVAL, PRODUCT、アレイ構成関数とし
ての PACK, UNPACK、アレイ整形関数としての RESHAP
E、アレイ操作関数としての EOSHIFT, TRANSPOSE、アレ
イ位置関数としての MAXLOC, MINLOC、及びこれらの関
数の任意の組み合わせを含むソース・コードに対して適
用可能である。これらの関数の詳細については、前記の
Jeanne C. Adams etal. "FORTRAN90 HANDBOOK Complet
e ANSI/ISO Reference", McGrawHill Inc.などを参照さ
れたい。この技術分野の当業者であれば、上記の例で S
PREAD、CSHIFT、SUM、MERGE に関して生成されたマク
ロ・テンプレートの例に基づき、各々の関数につき、マ
クロ・テンプレートを生成するようにシステムを構成す
ることが可能であると思料する。

【００９０】また、本発明は、ＦＯＲＴＲＡＮ９０のみ
ならず、ＡＰＬ、ＨＰＦ（ＦＯＲＴＲＡＮ９０をベース
とする並列処理言語）、Ｃ＊（Ｃをベースとする並列言
語）などの、配列を直接操作する関数をもつ言語に適用
可能である。

【００９１】さらにまた、本発明は、インライン化が本
来の目的であり、その用途は、スカラ・プロセッサに限
定したものではない。実際、インライン化によって、組
み込み関数をループ化できるため、そのループ全体に対
して、並列化が効率的に行える。従って、本発明を並列
プロセッサ用のコンパイラに適用しても、十分な効率化
を図ることができる。

【００９２】

【発明の効果】以上説明したように、この発明によれ
ば、ＴＩＦまたはＲＩＦ毎に個別にテンプレートを用意
しておき、配列とＴＩＦまたはＲＩＦを含むソース・コ
ードを一旦仮想配列化した式にテンプレートを適用する
ことによって、ＴＩＦやＲＩＦが入れ子になった複雑な
式にも、最適なインライン展開を適用することが可能と
なる。

Claims

【特許請求の範囲】

【請求項１】アレイ関数を有するプログラミング言語の
コンパイラにおいて、(a) ソース・コード中の上記アレ
イ関数をマクロ拡張し、実配列へのマッピング関数を生
成することによって、上記アレイ関数の仮想配列を作成
する段階と、(b) 上記アレイ関数の仮想配列を、仮想配
列のままインライン展開する段階と、(c) 上記インライ
ン展開された仮想配列を、実際の配列に逆変換する段階
を有する、アレイ関数をもつプログラミング言語におけるインライ
ン展開方法。
【請求項２】上記プログラミング言語がＦＯＲＴＲＡＮ
９０であり、上記アレイ関数が、ＴＩＦである、請求項
１に記載のアレイ関数をもつプログラミング言語におけ
るインライン展開方法。
【請求項３】上記ＴＩＦが、SPREADまたはCSHIFTであ
る、請求項２に記載のアレイ関数をもつプログラミング
言語におけるインライン展開方法。
【請求項４】上記プログラミング言語がＦＯＲＴＲＡＮ
９０であり、上記アレイ関数が、ＲＩＦである、請求項
１に記載のアレイ関数をもつプログラミング言語におけ
るインライン展開方法。
【請求項５】上記ＲＩＦが、MERGE である、請求項２に
記載のアレイ関数をもつプログラミング言語におけるイ
ンライン展開方法。
【請求項６】上記インライン展開された仮想配列を、実
際の配列に逆変換する段階が、個別のＴＩＦ毎を解析す
ることによって生成されたマクロ・テンプレートを用い
て行われる、請求項１に記載のアレイ関数をもつプログ
ラミング言語におけるインライン展開方法。
【請求項７】アレイ関数を有するプログラミング言語の
コンパイラにおいて、(a) アレイ関数毎に個別に、仮想
配列に変換する機能と、引数に従いマクロ・テンプレー
トを作成する機能を用意しておく段階と、(b) ソース・
コード中で、アレイ関数を含む式を見出だす段階と、
(c) 上記アレイ関数を見出したことに応答して、上記段
階(a)で、該見出だされたアレイ関数に対応して用意さ
れた仮想配列に変換する形式に従い、上記式を仮想配列
を含む式に変換する段階と、(d) 上記見出だされたアレ
イ関数の引数に従い、仮想配列を実配列に変換するマク
ロ・テンプレートを作成する段階と、(e) 上記仮想配列
を含む式をインライン展開する段階と、(f) 上記インラ
イン展開された式中の仮想配列を、上記段階(d)で作成
されたマクロ・テンプレートを使用して、実際の配列に
逆変換する段階を有する、アレイ関数をもつプログラミング言語におけるインライ
ン展開方法。
【請求項８】上記仮想配列に変換する機能は、仮想配列
の次元の決定と、仮想配列と実配列のインデックスとを
対応づける機能を含む、請求項７に記載のアレイ関数を
もつプログラミング言語におけるインライン展開方法。
【請求項９】入れ子のアレイ関数の存在に応答して、入
れ子の各々のアレイ関数毎にマクロ・テンプレートを作
成し、結果的に、入れ子の外側のアレイ関数に基づき作
成したマクロ・テンプレートに、入れ子の内側のアレイ
関数に基づき作成したマクロ・テンプレートを順次適用
することによって、上記段階(f)で利用されるマクロ・
テンプレートを作成する段階を有する、請求項７に記載
のアレイ関数をもつプログラミング言語におけるインラ
イン展開方法。
【請求項１０】入れ子のアレイ関数の存在に応答して、
入れ子の各々のアレイ関数毎にマクロ・テンプレートを
作成し、結果的に、入れ子の内側のアレイ関数に基づき
作成したマクロ・テンプレートに、入れ子の外側のアレ
イ関数に基づき作成したマクロ・テンプレートを順次適
用することによって、上記段階(f)で利用されるマクロ
・テンプレートを作成する段階を有する、請求項７に記
載のアレイ関数をもつプログラミング言語におけるイン
ライン展開方法。