JP2002099426A

JP2002099426A - コンパイラプログラムを記憶した記憶媒体及びコンパイル装置

Info

Publication number: JP2002099426A
Application number: JP2000287988A
Authority: JP
Inventors: Hiroko Sugiyama; 浩子杉山
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2000-09-22
Filing date: 2000-09-22
Publication date: 2002-04-05

Abstract

(57)【要約】【課題】並列実行が終了した後であっても、Threadpriv
ate変数として宣言された変数を保持することができる
コンパイラプログラムを記憶した記憶媒体及びコンパイ
ル装置を提供すること【解決手段】本発明にかかるコンパイラ１０を記憶した
記憶媒体は、複数のプロセッサＰＥ３２ｎを有し、共有
メモリ３３を使用する並列コンピュータ３にて実行され
るプログラムに関し、ソースプログラム１００からオブ
ジェクトプログラム２００にコンパイルするコンパイラ
を記憶した記憶媒体であって、このコンパイラは、コン
パイルを行うコンピュータ１に、Threadprivate変数と
して宣言された変数について必要なスレッド数に応じた
データ領域を有する配列ａ〔０〕、ａ〔１〕、ａ〔２〕
・・・ａ〔ｎ〕として記憶領域の確保を行うオブジェク
トプログラム２００を発生させるものである。

Description

【発明の詳細な説明】

【０００１】

【発明が属する技術分野】本発明は、コンパイラに関
し、より詳しくは、複数のプロセッサを有するコンピュ
ータで実行されうるプログラムをコンパイルするコンパ
イラに関する。

【０００２】

【従来の技術】高性能コンピュータ分野は、ベクトルプ
ロセッサから、メモリを共有するマルチプロセッサへ移
行しつつある。ベンダは、メモリを共有するマルチプロ
セッサに対する並列プログラミングのために、種々の並
列化指示文を用意している。しかし、それらの並列化指
示文は、ベンダ独自の仕様であるため、移植性が乏しい
という問題点があった。かかる問題点を解決するため、
並列化指示文により並列プログラミングを行うための言
語仕様として、OpenMPが制定された。尚、OpenMPについ
ては、文献「OpenMP C and C++ Application Program I
nterface version1.0 - October 1998 Document Number
004-2229-001」(発行元:OpenMP Architecture Review
Board)に詳細に開示されている。そして、このOpenMPに
関連して、Fortran（フォートラン）言語、Ｃ言語、Ｃ
＋＋言語等に対応するアプリケーションプログラミング
インターフェース（ＡＰＩ）が提供されるようになっ
た。このOpenMPに従った並列指示文において記述するこ
とができる指示の１つとしてThreadprivate（スレッド
プライベート）がある。

【０００３】ここで、このThreadprivateについて説明
する。Threadprivateは、例えば、ある変数に対して、T
hreadprivateで扱うことを指示することができる。この
場合の変数、即ちThreadprivateで扱われた変数のこと
を、この発明の詳細な説明においては特にThreadprivat
e変数と呼ぶ。並列化指示文において変数ａをThreadpri
vateとして扱うように指示した場合、並列実行をしてい
るそれぞれのプロセスは、変数ａをそれぞれのプロセス
が個別に持っているような動作を実行する。このように
並列実行をしているそれぞれのプロセスをスレッドと呼
ぶ。また、並列実行しているスレッドは、スレッド番号
によって識別することができる。そして、スレッド番号
が０のスレッドは、特にメインスレッドと呼ばれる。

【０００４】Threadprivate指示を行うことにより、逐
次実行しているプロセスと、並列実行をしているメイン
スレッドとは、同じ変数ａを用いることができる。並列
実行が複数回行われる場合には、並列実行時に各々のス
レッドにおいて使用された変数ａは、次の並列実行時に
その値を用いることもあるから、並列実行が終了した後
でも各々のスレッド毎にその値を個別に保持する必要が
ある。

【０００５】しかしながら、従来の技術においては、並
列実行において各々のスレッドが個別に使用している変
数は、逐次実行に移行する時点で消滅させてしまってい
た。そのため、次の並列実行を行う場合に、前回の変数
の値を使用することはできなかった。

【０００６】この点について、さらに図５及び図６を用
いて詳細に説明する。図５は、並列実行と逐次実行を行
う並列コンピュータの処理を説明するための模式図であ
る。図６は、並列コンピュータにおける共有メモリの記
憶領域を示す模式図である。図５では、図の上部から下
部へと処理が実行されることを示している。この例で
は、スレッド０、スレッド１、スレッド２乃至スレッド
ｎにおいて、変数ａが使用されているものとし、スレッ
ド０における変数をａ０、スレッド１における変数をａ
１、スレッド２における変数をａ２、スレッドｎにおけ
る変数をａｎとしている。

【０００７】プログラムの処理が開始すると、メインス
レッドであるスレッド０において処理が実行される。こ
の処理を実行するにあたっては、図６に示されるよう
に、変数ａ０に関する値を格納するための記憶領域が、
共有メモリ中のスレッド０に対応する記憶領域中に確保
される。そして、並列実行に移行すると、スレッド０の
処理に並行して、スレッド１、スレッド２・・・スレッ
ドｎの処理が実行される。これらの処理を実行するにあ
たっては、図６に示されるように、各スレッドに対応す
る変数ａ１、ａ２・・・ａｎの記憶領域が、各々のスレ
ッドに対応する記憶領域中に確保される。ここで、各々
のスレッドに対応する記憶領域は、並列実行中にのみ割
り当てられるものである。そのため、並列実行が終了
し、逐次実行に移行すると、各々のスレッドに対応する
記憶領域に対する割り当ては、取り消され、その記憶領
域は、その後の処理において自由に使用できることにな
る。即ち、その記憶領域は開放される。このことから、
各スレッドの処理を実行した際に記憶された変数ａ１、
ａ２・・・・ａｎの値は、並列実行が終了した時点で、
実質的に消滅することになる。従って、次の並列実行を
行う場合には、前回の並列実行における変数の値を用い
ることはできない。

【０００８】尚、次の並列実行においては、再度、各々
のスレッドに対応する記憶領域が確保されるとともに、
それらの領域中に、変数ａ１、ａ２・・・・ａｎの記憶
領域が確保される。しかしながら、これらの変数の値
も、並列実行が終了した時点で実質的に消滅する。

【０００９】

【発明が解決しようとする課題】このように従来の技術
においては、並列実行が終了した後は、Threadprivate
変数として宣言された変数を保持することができないと
いう問題点があった。

【００１０】よって、本発明の目的は、並列実行が終了
した後であっても、Threadprivate変数として宣言され
た変数を保持することができるコンパイラを記憶した記
憶媒体及びコンパイル装置を提供することである。

【００１１】

【課題を解決するための手段】本発明の第１の態様にか
かる、コンパイラプログラム（以下、単にコンパイラ）
（例えば、本実施の形態におけるコンパイラ１０）を記
憶した記憶媒体は、複数のプロセッサ（例えば、本実施
の形態におけるＰＥ３２１・・・ＰＥ３２ｎ）を有し、
共有メモリ（例えば、本実施の形態における共有メモリ
３３）を使用する並列コンピュータ（例えば、本実施の
形態における並列コンピュータ３）にて実行されるプロ
グラムに関し、ソースプログラム（例えば、本実施の形
態におけるソースプログラム１００）からオブジェクト
プログラム（例えば、本実施の形態におけるオブジェク
トプログラム２００）にコンパイルするコンパイラを記
憶した記憶媒体であって、このコンパイラは、コンパイ
ルを行うコンピュータに、スレッドプライベート（Thre
adprivate）変数として宣言された変数について、必要
なスレッド数に応じたデータ領域を有する配列（例え
ば、本実施の形態におけるａ

〔０〕、ａ〔１〕、ａ
〔２〕・・・ａ〔ｎ〕）として記憶領域の確保を行うオ
ブジェクトプログラムを発生させるものである。これに
より、複数回、並列実行が行われる場合に、スレッドプ
ライベート変数として宣言された変数を保持することが
できる。

【００１２】さらに、コンパイラは、コンパイルを行う
コンピュータに、配列において、スレッドプライベート
変数として宣言された変数を扱うスレッドのスレッド番
号を、当該スレッドに割り当てられたデータ領域のイン
デクスとし、スレッド内で、スレッドプライベート変数
として宣言された変数に対するアクセスを実行するソー
スプログラムの記述に対応して、スレッド番号をインデ
クスとして前記配列をアクセスするオブジェクトプログ
ラムを発生させるものとしてもよい。これにより、確実
にスレッド毎に変数を保持することができ、また、所望
の変数に対してアクセスすることができる。

【００１３】さらに、また、配列が並列コンピュータに
おけるプロセッサの数に応じたデータ領域を有するよう
にしてもよい。これにより、確保する必要がある最大の
データ領域を予め確保することができる。

【００１４】本発明の第２の態様にかかる、コンパイル
装置は、複数のプロセッサを有し、共有メモリを使用す
る並列コンピュータにて実行されるプログラムに関し、
ソースプログラムからオブジェクトプログラムにコンパ
イルするコンパイル装置（例えば、本実施の形態におけ
るコンピュータ１）であって、ソースプログラムを解析
し、中間コードを生成するソースプログラム解析手段
（例えば、本実施の形態におけるソースプログラム解析
部１１）と、このソースプログラム解析手段により生成
された中間コードの最適化を実施する最適化実施手段
（例えば、本実施の形態における最適化実施部１３）
と、この最適化実施手段により最適化された中間コード
に基づき、オブジェクトプログラムを生成するコード生
成手段（例えば、本実施の形態におけるコード生成部１
５）とを備え、前述の最適化実施手段を、スレッドプラ
イベート変数として宣言された変数について、必要なス
レッド数に応じたデータ領域を有する配列として記憶領
域の確保を行う中間コードに変換するようにしたもので
ある。これにより、複数回、並列実行が行われる場合
に、スレッドプライベート変数として宣言された変数を
保持することができる。

【００１５】さらに、上述の最適化実施手段を、配列に
おいてスレッドプライベート変数として宣言された変数
を扱うスレッドのスレッド番号を当該スレッドに割り当
てられたデータ領域のインデクスとし、スレッド内で、
スレッドプライベート変数として宣言された変数に対す
るアクセスを実行するソースプログラムの記述に対応し
て、スレッド番号をインデクスとして前記配列をアクセ
スする中間コードに変換するようにしてもよい。これに
より、確実にスレッド毎に変数を保持することができ、
また、所望の変数に対してアクセスすることができる。

【００１６】

【発明の実施の形態】図１を用いて、本発明に関連する
コンピュータについて簡単に説明する。コンピュータ１
では、本発明に関連するコンパイラ１０が実行されてい
る。コンパイラ１０は、ユーザが作成したソースプログ
ラム１００をコンパイルし、オブジェクトプログラム２
００を生成する。ソースプログラム１００は、図１に示
されている並列コンピュータ３用に書かれたものであ
り、コンパイラ１０は、並列コンピュータ３用にコンパ
イルを行う。故にオブジェクトプログラム２００は、並
列コンピュータ３用のオブジェクトプログラムである。
尚、コンパイラ１０は、例えば、コンパイラを記憶した
記憶媒体がコンピュータ１にインストールされることに
より構成される。ここで、コンパイラを記憶した記憶媒
体としては、例えば、フロッピー（登録商標）ディス
ク、ＣＤ−ＲＯＭ、光磁気ディスク、半導体メモリ、ハ
ードディスク等が含まれる。そして、このコンパイラ
は、インタネット網、公衆回線網等の有線又は無線の通
信網を通じて伝送される場合もある。この場合に、コン
パイラは、搬送波により伝送される。

【００１７】並列コンピュータ３は、バス３１に接続さ
れた複数のプロセッサ・エレメントＰＥ３２１、３２２
乃至３２ｎ及び共有メモリ３３を備えている。コンピュ
ータ１のコンパイラ１０にて生成されたオブジェクトプ
ログラム２００は、プロセッサエレメントＰＥ３２１乃
至ＰＥ３２ｎにて実行される。また、各プロセッサエレ
メントＰＥ３２１乃至ＰＥ３２ｎは、オブジェクトプロ
グラム２００の実行にあたり、共有メモリ３３を使用
し、所定の情報を格納、消去及び読み出し処理を実行す
る。

【００１８】コンパイラ１０で行われる処理の概要を図
２に示す。最初にソースプログラム１００がコンパイラ
１０に入力される。そして、コンパイラ１０のソースプ
ログラム解析部１１は、入力されたソースプログラム１
００の解析を実行する。この解析は、字句解析、文解
析、構造解析を含む。ソースプログラム解析部１１によ
る解析の終了後には、ソースプログラム１００は、コン
パイラ１０が使用する中間コードで表現されたプログラ
ムに変換されている。

【００１９】コンパイラ１０は、中間コードで表現され
たプログラムに対して、図示しない意味解析を実行し、
最適化実施部１３において、最適化を行う。最適化実施
部１３は、中間コードで表現されたプログラムより、Th
readprivateに指定された変数を認識し、配列用の領域
を共有メモリ３３のメインスレッドに割り当てられた領
域中に確保するように当該中間コードを最適化する。具
体的な処理については、後述するが、この最適化処理に
あたっては、ライブラリ１７のライブラリ関数が用いら
れる。この配列用の領域におけるデータ領域の数は、並
列コンピュータ３のプロセッサエレメント３２ｎの数と
し、また領域の規模は、個々の変数の大きさに当該プロ
セッサエレメントの数を乗じた値に基づき定められる。
この配列は、スレッドごとにそのスレッド番号をインデ
クスとしてデータ領域を確保している。また、この配列
用の領域は、並列実行部分、逐次実行部分を問わず、プ
ログラムの処理が完了するまで、確保し続けられる。ス
レッド内において、Threadprivate変数として宣言され
た変数に対してアクセスを実行する旨の記述がソースプ
ログラム１００中に含まれていた場合には、そのスレッ
ドのスレッド番号をインデクスとして配列にアクセスす
る。

【００２０】コード生成部１５は、この最適化処理後の
中間コードに基づき、並列コンピュータ３用のオブジェ
クトプログラムコードを生成する。最後に、コンパイラ
１０は、オブジェクトプログラム２００を出力する。

【００２１】さらに図３及び図４を用いて詳細に説明す
る。これらの図３、図４では、コンパイラ１０のおいて
発生されるオブジェクトプログラム２００を説明するた
めに、当該オブジェクトプログラム２００に基づき実行
される並列コンピュータ３の処理を説明する。図３は、
並列実行と逐次実行を行う並列コンピュータの処理を説
明するための模式図である。図４は、並列コンピュータ
における共有メモリの記憶領域を示す模式図である。図
３では、図の上部から下部へと処理が行われることを示
している。そして、縦方向のラインは、各々のプロセッ
サの処理を示している。縦方向のラインが１本の領域
は、特定の１つのプロセッサのみにより処理が逐次実行
されていることを示している。他方、縦方向のラインが
複数本の領域は、複数のプロセッサにより処理が並列実
行されていることを示している。この例では、スレッド
０、スレッド１、スレッド２乃至スレッドｎにおいて、
変数ａが使用されている場合を図示している。そして、
スレッド０における変数をａ０、スレッド１における変
数をａ１、スレッド２における変数をａ２、スレッドｎ
における変数をａｎとしている。

【００２２】また、図４のスレッド０の記憶領域中に設
けられたａ

〔０〕と付した領域は、スレッド０、即ちメ
インスレッドが変数ａ０につき使用する領域である。ａ
〔１〕と付した領域は、スレッド１が変数ａ１につき使
用する領域、ａ〔２〕と付した領域は、スレッド２が変
数ａ２につき使用する領域、さらには、ａ〔ｎ〕と付し
た領域は、スレッドｎが変数ａｎにつき使用する領域で
ある。

【００２３】プログラムの処理を開始すると、まず、ソ
ースプログラム１００中の指示に従い、メインスレッド
であるスレッド０において処理が実行される。この処理
を実行するにあたって、コンパイラ１０は、図４に示さ
れるように、変数ａ０に関する値を格納するための記憶
領域を、共有メモリ３３中のスレッド０に対応する記憶
領域中に確保するオブジェクトプログラム２００を生成
する。そして、並列実行に移行すると、スレッド０の処
理に並行して、スレッド１、スレッド２・・・スレッド
ｎの処理が実行される。これらの処理を実行するにあた
って、コンパイラ１０は、図６に示されるように、各ス
レッドに対応する変数ａ１、ａ２・・・ａｎの記憶領域
ａ〔１〕、ａ〔２〕・・・ａ〔ｎ〕が、共有メモリ３３
中のスレッド０に対応する記憶領域中に配列として確保
するオブジェクトプログラム２００を生成する。

【００２４】この配列用のデータ領域を共有メモリ３３
中に設定する場合には、ライブラリ１７のライブラリ関
数が用いられる。ライブラリ１７は、予めプログラムの
実行時に設定した並列コンピュータ３のプロセッサエレ
メント３２ｎの数に関する情報を有している。最適化実
施部１３は、ソースプログラム１００中のThreadprivat
e指示を認識した場合、確保すべき配列中のデータ領域
の数をライブラリ１７に問い合わせる。ライブラリ１７
は、この問い合わせに応じて並列コンピュータ３のプロ
セッサエレメント３２ｎの数を、当該配列中に設けるべ
きデータ領域の数として、最適化実施部１３に回答す
る。このようにして、最適化実施部１３は、配列用のデ
ータ領域の数を決定する。

【００２５】共有メモリ３３のスレッド０に対応する記
憶領域は、並列実行処理中のみならず、その後の逐次実
行処理、さらにはその後の並列実行処理等、プログラム
の処理が終了するまで、共有メモリ３３に確保し続けら
れる。そのため、並列実行処理が終了した後であって
も、プログラム終了まで、その記憶領域は開放されるこ
とはない。このことから、各スレッドの処理を実行した
際に記憶された変数ａ１、ａ２・・・・ａｎの値は、並
列実行が終了した後であっても、プログラム終了まで、
記憶される。従って、次の並列実行処理を行う場合に、
前回の並列実行処理における変数の値を用いることがで
きる。配列ａ〔１〕、ａ〔２〕・・・ａ〔ｎ〕は、各々
スレッド番号をインデクスとして保有している。

【００２６】また、各スレッドが処理の過程で変数を使
用する場合には、これらの配列ａ〔１〕、ａ〔２〕・・
・ａ〔ｎ〕を使用する。例えば、スレッド０は、変数ａ
０については、ａ

〔０〕の領域を、スレッドｎは、変数
ａｎについてはａ〔ｎ〕の領域を各々使用する。そし
て、各スレッドがこれらの配列ａ〔１〕、ａ〔２〕・・
・ａ〔ｎ〕を使用する場合は、自分のスレッド番号をイ
ンデクスとしてアクセスする。例えば、スレッド１は、
自分のスレッド番号である「１」をインデクスとしてａ
〔１〕の領域をアクセスする。また、スレッド２は、自
分のスレッド番号である「２」をインデクスとしてａ
〔２〕の領域をアクセスする。このような構成とするこ
とにより、スレッドｎは常に配列のデータ領域ａ〔ｎ〕
を変数ａｎの記憶領域として使用することになる。そし
て、スレッドｎ以外の他のスレッドからは、配列のデー
タ領域ａ〔ｎ〕へアクセスすることはない。

【００２７】次の並列実行においては、スレッド０に対
応する記憶領域に設けられた配列のデータ領域ａ
〔１〕、ａ〔２〕・・・ａ〔ｎ〕より、各々必要に応じ
て変数ａ１、ａ２・・・ａｎの値が読み出される。さら
に並列実行の結果、当該変数ａ１、ａ２・・・ａｎの値
が修正された場合には、修正後の内容が配列のデータ領
域ａ〔１〕、ａ〔２〕・・・ａ〔ｎ〕中に記憶される。

【００２８】次に、OpenMPに従った並列指示文の記述例
を表１に示す。なお、左端の行番号及び「並列実行部そ
の１」「並列実行部その２」の記載は、実施例の説明の
ためだけに付したものである。

【００２９】

【表１】 01 int a; 02 #pragma omp threadprivate(a) 03 main(){ 04 #pragma omp parallel 05 { a = omp_get_thread_num(); } ・・・並列実行部その１ 06 #pragma omp parallel 07 { printf("%d\n",a); } ・・・並列実行部その２ 08 }

【００３０】第０１行は、aは整数型の変数であるとい
う宣言をしている。第０２行は、aはThreadprivate変数
であるという宣言をしている。第０３行は、プログラム
の開始を示している。この場合は、スレッド０の開始を
意味している。第０４行は、直後の{}で囲まれている部
分、即ち第０５行を並列実行するという指示を示してい
る。第０５行は、aに自分のスレッド番号を入れるとい
う実行文である。ここで、第０５行が実行される直前に
並列実行するための複数のスレッドが生まれ、同じく第
０５行が実行された直後に並列実行するための複数のス
レッドが消える。第０６行は、直後の{}で囲まれている
部分、即ち第０７行を並列実行するという指示を示して
いる。第０７行は、aの値を表示するという実行文であ
る。ここで、第０７行が実行される直前に並列実行する
ための複数のスレッドが生まれ、同じく第０７行が実行
された直後に並列実行するための複数のスレッドが消え
る。第８行は、プログラムの終了を示している。この場
合は、スレッド０の終了を意味している。

【００３１】尚、上述の例では、Threadprivate変数と
宣言された変数に関しては、配列中に、並列コンピュー
タが有する全プロセッサの数のデータ領域を確保するこ
ととしたが、必ずしも、全プロセッサの数のデータ領域
を確保する必要はない。例えば、並列化処理において、
並列コンピュータのプロセッサの一部のみ使用すること
が明らかな場合には、当該一部のプロセッサの数のデー
タ領域を確保すればよい。また、本発明に係るコンパイ
ラで生成されたオブジェクトプログラムは複数のプロセ
ッサを有する並列コンピュータのみならず単一のプロセ
ッサを有するコンピュータでも実行可能である。

【００３２】（付記１）複数のプロセッサを有し、共有
メモリを使用する並列コンピュータにて実行されうるプ
ログラムに関し、ソースプログラムからオブジェクトプ
ログラムにコンパイルするコンパイラプログラムを記憶
した記憶媒体であって、前記コンパイラプログラムはコ
ンピュータに、スレッドプライベート変数として宣言さ
れた変数について、必要なスレッド数に応じたデータ領
域を有する配列として記憶領域の確保を行うオブジェク
トプログラムを発生させることを特徴とするコンパイラ
プログラムを記憶した記憶媒体。

【００３３】（付記２）前記コンパイラプログラムはコ
ンピュータに、前記配列において、スレッドプライベー
ト変数として宣言された変数を扱うスレッドのスレッド
番号を、当該スレッドに割り当てられたデータ領域のイ
ンデクスとし、スレッド内で、スレッドプライベート変
数として宣言された変数に対するアクセスを実行するソ
ースプログラムの記述に対応して、スレッド番号をイン
デクスとして前記配列をアクセスするオブジェクトプロ
グラムを発生させることを特徴とする付記１記載のコン
パイラプログラムを記憶した記憶媒体。

【００３４】（付記３）前記配列は、前記並列コンピュ
ータにおけるプロセッサの数に応じたデータ領域を有す
ることを特徴とする付記１記載のコンパイラプログラム
を記憶した記憶媒体。

【００３５】（付記４）前記配列の記憶領域は、メイン
スレッドに割り当てられた記憶領域中に確保されること
を特徴とする付記１記載のコンパイラプログラムを記憶
した記憶媒体。

【００３６】（付記５）複数のプロセッサを有し、共有
メモリを使用する並列コンピュータにて実行されうるプ
ログラムに関し、ソースプログラムからオブジェクトプ
ログラムにコンパイルするコンパイル装置であって、ソ
ースプログラムを解析し、中間コードを生成するソース
プログラム解析手段と、前記ソースプログラム解析手段
により生成された中間コードの最適化を実施する最適化
実施手段と、前記最適化実施手段により最適化された中
間コードに基づき、オブジェクトプログラムを生成する
コード生成手段とを備え、前記最適化実施手段は、スレ
ッドプライベート変数として宣言された変数について、
必要なスレッド数に応じたデータ領域を有する配列とし
て記憶領域の確保を行う中間コードに変換することを特
徴とするコンパイル装置。

【００３７】（付記６）前記最適化実施手段は、前記配
列において、スレッドプライベート変数として宣言され
た変数を扱うスレッドのスレッド番号を、当該スレッド
に割り当てられたデータ領域のインデクスとし、スレッ
ド内で、スレッドプライベート変数として宣言された変
数に対するアクセスを実行するソースプログラムの記述
に対応して、スレッド番号をインデクスとして前記配列
をアクセスする中間コードに変換することを特徴とする
付記５記載のコンパイル装置。

【００３８】（付記７）前記配列は、前記並列コンピュ
ータにおけるプロセッサの数に応じたデータ領域を有す
ることを特徴とする付記５記載のコンパイル装置。

【００３９】（付記８）前記配列の記憶領域は、メイン
スレッドに割り当てられた記憶領域中に確保されること
を特徴とする付記５記載のコンパイル装置。

【００４０】（付記９）前記コンパイル装置は、さら
に、予め設定された前記プロセッサの数に基づいて前記
配列におけるデータ領域の数を発生させるライブラリ関
数を有するライブラリを有し、当該ライブラリは、前記
最適化実施手段からソースコード中のスレッドプライベ
ート指示に応じて発生された配列中のデータ領域の数に
関する要求が通知された場合に、当該ライブラリ関数に
より発生したデータ領域の数を当該最適化実施手段に対
し通知することを特徴とする付記５記載のコンパイル装
置。

【００４１】（付記１０）複数のプロセッサを有し、共
有メモリを使用する並列コンピュータにて実行されうる
プログラムに関し、ソースプログラムからオブジェクト
プログラムにコンパイルするコンパイル方法であって、
スレッドプライベート変数として宣言された変数を認識
する第１のステップと、第１のステップにおいて認識さ
れた変数について必要なスレッド数に応じたデータ領域
を有する配列として記憶領域の確保するオブジェクトプ
ログラムを発生させる第２のステップを有するコンパイ
ル方法。

【００４２】

【発明の効果】本発明により、並列実行が終了した後で
あっても、スレッドプライベート変数として宣言された
変数を保持することができるコンパイラを記憶した記憶
媒体及びコンパイル装置を提供することができる。

【図面の簡単な説明】

【図１】本発明に関係するコンピュータを説明するため
のブロック図である。

【図２】本発明にかかるコンパイラの構成を示すブロッ
ク図である。

【図３】本発明にかかる並列実行と逐次実行を行う並列
コンピュータの処理を説明するための模式図である。

【図４】本発明にかかる並列コンピュータの共有メモリ
の記憶領域を示す模式図である。

【図５】従来例にかかる並列実行と逐次実行を行う並列
コンピュータの処理を説明するための模式図である。

【図６】従来例にかかる並列コンピュータの共有メモリ
の記憶領域を示す模式図である。

【符号の説明】

１コンピュータ３並列コンピュータ１０コン
パイル装置１１ソースプログラム解析部１３最適化実施部
１５コード生成部１７ライブラリ１００ソースプログラム２００オブジェクトプログラム

Claims

【特許請求の範囲】

【請求項１】複数のプロセッサを有し、共有メモリを使
用する並列コンピュータにて実行されうるプログラムに
関し、ソースプログラムからオブジェクトプログラムに
コンパイルするコンパイラプログラムを記憶した記憶媒
体であって、前記コンパイラプログラムはコンピュータに、スレッドプライベート変数として宣言された変数につい
て、必要なスレッド数に応じたデータ領域を有する配列
として記憶領域の確保を行うオブジェクトプログラムを
発生させることを特徴とするコンパイラプログラムを記
憶した記憶媒体。
【請求項２】前記コンパイラプログラムはコンピュータ
に、前記配列において、スレッドプライベート変数として宣
言された変数を扱うスレッドのスレッド番号を、当該ス
レッドに割り当てられたデータ領域のインデクスとし、スレッド内で、スレッドプライベート変数として宣言さ
れた変数に対するアクセスを実行するソースプログラム
の記述に対応して、スレッド番号をインデクスとして前
記配列をアクセスするオブジェクトプログラムを発生さ
せることを特徴とする請求項１記載のコンパイラプログ
ラムを記憶した記憶媒体。
【請求項３】前記配列は、前記並列コンピュータにおけ
るプロセッサの数に応じたデータ領域を有することを特
徴とする請求項１記載のコンパイラプログラムを記憶し
た記憶媒体。
【請求項４】複数のプロセッサを有し、共有メモリを使
用する並列コンピュータにて実行されうるプログラムに
関し、ソースプログラムからオブジェクトプログラムに
コンパイルするコンパイル装置であって、ソースプログラムを解析し、中間コードを生成するソー
スプログラム解析手段と、前記ソースプログラム解析手段により生成された中間コ
ードの最適化を実施する最適化実施手段と、前記最適化実施手段により最適化された中間コードに基
づき、オブジェクトプログラムを生成するコード生成手
段とを備え、前記最適化実施手段は、スレッドプライベート変数とし
て宣言された変数について、必要なスレッド数に応じた
データ領域を有する配列として記憶領域の確保を行う中
間コードに変換することを特徴とするコンパイル装置。
【請求項５】前記最適化実施手段は、前記配列において、スレッドプライベート変数として宣
言された変数を扱うスレッドのスレッド番号を、当該ス
レッドに割り当てられたデータ領域のインデクスとし、スレッド内で、スレッドプライベート変数として宣言さ
れた変数に対するアクセスを実行するソースプログラム
の記述に対応して、スレッド番号をインデクスとして前
記配列をアクセスする中間コードに変換することを特徴
とする請求項４記載のコンパイル装置。