JPH11232117A

JPH11232117A - プログラム変換方法、プログラム変換装置及びプログラム変換プログラムを記憶した記憶媒体

Info

Publication number: JPH11232117A
Application number: JP10032852A
Authority: JP
Inventors: Hiroko Isozaki; 博子磯崎
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1998-02-16
Filing date: 1998-02-16
Publication date: 1999-08-27
Anticipated expiration: 2018-02-16
Also published as: EP0936543A2; JP3178403B2; US6282707B1; EP0936543A3; KR19990072721A; CN1228558A

Abstract

(57)【要約】【課題】様々な手続相互間におけるキャッシュ・メモ
リ上での衝突及び頻繁に用いる手続のキャッシュ・ミス
を防止する。【解決手段】開示されるプログラム変換方法は、ユー
ザ・ライブラリ手続、標準ライブラリ手続、ランタイム
・ライブラリ手続を含むライブラリを、手続毎に配置可
能な再配置可能ライブラリに変換すると共に、原始プロ
グラムをユーザ手続について手続毎に配置可能な一時的
な再配置可能目的プログラムにコンパイルし、再配置可
能ライブラリと一時的な再配置可能目的プログラムとを
結合して実行することにより得られるこれらの手続に関
する動的情報に基づいて、これらの手続を主記憶装置の
いずれの記憶領域に記憶すべきかを決定し、その決定結
果に基づいて目的プログラムを生成する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、プログラム変換
方法、プログラム変換装置及びプログラム変換プログラ
ムを記憶した記憶媒体に関し、詳しくは、プログラミン
グ言語で記述された原始プログラムを計算機やＣＰＵ
（中央処理装置）が実行可能な言語（機械語、アセンブ
リ言語など）で記述された目的プログラムに変換（コン
パイル）するプログラム変換方法、プログラム変換装置
及びプログラム変換プログラムを記憶した記憶媒体に関
する。

【０００２】

【従来の技術】図１５は、特開平１-１１８９３１号公
報に開示されている従来のプログラム変換装置の第１の
電気的構成例を示すブロック図である。この例のプログ
ラム変換装置は、第１プログラム記憶部１と、コンパイ
ラ２と、第２プログラム記憶部３と、第３プログラム記
憶部４と、入力データ記憶部５と、プログラム実行部６
と、第４プログラム記憶部７と、解析結果記憶部８とか
ら概略構成されている。まず、コンパイラ２は、第１プ
ログラム記憶部１から、例えば、Ｃ言語（商標名）等の
プログラミング言語で記述された原始プログラムを読み
込み、機械語やアセンブリ言語などで記述された一時的
な目的プログラムを作成し、第２プログラム記憶部３に
記憶する。

【０００３】ここで、一時的な目的プログラムとは、原
始プログラムをその記述された順に機械語やアセンブリ
言語などからなるコードに変換したものをいう。この一
時的な目的プログラムは、計算機やＣＰＵ（中央処理装
置）で実行可能であるが、単に原始プログラムをその記
述された順にコードに変換しているだけであるので、冗
長な部分があり、そのままでは目的プログラム全体のサ
イズ（コードサイズ）が大きく、目的プログラムを記憶
すべき主記憶装置に大容量のものが必要であると共に、
目的プログラムの実行時間が長く、効率的ではない。そ
こで、効率的で最適な目的プログラムを作成する必要が
あるが、ここの処理で単に原始プログラムをその記述さ
れた順にコードに変換した目的プログラムを、最適化さ
れた最終的な目的プログラムに対して、「一時的な目的
プログラム」と呼ぶのである。

【０００４】目的プログラムの最適化には様々な手法が
あるが、ここでは、手続の命令コードの配置最適化を行
う。なお、手続とは、計算機やＣＰＵが行うあるひとま
とまりの処理（例えば、四則演算）を意味し、関数、あ
るいはサブルーチンとも呼ばれるが、以下ではそれらを
総称して手続と呼ぶことにする。プログラムでは、ある
箇所である手続（以下、呼出側手続という）を実行する
際に他の手続（以下、被呼出側手続という）を呼び出す
ことがある。そこで、原始プログラムを目的プログラム
に変換し主記憶装置に記憶した場合、呼出側手続の命令
コードと密接な関係を有する被呼出側手続の命令コード
とが物理的に近くに配置されていれば、手続呼出命令を
ロングジャンプのものからショートジャンプのものに変
更することが可能となる。これにより、目的プログラム
全体のコードサイズを削減できると共に、計算機やＣＰ
Ｕが目的プログラムを実行した際の実行速度を速くする
ことができる。このように、時間的に連続して実行され
る可能性の高い手続の命令コード同士を、目的プログラ
ム上で物理的に近く配置することを手続の命令コードの
配置最適化というのである。

【０００５】次に、プログラム実行部６は、第４プログ
ラム記憶部７から、手続呼出頻度解析プログラムを読み
込み、それを実行する。即ち、プログラム実行部６は、
第２プログラム記憶部３から一時的な目的プログラムを
読み込むと共に、操作者が入力し入力データ記憶部５に
記憶した入力データを入力データ記憶部５から読み込
み、一時的な目的プログラムの実行をシミュレートしつ
つ、一時的な目的プログラムの中のある手続において他
の手続が呼び出された回数を各手続毎に積算し、その結
果を手続参照頻度解析結果として解析結果記憶部８に記
憶する。これにより、コンパイラ２は、解析結果記憶部
８から手続参照頻度解析結果を読み込み、任意の２つの
手続間の参照関係の密接さを計算し、その結果に基づい
て手続の命令コードの配置最適化を行って最終的な目的
プログラムを作成し、第３プログラム記憶部４に記憶す
る。

【０００６】また、図１６は、特開平９−３４７２５号
公報に開示されている従来のプログラム変換装置の第２
の電気的構成例を示すブロック図である。この例のプロ
グラム変換装置は、原始プログラム記憶部１１と、コン
パイラ１２と、目的プログラム記憶部１３とから概略構
成されている。コンパイラ１２は、構文解析部１４と、
手続呼出計数部１５と、コード生成部１６と、手続呼出
回数データ格納部１７と、特定空間配置手続決定部１８
と、目的プログラム出力部１９とから概略構成されてい
る。ここで、特定空間とは、プログラム空間の一部に設
定された有限なコードサイズの特定領域である。構文解
析部１４は、原始プログラム記憶部１１から解析すべき
原始プログラムを読み込み、原始プログラムを構成する
構文を解析する。手続呼出計数部１５は、構文解析部１
４が構文を解析した際に認識した各手続の呼出回数を各
手続毎に計数する。コード生成部１６は、２回のコード
生成を行う。即ち、１回目のコード生成では、コード生
成部１６は、構文解析部１４の構文解析結果に基づい
て、当該構文が、手続呼出命令でなければ通常のコード
を生成し、手続呼出命令であれば通常の呼出命令を用い
た命令コードを生成する。また、コード生成部１６は、
２回目のコード生成では、１回目のコード生成結果を先
頭から走査し、当該コードが、手続呼出命令であり、特
定空間配置手続決定部１８に問い合わせた結果、特定空
間に配置することが決定された特定空間配置手続である
ならば、バイト数が長い通常の呼出命令コードからバイ
ト数の短い専用の呼出命令コードに置換する。

【０００７】手続呼出回数データ格納部１７は、手続毎
に、手続呼出計数部１５で計数された呼出回数と、コー
ド生成部１６における１回目のコード生成で生成された
コードサイズとを格納する。特定空間配置手続決定部１
８は、手続呼出回数データ格納部１７に格納された手続
毎の呼出回数とコードサイズとに基づいて、特定空間に
配置すべき手続を、呼出回数の多い手続を優先しなが
ら、特定空間に配置すべき手続のコードサイズの総和が
特定空間のコードサイズに収まるように選択し、決定す
る。目的プログラム出力部１９は、コード生成部１６で
生成されたコードが、特定空間配置手続決定部１８に問
い合わせた結果、特定空間配置手続の定義部のコードで
あるならば、当該コードを特定空間への配置属性を付加
したセグメントに出力し、特定空間配置手続の定義部の
コードでないならば、当該コードを通常のセグメントに
出力する。ここで、セグメントとは、コードをプログラ
ム空間に配置する際に、配置の最小単位であるコードの
集まりを意味する。以上のように、目的プログラム出力
部１９は、特定空間配置手続と通常の手続とを分離して
出力する。次に、目的プログラム出力部１９は、変数領
域等のデータを出力し、コード部とデータ部とを合わせ
て目的プログラムとして出力し、目的プログラム記憶部
１３に記憶する。以上の構成によれば、生成する目的プ
ログラムのコードサイズを削減でき、これに伴い、プロ
グラム空間を節約できると共に、計算機やＣＰＵが目的
プログラムを実行した際の実行速度を速くすることがで
きる。

【０００８】

【発明が解決しようとする課題】上記特開平１-１１８
９３１号公報に開示された従来のプログラム変換装置に
おいて、手続の命令コードの配置最適化は、ユーザが原
始プログラム中で定義した手続だけが対象であるので、
目的プログラムの効率化にも限界がある。一方、上記特
開平９−３４７２５号公報に開示された従来のプログラ
ム変換装置においては、特定空間が有限なコードサイズ
であるので、特定空間に配置される手続が限られてお
り、この場合も、目的プログラムの効率化に限界があ
る。

【０００９】ところで、プログラム変換装置で作成され
た目的プログラムを、ＣＰＵやデコーダ等からなる１チ
ップ・マイクロ・コンピュータで実行する場合、目的プ
ログラムはその外部の主記憶装置に記憶されており、主
記憶装置から目的プログラムの各コードが順次読み出さ
れ、デコーダでデコードされた後、ＣＰＵがそれを解釈
して実行する。この場合、ＣＰＵの実行速度を速くする
ために、通常、記憶容量は大きいがアクセス・タイムの
長い主記憶装置から読み出されたコードを一時的に記憶
する、記憶容量は小さいがアクセス・タイムの短いキャ
ッシュ・メモリが１チップ・マイクロ・コンピュータ内
に設けられている。

【００１０】このキャッシュ・メモリが設けられた１チ
ップ・マイクロ・コンピュータの中には、ＣＰＵがコー
ドを実行する場合、主記憶装置から読み出された目的プ
ログラムの各コードが一旦キャッシュ・メモリに記憶さ
れた後でなければ、それをデコーダでデコードし、ＣＰ
Ｕで解釈して実行することができないものがある。この
種の１チップ・マイクロ・コンピュータにおいて、主記
憶装置から読み出した各コードをキャッシュ・メモリに
記憶する方法には、各種あるが、その１つとしてダイレ
クト・マップ方式がある。ダイレクト・マップ方式で
は、図１７に示すように、キャッシュ・メモリ２１が複
数の記憶領域（これをキャッシュ・ラインという）に分
割されていると共に、主記憶装置２２の各記憶領域も分
割されており、主記憶装置２２の各記憶領域がキャッシ
ュ・メモリ２１の各キャッシュ・ラインに対応づけられ
ている。図１７では、キャッシュ・メモリ２１は５個の
キャッシュ・ライン２１a〜２１eからなり、それに対応
して主記憶装置２２も１個のキャッシュ・ラインと同一
の記憶容量を有する記憶領域毎に分割され、各記憶領域
は５個を単位としてそれぞれ５個のキャッシュ・ライン
２１a〜２１eに対応づけられている。即ち、主記憶装置
２２の記憶領域２２1a〜２２1eはひとまとまりでキャッ
シュ・ライン２１a〜２１eに対応づけられ、同様に、記
憶領域２２2a〜２２2eはキャッシュ・ライン２１a〜２
１eに対応づけられ、最後の領域２２na〜２２ne（ｎは
自然数）はキャッシュ・ライン２１a〜２１eに対応づけ
られている。

【００１１】このようなダイレクト・マップ方式が採用
されている１チップ・マイクロ・コンピュータで実行さ
れるべき目的プログラムをプログラム変換装置を用いて
作成する場合、以下に示す不都合がある。例えば、図１
８に示すＣ言語で記述された原始プログラムをプログラ
ム変換装置で目的プログラムに変換した結果、図１９に
示すように、手続ｆｕｎｃ＿Ａ及び手続ｆｕｎｃ＿Ｂの
それぞれの命令コードが主記憶装置２２に記憶されると
する。図１９では、手続ｆｕｎｃ＿Ａの命令コードは主
記憶装置２２の記憶領域２２1a〜２２1cに記憶され、手
続ｆｕｎｃ＿Ｂの命令コードは主記憶装置２２の記憶領
域２２2a及び２２1bに記憶されている。したがって、手
続ｆｕｎｃ＿Ａの命令コードはキャッシュ・メモリ２１
のキャッシュ・ライン２１a〜２１cに対応づけられ、手
続ｆｕｎｃ＿Ｂの命令コードはキャッシュ・メモリ２１
のキャッシュ・ライン２１a及び２１bに対応づけられて
いる。

【００１２】このような場合、ＣＰＵが図１８に示す原
始プログラムを変換した目的プログラムを実行すると、
まず、手続ｆｕｎｃ＿Ａの命令コードが主記憶装置２２
の記憶領域２２1a〜２２1cから読み出され、一旦キャッ
シュ・メモリ２１のキャッシュ・ライン２１a〜２１cに
記憶された後、デコーダでデコードされ、ＣＰＵが解釈
して実行する。次に、手続ｆｕｎｃ＿Ｂの命令コードが
主記憶装置２２の記憶領域２２2a及び２２1bから読み出
され、キャッシュ・メモリ２１のキャッシュ・ライン２
１a及び２１bに一旦記憶される。今、キャッシュ・メモ
リ２１のキャッシュ・ライン２１a及び２１bには既に手
続ｆｕｎｃ＿Ａの命令コードの一部が記憶されている
が、手続ｆｕｎｃ＿Ｂの命令コードが記憶される（上書
き）ことにより、その手続ｆｕｎｃ＿Ａの命令コードの
一部は以後読み出すことができなくなる。この後、キャ
ッシュ・メモリ２１のキャッシュ・ライン２１a及び２
１bに記憶されている手続ｆｕｎｃ＿Ｂの命令コードが
デコーダでデコードされ、ＣＰＵが解釈して実行する。
次に、図１８に示す原始プログラムによれば、手続ｆｕ
ｎｃ＿Ａの命令コードを再び実行しなければならない
が、キャッシュ・メモリ２１のキャッシュ・ライン２１
a及び２１bには既に手続ｆｕｎｃ＿Ｂの命令コードが記
憶されており、手続ｆｕｎｃ＿Ａの命令コードの一部は
読み出すことができないので、再び手続ｆｕｎｃ＿Ａの
命令コードが主記憶装置２２の記憶領域２２1a〜２２1b
から読み出され、一旦キャッシュ・メモリ２１のキャッ
シュ・ライン２１a〜２１bに記憶された後、デコーダで
デコードされ、ＣＰＵが解釈して実行する。

【００１３】以上説明したように、時間的に連続して実
行される可能性の高い２つの手続の命令コードがキャッ
シュ・メモリ２１の同一のキャッシュ・ラインに対応し
た主記憶装置２２の記憶領域に記憶されている場合（こ
れを同一のキャッシュ・ラインに載るという）には、先
に主記憶装置２２から読み出されキャッシュ・メモリ２
１に記憶された手続の命令コードの全部又は一部は、後
から主記憶装置２２から読み出された手続の命令コード
がキャッシュ・メモリ２１の同一のキャッシュ・ライン
に上書きされることにより、読み出すことができなくな
ってしまう。このような状態を衝突（キャッシュ・コン
フリクト；cache conflict）という。この衝突が頻繁に
起こってしまうと、ＣＰＵの実行速度を速くするために
キャッシュ・メモリを設けた効果が半減するどころか、
場合によっては逆にＣＰＵの実行速度が遅くなってしま
う。

【００１４】なお、主記憶装置から読み出した各コード
をキャッシュ・メモリに記憶する方法には、ダイレクト
・マップ方式以外にも、主記憶装置のデータをキャッシ
ュ・メモリ上のどのキャッシュ・ラインに記憶しても良
いフル・アソシアティブ方式や、ダイレクト・マップ方
式とフル・アソシアティブ方式の中間の方式であって、
主記憶装置のデータを配置可能なキャッシュ・メモリ上
のキャッシュ・ラインが複数存在するセット・アソシア
ティブ方式など各種ある。いずれの方式の場合も、主記
憶装置よりもキャッシュ・メモリの記憶容量が少ないの
で、以上説明したキャッシュ・メモリ上での手続の衝突
が発生する可能性はある。

【００１５】ところが、上記特開平１-１１８９３１号
公報及び特開平９−３４７２５号公報に開示された従来
のプログラム変換装置においては、以上の衝突に関して
何等考慮されていないので、手続の命令コードの配置最
適化や手続の特定空間への配置を行った結果、時間的に
連続して実行される可能性の高い２つの手続の命令コー
ドがキャッシュ・メモリ２１の同一のキャッシュ・ライ
ンに載る場合には、上記衝突は避けられない。したがっ
て、目的プログラム全体のコードサイズは削減できたと
しても、ＣＰＵの実行速度を速くすることはできない。

【００１６】また、目的プログラム実行中に頻繁に用い
る手続は、キャッシュ・メモリ２１に当該命令コードが
そもそも記憶されていなかったり、上記衝突のために当
該命令コードを読み出せない（これらを合わせてキャッ
シュ・ミスという）ために、用いる度に主記憶装置２２
から当該命令コードを読み出してキャッシュ・メモリ２
１の対応するキャッシュ・ラインに記憶するのでは、Ｃ
ＰＵの実行速度を速くできない。そこで、頻繁に用いる
手続をキャッシュ・メモリ２１にできるだけ長く、しか
も他の手続と衝突することなく記憶しておく必要があ
る。ところが、上記特開平１-１１８９３１号公報及び
特開平９−３４７２５号公報に開示された従来のプログ
ラム変換装置においては、上記のような目的プログラム
実行時におけるキャッシュ・ミスについては何等考慮し
ていない。したがって、この点についても、ＣＰＵの実
行速度を速くすることはできない。

【００１７】この発明は、上述の事情に鑑みてなされた
もので、様々な手続相互間におけるキャッシュ・メモリ
上での衝突を防止できると共に、頻繁に用いる手続のキ
ャッシュ・ミスを防止でき、これにより、計算機やＣＰ
Ｕが目的プログラムを実行した際の実行速度を速くする
ことができるプログラム変換方法、プログラム変換装置
及びプログラム変換プログラムを記憶した記憶媒体を提
供することを目的としている。

【００１８】

【課題を解決するための手段】上記課題を解決するため
に、請求項１記載の発明は、プログラミング言語で記述
された原始プログラムを計算機や中央処理装置が実行可
能な言語で記述された目的プログラムに変換するプログ
ラム変換方法に係り、上記原始プログラムで用いられて
いる手続、関数、あるいはサブルーチンの少なくとも一
部を、上記目的プログラムが上記計算機や中央処理装置
で用いられる際に記憶される主記憶装置の任意の記憶領
域に記憶可能に変換する第１の処理と、上記原始プログ
ラムを上記目的プログラムに変換する過程で得られる上
記手続、関数、あるいはサブルーチンに関する情報に基
づいて、上記第１の処理で変換され又は変換されなかっ
た手続、関数、あるいはサブルーチンを、上記主記憶装
置のいずれの記憶領域に記憶すべきかを決定し、その決
定結果に基づいて上記目的プログラムを生成する第２の
処理とからなることを特徴としている。

【００１９】請求項２記載の発明は、請求項１記載のプ
ログラム変換方法に係り、上記手続、関数、あるいはサ
ブルーチンは、ユーザが上記原始プログラム中で定義し
たもの、ユーザにより定義され検査が終了したもの、上
記プログラミング言語において処理系で予め用意されて
いるもの、命令コードの形式で予め用意されているもの
のうち、少なくとも１つからなることを特徴としてい
る。

【００２０】請求項３記載の発明は、請求項１又は２記
載のプログラム変換方法に係り、上記情報は、上記原始
プログラムから変換された一時的な目的プログラムを実
行することにより得られる、上記手続、関数、あるいは
サブルーチンが実際に呼び出される回数を示す情報と、
上記手続、関数、あるいはサブルーチン同士が互いを呼
び出す関係を示す情報とからなることを特徴としてい
る。

【００２１】請求項４記載の発明は、プログラミング言
語で記述された原始プログラムを計算機や中央処理装置
が実行可能な言語で記述された目的プログラムに変換す
るプログラム変換方法に係り、上記原始プログラムで用
いられている手続、関数、あるいはサブルーチンのう
ち、ユーザにより定義され検査が終了したもの、上記プ
ログラミング言語において処理系で予め用意されている
もの、命令コードの形式で予め用意されているものの少
なくとも一部を、上記目的プログラムが上記計算機や中
央処理装置で用いられる際に記憶される主記憶装置の任
意の記憶領域に記憶可能に変換する第１の処理と、上記
原始プログラムを目的プログラムに変換すると共に、上
記目的プログラムについて、ユーザが上記原始プログラ
ム中で定義した手続、関数、あるいはサブルーチンを上
記主記憶装置の任意の記憶領域に記憶可能に変換する第
２の処理と、上記第１の処理で変換された手続、関数、
あるいはサブルーチンと、上記第２の処理で得られた目
的プログラムとを結合する第３の処理と、上記第３の処
理で得られた目的プログラムを実行しつつ、上記手続、
関数、あるいはサブルーチンが実際に呼び出される回数
を示す情報と、上記手続、関数、あるいはサブルーチン
同士が互いを呼び出す関係を示す情報とからなる動的情
報を収集する第４の処理と、上記動的情報に基づいて、
上記手続、関数、あるいはサブルーチンを、上記主記憶
装置のいずれの記憶領域に記憶すべきかを決定し、配置
情報を生成する第５の処理と、上記配置情報に基づい
て、上記第１の処理で変換された手続、関数、あるいは
サブルーチンと、上記第２の処理で得られた目的プログ
ラムとを結合して、最終的な目的プログラムを生成する
第６の処理とからなることを特徴としている。

【００２２】請求項５請求項１記載の発明は、プログラ
ミング言語で記述された原始プログラムを計算機や中央
処理装置が実行可能な言語で記述された目的プログラム
に変換するプログラム変換方法に係り、上記原始プログ
ラムを一時的な目的プログラムに変換すると共に、上記
一時的な目的プログラムを実行した際に上記手続、関
数、あるいはサブルーチンが実際に呼び出される回数を
カウントするコードを挿入する第１の処理と、上記原始
プログラムで用いられている手続、関数、あるいはサブ
ルーチンのうち、ユーザにより定義され検査が終了した
もの、上記プログラミング言語において処理系で予め用
意されているもの、命令コードの形式で予め用意されて
いるものと、上記第１の処理で得られた一時的な目的プ
ログラムとを結合する第２の処理と、上記第２の処理で
得られた一時的な目的プログラムを実行しつつ、上記手
続、関数、あるいはサブルーチンが実際に呼び出される
回数を示す情報と、上記手続、関数、あるいはサブルー
チン同士が互いを呼び出す関係を示す情報とからなる動
的情報を収集する第３の処理と、上記動的情報に基づい
て、上記手続、関数、あるいはサブルーチンを、上記主
記憶装置のいずれの記憶領域に記憶すべきかを決定し、
配置情報を生成する第４の処理と、上記原始プログラム
で用いられている手続、関数、あるいはサブルーチンの
うち、ユーザにより定義され検査が終了したもの、上記
プログラミング言語において処理系で予め用意されてい
るもの、命令コードの形式で予め用意されているものの
少なくとも一部を、上記目的プログラムが上記計算機や
中央処理装置で用いられる際に記憶される主記憶装置の
任意の記憶領域に記憶可能に変換する第５の処理と、上
記原始プログラムを目的プログラムに変換した後、上記
目的プログラムについて、ユーザが上記原始プログラム
中で定義した手続、関数、あるいはサブルーチンを上記
主記憶装置の任意の記憶領域に記憶可能に変換する第６
の処理と、上記配置情報に基づいて、上記第５の処理で
変換された手続、関数、あるいはサブルーチンと、上記
第６の処理で得られた目的プログラムとを結合して、最
終的な目的プログラムを生成する第７の処理とからなる
ことを特徴としている。

【００２３】請求項６記載の発明は、プログラミング言
語で記述された原始プログラムを計算機や中央処理装置
が実行可能な言語で記述された目的プログラムに変換す
るプログラム変換装置に係り、上記原始プログラムで用
いられている手続、関数、あるいはサブルーチンの少な
くとも一部を、上記目的プログラムが上記計算機や中央
処理装置で用いられる際に記憶される主記憶装置の任意
の記憶領域に記憶可能に変換する手続等変換手段と、上
記原始プログラムを上記目的プログラムに変換する過程
で得られる上記手続、関数、あるいはサブルーチンに関
する情報に基づいて、上記手続等変換手段で変換され又
は変換されなかった手続、関数、あるいはサブルーチン
を、上記主記憶装置のいずれの記憶領域に記憶すべきか
を決定し、その決定結果に基づいて上記目的プログラム
を生成するプログラム変換手段とを備えてなることを特
徴としている。

【００２４】請求項７記載の発明は、請求項６記載のプ
ログラム変換装置に係り、上記手続、関数、あるいはサ
ブルーチンは、ユーザが上記原始プログラム中で定義し
たもの、ユーザにより定義され検査が終了したもの、上
記プログラミング言語において処理系で予め用意されて
いるもの、命令コードの形式で予め用意されているもの
のうち、少なくとも１つからなることを特徴としてい
る。

【００２５】請求項８記載の発明は、請求項６又７記載
のプログラム変換方法に係り、上記情報は、上記原始プ
ログラムから変換された一時的な目的プログラムを実行
することにより得られる、上記手続、関数、あるいはサ
ブルーチンが実際に呼び出される回数を示す情報と、上
記手続、関数、あるいはサブルーチン同士が互いを呼び
出す関係を示す情報とからなることを特徴としている。

【００２６】請求項９記載の発明は、プログラミング言
語で記述された原始プログラムを計算機や中央処理装置
が実行可能な言語で記述された目的プログラムに変換す
るプログラム変換装置に係り、上記原始プログラムで用
いられている手続、関数、あるいはサブルーチンのう
ち、ユーザにより定義され検査が終了したもの、上記プ
ログラミング言語において処理系で予め用意されている
もの、命令コードの形式で予め用意されているものの少
なくとも一部を、上記目的プログラムが上記計算機や中
央処理装置で用いられる際に記憶される主記憶装置の任
意の記憶領域に記憶可能に変換する手続等変換手段と、
上記原始プログラムを目的プログラムに変換すると共
に、上記目的プログラムについて、ユーザが上記原始プ
ログラム中で定義した手続、関数、あるいはサブルーチ
ンを上記主記憶装置の任意の記憶領域に記憶可能に変換
するプログラム変換手段と、上記手続等変換手段で変換
された手続、関数、あるいはサブルーチンと、上記プロ
グラム変換手段で得られた目的プログラムとを結合する
結合手段と、上記結合手段で得られた目的プログラムを
実行しつつ、上記手続、関数、あるいはサブルーチンが
実際に呼び出される回数を示す情報と、上記手続、関
数、あるいはサブルーチン同士が互いを呼び出す関係を
示す情報とからなる動的情報を収集する動的情報収集手
段と、上記動的情報に基づいて、上記手続、関数、ある
いはサブルーチンを、上記主記憶装置のいずれの記憶領
域に記憶すべきかを決定し、配置情報を生成する最適化
手段とを備え、上記結合手段は、上記配置情報に基づい
て、上記手続等変換手段で変換された手続、関数、ある
いはサブルーチンと、上記プログラム変換手段で得られ
た目的プログラムとを結合して、最終的な目的プログラ
ムを生成することを特徴としている。

【００２７】請求項１０記載の発明は、プログラミング
言語で記述された原始プログラムを計算機や中央処理装
置が実行可能な言語で記述された目的プログラムに変換
するプログラム変換装置に係り、上記原始プログラムを
一時的な目的プログラムに変換すると共に、上記一時的
な目的プログラムを実行した際に上記手続、関数、ある
いはサブルーチンが実際に呼び出される回数をカウント
するコードを挿入するプログラム変換手段と、上記原始
プログラムで用いられている手続、関数、あるいはサブ
ルーチンのうち、ユーザにより定義され検査が終了した
もの、上記プログラミング言語において処理系で予め用
意されているもの、命令コードの形式で予め用意されて
いるものと、上記プログラム変換手段で得られた一時的
な目的プログラムとを結合する結合手段と、上記結合手
段で得られた一時的な目的プログラムを実行しつつ、上
記手続、関数、あるいはサブルーチンが実際に呼び出さ
れる回数を示す情報と、上記手続、関数、あるいはサブ
ルーチン同士が互いを呼び出す関係を示す情報とからな
る動的情報を収集する動的情報収集手段と、上記動的情
報に基づいて、上記手続、関数、あるいはサブルーチン
を、上記主記憶装置のいずれの記憶領域に記憶すべきか
を決定し、配置情報を生成する最適化手段と、上記原始
プログラムで用いられている手続、関数、あるいはサブ
ルーチンのうち、ユーザにより定義され検査が終了した
もの、上記プログラミング言語において処理系で予め用
意されているもの、命令コードの形式で予め用意されて
いるものの少なくとも一部を、上記目的プログラムが上
記計算機や中央処理装置で用いられる際に記憶される主
記憶装置の任意の記憶領域に記憶可能に変換する手続等
変換手段とを備え、上記プログラム変換手段は、上記原
始プログラムを目的プログラムに変換すると共に、上記
目的プログラムについて、ユーザが上記原始プログラム
中で定義した手続、関数、あるいはサブルーチンを上記
主記憶装置の任意の記憶領域に記憶可能に変換し、上記
結合手段は、上記配置情報に基づいて、上記手続等変換
手段で変換された手続、関数、あるいはサブルーチン
と、上記プログラム変換手段で得られた目的プログラム
とを結合して、最終的な目的プログラムを生成すること
を特徴としている。

【００２８】請求項１１記載の発明に係る記憶媒体は、
コンピュータに請求項１乃至１０のいずれか１つに記載
の機能を実現させるためのプログラム変換プログラムが
記憶されていることを特徴としている。

【００２９】

【作用】この発明の構成によれば、様々な手続相互間に
おけるキャッシュ・メモリ上での衝突を防止できると共
に、頻繁に用いる手続のキャッシュ・ミスを防止でき
る。これにより、計算機やＣＰＵが目的プログラムを実
行した際の実行速度を速くすることができる。

【００３０】

【発明の実施の形態】以下、図面を参照して、この発明
の実施の形態について説明する。説明は、実施例を用い
て具体的に行う。Ａ．第１の実施例図１はこの発明の第１の実施例であるプログラム変換装
置の電気的構成を示すブロック図である。この例のプロ
グラム変換装置は、第１〜第４プログラム記憶部３１〜
３４と、コンパイラ３５と、リンカ３６と、プロファイ
ラ３７と、第１，第２情報記憶部３８，３９と、最適化
部４０と、第１，第２ライブラリ記憶部４１，４２と、
ライブラリ生成部４３とから概略構成されている。第１
プログラム記憶部３１は、ＲＯＭやＲＡＭ等の半導体メ
モリ、ＦＤ（フロッピー・ディスク）、ＨＤ（ハード・
ディスク）やＣＤ−ＲＯＭ等の記憶媒体からなり、例え
ば、Ｃ言語等のプログラミング言語で記述された原始プ
ログラムが予め記憶されている。この実施例では、プロ
グラミング言語としてＣ言語を用いた場合について説明
する。コンパイラ３５は、原始プログラムを再配置可能
目的プログラムにコンパイルした後、手続毎に配置可能
な再配置可能目的プログラムに変換して第２プログラム
記憶部３２に記憶する。ここで、再配置可能目的プログ
ラムとは、主記憶装置のどの記憶領域にも記憶可能な目
的プログラムをいい、手続毎に配置可能とは、再配置可
能目的プログラム内部で手続の配置が可能なことをい
う。

【００３１】なお、この実施例において、手続は、「従
来の技術」で説明したように、本来の意味の手続の他、
関数及びサブルーチンを含めた総称である。この手続に
は、ユーザ手続、ユーザ・ライブラリ手続、標準ライブ
ラリ手続、ランタイム・ライブラリ手続等が含まれる。
ユーザ手続とは、ユーザが原始プログラム中で定義した
手続をいう。例えば、ユーザが図２に示すような原始プ
ログラムを作成した場合、手続ｆｕｎｃ、ｆｕｎｃ１及
びｆｕｎｃ２は全てユーザ手続である。ユーザ・ライブ
ラリ手続とは、元々はユーザ手続であったが、汎用性が
高いと思われるものをデバッグ等の検査後、第１ライブ
ラリ記憶部４１に記憶したものをいう。例えば、図２に
示す原始プログラムを再配置可能目的プログラムにコン
パイルした後、デバッグ等の処理をして第１ライブラリ
記憶部４１に記憶した場合には、手続ｆｕｎｃ、ｆｕｎ
ｃ１及びｆｕｎｃ２は全てユーザ・ライブラリ手続とな
る。標準ライブラリ手続とは、原始プログラムを記述す
るために使用されるプログラミング言語においてコンパ
イラなどの処理系で予め用意されており、ユーザが定義
せずに使用できる手続をいう。例えば、Ｃ言語では、文
字列を標準出力に出力する手続ｐｒｉｎｔｆや、文字列
の長さを返す手続ｓｔｒｌｅｎなどである。ランタイム
・ライブラリ手続とは、汎用性が高いがコードサイズが
大きいため、予め命令コードで記述された手続の形式で
第１ライブラリ記憶部４１に予め記憶された手続をい
う。汎用性が高いがサイズが大きい命令列は、コンパイ
ラ３５が目的プログラムを生成する度に命令コードを生
成するのは効率的でないので、そのような命令列を予め
命令コードで記述された手続の形式とし、目的プログラ
ム生成時にその手続を呼び出すコードを生成し、リンカ
３６において後でリンクするのである。例えば、最終的
な目的プログラムを実行するＣＰＵ等が浮動小数点用の
命令を有しないのも拘らず、原始プログラムにｆｌｏａ
ｔ型の変数や演算が記述されている場合、コンパイラ３
５は複数の命令列で構成された手続、例えば、ｆｌｏａ
ｔ用手続ａｄｄや、ｆｌｏａｔ用手続ｓｕｂ等を用いて
目的プログラムを生成する。この時のｆｌｏａｔ用手続
ａｄｄやｆｌｏａｔ用手続ｓｕｂがランタイム・ライブ
ラリ手続である。

【００３２】第２プログラム記憶部３２は、ＲＡＭ等の
半導体メモリ、ＦＤやＨＤ等の記憶媒体からなり、手続
毎に配置可能な再配置可能目的プログラムが記憶され
る。リンカ３６は、第２プログラム記憶部３２に記憶さ
れた手続毎に配置可能な再配置可能目的プログラムと、
第２ライブラリ記憶部４２に記憶された手続毎に配置可
能な再配置可能ライブラリ（後述）とをリンクして実行
可能な一時的な目的プログラムを生成して第３プログラ
ム記憶部３３に記憶すると共に、第２情報記憶部３９に
記憶された配置情報（後述）に基づいて、手続毎に配置
可能な再配置可能目的プログラムと手続毎に配置可能な
再配置可能ライブラリとをリンクして実行可能な最終的
な目的プログラムを生成して第４プログラム記憶部３４
に記憶する。第３プログラム記憶部３３は、ＲＡＭ等の
半導体メモリ、ＦＤやＨＤ等の記憶媒体からなり、一時
的な目的プログラムが記憶される。第４プログラム記憶
部３４は、ＲＡＭ等の半導体メモリ、ＦＤやＨＤ等の記
憶媒体からなり、最終的な目的プログラムが記憶され
る。プロファイラ３７は、ハードウェア・エミュレータ
やソフトウェア・シミュレータ等からなり、第３プログ
ラム記憶部３３から読み込んだ一時的な目的プログラム
を実行しつつ、各手続相互間の呼出関係、各手続の呼出
回数、ループ構造情報等からなる動的情報（プロファイ
ル情報）を収集し、得られた動的情報を第１情報記憶部
３８に記憶する。ループ構造情報とは、ある手続がルー
プ構造の中で呼ばれたことを示す情報をいう。具体的に
は、原始プログラムのループ構造にプロファイラ３７の
動作時にループ構造の開始と終了を認識できる何らかの
マーカを記述しておき、プロファイラ３７が動作時にそ
のマーカによりループ構造の開始と終了を認識すること
により、そのループ構造中で呼ばれた手続はループ構造
に属していることが認識できる。これにより、ループ構
造中の手続同士が時間的に連続して実行される可能性の
高いと判断できるのである。

【００３３】第１情報記憶部３８は、ＲＡＭ等の半導体
メモリ、ＦＤやＨＤ等の記憶媒体からなり、動的情報が
記憶される。最適化部４０は、第１情報記憶部３８に記
憶された動的情報に基づいて、時間的に連続して実行さ
れる可能性の高い手続同士がキャッシュ・メモリ上で衝
突したり、頻繁に用いる手続のキャッシュ・ミスが起こ
らないように、全ての手続の配置最適化を行って、リン
カ３６に手続の配置を指示するための配置情報を生成
し、第２情報記憶部３９に記憶する。第２情報記憶部３
９は、ＲＡＭ等の半導体メモリ、ＦＤやＨＤ等の記憶媒
体からなり、配置情報が記憶される。第１ライブラリ記
憶部４１は、ＲＯＭやＲＡＭ等の半導体メモリ、ＦＤ、
ＨＤやＣＤ−ＲＯＭ等の記憶媒体からなり、標準ライブ
ラリ手続、ランタイム・ライブラリ手続及びユーザ・ラ
イブラリ手続を含んだ再配置可能ライブラリがそれぞれ
記憶されている。ここで、再配置可能ライブラリも再配
置可能目的プログラムであるが、コンパイラ３５が生成
した再配置可能目的プログラムと区別するために、第１
ライブラリ記憶部４１に記憶された再配置可能目的プロ
グラムを再配置可能ライブラリと呼ぶことにする。ライ
ブラリ生成部４３は、第１ライブラリ記憶部４１に記憶
された再配置可能ライブラリを手続毎に配置可能な再配
置可能ライブラリに変換して第２ライブラリ記憶部４２
に記憶する。第２ライブラリ記憶部４２は、ＲＡＭ等の
半導体メモリ、ＦＤやＨＤ等の記憶媒体からなり、手続
毎に配置可能な再配置可能ライブラリが記憶される。

【００３４】次に、上記構成を有するプログラム変換装
置の動作について、図３〜図１０を参照して説明する。
まず、図３に示すステップＳＡ１では、ライブラリ生成
部４３は、第１ライブラリ記憶部４１に記憶された各再
配置可能ライブラリについて、手続単位を認識して手続
毎に配置可能な再配置可能ライブラリに変換し、第２ラ
イブラリ記憶部４２に記憶する。１つの再配置可能ライ
ブラリ内の複数の手続は、通常、１つのまとまりとして
配置の単位であるセクション、例えば、テキスト・セク
ション（．ｔｅｘｔ・セクション）に属し、リンカ３６
におけるリンク時にはテキスト・セクションとしてまと
めて配置されるので、個々の手続単位で配置できない。
そこで、手続単位に個別のセクションに分割すれば、リ
ンカ３６におけるリンク時に手続単位で適宜配置するこ
とが可能となる。以下、再配置可能ライブラリ内のテキ
スト・セクションを手続単位のセクションに分割する手
順を説明する。まず、手続の先頭には、手続の外部でも
使用可能であることを示すグローバル属性や手続の属性
等に関するシンボル情報が付加されているので、それを
手続の先頭アドレスを参照するための手続の先頭ラベル
として認識する。次に、上記各手続の先頭ラベルの認識
に基づいて、"手続名＿原始プログラム名"のように、手
続毎に別の名称を有するセクションを新たに生成し、再
配置可能ライブラリ内のセクションに関する情報をまと
めて、再配置可能ライブラリ内のある部分、例えば、セ
クション・ヘッダ部に新規に登録する。なお、再配置可
能ライブラリ内において、テキスト・セクションが不要
な場合には削除する。再配置可能ライブラリは、各種の
情報の再配置可能ライブラリ内における位置を示すオフ
セットを各箇所に有しているので、上記のように新規の
セクションが追加された場合には、これらのオフセット
がずれてしまう。そこで、オフセットを更新する。以上
の処理を経た各再配置可能ライブラリを手続毎に配置可
能な再配置可能ライブラリとして第２ライブラリ記憶部
４２に記憶する。

【００３５】ステップＳＡ２では、コンパイラ３５は、
原始プログラムを再配置可能目的プログラムにコンパイ
ルした後、ステップＳＡ１におけるライブラリ生成部４
３の処理と同様の処理により、再配置可能目的プログラ
ムを手続毎に配置可能な再配置可能目的プログラムに変
換して第２プログラム記憶部３２に記憶する。ステップ
ＳＡ３では、リンカ３６は、第２プログラム記憶部３２
に記憶された手続毎に配置可能な再配置可能目的プログ
ラムと、第２ライブラリ記憶部４２に記憶された手続毎
に配置可能な再配置可能ライブラリとをリンクして実行
可能な一時的な目的プログラムを生成して第３プログラ
ム記憶部３３に記憶する。ステップＳＡ４では、プロフ
ァイラ３７は、第３プログラム記憶部３３から読み込ん
だ一時的な目的プログラムを実行しつつ、各手続相互間
の呼出関係、各手続の呼出回数、ループ構造情報等から
なる動的情報を収集し、得られた動的情報を第１情報記
憶部３８に記憶する。ステップＳＡ５では、最適化部４
０は、第１情報記憶部３８に記憶された動的情報に基づ
いて、全ての手続の配置最適化を行って配置情報を生成
し、第２情報記憶部３９に記憶する。この手続の配置最
適化の詳細については、後述する。ステップＳＡ６で
は、リンカ３６は、第２情報記憶部３９に記憶された配
置情報に基づいて、手続毎に配置可能な再配置可能目的
プログラムと手続毎に配置可能な再配置可能ライブラリ
とをリンクして実行可能な最終的な目的プログラムを生
成して第４プログラム記憶部３４に記憶した後、一連の
処理を終了する。

【００３６】次に、最適化部４０の手続の配置最適化処
理について、図４〜図１０を参照して説明する。キャッ
シュ・メモリを効率よく使用するための手続の配置最適
化方法には各種あるが、この実施例においては、"Effic
ient Procedure Mapping Using Cache Line Coloring",
A. H. Hasemi, et al., SIGPLAN, pp. 171-182, June,
1997に開示されたキャッシュ・ライン・カラーリング
による配置方法を採用する。まず、前提として、このプ
ログラム変換装置により作成され、主記憶装置に記憶さ
れた目的プログラムの各コードは、主記憶装置から読み
出された後、上記したダイレクト・マップ方式で、４個
のキャッシュ・ラインからなるキャッシュ・メモリに記
憶されるものとする。コンパイルすべき原始プログラム
には、７個の手続Ａ〜Ｇがこの順で記述されており、原
始プログラムを目的プログラムにコンパイルした場合の
各手続Ａ〜Ｇのコード・サイズ、即ち、キャッシュ・メ
モリを構成するキャッシュ・ラインを占める数（キャッ
シュ・ライン数）は、図５に示すものとする。また、プ
ロファイラ３７における動的解析の結果、手続Ａから手
続Ｂを呼び出す頻度は９０、手続Ｂから手続Ｃを呼び出
す頻度は８０、手続Ｃから手続Ｄを呼び出す頻度は７
０、手続Ａから手続Ｅを呼び出す頻度は４０、手続Ｅか
ら手続Ｃを呼び出す頻度は１００、手続Ｅから手続Ｆを
呼び出す頻度は０、手続Ｆから手続Ｇを呼び出す頻度は
０であるとする。このキャッシュ・ライン・カラーリン
グによる配置方法は、後述する手続呼出グラフを用い
て、一世代（直接ある手続から他の手続を呼び出す関
係）におけるキャッシュ・メモリ上での衝突を低減する
ものである。この配置方法では、各キャッシュ・ライン
に「色」を割り当て、配置するのに必要な「色」の数、
即ち、キャッシュ・ライン数、手続が配置された
「色」、及び利用不可能集合を用いて手続の配置を行
う。この実施例では、第１番目のキャッシュ・ラインに
は赤（ｒ）が、第２番目のキャッシュ・ラインには緑
（ｇ）が、第３番目のキャッシュ・ラインには青（ｂ）
が、第４番目のキャッシュ・ラインには黄（ｙ）がそれ
ぞれ割り当てられている。また、利用不可能集合とは、
直接に呼び出し呼び出される関係にある手続同士であ
り、配置済の手続が占める「色」の合併集合をいう。

【００３７】まず、図４に示すステップＳＢ１では、最
適化部４０は、第１情報記憶部３８に記憶された動的情
報に基づいて、図６に示す手続呼出グラフを作成する。
図６において、ノードのＡ〜Ｇは手続を示し、ノード間
の辺は手続の呼出関係を示し、辺に付加された数値は、
ノードの始点、即ち、矢印の手前の手続から、ノードの
終点、即ち、矢印の先の手続を呼び出す呼出頻度を示
す。ステップＳＢ２では、手続呼出グラフについて、辺
とノードを呼出頻度の高いグループと低いグループとに
分割する。この実施例においては、図６からわかるよう
に、呼出頻度の高いグループは、ノードがノードＡ〜
Ｅ、辺がノードＡからノードＢへ向かう辺、ノードＡか
らノードＥへ向かう辺、ノードＢからノードＣへ向かう
辺、ノードＣからノードＤへ向かう辺、ノードＥからノ
ードＣへ向かう辺である。一方、呼出頻度の低いグルー
プは、ノードがノードＦ及びＧ、辺がノードＥからノー
ドＦへ向かう辺、ノードＦからノードＧへ向かう辺であ
る。ステップＳＢ３では、各グループ内で辺及びノード
を並び替える。即ち、呼出頻度の高いグループでは辺に
付加された数値が大きい順に辺を並び替える。これに対
して、呼出頻度の低いグループでは手続のキャッシュ・
ライン数の大きい順にノードを並び替え、主にプログラ
ム空間の空きを埋めるために配置される。この実施例に
おいては、図６からわかるように、呼出頻度の高いグル
ープでは、辺は、ノードＥからノードＣへ向かう辺、ノ
ードＡからノードＢへ向かう辺、ノードＢからノードＣ
へ向かう辺、ノードＣからノードＤへ向かう辺、ノード
ＡからノードＥへ向かう辺の順となる。一方、呼出頻度
の低いグループでは、図５からわかるように、手続Ｇの
キャッシュ・ライン数が２であるのに対し、手続Ｆのキ
ャッシュ・ライン数が１であるので、ノードＧ、ノード
Ｆの順となる。

【００３８】ステップＳＢ４では、呼出頻度の高いグル
ープの辺が残っているか否かを判断する。この判断結果
が「ＹＥＳ」の場合には、ステップＳＢ５へ進む。今の
場合、最初であるので、全ての辺が残っており、ステッ
プＳＢ４の判断結果は「ＹＥＳ」となる。ステップＳＢ
５では、残っている辺のうち、ステップＳＢ３の処理で
並べ替えられた順序で最も高い順位の辺の両側のノード
が未配置か否かを判断する。この判断結果が「ＹＥＳ」
の場合には、ステップＳＢ６へ進む。今の場合、残って
いる辺で最も高い順位の辺は、ノードＥからノードＣへ
向かう辺であり、最初であるので、両側のノードＥ及び
Ｃが未配置である。したがって、ステップＳＢ５の判断
結果は「ＹＥＳ」となる。ステップＳＢ６では、処理の
対象となっている辺の両側のノードを隣接させて配置し
た後、ステップＳＢ７へ進む。この場合、プログラム空
間の任意の位置に配置できる。今の場合、手続Ｅ及び手
続Ｃは、図５からわかるように、共にキャッシュ・ライ
ン数が２であるので、図７の第１段に示すように、手続
Ｅの部分Ｅ１及びＥ２は、第１及び第２番目のキャッシ
ュ・ライン（色は赤（ｒ）及び緑（ｇ））に配置され、
手続Ｃの部分Ｃ１及びＣ２は、第３及び第４番目のキャ
ッシュ・ライン（色は青（ｂ）及び黄（ｙ））に配置さ
れる。この場合、ノードＥ及びＣは併合（マージ）され
て単一のノードになったと考え、複合ノードＥ−Ｃと呼
ぶ。ステップＳＢ７では、利用不可能集合を更新した
後、ステップＳＢ４へ戻る。ノードＥの場合、直接呼び
出す関係にあるノードＣが配置されているキャッシュ・
ラインの「色」は青（ｂ）及び黄（ｙ）であるので、利
用不可能集合は、Ｅ｛ｂ，ｙ｝となる。同様に、ノード
Ｃの場合、直接呼び出される関係にあるノードＥが配置
されているキャッシュ・ラインの「色」は赤（ｒ）及び
緑（ｇ）であるので、利用不可能集合は、Ｃ｛ｒ，ｇ｝
となる。

【００３９】以上説明したステップＳＢ４〜ＳＢ７の処
理を、呼出頻度の高いグループの辺のうち、両側のノー
ドが未配置の辺がなくなるまで繰り返す。そして、呼出
頻度の高いグループの辺が残っていない場合には、ステ
ップＳＢ４の判断結果が「ＮＯ」となり、ステップＳＢ
１６へ進む。今の場合、ノードＡからノードＢへ向かう
辺が残っており、その辺の両側のノードＡ及びＢが未配
置であるので、ステップＳＢ６及びＳＢ７の処理を行
う。手続Ａ及び手続Ｂは、図５からわかるように、共に
キャッシュ・ライン数が１であるので、図７の第１段に
示すように、手続Ａは、第３番目のキャッシュ・ライン
（色は青（ｂ））に配置され、手続Ｂは、第４番目のキ
ャッシュ・ライン（色は黄（ｙ））に配置される。そし
て、ノードＡ及びＢは複合ノードＡ−Ｂとなる。次に、
ノードＡの場合、直接呼び出す関係にあるノードＢが配
置されているキャッシュ・ラインの「色」は黄（ｙ）で
あるので、利用不可能集合は、Ａ｛ｙ｝となる。同様
に、ノードＢの場合、直接呼び出される関係にあるノー
ドＡが配置されているキャッシュ・ラインの「色」は青
（ｂ）であるので、利用不可能集合は、Ｂ｛ｂ｝とな
る。なお、図６に示す手続呼出グラフでは、ノードＡか
らノードＥへ向かう辺が残っているにも拘らず、ノード
Ａの利用不可能集合Ａ｛ｙ｝にノードＥが配置されてい
るキャッシュ・ラインの「色」である赤（ｒ）及び緑
（ｇ）が含まれていないが、これは、ノードＡからノー
ドＥへ向かう辺が順位が低いためにまだ処理されていな
いことによる。現状では、ノードＡからノードＥへ向か
う辺に関して衝突が発生する状況になっているが、もと
もと辺の順位に従って処理しているので、このままで良
い。

【００４０】一方、呼出頻度の高いグループの辺は残っ
ているが、その辺のいずれかの側のノードが既に配置済
の場合には、ステップＳＢ５の判断結果が「ＮＯ」とな
り、ステップＳＢ８へ進む。上記の処理において、ノー
ドＥからノードＣへ向かう辺及びノードＡからノードＢ
へ向かう辺が処理され、呼出頻度の高いグループでは、
ノードＢからノードＣへ向かう辺、ノードＣからノード
Ｄへ向かう辺、ノードＡからノードＥへ向かう辺が残っ
ている。しかし、これらの辺はいずれも一方のノードが
配置済であるので、ステップＳＢ８へ進む。ステップＳ
Ｂ８では、処理の対象となっている辺が２個の異なる複
合ノードに属するノードを結ぶ辺であるか否かを判断す
る。この判断結果が「ＹＥＳ」の場合には、ステップＳ
Ｂ９へ進む。今の場合、残っている辺のうち、最も順位
の高い辺であるノードＢからノードＣへ向かう辺は、複
合ノードＥ−Ｃと複合ノードＡ−Ｂを結ぶ辺であるの
で、ステップＳＢ８の判断結果が「ＹＥＳ」となり、ス
テップＳＢ９へ進む。ステップＳＢ９では、処理対象と
なっている辺について、２個の複合ノードを併合して単
一の複合ノードとする。これは、２個の複合ノードのう
ち、併合されたノード数の少ない複合ノード（これを短
い複合ノードという）を併合されたノード数の多い複合
ノード（これを長い複合ノードという）に結合して行
う。短い複合ノードを長い複合ノードに結合する際、プ
ログラム空間上でも同様に短い複合ノードを長い複合ノ
ードに結合する。まず、短い複合ノードを長い複合ノー
ドの左右いずれの側に配置するかを決定する。具体的に
は、長い複合ノードを構成するノードの中で、処理対象
となっている辺を構成するノードの中央の位置が、長い
複合ノードの左右の境界のいずれに近いかを、左右の境
界に到達するのに要するキャッシュ・ライン数で判断
し、近い側に短い複合ノードを配置すると決定する。次
に、短い複合ノードの配置する方向を決定して配置す
る。具体的には、処理の対象となっている辺を構成する
複数のノードのうち、長い複合ノードを構成するノード
以外のノードが既に配置された長い複合ノードを構成す
るノードになるべく近くなるように短い複合ノードの向
きを決定して配置する。この場合、短い複合ノードの配
置により衝突が発生するならば、衝突が発生しなくなる
まで順に当該長い複合ノードを構成するノード以外のノ
ードの位置を長い複合ノードを構成するノードから離し
て配置する。しかし、当該長い複合ノードを構成するノ
ード以外のノードの配置位置をどのように変更しても衝
突が避けられない場合には、当初の配置位置に戻す。そ
して、ステップＳＢ１０へ進む。

【００４１】この実施例においては、複合ノードＥ−Ｃ
及び複合ノードＡ−Ｂは共に併合されたノード数が２個
で同じであるので、いずれを短い複合ノードとしても良
いが、今の場合、複合ノードＡ−Ｂを短い複合ノードと
する。次に、長い複合ノードＥ−Ｃを構成するノードＥ
及びＣのうち、処理対象となっているノードＢからノー
ドＣへ向かう辺を構成するノードＣの中央の位置は、図
７の第１段に示すように、部分Ｃ１と部分Ｃ２との間で
あるから、そこから長い複合ノードＥ−Ｃの左側の境界
に到達するのに要するキャッシュ・ライン数は３個であ
るのに対し、右側の境界に到達するのに要するキャッシ
ュ・ライン数は１個である。したがって、長い複合ノー
ドＥ−Ｃの右側に短い複合ノードＡ−Ｂを配置すると決
定する。次に、処理の対象となっているノードＢからノ
ードＣへ向かう辺を構成するノードＢ及びＣのうち、長
い複合ノードＥ−Ｃを構成するノードＣ以外のノードＢ
が既に配置されたノードＣになるべく近くなるように短
い複合ノードＡ−Ｂの向きを決定すると、Ｂ−Ａとなる
が、このように配置しても衝突は発生しないので、その
まま配置する（図７の第２段参照）。これにより、新た
に複合ノードＥ−Ｃ−Ｂ−Ａが生成される。

【００４２】ステップＳＢ１０では、上記配置処理によ
りプログラム空間に空いた領域が発生したか否かを判断
する。この判断結果が「ＮＯ」の場合には、ステップＳ
Ｂ７へ進む。今の場合、空いた領域は発生しないので、
ステップＳＢ７へ進み、利用不可能集合を更新した後、
ステップＳＢ４へ戻る。ノードＡの場合、直接呼び出す
関係にあるノードＢが配置されているキャッシュ・ライ
ンの「色」は赤（ｒ）であるので、利用不可能集合は、
Ａ｛ｒ｝となる。同様に、ノードＢの場合、直接呼び出
される関係にあるノードＡが配置されているキャッシュ
・ラインの「色」は緑（ｇ）であり、直接呼び出す関係
にあるノードＣが配置されているキャッシュ・ラインの
「色」は青（ｂ）及び黄（ｙ）であるので、利用不可能
集合は、Ｂ｛ｇ，ｂ，ｙ｝となる（図７の第２段参
照）。一方、ステップＳＢ１０の判断結果が「ＹＥＳ」
の場合、即ち、上記配置処理によりプログラム空間に空
いた領域が発生した場合には、ステップＳＢ１１へ進
む。ステップＳＢ１１では、プログラム空間に空いた領
域に、呼出頻度の低いグループの中で順位の高いノード
を配置した後、ステップＳＢ７へ進む。以上説明したス
テップＳＢ４、ＳＢ５、ＳＢ８〜ＳＢ１１及びＳＢ７の
処理を、呼出頻度の高いグループの辺の中で、いずれか
の側のノードが既に配置済であり、かつ、２個の異なる
複合ノードに属するノードを結ぶ辺がなくなるまで繰り
返す。そして、呼出頻度の高いグループの辺が残ってい
ない場合には、ステップＳＢ４の判断結果が「ＮＯ」と
なり、ステップＳＢ１６へ進む。

【００４３】一方、残っている呼出頻度の高いグループ
の辺の中で、いずれかの側のノードが既に配置済であ
り、かつ、２個の異なる複合ノードに属するノードを結
ぶ辺ではない場合には、ステップＳＢ８の判断結果が
「ＮＯ」となり、ステップＳＢ１２へ進む。今までの処
理において、ノードＥからノードＣへ向かう辺、ノード
ＡからノードＢへ向かう辺及びノードＢからノードＣへ
向かう辺が処理され、呼出頻度の高いグループでは、ノ
ードＣからノードＤへ向かう辺、ノードＡからノードＥ
へ向かう辺が残っている。しかし、これらの辺はいずれ
も一方のノードが配置済であり、かつ、２個の異なる複
合ノードに属するノードを結ぶ辺ではないので、ステッ
プＳＢ８の判断結果が「ＮＯ」となり、ステップＳＢ１
２へ進む。ステップＳＢ１２では、処理の対象となって
いる辺を構成する２個のノードのうち、一方が複合ノー
ドを構成するノードであり、他方が未配置か否かを判断
する。この判断結果が「ＹＥＳ」の場合には、ステップ
ＳＢ１３へ進む。今の場合、残っている辺のうち、最も
順位の高い辺であるノードＣからノードＤへ向かう辺
は、ノードＣが複合ノードＥ−Ｃ−Ｂ−Ａを構成するノ
ードであり、ノードＤが未配置であるので、ステップＳ
Ｂ１２の判断結果が「ＹＥＳ」となり、ステップＳＢ１
３へ進む。ステップＳＢ１３では、処理対象となってい
る辺の未配置のノードを複合ノードに結合する。未配置
のノードを複合ノードに結合する際、プログラム空間上
でも同様に未配置のノードを複合ノードに結合する。ま
ず、未配置のノードを複合ノードの左右いずれの側に配
置するかを決定する。具体的には、複合ノードを構成す
るノードの中で、処理対象となっている辺を構成するノ
ードの中央の位置が、複合ノードの左右の境界のいずれ
に近いかを、左右の境界に到達するのに要するキャッシ
ュ・ライン数で判断し、近い側に未配置のノードを配置
すると決定する。この場合、未配置のノードの配置によ
り衝突が発生するならば、衝突が発生しなくなるまで順
に当該複合ノードを構成するノード以外のノードの位置
を複合ノードを構成するノードから離して配置する。し
かし、当該複合ノードを構成するノード以外のノードの
配置位置をどのように変更しても衝突が避けられない場
合には、当初の配置位置に戻す。そして、ステップＳＢ
１０へ進む。

【００４４】この実施例においては、複合ノードＥ−Ｃ
−Ｂ−Ａを構成するノードＥ、Ｃ、Ｂ及びＡのうち、処
理対象となっているノードＣからノードＤへ向かう辺を
構成するノードＣの中央の位置は、図７の第１段に示す
ように、部分Ｃ１と部分Ｃ２との間であるから、そこか
ら複合ノードＥ−Ｃ−Ｂ−Ａの左側の境界に到達するの
に要するキャッシュ・ライン数は３個であり、右側の境
界に到達するのに要するキャッシュ・ライン数も３個で
ある。したがって、複合ノードＥ−Ｃ−Ｂ−Ａの左右い
ずれに配置しても良いが、今の場合、複合ノードＥ−Ｃ
−Ｂ−Ａの左側にノードＤを配置すると決定する。この
場合、ノードＤの部分Ｄ１及びＤ２をノードＥの部分Ｅ
１すぐ左側に配置するとノードＤの部分Ｄ１及びＤ２と
ノードＣの部分Ｃ１及びＣ２との衝突が発生するので、
衝突が発生しなるように、ノードＤの部分Ｄ１及びＤ２
の位置をノードＥの部分Ｅ１から左側へキャッシュ・ラ
イン２個分だけ離して配置する（図７の第３段参照）。
次に、今の場合、ノードＤの部分Ｄ１及びＤ２の右側に
キャッシュ・ライン２個分だけ空いた領域が発生してい
るので、ステップＳＢ１０の判断結果が「ＹＥＳ」とな
り、ステップＳＢ１１へ進む。ステップＳＢ１１では、
ノードＤの部分Ｄ１及びＤ２の右側にキャッシュ・ライ
ン２個分だけ空いた領域に、呼出頻度の低いグループの
中で順位の高いノード、今の場合、ノードＧを配置した
後（図７の第４段参照）、ステップＳＢ７へ進み、利用
不可能集合を更新した後、ステップＳＢ４へ戻る。ノー
ドＤの場合、直接呼び出す関係にあるノードＣが配置さ
れているキャッシュ・ラインの「色」は青（ｂ）及び黄
（ｙ）であるので、利用不可能集合は、Ｄ｛ｂ，ｙ｝と
なる（図７の第３段参照）。以上説明したステップＳＢ
４、ＳＢ５、ＳＢ８、ＳＢ１２、ＳＢ１３、ＳＢ１０、
ＳＢ１１及びＳＢ７の処理を、残っている呼出頻度の高
いグループの辺の中で、いずれかの側のノードが既に配
置済であり、２個の異なる複合ノードに属するノードを
結ばず、かつ、一方の側のノードが複合ノードを構成す
るノードであり、他方の側のノードが未配置である辺が
なくなるまで繰り返す。そして、呼出頻度の高いグルー
プの辺が残っていない場合には、ステップＳＢ４の判断
結果が「ＮＯ」となり、ステップＳＢ１６へ進む。

【００４５】一方、残っている呼出頻度の高いグループ
の辺の中で、いずれかの側のノードが既に配置済であ
り、２個の異なる複合ノードに属するノードを結ばず、
かつ、一方の側のノードが複合ノードを構成するノード
であり、他方の側のノードが未配置である辺ではない場
合には、ステップＳＢ１２の判断結果が「ＮＯ」とな
り、ステップＳＢ１３へ進む。今までの処理において、
ノードＥからノードＣへ向かう辺、ノードＡからノード
Ｂへ向かう辺、ノードＢからノードＣへ向かう辺及びノ
ードＣからノードＤへ向かう辺が処理され、呼出頻度の
高いグループでは、ノードＡからノードＥへ向かう辺だ
けが残っている。しかし、この辺は一方のノードが配置
済であり、かつ、２個の異なる複合ノードに属するノー
ドを結ばず、かつ、一方の側のノードが複合ノードを構
成するノードであり、他方の側のノードが未配置である
辺ではないので、ステップＳＢ１２の判断結果が「Ｎ
Ｏ」となり、ステップＳＢ１４へ進む。ステップＳＢ１
４では、処理の対象となっている辺が同一の複合ノード
に属するノードを結ぶ辺であるか否かを判断する。この
判断結果が「ＹＥＳ」の場合には、ステップＳＢ１５へ
進む。今の場合、残っている辺のうち、最も順位の高い
辺であるノードＡからノードＥへ向かう辺は、ノードＡ
及びＥが共に同一の複合ノードＥ−Ｃ−Ｂ−Ａを構成す
るノードであり、ノードＤが未配置であるので、ステッ
プＳＢ１４の判断結果が「ＹＥＳ」となり、ステップＳ
Ｂ１５へ進む。ステップＳＢ１５では、処理対象となっ
ている辺を構成するノード間での衝突を削減する。即
ち、処理対象となっている辺を構成するノード間で衝突
が発生している場合には、複合ノードの境界に近い方の
ノードを衝突が発生しなくなるまで、境界を越えて移動
する。しかし、当該ノードの配置位置をどのように変更
しても衝突が避けられない場合には、当初の配置位置に
戻す。そして、ステップＳＢ１０へ進む。

【００４６】この実施例においては、処理の対象となっ
ている辺はノードＡからノードＥへ向かう辺であり、図
７の第４段からわかるように、ノードＡとノードＥとの
間に衝突が発生している。そして、ノードＡからノード
Ｅへ向かう辺を構成するノードＡ及びＥのうち、ノード
Ａが複合ノードＥ−Ｃ−Ｂ−Ａの境界に近いので、ノー
ドＡを境界を越えて移動する。今の場合、ノードＡをキ
ャッシュ・ライン１個分だけ移動させれば、衝突が発生
しなくなるので、その位置にノードＡを配置する（図７
の第５段参照）。次に、今の場合、ノードＡの右側にキ
ャッシュ・ライン１個分だけ空いた領域が発生している
ので、ステップＳＢ１０の判断結果が「ＹＥＳ」とな
り、ステップＳＢ１１へ進む。ステップＳＢ１１では、
ノードＡの右側にキャッシュ・ライン１個分だけ空いた
領域に、呼出頻度の低いグループの中で残っているノー
ド、今の場合、ノードＦを配置した後（図７の第６段参
照）、ステップＳＢ７へ進み、利用不可能集合を更新し
た後、ステップＳＢ４へ戻る。ノードＡの場合、直接呼
び出す関係にあるノードＥ及びＢが配置されているキャ
ッシュ・ラインの「色」は赤（ｒ）及び緑（ｇ）である
ので、利用不可能集合は、Ａ｛ｒ，ｇ｝となる（図７の
第５段参照）。一方、ノードＢの場合、直接呼び出す関
係にあるノードＣ及び直接呼び出される関係にあるノー
ドＡが配置されているキャッシュ・ラインの「色」は青
（ｂ）及び黄（ｙ）であるので、利用不可能集合は、Ｂ
｛ｂ，ｙ｝となる（図７の第５段参照）。以上説明した
ステップＳＢ４、ＳＢ５、ＳＢ８、ＳＢ１２、ＳＢ１
４、ＳＢ１５、ＳＢ１０、ＳＢ１１及びＳＢ７の処理
を、同一の複合ノードに属するノードを結ぶ辺がなくな
るまで繰り返す。そして、呼出頻度の高いグループの辺
が残っていない場合には、ステップＳＢ４の判断結果が
「ＮＯ」となり、ステップＳＢ１６へ進む。

【００４７】ステップＳＢ１６では、残った呼出頻度の
低いグループに属するノードについて、単純な深さ優先
探索によって配置する。以上の処理により複数の複合ノ
ードが離れて配置された場合には、各複合ノードに呼出
頻度に基づいて優先度を付け、最終的な配置を決定す
る。そして、一連の処理を終了する。以上説明した手続
の配置最適化処理により得られる配置情報の一例を図８
に示す。前提として、手続Ａ及びＢはファイル名「ｔｅ
ｓｔ１．ｏ」の原始プログラム・ファイルに属し、関数
Ｅ、Ｆ及びＧはファイル名「ｔｅｓｔ２．ｏ」の原始プ
ログラム・ファイルに属し、また手続Ｃ及びＤはファイ
ル名「ｌｉｂｃ．ａ」のライブラリ・ファイルに属する
標準ライブラリ手続であるとする。また、１個のキャッ
シュ・ラインのサイズを３２バイト（０ｘ２０）とす
る。図８において、「ＧＲＯＵＰ１」は、セグメント名
であり、出力セクションを１つのかたまりとして取り扱
う場合に付す。「！ＬＯＡＤ」は、セグメント・タイプ
を表しており、このフィールドは固定されている。今の
場合、「ＬＯＡＤ」はメモリにロードするセグメントで
あることを示している。「？ＲＸ」は、セグメント属性
を表しており、セグメントの読み出し／書き込み／実行
の属性を示している。命令部分（テキスト・コード）の
場合は、「？ＲＸ」に固定されている。「Ａ０ｘ１００
０」は、整列条件を表しており、セグメントをメモリ空
間に配置する際の整列条件を示している。今の場合、整
列条件が「０ｘ１０００」であることを示している。ま
た、「＿Ｄ＿ＬＩＢ」や「＿Ｇ＿ｔｅｓｔ２」等は、出
力セクション名であり、同じタイプと属性の入力セクシ
ョンを結合してできるかたまりを表している。「＄ＰＲ
ＯＧＢＩＴＳ」は、入力セクションのタイプを表してお
り、テキスト・コードの場合はこれに固定されている。
「？ＡＸ」は、セクション属性を表しており、入力セク
ションが、メモリを占有する／書き込み可能／実行可能
等の属性を示している。テキスト・コードの場合は、こ
れに固定されている。「Ａ０ｘ２０」は、入力セクショ
ンを出力セクションに配置する際の整列条件を表してい
る。キャッシュ・ライン単位に配置を考慮したので、整
列条件はキャッシュ・ライン１個のサイズである０ｘ２
０である。「＿Ｄ＿ｔｅｓｔ１」や「＿Ｇ＿ｔｅｓｔ
２」等は、出力セクションに配置すべき入力セクション
の名前を表している。「ｌｉｂｃ．ａ」や「ｔｅｓｔ
２．ｏ」等は、入力セクションが属するファイル名を表
している。複数ファイルの同じ入力セクションをまとめ
て出力セクションにする時は、ファイル名を複数記述す
ることが可能である。既述したように、手続毎に入力セ
クション名を付すことにより、上記のように手続の配置
の順番を整列条件付きで指定することができるのであ
る。

【００４８】このように、この例の構成によれば、再配
置可能ライブラリを手続毎に配置可能な再配置可能ライ
ブラリに変換するライブラリ生成部４３を設け、プロフ
ァイラ３７による動的解析時に全ての手続について動的
情報を収集し、その動的情報に基づいて全ての手続にと
って最適な配置を決定して配置情報を生成し、その配置
情報に基づき全ての手続を配置しているので、目的プロ
グラムを構成する全ての手続間でのキャッシュ・メモリ
上での衝突を低減できると共に、頻繁に用いる手続のキ
ャッシュ・ミスも低減できる。これにより、計算機やＣ
ＰＵが目的プログラムを実行した際の実行速度を速くす
ることができる。これに対して、コンパイルすべき原始
プログラムに７個の手続Ａ〜Ｇがこの順で記述されてお
り、原始プログラムを目的プログラムにコンパイルした
場合の各手続Ａ〜Ｇのキャッシュ・ライン数が図５に示
すものとした場合、上記最適化部４０による手続の配置
最適化処理を全く施さないと、原始プログラム中の手続
Ａ〜Ｇがその記述順で目的プログラムにコンパイルされ
るので、図９に示すように、手続Ｃと手続Ｅとの間で衝
突が発生してしまう。

【００４９】また、この発明では、手続の種類を区別す
ることなく、全ての手続を同等に扱い手続毎に配置可能
であるので、衝突を完全に削減できる確率が高いが、図
６に示す手続呼出グラフにおいて、図１０に示すよう
に、手続Ｃ及びＤが標準ライブラリ手続であって、従来
のように、手続の配置最適化処理の対象外とすると、上
記文献に記載されたキャッシュ・ライン・カラーリング
による配置方法を採用したとしても、以下に示すように
衝突を完全に削減できない。何故なら、原始プログラム
に複数の標準ライブラリ手続の呼出命令が記述されてい
る場合、従来ではリンカにおけるリンク時にライブラリ
記憶部から対応する複数の標準ライブラリ手続が読み出
され、主記億装置の特定の領域にまとめて配置されるた
め、手続毎に配置を指定することができなかったからで
ある。図１１に、標準ライブラリ手続Ｃ及びＤを手続の
配置最適化処理の対象外とした場合の最適化部の手続の
配置最適化処理の手順を示す。この場合、標準ライブラ
リ手続Ｃ及びＤが対象外であるから、手続Ｅから手続Ｃ
へ向かう辺及び手続Ｂから手続Ｃへ向かう辺も当然対象
外となる。したがって、図１１の第５段に示すように、
手続Ｅと手続Ｃとの衝突を削減することができない。

【００５０】Ｂ．第２の実施例次に、第２の実施例について説明する。図１２はこの発
明の第２の実施例であるプログラム変換装置の電気的構
成を示すブロック図である。この図において、図１の各
部に対応する部分には同一の符号を付け、その説明を省
略する。この図に示すプログラム変換装置においては、
第１ライブラリ記憶部４１に記憶された再配置可能ライ
ブラリがリンカ３６にも供給されるように構成されてい
る。このように構成したのは、以下に示す理由による。
即ち、再配置可能ライブラリの数が多い場合、ライブラ
リ生成部４３が、第１ライブラリ記憶部４１に記憶され
た全ての再配置可能ライブラリを手続毎に配置可能な再
配置可能ライブラリに変換するのでは時間がかかってし
まう。そこで、一部の再配置可能ライブラリについて
は、ライブラリ生成部４３が手続毎に配置可能な再配置
可能ライブラリに変換せずにリンカ３６で手続毎に配置
可能な再配置可能目的プログラムと直接リンクさせるの
である。この場合、どの再配置可能ライブラリを直接リ
ンカ３６に供給するかは、例えば、第１情報記憶部３８
に記憶された動的情報や各手続のコード・サイズに基づ
いて、リンカ３６が判断するように構成しても良い。こ
のように、この例の構成によれば、第１の実施例に比べ
て短い時間で最終的な目的プログラムを作成できる。

【００５１】Ｃ．第３の実施例次に、第３の実施例について説明する。図１３はこの発
明の第３の実施例であるプログラム変換装置の電気的構
成を示すブロック図である。この図において、図１２の
各部に対応する部分には同一の符号を付け、その説明を
省略する。この図に示すプログラム変換装置において
は、図１２に示すコンパイラ３５及びプロファイラ３７
に代えて、コンパイラ４４及びプロファイラ４５が新た
に設けられている。プロファイラ４５は、図１２に示す
プロファイラ３７とは異なり、第３プログラム記憶部３
３に記憶された実行可能な一時的な目的プログラムを読
み込んで単に実行するだけの機能を有している。その代
わり、コンパイラ４４は、原始プログラムを実行可能な
一時的な目的プログラムにコンパイルする際、一時的な
目的プログラムに、プロファイラ４５がその一時的な目
的プログラムを実行した際に実際に実行された手続の回
数をカウントするカウント・コードを挿入する。これに
より、プロファイラ４５は、一時的な目的プログラムを
実行することにより、各手続相互間の呼出関係、各手続
の呼出回数等からなる動的情報を収集することができ、
得られた動的情報を第１情報記憶部３８に記憶する。

【００５２】次に、上記構成を有するプログラム変換装
置の動作について、図１４を参照して説明する。まず、
図１４に示すステップＳＣ１では、コンパイラ４４は、
第１プログラム記憶部３１から読み込まれた原始プログ
ラム（図２参照）をカウント・コードを挿入しつつ実行
可能な一時的な目的プログラムにコンパイルして、第２
プログラム記憶部３２に記憶する。ステップＳＣ２で
は、リンカ３６は、第２プログラム記憶部３２に記憶さ
れたカウント・コードが挿入された一時的な目的プログ
ラムと、第１ライブラリ記憶部４１に記憶された再配置
可能ライブラリとをリンクして実行可能な一時的な目的
プログラムを生成して第３プログラム記憶部３３に記憶
する。ステップＳＣ３では、プロファイラ４５は、第３
プログラム記憶部３３から読み込んだ一時的な目的プロ
グラムを実行する。この場合、一時的な目的プログラム
にカウント・コードが挿入されているので、各手続相互
間の呼出関係、各手続の呼出回数等からなる動的情報が
収集されるので、得られた動的情報を第１情報記憶部３
８に記憶する。

【００５３】ステップＳＣ４では、最適化部４０は、第
１情報記憶部３８に記憶された動的情報に基づいて、全
ての手続の配置最適化を行って配置情報を生成し、第２
情報記憶部３９に記憶する。このステップＳＣ４の処理
は、上記した第１の実施例におけるステップＳＡ５の処
理とほぼ同様であるので、その説明を省略する。ステッ
プＳＣ５では、ライブラリ生成部４３は、第１ライブラ
リ記憶部４１に記憶された各再配置可能ライブラリにつ
いて、手続単位を認識して手続毎に配置可能な再配置可
能ライブラリに変換し、第２ライブラリ記憶部４２に記
憶する。このステップＳＣ５の処理は、上記した第１の
実施例におけるステップＳＡ１の処理とほぼ同様である
ので、その説明を省略する。ステップＳＣ６では、コン
パイラ３５は、原始プログラムを再配置可能目的プログ
ラムにコンパイルした後、ステップＳＣ５におけるライ
ブラリ生成部４３の処理と同様の処理により、再配置可
能目的プログラムを手続毎に配置可能な再配置可能目的
プログラムに変換して第２プログラム記憶部３２に記憶
する。ステップＳＣ７では、リンカ３６は、第２情報記
憶部３９に記憶された配置情報に基づいて、手続毎に配
置可能な再配置可能目的プログラムと手続毎に配置可能
な再配置可能ライブラリとをリンクして実行可能な最終
的な目的プログラムを生成して第４プログラム記憶部３
４に記憶した後、一連の処理を終了する。このように、
この例の構成によれば、プロファイラ４５が動的情報を
収集する機能を有しない場合でも、第１の実施例の場合
とほぼ同様の効果を得ることがでできる。

【００５４】以上、この発明の実施例を図面を参照して
詳述してきたが、具体的な構成はこの実施例に限られる
ものではなく、この発明の要旨を逸脱しない範囲の設計
の変更等があってもこの発明に含まれる。例えば、上述
の実施例においては、この発明を１つの原始プログラム
から１つの最終的な目的プログラムを生成する場合に適
用する例を示したが、これに限定されず、この発明を複
数の原始プログラムをそれぞれ再配置可能目的プログラ
ムにコンパイルした後、それらをリンカ３６でリンクし
て１つの最終的な目的プログラムを生成する場合に適用
しても、もちろん良い。また、上述の各実施例において
は、各プログラム記憶部３１〜３４、各情報記憶部３
８，３９及びライブラリ記憶部４１，４２は、それぞれ
別々の記憶媒体で構成する例を示したが、これに限定さ
れず、例えば、同一の記憶媒体の異なる記憶領域で構成
するようにしても良い。この場合、各プログラム記憶部
３１〜３４及びライブラリ記憶部４１，４２は、記憶対
象が多くの記憶容量を要するプログラムや再配置可能ラ
イブラリであるので、ＦＤやＨＤ、あるいはＣＤ−ＲＯ
Ｍで構成し、各情報記憶部３８，３９は、記憶対象が比
較的少ない記憶容量で済むデータであるので、ＲＯＭや
ＲＡＭ等の半導体メモリで構成するようにしても良い。

【００５５】また、上述の各実施例においては、各手段
をハードウェアで構成した例を示したが、これに限定さ
れない。即ち、上記プログラム変換装置を、ＣＰＵ（中
央処理装置）と、ＲＯＭやＲＡＭ等の内部記憶装置と、
ＦＤＤ（フロッピー・ディスク・ドライバ）、ＨＤＤ
（ハード・ディスク・ドライバ）、ＣＤ−ＲＯＭドライ
バ等の外部記憶装置と、出力手段と、入力手段とを有す
るコンピュータによって構成し、上記コンパイラ３５，
４４、リンカ３６及びプロファイラ３７，４５がＣＰＵ
によって構成され、これらの機能がプログラム変換プロ
グラムとして、ＲＯＭ等の半導体メモリや、ＦＤ、ＨＤ
やＣＤ−ＲＯＭ等の記憶媒体に記憶されていると構成し
ても良い。この場合、上記内部記憶装置、あるいは外部
記憶装置が各プログラム記憶部３１〜３４、各情報記憶
部３８，３９及びライブラリ記憶部４１，４２となり、
プログラム変換プログラムは、記憶媒体からＣＰＵに読
み込まれ、ＣＰＵの動作を制御する。ＣＰＵは、プログ
ラム変換プログラムが起動されると、コンパイラ３５，
４４、リンカ３６及びプロファイラ３７，４５として機
能し、プログラム変換プログラムの制御により、上記し
た処理を実行するのである。

【００５６】

【発明の効果】以上説明したように、この発明の構成に
よれば、様々な手続相互間におけるキャッシュ・メモリ
上での衝突を防止できると共に、頻繁に用いる手続のキ
ャッシュ・ミスを防止できる。これにより、計算機やＣ
ＰＵが目的プログラムを実行した際の実行速度を速くす
ることができる。

【図面の簡単な説明】

【図１】この発明の第１の実施例であるプログラム変換
装置の電気的構成を示すブロック図である。

【図２】同実施例で用いられる原始プログラムの一例を
示す図である。

【図３】同実施例におけるプログラム変換装置の動作を
表すフローチャートである。

【図４】同実施例における最適化部の手続の配置最適化
処理を表すフローチャートである。

【図５】手続Ａ〜Ｇが占めるキャッシュ・ライン数の一
例を示す図である。

【図６】最適化部により作成される手続呼出グラフの一
例を示す図である。

【図７】同実施例における最適化部の手続の配置最適化
処理を説明するための説明図である。

【図８】配置情報の一例を示す図である。

【図９】手続の配置最適化処理を行わなかった場合の不
都合を説明するための説明図である。

【図１０】図６の手続呼出グラフにおいて手続Ｃ及びＤ
が標準ライブラリ手続であった場合を示す図である。

【図１１】標準ライブラリ手続を手続の配置最適化処理
の対象外とした場合の不都合を説明するための図であ
る。

【図１２】この発明の第２の実施例であるプログラム変
換装置の電気的構成を示すブロック図である。

【図１３】この発明の第３の実施例であるプログラム変
換装置の電気的構成を示すブロック図である。

【図１４】この発明の第３の実施例であるプログラム変
換装置の動作を表すフローチャートである。

【図１５】従来のプログラム変換装置の第１の電気的構
成例を示すブロック図である。

【図１６】従来のプログラム変換装置の第２の電気的構
成例を示すブロック図である。

【図１７】ダイレクト・マップ方式におけるキャッシュ
・メモリと主記憶装置との関係を説明するための図であ
る。

【図１８】従来例で用いられる原始プログラムをＣ言語
で表現した場合の一例を示す図である。

【図１９】キャッシュ・メモリ上における手続相互間の
衝突を説明するための説明図である。

【符号の説明】

３５，４４コンパイラ（プログラム変換手段）３６リンカ（結合手段）３７，４５プロファイラ（動的情報収集手段）４０最適化部（最適化手段）４３ライブラリ生成部（手続等変換手段）

Claims

【特許請求の範囲】

【請求項１】プログラミング言語で記述された原始プ
ログラムを計算機や中央処理装置が実行可能な言語で記
述された目的プログラムに変換するプログラム変換方法
において、前記原始プログラムで用いられている手続、関数、ある
いはサブルーチンの少なくとも一部を、前記目的プログ
ラムが前記計算機や中央処理装置で用いられる際に記憶
される主記憶装置の任意の記憶領域に記憶可能に変換す
る第１の処理と、前記原始プログラムを前記目的プログ
ラムに変換する過程で得られる前記手続、関数、あるい
はサブルーチンに関する情報に基づいて、前記第１の処
理で変換され又は変換されなかった手続、関数、あるい
はサブルーチンを、前記主記憶装置のいずれの記憶領域
に記憶すべきかを決定し、その決定結果に基づいて前記
目的プログラムを生成する第２の処理とからなることを
特徴とするプログラム変換方法。
【請求項２】前記手続、関数、あるいはサブルーチン
は、ユーザが前記原始プログラム中で定義したもの、ユ
ーザにより定義され検査が終了したもの、前記プログラ
ミング言語において処理系で予め用意されているもの、
命令コードの形式で予め用意されているもののうち、少
なくとも１つからなることを特徴とする請求項１記載の
プログラム変換方法。
【請求項３】前記情報は、前記原始プログラムから変
換された一時的な目的プログラムを実行することにより
得られる、前記手続、関数、あるいはサブルーチンが実
際に呼び出される回数を示す情報と、前記手続、関数、
あるいはサブルーチン同士が互いを呼び出す関係を示す
情報とからなることを特徴とする請求項１又は２記載の
プログラム変換方法。
【請求項４】プログラミング言語で記述された原始プ
ログラムを計算機や中央処理装置が実行可能な言語で記
述された目的プログラムに変換するプログラム変換方法
において、前記原始プログラムで用いられている手続、関数、ある
いはサブルーチンのうち、ユーザにより定義され検査が
終了したもの、前記プログラミング言語において処理系
で予め用意されているもの、命令コードの形式で予め用
意されているものの少なくとも一部を、前記目的プログ
ラムが前記計算機や中央処理装置で用いられる際に記憶
される主記憶装置の任意の記憶領域に記憶可能に変換す
る第１の処理と、前記原始プログラムを目的プログラムに変換すると共
に、前記目的プログラムについて、ユーザが前記原始プ
ログラム中で定義した手続、関数、あるいはサブルーチ
ンを前記主記憶装置の任意の記憶領域に記憶可能に変換
する第２の処理と、前記第１の処理で変換された手続、
関数、あるいはサブルーチンと、前記第２の処理で得ら
れた目的プログラムとを結合する第３の処理と、前記第３の処理で得られた目的プログラムを実行しつ
つ、前記手続、関数、あるいはサブルーチンが実際に呼
び出される回数を示す情報と、前記手続、関数、あるい
はサブルーチン同士が互いを呼び出す関係を示す情報と
からなる動的情報を収集する第４の処理と、前記動的情報に基づいて、前記手続、関数、あるいはサ
ブルーチンを、前記主記憶装置のいずれの記憶領域に記
憶すべきかを決定し、配置情報を生成する第５の処理
と、前記配置情報に基づいて、前記第１の処理で変換された
手続、関数、あるいはサブルーチンと、前記第２の処理
で得られた目的プログラムとを結合して、最終的な目的
プログラムを生成する第６の処理とからなることを特徴
とするプログラム変換方法。
【請求項５】プログラミング言語で記述された原始プ
ログラムを計算機や中央処理装置が実行可能な言語で記
述された目的プログラムに変換するプログラム変換方法
において、前記原始プログラムを一時的な目的プログラムに変換す
ると共に、前記一時的な目的プログラムを実行した際に
前記手続、関数、あるいはサブルーチンが実際に呼び出
される回数をカウントするコードを挿入する第１の処理
と、前記原始プログラムで用いられている手続、関数、ある
いはサブルーチンのうち、ユーザにより定義され検査が
終了したもの、前記プログラミング言語において処理系
で予め用意されているもの、命令コードの形式で予め用
意されているものと、前記第１の処理で得られた一時的
な目的プログラムとを結合する第２の処理と、前記第２の処理で得られた一時的な目的プログラムを実
行しつつ、前記手続、関数、あるいはサブルーチンが実
際に呼び出される回数を示す情報と、前記手続、関数、
あるいはサブルーチン同士が互いを呼び出す関係を示す
情報とからなる動的情報を収集する第３の処理と、前記動的情報に基づいて、前記手続、関数、あるいはサ
ブルーチンを、前記主記憶装置のいずれの記憶領域に記
憶すべきかを決定し、配置情報を生成する第４の処理
と、前記原始プログラムで用いられている手続、関数、ある
いはサブルーチンのうち、ユーザにより定義され検査が
終了したもの、前記プログラミング言語において処理系
で予め用意されているもの、命令コードの形式で予め用
意されているものの少なくとも一部を、前記目的プログ
ラムが前記計算機や中央処理装置で用いられる際に記憶
される主記憶装置の任意の記憶領域に記憶可能に変換す
る第５の処理と、前記原始プログラムを目的プログラムに変換した後、前
記目的プログラムについて、ユーザが前記原始プログラ
ム中で定義した手続、関数、あるいはサブルーチンを前
記主記憶装置の任意の記憶領域に記憶可能に変換する第
６の処理と、前記配置情報に基づいて、前記第５の処理で変換された
手続、関数、あるいはサブルーチンと、前記第６の処理
で得られた目的プログラムとを結合して、最終的な目的
プログラムを生成する第７の処理とからなることを特徴
とするプログラム変換方法。
【請求項６】プログラミング言語で記述された原始プ
ログラムを計算機や中央処理装置が実行可能な言語で記
述された目的プログラムに変換するプログラム変換装置
において、前記原始プログラムで用いられている手続、関数、ある
いはサブルーチンの少なくとも一部を、前記目的プログ
ラムが前記計算機や中央処理装置で用いられる際に記憶
される主記憶装置の任意の記憶領域に記憶可能に変換す
る手続等変換手段と、前記原始プログラムを前記目的プログラムに変換する過
程で得られる前記手続、関数、あるいはサブルーチンに
関する情報に基づいて、前記手続等変換手段で変換され
又は変換されなかった手続、関数、あるいはサブルーチ
ンを、前記主記憶装置のいずれの記憶領域に記憶すべき
かを決定し、その決定結果に基づいて前記目的プログラ
ムを生成するプログラム変換手段とを備えてなることを
特徴とするプログラム変換装置。
【請求項７】前記手続、関数、あるいはサブルーチン
は、ユーザが前記原始プログラム中で定義したもの、ユ
ーザにより定義され検査が終了したもの、前記プログラ
ミング言語において処理系で予め用意されているもの、
命令コードの形式で予め用意されているもののうち、少
なくとも１つからなることを特徴とする請求項６記載の
プログラム変換装置。
【請求項８】前記情報は、前記原始プログラムから変
換された一時的な目的プログラムを実行することにより
得られる、前記手続、関数、あるいはサブルーチンが実
際に呼び出される回数を示す情報と、前記手続、関数、
あるいはサブルーチン同士が互いを呼び出す関係を示す
情報とからなることを特徴とする請求項６又は７記載の
プログラム変換装置。
【請求項９】プログラミング言語で記述された原始プ
ログラムを計算機や中央処理装置が実行可能な言語で記
述された目的プログラムに変換するプログラム変換装置
において、前記原始プログラムで用いられている手続、関数、ある
いはサブルーチンのうち、ユーザにより定義され検査が
終了したもの、前記プログラミング言語において処理系
で予め用意されているもの、命令コードの形式で予め用
意されているものの少なくとも一部を、前記目的プログ
ラムが前記計算機や中央処理装置で用いられる際に記憶
される主記憶装置の任意の記憶領域に記憶可能に変換す
る手続等変換手段と、前記原始プログラムを目的プログラムに変換すると共
に、前記目的プログラムについて、ユーザが前記原始プ
ログラム中で定義した手続、関数、あるいはサブルーチ
ンを前記主記憶装置の任意の記憶領域に記憶可能に変換
するプログラム変換手段と、前記手続等変換手段で変換された手続、関数、あるいは
サブルーチンと、前記プログラム変換手段で得られた目
的プログラムとを結合する結合手段と、前記結合手段で得られた目的プログラムを実行しつつ、
前記手続、関数、あるいはサブルーチンが実際に呼び出
される回数を示す情報と、前記手続、関数、あるいはサ
ブルーチン同士が互いを呼び出す関係を示す情報とから
なる動的情報を収集する動的情報収集手段と、前記動的情報に基づいて、前記手続、関数、あるいはサ
ブルーチンを、前記主記憶装置のいずれの記憶領域に記
憶すべきかを決定し、配置情報を生成する最適化手段と
を備え、前記結合手段は、前記配置情報に基づいて、前記手続等
変換手段で変換された手続、関数、あるいはサブルーチ
ンと、前記プログラム変換手段で得られた目的プログラ
ムとを結合して、最終的な目的プログラムを生成するこ
とを特徴とするプログラム変換装置。
【請求項１０】プログラミング言語で記述された原始
プログラムを計算機や中央処理装置が実行可能な言語で
記述された目的プログラムに変換するプログラム変換装
置において、前記原始プログラムを一時的な目的プログラムに変換す
ると共に、前記一時的な目的プログラムを実行した際に
前記手続、関数、あるいはサブルーチンが実際に呼び出
される回数をカウントするコードを挿入するプログラム
変換手段と、前記原始プログラムで用いられている手続、関数、ある
いはサブルーチンのうち、ユーザにより定義され検査が
終了したもの、前記プログラミング言語において処理系
で予め用意されているもの、命令コードの形式で予め用
意されているものと、前記プログラム変換手段で得られ
た一時的な目的プログラムとを結合する結合手段と、前記結合手段で得られた一時的な目的プログラムを実行
しつつ、前記手続、関数、あるいはサブルーチンが実際
に呼び出される回数を示す情報と、前記手続、関数、あ
るいはサブルーチン同士が互いを呼び出す関係を示す情
報とからなる動的情報を収集する動的情報収集手段と、前記動的情報に基づいて、前記手続、関数、あるいはサ
ブルーチンを、前記主記憶装置のいずれの記憶領域に記
憶すべきかを決定し、配置情報を生成する最適化手段
と、前記原始プログラムで用いられている手続、関数、ある
いはサブルーチンのうち、ユーザにより定義され検査が
終了したもの、前記プログラミング言語において処理系
で予め用意されているもの、命令コードの形式で予め用
意されているものの少なくとも一部を、前記目的プログ
ラムが前記計算機や中央処理装置で用いられる際に記憶
される主記憶装置の任意の記憶領域に記憶可能に変換す
る手続等変換手段とを備え、前記プログラム変換手段は、前記原始プログラムを目的
プログラムに変換すると共に、前記目的プログラムにつ
いて、ユーザが前記原始プログラム中で定義した手続、
関数、あるいはサブルーチンを前記主記憶装置の任意の
記憶領域に記憶可能に変換し、前記結合手段は、前記配
置情報に基づいて、前記手続等変換手段で変換された手
続、関数、あるいはサブルーチンと、前記プログラム変
換手段で得られた目的プログラムとを結合して、最終的
な目的プログラムを生成することを特徴とするプログラ
ム変換装置。
【請求項１１】コンピュータに請求項１乃至１０のい
ずれか１つに記載の機能を実現させるためのプログラム
変換プログラムを記憶した記憶媒体。