JP2003271394A

JP2003271394A - 関数と基本ブロックの配置割付装置および割付最適化プログラム

Info

Publication number: JP2003271394A
Application number: JP2002076685A
Authority: JP
Inventors: Rika Ono; 梨香小野
Original assignee: NEC Electronics Corp
Current assignee: NEC Electronics Corp
Priority date: 2002-03-19
Filing date: 2002-03-19
Publication date: 2003-09-26

Abstract

(57)【要約】【課題】高い頻度で呼び出される関数と高い頻度で実行
される基本ブロックを抽出してキャッシュコンフリクト
が低減するように最適割付する装置を提供する。【解決手段】直接関数呼出情報記録手段２０、間接関数
呼出情報記録手段２２およびパスプロファイル情報記録
手段２５を備える。直接関数呼出情報記録手段２０は、
直接関数呼出で呼び出される関数名と呼出回数を記録す
る。間接関数呼出情報記録手段２２は、最多呼出情報２
３に間接関数呼出で最も多くの回数呼び出された関数の
アドレスと最多の連続呼出回数と累計呼出回数を記録
し、カレント情報２４に最近の間接関数呼出で呼び出さ
れた関数のアドレスと連続呼出回数を記録する。パスプ
ロファイル情報記録手段２５は基本ブロックレベルのパ
スの実行回数に関する情報を記録する。配置割付装置は
これらの情報に基づいてキャッシュコンフリクトが低減
するように関数と基本ブロックを最適配置する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、関数と基本ブロッ
クの命令キャッシュでのコンフリクト発生が低減するよ
うにプログラムのメモリ空間への割付を行う配置割付装
置および割付プログラムに関する。

【０００２】

【従来の技術】近年、ＣＰＵの高速化が急速に進み、Ｄ
ＲＡＭなどの外部メモリのアクセス時間とＣＰＵの処理
速度のギャップは増大の一途を辿っている。このような
状況下にあるため、ＣＰＵから高速にアクセスできるバ
ッファであるキャッシュを設け、外部メモリ上のプログ
ラムの一部をキャッシュ内にコピーして実行する技術が
高速のコンピュータを中心に広く使用されている。しか
しながら、高速なキャッシュ用のメモリはコストがかか
るため、そのサイズは外部メモリと比較してずっと小さ
くせざるを得ない。したがって、実行するプログラムの
どの部分をキャッシュに格納するかがプログラムを高速
に実行する上できわめて重要となる。

【０００３】外部メモリはキャッシュのサイズで区切っ
た領域に分割され、また、キャッシュはキャッシュライ
ンと呼ばれる特定のサイズに分割される。外部メモリか
らキャッシュへのコピーはキャッシュライン単位で行わ
れる。同一のキャッシュラインに割り当てられた関数お
よび関数を構成する基本的ブロックは、プログラムの実
行中に関数、基本ブロックが切り替わるたびにキャッシ
ュにコピーし直す必要が生じる。このようなキャッシュ
コンフリクトが頻繁に起きるとプログラムの実行速度が
低下するため、ソースプログラムをコンパイルする際に
キャッシュコンフリクトが生じないように外部メモリ上
に関数、基本ブロックを割り付ける方法が研究されてい
る。なお、キャッシュには、もっとも単純なダイレクト
マップ方式、セットアソシアティブ方式、フルアソシア
ティブ方式等があるが、基本的な問題は共通しているた
め、ダイレクトマップ方式を例として説明する。

【０００４】命令キャッシュへの割付最適化技術として
特開２００１−２１６１４０号公報に記載の技術があ
る。図１５は、この第１の従来技術による配置割付装置
の図である。配置割付装置４１は、関数呼出情報生成部
５１とメモリ空間配置最適化部５２とを備えている。配
置割付装置４１は、ソースプログラム４２をもとに関数
呼出情報生成部５１で関数呼出組合せ情報４３を生成
し、また関数呼出組合せ情報４３をもとにメモリ空間配
置最適化部５２で配置最適化情報４４を生成し出力す
る。配置最適化情報４４には、キャッシュコンフリクト
による実行性能の低下が極力低減されるように最適配置
された外部メモリにおける関数の配置情報が出力され
る。

【０００５】図１６は、関数呼出組合せ情報４３の一例
を示す図である。図１７はメモリ空間配置最適化部５２
の処理を示すフロー図である。ステップＳ５１で関数呼
出組合せ情報４３をもとに呼出回数をその辺に対する重
みとして図１８に示す関数呼出グラフを作成し、ステッ
プＳ５２で、ステップ呼出回数の多いものと少ないもの
に分割する。ステップＳ５３で、呼出回数の多い順に並
べ替え、その順番でステップＳ５４以降の処理を行う。
ステップＳ５４以降では、キャッシュサイズに含まれる
キャッシュラインに「色」が割り当てられ、ステップＳ
５３で決められた順番で関数をメモリ空間に配置される
とともに、配置する関数が利用できない「色」の集合を
認識し、これを避けて配置する。関数が占める色の数す
なわちキャッシュライン数は関数ｆｕｎｃが２個で、そ
の他の関数はそれぞれ１個とする。

【０００６】まず、ステップＳ５４で、図１８の関数呼
出グラフにおいて最も重みが大きい辺の両端のノードで
ある関数ｆｕｎｃと関数ｆｕｎｃＡとを取り出し、ステ
ップＳ５６で、メモリ空間に配置する。この例では
「赤」と「緑」にｆｕｎｃが配置されたので隣接する
「青」にｆｕｎｃＡが配置される。図１９（ａ）にこの
段階での関数のメモリ空間への配置を示す。ステップＳ
５４に戻り、２番目に重みが大きい辺を選択する。２番
目に重みが大きい辺の両端のノードが関数ｆｕｎｃと関
数ｆｕｎｃＣであり、ステップＳ６２で一方のｆｕｎｃ
は配置済であると判断されてステップＳ６３に進み、ｆ
ｕｎｃＣを使用不可能な「色」を避けてｆｕｎｃに近い
キャッシュラインに配置する。図１９（ｂ）にこの段階
での関数のメモリ空間への配置を示す。３番目以降に重
みが大きい辺についても同様に処理して図１９（ｃ）に
示すように関数ｆｕｎｃＢおよび関数ｍａｉｎが配置さ
れる。この第１の従来技術の配置割付装置では、関数を
単位として配置の割付を行うため、すなわち、関数ｆｕ
ｎｃが高い頻度で実行されるプログラム部分と低い頻度
で実行されるプログラム部分とで構成されているとして
も、キャッシュメモリには低い頻度で実行されるプログ
ラム部分を含めた関数ｆｕｎｃ全体がひとつとして割り
付けられるため、キャッシュメモリを有効に利用してい
るとはいえず改良の余地がある。また、関数呼出組合せ
情報４３を取得するためのプロファイリングでは、通
常、すべての関数の組合せが記録できるメモリ領域を確
保する必要があるため、関数の数が多い場合にはプロフ
ァイル作成用に大きなメモリ領域が占有されてしまう。

【０００７】特開平１１−２１２８３７号公報には、ソ
ースプログラムを静的解析することにより関数呼出を検
出して呼出元と呼出先のペアごとに識別番号を設定し、
プロファイリング時に識別番号毎に回数を格納すること
により占有するメモリ領域を削減する技術が記載されて
いる。しかしながら、この技術は直接間接呼出（イミデ
ィエート値によるＰＣ相対アドレスでの分岐）の場合を
対象としており、間接関数呼出（レジスタ間接による分
岐）の場合においてプロファイル作成用メモリを削減す
る方法については開示されていない。

【０００８】上記特開２００１−２１６１４０号公報に
は、上記の第１の従来技術の改良技術として、関数実行
の時系列情報を収集しこれを解析して間接的に発生する
キャッシュコンフリクトをも考慮して割り付ける技術に
ついても開示されているが、関数を単位としてメモリ空
間への配置割付を行う点においては同じであるため、キ
ャッシュメモリを有効に利用してはいない。また、時系
列情報を記録するために必要なメモリ容量が予め予測で
きないので、十分大きいメモリ領域をプロファイル作成
用に確保しておかなければならない。

【０００９】関数を複数の基本ブロックに分割し、基本
ブロックで構成されるパスの実行回数のプロファイリン
グを効率的に行う第２の従来技術（゛Efficient Path P
rofiling″,Thomas Ball and James Larus, Priceeding
s of the 29th Annual IEEE/ACM International Sympos
ium on Microarchitecture (Micro-29),pp.46-57,Nov.
1996.)が知られている。図２０は、第２の従来技術を説
明する図で、（ａ）は基本ブロック間の制御フローグラ
フであり、（ｂ）はパス(path)とパスサム(path sum)の
対応を示す図である。

【００１０】第２の従来技術では、ループを含まない制
御フローグラフの例である図２０（ａ）において、制御
フローグラフの辺に整数のラベルを付加する。このと
き、手続きの入り口である基本ブロックＡから出口であ
る基本ブロックＦに至るパスの各々のパスに対して、パ
スサム、すなわち、辿ったパスに付加されたラベルの合
計がパス毎にユニークな値となり、制御フローグラフに
おける可能なパスの数がｎ個である場合にはパスサムが
０から（ｎ−１）までのいずれかの値になるように各々
の辺のラベルを決める。図２０（ａ）のようにラベル付
けされたとすれば、ＡＢＤＥＦのパスを通る場合にはパ
スサムは（４＋１＝５）となり、ＡＣＤＥＦのパスを通
る場合にはパスサムは（０＋１＝１）となるので、パス
サムが分かれば基本ブロックＡから基本ブロックＢまで
のどのパスを実行したかを決定できる。制御フローグラ
フがループを含む場合には、予めループの含まない制御
グラフに変換しておく。

【００１１】パスプロファイリングを実行する際には、
パスサムに対応したレジスタを用意する。また、図２０
（ａ）で黒い四角が付されている辺でのラベル設定、パ
スサム計算、パスサムに対応するレジスタのインクリメ
ント等の処理に対応するコードをプログラムに付加す
る。そののち基本ブロックＡ〜Ｆからなるプログラムを
実行する。プログラムの実行後にパスサムに対応するレ
ジスタの格納値を読み出すことにより、パスとそのパス
の実行回数が得られる。

【００１２】この第２の従来技術では、基本ブロック単
位の実行遷移情報を取得できるものの、関数内の遷移に
限られる。すなわち反復して実行されるループについて
は認識できるが、ループから呼び出される関数があって
も得られたプロファイル情報からは判別できない。した
がって、この第２の従来技術を用いて取得したプロファ
イル情報に基づいてキャッシュへの配置割付を行う場合
に、ループから頻繁に呼び出される関数があったとして
も考慮し得ないので、最適な割付を実現することができ
ない。

【００１３】

【発明が解決しようとする課題】以上に説明したよう
に、第１の従来技術の配置割付装置およびその改良技術
では、配置割付が関数単位であるために低い頻度で実行
されるプログラム部分（低い頻度で実行される基本ブロ
ック）をも含めてひとつの関数として割り付けられるた
め、キャッシュメモリを有効に利用しているとはいえな
かった。また、間接関数呼出も含めて関数のプロファイ
ル情報を取得する場合にはプロファイル作成用に大きな
メモリ領域を必要とするという問題点があった。第２の
従来技術のプロファイリングでは、ループ内から呼び出
される関数については考慮し得ないので、実行頻度の高
い関数同士が同じキャッシュライン上に配置されキャッ
シュコンフリクトが発生する可能性がある。

【００１４】本発明はこのような事情に鑑みてなされた
もので、本発明の目的は、（１）小さな容量のプロファ
イル作成用メモリで間接関数呼出を含めて実用的に十分
なプロファイル情報を取得でき、（２）基本ブロックと
基本ブロックから呼び出される直接呼出関数および間接
呼出関数の中から高い頻度で呼び出される関数と高い頻
度で実行される基本ブロックだけを抽出して最適割付の
対象とすることによって、キャッシュコンフリクトを削
減できるとともに限られた容量のキャッシュメモリをよ
り有効に使用できる配置割付装置およびプログラムを提
供することである。

【００１５】

【課題を解決するための手段】本発明の関数と基本ブロ
ックの配置割付装置は、ソースプログラムを入力してコ
ンパイルし各々に含まれる関数呼出が１個以下の複数の
基本ブロックに関数を分割し、該関数の基本ブロックレ
ベルでのパスの実行を計数するためのコードと、基本ブ
ロックから関数呼出がある場合に直接呼出か間接呼出か
を判別して計数するためのコードとを付加しコード挿入
済みコンパイルプログラムとして出力するプロファイリ
ングコード挿入部と、基本ブロックレベルでのパス毎の
実行回数を記録するパスプロファイル情報記録手段と直
接関数呼出の実行回数を記録する直接関数呼出情報記録
手段と間接関数呼出の実行回数を記録する間接関数呼出
情報記録手段とを備え、前記コード挿入済みコンパイル
プログラムを入力して実行し前記パス毎の実行回数、前
記直接関数呼出の実行回数、前記間接関数呼出の実行回
数を計数して記録するコンパイルプログラム実行部と、
を有して構成される。

【００１６】また、本発明の割付最適化プログラムは、
命令キャッシュの割付を最適化するコンピュータプログ
ラムにおいてソースプログラムを入力してコンパイルし
関数を各々に含まれる関数呼出が１個以下の複数の基本
ブロックに分割し、関数の基本ブロックレベルでのパス
の実行を計数するためのパスプロファイリングコード
と、基本ブロックから関数呼出がある場合に直接呼出か
間接呼出かを判別して計数するための関数呼出プロファ
イリングコードとを挿入しコード挿入済みコンパイルプ
ログラムを生成する第１の手順と、前記コード挿入済み
コンパイルプログラムを入力し実行して実行終了後に基
本ブロックレベルでのパス毎の実行回数が計数され記録
されたパスプロファイル情報と、直接関数呼出を含む基
本ブロックの直接関数呼出の実行回数が計数され記録さ
れた直接関数呼出情報と、間接関数呼出を含む基本ブロ
ックの間接関数呼出の実行回数が計数され記録された間
接関数呼出情報とを含むプロファイル情報を生成する第
２の手順と、前記プロファイル情報に基づいて実行回数
の多い基本ブロックおよび関数を抽出しこれらが同一の
キャッシュラインに割り当てられることが少なくなるよ
うにメモリ空間に配置割付する第３の手順と、をコンピ
ュータに実行させることを特徴とする。

【００１７】

【発明の実施の形態】次に本発明について図面を用いて
説明する。図１は、本発明の一実施の形態の配置割付装
置を含むシステムのブロック図である。配置割付装置１
は、プロファイリングコード挿入部１１と、コンパイル
プログラム実行部１２と、プロファイル情報統合部１３
とメモリ空間配置最適化部１４とを有する。なお、以下
の説明では、ソースプログラムからマシン語またはアセ
ンブリ言語にコンパイルされたプログラムを各々に含ま
れる関数呼出が１個以下の複数のブロックに分割したと
きに、このようなブロックのそれぞれを基本ブロックと
呼び、これら複数の基本ブロックの全体をコンパイルプ
ログラムと呼ぶことにする。

【００１８】プロファイリングコード挿入部１１は、ソ
ースプログラム２をコンパイルし、プログラムをラベル
または分岐または関数呼出の出現毎に、各々に含まれる
関数呼出が１個以下の複数の基本ブロックに分割し、制
御フローグラフを作成し、パス毎にユニークなパスサム
を割り当て、基本ブロックのパスプロファイリングコー
ドを挿入するとともに、基本ブロックからの関数呼出を
含む場合に、イミディエート値によるＰＣ相対アドレス
での分岐である直接関数呼出か、または、レジスタ間接
による分岐である間接関数呼出か、を区別して関数呼出
回数を計測するための関数呼出頻度プロファイリングコ
ードを挿入しコード挿入済コンパイルプログラムを生成
する。また、基本ブロック情報、ループ逆向き情報、パ
ス情報等をパスデータファイルに格納する。

【００１９】コンパイルプログラム実行部１２は、図２
に示すように、関数の基本ブロックレベルのパスプロフ
ァイル情報を記録するパスプロファイル情報記録手段２
５と、直接関数呼出情報を記録する直接関数呼出情報記
録手段２０と、間接関数呼出情報を記録する間接関数呼
出情報記録手段２２とを有し、コード挿入済コンパイル
プログラム４を実行して基本ブロックレベルのパスプロ
ファイル情報を記録し、また、基本ブロックが関数呼出
を含む場合に直接関数呼出か間接関数呼出かを区別して
呼出回数を記録する。また、コンパイルプログラム実行
部１２は、コンパイルプログラムの実行完了後に基本ブ
ロックレベルのパスプロファイル情報と、直接関数呼出
情報および間接関数呼出情報とをプロファイル格納ファ
イル５に格納する。

【００２０】プロファイル情報統合部１３は、プロファ
イル格納ファイル５に格納されたパスデータファイルを
参照して基本ブロックレベルのパスプロファイル情報を
パスサムと回数の関係から基本ブロック名（基本ブロッ
クのＩＤ）で表現されたパスと回数との関係へ変換し、
直接関数呼出情報および間接関数呼出情報とともにプロ
ファイル情報ファイル６に出力する。

【００２１】メモリ空間配置最適化部１４は、プロファ
イル情報ファイル６に格納された基本ブロックレベルの
パスプロファイル情報と直接関数呼出情報および間接関
数呼出情報とに基づいて、例えば第１の従来技術におけ
る関数の配置割付（図１７）と同様の方法を用いて、基
本ブロックと関数とをメモリ空間に割り付けることによ
りキャッシュコンフリクトの発生を低減した配置最適化
情報７を生成し出力する。

【００２２】図２は、コンパイルプログラム実行部１２
が内部に備える直接関数呼出情報記録手段２０、間接関
数呼出情報記録手段２２およびパスプロファイル情報記
録手段２５の構成を示す図である。直接関数呼出情報記
録手段２０は、直接関数呼出情報２１について、直接関
数呼出で基本ブロックから呼び出される関数名を記録領
域３１に記録し呼出回数を記録領域３２に記録する。図
２の例では、記録領域３１に記録された関数（ｆｕｎｃ
Ａ）が１００回呼び出されたことを示す。間接関数呼出
情報記録手段２２は、累計呼出回数の多い間接関数呼出
の情報である最多呼出情報２３と最近に呼び出した間接
関数の情報であるカレント情報２４とを含む間接関数呼
出情報を記録する。最多呼出情報２３については、間接
関数呼出で基本ブロックから最も多くの回数呼び出され
た関数のアドレスが記録領域３３に記録され、この関数
アドレスに対する最多の連続呼出回数が記録領域３４に
記録され、この関数アドレスの累計呼出回数が記録領域
３５に格納される。カレント情報２４については、最近
の間接関数呼出で基本ブロックから呼び出された関数の
アドレスが記録領域３６に記録され、この関数に対する
連続呼出回数が記録領域３７に記録される。図２の例で
は、最多呼出情報２３は、記録領域３３に記録された関
数アドレス（ｆｕｎｃＢ）が最多の連続呼出回数として
２４回呼び出されたことがあり、この時点までの累計で
９６回呼び出されたことを示す。また、カレント情報２
４は、記録領域３６に記録された関数アドレス（ｆｕｎ
ｃＣ）が最近に呼び出された関数アドレスであり、現在
までの連続呼出回数が１回であることを示している。

【００２３】図２は、直接関数呼出する基本ブロックが
１個で間接関数呼出する基本ブロックが１個の単純な場
合であるが、直接関数呼び出しする基本ブロックがｍ個
ある場合には、直接関数呼出情報記録手段２０内には直
接関数呼び出しする基本ブロックのそれぞれに対応して
計ｍ個の直接関数呼出情報２１が設けられる。同様に、
間接関数呼出する基本ブロックがｎ個である場合には、
間接関数呼出情報記録手段２２内には間接関数呼び出し
する基本ブロックのそれぞれに対応して最多呼出情報と
カレント情報との組からなる間接関数呼出情報が計ｎ組
設けられる。また、図２の例では最多呼出情報２３は１
つであるが、最多呼出情報として累計呼出回数が多い方
からｋ個の関数アドレスを最多呼出情報として設定して
もよい。この場合には、ｋ個の最多呼出情報と１個のカ
レント情報とで１組の間接関数呼出情報となる。このよ
うに最多呼出情報を複数持つ場合であっても、従来の技
術のような関数の呼出元と呼出先との組み合わせを記録
するメモリ領域を用意するもの、および、関数実行の時
系列情報の始終を記録するもの、と比較して記録する情
報量を削減できるので、直接関数呼出情報記録手段２０
および間接関数呼出情報記録手段２２に使用されるメモ
リ容量を従来に比較して小容量で済ますことが可能とな
る。

【００２４】パスプロファイル情報記録手段２５は、実
行された基本ブロックのパスをパス毎に計数し記録す
る。記録領域３８に記録されたパスサムのそれぞれの値
に対応するパスが実行された回数が計数され、記録領域
３９に記録される。図２では、現時点までのコンパイル
プログラムの実行においてパスサム＝０に対応する基本
ブロックのパスをたどった回数が１であり、パスサム＝
２に対応する基本ブロックのパスをたどった回数が９８
であり、パスサム＝３に対応する基本ブロックのパスを
たどった回数が１であることを示している。

【００２５】次に、本実施の形態の動作について説明す
る。なお、以下の動作説明では、説明の簡単化のために
直接関数呼出する基本ブロックが１個であり、また、間
接関数呼出する基本ブロックが１個でかつ間接関数呼出
情報記録手段２２が記録する最多呼出情報２３も１つで
ある場合を例として説明する。

【００２６】図３は、プロファイリングコード挿入部１
１の動作を示すフロー図である。プロファイリングコー
ド挿入部１１は、ソースプログラム２をコンパイルして
関数を基本ブロックに分割した後、ステップＳ１１で関
数の制御フローグラフを構築する。

【００２７】図４は、Ｃ言語で記述されたソースプログ
ラムの例である。Ｉが１から１００までの間＋１加わる
毎に関数ｆｕｎｃＡを呼び出しｆｐのアドレスで示され
る関数を実行する。ｆｕｎｃＡの呼出回数を２５で割っ
て剰余がでる場合にはｆｐ＝ｆｕｎｃＢとしてアドレス
ｆｕｎｃＢの関数を実行し、ｆｕｎｃＡの呼出回数を２
５で割って剰余がでない場合にはｆｐ＝ｆｕｎｃＣとし
てアドレスｆｕｎｃＣの関数を実行する。図５は、図４
のソースプログラムをコンパイルしてＢ０、Ｂ１，Ｂ
２，Ｂ３，Ｂ４の５つの基本ブロックに分割した場合の
制御フローグラフである。それぞれの基本ブロックはア
センブル言語またはマシン語で記述されるが、ここでは
具体的な記述による煩雑さを避けるためにそれぞれの基
本ブロックでの大まかな処理を記すのみとする。図５の
基本ブロックＢ０では、関数ｆｕｎｃの開始に伴うスタ
ックフレームの生成やレジスタの退避等の処理と変数ｉ
の初期化を行う。基本ブロックＢ１では、ｆｕｎｃＡの
呼び出し処理（直接関数呼出）を行う。基本ブロックＢ
２では、ポインタｆｐによる間接関数呼出処理を行う。
基本ブロックＢ３では１００回のループが終了したかの
判定処理を行う。ｉ＝１００に満たない場合には基本ブ
ロックＢ１に戻り、ｉ＝１００の場合には基本ブロック
Ｂ４へ進む。基本ブロックＢ４では、レジスタの復帰、
スタックフレームの消滅などの関数エピローグ処理を行
い呼び側関数へ復帰する。

【００２８】本実施の形態では、基本ブロックの制御フ
ローグラフに対して、前述した第２の従来技術と同様の
方法でパスプロファイルを収集してパスプロファイル情
報記録手段２５に記録する。

【００２９】図３に戻り、ステップＳ１２では、制御フ
ローグラフにループ情報があるか否かの解析を行う。図
５の制御フローグラフではＢ１からＢ２，Ｂ３を通って
Ｂ１に戻るループが存在することを検出する。ステップ
Ｓ１３に進み、Ｂ０〜Ｂ４の基本ブロック情報、ループ
逆向き辺の情報をパスデータファイル３に出力する。図
１０は、パスデータファイル３の一例を示す図である。
６行目から１０行目にかけて基本ブロック情報が格納さ
れている。例えば、６行目の（０：１４：１）は、基本
ブロックＢ０（ブロックＩＤが「０」）に属するプログ
ラムはコンパイルプログラムの１４行目から記述されて
いて後続のブロックＩＤが「１」（基本ブロックＢ１）
であることを示している。また、ループ逆向き辺の情報
については、１２行目の（３，１）により、ＩＤが３の
ブロック（基本ブロックＢ３）からＩＤが１のブロック
（基本ブロックＢ１）へ向かう逆向き辺が存在すること
を示している。

【００３０】次にステップＳ１４に進み、ループ逆向き
辺の変形を行う。具体的には、図６（ａ）に示すよう
に、ＥＮＴＲＹとＥＸＩＴを設け、ＥＮＴＲＹから基本
ブロックＢ０に進む辺と、ＥＮＴＲＹから基本ブロック
Ｂ１に進む辺と、基本ブロックＢ３からＥＸＩＴに進む
辺と、基本ブロックＢ４からＥＸＩＴに進む辺と、ＥＸ
ＩＴからＥＮＴＲＹへ戻る辺とを付加し、基本ブロック
Ｂ３から基本ブロックＢ１へ戻る辺を削除する。この変
形により、基本ブロックＢ３から基本ブロックＢ１へ戻
る逆向き辺は、Ｂ３，ＥＸＩＴ、ＥＮＴＲＹ，Ｂ１の経
路に置き換わり、基本ブロックＢ１から基本ブロックＢ
４までの間から逆向き辺をなくすことができるわけであ
る。ＥＮＴＲＹおよびＥＸＩＴのＩＤは基本ブロックの
ＩＤとして割り当てられていないＩＤを割り当てる。こ
こではＥＮＴＲＹのＩＤを「−２」、ＥＸＩＴのＩＤを
「−１」としている。

【００３１】次にステップＳ１５に進み、ＥＮＴＲＹか
らＥＸＩＴへのそれぞれのパスにユニークな値のパスサ
ムが対応し、かつ，パスサムの範囲が０から（パスの数
−１）となるように、各々の辺のラベルを決定する。す
なわち、制御フローグラフの出口から入口に向かって走
査して基本ブロックにラベルを付けた後、再び制御フロ
ーグラフの出口から入口に向かって走査して基本ブロッ
クのラベルに基づいて各辺のラベルを決定する。図６
（ａ）の変形された制御フローグラフにおいては、基本
ブロックＢ３からＢ４への辺にラベル“１”を付け、Ｅ
ＮＴＲＹからＢ１への辺にラベル“２”を付け、図６
（ｂ）に示すように、ＥＮＴＲＹからＥＸＩＴまでの可
能な４通りのパスに対してパスサム０，１，２，３を割
り当てる。

【００３２】図７は、ラベル設定、パスサム計算、パス
サムに対応するレジスタのインクリメント等のパスプロ
ファイリングのための処理を付加する辺に黒い四角を付
して表示した制御フローグラフである。ステップＳ１６
では、パスプロファイル情報記録部２５にパスサムと実
行回数とを対応させて記録するために、これらの付加処
理に対応するコードを辺に沿って付加する。

【００３３】次に、ステップＳ１７では、直接関数呼出
の計数および間接関数呼出の計数のための関数呼出頻度
プロファイリングコードを挿入する。

【００３４】図８は、ステップＳ１７の関数呼出頻度プ
ロファイリングコード挿入処理の詳細なフロー図であ
る。ステップＳ１７の関数呼出頻度プロファイリングコ
ード挿入処理では、まずステップＳ２１で、関数呼出頻
度プロファイリングコード挿入処理未了の基本ブロック
を選択する。次に選択した基本ブロックが関数呼出を含
むか否かを判断する。関数呼出を含まない場合にはその
ままコード挿入済コンパイルプログラム４に出力してス
テップＳ２９へ進む。関数呼出を含む場合にはステップ
Ｓ２３へ進み直接関数呼出か否かを判断する。直接関数
呼出を含む場合にはステップＳ２４で直接関数呼出情報
記録手段２０内に直接関数呼出情報２１を記録する領域
を設けて割り当て、ステップＳ２５で呼び出される関数
名を設定し、ステップＳ２６でこの基本ブロックのプロ
グラムを実行する毎に対応する直接関数呼出情報２１の
呼出回数を＋１加算する処理を行うようにプロファイリ
ングコードを挿入してステップＳ２９へ進む。図６の制
御フローグラフの例では、基本ブロックＢ１に呼び出さ
れる関数名をｆｕｎｃＡとして直接関数呼出のプロファ
イリングコードが挿入される。ステップＳ２３で直接関
数呼出でないと判断された場合には、ステップＳ２７へ
進み、間接関数呼出情報記録手段２２内に最多呼出情報
とカレント情報との組からなる間接関数呼出情報を記録
する領域を設けて割り当て、ステップＳ２８で後述する
図９の処理を行うためのプロファイリングコードを挿入
しコード挿入済コンパイルプログラム４に格納してステ
ップＳ２９へ進む。図６の制御フローグラフの例では、
基本ブロックＢ２に間接関数呼出のプロファイリングコ
ードが挿入される。ステップＳ２９ですべての基本ブロ
ックの処理が終了したか否かを判断し、処理未了の基本
ブロックがあればステップＳ２１へ戻る。ステップＳ２
９ですべての基本ブロックについて処理が終了したと判
断された場合には図３のステップＳ１７を終了しステッ
プＳ１８へ進む。

【００３５】ステップＳ１８では、パスの情報をパスデ
ータファイル３に格納する。パスデータファイルの例で
ある図１０を参照すると、パスの情報として、１４行目
にパスサムの範囲が０から３までの整数値であることが
追加され、１６行目、１７行目にラベル付けされた辺の
情報が追加されている。１６行目の（−２，１：２：
３）は、前半の（−２，１：２）でブロックＩＤが「−
２」のＥＮＴＲＹからブロックＩＤが「１」の基本ブロ
ックＢ１へ向かう辺にラベル２が付与されたことを示
し、最後の（：３）はこの辺が対応する元のループ逆向
き辺がブロックＩＤが「３」の基本ブロックＢ３からの
辺であることを示す。同様に、１７行目は、ブロックＩ
Ｄが「３」の基本ブロックＢ３からブロックＩＤが
「４」の基本ブロックＢ４へ向かう辺にラベル１が付与
されたことを示す。

【００３６】次に、図８のステップＳ２８で挿入される
プロファイリングコードにより実行される処理について
説明する。図９は、間接関数呼出におけるプロファイリ
ング処理のフローを示す図である。すなわち、図８のス
テップＳ２８において図９の処理を行うためのプロファ
イリングコードが挿入され、コンパイルプログラム実行
部１２によるコード挿入済みコンパイルプログラムの実
行の際に、間接関数呼出を含む基本ブロックが実行され
る毎に図９のフローに従ってプロファイリングが行われ
る。図２に関連して説明したように、関数呼出を含む基
本ブロックに対応して最多呼出情報２３とカレント呼出
情報２４とが設けられていて、プロファイリング実行時
にはカレント呼出情報２４の記録領域３６に呼び出され
る関数のアドレスを記録し、記録領域３７に連続呼出回
数を呼出毎に計数して記録する。

【００３７】間接関数呼出があったときに、まずステッ
プＳ３１で呼び出される関数のアドレス（間接呼出関数
であるので、プログラム中に指定されたレジスタＲに格
納された値が呼び出される関数の開始アドレスを示す）
と、カレント呼出情報２４の記録領域３６に記録された
関数アドレスとを比較する。ステップＳ３２で両者が同
一アドレスか否かを判断し、同一アドレスであると判断
された場合にはステップＳ３３に進み、カレント呼出情
報２４の記録領域３７に記録された連続呼出回数に＋１
を加算して更新し、この間接関数呼出に関するプロファ
イリング処理を終了する。

【００３８】ステップＳ３２で同一アドレスではないと
判断された場合にはカレント呼出情報２４を新規に設定
し直す必要が生じる。この場合にはまずステップＳ３４
に進み、記録領域３３に記録された最多呼出情報２３の
関数アドレスと記録領域３６に記録されたカレント呼出
情報２４の関数アドレスとを比較する。ステップＳ３５
で両者が同一アドレスか否かを判断し、同一アドレスで
あると判断された場合には最多呼出情報２３の記録領域
３５に記録された累計呼出回数にカレント呼出情報２４
の記録領域３７に記録された連続呼出回数を加算し累計
呼出回数として記録領域３５に書き戻したのちにカレン
ト呼出情報の更新ステップであるステップＳ４０に進
む。

【００３９】ステップＳ３５で同一アドレスではないと
判断された場合にはステップＳ３７に進み、カレント呼
出情報２４の記録領域３７に記録されている連続呼出回
数と最多呼出情報２３の記録領域３５に記録されている
累計呼出回数とを比較する。ステップＳ３８でカレント
呼出情報２４の連続呼出回数の方が大きいと判断された
場合にはカレント呼出情報２４の記録領域３６にあった
関数アドレスを最多呼出情報２３の記録領域３３に書き
込み、カレント呼出情報２４の記録領域３７にあった連
続呼出回数を最多呼出情報２３の記録領域３４及び記録
領域３５に書き込んだのちにカレント呼出情報の更新ス
テップであるステップＳ４０に進む。ステップＳ３８で
カレント呼出情報２４の連続呼出回数の方が大きくはな
いと判断された場合にはそのままカレント呼出情報の更
新ステップであるステップＳ４０に進む。

【００４０】ステップＳ４０では、カレント呼出情報２
４の記録領域３６に新たに呼び出された関数のアドレス
を書き込み、連続呼出回数を１に更新し、この間接関数
呼出に関するプロファイリング処理を終了する。

【００４１】次に、図１に戻り、コンパイルプログラム
実行部１２の動作について説明する。コンパイルプログ
ラム実行部１２は、コード挿入済コンパイルプログラム
４からプロファイリングコードが付加された基本ブロッ
クを読み込んで各基本ブロックをリンクして実行する。
基本ブロックのパスプロファイルについては図７のＥＮ
ＴＲＹからＥＸＩＴまでの基本ブロックのパスを実行す
る毎に、基本ブロッＢ０からＢ１への辺またはＥＮＴＲ
ＹからＢ１への辺ではパスサムの値に対応するレジスタ
を設定し、Ｂ３からＢ４への辺またはＢ３からＥＸＩＴ
への辺ではパスサムの値に対応するレジスタを更新し、
パスプロファイル情報記録手段２５のパスサムの値に対
応する記録領域３９が格納する値に＋１を加える。ま
た、関数呼出を含む基本ブロックについては次のように
してプロファイリングする。基本ブロックが直接関数呼
出を含む場合は、呼び出される関数名はプロファイリン
グコードの挿入処理（図８のステップＳ２５）で設定さ
れて図２の直接関数呼出情報記録手段２０の直接関数呼
出情報２１内の記録領域３１に記録されており、プロフ
ァイリングの実行時に呼出回数をカウントする。基本ブ
ロックが関数呼出を含む場合は、関数アドレスは呼び出
される関数の実行時に判明し、図９の処理フローに従っ
てプロファイリングする。

【００４２】図１１（ａ）は図７の基本ブロックＢ１に
対応して設定された直接関数呼出情報２１の初期状態を
示し、図１１（ｂ）はループ１００回実行後の直接関数
呼出情報２１を示している。関数ｆｕｎｃＡは図８のス
テップＳ２５で設定されており、コード挿入済みコンパ
イルプログラムの基本ブロックＢ１を実行する毎に記録
領域３２に記録される呼出回数に＋１を加算する。図４
のソースプログラムではＩ＝１００まで繰り返すので基
本ブロックＢ１は１００回実行されることになり、コー
ド挿入済みコンパイルプログラムの実行が終了したのち
には直接関数呼出情報２１の記録領域３２に記録される
ｆｕｎｃＡの呼出回数は図１１（ｂ）に示すように１０
０となる。

【００４３】図１２（ａ）〜（ｆ）は、基本ブロックＢ
２に対応して設定された間接関数呼出の最多呼出情報お
よびカレント呼出情報の初期状態からループ１００回実
行後の状態までの推移を示す。図１２（ａ）の初期状態
では最多呼出情報の関数アドレス、連続呼出回数、累計
呼出回数をそれぞれ記録する記録領域３３，３４，３５
と、カレント呼出情報の関数アドレス、連続呼出回数を
それぞれ記録する記録領域３６，３７とはクリアされた
状態になっている。図７のＥＮＴＲＹからＥＸＩＴへ行
きＥＮＴＲＹに戻るループ（１回目はＥＮＴＲＹ，Ｂ
０，Ｂ１，Ｂ２，Ｂ３，ＥＸＩＴ，ＥＮＴＲＹのパスを
通る）を１回実行した段階では、図１２（ｂ）のように
カレント呼出情報のみが記録され、記録領域３６に関数
アドレスとしてｆｕｎｃＢが記録され記録領域３７に連
続呼出回数１が記録される。２回目のループから２４回
目のループ終了まではループの回数を重ねる（２回目か
らはＥＮＴＲＹ，Ｂ１，Ｂ２，Ｂ３，ＥＸＩＴ，ＥＮＴ
ＲＹのパスを通る）毎に図９のステップＳ３２からステ
ップＳ３３のフローを通ってカレント呼出情報の連続呼
出回数が＋１される。

【００４４】２５回目のループでｆｕｎｃＡの実行回数
を２５で割った剰余が０となるので基本ブロックＢ２か
ら関数アドレスｆｕｎｃＣを呼び出す。したがって図９
のステップＳ３２からステップＳ３４，Ｓ３５，Ｓ３
７，Ｓ３８，Ｓ３９，Ｓ４０のフローを通るため、ルー
プ２５回終了後は図１２（ｃ）のように最多呼出情報の
関数アドレス、連続呼出回数、累計呼出回数に、ｆｕｎ
ｃＢ、２４、２４がそれぞれ記録され、カレント呼出情
報の関数アドレス、連続呼出回数にｆｕｎｃＣ、１がそ
れぞれ記録される。２６回目のループではｆｕｎｃＡの
実行回数を２５で割った剰余が１となるので基本ブロッ
クＢ２から関数アドレスｆｕｎｃＢを呼び出す。図９の
ステップＳ３２からステップＳ３４，Ｓ３５，Ｓ３７，
Ｓ３８，Ｓ４０のフローを通るため、ループ２６回終了
後は図１２（ｄ）のように最多呼出情報はループ２５回
終了時と変わらず、カレント呼出情報のみが関数アドレ
ス、連続呼出回数にｆｕｎｃＢ、１がそれぞれ記録され
る。２７回目のループから４９回目のループまでは基本
ブロックＢ２を実行する毎に図９のステップＳ３２，Ｓ
３３を通ってカレント呼出情報の連続呼出回数が＋１さ
れる。

【００４５】５０回目のループではｆｕｎｃＡの実行回
数を２５で割った剰余が０となるので基本ブロックＢ２
から関数アドレスｆｕｎｃＣを呼び出し、図９のステッ
プＳ３２からステップＳ３４，Ｓ３５，Ｓ３６，Ｓ４０
のフローを通るため、図１２（ｅ）のように最多呼出情
報の関数アドレス、連続呼出回数、累計呼出回数に、ｆ
ｕｎｃＢ、２４、４８がそれぞれ記録され、カレント呼
出情報の関数アドレス、連続呼出回数にｆｕｎｃＣ、１
がそれぞれ記録される。５１回目のループではｆｕｎｃ
Ａの実行回数を２５で割った剰余が１となるので基本ブ
ロックＢ２から関数アドレスｆｕｎｃＢを呼び出し、図
９のステップＳ３２からステップＳ３４，Ｓ３５，Ｓ３
７，Ｓ３８，Ｓ４０のフローを通るため、ループ５１回
終了後は最多呼出情報はループ５０回終了時と変わら
ず、カレント呼出情報のみが関数アドレス、連続呼出回
数にｆｕｎｃＢ、１がそれぞれ記録される。５２回目の
ループから７４回目のループまでは基本ブロックＢ２を
実行する毎に図９のステップＳ３２，Ｓ３３を通ってカ
レント呼出情報の連続呼出回数が＋１される。

【００４６】７５回目のループではｆｕｎｃＡの実行回
数を２５で割った剰余が０となるので基本ブロックＢ２
から関数アドレスｆｕｎｃＣを呼び出し、図９のステッ
プＳ３２からステップＳ３４，Ｓ３５，Ｓ３６，Ｓ４０
のフローを通るため、最多呼出情報の関数アドレス、連
続呼出回数、累計呼出回数に、ｆｕｎｃＢ、２４、７２
がそれぞれ記録され、カレント呼出情報の関数アドレ
ス、連続呼出回数にｆｕｎｃＣ、１がそれぞれ記録され
る。７６回目のループではｆｕｎｃＡの実行回数を２５
で割った剰余が１となるので基本ブロックＢ２から関数
アドレスｆｕｎｃＢを呼び出し、図９のステップＳ３２
からステップＳ３４，Ｓ３５，Ｓ３７，Ｓ３８，Ｓ４０
のフローを通るため、ループ７６回終了後は最多呼出情
報はループ５０回終了時と変わらず、カレント呼出情報
のみが関数アドレス、連続呼出回数にｆｕｎｃＢ、１が
それぞれ記録される。７７回目のループから９９回目の
ループまでは基本ブロックＢ２を実行する毎に図９のス
テップＳ３２，Ｓ３３を通ってカレント呼出情報の連続
呼出回数が＋１される。

【００４７】１００回目のループではｆｕｎｃＡの実行
回数を２５で割った剰余が０となるので基本ブロックＢ
２から関数アドレスｆｕｎｃＣを呼び出し、図９のステ
ップＳ３２からステップＳ３４，Ｓ３５，Ｓ３６，Ｓ４
０のフローを通るため、図１２（ｆ）に示すように、最
多呼出情報の関数アドレス、連続呼出回数、累計呼出回
数に、ｆｕｎｃＢ、２４、９６がそれぞれ記録され、カ
レント呼出情報の関数アドレス、連続呼出回数にｆｕｎ
ｃＣ、１がそれぞれ記録される。なお１００回目にはＥ
ＮＴＲＹ，Ｂ１，Ｂ２，Ｂ３，Ｂ４，ＥＸＩＴのパスを
通りコンパイルプログラムの実行をすべて終了する。

【００４８】上に述べたように１回目のループではＥＮ
ＴＲＹ，Ｂ０，Ｂ１，Ｂ２，Ｂ３，ＥＸＩＴのパスは通
るが、図６を参照するとこのパスに対応するパスサムは
０であり、２回目から９９回目までのループではＥＮＴ
ＲＹ，Ｂ１，Ｂ２，Ｂ３，ＥＸＩＴのパスを通るが、図
６を参照するとこのパスのパスサムは２であり、１００
回目のループではＥＮＴＲＹ，Ｂ１，Ｂ２，Ｂ３，Ｂ
４，ＥＸＩＴのパスを通るが、図６を参照するとこのパ
スのパスサムは３である。したがって基本ブロックレベ
ルのパスプロファイル情報は、パスサムが０のパスの実
行回数が１となり、パスサムが２のパスの実行回数が９
８となり、パスサムが３のパスの実行回数が１となる。

【００４９】コンパイルプログラムの実行が終了した段
階では、直接関数呼出情報記録手段２０に記録された直
接関数呼出情報２１と、間接関数呼出情報記録手段２２
に記録された最多呼出情報２３およびカレント呼出情報
２４と、パスプロファイル情報記録手段２５に記録され
た基本ブロックレベルのパスプロファイル情報とは、図
２に示したようになり、コンパイルプログラム実行部１
２はこれらのプロファイル情報をプロファイル格納ファ
イル５に格納する。

【００５０】なお、以上の間接関数呼出のプロファイリ
ングの説明では、図９のフローに示したようにカレント
呼出情報に記録された関数アドレスとは異なる関数アド
レスが呼び出されて呼び出された関数アドレスが最多呼
出情報に記録された関数アドレスとも異なる場合（すな
わち、図９でステップＳ３２，Ｓ３４を通りステップＳ
３５でＮＯと判断された場合）に、ステップＳ３７で最
多呼出情報の累計呼出回数とカレント呼出情報の連続呼
出回数とを比較していたが、最多呼出情報の連続呼出回
数とカレント呼出情報の連続呼出回数とを比較するよう
にしてもよい。図１３は、図９とは別の実施例で最多呼
出情報の連続呼出回数とカレント呼出情報の連続呼出回
数とを比較するように変更したフロー図である。図９に
おけるステップＳ３７を、最多呼出情報の連続呼出回数
とカレント呼出情報の連続呼出回数とを比較するステッ
プＳ３７ａに置き換えたこと以外は図９と同一であり、
ステップＳ３８でカレント呼出情報の連続呼出回数の方
が最多呼出情報の連続呼出回数よりも大である場合には
ステップＳ３９でカレント呼出情報に記録されていた関
数アドレスを最多呼出情報の関数アドレスに書き込み、
カレント呼出情報の連続呼出回数を最多呼出情報の連続
呼出回数および累計呼出回数に書き込む。図９のフロー
を用いた場合には、累計呼出回数を最重要視したプロフ
ァイル情報が得られるのに対して、図１３のフローを用
いた場合には累計呼出回数よりも連続呼出回数を重要視
したプロファイル情報が得られる。

【００５１】次に、図１に戻り、プロファイル情報統合
部１３の動作について説明する。プロファイル格納ファ
イル５に格納された基本ブロックレベルのパスプロファ
イル情報はパスサムと実行回数の対応を示すだけである
ため、プロファイル情報統合部１３ではプロファイル格
納ファイル５とパスデータファイル３とを読み込み、基
本ブロックレベルのパスプロファイル情報とパスデータ
ファイル３に格納された基本ブロックレベルのパスとの
対応（図１０参照）と統合して基本ブロック名（基本ブ
ロックのＩＤ）で表現されたパスと回数との関係へ変換
する。このようにして統合されたパスプロファイル情報
と、プロファイル格納ファイル５から読み出した直接関
数呼出情報２１および間接関数呼出情報（最多呼出情報
およびカレント呼出情報）とをプロファイル情報ファイ
ル６に格納する。

【００５２】次に、メモリ空間配置最適化部１４の動作
について説明する。メモリ空間配置最適化部１４には、
配置対象となる各関数プログラムのサイズおよび各基本
ブロックプログラムのサイズに関する情報が格納され
る。これらを予め算出して直接にメモリ空間配置最適化
部１４に供給してもよく、またプロファイル情報ファイ
ル６などに一旦格納してからメモリ空間配置最適化部１
４に読み込んでもよい。メモリ空間配置最適化部１４
は、統合されたパスプロファイル情報、直接関数呼出情
報および間接関数呼出情報（最多呼出情報およびカレン
ト呼出情報）をプロファイル情報ファイル６から読み込
み、各関数プログラムのサイズおよび各基本ブロックプ
ログラムのサイズを参照して、例えば第１の従来技術に
おける関数の割付と同様の方法を関数および基本ブロッ
クに適用してメモリ空間に割り付けることによりキャッ
シュコンフリクトの発生を低減した配置最適化情報７を
生成し出力する。

【００５３】図１４は、図２で示されたパスプロファイ
ル情報、直接関数呼出情報および間接関数呼出情報（最
多呼出情報およびカレント呼出情報）に基づいて関数ｆ
ｕｎｃを構成する基本ブロックＢ０〜Ｂ４と基本ブロッ
クＢ１から直接関数呼出される関数ｆｕｎｃＡと基本ブ
ロックＢ２から間接関数呼出される関数ｆｕｎｃＢおよ
びｆｕｎｃＣを最適配置した一例である。この例では、
Ｂ０〜Ｂ４の各基本ブロック、関数ｆｕｎｃＡ、関数ｆ
ｕｎｃＢ、関数ｆｕｎｃＣのそれぞれが１キャッシュラ
インのサイズであるとし、キャッシュサイズには５キャ
ッシュラインを含むものとしている。

【００５４】図１４においては、キャッシュサイズで区
切られたメモリ空間（キャッシュサイズ空間と呼ぶこと
にする）で左端から数えて１番目のキャッシュラインに
対応する位置に呼出回数が１００回の関数ｆｕｎｃＡが
配置され、これと隣接した左端から数えて２番目のキャ
ッシュラインに対応する位置に累計呼出回数が９６回の
関数ｆｕｎｃＢが配置されている。これらとのコンフリ
クトの発生を抑制するように、隣のキャッシュサイズ空
間で左端から数えて３番目のキャッシュラインから５番
目キャッシュラインに対応する位置に実行回数が９８回
のパスに含まれる基本ブロックＢ１，Ｂ２，Ｂ３が配置
されている。このようにパスプロファイル情報、直接関
数呼出情報および間接関数呼出情報（最多呼出情報およ
びカレント呼出情報）に基づいて関数および基本ブロッ
クの配置が割り付けられることにより、コンフリクトの
発生を低減することができる。

【００５５】第１の従来技術では関数ｆｕｎｃを５キャ
ッシュラインを占める１個の関数として扱っていたため
関数数ｆｕｎｃＡ、関数ｆｕｎｃＢ、関数ｆｕｎｃの３
つを（すべてをコンフリクトなく配置するには７キャッ
シュライン必要なので）５キャッシュラインのキャッシ
ュサイズの中に最適配置することができなかったが、本
発明によれば、関数ｆｕｎｃは基本ブロックＢ０〜Ｂ４
に分割され、そのうちの基本ブロックＢ１，Ｂ２，Ｂ３
だけが関数ｆｕｎｃＡ，ｆｕｎｃＢとともに最適配置の
対象とされるので、図１４に示す配置割付をとることが
可能となり、キャッシュコンフリクトを著しく低減する
ことができる。

【００５６】なお、以上において配置割付装置１は、専
用の装置として説明したが、汎用のコンピュータと、プ
ロファイリングコード挿入手順を記述したプログラム、
コンパイルプログラム実行手順を記述したプログラムお
よびプロファイル情報統合の手順を記述したプログラム
を含むプロファイル情報生成プログラムとメモリ空間配
置最適化プログラムとからなる配置割付プログラムと、
を用いても本発明の配置割付装置１をまったく支障なく
実現し適用することができる。

【００５７】

【発明の効果】以上のように、本発明を適用することに
より、関数呼出のプロファイル情報とパスプロファイリ
ングにより取得した基本ブロックレベルでのパスプロフ
ァイル情報との両方に基づき基本ブロックと関数とを同
様に扱って高い頻度で呼び出される関数と高い頻度で実
行される基本ブロックだけを抽出し最適割付の対象とし
てメモリ空間への配置割付を行うので、キャッシュの限
られた容量を従来よりも有効に活用してキャッシュコン
フリクトを削減することが可能となる。また、関数呼出
のプロファイリングにおいて記録する情報の量が従来よ
り少ないため小容量で直接関数呼出だけでなく間接関数
呼出を含めた関数呼出のプロファイル情報を記録できる
ので、パスプロファイル情報を含めたプロファイル情報
の作成が小さなメモリ容量で可能となる。

【図面の簡単な説明】

【図１】本発明の一実施の形態の配置割付装置を含むシ
ステムのブロック図である。

【図２】直接関数呼出情報記録手段、間接関数呼出情報
記録手段およびパスプロファイル情報記録手段の構成を
示す図である。

【図３】プロファイリングコード挿入部の動作を示すフ
ロー図である。

【図４】Ｃ言語で記述されたソースプログラムの例であ
る。

【図５】ソースプログラムをコンパイルしてＢ０、Ｂ
１，Ｂ２，Ｂ３，Ｂ４の５つの基本ブロックに分割した
場合の制御フローグラフである。

【図６】（ａ）は変形された制御フローグラフを示す図
であり、（ｂ）はパスサムと関数ｆｕｎｃの基本ブロッ
クレベルのパスとの対応を示す図である。

【図７】付加処理を辺に対応させて表示した制御フロー
グラフである。

【図８】関数呼出頻度プロファイリングコード挿入処理
のフロー図である。

【図９】間接関数呼出におけるプロファイリング処理の
フロー図である。

【図１０】パスデータファイルの一例を示す図である。

【図１１】直接関数呼出情報の状態の推移を示す図であ
る。

【図１２】最多呼出情報およびカレント呼出情報の状態
の推移を示す図である。

【図１３】間接関数呼出におけるプロファイリング処理
の別の実施例を示すフロー図である。

【図１４】本発明による最適配置割付の一例である。

【図１５】第１の従来技術による配置割付装置の図であ
る。

【図１６】第１の従来技術における関数呼出組合せ情報
の一例を示す図である。

【図１７】第１の従来技術におけるメモリ空間配置最適
化部の処理を示すフロー図である。

【図１８】図１６に対応する関数呼出グラフである。

【図１９】第１の従来技術による配置割付の各段階での
関数のメモリ空間への配置状況と使用不可能集合を示す
図である。

【図２０】第２の従来技術によるパスプロファイリング
の概略を説明するための図で、（ａ）は基本ブロックレ
ベルの制御フロー図であり、（ｂ）はパスとパスサムと
の対応を示す図である。

【符号の説明】

１配置割付装置２ソースプログラム３パスデータファイル４コード挿入済コンパイルプログラム５プロファイル格納ファイル６プロファイル情報ファイル７配置最適化情報１１プロファイリングコード挿入部１２コンパイルプログラム実行部１３プロファイル情報統合部１４メモリ空間配置最適化部２０直接関数呼出情報記録手段２１直接関数呼出情報２２間接関数呼出情報記録手段２３最多呼出情報２４カレント呼出情報２５パスプロファイル情報記録手段３１，３２，３３，３４，３５，３６，３７，３８，３
９記録領域Ｂ０，Ｂ１，Ｂ２，Ｂ３，Ｂ４基本ブロック

Claims

【特許請求の範囲】

【請求項１】ソースプログラムを入力してコンパイル
し各々に含まれる関数呼出が１個以下の複数の基本ブロ
ックに関数を分割し、該関数の基本ブロックレベルでの
パスの実行を計数するためのコードと、基本ブロックか
ら関数呼出がある場合に直接呼出か間接呼出かを判別し
て計数するためのコードとを付加しコード挿入済みコン
パイルプログラムとして出力するプロファイリングコー
ド挿入部と、基本ブロックレベルでのパス毎の実行回数を記録するパ
スプロファイル情報記録手段と直接関数呼出の実行回数
を記録する直接関数呼出情報記録手段と間接関数呼出の
実行回数を記録する間接関数呼出情報記録手段とを備
え、前記コード挿入済みコンパイルプログラムを入力し
て実行し前記パス毎の実行回数、前記直接関数呼出の実
行回数、前記間接関数呼出の実行回数を計数して記録す
るコンパイルプログラム実行部と、を有して構成される
ことを特徴とする関数と基本ブロックの配置割付装置。
【請求項２】前記直接関数呼出情報記録手段は、呼び
出された関数名と呼出回数とを対応させて記録し、前記間接関数呼出情報記録手段は、呼出回数の累計が最
多である間接関数呼出について呼び出された関数のアド
レスと累計呼出回数とを対応させて記録することを特徴
とする請求項１記載の関数と基本ブロックの配置割付装
置。
【請求項３】前記直接関数呼出情報記録手段は、呼び
出された関数名と呼出回数とを対応させて直接関数呼出
情報として記録し、前記間接関数呼出情報記録手段は、呼出回数の累計が最
多である間接関数呼出について呼び出された関数のアド
レスと連続呼出回数と累計呼出回数とを対応させて最多
呼出情報として記録し、前回に実行された間接関数呼出
について呼び出された関数のアドレスと連続呼出回数と
を対応させてカレント呼出情報として記録し、今回呼び
出される関数アドレスが前記カレント呼出情報に記録さ
れた関数アドレスと異なりかつ前記最多呼出情報に記録
された関数アドレスと同一である場合には前記カレント
呼出情報の連続呼出回数を前記最多呼出情報の累計呼出
回数に加算して得られる回数が累計呼出情報として書き
込まれ、今回呼び出される関数アドレスが前記カレント
呼出情報に記録された関数アドレスと異なりかつ前記最
多呼出情報に記録された関数アドレスとも異なる場合に
は前記カレント呼出情報の連続呼出回数が前記最多呼出
情報の累計呼出回数よりも大きければ前記カレント呼出
情報の関数アドレスが前記最多呼出情報の関数アドレス
として書き込まれるとともに前記カレント呼出情報の連
続呼出回数が前記最多呼出情報の連続呼出回数および累
計呼出回数として書き込まれることを特徴とする請求項
１記載の関数と基本ブロックの配置割付装置。
【請求項４】前記直接関数呼出情報記録手段は、呼び
出された関数名と呼出回数とを対応させて記録し、前記間接関数呼出情報記録手段は、連続呼出回数が最多
である間接関数呼出について呼び出された関数のアドレ
スと連続呼出回数とを対応させて記録することを特徴と
する請求項１記載の関数と基本ブロックの配置割付装
置。
【請求項５】前記直接関数呼出情報記録手段は、呼び
出された関数名と呼出回数とを対応させて直接関数呼出
情報として記録し、前記間接関数呼出情報記録手段は、連続呼出回数が最多
である間接関数呼出について呼び出された関数のアドレ
スと連続呼出回数と累計呼出回数とを対応させて最多呼
出情報として記録し、前回に実行された間接関数呼出に
ついて呼び出された関数のアドレスと連続呼出回数とを
対応させてカレント呼出情報として記録し、今回呼び出
される関数アドレスが前記カレント呼出情報に記録され
た関数アドレスと異なりかつ前記最多呼出情報に記録さ
れた関数アドレスと同一である場合には前記カレント呼
出情報の連続呼出回数を前記最多呼出情報の累計呼出回
数に加算して得られる回数が累計呼出情報として書き込
まれ、今回呼び出される関数アドレスが前記カレント呼
出情報に記録された関数アドレスと異なりかつ前記最多
呼出情報に記録された関数アドレスとも異なる場合には
前記カレント呼出情報の連続呼出回数が前記最多呼出情
報の連続呼出回数よりも大きければ前記カレント呼出情
報の関数アドレスが前記最多呼出情報の関数アドレスと
して書き込まれるとともに前記カレント呼出情報の連続
呼出回数が前記最多呼出情報の連続呼出回数および累計
呼出回数として書き込まれることを特徴とする請求項１
記載の関数と基本ブロックの配置割付装置。
【請求項６】命令キャッシュの割付を最適化するコン
ピュータプログラムにおいてソースプログラムを入力してコンパイルし関数を各々に
含まれる関数呼出が１個以下の複数の基本ブロックに分
割し、関数の基本ブロックレベルでのパスの実行を計数
するためのパスプロファイリングコードと、基本ブロッ
クから関数呼出がある場合に直接呼出か間接呼出かを判
別して計数するための関数呼出プロファイリングコード
とを挿入しコード挿入済みコンパイルプログラムを生成
する第１の手順と、前記コード挿入済みコンパイルプログラムを入力し実行
して実行終了後に基本ブロックレベルでのパス毎の実行
回数が計数され記録されたパスプロファイル情報と、直
接関数呼出を含む基本ブロックの直接関数呼出の実行回
数が計数され記録された直接関数呼出情報と、間接関数
呼出を含む基本ブロックの間接関数呼出の実行回数が計
数され記録された間接関数呼出情報とを含むプロファイ
ル情報を生成する第２の手順と、前記プロファイル情報に基づいて実行回数の多い基本ブ
ロックおよび関数を抽出しこれらが同一のキャッシュラ
インに割り当てられることが少なくなるようにメモリ空
間に配置割付する第３の手順と、をコンピュータに実行
させることを特徴とする割付最適化プログラム。
【請求項７】前記第１の手順において前記関数呼出プ
ロファイリングコードを挿入する手順は、基本ブロック
が関数呼出を含む場合に直接関数呼出か間接関数呼出か
を判断しするステップと、直接関数呼出である場合には前記直接関数呼出情報の記
録領域を割り当て呼び出される関数名を記録し前記直接
関数呼出情報を収集するためのプロファイリングコード
を挿入するステップと、間接関数呼出である場合には前記間接関数呼出情報の記
録領域を割り当て前記間接関数呼出情報を収集するため
のプロファイリングコードを挿入するステップと、を有
することを特徴とする請求項６に記載の割付最適化プロ
グラム。
【請求項８】前記直接関数呼出情報の記録領域には呼
び出された関数名と呼出回数とを対応させて記録し、前記間接関数呼出情報の記録領域には最多呼出情報とし
て呼出回数の累計が最多である間接関数呼出について呼
び出された関数のアドレスと連続呼出回数と累計呼出回
数とを対応させて記録し、カレント呼出情報として前回
に実行された間接関数呼出について呼び出された関数の
アドレスと連続呼出回数とを対応させて記録することを
特徴とする請求項７に記載の割付最適化プログラム。
【請求項９】前記間接関数情報を収集するためのプロ
ファイリング情報を挿入する手順は、今回呼び出される関数アドレスが前記カレント呼出情報
に記録された関数アドレスと同一かを判断するステップ
と前記カレント呼出情報に記録された関数アドレスと同一
である場合に前記カレント呼出情報の連続呼出回数に１
を加算して更新するステップと、前記カレント呼出情報に記録された関数アドレスと異な
る場合に前記最多呼出情報に記録された関数アドレスと
同一かを判断するステップと、前記最多呼出情報に記録された関数アドレスと同一であ
る場合に前記カレント呼出情報の連続呼出回数を前記最
多呼出情報の累計呼出回数に加算して得られる回数を累
計呼出情報として記録するステップと、前記最多呼出情報に記録された関数アドレスと異なる場
合に前記カレント呼出情報の連続呼出回数が前記最多呼
出情報の累計呼出回数よりも大きければ前記カレント呼
出情報の連続呼出回数を前記最多呼出情報の連続呼出回
数および累計呼出回数として記録するステップと、を有
することを特徴とする請求項８に記載の割付最適化プロ
グラム。
【請求項１０】前記直接関数呼出情報の記録領域には
呼び出された関数名と呼出回数とを対応させて記録し、前記間接関数呼出情報の記録領域には最多呼出情報とし
て連続呼出回数が最多である間接関数呼出について呼び
出された関数のアドレスと連続呼出回数と累計呼出回数
とを対応させて記録し、カレント呼出情報として前回に
実行された間接関数呼出について呼び出された関数のア
ドレスと連続呼出回数とを対応させて記録することを特
徴とする請求項７に記載の割付最適化プログラム。
【請求項１１】前記間接関数情報を収集するためのプ
ロファイリング情報を挿入する手順は、今回呼び出される関数アドレスが前記カレント呼出情報
に記録された関数アドレスと同一かを判断するステップ
と前記カレント呼出情報に記録された関数アドレスと同一
である場合に前記カレント呼出情報の連続呼出回数に１
を加算して更新するステップと、前記カレント呼出情報に記録された関数アドレスと異な
る場合に前記最多呼出情報に記録された関数アドレスと
同一かを判断するステップと、前記最多呼出情報に記録された関数アドレスと同一であ
る場合に前記カレント呼出情報の連続呼出回数を前記最
多呼出情報の累計呼出回数に加算して得られる回数を累
計呼出情報として記録するステップと、前記最多呼出情報に記録された関数アドレスと異なる場
合に前記カレント呼出情報の連続呼出回数が前記最多呼
出情報の連続呼出回数よりも大きければ前記カレント呼
出情報の連続呼出回数を前記最多呼出情報の連続呼出回
数および累計呼出回数として記録するステップと、を有
することを特徴とする請求項１０に記載の割付最適化プ
ログラム。