JP2013235386A - 最適化装置、最適化方法、及び最適化プログラム - Google Patents

最適化装置、最適化方法、及び最適化プログラム Download PDF

Info

Publication number
JP2013235386A
JP2013235386A JP2012106908A JP2012106908A JP2013235386A JP 2013235386 A JP2013235386 A JP 2013235386A JP 2012106908 A JP2012106908 A JP 2012106908A JP 2012106908 A JP2012106908 A JP 2012106908A JP 2013235386 A JP2013235386 A JP 2013235386A
Authority
JP
Japan
Prior art keywords
class
test
optimization
code string
receiver object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012106908A
Other languages
English (en)
Inventor
Hiroshi Inoue
拓 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2012106908A priority Critical patent/JP2013235386A/ja
Priority to US13/886,840 priority patent/US9323507B2/en
Publication of JP2013235386A publication Critical patent/JP2013235386A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • G06F8/44Encoding
    • G06F8/443Optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/362Software debugging
    • G06F11/3636Software debugging by tracing the execution of the program
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • G06F11/3676Test management for coverage analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • G06F11/3684Test management for test design, e.g. generating new test cases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45504Abstract machines for programme code execution, e.g. Java virtual machine [JVM], interpreters, emulators
    • G06F9/45516Runtime code conversion or optimisation
    • G06F9/4552Involving translation to a different instruction set architecture, e.g. just-in-time translation in a JVM
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3604Software analysis for verifying properties of programs
    • G06F11/3608Software analysis for verifying properties of programs using formal methods, e.g. model checking, abstract interpretation

Abstract

【課題】コード列内のメソッド境界におけるvirtual call guardを最適化する技術を提供する。
【解決手段】最適化装置210は、コード列に含まれる各仮想関数に対しメソッド・テストを挿入する挿入部212と、挿入処理済のコード列の実行において各仮想関数の呼び出しに使用されたレシーバ・オブジェクトのプロファイルされた1以上の実行時のクラスを取得する取得部214と、コード列に含まれる各仮想関数に対し、対応するレシーバ・オブジェクトの実行時のクラスが、該レシーバ・オブジェクトに対しメソッド・テストを要求する全ての仮想関数の呼び出しを成功させたことを条件に、挿入した前記メソッド・テストに代えて、対応するレシーバ・オブジェクトの記録時のクラス及び実行時のクラスを許可すべきクラスとするクラス・テストを挿入する最適化部218とを含む。
【選択図】図2

Description

本発明は、コンパイラ最適化技術に関し、より詳細には、記録されたトレース又は特殊化された直線実行パス内のvirtualcall guardを最適化するコンパイラ最適化技術に関する。
従来、頻繁に実行される直線的な命令列を実行時プロファイルにより見つけてコンパイルを行う、トレースベースのコンパイラが知られている。トレースベースのコンパイラは、ガード付きメソッド展開による最適化と同様に、メソッドの境界において呼び出されるメソッドが一意に定まらない場合に、トレースに記録されているメソッドと実行すべきメソッドとが一致することを実行時に確認するvirtualcall guardと呼ばれるガードを挿入する。上記性質を有するメソッドは、仮想関数(virtualmethod)として知られており、仮想関数は、オブジェクト指向言語の特徴の1つである「多様性(polymorphism)」を実現するための機能である。
ところで上記ガードによる確認には2つの方法が存在する。1つはクラス・テスト(classtest)と呼ばれる方法であり、仮想関数呼び出しにおいて使用されるレシーバ・オブジェクト(実際に呼び出すメソッドを決定するのに用いられるオブジェクト、以下同様)について、トレース記録時のクラスと実行時のクラスとを比較することによってメソッドの一致を確認する方法である(例えば特許文献1及び2を参照)。また1つはメソッド・テスト(methodtest)と呼ばれる方法であり、仮想関数呼び出しにおいて使用されるレシーバ・オブジェクトの実行時のクラスが、インラインされたメソッドを呼び出すクラスであることを確認する方法である。
また、ガード付きメソッド展開による最適化においては、多相的インライン・メソッド・キャッシュ(polymorphicinline cache: PIC)として知られるガード技術が存在する。最も古典的なvirtualcall guardの技術では、仮想関数呼び出しに対して毎回呼び出し先の検索が行われる。そこで呼び出し前にコールサイトにおいて最も頻繁に現れる1のクラスの確認を行うことにより多くの場合に検索を省略するinlinecache(IC)と呼ばれる技術が開発された。PICはこのICを更に拡張した技術であり、呼び出し前にコールサイトにおいて頻繁に現れる複数のクラスのチェックを行う技術である(例えば、非特許文献1を参照)。
更に、オブジェクト・リファレンスをパラメータに取る仮想メソッドをインラインする際に、その仮想メソッドのレシーバ・オブジェクトの型チェックに加えて、パラメータとして渡されるオブジェクトの型チェックをvirtualcall guardに含める技術も存在する(例えば、特許文献3を参照)。
米国特許第6175956号明細書 米国特許第6161217号明細書 米国特許第7716657号明細書
Urs Holzle, Craig Chambers,David Ungar , "Optimizing dynamically-typed object-oriented languages withpolymorphic inline caches", ECOOP ’91 proceedings, Springer Verlag LectureNotes in Computer Science 512, July, 1991
上述したクラス・テストによる確認方法は、ポインタの比較による確認のためチェックによるオーバーヘッドが小さいという利点、また、一度確認を行えば同じレシーバ・オブジェクトを使用する他の仮想関数呼び出しについてのチェックを省略できるという利点がある。しかしながらクラス・テストによる確認はクラスの一致によりメソッドの一致を確認するものであるため、別のクラスが承継により同じメソッドを呼び出す場合に確認に失敗するという欠点がある。
一方、メソッド・テストによる確認方法は、仮想関数のレシーバ・オブジェクトの実行時のクラスがインラインされた記録時のメソッドを呼び出すことを確認するため、別のクラスが承継により同じメソッドを呼び出す場合に正しくガードを通過させることができる。しかしながらメソッド・テストによる確認方法は、実行時に呼び出し先の解決を必要とするためチェックによるオーバーヘッドが大きく、またクラス・テストのようなチェックの省略ができないという欠点がある。
そこでPICのように、クラス・テストにおいてガードを通過させるクラスを複数設定することが考えられる。しかしながら、コールサイトにおいて頻繁に現れるクラスがトレース記録時のメソッドを呼び出すクラスであるとの保証はないため、単純にPICを適用することはできない。なお、特許文献3の技術は、1の仮想関数呼び出しにおいてチェック対象のオブジェクトが複数ある場合の技術であるため、上記問題に対し何ら解決策を与えない。
この発明は、上記の問題点を解決するためになされたものであって、トレースベースのコンパイラ又はPath specializationを適用するメソッドベースのコンパイラにおいて、メソッドの境界におけるvirtualcall guardのオーバーヘッドを削減し、システムの性能を向上させることを目的とする。また本発明は、従来のクラス・テストの利点を維持しつつ、その欠点をカバーしうる新たなガード技術を提供することを目的とする。
上記課題を解決するために、本発明の1態様によれば、コンピュータ処理により、記録されたトレース又はスペシャライズされた直線実行パス(以下、まとめて「コード列」という)を最適化する第1の最適化方法が提供される。第1の最適化方法は、(a)記憶装置から前記コード列を読み出し、該コード列に含まれる各仮想関数に対しメソッド・テストを挿入するステップと、(b)前記コード列の実行において前記各仮想関数の呼び出しに使用されたレシーバ・オブジェクトのプロファイルされた1以上の実行時のクラスを取得するステップと、(c)前記コード列に含まれる前記各仮想関数に対し、対応するレシーバ・オブジェクトの実行時のクラスが、該レシーバ・オブジェクトに対し前記メソッド・テストを要求する全ての仮想関数の呼び出しを成功させたことを条件に、前記メソッド・テストに代えて、前記対応するレシーバ・オブジェクトの記録時のクラス及び前記実行時クラスを許可すべきクラスとするクラス・テストを挿入することにより、前記コード列を最適化するステップとを含む。
好ましくは、上記ステップ(c)において、許可すべきクラスとするクラス数が所定数を超える場合に複数の許可すべきクラスの中からプロファイル回数の多い上位のクラスのみを許可すべきクラスとして追加する。
より好ましくは、ステップ(c)において、使用するレシーバ・オブジェクトが同一である複数の仮想関数については、前記コード列内において最初に実行される仮想関数に対してのみ前記クラス・テストを挿入し、残りの仮想関数に対する前記クラス・テストを省略する。
更に好ましくは、前記各仮想関数の呼び出しに使用されたレシーバ・オブジェクトの実行時のクラスは、挿入されたすべての前記メソッド・テストの成功を条件にプロファイルされる。
また、本発明の他の態様によれば、上記コード列を最適化する第2の最適化方法が提供される。第2の最適化方法は、(a)記憶装置から前記コード列を読み出し、該コード列に含まれる各仮想関数に対し、該仮想関数の呼び出しに使用されるレシーバ・オブジェクトの記録時のクラスを許可すべきクラスとするクラス・テストと、該クラス・テストの失敗をその実行の条件とするメソッド・テストとを挿入するステップと、(b)挿入処理済みの前記コード列を実行において前記各仮想関数の呼び出しに使用されたレシーバ・オブジェクトのプロファイルされた1以上の実行時のクラスを取得するステップと、(c)前記コード列に含まれる各仮想関数について、対応するレシーバ・オブジェクトの実行時のクラスが、該レシーバ・オブジェクトに対し前記メソッド・テストを要求する全ての仮想関数呼び出しを成功させたことを条件に、対応する前記クラス・テストが許可するクラスに前記実行時のクラスを追加することにより、前記コード列を最適化するステップとを含む。
好ましくは、最適化されたコード列の実行に対してステップ(b)及び(c)が繰り返される。
より好ましくは、ステップ(b)において、各仮想関数に対して挿入された前記メソッド・テストのプロファイルされたテスト結果を合わせて取得し、ステップ(c)において、前記メソッド・テストの結果が失敗であった仮想関数が使用するレシーバ・オブジェクトの実行時のクラスを、対応するクラス・テストに拒絶すべきクラスとして追加する。
更に好ましくは、ステップ(c)において、前記クラス・テストにおいて許可すべきクラス又は拒絶すべきクラス数が所定数を超える場合に当該所定数を超える複数のクラスの中からプロファイル回数の多い上位のクラスのみを許可すべきクラス又は拒絶すべきクラスとして追加する。
以上、最適化方法として本発明を説明したが、本発明は、上記説明した最適化方法の各ステップをコンピュータに実行させるための最適化プログラム、及び該最適化プログラムを1以上のコンピュータにインストールすることにより実現される最適化装置として把握することもできる。
本発明によれば、virtualcall guardとしてメソッド・テストを用いたコード列のコンパイル前又はコンパイル後の実行におけるプロファイル結果に基づき、virtualcall guardの通過を許可すべきクラスが決定され、その後のvirtual callguardとしてのクラス・テストにおける許可クラスを複数設定できるので、従来のメソッドの境界におけるvirtual callguardのオーバーヘッドを削減し、システムの性能を向上させることができる。本発明のその他の効果については、各実施の形態の記載から理解される。
本発明に係る最適化方法を適用可能なコンピュータ・システム50の機能構成を示す構成図である。 本発明を実現するソフトウェアの構成を示すブロック図である。 クラス毎のメソッド定義の一例を示す図である。 図4(a)は、記録されたトレースの一例を示す。図4(b)、(c)、(d)は各々、図4(a)に示すトレースの実行結果の一例を示す図である。 図4(b)、(c)、(d)に示す実行結果に対する第1の実施形態における最適化処理を説明する図である。 図6(a)は、記録されたトレースの他の例を示す。図6(b)、(c)、(d)は各々、図6(a)に示すトレースの実行結果の一例を示す図である。 図7(a)、(b)は各々、(図6(b)、(c)、(d)に示す実行結果に対する第1の実施形態における最適化処理を説明する図である。 本発明の第1の実施形態に係る最適化処理全体のフローチャートである。 図9(a)は、記録されたトレースの一例を示す。図9(b)、(c)、(d)は各々、図9(a)に示すトレースの実行結果の一例を示す図である。 図9(b)、(c)、(d)に示す実行の結果に対する第2の実施形態における最適化処理を説明する図である。 図11(a)は、記録されたトレースの一例を示す。図11(b)、(c)、(d)は各々、図11(a)に示すトレースの実行結果の一例を示す図である。 図11(b)、(c)、(d)に示す実行結果に対する第2の実施形態における最適化処理を説明する図である。 図11(b)、(c)、(d)に示す実行結果に対する第2の実施形態における最適化処理を説明する図である。 本発明の第2の実施形態に係る最適化処理全体のフローチャートである。 従来技術と本発明(第1の実施形態)とで性能を比較した実験結果を示す図である。 従来技術と本発明(第1の実施形態)とでコードサイズを比較した実験結果を示す図である。
以下、本発明を実施するための形態を図面に基づいて詳細に説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
図1は、本発明を適用可能なコンピュータ・システム50の構成を示す。コンピュータ50は、バス2に接続されたメインCPU(中央処理装置)1とメイン・メモリ4を含んでいる。CPU1は好ましくは、32ビット又は64ビットのアーキテクチャに基づくものであり、例えば、インテル社のCore i(商標)シリーズ、Core 2(商標)シリーズ、Atom(商標)シリーズ、Xeon(商標)シリーズ、Pentium(登録商標)シリーズ、Celeron(登録商標)シリーズ、AMD社のPhenom(商標)シリーズ、Athlon(商標)シリーズ、Turion(商標)シリーズ又はSempron(商標)が使用されうる。メイン・メモリ4は好ましくは、1GB以上の容量、より好ましくは、2GB以上の容量をもつものであってよい。
またハードディスク装置13、30、及びCD-ROM装置26、29、フレキシブル・ディスク装置20、MO装置28、DVD装置31のようなリムーバブル・ストレージ(記録メディアを交換可能な外部記憶システム)がフレキシブル・ディスクコントローラ19、IDEコントローラ25、SCSIコントローラ27などを経由してバス2へ接続されている。フレキシブル・ディスク、MO、CD-ROM、DCD-ROMのような記憶メディアが、リムーバブル・ストレージに挿入される。
これら記憶メディアやハードディスク装置13、30、ROM14には、オペレーティング・システム、J2EEなどの処理環境、アプリケーション、仮想マシン(VM)、実行時(JIT)コンパイラを提供するプログラム、その他のプログラム及びデータが、メイン・メモリ4にロード可能に記憶されてよい。なお、オペレーティング・システムは、Linux(商標)、マイクロソフト社のWindows(商標)7、Windows XP(商標)、Windows(商標)2003サーバ、アップルコンピュータ社のMac OS(商標)などの、CPU1に適合する任意のものでよい。
更に、上記記憶メディアやハードディスク装置13、30、ROM14には、オペレーティング・システムと協働してCPU1に命令を与え、本発明を実施するためのコンピュータ・プログラムを記録することができる。即ち、上記説明した数々の記憶装置には、コンピュータ・システム50にインストールされ、コンピュータ・システム50を本発明の実施形態による最適化装置として機能させる最適化プログラムや各種データを記録することができる。
上記最適化プログラムは、挿入モジュールと、取得モジュールと、最適化モジュールとを含む。これらプログラム及びモジュールは、CPU1に働きかけて、コンピュータ・システム50を、各々後述する挿入部212と、取得部214と、最適化部218としてそれぞれ機能させる。なお、これら機能はトレースベースのJITコンパイラ又はPathspecializationを適用するメソッドベースのJITコンパイラの機能の一部として実装されてよい。コンピュータ・プログラムは圧縮し、また複数に分割して複数の媒体に記録することもできる。
コンピュータ・システム50は、キーボード/マウス・コントローラ5を経由して、キーボード6やマウス7のような入力デバイスからの入力を受ける。コンピュータ・システム50は、オーディオコントローラ21を経由して、マイク24からの入力を受け、またスピーカー23から音声を出力する。コンピュータ50は、視覚データをユーザに提示するための表示装置11に、グラフィックスコントローラ10を経由して接続される。コンピュータ・システム50は、ネットワーク・アダプタ18(イーサネット(登録商標)・カードやトークンリング・カード)等を介してネットワークに接続し、他のコンピュータ等と通信を行うことが可能である。
以上の説明により、コンピュータ・システム50は、通常のパーソナルコンピュータ、ワークステーション、メインフレームなどの情報処理装置、又は、これらの組み合わせによって実現されることが容易に理解されるであろう。なお、上記説明した構成要素は例示であり、そのすべての構成要素が本発明の必須構成要素となるわけではない。
図2は、本発明を実現するソフトウェアの構成を示すブロック図である。同図において、オペレーティング・システム202は、CPUやメモリを資源として管理し、時分割によるマルチスレッドの機能を実現する。仮想マシン204は、実行対象のプログラムの一部である記録されたトレース又は特化された直線実行パス(以下、まとめて「コード列」という)206とオペレーティング・システム202とのインタフェースを行うソフトウェアであり、コード列206から見て仮想マシン204以下の階層全体を例えばJava(登録商標)仮想マシン(Virtual Machine)として作用させる。なお、以下の説明では仮想マシン204はJava(登録商標)仮想マシン(Virtual Machine)であるとして説明する。
仮想マシン204は、バイトコードを実行時に動的に機械語にコンパイルしてネイティブコードを生成し、プログラムの実行を高速化するコンパイラ208A/Bと、プログラムがバイトコード等の中間コードで与えられるときこれを解釈する実行部(インタープリタ)220と、その解釈に応じて呼び出されるプロファイラ222A/Bとを含む。なお、コンパイラ208とプロファイラ222に付されるA/Bの符号は、Aが後述する本発明の第1実施形態に係るコンパイラ208及びプロファイラ222であることを、また、Bが後述する本発明の第2実施形態に係るコンパイラ208及びプロファイラ222であることを示している。以後使用するA/Bの符号も同様の意味を有するものとする。ここで、コンパイラ208A/Bは、コンパイル単位をトレースとするトレースベースのJITコンパイラ、又はコンパイル単位をメソッドとするメソッドベースのコンパイラである。但し後者の場合メソッドベースのコンパイラはPath specializationを適用するものとする。更に本発明の第1の実施形態に係るコンパイラ208Aは、たとえばC++のコンパイラ等、静的コンパイルを行うコンパイラであってもよい。また、以下ではプロファイル用のコードはコンパイラ208A/Bにより挿入されるものとして説明するが、これに限定されず、プロファイラ222A/Bの機能を実行部220に実装してもよい。
そしてコンパイラ208A/Bは、コード列206に含まれる仮想関数の呼び出しに対するvirtual callguardを最適化する最適化装置210A/Bを含む。最適化装置210A/Bは、virtualcall guardであるメソッド・テストのチェック結果を利用して、virtual callguardであるクラス・テストにおける許可クラスに複数のクラスを設定する。
ここでメソッド・テストとは、背景技術で説明した通り、仮想関数の呼び出しにおいて使用されるレシーバ・オブジェクトの実行時のクラスが、記録時のインラインされたメソッドを呼び出すことを確認する方法である。より具体的には、レシーバ・オブジェクトの実行時のクラスを出発点に、該クラスのメソッド・テーブルを辿り、メソッド・テーブルから呼び出すべきメソッドのアドレスを取得して、取得したアドレスがインラインされたメソッドのアドレスと同一であることを確認する方法である。
クラス・テストもまた、背景技術で説明した通り、仮想関数呼び出しにおいて使用されるレシーバ・オブジェクトについて、トレース記録時のクラスと実行時のクラスとを比較することによってメソッドの一致を確認する方法である。より具体的には、レシーバ・オブジェクトの実行時のクラスを指すポインタとトレース記録時のクラスを指すポインタとを比較して、同一であることを確認する方法である。
なお、メソッド・テスト及びクラス・テストそれ自体は、どちらも既存の技術であるためこれ以上の説明は省略する。
メソッド・テストを利用したvirtual call guardの通過を許可すべきクラスの決定は、コンパイル前の実行におけるプロファイリングの結果に基づいて行ってもよく、又はコンパイル後の実行におけるプロファイリングの結果に基づいて繰り返し行い、その都度許可すべきクラスを追加してもよい。以下では、前者を第1実施形態、後者を第2実施形態として順に説明する。
(第1実施形態)
このセクションでは、virtual callguardとしてメソッド・テストを挿入したコード列206のコンパイル前の実行におけるプロファイリング結果に基づいてvirtual callguardの通過を許可すべきクラスを決定し、挿入したメソッド・テストを、複数のクラスを許可クラスとするクラス・メソッドで置換することによりvirtualcall guardを最適化する手法について説明する。なお、コンパイラ208Aによるコンパイルはvirtualcall guardを最適化されたコード列206に対して行われることに留意されたい。図2に示すように、第1実施形態に係る最適化装置210Aは、挿入部212Aと、取得部214Aと、最適化部218Aとを含む。
挿入部212Aは、次にコンパイル対象とするコード列206を読み出して走査し、コード列206に含まれる各仮想関数に対しvirtualcall guardとしてメソッド・テストを挿入する。メソッド・テストの挿入位置はメソッド境界とする。但し、レシーバ・オブジェクトのクラスが先頭位置で決まっていることが確認できる場合は、挿入位置はコード列206の先頭であってもよい。また、仮想関数の呼び出しに使用するレシーバ・オブジェクトが同一である複数の仮想関数については、挿入するメソッド・テストをまとめて1つとしてよい。但し挿入するメソッド・テストは、使用されるレシーバ・オブジェクトの実行時のクラスが、上記複数の仮想関数すべてを呼び出すクラスであることを確認するものとする。また、メソッド・テストの挿入位置は、上記複数の仮想関数のうち、コード列206において最初に実行される仮想関数の直前とする。
挿入部212Aはまた、挿入されたすべてのメソッド・テストの成功を条件として各仮想関数の呼び出しに使用されたレシーバ・オブジェクトの実行時のクラスを記録するコードを挿入する。一例として挿入部212Aは、各レシーバ・オブジェクトの実行時のクラスをプロファイルするコード(以下、「プロファイラA」と呼ぶ)をコード列206の末尾に挿入する。但し、プロファイラAのコードが非常に長くなるような場合は、プロファイラAを呼び出すコードをコード列206の末尾に挿入するのが好ましい。なお、コード列206の実行はメソッド・テストが失敗した時点で終了するものとする。これに代えて、挿入部212Aは、上述したように、使用するレシーバ・オブジェクトが同一である複数の仮想関数については挿入するメソッド・テストを1つにまとめ、かつ、メソッド・テストごと、仮想関数の呼び出しに使用されたレシーバ・オブジェクトの実行時のクラスとメソッド・テストのテスト結果(成功/失敗)とをプロファイルするコードを挿入してもよい。前者の場合、プロファイル結果に基づき決定できるのはvirtualcall guardの通過を許可すべきクラスである。一方、後者の場合、プロファイル結果に基づき決定できるのは、virtualcall guardの通過を許可すべきクラスと拒絶すべきクラスである。なお、本実施例では前者の構成を採用するものとする。後者の詳細については第2実施形態に関連して後述する。挿入部212Aはまた、プロファイル結果を格納するためのプロファイル・テーブルを作成する。プロファイル・テーブルの詳細は図8を参照して後述する。メソッド・テストを挿入されたコード列206はその後、プロファイル結果を取得するため実行部220により繰り返し実行される。
取得部214Aは、プロファイラAにより記録されたプロファイル結果224Aを読み出し、コード列206に含まれる各仮想関数の呼び出しに使用されたレシーバ・オブジェクトの実行時のクラスを取得する。取得部214Aは、取得した各レシーバ・オブジェクトの実行時のクラスを最適化部218Aに渡す。
最適化部218Aは、取得部214Aから受け取った各レシーバ・オブジェクトの実行時のクラスが、該レシーバ・オブジェクトに対しメソッド・テストを要求する全ての仮想関数の呼び出しを成功させたことを条件に、コード列206に挿入されているメソッド・テストをクラス・テストで置換する。その際最適化部218Aは、各クラス・テストについて、対応するレシーバ・オブジェクトのコード列206記録時におけるクラスに加えて該レシーバ・オブジェクトに対してプロファイルされた実行時のクラスを許可すべきクラスとして設定する。
なお、各レシーバ・オブジェクトの実行時のクラスは、上述したようにコード列206に挿入されたすべてのメソッド・テストが成功した場合にのみ記録され、プロファイルされる。そのため、最適化部218Aは、取得部214Aから各レシーバ・オブジェクトの実行時のクラスを受け取ることができた場合には、上記条件が満たされていることを確認することなくそのまま上記置換処理を行ってよい。
最適化部218Aはまた、1のレシーバ・オブジェクトに対してプロファイルされた実行時のクラスが所定数を超える場合は、その複数のプロファイルされた実行時のクラスの中からプロファイル回数の多い上位m個(mは1以上の整数)のクラスのみを許可すべきクラスとして設定するのが好ましい。そのためにプロファイラAは、レシーバ・オブジェクトの実行時のクラス情報と共にそのプロファイル回数も合わせて記録するものとする。クラス・テストにおいて許可されるクラスの数が非常に多くなるとチェックのコストが大きくなり得る。そこで、上記構成を採用することによってコスト増を避けつつも性能向上を図ることが可能となる。
最適化部218Aはまた、レシーバ・オブジェクトが同一である複数の仮想関数呼び出しについては、最初に実行される仮想関数呼び出しに対してのみクラス・テストを挿入し、残りの仮想関数呼び出しに対しては挿入済みのメソッド・テストは削除するだけで、クラス・テストを省略するのが好ましい。これによってコードサイズを小さくすることが可能となる。最適化部218Aによる処理が済んだコード列206はその後コンパイラ208Aにより機械語にコンパイルされる。
次に、図3〜図5を参照して、プロファイル結果に基づいてvirtualcall guardを最適化する第1の実施形態に係る最適化方法を具体的に説明する。図3は、クラス毎のメソッド定義の一例を示す図である。図4(a)は、記録されたトレースの一例を示す。図4(b)、(c)、(d)は各々、図4(a)に示すトレースの実行結果の一例を示す図である。図5は、図4(b)、(c)、(d)に示す実行結果に対する最適化処理を説明する図である。
本実施例では、図3に示すように、methodAとmethodBをメンバとしてもつsuperClassを拡張して、childClass0、1、2が作成されたとする。ここで、childClass0はmethodAとmethodBの両方をそのまま承継するが、childClass1はmethodAをオーバーライドしたmethodA’と、methodBをメンバとしてもち、childClass2はmethodA と、methodBをオーバーライドしたmethodB’と をメンバとしてもつとする。
またトレース400は、図4(a)に示すように、2つの仮想関数呼び出しcallobj.methodAとcall obj.methodBを含む。仮想関数の呼び出しに使用されるレシーバ・オブジェクトobjは、トレース400の記録時にsuperClassのインスタンスであったため、記録されたトレース400では、これら2つの仮想関数呼び出しに対し、それぞれsuperClassのメンバmethodA()とmethodB()とがインラインされている。挿入部212Aはコンパイル対象としてトレース400を読み込むと、2つの仮想関数それぞれに対し、virtualcall guard402、404としてメソッド・テストを挿入する。挿入されるメソッド・テストは、テストが成功した場合は実行を継続させ、失敗した場合は実行を終了させるテストである。挿入部212Aはまた、トレース400の末尾にプロファイラAを直接またはプロファイラAを呼び出すコードを挿入する。
図4(b)、(c)、(d)は、上記説明した状況においてプロファイル結果を取得するために実行部220がトレース400を実行した結果を示す。図4(b)に示す実行結果410では、レシーバ・オブジェクトobjの実行時のクラスはchildClass0である。上述したようにchildClass0は、methodAとmethodBの両方をそのまま承継しているので、メソッド・テストは、図4(a)に示すvirtualcall guard402に対応する地点412及びvirtual callguard404に対応する地点414の両地点において成功している。結果、プロファイラAによりレシーバ・オブジェクトobjの実行時のクラスとしてchildClass0が記録される。
図4(c)に示す実行結果420では、レシーバ・オブジェクトobjの実行時のクラスはchildClass1である。上述したようにchildClass1は、methodAをオーバーライドしている。そのため、メソッド・テストは図4(a)に示すvirtual call guard402に対応する地点422において失敗している。結果、トレース400の実行は途中で終了し、プロファイラAは実行されないため、レシーバ・オブジェクトobjの実行時のクラスchildClass1も記録されない。
また、図4(d)に示す実行結果430では、レシーバ・オブジェクトobjの実行時のクラスはchildClass2である。上述したようにchildClass2は、methodA についてはそのまま承継しているが、methodBについてはオーバーライドしている。そのため、メソッド・テストは図4(a)に示すvirtual call guard402に対応する地点432において成功しているものの、virtualcall guard404に対応する地点434において失敗している。結果、トレース400の実行は途中で終了し、プロファイラAは実行されないため、レシーバ・オブジェクトobjの実行時のクラスchildClass2も記録されない。
図4(b)、(c)、(d)に示す実行結果に対し、取得部214Aはプロファイル結果としてchildClass0を取得する。最適化部218Aは取得部214AからchildClass0を受け取ると、これを用いてトレース400に含まれるvirtualcall guard402、404を最適化する。図5は、最適化されたvirtualcall guard402、404を示す。図5に示すように、メソッド・テストと置換されたクラス・テストは、トレース400記録時のレシーバ・オブジェクトobjのクラスであるsuperClassと、プロファイルされた実行時のクラスであるchildClass0とを許可クラスとする。なお、virtual call guard402、404はいずれも同じレシーバ・オブジェクトobjを使用する仮想関数の呼び出しに対するものであるため、後に実行されるvirtual callguard404としてのクラス・テストは省略してよい。
図4〜図5を参照して説明した例では、トレース400内で使用されるレシーバ・オブジェクトは1つのみであった。そこで次に図6及び図7を参照して、トレース内で使用されるレシーバ・オブジェクトが2つである場合について説明する。図6(a)は、記録されたトレースの他の例を示す。図6(b)、(c)、(d)は各々、図6(a)に示すトレースの実行結果の一例を示す。図7は、図6(b)、(c)、(d)に示す実行結果に対する最適化処理を説明する図である。なお、クラス毎のメソッドの定義状況は図3を参照して説明した通りである。
図6(a)に示すトレース600は、2つの仮想関数呼び出しcallobjX.methodAとcall objY.methodBを含む。仮想関数の呼び出しに使用されるレシーバ・オブジェクトobjXとobjYは、トレース600の記録時に共にsuperClassのインスタンスであったため、記録されたトレース600では、これら2つの仮想関数呼び出しに対しsuperClassのメンバmethodA()とmethodB()がそれぞれインラインされている。挿入部212Aはコンパイル対象としてトレース600を読み込むと、2つの仮想関数呼び出しそれぞれに対し、virtualcall guard602、604としてメソッド・テストを挿入する。挿入されるメソッド・テストは、テストが成功した場合は実行を継続させ、失敗した場合は実行を終了させるテストである。挿入部212Aはまた、トレース600の末尾にプロファイラAを直接またはプロファイラAを呼び出すコードを挿入する。
図6(b)、(c)、(d)は、上記説明した状況においてプロファイル結果を取得するために実行部220がトレース600を実行した結果を示す。図6(b)に示す実行結果610では、レシーバ・オブジェクトobjXの実行時のクラスはchildClass2であり、レシーバ・オブジェクトobjYの実行時のクラスはchildClass1である。図3に示したようにクラスchildClass2は、methodAをそのまま承継しているので、図6(a)に示すvirtual call guard602に対応する地点612においてメソッド・テストは成功している。同様に、クラスchildClass1も、methodBをそのまま承継しているので、図6(a)に示すvirtual call guard604に対応する地点614においてメソッド・テストは成功している。結果、プロファイラAにより、レシーバ・オブジェクトobjXの実行時のクラスとしてchildClass2が、objYの実行時のクラスとしてchildClass1がそれぞれ記録される。
図6(c)に示す実行結果620では、レシーバ・オブジェクトobjXとobjYの実行時のクラスは共にchildClass0である。上述したようにchildClass0は、methodAとmethodBをそのまま承継しているので、メソッド・テストは図6(a)に示すvirtual call guard602に対応する地点622とvirtualcall guard604に対応する地点624の両地点において成功している。結果、プロファイラAにより、レシーバ・オブジェクトobjXとobjYの実行時のクラスとして共にchildClass0が記録される。
図6(d)に示す実行結果630では、レシーバ・オブジェクトobjXとobjYの実行時のクラスは共にchildClass2である。上述したようにchildClass2は、methodAについてはそのまま承継しているが、methodBについてはオーバーライドしている。そのため、メソッド・テストは図6(a)に示すvirtual call guard604に対応する地点632では成功するが、virtualcall guard604に対応する地点634では失敗している。結果、トレース400の実行は途中で終了し、プロファイラAは実行されないため、レシーバ・オブジェクトobjXとobjYの実行時のクラスchildClass2も記録されない。
図6(b)、(c)、(d)に示す実行結果に対し、取得部214Aはプロファイル結果としてレシーバ・オブジェクトobjX に対しchildClass2とchildClass0の2つのクラスを、レシーバ・オブジェクトobjYに対しchildClass1とchildClass0の2つのクラスをそれぞれ取得する。最適化部218Aは取得部214Aからプロファイル結果を受け取ると、これを用いてトレース600に含まれるvirtualcall guard602、604を最適化する。図7(a) は最適化されたvirtual callguard602を、図7(b)は、最適化されたvirtual callguard604をそれぞれ示す。図7(a)に示すように、メソッド・テストと置換されたvirtual callguard602としてのクラス・テストは、トレース600記録時のレシーバ・オブジェクトobjXのクラスであるsuperClassに加えて、プロファイルされた実行時のクラスであるchildClass2とchildClass0とを許可クラスとする。また、図7(b)に示すように、メソッド・テストと置換されたvirtualcall guard604としてのクラス・テストは、トレース600記録時のレシーバ・オブジェクトobjYのクラスであるsuperClassに加えて、プロファイルされた実行時のクラスであるchildClass1とchildClass0とを許可クラスとする。なお、virtualcall guard602、604はそれぞれ異なるレシーバ・オブジェクトobjX、objYを使用する仮想関数の呼び出しに対するものであるため、後に実行されるvirtualcall guard604としてのメソッド・テストを省略することはできない。
次に図8を参照して、本発明の第1の実施形態に係る最適化装置210Aによる処理の流れを説明する。図8に示す処理は、ステップ800より開始され、最適化装置210Aは、プロファイル結果を格納するための空のプロファイル・テーブル822を作成する。作成するプロファイル・テーブル822は、レシーバ・オブジェクトのフィールドと、実行時クラスのフィールドと、回数のフィールドとを有する。レシーバ・オブジェクトのフィールドのエントリには、プロファイル対象のレシーバ・オブジェクトの名前が格納される。実行時クラスのフィールドのエントリには、プロファイル対象のレシーバ・オブジェクトの実行時のクラスが格納される。回数のフィールドのエントリには、該エントリと同一の内容がプロファイルされた回数が格納される。
続いて最適化装置210Aは、コード列格納部824から次にコンパイル対象とするコード列206を読み出し、読み出したコード列206に含まれる各仮想関数に対しメソッド・テストを挿入する(ステップ802)。最適化装置210Aはまた、挿入した全メソッド・テストの成功を条件に、各仮想関数の呼び出しに使用されるレシーバ・オブジェクトの実行時のクラスと、プロファイル回数を記録するコードを挿入する(ステップ802)。
ここで挿入されるコードは実行されると次のように動作する。即ち、コード列206に含まれるレシーバ・オブジェクトごと、該レシーバ・オブジェクトの名前とその現在のクラスをキーとしてプロファイル・テーブル822を検索する。マッチするエントリが存在する場合、そのエントリの回数フィールドの値を1増加する。マッチするエントリが存在しない場合、レシーバ・オブジェクトのフィールドを現在のレシーバ・オブジェクトの名前、実行時クラスのフィールドをレシーバ・オブジェクトの現在のクラス、回数のフィールドを値1とするエントリを新たに追加する。挿入処理済のコード列206はその後コード列格納部824に戻される。
続いて最適化装置210Aは、挿入処理済のコード列206の実行を実行部220に要求し(ステップ804)、プロファイル結果の取得を試みる(ステップ806)。なお、実行部220による実行は予め定めた回数行われるものとする。最適化装置210Aは、プロファイル結果を取得できたか否かを判定し(ステップ808)、プロファイル結果を取得できなかった場合(ステップ808:NO)、ステップ804に戻って再度コード列206の実行を要求する。
一方、プロファイル結果を取得できた場合(ステップ808:YES)、最適化装置210Aは、コード列206に含まれるレシーバ・オブジェクトごと、プロファイル・テーブル822から回数の多い上位m個(mは1以上の整数)のエントリを選択し、選択した各エントリの実行時クラスとコード列206記録時のクラスとを許可クラスとするクラス・テストのコードを生成し、コード列206内の対応するメソッド・テストと置換する(ステップ810)。なお、同一のレシーバ・オブジェクトに関するメソッド・テストがコード列206内に複数に含まれる場合、コード列206内において最初に実行されるメソッド・テストのみを上記生成したクラス・テストと置換し、残りのメソッド・テストは削除してよい。複数のクラスの通過を許可するクラス・テストによってvirtualcall guardを最適化されたコード列206はその後、最適化済みコード列格納部826に格納され、コンパイラ208Aによるコンパイル対象となる。そして処理は終了する。
(第2実施形態)
このセクションでは、virtual callguardとしてクラス・テストと該クラス・テストの失敗をその実行の条件とするメソッド・テストとを挿入したコード列206の実行におけるプロファイリング結果に基づいてvirtual callguardの通過を許可すべきクラスを決定し、許可すべきクラスが新たに見つかるごとにこれをクラス・テストの許可クラスに追加してvirtualcall guardを最適化する手法について説明する。なお、コンパイラ208Bによるコンパイルは許可クラスが追加されるごとに行っても、或いは許可クラスが追加されるごとには行わないようにしてもよい。図2に示すように、第2の実施形態に係る最適化装置210Bは、挿入部212Bと、取得部214Bと、最適化部218Bとを含む。
挿入部212Bは、次にコンパイル対象とするコード列206を読み出して走査し、コード列206に含まれる各仮想関数に対しvirtualcall guardとして、クラス・テストと該クラス・テストの失敗をその実行の条件とするメソッド・テスト(以下、両テストを合わせて「型テスト」という)とを挿入する。ここで挿入する各クラス・テストに対し設定する通過を許可する許可クラスは、対応するレシーバ・オブジェクトのコード列206記録時のクラスである。型テストの挿入位置はメソッド境界とする。但し、レシーバ・オブジェクトのクラスが先頭位置で決まっていることが確認できる場合は、挿入位置はコード列206の先頭であってもよい。また、仮想関数の呼び出しに使用するレシーバ・オブジェクトが同一である複数の仮想関数については、挿入する型テストをまとめて1つとしてよい。但し挿入する型テストのうちメソッド・テストの部分については、使用されるレシーバ・オブジェクトの実行時のクラスが、上記複数の仮想関数すべてを呼び出すクラスであることを確認するものとする。確認に使用するため挿入部212Bは、コード列206に含まれるすべての仮想関数について仮想関数と該仮想関数の呼び出しに使用するレシーバ・オブジェクトとの組をリストするリストを作成する。また、型テストの挿入位置は、上記複数の仮想関数のうち、コード列206において最初に実行される仮想関数よりも前とする。
挿入部212Bはまた、すべての型テストの成功を条件として各仮想関数の呼び出しに使用されたレシーバ・オブジェクトの実行時のクラスを記録するためのコードを挿入する。一例として挿入部212Bは、各レシーバ・オブジェクトの実行時のクラスをプロファイルするコードをコード列206の末尾に挿入する。但し、コード列206の実行はメソッド・テストが失敗した時点で終了するものとする。これに代えて、挿入部212Bは、上述したように、使用するレシーバ・オブジェクトが同一である複数の仮想関数については挿入する型テストを1つにまとめ、かつ、型テストごと、メソッド・テストの実行を条件に、仮想関数の呼び出しに使用されたレシーバ・オブジェクトの実行時のクラスとメソッド・テストのテスト結果(成功/失敗)とをプロファイルするコード(以下、「プロファイラB」と呼ぶ)を挿入してもよい。但し、プロファイラBのコードが非常に長くなるような場合は、プロファイラBを呼び出すコードをコード列206の末尾に挿入するのが好ましい。メソッド・テストのテスト結果を合わせてプロファイルすることで、プロファイル結果に基づきvirtualcall guardの通過を許可すべきクラスと拒絶すべきクラスの両方を決定できる。そこで本実施例では当該構成について説明する。挿入部212Bはまた、プロファイル結果を格納するためのプロファイル・テーブルを作成する。プロファイル・テーブルの詳細は図14を参照して後述する。挿入部212Bによる処理がなされたコード列206はその後、実行部220、又はコンパイラ208Bによりコンパイルされた場合にはCPU1により実行される。
取得部214Bは、挿入処理済のコード列206の実行においてプロファイラBにより記録されたプロファイル結果224Bを読み出し、コード列206に含まれる各レシーバ・オブジェクトについて、記録されていれば、実行時のクラスとメソッド・テストのテスト結果とを取得する。取得部214Bは、取得したレシーバ・オブジェクトごとの実行時のクラスと対応するテスト結果を最適化部218Bに渡す。
最適化部218Bは、取得部214Bから受け取った各レシーバ・オブジェクトの実行時のクラスごとに、該実行時のクラスがレシーバ・オブジェクトに対しメソッド・テストを要求する全ての仮想関数の呼び出しを成功させたことを条件に、コード列206に挿入された対応するクラス・テスト、即ち、上記レシーバ・オブジェクトを使用する各仮想関数に対するクラス・テストが許可すべきクラスに上記実行時のクラスを追加する。なお、上述したように本実施例において挿入されるメソッド・テストは、レシーバ・オブジェクトの実行時のクラスが、該レシーバ・オブジェクトを使用するすべての仮想関数を呼び出すクラスであることを確認するものである。従って最適化部218Bは上記条件が満たされることを対応するテスト結果に従って判断する。
最適化部218Bはまた、取得部214Bから受け取った各レシーバ・オブジェクトの実行時のクラスごとに、該実行時のクラスがレシーバ・オブジェクトに対しメソッド・テストを要求するいずれかの仮想関数の呼び出しを失敗させたことを条件に、コード列206に挿入された対応する各クラス・テスト、即ち、上記レシーバ・オブジェクトを使用する各仮想関数に対するクラス・テストが拒絶すべきクラスに上記実行時のクラスを追加する。許可すべきクラスの追加に関して説明したのと同様の理由により、最適化部218Bは上記条件が満たされることを対応するテスト結果に従って判断する。
最適化部218Bはまた、いずれかのクラス・テストについて許可すべきクラス又は拒絶すべきクラスの数が所定数を超える場合に、当該所定数を超える複数のクラスの中からプロファイル回数の多い上位のm個(mは1以上の整数)のクラスのみを許可すべきクラス又は拒絶すべきクラスとして追加してよい。この場合、プロファイラ222Bは、実行時のクラスとテスト結果と共にそのプロファイル回数も合わせて記録するものとする。上述したように、クラス・テストにおいて許可される又は拒絶されるクラスの数が非常に多くなるとチェックのコストが大きくなり得る。そこで、上記構成を採用することによってコスト増を避けつつも性能向上を図ることが可能となる。
最適化部218Bによる処理が済んだコード列206はその後、実行部220、又はコンパイラ208Bによりコンパイルされた場合にはCPU1により実行される。そして該実行においてプロファイラ222Bにより得られたプロファイル結果に基づいて、取得部214B及び最適化部218Bによる上記処理が繰り返される。
次に、図3、図9及び図10を参照して、プロファイル結果に基づいてvirtual callguardを最適化する第2の実施形態に係る最適化方法を具体的に説明する。図3は、上述したとおりクラス毎のメソッド定義の一例を示す図である。図9(a)は、記録されたトレースの一例を示す。図9(b)、(c)、(d)は各々、図9(a)に示すトレースを実行した際の実行結果の一例を示す図である。図10は、図9(b)、(c)、(d)に示す実行結果に対する第2の実施形態における最適化処理を説明する図である。
図3については、第1の実施形態に係る最適化方法に関連して説明した通りである。図9(a)に示すトレース900は、2つの仮想関数呼び出しcall obj.methodAとcall obj.methodBを含む。仮想関数の呼び出しに使用されるレシーバ・オブジェクトobjは、トレース900の記録時にsuperClassのインスタンスであったため、記録されたトレース900では、これら2つの仮想関数呼び出しに対し、それぞれsuperClassのメンバmethodA()とmethodB()とがインラインされている。挿入部212Bはトレース900を読み込むと、トレース900に含まれるすべての仮想関数について仮想関数と該仮想関数の呼び出しに使用するレシーバ・オブジェクトとの組をリストするリスト{(obj, methodA),(obj,methodB)}を作成する。そして挿入部21Bは、2つの仮想関数の呼び出しに使用されるレシーバ・オブジェクトが共通であることから型テストを1つにまとめ、先に実行される仮想関数に対してのみ、virtualcall guard902を挿入する。挿入するvirtual callguard902は、superClassをレシーバ・オブジェクトobjの許可クラスとするクラス・テストと該クラス・テストの失敗をその実行の条件とするメソッド・テストである。ここでメソッド・テストは、リストを参照してレシーバ・オブジェクトobjの現在のクラスがレシーバ・オブジェクトobjとの組をリストされる全仮想関数を呼び出すクラスであるか否かをテストし、テストが成功した場合は実行を継続させ、失敗した場合は実行を終了させるテストである。挿入部212Bはまた、挿入したメソッド・テストに対しプロファイラBを挿入する。図10に示すコード1000は挿入部212Bにより挿入されるコードの一例である。
図9(b)、(c)、(d)は、図3に示すクラス毎のメソッド定義状況下においてトレース900を実行した際の実行結果を示す。図9(b)に示す実行結果910では、レシーバ・オブジェクトobjの実行時のクラスはchildClass0であり、トレース記録時のクラスsuperClassとは異なるため、トレース900にvirtual call guard902として挿入されたメソッド・テストが実行されている。そしてchildClass0は、methodAとmethodBの両方をそのまま承継しているので、メソッド・テストは成功している。メソッド・テストが実行されることから、プロファイラBが実行され、レシーバ・オブジェクトobjの実行時のクラスとしてchildClass0とメソッド・テストの結果(成功)が記録される。
図9(b)に示す実行結果910に対し、取得部214Bは上記プロファイル結果を取得して最適化部218Bへ渡す。最適化部218Bは、レシーバ・オブジェクトobjの実行時のクラスchildClass0についてのメソッド・テストのテスト結果が成功であることから、上記挿入処理済のトレース900に含まれる対応するクラス・テストの許可クラスにクラスchildClass0を追加する。図10に示すコード1002は、クラス・テストの許可クラスにプロファイルされた実行時のクラスchildClass0(参照番号1004)を追加することによって最適化されたvirtual call guard902を示す。
図9(c)に示す実行結果920では、レシーバ・オブジェクトobjの実行時のクラスはchildClass1であり、トレース記録時のクラスsuperClassとは異なるため、記録されたトレース900に挿入されたメソッド・テストが実行されている。そしてchildClass1は、methodAをオーバーライドしているので、メソッド・テストは失敗している。メソッド・テストが実行されたことからプロファイラBが実行され、レシーバ・オブジェクトobjの実行時のクラスとしてchildClass1とメソッド・テストの結果(失敗)が記録される。なお、メソッド・テストが失敗することにより、プロファイラBによる処理が終了するとトレース900の実行が終了することに留意されたい。
図9(c)に示す実行結果920に対し、取得部214Bは上記プロファイル結果を取得して最適化部218Bへ渡す。最適化部218Bは、レシーバ・オブジェクトobjの実行時のクラスchildClass1についてのメソッド・テストのテスト結果が失敗であることから、上記最適化処理済のトレース900に含まれる対応するクラス・テストにクラスchildClass1を設定した拒絶クラスを新たに追加する。図10に示すコード1006は、クラス・テストにプロファイルされた実行時のクラスchildClass1を設定した拒絶クラスを追加する(参照番号1008)ことによって最適化されたvirtual callguard902を示す。
図9(d)に示す実行結果930では、レシーバ・オブジェクトobjの実行時のクラスはchildClass2であり、トレース記録時のクラスsuperClassとは異なるため、記録されたトレース900に挿入されたメソッド・テストが実行されている。そしてchildClass2は、methodAについてはそのまま承継しているが、methodBについてはオーバーライドしているので、メソッド・テストは失敗している。メソッド・テストが実行されることからプロファイラBが実行され、レシーバ・オブジェクトobjの実行時のクラスとしてchildClass2とメソッド・テストの結果(失敗)が記録される。
図9(d)に示す実行結果930に対し、取得部214Bは上記プロファイル結果を取得して最適化部218Bへ渡す。最適化部218Bは、レシーバ・オブジェクトobjの実行時のクラスchildClass2
についてのメソッド・テストのテスト結果が失敗であることから、上記最適化処理済のトレース900に含まれる対応するクラス・テストの拒絶クラスにクラスchildClass2を追加する。図10に示すコード1010は、クラス・テストの拒絶クラスにプロファイルされた実行時のクラスchildClass2(参照番号1012)を追加することによって最適化されたvirtual call guard902を示す。
図3、図9及び図10参照して説明した例では、トレース900内で使用されるレシーバ・オブジェクトは1つのみであった。そこで次に図11から図13を参照して、トレース内で使用されるレシーバ・オブジェクトが2つである場合について説明する。図11(a)は、記録されたトレースの他の例を示す。図11(b)、(c)、(d)は各々、図11(a)に示すトレースの実行結果の一例を示す。図12及び図13は、図11(b)、(c)、(d)に示す実行結果に対する最適化処理を説明する図である。なお、クラス毎のメソッドの定義状況は図3を参照して説明した通りである。
図11(a)に示すトレース1100は、2つの仮想関数呼び出しcallobjX.methodAとcall objY.methodBを含む。仮想関数の呼び出しに使用されるレシーバ・オブジェクトobjXとobjYは、トレース1100の記録時に共にsuperClassのインスタンスであったため、記録されたトレース1100では、これら2つの仮想関数呼び出しに対しsuperClassのメンバmethodA()とmethodB()がそれぞれインラインされている。挿入部212Bはトレース1100を読み込むと、2つの仮想関数呼び出しそれぞれに対し、virtualcall guard1102、1104として、superClassをレシーバ・オブジェクトobjの許可クラスとするクラス・テストと該クラス・テストの失敗をその実行の条件とするメソッド・テストとを挿入する。挿入されるメソッド・テストは、テストが成功した場合は実行を継続させ、失敗した場合は実行を終了させるテストである。挿入部212Bはまた、挿入したメソッド・テストそれぞれに対しプロファイラBを挿入する。図12に示すコード1200はvirtualcall guard902及びプロファイラBとして挿入するコードの一例であり、図13に示すコード1300は、virtualcall guard904及びプロファイラBとして挿入するコードの一例である。
図11(b)、(c)、(d)は、上記説明した状況において11(a)に示す記録されたトレース900が実行された際の実行結果を示す。図11(b)に示す実行結果1110では、レシーバ・オブジェクトobjXの実行時のクラスはchildClass2であり、レシーバ・オブジェクトobjYの実行時のクラスはchildClass1である。いずれについてもトレース記録時のクラスsuperClassとは異なるため、いずれのメソッド・テストも実行されている。そして上述したようにchildClass2は、methodAをそのまま承継しているので、メソッド・テストは図11(a)に示すvirtual call guard1102に対応する地点1112において成功している。同様に、クラスchildClass1も、methodBをそのまま承継しているので、メソッド・テストは図11(a)に示すvirtual call guard1104に対応する地点1114において成功している。メソッド・テストが実行されることから地点1112と地点1114のそれぞれにおいてプロファイラ222Bが実行され、レシーバ・オブジェクトobjXの実行時のクラスとしてchildClass2が、objYの実行時のクラスとしてchildClass1がそれぞれテスト結果(成功)と共に記録される。
図11(b)に示す実行結果1110に対し、取得部214Bは上記プロファイル結果を取得して最適化部218Bへ渡す。最適化部218Bは、レシーバ・オブジェクトobjXの実行時のクラスchildClass2についてのメソッド・テストのテスト結果が成功であることから、上記挿入処理済のトレース1100に含まれる対応するクラス・テストの許可クラスにクラスchildClass2を追加する。図12に示すコード1202は、クラス・テストの許可クラスにプロファイルされた実行時のクラスchildClass2(参照番号1204)を追加することによって最適化されたvirtual call guard1102を示す。同様に、最適化部218Bは、レシーバ・オブジェクトobjYの実行時のクラスchildClass1についてのメソッド・テストのテスト結果が成功であることから、上記挿入処理済のトレース1100に含まれる対応するクラス・テストの許可クラスにクラスchildClass1を追加する。図13に示すコード1302は、クラス・テストの許可クラスにプロファイルされた実行時のクラスchildClass1(参照番号1304)を追加することによって最適化されたvirtual call guard1104を示す。
図11(c)に示す実行結果1120では、レシーバ・オブジェクトobjXとobjYの実行時のクラスは共にchildClass0でありトレース記録時のクラスsuperClassとは異なるため、いずれのメソッド・テストも実行されている。そして上述したようにchildClass0は、methodAとmethodBをそのまま承継しているので、メソッド・テストは図11(a)に示すvirtualcall guard1102に対応する地点1122とvirtual callguard1104に対応する地点1124の両地点において成功している。メソッド・テストが実行されることから地点1122と地点1124のそれぞれにおいてプロファイラ222Bが実行され、レシーバ・オブジェクトobjXとobjYの実行時のクラスとしてchildClass0がテスト結果(成功)と共に記録される。
図11(c)に示す実行結果1120に対し、取得部214Bは上記プロファイル結果を取得して最適化部218Bへ渡す。最適化部218Bは、レシーバ・オブジェクトobjXの実行時のクラスchildClass0についてのメソッド・テストのテスト結果が成功であることから、上記挿入処理済のトレース1100に含まれる対応するクラス・テストの許可クラスにクラスchildClass0を追加する。図12に示すコード1206は、クラス・テストの許可クラスにプロファイルされた実行時のクラスchildClass0(参照番号1208)を追加することによって最適化されたvirtual call guard1102を示す。同様に、最適化部218Bは、レシーバ・オブジェクトobjYの実行時のクラスchildClass0についてのメソッド・テストのテスト結果が成功であることから、上記挿入処理済のトレース1100に含まれる対応するクラス・テストの許可クラスにクラスchildClass0を追加する。図13に示すコード1306は、クラス・テストの許可クラスにプロファイルされた実行時のクラスchildClass0(参照番号1308)を追加することによって最適化されたvirtual call guard1104を示す。
図11(d)に示す実行結果1130では、レシーバ・オブジェクトobjXとobjYの実行時のクラスは共にchildClass2でありトレース記録時のクラスsuperClassとは異なるため、いずれのメソッド・テストも実行されている。そして上述したようにchildClass2は、methodAについてはそのまま承継しているが、methodBについてはオーバーライドしている。そのため、メソッド・テストは図11(a)に示すvirtual callguard1102に対応する地点1132では成功するが、virtual callguard1104に対応する地点1134では失敗している。メソッド・テストが実行されることから地点1132と地点1134のそれぞれにおいてプロファイラ222Bが実行され、レシーバ・オブジェクトobjXの実行時のクラスとしてchildClass2がテスト結果(成功)と共に、また、レシーバ・オブジェクトobjYの実行時のクラスとしてchildClass2がテスト結果(失敗)と共に記録される。
図11(d)に示す実行結果1130に対し、取得部214Bは上記プロファイル結果を取得して最適化部218Bへ渡す。最適化部218Bは、レシーバ・オブジェクトobjXの実行時のクラスchildClass2は、図11(b)の実行結果に対する最適化処理において許可クラスとして既に追加済みであるため何もしない。一方、最適化部218Bは、レシーバ・オブジェクトobjYの実行時のクラスchildClass2についてのメソッド・テスト結果が失敗であることから、上記挿入処理済のトレース1100に含まれる対応するクラス・テストにクラスchildClass2を設定した拒絶クラスを新たに追加する。図13に示すコード1310は、クラス・テストにプロファイルされた実行時のクラスchildClass2を拒絶クラスとして追加する(図13の参照番号1312)ことによって最適化されたvirtual callguard1104を示す。
次に図14を参照して、本発明の第2の実施形態に係る最適化装置210Bによる処理の流れを説明する。図14に示す処理は、ステップ1400より開始され、最適化装置210Bは、プロファイル結果を格納するための空のプロファイル・テーブル1424を作成する。作成するプロファイル・テーブル1424は、レシーバ・オブジェクトのフィールドと、実行時クラスのフィールドと、テスト結果のフィールドと、回数のフィールドとを有する。レシーバ・オブジェクトのフィールドのエントリには、
プロファイル対象のレシーバ・オブジェクトの名前が格納される。実行時クラスのフィールドのエントリには、プロファイル対象のレシーバ・オブジェクトの実行時のクラスが格納される。テスト結果のフィールドのエントリには、プロファイル対象のメソッド・テストのテスト結果が格納される。回数のフィールドのエントリには、該エントリと同一の内容がプロファイルされた回数が格納される。
続いて最適化装置210Bは、コード列格納部1420から次にコンパイル対象とするコード列206を読み出し、読み出したコード列206に含まれる各仮想関数に対しクラス・テストと該クラス・テストの失敗をその実行の条件とするメソッド・テスト、即ち型テストを挿入する(ステップ1402)。但し、上述したように、同一のレシーバ・オブジェクトを使用する仮想関数については、最適化装置210Bは挿入する型テストを1つにまとめる。最適化装置210Aはまた挿入した型テストごと、メソッド・テストの実行を条件に、仮想関数の呼び出しに使用されたレシーバ・オブジェクトの実行時のクラスと、メソッド・テストのテスト結果と、プロファイルの回数とを記録するためのコードを挿入する(ステップ1402)。
挿入するコードは実行されると次のように動作する。即ち、直前に実行されたメソッド・テストのレシーバ・オブジェクトの名前と、現在のクラスと、メソッド・テストのテスト結果を取得する。続いて取得したレシーバ・オブジェクトの名前と現在のクラスとをキーとしてプロファイル・テーブル1424を検索する。マッチするエントリが存在する場合、そのエントリの回数フィールドの値を1増加する。マッチするエントリが存在しない場合、レシーバ・オブジェクトのフィールドを現在のレシーバ・オブジェクトの名前、実行時クラスのフィールドを現在のクラス、テスト結果のフィールドを現在のメソッド・テストのテスト結果、回数のフィールドを値1とするエントリを新たに追加する。挿入処理済のコード列206はその後コード列格納部1420に戻される。
続いて最適化装置210Bは、挿入処理済のコード列206が実行部220、又はコンパイラ208Bによりコンパイルされた場合にはCPU1により実行されたか否かを判定する(ステップ1404)。ステップ1404の判定処理は、実行されたとの判定がなされるまで繰り返し行われる。最適化装置210Bは、ステップ1404において実行されたと判定した場合(ステップ1404:YES)、プロファイル結果の取得を試みる(ステップ1406)。最適化装置210Bは、プロファイル結果を取得できたか否かを判定し(ステップ1408)、プロファイル結果を取得できなかった場合(ステップ1408:NO)、再びステップ1404の判定処理を行う。
一方、プロファイル結果を取得できた場合(ステップ1408:YES)、最適化装置210Bは、コード列206に含まれるレシーバ・オブジェクトごと、プロファイル・テーブル1424のテスト結果が「成功」である実行時クラスの中から、回数の多い上位m個(mは1以上の整数)のエントリを選択する(ステップ1410)。同様に最適化装置210Bは、コード列206に含まれるレシーバ・オブジェクトごと、プロファイル・テーブル1424のテスト結果が「失敗」である実行時クラスの中から、回数の多い上位n個(nは1以上の整数)のエントリを選択する(ステップ1410)。
続いて最適化装置210Bは、コード列格納部1420からステップ1402の挿入処理済のコード列206を読み出し、各クラス・テストについて、ステップ1410で対応するレシーバ・オブジェクトに対して「成功」クラスとして選択した上記m個のエントリの実行時のクラスを用いて許可クラスを追加又は更新する(ステップ1412)。同様に、最適化装置210Bは、各クラス・テストについて、ステップ1410で対応するレシーバ・オブジェクトに対して「失敗」クラスとして選択した上記n個のエントリの実行時のクラスを用いて拒絶クラスを追加又は更新する(ステップ1412)。許可クラス及び/又は拒絶クラスを追加又は更新されることによってvirtualcall guardを最適化されたコード列206はその後コード列格納部1420に戻される。そして処理は再びステップ1404に戻り、ステップ1404からステップ1412までの一連の処理がS1412において最適化されたコード列206に対し繰り返される。
次に図15及び図16を参照して、本発明による性能向上とコードサイズ削減の効果を検証する。図15及び図16に示すグラフは、トレース記録時のクラスのみを許可クラスとする従来技術のクラス・テストをvirtualcall guardとして用いた場合と、本発明の第1実施形態に係る最適化方法を適用して得られた複数のクラスを許可クラスとするクラス・テストをvirtualcall guardとして用いた場合の性能とコードサイズとを比較した実験結果である。図15において、縦軸は従来技術の性能を基準としたパフォーマンスの改善率を示し、横軸はDaCapo benchmark suite(Dacapo-2006-10-MR2)ベンチマーク群の各プログラム名を示している。また、図16において、縦軸は従来技術のJITコンパイル後のコードサイズに対する割合を示し、横軸は図15と同じくDaCapo benchmark suiteの各プログラム名を示している。実験に使用したコンピュータは、4.0GHz動作のPOWER6を搭載し、オペレーティング・システムはAIX6.1であった。また実験結果は16回の実行平均であり、許可クラスとして追加するクラスを上位4つに制限した。図15に示すように、fopベンチマークを除く全てのベンチマークで性能向上が得られ、pmtベンチマークについては25%もの性能向上が得られた。また、chartベンチマークを除く全てのベンチマークについてJITコンパイル後のコードサイズは減少した。
以上、実施形態を用いて本発明の説明をしたが、本発明の技術範囲は上記実施形態に記載の範囲には限定されない。例えば上記説明では、仮想関数の呼び出し先が実行時の単一のオブジェクトのクラスによって決定される(singledispatch)言語に本発明を適用した。しかし、本発明は複数の引数の型に応じて呼び出し先メソッドを実行時に選択できる(multidispatch)言語にも適用可能である。但しこの場合、2回目以降のvirtualcall guardを省略するためには、呼び出し先の決定に関係する全てのオブジェクトの組としてチェック済みであるという情報を伝播する必要がある。例えばオブジェクトAとオブジェクトBの組、及びオブジェクトAとオブジェクトCの組を型チェックしている場合であっても、オブジェクトBとオブジェクトCを用いて仮想関数呼び出しを行う場合にはその型チェックを省略できない。このように上記の実施形態に、種々の変更または改良を加えることが可能であることが当業者に明らかである。従って、そのような変更または改良を加えた形態も当然に本発明の技術的範囲に含まれる。

Claims (16)

  1. コンピュータ処理により、記録されたトレース又はスペシャライズされた直線実行パス(以下、まとめて「コード列」という)を最適化する最適化方法であって、
    (a)記憶装置から前記コード列を読み出し、該コード列に含まれる各仮想関数に対しメソッド・テストを挿入するステップと、
    (b)前記コード列の実行において前記各仮想関数の呼び出しに使用されたレシーバ・オブジェクトのプロファイルされた1以上の実行時のクラスを取得するステップと、
    (c)前記コード列に含まれる前記各仮想関数に対し、対応するレシーバ・オブジェクトの実行時のクラスが、該レシーバ・オブジェクトに対し前記メソッド・テストを要求する全ての仮想関数の呼び出しを成功させたことを条件に、前記メソッド・テストに代えて、前記対応するレシーバ・オブジェクトの記録時のクラス及び前記実行時のクラスを許可すべきクラスとするクラス・テストを挿入することにより、前記コード列を最適化するステップと、
    を含む最適化方法。
  2. ステップ(c)において、許可すべきクラスとするクラスの数が所定数を超える場合に複数の許可すべきクラスの中からプロファイル回数の多い上位のクラスのみを許可すべきクラスとして追加する、請求項1に記載の最適化方法。
  3. ステップ(c)において、使用するレシーバ・オブジェクトが同一である複数の仮想関数については、前記コード列内において最初に実行される仮想関数に対してのみ前記クラス・テストを挿入し、残りの仮想関数に対する前記クラス・テストを省略する、請求項2に記載の最適化方法。
  4. 前記各仮想関数の呼び出しに使用されたレシーバ・オブジェクトの実行時のクラスは、前記コード列に挿入されたすべての前記メソッド・テストの成功を条件にプロファイルされる、請求項3に記載の最適化方法。
  5. コンピュータ処理により、記録されたトレース又はスペシャライズされた直線実行パス(以下、「コード列」という)を最適化する最適化方法であって、
    (a)記憶装置から前記コード列を読み出し、該コード列に含まれる各仮想関数に対し、該仮想関数の呼び出しに使用されるレシーバ・オブジェクトの記録時のクラスを許可すべきクラスとするクラス・テストと、該クラス・テストの失敗をその実行の条件とするメソッド・テストとを挿入するステップと、
    (b)挿入処理済みの前記コード列の実行において前記各仮想関数の呼び出しに使用されたレシーバ・オブジェクトのプロファイルされた1以上の実行時のクラスを取得するステップと、
    (c)前記コード列に含まれる前記各仮想関数に対し、対応するレシーバ・オブジェクトの実行時のクラスが、該レシーバ・オブジェクトに対し前記メソッド・テストを要求する全ての仮想関数の呼び出しを成功させたことを条件に、対応する前記クラス・テストが許可するクラスに前記実行時のクラスを追加することにより前記コード列を最適化するステップと、
    を含む最適化方法。
  6. 最適化されたコード列の実行に対してステップ(b)及び(c)を繰り返す、請求項5に記載の最適化方法。
  7. ステップ(b)において、各仮想関数に対して挿入された前記メソッド・テストのプロファイルされたテスト結果を合わせて取得し、ステップ(c)において、前記メソッド・テストの結果が失敗であった仮想関数が使用するレシーバ・オブジェクトの実行時のクラスを、対応するクラス・テストに拒絶すべきクラスとして追加する、請求項6に記載の最適化方法。
  8. ステップ(c)において、追加される許可すべきクラス又は拒絶すべきクラスの数が所定数を超える場合に当該所定数を超える複数のクラスの中からプロファイル回数の多い上位のクラスのみを許可すべきクラス又は拒絶すべきクラスとして追加する、請求項7に記載の最適化方法。
  9. コンピュータに、請求項1乃至8のいずれか一項に記載の最適化方法の各ステップを実行させるための最適化プログラム。
  10. 記録されたトレース又はスペシャライズされた直線実行パス(以下、まとめて「コード列」という)を最適化する最適化装置であって、
    記憶装置から前記コード列を読み出し、該コード列に含まれる各仮想関数に対しメソッド・テストを挿入する挿入部と、
    前記メソッド・テストを挿入された前記コード列の実行において前記各仮想関数の呼び出しに使用されたレシーバ・オブジェクトのプロファイルされた1以上の実行時のクラスを取得する取得部と、
    前記コード列に含まれる前記各仮想関数に対し、対応するレシーバ・オブジェクトの実行時のクラスが、該レシーバ・オブジェクトに対し前記メソッド・テストを要求する全ての仮想関数の呼び出しを成功させたことを条件に、前記メソッド・テストに代えて、前記対応するレシーバ・オブジェクトの記録時のクラス及び前記実行時のクラスを許可すべきクラスとするクラス・テストを挿入する最適化部と、
    を含む最適化装置。
  11. 前記最適化部は、許可すべきクラスとするクラスの数が所定数を超える場合に当該所定数を超える複数のクラスの中からプロファイル回数の多い上位のクラスのみを許可すべきクラスとして追加する、請求項10に記載の最適化装置。
  12. 前記最適化部は、レシーバ・オブジェクトが同一である複数の仮想関数については、前記コード列内において最初に実行される仮想関数に対してのみ前記クラス・テストを挿入し、残りの仮想関数に対する前記クラス・テストを省略する、請求項11に記載の最適化装置。
  13. 記録されたトレース又はスペシャライズされた直線実行パス(以下、まとめて「コード列」という)を最適化する最適化装置であって、
    記憶装置から前記コード列を読み出し、該コード列に含まれる各仮想関数に対し、該仮想関数の呼び出しに使用されるレシーバ・オブジェクトの記録時のクラスを許可すべきクラスとするクラス・テストと、該クラス・テストの失敗をその実行の条件とするメソッド・テストとを挿入する挿入部と、
    挿入処理済みの前記コード列の実行において前記各仮想関数の呼び出しに使用されたレシーバ・オブジェクトのプロファイルされた1以上の実行時のクラスを取得する取得部と、
    前記コード列に含まれる前記各仮想関数に対し、対応するレシーバ・オブジェクトの実行時のクラスが、該レシーバ・オブジェクトに対し前記メソッド・テストを要求する全ての仮想関数の呼び出しを成功させたことを条件に、対応する前記クラス・テストが許可するクラスに前記実行時のクラスを追加することにより前記コード列を最適化する最適化部と、
    を含む最適化装置。
  14. 最適化された前記コード列の実行に対し、前記取得部及び前記最適化部の処理が繰り返される、請求項13に記載の最適化装置。
  15. 前記最適化部は、取得したレシーバ・オブジェクトの実行時のクラスが、該レシーバ・オブジェクトに対し前記メソッド・テストを要求するいずれかの仮想関数の呼び出しを失敗させたことを条件に、該失敗させたレシーバ・オブジェクトの実行時のクラスを対応するクラス・テストに拒絶すべきクラスとして追加する、請求項14に記載の最適化装置。
  16. 前記最適化部は、前記クラス・テストにおいて許可すべきクラス又は拒絶すべきクラスの数が所定数を超える場合に当該所定数を超える複数のクラスの中からプロファイル回数の多い上位のクラスのみを許可すべきクラス又は拒絶すべきクラスとして追加する、請求項15に記載の最適化装置。
JP2012106908A 2012-05-08 2012-05-08 最適化装置、最適化方法、及び最適化プログラム Pending JP2013235386A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012106908A JP2013235386A (ja) 2012-05-08 2012-05-08 最適化装置、最適化方法、及び最適化プログラム
US13/886,840 US9323507B2 (en) 2012-05-08 2013-05-03 Optimization apparatus, optimization method and optimization program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012106908A JP2013235386A (ja) 2012-05-08 2012-05-08 最適化装置、最適化方法、及び最適化プログラム

Publications (1)

Publication Number Publication Date
JP2013235386A true JP2013235386A (ja) 2013-11-21

Family

ID=49549648

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012106908A Pending JP2013235386A (ja) 2012-05-08 2012-05-08 最適化装置、最適化方法、及び最適化プログラム

Country Status (2)

Country Link
US (1) US9323507B2 (ja)
JP (1) JP2013235386A (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9207914B2 (en) 2013-12-20 2015-12-08 Microsoft Technology Licensing, Llc Execution guards in dynamic programming
US9104434B2 (en) * 2013-12-20 2015-08-11 Microsoft Technology Licensing, Llc Property accesses in dynamically typed programming languages
US9910680B2 (en) 2014-04-22 2018-03-06 Oracle International Corporation Decomposing a generic class into layers
US10324741B2 (en) * 2014-08-30 2019-06-18 Oracle International Corporation Speeding up dynamic language execution on a virtual machine with type speculation
US10001979B2 (en) 2015-11-25 2018-06-19 International Business Machines Corporation Avoiding guard test invalidation for virtual and interface calls
US10083029B2 (en) * 2016-11-09 2018-09-25 Red Hat, Inc. Detect application defects by correlating contracts in application dependencies
KR102195103B1 (ko) * 2017-06-26 2020-12-24 삼성전자주식회사 프로그램 컴파일 방법
US10216615B2 (en) * 2017-06-30 2019-02-26 Sap Se Debuggable instance code in a cloud-based instance platform environment
US11163594B2 (en) * 2019-10-29 2021-11-02 International Business Machines Corporation Rescheduling JIT compilation based on jobs of parallel distributed computing framework
CN112416725A (zh) * 2020-11-02 2021-02-26 北京三快在线科技有限公司 一种压力测试方法及装置

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6219825B1 (en) * 1995-01-10 2001-04-17 Hewlett-Packard Company Profile based optimization of shared libraries
CA2171898C (en) * 1996-03-15 2000-02-01 Brian Ward Thomson Linker optimization for compiled object oriented programs
US6170083B1 (en) * 1997-11-12 2001-01-02 Intel Corporation Method for performing dynamic optimization of computer code
US6175956B1 (en) 1998-07-15 2001-01-16 International Business Machines Corporation Method and computer program product for implementing method calls in a computer system
US6161217A (en) 1998-09-14 2000-12-12 Sun Microsystems, Inc. Accurate method for inlining virtual calls
GB9825102D0 (en) * 1998-11-16 1999-01-13 Insignia Solutions Plc Computer system
US6704924B1 (en) * 1999-02-03 2004-03-09 William H. Gates, III Method and system for implementing virtual functions of an interface
US6658657B1 (en) * 2000-03-31 2003-12-02 Intel Corporation Method and apparatus for reducing the overhead of virtual method invocations
US7725885B1 (en) * 2000-05-09 2010-05-25 Hewlett-Packard Development Company, L.P. Method and apparatus for trace based adaptive run time compiler
US6662362B1 (en) * 2000-07-06 2003-12-09 International Business Machines Corporation Method and system for improving performance of applications that employ a cross-language interface
US7793277B2 (en) * 2001-09-07 2010-09-07 International Business Machines Corporation Compiler apparatus and method for devirtualizing virtual method calls
JP3956131B2 (ja) * 2002-12-26 2007-08-08 インターナショナル・ビジネス・マシーンズ・コーポレーション プログラム変換装置、プログラム変換方法及びプログラム
CA2443049A1 (en) * 2003-09-26 2005-03-26 Ali I. Sheikh Method for computer program optimization in a dynamic compiling environment
CA2453776A1 (en) 2003-12-19 2005-06-19 Ibm Canada Limited-Ibm Canada Limitee Compiler optimization
US7496908B2 (en) * 2004-01-14 2009-02-24 International Business Machines Corporation Method and apparatus for optimizing code execution using annotated trace information having performance indicator and counter information
FR2865047B1 (fr) * 2004-01-14 2006-04-07 Commissariat Energie Atomique Systeme de generation automatique de codes optimises
US7526760B1 (en) * 2004-03-17 2009-04-28 Sun Microsystems, Inc. Methods for implementing virtual method invocation with shared code
US7698697B2 (en) * 2005-03-03 2010-04-13 International Business Machines Corporation Transforming code to expose glacial constants to a compiler
JP3938387B2 (ja) * 2005-08-10 2007-06-27 インターナショナル・ビジネス・マシーンズ・コーポレーション コンパイラ、制御方法、およびコンパイラ・プログラム
US7694281B2 (en) * 2005-09-30 2010-04-06 Intel Corporation Two-pass MRET trace selection for dynamic optimization
US8769511B2 (en) * 2006-02-16 2014-07-01 The Regents Of The University Of California Dynamic incremental compiler and method
US8245210B2 (en) * 2009-05-22 2012-08-14 Microsoft Corporation Compile-time context for dynamically bound operations
US8429632B1 (en) * 2009-06-30 2013-04-23 Google Inc. Method and system for debugging merged functions within a program
US8402444B2 (en) * 2009-10-09 2013-03-19 Microsoft Corporation Program analysis through predicate abstraction and refinement
US8522222B2 (en) * 2010-06-21 2013-08-27 Microsoft Corporation Tracing just-in-time compilation with pointers to local variables
JP5496849B2 (ja) * 2010-10-15 2014-05-21 インターナショナル・ビジネス・マシーンズ・コーポレーション プロファイル計装方法、プログラム及びコンパイラ
US8756581B2 (en) * 2011-02-03 2014-06-17 International Business Machines Corporation Adaptive next-executing-cycle trace selection for trace-driven code optimizers
US8578352B1 (en) * 2011-03-31 2013-11-05 Google, Inc. Optimizing object oriented programs using limited customization
US8549498B2 (en) * 2011-08-23 2013-10-01 International Business Machines Corporation Integration of trace selection and trace profiling in dynamic optimizers

Also Published As

Publication number Publication date
US9323507B2 (en) 2016-04-26
US20130305230A1 (en) 2013-11-14

Similar Documents

Publication Publication Date Title
JP2013235386A (ja) 最適化装置、最適化方法、及び最適化プログラム
Gong et al. Jitprof: Pinpointing jit-unfriendly javascript code
Avgustinov et al. Making trace monitors feasible
US8893102B2 (en) Method and system for performing backward-driven path-sensitive dataflow analysis
JP5460430B2 (ja) 動的コンパイラプログラム、動的コンパイル方法及び動的コンパイル装置
US8516443B2 (en) Context-sensitive analysis framework using value flows
Yan et al. Uncovering performance problems in Java applications with reference propagation profiling
JP5583514B2 (ja) バイナリコードを最適化するコンパイル方法、及びそのコンパイラシステム、並びにコンピュータ・プログラム
US8782623B2 (en) Profiler for executing computer program
US10303467B2 (en) Target typing-dependent combinatorial code analysis
US9424004B2 (en) Execution guards in dynamic programming
Yu et al. Fast loop-level data dependence profiling
JP5719278B2 (ja) 情報処理装置、プロファイル対象決定プログラム及び方法
US20090037690A1 (en) Dynamic Pointer Disambiguation
Gaikwad et al. Performance analysis for languages hosted on the truffle framework
JP5871589B2 (ja) 情報処理装置、配列の初期サイズ調整プログラム及び方法
CN105786465A (zh) 一种脚本语言执行方法及装置
US8938728B2 (en) Dynamic compiler program, dynamic compiling method and dynamic compiling device
Alnaeli et al. Empirically examining the parallelizability of open source software system
Liu et al. Exploring missed optimizations in webassembly optimizers
Park et al. Reusing the Optimized Code for JavaScript Ahead-of-Time Compilation
Atre et al. Dissecting sequential programs for parallelization—An approach based on computational units
Molnar et al. Stack allocation of objects in the cacao virtual machine
Ramu A hybrid approach for selecting and optimizing graph traversal strategy for analyzing big code
JP2015103225A (ja) 判定プログラム,判定装置,判定方法