JP2012138004A - プログラム解析の方法、システムおよびプログラム - Google Patents

プログラム解析の方法、システムおよびプログラム Download PDF

Info

Publication number
JP2012138004A
JP2012138004A JP2010290894A JP2010290894A JP2012138004A JP 2012138004 A JP2012138004 A JP 2012138004A JP 2010290894 A JP2010290894 A JP 2010290894A JP 2010290894 A JP2010290894 A JP 2010290894A JP 2012138004 A JP2012138004 A JP 2012138004A
Authority
JP
Japan
Prior art keywords
flag
program
branch
history information
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010290894A
Other languages
English (en)
Other versions
JP5552042B2 (ja
Inventor
Kenta Nakamura
健太 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2010290894A priority Critical patent/JP5552042B2/ja
Priority to US13/332,436 priority patent/US8990545B2/en
Publication of JP2012138004A publication Critical patent/JP2012138004A/ja
Application granted granted Critical
Publication of JP5552042B2 publication Critical patent/JP5552042B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3802Instruction prefetching
    • G06F9/3804Instruction prefetching for branches, e.g. hedging, branch folding
    • G06F9/3806Instruction prefetching for branches, e.g. hedging, branch folding using address prediction, e.g. return stack, branch history buffer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3096Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents wherein the means or processing minimize the use of computing system or of computing system component resources, e.g. non-intrusive monitoring which minimizes the probe effect: sniffing, intercepting, indirectly deriving the monitored data from other directly available data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3836Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
    • G06F9/3842Speculative instruction execution
    • G06F9/3844Speculative instruction execution using dynamic branch prediction, e.g. using branch history tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/865Monitoring of software

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】分岐履歴テーブルBHTを用いたプログラム解析手法を実現する。
【解決手段】
プログラムの開始時に、プログラムの各命令にそれぞれが対応している複数のフラグをディスエーブルに初期化してBHTの初期状態を保存し、分岐命令の実行時に、該当するフラグがイネーブルかディスエーブルかを判定し、該当するフラグがディスエーブルの場合には該当するフラグをイネーブルにし、分岐不成立の場合にはBHTの該当するエントリの履歴情報の値をデクリメントし、分岐成立の場合には該当するエントリの履歴情報の値をインクリメントし、プログラムの終了時に、BHTの終了状態と保存した初期状態からエントリそれぞれの履歴情報の値の差分を取得し、フラグそれぞれの終了状態を取得する。
【選択図】図6

Description

本発明は、プログラム解析に関し、特に、分岐履歴テーブル(BHT:Branch History Table、以下「BHT」と称す)のようなテーブルを用いてプログラム解析を行なう方法、システムおよびコンピュータ・プログラムに関する。
プログラムの開発と最適化では、その振舞いを詳細に知ることが重要である。プログラムの振舞いを知るための解析手法としては、CPUエミュレータ、ソフトウェア・プロファイラ、ハードウェア・プロファイラなどがある。ソフトウェアのCPUエミュレータ上でプログラムを実行するCPUエミュレータ手法は、プロセッサ内部の状態も含めあらゆる情報を取得することが可能であるが、実行速度が遅く、組込機器の実使用環境を再現できない。コンパイル時に解析用の命令を挿入するソフトウェア・プロファイル手法は、関数単位の実行順序、回数、時間を計測するが、解析用の命令によるプログラムの振る舞いへの影響が大きい。CPU内部に実装されバス上やCPUの専用インターフェースに解析用のハードウェアを追加するハードウェア・プロファイラ手法は、その解析能力が実装次第であり、実装されている場合のみ有効である。
特許文献1には、分岐履歴テーブルを使った分岐予測と分岐履歴テーブルを使わない分岐予測(静的分岐予測)とを併用し、静的に予測できる場合には分岐履歴テーブルを更新しないことにより、不要に分岐履歴テーブルの値が書き換わって分岐履歴テーブルを必要とする分岐命令の予測精度を下げないようにする技術が、記載されている。
特許文献2には、分岐命令毎に1ビットの履歴ビットと2ビットのカウンタを保持する分岐予測表と、カウンタの値が0または2の場合は、履歴ビットの値を出力し、カウンタの値が1または3の場合は、履歴ビットの値を反転して出力する予測出力部と、分岐結果と履歴ビットの値を比較し, 一致した場合はカウンタの値を0にし、一致しなかった場合はカウンタの値が3以外ならばカウンタ値を1増加するカウンタ制御部とを備えるようにして、少量のハードウェアで分岐成立と不成立が交互に連続するパターンを正しく予測する分岐予測装置が、記載されている。
特開平11−282677号公報 特開2000−293373号公報
既存のプログラム解析手法は必ずしも満足できるものではなく、それぞれには問題点が存在する。特に、組込システムの最適化にはソフトウェアの詳細な振る舞い解析が重要であるが、CPUエミュレータ手法は、組込機器の実使用環境を再現できないために、組込システムのプログラムには適さない。ソフトウェア・プロファイラ手法は、関数単位かそれよりも粗い粒度でのプログラム解析しか行なえず、ソフトウェアの変更を伴う。ハードウェア・プロファイラ手法は、CPUにハードウェア・プロファイラが実装されていなければ使えない。
本発明は、それら既存手法の問題点を解決するプログラム解析手法の実現を目的とする。本発明の目的には、BHTのようなテーブルを用いてプログラム解析を行なう方法、システムおよびコンピュータ・プログラムを提供することが含まれる。
本発明による1実施態様のプログラム解析方法は、プロセッサが次のステップを実行することを含む。即ち、プログラムの開始時に、プログラムの各命令にそれぞれが対応している複数のフラグを備える第1テーブルの当該フラグをディスエーブルに初期化するステップと、プログラムの開始時に、プログラムの各命令にそれぞれが対応している複数のエントリを備え当該エントリに履歴情報を有する第2テーブルの初期状態を保存するステップと、分岐命令の実行時に、分岐が成立か不成立かを判定するステップと、分岐が不成立の場合、第2テーブルの該当するエントリの履歴情報の値をデクリメントするステップと、分岐が成立の場合、第2テーブルの該当するエントリの履歴情報の値をインクリメントするステップと、第1テーブルの該当するフラグがイネーブルかディスエーブルかを判定するステップと、該当するフラグがディスエーブルの場合、該当するフラグをイネーブルにするステップと、プログラムを終了するか否かを判定するステップと、プログラムを終了しない場合、分岐が成立か不成立かを判定するステップからプログラムを終了するか否かを判定するステップまでを繰り返すステップと、プログラムを終了する場合、第2テーブルの終了状態と保存した初期状態からエントリそれぞれの履歴情報の値の差分を取得するステップと、第1テーブルのフラグそれぞれの終了状態を取得するステップである。
好ましくは、フラグはフラグ・ビットであり、フラグをディスエーブルに初期化するステップは当該フラグ・ビットを0に設定することを含み、フラグをイネーブルにするステップは当該フラグ・ビットを1に設定することを含む。また、好ましくは、履歴情報は複数のビットからなり、当該複数のビットの最下位ビットをフラグにして第2テーブルは第1テーブルを兼ね、フラグをディスエーブルに初期化するステップは当該最下位ビットを0に設定することを含み、フラグをイネーブルにするステップは当該最下位ビットを1に設定することを含む。さらに、好ましくは、第2テーブルとして分岐履歴テーブルBHTを用いることを含む。
本発明の1実施態様により、プロセッサに上記方法の各ステップを実行させるプログラム解析のためのコンピュータ・プログラムが提供される。
本発明による1実施態様のプログラム解析システムでは、プロセッサは、プログラムの各命令にそれぞれが対応している複数のフラグを備える第1テーブルと、第1テーブルを制御する第1テーブル制御部と、プログラムの各命令にそれぞれが対応している複数のエントリを備え当該エントリに履歴情報を有する第2テーブルと、第2テーブルを制御する第2テーブル制御部と、分岐命令を処理し、分岐の成立、不成立の情報を第1テーブル制御部および第2テーブル制御部に提供する分岐処理部とを含む。そして、第1テーブル制御部はフラグ処理部を備え、当該フラグ処理部は、プログラムの開始時にフラグをディスエーブルに初期化し、分岐処理部から分岐成立の情報が提供されたときには該当するフラグがイネーブルかディスエーブルかを判定し、該当するフラグがディスエーブルの場合には該当するフラグをイネーブルにし、プログラムの終了時に第1テーブルのフラグそれぞれの終了状態を提供する。また、第2テーブル制御部は履歴情報処理部を備え、当該履歴情報処理部は、プログラムの開始時にエントリの履歴情報の初期状態を保存し、分岐処理部から分岐不成立の情報が提供されたときには該当するエントリの履歴情報の値をデクリメントし、分岐処理部から分岐成立の情報が提供されたときには該当するエントリの履歴情報の値をインクリメントし、プログラムの終了時にエントリの履歴情報の終了状態と保存した初期状態からエントリそれぞれの履歴情報の値の差分を提供する。
好ましくは、フラグはフラグ・ビットであり、フラグ処理部は、当該フラグ・ビットを0に設定することによりフラグをディスエーブルに初期化し、当該フラグ・ビットを1に設定することによりフラグをイネーブルにする。また、好ましくは、履歴情報は複数のビットからなり、当該複数のビットの最下位ビットをフラグにして第2テーブルは第1テーブルを兼ね、履歴情報処理部は、当該最下位ビットを0に設定することによりフラグをディスエーブルに初期化し、当該最下位ビットを1に設定することによりフラグをイネーブルにする。さらに、好ましくは、第2テーブルは分岐履歴テーブルBHTを含む。
本発明により、既存のプログラム解析手法の問題点を解決するプログラム解析手法が実現され、BHTのようなテーブルを用いてプログラム解析を行なう方法、システムおよびコンピュータ・プログラムが提供される。特に、プロセッサに実装されているBHTのようなテーブルを用いて、ハードウェア・コストの低い、プログラムへの影響の少ない、関数単位より細かい粒度の基本ブロック(Basic block)単位での高速なプログラム解析手法を達成することができる。
BHTの動作を例示する概略図である。 BHTの動作を例示する概略図である。 BHTの動作を例示する概略図である。 BHTの動作を例示する概略図である。 本発明の1実施形態に係るプログラム解析システムを有するプロセッサを概略的に示すブロック図である。 本発明の1実施形態に係るプログラム解析方法を概略的に示すフローチャート図である。 本発明の1実施形態に係るプログラム解析方法を実施したときの開始時のBHTおよびBFTを例示する概略図である。 本発明の1実施形態に係るプログラム解析方法を実施したときの終了時のBHTおよびBFTを例示する概略図である。 本発明の1実施形態に係るプログラム解析方法を実施して得られるデータを例示する概略図である。 BHTのみによるプログラム解析での開始時のBHTを例示する概略図である。 BHTのみによるプログラム解析での終了時のBHTを例示する概略図である。 BHTのみによるプログラム解析で得られるデータを例示する概略図である。 本発明の1実施形態に係るプログラム解析方法を実施して得られる別のデータを例示する概略図である。
以下、本発明を実施するための最良の形態を図面に基づいて詳細に説明するが、以下の実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。本発明は多くの異なる態様で実施することが可能であり、記載された実施形態の内容に限定して解釈されるべきではない。なお、実施形態の説明の全体を通じて同じ構成部分乃至構成要素には同じ番号を付している。
まず、本発明の1実施形態に係るプログラム解析方法において用いられるBHTの動作についてその概略を述べる。図1に示すように、プログラムは命令を1番目の基本ブロックで順次実行し(1)、brと記された分岐命令に達する。BHTの各エントリには、命令のアドレスAddr.に対応して例えば2ビットで表される履歴Historyが設けられている。
図2に示すように、1番目のブロックの分岐命令brが実行されて、2番目のブロックの分岐命令brの直後までジャンプすると(2)、1番目のブロックの分岐命令brで分岐が成立したことにより、BHTの該当するエントリのアドレスAddr.が000Cである履歴ビットはインクリメントされ、10から11へと変わる。2番目のブロックの分岐命令brは実行されないので、BHTの該当するエントリの履歴ビットは変わらない。プログラムは命令を3番目のブロックで順次実行し(3)、brと記された分岐命令に達する。
図3に示すように、3番目のブロックの分岐命令brが実行されて、2番目のブロックの分岐命令brの直後までプログラムはジャンプして戻ると(4)、3番目のブロックの分岐命令brで分岐が成立したことにより、BHTの該当するエントリのアドレスAddr.が0030である履歴ビットはインクリメントされ、01から10へと変わる。
図4に示すように、プログラムは、2番目のブロックの分岐命令brの直後までジャンプして戻ると(4)、再度3番目のブロックで命令を順次実行し、brと記された分岐命令に達する(5)。今度は3番目のブロックの分岐命令brが実行されても、ジャンプしないので分岐は成立しない、即ち不成立となる。分岐命令brが実行されて分岐が不成立となる場合には、BHTの該当するエントリ(アドレスAddr.が0030)の履歴ビットはデクリメントされ、10から01へと変わる。3番目のブロックの分岐命令brの実行に続いて、プログラムは、4番目のブロックで命令を順次実行し(6)、brと記された分岐命令に達する。プログラムは、4番目のブロックの分岐命令brを実行してジャンプする。4番目のブロックの分岐命令brで分岐が成立したことにより、BHTの該当するエントリのアドレスAddr.が3FFCである履歴ビットはインクリメントされ、10から11へと変わる。
図5は、本発明の1実施形態に係るプログラム解析システムを有するプロセッサ100を概略的に示すブロック図である。プロセッサ100は、命令を保持する命令キャッシュ110、命令を実行のため格納する命令キュー120、分岐命令を処理する分岐処理部130、BHT140、BHT140を制御するBHT制御部150、分岐フラグ・テーブル(BFT:Branch Flag Table、以下「BFT」と称す)160およびBFT160を制御するBFT制御部170を含む。分岐処理部130は、命令キュー120からの分岐命令を実行し、分岐が成立したか否か(不成立)の情報をBHT制御部150およびBFT制御部170に提供する。
BHT制御部150は履歴情報処理部155を備える。履歴情報処理部155は、プログラム解析開始の命令に応答して、BHT140の初期状態を図示していないメモリや専用SRAMに保存する。また、履歴情報処理部155は、分岐命令が実行された場合に、分岐処理部130から分岐成立の情報が提供されたときは、BHT140の該当するエントリ、即ち分岐命令のアドレスを有するエントリの履歴ビットをインクリメントし、分岐処理部130から分岐不成立の情報が提供されたときは、BHT140の該当するエントリの履歴ビットをデクリメントする。さらに、履歴情報処理部155は、分岐命令が実行されない場合には、BHT140の該当するエントリの履歴ビットを変えない。
BFT160は、各命令に対応して例えば1ビットからなるフラグ(Flag)を有する。フラグは、「1」のイネーブルに設定されたり、「0」のディスエーブルに設定されたりする。フラグビットの値を反対にしてそれらの設定をしても良い。BFT制御部170はフラグ処理部175を備える。フラグ処理部175は、プログラム解析開始の命令に応答して、BFT160のフラグを初期化、即ち「0」のディスエーブルに設定する。また、フラグ処理部175は、分岐命令が実行された場合に、分岐処理部130から分岐成立の情報が提供されたときは、BFT160の該当するフラグ、即ち分岐命令に対応するフラグがイネーブルかディスエーブルかを判定し、フラグがディスエーブルの場合にはそのフラグのビットを「1」のイネーブルに設定する。分岐処理部130から分岐不成立の情報が提供されたときは、フラグ処理部175はBFT160の該当するフラグの設定されている状態を維持する。さらに、フラグ処理部175は、プログラム解析の間イネーブルに設定されたフラグのビットを保持する、即ち、フラグがイネーブルに設定されたら、プログラム解析の間そのイネーブルの設定を変えない。
図5では、BFT160およびBFT制御部170は、BHT140およびBHT制御部150とは別に独立して設けられているが、エントリのアドレス部Addr.以外のフィールドが2ビットよりも多いいビット数のテーブルでBHT140を構成し、そのテーブルの最下位ビットをBFT160用のフラグ部として設けるようにして、BHT140にBFT160の機能まで持たせても良い。その場合、BFT制御部170の機能もBHT制御部150に設けられることになり、BHT制御部150には履歴情報処理部155の機能の外にフラグ処理部175の機能が加わる。
図6は、本発明の1実施形態に係るプログラム解析方法を概略的に示すフローチャート(200)図である。この方法は、図5に示されたようなプログラム解析システムを有するプロセッサ100で実施できる。プロセッサ100において、プログラム解析開始の命令が命令キュー120より提供されると開始する(ステップ205)。プロセッサ100は、BFT160のフラグを初期化、即ち「0」のディスエーブルに設定する(ステップ210)。また、プロセッサ100は、BHT140の初期状態を図示していないメモリや専用SRAMに保存する(ステップ215)。
続いて、プロセッサ100は、プログラム中の分岐命令を実行し(ステップ220)、BFT160の該当するフラグ、即ち分岐命令に対応するフラグがビットを「1」にするイネーブルに設定されているか否かを判定する(ステップ225)。判定が「いいえ」の場合、即ち該当するフラグがイネーブルでない場合には、プロセッサ100は、その該当するフラグをイネーブルに(ビットを「1」に)設定して(ステップ230)、ステップ235に進む。判定が「はい」の場合、即ち該当するフラグがイネーブルの場合にも、ステップ235に進む。分岐命令の実行で分岐が成立したか否か(不成立)を判定する(ステップ235)。判定が「いいえ」の場合、即ち分岐不成立の場合には、プロセッサ100は、BHT140の該当するエントリ、即ち分岐命令のアドレスを有するエントリの履歴ビットをデクリメントして(ステップ240)、ステップ250に進む。判定が「はい」の場合、即ち分岐成立の場合には、プロセッサ100は、BHT140の該当するエントリの履歴ビットをインクリメントして(ステップ240)、ステップ250に進む。
プロセッサ100は、ステップ250で解析対象のプログラムを終了するか否かを判定する。判定が「いいえ」の場合、即ちそのプログラムを終了しないで続ける場合には、ステップ220の直前に戻って、ステップ220からステップ250までを繰り返す。判定が「はい」の場合、即ちそのプログラムを終了する場合には、ステップ255に進む。プロセッサ100は、BHT140の終了状態と保存した初期状態から各エントリ(履歴ビット)の値の差分を取得し(ステップ255)、さらに、BFT160の終了状態を取得して(ステップ260)、終了する(ステップ265)。取得したBHT140の各エントリ(履歴ビット)の値の差分およびBFT160の終了状態はメモリなどに保存しても良いし、図示しない表示装置に表示してユーザに提供するようにしても良い。
図7および図8は、本発明の1実施形態に係るプログラム解析方法を実施したときのそれぞれ開始時および終了時のBHTおよびBFTを、図1乃至図4に示した例を用いて示す。図7では、プロファイル即ちプログラム解析の開始時におけるBHTおよびBFTのデータが示されている。BHTの初期状態は図示していないメモリや専用SRAMに保存され、BFTはフラグすべてを初期化、即ち「0」のディスエーブルに設定される。プログラムは基本ブロック(a)の部分から実行される(1)。
図8では、プロファイル即ちプログラム解析の終了時におけるBHTおよびBFTのデータが示されている。プログラムでは、(a)の部分の分岐命令(a)brを実行して(c)の部分にジャンプし(2)、(c)の部分を実行する(3)。それから、プログラムでは、(c)の部分の分岐命令(c)brを実行して(c)の部分の先頭にジャンプし(4)、再度(c)の部分を実行する(5)。プログラムでは、今度は(c)の部分の分岐命令(c)brを実行せずに、(x)の部分を実行する(6)。そして、プログラムでは、(x)の部分の分岐命令(x)brを実行してジャンプする。各分岐命令が実行されて、その都度BHTの該当するエントリの履歴ビットは更新されている。得られたBHTの終了状態のデータから開始時に保存していた初期状態のデータとの差分diffが求められている。また、各分岐命令が実行されて、分岐が成立した場合にはBFTの該当するフラグのビットが「1」のイネーブルに設定されている。本発明の1実施形態に係るプログラム解析方法を実施して、BHTの差分diffのデータとBFTの終了時のフラグのデータが得られる。
図9には、解析するプログラムの動作と共に、得られたBHTの差分diffのデータとBFTの終了時のフラグFlagのデータが示されている。得られたこれらのデータからプログラムについて以下のことが解析できる。即ち、
・分岐命令(a)brについての差分データdiffの「+1」とフラグ・データFlagの「1」から、(a)の部分のコードは実行され、分岐命令(a)brの分岐は成立した。
・分岐命令(b)brについてのフラグ・データFlagの「0」から、(b)の部分のコードは実行されなかった。
・分岐命令(c)brについての差分データdiffの「0」とフラグ・データFlagの「1」から、(c)の部分のコードは実行され、分岐命令(c)brの分岐は成立した。その分岐の不成立も1回はあった。
・分岐命令(x)brについての差分データdiffの「+1」とフラグ・データFlagの「1」から、(x)の部分のコードは実行され、分岐命令(x)brの分岐は1回以上成立した。
図10乃至図12は、参考までに、BHT(エントリの履歴ビット)のみによるプログラム解析で得られるデータから解析できる事項を示す。図10には、プロファイル開始時におけるBHTのデータが示されている。図10は図7に対応するが、図7に示されたBFTのデータは存在しない。同様に、図11には、プロファイル終了時におけるBHTのデータが示されている。やはり、図11は図8に対応するが、図8に示されたBFTのデータは存在せず、BHTの差分diffのデータのみが得られる。
図12には、解析するプログラムの動作と共に、得られたBHTの差分diffのデータが示されている。得られたこのデータからプログラムについて以下のことが解析できる。即ち、
・分岐命令(a)brについての差分データdiffの「+1」から、(a)の部分のコードは実行され、分岐命令(a)brの分岐は成立した。
・分岐命令(x)brについての差分データdiffの「+1」から、(x)の部分のコードは実行され、分岐命令(x)brの分岐は成立した。
このように、BHT(エントリの履歴ビット)のみによるプログラム解析では、(b)の部分のコードが実行されたかどうかは分からないし、また、(c)の部分のコードは実行されたにも拘らず、(c)の部分のコードが実行されたかどうかも分からない。しかしながら、先に例示したとおり、本発明のように、BFTを設けて分岐成立時に該当フラグをイネーブルにすることにより、それらの問題点は解決される。
図13は、本発明の1実施形態に係るプログラム解析方法を実施して得られる別のデータを例示する概略図である。図13の例では、プログラム固有の分岐命令の有無や分岐確率が予めプロファイル取得される。図13に示すように、コードA、BおよびCの最初の分岐命令brは常に実行される条件分岐であり、コードAの最後の分岐命令brは高頻度で成立し、コードCの最後の分岐命令brは高頻度で不成立であることが分かっている。これらの、プロファイル情報と得られたBHTの差分diffのデータおよびBFTのフラグのデータとを対応付けてプログラムの振舞いを解析することができる。特に、以下のことが解析できる。即ち、
・コードAおよびCにおける最初の分岐命令brについての差分データdiffの「0」とフラグ・データFlagの「1」から、コードAおよびCは実行され、それらの常に実行される条件分岐は成立した。
・コードBにおける最初の分岐命令brについての差分データdiffのブランク(更新なし)とフラグ・データFlagのブランク(「0」)から、コードBは実行されなかった。
・コードAが実行されたことが確認されており、コードAおよびCにおける最後の分岐命令brについての差分データdiffが「−1」となり、フラグ・データFlagが「1」となっていることから総合的に判断して、高頻度で成立するコードAの方の分岐命令が実行された後に、高頻度で不成立するコードCの方の分岐命令が実行された。
以上、実施態様を用いて本発明の説明をしたが、本発明の技術的範囲は実施態様について記載した範囲には限定されない。実施態様に種々の変更又は改良を加えることが可能であり、そのような変更又は改良を加えた態様も当然に本発明の技術的範囲に含まれる。
本発明による1実施態様のプログラム解析方法は、プロセッサが次のステップを実行することを含む。即ち、プログラムの開始時に、プログラムの各命令にそれぞれが対応している複数のフラグを備える第1テーブルの当該フラグをディスエーブルに初期化するステップと、プログラムの開始時に、プログラムの各命令にそれぞれが対応している複数のエントリを備え当該エントリに履歴情報を有する第2テーブルの初期状態を保存するステップと、分岐命令を実行するステップと、分岐命令の実行時に、第1テーブルの該当するフラグがイネーブルかディスエーブルかを判定するステップと、該当するフラグがディスエーブルの場合、該当するフラグをイネーブルにするステップと、分岐命令の実行時に、分岐が成立か不成立かを判定するステップと、分岐が不成立の場合、第2テーブルの該当するエントリの履歴情報の値をデクリメントするステップと、分岐が成立の場合、第2テーブルの該当するエントリの履歴情報の値をインクリメントするステップと、プログラムを終了するか否かを判定するステップと、プログラムを終了しない場合、分岐命令を実行するステップからプログラムを終了するか否かを判定するステップまでを繰り返すステップと、プログラムを終了する場合、第2テーブルの終了状態と保存した初期状態からエントリそれぞれの履歴情報の値の差分を取得するステップと、第1テーブルのフラグそれぞれの終了状態を取得するステップである。
本発明による1実施態様のプログラム解析システムでは、プロセッサは、プログラムの各命令にそれぞれが対応している複数のフラグを備える第1テーブルと、第1テーブルを制御する第1テーブル制御部と、プログラムの各命令にそれぞれが対応している複数のエントリを備え当該エントリに履歴情報を有する第2テーブルと、第2テーブルを制御する第2テーブル制御部と、分岐命令を処理し、分岐命令実行の情報および分岐の成立、不成立の情報を第1テーブル制御部および第2テーブル制御部それぞれに提供する分岐処理部とを含む。そして、第1テーブル制御部はフラグ処理部を備え、当該フラグ処理部は、プログラムの開始時にフラグをディスエーブルに初期化し、分岐処理部から分岐命令実行の情報が提供されたときには該当するフラグがイネーブルかディスエーブルかを判定し、該当するフラグがディスエーブルの場合には該当するフラグをイネーブルにし、プログラムの終了時に第1テーブルのフラグそれぞれの終了状態を提供する。また、第2テーブル制御部は履歴情報処理部を備え、当該履歴情報処理部は、プログラムの開始時にエントリの履歴情報の初期状態を保存し、分岐処理部から分岐不成立の情報が提供されたときには該当するエントリの履歴情報の値をデクリメントし、分岐処理部から分岐成立の情報が提供されたときには該当するエントリの履歴情報の値をインクリメントし、プログラムの終了時にエントリの履歴情報の終了状態と保存した初期状態からエントリそれぞれの履歴情報の値の差分を提供する。
図5は、本発明の1実施形態に係るプログラム解析システムを有するプロセッサ100を概略的に示すブロック図である。プロセッサ100は、命令を保持する命令キャッシュ110、命令を実行のため格納する命令キュー120、分岐命令を処理する分岐処理部130、BHT140、BHT140を制御するBHT制御部150、分岐フラグ・テーブル(BFT:Branch Flag Table、以下「BFT」と称す)160およびBFT160を制御するBFT制御部170を含む。分岐処理部130は、命令キュー120からの分岐命令を実行し、分岐命令実行の情報および分岐が成立したか否か(不成立)の情報をBHT制御部150およびBFT制御部170それぞれに提供する。
BFT160は、各命令に対応して例えば1ビットからなるフラグ(Flag)を有する。フラグは、「1」のイネーブルに設定されたり、「0」のディスエーブルに設定されたりする。フラグビットの値を反対にしてそれらの設定をしても良い。BFT制御部170はフラグ処理部175を備える。フラグ処理部175は、プログラム解析開始の命令に応答して、BFT160のフラグを初期化、即ち「0」のディスエーブルに設定する。また、フラグ処理部175は、分岐命令が実行された場合に、分岐処理部130から分岐命令実行の情報が提供されたときは、BFT160の該当するフラグ、即ち分岐命令に対応するフラグがイネーブルかディスエーブルかを判定し、フラグがディスエーブルの場合にはそのフラグのビットを「1」のイネーブルに設定する。フラグがイネーブルの場合には、フラグ処理部175はBFT160の該当するフラグの設定されている状態を維持する。さらに、フラグ処理部175は、プログラム解析の間イネーブルに設定されたフラグのビットを保持する、即ち、フラグがイネーブルに設定されたら、プログラム解析の間そのイネーブルの設定を変えない。

Claims (9)

  1. プログラムを解析する方法であって、プロセッサが、
    前記プログラムの開始時に、前記プログラムの各命令にそれぞれが対応している複数のフラグを備える第1テーブルの当該フラグをディスエーブルに初期化するステップと、
    前記プログラムの開始時に、前記プログラムの各命令にそれぞれが対応している複数のエントリを備え、当該エントリに履歴情報を有する第2テーブルの初期状態を保存するステップと、
    分岐命令の実行時に、分岐が成立か不成立かを判定するステップと、
    分岐が不成立の場合、前記第2テーブルの該当する前記エントリの前記履歴情報の値をデクリメントするステップと、
    分岐が成立の場合、前記第2テーブルの該当する前記エントリの前記履歴情報の値をインクリメントするステップと、
    前記第1テーブルの該当する前記フラグがイネーブルかディスエーブルかを判定するステップと、
    該当する前記フラグがディスエーブルの場合、該当する前記フラグをイネーブルにするステップと、
    前記プログラムを終了するか否かを判定するステップと、
    前記プログラムを終了しない場合、前記分岐が成立か不成立かを判定するステップから前記プログラムを終了するか否かを判定するステップまでを繰り返すステップと、
    前記プログラムを終了する場合、前記第2テーブルの終了状態と保存した前記初期状態から前記エントリそれぞれの前記履歴情報の値の差分を取得するステップと、
    前記第1テーブルの前記フラグそれぞれの終了状態を取得するステップと、
    を実行することを含む、プログラム解析方法。
  2. 前記フラグはフラグ・ビットであり、前記フラグをディスエーブルに初期化するステップは当該フラグ・ビットを0に設定することを含み、前記フラグをイネーブルにするステップは当該フラグ・ビットを1に設定することを含む、請求項1に記載の方法。
  3. 前記履歴情報は複数のビットからなり、当該複数のビットの最下位ビットを前記フラグにして前記第2テーブルは前記第1テーブルを兼ね、前記フラグをディスエーブルに初期化するステップは当該最下位ビットを0に設定することを含み、前記フラグをイネーブルにするステップは当該最下位ビットを1に設定することを含む、請求項1に記載の方法。
  4. 前記第2テーブルとして分岐履歴テーブルを用いることを含む、請求項1〜3のいずれか1項に記載の方法。
  5. プロセッサに、請求項1〜4のいずれか1項に記載の方法の各ステップを実行させるプログラム解析のためのコンピュータ・プログラム。
  6. プログラムを解析するシステムであって、
    プロセッサは、前記プログラムの各命令にそれぞれが対応している複数のフラグを備える第1テーブルと、前記第1テーブルを制御する第1テーブル制御部と、前記プログラムの各命令にそれぞれが対応している複数のエントリを備え、当該エントリに履歴情報を有する第2テーブルと、前記第2テーブルを制御する第2テーブル制御部と、分岐命令を処理し、分岐の成立、不成立の情報を前記第1テーブル制御部および前記第2テーブル制御部に提供する分岐処理部とを含み、
    前記第1テーブル制御部はフラグ処理部を備え、当該フラグ処理部は、前記プログラムの開始時に前記フラグをディスエーブルに初期化し、前記分岐処理部から前記分岐成立の情報が提供されたときには該当する前記フラグがイネーブルかディスエーブルかを判定し、該当する前記フラグがディスエーブルの場合には該当する前記フラグをイネーブルにし、前記プログラムの終了時に前記第1テーブルの前記フラグそれぞれの終了状態を提供し、
    前記第2テーブル制御部は履歴情報処理部を備え、当該履歴情報処理部は、前記プログラムの開始時に前記エントリの前記履歴情報の初期状態を保存し、前記分岐処理部から前記分岐不成立の情報が提供されたときには該当する前記エントリの前記履歴情報の値をデクリメントし、前記分岐処理部から前記分岐成立の情報が提供されたときには該当する前記エントリの前記履歴情報の値をインクリメントし、前記プログラムの終了時に前記エントリの前記履歴情報の終了状態と保存した前記初期状態から前記エントリそれぞれの前記履歴情報の値の差分を提供する、
    プログラム解析システム。
  7. 前記フラグはフラグ・ビットであり、前記フラグ処理部は、当該フラグ・ビットを0に設定することにより前記フラグをディスエーブルに初期化し、当該フラグ・ビットを1に設定することにより前記フラグをイネーブルにする、請求項6に記載のシステム。
  8. 前記履歴情報は複数のビットからなり、当該複数のビットの最下位ビットを前記フラグにして前記第2テーブルは前記第1テーブルを兼ね、前記履歴情報処理部は、当該最下位ビットを0に設定することにより前記フラグをディスエーブルに初期化し、当該最下位ビットを1に設定することにより前記フラグをイネーブルにする、請求項6に記載のシステム。
  9. 前記第2テーブルは分岐履歴テーブルを含む、請求項6〜8のいずれか1項に記載のシステム。
JP2010290894A 2010-12-27 2010-12-27 プログラム解析の方法、システムおよびプログラム Expired - Fee Related JP5552042B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010290894A JP5552042B2 (ja) 2010-12-27 2010-12-27 プログラム解析の方法、システムおよびプログラム
US13/332,436 US8990545B2 (en) 2010-12-27 2011-12-21 Method, system, and computer program for analyzing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010290894A JP5552042B2 (ja) 2010-12-27 2010-12-27 プログラム解析の方法、システムおよびプログラム

Publications (2)

Publication Number Publication Date
JP2012138004A true JP2012138004A (ja) 2012-07-19
JP5552042B2 JP5552042B2 (ja) 2014-07-16

Family

ID=46318478

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010290894A Expired - Fee Related JP5552042B2 (ja) 2010-12-27 2010-12-27 プログラム解析の方法、システムおよびプログラム

Country Status (2)

Country Link
US (1) US8990545B2 (ja)
JP (1) JP5552042B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10657051B2 (en) * 2017-12-14 2020-05-19 Macronix International Co., Ltd. Memory device and operation method thereof

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63228237A (ja) * 1987-03-17 1988-09-22 Nec Corp プログラムデバツグ方式
JPH10228377A (ja) * 1996-12-09 1998-08-25 Matsushita Electric Ind Co Ltd 分岐予測する情報処理装置
US6484256B1 (en) * 1999-08-09 2002-11-19 International Business Machines Corporation Apparatus and method of branch prediction utilizing a comparison of a branch history table to an aliasing table
WO2007046324A1 (ja) * 2005-10-17 2007-04-26 Fukuoka Industry, Science & Technology Foundation 推定装置、テーブル管理装置、選択装置、テーブル管理方法、そのテーブル管理方法をコンピュータに実現させるプログラム、及び、そのプログラムを記録する記録媒体

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2064585B (en) 1979-11-19 1983-11-09 Enthone Acid zinc electro plating solutions and methods utilizing ethoxylated/propoxylated polyhydric alcohols
JP2508872B2 (ja) * 1990-02-27 1996-06-19 三菱電機株式会社 プログラマブルコントロ―ラの制御方法
JPH0613070A (ja) 1992-06-29 1994-01-21 Sumitomo Electric Ind Ltd リチウム二次電池およびリチウム二次電池用負極の製造方法
JP3473249B2 (ja) 1996-03-08 2003-12-02 株式会社日立製作所 中央処理装置
WO1998008160A1 (en) * 1996-08-20 1998-02-26 Idea Corporation A method for identifying hard-to-predict branches to enhance processor performance
US6151672A (en) 1998-02-23 2000-11-21 Hewlett-Packard Company Methods and apparatus for reducing interference in a branch history table of a microprocessor
US6233678B1 (en) * 1998-11-05 2001-05-15 Hewlett-Packard Company Method and apparatus for profiling of non-instrumented programs and dynamic processing of profile data
JP2001156321A (ja) 1999-03-09 2001-06-08 Fuji Xerox Co Ltd 半導体装置およびその製造方法
JP2000293373A (ja) 1999-04-12 2000-10-20 Hitachi Ltd 分岐予測装置
JP3502592B2 (ja) 2000-03-02 2004-03-02 株式会社東芝 分岐予測装置
DE10121792C2 (de) * 2000-05-26 2003-09-25 Ibm Universelle Ladeadresse/Wertevorhersageschema
GB2366879B (en) * 2000-09-16 2005-02-16 Ibm Tracing the execution path of a computer program
JP3922155B2 (ja) 2002-10-04 2007-05-30 トヨタ自動車株式会社 電動手段付き過給機により冷却を行なう内燃機関
US7120784B2 (en) 2003-04-28 2006-10-10 International Business Machines Corporation Thread-specific branch prediction by logically splitting branch history tables and predicted target address cache in a simultaneous multithreading processing environment
US20040225870A1 (en) * 2003-05-07 2004-11-11 Srinivasan Srikanth T. Method and apparatus for reducing wrong path execution in a speculative multi-threaded processor
US20060015706A1 (en) * 2004-06-30 2006-01-19 Chunrong Lai TLB correlated branch predictor and method for use thereof
JP2006053830A (ja) 2004-08-13 2006-02-23 Toshiba Corp 分岐予測装置および分岐予測方法
FR2886460B1 (fr) 2005-05-25 2007-08-24 Electricite De France Sulfurisation et selenisation de couches de cigs electrodepose par recuit thermique
US7507321B2 (en) 2006-01-06 2009-03-24 Solopower, Inc. Efficient gallium thin film electroplating methods and chemistries
JP5497261B2 (ja) 2006-12-15 2014-05-21 ローム・アンド・ハース・エレクトロニック・マテリアルズ,エル.エル.シー. インジウム組成物
TW200837430A (en) 2007-03-09 2008-09-16 Chunghwa Picture Tubes Ltd Active device array substrate and repair method thereof
ES2624637T3 (es) 2008-05-30 2017-07-17 Atotech Deutschland Gmbh Aditivo de electrogalvanoplastia para la deposición de una aleación de un metal del grupo IB/binaria o ternaria del grupo IB-grupo IIIA/ternaria, cuaternaria o quinaria del grupo IB, el grupo IIIA-grupo VIA
CN101763248A (zh) * 2008-12-25 2010-06-30 世意法(北京)半导体研发有限责任公司 用于多模式分支预测器的系统和方法
US8566569B2 (en) * 2010-06-24 2013-10-22 International Business Machines Corporation State machine-based filtering of pattern history tables based on distinguishable pattern detection

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63228237A (ja) * 1987-03-17 1988-09-22 Nec Corp プログラムデバツグ方式
JPH10228377A (ja) * 1996-12-09 1998-08-25 Matsushita Electric Ind Co Ltd 分岐予測する情報処理装置
US6484256B1 (en) * 1999-08-09 2002-11-19 International Business Machines Corporation Apparatus and method of branch prediction utilizing a comparison of a branch history table to an aliasing table
WO2007046324A1 (ja) * 2005-10-17 2007-04-26 Fukuoka Industry, Science & Technology Foundation 推定装置、テーブル管理装置、選択装置、テーブル管理方法、そのテーブル管理方法をコンピュータに実現させるプログラム、及び、そのプログラムを記録する記録媒体

Also Published As

Publication number Publication date
US8990545B2 (en) 2015-03-24
JP5552042B2 (ja) 2014-07-16
US20120166776A1 (en) 2012-06-28

Similar Documents

Publication Publication Date Title
US8671397B2 (en) Selective data flow analysis of bounded regions of computer software applications
US8214812B2 (en) Method of interpreting method bytecode and system operated by the same
KR101579589B1 (ko) 파이프라인 프로세서를 위한 정적 분기 예측 방법과 이를 위한 컴파일 방법
US8635627B2 (en) Method, medium and apparatus storing and restoring register context for fast context switching between tasks
CN108595210B (zh) 实现零开销循环的处理器
JP5808450B1 (ja) マルチコアプロセッサを使用して逐次プログラムを実行する制御装置
CN106020905B (zh) 一种微控制器固件开发与更新的方法及系统
JP2008269569A (ja) コード変換装置
US11226798B2 (en) Information processing device and information processing method
CN112083954B (zh) 一种gpu中显式独立掩码寄存器的掩码操作方法
JP5421228B2 (ja) 仮想タスクを使用した関係可視化のためのプログラム、装置およびその方法
US11042378B2 (en) Propagation instruction to generate a set of predicate flags based on previous and current prediction data
US10466974B2 (en) Independent expression animations
JP5552042B2 (ja) プログラム解析の方法、システムおよびプログラム
US20150363241A1 (en) Method and apparatus to migrate stacks for thread execution
JP6510430B2 (ja) トレースデータ編集装置及び方法
JP2017084361A (ja) 汎用マイクロプロセッサを用いたplcのデバッグ方法
US8549508B2 (en) Mechanism for performing instruction scheduling based on register pressure sensitivity
JP5021584B2 (ja) マイコンシミュレータ、そのシミュレーション方法、プログラム、及びコンピュータ読み取り可能な媒体
WO2001090889A3 (en) Instruction dependency scoreboard with a hierarchical structure
US11853193B2 (en) Inverse performance driven program analysis
KR101550652B1 (ko) 프로그램 개발 환경 제공 장치 및 방법
CN113760364B (zh) 逻辑器件的控制器
JP2009110455A (ja) プログラマブル操作表示器、そのプログラム
CN115454532A (zh) 一种安卓注解处理器优化应用启动速度的方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131003

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140523

R150 Certificate of patent or registration of utility model

Ref document number: 5552042

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees