JP2001142747A

JP2001142747A - プロセッサ性能データ収集装置及び該装置を利用した最適化方法

Info

Publication number: JP2001142747A
Application number: JP32637799A
Authority: JP
Inventors: Satoshi Matsushita; 智松下
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1999-11-17
Filing date: 1999-11-17
Publication date: 2001-05-25
Anticipated expiration: 2019-11-17
Also published as: JP3292189B2

Abstract

(57)【要約】【課題】性能改善に役立つ事象の統計データを実運用
時に迅速かつ低コストで収集する。【解決手段】抽出部連想メモリ31は、プロセッサの性
能低下に及ぼす影響が大きく且つ統計的な信頼度が基準
を満たす上位一定数の事象の統計データを記憶する。巡
回部連想メモリ32は、統計的な信頼度が未だ基準を満た
さないか或いは前記上位一定数に入らない事象の統計デ
ータを一時的に記憶する。投機確率データ更新回路43及
び入れ替え候補決定回路45は、実運用時に発生した事象
に関するデータをプロセッサから投機指示バス22を通じ
て受け取って該当する事象の失敗率を更新し、現在まで
に計算された事象の統計データのうちプロセッサの性能
低下に及ぼす影響が大きい上位一定数の事象の統計デー
タが抽出部連想メモリ31に残るように、巡回部連想メモ
リ32と抽出部連想メモリ31間での事象の統計データの入
れ替え及び抽出部連想メモリ31の事象の統計データの入
れ替えを行う。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、コンピュータシス
テムの性能改善を目的としてプロセッサで発生した事象
の統計データを収集するプロセッサ性能データ収集装置
及び該装置を利用した最適化方法に関する。

【０００２】

【従来の技術】従来より、プロセッサで発生した各種事
象に関するデータを収集して統計処理を行い、その事象
の統計データに基づいてコンピュータシステムの性能を
チューニングすることが行われている。以下に、代表的
な従来技術を示す。

【０００３】（１）従来技術１特開平７−１９１８８２号公報（以下、文献１と称す）
には、事象の統計データとしてメモリの連続領域毎かつ
アクセスタイプ毎のアクセス回数を求め、その統計デー
タに基づいて性能をチューニングする技術が示されてい
る。具体的には、メモリアクセスの履歴を採取するトレ
ース採取ルーチンをターゲットプログラムに埋め込んで
実行させ、メモリアクセスが１回行われる毎にそのメモ
リアクセスの種類とアクセスしたアドレスを含むトレー
ス情報をトレースファイルに収集する。次にプロファイ
リング手段によって、トレースファイルの各トレース情
報毎に解析し、メモリの連続領域毎かつアクセスタイプ
毎のアクセス回数を集計して出力する。そして、アクセ
ス回数を参照して、処理の重い部分や頻繁にアクセスさ
れる変数やデータ構造を改善する。

【０００４】（２）従来技術２特開平８−２６３３７２号公報（以下、文献２と称す）
には、事象の統計データとして各データアドレスのキャ
ッシュミス率（アクセス回数に対するキャッシュミス回
数の比率）を求め、その統計データに基づいて性能をチ
ューニングする技術が示されている。具体的には、コン
パイラが出力したオブジェクトプログラムについてその
実行シーケンスに従って命令を１つずつトレースし、そ
の命令がアクセスするデータの主記憶上のアドレスを抽
出する処理手段と、アクセスアドレスがキャッシュメモ
リに取り込んだとみなされるデータのアドレス範囲内に
ないときキャッシュミスとして検出し、キャッシュミス
情報中の当該アドレスについてのアクセス回数とキャッ
シュミス回数をカウントアップするシミュレート手段と
を備える。そして、コンパイラは、前記キャッシュミス
情報から各命令に関するアドレスのキャッシュミス率を
計算し、そのキャッシュミス率が所定値以上のとき、当
該命令と並行して実行されるだけの独立した後続命令を
並行実行させるよう命令の実行順序を変更することで最
適化を実施する。

【０００５】（３）従来技術３特開平１１−２７２５１９号公報（以下、文献３と称
す）には、事象の統計データとして、プロセス毎のキャ
ッシュヒット率やスレッド毎の平均メモリシステム待ち
時間など事前に設定された事象の統計データを求め、そ
の統計データに基づいて性能をチューニングする技術が
示されている。この従来技術３は、事象に関するデータ
を、従来技術１のようにターゲットプログラムに付加的
なコードを追加することなく、また従来技術２のような
シミュレートによることなく、ハードウェア的にサンプ
リングする。更に、分岐予想ミスによって失われた命令
サイクルなどの付加情報を、プログラムの特定の命令に
帰属させて収集することができる。具体的には、図２１
に示されるようなトリガー１０００、カウンタ１００１
及びマーカー１００２から構成されるセレクタ２０００
がプロセッサ内に設けられる。

【０００６】カウンタ１００１は、ハードウェア又はソ
フトウェアによって任意に設定可能な初期値１００７で
初期化され、カウンタ事象信号１００８により歩進され
る。カウンタ事象信号１００８は、カウント選択信号１
００９により１つ以上の事象信号（事象１、事象２、事
象３）１００５から選択される。事象信号１００５はク
ロックサイクル、トランザクション等である。トリガー
１０００は、コンピュータシステムにおける現在のトラ
ンザクション１００３、事象１００５、状態１００６を
入力し、何時どんな条件の下でカウンタ１００１を歩進
可能状態にすべきかを決定する。マーカー１００２は、
事象１００５、状態１００６及びトランザクションを入
力し、カウンタ１００１がオーバーフローしたとき、選
択されたトランザクションＴ’１００４としてどのトラ
ンザクションがマークされるかを決定する。選択された
トランザクションのマーキングは、例えばＴからＴ’ま
での付加的なサンプルビットをトランザクションに与え
ることにより行われる。

【０００７】或るトランザクションがサンプリングのた
めに選択された後に、マークされたトランザクション１
００４を処理するプロセッサは、各当該処理段階にサン
プルビットをチェックし、それに使用できる状態情報を
収集し、バッファに記憶する。状態情報記憶用のバッフ
ァには、処理されている特定トランザクションに関する
状態（例えば、トランザクションがメモリ参照である場
合には、キャッシュヒット状態か否か等）を示す状態フ
ィールド、当該トランザクションに関連した仮想や物理
的アドレスを示すアドレスフィールド、当該トランザク
ションのソースのスレッド識別子などを示すコンテクス
トフィールド、当該トランザクションのソース（例えば
ロード又は記憶命令、ＤＭＡ要求等）を示すソースフィ
ールド、ソースを識別するための付加的な情報（ソース
がプロセッサパイプラインのフェッチユニットである場
合には命令のプログラムカウンタや命令フィールドな
ど）を示す命令フィールドなどが含まれる。

【０００８】特定数のトランザクションが記録された後
に、バッファが一杯になると、割り込みやソフトウェア
ポーリングによってバッファの内容がソフトウェアによ
って読み込まれ、次のサンプリングを可能とする。ソフ
トウェアによって読み込まれた状態情報は、プロファイ
リングアプリケーションソフトウェアによって統計的な
解析が行われて統計データが求められる。そして、この
統計データを分析し、再コンパイルなどの方法で実行中
プログラム内の性能問題の最適化を動的に実施する。

【０００９】

【発明が解決しようとする課題】従来の課題の１つは、
性能改善に役立つ事象の統計データを得るために保存し
ておかなければならないデータ量が多く、保存にコスト
がかかることである。その理由は、従来技術１では、発
生した事象に関する全てのサンプルを格納し得る容量の
トレースファイルが必要になり、従来技術２では、アク
セス回数及びキャッシュミス回数の途中結果を各メモリ
アドレス毎に格納できる大容量なキャッシュミス情報が
必要になり、従来技術３では、状態情報格納用バッファ
から読み取ったデータ全てを格納できるファイル等が必
要になるためである。

【００１０】従来の他の課題は、性能改善に役立つ事象
の統計データを実運用時に速やかに求めることが難しい
ことである。その理由は、従来技術１および従来技術３
とも、全サンプルを収集した後に統計処理を行って統計
データを求めているからである。また、性能改善に役立
つ事象の統計データの計算が、性能改善に役立たない事
象の統計データの計算より後回しになってしまう可能性
があるからである。ここで、性能改善に役立たない事象
の統計データとは、従来技術１で言えば、アクセス回数
の少ないメモリの連続領域・アクセスタイプの事象の統
計データである。なお、従来技術２はシミュレータを用
いているため、プログラムの実運用時に事象の統計デー
タを求めることは本質的に不可能である。

【００１１】本発明の目的は、性能改善に役立つ事象の
統計データを実運用時に迅速かつ低コストで求めること
ができるプロセッサ性能データ収集装置を提供すること
にある。

【００１２】本発明の他の目的は、本発明のプロセッサ
性能データ収集装置を利用した最適化方法を提供するこ
とにある。

【００１３】

【課題を解決するための手段】本発明のプロセッサ性能
データ収集装置は、事象の統計データのうちプロセッサ
の性能低下に及ぼす影響が大きい上位一定数の事象の統
計データを記憶する抽出部メモリと、実運用時に発生し
た事象に関するデータをプロセッサから受け取り、現在
までに計算された事象の統計データのうちプロセッサの
性能低下に及ぼす影響が大きい上位一定数の事象の統計
データが前記抽出部メモリに残るように事象の統計デー
タの更新及び事象の統計データの入れ替えを行う制御手
段とを有する。

【００１４】プロセッサで発生した事象の統計データ
は、一般に性能改善に役立つものとそうでないものとに
分けることができる。例えば、アクセス頻度に基づいて
ソフトウェアの性能を改善する場合、処理の重い部分や
頻繁にアクセスされる変数やデータ構造を改善した方が
効果が大きいので、アクセス回数が多いことを示す事象
の統計データが性能改善に役立つ。また、キャッシュミ
ス情報に基づいてソフトウェアの性能を改善する場合、
キャッシュミス比率が大きい事象の統計データが性能改
善に役立つ。更に、投機実行可能なプロセッサにおける
各投機事象の投機失敗率に基づいてソフトウェアの性能
を改善する場合、投機失敗率が大きい事象の統計データ
が性能改善に役立つ。換言すると、性能改善に役立つ事
象の統計データは、プロセッサの性能低下に及ぼす影響
が大きい事象の統計データと言える。そこで本発明のプ
ロセッサ性能データ収集装置では、現在までに計算され
た事象の統計データのうちプロセッサの性能低下に及ぼ
す影響が大きい上位一定数の事象の統計データが抽出部
メモリに残るように事象の統計データの更新及び事象の
統計データの入れ替えを行う。これによって、限られた
容量の抽出部メモリが有効に活用され且つ統計処理と収
集が並行して実施されるため、性能改善に役立つ事象の
統計データを実運用時に迅速かつ低コストで収集するこ
とができる。

【００１５】現在までに計算された事象の統計データを
保存する場所として抽出部メモリだけを使用すると、抽
出部メモリが満杯となった以降、新たな事象の統計デー
タを残すには抽出部メモリに既に記録されている事象の
統計データを上書きする操作が必要になる。このような
操作を行っても収集精度は低下するが、プロセッサの性
能低下に及ぼす影響が極端に大きな事象の統計データの
幾つかは収集することができる。しかし、収集精度を高
めるためには、抽出部メモリ以外に補助的な格納場所が
必要になる。本発明では、補助的な格納場所として、巡
回部メモリを使用する方法、プロセッサ中の命令キャッ
シュを活用する方法、およびその両者を使用する方法の
何れかを提供する。

【００１６】巡回部メモリを使用する場合、抽出部メモ
リには、プロセッサの性能低下に及ぼす影響が大きく且
つ統計的な信頼度が基準を満たす上位一定数の事象の統
計データを記憶し、巡回部メモリには、統計的な信頼度
が未だ基準を満たさないか或いは前記上位一定数に入ら
ない事象の統計データを一時的に記憶する。統計的な信
頼度が基準を満たすか否かは、例えば出現回数が或る閾
値以上か否かで判断される。制御手段は、発生した事象
に関するデータをプロセッサから受け取り、現在までに
計算された事象の統計データのうちプロセッサの性能低
下に及ぼす影響が大きい上位一定数の事象の統計データ
が前記抽出部メモリに残るように、事象の統計データの
更新、前記巡回部メモリと前記抽出部メモリ間での事象
の統計データの入れ替え及び前記抽出部メモリの事象の
統計データの入れ替えを行う。具体的には、前記制御手
段は、前記プロセッサから受け取った事象の統計データ
が前記抽出部メモリ及び前記巡回部メモリの何れにも記
憶されていないときは前記巡回部メモリに空きエントリ
を確保して当該事象の統計データを登録し、前記巡回部
メモリに記憶されているときは該記憶されている事象の
統計データを更新すると共に必要に応じて前記巡回部メ
モリと前記抽出部メモリとの間で事象の統計データの入
れ替えを行い、前記抽出部メモリに記憶されているとき
は該記憶されている事象の統計データを更新する。

【００１７】巡回部メモリと命令キャッシュの双方を利
用する場合、抽出部メモリには、プロセッサの性能低下
に及ぼす影響が大きく且つ統計的な信頼度が基準を満た
す上位一定数の事象の統計データを記憶し、巡回部メモ
リに、統計的な信頼度が未だ基準を満たさないか或いは
前記上位一定数に入らない事象の統計データを一時的に
記憶し、命令キャッシュの各キャッシュライン毎に付加
した領域に、前記巡回部メモリへの登録事象を絞り込む
ために前記抽出部メモリおよび前記巡回部メモリの何れ
にも登録されていない事象にかかる簡易統計データを保
持する。制御手段は、発生した事象に関するデータをプ
ロセッサから受け取り、現在までに計算された事象の統
計データのうちプロセッサの性能低下に及ぼす影響が大
きい上位一定数の事象の統計データが前記抽出部メモリ
に残るように、事象の統計データの更新、前記巡回部メ
モリと前記抽出部メモリ間での事象の統計データの入れ
替え及び前記抽出部メモリの事象の統計データの入れ替
え並びに前記簡易統計データの更新を行う。具体的に
は、前記制御手段は、前記プロセッサから受け取った事
象の統計データが前記抽出部メモリ及び前記巡回部メモ
リの何れにも記憶されていないときは当該事象にかかる
命令を保持するキャッシュラインの簡易統計データを更
新すると共に更新後の簡易統計データが一定の基準を満
足したときに前記巡回部メモリに空きエントリを確保し
て当該事象の統計データを登録し、前記巡回部メモリに
記憶されているときは該記憶されている事象の統計デー
タを更新すると共に必要に応じて前記巡回部メモリと前
記抽出部メモリとの間で事象の統計データの入れ替えを
行い、前記抽出部メモリに記憶されているときは該記憶
されている事象の統計データを更新する。

【００１８】命令キャッシュだけを利用する場合、抽出
部メモリには、プロセッサの性能低下に及ぼす影響が大
きく且つ統計的な信頼度が基準を満たす上位一定数の事
象の統計データを記憶し、命令キャッシュの各キャッシ
ュライン毎に付加した領域に、前記抽出部メモリへの登
録事象を絞り込むために前記抽出部メモリに登録されて
いない事象にかかる簡易統計データを保持する。制御手
段は、発生した事象に関するデータをプロセッサから受
け取り、現在までに計算された事象の統計データのうち
プロセッサの性能低下に及ぼす影響が大きい上位一定数
の事象の統計データが前記抽出部メモリに残るように、
事象の統計データの更新、前記抽出部メモリの事象の統
計データの入れ替え並びに前記簡易統計データの更新を
行う。具体的には、前記制御手段は、前記プロセッサか
ら受け取った事象の統計データが前記抽出部メモリに記
憶されていないときは当該事象にかかる命令を保持する
キャッシュラインの簡易統計データを更新すると共に更
新後の簡易統計データが一定の基準を満足したときに前
記抽出部メモリに空きエントリを確保して当該事象の統
計データを登録し、前記抽出部メモリに記憶されている
ときは該記憶されている事象の統計データを更新する。

【００１９】前記抽出部メモリおよび前記巡回部メモリ
は、好ましくは、事象の種類（例えば命令アドレス）で
検索可能な連想メモリで構成される。また、前記抽出部
メモリの事象の統計データは、好ましくは、プロセッサ
の性能低下に及ぼす影響が大きい順に整列される。前記
事象の統計データは、例えば事象の出現回数、事象の失
敗回数及び失敗率を含む。ここで事象としてはキャッシ
ュアクセス命令や投機実行命令などがある。前記事象の
統計データは、更に、失敗した事象の巻き戻しに要する
コストを示す付加情報を含ませることができる。投機事
象の場合、そのコストは、巻き戻される命令の数や、投
機中にロードしたデータ量が付加情報となる。

【００２０】また本発明のプロセッサ性能データ収集装
置を利用した最適化方法は、上述したプロセッサ性能デ
ータ収集装置によってプログラムの実運用時に収集され
た事象の統計データに基づき、プログラムの再コンパイ
ル時に最適化し直すことで、動的な性能チューニングを
可能にする。

【００２１】

【発明の実施の形態】次に本発明の実施の形態の例につ
いて図面を参照して詳細に説明する。

【００２２】（第１実施例）本実施例では、投機実行を
行うプロセッサの実運用時に、そのプロセッサの処理と
並行して性能上問題となる投機の統計データを収集し、
この収集した統計データに基づいて性能チューニングを
行う。

【００２３】投機実行とは、動作予測に従い先行して投
機的に処理を投入し、予測が外れていた場合には、投機
実行の結果を取り消し、必要に応じて正しい処理をやり
直すことにより、結果の正当性を保証する処理方式であ
る。投機実行は、制御投機とデータ投機に分類される。
制御投機は、制御依存を無視して先行的に命令の実行を
開始する方法であり、データ投機は、データ依存を無視
して先行的にデータの値やデータのアドレスを予測し実
行を開始する方法である。投機実行の代表例に、プログ
ラム中の条件分岐命令において分岐先を実行前に予測す
る分岐予測がある。分岐予測は、コンパイル時に予測す
る静的分岐予測と、実行時に予測する動的分岐予測に分
類される。本実施例は、制御投機およびデータ投機を行
う処理部分をコンパイル時点で決定する静的予測手法を
用いる。以下、本実施例の前提となる静的予測による投
機実行について説明する。

【００２４】図１に、或るプログラムの開始Ｓｔｒａｔ
１から終了Ｅｎｄ２までの実行フローが示されている。
この実行フローにおいては、処理３ａが完了するまで
は、条件判断４ａ、条件判断４ｂの条件が確定しない。
このため、処理３ｃを処理３ａと同時に実行する場合、
処理３ｃの実行は制御投機となる。処理３ｂではなく、
処理３ｃに投機するのは、コンパイル時点の静的予測に
より、処理３ｃの方が投機の確実性が高いと判断された
ことによる。他方、処理３ｅは、条件判断４ａ、４ｂの
結果に依存せずに必ず実行されるため制御投機は不要で
あるが、処理３ａとデータ依存がある場合、処理３ｅを
処理３ａと同時に実行すると、処理３ｅの実行はデータ
投機となる。静的予測では、このようなデータ依存関係
の予測も可能であり、予測部分の投機実行により性能の
向上が図れる。従って、処理３ｃおよび処理３ｅを処理
３ａと同時に実行する場合、制御投機およびデータ投機
の双方が実施されていることになる。

【００２５】制御投機およびデータ投機を行う処理部分
を静的予測によって決定したプログラムの実行方法とし
ては、例えば特開平１０−２７１０８号公報（以下、文
献４と称す）に記載されたスレッド実行方法がある。同
文献４では、処理の割り当て単位をスレッドと呼び、複
数のスレッド実行部を使って親子関係にある複数のスレ
ッドを並列に実行する。その際、親スレッドの処理が或
る程度確定するまで子スレッドを確実に生成することが
わからない場合に、投機的に子スレッドを生成し、その
後の親スレッドの処理の進み方によって、仮に生成した
子スレッドを確定させたり、取り消したりする。そのた
めに、親スレッドがプログラム実行上の正当性が確定す
る前に子スレッドを投機的に生成するための投機的スレ
ッド生成命令、正当性が確認された後にその結果を子ス
レッドに伝えるための投機成功通知命令、不当な生成で
ある場合に子スレッドの実行を取り消すための投機失敗
通知命令といった特殊命令が用意される。また、スレッ
ド実行部に、実行に伴う作用を取り消すための機構が設
けられ、その機能の許容する範囲内でスレッドの仮実行
を行う。更に、親スレッドのスレッド実行部が投機成功
通知命令を実行すると、その情報が子スレッドを実行し
ているスレッド実行部に伝えられ、子スレッド実行部は
通常状態に遷移し、他方、親スレッドのスレッド実行部
が投機失敗通知命令を実行すると、その情報が子スレッ
ドを実行しているスレッド実行部に伝えられ、子スレッ
ドの実行を取り消し、さらに、親スレッドのスレッド実
行部においてもスレッド生成を行っていない状態に戻す
ようにしている。

【００２６】図２は投機が成功する場合の動作例を、図
３は投機が失敗する場合の動作例をそれぞれ示す。図２
において、スレッド＃０が投機的スレッド生成命令１１
を実行すると、スレッド＃１が生成され、仮実行状態で
スレッド＃１の実行が開始され、スレッド＃０はスレッ
ド仮生成状態となる。スレッド＃１の仮実行状態でスレ
ッド生成命令１２が実行されると、それによって生成さ
れるスレッド＃２もスレッド＃１の仮実行属性を引き継
ぎ、仮実行状態で実行される。スレッド＃０が条件分岐
命令１３を実行後、この条件分岐によってスレッド生成
の投機が正しいと確定すると、投機成功通知命令１４を
実行する。これによって、スレッド＃１、スレッド＃２
の仮実行状態が解除され、スレッド＃０はスレッド生成
状態となる。

【００２７】図３においても同様に実行されるが、条件
分岐命令１３が逆方向に分岐し、これによってスレッド
生成の投機が不正であると確定する。この時、スレッド
＃０は投機失敗通知命令１５を実行する。これによっ
て、スレッド＃１及びスレッド＃２の実行は取り消され
る。この投機失敗通知命令１５を実行することにより、
スレッド＃０はスレッド仮生成状態からスレッド未生成
状態に戻り、再びスレッド生成命令１６を実行してスレ
ッド＃３を生成することが可能になる。なお、投機的な
スレッド生成に失敗した時に投機的な実行による副作用
が生じないように、共有メモリなどへの書き込みは抑止
され、別途設けられた仮実行用バッファが代わりに使用
される。

【００２８】さて、図４を参照すると、本発明を適用し
たプロセッサ２５の一例は、ＭＰＵ演算実行部２０に対
して、投機指示バス２２、付加情報バス２３および結果
アクセスバス２４を介して、本発明にかかるプロセッサ
性能データ収集装置の一実施例である投機情報収集装置
２１が接続された構成を有する。

【００２９】ＭＰＵ演算実行部２０は、前述したような
投機実行を行う機能を有するプロセッサにデータ採取手
段２７および最適化手段２８を組み込んだものである。
データ採取手段２７は、ＭＰＵ演算実行部２０上でのプ
ログラムの実行中に、投機情報収集装置２１へ以下のよ
うな情報を出力する。

【００３０】（１）投機処理の開始時ＭＰＵ演算実行部２０上でのプログラム実行中に投機処
理が開始する都度、その事象を検出し、投機処理が開始
された旨及び投機命令のアドレスを、投機指示バス２２
を通じて投機情報収集装置２１に出力する。対象となる
投機処理としては、例えば図２、図３の投機的スレッド
生成命令１１がある。勿論、投機的に実行されるメモリ
ロード命令や条件分岐命令など、他の投機処理を対象に
することもできる。

【００３１】（２）投機処理の終了時ＭＰＵ演算実行部２０上でのプログラム実行中に投機処
理が完了する都度、その事象を検出し、投機処理が完了
した旨、完了種別（成功完了か失敗完了かの種別）およ
び投機命令アドレスを、投機指示バス２２を通じて投機
情報収集装置２１に出力する。例えば図２の場合、投機
成功通知命令１４の実行時点で投機的スレッド生成命令
１１にかかる投機処理が成功完了するので、投機処理が
完了した旨、成功完了および投機的スレッド生成命令１
１のアドレスを出力し、図３の場合は、投機失敗通知命
令の実行時点で投機的スレッド生成命令１１にかかる投
機処理が失敗完了するので、投機処理が完了した旨、失
敗完了および投機的スレッド生成命令１１のアドレスを
出力する。

【００３２】（３）投機実行中ＭＰＵ演算実行部２０上のプログラムで投機処理が実行
されている最中、当該投機処理が失敗完了した場合の無
駄なコストを見積もるのに必要なデータを付加情報とし
て採取し、当該投機処理の投機命令アドレスと共に付加
情報バス２３を通じて投機情報収集装置２１に出力す
る。無駄なコストを見積もるのに必要なデータとして
は、命令数、ストア／ロードしたデータ量などがある。
例えば図３の場合、投機的スレッド生成命令１１が失敗
完了した場合の無駄なコストは、仮実行状態のスレッド
＃１、＃２が実行した命令数あるいはメモリにストア／
ロードしたデータ量などで見積もることができる。命令
数を付加情報とする場合、データ採取手段２７は、投機
的スレッド生成命令１１で生成されたスレッド＃１、＃
２が仮実行状態になっている期間において命令が実行さ
れる都度、投機的スレッド生成命令１１のアドレスを伴
って命令が１つ実行された旨の付加情報を出力する。ま
たメモリにストア／ロードしたデータ量を付加情報とす
る場合、データ採取手段２７は、投機的スレッド生成命
令１１で生成されたスレッド＃１、＃２が仮実行状態に
なっている期間においてメモリストア／ロード命令が実
行される都度、投機的スレッド生成命令１１のアドレス
を伴ってそのストア／ロードしたデータ量を付加情報と
して出力する。

【００３３】データ採取手段２７の実現例としては、文
献１において採用されているように必要な情報を採取し
て出力するルーチンをプログラム中に組み込む構成があ
る。しかし、プログラムの実行速度を低下させないよう
に、文献３において採用されているようなハードウェア
によって必要な情報を採取して出力する構成が望まし
い。文献３に記載のハードウェア構成を流用することも
可能であり、その場合は、採取した情報をバッファに蓄
積する代わりにバス２２、２３を通じて投機情報収集装
置２１に出力する構成とする。勿論、他のハードウェア
構成を採用しても良い。

【００３４】投機情報収集装置２１は、ＭＰＵ演算実行
部２０と並行して動作するハードウェア機構であり、Ｍ
ＰＵ演算実行部２０中のデータ採取手段２７から投機指
示バス２２を通じて出力されるデータを入力して性能上
問題となる投機の統計データを内部メモリ上に生成す
る。また、付加情報バス２３を通じて出力される付加情
報も前記統計データの一部として内部メモリに蓄積す
る。内部メモリ上に生成された統計データは、結果アク
セスバス２４を通じてＭＰＵ演算実行部２０から読み取
られ、最適化手段２８によるプログラムの最適化に供さ
れる。

【００３５】図５を参照すると、投機情報収集装置２１
の一例は、連想表３０、投機確率データ更新回路４３、
抽出部移行限度レジスタ４４、入れ替え候補決定回路４
５、付加情報更新回路４６、結果アクセス制御回路４８
および投機指示処理回路４９を備えている。

【００３６】連想表３０は、ｎ＋ｍ個のエントリを有す
るフルアソシアティブ方式の連想メモリであり、そのう
ち連続するｎ個のエントリで抽出部連想メモリ３１が構
成され、残りｍ個のエントリで巡回部連想メモリ３２が
構成される。最終的に、抽出部連想メモリ３１には実行
性能の低下に及ぼす影響が大きい上位ｎ個の投機実行に
関する統計データが記憶される。巡回部連想メモリ３２
は、統計的な信頼度が未だ充分でないか或いは信頼度が
充分であっても上位ｎ個に入らない統計データを一時的
に記憶するために使用される。

【００３７】連想表３０の各エントリは連想キー部３３
とデータ部とで構成され、データ部は投機確率データ部
３４と順序／ＬＲＵ情報部３５と付加情報部３６とに区
分されている。連想キー部３３には投機命令アドレス３
７が登録され、投機確率データ部３４には、当該投機命
令アドレスで一意に特定される投機実行の出現回数３８
と、そのうちの失敗回数３９と、出現回数３８に対する
失敗回数３９の比を示す失敗率４０とが登録される。ま
た、順序／ＬＲＵ部３５には、抽出部連想メモリ３１に
あっては順序情報が登録される。つまり、抽出部連想メ
モリ３１の各エントリは、順序／ＬＲＵ情報部３５に登
録された順序情報によって、図６に示されるように、失
敗率４０が大きい順に論理的に昇順に並べられる。な
お、図６において、６１は、ｎ個のエントリのうち最も
失敗率の小さいエントリ６０を指し示すポインタであ
り、入れ替え候補決定回路４５内に設けられる。

【００３８】また、巡回部連想メモリ３２では順序／Ｌ
ＲＵ情報部３５にＬＲＵ情報が登録され、ＬＲＵアルゴ
リズムに従って最も長い間参照されていないエントリが
再利用される。つまり、ｍ個のエントリから構成される
巡回部連想メモリ３２は、図６に示されるように、最も
最近参照されたものから順に論理的に並べられ、最も長
い間参照されていないエントリ６２を指し示すポインタ
６３を有する入れ替え候補決定回路４５が、そのポイン
タ６３を用いてＬＲＵ方式で巡回部連想メモリ３２中の
書き潰すエントリを決定する。

【００３９】さらに付加情報部３６には、投機実行中に
発生した巻き戻しのためのデータ量等の付加情報４１が
登録される。付加情報部３６は、現在までに失敗した全
ての投機実行にかかる付加情報の累積値（全累積値と称
す）と、現実行中の投機にかかる付加情報の累積値（現
累積値と称す）とを保持しており、現実行中の投機が失
敗完了したとき、現累積値が全累積値に加算される。

【００４０】投機指示処理回路４９は、投機指示バス２
２を通じてＭＰＵ演算実行部２０に接続されている。デ
ータ採取手段２７から投機指示バス２２を通じて投機処
理の開始とその投機命令アドレス、または投機処理の終
了とその投機命令アドレスと完了種別が送られてくる毎
に、投機指示処理回路４９はそれらを投機確率データ更
新回路４３及び付加情報更新回路４６に伝達すると同時
に、投機命令アドレスを投機命令アドレス線４２に出力
する。投機命令アドレス線４２は連想表３０の各エント
リの連想キー部３３に接続されており、各連想キー部３
３内の比較器において、当該連想キー部３３に登録され
ている投機命令アドレスと投機命令アドレス線４２上の
投機命令アドレスとが比較され、それぞれの比較結果が
比較結果線２６を通じて投機確率データ更新回路４３に
伝達される。

【００４１】投機確率データ更新回路４３は、連想表３
０の各エントリの投機確率データ部３４を更新する回路
であり、比較結果線２６により投機命令アドレスの一致
が報告されたエントリの投機確率データ部３４中の出現
回数３８、失敗回数３９および失敗率４０を更新する。
具体的には、投機指示処理回路４９からの通知が投機処
理の開始である場合、出現回数３８を＋１する。また、
投機指示処理回路４９からの通知が投機処理の終了であ
る場合、完了種別が失敗完了であるときは失敗回数３９
を＋１した後、成功完了であるときは失敗回数３９を更
新せずに、失敗率４０を計算し直して再登録する。そし
て、当該エントリを指定して入れ替え候補決定回路４５
の入れ替え処理を起動する。比較結果線２６の何れも一
致を示さない場合、つまり投機命令アドレス線４２に出
力された投機命令アドレスが連想表３０に未登録の場
合、投機確率データ更新回路４３は、入れ替え候補決定
回路４５に巡回部連想メモリ３２中のエントリの確保要
求を出し、確保されたエントリのデータ部を初期化す
る。

【００４２】入れ替え候補決定回路４５は、投機確率デ
ータ更新回路４３から入れ替え処理が起動されると、以
下の処理を行う。（１）失敗率４０が更新された今回のエントリが抽出部
連想メモリ３１に含まれるエントリの場合、図６で説明
したように、抽出部連想メモリ３１のｍ個のエントリが
失敗率４０の値で論理的に昇順に並ぶように、必要に応
じて順序／ＬＲＵ情報部３５の順序情報およびポインタ
６１を更新する。（２）失敗率４０が更新された今回のエントリが巡回部
連想メモリ３２に含まれるエントリの場合、当該エント
リと抽出部連想メモリ３１のエントリとを入れ替える必
要があるか否かを判定する。以下の条件を満足する場
合、入れ替えが必要と判定する。（ａ）当該エントリの出現回数３８が抽出部移行限度レ
ジスタ４４に設定された閾値以上である。（ｂ）当該エントリの失敗率４０が、抽出部連想メモリ
３１の図６のポインタ６１で指示される最小失敗率のエ
ントリ６０の失敗率４０以上である。そして、以上の
（ａ）、（ｂ）の条件を満足する場合、当該エントリに
登録されている内容と、抽出部連想メモリ３１の最小失
敗率のエントリ６０に登録されている内容とを入れ替え
る。

【００４３】ここで、条件（ａ）を定めた理由は、出現
回数３８が或る値より少ない場合、その失敗率４０は統
計的な信頼度が未だ充分でないためである。この条件を
加味することによって、統計的な信頼度が低い統計デー
タによって、統計的な信頼度が高い統計データが抽出部
連想メモリ３１から追い出されてしまうことが防止され
る。

【００４４】他方、入れ替え候補決定回路４５は、投機
確率データ更新回路４３からエントリの確保要求があっ
た場合、巡回部連想メモリ３２のｎ個のエントリのうち
順序／ＬＲＵ情報部３５が最も長い間参照されていない
エントリ、つまり図６のポインタ６３が指示するエント
リ６２を追い出すエントリに決定する。そして、連想キ
ー更新指示線５０によって当該エントリ６２の連想キー
部３３に今回の投機命令アドレスを登録し、また付加情
報更新回路４６を通じて当該エントリ６２の付加情報部
３６を初期化した後、そのエントリ６２を投機確率デー
タ更新回路４３に通知する。

【００４５】なお、入れ替え候補決定回路４５は、連想
表３０のエントリの連想キー部３３に新たな投機命令ア
ドレスを登録する毎およびエントリの入れ替え毎に、付
加情報更新回路４６内に設けられているエントリと投機
命令アドレスとの対応表（図示せず）を更新する。ま
た、エントリを実際に入れ替えたか否かにかかわらず、
入れ替え処理を終えた時点でその旨を付加情報更新回路
４６に通知する。

【００４６】付加情報更新回路４６は、付加情報バス２
３を通じてＭＰＵ演算実行部２０に接続されている。付
加情報バス２３を通じてデータ採取手段２７から投機命
令アドレスを伴った付加情報が送られてくる毎に、付加
情報更新回路４６は、当該投機命令アドレスが登録され
ているエントリを前記対応表を参照して特定し、当該エ
ントリの付加情報部３６における現累積値に付加情報を
累積する。そして、投機指示処理回路４９から失敗完了
した投機命令アドレスが通知されてきた場合、入れ替え
候補決定回路４５から入れ替え処理が終了した旨の通知
を受けた後に、失敗完了した投機命令アドレスが登録さ
れているエントリを前記対応表を参照して特定し、当該
エントリの付加情報部３６における現累積値を全累積値
に加算する。

【００４７】結果アクセス制御回路４８は、結果アクセ
スバス２４を通じてＭＰＵ演算実行部２０に接続され、
連想表３０の抽出部連想メモリ３１とはデータ線および
アドレス線を含む結果アクセス線４７で接続されてお
り、ＭＰＵ演算実行部２０からのアドレス指定で連想表
３０の抽出部連想メモリ３１の各エントリの内容を読み
出せるようになっている。また、抽出部移行限度レジス
タ４４にも接続されており、ＭＰＵ演算実行部２０から
の抽出移行限度レジスタ４４へ事前に閾値を設定できる
ようになっている。

【００４８】次に投機情報収集装置２１の全体的な動作
の流れについて、図７および図８のフローを参照して以
下説明する。

【００４９】ＭＰＵ演算実行部２０のデータ採取手段２
７から投機指示バス２２を通じて投機処理の開始とその
投機命令アドレスが送られてくると（Ｓ１）、投機指示
処理回路４９によって当該投機命令アドレスで連想表３
０の連想キー部３３が検索される（Ｓ２）。当該投機命
令アドレスを連想キー部３３に持つエントリが存在しな
かった場合（Ｓ３でＮＯ）、入れ替え候補決定回路４５
は、巡回部連想メモリ３２のエントリのうち最も長い間
参照されていないエントリ６２を書き潰すエントリに決
定し（Ｓ４）、当該エントリが初期化される（Ｓ５）。
つまり、入れ替え候補決定回路４５によって今回の投機
命令アドレスが当該エントリ６２の連想キー部３３に登
録され、付加情報更新回路４６によって付加情報部３６
が初期化され、投機確率データ更新回路４３によって当
該エントリ６２の投機確率データ部３５における出現回
数３８に値「１」、失敗回数３９に値「０」、失敗率４
０に値「０」がそれぞれ登録される。そして、入れ替え
候補決定回路４５によって当該エントリ６２の順序／Ｌ
ＲＵ情報部３５のＬＲＵ情報が更新される（Ｓ８）。

【００５０】他方、当該投機命令アドレスを連想キー部
３３に持つエントリが既に存在していた場合（Ｓ３でＹ
ＥＳ）、投機確率データ更新回路４３は、当該エントリ
の投機確率データ部３４における出現回数３８を＋１す
る（Ｓ６）。次に、当該エントリが巡回部連想メモリ３
２のエントリであった場合（Ｓ７でＹＥＳ）、入れ替え
候補決定回路４５により当該エントリの順序／ＬＲＵ情
報部３５のＬＲＵ情報を更新する（Ｓ８）。

【００５１】その後、当該エントリに登録された投機命
令アドレスを伴う付加情報が付加情報バス２３を通じて
ＭＰＵ演算実行部２０のデータ採取手段２７から送られ
てくる毎に、付加情報更新回路４６は、当該投機命令ア
ドレスを持つエントリの付加情報部３６における現累積
値に今回の付加情報を累積する処理を行う。

【００５２】次に、ＭＰＵ演算実行部２０のデータ採取
手段２７から投機指示バス２２を通じて投機処理の終了
とその投機命令アドレス及び完了種別が送られてくると
（Ｓ１１）、投機指示処理回路４９によって当該投機命
令アドレスで連想表３０の連想キー部３３が検索される
（Ｓ１２）。当該投機命令アドレスを持つエントリは投
機開始時点で必ず確保されており、そのＬＲＵ情報も更
新されているため、巡回部連想メモリ３２のエントリ数
ｍを或る数以上に設定しておくことで、当該検索は必ず
成功する。次に投機確率データ更新回路４３によって、
完了種別が失敗完了である場合に限って、検索されたエ
ントリの失敗回数３９を＋１した後、失敗率４０を更新
する（Ｓ１３）。以降は、当該エントリが抽出部連想メ
モリ３１のエントリか、巡回部連想メモリ３２のエント
リかで処理が分かれる。

【００５３】抽出部連想メモリ３１のエントリであった
場合（Ｓ１４でＹＥＳ）、入れ替え候補決定回路４５
は、当該エントリの失敗率４０が抽出部連想メモリ３１
における１つ上位のエントリの失敗率４０を超えたか否
かを判定し（Ｓ１５）、超えていれば、１つ上位のエン
トリと当該エントリの順序を入れ替える（Ｓ１６）。

【００５４】巡回部連想メモリ３２のエントリであった
場合（Ｓ１４でＮＯ）、入れ替え候補決定回路４５は、
当該エントリの出現回数３８が抽出部移行限度レジスタ
４４に設定された閾値を超えたか否かを判定し（Ｓ１
７）、超えていなければ、当該エントリのＬＲＵ情報を
更新して（Ｓ１８）、処理を終える。超えていれば、当
該エントリの失敗率４０が抽出部連想メモリ３１の最下
位失敗率を超えたか否かを調べ（Ｓ１９）、超えていな
ければ、当該エントリのＬＲＵ情報を更新して（Ｓ１
８）、処理を終える。最下位失敗率を超えていた場合
は、当該エントリと抽出部連想メモリ３１の最下位失敗
率のエントリとを入れ替え（Ｓ２０）、巡回部連想メモ
リ３２に移行したエントリのＬＲＵ情報を更新し（Ｓ２
１）、処理を終える。

【００５５】また、投機処理が失敗完了した場合、付加
情報更新回路４６は、失敗完了した投機命令アドレスを
持つエントリにおける付加情報部３６の現累積値を全累
積値に加算し、現累積値を０に初期化する。

【００５６】以上のような動作が投機情報収集装置２１
で行われることにより、最終的に、抽出部連想メモリ３
１には失敗率が大きい上位ｎ個の投機命令アドレス、そ
の出現回数、失敗回数、失敗率、付加情報が残ることに
なる。

【００５７】次に、投機情報収集装置２１の抽出部連想
メモリ３１に収集された統計データを利用して性能チュ
ーニングを行う最適化手段２８について説明する。

【００５８】図９に最適化手段２８のシステム運用上の
位置付けと処理の概略を示す。ソースプログラム又はそ
の中間コード２００は、既存のコンパイラ２０１によっ
てコンパイルされ、実行モジュール２０２が生成され
る。このとき、プログラムの字面の解析や更にプロファ
イル２０３を使用した解析によって確実性の高い投機が
予測され、プログラムの最適化が実施される。プロファ
イルベースの最適化技術を記載した文献として例えば特
開平８−２４１１９８号公報（以下、文献５と称す）が
ある。同文献５では、ソースプログラムからプロファイ
ラ用実行形式オブジェクトを生成して仮実行することで
プロファイル２０３を生成し、このプロファイル２０３
を参照してソースプログラムを再コンパイルすることで
最適化を実施する。しかし、このようなプロファイルベ
ースの最適化を行っても常に最適な結果が得られるわけ
ではない。その理由は、実行モジュール２０２を使った
実運用時にはユーザ毎に様々な種類の実データ２０４が
使われるが、プロファイル生成のための仮実行時にその
ような現実的かつバラエティを持ったデータを用意する
ことは困難であり、それ故、生成されるプロファイル２
０３が実運用とは相違するからである。

【００５９】そこで本実施例では、実データ２０４を使
った実行モジュール２０２の実運用時に（２０５）、前
述したように投機情報収集装置２１で投機情報を収集
し、この収集された投機情報に基づいて最適化手段２８
が再びプログラムの最適化を行うことで、各ユーザの実
環境に応じた動的な最適化を実現している。つまり、最
適化手段２８は、投機情報収集装置２１の抽出部連想メ
モリ３１を結果アクセスバス２４および結果アクセス制
御回路４８を通じてアクセスし、失敗率の高い上位ｎ個
の投機事象に関する統計データを取得し（２０６）、こ
の取得した統計データを参照してソース又は中間コード
２００の再コンパイルを行って最適化をやり直した実行
モジュール２０２を生成する。最適化手段２８による最
適化のやり直しは、実行モジュール２０２の実行が終了
する毎に自動的に実施しても良く、ユーザからその旨の
指示が入力された時に実施しても良い。

【００６０】本実施例では、失敗率の高い上位ｎ個の投
機事象に関する統計データが実行モジュール２０２の実
行終了時点で既に得られているため、従来技術のように
最適化時に各投機事象の統計データの中から失敗率の高
い投機事象を選別する処理は不要である。また、順序／
ＬＲＵ情報部３５の順序情報によって失敗率のより高い
ものから順に整列しているため、選別した投機事象を失
敗率の高い順に並べ替える処理も不要である。従って、
たとえば失敗率のより高い投機事象から順に、その失敗
率４０が或る基準値以上であれば最適化をやり直してい
き、失敗率４０が前記基準値未満の投機事象に至った時
点で最適化すべき投機事象の終了と判定するような効率
的な処理も可能である。

【００６１】また、本実施例では、投機失敗毎の付加情
報の累積値が付加情報部３６の全累積値に蓄積されてい
るため、全累積値を失敗回数３９で割ることにより、失
敗１回当たりの無駄なコストを見積もることができる。
このため、失敗率４０が或る基準値以上であるが、投機
やり直しのコストが低い投機事象は性能上問題が少ない
として、再最適化の対象から除外するといった処理を、
付加情報に基づいて実施することが可能である。

【００６２】次に最適化手段２８による再最適化の具体
例を説明する。

【００６３】（１）制御投機の再最適化例えばプロファイル２０３を用いたコンパイラ２０１の
最適化処理によって図２および図３に示した投機実行を
行う実行モジュール２０２が生成されたが、実データ２
０４を用いた実運用時に投機的スレッド生成命令１１の
失敗率が或る基準値以上で且つ投機やり直しのコストも
或る基準値以上であるとの統計データが投機情報収集装
置２１で収集されたとする。この場合、最適化手段２８
は、投機的スレッド生成命令１１の代わりに、スレッド
＃３を生成する投機的スレッド生成命令を用いることに
より、スレッド＃１、＃２の投機実行に代えてスレッド
＃３を投機実行するよう最適化する。

【００６４】（２）データ投機の再最適化例えばプロファイル２０３を用いたコンパイラ２０１の
最適化処理によって図１０の左側に示されるように、ス
レッド＃１のスレッド生成命令２１０で生成されるスレ
ッド＃２で２つの投機的メモリロード命令２１２、２１
３が実行されるように最適化された実行モジュール２０
２が生成されたが、実データ２０４を用いた実運用時に
投機的メモリロード命令２１３の失敗率が或る基準値以
上であるとの統計データが統計情報収集装置２１で収集
されたとする。また、ＭＰＵ演算実行部２０は、ハード
ウェア量を削減するために投機状態にあるスレッド＃２
における各メモリロード時点の実行状態を保存するので
はなく、最初のロードを実行する投機的メモリロード命
令２１２を実行する直前の実行状態のみを保存してお
き、若し、後続の投機的メモリロード命令２１３の投機
に失敗した場合には、最初の投機的メモリロード命令２
１２まで巻き戻し、投機的メモリロード命令２１３直前
までの命令を再実行することで投機的メモリロード命令
２１３の状況に巻き戻す手法を採用しているものとす
る。そうすると、投機的メモリロード命令２１２と投機
的メモリロード命令２１３との間に多くの命令が介在す
る場合、投機的メモリロード命令２１３の失敗完了によ
る投機やり直しコストは大きくなる。

【００６５】この場合、最適化手段２８は、スレッド生
成命令２１０の挿入を取り止め、スレッド＃２で行った
処理をスレッド＃１の後に逐次に行うことで投機実行を
無くす選択も可能であるが、そうするとスレッド＃２の
投機的メモリロード命令２１３以前の処理もスレッド＃
１と並列に実行できず、性能が返って低下する場合があ
る。そこで最適化手段２８は、投機的メモリロード命令
２１２が失敗率の上位ｎ個に入っていなければ、スレッ
ド＃１とスレッド＃２の並列処理が性能向上に寄与して
いると判断し、図１０の右側に示すように、失敗率の高
い投機的メモリロード命令２１３の前にスレッド生成命
令２１４を挿入し、投機的メモリロード命令２１３を新
たに生成されたスレッド＃３の先頭部分に移動するよう
な再最適化を実施する。この再最適化後のプログラムで
も実データ２０４が変わらなければ投機的メモリロード
命令２１３の失敗率は高いままであるが、投機的メモリ
ロード命令２１３がスレッド＃３の最初の投機的メモリ
ロード命令として実行されるため、投機失敗時の巻き戻
し量が減り、結果として性能が向上する。

【００６６】なお、次以降の実運用において投機的メモ
リロード命令２１３が高い失敗率として検出された場
合、巻き戻し量が少ないことから再最適化対象から除外
されるか、同じような再最適化が繰り返される。このよ
うな同じ再最適化の繰り返しを防止するには、コンパイ
ラ２０１及び最適化手段２８がどの箇所にどのような理
由でどのような最適化を実施したかをデータベースに記
録しておき、再最適化時に既に対策済か否かを調べるよ
うにすれば良い。

【００６７】以上のように本実施例の投機情報収集装置
２１は、失敗率が大きく且つ統計的な信頼度が基準を満
たす上位ｎ個の投機事象の統計データを記憶する抽出部
連想メモリ３１と、統計的な信頼度が未だ基準を満たさ
ないか或いは上位ｎ個に入らない投機事象の統計データ
を一時的に記憶する巡回部連想メモリ３２とを備え、発
生した投機事象に関するデータをＭＰＵ演算実行部２０
から受け取ったとき、当該投機事象の統計データが抽出
部連想メモリ３１および巡回部連想メモリ３２の何れに
も記憶されていないときは巡回部連想メモリ３２に空き
エントリを確保して当該投機事象の統計データを登録す
る。このように巡回部連想メモリ３２のエントリが異な
る投機事象の統計データ格納用に再利用されるため、投
機事象のの中には巡回部連想メモリ３２に一旦登録され
た後に追い出された結果、失敗回数が正確に計数されな
いものが出てくる。しかし、巡回部連想メモリ３２から
追い出される可能性の高い投機事象は出現回数が基準以
下か或いは実行回数の少ないものが殆どであり、出現回
数が多く且つ失敗率が高い投機事象は巡回部連想メモリ
３２から追い出されることなく抽出部連想メモリ３１へ
と移っていく。この結果、抽出部連想メモリ３１と巡回
部連想メモリ３２のエントリの総数（ｎ＋ｍ）が、投機
事象の数（投機命令の数）より少ない場合であっても、
失敗率が高い上位ｎ個の投機事象の統計データをほぼ確
実に収集することができる。これによって、性能改善に
役立つ統計データを少ないメモリ量で収集することが可
能となる。

【００６８】抽出部連想メモリ３１のエントリ数ｎおよ
び巡回部連想メモリ３２のエントリ数ｍを余り少なくす
ると、メモリ量は削減できるが収集漏れの危険性が高ま
る。このため、ｎ、ｍを最低どの程度の数にすべきかは
予備的な実験によって定めるのが望ましい。

【００６９】エントリ数ｎ、ｍの下限が決まると、メモ
リ量は１エントリ当たりの容量×エントリ数で定まる。
メモリ量をより削減するには、１エントリ当たりの容量
を削減する必要がある。以下では、１エントリ当たりの
容量を、失敗率４０に必要なビット数を削減することで
実現する方法を説明する。

【００７０】今、出現回数３８および失敗回数３９を３
２ビットのデータとして連想表３０に格納するものとす
れば、失敗回数３９を出現回数３８で割って求められる
失敗率４０の取り得る値は、２の−３２乗から、１．０
までの小数値となる。これをそのまま失敗率４０に登録
すると、多くのビット数が必要である。そこで、失敗率
４０は、連想表３０のエントリの入れ替えが大まかに決
定できれば良いこと、値のダイナミックレンジは広いも
のの有効桁数はそれほど必要でないことに着目し、失敗
率４０を図１１に示すような短縮浮動小数フォーマット
で表現し、その仮数部２進表記５１の４ビットを仮数部
５３、その指数部２進表記５２の５ビットを指数部５４
として、合計９ビットで失敗率４０に記録する。これに
より、１エントリ当たりのメモリ量、ひいては連想表３
０全体の容量を削減できる。

【００７１】図１２に、図１１のような短縮浮動小数フ
ォーマットで表現された失敗率４０を計算する方法の一
例を示す。図１２において、式９０は失敗率４０の計算
式であり、各値の表現形式を添字形式で併記してある。
失敗率４０は以下のようにして計算される。

【００７２】図１２の（１）に示されるように、３２ビ
ット符号無し整数で表現された失敗回数の最上位の非零
ビットに続くＬＳＢ側の４ビットを仮数部Ｓ９１とし
て、同じく３２ビット符号無し整数で表現された出現回
数の最上位の非零ビットに続くＬＳＢ側の４ビットを仮
数部Ｔ９３としてそれぞれ抜き出す。同時に、失敗回数
と出現回数の最上位の非零ビットのずれ量を仮り指数部
Ｐとする（９２）。

【００７３】図１２の（２）に示されるように、仮数部
Ｓ、Ｔの除算を行い、結果の仮数部２進表記５１を得
る。Ｐに対しては、仮り指数部Ｐの補正分９４を減算
し、結果の指数部２進表記５２を得る。仮数部の除算９
５は、例えば以下のように２つの小さなテーブルの参照
と加算で高速に実行できる。（ａ）第１のテーブルの参照による上位除算結果Ａの算
出（９６）および第２のテーブルの参照による上位除算
結果Ｂの算出（９７）。ここで、第１のテーブルは９６
の計算用のデータを保持するテーブル、第２のテーブル
は９７の計算用のデータを保持するテーブルである。（ｂ）上記の結果Ａ、Ｂの加算による仮り仮数部Ｒの算
出（９８）。（ｃ）上記の結果Ｒの最上位ビットＲ0 が０の場合は、
仮り指数部Ｐの補正分９４から１を減算する。

【００７４】（第２実施例）ここでも、第１実施例と同
じく、投機実行を行うプロセッサの実運用時に、そのプ
ロセッサの処理と並行して性能上問題となる投機の統計
データを収集し、この収集した統計データに基づいて性
能チューニングを行うシステムに本発明を適用した実施
例を取り上げる。第１実施例との相違点は、ＭＰＵ演算
実行部２０が本来有する命令キャッシュを失敗率の格納
用に活用することにより、低コストで、連想表３０の巡
回部連想メモリ３２のエントリ数ｍを等価的に大きくで
きるようにした点にある。

【００７５】図１３に本実施例を適用したプロセッサ２
５の構成例を示す。図４との相違点は、ＭＰＵ演算実行
部２０内に、命令キャッシュ１３０に対する失敗率の登
録などを制御する簡易失敗率更新回路１３１と限度レジ
スタ１３２とを設け、管理失敗率更新回路１３１を転送
バス１３３を通じて投機情報収集装置２１に接続した点
である。投機情報収集装置２１の構成は後述する一部の
機能を除いて図５に示されるものと同じであり、転送バ
ス１３３は投機情報収集装置２１内部では投機確率デー
タ更新回路４３に接続される。

【００７６】図１４を参照すると、命令キャッシュ１３
０は、命令キャッシュデータアレイ１００と命令キャッ
シュタグアレイ１０１とから構成され、命令キャッシュ
タグアレイ１０１の各命令キャッシュライン１０２ｉ〜
１０２ｋ毎に、投機事象の簡易失敗率１０４ｉ〜１０４
ｋを登録する領域を新たに付加してある。第１実施例で
は、新たに発生した投機事象と同じ投機命令アドレスを
持つエントリが連想表３０に存在しなかった場合、巡回
部連想メモリ３２のエントリを直ちに再利用したが、本
実施例では、当該投機命令アドレスで特定される投機命
令をキャッシュしている命令キャッシュライン１０２の
簡易失敗率１０４を当該投機命令が失敗完了した場合に
更新し、簡易失敗率１０４が限度レジスタ１３２に予め
設定された閾値を超えた時点で、巡回部連想メモリ３２
にエントリを確保して統計データを登録する。

【００７７】簡易失敗率更新回路１３１は、同じ命令キ
ャッシュライン１０２に目的とする投機命令とは別の投
機命令がキャッシュされていても、そのラインの簡易失
敗率１０４を更新する。このことを簡易失敗率のエイリ
アスと呼ぶ。図１５に簡易失敗率１０４の遷移を示す。
簡易失敗率１０４は０からＮまでの正の整数値をとり、
当該命令キャッシュライン１０２がリフィルされたと
き、及び当該命令キャッシュライン１０２にキャッシュ
されている何れかの投機命令についてのエントリが巡回
部連想メモリ３２に確保されたときに、簡易失敗率更新
回路１３１によって０にリセットされる。以降、当該命
令キャッシュライン１０２にキャッシュされている投機
命令のアドレスが投機情報収集装置２１から転送バス１
３３を通じて伝達される毎に、つまり、連想表３０に登
録されていない当該キャッシュライン中の投機命令が失
敗完了する毎に＋１される。但し、最大値Ｎになるとそ
れ以上増えない（飽和加算）。

【００７８】次に本実施例の投機情報収集装置２１の全
体的な動作の流れについて、図１６ないし図１８のフロ
ーを参照して、第１の実施例との相違点を中心に以下説
明する。

【００７９】ＭＰＵ演算実行部２０のデータ採取手段２
７から投機指示バス２２を通じて投機処理の開始とその
投機命令アドレスが送られてくると（Ｓ１）、投機指示
処理回路４９によって当該投機命令アドレスで連想表３
０の連想キー部３３が検索され（Ｓ２）、エントリが既
に存在していた場合（Ｓ３でＹＥＳ）、第１実施例と同
様の動作が行われる（Ｓ６〜Ｓ８）。他方、当該投機命
令アドレスを連想キー部３３に持つエントリが存在しな
かった場合（Ｓ３でＮＯ）、第１実施例と異なり、処理
を終了する。

【００８０】その後、投機命令アドレスを伴う付加情報
が付加情報バス２３を通じてＭＰＵ演算実行部２０のデ
ータ採取手段２７から送られてくる毎に、付加情報更新
回路４６は、当該投機命令アドレスを持つエントリの付
加情報部３６における現累積値に今回の付加情報を累積
する処理を行う。但し、当該投機命令アドレスを持つエ
ントリが存在しなければ今回の付加情報は廃棄する。

【００８１】次に、ＭＰＵ演算実行部２０のデータ採取
手段２７から投機指示バス２２を通じて投機処理の終了
とその投機命令アドレス及び完了種別が送られてくると
（Ｓ１１）、投機指示処理回路４９によって当該投機命
令アドレスで連想表３０の連想キー部３３が検索される
（Ｓ１２）。次に投機確率データ更新回路４３は、当該
投機命令アドレスを持つエントリが存在したか否かを判
定し（Ｓ３１）、存在していれば、第１実施例と同様の
動作が実施される（Ｓ１３〜Ｓ２１）。他方、存在して
いなかった場合、投機確率データ更新回路４３は、失敗
完了であったか否かを調べ（Ｓ３２）、失敗完了でなく
成功完了であれば、処理を終了する。

【００８２】失敗完了であった場合、投機確率データ更
新回路４３は、今回の投機命令アドレスを転送バス１３
３を通じて簡易失敗率更新回路１３１に転送する。簡易
失敗率更新回路１３１は、転送された投機命令アドレス
で命令キャッシュ１３０を検索し、その投機命令をキャ
ッシュしている命令キャッシュライン１０２の簡易失敗
率１０４を＋１する（Ｓ３３）。そして、その簡易失敗
率１０４が限度レジスタ１３２に設定された閾値を超え
たか否かを調べ（Ｓ３４）、超えていなければ処理を終
了する。超えていれば、当該簡易失敗率１４０を０に初
期化する（Ｓ３５）。この後、簡易失敗率更新回路１３
１は、当該投機命令アドレスを連想表３０に登録すべき
指示データを転送バス１３３を通じて投機確率データ更
新回路４３に転送する。

【００８３】投機確率データ更新回路４３は、入れ替え
候補決定回路４５によって、巡回部連想メモリ３２のエ
ントリのうち最も長い間参照されていないエントリ６２
を書き潰すエントリに決定させる（Ｓ３６）。そして、
当該エントリを初期化する（Ｓ３７）。つまり、入れ替
え候補決定回路４５によって今回の投機命令アドレスが
当該エントリ６２の連想キー部３３に登録され、付加情
報更新回路４６によって付加情報部３６が初期化され、
投機確率データ更新回路４３によって当該エントリ６２
の投機確率データ部３５における出現回数３８に値
「１」、失敗回数３９に値「１」、失敗率４０に値
「１」がそれぞれ登録される。そして、入れ替え候補決
定回路４５によって当該エントリ６２の順序／ＬＲＵ情
報部３５のＬＲＵ情報が更新される（Ｓ３８）。

【００８４】本実施例では、簡易失敗率のエイリアスが
存在するものの、判断Ｓ３２があるため、投機失敗を起
こさない事象は、エイリアスにより巡回部連想メモリ３
２へ登録されることはない。投機失敗率が低い投機事象
Ａが投機失敗率が高い投機事象Ｂとのエイリアスによ
り、巡回部連想メモリ３２へ登録される可能性はある
が、登録されたとしても投機失敗率が高い投機事象Ｂが
巡回部連想メモリ３２へ登録されない限り簡易失敗率１
０４の更新は続くため、いずれは投機失敗率が高い投機
事象Ｂも巡回部連想メモリ３２へ登録される。そして、
巡回部連想メモリ３２へ移行した投機失敗率の高い投機
事象Ｂは、判断Ｓ３１により簡易失敗率１０４の更新に
寄与することはない。従って、これ以降、投機失敗率が
低い投機事象ＡがＬＲＵアルゴリズムによって巡回部連
想メモリ３２より除去された後は、投機失敗率が低い投
機事象Ａはエイリアスによって巡回部連想メモリ３２に
再度登録されることはない。

【００８５】但し、投機失敗率は低いものの非常に頻繁
に実行される投機事象が、簡易失敗率のエイリアスによ
り巡回部連想メモリ３２のエントリに登録されると、該
エントリはＬＲＵアルゴリズムにより掃き出し対象には
選ばれず残留するため、巡回部連想メモリ３２の利用率
を下げてしまう。これを防止するには、巡回部連想メモ
リ３２のエントリの中に、出現回数３８が抽出部移行限
度レジスタ４４の値を超え、なおかつ、失敗率４０が抽
出部末端エントリ６０の失敗率４０の一定比率に満たな
いエントリがあれば、当該エントリを、最も長い間更新
されていないエントリ（巡回部末端エントリ６２）とし
て登録する機能を、入れ替え候補決定回路４５に設けれ
ば良い。

【００８６】第１実施例においては巡回部連想メモリ３
２のエントリ数ｍを小さく設定すると、同一の投機命令
Ａが再び実行される前に、別な投機命令が次々に実行さ
れた場合、当該投機命令Ａが再び実行された時点では既
に当該投機命令Ａが巡回部連想メモリ３２より掃き出さ
れてしまう可能性がある。こうなると、当該投機命令Ａ
の統計データはいつまでたっても初期値付近に留まり、
統計データの収集が困難になる。これを改善するには、
巡回部連想メモリ３２のエントリ数ｍを大きくすること
であるが、連想表３０のエントリ数の増大はハードウェ
ア的にコストが大きい。第２の実施例によれば、ＭＰＵ
演算実行部２０が本来有する命令キャッシュ１３０を一
部拡張するだけで巡回部連想メモリ３２のエントリ数を
等価的に増大でき、コストの上昇を抑えることが可能で
ある。

【００８７】以上本発明について幾つかの実施例を挙げ
て説明したが、本発明は以上の実施例にのみ限定され
ず、その他各種の付加変更が可能である。以下ではその
変形例について説明する。

【００８８】前記各実施例では、連想表３０にフルアソ
シアティブ方式を用いる方式を説明したが、連想表３０
には、通常のキャッシュと同様に、セットアソシアティ
ブ方式やダイレクトマップ方式を用いることが可能であ
る。

【００８９】前記各実施例では、巡回部連想メモリ３２
の入れ替えに、ＬＲＵを用いる方法について説明した
が、巡回部連想メモリ３２の入れ替えには、通常のキャ
ッシュと同様に、疑似ＬＲＵ、ＦＩＦＯ順序、ランダム
リプレースを用いることが可能である。

【００９０】前記各実施例では、巡回部連想メモリ３２
のエントリが抽出部連想メモリ３１の末端エントリと比
較される前提条件として、出現回数３８が抽出部移行限
度レジスタ４４の値を超えている条件を設定したが、こ
の条件を省略して、常に巡回部連想メモリ３２のエント
リを抽出部連想メモリ３１の末端エントリと比較する実
現法も可能である。また、出現回数３８が抽出部移行限
度レジスタ４４の値を超えているという条件に代えて、
失敗回数３９が或る値を超えているという条件を前提条
件にしても良い。更に付加情報４１で判明する巻き戻し
に要するコストも加味するようにしても良い。

【００９１】前記各実施例では、抽出部連想メモリ３１
のエントリ間の入れ替えを、失敗率４０の比較のみで行
う例を示したが、投機事象の性能への影響としては、失
敗率４０に付加情報４１で判明する巻き戻しに要するコ
ストも加味した方が有効性が高まるため、例えば、付加
情報４１の全累積値を失敗回数３９で割って得た失敗１
回当たりのコストに失敗率を乗じた値を比較するように
しても良い。

【００９２】前記第１実施例において、連想表３０から
巡回部連想メモリ３２を削除し、前記第２実施例で使っ
た命令キャッシュ１３０へ簡易失敗率を登録する機構
を、巡回部連想メモリ３２の代わりに用いることも可能
である。この場合の処理は以下のようになる。先ず、Ｍ
ＰＵ演算実行部２０のデータ採取手段２７から投機指示
バス２２を通じて投機処理の開始とその投機命令アドレ
スが送られてきたときの動作は、第２実施例における図
１６と同様の動作となる。他方、ＭＰＵ演算実行部２０
のデータ採取手段２７から投機指示バス２２を通じて投
機処理の終了とその投機命令アドレス及び完了種別が送
られてきた場合は、図１９に示されるような動作が行わ
れる。

【００９３】先ず、投機指示処理回路４９によって当該
投機命令アドレスで連想表３０の連想キー部３３が検索
され（Ｓ１２）、次に投機確率データ更新回路４３によ
って、当該投機命令アドレスを持つエントリが存在した
か否かが判定される（Ｓ３１）。存在していれば、第１
実施例と同様に当該エントリの失敗回数３９、失敗率４
０を更新する（Ｓ１３）。次に、当該エントリの失敗率
４０が抽出部連想メモリ３１の１つ上位の失敗率を超え
たか否かを調べ（Ｓ１５）、超えていればエントリの入
れ替えを行う（Ｓ１６）。他方、当該投機命令アドレス
を持つエントリが存在していなかった場合（Ｓ３１でＮ
Ｏ）、投機確率データ更新回路４３により失敗完了であ
ったか否かを調べ（Ｓ３２）、失敗完了でなく成功完了
であれば、処理を終了する。失敗完了であった場合は、
投機確率データ更新回路４３により今回の投機命令アド
レスを転送バス１３３を通じて簡易失敗率更新回路１３
１に転送する。簡易失敗率更新回路１３１は、転送され
た投機命令アドレスで命令キャッシュ１３０を検索し、
その投機命令をキャッシュしている命令キャッシュライ
ン１０２の簡易失敗率１０４を＋１する（Ｓ３３）。そ
して、その簡易失敗率１０４が限度レジスタ１３２に設
定された閾値を超えたか否かを調べ（Ｓ３４）、超えて
いなければ処理を終了する。超えていれば、当該簡易失
敗率１４０を０に初期化する（Ｓ３５）。この後、簡易
失敗率更新回路１３１は、当該投機命令アドレスを連想
表３０に登録すべき旨の指示データを転送バス１３３を
通じて投機確率データ更新回路４３に転送する。投機確
率データ更新回路４３は、入れ替え候補決定回路４５に
よって、抽出部連想メモリ３１の末端エントリ６０を書
き潰すエントリに決定し、当該エントリを初期化する
（Ｓ４２）。つまり、入れ替え候補決定回路４５によっ
て今回の投機命令アドレスが当該エントリ６０の連想キ
ー部３３に登録され、付加情報更新回路４６によって付
加情報部３６が初期化され、投機確率データ更新回路４
３によって当該エントリ６０の投機確率データ部３５に
おける出現回数３８に値「１」、失敗回数３９に値
「１」、失敗率４０に値「１」がそれぞれ登録される。

【００９４】前記第１実施例において、連想表３０へ登
録する投機事象を事前に絞り込むようにして、連想表３
０から巡回部連想メモリ３２を削除することも可能であ
る。連想表３０へ登録する投機事象を事前に絞り込む方
法としては、ハードウェア的な方法が利用できる他、失
敗率が高いと事前に予想される投機命令だけにプレフィ
ックス命令で採取の対象であることをプログラム上明示
するソフトウェア的な方法も利用できる。この場合、限
定された投機事象のデータだけがデータ採取手段２７か
ら投機情報収集装置２１に出力されることになる。処理
は以下のようになる。先ず、ＭＰＵ演算実行部２０のデ
ータ採取手段２７から投機指示バス２２を通じて投機処
理の開始とその投機命令アドレスが送られてきたときの
動作は、第２実施例における図１６と同様の動作とな
る。他方、ＭＰＵ演算実行部２０のデータ採取手段２７
から投機指示バス２２を通じて投機処理の終了とその投
機命令アドレス及び完了種別が送られてきた場合は、図
２０に示されるような動作が行われる。第１９図と相違
し、失敗完了であった場合に、抽出部連想メモリ３１の
末端エントリ６０を書き潰すエントリに決定し、当該エ
ントリを初期化する（Ｓ４２）。つまり、入れ替え候補
決定回路４５によって今回の投機命令アドレスが当該エ
ントリ６０の連想キー部３３に登録され、付加情報更新
回路４６によって付加情報部３６が初期化され、投機確
率データ更新回路４３によって当該エントリ６０の投機
確率データ部３５における出現回数３８に値「１」、失
敗回数３９に値「１」、失敗率４０に値「１」がそれぞ
れ登録される。この実施例では収集精度が極端に低下す
るが、失敗率が１００％に近い投機事象の幾つかだけを
検出するには充分役立つ。

【００９５】以上の実施例は、投機実行を行うプロセッ
サの実運用時に、そのプロセッサの処理と並行して性能
上問題となる投機の統計データを収集し、この収集した
統計データに基づいて性能チューニングを行うシステム
に本発明を適用した。それ以外に、キャッシュミス率の
高いメモリ領域の統計データを収集し、この収集した統
計データに基づいて性能チューニングを行うシステムな
ど、その他各種の統計データの収集、性能チューニング
に本発明は適用可能である。

【００９６】

【発明の効果】以上説明したように本発明によれば、キ
ャッシュミス率の高いメモリ領域や失敗確率の高い投機
命令などの性能改善に役立つ統計データを、実データを
使用した実運用時に、迅速かつ低コストで求めることが
できる。また収集した統計データに基づく動的な最適化
のやり直しが可能となる。

【図面の簡単な説明】

【図１】投機実行を説明するためのプログラムの制御フ
ロー図である。

【図２】投機が成功する場合の動作例を示す図である。

【図３】投機が失敗する場合の動作例を示す図である。

【図４】本発明を適用したプロセッサの第一の実施例を
示すブロック図である。

【図５】投機情報収集装置の一実施例の内部構成を示す
ブロック図である。

【図６】連想表を構成する抽出部連想メモリおよび巡回
部連想メモリにおけるエントリの整列方法の説明図であ
る。

【図７】第一の実施例の投機命令実行開始時点における
投機情報収集装置の動作例を示すフロー図である。

【図８】第一の実施例の投機命令実行終了時点における
投機情報収集装置の動作例を示すフロー図である。

【図９】最適化手段のシステム運用上の位置付けと処理
の概略を示す図である。

【図１０】再最適化の一例の説明図である。

【図１１】失敗率を表現する短縮浮動小数フォーマット
を示す図である。

【図１２】失敗率の計算方法の一例を示す図である。

【図１３】本発明を適用したプロセッサの他の例を示す
ブロック図である。

【図１４】簡易失敗率を格納するように拡張された命令
キャッシュの構成図である。

【図１５】簡易失敗率の遷移の説明図である。

【図１６】第二の実施例の投機命令実行開始時点におけ
る投機情報収集装置の動作例を示すフロー図である。

【図１７】第二の実施例の投機命令実行終了時点におけ
る投機情報収集装置の動作例を示すフロー図である。

【図１８】第二の実施例の投機命令実行終了時点におけ
る投機情報収集装置の動作例を示すフロー図である。

【図１９】投機命令実行終了時点における投機情報収集
装置の別の動作例を示すフロー図である。

【図２０】投機命令実行終了時点における投機情報収集
装置の更に別の動作例を示すフロー図である。

【図２１】プロセッサの各種状態をハードウェア的に採
取するサンプリング機構の一例を示すブロック図であ
る。

【符号の説明】

２０…ＭＰＵ演算実行部２１…投機情報収集装置２２…投機指示バス２３…付加情報バス２４…結果アクセスバス２５…プロセッサ２６…比較結果線２７…データ採取手段２８…最適化手段３０…連想表３１…抽出部連想メモリ３２…巡回部連想メモリ３３…連想キー部３４…投機確率データ部３５…順序／ＬＲＵ情報部３６…付加情報部３８…出現回数３９…失敗回数４０…失敗率４１…付加情報４２…投機命令アドレス線４３…投機確率データ更新回路４４…抽出部移行限度レジスタ４５…入れ替え候補決定回路４６…付加情報更新回路４７…結果アクセス線４８…結果アクセス制御回路４９…投機指示処理回路５０…連想キー更新指示線

Claims

【特許請求の範囲】

【請求項１】プロセッサで発生した事象の統計データ
を収集する装置において、事象の統計データのうちプロセッサの性能低下に及ぼす
影響が大きい上位一定数の事象の統計データを記憶する
抽出部メモリと、実運用時に発生した事象に関するデータをプロセッサか
ら受け取り、現在までに計算された事象の統計データの
うちプロセッサの性能低下に及ぼす影響が大きい上位一
定数の事象の統計データが前記抽出部メモリに残るよう
に事象の統計データの更新及び事象の統計データの入れ
替えを行う制御手段とを含むことを特徴とするプロセッ
サ性能データ収集装置。
【請求項２】プロセッサで発生した事象の統計データ
を収集する装置において、プロセッサの性能低下に及ぼす影響が大きく且つ統計的
な信頼度が基準を満たす上位一定数の事象の統計データ
を記憶する抽出部メモリと、統計的な信頼度が未だ基準を満たさないか或いは前記上
位一定数に入らない事象の統計データを一時的に記憶す
る巡回部メモリと、実運用時に発生した事象に関するデータをプロセッサか
ら受け取り、現在までに計算された事象の統計データの
うちプロセッサの性能低下に及ぼす影響が大きい上位一
定数の事象の統計データが前記抽出部メモリに残るよう
に、事象の統計データの更新、前記巡回部メモリと前記
抽出部メモリ間での事象の統計データの入れ替え及び前
記抽出部メモリの事象の統計データの入れ替えを行う制
御手段とを含むことを特徴とするプロセッサ性能データ
収集装置。
【請求項３】前記制御手段は、前記プロセッサから受
け取った事象の統計データが前記抽出部メモリ及び前記
巡回部メモリの何れにも記憶されていないときは前記巡
回部メモリに空きエントリを確保して当該事象の統計デ
ータを登録し、前記巡回部メモリに記憶されているとき
は該記憶されている事象の統計データを更新すると共に
必要に応じて前記巡回部メモリと前記抽出部メモリとの
間で事象の統計データの入れ替えを行い、前記抽出部メ
モリに記憶されているときは該記憶されている事象の統
計データを更新することを特徴とする請求項２記載のプ
ロセッサ性能データ収集装置。
【請求項４】プロセッサで発生した事象の統計データ
を収集する装置において、プロセッサの性能低下に及ぼす影響が大きく且つ統計的
な信頼度が基準を満たす上位一定数の事象の統計データ
を記憶する抽出部メモリと、統計的な信頼度が未だ基準を満たさないか或いは前記上
位一定数に入らない事象の統計データを一時的に記憶す
る巡回部メモリと、前記巡回部メモリへの登録事象を絞り込むために前記抽
出部メモリおよび前記巡回部メモリの何れにも登録され
ていない事象にかかる簡易統計データを保持する、前記
プロセッサにおける命令キャッシュの各キャッシュライ
ン毎の領域と、実運用時に発生した事象に関するデータをプロセッサか
ら受け取り、現在までに計算された事象の統計データの
うちプロセッサの性能低下に及ぼす影響が大きい上位一
定数の事象の統計データが前記抽出部メモリに残るよう
に、事象の統計データの更新、前記巡回部メモリと前記
抽出部メモリ間での事象の統計データの入れ替え及び前
記抽出部メモリの事象の統計データの入れ替え並びに前
記簡易統計データの更新を行う制御手段とを含むことを
特徴とするプロセッサ性能データ収集装置。
【請求項５】前記制御手段は、前記プロセッサから受
け取った事象の統計データが前記抽出部メモリ及び前記
巡回部メモリの何れにも記憶されていないときは当該事
象にかかる命令を保持するキャッシュラインの簡易統計
データを更新すると共に更新後の簡易統計データが一定
の基準を満足したときに前記巡回部メモリに空きエント
リを確保して当該事象の統計データを登録し、前記巡回
部メモリに記憶されているときは該記憶されている事象
の統計データを更新すると共に必要に応じて前記巡回部
メモリと前記抽出部メモリとの間で事象の統計データの
入れ替えを行い、前記抽出部メモリに記憶されていると
きは該記憶されている事象の統計データを更新すること
を特徴とする請求項４記載のプロセッサ性能データ収集
装置。
【請求項６】前記抽出部メモリおよび前記巡回部メモ
リが、事象の種類で検索可能な連想メモリで構成された
ことを特徴とする請求項２、３、４または５記載のプロ
セッサ性能データ収集装置。
【請求項７】プロセッサで発生した事象の統計データ
を収集する装置において、プロセッサの性能低下に及ぼす影響が大きく且つ統計的
な信頼度が基準を満たす上位一定数の事象の統計データ
を記憶する抽出部メモリと、前記抽出部メモリへの登録事象を絞り込むために前記抽
出部メモリに登録されていない事象にかかる簡易統計デ
ータを保持する、前記プロセッサにおける命令キャッシ
ュの各キャッシュライン毎の領域と、実運用時に発生した事象に関するデータをプロセッサか
ら受け取り、現在までに計算された事象の統計データの
うちプロセッサの性能低下に及ぼす影響が大きい上位一
定数の事象の統計データが前記抽出部メモリに残るよう
に、事象の統計データの更新、前記抽出部メモリの事象
の統計データの入れ替え並びに前記簡易統計データの更
新を行う制御手段とを含むことを特徴とするプロセッサ
性能データ収集装置。
【請求項８】前記制御手段は、前記プロセッサから受
け取った事象の統計データが前記抽出部メモリに記憶さ
れていないときは当該事象にかかる命令を保持するキャ
ッシュラインの簡易統計データを更新すると共に更新後
の簡易統計データが一定の基準を満足したときに前記抽
出部メモリに空きエントリを確保して当該事象の統計デ
ータを登録し、前記抽出部メモリに記憶されているとき
は該記憶されている事象の統計データを更新することを
特徴とする請求項７記載のプロセッサ性能データ収集装
置。
【請求項９】前記抽出部メモリが、事象の種類で検索
可能な連想メモリで構成されたことを特徴とする請求項
７または８記載のプロセッサ性能データ収集装置。
【請求項１０】前記抽出部メモリの事象の統計データ
をプロセッサの性能低下に及ぼす影響が大きい順に整列
させるようにしたことを特徴とする請求項６または９記
載のプロセッサ性能データ収集装置。
【請求項１１】前記事象の統計データは、事象の出現
回数、事象の失敗回数及び失敗率を含むことを特徴とす
る請求項１０記載のプロセッサ性能データ収集装置。
【請求項１２】前記事象の統計データは、更に、失敗
した事象の巻き戻しに要するコストを示す付加情報を含
むことを特徴とする請求項１１記載のプロセッサ性能デ
ータ収集装置。
【請求項１３】前記プロセッサは投機実行可能なプロ
セッサであり、前記事象が投機事象である請求項１１ま
たは１２記載のプロセッサ性能データ収集装置。
【請求項１４】請求項１乃至１３の何れかに記載のプ
ロセッサ性能データ収集装置によってプログラムの実運
用時に収集された事象の統計データに基づき、プログラ
ムの再コンパイル時に最適化し直すようにしたことを特
徴とするプロセッサ性能データ収集装置を利用した最適
化方法。
【請求項１５】投機実行可能なプロセッサから収集さ
れた投機実行の統計データに基づき実行投機の最適化を
行う請求項１４記載のプロセッサ性能データ収集装置を
利用した最適化方法。