JP3609603B2 - マルチスレッド・プロセッサ内でパフォーマンスを監視する方法およびシステム - Google Patents

マルチスレッド・プロセッサ内でパフォーマンスを監視する方法およびシステム Download PDF

Info

Publication number
JP3609603B2
JP3609603B2 JP04919098A JP4919098A JP3609603B2 JP 3609603 B2 JP3609603 B2 JP 3609603B2 JP 04919098 A JP04919098 A JP 04919098A JP 4919098 A JP4919098 A JP 4919098A JP 3609603 B2 JP3609603 B2 JP 3609603B2
Authority
JP
Japan
Prior art keywords
thread
response
event occurrence
event
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP04919098A
Other languages
English (en)
Other versions
JPH10275100A (ja
Inventor
トロイ・デール・ラーセン
ジャック・クリス・ランドルフ
アンドリュー・ヘンリー・ウォトレング
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH10275100A publication Critical patent/JPH10275100A/ja
Application granted granted Critical
Publication of JP3609603B2 publication Critical patent/JP3609603B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/86Event-based monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/88Monitoring involving counting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/885Monitoring specific for caches

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、一般にデータ処理、特にデータ処理システム内でパフォーマンスを監視する方法に関する。さらに詳細には、本発明は、マルチスレッド・プロセッサ内でパフォーマンスをスレッド単位で監視する方法に関する。
【0002】
【従来の技術】
プロセッサから最適なパフォーマンスを引き出すために、ハードウェアおよびソフトウェア・エンジニアは、プロセッサの動的挙動を検出し、分析する。過去には、そのようなプロセッサ分析において有用なプロセッサ状態のほとんどは、外部装置からアクセスすることができた。例えば、低い集積レベルでは、大部分の機械状態、バス・トランザクション、および他の有用な信号が、モジュール相互接続、エッジ・コネクタ、およびチップ・バックプレーン上で検出することができた。したがって、プロセッサ・パフォーマンス分析に使用するためにデータを容易に収集し、事後に処理することができた。
【0003】
しかしながら、集積レベルが高まり、それによりプロセッサ状態が外部装置からアクセスすることができなくなるにつれて、ハードウェアならびにソフトウェアを最適化するために必要な実験データを収集するためにプロセッサ内にパフォーマンス監視回路を組み込むことが必要になってきた。オンボード・パフォーマンス・モニタは、一般に、プロセッサ・サイクル、実行された命令、キャッシュ・ミスなど、プロセッサ・パフォーマンスを示す選択されたイベントのオカレンスをそれぞれカウントする1つまたは複数のカウンタを含んでいる。現在入手できるパフォーマンス・モニタは、従来のプロセッサの動的挙動を分析するのに十分なデータを提供することができるが、単一のカウンタを使用して、選択されたイベントのすべてのオカレンスを記録する従来のパフォーマンス・モニタは、複数の並行スレッドにハードウェア・サポートを提供するマルチスレッド・プロセッサに十分なパフォーマンス・データを提供することができない。例えば、従来のパフォーマンス・モニタは、各スレッドに起因するキャッシュ・ミスの数、または有意義な数のサイクルにわたって各スレッドによって使用されるプロセッサ・サイクルの数を示す情報を提供することができない。
【0004】
したがって、プロセッサ内の複数の各スレッドを独立して監視するハードウェア・パフォーマンス・モニタを含むマルチスレッド・プロセッサを提供することが望ましい。
【0005】
【発明が解決しようとする課題】
したがって、本発明の一目的は、改善されたデータ処理の方法およびシステムを提供することである。
【0006】
本発明の他の目的は、データ処理システム内でパフォーマンスを監視する改善された方法およびシステムを提供することである。
【0007】
本発明の他の目的は、マルチスレッド・プロセッサ内でパフォーマンスをスレッド単位で監視する方法およびシステムを提供することである。
【0008】
【課題を解決するための手段】
上記の目的は、以下で説明するようにして達成される。マルチスレッド・プロセッサ内でパフォーマンスを監視する方法およびシステムが提供される。このシステムは、第1のスレッド内の命令および第2のスレッド内の命令に応答するプロセッサと、第1のスレッドに応答してプロセッサによって生成された第1のイベント、および第2のスレッドに応答してプロセッサによって生成された第2のイベントを別々に記録するパフォーマンス・モニタとを含んでいる。一実施形態では、プロセッサは、第1の動作モードおよび第2の動作モードを含んでいる。この実施形態では、パフォーマンス・モニタが第1のモードで動作しているとき、パフォーマンス・モニタ内の第1のカウンタは、第1のイベントの各オカレンスに応答して増分し、パフォーマンス・モニタ内の第2のカウンタは、第2のイベントの各オカレンスに応答して増分する。あるいは、パフォーマンス・モニタが第2のモードで動作しているとき、第1のカウンタは、第1のイベントの各オカレンスおよび第2のイベントの各オカレンスに応答して増分する。
【0009】
【発明の実施の形態】
次に、図面、特に図1を参照すると、首記の請求の範囲に記載されている本発明によるデータ処理システムの例示的な実施形態のブロック図が示されている。記載の例示的な実施形態では、データ処理回路ならびにオンボード・パフォーマンス・モニタ50を含んでいるプロセッサ10は、単一の集積回路スーパスカラ・マイクロプロセッサを含んでいる。したがって、以下で詳細に論じるように、様々な実行ユニット、レジスタ、バッファ、メモリ、およびプロセッサ10の他の機能ユニットはすべて集積回路によって形成される。プロセッサ10は、インターナショナル・ビジネス・マシーンズ・コーポレイションから市販されている縮小命令セット・コンピューティング(RISC)プロセッサのラインの1つを含んでいることが好ましい。ただし、他の適切なプロセッサを代わりに使用して、本発明を実施することができることが当業者には以下の説明から理解できよう。
【0010】
図1に示すように、プロセッサ10は、バス・インタフェース・ユニット(BIU)12を介してシステム・バス11に結合される。バス・インタフェース・ユニット12は、バス・アービトレーションに関与することによって、プロセッサ10と、システム・バス11に結合された主メモリ52および不揮発性大容量記憶装置54など、他のデバイスとの間の情報の転送を制御する。図1に示すデータ処理システムは、システム・バス11に結合された図示されていない他のデバイスを含んでいることが好ましい。これらは、以下の説明の理解にとって不要であり、したがって説明を簡潔にするために省略する。
【0011】
BIU12は、メモリ管理ユニット14(MMU)に接続される。メモリ管理ユニット14は、プロセッサ10のメモリ階層の様々な構成要素内に記憶されたデータおよび命令へのプロセッサ10によるアクセスを管理する。例示的な実施形態では、プロセッサ10のメモリ階層は、不揮発性大容量記憶装置54および主メモリ52だけでなく、統一レベル2(L2)キャッシュ56を含んでいる。L2キャッシュ56には、L2キャッシュ・インタフェース58、レベル1(L1)命令キャッシュ14、およびL1データ・キャッシュ16を介してアクセスする。したがって、MMU14の管理機能には、例えば、トランスレーション・ルックアサイド・バッファ(TLB、変換索引緩衝機構)13を使用して、論理対実アドレス変換を実施すること、記憶制御(SC)回路23を使用して、L1データ・キャッシュ16およびL2キャッシュ56内のデータにアクセスすること、ライン・バッファ(LB)15とBIU12の間でデータのラインを転送することが含まれる。当業者なら理解できるように、速度が徐々に高くなるメモリ内でデータおよび命令をこのような形でステージングすることにより、プロセッサ10は、より高いレベルのメモリ階層内に記憶されたデータに比較的速いアクセスを行うことができ、したがってデータ処理システムの全体的なパフォーマンスが向上する。
【0012】
L1命令キャッシュ14はさらに、順次バッファ17、スレッド・スイッチ・バッファ18、分岐バッファ19、および分岐ユニット20に結合される。これらは、ディスパッチ・ユニット21とともに、プロセッサ10の命令ユニット(IU)論理パーティション25を形成する。IU25は、プロセッサ10の浮動小数点(FP)論理パーティション26および固定小数点(FX)論理パーティション30内の複数の可能な並行ハードウェア・スレッドのうちの1つの実行を制御する。本発明の開示では、「ハードウェア・スレッド」または単に「スレッド」なる語は、その状態がプロセッサ・ハードウェア内で他の1つまたは複数のハードウェア・スレッドのそれと同時に維持され、かつその実行がプロセッサ・ハードウェアによって支配される(他の並行スレッドと同じプログラムに属することもあり、属しないこともある)命令のグループを表すために使用する。したがって、プロセッサ10によってサポートされる密マルチスレッディングは、多数の現況技術のオペレーティング・システムによってサポートされるソフトウェア管理マルチタスキングと異なることが当業者には明らかであろう。さらに、以下では、プロセッサ10については、2つの並行スレッド(すなわち、活動スレッドと非活動スレッド)のみをサポートするものとして説明するが、本発明は、追加の活動スレッドおよび非活動スレッドをサポートするマルチスレッド・プロセッサにも同じく適用できることを理解されたい。
【0013】
動作に際して、順次バッファ17は、命令をL1命令キャッシュ14から活動スレッド内にフェッチし、それらの命令を一時的にバッファする。順次バッファ17は、フェッチした命令を受け取った順にディスパッチ・ユニット21に送る。ディスパッチ・ユニット21は、各命令を一部復号し、その後分岐命令を分岐処理ユニット(BPU)20に送り、順次命令を実行のためにFP26およびFX30のうちの適切な1つに送る。分岐命令の受取りに応答して、分岐ユニット20は、分岐がとられた場合に実行が続行されるターゲット・アドレスを決定し、ターゲット・アドレスをL1命令キャッシュ14に供給する。順次実行パス内の命令をまだ順次バッファ17に供給している間に、L1命令キャッシュ14は、ターゲット・アドレスに応答して、ターゲット実行パス内の命令を分岐バッファ19にロードする。その結果、分岐がその後とられるものと決定された場合、分岐バッファ19は、ターゲット実行パス内の命令を待ち時間なしでディスパッチ・ユニット21に供給することができる。その後、順次バッファ17は、命令を新しい実行パス内にフェッチし始める。
【0014】
IU25は、同様にしてスレッド・スイッチを実施する。スレッド・スイッチ・バッファ18は、実行すべき次の命令を非活動スレッド内にフェッチし、バッファする。選択されたイベント、例えば、活動スレッドに対するL2キャッシュ・ミスまたはTLBミスのオカレンスに応答して、非活動スレッドが、活動スレッドに指定され、スレッド・スイッチ・バッファ18内の命令が、分岐バッファ19内に転送される。次いで、ディスパッチ・ユニット21は、新たに活動状態になったスレッドからの命令をBPU20、FP26、およびFX30に送達し始める。一方、順次バッファ17は、命令を新たに活動状態になったスレッド内にフェッチし始め、スレッド・スイッチ・バッファ18は、命令を非活動状態になったスレッド内にフェッチし始める。
【0015】
次に、FP26およびFX30を参照すると、分岐ユニット20の他に、プロセッサ10の実行回路は、倍精度浮動小数点ユニット(FPU)27、ロード・ストア・ユニット(LSU)32、単複整数ユニット34、および単整数ユニット36を含んでいる。各実行ユニット27、32、34、および36は、各プロセッサ・サイクル中に関連するタイプの1つまたは複数の順次命令のうちの1つまたは複数の命令を実行することができる。例えば、単整数ユニット36は、固定小数点算術演算(例えば、加算および減算)を実行し、指定された整数レジスタ38からロードされたソース・オペランドを使用して、演算を比較する。固定小数点命令を実行した後、単整数ユニット36は、命令の結果データを1つまたは複数の指定された整数レジスタ38内に記憶する。同様に、倍精度FPU27は、浮動小数点乗算や除算など、倍精度浮動小数点算術演算および論理演算を浮動小数点レジスタ(FPR)28からロードされたソース・オペランドに対して実行し、結果データを指定されたFPR28内に記憶する。プロセッサ10の各順次命令実行ユニットは、パイプラインを使用して、プロセッサ10のスーパスカラ・アーキテクチャのパフォーマンスをさらに向上させる。図示のように、各FPR28および整数レジスタ38は、複数の複製レジスタ・セットまたは「ウェイ」を有する。これらは、プロセッサ10によってサポートされる複数の並行スレッドの各スレッドにそれぞれ関連する。
【0016】
本発明によれば、プロセッサ10は、以下で詳細に説明するように、プロセッサ10によってサポートされる複数の各並行スレッドごとに独立したパフォーマンス監視をサポートするパフォーマンス・モニタ50を含んでいる。図示のように、パフォーマンス・モニタ50は、IU25、FP26、FX30、SC23、BIU12、およびL2キャッシュ・インタフェース58の動作によって生成されたイベント・オカレンスを入力として受け取る。パフォーマンス・モニタ50によって受け取られた多数のイベント・オカレンスの中から選択されたイベント・オカレンスが、パフォーマンス・モニタ50内のソフトウェア読取り可能/書込み可能パフォーマンス・モニタ・カウンタ(PMC)内に記録される。PMC「アドレス」を指定するアーキテクチャ定義命令の実行に応答して、パフォーマンス・モニタ50は、例えば、指定されたPMCの値を整数レジスタ38の選択された1つに記憶することによって、指定されたPMCの値を出力する。パフォーマンス・モニタ50はまた、PMCの1つのオーバフローに応答してアサートされるパフォーマンス・モニタ割込み出力を有する。
【0017】
本発明の重要な一態様によれば、パフォーマンス・モニタ50は、次の2つの動作モードを有する。(1)同じイベントのオカレンスがすべて同じスレッドを処理するステップに応答して生成されてもされなくてもオカレンスがすべて一緒に記録されるグローバル・モード、(2)各スレッドに関連するイベントのオカレンスが別々に記録されるマルチスレッド・モード。
【0018】
次に、図2を参照すると、グローバル・モードで動作しているときのパフォーマンス・モニタ50の概念図が示されている。図示のように、グローバル・モードでは、プロセッサ10のすべての論理パーティションによって生成されたイベント・オカレンスが、マルチプレクサ82内に入力される。次いで、マルチプレクサ82は、選択入力86に応答して、イベント・オカレンスをPMC84のうちの特定のカウンタに送る。選択入力86は、ソフトウェア・アクセス可能制御レジスタ80内のビット・フィールドの設定に応答して生成される。制御レジスタ80内のビット・フィールドは、イベント・オカレンス、各PMC84のレコードがあればそれを指定するだけでなく、パフォーマンス・モニタ50が動作するモード(グローバル・モードまたはマルチスレッド・モード)および各PMC84ごとにカウントをいつ可能にし、またいつ不能にするかを指定する。イベント・オカレンスの受取りに応答して、可能になったPMCが増分する。図2に示すように、いずれかのPMC84のビット0が1にセットされた場合、パフォーマンス・モニタ割込みがORゲート88によって生成される。
【0019】
次に、図3を参照すると、マルチスレッド・モードで動作しているときのパフォーマンス・モニタ50の概念図が示されている。図示の例示的な実施形態では、プロセッサ10は、それぞれPMC84の半分に割り振られた最大2つの並行スレッドをサポートする。したがって、参照番号84aによって識別されたPMC1〜PMC4が、スレッド0に割り振られ、参照番号84bによって識別されたPMC5〜PMC8が、スレッド1に割り振られる。図示のように、選択入力86aに応答して、イベント・オカレンスがマルチプレクサ82aによってPMC1〜PMC4に送られ、選択入力86bに応答して、イベント・オカレンスがマルチプレクサ82bによってPMC5〜PMC8に送られる。選択入力86aおよび選択入力86bは、図2に関して上述したようにして制御レジスタ80内のビット・フィールドの値に応答して生成される。
【0020】
パフォーマンス・モニタ50がグローバル・モードで動作している場合とは異なり、パフォーマンス・モニタ50がマルチスレッド・モードで動作している場合は、イベント・オカレンスがすべて同様に処理されるわけではない。そうではなく、イベント・オカレンスは、そのイベント・オカレンスが属するイベント・グループに依存する形で処理される。第1のグループのイベントは、活動スレッドのみに関連するイベントを含んでいる。これらのイベントのオカレンスは、IU25、FX30、およびFP26によって生成され、次のものを含んでいる。
(1)完了した命令
(2)プロセッサ・サイクル
(3)記憶装置待ち時間のサイクル
(4)分岐データ
(5)データ依存度
(6)不整合アクセス
(7)L1命令キャッシュ・ミス・カウント
(8)浮動小数点演算
(9)スレッド・スイッチ・カウント
【0021】
第2のグループのイベントは、活動スレッドまたは非活動スレッドに関連するイベントである。これらのイベントのオカレンスは、SC23によって生成され、次のものを含んでいる。
(1)合計カウント、待ち時間、ミス・タイプなど、L1データ・キャッシュ・ミス・イベント
(2)変換ミス・イベント(例えば、TLBミス・イベント)
(3)L2キャッシュ・ミス・イベント
【0022】
第3の(最後の)グループのイベントは、特定のスレッドに関連しないイベントである。これらのイベントのオカレンスは、BIU12、LB15、またはL2キャッシュ・インタフェース58によって生成され、次のものを含んでいる。
(1)L2キャッシュ・ライン遷移
(2)L2キャッシュ・キャストアウト
(3)L2キャッシュ・スヌープ・カウント
(4)ライン・バッファ使用
(5)システム・バス使用率
(6)システム・バス再試行
【0023】
図3に示すように、第1のイベント・グループ内のイベント・オカレンスは、ANDゲート100および102によって入力として受け取られる。第1のイベント・グループ内のイベント・オカレンスは、スレッド0が活動状態の場合にのみマルチプレクサ82aに入力され、スレッド1が活動状態の場合にのみマルチプレクサ826に入力される。第1のイベント・グループに属するイベント・オカレンスと異なり、第2のグループ内のイベントは、上述のように例示的な実施形態ではMMU14内のSC23によって生成され、イベント・オカレンスに関連するスレッドが活動スレッドであるか、それとも非活動スレッドであるかに関わらず、可能な選択のためにマルチプレクサ82aと2bの適切な一方に送られる。第3のイベント・グループに属するイベント・オカレンスは、可能な選択のためにマルチプレクサ82aと82bの両方に送られる。
【0024】
次に、図4を参照すると、パフォーマンス・モニタ50がイベント・オカレンスを処理する方法をそれぞれグローバル動作モードおよびマルチスレッド動作モードについて要約した論理流れ図が示されている。図示のように、プロセスは、ブロック170から始まり、その後ブロック172に進む。ブロック172では、パフォーマンス・モニタ50がマルチスレッド・モードで動作しているか否か判定する。パフォーマンス・モニタ50がマルチスレッド・モードで動作しているのではなく、グローバル・モードで動作しているとの判定に応答して、プロセスはブロック174に進む。ブロック174では、マルチプレクサ82が選択入力86によって選択されたイベント・オカレンスをPMC84の適切な1つに送る。上述のように、様々なスレッドによって生成された同じイベントのオカレンスは、PMC84内でマージされ、単一のイベント・カウントが各選択されたイベントごとに維持される。
【0025】
再びブロック172を参照すると、パフォーマンス・モニタ50がマルチスレッド・モードで動作しているとの判定に応答して、プロセスはブロック176に進む。ブロック176では、検出されたイベント・オカレンスがIU25、FX30、またはFP26によって生成されたか否か(すなわち、イベント・オカレンスが第1のイベント・グループに属するかどうか)判定する。検出されたイベント・オカレンスがIU25、FX30、またはFP26によって生成された場合、ブロック178で、スレッド0が活動スレッドであるか否かを判定する。スレッド0が活動スレッドである場合、プロセスはブロック180に進む。ブロック180では、イベント・オカレンスが選択された場合、それがPMC1〜PMC4の適切な1つに送られる。しかし、スレッド1が活動スレッドであるとの判定に応答して、プロセスはブロック178からブロック182に進む。ブロック182では、イベント・オカレンスが選択された場合、それがPMC5〜PMC8の適切な1つに送られる。
【0026】
ブロック176に戻ると、検出されたイベント・オカレンスがIU25、FX30、またはFP26によって生成されなかったとの判定に応答して、プロセスはブロック184に進む。ブロック184は、イベント・オカレンスがSC23によって生成されたか否かを判定する。イベント・オカレンスがSC23によって生成された場合、プロセスはブロック184からブロック186に進む。ブロック186で、イベント・オカレンスがスレッド0またはスレッド1を処理するステップに応答して生成されたと判定する。イベント・オカレンスがスレッド0を処理するステップに応答して生成されたとの判定に応答して、プロセスはブロック188に進む。ブロック188では、イベント・オカレンスが選択された場合、イベント・オカレンスがPMC1〜PMC4の1つに送られる。あるいは、イベント・オカレンスがスレッド1を処理するステップに応答して生成されたとのブロック186での判定に応答して、プロセスはブロック190に進む。ブロック190では、イベント・オカレンスが選択された場合、イベント・オカレンスをPMC5〜PMC8の1つに送る。
【0027】
再びブロック184を参照すると、イベント・オカレンスがSC23によって生成されたとの判定に応答して、プロセスはブロック192に進む。ブロック192では、イベント・オカレンスがBIU12、LB15、またはL2キャッシュ・インタフェース58によって生成されたと判定する。この判定に応答して、イベント・オカレンスが選択された場合、イベント・オカレンスがPMC1〜PMC8の適切な1つに送られる。
【0028】
次いで、図5を参照すると、パフォーマンス・モニタ50の割込み挙動を要約した論理流れ図が示されている。図示のように、プロセスは、ブロック130から始まり、その後ブロック132に進む。ブロック132では、パフォーマンス・モニタ50がマルチスレッド・モードで動作しているか否か判定する。ブロック132での判定は、例えば、制御レジスタ80内の所定のビット・フィールドの値を検査することによって行われる。パフォーマンス・モニタ50がマルチスレッド・モードで動作しているのではなく、グローバル・モードで動作しているとの判定に応答して、プロセスはブロック134に進む。ブロック134では、いずれかのPMC1〜PMC8のビット0が値1を有するか否か判定する。いずれかのPMC1〜PMC8のビット0が値1を有していない場合、プロセスはブロック132に戻る。しかし、少なくとも1つのPMC84のビット0が1にセットされているとの判定に応答して、図5のブロック150でパフォーマンス・モニタ割込みが発生される。
【0029】
グローバル・モードとは異なり、パフォーマンス・モニタ50がマルチスレッド・モードで動作している場合は、活動スレッドに関連する割込みのみがソフトウェアに与えられる。したがって、図5のブロック136および138を参照すると、スレッド0が活動状態の場合、PMC84aに関連する割込みのみが与えられる。PMC84bに関連する割込みは、スレッド1が再び活動状態になるまで保管される。あるいは、ブロック140および150に示すように、スレッド1が活動状態の場合、PMC84bに関連する割込みがソフトウェアに与えられ、PMC84aに関連する割込みは、スレッド0が再び活動状態になるまで保管される。図3において、この割込み挙動は、ORゲート104および108およびANDゲート106および110によって実施される。
【0030】
次いで、図6を参照すると、パフォーマンス・モニタ50内のPMC1〜PMC8にアクセスする方法を要約した論理流れ図が示されている。図示のように、プロセスは、LSU32が、読み取るべき特定のPMCを指定する命令をディスパッチ・ユニット21から受け取ったことに応答して、ブロック200から始まる。この命令に応答して、LSU32は、PMC数をパフォーマンス・モニタ50に与える。PMC数は、ブロック202で、パフォーマンス・モニタ50がマルチスレッド・モードで動作しているか、それともグローバル・モードで動作しているかを判定する。ブロック204でパフォーマンス・モニタ50がグローバル・モードで動作しているとの判定に応答して、パフォーマンス・モニタ50は、指定されたPMCの値を整数レジスタ38の指定された1つに出力する。
【0031】
再びブロック202を参照すると、パフォーマンス・モニタ50がマルチスレッド・モードで動作しているとの判定に応答して、プロセスはブロック206に進む。ブロック206では、スレッド0またはスレッド1が活動スレッドであるか否か判定する。スレッド1が活動スレッドである場合、1〜4の有効範囲を有する指定されたPMCアドレスが、ブロック208で、PMC5〜PMC8のそれぞれ1つにマッピングされる。あるいは、スレッド0が活動スレッドである場合、指定されたPMCアドレスは、ブロック210で、各PMC1〜PMC4の対応する1つにアクセスするために使用される。図3に示すように、このPMCアドレス・マッピングは、論理90をアドレス指定することによって実施される。
【0032】
上述のように、本発明は、第1のモードで動作しているときに複数の並行スレッドのパフォーマンスを個々に監視することができるパフォーマンス・モニタを含むマルチスレッド・プロセッサを提供する。さらに、パフォーマンス・モニタは、プロセッサによって生成されたすべてのイベント・オカレンスを集合的に監視する第2のモードで動作するようにソフトウェアによって構成することができる。
【0033】
まとめとして、本発明の構成に関して以下の事項を開示する。
【0034】
(1)第1のスレッド内の命令および第2のスレッド内の命令に応答するプロセッサと、
前記第1のスレッドに応答して前記プロセッサによって生成された第1のイベント・オカレンス、および前記第2のスレッドに応答して前記プロセッサによって生成された第2のイベント・オカレンスを別々に記録するパフォーマンス・モニタとを含む、マルチスレッド・プロセッサ内でパフォーマンスを監視するシステム。
(2)前記プロセッサと前記パフォーマンス・モニタがどちらも単一の半導体基板内に形成されることを特徴とする、上記(1)に記載のシステム。
(3)前記パフォーマンス・モニタが、第1のカウンタおよび第2のカウンタを含み、かつ第1の動作モードを有し、前記パフォーマンス・モニタが前記第1の動作モードで動作しているときに、前記第1のカウンタが前記第1のイベント・オカレンスに応答して増分し、前記第2のカウンタが前記第2のイベント・オカレンスに応答して増分することを特徴とする、上記(1)に記載のシステム。
(4)前記第1のイベント・オカレンスと前記第2のイベント・オカレンスが同じイベントの2つのオカレンスであることを特徴とする、上記(3)に記載のシステム。
(5)前記パフォーマンス・モニタが第2の動作モードを有し、前記パフォーマンス・モニタが前記第2の動作モードで動作しているときに、前記第1のカウンタが前記第1のイベント・オカレンスならびに前記第2のイベント・オカレンスに応答して増分することを特徴とする、上記(3)に記載のシステム。
(6)前記プロセッサが前記第1のスレッドおよび前記第2のスレッドに応答して、複数の様々なイベントのオカレンスを生成し、前記パフォーマンス・モニタが、そのオカレンスが記録される前記複数の様々なイベントのサブセットを選択的に決定する制御装置を含むことを特徴とする、上記(1)に記載のシステム。
(7)前記マルチスレッド・プロセッサが前記第1のスレッドと前記第2のスレッドを一時に1つ実行し、前記第2のスレッド内の少なくとも1つの命令が、前記第1のイベント・オカレンスの生成と、前記第1のスレッドに応答して生成された第3のイベント・オカレンスの生成との間に前記プロセッサによって実行され、前記パフォーマンス・モニタが前記第1のイベント・オカレンスと前記第3のイベント・オカレンスを一緒に記録することを特徴とする、上記(1)に記載のシステム。
(8)前記プロセッサが、前記第1のスレッドが非活動状態である間に前記第1のイベント・オカレンスを生成することを特徴とする、上記(1)に記載のシステム。
(9)前記パフォーマンス・モニタが、イベント・オカレンスを記録する複数のカウンタを含み、前記複数のカウンタの第1のサブセットが前記第1のスレッドに割り振られ、前記複数のカウンタの第2のサブセットが前記第2のスレッドに割り振られ、特定のイベントに対して、前記第1のサブセットに属するカウンタのみが、前記第1のスレッドが活動状態である間に生成された前記特定のイベントのオカレンスに応答して増分することができ、前記第2のサブセットに属するカウンタのみが、前記第2のスレッドが活動状態である間に生成された前記特定のイベントのオカレンスに応答して増分することができることを特徴とする、上記(1)に記載のシステム。
(10)アドレス指定論理をさらに含み、前記第1のスレッドおよび前記第2のスレッドのうちの一方からの読取り要求に応答して、前記アドレス指定論理が、前記カウンタの第1のサブセットおよび前記カウンタの第2のサブセットのうち対応する一方のサブセット中の特定のカウンタに前記読取り要求をマッピングすることを特徴とする、上記(9)に記載のシステム。
(11)割込み発生回路をさらに含み、前記割込み発生回路が、前記第1のスレッドが活動状態であるときにのみ前記第1のサブセット中のカウンタの状態に応答して割込みを発生し、かつ前記第2のスレッドが活動状態であるときにのみ前記第2のサブセット中のカウンタの状態に応答して割込みを発生することを特徴とする、上記(9)に記載のシステム。
(12)マルチスレッド・プロセッサ内で、第1のスレッドおよび第2のスレッドを処理するステップと、
前記第1のスレッドを処理するステップに応答して前記マルチスレッド・プロセッサ内で第1のイベント・オカレンスを生成し、かつ前記第2のスレッドを処理するステップに応答して前記マルチスレッド・プロセッサ内で第2のイベント・オカレンスを生成するステップと、
前記第1のイベント・オカレンスおよび前記第2のイベント・オカレンスを別々に記録するステップとを含む、マルチスレッド・プロセッサ内でパフォーマンスを監視する方法。
(13)前記マルチスレッド・プロセッサが、第1のカウンタおよび第2のカウンタを含むパフォーマンス・モニタを有し、前記パフォーマンス・モニタが第1の動作モードを有し、前記第1のイベント・オカレンスおよび前記第2のイベント・オカレンスを別々に記録する前記ステップが、前記第1のモードで動作している前記パフォーマンス・モニタに応答して実施され、前記記録ステップが、
前記第1のイベント・オカレンスに応答して前記第1のカウンタを増分し、かつ前記第2のイベント・オカレンスに応答して前記第2のカウンタを増分するステップを含むことを特徴とする、上記(12)に記載の方法。
(14)前記第1のイベント・オカレンスと前記第2のイベント・オカレンスが同じイベントの2つのオカレンスであることを特徴とする、上記(13)に記載の方法。
(15)前記パフォーマンス・モニタが第2の動作モードを有し、
前記パフォーマンス・モニタが前記第2のモードで動作するのに応答して、前記第1のイベント・オカレンスならびに前記第2のイベント・オカレンスに応答して前記第1のカウンタを増分するステップをさらに含むことを特徴とする、上記(14)に記載の方法。
(16)前記マルチスレッド・プロセッサが前記第1のスレッドおよび前記第2のスレッドを処理するステップに応答して、複数の様々なイベントのオカレンスを生成し、そのオカレンスが記録される前記複数の様々なイベントのサブセットを選択的に決定するステップをさらに含むことを特徴とする、上記(12)に記載の方法。
(17)前記マルチスレッド・プロセッサが前記第1のスレッドと前記第2のスレッドを一時に1つ実行し、前記第2のスレッド内の少なくとも1つの命令が、前記第1のイベント・オカレンスの生成と、前記第1のスレッドに応答して生成された第3のイベント・オカレンスの生成との間に前記プロセッサによって実行され、この方法が前記第1のイベント・オカレンスと前記第3のイベント・オカレンスを一緒に記録するステップをさらに含むことを特徴とする、上記(12)に記載の方法。
(18)前記第1のイベント・オカレンスを生成する前記ステップが、前記第1のスレッドが非活動状態である間に前記第1のイベント・オカレンスを生成するステップをさらに含むことを特徴とする、上記(12)に記載の方法。
(19)前記マルチスレッド・プロセッサが、イベント・オカレンスを記録する複数のカウンタを含み、前記複数のカウンタの第1のサブセットが前記第1のスレッドに割り振られ、前記複数のカウンタの第2のサブセットが前記第2のスレッドに割り振られ、前記第1のイベント・オカレンスおよび前記第2のイベント・オカレンスが特定のイベントの2つのオカレンスであり、前記第1のイベント・オカレンスおよび前記第2のイベント・オカレンスを別々に記録する前記ステップが、
前記第1のスレッドが活動状態である間に生成された前記特定のイベントのオカレンスに応答して、前記第1のサブセットに属するカウンタを増分するステップと、
前記第2のスレッドが活動状態である間に生成された前記特定のイベントのオカレンスに応答して、前記第2のサブセットに属するカウンタを増分するステップとを含むことを特徴とする、上記(12)に記載の方法。
(20)前記第1のスレッドおよび前記第2のスレッドの1つによる読取り要求に応答して、前記カウンタの第1のサブセットおよび前記カウンタの第2のサブセットのうちの対応する一方のサブセット中の特定のカウンタに前記読取り要求をマッピングするステップをさらに含むことを特徴とする、上記(19)に記載の方法。
(21)前記第1のスレッドが活動状態であるときにのみ前記第1のサブセット中のカウンタの状態に応答して割込みを発生し、かつ前記第2のスレッドが活動状態であるときにのみ前記第2のサブセット中のカウンタの状態に応答して割込みを発生することを特徴とする、上記(19)に記載の方法。
以上
【図面の簡単な説明】
【図1】本発明によるパフォーマンス・モニタを含むデータ処理システムの例示的な実施形態を示す図である。
【図2】グローバル・モードで動作しているときの図1のパフォーマンス・モニタを示す図である。
【図3】マルチスレッド・モードで動作しているときの図1のパフォーマンス・モニタを示す図である。
【図4】パフォーマンス・モニタがグローバル・モードおよびマルチスレッド・モードで動作しているときにイベントがどのようにしてパフォーマンス・モニタ・カウンタへ送られるかを示す論理流れ図である。
【図5】パフォーマンス・モニタがそれぞれグローバル・モードおよびマルチスレッド・モードで動作しているときにパフォーマンス・モニタ割込みがどのようにして発生されるかを示す論理流れ図である。
【図6】パフォーマンス・モニタがグローバル・モードおよびマルチスレッド・モードで動作しているときにパフォーマンス・モニタ・カウンタにどのようにしてアクセスするかを示す論理流れ図である。
【符号の説明】
10 プロセッサ
11 システム・バス
12 バス・インタフェース・ユニット(BIU)
13 トランザクション・ルックアサイド・バッファ
14 L1命令キャッシュ
15 ライン・バッファ
16 L1データ・キャッシュ
17 順次バッファ
18 スレッド・スイッチ・バッファ
19 分岐バッファ
20 分岐処理ユニット(BPU)
21 ディスパッチ・ユニット
23 記憶制御回路
25 命令ユニット(IU)論理パーティション
26 浮動小数点(FP)論理パーティション
27 倍精度浮動小数点ユニット(FPU)
28 浮動小数点レジスタ(FPR)
30 固定小数点(FX)論理パーティション
32 ロード・ストア・ユニット(LSU)
34 単複整数ユニット
36 単整数ユニット
38 整数レジスタ
50 パフォーマンス・モニタ
52 主メモリ
54 不揮発性大容量記憶装置
56 L2キャッシュ
58 L2キャッシュ・インタフェース
82 マルチプレクサ
82a マルチプレクサ
82b マルチプレクサ
84 PMC
86 選択入力
86a 選択入力
86b 選択入力
88 ORゲート
90 論理
100 ANDゲート
102 ANDゲート

Claims (19)

  1. 第1のスレッド内の命令および第2のスレッド内の命令に応答するプロセッサと、
    前記第1のスレッドに応答して前記プロセッサによって生成された第1のイベント・オカレンス、および前記第2のスレッドに応答して前記プロセッサによって生成された第2のイベント・オカレンスを別々に記録するパフォーマンス・モニタとを含み、
    前記第1のイベント・オカレンスと前記第2のイベント・オカレンスが同じイベントの2つのオカレンスであることを特徴とする、マルチスレッド・プロセッサ内でパフォーマンスを監視するシステム。
  2. 前記プロセッサと前記パフォーマンス・モニタがどちらも単一の半導体基板内に形成されることを特徴とする、請求項1に記載のシステム。
  3. 前記パフォーマンス・モニタが、第1のカウンタおよび第2のカウンタを含み、かつ第1の動作モードを有し、前記パフォーマンス・モニタが前記第1の動作モードで動作しているときに、前記第1のカウンタが前記第1のイベント・オカレンスに応答して増分し、前記第2のカウンタが前記第2のイベント・オカレンスに応答して増分することを特徴とする、請求項1に記載のシステム。
  4. 前記パフォーマンス・モニタが第2の動作モードを有し、前記パフォーマンス・モニタが前記第2の動作モードで動作しているときに、前記第1のカウンタが前記第1のイベント・オカレンスならびに前記第2のイベント・オカレンスに応答して増分することを特徴とする、請求項3に記載のシステム。
  5. 前記プロセッサが前記第1のスレッドおよび前記第2のスレッドに応答して、複数の様々なイベントのオカレンスを生成し、前記パフォーマンス・モニタが、そのオカレンスが記録される前記複数の様々なイベントのサブセットを選択的に決定する制御装置を含むことを特徴とする、請求項1に記載のシステム。
  6. 前記マルチスレッド・プロセッサが前記第1のスレッドと前記第2のスレッドを一時に1つ実行し、前記第2のスレッド内の少なくとも1つの命令が、前記第1のイベント・オカレンスの生成と、前記第1のスレッドに応答して生成された第3のイベント・オカレンスの生成との間に前記プロセッサによって実行され、前記パフォーマンス・モニタが前記第1のイベント・オカレンスと前記第3のイベント・オカレンスを一緒に記録することを特徴とする、請求項1に記載のシステム。
  7. 前記プロセッサが、前記第1のスレッドが非活動状態である間に前記第1のイベント・オカレンスを生成することを特徴とする、請求項1に記載のシステム。
  8. 前記パフォーマンス・モニタが、イベント・オカレンスを記録する複数のカウンタを含み、前記複数のカウンタの第1のサブセットが前記第1のスレッドに割り振られ、前記複数のカウンタの第2のサブセットが前記第2のスレッドに割り振られ、特定のイベントに対して、前記第1のサブセットに属するカウンタのみが、前記第1のスレッドが活動状態である間に生成された前記特定のイベントのオカレンスに応答して増分することができ、前記第2のサブセットに属するカウンタのみが、前記第2のスレッドが活動状態である間に生成された前記特定のイベントのオカレンスに応答して増分することができることを特徴とする、請求項1に記載のシステム。
  9. アドレス指定論理をさらに含み、前記第1のスレッドおよび前記第2のスレッドのうちの一方からの読取り要求に応答して、前記アドレス指定論理が、前記カウンタの第1のサブセットおよび前記カウンタの第2のサブセットのうち対応する一方のサブセット中の特定のカウンタに前記読取り要求をマッピングすることを特徴とする、請求項8に記載のシステム。
  10. 割込み発生回路をさらに含み、前記割込み発生回路が、前記第1のスレッドが活動状態であるときにのみ前記第1のサブセット中のカウンタの状態に応答して割込みを発生し、かつ前記第2のスレッドが活動状態であるときにのみ前記第2のサブセット中のカウンタの状態に応答して割込みを発生することを特徴とする、請求項8に記載のシステム。
  11. マルチスレッド・プロセッサ内で、第1のスレッドおよび第2のスレッドを処理するステップと、
    前記第1のスレッドを処理するステップに応答して前記マルチスレッド・プロセッサ内で第1のイベント・オカレンスを生成し、かつ前記第2のスレッドを処理するステップに応答して前記マルチスレッド・プロセッサ内で第2のイベント・オカレンスを生成するステップと、
    前記第1のイベント・オカレンスおよび前記第2のイベント・オカレンスを別々に記録するステップとを含み、
    前記第1のイベント・オカレンスと前記第2のイベント・オカレンスが同じイベントの2つのオカレンスであることを特徴とする、マルチスレッド・プロセッサ内でパフォーマンスを監視する方法。
  12. 前記マルチスレッド・プロセッサが、第1のカウンタおよび第2のカウンタを含むパフォーマンス・モニタを有し、前記パフォーマンス・モニタが第1の動作モードを有し、前記第1のイベント・オカレンスおよび前記第2のイベント・オカレンスを別々に記録する前記ステップが、前記第1のモードで動作している前記パフォーマンス・モニタに応答して実施され、前記記録ステップが、
    前記第1のイベント・オカレンスに応答して前記第1のカウンタを増分し、かつ前記第2のイベント・オカレンスに応答して前記第2のカウンタを増分するステップを含むことを特徴とする、請求項11に記載の方法。
  13. 前記パフォーマンス・モニタが第2の動作モードを有し、
    前記パフォーマンス・モニタが前記第2のモードで動作するのに応答して、前記第1のイベント・オカレンスならびに前記第2のイベント・オカレンスに応答して前記第1のカウンタを増分するステップをさらに含むことを特徴とする、請求項12に記載の方法。
  14. 前記マルチスレッド・プロセッサが前記第1のスレッドおよび前記第2のスレッドを処理するステップに応答して、複数の様々なイベントのオカレンスを生成し、そのオカレンスが記録される前記複数の様々なイベントのサブセットを選択的に決定するステップをさらに含むことを特徴とする、請求項11に記載の方法。
  15. 前記マルチスレッド・プロセッサが前記第1のスレッドと前記第2のスレッドを一時に1つ実行し、前記第2のスレッド内の少なくとも1つの命令が、前記第1のイベント・オカレンスの生成と、前記第1のスレッドに応答して生成された第3のイベント・オカレンスの生成との間に前記プロセッサによって実行され、この方法が前記第1のイベント・オカレンスと前記第3のイベント・オカレンスを一緒に記録するステップをさらに含むことを特徴とする、請求項11に記載の方法。
  16. 前記第1のイベント・オカレンスを生成する前記ステップが、前記第1のスレッドが非活動状態である間に前記第1のイベント・オカレンスを生成するステップをさらに含むことを特徴とする、請求項11に記載の方法。
  17. 前記マルチスレッド・プロセッサが、イベント・オカレンスを記録する複数のカウンタを含み、前記複数のカウンタの第1のサブセットが前記第1のスレッドに割り振られ、前記複数のカウンタの第2のサブセットが前記第2のスレッドに割り振られ、前記第1のイベント・オカレンスおよび前記第2のイベント・オカレンスが特定のイベントの2つのオカレンスであり、前記第1のイベント・オカレンスおよび前記第2のイベント・オカレンスを別々に記録する前記ステップが、
    前記第1のスレッドが活動状態である間に生成された前記特定のイベントのオカレンスに応答して、前記第1のサブセットに属するカウンタを増分するステップと、
    前記第2のスレッドが活動状態である間に生成された前記特定のイベントのオカレンスに応答して、前記第2のサブセットに属するカウンタを増分するステップとを含むことを特徴とする、請求項11に記載の方法。
  18. 前記第1のスレッドおよび前記第2のスレッドの1つによる読取り要求に応答して、前記カウンタの第1のサブセットおよび前記カウンタの第2のサブセットのうちの対応する一方のサブセット中の特定のカウンタに前記読取り要求をマッピングするステップをさらに含むことを特徴とする、請求項17に記載の方法。
  19. 前記第1のスレッドが活動状態であるときにのみ前記第1のサブセット中のカウンタの状態に応答して割込みを発生し、かつ前記第2のスレッドが活動状態であるときにのみ前記第2のサブセット中のカウンタの状態に応答して割込みを発生することを特徴とする、請求項17に記載の方法。
JP04919098A 1997-03-11 1998-03-02 マルチスレッド・プロセッサ内でパフォーマンスを監視する方法およびシステム Expired - Fee Related JP3609603B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/814,390 US5835705A (en) 1997-03-11 1997-03-11 Method and system for performance per-thread monitoring in a multithreaded processor
US08/814390 1997-03-11

Publications (2)

Publication Number Publication Date
JPH10275100A JPH10275100A (ja) 1998-10-13
JP3609603B2 true JP3609603B2 (ja) 2005-01-12

Family

ID=25214923

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04919098A Expired - Fee Related JP3609603B2 (ja) 1997-03-11 1998-03-02 マルチスレッド・プロセッサ内でパフォーマンスを監視する方法およびシステム

Country Status (8)

Country Link
US (2) US5835705A (ja)
JP (1) JP3609603B2 (ja)
KR (1) KR100384263B1 (ja)
CN (1) CN1153139C (ja)
GB (1) GB2324393B (ja)
HK (1) HK1015049A1 (ja)
SG (1) SG60202A1 (ja)
TW (1) TW385387B (ja)

Families Citing this family (144)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6073159A (en) * 1996-12-31 2000-06-06 Compaq Computer Corporation Thread properties attribute vector based thread selection in multithreading processor
US5835705A (en) * 1997-03-11 1998-11-10 International Business Machines Corporation Method and system for performance per-thread monitoring in a multithreaded processor
US5991708A (en) * 1997-07-07 1999-11-23 International Business Machines Corporation Performance monitor and method for performance monitoring within a data processing system
US6567839B1 (en) * 1997-10-23 2003-05-20 International Business Machines Corporation Thread switch control in a multithreaded processor system
US6161166A (en) * 1997-11-10 2000-12-12 International Business Machines Corporation Instruction cache for multithreaded processor
US6256775B1 (en) * 1997-12-11 2001-07-03 International Business Machines Corporation Facilities for detailed software performance analysis in a multithreaded processor
US6098169A (en) * 1997-12-23 2000-08-01 Intel Corporation Thread performance analysis by monitoring processor performance event registers at thread switch
US6067643A (en) * 1997-12-24 2000-05-23 Intel Corporation Programmable observation system for monitoring the performance of a graphics controller
US6115682A (en) * 1997-12-24 2000-09-05 Intel Corporation Apparatus for analyzing the performance of a computer system
US6272520B1 (en) * 1997-12-31 2001-08-07 Intel Corporation Method for detecting thread switch events
FI108478B (fi) * 1998-01-21 2002-01-31 Nokia Corp Sulautettu jõrjestelmõ
US6044447A (en) * 1998-01-30 2000-03-28 International Business Machines Corporation Method and apparatus for communicating translation command information in a multithreaded environment
KR100280460B1 (ko) * 1998-04-08 2001-02-01 김영환 데이터 처리 장치 및 이의 복수의 스레드 처리 방법
US6457064B1 (en) * 1998-04-27 2002-09-24 Sun Microsystems, Inc. Method and apparatus for detecting input directed to a thread in a multi-threaded process
US6275782B1 (en) 1998-05-05 2001-08-14 Advanced Micro Devices, Inc. Non-intrusive performance monitoring
US6256637B1 (en) * 1998-05-05 2001-07-03 Gemstone Systems, Inc. Transactional virtual machine architecture
US6243666B1 (en) * 1998-06-12 2001-06-05 Unisys Corporation Maintenance system and interface for use in a modularized, high-speed data processing system
US6301615B1 (en) * 1998-10-14 2001-10-09 Sun Microsystems, Inc. Cluster performance monitoring utility
US7529907B2 (en) 1998-12-16 2009-05-05 Mips Technologies, Inc. Method and apparatus for improved computer load and store operations
US7020879B1 (en) * 1998-12-16 2006-03-28 Mips Technologies, Inc. Interrupt and exception handling for multi-streaming digital processors
US6477562B2 (en) * 1998-12-16 2002-11-05 Clearwater Networks, Inc. Prioritized instruction scheduling for multi-streaming processors
US7035997B1 (en) 1998-12-16 2006-04-25 Mips Technologies, Inc. Methods and apparatus for improving fetching and dispatch of instructions in multithreaded processors
US7237093B1 (en) 1998-12-16 2007-06-26 Mips Technologies, Inc. Instruction fetching system in a multithreaded processor utilizing cache miss predictions to fetch instructions from multiple hardware streams
US7257814B1 (en) 1998-12-16 2007-08-14 Mips Technologies, Inc. Method and apparatus for implementing atomicity of memory operations in dynamic multi-streaming processors
US6389449B1 (en) * 1998-12-16 2002-05-14 Clearwater Networks, Inc. Interstream control and communications for multi-streaming digital processors
US6341338B1 (en) * 1999-02-04 2002-01-22 Sun Microsystems, Inc. Protocol for coordinating the distribution of shared memory
US6434714B1 (en) * 1999-02-04 2002-08-13 Sun Microsystems, Inc. Methods, systems, and articles of manufacture for analyzing performance of application programs
US6535905B1 (en) 1999-04-29 2003-03-18 Intel Corporation Method and apparatus for thread switching within a multithreaded processor
US6675371B1 (en) * 1999-04-30 2004-01-06 Hewlett-Packard Development Company, L.P. Java and native application window integration
US6542991B1 (en) 1999-05-11 2003-04-01 Sun Microsystems, Inc. Multiple-thread processor with single-thread interface shared among threads
US7086035B1 (en) * 1999-05-13 2006-08-01 International Business Machines Corporation Method and system for counting non-speculative events in a speculative processor
FI107422B (fi) * 1999-06-24 2001-07-31 Nokia Corp Istuntojen hallinta
US6542921B1 (en) * 1999-07-08 2003-04-01 Intel Corporation Method and apparatus for controlling the processing priority between multiple threads in a multithreaded processor
US7421572B1 (en) * 1999-09-01 2008-09-02 Intel Corporation Branch instruction for processor with branching dependent on a specified bit in a register
US6557167B1 (en) * 1999-09-03 2003-04-29 International Business Machines Corporation Apparatus and method for analyzing performance of a computer program
US6754690B2 (en) * 1999-09-16 2004-06-22 Honeywell, Inc. Method for time partitioned application scheduling in a computer operating system
US6714904B1 (en) * 1999-10-13 2004-03-30 Transmeta Corporation System for using rate of exception event generation during execution of translated instructions to control optimization of the translated instructions
US7761857B1 (en) 1999-10-13 2010-07-20 Robert Bedichek Method for switching between interpretation and dynamic translation in a processor system based upon code sequence execution counts
US6357016B1 (en) * 1999-12-09 2002-03-12 Intel Corporation Method and apparatus for disabling a clock signal within a multithreaded processor
US6889319B1 (en) 1999-12-09 2005-05-03 Intel Corporation Method and apparatus for entering and exiting multiple threads within a multithreaded processor
US6496925B1 (en) 1999-12-09 2002-12-17 Intel Corporation Method and apparatus for processing an event occurrence within a multithreaded processor
US7051329B1 (en) 1999-12-28 2006-05-23 Intel Corporation Method and apparatus for managing resources in a multithreaded processor
US6671795B1 (en) * 2000-01-21 2003-12-30 Intel Corporation Method and apparatus for pausing execution in a processor or the like
US7035989B1 (en) 2000-02-16 2006-04-25 Sun Microsystems, Inc. Adaptive memory allocation
US7856633B1 (en) 2000-03-24 2010-12-21 Intel Corporation LRU cache replacement for a partitioned set associative cache
US6594821B1 (en) 2000-03-30 2003-07-15 Transmeta Corporation Translation consistency checking for modified target instructions by comparing to original copy
US7093109B1 (en) * 2000-04-04 2006-08-15 International Business Machines Corporation Network processor which makes thread execution control decisions based on latency event lengths
US6546359B1 (en) 2000-04-24 2003-04-08 Sun Microsystems, Inc. Method and apparatus for multiplexing hardware performance indicators
US6647546B1 (en) 2000-05-03 2003-11-11 Sun Microsystems, Inc. Avoiding gather and scatter when calling Fortran 77 code from Fortran 90 code
US6802057B1 (en) 2000-05-03 2004-10-05 Sun Microsystems, Inc. Automatic generation of fortran 90 interfaces to fortran 77 code
US6556952B1 (en) 2000-05-04 2003-04-29 Advanced Micro Devices, Inc. Performance monitoring and optimizing of controller parameters
US6615300B1 (en) 2000-06-19 2003-09-02 Transmeta Corporation Fast look-up of indirect branch destination in a dynamic translation system
JP2004518183A (ja) 2000-07-14 2004-06-17 クリアウオーター・ネツトワークス・インコーポレイテツド マルチスレッド・システムにおける命令のフェッチとディスパッチ
US6986130B1 (en) 2000-07-28 2006-01-10 Sun Microsystems, Inc. Methods and apparatus for compiling computer programs using partial function inlining
US6748556B1 (en) * 2000-08-15 2004-06-08 International Business Machines Corporation Changing the thread capacity of a multithreaded computer processor
US6910107B1 (en) 2000-08-23 2005-06-21 Sun Microsystems, Inc. Method and apparatus for invalidation of data in computer systems
US6701447B1 (en) * 2000-09-06 2004-03-02 International Business Machines Corporation System for delaying the counting of occurrences of a plurality of events occurring in a processor until the disposition of the event has been determined
US6658584B1 (en) * 2000-09-06 2003-12-02 International Business Machines Corporation Method and structure for managing large counter arrays
US6854119B1 (en) * 2000-09-29 2005-02-08 International Business Machines Corporation Method, apparatus and article of manufacture for tracking processes
US7406681B1 (en) 2000-10-12 2008-07-29 Sun Microsystems, Inc. Automatic conversion of source code from 32-bit to 64-bit
US6957208B1 (en) 2000-10-31 2005-10-18 Sun Microsystems, Inc. Method, apparatus, and article of manufacture for performance analysis using semantic knowledge
US7448025B2 (en) * 2000-12-29 2008-11-04 Intel Corporation Qualification of event detection by thread ID and thread privilege level
GB2372847B (en) * 2001-02-19 2004-12-29 Imagination Tech Ltd Control of priority and instruction rates on a multithreaded processor
US7225446B2 (en) * 2001-02-20 2007-05-29 Pts Corporation Context preservation
US7320065B2 (en) 2001-04-26 2008-01-15 Eleven Engineering Incorporated Multithread embedded processor with input/output capability
US6651158B2 (en) * 2001-06-22 2003-11-18 Intel Corporation Determination of approaching instruction starvation of threads based on a plurality of conditions
US7134002B2 (en) * 2001-08-29 2006-11-07 Intel Corporation Apparatus and method for switching threads in multi-threading processors
US7363474B2 (en) * 2001-12-31 2008-04-22 Intel Corporation Method and apparatus for suspending execution of a thread until a specified memory access occurs
AU2003231945A1 (en) * 2002-05-31 2003-12-19 Guang R. Gao Method and apparatus for real-time multithreading
US8024735B2 (en) * 2002-06-14 2011-09-20 Intel Corporation Method and apparatus for ensuring fairness and forward progress when executing multiple threads of execution
US7065596B2 (en) * 2002-09-19 2006-06-20 Intel Corporation Method and apparatus to resolve instruction starvation
US7185338B2 (en) * 2002-10-15 2007-02-27 Sun Microsystems, Inc. Processor with speculative multithreading and hardware to support multithreading software
US7360220B2 (en) * 2002-10-31 2008-04-15 Intel Corporation Methods and apparatus for multi-threading using differently coded software segments to perform an algorithm
US7174554B2 (en) * 2002-12-20 2007-02-06 Microsoft Corporation Tools and methods for discovering race condition errors
TWI261198B (en) * 2003-02-20 2006-09-01 Samsung Electronics Co Ltd Simultaneous multi-threading processor circuits and computer program products configured to operate at different performance levels based on a number of operating threads and methods of operating
US7152170B2 (en) * 2003-02-20 2006-12-19 Samsung Electronics Co., Ltd. Simultaneous multi-threading processor circuits and computer program products configured to operate at different performance levels based on a number of operating threads and methods of operating
US7310723B1 (en) 2003-04-02 2007-12-18 Transmeta Corporation Methods and systems employing a flag for deferring exception handling to a commit or rollback point
US7657893B2 (en) 2003-04-23 2010-02-02 International Business Machines Corporation Accounting method and logic for determining per-thread processor resource utilization in a simultaneous multi-threaded (SMT) processor
US7496915B2 (en) * 2003-04-24 2009-02-24 International Business Machines Corporation Dynamic switching of multithreaded processor between single threaded and simultaneous multithreaded modes
US7143267B2 (en) * 2003-04-28 2006-11-28 International Business Machines Corporation Partitioning prefetch registers to prevent at least in part inconsistent prefetch information from being stored in a prefetch register of a multithreading processor
US7653904B2 (en) * 2003-09-26 2010-01-26 Intel Corporation System for forming a critical update loop to continuously reload active thread state from a register storing thread state until another active thread is detected
US7406698B2 (en) * 2003-12-30 2008-07-29 Microsoft Corporation Driver framework component for synchronizing interactions between a multi-threaded environment and a driver operating in a less-threaded software environment
US7617488B2 (en) * 2003-12-30 2009-11-10 Intel Corporation Method and apparatus and determining processor utilization
US7526757B2 (en) * 2004-01-14 2009-04-28 International Business Machines Corporation Method and apparatus for maintaining performance monitoring structures in a page table for use in monitoring performance of a computer program
US20050183065A1 (en) * 2004-02-13 2005-08-18 Wolczko Mario I. Performance counters in a multi-threaded processor
US8826241B2 (en) 2004-02-16 2014-09-02 Oracle America, Inc. Instruction sampling in a multi-threaded processor
US20050188186A1 (en) * 2004-02-23 2005-08-25 Wolczko Mario I. Obtaining execution path information in an instruction sampling system
US7555753B2 (en) * 2004-02-26 2009-06-30 International Business Machines Corporation Measuring processor use in a hardware multithreading processor environment
US20050198555A1 (en) * 2004-03-03 2005-09-08 Wolczko Mario I. Incorporating instruction reissue in an instruction sampling mechanism
US7154301B2 (en) * 2004-03-26 2006-12-26 Intel Corporation Apparatus and method for a low jitter predriver for differential output drivers
US7216223B2 (en) * 2004-04-30 2007-05-08 Hewlett-Packard Development Company, L.P. Configuring multi-thread status
US7590830B2 (en) * 2004-05-28 2009-09-15 Sun Microsystems, Inc. Method and structure for concurrent branch prediction in a processor
US20060005083A1 (en) * 2004-06-30 2006-01-05 International Business Machines Corporation Performance count tracing
US7702887B1 (en) * 2004-06-30 2010-04-20 Sun Microsystems, Inc. Performance instrumentation in a fine grain multithreaded multicore processor
GB0420442D0 (en) * 2004-09-14 2004-10-20 Ignios Ltd Debug in a multicore architecture
US7552212B2 (en) * 2004-10-22 2009-06-23 International Business Machines Corporation Intelligent performance monitoring based on user transactions
US20060129999A1 (en) * 2004-11-16 2006-06-15 Sony Computer Entertainment Inc. Methods and apparatus for using bookmarks in a trace buffer
US7681196B2 (en) * 2004-11-18 2010-03-16 Oracle International Corporation Providing optimal number of threads to applications performing multi-tasking using threads
US7200522B2 (en) * 2005-01-27 2007-04-03 International Business Machines Corporation Method, apparatus, and computer program product in a performance monitor for sampling all performance events generated by a processor
US20060212840A1 (en) * 2005-03-16 2006-09-21 Danny Kumamoto Method and system for efficient use of secondary threads in a multiple execution path processor
US7774784B2 (en) * 2005-03-17 2010-08-10 Microsoft Corporation Determining an actual amount of time a processor consumes in executing a portion of code
US7917907B2 (en) * 2005-03-23 2011-03-29 Qualcomm Incorporated Method and system for variable thread allocation and switching in a multithreaded processor
US20060271625A1 (en) * 2005-05-25 2006-11-30 International Business Machines Corporation Selective monitoring and publishing of discussion threads with membership linking
US20060277395A1 (en) * 2005-06-06 2006-12-07 Fowles Richard G Processor performance monitoring
US8413162B1 (en) 2005-06-28 2013-04-02 Guillermo J. Rozas Multi-threading based on rollback
US8230419B2 (en) * 2005-07-26 2012-07-24 International Business Machines Corporation Method, system and program product for capturing central processing unit (CPU) utilization for a process on a virtual machine
US7487317B1 (en) * 2005-11-03 2009-02-03 Sun Microsystems, Inc. Cache-aware scheduling for a chip multithreading processor
US20070139421A1 (en) * 2005-12-21 2007-06-21 Wen Chen Methods and systems for performance monitoring in a graphics processing unit
US8001549B2 (en) * 2006-04-27 2011-08-16 Panasonic Corporation Multithreaded computer system and multithread execution control method
JP4971679B2 (ja) * 2006-05-10 2012-07-11 ルネサスエレクトロニクス株式会社 プロセッサシステム及びプロセッサシステムの性能測定方法
CN100409200C (zh) * 2006-08-04 2008-08-06 上海科泰世纪科技有限公司 对嵌入式操作系统的性能信息进行实时监测的方法
US8533530B2 (en) * 2006-11-15 2013-09-10 Qualcomm Incorporated Method and system for trusted/untrusted digital signal processor debugging operations
US8370806B2 (en) 2006-11-15 2013-02-05 Qualcomm Incorporated Non-intrusive, thread-selective, debugging method and system for a multi-thread digital signal processor
US8380966B2 (en) * 2006-11-15 2013-02-19 Qualcomm Incorporated Method and system for instruction stuffing operations during non-intrusive digital signal processor debugging
US8341604B2 (en) * 2006-11-15 2012-12-25 Qualcomm Incorporated Embedded trace macrocell for enhanced digital signal processor debugging operations
US8264491B1 (en) * 2007-04-09 2012-09-11 Nvidia Corporation System, method, and computer program product for controlling a shader to gather statistics
US8484516B2 (en) * 2007-04-11 2013-07-09 Qualcomm Incorporated Inter-thread trace alignment method and system for a multi-threaded processor
JP5136553B2 (ja) 2007-06-20 2013-02-06 富士通株式会社 演算処理装置及び演算処理装置の制御方法
US20090019797A1 (en) * 2007-07-19 2009-01-22 Cameron Todd Gunn Simplified Protective Cover Assembly
US7987345B2 (en) * 2007-09-28 2011-07-26 Broadcom Corporation Performance monitors in a multithreaded processor architecture
US9098625B2 (en) * 2008-02-29 2015-08-04 International Business Machines Corporation Viral trace
US8161493B2 (en) * 2008-07-15 2012-04-17 International Business Machines Corporation Weighted-region cycle accounting for multi-threaded processor cores
US8892916B2 (en) * 2008-08-06 2014-11-18 International Business Machines Corporation Dynamic core pool management
US20100115494A1 (en) * 2008-11-03 2010-05-06 Gorton Jr Richard C System for dynamic program profiling
US8024719B2 (en) 2008-11-03 2011-09-20 Advanced Micro Devices, Inc. Bounded hash table sorting in a dynamic program profiling system
US8478948B2 (en) 2008-12-04 2013-07-02 Oracle America, Inc. Method and system for efficient tracing and profiling of memory accesses during program execution
US8423972B2 (en) 2009-02-27 2013-04-16 International Business Machines Corporation Collecting profile-specified performance data on a multithreaded data processing system
US8578382B2 (en) * 2009-05-19 2013-11-05 Qualcomm Incorporated Associating data for events occurring in software threads with synchronized clock cycle counters
US9672132B2 (en) * 2009-11-19 2017-06-06 Qualcomm Incorporated Methods and apparatus for measuring performance of a multi-thread processor
KR101635816B1 (ko) * 2010-07-02 2016-07-04 삼성전자주식회사 결정적 프로그레스 인덱스를 이용한 스레드 프로그레스 트래킹 방법 및 장치
US9092568B2 (en) * 2012-04-30 2015-07-28 Nec Laboratories America, Inc. Method and system for correlated tracing with automated multi-layer function instrumentation localization
US20130332778A1 (en) * 2012-06-07 2013-12-12 Vmware, Inc. Performance-imbalance-monitoring processor features
US9021172B2 (en) 2012-07-06 2015-04-28 Arm Limited Data processing apparatus and method and method for generating performance monitoring interrupt signal based on first event counter and second event counter
US9471318B2 (en) 2013-03-15 2016-10-18 International Business Machines Corporation System management and instruction counting
US9298651B2 (en) * 2013-06-24 2016-03-29 International Business Machines Corporation Continuous in-memory accumulation of hardware performance counter data
US9405575B2 (en) * 2013-09-09 2016-08-02 Apple Inc. Use of multi-thread hardware for efficient sampling
US9799087B2 (en) 2013-09-09 2017-10-24 Apple Inc. Shader program profiler
US20150120009A1 (en) * 2013-10-31 2015-04-30 Rockwell Automation Technologies, Inc. Independent Operation of Control Hardware and a Monitoring System in an Automation Controller
US9122800B1 (en) * 2014-05-30 2015-09-01 Honeywell International Inc. System and method of non-intrusive measurement of memory access profiles of threads in a multi-core processor
CN104239183B (zh) * 2014-09-22 2017-10-27 北京国双科技有限公司 监测系统性能的方法及装置
US10706101B2 (en) 2016-04-14 2020-07-07 Advanced Micro Devices, Inc. Bucketized hash tables with remap entries
US10997048B2 (en) 2016-12-30 2021-05-04 Intel Corporation Apparatus and method for multithreading-aware performance monitoring events
US10909015B2 (en) * 2016-12-30 2021-02-02 Intel Corporation Apparatus and method for generating performance monitoring metrics
US10310830B2 (en) 2017-06-02 2019-06-04 Apple Inc. Shader profiler

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US529727A (en) * 1894-11-27 William griscom
US5694603A (en) * 1982-09-28 1997-12-02 Reiffin; Martin G. Computer memory product with preemptive multithreading software
US4821178A (en) * 1986-08-15 1989-04-11 International Business Machines Corporation Internal performance monitoring by event sampling
US5179702A (en) * 1989-12-29 1993-01-12 Supercomputer Systems Limited Partnership System and method for controlling a highly parallel multiprocessor using an anarchy based scheduler for parallel execution thread scheduling
US5193187A (en) * 1989-12-29 1993-03-09 Supercomputer Systems Limited Partnership Fast interrupt mechanism for interrupting processors in parallel in a multiprocessor system wherein processors are assigned process ID numbers
GB2256296B (en) * 1991-05-31 1995-01-18 Integrated Device Tech Multiplexed status and diagnostic pins in a microprocessor with on-chip caches
JPH0774984B2 (ja) * 1991-06-10 1995-08-09 インターナショナル・ビジネス・マシーンズ・コーポレイション システム資源利用率測定方法とデータ処理システム
US5355484A (en) * 1991-08-12 1994-10-11 International Business Machines Corporation Dynamically established event monitors in event management services of a computer system
JPH05204656A (ja) * 1991-11-30 1993-08-13 Toshiba Corp スレッド固有データ保持方法
US5657253A (en) * 1992-05-15 1997-08-12 Intel Corporation Apparatus for monitoring the performance of a microprocessor
US5450349A (en) * 1992-10-27 1995-09-12 Digital Equipment Corporation Computer system performance evaluation system and method
US5490272A (en) * 1994-01-28 1996-02-06 International Business Machines Corporation Method and apparatus for creating multithreaded time slices in a multitasking operating system
AU2364095A (en) * 1994-05-12 1995-12-05 Ast Research, Inc. Cpu activity monitoring through cache watching
US5537541A (en) * 1994-08-16 1996-07-16 Digital Equipment Corporation System independent interface for performance counters
US5557548A (en) * 1994-12-09 1996-09-17 International Business Machines Corporation Method and system for performance monitoring within a data processing system
US5717926A (en) * 1995-02-28 1998-02-10 International Business Machines Corporation Efficient forking of a process
JPH096633A (ja) * 1995-06-07 1997-01-10 Internatl Business Mach Corp <Ibm> データ処理システムに於ける高性能多重論理経路の動作用の方法とシステム
US5838976A (en) * 1995-11-28 1998-11-17 Hewlett-Packard Co. System and method for profiling code on symmetric multiprocessor architectures
US5933627A (en) * 1996-07-01 1999-08-03 Sun Microsystems Thread switch on blocked load or store using instruction thread field
US5835705A (en) * 1997-03-11 1998-11-10 International Business Machines Corporation Method and system for performance per-thread monitoring in a multithreaded processor
US5907702A (en) * 1997-03-28 1999-05-25 International Business Machines Corporation Method and apparatus for decreasing thread switch latency in a multithread processor

Also Published As

Publication number Publication date
HK1015049A1 (en) 1999-10-08
CN1193144A (zh) 1998-09-16
SG60202A1 (en) 1999-02-22
GB2324393B (en) 2002-03-13
US6052708A (en) 2000-04-18
TW385387B (en) 2000-03-21
US5835705A (en) 1998-11-10
CN1153139C (zh) 2004-06-09
GB2324393A (en) 1998-10-21
GB9803673D0 (en) 1998-04-15
KR100384263B1 (ko) 2003-10-10
JPH10275100A (ja) 1998-10-13
KR19980079486A (ko) 1998-11-25

Similar Documents

Publication Publication Date Title
JP3609603B2 (ja) マルチスレッド・プロセッサ内でパフォーマンスを監視する方法およびシステム
US8539485B2 (en) Polling using reservation mechanism
US7133968B2 (en) Method and apparatus for resolving additional load misses in a single pipeline processor under stalls of instructions not accessing memory-mapped I/O regions
US10061588B2 (en) Tracking operand liveness information in a computer system and performing function based on the liveness information
US9940132B2 (en) Load-monitor mwait
US7890734B2 (en) Mechanism for selecting instructions for execution in a multithreaded processor
US5226130A (en) Method and apparatus for store-into-instruction-stream detection and maintaining branch prediction cache consistency
US7676655B2 (en) Single bit control of threads in a multithreaded multicore processor
US5937437A (en) Method and apparatus for monitoring address translation performance
US7418582B1 (en) Versatile register file design for a multi-threaded processor utilizing different modes and register windows
US8429386B2 (en) Dynamic tag allocation in a multithreaded out-of-order processor
US7111126B2 (en) Apparatus and method for loading data values
US20110055838A1 (en) Optimized thread scheduling via hardware performance monitoring
US20050273559A1 (en) Microprocessor architecture including unified cache debug unit
US20100332804A1 (en) Unified high-frequency out-of-order pick queue with support for speculative instructions
US6718403B2 (en) Hierarchical selection of direct and indirect counting events in a performance monitor unit
US6266759B1 (en) Register scoreboarding to support overlapped execution of vector memory reference instructions in a vector processor
KR100745904B1 (ko) 동시적 멀티스레드 프로세서에서 파이프라인 길이를변경하기 위한 방법 및 회로
JP3919764B2 (ja) 例外条件を解消するために同時マルチスレッド・プロセッサでディスパッチ・フラッシュを使用する方法
US5596735A (en) Circuit and method for addressing segment descriptor tables
US20130024647A1 (en) Cache backed vector registers
US8205032B2 (en) Virtual machine control structure identification decoder
US8046538B1 (en) Method and mechanism for cache compaction and bandwidth reduction
GB2378278A (en) Memory snapshot as a background process allowing write requests
US5970509A (en) Hit determination circuit for selecting a data set based on miss determinations in other data sets and method of operation

Legal Events

Date Code Title Description
A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20040109

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040406

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040907

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20041012

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041014

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071022

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081022

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees