JP3609603B2 - マルチスレッド・プロセッサ内でパフォーマンスを監視する方法およびシステム - Google Patents
マルチスレッド・プロセッサ内でパフォーマンスを監視する方法およびシステム Download PDFInfo
- Publication number
- JP3609603B2 JP3609603B2 JP04919098A JP4919098A JP3609603B2 JP 3609603 B2 JP3609603 B2 JP 3609603B2 JP 04919098 A JP04919098 A JP 04919098A JP 4919098 A JP4919098 A JP 4919098A JP 3609603 B2 JP3609603 B2 JP 3609603B2
- Authority
- JP
- Japan
- Prior art keywords
- thread
- response
- event occurrence
- event
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3409—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/86—Event-based monitoring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/88—Monitoring involving counting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/885—Monitoring specific for caches
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Debugging And Monitoring (AREA)
Description
【発明の属する技術分野】
本発明は、一般にデータ処理、特にデータ処理システム内でパフォーマンスを監視する方法に関する。さらに詳細には、本発明は、マルチスレッド・プロセッサ内でパフォーマンスをスレッド単位で監視する方法に関する。
【0002】
【従来の技術】
プロセッサから最適なパフォーマンスを引き出すために、ハードウェアおよびソフトウェア・エンジニアは、プロセッサの動的挙動を検出し、分析する。過去には、そのようなプロセッサ分析において有用なプロセッサ状態のほとんどは、外部装置からアクセスすることができた。例えば、低い集積レベルでは、大部分の機械状態、バス・トランザクション、および他の有用な信号が、モジュール相互接続、エッジ・コネクタ、およびチップ・バックプレーン上で検出することができた。したがって、プロセッサ・パフォーマンス分析に使用するためにデータを容易に収集し、事後に処理することができた。
【0003】
しかしながら、集積レベルが高まり、それによりプロセッサ状態が外部装置からアクセスすることができなくなるにつれて、ハードウェアならびにソフトウェアを最適化するために必要な実験データを収集するためにプロセッサ内にパフォーマンス監視回路を組み込むことが必要になってきた。オンボード・パフォーマンス・モニタは、一般に、プロセッサ・サイクル、実行された命令、キャッシュ・ミスなど、プロセッサ・パフォーマンスを示す選択されたイベントのオカレンスをそれぞれカウントする1つまたは複数のカウンタを含んでいる。現在入手できるパフォーマンス・モニタは、従来のプロセッサの動的挙動を分析するのに十分なデータを提供することができるが、単一のカウンタを使用して、選択されたイベントのすべてのオカレンスを記録する従来のパフォーマンス・モニタは、複数の並行スレッドにハードウェア・サポートを提供するマルチスレッド・プロセッサに十分なパフォーマンス・データを提供することができない。例えば、従来のパフォーマンス・モニタは、各スレッドに起因するキャッシュ・ミスの数、または有意義な数のサイクルにわたって各スレッドによって使用されるプロセッサ・サイクルの数を示す情報を提供することができない。
【0004】
したがって、プロセッサ内の複数の各スレッドを独立して監視するハードウェア・パフォーマンス・モニタを含むマルチスレッド・プロセッサを提供することが望ましい。
【0005】
【発明が解決しようとする課題】
したがって、本発明の一目的は、改善されたデータ処理の方法およびシステムを提供することである。
【0006】
本発明の他の目的は、データ処理システム内でパフォーマンスを監視する改善された方法およびシステムを提供することである。
【0007】
本発明の他の目的は、マルチスレッド・プロセッサ内でパフォーマンスをスレッド単位で監視する方法およびシステムを提供することである。
【0008】
【課題を解決するための手段】
上記の目的は、以下で説明するようにして達成される。マルチスレッド・プロセッサ内でパフォーマンスを監視する方法およびシステムが提供される。このシステムは、第1のスレッド内の命令および第2のスレッド内の命令に応答するプロセッサと、第1のスレッドに応答してプロセッサによって生成された第1のイベント、および第2のスレッドに応答してプロセッサによって生成された第2のイベントを別々に記録するパフォーマンス・モニタとを含んでいる。一実施形態では、プロセッサは、第1の動作モードおよび第2の動作モードを含んでいる。この実施形態では、パフォーマンス・モニタが第1のモードで動作しているとき、パフォーマンス・モニタ内の第1のカウンタは、第1のイベントの各オカレンスに応答して増分し、パフォーマンス・モニタ内の第2のカウンタは、第2のイベントの各オカレンスに応答して増分する。あるいは、パフォーマンス・モニタが第2のモードで動作しているとき、第1のカウンタは、第1のイベントの各オカレンスおよび第2のイベントの各オカレンスに応答して増分する。
【0009】
【発明の実施の形態】
次に、図面、特に図1を参照すると、首記の請求の範囲に記載されている本発明によるデータ処理システムの例示的な実施形態のブロック図が示されている。記載の例示的な実施形態では、データ処理回路ならびにオンボード・パフォーマンス・モニタ50を含んでいるプロセッサ10は、単一の集積回路スーパスカラ・マイクロプロセッサを含んでいる。したがって、以下で詳細に論じるように、様々な実行ユニット、レジスタ、バッファ、メモリ、およびプロセッサ10の他の機能ユニットはすべて集積回路によって形成される。プロセッサ10は、インターナショナル・ビジネス・マシーンズ・コーポレイションから市販されている縮小命令セット・コンピューティング(RISC)プロセッサのラインの1つを含んでいることが好ましい。ただし、他の適切なプロセッサを代わりに使用して、本発明を実施することができることが当業者には以下の説明から理解できよう。
【0010】
図1に示すように、プロセッサ10は、バス・インタフェース・ユニット(BIU)12を介してシステム・バス11に結合される。バス・インタフェース・ユニット12は、バス・アービトレーションに関与することによって、プロセッサ10と、システム・バス11に結合された主メモリ52および不揮発性大容量記憶装置54など、他のデバイスとの間の情報の転送を制御する。図1に示すデータ処理システムは、システム・バス11に結合された図示されていない他のデバイスを含んでいることが好ましい。これらは、以下の説明の理解にとって不要であり、したがって説明を簡潔にするために省略する。
【0011】
BIU12は、メモリ管理ユニット14(MMU)に接続される。メモリ管理ユニット14は、プロセッサ10のメモリ階層の様々な構成要素内に記憶されたデータおよび命令へのプロセッサ10によるアクセスを管理する。例示的な実施形態では、プロセッサ10のメモリ階層は、不揮発性大容量記憶装置54および主メモリ52だけでなく、統一レベル2(L2)キャッシュ56を含んでいる。L2キャッシュ56には、L2キャッシュ・インタフェース58、レベル1(L1)命令キャッシュ14、およびL1データ・キャッシュ16を介してアクセスする。したがって、MMU14の管理機能には、例えば、トランスレーション・ルックアサイド・バッファ(TLB、変換索引緩衝機構)13を使用して、論理対実アドレス変換を実施すること、記憶制御(SC)回路23を使用して、L1データ・キャッシュ16およびL2キャッシュ56内のデータにアクセスすること、ライン・バッファ(LB)15とBIU12の間でデータのラインを転送することが含まれる。当業者なら理解できるように、速度が徐々に高くなるメモリ内でデータおよび命令をこのような形でステージングすることにより、プロセッサ10は、より高いレベルのメモリ階層内に記憶されたデータに比較的速いアクセスを行うことができ、したがってデータ処理システムの全体的なパフォーマンスが向上する。
【0012】
L1命令キャッシュ14はさらに、順次バッファ17、スレッド・スイッチ・バッファ18、分岐バッファ19、および分岐ユニット20に結合される。これらは、ディスパッチ・ユニット21とともに、プロセッサ10の命令ユニット(IU)論理パーティション25を形成する。IU25は、プロセッサ10の浮動小数点(FP)論理パーティション26および固定小数点(FX)論理パーティション30内の複数の可能な並行ハードウェア・スレッドのうちの1つの実行を制御する。本発明の開示では、「ハードウェア・スレッド」または単に「スレッド」なる語は、その状態がプロセッサ・ハードウェア内で他の1つまたは複数のハードウェア・スレッドのそれと同時に維持され、かつその実行がプロセッサ・ハードウェアによって支配される(他の並行スレッドと同じプログラムに属することもあり、属しないこともある)命令のグループを表すために使用する。したがって、プロセッサ10によってサポートされる密マルチスレッディングは、多数の現況技術のオペレーティング・システムによってサポートされるソフトウェア管理マルチタスキングと異なることが当業者には明らかであろう。さらに、以下では、プロセッサ10については、2つの並行スレッド(すなわち、活動スレッドと非活動スレッド)のみをサポートするものとして説明するが、本発明は、追加の活動スレッドおよび非活動スレッドをサポートするマルチスレッド・プロセッサにも同じく適用できることを理解されたい。
【0013】
動作に際して、順次バッファ17は、命令をL1命令キャッシュ14から活動スレッド内にフェッチし、それらの命令を一時的にバッファする。順次バッファ17は、フェッチした命令を受け取った順にディスパッチ・ユニット21に送る。ディスパッチ・ユニット21は、各命令を一部復号し、その後分岐命令を分岐処理ユニット(BPU)20に送り、順次命令を実行のためにFP26およびFX30のうちの適切な1つに送る。分岐命令の受取りに応答して、分岐ユニット20は、分岐がとられた場合に実行が続行されるターゲット・アドレスを決定し、ターゲット・アドレスをL1命令キャッシュ14に供給する。順次実行パス内の命令をまだ順次バッファ17に供給している間に、L1命令キャッシュ14は、ターゲット・アドレスに応答して、ターゲット実行パス内の命令を分岐バッファ19にロードする。その結果、分岐がその後とられるものと決定された場合、分岐バッファ19は、ターゲット実行パス内の命令を待ち時間なしでディスパッチ・ユニット21に供給することができる。その後、順次バッファ17は、命令を新しい実行パス内にフェッチし始める。
【0014】
IU25は、同様にしてスレッド・スイッチを実施する。スレッド・スイッチ・バッファ18は、実行すべき次の命令を非活動スレッド内にフェッチし、バッファする。選択されたイベント、例えば、活動スレッドに対するL2キャッシュ・ミスまたはTLBミスのオカレンスに応答して、非活動スレッドが、活動スレッドに指定され、スレッド・スイッチ・バッファ18内の命令が、分岐バッファ19内に転送される。次いで、ディスパッチ・ユニット21は、新たに活動状態になったスレッドからの命令をBPU20、FP26、およびFX30に送達し始める。一方、順次バッファ17は、命令を新たに活動状態になったスレッド内にフェッチし始め、スレッド・スイッチ・バッファ18は、命令を非活動状態になったスレッド内にフェッチし始める。
【0015】
次に、FP26およびFX30を参照すると、分岐ユニット20の他に、プロセッサ10の実行回路は、倍精度浮動小数点ユニット(FPU)27、ロード・ストア・ユニット(LSU)32、単複整数ユニット34、および単整数ユニット36を含んでいる。各実行ユニット27、32、34、および36は、各プロセッサ・サイクル中に関連するタイプの1つまたは複数の順次命令のうちの1つまたは複数の命令を実行することができる。例えば、単整数ユニット36は、固定小数点算術演算(例えば、加算および減算)を実行し、指定された整数レジスタ38からロードされたソース・オペランドを使用して、演算を比較する。固定小数点命令を実行した後、単整数ユニット36は、命令の結果データを1つまたは複数の指定された整数レジスタ38内に記憶する。同様に、倍精度FPU27は、浮動小数点乗算や除算など、倍精度浮動小数点算術演算および論理演算を浮動小数点レジスタ(FPR)28からロードされたソース・オペランドに対して実行し、結果データを指定されたFPR28内に記憶する。プロセッサ10の各順次命令実行ユニットは、パイプラインを使用して、プロセッサ10のスーパスカラ・アーキテクチャのパフォーマンスをさらに向上させる。図示のように、各FPR28および整数レジスタ38は、複数の複製レジスタ・セットまたは「ウェイ」を有する。これらは、プロセッサ10によってサポートされる複数の並行スレッドの各スレッドにそれぞれ関連する。
【0016】
本発明によれば、プロセッサ10は、以下で詳細に説明するように、プロセッサ10によってサポートされる複数の各並行スレッドごとに独立したパフォーマンス監視をサポートするパフォーマンス・モニタ50を含んでいる。図示のように、パフォーマンス・モニタ50は、IU25、FP26、FX30、SC23、BIU12、およびL2キャッシュ・インタフェース58の動作によって生成されたイベント・オカレンスを入力として受け取る。パフォーマンス・モニタ50によって受け取られた多数のイベント・オカレンスの中から選択されたイベント・オカレンスが、パフォーマンス・モニタ50内のソフトウェア読取り可能/書込み可能パフォーマンス・モニタ・カウンタ(PMC)内に記録される。PMC「アドレス」を指定するアーキテクチャ定義命令の実行に応答して、パフォーマンス・モニタ50は、例えば、指定されたPMCの値を整数レジスタ38の選択された1つに記憶することによって、指定されたPMCの値を出力する。パフォーマンス・モニタ50はまた、PMCの1つのオーバフローに応答してアサートされるパフォーマンス・モニタ割込み出力を有する。
【0017】
本発明の重要な一態様によれば、パフォーマンス・モニタ50は、次の2つの動作モードを有する。(1)同じイベントのオカレンスがすべて同じスレッドを処理するステップに応答して生成されてもされなくてもオカレンスがすべて一緒に記録されるグローバル・モード、(2)各スレッドに関連するイベントのオカレンスが別々に記録されるマルチスレッド・モード。
【0018】
次に、図2を参照すると、グローバル・モードで動作しているときのパフォーマンス・モニタ50の概念図が示されている。図示のように、グローバル・モードでは、プロセッサ10のすべての論理パーティションによって生成されたイベント・オカレンスが、マルチプレクサ82内に入力される。次いで、マルチプレクサ82は、選択入力86に応答して、イベント・オカレンスをPMC84のうちの特定のカウンタに送る。選択入力86は、ソフトウェア・アクセス可能制御レジスタ80内のビット・フィールドの設定に応答して生成される。制御レジスタ80内のビット・フィールドは、イベント・オカレンス、各PMC84のレコードがあればそれを指定するだけでなく、パフォーマンス・モニタ50が動作するモード(グローバル・モードまたはマルチスレッド・モード)および各PMC84ごとにカウントをいつ可能にし、またいつ不能にするかを指定する。イベント・オカレンスの受取りに応答して、可能になったPMCが増分する。図2に示すように、いずれかのPMC84のビット0が1にセットされた場合、パフォーマンス・モニタ割込みがORゲート88によって生成される。
【0019】
次に、図3を参照すると、マルチスレッド・モードで動作しているときのパフォーマンス・モニタ50の概念図が示されている。図示の例示的な実施形態では、プロセッサ10は、それぞれPMC84の半分に割り振られた最大2つの並行スレッドをサポートする。したがって、参照番号84aによって識別されたPMC1〜PMC4が、スレッド0に割り振られ、参照番号84bによって識別されたPMC5〜PMC8が、スレッド1に割り振られる。図示のように、選択入力86aに応答して、イベント・オカレンスがマルチプレクサ82aによってPMC1〜PMC4に送られ、選択入力86bに応答して、イベント・オカレンスがマルチプレクサ82bによってPMC5〜PMC8に送られる。選択入力86aおよび選択入力86bは、図2に関して上述したようにして制御レジスタ80内のビット・フィールドの値に応答して生成される。
【0020】
パフォーマンス・モニタ50がグローバル・モードで動作している場合とは異なり、パフォーマンス・モニタ50がマルチスレッド・モードで動作している場合は、イベント・オカレンスがすべて同様に処理されるわけではない。そうではなく、イベント・オカレンスは、そのイベント・オカレンスが属するイベント・グループに依存する形で処理される。第1のグループのイベントは、活動スレッドのみに関連するイベントを含んでいる。これらのイベントのオカレンスは、IU25、FX30、およびFP26によって生成され、次のものを含んでいる。
(1)完了した命令
(2)プロセッサ・サイクル
(3)記憶装置待ち時間のサイクル
(4)分岐データ
(5)データ依存度
(6)不整合アクセス
(7)L1命令キャッシュ・ミス・カウント
(8)浮動小数点演算
(9)スレッド・スイッチ・カウント
【0021】
第2のグループのイベントは、活動スレッドまたは非活動スレッドに関連するイベントである。これらのイベントのオカレンスは、SC23によって生成され、次のものを含んでいる。
(1)合計カウント、待ち時間、ミス・タイプなど、L1データ・キャッシュ・ミス・イベント
(2)変換ミス・イベント(例えば、TLBミス・イベント)
(3)L2キャッシュ・ミス・イベント
【0022】
第3の(最後の)グループのイベントは、特定のスレッドに関連しないイベントである。これらのイベントのオカレンスは、BIU12、LB15、またはL2キャッシュ・インタフェース58によって生成され、次のものを含んでいる。
(1)L2キャッシュ・ライン遷移
(2)L2キャッシュ・キャストアウト
(3)L2キャッシュ・スヌープ・カウント
(4)ライン・バッファ使用
(5)システム・バス使用率
(6)システム・バス再試行
【0023】
図3に示すように、第1のイベント・グループ内のイベント・オカレンスは、ANDゲート100および102によって入力として受け取られる。第1のイベント・グループ内のイベント・オカレンスは、スレッド0が活動状態の場合にのみマルチプレクサ82aに入力され、スレッド1が活動状態の場合にのみマルチプレクサ826に入力される。第1のイベント・グループに属するイベント・オカレンスと異なり、第2のグループ内のイベントは、上述のように例示的な実施形態ではMMU14内のSC23によって生成され、イベント・オカレンスに関連するスレッドが活動スレッドであるか、それとも非活動スレッドであるかに関わらず、可能な選択のためにマルチプレクサ82aと2bの適切な一方に送られる。第3のイベント・グループに属するイベント・オカレンスは、可能な選択のためにマルチプレクサ82aと82bの両方に送られる。
【0024】
次に、図4を参照すると、パフォーマンス・モニタ50がイベント・オカレンスを処理する方法をそれぞれグローバル動作モードおよびマルチスレッド動作モードについて要約した論理流れ図が示されている。図示のように、プロセスは、ブロック170から始まり、その後ブロック172に進む。ブロック172では、パフォーマンス・モニタ50がマルチスレッド・モードで動作しているか否か判定する。パフォーマンス・モニタ50がマルチスレッド・モードで動作しているのではなく、グローバル・モードで動作しているとの判定に応答して、プロセスはブロック174に進む。ブロック174では、マルチプレクサ82が選択入力86によって選択されたイベント・オカレンスをPMC84の適切な1つに送る。上述のように、様々なスレッドによって生成された同じイベントのオカレンスは、PMC84内でマージされ、単一のイベント・カウントが各選択されたイベントごとに維持される。
【0025】
再びブロック172を参照すると、パフォーマンス・モニタ50がマルチスレッド・モードで動作しているとの判定に応答して、プロセスはブロック176に進む。ブロック176では、検出されたイベント・オカレンスがIU25、FX30、またはFP26によって生成されたか否か(すなわち、イベント・オカレンスが第1のイベント・グループに属するかどうか)判定する。検出されたイベント・オカレンスがIU25、FX30、またはFP26によって生成された場合、ブロック178で、スレッド0が活動スレッドであるか否かを判定する。スレッド0が活動スレッドである場合、プロセスはブロック180に進む。ブロック180では、イベント・オカレンスが選択された場合、それがPMC1〜PMC4の適切な1つに送られる。しかし、スレッド1が活動スレッドであるとの判定に応答して、プロセスはブロック178からブロック182に進む。ブロック182では、イベント・オカレンスが選択された場合、それがPMC5〜PMC8の適切な1つに送られる。
【0026】
ブロック176に戻ると、検出されたイベント・オカレンスがIU25、FX30、またはFP26によって生成されなかったとの判定に応答して、プロセスはブロック184に進む。ブロック184は、イベント・オカレンスがSC23によって生成されたか否かを判定する。イベント・オカレンスがSC23によって生成された場合、プロセスはブロック184からブロック186に進む。ブロック186で、イベント・オカレンスがスレッド0またはスレッド1を処理するステップに応答して生成されたと判定する。イベント・オカレンスがスレッド0を処理するステップに応答して生成されたとの判定に応答して、プロセスはブロック188に進む。ブロック188では、イベント・オカレンスが選択された場合、イベント・オカレンスがPMC1〜PMC4の1つに送られる。あるいは、イベント・オカレンスがスレッド1を処理するステップに応答して生成されたとのブロック186での判定に応答して、プロセスはブロック190に進む。ブロック190では、イベント・オカレンスが選択された場合、イベント・オカレンスをPMC5〜PMC8の1つに送る。
【0027】
再びブロック184を参照すると、イベント・オカレンスがSC23によって生成されたとの判定に応答して、プロセスはブロック192に進む。ブロック192では、イベント・オカレンスがBIU12、LB15、またはL2キャッシュ・インタフェース58によって生成されたと判定する。この判定に応答して、イベント・オカレンスが選択された場合、イベント・オカレンスがPMC1〜PMC8の適切な1つに送られる。
【0028】
次いで、図5を参照すると、パフォーマンス・モニタ50の割込み挙動を要約した論理流れ図が示されている。図示のように、プロセスは、ブロック130から始まり、その後ブロック132に進む。ブロック132では、パフォーマンス・モニタ50がマルチスレッド・モードで動作しているか否か判定する。ブロック132での判定は、例えば、制御レジスタ80内の所定のビット・フィールドの値を検査することによって行われる。パフォーマンス・モニタ50がマルチスレッド・モードで動作しているのではなく、グローバル・モードで動作しているとの判定に応答して、プロセスはブロック134に進む。ブロック134では、いずれかのPMC1〜PMC8のビット0が値1を有するか否か判定する。いずれかのPMC1〜PMC8のビット0が値1を有していない場合、プロセスはブロック132に戻る。しかし、少なくとも1つのPMC84のビット0が1にセットされているとの判定に応答して、図5のブロック150でパフォーマンス・モニタ割込みが発生される。
【0029】
グローバル・モードとは異なり、パフォーマンス・モニタ50がマルチスレッド・モードで動作している場合は、活動スレッドに関連する割込みのみがソフトウェアに与えられる。したがって、図5のブロック136および138を参照すると、スレッド0が活動状態の場合、PMC84aに関連する割込みのみが与えられる。PMC84bに関連する割込みは、スレッド1が再び活動状態になるまで保管される。あるいは、ブロック140および150に示すように、スレッド1が活動状態の場合、PMC84bに関連する割込みがソフトウェアに与えられ、PMC84aに関連する割込みは、スレッド0が再び活動状態になるまで保管される。図3において、この割込み挙動は、ORゲート104および108およびANDゲート106および110によって実施される。
【0030】
次いで、図6を参照すると、パフォーマンス・モニタ50内のPMC1〜PMC8にアクセスする方法を要約した論理流れ図が示されている。図示のように、プロセスは、LSU32が、読み取るべき特定のPMCを指定する命令をディスパッチ・ユニット21から受け取ったことに応答して、ブロック200から始まる。この命令に応答して、LSU32は、PMC数をパフォーマンス・モニタ50に与える。PMC数は、ブロック202で、パフォーマンス・モニタ50がマルチスレッド・モードで動作しているか、それともグローバル・モードで動作しているかを判定する。ブロック204でパフォーマンス・モニタ50がグローバル・モードで動作しているとの判定に応答して、パフォーマンス・モニタ50は、指定されたPMCの値を整数レジスタ38の指定された1つに出力する。
【0031】
再びブロック202を参照すると、パフォーマンス・モニタ50がマルチスレッド・モードで動作しているとの判定に応答して、プロセスはブロック206に進む。ブロック206では、スレッド0またはスレッド1が活動スレッドであるか否か判定する。スレッド1が活動スレッドである場合、1〜4の有効範囲を有する指定されたPMCアドレスが、ブロック208で、PMC5〜PMC8のそれぞれ1つにマッピングされる。あるいは、スレッド0が活動スレッドである場合、指定されたPMCアドレスは、ブロック210で、各PMC1〜PMC4の対応する1つにアクセスするために使用される。図3に示すように、このPMCアドレス・マッピングは、論理90をアドレス指定することによって実施される。
【0032】
上述のように、本発明は、第1のモードで動作しているときに複数の並行スレッドのパフォーマンスを個々に監視することができるパフォーマンス・モニタを含むマルチスレッド・プロセッサを提供する。さらに、パフォーマンス・モニタは、プロセッサによって生成されたすべてのイベント・オカレンスを集合的に監視する第2のモードで動作するようにソフトウェアによって構成することができる。
【0033】
まとめとして、本発明の構成に関して以下の事項を開示する。
【0034】
(1)第1のスレッド内の命令および第2のスレッド内の命令に応答するプロセッサと、
前記第1のスレッドに応答して前記プロセッサによって生成された第1のイベント・オカレンス、および前記第2のスレッドに応答して前記プロセッサによって生成された第2のイベント・オカレンスを別々に記録するパフォーマンス・モニタとを含む、マルチスレッド・プロセッサ内でパフォーマンスを監視するシステム。
(2)前記プロセッサと前記パフォーマンス・モニタがどちらも単一の半導体基板内に形成されることを特徴とする、上記(1)に記載のシステム。
(3)前記パフォーマンス・モニタが、第1のカウンタおよび第2のカウンタを含み、かつ第1の動作モードを有し、前記パフォーマンス・モニタが前記第1の動作モードで動作しているときに、前記第1のカウンタが前記第1のイベント・オカレンスに応答して増分し、前記第2のカウンタが前記第2のイベント・オカレンスに応答して増分することを特徴とする、上記(1)に記載のシステム。
(4)前記第1のイベント・オカレンスと前記第2のイベント・オカレンスが同じイベントの2つのオカレンスであることを特徴とする、上記(3)に記載のシステム。
(5)前記パフォーマンス・モニタが第2の動作モードを有し、前記パフォーマンス・モニタが前記第2の動作モードで動作しているときに、前記第1のカウンタが前記第1のイベント・オカレンスならびに前記第2のイベント・オカレンスに応答して増分することを特徴とする、上記(3)に記載のシステム。
(6)前記プロセッサが前記第1のスレッドおよび前記第2のスレッドに応答して、複数の様々なイベントのオカレンスを生成し、前記パフォーマンス・モニタが、そのオカレンスが記録される前記複数の様々なイベントのサブセットを選択的に決定する制御装置を含むことを特徴とする、上記(1)に記載のシステム。
(7)前記マルチスレッド・プロセッサが前記第1のスレッドと前記第2のスレッドを一時に1つ実行し、前記第2のスレッド内の少なくとも1つの命令が、前記第1のイベント・オカレンスの生成と、前記第1のスレッドに応答して生成された第3のイベント・オカレンスの生成との間に前記プロセッサによって実行され、前記パフォーマンス・モニタが前記第1のイベント・オカレンスと前記第3のイベント・オカレンスを一緒に記録することを特徴とする、上記(1)に記載のシステム。
(8)前記プロセッサが、前記第1のスレッドが非活動状態である間に前記第1のイベント・オカレンスを生成することを特徴とする、上記(1)に記載のシステム。
(9)前記パフォーマンス・モニタが、イベント・オカレンスを記録する複数のカウンタを含み、前記複数のカウンタの第1のサブセットが前記第1のスレッドに割り振られ、前記複数のカウンタの第2のサブセットが前記第2のスレッドに割り振られ、特定のイベントに対して、前記第1のサブセットに属するカウンタのみが、前記第1のスレッドが活動状態である間に生成された前記特定のイベントのオカレンスに応答して増分することができ、前記第2のサブセットに属するカウンタのみが、前記第2のスレッドが活動状態である間に生成された前記特定のイベントのオカレンスに応答して増分することができることを特徴とする、上記(1)に記載のシステム。
(10)アドレス指定論理をさらに含み、前記第1のスレッドおよび前記第2のスレッドのうちの一方からの読取り要求に応答して、前記アドレス指定論理が、前記カウンタの第1のサブセットおよび前記カウンタの第2のサブセットのうち対応する一方のサブセット中の特定のカウンタに前記読取り要求をマッピングすることを特徴とする、上記(9)に記載のシステム。
(11)割込み発生回路をさらに含み、前記割込み発生回路が、前記第1のスレッドが活動状態であるときにのみ前記第1のサブセット中のカウンタの状態に応答して割込みを発生し、かつ前記第2のスレッドが活動状態であるときにのみ前記第2のサブセット中のカウンタの状態に応答して割込みを発生することを特徴とする、上記(9)に記載のシステム。
(12)マルチスレッド・プロセッサ内で、第1のスレッドおよび第2のスレッドを処理するステップと、
前記第1のスレッドを処理するステップに応答して前記マルチスレッド・プロセッサ内で第1のイベント・オカレンスを生成し、かつ前記第2のスレッドを処理するステップに応答して前記マルチスレッド・プロセッサ内で第2のイベント・オカレンスを生成するステップと、
前記第1のイベント・オカレンスおよび前記第2のイベント・オカレンスを別々に記録するステップとを含む、マルチスレッド・プロセッサ内でパフォーマンスを監視する方法。
(13)前記マルチスレッド・プロセッサが、第1のカウンタおよび第2のカウンタを含むパフォーマンス・モニタを有し、前記パフォーマンス・モニタが第1の動作モードを有し、前記第1のイベント・オカレンスおよび前記第2のイベント・オカレンスを別々に記録する前記ステップが、前記第1のモードで動作している前記パフォーマンス・モニタに応答して実施され、前記記録ステップが、
前記第1のイベント・オカレンスに応答して前記第1のカウンタを増分し、かつ前記第2のイベント・オカレンスに応答して前記第2のカウンタを増分するステップを含むことを特徴とする、上記(12)に記載の方法。
(14)前記第1のイベント・オカレンスと前記第2のイベント・オカレンスが同じイベントの2つのオカレンスであることを特徴とする、上記(13)に記載の方法。
(15)前記パフォーマンス・モニタが第2の動作モードを有し、
前記パフォーマンス・モニタが前記第2のモードで動作するのに応答して、前記第1のイベント・オカレンスならびに前記第2のイベント・オカレンスに応答して前記第1のカウンタを増分するステップをさらに含むことを特徴とする、上記(14)に記載の方法。
(16)前記マルチスレッド・プロセッサが前記第1のスレッドおよび前記第2のスレッドを処理するステップに応答して、複数の様々なイベントのオカレンスを生成し、そのオカレンスが記録される前記複数の様々なイベントのサブセットを選択的に決定するステップをさらに含むことを特徴とする、上記(12)に記載の方法。
(17)前記マルチスレッド・プロセッサが前記第1のスレッドと前記第2のスレッドを一時に1つ実行し、前記第2のスレッド内の少なくとも1つの命令が、前記第1のイベント・オカレンスの生成と、前記第1のスレッドに応答して生成された第3のイベント・オカレンスの生成との間に前記プロセッサによって実行され、この方法が前記第1のイベント・オカレンスと前記第3のイベント・オカレンスを一緒に記録するステップをさらに含むことを特徴とする、上記(12)に記載の方法。
(18)前記第1のイベント・オカレンスを生成する前記ステップが、前記第1のスレッドが非活動状態である間に前記第1のイベント・オカレンスを生成するステップをさらに含むことを特徴とする、上記(12)に記載の方法。
(19)前記マルチスレッド・プロセッサが、イベント・オカレンスを記録する複数のカウンタを含み、前記複数のカウンタの第1のサブセットが前記第1のスレッドに割り振られ、前記複数のカウンタの第2のサブセットが前記第2のスレッドに割り振られ、前記第1のイベント・オカレンスおよび前記第2のイベント・オカレンスが特定のイベントの2つのオカレンスであり、前記第1のイベント・オカレンスおよび前記第2のイベント・オカレンスを別々に記録する前記ステップが、
前記第1のスレッドが活動状態である間に生成された前記特定のイベントのオカレンスに応答して、前記第1のサブセットに属するカウンタを増分するステップと、
前記第2のスレッドが活動状態である間に生成された前記特定のイベントのオカレンスに応答して、前記第2のサブセットに属するカウンタを増分するステップとを含むことを特徴とする、上記(12)に記載の方法。
(20)前記第1のスレッドおよび前記第2のスレッドの1つによる読取り要求に応答して、前記カウンタの第1のサブセットおよび前記カウンタの第2のサブセットのうちの対応する一方のサブセット中の特定のカウンタに前記読取り要求をマッピングするステップをさらに含むことを特徴とする、上記(19)に記載の方法。
(21)前記第1のスレッドが活動状態であるときにのみ前記第1のサブセット中のカウンタの状態に応答して割込みを発生し、かつ前記第2のスレッドが活動状態であるときにのみ前記第2のサブセット中のカウンタの状態に応答して割込みを発生することを特徴とする、上記(19)に記載の方法。
以上
【図面の簡単な説明】
【図1】本発明によるパフォーマンス・モニタを含むデータ処理システムの例示的な実施形態を示す図である。
【図2】グローバル・モードで動作しているときの図1のパフォーマンス・モニタを示す図である。
【図3】マルチスレッド・モードで動作しているときの図1のパフォーマンス・モニタを示す図である。
【図4】パフォーマンス・モニタがグローバル・モードおよびマルチスレッド・モードで動作しているときにイベントがどのようにしてパフォーマンス・モニタ・カウンタへ送られるかを示す論理流れ図である。
【図5】パフォーマンス・モニタがそれぞれグローバル・モードおよびマルチスレッド・モードで動作しているときにパフォーマンス・モニタ割込みがどのようにして発生されるかを示す論理流れ図である。
【図6】パフォーマンス・モニタがグローバル・モードおよびマルチスレッド・モードで動作しているときにパフォーマンス・モニタ・カウンタにどのようにしてアクセスするかを示す論理流れ図である。
【符号の説明】
10 プロセッサ
11 システム・バス
12 バス・インタフェース・ユニット(BIU)
13 トランザクション・ルックアサイド・バッファ
14 L1命令キャッシュ
15 ライン・バッファ
16 L1データ・キャッシュ
17 順次バッファ
18 スレッド・スイッチ・バッファ
19 分岐バッファ
20 分岐処理ユニット(BPU)
21 ディスパッチ・ユニット
23 記憶制御回路
25 命令ユニット(IU)論理パーティション
26 浮動小数点(FP)論理パーティション
27 倍精度浮動小数点ユニット(FPU)
28 浮動小数点レジスタ(FPR)
30 固定小数点(FX)論理パーティション
32 ロード・ストア・ユニット(LSU)
34 単複整数ユニット
36 単整数ユニット
38 整数レジスタ
50 パフォーマンス・モニタ
52 主メモリ
54 不揮発性大容量記憶装置
56 L2キャッシュ
58 L2キャッシュ・インタフェース
82 マルチプレクサ
82a マルチプレクサ
82b マルチプレクサ
84 PMC
86 選択入力
86a 選択入力
86b 選択入力
88 ORゲート
90 論理
100 ANDゲート
102 ANDゲート
Claims (19)
- 第1のスレッド内の命令および第2のスレッド内の命令に応答するプロセッサと、
前記第1のスレッドに応答して前記プロセッサによって生成された第1のイベント・オカレンス、および前記第2のスレッドに応答して前記プロセッサによって生成された第2のイベント・オカレンスを別々に記録するパフォーマンス・モニタとを含み、
前記第1のイベント・オカレンスと前記第2のイベント・オカレンスが同じイベントの2つのオカレンスであることを特徴とする、マルチスレッド・プロセッサ内でパフォーマンスを監視するシステム。 - 前記プロセッサと前記パフォーマンス・モニタがどちらも単一の半導体基板内に形成されることを特徴とする、請求項1に記載のシステム。
- 前記パフォーマンス・モニタが、第1のカウンタおよび第2のカウンタを含み、かつ第1の動作モードを有し、前記パフォーマンス・モニタが前記第1の動作モードで動作しているときに、前記第1のカウンタが前記第1のイベント・オカレンスに応答して増分し、前記第2のカウンタが前記第2のイベント・オカレンスに応答して増分することを特徴とする、請求項1に記載のシステム。
- 前記パフォーマンス・モニタが第2の動作モードを有し、前記パフォーマンス・モニタが前記第2の動作モードで動作しているときに、前記第1のカウンタが前記第1のイベント・オカレンスならびに前記第2のイベント・オカレンスに応答して増分することを特徴とする、請求項3に記載のシステム。
- 前記プロセッサが前記第1のスレッドおよび前記第2のスレッドに応答して、複数の様々なイベントのオカレンスを生成し、前記パフォーマンス・モニタが、そのオカレンスが記録される前記複数の様々なイベントのサブセットを選択的に決定する制御装置を含むことを特徴とする、請求項1に記載のシステム。
- 前記マルチスレッド・プロセッサが前記第1のスレッドと前記第2のスレッドを一時に1つ実行し、前記第2のスレッド内の少なくとも1つの命令が、前記第1のイベント・オカレンスの生成と、前記第1のスレッドに応答して生成された第3のイベント・オカレンスの生成との間に前記プロセッサによって実行され、前記パフォーマンス・モニタが前記第1のイベント・オカレンスと前記第3のイベント・オカレンスを一緒に記録することを特徴とする、請求項1に記載のシステム。
- 前記プロセッサが、前記第1のスレッドが非活動状態である間に前記第1のイベント・オカレンスを生成することを特徴とする、請求項1に記載のシステム。
- 前記パフォーマンス・モニタが、イベント・オカレンスを記録する複数のカウンタを含み、前記複数のカウンタの第1のサブセットが前記第1のスレッドに割り振られ、前記複数のカウンタの第2のサブセットが前記第2のスレッドに割り振られ、特定のイベントに対して、前記第1のサブセットに属するカウンタのみが、前記第1のスレッドが活動状態である間に生成された前記特定のイベントのオカレンスに応答して増分することができ、前記第2のサブセットに属するカウンタのみが、前記第2のスレッドが活動状態である間に生成された前記特定のイベントのオカレンスに応答して増分することができることを特徴とする、請求項1に記載のシステム。
- アドレス指定論理をさらに含み、前記第1のスレッドおよび前記第2のスレッドのうちの一方からの読取り要求に応答して、前記アドレス指定論理が、前記カウンタの第1のサブセットおよび前記カウンタの第2のサブセットのうち対応する一方のサブセット中の特定のカウンタに前記読取り要求をマッピングすることを特徴とする、請求項8に記載のシステム。
- 割込み発生回路をさらに含み、前記割込み発生回路が、前記第1のスレッドが活動状態であるときにのみ前記第1のサブセット中のカウンタの状態に応答して割込みを発生し、かつ前記第2のスレッドが活動状態であるときにのみ前記第2のサブセット中のカウンタの状態に応答して割込みを発生することを特徴とする、請求項8に記載のシステム。
- マルチスレッド・プロセッサ内で、第1のスレッドおよび第2のスレッドを処理するステップと、
前記第1のスレッドを処理するステップに応答して前記マルチスレッド・プロセッサ内で第1のイベント・オカレンスを生成し、かつ前記第2のスレッドを処理するステップに応答して前記マルチスレッド・プロセッサ内で第2のイベント・オカレンスを生成するステップと、
前記第1のイベント・オカレンスおよび前記第2のイベント・オカレンスを別々に記録するステップとを含み、
前記第1のイベント・オカレンスと前記第2のイベント・オカレンスが同じイベントの2つのオカレンスであることを特徴とする、マルチスレッド・プロセッサ内でパフォーマンスを監視する方法。 - 前記マルチスレッド・プロセッサが、第1のカウンタおよび第2のカウンタを含むパフォーマンス・モニタを有し、前記パフォーマンス・モニタが第1の動作モードを有し、前記第1のイベント・オカレンスおよび前記第2のイベント・オカレンスを別々に記録する前記ステップが、前記第1のモードで動作している前記パフォーマンス・モニタに応答して実施され、前記記録ステップが、
前記第1のイベント・オカレンスに応答して前記第1のカウンタを増分し、かつ前記第2のイベント・オカレンスに応答して前記第2のカウンタを増分するステップを含むことを特徴とする、請求項11に記載の方法。 - 前記パフォーマンス・モニタが第2の動作モードを有し、
前記パフォーマンス・モニタが前記第2のモードで動作するのに応答して、前記第1のイベント・オカレンスならびに前記第2のイベント・オカレンスに応答して前記第1のカウンタを増分するステップをさらに含むことを特徴とする、請求項12に記載の方法。 - 前記マルチスレッド・プロセッサが前記第1のスレッドおよび前記第2のスレッドを処理するステップに応答して、複数の様々なイベントのオカレンスを生成し、そのオカレンスが記録される前記複数の様々なイベントのサブセットを選択的に決定するステップをさらに含むことを特徴とする、請求項11に記載の方法。
- 前記マルチスレッド・プロセッサが前記第1のスレッドと前記第2のスレッドを一時に1つ実行し、前記第2のスレッド内の少なくとも1つの命令が、前記第1のイベント・オカレンスの生成と、前記第1のスレッドに応答して生成された第3のイベント・オカレンスの生成との間に前記プロセッサによって実行され、この方法が前記第1のイベント・オカレンスと前記第3のイベント・オカレンスを一緒に記録するステップをさらに含むことを特徴とする、請求項11に記載の方法。
- 前記第1のイベント・オカレンスを生成する前記ステップが、前記第1のスレッドが非活動状態である間に前記第1のイベント・オカレンスを生成するステップをさらに含むことを特徴とする、請求項11に記載の方法。
- 前記マルチスレッド・プロセッサが、イベント・オカレンスを記録する複数のカウンタを含み、前記複数のカウンタの第1のサブセットが前記第1のスレッドに割り振られ、前記複数のカウンタの第2のサブセットが前記第2のスレッドに割り振られ、前記第1のイベント・オカレンスおよび前記第2のイベント・オカレンスが特定のイベントの2つのオカレンスであり、前記第1のイベント・オカレンスおよび前記第2のイベント・オカレンスを別々に記録する前記ステップが、
前記第1のスレッドが活動状態である間に生成された前記特定のイベントのオカレンスに応答して、前記第1のサブセットに属するカウンタを増分するステップと、
前記第2のスレッドが活動状態である間に生成された前記特定のイベントのオカレンスに応答して、前記第2のサブセットに属するカウンタを増分するステップとを含むことを特徴とする、請求項11に記載の方法。 - 前記第1のスレッドおよび前記第2のスレッドの1つによる読取り要求に応答して、前記カウンタの第1のサブセットおよび前記カウンタの第2のサブセットのうちの対応する一方のサブセット中の特定のカウンタに前記読取り要求をマッピングするステップをさらに含むことを特徴とする、請求項17に記載の方法。
- 前記第1のスレッドが活動状態であるときにのみ前記第1のサブセット中のカウンタの状態に応答して割込みを発生し、かつ前記第2のスレッドが活動状態であるときにのみ前記第2のサブセット中のカウンタの状態に応答して割込みを発生することを特徴とする、請求項17に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/814,390 US5835705A (en) | 1997-03-11 | 1997-03-11 | Method and system for performance per-thread monitoring in a multithreaded processor |
US08/814390 | 1997-03-11 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10275100A JPH10275100A (ja) | 1998-10-13 |
JP3609603B2 true JP3609603B2 (ja) | 2005-01-12 |
Family
ID=25214923
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP04919098A Expired - Fee Related JP3609603B2 (ja) | 1997-03-11 | 1998-03-02 | マルチスレッド・プロセッサ内でパフォーマンスを監視する方法およびシステム |
Country Status (8)
Country | Link |
---|---|
US (2) | US5835705A (ja) |
JP (1) | JP3609603B2 (ja) |
KR (1) | KR100384263B1 (ja) |
CN (1) | CN1153139C (ja) |
GB (1) | GB2324393B (ja) |
HK (1) | HK1015049A1 (ja) |
SG (1) | SG60202A1 (ja) |
TW (1) | TW385387B (ja) |
Families Citing this family (144)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6073159A (en) * | 1996-12-31 | 2000-06-06 | Compaq Computer Corporation | Thread properties attribute vector based thread selection in multithreading processor |
US5835705A (en) * | 1997-03-11 | 1998-11-10 | International Business Machines Corporation | Method and system for performance per-thread monitoring in a multithreaded processor |
US5991708A (en) * | 1997-07-07 | 1999-11-23 | International Business Machines Corporation | Performance monitor and method for performance monitoring within a data processing system |
US6567839B1 (en) * | 1997-10-23 | 2003-05-20 | International Business Machines Corporation | Thread switch control in a multithreaded processor system |
US6161166A (en) * | 1997-11-10 | 2000-12-12 | International Business Machines Corporation | Instruction cache for multithreaded processor |
US6256775B1 (en) * | 1997-12-11 | 2001-07-03 | International Business Machines Corporation | Facilities for detailed software performance analysis in a multithreaded processor |
US6098169A (en) * | 1997-12-23 | 2000-08-01 | Intel Corporation | Thread performance analysis by monitoring processor performance event registers at thread switch |
US6067643A (en) * | 1997-12-24 | 2000-05-23 | Intel Corporation | Programmable observation system for monitoring the performance of a graphics controller |
US6115682A (en) * | 1997-12-24 | 2000-09-05 | Intel Corporation | Apparatus for analyzing the performance of a computer system |
US6272520B1 (en) * | 1997-12-31 | 2001-08-07 | Intel Corporation | Method for detecting thread switch events |
FI108478B (fi) * | 1998-01-21 | 2002-01-31 | Nokia Corp | Sulautettu jõrjestelmõ |
US6044447A (en) * | 1998-01-30 | 2000-03-28 | International Business Machines Corporation | Method and apparatus for communicating translation command information in a multithreaded environment |
KR100280460B1 (ko) * | 1998-04-08 | 2001-02-01 | 김영환 | 데이터 처리 장치 및 이의 복수의 스레드 처리 방법 |
US6457064B1 (en) * | 1998-04-27 | 2002-09-24 | Sun Microsystems, Inc. | Method and apparatus for detecting input directed to a thread in a multi-threaded process |
US6275782B1 (en) | 1998-05-05 | 2001-08-14 | Advanced Micro Devices, Inc. | Non-intrusive performance monitoring |
US6256637B1 (en) * | 1998-05-05 | 2001-07-03 | Gemstone Systems, Inc. | Transactional virtual machine architecture |
US6243666B1 (en) * | 1998-06-12 | 2001-06-05 | Unisys Corporation | Maintenance system and interface for use in a modularized, high-speed data processing system |
US6301615B1 (en) * | 1998-10-14 | 2001-10-09 | Sun Microsystems, Inc. | Cluster performance monitoring utility |
US7529907B2 (en) | 1998-12-16 | 2009-05-05 | Mips Technologies, Inc. | Method and apparatus for improved computer load and store operations |
US7020879B1 (en) * | 1998-12-16 | 2006-03-28 | Mips Technologies, Inc. | Interrupt and exception handling for multi-streaming digital processors |
US6477562B2 (en) * | 1998-12-16 | 2002-11-05 | Clearwater Networks, Inc. | Prioritized instruction scheduling for multi-streaming processors |
US7035997B1 (en) | 1998-12-16 | 2006-04-25 | Mips Technologies, Inc. | Methods and apparatus for improving fetching and dispatch of instructions in multithreaded processors |
US7237093B1 (en) | 1998-12-16 | 2007-06-26 | Mips Technologies, Inc. | Instruction fetching system in a multithreaded processor utilizing cache miss predictions to fetch instructions from multiple hardware streams |
US7257814B1 (en) | 1998-12-16 | 2007-08-14 | Mips Technologies, Inc. | Method and apparatus for implementing atomicity of memory operations in dynamic multi-streaming processors |
US6389449B1 (en) * | 1998-12-16 | 2002-05-14 | Clearwater Networks, Inc. | Interstream control and communications for multi-streaming digital processors |
US6341338B1 (en) * | 1999-02-04 | 2002-01-22 | Sun Microsystems, Inc. | Protocol for coordinating the distribution of shared memory |
US6434714B1 (en) * | 1999-02-04 | 2002-08-13 | Sun Microsystems, Inc. | Methods, systems, and articles of manufacture for analyzing performance of application programs |
US6535905B1 (en) | 1999-04-29 | 2003-03-18 | Intel Corporation | Method and apparatus for thread switching within a multithreaded processor |
US6675371B1 (en) * | 1999-04-30 | 2004-01-06 | Hewlett-Packard Development Company, L.P. | Java and native application window integration |
US6542991B1 (en) | 1999-05-11 | 2003-04-01 | Sun Microsystems, Inc. | Multiple-thread processor with single-thread interface shared among threads |
US7086035B1 (en) * | 1999-05-13 | 2006-08-01 | International Business Machines Corporation | Method and system for counting non-speculative events in a speculative processor |
FI107422B (fi) * | 1999-06-24 | 2001-07-31 | Nokia Corp | Istuntojen hallinta |
US6542921B1 (en) * | 1999-07-08 | 2003-04-01 | Intel Corporation | Method and apparatus for controlling the processing priority between multiple threads in a multithreaded processor |
US7421572B1 (en) * | 1999-09-01 | 2008-09-02 | Intel Corporation | Branch instruction for processor with branching dependent on a specified bit in a register |
US6557167B1 (en) * | 1999-09-03 | 2003-04-29 | International Business Machines Corporation | Apparatus and method for analyzing performance of a computer program |
US6754690B2 (en) * | 1999-09-16 | 2004-06-22 | Honeywell, Inc. | Method for time partitioned application scheduling in a computer operating system |
US6714904B1 (en) * | 1999-10-13 | 2004-03-30 | Transmeta Corporation | System for using rate of exception event generation during execution of translated instructions to control optimization of the translated instructions |
US7761857B1 (en) | 1999-10-13 | 2010-07-20 | Robert Bedichek | Method for switching between interpretation and dynamic translation in a processor system based upon code sequence execution counts |
US6357016B1 (en) * | 1999-12-09 | 2002-03-12 | Intel Corporation | Method and apparatus for disabling a clock signal within a multithreaded processor |
US6889319B1 (en) | 1999-12-09 | 2005-05-03 | Intel Corporation | Method and apparatus for entering and exiting multiple threads within a multithreaded processor |
US6496925B1 (en) | 1999-12-09 | 2002-12-17 | Intel Corporation | Method and apparatus for processing an event occurrence within a multithreaded processor |
US7051329B1 (en) | 1999-12-28 | 2006-05-23 | Intel Corporation | Method and apparatus for managing resources in a multithreaded processor |
US6671795B1 (en) * | 2000-01-21 | 2003-12-30 | Intel Corporation | Method and apparatus for pausing execution in a processor or the like |
US7035989B1 (en) | 2000-02-16 | 2006-04-25 | Sun Microsystems, Inc. | Adaptive memory allocation |
US7856633B1 (en) | 2000-03-24 | 2010-12-21 | Intel Corporation | LRU cache replacement for a partitioned set associative cache |
US6594821B1 (en) | 2000-03-30 | 2003-07-15 | Transmeta Corporation | Translation consistency checking for modified target instructions by comparing to original copy |
US7093109B1 (en) * | 2000-04-04 | 2006-08-15 | International Business Machines Corporation | Network processor which makes thread execution control decisions based on latency event lengths |
US6546359B1 (en) | 2000-04-24 | 2003-04-08 | Sun Microsystems, Inc. | Method and apparatus for multiplexing hardware performance indicators |
US6647546B1 (en) | 2000-05-03 | 2003-11-11 | Sun Microsystems, Inc. | Avoiding gather and scatter when calling Fortran 77 code from Fortran 90 code |
US6802057B1 (en) | 2000-05-03 | 2004-10-05 | Sun Microsystems, Inc. | Automatic generation of fortran 90 interfaces to fortran 77 code |
US6556952B1 (en) | 2000-05-04 | 2003-04-29 | Advanced Micro Devices, Inc. | Performance monitoring and optimizing of controller parameters |
US6615300B1 (en) | 2000-06-19 | 2003-09-02 | Transmeta Corporation | Fast look-up of indirect branch destination in a dynamic translation system |
JP2004518183A (ja) | 2000-07-14 | 2004-06-17 | クリアウオーター・ネツトワークス・インコーポレイテツド | マルチスレッド・システムにおける命令のフェッチとディスパッチ |
US6986130B1 (en) | 2000-07-28 | 2006-01-10 | Sun Microsystems, Inc. | Methods and apparatus for compiling computer programs using partial function inlining |
US6748556B1 (en) * | 2000-08-15 | 2004-06-08 | International Business Machines Corporation | Changing the thread capacity of a multithreaded computer processor |
US6910107B1 (en) | 2000-08-23 | 2005-06-21 | Sun Microsystems, Inc. | Method and apparatus for invalidation of data in computer systems |
US6701447B1 (en) * | 2000-09-06 | 2004-03-02 | International Business Machines Corporation | System for delaying the counting of occurrences of a plurality of events occurring in a processor until the disposition of the event has been determined |
US6658584B1 (en) * | 2000-09-06 | 2003-12-02 | International Business Machines Corporation | Method and structure for managing large counter arrays |
US6854119B1 (en) * | 2000-09-29 | 2005-02-08 | International Business Machines Corporation | Method, apparatus and article of manufacture for tracking processes |
US7406681B1 (en) | 2000-10-12 | 2008-07-29 | Sun Microsystems, Inc. | Automatic conversion of source code from 32-bit to 64-bit |
US6957208B1 (en) | 2000-10-31 | 2005-10-18 | Sun Microsystems, Inc. | Method, apparatus, and article of manufacture for performance analysis using semantic knowledge |
US7448025B2 (en) * | 2000-12-29 | 2008-11-04 | Intel Corporation | Qualification of event detection by thread ID and thread privilege level |
GB2372847B (en) * | 2001-02-19 | 2004-12-29 | Imagination Tech Ltd | Control of priority and instruction rates on a multithreaded processor |
US7225446B2 (en) * | 2001-02-20 | 2007-05-29 | Pts Corporation | Context preservation |
US7320065B2 (en) | 2001-04-26 | 2008-01-15 | Eleven Engineering Incorporated | Multithread embedded processor with input/output capability |
US6651158B2 (en) * | 2001-06-22 | 2003-11-18 | Intel Corporation | Determination of approaching instruction starvation of threads based on a plurality of conditions |
US7134002B2 (en) * | 2001-08-29 | 2006-11-07 | Intel Corporation | Apparatus and method for switching threads in multi-threading processors |
US7363474B2 (en) * | 2001-12-31 | 2008-04-22 | Intel Corporation | Method and apparatus for suspending execution of a thread until a specified memory access occurs |
AU2003231945A1 (en) * | 2002-05-31 | 2003-12-19 | Guang R. Gao | Method and apparatus for real-time multithreading |
US8024735B2 (en) * | 2002-06-14 | 2011-09-20 | Intel Corporation | Method and apparatus for ensuring fairness and forward progress when executing multiple threads of execution |
US7065596B2 (en) * | 2002-09-19 | 2006-06-20 | Intel Corporation | Method and apparatus to resolve instruction starvation |
US7185338B2 (en) * | 2002-10-15 | 2007-02-27 | Sun Microsystems, Inc. | Processor with speculative multithreading and hardware to support multithreading software |
US7360220B2 (en) * | 2002-10-31 | 2008-04-15 | Intel Corporation | Methods and apparatus for multi-threading using differently coded software segments to perform an algorithm |
US7174554B2 (en) * | 2002-12-20 | 2007-02-06 | Microsoft Corporation | Tools and methods for discovering race condition errors |
TWI261198B (en) * | 2003-02-20 | 2006-09-01 | Samsung Electronics Co Ltd | Simultaneous multi-threading processor circuits and computer program products configured to operate at different performance levels based on a number of operating threads and methods of operating |
US7152170B2 (en) * | 2003-02-20 | 2006-12-19 | Samsung Electronics Co., Ltd. | Simultaneous multi-threading processor circuits and computer program products configured to operate at different performance levels based on a number of operating threads and methods of operating |
US7310723B1 (en) | 2003-04-02 | 2007-12-18 | Transmeta Corporation | Methods and systems employing a flag for deferring exception handling to a commit or rollback point |
US7657893B2 (en) | 2003-04-23 | 2010-02-02 | International Business Machines Corporation | Accounting method and logic for determining per-thread processor resource utilization in a simultaneous multi-threaded (SMT) processor |
US7496915B2 (en) * | 2003-04-24 | 2009-02-24 | International Business Machines Corporation | Dynamic switching of multithreaded processor between single threaded and simultaneous multithreaded modes |
US7143267B2 (en) * | 2003-04-28 | 2006-11-28 | International Business Machines Corporation | Partitioning prefetch registers to prevent at least in part inconsistent prefetch information from being stored in a prefetch register of a multithreading processor |
US7653904B2 (en) * | 2003-09-26 | 2010-01-26 | Intel Corporation | System for forming a critical update loop to continuously reload active thread state from a register storing thread state until another active thread is detected |
US7406698B2 (en) * | 2003-12-30 | 2008-07-29 | Microsoft Corporation | Driver framework component for synchronizing interactions between a multi-threaded environment and a driver operating in a less-threaded software environment |
US7617488B2 (en) * | 2003-12-30 | 2009-11-10 | Intel Corporation | Method and apparatus and determining processor utilization |
US7526757B2 (en) * | 2004-01-14 | 2009-04-28 | International Business Machines Corporation | Method and apparatus for maintaining performance monitoring structures in a page table for use in monitoring performance of a computer program |
US20050183065A1 (en) * | 2004-02-13 | 2005-08-18 | Wolczko Mario I. | Performance counters in a multi-threaded processor |
US8826241B2 (en) | 2004-02-16 | 2014-09-02 | Oracle America, Inc. | Instruction sampling in a multi-threaded processor |
US20050188186A1 (en) * | 2004-02-23 | 2005-08-25 | Wolczko Mario I. | Obtaining execution path information in an instruction sampling system |
US7555753B2 (en) * | 2004-02-26 | 2009-06-30 | International Business Machines Corporation | Measuring processor use in a hardware multithreading processor environment |
US20050198555A1 (en) * | 2004-03-03 | 2005-09-08 | Wolczko Mario I. | Incorporating instruction reissue in an instruction sampling mechanism |
US7154301B2 (en) * | 2004-03-26 | 2006-12-26 | Intel Corporation | Apparatus and method for a low jitter predriver for differential output drivers |
US7216223B2 (en) * | 2004-04-30 | 2007-05-08 | Hewlett-Packard Development Company, L.P. | Configuring multi-thread status |
US7590830B2 (en) * | 2004-05-28 | 2009-09-15 | Sun Microsystems, Inc. | Method and structure for concurrent branch prediction in a processor |
US20060005083A1 (en) * | 2004-06-30 | 2006-01-05 | International Business Machines Corporation | Performance count tracing |
US7702887B1 (en) * | 2004-06-30 | 2010-04-20 | Sun Microsystems, Inc. | Performance instrumentation in a fine grain multithreaded multicore processor |
GB0420442D0 (en) * | 2004-09-14 | 2004-10-20 | Ignios Ltd | Debug in a multicore architecture |
US7552212B2 (en) * | 2004-10-22 | 2009-06-23 | International Business Machines Corporation | Intelligent performance monitoring based on user transactions |
US20060129999A1 (en) * | 2004-11-16 | 2006-06-15 | Sony Computer Entertainment Inc. | Methods and apparatus for using bookmarks in a trace buffer |
US7681196B2 (en) * | 2004-11-18 | 2010-03-16 | Oracle International Corporation | Providing optimal number of threads to applications performing multi-tasking using threads |
US7200522B2 (en) * | 2005-01-27 | 2007-04-03 | International Business Machines Corporation | Method, apparatus, and computer program product in a performance monitor for sampling all performance events generated by a processor |
US20060212840A1 (en) * | 2005-03-16 | 2006-09-21 | Danny Kumamoto | Method and system for efficient use of secondary threads in a multiple execution path processor |
US7774784B2 (en) * | 2005-03-17 | 2010-08-10 | Microsoft Corporation | Determining an actual amount of time a processor consumes in executing a portion of code |
US7917907B2 (en) * | 2005-03-23 | 2011-03-29 | Qualcomm Incorporated | Method and system for variable thread allocation and switching in a multithreaded processor |
US20060271625A1 (en) * | 2005-05-25 | 2006-11-30 | International Business Machines Corporation | Selective monitoring and publishing of discussion threads with membership linking |
US20060277395A1 (en) * | 2005-06-06 | 2006-12-07 | Fowles Richard G | Processor performance monitoring |
US8413162B1 (en) | 2005-06-28 | 2013-04-02 | Guillermo J. Rozas | Multi-threading based on rollback |
US8230419B2 (en) * | 2005-07-26 | 2012-07-24 | International Business Machines Corporation | Method, system and program product for capturing central processing unit (CPU) utilization for a process on a virtual machine |
US7487317B1 (en) * | 2005-11-03 | 2009-02-03 | Sun Microsystems, Inc. | Cache-aware scheduling for a chip multithreading processor |
US20070139421A1 (en) * | 2005-12-21 | 2007-06-21 | Wen Chen | Methods and systems for performance monitoring in a graphics processing unit |
US8001549B2 (en) * | 2006-04-27 | 2011-08-16 | Panasonic Corporation | Multithreaded computer system and multithread execution control method |
JP4971679B2 (ja) * | 2006-05-10 | 2012-07-11 | ルネサスエレクトロニクス株式会社 | プロセッサシステム及びプロセッサシステムの性能測定方法 |
CN100409200C (zh) * | 2006-08-04 | 2008-08-06 | 上海科泰世纪科技有限公司 | 对嵌入式操作系统的性能信息进行实时监测的方法 |
US8533530B2 (en) * | 2006-11-15 | 2013-09-10 | Qualcomm Incorporated | Method and system for trusted/untrusted digital signal processor debugging operations |
US8370806B2 (en) | 2006-11-15 | 2013-02-05 | Qualcomm Incorporated | Non-intrusive, thread-selective, debugging method and system for a multi-thread digital signal processor |
US8380966B2 (en) * | 2006-11-15 | 2013-02-19 | Qualcomm Incorporated | Method and system for instruction stuffing operations during non-intrusive digital signal processor debugging |
US8341604B2 (en) * | 2006-11-15 | 2012-12-25 | Qualcomm Incorporated | Embedded trace macrocell for enhanced digital signal processor debugging operations |
US8264491B1 (en) * | 2007-04-09 | 2012-09-11 | Nvidia Corporation | System, method, and computer program product for controlling a shader to gather statistics |
US8484516B2 (en) * | 2007-04-11 | 2013-07-09 | Qualcomm Incorporated | Inter-thread trace alignment method and system for a multi-threaded processor |
JP5136553B2 (ja) | 2007-06-20 | 2013-02-06 | 富士通株式会社 | 演算処理装置及び演算処理装置の制御方法 |
US20090019797A1 (en) * | 2007-07-19 | 2009-01-22 | Cameron Todd Gunn | Simplified Protective Cover Assembly |
US7987345B2 (en) * | 2007-09-28 | 2011-07-26 | Broadcom Corporation | Performance monitors in a multithreaded processor architecture |
US9098625B2 (en) * | 2008-02-29 | 2015-08-04 | International Business Machines Corporation | Viral trace |
US8161493B2 (en) * | 2008-07-15 | 2012-04-17 | International Business Machines Corporation | Weighted-region cycle accounting for multi-threaded processor cores |
US8892916B2 (en) * | 2008-08-06 | 2014-11-18 | International Business Machines Corporation | Dynamic core pool management |
US20100115494A1 (en) * | 2008-11-03 | 2010-05-06 | Gorton Jr Richard C | System for dynamic program profiling |
US8024719B2 (en) | 2008-11-03 | 2011-09-20 | Advanced Micro Devices, Inc. | Bounded hash table sorting in a dynamic program profiling system |
US8478948B2 (en) | 2008-12-04 | 2013-07-02 | Oracle America, Inc. | Method and system for efficient tracing and profiling of memory accesses during program execution |
US8423972B2 (en) | 2009-02-27 | 2013-04-16 | International Business Machines Corporation | Collecting profile-specified performance data on a multithreaded data processing system |
US8578382B2 (en) * | 2009-05-19 | 2013-11-05 | Qualcomm Incorporated | Associating data for events occurring in software threads with synchronized clock cycle counters |
US9672132B2 (en) * | 2009-11-19 | 2017-06-06 | Qualcomm Incorporated | Methods and apparatus for measuring performance of a multi-thread processor |
KR101635816B1 (ko) * | 2010-07-02 | 2016-07-04 | 삼성전자주식회사 | 결정적 프로그레스 인덱스를 이용한 스레드 프로그레스 트래킹 방법 및 장치 |
US9092568B2 (en) * | 2012-04-30 | 2015-07-28 | Nec Laboratories America, Inc. | Method and system for correlated tracing with automated multi-layer function instrumentation localization |
US20130332778A1 (en) * | 2012-06-07 | 2013-12-12 | Vmware, Inc. | Performance-imbalance-monitoring processor features |
US9021172B2 (en) | 2012-07-06 | 2015-04-28 | Arm Limited | Data processing apparatus and method and method for generating performance monitoring interrupt signal based on first event counter and second event counter |
US9471318B2 (en) | 2013-03-15 | 2016-10-18 | International Business Machines Corporation | System management and instruction counting |
US9298651B2 (en) * | 2013-06-24 | 2016-03-29 | International Business Machines Corporation | Continuous in-memory accumulation of hardware performance counter data |
US9405575B2 (en) * | 2013-09-09 | 2016-08-02 | Apple Inc. | Use of multi-thread hardware for efficient sampling |
US9799087B2 (en) | 2013-09-09 | 2017-10-24 | Apple Inc. | Shader program profiler |
US20150120009A1 (en) * | 2013-10-31 | 2015-04-30 | Rockwell Automation Technologies, Inc. | Independent Operation of Control Hardware and a Monitoring System in an Automation Controller |
US9122800B1 (en) * | 2014-05-30 | 2015-09-01 | Honeywell International Inc. | System and method of non-intrusive measurement of memory access profiles of threads in a multi-core processor |
CN104239183B (zh) * | 2014-09-22 | 2017-10-27 | 北京国双科技有限公司 | 监测系统性能的方法及装置 |
US10706101B2 (en) | 2016-04-14 | 2020-07-07 | Advanced Micro Devices, Inc. | Bucketized hash tables with remap entries |
US10997048B2 (en) | 2016-12-30 | 2021-05-04 | Intel Corporation | Apparatus and method for multithreading-aware performance monitoring events |
US10909015B2 (en) * | 2016-12-30 | 2021-02-02 | Intel Corporation | Apparatus and method for generating performance monitoring metrics |
US10310830B2 (en) | 2017-06-02 | 2019-06-04 | Apple Inc. | Shader profiler |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US529727A (en) * | 1894-11-27 | William griscom | ||
US5694603A (en) * | 1982-09-28 | 1997-12-02 | Reiffin; Martin G. | Computer memory product with preemptive multithreading software |
US4821178A (en) * | 1986-08-15 | 1989-04-11 | International Business Machines Corporation | Internal performance monitoring by event sampling |
US5179702A (en) * | 1989-12-29 | 1993-01-12 | Supercomputer Systems Limited Partnership | System and method for controlling a highly parallel multiprocessor using an anarchy based scheduler for parallel execution thread scheduling |
US5193187A (en) * | 1989-12-29 | 1993-03-09 | Supercomputer Systems Limited Partnership | Fast interrupt mechanism for interrupting processors in parallel in a multiprocessor system wherein processors are assigned process ID numbers |
GB2256296B (en) * | 1991-05-31 | 1995-01-18 | Integrated Device Tech | Multiplexed status and diagnostic pins in a microprocessor with on-chip caches |
JPH0774984B2 (ja) * | 1991-06-10 | 1995-08-09 | インターナショナル・ビジネス・マシーンズ・コーポレイション | システム資源利用率測定方法とデータ処理システム |
US5355484A (en) * | 1991-08-12 | 1994-10-11 | International Business Machines Corporation | Dynamically established event monitors in event management services of a computer system |
JPH05204656A (ja) * | 1991-11-30 | 1993-08-13 | Toshiba Corp | スレッド固有データ保持方法 |
US5657253A (en) * | 1992-05-15 | 1997-08-12 | Intel Corporation | Apparatus for monitoring the performance of a microprocessor |
US5450349A (en) * | 1992-10-27 | 1995-09-12 | Digital Equipment Corporation | Computer system performance evaluation system and method |
US5490272A (en) * | 1994-01-28 | 1996-02-06 | International Business Machines Corporation | Method and apparatus for creating multithreaded time slices in a multitasking operating system |
AU2364095A (en) * | 1994-05-12 | 1995-12-05 | Ast Research, Inc. | Cpu activity monitoring through cache watching |
US5537541A (en) * | 1994-08-16 | 1996-07-16 | Digital Equipment Corporation | System independent interface for performance counters |
US5557548A (en) * | 1994-12-09 | 1996-09-17 | International Business Machines Corporation | Method and system for performance monitoring within a data processing system |
US5717926A (en) * | 1995-02-28 | 1998-02-10 | International Business Machines Corporation | Efficient forking of a process |
JPH096633A (ja) * | 1995-06-07 | 1997-01-10 | Internatl Business Mach Corp <Ibm> | データ処理システムに於ける高性能多重論理経路の動作用の方法とシステム |
US5838976A (en) * | 1995-11-28 | 1998-11-17 | Hewlett-Packard Co. | System and method for profiling code on symmetric multiprocessor architectures |
US5933627A (en) * | 1996-07-01 | 1999-08-03 | Sun Microsystems | Thread switch on blocked load or store using instruction thread field |
US5835705A (en) * | 1997-03-11 | 1998-11-10 | International Business Machines Corporation | Method and system for performance per-thread monitoring in a multithreaded processor |
US5907702A (en) * | 1997-03-28 | 1999-05-25 | International Business Machines Corporation | Method and apparatus for decreasing thread switch latency in a multithread processor |
-
1997
- 1997-03-11 US US08/814,390 patent/US5835705A/en not_active Expired - Lifetime
- 1997-10-23 US US08/955,404 patent/US6052708A/en not_active Expired - Lifetime
- 1997-11-04 TW TW086116367A patent/TW385387B/zh not_active IP Right Cessation
- 1997-11-26 KR KR1019970063192A patent/KR100384263B1/ko not_active IP Right Cessation
-
1998
- 1998-02-09 CN CNB981043984A patent/CN1153139C/zh not_active Expired - Fee Related
- 1998-02-19 SG SG1998000357A patent/SG60202A1/en unknown
- 1998-02-24 GB GB9803673A patent/GB2324393B/en not_active Expired - Lifetime
- 1998-03-02 JP JP04919098A patent/JP3609603B2/ja not_active Expired - Fee Related
-
1999
- 1999-01-05 HK HK99100012A patent/HK1015049A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
HK1015049A1 (en) | 1999-10-08 |
CN1193144A (zh) | 1998-09-16 |
SG60202A1 (en) | 1999-02-22 |
GB2324393B (en) | 2002-03-13 |
US6052708A (en) | 2000-04-18 |
TW385387B (en) | 2000-03-21 |
US5835705A (en) | 1998-11-10 |
CN1153139C (zh) | 2004-06-09 |
GB2324393A (en) | 1998-10-21 |
GB9803673D0 (en) | 1998-04-15 |
KR100384263B1 (ko) | 2003-10-10 |
JPH10275100A (ja) | 1998-10-13 |
KR19980079486A (ko) | 1998-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3609603B2 (ja) | マルチスレッド・プロセッサ内でパフォーマンスを監視する方法およびシステム | |
US8539485B2 (en) | Polling using reservation mechanism | |
US7133968B2 (en) | Method and apparatus for resolving additional load misses in a single pipeline processor under stalls of instructions not accessing memory-mapped I/O regions | |
US10061588B2 (en) | Tracking operand liveness information in a computer system and performing function based on the liveness information | |
US9940132B2 (en) | Load-monitor mwait | |
US7890734B2 (en) | Mechanism for selecting instructions for execution in a multithreaded processor | |
US5226130A (en) | Method and apparatus for store-into-instruction-stream detection and maintaining branch prediction cache consistency | |
US7676655B2 (en) | Single bit control of threads in a multithreaded multicore processor | |
US5937437A (en) | Method and apparatus for monitoring address translation performance | |
US7418582B1 (en) | Versatile register file design for a multi-threaded processor utilizing different modes and register windows | |
US8429386B2 (en) | Dynamic tag allocation in a multithreaded out-of-order processor | |
US7111126B2 (en) | Apparatus and method for loading data values | |
US20110055838A1 (en) | Optimized thread scheduling via hardware performance monitoring | |
US20050273559A1 (en) | Microprocessor architecture including unified cache debug unit | |
US20100332804A1 (en) | Unified high-frequency out-of-order pick queue with support for speculative instructions | |
US6718403B2 (en) | Hierarchical selection of direct and indirect counting events in a performance monitor unit | |
US6266759B1 (en) | Register scoreboarding to support overlapped execution of vector memory reference instructions in a vector processor | |
KR100745904B1 (ko) | 동시적 멀티스레드 프로세서에서 파이프라인 길이를변경하기 위한 방법 및 회로 | |
JP3919764B2 (ja) | 例外条件を解消するために同時マルチスレッド・プロセッサでディスパッチ・フラッシュを使用する方法 | |
US5596735A (en) | Circuit and method for addressing segment descriptor tables | |
US20130024647A1 (en) | Cache backed vector registers | |
US8205032B2 (en) | Virtual machine control structure identification decoder | |
US8046538B1 (en) | Method and mechanism for cache compaction and bandwidth reduction | |
GB2378278A (en) | Memory snapshot as a background process allowing write requests | |
US5970509A (en) | Hit determination circuit for selecting a data set based on miss determinations in other data sets and method of operation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20040109 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040406 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040907 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20041012 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20041014 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071022 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081022 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |