JP5186178B2 - プロセッサ性能計測のための重み付けされたイベント計数方法、プロセッサ、および重み付け性能カウンタ回路(プロセッサ性能計測のための重み付けされたイベント計数システムおよび方法) - Google Patents

プロセッサ性能計測のための重み付けされたイベント計数方法、プロセッサ、および重み付け性能カウンタ回路(プロセッサ性能計測のための重み付けされたイベント計数システムおよび方法) Download PDF

Info

Publication number
JP5186178B2
JP5186178B2 JP2007281412A JP2007281412A JP5186178B2 JP 5186178 B2 JP5186178 B2 JP 5186178B2 JP 2007281412 A JP2007281412 A JP 2007281412A JP 2007281412 A JP2007281412 A JP 2007281412A JP 5186178 B2 JP5186178 B2 JP 5186178B2
Authority
JP
Japan
Prior art keywords
processor
performance
events
weighted
event signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007281412A
Other languages
English (en)
Other versions
JP2008140380A (ja
Inventor
ジュアン・カルロス・ルビオ
マイケル・ステファン・フロイド
ソラヤ・ギアシ
カルシック・ラジャマニ
トーマス・ウォルター・ケラー・ジュニア
フリーマン・レイ・ローソン・サード
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2008140380A publication Critical patent/JP2008140380A/ja
Application granted granted Critical
Publication of JP5186178B2 publication Critical patent/JP5186178B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/348Circuit details, i.e. tracer hardware
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/86Event-based monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/88Monitoring involving counting

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Power Sources (AREA)

Description

本発明は、一般的には、プロセッサ性能計測システムに関し、より特定的には、待ち時間および誤りが低い性能計数システムに関する。
処理部の性能計測は、典型的には、プロセッサ内の部品の使用についての情報を累積するカウンタのセットによって行われる。そのような使用情報を得ることによって、高度な電力管理アルゴリズムが、プロセッサ周波数および電圧、アイドル時間、または他のエネルギ使用制御機構などの動作条件を調整して、電力消費または損失を減少させることができる一方で、理想的には、処理性能に対する影響を最小限にすることができる。
高精度の性能評価システムが複雑な多項式による計量に基づいて提案されているが、数多くの並行イベントを計測する必要がある。性能計測に寄与するイベントが、上述のような処理部の個別の使用である場合には、使用を計測しているカウンタが各部に提供される。そのような実施においては、数十の処理部、キャッシュ部、およびプロセッサの性能全体に寄与する他の部を有する複数のパイプラインを有することもある現代のプロセッサにおいて性能を計測するには、数多くのカウンタが必要となる。しかしながら、既存の性能計測の実施は、典型的には、計量が行われるごとに別個のカウンタが必要となり、典型的には、数多くのイベントを並行して処理することができない。したがって、そのような性能計測の実施では、電力管理制御がプロセッサの動作パラメータを変更する場合に、性能変化の正確な予測を提供することができなくなる。
計量毎に使用カウンタを提供する上述の手法に対する一代替策は、少ないセットのカウンタ(または単一のカウンタ)を時間多重して個別の計測を行うことである。しかしながら、そのような手法の総待ち時間は、きめの細かい制御を要するエネルギ管理システムにとって大きすぎる。さらに、内部計量による計測遅延によって、計測値に誤りが生じる。個別のカウンタを使用する場合であっても、典型的には、これらのカウンタを同時にアクセスすることはなく、これによっても、内部計量による遅延誤りおよび待ち時間の両方が生じる。
したがって、誤りおよび待ち時間の少ない使用情報を提供する性能計数方法およびシステムを提供することが望ましい。さらに、性能計測に寄与する計量毎にカウンタを必要としないシステムおよび方法を提供することが望ましい。
計量毎にカウンタを必要としない、待ち時間および誤りの少ない性能計測を提供するという目的は、重み付けされた性能カウンタ回路および方法において達成され、これらはプロセッサ内に内蔵されていてもよい。
重み付けされた性能カウンタは、プロセッサ内の複数の機能部において生じるイベントを示す複数のイベント信号を受信する。信号は、イベントとプロセッサの性能との相関性に従って重み付けされ、結果生じた重み付けされたイベント値が性能カウンタによって累積される。カウントは、プロセッサのクロック周期毎に累積されてもよい。重みは、プログラム制御下で調整可能なように、プログラム可能なレジスタから提供されてもよいし、または、回路内で提供される固定値であってもよい。
組み合わせ論理が、同一の重みを有するイベントを小計フィールドに累積して、複数のイベント信号を結合してもよい。互いに排他的なイベントは、組み合わせ結果内の単一のフィールドにマージされてもよい。
結果生じた重み付けされた性能カウントは、性能を最大限にするためにプロセッサの動作パラメータを調整し、電力消費を推測し、または電力消費の変化を予想するために、システム管理ソフトウェアまたはハードウェアもしくはその両方によって使用されてもよい。
本発明の上記および他の目的、特徴、および利点は、添付の図面に示すように、以下の特に本発明の好ましい実施形態の説明から明らかだろう。
本発明の特徴と思われる新規の特徴を添付の請求項に記載する。しかしながら、本発明自体は、その好ましい使用態様、目的および利点と共に、例示の実施形態についての以下の詳細な説明を参照して添付の図面と共に読むと、最もよく理解されるだろう。図面において、同様の参照番号は、同様の構成要素を示す。
本発明は、単一の性能カウンタを使用して複数のイベント型のイベントを同時に計測することによって、少ない性能測定誤りおよび待ち時間を提供する、性能計測のための回路および方法に関する。各イベント型のシステムまたはプロセッサ性能に対する相関を正確に反映するために、イベントは、計測する前に重み付けされる。すなわち、これに基づいて、単一のプロセッサ周期または各イベントが計測される他の期間でイベントが計測される。カウンタが増分される値は、各イベント型の数およびイベント型それ自体の両方によって異なる。例えば、L1キャッシュ・ミスは、L2キャッシュ・ミスとは異なる性能ペナルティを示すので、性能カウントが異なる変化を表すように、互いに異なるように重み付けがなされることになる。イベントの総レートは、一般的には、性能に対して単調である。しかしながら、完了した命令などの他のイベントに比例したキャッシュ・ミスなどというあるイベントの増加は、性能の低下を示す。
プロセッサまたは他の装置/システムの性能は、別個の計測を使用して、性能との相関に従ってイベントを調節することによって、プロセッサ内の未処理の各性能依存型のイベントのカウントを結合するという、複雑な多項式による計量から判断できる。しかしながら、上述のように、そのようなイベント計測は、数多くのカウンタを必要とし、または、全体としての測定待ち時間と内部イベント・カウント遅延誤りとを生じさせる多重手法を必要とする。したがって、本発明の重み付けされた性能カウンタによってサポートされる複雑な多項式による計量は、回路領域と監視のために必要な電力との削減と、多重化手法に対する測定待ち時間と誤りとの削減と伴う、互いに異なるイベントについての性能カウントに対して異なる効果を提供することによって、改良された性能モデルを提供する。そして、結果生じた性能情報は、米国特許出願第11/538131号である「METHOD AND SYSTEM FOR IMPROVING PROCESSING PERFORMANCE BY USING ACTIVITY FACTOR HEADROOM」に記載されているような電力管理制御システムに対する入力として印加できる。
今度は図面を参照して、特に図1を参照すると、本発明の一実施形態に係る、プロセッサを内蔵するシステムのブロック図が示されている。本システムは、プロセッサ・グループ8を含み、スーパー・スカラ・プロセッサを形成するブリッジ17を介して他のプロセッサ・グループに結合されていてもよい。プロセッサ・グループ8は、システム・ローカル・メモリ19と、2つのサービス・プロセッサ6Aおよび6Bと共に様々な周辺機器15に接続される。サービス・プロセッサ6Aおよび6Bは、故障の監視、支援、およびテスト機能をプロセッサ・グループ8に対して提供し、すべてのプロセッサ12A〜12Dを接続すると共に他のプロセッサ・グループへの自身の相互接続パスを有してもよい。さらに、サービス・プロセッサ6Aおよび6Bのうちの1つまたは両方は、性能および電力測定/管理を行ってもよく、そのような制御を、本発明の一実施形態に係る1つ以上の重み付けされた性能カウンタから読み出された性能カウントと整合するように行ってもよい。
プロセッサ・グループ8の内部には、複数のプロセッサ12A〜12Dがあり、それぞれ、通常、単一の部で製造され、L2キャッシュ14およびメモリ・コントローラ16とに結合された複数のプロセッサ・コア10Aおよび10Bを含む。プロセッサ・コア10Aおよび10Bは、汎用処理機能に関するデータ値に対する命令実行および動作を提供する。別個のL3キャッシュ18A〜18Dが、各プロセッサ12A〜12Dに提供される。ブリッジ17は、システム内の他のブリッジとともに、他の処理グループを伴う広いバス上の通信を提供し、バス11は、プロセッサ12A〜12Dと、ブリッジ17と、周辺機器15と、L3キャッシュ18A〜18Dと、システム・ローカル・メモリ19の接続を提供する。他のグローバル・システム・メモリをブリッジ17の外部に結合して、すべてのプロセッサ・グループによる対称的なアクセスを行ってもよい。
図2を参照すると、プロセッサ・コア10Aおよび10Bと同一の特徴を有するプロセッサ・コア10の詳細が示されている。バス・インターフェース部33は、プロセッサ・コア10を他のプロセッサおよび周辺機器に接続し、データ値を記憶するためのL1 Dキャッシュ32と、プログラム命令を記憶するためのL1 Iキャッシュ30と、キャッシュ・インターフェース部31とを外部メモリ、プロセッサ、および他の装置に接続する。L1 Iキャッシュ30は、命令フェッチ部IFU26と共に命令ストリームのロードを提供する。命令フェッチ部IFU26は、命令を予め取り出すものであり、見込みロードおよび分岐予測機能を含んでもよい。命令シーケンサ部(ISU)22は、一般的な演算を実行するための固定点部(FXU)24および浮動点演算を実行するための浮動点部(FPU)25などの様々な内部部品に対して発行される命令のシーケンシングを制御する。グローバル完了テーブル(GCT)23は、ISU22によって発行された命令を、命令によって対象となった特定の実行部が命令実行完了を示すまで追跡する。
固定点部24および浮動点部25は、汎用レジスタ(GPR)28A、浮動点レジスタ(FPR)28B、条件レジスタ(CR)28C、再命名バッファ28D、カウント・レジスタ/リンク・レジスタ(CTR/LR)28E、および例外レジスタ(XER)28Fなどの様々なリソースに結合される。GPR28AおよびFPR28Bは、ロード記憶部(LSU)29によってL1 Dキャッシュ22からロードおよび記憶されたデータ値に対してデータ値の記憶を提供する。CR28Cは、条件分岐情報を記憶し、再命名バッファ28D(様々な内部実行部に関連したいくつかの再命名部を備えてもよい)は、実行部にとってのオペランドおよび結果の記憶を提供する。XER28Fは、分岐と固定点例外情報とを記憶し、CTR/LR28Eは、分岐リンク情報とプログラム分岐実行のためのカウント情報とを記憶する。制御論理21は、プロセッサ・コア10内の様々な実行部およびリソースに結合されて、実行部およびリソースの広範な制御を行うために使用される。SCOM/XSCOMインターフェース部35は、外部サービス・プロセッサ34Aおよび34Bに対する接続を提供する。
また、プロセッサ・コア10は、通常の性能カウンタ(PCs)37と、本発明の一実施形態に係る重み付け性能カウンタ(WPC)40Aおよび40Bとのセットによって提供される性能カウント値を収集する性能監視部(PMU)36を含む。性能カウンタ37を使用して、重み付け性能カウンタ40Aおよび40Bによってカウントされない追加のイベントをカウントする。多項式の性能計量は、性能監視部36によって計算することができる。または、性能監視部36は、性能カウンタ37および重み付け性能カウンタ40Aおよび40Bから、図1の処理システム内の1つ以上のプロセッサ12A〜12D内で実行するハイパーバイザーなどの外部ソフトウェアへ、またはサービス・プロセッサ6Aまたは6Bによって実行されるサービス・プロセッサ・プログラムへのカウント値の表示を提供することができる。また、性能測定部36、性能カウンタ37、重み付け性能カウンタ40A,40Bは、プロセッサ・コア10の外部に位置していてもよい。例えば、図1のプロセッサ12A〜12Dは、各コア10Aおよび10Bからイベント信号が提供される性能測定部と、メモリ・コントローラ16と、L2キャッシュ14とをそれぞれ含んでもよい。
性能カウンタ37および重み付けされた性能カウンタ40Aおよび40Bは、プロセッサ・コア10内部での様々なイベントの発生を信号で知らせる入力を受信する。実施形態例において、重み付け性能カウンタ40Aは、ISU22、IFU26、FPU25、およびキャッシュ・インターフェース部31などの様々な機能処理ブロックからイベントを受信する。重み付け性能カウンタ40Bは、イベントバス入力をLSU29から受信する。性能カウンタ37は、一般的には、プロセッサ周期数に対するイベント・カウントすべて評価を行うことができるように、プロセッサ周期をカウントするカウンタを含む。イベント監視手法例は、二重カウンタ重み付けイベント計数手法を例示しており、メモリ待ち時間に依存するイベントは、重み付け性能カウンタ40Bによって計数される一方で、重み付け性能カウンタ40Aは、プロセッサのクロック周波数に依存するイベントをカウントする。主な電力管理手法は、プロセッサのクロック周波数および電圧を調整し、メモリ待ち時間は変更しないので、プロセッサのクロック周期のメモリ待ち時間は、プロセッサのクロック周波数が変更されると変化する。メモリ待ち時間に依存するイベントと、プロセッサのクロック周波数に依存するイベントとについての別個の重み付けされた性能カウンタ40Aおよび40Bを使用することによって、2つの互いに異なる型のイベント上のプロセッサ周波数変化の影響を独立して評価するための機構を提供する。実施形態例は、プロセッサ周期数と、完了命令数と、メモリ階層の各レベルのミス・レートを追跡する。結果生じたカウントから、プロセッサの周波数に依存するメモリ待ち時間が識別でき、プロセッサ周波数に対する性能の推定値が、毎秒の命令または他の性能指数として判断される。そして、電力管理アルゴリズムは、周波数の結果に対する推定性能を使用して、電力管理に関する決定をその場で行うことができる。
図示の実施形態において、性能監視部36は、バス・インターフェース部33およびSCOMインターフェース35に結合される出力を有し、重み付け性能カウンタ40Aおよび40Bならびに性能カウンタ37から結果生じた性能測定値を、サービス・プロセッサ6Aおよび6Bのうちの1つまたはバス11に結合された他のプロセッサによって読み出すことができる。代わりに、プログラム読み出し可能なレジスタを性能監視部36から提供してもよい。重み付け性能カウンタ40Aおよび40Bは、バス・インターフェース部33およびSCOMインターフェース35のうちの1つまたは両方にオプションとしてさらに結合される入力を有し、各イベント型の性能カウントに対する寄与を判断するのに使用される重みは、プログラム制御によって調整されてもよい。調整は、性能監視によって提供される現行の結果の判断に基づいて動的に行われてもよいし、実行中の作業負荷の型の決定と適合するように設定されてもよいし、または、性能推定において使用される固定値のさらなる改良のために提供されてもよい。
今度は図3を参照すると、本発明の一実施形態にかかる重み付け性能カウンタ40の詳細であって、図2の性能カウンタ40Aおよび40Bを実施するために使用されてもよいものが図示されている。組み合わせ論理部42は、プロセッサ10内の機能部から受信されたイベント信号のセット、または性能を測定中の回路またはシステムの型に従った他のイベント信号を組み合わせる。結果生じた出力数値は、イベントを組み合わせ、これは、イベント毎にフィールドを含むバイナリ数値であってもよく、または以下に詳細に述べるように、出力値のビット幅を減少させるフィールドを含んでもよい。組み合わされたイベント結果は、重みのセット{W0’,W1’...WN’}を加算器46の入力に選択的に印加するセレクタ45の制御入力に与えられる。加算器46は、性能カウント・ラッチ47の現在の値と共に組み合わされた重みを加算する。例えば、イベント0が所定のプロセッサ周期で生じ、イベント1が生じない場合に、重みW0がカウントに加算されるが、W1は加算されない。加算器46は、各重み重み{W0’,W1’...WN’}を性能カウント・ラッチ47の現在の値に加算するのに充分な幅の充分な入力を有し、セレクタ45は、組み合わせ回路部42の組み合わせ出力によって与えられる制御信号に従って、ゼロ値入力と各重み入力{W0’,W1’...WN’。}との間で選択をおこなう
重み{W0’,W1’...WN’}は、重みマッピング器44によって決定される。重みマッピング器44は、上述のようなプログラム制御によって設定されてもよいような重みレジスタ43のセットにプログラムされた値を調節する。性能計測手法の分析を保存するために、イベント毎のカウントに加算される値は、重みの差が性能とイベントの発生との間の相関の差分を真に表すように、調整されなければならない。例えば、イベント重みが1という値に設定され、他のイベントが1.5という相対性能相関を有した場合、他のイベントについての相対重みは、固定点加算によっては正確に表現することができなかったはずである。したがって、重みの範囲{W0’,W1’...WN’}は、性能に対するイベントの相対相関の細かい差を表現するのに充分なほど大きくあるべきである。しかしながら、0〜3(2ビット)のような小さな重みの範囲であっても、少ない数のイベントをカウントするシステムに対して誤りの減少を提供し、ここにおいて、イベントは、一様にカウントされるか、多項式による性能計量への個々の寄与を同一に収集しないように、多重化されたやり方でカウントされる。
組み合わせ論理(ユニット)42は、出力選択信号のビット幅を減少させてもよいので、セレクタ45の複雑性およびサイズ、ならびに重み付け性能カウンタ40を実施するのに必要な重み数をも減少させる。減少は、同一の重みを有する互いに排他的なイベントによって提供される。同一の重みで互いに排他的なイベント入力は、論理和演算によって組み合わせることができる。なぜならば、当該イベントのセットから結果生じる重みは、常にゼロか、または単一の重み値となるからである。出力選択信号のビット幅が減少するような他のやり方は、互いに排他的ではない同一の重みのイベントを加算して、同一の重みのイベントに対応するフィールドがイベント数を表す2進数であるようにすることである。この型のフィールドについて、セレクタ45は、重み値の選択を受信して、重み値と単一のフィールドにおいて組み合わせられている同一の重みのイベント数との積を表す数を加算器46に与えるのに充分な重み値を決定する。
本発明をその好ましい実施形態を参照して特に図示および説明してきたが、形式および詳細についての上記および他の変更を本発明の精神および範囲から逸脱することなく行ってもよいことは、当業者によって理解されるだろう。
本発明の一実施形態に係るプロセッサを内蔵する処理システムのブロック図である。 本発明の一実施形態に係るプロセッサ・コアのブロック図である。 本発明の一実施形態に係る重み付けされた性能カウンタの回路図である。
符号の説明
6A サービス・プロセッサA
6B サービス・プロセッサB
8 プロセッサ・グループ
10A,10B コア
12A,12B,12C,12D プロセッサ
14 L2キャッシュ
15 周辺機器
16 メモリ・コントローラ
17 ブリッジ
18A,18B,18C,18D L3キャッシュ
19 システム・ローカル・メモリ
20A,20B,40A,40B WPC(重み付け性能カウンタ)

Claims (8)

  1. プロセッサの性能レベルを判断する方法であって、
    前記プロセッサ内の互いに異なるイベントに対応する前記プロセッサ内の機能部から、複数のイベント信号を受信するステップと、
    前記複数のイベント信号の総計と適合するように、性能カウンタを更新するステップであって、互いに異なる重みを、前記複数のイベント信号のうちの少なくとも2つに割り当てて、前記イベントに対応する性能計量の収集間の待ち時間が減少し、前記イベントは、前記プロセッサの性能に対する相関に従ってさらに別個に重み付けされる、前記更新するステップと、
    前記性能カウンタを周期的な間隔で読み出して、性能カウントを取得するステップと
    を含む、方法。
  2. 前記受信および更新ステップは、前記プロセッサの各クロック周期におこなわれる、請求項1に記載の方法。
  3. 前記プロセッサに入力される値と適合するように前記重みを調整するステップをさらに含む、請求項1に記載の方法。
  4. 前記複数の受信イベント信号を符号化して、組み合わせ値を提供するステップと、
    前記重みを前記組み合わせ値に印加して更新値を提供するステップであって、前記更新ステップは、前記更新値を前記性能カウントの現在の値に加算して次の性能カウントを取得する、ステップと
    をさらに含む、請求項1に記載の方法。
  5. 前記符号化は、前記重みのうちの等しいものに対応する前記イベントをマージする、請求項4に記載の方法。
  6. 前記性能カウントと適合するように、前記プロセッサについての電力管理数値を決定するステップと、
    前記決定の結果と適合するように、前記プロセッサの動作パラメータを調整するステップと
    をさらに含む、請求項1に記載の方法。
  7. プロセッサ内の複数のイベントの発生を示すための複数のイベント信号のうちの少なくとも1つの出力イベント信号をそれぞれ有する複数の機能部と、
    前記複数のイベント信号を受信して、前記複数のイベント信号の状態に従って性能カウントを更新するための重み付け性能カウンタとを備え、前記複数のイベントのうちの少なくとも2つに従った前記性能カウントの変更は、互いに異なるように重み付けされ
    前記重み付け性能カウンタは、
    前記複数のイベント信号を受信して、前記複数のイベントのうち前記プロセッサの現在の周期で生じたものを表す組み合わせ値を提供するための組み合わせ論理と、
    互いに異なる重みを前記プロセッサの前記現在の周期で生じた前記組み合わせ値に適合させるための重み付け論理と、
    前記性能カウントを提供するために前記重み付け論理の出力を累積するための加算/累算器とを備え、
    前記重み付け論理は、前記互いに異なる重みがプログラム制御下で変更されてもよいプログラム可能なレジスタを備える、
    プロセッサ。
  8. プロセッサ内の複数のイベントの発生を示すための複数のイベント信号のうちの少なくとも1つの出力イベント信号をそれぞれ有する複数の機能部と、
    前記複数のイベント信号を受信して、前記複数のイベント信号の状態に従って性能カウントを更新するための重み付け性能カウンタとを備え、前記複数のイベントのうちの少なくとも2つに従った前記性能カウントの変更は、互いに異なるように重み付けされ
    前記重み付け性能カウンタは、
    前記複数のイベント信号を受信して、前記複数のイベントのうち前記プロセッサの現在の周期で生じたものを表す組み合わせ値を提供するための組み合わせ論理と、
    互いに異なる重みを前記プロセッサの前記現在の周期で生じた前記組み合わせ値に適合させるための重み付け論理と、
    前記性能カウントを提供するために前記重み付け論理の出力を累積するための加算/累算器とを備え、
    前記組み合わせ論理は、前記重みのうちの等しいものに対応するイベント信号をマージする、
    プロセッサ。
JP2007281412A 2006-11-30 2007-10-30 プロセッサ性能計測のための重み付けされたイベント計数方法、プロセッサ、および重み付け性能カウンタ回路(プロセッサ性能計測のための重み付けされたイベント計数システムおよび方法) Expired - Fee Related JP5186178B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/565,106 US7340378B1 (en) 2006-11-30 2006-11-30 Weighted event counting system and method for processor performance measurements
US11/565106 2006-11-30

Publications (2)

Publication Number Publication Date
JP2008140380A JP2008140380A (ja) 2008-06-19
JP5186178B2 true JP5186178B2 (ja) 2013-04-17

Family

ID=39125518

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007281412A Expired - Fee Related JP5186178B2 (ja) 2006-11-30 2007-10-30 プロセッサ性能計測のための重み付けされたイベント計数方法、プロセッサ、および重み付け性能カウンタ回路(プロセッサ性能計測のための重み付けされたイベント計数システムおよび方法)

Country Status (3)

Country Link
US (2) US7340378B1 (ja)
JP (1) JP5186178B2 (ja)
CN (1) CN101192188B (ja)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7519797B1 (en) * 2006-11-02 2009-04-14 Nividia Corporation Hierarchical multi-precision pipeline counters
US8117478B2 (en) * 2006-12-29 2012-02-14 Intel Corporation Optimizing power usage by processor cores based on architectural events
US7908493B2 (en) * 2007-06-06 2011-03-15 International Business Machines Corporation Unified management of power, performance, and thermals in computer systems
JP5151685B2 (ja) * 2008-05-23 2013-02-27 富士通株式会社 半導体回路設計支援プログラム
GB2476606B (en) 2008-09-08 2012-08-08 Virginia Tech Intell Prop Systems, devices, and methods for managing energy usage
US8055477B2 (en) * 2008-11-20 2011-11-08 International Business Machines Corporation Identifying deterministic performance boost capability of a computer system
US8261112B2 (en) * 2008-12-08 2012-09-04 International Business Machines Corporation Optimizing power consumption by tracking how program runtime performance metrics respond to changes in operating frequency
JP2010244393A (ja) * 2009-04-08 2010-10-28 Renesas Electronics Corp パフォーマンス評価装置、及びパフォーマンス評価方法
GB2473196B (en) * 2009-09-02 2012-01-04 1E Ltd Monitoring the performance of and controlling a computer
US9003206B2 (en) * 2009-12-23 2015-04-07 Bae Systems Information And Electronic Systems Integration Inc. Managing communication and control of power components
US8463456B2 (en) * 2010-03-18 2013-06-11 International Business Machines Corporation Minimizing aggregate cooling and leakage power
WO2012001779A1 (ja) 2010-06-30 2012-01-05 富士通株式会社 情報処理装置の使用量解析方法、情報処理システム及びそのプログラム
US10169187B2 (en) * 2010-08-18 2019-01-01 International Business Machines Corporation Processor core having a saturating event counter for making performance measurements
WO2012047627A2 (en) * 2010-09-27 2012-04-12 Purdue Research Foundation System and method of extending the linear dynamic range of event counting
US8595472B2 (en) 2010-11-22 2013-11-26 International Business Machines Corporation Ganged hardware counters for coordinated rollover and reset operations
US8635483B2 (en) 2011-04-05 2014-01-21 International Business Machines Corporation Dynamically tune power proxy architectures
JP5794010B2 (ja) 2011-07-19 2015-10-14 富士通株式会社 情報処理装置、制御プログラムおよび制御方法
US9141159B2 (en) 2011-11-03 2015-09-22 International Business Machines Corporation Minimizing aggregate cooling and leakage power with fast convergence
US9329670B2 (en) 2012-06-05 2016-05-03 International Business Machines Corporation Predicting energy savings
KR101991687B1 (ko) * 2012-11-23 2019-06-24 삼성전자 주식회사 동적 라이브러리 프로파일링 방법, 이를 기록한 컴퓨터로 읽을 수 있는 기록 매체 및 동적 라이브러리 프로파일링 시스템
US9424159B2 (en) 2013-10-10 2016-08-23 International Business Machines Corporation Performance measurement of hardware accelerators
US9645626B2 (en) * 2014-11-12 2017-05-09 Qualcomm Incorporated Circuits and methods providing supply voltage control based on transient load prediction
JP6646201B2 (ja) 2015-07-27 2020-02-14 富士通株式会社 情報処理装置、電力推定プログラム及び電力推定方法
CN105487958B (zh) * 2015-11-24 2018-04-10 无锡江南计算技术研究所 处理器内部行为监测方法
JP2017102790A (ja) * 2015-12-03 2017-06-08 富士通株式会社 情報処理装置、演算処理装置および情報処理装置の制御方法
JP2017167930A (ja) * 2016-03-17 2017-09-21 富士通株式会社 情報処理装置、電力測定方法及び電力測定プログラム
US11023025B2 (en) * 2016-11-16 2021-06-01 Cypress Semiconductor Corporation Microcontroller energy profiler
US10140574B2 (en) * 2016-12-31 2018-11-27 Via Alliance Semiconductor Co., Ltd Neural network unit with segmentable array width rotator and re-shapeable weight memory to match segment width to provide common weights to multiple rotator segments
CN111209155B (zh) * 2018-11-21 2022-09-23 华夏芯(北京)通用处理器技术有限公司 一种便于扩展和配置的性能检测方法
US10948957B1 (en) * 2019-09-26 2021-03-16 Apple Inc. Adaptive on-chip digital power estimator
US20210200580A1 (en) * 2019-12-28 2021-07-01 Intel Corporation Performance monitoring in heterogeneous systems
US11303551B2 (en) 2020-07-10 2022-04-12 Zte Corporation Network error performance measurement
KR102253362B1 (ko) 2020-09-22 2021-05-20 쿠팡 주식회사 전자 장치 및 이를 이용한 정보 제공 방법
US11698671B2 (en) * 2021-09-22 2023-07-11 Apple Inc. Peak power management for processing units
US20230121710A1 (en) * 2021-10-18 2023-04-20 Hewlett Packard Enterprise Development Lp System and method for compute system cooling fan control
CN116089183A (zh) * 2022-11-28 2023-05-09 格兰菲智能科技有限公司 图形处理器性能测试方法、装置、计算机设备、存储介质

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2005092A (en) * 1935-06-18 Bottle dispensing device
US5657253A (en) 1992-05-15 1997-08-12 Intel Corporation Apparatus for monitoring the performance of a microprocessor
US6539336B1 (en) * 1996-12-12 2003-03-25 Phatrat Technologies, Inc. Sport monitoring system for determining airtime, speed, power absorbed and other factors such as drop distance
US5557548A (en) 1994-12-09 1996-09-17 International Business Machines Corporation Method and system for performance monitoring within a data processing system
US5796637A (en) 1996-09-06 1998-08-18 Intel Corporation Apparatus and method for filtering event signals
US6112318A (en) 1997-08-11 2000-08-29 Digital Equipment Corporation Performance counters controlled by programmable logic
US6233531B1 (en) 1997-12-19 2001-05-15 Advanced Micro Devices, Inc. Apparatus and method for monitoring the performance of a microprocessor
JPH11212830A (ja) * 1998-01-29 1999-08-06 Fujitsu Ltd プロセッサ性能測定装置
US6275782B1 (en) 1998-05-05 2001-08-14 Advanced Micro Devices, Inc. Non-intrusive performance monitoring
US6360337B1 (en) * 1999-01-27 2002-03-19 Sun Microsystems, Inc. System and method to perform histogrammic counting for performance evaluation
US6460107B1 (en) 1999-04-29 2002-10-01 Intel Corporation Integrated real-time performance monitoring facility
US6546359B1 (en) 2000-04-24 2003-04-08 Sun Microsystems, Inc. Method and apparatus for multiplexing hardware performance indicators
US6792392B1 (en) 2000-06-30 2004-09-14 Intel Corporation Method and apparatus for configuring and collecting performance counter data
US6718403B2 (en) 2000-12-11 2004-04-06 International Business Machines Corporation Hierarchical selection of direct and indirect counting events in a performance monitor unit
US6676777B2 (en) 2001-03-02 2004-01-13 National Institute For Materials Science Postweld heat treatment process of carbon steel and low alloy steel
JP4445160B2 (ja) * 2001-05-18 2010-04-07 富士通株式会社 イベント計測装置および方法並びにイベント計測プログラムおよび同プログラムを記録したコンピュータ読取可能な記録媒体並びにプロセッサシステム
US6898718B2 (en) * 2001-09-28 2005-05-24 Intel Corporation Method and apparatus to monitor performance of a process
US7657893B2 (en) 2003-04-23 2010-02-02 International Business Machines Corporation Accounting method and logic for determining per-thread processor resource utilization in a simultaneous multi-threaded (SMT) processor
US7475301B2 (en) 2003-05-09 2009-01-06 Hewlett-Packard Development Company, L.P. Increment/decrement circuit for performance counter
US7424397B2 (en) 2003-05-09 2008-09-09 Hewlett-Packard Development Company, L.P. General purpose performance counter
US7272754B2 (en) 2003-09-27 2007-09-18 International Business Machines Corporation Implementation-efficient multiple-counter value hardware performance counter
JP4464655B2 (ja) * 2003-11-06 2010-05-19 株式会社野村総合研究所 コンピュータの監視装置および監視対象のコンピュータに関するメッセージの処理方法
US7392370B2 (en) 2004-01-14 2008-06-24 International Business Machines Corporation Method and apparatus for autonomically initiating measurement of secondary metrics based on hardware counter values for primary metrics
US20050177344A1 (en) 2004-02-09 2005-08-11 Newisys, Inc. A Delaware Corporation Histogram performance counters for use in transaction latency analysis
US20050183065A1 (en) 2004-02-13 2005-08-18 Wolczko Mario I. Performance counters in a multi-threaded processor
US7676530B2 (en) 2004-06-03 2010-03-09 Hewlett-Packard Development Company, L.P. Duration minimum and maximum circuit for performance counter
US7594128B2 (en) * 2004-08-04 2009-09-22 Hewlett-Packard Development Company, L.P. Systems and methods to determine processor utilization
JP4845001B2 (ja) * 2004-11-26 2011-12-28 株式会社リコー 情報処理装置及び同装置に用いるプログラム

Also Published As

Publication number Publication date
US20080133180A1 (en) 2008-06-05
US7533003B2 (en) 2009-05-12
JP2008140380A (ja) 2008-06-19
CN101192188A (zh) 2008-06-04
CN101192188B (zh) 2011-08-24
US7340378B1 (en) 2008-03-04

Similar Documents

Publication Publication Date Title
JP5186178B2 (ja) プロセッサ性能計測のための重み付けされたイベント計数方法、プロセッサ、および重み付け性能カウンタ回路(プロセッサ性能計測のための重み付けされたイベント計数システムおよび方法)
KR100754153B1 (ko) 어카운팅 방법 및 프로세서
US6708296B1 (en) Method and system for selecting and distinguishing an event sequence using an effective address in a processing system
US5691920A (en) Method and system for performance monitoring of dispatch unit efficiency in a processing system
US5752062A (en) Method and system for performance monitoring through monitoring an order of processor events during execution in a processing system
US5751945A (en) Method and system for performance monitoring stalls to identify pipeline bottlenecks and stalls in a processing system
US5797019A (en) Method and system for performance monitoring time lengths of disabled interrupts in a processing system
US7849387B2 (en) Detecting architectural vulnerability of processor resources
US20090300329A1 (en) Voltage droop mitigation through instruction issue throttling
Naithani et al. Reliability-aware scheduling on heterogeneous multicore processors
US5949971A (en) Method and system for performance monitoring through identification of frequency and length of time of execution of serialization instructions in a processing system
US8161493B2 (en) Weighted-region cycle accounting for multi-threaded processor cores
US7519510B2 (en) Derivative performance counter mechanism
US10169187B2 (en) Processor core having a saturating event counter for making performance measurements
US6530042B1 (en) Method and apparatus for monitoring the performance of internal queues in a microprocessor
US5748855A (en) Method and system for performance monitoring of misaligned memory accesses in a processing system
US5729726A (en) Method and system for performance monitoring efficiency of branch unit operation in a processing system
US7051177B2 (en) Method for measuring memory latency in a hierarchical memory system
KR20240024261A (ko) 상호연결된 이벤트 계수기 및 가중 합산 누산기를 이용하여 프로세서 내의 전력 소비를 제어하기 위한 시스템 및 방법
US11112846B2 (en) Predictive on-chip voltage simulation to detect near-future under voltage conditions
US8001362B2 (en) Processing unit
Upton et al. Evaluating linear regression for temperature modeling at the core level
Ryabko et al. Estimating the performance of computer systems through computer capacity

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100621

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120306

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120510

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130121

R150 Certificate of patent or registration of utility model

Ref document number: 5186178

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160125

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees