JP2790119B2 - キャッシュミスアドレス分布トレース回路 - Google Patents

キャッシュミスアドレス分布トレース回路

Info

Publication number
JP2790119B2
JP2790119B2 JP8110489A JP11048996A JP2790119B2 JP 2790119 B2 JP2790119 B2 JP 2790119B2 JP 8110489 A JP8110489 A JP 8110489A JP 11048996 A JP11048996 A JP 11048996A JP 2790119 B2 JP2790119 B2 JP 2790119B2
Authority
JP
Japan
Prior art keywords
address
cache miss
cache
access
distribution table
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP8110489A
Other languages
English (en)
Other versions
JPH09274589A (ja
Inventor
吉弘 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP8110489A priority Critical patent/JP2790119B2/ja
Publication of JPH09274589A publication Critical patent/JPH09274589A/ja
Application granted granted Critical
Publication of JP2790119B2 publication Critical patent/JP2790119B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Memory System Of A Hierarchy Structure (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報処理装置に関
し、特に情報処理装置のキャッシュメモリのアドレス分
布をトレースする回路に関する。
【0002】
【従来の技術】コンピュータ等情報処理装置のメモリを
階層構造とし、高速アクセスを実現する手法として、大
容量・低速の主記憶とCPUとの間に、小量量・高速の
キャッシュメモリを配置し、CPUがアクセスするデー
タをキャシュメモリに保存するキャッシュメモリ方式が
採用されている。その際、CPUがアクセスしたデータ
がキャッシュメモリ内に存在する場合をキャッシュヒッ
トといい、CPUが高いキャッシュヒット率でキャッシ
ュメモリからデータをアクセスできれば、CPUはほぼ
キャッシュメモリのアクセス時間に近い速度で主記憶を
アクセスしているのと等価となる。一方、キャッシュメ
モリ中のアクセスするデータがない場合、キャッシュミ
ス(ミスヒット)となり、この場合、主記憶からデータ
をキャッシュメモリに書き込むことが必要とされる。
【0003】キャッシュメモリとして、所定のバイト数
を一ライン(ブロック)とし、例えばアクセスアドレス
の所定の上位ビットフィールドを、タグフィールドとイ
ンデックスフィールドとし、インデッックスフィールド
にてブロック単位にエントリをアクセスし、アクセスさ
れたエントリに保持されているタグ情報とアクセスアド
レスのタグフィールドとを比較し、これらが一致し且つ
有効フラグがオンの際に、キャッシュのヒットと判定
し、アクセスアドレスの下位側ビットでブロック内のデ
ータをアクセスするような構成が典型的に採用されてい
る。
【0004】キャッシュメモリの高速化を実現するた
め、キャッシュミスの少なくなるようなメモリの割り当
て改善や最適なキャッシュ容量・ウェイ数などの選択の
ために、キャッシュメモリにおけるキャッシュミスのア
ドレス分布を得て解析することが行われる。
【0005】このようなキャッシュメモリにおけるキャ
ッシュミスのアドレス分布を得るための従来の方法とし
ては、ソフトウェアでのシミュレーションによる方法
と、外部ハードウェア装置での測定による方法が用いら
れていた。
【0006】
【発明が解決しようとする課題】しかしながら上記した
従来の方法においては、下記記載の問題点を有してい
る。
【0007】すなわち、従来のソフトウェアによるシミ
ュレーション方式においては、対象となるキャッシュミ
スのメモリアクセスをソフトウェアでシミュレーション
することから、実際のプログラムの実行時間に比べて極
めて長時間のシミュレーション時間を要するという問題
点を有している。
【0008】また、従来の外部ハードウェア装置による
測定においては、アドレストレースを行うための独自の
プロセッサやメモリ等を具備することが必要とされてお
り、装置が高価となるという問題点を有している。
【0009】従って、本発明は、上記事情に鑑みて為さ
れたものであって、その目的は、ソフトウェアによるシ
ミュレーション方法のように長時間を要することのない
ハードウェア回路を用い、また外部ハードウェア装置を
用いた従来の方法よりも安価なキャッシュミスアドレス
分布のトレース回路を提供することにある。
【0010】
【課題を解決するための手段】前記目的を達成するた
め、本発明のキャッシュミスアドレス分布トレース回路
は、主記憶アクセス時のアドレスを格納するアクセスア
ドレス格納手段と、予め設定されたマスク情報により前
記アクセスアドレス格納手段の出力をマスクするアドレ
スマスク手段と、トレースをとるべきアドレスを格納し
ておく比較アドレス格納手段と、前記アドレスマスク手
段の出力と前記比較アドレス格納手段の出力とを比較し
て一致信号を出力する比較手段と、比較が一致した回数
を記録するために前記主記憶内に設けられたキャッシュ
ミスアドレス分布表と、前記キャッシュミスアドレス分
布表内の前記アクセスアドレスが対応するエントリの下
位アドレスを前記アクセスアドレス格納手段の出力から
抽出する下位アドレス抽出手段と、前記キャッシュミス
アドレス分布表の上位アドレスを指定する分布表上位ア
ドレス格納手段と、前記分布表上位アドレス格納手段と
前記下位アドレス抽出手段の出力とによって指定された
エントリに記録されているアドレス別の計数値を加算す
る加算手段と、これらの動作の制御を行う制御手段と、
を有し、予め与えられた比較アドレスとマスク情報とに
基づいて、一致したキャッシュミスによる主記憶アクセ
スの回数を前記キャッシュミスアドレス分布表にアドレ
ス別に記録することを特徴とする。
【0011】また、本発明は、予め与えられたキャッシ
ュミス回数で割込みを発生するようにキャッシュミスカ
ウンタを有している。
【0012】上記構成のもと、本発明によれば、キャッ
シュミスによる主記憶アクセスが発生すると、アドレス
がアクセスアドレス格納手段に格納され、与えられたマ
スク情報に基づきアドレスマスク手段によってマスクさ
れ、比較アドレス格納手段に与えられた比較アドレスと
比較される。そして、比較手段が一致を検出すると、ア
クセスアドレスから、下位アドレス抽出手段によって、
下位アドレスが抽出され、分布表上位アドレス格納手段
の出力とあわせて、キャッシュミスアドレス分布表の中
の1つのエントリが指定される。
【0013】指定されたエントリの値が読み出されて加
算手段によって1加算され書き込まれる。このようにし
て、与えられた比較アドレスとマスク情報に基づいて一
致したキャッシュミスによる主記憶アクセスの回数が主
記憶内に設けられたキャッシュミスアドレス分布表にア
ドレス別に記憶される。
【0014】この動作は、ハードウェアにより行われる
のでソフトウェアによるシミュレーションより高速であ
り、また主記憶内に分布表を設けるという簡単なハード
ウェアで構成されていることで外部ハードウェア装置を
用いる測定による方法よりも安価に実現できる。
【0015】これにより、排他性キャッシュミスの発生
するアドレスの情報が得られ、キャッシュミスの少なく
なるようなメモリの割り当て改善や最適なキャッシュ容
量・ウェイ数などの選択を考慮するための手段を与え
る。
【0016】
【発明の実施の形態】次に、本発明の実施形態について
図面を参照して詳細に説明する。
【0017】図1を参照すると、本発明の実施形態は、
アクセスアドレス格納手段110と、アドレスマスク手
段120と、比較アドレス格納手段130と、比較手段
140と、下位アドレス抽出手段150と、分布表上位
アドレス格納手段160と、加算手段170と、制御手
段180と、キャッシュミスカウンタ190と、主記憶
300内のキャッシュミスアドレス分布表310と、キ
ャッシュメモリを備えたCPU200と、を備えてなる
ものである。
【0018】CPU200がキャッシュミスを起こす
と、キャッシュミスアドレスをアドレスバス上に出力
し、主記憶300をアクセスする。このアドレスはアク
セスアドレス格納手段110に格納され、アドレスマス
ク手段120に予め与えられたマスク情報に基づきマス
クされ、比較アドレス格納手段130に予め与えられた
比較アドレスと、比較手段140にて比較される。
【0019】比較手段140が一致を検出すると、予め
与えられた抽出情報に基づきアクセスアドレスから下位
アドレス抽出手段150によって下位アドレスが抽出さ
れ、分布表上位アドレス格納手段160に予め与えられ
たキャッシュミス分布表310の上位アドレスとあわせ
てキャッシュミス分布表310の中の1つのエントリが
指定される。
【0020】指定されたエントリの値がデータバスを通
して読み出され、加算手段170によって1加算され、
もとのエントリに書き込まれる。
【0021】このとき、キャッシュミスしたアドレスの
マスクされていない部分と、加算されたエントリとは、
1対1に対応しており、エントリの値はそのアドレスに
おけるキャッシュミス回数に一致する。
【0022】このようにして、キャッシュミスによる主
記憶アクセスの回数が主記憶300内のキャッシュミス
アドレス分布表にアドレス別に記録される。
【0023】一定のミス回数で測定を停止したい場合
は、キャッシュミスカウンタ190に予め一定の値を設
定しておく。
【0024】キャッシュミスカウンタ190は、比較手
段140が一致を検出したことを制御手段180から通
知されると、1減算され、値が「0」になると、割込み
信号を発生する。これにより制御回路180は動作を停
止する。
【0025】次に、本発明の一実施例を以下に説明す
る。以下では上記した本発明の実施形態の効果的な利用
法について図面を参照して詳細に説明する。
【0026】仮に、CPU200内のキャッシュメモリ
のブロックサイズを64バイト、キャッシュミスアドレ
ス分布表のエントリの大きさを4バイトとする。各ブロ
ックごとにキャッシュミス回数を測定すると、キャッシ
ュミスアドレス分布表の大きさとしては、主記憶の16
分の1の大きさ分必要とされ、大きくなりすぎる。
【0027】そこで、第1に、キャッシュ内ブロックア
ドレス別にキャッシュミス回数の分布をトレースし、第
2に、キャッシュミスの多かった特定のブロックについ
て、キャッシュタグアドレス別にキャッシュミス回数の
分布をトレースする、という2段階の方法を行うこと
が、キャッシュミスアドレス分布表を小さくすることに
効果的である。
【0028】ここで、キャッシュメモリの大きさを、6
4キロバイト、主記憶の大きさを64メガバイトと仮定
する。
【0029】図2は、キャッシュ内ブロックアドレス別
にキャッシュミス回数の分布をトレースするために、本
発明の実施形態の各構成要素に予め与える情報を示した
ものいである。
【0030】アドレスマスク手段120と比較アドレス
格納手段130には、ともに全ビット0を与える。この
とき、キャッシュミスが起こると、比較手段140は常
に一致を示す。
【0031】下位アドレス抽出手段150には、アクセ
スアドレスのビット6からビット15までを抽出し、こ
れを4ビットシフト(右シフト)して、キャッシュミス
アドレス分布表のエントリのアドレスとするような情報
を与える。なお、キャッシュミスアドレス分布表のエン
トリのアドレスは4バイトとされ、下位アドレス抽出手
段150に与える情報下位2ビットは、この4バイト分
に対応する。
【0032】分布表上位アドレス格納手段160には、
キャッシュミスアドレス分布表310の開始アドレスの
ビット12からビット25までを与える。
【0033】このような設定により、キャッシュメモリ
のどのブロックが、キャッシュミス回数が多いかをトレ
ースできる。
【0034】図3は、特定ブロックのキャッシュタグア
ドレス別にキャッシュミス回数の分布をトレースするた
めに、本発明の実施形態の各構成要素に予め与える情報
を示したものである。
【0035】アドレスマスク手段120には、アクセス
アドレスのブロックアドレスの部分、即ちビット6から
ビット15までに、マスクしないように“1”を与え、
他のビットに“0”を与える。
【0036】比較アドレス格納手段130には、ブロッ
クアドレスの部分、即ちビット6からビット15まで
に、特定のブロックアドレスを、他のビットに“0”
を、与える。このとき、特定のブロックアドレスにおけ
るキャッシュミスに限り、比較手段140は一致を示
す。
【0037】下位アドレス抽出手段150には、アクセ
スアドレスのビット16からビット25までを抽出し、
14ビットシフト(右シフト)してキャッシュミスアド
レス分布表のエントリのアドレスとするような情報を与
える。
【0038】分布表上位アドレス格納手段160には、
キャッシュミスアドレス分布表310の開始アドレスの
ビット12からビット25までを与える。
【0039】このような設定で、特定ブロックのキャッ
シュミスのタグアドレスの分布をトレースできる。
【0040】以上の2段階の方法によって、必要なキャ
ッシュミスアドレス分布表310の大きさは、16キロ
バイトとなり、主記憶の4096分の1の大きさで済
む。
【0041】
【発明の効果】以上説明したように、本発明によれば、
従来のソフトウェアによるシミュレーション方法より
も、高速なキャッシュミスアドレス分布トレースが行え
るという効果を有する。
【0042】これは、本発明においては、キャッシュミ
スのアドレストレース動作がハードウェアにより行われ
ることによる。
【0043】また、本発明は、従来の外部ハードウェア
装置による測定よりも、安価にキャッシュミスアドレス
分布トレースが実現できるという効果を有する。
【0044】これは、本発明においては、主記憶内にト
レース分布表を設けているので、独自のメモリを必要と
しないこと、及び簡易なハードウェア構成により実現可
能とされたことにより、アドレス分布トレース用の独自
のプロセッサを必要としないことによる。
【図面の簡単な説明】
【図1】本発明のキャッシュミスアドレス分布トレース
回路の一実施形態をブロック図にて示したものである。
【図2】本発明の実施の形態を説明するための図であ
り、キャッシュ内ブロックアドレス別にキャッシュミス
回数の分布をトレースするための設定例を示す図であ
る。
【図3】本発明の実施の形態を説明するための図であ
り、特定ブロックのキャッシュタグアドレス別にキャッ
シュミス回数の分布表をトレースするための設定例を示
す図である。
【符号の説明】
110 アクセスアドレス格納手段 120 アドレスマスク手段 130 比較アドレス格納手段 140 比較手段 150 下位アドレス抽出手段 160 分布表上位アドレス格納手段 170 加算手段 180 制御手段 190 キャッシュミスカウンタ 200 CPU 300 主記憶 310 キャッシュミスアドレス分布表

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】主記憶アクセス時のアドレスを格納するア
    クセスアドレス格納手段と、 予め設定されたマスク情報により前記アクセスアドレス
    格納手段の出力をマスクするアドレスマスク手段と、 トレースをとるべきアドレスを格納しておく比較アドレ
    ス格納手段と、 前記アドレスマスク手段の出力と前記比較アドレス格納
    手段の出力とを比較して一致信号を出力する比較手段
    と、 比較が一致した回数を記録するために前記主記憶内に設
    けられたキャッシュミスアドレス分布表と、 前記キャッシュミスアドレス分布表内の前記アクセスア
    ドレスが対応するエントリの下位アドレスを前記アクセ
    スアドレス格納手段の出力から抽出する下位アドレス抽
    出手段と、 前記キャッシュミスアドレス分布表の上位アドレスを指
    定する分布表上位アドレス格納手段と、 前記分布表上位アドレス格納手段と前記下位アドレス抽
    出手段の出力とによって指定されたエントリに記録され
    ているアドレス別の計数値を加算する加算手段と、 これらの動作の制御を行う制御手段と、 を有し、 予め与えられた比較アドレスとマスク情報とに基づい
    て、一致したキャッシュミスによる主記憶アクセスの回
    数を前記キャッシュミスアドレス分布表にアドレス別に
    記録することを特徴とするキャッシュミスアドレス分布
    トレース回路。
  2. 【請求項2】予め与えられたキャッシュミス回数で割込
    みを発生するように、キャッシュミスカウンタを設けた
    ことを特徴とする請求項1のキャッシュミスアドレス分
    布トレース回路。
  3. 【請求項3】アクセスアドレスのブロックアドレスフィ
    ールドでブロック単位に参照され、前記アクセスアドレ
    スのタグフィールドと前記ブロック内に格納されたタグ
    情報とが一致しない場合キャッシュミスと判定されるキ
    ャッシュメモリにおいて、 キャッシュミス時におけるアクセスアドレスから抽出さ
    れるブロックアドレスについてキャッシュミス回数の頻
    度を累算し、 次に、前記キャッシュメモリにおけるキャッシュミスの
    多いブロックについて、前記アクセスアドレスから抽出
    されたキャッシュタグフィールド毎にキャッシュミス回
    数の頻度を累算する、 ことを特徴とするキャッシュミスアドレス分布トレース
    回路。
JP8110489A 1996-04-05 1996-04-05 キャッシュミスアドレス分布トレース回路 Expired - Lifetime JP2790119B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8110489A JP2790119B2 (ja) 1996-04-05 1996-04-05 キャッシュミスアドレス分布トレース回路

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8110489A JP2790119B2 (ja) 1996-04-05 1996-04-05 キャッシュミスアドレス分布トレース回路

Publications (2)

Publication Number Publication Date
JPH09274589A JPH09274589A (ja) 1997-10-21
JP2790119B2 true JP2790119B2 (ja) 1998-08-27

Family

ID=14537046

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8110489A Expired - Lifetime JP2790119B2 (ja) 1996-04-05 1996-04-05 キャッシュミスアドレス分布トレース回路

Country Status (1)

Country Link
JP (1) JP2790119B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8738881B2 (en) 2008-02-13 2014-05-27 Nec Corporation Performance optimization system, method and program
JP5440024B2 (ja) * 2009-08-25 2014-03-12 富士通株式会社 記録装置、記録方法、及び記録プログラム

Also Published As

Publication number Publication date
JPH09274589A (ja) 1997-10-21

Similar Documents

Publication Publication Date Title
US4285040A (en) Dual mode virtual-to-real address translation mechanism
US4495575A (en) Information processing apparatus for virtual storage control system
JPH04232551A (ja) 多重仮想アドレス変換方法及び装置
US11263139B2 (en) Hardware accelerators and access methods thereof
US5530823A (en) Hit enhancement circuit for page-table-look-aside-buffer
US6327643B1 (en) System and method for cache line replacement
JP2790119B2 (ja) キャッシュミスアドレス分布トレース回路
US10545877B2 (en) Apparatus and method for accessing an address translation cache
US5960456A (en) Method and apparatus for providing a readable and writable cache tag memory
US10482031B1 (en) Method and system for reconstructing virtual address from physical memory
JP2578182B2 (ja) デ−タ処理装置及びデ−タ処理システム
JPH05250262A (ja) マスキングされた保護間接ページ記述子を用いたデ−タ・プロセッサにおけるアドレス変換の方法および装置
JPH05225060A (ja) 情報処理装置
KR920005296B1 (ko) 정보처리장치
JP2850340B2 (ja) キャッシュメモリ制御回路
KR100234620B1 (ko) 캐시 메모리의 데이타 인출 방법
JP3235250B2 (ja) ディスクキャッシュ制御装置
JP2536651B2 (ja) 例外アドレスバッファ管理方式
JP3260466B2 (ja) メモリ更新方式
JPH11327949A (ja) 半導体装置およびそれを用いた情報処理システムの評価方法
JPS583175A (ja) 仮想記憶制御装置
JPH0883213A (ja) キャッシュメモリを含む記憶装置
JPH0764863A (ja) キャッシュメモリの自動判定方式
JPH06309196A (ja) トレース機能付情報処理装置
JPH02268350A (ja) バッファ記憶制御方式

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19980512