WO2006038258A1

WO2006038258A1 - データプロセッサ

Info

Publication number: WO2006038258A1
Application number: PCT/JP2004/014353
Authority: WO
Inventors: Masayuki Ito
Original assignee: Renesas Technology Corp.
Priority date: 2004-09-30
Filing date: 2004-09-30
Publication date: 2006-04-13
Also published as: US20080114940A1; JPWO2006038258A1

Abstract

　ＴＬＢのエントリ数分のウェイを持つセットアソシアティブキャッシュメモリ（２１）における各ウェイはＴＬＢによるアドレス変換単位であるページサイズに対応する記憶容量をデータ部（ＤＡＴ）に有し、アドレス部としてタグメモリ若しくはタグを持たない。ＴＬＢの各エントリ（ＥＴＹ０～ＥＴＹ７）とキャッシュメモリの各ウェイ（ＷＡＹ０～ＷＡＹ７）を１対１対応させ、ＴＬＢのアドレス変換対で規定される物理アドレスにマッピングされる領域のデータのみを対応するウェイにキャッシング可能とする。ＴＬＢの仮想ページアドレスの比較結果とＴＬＢの有効ビットとの論理積によって得られるＴＬＢヒット信号によってキャッシュデータアレイの動作を１ウェイのみ選択する。動作選択されたウェイのキャッシュ有効ビットをキャッシュヒット信号として利用する。

Description

明細書

テータプロセッサ

技術分野

[0001] 本発明はキャッシュメモリとアドレス変換バッファとを有するデータプロセッサに関する。

背景技術

[0002] キャッシュメモリにおいて、一定の大きさのブロックを単位として、外部メモリのデータをキャッシュメモリ内のデータに対応づけるマッピング方式として、ダイレクトマツピング方式、セットァソシァティブ方式、フルァソシァティブ方式がある。ここで、ブロックの大きさを Bバイト、キャッシュメモリ内のブロック数を cとすると、外部メモリのアドレス aのバイトが含まれるブロックの番号 mを aZBの整数部とする。ダイレクトマッピング方式では、番号 mの外部メモリのブロックはキャッシュメモリ内において式 m mod cで得られる番号のブロックに一意的にマッピングされる。ダイレクトマッピングでは、キヤッシュメモリ内の同一ブロックに割り当てられる複数のブロックが同時に使用されると衝突が発生してキャッシュヒット率が低下する。要するに、別アドレスでも同一ブロック（キャッシュライン）力 Sインデックスされる場合が多い、ということである。これに対してフルァソシァティブ方式では、外部メモリのどのブロックもキャッシュメモリのどのブロックに対してもマッピング可能とする方式である。し力しながら、フルァソシァティブ方式では、キャッシュメモリの全ブロックを各アクセス毎に連想検索しなければならず、実用的なキャッシュ容量では、実現困難である。このため、実用的には、両者の中間のセットァソシァティブ方式が一般的に用いられる。セットァソシァティブ方式は、 n (n= 2 、 4又は 8程)個のキャッシュメモリ内ブロックをまとめた単位をセットと定義し、このセットに対してはダイレクトマッピングを適用し、セット内のブロック（ウェイ）に対しては、フルァソシァティブマッピングを適用することによって、両者の長所を生かす構成であり、 nの値により nウェイセットァソシァティブ方式と称される。

[0003] 4ウェイセットァソシァティブ方式では、まず仮想アドレスのインデックスビットでインデッタスされる 4つの各ウェイのキャッシュライン力タグと有効ビットとデータを読み出す。実用的なキャッシュ方式である物理アドレスタグ方式のキャッシュでは、仮想アドレスをアドレス変換バッファ (TLB)により変換した物理アドレスと各ウェイのタグとを比較する。タグが一致してかつ有効ビットが 1であるウェイがキャッシュヒットとなる。キヤッシュヒットしたウェイのデータアレイからのデータを選択することで CPUの要求したデータを供給することができる。全てのウェイがヒットしない場合がキャッシュミスであり、この場合は下位階層のキャッシュメモリ又は外部メモリへアクセスして有効なデータを取得する必要がある。尚、フルァソシァティブ、セットァソシァティブ、ダイレクトマツピングの考え方はキャッシュとは独立に TLBの構成にも採用できる。

[0004] 本発明完成後の先行技術調査にて特許文献 1が得られた。特許文献 1には TLBとキャッシュメモリを備えたマイクロプロセッサにおいて TLBヒット判断とキャッシュヒット判断とを効率的に行う発明に関する記載がある。すなわち、 TLBとキャッシュメモリとを兼ねる TLB/キャッシュを配置し、仮想アドレス力も物理アドレスへの変換の際に、仮想アドレスにより TLB/キャッシュをインデックスしてタグを読み出し、読出したタグと仮想アドレスの上位側ビットを比較し、その比較結果信号と有効フラグ CVによりキャッシュヒット信号を生成する。この技術は、 1回の比較動作でキャッシュヒットの判断と TLBヒットの判断をまとめて行うことを特徴としており、ダイレクトマップを一例として示している。セットァソシァティブ形態とする場合には、当然複数のウェイは並列動作され、ウェイ毎にキャッシュヒットの判断と TLBヒットの判断がまとめて行われる。特に、 1キャッシュラインのデータはアドレス変換単位であるページサイズに等しくされる場合もあり、インデックスによるキャッシュラインの読出し及び書き込み単位は 32バイトなどの通常サイズに比べて 1キロバイトや 4キロバイトのように数十倍以上にも及ぶことになる。

[0005] 特許文献 1：特開 2003— 196157号公報

発明の開示

発明が解決しょうとする課題

[0006] 本発明者はセットァソシァティブキャッシュメモリによる電力消費を検討した。例えば 4ウェイセットァソシァティブキャッシュメモリの場合、メモリアクセスが発生する毎に、 4 ウェイ分のタグを読み出してキャッシュヒット判定を行う必要がある。 4ウェイ分のデータの同時にあら力じめ読み出しておき、前記キャッシュヒット判定信号でヒットしたゥェィのデータを選択する。このため、タグメモリ 4ウェイ分とデータメモリ 4ウェイ分の全てに対して読み出し動作を行う必要があり消費電力が大きいということが本発明者によつて見出された。

[0007] データプロセッサの低消費電力化に対する要求は、プロセスの微細化による動作周波数の向上や論理規模の増加により益々高まってきており、電池駆動のシステムや安価なノッケージを必要とするデータプロセッサでは特に大きな課題である。

[0008] こうした背景力も本発明者は、動作時の消費電力が大きいキャッシュメモリの無駄な読み出しを省くことについて検討した。キャッシュヒット率の観点から 2— 8ウェイを持つセットァソシァティブキャッシュメモリが主流である。セットァソシァティブキャッシュメモリでは全てのウェイのタグアレイとデータアレイを読み出す必要がある力実際に使われるのは一つのウェイ力も読み出したデータのみである。また、外部メモリの連続した領域がキャッシングされることが自然であるためタグには同一の物理ページァドレス（物理ページアドレス番号）が数多く登録される傾向があり、その物理アドレスは TL Bの物理ページ番号と同一である。そこで本発明者は、 TLBの物理ページ番号とキャッシュのタグを兼ねるようにして、セットァソシァティブキャッシュメモリにおけるデータアレイを TLBのヒット信号に従って 1ウェイのみ起動するという着眼点を得た。特許文献 1による着眼点は TLBヒット判断とキャッシュヒット判断とを効率的に行うために、 TLBの物理ページ番号とキャッシュのタグを兼ねるというものである。

[0009] 本発明の目的は、セットァソシァティブキャッシュメモリとアドレス変換バッファを有するデータプロセッサにお、て前記セットァソシァティブキャッシュメモリによる電力消費を低減することにある。

[0010] 本発明の前記並びにその他の目的と新規な特徴は本明細書の記述及び添付図面力明らかになるであろう。

課題を解決するための手段

[0011] 本願において開示される発明のうち代表的なものの概要を簡単に説明すれば下記の通りである。すなわち、 TLBのエントリ数分のウェイを持つセットァソシァティブキヤッシュメモリにおける各ウェイは TLBによるアドレス変換単位であるページサイズに対応する記憶容量をデータ部に有し、アドレス部としてタグメモリ若しくはタグを持たない。 TLBの各エントリとキャッシュメモリの各ウェイを 1対 1対応させ、 TLBのアドレス変換対で規定される物理アドレスにマッピングされる領域のデータのみを対応するゥェィにキャッシング可能とする。 TLBの仮想ページアドレスの比較結果と TLBの有効ビットとの論理積によって得られる TLBヒット信号によってキャッシュデータアレイの動作を 1ウェイのみ選択する。動作選択されたウェイのキャッシュ有効ビットをキャッシュヒット信号として利用する。以下に本発明を複数項目に分けて更に説明する。

[0012] 〔1〕データプロセッサは、アドレス変換バッファとセットァソシァティブ形態のキヤッシュメモリとを有し、前記アドレス変換バッファはアドレス変換対を格納するための n個のエントリフィールドを有し、前記キャッシュメモリは前記エントリフィールドに一対一対応される n個のウェイを有し、前記各々のウェイはアドレス変換単位であるページサイズの記憶容量を有するデータフィールドを備える。前記アドレス変換バッファはエントリフィールド毎の連想比較結果を対応するウェイに出力し、前記ウェイは入力した連想比較結果の連想ヒットに応答してメモリ動作を開始する。上記した手段によれば、 TL Bの連想ヒットに応答して対応する一つのウェイのみ起動するから、セットァソシァティブキャッシュメモリにおいて全てのウェイのタグアレイとデータアレイを並列に読み出し動作させることを回避することができ、低消費電力に資することができる。

[0013] 本発明の具体的な形態として、前記アドレス変換対は仮想ページアドレスとこれに対応する物理ページアドレスとを対とする情報を有し、前記データフィールドが保有するデータの物理ページアドレスは、対応するエントリフィールドのアドレス変換対が保有する物理ページアドレスに等し、。前記キャッシュメモリは前記データフィールドと対のアドレスタグフィールドを持つことを必要としない。

[0014] 前記アドレス変換バッファは、入力した変換対象アドレスを前記エントリフィールドの仮想ページアドレスと比較し、比較結果が一致したエントリフィールドが有効であることを条件に、当該エントリフィールドに対応するウェイにウェイヒットを通知し、このゥェィヒットの通知が連想比較結果の連想ヒットを示す。

[0015] 前記アドレス変換バッファによる前記連想比較結果が全て連想ミスであるときァドレス変換バッファのエントリをリプレースする制御ユニット（2, 24)を有し、前記制御ュ- ットはアドレス変換バッファのエントリをリプレースするとき、リプレースされるエントリに対応するキャッシュメモリのウェイのデータフィールドを無効化する。前記制御ユニットは更に、リプレースされるエントリに対応するキャッシュメモリのウェイのデータフィールドを無効化するとき、コピーバックされるべきデータフィールドのデータを有して、る場合には下位側メモリに書き戻しする。

[0016] 〔2〕本発明の別の観点によるデータプロセッサは、アドレス変換バッファとセットァソシァティブ形態のキャッシュメモリとを有し、前記アドレス変換バッファはアドレス変換対を格納するための n個のエントリフィールドを有し、前記キャッシュメモリは前記ェントリフィールドに一対一対応される n個のウェイを有し、前記各々のウェイは対応するエントリフィールドが保有する物理ページアドレスのデータの格納に割り当てられる。前記ウェイは対応するエントリフィールドに関する連想比較結果が連想ヒットになるのを条件にメモリ動作を開始する。したがって、セットァソシァティブキャッシュメモリにおいて全てのウェイのタグアレイとデータアレイを並列に読み出し動作させることを回避することができ、低消費電力に資することができる。

[0017] 本発明の具体的な形態として、全てのエントリフィールドに関する前記連想比較結果が連想ミスであるときアドレス変換バッファのエントリをリプレースする制御ユニットを有し、前記制御ユニットはアドレス変換バッファのエントリをリプレースするとき、リプレースされるエントリに対応するキャッシュメモリのウェイのキャッシュデータを無効化する。前記制御ユニットは更に、リプレースされるエントリに対応するキャッシュメモリのゥエイのデータを無効化するとき、コピーノックされるべきデータを有して、る場合には下位側メモリに書き戻しする。

[0018] 〔3〕本発明の更に別の観点によるデータプロセッサは、アドレス変換バッファとセットァソシァティブ形態のキャッシュメモリとを有し、前記アドレス変換バッファはアドレス変換対を格納するための n個のエントリフィールドと、アドレス変換の変換ヒットになるエントリフィールドを予測する予測回路とを有し、前記キャッシュメモリは前記エントリフィールドに一対一対応される n個のウェイを有し、前記各々のウェイは対応するェントリフィールドが保有する物理ページアドレスに配置されているデータの格納に割り当てられる。前記ウェイは対応するエントリフィールドがアドレス変換ヒットの予測領域であるのを条件にメモリ動作を開始し、前記キャッシュメモリは前記アドレス変換ヒットの予測が実際のアドレス変換結果と一致するのを条件にキャッシュヒットを生成する。 TLBの連想ヒットに応答して対応する一つのウェイを起動する制御形態は、一つのゥエイの動作を起動するタイミングが TLBの連想検索結果が出た後であり、 TLBの連想検索に並行してキャッシュメモリのインデックスを行う制御形態に比べて、キャッシュメモリのインデックス動作までに要する時間が長くなる。予測回路による予測結果にしたがってキャッシュメモリのインデックス動作を予め開始することによってその動作開始の遅れを小さくすることができる。予め開始したキャッシュ動作のキャッシュヒットは前記アドレス変換ヒットの予測が実際のアドレス変換結果と一致するのを条件とするから、誤った予測によるキャッシュ動作が有効にされることはない。

[0019] 〔4〕本発明の更に別の観点によるデータプロセッサは、アドレス変換バッファと複数のウェイを持つセットァソシァティブ形態のキャッシュメモリとを有し、前記アドレス変換ノッファは仮想ページアドレス情報と物理ページアドレス情報とを保有するアドレス変換対を有し、前記キャッシュメモリのタグをアドレス変換バッファのアドレス変換対が保有する物理ページアドレス情報と共通化し、前記アドレス変換バッファのヒット信号に応じて対応するキャッシュのウェイの動作を選択する。

[0020] 本発明の更に別の観点によるデータプロセッサは、アドレス変換バッファと複数のゥエイを持つセットァソシァティブ形態のキャッシュメモリとを有し、前記アドレス変換バッファは仮想ページアドレス情報と物理ページアドレス情報とを保有するアドレス変換対を有し、前記アドレス変換バッファの変換対が保有する物理ページアドレス情報によって指定される物理アドレス空間のデータをキャッシュメモリの対応するウェイに格納し、前記アドレス変換バッファのウェイのヒット信号に応じて、対応するウェイの動作を選択する。

[0021] 予測回路を用いる本発明の更に別の観点によるデータプロセッサは、アドレス変換ノッファと複数のウェイを持つセットァソシァティブ形態のキャッシュメモリとを有し、前記アドレス変換バッファは、仮想ページアドレス情報と物理ページアドレス情報とを保有するアドレス変換対と、アドレス変換バッファの変換ヒットを予測する予測回路とを有し、前記キャッシュメモリのタグをアドレス変換バッファのアドレス変換対が保有する物理ページアドレス情報と共通化し、前記予測回路による予測に応じて対応するキヤッシュのウェイの動作を選択し、前記予測が実際のアドレス変換結果に一致することを条件にキャッシュヒットを生成する。

[0022] 予測回路を用いる本発明の更に別の観点によるデータプロセッサは、アドレス変換ノッファと複数のウェイを持つセットァソシァティブ形態のキャッシュメモリとを有し、前記アドレス変換バッファは、仮想ページアドレス情報と物理ページアドレス情報を保有するアドレス変換対と、アドレス変換バッファの変換ヒットを予測する予測回路とを有し、前記アドレス変換バッファの変換対が保有する物理ページアドレス情報によつて指定される物理アドレス空間のデータをキャッシュメモリの対応するウェイに格納し、前記予測回路による予測に応じて対応するキャッシュのウェイの動作を選択し、前記予測が実際のアドレス変換結果に一致することを条件にキャッシュヒットを生成する発明の効果

[0023] 本願において開示される発明のうち代表的なものによって得られる効果を簡単に説明すれば下記の通りである。

[0024] すなわち、セットァソシァティブキャッシュメモリにおけるデータアレイを TLBの変換ヒット信号に従って 1個のウェイのみ動作を選択するから、セットァソシァティブキヤッシュメモリとアドレス変換バッファを有するデータプロセッサにおいて前記セットァソシァティブキャッシュメモリによる電力消費を低減することができる。

図面の簡単な説明

[0025] [図 1]ITLB及び ICACHEの詳細な一例を示すブロック図である。

[図 2]本発明の一例に係るデータプロセッサのブロック図である。

[図 3]図 1に代表されるようにアドレス変換バッファとキャッシュメモリが密結合でリンクされて動作される構成におけるメインメモリのデータとキャッシュメモリのデータとの関係を例示するアドレスマップである。

[図 4]ITLB及び ICACHEの動作フローを示すフローチャートである。

[図 5]TLB書き換え制御フローを示すフローチャートである。

[図 6]キャッシュ書き換え制御フローを示すフローチャートである。 [図 7]アドレス変換ヒットの予測結果を用いる ICACHと ITLBの詳細な一例を示すブロック図である。

[図 8]全てのウェイを並列的にインデックスする形態のキャッシュメモリを比較例として示すブロック図である。

[図 9]図 8のキャッシュメモリのデータとメインメモリのデータとの関係を例示するァドレスマップである。

符号の説明

1 データプロセッサ

2 CPU

3 アドレス変換バッファ及びキャッシュユニット

4 内部バス

5 ノスコントローラ

6 メインメモリ

20 命令アドレス変換バッファ

21 命令キャッシュメモリ

22 データアドレス変換バッファ

23 データキャッシュメモリ

24 制御回路

25 命令フツチ信号

26 仮想命令アドレス

27 仮想アドレス変換ヒット信号

28 命令

30 データフツチ信号

31 データアドレス

32 仮想アドレス変換ヒット信号

33 データ

ETY0— ETY7 エントリ

VPN 仮想ページアドレス（エントリフィールド) PPN 物理ページアドレス（エントリフィールド）

V 有効ビット（エントリフィールド）

50[7 : 0] エントリ変換ヒット信号

27[7 : 0] 仮想アドレス変換ヒット信号

65 キャッシュヒット信号

70 予測回路

71 予測一致確認回路

72[7 : 0] 仮想アドレス変換ヒット予測信号

73[7 : 0] 予測信号

発明を実施するための最良の形態

[0027] 《データプロセッサ》

図 2には本発明の一例に係るデータプロセッサが示される。同図に示されるデータプロセッサ (MPU) 1は、特に制限されないが、公知の半導体集積回路製造技術によって単結晶シリコンのような 1個の半導体基板（半導体チップ）に形成される。このデータプロセッサ 1は、データ処理ユニットとして、例えば、中央処理装置（CPU) 2を有し、中央処理装置 2はアドレス変換バッファ及びキャッシュユニット（TLB'CACH) 3を介して内部バス (IBUS) 4に接続される。特に制限されないが、前記内部バス 4にはスプリット 'トランザクション 'バスのバスプロトコルが採用される。内部バス 4には外部バス制御若しくは外部メモリインタフェース制御を行うバスコントローラ (BSC) 5が接続される。図においてバスコントローラ 5にはシンクロナス DRAMなどによって構成されるメインメモリ（MMRY) 6が接続される。また、バスコントローラに接続される外部回路はメモリに限定されず、その他 LSI (例えば LCDC、周辺回路）力接続されるように構成されヽて、ても良、。更に前記内部ノス 4にはバスブリッジ回路（BBRG) 7を介して周辺バス（PBUS) 8が接続される。周辺バス 8には割り込みコントローラ（INT C) 10、クロックパルスジェネレータ（CPG) 11などの周辺回路が接続される。周辺バス 8と内部バス 4にはダイレクト 'メモリ 'アクセス'コントローラ（DMAC) 12が接続され、モジュール間のデータ転送制御を行う。

[0028] 前記 CPU2は、特に制限されないが、汎用レジスタや算術論理演算器などを備えて演算を行う演算部と、プログラムカウンタや命令デコーダ等を備えて命令のフェッチや解読並びに命令実行手順を制御したり演算制御を行う命令制御部とを有する。

[0029] 前記アドレス変換バッファ及びキャッシュユニット 3は、命令アドレス変換バッファ（IT LB) 20、命令キャッシュメモリ（ICACHE) 21、データアドレス変換バッファ（DTLB) 22、データキャッシュメモリ（DCACHE) 23、及び制御回路 24を有する。 ITLB20は仮想命令アドレスとこれに対応される物理命令アドレスとの対の情報を変換対として有する。 DTLB21は仮想データアドレスとこれに対応される物理データアドレスとの対の情報を変換対として有する。それら変換対はメインメモリ 6上のページ管理情報の一部のコピーとされる。 ICACHE21はメインメモリ上のプログラム領域が保有するプログラムの一部の命令のコピーを有する。 DCACHE23はメインメモリ上のワーク領域が保有するデータの一部のコピーを有する。

[0030] CPU2は命令フェッチを行うとき、 ITLB20及び ICACHE21に、命令フェッチ信号 25をアサートし、且つ仮想命令アドレス 26を出力する。 ITLB20は仮想アドレスに対する変換ヒットのとき仮想アドレス変換ヒット信号 27を ICACHE21に出力する。 ICA CHE21は仮想命令アドレスに応ずる命令 28を CPU2に出力する。 CPU2はデータフェッチを行うとき、 DTLB22及び DCACHE23に、データフェッチ信号 30をアサ一トし、且つ仮想データアドレス 31を出力する。 DTLB22は仮想アドレスに対する変換ヒットのとき仮想アドレス変換ヒット信号 32を DCACHE23に出力する。リードアクセスの場合には DCACHE23は仮想データアドレスに応ずるデータ 33を CPU2に出力し、ライトアクセスの場合には DCACHE23は仮想データアドレスに応ずるキャッシュラインに CPU2からのデータ 33を書き込む。制御回路 24は、 ITLB20及び DTLB2 2における変換ミスの発生に応答して CPU2に TLB例外処理要求を通知する制御などを行う。また、制御回路 24は、 ICACHE21及び DCACHE23におけるキャッシュミスの発生に応答するキャッシュエントリのリプレース制御などを行う。

[0031] 前記アドレス変換及びキャッシュユニット 3は、内部バス 4との間で、物理命令アドレス 40の出力、命令 41の入力、データアドレス 42の出力、データ 43の入出力など行う

[0032] 《アドレス変換バッファ及びキャッシュユニット》図 1には ITLB及び ICACHEの詳細な一例が示される。ここでは ITLB20は例えば 8エントリのフルァソシァティブ構成、 ICACH21は例えば 8ウェイセットァソシァティブ構成とする。

[0033] ITLB20には 2個のエントリ ETY0、 ETY7が代表的に示される。 8エントリのフルァソシァティブ構成においてエントリをウェイと称することも可能である力ここではキヤッシュメモリのウェイと区別するためにエントリと称する。各々のエントリには仮想ページアドレス（VPN)、エントリの有効ビット（V)、物理ページアドレス（PPN)を保有するためのエントリフィールドを有する。 VPNと PPNは変換対を構成する。この例では ITLB 20によるアドレス変換単位であるページサイズは 4キロバイトとされ、仮想アドレス空間を 32ビットアドレス空間とする。 VPN及び PPNのビット幅は第 13ビット目から第 32 ビット目までの 20ビット（[31： 12])とされる。各エントリにおいて CMPは比較手段、 A NDは論理積ゲートを機能的に示して、る。フルァソシァティブ構成のメモリにはビット単位で比較機能を有するメモリセルを採用することができ、この場合には比較機能及び論理積機能はビット単位でメモリセルに担わせてよい。

[0034] CPU2が仮想命令アドレス 26を発行すると、そのうちの仮想ページアドレス [31： 12 ]が比較手段 CMPにより VPN ([31： 12])と比較され、これが一致してかつ有効ビット TVが 1 (有効レベル)である場合にエントリ ETYOにおけるエントリ変換ヒット信号 50[ 0]がヒットを意味する論理値 1となる。各エントリからのエントリ変換ヒット信号 50[7 : 0] が同時に 2つ以上論理値 1になる TLBマルチヒット状態は通常は生じな、ようになつている。 TLBマルチヒット状態が発生された場合にはその状態を検出し、マルチヒット例外処理要求を CPU2に通知することで対処するようになって、る。論理和回路 (O R) 51は 8本の信号 50[7 : 0]の論理和を採って変換ヒット信号 53を生成する。制御回路 24は変換ヒット信号 50を入力し、 TLBミスが通知されたとき CPU2に TLBミス例外要求を発生する。また、エントリの PPNはエントリ変換ヒット信号 50[7 : 0]によってセレクタ 52で一つが選択され物理ページアドレスとして出力される。この物理ページアドレスは、必要に応じて図 2の 40で示される物理アドレス 40を構成する物理ページアドレスとして内部バス 4に出力される。前記エントリ変換ヒット信号 50[7 : 0]はアンドゲート 54で命令フェッチ信号 25と論理積が採られ、仮想アドレス変換ヒット信号 27[7： 0] として命令キャッシュメモリ 21に供給される。

[0035] 命令キャッシュメモリ 21は 8個のウェイ WAYO— WAY7を有する。ウェイ WAYO— WAY7の全て又は任意の一つを指称するときは単にゥヱイ WAYとも記す。各々のゥエイ WAY0— WAY7はデータフィールド DATと有効ビットフィールド Vを有し、各々のウェイ WAYのデータフィールドのキャッシュ容量はページサイズと一致しており 4キロバイトである。データフィールド DATのキャッシュラインサイズは 32バイトの例で示しており、仮想アドレスの下位側 [11 : 5]が命令キャッシュメモリ 21へのインデックスァドレス 60として与えられる。仮想アドレスの下位アドレス [4 : 0]はライン内オフセットアドレス 61とされ、 1ライン内 32バイトの中でのデータ位置の選択に用いられる。その選択にはセレクタ 63を用いる。 8個のウェイ WAY0— WAY7の動作は仮想アドレス変換ヒット信号 27[7 : 0]によって個別に指示される。すなわち、各々のウェイ WAY0— WAY7は対応する仮想アドレス変換ヒット信号 27[7： 0]が変換ヒットであるときメモリ動作が選択される。メモリ動作が選択されたウェイ WAYは、インデックスアドレスによるアドレシングなどが可能にされ、メモリセルの選択、選択されたメモリセル力記憶情報を読み出し、或いは選択されたメモリセルに情報を記憶することが可能にされる。したがって、命令アクセス要求がある場合でも、対応する仮想アドレス変換ヒット信号 27[7： 0]がヒットしない限りウェイ WAYはは起動しな!、。仮想アドレス変換ヒット信号 27[7： 0]は仮想ページ単位の変換ヒット信号であるから、仮想アドレス変換ヒット信号 27[7 : 0]は 1つし力論理値 1 (変換ヒット値）にならず、動作されるウェイは一つに限られる。要するに、 TLBによるアドレス変換ヒットに係る仮想ページに対応する一つのウェイ WAYだけが動作される。全てのウェイが並列動作されない。これにより、無駄な電力消費を抑制することができる。

[0036] 起動されたウェイ WAYでは、データフィールド DATと有効ビットフィールド Vからィンデッタスアドレス 60に対応するキャッシュラインが選択され、データと有効ビットが読み出される。読み出されたデータはオフセットアドレス 61によりセレクタ 63で選択される。セレクタ 63から出力されたデータと前記ウェイ力も読み出された有効ビットは仮想アドレス変換ヒット信号 27[7 : 0]によって選択動作を行うセレクタ 64で選択されて出力される。セレクタ 64で選択された有効ビットは制御回路 24に供給される。制御回路 2 4は有効ビットをキャッシュヒット信号 65とみなし、キャッシュヒットであれば (有効ビットが有効を示す論理値であれば）、前記セレクタ 64で選択されたデータをキャッシュデータ 28として CPU2に供給される。キャッシュミスであれば、バスコントローラ 5を介してメインメモリ 6をアクセスして、対応する命令をそのキャッシュラインに取り込む制御を行うと共に、取り込んだ命令を CPU2に供給する。

[0037] 図 1では命令系の ITLB及び ICACHEについて説明した力データ系の DTLB及び DCACHETLBについても同様に構成することができる。データの場合は書き込みアクセスも発生する力ウェイの選択以外は従来のキャッシュメモリと特別異なる操作を行う必要はない。また、命令とデータを区別しない統合 TLB、統合キャッシュメモリの構成を採用する場合も同様である。詳細は後述するが TLBミスと関係してキヤッシュメモリの操作が必要になる。

[0038] 図 3には図 1に代表されるようにアドレス変換バッファとキャッシュメモリが密結合でリンクされて動作される構成におけるメインメモリのデータとキャッシュメモリのデータとの関係を例示する。ここでは、説明を簡単にするために、 PPNを 2ビット、ページサイズを 3ビットエリアとする。キャッシュメモリのウェイはキャッシュラインを 8ライン有して!/ヽる。インデックスアドレス Aidxは 3ビットである。図において、ウェイ WAYOに対応する TLBの PPNはページ番号 00、ウェイ WAY1に対応する TLBの PPNはページ番号 10としている。この場合、キャッシュメモリのウェイ WAYOにはメインメモリのメモリアドレス 00000— 00111までの範囲 RNGOが格納可能であり、ウェイ WAY1にはメインメモリのメモリアドレス 10000— 10111までの範囲 RAG1が格納可能である。このように、ある時点において、 TLBに格納されているアドレス変換対象となるメモリ領域のみが対応するキャッシュメモリのウェイに格納可能となる。この関係ゆえに、 TLBにおけるエントリ毎の仮想アドレス変換ヒット信号でキャッシュメモリのウェイ毎にメモリ動作の起動を決めることができる。なお、キャッシュメモリへのデータの登録はラインサイズ単位で行い、そのサイズ毎に有効ビットを保有しており、有効なデータがキャッシュに登録されている場合に有効ビットを論理値 1としてそのデータが有効であることを示す

[0039] 図 4には ITLB及び ICACHEの動作フローが例示される。 CPU2から発行される命令仮想アドレスの上位 [31： 12]を命令 TLBの各エントリの VPNと比較し、その比較結果と各エントリの有効ビットとの論理積を採り、各エントリの仮想アドレス変換ヒット信号 27[7： 0]を生成する（S 1)。仮想アドレス変換ヒット信号 27[7： 0]のうち論理値 1が幾つあるかを判定する（S2)。 2個以上であれば TLBマルチヒット状態が CPU2に通知される（S3)。一つだけが論理値 1であれば、ヒットに係るウェイのメモリ動作が選択され、当該ウェイからインデックスされたデータと有効ビットを読み出す (S4)。読出した有効ビットの論理値力^かを判定し (S5)、有効 (論理値 1)であれば読出しデータ力 SCPUに供給される（S6)。有効でなければ、キャッシュ書き換え制御により、キヤッシュミスに対するキャッシュラインのフィル動作などが行われる（S7)。ステップ S2の判定で全てが論理値 0のときは、 TLBミスであり、 TLBのエントリの追加若しくはリプレースのための TLBミス例外処理要求が CPU2に発行され、 TLB書き換え制御が行われる（S8)。このとき、制御部 24は、書き換えた TLBのエントリに対応されるキャッシュメモリのウェイの有効ビットを全て無効のレベルに書き換える（S9)。その後、 TLBの各エントリの仮想ページアドレス VPNに対する比較動作 (S1)力やり直す。

[0040] 特に図示はしないが、書き込みアクセスに対応することが必要なデータキャッシュメモリの場合、前記制御回路 24は、リプレースされるエントリに対応するキャッシュメモリのウェイのデータフィールドを無効化するとき（S9)、コピーバックされるべきデータフィールドのデータを有して、る場合にはメインメモリに書き戻しする。

[0041] 図 5には TLB書き換え制御フローが例示される。書き換え制御フローはデータプロセッサに下位階層の TLBが存在するカゝ否かで異なる（Sl l)。下位階層の TLBが存在する場合、下位階層の TLBを検索する（S12)。検索した下位階層の TLBが、上記 TLBミスに係る仮想ページアドレスに対して変換ヒット (TLBヒット）であるかを判定する（S13)。 TLBヒットの場合には当該下位階層 TLBの変換対の VPNと PPNをミスに係る TLBのエントリとして登録する（S 14)。ステップ S 13にお!/、て下位階層の TLB がミスであるとき（下位階層の TLBが存在するがそこでも TLBミスとなった場合）、 TL Bミスを CPUに通知しソフトウェア制御にてメインメモリに管理されているページ管理情報をミスに係る上位及び下位双方の TLB(VPN, PPN)に登録し、有効にする（S1 5)。下位階層の TLBが存在しない場合、 TLBミス例外を CPUに通知しソフトウェア制御にてメモインメモリ 6に管理されているページ管理情報をミスに係る TLB(VPN, PPN)に登録し、有効にする。

[0042] 図 6にはキャッシュ書き換え制御フローが例示される。 TLBにはヒットしたが対応するキャッシュのウェイの有効ビットが論理値 0 (無効レベル)であった場合、キャッシュミスとなる。このとき図 4にステップ S 7で説明したようにキャッシュ書き換え制御を行う。キャッシュの書き換えはキャッシュミスした 1ラインのみの更新である。

[0043] まず、データプロセッサに下位階層のキャッシュメモリが存在するか否かで制御が異なる（S21)。下位階層のキャッシュメモリが存在する場合、下位階層のキャッシュメモリを検索する（S22)。下位階層のキャッシュメモリがキャッシュヒットの場合にはヒットに係るキャッシュデータを上位階層のキャッシュメモリに登録し、有効ビットを論理値 1 とする（S24)。下位階層のキャッシュが存在するがそこでもキャッシュミスとなった場合には、キャッシュミスをバスコントローラ 5に通知し、メインメモリ 6をアクセスさせる。これによってメインメモリ 6から取得したデータを上位及び下位双方のキャッシュメモリに登録し、有効ビットを論理値 1とする（S25)。このとき、下位階層のキャッシュメモリに対してデータ登録を行なわな、選択も可能である。下位階層のキャッシュメモリが存在しない場合、キャッシュミスをバスコントローラ 5に通知し、メインメモリ 6をアクセスさせ、メインメモリ 6から得たデータをキャッシュメモリに登録し、有効ビットを論理値 1として、キャッシュ書き換え制御を終了する（S26)。

[0044] キャッシュメモリを書き換えた後、正しいデータを CPU2へ供給することができる。このとき、 TLBの各エントリの VPN比較動作 (S1)力もやり直すことも可能であるし、仮想アドレス変換ヒット信号 27[7： 0]を保持しておき対応するキャッシュウェイ力もの読み出し動作力再開しても良い。或いは、キャッシュメモリへのデータ登録と同時に C PU2が要求しているデータをキャッシュメモリへ登録するのと並行して CPU2へも供給する制御を行うことも可能である。

[0045] 図 8には全てのウェイを並列的にインデックスする形態のキャッシュメモリを比較例として示す。図 8において ICACHEはアドレスタグフィールド TAGを有する。図 8において信号 25にて命令アクセス要求があると、 ITLBのアドレス変換動作に並行して、 I CACHEは全てのウェイ WAYO— WAY7の動作が選択されてインデックス動作が開始される。インデックスされたキャッシュラインのタグは ITLBカゝら供給される物理ぺージアドレスと比較され、一致したウェイのキャッシュデータがキャッシュヒットに係るデータとされる。図 9には図 8のキャッシュメモリのデータとメインメモリのデータとの関係を例示する。ここでも図 3と同様に、説明を簡単にするため、 PPNを 2ビット、ページサイズを 3ビットエリアとする。キャッシュメモリのウェイはキャッシュラインを 8ライン有して!/ヽる。インデックスアドレス Aidxは 3ビットである。

[0046] 以上説明したように、データプロセッサ 1にお、て仮想アドレス変換ヒット信号 27[7： 0]に代表されるように TLBのエントリ毎に生成されるアドレス変換ヒット信号に応答して対応するキャッシュウェイのメモリ動作が開始され、全てのキャッシュウェイが並列的にインデックス動作を開始することはない。 ICACH, DCACHはキャッシュにタグメモリが不要であるから、タグメモリ自体をアクセスするための電力も全く必要ない。したがって、従来技術のセットァソシァティブ構成のキャッシュメモリに対して低消費電力を実現することができる。この効果を見積もるにあたり、キャッシュメモリのタダフィールドとデータフィールドのビット幅を考慮して、 1個のキャッシュウェイにお!、てタグフィ一ルドとデータフィールドの電力消費の割合を 1： 2と仮定すると、従来技術のセットァソシァティブキャッシュメモリと ICACHに代表される TLBと密結合されたウェイの選択動作型キャッシュメモリとの消費電力の比は 12 : 2程度になり、キャッシュメモリの消費電力を約 83%程度低減可能であると見積ることができる。

[0047] 《アドレス変換ヒットの予測結果を用いるキャッシュユニット》

図 7にはアドレス変換ヒットの予測結果を用いる ICACHと ITLBの詳細な一例が示される。ここでは ITLB20は例えば 8エントリのフルァソシァティブ構成、 ICACH21は例えば 8ウェイセットァソシァティブ構成とし、図 1の場合と同様とする。図 1の構成に対し、予測回路 70と予測一致確認回路 71とを追加し、仮想アドレス変換ヒット予測信号 72[7 : 0]にしたがってウェイ WAYの動作を選択し、前記アドレス変換ヒットの予測が実際のアドレス変換結果と一致するのを条件にキャッシュヒット 65を生成するようにした点が相違される。予測回路 70は一つ前のアドレス変換結果を保持し、これを予測信号 73[7 : 0]として出力する。予測信号 73[7 : 0]はアンドゲート 54によって命令フエッチ信号 25と論理積が採られ、論理積信号が仮想アドレス変換ヒット予測信号 72[ 7： 0]とされる。 ICACH21のウェイ WAYO— WAY7は対応する仮想アドレス変換ヒット予測信号 72[7 : 0]の論理値 1によってメモリ動作が開始される。要するに、 ICACH 21のウェイ WAYO— WAY7に対する起動制御に関しては、仮想アドレス変換ヒット予測信号 72[7： 0]は図 1における仮想アドレス変換ヒット信号 27[7： 0]の機能を持つ。予測一致確認回路 71は実際の各エントリ ETYO— ETY7におけるアドレス変換結果であるエントリ変換ヒット信号 50[7 : 0]を受け取る。予測一致確認回路 71は予測回路 70が保持して、る予測信号 73[7： 0]の値と、新たに受け取ったエントリ変換ヒット信号 50[7 : 0]との一致を判定し、その判定結果信号 75を出力すると共に、予測回路 70に新たな予測結果としてそのエントリ変換ヒット信号 50[7 : 0]の値を保持させ、次のキャッシュ動作に利用可能とする。予測の正否を示す判定結果信号 75はセレクタ 77で選択された有効ビットとアンドゲート 76で論理積が採られる。その論理積信号がキャッシュヒット信号 65とみなされる。

図 1と比べると、対応するキャッシュのゥヱイを信号 27[7 : 0]で起動する代わりに、予測信号 73[7： 0]と命令アクセス信号 25との論理積信号を用いて命令キャッシュのゥエイ WAYを起動する。したがって、 ITLB20での変換ヒット信号 50[7 : 0]の確定を待たずにキャッシュメモリ 21を起動することができるため高速動作が可能となる。この場合でも ITLB20側の VPN比較は行、、実際のアドレス変換ヒット信号 50[7： 0]が確定した時点で予測が正し力たかどうかを確認する。予測一致確認結果は次の予測に反映するため予測回路 70に供給される。予測が正し力つた場合、 ICACH21から出力されるデータとキャッシュヒット信号は正しいものであり、図 1の場合と同様に用いれらる。予測が誤っていた場合には、今度は正しい予測信号 73[7 : 0]を既に得ているため、予測回路 70の出力を用いても予測を誤ることはない。正しい予測ヒット信号を予測回路 70に保持しておけば、対応するキャッシュメモリ 21のウェイ WAYの読み出しから再開することができる。もちろん ITLB20の各エントリ ETYの VPN比較からやり直す制御も可能である。この応用例では、キャッシュメモリの有効データを高速に得ることができる特徴にカ卩えて、起動されるキャッシュメモリのウェイ WAYが 1個である点は先に説明した例と変わりないため、上記同様に低消費電力の効果も得ることができる。 [0049] 以上本発明者によってなされた発明を実施形態に基づいて具体的に説明したが、本発明はそれに限定されるものではなぐその要旨を逸脱しない範囲において種々変更可能であることは言うまでもな、。

[0050] 例えば上記の例では仮想メモリから物理メモリへのマッピング方式として、固定長のアドレス変換を用いる方式 (ページング方式）を一例として、る。ページサイズは 4キロバイトに限定されず適宜変更可能である。データプロセッサは CPUの他に浮動小数点演算ユニットや積和演算ユニットなどのデータ処理ユニットを備えてもよい。更にその他の回路モジュールを有してょ、。データプロセッサはシングルチップに限定されず、マルチチップで構成されるものであってもよいし、中央処理装置を複数備えるマルチ CPU構成であってもよ!/、。

産業上の利用可能性

[0051] 本発明はアドレス変換バッファとキャッシュメモリを備えたマイクロコンピュータやマイクロプロセッサなどに広く適用することができる。

Claims

請求の範囲

[1] アドレス変換バッファとセットァソシァティブ形態のキャッシュメモリとを有し、

前記アドレス変換バッファはアドレス変換対を格納するための n個のエントリフィールドを有し、

前記キャッシュメモリは前記エントリフィールドに一対一対応される n個のウェイを有し、前記各々のウェイはアドレス変換単位であるページサイズの記憶容量を有するデータフィールドを備え、

前記アドレス変換バッファはエントリフィールド毎の連想比較結果を対応するウェイに出力し、前記ウェイは入力した連想比較結果の連想ヒットに応答してメモリ動作を開始するデータプロセッサ。

[2] 前記アドレス変換対は仮想ページアドレスとこれに対応する物理ページアドレスとを対とする情報を有し、

前記データフィールドが保有するデータの物理ページアドレスは、対応するエントリフィールドのアドレス変換対が保有する物理ページアドレスに等しい請求項 1記載のデータプロセッサ。

[3] 前記キャッシュメモリは前記データフィールドと対のアドレスタグフィールドを持つことを必要としない請求項 2記載のデータプロセッサ。

[4] 前記アドレス変換バッファは、入力した変換対象アドレスを前記エントリフィールドの仮想ページアドレスと比較し、比較結果が一致したエントリフィールドが有効であることを条件に、当該エントリフィールドに対応するウェイにウェイヒットを通知し、このゥェィヒットの通知が連想比較結果の連想ヒットを示す請求項 3記載のデータプロセッサ。

[5] 前記アドレス変換バッファによる前記連想比較結果が全て連想ミスであるときアドレス変換バッファのエントリをリプレースする制御ユニットを有し、前記制御ユニットはアドレス変換バッファのエントリをリプレースするとき、リプレースされるエントリに対応するキャッシュメモリのウェイのデータフィールドを無効化する請求項 1記載のデータプロセッサ。

[6] 前記制御ユニットは更に、リプレースされるエントリに対応するキャッシュメモリのウェイのデータフィールドを無効化するとき、書き込みアクセスに対するキャッシュメモリのライトキャッシュミスに対してコピーバックされるべきデータフィールドのデータを下位側メモリに書き戻しする請求項 5記載のデータプロセッサ。

[7] アドレス変換バッファとセットァソシァティブ形態のキャッシュメモリとを有し、

前記キャッシュメモリは前記エントリフィールドに一対一対応される n個のウェイを有し、

前記各々のウェイは対応するエントリフィールドが保有する物理ページアドレスのデータの格納に割り当てられ、

前記ウェイは対応するエントリフィールドに関する連想比較結果が連想ヒットになるのを条件にメモリ動作を開始するデータプロセッサ。

[8] 全てのエントリフィールドに関する前記連想比較結果が連想ミスであるときアドレス変換バッファのエントリをリプレースする制御ユニットを有し、前記制御ユニットはァドレス変換バッファのエントリをリプレースするとき、リプレースされるエントリに対応するキャッシュメモリのウェイのキャッシュデータを無効化する請求項 7記載のデータプロセッサ。

[9] 前記制御ユニットは更に、リプレースされるエントリに対応するキャッシュメモリのウェイのデータを無効化するとき、書き込みアクセスに対するキャッシュメモリのライトキヤッシュミスに対してコピーバックされるべきデータを下位側メモリに書き戻しする請求項 8 記載のデータプロセッサ。

[10] アドレス変換バッファとセットァソシァティブ形態のキャッシュメモリとを有し、

前記アドレス変換バッファはアドレス変換対を格納するための n個のエントリフィールドと、アドレス変換の変換ヒットになるエントリフィールドを予測する予測回路とを有し、前記キャッシュメモリは前記エントリフィールドに一対一対応される n個のウェイを有し、

前記各々のウェイは対応するエントリフィールドが保有する物理ページアドレスに配置されて!、るデータの格納に割り当てられ、

前記ウェイは対応するエントリフィールドがアドレス変換ヒットの予測領域であるのを条件にメモリ動作を開始し、前記キャッシュメモリは前記アドレス変換ヒットの予測が実際のアドレス変換結果と一致するのを条件にキャッシュヒットを生成するデータプロセッサ。

[11] アドレス変換バッファと複数のウェイを持つセットァソシァティブ形態のキャッシュメモリとを有し、

前記アドレス変換バッファは仮想ページアドレス情報と物理ページアドレス情報とを保有するアドレス変換対を有し、

前記キャッシュメモリのタグをアドレス変換バッファのアドレス変換対が保有する物理ページアドレス情報と共通化し、前記アドレス変換バッファのヒット信号に応じて対応するキャッシュのウェイの動作を選択するデータプロセッサ。

[12] アドレス変換バッファと複数のウェイを持つセットァソシァティブ形態のキャッシュメモリとを有し、

前記アドレス変換バッファの変換対が保有する物理ページアドレス情報によって指定される物理アドレス空間のデータをキャッシュメモリの対応するウェイに格納し、前記アドレス変換バッファのウェイのヒット信号に応じて、対応するウェイの動作を選択するデータプロセッサ。

[13] アドレス変換バッファと複数のウェイを持つセットァソシァティブ形態のキャッシュメモリとを有し、

前記アドレス変換バッファは、仮想ページアドレス情報と物理ページアドレス情報とを保有するアドレス変換対と、アドレス変換バッファの変換ヒットを予測する予測回路とを有し、

前記キャッシュメモリのタグをアドレス変換バッファのアドレス変換対が保有する物理ページアドレス情報と共通化し、前記予測回路による予測に応じて対応するキヤッシュのウェイの動作を選択し、前記予測が実際のアドレス変換結果に一致することを条件にキャッシュヒットを生成するデータプロセッサ。

[14] アドレス変換バッファと複数のウェイを持つセットァソシァティブ形態のキャッシュメモリとを有し、

前記アドレス変換バッファは、仮想ページアドレス情報と物理ページアドレス情報を保有するアドレス変換対と、アドレス変換バッファの変換ヒットを予測する予測回路とを有し、

前記アドレス変換バッファの変換対が保有する物理ページアドレス情報によって指定される物理アドレス空間のデータをキャッシュメモリの対応するウェイに格納し、前記予測回路による予測に応じて対応するキャッシュのウェイの動作を選択し、前記予測が実際のアドレス変換結果に一致することを条件にキャッシュヒットを生成するデータプロセッサ。