WO2007097030A1

WO2007097030A1 - キャッシュ制御装置およびキャッシュ制御方法

Info

Publication number: WO2007097030A1
Application number: PCT/JP2006/303622
Authority: WO
Inventors: Masaki Ukai
Original assignee: Fujitsu Limited
Priority date: 2006-02-27
Filing date: 2006-02-27
Publication date: 2007-08-30
Also published as: JPWO2007097030A1; EP2261804B1; US8312218B2; EP1990730A1; EP2261804A1; EP1990730A4; JP4409620B2; EP1990730B1; US20080320223A1

Abstract

　チップの小型化および低コスト化を実現しつつ、キャッシュメモリに書き込まれるデータを多く取り込むこと。外部バス制御部（１０１）は、入出力制御部（１０５）の制御に応じたタイミングで、いずれかの外部バスからのＭＩデータをＭＩデータＲＡＭ（１０２）に入力する。ＭＩデータＲＡＭ（１０２）は、ＭＩデータを記憶し、データレジスタ部（１０８）にＭＩデータを取り込むための空きが生じるとセレクタ（１０４）を経由してデータレジスタ部（１０８）へＭＩデータを出力する。入出力制御部（１０５）は、外部バス制御部（１０１）へ流入するＭＩデータをＣＰＵサイクルに合わせてＭＩデータＲＡＭ（１０２）に入力させる。データレジスタ部（１０８）は、Ｌ２キャッシュ（１１１）へ書き込まれるＭＩデータを一度取り込んだ後、Ｌ２キャッシュ（１１１）へ書き込む。

Description

明細書

キャッシュ制御装置およびキャッシュ制御方法

技術分野

[0001] 本発明は、キャッシュメモリにデータを書き込むキャッシュ制御装置およびキヤッシュ制御方式に関し、特に、チップの小型化および低コストィ匕を実現しつつ、キャッシュメモリに書き込まれるデータを多く取り込むことができるキャッシュ制御装置およびキャッシュ制御方法に関する。

背景技術

[0002] 近年、コンピュータなどの情報処理装置にお!、ては、一般にアクセス速度が低!、メインメモリへのアクセス回数を減らして CPU (Central Processing Unit)の処理速度を向上させるため、 CPU上にキャッシュメモリが搭載される構成が主流となっている。キャッシュメモリは、高速アクセスが可能であるものの、容量がメインメモリよりも小さいため、 CPUが必要とするデータがキャッシュメモリに記憶されてヽなヽ（キャッシュミス）ことがあり、このような場合には、 2次キャッシュなどの上位キャッシュやメインメモリに記憶されているデータを CPU上のキャッシュメモリヘム一ブインする必要が生じる。

[0003] キャッシュメモリヘム一ブインされるデータは、ー且キャッシュメモリに接続されるデータレジスタによって取り込まれ、データレジスタからキャッシュメモリに書き込まれるのが一般的である。

[0004] ところで、近年の技術の目覚しい進歩により、 CPUの処理速度はますます向上しているとともに、メインメモリの容量はますます増大している。この結果、単位時間当たりに CPUが必要とするデータ量は多くなる一方で、これらのデータをメインメモリから探し出すのには長時間を要するようになり、 CPUとメインメモリの速度が乖離し、相対的にメモリレイテンシが増大しつつある。

[0005] このような状況下では、キャッシュメモリへのデータのムーブインを適切に制御することが重要になってきており、例えば特許文献 1では、メインメモリの負荷が大きくなるとムーブインするデータ量を削減し、メインメモリの負荷が小さくなると削減した分のデ一タのム一ブインを再開する技術が開示されてヽる。 [0006] 特許文献 1の技術では、キャッシュミス発生時のデータのムーブインを効率的に調整することができるものの、ムーブインされるデータを使用する CPUの処理速度がメインメモリの速度によって制限されることになり、増大しているメモリレイテンシを完全にカバーすることはできない。そこで、キャッシュミスに対するデータのムーブインを実行中に、 CPUが後続する処理を次々に実行してスループットを向上することが考えられる。この場合、同時期に発生するキャッシュミスが多くなつてムーブインされるデータ量が増えるため、キャッシュメモリにデータを書き込むデータレジスタが一度に取り込み可能なデータ量を増カロさせることが望まれる。

[0007] 特許文献 1 :特開平 7— 210460号公報

発明の開示

発明が解決しょうとする課題

[0008] しかしながら、データレジスタの容量を増加させるため、単にデータレジスタ内のデ一タキユーを大きくすると、現行のチップの面積には収まりきらなくなるため、 CPUが搭載されるチップの面積の増大を招き、チップの小型化に逆行することになり現実的ではない。用することも考えられるが、データレジスタは、キャッシュメモリに書き込まれるデータを一時的に取り込むものであるため、データレジスタの代用となる RAMは、キヤッシュメモリよりは大幅に小さい容量で十分である。そして、容量が小さいにも拘らず、データレジスタの代用として機能しスループットを向上するためには、 RAMの単位時間当たりのデータの流入量および流出量をキャッシュメモリへの書き込みに合わせて大きくする必要がある。このため、 RAMの使用に伴う制御回路やデータバスが大きい面積を占めることになり、結果としてデータレジスタの代用部分が空間的にもコスト的にも肥大してしまう。

[0010] 本発明は力かる点に鑑みてなされたものであり、チップの小型化および低コストィ匕を実現しつつ、キャッシュメモリに書き込まれるデータを多く取り込むことができるキヤッシュ制御装置およびキャッシュ制御方法を提供することを目的とする。

課題を解決するための手段 [0011] 上記課題を解決するために、本発明は、キャッシュメモリにデータを書き込むキヤッシュ制御装置であって、前記キャッシュメモリへの書き込み用に外部から流入するデータを保持する第 1バッファ手段と、前記第 1バッファ手段に保持されるデータのうち、現時点で前記キャッシュメモリへの書き込み対象となるデータを保持する第 2バッファ手段と、前記第 2バッファ手段に保持されるデータの前記キャッシュメモリへの書き込みを制御する書込制御手段とを有することを特徴とする。

[0012] また、本発明は、上記発明において、前記第 1バッファ手段は、前記キャッシュメモリへの書き込みが同時に要求され得るすべてのデータを記憶可能な容量の RAMを含むことを特徴とする。

[0013] また、本発明は、上記発明において、前記第 2バッファ手段に空き領域がある力否かを監視する監視手段をさらに有し、前記第 1バッファ手段は、前記監視手段によつて前記第 2バッファ手段に空き領域があること確認された場合に、データを前記第 2 ノッファ手段へ出力することを特徴とする。

[0014] また、本発明は、上記発明において、前記第 2バッファ手段は、前記キャッシュメモリの近傍に配置され、前記第 1バッファ手段は、前記第 2バッファ手段よりも前記キヤッシュメモリから遠方に配置されることを特徴とする。

[0015] また、本発明は、上記発明において、前記第 1バッファ手段は、複数の外部バスからのデータの流入を制御する外部バス制御手段を含み、前記第 2バッファ手段は、外部バスそれぞれに対応する領域であって同量のデータを保持する領域を備えることを特徴とする。

[0016] また、本発明は、上記発明において、前記第 2バッファ手段は、外部バスそれぞれについて 2回の書き込み分のデータを保持する領域を備えることを特徴とする。

[0017] また、本発明は、上記発明において、外部から流入するデータに前記第 1バッファ手段をバイパスさせるバイパス手段と、前記第 1バッファ手段から出力されるデータまたは前記バイパス手段力も出力されるデータのいずれか一方を選択して前記第 2バッファ手段へ出力する選択手段とをさらに有することを特徴とする。

[0018] また、本発明は、上記発明において、前記選択手段は、前記第 2バッファ手段に空き領域がある場合に、前記バイパス手段力も出力されるデータを選択することを特徴とする。

[0019] また、本発明は、上記発明において、前記書込制御手段は、前記第 1バッファ手段から前記第 2バッファ手段へデータが出力されると、このデータの前記キャッシュメモリへの書き込みを前記第 2バッファ手段に実行させることを特徴とする。

[0020] また、本発明は、キャッシュメモリにデータを書き込むキャッシュ制御方法であって、前記キャッシュメモリへの書き込み用に外部力流入するデータを第 1バッファに保持する第 1保持工程と、前記第 1保持工程にて保持されるデータのうち、現時点で前記キャッシュメモリへの書き込み対象となるデータを第 2バッファに保持する第 2保持工程と、前記第 2保持工程にて保持されるデータの前記キャッシュメモリへの書き込みを制御する書込制御工程とを有することを特徴とする。

発明の効果

[0021] 本発明によれば、キャッシュメモリへの書き込み用に外部力流入するデータを第 1 ノッファに保持し、第 1バッファに保持されるデータのうち、現時点でキャッシュメモリへの書き込み対象となるデータを第 2バッファに保持し、第 2バッファに保持されるデータのキャッシュメモリへの書き込みを制御する。このため、第 2バッファとして通常のデータレジスタを用いれば、第 1バッファとしては、単位時間当たりのデータの流入量および流出量力、さぐ付随する回路の回路規模が小さい RAMなどを用いることが可能となり、チップの小型化および低コストィヒを実現しつつ、キャッシュメモリに書き込まれるデータを多く取り込むことができる。

[0022] また、本発明によれば、第 1バッファは、キャッシュメモリへの書き込みが同時に要求され得るすべてのデータを記憶可能な容量の RAMを含むため、例えばキャッシュミスに伴って発行されるすべてのムーブイン要求に対する応答のデータをすベて記憶することができ、 CPUが後続する処理を実行してスループットを向上することができる。

[0023] また、本発明によれば、第 2バッファに空き領域がある力否かを監視し、第 1バッファは、第 2バッファに空き領域があること確認された場合に、データを第 2バッファへ出力する。このため、直接キャッシュメモリに書き込まれるデータを保持する第 2バッファが溢れてしまうことがなぐ確実にすべてのデータをキャッシュメモリに書き込むことができる。

[0024] また、本発明によれば、第 2バッファは、キャッシュメモリの近傍に配置され、第 1バッファは、第 2バッファよりもキャッシュメモリから遠方に配置されるため、第 2バッファからキャッシュメモリへのデータの書き込みが迅速に実行されるとともに、第 1バッファのチップ上での位置を柔軟に決定することができる。

[0025] また、本発明によれば、第 1バッファは、複数の外部バス力ものデータの流入を制御し、第 2バッファは、外部バスそれぞれに対応する領域であって同量のデータを保持する領域を備える。このため、チップ外力第 1バッファへ複数の外部バス力データが流入する場合でも、それぞれの外部バス力のデータを均等にキャッシュメモリに書き込むことができる。

[0026] また、本発明によれば、第 2バッファは、外部バスそれぞれにつ!/、て 2回の書き込み分のデータを保持する領域を備えるため、 1回の書き込み分のデータをキャッシュメモリに書き込む間に、次の書き込み分のデータを第 1バッファ力も取り込むことができ、効率的にキャッシュメモリへのデータの書き込みを実行することができる。

[0027] また、本発明によれば、外部力も流入するデータに第 1バッファをバイパスさせ、第 1バッファから出力されるデータまたは第 1バッファをバイパスしたデータのいずれか一方を選択して第 2バッファへ出力する。このため、必要に応じて第 2バッファが直接データを取り込むことが可能となり、第 1バッファへのデータの入出力に要する時間を省くことができる。

[0028] また、本発明によれば、第 2バッファに空き領域がある場合に、第 1バッファをバイパスしたデータを選択するため、第 2バッファに空き領域があり、第 1バッファへのデータの入出力に要する時間が無駄になる場合、チップにデータが流入して力キャッシュメモリに書き込まれるまでの時間を短縮することができる。

[0029] また、本発明によれば、第 1バッファ力も第 2バッファへデータが出力されると、このデータのキャッシュメモリへの書き込みを第 2バッファに実行させるため、キャッシュメモリへの書き込み時には書き込み対象のデータが第 2バッファに取り込まれており、チップに流入したデータを確実にキャッシュメモリに書き込むことができる。

図面の簡単な説明 [0030] [図 1]図 1は、本発明の一実施の形態に係るチップの要部構成を示すブロック図である。

[図 2]図 2は、一実施の形態に係るデータレジスタ部の内部構成を示すブロック図である。

[図 3]図 3は、一実施の形態に係るムーブインデータのパケット構成の一例を示す図である。

[図 4]図 4は、一実施の形態に係るチップへのデータ流入の様子を示す図である。

[図 5-1]図 5— 1は、一実施の形態に係る RAMへのムーブインデータの入出力タイミングの一例を示す図である。

[図 5-2]図 5— 2は、一実施の形態に係る RAMへのムーブインデータの入出力タイミングの他の一例を示す図である。

[図 6]図 6は、一実施の形態に係るチップ上の回路配置の一例を示す図である。符号の説明

[0031] 101 外部バス制御部

102 Mlデータ RAM

103 バイパス経路部

104 セレクタ

105 入出力制御部

106 監視部

107—1、 107- 2 CPUコア

107a— 1、 107a— 2 ΙΛキャッシュ

108 データレジスタ部

108a MIDQ

108b WBDQ

108c MODQ

108d RDQ

109 MIB

110 書込制御部 111 L2キャッシュ

発明を実施するための最良の形態

[0032] 以下、本発明の一実施の形態について、図面を参照して詳細に説明する。なお、以下では、それぞれ 1次キャッシュ（L1キャッシュ）を備えた 2つの CPUコアおよび 2 次キャッシュ（L2キャッシュ）が 1つのチップに搭載されており、 L2キャッシュへのデータのム一ブインが行われる場合について説明する力本発明は、他のキャッシュへのデータの書き込み時にも同様に適用することができる。

[0033] 図 1は、本発明の一実施の形態に係るチップの要部構成を示すブロック図である。

図 1に示すチップは、外部バス制御部 101、ムーブイン (Move-in:以下「MI」と略記する）データ RAM102、バイパス経路部 103、セレクタ 104、入出力制御部 105、監視部 106、 CPUコア 107— 1、 107— 2、 L1キャッシュ 107a— 1、 107a— 2、データレジスタ部 108、ムーブインバッファ（Move- in Buffer:以下「MIB」と略記する） 109、書込制御部 110、および L2キャッシュ 111を有している。なお、図 1においては、チップに対して 4つの Mlデータの流入パスが設けられて!/、るが、 Mlデータの流入パス数は、 1でも 4以外の複数でも良い。

[0034] 外部バス制御部 101は、チップ外の図示しない上位キャッシュ、メインメモリ、または他のチップなどと外部バスを通じて接続されており、チップ内へのデータの流入パスとなる複数（図 1では 4つ）の外部バスを制御し、各外部バス力流入する Mlデータを一時的に内部のレジスタに登録する。そして、外部バス制御部 101は、入出力制御部 105の制御に応じたタイミングで、いずれかの外部バスからの Mlデータを Mlデータ RAM 102およびバイパス経路部 103に入力する。

[0035] Mlデータ RAM102は、外部バス制御部 101から出力される Mlデータを記憶し、データレジスタ部 108に Mlデータを取り込むための空きが生じるとセレクタ 104を経由してデータレジスタ部 108へ Mlデータを出力する。すなわち、 Mlデータ RAM10 2は、データレジスタ部 108の前段に設けられたバッファとして機能する。具体的には、 Mlデータ RAM102は、同時期に発行されるすべてのムーブイン要求に対する応答として Mlデータが転送されてきた場合、すべての Mlデータを記憶可能な容量の S RAM (Static Random Access Memory)などから構成されている。 [0036] この MIデータ RAM102は、データレジスタ部 108のバッファであるため、単位時間当たりのデータの流入量および流出量をキャッシュへの書き込みに合わせて大きくする必要はない。ただし、外部バスからのデータの流入量に対応する程度のスループットを達成する必要はある。

[0037] バイパス経路部 103は、外部バス制御部 101から出力される Mlデータをバイパスし、データレジスタ部 108に Mlデータを取り込むための空き領域がある場合や、 CPU コア 107—1、 107— 2へ直接 Mlデータを出力する場合に、セレクタ 104を経由してデータレジスタ部 108または CPUコア 107— 1、 107— 2へ Mlデータを出力する。

[0038] セレクタ 104は、入出力制御部 105の制御に応じて、 Mlデータ RAM102に記憶されている Mlデータまたはバイパス経路部 103を通過する Mlデータのいずれか一方を選択し、データレジスタ部 108および CPUコア 107— 1、 107— 2へ出力する。

[0039] 入出力制御部 105は、外部バスのサイクルで外部バス制御部 101へ流入する Ml データを CPUサイクルに合わせて MIデータ RAM 102およびバイパス経路部 103に入力させるとともに、 Mlデータ RAM102またはバイパス経路部 103からの Mlデータをセレクタ 104から Mlデータを出力させる。このとき、入出力制御部 105は、監視部 1 06力報告されるデータレジスタ部 108の空き状況に応じて、 Mlデータ RAM102 およびバイパス経路部 103のどちらを選択する力決定し、決定された処理部からの Mlデータを出力するようにセレクタ 104を制御する。

[0040] また、入出力制御部 105は、セレクタ 104から Mlデータを出力させると、出力された Mlデータに関する情報を MIB109へ通知する。なお、入出力制御部 105による Mlデータの入出力のタイミングについては、後に詳述する。

[0041] 監視部 106は、データレジスタ部 108における空き状況を監視し、データレジスタ部 108に Mlデータを取り込む空き容量がある場合に、その旨を入出力制御部 105 へ報告する。なお、詳細は後述するが、監視部 106は、図 2に示すように、データレジスタ部 108内のムーブインデータキュー（以下「MIDQ」と略記する） 108aの空き状況を監視する。このとき、監視部 106は、 MIDQ108aの容量を外部バスの数に等分し、それぞれの外部ノスに対応する容量の空き領域を監視するようにしても良い。こうすることにより、チップに複数の外部バスが接続されている場合、各外部バスから流入するデータを均等に MIDQ108aへ取り込ませることができる。

[0042] CPUコア 107— 1、 107— 2は、それぞれ内部に L1キャッシュ 107a— 1、 107a— 2 を備えており、 L1キャッシュ 107a— 1、 107a— 2に記憶されたデータ、 L2キャッシュ 111から読み出されたデータ、およびチップ外からの Mlデータなどを用いて所定の処理を実行する。

[0043] データレジスタ部 108は、 L2キャッシュ 111へ書き込まれるデータおよび L2キヤッシュ 111から読み出されるデータを一度取り込み、 Mlデータを含む書き込みデータを L2キャッシュ 111へ書き込み、読み出しデータを例えば CPUコア 107— 1、 107— 2の L1キャッシュ 107a— 1、 107a— 2などへ出力する。具体的には、データレジスタ部 108は、例えば図 2に示すように、 MIDQ108a、ライトバックデータキュー（以下「 WBDQJと略記する） 108b,ムーブアウトデータキュー（以下「MODQ」と略記する） 108c,およびリードデータキュー（以下「RDQ」と略記する） 108dを有している。

[0044] MIDQ108aは、セレクタ 104から出力される Mlデータを取り込み、取り込まれた M Iデータを L2キャッシュ 111に書き込む。 MIDQ108aは、 1つの外部バスについて 2 単位のデータを取り込み可能な容量を有している。すなわち、本実施の形態においては、 4つの外部バスがチップに接続されているため、合計で 8単位のデータを取り込み可能な容量を有している。この構成により、データが MIDQ108aに取り込まれて、る最中に、既に MIDQ108aに取り込まれて!/、るデータを L2キャッシュ 111に書き込むと、う動作がすべての外部バスからのデータにつ!、て可能となる。

[0045] WBDQ108bは、 L1キャッシュ 107a— 1、 107a— 2から書き戻されるライトバックデータを取り込み、取り込まれたライトバックデータを L2キャッシュ 111に書き込む。 M ODQ108cは、 L2キャッシュ 111からのムーブアウトがチップの外部から要求されたムーブアウトデータ（図 2では「MOデータ」）を L2キャッシュ 111から読み出し、ムーブアウト要求元のチップ外部へ出力する。 RDQ108dは、 CPUコア 107—1、 107— 2によって読み出しが要求されたリードデータを L2キャッシュ 111から読み出し、 CP Uコア 107— 1、 107— 2へ出力する。

[0046] 図 1に戻って、 MIB109は、 L2キャッシュ 111へのムーブインを要求するリクエストを記憶するバッファであり、入出力制御部 105から Mlデータに関する情報が通知されると、この MIデータに対応するリクエストを消去するとともに、その旨を書込制御部 110へ通知する。

[0047] 書込制御部 110は、 MIB109から消去されたリクエストに対応する Mlデータを L2 キャッシュ 111に書き込むようにデータレジスタ部 108を制御する。具体的には、書込制御部 110は、 MIB109からリクエストを消去した旨が通知されると、 MIDQ108aに取り込まれている Mlデータであって消去されたリクエストに対応する Mlデータを L2 キャッシュ 111へ書き込むようにデータレジスタ部 108に指示する。

[0048] L2キャッシュ 111は、 CPUコア 107—1、 107— 2によって必要とされるデータを記憶しており、 CPUコア 107—1、 107— 2が必要とするデータが記憶されていない場合 (キャッシュミスが発生した場合）には、チップ外の上位キャッシュ、メインメモリ、または他のチップなどから所望のデータがムーブインされる。

[0049] これらの処理ブロックのうち、外部バス制御部 101、 Mlデータ RAM102、バイパス経路部 103、セレクタ 104、入出力制御部 105、監視部 106、データレジスタ部 108 、 MIB109、および書込制御部 110は、 L2キャッシュ 111への Mlデータの書き込みを制御しており、本実施の形態に係るキャッシュ制御装置を構成して、る。

[0050] 次いで、上記のように構成されたチップの L2キャッシュ 111へのデータムーブイン時における動作にっ、て説明する。

[0051] CPUコア 107— 1、 107— 2によって L2キャッシュ 111からのデータの読み出しが要求された際、 L2キャッシュ 111に所望のデータが記憶されておらずキャッシュミスが発生すると、チップ外の上位キャッシュ、メインメモリ、または他のチップなどへデータのム一ブインが要求される。このムーブイン要求時に発行されるリクエストは、 MIB 109に記憶される。

[0052] その後、このムーブイン要求に対する応答として、チップの外部バス制御部 101に Mlデータが流入する。図 1は 4つの Mlデータがそれぞれ異なる外部バス力外部バス制御部 101に流入する様子を示している力各外部バス力 Mlデータが流入するタイミングは重なっていても異なっていても良い。ここでは、いずれか 1つの外部バス力も Mlデータが流入する場合について説明を続ける。

[0053] 外部バス制御部 101に流入する Mlデータは、例えば図 3に示すようなパケットで構成されている。すなわち、外部バスの 1サイクル目で 4バイトのヘッダが外部バス制御部 101へ流入し、外部バスの 2サイクル目力 9サイクル目で Mlデータの本体である応答データ (WORD0〜7)が外部ノス制御部 101へ流入することになる。図 3に示すように、 Mlデータのパケットのヘッダには、このパケットがコマンドなどのパケットではなくデータパケットであることを示すオペコード（OPCODE)や、パケットの誤り検出に用いられるパリティビット (PA)などが含まれて、る。

[0054] また、外部バスの各サイクルで流入するデータ量は 4バイト（ = 32ビット）であるが、それぞれのサイクルの先頭には、当該サイクルがヘッダであるかデータであるかを示すタグが付加されている。具体的には、例えば図 3において、タグが「001」のサイクルはヘッダであり、タグが「100」のサイクルはデータであり、さらにタグが「101」であるサイクルはデータの末尾である。

[0055] このようなパケットとして外部バス力外部バス制御部 101へ流入した Mlデータは、外部バス制御部 101内のレジスタに一度登録された後、入出力制御部 105の制御によって外部バス制御部 101から Mlデータ RAM102およびバイパス経路部 103に入力される。このとき、入出力制御部 105は、外部バスのサイクルと CPUサイクルとの違いや外部バスの転送容量とチップ内の内部バスの転送容量との違いなどを考慮して、外部バス力流入する Mlデータが外部バス制御部 101内のレジスタのデータ許容量を超えない速度で外部バス制御部 101から Mlデータを出力させ、 Mlデータを Mlデータ RAM102およびバイパス経路部 103に入力する。なお、本実施の形態においては、 Mlデータを Mlデータ RAM102およびバイパス経路部 103の双方に入力するため、バイパス経路部 103を通過したデータを Mlデータ RAM102から再送することができるが、データの再送が不要であれば、以下のセレクタ 104による選択に応じて、 Mlデータを Mlデータ RAM102およびバイパス経路部 103のいずれか一方のみに入力するようにしても良、。

[0056] 一方、監視部 106によって、データレジスタ部 108の MIDQ 108aの空き状況が常に監視されており、 MIDQ108aに Mlデータを取り込み可能な空き領域があれば、その旨が入出力制御部 105へ報告されている。そこで、入出力制御部 105によって、 MIDQ108aに空き領域があれば、セレクタ 104に Mlデータ RAM102またはバイパス経路部 103から MIDQ108aへ MIデータを出力させる。

[0057] このとき、入出力制御部 105は、 Mlデータが外部バス制御部 101から出力される時点で MIDQ108aに空き領域があり、かつ、 Mlデータ RAM102に Mlデータが記憶されていなければ、セレクタ 104にバイパス経路部 103からの Mlデータを出力させるようにする。また、入出力制御部 105は、 Mlデータ RAM102に既に Mlデータが記憶されていれば、セレクタ 104に Mlデータ RAM102からの Mlデータを出力させるよう〖こする。

[0058] このようにセレクタ 104から出力される Mlデータが選択されることにより、外部バス力もチップに流入した順序で Mlデータが MIDQ108aへ出力されるとともに、 Mlデータ RAM102に Mlデータが記憶されていない場合は、バイパス経路部 103から直接 Mlデータが MIDQ 108aへ出力され、 Mlデータが Mlデータ RAM 102に書き込まれる時間を削減することができる。

[0059] また、入出力制御部 105は、例えばプリフェッチ時など CPUコア 107— 1、 107- 2 が直接 Mlデータを要求している場合は、セレクタ 104を制御してバイパス経路部 10 3からの Mlデータを直接 CPUコア 107—1、 107— 2へ出力させるようにしても良い。

[0060] そして、入出力制御部 105によってセレクタ 104が制御され、 Mlデータが MIDQ1 08aへ出力されると、この Mlデータに関する情報が MIB109へ通知される。そして、 MIB109によって、入出力制御部 105から通知された Mlデータに対応するムーブイン要求のリクエストが消去され、その旨が書込制御部 110へ通知される。ムーブイン要求のリクエストが MIB109から消去されると、対応する Mlデータのムーブインを完了するため、書込制御部 110によって、データレジスタ部 108内の MIDQ108aに対して、 MIB109力消去されたリクエストに対応する Mlデータの L2キャッシュ 111への書き込みが指示される。この指示を受け、 MIDQ108aによって、 Mlデータ力キャッシュ 111へ書き込まれ、ムーブインが完了する。

[0061] 以降、ムーブインが完了すると、 MIDQ108aには空き領域ができるため、監視部 1 06によって空き領域があることが入出力制御部 105へ報告され、再びセレクタ 104から、 Mlデータ RAM102またはバイパス経路部 103からの Mlデータが出力されることになる。 [0062] 次に、入出力制御部 105によって、 Mlデータ RAM102に Mlデータが入出力されるタイミングについて、具体例を挙げながら説明する。以下では、 CPUサイクルは外部バスのサイクルの 3倍の速度であり、内部バスの転送容量は外部バスの転送容量の 2倍であるとする。また、 Mlデータとしては、図 3に示したパケットが外部バス制御部 101へ流入しているものとする。

[0063] 図 4に示すように、 Mlデータは、外部バスの 1サイクル（CPUの 3サイクル）ごとにへッダ、データ WO、データ Wl、 · ··、データ W7の順にチップに受信される。すなわち、 CPUの 3サイクルにっき 4バイトずつのデータが受信され、受信データは、外部バス制御部 101に流入し、外部バス制御部 101内のレジスタ # 1に保持される。その後、内部バスの転送容量に合わせて、 4バイトずつ受信されたデータ W0〜W7が 8バイトずつにまとめられてレジスタ # 2に保持される。このとき、レジスタ # 2が 8バイトを単位としてデータを保持するため、それぞれの 4バイトのデータ W0〜W7がレジスタ # 2に保持される時間は、 8バイト分のデータの受信に要する CPUの 6サイクルとなる。

[0064] 以上は 1つの外部ノスからのデータの流入を示している力本実施の形態においては、外部バス # 1〜# 4の 4つの流入パスから外部バス制御部 101に Mlデータが流入する。これらのいずれの外部バス # 1〜# 4からも上述したのと同様に Mlデータが流入しているため、 CPUの 6サイクルの間に 4つの外部バスすベてからデータを M Iデータ RAM102およびバイパス経路部 103に入力する必要がある。ここでは、それぞれ外部バス # 1〜# 4に CPUの 1サイクルずつ割り当てて、割り当てられたサイクルで各外部バスからのデータを Mlデータ RAM102およびバイパス経路部 103に入力するようにすれば良い。こうすることにより、 4つの外部バス # 1〜# 4のデータは、 CPUの 4サイクルで Mlデータ RAM102およびバイパス経路部 103に入力されることになり、外部バス制御部 101内のレジスタが溢れることがない。

[0065] このように外部バスの数、チップのクロックレート、および外部バスと内部バスの転送容量の差などにより、 1サイクルで Mlデータ RAM102に入力されるデータ量が異なるため、 Mlデータ RAM102は、 1サイクルで入力されるデータ量を受け付け可能である必要がある。ただし、このデータ量は、データレジスタ部 108内の MIDQ 108aが 1サイクルで受け付けるデータ量よりも大幅に少ない。したがって、データレジスタの代用として RAMが用いられる場合と比して、 Mlデータ RAM102に付随する制御回路ゃデータバスの面積は無視できるほど小さい。

[0066] ところで、 Mlデータ RAM102は、通常 1サイクル中にデータの読み書きの一方しか実行することができない。そのため、 6サイクル中 4サイクルが各外部バス # 1〜# 4 からのデータの入力に費やされると、残りの 2サイクル中 1サイクルは、データの出力に用いられる。そして、さらに残りの 1サイクルは、データの入力と出力の間の何もしないインターバルのサイクルとしておき、データの入出力間での干渉を防止するのが望ましい。

[0067] このように、外部バス # 1〜 # 4の 4つの外部ノスがチップに接続されて、る場合は、内部バスの転送容量や CPUのクロックレートによるチップ内部でのスループットが外部バスの少なくとも 6倍であれば、図 5— 1に示すように、 6サイクル中にすべての外部バス # 1〜# 4からのデータが Mlデータ RAM102に入力されるとともに、このデータが Mlデータ RAM102から出力される。このとき、外部バス # 1〜# 4すべてから同じタイミングでデータが流入するとは限らないが、例えば外部バス # 1と外部バス # 4 力はデータが遅れて流入したとしても、図 5— 2に示すように、必ずすベての外部バス # 1〜# 4のデータを Mlデータ RAM102に入力するタイミングと Mlデータ RAMI 02から出力するタイミングとが 6サイクル中にある。

[0068] そして、 4つの外部バス # 1〜 # 4のデータが Mlデータ RAM102から溢れることがないように入出力されるため、チップにデータレジスタ部 108のみが備えられた場合よりも L2キャッシュ 111に書き込まれるデータを多く取り込むことができる。また、この Mlデータ RAM102は、直接 L2キャッシュ 111に接続されるのではなぐデータレジスタ部 108の MIDQ 108aと接続され、バッファが二段構成となっている。このため、 Mlデータ RAM102自体の単位時間当たりのデータの流入量および流出量は、 Ml DQ108aよりも大幅に小さくて良ぐ Mlデータ RAM102に付随する制御回路ゃデータバスの小型化および低コストィ匕を図ることができる。

[0069] さらに、バッファを二段構成として、 MIDQ 108aに RAMを接続したことにより、 RA Mと MIDQ108aとの空間的距離に制限がなぐチップ上で Mlデータ RAM102を配置する位置を自由に決定することができる。このため、チップ上での回路配置を柔軟に決定することができるとともに、データレジスタ部 108の大きさは変わらないため、例えば図 6に示すように、チップ上で何の機能も果たさな、死に地（図中斜線部）を最小限に抑制することができる。ただし、図 6においては、 MIDRは Mlデータ RAMI 02の位置を示しており、制御ブロックは入出力制御部 105、監視部 106、 MIB109、および書込制御部 110などの処理ブロックの位置を示して!/、る。

[0070] 以上のように、本実施の形態によれば、チップ内のデータレジスタの前段に Mlデータを記憶する RAMを設け、チップ内に流入する Mlデータを記憶させるため、キヤッシュメモリに書き込まれる Mlデータをチップに多く取り込むことができるとともに、 RA M自体がキャッシュメモリへの書き込みを行うわけではな!/、ので、 RAMを設けたことによる回路規模の増大およびコストの増大は最小限ですむ。

[0071] なお、上記実施の形態においては、 Mlデータ RAM102から MIDQ108aへ出力された順序でデータ力キャッシュ 111に書き込まれることとなる力例えば L2キヤッシュ 111に書き込まれたデータのリプレース処理などが発生することにより、 MIDQ 108aから L2キャッシュ 111への書き込みを待機する必要が生じることがある。このような状況は、 MIB109において入出力制御部 105からの通知と記憶されているリクェストと力も把握することが可能であるため、 MIDQ108aに取り込まれたデータの書き込みの待機が生じた場合、一度 MIDQ108aに取り込まれたデータを廃棄し、後続のデータを Mlデータ RAM102から取り込んで書き込みを行うようにしても良い。そして、廃棄されたデータは、改めて MIDQ108aに取り込まれて書き込みが行われるようにすれば良い。

産業上の利用可能性

[0072] 本発明は、チップの小型化および低コストィ匕を実現しつつ、キャッシュメモリに書き込まれるデータを多く取り込む場合に適用することができる。

Claims

請求の範囲

[1] キャッシュメモリにデータを書き込むキャッシュ制御装置であって、

前記キャッシュメモリへの書き込み用に外部力流入するデータを保持する第 1バッファ手段と、

前記第 1バッファ手段に保持されるデータのうち、現時点で前記キャッシュメモリへの書き込み対象となるデータを保持する第 2バッファ手段と、

前記第 2バッファ手段に保持されるデータの前記キャッシュメモリへの書き込みを制御する書込制御手段と

を有することを特徴とするキャッシュ制御装置。

[2] 前記第 1バッファ手段は、

前記キャッシュメモリへの書き込みが同時に要求され得るすべてのデータを記憶可能な容量の RAM (Random Access Memory)を含むことを特徴とする請求項 1記載のキャッシュ制御装置。

[3] 前記第 2バッファ手段に空き領域があるか否力を監視する監視手段をさらに有し、前記第 1バッファ手段は、

前記監視手段によって前記第 2バッファ手段に空き領域があること確認された場合に、データを前記第 2バッファ手段へ出力することを特徴とする請求項 1記載のキヤッシュ制御装置。

[4] 前記第 2バッファ手段は、

前記キャッシュメモリの近傍に配置され、

前記第 1バッファ手段は、

前記第 2バッファ手段よりも前記キャッシュメモリから遠方に配置される

ことを特徴とする請求項 1記載のキャッシュ制御装置。

[5] 前記第 1バッファ手段は、

複数の外部バス力のデータの流入を制御する外部バス制御手段を含み、前記第 2バッファ手段は、

外部ノスそれぞれに対応する領域であって同量のデータを保持する領域を備えることを特徴とする請求項 1記載のキャッシュ制御装置。

[6] 前記第 2バッファ手段は、

外部ノスそれぞれについて 2回の書き込み分のデータを保持する領域を備えることを特徴とする請求項 5記載のキャッシュ制御装置。

[7] 外部力も流入するデータに前記第 1バッファ手段をバイパスさせるバイパス手段と、前記第 1バッファ手段から出力されるデータまたは前記バイパス手段から出力されるデータのいずれか一方を選択して前記第 2バッファ手段へ出力する選択手段とをさらに有することを特徴とする請求項 1記載のキャッシュ制御装置。

[8] 前記選択手段は、

前記第 2バッファ手段に空き領域がある場合に、前記バイパス手段から出力されるデータを選択することを特徴とする請求項 7記載のキャッシュ制御装置。

[9] 前記書込制御手段は、

前記第 1バッファ手段から前記第 2バッファ手段へデータが出力されると、このデータの前記キャッシュメモリへの書き込みを前記第 2バッファ手段に実行させることを特徴とする請求項 1記載のキャッシュ制御装置。

[10] キャッシュメモリにデータを書き込むキャッシュ制御方法であって、

前記キャッシュメモリへの書き込み用に外部力流入するデータを第 1バッファに保持する第 1保持工程と、

前記第 1保持工程にて保持されるデータのうち、現時点で前記キャッシュメモリへの書き込み対象となるデータを第 2バッファに保持する第 2保持工程と、

前記第 2保持工程にて保持されるデータの前記キャッシュメモリへの書き込みを制御する書込制御工程と

を有することを特徴とするキャッシュ制御方法。