JP2003022211A

JP2003022211A - キャッシュ制御方法及びキャッシュ装置

Info

Publication number: JP2003022211A
Application number: JP2001209153A
Authority: JP
Inventors: Morio Sasaki; 盛朗佐々木; Atsuhiro Tanaka; 淳裕田中; Kousuke Tachikawa; 江介立川
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2001-07-10
Filing date: 2001-07-10
Publication date: 2003-01-24
Anticipated expiration: 2021-07-10
Also published as: US6834329B2; JP4042359B2; US20030014603A1

Abstract

(57)【要約】【課題】アクセスパターンが異なる複数のデータ系列
を同時に効率良くキャッシュできるようにする。【解決手段】キャッシュ記憶部にキャッシュされてい
る複数のデータを、アクセスパターンが異なるデータ系
列毎のグループにグループ分けする（ステップＢ１）。
各グループは、独自のキャッシングアルゴリズムで、自
グループに属するデータに優先度を割り当てる。キャッ
シュ記憶部に十分な空き領域がなく、データをパージす
ることが必要になった場合、最低優先度決定手段により
最も優先度の低いグループを求め（ステップＢ４）、デ
ータ操作手段が、そのグループ内で最低優先度を割り当
てられているデータをパージする（ステップＢ５）。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、キャッシュ制御技
術に関し、特に、キャッシュヒット率が向上するように
パージするデータを選択する技術に関する。

【０００２】

【従来の技術】記憶装置の階層化が進むにつれて、キャ
ッシュ技術は、ますます多くの場所で使われるようにな
っている。また、近年の情報通信機器の高速化によっ
て、全処理時間に対する、ミスヒット時の処理時間が占
める割合が大きくなってきており、キャッシュ技術は、
性能に大きな影響を及ぼすようになってきている。

【０００３】その顕著な例は、インターネット等のネッ
トワークを介して転送されるコンテンツをキャッシュす
るプロキシキャッシュ装置である。プロキシキャッシュ
装置等のネットワーク中に設置されたキャッシュ装置に
おけるキャッシュヒットは、データ転送経路を短縮する
ことでデータ転送速度を向上させるので、データ転送の
レスポンスタイムを短縮する。

【０００４】図１は、プロキシキャッシュ装置４が、イ
ンターネット等のネットワーク３を介して、一台以上の
サーバ１−１〜１−ｍ及び一台以上のクライアント２−
１〜２−ｎの通信を仲介するネットワークシステムの一
例を示すブロック図である。プロキシキャッシュ装置４
は、サーバ１−ｉ（１≦ｉ≦ｍ）に代わってクライアン
ト２−ｊ（１≦ｊ≦ｎ）のリクエストを受け付け、クラ
イアント２−ｊに代わってサーバ１−ｉにリクエストを
発行する。そして、サーバ１−ｉからデータを受けとる
と、これをクライアント２−ｊに転送する。プロキシキ
ャッシュ装置４は、サーバ１−ｉからデータを受けとっ
た際、このデータをキャッシュする。そして、次に同じ
データへのリクエストがクライアント２−ｋ（１≦ｋ≦
ｎ）によってなされた時には、プロキシキャッシュ装置
４に記憶されたデータが、プロキシキャッシュ装置４か
らクライアント２−ｋに転送される。

【０００５】プロキシキャッシュ装置４等のキャッシュ
装置で適用されるキャッシュ方式として、ＬＲＵ等を初
めとする多くのキャッシュ方式が従来から提案されてい
る。詳しくは、Ｈｅｗｌｅｔｔ−ｐａｃｋａｒｄ社のテ
クニカルレポート、ＬｕｄｍｉｌａＣｈｅｒｋａｓｏ
ｖａ：「ＩｍｐｒｏｖｉｎｇＷＷＷＰｒｏｘｉｅｓ
ＰｅｒｆｏｒｍａｎｃｅｗｉｔｈＧｒｅｅｄｙ−
Ｄｕａｌ−Ｓｉｚｅ−ＦｒｅｑｕｅｎｃｙＣａｃｈｉ
ｎｇＰｏｌｉｃｙ」，ＨＰＬ−９８−６９Ｒ１，９８
１１２０．（ｈｔｔｐ：／／ｗｗｗ．ｈｐｌ．ｈｐ．ｃ
ｏｍ／ｔｅｃｈｒｅｐｏｒｔｓ／９８／ＨＰＬ−９８−
６９Ｒ１．ｈｔｍｌから入手可能である）（以下、文献
１と称する）で述べられている。

【０００６】理論的に最適なキャッシュ方法は、最も遠
い将来にアクセスされるデータに最低の優先度を割り当
てる方法であるが、これは将来のデータアクセスが全て
分かっていないと実現不可能である。ＬＲＵ等のキャッ
シングアルゴリズムは最適キャッシュ方法の近似にすぎ
ない。

【０００７】ＬＲＵ以外にも、様々なキャッシュ方法が
提案されている。例えば、Ｅ．Ｏ‘Ｎｅｉｌ，Ｐ．Ｏ’
Ｎｅｉｌ，Ｇ．Ｗｅｉｋｕｍ：「ＴｈｅＬＲＵ−Ｋｐ
ａｇｅｒｅｐｌａｃｅｍｅｎｔａｌｇｏｒｉｔｈｍ
ｆｏｒｄａｔａｂａｓｅｄｉｓｋｂｕｆｆｅｒｉｎ
ｇ」，Ｐｒｏｃ．ＡＣＭＳＩＧＭＯＤＩｎｔｅｒｎａ
ｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＭａｎａｇ
ｅｍｅｎｔｏｆＤａｔａ，ｐｐ．２９７−３０６，１
９９３．（以下、文献２と称する）がある。

【０００８】文献２に記載されているＬＲＵ−Ｋという
キャッシュ方式は、データ毎に、Ｋ個前までのアクセス
が行なわれた時刻を記録する。ただし、Ｋは自然数であ
り、ＬＲＵ−Ｋでは、Ｋ個前のアクセス時刻が最も早い
データからパージする。例えば、Ｋ＝２としたＬＲＵ−
２では、データは二回以上アクセスされたか否かで異な
る優先度が割り当てられ、二回以上アクセスされたデー
タの中で最低の優先度を持つデータは、二回目にアクセ
スされた時刻が最も早いものである。過去一回しかアク
セスされたことのないデータは、二回以上アクセスされ
たデータよりも低い優先度が割り当てられる。ＬＲＵが
用いる情報は前回のアクセス時刻のみであるが、ＬＲＵ
−Ｋは過去Ｋ回のアクセス時刻を情報として持ち、より
多くの情報に基づいてキャッシュ方法を決定している。

【０００９】Ｄ．Ｌｅｅ，Ｊ．Ｃｈｏｉ，Ｊ．Ｈ．Ｋ
ｉｍ，Ｓ．Ｈ．Ｎｏｈ，Ｓ．Ｌ．Ｍｉｎ，Ｙ．Ｃｈ
ｏ，ａｎｄＣ．Ｓ．Ｋｉｍ：「ＯｎｔｈｅＥｘｉｓ
ｔｅｎｃｅｏｆａＳｐｅｃｔｒｕｍｏｆＰｏｌｉ
ｃｉｅｓｔｈａｔＳｕｂｓｕｍｅｓｔｈｅＬｅａｓ
ｔＲｅｃｅｎｔｌｙＵｓｅｄ（ＬＲＵ）ａｎｄＬｅ
ａｓｔＦｒｅｑｕｅｎｔｌｙＵｓｅｄ（ＬＦＵ）Ｐ
ｏｌｉｃｉｅｓ」，ＩｎＰｒｏｃｅｅｄｉｎｇｓｏｆ
ｔｈｅ１９９９ＡＣＭＳＩＧＭＥＴＲＩＣＳＣｏ
ｎｆｅｒｅｎｃｅｏｎＭｅａｓｕｒｅｍｅｎｔａｎ
ｄＭｏｄｅｌｉｎｇｏｆＣｏｍｐｕｔｅｒＳｙｓｔ
ｅｍｓ，ｐｐ．１３４−１４３，１９９９．（以下、文
献３と称する）に示されているキャッシュ方式ＬＲＦＵ
では、データの優先度を、ＣＲＦ（Ｃｏｍｂｉｎｅｄ
ＲｅｃｅｎｃｙａｎｄＦｒｅｑｕｅｎｃｙ）値で与え
る。時刻ｔにおけるＣＲＦ値Ｃ（ｔ）は、重みづけ関数
Ｆ（ｘ）によって計算される。例えば、現在時刻が８
で、時刻１、２、５、８にアクセスがあったとする。こ
の時、Ｃ（ｔ）＝Ｆ（８−１）＋Ｆ（８−２）＋Ｆ（８
−５）＋Ｆ（８−８）＝Ｆ（７）＋Ｆ（６）＋Ｆ（３）
＋Ｆ（０）となる。データに対するアクセス回数が多い
場合、この優先度の計算は重い処理になってしまい、保
持すべき情報も多くなるが、Ｆ（ｘ＋ｙ）＝Ｆ（ｘ）Ｆ
（ｙ）となるようなＦであれば、Ｃ（ｔ）＝Ｆ（８−
１）＋Ｆ（８−２）＋Ｆ（８−５）＋Ｆ（８−８）＝Ｆ
（３＋５−１）＋Ｆ（３＋５−２）＋Ｆ（３＋５−５）
＋Ｆ（３＋５−８）＝Ｆ（０）＋Ｆ（３）Ｃ（５）とな
るので、前回のアクセス時刻のＣＲＦ値を元に、容易に
計算できる。文献３では、ＬＲＦＵがＬＲＵ−２よりも
高いヒット率を達成できることが示されている。

【００１０】Ｙ．Ｓｍａｒａｇｄａｋｉｓ，Ｓ．Ｋａｐ
ｌａｎ，ａｎｄＰ．Ｗｉｌｓｏｎ：「ＥＥＬＲＵ：Ｓ
ｉｍｐｌｅａｎｄＥｆｆｅｃｔｉｖｅＡｄａｐｔｉ
ｖｅＰａｇｅＲｅｐｌａｃｅｍｅｎｔ」，ＩｎＰｒ
ｏｃｅｅｄｉｎｇｓｏｆｔｈｅ１９９９ＡＣＭ
ＳＩＧＭＥＴＲＩＣＳＣｏｎｆｅｒｅｎｃｅｏｎ
ＭｅａｓｕｒｅｍｅｎｔａｎｄＭｏｄｅｌｉｎｇ
ｏｆＣｏｍｐｕｔｅｒＳｙｓｔｅｍｓ，ｐｐ．１２
２−１３３，１９９９．（以下、文献４と記載）では、
ＥａｒｌｙＥｖｉｃｔｉｏｎＬＲＵ（ＥＥＬＲＵ）
というキャッシュ方式が提案されている。このキャッシ
ングアルゴリズムが使用する情報は、前回のアクセス時
刻である。ＥＥＬＲＵは、多くの最近アクセスされたデ
ータがキャッシュから削除されるまでは、ＬＲＵと同様
に、キャッシュ中のデータで最も遠い過去にアクセスさ
れたデータからパージする。逆に、多くの最近アクセス
されたデータがキャッシュから削除された場合、キャッ
シュ中のデータの中でｅ番目に近い過去にアクセスされ
たデータからパージする。ただし、ｅはヒット率を上げ
るように動的に調整される。

【００１１】ＬＲＵ−Ｋ、ＬＲＦＵ、ＥＥＬＲＵは、い
ずれもＬＲＵ等の一般的なキャッシュ方式に比べて、高
いヒット率を達成できるが、プロキシ装置でのキャッシ
ングには不向きである。なぜなら、プロキシキャッシュ
装置で用いられるキャッシュ方式では、多くの場合、デ
ータのキャッシュ、パージは、クライアントからのリク
エストによって要求されたデータを単位として行なう。
そのため、クライアントが大きなデータをリクエスト
し、このデータがキャッシュされる場合、他の多くのデ
ータがこの大きなデータを記憶するための空き領域を作
るために消去されてしまう。つまり、データの有用性は
データのアクセスパターン以外に、データサイズにも依
存する。データサイズを考慮したキャッシュ方式の一つ
は、文献１に示されるＧＤＳＦ（Ｇｒｅｅｄｙ−Ｄｕａ
ｌ−Ｓｉｚｅ−ＦｒｅｑｕｅｎｃｙＣａｃｈｉｎｇＰ
ｏｌｉｃｙ）である。ＧＤＳＦは、大きなデータに低い
優先度を割り当てることでオブジェクトのヒット率を向
上させる。このため、連続メディアデータのように大き
なデータを扱う場合、連続メディアデータには低い優先
度が割り当てられてしまうので、ＧＤＳＦは連続メディ
アデータを扱うには不向きである。

【００１２】キャッシュ記憶部は、速度、容量の異なる
複数の記憶媒体から構成されることが多い。一般的なキ
ャッシュ記憶部は、高速小容量の主記憶装置と低速大容
量の二次記憶装置からなる。このようなキャッシュ記憶
部を有するプロキシキャッシュ装置で、連続メディアデ
ータ等の巨大なデータを扱う場合、データサイズが主記
憶装置の記憶容量に対して大きいため、ほとんどの場
合、二次記憶装置に格納されてしまう。これは、連続メ
ディアデータにアクセスが集中した場合、低速な二次記
憶装置からのデータ読みだし速度がボトルネックになっ
てしまうことを意味する。さらに、巨大な連続メディア
データが低速記憶部からのデータ転送を独占してしまう
ため、多くのデータが記憶されている低速記憶部からの
他のデータの転送ができないという問題がある。これ
は、二次記憶装置中のデータの主記憶装置へのキャッシ
ングだけでなく、遠隔地のホストのデータがローカルな
二次記憶装置へキャッシングされるケースでも、同様の
問題が生じる。

【００１３】連続メディアデータのキャッシュ方法の一
つは、ＡｓｉｔＤａｎ，ＤｉｎｋａｒＳｉｔａｒａ
ｍ：「ＡＧｅｎｅｒａｌｉｚｅｄＩｎｔｅｒｖａｌ
ＣａｃｈｉｎｇＰｏｌｉｃｙｆｏｒＭｉｘｅｄ
ＩｎｔｅｒａｃｔｉｖｅａｎｄＬｏｎｇＶｉｄｅ
ｏＷｏｒｋｌｏａｄｓ」，ＭｕｌｔｉｍｅｄｉａＣｏ
ｍｐｕｔｉｎｇａｎｄＮｅｔｗｏｒｋｉｎｇ，ｐ
ｐ．３４４−３５１，１９９６．（以下、文献５と称す
る）に記載されている。

【００１４】文献５の方法は、連続メディアデータへの
アクセスはシーケンシャルであることを利用している。
つまり、連続メディアデータは巨大であるが、一度に全
てのデータが要求されるのではなく、ある速度でデータ
の先頭から順次要求される。そこで、ある連続メディア
データを分割して考えると、分割された先頭のデータが
要求されれば、時間が経つにつれ後続の分割データも要
求される。従って、先頭のデータが到着した時点で、後
続のデータのアクセス時刻を予想することができる。予
想アクセス時刻が近いものに高い優先度を与えるのが、
文献５に記載されたキャッシュ方式である。

【００１５】連続メディアデータと非連続メディアデー
タのように、全く異なるアクセスパターンを持つデータ
を効率よくキャッシュするのは、一般に困難である。例
えば、連続メディアデータと非連続メディアにそれぞれ
別々のプロキシキャッシュ装置を用意して、レイヤ７ス
イッチ等でデータが連続メディアかどうか判定するとし
ても、連続、非連続メディアデータ用のそれぞれのプロ
キシキャッシュ装置の間で相互に計算資源を融通するこ
とができないからである。例えば、連続メディアデータ
にアクセスが集中した場合、非連続メディアデータ用の
プロキシキャッシュ装置の計算資源には余裕があるの
に、連続メディアデータ用のプロキシキャッシュ装置は
過負荷になってしまう。また、複数のプロキシキャッシ
ュ装置とレイヤ７スイッチを用いるのは、コスト的に高
価である。従って、一台のプロキシキャッシュ装置で、
連続、非連続メディアデータをともにキャッシュできる
のが望ましい。

【００１６】プロキシキャッシュ装置で用いられるキャ
ッシュ方式は、装置に一つである必要はない。複数のキ
ャッシュ方式を使用する方法は特開平１１−６５９２７
号公報に示されており、文献５に示されるキャッシュ方
式と、従来のＬＲＵ、ＬＦＵ等のキャッシュ方式を同時
に使う方法が考えられる。特開平１１−６５９２７公報
では、複数のキャッシュ方式を用いてデータに優先度を
割り当てることができるが、各キャッシュ方式が使用で
きる記憶領域は固定されている。従って、全体として、
あるデータを記憶するのに十分な空き記憶領域があって
も、データに適用されるキャッシュ方式が使用できる記
憶領域に十分な空き領域がない場合、データをキャッシ
ュすることはできない。従って、特開平１１−６５９２
７号公報に示される方法を適用した場合、計算資源の分
割の自由度、コストにおいて、レイヤ７スイッチと複数
のプロキシキャッシュ装置を使った場合よりも優れてい
るが、依然として計算資源は共有されておらず、動的に
変化するリクエストに対応するのは困難である。

【００１７】

【発明が解決しようとする課題】上述した文献１〜文献
５に記載されている従来の技術では、単一の優先度を用
いてデータを管理しているため、アクセスパターンが異
なる複数のデータ系列、例えば、連続メディアデータと
非連続メディアデータ、を効率良くキャッシュすること
が困難であるという問題点がある。この問題点は、特開
平１１−６５９２７号公報に記載されている技術を利用
することによりある程度は解決することができる。つま
り、連続メディアデータには予想アクセス時刻に基づく
優先度を割り当て、非連続メディアデータにはアクセス
頻度（ＬＦＵ）に基づく優先度を割り当てることによ
り、各データ系列のデータをそれぞれ効率的にキャッシ
ュすることが可能になる。

【００１８】しかしながら、特開平１１−６５９２７号
公報に記載されている技術は、各データ系列に、それぞ
れ固定的な別々の記憶領域を割り当てるようにしている
ため、あるデータ系列に対してアクセスが集中すると、
他のデータ系列に割り当てられている記憶領域に空きが
ある場合であっても、上記或るデータ系列に割り当てら
れている記憶領域の空き不足によりミスヒットが頻繁に
発生し、データのパージが頻繁に行われてしまうという
問題がある。

【００１９】そこで、本発明の目的は、特定のデータ系
列にアクセスが集中した場合にも、記憶領域を有効利用
することにより、高いキャッシュヒット率を得られるよ
うにすることにある。

【００２０】

【課題を解決するための手段】本発明は上記目的を達成
するため、次のようにしている。キャッシュ記憶部にキ
ャッシュするデータを、アクセスパターンが異なるデー
タ系列毎のグループにグループ分けし、各グループ毎
に、独自のキャッシングアルゴリズムで自グループに属
するデータに優先度を割り当てる。そして、データをキ
ャッシュ記憶部からパージすることが必要になった場合
は、予め定められている評価規則によって決まる最低優
先度のグループ中の、そのグループのキャッシングアル
ゴリズムによって最低優先度が割り当てられているデー
タをパージする。この構成によれば、各グループ毎に独
自のキャッシングアルゴリズムでデータを管理している
にも関わらず、キャッシュされている全グループの全デ
ータの内の、最も優先度の低いデータをパージすること
ができるので、各グループ毎に固定的に記憶領域を割り
当てる必要がなくなる。この結果、或るグループにアク
セスが集中し、他のグループにアクセスが余りなかった
場合、上記或るグループのデータをキャッシュするため
に多くの記憶領域を使用することが可能になるので、キ
ャッシュヒット率を高いものにすることが可能になる。

【００２１】

【発明の実施の形態】次に本発明の実施の形態について
図面を参照して詳細に説明する。

【００２２】

【構成の説明】図２は本発明の第一の実施の形態に係る
キャッシュ装置１０の構成例を示すブロック図である。
本実施の形態のキャッシュ装置１０は、外部からのリク
エストを受け付けるリクエスト処理部１１と、キャッシ
ュされたデータを記憶するキャッシュ記憶部１４と、リ
クエストされたデータがキャッシュされているかどうか
を判定し、キャッシュされていれば、そのデータをキャ
ッシュ記憶部１４から読み出すキャッシュ検索部１２
と、データをキャッシュするかどうかを判定し、キャッ
シュする場合はそのデータをキャッシュ記憶部１４に書
き込み、キャッシュ記憶部１４の空き記憶領域が足りな
くなった時には、いずれかのデータを選択してパージす
るキャッシュ判定部１３とを備えている。

【００２３】図３は、図２に示したキャッシュ判定部１
３及びキャッシュ記憶部１４の構成例を示すブロック図
である。キャッシュ判定部１３は、複数の部分キャッシ
ュ管理部２１−１〜２１−ｎと、データグループ決定手
段２２と、最低優先度決定手段２３とを含む。

【００２４】データグループ決定手段２２は、予め定め
られているグループ分け規則に従って、キャッシュ記憶
部１４にキャッシュされる各データ２５−１〜２５−ｍ
を、複数の部分キャッシュ管理部２１−１〜２１−ｎの
内の、どの部分キャッシュ管理部に管理させるかを決定
する。以降、一つの部分キャッシュ管理部で管理される
データの集合をデータグループと呼ぶ。キャッシュされ
るデータ２５−１〜２５−ｍは、いずれか一つのデータ
グループに属し、各データ２５−１〜２５−ｍは、同一
のサイズを有する。

【００２５】各部分キャッシュ管理部２１−１〜２１−
ｎは、それぞれ独自のキャッシングアルゴリズムで自管
理部に割り当てられているデータを管理するものであ
り、優先度割り当て手段３１と、部分最低優先度決定手
段３２と、データ操作手段３３とを備えている。優先度
割り当て手段３１は、それを含んでいる部分キャッシュ
管理部２１−ｉ（１≦ｉ≦ｎ）が管理するデータグルー
プ中の各データに、部分キャッシュ管理部２１−ｉ独自
のキャッシングアルゴリズムに従った優先度を割り当て
る。部分最低優先度決定手段３２は、それを含んでいる
部分キャッシュ管理部２１−ｉで管理されているデータ
グループ中の最も低い優先度を持つ部分最低優先度デー
タを特定する。データ操作手段３３は、データのキャッ
シュ、パージを行う。

【００２６】最低優先度決定手段２３は、各部分キャッ
シュ管理部２１−１〜２１−ｎが管理しているデータグ
ループの中から最低優先度のデータグループを特定す
る。キャッシュ記憶部１４中の空き記憶領域２４が不足
した場合には、最低優先度のデータグループを管理して
いる部分キャッシュ管理部内のデータ操作手段３３が、
上記データグループ中の最低優先度を持つデータをパー
ジする。

【００２７】

【動作の説明】図２、図３、図４を参照しつつ、本実施
の形態の動作を説明する。

【００２８】リクエスト処理部１１が外部からのリクエ
ストを受け取った場合の処理例を図４の流れ図に示す。

【００２９】まず、リクエスト処理部１１がリクエスト
を受けとり（図４、ステップＡ１）、キャッシュ検索部
１２で、リクエストされたデータがキャッシュ記憶部１
４にキャッシュされているかどうかを調べる（ステップ
Ａ２）。

【００３０】データがキャッシュされていれば、キャッ
シュ検索部１２は、リクエストされたデータをキャッシ
ュ記憶部１４から読み出す（ステップＡ３）。また、上
記データを管理している部分キャッシュ管理部２１−ｉ
内の優先度割り当て手段３１は、上記部分キャッシュ管
理部２１−ｉが管理しているデータグループ中のデータ
の優先度を更新する（ステップＡ４）。この優先度の更
新は、上記部分キャッシュ管理部２１−ｉのキャッシン
グアルゴリズムに従って行うものであり、例えば、部分
キャッシュ管理部２１−ｉのキャッシングアルゴリズム
がＬＦＵであれば、上記データの参照回数を＋１する。
これに対して、リクエストされたデータがキャッシュさ
れていなければ、キャッシュ検索部１２は、キャッシュ
元からオリジナルなデータＤを取得する（ステップＡ
５）。

【００３１】次に、キャッシュ判定部１３内のデータグ
ループ決定手段２２によって、データＤが属するデータ
グループが決定され（ステップＢ１）、そのデータグル
ープを管理する部分キャッシュ管理部２１−ｊの優先度
割り当て手段３１によって、データＤに優先度が割り当
てられる（ステップＢ２）。そして、空き記憶領域２４
がデータＤを記憶するのに十分な大きさを持つかどうか
の判定を行ない（ステップＢ３）、十分な大きさを持て
ばステップＢ６へ、十分な大きさを持たなければ、最低
優先度決定手段２３が予め定められている評価規則に従
って、全データグループの中からデータをパージするデ
ータグループ（最低優先度のデータグループ）を決定す
る（ステップＢ４）。ステップＢ４で最低優先度のデー
タグループが決定されると、そのデータグループを管理
する部分キャッシュ管理部２１−ｋ（１≦ｋ≦ｎ）内の
データ操作手段３３が、部分最低優先度決定手段３２に
よって特定されている最低優先度を持つデータが使用し
ていた記憶領域を空き記憶領域２４に含め、データＤを
キャッシュするのに十分な空き記憶領域を確保し（ステ
ップＢ５）、確保した空き領域にデータをキャッシュす
る（ステップＢ６）。尚、本実施の形態では、各データ
２５−１〜２５−ｎのサイズを同一としたが、各データ
のサイズが異なっていても良いことは勿論である。但
し、各データのサイズが一定でない場合は、データＤを
格納するのに十分な空き記憶領域２４が確保されるま
で、ステップＢ４，Ｂ５の処理を繰り返し行うことが必
要になる。

【００３２】

【発明の他の実施の形態】次に、本発明の第二の実施の
形態について図面を参照して詳細に説明する。本実施の
形態に係るキャッシュ装置は、図３に示したキャッシュ
判定部１３の代わりに、図５に示したキャッシュ判定部
１３ａを使用することにより実現される。キャッシュ判
定部１３ａは、部分キャッシュ管理部２１−１〜２１−
ｎの代わりに部分キャッシュ管理部２６−１〜２６−ｎ
を備えている点が、第一の実施の形態と異なっている。
部分キャッシュ管理部２６−１〜２６−ｎは、図３に示
された第一の実施の形態における部分キャッシュ管理部
２１−１〜２１−ｎの構成に加え、サイズ測定手段３４
と、ヒット率測定手段３５とを有する点で異なる。サイ
ズ測定手段３４は、それが含まれている部分キャッシュ
管理部２６−ｉ（１≦ｉ≦ｎ）が管理しているデータグ
ループに割り当てられている記憶領域のサイズを測定
し、ヒット率測定手段３５は、それが含まれている部分
キャッシュ管理部２６−ｉが管理しているデータグルー
プのキャッシュヒット率を測定する。

【００３３】次に、本実施の形態の動作を、図６の流れ
図を参照して詳細に説明する。尚、図６のステップＡ１
〜Ａ５、Ｂ１〜Ｂ６の処理は、第一の実施の形態と同様
であるため、説明は省略する。

【００３４】第一の実施の形態では、ステップＢ４でど
のようなパラメータを用いて、パージするデータグルー
プを決定するのか、具体的に指定していなかった。本実
施の形態では、各部分キャッシュ管理部２６−１〜２６
−ｎ内のサイズ測定手段３４及びヒット率測定手段３５
で、各データグループに割り当てられている記憶領域の
サイズ及びキャッシュヒット率を測定し（ステップＣ
１）、それらを用いてパージするデータグループを決定
する（ステップＢ４）。より具体的には、各データグル
ープに於ける、キャッシュヒット率と割り当てられてい
る記憶領域のサイズとの比（キャッシュヒット率／サイ
ズ）を求め、その値が最も小さいデータグループをパー
ジするデータグループとする。

【００３５】次に、本実施の形態の効果について説明す
る。本実施の形態では、データグループの有用性を判断
する際（パージするデータグループを決定する際）、デ
ータグループの使用記憶領域の大きさとキャッシュヒッ
ト率を考慮する事で、データグループ全体の特徴を考慮
しない場合よりも、パージすべきデータをより的確に判
断できる。従って、キャッシュヒット率を向上させるこ
とが可能である。

【００３６】

【実施例】次に、第一の実施の形態に対する第一の実施
例について説明する。本実施例は、図２に示すキャッシ
ュ装置１０をＷＷＷデータのキャッシングに用いられる
プロキシキャッシュ装置として使用した場合についての
ものである。

【００３７】本実施例では、クライアントからキャッシ
ュ装置１０へ送られてくるリクエストは、データを先頭
からシーケンシャルに転送することを要求するものとな
る。そこで、データを先頭から所定サイズ（例えば４０
９６バイト）ずつに分割し、この分割データをキャッシ
ュ／パージの単位とする。この時、データの先頭を含む
分割データ（第１番目の分割データ）がまた要求される
かどうかは不確定であるが、第１番目の分割データへの
リクエストが到着すれば、後続の分割データ（第２番目
以降の分割データ）へのリクエストがなされることは確
定する。データの先頭からＡ１バイト目まで、データの
Ａ１バイト目からＡ２バイト目まで、……、のようにデ
ータを不定長に分割した場合にも本実施例を利用できる
ことは明らかである。

【００３８】本実施例の動作を説明する。リクエスト処
理部１１がクライアントからのリクエスト（或るデータ
αを先頭からシーケンシャルに転送することを要求する
リクエスト）を受け取ると（図４のステップＡ１）、キ
ャッシュ検索部１２が、上記データαの先頭を含む第１
番目の分割データがキャッシュ記憶部１４にキャッシュ
されているかどうかを調べる（ステップＡ２）。

【００３９】今、第１番目の分割データがキャッシュさ
れていないとすると、キャッシュ検索部１２は、サーバ
からオリジナルな第１番目の分割データを取得する（ス
テップＡ５）。その後、キャッシュ判定部１３内のデー
タグループ決定手段２２によって、上記第１番目の分割
データが属するデータグループが決定される（ステップ
Ｂ１）。

【００４０】尚、本実施例では、データグループ決定手
段２２は、アクセス時刻を予想できないデータを、デー
タグループＸに分類し、アクセス時刻を予想できるデー
タをデータグループＹに分類するものとする。より具体
的には、データグループ決定手段２２は、第１番目の分
割データは、データグループＸに分類する。第２番目以
降の分割データは、リクエスト処理部１１が受け付けて
いる後続のリクエストの中に、現在グループ分けの対象
にしている分割データを含むデータと同じデータに対す
るリクエストがある場合には、データグループＹに分類
し、そうでない場合には、データグループＸに分類す
る。また、本実施例では、部分キャッシュ管理部２１−
１がデータグループＸに属する分割データを管理し、部
分キャッシュ管理部２１−２がデータグループＹに属す
る分割データを管理するものとする。

【００４１】ステップＢ１に於いて、第１番目の分割デ
ータがデータグループＸに分類されると、部分キャッシ
ュ管理部２１−１内の優先度割り当て手段３１が第１番
目の分割データに優先度を割り当てる（ステップＢ
２）。ここで、データグループＸを管理する部分キャッ
シュ管理部２１−１内の優先度割り当て手段３１は、Ｌ
ＦＵに従って優先度を割り当てる（参照回数を優先度と
して割り当てる）。この例では、第１番目の分割データ
がデータグループＸに属するので、部分キャッシュ管理
部２１−１内の優先度割り当て手段３１によって優先度
の割り当てがおこなわれるが、ステップＢ１に於いて、
分割データがデータグループＹに分類された場合には、
データグループＹに属するデータを管理する部分キャッ
シュ管理部２１−２によって優先度が割り当てられる。
データグループＹを管理する部分キャッシュ管理部２１
−２内の優先度割り当て手段３１は、予想アクセス時刻
を優先度として割り当てる。予想アクセス時刻は、クラ
イアントからプロキシキャッシュ装置への予想転送速度
と、分割されたデータの大きさとから予想される。アク
セスされた分割データと到着時刻を予想している分割デ
ータとの間にいくつの分割データがあるかも考慮する。
例えば、予想転送速度が一定で、一秒間当たり１メガビ
ットで、分割データの大きさが全て２５６キロバイトで
あるとすると、１つの分割データの転送に２秒かかる。
予想アクセス時刻は、「予想アクセス時刻＝現在時刻＋
分割データサイズ×Ｒ／データの転送速度」で予想す
る。ただしＲは、アクセスされた分割データと到着時刻
を予想している分割データとの間にいくつの分割データ
があるかを表す。

【００４２】その後、ステップＢ３に於いて、空き記憶
領域２４が第１番目の分割データを記憶するのに十分な
大きさを持つか否かが調べられる。そして、十分な大き
さを持てば、第１番目の分割データは、部分キャッシュ
管理部２１−１内のデータ操作手段３３によってキャッ
シュ記憶部１４にキャッシュされる（ステップＢ６）。
これに対して、空き記憶領域２４の大きさが十分でない
場合には、最低優先度決定手段２３によってデータグル
ープＸとデータグループＹとの優先度が比較され、パー
ジの対象にするデータグループが決定される（ステップ
Ｂ４）。

【００４３】このステップＢ４の処理を詳しく説明する
と、次のようになる。データグループＸ，Ｙの優先度の
比較は、部分キャッシュ管理部２１−１内の最低優先度
決定手段２３によってデータグループＸの部分最低優先
度データに対する予想アクセス時刻を推定し、この値と
データグループＹの部分最低優先度データに割り当てら
れている優先度（予測アクセス時刻）と比較することで
行なう。データグループＸの部分最低優先度データに対
する予想アクセス時刻は、現在時刻とデータの通算参照
回数を元に推定する。データグループＸのキャッシング
アルゴリズムとしてＬＦＵ以外を用いた場合は、そのキ
ャッシュ方式が利用する情報をパラメータとする関数に
よって、優先度変換を行なう。参照回数で与えられる優
先度を予想アクセス時刻に変換する関数は、予想アクセ
ス時刻＝Ｃ＋ｋ／（ｆ＋１）とする。ただし、Ｃは現在
時刻、ｆはパージ候補の単位データの参照回数、ｋは定
数である。また、部分最低優先度決定手段３２には、ヒ
ープを用いる。

【００４４】ステップＢ４に於いて、パージ対象にする
データグループが決定されると、そのデータグループを
管理している部分キャッシュ管理部内のデータ操作手段
３３が、部分最低優先度決定手段３２によって特定され
る最低優先度データが使用していた領域を空き記憶領域
に含め、そこに第１番目の分割データをキャッシュする
（ステップＢ５，Ｂ６）。

【００４５】以上は、データαの第１番目の分割データ
がキャッシュされていない場合の動作であるが、キャッ
シュされている場合は、次のような動作が行われる。

【００４６】ステップＡ２に於いて、第１番目の分割デ
ータがキャッシュされていると判断した場合、キャッシ
ュ検索部１２は、第１番目の分割データをキャッシュ記
憶部１４から読み出す（ステップＡ３）。その後、デー
タαの第２番目以降のデータの優先度を更新する（ステ
ップＡ４）。

【００４７】このステップＡ４の処理を詳細に説明する
と、次のようになる。データグループ決定手段２２が、
データグループＸの分割データを管理している部分キャ
ッシュ管理部２１−１に対して、データαの第２番目以
降の分割データを管理対象から除外し、データグループ
Ｙの分割データを管理している部分キャッシュ管理部２
１−２に対して、データαの第２番目以降の分割データ
を管理対象にすることを指示する。これにより、部分キ
ャッシュ管理部２１−１は、データαの第２番目以降の
分割データを管理対象にしていれば、それを管理対象か
ら除外する。また、部分キャッシュ管理部２１−２は、
データαの第２番目以降の分割データを管理対象にして
いなければ、それを管理対象にする。その後、部分キャ
ッシュ管理部２１−２内の優先度割り当て手段３１が、
データαの第２番目以降の分割データの優先度（予想ア
クセス時刻）を更新する。この優先度の更新は、前述し
た式「予想アクセス時刻＝現在時刻＋分割データサイズ
×Ｒ／データの転送速度」に基づいて、データαの第２
番目以降の各分割データの予想アクセス時刻を求め、求
めた予想アクセス時刻を対応する分割データに割り当て
ることにより行う。また、データグループＸを管理して
いる部分キャッシュ管理部２１−１内の優先度割り当て
手段３１は、データαの第１番目の分割データの優先度
（参照回数）を更新する。

【００４８】データαの第１番目の分割データに対する
処理が終了すると、第２番目以降の分割データに対して
前述した動作と同様の動作が行われる。そして、データ
αの最後の分割データに対する処理が終了すると、デー
タグループ決定手段２２は、リクエスト処理部１１が受
け付けている後続のリクエストの中に、データαに対す
るリクエストが存在するか否かを調べる。そして、存在
しない場合には、データグループＸの分割データを管理
している部分キャッシュ管理部２１−１に対して、デー
タαの第２番目以降のデータを管理対象にすることを指
示し、データグループＹのデータを管理している部分キ
ャッシュ管理部２１−２に対して、データαの第２番目
以降のデータを管理対象から除外することを指示する。
これにより、部分キャッシュ管理部２１−１は、データ
αの第２番目以降の分割データを管理対象にし、部分キ
ャッシュ管理部２１−２は、データαの第２番目以降の
分割データを管理対象から除外する。更に、部分キャッ
シュ管理部２１−１内の優先度割り当て手段３１は、デ
ータαの第２番目以降の分割データに、データαの第１
番目の分割データと同じ優先度（参照回数）を割り当て
る。

【００４９】本実施例の変形として、主記憶装置に二次
記憶装置中のデータをキャッシュするディスクキャッシ
ュ装置に第一の実施の形態を適用した場合を示す。

【００５０】本発明を、図７に示す、演算装置１０１
と、キャッシュ記憶部１０４を有する主記憶装置１０２
と、二次記憶装置１０３とから構成されるシステムに適
用した場合について考える。尚、主記憶装置１０２上に
は、図２に示したキャッシュ装置１０の構成要素であ
る、リクエスト処理部１１，キャッシュ検索部１２，キ
ャッシュ判定部１３を実現するためのキャッシュ装置用
プログラム１０Ｐが登録されている。このキャッシュ装
置用プログラム１０Ｐは、演算装置１０１によって読み
取られ、その動作を制御することで、演算装置１０１上
にリクエスト処理部１１，キャッシュ検索部１２，キャ
ッシュ判定部１３を実現する。また、主記憶装置１０２
上のキャッシュ記憶部１０４は、図２のキャッシュ記憶
部１４に相当するものである。

【００５１】二次記憶装置１０３に連続メディアデータ
等の巨大なサイズを持つデータが記憶されているとす
る。これらのデータへのアクセスは、二次記憶装置１０
３からの読み出しに用いられる帯域を長時間にわたって
占有する。従って、多くの連続メディアデータ等の巨大
なデータがリクエストされた場合、低速な二次記憶装置
からの読み出し速度がボトルネックになり、転送速度が
大幅に低下してしまう。そこで、連続メディアデータ等
の巨大なデータの性質を利用して、なるべく高速な一次
記憶からデータが読み出されるように、パージする分割
データを選択する。

【００５２】データは、二次記憶装置１０３の入出力の
単位に分割され、この分割データがキャッシュ／パージ
の単位とされる。例えば、二次記憶装置１０３が４０９
６バイトずつ読み出し、書き込みを行なうとすると、デ
ータは先頭から４０９６バイトずつに分割され、この分
割データがキャッシュ／パージの単位とされる。

【００５３】本実施例の動作を説明する。キャッシュ装
置用プログラム１０Ｐによって実現されるリクエスト処
理部１１が、演算装置１０１からリクエスト（或るデー
タαを先頭からシーケンシャルに転送することを要求す
るリクエスト）を受け取ると（図４のステップＡ１）、
データαの第１番目の分割データから順番に、第一の実
施例で説明した処理と同様の処理が行われる。今、例え
ば、データαの第ｎ番目の分割データが処理対象になっ
たとすると、キャッシュ装置用プログラム１０Ｐによっ
て実現されるキャッシュ検索部１２が、上記データαの
第ｎ番目の分割データがキャッシュ記憶部１０４にキャ
ッシュされているかどうかを調べる（ステップＡ２）。

【００５４】今、第ｎ番目の分割データがキャッシュさ
れていないとすると、キャッシュ検索部１２は、二次記
憶装置１０３からオリジナルの第ｎ番目の分割データを
取得する（ステップＡ５）。その後、キャッシュ装置用
プログラム１０Ｐによって実現されるキャッシュ判定部
１３内のデータグループ決定手段２２によって、上記第
ｎ番目の分割データが属するデータグループが決定され
る（ステップＢ１）。このステップＢ１の具体的な処理
は、第一の実施例のステップＢ１の処理と全く同じであ
り、第ｎ番目の分類データは、アクセス時刻を予想不可
能なデータグループＸ或いはアクセス時刻を予測可能な
データグループＹに分類される。

【００５５】その後、ステップＢ２に於いて、第ｎ番目
の分割データに優先度が割り当てられる。ここで、第ｎ
番目の分割データが、データグループＸに属するもので
あるときは、参照回数が優先度として割り当てられ、デ
ータグループＹに属するものであるときは、予測アクセ
ス時刻が優先度として割り当てられる。予想アクセス時
刻は、式「予想アクセス時刻＝現在時刻＋分割データサ
イズ×Ｒ／演算装置１０１と主記憶装置１０２との間の
データ転送速度」を使用して予想する。但しＲは、アク
セスされた分割データと到着時刻を予想している分割デ
ータとの間にいくつの分割データがあるかを表す。

【００５６】その後、ステップＢ３に於いて、キャッシ
ュ記憶部１０４の空き記憶領域が第ｎ番目の分割データ
を記憶するのに十分な大きさを持つか否かが調べられ
る。そして、十分な大きさを持てば、第ｎ番目の分割デ
ータは、部分キャッシュ管理部２１−１或いは部分キャ
ッシュ管理部２１−２内のデータ操作手段３３によって
キャッシュ記憶部１０４にキャッシュされる（ステップ
Ｂ６）。これに対して、空き記憶領域の大きさが十分で
ない場合には、最低優先度決定手段２３によってデータ
グループＸとデータグループＹとの優先度が比較され、
パージの対象にするデータグループが決定される（ステ
ップＢ４）。このステップＢ４の具体的な動作は、第一
の実施例と全く同じである。

【００５７】ステップＢ４に於いて、パージ対象にする
データグループが決定されると、そのデータグループを
管理している部分キャッシュ管理部内のデータ操作手段
３３が、部分最低優先度決定手段３２によって特定され
る最低優先度データが使用していた領域をパージし、そ
こに第ｎ番目の分割データをキャッシュする（ステップ
Ｂ５，Ｂ６）。

【００５８】以上は、データαの第ｎ番目の分割データ
がキャッシュされていない場合の動作であるが、キャッ
シュされている場合は、次のような動作が行われる。

【００５９】ステップＡ２に於いて、第ｎ番目の分割デ
ータがキャッシュされていると判断した場合、キャッシ
ュ検索部１２は、第ｎ番目の分割データをキャッシュ記
憶部１０４から読み出す（ステップＡ３）。その後、デ
ータαの第（ｎ＋１）番目以降のデータの優先度を更新
する（ステップＡ４）。このステップＡ４の具体的な動
作は、第１の実施例と全く同様である。

【００６０】以上の動作をデータαの最後の分割データ
まで行うと、データグループ決定手段２２は、リクエス
ト処理部１１が受け付けている後続のリクエストの中
に、データαに対するリクエストが存在するか否かを調
べる。そして、存在しない場合には、データグループＸ
の分割データを管理している部分キャッシュ管理部２１
−１に対して、データαの第２番目以降のデータを管理
対象にすることを指示し、データグループＹのデータを
管理している部分キャッシュ管理部２１−２に対して、
データαの第２番目以降のデータを管理対象から除外す
ることを指示する。これにより、部分キャッシュ管理部
２１−１は、データαの第２番目以降の分割データを管
理対象にし、部分キャッシュ管理部２１−２は、データ
αの第２番目以降の分割データを管理対象から除外す
る。更に、部分キャッシュ管理部２１−１内の優先度割
り当て手段３１は、データαの第２番目以降の分割デー
タに、データαの第１番目の分割データと同じ優先度
（参照回数）を割り当てる。尚、上述した第一の実施例
及びその変形は、第二の実施の形態にも適用できる。

【００６１】次に、第一の実施の形態に対する第二の実
施例を示す。本実施例は、第一の実施の形態に係るキャ
ッシュ装置を、二次記憶装置中にディレクトリデータと
ファイルデータの二種類の情報が格納されているシステ
ムにおけるディスクキャッシュ装置とした場合について
のものである。

【００６２】本実施例では、ディレクトリデータと、フ
ァイルデータのそれぞれをＬＦＵでキャッシュし、各デ
ータには優先度として参照回数を割り当てる。更に、本
実施例では、最低優先度のデータグループを決定するた
めに、各データに最終アクセス時刻も割り当てる。そし
て、二つのデータグループの部分最低優先度データ（参
照回数が最も少ないデータ）のうち、最終アクセス時刻
が早い方が最低優先度データとする。

【００６３】図８は本実施例のブロック図であり、キャ
ッシュ装置２００と、主記憶装置２１０と、二次記憶装
置２２０とから構成されている。

【００６４】主記憶装置２１０には、キャッシュ記憶部
２１１が設けられている。二次記憶装置２２０には、複
数のディレクトリデータＡ〜Ｆと、複数のファイルデー
タ１〜６が格納されている。

【００６５】キャッシュ装置２００は、リクエスト処理
部２０１と、キャッシュ検索部２０２と、キャッシュ判
定部２０３とを備えている。リクエスト処理部２０１，
キャッシュ検索部２０２は、図２に示したリクエスト処
理部１１，キャッシュ検索部１２と同様の機能を有す
る。キャッシュ判定部２０３は、ディレクトリデータを
管理する部分キャッシュ管理部２０４−１と、ファイル
データを管理する部分キャッシュ管理部２０４−２と、
最低優先度決定手段２０８と、データグループ決定手段
２０９とを備えている。

【００６６】外部からのリクエストをリクエスト処理部
２０１が受け付けると（図４，ステップＡ１）、キャッ
シュ検索部２０２は、リクエストされたデータがキャッ
シュ記憶部２１１にキャッシュされているか否かを調べ
る（ステップＡ２）。

【００６７】そして、キャッシュされている場合には、
キャッシュ検索部２０２は、リクエストされたデータを
キャッシュ記憶部２１１から読み出す（ステップＡ
３）。その後、上記リクエストされているデータを管理
している部分キャッシュ管理部２０４−ｉ（ｉ＝１また
は２）内の優先度割り当て手段２０５−ｉが、上記リク
エストされたデータの参照回数（優先度）および最終ア
クセス時刻を更新する（ステップＡ４）。これに対し
て、リクエストされたデータがキャッシュされていない
場合は、キャッシュ検索手段２０２は、二次記憶装置２
２０からリクエストされたデータを取り出す（ステップ
Ａ５）。

【００６８】その後、キャッシュ判定部２０３内のデー
タグループ決定手段２０９が、上記データを所属させる
データグループを決定する（ステップＢ１）。本実施例
では、上記データがディレクトリデータである場合に
は、所属先を部分キャッシュ管理部２０４−１で管理さ
れるデータグループＧ１にし、ファイルデータである場
合には、所属先を部分キャッシュ管理部２０４−２で管
理されるデータグループＧ２とする。

【００６９】その後、所属先とされた部分キャッシュ管
理部２０４−ｉ内の優先度割り当て手段２０５−ｉが、
上記データに参照回数（優先度）および最終アクセス時
刻を割り当てる（ステップＢ２）。そして、キャッシュ
記憶部２１１の空き領域が、データを記憶するのに十分
な大きさを持つかどうかの判定を行ない（ステップＢ
３）、十分な大きさを持てば、キャッシュ記憶部２１１
にデータを格納する（ステップＢ６）。これに対して、
空き領域が十分な大きさを持たない場合は、最低優先度
決定手段２０８が、部分最低優先度決定手段２０６−
１，２０６−２によって求められた、データグループＧ
１，Ｇ２中の部分最低優先度データ（参照回数が最も少
ないデータ）の最終アクセス時刻を比較し、最終アクセ
ス時刻が新しい方のデータグループをパージ対象のデー
タグループとする（ステップＢ４）。

【００７０】その後、パージ対象にされたデータグルー
プを管理している部分キャッシュ管理部２０４−ｉ内の
データ操作手段２０７−ｉが、部分最低優先度決定手段
２０６−ｉによって特定されている最低優先度を持つデ
ータが使用していた記憶領域を空き記憶領域に含め、デ
ータをキャッシュするのに十分な空き記憶領域を確保し
（ステップＢ５）、確保した領域にデータをキャッシュ
する（ステップＢ６）。

【００７１】次に、図９に示す関係を持つディレクトリ
データＡ〜Ｆ、ファイル１〜６が二次記憶装置２２０に
格納されている場合を例にとって、本実施例の効果につ
いて説明する。ファイルデータ、ディレクトリデータと
もに、複数のユーザによって共有されている等の理由で
頻繁に参照されるものと、ほとんど参照されないものが
あるため、頻繁にアクセスされるファイルを主記憶装置
２１０中のキャッシュ記憶部２１１にキャッシュする
と、アクセスコストが軽減される。ディレクトリデータ
Ｂが４人のユーザに共有されていて、ディレクトリＢに
各ユーザがファイルを持っていたとすると、ディレクト
リＢは多数のアクセスを受けることになる。

【００７２】最初に、ディレクトリデータとファイルデ
ータの二つのデータを既存のキャッシングアルゴリズム
により統一的に管理する場合の問題点について説明す
る。二次記憶装置２２０上にあるディレクトリデータを
主記憶装置２１０上のキャッシュ記憶部２１１にキャッ
シュするとファイルデータへのアクセス速度が増加する
ため、ディレクトリデータをキャッシュすることは良い
が、ファイルデータもキャッシュする必要があるため、
ディレクトリデータのキャッシュに割り当てる記憶領域
と、ファイルデータのキャッシュに割り当てる記憶領域
のバランスを取る必要がある。ところが上に述べた通
り、ディレクトリデータは、ファイルデータに比べて多
数のアクセスを受ける傾向がある。そのため頻繁にアク
セスされるファイルデータ、ディレクトリデータが時間
とともに変化した場合には、ディレクトリデータの参照
回数とファイルデータの参照回数を直接比較すると、現
時点で頻繁にアクセスされているファイルデータより
も、過去に頻繁にアクセスされていたディレクトリデー
タの方が優先順位が高くなってしまう。この結果、キャ
ッシュ記憶部２１１に格納されているデータをパージす
ることが必要になった場合、過去に頻繁にアクセスされ
ていたディレクトリデータがパージされずに、現在頻繁
にアクセスされているファイルデータがパージされてし
まうという問題が生じる。

【００７３】本実施例では、参照回数に関して、ファイ
ルデータはファイルデータ同士、ディレクトリデータは
ディレクトリデータ同士の比較になり、ファイルデータ
をキャッシュするための記憶領域とディレクトリデータ
をキャッシュするための記憶領域の大きさのバランス
は、互いのデータグループで最も不要なデータの最終ア
クセス時刻の比較によって取られる。頻繁にアクセスさ
れるファイルデータ、ディレクトリデータが移り代わる
と、ファイルデータ、ディレクトリデータそれぞれの中
で高い優先度を持っていた（参照回数が多かった）デー
タが低い優先度を持つようになり、いずれ部分最低優先
度データとなる。この時、最も低い優先度を持つディレ
クトリデータ、ファイルデータのどちらを捨てるかは、
参照回数ではなく、最終アクセス時刻によって決定され
るため、多くなりがちなディレクトリデータの参照回数
とファイルデータの参照回数が比較されることはなく、
ファイルデータとディレクトリデータが使用する記憶領
域のバランスが取られるので、適切なキャッシングを行
なうことができ、ディレクトリデータ、ファイルデータ
へのキャッシュヒットが増加し、ファイル検索、ファイ
ルＩ／Ｏの速度が増す。

【００７４】本実施例の変形として、二次記憶装置２２
０中にＤＮＳデータとファイルデータとを格納し、キャ
ッシュ装置２００をプロキシキャッシュ装置として使用
する場合について説明する。

【００７５】ＵＲＬは、データを保持するホストと、ホ
ストで解決されるファイルの識別子からなり、ホストと
ＩＰアドレスの関連づけはＤＮＳデータに基づいて行な
われる。従って、プロキシキャッシュ装置の高速化のた
めには、ファイルデータだけでなくＤＮＳデータもキャ
ッシュした方が良い。図８に示した部分キャッシュ管理
部２０４−１，２０４−２をそれぞれＤＮＳデータ用，
ファイルデータ用に使用すれば、ファイルデータとＤＮ
Ｓデータが使用するキャッシュ記憶部２１１の領域のバ
ランスが取られるので、適切なキャッシングを行なうこ
とができ、ファイルデータ、ＤＮＳデータへのキャッシ
ュヒットが増加し、クライアントのリクエストに対する
レスポンスタイムが短縮される。ファイルデータとＤＮ
Ｓデータを共にキャッシュする場合、上記のファイルデ
ータとディレクトリデータの関係と同様、人気のあるフ
ァイルを保持するホストのＤＮＳデータは、そのホスト
が保持するデータに比べて多数のアクセスを受けるた
め、ファイルデータとＤＮＳデータの参照回数を直接比
較すると、ファイルのためのキャッシュ領域とＤＮＳデ
ータのためのキャッシュ領域のバランスがとれない。

【００７６】上記実施例ではファイルとディレクトリ
（ＤＮＳデータ）の優先度を最終アクセス時刻を用いて
比較するが、これ以外にもデータグループＹに属するデ
ータに対して、初めてアクセスされた時刻Ｂを付加し、
次回のアクセス予想時刻を予想時刻＝Ｃ＋（Ｃ−Ｂ）／
Ｆとする方式も考えられる。ただし、Ｃは現在時刻、Ｆ
は参照回数である。そして、各データグループの部分最
低優先度データの内、予想アクセス時刻が最も遠い時刻
を示しているものをパージする。尚、上述した第二の実
施例は及びその変形は、第二の実施の形態にも適用でき
る。

【００７７】次に、第一の実施の形態に対する第三の実
施例について説明する。本実施例は、第１の実施の形態
に係るキャッシュ装置を、ＷＷＷデータのキャッシング
に用いられるプロキシキャッシュ装置に適用した場合に
ついてのものである。

【００７８】図１０は本実施例に係るキャッシュ装置３
００の構成例を示すブロック図であり、リクエスト処理
部３０１と、キャッシュ検索部３０２と、キャッシュ判
定部３０３と、キャッシュ記憶部３１４とから構成され
ている。

【００７９】キャッシュ判定部３０３は、部分キャッシ
ュ管理部３０４−１，３０４−２と、データグループ決
定手段３０８と、最低優先度決定手段３０９と、ヒット
率推定手段３１０とを備えている。

【００８０】部分キャッシュ管理部３０４−１，３０４
−２は、優先度割り当て手段３０５−１，３０５−２
と、部分最低優先度決定手段３０６−１，３０６−２
と、データ操作手段３０７−１，３０７−２とを備えて
いる。また、ヒット率推定手段３１０は、サイズ管理手
段３１１と、個数管理手段３１２と、演算手段３１３と
を備えている。

【００８１】本実施例においては、キャッシュ記憶部３
１４にキャッシュされているデータを、キャッシュされ
た後一度もアクセスされていないデータグループＬと、
キャッシュされた後一度以上アクセスされたデータグル
ープＨとに分けて管理する。従って、キャッシュ記憶部
３１４中のデータグループＬのデータがアクセスされた
場合、そのデータはデータグループＬから取り除かれ
て、データグループＨに移される。データグループＨ，
Ｌに属するデータは、それぞれ部分キャッシュ管理部３
０４−１，３０４−２によって管理される。各部分キャ
ッシュ管理部３０４−１，３０４−２内の優先度割り当
て手段３０５−１，３０５−２は、どちらもＬＲＵに従
った優先度を、管理しているデータに割り当てる。

【００８２】ヒット率推定手段３１０内のサイズ管理手
段３１１は、データグループＬ，Ｈが占める記憶領域の
サイズ｜Ｌ｜，｜Ｈ｜を管理する。個数管理手段３１２
は、データグループＬからデータグループＨに移った
後、一度以上アクセスされたことのあるデータの数Ｔ
と、データグループＬからデータグループＨに移った
後、一度もアクセスされたことのないデータの数Ｓとを
管理している。演算手段３１３は、サイズ管理手段３１
１，個数管理手段３１２で管理されているデータに基づ
いて、データグループＬ，Ｈそれぞれのヒット率の推定
値を求める。

【００８３】次に、本実施例の動作を説明する。

【００８４】リクエスト処理部３０１が、外部からのデ
ータＤに対するリクエストを受け付けると（図４のステ
ップＡ１）、キャッシュ検索部３０２が、キャッシュ記
憶部３１４にデータＤがキャッシュされているか否かを
調べる（ステップＡ２）。

【００８５】キャッシュされている場合（ステップＡ２
がｙ）は、キャッシュ検索部３０２によって、キャッシ
ュ記憶部３１４からリクエストされたデータＤが読み出
され（ステップＡ３）、更に、上記データＤを管理して
いる部分キャッシュ管理部３０４−ｉ（ｉ＝１または
２）内の優先度割り当て手段３０５−ｉによってデータ
Ｄに対する優先度（ＬＲＵに従った優先度）が更新され
る（ステップＡ４）。また、ステップＡ４の処理が終了
した後、データグループ決定手段３０８は、上記データ
ＤがデータグループＬに属するものであれば、部分キャ
ッシュ管理部３０４−１，３０４−２に指示を出し、デ
ータＤをデータグループＬからデータグループＨへ移
す。

【００８６】これに対して、データＤがキャッシュされ
ていない場合（ステップＡ２がｎ）は、キャッシュ検索
部３０２が、キャッシュ元からオリジナルなデータＤを
取得する（ステップＡ５）。その後、データグループ決
定手段３０８が、上記データＤをデータグループＬにグ
ループ分けし（ステップＢ１）、データグループＬを管
理している部分キャッシュ管理部３０４−２内の優先度
割り当て手段３０５−２が、データＤに優先度（ＬＲＵ
に従った優先度）を割り当てる。

【００８７】その後、ステップＢ３に於いて、データＤ
を格納するのに十分な空き領域がキャッシュ記憶部３１
４上に存在するか否かが調べられる。そして、十分な空
き領域が存在する場合には、部分キャッシュ管理部３０
４−２内のデータ操作手段３０７−２によって、データ
Ｄがキャッシュ記憶部３１４にキャッシュされる（ステ
ップＢ６）。

【００８８】これに対して、データＤを格納するのに、
十分な空き領域が存在しない場合（ステップＢ３がｙ）
は、最低優先度決定手段３０９が、ヒット率推定手段３
１０の推定結果に基づいて、パージするデータグループ
を決定する（ステップＢ４）。

【００８９】このステップＢ４の処理を詳細に説明する
と、次のようになる。ヒット率推定手段３１０内の演算
手段３１３は、サイズ管理手段３１１，個数管理手段３
１２で管理されているデータ｜Ｌ｜，｜Ｈ｜，Ｓ，Ｔを
使用して、データグループＬ，Ｈのヒット率の推定値Ｓ
Ｌ，ＳＨを次式（１），（２）により求めている。

【００９０】ＳＬ＝｜Ｌ｜／（Ｓ＋ａ） … （１）ＳＨ＝｜Ｈ｜／（Ｔ＋ａ） … （２）ここで、ａは定数である。

【００９１】最低優先度決定手段３０９は、データグル
ープＬ，Ｈのヒット率の推定値ＳＬ，ＳＨを比較し、Ｓ
Ｌ≧ＳＨであれば、データグループＨの優先度の方が高
いと判断し、データをパージするデータグループをデー
タグループＬに決定する。ＳＬ＜ＳＨであれば、データ
グループＬの方が優先度が高いと判断し、データをパー
ジするデータグループをデータグループＨに決定する。
以上がステップＢ４で行う処理の詳細である。

【００９２】ステップＢ４に於いて、パージするデータ
グループがデータグループＨに決定された場合には、部
分キャッシュ管理部３０４−１内のデータ操作手段３０
７−１がデータグループＨ中の最低優先度データをキャ
ッシュ記憶部３１４からパージし、その後、データＤを
キャッシュ記憶部３１４にキャッシュする（ステップＢ
５，Ｂ６）。また、ステップＢ４に於いて、パージする
データグループがデータグループＬに決定された場合に
は、部分キャッシュ管理部３０４−２内のデータ操作手
段３０７−２が、データグループＬ中の最低優先度デー
タをキャッシュ記憶部３１４からパージし、その後、デ
ータＤをキャッシュ記憶部３１４にキャッシュする（ス
テップＢ５，Ｂ６）。

【００９３】尚、サイズ管理手段３１１では、例えば、
次のようにして、データグループＬ，Ｈが占める記憶領
域のサイズ｜Ｌ｜，｜Ｈ｜を管理する。ステップＢ５に
於いて、データグループＨを管理している部分キャッシ
ュ管理部３０４−１内のデータ操作手段３０７−１がデ
ータをパージした場合、上記データのサイズ分だけデー
タグループＨのサイズ｜Ｈ｜を減少させ、ステップＢ６
に於いてデータ操作手段３０７−１がデータをキャッシ
ュした場合、上記データのサイズ分だけデータグループ
Ｈのサイズ｜Ｈ｜を増加させる。また、ステップＢ５に
於いて、データグループＬを管理している部分キャッシ
ュ管理部３０４−２内のデータ操作手段３０７−２がデ
ータをパージした場合には、上記データのサイズ分だけ
データグループＬのサイズ｜Ｌ｜を減少させ、ステップ
Ｂ６に於いてデータ操作手段３０７−２がデータをキャ
ッシュした場合には、上記データのサイズ分だけデータ
グループＬのサイズ｜Ｌ｜を増加させる。

【００９４】また、個数管理手段３１２は、例えば次の
ようにして、個数Ｓ，Ｔを管理する。ステップＡ３にお
いて、キャッシュ記憶部３１４から或るデータαが読み
出された場合、そのデータαの識別子とアクセス回数と
の対が、自手段３１２内に設けられているリスト（図示
せず）に繋がれているか否かを調べる。もし、繋がれて
いない場合は、データαの識別子とアクセス回数（０
回）との対を、リストに追加し、更に、個数Ｓを＋１す
る。これに対して、データαの識別子がリストに繋がれ
ている場合は、それと対になっているアクセス回数を＋
１し、更新後のアクセス回数が「１回」であるか否かを
調べる。そして、アクセス回数が「１回」である場合に
は、個数Ｔを＋１し、「１回」でない場合には、個数Ｔ
に対する更新は行わない。また、ステップＢ５に於い
て、データ操作手段３０７−１によって、データグルー
プＨ中の最低優先度データβがパージされた場合、リス
トに繋がれているデータβの識別子とアクセス回数との
対に注目し、アクセス回数が「０回」であるか否かを調
べる。そして、アクセス回数が「０回」であれば、個数
Ｓを−１し、更に、上記注目した対をリストから削除す
る。これに対して、アクセス回数が「０回」でなけれ
ば、個数Ｔを−１し、更に上記注目した対をリストから
削除する。

【００９５】本実施例は、二つのデータグループを組み
合わせることで既存のＬＲＵ，ＬＦＵを単独で使った方
式の問題点を克服している。

【００９６】ＬＲＵを使った場合は、ミラーリングを行
うためにあるサイト上のＷＷＷデータを大量にコピーす
るようなアクセスが発生した場合に、一度しかアクセス
されないデータも含めて大量のデータに対するアクセス
が発生するため、結果として頻繁に利用されるデータが
キャッシュから追い出されてキャッシュの効率が低下す
る問題点がある。

【００９７】ＬＦＵを使った場合は、ユーザのアクセス
パターンが変化して頻繁にアクセスされるデータが時間
とともに変化した場合でも、以前アクセスされていたデ
ータに対するアクセス数が大きかった場合は、なかなか
キャッシュから追い出されずにキャッシュの効率を低下
する問題点がある。本実施例では、ＷＷＷデータを大量
にコピーするようなアクセスが発生した場合でも、一度
しかアクセスされないデータはデータグループＬに入れ
られ、結果としてデータグループＬのヒット率が低下す
るため、データグループＨに入っている頻繁にアクセス
されるデータがパージされることがない。この結果、キ
ャッシュを効率的に利用することができる。

【００９８】また、ユーザのアクセスパターンが変化し
て頻繁にアクセスされるデータが時間とともに変化した
場合は、アクセスされなくなったデータは、以前に頻繁
にアクセスされていたデータであってもデータグループ
Ｈから急速に追い出されるためキャッシュの効率が低下
する問題点が解決される。

【００９９】また本実施例は、ＬＲＵと同様にデータ構
造としてキューを使ってキャッシュされたデータを管理
することができるため、一回のキャッシュ操作に要する
計算量はＯ（１）しか必要としない。これに対してＬＦ
Ｕ等のようにデータ構造としてヒープを用いた他のキャ
ッシングアルゴリズムでは、キャッシュ中のデータ数が
ｎの時の一回のキャッシュ操作に要する計算量がＯ(log
ｎ) のキャッシングアルゴリズムと比較して短い計算時
間しか必要とせずに実現できるという特長も持つ。

【０１００】なお、本実施例の適用範囲はＷＷＷデータ
のキャッシングに用いられるプロキシキャッシュ装置以
外にも、ディスク中のデータを主記憶装置中にキャッシ
ュする目的や、ＤＮＳデータを主記憶装置中にキャッシ
ュする目的にも適用可能であることは明らかである。

【０１０１】本実施例の変形として、ＷＷＷデータのキ
ャッシングだけでなく、データのプリフェッチも行なう
プロキシキャッシュ装置に、第一の実施の形態を適用し
た場合について説明する。

【０１０２】本実施例を示した図１０において、データ
グループＨを管理する部分キャッシュ管理部３０４−１
をキャッシュされたデータの管理に、データグループＬ
を管理する部分キャッシュ管理部３０４−２をプリフェ
ッチされたデータの管理に用いる。データグループ決定
手段３０８は、プリフェッチされたデータに対してはデ
ータグループＬを割り当て、データグループＬ中にキャ
ッシュされているデータがアクセスされた場合、そのデ
ータをデータグループＬからデータグループＨに移す。
また、何れのデータグループの優先度割り当て手段３０
５−１，３０５−２も、ＬＲＵに従って優先度を割り当
てる。

【０１０３】ヒット率推定手段３１０は、第三の実施例
と同様に、データグループＬのヒット率の推定値ＳＬ＝
｜Ｌ｜／（Ｓ＋ａ）と、データグループＨのヒット率の
推定値ＳＨ＝｜Ｈ｜／（Ｔ＋ａ）とを求める。最低優先
度決定手段３０９は、図４のステップＢ４に於いて、ヒ
ット率推定手段３１０が算出したヒット率の推定値Ｓ
Ｌ，ＳＨを比較する。そして、ＳＬ≧ＳＨであれば、デ
ータグループＨの優先度の方が高いと判断し、データを
パージするデータグループをデータグループＬに決定す
る。ＳＬ＜ＳＨであれば、データグループＬの方が優先
度が高いと判断し、データをパージするデータグループ
をデータグループＨに決定する。

【０１０４】本実施例のキャッシュ方式と、プリフェッ
チされたデータを扱う本実施例の変形例は、容易に組み
合わせることが可能である。まず、プリフェッチされた
データからなるデータグループＰと、キャッシュされた
後一度もアクセスされていないデータグループＬ、キャ
ッシュされた後一度以上アクセスされたデータグループ
Ｈを作り、各データグループをＬＲＵでキャッシュす
る。また、Ｐに属するデータがアクセスされると、その
データはＬに、Ｌに属するデータがアクセスされると、
そのデータはＨに移される。データグループＨに属する
データで、Ｈに移ってから一度以上アクセスされたデー
タの数Ｔと、データグループＬからデータグループＨへ
と移ってからアクセスされたことがないデータの数Ｓ、
データグループＬに属するデータで、データグループＰ
から移されたデータの数Ｖ、データグループＬにキャッ
シュされたデータの数Ｘを管理する。最低優先度決定手
段３０９は、上記Ｔ、Ｓ、Ｖ、Ｘを用いて、｜Ｐ｜／
Ｖ、｜Ｌ｜／Ｓ、｜Ｈ｜／Ｔのうち、｜Ｐ｜／Ｖが最大
値であればＰの、｜Ｌ｜／Ｓが最大値であればＬの、｜
Ｈ｜／Ｔが最大値であればＨの中で最低の優先度を持つ
データをパージする。

【０１０５】さらに、異なるヒット率の推定方法につい
て述べる。ｔ回目のリクエストを受け付けた時のデータ
グループｉに対してh(t,i)を、ｃを０より大きく１未満
の定数として、h(t,i)=ch(t-1,i)+(1-c)Δ(t) と定義す
る。ただし、ｉはデータグループであり、Δ(t) は、t
回目のリクエストがデータグループｉに属するデータに
対するものであれば１、そうでなければ０を取る。そし
て、ｔ回目のリクエストを受けた時のデータグループｉ
のデータサイズをs(t,i)とし、h(t,i)/s(t,i)をヒット
率とする。ヒット率が最小であるデータグループの部分
最低優先度データが最低優先度データとみなされ、パー
ジされる。

【０１０６】また、第一の実施例で述べたデータグルー
プＸ、Ｙに対して上記同様、ヒット率をh(t,i)/s(t,i)
と推定し、最小のh(t,i)/s(t,i) を持つデータグループ
の部分最低優先度データをパージする方法が、容易に類
推できる。

【０１０７】次に、第一の実施の形態の第四の実施例を
述べる。

【０１０８】本実施例は、HTML(Hyper Text Markup Lan
guage)で記述されたWeb ページ(HTML 文書) 、およびそ
れらのページに埋め込まれている画像、音声、音楽、動
画、映像、あるいはJavaなどのプログラミング言語で記
述されたプログラムなどのWeb オブジェクトを管理する
キャッシュ装置に、第一の実施の形態を適用したもので
ある。

【０１０９】HTML文書においては、他のHTML文書、もし
くはWeb オブジェクトとの論理的な関連をつけるために
「リンク」が用いられている。例えば、「<a href = UR
L>アンカー </a> 」という記述を用いることで、あるHT
ML文書中の「アンカー」という部分と、URL という識別
子で示される Webオブジェクトとを関連づけることがで
きる。

【０１１０】一つのHTML文書中にたくさんのリンクを持
つ Webページというものは、例えばディレクトリ型検索
システムのように、多くの Webページを主題別に分類
し、また分類をおおまかな大分類から詳細な小分類へと
階層的に行なうことで利用者への便宜をはかるようなシ
ステムで良く見られることがある。あるいは、ニュース
を提供するシステムのように、ニュース記事そのものを
含むのではなく、個別ニュースへのリンクをジャンルご
とにまとめあげ、一つの Webページ内にニュース記事の
見出しを見やすく配置するような場合にも、一つの HTM
L 文書中に多くのリンクを含むこととなる。すなわち、
多くの情報を分類・整理することによって、そのWeb ペ
ージ自体の価値が重要視されるようなWeb ページは、一
般に他のWeb ページへのリンクを多く含むこととなって
いる。以下、このような Webページのことを「インデッ
クスページ」と呼ぶ。

【０１１１】逆に、事件・事故などを詳細に解説したニ
ュースそのもののWeb ページや、なんらかの技術に関す
る解説記事、あるいはエッセイ・日記などのように、他
の Webページへのリンクをほとんど含まない HTML 文書
というものも存在する。このような Webページを以下で
は「アーティクルページ」と呼ぶ。

【０１１２】そこで、データグループ決定手段２２で
は、HTML文書のこのような構造を利用し、HTML文書中に
含まれているリンクの数を用いてデータグループを決定
する（図４，ステップＢ１）。すなわち、HTML文書中に
含まれる「<a href=...>・・・</a> 」というリンク部
分を検出し、その数が定められた数以上であればインデ
ックスページに、そうでなければアーティクルページ
に、その文書をグループ分けする。一般に、ユーザが W
ebページを参照する時には、最初にインデックスページ
を参照し、そのページ内のリンクを用いて、続いてアー
ティクルページを参照し、場合によってはそのアーティ
クルページからもう一度先ほどのインデックスページを
参照し、別のアーティクルページを参照するというよう
な動作を行なうことが多い。すなわち、ユーザはインデ
ックスページを基準とし、そこからリンクされている幾
つかのアーティクルページを参照するという行為を繰り
返している。この結果として、インデックスページの参
照回数が、アーティクルページの参照回数に比べて多く
なっている。図１１に、インデックスページ４００−１
から、インデックスページ４００−２、アーティクルペ
ージ４００−３、アーティクルページ４００−４…と参
照し、Web ページ４００−ｋまで参照する例を示した。

【０１１３】これまでに提案されている従来のキャッシ
ュ管理手法においては、上記で述べたようなインデック
スページやアーティクルページが持つ意味合いをまった
く考慮しておらず、キャッシュを有効に活用することが
できていなかった。

【０１１４】本実施例においては、データグループ決定
手段２２において、Web ページ中のリンク数を検出する
ことで、そのページがインデックスページであるかアー
ティクルページであるかを判断する。キャッシュ判定部
１３には、インデックスページ用とアーティクルページ
用の部分キャッシュ管理部２１−１，２１−２が用意さ
れており、インデックスページもしくはアーティクルペ
ージは、それぞれ対応する部分キャッシュ管理部におい
て、それぞれ個別のキャッシングアルゴリズムを用いて
管理される。キャッシングアルゴリズムとしては、参照
回数や最終参照時刻を用いた優先順位に基づく管理方式
を採用する。例えば、一般に知られているＬＦＵ(Least
Frequently Used) アルゴリズムでは、参照回数を優先
度として採用しており、参照回数の最も小さなものが置
換え対象となる。またＬＲＵ(Least Recently Used) ア
ルゴリズムでは、「１／（現在時刻−最終参照時刻）」
が優先度に相当し、最終参照時刻が最も古いもの、すな
わち「１／（現在時刻−最終参照時刻）」の値が最も小
さなものが置換え対象となる。また、ＬＲＵとＬＦＵの
中間の性質を持つキャッシングアルゴリズムとしては、
０＜ｐ＜１なる定数ｐを用いてｐ＊参照回数＋（１−
ｐ）＊１／（現在時刻−最終参照時刻）という式から算
出される値を、優先順位とする方式も考えられる。

【０１１５】各部分キャッシュ管理部２１−１，２１−
２内の部分最低優先度決定手段３２においては、上記の
キャッシングアルゴリズムを用いてWeb ページを管理
し、最低の優先度を持つWeb ページを置換えの候補とす
る。

【０１１６】最低優先度決定手段２３は、ステップＢ４
に於いて、インデックスページとアーティクルページと
の内の、どちらを置換え対象とするかを評価式に基づき
決定する。

【０１１７】例えば、評価値をＶ＝１／（現在時刻−最
終アクセス時刻) と定義し、インデックスページの評価
値Ｖｉとアーティクルページの評価値Ｖａのうち、小さ
な方を真の置換え対象と決定することができる。

【０１１８】あるいは正の定数αを用いて、 Vi とα *
Va との値の比較を行ない、小さな方を真の置換え対象
と決定する方式も考えられる。α≧１の場合には、アー
ティクルページの方をインデックスページよりも長期間
キャッシュに保存することができ、逆にα＜１の場合に
はインデックスページの方をアーティクルページよりも
長期間キャッシュに保存することができる。

【０１１９】置き換えの対象とされたページを管理して
いる部分キャッシュ管理部２１−ｉ内のデータ操作手段
３３は、ステップＢ５に於いて、自管理部２１−ｉ内の
部分最低優先度決定手段３２によって置き換え候補とさ
れた最低優先度を持つデータをパージする。

【０１２０】データグループ決定手段２２における分類
方法として、上記実施例においてはリンク数に基づく分
類方法のみを説明したが、これ以外にも埋め込みオブジ
ェクトの数を考慮した分類を行なうこともできる。例え
ば、HTML文書では「<IMG SRC=...> 」という記述を用い
て、画像、音声、音楽、動画などを文書中に埋め込むこ
とができるので、文書中にある<IMG SRC=...> というタ
グを解析し、埋め込みオブジェクトの数を算出すること
ができる。そこで、ある HTML 文書中のリンク数と埋め
込みオブジェクトの数とを用いて、HTMLページをインデ
ックスページとアーティクルページとに分類することが
できる。

【０１２１】あるいは、埋め込みオブジェクト自体には
HTML 文書とは別の参照特性があると考えて、インデッ
クスページ、アーティクルページ、そして埋め込みオブ
ジェクトのように分類を３種類にすることもできる。い
ずれの場合においても、データグループ決定手段２２を
除く本発明の構成要素は、上記実施例で述べた方法が素
直に適用できることは明らかである。

【０１２２】本実施例においては、Web ページ中の HTM
L タグを用いながら、Web ページをインデックスページ
とアーティクルページ、あるいは埋め込みオブジェクト
というように、その論理的な意味にもとづく分類を行な
い、かつそれぞれのページを独立なキャッシングアルゴ
リズムで管理し、更に最終的な置換え対象を決定する際
には、現在時刻と最終参照時刻とを用いて、最も参照さ
れていない Webページを置換え対象としている。すなわ
ち、Web ページの論理構造を重視した上で、今までに知
られている優先順位に基づくキャッシングアルゴリズム
が矛盾なく統一的に動作する構成となっている。

【０１２３】尚、本発明の適用範囲は、HTMLで記述され
た Webページ(HTML 文書) および画像、音声、音楽、動
画などの Webオブジェクトに限られるものではない。ハ
イパーリンク構造を持つ文書や、画像、音声、音楽、動
画、映像を含むマルチメディアデータ、あるいはプログ
ラムを対象とするキャッシュ一般にも適用可能であるこ
ともまた明らかである。また、第四の実施例は、第二の
実施の形態にも適用できる。

【０１２４】

【発明の効果】第一の効果は、キャッシュヒット率の向
上である。その理由は、データ毎に異なるキャッシング
アルゴリズムを適用できるので、データ毎のアクセス特
性を反映したキャッシングができるためである。また、
データグループ毎にデータ記憶領域を固定的に割り当て
る必要がないため、各データグループ毎に独自のキャッ
シングアルゴリズムを用いているにも関わらず、データ
記憶領域を有効に活用でき、このこともキャッシュヒッ
ト率向上に寄与している。

【０１２５】第二の効果は、軽いキャッシュ処理のコス
トである。その理由は、第三の実施例で述べた通り、本
発明ではＯ（１）で高いキャッシュヒット率を達成でき
るためである。

【０１２６】第三の効果は、Web ページの論理構造を重
視した上で、今までに知られている優先順位に基づくキ
ャッシングアルゴリズムを矛盾なく統一的に動作させら
れる点である。その理由は、第四の実施例で述べた通
り、本発明ではハイパーリンク構造をキャッシュ処理時
に考慮できるからである。

【図面の簡単な説明】

【図１】プロキシキャッシュ装置を使用したネットワー
クシステムの一例を示す図である。

【図２】本発明の第一の実施の形態に係るキャッシュ装
置１０の構成例を示すブロック図である。

【図３】キャッシュ装置１０内のキャッシュ判定部及び
キャッシュ記憶部の構成例を示すブロック図である。

【図４】第一の実施の形態の処理例を示す流れ図であ
る。

【図５】本発明の第二の実施の形態に係るキャッシュ判
定部１３ａ及びキャッシュ記憶部の構成例を示すブロッ
ク図である。

【図６】第二の実施の形態の処理例を示す流れ図であ
る。

【図７】第一の実施の形態の第一の実施例を説明するた
めのブロック図である。

【図８】第一の実施の形態の第二の実施例を説明するた
めのブロック図である。

【図９】図８に示した第二の実施例を説明するための図
である。

【図１０】第一の実施の形態の第三の実施例を説明する
ためのブロック図である。

【図１１】第一の実施の形態の第四の実施例を説明する
ための図である。

【符号の説明】

１−１〜１−ｍ…サーバ２−１〜２−ｎ…クライアント３…ネットワーク４…プロキシキャッシュ装置１０…キャッシュ装置１１…リクエスト処理部１２…キャッシュ検索部１３…キャッシュ判定部１４…キャッシュ記憶部２１−１〜２１−ｎ…部分キャッシュ管理部２２…データグループ決定手段２３…最低優先度決定手段２４…空き記憶領域２５−１〜２５−ｍ…データ３１…優先度割り当て手段３２…部分最低優先度決定手段３３…データ操作手段１３ａ…キャッシュ判定部２６−１〜２６−ｎ…部分キャッシュ管理部３４…サイズ測定手段３５…ヒット率測定手段１０１…演算装置１０２…主記憶装置１０３…二次記憶装置１０４…キャッシュ記憶部１０Ｐ…キャッシュ装置用プログラム２００…キャッシュ装置２０１…リクエスト処理部２０２…キャッシュ検索部２０３…キャッシュ判定部２０４−１，２０４−２…部分キャッシュ管理部２０５−１，２０５−２…優先度割り当て手段２０６−１，２０６−２…部分最低優先度決定手段２０７−１，２０７−２…データ操作手段２０８…最低優先度決定手段２０９…データグループ決定手段２１０…主記憶装置２１１…キャッシュ記憶部２２０…二次記憶装置３００…キャッシュ装置３０１…リクエスト処理部３０２…キャッシュ検索部３０３…キャッシュ判定部３０４−１，３０４−２…部分キャッシュ管理部３０５−１，３０５−２…優先度割り当て手段３０６−１，３０６−２…部分最低優先度決定手段３０７−１，３０７−２…データ操作手段３０８…データグループ決定手段３０９…最低優先度決定手段３１０…ヒット率推定手段３１１…サイズ管理手段３１２…個数管理手段３１３…演算手段３１４…キャッシュ記憶部４００−１〜４００−ｋ…Web ページ

───────────────────────────────────────────────────── フロントページの続き (72)発明者立川江介東京都港区芝五丁目７番１号日本電気株式会社内Ｆターム(参考） 5B005 JJ13 KK02 LL11 MM04 MM11 QQ04 VV02 5B082 HA02 HA08

Claims

【特許請求の範囲】

【請求項１】キャッシュ記憶部にキャッシュされてい
る複数のデータを、アクセスパターンが異なるデータ系
列毎のグループにグループ分けすると共に、各グループ
毎にそれぞれ独立したキャッシングアルゴリズムで自グ
ループに属するデータに優先度を割り当て、前記キャッシュ記憶部からデータをパージすることが必
要になった場合、予め定められている評価規則によって
決まる最低優先度のグループ中の、そのグループのキャ
ッシングアルゴリズムによって最低優先度が割り当てら
れているデータをパージすることを特徴とするキャッシ
ュ制御方法。
【請求項２】リクエストされたデータを分割してでき
る分割データをキャッシュ管理の単位として扱い、前記複数の分割データを、アクセス時刻を予想すること
ができるグループと、アクセス時刻を予想することがで
きないグループとにグループ分けすると共に、各グルー
プ毎にそれぞれ独立したキャッシングアルゴリズムで自
グループに属する分割データに優先度を割り当て、前記キャッシュ記憶部から分割データをパージすること
が必要になった場合、予め定められている評価規則によ
って決まる最低優先度のグループ中の、そのグループの
キャッシングアルゴリズムによって最低優先度が割り当
てられている分割データをパージすることを特徴とする
キャッシュ制御方法。
【請求項３】請求項１記載のキャッシュ制御方法に於
いて、アクセス回数の差が大きい複数のデータ系列を扱い、前
記キャッシュ記憶部にキャッシュされているデータをデ
ータ系列毎にグループ化し、各グループで最低優先度を
持つデータ同士をＬＲＵで比較することにより最低優先
度のグループを決定することを特徴とするキャッシュ制
御方法。
【請求項４】請求項３記載のキャッシュ制御方法に於
いて、前記複数のデータ系列が、ディレクトリデータとファイ
ルデータであることを特徴とするキャッシュ制御方法。
【請求項５】請求項１記載のキャッシュ制御方法に於
いて、前記各グループのキャッシュヒット率を推定し、各グループのキャッシュヒット率の推定値に基づいて、
最低優先度を持つグループを決定することを特徴とする
キャッシュ制御方法。
【請求項６】請求項５記載のキャッシュ制御方法に於
いて、前記各グループのヒット率を、そのグループが占める記
憶領域のサイズと、そのグループに於いて１回以上アク
セスされたことのあるデータの数とに基づいて推定する
ことを特徴とするキャッシュ制御方法。
【請求項７】請求項１記載のキャッシュ制御方法に於
いて、データをグループ分けする際、データのハイパーリンク
構造に基づいてグループ分けすることを特徴とするキャ
ッシュ制御方法。
【請求項８】キャッシュ記憶部にキャッシュされてい
る複数のデータを、アクセスパターンが異なるデータ系
列毎のグループにグループ分けすると共に、各グループ
毎にそれぞれ独立したキャッシングアルゴリズムで自グ
ループに属するデータに優先度を割り当て、前記キャッシュ記憶部からデータをパージすることが必
要になった場合、予め定められている評価規則によって
決まる最低優先度のグループ中の、そのグループのキャ
ッシングアルゴリズムによって最低優先度が割り当てら
れているデータをパージする構成を有することを特徴と
するキャッシュ装置。
【請求項９】リクエストされたデータを分割してでき
る分割データをキャッシュ管理の単位として扱い、前記複数の分割データを、アクセス時刻を予想すること
ができるグループと、アクセス時刻を予想することがで
きないグループとにグループ分けすると共に、各グルー
プ毎にそれぞれ独立したキャッシングアルゴリズムで自
グループに属する分割データに優先度を割り当て、前記キャッシュ記憶部から分割データをパージすること
が必要になった場合、予め定められている評価規則によ
って決まる最低優先度のグループ中の、そのグループの
キャッシングアルゴリズムによって最低優先度が割り当
てられている分割データをパージする構成を有すること
を特徴とするキャッシュ装置。
【請求項１０】請求項８記載のキャッシュ装置に於い
て、前記キャッシュ記憶部にキャッシュされているデータ
を、アクセスパターンが異なるデータ系列毎のグループ
にグループ分けするデータグループ決定手段と、前記各グループ毎に設けられ、それぞれが独自のキャッ
シングアルゴリズムで対応するグループに属するデータ
に優先度を割り当てる優先度割り当て手段と、前記キャッシュ記憶部からデータをパージすることが必
要になった場合、予め定められている評価規則に従っ
て、最低優先度のグループを決定する最低優先度決定手
段と、該最低優先度決定手段で決定された最低優先度のグルー
プ中の、最低優先度のデータをパージするデータ操作手
段とを備えたことを特徴とするキャッシュ装置。
【請求項１１】請求項１０記載のキャッシュ装置に於
いて、前記データグループ決定手段が、前記キャッシュ記憶部
にキャッシュされているデータを、アクセス回数の差が
大きい複数のデータ系列毎にグループ分けする構成を有
し、前記各優先度割り当て手段が、自手段で管理している各
データにＬＲＵに従った優先度を割り当てる構成を有
し、前記最低優先度決定手段が、前記各グループで最低優先
度を持つデータの優先度に基づいて、最低優先度のグル
ープを決定する構成を有することを特徴とするキャッシ
ュ装置。
【請求項１２】請求項１１のキャッシュ装置に於い
て、前記データグループ決定手段が、前記キャッシュ記憶部
にキャッシュされているデータを、ディレクトリデータ
とファイルデータとにグループ分けする構成を有するこ
とを特徴とするキャッシュ装置。
【請求項１３】請求項１０記載のキャッシュ装置に於
いて、前記各グループのヒット率を推定するヒット率推定手段
を備え、且つ、前記最低優先度決定手段が、前記ヒット率推定手段が推
定した各グループのヒット率に基づいて、最低優先度の
グループを決定する構成を有することを特徴とするキャ
ッシュ装置。
【請求項１４】請求項１３記載のキャッシュ装置に於
いて、前記ヒット率推定手段が、前記各グループのヒット率
を、そのグループが占める記憶領域のサイズと、そのグ
ループに於いて１回以上アクセスされたことのあるデー
タの数とに基づいて推定する構成を有することを特徴と
するキャッシュ装置。
【請求項１５】請求項１０記載のキャッシュ装置に於
いて、前記データグループ決定手段が、データのハイパーリン
ク構造に基づいてグループ分けする構成を有することを
特徴とするキャッシュ装置。
【請求項１６】Ｗｅｂデータをキャッシュするプロキ
シキャッシュ装置として機能することを特徴とする請求
項８乃至１５記載の何れか１つのキャッシュ装置。
【請求項１７】ディスクデータをキャッシュするディ
スクキャッシュ装置として機能することを特徴とする請
求項８乃至１５記載の何れか１つのキャッシュ装置。