JPH1115707A - キャッシュを用いたデータ取得装置及び記録媒体 - Google Patents

キャッシュを用いたデータ取得装置及び記録媒体

Info

Publication number
JPH1115707A
JPH1115707A JP9167719A JP16771997A JPH1115707A JP H1115707 A JPH1115707 A JP H1115707A JP 9167719 A JP9167719 A JP 9167719A JP 16771997 A JP16771997 A JP 16771997A JP H1115707 A JPH1115707 A JP H1115707A
Authority
JP
Japan
Prior art keywords
data
cache
acquisition
cost
request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9167719A
Other languages
English (en)
Inventor
Yuji Ishikawa
裕治 石川
Masanori Tanabe
雅則 田辺
Satoshi Hakomori
聰 箱守
Ushio Inoue
潮 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA KK
NTT Data Group Corp
Original Assignee
N T T DATA KK
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA KK, NTT Data Corp filed Critical N T T DATA KK
Priority to JP9167719A priority Critical patent/JPH1115707A/ja
Publication of JPH1115707A publication Critical patent/JPH1115707A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 データ取得の際のコストを低減させるデータ
取得装置を提供する。 【解決手段】 放送方式またはオンデマンド方式で取得
したデータを共通にキャッシュするためのキャッシュ領
域15と、キャッシュされたデータをリストアップした
キャッシュデータリスト14と、キャッシュデータ管理
部17を含んでデータ取得装置を構成する。キャッシュ
データ管理部17は、キャッシュ対象となるデータにつ
いて、データ取得コストとアクセス確率とからデータ入
手コストを算出し、該データ入手コストが大きくなる順
にデータをキャッシュ領域15に保存する。また、保存
したデータの識別情報をキャッシュデータリスト14に
掲載する。統合型データ取得部13は、利用者からのデ
ータ取得要求があったときに、まずキャッシュデータリ
スト14を参照し、該当データの識別情報がない場合の
みサーバ20からデータを取得する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、キャッシュを用い
たデータ取得装置に係り、特に、キャッシュ領域を効率
的に管理してデータ取得に要するコストを低減させる手
法に関する。
【0002】
【従来の技術】複数のコンピュータ装置による分散処理
形態として、キャッシュを用いたクライアント・サーバ
システムが知られている。ここにいうキャッシュとは、
サーバ側のデータの一部をクライアントのキャッシュ領
域に保存しておき、同一データに対するクライアントか
らサーバへのデータ取得処理を軽減させる手法をいう。
このキャッシュを用いることにより、サーバ側からその
都度データを取得する場合に比べて、データを取得する
ためのコストは極めて小さくなる。この場合のコストと
しては、例えば、クライアントとサーバとの間の通信に
要する料金や、クライアントからデータ取得要求をサー
バに発信して当該データを取得するまでの待ち時間等が
挙げられる。
【0003】しかし、クライアントに用意されるキャッ
シュ領域はサーバ側のデータ領域に比べて小さいのが通
常なので、クライアントは、サーバが保存するデータの
ごく一部分しかキャッシュすることが出来ない。また、
クライアント側のキャッシュ領域のサイズと同一サイズ
となる複数のデータがサーバ側に保存されている場合、
いずれか一つのデータしかキャッシュすることが出来な
い。そのため、クライアント側では、サーバ側のデータ
のいずれをキャッシュすることが効果的かを決定する必
要がある。
【0004】以下、この決定手法について説明する。例
えば、データサイズが共に‘1’の2つのデータ
「a」、「b」をサーバから通信回線を介して取得する
場合に必要となるコスト(データ取得コスト)は、デー
タ「a」が‘2’、データ「b」が‘3’、過去の取得
要求の頻度に基づく要求発生確率、すなわちアクセス確
率は、データ「a」が‘0.7’、データ「b」が
‘0.3’とする(最大1.0)。このような条件下で
データ「a」をクライアントにキャッシュした場合、サ
ーバから直接取得するデータは「b」のみとなるので、
各データを入手しようとする場合に必要となるコスト
(データ入手コスト)の総和は0.9(=0×0.7+
3×0.3)となる。一方、クライアント側にデータ
「b」をキャッシュした場合、サーバから直接取得する
データは「a」のみとなるので、データ入手コストの総
和は1.4(=2×0.7+0×0.3)となる。従っ
て、上記の条件の場合は、データ「a」をキャッシュし
た方が全体のコストを小さくすることができるので、ク
ライアント側では、データ「a」をキャッシュすべきデ
ータ(キャッシュ候補データ)として決定する。
【0005】なお、キャッシュを行わない場合のデータ
入手コストの総和は2.3(=2×0.7+3×0.
3)となるので、データ「a」をキャッシュすることに
より、全体のコストを1.4(=2.3−0.9)だけ
低減することがわかる。また、データ入手コストはデー
タ取得コストとアクセス確率との積であることから、デ
ータ取得コストとアクセス確率の少なくとも一方が高い
データをキャッシュする方がコスト低減効果が大きいと
いう結果が導かれる。アクセス確率については、例え
ば、公知の LRU(Least Resently Used)方式が用い
られる。このLRU方式は、最終アクセスからの経過時
間が長いほどアクセス確率が小さいと仮定する方式であ
る。換言すれば、アクセス確率が小さいデータについて
はキャッシュする必要性が相対的に小さいことを意味す
る。
【0006】上記キャッシュを用いたクライアント・サ
ーバシステムは、例えばオンデマンド方式、放送方式、
あるいは、放送・オンデマンド統合型方式によって利用
者にデータを提示するデータ提示システムに応用するこ
とができる。以下、各方式によるデータ提示システムに
ついて簡単に説明する。
【0007】図6は、オンデマンド方式によるデータ提
示システムの機能ブロック図である。このデータ提示シ
ステムは、サーバ20とクライアント10とをネットワ
ーク等の通信回線を介して双方向通信可能な形態で接続
し、利用者が操作するクライアント10をサーバ20か
らのデータ取得装置として機能させることにより、利用
者が要求したデータを提示する。このシステムの動作は
下記のようになる。
【0008】クライアント10の要求受付部11が利用
者からのデータ取得要求を受け付けると、オンデマンド
データ取得部16は、キャッシュ領域15Aに保存され
たデータの識別情報がキャッシュデータリスト14Aに
掲載されているかどうかを探索する。掲載されているこ
とを確認した場合は、キャッシュ領域15Aから該当デ
ータを取得する。一方、キャッシュデータリスト14A
に該当データの識別情報が掲載されていない場合は、要
求送信部18及び要求通信路を通じてサーバ20に対し
て取得要求を送信し、オンデマンド通信路を通じて該当
データを取得する。オンデマンドデータ取得部16は、
取得したデータを結果表示部12を通じて利用者に提示
するとともに、サーバ20から取得されたデータについ
てはキャッシュデータ管理部50Aにも送る。
【0009】キャッシュデータ管理部50Aは、サーバ
20から取得したデータをキャッシュするかどうかを決
定する。キャッシュする場合は、キャッシュ領域15A
に当該データ用の保存領域を確保し、キャッシュ更新部
51Aでキャッシュ領域15Aとキャッシュデータリス
ト14Aの内容を更新する。なお、キャッシュ領域15
Aがフル状態の場合に新たにキャッシュすべきデータが
ある場合は、そのデータ用の保存領域を確保するために
過去にキャッシュしたデータのいずれかを削除する必要
がある。この場合は、キャッシュに先立ち、キャッシュ
領域15Aに既に存在するどのデータを削除するかを決
定する。
【0010】この決定は、前述のデータ入手コスト(デ
ータ取得コスト×アクセス確率)に基づき、以下のよう
にして行われる。クライアント10からサーバ20に発
信するデータ取得要求のサイズを一定のサイズs、サー
バ20から受信したデータのサイズをs’、オンデマン
ド方式の通信速度をβa、データ取得コストをクライア
ント10がサーバ20からデータを取得するために要す
る待ち時間で表すとすると、この場合のデータ取得コス
トConは、以下に示す計算式により算出することができ
る。 Con=(s+s’)/βa・・・(1)
【0011】次に、放送方式によるデータ提示システム
について説明する。図7はこの方式によるデータ提示シ
ステムの機能ブロック図である。便宜上、図6に示した
オンデマンド方式のデータ提示システムと同様の機能の
ものについては同一符号を付し、サフィックスのみを変
えてある。この放送方式と上記オンデマンド方式との相
違点はデータ取得方法にある。すなわち、放送方式で
は、データがキャッシュ15Bに存在しない場合、サー
バ20から該当するデータが放送されるまで待ち、放送
された場合に放送データ取得部19が放送通信路から該
当データを取得する。この場合、キャッシュデータ管理
部50Bによるコストの計算は、以下のようにして行わ
れる。
【0012】放送方式では、データを一定周期でサーバ
20からクライアント10に対して一方的に放送する動
作が基本であり、クライアント10でのデータ取得要求
の有無は関係ない。そのため、取得したいデータが放送
されるまで待つ時間は、放送データ(放送により得たデ
ータ)へのアクセス開始のタイミングによっても異なる
が、平均すると放送周期Tの略半分となる。また、放送
データの通信速度をβb、取得するデータのサイズをs
とすると、放送データからの該当データの取得に要する
時間はs/βbとなる。このことから、放送方式におけ
るデータ取得コストCbrは、以下に示す計算式により算
出することができる。 Cbr=T/2+s/βb ・・・(2)
【0013】なお、放送方式によるデータ提示システム
を提案している文献として、“David Gifford et. al.,
The Application of Digital Broadcast Communicatio
n toLarge Scale Information Systems, IEEE Journal
on selected areas in communications, Vol 3, pp.457
-467, May 1985.”が知られており、また、放送方式の
データ提示システムにおける保存データの選択方式を提
案している文献としては、“S.Acharya, R.Alonso, M.F
ranklin and S.Zdonik, Broadcast Disks: Data Manage
ment for Asymmetric Communication Environments, Pr
oc. fo 1995 ACM SIGMOD Conf., pp.199-210, Jun. 199
5.”が知られている。
【0014】次に、放送・オンデマンド統合型方式によ
るデータ提示システムについて説明する。図8はこのデ
ータ提示システムの機能ブロック図であり、便宜上、上
記オンデマンド方式、放送方式のシステムと同一機能の
ものについては同一符号を付してある。この方式のデー
タ提示システムでは、サーバ20からクライアント10
方向にオンデマンド通信路と放送通信路とが形成されて
いる。また、データ取得及び利用者へのデータ提示をオ
ンデマンド方式と放送方式のいずれかによって行うかを
選択する取得方式選択部132をクライアント10側に
備えている。
【0015】取得方式選択部133は、利用者からのデ
ータ取得要求を要求受付部11で受け付けると、要求さ
れているデータをオンデマンド方式かまたは放送方式か
どちらの提示方式を用いて取得すべきかを選択する。オ
ンデマンド方式が選択された場合、利用者からのデータ
取得要求は、オンデマンドデータ取得部16と要求送信
部18に渡される。要求送信部18は当該データ取得要
求をサーバ20側に送信し、オンデマンドデータ取得部
16は、データ取得要求に対応するデータをオンデマン
ド通信路を通じて取得する。取得したデータは、取得方
式選択部132とキャッシュデータ管理部50Aに送ら
れ、結果表示部12を通じて利用者に提示するととも
に、キャッシュするかどうかの判定がなされる。一方、
放送方式が選択された場合、利用者からのデータ取得要
求は、放送データ取得部19に渡される。放送データ取
得部19は、データ取得要求に対応するデータをサーバ
20側からの放送データから取得する。取得したデータ
は、取得方式選択部132とキャッシュデータ管理部5
0Bに送られ、結果表示部12を通じて利用者に提示す
るとともに、キャッシュするかどうかの判定がなされ
る。
【0016】この放送・オンデマンド統合型方式が採用
される理由として、まず、オンデマンド方式では、サー
バ20がクライアント10に対してデータ取得要求のあ
ったデータのみを送信し、不要なデータは送信しないで
済むという利点があり、他方、放送方式では、サーバ2
0は、クライアント10のデータ取得要求を受信する必
要がないから限られた通信帯域幅を用いて複数のクライ
アント10に対しデータを提示できるという利点があ
る。これらの方式は相補的な特徴を持つので、2つの方
式を組み合わせることで効率的なデータ提示が可能にな
る。また、取得方式選択部132が最適な取得方式を選
択するので、オンデマンド方式単独、または放送方式単
独の場合に比べてコストが低減する。
【0017】なお、放送・オンデマンド統合型方式に関
する文献には、“T.Imielinski andS.Viswanathan, Ada
ptive Wireless Information Systems, Proc. of SIGDB
S Conf., pp.19-41, Oct. 1994. ”が知られている。
【0018】
【発明が解決しようとする課題】上述のように、放送・
オンデマンド統合型方式のデータ提示システムは、オン
デマンド方式単独、あるいは放送方式単独のデータ提示
システムに比べて、よりコスト低減が図れる利点があ
る。しかし、従来のようなデータ取得手法をそのまま放
送・オンデマンド統合型方式のデータ提示システムに適
用すると以下に示すような問題が生じる。 (1)取得方式選択部132がキャッシュデータリスト
14A,14Bを参照できないため、オンデマンド方式
かまたは放送方式かの一方の方式で取得要求されるデー
タが、既にいずれかのキャッシュ領域15A,15Bに
既に保存されているにもかかわらず、データ取得方式と
して他方の方式を選択し、サーバからのデータを取得し
てしまう場合がある。この場合は無駄なコストが発生す
る。 (2)オンデマンド方式及び放送方式の2つの方式で、
別々に同一データを取得した場合には、同一データが双
方のキャッシュ領域に保存されてしまう。 (3)一方のデータ提示方式でデータ取得コスト及びア
クセス確率の高いデータを、当該方式のキャッシュ領域
以上多く取得した場合に、他方のキャッシュ領域を利用
して保存することができないため、キャッシュ領域の利
用効率が悪い。
【0019】このような問題は、上記データ提示システ
ムのほか、異なる伝送方式で伝送される複数のデータの
いずれかの取得要求を受け付け、その取得要求に対応す
るデータをキャッシュ領域、あるいは該当の伝送方式に
より取得して取得要求先に提示するシステムに共通に生
じる。
【0020】そこで本発明の課題は、例えば上述のよう
な放送・オンデマンド統合型方式のデータ提示システム
のようなシステムにおいてキャッシュ領域をより効率的
に使用することができ、且つデータ取得に伴うコスト低
減効果をより顕著にすることができる改良されたデータ
取得装置を提供することにある。本発明の他の課題は、
上記データ取得装置を汎用のコンピュータ装置で実現す
るための記録媒体を提供することにある。
【0021】
【課題を解決するための手段】上記課題を解決する本発
明のデータ取得装置は、取得要求に応じてそれぞれ異な
る伝送方式で伝送された複数のデータのいずれかを伝送
方式にかかわらず共通にキャッシュするためのキャッシ
ュ領域と、前記複数のデータの各々について、データ取
得コストと過去の前記取得要求の頻度に基づく要求発生
確率とをパラメータとするデータ入手コストを算出し、
該データ入手コストが大きくなる順にキャッシュ候補デ
ータを決定して前記キャッシュ領域に保存するキャッシ
ュデータ管理手段とを有することを特徴とする。
【0022】本発明の他のデータ取得装置は、それぞれ
異なる伝送方式で伝送される複数のデータのいずれかの
取得要求を統合的に受け付けるとともに、該取得要求に
対応するデータを取得して前記取得要求先に提示するデ
ータ提示手段と、既に取得した前記複数のデータのいず
れかを伝送方式にかかわらず共通にキャッシュするため
のキャッシュ領域と、前記複数のデータの各々につい
て、データ取得コストと過去の前記取得要求の頻度に基
づく要求発生確率とをパラメータとするデータ入手コス
トを算出し、該データ入手コストが大きくなる順にキャ
ッシュ候補データを決定して前記キャッシュ領域に保存
するとともに、保存したデータの識別情報を所定のリス
トに掲載するキャッシュ管理手段と、を備え、前記デー
タ提示手段が、前記取得要求の受付を契機に該当データ
の識別情報が前記リストに掲載されているかどうかを探
索し、掲載されていない場合に、前記取得要求に応じた
伝送方式で該当データを取得するように構成されること
を特徴とする。
【0023】上記各データ取得装置において、前記キャ
ッシュ管理手段は、キャッシュ候補データの保存領域が
確保できない場合に、前記キャッシュ領域に既に保存さ
れているデータのうち前記データ入手コストが当該キャ
ッシュ候補データよりも小さいデータを優先的に削除し
て当該キャッシュ候補データとおき替えるように構成さ
れる。
【0024】また、前記データ提示手段は、前記リスト
において前記取得要求に対応するデータの識別情報を検
出した場合に前記キャッシュ領域から当該データを取得
して前記取得要求先に提示するように構成される。
【0025】上記他の課題を解決する記録媒体は、キャ
ッシュ領域を具備したコンピュータ装置をデータ取得装
置として機能させるプログラムを前記コンピュータ装置
が読み取り可能な形態で記録して成る記録媒体であっ
て、前記プログラムが少なくとも下記の処理を前記コン
ピュータ装置に実行させるものである。 (1)それぞれ異なる伝送方式で伝送される複数のデー
タのいずれかの取得要求を統合的に受け付ける処理、
(2)既に取得した前記複数のデータの各々について、
データ取得コストと過去の前記取得要求の頻度に基づく
要求発生確率とをパラメータとするデータ入手コストを
算出し、該データ入手コストが大きくなる順にキャッシ
ュ候補データを決定して前記キャッシュ領域に保存する
処理、(3)保存したデータの識別情報を所定のリスト
に掲載する処理、(4)前記受け付けた取得要求に対応
するデータの識別情報が前記リストに掲載されているか
どうかを探索し、掲載されていない場合に、前記取得要
求に応じた伝送方式で該当データを取得する処理。
【0026】
【発明の実施の形態】以下、本発明のデータ取得装置を
放送・オンデマンド統合型のデータ提示システムに適用
した場合の実施の形態を詳細に説明する。図1は、本実
施形態によるデータ提示システムの機能ブロック図であ
り、便宜上、図8に示した従来型システムと同一機能の
部分については同一符号を付してある。なお、図中、実
線はデータの流れ、破線は要求の流れを表す。
【0027】このデータ提示システムでは、サーバ20
とクライアント10は、ネットワーク等の通信回線を介
して双方向通信可能に接続され、特に、サーバ20から
クライアント10へはオンデマンド通信路と放送通信路
とが形成されている。クライアント10は、本発明のデ
ータ取得装置として機能するもので、従来型システムと
同様の要求受付部11、結果表示部12、オンデマンド
データ取得部16、要求送信部18、放送データ取得部
19を備え、さらに、統合型データ取得部13、キャッ
シュデータリスト14、キャッシュ領域15、及びキャ
ッシュデータ管理部17を備えて構成される。
【0028】キャッシュ領域15は、放送方式またはオ
ンデマンド方式で取得したデータを同一のデータ方式で
共通にキャッシュするための領域であり、キャッシュデ
ータリスト14は、キャッシュ領域15に保存したデー
タの識別情報を登録するものである。このようにキャッ
シュ領域15を両方式で共通にすることで、例えば一方
の方式でデータ入手コストの高いデータを多く取得した
場合であっても、それが他方の方式で取得したデータの
データ入手コストよりも大きければキャッシュされるよ
うな使用形態が可能になる。また、キャッシュされるべ
きデータの保存領域を伝送方式によって動的に配分する
ことも可能になる。従って、キャッシュ領域の利用効率
を高めることができ、同時にデータ取得に要する全体の
コストを低減させることができるようになる。なお、キ
ャッシュ領域15のサイズは任意に設定することができ
るが、好ましくは、図8に示した従来型システムにおい
て放送方式とオンデマンド方式で2重に具備したキャッ
シュ領域の合計サイズ以上とする。
【0029】キャッシュデータ管理部17は、キャッシ
ュ領域15及びキャッシュデータリスト14の管理を行
うものである。具体的には、放送方式で取得されるデー
タをキャッシュする場合のコストを算出する放送コスト
計算部172と、オンデマンド方式で取得されるデータ
をキャッシュする場合のコストを算出するオンデマンド
コスト計算部173とを備え、キャッシュした場合にコ
ストができるだけ小さくなるようなデータを、放送方
式、オンデマンド方式の如何にかかわらずキャッシュ候
補データとして選定する。そして、選定したキャッシュ
候補データをキャッシュ更新部171に送り、キャッシ
ュ領域15及びキャッシュデータリスト14を更新させ
る。放送コスト計算部172及びオンデマンド計算部1
73は、それぞれ図8で示した放送コスト計算部52
B、オンデマンドコスト計算部52Aと基本的には同一
機能のものであり、それぞれ前述の式(1)及び式
(2)に基づくコスト算出を行う。本実施形態では、各
コスト計算部172,173に、それぞれの伝送方式に
よるデータ取得コストとアクセス確率とをデータ毎にテ
ーブル化して保存しておき、コスト計算の便宜を図って
いる。
【0030】統合型データ取得部13は、取得要求の受
領時に最初にキャッシュリスト14を探索してキャッシ
ュ領域15からデータが取得可能か否かを判定する機能
を備えた取得方式選択部131と、この取得方式選択部
131からの指示に従ってキャッシュ領域15、あるい
は各部データ取得部16,19のいずれかからデータを
取得するデータ取得部132とを備えて構成される。
【0031】上記各機能ブロック11〜19,131,
132,171〜173は、少なくともキャッシュ領域
を形成するに足りる容量のメモリを備えた汎用のコンピ
ュータ装置が所定のプログラムを読み込んで実行するこ
とにより形成される。このプログラムは、通常、当該コ
ンピュータ装置に内蔵される記憶手段に格納されて使用
されるが、コンピュータ装置とは分離した形態で取り引
きされる記録媒体、例えばCD−ROM等に格納され、
使用時に上記記憶手段にインストールされるものであっ
てもよい。
【0032】次に、本実施形態のデータ提示システムに
おけるデータ取得の手順を図2及び図3を参照して説明
する。利用者からの取得要求(例えばデータ識別情報)
dを受け付けると、要求受付部11は、これを統合型デ
ータ取得部13に渡す。統合型データ取得部13は、こ
の取得要求dを受領すると(ステップS101)、ま
ず、キャッシュ領域15からのデータ取得を試みる。つ
まり、取得方式選択部131でキャッシュデータリスト
14を探索して取得要求dに対応するデータの識別情報
が掲載されているかどうかを調べる(ステップS10
2)。掲載されている場合は(ステップS102:Ye
s)、該当データが存在するので、データ取得部132
に指示を出してキャッシュ領域15から該当するデータ
を取り出し(ステップS103)、そのデータを直ちに
結果表示部12に出力する(ステップS104)。
【0033】一方、ステップS102において、取得要
求dに対応するデータの識別情報が掲載されていなかっ
た場合は(ステップS102:No)、サーバ20から
のデータ取得を行う。すなわち、最適なデータ取得が可
能となる伝送方式(オンデマンド方式/放送方式)を選
択し(ステップS201)、取得要求dをオンデマンド
データ取得部16または放送データ取得部19に送出す
る(ステップS202)。オンデマンドデータ取得部1
6または放送データ取得部19は、この取得要求dをサ
ーバ20に送信して該当データを取得し、取得したデー
タを統合型データ取得部13に渡す。統合型データ取得
部13は、このデータを結果表示部12に出力する(ス
テップS203)。これにより取得要求に対応するデー
タが利用者に提示される。
【0034】オンデマンドデータ取得部16または放送
データ取得部19は、また、取得したデータをキャッシ
ュデータ管理部17にも渡す。キャッシュデータ管理部
17は、取得したデータを含むすべてのキャッシュ対象
データについて再度データ取得コスト及びデータ入手コ
ストを計算し、キャッシュ候補データとなるものについ
てはそれをキャッシュ領域15に保存する。
【0035】キャッシュデータ管理部16(放送コスト
計算部172/オンデマンドコスト計算部173)にお
けるコスト計算方法(再計算方法も同じ)を以下に説明
する。ここでは、便宜上、キャッシュ領域15を、放送
方式から取得したデータとオンデマンド方式から取得し
た4つのデータ(「a」,「b」,「c」,「d」)と
で適切に配分するための各コストの算出例を、図8の従
来型システムの場合と比較しながら説明する。まず、各
コスト算出のために、以下のパラメータを設定する。各
データのアクセス確率Pa,Pb,Pc,Pdは、前述
のLRU方式に基づいて与えられるものとする。
【0036】
【数1】 データの集合 :D={a,b,c,d} アクセス確率 :Pa=0.3、Pb=0.2、: P
c=0.4、Pd=0.1 通信速度 : オンデマンド方式βa=2、放送方
式βb=1 データサイズ :sa=sb=sc=sd=1 要求データサイズ: s=0.6
【0037】(第1例) (条件1) データ「a」とデータ「b」はオンデマン
ド方式で提示され、データ「c」とデータ「d」は放送
方式で提示される。データ「c」の放送周期Tcは
‘1’、データ「d」の放送周期Tdは‘4’とする。
この場合における、各データa〜dのコストCa〜Cd
は、次のようになる。
【0038】
【数2】 Ca=(sa+s)/βa=(1+0.6)/2=0.8 Cb=(sb+s)/βb=(1+0.6)/2=0.8 Cc= Tc/2+sc/βb=1/2+1/1=1.5 Cd= Td/2+sd/βb=4/2+1/1=3
【0039】図4は、各コストの算出結果と上記各パラ
メータの値を示す図表である。以下これらの値を参照し
て説明する。 (従来型システム)従来型システムでは、オンデマンド
方式のキャッシュ領域15Aには、データ「a」または
データ「b」がキャッシュされる。データ「a」をキャ
ッシュした場合に、データ「a」にかかるコストは
‘0’、データ「b」にかかるコストは‘0.8’であ
り、コスト総和は0.16(=0×0.3+0.8×
0.2)となる。一方、データ「b」をキャッシュした
場合は、データ「a」にかかるコストは‘0.8’、デ
ータ「b」にかかるコストは‘0’であり、コスト総和
は0.24(=0.8×0.3+0×0.2)となる。
この結果、データ「a」をキャッシュした方が全体のコ
ストを低く抑えられるので、この例ではデータ「a」が
キャッシュされる。同様の処理により、放送方式に対し
て割り当てられたキャッシュ領域15Bには、データ
「c」がキャッシュされる。さらに、データ「a」とデ
ータ「c」がキャッシュされた場合のコスト総和は0.
46(=0×Pa+Cb×Pb+0×Pc+Cd×P
d)となる。
【0040】(本実施形態のシステム)これに対し、本
実施形態のシステムでは、従来型システムのような2重
のキャッシュ領域を持たないので、上記4つのデータ
「a」〜「d」から2つのデータをキャッシュする。例
えば、データ「a」とデータ「b」をキャッシュした場
合、データ取得の際のコスト総和は以下のようになる。
【0041】
【数3】0×Pa+0×Pb+Cc×Pc+Cd×Pd
【0042】この結果、図4中の‘Pi×Ci’の値が
大きいデータを2つ選択してキャッシュすることで、コ
スト総和を最小にすることが出来る。この条件下では、
データ「c」とデータ「d」がキャッシュ候補データと
して選定される。この場合のコスト総和は、‘0.4’
となる。また、従来型システムと本実施形態のシステム
のコスト総和の差分は0.06(=0.46−0.4)
となるので、本実施形態のシステムの方が‘0.06’
だけ全体のコストを低減させることができる。また、こ
の場合、キャッシュ領域15はすべて放送データのため
に割り当てられることになる。
【0043】(第2例) (条件2) データ「a」、データ「b」、データ
「c」は、オンデマンド方式で提示されている。また、
データ「d」は放送方式で提示され、放送周期Tdは
‘1’である。この場合の各コストの算出結果と上記各
パラメータの値を図5に示す。以下、図5を用いて説明
する。
【0044】(従来型システム)オンデマンド方式に対
して割り当てられたキャッシュ領域15Aに、データ
「a」、データ「b」またはデータ「c」が保存される
余地があるが、上記第1例と同様にしてそれぞれのデー
タをキャッシュした場合についてコストを算出すると、
データ「c」がキャッシュ候補データとして選定され
る。一方、放送方式に対して割り当てられたキャッシュ
領域15Bには、単純にデータ「d」が保存される。つ
まり、キャッシュ領域15A,15Bにはデータ「c」
とデータ「d」とが保存されるので、オンデマンド方式
と放送方式とを統合した場合のコスト総和は、0.4に
なる。
【0045】(本実施形態のシステム)上記第1例と同
様にして、図5から‘Pi×Ci’の値が大きいデータ
を2つ選択する。この例では、データ「a」とデータ
「c」とが選択される。この場合のコスト総和は‘0.
31’となる。従来型システムのコストと本実施形態の
コスト総和の差分は0.09(=0.4−0.31)と
なるので、本実施形態のシステムの方が‘0.09’だ
け全体のコストを低減させることがわかる。また、本実
施形態のシステムでは、キャッシュ領域15は、すべて
オンデマンドデータのために割り当てられることにな
る。
【0046】このように、本実施形態のクライアント1
0は、従来型システムのものよりも少ないコストでデー
タを取得することが可能になる。また、利用者からの取
得要求があったときに、まず、キャッシュ領域15から
データを取得可能かどうかを判定するように構成されて
いるので、該当するデータがキャッシュされているにも
かかわらず、サーバ20側からそのデータを再度取得し
てしまう事態を回避することができる。また、従来、デ
ータ伝送系統分だけ多重に具備していたキャッシュ関連
の機能ブロックを、単一のキャッシュデータリスト1
4、キャッシュ領域15、キャッシュデータ管理部17
に統合して一元的な管理を行うようにしたので、構成が
簡略になる。
【0047】
【発明の効果】以上の説明から明らかなように、本発明
によれば、例えば放送・オンデマンド統合型方式のデー
タ提示システムのように異なる伝送方式でデータ取得を
行うシステムにおいて、限られたサイズのキャッシュ領
域をより効率的に使用することができ、且つデータ取得
に伴うコスト低減効果をより顕著にすることができる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る放送・オンデマンド
統合型データ提示システムの機能ブロック図。
【図2】本実施形態における統合データ取得部の処理手
順図。
【図3】本実施形態における統合データ取得部の処理手
順図。
【図4】第1例における各パラメータの値とコストの計
算結果例を示す図表。
【図5】第2例における各パラメータの値とコストの計
算結果例を示す図表。
【図6】従来のオンデマンド型データ提示システムの実
施形態を示す機能ブロック図。
【図7】従来の放送型データ提示システムの機能ブロッ
ク図。
【図8】従来の放送・オンデマンド統合型データ提示シ
ステムの機能ブロック図。
【符号の説明】
10 クライアント 11 要求受付部 12 結果表示部 13 統合型データ取得部 131 取得方式選択部 132 データ取得部 14、14A、14B キャッシュデータリスト 15、15A、15B キャッシュ領域 16 オンデマンドデータ取得部 17、17A、17B、50A、50B キャッシュデ
ータ管理部 171、171A、171B、51A、51B キャッ
シュ更新部 172、52B 放送コスト計算部 173、52A オンデマンドコスト計算部 18 要求送信部 19 放送データ取得部 20 サーバ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 井上 潮 東京都江東区豊洲三丁目3番3号 エヌ・ ティ・ティ・データ通信株式会社内

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 取得要求に応じてそれぞれ異なる伝送方
    式で伝送された複数のデータのいずれかを伝送方式にか
    かわらず共通にキャッシュするためのキャッシュ領域
    と、 前記複数のデータの各々について、データ取得コストと
    過去の前記取得要求の頻度に基づく要求発生確率とをパ
    ラメータとするデータ入手コストを算出し、該データ入
    手コストが大きくなる順にキャッシュ候補データを決定
    して前記キャッシュ領域に保存するキャッシュデータ管
    理手段とを有することを特徴とする、キャッシュを用い
    たデータ取得装置。
  2. 【請求項2】 それぞれ異なる伝送方式で伝送される複
    数のデータのいずれかの取得要求を統合的に受け付ける
    とともに、該取得要求に対応するデータを取得して前記
    取得要求先に提示するデータ提示手段と、 既に取得した前記複数のデータのいずれかを伝送方式に
    かかわらず共通にキャッシュするためのキャッシュ領域
    と、 前記複数のデータの各々について、データ取得コストと
    過去の前記取得要求の頻度に基づく要求発生確率とをパ
    ラメータとするデータ入手コストを算出し、該データ入
    手コストが大きくなる順にキャッシュ候補データを決定
    して前記キャッシュ領域に保存するとともに、保存した
    データの識別情報を所定のリストに掲載するキャッシュ
    管理手段と、を備え、 前記データ提示手段が、前記取得要求の受付を契機に該
    当データの識別情報が前記リストに掲載されているかど
    うかを探索し、掲載されていない場合に、前記取得要求
    に応じた伝送方式で該当データを取得するように構成さ
    れることを特徴とする、キャッシュを用いたデータ取得
    装置。
  3. 【請求項3】 前記キャッシュ管理手段は、キャッシュ
    候補データの保存領域が確保できない場合に、前記キャ
    ッシュ領域に既に保存されているデータのうち前記デー
    タ入手コストが当該キャッシュ候補データよりも小さい
    データを優先的に削除して当該キャッシュ候補データと
    おき替えるように構成されることを特徴とする請求項1
    または2記載のデータ取得装置。
  4. 【請求項4】 前記データ提示手段は、前記リストにお
    いて前記取得要求に対応するデータの識別情報を検出し
    た場合に前記キャッシュ領域から当該データを取得して
    前記取得要求先に提示するように構成されることを特徴
    とする請求項2または3記載のデータ取得装置。
  5. 【請求項5】 キャッシュ対象となる前記複数のデータ
    が、放送方式で伝送される放送データとオンデマンド方
    式で伝送されるオンデマンドデータとを含み、前記キャ
    ッシュ領域において同一データ構造で保存されることを
    特徴とする請求項1ないし4のいずれかの項記載のデー
    タ取得装置。
  6. 【請求項6】 キャッシュ領域を具備したコンピュータ
    装置をデータ取得装置として機能させるプログラムを前
    記コンピュータ装置が読み取り可能な形態で記録して成
    る記録媒体であって、 前記プログラムが、少なくとも、 それぞれ異なる伝送方式で伝送される複数のデータのい
    ずれかの取得要求を統合的に受け付ける処理、 既に取得した前記複数のデータの各々について、データ
    取得コストと過去の前記取得要求の頻度に基づく要求発
    生確率とをパラメータとするデータ入手コストを算出
    し、該データ入手コストが大きくなる順にキャッシュ候
    補データを決定して前記キャッシュ領域に保存する処
    理、 保存したデータの識別情報を所定のリストに掲載する処
    理、 前記受け付けた取得要求に対応するデータの識別情報が
    前記リストに掲載されているかどうかを探索し、掲載さ
    れていない場合に、前記取得要求に応じた伝送方式で該
    当データを取得する処理、を前記コンピュータ装置に実
    行させるものであることを特徴とする記録媒体。
JP9167719A 1997-06-24 1997-06-24 キャッシュを用いたデータ取得装置及び記録媒体 Pending JPH1115707A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9167719A JPH1115707A (ja) 1997-06-24 1997-06-24 キャッシュを用いたデータ取得装置及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9167719A JPH1115707A (ja) 1997-06-24 1997-06-24 キャッシュを用いたデータ取得装置及び記録媒体

Publications (1)

Publication Number Publication Date
JPH1115707A true JPH1115707A (ja) 1999-01-22

Family

ID=15854926

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9167719A Pending JPH1115707A (ja) 1997-06-24 1997-06-24 キャッシュを用いたデータ取得装置及び記録媒体

Country Status (1)

Country Link
JP (1) JPH1115707A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7089301B1 (en) * 2000-08-11 2006-08-08 Napster, Inc. System and method for searching peer-to-peer computer networks by selecting a computer based on at least a number of files shared by the computer

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7089301B1 (en) * 2000-08-11 2006-08-08 Napster, Inc. System and method for searching peer-to-peer computer networks by selecting a computer based on at least a number of files shared by the computer

Similar Documents

Publication Publication Date Title
US7558854B2 (en) Access relaying apparatus
US7580971B1 (en) Method and apparatus for efficient SQL processing in an n-tier architecture
US6182111B1 (en) Method and system for managing distributed data
JP4732667B2 (ja) 選択的ルーティング
US7349986B2 (en) Method for data distribution
US9569742B2 (en) Reducing costs related to use of networks based on pricing heterogeneity
EP2227016A1 (en) A content buffering, querying method and point-to-point media transmitting system
US20090271577A1 (en) Peer-to-peer network content object information caching
EP1867137B1 (en) Method and apparatus for efficiently expanding a p2p network
JP5238432B2 (ja) メタデータ収集装置、ならびにその方法およびプログラム
US20080201341A1 (en) Contents management method
CN107197359B (zh) 视频文件缓存方法及装置
JP2004513411A (ja) コンテンツ交換装置
JP2004509381A (ja) 自己発行ネットワークディレクトリ
JPH1021134A (ja) ゲートウェイ装置、クライアント計算機およびそれらを接続した分散ファイルシステム
JP2003122658A (ja) データ配送方法
JP2004514961A (ja) コンテンツのトラッキング
US8510513B2 (en) Network load reducing method and node structure for multiprocessor system with distributed memory
CN113051221A (zh) 数据存储方法、装置、介质、设备及分布式文件系统
JPH07239808A (ja) 分散データ管理方式
JPH1115707A (ja) キャッシュを用いたデータ取得装置及び記録媒体
JP2004508614A (ja) コンテンツマネージャ
CN112395453B (zh) 一种自适应分布式遥感影像缓存及检索方法
JP2002073401A (ja) Wwwコンテンツ配信システム、プロキシサーバ装置、wwwサーバ装置、wwwコンテンツ配信方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4533738B2 (ja) キャッシュ削除方法及びコンテンツ中継サーバ