JPH11120069A - データ先読み方法 - Google Patents

データ先読み方法

Info

Publication number
JPH11120069A
JPH11120069A JP9284914A JP28491497A JPH11120069A JP H11120069 A JPH11120069 A JP H11120069A JP 9284914 A JP9284914 A JP 9284914A JP 28491497 A JP28491497 A JP 28491497A JP H11120069 A JPH11120069 A JP H11120069A
Authority
JP
Japan
Prior art keywords
data
keyword
weight
user
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9284914A
Other languages
English (en)
Inventor
Kenichi Soejima
健一 副島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP9284914A priority Critical patent/JPH11120069A/ja
Publication of JPH11120069A publication Critical patent/JPH11120069A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】クライアントサーバ間のデータの先読み処理を
従来方式よりも効率良く行ない、より高速なデータアク
セスを実現するとともに、前記先読み処理の際に発生す
る無駄なトラフィックを削減する。 【解決手段】計算機1004で動作するクライアントプ
ログラム1008が、計算機1002上で動作するサー
バプログラム1006が管理するデータ1100を読み
込んでキャッシュデータ1112に保存すると、データ
先読み手段1010は前記キャッシュデータ1112を
読みだし、前記データ1100の一部もしくは全ての箇
所1102に関連づけられている当該箇所に関連するデ
ータの所在の情報1104と、前記情報に関連づけられ
たキーワード及び重み1106を抽出して先読みデータ
決定手段1012に渡す。次に前記先読みデータ決定手
段1012は、前記キーワード及び重み1106と、予
めユーザが定義したユーザ定義キーワード及び重み11
10と、先読みデータ判定基準1108から、先読みす
るデータとその先読み順序を決定し、前記決定に従いデ
ータ先読み手段1010でデータの先読みを行なう。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は一般にコンピュータ
システムに関し、詳細にはクライアントサーバシステム
におけるデータの先読み方法に関する。
【0002】
【従来の技術】データの一部もしくは全てに前記データ
の関連データの所在の情報を関連付けることができる従
来システムとして、WWW(World Wide Web)があ
る。WWWでは、管理するデータの一部もしくは全て
に、前記データに関連するデータの所在の情報をリンク
として関連付けることができる。
【0003】このWWWに関して、ユーザのデータアク
セスを高速化するために、クライアントがサーバからデ
ータを読み込んだ後、前記データ中にリンクが存在する
場合、次に前記リンクのうちのどれを読むかをユーザが
指定する前に、自動的に前記関連データを先読みすると
いう研究がなされている(Ken-ichi Chinen,Suguru
Yamaguchi :”The Feasibility and Performance
Studies on Prefe-tching Technique in the WW
W Platform”,Internet Conference '96Procee
ding)。なお前記研究では、前記関連データの名称から
文書データ及びインラインイメージデータと思われるも
のだけを先読みしている。
【0004】
【発明が解決しようとする課題】データの一部もしくは
全てに関連付けられた関連データを先読みする際、前記
データ中に関連づけられている全ての前記関連データを
先読みする方法では、全ての前記関連データを読み終る
前に、ユーザが前記関連データのうちいずれか1つの読
みだし要求を発行した場合、前記指定したデータをまだ
読み込んでいない可能性があり、この場合、無駄なデー
タを転送した上に、必要なデータが必要な時にはまだ読
み込まれていないということになる。そのため、先読み
を行なう際は、可能な限りユーザが次に読み込み要求を
発行すると予測される関連データを先に読み込む方が望
ましい。ところが、先読みする関連データや先読みの順
序を出現順や文書データのみ先読みする等の、内容に関
連の薄い条件により決定していると、前述のように無駄
なデータ転送を行なう上に、本当に必要なデータが必要
な時にまだ読ま込まれていないという事態が発生する可
能性がある。また、先読み処理の方針にユーザの意志が
反映されないため、ユーザが興味のない話題のデータが
無駄に先読みされる可能性がある。
【0005】本発明の目的は、前記従来の先読み方法よ
りも、効率の良い先読み処理を行ない、より高速なデー
タアクセスを実現するとともに、前記先読みの際に発生
する無駄なトラフィックを削減することである。
【0006】
【課題を解決するための手段】本発明におけるデータ先
読み方法では、先読みの候補となる関連データの所在の
情報に予め前記関連データの内容を示すキーワード及び
前記キーワードの重みを付けておき、先読み処理を行な
う際に、前記キーワード及び前記キーワードの重みと予
めユーザが定義しておいた先読みして欲しいデータに関
連するキーワード及び前記キーワードの重みから、どの
関連データをどの順で先読みするかを自動的に決定して
データの先読みを行なうことで、ユーザが興味のあるデ
ータである可能性の高いデータから順に先読みし、効率
的の良い先読み処理を実現してユーザのデータアクセス
を高速化するとともに、前記関連データを先読みするか
否かの判定基準を設け、前記先読み候補のうち、前記判
定基準に適合しないものは先読みしないようにすること
で、無駄なデータの先読みにより発生する無駄なトラフ
ィックを削減する。
【0007】
【発明の実施の形態】図1は、本発明を利用するための
システム構成の例を示したものである。
【0008】計算機1002と計算機1004は通信路
1000で接続されており、サーバプログラム1006
は計算機1002上で、クライアントプログラム100
8は計算機1004上でそれぞれ動作している。サーバ
プログラム1006は、データ1100を管理し、クラ
イアントプログラム1008からくる前記データ110
0の読みだし要求や書き込み要求(1200)に従って
処理を行なう(1204)。前記データ1100の一部
もしくは全て1102には、前記データ1100に関連
するデータの所在の情報1104が関連付けられている
(1218)。また、前記関連データの所在の情報11
04には、0個以上の、前記関連データの内容に関する
キーワード及び前記キーワードの重み1106が関連づ
けられている(1220)。一方、計算機1004上の
クライアントプログラム1008は、前記サーバプログ
ラム1006が管理するデータ1100を読み込むと、
それをキャッシュデータ1112として保存しておく
(1212)。また、データ先読み手段1010は、前
記クライアントプログラム1008が保存したキャッシ
ュデータ1112からデータ1100を読みだし、前記
関連データの所在の情報1104及び前記情報に関連づ
けられたキーワード及び重み1106を抽出し、先読み
データ決定手段1012に渡す(1216)。先読みデ
ータ決定手段1012は、先読みデータ判定基準110
8及び予め定義しているユーザ定義キーワード及び前記
キーワードの重み1110を読みだし(1206,12
08)、前記データ先読み手段1010から受けとった
前記データ1100中の関連データの所在情報1104
とキーワード及び重み1106を利用して、前記データ
1100中に関連づけられているどの関連データを先読
みするかを決定し、結果をデータ先読み手段1010に
渡す(1216)。
【0009】図2は、ユーザ定義キーワードを自動抽出
するためのシステム構成の例である。
【0010】通信路1000に接続された計算機100
4上で、クライアントプログラム1008が動作してい
る。また、計算機1004上には、ユーザ定義キーワー
ド及び重み1110が存在する。クライアントプログラ
ム1008は、過去にアクセスした関連データ1100
の所在の情報1104と、前記関連データに関連づけら
れたキーワード及び重み1106をアクセス履歴211
4に保存する(2226)。また、ユーザ定義キーワー
ド自動抽出手段2014は、前記アクセス履歴2114
を読みだし(2224)、前記読み出したデータから、
ユーザ定義キーワードとして登録するキーワード及び重
みを決定して、ユーザ定義キーワード及び重み1110
に登録する(2222)。
【0011】図3は、関連キーワードを自動付与するた
めのシステム構成の例である。
【0012】サーバプログラム1006は、通信路10
00に接続された計算機1002で動作しており、要求
に従って、データ1100の読みだし(3228,32
30)や書き込み(3232)を行なっている。特にデ
ータ読みだし時は、サーバプログラムはデータ読みだし
手段3012を経由してデータの読みだしを行なう(3
228,3230)。前記サーバが管理するデータ11
00の一部もしくは全て1102には、前記データ11
00に関連するデータ3114の所在の情報1104が
関連付けられており(1218)、さらに前記情報11
04には、前記関連データ3114に関連するキーワー
ド及び重み1106が関連付けられている(122
0)。関連キーワード自動付与手段3014は、前記関
連データ3114が自計算機1002に存在し、かつ前
記キーワード及び重み1106が空の場合、前記関連デ
ータ3114から、キーワード抽出用辞書3116を利
用して(3226)、前記関連データ3114のキーワ
ード及び重み1106を抽出し(3222)、データ読
みだし手段3012で前記データ1100を読み出す際
に、前記関連データの所在情報1104に関連づけられ
たキーワード及び重み1106として関連づける。
【0013】図4は、図1のユーザ定義キーワード及び
重み1110の例を示したものである。
【0014】図中の列4000はキーワードを示し、列
4002は前記列4000に記述したキーワードと同じ
行のキーワードの重みを示す。例えば、キーワード”分
散オブジェクト”の重みは6である(4004)。
【0015】図5は、図3におけるキーワード抽出用辞
書3116の例を示したものである。
【0016】列5000は、データのパターンを示した
ものであり、列5002は、前記パターンと同じ行の前
記列5000のパターンのデータが図3における関連デ
ータ3114中に存在する場合に図3における関連デー
タ3114の所在の情報1104に関連付けられるキー
ワード及び重みを示す。列5002に記述されたキーワ
ード及び重みは、キーワード5200とその重み520
4を区切り記号5202で接続したものを1組とし、2
組以上ある場合はカンマ記号で区切って並べて記述す
る。
【0017】図6は、図1におけるデータ1100に、
関連データの所在の情報1104とキーワード及び重み
1106を関連させた例を示したものである。
【0018】図で、データ1100の一部1102に
は、ぞれぞれ関連データの所在の情報1104と、0個
以上の、キーワードと重みの組1106が関連づけられ
ている(1102,1220)。ここで、キーワードと
重み1106は、キーワードと重みの組を0組以上、カ
ンマ記号で区切って並べたものである。キーワードと重
みの組は、ぞれぞれ、キーワード6300と、重み63
04を区切り記号6302で接続したものである。
【0019】図7は、先読みデータ判定基準1108の
例であり、先読みデータ決定手段1012で、データを
先読みするかそれとも先読みしないかを判断するための
判定基準7000を示したものである。
【0020】図8は、計算機1004における先読み処
理の流れを示したものである。図1におけるクライアン
トプログラム1008がデータを読み込むと先読み処理
を開始する(8000)。まず、前記クライアントプロ
グラム1008が取得したキャッシュデータ1112を
読み込み(8100)、前記読み込んだデータから、先
読みデータ決定手段1012で、関連データの所在の情
報及び前記情報に関連づけられたキーワードと重みの組
を先読み候補として抽出する(8102)。そして、前
記抽出した結果が空ならば(8200)処理を終了し
(8002)、空でなければ、ユーザ定義キーワード及
び重み1110と、前記抽出したキーワードと重みの組
と、先読みデータ判定基準1108から、先読みする関
連データとその読みだし順序を決定し(8104)、前
記決定した順序に従い、先読み手段1010でデータを
先読みしてキャッシュデータ1112に書き込み(81
06)、処理を終了する(8002)。
【0021】図9は、前記図8における先読みする関連
データと先読み順序を決定する処理の流れを示したもの
である。
【0022】処理を開始する(9000)と、処理81
02で決定した先読み候補のうち、先読み優先度を決定
していない候補があるかどうかを調べ(9200)、あ
れば、前記先読み候補から先読み候補の1つである関連
データの所在の情報1104とキーワード及び重みの組
1106を1組取りだし、ユーザ定義キーワード400
0から前記関連データの所在の情報1104に関連付け
られたキーワード6300を抽出する(9100)。さ
らに、前記抽出したユーザ定義キーワード4000の重
み4002と前記ユーザ定義キーワード4000に一致
した前記関連データの所在の情報1106に関連づけら
れたキーワード6300の重み6304の積を、前記関
連データに関連付けられたキーワード1106中の全て
のキーワードについて計算し、その和を前記関連データ
の先読み優先度とする(9102)。全ての先読み候補
について先読み優先度を計算すると、前記決定した先読
み優先度を使用して先読み判定基準7000を適用し、
適合しない先読み候補については、削除する(910
4)。次に、前記基準7000に適合する先読み候補を
前記決定した先読み候補優先度順に並びかえ、結果を先
読みするデータ及びその先読み順序とし(9106)、
先読みデータ及び先読み順序決定処理を終了する(90
02)。
【0023】図10は、ユーザ定義キーワード自動抽出
手段2014の処理の流れである。処理開始(1000
0)後、まず、過去のアクセス履歴2114から、過去
にアクセスした関連データの所在の情報1104に関連
づけられたキーワード1106を全て抽出し、出現回数
を数える(10110)。次に、出現回数の多い順に前
記抽出したキーワードを並び変え、出現頻度が高いもの
ほど重い重みがつくように、全てのキーワードについて
順に重みをつけていく(10102)。そして、その結
果をユーザ定義キーワード及び重み1110として登録
し(10104)、処理を終了する(10002)。
【0024】図11は、図3における関連キーワード自
動付与処理の流れを示したものである。
【0025】サーバプログラム1006にデータ読みだ
し要求が来ると、それがデータ読みだし手段3012に
伝わり、関連キーワード自動付与処理が開始される(1
1000)。そして、データ読みだし手段3012が、
要求されたデータ1100を読み出す(11100)。
次に、前記データ中の関連データの所在の情報1104
を1つ取りだし、前記情報に関連づけられたキーワード
及び前記キーワードの重み1106を抜き出す(111
02)。そして、この結果が空かどうか判断し(112
00)、空でなければ、前記関連データが自計算機10
02上にあるかどうか(11202)、前記関連データ
1104にキーワード及び重み1106がついているか
どうか(11204)判断し、前者が真、かつ後者が偽
であれば、前記関連データからキーワード抽出用辞書3
116に登録されているパターン5000に一致するキ
ーワードを抽出し、前記辞書中で前記一致したパターン
5000に対応付けられているキーワード及び重み50
02を抽出し(11104)、前記関連データの所在の
情報1104に関連付ける(11106)。全ての関連
データの所在の情報にキーワード及び重みが関連付けら
れると、前記データを要求してきたクライアントプログ
ラム1008に、前記キーワードと重みを関連づけたデ
ータを全て転送して(11108)、処理を終了する
(11002)。
【0026】
【発明の効果】本発明を利用すると、サーバ側で管理さ
れるデータの一部もしくは全ての箇所に当該箇所に関連
するデータの所在を示す情報を関連づけることができる
システムにおいて、従来方式よりも効率の良い先読みに
よる高速なデータアクセスを実現できるとともに、前記
先読みの際に発生する無駄なトラフィックを削減するこ
とができる。
【図面の簡単な説明】
【図1】システム構成の例。
【図2】ユーザ定義をキーワード自動抽出するためのシ
ステム構成の例。
【図3】関連キーワードを自動付与するためのシステム
構成の例。
【図4】ユーザ定義キーワード及び重みの例。
【図5】キーワード抽出用辞書の例。
【図6】キーワード及び重みを関連付けたデータの例。
【図7】先読みデータ判断基準の例。
【図8】先読み方法の処理の流れ。
【図9】先読みデータ決定処理の流れ。
【図10】ユーザ定義キーワード自動抽出処理の流れ。
【図11】関連キーワード自動付与処理の流れ。
【符号の説明】
1000…通信路、1002…計算機、1006…サー
バプログラム、1008…クライアントプログラム。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】通信路で接続された2台以上の計算機から
    構成され、要求に応じて前記データの書き込みや読み出
    しを行なうサーバプログラムと、前記サーバプログラム
    に前記データの読み出し要求もしくは書き込み要求を発
    行するクライアントプログラムがそれぞれ前記2台以上
    の計算機のうちいずれか1台以上で動作し、前記サーバ
    プログラムが管理する前記データの一部もしくは全ての
    箇所に、当該箇所に関連する関連データの所在を表す情
    報を関連づけることが可能なシステムにおいて、前記サ
    ーバプログラムで管理する前記データ中の、前記関連デ
    ータの所在を表す情報に、前記関連データの内容に関す
    る、0個以上の、キーワードと前記キーワードの重みの
    組を関連づけて保存し、前記クライアントプログラムで
    前記データを読み出すと、前記関連データの所在を表す
    情報に関連づけられた、0個以上の、前記キーワードと
    前記キーワードの重みの組と、予め前記クライアントプ
    ログラムのユーザが定義しておいたキーワード及び前記
    ユーザが定義しておいた前記キーワードの重みと、予め
    前記ユーザが定義しておいた前記関連データの先読みを
    行なうかどうかの判定基準から、前記データ中の一部も
    しくは全てに関連づけられた前記関連データのうち、ど
    の前記関連データをどの順で先読みするかを決定し、前
    記決定した順に前記関連データを先読みする、データ先
    読み方法。
  2. 【請求項2】請求項1におけるデータ先読み方法におい
    て、前記ユーザの過去の前記サーバ上の前記データのア
    クセス履歴から、ユーザが過去にアクセスしたデータに
    関連づけられたキーワード及び前記キーワードの重みを
    自動的に抽出し、予め前記ユーザが定義するキーワード
    及び前記キーワードの重みを自動的に生成するユーザ定
    義キーワード自動生成手段を含むデータ先読み方法。
  3. 【請求項3】請求項1におけるデータ先読み方法におい
    て、前記サーバから前記データを読み出す際に、前記デ
    ータ中の、前記データの前記一部もしくは全てに関連づ
    けられた一部もしくは全ての前記関連データの所在を表
    す情報について、前記関連データが前記サーバ内にある
    かどうか判断し、前記関連データが前記サーバ内にあれ
    ば、前記関連データから前記関連データの内容に関する
    キーワード及び前記キーワードの重みを自動的に決定し
    て、前記関連データの所在を表す情報に、0個以上の、
    前記決定したキーワード及び前記キーワードの重みの組
    を付与する関連キーワード自動付与手段を含むデータ先
    読み方法。
JP9284914A 1997-10-17 1997-10-17 データ先読み方法 Pending JPH11120069A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9284914A JPH11120069A (ja) 1997-10-17 1997-10-17 データ先読み方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9284914A JPH11120069A (ja) 1997-10-17 1997-10-17 データ先読み方法

Publications (1)

Publication Number Publication Date
JPH11120069A true JPH11120069A (ja) 1999-04-30

Family

ID=17684697

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9284914A Pending JPH11120069A (ja) 1997-10-17 1997-10-17 データ先読み方法

Country Status (1)

Country Link
JP (1) JPH11120069A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000250803A (ja) * 1999-03-02 2000-09-14 Toshiba Corp 情報配信システム、移動計算機、情報サーバ装置、キャッシュサーバ装置及び先読みキャッシュ処理方法
JP2001159998A (ja) * 1999-12-03 2001-06-12 Nec Corp Webコンテンツキャッシュシステム及び方法並びに記録媒体
JP2001223753A (ja) * 1999-06-07 2001-08-17 Matsushita Electric Ind Co Ltd データ受信装置
JP2002259626A (ja) * 2001-02-28 2002-09-13 Hitachi Ltd コンテンツ配信装置、コンテンツ配信方法、コンテンツ提供方法及びコンテンツプロバイダ紹介方法
JP2004512615A (ja) * 2000-10-24 2004-04-22 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 参照されるリソースを先取りする方法および装置
WO2018150539A1 (ja) * 2017-02-17 2018-08-23 株式会社日立製作所 データ取得装置、データ取得方法、およびデータ取得プログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000250803A (ja) * 1999-03-02 2000-09-14 Toshiba Corp 情報配信システム、移動計算機、情報サーバ装置、キャッシュサーバ装置及び先読みキャッシュ処理方法
JP2001223753A (ja) * 1999-06-07 2001-08-17 Matsushita Electric Ind Co Ltd データ受信装置
JP2001159998A (ja) * 1999-12-03 2001-06-12 Nec Corp Webコンテンツキャッシュシステム及び方法並びに記録媒体
JP2004512615A (ja) * 2000-10-24 2004-04-22 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 参照されるリソースを先取りする方法および装置
JP2002259626A (ja) * 2001-02-28 2002-09-13 Hitachi Ltd コンテンツ配信装置、コンテンツ配信方法、コンテンツ提供方法及びコンテンツプロバイダ紹介方法
WO2018150539A1 (ja) * 2017-02-17 2018-08-23 株式会社日立製作所 データ取得装置、データ取得方法、およびデータ取得プログラム
WO2018150639A1 (ja) * 2017-02-17 2018-08-23 株式会社日立製作所 データ取得装置、データ取得方法、およびデータ取得プログラム
JPWO2018150639A1 (ja) * 2017-02-17 2019-02-21 株式会社日立製作所 データ取得装置、データ取得方法、およびデータ取得プログラム

Similar Documents

Publication Publication Date Title
US8271471B1 (en) Anticipated query generation and processing in a search engine
JP5459958B2 (ja) 表意文字と表音文字とを有する言語のための自動補完方法およびシステム
US8972998B2 (en) Processing annotation requests using multithreaded constituent task and independent input/output tasks
KR100672277B1 (ko) 개인화 검색 방법 및 검색 서버
US8156429B2 (en) Method and system for accelerating downloading of web pages
JP2001509293A (ja) 情報検索
WO2013016219A1 (en) Systems and methods for contextual personalized searching
JP2000250841A (ja) ページ生成方法及び装置並びにページ生成プログラムを記録した記憶媒体および電子モールシステム
JPH10198680A (ja) 分散辞書管理方法及びそれを用いた機械翻訳方法
KR100843913B1 (ko) 서버로부터 페이지를 요청하는 방법, 데이터 프로세싱 시스템 및 컴퓨터 판독가능 저장 매체
CN110472013B (zh) 一种热门话题更新方法、装置和计算机存储介质
JPH11149405A (ja) Wwwキャッシュシステムおよびwwwデータの先読み方法
JPH11120069A (ja) データ先読み方法
US9547701B2 (en) Method of discovering and exploring feature knowledge
JPH0773085A (ja) データ処理システムおよびメタデータの先読み方法
US20020062354A1 (en) Method and apparatus for dynamic shared-memory caching of scripting engine product
KR100672278B1 (ko) 웹 브라우저의 즐겨찾기 리스트를 이용한 개인화 검색 방법및 검색 서버
EP4220446A1 (en) Resource pre-fetch using age threshold
JP2004348239A (ja) テキスト分類プログラム
JPH0728677A (ja) 記憶装置のファイル管理方式
CN101145149A (zh) 基于下载引擎的二进制文件相关搜索方法及系统
CN111857737A (zh) 基于SysML模型语义web系统的动静态资源分离方法
JP2008096759A (ja) 画像データにマッチした広告を配信するための広告配信方法および広告配信装置
Setia et al. Semantic Prefetching Based Hybrid Prediction Model
US20230401154A1 (en) Method for embedding rows prefetching in recommendation models