JPH04205173A - 情報検索システム - Google Patents

情報検索システム

Info

Publication number
JPH04205173A
JPH04205173A JP2336325A JP33632590A JPH04205173A JP H04205173 A JPH04205173 A JP H04205173A JP 2336325 A JP2336325 A JP 2336325A JP 33632590 A JP33632590 A JP 33632590A JP H04205173 A JPH04205173 A JP H04205173A
Authority
JP
Japan
Prior art keywords
data
search
retrieval
user
storage device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2336325A
Other languages
English (en)
Inventor
Koichi Nakai
光一 中井
Nobuhiko Nishi
伸彦 西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimadzu Corp
Original Assignee
Shimadzu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimadzu Corp filed Critical Shimadzu Corp
Priority to JP2336325A priority Critical patent/JPH04205173A/ja
Publication of JPH04205173A publication Critical patent/JPH04205173A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 A、産業上の利用分野 この発明は、データベースから所要のデータを検索する
情報検索システムに係り、特には、データベースへの検
索中のアクセス回数を減らして検索時間を短縮化する技
術に関する。
B、従来技術 データを保管する場合、コンピュータの内部記憶装置(
RAM)ではなく、外部機器としてのデータベース(磁
気ディスク)に保管するのが一般的である。これは、R
AMが一時的にしかデータを記憶できないのに対し磁気
ディスクは半永久的に保管することが可能であり、また
、大量のデータを記憶することができるからである。し
かし、磁気ディスクへのアクセスタイムは、RAMへの
アクセスタイムに比べかなり長いという欠点がある。そ
こで、磁気ディスクから所要のデータを検索する際に、
磁気ディスクへのアクセス回数を減らして検索時間の短
縮化を図るためのシステムとして以下のようなものがあ
る。
ユーザがデータ検索を開始すると、まず、磁気ディスク
のセクター単位、あるいは、予め定められた領域(ブロ
ック)単位で、磁気ディスクからデータを読み込み、内
部のキャッシュメモリに格納する。そして、与えられた
検索キーでキャッシュメモリ内の検索を行う。該当する
データがキャッシュメモリ内になければ、再び、セクタ
ー単位あるいはブロック単位でデータをキャッシュメモ
リに格納し検索を行う。このシステムによると、磁気デ
ィスク内のデータと検索キーとの比較を逐次行うよりも
(その都度、磁気ディスクへアクセスするよりも)、セ
クター単位あるいはブロック単位で磁気ディスクからデ
ータを読み込むため、アクセス回数は減少し、検索にか
かわる全体の処理時間の短縮化が図れる。
また、キャッシュメモリに対する検索時間を短縮化する
ために、以下に説明するハツシュ法やB−tree法な
どの検索手法が採用される。
■ハツシュ法:まず、磁気ディスクに蓄えられるデータ
のキーワード、例えば文字列などを数値化して、その数
値を表番号とする表を作成し、該当する表番号の項目中
にデータのアドレスナンバーを格納する。キーを数値化
するために用いられる関数をハフシュ関数1作成された
表をハツシュテーブルという。ユーザから検索キーが与
えられると、これもハノンユ関数を用いて数値化し、そ
の数値が示すハツシュテーブル中のアドレスナンバーを
キャッシュメモリに対して指定する。そのアドレスナン
バーのデータがキャンシュメモリ上になければ、再び、
セクター単位、ブロック単位でデータをキャッシュメモ
リに読み込む。このように、キャッシュメモリ内のデー
タ1つずつに対して、比較検索を行うのではなく、計算
したアドレスナンバーのデータがキャッシュメモリ上に
あるかないかで検索を行うので、かなりの高速検索が行
える。
■B  tree法:これは、インデフクスを用いたデ
ータ検索法である。第4図を参照して説明する。
まず゛、第4図(a)に示すように、データを登録する
段階で、データのキーワードとなるキーと、そのデータ
が記憶されるポインタ(記憶される所在地を示している
)とを1つのレコードとして、前記キーの大きさの昇順
にインデックスのべ一ノPOに格納していく。
インデフクスの1つのページPO(予め設定されている
記憶容量)を趙えそうになると、そのページの中間値を
求め、中間値を境に大小2つのレコードを格納するペー
ジP1.P2に分裂する(第4図[有])参照)。
キーの大きさの昇順に格納していくのであるから、やが
て分裂した大きい方のページP2の容量を趙えそうにな
る(ページP2に「7」と「8」の大きさをもつキーの
レコードが格納される)。
そうすると、前記と同様にしてページP2の中間値を求
め、その中間値を1つ上のレベルのページPOに格納し
、新たにページP3を生成する(第4図(C)参照)。
以上のような処理を繰り返し、データのキーとポインタ
とをツリー構造化していく。
検索を行うときは、検索キーと、B−treeの各ペー
ジのレコードのキーとを比較し、大きいか小さいかで検
索範囲を絞り込んで高速に検索を行う。
C1発明が解決しようとする課題 上記のような高速検索法(ハツシュ法、B−tree法
)をキャッシュメモリに対して用いたとじても、磁気デ
ィスクへのアクセス回数を極力減らさない限り、検索時
間の短縮化は望めない。そういう意味では、従来技術に
記載したシステムは、次の理由からまだ不十分である。
(1)検索処理の段階(ユーザから検索キーが入力され
たとき)になって初めて、磁気ディスクからキャンシュ
メモリにデータを読み込むため、検索時間は、そのアク
セスタイムが加算されたものとなり、無駄な時間がかか
っている。
(2)キャッシュメモリに読み込むデータの量は、ただ
単に磁気ディスクのセクター単位、ブロック単位である
ため、キャッシュメモリ内に所要のデータが入っている
確率は決して高いとは言えず、そのために何度も磁気デ
ィスクへアクセスする結果となり、十分な検索時間の短
縮化が図られて;・ない。
この発明は、このような事情に鑑みてなされたものであ
って、極力、検索中の磁気ディスクへのアクセス回数を
減少させることにより、検索時間の短縮化を図ることの
できる情報検索システムを提供することを目的としてい
る。
01課題を解決するための手段 この発明は、上記目的を達成するために次のような構成
を備えている。
即ち、この発明に係る情報検索システムは、データベー
スに対するデータの検索頻度をユーザ毎に計算する検索
頻度算出手段と、少なくとも前記算出された検索頻度を
ユーザ毎の検索知識データとして格納する知識ベースと
、ユーザからの検索条件が入力されないときに前記ユー
ザ毎の検索知識データを参照して頻度が設定値以上であ
るデータを予め内部記憶装置に読み込む制御部と、入力
された検索キーに基づいて前記内部記憶装置内のデータ
検索を行う検索手段と、検索結果を外部に出力する出力
手段とを備えたことを特徴としている。
E9作用 この発明によれば、ユーザからの検索条件が人力されな
いとき、すなわち、いつもの検索条件での検索を行うと
き、制御部は知識ベースからそのユーザの検索知識デー
タを参照して、検索頻度が設定値以上のデータを予めデ
ータベースから内部記憶装置に読み込んでおく。
その後、データ検索処理に移行し、ユーザからの検索キ
ーを人力する。検索手段は入力した検索キーを基に内部
記憶装置内のデータに対して検索を行う。
このように、予めユーザの検索知識データを参照して頻
繁に検索されるデータを内部記憶装置に読み込んでおく
から、検索処理に移行した直後にデータベースをアクセ
スすることがなく、また、内部記憶装置に読み込んだデ
ータの中に所要のデータが入っている確率が高く、その
後のアクセス回数は減少する。
F、実施例 以下、この発明の実施例を図面に基づいて説明する。
第1図は、この発明の情報検索システムの一実施例の概
略構成を示したブロック図である。
本システムには外部機器として、キーボード1、出力手
段としてのモニタデイスプレィ2、データベース3、知
識ベース4がインターフェイス5を介して接続されてい
る。
データベース3には大量のデータ、例えば文献情報やプ
ログラム部品などが格納されている。
知識ベース4には本システムを利用する各ユーザの検索
知識データが格納されている。検索知識データとは、利
用者名(ユーザのパスワード等)、データ検索の日時、
検索回数、検索頻度に相当する重み、そのデータの識別
番号(データID)のことで、第2図にその検索知識デ
ータ構造を表形式に示す。
本システムの内部には、データベース3および知識ベー
ス4への読み書きを行う制御部6と、知識ベース4に格
納される「重み」を計算する頻度算出部7と、日時デー
タを登録するタイマーレジスタ8と、データベース3か
ら読み出されたデータを一時的に格納する内部記憶装置
としてのキャッシュメモリ9と、前述のハツシュtL 
 B −tree法などの検索方法でキャッシュメモリ
9内のデータ検索を行う検索部IOとが具備されている
頻度算出部7による「重み(符号W)Jの計算は、例え
ば次式で行われる。
W= u + g (i)・・・・・・・・・・・・・
・・・・・・・・・・・・・・・・・・・・(1)(1
)式において符号Uは重みの初期値で、ユーザが特に頻
繁に検索する(優先してキャッシュメモリ9に読み込む
)データに付加される数値である。
初期値の設定がされなければ、「0」値が付加される。
g (i)は検索頻度を表す時間関数で、次の(2)式
で表される。
g(i)=α×i・・・・・・・・・・・・・・・・・
・・・・・旧・・・旧・・(2)(2)式において、符
号jは有期間の検索回数、例えば、−カ月間における検
索回数を表し、αはユーザによって定義される乗算定数
を表す。α値は、なるべくg(i)の値が「0」から「
1」の区間の値になるように決定される。例えば、−カ
月に同しデータを最高で10回検索するユーザであれば
α値にrO,I Jが設定され、100回検索するユー
ザであればrO,01Jが設定される。
そして、設定した有期開銀(上記例では−カ月毎)に頻
度算出部7は、重みWを計算し、制御部6がこれを更新
する。これにより、最近の検索頻度(重みW)が常に知
識ベース4内に格納される。
次に、本システムによるデータ検索処理について第3図
のフローチャートを基に説明する。
まず、本ンステムを起動した時点で、ユーザのパスワー
ドを入力する(ステップSl)。
続けて、ステップS2で、ユーザから検索条件が指定さ
れたかどうかを判断する。
検索条件は、予め、データベース3からキャッシュメモ
リ9に読み込んでおくためのデータの種類のことをいい
、ここでは、普段、検索しているものとは異なる種類の
データを検索するときに指定される。例えば、データベ
ース3に多数の技術文献情報が格納されており、あるユ
ーザは普段、情報処理分野の文献情報を頻繁に検索して
いたとすると、このユーザが異なる分野の文献情報、例
えば機械工学関係の文献情報を検索する場合に指定され
る。
検索条件が指定されたら、ステップS4に移行して、指
定された条件のデータをキャッシュメモリ9の記憶容量
に相当する分、データベース3から読み込んでキャンシ
ュメモリ9に転送する。
もし、ユーザから検索条件が特に指定されなければ、つ
まり、普段、検索している類のデータ(先の例でいうと
情報処理分野の文献情報)を検索する場合には、ステッ
プS3に進む。
ステップS3:制御部6はステップS1で入力したユー
ザのパスワードをキーとして知識ベース4を検索し、重
みWの値がX8以上のデータを読み込んで、キャッシュ
メモリ9に転送する。
Xlはシステムによって予め決定されている重みの値で
、例えば、χ、 = 0.7に設定されていると、W=
0.7以上の値をもつデータの識別番号(第2図のデー
タID)を参照して、該当するデータをデータベース3
からキャンシュメモリ9に転送する。
ステップS5で、ユーザからの検索キーを人力し、ステ
ップS6に進む。
ステップS6:検証部10は、入力した検索キーでもっ
て、ステップS3あるいはステップS4でキャッシュメ
モリ9に読み込んだデータに対して検索を行う。この検
索方法には、従来技術で説明したハツシュ法やB−tr
ee法が用いられる。
ステップS7で、キャッシュメモリ9内に検索キーと一
致する所要のデータがあったか(検索できたか)を判断
し、検索できたならステップS10に進んで、検索結果
をモニタデイスプレィ2に表示し、検索できなければス
テップS8に進む。
ステップS8ニステツプS3で予め設定されている重み
Wの値Xiを次のように変更する。
Xr →[Xr   a、Xt ] 符号aは本システムによって予め決定される定数で、0
から1までの値、例えばro、2 Jに設定されている
とすると、重みWの値が0.5から0.7までの区間、
すなわち、W=0.5とW=0.6の値に変更される。
ステップS9で、変更された重みWの値をもつデータを
、ステップS3と同様にしてデータベース3からキャッ
シュメモリ9に転送する。この例ではW=0.5とW=
0.6の重み値をもつデータがキャッシュメモリ9に転
送される。このように、キャンシュメモリ9内に所要の
データがなければ、重みWのイ直を変更しく値を低くし
て)、その重みW値をもつデータ群をキャッシュメモリ
9に転送する。
そして、ステップS6にリターンして、上記処理を繰り
返し、所要のデータを検索する。
G1発明の効果 以上の説明から明らかなように、この発明に係る情報検
索システムは、検索処理前に予め検索頻度の高いものを
内部記憶装置に読み込むようにしたので、検索処理に移
行した直後にデータベースをアクセスすることがなく、
また、内部記憶装置に読み込んだデータの中に所要のデ
ータが入っている確率が高いため、その後のアクセス回
数を減少させることができ、検索処理時間の大幅な短縮
化を図ることができる。
【図面の簡単な説明】
第1図ないし第3図は、この発明の一実施例に係り、第
1図は情報検索システムの概略構成を示したブロック図
、第2図は知識ベース内のデータ構造をテーブル形式で
示した回、第3図はデータ検索処理の流れを示したフロ
ーチャートである。 また、第4図は従来技術においてB−tree法の検索
を説明するのに用いた図で、同図(a)、 (bL (
c)はそれぞれB−treeの作成段階を示したもので
ある。 2・・・モニタデイスプレィ 3・・・データベース   4・・・知識ベース6・・
・制御部    7・・・頻度算出部9・・・キヤノン
ユメモリ  10・・・検証部特許出願人 株式会社 
島津製作所

Claims (1)

    【特許請求の範囲】
  1. (1)データベースに対するデータの検索頻度をユーザ
    毎に計算する検索頻度算出手段と、少なくとも前記算出
    された検索頻度をユーザ毎の検索知識データとして格納
    する知識ベースと、ユーザからの検索条件が入力されな
    いときに前記ユーザ毎の検索知識データを参照して頻度
    が設定値以上であるデータを予め内部記憶装置に読み込
    む制御部と、入力された検索キーに基づいて前記内部記
    憶装置内のデータ検索を行う検索手段と、検索結果を外
    部に出力する出力手段とを備えたことを特徴とする情報
    検索システム。
JP2336325A 1990-11-29 1990-11-29 情報検索システム Pending JPH04205173A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2336325A JPH04205173A (ja) 1990-11-29 1990-11-29 情報検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2336325A JPH04205173A (ja) 1990-11-29 1990-11-29 情報検索システム

Publications (1)

Publication Number Publication Date
JPH04205173A true JPH04205173A (ja) 1992-07-27

Family

ID=18297955

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2336325A Pending JPH04205173A (ja) 1990-11-29 1990-11-29 情報検索システム

Country Status (1)

Country Link
JP (1) JPH04205173A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002021270A1 (fr) * 2000-09-06 2002-03-14 Cai Co., Ltd. Procede et systeme pour creer une base de donnees presentant une structure de savoir-faire
JP2010039941A (ja) * 2008-08-07 2010-02-18 Fujitsu Ltd ネットワーク監視装置、ネットワーク監視システム及びネットワーク監視方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002021270A1 (fr) * 2000-09-06 2002-03-14 Cai Co., Ltd. Procede et systeme pour creer une base de donnees presentant une structure de savoir-faire
JP2010039941A (ja) * 2008-08-07 2010-02-18 Fujitsu Ltd ネットワーク監視装置、ネットワーク監視システム及びネットワーク監視方法

Similar Documents

Publication Publication Date Title
JPH05189490A (ja) 関数結果をセーブし検索する方法と装置
JPH04205173A (ja) 情報検索システム
JP2817103B2 (ja) データ検索装置及びデータ検索方法
JPH04340163A (ja) キーワード検索方式
JP4047557B2 (ja) データベース管理システム,データベース管理処理方法,データベース管理システム用のプログラムおよびその記録媒体
JP3804609B2 (ja) 検索チューニング方法および情報検索システム
JPH1185585A (ja) 完全メモリ常駐型インデックス方法および装置
JP2990312B2 (ja) データアクセス方法および装置
JPH03268064A (ja) データ検索装置及びデータ検索方法
JP3376874B2 (ja) データ分割による検索効率化方式
JP2975529B2 (ja) 電子化辞書検索装置
JPS6327927A (ja) 予約情報検索システムにおけるインデツクス作成方式
JPH06203075A (ja) 電子電話帳
JPH03118661A (ja) 単語検索装置
JPH0340043A (ja) データベース世代管理方法
JPS633351A (ja) バツフア検索制御方式
JPH07105223A (ja) データベース検索装置
CN114428792A (zh) 一种数据缓存取用方法、装置、计算机设备及存储介质
JPH0991304A (ja) 情報検索方法、情報検索システム及び情報検索用記憶媒体
JPH0225974A (ja) データベース更新検索方式
JP2000172542A (ja) ファイルアクセス方式
JPH0212565A (ja) 関係データベースシステム
JPS62187930A (ja) 検索方法及び装置
JPH04230576A (ja) 項目選択装置
JPH043251A (ja) 文書検索方法および文書検索処理装置