JP3578092B2 - 文書検索方法及びシステム及び文書検索プログラム及び文書検索プログラムを格納した記憶媒体 - Google Patents
文書検索方法及びシステム及び文書検索プログラム及び文書検索プログラムを格納した記憶媒体 Download PDFInfo
- Publication number
- JP3578092B2 JP3578092B2 JP2001039183A JP2001039183A JP3578092B2 JP 3578092 B2 JP3578092 B2 JP 3578092B2 JP 2001039183 A JP2001039183 A JP 2001039183A JP 2001039183 A JP2001039183 A JP 2001039183A JP 3578092 B2 JP3578092 B2 JP 3578092B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- document
- index file
- file
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【発明の属する技術分野】
本発明は、文書検索方法及びシステム及び文書検索プログラム及び文書検索プログラムを格納した記憶媒体に係り、特に、検索対象となる文書の追加削除を高速に行うことが可能な文書検索方法及びシステム及び文書検索プログラム及び文書検索プログラムを格納した記憶媒体に関する。
【0002】
【従来の技術】
従来の文書(全文)検索装置について説明する。
【0003】
図8は、従来の文書検索装置の構成を示す。
【0004】
従来の文書検索システムは、文書検索装置10、インデクスファイル20、及び文書データベース30より構成され、文書検索装置10は、文書検索部11とインデクス作成部12からなる。
【0005】
インデクス作成部12は、検索を高速に行うために、インデクスの作成(更新)要求に従い、予めインデクスファイルを作成(更新)する。以下にインデクス新規作成手順とインデクス更新手順を示す。
【0006】
図9は、従来の文書検索装置のインデクス作成部におけるインデクス新規作成のフローチャートである。
【0007】
ステップ11) インデクス作成要求を入力として取得する。
【0008】
ステップ12) インデクス作成要求に記述された内容に基づき検索対象となる文書の集合を文書データベース30から取得する。この文書集合をDとする。
ステップ13) それぞれの文書j∈Dに使用されている単語iを抽出する。
ステップ14) インデクスファイル20を作成し出力する。ここで、インデクスファイル20は、以下のキーと値を持つテーブルであり、キーを単語i、値を単語iの出現する文書IDの集合とする。
【0009】
以下の、このテーブルの値の部分(文書IDの集合)をポステイング情報と呼ぶ。インデクスファイルの例を図10に示す。例えば、図10において、単語“言語”は、文書IDが“1,3,5”の文書に出現することを示す。
【0010】
ステップ15) インデクスの作成が完了したら、作成完了通知を出力する。
次に、インデクスの更新手順について説明する。
【0011】
図11は、従来の文書検索装置のインデクス作成部におけるインデクス更新のフローチャートである。
【0012】
ステップ21) インデクス更新(文書の追加or削除)要求を入力として取得する。
【0013】
ステップ22) インデクス更新要求が削除要求の場合にはステップ23に移行し、追加要求の場合にはステップ24に移行する。
【0014】
ステップ23) 削除要求の場合は、指定された削除対象文書の文書IDをインデクスファイルのポスティング情報から削除する。
【0015】
ステップ24) 追加要求の場合は、新規作成の場合と同様に、文書データベース30から追加対象の文書集合を取得し、それぞれの文書から単語を抽出し、インデクスファイル20へ追加する。
【0016】
ステップ25) インデクスの更新が完了したら、更新完了通知を出力する。
次に、文書検索部11について説明する。
【0017】
文書検索部11は、入力として検索式を取得し、これに合致する検索結果(文書IDの集合)を出力する。この際にインデクス作成部12が作成したインデクスファイル20を利用する。
【0018】
具体的な動作を以下に示す。
【0019】
図12は、従来の文書検索装置の文書検索部における検索動作のフローチャートである。
【0020】
ステップ31) 単語または、単語のブール演算子結合によって記述される検索式qを入力として取得する。
【0021】
ステップ32) インデクスが更新中(または、新規作成中)である場合にはステップ33に移行し、そうでない場合にはステップ34に移行する。
【0022】
ステップ33) エラーを出力して処理を終了する。
【0023】
ステップ34) 検索式qに含まれるそれぞれの単語iを用いて、インデクスファイルを参照し、そのポスティング情報から単語iが出現する文書IDの集合Sを取得する。
【0024】
ステップ35) 検索式qに含まれるブール演算子を処理して、検索式に合致する文書IDの集合Rを集合Sの中から選定する。
【0025】
ステップ36) 検索結果として文書IDの集合Rを出力する。
【0026】
インデクスファイル20を用いた文書検索装置10では、検索式で指定された単語が出現する文書IDの集合を瞬時に取得することができる。そのため、非常に高速に検索を行うことができる。
【0027】
例えば、“(言語and処理)or知識”という検索式が与えられた場合、図10のインデクスファイル20からそれぞれの単語が出現する文書は、
言語(1 3 5)
処理(3 4 10)
知識(2 5)
であると瞬時にわかる。そして、検索式のブール演算子を処理することによって検索結果は、文書“2、3、5”となる。このように、インデクスファイル20を用いると、検索対象のすべての文書を走査する必要がなくなり高速に検索を行うことができるので、特に検索対象となる文書量が大きい場合に有効である。
【0028】
【発明が解決しようとする課題】
しかしながら、上記従来のインデクスファイルを用いた文書検索装置には、大規模な文書を対象とした場合でも検索速度が速いという特徴を持つ反面、以下の2つの問題がある。
【0029】
(a) 検索対象する文書量が大きくなるにつれて、インデクスの更新(文書の追加削除)時間が大きくなるという問題:
文書検索装置において、インデクスの更新(文書の追加削除)を行うためには、それぞれの単語の対応したインデクスファイルのポスティング情報を書き替える必要がある。例えば、図10のインデクスファイルに図13の文書を追加すると図14の内容となる。当然、既にインデクスされている文書量が大きければ大きいほど、インデクスファイルに登録される異なり語の個数とポスティング情報の大きさは大きくなる。そのため、文書の更新時間は、既にインデクスされている文書の量の応じて大きくなってしまう。その結果、既にインデクスされている文書量が大きい場合に追加や削除を行ってもインデクスに反映されるまでに時間がかかるという問題がある。
【0030】
(b) 更新作業中に検索を行うことができない問題:
文書検索装置の構成から明らかなようにインデクスの更新作業をしている間は、検索を行うことができない。この問題を解決するために、インデクスファイルを一旦コピーし、コピー先のインデクスファイルに対して更新作業を行ない、この間の検索は、コピー元のインデクスファイルを用いて行う。そして、更新作業が終わった時点で、新しいインデクスファイルを引くように切り替えるということが行われている。この方法によって、更新作業中でも原理的には検索を行うことができる。しかしながら、この方法では、更新作業中にインデクスファイルの全体のサイズの2倍ものディクス領域が必要になるため、文書が大規模な場合にディスク容量の問題がある。
【0031】
本発明は、上記の点に鑑みなされたもので、インデクス更新中でも検索が実行でき、また、検索対象の文書量が大きくなった場合でも更新時間を予め管理者が決めた時間内で終わらせることが可能な文書検索方法及びシステム及び文書検索プログラム及び文書検索プログラムを格納した記憶媒体を提供することを目的とする。
【0032】
【課題を解決するための手段】
図1は、本発明の原理を説明するための図である。
【0037】
本発明(請求項1)は、互いに異なる文書集合から作成されたインデックスファイルを持つ検索実行装置を複数台有するシステムにおいて、検索式が入力されると、稼動中の各検索実行装置に検索式を送信し、該各検索実行装置から各文書集合に対する検索結果を取得し、取得した該検索結果を統合して全文書集合に対する検索結果として出力する検索管理装置における文書検索方法において、
検索管理装置が、文書の追加または削除要求を取得した場合には(ステップ1)、
検索実行装置のいずれかが有する更新対象となるインデクスファイルをコピーし(ステップ2)、
コピー先のインデクスファイルに対して更新作業を行い(ステップ3)、
更新中は、コピー元のインデクスファイルを用いて検索を行い(ステップ4)、
コピー先のインデクスファイルの更新作業が終了した後に(ステップ5)、インデクスファイルを該コピー先のインデクスファイルに切り替える(ステップ6)。
【0038】
本発明(請求項2)は、検索管理装置が、文書の追加要求を取得した場合には、
複数の検索実行装置が有するインデクスファイルの中から最もファイルサイズの小さいものを見つけ、
ファイルサイズが予め指定されたサイズより小さければ、インデクスファイルに文書を追加する更新要求を発行し、
ファイルサイズが予め指定されたサイズより大きい場合には、新たな空のインデックスファイルを作成して、該新たな空のインデクスファイルに文書を追加する更新要求を発行する。
図2は、本発明の原理構成図である。
【0042】
本発明(請求項3)は、互いに異なる文書集合から作成されたインデックスファイルを持ち検索機能と文書の追加・削除機能とを有する複数の検索実行装置200と、検索式を入力する検索式入力手段、稼動中の各検索実行装置200に検索式を送信する検索式送信手段、該各検索実行装置200から各文書集合に対する検索結果を取得し、該検索結果を統合して全文書集合に対する検索結果として出力する統合出力手段とを有するメタ検索装置110と、どの検索実行装置200が現在稼動中かを管理し、文書の追加・削除要求に応じて適切な検索実行装置200に追加・削除要求を送信する要求送信手段を有する検索管理装置120とを有する文書検索システムであって、
検索管理装置120において、
追加または削除要求を取得した場合に、検索実行装置200のいずれかが有する更新対象となるインデクスファイルのコピーを指示する手段と、
コピー先のインデクスファイルに対して更新作業を行なわせる手段と、
コピー先のインデクスファイルが更新中は、コピー元のインデクスファイルを用いて検索を行なわせる手段と、
コピー先のインデクスファイルの更新作業が終了した後に、インデクスファイルを該コピー先のインデクスファイルに切り替えさせる手段と、
稼動中の検索実行装置のリストを更新する手段と、を有する。
【0043】
本発明(請求項4)は、検索管理装置120において、
文書の追加要求を取得した場合に、複数の検索実行装置200が有するインデクスファイルの中から最もファイルサイズの小さいものを見つける手段と、
ファイルサイズが予め指定されたサイズより小さければ、インデクスファイルに文書を追加する更新要求を発行する手段と、
ファイルサイズが予め指定されたサイズより大きい場合には、新たな空のインデックスファイルを作成して、該新たな空のインデクスファイルに文書を追加する更新要求を発行する手段と、を有する。
【0047】
本発明(請求項5)は、互いに異なる文書集合から作成されたインデックスファイルを持つ複数の検索実行装置を有するシステムにおいて、検索式が入力されると、各検索実行装置の稼動状況を取得し、稼動中の各検索実行装置に検索式を送信し、該各検索実行装置から各文書集合に対する検索結果を取得し、取得した該検索結果を統合して全文書集合に対する検索結果として出力する検索管理装置に実行させる文書検索プログラムであって、
検索管理装置が、追加または削除要求を取得した場合に、
検索実行装置のいずれかが有する更新対象となる、インデクスファイルのコピーを指示するステップと、
コピー先のインデクスファイルに対して更新作業を行わせるステップと、
更新中は、コピー元のインデクスファイルを用いて検索を行わせるステップと、
コピー先のインデクスファイルの更新作業が終了した後に、インデクスファイルを該コピー先のインデクスファイルに切り替えさせるステップと、
稼動中の検索実行装置のリストを更新するステップと、を実行させる。
【0048】
本発明(請求項6)は、文書の追加要求を取得した場合に、
複数の検索実行装置が有するインデクスファイルの中から最もファイルサイズの小さいものを見つけるステップと、
ファイルサイズが予め指定されたサイズより小さければ、インデクスファイルに文書を追加する更新要求を発行するステップと、
ファイルサイズが予め指定されたサイズより大きい場合には、新たな空のインデックスファイルを作成して、該新たな空のインデクスファイルに文書を追加する更新要求を発行するステップと、を実行させる。
【0052】
本発明(請求項7)は、互いに異なる文書集合から作成されたインデックスファイルを持つ複数の検索実行装置を有するシステムにおいて、検索式が入力されると、各検索実行装置の稼動状況を取得し、稼動中の各検索実行装置に検索式を送信し、該各検索実行装置から各文書集合に対する検索結果を取得し、取得した該検索結果を統合して全文書集合に対する検索結果として出力する検索管理装置に実行させる文書検索プログラムを格納した記憶媒体であって、
検索管理装置が、追加または削除要求を取得した場合に、
検索実行装置のいずれかが有する更新対象となる、インデクスファイルのコピーを指示するステップと、
コピー先のインデクスファイルに対して更新作業を行わせるステップと、
更新中は、コピー元のインデクスファイルを用いて検索を行わせるステップと、
コピー先のインデクスファイルの更新作業が終了した後に、インデクスファイルを該コピー先のインデクスファイルに切り替えさせるステップと、
稼動中の検索実行装置のリストを更新するステップと、を実行させる文書検索プログラムを格納した記憶媒体である。
【0053】
本発明(請求項8)は、文書の追加要求を取得した場合に、
複数の検索実行装置が有するインデクスファイルの中から最もファイルサイズの小さいものを見つけるステップと、
ファイルサイズが予め指定されたサイズより小さければ、インデクスファイルに文書を追加する更新要求を発行するステップと、
ファイルサイズが予め指定されたサイズより大きい場合には、新たな空のインデックスファイルを作成して、該新たな空のインデクスファイルに文書を追加する更新要求を発行するステップと、を実行させる。
【0054】
上記のように、本発明によれば、インデクスの更新機能を持った複数の実行装置と、これらの検索実行装置に対して一度に検索を行ない、検索結果を統合するメタ検索装置と、どの検索実行装置に対して文書の追加削除を行うのかと、どの検索実行装置に対して検索式を送信するのかを管理する検索管理装置を持ち、インデクスファイルの更新中でも検索の実行を可能とし、また、検索対象の文書量が大きくなった場合でも更新時間を予め管理者が決めた時間内で終わらせることが可能となる。
【0055】
【発明の実施の形態】
図3は、本発明の文書検索装置の構成を示す。
【0056】
同図に示す文書検索装置は、メタ検索装置110、検索管理装置120、複数の検索実行装置200から構成される。
【0057】
これらの装置は、ネットワークで接続され、相互に通信を行う。
【0058】
検索実行装置200は、図4に示すように、従来の文書検索装置と同等の機能を持つものであり、インデクス作成部210と文書検索部220からなる。インデクス作成部210は、インデクスファイル300の作成と更新を行う。文書検索部220は、検索式を受け取るとインデクスファイル300を引き、それに応じた検索結果を返す。ここで検索実行装置200単体では、従来の文書検索装置と同様に、インデクスファイルの更新中に検索を行うことはできない。
【0059】
メタ検索装置110は、検索式を入力として取得すると、まず、検索管理装置120から取得した稼働中の検索実行装置200のリストを用いて、どの検索実行装置200に検索式を送るかを決定する。そして、それらの検索実行装置200にその検索式を送り、それぞれの検索実行装置200から検索結果として取得した文書IDのリストを纏めることによって全体の検索結果を作成し、出力する。ここで、検索結果のまとめ方は特に限定しない。例えば、各検索装置からの検索結果を単純に結合して出力する、または、各検索装置からの検索結果が、例えば、検索式との一致度(得点)を持つ場合、各検索装置からの検索結果を得点準にソートして出力する等が考えられる。
【0060】
検索管理装置120は、インデクスファイル300の更新処理全体を管理する。まず、更新要求(文の追加・削除要求)を入力として取得する。文書の追加要求の場合、文書データベース140から追加対象となる文書を取得し、適切な検索実行装置200に対して追加要求を送る。削除要求の場合には、適切な検索実行装置200に対して削除要求を送る。更新完了通知を検索実行装置200から取得すると稼働中の検索実行装置200のリストを変更し、これをメタ検索装置110に送る。
【0061】
【実施例】
以下、図面と共の本発明の実施例を説明する。
【0062】
実際に文書検索及びインデクスの更新(文の追加と削除)がどのように行われるかを以下に示す。
【0063】
最初に、メタ検索装置110における文書検索について説明する。
【0064】
図5は、本発明の一実施例の文書検索の動作のシーケンスチャートである。
【0065】
メタ検索装置110は、単語、または、単語のブール演算結合からなる検索式を入力として取得する(ステップ101)。
【0066】
検索管理装置120から稼働中の検索実行装置200のリストを取得して(ステップ102)調べ、稼働中の検索実行装置に対して検索式を送信する(ステップ103)。
【0067】
それぞれの検索実行装置200から結果を受信し(ステップ104)、取得した結果をまとめることによって全体の検索結果を作成する(ステップ105)。ステップ105で作成した検索結果を出力する(ステップ106)。
【0068】
次に、文書の追加要求が発行された場合における、検索管理装置120の追加処理について説明する。
【0069】
図6は、本発明の一実施例の文書追加処理のフローチャートである。
【0070】
ステップ201) 検索管理装置120が、文書の追加要求を入力として取得する。
【0071】
ステップ202) 検索管理装置120は、現在稼働中の検索実行装置200の中で、最小サイズのインデクスファイルを持つ検索実行装置を抽出する。このインデクスファイルのIDをkとする。また、以下、kを持つ検索実行装置200をs(k)で表す。
【0072】
ステップ203) もし、「kのサイズ<インデクスファイルの最大サイズm」ならば、インデクスの更新処理のステップ204に移行し、そうでなければ、インデクス新規作成処理のステップ209に移行する。ここで、インデクスファイルの最大サイズmは予めシステム管理者が決めておくものとする。
【0073】
ステップ204) kをコピーしたインデクスファイルk’を作成する。
【0074】
ステップ205) 検索管理装置120は、検索実行装置s(k’)を起動し、s(k’)のインデクス作成部210に文書追加処理を依頼する。
【0075】
ステップ206) 検索管理装置120は、検索実行装置s(k’)から更新完了通知を受けたら稼働中の検索実行装置リストを更新する。具体的にはs(k)をリストから削除し、s(k’) を検索実行装置リストに加える。
【0076】
ステップ207) 検索管理装置120は、検索実行装置リストをメタ検索装置110に送る。
【0077】
ステップ208) 検索管理装置120は、検索実行装置s(k)に対するすべての検索処理が終了したのを確認し、s(k)を停止させる。
【0078】
ステップ209) 空のインデクスファイルxを作成する。
【0079】
ステップ210) 検索管理装置120は、新しい検索実行装置s(x)を起動する。
【0080】
ステップ211) 検索管理装置120は、検索実行装置s(x)のインデクス作成部210に文書追加処理を依頼する。
【0081】
ステップ212) 検索管理装置120は、検索実行装置s(x)から更新完了通知を取得したら検索実行装置リストに当該検索実行装置s(x)を追加する。
【0082】
ステップ213) 検索管理装置120は、検索実行装置リストをメタ検索装置110に送る。
【0083】
次に、インデクスの更新として文書の削除の例を説明する。
【0084】
図7は、本発明の一実施例の文書削除処理のシーケンスチャートである。
【0085】
ステップ301) 検索管理装置120は、文書の削除要求を入力として受け取る。
【0086】
ステップ302) 削除要求で指定された文書IDからどの検索実行装置s(k)に対する削除要求なのかを判定する。
【0087】
ステップ303) 当該検索実行装置s(k)を介してインデクスファイルをコピーしてk’を作成する。
【0088】
ステップ304) 検索管理装置120は、検索実行装置s(k’)を起動し、s(k’)のインデクス作成部210に文書削除処理を依頼する。
【0089】
ステップ305) 検索管理装置120は、s(k’)から更新完了通知を取得したら、検索実行装置リストを更新する。具体的には、s(k)をリストから削除し、s(k’)をリストに加える。
【0090】
ステップ306) 検索管理装置120は、検索実行装置s(k)に対する検索処理がすべて終了したのを確認し、検索実行装置s(k)を停止させる。
【0091】
上記により、前述の問題点が解決されるが、以下にその理由を説明する。
【0092】
(a) 検索対象とする文書量が大きくなるにつれて、インデクスの更新(文書の追加・削除)時間が大きくなるという問題:
本発明を用いた場合、文書量がどんなに大きくなったとしてもそれぞれのインデクスファイルのサイズは最大でもmに保たれる。ここで、mは、インデクスファイルの最大サイズであり、システム管理者が自由に指定できる。また、mを越えるような追加が行われる場合には、自動的に新しいインデクスファイルが作成される。従って、インデクスの更新時間は、文書量によらずmによって決まるので、文書量が大きくなった場合でもシステム管理者が任意の時間に設定することができる。
【0093】
(b) 更新作業中に検索を行うことができない問題:
本発明を用いた更新作業では、更新対象のインデクスファイルを一旦コピーし、コピー先のインデクスファイルに対して更新が行われる。そして、更新作業中は、コピー元のインデクスファイルを用いて検索が行われる。そのため、更新作業中でも中断することなく検索を行うことができる。また、コピーされるインデクスファイルのサイズは最大でもシステム管理者の定めたmであるので、既にインデクスされている文書量によらない。そのため、文書量が大きくなった場合でもディスクスペースの問題は起きない。
【0094】
また、上記の実施例では、図3の構成に基づいて説明したが、メタ検索装置110、検索管理装置120をプログラムとして構築し、検索装置として利用されるコンピュータのCPUにインストールする、または、通信網を介して流通させることも可能である。
【0095】
また、構築されたプログラムをコンピュータに接続されるディスク装置や、フロッピーディスクやCD−ROM等の可搬記憶媒体に格納しておき、本発明を実施する際にインストールすることにより容易に本発明を実現できる。
【0096】
なお、本発明は、上記の実施例に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
【0097】
【発明の効果】
上述のように、本発明によれば、検索対象の文書が大規模になった場合でも、非常に短い時間で、かつ、検索を中断することなくインデクスの更新(文書の追加削除)作業を行うことができるので、大規模な文書検索システムの利便性を向上させることができる。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明の文書検索装置の構成図である。
【図4】本発明の検索実行装置の構成図である。
【図5】本発明の一実施例の文書検索の動作のフローチャートである。
【図6】本発明の一実施例の文書追加処理のフローチャートである。
【図7】本発明の一実施例の文書削除処理のシーケンスチャートである。
【図8】従来の文書検索装置の構成図である。
【図9】従来の文書検索装置のインデクス作成部におけるインデクス新規作成のフローチャートである。
【図10】従来のインデクスファイルの例である。
【図11】従来の文書検索装置のインデクス作成部におけるインデクス更新のフローチャートである。
【図12】従来の文書検索装置の文書検索部の動作のフローチャートである。
【図13】従来の例における追加ドキュメントの例である。
【図14】従来の例におけるドキュメント追加後のインデクスファイルの例である。
【符号の説明】
110 メタ検索装置
120 検索管理装置
200 検索実行装置
210 インデクス作成部
220 文書検索部
300 インデクスファイル
400 文書データベース
Claims (8)
- 互いに異なる文書集合から作成されたインデックスファイルを持つ検索実行装置を複数台有するシステムにおいて、検索式が入力されると、各検索実行装置に検索式を送信し、該各検索実行装置から各文書集合に対する検索結果を取得し、取得した該検索結果を統合して全文書集合に対する検索結果として出力する検索管理装置における文書検索方法において、
前記検索管理装置が、文書の追加または削除要求を取得した場合には、
前記検索実行装置のいずれかが有する更新対象となる、インデクスファイルをコピーし、
コピー先のインデクスファイルに対して更新作業を行い、
更新中は、コピー元のインデクスファイルを用いて検索を行い、
前記コピー先のインデクスファイルの更新作業が終了した後に、インデクスファイルを該コピー先のインデクスファイルに切り替えることを特徴とする文書検索方法。 - 前記検索管理装置が、文書の追加要求を取得した場合には、
前記複数の検索実行装置が有する前記インデクスファイルの中から最もファイルサイズの小さいものを見つけ、
前記ファイルサイズが予め指定されたサイズより小さければ、前記インデクスファイルに文書を追加する更新要求を発行し、
前記ファイルサイズが予め指定されたサイズより大きい場合には、新たな空のインデックスファイルを作成して、該新たな空のインデクスファイルに文書を追加する更新要求を発行する請求項1記載の文書検索方法。 - 互いに異なる文書集合から作成されたインデックスファイルを持ち検索機能と文書の追加・削除機能とを有する複数の検索実行装置と、検索式を入力する検索式入力手段、稼動中の各検索実行装置に前記検索式を送信する検索式送信手段、該各検索実行装置から各文書集合に対する検索結果を取得し、該検索結果を統合して全文書集合に対する検索結果として出力する統合出力手段とを有するメタ検索装置と、どの検索実行装置が現在稼動中かを管理し、文書の追加・削除要求に応じて適切な検索実行装置に、追加・削除要求を送信する要求送信手段を有する検索管理装置とを有する文書検索システムであって、
前記検索管理装置は、
追加または削除要求を取得した場合に、前記検索実行装置に対して、該検索実行装置のいずれかが有する更新対象となるインデクスファイルのコピーを指示する手段と、
コピー先のインデクスファイルに対して更新作業を行なわせる手段と、
前記コピー先のインデクスファイルが更新中は、コピー元のインデクスファイルを用いて検索を行なわせる手段と、
前記コピー先のインデクスファイルの更新作業が終了した後に、インデクスファイルを該コピー先のインデクスファイルに切り替えさせる手段と、
稼動中の検索実行装置のリストを更新する手段と、
を有することを特徴とする文書検索システム。 - 前記検索管理装置は、
文書の追加要求を取得した場合に、前記複数の検索実行装置が有する前記インデクスファイルの中から最もファイルサイズの小さいものを見つける手段と、
前記ファイルサイズが予め指定されたサイズより小さければ、前記インデクスファイルに文書を追加する更新要求を発行する手段と、
前記ファイルサイズが予め指定されたサイズより大きい場合には、新たな空のインデックスファイルを作成して、該新たな空のインデクスファイルに文書を追加する更新要求を発行する手段と、を有する請求項3記載の文書検索システム。 - 互いに異なる文書集合から作成されたインデックスファイルを持つ複数の検索実行装置を有するシステムにおいて、検索式が入力されると、各検索実行装置の稼動状況を取得し、稼動中の各検索実行装置に検索式を送信し、該各検索実行装置から各文書集合に対する検索結果を取得し、取得した該検索結果を統合して全文書集合に対する検索結果として出力する検索管理装置に実行させる文書検索プログラムであって、
前記検索管理装置が、追加または削除要求を取得した場合に、
前記検索実行装置のいずれかが有する更新対象となる、インデクスファイルのコピーを指示するステップと、
コピー先のインデクスファイルに対して更新作業を行わせるステップと、
更新中は、コピー元のインデクスファイルを用いて検索を行わせるステップと、
前記コピー先のインデクスファイルの更新作業が終了した後に、インデクスファイルを該コピー先のインデクスファイルに切り替えさせるステップと、
稼動中の検索実行装置のリストを更新するステップと、
を実行させることを特徴とする文書検索プログラム。 - 文書の追加要求を取得した場合に、
前記複数の検索実行装置が有する前記インデクスファイルの中から最もファイルサイズの小さいものを見つけるステップと、
前記ファイルサイズが予め指定されたサイズより小さければ、前記インデクスファイルに文書を追加する更新要求を発行するステップと、
前記ファイルサイズが予め指定されたサイズより大きい場合には、新たな空のインデックスファイルを作成して、該新たな空のインデクスファイルに文書を追加する更新要求を発行するステップと、を実行させる請求項5記載の文書検索プログラム。 - 互いに異なる文書集合から作成されたインデックスファイルを持つ複数の検索実行装置を有するシステムにおいて、検索式が入力されると、各検索実行装置の稼動状況を取得し、稼動中の各検索実行装置に検索式を送信し、該各検索実行装置から各文書集合に対する検索結果を取得し、取得した該検索結果を統合して全文書集合に対する検索結果として出力する検索管理装置に実行させる文書検索プログラムを格納した記憶媒体であって、
前記検索管理装置が、追加または削除要求を取得した場合に、
前記検索実行装置のいずれかが有する更新対象となる、インデクスファイルのコピーを指示するステップと、
コピー先のインデクスファイルに対して更新作業を行わせるステップと、
更新中は、コピー元のインデクスファイルを用いて検索を行わせるステップと、
前記コピー先のインデクスファイルの更新作業が終了した後に、インデクスファイルを該コピー先のインデクスファイルに切り替えさせるステップと、
稼動中の検索実行装置のリストを更新するステップと、
を実行させることを特徴とする文書検索プログラムを格納した記憶媒体。 - 文書の追加要求を取得した場合に、
前記複数の検索実行装置が有する前記インデクスファイルの中から最もファイルサイズの小さいものを見つけるステップと、
前記ファイルサイズが予め指定されたサイズより小さければ、前記インデクスファイルに文書を追加する更新要求を発行するステップと、
前記ファイルサイズが予め指定されたサイズより大きい場合には、新たな空のインデックスファイルを作成して、該新たな空のインデクスファイルに文書を追加する更新要求を発行するステップと、を実行させる請求項7記載の文書検索プログラムを格納した記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001039183A JP3578092B2 (ja) | 2001-02-15 | 2001-02-15 | 文書検索方法及びシステム及び文書検索プログラム及び文書検索プログラムを格納した記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001039183A JP3578092B2 (ja) | 2001-02-15 | 2001-02-15 | 文書検索方法及びシステム及び文書検索プログラム及び文書検索プログラムを格納した記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002245039A JP2002245039A (ja) | 2002-08-30 |
JP3578092B2 true JP3578092B2 (ja) | 2004-10-20 |
Family
ID=18902034
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001039183A Expired - Lifetime JP3578092B2 (ja) | 2001-02-15 | 2001-02-15 | 文書検索方法及びシステム及び文書検索プログラム及び文書検索プログラムを格納した記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3578092B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5108252B2 (ja) * | 2006-04-27 | 2012-12-26 | 株式会社日立製作所 | インデクス更新方法及びそのシステム |
JP5437557B2 (ja) * | 2006-10-19 | 2014-03-12 | 富士通株式会社 | 検索処理方法及び検索システム |
JP5283478B2 (ja) | 2008-10-23 | 2013-09-04 | 株式会社日立ソリューションズ | 検索システム |
CN101546342B (zh) * | 2009-05-08 | 2012-07-04 | 阿里巴巴集团控股有限公司 | 实现搜索服务的方法与系统 |
JP5370328B2 (ja) * | 2010-09-29 | 2013-12-18 | ブラザー工業株式会社 | ノード装置、情報通信システム、情報処理方法及び情報処理プログラム |
JP6033070B2 (ja) * | 2012-12-14 | 2016-11-30 | 株式会社エクサ | データ管理装置及びデータ管理プログラム |
JP5538585B1 (ja) * | 2013-03-18 | 2014-07-02 | 三菱電機インフォメーションシステムズ株式会社 | データ検索システム及びデータ検索プログラム |
-
2001
- 2001-02-15 JP JP2001039183A patent/JP3578092B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2002245039A (ja) | 2002-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5437557B2 (ja) | 検索処理方法及び検索システム | |
JP2004287572A (ja) | ファイルストレージサービスシステム、ファイル管理装置、ファイル管理方法、id指定型nasサーバ、および、ファイル読出方法 | |
WO2022148055A1 (zh) | 一种文件检索方法及计算设备 | |
JPWO2008069125A1 (ja) | データ管理装置 | |
WO2008141583A1 (fr) | Procédé d'entrée de caractères, système d'entrée et procédé pour mettre à jour un lexique de mots | |
JP2006092515A (ja) | 索引キーを使用して検索を絞込むシステムおよび方法 | |
JP2010033227A (ja) | 文書管理装置、文書管理プログラム、及び文書管理システム | |
JP3578092B2 (ja) | 文書検索方法及びシステム及び文書検索プログラム及び文書検索プログラムを格納した記憶媒体 | |
JPH09204442A (ja) | ドキュメントデータ検索システム | |
JP7103763B2 (ja) | 情報処理システムおよび情報処理方法 | |
CN115543994A (zh) | 元数据检索方法、服务器、检索方法及终端设备 | |
JP4154118B2 (ja) | 関連語選出装置、その方法および記録媒体、並びに文書検索装置、その方法および記録媒体 | |
JP2002366410A (ja) | ごみ箱サーバおよびごみ箱処理プログラム | |
JP2002259387A (ja) | 文書検索システム | |
JP2009093581A (ja) | 類義語検索管理システム | |
JPH117445A (ja) | 統合化文書管理装置 | |
JPH07210435A (ja) | データベース管理装置 | |
JP2006085565A (ja) | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム | |
JP4065715B2 (ja) | ジョブ処理装置 | |
JP3601869B2 (ja) | 機械翻訳システム | |
US20240126750A1 (en) | Accelerating query execution by optimizing data transfer between storage nodes and database nodes | |
JP2002269148A (ja) | 文書管理装置および文書管理方法ならびに情報記録媒体 | |
KR101733118B1 (ko) | 메타데이터 연산 충돌 회피 방법 및 이를 수행하는 메타 데이터 관리 시스템 | |
JP3982969B2 (ja) | 文書管理装置 | |
JP2008021031A (ja) | 検索サーバ装置及びその制御方法、情報処理装置及びその制御方法、情報処理システム、情報検索装置及びその制御方法、プログラム、記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040323 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040517 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040622 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040705 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3578092 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080723 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080723 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090723 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090723 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100723 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100723 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110723 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120723 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130723 Year of fee payment: 9 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |