JP3693958B2 - 分散型文書検索方法及び装置、並びに分散型文書検索プログラム及びそのプログラムを記録した記録媒体 - Google Patents
分散型文書検索方法及び装置、並びに分散型文書検索プログラム及びそのプログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP3693958B2 JP3693958B2 JP2002002669A JP2002002669A JP3693958B2 JP 3693958 B2 JP3693958 B2 JP 3693958B2 JP 2002002669 A JP2002002669 A JP 2002002669A JP 2002002669 A JP2002002669 A JP 2002002669A JP 3693958 B2 JP3693958 B2 JP 3693958B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- integrated
- search server
- version
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2471—Distributed queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Computer And Data Communications (AREA)
Description
【発明の属する技術分野】
本発明は分散型文書検索方法及び装置、とりわけ文書検索を効率良く且つ高速で行なうことができる分散型文書検索方法及び装置に関するものである。
【0002】
【従来の技術】
従来の文書検索装置としては、例えば特開平9−319757号公報或いは特開平10−21250号公報に記載されたものがある。特開平9−319757号公報の文書検索装置は、各検索サーバで閉じたスコア計算とランキングを行い、各々上位M件を返すようにしたものである。
【0003】
また、特開平10−21250号公報の文書検索装置は、1つ以上のサーチエンジンを用いて、1つ以上のサーバから利用可能な複数個のデータベースを使用する文献検索の方法を提供するものである。
【0004】
【発明が解決しようとする課題】
しかしながら、上記のような従来の技術においては、特開平9−319757号公報の文書検索装置の技術ではランキング結果が不正確である不具合がある。また、特開平10−21250号公報の文書検索装置の技術では、スコア計算、ランキング結果は正確だが、各検索サーバがヒットした全レコードの情報を返すので効率が悪く、非現実的であるという不具合がある。
【0005】
本発明は、上記従来の問題点に鑑みてなされたもので、その目的は、文書検索を行なうに当たって効率的かつ正確な検索文書間のランキングを行ない、文書検索の品質を向上させることのできる文章検索方法及びそれを用いた分散型文書検索方法及び装置を提供することである。
【0006】
【課題を解決するための手段】
本発明は上記目的を達成するため、複数の文書を格納するデータベースに対して文書検索を行なう複数の検索サーバと、これらの複数の検索サーバに通信接続され、各検索サーバに対して検索指示を行なう統合検索サーバとにより文書検索を行なう分散型文書検索方法として、各検索サーバは、検索動作によって得られた中間結果を基に作成した統計情報を統合検索サーバへ送付し、統合検索サーバでは、前記統計情報を集計し、大域的な統計情報を作成して各検索サーバへ送付し、各検索サーバは前記大域的な統計情報を基にスコアを計算し、各々検索条件に合致した検索結果を統合検索サーバに返送し、前記各検索サーバは、前記データベースの版の更新を各検索サーバで独立に行い、この版の更新は統合検索サーバに対して更新の都度報告せず、その後の検索要求に対する検索動作を行なった時に版情報を統計情報とともに統合検索サーバに送付し、統合検索サーバでは、前記版情報が送られてきた時又は必要に応じて、各検索サーバのデータベースの最新版を組み合わせた統合版を自動的に生成して各検索サーバへ送付するようにしたものである。これにより文書検索に際してより確実で効率的な文書検索を行なうことができるものである。
【0007】
本発明はまた、分散型文書検索装置として、複数の文書を格納するデータベースに対して文書検索を行なう複数の検索サーバと、これらの複数の検索サーバに通信接続され、各検索サーバに対して検索指示を行なう統合検索サーバとから成り、前記検索サーバは、データベースに対して検索動作を行なう検索手段と、検索の結果得られた中間結果を保持する手段と、中間結果から統計情報を作成出力する統計情報出力手段と、検索した各文書に対してスコアを付けるスコア算出手段とを備え、また、前記統合検索サーバは、複数の検索サーバから送付された統計情報を集計する統計情報集計手段を備え、前記統合検索サーバで大域的な統計情報を作成して各検索サーバへ送付し、各検索サーバは前記大域的な統計情報を基に正確なスコアを計算し、各々検索条件に合致した検索結果を統合検索サーバに返送し、前記統合検索サーバは、前記統計情報集計手段によって集計した統計情報を基に統合版を作成する手段と、前記統合版の更新を行なう統合版更新手段と、前記統合版の管理を行なう統合版管理手段とを備え、前記各検索サーバは、前記データベースの版の更新を行なう版更新手段と、版の管理を行なう版管理手段とを備え、前記版管理手段は、検索要求に対する検索動作を行なった時に版情報を統計情報とともに統合検索サーバに送付し、前記統合検索サーバは、前記版情報が送られてきた時又は必要に応じて、各検索サーバのデータベースの最新版を組み合わせた統合版を自動的に生成して各検索サーバへ送付する構成とした。これにより動作が簡潔且つ高速にでき、文書検索に際してより確実で効率的な文書検索を行なうことができるものである。
【0008】
本発明はさらに、複数の文書を格納するデータベースに対して文書検索を行なう複数の検索サーバと、これらの複数の検索サーバに通信接続され、各検索サーバに対して検索指示を行なう統合検索サーバとにより文書検索を実行させるために、各検索サーバに、検索動作によって得られた中間結果を基に作成した統計情報を統合検索サーバへ送付させるステップと、統合検索サーバに、前記統計情報を集計し、大域的な統計情報を作成して各検索サーバへ送付させるステップと、各検索サーバに前記大域的な統計情報を基にスコアを計算させ、各々検索条件に合致した検索結果を統合検索サーバに返送させるステップと、前記各検索サーバに、前記データベースの版の更新を各検索サーバで独立に行い、この版の更新は統合検索サーバに対して更新の都度報告せず、その後の検索要求に対する検索動作を行なった時に版情報を統計情報とともに統合検索サーバに送付するステップと、統合検索サーバに、前記版情報が送られてきた時又は必要に応じて、各検索サーバのデータベースの最新版を組み合わせた統合版を自動的に生成して各検索サーバへ送付するステップと、を含む処理を実行させるようにした分散型文書検索プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体とした。これにより文書検索に際してより確実で効率的な文書検索を行なうことができるものである。
【0009】
(実施の形態1)
以下、本発明の実施の形態について図面を参照して説明する。図1は本発明の第1の実施の形態に係る分散型文書検索装置の構成を示すブロック図である。図1において、1は統合検索サーバ、2は検索サーバであり、この実施の形態においては複数の検索サーバ2a、2bが設けられている。3はクライアントであり、文書検索の要求を出力し、また文書検索の結果を受け取る。統合検索サーバ1と検索サーバ2とは互いに通信接続されて文書検索のデータの送受を行なうようになっている。検索サーバ2a、2bは、個々に、大量の文書を格納するデータベースを備えており、それぞれのデータベースに格納されている文書に対して文書検索を実行する。統合検索サーバ1は複数の検索サーバ2から送付されてきた文書検索結果を集計し全体的な文書検索結果をクライアント(ユーザ)に対して提示するようになっている。
【0010】
図1の統合検索サーバ1において、11はクライアント3からのコマンドを受け取って検索条件を入力する検索条件入力手段、12は入力された検索条件を検索サーバ2へ送出する検索条件送信手段、13は検索サーバ2から送付されてきた統計情報を受け取って集計する統計情報集計手段、14は検索サーバ2から送付されてきた検索結果を所定の規則にしたがって並べ替える検索結果並べ替え手段、15は検索結果をクライアント3に対して送付する検索結果出力手段である。また、16は統計集計手段13において得られた集計結果から検索結果の統合版を更新する統合版更新手段、17は統合版を管理する統合版管理テーブル、18は統合版を参照してその結果を検索条件送信手段12に出力する統合版参照手段である。なお、統合版管理テーブル17は、統合検索サーバ1におけるメモリのデータ格納領域である。
【0011】
また、図1の検索サーバ2(2aを代表させるが、2bにおいても同じ構成である)において21は統合検索サーバ1からの検索条件を受け取って自己の検索条件を入力する検索条件入力手段、22は入力された検索条件にしたがって文書検索動作を実行する検索手段、23は大量の文書を格納するデータベース、24は検索手段22によって検索を行なった結果得られた文書検索の途中の結果である中間結果、25は中間結果24に基づいて各検索された文書に対してスコアを計算するスコア算出手段、26はスコア算出手段25によるスコア計算の結果に基づいて検索結果を並べ替える検索結果並べ替え手段、27は検索結果を統合検索サーバ1に対して送付する検索結果出力手段である。また、28は中間結果24から統計情報を作成しこの統計情報を統計検索サーバ1に対して送付する統計情報出力手段、29は検索サーバ2aにおける検索結果の版を管理する版管理テーブル、30は版を参照してその結果を検索手段22に出力する版参照手段、31は版管理テーブル29の内容を更新する版更新手段、32は中間結果が変更されたときに変更前の中間結果を解放する中間結果解放手段である。なお、中間結果24および版管理テーブル29は、それぞれ検索サーバ2aにおけるメモリのデータ格納領域である。
【0012】
以下、本発明実施の形態にかかる構成を有する分散型文書検索装置による文書検索動作について説明する。
【0013】
図2は文書検索処理動作を行なうに当たってのクライアント3、統合検索サーバ1、検索サーバ2aおよび検索サーバ2b間における動作手順を表すシーケンス図である。先ずクライアント3から統合検索サーバ1に対して検索要求41aが出力される。この実施の形態において、上記検索要求はこの分散型文書検索装置のシステムにおいては統合データベースCに対する最初の検索要求である。また、統合データベースCは検索サーバ2a上のデータベースA23aと検索サーバ2b上のデータベースB23bを仮想的につなげたもので、実際のデータベースがあるわけではない。図3は本実施の形態における検索要求41a〜41cのデータ構成を示す図である。このデータ構成図から明らかなように、検索要求41aの内容は、
検索対象:統合データベースC
検索式:携帯or電話or液晶
取得件数:20件
統合版名:−−
である。ここで、「検索対象:統合データベースC」とは、ユーザが統合データベースCを検索対象にしていることを示す。「検索式:携帯or電話or液晶」とは、この表記による検索式で検索を行なうことの要求である。また、「取得件数:20件」とは、文書スコアの高い順にランキングした上位20件を取得したいという要求である。また「統合版名」についてはこの検索要求41aでは指定されていない。
【0014】
上記検索要求41aを受け取った統合検索サーバ1は、検索条件入力手段11において検索条件を入力し、統合版参照手段18により統合版管理テーブル17の統合版データを参照した後、検索条件送信手段12によりさらなる検索要求41a、41cを検索サーバ2aおよび検索サーバ2bに送付する。このとき、統合検索サーバ1における統合データベースCへの検索要求はまだ一度も来ていないので統合版データは存在していない。したがって検索サーバ2aおよび2bには版名を指定しない検査要求41b、41cのデータが送信される。具体的には、検索サーバ2aへ送付される検索要求41bのデータは、図3から明らかなように、
検索対象:データベースA
検索式:携帯or電話or液晶
取得件数:20件
版名:−−
であり、また、検索サーバ2bへ送付される検索要求41cのデータは、図3から明らかなように、
検索対象:データベースB
検索式:携帯or電話or液晶
取得件数:20件
版名:−−
である。
【0015】
検索サーバ2aおよび2bにおいては、上記検索条件を検索条件入力手段21において入力し、検索動作42として、検索手段22によりデータベースA(検索サーバ2aの場合)およびデータベースB(検索サーバ2bの場合)に対する検索を実行する。検索サーバ2aと2bは並列処理により検索動作42を実行する。検索サーバ2aでは、この検索動作42に際して、版参照手段30が版管理テーブル29を参照して、データベースA23aの最新版の版名が0315であり、また総文書数が30000であることを知る。次に、検索手段22がこの版のデータベースA23aに対して検索を行い、検索条件にヒットする文書番号と各検索語の文書内出現頻度を求め、中間結果24の領域に格納する。
【0016】
図4は上記中間結果24のデータ内容の一例を示す図である。この図から、検索サーバ2aでは上記検索条件の下で検索した結果、検索された文書として、文書番号が3,5,24,・・・・,29230の文書がヒットしたことが分かる。ここで、文書番号が「3」の文書についてみると、この文書中では、「携帯」の語句が1箇所存在し、「電話」の語句が2箇所存在し、「液晶」の語句が0箇所存在することが分かる。文書番号が「5」以下の文書についても同様の内容が示されている。この中間結果を基に統計情報出力手段28が各検索語についての出現文書数を集計し統計情報を作成する。図5は、上記統計情報出力手段28が集計して求めた各検索語の出現文書数を表す図である。この図から明らかなように、上記中間結果として集められた文書のうち、「携帯」の語句が出現する文書数は125であり、「電話」の語句が出現する文書数は893であり、「液晶」の語句が出現する文書数は650である。ここで、出現文書の「数」とは、各検索語についてその語句が1回でも出現した文書の数を意味し、その文書中での出現回数が1回でも複数回でもカウントは「1」である。
【0017】
次に、統計情報出力手段28は、上記統計情報を、検索に使用した最新版の情報(版名が0315、総文書数が30000)とともに、統合検索サーバ1に返す。その後、検索サーバ2aにおいては、統合検索サーバ1で求められた大域的な統計情報が送られてくるまで待つ。
【0018】
以上のような検索サーバ2aの一連の動作は検索サーバ2bにおいても並列的に実行される。図2に示すように、検索サーバ2bは、検索サーバ2aの場合と同様の検索条件の下で検索した結果、検索サーバ2bはデータベースB(23bとする)の最新版の版名が0628であり、また総文書数が40000であることを知る。また、検索動作42により検索された文書を基に作成した中間結果から、「携帯」の語句が出現する文書数は164であり、「電話」の語句が出現する文書数は320であり、「液晶」の語句が出現する文書数は220であることが分かる。
【0019】
統合検索サーバ1は、検索サーバ2aおよび2bから統計情報を受け取ると、統計情報集計動作43を行なう。この動作では、統計情報集計手段13が検索サーバ2a、検索サーバ2bから返った各検索語の出現文書数を加算(すなわち、集計)し、統合データベースCにおける各検索語の出現文書数を算出する。次に、統合検索サーバ1は、上記集計結果に基づいて統合版管理テーブル更新動作44を行なう。この統合版管理テーブル更新動作44においては、統合版更新手段16が、統合版管理テーブル17に統合データベースCの統合版0001を登録する。上述したように、検索開始時点では統合検索サーバ1の統合データベースCの統合版データは存在していなかった。したがってこの時点で統合版管理テーブル17に統合データベースCの統合版0001が初めて登録される。
【0020】
この登録処理により、統合版管理テーブル17には、統合データベースCの統合版0001を構成するデータベースA23aの版名0315とデータベースB23bの版名0628、およびそれぞれの総文書数の情報が格納される。図6はその上段に、上記のようにして統合版管理テーブル17に登録された統合版0001のデータを示す図である(下段のデータは後の処理により作成されるデータである)。統合検索サーバ1は、このようにして求めた、統合データベースCの統合版0001の総文書数と、各検索語の出現文書数を、検索サーバ2a、検索サーバ2bに送信する。この統合データベースCの統合版0001の総文書数と、各検索語の出現文書数はすべての検索サーバ2から送られた文書数をカバーするものであるから、大域的な統計情報ということができる。ちなみに、上述の処理動作において得られた大域的な統計情報について図2を用いて明らかにすると、検索に使用された統合版の総文書数は70000(30000+40000=70000)である。また、「携帯」の語句が出現する文書数は289であり、「電話」の語句が出現する文書数は1213であり、「液晶」の語句が出現する文書数は870である。
【0021】
統合データベースCの統合版0001の総文書数と、各検索語の出現文書数を受け取った検索サーバ2aは文書スコアの算出動作45を行なう。この文書スコアの算出動作45では、統合検索サーバ1から送られた大域的な統計情報、すなわち、統合データベースCの統合版0001の総文書数と各検索語の出現文書数を用いて、中間結果24の領域に保存しておいた中間結果の各文書について、スコア算出手段25が文書スコアSを、
S=Σ(tf*idf)
ここで、 tfは検索語の文書内出現頻度
idf=log(検索語の出現文書数/総文書数)
の演算によって求める。
なお、前記文書スコアSの計算式は代表的な例であり、これに限ったわけではない。
【0022】
その結果を基に、検索結果並べ替え手段26が、文書スコアの昇順に文書番号を並べ替える。さらに、検索結果出力手段27が、上位20件の文書番号と文書スコアを、統合検索サーバ1に返す。
【0023】
以上のような検索サーバ2aの一連の動作は検索サーバ2bにおいても並列的に実行され、この検索サーバ2bからも検索結果出力手段27が、上位20件の文書番号と文書スコアを、統合検索サーバ1に返す。
【0024】
統合検索サーバ1では、検索結果並べ替え手段14が、検索サーバ2aおよび検索サーバ2bから返った合計40件の文書番号を文書スコアの昇順に並べ替える。次いで、検索結果出力手段15が、文書スコアの上位20件の結果と、検索に使用した統合データベースCの版名0001を、クライアントに返す。
なお、同じ検索条件で文書スコアの上位21位以下の検索結果を求めたり、検索結果の中から選んだ文書の実体を取得したい場合には、クライアントから統合検索サーバ1に、統合版名0001を指定した検索要求(もしくは実体取得要求)を送る。これにより、検索サーバ2aでは対応するデータベースA23aの版0315に固定し、また検索サーバ2bでは対応するデータベースB23bの版0628に固定して検索(もしくは実体取得)を行なうことで整合性のとれた結果を得ることが可能となる。
【0025】
図7は検索要求、検索実行、統計情報作成、集計、などの処理動作が行なわれるデータベースA23aおよびデータベースB23bにおける版の変遷の一例を経時的に示す図である。上述の動作は図7中の時刻T1において、ユーザが統合データベースCを検索対象にして、「携帯or電話or液晶」という検索式で検索を行い、文書スコアの高い順にランキングした上位20件を取得しようとした場合の動作に相当するものである。したがって、その時刻T1においては、データベースA23aの最新版の版名が0315であり、またデータベースB23bの最新版の版名が0628であり、これは上述した説明と合致する。
【0026】
(実施の形態2)
次に、本発明の第2の実施の形態について説明する。図7中の時刻T2において、ユーザが統合データベースCを検索対象にして別の検索式「テレビ or デジタル」で検索を行い、文書スコアの上位20件を取得しようとしたとする。図8は上記のような文書検索処理動作を行なうに当たってのクライアント3、統合検索サーバ1、検索サーバ2aおよび検索サーバ2b間における動作手順を表すシーケンス図である。先ずクライアント3から統合検索サーバ1に対して検索要求51aが出力される。この検索要求51aは、統合データベースCに対する、統合版名を指定しない検索要求である。
【0027】
図9は本実施の形態における検索要求51a〜51cのデータ構成を示す図である。このデータ構成図から明らかなように、検索要求51aの内容は、
検索対象:統合データベースC
検索式:テレビorデジタル
取得件数:20件
統合版名:−−
である。
【0028】
上記検索要求51aを受け取った統合検索サーバ1は、検索条件入力手段11において検索条件を入力し、統合版参照手段18により統合版管理テーブル17の統合版データを参照して統合データベースCの最新の統合版を求める。この時点での最新の統合版は「0001」である(図8)。その後、統合検索サーバ1は、検索条件送信手段12によりさらなる検索要求51b、51cを検索サーバ2aおよび検索サーバ2bに送付する。このとき、上記のように最新の統合版は「0001」であるから、検索サーバ2aに対してはデータベースA23aの版0315を指定して検索要求51bを出し、また、検索サーバ2bに対してはデータベースB23bの版0628を指定して検索要求51cを出す。その際、版モードとして「最新」という要求を一緒に送る。版モード「最新」は、送った版名よりもさらに新しい版があればその版で検索を行ない、真の最新版の情報を一緒に返し、送った版名が最新版であればその版は返す必要がないという指示を意味している。
【0029】
具体的には、検索サーバ2aへ送付される検索要求51bのデータは、図9から明らかなように、
検索対象:データベースA
検索式:テレビorデジタル
取得件数:20件
版名:0315
版モード:最新
であり、また、検索サーバ2bへ送付される検索要求51cのデータは、図9から明らかなように、
検索対象:データベースB
検索式:テレビorデジタル
取得件数:20件
版名:0628
版モード:最新
である。
【0030】
検索サーバ2aおよび2bにおいては、上記検索条件を検索条件入力手段21において入力し、検索動作52として、検索手段22によりデータベースA(検索サーバ2aの場合)およびデータベースB(検索サーバ2bの場合)に対する検索を実行する。検索サーバ2aと2bは並列処理により検索動作52を実行する。検索サーバ2aでは、この検索動作52に際して、版参照手段30が版管理テーブル29を参照して、データベースA23aの最新版の版名が0315ではなく0316であり、また総文書数が30100であることを知る(図7)。次に、検索手段22が最新版0316のデータベースA23aに対して検索を行い、検索条件にヒットする文書番号と各検索語の文書内出現頻度を求め、中間結果24の領域に格納する。
【0031】
なお、本実施の形態における中間結果24については、図4に示された第1の実施の形態における中間結果24と同様の形で表現できるので図に表すのは省略した。また、図5に示されているような、統計情報出力手段28が集計して求めた各検索語の出現文書数もまた、これと同様の形で表現できるので図に表すのは省略した。
【0032】
次に、統計情報出力手段28は、統計情報を、検索に使用した最新版の情報(版名が0316、総文書数が30100)とともに、統合検索サーバ1に返す。その後、検索サーバ2aにおいては、統合検索サーバ1で求められた大域的な統計情報が送られてくるまで待つ。
【0033】
以上のような検索サーバ2aの一連の動作は検索サーバ2bにおいても並列的に実行される。図7及び図8に示すように、検索サーバ2bは、検索サーバ2aの場合と同様にして検索要求51cの検索条件の下で検索した結果、データベースB23bの最新版の版名は0628のままであり、総文書数もまた40000のままであることを知る。そこで、検索手段22が最新版0628のデータベースB23bに対して検索を行い、また、検索動作52により検索された文書を基に作成した中間結果24を中間結果領域に格納する。そして、この中間結果24から、検索語が出現する文書数を求め、これを統計情報出力手段28が統合検索サーバ1に返す。しかし、検索に使用した版0628の情報は返さない。
【0034】
統合検索サーバ1は、検索サーバ2aおよび2bから統計情報を受け取ると、統計情報集計動作53を行なう。この動作では、統計情報集計手段13が検索サーバ2a、検索サーバ2bから返った各検索語の出現文書数を加算(すなわち、集計)し、統合データベースCにおける各検索語の出現文書数を算出する。次に、統合検索サーバ1は、上記集計結果に基づいて統合版管理テーブル更新動作54を行なう。この統合版管理テーブル更新動作54においては、統合版更新手段16が、統合版管理テーブル17に登録されている統合版の個数が一定値を超えているか否かをチェックし、一定値を超えている場合は古い統合版から削除する。統合版更新手段16はまた、統合版管理テーブル17に統合データベースCの統合版0002を登録する。これにより、統合版管理テーブル17には、統合データベースCの統合版0002を構成するデータベースA23aの版名0316と、データベースB23bの版名0628、およびそれぞれの総文書数の情報が格納される。
【0035】
図6の下段には、上記のようにして統合版管理テーブル17に登録された統合版0002のデータが示される。統合検索サーバ1は、このようにして求めた、統合データベースCの統合版0002の総文書数と、各検索語の出現文書数を、検索サーバ2aおよび検索サーバ2bに送信する。この統合データベースCの統合版0002の総文書数と、各検索語の出現文書数はすべての検索サーバ2から送られた文書数をカバーするものであるから、大域的な統計情報ということができる。ちなみに、上述の処理動作において得られた大域的な統計情報について明らかにすると、検索に使用された統合版の総文書数は70100(30100+40000=70100)である(図8)。
【0036】
統合データベースCの統合版0002の総文書数と、各検索語の出現文書数を受け取った検索サーバ2aは文書スコアの算出動作55を行なう。この文書スコアの算出動作55では、統合検索サーバ1から送られた大域的な統計情報、すなわち、統合データベースCの統合版0002の総文書数と各検索語の出現文書数を用いて、中間結果24の領域に保存しておいた中間結果の各文書について、スコア算出手段25が文書スコアSを、
S=Σ(tf*idf)
ここで、 tfは検索語の文書内出現頻度
idf=log(検索語の出現文書数/総文書数)
の演算によって求める。
なお、前記文書スコアSの計算式は代表的な例であり、これに限ったわけではない。
【0037】
その結果を基に、検索結果並べ替え手段26が、文書スコアの昇順に文書番号を並べ替える。さらに、検索結果出力手段27が、上位20件の文書番号と文書スコアを、統合検索サーバ1に返す。
【0038】
以上のような検索サーバ2aの一連の動作は検索サーバ2bにおいても並列的に実行され、この検索サーバ2bからも検索結果出力手段27が、上位20件の文書番号と文書スコアを、統合検索サーバ1に返す。
【0039】
統合検索サーバ1では、検索結果並べ替え手段14が、検索サーバ2aおよび検索サーバ2bから返った合計40件の文書番号を文書スコアの昇順に並べ替える。次いで、検索結果出力手段15が、文書スコアの上位20件の結果と、検索に使用した統合データベースCの版名0002を、クライアントに返す。
【0040】
なお、同じ検索条件で文書スコアの上位21以下の検索結果を求めたり、検索結果の中から選んだ文書の実体を取得したい場合には、クライアントから統合検索サーバ1に、統合版名0002を指定した検索要求(もしくは実体取得要求)を送る。これにより、検索サーバ2aでは対応するデータベースA23aの版0316に固定し、また検索サーバ2bでは対応するデータベースB23bの版0628に固定して検索(もしくは実体取得)を行なうことで整合性のとれた結果を得ることが可能となる。
【0041】
なお本実施の形態において、アンロード情報を基に統合版を削除する動作を組み込むことも可能である。
すなわち、検索サーバ2aおよび2bにおいては、統合検索サーバ1から受け取った検索条件を検索条件入力手段21において入力し、検索手段22によりデータベースA(検索サーバ2aの場合)およびデータベースB(検索サーバ2bの場合)に対する検索動作52を実行する。このとき、検索サーバ2aは、この検索動作52に際して、版参照手段30が版管理テーブル29を参照して、データベースA23aの最新版の版名が0315ではなく0316であり、また総文書数が30100であることを知る(図7)。また、このときすでに版0315はアンロードされていることを知る(同図)。このような場合、検索手段22が最新版0316のデータベースA23aに対して検索を行い、検索条件にヒットする文書番号と各検索語の文書内出現頻度を求め、中間結果24の領域に格納する。
【0042】
次に、統計情報出力手段28は、各検索語の出現文書数を含む統計情報を、検索に使用した最新版の情報(版名が0316、総文書数が30100)と、版0315が利用できなくなっている(アンロードされている)という情報とともに総合検索サーバ1に返す。その後、検索サーバ2aにおいては、統合検索サーバ1で求められた大域的な統計情報が送られてくるまで待つ。
【0043】
検索サーバ2bについては、本実施の形態で上述したのと同じ動作を行なう。
【0044】
次に統合検索サーバ1では、検索サーバ2aおよび2bから統計情報を受け取ると、統計情報集計動作53を行なう。この動作では、統計情報集計手段13が検索サーバ2a、検索サーバ2bから返った各検索語の出現文書数を加算(すなわち、集計)し、統合データベースCにおける各検索語の出現文書数を算出する。次に、統合検索サーバ1は、上記集計結果に基づいて統合版管理テーブル更新動作54を行なう。この統合版管理テーブル更新動作54においては、統合版更新手段16が、統合版管理テーブル17から、利用できなくなったデータベースA23aの版0315を含む統合版0001を削除する。また、統合版更新手段16が統合版管理テーブル17に統合データベースCの統合版0002を登録する。これにより、統合版管理テーブル17には、統合データベースCの統合版0002を構成するデータベースA23aの版名0316と、データベースB23bの版名0628、およびそれぞれの総文書数の情報が格納される。
【0045】
その後、統合検索サーバ1は統合データベースCの統合版0002の総文書数と各検索語の出現文書数を検索サーバ2aおよび2bに送信する。
【0046】
(文書検索動作の変更態様)
文書検索動作を行なうに当たっては、通常、検索サーバ(2aとする)では版参照手段30が版管理テーブル29を参照して、データベースA23aの最新版の情報を求める。時系列の最初の段階(すなわち図7中の時刻T1)では、最新版の版名は0315で、総文書数が30000であることがわかる。この場合は、検索手段22がこの版のデータベースA23aに対して検索を行い、検索条件にヒットする文書番号と各検索語の文書内出現頻度を求め、中間結果24の領域に格納する。次いで、統計情報出力手段28が検索に使用した最新版の情報(版名が0315、総文書数が30000)とともに、各検索語の出現文書数を、文書スコアの計算に使用する統計情報として統合検索サーバ1に返す。検索サーバ2aは、その後統合検索サーバ1で求められた大域的な統計情報が送られてくるのを制限時間付きで待つ。その制限時間が経過したら、この検索要求についての処理を中止し、別の検索要求の処理に移る。
【0047】
(複数の中間結果の保持)
検索サーバ2aでは、版参照手段30が、版管理テーブル29を参照して、データベースAの最新版の情報を求める。時系列の最初の段階(すなわち図7中の時刻T1)では、最新版の版名は0315で、総文書数が30000であることがわかる。この場合は、検索手段22がこの版のデータベースA23aに対して検索を行い、検索条件にヒットする文書番号と各検索語の文書内出現頻度を求め、中間結果24の領域に格納する。その際、この中間結果24に固有のIDを割り振っておく。次いで、統計情報出力手段28が検索に使用した最新版の情報(版名が0315、総文書数が30000)とともに、各検索語の出現文書数を、文書スコアの計算に使用する統計情報として統合検索サーバ1に返す。その際、中間結果に割り振られたIDも一緒に返す。検索サーバ2aは、その後中間結果の数が一定個数を超えていたら、統合検索サーバ1で求められた大域的な統計情報が送られてくるのを待つ。しかし、中間結果の数が一定個数を超えていなかったら、統合検索サーバ1で求められた大域的な統計情報が送られてくるのを待たずに別の検索要求の処理に移る。
【0048】
統合検索サーバ1は、検索サーバ2aおよび2bから統計情報を受け取ると、統計情報集計動作を行なう。この動作では、統計情報集計手段13が検索サーバ2a、検索サーバ2bから返った各検索語の出現文書数を加算(すなわち、集計)し、統合データベースCにおける各検索語の出現文書数を算出する。次に、統合検索サーバ1は、上記集計結果に基づいて統合版管理テーブル更新動作を行なう。この統合版管理テーブル更新動作においては、統合版更新手段16が、統合版管理テーブル17に統合データベースCの統合版0001を登録する。
【0049】
この登録処理により、統合版管理テーブル17には、統合データベースCの統合版0001を構成するデータベースA23aの版名0315とデータベースB23bの版名0628、およびそれぞれの総文書数の情報が格納される。統合検索サーバ1は、このようにして求めた、統合データベースCの統合版0001の総文書数と、各検索語の出現文書数を、検索サーバ2a、検索サーバ2bに送信する。その際、検索サーバ2aおよび2bから出現文書数と一緒に送られてきたIDを一緒に送り返す。
【0050】
統合データベースCの統合版0001の総文書数と、各検索語の出現文書数を受け取った検索サーバ2aは文書スコアの算出動作(第1の実施の形態の動作45と同じ)を行なう。この文書スコアの算出動作では、統合検索サーバ1から送られた大域的な統計情報、すなわち、統合データベースCの統合版0001の総文書数と各検索語の出現文書数を用いて、中間結果24の領域に保存され、且つ該当するIDを持つ中間結果の各文書について、スコア算出手段25が文書スコアSを、
S=Σ(tf*idf)
ここで、 tfは検索語の文書内出現頻度
idf=log(検索語の出現文書数/総文書数)
の演算によって求める。
【0051】
その結果を基に、検索結果並べ替え手段26が、文書スコアの昇順に文書番号を並べ替える。さらに、検索結果出力手段27が、上位M件の文書番号と文書スコアを、統合検索サーバ1に返す。
【0052】
以上のような検索サーバ2aの一連の動作は検索サーバ2bにおいても並列的に実行され、この検索サーバ2bからも検索結果出職手段27が、上位M件の文書番号と文書スコアを、統合検索サーバ1に返す。
【0053】
統合検索サーバ1では、検索結果並べ替え手段14が、検索サーバ2aおよび検索サーバ2bから返った合計2M件の文書番号を文書スコアの昇順に並べ替える。次いで、検索結果出力手段15が、文書スコアの上位M件の結果と、検索に使用した統合データベースCの版名0001を、クライアントに返す。
【0054】
なお、同じ検索条件で文書スコアの上位(M+1)位以下の検索結果を求めたり、検索結果の中から選んだ文書の実体を取得したい場合には、クライアントから統合検索サーバ1に、統合版名0001を指定した検索要求(もしくは実体取得要求)を送る。これにより、検索サーバ2aでは対応するデータベースA23aの版0315に固定し、また検索サーバ2bでは対応するデータベースB23bの版0628に固定して検索(もしくは実体取得)を行なうことで整合性のとれた結果を得ることが可能となる。
【0055】
(処理フローについて)
図10〜図16は、本発明の上記各実施の形態における分散型文書検索処理の動作手順を総括的に説明するための、クライアント端末(以下、上記各実施の形態におけるクライアントをクライアント端末とそれを利用するユーザとに分けて説明する)、統合検索サーバ及び検索サーバごとに用意したフローチャートである。すなわち、図10〜図12において統合検索サーバが実行する処理フローを示し、図13〜図15において各検索サーバが実行する処理フローを示し、図16においてクライアント端末が実行する処理フローを示している。以下、これらの図を用いて、統合検索サーバ、検索サーバ、クライアント端末の順にそれぞれの動作手順について説明する。
【0056】
(統合検索サーバの処理)
図10のフローチャートに示すように、統合検索サーバは、クライアント端末から検索要求が送られてきたのを確認すると(ステップ101)、検索条件入力手段がその検索要求から自己の検索条件を入力する(ステップ102)。この検索条件の入力を合図にして各検索サーバに対する検索指示処理の実行が開始されることになる。
【0057】
すなわち、図11の検索指示処理フローチャートに示すように、検索条件入力手段により入力された検索条件において、統合版名が指定されているかどうかをチェックする(ステップ103)。
統合版名が指定されていない場合(ステップ103・No)、統合版参照手段は、統合版管理テーブルを参照し(ステップ104)、統合版データの有無を確認する(ステップ105)。統合版データが存在すれば(ステップ105・Yes)、検索条件送信手段は、最新の統合版データから版名を取得し(ステップ106)、その版名を指定してかつ版モード「最新」を含めた検索要求を各検索サーバに送信する(ステップ107)。他方、統合版データが存在しなければ(ステップ105・No)、検索条件送信手段は、検索条件送信手段版名を指定しない検索要求を各検索サーバに送信する(ステップ108)。
これに対して、統合版名が指定されている場合(ステップ103・Yes)、統合版参照手段は、統合版管理テーブルを参照し(ステップ104)、指定された統合版データの有無を確認する(ステップ109)。指定された統合版データが存在すれば(ステップ109・Yes)、検索条件送信手段は、指定された統合版データから版名を取得し(ステップ110)、その版名を指定した検索要求を各検索サーバに送信する(ステップ111)。他方、指定された統合版データが存在しなければ(ステップ109・No)、上記統合版名が指定されていない場合と同様な処理(ステップ105〜108)を行なう。
【0058】
上記検索指示処理が終了すると、図10のフローチャートに示すように、統合検索サーバは、検索指示を行った各検索サーバから送られてくる局所的な統計情報が全て揃うまで待つことになる(ステップ112・No)。
【0059】
そして、統合検索サーバは、検索指示を行った検索サーバから送られてくる局所的な統計情報が全て揃ったことを確認すると(ステップ112・Yes)、統計情報集計手段及び統計情報更新手段による集計・更新処理に移行する。
【0060】
すなわち、図12の集計・更新処理フローチャートに示すように、統計情報集計手段は、各検索サーバからの局所的な統計情報に基づいて集計処理を行い、各検索語の出現文書数を算出する(ステップ113)。
つぎに、検索サーバからの局所的な統計情報に当該検索サーバの最新版情報が添付されているときはその最新版情報に基づいて、他方、最新版情報は添付されていないときは統合版管理テーブルを参照して、総文書数を算出する(ステップ114)。
【0061】
つづいて、統合版更新手段は、算出した総文書数と各検索語の出現文書数とに基づいて、統合版管理テーブルの更新・登録を行なう(ステップ115)。
この更新・登録の際、前記最新版情報にアンロード情報が含まれている場合(ステップ116・Yes)、統合版更新手段は、そのアンロード情報に基づいて該当する統合版データを削除する(ステップ117)。
また、前記更新・登録の際、統合版のデータの個数が一定値を超えている場合(ステップ118・Yes)、統合版更新手段は、古いものから順に(又は検索頻度が少ない順に)統合版データを削除する(ステップ119)。
なお、上記ステップ115〜119の処理は、検索サーバから最新版情報が送られてくる時ではなく、適宜なタイミングで行ってもよい。
【0062】
つづいて、統計情報集計手段は、このように算出した総文書数と出現文書数、すなわち大域的な統計情報を、中間結果の固有IDとともに各検索サーバに送信する(ステップ120)。
【0063】
上記集計・更新処理が終了すると、図10のフローチャートに示すように、統合検索サーバは、当該大域的統計情報を送信した各検索サーバからの返信データ(文書番号及び文書スコア)が送られてくるのを待つことになる(ステップ121・No)。
【0064】
そして、統合検索サーバは、各検索サーバからの返信データが全て揃ったのを確認すると(ステップ121・Yes)、検索結果並べ替え手段は、当該全ての文書番号を文書スコアの昇順に並べ替える(ステップ122)。
つぎに、検索結果出力手段が、上位M件(クライアント端末からの検索要求において指定された件数)のランキング結果と、当該検索に使用した統合版名とを最終的な検索結果としてクライアント端末に送信する(ステップ123)。
【0065】
以上の処理動作が終了すると、つぎの検索処理に移行するか(ステップ124・Yes)又は処理全体を終了する(ステップ124・No)。
【0066】
(検索サーバの処理)
図13のフローチャートに示すように、検索サーバは、統合検索サーバからの検索指示データが送られてきたのを確認すると(ステップ201・Yes)、その検索指示データの種類を判別する。具体的には、検索指示データの種類が、検索条件であるか、それとも大域的統計情報であるかを判別する(ステップ202)。
大域的統計情報である場合、基本的に、スコア算出手順に移行することになるので、その説明は後述する。
他方、検索条件である場合、検索条件入力手段がその検索条件を入力し(ステップ203)、以下に説明するような検索・統計処理に移行する。
【0067】
すなわち、図14の検索・統計処理フローチャートに示すように、まず版参照手段は、検索条件に版名・版モード「最新」が含まれているかを確認する(ステップ204、205)。
【0068】
検索条件に版名が指定されていない場合(ステップ204・No)、版参照手段が版管理テーブルを参照して最新版の情報(最新版名及びその総文書数)を取得し(ステップ206)、その後、当該最新版名のデータベースに対して検索手段が行なう検索動作(ステップ207)に移行する。
【0069】
検索条件に版名が指定されていて(ステップ204・Yes)、かつ版モード「最新」が含まれていない場合(ステップ205・No)、継続した検索動作ということになるので、版参照手段が版管理テーブルを参照することなく、指定版名のデータベースに対して検索手段が行なう検索動作(ステップ208)に移行する。
【0070】
検索条件に版名が指定されていて(ステップ204・Yes)、かつ版モード「最新」が含まれている場合(ステップ205・Yes)は、版参照手段が版管理テーブルを参照して前記最新版の情報を取得し(ステップ206)、当該最新版名と検索条件で指定された版名とが同じかどうかを判断する(ステップ209)。
最新版名と指定版名とが同じ場合(ステップ209・Yes)、指定版名のデータベースに対して検索手段が行なう検索動作(ステップ208)に移行する。これに対して、最新版名と指定版名とが異なる場合(ステップ209・No)、さらに指定版名はアンロードされているかどうかを確認し(ステップ210)、アンロードされていなければ(ステップ210・No)、当該指定版名のデータベースに対して検索手段が行なう検索動作(ステップ207)に移行する。他方、指定版名がアンロードされている場合は(ステップ210・Yes)、最新版名のデータベースに対して検索手段が行なう検索動作(ステップ208)に移行するか、又はエラーメッセージを統合検索サーバに送信する。
【0071】
上記検索動作が終了すると、上記全ての場合に共通して、検索手段は、中間結果(検索の途中として検索によって得られた文書番号と文書内出現頻度)を、当該中間結果に割り当てた固有IDとともに中間結果のデータ領域に格納する(ステップ211)。
【0072】
そして、統計情報出力手段は、各検索語の出現文書数を集計して局所的な統計情報を作成し(ステップ212)、つぎの統計情報出力の処理に移行する。
すなわち、統計情報出力手段は、作成した局所的な統計情報を固有IDとともに統合検索サーバに送信する(ステップ213、214、又は215)。ここで、版名が指定されていなかった場合(ステップ204・No)、又は版名は指定されていたが当該指定版が最新版と異なっていた場合(ステップ204・Yes、ステップ209・No)は、前記局所的な統計情報に前記最新版の情報も添付して送信する(ステップ213)。なお、指定版名と最新版名とが異なっていた場合(ステップ204・No)において、指定版名がアンロードされていた場合(ステップ210・Yes)は、さらにアンロード情報を前記最新版の情報に含めて送信する(ステップ214)。
【0073】
上記検索処理が終了すると、図13のフローチャートに示すように、検索サーバは、統合検索サーバからの大域的統計情報が送られてくるまで待つか、それとも次の検索処理に移行するかを自動的に選択する。
すなわち、制限時間が経過したかどうかを判断し(ステップ216)、制限時間を経過した場合(ステップ216・Yes)には、中間結果の個数が一定個数を超えたかどうかを判断する(ステップ217)。そして、中間結果の個数が一定個数を超えていない場合(ステップ217・No)は、大域的統計情報が送られてくるのを待たずに次の検索処理(ステップ201〜215)に移行する。
これに対して、制限時間が経過しない間(ステップ216・No)、又は、制限時間が経過しても中間結果の個数が一定個数を超えている場合(ステップ216・Yes、ステップ218・Yes)は、次の検索処理(ステップ201〜215)に移行することなく、大域的統計情報が送られてくるのを待つ(ステップ218・No)。
上記いずれの場合も、統合検索サーバから大域的統計情報が送られてくるのを合図にして、直ぐに又は所定の処理後に、スコア算出処理に移行することになる。
【0074】
すなわち、図15のスコア算出処理フローチャートに示すように、検索サーバのスコア算出手段は、統合検索サーバから送られてきた大域的な統計情報を用いて、かつ該当する中間IDをもつ中間結果の各文書についてスコアを算出する(ステップ219)。
つぎに、検索結果並べ替え手段が文書スコアの昇順に文書番号を並べ替える(ステップ220)。なお、文書スコア並べ替え方はこれに限定されるものではない。
つぎに、検索結果出力手段が、上位M件(クライアント端末からの検索要求において指定された件数)の文書番号と文書スコアとを統合検索サーバに送信する。
【0075】
以上のスコア算出処理が終了すると、図13のフローチャートに示すように、検索サーバは、つぎの検索処理に移行するか(ステップ222・Yes)又は処理全体を終了する(ステップ222・No)。
【0076】
(クライアント端末の処理)
上記の統合検索サーバ及び検索サーバの処理動作により、ユーザは、より確実で効率的な文書検索を実行できる。
【0077】
すなわち、図16のフローチャートに示すように、情報検索元であるユーザは、まず、検索画面を表示させる(ステップ301)。つぎに、ユーザは、検索式や検索頻度などの検索条件を検索画面に入力し(ステップ302)、文書検索を要求する。このとき、統合版名を指定して過去の検索と整合性がある検索をしたいときは、その統合版名を指定した上で文書検索を要求する(ステップ303・Yes)。他方、最新のデータベースに対して文書検索を行いたいときは、統合版名を指定しないで文書検索を要求する(ステップ303・No)。前者の場合、クライアント端末は、統合版名を指定した検索要求を統合検索サーバに送信し(ステップ304)、後者の場合、統合版名を指定しない検索要求を統合検索サーバに送信する(ステップ305)。
当該検索条件の送信後、検索結果が統合検索サーバから送られて来るのを待つことになる(ステップ306・No)。
【0078】
そして、クライアント端末は、統合検索サーバから検索結果が送られてきたのを確認すると(ステップ306・Yes)、検索結果を表示する(ステップ307)。
【0079】
次の検索を実行する場合(ステップ308・Yes)は、上記の動作(ステップ302〜307)を繰り返す。他方、次の検索を実行しない場合(ステップ308・No)は、ユーザは、検索画面を閉じる(ステップ309)。これによりクライアント端末の検索に係る処理が全て終了する。
【0080】
【発明の効果】
以上説明したように、本発明によれば、複数の検索サーバと、これらの複数の検索サーバを統合する統合検索サーバとにより文書検索を行なうにあたり、各検索サーバは、検索動作によって得られた中間結果を基に作成した統計情報を統合検索サーバへ送付し、統合検索サーバでは、前記統計情報を集計し、大域的な統計情報を作成して各検索サーバへ送付し、各検索サーバは前記大域的な統計情報を基に正確なスコアを計算し、各々検索条件に合致した検索結果を統合検索サーバに返送し、前記各検索サーバは、前記データベースの版の更新を各検索サーバで独立に行い、この版の更新は統合検索サーバに対して更新の都度報告せず、その後の検索要求に対する検索動作を行なった時に版情報を統計情報とともに統合検索サーバに送付し、統合検索サーバでは、前記版情報が送られてきた時又は必要に応じて、各検索サーバのデータベースの最新版を組み合わせた統合版を自動的に生成して各検索サーバへ送付するようにしたため、文書検索に際してより確実で効率的な文書検索を行なうことができるものである。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態に係る分散型文書検索装置の構成を示すブロック図
【図2】前記実施の形態で文書検索処理動作を行なうに当たってのクライアント、統合検索サーバ、検索サーバ間における動作手順を表すシーケンス図
【図3】前記実施の形態における検索要求のデータ構成を示す図
【図4】前記実施の形態における中間結果のデータ内容の一例を示す図
【図5】前記実施の形態における統計情報出力手段が集計して求めた各検索語の出現文書数を表す図
【図6】前記実施の形態における統合版管理テーブルに登録された統合版のデータの例を示す図
【図7】前記実施の形態における検索要求、検索実行、統計情報作成、集計、などの処理動作が行なわれるデータベースにおける版の変遷の一例を経時的に示す図
【図8】本発明の第2の実施の形態において文書検索処理動作を行なうに当たってのクライアント、統合検索サーバ、検索サーバ間における動作手順を表すシーケンス図
【図9】前記実施の形態における検索要求のデータ構成を示す図
【図10】本発明の上記各実施の形態における分散型文書検索処理の動作手順を総括的に説明するための、統合検索サーバによる処理全体のフローチャート図
【図11】前記統合検索サーバによる検索指示処理のフローチャート図
【図12】前記統合検索サーバによる集計・更新処理のフローチャート図
【図13】本発明の上記各実施の形態における分散型文書検索処理の動作手順を総括的に説明するための、検索サーバによる処理全体のフローチャート図
【図14】前記検索サーバによる検索・統計処理のフローチャート図
【図15】前記検索サーバによるスコア算出処理のフローチャート図
【図16】本発明の上記各実施の形態における分散型文書検索処理の動作手順を総括的に説明するための、クライアント端末による処理全体のフローチャート図
【符号の説明】
1 統合検索サーバ
2 検索サーバ
3 クライアント
11 検索条件入力手段
12 検索条件送信手段
13 統計情報集計手段
14 検索結果並べ替え手段
15 検索結果出力手段
16 統合版更新手段
17 統合版管理テーブル
18 統合版参照手段
21 検索条件入力手段
22 検索手段
23 データベース
24 中間結果
25 スコア算出手段
26 検索結果並べ替え手段
27 検索結果出力手段
28 統計情報出力手段
29 版管理テーブル
30 版参照手段
31 版更新手段
32 中間結果解放手段
Claims (7)
- 複数の文書を格納するデータベースに対して文書検索を行なう複数の検索サーバと、これらの複数の検索サーバに通信接続され、各検索サーバに対して検索指示を行なう統合検索サーバとにより文書検索を行なう方法であって、
各検索サーバは、検索動作によって得られた中間結果を基に作成した統計情報を統合検索サーバへ送付し、統合検索サーバでは、前記統計情報を集計し、大域的な統計情報を作成して各検索サーバへ送付し、各検索サーバは前記大域的な統計情報を基にスコアを計算し、各々検索条件に合致した検索結果を統合検索サーバに返送し、
前記各検索サーバは、前記データベースの版の更新を各検索サーバで独立に行い、この版の更新は統合検索サーバに対して更新の都度報告せず、その後の検索要求に対する検索動作を行なった時に版情報を統計情報とともに統合検索サーバに送付し、
統合検索サーバでは、前記版情報が送られてきた時又は必要に応じて、各検索サーバのデータベースの最新版を組み合わせた統合版を自動的に生成して各検索サーバへ送付することを特徴とする分散型文書検索方法。 - 前記各検索サーバは、前記データベースの版の更新を行なったときは、この検索サーバで、新しい版がロードされてから、一定時間後に古い版をアンロードすることを特徴とする請求項1記載の分散型文書検索方法。
- 前記統合検索サーバは、統合版の個数が所定の個数を超えたときに統合版を所定の規則にしたがって削除することを特徴とする請求項1記載の分散型文書検索方法。
- 前記各検索サーバは、検索要求を受けた時に前記データベースの版がアンロードされていた場合は、その旨を伝えるアンロード情報を統計情報とともに統合検索サーバへ送付し、統合検索サーバは、前記アンロード情報が送られてきた時又は必要に応じて、前記アンロード情報を基に関係する統合版を削除することを特徴とする請求項1記載の分散型文書検索方法。
- 複数の文書を格納するデータベースに対して文書検索を行なう複数の検索サーバと、これらの複数の検索サーバに通信接続され、各検索サーバに対して検索指示を行なう統合検索サーバとから成り、
前記検索サーバは、データベースに対して検索動作を行なう検索手段と、前記検索動作の結果得られた中間結果を保持する手段と、前記中間結果から統計情報を作成出力する統計情報出力手段と、検索した各文書に対してスコアを付けるスコア算出手段とを備え、また、前記統合検索サーバは、複数の検索サーバから送付された統計情報を集計する統計情報集計手段を備え、前記統合検索サーバで大域的な統計情報を作成して各検索サーバへ送付し、各検索サーバは前記大域的な統計情報を基にスコアを計算し、各々検索条件に合致した検索結果を前記統合検索サーバに返送し、
前記統合検索サーバは、前記統計情報集計手段によって集計した統計情報を基に統合版を作成する手段と、前記統合版の更新を行なう統合版更新手段と、前記統合版の管理を行なう統合版管理手段とを備え、
前記各検索サーバは、前記データベースの版の更新を行なう版更新手段と、版の管理を行なう版管理手段とを備え、前記版管理手段は、検索要求に対する検索動作を行なった時に版情報を統計情報とともに統合検索サーバに送付し、
前記統合検索サーバは、前記版情報が送られてきた時又は必要に応じて、各検索サーバのデータベースの最新版を組み合わせた統合版を自動的に生成して各検索サーバへ送付することを特徴とする分散型文書検索装置。 - 複数の文書を格納するデータベースに対して文書検索を行なう複数の検索サーバと、これらの複数の検索サーバに通信接続され、各検索サーバに対して検索指示を行なう統合検索サーバとにより文書検索を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
各検索サーバに、検索動作によって得られた中間結果を基に作成した統計情報を統合検索サーバへ送付させるステップと、統合検索サーバに、前記統計情報を集計し、大域的な統計情報を作成して各検索サーバへ送付させるステップと、各検索サーバに前記大域的な統計情報を基にスコアを計算させ、各々検索条件に合致した検索結果を統合検索サーバに返送させるステップと、
前記各検索サーバに、前記データベースの版の更新を各検索サーバで独立に行い、この版の更新は統合検索サーバに対して更新の都度報告せず、その後の検索要求に対する検索動作を行なった時に版情報を統計情報とともに統合検索サーバに送付するステップと、
統合検索サーバに、前記版情報が送られてきた時又は必要に応じて、各検索サーバのデータベースの最新版を組み合わせた統合版を自動的に生成して各検索サーバへ送付するステップと、を含む処理を実行させるための分散型文書検索プログラムを記録したコンピュータ読み取り可能な記録媒体。 - 複数の文書を格納するデータベースに対して文書検索を行なう複数の検索サーバと、これらの複数の検索サーバに通信接続され、各検索サーバに対して検索指示を行なう統合検索サーバとにより文書検索をコンピュータに実行させるためのプログラムであって、
各検索サーバに、検索動作によって得られた中間結果を基に作成した統計情報を統合検索サーバへ送付させるステップと、統合検索サーバに、前記統計情報を集計し、大域的な統計情報を作成して各検索サーバへ送付させるステップと、各検索サーバに前記大域的な統計情報を基にスコアを計算させ、各々検索条件に合致した検索結果を統合検索サーバに返送させるステップと、
前記各検索サーバに、前記データベースの版の更新を各検索サーバで独立に行い、この版の更新は統合検索サーバに対して更新の都度報告せず、その後の検索要求に対する検索動作を行なった時に版情報を統計情報とともに統合検索サーバに送付するステップと、
統合検索サーバに、前記版情報が送られてきた時又は必要に応じて、各検索サーバのデータベースの最新版を組み合わせた統合版を自動的に生成して各検索サーバへ送付するステップと、を含む処理をコンピュータに実行させるための分散型文書検索プログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002002669A JP3693958B2 (ja) | 2001-04-05 | 2002-01-09 | 分散型文書検索方法及び装置、並びに分散型文書検索プログラム及びそのプログラムを記録した記録媒体 |
EP02006903A EP1248208A3 (en) | 2001-04-05 | 2002-03-26 | Distributed document retrieval method and device, and distributed document retrieval program and recording medium recording the program |
US10/115,261 US20020161753A1 (en) | 2001-04-05 | 2002-04-04 | Distributed document retrieval method and device, and distributed document retrieval program and recording medium recording the program |
CNB021060347A CN100489842C (zh) | 2001-04-05 | 2002-04-05 | 分布式文件检索方法、装置、程序及记录该程序的记录介质 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001-107629 | 2001-04-05 | ||
JP2001107629 | 2001-04-05 | ||
JP2002002669A JP3693958B2 (ja) | 2001-04-05 | 2002-01-09 | 分散型文書検索方法及び装置、並びに分散型文書検索プログラム及びそのプログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002366547A JP2002366547A (ja) | 2002-12-20 |
JP3693958B2 true JP3693958B2 (ja) | 2005-09-14 |
Family
ID=26613163
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002002669A Expired - Fee Related JP3693958B2 (ja) | 2001-04-05 | 2002-01-09 | 分散型文書検索方法及び装置、並びに分散型文書検索プログラム及びそのプログラムを記録した記録媒体 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20020161753A1 (ja) |
EP (1) | EP1248208A3 (ja) |
JP (1) | JP3693958B2 (ja) |
CN (1) | CN100489842C (ja) |
Families Citing this family (83)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7035880B1 (en) | 1999-07-14 | 2006-04-25 | Commvault Systems, Inc. | Modular backup and retrieval system used in conjunction with a storage area network |
US7395282B1 (en) | 1999-07-15 | 2008-07-01 | Commvault Systems, Inc. | Hierarchical backup and retrieval system |
US7389311B1 (en) | 1999-07-15 | 2008-06-17 | Commvault Systems, Inc. | Modular backup and retrieval system |
US6658436B2 (en) | 2000-01-31 | 2003-12-02 | Commvault Systems, Inc. | Logical view and access to data managed by a modular data and storage management system |
US7003641B2 (en) | 2000-01-31 | 2006-02-21 | Commvault Systems, Inc. | Logical view with granular access to exchange data managed by a modular data and storage management system |
US7155481B2 (en) | 2000-01-31 | 2006-12-26 | Commvault Systems, Inc. | Email attachment management in a computer system |
US7346493B2 (en) | 2003-03-25 | 2008-03-18 | Microsoft Corporation | Linguistically informed statistical models of constituent structure for ordering in sentence realization for a natural language generation system |
US7454569B2 (en) | 2003-06-25 | 2008-11-18 | Commvault Systems, Inc. | Hierarchical system and method for performing storage operations in a computer network |
CN100407636C (zh) * | 2003-10-14 | 2008-07-30 | 华为技术有限公司 | 一种提高通信设备可接入性的方法 |
US7546324B2 (en) | 2003-11-13 | 2009-06-09 | Commvault Systems, Inc. | Systems and methods for performing storage operations using network attached storage |
CA2546304A1 (en) | 2003-11-13 | 2005-05-26 | Commvault Systems, Inc. | System and method for performing an image level snapshot and for restoring partial volume data |
US7765549B1 (en) * | 2004-06-30 | 2010-07-27 | Affiliated Computer Services, Inc. | Distributing batches of items in a workflow |
US7801864B2 (en) | 2005-11-28 | 2010-09-21 | Commvault Systems, Inc. | Systems and methods for using metadata to enhance data identification operations |
US8930496B2 (en) | 2005-12-19 | 2015-01-06 | Commvault Systems, Inc. | Systems and methods of unified reconstruction in storage systems |
US7962709B2 (en) | 2005-12-19 | 2011-06-14 | Commvault Systems, Inc. | Network redirector systems and methods for performing data replication |
US7606844B2 (en) | 2005-12-19 | 2009-10-20 | Commvault Systems, Inc. | System and method for performing replication copy storage operations |
US8661216B2 (en) | 2005-12-19 | 2014-02-25 | Commvault Systems, Inc. | Systems and methods for migrating components in a hierarchical storage network |
AU2006331932B2 (en) | 2005-12-19 | 2012-09-06 | Commvault Systems, Inc. | Systems and methods for performing data replication |
US7617262B2 (en) | 2005-12-19 | 2009-11-10 | Commvault Systems, Inc. | Systems and methods for monitoring application data in a data replication system |
US7636743B2 (en) | 2005-12-19 | 2009-12-22 | Commvault Systems, Inc. | Pathname translation in a data replication system |
US7651593B2 (en) | 2005-12-19 | 2010-01-26 | Commvault Systems, Inc. | Systems and methods for performing data replication |
US20200257596A1 (en) | 2005-12-19 | 2020-08-13 | Commvault Systems, Inc. | Systems and methods of unified reconstruction in storage systems |
US7725461B2 (en) * | 2006-03-14 | 2010-05-25 | International Business Machines Corporation | Management of statistical views in a database system |
US20070233679A1 (en) * | 2006-04-03 | 2007-10-04 | Microsoft Corporation | Learning a document ranking function using query-level error measurements |
US8726242B2 (en) | 2006-07-27 | 2014-05-13 | Commvault Systems, Inc. | Systems and methods for continuous data replication |
US7593934B2 (en) | 2006-07-28 | 2009-09-22 | Microsoft Corporation | Learning a document ranking using a loss function with a rank pair or a query parameter |
US7882077B2 (en) | 2006-10-17 | 2011-02-01 | Commvault Systems, Inc. | Method and system for offline indexing of content and classifying stored data |
US8370442B2 (en) | 2008-08-29 | 2013-02-05 | Commvault Systems, Inc. | Method and system for leveraging identified changes to a mail server |
US20080228771A1 (en) * | 2006-12-22 | 2008-09-18 | Commvault Systems, Inc. | Method and system for searching stored data |
US7593931B2 (en) * | 2007-01-12 | 2009-09-22 | International Business Machines Corporation | Apparatus, system, and method for performing fast approximate computation of statistics on query expressions |
US8290808B2 (en) | 2007-03-09 | 2012-10-16 | Commvault Systems, Inc. | System and method for automating customer-validated statement of work for a data storage environment |
US7836174B2 (en) | 2008-01-30 | 2010-11-16 | Commvault Systems, Inc. | Systems and methods for grid-based data scanning |
JP5135060B2 (ja) * | 2008-05-21 | 2013-01-30 | 日本電信電話株式会社 | 分散型情報検索システム、分散型情報検索方法、分散型情報検索プログラムおよびそのプログラムを記録した記録媒体 |
US8204859B2 (en) | 2008-12-10 | 2012-06-19 | Commvault Systems, Inc. | Systems and methods for managing replicated database data |
US9495382B2 (en) | 2008-12-10 | 2016-11-15 | Commvault Systems, Inc. | Systems and methods for performing discrete data replication |
WO2011082113A1 (en) | 2009-12-31 | 2011-07-07 | Commvault Systems, Inc. | Asynchronous methods of data classification using change journals and other data structures |
JP5483561B2 (ja) * | 2010-02-25 | 2014-05-07 | 楽天株式会社 | ストレージ装置、サーバ装置、ストレージシステム、データベース装置、データの提供方法、及び、プログラム |
US8504517B2 (en) | 2010-03-29 | 2013-08-06 | Commvault Systems, Inc. | Systems and methods for selective data replication |
US8504515B2 (en) | 2010-03-30 | 2013-08-06 | Commvault Systems, Inc. | Stubbing systems and methods in a data replication environment |
US8725698B2 (en) | 2010-03-30 | 2014-05-13 | Commvault Systems, Inc. | Stub file prioritization in a data replication system |
US8352422B2 (en) | 2010-03-30 | 2013-01-08 | Commvault Systems, Inc. | Data restore systems and methods in a replication environment |
WO2011128945A1 (en) | 2010-04-16 | 2011-10-20 | Hitachi, Ltd. | Integrated search server and integrated search method |
WO2011150391A1 (en) | 2010-05-28 | 2011-12-01 | Commvault Systems, Inc. | Systems and methods for performing data replication |
JP5656563B2 (ja) * | 2010-11-02 | 2015-01-21 | キヤノン株式会社 | 文書管理システム、文書管理システムの制御方法、プログラム |
US9021198B1 (en) | 2011-01-20 | 2015-04-28 | Commvault Systems, Inc. | System and method for sharing SAN storage |
US8719264B2 (en) | 2011-03-31 | 2014-05-06 | Commvault Systems, Inc. | Creating secondary copies of data based on searches for content |
US8706756B2 (en) | 2011-05-11 | 2014-04-22 | Futurewei Technologies, Inc. | Method, system and apparatus of hybrid federated search |
US8914382B2 (en) * | 2011-10-03 | 2014-12-16 | Yahoo! Inc. | System and method for generation of a dynamic social page |
US9471578B2 (en) | 2012-03-07 | 2016-10-18 | Commvault Systems, Inc. | Data storage system utilizing proxy device for storage operations |
US9298715B2 (en) | 2012-03-07 | 2016-03-29 | Commvault Systems, Inc. | Data storage system utilizing proxy device for storage operations |
US9396540B1 (en) | 2012-03-28 | 2016-07-19 | Emc Corporation | Method and system for identifying anchors for fields using optical character recognition data |
US8595235B1 (en) * | 2012-03-28 | 2013-11-26 | Emc Corporation | Method and system for using OCR data for grouping and classifying documents |
US9069768B1 (en) * | 2012-03-28 | 2015-06-30 | Emc Corporation | Method and system for creating subgroups of documents using optical character recognition data |
US8832108B1 (en) * | 2012-03-28 | 2014-09-09 | Emc Corporation | Method and system for classifying documents that have different scales |
US8843494B1 (en) * | 2012-03-28 | 2014-09-23 | Emc Corporation | Method and system for using keywords to merge document clusters |
US9342537B2 (en) | 2012-04-23 | 2016-05-17 | Commvault Systems, Inc. | Integrated snapshot interface for a data storage system |
US8892523B2 (en) | 2012-06-08 | 2014-11-18 | Commvault Systems, Inc. | Auto summarization of content |
US9430491B2 (en) | 2013-01-11 | 2016-08-30 | Commvault Systems, Inc. | Request-based data synchronization management |
US9886346B2 (en) | 2013-01-11 | 2018-02-06 | Commvault Systems, Inc. | Single snapshot for multiple agents |
KR101496179B1 (ko) * | 2013-05-24 | 2015-02-26 | 삼성에스디에스 주식회사 | 데이터 부재 태깅 기반의 정보 검색 시스템 및 방법 |
US9753812B2 (en) | 2014-01-24 | 2017-09-05 | Commvault Systems, Inc. | Generating mapping information for single snapshot for multiple applications |
US9632874B2 (en) | 2014-01-24 | 2017-04-25 | Commvault Systems, Inc. | Database application backup in single snapshot for multiple applications |
US9495251B2 (en) | 2014-01-24 | 2016-11-15 | Commvault Systems, Inc. | Snapshot readiness checking and reporting |
US9639426B2 (en) | 2014-01-24 | 2017-05-02 | Commvault Systems, Inc. | Single snapshot for multiple applications |
US10042716B2 (en) | 2014-09-03 | 2018-08-07 | Commvault Systems, Inc. | Consolidated processing of storage-array commands using a forwarder media agent in conjunction with a snapshot-control media agent |
US9774672B2 (en) | 2014-09-03 | 2017-09-26 | Commvault Systems, Inc. | Consolidated processing of storage-array commands by a snapshot-control media agent |
US9448731B2 (en) | 2014-11-14 | 2016-09-20 | Commvault Systems, Inc. | Unified snapshot storage management |
US9648105B2 (en) | 2014-11-14 | 2017-05-09 | Commvault Systems, Inc. | Unified snapshot storage management, using an enhanced storage manager and enhanced media agents |
US10503753B2 (en) | 2016-03-10 | 2019-12-10 | Commvault Systems, Inc. | Snapshot replication operations based on incremental block change tracking |
CN106021527B (zh) * | 2016-05-24 | 2019-06-28 | 努比亚技术有限公司 | 一种数据处理方法及搜索服务器、同步服务器 |
US10540516B2 (en) | 2016-10-13 | 2020-01-21 | Commvault Systems, Inc. | Data protection within an unsecured storage environment |
US10389810B2 (en) | 2016-11-02 | 2019-08-20 | Commvault Systems, Inc. | Multi-threaded scanning of distributed file systems |
US10922189B2 (en) | 2016-11-02 | 2021-02-16 | Commvault Systems, Inc. | Historical network data-based scanning thread generation |
US10984041B2 (en) | 2017-05-11 | 2021-04-20 | Commvault Systems, Inc. | Natural language processing integrated with database and data storage management |
JP6556799B2 (ja) * | 2017-09-26 | 2019-08-07 | 株式会社東芝 | 検索装置、プログラム、データベースシステム、および検索方法 |
US20190251204A1 (en) | 2018-02-14 | 2019-08-15 | Commvault Systems, Inc. | Targeted search of backup data using calendar event data |
US10642886B2 (en) | 2018-02-14 | 2020-05-05 | Commvault Systems, Inc. | Targeted search of backup data using facial recognition |
US10732885B2 (en) | 2018-02-14 | 2020-08-04 | Commvault Systems, Inc. | Block-level live browsing and private writable snapshots using an ISCSI server |
US11159469B2 (en) | 2018-09-12 | 2021-10-26 | Commvault Systems, Inc. | Using machine learning to modify presentation of mailbox objects |
US11042318B2 (en) | 2019-07-29 | 2021-06-22 | Commvault Systems, Inc. | Block-level data replication |
US11494417B2 (en) | 2020-08-07 | 2022-11-08 | Commvault Systems, Inc. | Automated email classification in an information management system |
US11809285B2 (en) | 2022-02-09 | 2023-11-07 | Commvault Systems, Inc. | Protecting a management database of a data storage management system to meet a recovery point objective (RPO) |
US12056018B2 (en) | 2022-06-17 | 2024-08-06 | Commvault Systems, Inc. | Systems and methods for enforcing a recovery point objective (RPO) for a production database without generating secondary copies of the production database |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5659732A (en) * | 1995-05-17 | 1997-08-19 | Infoseek Corporation | Document retrieval over networks wherein ranking and relevance scores are computed at the client for multiple database documents |
US5826261A (en) * | 1996-05-10 | 1998-10-20 | Spencer; Graham | System and method for querying multiple, distributed databases by selective sharing of local relative significance information for terms related to the query |
US6163782A (en) * | 1997-11-19 | 2000-12-19 | At&T Corp. | Efficient and effective distributed information management |
AU1347100A (en) * | 1998-11-13 | 2000-06-05 | Chase Manhattan Bank, The | A system and method for managing information retrievals from distributed archives |
EP1006458A1 (en) * | 1998-12-01 | 2000-06-07 | BRITISH TELECOMMUNICATIONS public limited company | Methods and apparatus for information retrieval |
CA2296285A1 (en) * | 1999-02-03 | 2000-08-03 | At&T Corp. | Information access system and method for providing a personal portal |
EP1074925B8 (en) * | 1999-08-06 | 2011-09-14 | Ricoh Company, Ltd. | Document management system, information processing apparatus, document management method and computer-readable recording medium |
-
2002
- 2002-01-09 JP JP2002002669A patent/JP3693958B2/ja not_active Expired - Fee Related
- 2002-03-26 EP EP02006903A patent/EP1248208A3/en not_active Withdrawn
- 2002-04-04 US US10/115,261 patent/US20020161753A1/en not_active Abandoned
- 2002-04-05 CN CNB021060347A patent/CN100489842C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP1248208A3 (en) | 2004-12-15 |
CN100489842C (zh) | 2009-05-20 |
CN1379350A (zh) | 2002-11-13 |
EP1248208A2 (en) | 2002-10-09 |
US20020161753A1 (en) | 2002-10-31 |
JP2002366547A (ja) | 2002-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3693958B2 (ja) | 分散型文書検索方法及び装置、並びに分散型文書検索プログラム及びそのプログラムを記録した記録媒体 | |
US8402052B2 (en) | Search device, search method, and computer-readable recording medium storing search program | |
US8140541B2 (en) | Time-weighted scoring system and method | |
KR100971863B1 (ko) | 네트워크 문서의 배치화된 인텍싱을 위한 시스템 및 방법 | |
CN108509501A (zh) | 一种查询处理方法、服务器及计算机可读存储介质 | |
JP2006331117A (ja) | 文書検索システム、文書検索装置、文書検索方法および文書検索プログラム | |
CN110717073B (zh) | 云流程平台中结合业务数据实现流程查询处理的系统及其方法 | |
US6938043B2 (en) | Database processing method, apparatus for implementing same, and medium containing processing program therefor | |
CN113377289A (zh) | 一种缓存管理方法、系统、计算设备及可读存储介质 | |
CN110263060B (zh) | 一种erp电子附件管理方法及计算机设备 | |
CN111932076B (zh) | 一种规则配置和发布方法、装置及计算设备 | |
CN114647659A (zh) | 数据处理方法、装置、电子设备、存储介质 | |
WO2015049734A1 (ja) | 検索システム及び検索方法 | |
CN112527900A (zh) | 一种数据库读多副本一致性的方法、装置、设备及介质 | |
JP5211180B2 (ja) | データベース管理装置、データベース管理プログラム、データベース管理方法、データベース管理システム | |
US9147011B2 (en) | Searching method, searching apparatus, and recording medium of searching program | |
JP2002140366A (ja) | 関連語選出装置、その方法および記録媒体、並びに文書検索装置、その方法および記録媒体 | |
CN115203253A (zh) | 看板数据查询方法、装置、计算机终端及存储介质 | |
JP3984208B2 (ja) | 検索サーバ及び検索プログラム | |
JP3558267B2 (ja) | 文書検索装置 | |
KR101061201B1 (ko) | 검색 랭킹 모델 시뮬레이션 시스템 및 그 방법 | |
JP2009037359A (ja) | データ登録検索方法、データ登録検索プログラムおよびデータベースシステム | |
JP3699267B2 (ja) | 検索方法及び検索装置並びにデータベース方法及びデータベース装置 | |
CN114138798B (zh) | 查询结果命中概率估计系统、方法、电子设备及介质 | |
JP5508232B2 (ja) | クエリ推薦装置、クエリ推薦方法、クエリ推薦プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041005 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050308 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050414 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050621 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050622 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 3693958 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090701 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100701 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110701 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110701 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120701 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120701 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130701 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |