JP2005056223A

JP2005056223A - テキストデータ検索システム、その方法及びそのプログラム

Info

Publication number: JP2005056223A
Application number: JP2003287465A
Authority: JP
Inventors: Jiro Nakano; 治郎中野; Yasushi Shimizu; 泰清水; Kazuhiko Hattori; 和彦服部; Toramatsu Shintani; 虎松新谷; Tadachika Oozono; 忠親大囿
Original assignee: Inax Corp
Current assignee: Inax Corp
Priority date: 2003-08-06
Filing date: 2003-08-06
Publication date: 2005-03-03

Abstract

【課題】真に検索速度の高速化を実現可能なテキストデータ検索システムを提供する。
【解決手段】検索手段１０は、サーバコンピュータ１内の検索対象データベース１ａ〜１ｂの各元情報からレコード番号及び各クライアントコンピュータ２のニーズに応じて必要な項目を抽出して、レコード番号をもつ各クライアントコンピュータ２専用のインデックスを作成するインデックス作成手段１２と、クライアントコンピュータ２内のインデックスを検索して特定のレコード番号を抽出するレコード番号抽出手段１４と、レコード番号に基づいてサーバコンピュータ１の検索対象データベース１ａ〜１ｂから元情報を取得する元情報取得手段１６とからなる。
【選択図】図５

Description

本発明はテキストデータ検索システム、その方法及びそのプログラムに関する。

従来のテキストデータ検索システムでは、ユーザが所望する元情報をインデックスの検索によって取得することが行われている（例えば、特許文献１参照。）。そのシステムでは、元情報に含まれるテキスト情報によって、全文から構成されるインデックスが抽出できるようになっている。また、元情報に含まれるテキスト情報によって、文字列から構成されるインデックスも抽出できるようになっている。こうして、各インデックスでキーワードを検索することにより、インデックスに存在するキーワードの位置を特定したり、キーワードを含む文字列を特定したりすることができる。その際、検索対象となる項目が多数存在する場合、キーワードを含む文字列を特定した後、全文からその文字列に含まれるキーワードの位置を絞り込むことができる。このため、レコードの絞り込みが容易となり、高速検索を行うことができる。

特開２００２−３４２３７３号公報

しかし、上記従来のテキストデータ検索システムでは、キーワードを含む文字列を特定したり、全文からその文字列に含まれるキーワードの位置を特定したりすることを各検索対象の項目毎に繰り返すことによって、レコードの絞り込みを行っているにすぎない。こうしてレコードを絞り込む際に、何度も検索し直さなければならない。このため、真に検索速度の高速化を実現していない。

本発明は、上記従来の実情に鑑みてなされたものであって、真に検索速度の高速化を実現可能なテキストデータ検索システムを提供することを解決すべき課題としている。

本発明のテキストデータ検索システムは、テキスト情報を含み、データ型の異なる複数の項目から構成された元情報が格納された検索対象データベースを有するサーバコンピュータと、該サーバコンピュータとネットワークにより接続され、該検索対象データベースから所望する該テキスト情報を検索可能な検索手段を有する複数のクライアントコンピュータとからなり、
前記検索手段は、前記サーバコンピュータ内の前記検索対象データベースの各前記元情報からレコード番号及び各前記クライアントコンピュータのニーズに応じて必要な項目を抽出して、該レコード番号をもつ各該クライアントコンピュータ専用のインデックスを作成するインデックス作成手段と、該クライアントコンピュータ内の該インデックスを検索して特定の該レコード番号を抽出するレコード番号抽出手段と、該レコード番号に基づいて該サーバコンピュータの該検索対象データベースから該元情報を取得する元情報取得手段とからなることを特徴とする。

本発明のテキストデータ検索システムでは、サーバコンピュータにおいて、テキスト情報を含み、データ型の異なる複数の項目から構成された元情報が検索対象データベースに格納されている。元情報は、テキスト情報、数値情報、日付情報等といったデータ型の異なる複数の項目から構成されている。また、そのシステムは、サーバコンピュータとネットワークにより接続されたクライアントコンピュータにおいて、検索対象データベースから所望するテキスト情報を検索可能な検索手段を有している。

検索手段では、インデックス作成手段において、サーバコンピュータ内の検索対象データベースに格納された各元情報からレコード番号及び各クライアントコンピュータのニーズに応じて必要な項目を抽出して、レコード番号をもつ各クライアントコンピュータ専用のインデックスの作成を行うことができる。そして、レコード番号抽出手段において、クライアントコンピュータ内のインデックスを検索して特定のレコード番号の抽出を行うことができる。こうして、元情報取得手段において、レコード番号に基づいてサーバコンピュータの検索対象データベースから元情報の取得を行うことができる。

このため、検索手段において、インデックス作成手段で作成されるインデックスでは、各クライアントコンピュータのニーズに応じて必要な項目のみが抽出され、かつそれら検索対象となる項目をインデックス内で一つにまとめることによって検索速度の高速化を実現することができる。また、そのインデックスは、各クライアントコンピュータ専用のものであり、レコード番号を有している。そして、レコード番号抽出手段では、インデックスを検索することによって、キーワードが含まれる特定のレコード番号が抽出される。そのレコード番号は、サーバコンピュータの検索対象データベースに格納された元情報に対応している。このため、レコード番号を抽出することで元情報を取得することができる。データベースサーバでは、テキスト情報ではなく、レコード番号で検索することになるため、より一層、検索速度の高速化を実現することができる。

したがって、本発明のテキストデータ検索システムは、真に検索速度の高速化を実現することができる。

本発明のテキストデータ検索システムでは、検索対象データベースは複数のサーバコンピュータに跨る複数の個別データベースからなる場合は、データベース毎にインデックスを分けるか、各個別データベースを特定可能なフラグをもつことで対応する。インデックスが各個別データベース毎に作成されるか、又は各個別データベースを特定可能なフラグをもつことにより、複数のサーバコンピュータに跨って複数の個別データベースをもつ検索対象データベースを検索することができる。

本発明のテキストデータ検索システムでは、インデックス作成手段は、検索対象データベース内に追加された差分情報から新たなレコード番号を抽出し、該レコード番号をもつインデックスを追加的に作成することが好ましい。新たに追加されたレコード情報に対するインデックスを作成しているため、インデックスの作成時間を短縮することができる。

本発明のテキストデータ検索システムでは、インデックスはSuffix Array型であることが好ましい。Suffix Array型のインデックスであれば、検索速度の高速化を確実なものとすることができ、検索漏れのない全文検索を行うことができるからである。

本発明のテキストデータ検索システムでは、テキスト情報は顧客情報であることが好ましい。顧客情報は、顧客からの相談内容（苦情）、顧客からの相談内容に対する対応内容（相談応対）、顧客の住所、製品情報（製品のシリーズやその品番等）、顧客からの相談に対応した対応者、顧客からの相談に対応した日付等といったさまざまな情報があり、さまざまな個別データベースに格納されている。このため、このような情報の検索を高速化することが適切であると考えられる。

また、本発明のテキストデータ検索システムは、本発明のテキストデータ検索方法において検索することができる。すなわち、そのテキストデータ検索方法は、テキスト情報を含み、データ型の異なる複数の項目から構成された元情報が格納された検索対象データベースを有するサーバコンピュータと、該サーバコンピュータとネットワークにより接続された複数のクライアントコンピュータとを用い、該クライアントコンピュータによって該サーバコンピュータ内の該検索対象データベースから所望する該元情報を検索するテキストデータ検索方法において、
前記サーバコンピュータ内の前記検索対象データベースの各前記元情報からレコード番号及び各前記クライアントコンピュータのニーズに応じて必要な項目を抽出して、該レコード番号をもつ各該クライアントコンピュータ専用のインデックスを作成するインデックス作成工程と、該インデックスを前記クライアントコンピュータに保存するインデックス保存工程と、該クライアントコンピュータ内の該インデックスを検索して特定の該レコード番号を抽出するレコード番号抽出工程と、該レコード番号に基づいて該サーバコンピュータの該検索対象データベースから該元情報を取得する元情報取得工程とからなることを特徴とする。

このテキストデータ検索方法を実行することにより、本発明のテキストデータ検索システムを実現することができる。

さらに、本発明のテキストデータ検索システムは、本発明のテキストデータ検索プログラムにおいて検索することができる。すなわち、そのテキストデータ検索プラグラムは、テキスト情報を含み、データ型の異なる複数のテキスト情報が格納された検索対象データベースを有するサーバコンピュータと、該サーバコンピュータとネットワークにより接続された複数のクライアントコンピュータとを用い、該クライアントコンピュータによって該サーバコンピュータ内の該検索対象データベースから所望する該元情報を検索するテキストデータ検索プログラムにおいて、
前記サーバコンピュータ内の前記検索対象データベースの各前記元情報からレコード番号及び各前記クライアントコンピュータのニーズに応じて必要な項目を抽出して、該レコード番号をもつ各該クライアントコンピュータ専用のインデックスを作成するインデックス作成工程と、該インデックスを前記クライアントコンピュータに保存するインデックス保存工程と、該クライアントコンピュータ内の該インデックスを検索して特定の該レコード番号を抽出するレコード番号抽出工程と、該レコード番号に基づいて該サーバコンピュータの該検索対象データベースから該元情報を取得する元情報取得工程とからなることを特徴とする。

このテキストデータ検索プログラムを実行することにより、本発明のテキストデータ検索システムを実現することができる。

以下、本発明の実施形態を図１〜１３を参照しつつ説明する。

実施形態におけるテキストデータ検索システムは、例えば、企業内のコールセンター等に蓄積された大量の顧客情報に関する元情報を検索するためのものとして利用することができる。そのシステムは、図１に示すように、サーバコンピュータ１と、このサーバコンピュータ１とネットワークにより接続された複数のクライアントコンピュータ２とにより構成されている。

サーバコンピュータ１は、図２に示すように、元情報を格納した検索対象データベース１ａ〜１ｂを有している。検索対象データベースとしては、例えば、相談応対データベース１ａ、苦情データベース１ｂ等があり、その他にログデータベース１ｃ又は辞書データベース１ｄ等がある。相談応対データベース１ａには顧客からの相談にどのように応対したかについての元情報が蓄積されている。また、苦情データベース１ｂには顧客からの苦情についての元情報が蓄積されている。さらに、ログデータベース１ｃには各クライアントコンピュータ２が検索したキーワード検索実行日時等が蓄積されている。また、辞書データベース１ｄには、検索するキーワードとその類語との対応等を行うための元情報が蓄積されている。検索対象データベース１ａ〜１ｂは、コールセンター等に設けられた複数のサーバーコンピュータ１にさまざまな組み合わせで存在し得る。このように検索対象データベース１ａ〜１ｂに蓄積された元情報としてはさまざまな情報があり、元情報は、例えば、図３に示すようなテキスト情報や数値情報等といったデータ型の異なる複数の項目によって構成されている。なお、元情報や検索対象データベース１ａ〜１ｂは上述したものだけに限らず、さまざまなものが存在し得る。

クライアントコンピュータ２は、図４に示すように、実施形態のテキストデータ検索プログラムがアプリケーションサーバ２ａとしてインストールされている。アプリケーションサーバ２ａでは、元情報としてデータ型の異なる複数の項目のうち、所望するテキスト情報を検索可能な検索手段１０（図５参照）及び日付絞込手段を有している。なお、上述したログデータベース１ｃや辞書データベース１ｄ等がクライアントコンピュータ２に存在する場合もある。また、クライアントコンピュータ２にはテキスト検索用のインデックス及び日付絞込用相談応対インデックス１００が保存され、苦情データベース１ｂの元情報から抽出して作成された日付絞込用苦情インデックス１０１も保存されている。

検索手段１０では、図５に示すインデックス作成手段１２とレコード番号抽出手段１４と元情報取得手段１６とを備えている。

インデックス作成手段１２では、先ず、図２に示すサーバコンピュータ１内の検索対象データベース１ａ〜１ｂの各元情報からレコード番号を抽出する。そして、図６に示すインデックス作成フローチャートに基づいて各クライアントコンピュータ２専用のインデックスを作成する。

インデックス作成フローチャートにおけるステップＳ１では、インデックスを追加作成するか否かを判断する。追加作成しない（新規作成する）場合はステップＳ２に進む。

ステップＳ２では、変数ｉに１が代入される。次いで、ステップＳ３では、空のファイルとして、Suffix Array用元ファイル１１ａ及び日付絞込用インデックス１００を作成する。そして、ステップＳ４に進む。

ステップＳ４では、図７に示すように、上述した検索対象データベース１ａ〜１ｂの各元情報に付与されたレコード番号のうち、ｉ番目のレコード番号を有する元情報を抽出する。ここでは、一例として、相談応対データベース１ａの元情報（ｉ＝１番目の元情報）を抽出している。そして、図６に示すように、ステップＳ５に進む。

ステップＳ５では、図７に示すように、相談応対データベース１ａのｉ番目の元情報からクライアントコンピュータ２専用のインデックスに必要な項目をSuffix Array用元ファイル１１ａに追加する。そして、図６に示すように、ステップＳ６に進む。

ステップＳ６では、図７に示すように、相談応対データベース１ａのｉ番目の元情報から日付項目を日付絞込用相談応対インデックス１００に追加する。そして、図６に示すように、ステップＳ７に進む。

ステップＳ７では、検索対象データベース１ａ〜１ｂに次のレコードが存在するか否かを判断する。全てのレコードについて抽出した後、ステップＳ８に進む。

ステップＳ８では、図７に示すように、Suffix Array用元ファイル１１ａからSuffix Array型のインデックス１１１ａを作成する。そして、図６に示すように、ステップＳ９に進む。

ステップＳ９では、図７に示すように、レコード番号とSuffix Array型のインデックス１１１ａとの対応表１１１ｂを作成する。

こうして、Suffix Array型のインデックス１１１ａとその対応表１１１ｂとからなるクライアントコンピュータ２専用のインデックスが作成される。ここでは、オペレータ用相談応対インデックス１１１が作成されている。

ここで、図６に示すように、ステップＳ１においてインデックスを追加作成する場合はステップＳ１０に進む。ステップＳ１０では、追加作成するインデックスのレコード番号を変数ｉに代入する。そして、ステップＳ４に進む。

また、ステップＳ７において検索対象データベース１ａ〜１ｂに次のレコードが存在する場合はステップＳ１１に進む。ステップＳ１１では、変数ｉに１が加算される。そして、ステップＳ４に進む。

同様にして、図７に示すように、相談応対データベース１ａの元情報から必要な項目を追加したSuffix Array用元ファイル２２ａを作成する。そして、上述と同様に、新たなSuffix Array型のインデックス２２２ａとその対応表２２２ｂとからなるクライアントコンピュータ２専用のインデックスが作成される。ここでは、社内公開用相談応対インデックス２２２が作成されている。こうして、元情報からレコード番号を抽出し、そのレコード番号をもつ複数のニーズに応じたインデックスを作成することができる。

オペレータ用相談応対インデックス１１１は、例えば、図８（ａ）に示すように、製品のシリーズ、その品番、その相談内容、相談に対する対応内容又は対応者等の項目によって構成されている。また、社内公開用相談応対インデックス２２２は、例えば、図８（ｂ）に示すように、製品のシリーズ、その品番、その相談内容又は相談に対する応答内容等の項目によって構成されている。社内公開用相談応対インデックス２２２は、オペレータ用相談応対インデックス１１１に比して対応者の項目を必要としない。このように、クライアントコンピュータ２のニーズに応じて必要な項目のみを検索対象データベース１ａ〜１ｂから抽出してクライアントコンピュータ２専用のインデックスを作成することができる。このようなクライアントコンピュータ２専用のインデックスは、検索対象データベース１ａ〜１ｂの元情報に付与されたレコード番号に対応するレコード番号を有している。

こうして、作成された各クライアントコンピュータ２専用のインデックスは、図９に示す他のクライアントコンピュータ２に保存される。ここでは、オペレータ用のクライアントコンピュータ２に上述したオペレータ用相談応対インデックス１１１が保存され、上述と同様に苦情データベース１ｂの元情報から抽出して作成されたオペレータ用苦情インデックス１１２も保存されている。また、社内公開用のクライアントコンピュータ２に上述した社内公開用相談応対インデックス２２２が保存され、上述と同様に苦情データベース１ｂの元情報から抽出して作成された社内公開用苦情インデックス２２３も保存されている。

次に、図５に示すレコード番号抽出手段１４及び元情報取得手段１６では、図１０に示す検索実行フローチャートに基づいてクライアントコンピュータ２内のインデックスを検索して特定のレコード番号を抽出し、レコード番号に基づいてサーバコンピュータ１の検索対象データベース１ａ〜１ｂから元情報を取得する。

検索実行フローチャートにおけるステップＳ２１では、図１１に示すクライアントコンピュータ２の画面２０に検索したいキーワードを入力する。ここでは、クライアントコンピュータ２としてオペレータ用のものを用いている。その際、その画面２０では、「すべての語を含む」、「いずれかの語を含む」又は「類語検索」のいずれかを選択することによって、キーワードのＡＮＤ検索、そのＯＲ検索又はその類語検索を行うことができるようになっている。ここで、類語検索とは、キーワードの書き間違い、その同意異表記、その上位概念又はその下位概念を検索することである。こうして、キーワードのＡＮＤ検索、そのＯＲ検索又はその類語検索のいずれかを選ぶことによって検索式が決定される。また、その画面２０では、「相談応対データベース」、「苦情データベース」又な「すべて」のいずれかを選択することによって、図９に示すオペレータ用相談応対インデックス１１１、オペレータ用苦情インデックス１１２又はそれら両方を選択することができる。この際、クライアントコンピュータ２が社内公開用のものであれば、社内公開用相談応対インデックス２２２、社内公開用苦情インデックス２２３又はそれら両方を選択することができる。そして、図１０に示すステップＳ２２に進む。

ステップＳ２２では、ステップＳ２１において類語検索を選択したか否かを判断する。そして、類語検索を選択した場合は、ステップＳ２３に進む。ステップＳ２３では、上述した辞書インデックスを検索し、類語をキーワードに追加する。そして、ステップＳ２４に進む。ステップＳ２２において類語検索を選択しない場合は、ステップＳ２４にジャンプする。

ステップＳ２４では、ステップＳ２１及びステップＳ２３で選択したインデックスを検索し、検索したいキーワードに対応するレコード番号を取得する。こうして、図５に示すレコード番号抽出手段１４が行われることとなる。そして、図１０に示すステップＳ２５に進む。

ステップＳ２５では、日付絞込をするか否か判断する。日付絞込をする場合は、ステップＳ２６に進み、日付絞込用インデックスを用い、取得したレコード番号の絞込みを行う。そして、ステップＳ２７に進む。ステップＳ２５で日付絞込をしない場合は、ステップＳ２７にジャンプする。

ステップＳ２７では、ステップＳ２４で取得したレコード番号に基づいてサーバコンピュータ１の検索対象データベース１ａ〜１ｂから元情報を取得する。こうして、図５に示す元情報取得手段１６が行われることとなる。そして、図１０に示すステップＳ２８に進む。

ステップＳ２８では、検索結果を作成する。そして、ステップＳ２９に進み、図１２に示すクライアントコンピュータ２の画面２０に検索結果を表示する。なお、その画面２０において、検索結果で表示されるキーワードからさらに絞り込み検索を行うことができる。

こうして、実施形態の検索システムは、図１３に示す検索方法によって実行されることとなる。すなわち、インデックス作成手段１２によってインデックス作成工程Ｓ２０が行われ、インデックスをクライアントコンピュータ２に保存することによってインデックス保存工程Ｓ３０が行われ、レコード番号抽出手段１４によってレコード番号抽出工程Ｓ４０が行われ、元情報取得手段１６によって元情報取得工程Ｓ５０が行われることとなる。

以上のようにして構成される検索システムにおいて、所定のキーワードを１つ検索した場合、検索できたキーワードの数と検索に要した時間とを測定した。また、弊社既存システムを用いて検索した場合も同様に測定した。その結果を表１に示す。

表１に示すように、実施形態の検索システムでは、所定のキーワード（例えば、サティス）を１つ検索した場合、２秒で８６００個のキーワードを検索することができた。また、そのキーワード（例えば、サティス・寸法）を２つ検索した場合、２秒で２３６個のキーワードを検索することができた。

これに対し、弊社既存システムを用いて検索した場合、所定のキーワードを１つ検索した場合、１５０秒で８６００個のキーワードを検索することができた。また、そのキーワードを２つ検索した場合、１６５秒で２３６個のキーワードを検索することができた。

このように実施形態の検索システムでは、検索手段１０において、インデックス作成手段１２で作成されるインデックスが各クライアントコンピュータ２のニーズに応じて必要な項目のみを抽出し、インデックス内で一つにまとめることによって、またSuffix Arrayを用いていることから、検索速度の高速化が実現できる。また、インデックス検索後に得られたレコード番号でデータベースを再検索して元情報を取得するため、データベース負荷が低減し、より一層、検索速度の高速化を実現することができる。

したがって、実施形態のテキストデータ検索システムは、真に検索速度の高速化を実現することができる。

また、その検索システムでは、インデックスをデータベース毎に分けるか、インデックスが検索対象データベース１ａ〜１ｂを特定可能なフラグをもつことから、インデックスのフラグを検索することで検索対象データベース１ａ〜１ｂの検索が容易となる。

さらに、その検索システムでは、インデックス作成手段１２において、新たに追加された差分情報に対するインデックスを追加的に作成しているため、インデックスの作成時間を短縮することができる。

また、その検索システムでは、インデックスがSuffix Array型であるため、検索速度の高速化を確実なものとすることができ、検索漏れのない全文検索を行うことができる。

本発明はコンピュータによるテキスト情報の検索に用いて好適である。

実施形態に係り、テキストデータ検索システムに関する全体構成図である。実施形態に係り、サーバコンピュータに関する詳細図ある。実施形態に係り、元情報に関する詳細図ある。実施形態に係り、クライアントコンピュータに関する詳細図ある。実施形態に係り、検索手段に関する詳細図ある。実施形態に係り、インデックス作成手段に関するフローチャートである。実施形態に係り、インデックス作成手段に関する詳細図である。実施形態に係り、クライアントコンピュータ専用のインデックスを示す全体図である。実施形態に係り、他のクライアントコンピュータに関する詳細図ある。実施形態に係り、レコード番号抽出手段及び元情報取得手段に関するフローチャートである。実施形態に係り、クライアントコンピュータの画面図である。実施形態に係り、検索結果を示すクライアントコンピュータの画面図である。実施形態に係り、テキストデータ検索方法に関する工程図である。

符号の説明

１ａ〜１ｂ…検索対象データベース（１ａ…相談応対データベース、１ｂ…苦情データベース）
１…サーバコンピュータ
１０…検索手段
２…クライアントコンピュータ
１２…インデックス作成手段
１４…レコード番号抽出手段
１６…元情報取得手段
Ｓ２０…インデックス作成工程
Ｓ３０…インデックス保存工程
Ｓ４０…レコード番号抽出工程
Ｓ５０…元情報取得工程

Claims

テキスト情報を含み、データ型の異なる複数の項目から構成された元情報が格納された検索対象データベースを有するサーバコンピュータと、該サーバコンピュータとネットワークにより接続され、該検索対象データベースから所望する該テキスト情報を検索可能な検索手段を有する複数のクライアントコンピュータとからなり、
前記検索手段は、前記サーバコンピュータ内の前記検索対象データベースの各前記元情報からレコード番号及び各前記クライアントコンピュータのニーズに応じて必要な項目を抽出して、該レコード番号をもつ各該クライアントコンピュータ専用のインデックスを作成するインデックス作成手段と、該クライアントコンピュータ内の該インデックスを検索して特定の該レコード番号を抽出するレコード番号抽出手段と、該レコード番号に基づいて該サーバコンピュータの該検索対象データベースから該元情報を取得する元情報取得手段とからなることを特徴とするテキストデータ検索システム。
前記検索対象データベースは複数の前記サーバコンピュータに跨る複数の個別データベースからなり、前記インデックスは、各該個別データベース毎に作成され、又は各該個別データベースを特定可能なフラグをもつことを特徴とする請求項１記載のテキストデータ検索システム。
前記インデックス作成手段は、前記検索対象データベース内に追加された各差分情報から新たなレコード番号を抽出し、該レコード番号をもつインデックスを追加的に作成することを特徴とする請求項１又は２記載のテキストデータ検索システム。
前記インデックスはSuffix Array型であることを特徴とする請求項１乃至３のいずれか１項記載のテキストデータ検索システム。
前記テキスト情報は顧客情報であることを特徴とする請求項１乃至４のいずれか１項記載のテキストデータ検索システム。
テキスト情報を含み、データ型の異なる複数の項目から構成された元情報が格納された検索対象データベースを有するサーバコンピュータと、該サーバコンピュータとネットワークにより接続された複数のクライアントコンピュータとを用い、該クライアントコンピュータによって該サーバコンピュータ内の該検索対象データベースから所望する該元情報を検索するテキストデータ検索方法において、
前記サーバコンピュータ内の前記検索対象データベースの各前記元情報からレコード番号及び各前記クライアントコンピュータのニーズに応じて必要な項目を抽出して、該レコード番号をもつ各該クライアントコンピュータ専用のインデックスを作成するインデックス作成工程と、該インデックスを前記クライアントコンピュータに保存するインデックス保存工程と、該クライアントコンピュータ内の該インデックスを検索して特定の該レコード番号を抽出するレコード番号抽出工程と、該レコード番号に基づいて該サーバコンピュータの該検索対象データベースから該元情報を取得する元情報取得工程とからなることを特徴とするテキストデータ検索方法。
テキスト情報を含み、データ型の異なる複数の項目から構成された元情報が格納された検索対象データベースを有するサーバコンピュータと、該サーバコンピュータとネットワークにより接続された複数のクライアントコンピュータとを用い、該クライアントコンピュータによって該サーバコンピュータ内の該検索対象データベースから所望する該元情報を検索するテキストデータ検索プログラムにおいて、
前記サーバコンピュータ内の前記検索対象データベースの各前記元情報からレコード番号及び各前記クライアントコンピュータのニーズに応じて必要な項目を抽出して、該レコード番号をもつ各該クライアントコンピュータ専用のインデックスを作成するインデックス作成工程と、該インデックスを前記クライアントコンピュータに保存するインデックス保存工程と、該クライアントコンピュータ内の該インデックスを検索して特定の該レコード番号を抽出するレコード番号抽出工程と、該レコード番号に基づいて該サーバコンピュータの該検索対象データベースから該元情報を取得する元情報取得工程とからなることを特徴とするテキストデータ検索プログラム。