JP4266722B2 - インデクス作成ルール設定方法 - Google Patents

インデクス作成ルール設定方法 Download PDF

Info

Publication number
JP4266722B2
JP4266722B2 JP2003175268A JP2003175268A JP4266722B2 JP 4266722 B2 JP4266722 B2 JP 4266722B2 JP 2003175268 A JP2003175268 A JP 2003175268A JP 2003175268 A JP2003175268 A JP 2003175268A JP 4266722 B2 JP4266722 B2 JP 4266722B2
Authority
JP
Japan
Prior art keywords
index
request
index creation
search
creation rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003175268A
Other languages
English (en)
Other versions
JP2005011108A5 (ja
JP2005011108A (ja
Inventor
岐勇 飯島
忠孝 松林
菅谷  奈津子
十悟 野田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2003175268A priority Critical patent/JP4266722B2/ja
Publication of JP2005011108A publication Critical patent/JP2005011108A/ja
Publication of JP2005011108A5 publication Critical patent/JP2005011108A5/ja
Application granted granted Critical
Publication of JP4266722B2 publication Critical patent/JP4266722B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、コンピュータを利用した文書検索技術に関し、特に、文書検索システムにて使用する検索インデクスを作成する技術に関する。
【0002】
【従来の技術】
電子記憶媒体の普及により文書データベースは大規模化の一途を辿っており、その中から任意の文書を探し出す文書検索システムの重要性が増している。文書検索システムは、先ず、検索インデクスを作成し、次に、検索インデクスを参照して文書データを検索する。インデクスを作成する文字列の組み合わせパターンを、以下、インデクス作成ルールと呼ぶ。
【0003】
特開昭64−35627号公報には、検索対象文書の登録時に文書中の文字列の位置情報をインデクスとして格納しておくことにより検索タームを入力してから文書を探し出すまでの時間(以下、検索時間と呼ぶ)を短縮する技術が記載されている。以下、この技術を従来技術1と呼ぶ。
【0004】
特開平8−194718号公報には、インデクス作成ルールを拡張することによってさらに検索時間を短縮する技術が記載されている。以下、この技術を従来技術2と呼ぶ。
【0005】
【特許文献1】
特開昭64−35627号公報
【特許文献2】
特開平8−194718号公報
【0006】
【発明が解決しようとする課題】
インデクス作成ルールを拡張すると、検索精度は高くなるが、作成されるインデクスも増加し、それを格納するために必要な記憶装置の容量(以下、インデクス容量と呼ぶ)が増加し、検索時間が増加する。
【0007】
現実には、文書検索システムが利用可能な記憶容量には制限があるため、インデクス容量には制限がある。従来技術2では、検索時間の短縮という目的は達成されるが文書検索システムにて利用できるインデクス容量などについては考慮されていない。
【0008】
所定のインデクス容量の範囲にて、検索時間を短縮することができるインデクス作成ルールを設定するためには、文書検索システムの利用方法と検索対象文書に精通した者が作業する必要がある。
【0009】
しかしながら、検索者及びシステム管理者の双方が、文書検索システムの利用方法と検索対象文書に精通することは困難となりつつある。
【0010】
本発明は、文書検索システムの利用方法と検索対象文書に精通した者が作業しなければ、適切なインデクス作成ルールを設定できないという問題を解決することを目的とする。
【0011】
本発明は、登録された文書データ及び文書検索システムの環境に応じたインデクス作成ルールを短時間に簡便な方法で設定できるよう支援することを目的とする。
【0012】
【課題を解決するための手段】
本発明によると、先ず、登録する検索対象文書の統計情報と、検索実行者が入力すると予想される検索文字列又は検索タームと、記憶媒体の容量等の制約条件についての情報を取得する。次に、取得した情報と過去のインデクス作成実績に基づいてインデクス作成後のインデクス容量と検索速度を推定する。
【0013】
また、推定インデクス容量と推定検索速度に対して、インデクス容量を減らしたい又は全体的に検索速度を向上させたい又は特定の検索パターンの検索速度を向上させたいといった、インデクスを作成するシステム管理者の要望を取得する。次に、取得した要望に基づいてインデクス作成ルールを再作成し、修正した推定インデクス容量と推定検索速度を出力する。
【0014】
インデクスを作成するシステム管理者が、推定インデクス容量と推定検索速度に対して満足した場合に、その意図を取得する。このとき、推定に用いたインデクス作成ルールを、実際にインデクスを作成するインデクス作成ルールとして記録する。
【0015】
【発明の実施の形態】
以下、本発明の実施例について図1を用いて説明する。本例のインデクス作成ルール設定システムは、ディスプレイ等の表示装置101、キーボード、マウス等の入力装置102、中央演算処理装置(CPU)103、二次記憶装置としての磁気ディスク装置104、主記憶装置105及びこれらを結ぶバス106から構成される。本例のインデクス作成ルール設定システムは、文書データより文書を検索する文書検索システムのためにインデクス作成ルールを設定する。文書検索システムは、様々なものが知られており、その説明を省略する。
【0016】
磁気ディスク装置104には、質問回答パターン111、インデクス作成ルールパターン112、検索内容種別113、インデクス容量推定基準知識114及び検索速度推定基準知識115が格納される。主記憶装置105には、一時記憶121とプログラム122が格納される。プログラム122は、システム制御プログラム123と入出力制御プログラム124と設定制御プログラム125とを含む。プログラム122は更に登録データ取得プログラム126、統計情報取得プログラム127、質問処理プログラム128、要望取得プログラム129、ルール設定処理プログラム130、容量推定処理プログラム131、検索速度推定処理プログラム132及び要望対応処理プログラム133を含む。
【0017】
プログラム122は磁気ディスク装置104等のコンピュータによって読み書き可能な記憶媒体に格納され、実行時に主記憶装置に読み出される。
【0018】
以下、図2及び図3を参照して、本実施例におけるインデクス作成ルール設定システムの処理内容の概要について説明する。
【0019】
ステップ201にて、先ず、入力装置102からの指示によって、システム制御プログラム123が起動する。システム制御プログラム123は、入出力制御プログラム124を起動する。入出力制御プログラム124は、登録データ取得プログラム126を起動する。登録データ取得プログラム126は、表示装置101に図4の登録データ取得画面301を出力する。
【0020】
ユーザは、入力装置102を用いて登録データ取得画面301を操作し、当該文書検索システムにこれから登録する予定である文書データのサンプルを指定する。これを以下、登録予定データ内容231と呼ぶ。登録データ取得プログラム126は登録予定データ内容231を磁気ディスク装置104に格納する。図4の登録データ取得画面301に関しては後述する。
【0021】
ステップ202にて、入出力制御プログラム124は統計情報取得プログラム127を起動する。統計情報取得プログラム127は、磁気ディスク装置104に格納された登録予定データ内容231を分析し、分析結果として、図5に示す統計情報232を生成する。
【0022】
統計情報232は、分析項目401と登録予定データ分析結果402と検索予定データ分析結果403を含む。登録予定データ分析結果402と検索予定データ分析結果403は、磁気ディスク装置104に格納される。図5の統計情報232に関しては後述する。
【0023】
ステップ203にて、入出力制御プログラム124は質問処理プログラム128を起動する。質問処理プログラム128は、登録予定データ分析結果402に基づいて、磁気ディスク装置104に格納された質問回答パターン111から、質問文章501と回答パターン502を取得する。質問回答パターン111の表を図6に示す。質問回答パターン111は質問文章501と回答パターン502と影響503と分析項目条件504からなる。統計情報232における登録予定データ分析結果402が分析項目条件504を満たす場合に、その質問文章501と回答パターン502を取得する。図6の質問回答パターン111に関しては後述する。
【0024】
ステップ204にて、質問処理プログラム128は表示装置101に図7の回答請求画面601を出力する。回答請求画面601には、ステップ203で取得した質問文章501と回答パターン502が表示される。ユーザは、質問文章501に対する回答パターン502を選択又は指定する。質問処理プログラム128は、全ての質問文章501に対する回答パターン502が選択されたら、それを回答として取得する。図7の回答請求画面601に関しては後述する。
【0025】
ステップ205にて、質問処理プログラム128はステップ204で取得した回答と質問回答パターン111の影響503に基づいて、検索するデータ内容と環境の制約条件を決定し、回答と共に磁気ディスク装置104に格納する。検索するデータ内容は、検索者が入力すると予想される検索文字列又は検索タームであり、以下に検索予定データ内容235と呼ぶ。
【0026】
ステップ206にて、システム制御プログラム123は入力装置102からの指示を受けて設定制御プログラム125を起動する。設定制御プログラム125は、ルール設定処理プログラム130を起動する。ルール設定処理プログラム130は、質問回答パターン111及び回答、検索予定データ内容235、環境の制約条件 、登録予定データ分析結果402に基づいて、インデクス作成ルールパターン112に含まれるインデクス作成ルール701ごとの優先順位704を設定する。インデクス作成ルールパターン112は図8に示す。設定した優先順位704はルール設定優先順として一時記憶121に保持する。図8のインデクス作成ルールパターン112に関しては後述する。
【0027】
ステップ207にて、ルール設定処理プログラム130は、ステップ206又はステップ213で設定した優先順位に基づいて適用するインデクス作成ルールを選定し、一時記憶121に保持する。
【0028】
ステップ206、ステップ207の処理により、適用するインデクス作成ルールは当該文書検索システムの記憶装置容量等の制限事項を反映することが可能となり、許容できる記憶容量を越えるようなルールが適用されることはない。
【0029】
ステップ208にて、設定制御プログラム125は、容量推定処理プログラム131を起動する。容量推定処理プログラム131は、インデクス容量推定基準知識114を用いて、ステップ207で選定したインデクス作成ルールに基づいて、当該文書検索システムで作成したインデクスの容量を推定し、それを推定インデクス容量として一時記憶121に保持する。インデクス容量推定基準知識114は、過去のインデクス作成実績に基づいて作成されたものである。推定インデクス容量は、環境の制約条件の範囲にて、登録する文書データの容量毎に求められる。
【0030】
ステップ209にて、設定制御プログラム125は、検索速度推定処理プログラム132を起動する。検索速度推定処理プログラム132は、検索速度推定基準知識115を用いて、ステップ207で選定したインデクス作成ルールに基づいて、当該文書検索システムでインデクスを作成した場合の検索速度を推定し、それを推定検索速度として一時記憶121に保持する。検索速度推定基準知識115は、過去のインデクス作成実績に基づいて作成されたものである。推定検索速度は、図10に示すように、検索内容種別113毎に求められる。図10の検索内容種別113の詳細は後に説明する。
【0031】
ステップ210にて、システム制御プログラム123は、推定インデクス容量と推定検索速度が算出された後に、入出力制御プログラム124を起動する。入出力制御プログラム124は、要望取得プログラム129を起動する。要望取得プログラム129は、表示装置101に図9の推定結果画面801を出力する。ユーザは、入力装置102より、推定結果画面801の要望を指定する。要望取得プログラム129は、ユーザによって指定された要望を一時記憶121に格納する。図9の推定結果画面801に関しては後述する。
【0032】
ステップ211にて、システム制御プログラム123は、要望取得プログラム129が一時記憶121に要望を格納すると、設定制御プログラム125を起動する。設定制御プログラム125は、要望対応処理プログラム133を起動する。要望対応処理プログラム133は一時記憶121に格納された要望を取得する。
【0033】
要望が表示装置101に出力した推定結果画面801中の推定インデクス容量又は推定検索速度に対する変更要請であるならば内容に応じて一時記憶121に格納された適用するインデクス作成ルールを変更する処理を行なう。推定インデクス容量及び推定検索速度に満足した内容ならば適用するインデクス作成ルールを最終インデクス作成ルールとして磁気ディスク装置104に格納する処理を実施する。
【0034】
ステップ212にて、要望対応処理プログラム133がステップ211で取得した要望が、検索パターン802ごとの予想検索速度803又は特定ターム指定パターン808ごとの予想検索速度809の変更であるか否かを判定する。予想検索速度803又は予想検索速度809の変更ならば、ステップ213にて、一時記憶121に格納したルール設定優先順を変更する処理を実施する。ステップ213の詳細は後に説明する。そうでないならステップ214に進む。
【0035】
ステップ214にて、要望が、インデクス容量が増加しても検索時間を短縮したいのであるか否かを判定する。検索時間を短縮したいのであれば、ステップ215にて、一時記憶121に格納したルール設定優先順に基づいて、適用するインデクス作成ルールを増加する処理を実施し、ステップ208に進む。ステップ215の詳細は後に説明する。
【0036】
そうでなければ、ステップ216に進み、要望が、検索時間が増加してもインデクス容量を縮小したいのであるか否かを判定する。インデクス容量を縮小したいのであるならば、ステップ217に進む。ステップ217にて、一時記憶121に格納したルール設定優先順に基づいて、適用するインデクス作成ルールを低減する処理を実施し、ステップ208に進む。ステップ217の詳細は後に説明する。そうでなければ、ステップ218に進む。
【0037】
ステップ218は、要望が、検索パターン802ごとの予想検索速度803の変更ではなく、又はインデクス容量が増加しても検索時間を短縮したい(速度上昇・容量増加ボタン804)のでもなく、又は検索時間が増加してもインデクス容量を縮小したい(容量減少・速度低下ボタン805)のでもない場合である。当発明の対応しない入力であるため、システム制御プログラム123は入出力制御プログラム124を起動し、表示装置101に出力する推定結果画面801に、入力者である当該文書検索システムのシステム管理者に対して、要望を入力し直すよう促す。
【0038】
次に、ステップ213のルール設定優先順を変更する処理について説明する。該当処理では、一時記憶121に格納された要望より、検索パターン802と予想検索速度803に対する「高速(検索時間を短縮する)」「低速(インデクス容量を低減する)」といった要望を取得する。
【0039】
図10に示す検索内容種別113から、当該検索パターン802に対応する関連インデクス作成ルール名称902を取得し、それらのインデクス作成ルールのルール設定優先順を、要望に応じ、優先度を高くする又は低くする。例えば、「高速」が指定された場合、該当するインデクス作成ルールのルール設定優先順を高くする。一時記憶121に格納したルール設定優先順 を更新した後、適用するインデクス作成ルールを変更するステップ207の処理を実施する。図10の検索内容種別113に関しては後述する。
【0040】
次に、ステップ215の、適用するインデクス作成ルールを増加する処理について説明する。該当処理では、一時記憶121に格納したルール設定優先順の中で、一時記憶121に格納した、適用するインデクス作成ルールに含まれないルールの中で最もルール設定優先順が高いインデクス作成ルールを、適用するインデクス作成ルールに加え、インデクス作成ルールを更新する。一時記憶121に格納した適用するインデクス作成ルールを更新した後、推定インデクス容量と推定検索速度を取得するステップ208、209の処理を実施する。
【0041】
次に、ステップ217の、適用するインデクス作成ルールを低減する処理について説明する。該当処理では、一時記憶121に格納した適用するインデクス作成ルールの中から、最もルール設定優先順が低いインデクス作成ルールを除外し、インデクス作成ルールを更新する。一時記憶121に格納した適用するインデクス作成ルールを更新した後、推定インデクス容量と推定検索速度を取得するステップ208、209の処理を実施する。
【0042】
ステップ219の、最終インデクス作成ルールを設定する処理について説明する。要望が、表示装置101に出力した推定結果画面801中の推定インデクス容量及び推定検索速度に満足した内容ならば、推定に利用した、一時記憶121に格納した適用するインデクス作成ルールを最終インデクス作成ルールとして磁気ディスク装置104に格納する。
【0043】
ステップ211からステップ219までの一連の処理により当該文書検索システムのシステム管理者にインデクス作成後の予測を示し、それに対するシステム管理者の意図を取得し、インデクス作成ルールに反映することによって、当該文書検索システムのインデクス作成ルールとなる最終インデクス作成ルールは、当該文書検索システムのシステム管理者の意図に沿うものとなる。
【0044】
図4の登録データ取得画面301について説明する。登録データ取得画面301は、ステップ201において表示装置101に出力される。本例の登録データ取得画面301は、ディレクトリ構造一覧302と指定ディレクトリ内のファイル一覧303と登録対象ディレクトリ一覧306と登録対象ファイル一覧307と指定ディレクトリ追加ボタン304と指定ファイル追加ボタン305と現在指定されているディレクトリ308を含む。
【0045】
図示のように、登録データ取得画面301には「サンプル文書又はサンプル文書があるディレクトリを選択してください。」の指示が表示される。ユーザが、ディレクトリ構造一覧302からディレクトリを指定すると、そのディレクトリ名がディレクトリ308に表示され、指定したディレクトリ内のファイルがファイル一覧303に表示される。ユーザが、指定ディレクトリ追加ボタン304を押下すると、指定したディレクトリが登録対象ディレクトリ一覧306に追加され、指定ファイル追加ボタン305を押下すると、指定したファイルが登録対象ファイル一覧307に追加される。
【0046】
指定ディレクトリ追加ボタン304と指定ファイル追加ボタン305を設ける代わりに、マウス等の入力装置102によるドラッグアンドドロップによる動作により、指定ディレクトリ又は指定ファイルを登録対象ディレクトリ一覧306又は登録対象ファイル一覧307に追加するように構成してもよい。図4の登録データ取得画面301の内容は例示であり、その一部は省略されてもよい。
【0047】
登録対象ディレクトリ一覧306にて指定されたディレクトリ内及びそれ以下の構造に存在する全てのファイルは、登録予定データ内容231として登録データ取得プログラム126が取得する。また、登録対象ファイル一覧307にて指定された全てのファイルは、登録予定データ内容231として登録データ取得プログラム126が取得する。
【0048】
図5の統計情報232について説明する。統計情報232は分析項目401と登録予定データ分析結果402と検索予定データ分析結果403とを含む。分析項目401は、取得するべき分析の内容であり、図示のように、半角英字連続出現率、漢字連続出現率、半角英字半角数字隣接率等がある。登録予定データ分析結果402は、登録予定データ231に対する各分析項目の分析結果である。登録予定データ231は、ステップ201にて、入力装置102からのユーザの指示によって指定される。検索予定データ分析結果403は、検索予定データ内容235に対する各分析項目の分析結果情報である。検索予定データ内容235は、ステップ205にて、質問処理プログラム128によって設定される。
【0049】
図6の質問回答パターン111について説明する。質問回答パターン111は質問文章501と回答パターン502と影響503と分析項目条件504を含む。例えば、カタカナ連続出現率が高い場合は、質問文章501「外来語など、カタカナで多くの検索を実行しますか」、回答パターン502「Yes/No」を取得する。Yesであった場合、影響503「ルール:カタカナ3-gramインデクス作成優先度を上げる」を、ルール設定優先順を設定する処理(図2のステップ206)において適用する。
【0050】
図7の回答請求画面601について説明する。回答請求画面601は図2のステップ204において表示装置101に出力され、ステップ203で取得した質問文章501と回答パターン502と等しい数の質問欄602と回答欄603からなる。回答請求画面601には複数の質問文章501と回答パターン502が表示されている。
【0051】
それぞれの質問欄602と回答欄603には一つづつ、質問文章501と回答パターン502を出力する。回答欄603は入力装置102から操作可能であり、操作結果を回答として、質問処理プログラム128が取得する。
【0052】
図8のインデクス作成ルールパターン112について説明する。インデクス作成ルールパターン112はインデクス作成ルール701ごとに、初期のインデクス作成ルールに含めるか否かを表す初期設定702と日本語の基本原則に基づく基本優先度703と当システムが入力情報に基づいて決定する優先順位704を保持する。例えば、初期設定702は0又は1、基本優先度703及び優先順位704は、1から10までの数字が設定される。
【0053】
なお、本実施例ではインデクス作成ルールの例として、n-gramインデクス作成方式とタームインデクス作成方式を組み合わせたルール群を用いて説明したが、本発明は特定のインデクス作成方式に限定されるものではなく、あらゆるインデクス作成方式に対して適用可能である。この場合、登録予定データ内容の統計情報232、質問回答パターン111、インデクス作成ルールパターン112、推定インデクス容量、検索速度推定基準知識115、検索内容種別113をインデクス作成方式に適合させたものにすればよい。
【0054】
図9の推定結果画面801について説明する。推定結果画面801はステップ210において表示装置101に出力され、検索パターン802と検索パターン802ごとの予想検索速度803と特定ターム指定パターン808と特定ターム指定パターン808ごとの予想検索速度809と速度上昇・容量増加ボタン804と容量減少・速度低下ボタン805と登録容量に対するインデクス容量の推移予想図806とインデクス確定ボタン807を含む。
【0055】
推定結果画面801では、入力装置102から、検索パターン802ごとの予想検索速度803と特定ターム指定パターン808ごとの予想検索速度809で個別の検索の予想検索速度に対する要望を取得できる。
【0056】
また、同様に速度上昇・容量増加ボタン804から、インデクス容量が増加しても検索時間を短縮したい意図を取得できる。
【0057】
同様に、容量減少・速度低下ボタン805から、検索時間が増加してもインデクス容量を縮小したい意図を取得できる。
【0058】
同様に、インデクス確定ボタン807から、推定インデクス容量及び推定検索速度に満足した意図を取得できる。
【0059】
また、本実施例では検索内容種別113に検索パターン802と特定ターム指定パターン808の2つの例を示したが、そのどちらか片方のみである場合もある。又はSQL自体を指定する方式の実施形態を構成するようにしても良い。
【0060】
図10の検索内容種別113について説明する。検索内容種別113は検索内容名称901と関連インデクス作成ルール名称902を含む。例えば、検索内容名称901「長いカタカナ語検索」の関連インデクス作成ルール名称902は「カタカナ3-gramインデクス」となる。図3のステップ213において、当該検索パターン802が「長いカタカナ語検索」であり「高速」が指定されている場合、対応する関連インデクス作成ルール名称902である「カタカナ3-gramインデクス」のルール設定優先順を上げる。
【0061】
図11を参照して、本発明によるインデクス作成ルール設定装置の例を説明する。本例のインデクス作成ルール設定装置1106は、登録データ取得プログラム126の機能を有する登録データ取得部1126、統計情報取得プログラム127の機能を有する統計情報取得部1127、質問処理プログラム128の機能を有する質問処理部1128、要望取得プログラム129の機能を有する要望取得部1129、ルール設定処理プログラム130の機能を有するルール設定処理部1130、容量推定処理プログラム131の機能を有する容量推定処理部1131、検索速度推定処理プログラム132の機能を有する検索速度推定処理部1132及び要望対応処理プログラム133の機能を有する要望対応処理部1133を含む。
【0062】
本例のインデクス作成ルール設定装置は、更に、磁気ディスク装置104を有し、磁気ディスク装置104には、質問回答パターン111、インデクス作成ルールパターン112、検索内容種別113、インデクス容量推定基準知識114及び検索速度推定基準知識115が格納される。
【0063】
本発明は、図1に示したように、コンピュータプログラムとして実現されてよいが、図11に示すように、ハードウエアとして構成されてよい。
【0064】
以上本発明の例を説明したが、本発明は上述の例に限定されるものではなく、特許請求の範囲に記載された発明の範囲にて様々な変更が可能であることは当業者に理解されよう。
【0065】
【発明の効果】
本発明により、文書検索システムのシステム管理者が、知識不足である場合や経験の浅い場合でも、装置の制限内のインデクス容量で、頻繁に検索される検索パターンの検索時間がより短くなるインデクス作成ルールを設定することが出来る。
【図面の簡単な説明】
【図1】本発明のインデクス作成ルール設定システムの構成例を示す図である。
【図2】本発明のインデクス作成ルール設定システムの処理の概要を示す図である。
【図3】本発明のインデクス作成ルール設定システムの処理の概要を示す図である。
【図4】表示装置に表示された登録データ取得画面の例を示す図である。
【図5】統計情報の例を示す図である。
【図6】質問回答パターンの例を示す図である。
【図7】表示装置に表示された回答請求画面の例を示す図である。
【図8】インデクス作成ルールパターンの例を示す図である。
【図9】表示装置に表示された推定結果画面の例を示す図である。
【図10】検索内容種別の例を示す図である。
【図11】本発明のインデクス作成ルール設定装置の構成例を示す図である。
【符号の説明】
101…表示装置、102…入力装置、103…中央演算処理装置、104…磁気ディスク装置、105…主記憶装置、106…バス、111…登録する質問回答パターン、112…インデクス作成ルールパターン、113…検索内容種別、114…インデクス容量推定基準知識、115…検索速度推定基準知識、121…一時記憶、122…プログラム、123…システム制御プログラム、124…入出力制御プログラム、125…設定制御プログラム、126…登録データ取得プログラム、127…統計情報取得プログラム、128…質問処理プログラム、129…要望取得プログラム、130…ルール設定処理プログラム、131…容量推定処理プログラム、132…検索速度推定処理プログラム、133…要望対応処理プログラム

Claims (3)

  1. 文書検索システムで用いるインデクスを作成するためのユーザが入力した文字列の組み合わせパターンを規定するインデクス作成ルール設定方法であって、
    登録データ取得部が、ユーザからの入力に基づいて文書検索を行う文書検索システムに登録する予定の登録予定データを取得する登録データ取得ステップと、
    統計情報得部が、前記登録予定データを分析して統計情報を生成し取得する統計情報取得ステップと、
    質問処理部が、前記統計情報に基づいて取得した質問文章と回答パターンと影響と分析項目条件とを含む質問回答パターンを表示装置に表示し、該質問文章に対してユーザが選択した前記回答パターンとしての回答と前記影響に基づいてユーザが入力すると予想される検索予定データ内容と環境の制約条件とを取得する質問処理ステップと、
    ルール設定処理部が、前記質問回答パターンと前記回答と前記検索予定データ内容と前記環境の制約条件と前記統計情報に基づいてインデクス作成ルールの優先順位を設定し、該優先順位に基づいて前記インデクス作成ルールを選定する設定処理ステップと、
    容量推定処理部が、前記選定されたインデクス作成ルールに基づいて前記インデクスの容量を推定するインデクス容量推定ステップと、
    検索速度推定処理部が、前記選定されたインデクス作成ルールに基づいて前記インデクスを用いた場合の検索速度を推定する検索速度推定ステップと、
    要望取得部が、前記推定インデクス容量及び前記推定検索速度を表示装置に表示する推定結果表示ステップと、
    を有することを特徴とするインデクス作成ルール設定方法。
  2. 請求項1に記載のインデクス作成ルール設定方法において、さらに、
    前記要望取得部が、前記表示装置に表示された前記推定インデクス容量及び前記推定検索速度に対するユーザの要望を取得する要望取得ステップと、
    要望対応処理部が、前記要望に基づいて対応処理を行う要望対応処理ステップと、
    を有し、
    該要望対応処理ステップは、
    前記要望が前記推定インデクス容量及び前記推定検索速度に対する変更の要望である場合には、前記選定されたインデクス作成ルールに含まれないルールの中で最もルール設定優先順が高いインデクス作成ルールを加えるか、または前記選定されたインデクス作成ルールの中で最もルール設定優先順が低いインデクス作成ルールを除外することにより、前記選定したインデクス作成ルールを変更する処理を行い、
    前記要望取得部がユーザから前記推定インデクス容量及び前記推定検索速度に対して満足する旨の意思を取得した場合には、前記選定されたインデクス作成ルールを最終インデクス作成ルールとする処理を行うことを特徴とするインデクス作成ルール設定方法。
  3. 請求項1に記載のインデクス作成ルール設定方法において、さらに、
    前記要望取得部が、前記表示装置に表示された前記推定インデクス容量及び前記推定検索速度に対するユーザの要望を取得する要望取得ステップと、
    要望対応処理部が、前記要望に基づいて対応処理を行う要望対応処理ステップと、
    を有し、
    該要望対応処理ステップは、
    前記要望が検索パターンごとの予想検索速度の変更の要望である場合には、該変更の要望に対応する前記インデクス作成ルールの優先順を高くするか又は低くすることにより、前記インデクス作成ルールの優先順位を変更する処理を行うことを特徴とするインデクス作成ルール設定方法。
JP2003175268A 2003-06-19 2003-06-19 インデクス作成ルール設定方法 Expired - Fee Related JP4266722B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003175268A JP4266722B2 (ja) 2003-06-19 2003-06-19 インデクス作成ルール設定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003175268A JP4266722B2 (ja) 2003-06-19 2003-06-19 インデクス作成ルール設定方法

Publications (3)

Publication Number Publication Date
JP2005011108A JP2005011108A (ja) 2005-01-13
JP2005011108A5 JP2005011108A5 (ja) 2005-10-27
JP4266722B2 true JP4266722B2 (ja) 2009-05-20

Family

ID=34098519

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003175268A Expired - Fee Related JP4266722B2 (ja) 2003-06-19 2003-06-19 インデクス作成ルール設定方法

Country Status (1)

Country Link
JP (1) JP4266722B2 (ja)

Also Published As

Publication number Publication date
JP2005011108A (ja) 2005-01-13

Similar Documents

Publication Publication Date Title
US20030212960A1 (en) Computer-implemented system and method for report generation
KR20060050866A (ko) 검색 엔진에 의해 반환된 페이지들의 등급화를 제어하는시스템 및 방법
CN101136027B (zh) 用于数据库索引、搜索和数据检索的系统和方法
US20090113283A1 (en) Method for capturing design-time and run-time formulas associated with a cell
JP2006172446A (ja) 複合データアクセス
ZA200503578B (en) Adaptively interfacing with a data repository
JP2008257444A (ja) 類似ファイル管理装置、その方法及びそのプログラム
US20020095621A1 (en) Method and system for modifying search criteria based on previous search date
JP4160548B2 (ja) 文書要約作成システム、方法、及びプログラム
JPH0528190A (ja) 情報検索用端末装置
Klahold et al. Computer aided writing
JP3356519B2 (ja) 文書情報検索装置
US8170992B2 (en) Method and system for batch processing form data
WO2014054308A1 (ja) 情報処理装置及びプログラム
US6721732B2 (en) Method and system for pre-filling search criteria into a form
JP3767763B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
US20020078023A1 (en) Method and system for combining user-supplied sort information with secondary sort information
JP4266722B2 (ja) インデクス作成ルール設定方法
JP4788708B2 (ja) 情報検索装置、情報検索方法、及び情報検索プログラム
JP4000332B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002207768A (ja) 情報処理システム及びその方法、並びにコンピュータ上で動作する情報処理プログラムを記録した記録媒体
US20020078021A1 (en) Method and system for organizing information into visually distinct groups based on user input
JP2000200279A (ja) 情報検索装置
JPH1021220A (ja) 文書編集装置及び文書管理方法
JP3498635B2 (ja) 情報検索方法及びその装置並びにコンピュータ可読記録媒体

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050713

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050713

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080708

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080908

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081104

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090127

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090217

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120227

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120227

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130227

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130227

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140227

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees