JP2006350770A - 情報検索装置及び情報検索方法 - Google Patents
情報検索装置及び情報検索方法 Download PDFInfo
- Publication number
- JP2006350770A JP2006350770A JP2005177379A JP2005177379A JP2006350770A JP 2006350770 A JP2006350770 A JP 2006350770A JP 2005177379 A JP2005177379 A JP 2005177379A JP 2005177379 A JP2005177379 A JP 2005177379A JP 2006350770 A JP2006350770 A JP 2006350770A
- Authority
- JP
- Japan
- Prior art keywords
- search
- actual data
- index
- data
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】 情報検索装置が受け付けた検索条件から、実データの検索に要する時間を推定し、推定した結果に基づいて、処理方法を判定し、判定結果に基づいて、処理方法を自動で切り分けて実データの検索を行うシステムを提供することを目的とする。
【解決手段】 検索条件を受け付ける検索条件入力部と、検索条件を満たすインデックスを、記憶部を参照して検索するインデックス検索部と、検索したインデックスから、検索対象の実データを検索する検索処理方法を、記憶部の実データ検索時間推定用テーブルを参照して判定する検索処理方法判定部と、判定した検索処理方法を用いて、実データの検索を、記憶部を参照して行う実データ検索部と、検索した実データを、検索結果として出力する結果出力部とを有する構成とした。
【選択図】 図1
【解決手段】 検索条件を受け付ける検索条件入力部と、検索条件を満たすインデックスを、記憶部を参照して検索するインデックス検索部と、検索したインデックスから、検索対象の実データを検索する検索処理方法を、記憶部の実データ検索時間推定用テーブルを参照して判定する検索処理方法判定部と、判定した検索処理方法を用いて、実データの検索を、記憶部を参照して行う実データ検索部と、検索した実データを、検索結果として出力する結果出力部とを有する構成とした。
【選択図】 図1
Description
本発明は、インデックスを用いて情報検索を行う情報検索装置及び情報検索方法に関する。
情報技術の発展とともに、データ管理システムに対する顧客の要望も高度化し、また、データ管理システムにおいて管理するデータ容量も大容量化してきている。例えば、製造業では、製造した製品の企画から製造、販売、保守までの製品ライフサイクル全体の情報を製造番号レベルで全て管理するといったことや、その他の業種においても情報の一元管理などの実施により、TB(テラバイト)単位のデータ量を管理し、情報検索をする必要に迫られている。このような、大容量データを扱うシステムにおいては、検索する条件により、データの検索に要する時間が大幅に変動してしまうという問題がある。
従来では、この問題を解消するため、リアルタイム処理によってデータを検索する場合、機能制限を実施することで検索に要する時間が短時間で収まるようにしていた。例えば、管理データは大容量だが、1つの検索機能で検索するデータ範囲を限定することによって、機能ごとの検索対象データを少なくする手法が用いられていた。また、例えば、ユーザが指定する検索条件を厳しくすることによって、確実に検索範囲を絞り込む手法が用いられていた。さらに、レスポンスタイムにリアルタイム検索ほどの厳格さを必要としないバッチ処理によってデータを検索する手法も用いられていた。
また、他の手法として、バッチ処理とリアルタイム処理とが共存する環境において、バッチ処理中にリアルタイム処理を受け付け、バッチ処理とリアルタイム処理とが、ともにデータベースの更新を可能とする手法が用いられていた(例えば、特許文献1参照)。
さらに、他の手法として、WWW(World Wide Web)上の検索エンジンを選択するためのインデックスを予め作成しておき、検索キーワードの分野とインデックスとの一致度に基づいて検索エンジンを選択することが可能な検索エンジンの選択手法が用いられていた(例えば、特許文献2参照)。
特開2004−171339号公報(段落0010〜0028、図2)
特開2001−188802号公報(段落0017〜0042、図2)
しかしながら、前記従来の技術におけるリアルタイム処理は、検索するデータ範囲を限定するとしても限界があった。また、検索条件の内容によって検索範囲を絞り込む作業は、ユーザにとって手間が掛かるなど、負担が大きかった。さらに、バッチ処理は、定型的な処理向きであること、欲しい情報を即座に得られないことなど、データ管理システムに適用するには柔軟性に欠けるといった問題がある。
また、特許文献1で開示されている手法によれば、バッチ処理の実行中にリアルタイム処理を優先的に割り込ませ、リアルタイム処理にバッチ処理で実行する処理を含めて実行することが可能である。しかし、検索要求を分析し、分析した結果に応じて、検索要求に対する処理をバッチ処理で行うのか、あるいはリアルタイム処理で行うのかを切り分けることは出来ないという問題がある。
また、特許文献2で開示されている手法によれば、予め作成されたインデックスを用いて、検索キーワードの分野にマッチした検索エンジンを選択することは可能であるが、そのインデックスを用いて検索対象のデータ量を推定することは出来ないという問題がある。
本発明は、以上のような問題点に鑑みてなされたものであり、インデックスを用いて、検索対象となる実データの検索に要する時間を推定することを目的とする。また、推定した時間から、検索処理方法を判定することを目的とする。さらに、判定結果に基づいて、処理方法を自動で切り分けて実データの検索を行うことを目的とする。
本発明は、前記目的を達成するために創案されたものであり、本発明の情報検索装置は、記憶部と処理部とを備え、前記記憶部が、検索対象となる実データと、前記実データを管理するためのインデックスと、前記インデックスで管理された前記実データを検索するために要する時間を算出するための実データ検索時間推定用テーブルとを格納し、前記処理部は、検索条件を受け付ける検索条件入力部と、前記検索条件入力部が受け付けた前記検索条件を満たす前記インデックスを、前記記憶部を参照して検索するインデックス検索部と、前記インデックス検索部が検索した前記インデックスから、検索対象の前記実データを検索する検索処理方法を、前記記憶部の前記実データ検索時間推定用テーブルを参照して判定する検索処理方法判定部と、前記検索処理方法判定部が判定した前記検索処理方法を用いて、前記実データの検索を、前記記憶部を参照して行う実データ検索部と、前記実データ検索部が検索した前記実データを、検索結果として出力する結果出力部とを有する構成とした。
かかる構成によれば、情報検索装置は、インデックスのレコード数がその下に紐付く実データ数と一致することにより、インデックス上の検索のみで実データ検索に必要なデータ量の推定が可能となる。また、検索処理方法を決定する為に実データ量の推定結果から推定検索時間を算出することが可能となる。
本発明によれば、インデックスを用いて、検索対象となる実データの検索に要する時間を推定することが可能である。また、推定した時間から、検索処理方法を判定することが可能である。さらに、判定結果に基づいて、処理方法を自動で切り分けて実データの検索を行うことが可能である。
次に、本発明を実施するための最良の形態について図面を参照して説明する。なお、本実施形態においては、製造業で製造される製品の実績に関するデータ(以下、製造実績データともいう)を、その製品の製造番号単位で検索する場合について説明する。
まず、図1を参照して、本発明の実施形態に係る情報検索装置の構成について説明する。
図1に示すように、情報検索装置10は、データ処理装置11と、データ記憶装置12と、データ検索装置13とを備える。以下、各装置の機能について説明する。
データ処理装置11は、不図示の製造実績収集システム(コンピュータシステム)等から製造実績データを受け取り、検索用のデータとしてインデックスを生成すると共に、データの蓄積処理を行う。データ処理装置11は、データ入力部111と、インデックス生成部112とを含んで構成される。
データ入力部111は、検索対象となる製造実績データの入力を受け付け、データのフォーマットチェック等を実施し、インデックス生成部112に出力する。
インデックス生成部112は、データ入力部111から入力されたデータを解析し、検索用にインデックスを生成すると共に製造実績データの格納処理を行う。インデックス生成部112において生成されたインデックスは、後記するインデックスデータ記憶部121に格納される。また、製造実績データは、蓄積用に加工され、後記する実データ記憶部122に格納される。
データ記憶装置12は、データを格納するものである。データ記憶装置12は、インデックスデータ記憶部121と、実データ記憶部122とを含んで構成される。
インデックスデータ記憶部121は、インデックス生成部112において生成されたインデックスを格納する。
実データ記憶部122は、インデックス生成部112において加工された製造実績データを格納する。
データ検索装置13は、ユーザ用端末(不図示)からの検索リクエストを受け付け、データ記憶装置12に蓄積されている製造実績データを検索し、その検索結果をユーザ用端末へ返すものである。ユーザ用端末は、例えば、情報検索装置10と接続されたコンピュータである。データ検索装置13は、検索条件入力部131と、インデックス検索部132と、検索処理方法判定部133と、バッチジョブ投入部134と、実データ検索部135と、結果出力部136とを含んで構成される。
検索条件入力部131は、ユーザ用端末から入力された検索条件を受け付けるものである。受け付けた検索条件は、インデックス検索部132に出力される。
インデックス検索部132は、検索条件入力部131から受け取った検索条件に基づいて、インデックスの検索を行う。インデックス検索部132は、検索条件入力部131から入力された検索条件を解析し、インデックスデータ記憶部121に格納されているインデックスを検索して得られた結果を検索処理方法判定部133に出力する。また、インデックス検索部132は、検索条件入力部131から受け取った検索条件を検索処理方法判定部133に出力する。
検索処理方法判定部133は、インデックス検索部132から受け取ったインデックスの検索結果に基づいて、検索処理方法の判定を行う。検索処理方法判定部133は、インデックス検索部132において行った検索処理の結果を受け、実データ部の検索処理に必要となるデータファイル数から予測検索処理時間を算出し、算出値と基準値とを比較して検索処理方法の判定を行う。検索処理方法がリアルタイム処理であると判定された場合は、インデックス検索部132から受け取った検索条件及びインデックスの検索結果を実データ検索部135に出力する。また、検索処理方法がバッチ処理であると判定された場合は、インデックス検索部132から受け取った検索条件及びインデックスの検索結果をバッチジョブ投入部134に出力する。
バッチジョブ投入部134は、検索処理方法判定部133から呼び出されると、実データ検索処理をバッチジョブとして投入する。バッチジョブ投入部134は、検索処理方法判定部133から検索条件及びインデックスの検索結果の入力を受けると、実データ検索処理をバッチジョブとして投入する。また、検索条件及びインデックスの結果を実データ検索部135に出力する。
実データ検索部135は、検索処理方法判定部133又はバッチジョブ投入部134から受け取ったインデックスの検索結果に基づいて、必要な実データを実データ記憶部122から取得する。また、実データ記憶部122から取得した実データを、検索処理方法判定部133又はバッチジョブ投入部134から受け取った検索条件に基づいてさらに検索し、検索結果を結果出力部136に出力する。
結果出力部136は、実データ検索部135から受け取った検索結果を、検索処理結果として出力するためのものである。検索処理結果の出力先は、例えば、情報検索装置10に検索の要求元のユーザ用端末である。
次に、図2を参照して、情報検索装置10で管理するインデックスと実データとの関係について説明する。
本発明では、インデックス部分と実データ部分の検索処理を切り分ける必要がある為、図2に示すように、インデックスを階層状に構成して、これらのインデックスに実データを関連付ける方法を採用する。
データ種別インデックス201は、実データのデータ種別を示す最上層のインデックスであり、その種別毎にインデックスのアドレスを用いて構成される。ここでの、アドレスとは、データの所在を特定することが可能なデータのことである。例えば、データの存在する絶対パスなどがこれに用いられる。
製品情報インデックス202は、データ種別インデックス201の下位に位置付けられるインデックスであり、実データのアドレスによって構成される。図2では、データ種別インデックス201の下位に位置付けられたインデックスの例として、製品情報インデックス202の他に、製造番号情報インデックス203と、出荷情報インデックス204とが挙げられている。これらのインデックスは、インデックス生成部112(図1参照)によって製造実績データの中から抽出されるものである。
製品情報1(205)や製品情報2(206)は、製品情報インデックス202の管理下の実データである。また、製造番号情報1(207)や、製造番号情報2(208)は、製造番号情報インデックス203の管理下の実データである。
図2で示すように、製造実績データである製品情報1(205)等の大容量データを管理する場合は、同一種別のデータであっても検索効率の低下を回避する為、複数のデータ種別に分割して管理する構成とするのが好ましい。本実施形態では、複数の種類に分類される実データを階層別のインデックスを用いて管理することで、実データの分割管理を実現している。例えば、製品情報1(205)及び製品情報2(206)のアドレスを製品情報インデックス202を用いて管理することで、それら製品情報の検索を1つのインデックスを参照して行うことが可能である。
次に、図3を参照して、図2に示したデータ種別インデックス201のデータの構成例について説明する。
図3に示す例では、データ種別インデックス201は、大分類301と、小分類302と、アドレス303とから構成されている。
大分類301は、製品情報等のデータの検索時に使用する検索用と、検索結果の出力時に使用する結果出力用とに分類されている。検索対象として使用される項目は、大分類301の検索用データとして管理しておき、検索実行時は、この大分類301の検索用データの中のデータ種別から、必要なインデックスを特定可能にしている。
小分類302は、検索対象のデータ種別名を管理している。例えば、製造番号情報などがある。
アドレス303は、小分類302で指定されたデータ種別に対応するインデックスの所在を示すアドレスを示し、データ種別に応じたインデックスの所在の特定を可能としている。これにより、検索時及び結果出力時に必要なデータ種別に応じたインデックスを即座に特定し、そのインデックスで指定されたアドレスに存在する実データ(製品情報等)のファイルを読み込むことで検索処理を実現している。
次に、図4を参照(適宜図2参照)して、製品情報インデックス202のデータの構成例について説明する。
例えば、図2に示した製品情報インデックス202は、図3に示したデータ種別インデックス201において、「IR−1」のアドレスに管理されている。
図4に示すように、製品情報インデックス202は、プライマリキー401、ファイル名402及びアドレス403の3つのカラムを保持する。プライマリキー401で各製品情報の先頭プライマリキーを管理し、ファイル名402でその各製品情報のファイル名を管理し、アドレス403で各製品情報のアドレスを管理している。
製品情報インデックス202では、ファイル名402が製品情報1の先頭レコードのプライマリキー401をAA0001として管理している。また、ファイル名402が製品情報2の先頭レコードのプライマリキー401を、BB0001として管理している。そして、AA0001のプライマリキー401と、製品情報1のファイル名402に対応するアドレス403をDA−1で管理している。また、BB0001のプライマリキー401と、製品情報2のファイル名402に対応するアドレス403をDA−2で管理している。製品情報1及び製品情報2のデータ構造例については、後記する。
例えば、図2に示した製品情報インデックス202が、2件のレコードを保持している場合、製品情報インデックス202の管理下の実データのファイル数も2件となっている。このように、製品情報インデックス202のレコード数は、その管理下にある実データのファイル数と同一になるのが好ましい。このような構造であれば、インデックスの検索をすることによって、実データの検索に必要なデータ量を特定することが可能であり、実データの予測検索処理時間を算出することが可能である。
次に、図5を参照(適宜図2参照)して、製造番号情報インデックス203のデータの構成例について説明する。
図5に示すように、製造番号情報インデックス203は、図3に示したデータ種別インデックス201において、「IS−1」のアドレスに管理されている。
製造番号情報インデックス203では、ファイル名502が製造番号情報1の先頭レコードのプライマリキー501をPC20050301として管理している。また、ファイル名502が製造番号情報2の先頭レコードのプライマリキー501を、PC20050310として管理している。そして、PC20050301のプライマリキー501と、製造番号情報1のファイル名502に対応するアドレス503をSS−1で管理している。また、PC20050310のプライマリキー501と、製造番号情報2のファイル名502に対応するアドレス503をSS−2で管理している。製造番号情報1及び製造番号情報2のデータ構造例については、後記する。
例えば、製造番号情報インデックス203は、2件のレコードを保持している場合、製造番号情報インデックス203の管理下の実データのファイル数も2件となっている。このように、製造番号情報インデックス203のレコード数は、その管理下にある実データのファイル数と同一になるのが好ましい。好ましい理由については、製品情報インデックス202の場合と同様であるため、説明を省略する。
製造番号情報インデックス203におけるデータの管理方法は、製品情報インデックス202におけるデータの管理方法と同様であるため、説明を省略する。
次に、図6を参照(適宜図2参照)して、出荷情報インデックス204のデータの構成例について説明する。
図6に示すように、出荷情報インデックス204は、図3に示したデータ種別インデックス201において、「IR−2」のアドレスに管理されている。
出荷情報インデックス204では、ファイル名602が出荷情報1の先頭レコードのプライマリキー601をAA0001として管理している。また、出荷情報2の先頭レコードのプライマリキー601を、SS0001として管理している。出荷情報インデックス204は、プライマリキー601のAA0001に対応するファイルのファイル名602を出荷情報1として、ファイルのアドレス603をDS−1として管理している。また、プライマリキー601のAA0001に対応するファイルのファイル名602を出荷情報2として、ファイルのアドレス603をDS−2として管理している。出荷情報1及び出荷情報2のデータ構造例については、後記する。
例えば、出荷情報インデックス204は、2件のレコードを保持している場合、出荷情報インデックス204の管理下の実データのファイル数も2件となっている。このように、出荷情報インデックス204のレコード数は、その管理下nある実データのファイル数と同一になるのが好ましい。好ましい理由については、製品情報インデックス202の場合と同様であるため、説明を省略する。
図7を参照(適宜図2参照)して、製品情報1(205)のデータの構成例について説明する。
図7に示すように、製品情報1(205)は、図4に示した製品情報インデックス202において、「DA−1」のアドレスに管理されている。
製品情報1(205)は、製品情報インデックス202に管理される実データである。図7に示すように、同一種別のデータであっても規定のレコード数で分割してデータ管理を実施するのが好ましい。そのような構成にすることで、大容量データに対しても検索性能の劣化を回避することが可能となる。
図8を参照(適宜図2参照)して、製品情報2(206)のデータの構成例について説明する。図8は、本発明の実施形態に係る製品情報2のデータ構成図である。
製品情報2(206)の所在は、図4に示した製品情報インデックス202において、アドレス403のDA−2として、管理されているものである。
製品情報2(206)は、製品情報インデックス202に管理される実データである。図8に示すように、同一種別のデータであっても規定のレコード数で分割してデータ管理を実施するのが好ましい。理由は製品情報1(205)の場合と同様である。
図9を参照(適宜図2参照)して、製造番号情報1(207)のデータの構成例について説明する。図9は、本発明の実施形態に係る製造番号情報1のデータ構成図である。
製造番号情報1(207)の所在は、図5に示した製造番号情報インデックス203において、アドレス503のSS−1として、管理されているものである。
製造番号情報1(207)は、製造番号情報インデックス203に管理される実データである。図9に示すように、同一種別のデータであっても規定のレコード数で分割してデータ管理を実施するのが好ましい。理由は製品情報1(205)の場合と同様である。
図10を参照(適宜図2参照)して、製造番号情報2(208)のデータの構成例について説明する。図10は、本発明の実施形態に係る製造番号情報2のデータ構成図である。
製造番号情報2(208)の所在は、図5に示した製造番号情報インデックス203において、アドレス503のSS−2として、管理されているものである。
製造番号情報2(208)は、製造番号情報インデックス203に管理される実データである。図10に示すように、同一種別のデータであっても規定のレコード数で分割してデータ管理を実施するのが好ましい。理由は製品情報1(205)の場合と同様である。
次に、図11を参照(適宜図2参照)して、検索処理方法判定部133(図1参照)において予測検索処理時間を算出する際に使用するデータの構成例について説明する。すなわち、実データ検索時間推定用テーブルのデータ構成図について説明する。
図11に示すように、実データ検索時間推定用テーブル1100には、大分類:「検索用」の1データあたりの平均検索処理時間は5秒、大分類:「結果出力用」の1データあたりの平均検索処理時間は10秒、また、検索方法切り分け基準値は20秒と設定されている。これらの平均検索処理時間は、あらかじめ実測により登録しておくことが可能である。これらの前提条件と、前記したインデックス検索部132の結果とを用いて、実データの予測検索処理時間を算出することが可能である。
図12を参照(適宜図1参照)して、データ検索装置13での検索処理の一例について説明する。
まず、ユーザ用端末から要求された検索条件が入力される(S101)。具体的には、検索条件入力部131は、その検索条件を受け付ける。ここでは、例えば、製造番号『PC20050301』と製造番号『PC20050305』とが検索条件として入力されたものとする。
続いて、入力された検索条件の検索条件項目のインデックスアドレスを、データ種別インデックスから取得する(S102)。具体的には、インデックス検索部132は、入力された検索条件に基づいて、どの検索条件項目が入力されたかを解析し、解析された検索条件項目のインデックスアドレスをデータ種別インデックス201(図3参照)から取得する。ここでは、検索条件に製造番号のみが含まれているので、検索条件項目は製造番号となり、データ種別インデックス201の大分類301(図3参照)に含まれる「検索用」の「製造番号情報」を検索し、そのアドレス「IS-1」を取得する。
次に、取得したアドレスに合致するインデックスを検索し、入力された検索条件に合致する実データのデータ数を特定する(S103)。具体的には、データ数とはデータを管理する為のまとまりの数であり、本実施形態では、ファイル数を主に用いるものとする。検索処理方法判定部133は、インデックス検索部132によって取得されたインデックスアドレスのインデックスを参照し、入力された検索条件に合致する実データのファイル数を特定する。ここでは、取得したインデックスアドレス「IS-1」でアドレスが指定される製造番号情報インデックス203を参照して、製造番号『PC20050301』又は製造番号『PC20050305』に合致する実データのファイル数を特定する。各インデックスでは、各実データの先頭レコードを管理している為、範囲検索となる。
図5のデータ例で具体的に説明する。プライマリキーがPC20050301〜PC20050309の場合、プライマリキーで指定される実データは製造番号情報1に登録されており、PC20050310以降のプライマリキーで指定された実データは全て製造番号情報2に登録されているということが分かる。つまり、検索条件で入力された『PC20050301』と『PC20050305』とは、いずれも製造番号情報1に登録されていることが分かり、検索用データの必要データ数は1であると特定することが可能である。次に、結果出力時に必要なデータを考えると、結果として何件ヒットするかは、実データ検索を実施してからでないと分からないが、検索用データの必要ファイル数と同数の結果出力用ファイルが必要と考えれば良い。従って、ここでは、実データの検索に必要なデータ数は、検索用が1つ、結果出力用が1つということが分かる。なお、本実施形態では、検索用データ数を(a)、結果出力用データ数を(b)で表す。
図12に戻って、次に、検索処理方法判定部133は、実データ検索時間推定処理を行う(S104)。実データ検索時間推定処理についての詳細な説明は、後記する。ここでは、実データの予測検索処理時間は、1(検索用ファイル数)×5(秒)+1(結果出力用ファイル数)×10(秒)=15秒と算出することが可能である。また、実データ検索時間推定用テーブルから検索方法切り分け基準値を読み込むことが可能である。なお、算出された推定実データ検索時間を(e)、読み込まれた検索方法切り分け基準値を(f)で表す。
検索処理方法判定部133は、実データの予測検索処理時間と切り分け時間との大小関係の比較を行う(S105)。
実データの予測検索処理時間より切り分け時間のほうが大きい場合(S105でYesの場合)、バッチ処理で検索処理を実行すると決定し、バッチジョブを投入する(S106)。その後、S107に進む。その他の場合(S105でNoの場合)、検索処理方法判定部133は、リアルタイム処理で検索処理を実行すると決定し、S107に進む。ここでは、実データ検索時間推定用テーブル1100に登録されている検索方法切り分け基準値は20秒である為、図11に示す例では、リアルタイム処理で検索処理を実行すると決定することが可能である。
実データの予測検索処理時間より切り分け時間のほうが大きい場合(S105でYesの場合)、バッチ処理で検索処理を実行すると決定し、バッチジョブを投入する(S106)。その後、S107に進む。その他の場合(S105でNoの場合)、検索処理方法判定部133は、リアルタイム処理で検索処理を実行すると決定し、S107に進む。ここでは、実データ検索時間推定用テーブル1100に登録されている検索方法切り分け基準値は20秒である為、図11に示す例では、リアルタイム処理で検索処理を実行すると決定することが可能である。
S107に進んだ場合、特定された実データアドレスの情報を検索条件で検索する(S107)。具体的には、実データ検索部135は、インデックスで特定された実データのアドレスを参照して、検索用データを入力された検索条件で検索し、結果出力用データとJOINすることで、検索結果を得ることが可能である。ここでは、図7に示した製品情報1(205)がそのまま検索結果となる。また、例えば、検索結果として出荷情報を付加して出力する場合は、製品情報1(205)と同様の方法で、図6の出荷情報インデックス(204)を用いることにより、下位の出荷情報を特定し、出荷情報を付加して検索結果を得ることが可能となる。
続いて、検索結果を出力する(S108)。具体的には、結果出力部136は、実データ検索部135によって得られた検索結果を、ユーザ用端末に出力する。ここでは、図7に示した製品情報1(205)の内容がそのまま検索結果として出力される。
次に、図13を参照(適宜図1参照)して、S104の実データ検索時間推定処理(図12参照)について説明する。図13は、本発明の実施形態に係る実データ検索時間推定処理を表すフローチャートである。
まず、実データ検索に必要なデータ数を特定する(S201)。具体的には、検索処理方法判定部133は、S103(図12参照)で特定された実データのデータ数を実データの検索に必要なデータ数として用いるようにしてもよい。ここでは、前記した通り、検索条件で入力された『PC20050301』と『PC20050305』とが、いずれも製造番号情報1に登録されていることが分かり、検索用データの必要データ数は1であると特定することが可能である。
続いて、検索処理方法判定部133は、実データ検索時間推定用テーブル1100(図11参照)から前提条件を読み込む(S202)。前提条件は、検索用の1ファイルあたりの平均時間と、結果出力用の1ファイルあたりの平均時間と、検索方法切り分け基準値とを含むものである。図11に示す例では、検索用の1データあたりの検索時間が5秒、結果出力用の1データあたりの検索時間が10秒、検索方法切り分け基準値が20秒となっており、それらの値を読み込む。
そして、推定実データ検索時間を算出する(S203)。ここでは、検索処理方法判定部133は、S201で特定した検索用データ数を(a)、S201で特定した結果出力用データ数を(b)、S202で読み込んだ1データあたりの検索時間(検索用)を(c)、S202で読み込んだ1データあたりの検索時間(結果出力用)を(d)で表すと、推定実データ検索時間は(a)*(c)+(b)*(d)=1*5+1*10=15と算出される。算出された推定実データ検索時間を(e)で表す。算出された推定実データ検索時間と、読み込まれた検索方法切り分け基準値とは、S105の判定処理で用いられる。
このように、本実施形態では、インデックスを2層、実データを1層という階層に分けることとしたが、インデックス部分と実データ部分とが分離されている構成であれば、階層がいくつであっても良い。インデックス部分と実データ部分とが分離されていれば、入力された検索条件を用いて、まずインデックスを検索し、実データの検索に要する時間を推定し、その推定結果によって、実データの検索方法を決定し、その方法を用いて実データを検索することが可能である。
また、本実施形態では、入力された検索条件を解析することによって、検索方法をリアルタイム処理にするか、バッチ処理にするかを判定し、判定された検索方法を用いて、自動で検索を実行することとしたが、検索方法の判定結果をユーザに知らせて、その検索方法で検索してもよいかどうかをユーザに確認させる構成としてもよい。その場合、例えば、本実施形態における結果出力部が、検索方法の判定結果を出力する機能を有する構成とすればよい。また、実データの検索時間を推定し、その推定時間をユーザに知らせて、検索方法を選択させる構成としてもよい。その場合、例えば、本実施形態における検索処理方法判定部に代えて、実データ検索時間推定部を設け、本実施形態における結果出力部が推定結果を出力する機能を有する構成とすればよい。実データ検索時間推定部は、インデックス検索部が検索したインデックスから、検索対象の実データを検索するために要する推定実データ検索時間を、記憶部の実データ検索時間推定用テーブルを参照して算出する。
また、本実施形態では、実データの検索時間は、ファイルの種類によらず、一定であるとしてテーブルに登録する構成としたが、実データの検索時間をファイルの種類毎に変えてテーブルに登録する構成としてもよい。これによってファイルのデータ量を一定にする必要性をなくすことが可能である。テーブルに登録してある検索方法切り分け基準値は、ユーザが指定できる構成としてもよい。
また、本実施形態では、製造実績データなどのデータを入力し、インデックスを生成するデータ処理装置を、情報検索装置に含める構成としたが、情報検索装置に含めない構成としてもよい。その場合、例えば、データ処理装置において作成されたインデックスは、情報検索装置のディスクドライブなどの入力手段から読み込まれ、インデックスデータ記憶部に格納される構成などが考えられる。
本発明は、同一機能を発揮するが、入力条件により検索処理時間が大幅に異なる機能を有するシステムに対して、特に有効である。また、データ検索システムとしてのユーザビリティを向上させることが可能である。つまり、検索処理方法としてはリアルタイム処理、バッチ処理ともに一長一短がある為、両方の検索方法を自動で切り分けることで、双方の利点を併せ持つデータ検索の方法を提供することが可能である。
例えば、製造実績データの情報検索時に、ある特定の製造番号の製品情報を検索する場合は、情報を一意に特定できる為、大量のデータを管理している場合でも検索処理時間は短時間である。このように、特定の情報を検索する場合はユーザとしても直ちに情報を取得したい為、リアルタイム処理で検索を実施するのが好ましい。
また、例えば、過去10年間の製造実績データから同一型名の製品情報を検索する場合は、大量のデータの中から不特定量の情報を検索することになり、検索処理に時間を要する。さらに、製造番号の一部だけが分かっている状態で製品情報を検索するといった、あいまいな検索をする場合にも、検索処理に時間を要する。このような場合は、リアルタイム処理は、ユーザに多大な待ち時間を与えることになり、バッチ処理で検索を実施するのが好ましい。そうすれば、システム利用者はそのレスポンスを待ち続ける必要はなく、他の作業を実施し、検索処理が終わった時に結果を参照すれば良いといった利点を得ることが可能である。
本発明は、主に製造業向けの生産実績データの検索に適用するのが有効であるが、その他の分野に適用しても、同様の効果を得ることが可能である。
また、本発明によれば、データ検索システムの機能制限を緩和することが可能である。これにより、データ検索システムとしてユーザの多様な機能要求に対応することが可能となり、システム機能の充実やCS(Customer Satisfaction)を向上させることが可能となる。
尚、本発明は、検索処理性能を向上させるものでは無い為、実際の大量データ検索システムとしての適用時にはブレードのスタンバイCPUを活用するなどハードウェア面での処理性能向上を図ることにより、より有用性が増すものと考えられる。
10 情報検索装置
11 データ処理装置
12 データ記憶装置
13 データ検索装置
121 インデックスデータ記憶部
122 実データ記憶部
131 検索条件入力部
132 インデックス検索部
133 検索処理方法判定部
134 バッチジョブ投入部
135 実データ検索部
136 結果出力部
1100 実データ検索時間推定用テーブル
11 データ処理装置
12 データ記憶装置
13 データ検索装置
121 インデックスデータ記憶部
122 実データ記憶部
131 検索条件入力部
132 インデックス検索部
133 検索処理方法判定部
134 バッチジョブ投入部
135 実データ検索部
136 結果出力部
1100 実データ検索時間推定用テーブル
Claims (6)
- 記憶部と処理部とを備えた情報検索装置であって、
前記記憶部は、
検索対象となる実データと、
前記実データを管理するためのインデックスと、
前記インデックスで管理された前記実データを検索するために要する時間を算出するための実データ検索時間推定用テーブルと
を格納し、
前記処理部は、
検索条件を受け付ける検索条件入力部と、
前記検索条件入力部が受け付けた前記検索条件を満たす前記インデックスを、前記記憶部を参照して検索するインデックス検索部と、
前記インデックス検索部が検索した前記インデックスから、検索対象の前記実データを検索する検索処理方法を、前記記憶部の前記実データ検索時間推定用テーブルを参照して判定する検索処理方法判定部と、
前記検索処理方法判定部が判定した前記検索処理方法を、判定結果として出力する結果出力部と
を有することを特徴とする情報検索装置。 - 前記処理部は、
前記検索処理方法判定部が判定した前記検索処理方法を用いて、前記実データの検索を、前記記憶部を参照して行う実データ検索部をさらに有し、
前記結果出力部は、
前記実データ検索部が検索した前記実データを、検索結果として出力する
ことを特徴とする請求項1に記載の情報検索装置。 - 記憶部と処理部とを備えた情報検索装置であって、
前記記憶部は、
検索対象となる実データと、
前記実データを管理するためのインデックスと、
前記インデックスで管理された前記実データを検索するために要する時間を算出するための実データ検索時間推定用テーブルと
を格納し、
前記処理部は、
検索条件を受け付ける検索条件入力部と、
前記検索条件入力部が受け付けた前記検索条件を満たす前記インデックスを、前記記憶部を参照して検索するインデックス検索部と、
前記インデックス検索部が検索した前記インデックスから、検索対象の前記実データを検索するために要する推定実データ検索時間を、前記記憶部の前記実データ検索時間推定用テーブルを参照して算出する実データ検索時間推定部と、
前記実データ検索時間推定部が算出した前記推定実データ検索時間を、推定結果として出力する結果出力部と
を有することを特徴とする情報検索装置。 - 記憶部と処理部とを備えた情報検索装置を用いた情報検索方法であって、
前記記憶部は、
検索対象となる実データと、
前記実データを管理するためのインデックスと、
前記インデックスで管理された前記実データを検索するために要する時間を算出するための実データ検索時間推定用テーブルと
を格納し、
前記処理部は、
検索条件を受け付け、
受け付けた前記検索条件を満たす前記インデックスを、前記記憶部を参照して検索し、
検索した前記インデックスから、検索対象の前記実データを検索する検索処理方法を、前記記憶部の前記実データ検索時間推定用テーブルを参照して判定し、
判定した前記検索処理方法を、判定結果として出力する
ことを特徴とする情報検索方法。 - 前記処理部は、
判定した前記検索処理方法を用いて、前記実データの検索を、前記記憶部を参照して行い、
検索した前記実データを、検索結果として出力する
ことを特徴とする請求項4に記載の情報検索方法。 - 記憶部と処理部とを備えた情報検索装置を用いた情報検索方法であって、
前記記憶部は、
検索対象となる実データと、
前記実データを管理するためのインデックスと、
前記インデックスで管理された前記実データを検索するために要する時間を算出するための実データ検索時間推定用テーブルと
を格納し、
前記処理部は、
検索条件を受け付け、
受け付けた前記検索条件を満たす前記インデックスを、前記記憶部を参照して検索し、
検索した前記インデックスから、検索対象の前記実データを検索するために要する推定実データ検索時間を、前記記憶部の前記実データ検索時間推定用テーブルを参照して算出し、
算出した前記推定実データ検索時間を、推定結果として出力する
ことを特徴とする情報検索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005177379A JP2006350770A (ja) | 2005-06-17 | 2005-06-17 | 情報検索装置及び情報検索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005177379A JP2006350770A (ja) | 2005-06-17 | 2005-06-17 | 情報検索装置及び情報検索方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006350770A true JP2006350770A (ja) | 2006-12-28 |
Family
ID=37646530
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005177379A Pending JP2006350770A (ja) | 2005-06-17 | 2005-06-17 | 情報検索装置及び情報検索方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006350770A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011039815A1 (ja) * | 2009-09-30 | 2011-04-07 | ヒューレット-パッカード デベロップメント カンパニー エル.ピー. | イベント登録・通知における通知方法・装置 |
US10984005B2 (en) | 2016-10-05 | 2021-04-20 | Fujitsu Limited | Database search apparatus and method of searching databases |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11203288A (ja) * | 1998-01-09 | 1999-07-30 | Canon Inc | データベース参照装置 |
JP2004110216A (ja) * | 2002-09-17 | 2004-04-08 | Fuji Xerox Co Ltd | 検索装置および方法 |
JP2005115514A (ja) * | 2003-10-06 | 2005-04-28 | Ibm Japan Ltd | データベース検索システム及びその検索方法並びにプログラム |
-
2005
- 2005-06-17 JP JP2005177379A patent/JP2006350770A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11203288A (ja) * | 1998-01-09 | 1999-07-30 | Canon Inc | データベース参照装置 |
JP2004110216A (ja) * | 2002-09-17 | 2004-04-08 | Fuji Xerox Co Ltd | 検索装置および方法 |
JP2005115514A (ja) * | 2003-10-06 | 2005-04-28 | Ibm Japan Ltd | データベース検索システム及びその検索方法並びにプログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011039815A1 (ja) * | 2009-09-30 | 2011-04-07 | ヒューレット-パッカード デベロップメント カンパニー エル.ピー. | イベント登録・通知における通知方法・装置 |
US10984005B2 (en) | 2016-10-05 | 2021-04-20 | Fujitsu Limited | Database search apparatus and method of searching databases |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5492187B2 (ja) | 編集距離および文書情報を使用する検索結果順位付け | |
JP5494454B2 (ja) | 検索結果生成方法、検索結果生成プログラムおよび検索システム | |
CA2783446C (en) | Personalized tag ranking | |
TWI524193B (zh) | 用於搜尋結果之語義目錄的電腦可讀取媒體及電腦實現方法 | |
US8161036B2 (en) | Index optimization for ranking using a linear model | |
EP1643384B1 (en) | Query forced indexing | |
JP4930153B2 (ja) | 文書検索システム、文書番号部分列取得装置、および文書検索方法 | |
JP5633944B1 (ja) | 評価方法、評価装置、およびプログラム | |
US7698294B2 (en) | Content object indexing using domain knowledge | |
JP6299596B2 (ja) | クエリ類似度評価システム、評価方法、及びプログラム | |
JP2006127529A (ja) | 階層を考慮したウェブページのランク付け | |
JP2013510343A (ja) | 検索結果のランク付けのための静的な関連性の特性としてのドキュメント長 | |
JP2010536086A (ja) | ユーザ中心の情報探索方法およびシステム | |
JP2010097461A (ja) | 文書検索装置、文書検索方法および文書検索プログラム | |
JP2006350770A (ja) | 情報検索装置及び情報検索方法 | |
WO2012081165A1 (ja) | データベース管理装置及びデータベース管理方法 | |
JP5515117B2 (ja) | データ処理装置 | |
JP5585489B2 (ja) | 検索支援装置、プログラム及び方法 | |
JP5757187B2 (ja) | ファイル格納先候補決定装置、ファイル格納先候補の決定方法、ファイル格納先決定支援システム、並びにコンピュータ・プログラム | |
WO2004084095A1 (ja) | 情報検索システム | |
JP2005327225A (ja) | 文書管理システム、文書管理方式、文書管理プログラム及びプログラム記録媒体 | |
JP7363533B2 (ja) | 引継元特定方法、および引継元特定プログラム | |
Dharmarajan et al. | Web user navigation pattern behavior prediction using nearest neighbor interchange from weblog data | |
JP7338315B2 (ja) | 化学物質探索装置、化学物質探索方法、及び化学物質探索プログラム | |
WO2022091204A1 (ja) | データ分析処理装置、データ分析処理方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071029 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100518 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100706 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100803 |