JPH0296274A - 多重索引構造による情報検索装置 - Google Patents
多重索引構造による情報検索装置Info
- Publication number
- JPH0296274A JPH0296274A JP63248019A JP24801988A JPH0296274A JP H0296274 A JPH0296274 A JP H0296274A JP 63248019 A JP63248019 A JP 63248019A JP 24801988 A JP24801988 A JP 24801988A JP H0296274 A JPH0296274 A JP H0296274A
- Authority
- JP
- Japan
- Prior art keywords
- data
- file
- index file
- data type
- retrieving
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000284 extract Substances 0.000 abstract 1
- 238000004519 manufacturing process Methods 0.000 abstract 1
- 238000000034 method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は多重索引構造による情報検索装置に関する。
従来、情報検索装置の索引ファイルは単一レベルのファ
イルであり、構造上多重レベルとなっていてもそれは基
本ソフトウェアのファイルアクセスに関するものである
。すなわちデータの内容を利用した多重構造ではなく、
機能的には単一レベルとなっている。
イルであり、構造上多重レベルとなっていてもそれは基
本ソフトウェアのファイルアクセスに関するものである
。すなわちデータの内容を利用した多重構造ではなく、
機能的には単一レベルとなっている。
従来の情報検索装置では索引ファイルが単一レベルであ
り、利用者が指定した検索式に基づいて検索するとき、
その時点で接続されているデータベースの全体を対象と
して検索しなければならず、検索所要時間が大きくなり
実行時のメモリサイズも大きいという欠点がある。
り、利用者が指定した検索式に基づいて検索するとき、
その時点で接続されているデータベースの全体を対象と
して検索しなければならず、検索所要時間が大きくなり
実行時のメモリサイズも大きいという欠点がある。
さらに、単一レベルの索引ファイルでは登録データ量が
増大するにつれ、索引ファイの作成。
増大するにつれ、索引ファイの作成。
更新の時間が膨大になってしまうという欠点もある。
本発明の多重索引構造による情報検索装置は、登録すべ
きデータの内容を評価判断しデータ種別を判定する入力
装置と、データ種別毎の索引ファイルと前記索引ファイ
ルの上位に位置し各見出し語がどのデータ種別に関連し
ているかの情報を含む上位レベル索引ファイルとを有す
る記憶装置と、指定された検索式から検索対象とすべき
データ種別を求め前記データ種別に属する索引ファイル
および前記上位レベル索引ファイルを用いて対応するデ
ータを検索する検索装置とを有している。
きデータの内容を評価判断しデータ種別を判定する入力
装置と、データ種別毎の索引ファイルと前記索引ファイ
ルの上位に位置し各見出し語がどのデータ種別に関連し
ているかの情報を含む上位レベル索引ファイルとを有す
る記憶装置と、指定された検索式から検索対象とすべき
データ種別を求め前記データ種別に属する索引ファイル
および前記上位レベル索引ファイルを用いて対応するデ
ータを検索する検索装置とを有している。
次に、本発明について図面を参照して説明する。
第1図は本発明の一実施例を示す構成図である。同図に
おいて多重索引構造による情報検索装置は、登録すべき
データを入力しその内容によりデータ種別を判定する機
能を有する入力装置1と、データを検索に適した構成で
格納する記憶装置2と、利用者に指定された検索式によ
り記憶装置2内のデータを検索する検索装置3とで構成
される。さらに、記憶装置2は入力されたデータを格納
するデータファイル21と、データ種別毎の検索用索引
ファイル22と、その上位に位置し見出し語とデータ種
別とを関連づける上位レベル索引ファイル23とで構成
される。
おいて多重索引構造による情報検索装置は、登録すべき
データを入力しその内容によりデータ種別を判定する機
能を有する入力装置1と、データを検索に適した構成で
格納する記憶装置2と、利用者に指定された検索式によ
り記憶装置2内のデータを検索する検索装置3とで構成
される。さらに、記憶装置2は入力されたデータを格納
するデータファイル21と、データ種別毎の検索用索引
ファイル22と、その上位に位置し見出し語とデータ種
別とを関連づける上位レベル索引ファイル23とで構成
される。
入力装置1は情報検索の対象とするデータを端末やファ
イル等の媒体から入力し、記憶装置2に検索に適した構
造で蓄積する。第2図に示すように、入力装置lは入力
データ10を入力し、その内容によりどのデータ種別に
属するかを判定する。その後、データを逐次データファ
イル21に格納しながらデータの特定項目からキーワー
ドを抽出し、それをデータ種別毎のキーワードファイル
22aに格納する。このファイル22aはキーワードが
抽出される度に書き込む順編成ファイルであり、検索補
助ファイルとしては適さないので、コード順にソートし
同一キーワード毎に束ねたデータ種別毎の索引ファイル
22を作成する。
イル等の媒体から入力し、記憶装置2に検索に適した構
造で蓄積する。第2図に示すように、入力装置lは入力
データ10を入力し、その内容によりどのデータ種別に
属するかを判定する。その後、データを逐次データファ
イル21に格納しながらデータの特定項目からキーワー
ドを抽出し、それをデータ種別毎のキーワードファイル
22aに格納する。このファイル22aはキーワードが
抽出される度に書き込む順編成ファイルであり、検索補
助ファイルとしては適さないので、コード順にソートし
同一キーワード毎に束ねたデータ種別毎の索引ファイル
22を作成する。
データファイル21は入力されたデータを蓄積するファ
イルであり、データは入力順に蓄積される。ただし、各
データは入力時に特定項目の内容が評価され、どのデー
タ種別に属するか判定されるので、第3図に示すように
論理構造21aとしてデータ種別毎に分類されていると
見做すことができる。そしてこの各々のデータ種別のデ
ータ毎に索引ファイル22が作られる。また、検索式内
で指定されたキーワードがどのデータ種別に関連してい
るかを示す上位レベルの索引ファイル23が作られる。
イルであり、データは入力順に蓄積される。ただし、各
データは入力時に特定項目の内容が評価され、どのデー
タ種別に属するか判定されるので、第3図に示すように
論理構造21aとしてデータ種別毎に分類されていると
見做すことができる。そしてこの各々のデータ種別のデ
ータ毎に索引ファイル22が作られる。また、検索式内
で指定されたキーワードがどのデータ種別に関連してい
るかを示す上位レベルの索引ファイル23が作られる。
本発明ではデータファイルが1個になっているが、デー
タ種別毎にデータファイル。
タ種別毎にデータファイル。
索引ファイルの対を作る方法と比べると、一つのデータ
が複数のデータ種別に属するときファイル容量の削減効
果があり、また異なる見地による複数のデータ種別を設
定することも可能になるという利点がある。
が複数のデータ種別に属するときファイル容量の削減効
果があり、また異なる見地による複数のデータ種別を設
定することも可能になるという利点がある。
検索装置3は端末またはファイルから検索概念を示す検
索式を入力して内部形式に変換した後、記憶装置2をア
クセスして検索の回答としてデータ種別と番号のリスト
を作り出す。このリストは以降の検索で引用するため、
あるいは回答データを端末やファイルに表示・出力する
ために使用される。
索式を入力して内部形式に変換した後、記憶装置2をア
クセスして検索の回答としてデータ種別と番号のリスト
を作り出す。このリストは以降の検索で引用するため、
あるいは回答データを端末やファイルに表示・出力する
ために使用される。
第4図は本発明の情報検索装置による検索処理の動作を
示す流れ図である。
示す流れ図である。
まず、ステップ31において利用者がキーワード、条件
、論理演算子などで検索概念を表現した検索式を端末ま
たはファイルから入力する。ステップ32では、この検
索式を解析し、キーワード、条件、論理演算子などの要
素を抽出し、内部形式に変換する。
、論理演算子などで検索概念を表現した検索式を端末ま
たはファイルから入力する。ステップ32では、この検
索式を解析し、キーワード、条件、論理演算子などの要
素を抽出し、内部形式に変換する。
そしてステップ33において、検索の開始時に検索対象
のデータ種別の指定があればステップ38の該当するデ
ータ種別の検索処理へ行く。
のデータ種別の指定があればステップ38の該当するデ
ータ種別の検索処理へ行く。
データ種別が指定されていなければ、最初にデータ種別
を選択する処理を行なう。すなわち、ステップ34で最
初のキーワードに対し上位レベルの索引ファイル23を
アクセスし、そのキーワードを含むデータのデータ種別
番号リストを取り出す。
を選択する処理を行なう。すなわち、ステップ34で最
初のキーワードに対し上位レベルの索引ファイル23を
アクセスし、そのキーワードを含むデータのデータ種別
番号リストを取り出す。
そしてステップ35において、キーワードが1個だけな
ら、そのキーワードが関連するデータ種別の番号リスト
が得られた事になるのでステップ38へ行く、キーワー
ドが複数ある場合は、ステップ36で次のキーワードに
ついてそのキーワードを含むデータのデータ種別番号リ
ストを取り出し、ステップ37でそれまでに得られてい
るデータ種別番号リストと論理演算をする。このステッ
プ36および37をすべてのキーワードの処理が終わる
まで繰り返す。
ら、そのキーワードが関連するデータ種別の番号リスト
が得られた事になるのでステップ38へ行く、キーワー
ドが複数ある場合は、ステップ36で次のキーワードに
ついてそのキーワードを含むデータのデータ種別番号リ
ストを取り出し、ステップ37でそれまでに得られてい
るデータ種別番号リストと論理演算をする。このステッ
プ36および37をすべてのキーワードの処理が終わる
まで繰り返す。
このようにして最終的に検索式の対象となるデータ種別
番号リストが求まるので、ステップ38でそれぞれのデ
ータ種別の索引ファイル22により検索処理を行ってデ
ータ番号リストを求める。なお、回答の保存は検索式と
データ番号リストに加え、データ種別番号リストも対象
とする。
番号リストが求まるので、ステップ38でそれぞれのデ
ータ種別の索引ファイル22により検索処理を行ってデ
ータ番号リストを求める。なお、回答の保存は検索式と
データ番号リストに加え、データ種別番号リストも対象
とする。
以上説明したように、本発明は情報検索装置に対し、入
力データの内容を評価判断しデータ種別を判定する機能
と、データ種別を用いた多重索引構造を持つ記憶装置と
、それを利用して検索する機能とを付加することにより
、検索時の所要時間、メモリサイズを大幅に削減し、索
引ファイルの更新に要する時間、メモリサイズ、ワーク
ファイルの量も大幅に削減する効果がある。
力データの内容を評価判断しデータ種別を判定する機能
と、データ種別を用いた多重索引構造を持つ記憶装置と
、それを利用して検索する機能とを付加することにより
、検索時の所要時間、メモリサイズを大幅に削減し、索
引ファイルの更新に要する時間、メモリサイズ、ワーク
ファイルの量も大幅に削減する効果がある。
第1図は本発明の一実施例を示す構成図、第2図および
第3図はデータおよび各種ファイルの関連を示す説明図
、第4図は検索処理の動作を示す流れ図である。 1・・・入力装置、2・・・記憶装置、3・・・検索装
置、21・・・データファイル、22・・・索引ファイ
ル、23・・・上位レベル索引ファイル。
第3図はデータおよび各種ファイルの関連を示す説明図
、第4図は検索処理の動作を示す流れ図である。 1・・・入力装置、2・・・記憶装置、3・・・検索装
置、21・・・データファイル、22・・・索引ファイ
ル、23・・・上位レベル索引ファイル。
Claims (1)
- 登録すべきデータの内容を評価判断しデータ種別を判定
する入力装置と、データ種別毎の索引ファイルと前記索
引ファイルの上位に位置し各見出し語がどのデータ種別
に関連しているかの情報を含む上位レベル索引ファイル
とを有する記憶装置と、指定された検索式から検索対象
とすべきデータ種別を求め前記データ種別に属する索引
ファイルおよび前記上位レベル索引ファイルを用いて対
応するデータを検索する検索装置とを備えたことを特徴
とする多重索引構造による情報検索装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63248019A JPH0296274A (ja) | 1988-09-30 | 1988-09-30 | 多重索引構造による情報検索装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63248019A JPH0296274A (ja) | 1988-09-30 | 1988-09-30 | 多重索引構造による情報検索装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0296274A true JPH0296274A (ja) | 1990-04-09 |
Family
ID=17171993
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63248019A Pending JPH0296274A (ja) | 1988-09-30 | 1988-09-30 | 多重索引構造による情報検索装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0296274A (ja) |
-
1988
- 1988-09-30 JP JP63248019A patent/JPH0296274A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4785400A (en) | Method for processing a data base | |
US5649181A (en) | Method and apparatus for indexing database columns with bit vectors | |
US5995962A (en) | Sort system for merging database entries | |
US5745745A (en) | Text search method and apparatus for structured documents | |
US6678687B2 (en) | Method for creating an index and method for searching an index | |
US5021992A (en) | Method of translating data from knowledge base to data base | |
US6760718B2 (en) | Database operation processor | |
US6446066B1 (en) | Method and apparatus using run length encoding to evaluate a database | |
ZA200100187B (en) | Value-instance-connectivity computer-implemented database. | |
CN116431837B (zh) | 基于大型语言模型和图网络模型的文档检索方法和装置 | |
CN115543993A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
JPH07146880A (ja) | 文書検索装置及び方法 | |
JPH0296274A (ja) | 多重索引構造による情報検索装置 | |
JP2000250921A (ja) | データベースの管理方法およびシステム | |
JPS62121532A (ja) | デ−タ検索方法 | |
JP3018579B2 (ja) | 名前検索処理装置 | |
JPH02116936A (ja) | 再編成方式 | |
JPS61278932A (ja) | デ−タ追加処理方法 | |
Samanek | Partial-match retrieval using multi-level superimposed codes: Jaroslav (Joe) Samanek | |
JPH04304559A (ja) | データ検索方式 | |
JPH103414A (ja) | データ格納制御方式 | |
JPS63128426A (ja) | 可変長文字列の検索方式 | |
JPH09282326A (ja) | 文書高速構造検索方式 | |
JPH10143408A (ja) | 索引付順編成ファイル作成装置 | |
JPH05165891A (ja) | データベースのデータ登録・検索方式 |