JPH05108717A

JPH05108717A - インデツクスフアイル構造およびデータベース検索方式

Info

Publication number: JPH05108717A
Application number: JP3265782A
Authority: JP
Inventors: Yoshiyuki Tanaka; 芳幸田中
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1991-10-15
Filing date: 1991-10-15
Publication date: 1993-04-30

Abstract

(57)【要約】【目的】多量のデータを処理する情報検索システムにお
いて、あらゆる検索条件に対し高速、かつ、安定した検
索処理時間を得る。【構成】検索条件入力３は、属性データを持ち、検索条
件分類処理４は、検索条件について属性内データ件数を
読み込み、レコードが効率よく絞り込めるように、属性
内データ件数が小さい順に並べ替える処理を行う。検索
高速処理５において、インデックスデータを読み込み、
検索されるデータを含むレコードの個数がある値になる
まで絞り込む処理を行う。そして、絞り込まれたデータ
は、検索処理６に受け渡され、１レコードずつ検索条件
に合うレコードを検索する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、データベース検索方式
に関し、特にインデックス付きデータベースにおける検
索処理方式に関する。

【０００２】

【従来の技術】従来のデータベース検索方式において、
検索処理は、レコードにインデックスを付けることによ
ってより高速な検索を行ってきている。しかしながら、
定型業務が主である従来の検索処理においては、インデ
ックスの付け方に規則性があり、今後、データベースが
エンドユーザへ解放されると考えられることから多種多
様な検索に対応し、かつ、高速化が検索処理に望まれ
る。

【０００３】次に、従来のデータベース検索方式の検索
処理について図面を参照して説明する。

【０００４】図７、図８は従来例のデータベース検索方
式の検索処理のフローチャート、図９は従来例の検索処
理時間とレコード件数の関係を示すグラフである。

【０００５】図７、図８は人事表での検索処理を例とし
てあげており、所属が開発部で出身地が茨城県の社員の
検索である。

【０００６】そして、図７は所属及び出身地の両者共に
インデックスが付いている場合である。

【０００７】まず、ステップ４１で所属インデックスを
読み、ステップ４２で所属＝開発部の条件に合うレーコ
ードを検索し、メモリに記憶される。出身地インデック
スを読み、出身地＝茨城県の条件に合うレコードを検索
する（ステップ４３，４４）。そして、それぞれ両条件
のインデックスによる検索が終了した後に（ステップ４
４）、両者の論理積がとられ（ステップ４４）、目的の
レコードを画面に出力する（ステップ４５）。インデッ
クスが付いている条件がＮ個ある場合は、Ｎ回のインデ
ックスでの検索の後、全ての論理積がとられ、目的のレ
コードを得る。

【０００８】図８は上記の条件にインデックスが付いて
いない場合の例である。

【０００９】まず、１件ずつレコードを読み込み（ステ
ップ５１）、全ての条件に当てはまるレコードを検索し
（ステップ５２）、レコードの終わりまで繰り返す全件
読み出しの検索処理を行い（ステップ５３）、目的のレ
コードを画面に出力する（ステップ５４）。

【００１０】また、インデックスが付く属性と付かない
属性の複合条件の場合、まず、インデックスのある属性
から図７の処理を行い、その後、図８の処理を行って目
的のレコードを得ている。

【００１１】そのため、図９に示すように、インデック
スのない条件で検索された場合は、インデックスを用い
ない検索処理の検索処理時間とレコード件数の関係３３
（一点鎖線ライン）で示すように、レコード件数が増加
すると、検索処理に時間が増加している。また、インデ
ックスがある条件で検索した場合は、インデックスを用
いた検索処理の検索処理時間とレコード件数の関係３２
（破線ライン）で示すようにレコード件数の増加によら
ず検索処理時間は一定ではあるが、レコード件数が所定
値Ｘ以下においては、インデックスが無い場合よりも検
索処理時間がかかっている。

【００１２】

【発明が解決しようとする課題】上述した従来のデータ
ベース検索方式においては、インデックスのない条件で
検索された場合は、レコード件数が増加すると、検索処
理の時間が増加する。また、インデックスがある条件で
検索した場合は、レコード件数の増加によらず検索処理
時間は一定ではあるが、レコード件数が所定値Ｘ以下に
おいては、インデックスが無い場合よりも検索処理時間
がかかり、インデックスの有無やレコードの件数などに
よってシステムのパフォーマンスが落ちてしまうという
欠点がある。

【００１３】本発明の目的は、属性データを持つ検索条
件入力と、検索条件について属性内データ件数を読み込
みレコードが効率よく絞り込めるように属性内データ件
数を小さい順に並べ替える処理を行う検索条件分類処理
と、インデックスデータを読み込み検索されるデータを
含むレコードの個数がある値になるまで絞り込む処理を
行う検索高速処理と、絞り込まれたデータを受け取り１
レコードずつ検索条件に合うレコードを検索する検索処
理とを有することにより、上記の欠点を解消し、あらゆ
る検索条件に対して高速かつ安定した検索応答時間を得
ることができ、これにより、インデックスのある場合と
無い場合の利点を生かして検索を行い、検索処理時間と
レコード件数の関係をレコード件数が所定値を越える
と、検索処理時間が一定になるようにでき、システムの
パフォーマンスを低下させなくてすむインデックスファ
イル構造およびデータベース検索方式を提供することに
ある。

【００１４】

【課題を解決するための手段】本第一の発明のインデッ
クスファイル構造は、データ値毎にそのデータ値が使用
されている総数である属性内データ件数と、そのデータ
値を有するレコードのレコード番号であるポインタ値と
を有している。本第二の発明のデータベース検索方式
は、検索条件として与えられた属性データを上記第一の
発明のインデックスファイル構造のインデックスファイ
ルにおけるその属性データの属性内データ件数が少ない
順に並べ替える検索条件分類処理手段と、検索条件分類
処理手段で並ベ替えられた属性内データ件数の最少のも
のを読み込んでインデックスでの検索を行いレコード件
数が所定値以下かどうか判断する第１検索条件処理手段
と、この結果が所定値以上ならば属性内データ件数が２
番目に少ない検索条件を読み込み読み込んだ検索条件と
第１検索条件のインデックスを用いて論理演算によって
レコード件数を絞り込みレコード件数が所定値以下かど
うか判断する第２検索条件処理手段と、この結果が所定
値以上ならば属性内データ件数が次に少ない検索条件の
インデックスと前工程の結果で絞り込まれたレコードを
用いて両者の論理演算によってレコード件数を絞り込み
レコード件数が所定値以下かどうか判断し所定値以下に
なるまでこの処理を繰り返す繰り返し検索条件処理手段
とを有し、第１と第２と繰り返し検索条件処理手段によ
ってレコード件数が所定値以下になったならば、所定値
以下になったインデックスを持つ検索条件より属性内デ
ータ件数の大きい検索条件全てを用いて前工程で絞られ
たレコードに対しレコードの全件読み出し処理を行って
いる。

【００１５】

【実施例】次に、本発明の実施例について図面を参照し
て説明する。

【００１６】図１は本発明の一実施例のデータベース検
索方式を使用したシステムのブロック図である。

【００１７】図１において、本実施例のデータベース検
索方式を使用したシステムは、インデックスファイル１
と、データファイル２と、検索条件入力処理４と、検索
高速化処理５と、検索処理６とで構成され、検索条件入
力３を入力し、画面出力７を出力する。

【００１８】ここで、検索条件入力３は、少なくとも１
つ以上の属性（氏名、性別、年齢）において具体的な属
性データ（日電太郎、男、３２才）を持つ。検索条件分
類処理４は、検索条件についてインデックスファイル１
からインデックスデータの属性内データ件数を読み込
み、複数の検索条件を検索されるレコードが効率よく絞
り込めるように、属性内データ件数が小さい順に並べ替
える処理を行う。並べ替えられた検索条件は、検索高速
化処理５においてインデックスファイル１からインデッ
クスデータを読み込み、検索されるべきデータを含むレ
コードの個数が所定値になるまで絞り込む処理を行う。
絞り込まれたデータは、検索処理６に受け渡され１レコ
ードずつデータファイル２から入力し、検索条件に合う
レコードを検索して画面出力７として画面に出力する。

【００１９】次に、このインデックスファイル１及びデ
ータファイル２のファイル構造を人事表を例に取り、図
面を参照して説明する。

【００２０】図２は図１のインデックスファイル１の属
性データを表す図、図２（ａ）は属性データの氏名を表
す図、図２（ｂ）は属性データの性別を表す図、図２
（ｃ）は属性データの所属を表す図、図２（ｄ）は属性
データの出身地を表す図、図３は図１のデータファイル
２の属性データを表す図である。

【００２１】インデックスファイル１は、各属性毎にイ
ンデックスが有り、属性データ８ごとにその属性データ
が幾つのレコードの中に含まれているかを示す属性内デ
ータ件数９と、その属性データが含まれるレコードのレ
コード番号１０から構成される。データファイル２は、
レコード１１に各属性データがインデックスファイル１
で示されたレコード番号に関係付けられている。

【００２２】次に、図４を参照して検索条件分類処理に
ついて図２、図３における人事表を例に取り説明する。

【００２３】図４は本実施例の検索条件分類処理のフロ
ーチャートである。

【００２４】まず、ステップ１２において検索条件入力
３の読み込みを行う。このとき“男性”で、“人事部”
で、“北海道出身”の社員の検索が行われるとすると、
ステップ１３において、これら３つの条件についてイン
デックスファイル１を参照し、どの属性にインデックス
が有るのか判断を行い、３つともインデックスが有る属
性データであることを検出する。ステップ１４において
は、このインデックス有りの属性データについて、イン
デックスファイル１から各条件の属性内データ件数９を
読み込んで小さい順に並べ替え、検索優先順位を付け、
メモリに記憶して検索条件分類処理４を終了する。そし
て、次の検索高速化処理５に移る。このとき、第１検索
条件は“人事部”、第２検索条件は“北海道”、第３検
索条件は“男性”となる。

【００２５】次に、図５、図６を参照して上記の検索条
件分類処理４に引続いて検索高速化処理５について説明
する。

【００２６】図５は本実施例の検索高速化処理のフロー
チャート、図６は本実施例の検索処理時間とレコード件
数の関係を示すグラフである。

【００２７】まず、ステップ１５、１６において、第１
検索条件の属性内データ件数を読み込む。ステップ１７
では、その属性内データ件数を規定値Ｘと比較する。こ
の規定値Ｘは、任意の値であり、レコード件数を絞り込
むときのしきい値である。この値は、データベースシス
テムのＣＰＵ速度、メモリ、バッファ等によって検索速
度が変化することから、任意に決められるものとする
が、図９に示す従来例の検索処理時間とレコード件数の
関係からインデックスがある場合の検索処理によるイン
デックスを用いた検索処理の検索処理時間とレコード件
数の関係３２（破線ライン）とインデックスが無い場合
の検索処理によるインデックスを用いない検索処理の検
索処理時間とレコード件数の関係３３（一点鎖線ライ
ン）との交点のレコード件数として求めることができ
る。ここでは、Ｘの値を８とすると、例えば、人事部の
属性内データ件数が７件であった場合、ステップ１８に
おいて第１検索条件のみインデックスを用いた検索方法
を行う。そして、第２検索条件以上は、インデックス無
しの検索方法となる。図２、図３によると、人事部の属
性内データ件数は１８件であるので、ステップ１９へ処
理が移る。ステップ２０では、第１検索条件（人事部）
と第２検索条件（北海道）のインデックスをインデック
スファイル１より読み込む。ステップ２１、２２におい
て、両者のインデックスから個々にビットマップ展開を
行い、両条件に当てはまるレコード及びレコード件数の
論理積を、ビットマップに展開し求める。この両条件に
当てはまるレコードを示したビットマップを該当ビット
マップという。ステップ２３では、ステップ２２で求め
たレコード件数と規定値Ｘを比較し、ＹＥＳであれば、
ステップ１８において、第１、２検索条件によって絞ら
れたレコードについて第３検索条件をインデックス無し
とみなす処理を行い、検索処理６に送る。しかし、ＮＯ
であれば、ステップ２４へ処理が移り、今度は先に求め
た第１検索条件と第２検索条件に当てはまるレコードを
示した該当ビットマップと、第３検索条件のインデック
スを読み込み、両者の該当レコードをビットマップによ
り検索する処理を行う（ステップ２５，２６，２７）。
このとき、第１、２検索条件によって求められたレコー
ドと、第３検索条件によって求められたレコードの論理
積によって求められるレコード件数が規定値Ｘ以下なら
ば（ステップ２８、Ｙｅｓ）、ステップ１８に処理は移
り、規定値Ｘ以上ならば（ステップ２８、Ｎｏ）、ステ
ップ２４へループし、該当レコード件数が規定値Ｘ以下
になるまで条件Ｎに１を加えながら繰り返し処理を行
う。

【００２８】上記のようにして図６に示す本実施例で得
られる検索処理時間とレコード件数関係３１を得る。

【００２９】

【発明の効果】以上説明したように、本発明のインデッ
クスファイル構造およびデータベース検索方式は、属性
データを持つ検索条件入力と、検索条件について属性内
データ件数を読み込みレコードが効率よく絞り込めるよ
うに属性内データ件数を小さい順に並べ替える処理を行
う検索条件分類処理と、インデックスデータを読み込み
検索されるデータを含むレコードの個数がある値になる
まで絞り込む処理を行う検索高速処理と、絞り込まれた
データを受け取り１レコードずつ検索条件に合うレコー
ドを検索する検索処理とを有することにより、あらゆる
検索条件に対して高速かつ安定した検索応答時間を得る
ことができ、これにより、インデックスのある場合と無
い場合の利点を生かして検索を行い、検索処理時間とレ
コード件数の関係をレコード件数が所定値を越えると、
検索処理時間が一定になるようにでき、システムのパフ
ォーマンスを低下させなくてすむという効果がある。

【図面の簡単な説明】

【図１】本発明の一実施例のデータベース検索方式を使
用したシステムのブロック図である。

【図２】図１のインデックスファイル１の属性データを
表す図である。図２（ａ）は属性データの氏名を表す図
である。図２（ｂ）は属性データの性別を表す図であ
る。図２（ｃ）は属性データの所属を表す図である。図
２（ｄ）は属性データの出身地を表す図である。

【図３】図１のデータファイル２の属性データを表す図
である。

【図４】図１の検索条件分類処理４のフローチャートで
ある。

【図５】図１の検索高速化処理５のフローチャートであ
る。

【図６】本実施例の検索処理時間とレコード件数の関係
を示すグラフである。

【図７】従来例のデータベース検索方式の検索処理のフ
ローチャートである。

【図８】従来例のデータベース検索方式の検索処理のフ
ローチャートである。

【図９】従来例のデータベース検索方式の検索処理時間
とレコード件数の関係を示すグラフである。

【符号の説明】

１インデックスファイル２データファイル３検索条件入力４検索条件入力処理５検索高速化処理６検索処理７画４出力８属性データ９属性内データ件数１０レコード番号１１レコード３１本実施例で得られる検索処理時間とレコード件
数の関係３２インデックスを用いた検索処理の検索処理時間
とレコード件数の関係３３インデックスを用いない検索処理の検索処理時
間とレコード件数の関係

Claims

【特許請求の範囲】

【請求項１】データ値毎にそのデータ値が使用されて
いる総数である属性内データ件数と、そのデータ値を有
するレコードのレコード番号であるポインタ値とを備え
たことを特徴とするインデックスファイル構造。
【請求項２】検索条件として与えられた属性データを
請求項１記載の前記インデックスファイル構造のインデ
ックスファイルにおけるその属性データの属性内データ
件数が少ない順に並べ替える検索条件分類処理手段と、
前記検索条件分類処理手段で並べ替えられた属性内デー
タ件数の最少のものを読み込んでインデックスでの検索
を行いレコード件数が所定値以下かどうか判断する第１
検索条件処理手段と、この結果が所定値以上ならば属性
内データ件数が２番目に少ない検索条件を読み込み読み
込んだ検索条件と前記第１検索条件のインデックスを用
いて論理演算によってレコード件数を絞り込みレコード
件数が所定値以下かどうか判断する第２検索条件処理手
段と、この結果が所定値以上ならば属性内データ件数が
次に少ない検索条件のインデックスと前工程の結果で絞
り込まれたレコードを用いて両者の論理演算によってレ
コード件数を絞り込みレコード件数が所定値以下かどう
か判断し所定値以下になるまでこの処理を繰り返す繰り
返し検索条件処理手段とを有し、前記第１と第２と繰り
返し検索条件処理手段によってレコード件数が所定値以
下になったならば、所定値以下になったインデックスを
持つ検索条件より属性内データ件数の大きい検索条件全
てを用いて前工程で絞られたレコードに対しレコードの
全件読み出し処理を行うことを特徴とするデータベース
検索方式。