JPH05108717A - インデツクスフアイル構造およびデータベース検索方式 - Google Patents

インデツクスフアイル構造およびデータベース検索方式

Info

Publication number
JPH05108717A
JPH05108717A JP3265782A JP26578291A JPH05108717A JP H05108717 A JPH05108717 A JP H05108717A JP 3265782 A JP3265782 A JP 3265782A JP 26578291 A JP26578291 A JP 26578291A JP H05108717 A JPH05108717 A JP H05108717A
Authority
JP
Japan
Prior art keywords
search
data
attribute
record
records
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3265782A
Other languages
English (en)
Inventor
Yoshiyuki Tanaka
芳幸 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP3265782A priority Critical patent/JPH05108717A/ja
Publication of JPH05108717A publication Critical patent/JPH05108717A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】多量のデータを処理する情報検索システムにお
いて、あらゆる検索条件に対し高速、かつ、安定した検
索処理時間を得る。 【構成】検索条件入力3は、属性データを持ち、検索条
件分類処理4は、検索条件について属性内データ件数を
読み込み、レコードが効率よく絞り込めるように、属性
内データ件数が小さい順に並べ替える処理を行う。検索
高速処理5において、インデックスデータを読み込み、
検索されるデータを含むレコードの個数がある値になる
まで絞り込む処理を行う。そして、絞り込まれたデータ
は、検索処理6に受け渡され、1レコードずつ検索条件
に合うレコードを検索する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、データベース検索方式
に関し、特にインデックス付きデータベースにおける検
索処理方式に関する。
【0002】
【従来の技術】従来のデータベース検索方式において、
検索処理は、レコードにインデックスを付けることによ
ってより高速な検索を行ってきている。しかしながら、
定型業務が主である従来の検索処理においては、インデ
ックスの付け方に規則性があり、今後、データベースが
エンドユーザへ解放されると考えられることから多種多
様な検索に対応し、かつ、高速化が検索処理に望まれ
る。
【0003】次に、従来のデータベース検索方式の検索
処理について図面を参照して説明する。
【0004】図7、図8は従来例のデータベース検索方
式の検索処理のフローチャート、図9は従来例の検索処
理時間とレコード件数の関係を示すグラフである。
【0005】図7、図8は人事表での検索処理を例とし
てあげており、所属が開発部で出身地が茨城県の社員の
検索である。
【0006】そして、図7は所属及び出身地の両者共に
インデックスが付いている場合である。
【0007】まず、ステップ41で所属インデックスを
読み、ステップ42で所属=開発部の条件に合うレーコ
ードを検索し、メモリに記憶される。出身地インデック
スを読み、出身地=茨城県の条件に合うレコードを検索
する(ステップ43,44)。そして、それぞれ両条件
のインデックスによる検索が終了した後に(ステップ4
4)、両者の論理積がとられ(ステップ44)、目的の
レコードを画面に出力する(ステップ45)。インデッ
クスが付いている条件がN個ある場合は、N回のインデ
ックスでの検索の後、全ての論理積がとられ、目的のレ
コードを得る。
【0008】図8は上記の条件にインデックスが付いて
いない場合の例である。
【0009】まず、1件ずつレコードを読み込み(ステ
ップ51)、全ての条件に当てはまるレコードを検索し
(ステップ52)、レコードの終わりまで繰り返す全件
読み出しの検索処理を行い(ステップ53)、目的のレ
コードを画面に出力する(ステップ54)。
【0010】また、インデックスが付く属性と付かない
属性の複合条件の場合、まず、インデックスのある属性
から図7の処理を行い、その後、図8の処理を行って目
的のレコードを得ている。
【0011】そのため、図9に示すように、インデック
スのない条件で検索された場合は、インデックスを用い
ない検索処理の検索処理時間とレコード件数の関係33
(一点鎖線ライン)で示すように、レコード件数が増加
すると、検索処理に時間が増加している。また、インデ
ックスがある条件で検索した場合は、インデックスを用
いた検索処理の検索処理時間とレコード件数の関係32
(破線ライン)で示すようにレコード件数の増加によら
ず検索処理時間は一定ではあるが、レコード件数が所定
値X以下においては、インデックスが無い場合よりも検
索処理時間がかかっている。
【0012】
【発明が解決しようとする課題】上述した従来のデータ
ベース検索方式においては、インデックスのない条件で
検索された場合は、レコード件数が増加すると、検索処
理の時間が増加する。また、インデックスがある条件で
検索した場合は、レコード件数の増加によらず検索処理
時間は一定ではあるが、レコード件数が所定値X以下に
おいては、インデックスが無い場合よりも検索処理時間
がかかり、インデックスの有無やレコードの件数などに
よってシステムのパフォーマンスが落ちてしまうという
欠点がある。
【0013】本発明の目的は、属性データを持つ検索条
件入力と、検索条件について属性内データ件数を読み込
みレコードが効率よく絞り込めるように属性内データ件
数を小さい順に並べ替える処理を行う検索条件分類処理
と、インデックスデータを読み込み検索されるデータを
含むレコードの個数がある値になるまで絞り込む処理を
行う検索高速処理と、絞り込まれたデータを受け取り1
レコードずつ検索条件に合うレコードを検索する検索処
理とを有することにより、上記の欠点を解消し、あらゆ
る検索条件に対して高速かつ安定した検索応答時間を得
ることができ、これにより、インデックスのある場合と
無い場合の利点を生かして検索を行い、検索処理時間と
レコード件数の関係をレコード件数が所定値を越える
と、検索処理時間が一定になるようにでき、システムの
パフォーマンスを低下させなくてすむインデックスファ
イル構造およびデータベース検索方式を提供することに
ある。
【0014】
【課題を解決するための手段】本第一の発明のインデッ
クスファイル構造は、データ値毎にそのデータ値が使用
されている総数である属性内データ件数と、そのデータ
値を有するレコードのレコード番号であるポインタ値と
を有している。本第二の発明のデータベース検索方式
は、検索条件として与えられた属性データを上記第一の
発明のインデックスファイル構造のインデックスファイ
ルにおけるその属性データの属性内データ件数が少ない
順に並べ替える検索条件分類処理手段と、検索条件分類
処理手段で並ベ替えられた属性内データ件数の最少のも
のを読み込んでインデックスでの検索を行いレコード件
数が所定値以下かどうか判断する第1検索条件処理手段
と、この結果が所定値以上ならば属性内データ件数が2
番目に少ない検索条件を読み込み読み込んだ検索条件と
第1検索条件のインデックスを用いて論理演算によって
レコード件数を絞り込みレコード件数が所定値以下かど
うか判断する第2検索条件処理手段と、この結果が所定
値以上ならば属性内データ件数が次に少ない検索条件の
インデックスと前工程の結果で絞り込まれたレコードを
用いて両者の論理演算によってレコード件数を絞り込み
レコード件数が所定値以下かどうか判断し所定値以下に
なるまでこの処理を繰り返す繰り返し検索条件処理手段
とを有し、第1と第2と繰り返し検索条件処理手段によ
ってレコード件数が所定値以下になったならば、所定値
以下になったインデックスを持つ検索条件より属性内デ
ータ件数の大きい検索条件全てを用いて前工程で絞られ
たレコードに対しレコードの全件読み出し処理を行って
いる。
【0015】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。
【0016】図1は本発明の一実施例のデータベース検
索方式を使用したシステムのブロック図である。
【0017】図1において、本実施例のデータベース検
索方式を使用したシステムは、インデックスファイル1
と、データファイル2と、検索条件入力処理4と、検索
高速化処理5と、検索処理6とで構成され、検索条件入
力3を入力し、画面出力7を出力する。
【0018】ここで、検索条件入力3は、少なくとも1
つ以上の属性(氏名、性別、年齢)において具体的な属
性データ(日電太郎、男、32才)を持つ。検索条件分
類処理4は、検索条件についてインデックスファイル1
からインデックスデータの属性内データ件数を読み込
み、複数の検索条件を検索されるレコードが効率よく絞
り込めるように、属性内データ件数が小さい順に並べ替
える処理を行う。並べ替えられた検索条件は、検索高速
化処理5においてインデックスファイル1からインデッ
クスデータを読み込み、検索されるべきデータを含むレ
コードの個数が所定値になるまで絞り込む処理を行う。
絞り込まれたデータは、検索処理6に受け渡され1レコ
ードずつデータファイル2から入力し、検索条件に合う
レコードを検索して画面出力7として画面に出力する。
【0019】次に、このインデックスファイル1及びデ
ータファイル2のファイル構造を人事表を例に取り、図
面を参照して説明する。
【0020】図2は図1のインデックスファイル1の属
性データを表す図、図2(a)は属性データの氏名を表
す図、図2(b)は属性データの性別を表す図、図2
(c)は属性データの所属を表す図、図2(d)は属性
データの出身地を表す図、図3は図1のデータファイル
2の属性データを表す図である。
【0021】インデックスファイル1は、各属性毎にイ
ンデックスが有り、属性データ8ごとにその属性データ
が幾つのレコードの中に含まれているかを示す属性内デ
ータ件数9と、その属性データが含まれるレコードのレ
コード番号10から構成される。データファイル2は、
レコード11に各属性データがインデックスファイル1
で示されたレコード番号に関係付けられている。
【0022】次に、図4を参照して検索条件分類処理に
ついて図2、図3における人事表を例に取り説明する。
【0023】図4は本実施例の検索条件分類処理のフロ
ーチャートである。
【0024】まず、ステップ12において検索条件入力
3の読み込みを行う。このとき“男性”で、“人事部”
で、“北海道出身”の社員の検索が行われるとすると、
ステップ13において、これら3つの条件についてイン
デックスファイル1を参照し、どの属性にインデックス
が有るのか判断を行い、3つともインデックスが有る属
性データであることを検出する。ステップ14において
は、このインデックス有りの属性データについて、イン
デックスファイル1から各条件の属性内データ件数9を
読み込んで小さい順に並べ替え、検索優先順位を付け、
メモリに記憶して検索条件分類処理4を終了する。そし
て、次の検索高速化処理5に移る。このとき、第1検索
条件は“人事部”、第2検索条件は“北海道”、第3検
索条件は“男性”となる。
【0025】次に、図5、図6を参照して上記の検索条
件分類処理4に引続いて検索高速化処理5について説明
する。
【0026】図5は本実施例の検索高速化処理のフロー
チャート、図6は本実施例の検索処理時間とレコード件
数の関係を示すグラフである。
【0027】まず、ステップ15、16において、第1
検索条件の属性内データ件数を読み込む。ステップ17
では、その属性内データ件数を規定値Xと比較する。こ
の規定値Xは、任意の値であり、レコード件数を絞り込
むときのしきい値である。この値は、データベースシス
テムのCPU速度、メモリ、バッファ等によって検索速
度が変化することから、任意に決められるものとする
が、図9に示す従来例の検索処理時間とレコード件数の
関係からインデックスがある場合の検索処理によるイン
デックスを用いた検索処理の検索処理時間とレコード件
数の関係32(破線ライン)とインデックスが無い場合
の検索処理によるインデックスを用いない検索処理の検
索処理時間とレコード件数の関係33(一点鎖線ライ
ン)との交点のレコード件数として求めることができ
る。ここでは、Xの値を8とすると、例えば、人事部の
属性内データ件数が7件であった場合、ステップ18に
おいて第1検索条件のみインデックスを用いた検索方法
を行う。そして、第2検索条件以上は、インデックス無
しの検索方法となる。図2、図3によると、人事部の属
性内データ件数は18件であるので、ステップ19へ処
理が移る。ステップ20では、第1検索条件(人事部)
と第2検索条件(北海道)のインデックスをインデック
スファイル1より読み込む。ステップ21、22におい
て、両者のインデックスから個々にビットマップ展開を
行い、両条件に当てはまるレコード及びレコード件数の
論理積を、ビットマップに展開し求める。この両条件に
当てはまるレコードを示したビットマップを該当ビット
マップという。ステップ23では、ステップ22で求め
たレコード件数と規定値Xを比較し、YESであれば、
ステップ18において、第1、2検索条件によって絞ら
れたレコードについて第3検索条件をインデックス無し
とみなす処理を行い、検索処理6に送る。しかし、NO
であれば、ステップ24へ処理が移り、今度は先に求め
た第1検索条件と第2検索条件に当てはまるレコードを
示した該当ビットマップと、第3検索条件のインデック
スを読み込み、両者の該当レコードをビットマップによ
り検索する処理を行う(ステップ25,26,27)。
このとき、第1、2検索条件によって求められたレコー
ドと、第3検索条件によって求められたレコードの論理
積によって求められるレコード件数が規定値X以下なら
ば(ステップ28、Yes)、ステップ18に処理は移
り、規定値X以上ならば(ステップ28、No)、ステ
ップ24へループし、該当レコード件数が規定値X以下
になるまで条件Nに1を加えながら繰り返し処理を行
う。
【0028】上記のようにして図6に示す本実施例で得
られる検索処理時間とレコード件数関係31を得る。
【0029】
【発明の効果】以上説明したように、本発明のインデッ
クスファイル構造およびデータベース検索方式は、属性
データを持つ検索条件入力と、検索条件について属性内
データ件数を読み込みレコードが効率よく絞り込めるよ
うに属性内データ件数を小さい順に並べ替える処理を行
う検索条件分類処理と、インデックスデータを読み込み
検索されるデータを含むレコードの個数がある値になる
まで絞り込む処理を行う検索高速処理と、絞り込まれた
データを受け取り1レコードずつ検索条件に合うレコー
ドを検索する検索処理とを有することにより、あらゆる
検索条件に対して高速かつ安定した検索応答時間を得る
ことができ、これにより、インデックスのある場合と無
い場合の利点を生かして検索を行い、検索処理時間とレ
コード件数の関係をレコード件数が所定値を越えると、
検索処理時間が一定になるようにでき、システムのパフ
ォーマンスを低下させなくてすむという効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例のデータベース検索方式を使
用したシステムのブロック図である。
【図2】図1のインデックスファイル1の属性データを
表す図である。図2(a)は属性データの氏名を表す図
である。図2(b)は属性データの性別を表す図であ
る。図2(c)は属性データの所属を表す図である。図
2(d)は属性データの出身地を表す図である。
【図3】図1のデータファイル2の属性データを表す図
である。
【図4】図1の検索条件分類処理4のフローチャートで
ある。
【図5】図1の検索高速化処理5のフローチャートであ
る。
【図6】本実施例の検索処理時間とレコード件数の関係
を示すグラフである。
【図7】従来例のデータベース検索方式の検索処理のフ
ローチャートである。
【図8】従来例のデータベース検索方式の検索処理のフ
ローチャートである。
【図9】従来例のデータベース検索方式の検索処理時間
とレコード件数の関係を示すグラフである。
【符号の説明】
1 インデックスファイル 2 データファイル 3 検索条件入力 4 検索条件入力処理 5 検索高速化処理 6 検索処理 7 画4出力 8 属性データ 9 属性内データ件数 10 レコード番号 11 レコード 31 本実施例で得られる検索処理時間とレコード件
数の関係 32 インデックスを用いた検索処理の検索処理時間
とレコード件数の関係 33 インデックスを用いない検索処理の検索処理時
間とレコード件数の関係

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 データ値毎にそのデータ値が使用されて
    いる総数である属性内データ件数と、そのデータ値を有
    するレコードのレコード番号であるポインタ値とを備え
    たことを特徴とするインデックスファイル構造。
  2. 【請求項2】 検索条件として与えられた属性データを
    請求項1記載の前記インデックスファイル構造のインデ
    ックスファイルにおけるその属性データの属性内データ
    件数が少ない順に並べ替える検索条件分類処理手段と、
    前記検索条件分類処理手段で並べ替えられた属性内デー
    タ件数の最少のものを読み込んでインデックスでの検索
    を行いレコード件数が所定値以下かどうか判断する第1
    検索条件処理手段と、この結果が所定値以上ならば属性
    内データ件数が2番目に少ない検索条件を読み込み読み
    込んだ検索条件と前記第1検索条件のインデックスを用
    いて論理演算によってレコード件数を絞り込みレコード
    件数が所定値以下かどうか判断する第2検索条件処理手
    段と、この結果が所定値以上ならば属性内データ件数が
    次に少ない検索条件のインデックスと前工程の結果で絞
    り込まれたレコードを用いて両者の論理演算によってレ
    コード件数を絞り込みレコード件数が所定値以下かどう
    か判断し所定値以下になるまでこの処理を繰り返す繰り
    返し検索条件処理手段とを有し、前記第1と第2と繰り
    返し検索条件処理手段によってレコード件数が所定値以
    下になったならば、所定値以下になったインデックスを
    持つ検索条件より属性内データ件数の大きい検索条件全
    てを用いて前工程で絞られたレコードに対しレコードの
    全件読み出し処理を行うことを特徴とするデータベース
    検索方式。
JP3265782A 1991-10-15 1991-10-15 インデツクスフアイル構造およびデータベース検索方式 Pending JPH05108717A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3265782A JPH05108717A (ja) 1991-10-15 1991-10-15 インデツクスフアイル構造およびデータベース検索方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3265782A JPH05108717A (ja) 1991-10-15 1991-10-15 インデツクスフアイル構造およびデータベース検索方式

Publications (1)

Publication Number Publication Date
JPH05108717A true JPH05108717A (ja) 1993-04-30

Family

ID=17421966

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3265782A Pending JPH05108717A (ja) 1991-10-15 1991-10-15 インデツクスフアイル構造およびデータベース検索方式

Country Status (1)

Country Link
JP (1) JPH05108717A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07129691A (ja) * 1993-11-02 1995-05-19 Nec Corp 提案書作成装置
JPH1153401A (ja) * 1997-08-01 1999-02-26 Nec Corp データベースの索引自動生成システム
JP2001337975A (ja) * 2000-05-26 2001-12-07 Nec Software Hokuriku Ltd 顧客情報蓄積システムおよび顧客情報蓄積方法
JP2015200857A (ja) * 2014-04-10 2015-11-12 日本電信電話株式会社 系列信号特定方法、装置、及びプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07129691A (ja) * 1993-11-02 1995-05-19 Nec Corp 提案書作成装置
JPH1153401A (ja) * 1997-08-01 1999-02-26 Nec Corp データベースの索引自動生成システム
JP2001337975A (ja) * 2000-05-26 2001-12-07 Nec Software Hokuriku Ltd 顧客情報蓄積システムおよび顧客情報蓄積方法
JP2015200857A (ja) * 2014-04-10 2015-11-12 日本電信電話株式会社 系列信号特定方法、装置、及びプログラム

Similar Documents

Publication Publication Date Title
US7346608B2 (en) Method and apparatus for query and analysis
EP0558505B1 (en) System and method for information retrieval
US8290975B2 (en) Graph-based keyword expansion
EP0351210B1 (en) Data base management system and method therefor
US8176052B2 (en) Hyperspace index
US6266660B1 (en) Secondary index search
US7069264B2 (en) Stratified sampling of data in a database system
JP3318834B2 (ja) データファイルシステム及びデータ検索方法
Faloutsos et al. Fast text access methods for optical and large magnetic disks: Designs and performance comparison
US20050210043A1 (en) Method for duplicate detection and suppression
JPH11120203A (ja) データベースを合併する方法およびデータベースからドキュメントを検索する装置
KR101663547B1 (ko) 데이터베이스의 아카이빙 방법 및 장치, 아카이빙된 데이터베이스의 검색 방법 및 장치
US10963440B2 (en) Fast incremental column store data loading
KR101656750B1 (ko) 인덱스정보를 생성하는 데이터베이스의 아카이빙 방법 및 장치, 인덱스정보를 포함하는 아카이빙된 데이터베이스의 검색 방법 및 장치
JP3184243B2 (ja) エキスパートシステムにおける知識獲得支援装置
JPH05108717A (ja) インデツクスフアイル構造およびデータベース検索方式
WO2005043409A1 (ja) 表形式データの結合方法、結合装置およびプログラム
JP3653333B2 (ja) データベース管理方法およびシステム
US5918231A (en) Object-oriented database management system with improved usage efficiency of main memory
JPH08272806A (ja) データベース検索システム
Losee Probabilistic retrieval and coordination level matching
US11734282B1 (en) Methods and systems for performing a vectorized delete in a distributed database system
JP6764973B1 (ja) 関連語辞書作成システム、関連語辞書作成方法及び関連語辞書作成プログラム
JPH08305710A (ja) 文書のキーワード抽出方法及び文書検索装置
US20190057097A1 (en) Information processing device, information processing method, and computer-readable recording medium