JP2569530B2 - デ−タベ−ス検索方式 - Google Patents

デ−タベ−ス検索方式

Info

Publication number
JP2569530B2
JP2569530B2 JP62033785A JP3378587A JP2569530B2 JP 2569530 B2 JP2569530 B2 JP 2569530B2 JP 62033785 A JP62033785 A JP 62033785A JP 3378587 A JP3378587 A JP 3378587A JP 2569530 B2 JP2569530 B2 JP 2569530B2
Authority
JP
Japan
Prior art keywords
search
estimated
data distribution
database
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP62033785A
Other languages
English (en)
Other versions
JPS63201717A (ja
Inventor
保 牧野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP62033785A priority Critical patent/JP2569530B2/ja
Publication of JPS63201717A publication Critical patent/JPS63201717A/ja
Application granted granted Critical
Publication of JP2569530B2 publication Critical patent/JP2569530B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はデータベース検索方式に関し、特に大規模な
データベースに対して効率良く検索を行うためのデータ
ベース検索方式に関する。
〔従来の技術〕
従来、この種のデータベース検索方式は、検索条件に
応じて検索手順を決定する方式となっていた。
〔発明が解決しようとする問題点〕
上述した従来のデータベース検索方式は、検索条件に
応じて検索手順を決定する方式となっているので、 (1) 決定した検索手順が必ずしも検索効率の良い検
索手順ではない、 (2) 検索処理が終了するまで検索件数を知ることが
できない、 などの欠点がある。
本発明の目的は、上述の点に鑑み、検索処理に先立っ
て検索件数の推定を行い検索効率の良い検索手順を決定
することのできるデータベース検索方式を提供すること
にある。
〔問題点を解決するための手段〕
本発明のデータベース検索方式は、データベースの全
データの一部をサンプリングしてデータ分布情報を求
め、このデータ分布情報に基づいて検索条件に対する検
索件数の推定を行い推定検索件数を通知する検索件数推
定機構と、前記検索条件と前記検索件数推定機構により
推定された前記推定検索件数とを解析して検索手順を決
定する検索手順決定機構と、この検索手順決定機構によ
り決定された前記検索手順に従って前記データベースに
対して検索を行う検索機構とを有する。
〔作用〕
本発明のデータベース検索方式では、検索件数推定機
構がデータベースの全データの一部をサンプリングして
データ分布情報を求め、このデータ分布情報に基づいて
検索条件に対する検索件数の推定を行い推定検索件数を
通知し、検索手順決定機構が検索条件と検索件数推定機
構により推定された推定検索件数とを解析して検索手順
を決定し、検索機構が検索手順決定機構により決定され
た検索手順に従ってデータベースに対して検索を行う。
〔実施例〕
次に、本発明について図面を参照して説明する。
図は、本発明の一実施例を示す構成図である。本実施
例のデータベース検索方式は、検索手順決定機構1と、
検索件数推定機構2と、検索機構3と、データベース4
と、データ分布記憶域5とから、その主要部が構成され
ている。
検索件数推定機構2は、推定検索件数通知手段21と、
検索件数推定手段22と、データサンプリング手段23と、
データ分布推定手段24と、データ分布記憶手段25とを含
んで構成されている。
なお、図中、符号31は検索条件を、32は検索結果を、
33は推定検索件数をそれぞれ示す。
次に、このように構成された本実施例のデータベース
検索方式の動作について説明する。
検索手順決定機構1は、端末等から入力される検索条
件31の解析を行い、検索件数の推定が必要であるか否か
を判断する。例えば、検索条件として 検索条件かつ検索条件 が与えられた場合には、 検索条件を満たすデータの件数 ≪ 検索条件を満たすデータの件数 であるとすると、先に検索条件を満たすか否かを調
べ、次に検索条件を満たすか否かを調べた方が検索効
率が良い。このような場合には、検索条件を満たすデ
ータの件数と検索条件を満たすデータの件数との推定
が必要であると判断する。
検索手順決定機構1は、検索件数の推定が必要である
と判断すると検索件数推定機構2に制御を渡す。
検索件数推定機構2では、まずデータ分布記憶手段25
により検索条件が指定された項目のデータ分布を示すデ
ータ分布情報がデータ分布記憶域5に登録されているか
否かを調べる。例えば、検索条件に指定された項目のデ
ータ分布情報として指数分布,一様分布,2項分布等のデ
ータ分布密度関数が登録されているか否かを調べる。
データ分布記憶域5にデータ分布情報が登録されてい
るときには、検索件数推定機構2は登録されているデー
タ分布情報に基づいて検索件数推定手段22により推定検
索件数を求める。
データ分布記憶域5にデータ分布情報が登録されてい
ないときには、検索件数推定機構2はデータサンプリン
グ手段23によりデータベース4から検索条件が指定され
た項目のデータのサンプリングを行い、そのサンプリン
グデータに基づいて検索件数推定手段22により推定検索
件数33を求めて検索手順決定機構1に通知する。
また、検索件数推定機構2は、データサンプリング手
段23によりサンプリングされたサンプリングデータに基
づいてデータ分布推定手段24によりデータ分布の推定を
行い、データ分布の推定ができたときには、データ分布
記憶手段25により推定されたデータ分布のデータ分布情
報をデータ分布記憶域5に登録する。
さらに、検索件数推定機構2は、必要に応じて、例え
ばデータ量が多く検索処理に長時間かかると予想されデ
ータベース検索者が前もって検索件数の推定値を欲して
いる場合等に、推定検索件数通知手段21により推定検索
件数33を端末等に表示させてデータベース検索者に通知
する。したがって、データベース検索者は、端末等に表
示させた推定検索件数33を見ることにより、推定検索件
数33が大き過ぎるので検索を取り止めたいと判断した場
合等には検索を取り止めることができる。
検索手順決定機構1は、端末等から入力された検索条
件31と検索件数推定機構2により通知された推定検索件
数33とを解析することにより検索手順を決定し、検索機
構3に制御を渡す。
検索機構3は、検索手順決定機構1により決定された
検索手順に従いデータベース4に対してデータの検索を
行う。
なお、検索件数推定機構2は、検索機構3により実際
に検索処理を行って検索したデータの件数と検索件数推
定機構2において推定した検索件数とを比べて両者があ
る程度以上に相違する場合には、サンプリングデータに
基づいて推定したデータ分布も正しくないものと判断し
て、データ分布記憶手段25によりデータ分布記憶域5か
らそのデータ分布情報を削除する。
次に、本実施例のデータベース検索方式の動作につい
て具体例を用いてより詳細に説明する。
いま、検索条件31として、 a≦項目1<b …… かつ c≦項目2<d …… が与えられたとする。なお、項目1および項目2には索
引が作られていて、高速ランダムアクセスが可能である
とする。
検索手順決定機構1は、検索条件31を解析し、検索条
件、検索条件および検索条件かつに対する検索
件数を推定する必要があるか否かを判断する。これは、
例えば、 検索条件を満たすデータの件数 ≪ 検索条件を満たすデータの件数 であるならば検索条件から先に調べる方が検索効率が
良いと判断したり、検索条件かつを満たすデータの
件数の推定値をデータベース検索者が事前に欲している
場合にそれを通知したりするためである。
検索手順決定機構1は、検索件数を推定する必要があ
ると判断すると検索件数推定機構2に制御を渡す。
検索件数推定機構2は、検索条件,検索条件およ
び検索条件かつに対する検索件数の推定をそれぞれ
行う。
(1−1) 項目1および項目2に対するデータ分布情
報がデータ分布記憶域5に登録されている場合。
項目1および項目2に対するデータ分布情報として、
例えばデータ分布密度関数f(x)およびg(x)がそ
れぞれ登録されていた場合には、検索条件,検索条件
および検索条件かつに対する推定検索件数をそれ
ぞれ次の値と推定する。
(1−2) 項目1および項目2に対するデータ分布情
報がデータ分布記憶域5に登録されていない場合。
データベース4に対してサンプリングを行い、検索条
件,検索条件および検索条件かつに対する推定
検索件数をそれぞれ次の値と推定する。
なお、項目1および項目2のいずれか一方に対するデ
ータ分布情報のみがデータ分布記憶域5に登録されてい
る場合には、(1−1)の場合のようなデータ分布関数
に基づく推定検索件数と、(1−2)の場合のようなサ
ンプリングに基づく推定検索件数との組合せにより、検
索条件,検索条件および検索条件かつに対する
推定検索件数がそれぞれ推定される。
推定検索件数33の推定後、検索件数推定機構2は検索
手順決定機構1に制御を戻す。
検索手順決定機構1は、検索条件31と推定検索件数33
とを解析することにより検索手順を決める。
(2−1) 検索条件に対する推定検索件数≪ 全レ
コード件数、または検索条件に対する推定検索件数≪
全レコード件数の場合。
検索件数が全レコード件数に比べてごく少ない場合に
は、索引のランダムアクセスにより索引のごく一部を読
み込むだけで条件を満たすレコードを求められるので、
索引やデータを順にすべて読み込む方法に比べて速く検
索できる。したがって、索引のランダムアクセスにより
検索を行った方が検索効率が良いと判断する。
また、このとき、検索条件および検索条件のうち
の推定検索件数が小さい方の検索条件から先に検索を行
った方が検索効率が良いと判断する。例えば、全レコー
ドの件数が10,000件、検索条件を満たすレコードの件
数が100件、検索条件を満たすレコードの件数が10件
であるとすると、検索条件から調べると100件のレコ
ードに対して検索条件を調べることになり、検索条件
から調べると10件のレコードに対して検索条件を調
べることになる。すなわち、検索件数が少なくなる後者
の場合の調べ方の方が速く検索できることになる。
(2−2) 検索条件かつに対する推定検索件数が
全レコード件数に比べてあまり小さくない場合。
索引のマルチブロッキングによる順アクセスにより検
索を行った方が検索効率が良いと判断する。索引のラン
ダムアクセスによる検索では、検索条件を満たす件数が
多いほど入出力回数が増えて検索時間がかかる。索引の
マルチブロッキングによる順アクセスによる検索では、
索引をすべて読み込みために検索条件を満たす件数が変
わっても検索条件があまり変わらないので、このように
判断する。
以上のように、本実施例では、検索手順を決めるため
に推定検索件数を利用することにより、検索効率の良い
検索手順が得られる。
〔発明の効果〕
以上説明したように本発明は、データサンプリング機
能を有する検索件数推定機構で検索件数を推定し推定検
索件数および検索条件を解析して検索手順決定機構で検
索手順を決めて検索機構で検索を行うことにより、 (1) 検索手順を決めるのに推定検索件数を使わない
場合に比べて検索効率の良い検索処理が行える、 (2) 検索処理に先立って推定検索件数を通知できる
ので、検索処理を続行するか否かの選択が可能になり、
データベース検索システムの効率の良い利用ができる、 という効果がある。
【図面の簡単な説明】
図は本発明の一実施例を示す構成図である。 図において、 1……検索手順決定機構、2……検索件数推定機構、3
……検索機構、4……データベース、5……データ分布
記憶域、21……推定検索件数通知手段、22……検索件数
推定手段、23……データサンプリング手段、24……デー
タ分布推定手段、25……データ分布記憶手段、31……検
索条件、32……検索結果、33……推定検索件数である。

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】データベースの全データの一部をサンプリ
    ングしてデータ分布情報を求め、このデータ分布情報に
    基づいて検索条件に対する検索件数の推定を行い推定検
    索条件数を通知する検索件数推定機構と、 前記検索条件と前記検索件数推定機構により推定された
    前記推定検索件数とを解析して検索手順を決定する検索
    手順決定機構と、 この検索手順決定機構により決定された前記検索手順に
    従って前記データベースに対して検索を行う検索機構
    と、 を有することを特徴とするデータベース検索方式。
  2. 【請求項2】前記検索件数推定機構が、データ分布記憶
    領域にデータ分布情報が登録されていないときにデータ
    サンプリング手段によりデータベースから検索条件が指
    定された項目のデータのサンプリングを行い、そのサン
    プリングデータに基づいて検索件数推定手段により検索
    件数の推定を行う特許請求の範囲第1項記載のデータベ
    ース検索方式。
JP62033785A 1987-02-17 1987-02-17 デ−タベ−ス検索方式 Expired - Fee Related JP2569530B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62033785A JP2569530B2 (ja) 1987-02-17 1987-02-17 デ−タベ−ス検索方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62033785A JP2569530B2 (ja) 1987-02-17 1987-02-17 デ−タベ−ス検索方式

Publications (2)

Publication Number Publication Date
JPS63201717A JPS63201717A (ja) 1988-08-19
JP2569530B2 true JP2569530B2 (ja) 1997-01-08

Family

ID=12396122

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62033785A Expired - Fee Related JP2569530B2 (ja) 1987-02-17 1987-02-17 デ−タベ−ス検索方式

Country Status (1)

Country Link
JP (1) JP2569530B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03174655A (ja) * 1989-12-04 1991-07-29 Hitachi Ltd 検索時間、検索結果の目安提示方式
US6169985B1 (en) * 1998-05-29 2001-01-02 Epiphany, Inc. Method and apparatus for determining a set of database entries
US6502094B1 (en) * 1999-07-02 2002-12-31 Sap Portals, Inc. Relation path viability prediction

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6240530A (ja) * 1985-08-17 1987-02-21 Fujitsu Ltd デ−タ抽出処理方式

Also Published As

Publication number Publication date
JPS63201717A (ja) 1988-08-19

Similar Documents

Publication Publication Date Title
US5043872A (en) Access path optimization using degrees of clustering
EP0252234B1 (en) Index key range estimator
US5021992A (en) Method of translating data from knowledge base to data base
US5899986A (en) Methods for collecting query workload based statistics on column groups identified by RDBMS optimizer
US20060048155A1 (en) Organizing transmission of repository data
CN112527843B (zh) 数据查询方法、装置、终端设备和存储介质
JP2008310634A (ja) データベース検索装置及びデータベース検索プログラム
US20050027678A1 (en) Computer executable dimension reduction and retrieval engine
JP2569530B2 (ja) デ−タベ−ス検索方式
KR100913027B1 (ko) 데이터 마이닝 시스템 및 그 방법
CN108170664B (zh) 基于重点关键词的关键词拓展方法和装置
Chen et al. Scalable processing of snapshot and continuous nearest-neighbor queries over one-dimensional uncertain data
US9158815B2 (en) Estimating a number of unique values in a list
CN114880329A (zh) 数据查询方法、装置、存储介质及计算机设备
CN112667149A (zh) 一种数据热度感知方法、装置、设备及介质
JP2004157728A (ja) データベース乱れ解消処理方法及びその実施装置並びにその処理プログラム
CN110928868A (zh) 车辆数据检索方法、装置及计算机可读存储介质
CN115455010B (zh) 一种基于milvus数据库的数据处理方法、电子设备及存储介质
KR100373371B1 (ko) 메타데이터의 중요도 결정기법을 적용한 비디오 데이터 검색방법
CN114398378B (zh) 确定索引代价的方法和装置
CN111597212B (zh) 一种数据检索方法及装置
KR100994326B1 (ko) 중요도 정보를 반영한 검색 결과 리스트 제공 방법 및 그시스템
CN117009382A (zh) 一种数据表单的查询方法、装置、电子设备及存储介质
Кузьміних et al. The influence of current results in a eventoriented data collection system
JPH052510A (ja) データベース再編成データ増加量予測方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees