JPH032938A - データベース処理方法 - Google Patents

データベース処理方法

Info

Publication number
JPH032938A
JPH032938A JP1136033A JP13603389A JPH032938A JP H032938 A JPH032938 A JP H032938A JP 1136033 A JP1136033 A JP 1136033A JP 13603389 A JP13603389 A JP 13603389A JP H032938 A JPH032938 A JP H032938A
Authority
JP
Japan
Prior art keywords
value
cost
processing
database
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1136033A
Other languages
English (en)
Inventor
Yukio Nakano
幸生 中野
Masashi Tsuchida
正士 土田
Shigeru Yoneda
茂 米田
Toshio Honma
本間 敏夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Software Engineering Co Ltd
Hitachi Ltd
Original Assignee
Hitachi Software Engineering Co Ltd
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Software Engineering Co Ltd, Hitachi Ltd filed Critical Hitachi Software Engineering Co Ltd
Priority to JP1136033A priority Critical patent/JPH032938A/ja
Publication of JPH032938A publication Critical patent/JPH032938A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野〕 本発明は、データベース処理装置に関し、特にリレーシ
ョナルデータベース管理システムの間合せ処理に好適な
データベース処理方法に関する。
(従来の技術〕 データベース管理システム(以下DBMSと略記)、特
にリレーショナルDBMSは、非手続き的なN WAで
表現された問合せを処理して、内部処理手順を決定し、
実行する。
従来の間合せ処理の主な方法には、予め設定した規則に
基ついて単一の内部処理手順を決定するもの[例えば、
シーニーシーエム、第18巻第10号、1975年10
月、第568〜579頁(CACM Vol、18. 
Nn1O,Oct、1975. pp、568−579
.)]と、各神統計情報を用いて選定された複数の候補
処理手順から、コスト評価により、最適と思オ〕れるも
のを決定するもの[例えば、プロシーデインゲス オブ
 エーシーエ11  ルグモド、1979年、第23〜
34頁(Proc、 ACM−3IGMOI)、 19
79゜pp、 23−34. )コとがある。
前者は、処理手順作成のための負債は小さいけれども、
−律に設定された規則の妥当性に問題があり、選ばれた
内部処理手順の最適性にも問題がある。後者は、各種統
計情報の管理と、複数の候補処理手順の作成及びそれら
のコスト評価のための負荷があるものの、最適な処理手
順を与える。
ここで、データベースはユーザから2次元のテーブル形
式で見られるリレーションから成る・ト」のとし、当該
デープルの行に対応するものをローとする。また、ロー
は、1つ以りのJOC性(これをFカラム」という)か
ら成っている。
〔発明が解決しようとする課題〕
上記従来技術、特に間合せで出現ずろ検索条件式を?l
a1足するデータの割合を基にコスト評価により最適な
処理手順を決定するものは、コスト評価の評価値をデー
タ・ベースの統計情報を用いて求めていた。しかし、求
めたコスト評価値と実す′1斗の検索した結果の値を比
較すると誤差が大きいことがある。これは、データベー
ス挿入、更新、削除の操作によってページ中のローの集
密度が實化するごとに起因する。
本発明の目的は、コスト評価の見積り値を統計情報と前
回の検索要求のコスト評価見積り値と検索実行時の実際
の値を比較し求めた値を用いて訂(itll!題を解決
するための手段〕h 1jl、7目的は、(1)データ
ベースに対するユーザからの問合せの解析結果とデータ
ベースシステムの統計情報よりデータ・アクセス処理手
段を選定する際に、処理コスト評価を行い見積もったコ
スト値より処理手順を選びだしそれを実行するデータベ
ース処β11装ド′Cにおいて、コスト評価の見積りを
、データベース特性、システム特性、データ特性、リレ
ーションを構成するカラムの出現値、あるいはカラムの
出現値を分割した結果得られる範囲値とカラム値の出現
1回数と当該範囲に出現するカラム値の個数に関する情
報等を含むデータベース挿入テl−の統計情報と、前回
の間合せ処理時の処理コストの見積り値と検索実行時の
実際の値の比較により求められた補正値を用いて計算す
る。
(2)検索終了時に夕(理手順を選ぶために見積もった
コスト4+riと実際の値を比較し、次Hのコスト評価
値の計算式に反映される補正値を求める。
に3)コスト評価時に見積もった値と実際の幀を格納す
る領域を確保し、ユーザが参照可能とじユーザが直接両
方の飴を1伴価し、コスト評価式の補正値をイ晦【トす
る。
(4)コスト評価見積りを行うための評価式を格納する
領域を確保し、評価fllli式を内部処理及びユーザ
インタフェースより変更Ill能とすることにより達成
される。
〔作用〕
本発明のコスト見積り方式は、検二佐を実行゛→る毎に
、!7.1ダリコストと倹索柊r時のイ1へを比較し求
めた補正値を次回のコスト見積り時の評価値に反映する
ことにより誤差が小さくなりより+E 4i:1な」ス
ト見積りができろ。
〔実施例〕
以ド、本発明の一実施例を図面にノ人づいで詳細に説明
する。
第1図は、本発明か適ハ1^れ/”−1) l(M S
のり1チ(1例を示す。間合せ::I マンF l 0
1をl)8M81tJ2に人力ずろと間合せ処理か行わ
れ、検索納置+ o !]に出力されろ。
1) )3 M S 102は間合ぜ解析部10.3.
述語渕択率算出部104.アクセスパス剪定部105、
データアクセス処理車L1作成部106.検索実行部1
07および見積り値評価部108とからなる。
上記間合せ解析部103は、人力された間合せコマンド
の構文解析、意味解析を実行する。述語選択率算出部1
04は1間合せコマンドで出現する各種条件式から条件
を満足するデータの割合(述語選択率)を推定する。ア
クセスバス剪定部105は、第4図の様な、予め設定し
ている規則を利用し、データベース特性(データベース
中の各種データサイズ、データベースの物理構造、イン
デクス有無や種類等)やシステム特性(バッファサイズ
、CPU性能等)に関する情報を用いて有効なアクセス
バス候補を剪定する。データアクセス処理:f−順作成
部106は、第5図の如き処理コス1へS’l出式によ
りコスト評価を行い、内部処理手順を作成する。検索実
行部107は、データアクセス処理手順作成部106で
、作成された手順に従って検索を実行する見積り佃評価
部108は検疾実行結果得た実際のロー数、ページ数等
の値とアータアクセス処理手り11作成でJ+’、積も
った値とを比較し、評価し、次回のコスト評価値見積り
時の評価式に反映するイロ1を求める。データベース1
10には、テーブル112及び統計情報管理テーブル1
11かスI枯されている。統計情報管理テーブル111
は、データベース110の各テーブルを(11η成する
カラム値の出現回数情報、データベース特性、システム
特性及びコスト評価式と評価式の補正値を設定しでいる
第2図は、本発明が適用されるハードウェア構成の一例
を示すものである。具体的には上記tα(MM)201
を保持する中央処理装置(CPU)と、入出力制御を行
うチャネル装置i’t (CM) 202と、ディスク
(LJISK)203からなる。中央処ア11装置?/
 200からのディスク203内のデータアクセス要求
はチャネル202を介して行われデータ転送、制御デー
タ交換のために中央処JllI装置′+1200とチャ
ネル201の間に経路204、チャネル20[とディス
ク20:3の間に経路205が用いられる。
本構成の主記憶201内にl)BMSが格納され動作し
ており、I−J I S K 203内にテーブル、統
計情報等のデータベースが捨積されている。
第3図は、本発明を適用したL)BMSの各処理のフロ
ーチャートである。以−ト、各処理部の詳細なフローチ
ャートの説明を行う。
間合せ解析部310は、間合せコマンドの構文解析、意
味解析を実行しく311)、コマンドに出現する条件式
をCNF(コンジャンクチイブノーマル フオーム: 
Conjunctive Normal Form)か
1JNF(テイスジャンクテイブ ノーマル フオーム
: Dis、1unctive Normal For
m)に変換する(312)。
述語選択率算出部320は、当述語のカラ11値分布情
報が有ることを確認する(321)。カラム値分布情報
が有れば選択率を算出しく322)、分布情報が無けれ
ば述語の種類に応じて、予め設定しているデイフォルト
値を選択率として設定する(323)。
アクセスバス剪定部340は、述語の組合せ、インデク
スの有無を基にして、問合せを52のパターンに分け(
341)、第4図を参照し、対応する処理手順候補を選
出する(342)。なお、結合処理にはソートマージ結
合とネストルーブ結合がある。アクセスバスには、内部
で作成した中間結果を使用するカラム(リスト・カラム
)と選択を行ったカラム(セレクション・カラlS)と
結合を行ったカラム(ジョイン・カラム)がある。
リス1−・アクセスバスにはセレクション・カラtz 
1インデクス付きのカラム(インデクス・カラム)とテ
ーブルを順番にスキャンするりレーション・スキャンと
がある。中間結果を作成する時ソートするカラムには、
ジョイン・カラムかある。
データアクセス処理手順作成350は、アクセスバス剪
定部:340で絞りこまれた候補の処理コスト評価値を
見積り(351)、評価値によって最小となる処理手順
を唯一決定する(:3:52)。
処理コスト評価値は、第5図の対応する算出式のロー数
、ページ数の計算式に前回の検疾終r時に求められた補
正値(それぞれα、β)を掛けあわせた値として計算す
る。
例えば、第5図番号aの処理コストを求めるには、ソー
トマージ結合コストCs : E t + Ex +(
RW l串α)*jFt申(RWx−β)を計算すれば
良い。
検索実行結果360は、選択された実行形式の処理手順
を解釈し1間合せコマンドを実行する(3f;1)。
31、積り値評価部370は、データアクセス処理f厘
生成で求めたロー数、ページ数と実際に検索を行った結
果のロー数、ページ数を比較し、見積偵を補正する値(
α、β)を求め(371)、次回評価見積りのために統
計情報として37.録する(コ372)。
これまでの処理過程を経て、見積り評価式を補正する検
索方式が実現される。
以上の処理フローを説明した。本発明のコスト見積り値
補正処理方式は、適当なデータベース参照特性情報を与
え、コスト評価により内部処理手順が得られるものであ
れば、コスト評価のみ、コスト評価と規則利用の併用等
の最適化処理を行うml 13 M Sにも適用できろ
。上記コスト見積り補+E値のα、βは検索実行結果よ
り見積り値評価部がケ仙的に設定する以外にも、ユーザ
からの指定で實史されても良い。さらに、カラl、 (
11jの出現回数。
コスト見積りの補正値等の統計情報は、データベースに
格納しなくともデータディレクトリあるいはディレクト
リ等に格納されても良い。
〔発明の効果〕
本発明によれば、内部処理手順を決定するコスト評価の
値を補正値により修【トすることによりc II LJ
負負荷あまり増やすこと無く、より止(Keなコスト評
価を行うことができ、結果として最適な内部処理手順が
選択できCI) LI負<rj、110回数を軽減させ
る効果がある。
【図面の簡単な説明】
第1図は本発明が適用されたLI B M Sの処理例
の説明図、第2図は本発明が適用されろハードウェア構
成の一例を示すブロック図、第23図は本発明を泗用し
たD HM Sのフローチャート、第4図はデータベー
スの処理手順の一覧を示す図、第5図は処理負荷の評価
の覧を示す図である。 102・・・データベース管理システム、103〜10
8・・・oByrs内各処理部、110・・・データベ
ース、200・・・中央処理装置、201・・・主記憶
装置i=7.202・・・チャネル装置、203・・・
ディスク装置。 第 l 囚 礫 因 (α) (b)

Claims (1)

  1. 【特許請求の範囲】 1、データベースに対するユーザからの間合せの解析結
    果とデータベースシステムの統計情報よりデータ・アク
    セス処理手順を選定する際に、処理コスト評価を行い見
    積もつたコスト値より処理手順を選びだしそれを実行す
    るデータベース処理装置において、コスト評価の見積り
    を、データベース特性、システム特性、データ特性、リ
    レーションを構成するカラムの出現値、あるいはカラム
    の出現値を分割した結果得られる範囲値とカラム値の出
    現回数と当該範囲に出現するカラム値の個数に関する情
    報等を含むデータベースシステムの統計情報と、前回の
    問合せ処理時の処理コストの見積り値と検索実行時の実
    際の値の比較により求められた補正値を用いて計算する
    データベース処理方法。 2、請求項1記載の方法において、検索終了時に処理手
    順を選ぶために見積もつたコスト値と実際の値を比較し
    、次回のコスト評価値の計算式に反映される補正値を求
    めるデータベース処理方法。 3、請求項1記載の方法において、コスト評価時に見積
    もつた値と実際の値を格納する領域を確保し、ユーザが
    参照可能とし、ユーザが直接両方の値を評価し、コスト
    評価式の補正値を修正するデータベース処理方法。 4、請求項1記載の方法において、コスト評価見積りを
    行うための評価式を格納する領域を確保し、評価式を内
    部処理及びユーザインタフェースより変更可能とするデ
    ータベース処理方法。
JP1136033A 1989-05-31 1989-05-31 データベース処理方法 Pending JPH032938A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1136033A JPH032938A (ja) 1989-05-31 1989-05-31 データベース処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1136033A JPH032938A (ja) 1989-05-31 1989-05-31 データベース処理方法

Publications (1)

Publication Number Publication Date
JPH032938A true JPH032938A (ja) 1991-01-09

Family

ID=15165611

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1136033A Pending JPH032938A (ja) 1989-05-31 1989-05-31 データベース処理方法

Country Status (1)

Country Link
JP (1) JPH032938A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007506191A (ja) * 2003-09-15 2007-03-15 エービー イニティオ ソフトウェア コーポレーション データプロファイリング
WO2012169102A1 (ja) * 2011-06-08 2012-12-13 日本電気株式会社 データベース性能予測装置及びデータベース予測方法
US9323748B2 (en) 2012-10-22 2016-04-26 Ab Initio Technology Llc Profiling data with location information
US9449057B2 (en) 2011-01-28 2016-09-20 Ab Initio Technology Llc Generating data pattern information
US9892026B2 (en) 2013-02-01 2018-02-13 Ab Initio Technology Llc Data records selection
US9971798B2 (en) 2014-03-07 2018-05-15 Ab Initio Technology Llc Managing data profiling operations related to data type
US11068540B2 (en) 2018-01-25 2021-07-20 Ab Initio Technology Llc Techniques for integrating validation results in data profiling and related systems and methods
US11487732B2 (en) 2014-01-16 2022-11-01 Ab Initio Technology Llc Database key identification

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8868580B2 (en) 2003-09-15 2014-10-21 Ab Initio Technology Llc Data profiling
US9323802B2 (en) 2003-09-15 2016-04-26 Ab Initio Technology, Llc Data profiling
JP2007506191A (ja) * 2003-09-15 2007-03-15 エービー イニティオ ソフトウェア コーポレーション データプロファイリング
US9449057B2 (en) 2011-01-28 2016-09-20 Ab Initio Technology Llc Generating data pattern information
US9652513B2 (en) 2011-01-28 2017-05-16 Ab Initio Technology, Llc Generating data pattern information
WO2012169102A1 (ja) * 2011-06-08 2012-12-13 日本電気株式会社 データベース性能予測装置及びデータベース予測方法
US9336254B2 (en) 2011-06-08 2016-05-10 Nec Corporation Database performance estimation device and database estimation method
US9569434B2 (en) 2012-10-22 2017-02-14 Ab Initio Technology Llc Profiling data with source tracking
US9323749B2 (en) 2012-10-22 2016-04-26 Ab Initio Technology Llc Profiling data with location information
US9323748B2 (en) 2012-10-22 2016-04-26 Ab Initio Technology Llc Profiling data with location information
US9990362B2 (en) 2012-10-22 2018-06-05 Ab Initio Technology Llc Profiling data with location information
US10719511B2 (en) 2012-10-22 2020-07-21 Ab Initio Technology Llc Profiling data with source tracking
US9892026B2 (en) 2013-02-01 2018-02-13 Ab Initio Technology Llc Data records selection
US10241900B2 (en) 2013-02-01 2019-03-26 Ab Initio Technology Llc Data records selection
US11163670B2 (en) 2013-02-01 2021-11-02 Ab Initio Technology Llc Data records selection
US11487732B2 (en) 2014-01-16 2022-11-01 Ab Initio Technology Llc Database key identification
US9971798B2 (en) 2014-03-07 2018-05-15 Ab Initio Technology Llc Managing data profiling operations related to data type
US11068540B2 (en) 2018-01-25 2021-07-20 Ab Initio Technology Llc Techniques for integrating validation results in data profiling and related systems and methods

Similar Documents

Publication Publication Date Title
Haas et al. Ripple joins for online aggregation
CA2146171C (en) Method for estimating cardinalities for query processing in a relational database management system
US5778353A (en) Computer program product for optimizing data retrieval using index scanning
Seshadri et al. Sequence query processing
Donjerkovic et al. Probabilistic optimization of top N queries
US6947927B2 (en) Method and apparatus for exploiting statistics on query expressions for optimization
US7240078B2 (en) Method, system, and program for query optimization with algebraic rules
US6356889B1 (en) Method for determining optimal database materializations using a query optimizer
US5043872A (en) Access path optimization using degrees of clustering
US7240044B2 (en) Query optimization by sub-plan memoization
Chaudhuri et al. Optimization of queries with user-de ned predicates
US6738755B1 (en) Query optimization method for incrementally estimating the cardinality of a derived relation when statistically correlated predicates are applied
Swami et al. On the estimation of join result sizes
US6122644A (en) System for halloween protection in a database system
US20060041537A1 (en) Selecting candidate queries
WO2002071260A1 (en) Adaptable query optimization and evaluation in temporal middleware
JPH0855138A (ja) 関係データベースの質問を最適化する方法
Bodorik et al. Deciding to correct distributed query processing
Trummer et al. An incremental anytime algorithm for multi-objective query optimization
US6999967B1 (en) Semantically reducing the number of partitions involved in a join
US8452757B2 (en) Index mechanism for finding nearest matches in a computer system
JPH032938A (ja) データベース処理方法
Feldman et al. A knowledge-based approach for index selection in relational databases
McHugh et al. Optimizing branching path expressions
Schkolnick et al. Considerations in developing a design tool for a relational DBMS