JPS62191922A - デ−タ・ベ−ス検索システム - Google Patents

デ−タ・ベ−ス検索システム

Info

Publication number
JPS62191922A
JPS62191922A JP61301941A JP30194186A JPS62191922A JP S62191922 A JPS62191922 A JP S62191922A JP 61301941 A JP61301941 A JP 61301941A JP 30194186 A JP30194186 A JP 30194186A JP S62191922 A JPS62191922 A JP S62191922A
Authority
JP
Japan
Prior art keywords
access
data
node
statistical information
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61301941A
Other languages
English (en)
Other versions
JPH07113924B2 (ja
Inventor
サクテイ・パダ・ゴーシ
レイモンド・アマンド・チヤールズ・ローリイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPS62191922A publication Critical patent/JPS62191922A/ja
Publication of JPH07113924B2 publication Critical patent/JPH07113924B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Complex Calculations (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 A、産業上の利用分野 本発明は、データ・アクセス方法と、該アクセス方法を
実現する物理的なデータの編成、つまり構造を持つデー
タ・ベース検索システムに関する。
さらに詳しくは、統計処理のためのデータ・アクセスを
促進する構造を持つデータ・ベース検索システムに関す
る。
B、従来技術 データ・ベース管理システム(DBMS)には、データ
・モデル、データ定義言語、データ操作言語、照会言語
、データ・アクセス方法、照会オプテイマイザ、並行お
よびロッキング機構等の多くの重要な構成要素がある。
これらの構成要素のすベては、データ・ベース管理シス
テムの望む特性に寄与する。データ・ベース管理システ
ムの基礎的な概念の多くは、DBMSについてのどの標
準的な教科書にも記述されている。例えば、Ghosh
S、、Data Ba5e Drganization
 for DataManagement、  Pub
lished  by  Academic  Pre
ss。
New York(1977) ; Date C,J
、。
^n Introduction to Databa
se Systems。
Published by Addison −Wes
ley、 Reading、 Mass。
(1977)  ; Wiederhold G、、D
atabase Design。
Published by McGraw −Hill
、New York(1977)のような文献がある。
DBMS製品の説明の多くは、様々なベンダーによって
配られるマニュアルの形で入手できる。
リレーショナル・モデルに基づ<DBMS製品が開発さ
れてきているが、いくつかの製品についての優れた要約
が、Kim L、 ”Re1ational Data
baseSystems、” Computing 5
urvey、 Published byACM、、 
Vol、 11 、 Ha 3、pp、185−211
(1979)に記されている。
DBMSの構成要素のうち、アクセス方法および該方法
を実現する構造は、記憶媒体上のデータのビットおよび
パイ1〜の編成と、ホスト・プロセッサからのI10要
求への応答とについて責任を持つ。
索引順次探索に基づ<ISAM(システム360オペレ
ーテイング・システム、索引順次アクセス方式(プログ
ラミング・ロジック)、IBM(登録商標)フオームY
28−6618(1975a))。
およびBツリー(Bayet R,and McCre
ight C,。
”Organization and Mainten
ance of LargeOrdered Inde
xes”、 Acta、 Inf、 Vol、 1、魔
3、pp、173−189  (1972))に基づ<
VSAM (O8/VS仮想記憶アクセス方式(VSA
M)プログラミング、ガイド、IBMフオームGC26
−3838(1975b))が創作されて、コンピュー
タに記憶されているファイルの中の情報の探索が促進さ
れるようになった。これらのアクセス方法によって、デ
ータ・ベースから情報を検索するのに要する探索時間が
大幅に減少した。
これらの従来のアクセス方法のすべては、xXXに等し
いキーを持つレコードを見つけたり、述語(Predi
cate)P(A)を満たすすべてのレコードを見つけ
たりあるいは値xxxxの属性Aを持つレコードを更新
したりするという、論理的な情報処理を促進するために
設計されていた。商業的なアクセス方法で実現されたも
の以外にも、多くの探索技術がある(Knuth D、
、 The Art of ComputerProg
ramn+ing、 Vols、 1.2.3、Pub
lished byAddison −Wesley 
Publ、 Go、v Reading、 Mass。
(1968))。
しかしながら、すべてが論理的な情報処理の効率を向上
させるように設計されている。したがって、既存のアク
セス方法の何れを使っても1編成されたレコードから属
性の平均値を計算しようとすれば、ファイルの中のすべ
てのレコードが処理されなければならず、時間の大きな
浪費である。
一般に、論理処理用に設計されたシステムでは、平均値
の計算のような統計的な情報処理が遅い。
統計情報処理には多くのタイプがある(Kendall
M、G、&  5tuart  A、l  The  
Advance  Thaory  ofStatis
tics、Vol、1、Published  by 
 CharlesGriffin & Company
、 London(1958)およびKendall 
 M、G、&  5tuart  A、、The  A
dvanceTheory  of  5tatist
ics、Vol、2 、Published  byH
afrer Publishing Co、New Y
ork、(1961))。
これらのほとんどは、多くの個物(individua
l)、通常はファイルの個物(レコード)のすべてに基
づいて、ある数の関数の計算を処理しなければならない
。これでは統計計算に時間がかかつてしまう。統計計算
の例としては、パラメータの推定。
曲線のフィッティング、統計的要約(周波数分布。
モーメント、表による表現の計算)、仮説の統計的検証
、サンプリング、実験の統計的設計、統計的連想手段、
統計的予測等がある。統計的な情報処理の最終結果は数
であり、精度が関連することに注意すべきである。
統計的な情報処理に関連する基本的な要素は、処理に要
する時間である。コンピュータ科学の主要な目標の1つ
は、処理時間を最小にすることである。これは、通常、
記憶空間への要求と取り引きすることにより達成される
。統計的計算では、精度も時間最小化のための基本的な
取引材料である。
C0発明が解決しようとする問題点 統計的照会における時間、空間、および精度の兼合をと
るこのような能力を認めて、本発明は、自分の中に記憶
されるレコードに関する統計的照会の処理を促進するデ
ータ・アクセス構造を持つデータ・ベース検索システム
を提供する。
本発明によれば、該構造は、少なくとも1つの属性を共
通して持つレコードを記憶する複数のデータ・ノードと
、複数のアクセス・ノードからなる。各アクセス・ノー
ドは、別のアクセス・ノードまたはデータ・ノードを指
すポインタを少なくとも1つ持つ。アクセス・ノードは
、それぞれが少なくとも1つのデータ・ノードと関連す
るように編成する。各アクセス・ノードには統計的情報
が記憶される。統計的情報は、アクセス・ノードに直接
または間接につながるすべての後続のデータ・ノードに
記憶されているレコードの総個数および前記共通の属性
に関してこれらのレコードが含むすべての属性値に関連
する情報の少なくとも一方である。
さらに、データ・ノードに記憶されるレコードの変更に
応じて、アクセス構造に記憶されている統計的情報を更
新する手段が提供される。
本発明は、様々な階層的および非階層的アクセス方式に
よる実現に適している。そのようなアクセス方式には、
Bツリーに基づくもの、ISAM。
IBM  VSAM(7)RRDS (相対し/ml−
ド・データ・セット)、およびIBM  IMS(情報
管理システム)のHDAM (階層直接アクセス方式)
%式% データ・アクセス構造のアクセス・ノードに関連して統
計的情報を維持するようにしたので、アクセス構造のノ
ードのサブセットから統計的情報を読み取ることにより
、統計的照会を解決することができる。その結果、統計
的照会の処理に要するアクセス時間が大幅に削減される
。精度の良さが求められる照会については、ユーザがア
クセス構造をはるばる下がって現実のレコードへ進むこ
とができる。そうするとことによって、情報の紛失を防
ぐ。加えて、統計的情報の更新手段を適用して、構造中
のどのレベルでも望む精度を維持することができる。
D、実施例 図面を参照して、本発明の実施例を詳細に説明する。
第1図は、本発明を実現し得るデータ処理システムの簡
単な説明図である。データ処理システムは、通信チャネ
ルまたは人間が操作するキーボードのようなデータ・ソ
ース10を含む。データ・ソース10は、ユーザの指定
に応じ、プロセッサ11と交信してデータを処理する。
典型的な場合。
プロセッサ11は直接アクセス記憶装置12(DASD
)と交信する。DASD12は、プロセッサ11が与え
たデータを不揮発性記憶に維持する。
プロセッサ11は、アクセス構造に従ってデータを編成
するとともに、チャネル13を越えて制御情報を与える
第1図に示すシステムは、説明のために大幅に簡略化し
たものである。本発明は、プロセッサ11が維持する通
りに、DASD12上でデータを編成することに関する
。典型的なシステムでは、複数のプロセッサと非常に多
くの数の記憶装置を含んで差し支えない。
第2図は1本発明によるデータ・アクセス構造20を示
す。該構造は、その中に記憶されているレコードに関す
る統計的照会の処理を促進するためのものである6デー
タ・レコードは、複数のデータ・ノード、例えばデータ
・ノード21に記憶される。また、アクセス構造20は
、複数のアクセス・ノード、例えばアクセス・ノード2
2を含む6各アクセス・ノードは、アクセス情報ACC
を記憶する。ACCの例は、別のアクセス・ノード、ま
たはデータ・ベースを指す少なくとも1つのポインタ、
またはそれらの識別子である。アクセス・ノードは、各
アクセス・ノードが該構造中の少なくとも1つのデータ
・ノードに関連するように編成される。ポインタは、第
2図において、アクセス・ノードから別のアクセス・ノ
ードへ、あるいはアクセス・ノードからデータ・ノード
へ至る線で表わされる1本発明によれば、各アクセス・
ノードに記憶される統計的情報5TATは。
該アクセス・ノードの直接または間接の後続データ・ノ
ードに記憶されているレコードに関連する情報である。
第2図に示される構造は、レベル0からレベル4までの
ラベルを付けられた複数個のレベルを含む。このような
レベル記述を一般化して、各レベルをレベルi (i=
o〜n)どして示す列表記が可能である。第2図に示さ
れるインプレメンテ−ジョンでは、nが4に等しい。レ
ベルOはルート・アクセス・ノード23であり、レベル
1のアクセス・ノード22.24.25を示すポインタ
を記憶する。
レベルi  (i=o、・・・・、n−1)の各アクセ
ス・ノードは、レベル(i+1)のアクセス・ノードの
サブセットを指すポインタを持つ。しだがつて、レベル
1のアクセスCノード22は、レベル2のアクセス・ノ
ード26.27.28を指すポインタを記憶する。レベ
ル2のアクセス・ノード27は、レベル3のアクセス・
ノード29等を指すポインタを含む。
レベル3のアクセス・ノード29は、レベル4のデータ
・ノード21,30.31を指すポインタを記憶する。
このように、実際にレコードを維持するデータ・ノード
を記憶するのはレベルnであることがわかる。
統計的情報(S ’T A T )は、アクセス・ノー
ドおよびデータ・ノードのサブセットに関連する。
第2図に示される実施例においてサブセットに含まれる
のは、データ・アクセス構造20を構成するすべてのア
クセス・ノードとデータ・ノードである。ユーザは、本
発明の適用を図ることにより、記憶空間、精度およびア
クセス時間の間の希望する兼合に応じて1例えば該構造
の1つのレベルだけで、統計的情報を保持することがで
きる。
第2図に示されるように、統計的情報は、記憶装置のア
クセス・ノードに含まれるレコードに記憶される。した
がって、アクセス・ノードに1回アクセスすると、アク
セス構造を通って実際のデータへ導くポインタの他に、
統計的情報が得られる。
第3図は、統計的情報をアクセス・ノードと関連づける
代替手段を示す。特に、第3図のノード35のようなア
クセス・ノードは、構造中のアクセス・ノードを指す索
引ポインタINDEX  PNTR8の他に、統計的情
報5TATを指すポインタ5TAT  PNTRを記憶
する。統計的情報5TATは、記憶装置において、統計
ポインタ5TAT  PNTRによって指示される位置
36に記憶される。この代替手段によれば、アクセス構
−造の空間を節約できるけれども、アクセス・ノードに
関連する統計的参照を処理するために、付加的なアクセ
スを要する。
第2図に示されるような、データ・ノードも自身に関連
する統計的情報を持つアクセス構造では、第3図に示さ
れるような統計ポインタを使って、統計的情報をアクセ
ス・ノードに関連づけることができる。
第2図に示されるようなアクセス構造は、第1図に示さ
れるDASD12のようなディスク・ドライブの数個の
連続するシリンダに記憶させておくことができる。デー
タ・ノードは、データ記憶システムにおいて、アクセス
構造によって示される位置に記憶される。統計的情報は
、第2図を参照して記述したようなアクセス構造によっ
て、該統計的情報が関連する特定のアクセス・ノードと
同じシリンダに、そして同じアドレスに記憶することが
できる。別の場合、統計的情報は、該アクセス構造と隣
接する数個のシリンダに、関連する統計的情報を指す該
構造中のポインタを使って記憶することができる。
上述のように、第1図に示されるプロセッサ11の働き
は、データ・ノードの中に記憶されるレコードが挿入さ
れたり、変更されたり、削除されたりするときに、第2
図に示される階層構造20のようなアクセス構造を維持
することである。アクセス構造を維持する1つのよく知
られている方法は、Bツリー(B天水)と呼ばれる。B
ツリー・データ編成は、Jeffrey D、 Ull
man、 Pr1nciplesof Databas
e Systems、 5econd edition
、ComputerScience Press(19
82)、Pages58−65によく書かれている。本
発明によれば、プロセッサ11が、実行中に階層的デー
タ構造20において統計的情報5TATを維持する。
第4図と第5図は、本発明によるアクセス・ノードとデ
ータ・ノードのそれぞれのフォーマットを示す。第4A
図はアクセス・ノードを示す。維持される統計的情報5
TATは、特定のアクセス・ノードが関連するデータ・
ノードに記憶されるレコードの数nと、例えばn個のレ
コードのそれぞれの属性Xの和Sである。統計的情報は
、Xの2乗の和、中央値、モード、nの範囲の周波数分
布、多変量統計、またはその他の、データ・ベースを用
いて処理される可能性のある統計的参照の処理を容易に
する情報も含み得る。
統計的情報5TATは、5TAT−RECIと5TAT
−RFe5を含むフオームで維持される。
5TAT−RECIは、アクセス・ノードのための現在
の統計的情報を維持する。5TAT−RFe5は、統計
的情報の最後に進められた(プロモートされた)バージ
ョンを記憶する。該バージョンの情報は、n′、および
に=1〜n′についての属性X′の和S′として示され
ている。したがって1階層的構造において、レベルiに
ある所定のノードについての5TAT−RECIは、該
所定のノードと関連するレベル(i+1)のノードから
得られる5TAT−RFe5の値から生成される。最後
に進められたバージョン5TAT−RFe5の使用は、
アクセス構造で統計的情報を維持する方法に関して、以
下で説明される。
アクセス構造を通って導くアクセス情報ACCは、第4
図に示されるアクセス・ノードの2番目の部分に記憶さ
れる。Bツリーのような階層的索引に基づくアクセス構
造では、アクセス情報ACCが、各ポインタに関連する
索引値を含む。例えば、索引1、ポインタ1といった具
合である。例えば、索引は、ポインタ1によって指示さ
れる階層的構造の下のノードに関連するデータ・ノード
に記憶されるレコードについての値の範囲、すなわち最
大値を識別する。同様に、アクセス・ノードの2番目の
エントリは、索引12とポインタ2を含む。アクセス構
造に従って、以下同様である。
第5図は、データ・ノードの編成を示す。本実施例での
データ・ノード中の統計的情報S TATは、現在の統
計的情報5TAT−RECI、および最後に進められた
バージョンである5TAT−RFe5を維持する。5T
AT−RECIは、データ・ノードのレコードにおける
現実の変化に応じて計算される。データは、P個の属性
xIK、X  、・・・・、XpKを各レコードrに関
連づけ2に るテーブルの形で維持される。ここで、に=1〜nであ
る。第5図のデータ・ノードで、5TAT−RECIは
nを記憶するが、これはデータ・ノードに維持されるデ
ータ・レコードの数を識別する。
このようにして、複数のレコードがデータ・ノードのデ
ータ部に記憶されて、属性X   (j=15に 〜P、に=1〜n)が備えられる。
第6図は、3レベルのBツリー・データ構造の例である
。ここでは、本発明に従って、統計的情報が第4図、第
5図に示すように編成されている。
レベル0のルート・アクセス・ノード50は、統計的情
報のコピーを1つだけ維持している。すなわち、nと、
K=1〜nについての属性XIKの値の和である。ルー
ト・アクセス・ノード50に関連するアクセス情報は、
属性の値の範囲の標識(インディケータ、図示の例では
最大値)と、レベル1のアクセス・ノードの位置のポイ
ンタ、または他の識別子を含む。なお、子ノードでは、
前記標識によってアクセス構造が編成される。
第6図に示す実施例では、ルート・ノード50に5個の
ポインタがあり、矢印で示すようにレベル1にあるペー
ジP2、R3、R4、R5、R6のすべてを指している
。レベル1のアクセス・ノード51.52.53.54
.55は、図面でSR1と記す現在の統計的情報STA
T−RECIのコピーと、図面でSR2と記す最後に進
められたバージョン5TAT−REC2のコピーを記憶
する。Pl、つまりルート・アクセス・ノード50に記
憶される数nは、レベル1のアクセス・ノードについて
の統計的情報のバージョンSR2に記憶されるn′の値
の和であることがわかる。つまり、79は14.20.
15.20.10の和に等しい。さらに、ルート・アク
セス・ノード50に記憶されるxIKの和の値Sは、レ
ベル1のアクセス・ノードのSR2からとった、最後に
進められたバージョンS′の和に等しい。
レベル1の各アクセス・ノードは、データ・ノードを指
すポインタを含む。図面では、R2というラベルのつけ
られたアクセス・ノード51からのポインタだけが説明
されている。図面かられかるように、アクセス・ノード
51には4個のポインタがあり、それぞれR7,R8、
R9、PLOを指している。アクセス・ノード51のS
R1に記憶されている統計的情報は、ページP7、R8
、R9、PLOにそれぞれ記憶されているデータ・ノー
ド56.57.58.59に記憶されている統計的情報
の要約である。特に、データ・ノードに記憶されている
バージョンSR2の和である。
したがって、14は4.3,4.3の和に等しく、13
3は24.24.45.4oの和に等しい。
データ・レコードがセットアツプされたとき、または定
常状態にあるときは、統計的情報のバージョンSR2が
、現在のバージョンSRIに等しい。第6図はその例で
ある。
第6図のアクセス構造を用いて平均を計算する場合、ユ
ーザは値n(レコードの数)とS(属性XIKの値の和
)をルート・アクセス・ノードが検索しなければならな
い。平均はS / n、つまり図の例だと2483/7
9に等しい。
第6図のアクセス構造に記憶された属性の平均を計算す
る場合、ルート・アクセス・ノード50がアクセスされ
て、統計的情報n、Sが検索される。平均はS / n
、っまり2483/79に等しい。データ・レコードが
変更された結果、レベル2のノードのSRIとSR2が
異なるならば、レベル2のノードのSRIに記憶されて
いる統計的情報を検索して、一層良い精度を得ることが
できる。
下記第1表の中央値を計算するアルゴリズムは、本発明
によるソーティングに基づく統計的参照の計算を説明し
ている。
第1表 中央値の計算 CET n fron+ 5TAT−RECin ro
ot pageSET  m、  = [(n+1)/
2]SET va = 0 3ET P = pointer to root a
ccess nodeDo Wt(ILE (P po
ints to an access node)CA
LL 5UBROUTINE (+o、LII1.P)
SUBROUTINE: PROC(町−、P)DOW
HILE m < m6 Scan in ascending order t
he 5TAT−REC2inpages point
ed to by theindices in th
e 5canned access node。
SET P to pointer of node 
examined;S[ET m = m + n (
from 5TAT−RECof node);END
 DOt、oop; SET m = m −n (from root n
ode);END 5UBROUTINE END DOLOOP Go TOthe (mo −m)th data r
ecord in node pointed to 
byP、  The median is equal
 to the value of theAttri
bute from the retrieved r
ecord。
第6図の例では、中央値が次のように計算される。
ff1o = (79+1)/2 :40;P=P2に
ついて、m=0+14=14;P=P3について、m 
= 14 + 20 = 34;P=P4について、r
s = 34 + 15 ” 49;49 ) 40だ
から、m=49−15=34にセットする。
lfio−m = 40−34 = 6;つまり、中央
値は、R4の6番目のレコードの属性の値に等しい。
統計的情報は、データ・ノードに記憶されているレコー
ドの変更に応じてBツリーに維持される。
記憶機構に関連するプロセッサ11のソフトウェアは、
本実施例において下記のようにして統計的情報を維持す
る。
第7図は、ページ1とページ2の2つの索引ページ、お
よびデータ・ページである。ページ3を、第2図のよう
な階層的構造を示している。ページ1はnlとS工を記
憶するルート・アクセス・ノードである。ページ2は、
SRIとn2と82を記憶し、SR2にn′2とS12
を記憶するアクセス・ノードである。データ・ノード・
ページ3では、n、とS、がSR,に記憶され、n /
、とS′、がSR2に記憶される。
データ・ページに新しいレコードが付加されると、デー
タ・ページの5TAT−RFe5が更新される。属性X
の値Vを持つあるレコードがページ3に付加された場合
を想定すると、n′、とS /3の新しい値は次のよう
になる。
n′□=n’、+1; S ’ 、=S’ 3 ” v; データ・ノードにおける新しいレコードの付加に応答す
る統計的情報を更新するためのアルゴリズムの概要は、
下記第2表の通りである。
第2表 Do while (add new record 
having value V) :n’ 3 ” n
’ 3 ” t; S’ 3 ” S’ 3 ” v: If (n’ ) −R3)/n、 > thresh
old; or(S’ :l −S、)/S、 > t
hresholdThen  oo:  n’  z”
n’  z”n’  s−n   a;  S’  z
”s’  t”s’  s  −S3;E、、、  n
a=n’ :I; S3”S’ i; E″ND Do
 Loop:アクセス・ノードにもデータ・ノードにも
同じアルゴリズムが適用可能である。
削除アルゴリズムは、レコードが削除される場合に、統
計的情報n′1、S l、の値が次のように更新される
点を除き、更新アルゴリズムと同じである。
n′、=n′3−1 S’ 、=S’ 、−D; ページ3にレコードが挿入される結果、該ページが、第
8図のように、つまりBツリーの分裂のように、ページ
4とページ5の2ページに分裂すると想定する。ここで
、n′、はR4とn、に分裂し、S/、はS4とS、と
に、それぞれ次の関係を満たすように分裂する。
n’  、:n噛 + R5 s’ 、=s4+  s。
挿入アルゴリズムでは、n /、とS′、を使って計算
する場合、n/2とS/2についての式は同じになる。
ページ4とページ5のパラメータを使う場合の新しい式
は次の通りである。
n’z=n’、+  n、+  n、  −n。
S’、=S’、+  84 +  Ss  −S。
更新は挿入と削除の組合せである。したがって、更新ア
ルゴリズムは、前述の挿入アルゴリズムと削除アルゴリ
ズムの組合せになる。
ユーザは、上記更新アルゴリズムで関係するしきい値を
選択することにより、統計的情報の精度と、情報の流れ
を維持するのに要する時間との兼合いをとることができ
る。しきい値は、維持される統計的情報の種類によって
違っていてもよいし、アクセス構造のレベルによって違
っていてもよい。
次に述べる例は、属性Xの平均に関係する統計的情報に
ついてのしきい値の選び方を説明するものである。
更新前の平均Mが(s1+s、+・・・・+S、)/n
によって与えられると想定する。1以上のデータ・ノー
ドに記憶されているレコードの更新の際、和のエントリ
S  、、S  、   ・・・・、S が、デに−J
      k−J+l”          k−タ
・ページにおいて、s’、、s’。
k−J    k−J+1 ” ・・、S′、に変更されると想定する。
その場合、更新後の真の平均MUは次のように表現でき
る。
Mu ” (s、+s、+、、、+5k−j−1+s’
 k−j+s/ k−j、t+−+3’ k)/(nt
”ni+、、、+n、j、 411’に−j+y1’に
−j+ビ°、+、/ k)= (M+e  /n)/(
1+e  /n)S        n =(M+e /n) (1−e /n)−’S    
   n ここで、es” (S′に−j −8k−j”(S′に
−j+l −8k−j+1”””(S′k −”’h)
en” (n’に−j =に−j”(n’に−j+l 
−nk−j41”””(n’k −nk)である。
したがって、MUの概算は次のようにして求める。
MU=(M + s、/n) (1−eo/n)= M
 + e /n −M(e /n)  +  (e  
−e  )/n’s           n    
       snこの結果、更新前の平均Mを更新後
の真の平均MUの概算として使った場合に生じる相対誤
差Eは、次のように表わされる。
E = e /nM −e /n + (e ee )
/Mn”s          n         
 snしたがって、和の誤差eについてのしきい値がα
 と等しくなるように選ばれ、かつ、カウントの誤差e
についてのしきい値がα と等しくなるn      
                        n
ように選ばれた場合、ルート・ノードに記憶される5T
AT−RFCから概算した平均に与える。
選択されたしきい値の影響を、次のように表わされる。
α/nM−α/n+ α α7M s            n          n
s実際的には、アクセス・ノードよりもデータ・ノード
において、「和」についてのしきい値を高く設定し、逆
にrカウントJについてのしきい値を低く設定すること
ができる。したがって、データ・ノードでは、和につい
て相対誤差の10%をしきい値として設定するとともに
、カウントについて相対誤差の1%をしきい値として設
定することができる。次に高いレベルのアクセス・ノー
ドのしきい値は、和について8%または9%を設定し、
カウントについて2%または3%を設定することができ
る。このプロセスは、アクセス・ノードの連鎖中で繰り
返すことができる。したがって、5または6レベルの索
引を持つ場合、この例に従って、ルート・ノードのカウ
ントについてのしきい値は10%もの高さとなり、和に
ついてのしきい値は1%もの低さとなる。
属性X1−平均の計算についての上記例のように、本実
施例では統計的情報が維持され、それに基づいてアクセ
ス構造が編成される。他の実施例では、統計的情報の中
に、レコードの他の属性、または属性の組合せから導い
た統計資料を含めることができる。
E0発明の効果 本発明によれば、アクセス・ノードをアクセスするだけ
で統計的情報が得られるので、統計的計量が大幅に減少
するという優れた結果が得られる。
【図面の簡単な説明】
第1図は、データ・ベース・システムの要素を示す簡単
な概観ブロック図である。 第2図は、本発明によるデータ・アクセス構造の説明図
である。 第3図は、第2図に示すような構造におけるノードに統
計的情報を関連させる代替手段の説明図である。 第4図は、本発明の一実施例によるアクセス・ノードの
構造の説明図である。 第5図は、本発明の一実施例によるデータ・ノードの構
造の説明図である。 第6図は1本発明に従って実現されるBツリー・アクセ
ス構造の説明図である。 第7図は、アクセス構造中のアクセス・ノードに関連す
る統計的情報の更新の説明図である。 第8図は、本発明に従って実現されるBツリー構造に新
しくデータ・ページを挿入した後にノートが分裂する様
子の説明図である。 出願人  インターナショナル・ビジネス・マシーンズ
・コーポレーション 代理人  弁理士  頓  宮  孝  −(外1名)

Claims (1)

  1. 【特許請求の範囲】 プロセッサをデータ記憶装置とデータ・ソースとに接続
    してなるデータ・ベース・システムにおいて、 前記記憶装置に、少なくとも1つの属性を共通して持つ
    レコードを記憶する複数個のデータ・ノードと、データ
    ・ノードにアクセスするための索引として機能する複数
    個のアクセス・ノードとを、アクセス・ノードに記憶さ
    れる少なくとも1つのポインタが別のアクセス・ノード
    またはデータ・ノードを指し、かつどのアクセス・ノー
    ドも少なくとも1つのデータ・ノードを直接または間接
    の後続ノードとして持つように編成して設け、前記アク
    セス・ノードのそれぞれに、該アクセス・ノードに直接
    または間接につながるすべての後続のデータ・ノードに
    記憶されているレコードの総個数および前記共通の属性
    に関してこれらのレコードが含むすべての属性値に関連
    する情報の少なくとも一方を記憶させる手段と、 前記データ・ノードに記憶されるレコードの変更に応じ
    て、前記アクセス・ノードに記憶されている前記情報を
    更新する手段とを備えた ことを特徴とするデータ・ベース検索システム。
JP61301941A 1986-02-14 1986-12-19 データ・ベース検索システム Expired - Fee Related JPH07113924B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US82973086A 1986-02-14 1986-02-14
US829730 1986-02-14

Publications (2)

Publication Number Publication Date
JPS62191922A true JPS62191922A (ja) 1987-08-22
JPH07113924B2 JPH07113924B2 (ja) 1995-12-06

Family

ID=25255392

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61301941A Expired - Fee Related JPH07113924B2 (ja) 1986-02-14 1986-12-19 データ・ベース検索システム

Country Status (3)

Country Link
EP (1) EP0235525B1 (ja)
JP (1) JPH07113924B2 (ja)
DE (1) DE3751388T2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2148576T3 (es) * 1995-01-26 2000-10-16 Hans Verner Thorsen Metodo y sistema de acceso a datos.
GB2315889A (en) * 1996-07-31 1998-02-11 Ibm Locating and sampling of data in parallel processing systems
EP1127059B1 (en) 1998-11-03 2008-02-20 Nycomed GmbH Imidazonaphthyridines
US7633886B2 (en) 2003-12-31 2009-12-15 University Of Florida Research Foundation, Inc. System and methods for packet filtering
CN101937365B (zh) 2009-06-30 2013-05-15 国际商业机器公司 并行程序的死锁检测方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
IBM RESEACH LABORATORY=1985 *

Also Published As

Publication number Publication date
DE3751388D1 (de) 1995-08-10
DE3751388T2 (de) 1996-03-07
JPH07113924B2 (ja) 1995-12-06
EP0235525B1 (en) 1995-07-05
EP0235525A2 (en) 1987-09-09
EP0235525A3 (en) 1992-04-08

Similar Documents

Publication Publication Date Title
US5265244A (en) Method and system for facilitating processing of statistical inquires on stored data accessible through a data access structure
US6470330B1 (en) Database system with methods for estimation and usage of index page cluster ratio (IPCR) and data page cluster ratio (DPCR)
US5926820A (en) Method and system for performing range max/min queries on a data cube
US7103588B2 (en) Range-clustered tables in a database management system
US6009432A (en) Value-instance-connectivity computer-implemented database
US6356913B1 (en) Generic (database-independent) and dynamically-modifiable schema
US5440730A (en) Time index access structure for temporal databases having concurrent multiple versions
US6725223B2 (en) Storage format for encoded vector indexes
AU2002249161B2 (en) Data structure for information systems
US20040133581A1 (en) Database management system, data structure generating method for database management system, and storage medium therefor
Shen et al. The TP-Index: A dynamic and efficient indexing mechanism for temporal databases
US8375012B1 (en) Computer indexes with multiple representations
EP2414963A2 (en) Dynamic hash table for efficient data access in a relational database system
JP2007531115A (ja) 永続的でユーザアクセス可能なビットマップ値を有するデータベース管理システム
Kouramajian et al. The time index+ an incremental access structure for temporal databases
Riedewald et al. pCube: Update-efficient online aggregation with progressive feedback and error bounds
Gou et al. A/sup*/search: an efficient and flexible approach to materialized view selection
Srivastava et al. TBSAM: An access method for efficient processing of statistical queries
Park et al. A new query processing technique for XML based on signature
JPS62191922A (ja) デ−タ・ベ−ス検索システム
US20030225759A1 (en) Converting expressions to execution plans
Yazıcı et al. An indexing technique for similarity-based fuzzy object-oriented data model
Yang et al. Querying a collection of continuous functions
Rowe Management of regression-model data
Sellis et al. Expert database systems: Efficient support for engineering environments

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees