JPH01258128A - レコード格納管理方法 - Google Patents

レコード格納管理方法

Info

Publication number
JPH01258128A
JPH01258128A JP63086944A JP8694488A JPH01258128A JP H01258128 A JPH01258128 A JP H01258128A JP 63086944 A JP63086944 A JP 63086944A JP 8694488 A JP8694488 A JP 8694488A JP H01258128 A JPH01258128 A JP H01258128A
Authority
JP
Japan
Prior art keywords
division
evaluation value
record
records
column
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63086944A
Other languages
English (en)
Other versions
JPH0727485B2 (ja
Inventor
Haruo Hayamizu
速水 治夫
Ichiro Itakura
板倉 一郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP63086944A priority Critical patent/JPH0727485B2/ja
Publication of JPH01258128A publication Critical patent/JPH01258128A/ja
Publication of JPH0727485B2 publication Critical patent/JPH0727485B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 【産業上の利用分野〕 本発明は関係データベース等のレコード群分割方法に係
り、詳しくは、 lll1−のカラム構成を持つレコー
ドの集まりを1分割制御用として指定された複数のカラ
ムの値とそれらの重み付け情報に基づいて複数のレコー
ドの集まりに分割する方法に関する。
〔従来の技術〕
関係データベース等では、検索時間の短縮のためにレコ
ード群の分割格納が行われる。
第7v4は従来方法のレコード群の分割例を示したもの
である。同図において、レコード群1は分割前の状態で
あり、8個のレコードはそれぞれカラムA、B、C,D
の同一のカラム構成をとる。
分割制御用としてカラムB、その値を3と指定すること
により、レコード群1はカラムBの値が“3”以下のレ
コードからなるレコード群2と、カラムBの値が“3”
より大きいレコードからなるレコード群3に分けられる
。ニーで、分割を決める値(本例では″3”)は、分割
した両レコード群のレコード数が均等に成るように選ば
れるのが普通である。
この様に、カラムの値によってレコード群を複数の小さ
いレコード群に分割することをクラスタリングと呼び、
分割された各レコード群をクラスタと呼ぶ、カラムの分
割値を管理するために2分木(ツリー)が用いられ、2
分木の分岐点を節点と呼ぶ。第7図では、各クラスタの
レコード数は4としている。
第7図の例において、カラム値を指定した条件(例えば
カラムBの値が′2″である)を満足するレコードをレ
コード群から検索することを考える。レコード群の分割
が行われていないレコード群1を検索する場合は、8個
のレコードのカラムBの値が′2″′であるかを比較し
なければならない。ところが、カラムBの値が3で分割
されていれば、カラムBの値が′3”以下のレコードか
らなるレコード群2の4個のレコードのみを比較すれば
よい。このように、レコード群の分割を事前に行うこと
により、分割制御用カラムの値を指定した検索の処理時
間を短縮することが可能となる。
レコード群にはレコードが追加されることがある。第8
図はレコードが追加された場合の分割例を示したもので
ある0本例においては、第7図のレコード群3に相当す
るレコードが4個追加されている。こ−では、各クラス
タのレコード数は4としているため、第7図のレコード
群3相当のレコードを何らかの方法で再分割しなければ
ならない。第8図では、もう1つの分割制御用カラムで
あるカラムCの値(“6″′)に基づいて分割し、新た
なレコード群3、レコード群4に分割している。
第8図のように、複数のカラムが分割制御用として指定
されている場合をマルチキークラスタリングと呼ぶ、マ
ルチキークラスタリングの場合、複数の分割制御用カラ
ムを交互に用いて分割していく方法がよく採られる。
第9図は更にレコードが追加された場合の分割例を示し
たものである。本例においては、第8図のレコード群4
に相当するレコードが4個追加されている。このため、
第8図のレコード群4相当のレコードを、カラムBの値
(“8”)に基づいて分割し、新たなレコード群4.レ
コード群5に分割している。
〔発明が解決しようとする課題〕
第9図の例において、各クラスタへの節点数がクラスタ
によって異なっている。即ち、レコード群2へはカラム
Cの値が“3″を越えるかの1節点のみであるが、レコ
ード群3へは2節点、レコード群4、レコード群5へは
3節点である。このように、節点数の最大値と最小値が
2以上異なる場合を2分木がアンバランスであるといシ
、そうでない場合をバランスしているという0元のレコ
ード群に複数回レコードが追加されると2分木にアンバ
ランスが生じ易い。
2分木がアンバランスである場合、検索条件が指定され
てから該条件を満足するクラスタを決めるまでに判定し
なければならない節点数の最大値は、バランスしている
場合のそれより大きい。検索時間を短縮する場合、最大
値を小さくすることが最も重要である。この為、アンバ
ランスが生じた場合、バランスさせる処理が必要になる
分割制御用カラムが1つであるシングルキークラスタリ
ングの場合は、2分木のバランス化は容易であり、その
アルゴリズムは、例えばN 1klausW i r 
t h著、片山卓也訳、[アルゴリズム子データ構造=
プログラム」、日本コンピュータ協会、PP215−2
25に示されている。一方、マルチキークラスタリング
の場合においては、従来の分割方法では、各クラスタの
レコードを入れ換えなければバランス化することはでき
ない。これを第9図の例について示すと第10図のよう
になる。
通常、レコード群は2次記憶装置にクラスタ単位で格納
されているため、クラスタのレコードを入れ換える処理
は、多数回の2次記憶装置アクセスを必要とするため長
時間を要する。
本発明の目的は、マルチキークラスリングにおいて、レ
コードの追加により2分木にアンバランスが生じた場合
に、各クラスタのレコードを入れ換えることなしにバラ
ンスさせることを可能とするレコード群分割方法を提供
することにある。
〔課題を解決するための手段〕
本発明は、分割制御用として指定された複数のカラムの
値とそれらの重み付け情報に基づき1つの分割評価値を
作成し、その分割評価値に基づいて、同一のカラム構成
を持つレコードの集まりを複数のレコードの集まりに分
割する。
【作 用〕
本発明では、マルチキークラスタリングをシングルキー
クラスタリングに置換している。これにより、2分木が
アンバランスと成ったときにバランス化が可能である。
分割制御用として指定された複数のカラムの重み付け情
報が指定された場合、従来方法では、分割の節点に用い
るカラムの使用頻度を重要なカラムはど高くすることに
よって、所望の目的を果たしている。これに対し、本発
明では、各カラムの値に基づいて作成した部分分割評価
値に乗じる係数を、重み付け情報に基づき重要なカラム
程大きくする。これにより、レコード実体の入れ換え無
しに2分木の節点の分割値の交換だけで、2分木をバラ
ンス化させることが可能にある。
〔実施例〕
以下、本発明の一実施例について図面により説明する。
第1図は本発明の一実施例の概略構成図である。
ニーで、1は分割評価値作成付加部、2はレコード分割
部、3は元のレコード群の入力線、4は分割評価値付レ
コード群の転送線、5は分割後のレコード群の転送線で
ある。分割評価値作成付加部lの働きは、各レコード毎
に、分割制御用として指定された複数のカラムの値に基
づいて部分分割評価値を作成し、この部分分割評価値の
各々に予め定めた重み付け情報に基づく重み付け係数を
乗じて総和を求めて分割評価値とし、この分割評価値を
該当レコードに付加するものである。レコード分割部2
は従来と同様であるため、以下では詳しく述べない。
第2図は分割評価値作成付加部1の一実施例の詳細構成
図である。二へで、10は分割対象のレコード群の各レ
コードを保持するレコード保持レジスタ、11はレコー
ドから指定された分割制御用カラムを選択する分割制御
用カラム選択部、12は分割制御用カラム保持レジスタ
、13はレジスタ12の内容に基づき部分分割評価値を
作成する部分分割評価値作成部、14は部分分割評価値
保持レジスタ、15は指定された重み付け情報に基づき
重み付け係数を選択する重み付け係数選択部、16は重
み付け係数保持レジスタ、17は乗算器、18は加算器
、19は分割評価値の中間結果を保持する中間分割評価
値保持レジスタ、20は分割評価値を付加したレコード
を保持する分割評価値付きレコード保持レジスタである
第3図は第7図のレコード群1について、本実施例によ
る分割例を示したものである。二Nでは簡単のために、
部分分割評価値作成部13では該当カラムの値をそのま
5部分分割評価値とし、重み付け係数選択部15では重
み付け情報(カラムBはカラムCより2倍重要とする)
に基づきカラムBに対し“2″、カラムCに対しdl 
l 11を選択することNする。
以下の説明において、カラムAの値はユニークであるの
で、カラムAの値が■、■、■、・・・のレコードをレ
コード■、■、■、・・・と呼ぶことにする。
第3図に示すレコード群1のレコード■が分割評価値作
成付加部1に入力された後の処理手順を以下に示す。
(1)レコードのをレコード保持レジスタ10に保持す
る。
(…)分割制御用カラム選択部11はカラムBを選択し
、その値“1”を分割制御用カラム保持レジスタ12に
出力する。
(温)部分分割評価値作成部13はレジスタ12の値を
そのま一部分分割評価値1J 111とし。
部分分割評価値保持レジスタ14に出力する。
(fv)重み付け係数選択部15はカラムBに対する重
み付け係数“2″を選択し、重み付け係数保持レジスタ
16に出力する。
(V)乗算器17はレジスタ14.16の部分分割評価
値“1″と重み付け係数′2″とを乗算し、その乗算結
果“2”を出力する。
(vi)加算器18は乗算器17での乗算結果゛′2″
′と中間評価値保持レジスタ19に入っている初期値゛
′0′″とを加算して加算結果“2″′を得、中間分割
評価値保持レジスタ19に新しい中間分割評価値1(2
IIとして出力する。
(燵)レコード■のカラムCについて(n)〜(vi 
)と同様な処理を実行し、中間分割評価値保持レジスタ
19に新しい中間分割評価値(これは最終の分割評価値
になる)4″を出力する。
(vfn)レコード保持レジスタ10に保持されている
レコード■と中間分割評価値保持レジスタ19の分割評
価値“′4″°とを結合し、分割評価値付きレコード保
持レジスタ20に出力する。
以上の動作を繰返し、レコード■〜■に対しても分割評
価値を作成し付加する。この結果、第3図に示す分割評
価値付レコード群1が作成される。
この後は、従来と同様に、レコード分割部2において、
8個のレコードからなる分割評価値付レコード群1を分
割評価値の値が“14”以下のレコードからなるレコー
ド群2と1分割評価値の値が“14”より大きいレコー
ドからなるレコード群3に分割する。
第4図及び第5図は、従来の第8図及び第9図の場合と
同様に、レコードが順次追加された場合の分割例を示し
たものである。こ\で、第5図の分割例においては、従
来と同様に2分木にアンバランスが生じている。この場
合、第6図に示すように、2分木の各節点の分割値を交
換するだけで、レコード群2〜5のレコードを入れ換え
ることなく、2分木をバランス化させることが可能であ
る。
これは1つの分割評価値に基づいて分割していることに
よる。
以上の説明においては、部分分割評価値作成部13では
該当カラムの値をそのまN部分分割評価値としたが、こ
れは説明を簡単化するためであり、これに限られるもの
ではない。また、分割制御用カラムの数を2としたが、
これに限られるものではない。
〔発明の効果〕
以上説明したように、本発明によるレコード群の分割方
法においては、2分木のアンバランスが生じたときに、
レコード実体の入れ換え無しに2分水の分割値の交換だ
けで、2分木をバランス化させることが可能である。こ
れにより、2分木をバランス化させる場合に、レコード
交換のための2次記憶装置アクセスが不要となり、バラ
ンス化の処理時間が短縮される。
【図面の簡単な説明】
第1図は本発明の一実施例の概略構成図、第2図は第1
図における分割評価値作成付加部の詳細構成図、第3図
乃至第6図は本発明方法による分割例を示す図、第7L
!!i乃至第10図は従来方法の分割例を示す図である
。 1・・・分割評価値作成付加部、 2・・・レコード分割部、 10・・・レコード保持レジスタ、 11・・・分割制御用カラム選択部、 12・・・分割制御用カラム保持レジスタ。 13・・・部分分割評価値作成部、 14・・・部分分割評価値保持レジスタ、15・・・重
み付け係数選択部、 16・・・重み付け係数保持レジスタ、17・・・乗算
器、 18・・・加算器、19・・・中間分割評価値保
持レジスタ、20・・・分割評価値付きレコード保持レ
ジスタ。

Claims (1)

    【特許請求の範囲】
  1. (1)同一のカラム構成を持つレコードの集まりを、分
    割制御用として指定された複数のカラムの値とそれらの
    重み付け情報に基づいて複数のレコードの集まりに分割
    する方法において、 分割制御用として指定された複数のカラムの値とそれら
    の重み付け情報に基づき1つの分割評価値を作成し、該
    分割評価値に基づいて複数のレコードの集まりに分割す
    ることを特徴とするレコード群分割方法。
JP63086944A 1988-04-08 1988-04-08 レコード格納管理方法 Expired - Fee Related JPH0727485B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63086944A JPH0727485B2 (ja) 1988-04-08 1988-04-08 レコード格納管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63086944A JPH0727485B2 (ja) 1988-04-08 1988-04-08 レコード格納管理方法

Publications (2)

Publication Number Publication Date
JPH01258128A true JPH01258128A (ja) 1989-10-16
JPH0727485B2 JPH0727485B2 (ja) 1995-03-29

Family

ID=13900981

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63086944A Expired - Fee Related JPH0727485B2 (ja) 1988-04-08 1988-04-08 レコード格納管理方法

Country Status (1)

Country Link
JP (1) JPH0727485B2 (ja)

Also Published As

Publication number Publication date
JPH0727485B2 (ja) 1995-03-29

Similar Documents

Publication Publication Date Title
CA2150745C (en) Method and apparatus for implementing partial declustering in a parallel database system
US7213025B2 (en) Partitioned database system
US6772163B1 (en) Reduced memory row hash match scan join for a partitioned database system
US6141655A (en) Method and apparatus for optimizing and structuring data by designing a cube forest data structure for hierarchically split cube forest template
US7917512B2 (en) Method for automated design of range partitioned tables for relational databases
US6845375B1 (en) Multi-level partitioned database system
US7080072B1 (en) Row hash match scan in a partitioned database system
Omiecinski Performance Analysis of a Load Balancing Hash-Join Algorithm for a Shared Memory Multiprocessor.
JP2001331509A (ja) リレーショナルデータベース処理装置、リレーショナルデータベースの処理方法及びリレーショナルデータベースの処理プログラムを記録したコンピュータ読み取り可能な記録媒体
US7203686B1 (en) Partition join in a partitioned database system
Ceri et al. Optimization problems and solution methods in the design of data distribution
JPH021059A (ja) 連想検索システム
US8321420B1 (en) Partition elimination on indexed row IDs
WO2005043409A1 (ja) 表形式データの結合方法、結合装置およびプログラム
JPH01258128A (ja) レコード格納管理方法
JPH08235033A (ja) オブジェクト指向データベース管理システムにおける結合演算方式
Hardgrave A technique for implementing a set processor
JPH0644309A (ja) データベース管理方式
JP3061486B2 (ja) データソート処理システム
JP3630045B2 (ja) T木インデックス構築方法及びt木インデックス検索方法及びt木インデックス構築装置及びt木インデックス検索装置及びt木インデックス構築プログラムを格納した記憶媒体及びt木インデックス検索プログラムを格納した記憶媒体
JP3824091B2 (ja) リレーショナルデータベースシステム
JPH02236778A (ja) 問い合わせ最適化処理方法
Pramanik et al. Index database machine
JPH022433A (ja) データ格納方式
JPH02132559A (ja) 自然結合演算処理装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees