JPH0727485B2 - レコード格納管理方法 - Google Patents

レコード格納管理方法

Info

Publication number
JPH0727485B2
JPH0727485B2 JP63086944A JP8694488A JPH0727485B2 JP H0727485 B2 JPH0727485 B2 JP H0727485B2 JP 63086944 A JP63086944 A JP 63086944A JP 8694488 A JP8694488 A JP 8694488A JP H0727485 B2 JPH0727485 B2 JP H0727485B2
Authority
JP
Japan
Prior art keywords
record
division
value
group
records
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63086944A
Other languages
English (en)
Other versions
JPH01258128A (ja
Inventor
治夫 速水
一郎 板倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP63086944A priority Critical patent/JPH0727485B2/ja
Publication of JPH01258128A publication Critical patent/JPH01258128A/ja
Publication of JPH0727485B2 publication Critical patent/JPH0727485B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、各々同一構成の複数カラムを持つレコードの
集まりからなる関係データベースなどのデータベースに
おけるレコード格納管理方法に係わり、詳しくは、同一
のカラム構成を持つレコードの集まりを、分割制御用と
して指定された複数のカラムの値とそれらの重み付け情
報に基づいて複数のレコードの集まりに分割して格納管
理する方法に関する。
〔従来の技術〕
関係データベース等では、検索時間の短縮のためにレコ
ード群の分割格納が行われる。
第7図は従来方法のレコード群の分割例を示したもので
ある。同図において、レコード群1は分割前の状態であ
り、8個のレコードはそれぞれカラムA,B,C,Dの同一の
カラム構成をとる。分割制御用としてカラムB、その値
を3と指定することにより、レコード群1はカラムBの
値が“3"以下のレコードからなるレコード群2と、カラ
ムBの値が“3"より大きいレコードからなるレコード群
3に分けられる。こゝで、分割を決める値(本例では
“3")は、分割した両レコード群のレコード数が均等に
成るように選ばれるのが普通である。
この様に、カラムの値によってレコード群を複数の小さ
いレコード群に分割することをクラスタリングと呼び、
分割された各レコード群をクラスタと呼ぶ。カラムの分
割値を管理するために2分木(ツリー)が用いられ、2
分木の分岐点を節点と呼ぶ。第7図では、各クラスタの
レコード数は4としている。
第7図の例において、カラム値を指定した条件(例えば
カラムBの値が“2"である)を満足するレコードをレコ
ード群から検索することを考える。レコード群の分割が
行われていないレコード群1を検索する場合は、8個の
レコードのカラムBの値が“2"であるかを比較しなけれ
ばならない。ところで、カラムBの値が3で分割されて
いれば、カラムBの値が“3"以下のレコードからなるレ
コード群2の4個のレコードのみを比較すればよい。こ
のように、レコード群の分割を事前に行うことにより、
分割制御用カラムの値を指定した検索の処理時間を短縮
することが可能となる。
レコード群にはレコードが追加されることがある。第8
図はレコードが追加された場合の分割例を示したもので
ある。本例においては、第7図のレコード群3に相当す
るレコードが4個追加されている。こゝでは、各クラス
タのレコード数は4としているため、第7図のレコード
群3相当のレコードを何らかの方法で再分割しなければ
ならない。第8図では、もう1つの分割制御用カラムで
あるカラムCの値(“6")に基づいて分割し、新たなレ
コード群3、レコード群4に分割している。
第8図のように、複数のカラムが分割制御用として指定
されている場合をマルチキークラスタリングと呼ぶ。マ
ルチキークラスタリングの場合、複数の分割制御用カラ
ムを交互に用いて分割していく方法がよく採られる。
第9図は更にレコードが追加された場合の分割例を示し
たものである。本例においては、第8図のレコード群4
に相当するレコードが4個追加されている。このため、
第8図のレコード群4相当のレコードを、カラムBの値
(“8")に基づいて分割し、新たなレコード群4、レコ
ード群5に分割している。
〔発明が解決しようとする課題〕
第9図の例において、各クラスタへの節点数がクラスタ
によって異なっている。即ち、レコード群2へはカラム
Cの値が“3"を越えるかの1節点のみであるが、レコー
ド群3へは2節点、レコード群4、レコード群5へは3
節点である。このように、節点数の最大値と最小値が2
以上異なる場合を2分木がアンバランスであるといゝ、
そうでない場合をバランスしているという。元のレコー
ド群に複数回レコードが追加されると2分木にアンバラ
ンスが生じ易い。
2分木がアンバランスである場合、検索条件が指定され
てから該条件を満足するクラスタを決めるまでに判定し
なければならない節点数の最大値は、バランスしている
場合のそれより大きい。検索時間を短縮する場合、最大
値を小さくすることが最も重要である。この為、アンバ
ランスが生じた場合、バランスさせる処理が必要にな
る。
分割制御用カラムが1つであるシングルキークラスタリ
ングの場合は、2分木のバランス化は容易であり、その
アルゴリズムは、例えばNiklaus Wirth著、片山卓也
訳、「アルゴリズム+データ構造=プログラム」、日本
コンピュータ協会、PP215−225に示されている。一方、
マルチキークラスタリングの場合においては、従来の分
割方法では、各クラスタのレコードを入れ換えなければ
バランス化することはできない。これを第9図の例につ
いて示すと第10図のようになる。
通常、レコード群は2次記憶装置にクラスタ単位で格納
されているため、クラスタのレコードを入れ換える処理
は、多数回の2次記憶装置アクセスを必要とするため長
時間を要する。
本発明の目的は、各々同一構成の複数カラムを持つレコ
ードの集まりからなる関係データベースなどのデータベ
ースにおいて、マルチキークラスタリングの際、レコー
ドの追加により2分木にアンバランスが生じた場合に、
各クラスタのレコードを入れ換えることなしにバランス
させることを可能とするレコード格納管理方法を提供す
ることにある。
〔課題を解決するための手段〕
本発明は、各々同一構成の複数カラムを持つレコード
を、構成するレコード数の最大値が制約されているレコ
ード群に分割して格納管理するデータベースにおいて、 前記レコードが入力されたときに、分割制御用として指
定された複数のカラムの値と2分木構造のレコード群配
置情報とから特定されるレコード群に該入力されたレコ
ードを追加し、該レコードの追加によって前記レコード
数の最大値を超過する場合は、該レコード群を分割する
レコード格納管理方法であって、 前記レコードの前記分割制御用として指定された複数の
カラムの値と、前記分割制御用として指定されたカラム
に予め付与された重み付け情報に基づき1つの分割評価
値を作成し、該分割評価値を2分木節点の分割値として
前記レコード群配置情報を決定し、前記レコードが入力
されると前記分割価値を求めて該入力されたレコードに
付加して、該分割評価値と前記レコード群配置情報とか
ら決定されるレコード群に格納し、該レコードの追加に
より前記レコード数の最大値を超過して前記レコード群
の構成が変更された結果、前記レコード群配置の2分木
構造がアンバランスとなった場合は、2分木の節点の分
割値を変更して、前記レコード群配置の構成をバランス
させるようにする 〔作 用〕 本発明では、マルチキークラスタリングをシングルキー
クラスタリングに置換している。これにより、2分木が
アンバランスと成ったときにバランス化が可能である。
分割制御用として指定された複数のカラムの重み付け情
報が指定された場合、従来方法では、分割の節点に用い
るカラムの使用頻度を重要なカラムほど高くすることに
よって、所望の目的を果たしている。これに対し、本発
明では、各カラムの値に基づいて作成した部分分割評価
値に乗じる係数を、重み付け情報に基づき重要なカラム
程大きくする。これにより、レコード実体の入れ換え無
しに2分木の節点の分割値の交換だけで、2分木をバラ
ンス化させることが可能にある。
〔実施例〕
以下、本発明の一実施例について図面により説明する。
第1図は本発明の一実施例の概略構成図である。こゝ
で、1は分割評価値作成付加部、2はレコード分割部、
3は元のレコード群の入力線、4は分割評価値付レコー
ド群の転送線、5は分割後のレコード群の転送線であ
る。分割評価値作成付加部1の働きは、各レコード毎
に、分割制御用として指定された複数のカラムの値に基
づいて部分分割評価値を作成し、この部分分割評価値の
各々に予め定めた重み付け情報に基づく重み付け係数を
乗じて総和を求めて分割評価値とし、この分割評価値を
該当レコードに付加するものである。レコード分割部2
は従来と同様であるため、以下では詳しく述べない。
第2図は分割評価値作成付加部1の一実施例の詳細構成
図である。こゝで、10は分割対象のレコード群の各レコ
ードを保持するレコード保持レジスタ、11はレコードか
ら指定された分割制御用カラムを選択する分割制御用カ
ラム選択部、12は分割制御用カラム保持レジスタ、13は
レジスタ12の内容に基づき部分分割評価値を作成する部
分分割評価値作成部、14は部分分割評価値保持レジス
タ、15は指定された重み付け情報に基づき重み付け係数
を選択する重み付け係数選択部、16は重み付け係数保持
レジスタ、17は乗算器、18は加算器、19は分割評価値の
中間結果を保持する中間分割評価値保持レジスタ、20は
分割評価値を付加したレコードを保持する分割評価値付
主レコード保持レジスタである。
第3図は第7図のレコード群1について、本実施例によ
る分割例を示したものである。こゝでは簡単のために、
部分分割評価値作成部13では該当カラムの値をそのまゝ
部分分割評価値とし、重み付け係数選択部15では重み付
け情報(カラムBはカラムCより2倍重要とする)に基
づきカラムBに対し“2"、カラムCに対し“1"を選択す
ることゝする。
なお、一般に重み付け係数は、各カラムの重要度に大じ
て任意に決めればよく、具体的に重み付け係数をいくら
にするかはまったく自由である。
以下の説明において、カラムAの値はユニークであるの
で、カラムAの値が,,,…のレコードをレコー
ド,,,…と呼ぶことにする。
第3図に示すレコード群1のレコードが分割評価値作
成付加部1に入力された後の処理手順を以下に示す。
(i)レコードをレコード保持レジスタ10に保持す
る。
(ii)分割制御用カラム選択部11はカラムBを選択し、
その値“1"を分割制御用カラム保持レジスタ12に出力す
る。
(iii)部分分割評価値作成部13はレジスタ12の値をそ
のまゝ部分分割評価値“1"とし、部分分割評価値保持レ
ジスタ14に出力する。
(iv)重み付け係数選択部15はカラムBに対する重み付
け係数“2"を選択し、重み付け係数保持レジスタ16に出
力する。
(v)乗算器17はレジスタ14,16の部分分割評価値“1"
と重み付け係数“2"とを乗算し、その乗算結果“2"を出
力する。
(vi)加算器18は乗算器17での乗算結果“2"と中間評価
値保持レジスタ19に入っている初期値“0"とを加算して
加算結果“2"を得、中間分割評価値保持レジスタ19に新
しい中間分割評価値“2"として出力する。
(vii)レコードのカラムCについて(ii)〜(vi)
と同様な処理を実行し、中間分割評価値保持レジスタ19
に新しい中間分割評価値(これは最終の分割評価値にな
る)“4"を出力する。
(viii)レコード保持レジスタ10に保持されているレコ
ードと中間分割評価値保持レジスタ19の分割評価値
“4"とを結合し、分割評価値付きレコード保持レジスタ
20に出力する。
以上の動作を繰返し、レコード〜に対しても分割評
価値を作成し付加する。この結果、第3図は示す分割評
価値付レコード群1が作成される。この後は、従来と同
様に、レコード分割部2において、8個のレコードから
なる分割評価値付レコード群1を分割評価値の値が“1
4"以下のレコードからなるレコード群2と、分割評価値
の値が“14"より大きいレコードからなるレコード群3
に分割する。
なお、分割評価値の値が同じレコードが複数存在する場
合は、当然のことながらこれらのレコードは同じレコー
ド群に入れる。例えば、仮にレコードの分割評価がレ
コードと同じく「14」であった場合は、レコードは
レコード群2に入れる。この場合、レコード群2,3のレ
コード数が均等にならないが、これは何ら支障がない。
第4図及び第5図は、従来の第8図及び第9図の場合と
同様に、レコードが順次追加された場合の分割例を示し
たものである。こゝで、第5図の分割例においては、従
来と同様に2分木にアンバランスが生じている。この場
合、第6図に示すように、2分木の各節点の分割値を交
換するだけで、レコード群2〜5のレコードを入れ換え
ることなく、2分木をバランス化させることが可能であ
る。これは1つの分割評価値に基づいて分割しているこ
とによる。
また、分割評価値を用いることにより、検索時、複数の
カラムの値を指定した条件を満足するレコード群の検索
の処理時間の短縮することができる。例として、カラム
Bの値が“8"、且つ、カラムCの値が“8"の条件につい
て、第6図のレコード群分割により検索処理時間が短縮
される様子を示す。なお、重み付け係数は分割処理時と
同じである。カラムBの値が“8"、且つ、カラムCの値
が8の条件に相当する分割評価値fを計算すると、8×
2+8=24である。レコード群分割を管理する2分木に
より、f=24のレコードはレコード群4に含まれている
ことが分かるため、検索ではレコード群4に含まれる4
個のレコード,,,を比較するだけでよい。
以上の説明においては、部分分割評価値作成部13では該
当カラムの値をそのまゝ部分分割評価値としたが、これ
は説明を簡単化するためであり、これに限られるもので
はない。また、分割制御用カラムの数を2としたが、こ
れに限られるものではない。
〔発明の効果〕
以上説明したように、本発明によるレコード格納管理方
法においては、データベースにおけるマルチキークラス
タリング処理で、2分木のアンバランスが生じたとき
に、レコード実体の入れ換え無しに2分木の分割値を交
換だけで、2分木をバランス化させることが可能であ
る。これにより、2分木をバランス化させる場合に、レ
コード交換のための2次記憶装置アクセスが不要とな
り、バランス化の処理時間が短縮される。
【図面の簡単な説明】
第1図は本発明の一実施例の概略構成図、第2図は第1
図における分割評価値作成付加部の詳細構成図、第3図
乃至第6図は本発明方法による分割例を示す図、第7図
乃至第10図は従来方法の分割例を示す図である。 1……分割評価値作成付加部、 2……レコード分割部、 10……レコード保持レジスタ、 11……分割制御用カラム選択部、 12……分割制御用カラム保持レジスタ、 13……部分分割評価値作成部、 14……部分分割評価値保持レジスタ、 15……重み付け係数選択部、 16……重み付け係数保持レジスタ、 17……乗算器、18……加算器、 19……中間分割評価値保持レジスタ、 20……分割評価値付きレコード保持レジスタ。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】各々同一構成の複数カラムを持つレコード
    を、構成するレコード数の最大値が制約されているレコ
    ード群に分割して格納管理するデータベースにおいて、 前記レコードが入力されたときに、分割制御用として指
    定された複数のカラムの値と2分木構造のレコード群配
    置情報とから特定されるレコード群に該入力されたレコ
    ードを追加し、該レコードの追加によって前記レコード
    数の最大値を超過する場合は、該レコード群を分割する
    レコード格納管理方法であって、 前記レコードの前記分割制御用として指定された複数の
    カラムの値と、前記分割制御用として指定されたカラム
    に予め付与された重み付け情報に基づき1つの分割評価
    値を作成し、該分割評価値を2分木節点の分割値として
    前記レコード群配置情報を決定し、前記レコードが入力
    されると前記分割価値を求めて該入力されたレコードに
    付加して、該分割評価値と前記レコード群配置情報とか
    ら決定されるレコード群に格納し、該レコードの追加に
    より前記レコード数の最大値を超過して前記レコード群
    の構成が変更された結果、前記レコード群配置の2分木
    構造がアンバランスとなった場合は、2分木の節点の分
    割値を変更して、前記レコード群配置の構成をバランス
    させるようにしたことを特徴とするレコード格納管理方
    法。
JP63086944A 1988-04-08 1988-04-08 レコード格納管理方法 Expired - Fee Related JPH0727485B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63086944A JPH0727485B2 (ja) 1988-04-08 1988-04-08 レコード格納管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63086944A JPH0727485B2 (ja) 1988-04-08 1988-04-08 レコード格納管理方法

Publications (2)

Publication Number Publication Date
JPH01258128A JPH01258128A (ja) 1989-10-16
JPH0727485B2 true JPH0727485B2 (ja) 1995-03-29

Family

ID=13900981

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63086944A Expired - Fee Related JPH0727485B2 (ja) 1988-04-08 1988-04-08 レコード格納管理方法

Country Status (1)

Country Link
JP (1) JPH0727485B2 (ja)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
「情報処理学会第340(昭62年前期)全国大会講演論文集」P.459−460

Also Published As

Publication number Publication date
JPH01258128A (ja) 1989-10-16

Similar Documents

Publication Publication Date Title
US7213025B2 (en) Partitioned database system
US6772163B1 (en) Reduced memory row hash match scan join for a partitioned database system
EP0124097B1 (en) Method for storing and retrieving data in a data base
US5960431A (en) Method and apparatus for adding data storage bins to a stored computer database while minimizing movement of data and balancing data distribution
US7251653B2 (en) Method and system for mapping between logical data and physical data
Yagoubi et al. Massively distributed time series indexing and querying
US20040133581A1 (en) Database management system, data structure generating method for database management system, and storage medium therefor
US7917512B2 (en) Method for automated design of range partitioned tables for relational databases
JP2000187668A (ja) グループ化方法と重複排除方法
US6845375B1 (en) Multi-level partitioned database system
US8108400B2 (en) Database segment searching
EP0627697B1 (en) Indexing/compression scheme for supporting graphics and data selection
US7080072B1 (en) Row hash match scan in a partitioned database system
US7774353B2 (en) Search templates
US20040078556A1 (en) Method for rapid interpretation of results returned by a parallel compare instruction
US7487165B2 (en) Computer implemented method for retrieving hit count data from a data base system and according computer program product
JPH0727485B2 (ja) レコード格納管理方法
JPH08235033A (ja) オブジェクト指向データベース管理システムにおける結合演算方式
JPH0782429B2 (ja) 複数ファイルのマージ方法
JPS6143338A (ja) 連想技術を使用して稀薄なデータベースをサーチする方法
Pramanik et al. Index database machine
JPH10301935A (ja) データ処理方法
JP3824091B2 (ja) リレーショナルデータベースシステム
JPH0447858B2 (ja)
JPH048814B2 (ja)

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees