JPH0962696A - データベース管理システム - Google Patents

データベース管理システム

Info

Publication number
JPH0962696A
JPH0962696A JP7218442A JP21844295A JPH0962696A JP H0962696 A JPH0962696 A JP H0962696A JP 7218442 A JP7218442 A JP 7218442A JP 21844295 A JP21844295 A JP 21844295A JP H0962696 A JPH0962696 A JP H0962696A
Authority
JP
Japan
Prior art keywords
data
area
index
indexes
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7218442A
Other languages
English (en)
Inventor
Naoki Matsuo
直樹 松尾
Sadayuki Ogata
貞之 尾形
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP7218442A priority Critical patent/JPH0962696A/ja
Publication of JPH0962696A publication Critical patent/JPH0962696A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】本発明は、データ管理システムにおいて、ファ
イルの分割が発生した場合に格納キーやインデクスの一
部を論理的に比較することにより、最適な分割位置を特
定し、これを実行するものである。これにより大量の類
似性の強いデータに対する検索や追加、更新といった要
求に対しての高速な処理を目的とする。 【構成】データ領域、インデクス領域を持つファイルに
対しアクセスする電子計算機は業務プログラム、業務プ
ログラムとの連絡を行うアプリケーションインタフェー
ス、実際にファイルとのアクセスを行うファイル管理シ
ステム、ファイル分割と空き領域管理時に参照するファ
イル制御テーブル、ファイル分割システム、空き領域管
理システムから構成されている。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はデータのキー順格納また
はインデクスにツリー構造を持つデータベース管理シス
テムに関する。
【0002】
【従来の技術】通常のソフトウエアにおいてデータの蓄
積、検索や管理を行う場合、データをキー順に格納した
り、データにインデクスをつけ、このインデクスにツリ
ーの構造を持たせる方法が用いられる。データの追加に
伴い、ツリーを格納する領域を分割する必要がでてく
る。従来の技術ではこの分割は単にインデクス格納領域
の中央から行っていた。なお、上述の格納領域を中央で
分割する方式は日立製作所マニュアル「データベースマ
ネージメントシステム XDM E2系 XDM/RD
解説」(平成6年12月)第27ページから28ペー
ジに記載されている。また、データの更新や追加の発生
に備え、データ領域および、インデクス領域内に一定の
空き領域を持っていたが、空き領域はブロックやトラッ
クといった物理的な単位ごとに取られていた。
【0003】インデクス領域を単純に中央で2つに分け
た場合、類似性の高い格納キーを持ったインデクスが別
々の領域に格納される。こうした場合に連続したインデ
クスを持つ大量のデータの検索や更新処理要求が発生す
ると、複数のページを参照する必要が出てくる。このた
め、計算機の外部記憶装置に対し、度々入出力を繰り返
すこととなり、処理時間を長くする原因となる。図1は
このような最適でない分割の状態を例示したものであ
る。図1ではファイル1のインデクス領域2が満杯にな
り、分割しなければならない場合を想定している。従来
の技術ではこの場合の分割はインデクス領域の中央で行
っていた。分割前の状態ではインデクスの先頭から4桁
目までが「111」のインデクスが領域の半分以上を占
めている。このため、分割後にインデクスの先頭から4
桁目までが「111」であるデータを全て取り出す場合
には2つのインデクス領域3と4をアクセスせねばなら
ず、オーバヘッドが発生していた。
【0004】データ領域またはインデクス領域に対し、
データやインデクスの類似性ではなくて単にブロックや
トラックといった物理的な境界ごとに空きエリアを設定
していた。この場合、類似性の高いデータの集合やイン
デクスの集合の間にも空き領域が入り込むこととなる。
この場合に類似性の高いデータの格納キーやインデクス
に対し大量検索や更新を行うと、ブロックやトラックを
またがった処理が必要となり、入出力回数の増加による
処理の長時間化につながる。一方、データの追加は一般
にランダムに発生するのではなく、データの格納キーま
たはインデクスに対し、昇順または降順に発生する場合
が多い。この場合、ブロックやトラックの間に有る空き
領域が無駄になるケースが発生する。銀行口座の開設の
場合を例に挙げる。図2ではファイル6のインデクス領
域5の中身を示している。インデクス領域5が2つのト
ラック7と8を持ち、各トラックにはN個のブロックが
入っており、各トラックには必ず1つ以上空きブロック
が有る。各ブロックには複数のインデクスが昇順に格納
されている。各インデクスの先頭3文字を銀行の支店番
号とし、4文字目以降を預金者の支店ごとの通し番号と
する。銀行の口座開設であるため、データの追加は各支
店番号ごとに昇順に発生する。このとき、「111」で
始まるインデクスを全件検索する場合にはトラック7と
トラック8の両方を検索する必要が有り、オーバヘッド
となる。また、ブロック11と12は空きブロックであ
るが、データの追加は常に昇順であるため、ブロック1
5にしか発生せず、無駄になる。
【0005】
【発明が解決しようとする課題】本発明の目的は、イン
デクス領域の分割を行う際にインデクスの格納状態に合
わせた分割方法、および格納キー順に配置されたデータ
に対する空きエリアの割当て方法を柔軟に決定し、連続
したキーやインデクスを持つデータの大量検索や更新に
たいしても高速な処理を実現し、かつデータおよびイン
デクス領域内の空き領域を最適に配置することで無駄な
領域を最小化することである。
【0006】
【課題を解決するための手段】本発明によれば、インデ
クスの領域を分割する際、またデータ領域に対し、新し
いブロック、シリンダを割り当てる際にデータの格納キ
ーまたはインデクスの上位部分による比較を行う機能を
提供する。
【0007】また、本発明によればこの比較に使用する
インデクスまたはデータの格納キーの比較対象範囲の指
定を動的に変更、設定する機能も提供している。
【0008】本発明によれば、データまたはインデクス
領域中の空き領域の設定をトラックやブロックといった
物理的な単位ではなく、データの格納キーやインデクス
の一部をもとに類似性の強いデータやインデクスの集合
の境界に設定する機能を提供する。
【0009】
【作用】本発明によれば、計算機内部のデータ格納領域
又はデータを管理するためのインデクス格納領域に対
し、分割が発生した場合に分割を行う場所の決定をデー
タの格納キーまたはインデクスの上位部分の比較を行う
分割点決定の手段と空き領域の位置決め手段を持ち、こ
れにより必ずしもデータ格納領域またはインデクス格納
領域の中央で分割するのではなく類似のデータやインデ
クス同志の集合の境界で分割することができる。この際
のインデクス又はデータの格納キーの上位部分のどこま
でを比較の対象とするかについては、状況に合わせた利
用者の判断により最適化を図ることとする。これによ
り、従来の格納領域の中央での分割であれば記憶領域を
またがった参照や更新が発生していたのに対し、本発明
により検索、更新時のデータアクセスを格納領域のまた
がり無しで行うことが出来、データ処理時間を最短にす
る作用がある。また、本発明によればデータ領域、また
はインデクス領域中の空き領域を、データやインデクス
の一部をもとに類似性を判定する手段をもとに、類似性
の強いデータやインデクスの集合の境界に設定する。従
来の物理的なトラックやブロックによる空き領域設定位
置の判定では昇順または降順データの大量追加の際など
に無駄な空き領域を大量に発生させていたが、本発明に
よりこれを解消した。
【0010】
【実施例】次に本発明の一実施例について図面で説明す
る。図3は本発明によるデータ管理システムを含む電子
計算機の構成例である。電子計算機21には業務プログ
ラム22とデータ管理プログラム23およびファイル制
御テーブル24、業務プログラムとの連絡を行うアプリ
ケーションインタフェース25、ファイル分割システム
および空き領域管理システム26が存在する。業務プロ
グラム22はデータファイル18のデータを参照、更新
するが、この操作はファイル管理システム23を介して
行う。ファイル制御テーブル24はデータファイル18
の各ファイルに対応した情報テーブルである。このデー
タ制御テーブル24はインデクス領域に分割の必要が発
生した場合にインデクス領域のどこから分割するかを決
定するため、インデクスの先頭から何桁を比較するかを
示す情報を持つ。図4はこのデータ制御テーブルを例示
している。ファイル管理システム23はファイル分割シ
ステム27を持ち、これがファイル制御テーブル24を
参照し、データファイル18中のインデクス領域19の
インデクスの先頭から指定桁数だけ比較を行い、インデ
クスの境界を捜し、分割を行う。
【0011】また、大量の追加データのみが昇順または
降順に発生する処理に対しては空きエリア管理システム
26がファイル制御テーブル24を参照し、各ファイル
のインデクスの指定桁数だけを比較し、これが同じもの
同志を一つの集合とみなし、この集合の間に空き領域を
設ける。
【0012】図6は本発明によるインデクス領域の分割
を示したものである。分割前の状態は図1と同じであ
る。しかし、図1では分割後は先頭から3文字目までが
「111」のインデクスは2つのインデクス領域に分け
て格納されていたが、図6では分割後でも先頭から3文
字目までが「111」のインデクスは同じインデクス領
域に入っている。これは本発明によりインデクス領域を
分割する場合にインデクスの先頭から3文字目までを比
較の対象とし、3文字目までが異なっている個所での分
割を行ったためである。
【0013】図6は本発明によるインデクス領域中の空
き領域を最適化した例を示したものである。インデクス
自体は図2と同じであるが、トラック29の各インデク
スは先頭から3文字が「111」であり、このためトラ
ック29の3つのブロックには類似性の強いインデクス
だけが入っている。これにより先頭から3文字が「11
1」であるインデクスを検索する場合、トラック3のみ
の検索だけですむ。また、ブロック31、32、35、
36には空き領域がなく、無駄な領域も省いたことにな
る。
【0014】本実施例により、連続したデータを大量検
索あるいは大量更新する際のデータのアクセス時に複数
のインデクス領域を参照、更新する必要が無くなり、こ
のため高速な処理が可能となる。また、大量のデータま
たはインデクスを降順または昇順に追加する処理に対し
てはデータ領域またはインデクス領域の空き領域の無駄
を省ける。
【0015】
【発明の効果】以上の説明の通り、本発明によりデータ
格納領域またはインデクス格納領域において分割が発生
した場合、単純にインデクス格納領域またはデータ格納
領域の中央で分割を行うのではなく、インデクスやデー
タの格納キーの数桁を使って分割することにより、最適
な分割を行い、大量のデータ参照やデータ更新時にも高
速な処理を実現した。また、データの格納キーやインデ
クスが常に昇順または降順のデータおよびインデクスを
大量に追加する処理にたいしてはデータおよびインデク
ス領域中の空き領域を節約することが出来る。
【図面の簡単な説明】
【図1】従来の技術によるインデクス領域の分割を行
い、最適でない分割となった例を示す図である。
【図2】従来の技術によるインデクス領域の分割を行
い、最適でない空き領域の設定を行った例を示す図であ
る。
【図3】本発明によるデータ管理システムの例を示す図
である。
【図4】本発明によるファイル制御テーブルの例を示す
図である。
【図5】本発明によるインデクス領域の分割方法を使っ
た最適な空き領域の設定例を示す図である。
【図6】本発明によるインデクス領域の分割方法を使っ
た最適なインデクス領域の分割例を示す図である。
【符号の説明】
1,18,39,40…データファイル、2,41…分
割前のインデクス領域、3,4,42,43…分割後の
インデクス領域、5…インデクス領域、
6…データファイル、7,8,29,30…データ
ファイル中のトラック、9,10,13,31,32…
先頭から3文字が「111」であるインデクスを格納し
ているブロック、11,12,16,17,33,3
4,37,38…空きブロック、14,15,35,3
6…先頭から3文字が「112」であるインデクスを格
納しているブロック、19,28…インデクス領域、
20…データ領域、21…電子計算機、
22…業務プログラム、23…ファイル
管理システム、 24…ファイル制御テーブ
ル、25…アプリケーションインタフェース、26…空
き領域管理システム、27…ファイル分割システム。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】電子計算機で保有するデータに対し、デー
    タ領域又はデータを管理するためのインデクス領域を持
    ち、これらを検索、データを追加、削除あるいは変更す
    ることを目的としたプログラムで、データ及びインデク
    スの増加により発生するデータ又はインデクスの検索回
    数の増加とこれによる処理時間の長時間化を防止する手
    段を持ったデータベース管理システムで、データ又はイ
    ンデクスの検索に使用する格納キー(クラスタリングキ
    ー)の格納領域を分割する際に同じ領域に類似性の強い
    データ又はインデクスを多く格納することで検索回数を
    減少させる機能を持ち、データ及びインデクスの検索を
    高速に行うことを特徴としたデータベース管理システ
    ム。
  2. 【請求項2】電子計算機で保有するデータに対し、デー
    タ領域またはデータを管理するためのインデクス領域を
    持ち、データやインデクスの格納時に一定の空き領域を
    設定する機能を持ち、空き領域の設定を単にブロックや
    トラックといった物理的な単位で設定するのではなく、
    格納するデータの類似性に着目し、類似性の高いデータ
    の集合ごとに空き領域を設けることでデータやインデク
    スの追加および更新に対しても効率的な処理を実現する
    ことを特徴としたデータベース管理システム。
JP7218442A 1995-08-28 1995-08-28 データベース管理システム Pending JPH0962696A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7218442A JPH0962696A (ja) 1995-08-28 1995-08-28 データベース管理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7218442A JPH0962696A (ja) 1995-08-28 1995-08-28 データベース管理システム

Publications (1)

Publication Number Publication Date
JPH0962696A true JPH0962696A (ja) 1997-03-07

Family

ID=16719984

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7218442A Pending JPH0962696A (ja) 1995-08-28 1995-08-28 データベース管理システム

Country Status (1)

Country Link
JP (1) JPH0962696A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001043237A (ja) * 1999-07-30 2001-02-16 Mitsubishi Electric Corp データファイル及びデータ検索方法
US6965894B2 (en) 2002-03-22 2005-11-15 International Business Machines Corporation Efficient implementation of an index structure for multi-column bi-directional searches
CN115129739A (zh) * 2022-08-31 2022-09-30 杭州沃趣科技股份有限公司 一种数据文件断点续传方法、装置、设备及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001043237A (ja) * 1999-07-30 2001-02-16 Mitsubishi Electric Corp データファイル及びデータ検索方法
US6965894B2 (en) 2002-03-22 2005-11-15 International Business Machines Corporation Efficient implementation of an index structure for multi-column bi-directional searches
CN115129739A (zh) * 2022-08-31 2022-09-30 杭州沃趣科技股份有限公司 一种数据文件断点续传方法、装置、设备及存储介质
CN115129739B (zh) * 2022-08-31 2022-11-25 杭州沃趣科技股份有限公司 一种数据文件断点续传方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US5826262A (en) Parallel bottom-up construction of radix trees
US6725223B2 (en) Storage format for encoded vector indexes
KR100886189B1 (ko) 데이터 베이스
US5408652A (en) Method and apparatus for heterogenous database access by generating different access procedures for different database data structures
US6859808B1 (en) Mapping logical row identifiers for primary B+tree-like structures to physical row identifiers
US20070100873A1 (en) Information retrieving system
AU2002222096A1 (en) Method of organising, interrogating and navigating a database
JPH09330324A (ja) 並列検索技術
JP2708657B2 (ja) スプリット制御方法
JPH1131096A (ja) データ格納検索方式
JPH0962696A (ja) データベース管理システム
JP2007048318A (ja) リレーショナルデータベースの処理方法およびリレーショナルデータベース処理装置
Omiecinski Concurrent file reorganization: Clustering, conversion and maintenance
JP2615046B2 (ja) レコード追加処理方法
JPH09305449A (ja) データベース管理システム
JPH04336340A (ja) ディスクキャッシュアクセス制御方式
JPS62160545A (ja) 直接アクセス記憶装置の未使用領域管理方式
Deen A tuple placement technique for databases
JPH04287140A (ja) 複数物理ファイルに分割するためのファイル管理方式
JPH05314183A (ja) 結果自動補正検索システム
JPS63189934A (ja) デ−タベ−ス副次エントリ処理方式
JPH0474232A (ja) タスク実行方法及びキャッシュ装置の割り当て方法
JPS63206837A (ja) 区分デ−タセツトアクセス方式
JPS62254246A (ja) データディクショナリ・ディレクトリをもつデータベースの制御方法
JPH07281931A (ja) 中間データ格納方法