JPH022433A

JPH022433A - データ格納方式

Info

Publication number: JPH022433A
Application number: JP63147248A
Authority: JP
Inventors: Kyoji Kawagoe; 恭二川越
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1988-06-14
Filing date: 1988-06-14
Publication date: 1990-01-08

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明はデータ格納方式に関し、特に幾つかの属性を有
するデータの集合をファイルに格納するデータ格納方式
に関する。

（″従来の技術〕従来のデータ格納方式は、例えば、会社の従業ｉ情報、
販売情報、生産管理情報などを統一的に管理する関係デ
ータベースの格納において、原データを一意に識別でき
る属性である一次キーによって原データの゛格納番地を
定めて格納するとともに、−次キー以外の属性の値から
、その値を持つ原データを取出すための索引データを作
成して格納する方式がある。

このような索引データを作成する方式としては、各属性
ごとにそれぞれの値から原データの格納番地を得ること
ができる格納方式がある。

二の格納方式の参考文献には、ソーティング・アンド・
サーチング（Ｓｏｒｔ−ｉｎｇ　　ａｎｄＳｅａｒｃｈ
ｉｎｇ）、６．５節、アディソン・ウェズレイ（Ａｄｄ
ｉｓｏｎ−Ｗｅｓｌｅｙ）社、１９７３力（ある。

また、複数の属性の索引データを一括して格納する方式
がある。

この格納方式を示している参考文献には、ザ・フォード
トリー・アンド・リレイティッド・ヒエラキカル・デー
タ・スＩ・ラフチャ（ＴｈｅＱ＋」ａｄｔｒｅｅ　　ａ
ｎｃＬ　　Ｒｅ　ｆａｔｅｄＨｉｅｒａｒｃｈｉｃａｌ
　　Ｄａｔａ　　５ｔｒｕＣｔｕｒｅＳ）、コンピユー
テイング・サーベイズ（Ｃｏｍｐｕｔｉｎｇ　　５ｕｒ
ｖｅｙｓ）、１６巻２号、１８７頁〜２６０頁、ＡＣＭ
１９８４がある。

〔発明が解決しようとする課題〕

上述した従来のデータ格納方式は、−様に分布するデー
タに対しては効率良く格納することができるが、分布に
偏りが存在したり複数の属性の間で相関関係が存在する
データについては、保存するファイルの容量や索引デー
タ量が増加し、その結果としてデータのアクセスを行う
時間も増加するという問題点がある。

本発明の目的は、−様に分布していないデータ、あるい
は複数の属性の間に相関関係が存在するデータについて
も、保存するファイルの容量や索引データ量の増加を少
なくするとともに、その結果としてデータを取出すため
のアクセスを行う時間も短縮することができるデ←り格
納方式を提供することにある。

〔課題を解決するための手段〕

本発明のデータ格納方式は、複数の属性を有する原デー
タの集合を保存するファイルのデータ格納方式において
、（Ａ）あらかじめ定められたアフィン変換によって、前
記原データに有する幾つかの属性の値を変換するアフィ
ン変換手段、（Ｂ）前記アフィン変換手段で変換された新たな幾つか
の属性の値から、前記原データのそれぞれを格納すべき
前記ファイル内のデータ格納番地を算定するデータ格納
番地算定手段、（Ｃ）前記データ格納番地算定手段で算定されたデータ
格納番地に前記原データのそれぞれを格納するデータ格
納手段、を流えて構成されている。

〔作用〕

本発明のデータ格納方式は、索引に使用する幾つかの属
性の値に対して一様に′分布、していない原データにつ
い□て、まず、その索引に使用する幾つかの属性の値に
アフィン変換を施している。

このアフィン変換は、原データが変換後の新たな幾つか
の属性の値に対して出来る限り一様に分布するように、
あらかじめ定められる。

次に、変換された結果の新た。な幾つがの属性の値を使
用して原データのデータ格納番地を算定するとともに、
その索引データを作成する。。

そして、原データを、算定したデータ格納番地にそのま
ま格納することにより、原データは、変換された結果の
新たな幾つかの属性の値に対してほぼ一様に分布するの
で、ファイルに効率良く格納される。

このように、−様に分布していないデータに対して効率
的でない従来のデータ格納方式に対して、本発明のデー
タ格納方式は、あらかじめアフィン変換によって一様分
布に近づけることにより、ファイルにデータを効率良く
格納することができる。

〔実施例〕

次に本発明の実施例について図面を参照して説明する。

第１図は本発明のデータ格納方式の一実施例を示すブロ
ック図であ、る。

第１図に示すように、アフィン変換手段１は、格納する
原データＤのそれぞれに有する索引に使用する幾つかの
属性の値に、あらかじめ定められたアフィン変換を実施
している。

また、データ格納番地算定手段２は、アフィン変換手段
１で変換された新たな幾っがの属性の値から、原データ
Ｄのそれぞれを格納すべきファイルＦ内のデータ格納番
地を算定している。

一方、データ格納手段３は、データ格納番地算定手段２
で算定されたファイルＦ内のデータ格納番地に原データ
Ｄのそれぞれを格納している。

第２図は本実施例のデータ格納方式の動作の一例を示す
流れ図である。

第２図のステップ２１で、アフィン変換手段１は、変換
された新たな幾つかの属性の値として得られるベクトル
ｇ＝［：ｇ＋、・・・・・・・・・ｇ、）ｔを、索引に
使用する幾つかの属性の値で構成されるベタ１〜ルに＝
（ｋ、、・・・・・・・・１（。〕１とアフィン変換行
列Ｔとの積として、ｇ＝Ｔ＊ｋを計算している。

次に、ステップ２２で、データ格納番地算定手段２は、
ベクトルｇから格納すべき番地Ａｄｒを以下のように算
定している。

すなわち、ｇ＋の取り得る最大の値と最小の値とを各々
ｂ　１　＋　ａ　Ｉ　とし、ｇｌに対するそのときの等
分割数をｎｌとして、Ａ　ｄ　ｒ　＝　Ｘ　ｎＸ　１　＝　ｎ　Ｉ＊　Ｘ　＋　−Ｈ＋　Ｙ　＋ただし
、ｉ−２，・・・・・・ｎである。

ただし、ｉ−１，・・・・・・ｎであり、１７１はＺを
越えない最大の整数である。

Ｘ、＝Ｙ。

を算定している。

さらに、ステップ２３で、データ格納手段３は、原デー
タＤのそれぞれを以下のようにして格納している。

まず、ステップ２３−１で、もし、Ａｄｒで示された番
地に既にデータが格納され、これ以上格納できないなら
ば、ｇｌの等分割数を適当数だけ増加させ、これに応じ
て、すべてのデータの格納状態の再構成を実施する。

そこで、ステップ２３−２で、Ａｄｒで示される番地に
格納できる領域が存在すれば、その領域に原データを格
納する。

次に示す第１表は格納する原データＤの一例を示してい
る。

第１表なお、最初、Ａ１とＡ２とも分割はなくｎ＋＝１であり
、番地に格納できるデータの数も１として説明する。

また、アフィン変換行列Ｔは、原データＤが変換後の新
たな２つの属性の値に対して出来る限り一様に分布する
ように、あらかじめ次の値に定められているものとする
。

第１表の原デ、−タＤは、三つの属性Ａｔ。

Ａ２．Ａ３を有しているが、以下に、索引に使用する属
性は、Ａ１とＡ２との二つであり、Ａ１とＡ２の取り得
る値がそれぞれＯと１との間である場合について、デー
タが全く格納されていないファイルに第１表の原データ
Ｄを格納する例を説明する。

この結果、変換後の新たな属性のへりＩ〜ルど−（ｇ＋
　、ｇｚ　）ｔの取り得る値は、ｇｌ　が−１と１との
間で、ｇｚが０と１．４１４との間になる。

まず、第１表の最初の原データＤ１について。

第２図のステップ２１で、上記のアフィン変換を行って
、ｇ＝（０，，３，０，１４１４）’を得ることができ
る。

次に、第２図のステップ２２で、番地Ａ、ｄｒを求めれ
ば、Ｙ、＝Ｏ１Ｘ１＝０、Ｙ２＝Ｏ。

Ｘ２−０で、Ａｄｒ＝ｏとなる。そこで、Ｄｌを番地０
に格納する。

第３図は第１表の原データを順次格納するときの格納状
況の一例を示す格納状況説明図である。

第３図（ａ）に示すように、Ｄ１格納時には、Ｄｌが番
地Ｏに格納される。

次に、第１表の原データＤ２についても、同様に番地Ａ
ｄｒを求めれば、Ｄｌと同じＡｄｒ＝Ｏとなる。そこで
、第２図のステップ２３−１で、分割数を増加させ、ｎ
ｌ　＝２とする。

そして、Ｄｌに対して再びＡｄｒを求めれば、Ａｄｒ＝
１となる。このため、Ｄｌを番地１に移動する。また、
Ｄ２については、Ａｄｒ＝０となり、既にＤｌが番地１
に移動しているので、Ｄ２を番地０に格納する。

この結果、第３図（ｂ）に示すように、Ｄ２格納時には
、Ｄｌが番地１に、Ｄ２が番地Ｏに格納されることとな
る。

次に、Ｄ３については、Ａｄｒ＝１となり、再び分割し
なければならないので、ｎ２＝２とする。

そして、ＤｌとＤ２とＤ３のＡｄｒを再計算すると、Ｄ
ｉについてはＡｄｒ＝２．Ｄ２についてはＡｄｒ＝１．
Ｄ３についてはＡｄｒ＝３となるので、それぞれの番地
に格納する。

この結果、第３図（ｃ）に示すように、Ｄ３格納時には
、Ｄｌが番地２に、Ｄ２が番地１、Ｄ３を番地３に格納
されることとなる。

以降のＤ４．Ｄ５．Ｄ６についても、同様の処理を施す
ことにより、第３図（ｄ）、（ｅ）。

（ｆ）に示すように、Ｄｌ、・・・・・・・・・Ｄ６が
それぞれ格納されることとなる。

一方、第４図は第１表の原データを従来のデータ格納方
式で格納するときの格納状況の一例を示す格納状況説明
図である。

第４図に示すように、従来のデータ格納方式のファイル
は、索引に使用する属性のＡ１とＡ２とをそれぞれ等間
隔に区分して、６つの原データＤ１．・・・・・・・・
・Ｄ６を格納するための８つのデータ格納番地を有、し
ている。

従って、第４図に示す従来のデータ格納方式のファイル
は、第３図（ｆ）の本実施例のデ−タ格納番地に圧べて
、データ格納番地の数が多く、データを格納していない
データ格納番地の数が多くなっている。

このように、本実施例のデータ格納方式は、アフィン変
換により、必要な格納領域が少な（、効率良くデータを
格納することができる。

以上述べたように、本実施例のデータ格納方式は、−様
に分布していないデータ、あるいは複数の属性の間に相
関関係が存在するデータについても、保存するファイル
の容量や索引データ量の増加を少なくするとともに、そ
の結果としてデータを取出すためのアクセスを行う時間
も短縮することができる。

なお、本実施例は、索引に使用する属性が２つの場合に
ついて述べているが１．２つである必要はなく９、幾つ
の場合にも適用できる７また、本発明のデータ格納方式は、アフィン変換をデー
タ格納番地の計算の前に使用することに特徴があるので
、第２図のステップ２２におけるデータ格納番地の計算
方法も、これに限ることなく、索引ファイルを使用する
方法、ハツシングによる方法、配列による方法など様々
な方法を使用することができる。

〔発明の効果〕

以上説明し、たように、本発明のデータ格納方式は、−
様に分布していないデータ、あるいは複数の属性の間に
相関関係が存在するデータについても、保存するファイ
ルの容量や索引データ量の増加を少なくするとともに、
その結果としてデータを取出すためのアクセスを行う時
間も短縮することができるという効果を有している。

【図面の簡単な説明】

第１図は本発明のデータ格納方式の一実施例を示すブロ
ック図、第２図は本実施例のデータ格納方式の動作の一
例を示す流れ図、第３図は第１表の原データを順次格納
するときの格納状況の一例を示す格納状況説明図、第４
図は第１表の原デ−夕を従来のデータ格納方式で格納す
るときの格納状況の一例を示す格納状況説明図である。１・・・・・・アフィン変換手段、２・・・・・・デー
タ格納番地算・定手段、３・・・・・・データ格納手段
、Ｄ・・・・・・原データ、Ｆ・・・・・・ファイル。

Claims

【特許請求の範囲】複数の属性を有する原データの集合を保存するファイル
のデータ格納方式において、（Ａ）あらかじめ定められたアフィン変換によって、前
記原データに有する幾つかの属性の値を変換するアフィ
ン変換手段、（Ｂ）前記アフィン変換手段で変換された新たな幾つか
の属性の値から、前記原データのそれぞれを格納すべき
前記ファイル内のデータ格納番地を算定するデータ格納
番地算定手段、（Ｃ）前記データ格納番地算定手段で算定されたデータ
格納番地に前記原データのそれぞれを格納するデータ格
納手段、を備えることを特徴とするデータ格納方式。