JPH022433A - データ格納方式 - Google Patents
データ格納方式Info
- Publication number
- JPH022433A JPH022433A JP63147248A JP14724888A JPH022433A JP H022433 A JPH022433 A JP H022433A JP 63147248 A JP63147248 A JP 63147248A JP 14724888 A JP14724888 A JP 14724888A JP H022433 A JPH022433 A JP H022433A
- Authority
- JP
- Japan
- Prior art keywords
- data
- data storage
- stored
- affine transformation
- original data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013500 data storage Methods 0.000 title claims abstract description 56
- 230000009466 transformation Effects 0.000 claims abstract description 23
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims abstract description 21
- 238000000034 method Methods 0.000 claims description 31
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000009827 uniform distribution Methods 0.000 abstract description 2
- 238000003860 storage Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明はデータ格納方式に関し、特に幾つかの属性を有
するデータの集合をファイルに格納するデータ格納方式
に関する。
するデータの集合をファイルに格納するデータ格納方式
に関する。
(″従来の技術〕
従来のデータ格納方式は、例えば、会社の従業i情報、
販売情報、生産管理情報などを統一的に管理する関係デ
ータベースの格納において、原データを一意に識別でき
る属性である一次キーによって原データの゛格納番地を
定めて格納するとともに、−次キー以外の属性の値から
、その値を持つ原データを取出すための索引データを作
成して格納する方式がある。
販売情報、生産管理情報などを統一的に管理する関係デ
ータベースの格納において、原データを一意に識別でき
る属性である一次キーによって原データの゛格納番地を
定めて格納するとともに、−次キー以外の属性の値から
、その値を持つ原データを取出すための索引データを作
成して格納する方式がある。
このような索引データを作成する方式としては、各属性
ごとにそれぞれの値から原データの格納番地を得ること
ができる格納方式がある。
ごとにそれぞれの値から原データの格納番地を得ること
ができる格納方式がある。
二の格納方式の参考文献には、ソーティング・アンド・
サーチング(Sort−ing andSearch
ing)、6.5節、アディソン・ウェズレイ(Add
ison−Wesley)社、1973力(ある。
サーチング(Sort−ing andSearch
ing)、6.5節、アディソン・ウェズレイ(Add
ison−Wesley)社、1973力(ある。
また、複数の属性の索引データを一括して格納する方式
がある。
がある。
この格納方式を示している参考文献には、ザ・フォード
トリー・アンド・リレイティッド・ヒエラキカル・デー
タ・スI・ラフチャ(TheQ+」adtree a
ncL Re fatedHierarchical
Data 5truCtureS)、コンピユー
テイング・サーベイズ(Computing 5ur
veys)、16巻2号、187頁〜260頁、ACM
1984がある。
トリー・アンド・リレイティッド・ヒエラキカル・デー
タ・スI・ラフチャ(TheQ+」adtree a
ncL Re fatedHierarchical
Data 5truCtureS)、コンピユー
テイング・サーベイズ(Computing 5ur
veys)、16巻2号、187頁〜260頁、ACM
1984がある。
上述した従来のデータ格納方式は、−様に分布するデー
タに対しては効率良く格納することができるが、分布に
偏りが存在したり複数の属性の間で相関関係が存在する
データについては、保存するファイルの容量や索引デー
タ量が増加し、その結果としてデータのアクセスを行う
時間も増加するという問題点がある。
タに対しては効率良く格納することができるが、分布に
偏りが存在したり複数の属性の間で相関関係が存在する
データについては、保存するファイルの容量や索引デー
タ量が増加し、その結果としてデータのアクセスを行う
時間も増加するという問題点がある。
本発明の目的は、−様に分布していないデータ、あるい
は複数の属性の間に相関関係が存在するデータについて
も、保存するファイルの容量や索引データ量の増加を少
なくするとともに、その結果としてデータを取出すため
のアクセスを行う時間も短縮することができるデ←り格
納方式を提供することにある。
は複数の属性の間に相関関係が存在するデータについて
も、保存するファイルの容量や索引データ量の増加を少
なくするとともに、その結果としてデータを取出すため
のアクセスを行う時間も短縮することができるデ←り格
納方式を提供することにある。
本発明のデータ格納方式は、複数の属性を有する原デー
タの集合を保存するファイルのデータ格納方式において
、 (A)あらかじめ定められたアフィン変換によって、前
記原データに有する幾つかの属性の値を変換するアフィ
ン変換手段、 (B)前記アフィン変換手段で変換された新たな幾つか
の属性の値から、前記原データのそれぞれを格納すべき
前記ファイル内のデータ格納番地を算定するデータ格納
番地算定手段、 (C)前記データ格納番地算定手段で算定されたデータ
格納番地に前記原データのそれぞれを格納するデータ格
納手段、 を流えて構成されている。
タの集合を保存するファイルのデータ格納方式において
、 (A)あらかじめ定められたアフィン変換によって、前
記原データに有する幾つかの属性の値を変換するアフィ
ン変換手段、 (B)前記アフィン変換手段で変換された新たな幾つか
の属性の値から、前記原データのそれぞれを格納すべき
前記ファイル内のデータ格納番地を算定するデータ格納
番地算定手段、 (C)前記データ格納番地算定手段で算定されたデータ
格納番地に前記原データのそれぞれを格納するデータ格
納手段、 を流えて構成されている。
本発明のデータ格納方式は、索引に使用する幾つかの属
性の値に対して一様に′分布、していない原データにつ
い□て、まず、その索引に使用する幾つかの属性の値に
アフィン変換を施している。
性の値に対して一様に′分布、していない原データにつ
い□て、まず、その索引に使用する幾つかの属性の値に
アフィン変換を施している。
このアフィン変換は、原データが変換後の新たな幾つか
の属性の値に対して出来る限り一様に分布するように、
あらかじめ定められる。
の属性の値に対して出来る限り一様に分布するように、
あらかじめ定められる。
次に、変換された結果の新た。な幾つがの属性の値を使
用して原データのデータ格納番地を算定するとともに、
その索引データを作成する。。
用して原データのデータ格納番地を算定するとともに、
その索引データを作成する。。
そして、原データを、算定したデータ格納番地にそのま
ま格納することにより、原データは、変換された結果の
新たな幾つかの属性の値に対してほぼ一様に分布するの
で、ファイルに効率良く格納される。
ま格納することにより、原データは、変換された結果の
新たな幾つかの属性の値に対してほぼ一様に分布するの
で、ファイルに効率良く格納される。
このように、−様に分布していないデータに対して効率
的でない従来のデータ格納方式に対して、本発明のデー
タ格納方式は、あらかじめアフィン変換によって一様分
布に近づけることにより、ファイルにデータを効率良く
格納することができる。
的でない従来のデータ格納方式に対して、本発明のデー
タ格納方式は、あらかじめアフィン変換によって一様分
布に近づけることにより、ファイルにデータを効率良く
格納することができる。
次に本発明の実施例について図面を参照して説明する。
第1図は本発明のデータ格納方式の一実施例を示すブロ
ック図であ、る。
ック図であ、る。
第1図に示すように、アフィン変換手段1は、格納する
原データDのそれぞれに有する索引に使用する幾つかの
属性の値に、あらかじめ定められたアフィン変換を実施
している。
原データDのそれぞれに有する索引に使用する幾つかの
属性の値に、あらかじめ定められたアフィン変換を実施
している。
また、データ格納番地算定手段2は、アフィン変換手段
1で変換された新たな幾っがの属性の値から、原データ
Dのそれぞれを格納すべきファイルF内のデータ格納番
地を算定している。
1で変換された新たな幾っがの属性の値から、原データ
Dのそれぞれを格納すべきファイルF内のデータ格納番
地を算定している。
一方、データ格納手段3は、データ格納番地算定手段2
で算定されたファイルF内のデータ格納番地に原データ
Dのそれぞれを格納している。
で算定されたファイルF内のデータ格納番地に原データ
Dのそれぞれを格納している。
第2図は本実施例のデータ格納方式の動作の一例を示す
流れ図である。
流れ図である。
第2図のステップ21で、アフィン変換手段1は、変換
された新たな幾つかの属性の値として得られるベクトル
g=[:g+、・・・・・・・・・g、)tを、索引に
使用する幾つかの属性の値で構成されるベタ1〜ルに=
(k、、・・・・・・・・1(。〕1とアフィン変換行
列Tとの積として、 g=T*k を計算している。
された新たな幾つかの属性の値として得られるベクトル
g=[:g+、・・・・・・・・・g、)tを、索引に
使用する幾つかの属性の値で構成されるベタ1〜ルに=
(k、、・・・・・・・・1(。〕1とアフィン変換行
列Tとの積として、 g=T*k を計算している。
次に、ステップ22で、データ格納番地算定手段2は、
ベクトルgから格納すべき番地Adrを以下のように算
定している。
ベクトルgから格納すべき番地Adrを以下のように算
定している。
すなわち、g+の取り得る最大の値と最小の値とを各々
b 1 + a I とし、glに対するそのときの等
分割数をnlとして、 A d r = X n X 1 = n I* X + −H+ Y +ただし
、i−2,・・・・・・nである。
b 1 + a I とし、glに対するそのときの等
分割数をnlとして、 A d r = X n X 1 = n I* X + −H+ Y +ただし
、i−2,・・・・・・nである。
ただし、i−1,・・・・・・nであり、171はZを
越えない最大の整数である。
越えない最大の整数である。
X、=Y。
を算定している。
さらに、ステップ23で、データ格納手段3は、原デー
タDのそれぞれを以下のようにして格納している。
タDのそれぞれを以下のようにして格納している。
まず、ステップ23−1で、もし、Adrで示された番
地に既にデータが格納され、これ以上格納できないなら
ば、glの等分割数を適当数だけ増加させ、これに応じ
て、すべてのデータの格納状態の再構成を実施する。
地に既にデータが格納され、これ以上格納できないなら
ば、glの等分割数を適当数だけ増加させ、これに応じ
て、すべてのデータの格納状態の再構成を実施する。
そこで、ステップ23−2で、Adrで示される番地に
格納できる領域が存在すれば、その領域に原データを格
納する。
格納できる領域が存在すれば、その領域に原データを格
納する。
次に示す第1表は格納する原データDの一例を示してい
る。
る。
第1表
なお、最初、A1とA2とも分割はなくn+=1であり
、番地に格納できるデータの数も1として説明する。
、番地に格納できるデータの数も1として説明する。
また、アフィン変換行列Tは、原データDが変換後の新
たな2つの属性の値に対して出来る限り一様に分布する
ように、あらかじめ次の値に定められているものとする
。
たな2つの属性の値に対して出来る限り一様に分布する
ように、あらかじめ次の値に定められているものとする
。
第1表の原デ、−タDは、三つの属性At。
A2.A3を有しているが、以下に、索引に使用する属
性は、A1とA2との二つであり、A1とA2の取り得
る値がそれぞれOと1との間である場合について、デー
タが全く格納されていないファイルに第1表の原データ
Dを格納する例を説明する。
性は、A1とA2との二つであり、A1とA2の取り得
る値がそれぞれOと1との間である場合について、デー
タが全く格納されていないファイルに第1表の原データ
Dを格納する例を説明する。
この結果、変換後の新たな属性のへりI〜ルど−(g+
、gz )tの取り得る値は、gl が−1と1との
間で、gzが0と1.414との間になる。
、gz )tの取り得る値は、gl が−1と1との
間で、gzが0と1.414との間になる。
まず、第1表の最初の原データD1について。
第2図のステップ21で、上記のアフィン変換を行って
、g=(0,,3,0,1414)’を得ることができ
る。
、g=(0,,3,0,1414)’を得ることができ
る。
次に、第2図のステップ22で、番地A、drを求めれ
ば、Y、=O1X1=0、Y2=O。
ば、Y、=O1X1=0、Y2=O。
X2−0で、Adr=oとなる。そこで、Dlを番地0
に格納する。
に格納する。
第3図は第1表の原データを順次格納するときの格納状
況の一例を示す格納状況説明図である。
況の一例を示す格納状況説明図である。
第3図(a)に示すように、D1格納時には、Dlが番
地Oに格納される。
地Oに格納される。
次に、第1表の原データD2についても、同様に番地A
drを求めれば、Dlと同じAdr=Oとなる。そこで
、第2図のステップ23−1で、分割数を増加させ、n
l =2とする。
drを求めれば、Dlと同じAdr=Oとなる。そこで
、第2図のステップ23−1で、分割数を増加させ、n
l =2とする。
そして、Dlに対して再びAdrを求めれば、Adr=
1となる。このため、Dlを番地1に移動する。また、
D2については、Adr=0となり、既にDlが番地1
に移動しているので、D2を番地0に格納する。
1となる。このため、Dlを番地1に移動する。また、
D2については、Adr=0となり、既にDlが番地1
に移動しているので、D2を番地0に格納する。
この結果、第3図(b)に示すように、D2格納時には
、Dlが番地1に、D2が番地Oに格納されることとな
る。
、Dlが番地1に、D2が番地Oに格納されることとな
る。
次に、D3については、Adr=1となり、再び分割し
なければならないので、n2=2とする。
なければならないので、n2=2とする。
そして、DlとD2とD3のAdrを再計算すると、D
iについてはAdr=2.D2についてはAdr=1.
D3についてはAdr=3となるので、それぞれの番地
に格納する。
iについてはAdr=2.D2についてはAdr=1.
D3についてはAdr=3となるので、それぞれの番地
に格納する。
この結果、第3図(c)に示すように、D3格納時には
、Dlが番地2に、D2が番地1、D3を番地3に格納
されることとなる。
、Dlが番地2に、D2が番地1、D3を番地3に格納
されることとなる。
以降のD4.D5.D6についても、同様の処理を施す
ことにより、第3図(d)、(e)。
ことにより、第3図(d)、(e)。
(f)に示すように、Dl、・・・・・・・・・D6が
それぞれ格納されることとなる。
それぞれ格納されることとなる。
一方、第4図は第1表の原データを従来のデータ格納方
式で格納するときの格納状況の一例を示す格納状況説明
図である。
式で格納するときの格納状況の一例を示す格納状況説明
図である。
第4図に示すように、従来のデータ格納方式のファイル
は、索引に使用する属性のA1とA2とをそれぞれ等間
隔に区分して、6つの原データD1.・・・・・・・・
・D6を格納するための8つのデータ格納番地を有、し
ている。
は、索引に使用する属性のA1とA2とをそれぞれ等間
隔に区分して、6つの原データD1.・・・・・・・・
・D6を格納するための8つのデータ格納番地を有、し
ている。
従って、第4図に示す従来のデータ格納方式のファイル
は、第3図(f)の本実施例のデ−タ格納番地に圧べて
、データ格納番地の数が多く、データを格納していない
データ格納番地の数が多くなっている。
は、第3図(f)の本実施例のデ−タ格納番地に圧べて
、データ格納番地の数が多く、データを格納していない
データ格納番地の数が多くなっている。
このように、本実施例のデータ格納方式は、アフィン変
換により、必要な格納領域が少な(、効率良くデータを
格納することができる。
換により、必要な格納領域が少な(、効率良くデータを
格納することができる。
以上述べたように、本実施例のデータ格納方式は、−様
に分布していないデータ、あるいは複数の属性の間に相
関関係が存在するデータについても、保存するファイル
の容量や索引データ量の増加を少なくするとともに、そ
の結果としてデータを取出すためのアクセスを行う時間
も短縮することができる。
に分布していないデータ、あるいは複数の属性の間に相
関関係が存在するデータについても、保存するファイル
の容量や索引データ量の増加を少なくするとともに、そ
の結果としてデータを取出すためのアクセスを行う時間
も短縮することができる。
なお、本実施例は、索引に使用する属性が2つの場合に
ついて述べているが1.2つである必要はなく9、幾つ
の場合にも適用できる7 また、本発明のデータ格納方式は、アフィン変換をデー
タ格納番地の計算の前に使用することに特徴があるので
、第2図のステップ22におけるデータ格納番地の計算
方法も、これに限ることなく、索引ファイルを使用する
方法、ハツシングによる方法、配列による方法など様々
な方法を使用することができる。
ついて述べているが1.2つである必要はなく9、幾つ
の場合にも適用できる7 また、本発明のデータ格納方式は、アフィン変換をデー
タ格納番地の計算の前に使用することに特徴があるので
、第2図のステップ22におけるデータ格納番地の計算
方法も、これに限ることなく、索引ファイルを使用する
方法、ハツシングによる方法、配列による方法など様々
な方法を使用することができる。
以上説明し、たように、本発明のデータ格納方式は、−
様に分布していないデータ、あるいは複数の属性の間に
相関関係が存在するデータについても、保存するファイ
ルの容量や索引データ量の増加を少なくするとともに、
その結果としてデータを取出すためのアクセスを行う時
間も短縮することができるという効果を有している。
様に分布していないデータ、あるいは複数の属性の間に
相関関係が存在するデータについても、保存するファイ
ルの容量や索引データ量の増加を少なくするとともに、
その結果としてデータを取出すためのアクセスを行う時
間も短縮することができるという効果を有している。
第1図は本発明のデータ格納方式の一実施例を示すブロ
ック図、第2図は本実施例のデータ格納方式の動作の一
例を示す流れ図、第3図は第1表の原データを順次格納
するときの格納状況の一例を示す格納状況説明図、第4
図は第1表の原デ−夕を従来のデータ格納方式で格納す
るときの格納状況の一例を示す格納状況説明図である。 1・・・・・・アフィン変換手段、2・・・・・・デー
タ格納番地算・定手段、3・・・・・・データ格納手段
、D・・・・・・原データ、F・・・・・・ファイル。
ック図、第2図は本実施例のデータ格納方式の動作の一
例を示す流れ図、第3図は第1表の原データを順次格納
するときの格納状況の一例を示す格納状況説明図、第4
図は第1表の原デ−夕を従来のデータ格納方式で格納す
るときの格納状況の一例を示す格納状況説明図である。 1・・・・・・アフィン変換手段、2・・・・・・デー
タ格納番地算・定手段、3・・・・・・データ格納手段
、D・・・・・・原データ、F・・・・・・ファイル。
Claims (1)
- 【特許請求の範囲】 複数の属性を有する原データの集合を保存するファイル
のデータ格納方式において、 (A)あらかじめ定められたアフィン変換によって、前
記原データに有する幾つかの属性の値を変換するアフィ
ン変換手段、 (B)前記アフィン変換手段で変換された新たな幾つか
の属性の値から、前記原データのそれぞれを格納すべき
前記ファイル内のデータ格納番地を算定するデータ格納
番地算定手段、 (C)前記データ格納番地算定手段で算定されたデータ
格納番地に前記原データのそれぞれを格納するデータ格
納手段、 を備えることを特徴とするデータ格納方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63147248A JPH022433A (ja) | 1988-06-14 | 1988-06-14 | データ格納方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63147248A JPH022433A (ja) | 1988-06-14 | 1988-06-14 | データ格納方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH022433A true JPH022433A (ja) | 1990-01-08 |
Family
ID=15425934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63147248A Pending JPH022433A (ja) | 1988-06-14 | 1988-06-14 | データ格納方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH022433A (ja) |
-
1988
- 1988-06-14 JP JP63147248A patent/JPH022433A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3380954B1 (en) | Storing and retrieving data of a data cube | |
US7133858B1 (en) | Partial pre-aggregation in relational database queries | |
US6775681B1 (en) | Evaluation of grouping sets by reduction to group-by clause, with or without a rollup operator, using temporary tables | |
US5832475A (en) | Database system and method employing data cube operator for group-by operations | |
US7530012B2 (en) | Incorporation of spreadsheet formulas of multi-dimensional cube data into a multi-dimensional cube | |
US6920460B1 (en) | Systems and methods for managing partitioned indexes that are created and maintained by user-defined indexing schemes | |
US7734615B2 (en) | Performance data for query optimization of database partitions | |
US7702622B2 (en) | Advanced techniques for SQL generation of performancepoint business rules | |
Wang et al. | Supporting a light-weight data management layer over hdf5 | |
JP4609995B2 (ja) | オンライン分析処理(olap)のための方法およびシステム | |
JP2003500741A (ja) | 単一の集計プロセスで複数のデータマートを実装するための方法および装置 | |
JP2006503357A5 (ja) | ||
US6502089B1 (en) | Generating restriction queries using tensor representations | |
JP2001331509A (ja) | リレーショナルデータベース処理装置、リレーショナルデータベースの処理方法及びリレーショナルデータベースの処理プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
US7979412B2 (en) | Object query over previous query results | |
Su et al. | Indexing and parallel query processing support for visualizing climate datasets | |
US7085754B2 (en) | System and a two-pass algorithm for determining the optimum access path for multi-table SQL queries | |
US6745173B1 (en) | Generating in and exists queries using tensor representations | |
Page | A study of a parallel database machine and its performance the NCR/Teradata DBC/1012 | |
JPH022433A (ja) | データ格納方式 | |
JPH08235033A (ja) | オブジェクト指向データベース管理システムにおける結合演算方式 | |
CN114328610A (zh) | 基于HBase分布式存储系统的剧场数据精准查询方法 | |
CN111399838A (zh) | 一种基于SparkSQL和物化视图的数据建模方法及装置 | |
JPH01314348A (ja) | データ格納方式 | |
US20240346334A1 (en) | Heuristic search for optimal node in a generalization lattice |