JPH022433A - データ格納方式 - Google Patents

データ格納方式

Info

Publication number
JPH022433A
JPH022433A JP63147248A JP14724888A JPH022433A JP H022433 A JPH022433 A JP H022433A JP 63147248 A JP63147248 A JP 63147248A JP 14724888 A JP14724888 A JP 14724888A JP H022433 A JPH022433 A JP H022433A
Authority
JP
Japan
Prior art keywords
data
data storage
stored
affine transformation
original data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63147248A
Other languages
English (en)
Inventor
Kyoji Kawagoe
恭二 川越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63147248A priority Critical patent/JPH022433A/ja
Publication of JPH022433A publication Critical patent/JPH022433A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はデータ格納方式に関し、特に幾つかの属性を有
するデータの集合をファイルに格納するデータ格納方式
に関する。
(″従来の技術〕 従来のデータ格納方式は、例えば、会社の従業i情報、
販売情報、生産管理情報などを統一的に管理する関係デ
ータベースの格納において、原データを一意に識別でき
る属性である一次キーによって原データの゛格納番地を
定めて格納するとともに、−次キー以外の属性の値から
、その値を持つ原データを取出すための索引データを作
成して格納する方式がある。
このような索引データを作成する方式としては、各属性
ごとにそれぞれの値から原データの格納番地を得ること
ができる格納方式がある。
二の格納方式の参考文献には、ソーティング・アンド・
サーチング(Sort−ing  andSearch
ing)、6.5節、アディソン・ウェズレイ(Add
ison−Wesley)社、1973力(ある。
また、複数の属性の索引データを一括して格納する方式
がある。
この格納方式を示している参考文献には、ザ・フォード
トリー・アンド・リレイティッド・ヒエラキカル・デー
タ・スI・ラフチャ(TheQ+」adtree  a
ncL  Re fatedHierarchical
  Data  5truCtureS)、コンピユー
テイング・サーベイズ(Computing  5ur
veys)、16巻2号、187頁〜260頁、ACM
1984がある。
〔発明が解決しようとする課題〕
上述した従来のデータ格納方式は、−様に分布するデー
タに対しては効率良く格納することができるが、分布に
偏りが存在したり複数の属性の間で相関関係が存在する
データについては、保存するファイルの容量や索引デー
タ量が増加し、その結果としてデータのアクセスを行う
時間も増加するという問題点がある。
本発明の目的は、−様に分布していないデータ、あるい
は複数の属性の間に相関関係が存在するデータについて
も、保存するファイルの容量や索引データ量の増加を少
なくするとともに、その結果としてデータを取出すため
のアクセスを行う時間も短縮することができるデ←り格
納方式を提供することにある。
〔課題を解決するための手段〕
本発明のデータ格納方式は、複数の属性を有する原デー
タの集合を保存するファイルのデータ格納方式において
、 (A)あらかじめ定められたアフィン変換によって、前
記原データに有する幾つかの属性の値を変換するアフィ
ン変換手段、 (B)前記アフィン変換手段で変換された新たな幾つか
の属性の値から、前記原データのそれぞれを格納すべき
前記ファイル内のデータ格納番地を算定するデータ格納
番地算定手段、 (C)前記データ格納番地算定手段で算定されたデータ
格納番地に前記原データのそれぞれを格納するデータ格
納手段、 を流えて構成されている。
〔作用〕
本発明のデータ格納方式は、索引に使用する幾つかの属
性の値に対して一様に′分布、していない原データにつ
い□て、まず、その索引に使用する幾つかの属性の値に
アフィン変換を施している。
このアフィン変換は、原データが変換後の新たな幾つか
の属性の値に対して出来る限り一様に分布するように、
あらかじめ定められる。
次に、変換された結果の新た。な幾つがの属性の値を使
用して原データのデータ格納番地を算定するとともに、
その索引データを作成する。。
そして、原データを、算定したデータ格納番地にそのま
ま格納することにより、原データは、変換された結果の
新たな幾つかの属性の値に対してほぼ一様に分布するの
で、ファイルに効率良く格納される。
このように、−様に分布していないデータに対して効率
的でない従来のデータ格納方式に対して、本発明のデー
タ格納方式は、あらかじめアフィン変換によって一様分
布に近づけることにより、ファイルにデータを効率良く
格納することができる。
〔実施例〕
次に本発明の実施例について図面を参照して説明する。
第1図は本発明のデータ格納方式の一実施例を示すブロ
ック図であ、る。
第1図に示すように、アフィン変換手段1は、格納する
原データDのそれぞれに有する索引に使用する幾つかの
属性の値に、あらかじめ定められたアフィン変換を実施
している。
また、データ格納番地算定手段2は、アフィン変換手段
1で変換された新たな幾っがの属性の値から、原データ
Dのそれぞれを格納すべきファイルF内のデータ格納番
地を算定している。
一方、データ格納手段3は、データ格納番地算定手段2
で算定されたファイルF内のデータ格納番地に原データ
Dのそれぞれを格納している。
第2図は本実施例のデータ格納方式の動作の一例を示す
流れ図である。
第2図のステップ21で、アフィン変換手段1は、変換
された新たな幾つかの属性の値として得られるベクトル
g=[:g+、・・・・・・・・・g、)tを、索引に
使用する幾つかの属性の値で構成されるベタ1〜ルに=
(k、、・・・・・・・・1(。〕1とアフィン変換行
列Tとの積として、 g=T*k を計算している。
次に、ステップ22で、データ格納番地算定手段2は、
ベクトルgから格納すべき番地Adrを以下のように算
定している。
すなわち、g+の取り得る最大の値と最小の値とを各々
b 1 + a I とし、glに対するそのときの等
分割数をnlとして、 A d r = X n X 1 = n I* X + −H+ Y +ただし
、i−2,・・・・・・nである。
ただし、i−1,・・・・・・nであり、171はZを
越えない最大の整数である。
X、=Y。
を算定している。
さらに、ステップ23で、データ格納手段3は、原デー
タDのそれぞれを以下のようにして格納している。
まず、ステップ23−1で、もし、Adrで示された番
地に既にデータが格納され、これ以上格納できないなら
ば、glの等分割数を適当数だけ増加させ、これに応じ
て、すべてのデータの格納状態の再構成を実施する。
そこで、ステップ23−2で、Adrで示される番地に
格納できる領域が存在すれば、その領域に原データを格
納する。
次に示す第1表は格納する原データDの一例を示してい
る。
第1表 なお、最初、A1とA2とも分割はなくn+=1であり
、番地に格納できるデータの数も1として説明する。
また、アフィン変換行列Tは、原データDが変換後の新
たな2つの属性の値に対して出来る限り一様に分布する
ように、あらかじめ次の値に定められているものとする
第1表の原デ、−タDは、三つの属性At。
A2.A3を有しているが、以下に、索引に使用する属
性は、A1とA2との二つであり、A1とA2の取り得
る値がそれぞれOと1との間である場合について、デー
タが全く格納されていないファイルに第1表の原データ
Dを格納する例を説明する。
この結果、変換後の新たな属性のへりI〜ルど−(g+
 、gz )tの取り得る値は、gl が−1と1との
間で、gzが0と1.414との間になる。
まず、第1表の最初の原データD1について。
第2図のステップ21で、上記のアフィン変換を行って
、g=(0,,3,0,1414)’を得ることができ
る。
次に、第2図のステップ22で、番地A、drを求めれ
ば、Y、=O1X1=0、Y2=O。
X2−0で、Adr=oとなる。そこで、Dlを番地0
に格納する。
第3図は第1表の原データを順次格納するときの格納状
況の一例を示す格納状況説明図である。
第3図(a)に示すように、D1格納時には、Dlが番
地Oに格納される。
次に、第1表の原データD2についても、同様に番地A
drを求めれば、Dlと同じAdr=Oとなる。そこで
、第2図のステップ23−1で、分割数を増加させ、n
l =2とする。
そして、Dlに対して再びAdrを求めれば、Adr=
1となる。このため、Dlを番地1に移動する。また、
D2については、Adr=0となり、既にDlが番地1
に移動しているので、D2を番地0に格納する。
この結果、第3図(b)に示すように、D2格納時には
、Dlが番地1に、D2が番地Oに格納されることとな
る。
次に、D3については、Adr=1となり、再び分割し
なければならないので、n2=2とする。
そして、DlとD2とD3のAdrを再計算すると、D
iについてはAdr=2.D2についてはAdr=1.
D3についてはAdr=3となるので、それぞれの番地
に格納する。
この結果、第3図(c)に示すように、D3格納時には
、Dlが番地2に、D2が番地1、D3を番地3に格納
されることとなる。
以降のD4.D5.D6についても、同様の処理を施す
ことにより、第3図(d)、(e)。
(f)に示すように、Dl、・・・・・・・・・D6が
それぞれ格納されることとなる。
一方、第4図は第1表の原データを従来のデータ格納方
式で格納するときの格納状況の一例を示す格納状況説明
図である。
第4図に示すように、従来のデータ格納方式のファイル
は、索引に使用する属性のA1とA2とをそれぞれ等間
隔に区分して、6つの原データD1.・・・・・・・・
・D6を格納するための8つのデータ格納番地を有、し
ている。
従って、第4図に示す従来のデータ格納方式のファイル
は、第3図(f)の本実施例のデ−タ格納番地に圧べて
、データ格納番地の数が多く、データを格納していない
データ格納番地の数が多くなっている。
このように、本実施例のデータ格納方式は、アフィン変
換により、必要な格納領域が少な(、効率良くデータを
格納することができる。
以上述べたように、本実施例のデータ格納方式は、−様
に分布していないデータ、あるいは複数の属性の間に相
関関係が存在するデータについても、保存するファイル
の容量や索引データ量の増加を少なくするとともに、そ
の結果としてデータを取出すためのアクセスを行う時間
も短縮することができる。
なお、本実施例は、索引に使用する属性が2つの場合に
ついて述べているが1.2つである必要はなく9、幾つ
の場合にも適用できる7 また、本発明のデータ格納方式は、アフィン変換をデー
タ格納番地の計算の前に使用することに特徴があるので
、第2図のステップ22におけるデータ格納番地の計算
方法も、これに限ることなく、索引ファイルを使用する
方法、ハツシングによる方法、配列による方法など様々
な方法を使用することができる。
〔発明の効果〕
以上説明し、たように、本発明のデータ格納方式は、−
様に分布していないデータ、あるいは複数の属性の間に
相関関係が存在するデータについても、保存するファイ
ルの容量や索引データ量の増加を少なくするとともに、
その結果としてデータを取出すためのアクセスを行う時
間も短縮することができるという効果を有している。
【図面の簡単な説明】
第1図は本発明のデータ格納方式の一実施例を示すブロ
ック図、第2図は本実施例のデータ格納方式の動作の一
例を示す流れ図、第3図は第1表の原データを順次格納
するときの格納状況の一例を示す格納状況説明図、第4
図は第1表の原デ−夕を従来のデータ格納方式で格納す
るときの格納状況の一例を示す格納状況説明図である。 1・・・・・・アフィン変換手段、2・・・・・・デー
タ格納番地算・定手段、3・・・・・・データ格納手段
、D・・・・・・原データ、F・・・・・・ファイル。

Claims (1)

  1. 【特許請求の範囲】 複数の属性を有する原データの集合を保存するファイル
    のデータ格納方式において、 (A)あらかじめ定められたアフィン変換によって、前
    記原データに有する幾つかの属性の値を変換するアフィ
    ン変換手段、 (B)前記アフィン変換手段で変換された新たな幾つか
    の属性の値から、前記原データのそれぞれを格納すべき
    前記ファイル内のデータ格納番地を算定するデータ格納
    番地算定手段、 (C)前記データ格納番地算定手段で算定されたデータ
    格納番地に前記原データのそれぞれを格納するデータ格
    納手段、 を備えることを特徴とするデータ格納方式。
JP63147248A 1988-06-14 1988-06-14 データ格納方式 Pending JPH022433A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63147248A JPH022433A (ja) 1988-06-14 1988-06-14 データ格納方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63147248A JPH022433A (ja) 1988-06-14 1988-06-14 データ格納方式

Publications (1)

Publication Number Publication Date
JPH022433A true JPH022433A (ja) 1990-01-08

Family

ID=15425934

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63147248A Pending JPH022433A (ja) 1988-06-14 1988-06-14 データ格納方式

Country Status (1)

Country Link
JP (1) JPH022433A (ja)

Similar Documents

Publication Publication Date Title
EP3380954B1 (en) Storing and retrieving data of a data cube
US7133858B1 (en) Partial pre-aggregation in relational database queries
US6775681B1 (en) Evaluation of grouping sets by reduction to group-by clause, with or without a rollup operator, using temporary tables
US5832475A (en) Database system and method employing data cube operator for group-by operations
US7530012B2 (en) Incorporation of spreadsheet formulas of multi-dimensional cube data into a multi-dimensional cube
US6920460B1 (en) Systems and methods for managing partitioned indexes that are created and maintained by user-defined indexing schemes
US7734615B2 (en) Performance data for query optimization of database partitions
US7702622B2 (en) Advanced techniques for SQL generation of performancepoint business rules
Wang et al. Supporting a light-weight data management layer over hdf5
JP4609995B2 (ja) オンライン分析処理(olap)のための方法およびシステム
JP2003500741A (ja) 単一の集計プロセスで複数のデータマートを実装するための方法および装置
JP2006503357A5 (ja)
US6502089B1 (en) Generating restriction queries using tensor representations
JP2001331509A (ja) リレーショナルデータベース処理装置、リレーショナルデータベースの処理方法及びリレーショナルデータベースの処理プログラムを記録したコンピュータ読み取り可能な記録媒体
US7979412B2 (en) Object query over previous query results
Su et al. Indexing and parallel query processing support for visualizing climate datasets
US7085754B2 (en) System and a two-pass algorithm for determining the optimum access path for multi-table SQL queries
US6745173B1 (en) Generating in and exists queries using tensor representations
Page A study of a parallel database machine and its performance the NCR/Teradata DBC/1012
JPH022433A (ja) データ格納方式
JPH08235033A (ja) オブジェクト指向データベース管理システムにおける結合演算方式
CN114328610A (zh) 基于HBase分布式存储系统的剧场数据精准查询方法
CN111399838A (zh) 一种基于SparkSQL和物化视图的数据建模方法及装置
JPH01314348A (ja) データ格納方式
US20240346334A1 (en) Heuristic search for optimal node in a generalization lattice