JPH1011338A

JPH1011338A - リレーショナル・データベース・システム，該システムへのデータ格納・読み出し方法，およびそのためのプログラムを記録した記録媒体

Info

Publication number: JPH1011338A
Application number: JP8164008A
Authority: JP
Inventors: Kunisaku Ikeda; 国作池田; Hiroaki Yagi; 宏明八木
Original assignee: Hitachi Information Systems Ltd
Current assignee: Hitachi Information Systems Ltd
Priority date: 1996-06-25
Filing date: 1996-06-25
Publication date: 1998-01-16

Abstract

(57)【要約】【課題】格納容量の削減とアクセス効率向上を両立さ
せることが可能なＲＤＢ、該ＲＤＢへのデータ圧縮格納
／検索時の読み出し復元を行うデータ格納・読み出し方
法、およびそのための制御プログラムを記録した記録媒
体を提供する。【解決手段】格納データレコード（入力レコードａ〜
ｄ）を、主キー部と、サブキー部と、共通フィールド部
と、個別フィールド部とに区分けし、主キー部同値の複
数レコードを、主キー部と共通データフィールド部とＮ
ＵＬＬ値フィールド部とで構成される一つの親レコード
（共通格納レコード）と、主キー部と、サブキー部
と、個別データフィールド部とＮＵＬＬ値フィールド部
とで構成される複数の子レコード（個別格納レコード
〜）とに分割してデータベースに格納する。また、指
定された主キーとサブキーから読み出した該当の親レコ
ードと、子レコードとを１レコードに合成し、格納デー
タレコードを復元する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、リレーショナル・
データベース・システム（Ｒelational Ｄata Ｂase Ｓ
ystem：以下ＲＤＢと略す）に関するものであり、特
に、データを大幅に圧縮して格納することが可能なＲＤ
Ｂ、該ＲＤＢへのデータ圧縮格納および読み出し復元を
行うデータ格納・読み出し方法、およびそのための制御
プログラムを記録した記録媒体に関する。

【０００２】

【従来の技術】ＲＤＢは、データを複数の表の形式で記
憶するデータベースである。各表はデータ要素の集まり
である行（レコードともいう）と列から構成され、各表
は他の表と区別するための表名を持っている。ＲＤＢに
おける各表の行の順序は任意であり、また、一つ以上の
表に対して自由に選択（Ｓelection；表から特定の条件
に合致した行を取り出す／Ｒestriction；制約），射影
（Ｐrojection；表から特定の列だけを取り出す），結
合（Ｊoin；２つ以上の表から１つの表を生成）などの
関係演算，合併（Ｕnion；２つの照会結果を連接して合
わせる），共通（Ｉntersection；複数の表間で共通の
内容を取り出す），差（Ｄifference；複数の表間の差
分データを取り出す）などの集合演算、挿入（Ｉnsert;
行単位での挿入），削除（Ｄelete；行単位での削
除），更新（Ｕpdate；データ要素単位での更新）など
の変更操作が可能である。ＲＤＢは、表表現であるため
一覧性があり親しみやすくまた各種操作が理解しやすい
ために広く研究されて様々な改良が加えられている。な
お、ＲＤＢの詳細については、例えば、平尾隆行著「関
係データベースシステム」(1991年3月20日近代科学社
発行)を参照されたい。

【０００３】ＲＤＢの表定義設計は、対象業務の論理デ
ータモデルを設計し、正規化手順を経てＲＤＢの表定義
における列定義を決定する。通常、正規化手順により表
列定義の主キー以外の項目属性の間に従属関係がなくな
るまで正規化を行い、各表の列定義を決定する。また、
正規化を行うことで、各表の列同志の項目重複を避ける
ことができる。以下、その例を具体的に説明する。

【０００４】（例題）ある契約マスタの非正規化型とし
て論理データ項目が以下のケースを想定する。１．証券番号２．顧客番号３．契約者氏名４．契約者住所５．契約者電話番号６．証券種類７．契約明細項目１（ｅｘ；契約期間）８．契約明細項目２（ｅｘ；契約料）

【０００５】これらのデータにおいて、同一顧客が契約
するセット商品の契約情報をＲＤＢ上で保有管理する場
合、個別の契約内容を（証券番号＋枝番）で登録管理す
るケースでは、表定義の列定義項目として以下の構成が
考えられる。（表定義Ａ）１．証券番号２．証券番号枝番３．顧客番号４．契約者氏名５．契約者住所６．契約者電話番号７．証券種類８．契約明細項目１（ｅｘ；契約期間）９．契約明細項目２（ｅｘ；契約料）

【０００６】キーとして「証券番号＋証券番号枝番」を
考えた場合、表定義Ａにおいてデータ項目３〜６につい
ては、顧客番号をキーとする従属関係が存在するため、
正規化によりＲＤＢにおけるデータモデルの表定義は、
次のように２つに分割される。（表定義１）１．証券番号２．証券番号枝番３．顧客番号４．証券種類５．契約明細項目１（ｅｘ；契約期間）６．契約明細項目２（ｅｘ；契約料）（表定義２）１．顧客番号２．契約者氏名３．契約者住所４．契約者電話番号

【０００７】上記のような表定義においてマスタ内容の
照会処理を考えた場合、表へのアクセスは、１．表定義１からの契約明細の検索アクセス２．表定義２から該当契約の契約者情報（氏名，住所，
電話番号など）の検索アクセスの２回の表アクセスを行うことになる。

【０００８】

【発明が解決しようとする課題】上記例題の表定義構成
において、次のような条件を有する場合には、表へのア
クセス時間が問題となってくる。１．主キーの枝番で保管する同一顧客の契約レコードが
平均２件以上存在する。（同一キーで検索できる表レコ
ードが２件以上存在する）２．保有契約件数が多数存在する。３．表の１レコード内に従属関係の項目が多数存在す
る。（上記例題での契約者氏名，契約者住所，契約者電話番
号など）

【０００９】上記のような条件のデータ項目を保有する
表定義を考えた場合、格納容量を削減するためには、上
記例題のように、従属関係項目を別表定義として分離
し、２表にすることが考えられる。しかしながら、この
ようにした場合には格納容量は削減できるが、アクセス
対象の表が２表になるため、アクセス効率が低下すると
いう新たな問題を招く。また、全てのデータ項目を１表
で定義した場合、表へのアクセスは、１表のみとなり表
へのアクセス効率は向上するが、表列定義内の各レコー
ドで同一主キー同志で「同一な従属関係の項目」が多数
重複して存在するため、ＲＤＢの格納容量が膨大とな
る。従って、上記のようなケースでは、格納容量の削減
とアクセス効率向上を両立させることが困難になる。本
発明は、上記問題点を解決し、格納容量の削減とアクセ
ス効率向上を両立させることが可能なＲＤＢ、該ＲＤＢ
へのデータ圧縮格納／検索時の読み出し復元を行うデー
タ格納・読み出し方法、およびそのための制御プログラ
ムを記録した記録媒体を提供することを目的とする。

【００１０】

【課題を解決するための手段】本発明は、上記目的を達
成するために、ＲＤＢにおいて、格納データレコード
（入力レコードａ〜ｄ）を、主キー部と、サブキー部
と、共通フィールド部と、個別フィールド部とに区分け
し、主キー部が同値を持つデータレコードが複数レコー
ド存在する場合に、主キー部同値の複数レコードを、主
キー部と共通データフィールド部とＮＵＬＬ値フィール
ド部とで構成される一つの親レコード（共通格納レコー
ド１）と、主キー部と、サブキー部と、個別データフィ
ールド部とＮＵＬＬ値フィールド部とで構成される複数
の子レコード（個別格納レコード〜）とに、分割し
て格納するレコード分割・格納手段と、指定された主キ
ーとサブキーから読み出した該当の親レコード（共通格
納レコード）と、子レコード（個別格納レコード〜
）とを１レコードに合成し、格納データレコード（入
力レコードａ〜ｄ）を復元するレコード読み出し復元手
段とを備えたことを特徴としている。

【００１１】また、この場合、親レコード（共通格納レ
コード）と、前記親レコード（共通格納レコード）
に対応する子レコード（個別格納レコード〜）を、
共に同じレコード・フォーマット、レコード長で作成
し、親レコード（共通格納レコード）における共通デ
ータフィールド部は、子レコード（個別格納レコード
〜）におけるＮＵＬＬ値フィールド部に、また、子レ
コード（個別格納レコード〜）における個別データ
フィールド部は、親レコード（共通格納レコード）に
おけるＮＵＬＬ値フィールド部に、それぞれ対応するよ
うに格納データレコード（入力レコードａ〜ｄ）をフォ
ーマットすることを特徴としている。

【００１２】また、本発明のリレーショナル・データベ
ースにおけるデータレコードの格納・読み出し方法は、
格納データレコード（入力レコードａ〜ｄ）を、主キー
部と、サブキー部と、共通フィールド部と、個別フィー
ルド部とに区分けし、主キー部が同値を持つデータレコ
ードが複数レコード存在する場合に、主キー部同値の複
数レコードを、主キー部と共通データフィールド部とＮ
ＵＬＬ値フィールド部とで構成される一つの親レコード
（共通格納レコード）と、主キー部と、サブキー部
と、個別データフィールド部とＮＵＬＬ値フィールド部
とで構成される複数の子レコード（個別格納レコード
〜）とに分割してデータベースに格納し、指定された
主キーとサブキーから読み出した該当の親レコード（共
通格納レコード）と、子レコード（個別格納レコード
〜のいずれか）とを１レコードに合成し、格納デー
タレコード（入力レコードａ〜ｄ）を復元することを特
徴としている。

【００１３】また、この場合、親レコード（共通格納レ
コード）と、前記親レコード（共通格納レコード）
に対応する子レコード（個別格納レコード〜）を、
共に同じレコード・フォーマット、レコード長で作成
し、親レコード（共通格納レコード）における共通デ
ータフィールド部は、子レコード（個別格納レコード
〜）におけるＮＵＬＬ値フィールド部に、また、子レ
コード（個別格納レコード〜）における個別データ
フィールド部は、親レコード（共通格納レコード）に
おけるＮＵＬＬ値フィールド部に、それぞれ対応するよ
う格納データレコード（入力レコードａ〜ｄ）をフォー
マットすることを特徴としている。

【００１４】さらに、本発明の記録媒体は、格納データ
レコード（入力レコードａ〜ｄ）を、主キー部と、サブ
キー部と、共通フィールド部と、個別フィールド部とに
区分けし、主キー部が同値を持つデータレコードが複数
レコード存在する場合に、主キー部同値の複数レコード
を、主キー部と、共通データフィールド部と、ＮＵＬＬ
値フィールド部とで構成される一つの親レコード（共通
格納レコード）と、主キー部と、サブキー部と、個別
データフィールド部と、ＮＵＬＬ値フィールド部とで構
成される複数の子レコード（個別格納レコード〜）
とに、分割して格納するレコード分割・格納手順と、指
定された主キーとサブキーから読み出した該当の親レコ
ード（共通格納レコード）と、子レコード（個別格納
レコード〜）とを１レコードに合成し、格納データ
レコード（入力レコードａ〜ｄ）を復元するレコード読
み出し復元手順を含んだデータベース・アクセス制御プ
ログラムが記録されたものであることを特徴としてい
る。

【００１５】また、この場合、レコード分割・格納手順
は、親レコード（共通格納レコード）と、前記親レコ
ード（共通格納レコード）に対応する子レコード（個
別格納レコード〜）を、共に同じレコード・フォー
マット、レコード長で作成し、親レコード（共通格納レ
コード）における共通データフィールド部は、子レコ
ード（個別格納レコード〜）におけるＮＵＬＬ値フ
ィールド部に、また、子レコード（個別格納レコード
〜）における個別データフィールド部は、親レコード
（共通格納レコード）におけるＮＵＬＬ値フィールド
部に、それぞれ対応するよう格納データレコード（入力
レコードａ〜ｄ）をフォーマットするようにしたもので
あることを特徴としている。

【００１６】

【発明の実施の形態】表定義上で、１表にて定義した場
合（表定義Ａのケース）、１表の列定義項目内で従属関
係にある項目については、同一主キー（枝番なし）同志
のレコード間で項目値が重複して格納されてしまうた
め、ＲＤＢ格納容量が増大する。このため、同一主キー
（枝番なし）同志のレコード間での従属関係にある項目
の格納を同一主キーのレコード件数分格納せず、１レコ
ード分の格納に抑えて格納できれば、２表に分割して格
納するケースとほぼ同等の格納容量となる。本発明で
は、以下の格納方法によりアクセス効率のよい１表によ
る表定義ＲＤＢを使用し、レコード間の「従属関係にあ
る項目」の重複格納を避けることにより、格納容量の削
減も実現している。

【００１７】（１）格納する主キーが重複するレコード
の各項目を、各レコード個別フィールド群と共通フィー
ルド群とに振り分けて登録する。各レコード個別項目
は、個別格納レコード「主キー＋枝番（０１〜）」に格
納する。個別格納レコード内の共通フィールドには、Ｎ
ＵＬＬ値設定として格納する。主キーが重複するレコー
ドの共通項目は、「主キー＋枝番（００）」の共通格納
レコードとして格納する。共通格納レコードの個別フィ
ールドには、個別格納レコードと反対にＮＵＬＬ値を設
定して格納する。入力レコードから共通格納レコードお
よび個別格納レコードに分離するためには、ＲＤＢの列
定義での各項目の内、どの項目が共通フィールドでどの
項目が個別フィールドかを識別する情報が必要になる。
本実施例では、本識別する情報としてＭＡＳＫテーブル
を定義しておき、該ＭＡＳＫテーブルとの突き合わせに
より格納レコードへの分離を行う。（２）レコードの復元時は、上記分割レコードを統合
し、格納時のレコードを復元する。

【００１８】上記発明の実施の形態によると、同一キー
内（枝番などで複数のレコードが存在する）の複数レコ
ード間で、重複している情報を、共通格納レコードとし
て集約するとともに、個別格納レコードは共通格納レコ
ードと逆の重複しない情報を設定し作成している。これ
により、データベースの標準機能である「連続文字圧縮
機能」が有効に働き、ディスク容量を削減することがで
きる。このとき、共通格納レコードに設定するフィール
ドと、個別格納フィールドに設定するフィールドの識別
は、ＭＡＳＫテーブルとの比較によって実現させてお
り、１項目単位に比較する方法に比較して処理効率が向
上する。また、格納レコードの復元は、共通格納レコー
ドと個別格納レコードの合成により実現させている。

【００１９】以下、本発明の実施例を図面を用いて詳細
に説明する。図１は本発明の実施例に係るリレーショナ
ル・データベース１とユーザプログラム２とデータベー
ス管理システム（ＤＢＭＳ）３とＤＢアクセス制御ルー
チン４の関係を示す概念図である。ＤＢアクセス制御ル
ーチン４は、ユーザプログラムから受け取った入力レコ
ードからリレーショナル・データベース１へ格納する格
納レコードを作成するとともに、リレーショナル・デー
タベース１に格納されている格納レコードから元の入力
レコードを復元するためのルーチンである。以下の説明
で明らかになるように、このＤＢアクセス制御ルーチン
４は、ユーザプログラムがデータベースに対しレコード
の入出力要求を行った場合、次のような処理を実施す
る。

【００２０】（１）レコード検索要求の場合、データベ
ースから共通格納レコードと個別格納レコードを入力
し、共通格納レコードと個別格納レコードでレコードを
復元処理を行い、復元したレコードをユーザプログラム
へ返す。（２）レコード更新要求の場合、データベースから共通
格納レコードを入力し、ユーザプログラムから受け取っ
たレコードと該共通格納レコードとで個別格納レコード
を作成し、個別格納レコードをデータベースに格納す
る。本発明は、このＤＢアクセス制御ルーチン４の機能
により、ユーザプログラム２側からもデータベース管理
システム（ＤＢＭＳ）３側からも、相互の関連を意識す
ることなく、リレーショナル・データベース１のアクセ
スを可能としている。

【００２１】図２は、ユーザプログラム２から入力され
る入力レコードからリレーショナル・データベース１へ
格納する格納レコードを作成する方法を示すイメージ図
である。本方法では、同一キー（枝番などで区別して管
理されている同一主キーを有するデータは同一キーとし
て取り扱う）を有する複数の入力レコードから、共通フ
ィールド（複数のレコード間で同一の情報が設定されて
いる比率が大きい項目の集まり）に該同一の情報を設定
し、個別フィールド（複数のレコード間で同一の情報が
設定されている比率が小さい項目の集まり）の情報は
「ＮＵＬＬ値」を設定した共通格納レコードと、個別フ
ィールド情報として対応する入力レコードの個別フィー
ルドの値を設定し、共通フィールドの情報として「ＮＵ
ＬＬ」値を設定（例外的に、入力レコードの共通フィー
ルドが共通格納レコードの共通フィールドの情報と異な
る場合には入力レコードの共通フィールドの情報を優先
して設定）した個別格納レコードを作成する。このよう
にして、共通格納レコードが同一キー毎に１レコード作
成され、個別格納レコードが入力レコード数だけ作成さ
れる。

【００２２】次に、図２を用いて、入力レコードから格
納レコードを作成する方法をさらに詳細に説明する。図
２の例では、入力レコードａ〜ｄはキーが全て同一のＡ
ＡＡで枝番がそれぞれ１〜４を有している。入力レコー
ドａ，ｂ，ｄの共通フィールド１が同一の情報「ＡＡ」
を有し、入力レコードｃの共通フィールド１だけが情報
「ＢＢ」を有している。また、入力レコードａ，ｂ，ｃ
の共通フィールド２が同一の情報「ＣＣ」を有し、入力
レコードｄの共通フィールド２だけが情報「ＤＤ」を有
している。個別フィールド１および２の情報は全ての入
力レコードで異なっている。

【００２３】なお、以下の説明では、簡単のために入力
レコードが４個の場合を説明しているが入力レコード数
は任意でよく、多ければ多いほど本発明の効果が顕著に
なる。また、入力レコードの共通フィールドと個別フィ
ールドとしてそれぞれ２個のみを示しているが、この数
も任意でよいことはいうまでもない。

【００２４】上述したように、共通格納レコードは、
共通フィールド１に入力レコードａ，ｂ，ｄで共通の情
報「ＡＡ」を、共通フィールド２に入力レコードａ，
ｂ，ｃで共通の情報「ＣＣ」を入れ、個別フィールド１
および２には全て「ＮＵＬＬ値」を入れることにより、
入力レコードａ〜ｄに対してただ一つ作成される。

【００２５】個別格納レコード〜の各々は、個別フ
ィールド１および２には対応する入力レコードａ〜ｄの
個別フィールド１および２の情報をそのまま入れ、共通
フィールド１および２には原則として「ＮＵＬＬ値」を
入れて作成する。例外的に、入力レコードの共通フィー
ルドの情報が共通格納レコードの共通フィールドの情
報と異なる場合に、その入力レコードに対応する個別格
納レコードの共通フィールドにその入力レコードの共通
フィールドの情報を優先的に設定するようにする。入力
レコードａ〜ｄに上記操作を行うことにより、図２に示
されているような格納レコードが作成される。特に、個
別格納レコードの共通フィールド１には「ＢＢ」が、
個別格納レコードの共通フィールド２には「ＤＤ」が
入れられることに留意されたい。

【００２６】以上の説明から明らかなように、格納レコ
ードを作成する場合、共通フィールドの情報が１番目の
入力レコードの共通フィールドの情報と同一の情報を有
する入力レコードに対応する個別格納レコードの共通フ
ィールドは「ＮＵＬＬ値」に設定されるため、データベ
ースの標準機能である「連続文字圧縮機能」が有効に働
きデータベース格納容量を削減することができる。この
ことは、入力レコード数が多く、かつ入力レコードの共
通フィールドができるだけ共通の情報を有しているほど
データベース格納容量（ディスク容量）の削減効果が大
きいことを意味している。

【００２７】なお、１番目の入力レコードの共通フィー
ルドだけが後続する他の入力レコードの共通フィールド
の値と異なっている場合には個別格納レコードの共通フ
ィールドを「ＮＵＬＬ値」に設定することができないた
め、上述した連続文字圧縮機能によるデータベース格納
容量の削減効果はなくなるが、「１番目の入力レコード
の共通フィールドだけが後続する他の入力レコードの共
通フィールドの値と異なっている場合」という状況は確
率的に小さく、ほとんどの場合に対して上記データベー
ス格納容量（ディスク容量）の削減効果が期待できる。

【００２８】次に、格納レコードから入力レコードを復
元する方法について説明する。図３は、リレーショナル
・データベース１に格納されている共通格納レコード
と個別格納レコード〜から構成される格納レコード
から入力レコードａ〜ｄ（復元後レコードａ’〜ｄ’と
して示す）を復元する方法を示すイメージ図である。レ
コードの復元は、共通格納レコードの共通フィールドの
情報と、個別格納レコードの個別フィールドの情報を合
成して行われる。ただし、個別格納レコードの共通フィ
ールドに「ＮＵＬＬ値」以外の情報が設定されている場
合には、この個別格納レコードの共通フィールド情報を
優先して採用するようにする。

【００２９】図３を用いて具体的に説明すると、復元後
レコードａ’は、共通フィールド１および２の情報とし
て共通格納レコードの共通フィールド１および２の情
報「ＡＡ」「ＣＣ」を、個別フィールド１および２の情
報として個別格納レコードの個別フィールド１および
２の情報「ああ」「いい」を抽出して合成し、復元後レ
コードｂ’は、共通フィールド１および２の情報として
共通格納レコードの共通フィールド１および２の情報
「ＡＡ」「ＣＣ」を、個別フィールド１および２の情報
として個別格納レコードの個別フィールド１および２
の情報「うう」「ええ」を抽出して合成する。

【００３０】復元後レコードｃ’は、共通フィールド１
の情報としては、個別格納レコードの共通フィールド
１に共通格納レコードの共通フィールド１の情報「Ａ
Ａ］とは異なる情報「ＢＢ」が設定されているのでこの
情報「ＢＢ」を採用するとともに、共通フィールド２の
情報として共通格納レコードの共通フィールド２の情
報「ＣＣ」を、個別フィールド１および２の情報として
個別格納レコードの個別フィールド１および２の情報
「おお」「かか」を抽出して合成する。

【００３１】復元後レコードｄ’は、共通フィールド２
の情報としては、個別格納レコードの共通フィールド
２に共通格納レコードの共通フィールド２の情報「Ｃ
Ｃ」とは異なる情報「ＤＤ」が設定されているのでこの
情報「ＤＤ」を採用するとともに、共通フィールド１の
情報として共通格納レコードの共通フィールド１の情
報「ＡＡ」を、個別フィールド１および２の情報として
個別格納レコードの個別フィールド１および２の情報
「きき」「くく」を抽出して合成する。

【００３２】図２に示したように、格納レコード作成と
して、（イ）１番目の入力レコードから共通格納レコードと１
番目の個別格納レコードを作成（ロ）２番目以降の入力レコードから２番目の個別格納
レコードを作成（共通フィールドの情報が１番目の共通
フィールドの情報と同一の場合）（ハ）２番目以降の入力レコードから２番目の個別格納
レコードを作成（共通フィールドの情報が１番目の共通
フィールドの情報と異なっている場合）の３種類ある。

【００３３】図４〜図６は、これら３種類の格納レコー
ド作成手順の具体例を説明するための図であり、ＭＡＳ
Ｋテーブルを利用している点に特徴がある。図４は同一
キー（ＡＡＡ）を有する入力レコードに対応する格納レ
コードを作成する場合の初回の格納レコード作成手順を
示す図であり、この手順により１番目の入力レコードａ
から共通格納レコードと１番目の個別格納レコード
が作成される。同図に示すように、初回の格納レコード
作成手順は、まず、ＭＡＳＫテーブル１（共通フィール
ドがＨＩＧＨ−ＶＡＬＵＥ値で、個別フィールドが「Ｎ
ＵＬＬ値」のテーブル）と１番目の入力レコードａとで
論理積をとり、共通格納レコードを作成する。これは
論理積のビット操作により、共通格納レコードの共通
フィールドの情報は入力レコードの共通フィールドの情
報のままとし、個別フィールドの情報を全て「ＮＵＬＬ
値」として作成することに相当している。

【００３４】次に、ＭＡＳＫテーブル２（共通フィール
ドが「ＮＵＬＬ値」で、個別フィールドがＨＩＧＨ−Ｖ
ＡＬＵＥ値のテーブル）と入力レコードａとで論理積を
とり、個別格納レコード（１番目の入力レコードａに
対応）を作成する。これは論理積のビット操作により、
個別格納レコードの共通フィールドの情報を「ＮＵＬ
Ｌ値」とし、個別フィールドの情報は入力レコードａの
情報のまま「ああ」「いい」として作成することに相当
している。なお、上述したＭＡＳＫテーブル１およびＭ
ＡＳＫテーブル２は、レコードコピーライブラリにより
自動生成される。

【００３５】図５は、同一キーを有する２番目以降の入
力レコードに対応する格納レコードを作成する場合、該
２番目以降の入力レコードの共通フィールドの内容が共
通格納レコードの共通フィールドの内容と同一の場合
（本実施例では２番目の入力レコードｂが該当してい
る）の格納レコード作成手順を説明するための図であ
り、同図は２番目の入力レコードｂから２番目の個別格
納レコードを作成する場合の例を示している。すなわ
ち、上記図４に示した初回の格納レコード作成手順で作
成した共通格納レコードと入力レコードｂとで排他的
論理和をとり、第２の個別格納レコードを作成してい
る。これは排他的論理和のビット操作により、個別格納
レコードの共通フィールドの情報を「ＮＵＬＬ値」と
し、個別フィールド１および２の情報は入力レコードの
個別フィールドの情報のまま「うう」「ええ」として作
成することを意味している。

【００３６】図６は、２番目以降の入力レコードで共通
フィールドの情報が共通格納レコードの共通フィールド
の内容と異なる場合（本実施例では３番目の入力レコー
ドｃおよび４番目の入力レコードｄが該当している）の
格納レコード作成方法を説明するための図であり、これ
により上記実施例の３番目の個別格納レコードおよび
４番目の個別格納レコードが作成される。図６は３番
目の入力レコードｃから３番目の個別格納レコードを
作成する場合の例を示したものであるが、４番目の入力
レコードｄから４番目の個別格納レコードを作成する
場合も同様な方法がとられる。

【００３７】図６の方法は図５に示した２番目以降の格
納レコード作成方法と類似しているが、共通格納レコー
ドと入力レコードとで、排他的論理和をとったとき、
共通フィールドの情報が「ＮＵＬＬ値」にならない場合
（すなわち共通フィールドの内容が共通の情報でない場
合）、入力レコードの情報を優先して設定するようにし
たところが図５と異なっている。このようにすることに
よって、入力レコードの共通フィールドの情報が全て同
一でない場合に対しても柔軟に対応できるようになる。

【００３８】図５および図６の方法を実施するために、
共通格納レコードの共通フィールド（１番目の入力レ
コードの共通フィールドと同じ）と２番目以降の入力レ
コードの共通フィールドの情報が全て一致しているかど
うか、また、もし不一致の場合にはどの共通フィールド
の情報が不一致なのかを判別する必要がある（図６に示
ように、不一致の共通フィールドに入力レコードの情報
を優先して設定するため）。次に、この判別方法を図７
および図８を用いて説明する。

【００３９】まず、入力レコードとＭＡＳＫテーブル１
（共通フィールドがＨＩＧＨ−ＶＡＬＵＥ値で、個別フ
ィールドが「ＮＵＬＬ値」のテーブル）とで論理積をと
って結果１を得、次に、その結果１と共通格納レコード
とで排他的論理和をとって結果２を得る。結果２の共
通フィールドと個別フィールドを含めた全フィールドが
「ＮＵＬＬ値」の場合、共通フィールド情報の値は一致
していると判断する。図７にその具体例を示す。同図
は、２番目の入力レコードｂに対してこの処理を行った
例を示したもので、結果２の全てのフィールドが「ＮＵ
ＬＬ値」になるので入力レコード２と共通格納レコード
の共通フィールドの情報が全て一致（共通フィールド
１が「ＡＡ」、共通フィールド２が「ＣＣ」で一致）し
ているものと判断される。

【００４０】また、結果２の全フィールドが「ＮＵＬＬ
値」でない場合は、判定する範囲を２分割しそれぞれの
範囲に対して同様の処理を行い、２分割された範囲内で
全フィールドが「ＮＵＬＬ値」であれば、その範囲内で
は共通フィールドが一致していると判断し、全フィール
ドが「ＮＵＬＬ値」でない範囲についてのみ再度上記と
同様の処理を行う、という処理を繰り返し、範囲を順次
絞り込んで不一致の情報を有する共通フィールドを特定
する。

【００４１】図８にその具体例を示す。同図は、３番目
の入力レコードｃに対してこの処理を行った例を示した
もので、結果１の共通フィールド１の情報が「ＢＢ」
で、共通格納レコードの共通フィールド１の情報が
「ＡＡ」であるので結果２の共通フィールド１の情報は
「ＮＵＬＬ値」にならない。この場合、不一致のフィー
ルドを見付けるために、不一致である全フィールドの範
囲（イ）を範囲（ロ）と範囲（ハ）に２分割して各範囲
で同様の処理を行うと範囲（ハ）内の全フィールドは
「ＮＵＬＬ値」であるためこの範囲内では共通フィール
ドは一致している。一方、範囲（ロ）内の全フィールド
が「ＮＵＬＬ値」でないためこの範囲（ロ）内のフィー
ルドに不一致フィールドがあることがわかる。さらに範
囲（ロ）を範囲（ニ）と範囲（ホ）に２分割しそれぞれ
の範囲に同様の処理を行う。その結果、範囲（ホ）のフ
ィールドは「ＮＵＬＬ値」であるが範囲（ニ）のフィー
ルドは「ＮＵＬＬ値」でないため、最終的に範囲
（ニ），すなわち共通フィールド１の情報が不一致であ
ることがわかる。

【００４２】図９〜図１１は、個別格納レコードを入力
レコードイメージへ復元する方法を説明するための図で
ある。まず、図９に示すように、個別格納レコードとＭ
ＡＳＫテーブル１（共通フィールドがＨＩＧＨ−ＶＡＬ
ＵＥ値で、個別フィールドが「ＮＵＬＬ値」のテーブ
ル）とで論理積をとって結果１を得る。得られた結果１
の全フィールドが「ＮＵＬＬ値」の場合、共通フィール
ドの情報が共通格納レコードの情報と一致していると判
断できるため、個別格納レコードと共通格納レコードと
で論理和をとれば、入力レコードの復元が可能となる。

【００４３】例えば、図９および図１０は個別格納レコ
ードと共通格納レコードから入力レコードａ’を復
元する例であり、この場合、結果１の全フィールドが
「ＮＵＬＬ値」であるため復元する入力レコードの共通
フィールドの情報が共通格納レコードの共通フィールド
の情報「ＡＡ」「ＣＣ」と一致していると判定され、図
１０に示すように、個別格納レコードと共通格納レコ
ードとの論理和をとることによって復元される。すな
わち、個別格納レコードの共通フィールド１および２
と共通格納レコードの個別フィールド１および２はと
もに「ＮＵＬＬ値」であるので、復元後の入力レコード
ａ’は、共通フィールド１および２に共通格納レコード
の共通フィールド１および２の情報「ＡＡ」および
「ＣＣ］が、個別フィールド１および２に個別格納レコ
ードの個別フィールド１および２の情報「ああ」およ
び「いい」がそのまま設定される。

【００４４】また、個別格納レコードとＭＡＳＫテーブ
ル１（共通フィールドがＨＩＧＨ−ＶＡＬＵＥ値で、個
別フィールドが「ＮＵＬＬ値」のテーブル）とで論理積
をとった結果１の全フィールドが「ＮＵＬＬ値」でない
場合、共通フィールドの情報が共通格納レコードの情報
と不一致であると判断できるので、図８のときと同様の
２分割により不一致の範囲が共通フィールド１に絞り込
まれる。図１１は、個別格納レコードと共通格納レコ
ードから入力レコードｃを復元する場合を示してい
る。

【００４５】図１１において、一致している範囲の情報
は、図１０の場合と同様に、個別格納レコードと共通格
納レコードとの論理和をとることによって復元される。
すなわち、個別格納レコードの共通フィールド２と共
通格納レコードの個別フィールド１および２は「ＮＵ
ＬＬ値」であるので、復元後のレコードｃ’は、共通フ
ィールド２に共通格納レコードの共通フィールド２の
情報「ＣＣ」が、個別フィールド１および２には個別格
納レコードの個別フィールド１および２の情報「お
お」および「かか」が設定される。また、最終的に絞り
込まれた不一致のフィールド（すなわち「共通フィール
ド１」）の情報は、個別格納レコードの情報「ＢＢ」
を優先して設定することによって、復元後レコードｃ’
が復元される。

【００４６】

【発明の効果】以上説明したように、本発明のデータベ
ースの重複項目格納方法によれば、同一キー内（枝番な
どで複数のレコードが存在する）の複数レコード間で、
重複している情報を、共通格納レコードとして集約（個
別項目情報は「ＮＵＬＬ値」）するとともに、個別格納
レコードは共通格納レコードと逆の重複しない情報を設
定（重複項目情報は「ＮＵＬＬ値」）し作成しているた
め、データベースに格納する場合、データベースの標準
機能である「連続文字圧縮機能」が有効に働き、ディス
ク容量が大幅に削減できるという顕著な効果がある。

【００４７】また、共通格納レコードに設定するフィー
ルドと、個別格納フィールドに設定するフィールドの識
別は、ＭＡＳＫテーブルとの比較によって実現させてい
るため、共通情報、個別情報に変更があっても、ＭＡＳ
Ｋテーブルの修正で対応できるため、ユーザプログラム
の修正は不要となり、容易に変更できるという効果があ
る。さらに、格納レコードの復元は、共通格納レコード
と個別格納レコードの論理和により実現しているため、
１項目単位に比較する方法に比較して処理効率を大幅に
向上させる効果がある。

【図面の簡単な説明】

【図１】本発明の実施例に係るユーザプログラム，ＤＢ
アクセス制御ルーチン，データベース管理システム（Ｄ
ＢＭＳ），およびリレーショナル・データベースの関連
を示す概念図である。

【図２】データベースへ格納するためのデータ作成イメ
ージを表わす図である。

【図３】データベースに格納されている格納レコードか
らの復元イメージを表わす図である。

【図４】最初の入力レコードから格納レコード（共通格
納レコード，個別格納レコード）を作成する方法を示す
図である。

【図５】２番目以降の入力レコードから格納レコード
（個別格納レコード）を作成する方法を示す図である
（共通フィールドが同一の場合）。

【図６】２番目以降の入力レコードから格納レコード
（個別格納レコード）を作成する方法を示す図である
（共通フィールドが異なる場合）。

【図７】共通格納レコードと個別格納レコードの共通フ
ィールドの情報の一致／不一致の判定方法を示す図であ
る（一致の場合）。

【図８】共通格納レコードと個別格納レコードの共通フ
ィールドの情報の一致／不一致の判定方法および不一致
の共通フィールドの見つけ出す方法を示す図である（不
一致の場合）。

【図９】格納レコードから入力レコードへ復元する場
合、個別格納レコードの共通フィールドの情報が共通格
納レコードの共通フィールドの情報と一致しているか否
かを見つけ出す方法を示す図である。

【図１０】格納レコードから入力レコードへ復元する場
合、個別格納レコードの共通フィールドの情報が共通格
納レコードの共通フィールドの情報と一致しているとき
の復元方法を示す図である。

【図１１】格納レコードから入力レコードへ復元する場
合、個別格納レコードの共通フィールドの情報が共通格
納レコードの共通フィールドの情報と不一致のときの復
元方法を示す図である。

【符号の説明】

１：リレーショナル・データベース、２：ユーザプログ
ラム、３：データベース管理システム（ＤＢＭＳ）、
４：ＤＢアクセス制御ルーチン

Claims

【特許請求の範囲】

【請求項１】リレーショナル・データベース・システ
ムにおいて、格納データレコードを、主キー部と、サブ
キー部と、共通フィールド部と、個別フィールド部とに
区分けし、主キー部が同値を持つデータレコードが複数
レコード存在する場合に、主キー部同値の複数レコードを、主キー部と共通データ
フィールド部とＮＵＬＬ値フィールド部とで構成される
一つの親レコード（共通格納レコード）と、主キー部
と、サブキー部と、個別データフィールド部とＮＵＬＬ
値フィールド部とで構成される複数の子レコード（個別
格納レコード）とに、分割して格納するレコード分割・
格納手段と、指定された主キーとサブキーから読み出した該当の親レ
コードと、子レコードとを１レコードに合成し、格納デ
ータレコードを復元するレコード読み出し復元手段とを
備えたことを特徴とするリレーショナル・データベース
・システム。
【請求項２】請求項１記載のリレーショナル・データ
ベース・システムにおいて、親レコードと、前記親レコードに対応する子レコード
を、共に同じレコード・フォーマット、レコード長で作
成し、親レコードにおける共通データフィールド部は、
子レコードにおけるＮＵＬＬ値フィールド部に、また、
子レコードにおける個別データフィールド部は、親レコ
ードにおけるＮＵＬＬ値フィールド部に、それぞれ対応
するように格納データレコードをフォーマットすること
を特徴とするレコード分割、格納手段を有するリレーシ
ョナル・データベース・システム。
【請求項３】リレーショナル・データベースにおける
データレコードの格納・読み出し方法において、格納データレコードを、主キー部と、サブキー部と、共
通フィールド部と、個別フィールド部とに区分けし、主
キー部が同値を持つデータレコードが複数レコード存在
する場合に、主キー部同値の複数レコードを、主キー部
と共通データフィールド部とＮＵＬＬ値フィールド部と
で構成される一つの親レコードと、主キー部と、サブキ
ー部と、個別データフィールド部とＮＵＬＬ値フィール
ド部とで構成される複数の子レコードとに分割してデー
タベースに格納し、指定された主キーとサブキーから読
み出した該当の親レコードと、子レコードとを１レコー
ドに合成し、格納データレコードを復元するようにした
データレコード格納・読み出し方法。
【請求項４】請求項３記載のデータレコード格納・読
み出し方法において、親レコードと、前記親レコードに
対応する子レコードを、共に同じレコード・フォーマッ
ト、レコード長で作成し、親レコードにおける共通デー
タフィールド部は、子レコードにおけるＮＵＬＬ値フィ
ールド部に、また、子レコードにおける個別データフィ
ールド部は、親レコードにおけるＮＵＬＬ値フィールド
部に、それぞれ対応するよう格納データレコードをフォ
ーマットすることを特徴とするデータレコード格納・読
み出し方法。
【請求項５】リレーショナル・データベース・システ
ムにおけるデータベース・アクセス制御プログラムであ
って、格納データレコードを、主キー部と、サブキー部
と、共通フィールド部と、個別フィールド部とに区分け
し、主キー部が同値を持つデータレコードが複数レコー
ド存在する場合に、主キー部同値の複数レコードを、主
キー部と、共通データフィールド部と、ＮＵＬＬ値フィ
ールド部とで構成される一つの親レコードと、主キー部
と、サブキー部と、個別データフィールド部と、ＮＵＬ
Ｌ値フィールド部とで構成される複数の子レコードと
に、分割して格納するレコード分割・格納手順と、指定
された主キーとサブキーから読み出した該当の親レコー
ドと、子レコードとを１レコードに合成し、格納データ
レコードを復元するレコード読み出し復元手順を含んだ
データベース・アクセス制御プログラムが記録された記
録媒体。
【請求項６】請求項５記載の記録媒体において、前記レコード分割・格納手順は、親レコードと、前記親
レコードに対応する子レコードを、共に同じレコード・
フォーマット、レコード長で作成し、親レコードにおけ
る共通データフィールド部は、子レコードにおけるＮＵ
ＬＬ値フィールド部に、また、子レコードにおける個別
データフィールド部は、親レコードにおけるＮＵＬＬ値
フィールド部に、それぞれ対応するよう格納データレコ
ードをフォーマットするものであることを特徴とする記
録媒体。