JPH11110265A - 情報処理装置 - Google Patents

情報処理装置

Info

Publication number
JPH11110265A
JPH11110265A JP9270992A JP27099297A JPH11110265A JP H11110265 A JPH11110265 A JP H11110265A JP 9270992 A JP9270992 A JP 9270992A JP 27099297 A JP27099297 A JP 27099297A JP H11110265 A JPH11110265 A JP H11110265A
Authority
JP
Japan
Prior art keywords
information
record
group
cluster
page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9270992A
Other languages
English (en)
Inventor
Naomi Yoshizawa
直美 吉沢
Hiroshi Ishikawa
博 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP9270992A priority Critical patent/JPH11110265A/ja
Publication of JPH11110265A publication Critical patent/JPH11110265A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】本発明は情報処理装置に関し、情報を格納する
際、単一I/O範囲のみならず、より詳細に隣接関係を
含めてその格納位置を制御できるようにして、情報操作
を対象とする時間性能を向上させる。 【解決手段】アクセスにI/O操作を必要とする外部記
憶装置を備え、該外部記憶装置の記憶媒体にデータを格
納し、管理する情報処理装置において、外部記憶装置に
データを格納する際、同一ページ内に存在させることに
より、参照時に必要とされるI/O回数を減少させるこ
とが可能である様なレコード群を対象として、対象情報
群を同一ページのみならず、物理的に隣接、或いは可能
な限り近接させる様、その格納配置を決定するデータ管
理部5を備えた。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、データベースシス
テム等に利用される情報処理装置に関する。一般に、各
種コンピュータ等の情報処理装置において、I/O所要
時間(二次記憶装置と一次記憶装置との間のデータ転送
に要する時間)は、CPU所要時間(一次記憶装置上の
データの操作、或いは二次記憶装置への操作に要する時
間)と比較して非常に大きいことが知られている。従っ
て、多量のデータの操作を行うシステムにおいては、I
/O必要回数を減少させるための手段が様々に考えられ
ている。
【0002】通常、二次記憶装置(外部記憶装置)から
の情報の読み出し操作はページ単位で実行される。従っ
て、一回のI/O操作で読み出されるページ上にどの程
度有効な情報が存在するか、が時間性能上重要な問題と
なる。時間性能の向上を上記方面から解決するための手
段の一つが物理クラスタリングである。なお、ここでい
うクラスタリングとは、「データベースを編成するレコ
ードの論理的、物理的集まり」のことであり、参照効率
の向上を目的として導入される。
【0003】実現階層が物理的である場合には、同一ク
ラスタに属するレコードは同一ページ上、或いは該当ク
ラスタが1ページに納まりきれない程度に大きい場合に
は、隣接するページ上に格納する。クラスタリングは、
同一I/Oの対象とすることにより、I/O回数の減少
が期待できるレコード群を同一ページに存在させること
を目的とする。
【0004】言い換えれば、クラスタリングとは、ほぼ
同時期の参照を必要とされるレコード群をクラスタとし
て登録し、同一クラスタとして指定されたレコード群
を、可能であれば同一ページに、それが不可能な場合で
も隣接するページにまとめることにより、I/O数を、
ひいてはI/O所要時間を減少させるものである。
【0005】従って、クラスタリング機能は、通常、該
当レコード群が同一ページに存在するか否かを問題と
し、それ以上の、例えば、関係するレコード群を物理的
に隣接して置く、と言うような要求を満たすものではな
い。これは、時間的に問題となるのはI/O所要時間で
あり、シーク時間(内部メモリ上の検索時間)はそれと
比較した場合には問題とならぬ程度のものだからであ
る。
【0006】以上の理由により、従来、特定のレコード
群を特定位置(但し、ページ単位であるが)に格納する
手段が提供されていた。これにより、情報参照操作にお
ける速度性能の向上が可能になっている。しかし、この
方式は、あくまで参照操作のみに効力を発揮するもので
あり、それ以外の操作に対しては、直接的な影響を及ぼ
さない。従って、この点を改善し、前記情報の参照操作
以外の操作に対しても時間効率の良い操作の実現が要望
されていた。
【0007】
【従来の技術】以下、従来例について説明する。図12
は従来例1の説明図である。従来、情報処理装置におい
て、I/O(入出力)操作の所要時間(二次記憶装置と
一次記憶装置との間のデータ転送に要する時間)は、現
在でもCPU所要時間(一次記憶装置上のデータの操
作、或いは二次記憶装置への操作に要する時間)と比較
した場合に非常に大きいものである。従って、この操作
に要する時間を短縮することはI/O操作を含む各種の
機能全体の時間性能に非常に有益であると考える。この
所要時間短縮の手法として以下の手法が存在する。な
お、前記二次記憶装置は、例えば、外部記憶装置の一つ
である磁気デイスク装置であり、一次記憶装置は内部の
メモリ(例えば、RAM)である。
【0008】(1) :I/O回数自体の減少 これを実現するための手法としては、例えば、次のよう
な手法が考えられる。 :必要な情報を可能な限り内部のメモリ上に展開して
おく。かつ、一度展開された情報が再利用されると予想
される場合には、その存在をメモリ上より消滅させな
い。
【0009】:必要となる情報を一度のI/Oで複数
参照(メモリ上への展開)可能となる様、情報格納位置
を考える。一般に、この操作は「クラスタリング」とし
て知られている。主としてDBMS(Database Managem
ent System:データベースの管理を行うソフトウェア)
における情報参照操作の(時間)性能向上手段として実
現(商品化)されつつある。
【0010】(2) :I/O操作1回当たりの所要時間短
縮 ファイル上に存在するデータの読み込みは、簡単に言え
ば、以下の操作により構成される。従って、操作所要時
間の減少のためには、いずれか一つ以上の操作に要する
時間の短縮化が必要となる。
【0011】:ディスクアクセス I/O指示発生後、ディスクにアクセスするまでの操作
である。同時期に(異なる位置への)複数のI/O指示
が出された場合には、それらはキューにためられ、先の
I/Oが終了するまで待機することになる。従って、同
時期に使用される情報を異なるディスク上のファイルに
分散格納することも時間短縮のためには有効である。
【0012】:ページシーク ディスクドライブシステム(例えば、ハードディスク装
置)のヘッド移動を含めた対象ページの検索操作であ
る。
【0013】通常、ファイル、及びこれを構成するペー
ジ群は、ディスク上に分散して配置されている。従っ
て、或るページをディスク上から読み込む場合には、先
ず、その存在位置の検索を必要とする。2枚以上のペー
ジの読み込みに必要とする時間は、この存在位置の関係
に依存し、この時間は実際のリード操作ほどではない
が、やはり無視できないものである。
【0014】:ページリード 該当情報の存在するページの読み込み(メモリ上への展
開)操作である。上記の各種手段は、I/O操作所要時
間の短縮化を目的としたものであり、その目的を達成す
る以上のことは行っていない。例えば、情報Aと情報B
が連続して使用されることが分かっている場合、AとB
を単一I/Oの対象とされる範囲(通常、1ページ)に
存在させる様、その格納位置制御を行っているが、それ
以上に詳細な位置制御を行っているわけではない。
【0015】例えば、(A1,B1)、(A2,B
2)、(A3,B3)、の三組の関係情報が存在する場
合、従来の方式では、図12のようになることが避けら
れなかった(というより、単一I/O範囲に載せる以上
のことは考えていなかった)。
【0016】すなわち、図12には、既存システムにお
ける情報格納イメージを示してあり、図示のように、既
存の方式では、同一I/Oの範囲に情報を載せることの
みに焦点を当てている。このため、関係する情報間に別
の情報が入っている状態(A1,B1)、ユーザの意図
しないシステム側に都合の良い配列(A2,A3及びB
2,B3)を回避できない。
【0017】このように、従来の方式では、同一I/O
の範囲に情報を載せることのみに焦点を当てている。こ
のため、関係する情報間に別の情報が入っている状態
(A1,B1)、ユーザの意図しないシステム側に都合
の良い配列(A2,A3及びB1,B3)を回避できな
い。
【0018】
【発明が解決しようとする課題】前記のような従来のも
のにおいては、次のような課題があった。従来例1の各
種手段は、I/O操作所要時間の短縮化を目的としたも
のであり、その目的を達成する以上のことは行っていな
い。従来例1のように、情報Aと情報Bが連続して使用
されることが分かっている場合、AとBを単一I/Oの
対象とされる範囲(通常、1ページ)に存在させる様、
その格納位置制御を行っているが、それ以上に詳細な情
報格納位置の制御を行っているわけではない。
【0019】例えば、(A1,B1)、(A2,B
2)、(A3,B3)の三組の関係情報が存在する場
合、従来例1の方式では、図12に示したようになるこ
とが避けられなかった(というより、単一I/O範囲に
載せる以上のことは考えていなかった)。すなわち、従
来例1の方式では、同一I/Oの範囲に情報を載せるこ
とのみに焦点を当てている。このため、関係する情報間
に別の情報が入っている状態(A1,B1)、ユーザの
意図しないシステム側に都合の良い配列(A2,A3及
びB1,B3)を回避できなかった。
【0020】本発明はこのような従来の課題を解決し、
情報を格納する際、単一I/O範囲のみならず、より詳
細に隣接関係を含めてその格納位置を制御できるように
して、情報操作を対象とする時間性能を向上させること
を目的とする。
【0021】
【課題を解決するための手段】図1は本発明の原理説明
図である。図1において、4は演算機構、5はデータ管
理部、7はメモリを示す。本発明は前記の目的を達成す
るため、次のように構成した。
【0022】(1) :アクセスにI/O(入出力)操作を
必要とする外部記憶装置(例えば、磁気ディスク装置)
を備え、該外部記憶装置にデータを格納し、管理する情
報処理装置において、前記外部記憶装置にデータを格納
する際、同一ページ内に存在させることにより、参照時
に必要とされるI/O回数を減少させることが可能であ
る様なレコード群を対象として、対象情報群を同一ペー
ジのみならず、物理的に隣接、或いは可能な限り近接さ
せる様、その格納配置を決定する情報格納手段(データ
管理部5の一部)を備えている。
【0023】(2) :前記(1) の情報処理装置において、
対象レコード群の総量がページサイズ以上に及ぶ場合
に、該レコード群を複数のページに分割格納した上で、
それぞれのページをファイル上の連続領域に格納する複
数ページ情報格納手段(データ管理部5の一部)を備え
ている。
【0024】(3) :前記(1) の情報処理装置において、
二つのレコード群集合に共通するレコード(又は、レコ
ード群)が存在する場合に、二つのレコード群自体を隣
接、或いは近接させ、共通レコード(又は、レコード
群)をその中間領域に置くレコード情報格納手段(デー
タ管理部5の一部)を備えている。
【0025】(4) :前記(1) の情報処理装置において、
二つ以上のレコード群集合に共通する要素レコード(又
は、レコード群)が存在する場合に、共通レコード(又
は、レコード群)が重複して複数位置に存在することを
許容し、それぞれのレコード(又は、レコード群)に対
して要素が近接する様、その格納配置を決定する要素レ
コード情報格納手段(データ管理部5の一部)を備えて
いる。
【0026】(作用)前記構成に基づく本発明の作用
を、図1に基づいて説明する。 (a) :前記(1) の作用 外部記憶装置にデータを格納する際、前記情報格納手段
は、同一ページ内に存在させることにより、参照時に必
要とされるI/O回数を減少させることが可能である様
なレコード群を対象として、対象情報群を同一ページの
みならず、物理的に隣接、或いは可能な限り近接させる
様、その格納配置を決定する。
【0027】例えば、図1に示した記憶媒体には、図示
のような最終的な情報格納形態で情報が格納される。こ
の例では、従業員個人情報はその家族情報と共に(同時
に)参照される頻度が非常に大きいことを想定して、個
人情報をその家族情報と共に同一クラスタとして扱って
いる。すなわち、従業員個人情報、その家族情報群、家
族情報群を管理するためのリストがクラスタとして設定
されている。保存されている情報がこのような構造を取
っている場合、操作は以下のようになる。
【0028】先ず、個人情報(リンク情報)により、従
業員個人情報テーブルの該当位置を決定(ここでページ
3にアクセス)する。しかし、この後、家族情報を取得
する際には、新たなページの読み込みを必要としない。
家族情報、及びその順序と所在を示すリスト情報は全て
個人情報と同一ページ上に存在する。これにより、I/
O操作に要する時間分の短縮がなされる。
【0029】このように、情報を格納する際、単一I/
O範囲のみならず、より詳細に隣接関係を含めてその格
納位置を制御しているので、情報操作を対象とする時間
性能を向上させることができる。また、前記情報格納手
段により格納された情報群を対象とする削除操作を必要
とする場合に、該当情報群の削除を一括して行うことが
できるので、この点においても、情報操作を対象とする
時間性能を向上させることができる。
【0030】更に、前記情報格納手段により格納された
情報群を対象とする排他制御を行う場合に、排他制御の
適用単位を該当情報群(クラスタ単位)とすることがで
きるので、この点においても、情報操作を対象とする時
間性能を向上させることができる。
【0031】また、前記情報格納手段により格納された
情報群を対象として、複数情報を対象とした連続操作が
可能である様な更新操作を行う場合に、適用単位を該当
情報群(クラスタ単位)とすることができるので、この
点においても、情報操作を対象とする時間性能を向上さ
せることができる。
【0032】(b) :前記(2) の作用 前記複数ページ情報格納手段は、対象レコード群の総量
がページサイズ以上に及ぶ場合に、該レコード群を複数
のページに分割格納した上で、それぞれのページをファ
イル上の連続領域に格納する。
【0033】このように、情報を格納する際、対象レコ
ード群の総量がページサイズ以上に及ぶ場合にも、単一
I/O範囲のみならず、より詳細に隣接関係を含めてそ
の格納位置を制御しているので、情報操作を対象とする
時間性能を向上させることができる。
【0034】(c) :前記(3) の作用 前記レコード情報格納手段は、二つのレコード群集合に
共通するレコード(又は、レコード群)が存在する場合
に、二つのレコード群自体を隣接、或いは近接させ、共
通レコード(又は、レコード群)をその中間領域に置く
ようにして情報を格納する。
【0035】このようにすれば、双方のレコード(又
は、レコード群)の参照効率を上げることができる。ま
た、参照操作に当たり、必要とされるI/O回数を減少
させることが可能となる。また、レコード情報格納手段
により格納された情報(又は、レコード群)を対象とし
て、前記情報格納手段(前記(1) の機能)により格納さ
れた情報群を対象とする削除操作を適用する場合に、共
通レコード群格納領域を識別し、該当領域が削除対象レ
コード群以外に属している場合には、その削除を回避す
ることが可能となる。
【0036】(d) :前記(4) の作用 前記要素レコード情報格納手段は、二つ以上のレコード
群集合に共通する要素レコード(又は、レコード群)が
存在する場合に、共通レコード(又は、レコード群)が
重複して複数位置に存在することを許容し、それぞれの
レコード(又は、レコード群)に対して要素が近接する
様、その格納配置を決定する。このようにすれば、複数
のレコード群全ての参照効率を上げることが可能にな
る。
【0037】
【発明の実施の形態】以下、発明の実施の形態を図面に
基づいて詳細に説明する。 §1:本実施の形態で使用する装置の説明・・・図2参
照 図2は装置説明図である。本実施の形態では図2に示し
た装置を使用する。この装置は、パーソナルコンピュー
タ、ワークステーション、その他のコンピュータ等の各
種コンピュータにより実現されるものであり、装置本体
1と、外部記憶装置の一種であるディスク装置(例え
ば、磁気ディスク装置)8と、クラスタ管理情報を格納
するクラスタ管理情報記憶部6と、ユーザが操作する入
出力装置(キーボード、マウス、ディスプレイ装置等)
3等を備えている。
【0038】そして、前記装置本体1には、各種演算等
の処理を行う演算機構4と、前記演算機構4からの指示
によりデータの管理を行うデータ管理機構2等が設けら
れており、前記データ管理機構2には、データ管理を行
うためのデータ管理部5と、データ管理部5がワーク用
として使用するメモリ7等を備えている。
【0039】なお、前記演算機構4はCPU(Central
Processing unit )、MPU(Micro Processing Unit
)等により実現される機構である。また、前記データ
管理部5はプログラムの実行により実現されるものであ
り、ディスク装置8へのデータ(情報)格納処理、格納
したデータ(情報)の削除処理、その他のデータ管理等
の処理を行う。更に、前記クラスタ管理情報記憶部6
は、任意の記憶媒体で実現可能であるが、記憶されたク
ラスタ管理情報は、ディスク装置8への情報の格納時に
同一記憶媒体に格納される。
【0040】§2:本実施の形態の処理概要等の説明 (1) :処理概要 本実施の形態では、前記ディスク装置8のディスク(記
憶媒体)上に情報(この場合の「情報」は「データ」と
同じような意味で使用する)を格納する場合、現状(従
来例)以上に、情報操作におけるアクセス範囲の限定、
局所化を追求し、これを利用して各種の操作をより効率
良く実現するものである。この局所化の手段として、関
連する情報の近接格納操作、即ち、物理クラスタリング
を利用する。
【0041】そして、同一クラスタ中のレコード群を必
要に応じて単一ページ上の隣接領域に格納する手段を提
供することにより、関連情報群の存在の局所化を実現
し、参照操作のみならず、削除操作、ロック(操作対象
の専有化)操作の時間性能の向上を指向する。更に、格
納位置の(ページ単位と比較して)詳細な制御を可能と
することにより、ユーザの認識する情報の関連性を情報
格納形態に反映させ、これにより、効率の良い操作形態
を提供することが可能になる。
【0042】なお、この際、情報の格納操作に要求され
る格納位置の決定のための負荷に関しては、クラスタリ
ング機能を利用することにより、専用操作を必要とせ
ず、最小限に抑えることが可能になる。
【0043】(2) :本実施の形態の特徴 本実施の形態は、前記ディスク装置8に情報を格納する
場合、「単純に関連情報をクラスタリングし、このクラ
スタの要素を単一I/O範囲に載せる」ことではなく、
「関連情報をクラスタリングし、このクラスタの要素を
単一I/O範囲の中でも、隣接関係を保つ特定の領域に
載せること」、及び「この状況=関連する情報が隣接領
域に載っている状態=を利用して関連情報群を纏めて操
作対象とすること」である。
【0044】これにより、各種操作中に占めるI/O部
分時間の減少のみならず、操作時間全体を視野に、その
所要時間を減少させる(要するに、CPU時間の減少を
効果に追加できる)ことが可能になる。本実施の形態に
おいて、前記データ管理部5の基本機能は、次のような
情報を管理することで実現される。
【0045】:クラスタと対象クラスタに属する情報
の格納に使用されるページ上の位置(範囲)対応関係、
及び該当ページの情報がメモリ上に展開されている場合
には、メモリ上の位置(範囲)との対応関係。
【0046】:各ページ上における空き領域の位置、
及びサイズの一覧。 :通常状態(クラスタされていない状態)において、
データタイプにより格納位置に制約が存在する場合に
は、クラスタ領域(ページ部分/ページ/ページ群)を
分割し、それぞれを制約にあったフォーマットに変換す
る必要がある。この場合には、各クラスタに対応付け
て、それぞれの制約を満たす領域の位置とサイズ、その
部分に適用される制約、の一覧。
【0047】なお、前記のような機能が実際にどのよう
にインプリメントされるか(モデリングされるか)に関
しては、システム依存である。 (3) :情報格納配置イメージの説明・・・図3参照 図3は情報格納配置イメージ説明図である。本実施の形
態では、前記のように、関係する情報を単一I/O範囲
のみならず、詳細に隣接関係を含めてその格納位置を制
御するものであり、情報をクラスタリングする(クラス
タ生成と情報の登録/対応関係指定)手段、及び指定さ
れた情報群(クラスタ要素として指定された情報群)を
単一I/O範囲のみならず、隣接領域に格納する手段、
隣接領域に存在する(同一クラスタの要素として登録さ
れている)情報群を一括して操作対象とする手段、を提
供する。これにより、情報単位で格納位置を制御し、図
3に示したような格納配置を実現し、操作時に各クラス
タを一括操作対象とすることが可能となる。
【0048】図3の例では、(A1,B1)、(A2,
B2)、(A3,B3)の三組の関係情報が存在する場
合、関連する情報(ユーザにより関係有りとされた情
報)は、必要であれば隣接関係を取って、図示のように
格納される。また、削除操作の場合でも、対象情報それ
ぞれを対象とせず、該当情報群の存在範囲(クラスタ格
納範囲)を対象とした削除を行うことが可能となるた
め、処理時間を短縮することができる。
【0049】§3:各処理例の説明 以下、各処理例について説明する。なお、以下の例にお
いて、「情報の格納」、或いは、「情報の削除」は、デ
ィスク装置8のディスク(記憶媒体)に対して情報を格
納、或いは情報を削除する処理である。
【0050】(1) :例1 例1は、情報を格納する場合、同一ページ内に存在させ
ることにより、参照時に必要とされるI/O回数を減少
させることが可能であるようなレコード群を対象とし
て、対象情報群を同一ページのみならず、物理的に隣
接、或いは可能な限り近接させる様、その格納配置を決
定する例である。
【0051】すなわち、例1は、以下に述べる各例の各
種操作(対象情報の一括操作)を実現するための関連情
報の局所化の実現手段を提供する例であり、クラスタと
格納領域の対応付けを行う機能は必須である。これに加
えて、領域(どのクラスタのどの位置か、等)の指定を
可能とする情報格納操作を用意する。このような操作に
より同一クラスタに属するレコード群を連続領域に格納
することが可能になる。
【0052】(2) :例2 例2は、前記例1において、対象レコード群の総量がペ
ージサイズ以上に及ぶ場合に、該レコード群を複数のペ
ージに分割格納した上で、それぞのページをファイル上
の連続領域に格納する例である。
【0053】すなわち、例2は、前記例1の処理を用い
て集中させた情報の全体量がページサイズ以上に及んだ
場合に、関係するレコード群の局所化をページに跨がっ
て適用する例である。この例では、リスト構造を持つ管
理情報(クラスタ管理情報)の保存領域を用意し、それ
ぞれのページに対応付ける(或いは、それぞれのページ
の一部を、この用途のために確保する)。なお、前記管
理情報の保存領域は、例えば、前記ディスク装置8の記
憶媒体上に確保する。
【0054】そして、この管理情報(クラスタ管理情
報)を用いてページに前後関係を与え、先に示した関連
レコード群の属するページ群をこの前後関係にあるよう
に配置する。この前後関係に従って順序良くファイルへ
書き込みを行うことにより、前記ページ群はファイル上
でも連続性を保つようになる。
【0055】(3) :例3 例3は、前記例1において、二つのレコード群集合に共
通するレコード(或いは、レコード群)が存在する場合
に、二つのレコード群自体を隣接、或いは近接させ、共
通レコード(或いは、共通レコード群)をその中間領域
に置くようにした例である。
【0056】すなわち、例3は、参照効率向上を目的と
して実行される関係レコード群の局所化を、複数のレコ
ード群、特に、それぞれのレコード群に共通する要素
(レコード)が存在する場合を対象として適用した例で
ある。
【0057】クラスタ(近接格納対象となるレコード
群)と、その要素レコードの対応関係を確保する等、各
クラスタの指定時には、それぞれのレコードが、既に別
のクラスタの要素となっているか否かを判断できるもの
を用意する。これにより、二度目以降にクラスタ要素と
して指定された際には、共通部分を双方のレコード群に
近接する位置に再配置する。これにより、双方のレコー
ド群の参照効率を上げることが可能になる(参照操作に
あたり、必要とされるI/O回数を減少させることが可
能となる)。
【0058】(4) :例4の説明 例4は、前記例1において、二つ以上のレコード群集合
に共通する要素レコード(或いは、レコード群)が存在
する場合に、共通レコード(或いはレコード群)が重複
して複数位置に存在することを許容し、それぞれのレコ
ード群に対して要素(或いは、要素群)が近接する様、
その格納配置を決定する例である。
【0059】すなわち、例4は、参照効率を向上を目的
として実行される関係レコード群の局所化を複数のレコ
ード群、特に、それぞれのレコード群に共通する要素
(レコード)が存在する場合を対象として適用した例で
ある。但し、ここでは、複数のレコード群に属するレコ
ードを、それぞれの群において近接させるための手段と
して、「重複レコード」の概念を導入する。
【0060】これは、或るレコード(情報)を複数位置
に存在させ(但し、更新に備えて、それぞれが同一実態
であることを示す情報を付加しておくこと)、それぞれ
の群において複数の内一つを近接対象とする。参照時に
は、該当レコード群に最も近い情報が参照対象となる。
これにより、複数のレコード群全ての参照効率を上げる
ことが可能となる。
【0061】(5) :例5の説明 例5は、前記例1の方式により格納された情報群を対象
として削除操作を必要とする場合に、該当情報群の削除
を一括して行う例である。すなわち、例5は、前記例1
の処理により、その存在位置が局所化している情報群を
対象とした一括削除(クラスタ単位で削除)を試みるも
のである。
【0062】該当クラスタに存在するレコード群の一括
削除を実行する場合に、通常の存在するレコード数の削
除操作を実行する代わりに、該当領域を対象とした一回
の削除操作を実現する。削除単位はクラスタとする。こ
れにより、該当クラスタに属する全てのレコードが削除
される(或いは削除と同等の効果が得られる)。
【0063】(6) :例6の説明 例6は、前記例3の方式により格納された情報群を対象
として、前記例5の機能を適用する場合に、共通レコー
ド群格納領域を識別し、該当領域が削除対象レコード以
外に属している場合には、その削除を回避することを可
能にする例である。
【0064】すなわち、例6は、前記例3により、複数
のレコード群(クラスタ)が同一レコードを要素として
いる場合に、内一つのレコード群を対象としたレコード
群の消去操作が発生した場合、該当レコード群の内、削
除対象となっていないレコード群に属するものを識別
し、削除対象外とするものである。
【0065】この場合、予めレコード集合を、属するレ
コード群の個数とその内容毎に分類し、それぞの小集合
(後述するプリミティブクラスタ)毎に、管理情報を付
加しておく。該当レコード群の一括消去は、属するレコ
ード群が1である、即ち、削除対象レコード群以外に全
く属さない小集合の無条件削除と、それ以外の小集合の
管理情報の更新(属するレコード群個数の減少と、属す
るレコード群リストの変更)により実現される。
【0066】(7) :例7の説明 例7は、前記例1の方式により格納された情報群を対象
とする排他制御(複数のユーザが一度に使用しないよう
にする制御)を行う場合に、排他制御の適用単位を該当
情報群(クラスタ単位)とする例である。
【0067】すなわち、例7は、前記例1により、その
存在位置が局所化している情報群を対象として排他制御
(専有処理)を実行する例である。操作対象となる情報
群を専有する必要がある場合に、ロック単位となる領域
に必要な情報のみが存在する様、各レコードの格納位置
を予め予定することにより、ロック範囲を必要部分のみ
に限定することが可能になる。これはロック単位をクラ
スタとすることにより実現される。
【0068】各種のロック属性は、クラスタに対応付け
られる。存在するレコード群は連続する領域に存在する
ため、それぞれを対象とした排他制御を行う必要はな
い。また、幾つかのシステムで使用されている対象範囲
をページとしたロックの様に、希望するレコードが存在
する集団中に必要としない(ロックをかける必要がな
い)情報が含まれることもない。
【0069】(8) :例8の説明 例8は、前記例1の方式により格納された情報を対象と
して、複数情報を対象とした連続操作が可能である様な
更新操作を行う場合に、適用単位を該当情報群とする例
である。
【0070】§4:情報伝達経路の説明・・・図4参照 図4は情報伝達経路の説明図であり、前記例1〜例8の
ための情報伝達経路(情報の流れ)を示している。以
下、図4に基づいて情報伝達経路を説明する。なお、図
の〜は伝達する情報を示す。図4において、ユーザ
(又は、入出力装置3)からの情報は、次のような経路
で伝達する。
【0071】(1) :ユーザからのサイズ(情報のサイ
ズ)の情報は、ユーザ→演算機構4→データ管理部5→
クラスタ管理情報記憶部6の経路で伝達されると共に、
データ管理部5→ディスク装置8の経路で伝達される。
【0072】(2) :ユーザからのクラスタID、操
作(オペレーション)の情報は、ユーザ→演算機構4→
データ管理部5の経路で伝達され、クラスタIDは、
データ管理部5→クラスタ管理情報記憶部6の経路で伝
達される。また、操作の情報は、データ管理部5→デ
ィスク装置8の経路で伝達される。
【0073】(3) :ユーザからのクラスタID、操
作の情報は、ユーザ→演算機構4→データ管理部5→ク
ラスタ管理情報記憶部6の経路で伝達される。 (4) :データ管理部5からの位置情報は、データ管理
部5→クラスタ管理情報記憶部6の経路で伝達される。
【0074】(5) :ディスク装置8からの位置情報
は、ディスク装置8→データ管理部5の経路で伝達され
る。 (6) :クラスタ管理情報記憶部6からのクラスタID
の情報は、クラスタ管理情報記憶部6→データ管理部5
→演算機構4→ユーザの経路で伝達される。
【0075】(7) :クラスタ管理情報記憶部6からの
位置情報は、クラスタ管理情報記憶部6→データ管理部
5の経路で伝達される。 (8) :データ管理部5からの位置情報は、データ管理
部5→ディスク装置8の経路で伝達される。
【0076】(9) :クラスタ管理情報記憶部6からの
S/F(S/F:SUCCESS/FALSE =成功したか、否か)
の情報は、クラスタ管理情報記憶部6→データ管理部5
→演算機構4→ユーザの経路で伝達される。
【0077】§5:各例の詳細な処理の説明 以下、前記各例について、詳細な処理を説明する。 (1) :例1 例1では、クラスタ要素となるレコード群を与えること
により、該当レコードを連続領域に格納するものであ
る。該当レコード群を格納可能な連続領域を確保するた
めの手段としては、以下のものが考えられる。
【0078】:レコードの格納は、既存データベース
システムと同様、最初に発見された領域を使用して行わ
れる。但し、適当なタイミングにシステム中に存在する
レコード群を確認し、同一クラスタに属するレコード群
の総量を計測、相当する連続領域を確保した上で、該当
レコード群の全てを確保された領域に移動する機能を提
供する。
【0079】なお、最新の更新以後、例5、或いは例7
に示した操作が実行されるまでに、前記機能が実行され
ていない場合には、その操作実行前に、前記機能を呼び
出し、クラスタの連続性を確保することが必要である。
【0080】:想定されるクラスタサイズを指定する
ことにより、情報格納操作実行以前に相当する連続格納
領域を確保する。この領域の位置、サイズをクラスタ管
理情報として保存し参照可能な状況を作る。レコードの
格納は、クラスタID(必要に応じて該当領域中に特定
位置を示す情報)を対象レコードに付加して指定するこ
とにより実現される。
【0081】:クラスタの指定を伴うレコードの格納
に先立ち、該当クラスタに属するレコード群の格納位置
の把握を行う。得られた格納位置に隣接して空き領域が
存在する場合には、その位置にレコードを格納し、その
位置を該当クラスタのレコード格納位置として登録す
る。
【0082】格納可能な隣接領域が存在しない場合に
は、より登録済みのレコード群を含めた該当クラスタ全
体を格納可能な空き領域を取得し、新規登録レコードを
含む全レコードを新規に確保された領域に移動する。レ
コードの格納が、クラスタID(必要に応じて該当領域
中の特定位置を示す情報)を対象レコードに付加して指
定することにより、実現されるのは前記の通りである。
この操作により、同一クラスタに属するレコード群の連
続領域への格納、及び、クラスタとこれに対応する各種
の管理情報の保存が保証される。前記管理情報の1例を
以下に示す。
【0083】a:クラスタID b:連続領域の存在位置に関する情報、例えば、開始位
置(ページIDとタプルID等で表現される)と、サイ
ズにより表現される。
【0084】c:その他のクラスタ属性情報、例えば、
その時点で該当クラスタにロックがかかっているか否か
等の情報がこれに該当する。 (2) :例2・・・図5参照 図5はページの隣接に関する説明図であり、情報のファ
イル上における格納形態と、メモリ7上における展開、
及びクラスタリング、その他の理由により関連する情報
群が格納された複数のページが連続領域に存在する様、
配置変更を行う状態を示している。
【0085】図5において、A1、A2、A3、B1、
C1、D1はそれぞれレコード群を示し、図示矢印は情
報の前後関係を示すリンクである。また、〜は処理
順序を示し、はファイル内情報格納順序(ディスク上
から読み出した情報)、はメモリ7上での情報格納形
態、は情報群A1、A2、A3をクラスタリングし、
かつページ隣接して配置したメモリ7上の情報、はフ
ァイル上に格納し保存した情報(ディスク上の情報)を
示す。なお、レコード群A1、A2、A3、B1、C
1、D1には、それぞれファイル上での前後関係の情報
が格納されているが、この情報は、からの処理へ移
る時に書き換えられる。
【0086】例2では、1ページに納まらない程度に大
量のレコードが近接格納対象として指定されることを前
提としている。大量の情報の一部を、前記例1の機能に
より、レコード単位で近接させ、更に、ページ単位で近
接させるものである(図5参照)。これにより、再度の
ファイルからの読み込み操作において、ページ開始位置
が前回と異なった場合でも、多くの有効情報を該当ペー
ジに存在させることが可能となる。
【0087】特定レコードを特定位置へ格納する手法に
関しては、例1で説明したものと同じである。ここでは
複数のページを連続させる、という一点に絞ってその方
法を説明する。この機能実現のために、ページに順序と
いう概念を与えることが必要になる。これにより、同一
情報格納ファイルからのI/O操作に使用されるペー
ジ、或いはページ上に存在する情報のメモリ7上におけ
る格納場所は、全て前後に関係付けられる。
【0088】前記例1に示した通常の情報近接格納によ
る(ページ間関係に何の注意も払わない)情報格納形式
は図5の→の処理のようになる。情報群A1を必要
とする場合に、このページの先頭位置が何らかの原因で
変化した場合、移動した部分に存在する情報(群)は必
要とされるA1に属さないものである。また、仮想ペー
ジ概念もあまり有効ではない。仮想ページ上の情報群、
即ち、連続するページ群に存在する情報群は、特に関係
のない組み合わせB1、C1、A2、・・・となってい
る。
【0089】ここで、ディスクから読み出された情報
(参照)は、メモリ7上に展開される(参照)が、
メモリ7上の情報の前後関係は、各ページの先頭に位置
する管理情報が双方向リンクの形で保持している。ここ
で、関連するページの近接を考える。例えば、情報群A
1とA2、A3は共にクラスタAの要素集合であり、或
る情報の参照に従い、別の情報の参照操作が発生する頻
度が高いと仮定する。
【0090】このような場合には、A1、A2、A3を
連続ページに格納する。前記の複数のページA1、A
2、A3は、ファイル上において前後関係にある領域を
使用する様、条件付け、格納配置の変更が成される(
参照)。なお、この機能は、再度の読み込み時にファイ
ル上に連続する位置に配置されていることを期待しての
ものであるので、情報がメモリ7上に存在している状況
で該当するバッファ(メモリ7上の情報格納方式)が連
続領域に存在する必要はない。
【0091】メモリ7上においては、このリンクは一意
に決定可能であれば良く、実際に各ページに相当するア
ドレスの大小関係と前後関係に相関性がある必要はな
い。また、ページの接続関係は線形に接続されている必
要もない。即ち、メモリ7上で指定された前後関係は、
必ずしもアドレスの連続性や大小関係に影響せず、その
接続関係が前後関係を示す状況に変化するのみである。
【0092】これらのぺージ群(に相当するバッファ
群)は、ファイルへの書き込み時に、ここで指定された
順に従って格納される(以上、図5の→の処理参
照)。このメモリ7上の情報がファイルに書き込まれる
際に、実際の格納構造、順位の変化が生じる。連続ペー
ジとして指定されたバッファ(群)上の情報群は、ファ
イルでは真に連続性を伴う位置に書き込まれる。
【0093】これにより、再度の読み込み操作では、A
1部分のページ読み込みにおいて、その開始位置がずれ
た場合であっても、移動部分にあたるのは、A2という
有効な関連情報群となる。また、仮想ページ概念を導入
した場合でも、そこに含まれる有効情報量は、当機能
(例2の機能)の適用以前と比較して非常に大きいもの
となる。
【0094】(3) :例3・・・図6参照 図6はプリミティブクラスタ概念説明図である。プリミ
ティブクラスタ(primitive cluster )は、一つ以上の
全く同一の組み合わせのクラスタに属するレコードの集
合であり、E1〜E12は各要素を示す。この例では、
に示したクラスタA、クラスタBが図示のように各要
素E1〜E12を含んでいたとする。のプリミティブ
クラスタの表現は次のようになる。
【0095】 primitive cluster A.=[E1,E2,E3,E5] primitive cluster B.=[E10,E11,E12] primitive cluster A.B.=[E4,E6] これにクラスタCを設定すると、のようになる。の
プリミティブクラスタの表現は次のようになる。
【0096】 primitive cluster A.=[E1,E2,E3,E5] primitive cluster B.=[E11,E12] primitive cluster C.=[E7,E8,E9] primitive cluster A.B.=[E6] primitive cluster B.C.=[E10] primitive cluster A.B.C.=[E4] 例3では、クラスタは単純なるレコード集合ではなく、
プリミティブクラスタを要素とするものとして表現され
る。プリミティブクラスタは、「一つ以上の全く同一の
組み合わせのクラスタに属するレコードの集合」であ
り、これが組み合わされてクラスタが認識される。これ
らのクラスタは、例えば、プリミティブクラスタX.Y
(X,Y:任意のプリミティブクラスタ)が、プリミテ
ィブクラスタXとプリミティブクラスタYの間に位置す
る様、順序関係を与えられ、この順序に従って格納され
る。
【0097】なお、クラスタCの設定によるプリミティ
ブクラスタの作成は自動的に行われるが、共通要素が存
在しない場合(primitive cluster A.C.)には、そ
れがプリミティブクラスタとして存在することはない。
【0098】(4) :例4・・・図7参照 図7は情報の重複格納説明図である。例4は、前記例1
による結果が提供されていることを前提として、更に複
雑な関係を持ち、全体量がページサイズと比較して非常
に大きい場合に有効である。この機能は同一実体を複数
領域に格納することを可能とするものである。更に、こ
の複数の格納位置を、前記例1の機能を使用することに
より、それぞれ関係する情報群と近接するものに決定す
る。
【0099】前記例1の機能を用いて実現する情報格納
位置の制御操作において、その格納順序の決定要因とし
て、情報がどのクラスタに属するかを判断基準とする。
この機能は複数位置に存在する情報が実際には単一のも
のを示していることを明確にすることで実現される。こ
の方式としては、例えば、次のようなことが考えられ
る。
【0100】:本体一つとその他沢山のコピーのよう
に区別し、全てのコピーは本体へのリンクを持つ様構成
することが考えられる。この場合には、全ての情報(レ
コード単位)はその情報が本体であるか否かを示すフラ
グを管理情報として保持する。また、当該情報がコピー
である場合には、本体へのリンクを、該当情報が本体で
ある場合には、コピーへのリンクをやはり管理情報の一
部として保持する。
【0101】:同格の複数の存在を循環リストで接続
する。このリンクは各情報の管理情報として提供され
る。重複保存の対象となっていない情報の管理情報は当
然のことながら、自分自身を指すことになる(これによ
り、重複保存の対象か否かを判断するフラグ機能をも持
つことになる)。
【0102】前記の構造例を図7に示す。図7におい
て、はページ1(クラスタA)、はページ2(クラ
スタB)、はページ3(クラスタC)を示し、各ペー
ジについて、サイズ(size)、重複のフラグとリンク
(dup frag and link)、データ(data)の各項目があ
る。
【0103】この例では、参照操作が要するI/O回数
の減少を目的として、情報の複数位置への格納を行う。
クラスタA、B、Cはそれぞれ十分な大きさがあり、1
ページに纏めて格納することは不可能であることを前提
とする。レコードE4は3つのクラスタの全ての要素と
なる。このような情報は、全てのクラスタにより近接格
納要素として指定される。
【0104】そこで、全てのクラスタが実際に近接格納
可能な複数の位置を選んで、その全ての位置にこのE4
を格納する。E4が必要となった場合(他の情報よりE
4が参照された場合)に実際に参照されるのは、該当情
報に最も近い位置に格納されているものである。
【0105】例えば、E4の参照がE1によりなされた
場合には、ヘージ1上に存在する情報が参照されるが、
E7によりE1が参照される場合には、ページ1へのア
クセスを必要としない。E7が存在するページ2上に
は、既にE4が存在しており、これを参照できるからで
ある。
【0106】前記のように、例4では、或る存在への更
新は、上記リスト、リンクを用いて別の存在にも伝播す
る。これにより、同一実体と認識されるレコード群の整
合性の確保が可能となる。
【0107】(5) :例5 例5は、前記例1による結果が保証されていることを前
提とする。即ち、同一クラスタに属するレコード群は連
続領域に存在し、クラスタと領域範囲の対応関係も確保
されているものとする。レコード群の削除はクラスタを
指定することにより実行される。システムは、指定クラ
スタの管理情報を検索し、相当する領域範囲(開始位置
とサイズ、或いは開始位置とレコード数等で表現され
る)を抽出、この連続する領域の情報群を纏めて削除す
る。
【0108】通常であれば、レコード群の削除操作はそ
れぞれのレコードを対象として実行され、各レコード毎
に格納位置の検索と抽出された領域に存在する情報の削
除を実行することになり、レコード数の格納位置の検索
操作と、レコード数の情報削除操作を繰り返すことにな
る。しかし、当方式では、検索操作を一回のみ実現する
ことで同様の効果を出現させることができる。
【0109】加えて、この機能を利用することによる効
率向上の要因は幾つかの(クラスタ要素数が1の)削除
対象レコードの位置決定操作の省略に過ぎず、通常のレ
コード削除機能との整合性に関しても問題は発生しない
と考える。従って、通常の削除操作との混用が可能であ
る。
【0110】当操作の使用は、ユーザが、クラスタID
(図4のクラスタID)と、これを対象とする操作
(図4の操作)を指定することにより実行される。こ
れによりデータ管理部5は、クラスタID(図4のク
ラスタID)をキー(引き数)としてクラスタ管理情報
記憶部6内のクラスタ管理情報を参照し、該当領域の位
置情報(図4の位置情報)を取得する。その後、デー
タ管理部5は、前記位置情報に相当するディスク装置8
のディスク上の領域を対象として、前記操作を実行す
る。ここでは操作(図4の操作:オペレーション)
は削除操作である。
【0111】(6) :例6 例6では、前記例3による結果が保証されていることを
期待する。このため、或るクラスタの要素として指定さ
れているものの内、該当クラスタのみに属している要素
を把握することになんの問題もない。削除対象クラスタ
として指定されたもののみに属するプリミティブクラス
タを検索し、それに対して前記例5と同様の削除操作を
行う。
【0112】(7) :例7 例7では、前記例1による結果が保証されていることが
必須である。クラスタを指定することにより、相当する
領域を検索可能であること、検索の結果として得られた
領域には該当クラスタに属する情報のみが存在し、途中
にそれ以外の情報が紛れていないこと、等が効率向上の
原因となる。
【0113】ここでのロック操作もやはりクラスタを指
定することにより実行される。排他制御のために管理情
報はクラスタ管理情報の一部として存在し、専有可能か
否か等の判断はこれを基に実現される。なお、このロッ
ク操作の効率は専有範囲を必要最小限に押さえることを
可能とした点に起因しており、前記例1で指定されたク
ラスタには同時に必要とされる最小限のレコード群のみ
が存在することを期待している。
【0114】なお、ここで提示したロック単位が他のロ
ック単位と重複していることは好ましくない。従って、
クラスタのネスト関係、重複関係が存在する場合には排
他制御情報を構造化する等の対応が必要となる。
【0115】当操作も、ユーザが、クラスタID(図4
のクラスタID)と操作(図4の操作)を指定する
ことにより実現される。但し、操作が該当領域の排他制
御の場合には、その成否は直接該当領域を参照すること
ではなく、クラスタ管理情報記憶部6内のクラスタ管理
情報を参照して決定されることが多い。従って、ここで
参照されるのはクラスタ管理情報であり、この操作の成
否(図4のS/F:SUCCESS/FALSE )は、ディスク装
置8のディスク上の格納領域を参照することなしに判断
される。なお、ここでの操作は専有処理である。
【0116】§6:各例の具体例による説明・・・図8
〜図11参照 図8は格納対象情報説明図、図9は一般格納形態説明
図、図10はクラスタ要素を連続領域に格納する場合の
説明図、図11はクラスタ領域の確保に関する説明図で
ある。以下、図8〜図11に基づいて、前記各例を具体
例に基づいて説明する。
【0117】ここではデータベースのデータエンジンを
例として説明する。ディスク装置8のディスクに情報を
格納する場合、図8に示す情報の格納を想定する。図8
に示した例では、部所情報(部所、職種、所在地、管理
職情報、部員情報)、従業員職務情報(氏名、部所情
報、地位、個人情報)、従業員個人情報(氏名、郵便番
号、住所、電話番号、家族情報)、家族情報(氏名、続
柄 職業、年齢)等の情報を格納対象情報としている。
【0118】図9は、図8に示した格納対象情報の一般
的格納形態(従来技術による格納例)を示した例であ
る。通常は同一タイプの情報がまとめて格納される。格
納順位には特に意味はなく、特別な制約が存在しない場
合には、登録時刻順である。
【0119】図9では、各情報はレコードとして認識さ
れ、レコードの集合がページ上に格納されている。情報
量が多い場合には、格納場所として複数のページが使用
される。図9の場合には格納場所(ページ)を各情報の
タイプ毎に用意している。また、同一タイプの情報が多
量に存在する場合には、該当タイプの情報を格納する領
域として複数のページを使用することになる(図におけ
るページ6とページ7、ページ4とページ5)。
【0120】格納形態がこのようになっている場合、所
属と氏名の判明している従業員の家族一覧を取得する場
合には、先ず、部署と従業員氏名を与えて従業員職務情
報テーブルを検索し(この際、ページ2従業員職務情報
テーブルの他、ページ1部署情報テーブルへのアクセス
がなされる)、ここで得られた個人情報(リンク情報)
により、従業員個人情報テーブルの該当位置を決定(こ
こでページ3にアクセス)する。
【0121】その後、ここに示した家族情報をリンクを
辿ることにより{ページ7へのアクセス、リストの配置
によりページ7′(ページ7と同一タイプの情報を格納
する別のページ)へのアクセスを必要とする可能性もあ
る}家族各員の情報を順次参照する(ページ4へのアク
セス。情報格納順位により全ての家族情報を得るまでに
必要となるページ数は異なる。図では対象従業員は複数
の家族を持ち、それぞれが異なったページ、ページ4と
ページ5に格納されていることになっている)。
【0122】以上の情報参照操作で必要とされるページ
数は6ページ、即ち、必要とされるI/O回数6回とな
る。また、ここでの検索対象となる従業員数が1ページ
に格納されている従業員情報数と比較して非常に小さい
場合には、I/O対象となったページ上に存在する無効
な(無意味な)情報の割合が非常に大きいものとなる。
【0123】以上は一般に物理クラスタリングの効果と
いわれているものと同等である。但し、ここでは同一ク
ラスタに属する情報群の格納位置が同一ページ上に存在
するのみでは十分ではなく、隣接する領域、即ちクラス
タ全体として連続領域に存在することが要求される。
【0124】このために、格納領域の取得を情報登録時
のみならずクラスタ指定により事前に確保する機能、或
いは格納済みの情報を別の領域、例えば、最終ページの
末尾等、希望するサイズの領域を確保できそうな領域に
移動する機能等が必要となる。
【0125】前記の一般的な情報の格納形態に対し、本
実施の形態による情報格納形態は次の通りである。以
下、図8に示した格納対象情報の格納に、本発明による
実現機能の適用を考える。この方式による最終的な情報
格納形態を図10に示す。図10は、図8に示した格納
対象情報を前記例1の処理を利用して格納したものであ
る。
【0126】ここでは、従業員個人情報は、その家族情
報と共に(同時に)参照される頻度が非常に大きいこと
を想定して、個人情報をその家族情報と共に同一クラス
タとして扱っている。すなわち、従業員個人情報、その
家族情報群、家族情報群を管理するためのリストがクラ
スタとして設定されている。保存されている情報がこの
ような構造を取っている場合、先に示した操作は、以下
のようになる。
【0127】個人情報(リンク情報)により、従業員個
人情報テーブルの該当位置を決定(ここでページ3にア
クセス)するまでは前述の場合と同様である。しかし、
この後、家族情報を取得する際には、新たなページの読
み込みを必要としない。家族情報、及びその順序と所在
を示すリスト情報は全て個人情報と同一ページ上に存在
する。従って、図9中に存在するページ7、ページ4、
ページ5の読み込みは必要とされない。ことにより、こ
こで示した参照操作は3回のI/O操作に要する時間分
の短縮がなされることになる。
【0128】以上は、一般に物理クラスタリングの効果
といわれているものと同等である。但し、ここでは同一
クラスタに属する情報群の格納位置が同一ページ上に存
在するのみでは十分でなく、隣接する領域、即ち、クラ
スタ全体として連続領域に存在することが要求される。
このために、格納領域の取得を情報登録時のみならず、
クラスタ指定により事前に確保する機能、或いは格納済
みの情報を別の領域(例えば、最終ページの末尾等希望
するサイズの領域を確保できそうな領域)に移動する機
能等が必要となる。
【0129】図11に図9の保存状態を作成する途上の
一例を示す。ここでは氏名1の登録に先立ちクラスタを
設定し、相当な領域を確保している。確保された領域は
システムに存在する汎用の格納領域管理機能の管理対象
外(既に使用されたものとして扱われる)となる。この
領域の管理はクラスタ管理に移行され、未使用領域と使
用領域の区別、格納領域サイズ等もクラスタ管理情報と
して扱われる。
【0130】このため、将来的に予定される氏名2の登
録は、このクラスタ要素の連続性を破壊しない領域に決
定される。以上により、前記例1の動作が実現される。
この動作は情報格納配置のより詳細な制御を可能とする
ことになり、以下の各種の操作を実現する。
【0131】関連情報を同一ページに格納する手段の提
供により、各種の応用機能が実現可能となる。前記例2
〜例8は、この例1の機能が提供されていることを期待
する。前記例1の操作により、操作内容とタイミングが
等しい情報はクラスタとしてグルーピングされ、連続領
域に格納されている(図10参照)。この「連続領域へ
格納されている」という事実をクラスタの全要素を対象
とする操作に利用するものが、前記例5、例7、例8に
示した機能である。ここでは前記例5を例に挙げてその
動作を説明する。
【0132】例えば、従業員の退職等が発生した場合、
従業員情報のみならず、その家族情報も合わせて不要な
ものとなる。このような場合には、該当従業員を要素と
するクラスタの削除を指定する。事前にクラスタ構成要
素(ここでは、従業員情報、家族情報など)と、クラス
タの対応関係を取得する手段を確保する。
【0133】図10では、クラスタ要素として、クラス
タIDを用意することにより、各クラスタ要素が自身の
クラスタIDを認識可能とする構造になっている。これ
により、削除を希望するクラスタのIDが決定する。ク
ラスタとそれを使用している格納領域の対応関係の保持
は、当システムにとっては必須である。ここではページ
110:クラスタ管理情報テーブルの形で保持されてい
る。これを参照することにより、操作対象範囲が決定す
る。
【0134】
【発明の効果】以上説明したように、本発明によれば次
のような効果がある。 (1) :従来以上に情報操作におけるアクセス範囲の限
定、局所化を追求し、これを利用して、各種の操作を効
率良く実現することができる。すなわち、情報を格納す
る際、単一I/O範囲のみならず、より詳細に隣接関係
を含めてその格納位置を制御しているので、情報操作を
対象とする時間性能を向上させることができる。
【0135】(2) :情報格納操作に要求される格納位置
の決定のための負荷に関しては、クラスタリング機能を
利用することにより、専用操作を必要とせず、最小限に
抑えることが可能になる。
【0136】(3) :格納された情報群を対象とする削除
操作を必要とする場合に、該当情報群の削除を一括して
行うことができるようにしたので、この点においても、
情報操作を対象とする時間性能を向上させることができ
る。
【0137】(4) :格納された情報群を対象とする排他
制御を行う場合に、排他制御の適用単位を該当情報群
(クラスタ単位)とすることができるようにしたので、
この点においても、情報操作を対象とする時間性能を向
上させることができる。
【0138】(5) :格納された情報群を対象として、複
数情報を対象とした連続操作が可能である様な更新操作
を行う場合に、適用単位を該当情報群(クラスタ単位)
とすることができるようにしたので、この点において
も、情報操作を対象とする時間性能を向上させることが
できる。
【0139】前記効果の他、各請求項に対応して次のよ
うな効果がある。 (6) :請求項1では、外部記憶装置にデータを格納する
際、情報格納手段は、同一ページ内に存在させることに
より、参照時に必要とされるI/O回数を減少させるこ
とが可能である様なレコード群を対象として、対象情報
群を同一ページのみならず、物理的に隣接、或いは可能
な限り近接させる様、その格納配置を決定する。
【0140】このように、情報を格納する際、単一I/
O範囲のみならず、より詳細に隣接関係を含めてその格
納位置を制御しているので、情報操作を対象とする時間
性能を向上させることができる。また、前記情報格納手
段により格納された情報群を対象とする削除操作を必要
とする場合に、該当情報群の削除を一括して行うことが
できるので、この点においても、情報操作を対象とする
時間性能を向上させることができる。
【0141】更に、前記情報格納手段により格納された
情報群を対象とする排他制御を行う場合に、排他制御の
適用単位を該当情報群(クラスタ単位)とすることがで
きるので、この点においても、情報操作を対象とする時
間性能を向上させることができる。
【0142】また、前記情報格納手段により格納された
情報群を対象として、複数情報を対象とした連続操作が
可能である様な更新操作を行う場合に、適用単位を該当
情報群(クラスタ単位)とすることができるので、この
点においても、情報操作を対象とする時間性能を向上さ
せることができる。
【0143】(7) :請求項2では、複数ページ情報格納
手段は、対象レコード群の総量がページサイズ以上に及
ぶ場合に、該レコード群を複数のページに分割格納した
上で、それぞれのページをファイル上の連続領域に格納
する。
【0144】このように、情報を格納する際、対象レコ
ード群の総量がページサイズ以上に及ぶ場合にも、単一
I/O範囲のみならず、より詳細に隣接関係を含めてそ
の格納位置を制御しているので、情報操作を対象とする
時間性能を向上させることができる。
【0145】(8) :請求項3では、レコード情報格納手
段は、二つのレコード群集合に共通するレコード(又
は、レコード群)が存在する場合に、二つのレコード群
自体を隣接、或いは近接させ、共通レコード(又は、レ
コード群)をその中間領域に置くようにして情報を格納
する。
【0146】このようにすれば、双方のレコード(又
は、レコード群)の参照効率を上げることができる。ま
た、参照操作に当たり、必要とされるI/O回数を減少
させることが可能となる。
【0147】また、レコード情報格納手段により格納さ
れた情報(又は、レコード群)を対象として、前記情報
格納手段(前記(1) の機能)により格納された情報群を
対象とする削除操作を適用する場合に、共通レコード群
格納領域を識別し、該当領域が削除対象レコード群以外
に属している場合には、その削除を回避することが可能
となる。
【0148】(9) :請求項4では、要素レコード情報格
納手段は、二つ以上のレコード群集合に共通する要素レ
コード(又は、レコード群)が存在する場合に、共通レ
コード(又は、レコード群)が重複して複数位置に存在
することを許容し、それぞれのレコード(又は、レコー
ド群)に対して要素が近接する様、その格納配置を決定
する。このようにすれば、複数のレコード群全ての参照
効率を上げることが可能になる。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】実施の形態における装置説明図である。
【図3】実施の形態における情報格納配置イメージ説明
図である。
【図4】実施の形態における情報伝達経路の説明図であ
る。
【図5】実施の形態におけるページの隣接に関する説明
図である。
【図6】実施の形態におけるプリミティブクラスタ概念
説明図である。
【図7】実施の形態における情報の重複格納説明図であ
る。
【図8】実施の形態における格納対象情報説明図であ
る。
【図9】一般格納形態説明図である。
【図10】実施の形態におけるクラスタ要素を連続領域
に格納する場合の説明図である。
【図11】実施の形態におけるクラスタ領域の確保に関
する説明図である。
【図12】従来例1の説明図である。
【符号の説明】
1 装置本体 3 入出力装置 4 演算機構 5 データ管理部 6 クラスタ管理情報記憶部 7 メモリ 8 ディスク装置

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】アクセスにI/O操作を必要とする外部記
    憶装置を備え、該外部記憶装置にデータを格納し、管理
    する情報処理装置において、 前記外部記憶装置にデータを格納する際、同一ページ内
    に存在させることにより、参照時に必要とされるI/O
    回数を減少させることが可能である様なレコード群を対
    象として、対象情報群を同一ページのみならず、物理的
    に隣接、或いは可能な限り近接させる様、その格納配置
    を決定する情報格納手段を備えていることを特徴とした
    情報処理装置。
  2. 【請求項2】対象レコード群の総量がページサイズ以上
    に及ぶ場合に、該レコード群を複数のページに分割格納
    した上で、それぞれのページをファイル上の連続領域に
    格納する複数ページ情報格納手段を備えていることを特
    徴とした請求項1記載の情報処理装置。
  3. 【請求項3】二つのレコード群集合に共通するレコード
    (群)が存在する場合に、二つのレコード群自体を隣
    接、或いは近接させ、共通レコード(群)をその中間領
    域に置くレコード情報格納手段を備えていることを特徴
    とした請求項1記載の情報処理装置。
  4. 【請求項4】二つ以上のレコード群集合に共通する要素
    レコード(群)が存在する場合に、共通レコード(群)
    が重複して複数位置に存在することを許容し、それぞれ
    のレコード(群)に対して要素が近接する様、その格納
    配置を決定する要素レコード情報格納手段を備えている
    ことを特徴とした請求項1記載の情報処理装置。
JP9270992A 1997-10-03 1997-10-03 情報処理装置 Withdrawn JPH11110265A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9270992A JPH11110265A (ja) 1997-10-03 1997-10-03 情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9270992A JPH11110265A (ja) 1997-10-03 1997-10-03 情報処理装置

Publications (1)

Publication Number Publication Date
JPH11110265A true JPH11110265A (ja) 1999-04-23

Family

ID=17493897

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9270992A Withdrawn JPH11110265A (ja) 1997-10-03 1997-10-03 情報処理装置

Country Status (1)

Country Link
JP (1) JPH11110265A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0971202A2 (en) * 1998-07-08 2000-01-12 Canon Kabushiki Kaisha Measuring unit, management unit, drive unit, drive system, and measuring apparatus
WO2007032068A1 (ja) * 2005-09-14 2007-03-22 Hitachi, Ltd. データベース管理プログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0971202A2 (en) * 1998-07-08 2000-01-12 Canon Kabushiki Kaisha Measuring unit, management unit, drive unit, drive system, and measuring apparatus
EP0971202A3 (en) * 1998-07-08 2000-05-31 Canon Kabushiki Kaisha Measuring unit, management unit, drive unit, drive system, and measuring apparatus
WO2007032068A1 (ja) * 2005-09-14 2007-03-22 Hitachi, Ltd. データベース管理プログラム
JPWO2007032068A1 (ja) * 2005-09-14 2009-03-19 株式会社日立製作所 データベース管理プログラム
JP4699469B2 (ja) * 2005-09-14 2011-06-08 株式会社日立製作所 データベース管理プログラム
US8073823B2 (en) 2005-09-14 2011-12-06 Hitachi, Ltd. Database management program

Similar Documents

Publication Publication Date Title
Harder et al. PRIMA-A DBMS prototype supporting engineering applications
US7526469B2 (en) Method and system of database management with shared area
US7685127B2 (en) Database access system, method of accessing a database, and method of designing a database access system
JP2012174096A (ja) 計算機システム及びデータ管理方法
CN102880704A (zh) 一种新型的并发内存数据组织与访问方法
CN115552390A (zh) 无服务器数据湖索引子系统及应用编程接口
JPH1153243A (ja) コンピュータシステム及びその処理プログラムを記録した媒体
CN1983270A (zh) 用于内容受管制的数据的数据库方案及其创建方法和系统
US20100023713A1 (en) Archive system and contents management method
KR100226447B1 (ko) 이동통신교환기에서 메타 데이타 및 목적 데이타를 직접 생성하 는 방법
JPH11110265A (ja) 情報処理装置
JP3169596B2 (ja) データベース管理装置
JP4825504B2 (ja) データ登録・検索システムおよびデータ登録・検索方法
JPH11161537A (ja) オブジェクト指向データベース及び記録媒体
JP4180247B2 (ja) オブジェクト管理方法を切り替える装置および方法
JP3590211B2 (ja) データベース管理方式
JP2004185561A (ja) データ変換方法、および、そのための計算機システム
JPS6129936A (ja) 検索方法
JPH03161864A (ja) 文書管理処理装置
JP2004259066A (ja) データソース統合プログラム及びシステム並びに方法
JPH07110809A (ja) 電子ファイル装置
JP2020149134A (ja) データ処理装置、データ処理システム、データ処理方法、プログラム
JPH10289254A (ja) 情報管理システムおよび記録媒体
JPH06175903A (ja) ファイル管理方式
JPH0341532A (ja) データベースアクセス方式

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20041207