JPH01250150A - 統合化ファイル・グループ記憶方法 - Google Patents

統合化ファイル・グループ記憶方法

Info

Publication number
JPH01250150A
JPH01250150A JP63301095A JP30109588A JPH01250150A JP H01250150 A JPH01250150 A JP H01250150A JP 63301095 A JP63301095 A JP 63301095A JP 30109588 A JP30109588 A JP 30109588A JP H01250150 A JPH01250150 A JP H01250150A
Authority
JP
Japan
Prior art keywords
physical
volume
logical
group
disk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63301095A
Other languages
English (en)
Other versions
JPH0534701B2 (ja
Inventor
Marc A Auslander
マーク・アレン・オースランダー
Albert Chang
アルバート・チャング
Stephen P Morgan
スティブン・ポール・モーガン
Ii John T O'quin
ジョン・トーマス・オークイン、セカンド
John C O'quin Iii
ジョン・クラウデ・オークイン、サード
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH01250150A publication Critical patent/JPH01250150A/ja
Publication of JPH0534701B2 publication Critical patent/JPH0534701B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F2003/0697Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers device management, e.g. handlers, drivers, I/O schedulers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 A、産業上の利用分野 この発明はデータ処理システムにおいて二次記憶装置に
物理記憶空間を割り振るデータ処理方法に関し、とくに
、システムが付加的な記憶空間を要求したときに、仮想
ディスクに割り振られたサイズを動的に調整するように
したものである。
B、従来の技術 データ処理システムにより採用されたデータを記憶する
ディスクの記憶装置を有するデータ処理システムに関し
ては多くの従来技術がある。ディスク記憶装置は種々の
型の情報を記憶する。たとえばマイクロ・プロセッサが
その下で動作するディスク・オペレーティング・システ
ムや、データ処理システムによって実行される様々なア
プリケーション・プログラム、アプリケーション・プロ
グラムによって生成されまたは処理された情報などであ
る。
ディスク記憶装置は通常1つまたはそれ以上の磁気ディ
スクを具備しており、ディスクは複数の同心円状のトラ
ックを有し、このトラックはセクタすなわちブロックに
分割されている。ディスクの各面は通常では情報を記憶
し、ディスク・ドライブが複数のディスクおよび多重磁
気ヘッドから構成され、いくつかのレコーディング・ト
ラックのうちの1つにヘッドを位置付けるようになって
いる。現行の多くのディスク・ドライブは所定のアドレ
ス規約を採用し、これがシリンダの番号(CC)、磁気
ヘッドの番号(H)およびセクタ番号(S)によって物
理記憶ロケーションを特定するようになっている。
シリンダ番号はまた、多重ヘッドが採用されている場合
には、トラック番号でもある。ヘッド番号は多重ディス
ク構造においてはディスク面と等価である。rCCH8
JCC−ス・フォーマットはディスク・ファイルの容量
とは無関係に採用されている。なぜならこのフォーマッ
トは現存するどのような構成のものをもアクセスする能
力を有しているからである。
ディスク記憶装置の容量をバイトで表わすと、それは採
用しているレコーディング手法、トラック密度、ディス
ク・サイズおよびディスクの数に依存する。この結果、
種々の容量、データ・レート、アクセス・タイムのディ
スク・ドライブが製作されている。
はとんどのデータ処理システムは通常多くのディスク・
ドライブをその記憶用に採用している。
各装置は故障につき独立したユニットであるから、沢山
の小容量のドライブにわたってデータを分散記憶するこ
とが1つの大容量装置を用いるより有、利なことがある
多くの小容量のドライブを用いる構成では、重要なデー
タのコピーを個別の装置に記憶することができ、主たる
コピーが利用できない場合でも他方の装置をアクセスす
ることができる。
システムにおいてディスク記憶空間の割り当てタスクは
通常ではオペレーティング・システムが行う。UNIX
 (ATT社の商標)型のオペレーティング・システム
たとえばIBM  AIX(IBM社の商標)オペレー
ティング・システム(IBM  PCRTエンジニアリ
ング・ワークステーションで採用されている)はファイ
ル統合のための極めて先進的なシステムを有している。
UNIXの語法では、「ファイル」はシステムにおいて
採用される情報を記憶するのに用いる基本構造である。
たとえばシステムにおける他のファイルのリストである
ディレクトリもファイルである。またデータ・ファイル
もファイルである。
各ファイルは固有の識別子を持たなくてはならない。ユ
ーザはファイルに名前を割り当て、オペレーティング・
システムは■ノード番号を割り当て、テーブルが各市を
番号に変換する。ファイル名は単なる文字列であり、通
常はぼ14個の文字に抑えられている。ファイルの総合
化は、関連するファイルを同一のディレクトリに割り当
てることにより行うことができる。ディレクトリは1つ
の名前を有する他のファイルであり、ディレクトリ中に
記憶されているファイルの名前およびIノード番号のリ
ストである。
AIXオペレーティング・システムは同様にファイル・
ディレクトリをもグループに統合する。
これにもファイル名が与えられる。これらもアアイルと
考えられるからである。このような統合化は階層的ファ
イル・システムとして知られている。
この階層的ファイル・システムは、頂点にルートを有し
、このルートから多重レベルに分岐する逆トリー構造に
似ている。ディレクトリ型のファイルおよび非ディレク
トリ型のファイルのいずれをも各レベルで記憶すること
ができる。1つのレベルで1つのディレクトリにおいて
名前によりリストされるファイルは1つの下位のレベル
に位置している。階層ファイル・システムにおいてファ
イルを特定するには、その名前を指定し、かつ、その前
にルート・レベルからその指定ファイルへとトレースす
るパスの記述を行う必要がある。パス記述子はパスが下
降していくパス名である。現行ディレクトリがルート・
ディレクトリであれば、全パスが表示される、現行ディ
レクトリが中間的なディレクトリであれば、より短いパ
スを定義する短いパス記述子でよい。
オペレーティング・システムの種々のファイルはそれ自
体階層的ファイル・システムで統合化されている。たと
えば多くのサブ・ディレクトリがルート・ディレクトリ
から生じ、これらが関連フッアイルをリストする。サブ
・ディレクトリはたとえば/、/b i n、/1mp
+ /uのような名前を有しており、/はAIXカーネ
ル・ファイルを記憶し、/ b i nはAIXユーテ
ィリティを記憶し、/l’mpは一時フアイルを記憶し
、/Uはユーザ・ファイルを記憶する。
上述のとおり、AIXファイルをディスク・ドライブの
個別のアドレス可能記憶ユニットに割り当てるタスクは
オペレーティング・システムが責任を持つ。
多くのオペレーティング・システムは、1またはそれ以
上のファイル・システムをディスク・ドライブに導入す
るよう働くコマンドを含んでいる。
「インストール」コマンドはファイルをディスク・ドラ
イブ上の継続したブロックにストアする。これら継続し
たブロックはディスク・ファイルのアドレス範囲の予め
指示された領域にある。ファイルを実際にディスク・ブ
ロックに割り当てる前に。
記憶サブシステムの利用可能ディスク記憶空間を多くの
異なる領域に分割して各領域が同一の一般機能を有する
ファイルを記憶できるようにするために決定を行う。こ
れら割り当てられた領域はよく仮想ディスクと呼ばれる
。AIXシステムでは用語ミニ・ディスクが用いられ、
IBM  VMシステムでは用語Aディスクが用いられ
る。
同一の特徴のファイルをディスク・ドライブの1つの定
義領域中に記憶すると、管理および制約の観点において
いくつかの利点がある。たとえばあるグループのファイ
ルは所定の期間変更できず。
他方他のファイルはすぐにでも変更することができる。
この結果異なる時間にバック・アップすることになる。
管理部(アトミニストレータ)にとっては、1つのグル
ープのファイルをファイルの機能に応じて1つの仮想デ
ィスクに割り当て、1つのグループのファイルをすべて
同様に管理するほうが単純である。
上述の2つは、記憶システム中のファイルの記憶をオペ
レーティング・システムで管理、制御する様に仮想ディ
スクにより与えられる簡便さの例である。
IBM  PCRTはAIXオペレーティング・システ
ムもPC−DOSオペレーティング、システムも動作さ
せることができ、このため、異なるオペレーティング・
システムによる異なる仮想ディスクへの記憶となり、シ
ステムの管理および制御が簡易となる。なぜなら各仮想
マシーンが、ミニ・ディスクに開存するそれ自身の記憶
システムがどのように現われているかを有効に保持して
いるからである。
AIXオペレーティング・システムで生成された仮想デ
ィスクの大きさは、−旦確立されたのちは動的に変更す
ることができない。実際のディスク装置の容量まではど
のようなサイズを選定してもよいけれど、そのサイズは
システム管理部および所定のAIXユーティリティの指
示によってのみ変更できる。いくつかのミニ・ディスク
においては、初期の容量の選定は比較的簡単に行われる
なぜならばミニ・ディスクに割り当てられるファイルす
べての大きさが、知られており、あまり起こらないプロ
グラム更新の場合をのぞけば所定の期間その容量は一定
になっているからである。他の極端な場合では、ディス
ク・ドライブの1つの領域すなわち1つのミニ・ディス
クをページング空間用に留保しておかなければならず、
要求されるページング空間の量は所定の期間にわたって
著しく変動する。
同様に、ユーザ・ファイル・データ用の空間も短かい時
間間隔で著しく変動することがある。仮想ディスクの容
量を最悪の条件をカバーするように選定すると、はとん
どの時間未使用となっている空間が生じてしまう。最悪
のケースに必要な容量に較べ少ない容量を割り当てると
、ディスク空間の不便なリローケーションを伴うことに
なる。
時々のニーズに合致すべく変動するのではない。
予め定められた容量を有する仮想ディスクでは、ディス
ク記憶空間を最良に使用するというにはほど遠く、最適
なパフォーマンスを確保するにはシスム管理部がより頻
繁に関与しなくてはならない。
固定容量の仮想ディスクの他の問題はシステムの総記憶
容量が1つのディスク装置では足りないときに起こる。
仮想ディスクは継続したディスク・ブロックを割り当て
て生成され、そのディスク・ブロックは記憶システムに
おけるアドレスの基本単位であるから、2つの物理デバ
イス装置にわたって1つの仮想ディスクを生成するのは
実際的ではない。1つの単一ディスク装置上にある複数
の仮想ディスクでは無駄な未使用空間も有し、この空間
はもう1つの仮想ディスクを保持するには十分でない。
したがってその空間は最後に生成された仮想ディスクに
加えてします、そうしふいと無駄になってしまうからで
ある。
C6発明が解決しようとする問題点 この発明は以上の事情を考慮してなされたちのであり、
必要に応じて動的に記憶容量を変動させるのでない仮想
ディスクを用いることにより生じる問題点を解消したデ
ータ処理システムのディスク・ドライブ上の空間割り当
て方法を提供することを目的としている。
D0問題点を解決するための手段 この発明によれば、複数の物理的に継続したブロックす
なわちセクタを有する区画が空間割り当ての基本ユニッ
トとして確立される一方で、ディスク・ファイルのアド
レスの基本ユニットとしてディスク・ブロックが維持さ
れる。複数の物理区画が1つにグルーピングされて物理
ボリュームと呼ばれる。1つにグルーピングされる複数
の物理、ボリュームはボリューム・グループと呼ばれる
各物理区画に含まれる物理ブロックの個数および各物理
ボリュームに含まれる物理区画の個数は、物理ボリュー
ムがボリューム・グループ中に導入されたときに固定さ
れる。換言すれば、1つの物理ボリューム・グループ中
のすべての物理区画は同一のサイズとなっている。異な
るボリューム・グループでは区画サイズは異なってよい
AIXファイル・システムすなち1グループの関連する
ファイルをシステムに導入するときに、最少数の物理区
画しか含まれない論理ボリュームが、ファイル・システ
ムを記憶する必要のあるディスク上に形成される。ファ
イル・システムはそれより大きな記憶空間を必要とする
ので、論理ボリューム・マネジャは付加的な物理区画を
その論理ボリュームに割り当てる。論理ボリュームの個
々の物理区画は異なるディスク・ドライブ上にあっても
よい。論理ボリューム・マネジャは各物理区画の初めの
物理アドレスをデバイス・アドレスおよびそのデバイス
上のブロック番号によって特定し、この論理ボリューム
・マネジャが区画マツプを維持し、これによりシステム
が付与した論理アドレスをディスク・ファイル上の実ア
ドレスに関係付けするのを容易にする。
E、実施例 第1図はこの発明で実施するうえで用いる典型的なデー
タ処理システム10を機能的に示す。この第1図におい
て、システム・ハードウェア10はマイクロプロセッサ
12、メモリ・マネジャ・ユニット13、主システム・
メモリ14、I10チャネル・コントローラ16および
I10バス21を有している0図示のように多くの種々
の機能のI10ユニットがバス21に接続されており、
その中にはディスク・ドライブ17もある。システムに
記憶されている情報は第1図のブロック11として機能
的に示されており1通常多くのアプリケーション・プロ
グラム、オペレーティング・システム24を含んでいる
。オペレーティング・システム24はここではAIXオ
ペレーティング・システムとする。また1グループのア
プリケーション開発のプログラム23も図示されている
。アブリケーシミン開発プログラム23は他のアプリケ
ーション・プログラムを開発するときに利用されるツー
ルである。
第1図のシステムの商用機の例はIBM  F’CRT
エンジニアリング・ワークステーションであり、これは
AIXオペレーション・システムを採用する。
AIXオペレーティング・システムはUnix型のオペ
レーティング・システムで、システム・コールおよびフ
ァイル統合化機能を含むUnix型の特徴の多くを含ん
でいる。
第2図はAIXオペレーティング・システムのファイル
統合化構造を示す。記憶される情報の基本単位は「ファ
イル」と呼ぶ。各ファイルは「my−f i l e、
 001Jのような名を有する。ファイルはグループ化
してよく、1つのグループに属する全ファイル名のリス
トが生成される。このリストは「デイレクト1月と呼ば
れ、それ自体ファイルである。これはrmy−d i 
rec t、 010」のような名を有する。第2図に
示すような統合化は反転トリー構造と呼ばれる。ファイ
ル統合化のルートが頂点に位置しているからである。
ファイル統合化のルート・レベルはディレクトリ・ファ
イルおよび他の型のファイルを含む、第2図に示すよう
に、ルート・ブイレフ1−リ・ファイルは他のファイル
OoA、00B、00C200DおよびOOEの名前を
リストしている。1つのレベルでディレクトリ・ファイ
ルにリストされたファイルはつぎの下位レベルのファイ
ルとして現われる。
ファイル名はユーザが割り当てた名前とパス定義とを含
む、パス定義はルート・ディレクトリで始まり、このル
ート・ディレクトリは取り決めによりスラッシュ記号(
1)で特定され、このルート・ディレクトリに続けてフ
ァイル名またはこのファイル名にいたるためにトレース
されるべきパス中のディレクトリ名を記述する。
第1図においてブロック11中に示されるプログラム領
域の各々は膨大な数のファイルのを含み、これらは第2
図に示す態様で統括されている。用語[ファイル・シス
テム」は共通の多重レベルのパスを共有する一部のファ
イルまたはファイルのそれぞれの多重レベル・パスの一
部を共有する一部のファイルを意味するのに用いる。
この発明の方法は第1図に示すディスク・ドライブ17
上の記憶空間を第1図のブロック11中に表わされたフ
ァイル全部および第2図に示される階層的記憶システム
上に表わされるファイル全部に割り振るように機能する
実際にはディスク・ドライブ17は複数の個別ディスク
・ドライブを含んでよい。そのような個別ディスク・ド
ライブは第3図に示される。第3図に示す装置は複数の
円形磁気ディスク30を有し、これらディスク30はシ
ャフト31に実装されている。このシャフト31はモー
タ32により等速度で回転させられている。ディスク3
0の各面33および34は磁性材料で被覆されており、
同心円状の複数の磁気トラックを有している。
ディスク・ドライブ17はさらに複数の磁気変換器36
を位置決めする機構35を有している。
磁気変換器36の各々はそれぞれ1つの面に関連付けら
れている。そしてキャリッジ38を移動させるため設け
られているアクチュエータ37に供給されるアドレス信
号36に応じて、同心円状に記録を行うトラック位置の
1つに関連付けられる。
各ディスクの各面上の記録トラックの1つ1つは記録ト
ラックの仮想シリンダに所属する。仮想シリンダを同じ
くする記録トラックは対応するトラック位置に存在する
ディスク・ドライブへの物理アドレスは“CCH3″′
で指示される5バイト・アドレスの形をしている。CC
はシリンダすなわちトラックの番号を表わし、Hは磁気
ヘッドすなわち磁気変換器に割り当てられた番号を表わ
す、この番号はディスク面にも対応する。1つのヘッド
あたり1つの面があるからである。またはトラック部分
ののセクタすなわちブロック番号を表わす、このブロッ
クは装置上アドレス可能な最小データ単位として確立さ
れる。
1つのブロックが512バイトの記憶位置を有し、1つ
のトラックに36個のブロックがあることにしよう。シ
ステム・アドレスの目的においては、ファイル中のブロ
ックはゼロから順に番号付けを行うことができる。ブロ
ック番号アドレスから実物理アドレスへの変換は単純な
数学的計算で行える。
プログラミングの観点からは、ディスク・ドライブは物
理ボリューム(Physical Volume: P
 V )と呼ばれることがあり、一連のディスク・ブロ
ックと考えられる。物理ボリュームは1個のデバイス・
アドレスを有し、2個の個別のディスク・デバイスを含
むことができない。なぜなら、各デバイスは個別のアク
セス機能を有し、固有のアドレスを要求する。
第4図は種々の記憶エレメントの物理的な関係を示す、
ただし、この種々の記憶エレメントは。
業界において大部分の標準化されているディスク・ドラ
イブのアドレス・アーキテクチャに関連するものである
各バイト位置40は1パイトド分のデータを記憶する。
セクタすなわちブロック41は特定数、通常512個の
順次的または継続したバイト位置を有し、アドレス可能
エレメントの最低レベルである。ブロック41はトラッ
ク42にまとめられる。トラック42は面33および3
4に統一される。面33および34はディスク31.3
2に統一される。ディスクはディスク・ドライブすなわ
ちディスク記憶デバイス171に統一される。2個以上
のディスク記憶デバイス171が採用されるならば、そ
れらを統合してディスク・ドライブまたはディスク・フ
ァイルの物理ストリングと呼ぶことができる。実際には
ディスクまたはディスク・トラック42はブロックを使
用不可にする欠陥を有する1またはそれ以上のセクタ1
7を含むことがある。
この発明を明確に理解するために、以下では、面は実感
なブロックを有しないとする。ただし、アドレス変換構
成において欠陥ブロックにどのように対処するかについ
ては一応説明する。これは使用不可ブロックを含むディ
スク・ドライブ環境においてはこの発明の実効性がない
というように考えないようにするためである。
各物理ボリュームたとえば各個別のディスク・ドライブ
は、電源が最初にオンされたときにシステムが用いる情
報をストアするボリュームの領域を留保している。この
ことはすでに業界の標準になっている。たとえばトラッ
クすなわちシリンダ0−4が特別情報用に留保されてい
る。
各物理ボリュームは少なくとも2つのシリンダを特別用
途に保留している。さらに、物理ボリュームのある所定
領域をブート・コードを保持するのに保留することがで
きる。ブート・コードはシステムがそこから立ち上がる
ものである。ブート・コードは診断ソフトウェアやオペ
レーティング・システムのカーネル(中核部)をロード
するのに用いることもできる。
第1の保留シリンダはシリンダOである。これは物理ボ
リューム上の第1シリンダである。各物理ボリュームは
シリンダ0の最初の4つのトラックを用いてダイレクト
・アクセス記憶デバイス(DASD)の種々のタイプの
構成および操作情報をストアする。このDASDはシス
テムに取り付けられるものである。この情報のうち所定
のものは物理ボリューム製造者によって実装され、また
他の所定のものはオペレーティング・システムによって
書き込まれる。
物理ボリュームの第2の保留シリンダはカスタマ・エン
ジニアが独占的に使用するようになっている。これはC
Eシリンダと呼ばれる。このシリンダは常に物理ボリュ
ームの最後のシリンダであり、診断目的に使用される。
CEシリンダはユーザ・データ用に使用できない。ブー
ト・コード領域および非保留領域は構成レコードの内容
との関連で変換されるIPLレコードの内容によってポ
イントされる。
IPLレコードは1個のブロックからなり、システムが
ブート・コード(もしあれば)を読み、物理ボリューム
を初期化することを可能にする情報を含んでいる。IP
Lレコードは4つの論理セクションに分割される。第1
セクシヨンはIPLレコードIDである。第2セクシヨ
ンは物理ボリュームに関するフォーマット情報を含んで
いる。
第3セクシヨンはブート・コード(もしあれば)がどこ
にあり、どのくらいの長さかを示す情報を含んでいる。
第4セクシヨンは物理ボリュームの非保留領域がどこに
あり、どのくらいの長さかを示す情報を含んでいる。
構成レコードは1個のブロックからなり、IPLレコー
ド、構成レコードまたはバックアップ構成レコードを読
み出す以外のすべてのI10操作用に物理ボリュームが
必要とする情報を含んでいる。構成レコード・フィール
ドは、たとえば構成レコードより、フォーマット後に利
用可能なセクタ数、IPLレコード、構成レコードまた
はバックアップ構成レコード以外のものを読むのに用い
るインターリーブ・ファクタ、IPLレコード、構成レ
コードまたはバックアップ構成レコード以外のものを読
むのに用いるセクタごとのバイト数等の項目を含んでい
る。
欠陥ブロック・ディレクトリが設けられて、欠陥ありと
診断されたブロックのレコードを保持している。以下で
はディスクに欠陥ブロックがないとする。または既知の
手法によりそれら欠陥ブロックは処理されるものとする
またパワー・オン・システム・テスト(posT)制御
ブロック用に1つのトラックが保留されている。このブ
ロックはシステム初期化動作時にメモリ中に生成される
物理ボリュームの非保留領域のレイアウトは第5図に示
すようになっている。物理ボリュームの非保留領域の第
1の部分は物理ボリューム記述子、論理ボリューム記述
子、ボリューム・グループ記述子およびネーム記述子領
域を含んでいる。物理ボリュームの空間を節約するため
に、この領域の大きさは可変となっている。この大きさ
は、物理ボリュームの大きさ、ボリューム・グループに
許容される論理ボリュームの個数に依存する。物理ボリ
ューム記述子は各物理区画ごとにエントリを含んでいる
。物理区画は物理ボリュームに相当するものである。た
とえば物理ボリュームが200メガ・バイトで物理区画
が1メガ・バイトであれば、物理ボリューム記述子は2
00個の物理区画エントリを有する。論理ボリューム記
述子はボリュームグループ中に許容されている最大個数
の論理ボリューム用のエントリを含んでいる。これはボ
リューム・グループが生成されたときに特定され、たと
えば128個である。
第5図に示す非保留領域のレイアウトでは200メガ・
バイトの物理ボリュームで゛、1メガ・バイトの物理区
画サイズで、ボリューム・グループ中の省略時の論理ボ
リュームの最大個数は128となっている。すべての数
は16進表示である。
所与の物理アドレスが物理ボリュームの非保留領域の最
初からのオフセット(セクタ中)になっていることにす
る。
各物理ボリュームは、物理ボリュームおよびその物理区
画の状態を示す物理ボリューム記述子と呼ばれるテーブ
ルを含んでいる。物理ボリューム記述子のサイズはそれ
が記述している物理ボリュームのサイズに直接比例する
。物理ボリューム記述子は記述子ヘッダおよび物理ボリ
ューム中の各物理区画ごとの1つのエントリを有してい
る。この実施例の物理ボリューム記述子は同一の物理ボ
リュームに複写され、いかなる物理区画中にも含まれず
、第6図に示すようなフォーマットを有する。
物理ブロック番号およびDASDデバイス配置形状との
間には明示的な関係は何らないことに留意されたい、物
理区画は、物理ブロックへのアクセスが最適化される態
様でDASD上に割り振られなければならない。物理ボ
リューム記述子はその2つのコピーが単一のミスでなる
べく消去されないような態様でDASD上に割り振られ
るべきである。
第6図に示される物理ボリューム記述子ヘッダの詳細は
第6a図に示されている。物理ボリューム記述子ヘッダ
は物理ボリュームの情報および物理区画マツプの内容の
情報を含み、第6a図に示すフォーマットを有している
物理ボリューム記述子ヘッダ中の種々のフィールドはつ
ぎのようなものである。
VOLUME  CHECK  FORMATは物理ボ
リュームが初期化されてオペレーティング・システムに
適合するデータを含みうるかどうかを判別するのに用い
る。さらに、このフィールドはディスク上の情報のバー
ジョンおよびリリース・レベルを示すのに用いることも
できる。
PHYSICAL  VOLUME  IDは物理ボリ
ュームを個別に統一的に特定する64ビツトの数である
。この固有の識別子は物理ボリュームの製造者により割
り当てられると考えるべきだが、論理ボリューム・マネ
ジャによって割り当てられてもよい。
物理ボリュームがシステムにおいて最初に導入されたと
きに構成レコードの「固有識別子」フィールド(バイト
6O−67)が非零であれば、この値は物理ボリューム
記述子ヘシダのPHYSICAL  VOLUME  
IDフィーjvド中ニコピーされ、その時点から論理ボ
リューム・マネジャによって物理ボリューム用の固有の
識別子として使用される。
PHYSICAL  VOLUME  TIMESTA
MPはプロセッサ・タイム・オブ・デイ・クロック内容
のコピーを含み、物理ボリューム記述子が最も最近に更
新された時間を示す。
PHYSICAL  VOLUME  NAMEti物
理ボリュームの名前を示すネーム記述子領域への16ビ
ツト・オフセットである。PHYSICAL  VOL
UME  NAMEは空(oxoo。
O)かまたはOおよび255のASCII文字の間の空
終了ストリングとしてフォーマットされているフィール
ドを指示する。取り決めではPHYSICAL  VO
LUME  NAMEは物理、ボリュームと関連する特
別のファイル(たとえば/de v / p v O)
の名前を指示する。
PP  5IZEは物理ボリューム上の物理区画のサイ
ズを表わす、PP  5IZEは16から28の範囲の
整数であり、システム・アトミニストレータによって割
り当てられる。この物理ボリュームを含むボリューム・
グループ中のすべての物理区画の大きさはPP  5I
ZEの値で特定される16〜28の2のべき乗である。
MOUNTABLEは物理ボリュームがマウント可能か
どうかを特定するものである。
PP  C0UNTは物理ボリューム上に割り当て可能
な物理区画の最大数を示す、PP  C0UNTは1か
ら1023の範囲の整数であり、論理ボリューム・マネ
ジャが物理ボリュームによりサポートされている物理ブ
ロックの数および各物理区画の大きさから計算する。
物理区画のマツプ・エントリの詳細は第6b図に示され
ている。
物理区画マツプは最高1023個の物理区画マツプ・エ
ントリからなる組を含んでいる。各エントリは当該物理
ボリューム内の1個の物理区画を記述しており、また第
6b図に示すようなフォーマットを有する。この場合ビ
ット番号は10進数である。バイト・オフセットは16
進数である。
スラッシュ(//)は保留フィールドを示す。
LOGICAL  VOLUME  NAMEは当該物
理区画を含む論理ボリュームの名前を表わすネーム記述
子領域への16ビツト・オフセットである。LOGIC
AL  VOLUME  NAMEは空のポインタであ
るか、またはOおよび255のASCII文字の間の空
終了ストリングとしてフォーマットされているフィール
ドをポイントする。取り決めでは、LOGICAL  
VOLUME  NAMEは論理ボリュームに関連する
特別のファイル(たとえば/ d e v / h d
 O)の名前をポイントする・ LOGICAL  PARTITION  NUMBE
Rは物理区画を含む論理ボリューム内の、当該物理区画
によって表わされる論理区画を示す。
LOGICAL  PARTITION  NUMBE
RはOから4095の範囲の整数であり、論理ボリュー
ム・マネジャによって割り当てられる。
PART  TYPEは物理区画の型を示し、つぎのよ
うなものである。
0XOO:使用不能区画、 ○X01:未割り振り 0XO2:非鏡映論理区画の単一コピー0XO3:単一
鏡映論理区画の主コピー0XO4:二重鏡映論理区画の
副コピーPHYSICAL  VOLUME  TIM
ESTAMPはプロセッサ・タイム・オブ・デイ・クロ
ックの内容のコピーを有しており、直近に物理ボリュー
ム・マツプ・エン1−りが更新された時刻を示している
フィールドIST  ALT  VOL、l5T−AL
T  PART、2ND  ALT  VOL、2ND
  ALT  PARTはすべて鏡映コピーの情報に関
連する。この実施例において鏡映機能がどのように管理
されるかを理解することは必要でないから、ここでは説
明しない。
物理ボリューム記述子は、システム故障に直面したとき
にも内容上の一貫性を保持しうるように特別の態様で更
新されることに留意されたい。
各物理ボリュームは論理ボリューム記述子と呼ばれるテ
ーブルをも含んでいる。この記述子はボリューム・グル
ープ中の論理ボリュームを記述するものである。論理ボ
リューム記述子は記述子ヘッダと、ボリューム・グルー
プにおいて許容される論理ボリュームの最高数を上限と
して各論理ボリュームあて1個のエントリとを有してい
る。この最高数はボリューム・グループが生成されると
きに特定される。省略時にはたとえば128となる。ボ
リューム・グループ中のすべての物理ボリュームは論理
ボリューム記述子の同一のコピーを有している。
論理ボリューム記述子は物理ボリュームごとに複写され
、物理区画単位では含まれない。これは第6c図のうよ
なフォーマットを有する。論理ボリューム記述子は、単
一故障で記述子の両コピーを消去する可能性がなるべく
少なくなるような手法でDASD上に割り振らけなけれ
ばならない。
第6c図の論理ボリュー記述子ヘッダの詳細な第6d図
に示される。論理ボリューム記述子ヘッダは当該ボリュ
ーム・グループ中の論理ボリュームに関する情報を含ん
でおり、そのフォーマットは第6d図に示すとおりであ
る。ここでビット番号は10進数である。バイト・オフ
セットは16進数である。スラッシュ(//)は保留フ
ィールドを示す。
論理ボリューム記述子ヘッダ内の種々のフィールドはつ
ぎのようにできる。
LOGICAL  VOLUME  TIMESTAM
Pはプロセッサ・タイム・オブ・デイ・クロックの内容
のコピーを有し、論理ボリューム記述子が直近に更新さ
れたのがいつかを示す。
VOLUME  GROUP  NAMEは当該物理ボ
リュームを含むボリューム・グループの名前を示すネー
ム記述子への16ビツトオフセツトである。VOLUM
E  GROUP  NAMEは0および255のAS
CII文字の間の空終了ストリングとしてフォーマット
されているフィールドへポイントする。
LV  C0UNTはボリューム・グループ中の現在の
論理ボリュームの個数を示す。LV  C0UNTは0
からMAX  LVS(7)間の整数である。
MAX  LVSはボリューム・グループ中に許容され
る論理ボリュームの最大個数である。この値はボリュー
ム・グループが生成されたときに特定される。MAX 
 LVSはたとえばOから1023の範囲の整数である
。ゼロが特定されると、省略時の128が用いられる。
論理ボリューム・マツプ・エントリの詳細は第60図に
示される。論理ボリューム・マツプは論理ボリューム・
マツプ・エントリの組を含む。このエントリの各々はボ
リューム・グループ内の1つの論理ボリュームを記述し
、第6e図に示すようなフォーマットを有する。ここで
ビット番号は10進数であり、バイト・オフセットは1
6進数である。
LOGICAL  VOLUME  IDは論理ボリュ
ームを個別にかつ統一的に識別する64ビツト番号を含
む、この固有のIDは論理ボリューム・マネジャによっ
て割り当てられる。
LOGICAL  VOLUME  NAMEは論理ボ
リュームの名前を示すネーム記述子領域への16ビツト
のオフセットを含む、LOGICALVOLUME  
NAMEは空ポインタテアルカ。
または0および255のASCII文字の間の空終了ス
トリングとしてフォーマットされたフィールドをポイン
トする。取り決めでは、LOG I CAL  VOL
UME  NAMEは論理ボリュームに関連する特別な
ファイル(たとえば/dev/hdo)の名前をポイン
トする。
MAXS I ZEは当該論理ボリュームが成長しうる
最高の大きさ(区画内において)を示す。
LV  TYPEは論理ボリュームの型を示し、つぎの
ようになっている。
oxoo:不知 0XOI:オペレーティング・システム・ページング空
間を含む。
0XO2:○Sログを含む。
○X03:○Sファイル・システムを含む。
0XO4: OSダンプ・ボリュームを含む。
0XO5: DOSファイル・システムを含むMIRR
ORは論理ボリュームが鏡映されるべきかどうかと、鏡
映の個数とを示す、MIRRORは非鏡映、単一鏡映、
二重鏡映にできる。
NPARN  5ELECTは論理ボリュームに対し次
の物理区画を選択するときに用いるアルゴリズム番号を
示す。
MIRROR5ELECTは論理ボリュームに対し論理
区画用の鏡映を選択するときに用いるアルゴリズム番号
を示す。
NUM  PVSは論理ボリュームのコピーが制限され
る物理ボリュームの個数を示す、制限がなければゼロで
ある。
PV  NAMEは、論理ボリューム用の区画が割り振
り開始される物理ボリュームの名前を示すネーム記述子
領域への16ビツトのオフセットである。
MIPV  NAMEは論理ボリュームの主鏡映用の区
画が割り振り開始される物理ボリュームの名前を示すネ
ーム記述子領域への16ビツトのオフセットである。
M2PV  NAMEは論理ボリュームの副鏡映用の区
画が割り振り開始される物理ボリュームの名前を示すネ
ーム記述子領域への16ビツトのオフセットである。
LOGICAL  VOLUME  TIMESTAM
Pはプロセッサ・タイム・オブ・デイ・クロックの内容
のコピーを有し、論理ボリューム・マツプ・エントリが
直近に更新された時刻を表わす。
各物理ボリュームはボリューム・グループ記述子という
テーブルも有する。ボリューム・グループ記述子は物理
ボリュームを含むボリューム・グループの状態を表示す
る。1つのボリューム・グループ内のすべての物理ボリ
ュームはボリューム・グループ記述子の同一のコピーを
有する。ボリューム・グループ記述子は同一の物理ボリ
ューム上で複写され、物理区画単位では含まれない。フ
ォーマットは第6f図に示すとおりである。ボリューム
・グループ記述子は、その両コピーが単一の故障で消去
されるのを抑えるような態様でDASD上に割り振られ
る。
ボリューム・グループ記述子ヘッダの詳細を第6f図に
示す。ボリューム・グループ記述子ヘッダはボリューム
・グループに関する情報およびボリューム・グループ・
マツプの内容に関する情報を有し、第6g図に示すよう
なフォーマットを有する。この場合バイト・オフセット
は16進数である。
ボリューム・グループ記述子ヘッダ内の種々のフィール
ドはつぎのとおりである。
VOLUME  GROUP  TIMESTAMPは
プロセッサ・タイム・オブ・デイ・クロックの内容のコ
ピーを有し、ボリューム・グループ記述子が直近に更新
された時刻を示す。
VOLUME  GROUP  IDはボリューム・グ
ループを識別する個別の統一的な64ビツトの番号を含
む、この固有の識別子は論理ボリューム・マネジャによ
って割り振られる。
ボリューム・グループ・マツプ・エントリの詳細は第6
h図に示す。ボリューム・グループ・マツプは254個
のボリューム・グループ・マツプ・エントリの組を有し
、各エントリはボリューム・グループ内の1個の物理ボ
リュームを記述し、第6h図に示すフォーマットを有す
る。ここでビット番号は10進数である。バイト・オフ
セットは16進数である。スラッシュ(//)は保留領
域を示す。
ボリューム・グループ・マツプ・エントリ内の種々のフ
ィールドはつぎのとおりである。
PHYSICAL   VOLUME   NUMBE
Rは物理ボリュームを個別に統一的に特定する64ビツ
トの番号を含む。この固有の識別子は物理ボリュームの
製造者によって割り振られていると考えるべきであるが
、論理ボリューム・マネジャが割り振ることもできる。
PHYSICAL  VOLUME  NAMEは当該
物理ボリュームの名前を示すネーム記述子領域への16
ビツトのオフセットである。PHYSICAL  VO
LUME  NAMEは空ポインタか、またはOおよび
255のASCII文字の間の空終了ストリングとして
フォーマットされているフィールドへポイントを行う。
VOLUME  GROUP  NAMEは当該物理ボ
リュームを含むボリューム・グループの名前を示すネー
ム記述子領域への16ビツトのオフセラトチある。VO
LUME  GROUP  NAMEは空ポインタか、
または0および255のASCII文字の間の空終了ス
トリングとしてフォーマットされているフィールドへポ
イントを行う6ボリユーム・グループ記述子テーラを第
61図に示す。ボリューム・グループ記述子テーラはボ
リューム・グループに関する情報およびボリューム・グ
ループ・マツプの内容に関する情報を含み、第61図に
示すフォーマットを有する。ここでビット番号は10進
数である。バイト・オフセットは16進数である。スラ
ッシュ(//)は保留フィールドを示す。
VOLUME  GROUP  TIMESTAMPは
プロセッサ・タイム・オブ・デイ・クロックの内容のコ
ピーを含み、ボリューム・グループ記述子が直近に更新
された時刻を示す。
種々のデータ構造について上述した際に触れたネーム記
述子領域はボリューム・グループとこのボリューム・グ
ループ内のすべて物理ボリュームおよび論理ボリューム
とに関する名前文字ストリングを含む未フォーマットの
領域である。ネーム記述子領域の大きさはボリューム・
グループ内の物理ボリュームおよび論理ボリュームの最
大個数に対応する。ボリューム・グループに対する論理
グループの最大個数は生成される。
ネーム記述子領域は物理区画単位では含まれない。
第7図は論理ボリュームのレイアウトを示す。
ここでブロック番号は10進数である。図示の論理区画
の大きさは64キロ・バイト(128(liの論理ブロ
ック)である。
好ましい実施例では、/ d e v / l u m
と名付けられたファイルによってこの発明の手法が実理
される。このファイルは論理ボリューム・マネジャであ
る。
論理ボリューム・マネジャ(LVM)は論理ボリューム
、物理ボリュームおよびボリューム・グループを生成し
、修正し、検索することを可能とする。LVMは動的に
より多くの空間が必要になると、自動的に特定の最大サ
イズまで拡大していく、論理ボリュームは同一ボリュー
ム・グループの物理グループにわたって広がることがで
き、高信頼性、高可用性、高効率性を向上させるべく鏡
映化することができる。論理ボリューム、ボリューム・
グループおよび物理ボリュームはすべて■Dを有し、こ
れによりシステム上の同−型のデバイスと固有に識別す
ることができる。
LVMはl0CTLシステム・コールへのコールにより
実行される多くのオペレーションを含む。
この発明に関連して最も重要な2つのl0CTLオペレ
ーシヨンはクリエート・ロジカル・ボリューム(CRE
ATLV)とインストール・フィジカル・ボリューム(
INSTALLPV)とである、標準的なl0CTLデ
ータ構造(図示しない)は種々のオペレーションで用い
られる情報をストアするために採用されている。
CREAELVは特定されたボリューム・グループにお
いて1の論理ボリュームを生成する、CREA置Vの構
造は論理ボリュームを生成するのに必要な情報を含んで
いる。この情報はっぎのとおりである。
LVNAMEフィールドは255以下のバイトの空終了
ストリングをポイントしなければならない。
VG  IDフィールドは当該論理グループを含むボリ
ューム・グループを特定する。
LVTYPEフィールドは論理ボリュームの型たとえば
エイジング・スペース、ファイル・システム等を特定す
る。
INITSIZEフィールドは論理ボリュームの初期の
大きさを論理区画の個数で特定する。
MAXS I ZEフィールドは論理ボリュームの最大
サイズを論理区画の個数で特定する(0から4096で
ある。ここでOは最大数無制限である)。
PV  IDフィールドは論理ボリューム用に区画を割
り振り開始する物理ボリュームを特定する。
NUM P V Sフィールドは論理ボリュームの各コ
ピーが制限される物理ボリュームの個数を特定する。無
制限であればゼロである。
MIRRORフィールドは当該論理ボリュームが鏡映さ
れるべきかを示し、また鏡映の数を示す。
NPARTN  5ELECTフイールドは当該論理ボ
リュームに対しつぎの物理区画を選択するときに用いら
れるアルゴリズム番号を示す。MTRROR5ELEC
Tフイールドは論理区画に対して鏡映を選択するときに
用いるアルゴリズム番号を示す。
MIPV  IDおよびM2PV  IDフィー/L/
ドはそれぞれ主鏡映および副鏡映に対する区画を割り振
り開始する物理ボリュームを示す、鏡映なしと特定され
れば、これらフィールドは空になる。
論理ボリューム・マネジャは論理ボリュームに対して固
有のIDを生成しCREA置Vバッファ中のLV  I
Dフィールドに戻す。
第8図はボリューム・グループを生成する際のステップ
を示すフローチャートである。この図は図自体で充分説
明されており、詳細説明は不必要である。
インストール物理ボリューム(INSTALLPV)シ
ステム・コールは特定ボリューム・グループ中に物理ボ
リュームを導入するよう機能する。
システム・アトミニストレータによって送出されたAI
Xコマンドはアトミニストレータからの要求パラメータ
でlN5TALLPV  l0CTLを要求する。特定
ボリューム・グループが存在しないなら、供与された情
報でボリューム・グループが生成される。マウント可能
な物理ボリュームの各々はそれ自体1ボリユーム・グル
ープ中になければならない。
lN5TALLPV構造は物理ボリュームを特定ボリュ
ーム・グループ中に導入するのに必要な情報を含み、ボ
リューム・グループがないなら、それを生成する。特定
ボリューム・グループが存在するなら、PPS I Z
E、VGNAMEおよびMAXIVSフィールドは無視
されることになる。
ボリューム・グループが存在しないなら、論理ボリュー
ム・マネジャがボリューム・グループ用の固有のIDを
生成し、このIDをlN5TAf、LPvバッファのV
G  IDフィールドに戻す。
NAMEフィールドは255バイト以下の空終了ストリ
ングをポイントしければならない。
MAXLVSフィールドは当該ボリューム・グループ中
の論理ボリュームの最大個数を特定する。
ゼロが特定されれば、ボリューム・グループごとの論理
ボリュームの省略時最大個数、128が採用されること
になる。
PPS I ZEフィールドは当該ボリューム・グルー
プ中のすべての論理ボリューム用の物理区画の大きさ(
バイト表示)を示す。
MOUNTABLEフィールドは物理ボリュームがマウ
ント可能(1)か不可能(0)かを示す。
論理ボリューム・マネジャは物理ボリューム用の固有の
IDを生成してlN5TALLPVバツフアのPV  
IDフィールドに戻す。
第9図は物理ボリュームを導入する際のステップのフロ
ーチャートである。この図自体で充分説明がなされてい
るので、詳細な説明は行わない。
他の特定対のファイル(dev/hclnおよびdev
/pdn)は論理ボリューム・デバイス・ドライバおよ
び物理ボリューム・デバイス・ドライバを支援する。
論理ボリューム・デバイス・ドライバおよび物理ボリュ
ーム・デバイス・ドライバは物理ポリュ−ムおよび物理
ボリュームへのブロックおよび文字(行)アクセスを実
現する。C0NFIGデバイス・ドライバは小デバイス
番号を論理ボリュームに関連付ける。通常、特別ファイ
ル/dev/hdnおよび/ d e v / r h
 d nには小デバイス番号nが付与される。小デバイ
ス番号Oの論理ボリュームは常にシステム・プログラム
を初期ロードするのに用いる論理ボリュームである。
行I10を実行する際には、読み出しまた。書き込みさ
れるバイトの数は512バイト(論理ブロック)の複数
倍である。同様にLSEEKシステム・コールは512
の倍数のバイトを特定する。
所与のDASD上のすべてのオペレーションはそのDA
SD (を含むボリューム・グループ)用の駆動サイト
で実行される。クラスタ構成では、各サイトがボリュー
ム・グループを駆動サイトヘマッピングするテーブルを
保持する。このテーブルはIPL時に初期化され、カー
ネル・コモン・フリンジ(KCK)の一部となる。1つ
のクラスタ中に最高で255個の駆動サイトと255個
のボリューム・グループが実現可能であるがら、高々2
56バイトの(固定)ストレージに表わすことができる
論理アドレスを物理アドレスに、また物理アドレスをデ
バイス・アドレスにマツピングするのに用いる手法をつ
ぎに説明する。
常にではないけれど典型的にはDASDへのアクセスは
論理アドレスすなわちボリューム・グループ、論理ボリ
ューム、論理ブロックにより行われる。物理アドレスす
なわちボリューム・グループ、物理ボリューム、物理ブ
ロックにより行われるのではない。
論理アドレス・アクセス要求を処理するデバイス・ドラ
イバはその要求に含まれる論理アドレスを物理アドレス
にマツピングしたのちその要求を処理する必要がある。
論理ブロックは1から3個の物理ブロックをマツピング
する。これは(1)論理ブロックの主コピー、(2)論
理ブロックの副コピー(もしあれば)、(3)論理ブロ
ックの第3コピー(もしあれば)に応じたものである。
鏡映は論理アドレスを物理アドレスにマツピングする際
に行う。
第10図は所定の論理アドレスを対応する物理アドレス
に効率良くマツピングするのに用いることができるデー
タ構造を説明している。小さなボックス50はボリュー
ム・グループ中の各論理ボリュームごとに1つエントリ
51を有するアレイを表わしている。このアレイ中のエ
ントリは2つのフィールドすなわち(1)表示されてい
る論理ボリュームに割り振られた論理区間の個数L’ 
P N(もしあれば)、(2)論理区画アレイ53への
ポインタLPS52を含む。
大きなボックス53はボリューム・グループ中の各論理
区画ごとに1つエントリ54を有するアレイを表わす、
このアレイ中の有効なエントリは6個のフィールドを含
み、これらフィールドは論理区画中のコピーを含む物理
区画を記述するのに用いる。これらはつぎのとおりであ
る。
1、PVO:主コピーを含む物理ボリューム2、PVl
:副コピーを含む物理ボリューム3、PV3:第3コピ
ーを含む物理ボリューム4、PPO:主コピーを含む物
理区画 5、PPI:副コピーを含む物理区画 6、PP2:第3コピーを含む物理区画物理ボリューム
を特定するフィールドの1つが番号255を含んでいる
なら、論理区画の対応するコピー用に物理区画が割り振
られていない。
論理アドレスを物理アドレスにマツピングするために、
駆動サイトで起動している論理ボリューム・デバイス・
ドライバは(1)論理ボリューム番号により論理ボリュ
ーム・マツプへとインデクシングを行い、(2)論理ボ
リューム内に含まれる第1の論理区画に対応する論理区
画マツプ中のエントリを発見し、(3)論理区画の正し
いコピーに対応する物理ボリュームおよび物理区画を参
照する。
第10図に示されるデータ構造は付加的な論理ボリュー
ムを割り振り、また付加的な論理区画を論理ボリューム
を割り振るための空間を含んでいる。たとえば論理区画
アレイ中のエントリ2が未使用であり、第3論理区画を
論理ボリュームOに割り振るのに用いることができる。
物理要求を処理するデバイス・ドライバはその要求内の
物理アドレスをデバイス・アドレスにまッピングしたの
ちに要求処理を行わなければならない。物理アドレスと
それに関連するデバイス・アドレスとの間にはアーキテ
クチャ上の関連はない。欠陥ブロックの再割り振りが、
物理アドレスからデバイス・アドレスへのマツピング時
に行われる。多くのディスクがそれ自体で所定量の欠陥
ブロック再割り振りを実行することに留意されたい。
物理アドレスをデバイス・アドレスヘマッピングするの
に用いることができる手法についてつぎに説明する6 第11図は欠陥ブロック再割り振りを容易に行えるよう
にするデバイス・レイアウトおよび物理アドレスからデ
バイス・アドレスへのマツピングを示している。この図
において、物理区画および論理区画は128ブロツク長
とする。各物理ブロックには予備として1ブロツクが割
り振られている。必要であれば予備ブロックを用いて再
割り振りされるブロックの内容を保持することができ、
このことから予備ブロックは再割り振りブロックと呼ば
れる。所定の物理区画中の欠陥ブロックはその物理区画
の直後に位置する予備ブロックに再割り振りする必要は
ない。しかし欠陥ブロックを近傍に割り振るのが好まし
い。
第11図に示す物理ブロックの配列によれば1の物理区
画内の物理ブロックへのランダム・アクセスおよび順次
アクセスの双方を効率良く行うことができ、また欠陥ブ
ロックの再割り振りを効率良く行うことができる。この
例では欠陥ブロック再割り振り用に割り当てられる空間
の量はデバイスの128分の1であり、すなわち1%以
下である。
デバイスの特性によってはより多くの、あるいはより少
ない空間が欠陥ブロック再割り振りを実現するために割
り当てられる。
第12図は欠陥ブロックを効率良く再割り振りするのに
用いることが可能なデータ構造を示している。小さなボ
ックス60はハツシュ・アンカ・テーブルを示し、この
テーブルは所定の1の物理ボリューム内の欠陥ブロック
用のものである。このアレイ中のエントリ61は空(対
応するハツシュ連鎖が空白であることを示す)であるか
、または非空(対応するハツシュ連鎖が空白でないこと
を示す)である。エントリが非空であれば、エントリは
欠陥ブロック・テーブル62をポイントする。
アレイ62は1の物理ボリューム中の各欠陥ブロックご
とにエントリ有する。このアレイ中の有効エントリは4
つのフィールドを含み、これらは欠陥ブロックを記述す
るのに用いられる。これらはつぎのとおりである。
1、v:欠陥ブロックを含む物理ボリューム番号2.0
LDBLOCK:欠陥ブロックの物理ブロック・アドレ
ス 3.0OFF:再割り振りブロックを位置決めするのに
用いるオフセット 4、NEXT:ハツシュ連鎖にかかるつぎのエレメント
(もしあれば)へのポイン タ 物理アドレスをデバイス・アドレスヘマッピングするた
めに、駆動サイトで起動している物理ボリューム・デバ
イス・ドライバは(1)物理区画の初めを位置決めし、
(2)その物理区画内の物理ブロック・アドレスを位置
決めし、(3)物理ブロック・アドレスのハツシュを実
行し、(4)物理ボリューム番号および物理ブロック・
アドレスを発見すべく欠陥ブロック・ハツシュ連鎖をサ
ーチする。もし発見されれば、物理ブロックに欠陥があ
り、再割り振りしなければならない、そうでなければ物
理ブロックに欠陥はなく、再割り振りすべきでない、物
理ブロックを再割り振りしなければならないならば、そ
の物理ブロック・アドレスに含まれるエントリ中で見出
されるオフセットをその物理ブロック・アドレスに足し
合わせる。
足し合わせた結果は新しいデバイス・アドレスであり、
これは再割り振りされた物理ブロックの内容を含むこと
になる。
第12図に示すデータ構造は付加的な欠陥ブロックをマ
ツピングするための空間を含む。たとえば“bb6”お
よび“bb7”で表示されるエントリは現在本使用であ
る。
【図面の簡単な説明】
第1図はこの発明が適用されるのに好適なデータ処理シ
ステムを示すブロック図、第2図は第1図のシステムで
記憶されるべき情報を含むファイルの階層的統合化を示
す図、第3図は第1図のディスク・ファイル記憶デバイ
スの構成を示す図、第4図はディスク・ファイルの実ア
ドレス・アーキテクチャ採用されるユニット間の物理的
関係を示す図、第5図は物理ボリュームの非保留領域の
一船釣しイアウドを示す図、第6図は物理ボリューム記
述子のデータを示す図、第6a図〜第61図は第6図の
データ構造の細部を示す図、第7図は論理ボリュームの
レイアウトを示す図、第8図はファイル・システムの初
期導入時のステップを示すフローチャート、第9図はフ
ァイル・システムの動的変化を示すフローチャート、第
10図は論理アドレスを物理アドレスにマツピングする
手法を説明する図、第11図は区画のレイアウトおよび
再割り振り欠陥ブロックを説明する図、第12図は欠陥
ブロックの存在下で物理アドレスをデバイス・アドレス
にマツピングする手法を説明する図である。 出願人  インターナショナル・ビジネス・マシーンズ
・コーポレーション 復代理人  弁理士  澤  1) 俊  失策1図 第2図 第4図 C’ () () () C) () g ()呂88
 g目目?=−一〜〜 しvDH=論″g1ポ・J%−t−Q遂↓・−タ”  
     第60図LVME=allい忙すューム・マ
ツプ・ニジトリ0      78     ’l’=
+1e+      i’l14jl0々のし0 00 o o F

Claims (1)

  1. 【特許請求の範囲】 ブロック・アドレス可能な記憶ロケーションを有する記
    憶装置を具備するデータ処理システムにおいて関連のあ
    る情報ファイルの統合化グループを記憶する方法におい
    て、 (A)複数のアドレスおよび識別可能な物理区画であっ
    て、各々が予め定められた個数の上記ブロック・アドレ
    ス可能な記憶ロケーションを含むものを確立するステッ
    プと、 (B)関連する統合化ファイル・グループごとにそのグ
    ループ内の個々のファイルの大きさに応じて上記予め定
    められた数を選択するステップと、 (C)上記関連する統合化ファイル・グループごとにそ
    のグループを記憶するのに必要な物理区画の最少数を割
    り当てるステップと、 (C)上記関連する統合化ファイル・グループごとに対
    応する最少数の物理区画に記憶するステップとを有する
    ことを特徴とする統合化ファイル・グループ記憶方法。
JP63301095A 1987-11-30 1988-11-30 統合化ファイル・グループ記憶方法 Granted JPH01250150A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12681487A 1987-11-30 1987-11-30
US126814 1993-09-24

Publications (2)

Publication Number Publication Date
JPH01250150A true JPH01250150A (ja) 1989-10-05
JPH0534701B2 JPH0534701B2 (ja) 1993-05-24

Family

ID=22426833

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63301095A Granted JPH01250150A (ja) 1987-11-30 1988-11-30 統合化ファイル・グループ記憶方法

Country Status (4)

Country Link
EP (1) EP0319147B1 (ja)
JP (1) JPH01250150A (ja)
BR (1) BR8806268A (ja)
DE (1) DE3855250T2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6430653B1 (en) 1998-05-01 2002-08-06 Nec Corporation Disk control unit and method for prefetching according to partition information and concatenation information
US7627731B2 (en) * 2006-12-13 2009-12-01 Hitachi, Ltd. Storage apparatus and data management method using the same

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5193184A (en) * 1990-06-18 1993-03-09 Storage Technology Corporation Deleted data file space release system for a dynamically mapped virtual data storage subsystem
JPH04364549A (ja) * 1991-06-12 1992-12-16 Hitachi Ltd ファイル格納方式とアクセス方式
JP2710550B2 (ja) * 1993-05-27 1998-02-10 インターナショナル・ビジネス・マシーンズ・コーポレイション データ記憶分散装置および方法
US6002866A (en) * 1995-09-01 1999-12-14 Sun Microsystems, Inc. Partitioning within a partition in a disk file storage system
US6567811B1 (en) * 1999-07-15 2003-05-20 International Business Machines Corporation Method and system to merge volume groups on a UNIX-based computer system
KR20010098429A (ko) * 2000-04-27 2001-11-08 포만 제프리 엘 다층 논리 볼륨 생성 및 관리를 위한 시스템 및 방법
DE60107532T2 (de) * 2001-02-26 2005-12-15 Yu-Te Wu Speicherverwaltungsverfahren zur Konfiguration eines Computer-speichermediums mit einer virtuellen Platteneinheit
DE102005058967A1 (de) * 2005-12-09 2007-06-14 Siemens Ag Dateisystem auf Basis von RFID-Tags und zugehörige Zugriffsverfahren

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4467421A (en) * 1979-10-18 1984-08-21 Storage Technology Corporation Virtual storage system and method
EP0072107B1 (en) * 1981-08-03 1989-05-31 International Business Machines Corporation Peripheral sub-systems accommodating guest operating systems

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6430653B1 (en) 1998-05-01 2002-08-06 Nec Corporation Disk control unit and method for prefetching according to partition information and concatenation information
US7627731B2 (en) * 2006-12-13 2009-12-01 Hitachi, Ltd. Storage apparatus and data management method using the same

Also Published As

Publication number Publication date
DE3855250D1 (de) 1996-06-05
DE3855250T2 (de) 1996-11-21
BR8806268A (pt) 1989-08-15
EP0319147B1 (en) 1996-05-01
JPH0534701B2 (ja) 1993-05-24
EP0319147A3 (en) 1991-12-18
EP0319147A2 (en) 1989-06-07

Similar Documents

Publication Publication Date Title
US5129088A (en) Data processing method to create virtual disks from non-contiguous groups of logically contiguous addressable blocks of direct access storage device
US5897661A (en) Logical volume manager and method having enhanced update capability with dynamic allocation of storage and minimal storage of metadata information
US6839827B1 (en) Method, system, program, and data structures for mapping logical blocks to physical blocks
US5715455A (en) Apparatus and method for storing file allocation table efficiently in memory
US10268408B2 (en) Flexible efficient runtime placement of data across multiple disks
US4536837A (en) Improved disk file allocation and mapping system utilizing cylinder control blocks and file map having unbalanced tree structure
US20180341421A1 (en) Storage system having a thin provisioning function
US5956745A (en) System and method for automatically resizing a disk drive volume
US5619690A (en) Computer system including a computer which requests an access to a logical address in a secondary storage system with specification of a local address in the secondary storage system
US6999913B2 (en) Emulated read-write disk drive using a protected medium
US6591356B2 (en) Cluster buster
US9274723B2 (en) Storage apparatus and its control method
US6567887B2 (en) Buffering of partition tables, file system directory structures and individual file cluster chains in a mass storage device
US20040230766A1 (en) Thin-provisioning with snapshot technology
US20240094936A1 (en) Storage system, memory management method, and management node
JPH05216593A (ja) 間接アクセス記憶装置
JP2000132343A (ja) 記憶装置システム
JPH09114710A (ja) ディスクファイル記憶装置における区画内部の区分化方法及び装置
EP0974095B1 (en) Dasd file system copy system for a data processor using a data storage subsystem snapshot copy capability
US6629203B1 (en) Alternating shadow directories in pairs of storage spaces for data storage
JPH01250150A (ja) 統合化ファイル・グループ記憶方法
JP2002073393A (ja) 複数層論理ボリューム管理システムのシステムおよび方法
KR100637983B1 (ko) 컴퓨터시스템 및 컴퓨터판독가능매체의 제조방법
JP3796391B2 (ja) 多用途な間接指定又は複数ボリュームを有するエクステント・ベース・ファイルシステム
JP3687111B2 (ja) 記憶装置システムおよび記憶装置の制御方法