JPH07168675A - データ記憶システム及びその動作方法 - Google Patents

データ記憶システム及びその動作方法

Info

Publication number
JPH07168675A
JPH07168675A JP5242228A JP24222893A JPH07168675A JP H07168675 A JPH07168675 A JP H07168675A JP 5242228 A JP5242228 A JP 5242228A JP 24222893 A JP24222893 A JP 24222893A JP H07168675 A JPH07168675 A JP H07168675A
Authority
JP
Japan
Prior art keywords
block
dasd
array
variable length
track
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5242228A
Other languages
English (en)
Other versions
JP2501007B2 (ja
Inventor
John S Best
ジョン・スチュアート・ベスト
Steven R Hetzler
スティブン・ロバート・ヘッツラー
Roger F Hoyt
ロジャー・フランクリン・ホイト
Jaishankar M Menon
ジャイシャンカー・モーゼダス・メノン
Michael F Mitoma
ミカエル・フランシス・ミトマ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH07168675A publication Critical patent/JPH07168675A/ja
Application granted granted Critical
Publication of JP2501007B2 publication Critical patent/JP2501007B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1008Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/064Management of blocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0661Format or protocol conversion arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F2003/0697Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers device management, e.g. handlers, drivers, I/O schedulers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • G11B20/1217Formatting, e.g. arrangement of data block or words on the record carriers on discs
    • G11B20/1258Formatting, e.g. arrangement of data block or words on the record carriers on discs where blocks are arranged within multiple radial zones, e.g. Zone Bit Recording or Constant Density Recording discs, MCAV discs, MCLV discs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

(57)【要約】 (修正有) 【目的】 固定ブロック(FBA) フォーマットの直接アク
セス記憶装置(DASD)の同期アレイを、可変長(CKD) フォ
ーマットのレコードを記憶し更新する。 【構成】 異なる読取、書込ヘッド配列に適合するマイ
クロジョギング(μJ)又は内側のトラックよりも外側
の方が高いブロック・カウントのバンド式ディスク構成
を必要とする読取、書込ヘッド技術を用いてより高い記
録密度を得るDASDでの使用に適する。磁気抵抗性ヘッド
は物理トラック位置読取後の記録用書込みヘッドを再整
列するμJを必要とし、本発明は位相シリンダ、トーラ
スのような所定の循環方法で配列の連続的なブロックの
斜方向記号シーケンスを含む論理トラックを有するDASD
スタガー・アレイ構成を用いる。そのなかのDASDの最小
限必要数は固定ブロック・サイズ (B)、ブロック間ギャ
ップ・サイズ (G)、平均DASDデータ転送速度(D) 及びμ
J遅延時間(T) で制限される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はカウント・キー・データ
(CKD) レコードの直接アクセス記憶装置(DASD)に関し、
より詳しくは、バンドを用いるDASDアレイ上の固定ブロ
ック・アーキテクチャ(FBA) レコードならびに別個の読
取りヘッド及び書込みヘッドを用いるCKD DASDシステム
に関する。
【0002】
【従来の技術】固定ブロック・アーキテクチャ(FBA) は
ディスク・ファイルをフォーマティングするために用い
られる共通の構成である。FBA フォーマットディスク・
ファイルでは、各同心ディスク・トラックは複数の同サ
イズのセクタに分割され各セクタは各々がサーボ情報、
識別情報(ID)及びデータを有する固定長ブロックを含
む。Hetzler 及びBestによる米国特許出願第07/727680
号 (1991年7月10日出願)明細書に開示されているNO-ID
手法の使用によりFBA フォーマットの装置からIDフィ
ールドを除去することが可能である。
【0003】IBM 社のカウント・キー・データ(CKD) ア
ーキテクチャは技術的に周知の可変長レコード構成であ
る。ハイエンドのIBM システムはMVS オペレーティング
システムによるCKD フォーマットを用いる。各CKD レコ
ードは固定長カウント・フィールド、任意選択のキー・
フィールド及び可変長データ・フィールドを含む。固定
長カウント・フィールドは可変長データ・フィールドの
長さを決め任意選択のキー・フィールドはCKD レコード
を識別するように作用する。これらのフィールドの各々
は直接アクセス記憶装置(DASD)トラックに沿って配置さ
れ所定の固定サイズのギャップにより分離される。この
ギャップが一定の速度で読取り又は書込みヘッドの下を
回転することにより、システムが次のフィールドを処理
する用意をする時間間隔が決まる。
【0004】データ記憶技術関連分野では、DASD記憶密
度及びアクセス効率を増す多数の手法を提案されてい
る。DASD記憶容量が増すにつれて、信頼性はデータ記憶
技術で考慮すべき重要な問題であり続ける。更に、トラ
ック間隔が減少すると、読取り及び書込みヘッド位置決
めの公差がかなり厳しくなる。
【0005】より新しい大容量DASDでは、トラック幅が
狭く磁気抵抗ヘッドが使用されることがある。整列不良
及びヘッドの斜行から起きる磁気抵抗読取り及び書込み
ヘッドの中心線間の相対的オフセットのために、読取り
動作から書込み動作に切替えるとき共有ヘッド・アクチ
ュエータをマイクロジョギングするための準備が行なわ
れる。このアクチュエータ・マイクロジョギングは、目
的セクタを見つけたのち読取りから書込みに切替えると
き中心線のオフセットを補償するヘッド再整列を可能に
する。
【0006】マイクロジョギング動作は、 "読取り" 動
作から "書込み" 動作に又はその逆に切替えるとき行な
われるアクチュエータ・アセンブリの半径方向位置に対
するトラック微調整として理解できる。読取りのとき、
アクチュエータ・アセンブリは、回転ディスク面に記録
されたデータ・トラックの中心と精密に位置合わせされ
るように調整される。書込みのとき、アクチュエータ・
アセンブリは、書込みヘッド中心線をトラックと位置合
わせする方向に僅かに移動される。シングル・ヘッドが
用いられる場合、読取り動作と書込み動作の間の "実
効" ヘッド中心線の変動のためにマイクロジョギングを
必要とすることがある。マイクロジョギングの精密な量
はヘッド特性、サーボ・トラック特性及びその他の物理
的な要素による。マイクロジョギングは通常はDASD制御
装置からのコマンドによって行なわれる。
【0007】CKD システムでは、DASDは最初にカウント
・フィールド (読取り) を見つけたのち次のデータ・フ
ィールドを更新する (書込む) 必要がある。より新しい
磁気抵抗ヘッドを有する高密度装置では、カウント・フ
ィールドが読取られた後及びデータ・フィールドが書込
まれる前に、ヘッド・アクチュエータをマイクロジョギ
ングする必要がある。典型的なDASDでは、カウント・フ
ィールドの終りと次のデータ・フィールドの始まりの間
におよそ70ミリ秒のギャップがある。たぶん、前記マイ
クロジョギングを実行するために300 ミリ秒〜500 ミリ
秒が必要とされ、これはフィールド間ギャップの遅延よ
りも数倍長い。従って、前記装置では、フィールド間ギ
ャップの遅延を数倍に増すか又はディスク回転を遅らせ
て所要のマイクロジョギング時間遅延を与える。前者の
オプションはディスク容量をかなり無駄にし後者はディ
スク・アクセス時間及び転送速度をかなり無駄にする。
【0008】より新しいDASDは、より大きい半径に配列
されたトラックの線形容量の増大を利用するために "バ
ンド" 方式でフォーマティングすることもできる。すな
わち、ディスク面は複数の同心 "バンド" に分割され、
各バンドはシングル物理トラック容量のフォーマットに
入れられた複数のトラックを有する。所与の線形トラッ
ク・データ密度に関して、内側のバンドにおけるトラッ
ク容量は外側のバンドにおけるトラック容量よりも少な
い。従って、シングル・ディスクのなかのトラック容量
は、線形トラック密度を変えずに、数百%変わることが
あり得る。バンド式装置は、特別なオペレーティングシ
ステムの変更が与えられない限り、固定トラック容量を
必要とするデータフォーマットで用いることができな
い。
【0009】R.A. Azizは ("Data Storage", IBM Techn
ical Disclosure Bulletin, Vol. 20,No.7, December 1
977, pp. 2581-2583で) DASD内の記憶ディスク記録容量
を増すバンド式螺旋トラックフォーマットを提案してい
る。Azizは、更新されたとき完全に再書込みされる各同
心バンド内のシングル螺旋セグメントを使用するが全体
又は一部で反復して読取りできることを開示している。
Azizは、この螺旋手法は従来の技術で知られている非バ
ンド式同心トラック手法と較べて各ディスクのデータ記
憶容量を倍増すると主張している。しかしながら、Aziz
の螺旋トラックは編集のためには実際的ではなく、更新
されたとき完全に重ね書きする必要がある。
【0010】データ記憶技術における従来からの信頼性
の問題に対して幾つかの有効な解法が提案されている。
DASD記憶容量が増大するにつれて、シングルDASD故障の
全システムに及ぼす影響も増大する。一般に、オンライ
ン・バックアップ・データ記憶装置が設けられない限
り、DASD故障は全システムを停止させる。この問題の1
つの解法は、David A. Patterson外により "A Case for
Redundant Arrays of Inexpensive Disks (RAID)", AC
M SIGMOD Conference, June 1988, pp. 109-116に記載
された、冗長アレイの低価格ディスク(RAID)アーキテク
チャとして技術的に知られている。
【0011】データ記憶技術は、FBA フォーマットDASD
を用いると同時に可変長 (例えば、CKD フォーマット)
をエミュレートする手法を十分にもっている。FBA DASD
は前述の米国特許出願第07/727680 号明細書に開示され
た"NO-ID" 手法よりも効率的に作られる。一般に、FBA
ディスクをホスト・オペレーティングシステムに対する
CKD ディスクとして演じさせるために、DASD制御装置で
CKD エミュレーションが実行される。パリティを有する
RAID記憶システムの導入は、FBA フォーマットDASDアレ
イで用いるCKD エミュレーション方法を明確に必要とし
ている。
【0012】米国特許第5072378 号では、Paul S. Mank
a は可変長CKD レコードのフォールトトレラント記憶装
置に適する独立して記憶されたパリティを有するDASD R
AIDシステムを開示している。Manka は、1つのDASDが
故障するか又は使用できなくなる場合、残りのレコード
・セグメントをパリティ・ブロックと組合わせることに
より、影響を受けたレコード・セグメントを再構築でき
るようパリティ・ブロックを記憶する別個のDASDの使用
を提案している。Manka のシステムは、物理トラック位
置にある論理セクタをインターリーブする仮想トラック
・イメージング手法を用いることにより、オペレーティ
ングシステムの変更なしに記憶効率を高め可変長データ
・レコードを提供する。
【0013】Menon は、米国特許出願第07/679455号(19
91年4月2日出願) 明細書でFBA フォーマットDASDの同
期アレイに記憶された可変長レコードをアクセスするシ
ステムを開示している。Menon は、可変長CKD レコード
の各々を等しい固定長FBA ブロックに分割し前記ブロッ
クをDASDアレイに列記号順に同期書込みするシステムを
提案している。Menon の列記号順は、各CKD レコード
(カウント・フィールド) の最初のブロックが(N+2) DAS
Dアレイの(N+1) 番目のDASDにおいて1カラムだけオフ
セットされて記憶されるように強制される。最後の(N+
2) 番目のDASDは、技術的に既知のものと類似の方法で
フォールトトレランスを与えるパリティ・ブロックを記
録するために予約される。しかしながら、読取り動作か
ら書込み動作に又はその逆に切替えるときにヘッド・ア
クチュエータをマイクロジョギングする必要がある状況
では、Menon のシステムはディスク回転を維持できなく
なる。すなわち、読取り配列から書込み配列に切替える
のに必要な遅延により、Menonのシステムは最初のディ
スク回転中に目標フィールドをミスし、次の回転中に目
標ブロックが書込みヘッドの下を再び通過するまで待つ
必要がある。Menon は技術的に既知のバンド式ディスク
フォーマットにより導入された可変トラック容量に適応
する手段についての提案も示唆もしていない。
【0014】前述のHetzler 及びBestによる特許出願は
マイクロジョギング問題に対する部分的な解法を提案し
ている。ブロック見出しには別々のID領域が組込まれな
いので、読取り書込み回復ギャップがFBA フォーマット
ディスクのブロック間読取り書込み遷移と一緒に除去さ
れる。初期の固定ブロック・アーキテクチャにより、デ
ータ・フィールドの書込みはIDフィールドの前読取りを
必要とする。IDフィールドとデータ・フィールドの間の
マイクロジョギングを完了できないので、ブロック間マ
イクロジョギング中にディスク回転が維持できなくなる
に違いない。前述のHetzler 及びBestによる特許出願で
開示されたNO-ID フォーマットはこのブロック間読取り
書込み遷移を除去する。しかしながら、前述のように、
Hetzler及びBestはFBA フォーマットのみを論議し、技
術的に既知のCKD フォーマットのような可変長レコード
について考慮も示唆もしていない。
【0015】L. Levy は、"Skewed Format Method For
Personal Computer Hard Disks ToReduce Rotational L
atency Delays", IBM Technical Disclosure Bulletin,
Vol. 29, No. 4, September 1986, pp. 1867-8で、例
えばトラック間シーク動作又はマイクロジョギング動作
により導入された回転待ち時間遅延 (失われた回転)を
減らすスキュー・セクタフォーマットを提案している。
Levyは隣接する同心トラック上のセクタを所定の角度だ
けオフセットすることを示唆している。Levyの意図は、
トラック間に受動回転待ち時間を導入してシリンダ間ス
テッピング時間を許容することにある。しかしながら、
Levyは、各論理レコードが多くのDASDに広がる場合に同
期ディスク・アレイを必要とするRAIDシステムに回転待
ち時間を導入する有効な手法について開示も提案もして
いない。
【0016】異なる読取り及び書込みヘッド配列を有す
るFBA フォーマットのバンド式DASDのアレイの有効なCK
D エミュレーション手法は技術的に知られていない。関
連した未解決の問題及び欠点は技術的に明確であり、本
発明で下記のように解決される。
【0017】
【発明が解決しようとする課題】本発明の第1の目的
は、DASDアレイを横切る斜方向記号パターンに沿った連
続的なブロック数を読取ることにより任意のCKD レコー
ドを順次に読取りできるように論理トラックに沿って可
変長CKD レコードを構成することにある。一度にアレイ
内の1つのDASDだけがデータを転送していることが本発
明の特徴である。
【0018】本発明の第2の目的は、更新されたCKD レ
コードを書込む前に目標CKD レコードの物理位置を読取
った後にマイクロジョギングする時間を許容するのに十
分なFBA ブロック数だけ可変長CKD レコードのなかのフ
ィールドを分離することにある。読取り(発見)動作と
書込み(更新)動作の間のディスク回転を失わずに十分
なマイクロジョギング時間を与えることが本発明の利点
である。
【0019】本発明の第3の目的は、物理トラック・サ
イズとは無関係である斜方向記号経路に沿った一定数の
FBA ブロックを含む一定の論理トラック・サイズを提供
することにある。バンド式DASD上の可変(又は固定)の
物理トラック容量とは無関係に論理トラック・サイズが
予め決定されることが本発明の特徴である。
【0020】本発明の第4の目的は、新たに(N+1) 番目
のDASDをパリティのために設けることによりスタガー・
アレイ・フォールトトレランスを提供することにある。
対応する一連の斜方向記号データ・ブロックのパリティ
を含むパリティ・ブロックをディスク回転を失わずに書
込み・更新できることが本発明の利点である。
【0021】単にDASD制御装置マイクロコードを変更す
ることにより、適切に設計されたFBA フォーマットDASD
アレイをFBA フォーマット又はCKD フォーマットのデー
タ記憶装置のどちらにも用いうることが本発明のもう1
つの利点である。
【0022】
【課題を解決するための手段】本発明の方法は、新規の
スタガーDASDアレイ・アーキテクチャの使用によりバン
ドフォーマット又はマイクロジョギング遅延又は両者を
有するDASDのアレイに適応する。スタガー・アレイは、
FBA フォーマットDASDアレイを横切って順序づけられた
連続的なフィールドを含む一連の論理トラックとして所
定の循環パターンで構成される。スタガー・アレイのな
かのDASDの各々は、前述のHetzler 及びBestによる特許
出願で開示されたNO-ID 手法を用いてIDフィールドなし
にFBA 装置としてフォーマティングされる。前記アレイ
で必要な最小のDASD数は、ディスク・ブロック・サイズ
(B)、ブロック間ギャップ・サイズ (G)、ディスク・デ
ータ転送速度(D) 及びマイクロジョギング時間遅延(T)
による。
【0023】
【実施例】
[同期DASDアレイ]図1は周辺同期DASDアレイを有する
典型的なデータ処理・記憶システムを示す。中央処理装
置(CPU)10 は、チャネル14、アレイ制御装置16及びキャ
ッシュ18を含む経路12を介して複数の DASD(1)〜(N+2)
をアクセスする。制御装置16は同期を保証するように動
作し制御経路20を介して DASD(1)〜DASD(N+2) をアクセ
スする。CPU 10からのアクセス・コマンドに応答して、
所定数の連続的なバイトを定義する (N+1)ストリームの
データがデータ経路22を介してキャッシュ18で同時に交
換される。同様に、制御装置16における読取り方向の並
直列変換及び書込み方向の直並列変換に続いてCPU 10と
制御装置16の間で経路14を介してデータをバイト毎に直
列に交換することができる。
【0024】読取り方向では、データ経路24及び26を介
してキャッシュ18から制御装置16にデータが供給され
る。書込み方向では、同じ経路24及び26を介して制御装
置16からキャッシュ18にデータが移される。
【0025】本明細書では、(N+1) DASDのアレイは、物
理記憶システムとして、一部又は全部が同時にアクセス
できる(N+1) DASDの任意の物理的な配列であると定義さ
れる。このような物理記憶としてのアレイの論理的なフ
ォーマティング及びその後の読取り/書込みアクセス
は、最初に行又は列方向の連続的な位置へのデータのコ
ピー又は挿入により行なわれる。このフォーマティング
動作が列方向で実行される場合、本明細書では、それは
"列記号順" と呼ばれる。同様に、行方向で実行される
場合、それは "行記号順" と呼ばれる。前記論理的なフ
ォーマティングの後、論理 "アレイ" は物理DASDアレイ
に写像される。列記号シーケンスの(N+1)ブロックのう
ちN個はデータ・レコードを表わし、(N+1) 番目のブロ
ックはパリティ情報を含む。
【0026】図2は、技術的に周知の可変長CKD レコー
ドフォーマットの特性を示す。CKDフォーマットは前述
のMenon の特許出願に詳述されている。CKD ディスクの
フォーマットは、CKD フォーマットが可変長レコードの
記憶及びデータから分離されているキーの記憶を可能に
する点で、固定ブロック(FBA) ディスクのフォーマット
とは異なる。図2におけるシングルCKD トラックはホー
ム・アドレス(HA)とそれに続くデータ・レコードR0〜Rn
とから成る。各データ・レコードRiは少なくとも1つの
カウント(Ci)フィールド、1つの可変長データ(Di)フィ
ールド及び任意選択の1つのキー(Ki)フィールドを含
む。全てのデータ・レコード及びフィールドは、データ
・ブロック長の時間変化により長さが変化するギャップ
(G) により分離される。各カウント又はHAフィールドは
欠陥ポインタ、セル番号、物理アドレス等のサブフィー
ルドを含む。シリンダ番号、ヘッド番号及びレコード番
号フィールドは一括してCCHHR と呼ばれる。これはレコ
ードの論理IDである。除去しえないCKD レコードはこの
IDフィールドを含まねばならないが、シリンダ及びヘッ
ド番号は物理アドレス・フィールドのものと同じでなく
てもよい。従って、物理トラック上の連続的なレコード
のレコード番号は連続的でなくてもよく一意的でなくて
もよい。
【0027】物理CKD トラック毎に、トラックの物理位
置(トラック・アドレス)及び物理トラックの状態を決
める1つのHAフィールドがある。HAフィールドは工場で
製造中に初期化される。最初のレコード(R0)はしばしば
トラック記述子レコードとして用いられるので、システ
ム・ソフトウェアで物理トラックに関する情報の記憶に
用いてもよい。レコードR1〜Rnはユーザ・レコードであ
る。
【0028】図3は、Menonの米国特許出願第07/666289
号 (1991年3月8日出願) 明細書によるCKD 可変長レコ
ードの行記号、即ちトラック指向レイアウトを示す。本
明細書では、図3の例は単に、従来の技術の同期DASDア
レイで使用できる典型的な可変長CKD データ記憶アーキ
テクチャを示すために含まれている。各物理トラックE
(1)〜E(N) はCKD レコードの可変番号を含み、CKD レコ
ード内の各ブロックはサイズ及び間隔が可変である。物
理トラック毎のトラック見出しブロック(HA,R0) 及び最
初のカウント・ブロック(Ci)を除き、図3の例は列の対
称性がないことを示す。本明細書では、 "同期" DASDア
レイは、 DASD(1)〜DASD(N-1) の範囲内の物理トラック
が全て列記号に基づいて同時にアクセスされる場合のア
レイを呼ぶ。すなわち、所定のシリンダにある1つの列
記号シーケンスの範囲内の全ブロックはデータ経路22
(図1)で同時に入手できる。図3はCKD レコードの列
記号データ記憶装置に役立つアーキテクチャを提供しな
い。
【0029】[CKD ディスク・データ転送動作]CPU 10
(図1)は、チャネル・プログラムを生成しその実行を
要求することにより、CKD ディスク(標識付けせず)か
らのI/O 動作を要求する。チャネル・プログラムはCPU
10内のチャネル(図示せず)及びアレイ制御装置12によ
り共同で実行される。最も簡単な形式は擬似コードで次
のように表示される。
【0030】Define Extent(範囲を定義する) Locate (Seek Address, Sector position, Read/Write,
ID) (シーク・アドレス, セクタ位置, 読取り/書込
み, IDを発見する) Write Data (データを書込む) Define Extent コマンドはチャネル・プログラムの動作
を可能にする物理トラック境界を設定する。Locateコマ
ンドはディスク・アクセス機構を特定のシリンダに移動
することを要求し、次いで該シリンダ上の特定のセクタ
(回転)位置の特定のトラックからディスクを読取り/
書込みする用意をすることを要求する。特定のトラック
上の指定されたセクタに読取り/書込みヘッドを置くこ
とを決定した後、チャネルは、Locateコマンドで指定さ
れたセクタに続く次のトラック上のレコードのIDフィー
ルドとLocateコマンドのID仕様とを比較する。両者が等
しくない場合、次のIDフィールドまで探索が続く。両者
が一致しチャネルが書込む場合、Write コマンドが実行
され、更新されたフィールドが主記憶装置(図示せず)
からディスクに転送される。IDフィールドはCKD ディス
ク(図2)上のカウント・フィールド(Ci)内のCCHHR サ
ブフィールドを指す。
【0031】前記チャネル・プログラムの場合、カウン
ト・フィールド(Ci)が読取られた後に次のデータ・フィ
ールドを書込むことができる。これは、カウント・フィ
ールド読取りと次のデータ・フィールドでの書込みの開
始の間に読取りから書込みへのヘッド配列の遷移(マイ
クロジョギング)を必要とする。マイクロジョギング時
間遅延(T) がカウント・フィールド(Ci)とデータ・フィ
ールド(Di)の間のギャップ(G) を越える場合、データ・
フィールド(Di)書込みは次のパスまで待つ必要があるの
で、全ディスク回転を失う。前述の特許出願でHetzler
及びBestにより開示された新規のNO-ID はFBA ディスク
にのみ使用可能であり、CKD レコードがFBA フォーマッ
トディスクに記憶されない限りこのCKD 問題は改善され
ない。
【0032】[スタガーDASDアレイ]本発明の方法はDA
SDのアレイを用い、その各々が前述のHetzler 及びBest
の特許出願で開示されたNO-ID 手法に従ってIDフィール
ドなしにFBA 装置としてフォーマティングされる。スタ
ガー・アレイのなかのDASDの数Nは、固定ブロック・サ
イズ (B)、ブロック間のギャップのサイズ (G)、ディス
ク・データ転送速度(D) 及びマイクロジョギング遅延時
間(T) による。マイクロジョギングの提供にはアレイ内
に次の式を満足するディスク数Nが要求される。
【0033】
【数1】T ≦ [(B + G)(N - 1) + G]/D この要求について以下に説明する。図4は4つのレコー
ドを有するCKD トラック28(HA及びR0フィールドが省略
されている)の実施例を示す。レコードR1はキー・フィ
ールドを持たないが、8 KBのデータ・フィールドD1を有
する。レコードR2はキー・フィールド及び6 KBのデータ
・フィールドD2を有する。レコードR3は2.8 KBのデータ
・フィールドD3を有する。レコードR4は4 KBのデータ・
フィールドD4を有する。図4は、4つのDASDからシリン
ダ30を構成する物理トラックのセットも示す。これはN=
4 の同期DASDアレイを形成する。4つのディスク・アク
チュエータ(図示せず)は同じシリンダ位置を同時にア
クセスするように同期され、ディスクの回転が同期され
る。4つのディスク毎に8つの固定長(1 KB)ブロックを
有する1つの物理トラックが示されている。32ブロック
が1つのアレイ・シリンダ30を表わす。この実施例で
は、それらは本発明の方法の論理トラックの1つの実施
例も表わし、図4のブロック番号B1〜B32 が論理トラッ
クの斜方向記号ブロック番号と呼ばれる。
【0034】B1〜B32 の斜方向トラックは本発明のスタ
ガー・アレイフォーマットを例示する。連続的なブロッ
ク番号は斜方向記号パターンに従い、DASD 4からDASD 1
に循環する。本明細書では、このタイプのパターンは固
定長ブロックの斜方向記号シーケンスから成る所定のト
ロイド形の横移動と呼ばれる。例えば、DASD 2のブロッ
クB2はDASD 1のブロックB1から1ブロックだけ列位置が
オフセットされる。同様に、DASD 1のブロックB5はDASD
4のブロックB4から1ブロックだけ列位置がオフセット
される。DASD 4からDASD 1への循環で、列位置のオフセ
ットが1ブロックを上回ることがある。例えば、DASD 1
のブロックB9はDASD 4のブロックB8から2ブロックだけ
列位置がオフセットされる。
【0035】図4によれば、トラック毎のブロックの数
がアレイのなかのDASDの数に関して相対的に首位である
とき、連続的なブロックの間の列のオフセットは一様に
1とすることができる。本発明では、一様に1ブロック
のオフセットが望ましいが、同様の有利な結果を得るた
めに本明細書に開示された手法を用いて2ブロック、3
ブロック等の一様の又は非一様の列のオフセットを用い
ることもできる。
【0036】次の手順により論理CKD トラック28をアレ
イ・シリンダ30に記憶することができる。
【0037】(a) ブロックB1に(最初の)フィールドC1
を挿入開始する。それがB1をオーバフローする場合、引
続きそれをブロックB2に挿入する。以下、同様である。
最後に、フィールドC1が完全に記憶されると、残りのブ
ロック(Bi)にある残りの空間を空のままにする。
【0038】(b) 次のCKD フィールドD1を次のブロック
B(i+1)の先頭から記憶開始する。従って、シリンダ30の
なかのブロック境界で全てのCKD フィールドが開始す
る。
【0039】(c) 全てのCKD レコード・フィールドが記
憶されるまでステップa及びbを反復する。
【0040】(d) 前記ステップa〜cで、見つかった全
ての欠陥FBA ブロックをスキップする。
【0041】図4によれば、論理CKD トラック28が前記
方法により記憶される。カウント・フィールドC1はブロ
ックB1に記憶される。そして、カウント・フィールドC1
は1KBよりも小さいので、C1はブロックB2には拡張しな
い。従って、データ・フィールドD1はブロックB2で開始
してブロックB9までの8つの1 KB FBAブロックに拡張す
る。このプロセスはブロックB26 まで進む。ブロックB2
6 はレコードR4からの4 KBデータ・フィールドD4の最後
の部分を含む。
【0042】図4のシリンダ30に記憶されたデータは、
斜方向記号シーケンスに沿って全論理トラックを読取
り、連続的なブロックの読取り中に斜線方向パターンに
単に追随することによりアクセスし検索することができ
る。この配列により、どの時点でもアレイのなかの4つ
のDASDの1つだけがデータを転送している。従って、DA
SDアレイの実効データ速度は任意の1つのDASDのデータ
速度に等しい。この速度は本明細書ではデータ転送速度
(D) と呼ばれる。最後に、図4で、ひとたび任意のDASD
(i) から又はそれにブロックが書込まれたならば、次に
DASD(i)で読取られ又は書込まれるブロックは少なくと
も3つ(N-1=3) の除去されたブロックであり、この実施
例では読取り配列から書込み配列へヘッドをマイクロジ
ョギングするのに十分な時間遅延(マイクロジョギング
遅延T)を供給する。マイクロジョギング遅延Tを有す
る前記チャネル・プログラム実施例の動作について以下
に詳述する。
【0043】[マイクロジョギング遅延を有するチャネ
ル・プログラム実施例]以下に詳述する実施例では、前
述のチャネル・プログラムは図4のレコードR4を更新す
るときマイクロジョギングにより動作する方法を示す。
最初のステップはレコードR4の先頭をマークするカウン
ト・フィールドC4の探索である。チャネル・プログラム
は通常はカウント・フィールドC4の開始に先行するセク
タ番号(図示せず)を指定する。従って、チャネル・プ
ログラムはレコードR3の最後のブロックであるブロック
B21 に写像するセクタ番号を指定できるが、アプリケー
ションによっては、チャネル・プログラムは先行するブ
ロック、例えばB20 又はそれ以前のブロックに写像する
セクタ番号を指定できる。すなわち、チャネル・プログ
ラム・セクタ番号は必ずしも探索されたカウント・フィ
ールドに写像されるとは限らない。
【0044】ひとたびチャネル・プログラムがセクタ番
号を供給すれば、セクタ番号から写像されたブロック又
はそれ以降のブロックにあるカウント・フィールドを含
む次のブロック番号が識別される必要がある。本発明の
方法は、次のカウント・フィールドに写像する順方向ポ
インタを保持するために、(必要に応じて1バイト又は
それ以上の)ポインタ・フィールドを全てのFBA ブロッ
ク内に含む。更に、カウント・フィールドを含むブロッ
クをデータ・フィールド又はキー・フィールドを含むブ
ロックから識別するために、各ブロックに幾つかのビッ
トが予約されている。各ブロック内のこれらの2つの追
加フィールドにより、レコードR4の更新が次のように行
なわれる。
【0045】チャネル・プログラムのなかのセクタ番号
はデータ・フィールドD3の最後のブロックであるブロッ
クB21 であると仮定する。そして、もし必要なら、読取
り配列から書込み配列へのマイクロジョギングを可能に
する十分な割込みブロックを使用できるように実際の探
索をブロックB17 あたりで開始せねばならない。従っ
て、もし必要なら、DASD 1はブロックB17 を読取り、DA
SD 2はブロックB18 を読取り、DASD 3はブロックB19 を
読取り、そしてDASD 4はブロックB20 を読取る。探索さ
れたカウント・フィールドC4に対する順方向ポインタを
ブロックB17 の読取りが発見する場合、手順はブロック
B18〜B20の読取りを無視できる。あるいは、探索された
カウント・フィールドC4の位置をブロックB17 の読取り
が発見しない場合、手順はブロックB18 の読取りを続行
する。それでもカウント・フィールドC4が分からない場
合、手順はブロック B19、B20 等の読取りを続ける。
【0046】図4の実施例で、ブロックB17 の読取り
後、DASD 1は、ブロックB21 に書込みできないので、ブ
ロックB21 を読取るようにそのヘッドを読取り配列位置
に保持する。ブロックB21 はデータ・フィールドD4に先
行するデータ・フィールドか、又は読取らねばならない
カウント・フィールドである。この実施例ではチャネル
・プログラム・セクタ番号(図示せず)からブロックB2
1 が写像するので、これは既知である。また、ブロック
B17 は、次のカウント・フィールドであるブロックB18
に対する順方向ポインタを含む。ブロックB18 は、チャ
ネル・プログラムで指定されたセクタから写像するブロ
ック(B21) に先行するので、カウント・フィールドC4で
はありえない。従って、ブロックB17 の読取り後にカウ
ント・フィールドC4の位置はなお未知であり、DASD 1は
読取りモードに留まる。
【0047】DASD 2がブロックB18 を読取ると、順方向
ポインタはブロックB22 にある次のカウント・フィール
ドを指す。これは手順が探索した情報である。カウント
・フィールドC4を回復するためにブロックB22 を読取る
必要があるので、DASD 2は読取りモードに留まる(マイ
クロジョギングは行なわれない)。しかしながら、ブロ
ック B19、B20 及びB21 は無視できるので、DASD 3、 4
及び 1はそれらの書込みモード・ヘッド配列へのマイク
ロジョギングを即座に開始できる。DASD 2は書込みブロ
ックB26 及び全ての他のDASDがブロックB18 で先行的に
マイクロジョギングされる前に5つのブロック間隔を有
するので、マイクロジョギング遅延(T)により回転が失
われることなく、カウント・フィールドC4の探索及びデ
ータ・フィールドD4の更新を終了することができる。
【0048】下記の表1は書込み目的を有するチャネル
・プログラムの概略アルゴリズムを示す。読取り目的を
有するチャネル・プログラムには特別な要求はない。表
1の手順が利用する書込み配列から読取り配列に切替え
るときのDASDの既知のマイクロジョギング時間遅延は、
読取り配列から書込み配列に切替えるときに経験したマ
イクロジョギング時間遅延よりも少ない。本発明の方法
は、 1.9ブロックと1ギャップの合計時間 (1.9B+G) 内
に書込から読取へのマイクロジョギングを実行すること
を必要とする。この要求は、1つのブロックが読取られ
次のカウント・フィールドが2ブロックしか離れていな
い最悪の場合に起きる。それはどれか2つのカウント・
フィールドの間に少なくとも1つのデータ・フィールド
がなければならないので1ブロックしか離れていないこ
とはありえない。この状況は最初のカウント・フィール
ドを読取ったとき即座に決定できる。FBA ブロック・サ
イズが1 KBである場合、カウント・フィールドはたぶん
僅かに40バイト程度である。従って、カウント・フィー
ルド・ブロックの大部分(たぶん90%)とギャップ(G)
と次のブロック(B) との合計は他のDASD上のヘッドを書
込み配列から読取り配列に再調整するために使用でき
る。これはDASD技術で可能である。減少した書込みから
読取りへのマイクロジョギング時間遅延は最初のカウン
ト・フィールドの探索が成功しないときにも有利であ
る。そのとき手順は次のカウント・フィールドを探索す
る。このカウント・フィールドも僅かに2ブロックしか
離れていないことがあり、(1.9B+G)の間に書込みから読
取りにマイクロジョギングするように先行的にDASDが再
調整されることを必要とする。
【0049】
【表1】(表中に現れる英文字の列はコマンドなどを表
す記号であり、翻訳できない) 1. チャネル・プログラム内のセクタ番号をブロックX
に写像する。アレイ内にN個のディスクを置く。B=X-N
にセットする。全てのディスク・ヘッドを読取りモード
にセットする。
【0050】2. ブロックBを Read; 3. If B≧X 内の順方向ポインタ then do;ポインタにより指定されたカウント・フィール
ドを含むディスクCを決定する Cを除く全てのディスクのマイクロジョギングを開始す
る (R->W) ステップ3をexit end; 4. B=B+1; If B=X then ステップ4を exit; ブロック
BをRead; 5. If B≧X 内の順方向ポインタ then do;ポインタにより指定されたカウント・フィール
ドを含むディスクCを決定する Cを除く全てのディスクのマイクロジョギングを開始す
る (R->W) ディスクCをReadモードにset[それは既に存在するか、
又は割込みを要する(R->W)マイクロジョギングの中央に
あるかも知れない。] ステップ5をexit end;else Bを含むディスクの(R->W)マイクロジョギン
グを開始する; 6. ステップ4にReturn [バンド式DASDを有するスタガー・アレイ動作]CKD ア
ーキテクチャは一定のトラック容量を必要とする。この
仮定によりホスト・ソフトウェアが記述される。例え
ば、ホストにおける割振りソフトウェアは割振りの単位
としてトラックを用いる。複数のデータ・バンドを有す
る装置はバンド毎に異なるトラック容量を有する。バン
ドは、内部トラックと較べて直線的に増大するディスク
の外端のトラックを利用する。図5は、バンド式DASDに
適応するように本発明のスタガー・アレイを用いる方法
を示す。基本的なアプローチはCKD アーキテクチャで期
待されたサイズが一定の論理トラック・イメージをホス
トに提示することである。
【0051】図5に、トラック当り7ブロックを有する
シリンダ32及びトラック当り8ブロックを有する別のシ
リンダ34が実施例として示される。各シリンダは、2つ
のバンドの各々に、4つのDASDの各々からの1つの物理
トラックを含む。この実施例では、20ブロックの論理ト
ラック・サイズが選択される。シリンダ32は、5つの斜
方向記号シーケンスS1〜S5を有する最初の論理トラック
T1及び2つの前記斜方向記号シーケンスS1〜S2を有する
二番目の論理トラックT2の一部、合計28ブロックを含
む。論理トラックT2のなかの残りの3つの斜方向記号シ
ーケンスS3〜S5は、三番目の論理トラックT3のシーケン
スS1〜S5とともにシリンダ34に与えられる。従って、合
計60ブロックの3つの論理トラックT1〜T3が2つのシリ
ンダにわたって分布される。
【0052】トラックT2の二番目のシーケンスS2から、
別のシリンダ上のトラックT2の三番目のシーケンスS3ま
でのDASD 1でのシーク時間はDASD 2、3及び4上のトラッ
クT2の二番目のシーケンスS2で読取るか又は書込むのに
必要な時間と部分的にオーバラップすることがある。即
ち、バンド間のシングル・トラック・シークの実行に用
いうる3(N-1=3) ブロック時間 (3*B)がある。これはマ
イクロジョギングよりもずっと長くかかることはないで
あろう。複数のバンド内の種々のDASDアレイ順N及び物
理トラック長の組合せに適応するように論理トラック・
サイズを選択することができる。
【0053】[パリティを有するスタガー・アレイ動
作]同期DASDアレイは、システム動作を中断せずにシン
グルDASD故障から回復するパリティ手法をよく用いる。
通常、このようなパリティ手法はアレイのなかのN個の
DASD毎に追加のDASD (N+1)を用いる。(N+1) 番目のパリ
ティDASDにあるシングル・ブロックは、アレイのなかの
残りのN個のDASD上の対応するブロックのシーケンスに
あるデータのパリティを含む。DASDが故障すると、簡単
なハードウェア排他的OR手順を用いて使用不可能な又
は脱落しているデータ・ブロックを回復するように、残
存するDASD及びパリティDASDからのデータを組合わせる
ことができる。前記システムは、故障したDASDのなかの
凍結されたデータの即時再構成のためにDASDアレイに切
替えできる待機("ホット")DASDをよく用いる。
【0054】#d 以下に開示する変形により、本発明のスタガー・アレイ
はフォールトトレランスのパリティ・ディスクの付加を
可能にする。図6は、5-DASDシリンダ36を完成するパリ
ティDASD 5の付加を除けば図4と同じである。パリティ
・ブロックP1〜P8の各々は、残る4個のDASDのなかのデ
ータ・ブロックの対応する斜方向記号シーケンスのパリ
ティを含む。例えば、パリティ・ブロックP1は斜方向記
号シーケンスB1〜B4のパリティを含み、パリティ・ブロ
ックP2はシーケンスB5〜B8のパリティを含み、以下同様
である。
【0055】1つのシーケンスのなかのブロックの更新
を要するときは必ず、更新されるシーケンスに対応して
更新されるパリティ・ブロックの再計算を可能にするよ
うに当該シーケンスのなかの全てのブロックを読取るこ
とが必要である。これは、さもなければ必要とするより
も数ブロック前に更新動作を開始しそして通常必要とす
るよりも数ブロック後まで継続することにより可能であ
る。例えば、フィールドC2 (ブロックB10)を探索しフィ
ールドK2 (ブロック B11〜B17)を更新する動作について
考える。ブロックB10 で動作を開始する代わりに、ブロ
ックB9を読取ることにより動作が開始される。そして、
ブロックB10 が読取られブロック B11〜B12 が書込まれ
る。ブロックB9〜B12 にある値は現時点で分かっている
ので、DASD 1上のブロックB13 の更新と同時にDASD 5上
のパリティ・フィールドP3を更新することができる。ブ
ロック B14〜B16 が引続き更新された後、ブロックB17
の更新と同時にパリティ・フィールドP4が更新される。
パリティがない場合、動作はここで終了する。パリティ
がある場合、更新されるパリティ・フィールドP5を計算
するためにブロック B18〜B20 を読取る必要がある。こ
の簡単な実施例は、本発明のスタガー・アレイにパリテ
ィを包含することは、さもなければ必要とするよりも数
ブロック早いか又は遅い各更新動作の開始又は終了を必
要とすることがある。
【0056】
【発明の効果】本発明によれば、固定ブロック(FBA) フ
ォーマットの直接アクセス記憶装置(DASD)の同期アレイ
を動作させて可変長(CKD) フォーマットレコードを記憶
し更新できる。
【図面の簡単な説明】
【図1】同期DASDアレイのブロックを示す図である。
【図2】カウント・キー・データ(CKD) レコードフォー
マットの概略図である。
【図3】図1のDASDアレイのパリティを有するRAID CKD
フォーマットの例を示す図である。
【図4】FBA フォーマットDASDのスタガー・アレイに論
理CKD トラックを記録する本発明の斜方向記号フォーマ
ットを示す図である。
【図5】バンド式DASDのスタガー・アレイで図4のフォ
ーマットの使用を示す図である。
【図6】1つの追加DASDに斜方向パリティ・ブロックを
記憶できるスタガーDASDアレイに図4のフォーマットを
用いる図である。
【符号の説明】
10 CPU 14 チャネル 16 アレイ制御装置 18 キャッシュ 20 制御経路 22 データ経路 24 データ経路 26 データ経路 28 CKDトラック 30 シリンダ 32 シリンダ 34 シリンダ 36 シリンダ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 スティブン・ロバート・ヘッツラー アメリカ合衆国カリフォルニア州サニーベ ール ヘンダーソン・アヴェニュー1237エ イチ (72)発明者 ロジャー・フランクリン・ホイト アメリカ合衆国カリフォルニア州サンホゼ タム・オシャンタ・ドライヴ6613番地 (72)発明者 ジャイシャンカー・モーゼダス・メノン アメリカ合衆国カリフォルニア州サンホゼ モントロ・ドライヴ6017番地 (72)発明者 ミカエル・フランシス・ミトマ アメリカ合衆国カリフォルニア州サンホゼ アルシャン・ウエイ7300番地

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】同期化された固定ブロックフォーマットの
    N(>1) 個の直接アクセス記憶装置(DASD)のアレイにおい
    て、前記各DASDが複数の物理トラック及び1つのデータ
    転送速度(D) を有し、各可変長レコードが少なくともカ
    ウント・フィールド及び1つのデータ・フィールドを有
    し、前記各物理トラックがサイズ(G) のギャップで分離
    されたサイズ(B) の少なくとも1つのブロックを有し、
    g,h,i,j 及びk が非0の正の整数である場合に、コマン
    ドに応答して前記可変長レコードをアクセスするよう論
    理データ記憶システムを動作させる方法であって、 (a) 前記可変長レコードを、前記カウント・フィールド
    を表わす最初の前記ブロックと前記少なくとも1つのデ
    ータ・フィールド及び他の全フィールドを表わす少なく
    とも1つの付加された前記ブロックとに再フォーマティ
    ングするステップと、 (b) k番目の前記DASDのi番目の前記物理トラック上の
    j番目の前記ブロックが(k-1) 番目のDASDのi番目の前
    記物理トラック上の(j-g) 番目の前記ブロックに続き、
    斜方向記号シーケンスがN番目の前記DASD上のj番目の
    前記ブロックから最初の前記DASD上の(j+h) 番目の前記
    ブロックまで循環するように、前記物理トラック上で、
    前記各可変長レコードの前記最初のブロック及び前記追
    加されたブロックを前記N個のDASDの少なくともいくつ
    かにわたり少なくとも1つの斜方向記号シーケンスを有
    する所定のトロイド形の横移動で同期書込みするステッ
    プと、 (c) 前記ブロックの番号を表わすポインタを前記カウン
    ト・フィールドの各々に付加し最初の次の前記カウント
    ・フィールドを前記各カウント・フィールドから分離す
    るステップと、 (d) 少なくとも1つの前記可変長レコードを要求する前
    記コマンドの各々に応答して前記再フォーマティングす
    るステップ(a) 及び前記書込むステップ(b) で指定され
    たシーケンスで前記要求された可変長レコードを形成す
    る前記ブロックをアクセスすることにより前記要求され
    た可変長レコードを検索するステップとを含む論理デー
    タ記憶システムを動作させる方法。
  2. 【請求項2】前記論理データ記憶システムは(N+1) 個の
    DASDのアレイを含み、更に(bb) 前記斜方向記号シーケ
    ンス毎に、前記書込みステップ(b) と同時にN個の前記
    ブロックよりも多くない対応するパリティ・ブロックを
    形成し且つ前記対応するパリティ・ブロックを(N+1) 番
    目のDASDに書込むステップと、 (e) 前記斜方向記号シーケンスの各々のなかの使用でき
    る前記ブロックと前記(N+1) 番目のDASDのなかの対応す
    る前記パリティ・ブロックとを組合わせることにより、
    故障した前記DASDに記憶された少なくとも1つの使用で
    きない前記ブロックを再構築するステップとを含む請求
    項1の方法。
  3. 【請求項3】前記各DASDは前記DASD毎に読取り及び書込
    みヘッド/トラック配列及び前記読取り配列と前記書込
    み配列の間のマイクロジョギング遅延時間(T) を有し、
    前記DASDの前記の数Nは不等式 N≦(B+DT)/(B+G) を満
    足する請求項2の方法。
  4. 【請求項4】各可変長レコードが少なくともカウント・
    フィールド及び1つのデータ・フィールドを有し、g,h,
    i,j 及びk が非0の正の整数である場合に、コマンドに
    応答して前記可変長レコードをアクセスする論理データ
    記憶システムであって、 N(>1) 個の同期された固定ブロックフォーマットの直接
    アクセス記憶装置(DASD)のアレイであって、前記各DASD
    は複数の物理トラック及び1つのデータ転送速度(D) を
    有し、前記各物理トラックはサイズ(G) のギャップで分
    離されたサイズ(B) の少なくとも1つのブロックを有す
    るアレイと、 前記アレイに結合され、前記各可変長レコードを、前記
    カウント・フィールドを表わす最初の前記ブロックと前
    記少なくとも1つのデータ・フィールド及び他の全フィ
    ールドを表わす少なくとも1つの追加された前記ブロッ
    クとに再フォーマティングする再フォーマティング手段
    と、 前記各DASD及び前記再フォーマティング手段に結合さ
    れ、前記物理トラックに、k番目の前記DASDのi番目の
    前記物理トラック上のj番目の前記ブロックが(k-1) 番
    目の前記DASDのi番目の前記物理トラック上の(j-g) 番
    目の前記ブロックに続くよう前記N個のDASDの少なくと
    もいくつかにわたり少なくとも1つの斜方向記号シーケ
    ンスを有する所定のトロイド形の横移動で前記各可変長
    レコードの前記最初のブロック及び前記付加されたブロ
    ックを同期書込みし、前記斜方向記号シーケンスがN番
    目の前記DASD上のj番目の前記ブロックから最初の前記
    DASD上の(j+h) 番目の前記ブロックまで循環する書込み
    手段と、 前記書込み手段に結合され、前記ブロックの番号を表わ
    すポインタを前記各カウント・フィールドに付加し最初
    の次の前記カウント・フィールドを前記各カウント・フ
    ィールドから分離するポインタ手段と、 前記アレイに結合され、少なくとも1つの前記可変長レ
    コードを要求する前記各コマンドに応答するシーケンス
    で前記要求された可変長レコードを形成する前記ブロッ
    クをアクセスする検索手段とを備える論理データ記憶シ
    ステム。
  5. 【請求項5】前記アレイは(N+1) 個のDASDを備え、更に
    前記書込み手段に結合され、N個の前記ブロックよりも
    多くない前記斜方向記号シーケンス毎に対応するパリテ
    ィ・ブロックを形成し且つ前記対応するパリティ・ブロ
    ックを(N+1) 番目のDASDに書込むパリティ手段と、 前記アクセスする手段に結合され、前記各斜方向記号シ
    ーケンスの使用できる前記ブロックと前記(N+1) 個のDA
    SDのなかの対応する前記パリティ・ブロックとを組合わ
    せることにより、故障した前記DASDに記憶された少なく
    とも1つの使用できない前記ブロックを再構築する再構
    築手段とを備える請求項4の論理データ記憶システム。
  6. 【請求項6】前記各DASDは前記DASD毎に読取り及び書込
    みヘッド/トラック配列及び前記読取り配列と前記書込
    み配列の間のマイクロジョギング遅延時間(T) を有し、
    前記DASDの前記の数Nは不等式 N≦(B+DT)/(B+G) を満
    足する請求項4の論理データ記憶システム。
  7. 【請求項7】前記各DASDは少なくとも2つの同心バンド
    に構成され、前記各バンドは同じ物理ブロック記憶容量
    をもつ複数の物理トラックを有し且つ前記最初のブロッ
    ク及び前記追加されたブロックは前記N個のDASDの少な
    くともいくつかにわたり少なくとも1つの斜方向記号シ
    ーケンスで分布された少なくとも1つの論理トラックに
    構成される、請求項4の論理データ記憶システム。
  8. 【請求項8】直接アクセス記憶装置(DASD)の各々が複数
    の物理トラック及び1つのデータ転送速度(D) を有し、
    可変長レコードの各々が少なくともカウント・フィール
    ド及び1つのデータ・フィールドを有し、前記各物理ト
    ラックがサイズ(G) のギャップで分離されたサイズ(B)
    の少なくとも1つのブロックを有し、g,h,i,j 及びkが
    非0の正の整数である場合に、同期化された固定ブロッ
    クフォーマットのN(>1) 個の前記DASDのアレイでコマン
    ドに応答して前記可変長レコードをアクセスする論理デ
    ータ記憶システムにおいて、 前記アレイに結合され、前記各可変長レコードを、前記
    カウント・フィールドを表わす最初の前記ブロックと前
    記少なくとも1つのデータ・フィールド及び他の全フィ
    ールドを表わす少なくとも1つの追加された前記ブロッ
    クとに再フォーマティングする再フォーマティング手段
    と、 前記各DASD及び前記再フォーマティング手段に結合さ
    れ、前記物理トラックに、k番目の前記DASDのi番目の
    前記物理トラック上のj番目の前記ブロックが(k-1) 番
    目の前記DASDのi番目の前記物理トラック上の(j-g) 番
    目の前記ブロックに続くよう前記N個のDASDの少なくと
    もいくつかにわたり少なくとも1つの斜方向記号シーケ
    ンスを有する所定のトロイド形の横移動で前記各可変長
    レコードの前記最初のブロック及び前記追加されたブロ
    ックを同期書込みし、前記斜方向記号シーケンスがN番
    目の前記DASD上のj番目の前記ブロックから最初の前記
    DASD上の(j+h) 番目の前記ブロックまで循環する書込み
    手段と、 前記書込み手段に結合され、前記ブロックの番号を表わ
    すポインタを前記各カウント・フィールドに付加し最初
    の次の前記カウント・フィールドを前記各カウント・フ
    ィールドから分離するポインタ手段と、 前記アレイに結合され、少なくとも1つの前記可変長レ
    コードを要求する前記各コマンドに応答するシーケンス
    で前記要求された可変長レコードを形成する前記ブロッ
    クをアクセスする検索手段とを備えることを特徴とする
    論理データ記憶システム。
  9. 【請求項9】前記アレイは(N+1) 個のDASDを含み、更に
    前記書込み手段に結合され、N個の前記ブロックよりも
    多くない前記斜方向記号シーケンス毎に対応するパリテ
    ィ・ブロックを形成し且つ前記対応するパリティ・ブロ
    ックを(N+1) 番目のDASDに書込むパリティ手段と、 前記アクセス手段に結合され、前記各斜方向記号シーケ
    ンスのなかの使用できる前記ブロックと前記(N+1) 番目
    のDASDのなかの対応する前記パリティ・ブロックとを組
    合わせることにより、故障した前記DASDに記憶された少
    なくとも1つの使用できない前記ブロックを再構築する
    再構築手段とを含む請求項8の論理データ記憶システ
    ム。
  10. 【請求項10】前記各DASDは前記DASD毎に読取り及び書
    込みヘッド/トラック配列及び前記読取り配列と前記書
    込み配列の間のマイクロジョギング遅延時間(T) を有
    し、前記DASDの前記の数Nは不等式 N≦(B+DT)/(B+G)
    を満足する請求項8の論理データ記憶システム。
  11. 【請求項11】前記各DASDは少なくとも2つの同心バン
    ドに構成され、前記各バンドは同じ物理ブロック記憶容
    量をもつ複数の物理トラックを有し且つ前記最初のブロ
    ック及び前記追加されたブロックは前記N個のDASDの少
    なくともいくつかにわたり少なくとも1つの斜方向記号
    シーケンスで分布された少なくとも1つの論理トラック
    に構成される、請求項8の論理データ記憶システム。
JP5242228A 1992-11-23 1993-09-29 デ―タ記憶システム及びその動作方法 Expired - Lifetime JP2501007B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/979,740 US5459853A (en) 1992-11-23 1992-11-23 Efficient variable-block data storage system employing a staggered fixed-block-architecture array
US979740 1992-11-23

Publications (2)

Publication Number Publication Date
JPH07168675A true JPH07168675A (ja) 1995-07-04
JP2501007B2 JP2501007B2 (ja) 1996-05-29

Family

ID=25527123

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5242228A Expired - Lifetime JP2501007B2 (ja) 1992-11-23 1993-09-29 デ―タ記憶システム及びその動作方法

Country Status (2)

Country Link
US (1) US5459853A (ja)
JP (1) JP2501007B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000007105A1 (fr) * 1998-07-27 2000-02-10 Hitachi, Ltd. Systeme informatique

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5463754A (en) * 1992-10-30 1995-10-31 International Business Machines Corporation Shared direct access storage device for fixed block architecture devices
US6138126A (en) * 1995-05-31 2000-10-24 Network Appliance, Inc. Method for allocating files in a file system integrated with a raid disk sub-system
JP3264465B2 (ja) * 1993-06-30 2002-03-11 株式会社日立製作所 記憶システム
JP3135751B2 (ja) * 1993-07-16 2001-02-19 株式会社東芝 データ記憶装置
JP3249868B2 (ja) * 1993-11-19 2002-01-21 株式会社日立製作所 アレイ形式の記憶装置システム
JP2557203B2 (ja) * 1993-12-27 1996-11-27 インターナショナル・ビジネス・マシーンズ・コーポレイション ファジィ・パッキング方法及びデータ記憶システム
JPH07320247A (ja) * 1994-05-23 1995-12-08 Internatl Business Mach Corp <Ibm> Mrヘッド用サーボ方法及びハードディスクシステム
US5634109A (en) * 1994-06-20 1997-05-27 International Business Machines Corporation Method and system for enhanced data management efficiency in memory subsystems utilizing redundant arrays of disk memory devices and a nonvolatile cache
US5613085A (en) * 1994-12-27 1997-03-18 International Business Machines Corporation System for parallel striping of multiple ordered data strings onto a multi-unit DASD array for improved read and write parallelism
JPH08202506A (ja) * 1995-01-30 1996-08-09 Fujitsu Ltd データ転送制御装置及びデータ転送制御方法
US5570332A (en) * 1995-05-25 1996-10-29 Seagate Technology, Inc. Method for reducing rotational latency in a disc drive
AU6041296A (en) * 1995-06-06 1996-12-24 Maxtor Corporation Mr head differential micro-jog
JP2914261B2 (ja) * 1995-12-20 1999-06-28 富士ゼロックス株式会社 外部記憶制御装置及び外部記憶装置制御方法
US5819310A (en) * 1996-05-24 1998-10-06 Emc Corporation Method and apparatus for reading data from mirrored logical volumes on physical disk drives
US6078989A (en) * 1996-10-04 2000-06-20 Sony Corporation Disc array control method and disc array control apparatus
US5802547A (en) * 1996-10-15 1998-09-01 International Business Machines Corporation Data storage system with streamlined data exchange path to cached data
US5951691A (en) * 1997-05-16 1999-09-14 International Business Machines Corporation Method and system for detection and reconstruction of corrupted data in a data storage subsystem
US6098148A (en) * 1997-05-29 2000-08-01 International Business Machines Corporation Storage and access of data using volume trailer
CA2245601C (en) * 1997-08-14 2007-06-12 Stewart Crozier High-performance low-complexity error-correcting codes
US6304940B1 (en) 1997-08-14 2001-10-16 International Business Machines Corporation Shared direct access storage system for MVS and FBA processors
US6112277A (en) * 1997-09-25 2000-08-29 International Business Machines Corporation Method and means for reducing device contention by random accessing and partial track staging of records according to a first DASD format but device mapped according to a second DASD format
US6173360B1 (en) * 1998-01-09 2001-01-09 International Business Machines Corporation Apparatus and method for allowing existing ECKD MVS DASD using an ESCON interface to be used by an open storage using SCSI-type interface
US6480949B2 (en) * 1998-02-27 2002-11-12 Stmicroelectronics N.V. Disk drive block ordering system
JP3404289B2 (ja) 1998-05-22 2003-05-06 富士通株式会社 ディスク制御装置及びその制御方法
US6463503B1 (en) 1999-05-12 2002-10-08 International Business Machines Corporation Method and system for increasing concurrency during staging and destaging in a log structured array
JP3952640B2 (ja) * 1999-09-07 2007-08-01 株式会社日立製作所 データバックアップ方法、メインフレーム系ストレージシステムおよびメインフレームホストコンピュータ
US6496901B1 (en) 1999-09-22 2002-12-17 Storage Technology Corporation Mapping variable size data blocks into a fixed block structure
US20020124137A1 (en) * 2001-01-29 2002-09-05 Ulrich Thomas R. Enhancing disk array performance via variable parity based load balancing
US6862692B2 (en) 2001-01-29 2005-03-01 Adaptec, Inc. Dynamic redistribution of parity groups
US6990667B2 (en) 2001-01-29 2006-01-24 Adaptec, Inc. Server-independent object positioning for load balancing drives and servers
US6990547B2 (en) * 2001-01-29 2006-01-24 Adaptec, Inc. Replacing file system processors by hot swapping
US20020174295A1 (en) * 2001-01-29 2002-11-21 Ulrich Thomas R. Enhanced file system failure tolerance
US7054927B2 (en) 2001-01-29 2006-05-30 Adaptec, Inc. File system metadata describing server directory information
US20020138559A1 (en) * 2001-01-29 2002-09-26 Ulrich Thomas R. Dynamically distributed file system
KR100518554B1 (ko) * 2003-02-05 2005-10-04 삼성전자주식회사 백업된 시스템 정보를 가지는 단일 헤드 디스크 드라이브및 단일 헤드 디스크 드라이브의 시스템 정보 기록 및독출 방법
US7000083B2 (en) * 2003-06-06 2006-02-14 International Business Machines Corp. Resynchronization of count key data with its corresponding meta data
US7502185B2 (en) * 2004-09-10 2009-03-10 Seagate Technology, Llc Method and system for determining spin pad length
US7380157B2 (en) * 2004-10-27 2008-05-27 Pillar Data Systems, Inc. Staggered writing for data storage systems
US7945729B2 (en) * 2004-11-24 2011-05-17 International Business Machines Corporation System and method for tolerating multiple storage device failures in a storage system using horizontal and vertical parity layouts
US8261015B2 (en) * 2008-09-12 2012-09-04 Lsi Corporation Utilizing more capacity of a physical disk through multiple logical drives on the physical disk
US8375227B2 (en) * 2009-02-02 2013-02-12 Microsoft Corporation Abstracting programmatic representation of data storage systems
US11429486B1 (en) * 2010-02-27 2022-08-30 Pure Storage, Inc. Rebuilding data via locally decodable redundancy in a vast storage network
US9619157B2 (en) * 2014-04-03 2017-04-11 Analysis Solution Llc High-speed data storage
US11327664B1 (en) * 2017-08-04 2022-05-10 Dell Products L.P. Fast small write forwarding with non-temporal cache memory
US10528348B2 (en) * 2018-03-07 2020-01-07 Seagate Technology Llc Data management method for storage media
US11100092B2 (en) 2019-06-17 2021-08-24 Bank Of America Corporation Database tool
US11269861B2 (en) 2019-06-17 2022-03-08 Bank Of America Corporation Database tool

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5301304A (en) * 1988-05-20 1994-04-05 International Business Machines Corporation Emulating records in one record format in another record format
US5072378A (en) * 1989-12-18 1991-12-10 Storage Technology Corporation Direct access storage device with independently stored parity
US5263145A (en) * 1990-05-24 1993-11-16 International Business Machines Corporation Method and means for accessing DASD arrays with tuned data transfer rate and concurrency
US5206939A (en) * 1990-09-24 1993-04-27 Emc Corporation System and method for disk mapping and data retrieval
US5271012A (en) * 1991-02-11 1993-12-14 International Business Machines Corporation Method and means for encoding and rebuilding data contents of up to two unavailable DASDs in an array of DASDs
EP0519669A3 (en) * 1991-06-21 1994-07-06 Ibm Encoding and rebuilding data for a dasd array
US5301297A (en) * 1991-07-03 1994-04-05 Ibm Corp. (International Business Machines Corp.) Method and means for managing RAID 5 DASD arrays having RAID DASD arrays as logical devices thereof
US5271014A (en) * 1992-05-04 1993-12-14 International Business Machines Corporation Method and apparatus for a fault-tolerant mesh with spare nodes

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000007105A1 (fr) * 1998-07-27 2000-02-10 Hitachi, Ltd. Systeme informatique

Also Published As

Publication number Publication date
JP2501007B2 (ja) 1996-05-29
US5459853A (en) 1995-10-17

Similar Documents

Publication Publication Date Title
JP2501007B2 (ja) デ―タ記憶システム及びその動作方法
AU640197B2 (en) Direct access storage device with independently stored parity
EP0458554B1 (en) Method and apparatus for formatting data on DASD arrays
US5768044A (en) Zoned recording embedded servo disk drive having no data identification fields and reduced rotational latency
US5442752A (en) Data storage method for DASD arrays using striping based on file length
US5890209A (en) System and method for reducing target track seek time in a data storage disk drive
US6785836B2 (en) In-place data transformation for fault-tolerant disk storage systems
US5506979A (en) Method and means for execution of commands accessing variable length records stored on fixed block formatted DASDS of an N+2 DASD synchronous array
JP3065481B2 (ja) ディスク・アレイ装置およびデータの格納方法
KR101077520B1 (ko) 데이터 기록 재생 시스템, 데이터 기록 재생 방법, 프로그램 및 기록 매체
JPS6228977A (ja) デ−タ記憶装置
JPH0736143B2 (ja) レコードの書き込み更新方法、単一パスアクセス保証方法、及びシステム
JPH06332623A (ja) アレイ型記録装置及び記録装置
JPH0756688A (ja) データ記憶装置
KR100537577B1 (ko) 스트리밍 오디오비주얼 데이터를 디스크 드라이브에기록하는 방법
US6457096B1 (en) Redundant recording disk device and data processing method using plural logical disks with mirrored data stored with a predetermined phase-offset
JPH06309113A (ja) ディスク装置
JPH11119915A (ja) ディスクアレイ装置
JPH07211016A (ja) ディスク記憶装置およびそのデータ記録方法
JPH04264910A (ja) コンピュータ外部記憶装置のデータ更新方法
JPH0816327A (ja) ディスクアレイ装置
EP1519377A1 (en) Method for writing streaming audiovisual data to a disk drive
JPH05181612A (ja) ディスク装置
JPS6386159A (ja) 磁気デイスク装置の記録方法
JPS63100671A (ja) 回転型記憶装置