JPH11143757A - フォールトトレラントファイルシステム - Google Patents

フォールトトレラントファイルシステム

Info

Publication number
JPH11143757A
JPH11143757A JP9310657A JP31065797A JPH11143757A JP H11143757 A JPH11143757 A JP H11143757A JP 9310657 A JP9310657 A JP 9310657A JP 31065797 A JP31065797 A JP 31065797A JP H11143757 A JPH11143757 A JP H11143757A
Authority
JP
Japan
Prior art keywords
disk
file
data
error
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9310657A
Other languages
English (en)
Inventor
Hisashi Nakamura
恒 中村
Hirokazu Takahashi
浩和 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Microcomputer Technologies Ltd
Original Assignee
NEC Microcomputer Technologies Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Microcomputer Technologies Ltd filed Critical NEC Microcomputer Technologies Ltd
Priority to JP9310657A priority Critical patent/JPH11143757A/ja
Publication of JPH11143757A publication Critical patent/JPH11143757A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】複数のディスクファイルを読み出し、ミラーリ
ングしている正常なディスクファイルを用いて、運用を
継続しながらエラーおよび不整合を修復することにあ
る。 【解決手段】フォールトトレラントファイルシステム1
のフォールトトレラント手段3は、ファイルシステム2
のファイル要求から、多重に同一ファイルを格納する各
ディスク5乃至Nに対して、ファイル要求を生成するデ
ータ構造生成手段31と、ディスク読み出しディスクフ
ァイルが整合しているか否かを、データ比較で検知する
データ比較手段33と、ファイル要求に基づいて、各デ
ィスクに対する入出力要求を生成してディスクドライバ
4に送り出し、ディスクドライバ4のエラー検知に対し
て、エラー修復とデータ比較手段33によるディスクフ
ァイルの不整合修復とを制御するデータ制御手段32
と、を有する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、ディスクファイ
ルのフォールトトレラントファイルシステムに関し、特
に、システム運用中に、エラーおよび不整合を修復でき
るフォールトトレラントファイルシステムに関する。
【0002】
【従来の技術】従来、ディスクファイルのフォールトト
レラントファイルシステム(以降FTFと略称)は、デ
ィスクファイルを2重化してミラーリングすることを指
すことが通常である。従来のFTFの構成を示す図6を
参照すると、このFTFは、UNIXシステムに実装し
たものである。普通のUNIXシステムはユーザの仕事
を受け持つアプリケーション101と、ファイルを管理
するファイルシステム102、ディスクファイルに読み
書きするディスクドライバ103と、でなるソフトウエ
アモジュールで構成されている。そしてファイルを格納
する2つのディスク105およびディスク106が一つ
のディスクファイルに対して領域を与えられ、2重化さ
れている。FTF103は、ファイルシステム102と
ディスクドライバ104の間に位置し、ディスク105
とディスク106とをミラーリング関係におく。
【0003】次に、この動作を説明する。普通のUNI
Xシステムならば、アプリケーション101よりディス
ク105とディスク106に対する読み書き込み要求が
発生した場合、ファイルシステム102とディスクドラ
イバ104を経由してディスク105およびディスク1
06にアクセスする。このシステムにFTF103を実
装すると、ファイルシステム102からの要求に対し
て、同時に複数のディスク105,106にアクセスで
きるようになる。つまり同一のディスクファイルを複数
のディスク105,106に保存してシステムの耐故障
性を高めるのである。
【0004】従来のUNIXシステム配下のFTFは、
ディスクに障害が起こったとき、エラーをユーザに報告
して、障害が起こったディスクを切り離すだけであっ
た。このような方法ではエラー時のディスクの切り離し
によってディスクを1台で運用する場面が起こりやす
い。またディスクが1台になってしまうとそのディスク
にエラーブロックがあった時はデータが失われてしまう
ので、そのような状況はなるべく回避しなければならな
い。
【0005】
【発明が解決しようとする課題】第1の問題は、ディス
クファイルを2重化したミラーリングにおいて、ソフト
ウエアで修復可能なエラーを運用中に修復することであ
る。これによりディスクアクセス時にエラーが起こった
場合のディスクの切り離しを減らすことができる。エラ
ー修復が可能な第1のエラーとは、ディスクブロックに
エラーブロックができた場合である。これは何らかの原
因によりディスクに傷がついた時などに発生する。第2
の修復可能なエラーとは、多重化したディスク間でディ
スクファイルの不一致が起こった場合である。これはデ
ータ書き込み時の不検出エラーが原因で発生する。
【0006】この発明の複数のディスクファイルの読み
出しデータを比較するFTFでは、2つ以上のディスク
でミラーリングしている正常なディスクファイルを用い
て、運用を継続しながら修復することにある。具体的に
は、UNIXシステムのFTFに、複数デスクに対すフ
ァイル要求を管理するデータ構造生成手段と、エラーが
発生したときにそのエラーが修復可能かどうか判断する
データ制御手段と、複数のディスクファイルの整合が取
れているかどうかを比較するデータ比較手段と、を設け
て、運用中にエラー修復して、ミラーリングを継続す
る。
【0007】
【課題を解決するための手段】そのため、この発明の、
複数のディスクファイルに対する入出力と障害処理とを
制御するフォールトトレラント手段を備えるフォルトト
レラントファイルシステムにおいて、2以上の多重化デ
ィスクファイルに対して、エラーブロックとディスクフ
ァイル不整合とを修復するフォールトトレラント手段を
有することを特徴とする。
【0008】更に、前記ディスクファイルは、複数のデ
ィスクそれぞれに格納されて、多重化されることを特徴
とする。
【0009】また、前記フォールトトレラント手段は、
ファイルシステムから送付されるファイル要求に基づい
て、複数のディスクそれぞれに対するファイル要求を生
成するデータ構造生成手段と、前記ディスクディスクの
読み出しデータが互いに整合しているか否かを、データ
比較で検知するデータ比較手段と、前記ファイル要求に
対して、ディスクドライバに送付する入出力要求の生成
と、前記ディスクドライバーのエラー検知に対して、エ
ラーブロック修復と前記データ比較手段による不整合デ
ィスクファイル修復とを制御するデータ制御手段と、を
有することを特徴とする。
【0010】
【発明の実施の形態】この発明について、図面を参照し
て説明する。この発明の実施の形態のを示す図1を参照
すると、フォールトトレラントファイルシステム1はU
NIXシステムに実装されている。図示しないアプリケ
ーションが、ディスク5およびディスク6乃至ディスク
Nに多重化されて存在するディスクファイルにアクセス
するため、ファイル要求をファイルシステム2に送付す
る。通常のUNIXシステムにおいて、ファイルシステ
ム2はディスクドライバ4を呼び出すが、この実施の形
態では、フォールトトレラント手段3を呼び出す。この
仕組みによって、2以上のディスクファイルのミラーリ
ングを実現する。
【0011】フォールトトレラントファイルシステム1
は、ファイルシステム2と、フォールトトレラント手段
3と、ディスクドライバ4と、ディスク5乃至Nと、を
備える。フォールトトレラント手段3には、複数ディス
ク5乃至ディスクNに格納されたディスクファイルのデ
ータ構造を管理するデータ構造生成手段31と、複数デ
ィスク5乃至Nに対する入出力要求を管理し、エラーお
よび不整合を修復するデータ制御手段32と、ディスク
ファイルの読み出しデータの整合を比較して判定するデ
ータ比較手段33と、を含む。データ制御手段32の入
出力要求は、各ディスク5,6乃至Nに対して入出力を
制御するディスクドライバ4に送付される。
【0012】次に、この実施の形態におけるエラー修復
の動作を説明する。図2(a),図2(b)は動作を説
明するフローチャートである。図2(a)を参照する
と、ファイルシステム2がFTF3を呼び出すと、デー
タ構造生成手段31がディスク5乃至Nの各ディスクフ
ァイルに対するデータ構造を生成する(ステップ2
1)。該データ構造に基づくファイル要求によって、デ
ィスク5からディスクファイルを読み込み(ステップ2
2)、読み込みが正常終了したか否かを判定する(ステ
ップ23)。エラーによってディスクファイルのデータ
が読めないとき(ステップ23のNO)、他のディスク
6から再度ディスクファイルを読み、ディスク6からデ
ィスクファイルが正常に読み込めたか否かチェックする
(ステップ25)。エラーによってディスクファイルが
読めないとき(ステップ25のNO)、残りのディスク
に対して、ディスクファイルを読み込む動作をしたか否
かを判断して(ステップ26)、正しいディスクファイ
ルが読み込めるまで残りディスクの読み込みを続ける
(ステップ26のNO,ステップ24,ステップ25の
NO)。正常にディスクファイルが読めたディスクがあ
るとき(ステップ25のYES)、該ディスクの読み込
みディスクファイルを、エラーが生じている他のディス
クに対して、再書き込み動作を行う(ステップ27)。
全てのディスク5乃至Nからの読み込みがエラーである
とき、図2(b)のエラー処理を行う。エラー処理は、
ステップ21で生成したデータ構造を解放する(ステッ
プ28)。修復できないエラーが発生したか否かをチェ
ックし(ステップ29)、修復できないエラーがあれば
(ステップ29のYES)、エラーの設定をし、ファイ
ルシステム2に通知する(ステップ30)。
【0013】次に、具体的なミラーリング動作を、2つ
のディスク5,6おける、ディスクのエラーブロックの
検出とブロック代替の具体例を示す図3(a)乃至図3
(d)を参照して説明する。まず図3(a)で、データ
制御手段32はディスク5のディスクファイルを読み込
む。ここではディスク5のディスクファイルはエラーブ
ロックであると想定している。図3(b)は、ディスク
5のディスクファイルがエラーであるので、ディスク6
のディスクファイルが読み込まれる。図3(c)は、デ
ィスク6のディスクファイルは正常に読めたことを想定
しているので、ディスク5とディスク6のディスクファ
イルが整合しているか否かをデータ比較手段33で判定
する。そしてこの場合は、ディスク5のディスクファイ
ル読み込みでエラーが発生しているので、ディスク6の
ディスクファイルをディスク5に書き込む。この書き込
みにおいて、実際にエラーブロックを代替ブロックに置
き換えるのはディスクドライバ4の機能である。書き込
み処理が正常に終了すると、図3(d)のように2つの
ディスク5とディスク6との間でディスクファイルの整
合がとれ、エラーブロックが修復される。
【0014】この実施の形態における不整合ディスクフ
ァイルを修復する場合について説明する。ディスク5乃
至ディスクNからの読み込み時に、必ずミラーリングし
ている全てのディスク5乃至ディスクNにアクセスし
て、ディスク5乃至ディスクNの間で、ディスクファイ
ルの整合性をチェックすることができる。図4(a),
図4(b),図4(c)は、その動作を示すフローチャ
ートである。ファイルシステム2が、フォールトトレラ
ント手段3を呼び出すと、データ構造生成手段31が、
各ディスクファイルにアクセスするためのデータ構造を
生成する(ステップ41)。データ制御手段32はデー
タ構造に基づいて、全てのディスク5乃至ディスクNか
らディスクドライバ4を通じて、ディスクファイルを順
次に読み込む(ステップ42)。フォールトトレラント
手段3が管理しているディスク5乃至ディスクNの内で
データ比較の基準となるディスク5をマスタディスクと
する。それ以外のディスク6乃至ディスクNはスレーブ
ディスクとする。全てのディスク5乃至ディスクNから
のディスクファイル読み込みが終了したら、ディスク5
からの読み込みでエラーが起こっているか否かを判定す
る(ステップ43)。エラーが起こっていなければ(ス
テップ43のYES)、データ比較手段33を使って、
ディスク6乃至ディスクNの読み出しディスクファイル
が一致しているか否かをチェックをする(ステップ4
7)。ディスク5からの読み込みでエラーが発生してい
た場合(ステップ43のNO)、ディスク5のディスク
ファイルのエラー修復するため、スレーブディスクのデ
ィスク6乃至ディスクNから読み込みが正常に終了した
ディスクファイルを見つける(ステップ44)。スレー
ブディスクのディスク6乃至ディスクNの読み込みが全
てエラーであるとき(ステップ45のYES)、エラー
処理に飛ぶ(ステップ51)。読み込みが正常終了する
スレーブディスクのディスクファイルがあるとき(ステ
ップ44のYES)、そのスレーブディスクのディスク
ファイルをマスタディスクのディスク5に書き込む(ス
テップ46)。マスタディスクのディスクファイルの不
整合が修復したら、データ比較手段33は、スレーブデ
ィスクのディスク6乃至ディスクNとディスクファイル
の整合をチェックするため、データを比較する(ステッ
プ47)。ディスクファイルの不一致が発見されると
(ステップ48のNO)、マスタディスクのディスク5
のディスクファイルをスレーブディスクにコピーする
(ステップ49)。ステップ41で、スレーブディスク
からの読み込みがエラーだったとき、直ちに無条件に、
ディスク5のディスクファイルがエラーのスレーブディ
スクにコピーされる。全てのスレーブディスクとのディ
スクファイル比較が終わったことが判断されると(ステ
ップ50のNO)、後処理を行う。先ず、後処理は、ス
テップ41で生成したデータ構造の解放を行う(ステッ
プ51)。修復できないエラーが発生したかどうかをチ
ェックし(ステップ52)、修復できないエラーがあれ
ば(ステップ52のNO)、エラーの設定をし、ファイ
ルシステム2に通知する(ステップ53)。
【0015】次に、具体的な整合動作を、2つのディス
ク5とディスク6とにおける図5(a)乃至図5(d)
を参照して説明する。ディスク5がマスタディスクであ
るとすると、図5(a)で、ディスク6のディスクファ
イルを読み込む。図5(b)で、ディスク6のディスク
ファイルを読み込む。図5(c)では、二つのディスク
5およびデスク6のディスクファイルの比較を行う。こ
の結果ディスク5とディスク6のディスクファイルが一
致していないことが判明する。この場合、フォールトト
レラント手段3は、マスタディスクであるディスク5の
ディスクファイルをスレーブディスクであるディスク6
に書き込む処理をする。書き込みが正常に終了すると、
図5(d)のように二つのディスク間でディスクファイ
ルの不整合が修復される。
【0016】
【発明の効果】この発明の第1の効果は、ディスクの読
み込みで、複数ディスクにアクセスするので、従来技術
よりエラーブロックを見つけるポイントが増えたことで
ある。またエラーブロックの修復を試みるので、ディス
ク間のディスクファイルの整合性を高めることができ
る。その理由はあらかじめ複数のディスクにディスクフ
ァイルを保存するデータ構造と、エラーブロックを発見
したとき、代替えブロックに再書き込みすることによ
る。
【0017】更に、第2の効果は、ディスク間のディス
クファイルのディスクファイル不整合をアクセスの度に
チェックし、発見できることである。その理由はディス
クからのディスクファイルの読み込み時にディスク間の
ディスクファイルを比較するからである。
【図面の簡単な説明】
【図1】この発明の実施の形態の構成を示す図である。
【図2】分図(a)および分図(b)は、図1の実施の
形態のディスクファイルのエラー修復動作を示すフロー
チャートである。
【図3】分図(a)乃至分図(d)は、図2のエラーブ
ロック修復動作を説明する図である。
【図4】この実施の形態における2つ以上の複数ディス
クファイルの不整合を修復する動作を示すフローチャー
トである。
【図5】分図(a)乃至分図(d)は、ディスクファイ
ルの不整合を修復する動作を説明する図である。
【図6】従来のフォールトトレラントファイルシステム
を示す図である。
【符号の説明】
1 フォールトトレラントファイルシステム 2 ファイルシステム 3 フォールトトレラント手段 4 ディスクドライバ 5乃至N ディスク 31 データ構造生成手段 32 データ制御手段 33 データ比較手段

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 複数のディスクファイルに対する入出力
    と障害処理とを制御するフォールトトレラント手段を備
    えるフォルトトレラントファイルシステムにおいて、 2以上の多重化ディスクファイルに対して、エラーブロ
    ックとディスクファイル不整合とを修復するフォールト
    トレラント手段を有することを特徴とするフォールトト
    レラントファイルシステム。
  2. 【請求項2】 前記ディスクファイルは、複数のディス
    クそれぞれに格納されて、多重化されることを特徴とす
    る請求項1記載のフォールトトレラントファイルシステ
    ム。
  3. 【請求項3】 前記フォールトトレラント手段は、 ファイルシステムから送付されるファイル要求に基づい
    て、複数のディスクそれぞれに対するファイル要求を生
    成するデータ構造生成手段と、 前記ディスクファイルの読み出しデータが互いに整合し
    ているか否かを、データ比較で検知するデータ比較手段
    と、 前記ファイル要求に対して、ディスクドライバに送付す
    る入出力要求の生成と、前記ディスクドライバーのエラ
    ー検知に対して、エラーブロック修復と前記データ比較
    手段による不整合ディスクファイル修復とを制御するデ
    ータ制御手段と、 を有することを特徴とする請求項1記載のフォルトトレ
    ラントファイルシステム。
  4. 【請求項4】 前記エラーブロック修復は、 代替えブロックに正常ディスクファイルを再書き込みし
    て修復することを特徴とする請求項3記載のフォールト
    トレラント手段。
  5. 【請求項5】 前記不整合ディスクファイル修復は、 ディスクファイルの読み出しデータを順次に比較して検
    知することを特徴とする請求項3記載のフォールトトレ
    ラント手段。
  6. 【請求項6】 前記データ制御手段は、 前記ディスクファイルのエラーブロックおよび不整合デ
    ィスクファイルの情報を前記ファイルシステムに通知す
    ること特徴とする請求項3記載のデータ制御手段。
JP9310657A 1997-11-12 1997-11-12 フォールトトレラントファイルシステム Pending JPH11143757A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9310657A JPH11143757A (ja) 1997-11-12 1997-11-12 フォールトトレラントファイルシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9310657A JPH11143757A (ja) 1997-11-12 1997-11-12 フォールトトレラントファイルシステム

Publications (1)

Publication Number Publication Date
JPH11143757A true JPH11143757A (ja) 1999-05-28

Family

ID=18007894

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9310657A Pending JPH11143757A (ja) 1997-11-12 1997-11-12 フォールトトレラントファイルシステム

Country Status (1)

Country Link
JP (1) JPH11143757A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005100373A (ja) * 2003-09-16 2005-04-14 Hitachi Ltd 複数世代の回復スナップショットのバックアップと修復のマッピング装置
JP2006268583A (ja) * 2005-03-24 2006-10-05 Nec Corp フォルトトレラント装置
WO2009013833A1 (ja) * 2007-07-26 2009-01-29 Fujitsu Limited 記録制御装置、記録装置、記録システム及び記録制御プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005100373A (ja) * 2003-09-16 2005-04-14 Hitachi Ltd 複数世代の回復スナップショットのバックアップと修復のマッピング装置
JP4526329B2 (ja) * 2003-09-16 2010-08-18 株式会社日立製作所 複数世代の回復スナップショットに関する情報処理システム
JP2006268583A (ja) * 2005-03-24 2006-10-05 Nec Corp フォルトトレラント装置
JP4543988B2 (ja) * 2005-03-24 2010-09-15 日本電気株式会社 フォルトトレラント装置
WO2009013833A1 (ja) * 2007-07-26 2009-01-29 Fujitsu Limited 記録制御装置、記録装置、記録システム及び記録制御プログラム

Similar Documents

Publication Publication Date Title
JP3226370B2 (ja) 高可用度ディスク配列に関する改善
US6883112B2 (en) Storage device, backup and fault tolerant redundant method and computer program code of plurality storage devices
US6535994B1 (en) Method and apparatus for identifying and repairing mismatched data
US6233696B1 (en) Data verification and repair in redundant storage systems
JP3618529B2 (ja) ディスクアレイ装置
CA2089836C (en) High availability disk arrays
US7840838B2 (en) Rapid regeneration of failed disk sector in a distributed database system
US5379417A (en) System and method for ensuring write data integrity in a redundant array data storage system
US5819109A (en) System for storing pending parity update log entries, calculating new parity, updating the parity block, and removing each entry from the log when update is complete
US7353423B2 (en) System and method for improving the performance of operations requiring parity reads in a storage array system
US7120826B2 (en) Partial mirroring during expansion thereby eliminating the need to track the progress of stripes updated during expansion
JP2000207136A (ja) 複数ドライブ故障トレラントraidアルゴリズム
US6886075B2 (en) Memory device system and method for copying data in memory device system
JP2002542526A (ja) 冗長データ記憶ユニットを通じてデータをカスケードにする方法および装置
US5933592A (en) Promoting device level error to raidset level error to restore redundacy in a raid array data storage system
JPH0744326A (ja) 記憶装置システム
US20050246576A1 (en) Redundant system utilizing remote disk mirroring technique, and initialization method for remote disk mirroring for in the system
US6167485A (en) On-line data verification and repair in redundant storage systems
JP3904894B2 (ja) バックアップ管理方法およびこの方法に用いる記憶制御装置
JP3832223B2 (ja) ディスクアレイのディスク障害復旧方法
JPH09269871A (ja) ディスクアレイ装置におけるデータ再冗長化方式
US7024585B2 (en) Method, apparatus, and program for data mirroring with striped hotspare
JPH11143757A (ja) フォールトトレラントファイルシステム
EP0559488B1 (en) Handling data in a system having a processor for controlling access to a plurality of data storage disks
JP4070398B2 (ja) 多重化計算機間のデータ利用方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20001226