JP2005018757A - 超大規模ファイル・システムでのファイル・システム使用のすばやい復元 - Google Patents

超大規模ファイル・システムでのファイル・システム使用のすばやい復元 Download PDF

Info

Publication number
JP2005018757A
JP2005018757A JP2004173175A JP2004173175A JP2005018757A JP 2005018757 A JP2005018757 A JP 2005018757A JP 2004173175 A JP2004173175 A JP 2004173175A JP 2004173175 A JP2004173175 A JP 2004173175A JP 2005018757 A JP2005018757 A JP 2005018757A
Authority
JP
Japan
Prior art keywords
file
file system
restoration
restored
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004173175A
Other languages
English (en)
Other versions
JP4160933B2 (ja
Inventor
Robert J Curran
ロバート・ジェイ・キュラン
A Soodon Wayne
ウェイン・エイ・ソードン
Frank B Schmuck
フランク・ベー・シュマック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2005018757A publication Critical patent/JP2005018757A/ja
Application granted granted Critical
Publication of JP4160933B2 publication Critical patent/JP4160933B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1435Saving, restoring, recovering or retrying at system level using file system or storage system metadata
    • EFIXED CONSTRUCTIONS
    • E01CONSTRUCTION OF ROADS, RAILWAYS, OR BRIDGES
    • E01CCONSTRUCTION OF, OR SURFACES FOR, ROADS, SPORTS GROUNDS, OR THE LIKE; MACHINES OR AUXILIARY TOOLS FOR CONSTRUCTION OR REPAIR
    • E01C15/00Pavings specially adapted for footpaths, sidewalks or cycle tracks
    • EFIXED CONSTRUCTIONS
    • E01CONSTRUCTION OF ROADS, RAILWAYS, OR BRIDGES
    • E01CCONSTRUCTION OF, OR SURFACES FOR, ROADS, SPORTS GROUNDS, OR THE LIKE; MACHINES OR AUXILIARY TOOLS FOR CONSTRUCTION OR REPAIR
    • E01C13/00Pavings or foundations specially adapted for playgrounds or sports grounds; Drainage, irrigation or heating of sports grounds
    • E01C13/003Construction of, or surfacings for, rinks or tracks for roller skating, skate-boarding or the like
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • Y10S707/99953Recoverability

Abstract

【課題】ファイル・システム復元操作中に、制限付きファイル・アクセスおよび完全なファイル・アクセスの両方を可能にすることである。
【解決手段】ファイル・システム復元が、当該復元処理全体を通じての個々のファイル復元ステータスのインジケータの使用を介して、より柔軟になされる。そのようなインジケータは、たとえば、ファイルの数がほぼ数億個の範囲におよぶかもしれないような大規模ファイル・システムの復元に特に有用である。大規模システムのファイル・システム復元は比較的長時間を要するので、復元処理が実行されつつある時であっても、本発明はさまざまな程度の個々のファイル・アクセスを提供する。ファイル・システム復元時間の間は、ファイル・アクセスは、完全なものとすることができるし、またはファイルの属性への限定的なものとすることができる。最も有利なことに、本発明は、ファイル・システム復元操作中であっても、動的に駆動される(オン・デマンドの)完全なファイル・アクセスを提供することができる。
【選択図】図1

Description

本発明は、全般的には、超大規模ファイル・システムの管理を対象とする。そのようなファイル・システムは、通常は、大規模データ処理システムと共に使用される。具体的には、本発明は、ストレージ・エリア・ネットワーク(SAN)環境に存在する可能性があるデータ・ファイル・システムをすばやく復元する方法およびシステムを対象とする。そのような環境は、しばしば、分散データ処理システムと共に使用される。しかし、本発明はこれらの環境に限定はされない。
SANファイル・システムおよび低コスト・ストレージの出現によって、非常に多数のファイルを有する超大規模ファイル・システムの可能性が生み出された。実際に、数テラ・バイト(1テラ・バイト=1012バイト=1000ギガ・バイト)の容量を有するファイル・システムが、現在存在し、より大きいファイル・システムが可能である。残念ながら、バックアップ・コピーからファイル・システムを完全に復元する時間はファイル・システムのサイズに比例する。20メガ・バイト/秒のテープ速度を仮定し、テープ処理時間およびソフトウェア・オーバーヘッドを無視すると、1テラ・バイトのデータのテープからの復元は10時間以上を必要とする。顧客は、特定の関心のあるファイルをまず手作業で復元し、ファイル・システムへのアクセスを可能にするか、またはすべてのデータが復元されるまでアクセスを遅らせるかを選択できる。第1のオプションは、システム管理者が、望まれるデータを正確に識別できることをまず必要とする。というのは、そうでなければ、未復元のデータにアクセスするアプリケーションに障害が発生するからである。第2のオプションは、すべてのファイルがテープから復元されるまでの仕事の復元の遅れを伴う。これらの代替案のどちらともまったく満足できるものでない。
本発明では、本願と同時に出願された関連特許出願(POU920030006US1)明細書、表題「Parallel High Speed Backup for a Storage Area Network (SAN) FileSystem」にも見られるデータ構造が使用される。本発明では、本発明の譲受人であるInternational Business MachinesCorporationが販売する製品であり、そのpSeries製品ラインをサポートするGPFS(汎用並列ファイル・システム)に含まれる階層記憶管理機能の並列サポート態様に見られる技法も使用される。しかし、本発明では、ファイル・システムの通常の復元を依然として継続する一方で、オン・デマンドを基礎としてバックアップされたデータにアクセスする能力を提供する新しい特徴も追加される。本発明を用いると、アプリケーション(即ち、アプリケーション・プログラム)は、ファイル・システム復元処理が開始された直後であってもファイル・システムの使用を開始することができ、これによって、ファイル・システムおよび顧客データが使用不能になる時間が大幅に削減される。
本発明が使用される環境をより良く理解するために、下記の用語が、当技術分野で一般に明確に理解された概念を指すのに使用される。下に示す定義は、便宜のために、ならびにかかわる問題および提案される解決策のよりよい理解のために供給されるものであり、ファイル・システム技術の技量を有する者であれば理解するように、一般的に理解される意味からの変形を暗示することを意図したものではない。本発明は、ファイルおよびファイル・システムを取り巻く概念に密接にかかわるので、それ故、より関連する用語の少なくとも一部の短い記述を読者に与えることが有用である。より完全なリストは、本発明と同一の譲受人に譲渡された米国特許第6032216号明細書にある。この特許明細書は、参照文献として本明細書に記載されている。この特許から選択された用語の下記の用語集が提供されるが、それは、これらの用語が本発明のより良い諒解および理解を提供するという観点で最も関連するためである。
データ/ファイル・システム・データ: これは、特定のアプリケーションとの関連でのみ意味がある任意のビット列である。
ファイル: コンピュータ・アプリケーションによってアクセスできる名前付きビット列。ファイルは、長さ、修正時刻、および最終アクセス時刻などの標準属性を有する。
メタデータ: これは、ファイルの構造とファイル・システムを含むディスクの使用とを記述するために、ファイル・システム・ソフトウェアによって作成される制御構造である。このタイプのファイル・システムに適用される特定のタイプのメタデータの特徴を下で特に示すが、これには、ディレクトリ、iノード、割振りマップ、およびログが含まれる。
ディレクトリ: これは、iノードによって表される一組のデータに名前を関連付ける制御構造である。
iノード: ファイルの属性と、ファイルを構成するデータを含むディスク(または他の記憶媒体)の区域への一連のポインタとを含むデータ構造。間接ブロックによってiノードを補完することができ、即ちこれら間接ブロックは、たとえばファイルが大きい場合には、追加ポインタによって当該iノードを補完する。
割振りマップ: これは、ディスクの特定の区域(またはiノードなどの他の制御構造)が、使用中かまたは使用可能であるかどうかを示す制御構造である。これによって、ソフトウェアが、使用可能なブロックおよびiノードを新しいファイルに効率的に割り当てられるようになる。この用語は、ファイル・システム操作の全般的な理解に有用であるが、本発明の動作に関しては周辺でのみ使用される。
ログ: 障害状況での消失に対する保護のために、他のタイプのメタデータを同期状態に(即ち、矛盾がない状態に)保つために使用されるレコードの組である。ログには、複数の構造に対する関連する更新を記述する単一のレコードが含まれる。この用語は、周辺でのみ有用であるが、上で説明した代替解決策との関連で提供される。
ファイル・システム: ディスク(または他の媒体)の定義された組を管理し、また、データおよびデータ・ファイルの、一貫性のある追加、修正、および削除を実現する形で、データへのアクセスを提供する、ソフトウェア・コンポーネント。この用語は、ディスク(または他の媒体)の特定の組に含まれるデータおよびメタデータの組を記述するのにも使用される。本発明は、通常は、最も頻繁に、回転式磁気ディスク記憶システムと共に使用されるが、また、隣接するブロックに配置されたデータと共に名前によってアクセスできるいかなるデータ記憶媒体と共にでも使用可能であり、したがって、用語「ディスク」または「ディスク・ストレージ」等が本明細書で使用される場合に、記憶媒体のこのより一般的な特性が意図されている。
スナップショット: ある所定の時点でのファイル・システムの状態を取り込んだファイルまたはファイルの組。
メタデータ・コントローラ: あるファイルへのすべてのアクセス要求がそれを介して処理される、ネットワーク化されたコンピュータ・システム内のノードまたはプロセッサ(本発明の譲受人が提供するスケーラブル並列システムのpSeriesなど)。この用語は、完全を期して提供されるが、本発明の動作の理解には関連しない。
米国特許出願(弁理士整理番号POU920030006US1) 米国特許第6032216号 米国特許出願第US2002/0124013号 米国特許出願第US2002/0143734号 米国仮特許出願第60/214127号 米国特許出願第US2002/0123997号
したがって、本発明の目的は、ファイル・システム復元操作中に、制限付きファイル・アクセスおよび完全なファイル・アクセスの両方を可能にすることである。
本発明の目的はまた、できる限りファイル・システム復元中の継続的なアプリケーション・プログラム操作を可能にすることである。
本発明のもう1つの目的は、ファイル・システム・バックアップ機能およびファイル・システム復元機能の両方の柔軟性を高めることである。
本発明の更にもう1つの目的は、分散データ処理システムおよび/または並列データ処理システムでの操作の効率を高めることである。
本発明の更なる目的は、未復元状態でのみ存在するファイルの除去を可能にすることである。
本発明のまた更なる目的は、未復元状態でのみ存在するファイルのリスト(一覧表)化を可能にすることである。
本発明の目的はまた、バックアップ能力および復元能力を強化するためにファイル・システムの機能強化されたデータ構造を提供することである。
本発明のまたもう1つの目的は、本明細書で開示されるファイル・システム復元方法を実行するシステムおよびプログラムを提供することである。
本発明の更なる目的は、ファイル・バックアップ操作中、特に大ファイル・システムのバックアップ操作中に作成されるデータ構造を活用することである。
最後に、しかしこれに限定はされないのであるが、本発明の目的は、ファイル・システム復元を実行するデータ処理操作全体を通じたファイル・システムのアクセスおよび可用性を改善することである。
本発明のさまざまな実施形態によって満足される望ましい目的のリストの本明細書での詳述は、これらの目的のいずれかまたはすべてが、個々にせよまたは集合的にせよ、本発明の最も一般的な実施形態またはそのより詳細な実施形態のいずれかにおいて本質的特徴として存在していることを暗示または提案するよう意図されたものではない。
本発明の好ましい実施形態によれば、ファイル・システムにアクセスする方法が提供される。この方法は、制限された属性を有しデータを有しないファイルであって、前記ファイルが未復元状態であることの表示が設けられたファイルについて、エントリーを作成するステップと、前記ファイルについてのファイル・システム操作を可能にするステップであって、前記操作が(1)前記ファイルのファイル名をリスト化するステップと、(2)前記ファイルを除去するステップとからなるグループから選択されたステップと、を有する。この方法の重要な態様は、ファイル・システム内において実質的にプレース・キーパー(場所維持)・エントリーとなるものを作成することである。このエントリーは、未復元状態を有することをそれが表示するのと共に、この状況が「未復元」から「復元済み」に変更されたファイルに関して引き続き行う操作についての機構を提供する。
本発明のもう1つの態様によれば、ファイル・システムを復元する方法が提供される。この方法は、ファイル・システム復元処理中に、復元されるファイルごとに、ファイルの復元に続いてファイル状況インジケータ(指標)を未復元表示から復元済み表示に変更するステップを有する。この方法はまた、ファイル・システム復元処理が他のファイルに関して継続される時であっても、ファイルが復元済み状態であることを前記状況インジケータが示しているファイル、に対しての即時アクセスを可能にする更なるステップを含むことが好ましい。アプリケーション・プログラムが、未復元状態のファイルにアクセスする場合に、ファイル復元ソフトウェアにイベントが提示され、ファイル復元ソフトウェアは、即座にそして同期的にファイルを復元し、復元された状態を反映するようにインジケータを変更し、イベント「完了」を返す。このイベントが処理されつつある間、ファイル・アクセスに関するアプリケーション要求は未定状態に保持される。イベントが完了した時にファイルが成功裡に復元された場合には、アプリケーション要求が引き受けられ、なんらかの理由(たとえば、テープ不良)で復元に失敗した場合には、アプリケーション要求が拒否される。わずかな遅延を除いて、アプリケーション・プログラムは、この目的のためにファイルを復元する必要があったのだということを知らない。2002年9月5日公開の米国特許出願第US2002/0124013号(2001年6月25日出願の第09/887533号、弁理士整理番号IL920000067US2)および2002年10月3日公開の米国特許出願第US2002/0143734号(2001年6月25日出願の米国特許出願第09/887520号明細書、弁理士整理番号IL920000067US3であり、09/887533の分割出願である;この両方が、米国仮特許出願第60/214127号明細書、弁理士整理番号IL920000067US1、2000年6月26日出願に基づいて出願された)、および2002年9月5日公開の米国特許出願第US2002/0123997号(出願番号第09/887550号、弁理士整理番号IL920000068US2、2001年6月25日出願であり、米国仮特許出願第60/214127号明細書、弁理士整理番号IL920000068US1、2000年6月26日出願に基づく)に記載の方法によって、これらのイベントを提示し、同一のファイル・システムを搭載する複数のコンピュータにまたがってのイベント処理が完了するまでアプリケーション実行を遅延させる機構が提供される。本発明では、これらの機能を活用して、要求されたファイル・システムを復元する能力を提供する。ファイル・システム復元操作中にアクセスされ、復元済み状態であることを反映するように状況インジケータがセットされたファイルについて、ファイル・システム操作のすべてが可能である。このようにして、できる限り多くのファイル・アクセスが可能にされ、復元処理の持続時間全体を通じて実行される。このような方法で、ファイル・システム内のあらゆるファイルを使用する連続的なアプリケーション・プログラムの実行が、ファイル・システム・メタデータが復元されるや否や可能になる。アプリケーション実行は、要求された特定のデータがまだ復元されていない場合に、アプリケーション要求に同期してデータの「オン・デマンド」復元を要求することができる。すべてのアプリケーション・プログラムが、完全なファイル・システム復元が達成されるまで待つ必要は、もはやない。
本発明の環境および操作のよりよい理解を提供するために、上述の汎用並列ファイル・システム(GPFS)の関連部分および構造を簡単に再検討する。GPFSが、Xopenファイル・システム標準規格に準拠するファイル・システムに類似し、したがって、そのようなファイル・システムのすべてが本発明と共に使用可能であることにも留意されたい。しかし、本発明は、そのようなファイル・システムに限定はされない。一般に、ファイルが3つの基本的な部分、即ち属性、データ、および名前からなることに留意されたい。一般にこの3つの部分はさまざまなファイル・システムで異なる場所に保管される。ファイル・サイズ、作成時刻、およびアクセス許可などのファイルの属性は、ファイル・システム技術で一般にiノードと称するファイル構造に保管される。ファイル・システムごとに1つのiノード・ファイルがある。iノードには、ファイルのデータ・ブロックへのポインタ即ち、ストレージ・システム内または特定の記憶装置内の物理的位置を示すポインタも保管される。単一のファイルに、任意の量のデータ、即ち皆無から264バイト(ほとんどすべての現在使用可能なデータ処理システムでの現在の限度)までを含めることができる。ファイルの名前は、ファイル・システム・ディレクトリと称する別々の構造に保管される。ディレクトリ・エントリーによって、ユーザがファイル、ディレクトリまたはサブディレクトリに割り当てた名前が、そのファイルを保管するiノードにマッピングされる。GPFSでは、ファイルをディレクトリからすばやく区別するために、ディレクトリ・エントリーに対象タイプ・フィールドも含まれる。ディレクトリ構造によって階層名前空間が形成され、ファイルを識別するパスが定義される。ファイルは複数の名前を有することができる。ディレクトリ構造(ファイル名を含む)は、通常のファイル・システム・ファイルに保管されるが、そのデータを「通常の」データ・ブロックと区別する属性を有することに留意されたい。
図1に、ファイル・システムの原理的要素を更に具体的に示す。図示されたような通常のファイル・システムには、ディレクトリ・ツリー100、iノード・ファイル200、およびデータ300が含まれる。この3つの要素は、通常は、ファイル・システム内でファイル自体として存在する。たとえば、図1からわかるように、iノード・ファイル200には個々のレコードまたはエントリー220の集合が含まれる。ファイル・システムごとに1つだけiノード・ファイルがある。具体的に言うと、iノード・ファイルは図1の最下部に示されたものであり、参照符号200によって示される。ディレクトリ・ツリー100内のエントリーにはフィールド112などのポインタが含まれ、このフィールドにはiノード・ファイル200への単純なインデックスとして動作する整数の量が含まれることが望ましい。たとえば、フィールド112にたとえば「10876」を表す2進整数が含まれる場合に、これによってiノード・ファイル200の10876番目のエントリーが参照される。特殊なエントリーを使用して(下で説明する参照符号216を参照されたい)、ファイルをディレクトリであるとして示すことができる。このように、ディレクトリとは、通常は、保管されたファイルの名前が任意の深さのディレクトリ・ツリー内に維持されているファイルである。ディレクトリ100に関して、本発明のよりよい理解のために意味が理解されなければならない3つの用語がある。「ディレクトリ・ツリー」とは、ファイル・システムのすべてのディレクトリを含むディレクトリの集合である。「ディレクトリ」とは、ディレクトリ・ツリーの要素である特定のタイプのファイルである。ディレクトリは、ディレクトリ・ツリー内の下位の位置を占めるファイルまたはディレクトリのいずれか、であるiノードへのポインタの集合である。「ディレクトリ・エントリー」とは、ファイルまたはディレクトリを指すディレクトリ内の単一のレコードである。図1では、模範的なディレクトリ・ツリーが機能ブロック100内に示されている。模範的なディレクトリ・エントリーには、図示のように、書式120の要素が含まれるが、本発明の目的のためのディレクトリ・エントリー内容の例示については図3も参照されたい。図1には(便宜的目的のため)2レベルだけの階層が示されているが、ディレクトリの階層ツリー構造の深さは2レベルに制限されないことを理解されたい。実際、どのディレクトリ・ツリーにも数十個のレベルが存在する可能性がある。にもかかわらず、このディレクトリ・ツリーの深さは、1つのファイルだけが識別されるかアクセスされる必要がある場合における複数ディレクトリ参照の必要性に寄与している。しかし、どの場合でも、ディレクトリ・ツリーの「葉」が、ファイル名(参照符号111)をiノード・ファイル200内のエントリー220に関連付けるのに使用される。参照は、iノード・ファイル200へのポインタを提供する「iノード番号」(参照符号112)による。本明細書で考慮されるタイプのファイル・システムには、1つのiノード配列がある。本発明の好ましい実施形態では、このiノード配列はiノード・ファイル200であり、インデックスによって、配列要素がポイントされる。したがって、iノード#10876は、iノード・ファイル200の10876番目の配列要素である。通常、このポインタは、iノード・ファイル200への単純なインデックスであり、したがって、本質的に線形の形でアクセスされ、そうであることが好ましい。したがって、インデックスが10876である場合に、これは、iノード・ファイル200の10876番目のレコードまたは配列要素をポイントする。名前エントリー111を用いると、ツリーの1つ深いレベルに移動することができる。通常のファイル・システムでは、名前エントリー111によって、たとえばディレクトリまたはデータ・ファイルであるiノード#10876がポイントされる。これがディレクトリである場合には、名前の次のレベルに関して、そのディレクトリ・ファイル内を再帰的に検索する。たとえば、エントリー111が、図1に示されているように「a」であると仮定する。この場合に、「a2」のiノードに関する名前エントリーが、iノード#10876のデータから検索される。名前エントリー111によってデータがポイントされる場合には、名前検索の終りに達している。本発明では、名前エントリー111に追加フィールド113(図3参照)が含まれ、これによって、ディレクトリであるか否かが示される。ディレクトリ・ツリー構造は、別々に含まれる。というのは、POSIXによって、本発明の理解または動作のいずれにも関連しない形で同一のファイルの複数の名前が可能になるからである。
iノード番号による参照ではなく、ファイル名による個々のファイル・エントリーへの参照が可能になるという点で、ディレクトリ・ツリー100は、当該ファイル・システムのために階層的名前空間を提供する。ディレクトリの各エントリーはiノードを指す。そのiノードは、ディレクトリの場合もあり、ファイルの場合もある。iノード220は、iノード・ファイル200(上で説明した)内の位置のインジケータ(指標)であることが望ましいフィールド112内のエントリーによって決定される。iノード・ファイル200内のiノード・ファイル・エントリー220は、通常は線形リストとして実施され、そうであることが望ましい。このリストの各エントリーに複数のフィールド、即ちiノード番号212、世代番号213、個々のファイル属性214、データ・ポインタ215、最終修正日付216、およびファイルがディレクトリであるか否かを示すインジケータ・フィールド217が含まれる。本発明と関係または関連性のない他のフィールドも、通常はiノード・エントリー220内に存在する。しかし、関連出願(弁理士整理番号POU920030006US1)と共に使用するのに最も関連するフィールドは、最終修正日付を示すフィールド216である。iノード番号は、ファイル・システム内で固有である。ファイル・システムには、もはや存在しないが存在した時に同一のiノード番号を有していたあるファイルから、あるファイルを区別するのに普通使用される、世代番号213が含まれることもまた望ましい。iノード・フィールド214によって、あるファイルに関連するある種の属性が識別される。これらの属性には、最終修正日付、作成日付、ファイル・サイズ、ファイル・タイプ、読取アクセスまたは書込アクセスを示すパラメータ、さまざまなアクセス許可およびアクセス・レベル、圧縮状況、暗号化状況、隠し状況、およびネットワーク内での状況が含まれるが、これらに限定はされない。iノード・エントリー220には、それがポイントするファイルが実際にディレクトリであるかどうかを示すエントリー217も含まれる。これによって、ファイル・システム自身のための名前空間として最もよく記述されるものをこのファイルが含んでいるという事実に従って、ファイル・システム自体がこのファイルを異なる形で扱うことが可能になる。しかし、最も重要なことは、普通のiノード・エントリー220に、ファイル・システムのデータ部分300に常駐する実際のデータ310の物理的な位置を識別するのに十分な情報を含むデータ・ポインタ215が含まれるということである。
具体的に本発明の構造および操作に関して、問題のファイルの復元状況を示すフィールドがiノード・エントリーに含まれる。具体的に言うと、対象のファイルの属性が復元済み状態であるか否かの表示が図1のフィールド218によって与えられる。同様に、対象のファイルのデータが復元済み状態であるか否かの表示が図1のフィールド219によって与えられる。下で具体的に説明するように、本発明では、ファイル・システム復元操作中に、あるファイルの属性が、当該ファイル内のデータが利用可能になるのに先立って使用可能にされるという状況が企図されている。したがって、別個のフィールド218および219が、このために設けられる。この特徴が必要とされないかまたは望まれない場合には、本発明の異なる実施形態によって、そのようなフィールドを1つだけ用いることで、属性およびデータの両方に適用されるような復元状態を示すことができる。
しかし、一般にファイル・システムの完全な復元には、ファイル・システム内のすべてのファイルのファイル名、属性、およびデータを復元することが含まれる。名前がないファイルにはアクセスすることができない。しかし、障害の深刻さが軽い情況において、ファイルの属性またはデータが欠けている場合には、ファイル・システムまたはアプリケーション・プログラムは、通常、ファイルへのアクセスを試みる場合にエラー表示を受け取る。
本発明によって、ファイルの名前、属性、およびデータを独立に復元する手段が提供される。属性もデータもないファイルを作成するのに使用され、また未復元状態のファイルを反映するファイル・システム、へのインターフェースが本発明によって用いられる。未復元状態のファイルに対して許容される対策は、その名前をリスト化すること、またはファイル・システムからそのファイルを除去することだけである。ファイル・システムは未復元ファイルを識別することができるので、したがって、すべてのファイルが復元される前にアプリケーション・プログラムが実行を開始できるようにすることができる。未復元ファイルにアクセスするプログラムは、ファイルの属性またはデータを復元することができるデータ管理アプリケーションに対するイベントを呼び出すか、またはファイルに現在アクセスできないことを示す戻りコードを受け取る。失敗状況に対処して、より早期の復元のためにより高い優先順位のファイルを位置付けるように、復元プログラムがスケジューリングを再順序付けできるようにすることは可能ではあるが、実際には、テープを読み取ることができないであるとかテープが使用可能でないであるとかの、比較的単純なエラー・シナリオから失敗が生じると通常は思われている。
すばやいファイル・システム復元を実施する多くの方法があり、それらの方法によって、ユーザ・アプリケーションを一時停止するという潜在的コストをかけてすばやくアプリケーションを再開始することと、完全な復元が完了するのにより長い時間をかけることとの間のトレードオフが示される。
当初に、新しい空のファイル・システムが作成される。次に、同時に出願された関連出願の中で引用されており、また特に、後述の[関連するバックアップ処理]以下で述べられている、ファイル・システム・バックアップ操作、の最中にたとえば作成されたシャドウ・ファイル(図2の参照符号500)、を使用してすべてのディレクトリ・エントリーが復元される。次に、ファイルの鍵になる属性が、バックアップ・システムから、バックアップされたデータを有する各iノードに復元される。この属性には、サイズ、所有者、およびアクセス許可が含まれる。データは、このステップの一部としては復元されず、ファイルは未復元としてマークされる。アプリケーション・アクセスは、復元のこの時点が完了した後に限って許可される。これには、リストとディレクトリ・ルックアップとが含まれる。名前空間ファイル500の使用によって、名前空間全体が並列に復元されるのが可能となる。このようにして、ファイル・システムは、たとえ分散システムにまたがっていたとしても、ユーザ・アプリケーションから使用可能となる。未復元のファイル属性またはファイル・データにアクセスするアプリケーションは、要求されたファイルが復元されるまで一時的に停止される。しかし、アプリケーション・プログラムは未復元ファイルを除去することを許可され、それを行うために待つ必要はない。そのファイルは削除済みとしてマークされ、復元するのは避けられる。
すべてのファイル属性およびデータを復元するために1つまたは複数の復元処理が開始される。「クイック(迅速な)」復元処理によって、ファイルの属性だけ(データではなく)を復元することができる。複数のクイック復元処理を実行して、ファイル属性を並列に復元できるようにすることができる。ファイルの属性だけのクイック復元によって、許可検査を行うことができると同時に、待ち時間なしでファイルのstat()をユーザが行えるようになる。stat()は、Xopenファイル・システム標準規格によって指定された、ファイルの属性を返すがデータは返さないオペレーティング・システム呼出しである。ファイルのデータを復元するために、1つまたは複数の「フル(完全な)」復元処理も実行しなければならない。この復元は、iノード順またはファイルがオフライン・テープに保管された順序で行うことができる。追加の処理を作成して、大きいファイルを並列に復元することもできる。
個々のファイルの復元は、ほとんど同様の形式で行われる。復元されるファイルをユーザが識別する。各ファイルが名前空間に挿入される(まだ挿入されていない場合に)。既存のデータまたは属性が削除され、ファイルが未復元状態として表示されるようにマークされる。ファイル・システムはまた、「フル」復元処理がファイルへのユーザのアクセスとは並列に実行されるようにこれをスケジュールすることが好ましい。
本発明には、GPFSに存在する他の機能の使用と一緒に、完全に新しいプログラム実施される機能が含まれる。この機能は、本明細書の他の場所で参照した、2002年9月5日公開の米国特許出願第US2002/0124013号(2001年6月25日出願の出願番号第09/887533号、弁理士整理番号IL920000067US2)および2002年10月3日公開の米国特許出願第US2002/0143734号(2001年6月25日出願の米国特許出願第09/887520号明細書、弁理士整理番号IL920000067US2であり、09/887533の分割出願であり、この両者が米国仮特許出願第60/214127号明細書、弁理士整理番号IL920000067US1、2000年6月26日出願に基づいて出願された)、および2002年9月5日公開の米国特許出願第US2002/0123997号(出願番号第09/887550号、弁理士整理番号IL920000068US2、出願2001年6月25日であり、米国仮特許出願第60/214127号明細書、弁理士整理番号IL920000068US1、2000年6月26日出願に基づく)に記載されている。これらの公開された特許出願によって、同一のファイル・システムを搭載する複数のノードにまたがって外部データ管理アプリケーションにイベントを同期的に提示する機構が指定される。これは、アプリケーション呼出しによってトリガされ、アプリケーションは、イベントが処理されるまで一時停止される。ここでの(処理の)流れは、オン・デマンド復元アプリケーションが、これらのイベントを処理するために登録されたGPFSクラスタ内のノードで開始されることである。この特定のイベントに関して複数のアプリケーションが存在する可能性がある。この処理フローは、クラスタのノードAで操作するアプリケーションが、まだ復元されていないファイルの読取を試みることである。ノードAのファイル・システムはそのファイルが「未復元」であることを認識し、またオン・デマンド復元アプリケーションがノードZで登録されていることを知る。ノードAのファイル・システムは、ノードZにイベントを送り、元のアプリケーションの処理を一時停止させる。ノードZは、そのイベントをオン・デマンド復元アプリケーションに提示し、そのオン・デマンド復元アプリケーションは、バックアップ・コピーを読み取り、そのデータをファイル・システムに書き込み、そしてそのファイルを「復元済み」としてマークする。その後、オン・デマンド復元アプリケーションはノードZでのイベントを完了させ、そのノードZは、アプリケーションを再開するようにノードAに通知し、したがって読取要求を満足する。
本明細書で提供されるインターフェースには、属性もデータも持たない、指定されたiノード番号を有する一組の名前付きファイルを作成する能力が含まれる。これらのファイルのスケルトン(骨組み)は、そのステータスが未復元として示される状態において作成される。復元なしのこれらのファイルに対して行うことができる対策は、その名前のリスト化またはそのファイルの削除だけである。他の操作によって、そのファイルを復元できるデータ管理アプリケーションへイベントが呼び出されるか、または、そのファイルにアクセスできないことを示す戻りコードの生成が引き起こされる。
このインターフェースは、次のように具体的に説明することができる。即ち呼出しの第1組では、メタデータ(属性)を、iノード番号によって指定されるiノードに書き込む。インターフェース・フォーマットは、次の形である。
Mmwrite_inode (atttribute_structure, inode_num)
ここで、属性構造体には、下記のものを明示的に含んだシャドウ・ファイル、と共に保存されるデータが含まれる
・サイズ
・許可
・所有者
・未復元ビット
・最終修正および最終アクセスの時刻
・タイプ(通常のファイル、ディレクトリ)

および
Mmwrite_dir (dir_name, entry_name,inode_num, type)
これは、dir_nameによって指定されるディレクトリに、名前entry_nameを有し、inode_numによって指定されるiノード番号を指し、typeによって指定されるタイプ(ディレクトリ、ファイル、またはリンク)を有するエントリーを書き込むというセマンティクス(意味)を有する。
本発明に関連する既存の機能に、ファイル・システムの名前空間全体を含むファイル名のリストをすばやく生成する能力が含まれる。これは、本発明と同時に出願された関連特許出願(弁理士整理番号POU920030006US1)に記載されている。その中で記載されている名前空間ファイルは、必要とされる訳ではないが、復元処理を高速化するように働く。本発明はまた、前に提示した特許出願(2002年9月5日公開の米国特許出願第US2002/0124013号(2001年6月25日出願の出願番号第09/887533号、弁理士整理番号IL920000067US2)および2002年10月3日公開の米国特許出願第US2002/0143734号(2001年6月25日出願の米国特許出願第09/887520号明細書、弁理士整理番号IL920000067US2であり、09/887533の分割出願である;この両者は、米国仮特許出願第60/214127号明細書、弁理士整理番号IL920000067US1、2000年6月26日出願に基づいて出願された)、および2002年9月5日公開の米国特許出願第US2002/0123997号(出願番号第09/887550号、弁理士整理番号IL920000068US2、出願2001年6月25日であり、米国仮特許出願第60/214127号明細書、弁理士整理番号IL920000068US1、2000年6月26日出願に基づく))に記載されているように、並列システムから階層ストレージ・マネージャにイベントを提示する能力を用いることも望ましい。本発明によって、2つの前述の特許出願に記載のデータ管理アプリケーション・プログラム・インターフェース(DMAPI)というインターフェースを介して提示される新しいイベント・クラスも定義される。このイベント・クラスは、アクセスのタイプ(ファイル・データ・アクセスまたはファイル属性アクセス)を反映しており、その結果、データ管理アプリケーションは、あるイベントを失敗させることを可能にするポリシーを持つように構成される。データ管理アプリケーションが、あるイベントを失敗させることを選択する場合には、そのアプリケーションは障害を受け取る。データ管理アプリケーションが、そのイベントに成功裡に応答する場合には、アプリケーション要求が再試行される。データ管理アプリケーションからの期待される応答は、データ管理アプリケーションがファイルに関連するデータを復元し、ファイル属性(所有者、許可など)を復元し、ファイルが未復元として印付けされる特殊な状態をクリアするというものである。これによって、アプリケーションによってより遅い応答がもたらされるが、リアル・タイムに敏感でないいかなるアプリケーションについてもアプリケーション障害がもたらされることはない。このアプリケーション低速化の頻度は、データ管理イベントまたは通常の復元処理のいずれかによって復元済み状態にステージ・バックされたファイルが増えるにつれて減る。ファイルは復元するのに先立って除去できることと、データ管理アプリケーションがその状態を認識し、削除されたファイルは復元しないこととに留意されたい。
[関連するバックアップ処理]
上で述べたように、本発明の好ましい実施形態では、関連特許出願(弁理士整理番号POU920030006US1)により詳細に記載されているように、ファイル・システム・バックアップ処理の一部として作成されるテーブルが利用される。そのテーブルの構成および関連特許での使用に注意を向ける。
(1)関連発明では、iノード・ファイル200がiノードによるバックアップとほとんど同様の方法で読み取られ、変更されたiノードのリスト400(図2参照)が生成される。これによって、バックアップ判断基準を満たすiノードのリストがもたらされる。しかし、iノードによるバックアップとは異なり、関連発明では、iノード番号を手掛かりとして使用するバックアップは行われない。
(2)関連発明では追加ステップが使用され、この追加ステップでは、ディレクトリ名前空間100が読み取られて、ファイル・システム内の各ファイルの名前が、それに対応するiノード番号と共に含まれた、ファイル名のテーブル500(図2参照)を生成する。ディレクトリを読み取る時に、関連発明では、図3に示すように、ディレクトリ・エントリーにより新たに供給される対象タイプ・フィールド113が使用される。従来のファイル・システムでは、対象がディレクトリまたはファイルであるか否かを示すディレクトリ・エントリー内のインジケータが保持されない。その情報は、一般にiノード・ファイル内だけに保持され、したがってiノードの読取りが必要である。それ故、関連発明の動作では、すべてのアクティブiノードを読み取る必要なしにサブディレクトリを識別できるようにするためにフィールド113が提供され、このようにして関連方法の主要な長所の1つがもたらされる。ディレクトリ・スキャンの結果は、ファイル・システムに現在存在するすべてのファイルについての名前とiノード番号とを有するテーブル500である。このスキャンは、現在のアクティブなファイル・システムかまたはファイル・システムのスナップショットかのいずれかに対して行われる。
(3)関連発明では、結果として得られるシャドウ名前空間テーブル500を、iノード番号によってソートする。これによって名前空間テーブル500をiノード・リスト400と簡単にマージできるようになり、これによるテーブルによって、バックアップされるファイルを指すファイル名のリストが作成される。
(4)結果として得られるマージされたテーブルの構造および内容は、ファイルの数と各ファイルのサイズとに基づいてマージされたテーブルを等しい部分に分割するための、そしてその後、ファイル・システム(たとえばGPFS)の複数のノードにまたがって並列にバックアップを実行する複数の並列バックアップ・ジョブ「ワーカー・スレッド」を呼び出すための、付加的な能力を関連発明に提供する。テーブルの「等しい」部分への分割は、各ファイルに必要な時間を推定することによって行われる。時間推定は、下記の計算に基づくことが望ましい(しかし、この計算の正確な式によって決定されるものではないことに留意されたい)。
時間=基礎時間+(時間/バイト)*(バイト数)
ここで、基礎時間とは、1バイトのファイルをバックアップするのに必要な推定時間であり、時間/バイトとは、追加のバイトをバックアップするのに必要な増分時間の推定値である。関連発明のこの態様は、そうあることが望ましいが、任意選択的なものである。
(5)バックアップが、複数のバックアップ・リポジトリ(集積場所)にまたがって分散される場合には、各ファイルを、毎回同一のリポジトリに送ることが望ましい。ベース・バックアップで、ファイル名前空間がリポジトリごとのほぼ等しい部分に分割され、ファイルは次のベース・バックアップまでそのリポジトリに関連付けられたままになる。このマッピングが元々の名前空間テーブルに追加されることが望ましい。関連発明のこの態様は、そうあることが望ましいが、また任意選択的なものでもある。区分化は、指定された基礎バックアップで任意に実行される。n個のリポジトリがある場合に、シャドウ・ファイルは、上のエントリー(4)で指定されたものとほぼ同一の負荷のn個の部分に分割される。その後、m個のワーカー・スレッドを使用してn個のリポジトリにデータが移動されるが、ここでmはnの倍数であるため、理想的には、各リポジトリが所望の時間のうちにバックアップを完了できるようになる。
(6)ファイル名からバックアップ・リポジトリへのマッピングは、バックアップ作業負荷を再平衡化できるように変更されることが望ましい。マッピングが変更される時に、ファイルの既存のバックアップ版は新しいリポジトリに移動されることが望ましいが、これは必要という訳ではない。関連発明のこの態様は、そうあることが望ましいが、任意選択的なものでもある。
(7)名前空間テーブルが、次のバックアップでの使用のために保存される。現在のバックアップの名前空間を前のバックアップと比較することによって、削除されたファイルと名前を変更されたファイルとが簡単に検出され、標準バックアップ・ポリシーに従って正しいバックアップ対策が行われる。関連発明のこの態様は、そうあることが望ましいが、任意選択的なものでもあり、特に関連発明をその最も広い範囲で検討する時にはそうである。
上記から、上で説明した方法およびシステムを介して本発明の目的が達成されることを諒解されたい。具体的に言うと、本発明によって、復元処理自体の間にファイル・アクセスが許可されるという点で、はるかに柔軟なファイル・システム復元操作がもたらされることがわかる。更に、許可されるファイル・アクセスの程度もまたより柔軟にでき、すべての必要とされることがファイルの属性へのアクセスだけである場合には特にそうである。また、ファイル・システム復元の柔軟性は、関連特許に開示したように、ファイル・システム・バックアップ操作中に作成される名前空間テーブルを使用することを介して機能強化されることに留意されたい。ファイル・システム復元の柔軟性は、ファイル復元処理中に行われるアクセス要求に応答してファイル復元の順序を修正できるという意味においても改善される。
ある好ましい実施形態に従って本発明を詳細に説明したが、多数の修正および変更を当業者が行うことができる。したがって、特許請求の範囲の意図するところは、本発明の真の趣旨および範囲に適合するようにそのような修正および変更のすべてをカバーすることである。
本発明によって活用されるファイル・システム構造を示すブロック図である。 データ構造記述の大きいブロックの検索を可能にするような、またバックアップ・タスクを複数の独立の動作に区分化することを可能にするような、形態にて現在使用可能なすばやく効率的なバックアップ操作、と共に用いることができる2つの追加構造体の構造を示すブロック図である。 ファイルとディレクトリ・エントリーまたはサブディレクトリ・エントリーとを区別するためにファイル・システム・ディレクトリ内で使用可能な構造を示すブロック図である。
符号の説明
100 ディレクトリ・ツリー
111 ファイル名
112 iノード番号
200 iノード・ファイル
212 iノード番号
213 世代番号
214 個々のファイル属性
215 データ・ポインタ
216 最終修正日付
217 インジケータ・フィールド
220 レコードまたはエントリー
300 データ
310 データ
400 リスト
500 名前空間ファイル

Claims (34)

  1. ファイル・システムにアクセスする方法であって、
    限定された属性を持ち、データを持たないファイルであって、前記ファイルのために前記ファイルが未復元状態であるとの表示が提供される、ファイルのためのエントリーを作成するステップと、
    前記ファイルについてファイル・システム操作を許可するステップであって、前記操作が、(1)いかなる上記のようなファイルについてもファイル名をリスト化するステップと、(2)いかなる上記のようなファイルをも除去するステップとからなるグループの中から選択される、ステップと
    を有する方法。
  2. 前記アクセスが、前記ファイル・システムについての復元操作中に行われる、請求項1に記載の方法。
  3. 未復元状態表示を有する前記ファイルを復元するステップと、復元済みステータスを反映するために前記表示を変更するステップと、を更に含む、請求項1に記載の方法。
  4. 前記復元中に、復元されるファイルごとに、前記ファイル復元に引き続いてファイル・ステータス・インジケータを未復元表示から復元済み表示に変更するステップ、を更に有する、ファイル・システムを復元する方法。
  5. ファイルへのアクセスを許可するステップであって、前記ファイルのために前記ファイルが復元済み状態であることを前記ステータス・インジケータが示す、ステップを更に含む、請求項4に記載の方法。
  6. ファイルへのアクセスを、前記ファイルが復元されるまで一時的に中断するステップであって、前記ファイルのために前記ファイルが未復元状態であることを前記状況インジケータが示す、ステップを更に含む、請求項4に記載の方法。
  7. ファイル・システムにアクセスする方法であって、
    属性もデータも持たないファイルのためのエントリーを作成するステップであって、前記ファイルのために前記ファイルが未復元状態であることの表示が提供される、ステップと、
    前記ファイルについてのファイル名をリスト化するステップと
    を有する方法。
  8. ファイル・システムにアクセスする方法であって、
    属性もデータも持たないファイルのためのエントリーを作成するステップであって、前記ファイルのために前記ファイルが未復元状態であることの表示が提供されるステップと、
    前記ファイルに割り当てられたファイル名を除去するステップと
    を有する方法。
  9. ファイル・システムにアクセスする方法であって、
    前記ファイル・システムの復元中に、まだ復元されていないとの表示を有する前記システム、の中のファイルに向けられたアクセスに際して、前記ファイルを復元し、復元済みステータスを反映するように前記表示を変更する、ステップ
    を有する方法。
  10. 前記ファイル・システムの前記復元中に前記ファイルにアクセスするステップ、を更に含む、請求項9に記載の方法。
  11. ファイル・システムにアクセスする方法であって、前記ファイル・システムの復元中に、まだ復元されていないとの表示を有する前記システム、の中のファイルに向けられたアクセスに際して、前記ファイルを前記ファイル・システムから除去し、前記ファイルの復元を省略するステップ、を含む方法。
  12. ファイル・システムにアクセスする方法であって、前記ファイル・システムの復元中に、まだ復元されていないとの表示を有する前記システム、の中のファイルに向けられたアクセスに際して、スケジュールされるファイル・システム復元の優先順位を調整して、その結果、前記アクセスされるファイルが、前記スケジュールされる順序内でより早期に復元されるようになる、ステップを有する方法。
  13. ファイル・システムを復元する方法であって、
    空のファイル・システムであって、その中で、ファイル属性とファイル・データのいずれも復元済みとして示されていないということを示すようにファイル・システムiノードがマークされている、ファイル・システムを作成するステップと、
    前記ファイル・システムについての名前空間を初期化するステップと、
    前記ファイル・システムについてのルート・ディレクトリを復元するステップと、
    前記ファイル・システム内の少なくとも1つのファイルを復元し、前記ファイルの属性およびデータが復元済みであるとの表示を提供するステップと
    を有する方法。
  14. 前記ファイル復元の間に前記ファイルにアクセスするステップを更に有する、請求項13に記載の方法。
  15. 前記ファイルのデータが復元されるまで、前記ファイル・システム内の前記ファイルへのアクセスを延期するステップを更に含む、請求項14に記載の方法。
  16. ファイル・システムを復元する方法であって、
    空のファイル・システムであって、その中で、ファイル属性とファイル・データのいずれも復元済みとして示されていないということを示すようにファイル・システムiノードがマークされている、ファイル・システムを作成するステップと、
    前記ファイル・システムについての名前空間を初期化するステップと、
    すべての前記ファイル・システムについてファイル・システム・ディレクトリ情報を復元するステップと、
    前記ファイル・システム内の少なくとも1つのファイルを復元し、前記ファイルの属性およびデータが復元済みであることの表示を提供するステップと、
    前記ファイル復元の間に前記ファイルにアクセスするステップと
    を有する方法。
  17. 前記ファイル・システム・ディレクトリ情報の前記復元が再帰的に実行される、請求項16に記載の方法。
  18. ファイル・システムを復元する方法であって、
    空のファイル・システムであって、その中で、ファイル属性とファイル・データのいずれも復元済みとして示されていないということを示すようにファイル・システムiノードがマークされている、ファイル・システムを作成するステップと、
    以前に作成され、関連するファイル名およびiノード番号を含んだテーブル、を使用して前記ファイル・システムを復元するステップと
    を有する方法。
  19. 前記テーブルが、異なるデータ処理ノードによってばらばらの部分で処理され、これによって前記復元が並列に実行される、請求項18に記載の方法。
  20. 前記ファイル・システム復元を実行するために少なくとも1つの他のプロセスを作成するステップを更に含む、請求項18に記載の方法。
  21. ファイル・システムを復元する方法であって、
    空のファイル・システムであって、その中で、ファイル属性とファイル・データのいずれも復元済みとして示されていないということを示すようにファイル・システムiノードがマークされている、ファイル・システムを作成するステップと、
    前記ファイル・システム内の少なくとも1つのファイルを、前記ファイルについての属性は復元されるが前記ファイルについてのデータは即座には復元されないという形で復元するステップと
    を有する方法。
  22. アプリケーション・プログラムが、前記ファイルのデータ内容ではなく前記ファイルの属性を確認するために前記ファイルにアクセスするステップ、を更に含む、請求項21に記載の方法。
  23. 前記ファイルのデータが、前記ファイルの属性の復元の後に引き続いて復元される、請求項21に記載の方法。
  24. ファイル・システムを復元する方法であって、
    空のファイル・システムであって、その中で、ファイル属性とファイル・データのいずれも復元済みとして示されないということを示すようにファイル・システムiノードがマークされている、ファイル・システムを作成するステップと、
    以前に作成され、関連するファイル名およびiノード番号を含んだテーブルを使用して前記ファイル・システム内の少なくとも1つのファイルを復元するステップと
    を含む方法。
  25. ファイル復元が、前記ファイル・システム内の前記ファイルのすべてについて実行される、請求項24に記載の方法。
  26. ファイル復元が、前記ファイル・システム内の複数のファイルについて実行される、請求項24に記載の方法。
  27. 前記ファイル復元が、前記以前に作成されたテーブルで指定される順序にて行われる、請求項25に記載の方法。
  28. 前記ファイル復元が、別の媒体に所与の順序で保管されたファイルから行われ、前記復元が、前記別の媒体に存在する前記順序に基づいた順にて行われる、請求項27に記載の方法。
  29. 前記媒体がテープである、請求項28に記載の方法。
  30. 前記テーブルが、以前に実行されたファイル・システム・バックアップ操作にて生成されたものである、請求項24に記載の方法。
  31. ファイル・システム復元のための、プログラム手段を持った計算機可読媒体上に保管されたコンピュータ・プログラムであって、前記プログラム手段が、(1)属性もデータも持たないファイルであって、前記ファイルのために前記ファイルが未復元状態であるとの表示が提供される、ファイルのエントリーを作成するためのものであり、また、(2)前記ファイルに対するファイル・システム操作を許可するためのものであって、前記操作が、(a)前記ファイルについてのファイル名をリスト化するステップと、(b)前記ファイルを除去するステップとからなるグループから選択されるものである、コンピュータ・プログラム。
  32. ファイル・システム復元のための、プログラム手段を持った計算機可読媒体上に保管されたコンピュータ・プログラムであって、前記プログラム手段が、前記復元中に、復元されるファイルごとに、前記ファイルの復元に引き続き、ファイル状況インジケータを未復元表示から復元済み表示に変更するステップを実行するためのものである、コンピュータ・プログラム。
  33. データ処理システムであって、
    中央処理装置と、
    前記中央処理装置による実行のためにデータおよびプログラムを保管するランダム・アクセス・メモリと、
    不揮発性ストレージ・デバイスと、
    ファイル・システム復元のためのプログラム手段であって、前記プログラム手段が計算機可読媒体上に保管され、前記プログラム手段が、(1)属性もデータも持たないファイルであって、前記ファイルのために前記ファイルが未復元状態であるとの表示が提供される、ファイルのエントリーを作成するための手段と、(2)前記ファイルに対するファイル・システム操作を許可する手段とを含み、前記操作が、(a)前記ファイルのファイル名をリスト化するステップと、(b)前記ファイルを除去するステップとからなるグループから選択されるものである、プログラム手段と
    を有するデータ処理システム。
  34. データ処理システムであって、
    中央処理装置と、
    前記中央処理装置による実行のためにデータおよびプログラムを保管するランダム・アクセス・メモリと、
    不揮発性ストレージ・デバイスと、
    ファイル・システム復元のためのプログラム手段であって、計算機可読媒体上に保管され、前記復元中に、復元されるファイルごとに、前記ファイル復元に引き続き、ファイル・ステータス・インジケータを未復元表示から復元済み表示に変更するステップを実行する、プログラム手段と
    を有するデータ処理システム。
JP2004173175A 2003-06-24 2004-06-10 超大規模ファイル・システムでのファイル・システム使用のすばやい復元 Expired - Fee Related JP4160933B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/602,157 US7234077B2 (en) 2003-06-24 2003-06-24 Rapid restoration of file system usage in very large file systems

Publications (2)

Publication Number Publication Date
JP2005018757A true JP2005018757A (ja) 2005-01-20
JP4160933B2 JP4160933B2 (ja) 2008-10-08

Family

ID=33539493

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004173175A Expired - Fee Related JP4160933B2 (ja) 2003-06-24 2004-06-10 超大規模ファイル・システムでのファイル・システム使用のすばやい復元

Country Status (3)

Country Link
US (1) US7234077B2 (ja)
JP (1) JP4160933B2 (ja)
KR (1) KR100622801B1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007242018A (ja) * 2006-03-06 2007-09-20 Hewlett-Packard Development Co Lp 分散データストレージシステム
JP2009522677A (ja) * 2006-01-05 2009-06-11 インターナショナル・ビジネス・マシーンズ・コーポレーション ノードの番号付けによるファイル・システムのダンプ/復元のための方法、システム、およびデバイス
JP2014089747A (ja) * 2013-12-26 2014-05-15 Hitachi Ltd 情報処理システムにおける障害復旧方法、及び情報処理システム
JP2016038784A (ja) * 2014-08-08 2016-03-22 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報処理装置、情報処理システム、バックアップ方法、およびプログラム
JP2016045869A (ja) * 2014-08-26 2016-04-04 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation データの復旧方法、プログラムおよびデータ処理システム

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7430570B1 (en) * 2003-04-28 2008-09-30 Ibrix, Inc. Shadow directory structure in a distributed segmented file system
US7555504B2 (en) * 2003-09-23 2009-06-30 Emc Corporation Maintenance of a file version set including read-only and read-write snapshot copies of a production file
US7096331B1 (en) * 2003-09-29 2006-08-22 Emc Corporation System and method for managing data associated with copying and replication procedures in a data storage environment
US8127095B1 (en) * 2003-12-31 2012-02-28 Symantec Operating Corporation Restore mechanism for a multi-class file system
US8825591B1 (en) * 2003-12-31 2014-09-02 Symantec Operating Corporation Dynamic storage mechanism
US7908302B1 (en) * 2004-09-17 2011-03-15 Symantec Operating Corporation In-place splitting and merging of files
US7698451B2 (en) 2005-03-09 2010-04-13 Vudu, Inc. Method and apparatus for instant playback of a movie title
US7937379B2 (en) 2005-03-09 2011-05-03 Vudu, Inc. Fragmentation of a file for instant access
US20080022343A1 (en) 2006-07-24 2008-01-24 Vvond, Inc. Multiple audio streams
US8219635B2 (en) 2005-03-09 2012-07-10 Vudu, Inc. Continuous data feeding in a distributed environment
US8904463B2 (en) 2005-03-09 2014-12-02 Vudu, Inc. Live video broadcasting on distributed networks
US7191215B2 (en) 2005-03-09 2007-03-13 Marquee, Inc. Method and system for providing instantaneous media-on-demand services by transmitting contents in pieces from client machines
US9176955B2 (en) 2005-03-09 2015-11-03 Vvond, Inc. Method and apparatus for sharing media files among network nodes
US7461071B2 (en) 2005-04-04 2008-12-02 Younite, Inc. Distributed management framework for personal attributes
US7657579B2 (en) * 2005-04-14 2010-02-02 Emc Corporation Traversing data in a repeatable manner
US20080065637A1 (en) * 2005-04-14 2008-03-13 Emc Corporation Locating last processed data
US20080065663A1 (en) * 2005-04-14 2008-03-13 Emc Corporation Reestablishing process context
US8099511B1 (en) 2005-06-11 2012-01-17 Vudu, Inc. Instantaneous media-on-demand
US20100036840A1 (en) * 2005-09-09 2010-02-11 Pitts William M Presentation of Search Results
US8838466B2 (en) * 2005-12-02 2014-09-16 Guard Insurance Group System and method to track the status, physical location, and logical location of workflow objects in a workflow cycle
US7650341B1 (en) * 2005-12-23 2010-01-19 Hewlett-Packard Development Company, L.P. Data backup/recovery
US8296812B1 (en) 2006-09-01 2012-10-23 Vudu, Inc. Streaming video using erasure encoding
JP5008991B2 (ja) * 2007-01-24 2012-08-22 株式会社日立製作所 データのリカバリを制御する装置及び方法
US7577803B2 (en) * 2007-02-16 2009-08-18 Seagate Technology Llc Near instantaneous backup and restore of disc partitions
US8463813B2 (en) * 2007-04-12 2013-06-11 Younite, Inc. Individualized data sharing
US8818936B1 (en) 2007-06-29 2014-08-26 Emc Corporation Methods, systems, and computer program products for processing read requests received during a protected restore operation
US8321482B2 (en) * 2008-04-28 2012-11-27 Microsoft Corporation Selectively modifying files of a container file
US8112464B2 (en) 2008-04-28 2012-02-07 Microsoft Corporation On-demand access to container file directories
US8037088B2 (en) * 2008-12-22 2011-10-11 Oracle International Corporation Change management
US8392386B2 (en) 2009-08-05 2013-03-05 International Business Machines Corporation Tracking file contents
US9256598B1 (en) 2009-08-19 2016-02-09 Emc Corporation Systems, methods, and computer readable media for copy-on-demand optimization for large writes
US8281181B2 (en) * 2009-09-30 2012-10-02 Cleversafe, Inc. Method and apparatus for selectively active dispersed storage memory device utilization
US8606751B1 (en) * 2009-12-21 2013-12-10 Emc Corporation System and method for backup by inode number
US8204863B2 (en) 2009-12-21 2012-06-19 International Business Machines Corporation Multi-phase file system restore with selective on-demand data availability
US8548959B2 (en) * 2010-11-29 2013-10-01 Ca, Inc. System and method for minimizing data recovery window
US8868502B2 (en) * 2011-01-14 2014-10-21 Apple Inc. Organizing versioning according to permissions
US8856591B2 (en) 2011-06-14 2014-10-07 Ca, Inc. System and method for data disaster recovery
CN102831029B (zh) * 2011-06-14 2017-05-10 中兴通讯股份有限公司 一种网元升级回退的实现方法及系统
US8671075B1 (en) 2011-06-30 2014-03-11 Emc Corporation Change tracking indices in virtual machines
US8849769B1 (en) 2011-06-30 2014-09-30 Emc Corporation Virtual machine file level recovery
US9158632B1 (en) 2011-06-30 2015-10-13 Emc Corporation Efficient file browsing using key value databases for virtual backups
US8949829B1 (en) 2011-06-30 2015-02-03 Emc Corporation Virtual machine disaster recovery
US8849777B1 (en) * 2011-06-30 2014-09-30 Emc Corporation File deletion detection in key value databases for virtual backups
US9229951B1 (en) 2011-06-30 2016-01-05 Emc Corporation Key value databases for virtual backups
US8843443B1 (en) 2011-06-30 2014-09-23 Emc Corporation Efficient backup of virtual data
US9311327B1 (en) 2011-06-30 2016-04-12 Emc Corporation Updating key value databases for virtual backups
WO2013057764A1 (en) * 2011-10-19 2013-04-25 Hitachi, Ltd. Storage system
US8595189B2 (en) * 2012-03-14 2013-11-26 Symantec Corporation Method and system for implementing fast incremental backups
US8639665B2 (en) 2012-04-04 2014-01-28 International Business Machines Corporation Hybrid backup and restore of very large file system using metadata image backup and traditional backup
US8832365B1 (en) 2012-04-20 2014-09-09 Kip Cr P1 Lp System, method and computer program product for a self-describing tape that maintains metadata of a non-tape file system
US9563365B2 (en) 2012-04-30 2017-02-07 Kip Cr P1 Lp System and method for using a memory buffer to stream data from a tape to multiple clients
US8977827B1 (en) 2012-05-31 2015-03-10 Kip Cr P1 Lp System, method and computer program product for recovering stub files
US8805789B2 (en) 2012-09-12 2014-08-12 International Business Machines Corporation Using a metadata image of a file system and archive instance to backup data objects in the file system
US8914334B2 (en) 2012-09-12 2014-12-16 International Business Machines Corporation Using a metadata image of a file system and archive instance to restore data objects in the file system
US9430333B2 (en) * 2013-03-14 2016-08-30 Microsoft Technology Licensing, Llc Recovery of application from snapshot
US10127118B1 (en) * 2013-12-27 2018-11-13 EMC IP Holding Company LLC Method and system for sharepoint server 2013 backup and restore
US9354979B2 (en) 2014-02-07 2016-05-31 International Business Machines Corporation Server based disaster recovery by making use of dual write responses
CN111240902A (zh) 2015-09-25 2020-06-05 华为技术有限公司 数据备份的方法和数据处理系统
KR20220017124A (ko) * 2020-08-04 2022-02-11 삼성전자주식회사 백업 데이터 복원 방법 및 이를 위한 전자 장치

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US123997A (en) * 1872-02-27 Improvement in washing-machines
US605546A (en) * 1898-06-14 Ward lees and frederick newton tweed ale
US124013A (en) * 1872-02-27 Improvement in the manufacture of torsion-springs
US620558A (en) * 1899-03-07 Uncoupling device
US143734A (en) * 1873-10-14 Improvement in planing-machines
US32216A (en) * 1861-04-30 Improvement in harvesting-machines
US4875159A (en) * 1987-12-22 1989-10-17 Amdahl Corporation Version management system using plural control fields for synchronizing two versions of files in a multiprocessor system
US5761677A (en) 1996-01-03 1998-06-02 Sun Microsystems, Inc. Computer system method and apparatus providing for various versions of a file without requiring data copy or log operations
US6366930B1 (en) 1996-04-12 2002-04-02 Computer Associates Think, Inc. Intelligent data inventory & asset management systems method and apparatus
JP3193880B2 (ja) * 1996-12-11 2001-07-30 株式会社日立製作所 データ移行方法
US6032216A (en) 1997-07-11 2000-02-29 International Business Machines Corporation Parallel file system with method using tokens for locking modes
US5983239A (en) 1997-10-29 1999-11-09 International Business Machines Corporation Storage management system with file aggregation supporting multiple aggregated file counterparts
US5991772A (en) * 1997-10-31 1999-11-23 Oracle Corporation Method and apparatus for restoring a portion of a database
US5946700A (en) 1997-10-31 1999-08-31 Oracle Corporation Method and apparatus for preserving non-current information that can be overwritten in a computer file
US6052764A (en) * 1997-12-19 2000-04-18 Compaq Computer Corportion Computer data restoration assembly and associated method
US6279011B1 (en) 1998-06-19 2001-08-21 Network Appliance, Inc. Backup and restore for heterogeneous file server environment
JP2000076110A (ja) 1998-08-28 2000-03-14 Hitachi Ltd 分散ファイルシステムにおける回復処理システム
US6205558B1 (en) 1998-10-07 2001-03-20 Symantec Corporation Recovery of file systems after modification failure
US6353887B1 (en) 1998-11-13 2002-03-05 Unisys Corporation Digital signaturing method and system for re-creating specialized native files out of a container imported from an open network or residing on a CD-ROM
WO2000055735A1 (en) 1999-03-15 2000-09-21 Powerquest Corporation Manipulation of computer volume segments
US6415300B1 (en) 1999-07-06 2002-07-02 Syncsort Incorporated Method of performing a high-performance backup which gains efficiency by reading input file blocks sequentially
US6477544B1 (en) 1999-07-16 2002-11-05 Microsoft Corporation Single instance store for file systems
US6442556B1 (en) 1999-12-04 2002-08-27 Inventec Corp. Decompression software package that can store files in assigned storage device
US6336930B1 (en) * 2000-03-07 2002-01-08 Zimmer, Inc. Polymer filled bone plate
AU6778601A (en) 2000-06-26 2002-01-08 International Business Machines Corporation Data management application programming interface for a parallel file system
US7730213B2 (en) * 2000-12-18 2010-06-01 Oracle America, Inc. Object-based storage device with improved reliability and fast crash recovery
JP4108973B2 (ja) * 2001-12-26 2008-06-25 株式会社日立製作所 バックアップシステム
US6715048B1 (en) * 2002-03-28 2004-03-30 Emc Corporation System and method for efficiently performing a restore operation in a data storage environment
US20040078641A1 (en) * 2002-09-23 2004-04-22 Hewlett-Packard Company Operating system-independent file restore from disk image

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009522677A (ja) * 2006-01-05 2009-06-11 インターナショナル・ビジネス・マシーンズ・コーポレーション ノードの番号付けによるファイル・システムのダンプ/復元のための方法、システム、およびデバイス
JP2007242018A (ja) * 2006-03-06 2007-09-20 Hewlett-Packard Development Co Lp 分散データストレージシステム
JP2014089747A (ja) * 2013-12-26 2014-05-15 Hitachi Ltd 情報処理システムにおける障害復旧方法、及び情報処理システム
JP2016038784A (ja) * 2014-08-08 2016-03-22 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報処理装置、情報処理システム、バックアップ方法、およびプログラム
US9852030B2 (en) 2014-08-08 2017-12-26 International Business Machines Corporation Data backup using metadata mapping
US9916204B2 (en) 2014-08-08 2018-03-13 International Business Machines Corporation Data backup using metadata mapping
US10049018B2 (en) 2014-08-08 2018-08-14 International Business Machines Corporation Data backup using metadata mapping
US10049019B2 (en) 2014-08-08 2018-08-14 International Business Machines Corporation Data backup using metadata mapping
US10705919B2 (en) 2014-08-08 2020-07-07 International Business Machines Corporation Data backup using metadata mapping
JP2016045869A (ja) * 2014-08-26 2016-04-04 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation データの復旧方法、プログラムおよびデータ処理システム
US10169165B2 (en) 2014-08-26 2019-01-01 International Business Machines Corporation Restoring data
US10261866B2 (en) 2014-08-26 2019-04-16 International Business Machines Corporation Restoring data

Also Published As

Publication number Publication date
US20040267822A1 (en) 2004-12-30
KR20050001301A (ko) 2005-01-06
JP4160933B2 (ja) 2008-10-08
US7234077B2 (en) 2007-06-19
KR100622801B1 (ko) 2006-09-14

Similar Documents

Publication Publication Date Title
JP4160933B2 (ja) 超大規模ファイル・システムでのファイル・システム使用のすばやい復元
JP4157858B2 (ja) ストレージ・エリア・ネットワーク(san)ファイル・システムの並列高速バックアップ
US7822726B1 (en) Encapsulation of storage object extensibility records for backup and restore
KR100962055B1 (ko) 컴퓨터 시스템들간의 객체 공유
US9665304B2 (en) Storage system with fast snapshot tree search
US7546324B2 (en) Systems and methods for performing storage operations using network attached storage
US5991753A (en) Method and system for computer file management, including file migration, special handling, and associating extended attributes with files
US8621165B1 (en) Method and apparatus for providing a volume image backup of selected objects
US20050216788A1 (en) Fast backup storage and fast recovery of data (FBSRD)
US9430331B1 (en) Rapid incremental backup of changed files in a file system
US9449007B1 (en) Controlling access to XAM metadata
US20070061540A1 (en) Data storage system using segmentable virtual volumes
US20090063393A1 (en) Sharing objects between computer systems
EP1754152B1 (en) Method and apparatus for storage backup
AU2002360252A1 (en) Efficient search for migration and purge candidates
AU2002330129A1 (en) Sharing objects between computer systems
AU2002349890A1 (en) Efficient management of large files

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071120

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20071205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20071205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080318

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080618

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080715

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20080715

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080718

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4160933

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110725

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110725

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120725

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130725

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees