JP4157858B2 - ストレージ・エリア・ネットワーク(san)ファイル・システムの並列高速バックアップ - Google Patents

ストレージ・エリア・ネットワーク(san)ファイル・システムの並列高速バックアップ Download PDF

Info

Publication number
JP4157858B2
JP4157858B2 JP2004173180A JP2004173180A JP4157858B2 JP 4157858 B2 JP4157858 B2 JP 4157858B2 JP 2004173180 A JP2004173180 A JP 2004173180A JP 2004173180 A JP2004173180 A JP 2004173180A JP 4157858 B2 JP4157858 B2 JP 4157858B2
Authority
JP
Japan
Prior art keywords
file
backup
node
directory
list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004173180A
Other languages
English (en)
Other versions
JP2005018758A (ja
Inventor
ロバート・ジェイ・キュラン
ダニエル・エル・マクマブ
デメトリオス・ケイ・ミチャラロス
ウェイン・エイ・ソードン
フランク・ベー・シュマック
ジェームズ・シー・ウィリー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2005018758A publication Critical patent/JP2005018758A/ja
Application granted granted Critical
Publication of JP4157858B2 publication Critical patent/JP4157858B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/16Protection against loss of memory contents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • G06F11/1451Management of the data involved in backup or backup restore by selection of backup contents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • Y10S707/99955Archiving or backup

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、全般的には、ファイル・システムをバックアップする方法およびシステムを対象とする。具体的には、本発明は、分散データ処理システムまたは並列データ処理システムで特に有用と思われる。というのは、本発明の構造によって、バックアップ処理の複数の独立の単位への区分化が可能になるからである。更に具体的には、本発明は、特に、分散データ処理ステムまたは並列データ処理システムのストレージ・エリア・ネットワークと共に使用可能である。
ディスク・ストレージにおける進歩によって、単一のファイル・システム内で大量のデータおよび多数のファイルを管理する能力が生み出された。これによって、大量のデータの移動に関連する問題と、どのファイルがバックアップされなければならないかの識別に関連する問題に起因して、ネットワーク内のファイルの普通のバックアップ・コピーを作る際の問題が生じる。
ファイルをバックアップする従来の技法では、フル・モードまたは増分モードのいずれかで動作することができるバックアップ・アプリケーションを実行することを必要とする。フル・バックアップ(即ち、フル・モードで実行されるバックアップ。ベース・バックアップとも称する)では、名前ツリー(用語「名前ツリー」または「名前空間」の詳細な議論については下を参照されたい)全体を読み取り、各ファイルのコピーを転送することによって、ファイル・システム全体が単一のデータシンクにバックアップされる。増分バックアップでは、作成または変更されたファイルについてファイルの新しいコピーが転送され、増分バックアップはまた削除されたファイルの注記も作成する。削除されたファイルのバックアップ・コピーは、最終的に、あるポリシー機構(たとえば、バックアップ・コピーを1カ月間保存する)に従って削除される。
上で説明した状況において存在する、本発明によって対処される2つの問題がある:(1)第1の問題は、その性質がなければそうならなかったのだが、データ・レートを不当に制限するというデータおよびファイル転送の持つシリアル(連続的)な性質、から生じるバックアップ・アプリケーションのシリアルな性質であり、(2)第2の問題は、どのファイルが実際にバックアップを必要とするかをすばやく判定する能力の欠如である。ファイル・バックアップ操作の既存の技法では、通常は、ファイル・システム階層内の名前空間全体が読み取られ、各ファイルに関するあるファイル情報が抽出される。これは、ファイル・システム内のすべてのファイルに対してファイル・システム呼出しを実行することを必要とする(Posixファイル・システム標準規格に従うデータ処理システムでは、この呼出しが、「stat()」コマンドによってもたらされる)。この呼出しは、ディスクに保管された情報を必要とし、ファイル名の順番で実行されるので、通常は、それぞれ数ミリ秒(ms)の時間的「コスト」を有するディスク操作がもたらされる。たとえば、1億個のファイルを有し、5msでファイル情報を読み取ることができるディスクを有するファイル・システムは、各ファイルを検査するのに133時間を必要とする。UNIX(R)オペレーティング・システム(Unix(登録商標)は、The Open Groupの登録商標である)の開発の初期から、「iノード」(あるファイル・システム構造の記述に幅広く使用されているこの用語の説明については、下を参照されたい)によるバックアップの技法が存在したが、これらの技法は、ファイルの識別が、一般に人間のファイル・システム・ユーザによって認識可能なファイル名自体ではなく、人間が使用可能な識別子ではないiノード番号である、という問題を被っている。
このファイル・バックアップ問題に対する唯一の他の既知の解決策は、変更されたファイルの連続的ジャーナル化に基づくファイル・システムに存在する。しかし、この解決策では、ファイルの修正、削除、または名前変更のたびにプログラム終了が呼び出され、その結果、バックアップされる必要があるファイルを表したある形のログの作成がもたらされる。この解決策は、必要なすべての情報が、バックアップの時に即座に使用可能であるという長所を有するが、継続的にログに情報を付加するというコスト的短所を有する。更に、非常に頻繁に発生する状況であるが、複数回修正されるファイルについては、当該付加されるレコードが冗長となることがある。
本発明が使用される環境のよりよい理解のために、当技術分野で、下記の用語が一般に明確に理解された概念を指すのに使用される。下に示す定義は、便宜のために、ならびにかかわる問題および提案される解決策のよりよい理解のために提供され、ファイル・システム技術の技量を有する者によって理解されるように、一般的に理解される意味からの変形の暗示を意図するものではない。本発明は、ファイルおよびファイル・システムを取り巻く概念に密接にかかわるので、読者に、少なくともいくつかのより関連する用語について、簡潔な記述を与えることが有用である。より完全なリストは、本発明と同一の譲受人に譲渡された米国特許第6032216号明細書にある。この特許明細書は、参考文献として本明細書に組み込まれている。この特許からの用語からなる下記の用語集が提供されるのは、これらの用語が、本発明をより容易に理解するのに最も関連するのであるからである。
データ/ファイル・システム・データ: これは、特定のアプリケーションとの関連でのみ意味がある任意のビット列である。
ファイル: コンピュータ・アプリケーションによってアクセスできる名前付きビット列。ファイルは、長さ、修正時刻、および最終アクセス時刻などの標準属性を有する。
メタデータ: これは、ファイルの構造とファイル・システムを含むディスクの使用とを記述するために、ファイル・システム・ソフトウェアによって作成される制御構造である。このタイプのファイル・システムに適用される特定のタイプのメタデータの特徴を下で特に示すが、これには、ディレクトリ、iノード、割振りマップ、およびログが含まれる。
ディレクトリ: これは、iノードによって表される一組のデータに名前を関連付ける制御構造である。
iノード: ファイルの属性と、ファイルを構成するデータを含むディスク(または他の記憶媒体)の区域への一連のポインタとを含むデータ構造。間接ブロックによってiノードを補完することができ、即ちこれら間接ブロックは、たとえばファイルが大きい場合には、追加ポインタによって当該iノードを補完する。
割振りマップ: これは、ディスクの特定の区域(またはiノードなどの他の制御構造)が、使用中かまたは使用可能であるかどうかを示す制御構造である。これによって、ソフトウェアが、使用可能なブロックおよびiノードを新しいファイルに効率的に割り当てられるようになる。この用語は、ファイル・システム操作の全般的な理解に有用であるが、本発明の動作に関しては周辺でのみ使用される。
ログ: 障害状況での消失に対する保護のために、他のタイプのメタデータを同期状態に(即ち、矛盾がない状態に)保つために使用されるレコードの組である。ログには、複数の構造に対する関連する更新を記述する単一のレコードが含まれる。この用語は、周辺でのみ有用であるが、上で説明した代替解決策との関連で提供される。
ファイル・システム: ディスク(または他の媒体)の定義された組を管理し、また、データおよびデータ・ファイルの一貫性のある追加、修正、および削除を実現する形でデータへのアクセスを提供する、ソフトウェア・コンポーネント。この用語は、ディスク(または他の媒体)の特定の組に含まれるデータおよびメタデータの組を記述するのにも使用される。本発明は、通常は、最も頻繁に、回転式磁気ディスク記憶システムと共に使用されるが、また、隣接するブロックに配置されたデータと共に名前によってアクセスできるいかなるデータ記憶媒体と共にでも使用可能であり、したがって、用語「ディスク」または「ディスク・ストレージ」等が本明細書で使用される場合に、記憶媒体のこのより一般的な特性が意図されている。
スナップショット: ある所定の時点でのファイル・システムの状態を取り込んだファイルまたはファイルの組。
メタデータ・コントローラ: あるファイルへのすべてのアクセス要求がそれを介して処理される、ネットワーク化されたコンピュータ・システム内のノードまたはプロセッサ(本発明の譲受人が提供するスケーラブル並列システムのpSeriesなど)。この用語は、完全を期して提供されるが、本発明の動作の理解には関連しない。
米国特許第6032216号 米国特許出願第US2002/0124013号 米国特許出願第US2002/0143734号 米国仮特許出願第60/214127号 米国特許出願第US2002/0123997号 米国特許出願(弁理士整理番号POU920030006US1)
本発明の1つの目的は、大ファイル・システムをバックアップする方法を提供することである。
本発明のもう1つの目的は、ストレージ・エリア・ネットワーク(SAN)内のデータのバックアップの性能を強化することである。
本発明の更なる目的は、バックアップ処理を、複数のデータ処理ノードで並列に実行されるように区分化することができる機構を提供することである。
本発明のもう1つの目的は、iノード番号による参照ではなく、より人間に可読なファイル名によってファイル指定をすることに、より従ったファイル・バックアップ・システムを提供することである。
本発明の更にもう1つの目的は、フル・モードおよび増分モードの両方のファイル・バックアップ手順の操作を機能拡張することである。
本発明の更なる目的は、単一のデータ・シンクまたは複数のデータ・シンクにファイルをバックアップする機構を提供することである。
本発明のまた更なる目的は、ファイル削除ポリシー、特に長期削除ポリシーとの一貫性があるファイル・バックアップ手順を提供することである。
本発明の1つの目的はまた、ファイル・バックアップ手順の通常のシリアルな性質を回避することである。
本発明のまたもう1つの目的は、どのファイルをバックアップすべきかをすばやく判定し、ファイル名によってバックアップを実行し、したがって、ファイル名によって個々のファイルを選択的に復元する能力を保つことである。
本発明の更にもう1つの目的は、ジャーナリングに基づくファイル・バックアップ手順を回避することである。
本発明の1つの目的はまた、特に大規模分散データ処理システムでのファイル・システム・バックアップに必要な時間を大幅に減らすことである。
最後に、これに制限はされないが、本発明の目的は、多数のファイルを有するファイル・システムで、たとえば、ファイルの数が数億である時に、バックアップ目的で、変更されたファイルをすばやく識別できるようにすることである。
本発明のさまざまな実施形態によって満足される望ましい目的のリストの本明細書での詳述は、これらの目的のいずれかまたはすべてが、個々にせよまたは集合的にせよ、本発明の最も一般的な実施形態またはそのより詳細な実施形態のいずれかにおいて本質的特徴として存在していることを暗示または提案するよう意図されたものではない。
本発明の好ましい実施形態によれば、ファイル・システムをバックアップする方法には、指定された時刻以降に変更されたiノードの、iノード番号順のリストを生成するステップが含まれる。このリストには、iノード番号と、ファイルのサイズや最後のファイル修正の時刻(日付も含む)などの、ある種のファイル属性が含まれる。現在ファイル・システム内にあるすべてのファイルの名前とiノード番号/世代番号とを有するテーブルも、生成される。このリストは、iノード番号によってソートされる。リストおよびテーブルが、iノード番号によってマージ(結合)される。その後、マージされたリストおよびテーブルの内容をどのファイルがバックアップされなければならないかを判定するために利用することによって、ファイルがバックアップされる。マージされた構成要素に現れる順序でファイルをバックアップすることができるが、この特定の順序によって決定されるものではない。本明細書で使用される用語「リスト」および「テーブル」は、本質的に同一の線形構造を含むことが意図され、「第1リスト」および「第2リスト」などのわかりにくい表記の参照を避けるために別々の用語が使用される。
本発明の好ましい実施形態では、iノード番号には世代番号も含まれる。世代番号を使用することによって、ファイルの削除の後に同一のiノードを使用できるようになる。古いファイルは「iノードX、世代N」であり、新しいファイルは、「iノードX、世代N+1」である。もう1つの態様では、マージされたリストおよびテーブルが、シャドウ名前空間ファイルと称するそれ自体のファイルに保管される。本発明では、比較的大きいブロックでのアクセスに、シャドウ名前空間ファイルの存在および構造も利用される。この形で、ブロックを区分し、システム内のさまざまな処理ノードに供給することができ、したがって、これにより、少なくとも2つの独立のプロセッサによって並列に実行される複数のバックアップ操作がもたらされる。この形でのバックアップ操作の区分は、バックアップされるシャドウ名前空間ファイルからのファイルの単純な線形分割に制限されない。区分は、区分内で示されるファイルのファイル・バックアップの完了の推定時間といった、だがこれに制限はされない、さまざまなファイル・パラメータに基づくものと容易にすることができる。
図1に、ファイル・システムの原理的要素を示す。図示されたような通常のファイル・システムには、ディレクトリ・ツリー100、iノード・ファイル200、およびデータ300が含まれる。この3つの要素は、通常は、ファイル・システム内でファイル自体として存在する。たとえば、図1からわかるように、iノード・ファイル200には個々のレコードまたはエントリー220の集合が含まれる。ファイル・システムごとに1つだけiノード・ファイルがある。具体的に言うと、iノード・ファイルは、図1の最下部に示されたものであり、参照符号200によって示される。ディレクトリ・ツリー100内のエントリーにはフィールド112などのポインタが含まれ、このフィールドにはiノード・ファイル200への単純なインデックスとして動作する整数の量が含まれることが望ましい。たとえば、フィールド112にたとえば「10876」を表す2進整数が含まれる場合に、これによってiノード・ファイル200の10876番目のエントリーが参照される。特殊なエントリーを使用して(下で説明する参照符号216を参照されたい)、ファイルをディレクトリであるとして示すことができる。このように、ディレクトリとは、通常は、保管されたファイルの名前が任意の深さのディレクトリ・ツリー内に維持されているファイルである。ディレクトリ100に関して、本発明のよりよい理解のために意味が理解されなければならない3つの用語がある。「ディレクトリ・ツリー」とは、ファイル・システムのすべてのディレクトリを含むディレクトリの集合である。「ディレクトリ」とは、ディレクトリ・ツリーの要素である特定のタイプのファイルである。ディレクトリは、ディレクトリ・ツリー内の下位の位置を占めるファイルまたはディレクトリのいずれか、であるiノードへのポインタの集合である。「ディレクトリ・エントリー」とは、ファイルまたはディレクトリを指すディレクトリ内の単一のレコードである。図1では、模範的なディレクトリ・ツリーが機能ブロック100内に示されている。模範的なディレクトリ・エントリーには、図示のように、書式120の要素が含まれるが、本発明の目的のためのディレクトリ・エントリー内容の例示については図3も参照されたい。図1には(便宜的目的のため)2レベルだけの階層が示されているが、ディレクトリの階層ツリー構造の深さは2レベルに制限されないことを理解されたい。実際、どのディレクトリ・ツリーにも数十個のレベルが存在する可能性がある。にもかかわらず、このディレクトリ・ツリーの深さは、1つのファイルだけが識別されるかアクセスされる必要がある場合における複数ディレクトリ参照の必要性に寄与している。しかし、どの場合でも、ディレクトリ・ツリーの「葉」が、ファイル名(参照符号111)をiノード・ファイル200内のエントリー220に関連付けるのに使用される。参照は、iノード・ファイル200へのポインタを提供する「iノード番号」(参照符号112)による。本明細書で考慮されるタイプのファイル・システムには1つのiノード配列がある。本発明の好ましい実施形態では、このiノード配列はiノード・ファイル200であり、インデックスによって、配列要素がポイントされる。したがって、iノード#10876は、iノード・ファイル200の10876番目の配列要素である。通常、このポインタは、iノード・ファイル200への単純なインデックスであり、したがって、本質的に線形の形でアクセスされ、そうであることが好ましい。したがって、インデックスが10876である場合に、これは、iノード・ファイル200の10876番目のレコードまたは配列要素をポイントする。名前エントリー111を用いると、ツリーの1つ深いレベルに移動することができる。通常のファイル・システムでは、名前エントリー111によって、たとえばディレクトリまたはデータ・ファイルであるiノード#10876がポイントされる。これがディレクトリである場合には、名前の次のレベルに関して、そのディレクトリ・ファイル内を再帰的に検索する。たとえば、エントリー111が、図1に示されているように「a」であると仮定する。この場合に、「a2」のiノードに関する名前エントリーが、iノード#10876のデータから検索される。名前エントリー111によってデータがポイントされる場合には、名前検索の終りに達している。本発明では、名前エントリー111に追加フィールド113(図3参照)が含まれ、これによって、ディレクトリであるか否かが示される。ディレクトリ・ツリー構造は、別々に含まれる。というのは、POSIXによって、本発明の理解または動作のいずれにも関連しない形で同一のファイルの複数の名前が可能になるからである。
iノード番号による参照ではなく、ファイル名による個々のファイル・エントリーへの参照が可能になるという点で、ディレクトリ・ツリー100は、当該ファイル・システムのために階層的名前空間を提供する。ディレクトリの各エントリーはiノードを指す。そのiノードは、ディレクトリの場合もあり、ファイルの場合もある。iノード220は、iノード・ファイル200内の位置のインジケータ(指標)であることが望ましいフィールド112内のエントリーによって決定される。iノード・ファイル200内のiノード・ファイル・エントリー220は、通常は線形リストとして実施され、そうであることが望ましい。このリストの各エントリーに複数のフィールド、即ちiノード番号212、世代番号213、個々のファイル属性214、データ・ポインタ215、最終修正日付216、およびファイルがディレクトリであるか否かを示すインジケータ・フィールド217が含まれる。本発明と関係または関連性のない他のフィールドも、通常はiノード・エントリー220内に存在する。しかし、本出願と共に使用するのに最も関連するフィールドは、最終修正日付を示すフィールド216である。iノード番号は、ファイル・システム内で固有である。ファイル・システムには、もはや存在しないが存在した時に同一のiノード番号を有していたあるファイルからあるファイルを区別するのに普通使用される、世代番号213が含まれることもまた望ましい。iノード・フィールド214によって、あるファイルに関連するある種の属性が識別される。これらの属性には、最終修正日付、作成日付、ファイル・サイズ、ファイル・タイプ、読取アクセスまたは書込アクセスを示すパラメータ、さまざまなアクセス許可およびアクセス・レベル、圧縮状況、暗号化状況、隠し状況、およびネットワーク内での状況が含まれるが、これらに限定はされない。iノード・エントリー220には、それがポイントするファイルが実際にディレクトリであるかどうかを示すエントリー217も含まれる。これによって、ファイル・システム自身のための名前空間として最もよく記述されるものをこのファイルが含んでいるという事実に従って、ファイル・システム自体がこのファイルを異なる形で扱うことが可能になる。しかし、最も重要なことは、普通のiノード・エントリー220に、ファイル・システムのデータ部分300に常駐する実際のデータ310の物理的な位置を識別するのに十分な情報を含むデータ・ポインタ215が含まれるということである。
本発明では、複数の機能の組合せを使用して、上で説明したものなどの現在使用されている技術よりかなり高速なバックアップ機能性を提供する。具体的には、本発明によって、下記の機能が提供される。
(1)個々のiノードではなくブロックによってiノード・ファイルをすばやく読み取る機能。これによって、ディスク・ストレージをより効率的に使用でき、複数のディスクにまたがるiノード・エントリーの読取りのオーバーラップも可能になる。たとえば、40ミリ秒で512個のiノード・エントリーのブロックを読み取ることが可能であり、これを100台のディスクにまたがって並列に行って、1億個のiノード・エントリーがある場合に、133時間ではなく、約80秒の要件がもたらされる。公開された特許出願である2002年9月5日公開の米国特許出願第US2002/0124013号(2001年6月25日出願の出願番号第09/887533号、弁理士整理番号IL920000067US2)および2002年10月3日公開の米国特許出願第US 2002/0143734号(2001年6月25日出願の米国特許出願第09/887520号明細書、弁理士整理番号IL920000067US3であり、09/887533の分割出願である;この両方が、米国仮特許出願第60/214127号明細書、弁理士整理番号IL920000067US1、2000年6月26日出願に基づいて出願された)、および2002年9月5日公開の米国特許出願第US 2002/0123997号(出願番号第09/887550号、弁理士整理番号IL920000068US2、2001年6月25日出願であり、米国仮特許出願第60/214127号明細書、弁理士整理番号IL920000068US1、2000年6月26日出願のものに基づく)に、並列システムから階層ストレージ・マネージャにイベントを提示する能力を提供するツールが記載されている。そのようなツールは、ストレージ・マネージャに供給される複数の返されたイベントを処理するのに有用である。上で参照した特許出願は、本発明と同時に出願された関連特許、米国特許出願(弁理士整理番号POU920030007US1)により関連するが、完全を期してここに掲載した。
(2)ファイル・システムの名前空間をすばやく読み取り、効果的に前空間のシャドウ・コピーであるものをすばやく作成する能力。本発明には、タイプを判定するためにiノードを読み取ることを必要とせずに、各ディレクトリ・エントリー内で名前付けされるオブジェクトのタイプを指定する能力も含まれる。これによって、ディレクトリ・エントリーを読み取ることだけによって名前空間を生成できるようになる。
(3)ディレクトリ・エントリーをiノード番号によって順序付けることでiノード番号からファイル名へのすばやい変換が可能になるようにするための、ディレクトリ・エントリーをソートする能力。これによって、ファイル・システム名前空間の前のコピー(シャドウ名前空間ファイル)を現在のコピーと比較して、好都合な形で、名前を変更されたファイルおよび削除されたファイルを検出できるようにもなる。
(4)作業負荷を分割してバックアップ対象に関するほぼ等しいストレスをもたらす能力。これによって、ファイルのサイズに従って作業負荷を分割できるようになり、ファイルの数に従って分割することも可能になり、更に、1つまたは複数のバックアップ対象への実際のデータ移動を行う「ワーカー(作業者)」スレッドのスケジューリングが可能になる。
(5)ファイル名空間の同一の部分から同一のバックアップ対象への毎回のデータのバックアップをする能力、またはバックアップ作業負荷をよりよく平衡化するために他のバックアップ対象へそれを移植する能力。
本明細書では、データのバックアップ・コピーを受け入れ、保管するバックアップ機構があると仮定する。そのような機構のテープ管理機能およびカタログ作成機能は、明らかに、本発明の動作に重要であるが、そのような製品の多数の例が現在の市場に存在する。IBM社のTivoli Storage Managerが、そのような製品の例である。IBMは、本発明の譲受人でもある。
多くの点でファイル・システムのX−open標準規格に従うファイル・システムに似たIBM社のGeneral Parallel File System(GPFS)の構造の関連する諸部分を、本発明の正しい理解のための背景を提供するために、短く検討する。
ファイル・システムの開始点は、スーパーブロック(superblock)と称するファイル・システム記述子データ構造であり、これは、ファイル・システムを含むディスクの既知の固定された点に常駐する。この構造は、ファイル・システムに関するすべての働きを実行するために必要である。この構造は、本発明の理解の鍵となる2つのデータ構造の、ディスク位置へのポインタを有する。これらのデータ構造の第1のデータ構造がiノード・ファイル200である。iノード・ファイルは、ファイルの主要なプロパティを記述するデータ構造、を構成する個々のiノードの集合である。本発明に関連して具体的に言うと、iノード・ファイル内のエントリーは、ファイルまたはそのプロパティが最後に変更された時を反映するタイム・スタンプを含んでおり、そのエントリーはまたファイルのサイズをも示している。ファイルのiノードには、ファイルの名前が含まれないことに留意されたい。ファイル名は、ファイル・システムのディレクトリ構造100に保管される。ファイル・システムのルート・ディレクトリ100は、ファイル・システムのスーパーブロックによって対処される第2の鍵となるデータ構造である。当該ルート・ディレクトリは、名前によってファイルを発見する開始点である。当該ルート・ディレクトリは、構造的には他のディレクトリと同一であり、即ちファイルまたは別のディレクトリの名前と、当該ファイルのプロパティを含むiノードを指すiノード番号と、ディレクトリ・エントリーの対象がファイルまたは別のディレクトリのどちらであるかを記述する(GPFSにおける)対象タイプ・フィールドとからなる一連のレコードが含まれる。rootdir/username/fileという名前のファイルが、rootdirという名前のディレクトリusernameと呼ぶディレクトリを表すiノード、を指すrootdirと呼ぶディレクトリ、を検索することによって突き止められる。usernameという名前のディレクトリに、ファイルのiノード番号が含まれる。通常のアクセス操作では、パス内の各ディレクトリおよびそれに対応するiノードが、データを見つけるためにアクセスされる。
本発明の長所の正しい理解のために、これらの操作の性能特性を完全に理解することが有用である。ほとんどのUNIX(登録商用)システムまたはUNIX(登録商用)的システムでは、ディレクトリはファイルである。したがって、ディレクトリに対する読取操作には、ディレクトリのiノードの読取りと、適切なディレクトリ・ブロックの読取りとが含まれる。これらの操作のそれぞれは、アクセス・パターンおよび/または使用可能キャッシュ量、による必要データのキャッシュが可能でない場合には、ディスク操作を含んでいる。本発明は、ファイル・システムのサイズと、メタデータが複数のシステムに対して使用可能であるという要件とによって、必要なデータが既にキャッシュされている可能性が低いものとなる場合に関するものである。更に、ディレクトリ・スキャンは、iノード・ファイルへのランダム・アクセスによく似ている。これによって、将来のアクセスを予測し、プリフェッチすることが困難になる。ディレクトリをスキャンしたりiノードを読み取ったりするのに必要なディスク操作が、性能を左右する。
バックアップに使用される2つの標準的な技法がある。この技法の一方が、「iノードによるバックアップ」である。この技法では、iノード・ファイルからiノードをまとめて読み取り、各iノード・ファイル・エントリーに関連するデータをバックアップする。ファイルはiノード番号によって識別される。これは、名前によって個々のファイルを復元する試みには、普通には行われないかなりのカスタム・プログラミングが伴うことを意味している。代替のより一般的な技法は、バックアップ判断基準(たとえば、指定された日付の後で修正されたもの)に合致するファイルを探して、ファイル・システム名前空間をスキャンすることである。名前空間を使用することによって、プログラムは名前空間全体における各ファイルを照会する。これを行う標準インターフェースは、ファイルに関するディレクトリ・エントリーとiノードとの読取りを必要とし、この処理は別々のディスク操作を必要とする。この名前空間全体の通過は、より大きいファイル・システムについて極端に時間がかかる。
上で注記したように、本発明では、複数の処理修正を利用することにより上で説明したバックアップ方法の制限を克服する。具体的に言うと、本発明では下記の方法が使用される。
(1)本発明では、iノード・ファイル200がiノードによるバックアップとほとんど同様の方法で読み取られ、変更されたiノードのリスト400(図2参照)が生成される。これによって、バックアップ判断基準を満たすiノードのリストがもたらされる。しかし、iノードによるバックアップとは異なり、本発明では、iノード番号を手掛かりとして使用するバックアップは行われない。
(2)本発明では追加ステップが使用され、この追加ステップでは、ディレクトリ名前空間100が読み取られて、ファイル・システム内の各ファイルの名前が、それに対応するiノード番号と共に含まれた、ファイル名のテーブル500(図2参照)を生成する。ディレクトリを読み取る時に、本発明では、図3に示すように、ディレクトリ・エントリーにより新たに供給される対象タイプ・フィールド113が使用される。従来のファイル・システムでは、対象がディレクトリまたはファイルであるか否かを示すディレクトリ・エントリー内のインジケータが保持されない。その情報は、一般にiノード・ファイル内だけに保持され、したがってiノードの読取りが必要である。それ故、本発明の動作では、すべてのアクティブiノードを読み取る必要なしにサブディレクトリを識別できるようにするためにフィールド113が提供され、このようにして本方法の主要な長所の1つがもたらされる。ディレクトリ・スキャンの結果は、ファイル・システムに現在存在するすべてのファイルについての名前とiノード番号とを有するテーブル500である。このスキャンは、現在のアクティブなファイル・システムかまたはファイル・システムのスナップショットかのいずれかに対して行われる。
(3)本発明では、結果として得られるシャドウ名前空間テーブル500を、iノード番号によってソートする。これによって名前空間テーブル500をiノード・リスト400と簡単にマージできるようになり、これによるテーブルによって、バックアップされるファイルを指すファイル名のリストが作成される。
(4)結果として得られるマージされたテーブルの構造および内容は、ファイルの数と各ファイルのサイズとに基づいてマージされたテーブルを等しい部分に分割するための、そしてその後、ファイル・システム(たとえばGPFS)の複数のノードにまたがって並列にバックアップを実行する複数の並列バックアップ・ジョブ「ワーカー・スレッド」を呼び出すための、付加的な能力を本発明に提供する。テーブルの「等しい」部分への分割は、各ファイルに必要な時間を推定することによって行われる。時間推定は、下記の計算に基づくことが望ましい(しかし、この計算の正確な式によって決定されるものではないことに留意されたい)。
時間=基礎時間+(時間/バイト)*(バイト数)
ここで、基礎時間とは、1バイトのファイルをバックアップするのに必要な推定時間であり、時間/バイトとは、追加のバイトをバックアップするのに必要な増分時間の推定値である。本発明のこの態様は、そうあることが望ましいが、任意選択的なものである。
(5)バックアップが、複数のバックアップ・リポジトリ(集積場所)にまたがって分散される場合には、各ファイルを、毎回同一のリポジトリに送ることが望ましい。ベース・バックアップで、ファイル名前空間がリポジトリごとのほぼ等しい部分に分割され、ファイルは次のベース・バックアップまでそのリポジトリに関連付けられたままになる。このマッピングが元々の名前空間テーブルに追加されることが望ましい。本発明のこの態様は、そうあることが望ましいが、また任意選択的なものでもある。区分化は、指定された基礎バックアップで任意に実行される。n個のリポジトリがある場合に、シャドウ・ファイルは、上のエントリー(4)で指定されたものとほぼ同一の負荷のn個の部分に分割される。その後、m個のワーカー・スレッドを使用してn個のリポジトリにデータが移動されるが、ここでmはnの倍数であるため、理想的には、各リポジトリが所望の時間のうちにバックアップを完了できるようになる。
(6)ファイル名からバックアップ・リポジトリへのマッピングは、バックアップ作業負荷を再平衡化できるように変更されることが望ましい。マッピングが変更される時に、ファイルの既存のバックアップ版は新しいリポジトリに移動されることが望ましいが、これは必要という訳ではない。本発明のこの態様は、そうあることが望ましいが、任意選択的なものでもある。
(7)名前空間テーブルが、次のバックアップでの使用のために保存される。現在のバックアップの名前空間を前のバックアップと比較することによって、削除されたファイルと名前を変更されたファイルとが簡単に検出され、標準バックアップ・ポリシーに従って正しいバックアップ対策が行われる。本発明のこの態様は、そうあることが望ましいが、任意選択的なものでもあり、特に本発明をその最も広い範囲で検討する時にはそうである。
上で説明した処理修正の結果は、名前によるバックアップの柔軟性を依然可能としながらも、大ファイル・システムのバックアップが高速になるということである。本発明のシステムおよび方法の長所を完全に諒解するために、具体的な例を下で検討する。これらの例のそれぞれで、5ミリ秒のディスク・シーク時間を仮定する。これは、現在のディスク・ドライブの通常のシーク時間である。
たとえば、サイズ100,000バイトの1千万個のファイルおよび10,000個のディレクトリを含む10台のディスクを有し、前のバックアップ以降にファイルの5%だけが変更されたファイル・システムにおいて、下記の性能差が認められた。
[名前によるバックアップを使用する従来技術のバックアップ技法]
それぞれ5ミリ秒での1千万個のiノード「読取」によって、変更されたファイルの判定に13時間以上の時間がもたらされ、名前を得るために10000個のディレクトリを読み取る必要がある。
[本発明を使用するバックアップ技法]
iノード・ファイルが、より大きい単位で読み取られる。更に、iノード・ファイルへのアクセスは連続的であり、前もって並列にiノードを読み取ることができる。この例では、iノードが、10台のディスクのすべてから512個単位で並列に読み取られる。512個のiノードの読取のそれぞれが、10元並列で、約50ミリ秒を要する。これは、100,000iノード/秒の読取レートであり、2分以内に1千万個のiノードを読み取ることができる。ディレクトリ読取性能は前の場合と同一である。この性能利得は、バックアップ・データを複数のリポジトリに送る複数ワーカー・スレッドを使用して並列にバックアップする能力によって、更に改善される。
ある好ましい実施形態に従って本発明を詳細に説明したが、多数の修正および変更を当業者が行うことができる。したがって、特許請求の範囲の意図するところは、本発明の真の趣旨および範囲に適合するようにそのような修正および変更のすべてをカバーすることである。
本発明によって活用されるファイル・システム構造を示すブロック図である。 データ構造記述の大きいブロックの検索を可能にするような、またバックアップ・タスクを複数の独立の動作に区分化することを可能にするような、形態にて現在使用可能なすばやく効率的なバックアップ操作、と共に用いることができる2つの追加構造体の構造を示すブロック図である。 ファイルとディレクトリ・エントリーまたはサブディレクトリ・エントリーとを区別するためにファイル・システム・ディレクトリ内で使用可能な構造を示すブロック図である。
符号の説明
100 ディレクトリ・ツリー
111 ファイル名
200 iノード・ファイル
212 iノード番号
213 世代番号
214 個々のファイル属性
215 データ・ポインタ
216 最終修正日付
217 インジケータ・フィールド
220 レコードまたはエントリー
300 データ
310 データ
400 リスト

Claims (9)

  1. データ処理システムによりファイル・システムを並列的にバックアップする方法であって、
    変更されたiノードのリストを、iノード番号順で生成するステップであって、前記リストがiノード番号を含む、ステップと、
    対象がディレクトリであるかファイルであるかを示すインジケータを保持するディレクトリ・エントリーをスキャンすることによって、現在前記ファイル・システム内にあるすべてのファイルの名前およびiノード番号を有するテーブルを生成するステップと、
    前記テーブルをiノード番号によってソートするステップと、
    前記リストおよび前記テーブルをiノード番号によってマージするステップであって、これによって、関連するiノードおよびファイル名が単一の構成要素にて提供される、ステップと、
    前記マージされたリストおよびテーブルに基づいてiノード番号からバックアップするべきファイル名への変換を行い、該ファイル名からバックアップ・リポジトリへのマッピングを行なってファイルをバックアップするステップと
    を有する方法。
  2. 前記iノード番号が世代番号をも含む、請求項1に記載の方法。
  3. 前記マージされたリストおよびテーブルを、シャドウ名前空間ファイルに保管するステップを更に有する、請求項1に記載の方法。
  4. 前記シャドウ名前空間ファイルにブロック単位でアクセスするステップを更に有する、請求項3に記載の方法。
  5. 前記ブロックが区分化され、また、前記バックアップするステップが、少なくとも2つの独立のプロセッサによって、その各々のプロセッサが前記区分内で示されるファイルをバックアップすることで実行される、請求項4に記載の方法。
  6. 前記区分化が、前記区分内で示されるファイルについてのファイル・バックアップの完了に関する推定時間に基づくものである、請求項5に記載の方法。
  7. 前記バックアップが、前記マージされたリストおよびテーブル内で示されるのと同一の順序で実行される、請求項1に記載の方法。
  8. ファイル・システムの並列的なバックアップのための機械実行可能なコンピュータ・プログラムであって、前記コンピュータ・プログラムが、
    (1)変更されたiノードのリストをiノード番号を含み、かつiノード番号順で生成する手段と、
    (2)対象がディレクトリであるかファイルであるかを示すインジケータを保持するディレクトリ・エントリーをスキャンすることによって、現在前記ファイル・システム内にあるすべてのファイルについての名前およびiノード番号を有するテーブルを生成する手段と、
    (3)前記テーブルをiノード番号によってソートする手段と、
    (4)前記リストおよび前記テーブルをiノード番号によってマージして、関連するiノードおよびファイル名を単一の構成要素にて提供する手段と、
    (5)前記マージされたリストおよびテーブルに基づいてiノード番号からバックアップするべきファイル名への変換を行い、該ファイル名からバックアップ・リポジトリへのマッピングを行なってファイルをバックアップする手段と
    をコンピュータに実現する、コンピュータ・プログラム。
  9. ファイル・システムを並列的にバックアップするデータ処理システムであって、
    中央処理装置と、
    前記中央処理装置による実行のためにデータおよびプログラムを保管するランダム・アクセス・メモリと、
    不揮発性ストレージ・デバイスと、
    前記メモリに保管された、ファイル・システムのバックアップのためのプログラム手段を実行させることによりコンピュータ上に実現される、
    (1)変更されたiノードのリストをiノード番号を含み、かつiノード番号順で生成する手段と、
    (2)対象がディレクトリであるかファイルであるかを示すインジケータを保持するディレクトリ・エントリーをスキャンすることによって、現在前記ファイル・システム内にあるすべてのファイルについての名前およびiノード番号を有するテーブルを生成する手段と、
    (3)前記テーブルをiノード番号によってソートする手段と、
    (4)前記リストおよび前記テーブルをiノード番号によってマージして、関連するiノードおよびファイル名を単一の構成要素にて提供する手段と、
    (5)前記マージされたリストおよびテーブルに基づいてiノード番号からバックアップするべきファイル名への変換を行い、該ファイル名からバックアップ・リポジトリへのマッピングを行なってファイルをバックアップするプログラム手段と
    を含む、データ処理システム。
JP2004173180A 2003-06-24 2004-06-10 ストレージ・エリア・ネットワーク(san)ファイル・システムの並列高速バックアップ Expired - Fee Related JP4157858B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/602,156 US7092976B2 (en) 2003-06-24 2003-06-24 Parallel high speed backup for a storage area network (SAN) file system

Publications (2)

Publication Number Publication Date
JP2005018758A JP2005018758A (ja) 2005-01-20
JP4157858B2 true JP4157858B2 (ja) 2008-10-01

Family

ID=33539492

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004173180A Expired - Fee Related JP4157858B2 (ja) 2003-06-24 2004-06-10 ストレージ・エリア・ネットワーク(san)ファイル・システムの並列高速バックアップ

Country Status (3)

Country Link
US (1) US7092976B2 (ja)
JP (1) JP4157858B2 (ja)
KR (1) KR100600933B1 (ja)

Families Citing this family (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002035355A1 (en) * 2000-02-01 2002-05-02 Flemming Danhild Fald Method for parallel datatransmission from computer in a network and backup system therefor
WO2002071220A1 (en) * 2001-03-05 2002-09-12 Sanpro Systems Inc. A system and a method for asynchronous replication for storage area networks
US7487212B2 (en) * 2001-12-14 2009-02-03 Mirapoint Software, Inc. Fast path message transfer agent
US7346664B2 (en) * 2003-04-24 2008-03-18 Neopath Networks, Inc. Transparent file migration using namespace replication
US8539081B2 (en) * 2003-09-15 2013-09-17 Neopath Networks, Inc. Enabling proxy services using referral mechanisms
US7555504B2 (en) * 2003-09-23 2009-06-30 Emc Corporation Maintenance of a file version set including read-only and read-write snapshot copies of a production file
JP2005165542A (ja) * 2003-12-01 2005-06-23 Internatl Business Mach Corp <Ibm> データバックアップ装置、データバックアップ方法、およびプログラム
US7440965B1 (en) * 2004-02-11 2008-10-21 Network Appliance, Inc. Method and system for generating and restoring a backup image
US8195627B2 (en) * 2004-04-23 2012-06-05 Neopath Networks, Inc. Storage policy monitoring for a storage network
US8190741B2 (en) * 2004-04-23 2012-05-29 Neopath Networks, Inc. Customizing a namespace in a decentralized storage environment
US7681069B1 (en) * 2004-08-30 2010-03-16 Netapp, Inc. Corruption checking during backup
US7756833B2 (en) * 2004-09-22 2010-07-13 Microsoft Corporation Method and system for synthetic backup and restore
US7506111B1 (en) * 2004-12-20 2009-03-17 Network Appliance, Inc. System and method for determining a number of overwitten blocks between data containers
WO2006082592A1 (en) * 2005-02-04 2006-08-10 Hewlett-Packard Development Company, L.P. Data processing system and method
US20080065663A1 (en) * 2005-04-14 2008-03-13 Emc Corporation Reestablishing process context
US7657579B2 (en) * 2005-04-14 2010-02-02 Emc Corporation Traversing data in a repeatable manner
US20060259461A1 (en) * 2005-05-16 2006-11-16 Rajesh Kapur Method and system for preserving access to deleted and overwritten documents by means of a system recycle bin
EP1900189B1 (en) * 2005-06-29 2018-04-18 Cisco Technology, Inc. Parallel filesystem traversal for transparent mirroring of directories and files
US8131689B2 (en) * 2005-09-30 2012-03-06 Panagiotis Tsirigotis Accumulating access frequency and file attributes for supporting policy based storage management
US7917712B2 (en) 2005-09-30 2011-03-29 Hewlett-Packard Development Company, L.P. Method and system for governing access to storage device on SAN
US7788223B2 (en) 2005-12-05 2010-08-31 Microsoft Corporation Resource freshness and replication
US7574461B1 (en) * 2005-12-28 2009-08-11 Emc Corporation Dividing data for multi-thread backup
US7693889B1 (en) 2005-12-28 2010-04-06 Emc Corporation Automated backup and recovery for content repository
US7769719B2 (en) * 2006-01-05 2010-08-03 International Business Machines Corporation File system dump/restore by node numbering
KR101274181B1 (ko) * 2006-02-13 2013-06-14 삼성전자주식회사 플래시 메모리를 관리하는 장치 및 방법
US7899780B1 (en) * 2006-03-30 2011-03-01 Emc Corporation Methods and apparatus for structured partitioning of management information
US8316008B1 (en) * 2006-04-14 2012-11-20 Mirapoint Software, Inc. Fast file attribute search
US8600953B1 (en) 2007-06-08 2013-12-03 Symantec Corporation Verification of metadata integrity for inode-based backups
US8055864B2 (en) * 2007-08-06 2011-11-08 International Business Machines Corporation Efficient hierarchical storage management of a file system with snapshots
US8447733B2 (en) * 2007-12-03 2013-05-21 Apple Inc. Techniques for versioning file systems
EP2336888A1 (fr) * 2008-04-17 2011-06-22 Asp64 Procédé de sauvegarde et de restauration de fichiers informatiques
US8478799B2 (en) 2009-06-26 2013-07-02 Simplivity Corporation Namespace file system accessing an object store
CN102483755B (zh) * 2009-06-26 2014-01-29 森普利维蒂公司 文件系统
US8341130B2 (en) * 2009-08-12 2012-12-25 International Business Machines Corporation Scalable file management for a shared file system
US8458239B2 (en) * 2009-12-16 2013-06-04 International Business Machines Corporation Directory traversal in a scalable multi-node file system cache for a remote cluster file system
US8473582B2 (en) * 2009-12-16 2013-06-25 International Business Machines Corporation Disconnected file operations in a scalable multi-node file system cache for a remote cluster file system
US9158788B2 (en) 2009-12-16 2015-10-13 International Business Machines Corporation Scalable caching of remote file data in a cluster file system
US8495250B2 (en) 2009-12-16 2013-07-23 International Business Machines Corporation Asynchronous file operations in a scalable multi-node file system cache for a remote cluster file system
US8606751B1 (en) * 2009-12-21 2013-12-10 Emc Corporation System and method for backup by inode number
US9058334B2 (en) * 2010-02-11 2015-06-16 Emc Corporation Parallel file system processing
US11449394B2 (en) 2010-06-04 2022-09-20 Commvault Systems, Inc. Failover systems and methods for performing backup operations, including heterogeneous indexing and load balancing of backup and indexing resources
US8504526B2 (en) 2010-06-04 2013-08-06 Commvault Systems, Inc. Failover systems and methods for performing backup operations
KR101753313B1 (ko) 2010-07-08 2017-07-19 삼성전자주식회사 파일 백업 장치 및 방법
US8627024B2 (en) 2010-11-30 2014-01-07 International Business Machines Corporation Snapshot based replication
US8805789B2 (en) 2012-09-12 2014-08-12 International Business Machines Corporation Using a metadata image of a file system and archive instance to backup data objects in the file system
US8914334B2 (en) 2012-09-12 2014-12-16 International Business Machines Corporation Using a metadata image of a file system and archive instance to restore data objects in the file system
CN103677994B (zh) * 2012-09-19 2017-11-17 中国银联股份有限公司 分布式数据处理系统、设备及方法
US20140122433A1 (en) * 2012-10-30 2014-05-01 Kabushiki Kaisha Toshiba Storage device and data backup method
US9483363B2 (en) 2013-05-08 2016-11-01 Commvault Systems, Inc. Use of temporary secondary copies in failover operations
DE102013114214A1 (de) * 2013-12-17 2015-06-18 Fujitsu Technology Solutions Intellectual Property Gmbh POSIX-kompatibles Dateisystem, Verfahren zum Erzeugen einer Dateiliste und Speichervorrichtung
US20150242284A1 (en) * 2014-02-25 2015-08-27 Ca, Inc. Two-algorithm sort during backup and recovery
US9811427B2 (en) 2014-04-02 2017-11-07 Commvault Systems, Inc. Information management by a media agent in the absence of communications with a storage manager
JP5991699B2 (ja) 2014-08-08 2016-09-14 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報処理装置、情報処理システム、バックアップ方法、およびプログラム
JP5984151B2 (ja) 2014-08-26 2016-09-06 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation データの復旧方法、プログラムおよびデータ処理システム
US10313243B2 (en) 2015-02-24 2019-06-04 Commvault Systems, Inc. Intelligent local management of data stream throttling in secondary-copy operations
CN106528189B (zh) * 2015-09-10 2019-05-28 阿里巴巴集团控股有限公司 一种启动备份任务的方法、装置及电子设备
US10298680B1 (en) 2015-09-23 2019-05-21 Cohesity, Inc. Dynamic throughput ingestion of backup sources
US10417102B2 (en) 2016-09-30 2019-09-17 Commvault Systems, Inc. Heartbeat monitoring of virtual machines for initiating failover operations in a data storage management system, including virtual machine distribution logic
US10389810B2 (en) * 2016-11-02 2019-08-20 Commvault Systems, Inc. Multi-threaded scanning of distributed file systems
US10782904B2 (en) * 2017-09-28 2020-09-22 Intel Corporation Host computing arrangement, remote server arrangement, storage system and methods thereof
US10761943B2 (en) 2018-07-21 2020-09-01 International Business Machines Corporation Multi-section full volume backups
US11200124B2 (en) 2018-12-06 2021-12-14 Commvault Systems, Inc. Assigning backup resources based on failover of partnered data storage servers in a data storage management system
CN110928498B (zh) * 2019-11-15 2023-11-10 浙江大华技术股份有限公司 一种目录遍历的方法、装置、设备和存储介质
CN113220501A (zh) * 2020-02-06 2021-08-06 伊姆西Ip控股有限责任公司 用于数据备份的方法、设备和计算机程序产品
US11099956B1 (en) 2020-03-26 2021-08-24 Commvault Systems, Inc. Snapshot-based disaster recovery orchestration of virtual machine failover and failback operations
US11645175B2 (en) 2021-02-12 2023-05-09 Commvault Systems, Inc. Automatic failover of a storage manager
US12007845B2 (en) * 2022-07-25 2024-06-11 Dell Products L.P. Method and system for managing data slice backups based on grouping prioritization

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5367698A (en) * 1991-10-31 1994-11-22 Epoch Systems, Inc. Network file migration system
JPH0827754B2 (ja) * 1992-05-21 1996-03-21 インターナショナル・ビジネス・マシーンズ・コーポレイション コンピュータシステムにおけるファイル管理方法及びファイル管理システム
US5963962A (en) * 1995-05-31 1999-10-05 Network Appliance, Inc. Write anywhere file-system layout
US5572709A (en) * 1993-06-18 1996-11-05 Lucent Technologies Inc. Using dynamically-linked libraries to add side effects to operations
US5689706A (en) * 1993-06-18 1997-11-18 Lucent Technologies Inc. Distributed systems with replicated files
US5778395A (en) * 1995-10-23 1998-07-07 Stac, Inc. System for backing up files from disk volumes on multiple nodes of a computer network
US5761677A (en) * 1996-01-03 1998-06-02 Sun Microsystems, Inc. Computer system method and apparatus providing for various versions of a file without requiring data copy or log operations
US5828876A (en) * 1996-07-31 1998-10-27 Ncr Corporation File system for a clustered processing system
US6032216A (en) * 1997-07-11 2000-02-29 International Business Machines Corporation Parallel file system with method using tokens for locking modes
US6697846B1 (en) * 1998-03-20 2004-02-24 Dataplow, Inc. Shared file system
JP2000076110A (ja) 1998-08-28 2000-03-14 Hitachi Ltd 分散ファイルシステムにおける回復処理システム
US6415300B1 (en) 1999-07-06 2002-07-02 Syncsort Incorporated Method of performing a high-performance backup which gains efficiency by reading input file blocks sequentially
AU2001238269B2 (en) * 2000-02-18 2006-06-22 Emc Corporation Hash file system and method for use in a commonality factoring system
JP2002082825A (ja) 2000-06-23 2002-03-22 Sharp Corp ファイル管理方法
AU6778601A (en) * 2000-06-26 2002-01-08 International Business Machines Corporation Data management application programming interface for a parallel file system

Also Published As

Publication number Publication date
US20040267838A1 (en) 2004-12-30
KR100600933B1 (ko) 2006-07-13
JP2005018758A (ja) 2005-01-20
KR20050001304A (ko) 2005-01-06
US7092976B2 (en) 2006-08-15

Similar Documents

Publication Publication Date Title
JP4157858B2 (ja) ストレージ・エリア・ネットワーク(san)ファイル・システムの並列高速バックアップ
JP4160933B2 (ja) 超大規模ファイル・システムでのファイル・システム使用のすばやい復元
EP1430400B1 (en) Efficient search for migration and purge candidates
US11288128B2 (en) Indexing a relationship structure of a filesystem
US8095678B2 (en) Data processing
US8640136B2 (en) Sharing objects between computer systems
US8176087B2 (en) Data processing
US8316008B1 (en) Fast file attribute search
AU2002360252A1 (en) Efficient search for migration and purge candidates
AU2002330129A1 (en) Sharing objects between computer systems
AU2002349890A1 (en) Efficient management of large files

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071120

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20071205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20071205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080311

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080610

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080708

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20080708

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080714

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110718

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110718

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120718

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130718

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees