JP4075203B2 - データバックアップシステム - Google Patents

データバックアップシステム Download PDF

Info

Publication number
JP4075203B2
JP4075203B2 JP10216799A JP10216799A JP4075203B2 JP 4075203 B2 JP4075203 B2 JP 4075203B2 JP 10216799 A JP10216799 A JP 10216799A JP 10216799 A JP10216799 A JP 10216799A JP 4075203 B2 JP4075203 B2 JP 4075203B2
Authority
JP
Japan
Prior art keywords
file
client
data
server
common
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP10216799A
Other languages
English (en)
Other versions
JP2000293420A (ja
Inventor
健一 木原
平田  俊明
太朗 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP10216799A priority Critical patent/JP4075203B2/ja
Priority to US09/542,160 priority patent/US6625625B1/en
Publication of JP2000293420A publication Critical patent/JP2000293420A/ja
Application granted granted Critical
Publication of JP4075203B2 publication Critical patent/JP4075203B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • G06F11/1453Management of the data involved in backup or backup restore using de-duplication of the data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1461Backup scheduling policy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • Y10S707/99953Recoverability
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • Y10S707/99955Archiving or backup

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computer And Data Communications (AREA)

Description

【0001】
【発明の属する技術分野】
本発明はネットワークシステムにおける複数のクライアント機のバックアップ(データの保存)・リストア(データの復旧)方法に関する。
【0002】
【従来の技術】
ネットワーク/システム管理の分野ではTCO(総保有コスト)の低減が課題になっており、クライアント機の管理コストがTCO低減の足かせになっている。特にディスククラッシュからの復旧には、OSやアプリケーションソフトの再インストールや環境設定等、膨大な手間がかかり、管理コスト上昇の元凶となっている。
【0003】
従来からディスククラッシュからの復旧に対応するためには、バックアップが有効であることは知られているが、ネットワークシステムにおけるバックアップについても例えば特開平2-297643号公報に記載されているような技術がある。この技術は複数のクライアント(ワークステーション)機のバックアップを目的としたもので、バックアップ用のサーバを設置し、クライアント上のバックアップファイルをバックアップ用サーバに蓄積する。
【0004】
【発明が解決しようとする課題】
前記技術によると、サーバ上でのデータバックアップ領域のサイズは、全クライアント機(ワークステーション)のバックアップデータの総和となり、クライアント台数が多いとサーバ上のデータバックアップ領域も巨大なものが必要となる。バックアップに要するディスク容量を考え、サーバのみバックアップを行いクライアントのバックアップをあきらめてしまうと、結果的にディスククラッシュから復旧できないという問題が生じることになる。
【0005】
本発明の目的は、複数のクライアント機が使用される環境において、クライアント機の記憶装置のバックアップデータサイズを縮小することであり、さらにバックアップへの障害をなくすことでバックアップを促しディスククラッシュからの復旧に対応できるようにすることであり、さらにシステムの管理コストを低減することである。
【0006】
【課題を解決するための手段】
上記目的を達成するために本発明では、各クライアントが持つデータ(ファイル群)内の共通部分を検出し、クライアントのデータ間に共通な部分と各クライアントのデータに固有な部分に分けて保存(バックアップ)することで、バックアップデータの総容量を低減する。
【0007】
同じネットワークシステム内にあるクライアント機それぞれが持つファイルまたはファイル群は、互いに同じような構成、内容になることが多い。その結果、各クライアントのバックアップデータの内容も似通った内容になりやすい。本発明はその特性を利用する。
【0008】
すなわち本発明は、記憶手段を持つ機器における一つあるいは複数のデータで構成されるバックアップデータを蓄積する手段において、異なる前記機器用の前記バックアップデータに含まれるデータの内容を比較し、前記データ内容に同一のものが発見されれば、前記内容が同一のデータを一つのデータに集約して蓄積する事を特徴とするものである。
【0009】
さらに本発明は、前記機器用の前記同一の単数または複数のデータを蓄積する記憶手段と、前記同一のデータ以外の前記機器用の単数または複数のデータを蓄積する記憶手段を持つことを特徴とするものである。
【0010】
さらに本発明は、前記機器用の単数または複数のデータを蓄積する手段すなわち共通データ蓄積手段と、前記機器別に前記共通データ蓄積手段に含まれるデータの中のどのデータが前記機器用バックアップデータに含まれているかを示す情報を蓄積する記憶手段すなわちデータ所有情報記憶手段とを、持つことを特徴とするものである。
【0011】
さらに本発明は、前記バックアップデータを蓄積する手段に蓄積された一つあるいは複数のデータを、前記機器別に取り出す機能を持つことを特徴とするものである。
【0012】
さらに本発明は、前記バックアップデータを蓄積する手段すなわちサーバと、データバックアップの対象である前記機器であり、前記サーバとの間で情報をやりとりする機能を持つ手段すなわちクライアントを持つことを特徴とするものである。
【0013】
さらに本発明は、前記クライアントと前記サーバの間でデータ名やデータサイズ、データの更新日時等のデータ属性情報を送信することを特徴とするものである。
【0014】
さらに本発明は、前記クライアントと前記サーバ間でやりとりされた前記データ属性情報にもとづいて前記クライアントから前記サーバに転送する必要のあるデータを決定することを特徴とするものである。
【0015】
さらに本発明は、前記クライアントと前記サーバの間で巡回冗長符号やチェックサム等データ内容から計算されるチェックコードをやり取りすることを特徴とするものである。
【0016】
さらに本発明は、前記クライアントと前記サーバ間でやりとりされた前記チェックコードにもとづいて前記クライアントから前記サーバに転送する必要のあるデータを決定することを特徴とするものである。
【0017】
さらに本発明は、前記クライアントから前記サーバに情報を伝達する手段とは異なる手段で前記サーバから前記クライアントに情報を伝達することを特徴とするものである。
【0018】
さらに本発明は、前記サーバから前記クライアントへの情報伝達手段として、記憶媒体を用いることを特徴とするものである。
【0019】
さらに本発明は、前記サーバから前記クライアントへの情報伝達手段として、通信衛星等の大容量のデータ転送に向く通信手段を用いることを特徴とするものである。
【0020】
【発明の実施の形態】
1.第一の実施例:基本構成
図1はその原理を示した図である。サーバ10、ネットワーク20、クライアントA30、クライアントB31の四つの構成要素からなる。図1では、クライアントは二台表記しているが、一台あるいは三台以上でも問題ない。クライアントA30、クライアントB31はサーバ10とネットワーク20経由で接続されている。
【0021】
各クライアントはローカルにファイルを持っており、バックアップの際にそれぞれそのファイルをサーバ10に送信する。サーバ10は各クライアントから送られたファイルを共通/固有振り分け処理101で、共通部分と固有部分とに分け、共通部分を共通ストア103に、クライアントA30の固有部分はクライアントA固有ストアA041、クライアントB31の固有部分はクライアントB固有ストアA042に保存する。
【0022】
たとえば図1の実施例では、クライアントA30はファイル装置301内にFile A、File B、File C、File Dという四つのファイルを持っていて、クライアントB31はFile A、File C、File Eという三つのファイルを持っている。両クライアントに共通するFile AとFile Cについては、共通ストア103に格納される。また、クライアントA30が持つファイル装置301内のFile B、File DについてはクライアントA30固有なので、固有ストアA1041に格納する。同様にクライアントB31のファイル装置311内のもFile Eも固有ストアB1042に格納する。File AとFile Cについては、別々に格納するのではなく、一つにまとめることで保存領域を節約できる。
【0023】
バックアップされたファイルを元のクライアントに戻す場合には、共通ストア103内のファイルとクライアント固有ストアの内容を合わせることで元のファイル(群)が得られる。そのファイル合成を行うのが個別ファイル合成処理102である。たとえばクライアントA30のファイル装置301のリストアが必要になったら、共通ストア103内のFile A、File CとクライアントA固有ストアA041内のFile B、File DをクライアントA30用のリストアデータとする。
【0024】
図2はネットワークシステム内で使われるサーバ装置およびクライアント装置のハードウェア構成の例である。内部はCPU41、メモリ42、キーボード43、ディスプレイ44、ハードディスクドライブ45、ネットワークインタフェース46の部品で構成されている。ネットワークインタフェース46は、他のマシンとネットワーク20で接続されている。
【0025】
図3は内部処理方法を説明する図で、図1のデータの流れを示したものである。クライアントA30はファイル装置301、ファイル送信機能302、ファイル受信機能303を持つ。ファイル装置301はクライアントA30で使われるファイルを保持するもので、前記ハードディスクドライブ45に相当する。ファイル送信機能302はファイルのバックアップを行う際に、サーバ10にファイル装置301内のファイルを送信する機能を持つもので、前記メモリ42上に前記CPU41が実行するプログラムとして実現される。その逆にファイル受信機能303はファイルのリストアを行う際にサーバ10からファイルを受け取り、ファイル装置301に格納する機能を持つもので、前記メモリ42上に前記CPU41が実行するプログラムとして実現される。
【0026】
サーバ10はクライアントA30から送られてくるファイルを、共通/固有振り分け処理101(前記CPU41が前記メモリ42上で実行するプログラムとして実現される)内のファイル受信1011で受け取り、クライアント別にクライアントA用受信バッファ1012またはクライアントB用受信バッファ1013に格納する(受信バッファはバックアップが必要となるクライアントの台数分を前記ハードディスクドライブ45に用意すればよい)。各受信バッファに格納されたファイルはAND1014で共通部分を抽出され、前記ハードディスクドライブ45内の共通ストア103に格納する。また、SUB1015によってクライアントA用受信バッファ1012から共通部分を差し引いたものを前記ハードディスクドライブ45内の固有ストアA1041に格納する。同様にSUB1016によってクライアントB用受信バッファ1012から共通部分を差し引いたものを前記ハードディスクドライブ45内の固有ストアB1042に格納する。
【0027】
またリストアの際には、個別ファイル合成処理102(前記CPU41が前記メモリ42上で実行するプログラムとして実現される)において、リストアが必要なクライアントに応じて共通ストアと固有ストアを合成したものを、ファイル送信1021を用いてクライアントに送信する。たとえばクライアントA30にリストアが必要な場合には、ADD1022を使って共通ストア103と固有ストアA1041の内容を合わせてクライアントA30に送信する。
【0028】
図4はクライアントとサーバ間のバックアップのプロトコルを示したものであり、上述の各処理プログラムによって実行される。バックアップの際にはクライアントA30からサーバ10に対してファイルバックアップ情報50を送信する。ファイルバックアップ情報50の中は、コマンドID(バックアップ操作を示す識別コード)、クライアント特定用のIDの後に各ファイルのデータを続ける。各ファイルのデータの内容はファイルパス名、ファイル属性、ファイル本体などを含めればよい。
【0029】
図5はクライアントとサーバ間のリストアのプロトコルを示したものであり、上述の各処理プログラムによって実行される。リストアの際には、クライアントA30からリストア要求51をサーバに発行する。リストア要求51の内容にはコマンドID(リストア要求を示す識別コード)とクライアントIDを含める。リストア要求51を受けたサーバ10はリストア要求51内のクライアントIDを元に、前に示した方法でクライアント用ファイルを作成し、リストアファイル情報52として、クライアントに送信する。リストアファイル情報52は、コマンドID(リストアファイル情報であることを示す識別コード)にファイル本体が続く。
【0030】
図6はサーバ側のメイン処理の流れを示したものであり、上述の各処理プログラムによって実行される。クライアントからのコマンドを受信し、受信したコマンドが終了指示なら終了し、バックアップ情報50ならバックアップ処理を、リストア要求51ならリストア処理を実行する。
【0031】
図7はサーバ側のバックアップ処理の内容を示したものであり、上述の各処理プログラムによって実行される。クライアントから送られてきたファイルをクライアント受信バッファにスプールする。前述の通り、クライアントA用受信バッファ1012またはクライアントB用受信バッファ1013に格納する。次に、すべての受信バッファの内容を確認し、全クライアントからのバックアップファイルが集まったかどうかを判断する。全部集まっていなければ終了する。集まっていれば全受信バッファに共通するファイルを抽出し、共通ストア103に格納する。また、各受信バッファ固有のファイルは固有ストアA1041と固有ストアB1042に格納する。
【0032】
図8はサーバ側のリストア処理の流れを示したものであり、上述の各処理プログラムによって実行される。共通分のファイルとリストア要求を出したクライアントの固有ストアのファイルとをリストア要求を出したクライアントへ送信する。
サーバ10内でのファイルの共有状況は内部処理なので直接目に見えない。そこで共有状況を画面に表示すれば共有の効果を目視で確認できるようになる。
【0033】
図9は共有の効果を確認するため図2のディスプレイ44上に、共通/固有振り分け処理101によって表示される画面例で、固有格納分と共有格納分のファイルサイズを表示している。オリジナル総ファイルサイズ901はクライアント側のファイルの合計(共有なし)、固有格納分はクライアント固有ストア(図3では1041,1042)の合計サイズ、共有格納分は共通ストア103のサイズをそれぞれ表示している。また削減率904は固有格納分902と共通格納分903を足したものをオリジナル総ファイルサイズ901で割った値を表示しており、ファイル共有による効果の度合いを示している。
図10は図2のディスプレイ44上に、共通/固有振り分け処理101によって表示されるクライアント別共有比率の表示画面例で、クライアント別906に何パーセントのファイルが共有されているかを、ファイルの個数907とファイルのサイズ908の観点で表示している。
図11は図2のディスプレイ44上に、共通/固有振り分け処理101によって表示される共有状況の表示画面例で、共通ストア内のファイルおよび固有ストア内のファイルをそれぞれ表示することで、どのファイルが共有されているかを目視で確認できる。
【0034】
上述のように、第一実施例によれば、クライアント機のバックアップデータをサーバに集め、バックアップデータをクライアント間で比較し、同じファイルがあれば一つに集約して保存することで、サーバ上のディスクスペースを節約できる。
【0035】
2.第二の実施例
第二の実施例として、サーバ10上でのバックアップ用ファイルの格納方法を変更した案を図12に示す。第一の実施例(図3)の共通/固有振り分け処理101、個別ファイル合成処理102、クライアントA固有ストアA041、クライアントB固有ストアA042に代わり、第二の実施例ではマルチクライアントファイル格納処理1051(前記CPU41が前記メモリ42上で実行するプログラムとして実現される)、オーナー対応表1052(前記メモリ42上に実現される)、マルチクライアントファイル取り出し処理1053(前記CPU41が前記メモリ42上で実行するプログラムとして実現される)を備えている。なお第二の実施例はサーバ10のみの変更で、クライアントA30には変更は必要ない。
【0036】
オーナー対応表1052は、共通ファイル103内のファイルについてどのクライアントがそのファイルを所有しているかを示すデータで図13に例示するように、共通ストア上のファイル毎に、ファイルID10521、オーナー10522、ファイルパス名10523が記されており、オーナー対応表1052内の横一行が一レコードになっている。
【0037】
ファイルID10521はオーナー対応表1052と共通ストア103の結びつけを行うためのもので、そのレコードが共通ストア103上のどのファイルに対するものかを示すための情報となっている。図13の例では、ファイルID10521は1001や1002などの数値で示しているが、区別可能なら記号でもよい。オーナー10522はそのファイルがどのクライアントによって所有されているかを示している。ファイルパス名10523はそのファイルがクライアントのファイル装置301上でどこ(のファイルパス)に配置されていたか(および配置させるか)を示すものである。
【0038】
図14はオーナー対応表1052の他の例である。図13では共通ストア103内の一ファイルに対してオーナー対応表1052の一行(一レコード)が対応していたが、図14では共通ストア103内の一ファイルがオーナー対応表1052の複数行に対応する。こうすることで、ファイルパス名10523(あるいはタイムスタンプ10524もしくは属性10525)は異なるがファイルの内容は同じ場合に、図13の例では複数のファイルが共通ストア103に格納されることになるが、図14の例では一つで済む。図14の例では、ファイルIDが1001のファイルは、クライアントAのファイル装置103上ではC:\DIR1\FILE01の場所に置かれているが、クライアントBではD:\DIR2\FILE01の場所に置かれていることを示している。
【0039】
マルチクライアントの格納処理1051の内容を図15に例示する。クライアントからファイルを受信すると、オーナー対応表1052からその送信元のクライアントの情報を取り除く。たとえばクライアントBからファイルを受信したとき、図14の例の場合、(図14に現れている範囲内で)二行目と三行目のレコードが削除される。レコードを削除した結果、オーナーが存在しなくなった共通ストア103内のファイルは、共通ストア103から削除する。以下、クライアントから受信した各ファイルについて次の処理を行う。すなわち、すでに同じファイルが共通ストア103上に存在するかどうかを判断し、共通ストア103内になければそのファイルを共通ストア103に格納し、共通ストア103内にある・ないに関わらずオーナー対応表1052の内容を更新する。
【0040】
第一の実施例と同様に、サーバ10内での共有状況を表示する仕組みを持たせると利用者が共有状況を確認できるので良い。図16はその画面例である。統計情報911として、オリジナル総ファイルサイズ(クライアントのファイルのサイズの合計)、格納ファイルサイズ(共通ストア103内に格納されているファイルのサイズの合計)、節約できたバイト数(前者二つの差)を示している。また共通ストア103内に格納されているファイルの一覧912として、共通ストア103内の各ファイルについてそれぞれファイルサイズとオーナー数を表示している。
【0041】
この第二の実施例によれば、あるファイルが総てのクライアントに共通でなくても二台以上に共通していれば共有可能になる。そのため、第二の実施例の方がよりディスクスペースを節約できる可能性がある。
【0042】
第二の実施例において、クライアントから送られてきたファイルと同じ内容のファイルが、すでに共通ストア103内にあるかどうかを判定する方法について説明する。クライアントから送られてきたファイルのそれぞれについて、共通ストア103内に格納されているファイル(群)の先頭から順に比較を行う手法を使った場合、次の二つの要因で処理量が膨大になる。
【0043】
要因1.比較回数が膨大
共通ストア103内の先頭から順に比較を行うので、クライアント側のファイル一つあたり、最悪で共通ストア103内のファイル個数回の比較が必要になる。平均でもファイル個数の半分程度の比較回数が必要になる。クライアント側の全ファイルに対してその処理を行う場合、平均で、「クライアント側の全ファイル」*「共通ストア内のファイル個数」/2回の比較が必要になる。たとえば、クライアントから1,000個のファイルが送られて、共通ストア103内に10,000個のファイルが存在する場合、比較回数は、最悪10,000,000回程度の比較が必要になる。
【0044】
要因2.比較一回あたりの処理量が膨大
ファイル内容同士を比較するため、比較一回あたりの処理量も大きくなる。
【0045】
そこで、比較回数を低減する方式について説明する。
【0046】
比較一回あたりの処理量が大きい点については、ファイル本体を比較する前にファイルパス名やファイルの長さ、チェックサム等を比較することで処理量を低減できる。また、比較回数が多い点は、オーナー対応表や共通ストア103内の情報をファイル名等でソートしておくことで、二分探索法などの効率の良い検索(比較)が行えるようになる。
【0047】
ファイルの長さをキーとしたファイル比較の効率化手法の例を一つ挙げる。本効率化手法例ではファイル探索を効率化するために、ファイル早見表109を用意する。ファイル早見表109の構造を図17に示す。ファイル早見表109は単数あるいは複数のファイル早見情報1091で構成されており、各ファイル早見情報1091はさらにファイルサイズ10911、チェックサム10912、ファイルID10913を含む。ファイル早見情報1091の並びは、ファイルサイズを主キー、チェックサムを副キーとしてソートされている。すなわち基本的にファイルサイズでソート済みで、ファイルサイズが同じファイル早見情報1091同士はチェックサムでソートする。クライアントから送られてきた個々のファイルのファイルサイズとチェックサムを比較対象の絞り込みに使用する。
【0048】
図18はファイル早見表109を用いた探索手法の例である。この図では、クライアントから送られてきたファイル108の内の一つに対して、共通ストア103内に存在するかを探し出す手順を示している。第一ステップは、クライアントから送られてきたファイル108のファイルサイズ(図18の例では32バイト)のファイル情報をファイル早見表109内から見つけだす。前述の通り、ファイル早見表109はファイルサイズでソートされているため、二分探索法による探索が可能である。図18の例ではファイルサイズが32バイトのファイルは三つある。第二ステップは、クライアントから送られてきたファイル108のチェックサムと同じ値のチェックサムを持つファイル情報を第一ステップで見つけたファイルの中から探し出す。前述の通り、ファイル早見表109はチェックサムでもソートされているため、この探索処理においても二分探索法が使える。図18の例ではチェックサムが一致するものは一つだけだった。第三のステップでファイル本体の比較を行う。第二ステップで発見したファイルの本体(図18の例ではファイルID=1001のもの)とクライアントから送られてきたファイル108の本体を比較する。
【0049】
このような手順を踏むことで、ファイル本体の比較は、ファイルサイズおよびチェックサムが一致するものに限定できるため処理量を低減できる。なお図18の例ではファイルサイズにチェックサムを併用したが、チェックサム算出に要する処理負担が気になる場合には、ファイルサイズのみとしても良い。
【0050】
3.第三の実施例
第三の実施例はサーバ10とクライアントA30間のプロトコル(通信手順)に関するものであり、第一の実施例、第二の実施例に付け加える形で実現できる。以下では、第二の実施例の構成に基づいて説明する。
【0051】
第三の実施例は、バックアップの際に行われるクライアントA30からサーバ10へのファイル転送時のファイル転送量を削減することを目的としている。その実現のためにサーバ10上にすでにあると考えられるファイルは転送しない仕組みを持たせる。クライアントA30側のファイルがサーバ10側にすでにあるかどうかは、ファイルのパス名、サイズ、タイムスタンプなどのファイルに付属する情報、あるいはファイルの中身のチェックサムやCRC(巡回冗長符号)などで判断する。なおリストアについては第二の実施例と同じ仕組みが使える。
【0052】
図19は第三の実施例を実装するシステム構成例である。図19の構成は、第二の実施例で出てきた図12の構成に転送量削減折衝処理S106(前記CPU41が前記メモリ42上で実行するプログラムとして実現される)と転送量削減折衝処理C304(前記CPU41が前記メモリ42上で実行するプログラムとして実現される)を加えた形になっている。第三の実施例では、図19の構成を前提として説明を進める。
【0053】
図20は第三の実施例のサーバ10−クライアントA30間のバックアップ時のプロトコルを示したものである。クライアントA30−サーバ10間でやりとりされる情報の形式は、コマンドID(通知の内容を示す識別コード)+オプション情報(通知内容によって異なる)となっている。以下、その手順を追う。
【0054】
最初にクライアントA30からサーバ10に対してファイルバックアップ要求801を発行する。それを受けたサーバ10はクライアントA30に対してファイル情報問い合わせ802を発行する。ファイル情報問い合わせ802の中には、要求する情報種別8021が含まれ、前記同一性チェックのための項目(ファイルパス名、サイズ、タイムスタンプ、チェックサム、CRC等)をクライアント側に知らせる。たとえばファイルのパス名とサイズ、タイムスタンプを同一性チェックの基準とするなら、ファイル情報問い合わせ802の中でファイルのパス名、サイズ、タイムスタンプと指定する。なお、ファイル情報問い合わせ802の中には、ファイルの範囲指定も可能で、全部あるいは指定範囲のみの二通りの設定8022が可能。指定範囲のみとした場合には、ファイルのパス名がその後に続く。ファイル情報問い合わせ802を受けたクライアントA30は、自身のファイル装置301内のファイルについて、ファイル情報問い合わせ802内で指定された項目についてファイル装置301の中を調べ、ファイル情報送信803としてサーバ10に通知する。ファイル情報送信803の中にはファイル情報8031が含まれており、さらにファイル情報8031の中にはファイルパス名80311と要求された情報80312が含まれている。要求された情報80312は、ファイルパス名80311に関する、要求する情報種別8021の情報(サイズやタイムスタンプ、チェックサム、CRC等)を入れる。ファイル情報送信803を受けたサーバ10は、ファイル情報送信803の中に含まれるファイル情報を調べ、共通ストア103や、第二の実施例に示す構成の場合のオーナー対応表1052に同じ内容のファイルが存在しないかを検索する。そして、ファイル情報送信803に含まれるファイル情報のうち、共通ストア103およびオーナー対応表1052(第二の実施例の場合)にないファイルのファイルパス名をファイル送信要求804として、クライアントA30に通知する。ファイル送信要求804を受けたクライアントA30は、要求されたファイル本体をファイル送信805としてサーバ10に送信する。サーバ10はファイル送信805を受けて、その内容を共通ストア103に格納するとともにオーナー対応表1052の内容を更新する。最後にサーバ10はクライアントA30に対して終了通知806を送信することでバックアップ処理を終了した旨を通知して終了する。
【0055】
なお要求する情報種別が固定あるいはクライアント側で確定している場合には、ファイルバックアップ要求801、ファイル情報問い合わせ802をスキップし、ファイル情報送信803から始めても良い。また図20の場合、ファイル送信805がバックアップ処理の最後だと分かっているので、終了通知806も省略可能である。
【0056】
前述の同一性チェック項目の内容はユーザによって変更可能な形を取っても良い。図21はその設定画面例である。大きな選択項目として、ファイル本体の照合が必要913か不要914かがある。同一性チェックの際、ファイルの内容についてもチェックする必要がある場合には、ユーザは必要913を選択する。ファイル内容のチェックが不要な場合には、ユーザが不要914を選択する。ユーザが必要913を指定した場合には第二の実施例と同等な動作となる。ユーザが不要914を選択した場合、さらに同一性チェックの際にファイルのどの項目を評価するかをユーザに選択させる。この画面で設定した内容をサーバ10内で記憶しておき、前記プロトコル内のファイル情報問い合わせ802中で要求する情報種別8021で指定するようにすれば良い。
【0057】
図22は、図20に示すプロトコルを実現するクライアント側の処理フローチャートである。最初にサーバ10に対してバックアップ要求801を発行し、サーバ10からの応答を待つ。サーバ10からの応答が来たらその内容を調べ、終了通知なら終了する。またサーバ10からの応答が、ファイル情報問い合わせ802なら自身のファイル装置301内を調べてファイル情報送信803をサーバ10に通知し、再びサーバ10からの応答待ちに入る。サーバ10からの応答がファイル送信要求804ならファイル送信要求804内で指定されたファイルの本体を自身のファイル装置301から取り出し、ファイル送信805としてサーバ10に送信した上で、再びサーバ10からの応答待ちに入る。
【0058】
同じく図20の第三の実施例の前記プロトコルを実現するサーバ10側の処理フローチャートを図23および図24に示す。
【0059】
クライアントA30からのバックアップ要求801を受信したら、まずファイル本体の照合が必要かどうかを判定する(7210)。これは第三の実施例の前記同一性チェック設定(図21)で設定された内容を受けて判断する。必要911な場合には、クライアントに全ファイルの送信要求を発行し(7213)、以下、第二の実施例と同様に、ファイルをクライアントA30から受け取り、受信したファイルのそれぞれについて、共通ストア103内に同一内容のファイルが無いかどうかを確認しオーナー対応表1052と共通ストア103の内容を更新し(7214)、復帰(処理を終了)する。
【0060】
不要912の場合には、バックアップ要求801を出したクライアントA30に全ファイルのファイル情報問い合わせ802を発行する(7211)。このファイル情報問い合わせ802の内容は、クライアント側処理の高速化のため図21で設定した内容から、チェックコードを除いたものにする。チェックサムやCRCなどのチェックコード処理を行っても性能的に問題無い場合には、7216、7217、7218、7219の処理を7211の処理中に行ってもよい。
【0061】
クライアントA30から送られてくるファイル情報送信803を受信する(7212)。続いて同一見込みリスト1061を作成する(7215)。同一見込みリスト1061は図25に示すようにファイルのパス名の一覧であり、その記憶には一時的なメモリ領域(変数領域)を使用すれば良い。図23の処理7212で受け取った内容と、共通ストア103とオーナー対応表1052の内容を比較し、共通するファイルのパス名を同一見込みリスト1061に格納する)。
【0062】
続いてチェックコードによる確認が必要かどうかを判定する(7216)。必要でないなら、図24の処理(7221)に進む。必要な場合には、図23の処理7217、7218、7219を実行する。すなわち、同一見込みリスト1061中の各ファイルのチェックコードをクライアント側に要求する(7217)。言い換えると、処理7216では図23の処理7211、7212で照会した結果、同一であると考えられるファイルのチェックコードをクライアントに要求していることになる。そしてクライアントからチェックコードを受信し(7218)、共通ストア内のファイルのチェックコードと比較し、チェックコードが同じでないファイルを同一見込みリスト1061から取り除き(7219)、図24の処理(7221)に進む。
【0063】
図24では、最初に同一見込みリスト1061に入っていないファイルがあるかどうかを判定し(7221)、ない場合には復帰(処理を終了)する。ある場合には、同一見込みリストに入っていないファイルの送信要求をクライアントに発行し(7223)、以下、第二の実施例と同様に、ファイルをクライアントA30から受け取り(7224)、受信したファイルのそれぞれについて、共通ストア103内に同一内容のファイルが無いかどうかを確認しオーナー対応表1052と共通ストア103の内容を更新し(7225)、復帰(処理を終了)する。続いて、同一見込みリスト1061が空かどうかを判断し(7226)、空なら復帰(処理終了)。そうでないなら、同一見込みリスト1061内の各ファイルについてオーナー対応表の内容を更新(処理対象となっているクライアント名を追加)(7227)し、復帰(処理終了)する。
【0064】
上述のように、第三の実施例によれば、クライアントからサーバにバックアップファイルを送信する際に、ファイル属性情報(ファイルパス名・ファイルサイズ・タイムスタンプなど)やファイル内容のチェックコード(CRC・チェックサム等)をサーバ・クライアント間で事前に交換することで、サーバ上にすでにあるファイルを再度送らずにすませることができ、バックアップ時のサーバの処理負荷、クライアントの処理負荷、ネットワーク負荷を低減し、バックアップ処理時間も短縮できる。
【0065】
4.第四、第五の実施例の概要
第四、第五の実施例はリストア時に発生するサーバ10からクライアントA30へのファイル転送の方法に関するもので、第一の実施例、第二の実施例、第三の実施例のリストア処理に追加あるいはリストア処理を置き換える形で適用できる。以下、第四、第五の実施例に共通する内容について説明する。
【0066】
クライアントA30のバックアップファイルをサーバ10に保管する場合、同じクライアントA30のバックアップ処理を繰り返すと、第三の実施例あるいは差分バックアップ等の技術を用いることで、クライアントA30からサーバ10への毎回のファイル転送量は低減される。一方、リストアでは対象クライアントのリストア用のファイルをすべて送るため、ファイル転送量は大きくなる。一般的にバックアップは定期的に行われるのに対して、リストアの頻度は低い。
【0067】
すなわち、バックアップでは比較的小容量のファイル転送が多く行われるのに対して、リストアでは大容量のファイル転送が低い頻度で発生する。第四、第五の実施例はこのファイル転送の性質の違いを利用し、バックアップ時とリストア時とでファイル転送手段を変えるものである。
【0068】
5.第四の実施例:記憶メディアによるリストア
以下、第四の実施例を第二の実施例をベースに説明するが、第一の実施例、第三の実施例にも適用可能である。
【0069】
第四の実施例ではリストア時に発生するサーバ10からクライアントA30へのファイルの受け渡しに記憶メディアを使う。そのためサーバ10、クライアントA30双方に記憶メディアの読み書き装置を設ける。
【0070】
図26はサーバ10のハードウェア構成を示したもので、図2に示す第一の実施例のハードウェア構成に記憶メディア書き込み装置47を追加している。記憶メディア書き込み装置47は記憶メディア49に情報を書き込む機能を有するもので読み書き兼用であってもよい。記憶メディア49はたとえばMO、CD−ROM(書き換え可能型)、DVD(書き換え可能型)などの可搬型の記憶メディアが好ましいが、必ずしも可搬型である必要はなく、サーバ10からクライアントA30にデータ(ファイル)を受け渡し可能な記憶手段ならば良い。
【0071】
図27はクライアントA30のハードウェア構成を示したもので、サーバ10の場合と同様、第一の実施例で取り上げた図2に記憶メディア読み込み装置48を追加したものになっている。記憶メディア読みとり装置48は、少なくとも記憶メディア49に格納されている情報を読み出す機能を有している。書き込み機能を有していても差し支えない。
【0072】
図28は記憶メディアによるリストア処理のためのシステム構成とデータの流れを示した図である。サーバ10内に、オーナー対応表1052、共通ストア103、クライアント用メディア作成処理1062、メディア書き込み処理1063を備える。オーナー対応表1052、共通ストア103は図12に記したものと同じである。リストアデータ生成処理1062(前記CPU41が前記メモリ42上で実行するプログラムとして実現される)はオーナー対応表1052、共通ストア103を元にクライアントに渡すデータを生成する機能を持つ。メディア書き込み処理1063(前記CPU41が前記メモリ42上で実行するプログラムとして実現される)はリストアデータ生成処理1062で作られたデータを記憶メディア49に書き込む機能を持つ。一方、クライアントA30内にはメディア読み取り処理3051とリストア処理3052(それぞれ前記メモリ42上に前記CPU41が実行するプログラムとして実現される)、ファイル装置301がある。メディア読み取り処理3051は記憶メディア49内に記憶されている情報を読み出す機能を持つ。
【0073】
図29は記憶メディア49の記憶内容を示した図である。記憶メディア49内に複数台のクライアントの情報を含む場合と単独のクライアントの場合とでは構造が異なる。複数格納時491の場合には、オーナー対応表4911と共通ストアファイル4912を含んでいる。すなわち、記憶メディア49上でもクライアント間でのファイル共有手法が働くようにしている。なお代案として、複数のクライアントファイルを個別に格納する形(493)にしても良い。単独の場合には、リストア対象のクライアント用のファイルを入れる(492)。
【0074】
図30はサーバ側の記憶メディア作成処理1062を示した図である。最初に全クライアントのリストアデータを記憶メディア49に格納するか、一部を格納するかをたとえば図31に示す選択画面中の全体915か指定916にてユーザに選択させる。指定916が選択された場合にはさらにどのクライアントかをユーザに選択させる。常にクライアント全体を選択する形で良いならこの選択画面は必要ない。次にユーザによって選択されたクライアントの台数が単数か複数かを判定する。複数ならオーナー対応表1052の中を調べ、指定された複数クライアントがオーナーとなっているレコードを抜き出し記憶メディア49に書き込み、さらにそのファイルの本体を共通ストア103から抜き出して記憶メディア49に書き込む。単数の場合には、オーナー対応表1052の中を調べ、指定されたクライアントがオーナーとなっているファイルの本体を共通ストア103から抜き出して記憶メディア49に書き込む。
【0075】
図32はクライアント側のリストア処理3052の流れを示した図である。まず記憶メディア49に格納されている内容を調べ、オーナー対応表4911が含まれているかどうかを判定する。オーナー対応表4911が無いなら、単数のクライアントの情報が含まれていると判断し、特定クライアント用ファイル4921の内容をクライアントA30自身のファイル装置301にリストアして、リストア処理は終了となる。オーナー対応表4911があるなら、オーナー対応表4911内に登場するクライアントのうち、どのクライアントに対してリストア操作を行うかをたとえば図33のようなユーザへの確認画面を用いてユーザに確認する。またクライアントA30のOS(Operating System)がクライアント名を保持しているなどの理由で、クライアントA30自身がクライアント名を知る手段があるならその手段を使って得られたクライアント名を自動的に選択する形にしても良い。その場合にはユーザによるクライアント名の選択操作は不要になる。クライアント名が明らかになった所で、記憶メディア49内のオーナー対応表4911の内容を調べ、該当クライアント用のファイル(群)を見つけだし、共通ストアファイル4912から対応するファイルの本体を取り出し、ファイル装置301にリストアして終了する。
【0076】
6.第五の実施例:大容量通信回線利用によるリストア
第五の実施例はリストア時のサーバ10−クライアントA30間データ転送に、通信衛星利用回線のような大容量データ転送向きの通信回線を用いるものである。これは本発明でのリストアのような比較的大容量のデータ送信に向く。また、前記通信衛星経由の通信を含むマルチキャスト、ブロードキャストなどの多数の相手に同時にデータを転送することが可能な通信手段は、本発明のような複数のクライアントでデータを共有するような構造を持つデータの配布に向く。なお通信回線のデータ帯域に余裕があるならリストアデータ、すなわちオーナー対応表1052と共通ストア103を常時送信しておいて、クライアントはリストアの必要が生じた時に、送られているデータを受信するという形にしても良い。
【0077】
第五の実施例ではデータ転送手段として通信衛星を用いるため、サーバ10側には通信衛星に対する送信装置、クライアントA30側には通信衛星からの受信装置を備える。サーバ10側のハード構成例を図34に、クライアントA30側のハード構成例を図35に示す。
【0078】
図36は通信衛星を用いたリストア部分のシステム構成例である。第四の実施例とほぼ同様な構成となっているが、第五の実施例では記憶メディア49の代わりに通信衛星61を用いる。それに合わせてサーバ10側にBS(Broadcast Satellite)送信装置1065、クライアントA30側にBS受信装置3061を備える。処理内容は第四の実施例と同様である。
【0079】
上述のように、第四、第五の実施例によれば、リストア処理時に発生するサーバからクライアントへのファイル転送手段として、MOディスクなどの記憶媒体または衛星通信などの大容量通信回線を用いることで、通常用いるサーバ・クライアント間のネットワークトラヒックを低減できる。
【0080】
【発明の効果】
本発明によれば、複数のクライアント機が使用される環境において、クライアント機の記憶装置のバックアップデータサイズを縮小することができる。
【0081】
さらにバックアップへの障害をなくすことでバックアップを促しディスククラッシュからの復旧に対応できるようになり、システムの管理コストを低減することが可能になる。
【図面の簡単な説明】
【図1】本発明によるクライアント向きバックアップシステムの原理図である。
【図2】本発明のハードウェア構成を示す図である。
【図3】本発明の論理構成図を示す図である。
【図4】バックアップのプロトコルを示す図である。
【図5】リストアのプロトコルを示す図である。
【図6】サーバ側のメイン処理を示す図である。
【図7】サーバ側のバックアップ処理を示す図である。
【図8】サーバ側のリストア処理を示す図である。
【図9】共有効果の確認画面例を示す図である。
【図10】クライアント別共有比率の表示画面例を示す図である。
【図11】共有状況表示画面例を示す図である。
【図12】第二の実施例の構成図を示す図である。
【図13】オーナー対応表の例1を示す図である。
【図14】オーナー対応表の例2を示す図である。
【図15】第二の実施例のバックアップ処理を示す図である。
【図16】第二の実施例の状況表示画面例を示す図である。
【図17】第二の実施例におけるファイル早見表の構造を示す図である。
【図18】第二の実施例におけるファイル探索手法の例を示す図である。
【図19】第三の実施例の構成図を示す図である。
【図20】第三の実施例のプロトコルを示す図である。
【図21】第三の実施例の設定画面例を示す図である。
【図22】第三の実施例のクライアント側処理を示す図である。
【図23】第三の実施例のバックアップ処理(前半)を示す図である。
【図24】第三の実施例のバックアップ処理(後半)を示す図である。
【図25】同一見込みリストの例を示す図である。
【図26】第四の実施例、サーバのハードウェア構成を示す図である。
【図27】第四の実施例、クライアントのハードウェア構成を示す図である。
【図28】第四の実施例、論理構成図を示す図である。
【図29】第四の実施例、記憶メディアの内容を示す図である。
【図30】第四の実施例、サーバ側記憶メディア作成処理を示す図である。
【図31】第四の実施例、メディア作成種別指定画面例を示す図である。
【図32】第四の実施例、リストア処理の内容を示す図である。
【図33】第四の実施例、クライアント名選択画面例を示す図である。
【図34】第五の実施例、サーバのハードウェア構成を示す図である。
【図35】第五の実施例、クライアントのハードウェア構成を示す図である。
【図36】第五の実施例、通信衛星経由のリストアファイル転送を示す図である。
【符号の説明】
10…サーバ、101…共通/固有振り分け処理、102…個別ファイル合成処理、103…共通ストア、1041…固有ストアA、1042…固有ストアB、20…ネットワーク、30…クライアントA、301…クライアントA用ファイル装置、31…クライアントB、311…クライアントB用ファイル装置。

Claims (4)

  1. 複数のクライアント機器と、サーバ機器とからなるデータバックアップシステムであって、
    前記サーバ機器は、
    検出方法の指示を受領し、前記受領した指示に基づいて、前記各クライアント機器が持つデータから各クライアント機器に共通なデータ部分と各クライアントに固有なデータ部分とを検出する手段と、
    前記共通なデータ部分を保存する共通データ保存手段と、
    前記固有なデータ部分を保存する固有データ保存手段と
    を備えるものであり、
    前記受領した検出方法の指示が、データの内容に基づく検出方法を指示するものである場合には、前記各クライアントからデータを受領し、受領したデータの内容に基づいて前記各クライアント機器が持つデータから各クライアント機器に共通なデータ部分と各クライアントに固有なデータ部分とを検出し、
    前記受領した検出方法の指示が、データの属性情報に基づく検出方法を指示するものである場合には、前記各クライアントからデータの属性情報を受領し、前記データの属性情報に基づいて前記各クライアント機器が持つデータから各クライアント機器に共通なデータ部分と各クライアントに固有なデータ部分とを検出することを特徴とするデータバックアップシステム。
  2. 請求項1記載のデータバックアップシステムにおいて、
    前記共通データ保存手段に保存されたデータそれぞれが、どのクライアント機器のデータであるかを示すデータを記憶する手段を備えることを特徴としたデータバックアップシステム。
  3. 請求項1記載のデータバックアップシステムにおいて、
    前記蓄積されたデータを、前記クライアント機器別にリストアする手段を備えることを特徴としたデータバックアップシステム。
  4. 請求項1記載のデータバックアップシステムにおいて、
    前記クライアント機器は、バックアップ対象となるデータの属性情報を前記サーバ機器へ送信する手段を備えることを特徴としたデータバックアップシステム。
JP10216799A 1999-04-09 1999-04-09 データバックアップシステム Expired - Fee Related JP4075203B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP10216799A JP4075203B2 (ja) 1999-04-09 1999-04-09 データバックアップシステム
US09/542,160 US6625625B1 (en) 1999-04-09 2000-04-04 System and method for backup and restoring by utilizing common and unique portions of data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10216799A JP4075203B2 (ja) 1999-04-09 1999-04-09 データバックアップシステム

Publications (2)

Publication Number Publication Date
JP2000293420A JP2000293420A (ja) 2000-10-20
JP4075203B2 true JP4075203B2 (ja) 2008-04-16

Family

ID=14320160

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10216799A Expired - Fee Related JP4075203B2 (ja) 1999-04-09 1999-04-09 データバックアップシステム

Country Status (2)

Country Link
US (1) US6625625B1 (ja)
JP (1) JP4075203B2 (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60029096T2 (de) * 2000-07-19 2007-01-18 Bull S.A. Verfahren zur Fernausführung bestimmter Operationen eines Zentralsystems in einem Satellitensystem und entsprechendes Kommunikationssystem.
US7089449B1 (en) * 2000-11-06 2006-08-08 Micron Technology, Inc. Recovering a system that has experienced a fault
JP3719962B2 (ja) * 2001-08-08 2005-11-24 東芝ソリューション株式会社 集中管理システム、集中管理方法および集中管理を行う為のプログラム
US20030149750A1 (en) * 2002-02-07 2003-08-07 Franzenburg Alan M. Distributed storage array
US7467167B2 (en) * 2002-03-19 2008-12-16 Network Appliance, Inc. System and method for coalescing a plurality of snapshots
US6947954B2 (en) * 2002-06-17 2005-09-20 Microsoft Corporation Image server store system and method using combined image views
US7464176B2 (en) * 2002-06-17 2008-12-09 Microsoft Corporation Multicast system and method for deploying multiple images simultaneously
US7017144B2 (en) * 2002-06-17 2006-03-21 Microsoft Corporation Combined image views and method of creating images
US6865655B1 (en) * 2002-07-30 2005-03-08 Sun Microsystems, Inc. Methods and apparatus for backing up and restoring data portions stored in client computer systems
US7124322B1 (en) * 2002-09-24 2006-10-17 Novell, Inc. System and method for disaster recovery for a computer network
US7302452B2 (en) * 2003-06-05 2007-11-27 International Business Machines Corporation Method and apparatus for handling requests for files in a data processing system
US20050091259A1 (en) * 2003-10-24 2005-04-28 Microsoft Corporation Redmond Wa. Framework to build, deploy, service, and manage customizable and configurable re-usable applications
JP3713666B2 (ja) * 2004-01-13 2005-11-09 理明 中川 ファイルシステムイメージの圧縮方法及びプログラム
US20060015545A1 (en) * 2004-06-24 2006-01-19 Josef Ezra Backup and sychronization of local data in a network
US20060212439A1 (en) * 2005-03-21 2006-09-21 Microsoft Corporation System and method of efficient data backup in a networking environment
US7483927B2 (en) * 2005-12-01 2009-01-27 International Business Machines Corporation Method for merging metadata on files in a backup storage
US7660836B2 (en) * 2006-03-09 2010-02-09 International Business Machines Corporation Controlling incremental backups using opaque object attributes
EP3336707A1 (en) 2006-05-05 2018-06-20 Hybir Inc. Group based complete and incremental computer file backup system, process and apparatus
US7613735B2 (en) * 2006-06-13 2009-11-03 Alcatel-Lucent Usa Inc. Method and apparatus for managing multimedia content
JP5018403B2 (ja) * 2007-10-31 2012-09-05 日本電気株式会社 バックアップシステム、サーバ装置及びそれらに用いるバックアップ方法並びにそのプログラム
US8200969B2 (en) * 2008-01-31 2012-06-12 Hewlett-Packard Development Company, L.P. Data verification by challenge
WO2010098757A1 (en) * 2009-02-26 2010-09-02 Hewlett-Packard Development Company, L.P. Network aware storage device
US8788831B2 (en) * 2009-03-20 2014-07-22 Barracuda Networks, Inc. More elegant exastore apparatus and method of operation
JP5682436B2 (ja) * 2011-04-27 2015-03-11 富士通株式会社 バックアッププログラム、情報処理装置、情報処理端末、バックアップ方法
JP5742614B2 (ja) * 2011-09-14 2015-07-01 富士通株式会社 リストア処理プログラム、リストア方法、及び情報処理装置
WO2013111187A1 (en) * 2012-01-25 2013-08-01 Hitachi, Ltd. Single instantiation method using file clone and file storage system utilizing the same
JP6133396B2 (ja) 2012-10-01 2017-05-24 株式会社日立製作所 計算機システム、サーバ、及び、データ管理方法
JP6269174B2 (ja) 2014-03-05 2018-01-31 富士通株式会社 データ処理プログラム、データ処理装置及びデータ処理方法
JP2019003163A (ja) 2017-06-20 2019-01-10 富士通株式会社 情報処理装置、情報処理方法、及びプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02297643A (ja) 1989-05-11 1990-12-10 Nec Corp ファイル管理方式
US5990810A (en) * 1995-02-17 1999-11-23 Williams; Ross Neil Method for partitioning a block of data into subblocks and for storing and communcating such subblocks
US5778395A (en) * 1995-10-23 1998-07-07 Stac, Inc. System for backing up files from disk volumes on multiple nodes of a computer network
US5765173A (en) * 1996-01-11 1998-06-09 Connected Corporation High performance backup via selective file saving which can perform incremental backups and exclude files and uses a changed block signature list
US5898836A (en) * 1997-01-14 1999-04-27 Netmind Services, Inc. Change-detection tool indicating degree and location of change of internet documents by comparison of cyclic-redundancy-check(CRC) signatures
US6332217B1 (en) * 1997-05-09 2001-12-18 Hearme Software inventory control system
US6003044A (en) * 1997-10-31 1999-12-14 Oracle Corporation Method and apparatus for efficiently backing up files using multiple computer systems
US6078960A (en) * 1998-07-03 2000-06-20 Acceleration Software International Corporation Client-side load-balancing in client server network

Also Published As

Publication number Publication date
US6625625B1 (en) 2003-09-23
JP2000293420A (ja) 2000-10-20

Similar Documents

Publication Publication Date Title
JP4075203B2 (ja) データバックアップシステム
CN101515273B (zh) 提供用于在存储设备的分布式文件系统中进行信息追踪的元数据的系统和方法
CN101334797B (zh) 一种分布式文件系统及其数据块一致性管理的方法
US9652335B2 (en) Systems and methods for restoring data from network attached storage
AU757667B2 (en) Access to content addressable data over a network
JP2020038623A (ja) データを記憶するための方法、装置及びシステム
US8074289B1 (en) Access to content addressable data over a network
JP4354233B2 (ja) バックアップシステム及び方法
JP4824753B2 (ja) 時間制限メッセージの効率的な処理
CN1294514C (zh) 高效的计算机文件备份系统和方法
CN1692356B (zh) 用于对现存文件重新条带化的方法
US6675177B1 (en) Method and system for backing up digital data
US20110238625A1 (en) Information processing system and method of acquiring backup in an information processing system
JP2004500648A (ja) クライアントサーバー環境における差分バックアップシステムの管理方法
CN104272274A (zh) 一种分布式文件存储系统中的数据处理方法及设备
CN104541252A (zh) 用于实现基于服务器的分层大容量存储系统的系统和方法
CN102713856A (zh) 具有选择性按需数据可用性的多阶段文件系统恢复
CN104583966A (zh) 用于去重复文件系统的备份和恢复系统以及对应的服务器和方法
CN103460197A (zh) 计算机系统、文件管理方法以及元数据服务器
US7363445B2 (en) Backup method
KR20120090320A (ko) 분산 파일 시스템에서 효율적인 자료 복구 방법
CN101901173A (zh) 一种灾备系统及灾备方法
US20080195675A1 (en) Method for Pertorming Distributed Backup on Client Workstations in a Computer Network
JPH07244645A (ja) 高信頼分散トランザクション処理システム
EP3819754B1 (en) Information processing apparatus and recording medium storing information processing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040325

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060417

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070904

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080121

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110208

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110208

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120208

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120208

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130208

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130208

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees