JP2000293420A - データバックアップシステム - Google Patents

データバックアップシステム

Info

Publication number
JP2000293420A
JP2000293420A JP11102167A JP10216799A JP2000293420A JP 2000293420 A JP2000293420 A JP 2000293420A JP 11102167 A JP11102167 A JP 11102167A JP 10216799 A JP10216799 A JP 10216799A JP 2000293420 A JP2000293420 A JP 2000293420A
Authority
JP
Japan
Prior art keywords
file
client
data
server
common
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11102167A
Other languages
English (en)
Other versions
JP4075203B2 (ja
Inventor
Kenichi Kihara
健一 木原
Toshiaki Hirata
平田  俊明
Taro Saito
太朗 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP10216799A priority Critical patent/JP4075203B2/ja
Priority to US09/542,160 priority patent/US6625625B1/en
Publication of JP2000293420A publication Critical patent/JP2000293420A/ja
Application granted granted Critical
Publication of JP4075203B2 publication Critical patent/JP4075203B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • G06F11/1453Management of the data involved in backup or backup restore using de-duplication of the data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1461Backup scheduling policy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • Y10S707/99953Recoverability
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • Y10S707/99955Archiving or backup

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computer And Data Communications (AREA)

Abstract

(57)【要約】 【課題】クライアントのバックアップファイルをサーバ
に保存する環境において、クライアントの台数が多数の
場合にサーバ上のディスクスペースが大量に必要にな
る。 【解決手段】クライアントのバックアップファイルをク
ライアント間で比較し、同一部分と固有部分とに分けて
格納し、サーバのディスクスペースを節約する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はネットワークシステ
ムにおける複数のクライアント機のバックアップ(デー
タの保存)・リストア(データの復旧)方法に関する。
【0002】
【従来の技術】ネットワーク/システム管理の分野では
TCO(総保有コスト)の低減が課題になっており、ク
ライアント機の管理コストがTCO低減の足かせになっ
ている。特にディスククラッシュからの復旧には、OS
やアプリケーションソフトの再インストールや環境設定
等、膨大な手間がかかり、管理コスト上昇の元凶となっ
ている。
【0003】従来からディスククラッシュからの復旧に
対応するためには、バックアップが有効であることは知
られているが、ネットワークシステムにおけるバックア
ップについても例えば特開平2-297643号公報に記載され
ているような技術がある。この技術は複数のクライアン
ト(ワークステーション)機のバックアップを目的とし
たもので、バックアップ用のサーバを設置し、クライア
ント上のバックアップファイルをバックアップ用サーバ
に蓄積する。
【0004】
【発明が解決しようとする課題】前記技術によると、サ
ーバ上でのデータバックアップ領域のサイズは、全クラ
イアント機(ワークステーション)のバックアップデー
タの総和となり、クライアント台数が多いとサーバ上の
データバックアップ領域も巨大なものが必要となる。バ
ックアップに要するディスク容量を考え、サーバのみバ
ックアップを行いクライアントのバックアップをあきら
めてしまうと、結果的にディスククラッシュから復旧で
きないという問題が生じることになる。
【0005】本発明の目的は、複数のクライアント機が
使用される環境において、クライアント機の記憶装置の
バックアップデータサイズを縮小することであり、さら
にバックアップへの障害をなくすことでバックアップを
促しディスククラッシュからの復旧に対応できるように
することであり、さらにシステムの管理コストを低減す
ることである。
【0006】
【課題を解決するための手段】上記目的を達成するため
に本発明では、各クライアントが持つデータ(ファイル
群)内の共通部分を検出し、クライアントのデータ間に
共通な部分と各クライアントのデータに固有な部分に分
けて保存(バックアップ)することで、バックアップデー
タの総容量を低減する。
【0007】同じネットワークシステム内にあるクライ
アント機それぞれが持つファイルまたはファイル群は、
互いに同じような構成、内容になることが多い。その結
果、各クライアントのバックアップデータの内容も似通
った内容になりやすい。本発明はその特性を利用する。
【0008】すなわち本発明は、記憶手段を持つ機器に
おける一つあるいは複数のデータで構成されるバックア
ップデータを蓄積する手段において、異なる前記機器用
の前記バックアップデータに含まれるデータの内容を比
較し、前記データ内容に同一のものが発見されれば、前
記内容が同一のデータを一つのデータに集約して蓄積す
る事を特徴とするものである。
【0009】さらに本発明は、前記機器用の前記同一の
単数または複数のデータを蓄積する記憶手段と、前記同
一のデータ以外の前記機器用の単数または複数のデータ
を蓄積する記憶手段を持つことを特徴とするものであ
る。
【0010】さらに本発明は、前記機器用の単数または
複数のデータを蓄積する手段すなわち共通データ蓄積手
段と、前記機器別に前記共通データ蓄積手段に含まれる
データの中のどのデータが前記機器用バックアップデー
タに含まれているかを示す情報を蓄積する記憶手段すな
わちデータ所有情報記憶手段とを、持つことを特徴とす
るものである。
【0011】さらに本発明は、前記バックアップデータ
を蓄積する手段に蓄積された一つあるいは複数のデータ
を、前記機器別に取り出す機能を持つことを特徴とする
ものである。
【0012】さらに本発明は、前記バックアップデータ
を蓄積する手段すなわちサーバと、データバックアップ
の対象である前記機器であり、前記サーバとの間で情報
をやりとりする機能を持つ手段すなわちクライアントを
持つことを特徴とするものである。
【0013】さらに本発明は、前記クライアントと前記
サーバの間でデータ名やデータサイズ、データの更新日
時等のデータ属性情報を送信することを特徴とするもの
である。
【0014】さらに本発明は、前記クライアントと前記
サーバ間でやりとりされた前記データ属性情報にもとづ
いて前記クライアントから前記サーバに転送する必要の
あるデータを決定することを特徴とするものである。
【0015】さらに本発明は、前記クライアントと前記
サーバの間で巡回冗長符号やチェックサム等データ内容
から計算されるチェックコードをやり取りすることを特
徴とするものである。
【0016】さらに本発明は、前記クライアントと前記
サーバ間でやりとりされた前記チェックコードにもとづ
いて前記クライアントから前記サーバに転送する必要の
あるデータを決定することを特徴とするものである。
【0017】さらに本発明は、前記クライアントから前
記サーバに情報を伝達する手段とは異なる手段で前記サ
ーバから前記クライアントに情報を伝達することを特徴
とするものである。
【0018】さらに本発明は、前記サーバから前記クラ
イアントへの情報伝達手段として、記憶媒体を用いるこ
とを特徴とするものである。
【0019】さらに本発明は、前記サーバから前記クラ
イアントへの情報伝達手段として、通信衛星等の大容量
のデータ転送に向く通信手段を用いることを特徴とする
ものである。
【0020】
【発明の実施の形態】1.第一の実施例:基本構成 図1はその原理を示した図である。サーバ10、ネットワ
ーク20、クライアントA30、クライアントB31の四つの構
成要素からなる。図1では、クライアントは二台表記し
ているが、一台あるいは三台以上でも問題ない。クライ
アントA30、クライアントB31はサーバ10とネットワーク
20経由で接続されている。
【0021】各クライアントはローカルにファイルを持
っており、バックアップの際にそれぞれそのファイルを
サーバ10に送信する。サーバ10は各クライアントから送
られたファイルを共通/固有振り分け処理101で、共通
部分と固有部分とに分け、共通部分を共通ストア103
に、クライアントA30の固有部分はクライアントA固有ス
トアA041、クライアントB31の固有部分はクライアントB
固有ストアA042に保存する。
【0022】たとえば図1の実施例では、クライアント
A30はファイル装置301内にFile A、File B、File C、Fi
le Dという四つのファイルを持っていて、クライアント
B31はFile A、File C、File Eという三つのファイルを
持っている。両クライアントに共通するFile AとFile C
については、共通ストア103に格納される。また、クラ
イアントA30が持つファイル装置301内のFile B、File D
についてはクライアントA30固有なので、固有ストアA10
41に格納する。同様にクライアントB31のファイル装置3
11内のもFile Eも固有ストアB1042に格納する。File A
とFile Cについては、別々に格納するのではなく、一つ
にまとめることで保存領域を節約できる。
【0023】バックアップされたファイルを元のクライ
アントに戻す場合には、共通ストア103内のファイルと
クライアント固有ストアの内容を合わせることで元のフ
ァイル(群)が得られる。そのファイル合成を行うのが
個別ファイル合成処理102である。たとえばクライアン
トA30のファイル装置301のリストアが必要になったら、
共通ストア103内のFile A、File CとクライアントA固有
ストアA041内のFile B、File DをクライアントA30用の
リストアデータとする。
【0024】図2はネットワークシステム内で使われる
サーバ装置およびクライアント装置のハードウェア構成
の例である。内部はCPU41、メモリ42、キーボード4
3、ディスプレイ44、ハードディスクドライブ45、ネッ
トワークインタフェース46の部品で構成されている。ネ
ットワークインタフェース46は、他のマシンとネットワ
ーク20で接続されている。
【0025】図3は内部処理方法を説明する図で、図1
のデータの流れを示したものである。クライアントA30
はファイル装置301、ファイル送信機能302、ファイル受
信機能303を持つ。ファイル装置301はクライアントA30
で使われるファイルを保持するもので、前記ハードディ
スクドライブ45に相当する。ファイル送信機能302はフ
ァイルのバックアップを行う際に、サーバ10にファイル
装置301内のファイルを送信する機能を持つもので、前
記メモリ42上に前記CPU41が実行するプログラムとし
て実現される。その逆にファイル受信機能303はファイ
ルのリストアを行う際にサーバ10からファイルを受け取
り、ファイル装置301に格納する機能を持つもので、前
記メモリ42上に前記CPU41が実行するプログラムとし
て実現される。
【0026】サーバ10はクライアントA30から送られて
くるファイルを、共通/固有振り分け処理101(前記C
PU41が前記メモリ42上で実行するプログラムとして実
現される)内のファイル受信1011で受け取り、クライア
ント別にクライアントA用受信バッファ1012またはクラ
イアントB用受信バッファ1013に格納する(受信バッフ
ァはバックアップが必要となるクライアントの台数分を
前記ハードディスクドライブ45に用意すればよい)。各
受信バッファに格納されたファイルはAND1014で共通部
分を抽出され、前記ハードディスクドライブ45内の共通
ストア103に格納する。また、SUB1015によってクライア
ントA用受信バッファ1012から共通部分を差し引いたも
のを前記ハードディスクドライブ45内の固有ストアA104
1に格納する。同様にSUB1016によってクライアントB用
受信バッファ1012から共通部分を差し引いたものを前記
ハードディスクドライブ45内の固有ストアB1042に格納
する。
【0027】またリストアの際には、個別ファイル合成
処理102(前記CPU41が前記メモリ42上で実行するプ
ログラムとして実現される)において、リストアが必要
なクライアントに応じて共通ストアと固有ストアを合成
したものを、ファイル送信1021を用いてクライアントに
送信する。たとえばクライアントA30にリストアが必要
な場合には、ADD1022を使って共通ストア103と固有スト
アA1041の内容を合わせてクライアントA30に送信する。
【0028】図4はクライアントとサーバ間のバックア
ップのプロトコルを示したものであり、上述の各処理プ
ログラムによって実行される。バックアップの際にはク
ライアントA30からサーバ10に対してファイルバックア
ップ情報50を送信する。ファイルバックアップ情報50の
中は、コマンドID(バックアップ操作を示す識別コー
ド)、クライアント特定用のIDの後に各ファイルのデ
ータを続ける。各ファイルのデータの内容はファイルパ
ス名、ファイル属性、ファイル本体などを含めればよ
い。
【0029】図5はクライアントとサーバ間のリストア
のプロトコルを示したものであり、上述の各処理プログ
ラムによって実行される。リストアの際には、クライア
ントA30からリストア要求51をサーバに発行する。リス
トア要求51の内容にはコマンドID(リストア要求を示
す識別コード)とクライアントIDを含める。リストア
要求51を受けたサーバ10はリストア要求51内のクライア
ントIDを元に、前に示した方法でクライアント用ファ
イルを作成し、リストアファイル情報52として、クライ
アントに送信する。リストアファイル情報52は、コマン
ドID(リストアファイル情報であることを示す識別コ
ード)にファイル本体が続く。
【0030】図6はサーバ側のメイン処理の流れを示し
たものであり、上述の各処理プログラムによって実行さ
れる。クライアントからのコマンドを受信し、受信した
コマンドが終了指示なら終了し、バックアップ情報50な
らバックアップ処理を、リストア要求51ならリストア処
理を実行する。
【0031】図7はサーバ側のバックアップ処理の内容
を示したものであり、上述の各処理プログラムによって
実行される。クライアントから送られてきたファイルを
クライアント受信バッファにスプールする。前述の通
り、クライアントA用受信バッファ1012またはクライア
ントB用受信バッファ1013に格納する。次に、すべての
受信バッファの内容を確認し、全クライアントからのバ
ックアップファイルが集まったかどうかを判断する。全
部集まっていなければ終了する。集まっていれば全受信
バッファに共通するファイルを抽出し、共通ストア103
に格納する。また、各受信バッファ固有のファイルは固
有ストアA1041と固有ストアB1042に格納する。
【0032】図8はサーバ側のリストア処理の流れを示
したものであり、上述の各処理プログラムによって実行
される。共通分のファイルとリストア要求を出したクラ
イアントの固有ストアのファイルとをリストア要求を出
したクライアントへ送信する。サーバ10内でのファイル
の共有状況は内部処理なので直接目に見えない。そこで
共有状況を画面に表示すれば共有の効果を目視で確認で
きるようになる。
【0033】図9は共有の効果を確認するため図2のデ
ィスプレイ44上に、共通/固有振り分け処理101によっ
て表示される画面例で、固有格納分と共有格納分のファ
イルサイズを表示している。オリジナル総ファイルサイ
ズ901はクライアント側のファイルの合計(共有な
し)、固有格納分はクライアント固有ストア(図3では
1041,1042)の合計サイズ、共有格納分は共通ストア103
のサイズをそれぞれ表示している。また削減率904は固
有格納分902と共通格納分903を足したものをオリジナル
総ファイルサイズ901で割った値を表示しており、ファ
イル共有による効果の度合いを示している。図10は図
2のディスプレイ44上に、共通/固有振り分け処理101
によって表示されるクライアント別共有比率の表示画面
例で、クライアント別906に何パーセントのファイルが
共有されているかを、ファイルの個数907とファイルの
サイズ908の観点で表示している。図11は図2のディ
スプレイ44上に、共通/固有振り分け処理101によって
表示される共有状況の表示画面例で、共通ストア内のフ
ァイルおよび固有ストア内のファイルをそれぞれ表示す
ることで、どのファイルが共有されているかを目視で確
認できる。
【0034】上述のように、第一実施例によれば、クラ
イアント機のバックアップデータをサーバに集め、バッ
クアップデータをクライアント間で比較し、同じファイ
ルがあれば一つに集約して保存することで、サーバ上の
ディスクスペースを節約できる。
【0035】2.第二の実施例 第二の実施例として、サーバ10上でのバックアップ用フ
ァイルの格納方法を変更した案を図12に示す。第一の実
施例(図3)の共通/固有振り分け処理101、個別ファ
イル合成処理102、クライアントA固有ストアA041、クラ
イアントB固有ストアA042に代わり、第二の実施例では
マルチクライアントファイル格納処理1051(前記CPU
41が前記メモリ42上で実行するプログラムとして実現さ
れる)、オーナー対応表1052(前記メモリ42上に実現さ
れる)、マルチクライアントファイル取り出し処理1053
(前記CPU41が前記メモリ42上で実行するプログラム
として実現される)を備えている。なお第二の実施例は
サーバ10のみの変更で、クライアントA30には変更は必
要ない。
【0036】オーナー対応表1052は、共通ファイル103
内のファイルについてどのクライアントがそのファイル
を所有しているかを示すデータで図13に例示するよう
に、共通ストア上のファイル毎に、ファイルID1052
1、オーナー10522、ファイルパス名10523が記されてお
り、オーナー対応表1052内の横一行が一レコードになっ
ている。
【0037】ファイルID10521はオーナー対応表1052
と共通ストア103の結びつけを行うためのもので、その
レコードが共通ストア103上のどのファイルに対するも
のかを示すための情報となっている。図13の例では、
ファイルID10521は1001や1002などの数値で示してい
るが、区別可能なら記号でもよい。オーナー10522はそ
のファイルがどのクライアントによって所有されている
かを示している。ファイルパス名10523はそのファイル
がクライアントのファイル装置301上でどこ(のファイ
ルパス)に配置されていたか(および配置させるか)を
示すものである。
【0038】図14はオーナー対応表1052の他の例であ
る。図13では共通ストア103内の一ファイルに対して
オーナー対応表1052の一行(一レコード)が対応してい
たが、図14では共通ストア103内の一ファイルがオー
ナー対応表1052の複数行に対応する。こうすることで、
ファイルパス名10523(あるいはタイムスタンプ10524も
しくは属性10525)は異なるがファイルの内容は同じ場
合に、図13の例では複数のファイルが共通ストア103
に格納されることになるが、図14の例では一つで済
む。図14の例では、ファイルIDが1001のファイル
は、クライアントAのファイル装置103上ではC:\DIR1\FI
LE01の場所に置かれているが、クライアントBではD:\DI
R2\FILE01の場所に置かれていることを示している。
【0039】マルチクライアントの格納処理1051の内容
を図15に例示する。クライアントからファイルを受信
すると、オーナー対応表1052からその送信元のクライア
ントの情報を取り除く。たとえばクライアントBからフ
ァイルを受信したとき、図14の例の場合、(図14に
現れている範囲内で)二行目と三行目のレコードが削除
される。レコードを削除した結果、オーナーが存在しな
くなった共通ストア103内のファイルは、共通ストア103
から削除する。以下、クライアントから受信した各ファ
イルについて次の処理を行う。すなわち、すでに同じフ
ァイルが共通ストア103上に存在するかどうかを判断
し、共通ストア103内になければそのファイルを共通ス
トア103に格納し、共通ストア103内にある・ないに関わ
らずオーナー対応表1052の内容を更新する。
【0040】第一の実施例と同様に、サーバ10内での共
有状況を表示する仕組みを持たせると利用者が共有状況
を確認できるので良い。図16はその画面例である。統
計情報911として、オリジナル総ファイルサイズ(クラ
イアントのファイルのサイズの合計)、格納ファイルサ
イズ(共通ストア103内に格納されているファイルのサ
イズの合計)、節約できたバイト数(前者二つの差)を
示している。また共通ストア103内に格納されているフ
ァイルの一覧912として、共通ストア103内の各ファイル
についてそれぞれファイルサイズとオーナー数を表示し
ている。
【0041】この第二の実施例によれば、あるファイル
が総てのクライアントに共通でなくても二台以上に共通
していれば共有可能になる。そのため、第二の実施例の
方がよりディスクスペースを節約できる可能性がある。
【0042】第二の実施例において、クライアントから
送られてきたファイルと同じ内容のファイルが、すでに
共通ストア103内にあるかどうかを判定する方法につい
て説明する。クライアントから送られてきたファイルの
それぞれについて、共通ストア103内に格納されている
ファイル(群)の先頭から順に比較を行う手法を使った
場合、次の二つの要因で処理量が膨大になる。
【0043】要因1.比較回数が膨大 共通ストア103内の先頭から順に比較を行うので、クラ
イアント側のファイル一つあたり、最悪で共通ストア10
3内のファイル個数回の比較が必要になる。平均でもフ
ァイル個数の半分程度の比較回数が必要になる。クライ
アント側の全ファイルに対してその処理を行う場合、平
均で、「クライアント側の全ファイル」*「共通ストア
内のファイル個数」/2回の比較が必要になる。たとえ
ば、クライアントから1,000個のファイルが送られて、
共通ストア103内に10,000個のファイルが存在する場
合、比較回数は、最悪10,000,000回程度の比較が必要に
なる。
【0044】要因2.比較一回あたりの処理量が膨大 ファイル内容同士を比較するため、比較一回あたりの処
理量も大きくなる。
【0045】そこで、比較回数を低減する方式について
説明する。
【0046】比較一回あたりの処理量が大きい点につい
ては、ファイル本体を比較する前にファイルパス名やフ
ァイルの長さ、チェックサム等を比較することで処理量
を低減できる。また、比較回数が多い点は、オーナー対
応表や共通ストア103内の情報をファイル名等でソート
しておくことで、二分探索法などの効率の良い検索(比
較)が行えるようになる。
【0047】ファイルの長さをキーとしたファイル比較
の効率化手法の例を一つ挙げる。本効率化手法例ではフ
ァイル探索を効率化するために、ファイル早見表109を
用意する。ファイル早見表109の構造を図17に示す。
ファイル早見表109は単数あるいは複数のファイル早見
情報1091で構成されており、各ファイル早見情報1091は
さらにファイルサイズ10911、チェックサム10912、ファ
イルID10913を含む。ファイル早見情報1091の並び
は、ファイルサイズを主キー、チェックサムを副キーと
してソートされている。すなわち基本的にファイルサイ
ズでソート済みで、ファイルサイズが同じファイル早見
情報1091同士はチェックサムでソートする。クライアン
トから送られてきた個々のファイルのファイルサイズと
チェックサムを比較対象の絞り込みに使用する。
【0048】図18はファイル早見表109を用いた探索
手法の例である。この図では、クライアントから送られ
てきたファイル108の内の一つに対して、共通ストア103
内に存在するかを探し出す手順を示している。第一ステ
ップは、クライアントから送られてきたファイル108の
ファイルサイズ(図18の例では32バイト)のファイ
ル情報をファイル早見表109内から見つけだす。前述の
通り、ファイル早見表109はファイルサイズでソートさ
れているため、二分探索法による探索が可能である。図
18の例ではファイルサイズが32バイトのファイルは
三つある。第二ステップは、クライアントから送られて
きたファイル108のチェックサムと同じ値のチェックサ
ムを持つファイル情報を第一ステップで見つけたファイ
ルの中から探し出す。前述の通り、ファイル早見表109
はチェックサムでもソートされているため、この探索処
理においても二分探索法が使える。図18の例ではチェ
ックサムが一致するものは一つだけだった。第三のステ
ップでファイル本体の比較を行う。第二ステップで発見
したファイルの本体(図18の例ではファイルID=1
001のもの)とクライアントから送られてきたファイ
ル108の本体を比較する。
【0049】このような手順を踏むことで、ファイル本
体の比較は、ファイルサイズおよびチェックサムが一致
するものに限定できるため処理量を低減できる。なお図
18の例ではファイルサイズにチェックサムを併用した
が、チェックサム算出に要する処理負担が気になる場合
には、ファイルサイズのみとしても良い。
【0050】3.第三の実施例 第三の実施例はサーバ10とクライアントA30間のプロト
コル(通信手順)に関するものであり、第一の実施例、
第二の実施例に付け加える形で実現できる。以下では、
第二の実施例の構成に基づいて説明する。
【0051】第三の実施例は、バックアップの際に行わ
れるクライアントA30からサーバ10へのファイル転送時
のファイル転送量を削減することを目的としている。そ
の実現のためにサーバ10上にすでにあると考えられるフ
ァイルは転送しない仕組みを持たせる。クライアントA3
0側のファイルがサーバ10側にすでにあるかどうかは、
ファイルのパス名、サイズ、タイムスタンプなどのファ
イルに付属する情報、あるいはファイルの中身のチェッ
クサムやCRC(巡回冗長符号)などで判断する。なお
リストアについては第二の実施例と同じ仕組みが使え
る。
【0052】図19は第三の実施例を実装するシステム
構成例である。図19の構成は、第二の実施例で出てき
た図12の構成に転送量削減折衝処理S106(前記CP
U41が前記メモリ42上で実行するプログラムとして実現
される)と転送量削減折衝処理C304(前記CPU41が
前記メモリ42上で実行するプログラムとして実現され
る)を加えた形になっている。第三の実施例では、図1
9の構成を前提として説明を進める。
【0053】図20は第三の実施例のサーバ10−クライ
アントA30間のバックアップ時のプロトコルを示したも
のである。クライアントA30−サーバ10間でやりとりさ
れる情報の形式は、コマンドID(通知の内容を示す識
別コード)+オプション情報(通知内容によって異な
る)となっている。以下、その手順を追う。
【0054】最初にクライアントA30からサーバ10に対
してファイルバックアップ要求801を発行する。それを
受けたサーバ10はクライアントA30に対してファイル情
報問い合わせ802を発行する。ファイル情報問い合わせ8
02の中には、要求する情報種別8021が含まれ、前記同一
性チェックのための項目(ファイルパス名、サイズ、タ
イムスタンプ、チェックサム、CRC等)をクライアン
ト側に知らせる。たとえばファイルのパス名とサイズ、
タイムスタンプを同一性チェックの基準とするなら、フ
ァイル情報問い合わせ802の中でファイルのパス名、サ
イズ、タイムスタンプと指定する。なお、ファイル情報
問い合わせ802の中には、ファイルの範囲指定も可能
で、全部あるいは指定範囲のみの二通りの設定8022が可
能。指定範囲のみとした場合には、ファイルのパス名が
その後に続く。ファイル情報問い合わせ802を受けたク
ライアントA30は、自身のファイル装置301内のファイル
について、ファイル情報問い合わせ802内で指定された
項目についてファイル装置301の中を調べ、ファイル情
報送信803としてサーバ10に通知する。ファイル情報送
信803の中にはファイル情報8031が含まれており、さら
にファイル情報8031の中にはファイルパス名80311と要
求された情報80312が含まれている。要求された情報803
12は、ファイルパス名80311に関する、要求する情報種
別8021の情報(サイズやタイムスタンプ、チェックサ
ム、CRC等)を入れる。ファイル情報送信803を受け
たサーバ10は、ファイル情報送信803の中に含まれるフ
ァイル情報を調べ、共通ストア103や、第二の実施例に
示す構成の場合のオーナー対応表1052に同じ内容のファ
イルが存在しないかを検索する。そして、ファイル情報
送信803に含まれるファイル情報のうち、共通ストア103
およびオーナー対応表1052(第二の実施例の場合)にな
いファイルのファイルパス名をファイル送信要求804と
して、クライアントA30に通知する。ファイル送信要求8
04を受けたクライアントA30は、要求されたファイル本
体をファイル送信805としてサーバ10に送信する。サー
バ10はファイル送信805を受けて、その内容を共通スト
ア103に格納するとともにオーナー対応表1052の内容を
更新する。最後にサーバ10はクライアントA30に対して
終了通知806を送信することでバックアップ処理を終了
した旨を通知して終了する。
【0055】なお要求する情報種別が固定あるいはクラ
イアント側で確定している場合には、ファイルバックア
ップ要求801、ファイル情報問い合わせ802をスキップ
し、ファイル情報送信803から始めても良い。また図2
0の場合、ファイル送信805がバックアップ処理の最後
だと分かっているので、終了通知806も省略可能であ
る。
【0056】前述の同一性チェック項目の内容はユーザ
によって変更可能な形を取っても良い。図21はその設
定画面例である。大きな選択項目として、ファイル本体
の照合が必要913か不要914かがある。同一性チェックの
際、ファイルの内容についてもチェックする必要がある
場合には、ユーザは必要913を選択する。ファイル内容
のチェックが不要な場合には、ユーザが不要914を選択
する。ユーザが必要913を指定した場合には第二の実施
例と同等な動作となる。ユーザが不要914を選択した場
合、さらに同一性チェックの際にファイルのどの項目を
評価するかをユーザに選択させる。この画面で設定した
内容をサーバ10内で記憶しておき、前記プロトコル内の
ファイル情報問い合わせ802中で要求する情報種別8021
で指定するようにすれば良い。
【0057】図22は、図20に示すプロトコルを実現す
るクライアント側の処理フローチャートである。最初に
サーバ10に対してバックアップ要求801を発行し、サー
バ10からの応答を待つ。サーバ10からの応答が来たらそ
の内容を調べ、終了通知なら終了する。またサーバ10か
らの応答が、ファイル情報問い合わせ802なら自身のフ
ァイル装置301内を調べてファイル情報送信803をサーバ
10に通知し、再びサーバ10からの応答待ちに入る。サー
バ10からの応答がファイル送信要求804ならファイル送
信要求804内で指定されたファイルの本体を自身のファ
イル装置301から取り出し、ファイル送信805としてサー
バ10に送信した上で、再びサーバ10からの応答待ちに入
る。
【0058】同じく図20の第三の実施例の前記プロトコ
ルを実現するサーバ10側の処理フローチャートを図23
および図24に示す。
【0059】クライアントA30からのバックアップ要求8
01を受信したら、まずファイル本体の照合が必要かどう
かを判定する(7210)。これは第三の実施例の前記同一
性チェック設定(図21)で設定された内容を受けて判
断する。必要911な場合には、クライアントに全ファイ
ルの送信要求を発行し(7213)、以下、第二の実施例と
同様に、ファイルをクライアントA30から受け取り、受
信したファイルのそれぞれについて、共通ストア103内
に同一内容のファイルが無いかどうかを確認しオーナー
対応表1052と共通ストア103の内容を更新し(7214)、
復帰(処理を終了)する。
【0060】不要912の場合には、バックアップ要求801
を出したクライアントA30に全ファイルのファイル情報
問い合わせ802を発行する(7211)。このファイル情報
問い合わせ802の内容は、クライアント側処理の高速化
のため図21で設定した内容から、チェックコードを除い
たものにする。チェックサムやCRCなどのチェックコ
ード処理を行っても性能的に問題無い場合には、7216、
7217、7218、7219の処理を7211の処理中に行ってもよ
い。
【0061】クライアントA30から送られてくるファイ
ル情報送信803を受信する(7212)。続いて同一見込み
リスト1061を作成する(7215)。同一見込みリスト1061
は図25に示すようにファイルのパス名の一覧であり、
その記憶には一時的なメモリ領域(変数領域)を使用す
れば良い。図23の処理7212で受け取った内容と、共通
ストア103とオーナー対応表1052の内容を比較し、共通
するファイルのパス名を同一見込みリスト1061に格納す
る)。
【0062】続いてチェックコードによる確認が必要か
どうかを判定する(7216)。必要でないなら、図24の
処理(7221)に進む。必要な場合には、図23の処理72
17、7218、7219を実行する。すなわち、同一見込みリス
ト1061中の各ファイルのチェックコードをクライアント
側に要求する(7217)。言い換えると、処理7216では図
23の処理7211、7212で照会した結果、同一であると考
えられるファイルのチェックコードをクライアントに要
求していることになる。そしてクライアントからチェッ
クコードを受信し(7218)、共通ストア内のファイルの
チェックコードと比較し、チェックコードが同じでない
ファイルを同一見込みリスト1061から取り除き(721
9)、図24の処理(7221)に進む。
【0063】図24では、最初に同一見込みリスト1061
に入っていないファイルがあるかどうかを判定し(722
1)、ない場合には復帰(処理を終了)する。ある場合
には、同一見込みリストに入っていないファイルの送信
要求をクライアントに発行し(7223)、以下、第二の実
施例と同様に、ファイルをクライアントA30から受け取
り(7224)、受信したファイルのそれぞれについて、共
通ストア103内に同一内容のファイルが無いかどうかを
確認しオーナー対応表1052と共通ストア103の内容を更
新し(7225)、復帰(処理を終了)する。続いて、同一
見込みリスト1061が空かどうかを判断し(7226)、空な
ら復帰(処理終了)。そうでないなら、同一見込みリス
ト1061内の各ファイルについてオーナー対応表の内容を
更新(処理対象となっているクライアント名を追加)
(7227)し、復帰(処理終了)する。
【0064】上述のように、第三の実施例によれば、ク
ライアントからサーバにバックアップファイルを送信す
る際に、ファイル属性情報(ファイルパス名・ファイル
サイズ・タイムスタンプなど)やファイル内容のチェッ
クコード(CRC・チェックサム等)をサーバ・クライ
アント間で事前に交換することで、サーバ上にすでにあ
るファイルを再度送らずにすませることができ、バック
アップ時のサーバの処理負荷、クライアントの処理負
荷、ネットワーク負荷を低減し、バックアップ処理時間
も短縮できる。
【0065】4.第四、第五の実施例の概要 第四、第五の実施例はリストア時に発生するサーバ10か
らクライアントA30へのファイル転送の方法に関するも
ので、第一の実施例、第二の実施例、第三の実施例のリ
ストア処理に追加あるいはリストア処理を置き換える形
で適用できる。以下、第四、第五の実施例に共通する内
容について説明する。
【0066】クライアントA30のバックアップファイル
をサーバ10に保管する場合、同じクライアントA30のバ
ックアップ処理を繰り返すと、第三の実施例あるいは差
分バックアップ等の技術を用いることで、クライアント
A30からサーバ10への毎回のファイル転送量は低減され
る。一方、リストアでは対象クライアントのリストア用
のファイルをすべて送るため、ファイル転送量は大きく
なる。一般的にバックアップは定期的に行われるのに対
して、リストアの頻度は低い。
【0067】すなわち、バックアップでは比較的小容量
のファイル転送が多く行われるのに対して、リストアで
は大容量のファイル転送が低い頻度で発生する。第四、
第五の実施例はこのファイル転送の性質の違いを利用
し、バックアップ時とリストア時とでファイル転送手段
を変えるものである。
【0068】5.第四の実施例:記憶メディアによるリ
ストア 以下、第四の実施例を第二の実施例をベースに説明する
が、第一の実施例、第三の実施例にも適用可能である。
【0069】第四の実施例ではリストア時に発生するサ
ーバ10からクライアントA30へのファイルの受け渡しに
記憶メディアを使う。そのためサーバ10、クライアント
A30双方に記憶メディアの読み書き装置を設ける。
【0070】図26はサーバ10のハードウェア構成を示
したもので、図2に示す第一の実施例のハードウェア構
成に記憶メディア書き込み装置47を追加している。記憶
メディア書き込み装置47は記憶メディア49に情報を書き
込む機能を有するもので読み書き兼用であってもよい。
記憶メディア49はたとえばMO、CD−ROM(書き換
え可能型)、DVD(書き換え可能型)などの可搬型の
記憶メディアが好ましいが、必ずしも可搬型である必要
はなく、サーバ10からクライアントA30にデータ(ファ
イル)を受け渡し可能な記憶手段ならば良い。
【0071】図27はクライアントA30のハードウェア
構成を示したもので、サーバ10の場合と同様、第一の実
施例で取り上げた図2に記憶メディア読み込み装置48を
追加したものになっている。記憶メディア読みとり装置
48は、少なくとも記憶メディア49に格納されている情報
を読み出す機能を有している。書き込み機能を有してい
ても差し支えない。
【0072】図28は記憶メディアによるリストア処理
のためのシステム構成とデータの流れを示した図であ
る。サーバ10内に、オーナー対応表1052、共通ストア10
3、クライアント用メディア作成処理1062、メディア書
き込み処理1063を備える。オーナー対応表1052、共通ス
トア103は図12に記したものと同じである。リストア
データ生成処理1062(前記CPU41が前記メモリ42上で
実行するプログラムとして実現される)はオーナー対応
表1052、共通ストア103を元にクライアントに渡すデー
タを生成する機能を持つ。メディア書き込み処理1063
(前記CPU41が前記メモリ42上で実行するプログラム
として実現される)はリストアデータ生成処理1062で作
られたデータを記憶メディア49に書き込む機能を持つ。
一方、クライアントA30内にはメディア読み取り処理305
1とリストア処理3052(それぞれ前記メモリ42上に前記
CPU41が実行するプログラムとして実現される)、フ
ァイル装置301がある。メディア読み取り処理3051は記
憶メディア49内に記憶されている情報を読み出す機能を
持つ。
【0073】図29は記憶メディア49の記憶内容を示し
た図である。記憶メディア49内に複数台のクライアント
の情報を含む場合と単独のクライアントの場合とでは構
造が異なる。複数格納時491の場合には、オーナー対応
表4911と共通ストアファイル4912を含んでいる。すなわ
ち、記憶メディア49上でもクライアント間でのファイル
共有手法が働くようにしている。なお代案として、複数
のクライアントファイルを個別に格納する形(493)に
しても良い。単独の場合には、リストア対象のクライア
ント用のファイルを入れる(492)。
【0074】図30はサーバ側の記憶メディア作成処理
1062を示した図である。最初に全クライアントのリスト
アデータを記憶メディア49に格納するか、一部を格納す
るかをたとえば図31に示す選択画面中の全体915か指
定916にてユーザに選択させる。指定916が選択された場
合にはさらにどのクライアントかをユーザに選択させ
る。常にクライアント全体を選択する形で良いならこの
選択画面は必要ない。次にユーザによって選択されたク
ライアントの台数が単数か複数かを判定する。複数なら
オーナー対応表1052の中を調べ、指定された複数クライ
アントがオーナーとなっているレコードを抜き出し記憶
メディア49に書き込み、さらにそのファイルの本体を共
通ストア103から抜き出して記憶メディア49に書き込
む。単数の場合には、オーナー対応表1052の中を調べ、
指定されたクライアントがオーナーとなっているファイ
ルの本体を共通ストア103から抜き出して記憶メディア4
9に書き込む。
【0075】図32はクライアント側のリストア処理30
52の流れを示した図である。まず記憶メディア49に格納
されている内容を調べ、オーナー対応表4911が含まれて
いるかどうかを判定する。オーナー対応表4911が無いな
ら、単数のクライアントの情報が含まれていると判断
し、特定クライアント用ファイル4921の内容をクライア
ントA30自身のファイル装置301にリストアして、リスト
ア処理は終了となる。オーナー対応表4911があるなら、
オーナー対応表4911内に登場するクライアントのうち、
どのクライアントに対してリストア操作を行うかをたと
えば図33のようなユーザへの確認画面を用いてユーザ
に確認する。またクライアントA30のOS(Operating S
ystem)がクライアント名を保持しているなどの理由
で、クライアントA30自身がクライアント名を知る手段
があるならその手段を使って得られたクライアント名を
自動的に選択する形にしても良い。その場合にはユーザ
によるクライアント名の選択操作は不要になる。クライ
アント名が明らかになった所で、記憶メディア49内のオ
ーナー対応表4911の内容を調べ、該当クライアント用の
ファイル(群)を見つけだし、共通ストアファイル4912
から対応するファイルの本体を取り出し、ファイル装置
301にリストアして終了する。
【0076】6.第五の実施例:大容量通信回線利用に
よるリストア 第五の実施例はリストア時のサーバ10−クライアントA3
0間データ転送に、通信衛星利用回線のような大容量デ
ータ転送向きの通信回線を用いるものである。これは本
発明でのリストアのような比較的大容量のデータ送信に
向く。また、前記通信衛星経由の通信を含むマルチキャ
スト、ブロードキャストなどの多数の相手に同時にデー
タを転送することが可能な通信手段は、本発明のような
複数のクライアントでデータを共有するような構造を持
つデータの配布に向く。なお通信回線のデータ帯域に余
裕があるならリストアデータ、すなわちオーナー対応表
1052と共通ストア103を常時送信しておいて、クライア
ントはリストアの必要が生じた時に、送られているデー
タを受信するという形にしても良い。
【0077】第五の実施例ではデータ転送手段として通
信衛星を用いるため、サーバ10側には通信衛星に対する
送信装置、クライアントA30側には通信衛星からの受信
装置を備える。サーバ10側のハード構成例を図34に、
クライアントA30側のハード構成例を図35に示す。
【0078】図36は通信衛星を用いたリストア部分の
システム構成例である。第四の実施例とほぼ同様な構成
となっているが、第五の実施例では記憶メディア49の代
わりに通信衛星61を用いる。それに合わせてサーバ10側
にBS(Broadcast Satellite)送信装置1065、クライ
アントA30側にBS受信装置3061を備える。処理内容は
第四の実施例と同様である。
【0079】上述のように、第四、第五の実施例によれ
ば、リストア処理時に発生するサーバからクライアント
へのファイル転送手段として、MOディスクなどの記憶
媒体または衛星通信などの大容量通信回線を用いること
で、通常用いるサーバ・クライアント間のネットワーク
トラヒックを低減できる。
【0080】
【発明の効果】本発明によれば、複数のクライアント機
が使用される環境において、クライアント機の記憶装置
のバックアップデータサイズを縮小することができる。
【0081】さらにバックアップへの障害をなくすこと
でバックアップを促しディスククラッシュからの復旧に
対応できるようになり、システムの管理コストを低減す
ることが可能になる。
【図面の簡単な説明】
【図1】本発明によるクライアント向きバックアップシ
ステムの原理図である。
【図2】本発明のハードウェア構成を示す図である。
【図3】本発明の論理構成図を示す図である。
【図4】バックアップのプロトコルを示す図である。
【図5】リストアのプロトコルを示す図である。
【図6】サーバ側のメイン処理を示す図である。
【図7】サーバ側のバックアップ処理を示す図である。
【図8】サーバ側のリストア処理を示す図である。
【図9】共有効果の確認画面例を示す図である。
【図10】クライアント別共有比率の表示画面例を示す
図である。
【図11】共有状況表示画面例を示す図である。
【図12】第二の実施例の構成図を示す図である。
【図13】オーナー対応表の例1を示す図である。
【図14】オーナー対応表の例2を示す図である。
【図15】第二の実施例のバックアップ処理を示す図で
ある。
【図16】第二の実施例の状況表示画面例を示す図であ
る。
【図17】第二の実施例におけるファイル早見表の構造
を示す図である。
【図18】第二の実施例におけるファイル探索手法の例
を示す図である。
【図19】第三の実施例の構成図を示す図である。
【図20】第三の実施例のプロトコルを示す図である。
【図21】第三の実施例の設定画面例を示す図である。
【図22】第三の実施例のクライアント側処理を示す図
である。
【図23】第三の実施例のバックアップ処理(前半)を
示す図である。
【図24】第三の実施例のバックアップ処理(後半)を
示す図である。
【図25】同一見込みリストの例を示す図である。
【図26】第四の実施例、サーバのハードウェア構成を
示す図である。
【図27】第四の実施例、クライアントのハードウェア
構成を示す図である。
【図28】第四の実施例、論理構成図を示す図である。
【図29】第四の実施例、記憶メディアの内容を示す図
である。
【図30】第四の実施例、サーバ側記憶メディア作成処
理を示す図である。
【図31】第四の実施例、メディア作成種別指定画面例
を示す図である。
【図32】第四の実施例、リストア処理の内容を示す図
である。
【図33】第四の実施例、クライアント名選択画面例を
示す図である。
【図34】第五の実施例、サーバのハードウェア構成を
示す図である。
【図35】第五の実施例、クライアントのハードウェア
構成を示す図である。
【図36】第五の実施例、通信衛星経由のリストアファ
イル転送を示す図である。
【符号の説明】
10…サーバ、101…共通/固有振り分け処理、102…個別
ファイル合成処理、103…共通ストア、1041…固有スト
アA、1042…固有ストアB、20…ネットワーク、30…クラ
イアントA、301…クライアントA用ファイル装置、31…
クライアントB、311…クライアントB用ファイル装置。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 齋藤 太朗 神奈川県横浜市戸塚区戸塚町5030番地 株 式会社日立製作所ソフトウェア事業部内 Fターム(参考) 5B082 DA02 DC05 DE06 HA08

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】複数のクライアント機器と、サーバ機器と
    からなるネットワークシステムにおけるデータバックア
    ップシステムであって、前記サーバ機器は、 前記各クライアント機器が持つデータから各クライアン
    ト機器に共通なデータ部分と各クライアントに固有なデ
    ータ部分とを検出する手段と、前記共通なデータ部分を
    保存する共通データ保存手段と、 前記固有なデータ部分を保存する固有データ保存手段と
    を備えることを特徴とするデータバックアップシステ
    ム。
  2. 【請求項2】請求項1記載のデータバックアップシステ
    ムにおいて、前記共通データ保存手段に保存されたデー
    タそれぞれが、どのクライアント機器のデータであるか
    を示すデータを記憶する手段を備えることを特徴とした
    データバックアップシステム。
  3. 【請求項3】請求項1記載のデータバックアップシステ
    ムにおいて、 前記蓄積されたデータを、前記クライアント機器別にリ
    ストアする手段を備えることを特徴としたデータバック
    アップシステム。
  4. 【請求項4】請求項1記載のデータバックアップシステ
    ムにおいて、 前記クライアント機器は、バックアップ対象となるデー
    タの属性情報を前記サーバ機器へ送信する手段を備える
    ことを特徴としたデータバックアップシステム。
  5. 【請求項5】請求項4記載のデータバックアップシステ
    ムにおいて、 前記サーバ機器は、各クライアント機器から送信された
    前記データ属性情報にもとづいて、データバックアップ
    時に前記クライアント機器から前記サーバ機器に転送す
    る必要のあるファイルを決定する手段を備えることを特
    徴としたデータバックアップシステム。
JP10216799A 1999-04-09 1999-04-09 データバックアップシステム Expired - Fee Related JP4075203B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP10216799A JP4075203B2 (ja) 1999-04-09 1999-04-09 データバックアップシステム
US09/542,160 US6625625B1 (en) 1999-04-09 2000-04-04 System and method for backup and restoring by utilizing common and unique portions of data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10216799A JP4075203B2 (ja) 1999-04-09 1999-04-09 データバックアップシステム

Publications (2)

Publication Number Publication Date
JP2000293420A true JP2000293420A (ja) 2000-10-20
JP4075203B2 JP4075203B2 (ja) 2008-04-16

Family

ID=14320160

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10216799A Expired - Fee Related JP4075203B2 (ja) 1999-04-09 1999-04-09 データバックアップシステム

Country Status (2)

Country Link
US (1) US6625625B1 (ja)
JP (1) JP4075203B2 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003050649A (ja) * 2001-08-08 2003-02-21 Toshiba It Solution Corp 集中管理システム、集中管理方法および集中管理を行う為のプログラム
JP2005202443A (ja) * 2004-01-13 2005-07-28 Masaaki Nakagawa ファイルシステムイメージの圧縮方法及びプログラム
JP2007157136A (ja) * 2005-12-01 2007-06-21 Internatl Business Mach Corp <Ibm> バックアップ・ストレージ中のファイルに関するメタデータの併合
JP2009110319A (ja) * 2007-10-31 2009-05-21 Nec Corp バックアップシステム、サーバ装置及びそれらに用いるバックアップ方法並びにそのプログラム
JP2009540467A (ja) * 2006-06-13 2009-11-19 アルカテル−ルーセント ユーエスエー インコーポレーテッド マルチメディアコンテンツを管理するための方法および装置
JP2012230646A (ja) * 2011-04-27 2012-11-22 Fujitsu Ltd バックアッププログラム、情報処理装置、情報処理端末、バックアップ方法
JP2013061883A (ja) * 2011-09-14 2013-04-04 Fujitsu Ltd リストア処理プログラム、リストア方法、及び情報処理装置
JP2015503777A (ja) * 2012-01-25 2015-02-02 株式会社日立製作所 ファイルクローンを利用したシングルインスタンス化方法及びそれを用いたファイルストレージ装置
US9330114B2 (en) 2014-03-05 2016-05-03 Fujitsu Limited Data processing apparatus, data processing method, and recording medium storing computer program for performing data processing
US10880083B2 (en) 2017-06-20 2020-12-29 Fujitsu Limited Information processing apparatus and method

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1175057B1 (fr) * 2000-07-19 2006-06-28 Bull S.A. Procédé de déport d'éxécution de certaines opérations d'un système central sur un système satellite et le système de communication correspondant
US7089449B1 (en) * 2000-11-06 2006-08-08 Micron Technology, Inc. Recovering a system that has experienced a fault
US20030149750A1 (en) * 2002-02-07 2003-08-07 Franzenburg Alan M. Distributed storage array
US7467167B2 (en) * 2002-03-19 2008-12-16 Network Appliance, Inc. System and method for coalescing a plurality of snapshots
US7017144B2 (en) * 2002-06-17 2006-03-21 Microsoft Corporation Combined image views and method of creating images
US7464176B2 (en) * 2002-06-17 2008-12-09 Microsoft Corporation Multicast system and method for deploying multiple images simultaneously
US6947954B2 (en) * 2002-06-17 2005-09-20 Microsoft Corporation Image server store system and method using combined image views
US6865655B1 (en) * 2002-07-30 2005-03-08 Sun Microsystems, Inc. Methods and apparatus for backing up and restoring data portions stored in client computer systems
US7124322B1 (en) * 2002-09-24 2006-10-17 Novell, Inc. System and method for disaster recovery for a computer network
US7302452B2 (en) * 2003-06-05 2007-11-27 International Business Machines Corporation Method and apparatus for handling requests for files in a data processing system
US20050091259A1 (en) * 2003-10-24 2005-04-28 Microsoft Corporation Redmond Wa. Framework to build, deploy, service, and manage customizable and configurable re-usable applications
US20060015545A1 (en) * 2004-06-24 2006-01-19 Josef Ezra Backup and sychronization of local data in a network
US20060212439A1 (en) * 2005-03-21 2006-09-21 Microsoft Corporation System and method of efficient data backup in a networking environment
US7660836B2 (en) * 2006-03-09 2010-02-09 International Business Machines Corporation Controlling incremental backups using opaque object attributes
KR101381551B1 (ko) 2006-05-05 2014-04-11 하이버 인크 그룹 기반의 완료 및 증분 컴퓨터 파일 백업 시스템, 프로세스 및 장치
US8200969B2 (en) * 2008-01-31 2012-06-12 Hewlett-Packard Development Company, L.P. Data verification by challenge
US20110302138A1 (en) * 2009-02-26 2011-12-08 Paul Michael Cesario Network aware storage device
US8788831B2 (en) * 2009-03-20 2014-07-22 Barracuda Networks, Inc. More elegant exastore apparatus and method of operation
CN104583966B (zh) * 2012-10-01 2018-06-08 株式会社日立制作所 用于去重复文件系统的备份和恢复系统以及对应的服务器和方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02297643A (ja) 1989-05-11 1990-12-10 Nec Corp ファイル管理方式
WO1996025801A1 (en) * 1995-02-17 1996-08-22 Trustus Pty. Ltd. Method for partitioning a block of data into subblocks and for storing and communicating such subblocks
US5778395A (en) * 1995-10-23 1998-07-07 Stac, Inc. System for backing up files from disk volumes on multiple nodes of a computer network
US5765173A (en) * 1996-01-11 1998-06-09 Connected Corporation High performance backup via selective file saving which can perform incremental backups and exclude files and uses a changed block signature list
US5898836A (en) * 1997-01-14 1999-04-27 Netmind Services, Inc. Change-detection tool indicating degree and location of change of internet documents by comparison of cyclic-redundancy-check(CRC) signatures
US6332217B1 (en) * 1997-05-09 2001-12-18 Hearme Software inventory control system
US6003044A (en) * 1997-10-31 1999-12-14 Oracle Corporation Method and apparatus for efficiently backing up files using multiple computer systems
US6078960A (en) * 1998-07-03 2000-06-20 Acceleration Software International Corporation Client-side load-balancing in client server network

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003050649A (ja) * 2001-08-08 2003-02-21 Toshiba It Solution Corp 集中管理システム、集中管理方法および集中管理を行う為のプログラム
JP2005202443A (ja) * 2004-01-13 2005-07-28 Masaaki Nakagawa ファイルシステムイメージの圧縮方法及びプログラム
JP2007157136A (ja) * 2005-12-01 2007-06-21 Internatl Business Mach Corp <Ibm> バックアップ・ストレージ中のファイルに関するメタデータの併合
JP2009540467A (ja) * 2006-06-13 2009-11-19 アルカテル−ルーセント ユーエスエー インコーポレーテッド マルチメディアコンテンツを管理するための方法および装置
JP2009110319A (ja) * 2007-10-31 2009-05-21 Nec Corp バックアップシステム、サーバ装置及びそれらに用いるバックアップ方法並びにそのプログラム
JP2012230646A (ja) * 2011-04-27 2012-11-22 Fujitsu Ltd バックアッププログラム、情報処理装置、情報処理端末、バックアップ方法
JP2013061883A (ja) * 2011-09-14 2013-04-04 Fujitsu Ltd リストア処理プログラム、リストア方法、及び情報処理装置
JP2015503777A (ja) * 2012-01-25 2015-02-02 株式会社日立製作所 ファイルクローンを利用したシングルインスタンス化方法及びそれを用いたファイルストレージ装置
US9330114B2 (en) 2014-03-05 2016-05-03 Fujitsu Limited Data processing apparatus, data processing method, and recording medium storing computer program for performing data processing
US10880083B2 (en) 2017-06-20 2020-12-29 Fujitsu Limited Information processing apparatus and method

Also Published As

Publication number Publication date
JP4075203B2 (ja) 2008-04-16
US6625625B1 (en) 2003-09-23

Similar Documents

Publication Publication Date Title
JP2000293420A (ja) データバックアップシステム
US10437721B2 (en) Efficient garbage collection for a log-structured data store
US7793112B2 (en) Access to content addressable data over a network
CN101334797B (zh) 一种分布式文件系统及其数据块一致性管理的方法
US7441092B2 (en) Multi-client cluster-based backup and restore
AU757667B2 (en) Access to content addressable data over a network
US7472125B2 (en) Method for managing a database system
JP2008546076A (ja) 時間制限メッセージの効率的な処理
US11307937B1 (en) Efficient space reclamation in deduplication systems
JP2004500648A (ja) クライアントサーバー環境における差分バックアップシステムの管理方法
CN102460398A (zh) 用于在备份操作中执行去重复的源分类
EP1387269A1 (en) Backup system and method of generating a checkpoint for a database
CN104583966A (zh) 用于去重复文件系统的备份和恢复系统以及对应的服务器和方法
CN101330431B (zh) 一种即时信息存储方法和系统
CN102693173A (zh) 基于快照的文件处理方法及具有快照功能的固态硬盘
US20120303588A1 (en) Data de-duplication processing method for point-to-point transmission and system thereof
CN107786599B (zh) 内存云系统
JPH07244645A (ja) 高信頼分散トランザクション処理システム
US7590627B2 (en) Arrangement for processing data files in connection with a terminal
JPH10124419A (ja) クライアントサーバーシステムにおけるソフトウェア及びデータの整合配布方法
CN104821907A (zh) 一种电子邮件处理方法
CN104702700A (zh) 一种邮件提取方法
CN104735152A (zh) 一种基于网络的邮件读取方法
WO2023246654A1 (zh) 数据管理的方法、装置、系统及存储介质
KR100449419B1 (ko) 데이터 크기에 따른 선별적 공간데이터 관리방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040325

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060417

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070904

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080121

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110208

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110208

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120208

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120208

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130208

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130208

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees