JP2009116773A - バックアップ実行可否判定システム - Google Patents

バックアップ実行可否判定システム Download PDF

Info

Publication number
JP2009116773A
JP2009116773A JP2007291697A JP2007291697A JP2009116773A JP 2009116773 A JP2009116773 A JP 2009116773A JP 2007291697 A JP2007291697 A JP 2007291697A JP 2007291697 A JP2007291697 A JP 2007291697A JP 2009116773 A JP2009116773 A JP 2009116773A
Authority
JP
Japan
Prior art keywords
storage area
data stored
backup
data
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007291697A
Other languages
English (en)
Other versions
JP2009116773A5 (ja
JP5124238B2 (ja
Inventor
Shoji Kodama
昇司 児玉
Kiyotake Kumazawa
清健 熊沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2007291697A priority Critical patent/JP5124238B2/ja
Priority to US12/068,207 priority patent/US7877359B2/en
Publication of JP2009116773A publication Critical patent/JP2009116773A/ja
Publication of JP2009116773A5 publication Critical patent/JP2009116773A5/ja
Application granted granted Critical
Publication of JP5124238B2 publication Critical patent/JP5124238B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1456Hardware arrangements for backup
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1461Backup scheduling policy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/81Threshold
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/84Using snapshots, i.e. a logical point-in-time copy of the data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】従来、ウィルス感染又はユーザのミス等によって大幅に変更されたデータを正常なバックアップ・データに上書きしてバックアップした結果、正常なバックアップ・データが失われるという問題があった。
【解決手段】ストレージシステムを備える計算機システムであって、前記ストレージシステムは、第1記憶領域、及び、ある時点における前記第1記憶領域に格納されたデータの複製を格納する第2記憶領域を含み、前記計算機システムは、バックアップ判定部をさらに含み、前記バックアップ判定部は、前記第1記憶領域に格納されたデータと、前記第2記憶領域に格納されたデータとの差分量が所定の閾値より小さいか否かを判定し、前記ストレージシステムは、前記差分量が前記所定の閾値より小さい場合のみ、前記第2記憶領域に格納されたデータを削除し、前記第1記憶領域に格納されたデータの複製を前記第2記憶領域に新たに格納する。
【選択図】図8

Description

本願明細書で開示される技術は、計算機によるデータ・バックアップの制御に関し、特に、正常なバックアップ・データが削除されたために、必要なデータをリストアできなくなる危険性を低下させる技術に関する。
バックアップ・ソフトウェアは、事前にシステム管理者が作成したバックアップ・ポリシーに従って、バックアップを実行する。
バックアップ・ポリシーは、バックアップ・スケジュール、オリジナル・データ位置、バックアップ先ストレージ、及び、バックアップ・データのリテンション期間などを指定する。
バックアップ・ソフトウェアは、バックアップ・スケジュールによってバックアップ契機を知り、オリジナル・データのコピーをバックアップ・データとしてバックアップ先ストレージに作成する。
バックアップ先ストレージの容量には上限があるため、新しいバックアップ・データをバックアップ先ストレージにコピーする前に、バックアップ・ソフトウェアは、リテンション期間(バックアップ・データを保持する期間)を過ぎたバックアップ・データを削除する。例えば、毎日バックアップが実行される場合、バックアップ実行の度に一週間前のバックアップ・データが削除されてもよい。
バックアップを実行する前に、バックアップの結果を予測する技術が開示されている(特許文献1参照)。特許文献1によれば、バックアップを実行する前に、バックアップが所定時間内に完了可能か否かを判定し、完了しないと判定された場合、警告が発行される。
具体的には、特許文献1によれば、バックアップされたデータ量及びバックアップに要した時間の履歴が保持され、その履歴に基づいて、次回のバックアップに要する時間が予測される。予測された時間が所定の閾値を超えた場合、警告が発行される。ユーザは、この警告に基づいてバックアップ・システムをチューニングすることができる。
特開2004−206611号公報
しかしながら、上記の特許文献1によれば、バックアップされるデータがウィルスに侵されていたり、ユーザのミスによってファイルの内容が大幅に変更されていたりしても、そのことを知ることができない。したがって、ウィルスに侵されたファイル又は誤って変更されたファイル等のバックアップの実行を防ぐことができない。
そのため、バックアップ実行後に、ユーザがファイルをウィルスに侵される前のファイル又は内容を大幅に変更する前のファイルにリストアしたいと考えても、既に実行したバックアップによってそれらのバックアップ・データが削除されているため、リストアできないという問題がある。
また、従来、バックアップ時に削除されるバックアップ・データは、バックアップ・ポリシーとして定められたリテンション期間によって決定される。ウィルスに侵されているバックアップ・データと、リテンション期間が経過しているがウィルスには侵されていないバックアップ・データが存在した場合、従来は、リテンション期間が経過したバックアップ・データが削除される。その結果、リストアに利用できない、ウィルスに犯されたバックアップ・データが残るため、正常なファイルをリストアするというバックアップの本来の目的を達成できないという問題がある。
本発明は、上記課題を解決するためになされたものであり、正常なバックアップ・データが削除されたために必要なデータをリストアできなくなる危険性を低下させるバックアップ実行可否判定システムを提供することを目的とする。
本願で開示する代表的な発明は、ネットワークに接続されるストレージシステムを備える計算機システムであって、前記ストレージシステムは、複数のデータ記憶領域を含む一つ以上のデータ記憶装置と、前記データ記憶装置を制御するコントローラと、を備え、前記複数のデータ記憶領域は、第1記憶領域、及び、ある時点における前記第1記憶領域に格納されたデータの複製を格納する第2記憶領域を含み、前記計算機システムは、バックアップ判定部をさらに含み、前記バックアップ判定部は、前記第1記憶領域に格納されたデータと、前記第2記憶領域に格納されたデータとの差分量が所定の閾値より小さいか否かを判定し、前記ストレージシステムは、前記差分量が前記所定の閾値より小さい場合のみ、前記第2記憶領域に格納されたデータを削除し、前記第1記憶領域に格納されたデータの複製を前記第2記憶領域に新たに格納することを特徴とする。
本発明の一実施形態によれば、ウィルスに感染したファイル又は誤って変更されたファイルをバックアップするために正常なバックアップ・ファイルを削除してしまうことを防止できる。
(第1の実施形態)
以下、本発明の第1の実施形態に係るバックアップ実行可否判定システムについて、図面を参照しながら説明する。
図1は、本発明の第1の実施形態のバックアップ実行可否判定システムの概略構成を示すブロック図である。
本システムは、サーバ0101、バックアップ実行可否判定サーバ0109、バックアップ・サーバ0106、ストレージ0113、及び、これらを接続するネットワーク0112から構成される。
ネットワーク0112としては、Ethernet(登録商標)又はInternetを利用できる。通信プロトコルとしてはTCP/IPを利用できる。
サーバ0101はアプリケーション0102が稼動する計算機である。アプリケーション0102は、ストレージ0113内にデータを格納し、格納されているデータを参照する。
バックアップ実行可否判定サーバ0109は、アプリケーション・データとバックアップ・データとを比較し、バックアップ・データを削除して新しくバックアップを実行するか否かを判定する計算機である。バックアップ実行可否判定サーバは、インデックス作成部0110及びバックアップ実行判定部0103を機能として有する。また、バックアップ実行可否判定サーバ0109は、管理情報として、インデックス・テーブル0119、実行条件テーブル0104及びキーワード管理テーブル0105を保持する。
バックアップ・サーバ0106は、バックアップ・ポリシーに基づいてデータのバックアップを実行する計算機である。本実施形態のバックアップ・サーバ0106は、バックアップを実行する前に、バックアップ実行可否判定サーバ1019に、バックアップを実行してもよいか否かを問い合わせる。バックアップ・サーバ0106では、バックアップ・ソフトウェア0107が稼動する。バックアップ・ソフトウェア0107は、管理情報として、バックアップ・ポリシー管理テーブル0108及びバックアップ・カタログ0120を保持する。
ストレージ0113は、サーバ0101からのデータ・アクセス要求(すなわち、データの格納要求又は参照要求)を処理する機能、及び、データをバックアップするためにスナップショットを作成する機能を提供するデータストレージシステムである。本実施形態のストレージ0113は、いわゆるNetwork Attached Storage(NAS)であるが、その他の種類のストレージシステムにも本発明を適用することができる。
サーバ0101からのデータ・アクセス要求は、I/O処理部0114によって処理される。
スナップショットの作成とは、スナップショット要求を受信した時点におけるデータ・ボリューム0116内のデータのコピーをバックアップ・ボリューム0117A〜0117B又は一時バックアップ・ボリューム0118に作成することを意味する。スナップショット作成処理は、スナップショット処理部0115が実行する。この場合、コピー元のデータ・ボリューム0116のデータはオリジナル・データとも記載される。スナップショット作成処理によって作成され、バックアップ・ボリューム0117A等に格納されるオリジナル・データのコピーは、バックアップ・データとも記載される。
以下の説明において、個々のバックアップ・ボリューム0117A〜0117Bを区別する必要がない場合、これらを総称してバックアップ・ボリューム0117と記載する。すなわち、バックアップ・ボリューム0117A〜0117Bの各々は、複数のバックアップ・ボリューム0117の一つである。
図1には、例として、一つのデータ・ボリューム0116及び二つのバックアップ・ボリューム0117を含むストレージ0113を示す。しかし、実際には、ストレージ0113は、任意の数のデータ・ボリューム0116及び任意の数のバックアップ・ボリューム0117を含んでもよい。
一時バックアップ・ボリューム0118は、バックアップ実行不可と判定された場合に、バックアップ・データを削除せず、データを一時的にバックアップしておくためのボリュームである。
なお、データ・ボリューム0116、バックアップ・ボリューム0117A〜0117B及び一時バックアップ・ボリューム0118の各々は、I/O処理部0114及びスナップショット処理部0115によって一つの論理的な記憶装置として扱われる記憶領域である。
本実施形態は、データをバックアップするために、ストレージ0113のスナップショット機能を利用する例を示す。ただし、本発明は、ホスト経由バックアップ、すなわち、バックアップ・サーバ0106がデータ・ボリューム内のファイルを読み出し、そのファイルのコピーをバックアップ・ボリューム0117A等に格納することによって実行されるバックアップにも本発明を適用することができる。
図2は、本発明の第1の実施形態のサーバ0101、バックアップ実行可否判定サーバ0109及びバックアップ・サーバ0106のハードウェア概略構成を示すブロック図である。
サーバ0101、バックアップ実行可否判定サーバ0109及びバックアップ・サーバ0106の各々は、図2に示すハードウェアを有する計算機0200によって実現される。
具体的には、これらのサーバを実現する計算機0200は、CPU0201、メモリ0202、Hard Disk Drive(HDD)0203及びネットワーク・インタフェース0205を内部構成要素として備え、それらが内部バス0204で相互に接続されている。これらのサーバはネットワーク・インタフェース0205を介してネットワーク0112に接続され、他のサーバ及びストレージ0113と通信する。
アプリケーション0102は、サーバ0101のメモリ0202に格納されたプログラム(図示省略)をサーバ0101のCPU0201が実行することによって実現される。
インデックス作成部0110及びバックアップ実行判定部0103は、バックアップ実行可否判定サーバ0109のメモリ0202に格納されたプログラム(図示省略)をバックアップ実行可否判定サーバ0109のCPU0201が実行することによって実現される。インデックス・テーブル0119、実行条件テーブル0104及びキーワード管理テーブル0105は、バックアップ実行可否判定サーバ0109のメモリ0202に格納される。
バックアップ・ソフトウェア0107は、バックアップ・サーバ0106のメモリ0202に格納されたプログラム(図示省略)をバックアップ・サーバ0106のCPU0201が実行することによって実現される。バックアップ・ポリシー管理テーブル0108及びバックアップ・カタログ0120は、バックアップ・サーバ0106のメモリ0202に格納される。
上記のプログラム及びテーブル等のデータは、HDD0203に格納され、必要に応じてメモリ0202にコピーされてもよい。
図3は、本発明の第1の実施形態のストレージ0113のハードウェア概略構成を示すブロック図である。
ストレージ0113は、ネットワーク・インタフェース0301、コントローラ0302、キャッシュメモリ0303、ディスク・インタフェース0305及び一台以上のHDD0306、0307及び0308を備える。これらのうちHDD0306等以外は内部バス0304によって相互に接続される。HDD0306等はディスク・インタフェース0305に接続される。ストレージ0113は、ネットワーク・インタフェース0305を介してネットワーク0112に接続し、各種サーバと通信する。
HDD0306等は、データを格納する複数の記憶領域を含む。各記憶領域は、データ・ボリューム0116、バックアップ・ボリューム0117A〜0117B及び一時バックアップ・ボリューム0118のいずれかに割り当てられる。
I/O処理部0114及びスナップショット処理部0115は、コントローラ0302によって実現される。例えば、上記の各部は、コントローラ0302内のCPU(図示省略)がコントローラ0302内のメモリ(図示省略)に格納されたプログラムを実行することによって実現されてもよい。したがって、本発明の実施形態において上記の各部が実行する処理は、実際にはコントローラ0302によって実行される。
図4は、本発明の第1の実施形態のバックアップ・ポリシー管理テーブル0108の例を示す説明図である。
バックアップ・ポリシーとは、どのデータをどこにいつバックアップし、どれだけの期間バックアップ・データを保管するのかを指定する設定情報である。
バックアップ・ポリシー管理テーブル0108は、ポリシーID0402、バックアップ元0403、バックアップ先0404、スケジュール0405及びリテンション期間0406から成る。
ポリシーID0402は、バックアップ・ポリシーを区別するユニークなID(識別子)である。
バックアップ元0403は、オリジナル・データが格納されている場所を示す。バックアップ元0403は、例えば、オリジナル・データが格納されているフォルダ、ファイル・システム又はボリュームなどを指定する。図4の例において、「ORIG001」等は、ファイル・システムの識別子である。本実施形態では、一つのデータ・ボリューム0116に一つのファイル・システムが格納される。
バックアップ先0404は、バックアップ・データを格納する場所を示す。データ・ボリューム0116のスナップショットが作成される場合、保管するバックアップ・データの世代の数と同数のバックアップ・ボリューム0117が用意される。それらのバックアップ・ボリューム0117のグループが、データ・ボリューム0116のバックアップ先として管理される。
例えば、あるデータ・ボリューム0116の3世代のバックアップ・データが保管される場合、そのデータ・ボリューム0116のバックアップ先として、三つのバックアップ・ボリューム0117からなるグループが用意される。バックアップ先0404は、このようなバックアップ・ボリューム0117のグループの識別子を指定する。
スケジュール0405は、バックアップの実行が開始されるタイミングを指定する。
リテンション期間0405は、取得したバックアップ・データを保管しなければならない期間を指定する。リテンション期間0405によって指定された期間が経過した後、バックアップ・データは削除対象となる。
図4の例では、ポリシーID0402の値「BK001」に対応するバックアップ元0403、バックアップ先0404、スケジュール0405及びリテンション期間0406として、それぞれ、「ORIG001」、「MEDIA_GROUP001」、「毎日正午」及び「1週間」が指定されている。これは、ファイル・システム「ORIG001」に格納されたデータが、「MEDIA_GROUP001」によって識別されるグループに含まれるいずれかのバックアップ・ボリューム0117にバックアップされること、そのバックアップが毎日正午に実行されること、及び、バックアップされたデータを、バックアップされた後1週間保管する必要があることを示している。
図5は、本発明の第1の実施形態の実行条件テーブル0104の例を示す説明図である。
実行条件テーブル0104は、リテンション期間が経過したバックアップ・データをバックアップ・ボリューム0117から削除し、そのバックアップ・ボリューム0117に新たなバックアップ・データを格納してよいか否かを判定するための条件を指定するテーブルである。
実行条件テーブル0104は、ポリシーID0502、差分条件0503及び削除対象条件0504から構成される。
ポリシーID0502は、バックアップ・ポリシー管理テーブル0108のポリシーID0402を指定する。バックアップ・ポリシー毎に実行条件を指定することができる。
差分条件0503は、バックアップを実行するか否かを判定するために使用される差分量の閾値を指定する。差分量とは、データ・ボリューム0116に格納されているオリジナル・データと、いずれかのバックアップ・ボリューム0117に格納されているバックアップ・データとの差を示す量であり、あらかじめ規定した算出式に基づいて算出される。例えば、差分量0503として「100」が指定されている場合、算出された差分量が100より小さい場合にバックアップが実行される。
削除対象条件0504は、バックアップを実行する場合に削除されるバックアップ・データを選択する条件を指定する。「リテンション期間に従う」と指定された場合は、リテンション期間が経過したバックアップ・データのうち、一番古い時刻に取得したバックアップ・データが削除される。「差分量が一番小さい」と指定された場合は、リテンション期間が経過した複数のバックアップ・データのうち、一番差分量が小さいバックアップ・データが削除される。
図6は、本発明の第1の実施形態のキーワード管理テーブル0105の例を示す説明図である。
キーワード管理テーブル0105は、バックアップ・データ毎に、バックアップしたファイルに含まれるキーワードと、それらのキーワードの出現回数とを保持するテーブルである。キーワード管理テーブル0105は、バックアップ対象データ(すなわち、これからバックアップされるオリジナル・データ)とバックアップ・データとの間の差分量を算出する際に参照される。
キーワード管理テーブル0105は、ポリシーID0601、バックアップ・データID0602、パス名0603、キーワード0604及びキーワード出現数0605から構成される。
ポリシーID0601は、バックアップ・データがどのバックアップ・ポリシーに基づいて取得されたものかを示す。具体的には、ポリシーID0601は、バックアップ・ポリシー管理テーブル0108のポリシーID0402を指定する。
バックアップ・データID0602は、バックアップ・データを特定するための情報である。例えば複数のバックアップ・ファイルをTAR(Tape Archival and Retrieval format)でまとめてバックアップした場合、バックアップ・データID0602は、TARファイルが格納されている場所を示す。スナップショットが作成された場合、バックアップ・データID0602は、作成されたスナップショットを格納するバックアップ・ボリューム0117の識別子を示す。
パス名0603は、バックアップされた各ファイル(すなわち、バックアップ・ボリューム0117に含まれる各ファイル)のパス名であり、ファイル個々を識別する目的で利用される。
キーワード0604は、各ファイル内に出現するキーワードである。
キーワード出現数0605は、一つのファイルにおける各キーワードの出現回数である。
例えばエントリ0606は、バックアップ・ポリシー「BK001」に基づいて取得されたバックアップ・データ「BK001_001」に含まれるファイル「/DIR1/FILE001」内にキーワード「日立」が23回出現したことを示す。
図7は、本発明の第1の実施形態のインデックス・テーブル0119の例を示す説明図である。
インデックス・テーブル0119は、バックアップ対象データ毎に、そのバックアップ対象データ内のファイルに含まれるキーワードと、それらのキーワードの出現回数とを保持するテーブルである。
インデックス・テーブル0119は、格納元0702、インデックス作成時刻0703、パス名0704、キーワード0705及びキーワード出現数0706から構成される。
格納元0702は、インデックス作成対象データが格納されている場所を示す。本実施形態では、バックアップ・ポリシーによって指定されたバックアップ元0403が格納元0702に対応する。
インデックス作成時刻0703は、格納元0702が示す場所に格納されたデータに関して、インデックス・テーブルを更新した時刻を示す。本実施形態では、前回のバックアップ完了時刻と次回のバックアップ開始時刻との間に少なくとも一回インデックス・テーブルを更新する。
パス名0703は、格納元0702が示す場所に格納された各ファイルのパス名である。
キーワード0704及びキーワード出現数0705は、それぞれ、キーワード管理テーブル0105のキーワード0604及びキーワード出現数0605と同様、各ファイル内に出現するキーワード及びその出現回数を示す。
次に、本実施形態において実行される処理について説明する。
バックアップ・ソフトウェア0107は、バックアップ・ポリシーが示すスケジュールに基づいてバックアップを実行する前に、バックアップを実行してよいか否かをバックアップ実行可否判定サーバ0109に問い合わせる。バックアップ可能であれば、バックアップ・ソフトウェア0107は、バックアップ実行可否判定サーバが決定したバックアップ・データを削除し、バックアップを実行する。バックアップ不可であれば、バックアップ・ソフトウェア0107はバックアップを中断する。
図8は、本発明の第1の実施形態のバックアップ・ソフトウェア0107が実行する一連の処理を示すフローチャートである。
図8に示す処理のうち、バックアップ・サーバ0106によって実行される処理は、バックアップ・サーバ0106のバックアップ・ソフトウェア0107によって実行される。より詳細には、この処理は、バックアップ・サーバ0106内のメモリ0202に格納されたバックアップ・ソフトウェア0107をCPU0201が実行することによって実現される。
最初に、バックアップ・サーバ0106は、バックアップ・ポリシーのスケジュールに基づき、起動する(ステップ0804)。その際、バックアップ・サーバ0106は、バックアップ・ポリシーID0402を指定する。
例えば、バックアップ・ポリシーが図4のように指定されている場合、毎日正午にバックアップ・サーバ0106が起動し、その際にポリシーID0402として「BK001」が指定される。さらに、毎週1回バックアップ・サーバ0106が起動し、その際にポリシーID0402として「BK002」が指定される。
起動したバックアップ・サーバ0106は、バックアップ実行可否判定サーバ0109に対して、バックアップ実行可否判定要求を発行する(ステップ0805)。要求フォーマットの例は、図11に示す。要求フォーマットは、ステップ0804において指定されたポリシーIDを含む。
バックアップ実行可否判定要求を受信したバックアップ実行可否判定サーバは、バックアップ実行判定部0103を呼び出す(ステップ0806)。呼び出されたバックアップ実行判定部0103は、図9に示す処理を実行する。
次に、バックアップ実行可否判定サーバ0109は、判定結果をバックアップ・サーバ0106に返す(ステップ0807)。判定結果のフォーマットは図12に示す。判定結果は、実行可否結果、及び、削除されるバックアップ・データのIDの指定を含む。
バックアップ・サーバ0106は、バックアップ実行可否判定の結果を判定する(ステップ0808)。バックアップ実行不可と判定された場合、バックアップ・サーバ0106はステップ0809を実行する。バックアップ実行可能と判定された場合、バックアップ・サーバ0106はステップ0811を実行する。
ステップ0808においてバックアップ実行不可と判定された場合、これからバックアップされるオリジナル・データは、ウィルス感染又はユーザの誤操作等に起因する、バックアップされるべきでないデータを含んでいる可能性がある。言い換えると、このバックアップによって削除される古いバックアップ・データは、ウィルス感染等が発生する前の、正しいデータを含んでいる可能性がある。
この場合、バックアップ・サーバ0106は、要求されたバックアップを実行しない。すなわち、バックアップ・サーバ0106は、要求されたバックアップを実行するために削除されるはずであった、リテンション期間が経過したバックアップ・データを、削除しない。
代わりに、バックアップ・サーバ0106は、リテンション期間が経過したバックアップ・データ(すなわち、要求されたバックアップが実行されれば削除されるはずであったバックアップ・データ)のリテンション期間を、次回のバックアップ実行時期まで延長する(ステップ0809)。バックアップ・サーバ0106は、リテンションが経過したバックアップ・データを削除する処理を、バックアップ実行タイミングにおいて実行するだけでなく、定期的に実行する場合がある。このような場合にも、管理者の確認が完了するまでバックアップ・データ削除を待たせるために、リテンション期間が延長される。
次に、バックアップ・サーバ0106は、管理者に対してバックアップがスケジュール通りに実行できなかったことを通知する(ステップ0810)。この通知は、例えば、バックアップ・サーバ0106が管理者にメールを送信することによって実行されてもよい。以上で処理を終える。
一方、ステップ0808においてバックアップ実行可能と判定された場合、これからバックアップされるオリジナル・データは、ウィルス感染又はユーザの誤操作等に起因する、バックアップされるべきでないデータを含んでいないと考えられる。この場合、バックアップ・サーバ0106は、バックアップ実行可否判定サーバ0109が指定したバックアップ・データを削除する指示をストレージ0113に送信する(ステップ0811)。ストレージ0113のスナップショット機能を使ってバックアップが実行される場合、ストレージ0113は、指定されたスナップショットを削除する。
次に、バックアップ・サーバ0106は、ストレージ0113に対してスナップショット要求を発行する(ステップ0812)。
なお、本実施形態では、ストレージ0113のスナップショット機能を使ってデータをバックアップする例を説明している。しかし、ホスト・ベースのファイル単位バックアップをバックアップ・サーバ0106自身が実行する場合にも、本発明を適用することができる。その場合は、ステップ0811、ステップ0812、および、ステップ0813において、ファイル単位のバックアップが実行される。例えば、バックアップ・サーバ0106が図13に示した1303のファイル毎のバックアップ可否結果に基づき、1304で指定されるバックアップ可能のファイルに対応する削除バックアップ・データを削除した上で、バックアップ可能のファイルをデータ・ボリューム0116から読み出し、そのファイルのコピーをバックアップ・ボリューム0117に格納してもよい。
ストレージ0113は、スナップショット要求に従ってスナップショットを作成し、結果をバックアップ・サーバ0106に返す(ステップ0813)。
結果を受信したバックアップ・サーバ0106は、バックアップが成功したことをバックアップ実行可否判定サーバ0109に通知する(ステップ0814)。この通知は、バックアップを取得した際のインデックス・テーブル0119の内容を、キーワード管理テーブル0105にコピーして記録するために送信される。バックアップ成功通知のフォーマットは図13に示す。
バックアップ成功通知を受信したバックアップ実行可否判定サーバ0109は、キーワード管理テーブル0105にエントリを一行追加する。そして、バックアップ実行可否判定サーバ0109は、追加されたエントリのポリシーID0601及びバックアップ・データID0602に、バックアップ成功通知によって指定されたポリシーID1403及びバックアップ・データID1404(図14参照)の内容をコピーする(ステップ0815)。さらに、バックアップ実行可否判定サーバ0109は、バックアップ実行判定部0103が一時的に保管しておいたインデックス・テーブル0119のパス名0703、キーワード0704及びキーワード出現数0705の内容を、追加されたエントリのパス名0603、キーワード0604及びキーワード出現数0605にコピーする。この一時的な保管については、図9において説明する(ステップ0907)。以上で処理を完了する。
上記の例では、ステップ0808においてバックアップ実行不可と判定された場合、バックアップ・データの削除及び新たなバックアップ・データ(スナップショット)の作成のいずれも実行されない。しかし、ステップ0808においてバックアップ実行不可と判定された場合、バックアップ・データを削除せずに、ステップ0810において新たなバックアップ・データを作成し、そのバックアップ・データを一時バックアップ・ボリューム0118に格納してもよい。この場合も、古いバックアップ・データが削除されないため、新たなバックアップ・データが例えばウィルス感染していた場合、新たなバックアップ・データを削除して古いバックアップ・データを利用することができる。
図9は、本発明の第1の実施形態のバックアップ実行判定部0103が実行する処理を示すフローチャートである。
図9に示す処理は、削除対象のバックアップ・データが、リテンション期間が経過した最古のバックアップ・データであるか、リテンション期間が経過した複数のバックアップ・データのうち実行条件を満足するバックアップ・データであるかによって分岐する。この分岐は、実行条件テーブル0104の削除対象条件0504の内容に基づいて判定される。バックアップ実行判定部0103は、バックアップ対象データの内容と削除候補のバックアップ・データの内容とを比較し、実行条件を満足するか否かを判定する。
以下、図9を用いて、バックアップ実行判定部0103の処理を説明する。この処理は、図8のステップ0806で呼び出される。なお、図9に示す処理は、バックアップ実行可否判定サーバ0109のCPU0201が、メモリ0202に格納されたプログラムを実行することによって実現される。
最初に、バックアップ実行可否判定サーバ0109は、実行条件テーブル0104のうち、指定されたポリシーIDに対応するエントリの削除対象条件0504を参照する(ステップ0902)。
次に、バックアップ実行可否判定サーバ0109は、削除対象条件0504が「リテンション期間に従う」であるか否かを判定する(ステップ0903)。削除対象条件0504が「リテンション期間に従う」である場合、バックアップ実行可否判定サーバ0109は、ステップ0904を実行する。削除対象条件0504が「差分量が一番小さい」である場合、バックアップ実行可否判定サーバ0109は、ステップ0910を実行する。
バックアップ実行可否判定サーバ0109は、バックアップ・サーバ0106のバックアップ・カタログ0120を参照し、指定されたポリシーIDに基づいてバックアップされたバックアップ・データのうち、リテンション期間が経過し、かつ、最も早くバックアップされたバックアップ・データ(すなわち最古のバックアップ・データ)を選択する(ステップ0904)。
次に、バックアップ実行可否判定サーバ0109は、ステップ0904で選択されたバックアップ・データと、これからバックアップされるオリジナル・データ(すなわち、バックアップ対象データ)との間の差分量を計算する(ステップ0905)。差分量計算の方法については図10で説明する。
次に、バックアップ実行可否判定サーバ0109は、実行条件テーブル0104の差分条件0503を参照し、ステップ0905で計算された差分量が条件を満足しているか否かを判定する(ステップ0906)。
差分量が条件を満足していた場合、バックアップ対象データは、ウィルス感染又はユーザの誤操作等に起因する不正なデータではないと考えられる。この場合、バックアップ実行可否判定サーバ0109はステップ0907を実行する。一方、差分量が条件を満足していなかった場合、バックアップ対象データは、ウィルス感染又はユーザの誤操作等に起因する、不正なデータを含んでいると考えられる。このようなデータをバックアップすること、及び、このようなデータをバックアップするために古いバックアップ・データを削除することは、望ましくない。この場合、バックアップ実行可否判定サーバ0109はステップ0909を実行する。
差分量が条件を満足していた場合、バックアップ実行可否判定サーバ0109は、インデックス・テーブル0119の内容のうち、指定されたポリシーIDに対応するバックアップ対象データに関する内容を一時的にメモリ0202に保管する(ステップ0907)。
次に、バックアップ実行可否判定サーバ0109は、「バックアップ実行可能」という判定結果を応答する(ステップ0908)。この場合、削除バックアップ・データ1203(図12参照)として、リテンション期間が切れた最古のバックアップ・データが指定される。
差分量が条件を満足していなかった場合、バックアップ実行可否判定サーバ0109は、「バックアップ実行不可」という判定結果を応答する(ステップ0909)。
ステップ0903において、削除対象条件0504が「差分量が一番小さい」であった場合、バックアップ実行可否判定サーバ0109は、バックアップ・サーバ0106が管理するバックアップ・ポリシー管理テーブル0108及びバックアップ・カタログ0120を参照し、指定されたポリシーIDに基づいてバックアップされたバックアップ・データのうち、リテンション期間が経過したバックアップ・データを検索する(ステップ0910)。そして、バックアップ実行可否判定サーバ0109は、検索の結果得られた一つ以上のバックアップ・データの各々に関してステップ0911以下の処理を実行する。
バックアップ実行可否判定サーバ0109は、検索された各バックアップ・データと、バックアップ対象データとの間の差分量を計算する(ステップ0911)。差分量計算の方法については図10で説明する。計算結果は、バックアップ・データ毎にテーブル(図示省略)に記録される。
次に、バックアップ実行可否判定サーバ0109は、検索された一つ以上のバックアップ・データのうち、リテンション期間が経過した全バックアップ・データに関して差分量計算が完了したか否かを判定する(ステップ0912)。全バックアップ・データに関して差分量計算が完了した場合、バックアップ実行可否判定サーバ0109は、ステップ0913を実行する。全バックアップ・データに関して差分量計算が完了していない場合、バックアップ実行可否判定サーバ0109は、次のバックアップ・データに関してステップ0911を繰り返す。
バックアップ実行可否判定サーバ0109は、差分量を計算したバックアップ・データのうち、実行条件テーブル0104の差分条件0503を満足するバックアップ・データを特定する(ステップ0913)。
差分条件0503を満足するバックアップ・データが少なくとも一つ存在する場合、バックアップ実行可否判定サーバ0109は、ステップ0907を実行する。その際、削除バックアップ・データ1203はステップ0913で存在すると判定されたバックアップ・データとなる。
ステップ0913において、差分条件0503を満足するバックアップ・データが複数存在すると判定された場合、それらのうち、算出された差分量が最も小さいもの、もしくは、最も最古ものが削除バックアップ・データ1203として指定されてもよい。
一方、差分条件0503を満足するバックアップ・データが一つも存在しない場合、バックアップ実行可否判定サーバ0109は、ステップ0909を実行する。
図10は、本発明の第1の実施形態の差分量計算処理を示すフローチャートである。
この処理は、バックアップ対象データと削除対象バックアップ・データとの差分量として、それらの内容の不一致度を計算する処理である。内容の不一致度は、ファイルに含まれるキーワードの違い及びキーワードの出現回数の違いに基づいて算出される。この処理は、図9のステップ0905及びステップ0911において、バックアップ実行可否判定サーバ0109のバックアップ実行判定部0103によって実行される。
最初に、バックアップ実行可否判定サーバ0109は、変数[差分量]の値を「0」に初期化する(ステップ1002)。変数[差分量]は、例えば、バックアップ実行可否判定サーバ0109のメモリ0202に格納されてもよい。
次に、バックアップ実行可否判定サーバ0109は、バックアップ対象データ及びそれと比較されるバックアップ・データの少なくとも一方に出現する全パス名をリストアップする(ステップ1003)。これらの全パス名は、インデックス・テーブル0119のパス名0703及びキーワード管理テーブル0105のパス名0603に基づいてリストアップされる。
具体的には、指定されたポリシーID0402に対応するバックアップ元0403(すなわち格納元0701)に対応するパス名0703(図7参照)、及び、比較されるバックアップ・データのID0602に対応するパス名0603(図6参照)が全てリストアップされる。
図10の処理がステップ0905において実行される場合、比較されるバックアップ・データとは、ステップ0904において選択されたバックアップ・データである。図10の処理がステップ0911において実行される場合、比較されるバックアップ・データとは、ステップ0910において検索された一つ以上のバックアップ・データのうち一つである。
ステップ1003においてリストアップされた全パス名について、ステップ1004以下の処理が実行される。
バックアップ実行可否判定サーバ0109は、リストアップされたパス名で識別されるファイルに出現する全てのキーワードについて、ステップ1005以下の処理を実行する(ステップ1004)。具体的には、出現する各キーワードについて順次ステップ1005が実行される。出現するキーワードは、リストアップされたパス名に対応するインデックス・テーブル0119のキーワード0704及びキーワード管理テーブル0105のキーワード0604から取得することができる。
バックアップ実行可否判定サーバ0109は、変数[差分量]に、([バックアップ元ファイル内のキーワード出現数]−[バックアップ・ファイル内のキーワード出現数])の二乗を加える(ステップ1005)。バックアップ元ファイル内のキーワード出現数は、インデックス・テーブル0119のキーワード0704から取得される値である。バックアップ・ファイル内のキーワード出現数は、キーワード管理テーブル0105のキーワード0604から取得される値である。比較される二つのファイルのうち一方のみにキーワードが出現している場合、もう一方のファイルにおける出現数をゼロとして計算される。
なお、ステップ1005において、([バックアップ元ファイル内のキーワード出現数]−[バックアップ・ファイル内のキーワード出現数])の二乗を加える代わりに、([バックアップ元ファイル内のキーワード出現数]−[バックアップ・ファイル内のキーワード出現数])の絶対値が加えられてもよい。
次に、バックアップ実行可否判定サーバ0109は、リストアップされたファイルに出現する全キーワードについてステップ1005の処理が終了したか否かを判定する(ステップ1006)。全キーワードについて処理が終了した場合、リストアップされたファイルの一つと、それに対応するバックアップ元ファイルとの間で、全てのキーワードの出現回数の差がキーワードごとに算出され、それらの差の合計値が算出された。この場合、処理はステップ1007に進む。そうでない場合は、ステップ1005に戻り、次のキーワードを対象に処理が実行される。
次に、バックアップ実行可否判定サーバ0109は、リストアップされた全パス名によって識別される全ファイルについて、ステップ1004〜ステップ1006の処理が終了したか否かを判定する(ステップ1007)。全パス名についての処理が処理した場合、バックアップ対象データに含まれる全キーワードの出現回数と、バックアップ・データに含まれる全キーワードの出現回数との差がキーワードごとに算出され、それらの合計値が算出された。この場合、処理はステップ1008に進む。そうでない場合は、ステップ1004に戻り、次のパス名を対象に処理が実行される。
次に、バックアップ実行可否判定サーバ0109は、差分量の計算結果として、変数[差分量]の値を返す(ステップ1008)。以上で処理を完了する。
図11は、本発明の第1の実施形態のバックアップ実行可否判定要求1101のフォーマット例を示す説明図である。
バックアップ実行可否判定要求1101には、要求種別1102及びポリシーID1103が含まれる。要求種別1102は、この要求がバックアップ実行可否判定要求であることを示す「バックアップ実行可否判定」を指定する。ポリシーID1103は、実行するバックアップ・ポリシーID、例えば、「BK001」を指定する。
図12は、本発明の第1の実施形態のバックアップ実行可否結果1201のフォーマット例を示す説明図である。
バックアップ実行可否結果1201は、結果1202及び削除バックアップ・データ1203から成る。結果1202は、バックアップ実行判定部0103による判定結果を指定する。具体的には、ステップ0908において送信されるバックアップ実行可否結果1201の結果1202は、「バックアップ可」を指定する。ステップ0909において送信されるバックアップ実行可否結果1201の結果1202は、「バックアップ不可」を指定する。
削除バックアップ・データ1203は、結果1202が「バックアップ可」のときのみ有効であり、バックアップ実行のために削除されるバックアップ・データを指定する。例えば、削除バックアップ・データ1203が「BK001_001」を指定する場合、ステップ0811において、「BK001_001」によって識別されるバックアップ・ボリューム0117に格納されたバックアップ・データが削除される。そして、ステップ0812において、そのバックアップ・ボリューム0117に新たなバックアップ・データ(すなわち作成されたスナップショット)が格納される。
図13は、本発明の第1の実施形態のバックアップ実行可否結果1301のフォーマットの変形例を示す説明図である。
本実施形態では、ストレージ0113のスナップショット機能を使ったバックアップを例に使っている。しかし、ファイルごとのホスト経由バックアップにも本発明を適用することができる。ファイルごとのバックアップの場合、ファイルごとにバックアップ実行可否を判定することで、より粒度の細かいバックアップ制御を行う事ができる。
その場合、図10のステップ1005において計算された値が、ファイルごと(より詳細には、各パス名によって識別される各ファイルに対応するデータごと)に集計される。そして、図9のステップ0906又はステップ0913において、ファイルごとに、差分量が差分条件0503を満足するか否かが判定される。この場合、差分条件0503として、ファイルごとに集計された差分量に適した値が設定される。この判定結果が、図13に示すバックアップ実行可否結果1301に反映される。
図13の例は、上記のように、ファイルごとにバックアップの実行可否が判定される場合にバックアップ実行判定部0103から応答される、ファイルごとのバックアップ実行可否結果1301の例を示している。バックアップ実行可否結果1301は、パス名1302、バックアップ可否1303及び削除バックアップ・データ1304から成る。
パス名1302は、データ・ボリューム0116に格納されたバックアップ対象ファイルを指定する。バックアップ可否1303は、各ファイルのバックアップが許可されるか否かを示す。削除バックアップ・データ1304は、ファイルのバックアップが許可される場合に、そのバックアップのために削除されるべきバックアップ・ボリューム0117内のファイルを指定する。
図14は、本発明の第1の実施形態のバックアップ成功通知1401のフォーマット例を示す説明図である。
バックアップ成功通知1401は、図8のステップ0814において、バックアップ・サーバ0106から送信される。バックアップ成功通知1401は、要求種別1402、ポリシーID1403及びバックアップ・データID1404を含む。
要求種別1402は、この通知がバックアップ成功通知1401であることを示す情報「バックアップ成功通知」を指定する。ポリシーID1403は、実行したバックアップ・ポリシーを指定する。バックアップ・データID1404は、バックアップされたデータの識別子を指定する。
図15は、本発明の第1の実施形態のバックアップ・カタログ0120の例を示す説明図である。
バックアップ・カタログ0120は、バックアップ・データごと(例えば、バックアップ・ボリューム0117ごと)に存在する。あるバックアップ・データのバックアップ・カタログ0120は、ポリシーID1502、バックアップ先1503、バックアップ・データID1504、バックアップ取得時刻1505及びリテンション期限1506から成る。
ポリシーID1502は、実行したバックアップ・ポリシーIDである。バックアップ先1503は、バックアップ・データの格納先であるバックアップ・ボリューム0117のグループの識別子である。バックアップ・データID1504は、バックアップ・データを識別するID、例えば、バックアップ・データを格納するバックアップ・ボリューム0117の識別子である。バックアップ取得時刻1505は、バックアップを実行した時刻である。リテンション期限1506は、バックアップ・データを保持しておく必要がある期間の終期である。具体的には、リテンション期限1506は、バックアップ取得時刻1505に、ポリシーID1502に対応するリテンション期間0405を加算することによって算出される。
図16は、本発明の第1の実施形態のバックアップ実行可否判定サーバ0109のインデックス作成部0110が実行する処理を示すフローチャートである。
インデックス作成部0110は定期的に起動され、図16に示す処理を実行することによって、バックアップ対象データのインデックス・テーブル0119を作成する。
図16に示す処理は、バックアップ実行可否判定サーバ0109のCPU0201が、メモリ0202に格納されたプログラムを実行することによって実現される。
最初に、バックアップ実行可否判定サーバ0109は、バックアップ・サーバ0106が管理するバックアップ・ポリシー管理テーブル0108を参照する(ステップ1602)。
次に、バックアップ実行可否判定サーバ0109は、バックアップ・ポリシー管理テーブル0108に設定されたバックアップ・ポリシーの中で、現在時刻から所定の時間が経過するまでの間にバックアップが開始されるポリシーに対してステップ1604以下の処理を実行する(ステップ1603)。該当するポリシーがない場合、処理を終える。例えば、あるバックアップ・ポリシーにおいて、午前6時にバックアップが開始され、所定の時間が2時間であり、かつ、現在時刻が午前4時から午前6時の間である場合、現在時刻から所定の時間が経過するまでの間にバックアップが開始される。この場合、そのバックアップ・ポリシーのバックアップ元0403に対してステップ1604以下の処理が実行される。
バックアップ実行可否判定サーバ0109は、ステップ1603の条件を満足するバックアップ・ポリシーのバックアップ元0403によって指定されたデータ・ボリューム0116からデータを読み出し、そのデータに含まれるキーワードを計数することによって、インデックス・テーブル0119を更新する(ステップ1604)。
バックアップ実行可否判定サーバ0109は、インデックス更新対象のバックアップ・ポリシー全てについてインデックス・テーブル0119の更新が完了したか否かを判定する(ステップ1605)。完了していれば処理を終える。完了していなければステップ1604を繰り返す。
上記のステップ1603及びステップ1604が実行される結果、あるバックアップ対象データのインデックス・テーブル0119は、そのバックアップ対象データのバックアップの完了後、次回のバックアップが開始されるまでの間に少なくとも一回は更新される。
(第2の実施形態)
図17は、本発明の第2の実施形態のバックアップ実行可否判定システムの概略構成を示すブロック図である。
図17は、インデックス作成部0110、バックアップ実行判定部0103、インデックス・テーブル0119、実行条件テーブル0104及びキーワード管理テーブル0105をストレージ0113が備える点が、図1と異なる。このため、本実施形態の計算機システムは、バックアップ実行可否判定サーバ0109を必要としない。その他の点は、図1と同様である。本実施形態のうち、第1の実施形態と同様の部分については説明を省略する。
本実施形態の計算機システムを構成するハードウェアは、第1の実施形態と同様である(図2及び図3参照)。
インデックス作成部0110、バックアップ実行判定部0103及びインデックス・テーブル0119は、I/O処理部0114等と同様、コントローラ0302によって実現される。インデックス・テーブル0119、実行条件テーブル0104及びキーワード管理テーブル0105は、コントローラ0302内のメモリ(図示省略)に格納される。
本実施形態によれば、I/O処理部0114がファイルの更新内容を検出し、その結果をインデックス・テーブル0119に反映することで、インデックス・テーブル0119の内容を常に最新に保つことが可能になる。これによって、差分量計算の結果が第1の実施形態の場合よりも正確になる。
加えて、本実施形態によれば、バックアップ・サーバ0106がストレージ0113にスナップショット要求を発行するタイミングで、ストレージ0113内のバックアップ実行判定部0103がバックアップ実行可否の判定を実行できるため、既存のバックアップ・ソフトウェア0107を変更せずに利用できる。
図18は、本発明の第2の実施形態のバックアップ・ソフトウェア0107が実行する一連の処理を示すフローチャートである。
最初に、バックアップ・サーバ0106は、バックアップ・ポリシーのスケジュールに基づき、起動する(ステップ1803)。この処理は、図8のステップ0804と同様である。
次に、バックアップ・サーバ0106は、ストレージ0113に対してスナップショット要求を発行する(ステップ1814)。この処理は、図8のステップ0812と同様である。
スナップショット要求を受信したストレージ0113は、バックアップ実行判定部0103を呼び出す(ステップ1805)。呼び出されたバックアップ実行判定部0103は、図9に示す処理を実行する。
次に、ストレージ0113は、図8のステップ0808と同様に、バックアップ実行可否判定の結果を判定する(ステップ1806)。バックアップ実行不可と判定された場合、ストレージ0113はステップ1807を実行する。バックアップ実行可能と判定された場合、ストレージ0113はステップ1809を実行する。
ステップ1807及びそれに続くステップ1808は、それらがストレージ0113によって実行されることを除いて、図8のステップ0809及びステップ0810と同様である。
ステップ1809において、ストレージ0113は、バックアップ・データを削除する。この処理は、第1の実施形態のストレージ0113がバックアップ・データ削除要求(図8のステップ0811)を受信したときに実行するものと同様である。
次に、ストレージ0113は、スナップショットを作成する(ステップ1810)。このステップは、図8のステップ0813と同様である。
次に、ストレージ0113は、キーワード管理テーブル0105を更新する(ステップ1811)。この処理は、それがストレージ0113によって実行されることを除いて、図8のステップ0815と同様である。
ステップ1808又はステップ1811が終了すると、ストレージ0113は、バックアップ・サーバ0106に応答を送信する(ステップ1812)。以上で処理が終了する。
上記の第1及び第2の実施形態において、実行条件テーブル0104の差分条件0503の閾値は、管理者によって指定されてもよいが、所定の期間バックアップ運用を継続することによって自動的に算出されてもよい。
例えば、バックアップ・サーバ0106は、所定の期間(例えば一週間程度)又は所定の回数、バックアップ実行可否の判定結果に拘らず、バックアップを実行する。具体的には、所定の回数、ステップ0808又はステップ1806において、実際の判定結果に拘らず、「バックアップ実行可能」と判定される。その間、バックアップ実行判定部0103は、バックアップが実行される度にバックアップ対象データとバックアップ・データとの差分量を算出する(ステップ0806又はステップ1805)。この算出は、図10に示すように実行される。そして、バックアップ実行判定部0103は、ステップ1008において、算出された差分量を記録しておく。
所定の期間又は所定の回数のバックアップ実行後、記録された差分量の平均値又は最大値を差分条件0503の閾値として設定することによって、閾値の算出が自動化される。
上記の第1及び第2の実施形態のさらなる変形例として、次のものが考えられる。バックアップ実行判定部0103は、バックアップ対象データと最新のバックアップ・データとの間の差分量を比較する。差分量が閾値以上であれば、最近大幅なデータ内容の変更があったと考えられるため、バックアップ・サーバ0106は、リテンション期間が経過したバックアップ・データを削除せず、一時バックアップ・ボリューム0118にバックアップ対象データの複製を格納する。
以上の本発明の実施形態によれば、バックアップ対象データとバックアップ・データとの差分量が所定の閾値を超えない場合のみ、バックアップ・データが削除され、バックアップ対象データの複製が新たなバックアップ・データとして格納される。
これによって、ウィルス感染又はユーザのミス等によってバックアップ対象データの内容が大幅に変更されたか否かが判定される。この判定によって、正常なバックアップ・データが削除されたために必要なデータをリストアできなくなる危険性を低減することができる。
バックアップ対象データとバックアップ・データとの差分量として、それらのデータに含まれるキーワードの出現回数の差が使用されてもよい。
これによって、バックアップ対象データとバックアップ・データとの差分量を正確に計算することができる、
所定の回数、バックアップが無条件で(すなわち差分量に拘らず)実行されてもよい。その間、バックアップ実行毎に、算出された差分量が記録される。記録された差分量の最大値が閾値として使用されてもよい。
これによって、データの更新頻度又はバックアップの実行頻度に応じて、自動的に閾値を決定することができる。
本発明の実施形態の計算機システムは、バックアップ対象データのインデックス・テーブルを保持する。インデックス・テーブルには、バックアップ対象データにおけるキーワードの出現回数が格納される。バックアップ対象データがバックアップされるとき、その時点のインデックス・テーブルの複製がキーワード管理テーブルに格納される。バックアップ対象データのバックアップが実行された後、次回のバックアップが実行されるまでの間に少なくとも1回、インデックス・テーブルが更新される。バックアップ対象データとバックアップ・データとの差分量は、インデックス・テーブル及びキーワード管理テーブルを参照することによって算出される。
これによって、差分量をより正確に算出することができる。
バックアップ実行可否判定サーバが上記の差分量を算出し、バックアップ・サーバが、算出された差分量が所定の閾値を超えるか否かを判定してもよい。
これによって、従来のストレージを用いて本発明を実施することができる。
バックアップ要求を受信したストレージシステムが上記の差分量を算出し、算出された差分量が所定の閾値を超えるか否かを判定してもよい。
これによって、従来のバックアップ・サーバを用いて本発明を実施することができる。さらに、これによって、インデックス・テーブルの精度を向上させることができる。
異なる時刻に作成された複数世代のバックアップ・データが存在する場合、全バックアップ・データと、バックアップ対象データとの差分量が比較されてもよい。この場合、バックアップ対象データとの差分量が一番小さいバックアップ・データが削除される。
これによって、複数のバックアップ・データの中から、バックアップ対象データの内容に一番近い内容を持つバックアップ・データが削除される。これによって、そのバックアップ・データを削除したとしても、リストアできなくなる可能性を低減することができる。
ファイルごとに差分量が算出され、算出された差分量が所定の閾値を超えない場合のみ、ファイルごとにバックアップが実行されてもよい。
これによって、より粒度が細かいバックアップ実行可否判定が可能になる。
算出された差分量が所定の閾値よりも大きかった場合、バックアップ・データは削除せず、予め確保しておいた一時バックアップ・ボリュームにデータをバックアップしてもよい。
これによって、一時バックアップ・ボリュームのコストが発生する代わりに、確実にバックアップ・ポリシーに基づいてバックアップを実行できる。
算出された差分量が所定の閾値を超えたためにバックアップが実行さなかった場合、バックアップ・データのリテンション期間が次回のバックアップ実行時刻まで延長される。
これによって、バックアップ・サーバがバックアップ実行有無に関わらず期限が切れたバックアップ・データを自動的に削除してしまうことを防止し、バックアップ・データを保護することができる。
本発明の第1の実施形態のバックアップ実行可否判定システムの概略構成を示すブロック図である。 本発明の第1の実施形態のサーバ、バックアップ実行可否判定サーバ及びバックアップ・サーバのハードウェア概略構成を示すブロック図である。 本発明の第1の実施形態のストレージのハードウェア概略構成を示すブロック図である。 本発明の第1の実施形態のバックアップ・ポリシー管理テーブルの例を示す説明図である。 本発明の第1の実施形態の実行条件テーブルの例を示す説明図である。 本発明の第1の実施形態のキーワード管理テーブルの例を示す説明図である。 本発明の第1の実施形態のインデックス・テーブルの例を示す説明図である。 本発明の第1の実施形態のバックアップ・ソフトウェアが実行する一連の処理を示すフローチャートである。 本発明の第1の実施形態のバックアップ実行判定部が実行する処理を示すフローチャートである。 本発明の第1の実施形態の差分量計算処理を示すフローチャートである。 本発明の第1の実施形態のバックアップ実行可否判定要求のフォーマット例を示す説明図である。 本発明の第1の実施形態のバックアップ実行可否結果のフォーマット例を示す説明図である。 本発明の第1の実施形態のバックアップ実行可否結果のフォーマットの変形例を示す説明図である。 本発明の第1の実施形態のバックアップ成功通知のフォーマット例を示す説明図である。 本発明の第1の実施形態のバックアップ・カタログの例を示す説明図である。 本発明の第1の実施形態のバックアップ実行可否判定サーバのインデックス作成部が実行する処理を示すフローチャートである。 本発明の第2の実施形態のバックアップ実行可否判定システムの概略構成を示すブロック図である。 本発明の第2の実施形態のバックアップ・ソフトウェアが実行する一連の処理を示すフローチャートである。
符号の説明
0101 サーバ
0103 バックアップ実行判定部
0104 実行条件テーブル
0105 キーワード管理テーブル
0106 バックアップ・サーバ
0107 バックアップ・ソフトウェア
0108 バックアップ・ポリシー管理テーブル
0109 バックアップ実行可否判定サーバ
0110 インデックス作成部
0112 ネットワーク
0113 ストレージ
0114 I/O処理部
0115 スナップショット処理部
0116 データ・ボリューム
0117A、0117B バックアップ・ボリューム
0118 一時バックアップ・ボリューム
0119 インデックス・テーブル
0120 バックアップ・カタログ

Claims (18)

  1. ネットワークに接続されるストレージシステムを備える計算機システムであって、
    前記ストレージシステムは、複数のデータ記憶領域を含む一つ以上のデータ記憶装置と、前記データ記憶装置を制御するコントローラと、を備え、
    前記複数のデータ記憶領域は、第1記憶領域、及び、ある時点における前記第1記憶領域に格納されたデータの複製を格納する第2記憶領域を含み、
    前記計算機システムは、バックアップ判定部をさらに含み、
    前記バックアップ判定部は、前記第1記憶領域に格納されたデータと、前記第2記憶領域に格納されたデータとの差分量が所定の閾値より小さいか否かを判定し、
    前記ストレージシステムは、前記差分量が前記所定の閾値より小さい場合のみ、前記第2記憶領域に格納されたデータを削除し、前記第1記憶領域に格納されたデータの複製を前記第2記憶領域に新たに格納することを特徴とする計算機システム。
  2. 前記バックアップ判定部は、
    前記第1記憶領域に格納されたデータに含まれるキーワードの出現回数と、前記第2記憶領域に格納されたデータに含まれる前記キーワードの出現回数との差を、前記キーワードごとに算出し、
    前記第1記憶領域に格納されたデータ及び前記第2記憶領域に格納されたデータの少なくとも一方に含まれる複数の前記キーワードについて算出された前記差の絶対値又は二乗値を合計し、
    前記合計された値を、前記第1記憶領域に格納されたデータと、前記第2記憶領域に格納されたデータとの差分量として使用することを特徴とする請求項1に記載の計算機システム。
  3. 前記計算機システムは、
    前記第1記憶領域に格納されたデータの複製をいずれかの前記記憶装置に格納するスケジュールを示す情報を保持し、
    インデックス作成部をさらに備え、
    前記インデックス作成部は、
    前記スケジュールを示す情報に基づいて、前記第1記憶領域に格納されたデータの複製がいずれかの前記記憶領域に格納された後、前記第1記憶領域に格納されたデータの複製が次にいずれかの前記記憶領域に格納される前に、少なくとも一度、前記第1記憶領域に格納されたデータに含まれるキーワードの出現回数を、前記キーワードごとに計数し、
    前記計数された出現回数を第1出現回数として保持し、
    前記第1記憶領域に格納されたデータの複製が前記第2記憶領域に格納される場合、前記第1出現回数の複製を、前記第2記憶領域に格納されたデータに含まれるキーワードの出現回数である第2出現回数として保持し、
    前記バックアップ判定部は、前記保持された前記第1出現回数と前記第2出現回数との差を算出することによって、前記第1記憶領域に格納されたデータに含まれるキーワードの出現回数と、前記第2記憶領域に格納されたデータに含まれるキーワードの出現回数との差を、前記キーワードごとに算出することを特徴とする請求項2に記載の計算機システム。
  4. 前記計算機システムは、前記ネットワークに接続される第1計算機及び第2計算機をさらに備え、
    前記第1計算機は、前記ネットワークに接続される第1インタフェースと、前記第1インタフェースに接続される第1プロセッサと、前記第1プロセッサに接続される第1メモリと、を備え、
    前記第2計算機は、前記ネットワークに接続される第2インタフェースと、前記第2インタフェースに接続される第2プロセッサと、前記第2プロセッサに接続される第2メモリと、を備え、
    前記スケジュールを示す情報は、前記第1計算機に保持され、
    前記第1計算機は、前記スケジュールを示す情報に基づいて、前記第1記憶領域に格納されたデータの複製をいずれかの前記記憶装置に格納する時刻が到来したと判定された場合、前記バックアップ判定部に判定要求を送信し、
    前記バックアップ判定部からバックアップを許可する応答を受信した場合のみ、前記ストレージシステムにバックアップ要求を送信し、
    前記バックアップ判定部及び前記インデックス作成部は、前記第2メモリに格納されたプログラムを前記第2プロセッサが実行することによって実現され、
    前記第1出現回数及び前記第2出現回数は、前記第2計算機に保持され、
    前記バックアップ判定部は、
    前記判定要求を受信すると、前記第1記憶領域に格納されたデータと、前記第2記憶領域に格納されたデータとの差分量が所定の閾値より小さいか否かを判定し、
    前記差分量が前記所定の閾値より小さいと判定された場合、バックアップを許可する応答を前記第1計算機に送信し、
    前記ストレージシステムは、前記バックアップ要求を受信すると、前記第2記憶領域に格納されたデータを削除し、前記第1記憶領域に格納されたデータの複製を前記第2記憶領域に新たに格納することを特徴とする請求項3に記載の計算機システム。
  5. 前記計算機システムは、前記ネットワークに接続される第1計算機をさらに備え、
    前記第1計算機は、前記ネットワークに接続される第1インタフェースと、前記第1インタフェースに接続される第1プロセッサと、前記第1プロセッサに接続される第1メモリと、を備え、
    前記スケジュールを示す情報は、前記第1計算機に保持され、
    前記第1計算機は、前記スケジュールを示す情報に基づいて、前記第1記憶領域に格納されたデータの複製をいずれかの前記記憶装置に格納する時刻が到来したと判定された場合、前記ストレージシステムにバックアップ要求を送信し、
    前記バックアップ判定部及び前記インデックス作成部は、前記コントローラが所定のプログラムを実行することによって実現され、
    前記第1出現回数及び前記第2出現回数は、前記ストレージシステムに保持され、
    前記バックアップ判定部は、前記バックアップ要求を受信すると、前記第1記憶領域に格納されたデータと、前記第2記憶領域に格納されたデータとの差分量が所定の閾値より小さいか否かを判定し、
    前記ストレージシステムは、前記差分量が前記所定の閾値より小さいと判定された場合、前記第2記憶領域に格納されたデータを削除し、前記第1記憶領域に格納されたデータの複製を前記第2記憶領域に新たに格納することを特徴とする請求項3に記載の計算機システム。
  6. 前記バックアップ判定部は、所定の回数、前記第1記憶領域に格納されたデータと、前記第2記憶領域に格納されたデータとの差分量を算出し、
    前記ストレージシステムは、前記所定の回数、前記差分量が前記所定の閾値より小さいか否かに拘らず、前記第2記憶領域に格納されたデータを削除し、前記第1記憶領域に格納されたデータの複製を前記第2記憶領域に新たに格納し、
    前記バックアップ判定部は、前記所定の回数の算出によって取得された複数の前記差分量の最大値を前記所定の閾値として使用することを特徴とする請求項1に記載の計算機システム。
  7. 前記複数の記憶領域は、さらに第3記憶領域を含み、
    前記第2記憶領域に、第1時点における前記第1記憶領域に格納されたデータの複製が格納され、前記第3記憶領域に、第2時点における前記第1記憶領域に格納されたデータの複製が格納され、
    前記バックアップ判定部は、
    前記第1記憶領域に格納されたデータと、前記第2記憶領域に格納されたデータとの差分量が、前記所定の閾値より小さく、かつ、前記第1記憶領域に格納されたデータと、前記第3記憶領域に格納されたデータとの差分量より小さい場合、前記第2記憶領域に格納されたデータを削除し、前記第1記憶領域に格納されたデータの複製を前記第2記憶領域に新たに格納し、
    前記第1記憶領域に格納されたデータと、前記第3記憶領域に格納されたデータとの差分量が、前記所定の閾値より小さく、かつ、前記第1記憶領域に格納されたデータと、前記第2記憶領域に格納されたデータとの差分量より小さい場合、前記第3記憶領域に格納されたデータを削除し、前記第1記憶領域に格納されたデータの複製を前記第3記憶領域に新たに格納することを特徴とする請求項1に記載の計算機システム。
  8. 前記バックアップ判定部は、前記第1記憶領域に格納されたデータのうち第1ファイルに対応するデータと、前記第2記憶領域に格納されたデータのうち前記第1ファイルに対応するデータとの差分量が所定の閾値より小さいか否かを判定し、
    前記ストレージシステムは、前記差分量が前記所定の閾値より小さい場合のみ、前記第2記憶領域に格納されたデータのうち前記第1ファイルに対応するデータを削除し、前記第1記憶領域に格納されたデータのうち前記第1ファイルに対応するデータの複製を前記第2記憶領域に新たに格納することを特徴とする請求項1に記載の計算機システム。
  9. 前記複数の記憶領域は、第4記憶領域をさらに含み、
    前記ストレージシステムは、前記差分量が前記所定の閾値以上である場合、前記第2記憶領域に格納されたデータを削除せず、前記第1記憶領域に格納されたデータの複製を前記第4記憶領域に格納することを特徴とする請求項1に記載の計算機システム。
  10. 前記第1計算機は、前記第2記憶領域に格納されたデータの保持期間を示す情報を保持し、
    前記バックアップ判定部は、前記第1記憶領域に格納されたデータと、前記第2記憶領域に格納されたデータとの差分量が前記所定の閾値以上であり、かつ、前記第2記憶領域に格納されたデータの保持期間が経過しているか否かを判定し、
    前記ストレージシステムは、
    前記差分量が前記所定の閾値より小さく、かつ、前記第2記憶領域に格納されたデータの保持期間が経過している場合、前記第2記憶領域に格納されたデータを削除し、前記第1記憶領域に格納されたデータの複製を前記第2記憶領域に新たに格納し、
    前記差分量が前記所定の閾値以上であり、かつ、前記第2記憶領域に格納されたデータの保持期間が経過している場合、前記第2記憶領域に格納されたデータを削除せず、前記第2記憶領域に格納されたデータの保持期限を延長するように前記情報を更新することを特徴とする請求項1に記載の計算機システム。
  11. ネットワークに接続されるストレージシステムを備える計算機システムの制御方法であって、
    前記ストレージシステムは、複数のデータ記憶領域を含む一つ以上のデータ記憶装置と、前記データ記憶装置を制御するコントローラと、を備え、
    前記複数のデータ記憶領域は、第1記憶領域、及び、ある時点における前記第1記憶領域に格納されたデータの複製を格納する第2記憶領域を含み、
    前記方法は、
    前記第1記憶領域に格納されたデータと、前記第2記憶領域に格納されたデータとの差分量が所定の閾値より小さいか否かを判定する第1手順と、
    前記差分量が前記所定の閾値より小さい場合のみ、前記第2記憶領域に格納されたデータを削除し、前記第1記憶領域に格納されたデータの複製を前記第2記憶領域に新たに格納する第2手順と、を含むことを特徴とする方法。
  12. 前記方法は、さらに、
    前記第1記憶領域に格納されたデータに含まれるキーワードの出現回数と、前記第2記憶領域に格納されたデータに含まれる前記キーワードの出現回数との差を、前記キーワードごとに算出する第3手順と、
    前記第1記憶領域に格納されたデータ及び前記第2記憶領域に格納されたデータの少なくとも一方に含まれる複数の前記キーワードについて算出された前記差の絶対値又は二乗値を合計する第4手順と、を含み、
    前記合計された値が、前記第1記憶領域に格納されたデータと、前記第2記憶領域に格納されたデータとの差分量として使用されることを特徴とする請求項11に記載の方法。
  13. 前記計算機システムは、前記第1記憶領域に格納されたデータの複製をいずれかの前記記憶装置に格納するスケジュールを示す情報を保持し、
    前記方法は、さらに、
    前記スケジュールを示す情報に基づいて、前記第1記憶領域に格納されたデータの複製がいずれかの前記記憶領域に格納された後、前記第1記憶領域に格納されたデータの複製が次にいずれかの前記記憶領域に格納される前に、少なくとも一度、前記第1記憶領域に格納されたデータに含まれるキーワードの出現回数を、前記キーワードごとに計数し、前記計数された出現回数を第1出現回数として保持する第5手順と、
    前記第1記憶領域に格納されたデータの複製が前記第2記憶領域に格納される場合、前記第1出現回数の複製を、前記第2記憶領域に格納されたデータに含まれるキーワードの出現回数である第2出現回数として保持する第6手順と、をさらに含み、
    前記第3手順は、前記保持された前記第1出現回数と前記第2出現回数との差を算出することによって実行されることを特徴とする請求項12に記載の方法。
  14. 所定の回数の前記第1手順は、算出された前記差分量を格納する手順を含み、
    前記所定の回数の前記第2手順は、前記差分量が前記所定の閾値より小さいか否かに拘らず、前記第2記憶領域に格納されたデータを削除し、前記第1記憶領域に格納されたデータの複製を前記第2記憶領域に新たに格納することによって実行され、
    前記格納された複数の前記差分量の最大値が、前記所定の閾値として使用されることを特徴とする請求項11に記載の方法。
  15. 前記複数の記憶領域は、さらに第3記憶領域を含み、
    前記第2記憶領域に、第1時点における前記第1記憶領域に格納されたデータの複製が格納され、前記第3記憶領域に、第2時点における前記第1記憶領域に格納されたデータの複製が格納され、
    前記第2手順は、
    前記第1記憶領域に格納されたデータと、前記第2記憶領域に格納されたデータとの差分量が、前記所定の閾値より小さく、かつ、前記第1記憶領域に格納されたデータと、前記第3記憶領域に格納されたデータとの差分量より小さい場合、前記第2記憶領域に格納されたデータを削除し、前記第1記憶領域に格納されたデータの複製を前記第2記憶領域に新たに格納する手順と、
    前記第1記憶領域に格納されたデータと、前記第3記憶領域に格納されたデータとの差分量が、前記所定の閾値より小さく、かつ、前記第1記憶領域に格納されたデータと、前記第2記憶領域に格納されたデータとの差分量より小さい場合、前記第3記憶領域に格納されたデータを削除し、前記第1記憶領域に格納されたデータの複製を前記第3記憶領域に新たに格納する手順と、を含むことを特徴とする請求項11に記載の方法。
  16. 前記第1手順は、前記第1記憶領域に格納されたデータのうち第1ファイルに対応するデータと、前記第2記憶領域に格納されたデータのうち前記第1ファイルに対応するデータとの差分量が所定の閾値より小さいか否かを判定する手順を含み、
    前記第2手順は、前記差分量が前記所定の閾値より小さい場合のみ、前記第2記憶領域に格納されたデータのうち前記第1ファイルに対応するデータを削除し、前記第1記憶領域に格納されたデータのうち前記第1ファイルに対応するデータの複製を前記第2記憶領域に新たに格納する手順を含むことを特徴とする請求項11に記載の方法。
  17. 前記複数の記憶領域は、第4記憶領域をさらに含み、
    前記方法は、前記差分量が前記所定の閾値以上である場合、前記第2記憶領域に格納されたデータを削除せず、前記第1記憶領域に格納されたデータの複製を前記第4記憶領域に格納する第7手順を含むことを特徴とする請求項11に記載の方法。
  18. 前記第1計算機は、前記第2記憶領域に格納されたデータの保持期間を示す情報を保持し、
    前記方法は、さらに、
    前記第2記憶領域に格納されたデータの保持期間が経過しているか否かを判定する第8手順と、
    前記差分量が前記所定の閾値以上であり、かつ、前記第2記憶領域に格納されたデータの保持期間が経過している場合、前記第2記憶領域に格納されたデータを削除せず、前記第2記憶領域に格納されたデータの保持期限を延長するように前記情報を更新する第9手順と、を含み、
    前記第2手順は、前記差分量が前記所定の閾値より小さく、かつ、前記第2記憶領域に格納されたデータの保持期間が経過している場合、前記第2記憶領域に格納されたデータを削除し、前記第1記憶領域に格納されたデータの複製を前記第2記憶領域に新たに格納する手順を含むことを特徴とする請求項11に記載の方法。
JP2007291697A 2007-11-09 2007-11-09 バックアップ実行可否判定システム Expired - Fee Related JP5124238B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007291697A JP5124238B2 (ja) 2007-11-09 2007-11-09 バックアップ実行可否判定システム
US12/068,207 US7877359B2 (en) 2007-11-09 2008-02-04 Backup executability judging system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007291697A JP5124238B2 (ja) 2007-11-09 2007-11-09 バックアップ実行可否判定システム

Publications (3)

Publication Number Publication Date
JP2009116773A true JP2009116773A (ja) 2009-05-28
JP2009116773A5 JP2009116773A5 (ja) 2010-02-04
JP5124238B2 JP5124238B2 (ja) 2013-01-23

Family

ID=40624770

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007291697A Expired - Fee Related JP5124238B2 (ja) 2007-11-09 2007-11-09 バックアップ実行可否判定システム

Country Status (2)

Country Link
US (1) US7877359B2 (ja)
JP (1) JP5124238B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013097680A (ja) * 2011-11-02 2013-05-20 Buffalo Inc 情報処理装置及びプログラム
CN108701188A (zh) * 2016-02-01 2018-10-23 赛门铁克公司 响应于检测潜在勒索软件以用于修改文件备份的系统和方法
JP2019175045A (ja) * 2018-03-28 2019-10-10 日本電気株式会社 情報処理装置、情報処理方法、情報処理プログラム、及び記憶装置
JP2021022390A (ja) * 2020-10-19 2021-02-18 株式会社日立製作所 バックアップシステム
JP2022088400A (ja) * 2020-10-19 2022-06-14 株式会社日立製作所 バックアップシステム

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9342528B2 (en) * 2010-04-01 2016-05-17 Avere Systems, Inc. Method and apparatus for tiered storage
US8214404B2 (en) 2008-07-11 2012-07-03 Avere Systems, Inc. Media aware distributed data layout
US9323681B2 (en) 2008-09-18 2016-04-26 Avere Systems, Inc. File storage system, cache appliance, and method
US9990254B1 (en) * 2009-01-29 2018-06-05 Veritas Technologies Llc Techniques for data restoration
US9678965B1 (en) * 2009-06-29 2017-06-13 Veritas Technologies Llc System and method for enforcing data lifecycle policy across multiple domains
WO2013093960A1 (en) * 2011-12-20 2013-06-27 Hitachi, Ltd. Storage system and method for controlling storage system
CN103778156A (zh) * 2012-10-24 2014-05-07 阿里巴巴集团控股有限公司 数据搜索的方法和装置以及用于数据搜索的服务器
US9201906B2 (en) * 2012-12-21 2015-12-01 Commvault Systems, Inc. Systems and methods to perform data backup in data storage systems
US9405482B2 (en) * 2012-12-21 2016-08-02 Commvault Systems, Inc. Filtered reference copy of secondary storage data in a data storage system
US9772907B2 (en) 2013-09-13 2017-09-26 Vmware, Inc. Incremental backups using retired snapshots
US9514002B2 (en) * 2013-09-13 2016-12-06 Vmware, Inc. Incremental backups using retired snapshots
US9659021B1 (en) * 2013-11-20 2017-05-23 EMC IP Holding Company LLC Client based backups and backup indexing
US9798629B1 (en) * 2013-12-16 2017-10-24 EMC IP Holding Company LLC Predicting backup failures due to exceeding the backup window
US10505825B1 (en) 2014-10-09 2019-12-10 Splunk Inc. Automatic creation of related event groups for IT service monitoring
US11087263B2 (en) 2014-10-09 2021-08-10 Splunk Inc. System monitoring with key performance indicators from shared base search of machine data
US10417225B2 (en) 2015-09-18 2019-09-17 Splunk Inc. Entity detail monitoring console
US11755559B1 (en) 2014-10-09 2023-09-12 Splunk Inc. Automatic entity control in a machine data driven service monitoring system
US9760240B2 (en) 2014-10-09 2017-09-12 Splunk Inc. Graphical user interface for static and adaptive thresholds
US9491059B2 (en) 2014-10-09 2016-11-08 Splunk Inc. Topology navigator for IT services
US11455590B2 (en) 2014-10-09 2022-09-27 Splunk Inc. Service monitoring adaptation for maintenance downtime
US9158811B1 (en) 2014-10-09 2015-10-13 Splunk, Inc. Incident review interface
US9146962B1 (en) 2014-10-09 2015-09-29 Splunk, Inc. Identifying events using informational fields
US10235638B2 (en) 2014-10-09 2019-03-19 Splunk Inc. Adaptive key performance indicator thresholds
US10305758B1 (en) 2014-10-09 2019-05-28 Splunk Inc. Service monitoring interface reflecting by-service mode
US10536353B2 (en) 2014-10-09 2020-01-14 Splunk Inc. Control interface for dynamic substitution of service monitoring dashboard source data
US9208463B1 (en) 2014-10-09 2015-12-08 Splunk Inc. Thresholds for key performance indicators derived from machine data
US10193775B2 (en) 2014-10-09 2019-01-29 Splunk Inc. Automatic event group action interface
US11671312B2 (en) 2014-10-09 2023-06-06 Splunk Inc. Service detail monitoring console
US9130832B1 (en) 2014-10-09 2015-09-08 Splunk, Inc. Creating entity definition from a file
US10417108B2 (en) 2015-09-18 2019-09-17 Splunk Inc. Portable control modules in a machine data driven service monitoring system
US9146954B1 (en) 2014-10-09 2015-09-29 Splunk, Inc. Creating entity definition from a search result set
US10209956B2 (en) 2014-10-09 2019-02-19 Splunk Inc. Automatic event group actions
US11501238B2 (en) 2014-10-09 2022-11-15 Splunk Inc. Per-entity breakdown of key performance indicators
US11200130B2 (en) 2015-09-18 2021-12-14 Splunk Inc. Automatic entity control in a machine data driven service monitoring system
US9210056B1 (en) 2014-10-09 2015-12-08 Splunk Inc. Service monitoring interface
US10474680B2 (en) 2014-10-09 2019-11-12 Splunk Inc. Automatic entity definitions
US10198155B2 (en) 2015-01-31 2019-02-05 Splunk Inc. Interface for automated service discovery in I.T. environments
US9967351B2 (en) 2015-01-31 2018-05-08 Splunk Inc. Automated service discovery in I.T. environments
US9959138B1 (en) * 2015-09-11 2018-05-01 Cohesity, Inc. Adaptive self-maintenance scheduler
US10942960B2 (en) 2016-09-26 2021-03-09 Splunk Inc. Automatic triage model execution in machine data driven monitoring automation apparatus with visualization
US10942946B2 (en) 2016-09-26 2021-03-09 Splunk, Inc. Automatic triage model execution in machine data driven monitoring automation apparatus
JP6341307B1 (ja) 2017-03-03 2018-06-13 日本電気株式会社 情報処理装置
US11106442B1 (en) 2017-09-23 2021-08-31 Splunk Inc. Information technology networked entity monitoring with metric selection prior to deployment
US11093518B1 (en) 2017-09-23 2021-08-17 Splunk Inc. Information technology networked entity monitoring with dynamic metric and threshold selection
US11159397B2 (en) 2017-09-25 2021-10-26 Splunk Inc. Lower-tier application deployment for higher-tier system data monitoring
US11080147B2 (en) * 2018-05-16 2021-08-03 International Business Machines Corporation Adjusting backup data in response to an abnormality detection
US11206306B2 (en) * 2019-05-21 2021-12-21 Cobalt Iron, Inc. Analytics based cloud brokering of data protection operations system and method
US11093346B2 (en) * 2019-06-03 2021-08-17 EMC IP Holding Company LLC Uninterrupted backup operation using a time based approach
US11500734B2 (en) * 2020-02-26 2022-11-15 EMC IP Holding Company LLC System and method for prioritizing backup generation
US11307933B2 (en) * 2020-02-28 2022-04-19 EMC IP Holding Company LLC Automated targetless snapshots
US11676072B1 (en) 2021-01-29 2023-06-13 Splunk Inc. Interface for incorporating user feedback into training of clustering model

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10207749A (ja) * 1997-01-22 1998-08-07 Nippon Telegr & Teleph Corp <Ntt> 情報提供方法及び装置
JPH10232884A (ja) * 1996-11-29 1998-09-02 Media Rinku Syst:Kk 映像ソフトウェア処理方法及び映像ソフトウェア処理装置
JP2002288185A (ja) * 2001-03-23 2002-10-04 Hitachi Ltd 画像検索システムおよび画像蓄積方法
JP2004118413A (ja) * 2002-09-25 2004-04-15 Hitachi Ltd ストレージシステム、記憶装置、ホスト計算機、および、スナップショット作成方法。
JP2005031716A (ja) * 2003-07-07 2005-02-03 Hitachi Ltd データバックアップの方法及び装置
JP2007219609A (ja) * 2006-02-14 2007-08-30 Hitachi Ltd スナップショット管理装置及び方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5758359A (en) * 1996-10-24 1998-05-26 Digital Equipment Corporation Method and apparatus for performing retroactive backups in a computer system
US6651077B1 (en) * 2000-09-27 2003-11-18 Microsoft Corporation Backup and restoration of data in an electronic database
JP4294308B2 (ja) 2002-12-26 2009-07-08 日立コンピュータ機器株式会社 バックアップシステム
JP4453323B2 (ja) * 2003-10-02 2010-04-21 株式会社日立製作所 複製データの管理方法、装置、及びプログラム
US7197520B1 (en) * 2004-04-14 2007-03-27 Veritas Operating Corporation Two-tier backup mechanism
US7680830B1 (en) * 2005-05-31 2010-03-16 Symantec Operating Corporation System and method for policy-based data lifecycle management
US7966513B2 (en) * 2006-02-03 2011-06-21 Emc Corporation Automatic classification of backup clients
JP2008065392A (ja) * 2006-09-04 2008-03-21 Hitachi Ltd ストレージ装置及びこれを用いたデータのバックアップ方法
JP5137476B2 (ja) * 2007-06-21 2013-02-06 株式会社日立製作所 連携して動作する複数のアプリケーションが使用するデータのバックアップ環境の設定を行う計算機及び方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10232884A (ja) * 1996-11-29 1998-09-02 Media Rinku Syst:Kk 映像ソフトウェア処理方法及び映像ソフトウェア処理装置
JPH10207749A (ja) * 1997-01-22 1998-08-07 Nippon Telegr & Teleph Corp <Ntt> 情報提供方法及び装置
JP2002288185A (ja) * 2001-03-23 2002-10-04 Hitachi Ltd 画像検索システムおよび画像蓄積方法
JP2004118413A (ja) * 2002-09-25 2004-04-15 Hitachi Ltd ストレージシステム、記憶装置、ホスト計算機、および、スナップショット作成方法。
JP2005031716A (ja) * 2003-07-07 2005-02-03 Hitachi Ltd データバックアップの方法及び装置
JP2007219609A (ja) * 2006-02-14 2007-08-30 Hitachi Ltd スナップショット管理装置及び方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013097680A (ja) * 2011-11-02 2013-05-20 Buffalo Inc 情報処理装置及びプログラム
CN108701188A (zh) * 2016-02-01 2018-10-23 赛门铁克公司 响应于检测潜在勒索软件以用于修改文件备份的系统和方法
JP2019505919A (ja) * 2016-02-01 2019-02-28 シマンテック コーポレーションSymantec Corporation 潜在的ランサムウェアを検出することに応答してファイルバックアップを変更するためのシステム及び方法
US10742665B2 (en) 2016-02-01 2020-08-11 NortonLifeLock Inc. Systems and methods for modifying file backups in response to detecting potential ransomware
CN108701188B (zh) * 2016-02-01 2021-09-24 诺顿卫复客公司 响应于检测潜在勒索软件以用于修改文件备份的系统和方法
JP2019175045A (ja) * 2018-03-28 2019-10-10 日本電気株式会社 情報処理装置、情報処理方法、情報処理プログラム、及び記憶装置
JP7087544B2 (ja) 2018-03-28 2022-06-21 日本電気株式会社 情報処理装置、情報処理方法、情報処理プログラム、及び記憶装置
JP2021022390A (ja) * 2020-10-19 2021-02-18 株式会社日立製作所 バックアップシステム
JP7036881B2 (ja) 2020-10-19 2022-03-15 株式会社日立製作所 バックアップシステム
JP2022088400A (ja) * 2020-10-19 2022-06-14 株式会社日立製作所 バックアップシステム
JP7304452B2 (ja) 2020-10-19 2023-07-06 株式会社日立製作所 バックアップシステム

Also Published As

Publication number Publication date
US20090125577A1 (en) 2009-05-14
US7877359B2 (en) 2011-01-25
JP5124238B2 (ja) 2013-01-23

Similar Documents

Publication Publication Date Title
JP5124238B2 (ja) バックアップ実行可否判定システム
US9501241B2 (en) Storage system and object management method
JP4996619B2 (ja) バックアップ・サーバとバックアップ記憶システムとを備えるシステムを動作させる方法及びプログラム
US10567542B2 (en) Method for state based snapshot difference with restart capability
US7756831B1 (en) Cooperative locking between multiple independent owners of data space
US20200167238A1 (en) Snapshot format for object-based storage
EP2673710B1 (en) Processes and methods for client-side fingerprint caching to improve deduplication system backup performance
US8548953B2 (en) File deduplication using storage tiers
US9798627B2 (en) Backup image duplication
US8019726B2 (en) Method, apparatus, program and system for migrating NAS system
US20030220929A1 (en) Managing finite data storage utilizing preservation weights
WO2011108021A1 (en) File level hierarchical storage management system, method, and apparatus
US20220131879A1 (en) Malicious activity detection and remediation in virtualized file servers
US20110197279A1 (en) Management methods of storage system and file system
US20060253734A1 (en) Backup method and storage control device using the same
US20090319532A1 (en) Method of and system for managing remote storage
US8533158B1 (en) Reclaiming data space by rewriting metadata
EP1836621A1 (en) Methods and apparatus for managing deletion of data
US9454536B1 (en) Space compaction and defragmentation mechanisms in data space
US8862639B1 (en) Locking allocated data space
JP6225606B2 (ja) データベース監視装置、データベース監視方法、並びにコンピュータ・プログラム
US8495315B1 (en) Method and apparatus for supporting compound disposition for data images
JP5276391B2 (ja) インテリジェント・コンテンツのインデックス付け実行技術

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091210

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120214

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120309

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120409

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121023

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121029

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151102

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees