JP6384094B2 - Storage system - Google Patents
Storage system Download PDFInfo
- Publication number
- JP6384094B2 JP6384094B2 JP2014077789A JP2014077789A JP6384094B2 JP 6384094 B2 JP6384094 B2 JP 6384094B2 JP 2014077789 A JP2014077789 A JP 2014077789A JP 2014077789 A JP2014077789 A JP 2014077789A JP 6384094 B2 JP6384094 B2 JP 6384094B2
- Authority
- JP
- Japan
- Prior art keywords
- backup
- backup method
- storage
- data
- file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、ストレージシステムにかかり、特に、バックアップを行うストレージシステムに関する。 The present invention relates to a storage system, and more particularly to a storage system that performs backup.
業務用のプライマリストレージとバックアップ用のセカンダリストレージで構成する階層ストレージシステムにおいて、プライマリストレージのデータをセカンダリストレージへバックアップすることが行われている。このバックアップ処理では、通常、以下の二つのバックアップ方式のどちらが採用される。 In a hierarchical storage system composed of a primary storage for business and a secondary storage for backup, data in the primary storage is backed up to the secondary storage. In this backup process, either of the following two backup methods is usually adopted.
(1)ファイルバックアップ
プライマリストレージにあるバックアップ対象のディスクをバックアップサーバでマウントし、ファイルシステムを解析して、ファイル単位でセカンダリストレージへバックアップする。
(2)RAWバックアップ
プライマリストレージにあるバックアップ対象ディスクの中身を解析せず、バックアップサーバを利用する必要がなく、RAWブロック単位で直接ディスクイメージをセカンダリストレージへバックアップする。
(1) File backup Mount the backup target disk in the primary storage with the backup server, analyze the file system, and back up to the secondary storage in file units.
(2) RAW backup The contents of the backup target disk in the primary storage are not analyzed and there is no need to use a backup server, and the disk image is directly backed up to the secondary storage in units of RAW blocks.
ここで、大容量データを多世代バックアップする時に利用するセカンダリストレージは、重複排除機能を持ち、重複データを識別して、非重複データのみディスクへ保存している。これにより、高い容量効率が実現され、バックアップ時間の短縮を図っている。なお、プライマリストレージがセカンダリストレージの重複排除情報を利用して重複排除の計算を行う方法が、特許文献1に開示されている。 Here, the secondary storage used when performing large-generation backup of large-capacity data has a deduplication function, identifies duplicate data, and stores only non-duplicate data on the disk. This achieves high capacity efficiency and shortens the backup time. A method in which the primary storage calculates deduplication using deduplication information of the secondary storage is disclosed in Patent Document 1.
そして、プライマリストレージのデータを、定期的に重複排除セカンダリストレージへバックアップする時には、指定された期間内でバックアップを完了させる必要がある。しかしながら、同じデータをバックアップする場合であっても、上述したファイルバックアップ方式とRAWバックアップ方式のどちらかを採用することにより、バックアップにかかる時間が異なるため、指定される期間内でバックアップを完了できない場合が生じる。つまり、バックアップ時間を短縮することができない、という問題がある。 When the primary storage data is regularly backed up to the deduplication secondary storage, it is necessary to complete the backup within a specified period. However, even if the same data is backed up, the time taken for the backup differs by adopting either the file backup method or RAW backup method described above, so the backup cannot be completed within the specified period. Occurs. That is, there is a problem that the backup time cannot be shortened.
このため、本発明の目的は、上述した課題である、バックアップ時間を短縮することができない、という問題を解決することができるストレージシステムを提供することにある。 Therefore, an object of the present invention is to provide a storage system that can solve the above-described problem that the backup time cannot be shortened.
本発明の一形態であるストレージシステムは、
プライマリストレージに記憶されているデータを、セカンダリストレージにバックアップする方式として、ファイルバックアップ方式あるいはRAWバックアップ方式のいずれの方式を用いるかを判断するバックアップ方式判断手段と、
前記バックアップ方式判断手段にて判断されたバックアップ方式を用いて、前記プライマリストレージに記憶されているデータを、前記セカンダリストレージにバックアップするバックアップ手段と、を備え、
前記バックアップ方式判断手段は、前記プライマリストレージに記憶されているデータと前記セカンダリストレージに記憶されているデータとに基づいて、前記ファイルバックアップ方式でバックアップを行った際にかかる時間と、前記RAWバックアップ方式でバックアップを行った際にかかる時間と、の差分であるバックアップ時間差分を算出して、当該バックアップ時間差分に基づいて前記バックアップ手段にて用いるバックアップ方式を判断する、
という構成をとる。
A storage system according to an aspect of the present invention
Backup method determination means for determining whether to use the file backup method or the RAW backup method as a method for backing up the data stored in the primary storage to the secondary storage;
Backup means for backing up the data stored in the primary storage to the secondary storage using the backup method determined by the backup method determination means;
The backup method determination means includes a time required for performing a backup in the file backup method based on data stored in the primary storage and data stored in the secondary storage, and the RAW backup method. Calculating the backup time difference, which is the difference between the time taken when the backup was performed at and determining the backup method used in the backup means based on the backup time difference,
The configuration is as follows.
また、本発明の他の形態であるプログラムは、
情報処理装置に、
プライマリストレージに記憶されているデータを、セカンダリストレージにバックアップする方式として、ファイルバックアップ方式あるいはRAWバックアップ方式のいずれの方式を用いるかを判断するバックアップ方式判断手段と、
前記バックアップ方式判断手段にて判断されたバックアップ方式を用いて、前記プライマリストレージに記憶されているデータを、前記セカンダリストレージにバックアップするバックアップ手段と、を実現させるプログラムであり、
前記バックアップ方式判断手段は、前記プライマリストレージに記憶されているデータと前記セカンダリストレージに記憶されているデータとに基づいて、前記ファイルバックアップ方式でバックアップを行った際にかかる時間と、前記RAWバックアップ方式でバックアップを行った際にかかる時間と、の差分であるバックアップ時間差分を算出して、当該バックアップ時間差分に基づいて前記バックアップ手段にて用いるバックアップ方式を判断する、
という構成をとる。
Moreover, the program which is the other form of this invention is:
In the information processing device,
Backup method determination means for determining whether to use the file backup method or the RAW backup method as a method for backing up the data stored in the primary storage to the secondary storage;
A backup unit that backs up the data stored in the primary storage to the secondary storage using the backup method determined by the backup method determination unit,
The backup method determination means includes a time required for performing a backup in the file backup method based on data stored in the primary storage and data stored in the secondary storage, and the RAW backup method. Calculating the backup time difference, which is the difference between the time taken when the backup was performed at and determining the backup method used in the backup means based on the backup time difference,
The configuration is as follows.
また、本発明の他の形態であるバックアップ方法は、
プライマリストレージに記憶されているデータを、セカンダリストレージにバックアップする方式として、ファイルバックアップ方式あるいはRAWバックアップ方式のいずれの方式を用いるかを判断し、
前記判断されたバックアップ方式を用いて、前記プライマリストレージに記憶されているデータを、前記セカンダリストレージにバックアップするバックアップ方法であって、
前記プライマリストレージに記憶されているデータと前記セカンダリストレージに記憶されているデータとに基づいて、前記ファイルバックアップ方式でバックアップを行った際にかかる時間と、前記RAWバックアップ方式でバックアップを行った際にかかる時間と、の差分であるバックアップ時間差分を算出して、当該バックアップ時間差分に基づいて前記バックアップ手段にて用いるバックアップ方式を判断する、
という構成をとる。
In addition, the backup method according to another aspect of the present invention includes
Determine whether to use the file backup method or the RAW backup method to back up the data stored in the primary storage to the secondary storage.
A backup method for backing up the data stored in the primary storage to the secondary storage using the determined backup method,
Based on the data stored in the primary storage and the data stored in the secondary storage, the time taken when performing the backup by the file backup method, and when performing the backup by the RAW backup method Calculating a backup time difference that is a difference between the time and determining a backup method to be used in the backup unit based on the backup time difference;
The configuration is as follows.
本発明は、以上のように構成されることにより、バックアップ時間を短縮することができる。 The present invention is configured as described above, so that the backup time can be shortened.
<実施形態1>
本発明の第1の実施形態を、図1乃至図8を参照して説明する。図1乃至図3は、ストレージシステムの構成を説明するための図であり、図4乃至図9は、ストレージシステムの動作を説明するための図である。
<Embodiment 1>
A first embodiment of the present invention will be described with reference to FIGS. 1 to 3 are diagrams for explaining the configuration of the storage system, and FIGS. 4 to 9 are diagrams for explaining the operation of the storage system.
[構成]
図1に示すように、ストレージシステム1は、業務用に稼働するプライマリストレージ10と、バックアップ用に稼働するセカンダリストレージ20と、を備えている。
[Constitution]
As shown in FIG. 1, the storage system 1 includes a
プライマリストレージ10は、演算装置と記憶装置とを備えた情報処理装置で構成されている。そして、プライマリストレージ10の記憶装置には、図10に示すように、業務用のデータが記憶された業務ボリューム11が形成されている。なお、プライマリストレージ10は、後述するように業務ボリューム11をプライマリストレージ20にバックアップする前に、ストレージ内部で業務ボリューム11の一次バックアップをとるが、かかる一次バックアップ12が記憶装置に形成される。そして、プライマリストレージ10は、後述するように、業務ボリューム11の一次バックアップ12をさらにセカンダリストレージ20にバックアップする処理を行う。このバックアップ処理は、以下の二つのバックアップ方式のどちらかで行われる。
The
(1)ファイルバックアップ方式
プライマリストレージ10にあるバックアップ対象となる業務ボリューム11のデータを、バックアップサーバ(図示せず)でマウントし、ファイルシステムを解析して、ファイル単位でセカンダリストレージ20へバックアップする。
(2)RAWバックアップ方式
プライマリストレージ10にあるバックアップ対象となる業務ボリューム11の中身を解析せず、バックアップサーバを利用する必要がなく、RAWブロック単位で直接ディスクイメージをセカンダリストレージ20へバックアップする。
(1) File backup method The data of the
(2) RAW backup method The contents of the
また、セカンダリストレージ20は、演算装置と記憶装置とを備えた情報処理装置で構成されている。そして、セカンダリストレージ20の記憶装置には、プライマリストレージ10からバックアップされたデータが記憶される二次バックアップ22が形成されている。なお、セカンダリストレージ20は、重複排除機能(重複排除部21)を有しているため、バックアップデータのうち既に記憶している重複データを識別して、非重複データのみディスクへ保存する。以下、各構成についてさらに詳述する。
Moreover, the
図2に示すように、プライマリストレージ10は、装備された演算装置にプログラムが組み込まれることで構築された、ファイルシステム解析部111と、重複排除率計算部112と、バックアップ方式判断部113と、バックアップ部114と、更新データチェック部115と、を備えている。また、プライマリストレージ10は、装備された記憶装置に、上述した業務ボリューム101,102,103と、ファイルシステム情報管理表121と、バックアップ方式管理表122と、更新データチェック結果管理表123と、が記憶されている。なお、図示しないが、プライマリストレージ10の記憶装置は、業務ボリューム101,102,103の一次バックアップも記憶されることとなる。
As shown in FIG. 2, the
ファイルシステム解析部111は、業務ボリューム11から一次バックアップ12を取る時に、一次バックアップの内容をファイルシステムとして解析して、その解析結果をファイルシステム情報管理表121に記憶する。ファイルシステム解析部111は、例えば、図3(A)のファイルシステム情報管理表121に記憶された情報に示すように、ファイルシステムの容量、使用ブロック数、ファイル数、をファイルシステムから解析する。但し、ファイルシステム解析部111による解析内容は、上述した内容に限定されない。
When taking the
重複排率除計算部112は、ファイルバックアップ方式でバックアップを行った場合の重複排除率と、RAWバックアップ方式でバックアップを行った場合の重複排除率と、をそれぞれ計算する。このとき、まず、プライマリストレージ10には、セカンダリストレージ20に記憶されている重複排除テーブル220のコピーである重複排除テーブルキャッシュ124が記憶されている。この重複排除テーブル220には、セカンダリストレージ20に既に記憶されているデータの内容に応じて算出されたハッシュ値が記憶されている。
The deduplication rate
そして、重複排除率計算部112は、まず、ファイルバックアップ方式の場合には、バックアップ対象となる業務ボリューム11のファイルを読み取って、所定容量のチャンクに分割(チャンキング)し、当該チャンクのデータ内容に応じたハッシュ値を算出する。そして、重複排除テーブルキャッシュ124を参照して、チャンクから算出したハッシュ値と同じ値が存在する場合には、かかるチャンクは既にセカンダリストレージ20に記憶されており、重複データであると判断する。最後に、重複データと判断されたチャンクの業務ボリューム11全体に対する割合を求め、ファイルバックアップ方式の場合の重複排除率とする。
First, in the case of the file backup method, the deduplication
また、重複排除率計算部112は、上述した処理を、RAWバックアップ方式についても行う。RAWバックアップ方式の場合には、バックアップ対象となる業務ボリューム11をブロック単位で読み取って、所定容量のチャンクに分割(チャンキング)し、当該チャンクのハッシュ値を算出する。そして、重複排除テーブルキャッシュ124を参照して、チャンクから算出したハッシュ値と同じ値が存在する場合には、かかるチャンクは既にセカンダリストレージ20に記憶されており、重複データであると判断する。最後に、重複データと判断されたチャンクの業務ボリューム11全体に対する割合を求め、RAWバックアップ方式の場合の重複排除率とする。
The deduplication
バックアップ方式判断部113(バックアップ方式判断手段)は、ファイルバックアップ方式あるいはRAWバックアップ方式のいずれの方式を用いてバックアップを行うかを判断する。このとき、バックアップ方式判断部113は、上述したファイルシステム解析部111によるファイルシステムの解析結果であるファイルシステム情報管理表121のデータと、重複排除率計算部112による各バックアップ方式における重複排除率と、を用いて判断する。
The backup method determination unit 113 (backup method determination means) determines which of the file backup method and the RAW backup method is used for backup. At this time, the backup
バックアップ方式判断部113は、バックアップ方式を判断する際に、ファイルバックアップ方式でバックアップを行った際にかかる時間と、RAWバックアップ方式でバックアップを行った際にかかる時間と、の差分であるバックアップ時間の差分を算出して、かかるバックアップ時間の差分に基づいて判断する。ここで、バックアップにかかる時間は、以下の三段階となる。
When determining the backup method, the backup
(1)プライマリストレージ側のデータ読み取り時間
まず、バックアップを行う際には、プライマリストレージ10においてバックアップ対象となるデータを読み取る時間がかかる。そして、ファイルバックアップ方式のときには、RAWバックアップ方式と比較して、データ読み取り時間にオーバーヘッドが生じる。このデータ読み取り時間のオーバーヘッドは、ファイル数に比例する。このため、バックアップ方式判断部113は、ファイルシステム情報管理表121のファイル数を用いて、ファイルバックアップ方式のときのデータ読み取り時間を算出し、かかる時間を、RAWバックアップ方式におけるデータ読み取り時間との差分(ΔR)とする。例えば、大量なファイルが存在するディスクをバックアップする場合、ファイルのオープン・クローズのオーバーヘッドにより、データ読取時間が大きくかかる。1ファイルのアクセスに10msecかかるとすると、100万ファイルあたり2.5時間ほどのオーバーヘッドになる。
(1) Data reading time on the primary storage side First, when performing backup, it takes time to read data to be backed up in the
(2)ストレージ間のデータ転送時間
次に、バックアップを行う際には、プライマリストレージ10からセカンダリストレージ20にデータを転送するデータ転送時間がかかる。このデータ転送時間は、データ転送量/回線速度、で求めることができる。ファイルバックアップ方式のときには、データ転送量はファイルシステム容量であるため、ファイルシステム情報管理表121のファイルシステム容量を用いて、ファイルバックアップ方式のときのデータ転送時間を算出する。また、RAWバックアップ方式のときには、データ転送量は予め設定されたブロックサイズ×ブロック数となるため、ファイルシステム情報管理表121のブロック数を用いて、RAWバックアップ方式のときのデータ転送時間を算出する。そして、各バックアップ方式におけるデータ転送時間の差分(ΔT)を算出する。なお、RAWバックアップ方式の場合には、ブロック単位でデータを読み取ってセカンダリストレージ20へ転送するので、ブロックに無効なデータが含まれても転送してバックアップしてしまう。このため、有効なデータのみ転送するファイルバックアップ方式よりもデータ転送量が大きくなる場合があり、かかるデータ転送に時間がかかり、差分が生じることがある。
(2) Data transfer time between storages Next, when performing backup, it takes data transfer time to transfer data from the
(3)セカンダリストレージ側のデータ書込み時間
最後に、バックアップを行う際には、セカンダリストレージ20でデータを書き込む時間がかかる。このデータ書き込み処理は、セカンダリストレージ20の重複排除機能により、重複排除されていないデータのみをディスクに書き込むため、重複排除率が高ければ高いほど、データの書き込み時間が短くなる。そして、データ書き込み時間は、(データ転送量×(1−重複排除率))/書き込み速度、で算出できる。従って、ファイルバックアップ方式のときには、ファイルシステム情報管理表121のファイルシステム容量をデータ転送量とし、また、重複排除率計算部112から重複排除率を取得して、データ書き込み時間を算出する。また、RAWバックアップ方式のときには、ファイルシステム情報管理表121のブロック数からデータ転送量を算出し、また、重複排除率計算部112から重複排除率を取得して、データ書き込み時間を算出する。そして、各バックアップ方式におけるデータ書き込み時間の差分(ΔW)を算出する。
(3) Data writing time on the secondary storage side Finally, it takes time to write data in the
バックアップ方式判断部113は、上述したように算出した各バックアップ方式における各時間の差分の和(ΔR+ΔT+ΔW)を、各バックアップ方式でバックアップを行った際にかかる時間の差分であるバックアップ時間差分として算出する。そして、バックアップ方式判断部113は、算出したバックアップ時間差分から、ファイルバックアップ方式またはRAWバックアップ方式のどちらの場合がバックアップ時間が短いかを判断し、バックアップ時間の短いバックアップ方式を選択して、バックアップ方式管理表122に保存しておく。例えば、バックアップ方式管理表122には、図3に示すように、業務ボリューム101,102,103毎に判断して選択したバックアップ方式(File backup又はRAW backup)を記憶しておく。
The backup
なお、バックアップ方式判断部113は、上述したように業務ボリューム11の一次バックアップ12を取るときに、バックアップ方式管理表122にエントリがない場合に、バックアップ方式の判断を行う。そして、バックアップ方式が既に存在した場合には、再度バックアップ方式を判断する必要がなく、一つの業務ボリューム11に対してバックアップ方式の判断は一回だけで済む。但し、バックアップ方式判断部113は、業務ボリュームの一次バックアップを取るたびに、バックアップ方式を判断してバックアップ方式管理表122を更新してもよい。
The backup
また、バックアップ方式判断部113は、上述したバックアップ時間差分が小さい、例えば、バックアップ時間差分が一定の範囲内(一方のバックアップ時間の5%以内)である場合には、重複排除率の高いバックアップ方式を選択して、バックアップ管理表122を更新する。
The backup
バックアップ部114(バックアップ手段)は、セカンダリストレージ20へ二次バックアップ22(201等)を取る時に、バックアップ方式管理表122を参照して、バックアップ対象毎のバックアップ方式を取得する。そして、その方式で、セカンダリストレージ20へ二次バックアップを取る。
The backup unit 114 (backup means) refers to the backup method management table 122 when acquiring the secondary backup 22 (201, etc.) to the
ここで、上記バックアップ部114は、業務ボリューム11(一次バックアップ12)のデータを全てバックアップするフルバックアップ後には、プライマリストレージ10で更新された差分データのみをセカンダリストレージ20にバックアップする差分バックアップを行う。このとき、差分バックアップも、バックアップ方式管理表122に記憶されたバックアップ方式で行う。但し、差分バックアップの場合、データの更新パターンによってファイルバックアップとRAWバックアップのバックアップ時間が異なる。このため、更新データチェック部115にて、差分バックアップを行うたびにデータの更新パターンをチェックし、その傾向を見てバックアップ方式を見直す。
Here, after the full backup that backs up all the data of the transaction volume 11 (primary backup 12), the
差分バックアップのバックアップ時間に影響するデータ更新パターンとしては、まず、大きいファイルが部分的に更新される場合が挙げられる。この場合、ファイル単位の差分であると転送データ量は更新ファイルのサイズになるが、ブロック転送だと更新部分のブロックのサイズのみとなる。また、デフラグなどファイルが置き換えられる場合があり、この場合は多くのブロックが更新され、ファイル単位よりブロック単位のデータ転送量が大きい。 As a data update pattern that affects the backup time of differential backup, there is a case where a large file is partially updated. In this case, if the difference is in file units, the transfer data amount is the size of the update file, but if it is block transfer, only the block size of the update portion is obtained. In some cases, a file is replaced, such as defragmentation. In this case, many blocks are updated, and the data transfer amount per block is larger than the file unit.
以上のことから、更新データチェック部115は、業務ボリューム11からの差分バックアップにより一次バックアップ12が更新されるたびに、ファイル単位の差分とブロック単位の差分のどちらのデータ転送量が多いかをチェックする。そして、更新データチェック部115は、一次バックアップの回数と、一方のバックアップ方式でデータ転送量が少ないと判断された回数とを、更新データチェック結果管理表123に記憶する。図3(C)の例では、業務ボリューム毎に、一次バックアップの回数(Count)と、RAWバックアップ方式の方がデータ転送量が少ないと判断された回数(Block)を記憶している。そして、更新データチェック部115は、更新データチェック結果管理表123のデータに基づいて、バックアップ方式を判断し、バックアップ方式管理表122を更新する。これにより、バックアップ部114は、更新されたバックアップ方式で、差分バックアップを行う。
From the above, the update data check
[動作]
次に、上述したストレージシステム1の動作を、主に図4乃至図8のフローチャートを参照して説明する。以下では、プライマリストレージ10の業務ボリューム11の全てのデータをセカンダリストレージ20にバックアップするフルバックアップ運用時の動作と、更新された差分データをバックアップする差分バックアップ運用時の動作と、に分けて説明する。
[Operation]
Next, the operation of the above-described storage system 1 will be described with reference mainly to the flowcharts of FIGS. The following description will be divided into an operation during full backup operation that backs up all data in the
(フルバックアップ運用)
まず、業務ボリューム101,102,103(11)は、ファイルサーバから利用され、大量な小さいファイルが保存されることを想定する。そして、プライマリストレージ10内で業務ボリューム101の一次バックアップを取る時に、バックアップ方式管理表122にエントリがなく、バックアップ方式の判断を行うこととなる。
(Full backup operation)
First, it is assumed that the
ファイルシステム解析部111は、業務ボリューム101のディスクイメージをバックアップサーバにマウントして、ファイルシステム(NTFS、ext3など)を解析する(図4のステップS1)。そして、その解析結果であるファイルシステム容量、使用ブロック数、ファイル数を、ファイルシステム情報管理表121に記憶する(図4のステップS2)。
The file
また、重複排除率計算部112は、まず、ファイルバックアップ方式の場合には、業務ボリューム101等のファイルを読み取って、所定容量のチャンクに分割(チャンキング)し、当該チャンクのハッシュ値を算出する(図5のステップS11)。そして、重複排除テーブルキャッシュ124を参照して、チャンクから算出したハッシュ値と同じ値が存在する場合には、かかるチャンクは既にセカンダリストレージ20に記憶されており、重複データであると判断する(図5のステップS12)。最後に、重複データと判断されたチャンクの業務ボリューム11全体に対する割合を求め、ファイルバックアップ方式の場合の重複排除率とする(図5のステップS13)。
Further, in the case of the file backup method, the deduplication
重複排除率計算部112は、上述同様に、RAWバックアップ方式についても、重複排除率を算出する。このとき、重複排除率計算部112は、バックアップ対象となる業務ボリューム101等のブロックをチャンキングして、そのハッシュ値を求める(図5のステップS11)。その後は、上述と同様の処理を行って(図5のステップS12)、RAWバックアップ方式の場合の重複排除率とする(図5のステップS13)。
As described above, the deduplication
次に、バックアップ方式判断部113が、図6に示すように、バックアップ方式の選択を行う。まず、バックアップ方式判断部113は、ファイルシステム情報管理表121から、ファイルシステム容量、ファイル数、使用ブロック数、の情報を取得する(図6のステップS21)。そして、バックアップ方式判断部13は、取得したファイル数を用いて、ファイルバックアップ方式でデータ読み取りの際にかかる時間を算出する。例えば、1ファイルのアクセスに10msecかかるとすると、ファイルシステム内に100万ファイルある場合には、読み取りにかかる時間は2.5時間となる。この算出したファイルバックアップ方式におけるデータ読み取り時間を、ファイルバックアップ方式とRAWバックアップ方式とにおけるデータ読み取り時間の差分(ΔR)として算出する(図6のステップS22)。
Next, the backup
続いて、バックアップ方式判断部113は、ファイルシステム容量と、使用ブロック数を用いて、ファイルバックアップ方式とRAWバックアップ方式とのデータ転送量の差分(ΔT)を算出する(図6のステップS23)。例えば、RAWバックアップの読み取りブロックサイズを256MBとすると、ΔT=((ファイルシステム容量−(256MB×ブロック数))/回線速度、により、データ転送時間の差分を算出できる。この場合、ΔTは、ファイルシステム方式の方がRAWバックアップ方式よりもかかるデータ転送時間として算出されることとなり、RAWバックバックアップ方式の方が無駄なデータが含まれている場合には、負の値となる。
Subsequently, the backup
さらに、バックアップ方式判断部113は、重複排除率計算部112から各ファイルバックアップ方式による重複排除率を取得する。そして、バックアップ方式判断部113は、取得した重複排除率と、データ転送量(ファイルシステム容量と使用ブロック数)を用いて、ファイルバックアップ方式とRAWバックアップ方式とのデータ書き込み時間の差分(ΔW)を算出する(図6のステップS24)。例えば、書き込み時間の差分は、ΔW=((ファイルバックアップ方式:データ転送量×(1−重複排除率)−(RAWバックアップ方式:データ転送量×(1−重複排除率))/書込み速度、により算出できる。
Further, the backup
そして、バックアップ方式判断部113は、上述したように算出した各時間の差分の合計(ΔR+ΔT+ΔW)を確認して(図6のステップS25)、バックアップ時間の短いバックアップ方式を選択して、バックアップ方式管理表122へ記憶する(図6のステップS26,S27)。このとき、バックアップ方式判断部113は、バックアップ時間の差分が一定範囲内(例えば、短い方のバックアップ時間の5%以内)である場合には、重複排除率の高いバックアップ方式を選択する(図6のステップS28)。なお、バックアップ方式判断部113は、バックアップ時間の差分の値が、予め設定された値の範囲内(例えば、±aの範囲内)である場合に、重複排除率の高いバックアップ方式を選択してもよい。
Then, the backup
その後、バックアップ部114は、二次バックアップを取る時に、バックアップ方式管理表122からバックアップ対象のディスクのバックアップ方式を取得する(図7のステップS31,S32)。バックアップ部114は、ファイルバックアップ方式の場合には、ファイルシステム解析部111を利用して、ファイルシステムからファイルを読み取ってセカンダリストレージ20へバックアップする(図7のステップS33)。RAWバックアップの場合には、ディスク自体のデータを単純に読み取ってセカンダリストレージ20へバックアップする(図7のステップS34)。
After that, the
(差分バックアップ運用)
上述したように、一回フルバックアップ後、差分バックアップで運用する場合には、ディスクイメージをマウントし(図8のステップS41)、一次バックアップが更新されるたびに、更新データチェック部115にて更新ファイル及び更新ブロックのデータ容量をチェックする(図8のステップS42,S43)。これにより、ファイル単位での差分データとブロック単位での差分データの両方のデータ転送量をチェックする。そして、更新データチェック部115は、ファイル単位とブロック単位とで、どちらのデータ転送量が少ないかを判断して、その結果に基づく値を、更新データチェック結果管理表123に保存する(図8のステップS44)。具体的に、更新データチェック部115は、一次バックアップへの差分バックアップ回数(Count)と、ブロック単位でデータ転送量が少ないと判断された回数(Block)とを、更新データチェック結果管理表123に保存する。
(Differential backup operation)
As described above, when operating with differential backup after a full backup, the disk image is mounted (step S41 in FIG. 8) and updated by the update data check
更新データチェック部115は、差分バックアップ回数(Count)が一定数(例えば、10回)に達した場合(図8のステップS45:Yes)、ブロック単位でデータ転送量が少ないと判断された回数(Block)を確認する(図8のステップS46)。ブロック単位でデータ転送量が少ないと判断された回数(Block)が、差分バックアップ回数(Count)の半数以上(5回以上)である場合には(図8のステップS46:50%以上)、傾向的にRAWバックアップ方式が有利と判断する(図8のステップS48)。一方、ブロック単位でデータ転送量が少ないと判断された回数(Block)が、差分バックアップ回数(Count)の半数未満(5回未満)である場合には(図8のステップS46:50%未満)、ファイルバックアップ方式が有利と判断する(図8のステップS47)。
When the number of differential backups (Count) reaches a certain number (for example, 10) (step S45 in FIG. 8: Yes), the update data check
そして、更新データチェック部115は、バックアップ方式管理表122を、有利と判断した方式に更新し(図8のステップS47,S48)、更新データチェック結果管理表123のCount値を0にリセットする(図8のステップS49)。その後、バックアップ部114による差分バックアップは、更新されたバックアップ方式で行われる。
Then, the update data check
以上のように、本発明では、プライマリストレージ内におけるデータの特徴に応じて、自動的に最適なバックアップ方式を選択し、最短なバックアップ時間にてバックアップを実現することができる。その結果、バックアップ時間の短縮化により、指定期間内にバックアップが完了できない可能性を低減できる。 As described above, according to the present invention, an optimal backup method can be automatically selected according to the characteristics of data in the primary storage, and backup can be realized in the shortest backup time. As a result, it is possible to reduce the possibility that the backup cannot be completed within the specified period by shortening the backup time.
また、本発明では、同等なバックアップ時間が得られる場合には、セカンダリストレージでの重複排除率の高いバックアップ方式を選択している。これにより、バックアップに必要なディスク容量を削減できる。 In the present invention, when the equivalent backup time can be obtained, a backup method with a high deduplication rate in the secondary storage is selected. As a result, the disk capacity required for backup can be reduced.
<付記>
上記実施形態の一部又は全部は、以下の付記のようにも記載されうる。以下、本発明におけるストレージシステム(図9参照)、プログラム、バックアップ方法の構成の概略を説明する。但し、本発明は、以下の構成に限定されない。
<Appendix>
Part or all of the above-described embodiment can be described as in the following supplementary notes. The outline of the configuration of the storage system (see FIG. 9), program, and backup method in the present invention will be described below. However, the present invention is not limited to the following configuration.
(付記1)
プライマリストレージに記憶されているデータを、セカンダリストレージにバックアップする方式として、ファイルバックアップ方式あるいはRAWバックアップ方式のいずれの方式を用いるかを判断するバックアップ方式判断手段と、
前記バックアップ方式判断手段にて判断されたバックアップ方式を用いて、前記プライマリストレージに記憶されているデータを、前記セカンダリストレージにバックアップするバックアップ手段と、を備え、
前記バックアップ方式判断手段は、前記プライマリストレージに記憶されているデータと前記セカンダリストレージに記憶されているデータとに基づいて、前記ファイルバックアップ方式でバックアップを行った際にかかる時間と、前記RAWバックアップ方式でバックアップを行った際にかかる時間と、の差分であるバックアップ時間差分を算出して、当該バックアップ時間差分に基づいて前記バックアップ手段にて用いるバックアップ方式を判断する、
ストレージシステム。
(Appendix 1)
Backup method determination means for determining whether to use the file backup method or the RAW backup method as a method for backing up the data stored in the primary storage to the secondary storage;
Backup means for backing up the data stored in the primary storage to the secondary storage using the backup method determined by the backup method determination means;
The backup method determination means includes a time required for performing a backup in the file backup method based on data stored in the primary storage and data stored in the secondary storage, and the RAW backup method. Calculating the backup time difference, which is the difference between the time taken when the backup was performed at and determining the backup method used in the backup means based on the backup time difference,
Storage system.
(付記2)
付記1に記載のストレージシステムであって、
前記バックアップ方式判断手段は、前記プライマリストレージに記憶されているデータを解析した結果を用いて、前記バックアップ時間差分を算出する、
ストレージシステム。
(Appendix 2)
The storage system according to attachment 1, wherein
The backup method determination means calculates the backup time difference using a result of analyzing data stored in the primary storage.
Storage system.
(付記3)
付記2に記載のストレージシステムであって、
前記バックアップ方式判断手段は、前記プライマリストレージに記憶されているファイルシステムに含まれるファイル数を用いて、前記ファイルバックアップ方式と前記RAWバックアップ方式とによるデータ読み取り時間の差分を算出し、当該データ読み取り時間の差分を用いて前記バックアップ時間差分を算出する、
ストレージシステム。
(Appendix 3)
The storage system according to appendix 2,
The backup method determination means calculates the difference in data read time between the file backup method and the RAW backup method using the number of files included in the file system stored in the primary storage, and the data read time The backup time difference is calculated using the difference of
Storage system.
(付記4)
付記2又は3に記載のストレージシステムであって、
前記バックアップ方式判断手段は、前記プライマリストレージに記憶されているファイルシステムの容量と、RAWデータに含まれるブロック数と、を用いて、前記ファイルバックアップ方式と前記RAWバックアップ方式とによるデータ転送時間の差分を算出し、当該データ転送時間の差分を用いて前記バックアップ時間差分を算出する、
ストレージシステム。
(Appendix 4)
The storage system according to appendix 2 or 3,
The backup method determination means uses the file system capacity stored in the primary storage and the number of blocks included in the RAW data to determine the difference in data transfer time between the file backup method and the RAW backup method. And calculating the backup time difference using the difference in the data transfer time,
Storage system.
(付記5)
付記1乃至4のいずれかに記載のストレージシステムであって、
前記バックアップ方式判断手段は、前記プライマリストレージに記憶されているデータと前記セカンダリストレージに記憶されているデータとに基づいて、前記ファイルバック方式と前記RAWバックアップ方式とのそれぞれの方式でバックアップを行ったときにおける重複記憶排除率を算出し、当該算出した各方式における重複記憶排除率を用いて、前記バックアップ時間差分を算出する、
ストレージシステム。
(Appendix 5)
The storage system according to any one of appendices 1 to 4,
The backup method determination means performs backup in each of the file back method and the RAW backup method based on the data stored in the primary storage and the data stored in the secondary storage. Calculating the duplicate storage exclusion rate at the time, and calculating the backup time difference using the calculated duplicate storage exclusion rate in each method,
Storage system.
(付記6)
付記5に記載のストレージシステムであって、
前記バックアップ方式判断手段は、前記算出した各方式における重複記憶排除率を用いて、前記ファイルバックアップ方式と前記RAWバックアップ方式とによるデータ書き込み時間の差分を算出し、当該データ書き込み時間の差分を用いて前記バックアップ時間差分を算出する、
ストレージシステム。
(Appendix 6)
The storage system according to appendix 5,
The backup method determination means calculates a difference in data writing time between the file backup method and the RAW backup method using the calculated duplicate storage exclusion rate in each method, and uses the difference in the data writing time. Calculating the backup time difference;
Storage system.
(付記7)
付記1に記載のストレージシステムであって、
前記バックアップ方式判断手段は、
前記プライマリストレージに記憶されているファイルシステムに含まれるファイル数を用いて、前記ファイルバックアップ方式と前記RAWバックアップ方式とによるデータ読み取り時間の差分を算出し、
前記プライマリストレージに記憶されているファイルシステムの容量と、RAWデータに含まれるブロック数と、を用いて、前記ファイルバックアップ方式と前記RAWバックアップ方式とによるデータ転送時間の差分を算出し、
前記プライマリストレージに記憶されているデータと前記セカンダリストレージに記憶されているデータとに基づいて、前記ファイルバック方式と前記RAWバックアップ方式とのそれぞれの方式でバックアップを行ったときにおける重複記憶排除率を算出し、当該算出した各方式における重複記憶排除率を用いて、前記ファイルバックアップ方式と前記RAWバックアップ方式とによるデータ書き込み時間の差分を算出し、
前記データ読み取り時間の差分と、前記データ転送時間の差分と、前記データ書き込み時間の差分と、を用いて、前記バックアップ時間差分を算出する、
ストレージシステム。
(Appendix 7)
The storage system according to attachment 1, wherein
The backup method determination means includes
Using the number of files included in the file system stored in the primary storage, calculate the difference in data read time between the file backup method and the RAW backup method,
Using the capacity of the file system stored in the primary storage and the number of blocks included in the RAW data, the difference in data transfer time between the file backup method and the RAW backup method is calculated,
Based on the data stored in the primary storage and the data stored in the secondary storage, the duplicate storage exclusion rate when backup is performed by each of the file back method and the RAW backup method. Calculate the difference in data write time between the file backup method and the RAW backup method using the calculated duplicate storage exclusion rate in each method,
Using the data read time difference, the data transfer time difference, and the data write time difference, the backup time difference is calculated.
Storage system.
(付記7.1)
付記6又は7に記載のストレージシステムであって、
前記バックアップ方式判断手段は、前記算出したバックアップ時間差分が所定範囲内である場合には、前記ファイルバックアップ方式と前記RAWバックアップ方式とのそれぞれの場合で算出した前記重複記憶排除率が高い方のバックアップ方式を用いるよう判断する、
ストレージシステム。
(Appendix 7.1)
The storage system according to appendix 6 or 7, wherein
When the calculated backup time difference is within a predetermined range, the backup method determining means determines whether the backup with the higher duplicated storage exclusion rate calculated in each case of the file backup method and the RAW backup method. Decide to use the method,
Storage system.
(付記8)
付記1乃至7のいずれかに記載のストレージシステムであって、
前記バックアップ手段は、前記バックアップ方式判断手段で判断されたバックアップ方式で、前記プライマリストレージにて更新された差分データを前記セカンダリストレージにバックアップする差分バックアップを行い、
前記バックアップ方式判断手段は、前記ファイルバックアップ方式と前記RAWバックアップ方式とのそれぞれの方式でバックアップを行ったときにおけるデータ転送量に基づいて、前記差分バックアップを行うときに用いるバックアップ方式を判断する、
ストレージシステム。
(Appendix 8)
The storage system according to any one of appendices 1 to 7,
The backup means performs a differential backup in which the differential data updated in the primary storage is backed up to the secondary storage in the backup system determined by the backup system determination means,
The backup method determining means determines a backup method to be used when performing the differential backup, based on a data transfer amount when backup is performed in each of the file backup method and the RAW backup method.
Storage system.
(付記8.1)
付記8に記載のストレージシステムであって、
前記バックアップ方式判断手段は、前記ファイルバックアップ方式と前記RAWバックアップ方式とのそれぞれの方式で、前記データ転送量が少ない方の回数をカウントし、当該回数に基づいて前記差分バックアップを行うときに用いるバックアップ方式を判断する、
ストレージシステム。
(Appendix 8.1)
The storage system according to attachment 8, wherein
The backup method determination means counts the number of times of the smaller data transfer amount in each of the file backup method and the RAW backup method, and uses the backup when performing the differential backup based on the number of times Determine the method,
Storage system.
(付記9)
情報処理装置に、
プライマリストレージに記憶されているデータを、セカンダリストレージにバックアップする方式として、ファイルバックアップ方式あるいはRAWバックアップ方式のいずれの方式を用いるかを判断するバックアップ方式判断手段と、
前記バックアップ方式判断手段にて判断されたバックアップ方式を用いて、前記プライマリストレージに記憶されているデータを、前記セカンダリストレージにバックアップするバックアップ手段と、を実現させるプログラムであり、
前記バックアップ方式判断手段は、前記プライマリストレージに記憶されているデータと前記セカンダリストレージに記憶されているデータとに基づいて、前記ファイルバックアップ方式でバックアップを行った際にかかる時間と、前記RAWバックアップ方式でバックアップを行った際にかかる時間と、の差分であるバックアップ時間差分を算出して、当該バックアップ時間差分に基づいて前記バックアップ手段にて用いるバックアップ方式を判断する、
プログラム。
(Appendix 9)
In the information processing device,
Backup method determination means for determining whether to use the file backup method or the RAW backup method as a method for backing up the data stored in the primary storage to the secondary storage;
A backup unit that backs up the data stored in the primary storage to the secondary storage using the backup method determined by the backup method determination unit,
The backup method determination means includes a time required for performing a backup in the file backup method based on data stored in the primary storage and data stored in the secondary storage, and the RAW backup method. Calculating the backup time difference, which is the difference between the time taken when the backup was performed at and determining the backup method used in the backup means based on the backup time difference,
program.
(付記10)
プライマリストレージに記憶されているデータを、セカンダリストレージにバックアップする方式として、ファイルバックアップ方式あるいはRAWバックアップ方式のいずれの方式を用いるかを判断し、
前記判断されたバックアップ方式を用いて、前記プライマリストレージに記憶されているデータを、前記セカンダリストレージにバックアップするバックアップ方法であって、
前記プライマリストレージに記憶されているデータと前記セカンダリストレージに記憶されているデータとに基づいて、前記ファイルバックアップ方式でバックアップを行った際にかかる時間と、前記RAWバックアップ方式でバックアップを行った際にかかる時間と、の差分であるバックアップ時間差分を算出して、当該バックアップ時間差分に基づいて前記バックアップ手段にて用いるバックアップ方式を判断する、
バックアップ方法。
(Appendix 10)
Determine whether to use the file backup method or the RAW backup method to back up the data stored in the primary storage to the secondary storage.
A backup method for backing up the data stored in the primary storage to the secondary storage using the determined backup method,
Based on the data stored in the primary storage and the data stored in the secondary storage, the time taken when performing the backup by the file backup method, and when performing the backup by the RAW backup method Calculating a backup time difference that is a difference between the time and determining a backup method to be used in the backup unit based on the backup time difference;
Backup method.
(付記10.1)
付記10に記載のバックアップ方法であって、
前記バックアップ方式を判断する際に、
前記プライマリストレージに記憶されているファイルシステムに含まれるファイル数を用いて、前記ファイルバックアップ方式と前記RAWバックアップ方式とによるデータ読み取り時間の差分を算出し、
前記プライマリストレージに記憶されているファイルシステムの容量と、RAWデータに含まれるブロック数と、を用いて、前記ファイルバックアップ方式と前記RAWバックアップ方式とによるデータ転送時間の差分を算出し、
前記プライマリストレージに記憶されているデータと前記セカンダリストレージに記憶されているデータとに基づいて、前記ファイルバック方式と前記RAWバックアップ方式とのそれぞれの方式でバックアップを行ったときにおける重複記憶排除率を算出し、当該算出した各方式における重複記憶排除率を用いて、前記ファイルバックアップ方式と前記RAWバックアップ方式とによるデータ書き込み時間の差分を算出し、
前記データ読み取り時間の差分と、前記データ転送時間の差分と、前記データ書き込み時間の差分とから、前記バックアップ時間差分を算出して、当該バックアップ時間差分に基づいて前記バックアップ手段にて用いるバックアップ方式を判断する、
バックアップ方法。
(Appendix 10.1)
The backup method according to
When determining the backup method,
Using the number of files included in the file system stored in the primary storage, calculate the difference in data read time between the file backup method and the RAW backup method,
Using the capacity of the file system stored in the primary storage and the number of blocks included in the RAW data, the difference in data transfer time between the file backup method and the RAW backup method is calculated,
Based on the data stored in the primary storage and the data stored in the secondary storage, the duplicate storage exclusion rate when backup is performed by each of the file back method and the RAW backup method. Calculate the difference in data write time between the file backup method and the RAW backup method using the calculated duplicate storage exclusion rate in each method,
A backup method for calculating the backup time difference from the difference in the data reading time, the difference in the data transfer time, and the difference in the data writing time, and using the backup method based on the backup time difference. to decide,
Backup method.
(付記10.2)
付記10又は10.1に記載のバックアップ方法であって、
前記バックアップを行う際に、前記判断されたバックアップ方式で、前記プライマリストレージにて更新された差分データを前記セカンダリストレージにバックアップする差分バックアップを行い、
前記バックアップ方式を判断する際に、前記ファイルバックアップ方式と前記RAWバックアップ方式とのそれぞれの方式でバックアップを行ったときにおけるデータ転送量に基づいて、前記差分バックアップを行うときに用いるバックアップ方式を判断する、
バックアップ方法。
(Appendix 10.2)
The backup method according to
When performing the backup, in the determined backup method, performing a differential backup that backs up the differential data updated in the primary storage to the secondary storage,
When determining the backup method, the backup method used when the differential backup is performed is determined based on the data transfer amount when the backup is performed by each of the file backup method and the RAW backup method. ,
Backup method.
なお、上述したプログラムは、記憶装置に記憶されていたり、コンピュータが読み取り可能な記録媒体に記録されている。例えば、記録媒体は、フレキシブルディスク、光ディスク、光磁気ディスク、及び、半導体メモリ等の可搬性を有する媒体である。 Note that the above-described program is stored in a storage device or recorded on a computer-readable recording medium. For example, the recording medium is a portable medium such as a flexible disk, an optical disk, a magneto-optical disk, and a semiconductor memory.
以上、上記実施形態等を参照して本願発明を説明したが、本願発明は、上述した実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明の範囲内で当業者が理解しうる様々な変更をすることができる。 Although the present invention has been described with reference to the above-described embodiment and the like, the present invention is not limited to the above-described embodiment. Various changes that can be understood by those skilled in the art can be made to the configuration and details of the present invention within the scope of the present invention.
1 ストレージシステム
10 プライマリストレージ
11 業務ボリューム
12 一次バックアップ
20 セカンダリストレージ
21 重複排除部
22 二次バックアップ
101,102,103 業務ボリューム
111 ファイルシステム解析部
112 重複排除率計算部
113 バックアップ方式判断部
114 バックアップ部
115 更新データチェック部
121 ファイルシステム情報管理表
122 バックアップ方式管理表
123 更新データチェック結果管理表
124 重複排除テーブル
201,202,203 二次バックアップ
220 重複排除テーブルキャッシュ
300 ストレージシステム
301 バックアップ方式判断手段
302 バックアップ手段
310 プライマリストレージ
320 セカンダリストレージ
DESCRIPTION OF SYMBOLS 1
Claims (10)
前記バックアップ方式判断手段にて判断されたバックアップ方式を用いて、前記プライマリストレージに記憶されているデータを、前記セカンダリストレージにバックアップするバックアップ手段と、を備え、
前記バックアップ方式判断手段は、前記プライマリストレージに記憶されているデータと前記セカンダリストレージに記憶されているデータとに基づいて、前記ファイルバックアップ方式でバックアップを行った際にかかる時間と、前記RAWバックアップ方式でバックアップを行った際にかかる時間と、の差分であるバックアップ時間差分を算出して、当該バックアップ時間差分に基づいて前記バックアップ手段にて用いるバックアップ方式を判断する、
ストレージシステム。 Backup method determination means for determining whether to use the file backup method or the RAW backup method as a method for backing up the data stored in the primary storage to the secondary storage;
Backup means for backing up the data stored in the primary storage to the secondary storage using the backup method determined by the backup method determination means;
The backup method determination means includes a time required for performing a backup in the file backup method based on data stored in the primary storage and data stored in the secondary storage, and the RAW backup method. Calculating the backup time difference, which is the difference between the time taken when the backup was performed at and determining the backup method used in the backup means based on the backup time difference,
Storage system.
前記バックアップ方式判断手段は、前記プライマリストレージに記憶されているデータを解析した結果を用いて、前記バックアップ時間差分を算出する、
ストレージシステム。 The storage system according to claim 1,
The backup method determination means calculates the backup time difference using a result of analyzing data stored in the primary storage.
Storage system.
前記バックアップ方式判断手段は、前記プライマリストレージに記憶されているファイルシステムに含まれるファイル数を用いて、前記ファイルバックアップ方式と前記RAWバックアップ方式とによるデータ読み取り時間の差分を算出し、当該データ読み取り時間の差分を用いて前記バックアップ時間差分を算出する、
ストレージシステム。 The storage system according to claim 2,
The backup method determination means calculates the difference in data read time between the file backup method and the RAW backup method using the number of files included in the file system stored in the primary storage, and the data read time The backup time difference is calculated using the difference of
Storage system.
前記バックアップ方式判断手段は、前記プライマリストレージに記憶されているファイルシステムの容量と、RAWデータに含まれるブロック数と、を用いて、前記ファイルバックアップ方式と前記RAWバックアップ方式とによるデータ転送時間の差分を算出し、当該データ転送時間の差分を用いて前記バックアップ時間差分を算出する、
ストレージシステム。 The storage system according to claim 2 or 3,
The backup method determination means uses the file system capacity stored in the primary storage and the number of blocks included in the RAW data to determine the difference in data transfer time between the file backup method and the RAW backup method. And calculating the backup time difference using the difference in the data transfer time,
Storage system.
前記バックアップ方式判断手段は、前記プライマリストレージに記憶されているデータと前記セカンダリストレージに記憶されているデータとに基づいて、前記ファイルバックアップ方式と前記RAWバックアップ方式とのそれぞれの方式でバックアップを行ったときにおける重複記憶排除率を算出し、当該算出した各方式における重複記憶排除率を用いて、前記バックアップ時間差分を算出する、
ストレージシステム。 The storage system according to any one of claims 1 to 4,
Said backup scheme decision means, the data stored in the primary storage based on the data stored in the secondary storage, back up in each method of the said file backup method RAW backup method And calculating the backup time difference using the calculated duplicate storage exclusion rate in each method.
Storage system.
前記バックアップ方式判断手段は、前記算出した各方式における重複記憶排除率を用いて、前記ファイルバックアップ方式と前記RAWバックアップ方式とによるデータ書き込み時間の差分を算出し、当該データ書き込み時間の差分を用いて前記バックアップ時間差分を算出する、
ストレージシステム。 The storage system according to claim 5,
The backup method determination means calculates a difference in data writing time between the file backup method and the RAW backup method using the calculated duplicate storage exclusion rate in each method, and uses the difference in the data writing time. Calculating the backup time difference;
Storage system.
前記バックアップ方式判断手段は、
前記プライマリストレージに記憶されているファイルシステムに含まれるファイル数を用いて、前記ファイルバックアップ方式と前記RAWバックアップ方式とによるデータ読み取り時間の差分を算出し、
前記プライマリストレージに記憶されているファイルシステムの容量と、RAWデータに含まれるブロック数と、を用いて、前記ファイルバックアップ方式と前記RAWバックアップ方式とによるデータ転送時間の差分を算出し、
前記プライマリストレージに記憶されているデータと前記セカンダリストレージに記憶されているデータとに基づいて、前記ファイルバックアップ方式と前記RAWバックアップ方式とのそれぞれの方式でバックアップを行ったときにおける重複記憶排除率を算出し、当該算出した各方式における重複記憶排除率を用いて、前記ファイルバックアップ方式と前記RAWバックアップ方式とによるデータ書き込み時間の差分を算出し、
前記データ読み取り時間の差分と、前記データ転送時間の差分と、前記データ書き込み時間の差分と、を用いて、前記バックアップ時間差分を算出する、
ストレージシステム。 The storage system according to claim 1,
The backup method determination means includes
Using the number of files included in the file system stored in the primary storage, calculate the difference in data read time between the file backup method and the RAW backup method,
Using the capacity of the file system stored in the primary storage and the number of blocks included in the RAW data, the difference in data transfer time between the file backup method and the RAW backup method is calculated,
Wherein based on the data and data stored in the primary storage is stored in the secondary storage, redundant storage rejection at the time when the backup was taken in each method of the said file backup method RAW backup method And using the duplicate storage exclusion rate in each of the calculated methods, calculate the difference in data write time between the file backup method and the RAW backup method,
Using the data read time difference, the data transfer time difference, and the data write time difference, the backup time difference is calculated.
Storage system.
前記バックアップ手段は、前記バックアップ方式判断手段で判断されたバックアップ方式で、前記プライマリストレージにて更新された差分データを前記セカンダリストレージにバックアップする差分バックアップを行い、
前記バックアップ方式判断手段は、前記ファイルバックアップ方式と前記RAWバックアップ方式とのそれぞれの方式でバックアップを行ったときにおけるデータ転送量に基づいて、前記差分バックアップを行うときに用いるバックアップ方式を判断する、
ストレージシステム。 The storage system according to any one of claims 1 to 7,
The backup means performs a differential backup in which the differential data updated in the primary storage is backed up to the secondary storage in the backup system determined by the backup system determination means,
The backup method determining means determines a backup method to be used when performing the differential backup, based on a data transfer amount when backup is performed in each of the file backup method and the RAW backup method.
Storage system.
プライマリストレージに記憶されているデータを、セカンダリストレージにバックアップする方式として、ファイルバックアップ方式あるいはRAWバックアップ方式のいずれの方式を用いるかを判断するバックアップ方式判断手段と、
前記バックアップ方式判断手段にて判断されたバックアップ方式を用いて、前記プライマリストレージに記憶されているデータを、前記セカンダリストレージにバックアップするバックアップ手段と、を実現させるプログラムであり、
前記バックアップ方式判断手段は、前記プライマリストレージに記憶されているデータと前記セカンダリストレージに記憶されているデータとに基づいて、前記ファイルバックアップ方式でバックアップを行った際にかかる時間と、前記RAWバックアップ方式でバックアップを行った際にかかる時間と、の差分であるバックアップ時間差分を算出して、当該バックアップ時間差分に基づいて前記バックアップ手段にて用いるバックアップ方式を判断する、
プログラム。 In the information processing device,
Backup method determination means for determining whether to use the file backup method or the RAW backup method as a method for backing up the data stored in the primary storage to the secondary storage;
A backup unit that backs up the data stored in the primary storage to the secondary storage using the backup method determined by the backup method determination unit,
The backup method determination means includes a time required for performing a backup in the file backup method based on data stored in the primary storage and data stored in the secondary storage, and the RAW backup method. Calculating the backup time difference, which is the difference between the time taken when the backup was performed at and determining the backup method used in the backup means based on the backup time difference,
program.
前記情報処理装置が、前記判断されたバックアップ方式を用いて、前記プライマリストレージに記憶されているデータを、前記セカンダリストレージにバックアップするバックアップ方法であって、
前記情報処理装置が、前記プライマリストレージに記憶されているデータと前記セカンダリストレージに記憶されているデータとに基づいて、前記ファイルバックアップ方式でバックアップを行った際にかかる時間と、前記RAWバックアップ方式でバックアップを行った際にかかる時間と、の差分であるバックアップ時間差分を算出して、当該バックアップ時間差分に基づいてバックアップに用いるバックアップ方式を判断する、
バックアップ方法。
The information processing device determines whether to use the file backup method or the RAW backup method as the method for backing up the data stored in the primary storage to the secondary storage,
The information processing apparatus is a backup method for backing up the data stored in the primary storage to the secondary storage using the determined backup method,
Based on the data stored in the primary storage and the data stored in the secondary storage, the information processing apparatus takes a time when the file backup method is performed, and the RAW backup method. calculates the time taken for the time of performing a backup, the backup time difference is a difference, to determine the backup method are use to bar Kkua' flop on the basis of the backup time difference,
Backup method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014077789A JP6384094B2 (en) | 2014-04-04 | 2014-04-04 | Storage system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014077789A JP6384094B2 (en) | 2014-04-04 | 2014-04-04 | Storage system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015200946A JP2015200946A (en) | 2015-11-12 |
JP6384094B2 true JP6384094B2 (en) | 2018-09-05 |
Family
ID=54552177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014077789A Active JP6384094B2 (en) | 2014-04-04 | 2014-04-04 | Storage system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6384094B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6888446B2 (en) * | 2017-07-10 | 2021-06-16 | 富士通株式会社 | Information processing device, deduplication rate identification method and deduplication rate identification program |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100359423B1 (en) * | 2002-01-04 | 2002-11-07 | Ncerti Co Ltd | Very high speed high capacity backup system and backup method thereof |
JP2005018233A (en) * | 2003-06-24 | 2005-01-20 | Fujitsu Ltd | Method for backing up data recorded in virtual storage medium, and backup device for data recorded in virtual storage medium |
JP2008299441A (en) * | 2007-05-29 | 2008-12-11 | Hitachi Ltd | Storage system and management method for data using it |
JP2009211132A (en) * | 2008-02-29 | 2009-09-17 | Hitachi Ltd | Storage system and data migration method |
JP5188538B2 (en) * | 2010-05-27 | 2013-04-24 | 株式会社日立製作所 | Computer system and restoration method |
-
2014
- 2014-04-04 JP JP2014077789A patent/JP6384094B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015200946A (en) | 2015-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10318181B2 (en) | System, method, and computer program product for increasing spare space in memory to extend a lifetime of the memory | |
JP6870246B2 (en) | Storage device and storage control device | |
CA2901668C (en) | Deduplication storage system with efficient reference updating and space reclamation | |
US9134914B1 (en) | Deduplication | |
JP5162701B2 (en) | Integrated deduplication system, data storage device, and server device | |
US8321384B2 (en) | Storage device, and program and method for controlling storage device | |
US9235535B1 (en) | Method and apparatus for reducing overheads of primary storage by transferring modified data in an out-of-order manner | |
JP6341307B1 (en) | Information processing device | |
US10176183B1 (en) | Method and apparatus for reducing overheads of primary storage while transferring modified data | |
JP6841024B2 (en) | Data processing equipment, data processing programs and data processing methods | |
KR20170023735A (en) | Methods and systems for improving storage journaling | |
JP5569074B2 (en) | Storage system | |
JP6805816B2 (en) | Information processing equipment, information processing system, information processing method and program | |
CN102999605A (en) | Method and device for optimizing data placement to reduce data fragments | |
US10169168B2 (en) | Metadata recovery for de-duplicated data | |
US8914325B2 (en) | Change tracking for multiphase deduplication | |
US8938641B2 (en) | Method and apparatus for synchronizing storage volumes | |
CN108255414B (en) | Solid state disk access method and device | |
JP6384094B2 (en) | Storage system | |
US20190056878A1 (en) | Storage control apparatus and computer-readable recording medium storing program therefor | |
KR20140131457A (en) | An Invalid Data Recycling Method for Improving I/O Performance in SSD-based Storage System | |
KR20150052402A (en) | A Unified De-duplication Method of Data and Parity Disks in SSD-based RAID Storage | |
KR101252375B1 (en) | Mapping management system and method for enhancing performance of deduplication in storage apparatus | |
US10789002B1 (en) | Hybrid data deduplication for elastic cloud storage devices | |
KR101932967B1 (en) | Method for flushing metadata in journaling file system and apparatus for writing data using the method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170301 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180109 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180306 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180710 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180723 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6384094 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |