JP2015514241A - ストレージ装置 - Google Patents
ストレージ装置 Download PDFInfo
- Publication number
- JP2015514241A JP2015514241A JP2014549265A JP2014549265A JP2015514241A JP 2015514241 A JP2015514241 A JP 2015514241A JP 2014549265 A JP2014549265 A JP 2014549265A JP 2014549265 A JP2014549265 A JP 2014549265A JP 2015514241 A JP2015514241 A JP 2015514241A
- Authority
- JP
- Japan
- Prior art keywords
- chunk
- container
- backup
- content
- universal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims description 153
- 230000008569 process Effects 0.000 claims description 122
- 238000012545 processing Methods 0.000 claims description 81
- 230000003068 static effect Effects 0.000 claims description 41
- 230000015654 memory Effects 0.000 description 79
- 238000005259 measurement Methods 0.000 description 52
- 230000006870 function Effects 0.000 description 22
- 238000007796 conventional method Methods 0.000 description 17
- 230000000694 effects Effects 0.000 description 7
- 238000007906 compression Methods 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 230000032683 aging Effects 0.000 description 4
- 238000013467 fragmentation Methods 0.000 description 4
- 238000006062 fragmentation reaction Methods 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004793 poor memory Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1448—Management of the data involved in backup or backup restore
- G06F11/1453—Management of the data involved in backup or backup restore using de-duplication of the data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1448—Management of the data involved in backup or backup restore
- G06F11/1451—Management of the data involved in backup or backup restore by selection of backup contents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1458—Management of the backup or restore process
- G06F11/1469—Backup restoration techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2365—Ensuring data consistency and integrity
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0608—Saving storage space on storage systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
- G06F3/064—Management of blocks
- G06F3/0641—De-duplication techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/067—Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/84—Using snapshots, i.e. a logical point-in-time copy of the data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Databases & Information Systems (AREA)
- Quality & Reliability (AREA)
- Data Mining & Analysis (AREA)
- Computer Security & Cryptography (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
(1−1)ストレージ装置に搭載する重複排除機能の概要
まず、本実施形態に係る重複排除機能の概要を説明する。実施形態に係るストレージ装置は、ネットワーク経由でホスト計算機に接続される。ストレージ装置は、データを記憶する記憶デバイスとして、例えば複数のハードディスク装置(HDD:Hard Disk Drive)を有する。ストレージ装置には、記憶デバイスにデータを格納する際にデータ量を削減する処理機能が搭載されている。データ量の削減には、例えばファイル圧縮処理(Compression)や重複排除処理(Deduplication)が用いられる。ファイル圧縮処理は、1ファイル内で同一内容のデータセグメントを縮約することにより、データ容量を削減する。一方、重複排除処理は、1ファイル内だけでなく、ファイル間で検出される同一内容のデータセグメントを縮約することにより、ファイルシステムやストレージシステムの総データ容量を削減する。
図1に、本実施形態に係るストレージ装置100のハードウェア構成を示す。図1に示すように、ストレージ装置100は、ネットワーク174を介して不図示のバックアップサーバその他の上位装置に接続されている。ネットワーク174は、例えばLAN(Local Area Network)、インターネット、公衆回線または専用回線などであってもよい。
1回目…1
2回目…0
3回目…1
4回目…0
5回目…0
1回目…10000000
2回目…01000000(右シフト+「0」付与)
3回目…10100000(右シフト+「1」付与)
4回目…01010000(右シフト+「0」付与)
5回目…00101000(右シフト+「0」付与)
本実施形態に係るバックアップ処理及びリストア処理の理解のために、まず、従来のバックアップ処理及びリストア処理について説明する。
従来手法を図2を用いて説明する。従来手法で用いるバックアッププログラム1450は、コンテンツf1(1460)、コンテンツf2(1470)及びコンテンツf3(1480)を到達順にバックアップする。因みに、コンテンツf1(1460)は第1世代のバックアップデータであり、コンテンツf2(1470)は第2世代のバックアップデータであり、コンテンツf3(1480)は第3世代のバックアップデータである。
図3を参照し、本実施形態に係るストレージ装置100によるバックアップ処理の概要を説明する。図2の場合と同様、バックアッププログラム150は、コンテンツf1(260)、コンテンツf2(270)及びコンテンツf3(280)を到着順にバックアップするものとする。因みに、コンテンツf1(260)が1番最初に到達し、コンテンツf2(270)が2番目に到達し、コンテンツf3(280)が3番目に到着するものとする。
図4Aを参照して、バックアップ処理時とリストア処理時の両方で使用されるコンテナ索引表T(110)の構成例とチャンク索引表U(162)の構成例を説明する。コンテナ索引表110は、コンテナ単位で作成されるテーブルである。また、チャンク索引表162は、コンテナに格納されるチャンクを管理するテーブルである。
Container/uuid-Cf…コンテナ本体
ContainerIndexIndex/uuid-Cf…コンテナ索引表データベース(テーブルTFを格納するファイル)
ChunkIndex/fp の上位Nbit…チャンク索引表データベース
Contents/uuid-Cf…コンテンツ索引表データベース
置に従ってコンテンツを再構成する。
図5に、バックアッププログラム150により実行されるバックアップ処理動作の詳細を示す。まず、バックアッププログラム150は、バックアップ対象のコンテンツをチャンクsi(i=1、2、…、n)に分解する(ステップS101)。
図6に、リストアプログラム152により実行されるリストア処理動作の詳細を示す。まず、リストアプログラム152は、コンテンツ索引表S(164)を参照し、読み込み対象であるコンテンツに含まれるチャンクsi(si=1、2、…、n)の情報を取得する(ステップS201)。具体的には、リストアプログラム152は、コンテンツ索引表164から、読み込む必要のあるチャンクsi のリストを作成する。
(1−4−1)普遍チャンクの定義
続いて、本実施形態に係る普遍コンテナCc(138)の構成方法について説明する。普遍コンテナ138は、普遍チャンクの集合として構成される。普遍チャンクは、コンテンツタイプ毎に必ず出現するチャンクであり、必ずしも普遍チャンクのアクセスが多いわけではない。従って、コンテンツ毎に1回しかアクセスされなくても、必ずアクセスされるチャンクは普遍チャンクである。
バックアッププログラム150は、計測表R(160)を使用して普遍チャンクを特定する。図7に、計測表160の具体的な構成を示す。計測表160は、メッセージダイジェスト300と、参照(reference)ビット302と、ni ビット310で構成される。メッセージダイジェスト300は、処理対象の特定に使用される。参照ビット302は、初期化時に「0」に更新され、登録されたメッセージダイジェスト300に参照があった場合に「1」に更新される。ni ビット310は、初期登録かどうかを示す。ni ビット310は、「0」に初期化され、初期登録でなくなった場合に「1」に更新される。
図8に、バックアッププログラム150により実行される普遍チャンク特定処理の詳細を示す。なお、本実施形態の場合、普遍チャンク特定処理は、本来のバックアップ処理(ストレージ装置の運用開始)に先立って実行される。
前述した普遍チャンク特定処理は、コンテンツのバックアップ開始前に、バックアッププログラム150を利用して実行される。また、バックアッププログラム150は、計測表160のメッセージダイジェスト300を利用し、普遍コンテナCc(138)と普遍コンテナ索引表Tc(128)を作成する。なお、普遍コンテナ138と普遍コンテナ索引表128は、普遍チャンク特定処理に伴って作成されたコンテナとコンテナ索引表を参照して作成される。普遍コンテナ138と普遍コンテナ索引表128の作成後、普遍チャンク特定処理に伴って作成されたチャンク索引表、コンテナ、コンテナ索引表はいずれも削除される。
以上説明したように、本実施形態に係るストレージ装置100は、普遍チャンクを集約的に管理する普遍コンテナ138と普遍コンテナ索引表128を用意する。普遍チャンク用のコンテナとその索引表を用意することにより、従来方式のように、普遍チャンクの属するコンテナに普遍チャンク以外のチャンクが混在したまま管理されることはない。このため、バックアップ処理時には、普遍チャンクに関する管理情報だけを集約した普遍コンテナ索引表128をメモリ104上に展開し、格納するチャンクが普遍チャンクか否かの判定に使用することができる。
に比して向上させることができる。
(2−1)ストレージ装置に搭載する重複排除機能の概要
まず、本実施形態に係る重複排除機能の概要について説明する。第1の実施形態では、バックアッププログラム150を利用して、コンテンツのバックアップ開始前に普遍コンテナCc(138)を作成し、ストレージ装置100によるバックアップ処理の運用開始後は、普遍チャンクの特定処理を実行しない場合について説明した。
本実施形態に係るストレージ装置100の機能構成は、バックアッププログラム150に設ける追加機能を除き、第1の実施形態と同様である。従って、詳細な説明は省略する。
本実施形態に係るバックアップ処理及びリストア処理は、第1の実施の形態とほぼ同様である。従って、詳細な説明は省略する。
本実施形態に係るバックアップ処理開始前の普遍コンテナの構成は、第1の実施形態と
同様である。従って、詳細な説明は省略する。
ここでは、バックアップ処理の開始後に普遍チャンクが特定された場合に、特定された
普遍チャンクを普遍コンテナに追加登録するための処理手順を説明する。
以上のように、本実施形態では、普遍チャンク特定処理をバックアップの運用開始後も適用し、バックアップ世代が進む度に新規な普遍チャンクの特定を可能にする。また、本実施形態では、使用されなくなった普遍チャンクを削除し、普遍コンテナ及び普遍コンテナ索引表が無限に増加することを回避する。これにより、バックアップ世代の変化に対応した普遍コンテナ及び普遍コンテナ索引表の運用が可能になる。
(3−1)ストレージ装置に搭載する重複排除機能の概要
まず、本実施形態に係る重複排除機能の概要を説明する。第2の実施形態に係るストレージ装置は、バックアッププログラム150が、運用開始前に普遍コンテナ138を作成するだけでなく、運用開始後も普遍チャンク特定処理を実行する。そして、第2の実施形態に係るバックアッププログラム150は、新たに特定された普遍チャンクを普遍コンテナに追加登録する一方、使用しない普遍チャンクを普遍コンテナから削除する。このように、第2の実施形態の場合、予め作成され登録されていた普遍チャンクが、普遍コンテナから事後的に削除される可能性がある。ところが、データベースは、通常、レコードの登録と削除を繰り返すことでフラグメンテーションが発生し、レコードの検索性能も登録性能も劣化する。
本実施形態に係るストレージ装置100の機能構成は、バックアッププログラム150に設ける追加機能を除き、第1の実施形態とほぼ同様である。従って、詳細な説明は省略する。
本実施形態に係るバックアップ処理及びリストア処理は、第1の実施の形態とほぼ同様である。従って、詳細な説明は省略する。
本実施形態の場合も、バックアップ処理開始前の普遍コンテナの構成は、第2の実施形態と同様である。従って、バックアップ処理開始前の普遍コンテナの構成についての詳細な説明は省略する。
ここでは、バックアップ処理開始後に普遍チャンクが新たに特定された場合に、特定された普遍チャンクを普遍コンテナに追加登録するための処理手順について説明する。
以上のように、本実施形態では、普遍チャンク特定処理をバックアップの運用開始後も適用し、バックアップ世代が進む度に新規に特定される普遍チャンクを動的普遍コンテナ524に登録し、使用されなくなった普遍チャンクを動的普遍コンテナ索引表514から削除する。これにより、静的普遍コンテナ522内の登録データが削除されることを回避することができ、データベースのフラグメンテーションによる性能劣化を回避することができる。
(4−1)ストレージ装置に搭載する重複排除機能の概要
まず、本実施形態に係る重複排除機能の概要を説明する。前述した第1、第2及び第3の実施形態では、バックアッププログラム150が、バックアップ世代毎に普遍チャンクを特定していた。通常、普遍チャンクは、ファイルフォーマットに依存し、コンテンツタイプ毎に存在する。
本実施形態に係るストレージ装置100の機能構成は、バックアッププログラム150に設ける追加機能を除き、第1の実施形態とほぼ同様である。従って、詳細な説明は省略する。
本実施形態に係るバックアップ処理及びリストア処理は、第1の実施の形態とほぼ同様である。従って、詳細な説明は省略する。
本実施形態の場合も、バックアップ処理の開始前には、コンテンツタイプ毎に計測表160を用意して普遍チャンクを特定し、特定された普遍チャンクを静的普遍コンテナに登録する点以外は、前述した実施形態と同様である。また、バックアップ処理の開始中には、コンテンツタイプ毎に計測表160を用いて普遍チャンクを特定し、特定された普遍チャンクを動的普遍コンテナに登録する点以外は、前述した実施形態と同様である。
図12に、コンテンツタイプ毎に普遍チャンクを特定するための処理手順を示す。バックアッププログラム150は、まず、バックアップ対象であるコンテンツ毎にそのコンテンツタイプを認識する(ステップS401)。このコンテンツタイプは、コンテンツのヘッダに格納されているマジックナンバーや拡張子などに基づいて認識することができる。なお、認識できなかったコンテンツタイプは1つのグループとして扱う。
以上のように、本実施形態では、普遍チャンク特定処理をコンテンツタイプ毎に適用する。このため、バックアップするコンテンツに複数のコンテンツタイプが混在している場合にも、コンテンツタイプ別の普遍チャンクを特定し、普遍コンテナおよびその索引表として管理することができる。このため、バックアップやリストアの実行時には、バックアップ対象であるコンテンツに必ず出現する普遍チャンクだけを格納する普遍コンテナとその索引表だけをメモリ上に展開することができる。すなわち、普遍チャンクの参照時以外にはほとんど参照されることがないコンテナ索引表やコンテナがメモリ上に展開される可能性を回避できる。この結果、バックアップ性能およびリストア性能を向上することができる。
(5−1)ストレージ装置に搭載する重複排除機能の概要
まず、本実施形態に係る重複排除機能の概要を説明する。前述した第4の実施形態では、バックアッププログラム150が、コンテンツタイプ毎の普遍チャンクの特定処理を静的にも動的にも実行する場合について説明した。しかし、コンテンツタイプは多数存在する。
本実施形態に係るストレージ装置100の機能構成は、バックアッププログラム150に設ける追加機能を除き、第1の実施形態とほぼ同様である。従って、詳細な説明は省略する。
本実施形態に係るバックアップ処理及びリストア処理は、第1の実施の形態とほぼ同様である。従って、詳細な説明は省略する。
本実施形態の場合も、バックアップ処理の開始前には、選択されたコンテンツタイプ毎に計測表160を用意して普遍チャンクを特定し、特定された普遍チャンクを静的普遍コンテナに登録する点以外は第4の実施形態と同じである。
以上のように、本実施形態では、普遍チャンク特定処理を指定されたコンテンツタイプについてのみ適用する。このため、考えられる又は出現する全てのコンテンツタイプについて、個別に普遍チャンク特定処理を実行する場合に比して処理負荷を抑制することができる。また、本実施形態の場合には、考えられる又は出現する全てのコンテンツタイプについて個別の計測表160を用意する必要がない。従って、コンテンツタイプを選択しない場合に比して、メモリの消費量を必要最低限に抑制することができる。また、考えられる又は出現する全てのファイルフォーマット毎に普遍チャンクを登録する場合には、静的普遍コンテナ、動的普遍コンテナおよびその索引表に、使用頻度の小さい普遍チャンクの登録が発生し、リソースの無駄でもある。しかし、本実施形態の場合には、選択されたコンテンツタイプについてのみ、静的普遍コンテナ、動的普遍コンテナおよびその索引表を生成し、管理することにより、バックアップ性能およびリストア性能を向上することができる。
前述の実施形態においては、各種処理機能の全体を制御する制御部としてプロセッサ102を適用する場合について説明した。しかし、本発明はこれに限らず、かかる制御部としての処理を実行するハードウェアやソフトウェアを、プロセッサ102とは別に用意してもよい。このような構成を採用する場合にも、前述の実施形態と同様の効果を実現することができる。
102 プロセッサ
104 メモリ
106 ディスク
108 ネットワークインタフェース
110 コンテナ索引表
112 コンテナ索引表
114 コンテナ索引表
118 普遍コンテナ索引表
138 普遍コンテナ
142 ライトバッファ
144 リードキャッシュ
150 バックアッププログラム
152 リストアプログラム
154 オペレーティングシステム
160 計測表
162 チャンク索引表
164 コンテンツ索引表
Claims (12)
- コンテンツのバックアップに使用されるストレージ装置において、
書き込み対象であるコンテンツから切り出されるチャンクのうちコンテンツタイプ毎に共通して出現する第1のチャンクの格納に使用する1つ又は複数の第1のコンテナと、第1のチャンク以外のチャンクの格納に使用する1つ又は複数の第2のコンテナの記憶領域を提供する記憶装置と、
書き込み対象であるコンテンツから切り出される各チャンクが、前記第1のコンテナに格納されたチャンクと重複する第1の重複チャンクか否かを判定し、第1の重複チャンクでないと判定されたチャンクについてのみ、各チャンクが前記第2のコンテナに格納されたチャンクと重複する第2の重複チャンクか否かを更に判定し、第2の重複チャンクでもないと判定されたチャンクだけを前記第2のコンテナに格納するバックアップ部と
を有するストレージ装置。 - 請求項1に記載のストレージ装置において、
前記バックアップ部は、処理対象とするチャンクと同一のチャンクが前記第1のコンテナ及び前記第2のコンテナのいずれにも存在しない場合には、チャンク索引表を参照して重複チャンクか否かを判定する
ことを特徴とするストレージ装置。 - 請求項2に記載のストレージ装置において、
前記バックアップ部は、コンテンツのバックアップ開始前に特定された第1のチャンクと、コンテンツのバックアップ開始後に特定された第1のチャンクを前記第1のコンテナに格納する
ことを特徴とするストレージ装置。 - 請求項3に記載のストレージ装置において、
前記バックアップ部は、コンテンツのバックアップ開始後における第1のチャンクの特定処理を、各コンテンツの書き込みと並行に実行する
ことを特徴とするストレージ装置。 - 請求項4に記載のストレージ装置において、
前記バックアップ部は、コンテンツのバックアップ開始前に特定された第1のチャンクの管理情報と、コンテンツのバックアップ開始後に特定された第1のチャンクの管理情報を第1のコンテナ索引表に格納する
ことを特徴とするストレージ装置。 - 請求項5に記載のストレージ装置において、
前記バックアップ部は、コンテンツのバックアップ開始前に特定された第1のチャンク
を第1の静的コンテナに格納する
ことを特徴とするストレージ装置。 - 請求項6に記載のストレージ装置において、
前記バックアップ部は、コンテンツのバックアップ開始前に特定された第1のチャンクの管理情報を第1の静的コンテナ索引表に格納し、コンテンツのバックアップ開始後に特定された第1のチャンクの管理情報を第1の動的コンテナ索引表に格納する
ことを特徴とするストレージ装置。 - 請求項7に記載のストレージ装置において、
前記バックアップ部は、コンテンツのバックアップ開始後、コンテンツのバックアップ開始前には前記第1のコンテナが作成されなかった全てのコンテンツタイプを対象に第1のチャンクの特定処理を実行し、特定された第1のチャンクの管理情報を前記第1の動的コンテナ索引表に格納する
ことを特徴とするストレージ装置。 - 請求項5に記載のストレージ装置において、
前記バックアップ部は、コンテンツのバックアップ開始前に事前に選択されたコンテンツタイプについて特定された第1のチャンクの管理情報を第1の静的コンテナ索引表に格納し、コンテンツのバックアップ開始後に前記選択されたコンテンツタイプについて特定された第1のチャンクの管理情報を第1の動的コンテナ索引表に格納する
ことを特徴とするストレージ装置。 - 請求項9に記載のストレージ装置において、
前記バックアップ部は、コンテンツのバックアップ開始前には選択されなかった全てのコンテンツタイプを対象に第1のチャンクの特定処理を実行し、コンテンツのバックアップ開始後に特定された前記第1のチャンクの管理情報を前記第1の動的コンテナ索引表に格納する
ことを特徴とするストレージ装置。 - 請求項10に記載のストレージ装置において、
前記バックアップ部は、コンテンツのバックアップ開始前に事前に選択されたコンテンツタイプについて特定された第1のチャンクを第1の静的コンテナに格納する
ことを特徴とするストレージ装置。 - 請求項9に記載のストレージ装置において、
前記バックアップ部は、操作画面上におけるオペレータの選択操作を通じて、第1のチャンクの特定処理を実行するコンテンツタイプの選択を受付ける
ことを特徴とするストレージ装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2012/002589 WO2013153584A1 (en) | 2012-04-13 | 2012-04-13 | Storage device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015514241A true JP2015514241A (ja) | 2015-05-18 |
JP5881859B2 JP5881859B2 (ja) | 2016-03-09 |
Family
ID=49326146
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014549265A Expired - Fee Related JP5881859B2 (ja) | 2012-04-13 | 2012-04-13 | ストレージ装置 |
Country Status (3)
Country | Link |
---|---|
US (2) | US9128616B2 (ja) |
JP (1) | JP5881859B2 (ja) |
WO (1) | WO2013153584A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114442917A (zh) * | 2020-11-06 | 2022-05-06 | 慧与发展有限责任合伙企业 | 包括跟踪数据结构的容器索引 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9766987B2 (en) * | 2013-01-11 | 2017-09-19 | Commvault Systems, Inc. | Table level database restore in a data storage system |
US9300748B2 (en) * | 2013-01-16 | 2016-03-29 | Cisco Technology, Inc. | Method for optimizing WAN traffic with efficient indexing scheme |
US9306997B2 (en) | 2013-01-16 | 2016-04-05 | Cisco Technology, Inc. | Method for optimizing WAN traffic with deduplicated storage |
US9509736B2 (en) | 2013-01-16 | 2016-11-29 | Cisco Technology, Inc. | Method for optimizing WAN traffic |
US9483494B1 (en) * | 2013-03-14 | 2016-11-01 | Emc Corporation | Opportunistic fragmentation repair |
US9798486B1 (en) * | 2013-12-18 | 2017-10-24 | EMC IP Holding Company LLC | Method and system for file system based replication of a deduplicated storage system |
US20160210306A1 (en) | 2015-01-15 | 2016-07-21 | Commvault Systems, Inc. | Managing structured data in a data storage system |
US10284593B1 (en) * | 2015-01-15 | 2019-05-07 | EMC IP Holding Company LLC | Protecting newly restored clients from computer viruses |
US10108687B2 (en) | 2015-01-21 | 2018-10-23 | Commvault Systems, Inc. | Database protection using block-level mapping |
US9904598B2 (en) | 2015-04-21 | 2018-02-27 | Commvault Systems, Inc. | Content-independent and database management system-independent synthetic full backup of a database based on snapshot technology |
US10387425B1 (en) * | 2016-06-30 | 2019-08-20 | EMC IP Holding Company LLC | Preserving temporal locality while multiplexing streams in a stream-informed segment layout (SISL) system |
US10318159B1 (en) * | 2017-06-14 | 2019-06-11 | EMC IP Holding Company LLC | Method and system for physical locality repair in a storage system |
US10349108B2 (en) | 2017-08-24 | 2019-07-09 | Mobitv, Inc. | System and method for storing multimedia files using an archive file format |
US11269732B2 (en) | 2019-03-12 | 2022-03-08 | Commvault Systems, Inc. | Managing structured data in a data storage system |
US11763021B2 (en) * | 2020-10-19 | 2023-09-19 | Duality Technologies, Inc. | Efficient secure string search using homomorphic encryption |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009205201A (ja) * | 2008-02-26 | 2009-09-10 | Kddi Corp | 重複排除技術を用いたデータバックアップ方法、記憶制御通信装置及びプログラム |
WO2010080591A2 (en) * | 2008-12-18 | 2010-07-15 | Sumooh Inc. | Methods and apparatus for content-aware data partitioning and data de-duplication |
JP2011510405A (ja) * | 2008-01-16 | 2011-03-31 | セパトン,インコーポレイテッド | 拡張可能な重複排除機構 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6813251B1 (en) * | 1999-07-27 | 2004-11-02 | Intel Corporation | Split Transaction protocol for a bus system |
US6928526B1 (en) | 2002-12-20 | 2005-08-09 | Datadomain, Inc. | Efficient data storage system |
WO2009117251A1 (en) * | 2008-03-19 | 2009-09-24 | Rambus Inc. | Optimizing storage of common patterns in flash memory |
US8190836B1 (en) * | 2008-04-30 | 2012-05-29 | Network Appliance, Inc. | Saving multiple snapshots without duplicating common blocks to protect the entire contents of a volume |
US8751462B2 (en) * | 2008-11-14 | 2014-06-10 | Emc Corporation | Delta compression after identity deduplication |
US8539179B1 (en) * | 2009-03-31 | 2013-09-17 | Symantec Corporation | Methods and systems for creating full backups |
US8051050B2 (en) * | 2009-07-16 | 2011-11-01 | Lsi Corporation | Block-level data de-duplication using thinly provisioned data storage volumes |
US9501365B2 (en) * | 2009-12-28 | 2016-11-22 | Netapp, Inc. | Cloud-based disaster recovery of backup data and metadata |
WO2012045023A2 (en) * | 2010-09-30 | 2012-04-05 | Commvault Systems, Inc. | Archiving data objects using secondary copies |
US9823981B2 (en) * | 2011-03-11 | 2017-11-21 | Microsoft Technology Licensing, Llc | Backup and restore strategies for data deduplication |
JP5682436B2 (ja) * | 2011-04-27 | 2015-03-11 | 富士通株式会社 | バックアッププログラム、情報処理装置、情報処理端末、バックアップ方法 |
US8930307B2 (en) * | 2011-09-30 | 2015-01-06 | Pure Storage, Inc. | Method for removing duplicate data from a storage array |
US8627026B2 (en) * | 2011-08-19 | 2014-01-07 | Hitachi, Ltd. | Storage apparatus and additional data writing method |
US20130054919A1 (en) * | 2011-08-30 | 2013-02-28 | International Business Machines Corporation | Methods and physical computer storage media for transferring de-duplicated data organized in virtual volumes to a target set of physical media |
WO2014068617A1 (en) * | 2012-10-31 | 2014-05-08 | Hitachi, Ltd. | Storage apparatus and method for controlling storage apparatus |
KR101505263B1 (ko) * | 2013-03-07 | 2015-03-24 | 포항공과대학교 산학협력단 | 데이터 중복 제거 방법 및 장치 |
-
2012
- 2012-04-13 JP JP2014549265A patent/JP5881859B2/ja not_active Expired - Fee Related
- 2012-04-13 US US13/508,583 patent/US9128616B2/en not_active Expired - Fee Related
- 2012-04-13 WO PCT/JP2012/002589 patent/WO2013153584A1/en active Application Filing
-
2015
- 2015-08-03 US US14/816,906 patent/US9223660B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011510405A (ja) * | 2008-01-16 | 2011-03-31 | セパトン,インコーポレイテッド | 拡張可能な重複排除機構 |
JP2009205201A (ja) * | 2008-02-26 | 2009-09-10 | Kddi Corp | 重複排除技術を用いたデータバックアップ方法、記憶制御通信装置及びプログラム |
WO2010080591A2 (en) * | 2008-12-18 | 2010-07-15 | Sumooh Inc. | Methods and apparatus for content-aware data partitioning and data de-duplication |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114442917A (zh) * | 2020-11-06 | 2022-05-06 | 慧与发展有限责任合伙企业 | 包括跟踪数据结构的容器索引 |
CN114442917B (zh) * | 2020-11-06 | 2023-11-07 | 慧与发展有限责任合伙企业 | 用于存储系统的方法、可读介质以及存储系统 |
Also Published As
Publication number | Publication date |
---|---|
US20150339199A1 (en) | 2015-11-26 |
US9128616B2 (en) | 2015-09-08 |
US9223660B2 (en) | 2015-12-29 |
WO2013153584A1 (en) | 2013-10-17 |
US20130275696A1 (en) | 2013-10-17 |
JP5881859B2 (ja) | 2016-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5881859B2 (ja) | ストレージ装置 | |
US20210157523A1 (en) | Storage system | |
US8627026B2 (en) | Storage apparatus and additional data writing method | |
JP5965541B2 (ja) | ストレージ装置及びストレージ装置の制御方法 | |
JP5878548B2 (ja) | 重複排除ストレージ・システム、その内部の合成バックアップを容易にする方法、及び、プログラム | |
US10599337B2 (en) | Method and device for writing data and acquiring data in a distributed storage system | |
US9720928B2 (en) | Removing overlapping ranges from a flat sorted data structure | |
US9740422B1 (en) | Version-based deduplication of incremental forever type backup | |
US9037541B2 (en) | Metadata for data storage array | |
US20190129971A1 (en) | Storage system and method of controlling storage system | |
US10936228B2 (en) | Providing data deduplication in a data storage system with parallelized computation of crypto-digests for blocks of host I/O data | |
US8850148B2 (en) | Data copy management for faster reads | |
US11144202B2 (en) | Volume management apparatus, volume management method, and volume management program | |
US11016676B2 (en) | Spot coalescing of distributed data concurrent with storage I/O operations | |
CN109496292A (zh) | 一种磁盘管理方法、磁盘管理装置及电子设备 | |
JP6089890B2 (ja) | ストレージ制御装置、ストレージ制御装置の制御方法およびストレージ制御装置の制御プログラム | |
US11288006B2 (en) | Storage system and volume copying method where changes to address conversion table is rolled back | |
US11860840B2 (en) | Update of deduplication fingerprint index in a cache memory | |
US11249666B2 (en) | Storage control apparatus | |
KR20210039212A (ko) | 블룸 필터를 이용한 효율적인 랜섬웨어 탐지 방법 및 시스템 | |
JP2006119822A (ja) | データベースの再編成方法、ストレージ装置及びストレージシステム | |
US12105972B2 (en) | Storage system and storage control method of data deduplication between virtual devices | |
CN117892297A (zh) | 具备勒索软件攻击检测功能的存储装置以及管理系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150924 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160119 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160202 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5881859 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |