JP2013514561A - ストレージシステム - Google Patents
ストレージシステム Download PDFInfo
- Publication number
- JP2013514561A JP2013514561A JP2012528165A JP2012528165A JP2013514561A JP 2013514561 A JP2013514561 A JP 2013514561A JP 2012528165 A JP2012528165 A JP 2012528165A JP 2012528165 A JP2012528165 A JP 2012528165A JP 2013514561 A JP2013514561 A JP 2013514561A
- Authority
- JP
- Japan
- Prior art keywords
- data
- storage device
- stored
- auxiliary storage
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
- G06F3/064—Management of blocks
- G06F3/0641—De-duplication techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/0802—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
- G06F12/0806—Multiuser, multiprocessor or multiprocessing cache systems
- G06F12/0811—Multiuser, multiprocessor or multiprocessing cache systems with multilevel cache hierarchies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0608—Saving storage space on storage systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0683—Plurality of storage devices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0683—Plurality of storage devices
- G06F3/0685—Hybrid storage combining heterogeneous device types, e.g. hierarchical storage, hybrid arrays
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【選択図】図20
Description
2.重複する内容の書込みの順序がオリジナルのチャンクの書込みの順序と同じであると仮定してプリフェッチを行う。さらにハッシュ値を、当初書き込まれた順序が反映された特別なファイルに保存しておく。これにより、順序が保存されている場合は、チャンクがシステム内に存在する場合の処理が早くなる。
RAMを使用する動作もあればディスクへのアクセスが必要な動作もあるため、検索動作のレイテンシが安定しない。レイテンシが数ミリ秒のディスクの読出しは、用途によっては十分ではない(例えばプライマリストレージ)。
重複する書込みがオリジナルの書込みと同じ順序で行われない場合、プリフェッチは事実上作業を停止し、スループットが数オーダーの規模で低下する。
記憶対象データを格納する第一補助記憶装置と、当該第一補助記憶装置よりもデータのアクセス速度が高速な第二補助記憶装置と、前記第一補助記憶装置及び前記第二補助記憶装置よりもデータのアクセス速度が高速な主記憶装置と、を備え、
記憶対象データを前記第一補助記憶装置に格納し、この記憶対象データの格納位置を当該記憶対象データのデータ内容に基づく特徴データを用いて管理すると共に、前記特徴データのデータ内容に基づくインデックスデータにて当該特徴データを参照するデータ管理部と、
新たに記憶する記憶対象データのデータ内容に基づく前記特徴データ及び当該特徴データのデータ内容に基づく前記インデックスデータを用いて、前記新たに記憶する記憶対象データと同一の記憶対象データが既に前記第一補助記憶装置に格納されているか否かを判定する重複判定部と、を備え、
前記データ管理部は、前記第一補助記憶装置に記憶した前記記憶対象データの前記特徴データを参照して当該特徴データに基づく前記インデックスデータを前記主記憶装置に記憶保持すると共に、前記主記憶装置に対して記憶保持された前記インデックスデータが予め設定された量に達した場合に、当該主記憶装置に記憶保持されている前記インデックスデータを前記第二補助記憶装置に記憶保持し、この第二補助記憶装置に記憶保持された前記インデックスデータを前記主記憶装置から削除する、
という構成をとる。
記憶対象データを格納する第一補助記憶装置と、当該第一補助記憶装置よりもデータのアクセス速度が高速な第二補助記憶装置と、前記第一補助記憶装置及び前記第二補助記憶装置よりもデータのアクセス速度が高速な主記憶装置と、を備えた情報処理装置に、
記憶対象データを前記第一補助記憶装置に格納し、この記憶対象データの格納位置を当該記憶対象データのデータ内容に基づく特徴データを用いて管理すると共に、前記特徴データのデータ内容に基づくインデックスデータにて当該特徴データを参照するデータ管理部と、
新たに記憶する記憶対象データのデータ内容に基づく前記特徴データ及び当該特徴データのデータ内容に基づく前記インデックスデータを用いて、前記新たに記憶する記憶対象データと同一の記憶対象データが既に前記第一補助記憶装置に格納されているか否かを判定する重複判定部と、を実現させると共に、
前記データ管理部は、前記第一補助記憶装置に記憶した前記記憶対象データの前記特徴データを参照して当該特徴データに基づく前記インデックスデータを前記主記憶装置に記憶保持すると共に、前記主記憶装置に対して記憶保持された前記インデックスデータが予め設定された量に達した場合に、当該主記憶装置に記憶保持されている前記インデックスデータを前記第二補助記憶装置に記憶保持し、この第二補助記憶装置に記憶保持された前記インデックスデータを前記主記憶装置から削除する、
ことを実現させるためのプログラムを記憶した記憶媒体である。
記憶対象データを格納する第一補助記憶装置と、当該第一補助記憶装置よりもデータのアクセス速度が高速な第二補助記憶装置と、前記第一補助記憶装置及び前記第二補助記憶装置よりもデータのアクセス速度が高速な主記憶装置と、を備えたストレージシステムにて、
記憶対象データを前記第一補助記憶装置に格納し、この記憶対象データの格納位置を当該記憶対象データのデータ内容に基づく特徴データを用いて管理すると共に、前記特徴データのデータ内容に基づくインデックスデータにて当該特徴データを参照することにより、記憶対象データを管理し、
新たに記憶する記憶対象データのデータ内容に基づく前記特徴データ及び当該特徴データのデータ内容に基づく前記インデックスデータを用いて、前記新たに記憶する記憶対象データと同一の記憶対象データが既に前記第一補助記憶装置に格納されているか否かを判定すると共に、
記憶対象データを管理する際に、前記第一補助記憶装置に記憶した前記記憶対象データの前記特徴データを参照して当該特徴データに基づく前記インデックスデータを前記主記憶装置に記憶保持すると共に、前記主記憶装置に対して記憶保持された前記インデックスデータが予め設定された量に達した場合に、当該主記憶装置に記憶保持されている前記インデックスデータを前記第二補助記憶装置に記憶保持し、この第二補助記憶装置に記憶保持された前記インデックスデータを前記主記憶装置から削除する、
という構成をとる。
本願では、フラッシュベースのSSD用に設計された重複検索構造であるソリッドステート重複排除インデックス(SolidStateDeduplicationIndex:SSDI)を提案する。本願で提案する解決策は、前述の欠点を解決し、順序が異なる重複排除にも有効であり、検索動作に安定性がありかつレイテンシが短く、RAMの消費が少ない。また、重複排除を検索するためにSSDに基づく別の構造を提案している最近の研究とは異なり、本願における設計はSSDの削除制限と書込み耐性についても考慮し、またこの解決策に必要なRAMの定量化を行っている。
重複識別構造をSSDに実装可能にするためには、毎秒十分な数の小さなランダムな読出しを行うことができるSSD装置を探す必要がある。SSD装置のその他の特徴は、本発明にとってはそれほど重要ではない。例えば停電耐性は必要ない。その理由は、データディスクに保存されている情報に基づいて構造を再構築することができると想定しているからである。さらに、本発明におけるシステムで使用するハードウェアの価格を抑えるため、この装置はかなり安価なものでなければならない。
ハッシュテーブルは、重複排除辞書とてして当然選択されるものである。データチャンクはそのハッシュ値によって識別されるため、データチャンクのハッシュ値はハッシュテーブルの鍵となる。各ハッシュテーブルのエントリには、1つのチャンクのメタデータ記録が保存される。チャンク毎に、少なくともそのハッシュ値(例えばSHA−1は20バイト、SHA−256は32バイト)とディスク上の場所を保存する必要があるため、各メタデータ記録は数十バイトを消費する。
ここでは、重複排除に関する性能の要件を満たすフラッシュベース構造であるソリッドステート重複排除インデックスについて説明する。この構造によると、上記段落で最後に述べた問題が解決されている。
チャンクが書込み時と同じ順序で読み込まれると、コンテナからの読出しも順次的になる。
システムによって保存されているチャンクの修正または同期の動作により、すべてのコンテナが一度に更新される(例えば、チャンクが削除済みとマークする、削除されたチャンクが占有している領域を再利用する、等)
近年のMLC NANDフラッシュの書込み耐性は、通常5k〜10kのプログラム削除サイクルが可能である。長年に渡り測定されたシステム寿命から考えると、ハッシュテーブルのスイープのために行われる書込みがフラッシュ装置の更新回数の上限に達しないようにするためには、RAM内にかなりの書込みキャッシュが必要となる。
(1)Kingstonの4GB ECCフルバッファRAMとIntelのX25−M SSD 80GBドライブとを比較
メモリの一部をSSDに搭載することで、書込みキャッシュに必要なメモリのサイズを削減することができる。RAM内の書込みキャッシュについては、等しいサイズのバッファをSSDに配置し、このバッファを使用することで、RAM内のキャッシュが一杯になった場合はRAM内のキャッシュのコンテンツを廃棄することができる。このようなバッファはハッシュテーブルとしても構成される。RAM内のキャッシュとそのバッファとの両方が一杯になった場合にのみスイープを実行する。メインハッシュテーブルのスイープ数を維持したい場合は、このようなバッファを追加することでRAM内のキャッシュサイズを半分に減らすことができる。残念ながら、現在は各検索動作でのSSD上のバッファを確認する必要がある。
1.1つの書込みキャッシュがRAM内に保存され、lエントリを上限として保存することができる。
2.SSD上のn2の書込みキャッシュを上限として、各々がlエントリを保存し、各々がブルームフィルタを含む。
3.SSD上のn3の書込みキャッシュを上限として、各々がl(n2+1)エントリを保存し、ブルームフィルタは含まない。
様々な書込みキャッシュ構成の比較を、図6に示す。比較対象のすべての構成はk個のエントリを保存することを目的としている。偽陽性率1%のブルームフィルタを使用すると仮定する。ファクタα(alpha)は、書込みキャッシュ負荷率のオーバーヘッドを含む、1つの書込みキャッシュメタデータ記録(またはハッシュテーブルメタデータ記録)の保存に必要な領域である。
重複排除ストレージシステムからデータを削除することは重要な問題である。重複排除機能があるため、ユーザが削除を望むチャンクを本当にシステムから削除すべきかどうか判断することは難しい。そのため、システムはそのチャンクを直ちに削除せず、マークアンドスイープのガーベジコレクションと同様に、データチャンクを構築してオフライン処理として削除を実施する。削除処理はシステム全体に影響を与え、新たなシステム状態を計算するため、事実上、新たなバージョンのコンテナが計算される。ソリッドステート重複排除インデックスからエントリを削除する設計は、このアプローチにうまく適合する。
様々な解決策について、2ラックユニットボックスに搭載されるシステムを対象とすると仮定して評価する。これらのシステムは通常、DataDomain DD630またはNEC HYDRAstor HS3−210と同様に、データ記憶装置用に12台の1TBディスクを搭載している。
DataDomain(DD)システム(非特許文献1):偽陽性率0.3%のブルームフィルタ(2.3GBのRAM)でチャンクがシステム内に存在しない場合の処理を高速化し、ストリームプリフェッチ(1GBのRAM)でチャンクがシステム内に存在する場合の処理を高速化する。この解決策については第1章で詳しく述べた。
MicrosoftのChunkStash(CS)(非特許文献3):cuckooハッシュテーブル(1GBのRAM)とストリームプリフェッチ(1GBのRAM)を使用。SSDIと同様に、CSは辞書構造をハッシュテーブルとコンテナのメタデータを持つファイル(我々の解決策でのメタデータファイルに匹敵)に分割する。ハッシュテーブルをRAMに保存し、メタデータファイルをSSDに保存する。ハッシュテーブルのサイズを削減するためにcuckooハッシュを使用し(通常のハッシュよりも高負荷率が可能)、テーブルエントリはメタデータファイルの識別子のみを含む(ファイル内の正確なオフセットについては不明)。150億チャンク用のハッシュテーブルは約10GBのメモリを消費する(エントリサイズは6バイト)。
ソリッドステート重複排除インデックス(SSDI):ストリームプリフェッチを使用せず、メモリ内にすべての書込みキャッシュを保存する(4GBのRAM、SSDには書込みキャッシュなし)。
ソリッドステート重複排除インデックス(3階層SSDI):3階層の書込みキャッシュを使用し、n2=4、n3=2(0.4GBのRAM、約4GBのSSD)。ストリームプリフェッチは使用しない。
(3)CSはメタデータファイルのオフセットを保存しないため、DD/SSDIよりも小さなメタデータファイルを使用して読出し要求サイズを縮小する。
(4)これは楽観的な推測である。フラッシュのチャンクサイズが大きいとレイテンシも大きくなり、バックアップアプリケーションにとっては厄介である。
最初の実験では、各解決策について次の2つのテストを実行した。
新規(fresh)書込み(重複0%)
重複書込み(重複100%、ランダムな順序の重複)
その結果を図7に示す。新規書込みについては、SSDIはDDおよびCSよりもわずかに良い結果となった。その理由は、SSDIではデータチャンクのコンテナファイルへの書込みによってディスクがほぼ完全に使用されているためである(図8参照)。DDはディスク常駐型ハッシュテーブルからの読出しにもディスクを使用してブルームフィルタの偽陽性に対応するが、CSはより小さなサイズのコンテナのメタデータファイルを実行するため、それらを書き込むためのディスクの使用が増加する。なお、我々の実験で測定されたDDに関する書込み性能は、上記(1)で述べたDD630システムの書込み性能(1.1TB/時、つまり320MB/秒)とほぼ確実に一致する。
2番目の実験は、SSDIへのメモリ内ストリームプリフェッチの実装が実現可能かどうかを判定するために行った。実際のバックアップからのデータを用いて、ストリームプリフェッチサイズが性能に与える影響を推測した。プリフェッチに保存するハッシュの数を、システム内に格納される全ハッシュの0.05%〜4%に制限した(32バイトのハッシュと仮定すると、RAM消費は375MBから3GBに相当する)。この実験は、解決策がビジネスに利用できるかどうかを評価するものである。したがって、メモリ消費が多大なCSとSSDIは競争力がないため除外することに決定し、DDと3階層SSDIのみについて検討する(CSは約10GBのRAMが必要、SSDIは約4GB。これは400MBしか必要としない3階層SSDIより多く、またDDは2.3GB必要だが、より小さなブルームフィルタを使用すれば実質的に削減することができる)。
Wikipedia:Wikipediaの5ヶ月分の月次バックアップで、各バックアップは約25GB、最後のバックアップでは40.9%が重複。
Mailboxes:ソフトウェア開発会社に勤務する従業員の約50のメールボックスの、32日分の日次バックアップ。各バックアップは約34GB、最後のバックアップでは94%が重複。
Homedirs: IT研究所に勤務する従業員約100人のホームディレクトリの、14週分の週次バックアップ。各バックアップは約78GBで、最後のバックアップでは98.6%が重複。
様々な解決策のコストを比較するために、RAM価格は$31.25/GB(Kingstonの4GB ECC、フルバッファRAMが$125であることに基づく)、SSD価格は$2.75/GB(IntelのX25−M SSD 80GBドライブが$220であることに基づく)と仮定した。この結果を図10に示す。我々はストリームプリフェッチなしの解決策を比較する。3階層SSDIはCSに比べて約1/2の価格だが、DDよりは約4倍高い。これは残念なことのように思われるが、3階層SSDIはDDよりもはるかにパフォーマンスが良く、SSDはRAMよりもはるかに早いスピードで価格が低下している。我々は、3階層SSDIおよびCSの全体的なコストが数年で一致すると予想している。
インライン重複排除を高速化するためにフラッシュメモリを使用するアイデアは、ChunkStash(CS)(非特許文献3)に記載されている。CSについては上記で説明したが、我々の解決策よりもはるかに多くのメモリを消費し、ランダムな重複に関するパフォーマンスは我々のものよりもはるかに悪い。この文献の著者は、ハッシュテーブル内にチャンクの断片のみを保存することでハッシュテーブルのサイズを削減できる可能性があるとしているが、これは重複排除機能の信頼性を損なうことを意味する。
本願における研究により、2つの商用フラッシュベースSSDを持つ2Uサーバを使用すれば、インライン重複排除時にディスクがボトルネックになる問題を解決できることがわかった。SSDIと3階層SSDIによって達成された結果には期待が持てる。さらに、より多くのSSDドライブ、または1秒当たりのランダムな読出しを増やすことができるフラッシュベースの装置を使用し、提案した解決策とストリームプリフェッチを組み合わせることで、より優れたパフォーマンスが得られる可能性もある。
本発明の第2の実施形態を、図12乃至図19を参照して説明する。図12は、システム全体の構成を示すブロック図である。図13は、ストレージシステムの概略を示すブロック図であり、図14は、構成を示す機能ブロック図である。図15乃至図19は、ストレージシステムの動作を説明するための説明図である。
上記実施形態の一部又は全部は、以下の付記のようにも記載されうる。以下、本発明におけるストレージシステム100(図20参照)、プログラムを記憶した記憶媒体、データ管理方法の構成の概略を説明する。但し、本発明は、以下の構成に限定されない。
記憶対象データを格納する第一補助記憶装置113と、当該第一補助記憶装置よりもデータのアクセス速度が高速な第二補助記憶装置112と、前記第一補助記憶装置及び前記第二補助記憶装置よりもデータのアクセス速度が高速な主記憶装置111と、を備え、
記憶対象データを前記第一補助記憶装置に格納し、この記憶対象データの格納位置を当該記憶対象データのデータ内容に基づく特徴データを用いて管理すると共に、前記特徴データのデータ内容に基づくインデックスデータにて当該特徴データを参照するデータ管理部101と、
新たに記憶する記憶対象データのデータ内容に基づく前記特徴データ及び当該特徴データのデータ内容に基づく前記インデックスデータを用いて、前記新たに記憶する記憶対象データと同一の記憶対象データが既に前記第一補助記憶装置に格納されているか否かを判定する重複判定部102と、を備え、
前記データ管理部101は、前記第一補助記憶装置に記憶した前記記憶対象データの前記特徴データを参照して当該特徴データに基づく前記インデックスデータを前記主記憶装置に記憶保持すると共に、前記主記憶装置に対して記憶保持された前記インデックスデータが予め設定された量に達した場合に、当該主記憶装置に記憶保持されている前記インデックスデータを前記第二補助記憶装置に記憶保持し、この第二補助記憶装置に記憶保持された前記インデックスデータを前記主記憶装置から削除する、
ストレージシステム100。
付記1に記載のストレージシステムであって、
前記データ管理部は、前記第二補助記憶装置に記憶保持された前記インデックスデータが予め設定された量に達した場合に、当該第二補助記憶装置に記憶保持されている複数単位の前記インデックスデータを結合して当該第二補助記憶装置に記憶保持し直すと共に、結合される前の前記インデックスデータを前記第二補助記憶装置から削除する、
ストレージシステム。
付記2に記載のストレージシステムであって、
前記データ管理部は、前記第二補助記憶装置に記憶保持されている前記複数単位のインデックスデータと前記主記憶装置に記憶保持されている前記インデックスデータとを結合して前記第二補助記憶装置に記憶保持し直すと共に、結合される前の前記インデックスデータを前記第二補助記憶装置及び前記主記憶装置から削除する、
ストレージシステム。
付記2に記載のストレージシステムであって、
前記データ管理部は、前記第二補助記憶装置に記憶された前記インデックスデータが存在するか否かを判定するために用いられる当該インデックスデータのデータ内容に基づく要素データを、前記主記憶装置に記憶する、
ストレージシステム。
付記4に記載のストレージシステムであって、
前記データ管理部は、前記第二補助記憶装置に記憶された前記インデックスデータをまとめて当該第二補助記憶装置に記憶し直す際に、前記主記憶装置に記憶された前記インデックスデータの前記要素データを解放する、
ストレージシステム。
付記1に記載のストレージシステムであって、
前記第一補助記憶装置はハードディスクドライブであり、前記第二補助記憶装置はSSD(Solid State Drive)である、
ストレージシステム。
記憶対象データを格納する第一補助記憶装置と、当該第一補助記憶装置よりもデータのアクセス速度が高速な第二補助記憶装置と、前記第一補助記憶装置及び前記第二補助記憶装置よりもデータのアクセス速度が高速な主記憶装置と、を備えた情報処理装置に、
記憶対象データを前記第一補助記憶装置に格納し、この記憶対象データの格納位置を当該記憶対象データのデータ内容に基づく特徴データを用いて管理すると共に、前記特徴データのデータ内容に基づくインデックスデータにて当該特徴データを参照するデータ管理部と、
新たに記憶する記憶対象データのデータ内容に基づく前記特徴データ及び当該特徴データのデータ内容に基づく前記インデックスデータを用いて、前記新たに記憶する記憶対象データと同一の記憶対象データが既に前記第一補助記憶装置に格納されているか否かを判定する重複判定部と、を実現させると共に、
前記データ管理部は、前記第一補助記憶装置に記憶した前記記憶対象データの前記特徴データを参照して当該特徴データに基づく前記インデックスデータを前記主記憶装置に記憶保持すると共に、前記主記憶装置に対して記憶保持された前記インデックスデータが予め設定された量に達した場合に、当該主記憶装置に記憶保持されている前記インデックスデータを前記第二補助記憶装置に記憶保持し、この第二補助記憶装置に記憶保持された前記インデックスデータを前記主記憶装置から削除する、
ことを実現させるためのプログラムを記憶した記憶媒体。
付記7に記載のプログラムを記憶した記憶媒体であって、
前記データ管理部は、前記第二補助記憶装置に記憶保持された前記インデックスデータが予め設定された量に達した場合に、当該第二補助記憶装置に記憶保持されている複数単位の前記インデックスデータを結合して当該第二補助記憶装置に記憶保持し直すと共に、結合される前の前記インデックスデータを前記第二補助記憶装置から削除する、
プログラムを記憶した記憶媒体。
記憶対象データを格納する第一補助記憶装置と、当該第一補助記憶装置よりもデータのアクセス速度が高速な第二補助記憶装置と、前記第一補助記憶装置及び前記第二補助記憶装置よりもデータのアクセス速度が高速な主記憶装置と、を備えたストレージシステムにて、
記憶対象データを前記第一補助記憶装置に格納し、この記憶対象データの格納位置を当該記憶対象データのデータ内容に基づく特徴データを用いて管理すると共に、前記特徴データのデータ内容に基づくインデックスデータにて当該特徴データを参照することにより、記憶対象データを管理し、
新たに記憶する記憶対象データのデータ内容に基づく前記特徴データ及び当該特徴データのデータ内容に基づく前記インデックスデータを用いて、前記新たに記憶する記憶対象データと同一の記憶対象データが既に前記第一補助記憶装置に格納されているか否かを判定すると共に、
記憶対象データを管理する際に、前記第一補助記憶装置に記憶した前記記憶対象データの前記特徴データを参照して当該特徴データに基づく前記インデックスデータを前記主記憶装置に記憶保持すると共に、前記主記憶装置に対して記憶保持された前記インデックスデータが予め設定された量に達した場合に、当該主記憶装置に記憶保持されている前記インデックスデータを前記第二補助記憶装置に記憶保持し、この第二補助記憶装置に記憶保持された前記インデックスデータを前記主記憶装置から削除する、
データ管理方法。
付記9に記載のデータ管理方法であって、
記憶対象データを管理する際に、前記第二補助記憶装置に記憶保持された前記インデックスデータが予め設定された量に達した場合に、当該第二補助記憶装置に記憶保持されている複数単位の前記インデックスデータを結合して当該第二補助記憶装置に記憶保持し直すと共に、結合される前の前記インデックスデータを前記第二補助記憶装置から削除する、
データ管理方法。
Claims (10)
- 記憶対象データを格納する第一補助記憶装置と、当該第一補助記憶装置よりもデータのアクセス速度が高速な第二補助記憶装置と、前記第一補助記憶装置及び前記第二補助記憶装置よりもデータのアクセス速度が高速な主記憶装置と、を備え、
記憶対象データを前記第一補助記憶装置に格納し、この記憶対象データの格納位置を当該記憶対象データのデータ内容に基づく特徴データを用いて管理すると共に、前記特徴データのデータ内容に基づくインデックスデータにて当該特徴データを参照するデータ管理部と、
新たに記憶する記憶対象データのデータ内容に基づく前記特徴データ及び当該特徴データのデータ内容に基づく前記インデックスデータを用いて、前記新たに記憶する記憶対象データと同一の記憶対象データが既に前記第一補助記憶装置に格納されているか否かを判定する重複判定部と、を備え、
前記データ管理部は、前記第一補助記憶装置に記憶した前記記憶対象データの前記特徴データを参照して当該特徴データに基づく前記インデックスデータを前記主記憶装置に記憶保持すると共に、前記主記憶装置に対して記憶保持された前記インデックスデータが予め設定された量に達した場合に、当該主記憶装置に記憶保持されている前記インデックスデータを前記第二補助記憶装置に記憶保持し、この第二補助記憶装置に記憶保持された前記インデックスデータを前記主記憶装置から削除する、
ストレージシステム。 - 請求項1に記載のストレージシステムであって、
前記データ管理部は、前記第二補助記憶装置に記憶保持された前記インデックスデータが予め設定された量に達した場合に、当該第二補助記憶装置に記憶保持されている複数単位の前記インデックスデータを結合して当該第二補助記憶装置に記憶保持し直すと共に、結合される前の前記インデックスデータを前記第二補助記憶装置から削除する、
ストレージシステム。 - 請求項2に記載のストレージシステムであって、
前記データ管理部は、前記第二補助記憶装置に記憶保持されている前記複数単位のインデックスデータと前記主記憶装置に記憶保持されている前記インデックスデータとを結合して前記第二補助記憶装置に記憶保持し直すと共に、結合される前の前記インデックスデータを前記第二補助記憶装置及び前記主記憶装置から削除する、
ストレージシステム。 - 請求項2に記載のストレージシステムであって、
前記データ管理部は、前記第二補助記憶装置に記憶された前記インデックスデータが存在するか否かを判定するために用いられる当該インデックスデータのデータ内容に基づく要素データを、前記主記憶装置に記憶する、
ストレージシステム。 - 請求項4に記載のストレージシステムであって、
前記データ管理部は、前記第二補助記憶装置に記憶された前記インデックスデータをまとめて当該第二補助記憶装置に記憶し直す際に、前記主記憶装置に記憶された前記インデックスデータの前記要素データを解放する、
ストレージシステム。 - 請求項1に記載のストレージシステムであって、
前記第一補助記憶装置はハードディスクドライブであり、前記第二補助記憶装置はSSD(Solid State Drive)である、
ストレージシステム。 - 記憶対象データを格納する第一補助記憶装置と、当該第一補助記憶装置よりもデータのアクセス速度が高速な第二補助記憶装置と、前記第一補助記憶装置及び前記第二補助記憶装置よりもデータのアクセス速度が高速な主記憶装置と、を備えた情報処理装置に、
記憶対象データを前記第一補助記憶装置に格納し、この記憶対象データの格納位置を当該記憶対象データのデータ内容に基づく特徴データを用いて管理すると共に、前記特徴データのデータ内容に基づくインデックスデータにて当該特徴データを参照するデータ管理部と、
新たに記憶する記憶対象データのデータ内容に基づく前記特徴データ及び当該特徴データのデータ内容に基づく前記インデックスデータを用いて、前記新たに記憶する記憶対象データと同一の記憶対象データが既に前記第一補助記憶装置に格納されているか否かを判定する重複判定部と、を実現させると共に、
前記データ管理部は、前記第一補助記憶装置に記憶した前記記憶対象データの前記特徴データを参照して当該特徴データに基づく前記インデックスデータを前記主記憶装置に記憶保持すると共に、前記主記憶装置に対して記憶保持された前記インデックスデータが予め設定された量に達した場合に、当該主記憶装置に記憶保持されている前記インデックスデータを前記第二補助記憶装置に記憶保持し、この第二補助記憶装置に記憶保持された前記インデックスデータを前記主記憶装置から削除する、
ことを実現させるためのプログラムを記憶した記憶媒体。 - 請求項7に記載のプログラムを記憶した記憶媒体であって、
前記データ管理部は、前記第二補助記憶装置に記憶保持された前記インデックスデータが予め設定された量に達した場合に、当該第二補助記憶装置に記憶保持されている複数単位の前記インデックスデータを結合して当該第二補助記憶装置に記憶保持し直すと共に、結合される前の前記インデックスデータを前記第二補助記憶装置から削除する、
プログラムを記憶した記憶媒体。 - 記憶対象データを格納する第一補助記憶装置と、当該第一補助記憶装置よりもデータのアクセス速度が高速な第二補助記憶装置と、前記第一補助記憶装置及び前記第二補助記憶装置よりもデータのアクセス速度が高速な主記憶装置と、を備えたストレージシステムにて、
記憶対象データを前記第一補助記憶装置に格納し、この記憶対象データの格納位置を当該記憶対象データのデータ内容に基づく特徴データを用いて管理すると共に、前記特徴データのデータ内容に基づくインデックスデータにて当該特徴データを参照することにより、記憶対象データを管理し、
新たに記憶する記憶対象データのデータ内容に基づく前記特徴データ及び当該特徴データのデータ内容に基づく前記インデックスデータを用いて、前記新たに記憶する記憶対象データと同一の記憶対象データが既に前記第一補助記憶装置に格納されているか否かを判定すると共に、
記憶対象データを管理する際に、前記第一補助記憶装置に記憶した前記記憶対象データの前記特徴データを参照して当該特徴データに基づく前記インデックスデータを前記主記憶装置に記憶保持すると共に、前記主記憶装置に対して記憶保持された前記インデックスデータが予め設定された量に達した場合に、当該主記憶装置に記憶保持されている前記インデックスデータを前記第二補助記憶装置に記憶保持し、この第二補助記憶装置に記憶保持された前記インデックスデータを前記主記憶装置から削除する、
データ管理方法。 - 請求項9に記載のデータ管理方法であって、
記憶対象データを管理する際に、前記第二補助記憶装置に記憶保持された前記インデックスデータが予め設定された量に達した場合に、当該第二補助記憶装置に記憶保持されている複数単位の前記インデックスデータを結合して当該第二補助記憶装置に記憶保持し直すと共に、結合される前の前記インデックスデータを前記第二補助記憶装置から削除する、
データ管理方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US38116110P | 2010-09-09 | 2010-09-09 | |
US61/381,161 | 2010-09-09 | ||
PCT/JP2011/004722 WO2012032727A1 (en) | 2010-09-09 | 2011-08-25 | Storage system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013514561A true JP2013514561A (ja) | 2013-04-25 |
JP5445682B2 JP5445682B2 (ja) | 2014-03-19 |
Family
ID=45810339
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012528165A Active JP5445682B2 (ja) | 2010-09-09 | 2011-08-25 | ストレージシステム |
Country Status (6)
Country | Link |
---|---|
US (1) | US8924663B2 (ja) |
EP (1) | EP2614439A4 (ja) |
JP (1) | JP5445682B2 (ja) |
CN (1) | CN103080910B (ja) |
CA (1) | CA2810991C (ja) |
WO (1) | WO2012032727A1 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015145532A1 (ja) * | 2014-03-24 | 2015-10-01 | 株式会社日立製作所 | ストレージシステム及びデータ処理方法 |
WO2015198371A1 (ja) * | 2014-06-23 | 2015-12-30 | 株式会社日立製作所 | ストレージシステム及び記憶制御方法 |
WO2017061022A1 (ja) * | 2015-10-09 | 2017-04-13 | 株式会社日立製作所 | データを重複排除するシステム |
JP2017134560A (ja) * | 2016-01-27 | 2017-08-03 | 日本電信電話株式会社 | データ操作方法とデータ操作方法プログラム |
Families Citing this family (67)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5459388B2 (ja) * | 2010-03-04 | 2014-04-02 | 日本電気株式会社 | ストレージ装置 |
US10394757B2 (en) * | 2010-11-18 | 2019-08-27 | Microsoft Technology Licensing, Llc | Scalable chunk store for data deduplication |
JP5762878B2 (ja) * | 2011-08-08 | 2015-08-12 | 株式会社東芝 | key−valueストアを有するメモリシステム |
JP5524144B2 (ja) * | 2011-08-08 | 2014-06-18 | 株式会社東芝 | key−valueストア方式を有するメモリシステム |
US8990171B2 (en) * | 2011-09-01 | 2015-03-24 | Microsoft Corporation | Optimization of a partially deduplicated file |
US20130173853A1 (en) * | 2011-09-26 | 2013-07-04 | Nec Laboratories America, Inc. | Memory-efficient caching methods and systems |
US9389965B1 (en) | 2012-03-12 | 2016-07-12 | Emc Corporation | System and method for improving performance of backup storage system with future access prediction |
US20130311433A1 (en) * | 2012-05-17 | 2013-11-21 | Akamai Technologies, Inc. | Stream-based data deduplication in a multi-tenant shared infrastructure using asynchronous data dictionaries |
US9189408B1 (en) | 2012-08-31 | 2015-11-17 | Emc Corporation | System and method of offline annotation of future accesses for improving performance of backup storage system |
CN103678405B (zh) * | 2012-09-21 | 2016-12-21 | 阿里巴巴集团控股有限公司 | 邮件索引建立方法及系统、邮件搜索方法及系统 |
CN103729304B (zh) * | 2012-10-11 | 2017-03-15 | 腾讯科技(深圳)有限公司 | 数据处理方法及装置 |
US9015212B2 (en) * | 2012-10-16 | 2015-04-21 | Rackspace Us, Inc. | System and method for exposing cloud stored data to a content delivery network |
CN103403709B (zh) * | 2012-11-15 | 2016-10-05 | 华为技术有限公司 | 一种数据读写的方法、装置和系统 |
FI124397B (en) * | 2013-01-04 | 2014-08-15 | Tellabs Oy | A method and apparatus for defining a paging system for a network element of a software configurable network |
US9300748B2 (en) * | 2013-01-16 | 2016-03-29 | Cisco Technology, Inc. | Method for optimizing WAN traffic with efficient indexing scheme |
US9509736B2 (en) | 2013-01-16 | 2016-11-29 | Cisco Technology, Inc. | Method for optimizing WAN traffic |
US9306997B2 (en) | 2013-01-16 | 2016-04-05 | Cisco Technology, Inc. | Method for optimizing WAN traffic with deduplicated storage |
US9547662B2 (en) | 2013-03-15 | 2017-01-17 | International Business Machines Corporation | Digest retrieval based on similarity search in data deduplication |
US9678975B2 (en) * | 2013-03-15 | 2017-06-13 | International Business Machines Corporation | Reducing digest storage consumption in a data deduplication system |
US9116941B2 (en) | 2013-03-15 | 2015-08-25 | International Business Machines Corporation | Reducing digest storage consumption by tracking similarity elements in a data deduplication system |
US9244937B2 (en) * | 2013-03-15 | 2016-01-26 | International Business Machines Corporation | Efficient calculation of similarity search values and digest block boundaries for data deduplication |
US9679007B1 (en) * | 2013-03-15 | 2017-06-13 | Veritas Technologies Llc | Techniques for managing references to containers |
WO2014155653A1 (ja) * | 2013-03-29 | 2014-10-02 | 株式会社日立製作所 | データ重複検出システムおよびデータ重複検出システムの制御方法 |
CN105324765B (zh) | 2013-05-16 | 2019-11-08 | 慧与发展有限责任合伙企业 | 选择用于去重复数据的存储区 |
WO2014185918A1 (en) * | 2013-05-16 | 2014-11-20 | Hewlett-Packard Development Company, L.P. | Selecting a store for deduplicated data |
US9225691B1 (en) * | 2013-09-27 | 2015-12-29 | Emc Corporation | Deduplication of encrypted dataset on datadomain backup appliance |
US9740714B2 (en) | 2014-02-06 | 2017-08-22 | International Business Machines Corporation | Multilevel filters for cache-efficient access |
WO2015125765A1 (ja) * | 2014-02-18 | 2015-08-27 | 日本電信電話株式会社 | セキュリティ装置、その方法、およびプログラム |
US10242020B2 (en) * | 2014-06-17 | 2019-03-26 | International Business Machines Corporation | Placement of data fragments generated by an erasure code in distributed computational devices based on a deduplication factor |
US9940356B2 (en) * | 2014-07-31 | 2018-04-10 | International Business Machines Corporation | Efficient join-filters for parallel processing |
CN104408069A (zh) * | 2014-10-30 | 2015-03-11 | 浪潮电子信息产业股份有限公司 | 一种基于布隆过滤器思想的一致性目录设计方法 |
CN104408373A (zh) * | 2014-12-11 | 2015-03-11 | 无锡江南计算技术研究所 | 用于细颗粒度污点分析的污染属性存储方法 |
US11113237B1 (en) | 2014-12-30 | 2021-09-07 | EMC IP Holding Company LLC | Solid state cache index for a deduplicate storage system |
US10204002B1 (en) | 2014-12-30 | 2019-02-12 | EMC IP Holding Company LLC | Method for maintaining a cache index on a deduplicated storage system |
US10503717B1 (en) * | 2014-12-30 | 2019-12-10 | EMC IP Holding Company LLC | Method for locating data on a deduplicated storage system using a SSD cache index |
US10175894B1 (en) | 2014-12-30 | 2019-01-08 | EMC IP Holding Company LLC | Method for populating a cache index on a deduplicated storage system |
US10248677B1 (en) | 2014-12-30 | 2019-04-02 | EMC IP Holding Company LLC | Scaling an SSD index on a deduplicated storage system |
US10289307B1 (en) | 2014-12-30 | 2019-05-14 | EMC IP Holding Company LLC | Method for handling block errors on a deduplicated storage system |
US9798793B1 (en) | 2014-12-30 | 2017-10-24 | EMC IP Holding Company LLC | Method for recovering an index on a deduplicated storage system |
US9767130B2 (en) * | 2014-12-31 | 2017-09-19 | Nexenta Systems, Inc. | Methods and systems for key sharding of objects stored in distributed storage system |
GB2534373A (en) * | 2015-01-20 | 2016-07-27 | Ibm | Distributed system with accelerator and catalog |
US9372628B1 (en) | 2015-01-23 | 2016-06-21 | International Business Machines Corporation | Deduplication tracking for accurate lifespan prediction |
US9848120B2 (en) * | 2015-05-08 | 2017-12-19 | Fast Model Technology Llc | System and method for preserving video clips from a handheld device |
US10235288B2 (en) * | 2015-10-02 | 2019-03-19 | Netapp, Inc. | Cache flushing and interrupted write handling in storage systems |
US10222987B2 (en) * | 2016-02-11 | 2019-03-05 | Dell Products L.P. | Data deduplication with augmented cuckoo filters |
US9742959B1 (en) * | 2016-02-24 | 2017-08-22 | Ricoh Company, Ltd. | Mechanism for color management cache reinitialization optimization |
US10073732B2 (en) | 2016-03-04 | 2018-09-11 | Samsung Electronics Co., Ltd. | Object storage system managing error-correction-code-related data in key-value mapping information |
US10162554B2 (en) | 2016-08-03 | 2018-12-25 | Samsung Electronics Co., Ltd. | System and method for controlling a programmable deduplication ratio for a memory system |
US20180095720A1 (en) * | 2016-09-30 | 2018-04-05 | Intel Corporation | Storage device with fine grained search capability |
KR20180087925A (ko) | 2017-01-25 | 2018-08-03 | 삼성전자주식회사 | 논리 어드레스와 물리 어드레스 사이에서 해싱 기반 변환을 수행하는 스토리지 장치 |
CN107040582B (zh) | 2017-02-17 | 2020-08-14 | 创新先进技术有限公司 | 一种数据处理方法及装置 |
CN115129618A (zh) * | 2017-04-17 | 2022-09-30 | 伊姆西Ip控股有限责任公司 | 用于优化数据缓存的方法和设备 |
US10474587B1 (en) | 2017-04-27 | 2019-11-12 | EMC IP Holding Company LLC | Smart weighted container data cache eviction |
US10423533B1 (en) * | 2017-04-28 | 2019-09-24 | EMC IP Holding Company LLC | Filtered data cache eviction |
US10635654B2 (en) | 2017-06-12 | 2020-04-28 | Samsung Electronics Co., Ltd. | Data journaling for large solid state storage devices with low DRAM/SRAM |
JP6962018B2 (ja) * | 2017-06-15 | 2021-11-05 | 富士通株式会社 | ストレージ制御装置、制御プログラム及び制御方法 |
US10579633B2 (en) | 2017-08-31 | 2020-03-03 | Micron Technology, Inc. | Reducing probabilistic filter query latency |
CN108170373B (zh) * | 2017-12-19 | 2021-01-05 | 云知声智能科技股份有限公司 | 一种数据缓存方法、装置及数据传输系统 |
CN109992196B (zh) * | 2017-12-29 | 2022-05-17 | 杭州海康威视数字技术股份有限公司 | 索引数据的存储方法及装置、存储系统 |
US11153094B2 (en) * | 2018-04-27 | 2021-10-19 | EMC IP Holding Company LLC | Secure data deduplication with smaller hash values |
US10783038B2 (en) * | 2018-09-21 | 2020-09-22 | EMC IP Holding Company LLC | Distributed generation of random data in a storage system |
US10963436B2 (en) | 2018-10-31 | 2021-03-30 | EMC IP Holding Company LLC | Deduplicating data at sub-block granularity |
US11580162B2 (en) | 2019-04-18 | 2023-02-14 | Samsung Electronics Co., Ltd. | Key value append |
US20210034472A1 (en) * | 2019-07-31 | 2021-02-04 | Dell Products L.P. | Method and system for any-point-in-time recovery within a continuous data protection software-defined storage |
US11609820B2 (en) | 2019-07-31 | 2023-03-21 | Dell Products L.P. | Method and system for redundant distribution and reconstruction of storage metadata |
US11775193B2 (en) | 2019-08-01 | 2023-10-03 | Dell Products L.P. | System and method for indirect data classification in a storage system operations |
US11816034B2 (en) * | 2020-10-26 | 2023-11-14 | International Business Machines Corporation | Fast cache tracking to support aggressive prefetching |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000284995A (ja) * | 1999-03-30 | 2000-10-13 | Fujitsu Ltd | データ処理装置及び記録媒体 |
JP2007234026A (ja) * | 2006-03-01 | 2007-09-13 | Quantum Corp | ユニークブロックプールマネージャを含むデータ記憶システムおよび階層記憶装置における応用 |
JP2008269520A (ja) * | 2007-04-25 | 2008-11-06 | Matsushita Electric Ind Co Ltd | 記録装置及び記録方法 |
WO2009102425A1 (en) * | 2008-02-12 | 2009-08-20 | Netapp, Inc. | Hybrid media storage system architecture |
JP2010079886A (ja) * | 2008-09-11 | 2010-04-08 | Nec Lab America Inc | 拡張可能な2次ストレージシステムと方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7136883B2 (en) * | 2001-09-08 | 2006-11-14 | Siemens Medial Solutions Health Services Corporation | System for managing object storage and retrieval in partitioned storage media |
US7149846B2 (en) * | 2002-04-17 | 2006-12-12 | Lsi Logic Corporation | RAID protected external secondary memory |
US7702666B2 (en) * | 2002-06-06 | 2010-04-20 | Ricoh Company, Ltd. | Full-text search device performing merge processing by using full-text index-for-registration/deletion storage part with performing registration/deletion processing by using other full-text index-for-registration/deletion storage part |
JP2005539309A (ja) * | 2002-09-16 | 2005-12-22 | ティギ・コーポレイション | 記憶システムアーキテクチャおよび多重キャッシュ装置 |
US7870105B2 (en) * | 2007-11-20 | 2011-01-11 | Hitachi, Ltd. | Methods and apparatus for deduplication in storage system |
JP2009251725A (ja) * | 2008-04-02 | 2009-10-29 | Hitachi Ltd | 記憶制御装置及び記憶制御装置を用いた重複データ検出方法。 |
-
2011
- 2011-08-25 CN CN201180042503.XA patent/CN103080910B/zh active Active
- 2011-08-25 CA CA2810991A patent/CA2810991C/en active Active
- 2011-08-25 EP EP11823208.1A patent/EP2614439A4/en not_active Withdrawn
- 2011-08-25 WO PCT/JP2011/004722 patent/WO2012032727A1/en active Application Filing
- 2011-08-25 US US13/640,628 patent/US8924663B2/en active Active
- 2011-08-25 JP JP2012528165A patent/JP5445682B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000284995A (ja) * | 1999-03-30 | 2000-10-13 | Fujitsu Ltd | データ処理装置及び記録媒体 |
JP2007234026A (ja) * | 2006-03-01 | 2007-09-13 | Quantum Corp | ユニークブロックプールマネージャを含むデータ記憶システムおよび階層記憶装置における応用 |
JP2008269520A (ja) * | 2007-04-25 | 2008-11-06 | Matsushita Electric Ind Co Ltd | 記録装置及び記録方法 |
WO2009102425A1 (en) * | 2008-02-12 | 2009-08-20 | Netapp, Inc. | Hybrid media storage system architecture |
JP2010079886A (ja) * | 2008-09-11 | 2010-04-08 | Nec Lab America Inc | 拡張可能な2次ストレージシステムと方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015145532A1 (ja) * | 2014-03-24 | 2015-10-01 | 株式会社日立製作所 | ストレージシステム及びデータ処理方法 |
US10120601B2 (en) | 2014-03-24 | 2018-11-06 | Hitachi, Ltd. | Storage system and data processing method |
WO2015198371A1 (ja) * | 2014-06-23 | 2015-12-30 | 株式会社日立製作所 | ストレージシステム及び記憶制御方法 |
US9703497B2 (en) | 2014-06-23 | 2017-07-11 | Hitachi, Ltd. | Storage system and storage control method |
WO2017061022A1 (ja) * | 2015-10-09 | 2017-04-13 | 株式会社日立製作所 | データを重複排除するシステム |
JP2017134560A (ja) * | 2016-01-27 | 2017-08-03 | 日本電信電話株式会社 | データ操作方法とデータ操作方法プログラム |
Also Published As
Publication number | Publication date |
---|---|
CA2810991A1 (en) | 2012-03-15 |
US20130036277A1 (en) | 2013-02-07 |
JP5445682B2 (ja) | 2014-03-19 |
US8924663B2 (en) | 2014-12-30 |
WO2012032727A1 (en) | 2012-03-15 |
EP2614439A4 (en) | 2014-04-02 |
CA2810991C (en) | 2016-06-21 |
CN103080910A (zh) | 2013-05-01 |
EP2614439A1 (en) | 2013-07-17 |
CN103080910B (zh) | 2016-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5445682B2 (ja) | ストレージシステム | |
US11650976B2 (en) | Pattern matching using hash tables in storage system | |
US9880746B1 (en) | Method to increase random I/O performance with low memory overheads | |
JP6304406B2 (ja) | ストレージ装置、プログラム、情報処理方法 | |
US11010300B2 (en) | Optimized record lookups | |
US9405473B2 (en) | Dense tree volume metadata update logging and checkpointing | |
CN105843551B (zh) | 高性能和大容量储存重复删除中的数据完整性和损耗电阻 | |
Nam et al. | Assuring demanded read performance of data deduplication storage with backup datasets | |
US10956071B2 (en) | Container key value store for data storage devices | |
Zou et al. | The dilemma between deduplication and locality: Can both be achieved? | |
WO2014015828A1 (zh) | 数据存储空间的处理方法、处理系统及数据存储服务器 | |
US11372576B2 (en) | Data processing apparatus, non-transitory computer-readable storage medium, and data processing method | |
CN111124258B (zh) | 全闪存阵列的数据存储方法、装置、设备及可读存储介质 | |
CN113535670B (zh) | 一种虚拟化资源镜像存储系统及其实现方法 | |
US20180307440A1 (en) | Storage control apparatus and storage control method | |
Chan et al. | Elastic parity logging for SSD RAID arrays: Design, analysis, and implementation | |
Chernov et al. | Survey on deduplication techniques in flash-based storage | |
CN114296630A (zh) | 缓存存储器中重复数据删除指纹索引的更新 | |
Li et al. | Improving the Restore Performance via Physical-Locality Middleware for Backup Systems | |
JP2021076969A (ja) | 情報処理装置および情報処理プログラム | |
CN111309261A (zh) | 一种分布式存储系统中单节点上数据物理位置映射方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130625 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130820 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131126 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131209 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5445682 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |