JP6724534B2 - 情報処理装置、重複除去プログラム、及び重複除去方法 - Google Patents
情報処理装置、重複除去プログラム、及び重複除去方法 Download PDFInfo
- Publication number
- JP6724534B2 JP6724534B2 JP2016094025A JP2016094025A JP6724534B2 JP 6724534 B2 JP6724534 B2 JP 6724534B2 JP 2016094025 A JP2016094025 A JP 2016094025A JP 2016094025 A JP2016094025 A JP 2016094025A JP 6724534 B2 JP6724534 B2 JP 6724534B2
- Authority
- JP
- Japan
- Prior art keywords
- data block
- address
- storage area
- predetermined address
- index value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
- G06F3/064—Management of blocks
- G06F3/0641—De-duplication techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0608—Saving storage space on storage systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0646—Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
- G06F3/0652—Erasing, e.g. deleting, data cleaning, moving of data to a wastebasket
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0655—Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
- G06F3/0659—Command handling arrangements, e.g. command buffers, queues, command scheduling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0683—Plurality of storage devices
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
また、本件の情報処理装置は、上述と同様の重複除去部、算出部、制御部、及び第1記憶領域のほかに、第2記憶領域および第3記憶領域を有する。前記第2記憶領域は、前記複数のアドレスと各アドレスに書き込まれる各データブロックから得られるハッシュ値とを対応付けて記憶する。前記第3記憶領域は、前記ハッシュ値と前記ハッシュ値に対応するデータブロックを記憶する重複除去用アドレスとを対応付けて記憶する。ここで、前記重複除去部は、前記第2記憶領域および前記第3記憶領域を用いて前記重複除去処理を実行する。前記制御部は、前記データブロックを前記所定アドレスに書き込む際に前記第1記憶領域を参照し、前記所定アドレスについて算出された前記指標値が前記複数の指標値の中で上位に属する場合、前記データブロックについて前記重複除去処理を保留させ、前記指標値が前記複数の指標値の中で上位に属する場合、前記ストレージから割り当てられた新たなアドレスに前記データブロックを書き込むとともに、前記第2記憶領域において、前記所定アドレスに対応付けられたハッシュ値を、前記新たなアドレスに書き換え、前記所定アドレスに対して書き込まれるデータブロックを、前記新たなアドレスに上書きすることで、前記データブロックについて前記重複除去処理を保留させる。
図1は、関連技術によって重複除去処理後に階層化処理を行なう場合の処理を説明する図である。図1の(A)に示すように、ここでは、ホストからの書込み要求に応じて重複除去エンジンが重複除去処理を行なった後、階層化ストレージによって階層化処理が行なわれる場合の処理について説明する。なお、階層化ストレージにおいては、例えば、性能の異なる記憶デバイスとしてSSD及びHDDの二種類が備えられ、階層化エンジンが階層化処理を行なう。
本実施形態では、重複除去処理後に階層化処理を行なう場合を対象として改良を行なって、先に重複除去処理を行なう場合に生じる課題を解消することで、ストレージを効率よく利用しながら重複除去が実現される。
まず、図10を参照しながら、本実施形態のストレージシステム1の構成及び機能構成について説明する。図10は、本実施形態のストレージシステム1のハードウエア構成例及び機能構成例を示すブロック図であり、図10に示すように、本実施形態のストレージシステム1は、ホスト10、情報処理装置20及び階層化ストレージ2を含む。また、階層化ストレージ2は、情報処理装置30及びストレージ40,50を含む。
次に、図13及び図14を参照しながら関連技術の重複除去エンジンによる動作の流れについて概略的に説明するとともに、関連技術の重複除去エンジンによる動作の流れに対比させ、図15〜図18を参照しながら本実施形態の重複除去エンジンによる動作の流れについて概略的に説明する。
図13に示すフローチャート(ステップS11〜S14)に従って、関連技術の重複除去エンジンにおける書込み動作の流れを説明する。
図14に示すフローチャート(ステップS21〜S23)に従って、関連技術における読出し動作の流れを説明する。
図15に示すフローチャート(ステップS31〜S35)に従って、本実施形態の重複除去エンジンにおける書込み動作の流れを説明する。
図16に示すフローチャート(ステップS41〜S44)に従って、本実施形態における読出し動作の流れを説明する。
図17に示すフローチャート(ステップS51〜S54)に従って、本実施形態における書込み回数指標値の一例、つまり図11に示すデータ構造T3についての、算出部212による更新動作(図15のステップS31)の流れを説明する。
図18に示すフローチャート(ステップS61〜S63)に従って、本実施形態における書込み回数指標値の他例、つまり図12に示すデータ構造T3′についての、算出部212による更新動作(図15のステップS31)の流れを説明する。
次に、図19〜図22を参照しながら関連技術による具体的な動作の流れについて説明するとともに、関連技術による具体的な動作の流れに対比させ、図23〜図26を参照しながら本実施形態による具体的な動作の流れについて説明する。
図1に示す関連技術において、上述した課題が生じた場合の状況について、具体的に説明する。例えば、図1に示す関連技術において、ホストから、図3に示すような書込み要求、つまりアドレス0に対するデータブロックa〜fの書込みアクセスが連続的(頻繁)に発生したものとする。このときの、図1に示す関連技術での状況を図19〜図22に示す。
そこで、上述した本実施形態の技術によって、上述した関連技術における二つの課題が解消される状況について、図23〜図26を参照しながら具体的に説明する。
以上、本発明の好ましい実施形態について詳述したが、本発明は、係る特定の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲内において、種々の変形、変更して実施することができる。
以上の実施形態に関し、さらに以下の付記を開示する。
ストレージの所定アドレスにデータブロックを書き込む際に前記データブロックについての重複除去処理を行なう重複除去部と、
前記所定アドレスへの書込み回数に相当する指標値を算出する算出部と、
前記算出部によって算出される前記指標値に応じ、前記データブロックについて前記重複除去処理を実行するか保留するかを決定して切り換える制御部と、を有する、情報処理装置。
前記所定アドレスを含む複数のアドレスについて前記算出部によって算出される、前記複数のアドレスへの書込み回数に相当する複数の指標値を、それぞれ前記複数のアドレスに対応付けて記憶する第1記憶領域を有し、
前記制御部は、
前記データブロックを前記所定アドレスに書き込む際に前記第1記憶領域を参照し、
前記所定アドレスについて算出された前記指標値が前記複数の指標値の中で上位に属する場合、前記データブロックについて前記重複除去処理を保留させる、付記1に記載の情報処理装置。
前記制御部は、前記指標値が前記複数の指標値の中で上位に属していない場合、前記データブロックについて前記重複除去処理を実行させる、付記2に記載の情報処理装置。
前記算出部は、時間の経過とともに前記複数の指標値相互間の差が相対的に小さくなるように、前記第1記憶領域に記憶される前記複数の指標値を更新する、付記2または付記3に記載の情報処理装置。
前記算出部は、
前記第1記憶領域に記憶される前記複数の指標値のそれぞれに0よりも大きく且つ1未満の定数を乗算し、
前記所定アドレスが前記第1記憶領域に記憶されているか否かを判定し、
前記所定アドレスが前記第1記憶領域に記憶されている場合、前記所定アドレスに対応する前記指標値に“1”を加算する一方、
前記所定アドレスが前記第1記憶領域に記憶されていない場合、前記複数の指標値のうちの最小の指標値と前記最小の指標値に対応付けられたアドレスとを前記第1記憶領域から削除し、値“1”を、前記指標値として、前記所定アドレスに対応付けて前記第1記憶領域に追加する、付記4に記載の情報処理装置。
前記算出部は、
前記所定アドレスが前記第1記憶領域に記憶されているか否かを判定し、
前記所定アドレスが前記第1記憶領域に記憶されている場合、前記所定アドレスに対応する前記指標値に“1”を加算する一方、
前記所定アドレスが前記第1記憶領域に記憶されていない場合、前記複数の指標値のうちの最小の指標値と前記最小の指標値に対応付けられたアドレスとを前記第1記憶領域から削除し、前記最小の指標値に“1”を加算した値を、前記指標値として、前記所定アドレスに対応付けて前記第1記憶領域に追加する、付記4に記載の情報処理装置。
前記複数のアドレスと各アドレスに書き込まれる各データブロックから得られるハッシュ値とを対応付けて記憶する第2記憶領域と、
前記ハッシュ値と前記ハッシュ値に対応するデータブロックを記憶する重複除去用アドレスとを対応付けて記憶する第3記憶領域と、を有し、
前記重複除去部は、前記第2記憶領域及び前記第3記憶領域を用いて前記重複除去処理を実行し、
前記制御部は、前記指標値が前記複数の指標値の中で上位に属する場合、前記ストレージから割り当てられた新たなアドレスに前記データブロックを書き込むとともに、前記第2記憶領域において、前記所定アドレスに対応付けられたハッシュ値を、前記新たなアドレスに書き換え、前記所定アドレスに対して連続的に書き込まれるデータブロックを、前記新たなアドレスに上書きすることで、前記データブロックについて前記重複除去処理を保留させる、付記2〜付記6のいずれか一項に記載の情報処理装置。
前記ストレージは、性能の異なる複数の記憶部を含む階層化ストレージであり、
前記複数の記憶部のうち、前記重複除去用アドレスまたは前記新たなアドレスに対するアクセス頻度に応じた性能の記憶部に、前記重複除去用アドレスまたは前記新たなアドレスに対応するデータブロックを配置する階層化処理を行なう階層化部を有する、付記7に記載の情報処理装置。
前記重複除去用アドレスまたは前記新たなアドレスと、前記アクセス頻度と、前記重複除去用アドレスまたは前記新たなアドレスに対応するデータブロックを配置する前記記憶部を特定する情報とを対応付けて記憶する第4記憶領域を有し、
前記階層化部は、前記第4記憶領域を用いて前記階層化処理を実行する、付記8に記載の情報処理装置。
ストレージの所定アドレスにデータブロックを書き込む際に前記データブロックについての重複除去処理を行なうコンピュータに、
前記所定アドレスへの書込み回数に相当する指標値を算出し、
算出した前記指標値に応じ、前記データブロックについて前記重複除去処理を実行するか保留するかを決定して切り換える、
処理を実行させる、重複除去プログラム。
前記所定アドレスを含む複数のアドレスについて算出される、前記複数のアドレスへの書込み回数に相当する複数の指標値を、それぞれ前記複数のアドレスに対応付けて記憶する第1記憶領域を、前記データブロックを前記所定アドレスに書き込む際に参照し、
前記所定アドレスについて算出された前記指標値が前記複数の指標値の中で上位に属する場合、前記データブロックについて前記重複除去処理を保留する、
処理を、前記コンピュータに実行させる、付記10に記載の重複除去プログラム。
前記指標値が前記複数の指標値の中で上位に属していない場合、前記データブロックについて前記重複除去処理を実行する、
処理を、前記コンピュータに実行させる、付記11に記載の重複除去プログラム。
時間の経過とともに前記複数の指標値相互間の差が相対的に小さくなるように、前記第1記憶領域に記憶される前記複数の指標値を更新する、
処理を、前記コンピュータに実行させる、付記11または付記12に記載の重複除去プログラム。
前記第1記憶領域に記憶される前記複数の指標値のそれぞれに0よりも大きく且つ1未満の定数を乗算し、
前記所定アドレスが前記第1記憶領域に記憶されているか否かを判定し、
前記所定アドレスが前記第1記憶領域に記憶されている場合、前記所定アドレスに対応する前記指標値に“1”を加算する一方、
前記所定アドレスが前記第1記憶領域に記憶されていない場合、前記複数の指標値のうちの最小の指標値と前記最小の指標値に対応付けられたアドレスとを前記第1記憶領域から削除し、値“1”を、前記指標値として、前記所定アドレスに対応付けて前記第1記憶領域に追加する、
処理を、前記コンピュータに実行させる、付記13に記載の重複除去プログラム。
前記所定アドレスが前記第1記憶領域に記憶されているか否かを判定し、
前記所定アドレスが前記第1記憶領域に記憶されている場合、前記所定アドレスに対応する前記指標値に“1”を加算する一方、
前記所定アドレスが前記第1記憶領域に記憶されていない場合、前記複数の指標値のうちの最小の指標値と前記最小の指標値に対応付けられたアドレスとを前記第1記憶領域から削除し、前記最小の指標値に“1”を加算した値を、前記指標値として、前記所定アドレスに対応付けて前記第1記憶領域に追加する、
処理を、前記コンピュータに実行させる、付記13に記載の重複除去プログラム。
ストレージの所定アドレスにデータブロックを書き込む際に前記データブロックについての重複除去処理を行なうコンピュータが、
前記所定アドレスへの書込み回数に相当する指標値を算出し、
算出した前記指標値に応じ、前記データブロックについて前記重複除去処理を実行するか保留するかを決定して切り換える、重複除去方法。
前記コンピュータが、
前記所定アドレスを含む複数のアドレスについて算出される、前記複数のアドレスへの書込み回数に相当する複数の指標値を、それぞれ前記複数のアドレスに対応付けて記憶する第1記憶領域を、前記データブロックを前記所定アドレスに書き込む際に参照し、
前記所定アドレスについて算出された前記指標値が前記複数の指標値の中で上位に属する場合、前記データブロックについて前記重複除去処理を保留する、付記16に記載の重複除去方法。
前記コンピュータが、時間の経過とともに前記複数の指標値相互間の差が相対的に小さくなるように、前記第1記憶領域に記憶される前記複数の指標値を更新する、付記17に記載の重複除去方法。
前記コンピュータが、
前記第1記憶領域に記憶される前記複数の指標値のそれぞれに0よりも大きく且つ1未満の定数を乗算し、
前記所定アドレスが前記第1記憶領域に記憶されているか否かを判定し、
前記所定アドレスが前記第1記憶領域に記憶されている場合、前記所定アドレスに対応する前記指標値に“1”を加算する一方、
前記所定アドレスが前記第1記憶領域に記憶されていない場合、前記複数の指標値のうちの最小の指標値と前記最小の指標値に対応付けられたアドレスとを前記第1記憶領域から削除し、値“1”を、前記指標値として、前記所定アドレスに対応付けて前記第1記憶領域に追加する、付記18に記載の重複除去方法。
前記コンピュータが、
前記所定アドレスが前記第1記憶領域に記憶されているか否かを判定し、
前記所定アドレスが前記第1記憶領域に記憶されている場合、前記所定アドレスに対応する前記指標値に“1”を加算する一方、
前記所定アドレスが前記第1記憶領域に記憶されていない場合、前記複数の指標値のうちの最小の指標値と前記最小の指標値に対応付けられたアドレスとを前記第1記憶領域から削除し、前記最小の指標値に“1”を加算した値を、前記指標値として、前記所定アドレスに対応付けて前記第1記憶領域に追加する、付記18に記載の重複除去方法。
2 階層化ストレージ(ストレージ)
10 ホスト
20 情報処理装置(重複除去エンジン,PC,コンピュータ)
21 処理部
211 重複除去部
212 算出部
213 制御部
22 記憶部
220 重複除去プログラム
221 第1記憶領域
222 第2記憶領域
223 第3記憶領域
30 情報処理装置(階層化エンジン,PC,コンピュータ)
31 処理部
311 階層化部
32 記憶部
320 階層化プログラム
321 第4記憶領域
40 SSD(記憶部)
50 HDD(記憶部)
T1〜T4 データ構造
Claims (11)
- ストレージの所定アドレスにデータブロックを書き込む際に前記データブロックについての重複除去処理を行なう重複除去部と、
前記所定アドレスへの書込み回数に相当する指標値を算出する算出部と、
前記算出部によって算出される前記指標値に応じ、前記データブロックについて前記重複除去処理を実行するか保留するかを決定する制御部と、
前記所定アドレスを含む複数のアドレスについて前記算出部によって算出される、前記複数のアドレスへの書込み回数に相当する複数の指標値を、それぞれ前記複数のアドレスに対応付けて記憶する第1記憶領域と、を有し、
前記制御部は、前記データブロックを前記所定アドレスに書き込む際に前記第1記憶領域を参照し、前記所定アドレスについて算出された前記指標値が前記複数の指標値の中で上位に属する場合、前記データブロックについて前記重複除去処理を保留させ、
前記算出部は、時間の経過とともに前記複数の指標値相互間の差が相対的に小さくなるように、前記第1記憶領域に記憶される前記複数の指標値を更新する、情報処理装置。 - 前記制御部は、前記指標値が前記複数の指標値の中で上位に属していない場合、前記データブロックについて前記重複除去処理を実行させる、請求項1に記載の情報処理装置。
- 前記算出部は、
前記第1記憶領域に記憶される前記複数の指標値のそれぞれに0よりも大きく且つ1未満の定数を乗算し、
前記所定アドレスが前記第1記憶領域に記憶されているか否かを判定し、
前記所定アドレスが前記第1記憶領域に記憶されている場合、前記所定アドレスに対応する前記指標値に“1”を加算する一方、
前記所定アドレスが前記第1記憶領域に記憶されていない場合、前記複数の指標値のうちの最小の指標値と前記最小の指標値に対応付けられたアドレスとを前記第1記憶領域から削除し、値“1”を、前記指標値として、前記所定アドレスに対応付けて前記第1記憶領域に追加する、請求項1または請求項2に記載の情報処理装置。 - 前記算出部は、
前記所定アドレスが前記第1記憶領域に記憶されているか否かを判定し、
前記所定アドレスが前記第1記憶領域に記憶されている場合、前記所定アドレスに対応する前記指標値に“1”を加算する一方、
前記所定アドレスが前記第1記憶領域に記憶されていない場合、前記複数の指標値のうちの最小の指標値と前記最小の指標値に対応付けられたアドレスとを前記第1記憶領域から削除し、前記最小の指標値に“1”を加算した値を、前記指標値として、前記所定アドレスに対応付けて前記第1記憶領域に追加する、請求項1または請求項2に記載の情報処理装置。 - 前記複数のアドレスと各アドレスに書き込まれる各データブロックから得られるハッシュ値とを対応付けて記憶する第2記憶領域と、
前記ハッシュ値と前記ハッシュ値に対応するデータブロックを記憶する重複除去用アドレスとを対応付けて記憶する第3記憶領域と、を有し、
前記重複除去部は、前記第2記憶領域および前記第3記憶領域を用いて前記重複除去処
理を実行し、
前記制御部は、前記指標値が前記複数の指標値の中で上位に属する場合、前記ストレージから割り当てられた新たなアドレスに前記データブロックを書き込むとともに、前記第2記憶領域において、前記所定アドレスに対応付けられたハッシュ値を、前記新たなアドレスに書き換え、前記所定アドレスに対して書き込まれるデータブロックを、前記新たなアドレスに上書きすることで、前記データブロックについて前記重複除去処理を保留させる、請求項1〜請求項4のいずれか一項に記載の情報処理装置。 - ストレージの所定アドレスにデータブロックを書き込む際に前記データブロックについての重複除去処理を行なう重複除去部と、
前記所定アドレスへの書込み回数に相当する指標値を算出する算出部と、
前記算出部によって算出される前記指標値に応じ、前記データブロックについて前記重複除去処理を実行するか保留するかを決定する制御部と、
前記所定アドレスを含む複数のアドレスについて前記算出部によって算出される、前記複数のアドレスへの書込み回数に相当する複数の指標値を、それぞれ前記複数のアドレスに対応付けて記憶する第1記憶領域と、
前記複数のアドレスと各アドレスに書き込まれる各データブロックから得られるハッシュ値とを対応付けて記憶する第2記憶領域と、
前記ハッシュ値と前記ハッシュ値に対応するデータブロックを記憶する重複除去用アドレスとを対応付けて記憶する第3記憶領域と、を有し、
前記重複除去部は、前記第2記憶領域および前記第3記憶領域を用いて前記重複除去処理を実行し、
前記制御部は、
前記データブロックを前記所定アドレスに書き込む際に前記第1記憶領域を参照し、前記所定アドレスについて算出された前記指標値が前記複数の指標値の中で上位に属する場合、前記データブロックについて前記重複除去処理を保留させ、
前記指標値が前記複数の指標値の中で上位に属する場合、前記ストレージから割り当てられた新たなアドレスに前記データブロックを書き込むとともに、前記第2記憶領域において、前記所定アドレスに対応付けられたハッシュ値を、前記新たなアドレスに書き換え、前記所定アドレスに対して書き込まれるデータブロックを、前記新たなアドレスに上書きすることで、前記データブロックについて前記重複除去処理を保留させる、情報処理装置。 - 前記ストレージは、性能の異なる複数の記憶部を含む階層化ストレージであり、
前記複数の記憶部のうち、前記重複除去用アドレスまたは前記新たなアドレスに対するアクセス頻度に応じた性能の記憶部に、前記重複除去用アドレスまたは前記新たなアドレスに対応するデータブロックを配置する階層化処理を行なう階層化部を有する、請求項5または請求項6に記載の情報処理装置。 - コンピュータに、
ストレージの所定アドレスにデータブロックを書き込む際に前記データブロックについての重複除去処理を実行させるとともに、
前記所定アドレスへの書込み回数に相当する指標値を算出する算出処理と、
算出した前記指標値に応じ、前記データブロックについて前記重複除去処理を実行するか保留するかを決定する決定処理と、を実行させ、
前記決定処理に際して、前記所定アドレスを含む複数のアドレスについて算出される、前記複数のアドレスへの書込み回数に相当する複数の指標値を、それぞれ前記複数のアドレスに対応付けて記憶する第1記憶領域を、前記データブロックを前記所定アドレスに書き込む際に参照し、前記所定アドレスについて算出された前記指標値が前記複数の指標値の中で上位に属する場合、前記データブロックについて前記重複除去処理を保留し、
前記算出処理に際して、時間の経過とともに前記複数の指標値相互間の差が相対的に小さくなるように、前記第1記憶領域に記憶される前記複数の指標値を更新する、
処理を実行させる、重複除去プログラム。 - コンピュータに、
ストレージの所定アドレスにデータブロックを書き込む際に前記データブロックについての重複除去処理を実行させるとともに、
前記所定アドレスへの書込み回数に相当する指標値を算出する算出処理と、
算出した前記指標値に応じ、前記データブロックについて前記重複除去処理を実行するか保留するかを決定する決定処理と、を実行させ、
前記決定処理に際して、前記所定アドレスを含む複数のアドレスについて算出される、前記複数のアドレスへの書込み回数に相当する複数の指標値を、それぞれ前記複数のアドレスに対応付けて記憶する第1記憶領域を、前記データブロックを前記所定アドレスに書き込む際に参照し、前記所定アドレスについて算出された前記指標値が前記複数の指標値の中で上位に属する場合、前記データブロックについて前記重複除去処理を保留し、
前記重複除去処理に際して、前記複数のアドレスと各アドレスに書き込まれる各データブロックから得られるハッシュ値とを対応付けて記憶する第2記憶領域と、前記ハッシュ値と前記ハッシュ値に対応するデータブロックを記憶する重複除去用アドレスとを対応付けて記憶する第3記憶領域と、を用い、
前記決定処理に際して、前記指標値が前記複数の指標値の中で上位に属する場合、前記ストレージから割り当てられた新たなアドレスに前記データブロックを書き込むとともに、前記第2記憶領域において、前記所定アドレスに対応付けられたハッシュ値を、前記新たなアドレスに書き換え、前記所定アドレスに対して書き込まれるデータブロックを、前記新たなアドレスに上書きすることで、前記データブロックについて前記重複除去処理を保留する、
処理を実行させる、重複除去プログラム。 - コンピュータによって、
ストレージの所定アドレスにデータブロックを書き込む際に前記データブロックについての重複除去処理を行なうとともに、
前記所定アドレスへの書込み回数に相当する指標値を算出する算出処理と、
算出した前記指標値に応じ、前記データブロックについて前記重複除去処理を実行するか保留するかを決定する決定処理と、を行ない、
前記決定処理に際して、前記所定アドレスを含む複数のアドレスについて算出される、前記複数のアドレスへの書込み回数に相当する複数の指標値を、それぞれ前記複数のアドレスに対応付けて記憶する第1記憶領域を、前記データブロックを前記所定アドレスに書き込む際に参照し、前記所定アドレスについて算出された前記指標値が前記複数の指標値の中で上位に属する場合、前記データブロックについて前記重複除去処理を保留し、
前記算出処理に際して、時間の経過とともに前記複数の指標値相互間の差が相対的に小さくなるように、前記第1記憶領域に記憶される前記複数の指標値を更新する、
重複除去方法。 - コンピュータによって、
ストレージの所定アドレスにデータブロックを書き込む際に前記データブロックについての重複除去処理を行なうとともに、
前記所定アドレスへの書込み回数に相当する指標値を算出する算出処理と、
算出した前記指標値に応じ、前記データブロックについて前記重複除去処理を実行するか保留するかを決定する決定処理と、を行ない、
前記決定処理に際して、前記所定アドレスを含む複数のアドレスについて算出される、前記複数のアドレスへの書込み回数に相当する複数の指標値を、それぞれ前記複数のアドレスに対応付けて記憶する第1記憶領域を、前記データブロックを前記所定アドレスに書き込む際に参照し、前記所定アドレスについて算出された前記指標値が前記複数の指標値の中で上位に属する場合、前記データブロックについて前記重複除去処理を保留し、
前記重複除去処理に際して、前記複数のアドレスと各アドレスに書き込まれる各データブロックから得られるハッシュ値とを対応付けて記憶する第2記憶領域と、前記ハッシュ値と前記ハッシュ値に対応するデータブロックを記憶する重複除去用アドレスとを対応付けて記憶する第3記憶領域と、を用い、
前記決定処理に際して、前記指標値が前記複数の指標値の中で上位に属する場合、前記ストレージから割り当てられた新たなアドレスに前記データブロックを書き込むとともに、前記第2記憶領域において、前記所定アドレスに対応付けられたハッシュ値を、前記新たなアドレスに書き換え、前記所定アドレスに対して書き込まれるデータブロックを、前記新たなアドレスに上書きすることで、前記データブロックについて前記重複除去処理を保留する、
重複除去方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016094025A JP6724534B2 (ja) | 2016-05-09 | 2016-05-09 | 情報処理装置、重複除去プログラム、及び重複除去方法 |
US15/489,264 US10282126B2 (en) | 2016-05-09 | 2017-04-17 | Information processing apparatus and method for deduplication |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016094025A JP6724534B2 (ja) | 2016-05-09 | 2016-05-09 | 情報処理装置、重複除去プログラム、及び重複除去方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017204037A JP2017204037A (ja) | 2017-11-16 |
JP6724534B2 true JP6724534B2 (ja) | 2020-07-15 |
Family
ID=60243455
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016094025A Active JP6724534B2 (ja) | 2016-05-09 | 2016-05-09 | 情報処理装置、重複除去プログラム、及び重複除去方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10282126B2 (ja) |
JP (1) | JP6724534B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10318415B2 (en) * | 2017-05-31 | 2019-06-11 | International Business Machines Corporation | Garbage collection facility grouping infrequently accessed data units in designated transient memory area |
US11537514B2 (en) * | 2018-02-27 | 2022-12-27 | SK Hynix Inc. | Data storage device and operating method thereof |
KR102631380B1 (ko) * | 2018-05-17 | 2024-02-01 | 에스케이하이닉스 주식회사 | 데이터 연산을 수행할 수 있는 다양한 메모리 장치를 포함하는 반도체 시스템 |
CN112597746B (zh) * | 2020-12-29 | 2024-05-28 | 维沃移动通信有限公司 | 数据显示方法、装置及电子设备 |
CN116010397A (zh) * | 2021-10-22 | 2023-04-25 | 伊姆西Ip控股有限责任公司 | 数据读取方法、存储方法、电子设备和计算机程序产品 |
US11922019B2 (en) * | 2022-01-20 | 2024-03-05 | Dell Products L.P. | Storage device read-disturb-based block read temperature utilization system |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5109618B2 (ja) | 2007-11-21 | 2012-12-26 | 富士通株式会社 | 情報処理装置、情報処理装置の制御方法およびプログラム |
JP5084551B2 (ja) | 2008-02-26 | 2012-11-28 | Kddi株式会社 | 重複排除技術を用いたデータバックアップ方法、記憶制御通信装置及びプログラム |
US8799601B1 (en) * | 2012-06-28 | 2014-08-05 | Emc Corporation | Techniques for managing deduplication based on recently written extents |
JP5842768B2 (ja) * | 2012-08-22 | 2016-01-13 | 富士通株式会社 | 重複除去装置、重複除去方法及び重複除去プログラム |
US10572171B2 (en) * | 2016-02-29 | 2020-02-25 | Hitachi, Ltd. | Storage system |
-
2016
- 2016-05-09 JP JP2016094025A patent/JP6724534B2/ja active Active
-
2017
- 2017-04-17 US US15/489,264 patent/US10282126B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017204037A (ja) | 2017-11-16 |
US20170322747A1 (en) | 2017-11-09 |
US10282126B2 (en) | 2019-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6724534B2 (ja) | 情報処理装置、重複除去プログラム、及び重複除去方法 | |
JP6304406B2 (ja) | ストレージ装置、プログラム、情報処理方法 | |
Pitchumani et al. | SMRDB: Key-value data store for shingled magnetic recording disks | |
JP6794782B2 (ja) | 情報処理装置、情報処理プログラム、及び情報処理方法 | |
JP6298932B2 (ja) | ストレージ装置 | |
KR20090046567A (ko) | 반도체 디스크 및 그것의 동작 방법 | |
JP2010535379A (ja) | フラッシュメモリに最適化された入出力制御方法および装置 | |
JP6867578B2 (ja) | ストレージ制御装置、ストレージシステム、ストレージ制御方法およびストレージ制御プログラム | |
JP2019128906A (ja) | ストレージ装置及びその制御方法 | |
JP6098301B2 (ja) | ストレージ制御装置、ストレージ制御方法、およびストレージ制御プログラム | |
US9471253B2 (en) | Use of flash cache to improve tiered migration performance | |
JP6089890B2 (ja) | ストレージ制御装置、ストレージ制御装置の制御方法およびストレージ制御装置の制御プログラム | |
JP5729479B2 (ja) | 仮想テープ装置及び仮想テープ装置の制御方法 | |
US10754824B2 (en) | Data restructuring of deduplicated data | |
US20110264848A1 (en) | Data recording device | |
US20130246842A1 (en) | Information processing apparatus, program, and data allocation method | |
JP2021076969A (ja) | 情報処理装置および情報処理プログラム | |
US20230418798A1 (en) | Information processing apparatus and information processing method | |
US10740015B2 (en) | Optimized management of file system metadata within solid state storage devices (SSDs) | |
JP2017146722A (ja) | ストレージ装置 | |
JP6032091B2 (ja) | データ消去プログラム、情報処理装置、およびデータ消去方法 | |
KR20120110670A (ko) | 바이너리 트리 구조의 캐시 컨트롤 레코드 관리 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190212 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190607 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191217 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200526 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200608 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6724534 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |