JP5842768B2 - 重複除去装置、重複除去方法及び重複除去プログラム - Google Patents

重複除去装置、重複除去方法及び重複除去プログラム Download PDF

Info

Publication number
JP5842768B2
JP5842768B2 JP2012183085A JP2012183085A JP5842768B2 JP 5842768 B2 JP5842768 B2 JP 5842768B2 JP 2012183085 A JP2012183085 A JP 2012183085A JP 2012183085 A JP2012183085 A JP 2012183085A JP 5842768 B2 JP5842768 B2 JP 5842768B2
Authority
JP
Japan
Prior art keywords
bloom filter
data
storage device
nth
deduplication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012183085A
Other languages
English (en)
Other versions
JP2014041452A (ja
Inventor
芳浩 土屋
芳浩 土屋
渡辺 高志
高志 渡辺
泰生 野口
泰生 野口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2012183085A priority Critical patent/JP5842768B2/ja
Priority to US13/958,668 priority patent/US9122407B2/en
Publication of JP2014041452A publication Critical patent/JP2014041452A/ja
Application granted granted Critical
Publication of JP5842768B2 publication Critical patent/JP5842768B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/064Management of blocks
    • G06F3/0641De-duplication techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system
    • G06F16/1748De-duplication implemented within the file system, e.g. based on file segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0608Saving storage space on storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、重複除去装置、重複除去方法及び重複除去プログラムに関する。
ストレージシステムとして、格納が指示されたデータを比較的小サイズのデータに分割し、分割したデータの中の、同一内容のデータが既に格納されているデータについては、その格納を行わないものが知られている。
特表2010−531086号公報 特開平9−16607号公報 特開2011−171995号公報
上記のような機能を有する既存のストレージシステムは、2個目の重複データから重複除去を行う(データを格納しない)ものとなっているのであるが、記憶装置に格納されるデータの種類によっては、N(≧3)個目の重複データから重複除去を行った方が良い場合もある。ただし、N(≧3)個目の重複データから重複除去を行うために、各データの重複数をカウンタによって管理するのは、あまり効率的なことではない。
そこで、本発明の課題は、N(≧3)個目の重複データからの重複除去が効率的に行える技術を提供することにある。
一態様の重複除去装置は、
第1乃至第N(≧3)のブルームフィルタと、
格納対象データと同内容のデータが記憶装置内に存在することを示す情報が各ブルームフィルタに登録されているか否かを判断する処理を、当該情報が登録されていない未登録ブルームフィルタを見出すか、当該情報が前記第Nのブルームフィルタに登録されていることを見出すまで、前記第1乃至第Nのブルームフィルタについて順次行い、前記未登録ブルームフィルタを見出した場合には、前記格納対象データが前記記憶装置内に存在することを示す情報を前記未登録ブルームフィルタに登録する計数部と、
前記計数部により前記未登録ブルームフィルタが見出された場合には、前記格納対象データを前記記憶装置に格納し、前記計数部によりに前記情報が前記第Nのブルームフィルタに登録されていることが見出された場合には、前記格納対象データを前記記憶装置内の同内容のデータに対応づけるインデックス情報を前記記憶装置に格納する重複除去部と、
を備える。
また、一態様の重複除去方法は、
コンピュータを、
格納対象データと同内容のデータが記憶装置内に存在することを示す情報が各ブルームフィルタに登録されているか否かを判断する処理を、当該情報が登録されていない未登録ブルームフィルタを見出すか、当該情報が第Nのブルームフィルタに登録されていることを見出すまで、第1乃至第Nのブルームフィルタについて順次行い、
前記未登録ブルームフィルタを見出した場合には、前記格納対象データが前記記憶装置
内に存在することを示す情報を前記未登録ブルームフィルタに登録すると共に、前記格納対象データを前記記憶装置に格納し、
前記情報が前記第Nのブルームフィルタに登録されていることを見出した場合には、前記格納対象データを前記記憶装置内の同内容のデータに対応づけるインデックス情報を前記記憶装置に格納する。
一態様の重複除去プログラムは、
コンピュータを、
第1乃至第N(≧3)のブルームフィルタと、
格納対象データと同内容のデータが記憶装置内に存在することを示す情報が各ブルームフィルタに登録されているか否かを判断する処理を、当該情報が登録されていない未登録ブルームフィルタを見出すか、当該情報が前記第Nのブルームフィルタに登録されていることを見出すまで、前記第1乃至第Nのブルームフィルタについて順次行い、前記未登録ブルームフィルタを見出した場合には、前記格納対象データが前記記憶装置内に存在することを示す情報を前記未登録ブルームフィルタに登録する計数部と、
前記計数部により前記未登録ブルームフィルタが見出された場合には、前記格納対象データを前記記憶装置に格納し、前記計数部によりに前記情報が前記第Nのブルームフィルタに登録されていることが見出された場合には、前記格納対象データを前記記憶装置内の同内容のデータに対応づけるインデックス情報を前記記憶装置に格納する重複除去部と、
を備える装置として動作させる。
N(≧3)個目の重複データからの重複除去が効率的に行える技術を提供できる。
実施形態に係る重複除去装置のハードウェア構成図である。 実施形態に係る重複除去装置の機能ブロック図である。 実施形態に係る重複除去装置が備える計数部が実行する計数処理の流れ図である。 実施形態に係る重複除去装置の動作内容の説明図(その1)である。 実施形態に係る重複除去装置の動作内容の説明図(その2)である。 実施形態に係る重複除去装置の動作内容の説明図(その3)である。
以下、本発明の実施形態について、図面を参照して詳細に説明する。尚、以下で説明する実施形態は、本発明の一例に過ぎず、本発明は、実施形態とは具体的な構成/手順が異なる形でも実現することができるものである。
図1に、実施形態に係る重複除去装置10のハードウェア構成図を示す。また、図2に、実施形態に係る重複除去装置10の機能ブロック図を示す。
図1に示してあるように、本実施形態に係る重複除去装置10は、記憶装置30及びホスト100と接続されるコンピュータ50のHDD(Hard Disk Drive)13に、OS(Operating System)、重複除去プログラム18等をインストールした装置である。
重複除去プログラム18は、コンピュータ50を、図2に示したような重複除去装置1
0、すなわち、計数部20と重複除去部25とを備えた重複除去装置10として動作させるプログラムである。
重複除去部25は、計数部20から通常格納指示情報と共に格納対象データ及びその論
理ブロックアドレスが送信されてきた場合に、当該格納対象データを記憶装置30内に格納するユニット(機能ブロック)である。また、重複除去部25は、計数部20からインデックス情報格納指示情報と共に格納対象データ及びその論理ブロックアドレスが送信されてきた場合に、当該格納対象データを記憶装置30内の同内容のデータに対応づけるためのインデックス情報を記憶装置30内に格納するユニットともなっている。
この重複除去部25が行う処理は、一般的な重複除去装置/重複除去ストレージシステム内の重複除去エンジンと本質的には同内容のものである。そのため、当該処理の詳細説明は省略する。
計数部20は、ホスト100から受信した格納対象データ(及びその論理ブロックアドレス)毎に、格納対象データ自体、格納対象データのインデックス情報のいずれを記憶装置30内に格納するかを決定し、重複除去部25に対して、決定した情報の格納を指示するユニットである。
計数部20は、k(≧2)個のハッシュ関数と、第1のブルームフィルタ22から第N(≧3)のブルームフィルタ22までのN個のブルームフィルタ22とを有している。尚、N値としては、通常、記憶装置30の利用パターンとメモリサイズとを考慮して定めた値が使用される。以下、第i(1≦i≦N)のブルームフィルタ22のことを、第i−BF22又は第iのBF22とも表記する。
各ハッシュ関数により得られることがある各ハッシュ値は、個々のブルームフィルタ22のいずれかのビットに対応付けられている。
また、図2中に点線で模式的に示しあるように、各ブルームフィルタ22のビット数は、第1のブルームフィルタ22、第2のブルームフィルタ22、…、第Nのブルームフィルタ22の順に少なくなっている。尚、各ブルームフィルタ22のビット数をそのように定めている理由については後述するが、k値、各ブルームフィルタ22のビット数は、擬陽性による誤判定の確率が十分に小さくなるようにも定められている。
そして、計数部20は、ホスト100から格納対象データを受信した場合、図3に示した手順の計数処理を実行するように構成(プログラミング)されている。
すなわち、ホスト100から格納対象データを受信した計数部20は、まず、変数iに“1”をセットする(ステップS101)。次いで、計数部20は、k個のハッシュ関数を用いて格納対象データについてのk個のハッシュ値を算出する(ステップS102)。
その後、計数部20は、各算出ハッシュ値に対応づけられている、第i−BF22のビット値に基づき、格納対象データが新規データであるか否かを判定する処理(ステップS103)を行う。すなわち、このステップS103にて、計数部20は、第i−BF22から、各算出ハッシュ値に対応づけられているビット値を読み出す。そして、計数部20は、或る算出ハッシュ値に対応づけられているビット値が“0”であった場合には、格納対象データが新規データであると判定してステップS103の処理を終了する。また、計数部20は、全ての算出ハッシュ値に対応づけられているビットの値が“1”であった場合には、格納対象データが新規データではない(格納対象データと同内容のデータが記憶装置30内に格納されている)と判定してステップS103の処理を終了する。
格納対象データが新規データであると判定した場合(ステップS104;YES)、計数部20は、各算出ハッシュ値に対応付けられている第i−BFの各ビットに“1”を設定する(ステップS105)。そして、計数部20は、重複除去部25に対して、通常格
納指示情報、格納対象データ及びその論理ブロックアドレスを送信(ステップS106)してから、この計数処理を終了する。
一方、格納対象データが新規データではないと判定した場合(ステップS104;NO)、計数部20は、変数iに“1”を加算する(ステップS107)。次いで、計数部20は、i>Nが成立しているか否かを判断(ステップS108)し、i>Nが成立していなかった場合(ステップS108;NO)には、ステップS103以降の処理を開始する。
計数部20は、このような処理を繰り返しているうちに、i>Nが成立した場合(ステップS108;YES)には、重複除去部25に対して、インデックス情報格納指示情報、格納対象データ及びその論理ブロックアドレスを送信(ステップS109)してから、この計数処理を終了する。
以下、N=3である場合を例に、図4A〜図4Cを用いて、重複除去装置10の動作をさらに具体的に説明する。
各BF22の全ビットが“0”となっている状況下、同一内容の更新対象データ(以下、単に、データと表記する)X1〜X4がこの順にホスト100から送信されてきた場合を考える。
この場合、データX1は、i=1の状態で実行されるステップS103の処理で、新規データであると判定される。そのため、ステップS105の処理により、図4Aに模式的に示したように、データX1が記憶装置30内に存在していることを示す情報(“データX1”)が第1−BF22に登録される。そして、ステップS106の処理が行われるため、データX1が記憶装置30内に格納されることになる。
また、更新対象データX2は、i=1の状態で実行されるステップS103の処理では、新規データではないと判定され、i=2の状態で実行されるステップS103の処理で、新規データであると判定される。そのため、ステップS105の処理により、図4Bに模式的に示したように、データX2が記憶装置30内に存在していることを示す情報(“データX2”)が第2−BF22に登録される。また、ステップS106の処理が行われるため、データX2が記憶装置30内に格納されることになる。
データX3については、i=1、2の状態で実行されるステップS103の処理では、新規データではないと判定され、i=3の状態で実行されるステップS103の処理で、新規データであると判定される。そのため、ステップS105の処理により、図4Cに模式的に示したように、更新対象データX3が記憶装置30内に存在していることを示す情報(“データX3”)が第3−BF22に登録される。また、ステップS106の処理が行われるため、データX3が記憶装置30内に格納されることになる。
データX4については、i=1〜3の状態で実行されるステップS103の処理では、新規データではないと判定される。そして、i=3の状態でステップS107の処理が行われると、i>Nが成立することになる。そのため、データX4、すなわち、N個目の重複データについては、ステップS109の処理が行われて、記憶装置30内にデータX4自体ではなくインデックス情報が記憶されることになる。
以上説明したように、本実施形態に係る重複除去装置10は、データ数によらず高速に実行可能なBF22によるデータの有無の判定をN回繰り返すことによりN個目の重複データからの重複除去を行う構成を有している。そして、重複数のカウンタによる管理は、
データ数によっては、カウントアップするデータの検索に時間が掛かるものなのであるから、本実施形態に係る重複除去装置10は、N(≧3)個目の重複データからの重複除去が、効率的に(メモリサイズに合わせた、重複除去の管理データの格納が可能な形で)行える装置となっていると言うことが出来る。
《変形形態》
上記した重複除去装置10は、各種の変形を行えるものである。例えば、重複除去装置10を、ビット数が同一のN個のBF22を備えた装置に変形することが出来る。ただし、上記手順の処理により、第j(≧2)のBF22にて管理されることになるデータの個数は、第i-1のBF22で管理されることになるデータの個数より常に小さくなる。従
って、メモリの記憶容量が無駄に使用されないようにするために、BF22のビット数は、後段側のBF22のビット数の方が小さくなるようにしておくことが好ましいのであるが、例えば、第NのBF22のみのビット数を少なくしておくことも出来る。
以上、開示した技術に関し、更に以下の付記を開示する。
(付記1) 第1乃至第N(≧3)のブルームフィルタと、
格納対象データと同内容のデータが記憶装置内に存在することを示す情報が各ブルームフィルタに登録されているか否かを判断する処理を、当該情報が登録されていない未登録ブルームフィルタを見出すか、当該情報が前記第Nのブルームフィルタに登録されていることを見出すまで、前記第1乃至第Nのブルームフィルタについて順次行い、前記未登録ブルームフィルタを見出した場合には、前記格納対象データが前記記憶装置内に存在することを示す情報を前記未登録ブルームフィルタに登録する計数部と、
前記計数部により前記未登録ブルームフィルタが見出された場合には、前記格納対象データを前記記憶装置に格納し、前記計数部によりに前記情報が前記第Nのブルームフィルタに登録されていることが見出された場合には、前記格納対象データを前記記憶装置内の同内容のデータに対応づけるインデックス情報を前記記憶装置に格納する重複除去部(25)と、
を備えることを特徴とする重複除去装置。
(付記2) 第1のブルームフィルタのビット長が、第Nのブルームフィルタのビット長よりも長い
ことを特徴とする付記1に記載の重複除去装置。
(付記3) 各ブルームフィルタのビット数が、第1乃至第Nのブルームフィルタの順に小さくなる
ことを特徴とする付記1に記載の重複除去装置。
(付記4) コンピュータが、
格納対象データと同内容のデータが記憶装置内に存在することを示す情報が各ブルームフィルタに登録されているか否かを判断する処理を、当該情報が登録されていない未登録ブルームフィルタを見出すか、当該情報が第Nのブルームフィルタに登録されていることを見出すまで、第1乃至第Nのブルームフィルタについて順次行い、
前記未登録ブルームフィルタを見出した場合には、前記格納対象データが前記記憶装置内に存在することを示す情報を前記未登録ブルームフィルタに登録すると共に、前記格納対象データを前記記憶装置に格納し、
前記情報が前記第Nのブルームフィルタに登録されていることを見出した場合には、前記格納対象データを前記記憶装置内の同内容のデータに対応づけるインデックス情報を前記記憶装置に格納する
ことを特徴とする重複除去方法。
(付記5) コンピュータを、
第1乃至第N(≧3)のブルームフィルタと、
格納対象データと同内容のデータが記憶装置内に存在することを示す情報が各ブルームフィルタに登録されているか否かを判断する処理を、当該情報が登録されていない未登録ブルームフィルタを見出すか、当該情報が前記第Nのブルームフィルタに登録されていることを見出すまで、前記第1乃至第Nのブルームフィルタについて順次行い、前記未登録ブルームフィルタを見出した場合には、前記格納対象データが前記記憶装置内に存在することを示す情報を前記未登録ブルームフィルタに登録する計数部と、
前記計数部により前記未登録ブルームフィルタが見出された場合には、前記格納対象データを前記記憶装置に格納し、前記計数部によりに前記情報が前記第Nのブルームフィルタに登録されていることが見出された場合には、前記格納対象データを前記記憶装置内の同内容のデータに対応づけるインデックス情報を前記記憶装置に格納する重複除去部と、
を備える装置として動作させることを特徴とする重複除去プログラム。
(付記6) コンピュータを、
第1乃至第N(≧3)のブルームフィルタと、
格納対象データと同内容のデータが記憶装置内に存在することを示す情報が各ブルームフィルタに登録されているか否かを判断する処理を、当該情報が登録されていない未登録ブルームフィルタを見出すか、当該情報が前記第Nのブルームフィルタに登録されていることを見出すまで、前記第1乃至第Nのブルームフィルタについて順次行い、前記未登録ブルームフィルタを見出した場合には、前記格納対象データが前記記憶装置内に存在することを示す情報を前記未登録ブルームフィルタに登録する計数部と、
前記計数部により前記未登録ブルームフィルタが見出された場合には、前記格納対象データを前記記憶装置に格納し、前記計数部によりに前記情報が前記第Nのブルームフィルタに登録されていることが見出された場合には、前記格納対象データを前記記憶装置内の同内容のデータに対応づけるインデックス情報を前記記憶装置に格納する重複除去部と、
を備える装置として動作させる重複除去プログラムを記録したコンピュータ可読媒体。
10 重複除去装置
11 CPU
12 メモリ
13 HDD
18 重複除去スプログラム
20 計数部
22 ブルームフィルタ
25 重複除去部
30 記憶装置
50 コンピュータ
100 ホスト

Claims (5)

  1. 第1乃至第N(≧3)のブルームフィルタと、
    格納対象データと同内容のデータが記憶装置内に存在することを示す情報が各ブルームフィルタに登録されているか否かを判断する処理を、当該情報が登録されていない未登録ブルームフィルタを見出すか、当該情報が前記第Nのブルームフィルタに登録されていることを見出すまで、前記第1乃至第Nのブルームフィルタについて順次行い、前記未登録ブルームフィルタを見出した場合には、前記格納対象データが前記記憶装置内に存在することを示す情報を前記未登録ブルームフィルタに登録する計数部と、
    前記計数部により前記未登録ブルームフィルタが見出された場合には、前記格納対象データを前記記憶装置に格納し、前記計数部によりに前記情報が前記第Nのブルームフィルタに登録されていることが見出された場合には、前記格納対象データを前記記憶装置内の同内容のデータに対応づけるインデックス情報を前記記憶装置に格納する重複除去部と、
    を備えることを特徴とする重複除去装置。
  2. 第1のブルームフィルタのビット長が、第Nのブルームフィルタのビット長よりも長い
    ことを特徴とする請求項1に記載の重複除去装置。
  3. 各ブルームフィルタのビット数が、第1乃至第Nのブルームフィルタの順に小さくなる
    ことを特徴とする請求項1に記載の重複除去装置。
  4. コンピュータが、
    格納対象データと同内容のデータが記憶装置内に存在することを示す情報が各ブルームフィルタに登録されているか否かを判断する処理を、当該情報が登録されていない未登録ブルームフィルタを見出すか、当該情報が第Nのブルームフィルタに登録されていることを見出すまで、第1乃至第Nのブルームフィルタについて順次行い、
    前記未登録ブルームフィルタを見出した場合には、前記格納対象データが前記記憶装置内に存在することを示す情報を前記未登録ブルームフィルタに登録すると共に、前記格納対象データを前記記憶装置に格納し、
    前記情報が前記第Nのブルームフィルタに登録されていることを見出した場合には、前記格納対象データを前記記憶装置内の同内容のデータに対応づけるインデックス情報を前記記憶装置に格納する
    ことを特徴とする重複除去方法。
  5. コンピュータを、
    第1乃至第N(≧3)のブルームフィルタと、
    格納対象データと同内容のデータが記憶装置内に存在することを示す情報が各ブルームフィルタに登録されているか否かを判断する処理を、当該情報が登録されていない未登録ブルームフィルタを見出すか、当該情報が前記第Nのブルームフィルタに登録されていることを見出すまで、前記第1乃至第Nのブルームフィルタについて順次行い、前記未登録ブルームフィルタを見出した場合には、前記格納対象データが前記記憶装置内に存在することを示す情報を前記未登録ブルームフィルタに登録する計数部と、
    前記計数部により前記未登録ブルームフィルタが見出された場合には、前記格納対象データを前記記憶装置に格納し、前記計数部によりに前記情報が前記第Nのブルームフィルタに登録されていることが見出された場合には、前記格納対象データを前記記憶装置内の同内容のデータに対応づけるインデックス情報を前記記憶装置に格納する重複除去部と、
    を備える装置として動作させることを特徴とする重複除去プログラム。
JP2012183085A 2012-08-22 2012-08-22 重複除去装置、重複除去方法及び重複除去プログラム Expired - Fee Related JP5842768B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012183085A JP5842768B2 (ja) 2012-08-22 2012-08-22 重複除去装置、重複除去方法及び重複除去プログラム
US13/958,668 US9122407B2 (en) 2012-08-22 2013-08-05 Deduplication device and deduplication method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012183085A JP5842768B2 (ja) 2012-08-22 2012-08-22 重複除去装置、重複除去方法及び重複除去プログラム

Publications (2)

Publication Number Publication Date
JP2014041452A JP2014041452A (ja) 2014-03-06
JP5842768B2 true JP5842768B2 (ja) 2016-01-13

Family

ID=50148946

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012183085A Expired - Fee Related JP5842768B2 (ja) 2012-08-22 2012-08-22 重複除去装置、重複除去方法及び重複除去プログラム

Country Status (2)

Country Link
US (1) US9122407B2 (ja)
JP (1) JP5842768B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105993094B (zh) * 2014-06-18 2017-10-24 皇家飞利浦有限公司 用于控制电池组的多个电池的设备和方法
US9634992B1 (en) * 2015-02-28 2017-04-25 Palo Alto Networks, Inc. Probabilistic duplicate detection
CN106649346B (zh) * 2015-10-30 2020-09-22 北京国双科技有限公司 数据重复性校验方法及装置
JP6724534B2 (ja) 2016-05-09 2020-07-15 富士通株式会社 情報処理装置、重複除去プログラム、及び重複除去方法
US10162554B2 (en) 2016-08-03 2018-12-25 Samsung Electronics Co., Ltd. System and method for controlling a programmable deduplication ratio for a memory system
US11429587B1 (en) * 2017-06-29 2022-08-30 Seagate Technology Llc Multiple duration deduplication entries
CN110933149A (zh) * 2019-11-18 2020-03-27 湖南警察学院 一种云存储安全去重方法和系统
US11809378B2 (en) 2021-10-15 2023-11-07 Morgan Stanley Services Group Inc. Network file deduplication using decaying bloom filters
US11874801B2 (en) 2022-02-14 2024-01-16 Seagate Technology Llc Deduplication in multiple-tiered storage systems
CN115454983B (zh) * 2022-09-13 2023-07-14 浪潮卓数大数据产业发展有限公司 一种基于布隆过滤器的海量Hbase数据去重方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0916607A (ja) 1995-06-26 1997-01-17 Hitachi Ltd データベース管理システムにおけるインデクス管理方法
US6928526B1 (en) * 2002-12-20 2005-08-09 Datadomain, Inc. Efficient data storage system
WO2008151674A1 (en) 2007-06-15 2008-12-18 Telefonaktiebolaget Lm Ericsson (Publ) Method of discovering overlapping cells
JP2011171995A (ja) 2010-02-18 2011-09-01 Nippon Telegr & Teleph Corp <Ntt> データ判別装置、データ判別方法およびデータ判別プログラム
US9639543B2 (en) * 2010-12-28 2017-05-02 Microsoft Technology Licensing, Llc Adaptive index for data deduplication
JP2014130549A (ja) * 2012-12-28 2014-07-10 Fujitsu Ltd ストレージ装置、制御方法、および制御プログラム
US9558199B2 (en) * 2013-03-07 2017-01-31 Jive Software, Inc. Efficient data deduplication

Also Published As

Publication number Publication date
US20140059016A1 (en) 2014-02-27
US9122407B2 (en) 2015-09-01
JP2014041452A (ja) 2014-03-06

Similar Documents

Publication Publication Date Title
JP5842768B2 (ja) 重複除去装置、重複除去方法及び重複除去プログラム
US10620869B2 (en) Storage control device, storage control method, and recording medium
JP5881859B2 (ja) ストレージ装置
US9851917B2 (en) Method for de-duplicating data and apparatus therefor
EP2770446A1 (en) Data processing method and device
US8255406B2 (en) Data management using multi-state bloom filter
JP2005122702A5 (ja)
WO2014157244A1 (ja) ストレージ制御装置、ストレージ制御方法、およびストレージ制御プログラム
US10007436B2 (en) Storage control apparatus and control method of storage control apparatus
JP2017084338A (ja) フラッシュメモリのフラッシングを改善する方法およびシステム
US8782375B2 (en) Hash-based managing of storage identifiers
CN107122130A (zh) 一种数据重删方法及装置
JP2017049806A (ja) ストレージ制御装置およびストレージ制御プログラム
WO2011019029A1 (ja) データ処理装置、データ記録方法、データ記録プログラム
CN111638925A (zh) 一种接口方法表生成方法、函数指针查询方法及装置
JP5729479B2 (ja) 仮想テープ装置及び仮想テープ装置の制御方法
JP5849969B2 (ja) データ管理装置、システム、プログラム、および、方法
US8341376B1 (en) System, method, and computer program for repartitioning data based on access of the data
US9858179B2 (en) Data sort using memory-intensive exosort
JP6112193B2 (ja) アクセス制御プログラム、ディスク装置及びアクセス制御方法
KR101341995B1 (ko) 공유 데이터 저장소 관리 장치 및 방법
JP2007004326A (ja) データアクセス方法及びそのプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150203

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151014

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151020

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151102

R150 Certificate of patent or registration of utility model

Ref document number: 5842768

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees