JP4975724B2 - 低冗長記憶システム内のサブブロックの存在を検出する方法 - Google Patents
低冗長記憶システム内のサブブロックの存在を検出する方法 Download PDFInfo
- Publication number
- JP4975724B2 JP4975724B2 JP2008500013A JP2008500013A JP4975724B2 JP 4975724 B2 JP4975724 B2 JP 4975724B2 JP 2008500013 A JP2008500013 A JP 2008500013A JP 2008500013 A JP2008500013 A JP 2008500013A JP 4975724 B2 JP4975724 B2 JP 4975724B2
- Authority
- JP
- Japan
- Prior art keywords
- sub
- block
- index
- bits
- bit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/174—Redundancy elimination performed by the file system
- G06F16/1744—Redundancy elimination performed by the file system using compression, e.g. sparse files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/13—File access structures, e.g. distributed indices
- G06F16/137—Hash-based
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
用語
欠落サブブロック:記憶装置内に存在しないサブブロック。
インデックス:サブブロック・インデックス参照
インデックス・バッファ:インデックス・エントリ書込みバッファ参照。
インデックス・エントリ:サブブロック・インデックス内のレコード。ある実施形態の場合には、インデックス・レコードは、インデックス・キーおよびインデックス値を含む。ある実施形態の場合には、インデックス・レコードは、インデックス・キーの一部およびインデックス値を含む。ある実施形態の場合には、インデックス・レコードはインデックス値だけを含む。ある実施形態の場合には、インデックス・レコードは値を含まないで、キーの一部または全部を含む。
データをサブブロックに分割するために種々の方法を使用することができる。これらの方法としては、(データがNバイトのサブブロックに分割される)固定長分割、およびデータがその位置に近いバイト(またはビット)がある所定の制約を満たす位置のところで可変長サブブロックに分割される可変長分割等がある。Williams Rの米国特許第5,990,810号に、可変長分割方法が詳細に記載されている。
6.2 サブブロックのハッシュ
少なくとも2つのタイプのハッシュ方法を使用することができる。
6.3 ビットフィルタの重要な特性
ビットフィルタの最も重要な特性は、サブブロックが「1」ビットにハッシュした場合、ビットフィルタが存在していても存在していなくてもよいことであるが、サブブロックが「0」にハッシュした場合には、サブブロックは記憶装置内に絶対存在しないということである。ビットフィルタを有用にしているのはこの確実性である。
6.4 ビットフィルタの密度とサイズ
ビットフィルタのサイズはどのくらいの大きさであるべきか?「1」ビットが所与の数である場合、ビットフィルタが大きければ大きいほど、メモリの消費量は大きくなるが、密度(ビットフィルタ内のビットに対する「1」ビットの比率)は小さくなる。ビットフィルタが小さければ小さいほど、メモリの消費量は少ないが、密度は大きくなる。それ故、メモリの消費量とビットフィルタの密度の間にはトレードオフがある。
6.5 ビットフィルタの成長
ビットフィルタのサイズをどのように選択したにせよ、その密度は時間の経過ととも増大する。何故なら、サブブロックがインデックスに追加されるからである。密度があまり大きくなると、偽陽性率を低減するためにビットフィルタのサイズを増大することができる。
6.6 インデックス・エントリ書込みバッファ
種々の方法によりインデックス・エントリ書込みバッファを実施することができる。バッファにインデックス・エントリを追加することができるものでなければならないし、ある実施形態の場合には、バッファを探索するための要件がある場合がある。
6.7 偽陽性
ビットフィルタを使用した場合の1つの問題は、「偽陽性」の問題である。この場合、サブブロックはビットフィルタ内の「1」ビットにハッシュするが、インデックスにアクセスした場合に、サブブロックが記憶装置内に存在しないことが分かる。ビットフィルタの密度が1/Dである場合には、これらの偽陽性が、D個の欠落サブブロックごとに平均1回発生する。偽陽性は、ディスク上のインデックスに対してランダム・アクセス読出しを行う恐れがある。
6.8 短い一致するランのスキップ
偽陽性を低減するためのより興味のあるアプローチは、BLOBフラグメンテーション中に、偽陽性をアドレス指定する方法である。BLOBが格納されていて、そのサブブロックが記憶装置内で発見されない場合には、サブブロックは、通常、記憶装置内に順次書き込まれる。しかし、サブブロックが一致した場合には、システムは、1つまたは複数の一致するサブブロックのランを処理しなければならない。そのランが非常に短い場合には、BLOBの表示は、スペースをほんの少し低減するためにフラグメント化される。図9の場合には、1つのサブブロックCが記憶装置内にすでに存在するという理由だけで、BLOB290の表示は3つの部分91、92、93に分割される。
6.9 各サブブロックに対する複数のビットの設定
偽陽性率を低減するためのもう1つの方法は、ビットフィルタ202内のN個の位置(ここで、Nは小さな正の整数)に各サブブロック200をマッピングし、ビットをN個すべての位置に設定するという方法である。このことはN個の異なるハッシュ関数204を使用することにより達成することができる。図20は、3つの異なるハッシュ関数(H1,H2,H3)を使用して、1つのサブブロック200をビットフィルタ内で3つの位置にハッシュし、3つのビットを設定する方法を示す。
6.10 ビットフィルタの圧縮
偽陽性率を低くするために、ビットフィルタはまばらでなければならないし、ビットフィルタがまばらだと、エントロピーは低くなり、大きく圧縮することができる。さらに、ビットフィルタ内でビットが設定される無秩序な方法のために、ビットフィルタは、メモリレス2進乱数発生装置の出力を、「1」の1/Dの確率、および「0」の(D−1)/Dの確率で近似する(ここで、Dはビットフィルタの密度である)。このことは、データの複雑なモデルを構成しなくても圧縮を行うことができることを意味する。最も重要なことは、ビットフィルタの密度が分かっている限り、(データの大きな圧縮片に関連して)圧縮損失なしで、その個々の小片を個々に圧縮することができることである。
6.11 ラン・レングス符号化ビットフィルタ圧縮
ビットフィルタを圧縮するための1つの簡単な技術は、(「0」が「1」より多いソースに対する)「0」ビット・ランの長さである数のシーケンスとしてビットフィルタが表示されるラン・レングス符号化である。種々のラン・レングス符号化方法は、主としてこれらの方法がラン・レングスを表示する方法において異なる。
6.12 TanakaおよびLeon−Garciaビットフィルタ圧縮
TanakaおよびLeon−Garciaによるラン・レングス符号化の特定の形式を使用すれば、ラン・レングス符号化の簡単さを保持しながら非常に効率的な圧縮を行うことができる。
00000000 0
1 1000
01 1001
001 1010
0001 1011
00001 1100
000001 1101
0000001 1110
00000001 1111
TanakaおよびLeon−Garciaは、任意の2値メモリレス・ソースの場合には(1つのパラメータPにより選択した場合 − 「1」ビットの確率)、その理論的な圧縮性に対して少なくとも96%の効率でそのソースを圧縮するモード−mコードが存在することを示した。mの式は下記の通りである。
gamma=(squareroot(5)-1)/2
if(count(one_bits)=0)
p=1 / count(total_bits)
else
p=count(one_bits) / count(total_bits)
endif
m=ceiling( log2((ln
gamma) / ln(1-p)) )
それ故、この方法を使用してビットのブロックを圧縮するために、「1」ビットおよびビットの全数がカウントされ、最適のmが計算され、ブロックがモードmコードを使用して符号化される。コードmのモードは符号化ブロックの始まりのところに格納することができる。詳細については、Hatsukazu TanakaおよびAlbert Leon−Garciaの、「効率的なラン・レングス符号化」(Efficient Run−Length Encodings)情報理論についてのIEEE議事録、28(6)、1982年11月、880〜890ページを参照されたい。
6.13 ビットフィルタの算術符号化
算術符号化は、ビットフィルタを圧縮するための最もスペースを効率的に使用する方法であるが、ある実施形態の場合には、ラン・レングス符号化に関連して複雑さおよびおそらく速度の低下が起こる。2値算術コードについては、Langdon G.GおよびRissanen J.Jの参照文献内の、「算術符号化による白黒映像の圧縮」(Compression of Black−White Images with Arithmetic Coding)、通信に関するIEEE議事録、29(6)、1981年、858〜867ページで、LangdonおよびRissanenが記述している。
6.14 ビットフィルタの非線形圧縮
ビットフィルタ圧縮の興味のある面は、(所与の数の「1」ビットに対して)ビットフィルタのサイズを2倍にしても、圧縮したビットフィルタのサイズが2倍にならないことである。代わりに、そうすると少ない量だけサイズが増大する。何故なら、それは、2倍にしたビットフィルタの密度が元の密度の半分になり、エントロピーの低減が大きなビットフィルタをより圧縮しやすくするからである。
-log2(1-p)ビット
各「1」ビットは下記のように圧縮することができる。
-log2(p)ビット
このことは、平均的に、ビットフィルタ内の各ビットは、下記のように圧縮することができることを意味し、
-(1-p)log2(1-p) - plog2(p)ビット
この式が図11のグラフの形を決定することを意味する。
6.15 ビットフィルタの分割
新しい各サブブロックが到着すると、ビットが「0」であるか「1」であるかを判定するために、(このサブブロックをビットフィルタ位置にハッシュすることにより)ビットフィルタ内でこのサブブロックがルックアップされる。全ビットフィルタを圧縮する場合には、各ルックアップの前に全ビットフィルタを圧縮解除しなければならないし(またはビットがアクセスされる前に、少なくともその一部を圧縮解除しなければならない)、時間がかかり、その出力(圧縮解除したビットフィルタ)は、圧縮したビットフィルタよりも数百倍大きくなる場合がある。
6.16 欠落サブブロックの処理
図17は、(多くの場合、欠落サブブロックのラン内で発生する)1つの欠落サブブロック170の、ビットフィルタ171およびインデックス・エントリ書込みバッファに関連する処理方法を示す。この図は、囲みBLOB172の格納の一部として、格納中のサブブロックEの処理の経過を示す。最初に、サブブロックEは、ビットフィルタ内である位置を形成するためにハッシュされ173、その後でその位置の内容である2進数にハッシュされる。Eが記憶装置内に存在せず(およびこのセクションがこのケースに焦点を当てている場合には)、ビットは「0」である。何故なら、サブブロックが格納されようとしているし、サブブロックEの存在を記録するために、ビットフィルタ内のビットが「1」に設定されるからである。次に、サブブロックは、記憶システム、およびサブブロックをその格納位置にマッピングする準備した175インデックス・エントリ内のある場所に格納される174。このインデックス・エントリ176は、後でディスク179上のサブブロック・インデックス178に書き込まれるインデックス・エントリ書込みバッファ177に追加される。この全プロセスのある態様は、(サブブロックE自身の内容もメモリ内にバッファされると仮定した場合)全プロセスは、1回のディスク・アクセスを必要としない。
6.17 遠隔記憶システムの表示
分散記憶用途および通信用途の場合には、本発明の1つの態様を、例えば、サブブロックを遠隔コンピュータに送信する必要があるか否かを判定するために、遠隔コンピュータ上の一組のサブブロックの存在を表示するために使用することができる。一般に、本発明の1つの態様は、ビットフィルタを格納しているコンピュータ上だけではなく、世界のどこか他の場所の1つまたは複数のコンピュータ上の数組のサブブロックを表示するために使用することができる。図19は、コンピュータA 190による、他のコンピュータB 194上に格納しているサブブロックの集合体に対応するビットフィルタ192の維持方法を示す。この例の場合には、コンピュータAは、コンピュータBがサブブロックX 196を処理しないと判定するためにそのビットフィルタを使用することができる。
6.18 ロバスト性
本発明の典型的な実施形態の場合には、インデックスはディスク上に常駐していて、ビットフィルタおよびインデックス・エントリ書込みバッファはメモリ内に常駐している(図12)。典型的な場合には、ビットフィルタのコピーは、時々更新されるディスク上に維持される。システムがクラッシュした場合、この編成はどのように対応するか?
コンピュータがクラッシュし、メモリの内容が失われた場合には、ビットフィルタ内の種々のビットの設定も失われる(何故なら、ディスク上のビットフィルタの古いコピーは、これらの位置のあるもの内に「1」よりも「0」を有しているからである)。インデックス・エントリ書込みバッファ内のインデックス・エントリも失われる。
6.19 範囲に関する注
当業者であれば、本発明は、上記の特定の用途に限定されないことを理解することができるだろう。また、本発明は、本明細書に記載し図面に示した特定の要素および/または機能に関してその好ましい実施形態に限定されない。本発明の原理から逸脱することなしに、種々の修正を行うことができることを理解することができるだろう。それ故、本発明は、本発明の範囲内に入るすべてのこのような修正を含むものと解釈すべきである。
Claims (17)
- 記憶システム内に常駐するサブブロックの存在を表すコンピュータによる制御方法であって、
前記サブブロックに対応するインデックス・ハッシュ値を得るためにサブブロックをハッシュし、
前記サブブロックに対応する前記インデックス・ハッシュ値を入力し且つビットのアレイの中にビットを出力し且つ前記サブブロックをビットのアレイの位置にマッピングする関数を用いてビットのアレイを生成し、当該生成において、前記ビットのアレイの1つのビットが、前記ビットのアレイに前記ビットの位置をマッピングする記憶システム内で少なくとも1つのサブブロックであるかどうかを示す1つの設定されたビット値であり、当該設定されたビット値のうち、第1の設定されたビット値が前記記憶システムの中にサブブロックが存在しないことを示し、第2の設定されたビット値が前記記憶システムの中にサブブロックが存在する可能性を示し、
前記サブブロックが前記記憶システム内に存在しない場合には、メモリ内に位置しているインデックス・エントリ・書込みバッファに前記インデックス・ハッシュ値を選択的に格納し、その場合に、当該インデックス・エントリ・書込みバッファが、前記記憶システム上に位置するサブブロック・インデックスの各位置に対応する複数のバッファ位置に分割され、および
前記記憶システムに対する1回の読出し動作および1回の書込み動作によって、前記インデックス・エントリ・書込みバッファのコンテンツを前記記憶システム上に位置するサブブロック・インデックスに転送し、その場合に、前記ビットのアレイはメモリ内に属し、前記サブブロック・インデックスはディスクに属する、
コンピュータによる制御方法。 - 前記関数がハッシュ関数である、請求項1に記載のコンピュータによる制御方法。
- 前記関数が、その結果が計算に入力される暗号ハッシュ関数である、請求項1に記載のコンピュータによる制御方法。
- 前記関数が、その結果が計算に入力される非暗号ハッシュ関数である、請求項1に記載のコンピュータによる制御方法。
- 前記計算がモジュロK演算であり、Kが前記ビットのアレイ内のビット数である、請求項3に記載のコンピュータによる制御方法。
- 複数の関数が、サブブロックを前記ビットのアレイ内の各位置にマッピングし、少なくとも1つのサブブロック/関数の組合せが前記ビットのアレイ内の各ビット位置にマッピングする場合には、前記ビットのアレイ内の前記ビットが前記設定されたビット値である、請求項1に記載のコンピュータによる制御方法。
- 前記ビットのアレイが、1つまたは複数のセクションに分割される、請求項6に記載のコンピュータによる制御方法。
- 各セクションが、圧縮方法により圧縮される、請求項7に記載のコンピュータによる制御方法。
- 前記インデックス・エントリ・書込みバッファが、複数のセクションに分割され、前記セクションのデータ容量が満たされた場合には、各セクションのデータが、前記記憶システム上のサブブロック・インデックスに転送される、請求項1に記載のコンピュータによる制御方法。
- 前記インデックス・エントリ・書込みバッファが設定されたレベルまで満たされた場合に、前記インデックスがメモリ内に読み込まれ、前記インデックス・エントリ・書込みバッファ内の要素が前記インデックスに追加され、次に、修正されたインデックスがディスクに書き込まれる、請求項1に記載のコンピュータによる制御方法。
- 一組のサブブロックが、複数の相互に排他的なスペース内に分割され、第2のビットのアレイが、前記記憶システム内の各サブブロックの存在を表す、請求項1に記載のコンピュータによる制御方法。
- 前記サブブロックの前記分割が、サブブロックをハッシュし、デジタル探索木を使用してサブブロック・ハッシュのスペースを分割することにより行われる、請求項11に記載のコンピュータによる制御方法。
- 前記インデックス・エントリ・書込みバッファが対応するように分割される、請求項11に記載のコンピュータによる制御方法。
- 前記ビットのアレイが、メモリ内に格納される、請求項9に記載のコンピュータによる制御方法。
- 請求項1の前記関数をサブブロックzに適用し、請求項1の方法により生成された前記ビットのアレイの対応するビット値を試験することにより、前記サブブロックzが記憶システム内に存在しないかどうかを判定するコンピュータによる制御方法。
- 請求項6の前記関数をサブブロックzに適用し、請求項6の方法により生成された前記ビットのアレイの対応するビット値を試験することにより、前記サブブロックzが記憶システム内に存在しないかどうかを判定するコンピュータによる制御方法であって、
前記ビットのアレイの試験されたビットがさらに設定されたビット値である場合には、前記サブブロックzが存在しないと判定する、コンピュータによる制御方法。 - サブブロックのシーケンス内で、明確に欠落した前記シーケンス内のサブブロックを試験するために、請求項15の方法を使用することにより前記シーケンス内の種々の位置において少なくともT個の存在するサブブロックに隣接するランが存在しないことを判定するコンピュータによる制御方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US66064105P | 2005-03-11 | 2005-03-11 | |
AU2005901173A AU2005901173A0 (en) | 2005-03-11 | Method for detecting the presence of subblocks in a reduced-redundancy storage system | |
AU2005901173 | 2005-03-11 | ||
US60/660,641 | 2005-03-11 | ||
PCT/AU2006/000328 WO2006094367A1 (en) | 2005-03-11 | 2006-03-10 | Method for detecting the presence of subblocks in a reduced-redundancy storage system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008533571A JP2008533571A (ja) | 2008-08-21 |
JP4975724B2 true JP4975724B2 (ja) | 2012-07-11 |
Family
ID=36952890
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008500013A Expired - Fee Related JP4975724B2 (ja) | 2005-03-11 | 2006-03-10 | 低冗長記憶システム内のサブブロックの存在を検出する方法 |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP1866776B1 (ja) |
JP (1) | JP4975724B2 (ja) |
WO (1) | WO2006094367A1 (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8190742B2 (en) | 2006-04-25 | 2012-05-29 | Hewlett-Packard Development Company, L.P. | Distributed differential store with non-distributed objects and compression-enhancing data-object routing |
US8099573B2 (en) | 2007-10-25 | 2012-01-17 | Hewlett-Packard Development Company, L.P. | Data processing apparatus and method of processing data |
WO2009054827A1 (en) | 2007-10-25 | 2009-04-30 | Hewlett-Packard Development Company, L.P. | Data processing apparatus and method of processing data |
US8150851B2 (en) | 2007-10-25 | 2012-04-03 | Hewlett-Packard Development Company, L.P. | Data processing apparatus and method of processing data |
US8140637B2 (en) | 2007-10-25 | 2012-03-20 | Hewlett-Packard Development Company, L.P. | Communicating chunks between devices |
US8332404B2 (en) | 2007-10-25 | 2012-12-11 | Hewlett-Packard Development Company, L.P. | Data processing apparatus and method of processing data |
DE112007003645B4 (de) | 2007-10-25 | 2011-06-16 | Hewlett-Packard Development Co., L.P., Houston | Datenverarbeitungsvorrichtung und Verfahren zur Datenverarbeitung |
WO2009131585A1 (en) | 2008-04-25 | 2009-10-29 | Hewlett-Packard Development Company, L.P. | Data processing apparatus and method of processing data |
US8788466B2 (en) | 2008-08-05 | 2014-07-22 | International Business Machines Corporation | Efficient transfer of deduplicated data |
US9063947B2 (en) | 2008-08-18 | 2015-06-23 | Hewlett-Packard Development Company, L.P. | Detecting duplicative hierarchical sets of files |
US8117343B2 (en) | 2008-10-28 | 2012-02-14 | Hewlett-Packard Development Company, L.P. | Landmark chunking of landmarkless regions |
US8375182B2 (en) | 2009-02-10 | 2013-02-12 | Hewlett-Packard Development Company, L.P. | System and method for segmenting a data stream |
US8001273B2 (en) | 2009-03-16 | 2011-08-16 | Hewlett-Packard Development Company, L.P. | Parallel processing of input data to locate landmarks for chunks |
US7979491B2 (en) | 2009-03-27 | 2011-07-12 | Hewlett-Packard Development Company, L.P. | Producing chunks from input data using a plurality of processing elements |
US9141621B2 (en) | 2009-04-30 | 2015-09-22 | Hewlett-Packard Development Company, L.P. | Copying a differential data store into temporary storage media in response to a request |
JP5463746B2 (ja) * | 2009-06-15 | 2014-04-09 | 日本電気株式会社 | アーカイブストレージ装置、ストレージシステム、データ格納方法、およびデータ格納プログラム |
US20110093439A1 (en) * | 2009-10-16 | 2011-04-21 | Fanglu Guo | De-duplication Storage System with Multiple Indices for Efficient File Storage |
US8660994B2 (en) | 2010-01-28 | 2014-02-25 | Hewlett-Packard Development Company, L.P. | Selective data deduplication |
JP5418719B2 (ja) * | 2011-09-16 | 2014-02-19 | 日本電気株式会社 | ストレージ装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0282332A (ja) * | 1988-09-20 | 1990-03-22 | Fujitsu Ltd | 索引ファイルのインデックス用入出力バッファ方式 |
JPH06103127A (ja) * | 1992-09-22 | 1994-04-15 | Kanebo Ltd | ハッシュファイルデータ管理装置およびハッシュファイルデータ管理方法 |
JPH06139280A (ja) * | 1992-10-29 | 1994-05-20 | Toshiba Corp | ファイル管理システム |
WO1996025801A1 (en) * | 1995-02-17 | 1996-08-22 | Trustus Pty. Ltd. | Method for partitioning a block of data into subblocks and for storing and communicating such subblocks |
GB9811574D0 (en) * | 1998-05-30 | 1998-07-29 | Ibm | Indexed file system and a method and a mechanism for accessing data records from such a system |
JP2000187668A (ja) * | 1998-12-22 | 2000-07-04 | Hitachi Ltd | グループ化方法と重複排除方法 |
US6704730B2 (en) * | 2000-02-18 | 2004-03-09 | Avamar Technologies, Inc. | Hash file system and method for use in a commonality factoring system |
CA2399555A1 (en) * | 2000-02-18 | 2001-08-23 | Avamar Technologies, Inc. | Hash file system and method for use in a commonality factoring system |
US6912645B2 (en) * | 2001-07-19 | 2005-06-28 | Lucent Technologies Inc. | Method and apparatus for archival data storage |
-
2006
- 2006-03-10 WO PCT/AU2006/000328 patent/WO2006094367A1/en not_active Application Discontinuation
- 2006-03-10 EP EP06705001.3A patent/EP1866776B1/en not_active Not-in-force
- 2006-03-10 JP JP2008500013A patent/JP4975724B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP1866776A4 (en) | 2010-10-20 |
EP1866776A1 (en) | 2007-12-19 |
EP1866776B1 (en) | 2015-12-30 |
JP2008533571A (ja) | 2008-08-21 |
WO2006094367A1 (en) | 2006-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4975724B2 (ja) | 低冗長記憶システム内のサブブロックの存在を検出する方法 | |
US8051252B2 (en) | Method and apparatus for detecting the presence of subblocks in a reduced-redundancy storage system | |
US9880746B1 (en) | Method to increase random I/O performance with low memory overheads | |
US7814129B2 (en) | Method and apparatus for storing data with reduced redundancy using data clusters | |
US8380688B2 (en) | Method and apparatus for data compression | |
JP4932726B2 (ja) | データのランダムに命名したブロック用の記憶システム | |
US9727573B1 (en) | Out-of core similarity matching | |
US9367557B1 (en) | System and method for improving data compression | |
US8527482B2 (en) | Method for reducing redundancy between two or more datasets | |
US7065619B1 (en) | Efficient data storage system | |
US8024382B2 (en) | Dynamic manipulation of archive files | |
CN107305586B (zh) | 索引生成方法、索引生成装置及搜索方法 | |
JP2008533570A (ja) | 低冗長記憶システムで索引を行う方法 | |
WO2006094365A1 (en) | Method for storing data with reduced redundancy using data clusters | |
US10977315B2 (en) | System and method for statistics-based pattern searching of compressed data and encrypted data | |
US5394143A (en) | Run-length compression of index keys | |
JP4768009B2 (ja) | データ・クラスタを使用する冗長性の少ないデータを格納する方法 | |
CN113366463A (zh) | 用于消除计算机存储器中的副本和值冗余的系统、方法和设备 | |
US8988258B2 (en) | Hardware compression using common portions of data | |
CN115454323A (zh) | 用于数据克隆操作的日志 | |
CN114461635A (zh) | 一种MySQL数据库数据存储方法、装置和电子设备 | |
KR101553028B1 (ko) | 고정 블록에 기반을 둔 가변 처리 파일 시스템 및 파일 가변 처리 방법 | |
CN117519576A (zh) | 去重存储系统的数据收纳缓冲区 | |
JP2003152548A (ja) | データ圧縮における文字列検索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090202 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110628 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110927 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111004 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120321 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120411 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4975724 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150420 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |