JP2018097450A - データ処理装置,データ処理プログラムおよびデータ処理方法 - Google Patents
データ処理装置,データ処理プログラムおよびデータ処理方法 Download PDFInfo
- Publication number
- JP2018097450A JP2018097450A JP2016239179A JP2016239179A JP2018097450A JP 2018097450 A JP2018097450 A JP 2018097450A JP 2016239179 A JP2016239179 A JP 2016239179A JP 2016239179 A JP2016239179 A JP 2016239179A JP 2018097450 A JP2018097450 A JP 2018097450A
- Authority
- JP
- Japan
- Prior art keywords
- data
- variable
- chunk
- search unit
- length block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
- G06F16/278—Data partitioning, e.g. horizontal or vertical partitioning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/174—Redundancy elimination performed by the file system
- G06F16/1748—De-duplication implemented within the file system, e.g. based on file segments
- G06F16/1752—De-duplication implemented within the file system, e.g. based on file segments based on file chunks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1448—Management of the data involved in backup or backup restore
- G06F11/1453—Management of the data involved in backup or backup restore using de-duplication of the data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1458—Management of the backup or restore process
- G06F11/1464—Management of the backup or restore process for networked environments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2379—Updates performed during online database operations; commit processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/84—Using snapshots, i.e. a logical point-in-time copy of the data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】複数の可変長ブロックデータからなるデータ列を、所定長の複数の検索単位領域に区分けし、各可変長ブロックデータを検索単位領域毎に管理し、データ列に対してデータアクセスを行なうに際して、データアクセス要求に含まれる位置情報に基づいて、アクセス対象の可変長ブロックデータが属する検索単位領域を特定し、特定した検索単位領域に属する可変長ブロックデータを対象に、データアクセス対象の可変長ブロックデータを検索する。
【選択図】図3
Description
図1は実施形態の一例としてのクラウドストレージシステム1の構成を例示する図である。
ファイルアクセス処理部22は、データファイルを複数のデータブロック(チャンク)に分割するデータ分割部としての機能を備える。例えば、ファイルアクセス処理部22は、バックアップサーバ53等の外部装置から受信するバックアップデータ(データファイル)を分割する。
ファイルアクセス処理部22は、ファイルシステム管理機能を備え、クラウドストレージ51に対してデータのリードやライトを行なう。
上述の如く構成された実施形態の一例としてのクラウドストレージシステム1におけるクラウドバックアップゲートウェイ10における処理を説明する。
図12は実施形態の一例としてのクラウドバックアップゲートウェイ10におけるファイルシステムとしてのライト処理の概要を説明するためのフローチャート(ステップA1〜A4)である。
次に、ファイルアクセス処理部22によるライト処理の詳細について説明する。
これにより、ライトデータの先頭部分に対応するチャンクは、リージョン0に属していることがわかる。
このように、ファイルアクセス処理部22は、ライト要求に含まれる位置情報(offset&size)に基づいて、ファイルにおける、ライトデータの先頭が書き込まれるチャンク(第1の可変長ブロックデータ)が属するリージョン(第1のリージョン,第1の検索単位領域)を特定する。
次に、ファイルアクセス処理部22は、チャンクマップテーブル243を参照して、先に特定したリージョン番号を有するレコード(チャンク)を取得する。図18に示す例においては、チャンク0,1,2が、リージョン0に属する。
これにより、ライトデータの末尾部分に対応するチャンクは、リージョン2に属していることがわかる。
次に、実施形態の一例としてのクラウドストレージシステム1におけるリード処置について説明する。
これにより、リード要求範囲の先頭部分に対応するチャンクは、リージョン0に属していることがわかる。
これにより、リード要求範囲の末尾部分に対応するチャンクは、リージョン2に属していることがわかる。
このように、実施形態の一例としてのクラウドストレージシステム1によれば、ファイルアクセス処理部22が可変長チャンキングを行ない、重複排除処理部21が、可変長チャンキングが行なわれた各チャンクについて、重複排除処理を行なう。
そして、開示の技術は上述した実施形態に限定されるものではなく、本実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。本実施形態の各構成および各処理は、必要に応じて取捨選択することができ、あるいは適宜組み合わせてもよい。
以上の実施形態に関し、さらに以下の付記を開示する。
複数の可変長ブロックデータからなるデータ列を、所定長の複数の検索単位領域に区分けし、各可変長ブロックデータを前記検索単位領域毎に管理するブロックデータ管理部と、
前記データ列に対してデータアクセスを行なうに際して、データアクセス要求に含まれる位置情報に基づいて、アクセス対象の可変長ブロックデータが属する検索単位領域を特定する検索単位領域特定部と、
特定した前記検索単位領域に属する前記可変長ブロックデータを対象に、データアクセス対象の可変長ブロックデータを検索するブロック検索部と
を備えることを特徴とする、データ処理装置。
前記データアクセスとして、前記データ列にライトデータをライトする場合に、
前記検索単位領域特定部が、ライト要求に含まれる前記位置情報に基づいて、前記データ列における、前記ライトデータの先頭が書き込まれる第1の可変長ブロックデータが属する第1の検索単位領域と、前記ライトデータの末尾が書き込まれる第2の可変長ブロックデータが属する第2の検索単位領域とを特定し、
前記ブロック検索部が、前記第1の検索単位領域から前記第1の可変長ブロックデータを抽出するとともに、前記第2の検索単位領域から前記第2の可変長ブロックデータを抽出し、
前記ライトデータの先頭に前記第1の可変長ブロックを、前記ライトデータの末尾に前記第2の可変長ブロックを、それぞれ結合することで更新データを作成し、当該更新データで前記データ列を部分的に置換するライト処理部
を備えることを特徴とする、付記1記載のデータ処理装置。
前記更新データを複数の可変長ブロックデータに分割し、各可変長ブロックデータについて重複排除処理を行なう重複排除処理部
を備えることを特徴とする、付記2記載のデータ処理装置。
前記データアクセスとして、前記データ列からリードデータをリードする場合に、
前記検索単位領域特定部が、リード要求に含まれる前記位置情報に基づいて、前記データ列における、前記リードデータの先頭となる第1の可変長ブロックデータが属する第1の検索単位領域と、前記リードデータの末尾となる第2の可変長ブロックデータが属する第2の検索単位領域とを特定し、
前記ブロック検索部が、前記第1の検索単位領域から前記第1の可変長ブロックデータを抽出するとともに、前記第2の検索単位領域から前記第2の可変長ブロックデータを抽出し、
前記データ列における、前記第1の可変長ブロックから前記第2の可変長ブロックまでの範囲内から、前記リードデータを抽出するリード処理部
を備えることを特徴とする、付記1〜3のいずれか1項に記載のデータ処理装置。
複数の可変長ブロックデータからなるデータ列を、所定長の複数の検索単位領域に区分けし、各可変長ブロックデータを前記検索単位領域毎に管理し、
前記データ列に対してデータアクセスを行なうに際して、データアクセス要求に含まれる位置情報に基づいて、アクセス対象の可変長ブロックデータが属する検索単位領域を特定し、
特定した前記検索単位領域に属する前記可変長ブロックデータを対象に、データアクセス対象の可変長ブロックデータを検索する
処理をコンピュータに実行させることを特徴とする、データ処理プログラム。
前記データアクセスとして、前記データ列にライトデータをライトする場合に、
ライト要求に含まれる前記位置情報に基づいて、前記データ列における、前記ライトデータの先頭が書き込まれる第1の可変長ブロックデータが属する検索単位領域を特定して、当該検索単位領域から前記第1の可変長ブロックデータを抽出し、
前記位置情報に基づいて、前記データ列における、前記ライトデータの末尾が書き込まれる第2の可変長ブロックデータが属する検索単位領域を特定して、当該検索単位領域から前記第2の可変長ブロックデータを抽出し、
前記ライトデータの先頭に前記第1の可変長ブロックを、前記ライトデータの末尾に前記第2の可変長ブロックを、それぞれ結合することで、更新データを作成し、当該更新データで前記データ列を部分的に置換する
処理を、前記コンピュータに実行させることを特徴とする、付記5記載のデータ処理プログラム。
前記更新データを複数の可変長ブロックデータに分割し、各可変長ブロックデータについて重複排除処理を行なう
処理を、前記コンピュータに実行させることを特徴とする、付記6記載のデータ処理プログラム。
前記データアクセスとして、前記データ列からリードデータをリードする場合に、
リード要求に含まれる前記位置情報に基づいて、前記データ列における、前記リードデータの先頭となる第1の可変長ブロックデータが属する検索単位領域を特定して、当該検索単位領域から前記第1の可変長ブロックデータを抽出し、
前記位置情報に基づいて、前記データ列における、前記リードデータの末尾となる第2の可変長ブロックデータが属する検索単位領域を特定して、当該検索単位領域から前記第2の可変長ブロックデータを抽出し、
前記データ列における、前記第1の可変長ブロックから前記第2の可変長ブロックまでの範囲内から、前記リードデータを抽出する
処理を、前記コンピュータに実行させることを特徴とする、付記5〜7のいずれか1項に記載のデータ処理プログラム。
複数の可変長ブロックデータからなるデータ列を、所定長の複数の検索単位領域に区分けし、各可変長ブロックデータを前記検索単位領域毎に管理し、
前記データ列に対してデータアクセスを行なうに際して、データアクセス要求に含まれる位置情報に基づいて、アクセス対象の可変長ブロックデータが属する検索単位領域を特定し、
特定した前記検索単位領域に属する前記可変長ブロックデータを対象に、データアクセス対象の可変長ブロックデータを検索する
ことを特徴とする、データ処理方法。
前記データアクセスとして、前記データ列にライトデータをライトする場合に、
ライト要求に含まれる前記位置情報に基づいて、前記データ列における、前記ライトデータの先頭が書き込まれる第1の可変長ブロックデータが属する検索単位領域を特定して、当該検索単位領域から前記第1の可変長ブロックデータを抽出し、
前記位置情報に基づいて、前記データ列における、前記ライトデータの末尾が書き込まれる第1の可変長ブロックデータが属する検索単位領域を特定して、当該検索単位領域から前記第2の可変長ブロックデータを抽出し、
前記ライトデータの先頭に前記第2の可変長ブロックを、前記ライトデータの末尾に前記第2の可変長ブロックを、それぞれ結合することで、更新データを作成し、当該更新データで前記データ列を部分的に置換する
ことを特徴とする、付記9記載のデータ処理方法。
前記更新データを複数の可変長ブロックデータに分割し、各可変長ブロックデータについて重複排除処理を行なう
ことを特徴とする、付記10記載のデータ処理方法。
前記データアクセスとして、前記データ列からリードデータをリードする場合に、
リード要求に含まれる前記位置情報に基づいて、前記データ列における、前記リードデータの先頭となる第1の可変長ブロックデータが属する検索単位領域を特定して、当該検索単位領域から前記第1の可変長ブロックデータを抽出し、
前記位置情報に基づいて、前記データ列における、前記リードデータの末尾となる第2の可変長ブロックデータが属する検索単位領域を特定して、当該検索単位領域から前記第2の可変長ブロックデータを抽出し、
前記データ列における、前記第1の可変長ブロックから前記第2の可変長ブロックまでの範囲内から、前記リードデータを抽出する
ことを特徴とする、付記9〜11のいずれか1項に記載のデータ処理方法。
11 CPU
12 メモリ
13 キャッシュ用バッファメモリ
13a キャッシュメモリ領域
13b 最大チャンクサイズ領域
14 記憶装置
21 重複排除処理部
22 ファイルアクセス処理部
50 クラウド
51 クラウドストレージ
52 業務サーバ
53 バックアップサーバ
240 管理データベース
241 ディレクトリテーブル
242 エントリテーブル
243 チャンクマップテーブル
244 チャンクテーブル
Claims (6)
- 複数の可変長ブロックデータからなるデータ列を、所定長の複数の検索単位領域に区分けし、各可変長ブロックデータを前記検索単位領域毎に管理するブロックデータ管理部と、
前記データ列に対してデータアクセスを行なうに際して、データアクセス要求に含まれる位置情報に基づいて、アクセス対象の可変長ブロックデータが属する検索単位領域を特定する検索単位領域特定部と、
特定した前記検索単位領域に属する前記可変長ブロックデータを対象に、データアクセス対象の可変長ブロックデータを検索するブロック検索部と
を備えることを特徴とする、データ処理装置。 - 前記データアクセスとして、前記データ列にライトデータをライトする場合に、
前記検索単位領域特定部が、ライト要求に含まれる前記位置情報に基づいて、前記データ列における、前記ライトデータの先頭が書き込まれる第1の可変長ブロックデータが属する第1の検索単位領域と、前記ライトデータの末尾が書き込まれる第2の可変長ブロックデータが属する第2の検索単位領域とを特定し、
前記ブロック検索部が、前記第1の検索単位領域から前記第1の可変長ブロックデータを抽出するとともに、前記第2の検索単位領域から前記第2の可変長ブロックデータを抽出し、
前記ライトデータの先頭に前記第1の可変長ブロックを、前記ライトデータの末尾に前記第2の可変長ブロックを、それぞれ結合することで更新データを作成し、当該更新データで前記データ列を部分的に置換するライト処理部
を備えることを特徴とする、請求項1記載のデータ処理装置。 - 前記更新データを複数の可変長ブロックデータに分割し、各可変長ブロックデータについて重複排除処理を行なう重複排除処理部
を備えることを特徴とする、請求項2記載のデータ処理装置。 - 前記データアクセスとして、前記データ列からリードデータをリードする場合に、
前記検索単位領域特定部が、リード要求に含まれる前記位置情報に基づいて、前記データ列における、前記リードデータの先頭となる第1の可変長ブロックデータが属する第1の検索単位領域と、前記リードデータの末尾となる第2の可変長ブロックデータが属する第2の検索単位領域とを特定し、
前記ブロック検索部が、前記第1の検索単位領域から前記第1の可変長ブロックデータを抽出するとともに、前記第2の検索単位領域から前記第2の可変長ブロックデータを抽出し、
前記データ列における、前記第1の可変長ブロックから前記第2の可変長ブロックまでの範囲内から、前記リードデータを抽出するリード処理部
を備えることを特徴とする、請求項1〜3のいずれか1項に記載のデータ処理装置。 - 処理装置とメモリとを備えたコンピュータにおいて、
複数の可変長ブロックデータからなるデータ列を、所定長の複数の検索単位領域に区分けし、各可変長ブロックデータを前記検索単位領域毎に管理し、
前記データ列に対してデータアクセスを行なうに際して、データアクセス要求に含まれる位置情報に基づいて、アクセス対象の可変長ブロックデータが属する検索単位領域を特定し、
特定した前記検索単位領域に属する前記可変長ブロックデータを対象に、データアクセス対象の可変長ブロックデータを検索する
処理を前記処理装置に実行させることを特徴とする、データ処理プログラム。 - 複数の可変長ブロックデータからなるデータ列を、所定長の複数の検索単位領域に区分けし、各可変長ブロックデータを前記検索単位領域毎に管理し、
前記データ列に対してデータアクセスを行なうに際して、データアクセス要求に含まれる位置情報に基づいて、アクセス対象の可変長ブロックデータが属する検索単位領域を特定し、
特定した前記検索単位領域に属する前記可変長ブロックデータを対象に、データアクセス対象の可変長ブロックデータを検索する
ことを特徴とする、データ処理方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016239179A JP6841024B2 (ja) | 2016-12-09 | 2016-12-09 | データ処理装置,データ処理プログラムおよびデータ処理方法 |
US15/826,775 US20180165345A1 (en) | 2016-12-09 | 2017-11-30 | Data processing device, computer-readable recording medium having recorded therein data processing program and data processing method |
EP17204619.5A EP3333730A1 (en) | 2016-12-09 | 2017-11-30 | Data processing device, data processing program and data processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016239179A JP6841024B2 (ja) | 2016-12-09 | 2016-12-09 | データ処理装置,データ処理プログラムおよびデータ処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018097450A true JP2018097450A (ja) | 2018-06-21 |
JP6841024B2 JP6841024B2 (ja) | 2021-03-10 |
Family
ID=60569672
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016239179A Active JP6841024B2 (ja) | 2016-12-09 | 2016-12-09 | データ処理装置,データ処理プログラムおよびデータ処理方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20180165345A1 (ja) |
EP (1) | EP3333730A1 (ja) |
JP (1) | JP6841024B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020047107A (ja) * | 2018-09-20 | 2020-03-26 | 株式会社日立製作所 | データ重複排除装置、データ重複排除方法、及びデータ重複排除プログラム |
US10938961B1 (en) | 2019-12-18 | 2021-03-02 | Ndata, Inc. | Systems and methods for data deduplication by generating similarity metrics using sketch computation |
US11119995B2 (en) | 2019-12-18 | 2021-09-14 | Ndata, Inc. | Systems and methods for sketch computation |
US11995050B2 (en) | 2021-07-28 | 2024-05-28 | Granica Computing, Inc. | Systems and methods for sketch computation |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017158794A1 (ja) * | 2016-03-17 | 2017-09-21 | 楽天株式会社 | ファイル管理システム、ファイル管理方法、収集プログラム、ならびに、非一時的なコンピュータ読取可能な情報記録媒体 |
US10831775B2 (en) * | 2017-01-06 | 2020-11-10 | International Business Machines Corporation | Efficient representation, access and modification of variable length objects |
US10652265B2 (en) * | 2018-01-12 | 2020-05-12 | Lianqun YANG | Method and apparatus for network forensics compression and storage |
US10922281B2 (en) * | 2018-10-25 | 2021-02-16 | EMC IP Holding Company LLC | Application aware deduplication |
US11449465B2 (en) * | 2019-09-11 | 2022-09-20 | International Business Machines Corporation | Fixed chunk size deduplication with variable-size chunking |
CN114579808B (zh) * | 2022-01-17 | 2022-11-29 | 深圳市慧视通科技股份有限公司 | 目标所处位置的索引方法、装置和电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03280136A (ja) * | 1990-03-29 | 1991-12-11 | Nec Corp | 順編成ファイルのレコード位置付け方式 |
JP2000285014A (ja) * | 1999-03-29 | 2000-10-13 | Nec Ic Microcomput Syst Ltd | 不定長データの格納方法および検索方法 |
US20060184505A1 (en) * | 2004-04-26 | 2006-08-17 | Storewiz, Inc. | Method and system for compression of files for storage and operation on compressed files |
US20120290537A1 (en) * | 2011-05-09 | 2012-11-15 | International Business Machines Corporation | Identifying modified chunks in a data set for storage |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4960417B2 (ja) | 2009-09-15 | 2012-06-27 | 株式会社東芝 | 可変長のデータ断片の開始・終了オフセットを決定する方法及び装置 |
JP5485866B2 (ja) | 2010-12-28 | 2014-05-07 | 株式会社日立ソリューションズ | 情報管理方法、及び情報提供用計算機 |
US8745003B1 (en) * | 2011-05-13 | 2014-06-03 | Emc Corporation | Synchronization of storage using comparisons of fingerprints of blocks |
CN104813310A (zh) * | 2012-09-05 | 2015-07-29 | 印度理工学院卡哈拉格普尔分校 | 多级别内联数据去重 |
CN104246722B (zh) | 2013-03-29 | 2017-02-22 | 株式会社东芝 | 用于基于哈希表排除数据重复的存储系统,存储控制器及方法 |
CN105446964B (zh) * | 2014-05-30 | 2019-04-26 | 国际商业机器公司 | 用于文件的重复数据删除的方法及装置 |
-
2016
- 2016-12-09 JP JP2016239179A patent/JP6841024B2/ja active Active
-
2017
- 2017-11-30 US US15/826,775 patent/US20180165345A1/en not_active Abandoned
- 2017-11-30 EP EP17204619.5A patent/EP3333730A1/en not_active Withdrawn
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03280136A (ja) * | 1990-03-29 | 1991-12-11 | Nec Corp | 順編成ファイルのレコード位置付け方式 |
JP2000285014A (ja) * | 1999-03-29 | 2000-10-13 | Nec Ic Microcomput Syst Ltd | 不定長データの格納方法および検索方法 |
US20060184505A1 (en) * | 2004-04-26 | 2006-08-17 | Storewiz, Inc. | Method and system for compression of files for storage and operation on compressed files |
JP2007535068A (ja) * | 2004-04-26 | 2007-11-29 | ストアウィズ インク | 記憶のためのファイル圧縮および圧縮ファイルの操作の方法およびシステム |
US20120290537A1 (en) * | 2011-05-09 | 2012-11-15 | International Business Machines Corporation | Identifying modified chunks in a data set for storage |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020047107A (ja) * | 2018-09-20 | 2020-03-26 | 株式会社日立製作所 | データ重複排除装置、データ重複排除方法、及びデータ重複排除プログラム |
US10938961B1 (en) | 2019-12-18 | 2021-03-02 | Ndata, Inc. | Systems and methods for data deduplication by generating similarity metrics using sketch computation |
US11119995B2 (en) | 2019-12-18 | 2021-09-14 | Ndata, Inc. | Systems and methods for sketch computation |
US11627207B2 (en) | 2019-12-18 | 2023-04-11 | Ndata, Inc. | Systems and methods for data deduplication by generating similarity metrics using sketch computation |
US11995050B2 (en) | 2021-07-28 | 2024-05-28 | Granica Computing, Inc. | Systems and methods for sketch computation |
Also Published As
Publication number | Publication date |
---|---|
JP6841024B2 (ja) | 2021-03-10 |
US20180165345A1 (en) | 2018-06-14 |
EP3333730A1 (en) | 2018-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10585857B2 (en) | Creation of synthetic backups within deduplication storage system by a backup application | |
JP6841024B2 (ja) | データ処理装置,データ処理プログラムおよびデータ処理方法 | |
US8386521B2 (en) | System for backing up and restoring data | |
US8315985B1 (en) | Optimizing the de-duplication rate for a backup stream | |
US8990171B2 (en) | Optimization of a partially deduplicated file | |
US9928210B1 (en) | Constrained backup image defragmentation optimization within deduplication system | |
KR102187127B1 (ko) | 데이터 연관정보를 이용한 중복제거 방법 및 시스템 | |
CN113535670A (zh) | 一种虚拟化资源镜像存储系统及其实现方法 | |
US11397706B2 (en) | System and method for reducing read amplification of archival storage using proactive consolidation | |
US10108647B1 (en) | Method and system for providing instant access of backup data | |
US9971797B1 (en) | Method and system for providing clustered and parallel data mining of backup data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190607 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190910 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200722 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200818 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201019 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210119 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210201 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6841024 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |