JP2010512565A - 多数の選択基準を用いるデータ管理方法およびシステム - Google Patents
多数の選択基準を用いるデータ管理方法およびシステム Download PDFInfo
- Publication number
- JP2010512565A JP2010512565A JP2009539422A JP2009539422A JP2010512565A JP 2010512565 A JP2010512565 A JP 2010512565A JP 2009539422 A JP2009539422 A JP 2009539422A JP 2009539422 A JP2009539422 A JP 2009539422A JP 2010512565 A JP2010512565 A JP 2010512565A
- Authority
- JP
- Japan
- Prior art keywords
- data
- function
- window
- value
- chunk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/174—Redundancy elimination performed by the file system
- G06F16/1748—De-duplication implemented within the file system, e.g. based on file segments
- G06F16/1752—De-duplication implemented within the file system, e.g. based on file segments based on file chunks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/22—Arrangements for sorting or merging computer data on continuous record carriers, e.g. tape, drum, disc
- G06F7/24—Sorting, i.e. extracting data from one or more carriers, rearranging the data in numerical or other ordered sequence, and rerecording the sorted data on the original carrier or on a different carrier or set of carriers sorting methods in general
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
Abstract
Description
Philip Koopman, 32-Bit Cyclic Redundancy Codes for Internet Ap plications, Proceedings of the 2002 Conference on Dependable Systems and Netwo rks, 2002 Jonathan Stone and Michael Greenwald, Performance of Checksums and CRCs over Real Data, IEEE/ACM Transactions on Networking, 1998 Val Henson and Richard Henderson, An Analysis of Compare-by-Ha sh, proceedings of the Ninth Workshop on Hot Topics in Operating Systems, Lihu e, Hawaii, May 2003, pp. 13-18 Raj Jain, A Comparison of Hashing Schemes for Address Lookup i n Computer Networks, IEEE Transactions on Communications, 1992.
Claims (29)
- データストリーム中の、データの複数のウインドウの一部を、第1の選択関数を用いて予め選択するステップと、
予め選択された、前記複数のウインドウの前記一部のサブセットを、第2の選択関数を用いて選択するステップと、
を有するデータ管理方法。 - 前記第1の関数は前記第2の関数よりも、データブロック境界を選択するのが速い、請求項1に記載の方法。
- 前記第1の関数は前記第2の関数よりも、ウインドウを選択するのが速い、請求項2に記載の方法。
- 前記第1の関数は、ボックスカーサム関数、MLCG関数、またはrolN-xor関数を含む 請求項1に記載の方法。
- 前記第1の関数は前記ボックスカーサム関数であり、該ボックスカーサム関数は、前記ボックスカーサムの値の選択基準と結合されている、請求項4に記載の方法。
- 前記第2の関数はRabin指紋、SHA-1関数、またはCRC32c関数を含む、請求項1に記載の方法。
- 前記第1の関数は、ローリングウインドウ関数、スライディングウインドウ関数、またはムービングウインドウ関数を含む、請求項1に記載の方法。
- 前記ウインドウは、ハッシングのためのデータグループを定めるのに使用され、前記データストリーム中のブレイクポイントを決定する速度が大きくされる、請求項1に記載の方法。
- 前記サブセットの1つまたは2つ以上のチャンクポイントによって定まるデータチャンクサイズの値を生成するステップをさらに有し、生成された値は前記データチャンクに含まれる基底データを示す、請求項1に記載の方法。
- 前記生成された値を、以前に生成された1つまたは複数の値と比較して、前記生成された値が、前記の以前に生成された1つまたは複数の値と等しいかどうか判定するステップをさらに有する、請求項9に記載の方法。
- データ重複が存在すると判定するステップと、
重複データを有すると判定されたデータチャンク内のデータをさらに処理するのを停止するステップと、
をさらに有する、請求項10に記載の方法。 - 前記の生成された値を、データ重複がない場合に格納するステップをさらに有する、請求項10に記載の方法。
- 前記第2の関数によって選択された、データの新しいウインドウまたはデータチャンクに含まれる基底データを、以前に定められた、データの1つまた複数のウインドウまたは1つまたは複数のデータチャンクからの以前に発生した基底データと比較するステップをさらに有する、請求項1に記載の方法。
- データの前記新しいウインドウに含まれる基底データを、それが前記の以前に発生した基底データと等しくなければ出力するステップと、
前記の新しいデータチャンクに含まれる前記基底データを、それが前記の以前に発生した基底データと等しくない場合に出力しないステップと、
をさらに有する、請求項1に記載の方法。 - データのウインドウまたはデータチャンクに含まれる基底データを示す、データのウインドウまたはデータチャンクの値を生成するステップをさらに有する、請求項1に記載の方法。
- 前記生成された値を、前記の以前に生成されたまたは発生した1つまたは複数の値と比較するステップをさらに有する、請求項15に記載の方法。
- 前記の生成された値を、それが前記の以前に生成されたまたは発生した1つまたは複数の値と等しくなければ出力するステップと、
前記の生成された値を、それが前記の以前に生成されたまたは発生した1つまたは複数の値と等しければ出力しないステップと、
をさらに有する、請求項16に記載の方法。 - データ管理のために、データストリーム中の境界ポイントを求める方法であって、
データストリーム中の複数の境界ポイントの一部分を、第1の選択関数を用いて予め選択するステップと、
予め選択された、前記複数の境界ポイントの前記一部分のサブセットを、第2の選択関数を用いて選択するステップと、
前記複数の境界ポイントの前記一部分の前記サブセットによって求められたデータのチャンクの値を生成するステップと、
を有する方法。 - 前記の生成された値を、重複を検出するようにまたは前記の生成された値を格納するように、1つまたは複数の格納された値と比較するステップをさらに有する、請求項18に記載の方法。
- 値を生成することが、ハッシングによって行われる、請求項19に記載の方法。
- 1つまたは複数の境界ポイントによって定まるデータのチャンクに含まれるデータをハッシングすることによって見出された重複データを除去するステップをさらに有する、請求項20に記載の方法。
- データブレイクポイントまたはウインドウの第1のセットを予め選択するように構成された第1の選択関数モジュールと、
前記の予め選択されたデータブレイクポイントまたはウインドウのサブセットを選択するように構成された第2の選択関数モジュールと、を有し、前記第1の選択関数モジュールは前記第2の選択関数モジュールよりも速くデータブレイクポイントまたはウインドウを処理する
データ処理システム。 - 前記第1の選択関数モジュールはボックスカーサム関数を含み、前記第2の選択関数モジュールはRabin関数を含む、請求項22に記載のデータ処理システム。
- 前記データ処理システムはハッシングシステムであり、コンテンツで規定される1つまた複数のデータブロックまたは1つまたは複数のチャンクポイントを出力する、請求項23に記載のデータ処理システム。
- データブレイクポイントまたはウインドウの第1のセットを予め選択する手段と、
前記の予め選択されたデータブレイクポイントまたはウインドウを選択し、出力する手段と、を有し、前記の予め選択する手段は、前記データブレイクポイントまたはウインドウを前記の選択する手段よりも速く処理する、
データ処理システム。 - 前記サブセットの前記1つまたは複数のデータブレイクポイントまたは1つまたは複数のウインドウの各々の値を生成する手段をさらに有する、請求項25に記載のデータ処理システム。
- 前記のデータブレイクポイントまたはウインドウの第1のセットを予め選択する手段はローリングボックスサム関数を実行し、前記の予め選択されたデータブレイクポイントまたはウインドウのサブセットを選択し、出力する手段はRabin関数を実行し、値を生成する前記手段はSHA-1関数を実行する、請求項26に記載のデータ処理システム。
- 前記の生成された値はハッシュ値である、請求項27に記載のデータ処理システム。
- 前記データ処理システムはハッシングシステムであり、コンテンツで規定される1つまた複数のデータブロックまたは1つまたは複数のチャンクポイントを出力する、請求項25に記載のデータ処理システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/566,122 US7844581B2 (en) | 2006-12-01 | 2006-12-01 | Methods and systems for data management using multiple selection criteria |
US11/566,122 | 2006-12-01 | ||
PCT/US2007/085357 WO2008067226A1 (en) | 2006-12-01 | 2007-11-21 | Methods and systems for data management using multiple selection criteria |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2010512565A true JP2010512565A (ja) | 2010-04-22 |
JP2010512565A5 JP2010512565A5 (ja) | 2010-10-07 |
JP5154566B2 JP5154566B2 (ja) | 2013-02-27 |
Family
ID=39469410
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009539422A Active JP5154566B2 (ja) | 2006-12-01 | 2007-11-21 | 多数の選択基準を用いるデータ管理方法およびシステム |
Country Status (9)
Country | Link |
---|---|
US (1) | US7844581B2 (ja) |
EP (1) | EP2087418A4 (ja) |
JP (1) | JP5154566B2 (ja) |
KR (1) | KR101541146B1 (ja) |
CN (1) | CN101379465B (ja) |
AU (1) | AU2007325319B2 (ja) |
CA (1) | CA2640736C (ja) |
TW (1) | TWI459726B (ja) |
WO (1) | WO2008067226A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012198832A (ja) * | 2011-03-23 | 2012-10-18 | Nec Corp | 重複ファイル検出装置 |
JP2017097437A (ja) * | 2015-11-18 | 2017-06-01 | 株式会社東芝 | 情報処理システム、情報処理装置、及びプログラム |
Families Citing this family (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080005391A1 (en) * | 2006-06-05 | 2008-01-03 | Bugra Gedik | Method and apparatus for adaptive in-operator load shedding |
US7890480B2 (en) * | 2008-02-11 | 2011-02-15 | International Business Machines Corporation | Processing of deterministic user-defined functions using multiple corresponding hash tables |
US20090204636A1 (en) * | 2008-02-11 | 2009-08-13 | Microsoft Corporation | Multimodal object de-duplication |
US8452736B2 (en) * | 2008-03-05 | 2013-05-28 | Ca, Inc. | File change detection |
US7539710B1 (en) * | 2008-04-11 | 2009-05-26 | International Business Machines Corporation | Method of and system for deduplicating backed up data in a client-server environment |
US8122069B2 (en) * | 2008-07-09 | 2012-02-21 | Hewlett-Packard Development Company, L.P. | Methods for pairing text snippets to file activity |
US7953752B2 (en) * | 2008-07-09 | 2011-05-31 | Hewlett-Packard Development Company, L.P. | Methods for merging text snippets for context classification |
US8117343B2 (en) * | 2008-10-28 | 2012-02-14 | Hewlett-Packard Development Company, L.P. | Landmark chunking of landmarkless regions |
US8140491B2 (en) * | 2009-03-26 | 2012-03-20 | International Business Machines Corporation | Storage management through adaptive deduplication |
US8538188B2 (en) * | 2009-08-04 | 2013-09-17 | Mitre Corporation | Method and apparatus for transferring and reconstructing an image of a computer readable medium |
US8180740B1 (en) * | 2009-08-12 | 2012-05-15 | Netapp, Inc. | System and method for eliminating duplicate data by generating data fingerprints using adaptive fixed-length windows |
CA2772185C (en) * | 2009-08-25 | 2014-07-15 | Sumitomo Metal Industries, Ltd. | Bent member and an apparatus and method for its manufacture |
US8924439B2 (en) * | 2009-09-01 | 2014-12-30 | Verizon Patent And Licensing Inc. | System for and method of partial file hashing |
US8407193B2 (en) * | 2010-01-27 | 2013-03-26 | International Business Machines Corporation | Data deduplication for streaming sequential data storage applications |
JP5372853B2 (ja) * | 2010-07-08 | 2013-12-18 | 株式会社日立製作所 | デジタルシーケンス特徴量算出方法及びデジタルシーケンス特徴量算出装置 |
US8397080B2 (en) * | 2010-07-29 | 2013-03-12 | Industrial Technology Research Institute | Scalable segment-based data de-duplication system and method for incremental backups |
US8495093B2 (en) | 2010-08-18 | 2013-07-23 | International Business Machines Corporation | Multiway trie data structure that dynamically adjusts node sizes in a manner that reduces memory footprint and improves access speed |
WO2012070094A1 (en) * | 2010-11-26 | 2012-05-31 | Hitachi, Ltd. | Computer system |
WO2012112121A1 (en) * | 2011-02-17 | 2012-08-23 | Jitcomm Networks Pte Ltd | Parallel data partitioning |
US8666955B2 (en) | 2011-04-11 | 2014-03-04 | Hitachi, Ltd. | Data management method and data management system |
WO2013027230A1 (en) * | 2011-08-19 | 2013-02-28 | Hitachi, Ltd. | Storage apparatus and duplicate data detection method |
US8880493B2 (en) * | 2011-09-28 | 2014-11-04 | Hewlett-Packard Development Company, L.P. | Multi-streams analytics |
KR101382273B1 (ko) * | 2011-09-30 | 2014-04-10 | 인하대학교 산학협력단 | Ssd 저장장치의 마모도 감소를 위한 ssd 기반 서버급 저장장치의 복합적 데이터 중복제거 방법 |
US8959082B2 (en) | 2011-10-31 | 2015-02-17 | Elwha Llc | Context-sensitive query enrichment |
EP2810171B1 (en) | 2012-02-02 | 2019-07-03 | Hewlett-Packard Enterprise Development LP | Systems and methods for data chunk deduplication |
WO2013158066A1 (en) | 2012-04-16 | 2013-10-24 | Hewlett-Packard Development Company, L.P. | File upload based on hash value comparison |
US20150088840A1 (en) * | 2012-05-01 | 2015-03-26 | Kave Eshghi | Determining segment boundaries for deduplication |
US9164688B2 (en) | 2012-07-03 | 2015-10-20 | International Business Machines Corporation | Sub-block partitioning for hash-based deduplication |
KR101956031B1 (ko) | 2012-10-15 | 2019-03-11 | 삼성전자 주식회사 | 데이터 압축 장치 및 방법, 데이터 압축 장치를 포함하는 메모리 시스템 |
US10592347B2 (en) | 2013-05-16 | 2020-03-17 | Hewlett Packard Enterprise Development Lp | Selecting a store for deduplicated data |
US10496490B2 (en) | 2013-05-16 | 2019-12-03 | Hewlett Packard Enterprise Development Lp | Selecting a store for deduplicated data |
CN105446964B (zh) * | 2014-05-30 | 2019-04-26 | 国际商业机器公司 | 用于文件的重复数据删除的方法及装置 |
US9514312B1 (en) * | 2014-09-05 | 2016-12-06 | Symantec Corporation | Low-memory footprint fingerprinting and indexing for efficiently measuring document similarity and containment |
US10372695B2 (en) * | 2014-12-27 | 2019-08-06 | Intel Corporation | Technologies for computing rolling hashes |
US9805180B2 (en) * | 2015-10-27 | 2017-10-31 | Blackberry Limited | Message sender authentication |
EP3282588B1 (en) * | 2016-08-09 | 2019-09-25 | Siemens Aktiengesellschaft | Method, system and program product for data transmission with a reduced data volume |
US10795860B1 (en) * | 2017-04-13 | 2020-10-06 | EMC IP Holding Company LLC | WAN optimized micro-service based deduplication |
US10795859B1 (en) | 2017-04-13 | 2020-10-06 | EMC IP Holding Company LLC | Micro-service based deduplication |
US10860212B1 (en) | 2017-07-21 | 2020-12-08 | EMC IP Holding Company LLC | Method or an apparatus to move perfect de-duplicated unique data from a source to destination storage tier |
US10936543B1 (en) | 2017-07-21 | 2021-03-02 | EMC IP Holding Company LLC | Metadata protected sparse block set for SSD cache space management |
US11461269B2 (en) | 2017-07-21 | 2022-10-04 | EMC IP Holding Company | Metadata separated container format |
US10459633B1 (en) | 2017-07-21 | 2019-10-29 | EMC IP Holding Company LLC | Method for efficient load balancing in virtual storage systems |
US10949088B1 (en) | 2017-07-21 | 2021-03-16 | EMC IP Holding Company LLC | Method or an apparatus for having perfect deduplication, adapted for saving space in a deduplication file system |
US11113153B2 (en) | 2017-07-27 | 2021-09-07 | EMC IP Holding Company LLC | Method and system for sharing pre-calculated fingerprints and data chunks amongst storage systems on a cloud local area network |
US10481813B1 (en) | 2017-07-28 | 2019-11-19 | EMC IP Holding Company LLC | Device and method for extending cache operational lifetime |
US10929382B1 (en) | 2017-07-31 | 2021-02-23 | EMC IP Holding Company LLC | Method and system to verify integrity of a portion of replicated data |
US11093453B1 (en) | 2017-08-31 | 2021-08-17 | EMC IP Holding Company LLC | System and method for asynchronous cleaning of data objects on cloud partition in a file system with deduplication |
US10866928B2 (en) | 2018-09-10 | 2020-12-15 | Netapp, Inc. | Methods for optimized variable-size deduplication using two stage content-defined chunking and devices thereof |
US11061932B2 (en) | 2018-10-06 | 2021-07-13 | Teradata Us, Inc. | Methods and system for managing storage with multiple simultaneous data temperature models |
US10938961B1 (en) * | 2019-12-18 | 2021-03-02 | Ndata, Inc. | Systems and methods for data deduplication by generating similarity metrics using sketch computation |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000124810A (ja) * | 1998-08-13 | 2000-04-28 | Fujitsu Ltd | 符号化装置及び復号化装置 |
JP2005302004A (ja) * | 2004-04-15 | 2005-10-27 | Microsoft Corp | 遠隔差分圧縮用の効率的アルゴリズムとプロトコル |
JP2006031686A (ja) * | 2004-06-17 | 2006-02-02 | Hewlett-Packard Development Co Lp | 複数のファイル間で記憶資源を共有するシステムおよび方法 |
WO2006094365A1 (en) * | 2005-03-11 | 2006-09-14 | Rocksoft Limited | Method for storing data with reduced redundancy using data clusters |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1996025801A1 (en) * | 1995-02-17 | 1996-08-22 | Trustus Pty. Ltd. | Method for partitioning a block of data into subblocks and for storing and communicating such subblocks |
US6263336B1 (en) * | 1997-02-27 | 2001-07-17 | Seiko Epson Corporation | Text structure analysis method and text structure analysis device |
AU2001286973A1 (en) * | 2000-08-31 | 2002-03-13 | Ontrack Data International, Inc. | System and method for data management |
US6810398B2 (en) * | 2000-11-06 | 2004-10-26 | Avamar Technologies, Inc. | System and method for unorchestrated determination of data sequences using sticky byte factoring to determine breakpoints in digital sequences |
US6658423B1 (en) * | 2001-01-24 | 2003-12-02 | Google, Inc. | Detecting duplicate and near-duplicate files |
EP1244221A1 (en) * | 2001-03-23 | 2002-09-25 | Sun Microsystems, Inc. | Method and system for eliminating data redundancies |
EP1419457B1 (en) * | 2001-08-20 | 2012-07-25 | Symantec Corporation | File backup system and method |
US6667700B1 (en) * | 2002-10-30 | 2003-12-23 | Nbt Technology, Inc. | Content-based segmentation scheme for data compression in storage and transmission including hierarchical segment representation |
US20050060643A1 (en) * | 2003-08-25 | 2005-03-17 | Miavia, Inc. | Document similarity detection and classification system |
US7472254B2 (en) * | 2003-10-10 | 2008-12-30 | Iora, Ltd. | Systems and methods for modifying a set of data objects |
US7281006B2 (en) * | 2003-10-23 | 2007-10-09 | International Business Machines Corporation | System and method for dividing data into predominantly fixed-sized chunks so that duplicate data chunks may be identified |
US8135683B2 (en) * | 2003-12-16 | 2012-03-13 | International Business Machines Corporation | Method and apparatus for data redundancy elimination at the block level |
US20060047855A1 (en) * | 2004-05-13 | 2006-03-02 | Microsoft Corporation | Efficient chunking algorithm |
US7487138B2 (en) * | 2004-08-25 | 2009-02-03 | Symantec Operating Corporation | System and method for chunk-based indexing of file system content |
US7680798B2 (en) * | 2004-11-20 | 2010-03-16 | International Business Machines Corporation | Method, device and system for automatic retrieval of similar objects in a network of devices |
US7487169B2 (en) * | 2004-11-24 | 2009-02-03 | International Business Machines Corporation | Method for finding the longest common subsequences between files with applications to differential compression |
US7564458B2 (en) * | 2004-12-15 | 2009-07-21 | Microsoft Corporation | System and method for interactively linking data to shapes in a diagram |
US7984018B2 (en) * | 2005-04-18 | 2011-07-19 | Microsoft Corporation | Efficient point-to-multipoint data reconciliation |
US7636767B2 (en) * | 2005-11-29 | 2009-12-22 | Cisco Technology, Inc. | Method and apparatus for reducing network traffic over low bandwidth links |
US7844652B2 (en) * | 2006-04-11 | 2010-11-30 | Emc Corporation | Efficient computation of sketches |
US8126911B2 (en) * | 2006-04-27 | 2012-02-28 | Intel Corporation | System and method for content-based partitioning and mining |
US8412682B2 (en) * | 2006-06-29 | 2013-04-02 | Netapp, Inc. | System and method for retrieving and using block fingerprints for data deduplication |
US7504969B2 (en) * | 2006-07-11 | 2009-03-17 | Data Domain, Inc. | Locality-based stream segmentation for data deduplication |
US7843823B2 (en) * | 2006-07-28 | 2010-11-30 | Cisco Technology, Inc. | Techniques for balancing throughput and compression in a network communication system |
US7797323B1 (en) * | 2006-10-11 | 2010-09-14 | Hewlett-Packard Development Company, L.P. | Producing representative hashes for segments of a file |
JP2008131594A (ja) * | 2006-11-24 | 2008-06-05 | Nippon Telegr & Teleph Corp <Ntt> | アプリケーション制御システムおよび制御方法 |
-
2006
- 2006-12-01 US US11/566,122 patent/US7844581B2/en active Active
-
2007
- 2007-11-21 JP JP2009539422A patent/JP5154566B2/ja active Active
- 2007-11-21 AU AU2007325319A patent/AU2007325319B2/en not_active Ceased
- 2007-11-21 EP EP07854739A patent/EP2087418A4/en not_active Withdrawn
- 2007-11-21 KR KR1020087021627A patent/KR101541146B1/ko active IP Right Grant
- 2007-11-21 CN CN2007800041298A patent/CN101379465B/zh not_active Expired - Fee Related
- 2007-11-21 CA CA2640736A patent/CA2640736C/en not_active Expired - Fee Related
- 2007-11-21 WO PCT/US2007/085357 patent/WO2008067226A1/en active Application Filing
- 2007-11-30 TW TW096145707A patent/TWI459726B/zh not_active IP Right Cessation
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000124810A (ja) * | 1998-08-13 | 2000-04-28 | Fujitsu Ltd | 符号化装置及び復号化装置 |
JP2005302004A (ja) * | 2004-04-15 | 2005-10-27 | Microsoft Corp | 遠隔差分圧縮用の効率的アルゴリズムとプロトコル |
JP2006031686A (ja) * | 2004-06-17 | 2006-02-02 | Hewlett-Packard Development Co Lp | 複数のファイル間で記憶資源を共有するシステムおよび方法 |
WO2006094365A1 (en) * | 2005-03-11 | 2006-09-14 | Rocksoft Limited | Method for storing data with reduced redundancy using data clusters |
Non-Patent Citations (3)
Title |
---|
JPN6012035240; Timothy E. Denehy: 'Duplicate Management for Reference Data' IBM Research Report , 20040128, p.1-5 * |
JPN6012035243; Deepak R. Bobbarjung: 'Improving Duplicate Elimination in Storage' ACM Transactions on Database Systems , 20050430 * |
JPN6012035245; Kave Eshghi: A Framework for Analyzing and Improving Content-Based , 20050922, p.1-10 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012198832A (ja) * | 2011-03-23 | 2012-10-18 | Nec Corp | 重複ファイル検出装置 |
JP2017097437A (ja) * | 2015-11-18 | 2017-06-01 | 株式会社東芝 | 情報処理システム、情報処理装置、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US7844581B2 (en) | 2010-11-30 |
AU2007325319B2 (en) | 2011-11-17 |
KR20090094055A (ko) | 2009-09-03 |
EP2087418A4 (en) | 2012-06-13 |
CN101379465A (zh) | 2009-03-04 |
KR101541146B1 (ko) | 2015-07-31 |
EP2087418A1 (en) | 2009-08-12 |
CN101379465B (zh) | 2013-03-27 |
WO2008067226A1 (en) | 2008-06-05 |
CA2640736C (en) | 2014-10-14 |
JP5154566B2 (ja) | 2013-02-27 |
CA2640736A1 (en) | 2008-06-05 |
US20080133446A1 (en) | 2008-06-05 |
TWI459726B (zh) | 2014-11-01 |
AU2007325319A1 (en) | 2008-06-05 |
TW200835174A (en) | 2008-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5154566B2 (ja) | 多数の選択基準を用いるデータ管理方法およびシステム | |
KR101414970B1 (ko) | 고속의 효율적 데이터 관리 및/또는 처리를 위한 방법 및 시스템 | |
US8112477B2 (en) | Content identification for peer-to-peer content retrieval | |
Xia et al. | {FastCDC}: A fast and efficient {Content-Defined} chunking approach for data deduplication | |
US10089360B2 (en) | Apparatus and method for single pass entropy detection on data transfer | |
US7733910B2 (en) | Data segmentation using shift-varying predicate function fingerprinting | |
JP5566888B2 (ja) | データ依存チャンキングを使用する最適化されたデータストリーム圧縮 | |
CN111382434B (zh) | 用于检测恶意文件的系统和方法 | |
US9696936B2 (en) | Applying a maximum size bound on content defined segmentation of data | |
US10817474B2 (en) | Adaptive rate compression hash processor | |
US20150019833A1 (en) | Hierarchical content defined segmentation of data | |
US20150088840A1 (en) | Determining segment boundaries for deduplication | |
US9483483B2 (en) | Applying a minimum size bound on content defined segmentation of data | |
Rajkumar et al. | Fuzzy-Dedup: A secure deduplication model using cosine based Fuzzy interference system in cloud application | |
US11347424B1 (en) | Offset segmentation for improved inline data deduplication | |
Abdulsalam et al. | Evaluation of Two Thresholds Two Divisor Chunking Algorithm Using Rabin Finger print, Adler, and SHA1 Hashing Algorithms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100823 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100823 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120710 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121001 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121205 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151214 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5154566 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |