JP6122038B2 - 重複排除のオペレーションを実行するためのフラグメンテーションのコントロール - Google Patents
重複排除のオペレーションを実行するためのフラグメンテーションのコントロール Download PDFInfo
- Publication number
- JP6122038B2 JP6122038B2 JP2014559940A JP2014559940A JP6122038B2 JP 6122038 B2 JP6122038 B2 JP 6122038B2 JP 2014559940 A JP2014559940 A JP 2014559940A JP 2014559940 A JP2014559940 A JP 2014559940A JP 6122038 B2 JP6122038 B2 JP 6122038B2
- Authority
- JP
- Japan
- Prior art keywords
- data set
- fragmentation
- deduplication operation
- access
- storage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013467 fragmentation Methods 0.000 title claims description 64
- 238000006062 fragmentation reaction Methods 0.000 title claims description 64
- 238000000034 method Methods 0.000 claims description 46
- 230000004044 response Effects 0.000 claims 6
- 238000010586 diagram Methods 0.000 description 12
- 239000000835 fiber Substances 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 102100040351 FK506-binding protein 15 Human genes 0.000 description 2
- 101710132915 FK506-binding protein 15 Proteins 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 229920006253 high performance fiber Polymers 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000004549 pulsed laser deposition Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/174—Redundancy elimination performed by the file system
- G06F16/1748—De-duplication implemented within the file system, e.g. based on file segments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2272—Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本願は、2012年2月29日出願の米国特許出願第13/408051号(特許文献1)の優先権を主張するものであり、該出願は参照の上全体としてこの明細書に組み込まれる。
本願についての少なくとも一つの実施形態は、ストレージサーバに格納されるデータの重複排除に関し、特に、重複排除のプロセスにて、データセットに取り入れられるフラグメンテーションのレベルをコントロールすることに関する。
ストレージコントローラは、一つ以上のホストの代わりにデータを格納し検索するのに用いられる物理的処理デバイスである。ネットワークストレージコントローラは、ネットワーク上で一つ以上のクライアントをサーブするストレージサーバとして動作するように、磁気若しくは光学ストレージベースのディスク、テープ若しくはフラッシュメモリなどの、大容量記憶装置のセット内にデータを格納して管理するように、(例えば、ハードウエア、ソフトウエア、ファームウエア、若しくはそれらの任意の組み合わせにより)構成され得る。
Claims (24)
- データセットへの重複排除のオペレーションの結果としてストレージサーバによりデータセットに取り込まれるフラグメンテーションのレベルを、ストレージサーバにより計算するステップと、
前記計算するステップの結果に基づいて重複排除のオペレーションを実行するかどうかを、ストレージサーバにより判定するステップと
を含む方法。 - 重複排除のオペレーションを実行するかどうかを判定するために、フラグメンテーションのレベルを閾値と、ストレージサーバにより比較するステップを
更に含む請求項1に記載の方法。 - フラグメンテーションのレベルを判定するステップが、
重複排除のオペレーションの後にデータセットにアクセスするのに必要な読み出しのオペレーションの数を計算するステップと、
理想データセットにアクセスするのに必要な読み出しのオペレーションの数を計算するステップと、
重複排除の後にデータセットにアクセスするのに必要な読み出しのオペレーションの数と理想データセットにアクセスするのに必要な読み出しのオペレーションの数とに基づいて、フラグメンテーションのレベルを表す、フラグメンテーションのインデクスを計算するステップであって、重複排除のオペレーションを実行するかどうかを判定するステップがフラグメンテーションのインデクスに基づくものである、ステップと
を含む、請求項1に記載の方法。 - フラグメンテーションのインデクスは、重複排除のオペレーションの後にデータセットにアクセスするための読み出しのオペレーションの数と、理想データセットにアクセスするのに必要な読み出しのオペレーションの数との比率である、請求項3に記載の方法。
- 重複排除のオペレーションの後にデータセットにアクセスするのに必要な読み出しのオペレーションの数を計算するステップは、
重複排除のオペレーションで共有されるべきデータセット内の複数のブロックの各々のための、ドナーブロックのアドレスを判定するステップと、
重複排除のオペレーションの後のデータセットのブロックの各々のためのアドレスを含むアドレスリストを作成するステップと、
ストレージデバイス上で発生する順序でアドレスリスト内のアドレスをソートするステップと、
アドレスリストから、重複排除のオペレーションの後にデータセットにアクセスするのに必要な読み出しのオペレーションの数を計算するステップと
を含む、請求項3に記載の方法。 - 閾値が、データセットのためのフラグメンテーションの最大限の受入可能なレベルを表す、請求項2に記載の方法。
- 更に、フラグメンテーションのレベルが閾値より低いことを判定することに応答して、重複排除のオペレーションを実行するステップを含む、請求項2に記載の方法。
- 更に、フラグメンテーションのレベルが閾値より高いことを判定することに応答して、重複排除のオペレーションを実行しないことを含む、請求項2に記載の方法。
- 閾値はユーザのインプットに基づいて設定される、請求項2に記載の方法。
- ストレージサーバ上に格納されるデータセットに取り込まれるフラグメンテーションのレベルを表すフラグメンテーションのインデクスを、データセットに関して重複排除のオペレーションを実行することの結果として、計算するステップであって、フラグメンテーションのインデクスは、重複排除のオペレーションの後にデータセットにアクセスするのに必要な読み出しのオペレーションの数と、理想データセットにアクセスするのに必要な読み出しのオペレーションの数との比率である、ステップと、
重複排除のオペレーションを実行するかどうかを判定するために、フラグメンテーションのインデクスを閾値と比較するステップと、
比較するステップの結果に基づいて重複排除のオペレーションを実行するステップと
を含む、方法。 - 更に、
重複排除のオペレーションで共有されるべきデータセット内の複数のブロックの各々のための、ドナーブロックのアドレスを判定するステップと、
重複排除のオペレーションの後のデータセットの各々のブロックのためのアドレスを含むアドレスリストを作成するステップと、
ストレージデバイス上で発生する順序でアドレスリスト内のアドレスをソートするステップと、
アドレスリストから、重複排除のオペレーションの後にデータセットにアクセスするのに必要な読み出しのオペレーションの数を計算するステップと
を含む、請求項10に記載の方法。 - 閾値が、データセットのためのフラグメンテーションの最大限の受入可能なレベルを表す、請求項10に記載の方法。
- 更に、フラグメンテーションのインデクスが閾値より低いことを判定することに応答して、重複排除のオペレーションを実行するステップを含む、請求項10に記載の方法。
- 更に、フラグメンテーションのインデクスが閾値より高いことを判定することに応答して、重複排除のオペレーションを実行しないことを含む、請求項10に記載の方法。
- 閾値はユーザのインプットに基づいて設定される、請求項10に記載の方法。
- プロセッサと、
前記プロセッサと連結するメモリであって、前記プロセッサにより実行されるとき前記プロセッサに複数のオペレーションを実行させる命令を格納する、メモリと
を含み、
オペレーションは、
データセットへの重複排除のオペレーションの結果としてストレージサーバによりデータセットに取り込まれるフラグメンテーションのレベルを計算するステップと、
前記計算するステップの結果に基づいて重複排除のオペレーションを実行するかどうかを判定するステップと
を含む、ストレージサーバ。 - 前記オペレーションは、重複排除のオペレーションを実行するかどうかを判定するために、フラグメンテーションのレベルを閾値と比較するステップを
更に含む請求項16に記載のストレージサーバ。 - フラグメンテーションのレベルを判定するステップが、
重複排除のオペレーションの後にデータセットにアクセスするのに必要な読み出しのオペレーションの数を計算するステップと、
理想データセットにアクセスするのに必要な読み出しのオペレーションの数を計算するステップと、
重複排除の後にデータセットにアクセスするのに必要な読み出しのオペレーションの数と理想データセットにアクセスするのに必要な読み出しのオペレーションの数とに基づいて、フラグメンテーションのレベルを表す、フラグメンテーションのインデクスを計算するステップと
を含む、請求項16に記載のストレージサーバ。 - フラグメンテーションのインデクスは、重複排除のオペレーションの後にデータセットにアクセスするための読み出しのオペレーションの数と、理想データセットにアクセスするのに必要な読み出しのオペレーションの数との比率である、請求項18に記載のストレージサーバ。
- 重複排除のオペレーションの後にデータセットにアクセスするのに必要な読み出しのオペレーションの数を計算するステップは、
重複排除のオペレーションで共有されるべきデータセット内の複数のブロックの各々のための、ドナーブロックのアドレスを判定するステップと、
重複排除のオペレーションの後のデータセットの各々のブロックのためのアドレスを含むアドレスリストを作成するステップと、
ストレージデバイス上で発生する順序でアドレスリスト内のアドレスをソートするステップと、
アドレスリストから、重複排除のオペレーションの後にデータセットにアクセスするのに必要な読み出しのオペレーションの数を計算するステップと
を含む、請求項18に記載のストレージサーバ。 - 閾値が、データセットのためのフラグメンテーションの最大限の受入可能なレベルを表す、請求項17に記載のストレージサーバ。
- 前記オペレーションが更に、フラグメンテーションのレベルが閾値より低いことを判定することに応答して、重複排除のオペレーションを実行するステップを含む、請求項17に記載のストレージサーバ。
- 前記オペレーションが更に、フラグメンテーションのレベルが閾値より高いことを判定することに応答して、重複排除のオペレーションを実行しないことを含む、請求項17に記載のストレージサーバ。
- 閾値はユーザのインプットに基づいて設定される、請求項17に記載のストレージサーバ。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/408,051 US9026503B2 (en) | 2012-02-29 | 2012-02-29 | Fragmentation control for performing deduplication operations |
US13/408,051 | 2012-02-29 | ||
PCT/US2013/027673 WO2013130410A1 (en) | 2012-02-29 | 2013-02-25 | Fragmentation control for performing deduplication operations |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015513741A JP2015513741A (ja) | 2015-05-14 |
JP6122038B2 true JP6122038B2 (ja) | 2017-04-26 |
Family
ID=49004399
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014559940A Active JP6122038B2 (ja) | 2012-02-29 | 2013-02-25 | 重複排除のオペレーションを実行するためのフラグメンテーションのコントロール |
Country Status (5)
Country | Link |
---|---|
US (2) | US9026503B2 (ja) |
EP (1) | EP2820545B1 (ja) |
JP (1) | JP6122038B2 (ja) |
CN (1) | CN104272263A (ja) |
WO (1) | WO2013130410A1 (ja) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9933978B2 (en) * | 2010-12-16 | 2018-04-03 | International Business Machines Corporation | Method and system for processing data |
US8732403B1 (en) * | 2012-03-14 | 2014-05-20 | Netapp, Inc. | Deduplication of data blocks on storage devices |
US8706971B1 (en) | 2012-03-14 | 2014-04-22 | Netapp, Inc. | Caching and deduplication of data blocks in cache memory |
JP6094267B2 (ja) * | 2013-03-01 | 2017-03-15 | 日本電気株式会社 | ストレージシステム |
US10127235B2 (en) * | 2013-03-06 | 2018-11-13 | Quest Software Inc. | Storage system deduplication with service level agreements |
US10642795B2 (en) * | 2013-04-30 | 2020-05-05 | Oracle International Corporation | System and method for efficiently duplicating data in a storage system, eliminating the need to read the source data or write the target data |
US10747440B2 (en) | 2014-09-24 | 2020-08-18 | Hitachi, Ltd. | Storage system and storage system management method |
CN105812405B (zh) * | 2014-12-29 | 2019-04-09 | 阿里巴巴集团控股有限公司 | 一种处理消息的方法、装置及系统 |
US10037336B1 (en) | 2015-03-27 | 2018-07-31 | EMC IP Holding Company LLC | Performing block deduplication using block sequence classifications |
CN105204783B (zh) * | 2015-10-13 | 2018-12-07 | 华中科技大学 | 一种基于数据生存期的固态盘垃圾回收方法 |
JP6406283B2 (ja) * | 2016-03-01 | 2018-10-17 | 日本電気株式会社 | ストレージ装置およびストレージ方法 |
CN106066818B (zh) * | 2016-05-25 | 2019-05-17 | 重庆大学 | 一种提高重复数据删除备份系统恢复性能的数据布局方法 |
US10162554B2 (en) | 2016-08-03 | 2018-12-25 | Samsung Electronics Co., Ltd. | System and method for controlling a programmable deduplication ratio for a memory system |
CN107632786B (zh) * | 2017-09-20 | 2020-04-07 | 杭州宏杉科技股份有限公司 | 一种数据重删的管理方法及装置 |
CN109359250B (zh) * | 2018-08-31 | 2022-05-31 | 创新先进技术有限公司 | 统一资源定位符处理方法、装置、服务器及可读存储介质 |
US11455281B2 (en) * | 2019-04-19 | 2022-09-27 | EMC IP Holding Company LLC | Generating and morphing a collection of files in a folder/sub-folder structure that collectively has desired dedupability, compression, clustering and commonality |
JP7323801B2 (ja) | 2019-11-06 | 2023-08-09 | 富士通株式会社 | 情報処理装置および情報処理プログラム |
CN111459848B (zh) * | 2020-03-31 | 2023-10-31 | Oppo广东移动通信有限公司 | 一种文件碎片的整理方法、装置、存储介质及电子设备 |
US11520695B2 (en) * | 2021-03-02 | 2022-12-06 | Western Digital Technologies, Inc. | Storage system and method for automatic defragmentation of memory |
US11809736B2 (en) | 2021-12-21 | 2023-11-07 | Western Digital Technologies, Inc. | Storage system and method for quantifying storage fragmentation and predicting performance drop |
US11809747B2 (en) * | 2021-12-21 | 2023-11-07 | Western Digital Technologies, Inc. | Storage system and method for optimizing write-amplification factor, endurance, and latency during a defragmentation operation |
US11847343B2 (en) | 2021-12-22 | 2023-12-19 | Western Digital Technologies, Inc. | Storage system and method for non-blocking coherent re-writes |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8051252B2 (en) | 2005-03-11 | 2011-11-01 | Ross Neil Williams | Method and apparatus for detecting the presence of subblocks in a reduced-redundancy storage system |
JP4915774B2 (ja) * | 2006-03-15 | 2012-04-11 | 株式会社日立製作所 | ストレージシステム及びストレージシステムの制御方法 |
US7562203B2 (en) | 2006-09-27 | 2009-07-14 | Network Appliance, Inc. | Storage defragmentation based on modified physical address and unmodified logical address |
US7321962B1 (en) * | 2007-02-07 | 2008-01-22 | Network Appliance, Inc. | Technique for translating a hybrid virtual volume file system into a pure virtual file system data stream |
JP5060876B2 (ja) * | 2007-08-30 | 2012-10-31 | 株式会社日立製作所 | ストレージシステム及びストレージシステムの消費電力低減方法 |
KR20100071063A (ko) * | 2007-10-05 | 2010-06-28 | 디스키퍼 코포레이션 | 고체 상태 드라이브 최적화기 |
US8447938B2 (en) * | 2008-01-04 | 2013-05-21 | International Business Machines Corporation | Backing up a deduplicated filesystem to disjoint media |
US8346730B2 (en) * | 2008-04-25 | 2013-01-01 | Netapp. Inc. | Deduplication of data on disk devices based on a threshold number of sequential blocks |
US9176978B2 (en) | 2009-02-05 | 2015-11-03 | Roderick B. Wideman | Classifying data for deduplication and storage |
US20110055471A1 (en) | 2009-08-28 | 2011-03-03 | Jonathan Thatcher | Apparatus, system, and method for improved data deduplication |
JP4852135B2 (ja) * | 2009-09-30 | 2012-01-11 | 株式会社東芝 | データ分割方法及び装置 |
US8499131B2 (en) | 2010-04-13 | 2013-07-30 | Hewlett-Packard Development Company, L.P. | Capping a number of locations referred to by chunk references |
US8244992B2 (en) * | 2010-05-24 | 2012-08-14 | Spackman Stephen P | Policy based data retrieval performance for deduplicated data |
US20120036113A1 (en) | 2010-08-04 | 2012-02-09 | Mark David Lillibridge | Performing deduplication of input data at plural levels |
KR101652436B1 (ko) | 2010-08-17 | 2016-08-30 | 에스케이텔레콤 주식회사 | 분산파일 시스템에서의 중복 제거 장치 및 방법 |
CA2809224C (en) * | 2010-08-31 | 2016-05-17 | Nec Corporation | Storage system |
US8463981B2 (en) * | 2010-12-08 | 2013-06-11 | Hitachi, Ltd. | Storage apparatus having deduplication unit |
US8825605B2 (en) * | 2011-10-11 | 2014-09-02 | Netapp, Inc. | Deduplication aware scheduling of requests to access data blocks |
US8615499B2 (en) * | 2012-01-27 | 2013-12-24 | International Business Machines Corporation | Estimating data reduction in storage systems |
-
2012
- 2012-02-29 US US13/408,051 patent/US9026503B2/en active Active
-
2013
- 2013-02-25 JP JP2014559940A patent/JP6122038B2/ja active Active
- 2013-02-25 WO PCT/US2013/027673 patent/WO2013130410A1/en active Application Filing
- 2013-02-25 CN CN201380022459.5A patent/CN104272263A/zh active Pending
- 2013-02-25 EP EP13755844.1A patent/EP2820545B1/en active Active
-
2015
- 2015-04-14 US US14/686,426 patent/US20150254268A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
EP2820545B1 (en) | 2020-09-30 |
US9026503B2 (en) | 2015-05-05 |
US20150254268A1 (en) | 2015-09-10 |
JP2015513741A (ja) | 2015-05-14 |
EP2820545A1 (en) | 2015-01-07 |
US20130226881A1 (en) | 2013-08-29 |
EP2820545A4 (en) | 2015-11-11 |
WO2013130410A1 (en) | 2013-09-06 |
CN104272263A (zh) | 2015-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6122038B2 (ja) | 重複排除のオペレーションを実行するためのフラグメンテーションのコントロール | |
US9606918B2 (en) | Methods and systems for dynamically controlled caching | |
US10459649B2 (en) | Host side deduplication | |
US8607017B2 (en) | Use of similarity hash to route data for improved deduplication in a storage server cluster | |
US9612768B2 (en) | Methods and systems for storing data at different storage tiers of a storage system | |
US9424285B1 (en) | Content-based sampling for deduplication estimation | |
US9798728B2 (en) | System performing data deduplication using a dense tree data structure | |
US8117388B2 (en) | Data distribution through capacity leveling in a striped file system | |
US8620962B1 (en) | Systems and methods for hierarchical reference counting via sibling trees | |
US8955087B2 (en) | Method and system for transferring replicated information from source storage to destination storage | |
US8171064B2 (en) | Methods and systems for concurrently reading direct and indirect data blocks | |
US11226869B2 (en) | Persistent memory architecture | |
WO2006118957A2 (en) | Data placement technique for striping data containers across volumes of a storage system cluster | |
US8601214B1 (en) | System and method for write-back cache in sparse volumes | |
EP2168063A1 (en) | System and method for on-the-fly elimination of redundant date | |
US20150081981A1 (en) | Generating predictive cache statistics for various cache sizes | |
US20150134625A1 (en) | Pruning of server duplication information for efficient caching | |
US10853286B2 (en) | Performance improvement for an active-active distributed non-ALUA system with address ownerships | |
US8954390B1 (en) | Method and system for replication in storage systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20151116 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20151118 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160224 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170228 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170330 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6122038 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |