JP2021189624A - 分散ストレージ装置および分散ストレージ装置におけるデータ管理方法 - Google Patents
分散ストレージ装置および分散ストレージ装置におけるデータ管理方法 Download PDFInfo
- Publication number
- JP2021189624A JP2021189624A JP2020092660A JP2020092660A JP2021189624A JP 2021189624 A JP2021189624 A JP 2021189624A JP 2020092660 A JP2020092660 A JP 2020092660A JP 2020092660 A JP2020092660 A JP 2020092660A JP 2021189624 A JP2021189624 A JP 2021189624A
- Authority
- JP
- Japan
- Prior art keywords
- data
- storage
- file
- cache data
- distributed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/174—Redundancy elimination performed by the file system
- G06F16/1748—De-duplication implemented within the file system, e.g. based on file segments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/148—File search processing
- G06F16/152—File search processing using file content signatures, e.g. hash values
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/172—Caching, prefetching or hoarding of files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/1727—Details of free space management performed by the file system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
なお、ドライブ214は、RAID技術などを用いて複数のハードディスク装置やSSDから構成されていてもよい。
処理終了の通知を受け取ったストレージノードBの分散ストレージプログラムは、キャッシュデータ解放処理(1200)を行った後、重複排除対象のデータを分割ファイルに書き込む(1012)。
そして、ストレージノードBの分散ストレージプログラムは、全重複排除対象データの処理が終了したか確認し(1114)、全重複排除対象データの処理が終了していなければ、処理1110から処理を繰り返す。全重複排除対象データの処理が終了していれば、キャッシュデータ解放処理(1200)を行った後、重複排除対象外のデータも分割ファイルに書き込む(1115)。この後、すべての重複排除対象外データの処理が終了したかを確認し(1116)、終了していればインライン重複排除処理を終了し、そうでなければ、処理1200、1115から処理を繰り返す。
処理終了の通知を受け取ったストレージノードBの分散ストレージプログラムは、全重複排除対象データの処理が終了したか確認し(1415)、全重複排除対象データの処理が終了していれば、更新管理テーブルから処理した更新データのエントリを削除し(1416)、全更新データを処理したか確認する(1417)。
次に、ストレージノードBの分散ストレージプログラムは、全重複排除対象データの処理が終了したか確認し(1415)、全重複排除対象データの処理が終了していれば、更新管理テーブルから処理した更新データのエントリを削除し(1416)、全更新データを処理したか確認する(1417)。
Claims (14)
- 複数のストレージノードを有する分散ストレージ装置であって、
前記ストレージノードはストレージデバイスとプロセッサとを有し、
前記複数のストレージノードは、ストレージノード間にて重複排除する重複排除機能を有し、
前記ストレージデバイスには、複数の前記ストレージノードにおいて重複排除されていないファイルと、重複排除された重複データが格納された重複データ格納ファイルと、他のストレージノードに格納された重複データのキャッシュデータが格納されたキャッシュデータ格納ファイルとが格納され、
前記プロセッサは、
所定の条件を満たした場合に、前記キャッシュデータを破棄し、
前記キャッシュデータのリードアクセス要求を受けた際に、前記キャッシュデータを前記キャッシュデータ格納ファイルに格納している場合には当該キャッシュデータを読み出し、前記キャッシュデータを破棄している場合には前記他のストレージノードに要求して前記キャッシュデータにかかる前記重複データを読み出す
ことを特徴とする分散ストレージ装置。 - 請求項1記載の分散ストレージ装置において、
前記所定の条件は、前記ストレージノード内のストレージデバイスの空き容量が少ないことである
ことを特徴とする分散ストレージ装置。 - 請求項1記載の分散ストレージ装置において、
前記プロセッサは、前記キャッシュデータ格納ファイルの前記キャッシュデータの一部もしくは全部を破棄して、前記他のストレージノードから読み出した前記リードアクセス要求にかかる前記重複データを前記キャッシュデータ格納ファイルに格納する
ことを特徴とする分散ストレージ装置。 - 請求項3記載の分散ストレージ装置において、
前記所定の複数のファイルがサーバからのアクセス単位となっており、前記アクセス単位内の所定の複数のファイルは複数のストレージノードに分散して格納されるとともに、前記ファイルを格納する担当がストレージノードに定められており、
前記プロセッサは、前記キャッシュデータ格納ファイルを破棄する際、自身の前記ストレージノードが担当となっているファイルにかかる前記重複データの前記キャッシュデータを優先的に前記キャッシュデータ格納ファイルに残す
ことを特徴とする分散ストレージ装置。 - 請求項3記載の分散ストレージ装置において、
前記所定の複数のファイルがサーバからのアクセス単位となっており、前記アクセス単位内の所定の複数のファイルは複数のストレージノードに分散して格納されるとともに、前記ファイルを格納する担当がストレージノードに定められており、
前記プロセッサは、前記キャッシュデータを破棄する際、破棄する前記キャッシュデータがあるアクセス単位の一部分を構成しているファイルである場合に、前記ファイルと同一のアクセス単位を構成する別のファイルの前記キャッシュデータを破棄する
ことを特徴とする分散ストレージ装置。 - 請求項1記載の分散ストレージ装置において、
前記プロセッサは、ライトアクセス要求を受けた際に、ライトアクセス要求にかかるデータがいずれかのデータと重複していることを検出した場合、重複排除を行うとともに、このライトアクセス要求にかかるデータを前記キャッシュデータ格納ファイルに格納する
ことを特徴とする分散ストレージ装置。 - 請求項6記載の分散ストレージ装置において、
前記プロセッサは、前記キャッシュデータ格納ファイルの前記キャッシュデータの一部もしくは全部を破棄し、前記ライトアクセス要求にかかる前記データの中に検出された前記重複データを前記キャッシュデータ格納ファイルに格納する
ことを特徴とする分散ストレージ装置。 - 請求項7記載の分散ストレージ装置において、
前記所定の複数のファイルがサーバからのアクセス単位となっており、前記アクセス単位内の所定の複数のファイルは複数のストレージノードに分散して格納されるとともに、前記ファイルを格納する担当がストレージノードに定められており、
前記プロセッサは、前記キャッシュデータ格納ファイルを破棄する際、自身の前記ストレージノードが担当となっているファイルにかかる前記重複データの前記キャッシュデータを優先的に前記キャッシュデータ格納ファイルに残す
ことを特徴とする分散ストレージ装置。 - 請求項7記載の分散ストレージ装置において、
前記所定の複数のファイルがサーバからのアクセス単位となっており、前記アクセス単位内の所定の複数のファイルは複数のストレージノードに分散して格納されるとともに、前記ファイルを格納する担当がストレージノードに定められており、
前記プロセッサは、前記キャッシュデータを破棄する際、破棄する前記キャッシュデータがあるアクセス単位の一部分を構成しているファイルである場合に、前記ファイルと同一のアクセス単位を構成する別のファイルの前記キャッシュデータを破棄する
ことを特徴とする分散ストレージ装置。 - 請求項1記載の分散ストレージ装置において、
前記プロセッサは、ライトアクセス要求を受けて前記重複排除されていないファイルに書き込みした後、任意のタイミングで重複判定を行い、書き込まれたデータの中に重複しているデータを検出した場合、この重複しているデータを前記キャッシュデータ格納ファイルに保存する
ことを特徴とする分散ストレージ装置。 - 請求項10記載の分散ストレージ装置において、
前記プロセッサは、前記キャッシュデータ格納ファイルの前記キャッシュデータの一部もしくは全部を破棄し、前記ライトアクセス要求にかかる前記データの中に検出された前記重複データを前記キャッシュデータ格納ファイルに格納する
ことを特徴とする分散ストレージ装置。 - 請求項11記載の分散ストレージ装置において、
前記所定の複数のファイルがサーバからのアクセス単位となっており、前記アクセス単位内の所定の複数のファイルは複数のストレージノードに分散して格納されるとともに、前記ファイルを格納する担当がストレージノードに定められており、
前記プロセッサは、前記キャッシュデータ格納ファイルを破棄する際、自身の前記ストレージノードが担当になっているファイルにかかる前記重複データの前記キャッシュデータを優先的に前記キャッシュデータ格納ファイルに残す
ことを特徴とする分散ストレージ装置。 - 請求項11記載の分散ストレージ装置において、
前記所定の複数のファイルがサーバからのアクセス単位となっており、前記アクセス単位内の所定の複数のファイルは複数のストレージノードに分散して格納されるとともに、前記ファイルを格納する担当がストレージノードに定められており、
前記プロセッサは、前記キャッシュデータを破棄する際、破棄する前記キャッシュデータがあるアクセス単位の一部分を構成しているファイルである場合に、前記ファイルと同一のアクセス単位を構成する別のファイルの前記キャッシュデータを破棄する
ことを特徴とする分散ストレージ装置。 - 複数のストレージノードを有する分散ストレージ装置におけるデータ管理方法であって、
前記ストレージノードはストレージデバイスとプロセッサとを有し、
前記複数のストレージノードは、ストレージノード間にて重複排除する重複排除機能を有し、
前記ストレージデバイスには、複数の前記ストレージノードにおいて重複排除されていないファイルと、重複排除された重複データが格納された重複データ格納ファイルと、他のストレージノードに格納された重複データのキャッシュデータが格納されたキャッシュデータ格納ファイルとが格納され、
所定の条件を満たした場合に、前記キャッシュデータを破棄し、
前記キャッシュデータのリードアクセス要求を受けた際に、前記キャッシュデータを前記キャッシュデータ格納ファイルに格納している場合には当該キャッシュデータを読み出し、前記キャッシュデータを破棄している場合には他のストレージノードに要求して前記キャッシュデータにかかる前記重複データを読み出す
ことを特徴とする分散ストレージ装置におけるデータ管理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020092660A JP7102460B2 (ja) | 2020-05-27 | 2020-05-27 | 分散ストレージ装置および分散ストレージ装置におけるデータ管理方法 |
US17/182,316 US11520745B2 (en) | 2020-05-27 | 2021-02-23 | Distributed storage device and data management method in distributed storage device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020092660A JP7102460B2 (ja) | 2020-05-27 | 2020-05-27 | 分散ストレージ装置および分散ストレージ装置におけるデータ管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021189624A true JP2021189624A (ja) | 2021-12-13 |
JP7102460B2 JP7102460B2 (ja) | 2022-07-19 |
Family
ID=78706371
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020092660A Active JP7102460B2 (ja) | 2020-05-27 | 2020-05-27 | 分散ストレージ装置および分散ストレージ装置におけるデータ管理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11520745B2 (ja) |
JP (1) | JP7102460B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102467372B1 (ko) * | 2022-01-06 | 2022-11-14 | 삼성전자주식회사 | 스토리지 장치 및 이의 동작 방법 |
JP7274057B1 (ja) * | 2022-04-13 | 2023-05-15 | 三菱電機株式会社 | 重複排除システム、サーバ装置、重複排除方法、および、重複排除プログラム |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10459892B2 (en) | 2014-04-23 | 2019-10-29 | Qumulo, Inc. | Filesystem hierarchical aggregate metrics |
US11360936B2 (en) | 2018-06-08 | 2022-06-14 | Qumulo, Inc. | Managing per object snapshot coverage in filesystems |
US10795796B1 (en) | 2020-01-24 | 2020-10-06 | Qumulo, Inc. | Predictive performance analysis for file systems |
US11151001B2 (en) | 2020-01-28 | 2021-10-19 | Qumulo, Inc. | Recovery checkpoints for distributed file systems |
US11775481B2 (en) | 2020-09-30 | 2023-10-03 | Qumulo, Inc. | User interfaces for managing distributed file systems |
US11157458B1 (en) | 2021-01-28 | 2021-10-26 | Qumulo, Inc. | Replicating files in distributed file systems using object-based data storage |
US11461241B2 (en) | 2021-03-03 | 2022-10-04 | Qumulo, Inc. | Storage tier management for file systems |
US11132126B1 (en) | 2021-03-16 | 2021-09-28 | Qumulo, Inc. | Backup services for distributed file systems in cloud computing environments |
US11567660B2 (en) | 2021-03-16 | 2023-01-31 | Qumulo, Inc. | Managing cloud storage for distributed file systems |
US11669255B2 (en) | 2021-06-30 | 2023-06-06 | Qumulo, Inc. | Distributed resource caching by reallocation of storage caching using tokens and agents with non-depleted cache allocations |
US11354273B1 (en) * | 2021-11-18 | 2022-06-07 | Qumulo, Inc. | Managing usable storage space in distributed file systems |
US11599508B1 (en) | 2022-01-31 | 2023-03-07 | Qumulo, Inc. | Integrating distributed file systems with object stores |
US20230409483A1 (en) * | 2022-06-16 | 2023-12-21 | Samsung Electronics Co., Ltd. | System and method for caching in storage devices |
US11722150B1 (en) | 2022-09-28 | 2023-08-08 | Qumulo, Inc. | Error resistant write-ahead log |
US11729269B1 (en) | 2022-10-26 | 2023-08-15 | Qumulo, Inc. | Bandwidth management in distributed file systems |
US11966592B1 (en) | 2022-11-29 | 2024-04-23 | Qumulo, Inc. | In-place erasure code transcoding for distributed file systems |
US11934660B1 (en) | 2023-11-07 | 2024-03-19 | Qumulo, Inc. | Tiered data storage with ephemeral and persistent tiers |
US11921677B1 (en) | 2023-11-07 | 2024-03-05 | Qumulo, Inc. | Sharing namespaces across file system clusters |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014160311A (ja) * | 2013-02-19 | 2014-09-04 | Hitachi Ltd | 自律分散重複排除ファイルシステム、記憶装置ユニット及びデータアクセス方法 |
US20140280664A1 (en) * | 2013-03-14 | 2014-09-18 | Microsoft Corporation | Caching content addressable data chunks for storage virtualization |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8745329B2 (en) * | 2011-01-20 | 2014-06-03 | Google Inc. | Storing data across a plurality of storage nodes |
-
2020
- 2020-05-27 JP JP2020092660A patent/JP7102460B2/ja active Active
-
2021
- 2021-02-23 US US17/182,316 patent/US11520745B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014160311A (ja) * | 2013-02-19 | 2014-09-04 | Hitachi Ltd | 自律分散重複排除ファイルシステム、記憶装置ユニット及びデータアクセス方法 |
US20140280664A1 (en) * | 2013-03-14 | 2014-09-18 | Microsoft Corporation | Caching content addressable data chunks for storage virtualization |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102467372B1 (ko) * | 2022-01-06 | 2022-11-14 | 삼성전자주식회사 | 스토리지 장치 및 이의 동작 방법 |
JP7274057B1 (ja) * | 2022-04-13 | 2023-05-15 | 三菱電機株式会社 | 重複排除システム、サーバ装置、重複排除方法、および、重複排除プログラム |
WO2023199427A1 (ja) * | 2022-04-13 | 2023-10-19 | 三菱電機株式会社 | 重複排除システム、機器、サーバ装置、重複排除方法、および、重複排除プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20210374105A1 (en) | 2021-12-02 |
JP7102460B2 (ja) | 2022-07-19 |
US11520745B2 (en) | 2022-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7102460B2 (ja) | 分散ストレージ装置および分散ストレージ装置におけるデータ管理方法 | |
US20210255791A1 (en) | Distributed storage system and data management method for distributed storage system | |
CN111587428B (zh) | 分布式存储系统中的元数据日志 | |
US10216651B2 (en) | Primary data storage system with data tiering | |
US9996421B2 (en) | Data storage method, data storage apparatus, and storage device | |
US11301159B2 (en) | Storage system and data transfer method | |
US10359967B2 (en) | Computer system | |
JP2022512064A (ja) | 様々なデータ冗長性スキームを備えた、システムにおける利用可能なストレージ空間を改善すること | |
US11169879B2 (en) | Storage system | |
US11449402B2 (en) | Handling of offline storage disk | |
US20180307440A1 (en) | Storage control apparatus and storage control method | |
US20180307426A1 (en) | Storage apparatus and storage control method | |
US10394484B2 (en) | Storage system | |
US10761764B1 (en) | Storage system and data transfer method | |
US20140188824A1 (en) | Reducing fragmentation in compressed journal storage | |
US11947419B2 (en) | Storage device with data deduplication, operation method of storage device, and operation method of storage server | |
JP6406283B2 (ja) | ストレージ装置およびストレージ方法 | |
US10963485B1 (en) | Storage system and data replication method in storage system | |
JP2020154626A (ja) | 分散ストレージシステム、データ管理方法、及びデータ管理プログラム | |
JP7435735B2 (ja) | 分散処理システム、分散処理システムの制御方法、及び、分散処理システムの制御装置 | |
US20210191628A1 (en) | Distributed storage system, data control method and storage medium | |
WO2018055686A1 (ja) | 情報処理システム | |
US11112973B2 (en) | Computer system and data management method | |
CN112256657A (zh) | 日志镜像方法及系统 | |
US20230236932A1 (en) | Storage system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210514 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220530 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220621 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220706 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7102460 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |