JP6653370B2 - ストレージシステム - Google Patents
ストレージシステム Download PDFInfo
- Publication number
- JP6653370B2 JP6653370B2 JP2018501544A JP2018501544A JP6653370B2 JP 6653370 B2 JP6653370 B2 JP 6653370B2 JP 2018501544 A JP2018501544 A JP 2018501544A JP 2018501544 A JP2018501544 A JP 2018501544A JP 6653370 B2 JP6653370 B2 JP 6653370B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- storage node
- storage
- node
- distributed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0646—Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
- G06F3/065—Replication mechanisms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/10—Program control for peripheral devices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0614—Improving the reliability of storage systems
- G06F3/0619—Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
- G06F3/064—Management of blocks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/067—Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2211/00—Indexing scheme relating to details of data-processing equipment not covered by groups G06F3/00 - G06F13/00
- G06F2211/10—Indexing scheme relating to G06F11/10
- G06F2211/1002—Indexing scheme relating to G06F11/1076
- G06F2211/1028—Distributed, i.e. distributed RAID systems with parity
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Computer Security & Cryptography (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
(1)該当オブジェクトのメタデータ管理表T20の再配置処理状態を再配置中に設定する。
(2)対象データの再配置処理を実行する。分散データ管理表T40を作成、更新する。
(3)再配置完了後も、メタデータ管理表T20の再配置状態を変更せず、維持する。
Claims (13)
- ネットワークを介して接続された複数のストレージノード、を含むストレージシステムであって、
第1ストレージノードと、第2ストレージノードと、第3ストレージノードと、を含み
前記第1ストレージノードは、オブジェクトのライトデータを受信し、
前記第1ストレージノードは、前記ライトデータから複数の分散配置ライトデータブロックを生成し、前記複数の分散配置ライトデータブロックから第1冗長データブロックを生成し、
前記第1ストレージノードは、前記複数の分散配置ライトデータブロックそれぞれと前記第1冗長データブロックとを異なるストレージノードに送信し、
前記異なるストレージノードは前記第2ストレージノードと前記第3ストレージノードとを含み、前記第1冗長データブロックの配置先は前記第3ストレージノードであり、
前記第2ストレージノードは、保持している分散配置ライトデータブロックから、複数の分散配置ライトデータブロックを選択し、前記選択された複数の分散配置ライトデータブロックの再配置先ストレージノードが異なり、
前記第2ストレージノードは、前記選択された複数の分散配置ライトデータブロックから第2冗長データブロックを生成し、
前記第2ストレージノードは、前記選択された複数の分散配置ライトデータブロックそれぞれを前記再配置先ストレージノードに再配置し、さらに、前記第2冗長データブロックを前記再配置先ストレージノード以外のストレージノードに配置することで、前記第1ストレージノードが受信した前記オブジェクトの前記ライトデータが前記複数のストレージノードの何れか1つに再配置される、ストレージシステム。 - 請求項1に記載のストレージシステムであって、
前記第1ストレージノードは、前記オブジェクトの識別子に基づいて前記異なるストレージノードを決定し、
前記第2ストレージノードは、前記選択された複数の分散配置ライトデータブロックそれぞれのオブジェクトの識別子に基づいて、前記再配置先ストレージノードと前記第2冗長データブロックを配置する前記ストレージノードとを決定する、ストレージシステム。 - 請求項2に記載のストレージシステムであって、
前記異なるストレージノードは、複数のオブジェクトからなるオブジェクト群と予め関連付けられている、ストレージシステム。 - 請求項1に記載のストレージシステムであって、
分散配置ライトデータブロックを保持しているストレージノードは、前記分散配置ライトデータブロックが再配置され、前記分散配置ライトデータブロックから生成される冗長データブロックが配置された後に、前記分散配置ライトデータブロックを削除する、ストレージシステム。 - 請求項1に記載のストレージシステムであって、
前記第2ストレージノードは、同一ストレージノードに送信する複数の分散配置ライトデータブロックを1回で送信する、ストレージシステム。 - 請求項1に記載のストレージシステムであって、
前記第2ストレージノードは、前記再配置をオブジェクトの予め定められた優先度に基づいて選択した1又は複数のオブジェクトの分散配置ライトデータブロックについて実行する、ストレージシステム。 - 請求項1に記載のストレージシステムであって、
前記第2ストレージノードは、前記再配置を、オブジェクトのアクセス頻度に基づいて選択した1又は複数のオブジェクトの分散配置ライトデータブロックについて実行する、ストレージシステム。 - 請求項1に記載のストレージシステムであって、
前記複数のストレージノードは、それぞれ、旧データを消去することなく更新データを追記し、メタデータによりデータ更新を管理し、
前記第1ストレージノードは、
前記受信したライトデータの更新データを受信し、
前記ライトデータを削除することなく、前記更新データから複数の更新ライトデータブロックを生成し、前記複数の更新ライトデータブロックから第3冗長データブロックを生成し、
前記第3冗長データブロックを前記第3ストレージノードに配置し、
前記更新ライトデータブロックそれぞれを、前記異なるストレージノードにおける、前記第3ストレージノード以外のストレージノードに配置し、
前記第3ストレージノードは、前記異なるストレージノードの少なくとも一部から受信した、最新ライトデータを使用して生成された中間冗長データにより、前記第3冗長データブロックを更新し、最新冗長データブロックを生成する、ストレージシステム。 - 請求項8に記載のストレージシステムであって、
前記更新データが、前記受信したライトデータの一部の更新データである場合、
前記第1ストレージノードは、前記更新データ内のデータからなるデータブロックと、ダミーデータからなるダミーデータブロックと、を含むように、前記複数の更新ライトデータブロックを生成し、
前記ダミーデータブロックの配置において、前記ダミーデータブロックを配置先ストレージノードに送信することなく前記ダミーデータブロックの通知を行い、
前記ダミーデータブロックの配置先ストレージノードは、前記ダミーデータブロックを格納することなく管理情報により管理する、ストレージシステム。 - 請求項9に記載のストレージシステムであって、
前記第3冗長データブロックは、複数チェックポイントのストライプにおいて、最も多くの最新データブロックを含むストライプの冗長データブロックである、ストレージシステム。 - 請求項8に記載のストレージシステムであって、
前記第2ストレージノードは、最新データから前記複数の分散配置ライトデータブロックを選択する、ストレージシステム。 - 請求項1に記載のストレージシステムであって、
ホストプログラムを配置するためのストレージノードとして、当該ホストプログラムが使用するオブジェクトの再配置先ストレージノードの優先度は、当該ホストプログラムが使用するオブジェクトを保持しないストレージノードよりも高い、ストレージシステム。 - コードを含む、計算機読み取り可能な非一時的記憶媒体であって、前記コードは、ストレージシステムにおけるプロセッサにより実行されることで、前記ストレージシステムに処理を実行させ、
前記ストレージシステムは、ネットワークを介して接続された第1ストレージノードと、第2ストレージノードと、第3ストレージノードと、を含み、
前記処理は、
前記第1ストレージノードが、オブジェクトのライトデータを受信し、
前記第1ストレージノードが、前記ライトデータから複数の分散配置ライトデータブロックを生成し、前記複数の分散配置ライトデータブロックから第1冗長データブロックを生成し、
前記第1ストレージノードが、前記複数の分散配置ライトデータブロックそれぞれと前記第1冗長データブロックとを異なるストレージノードに送信し、
前記異なるストレージノードは前記第2ストレージノードと前記第3ストレージノードとを含み、前記第1冗長データブロックの配置先は前記第3ストレージノードであり、
前記第2ストレージノードが、保持している分散配置ライトデータブロックから、複数の分散配置ライトデータブロックを選択し、前記選択された複数の分散配置ライトデータブロックの再配置先ストレージノードが異なり、前記選択された複数の分散配置ライトデータブロックから生成される第2冗長データブロックの配置先が前記第3ストレージノードであり、
前記第2ストレージノードが、前記選択された複数の分散配置ライトデータブロックから前記第2冗長データブロックを生成し、
前記第2ストレージノードが、前記選択された複数の分散配置ライトデータブロックそれぞれを前記再配置先ストレージノードに再配置し、さらに、前記第2冗長データブロックを前記再配置先ストレージノード以外のストレージノードに配置することで、前記第1ストレージノードが受信した前記オブジェクトの前記ライトデータが前記複数のストレージノードの何れかに1つ再配置される、記憶媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2016/055873 WO2017145375A1 (ja) | 2016-02-26 | 2016-02-26 | ストレージシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2017145375A1 JPWO2017145375A1 (ja) | 2018-08-30 |
JP6653370B2 true JP6653370B2 (ja) | 2020-02-26 |
Family
ID=59684991
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018501544A Active JP6653370B2 (ja) | 2016-02-26 | 2016-02-26 | ストレージシステム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10394484B2 (ja) |
JP (1) | JP6653370B2 (ja) |
WO (1) | WO2017145375A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021046693A1 (zh) * | 2019-09-09 | 2021-03-18 | 华为技术有限公司 | 存储系统中数据处理方法、装置以及存储系统 |
US11416356B2 (en) | 2020-04-22 | 2022-08-16 | Netapp, Inc. | Network storage failover systems and associated methods |
US11768775B2 (en) * | 2021-07-28 | 2023-09-26 | Netapp, Inc. | Methods and systems for managing race conditions during usage of a remote storage location cache in a networked storage system |
US11537613B1 (en) * | 2021-10-29 | 2022-12-27 | Snowflake Inc. | Merge small file consolidation |
US11593306B1 (en) | 2021-10-29 | 2023-02-28 | Snowflake Inc. | File defragmentation service |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3427763B2 (ja) * | 1999-01-26 | 2003-07-22 | 日本電気株式会社 | ディスクアレイ装置 |
US6609176B1 (en) * | 1999-12-27 | 2003-08-19 | Kabushiki Kaisha Toshiba | Disk control system and data rearrangement method |
WO2002027501A1 (fr) * | 2000-09-20 | 2002-04-04 | Yutaka Yasukura | Methode d'edition/retablissement d'information electronique |
JP3950720B2 (ja) * | 2002-03-18 | 2007-08-01 | 株式会社日立製作所 | ディスクアレイサブシステム |
JP2005148854A (ja) * | 2003-11-11 | 2005-06-09 | Hitachi Ltd | ファイルシステム及びプログラム |
JP4146380B2 (ja) * | 2004-03-29 | 2008-09-10 | 東芝ソリューション株式会社 | ストレージシステム、ブロック再配置制御方法及びプログラム |
US8019799B1 (en) * | 2004-04-12 | 2011-09-13 | Symantec Operating Corporation | Computer system operable to automatically reorganize files to avoid fragmentation |
US7546342B2 (en) | 2004-05-14 | 2009-06-09 | Microsoft Corporation | Distributed hosting of web content using partial replication |
US8051362B2 (en) * | 2007-06-15 | 2011-11-01 | Microsoft Corporation | Distributed data storage using erasure resilient coding |
US8825980B2 (en) * | 2012-03-21 | 2014-09-02 | International Business Machines Corporation | Consideration of adjacent track interference and wide area adjacent track erasure during disk defragmentation |
IN2013MU03094A (ja) * | 2013-09-27 | 2015-07-17 | Tata Consultancy Services Ltd |
-
2016
- 2016-02-26 US US15/777,782 patent/US10394484B2/en active Active
- 2016-02-26 JP JP2018501544A patent/JP6653370B2/ja active Active
- 2016-02-26 WO PCT/JP2016/055873 patent/WO2017145375A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
JPWO2017145375A1 (ja) | 2018-08-30 |
WO2017145375A1 (ja) | 2017-08-31 |
US20180373435A1 (en) | 2018-12-27 |
US10394484B2 (en) | 2019-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11487619B2 (en) | Distributed storage system | |
US10977124B2 (en) | Distributed storage system, data storage method, and software program | |
JP7312251B2 (ja) | 様々なデータ冗長性スキームを備えた、システムにおける利用可能なストレージ空間を改善すること | |
JP4809040B2 (ja) | ストレージ装置及びスナップショットのリストア方法 | |
US6912537B2 (en) | Dynamically changeable virtual mapping scheme | |
JP6653370B2 (ja) | ストレージシステム | |
US10459638B2 (en) | Computer system that generates group information and redundant code based on user data and changes the group information and redundant code based on transmission data, control method for computer system, and recording medium | |
US20090077327A1 (en) | Method and apparatus for enabling a NAS system to utilize thin provisioning | |
JP2022504790A (ja) | データブロックのイレイジャーコーディングコンテンツ主導分散 | |
US11301137B2 (en) | Storage system and data arrangement method of storage system | |
JPWO2015052798A1 (ja) | ストレージシステム及び記憶制御方法 | |
WO2017112166A1 (en) | Dynamic storage transitions employing tiered range volumes | |
US20220182445A1 (en) | Method and apparatus for performing simple storage service seamless migration using index objects | |
US11899533B2 (en) | Stripe reassembling method in storage system and stripe server | |
US20180307426A1 (en) | Storage apparatus and storage control method | |
US20220365692A1 (en) | Techniques for storage management | |
US20210103400A1 (en) | Storage system and data migration method | |
WO2016013075A1 (ja) | ストレージ、計算機およびその制御方法 | |
WO2018055686A1 (ja) | 情報処理システム | |
WO2017212515A1 (ja) | ストレージシステム、計算機、およびストレージ制御方法 | |
JP6605762B2 (ja) | 記憶ドライブの故障により消失したデータを復元する装置 | |
JP2022020744A (ja) | ストレージシステム及びストレージ制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180515 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190709 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190828 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200121 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200127 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6653370 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |