JP6817340B2 - 計算機 - Google Patents
計算機 Download PDFInfo
- Publication number
- JP6817340B2 JP6817340B2 JP2018565232A JP2018565232A JP6817340B2 JP 6817340 B2 JP6817340 B2 JP 6817340B2 JP 2018565232 A JP2018565232 A JP 2018565232A JP 2018565232 A JP2018565232 A JP 2018565232A JP 6817340 B2 JP6817340 B2 JP 6817340B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- storage drive
- storage
- fmpkg
- spare
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1076—Parity data used in redundant arrays of independent storages, e.g. in RAID systems
- G06F11/1092—Rebuilding, e.g. when physically replacing a failing disk
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1076—Parity data used in redundant arrays of independent storages, e.g. in RAID systems
- G06F11/1088—Reconstruction on already foreseen single or plurality of spare disks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0793—Remedial or corrective actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2089—Redundant storage control functionality
- G06F11/2092—Techniques of failing over between control units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0614—Improving the reliability of storage systems
- G06F3/0619—Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
- G06F3/0644—Management of space entities, e.g. partitions, extents, pools
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0683—Plurality of storage devices
- G06F3/0689—Disk arrays, e.g. RAID, JBOD
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0655—Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
- G06F3/0659—Command handling arrangements, e.g. command buffers, queues, command scheduling
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Human Computer Interaction (AREA)
- Computer Security & Cryptography (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Detection And Correction Of Errors (AREA)
Description
無効Planeポインタ1504は、寿命や故障によってデータ格納に利用できないPlaneの番号を示す。
図17は、部分故障処理実行部1604が、FMPKG113の故障を検知するフローを示す。本フローは、あるFMPKG113に部分故障が生じたことを検知した場合に実施される。以降、故障を通知したFMPKG113のことを、部分故障FMPKG113と呼ぶ。また、故障により消失したデータを消失データ、消失データの論理アドレスを消失データアドレスと呼ぶ。
部分故障処理実行部1604が受領する障害情報は、消失データアドレスと、サイズと、コレクション種別とを含む。
次に、図18を用いてデータ退避処理(1706)の詳細を説明する。ステップ1801において、部分故障処理実行部1604は、退避先FMPKG113のIDを決定する。複数の予備FMPKG113が存在する場合、部分故障処理実行部1604は、それらのうちの一台を選択する。退避先FMPKG113として使用されているFMPKG113が存在する場合、部分故障処理実行部1604は、それを選択する。
図19を用いて、リード処理実行部1601の処理フローを詳細に述べる。リード処理実行部1601は、ストレージコントローラ102がホスト計算機103からリード要求を受け付けたときに、実行される。
図21は、ライト要求受付部1602の処理フローを示す。ライト要求受付部1602は、ストレージコントローラ102がホスト計算機103からライト要求を受け付けたときに、実行される。
図22は、ライトアフタ処理実行部1603の処理フローを示す。ライトアフタ処理実行部1603は、CPU108が所定の契機で実行する。例えば、定期的にライトアフタ処理実行部1603が実行されてもよい。主記憶109上のダーティデータ量が所定量を超過した時点でライトアフタ処理実行部1603が実行されてもよい。
次に、部分故障FMPKG113内部のコントローラユニット1101で行われる処理について説明する。なおコントローラユニット1101で行われる処理は原則として、コントローラユニット1101内のプロセッサ1106がプログラムを実行することで実現される。また、そのプログラムは主記憶1107内に格納されている。
図27を用いて、リード処理実行部1601の処理フローを詳細に述べる。リード処理実行部1601は、ホスト計算機103から、ストレージコントローラ102が、リード要求を受け付けたときに実行される。
図28を用いて、リード処理実行部1601の処理フローを詳細に述べる。リード処理実行部1601は、ホスト103から、ストレージコントローラ102が、リード要求を受け付けたときに実行される。実施例1及び実施例2は、それぞれステップ1906及びステップ2801において、退避先FMPKG113 のIDを取得するが、本実施例は省略する。
図29は、ライトアフタ処理実行部1603の処理フローである。ライトアフタ処理実行部1603は、CPU108により所定の契機で実行される。例えば、定期的にライトアフタ処理実行部1603が実行されてもよい。主記憶109上のダーティデータ量が所定量を超過した時点でライトアフタ処理実行部1603が実行されてもよい。
次に、FMPKG113内のコントローラユニット1101で行われる処理について説明する。コントローラユニット1101で行われる処理は原則として、コントローラユニット1101内のプロセッサ1106がプログラムを実行することで実現される。また、そのプログラムは主記憶1107内に格納されている。主記憶1107内に格納された本実施例に関するプログラムは、図13に示されている。
Claims (8)
- 複数の記憶ドライブを制御する計算機であって、
メモリと、
前記メモリに格納されているプログラムに従って動作するプロセッサと、を含み、
前記プロセッサは、
第1の記憶ドライブの部分故障に対して、前記第1の記憶ドライブの論理アドレス空間において所定サイズ以上の1以上の領域を選択し、
前記選択した1以上の領域のデータを、予備記憶ドライブに移動し、
前記選択した1以上の領域のデータを前記予備記憶ドライブに移動した後に、前記第1の記憶ドライブとRAIDグループを構成する他の記憶ドライブからデータを読み出して、前記部分故障による消失データを復元し、復元した前記消失データを前記第1の記憶ドライブに書き込み、
前記第1の記憶ドライブから前記予備記憶ドライブに移動されるデータの、前記第1の記憶ドライブにおける論理アドレスと前記予備記憶ドライブにおける論理アドレスとは同一であり、
前記第1の記憶ドライブから前記予備記憶ドライブに移動されるデータが、前記部分故障により消失した第1消失データを含む場合、前記プロセッサは、前記他の記憶ドライブからデータを読み出して前記第1消失データを復元し、前記予備記憶ドライブに書き込む、計算機。 - 請求項1に記載の計算機であって、
前記プロセッサは、前記第1の記憶ドライブにおける空き予備領域から前記部分故障による全消失データ量を引いた値が所定の値より小さい場合に、前記所定サイズ以上の1以上の領域を選択する、計算機。 - 請求項2に記載の計算機であって、
前記プロセッサは、
前記第1の記憶ドライブから、前記第1の記憶ドライブにおける空き予備領域から前記部分故障による全消失データ量を引いた値が所定の値より小さい場合に、障害通知を受信し、
前記障害通知に応答して、前記所定サイズ以上の1以上の領域を選択する、計算機。 - 請求項1に記載の計算機であって、
前記複数の記憶ドライブは、それぞれ、複数の仮想記憶ドライブを含む、物理記憶ドライブであり、
前記複数の仮想記憶ドライブそれぞれに、物理記憶ドライブの論理アドレス空間内の領域が割り当てられており、
前記プロセッサは、
前記第1の記憶ドライブの部分故障に対して、前記第1の記憶ドライブにおける1以上の仮想記憶ドライブを選択し、
選択した前記1以上の仮想記憶ドライブのデータを前記予備記憶ドライブに移動する、計算機。 - 請求項4に記載の計算機であって、
前記1以上の仮想記憶ドライブは、前記予備記憶ドライブに含まれるいずれの仮想記憶ドライブともRAIDグループを構成していない、計算機。 - 請求項1に記載の計算機であって、
前記プロセッサは、
ホストからの前記1以上の領域に対するI/O要求に応答して、前記第1の記憶ドライブにI/O要求を送信し、
前記第1の記憶ドライブに対する前記I/O要求に対して、前記第1の記憶ドライブから前記予備記憶ドライブの識別情報を受信すると、前記予備記憶ドライブにI/O要求を送信する、計算機。 - 複数の記憶ドライブを制御する方法であって、
第1の記憶ドライブの部分故障に対して、前記第1の記憶ドライブの論理アドレス空間において所定サイズ以上の1以上の領域を選択し、
前記選択した1以上の領域のデータを、予備記憶ドライブに移動し、
前記第1の記憶ドライブから前記予備記憶ドライブに移動されるデータの、前記第1の記憶ドライブにおける論理アドレスと前記予備記憶ドライブにおける論理アドレスとは同一であり、
前記選択した1以上の領域のデータを前記予備記憶ドライブに移動した後に、前記第1の記憶ドライブとRAIDグループを構成する他の記憶ドライブからデータを読み出して、前記部分故障による消失データを復元し、復元した前記消失データを前記第1の記憶ドライブに書き込み、
前記第1の記憶ドライブから前記予備記憶ドライブに移動されるデータが、前記部分故障により消失した第1消失データを含む場合、前記他の記憶ドライブからデータを読み出して前記第1消失データを復元し、前記予備記憶ドライブに書き込
む、ことを含む方法。 - 複数の記憶ドライブと、
メモリと、
前記メモリに格納されているプログラムに従って動作するプロセッサと、を含み、
前記プロセッサは、
前記複数の記憶ドライブに含まれる第1の記憶ドライブの部分故障に対して、前記第1の記憶ドライブの論理アドレス空間において所定サイズ以上の1以上の領域を選択し、
前記選択した1以上の領域のデータを、予備記憶ドライブに移動し、
前記選択した1以上の領域のデータを前記予備記憶ドライブに移動した後に、前記第1の記憶ドライブとRAIDグループを構成する他の記憶ドライブからデータを読み出し、前記部分故障による消失データを復元し、復元した前記消失データを前記第1の記憶ドライブに書き込み、
前記第1の記憶ドライブから前記予備記憶ドライブに移動されるデータの、前記第1の記憶ドライブにおける論理アドレスと前記予備記憶ドライブにおける論理アドレスとは同一であり、
前記第1の記憶ドライブから前記予備記憶ドライブに移動されるデータが、前記部分故障により消失した第1消失データを含む場合、前記プロセッサは、前記他の記憶ドライブからデータを読み出して前記第1消失データを復元し、前記予備記憶ドライブに書き込む、計算機システム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2017/004251 WO2018142622A1 (ja) | 2017-02-06 | 2017-02-06 | 計算機 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2018142622A1 JPWO2018142622A1 (ja) | 2019-11-14 |
JP6817340B2 true JP6817340B2 (ja) | 2021-01-20 |
Family
ID=63040575
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018565232A Active JP6817340B2 (ja) | 2017-02-06 | 2017-02-06 | 計算機 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10915401B2 (ja) |
JP (1) | JP6817340B2 (ja) |
WO (1) | WO2018142622A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10915401B2 (en) * | 2017-02-06 | 2021-02-09 | Hitachi, Ltd. | Data saving caused by a partial failure of the memory device |
US20210326320A1 (en) * | 2018-10-15 | 2021-10-21 | Ocient Inc. | Data segment storing in a database system |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2369206B (en) * | 2000-11-18 | 2004-11-03 | Ibm | Method for rebuilding meta-data in a data storage system and a data storage system |
US7698591B2 (en) * | 2005-08-26 | 2010-04-13 | International Business Machines Corporation | Method and apparatus for ensuring data integrity in redundant mass storage systems |
US20070050544A1 (en) * | 2005-09-01 | 2007-03-01 | Dell Products L.P. | System and method for storage rebuild management |
JP2007233903A (ja) * | 2006-03-03 | 2007-09-13 | Hitachi Ltd | 記憶制御装置及び記憶制御装置のデータ回復方法 |
JP2009098996A (ja) * | 2007-10-18 | 2009-05-07 | Hitachi Ltd | ストレージシステム |
US8171377B2 (en) * | 2008-01-31 | 2012-05-01 | International Business Machines Corporation | System to improve memory reliability and associated methods |
US9558059B2 (en) * | 2009-07-30 | 2017-01-31 | International Business Machines Corporation | Detecting data requiring rebuilding in a dispersed storage network |
WO2013038618A1 (ja) | 2011-09-14 | 2013-03-21 | パナソニック株式会社 | 情報記憶媒体ライブラリアレイ装置、情報記録方法及び情報記録プログラム |
JP5586712B2 (ja) * | 2013-01-16 | 2014-09-10 | 株式会社東芝 | ディスクアレイ制御装置およびディスクアレイ装置 |
US10013322B2 (en) | 2013-06-03 | 2018-07-03 | Hitachi, Ltd. | Storage apparatus and storage apparatus control method |
US9411523B2 (en) * | 2013-07-03 | 2016-08-09 | Globalfoundries Inc. | Redundant array of independent disks (RAID) system backup management |
WO2015114744A1 (ja) * | 2014-01-29 | 2015-08-06 | 株式会社日立製作所 | ストレージ装置 |
US10558527B2 (en) * | 2014-12-02 | 2020-02-11 | Pure Storage, Inc. | Rebuilding strategy in memory managed multi-site duplication |
JP6283771B2 (ja) * | 2015-04-28 | 2018-02-21 | 株式会社日立製作所 | ストレージ装置 |
US10915401B2 (en) * | 2017-02-06 | 2021-02-09 | Hitachi, Ltd. | Data saving caused by a partial failure of the memory device |
-
2017
- 2017-02-06 US US16/327,787 patent/US10915401B2/en active Active
- 2017-02-06 JP JP2018565232A patent/JP6817340B2/ja active Active
- 2017-02-06 WO PCT/JP2017/004251 patent/WO2018142622A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2018142622A1 (ja) | 2018-08-09 |
JPWO2018142622A1 (ja) | 2019-11-14 |
US10915401B2 (en) | 2021-02-09 |
US20190220358A1 (en) | 2019-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10073640B1 (en) | Large scale implementation of a plurality of open channel solid state drives | |
US9665286B2 (en) | Storage device | |
JP5437373B2 (ja) | 複数のフラッシュパッケージを有するストレージシステム | |
US9684591B2 (en) | Storage system and storage apparatus | |
US10542089B2 (en) | Large scale implementation of a plurality of open channel solid state drives | |
US10884630B2 (en) | Storage system | |
JP6062060B2 (ja) | ストレージ装置、ストレージシステム、及びストレージ装置制御方法 | |
US20140189203A1 (en) | Storage apparatus and storage control method | |
JP6600698B2 (ja) | 計算機システム | |
US20150254186A1 (en) | Information processing device having a plurality of types of memory caches with different characteristics | |
JP2016506585A (ja) | データストレージのための方法及びシステム | |
US11928053B2 (en) | System garbage collection method and method for garbage collection in solid state disk | |
WO2015162758A1 (ja) | ストレージシステム | |
US20180275894A1 (en) | Storage system | |
US10013322B2 (en) | Storage apparatus and storage apparatus control method | |
WO2017068617A1 (ja) | ストレージシステム | |
JP6817340B2 (ja) | 計算機 | |
JP5768118B2 (ja) | 複数のフラッシュパッケージを有するストレージシステム | |
WO2018002999A1 (ja) | 記憶デバイス及びストレージ装置 | |
US11068180B2 (en) | System including non-volatile memory drive | |
JP6605762B2 (ja) | 記憶ドライブの故障により消失したデータを復元する装置 | |
JP6138318B2 (ja) | 複数のフラッシュパッケージを有するストレージシステム | |
JP5945040B2 (ja) | 複数のフラッシュパッケージを有するストレージシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190626 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190626 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200804 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200930 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201215 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201224 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6817340 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |