JP2017532666A - ハイブリッドオブジェクトストレージデバイスのためのデータの再構成を最適化する方法 - Google Patents

ハイブリッドオブジェクトストレージデバイスのためのデータの再構成を最適化する方法 Download PDF

Info

Publication number
JP2017532666A
JP2017532666A JP2017514530A JP2017514530A JP2017532666A JP 2017532666 A JP2017532666 A JP 2017532666A JP 2017514530 A JP2017514530 A JP 2017514530A JP 2017514530 A JP2017514530 A JP 2017514530A JP 2017532666 A JP2017532666 A JP 2017532666A
Authority
JP
Japan
Prior art keywords
hosd
data
reconfiguration
primary
failed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017514530A
Other languages
English (en)
Inventor
チャオ ジン
チャオ ジン
ウェイヤ シー
ウェイヤ シー
カイ レオン ヨン
カイ レオン ヨン
Original Assignee
エイジェンシー・フォー・サイエンス,テクノロジー・アンド・リサーチ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エイジェンシー・フォー・サイエンス,テクノロジー・アンド・リサーチ filed Critical エイジェンシー・フォー・サイエンス,テクノロジー・アンド・リサーチ
Publication of JP2017532666A publication Critical patent/JP2017532666A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • G06F11/1088Reconstruction on already foreseen single or plurality of spare disks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0619Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0659Command handling arrangements, e.g. command buffers, queues, command scheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/82Solving problems relating to consistency

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

ハイブリッドオブジェクトストレージデバイス(HOSD)のクラスタにおいて、HOSDの1つが故障したときにデータ再構成する方法を開示する。前記方法は、複数のストレージデバイスのうちの故障したものからデータにアクセスするためにサーバから読み出し要求及び書き込み要求の一方を受け付けるステップと、複数のストレージデバイスのうちの1以上の利用可能なものに記憶されたデータの一部から前記複数のストレージデバイスのうちの故障したものに記憶された、要求データを再構成するステップと、を含む。前記方法は、また、再構成されたデータから要求データをサーバへ送り返すステップと、再構成されたデータを複数のストレージデバイスのうちの代替のものへ送信するステップと、を含む。最後に、前記方法は、複数のストレージデバイスの代替のもの及びデータ再構成の完了を示すために再構成リストを更新するステップと、を含む。【選択図】図5

Description

本願は、2014年10月3日に出願されたシンガポール特許出願第10201406331Vの優先権を主張する。
本発明は、ストレージシステムに関し、より具体的には、このようなストレージシステム内のデータ再構成に関する。
データストレージシステムにおいて故障したデータストレージデバイスにおける理想的なデータ再構成は、最高速度でデータ再構成処理を実行することを可能にするために、そのストレージシステムが、クライアント/アプリケーションサーバへの応答を中止するオフライン再構成として生じる。しかし、ディスク故障から回復しているときでさえ、多くのストレージシステムが、途切れのないデータサービスを提供するように要求されるため、このシナリオは、多くの製品環境では現実的ではない。
よって、ディスク故障から回復している際に、途切れのないデータサービスを提供することによって本アプローチの欠点を少なくとも部分的に解消するデータ再構成のための方法及び装置が必要とされる。更に、他の望ましい構成及び特徴は、添付の図面及び本開示のこの背景技術と共に取られる、後続の発明の詳細な説明及び添付の特許請求の範囲から明らかとなるであろう。
本発明の一態様では、複数のストレージデバイスを備えるデータストレージシステムにおけるデータ再構成のための方法を提供する。前記方法は、前記複数のストレージデバイスのうちの故障したものからデータにアクセスするためにサーバから読み出し要求及び書き込み要求の一方を受け付けるステップと、前記複数のストレージデバイスのうちの1以上の利用可能なものに記憶されたデータの一部から前記複数のストレージデバイスのうちの故障したものに記憶された、要求データを再構成するステップと、を含む。前記方法は、更に、前記再構成されたデータから前記要求データを前記サーバへ送り返すステップと、前記再構成されたデータを前記複数のストレージデバイスのうちの代替のものへ送信するステップと、を含む。最後に、前記方法は、前記複数のストレージデバイスの代替のもの及びデータ再構成の完了を示すために再構成リストを更新するステップを含む。
本発明の別の態様では、ハイブリッドオブジェクトストレージデバイス(HOSD)の1つが故障したときに、HOSDのクラスタにおけるデータ再構成のための方法を提供し、HOSDのクラスタは、プライマリHOSDを含む。前記方法は、前記プライマリHOSDの不揮発性メモリで利用可能な故障したHOSDのデータを識別するステップと、前記プライマリHOSDの不揮発性メモリで利用可能な識別データを、代替HOSDにコピーするステップと、前記代替HOSD及びデータ再構成の完了を示すために、前記HOSDプライマリストレージデバイスにおいて再構成リストを更新するステップと、を含む。
本発明の更に別の態様では、ハイブリッドオブジェクトストレージデバイス(HOSD)の1つが故障したときに、HOSDのクラスタにおけるデータ再構成のための方法を提供する。前記方法は、前記プライマリHOSDの不揮発性メモリにおいて利用可能なデータに基づいて、故障したHOSDにおけるデータを演算するステップと、演算されたデータを代替HOSDに書き込むステップと、前記代替HOSD及びデータ再構成の完了を示すために、再構成リストを更新するステップと、を含む。
本発明の更に別の態様では、ハイブリッドオブジェクトストレージデバイス(HOSD)のイレイジャーコード(消失符号)グループ(ECG)クラスタを含むデータストレージシステムを提供する。HOSDの前記ECGクラスタのうちの1つは、プライマリHOSDとして割り当てられる。前記プライマリHOSDは、不揮発性(NV)キャッシュと、再構成リストと、再構成プロセッサと、1以上の通信インターフェースと、を含む。前記NVキャッシュは、前記プライマリHOSDからのオブジェクトデータを記憶するローカルキャッシュを含む。前記再構成リストは、故障したHOSD再構成の状態を示す。前記再構成プロセッサは、前記NVキャッシュ及び前記再構成リストに結合され、故障したHOSDデータを再構成し、前記再構成リストにおいて故障したHOSD再構成の状態を更新する。前記1以上の通信インターフェースは、前記再構成プロセッサと結合され、クライアント/アプリケーションサーバと通信し、HOSDの前記クラスタにおいて他のHOSDと通信する。
添付図は、同様の参照数字が別々の図にわたって同一か又は機能的に類似した要素を参照し、以下の詳細な記載と共に本明細書に組み込まれてその部分をなしており、非限定的な実施例のみによって、様々な実施形態を示して様々な原理及び利点を本発明の実施形態に従って説明するのに役立つ。
図1は、本実施形態に係るデータストレージシステムの図を示し、データストレージシステムは、複数のハイブリッドオブジェクトストレージデバイス(HOSD)を含み、1つのHOSDは、HOSDプライマリストレージデバイスとして割り当てられ、別のHOSDは故障している。 図2は、本実施形態に係るイレイジャーコードグループ(ECG)を含む図1のデータストレージシステムの図を示す。 図3は、本実施形態に係る、図2のECGの図を示し、HOSDは、ECGのHOSDプライマリストレージデバイスにおいてそれらのオブジェクトデータの表現を少なくとも記憶する。 図4は、本実施形態に係る、図3のデータストレージシステムのHOSDプライマリストレージデバイスのブロック図を示す。 図5は、本実施形態に係る、図2のHOSDプライマリストレージデバイスのフローチャートを示す。
図面の要素は、簡素性及び明確性のために示され、必ずしも寸法通りには示されないことを当業者は理解するであろう。
以下の詳細な記載は、本質的に例示的であるに過ぎず、本発明又は本発明の用途及び使用を限定することは意図されない。そのうえ、前述の本発明の背景又は以下の詳細な記載において提示されるいかなる理論によっても制限されるものではない。本発明目的は、途切れのないデータサービスを提供し、ディスク故障から復元するデータ再構成のためのシステム及び方法を提示することである。
図1を参照すると、本実施形態に係るデータストレージシステムの図100が開示される。データストレージシステム102は、複数のハイブリッドオブジェクトストレージデバイス(HOSD)104を含み、1つのHOSDは、HOSDプライマリストレージデバイス106として割り当てられる。データストレージシステム102は、サーバ108(クライアントサーバ又はアプリケーションサーバ)と結合される。本実施形態に係る再構成最適化は、1つのHOSD110が故障したときに生じる。
HOSD故障が認識されると、プライマリHOSD106は、再構成プロセスを開始する。再構成時に故障したHOSD110からのデータにアクセスするためにクライアントサーバ/アプリケーションサーバ108からの読み出し要求又は書き込み要求がある場合、当該データは、他の利用可能なHOSD104から読み出されたデータを演算することによりプライマリHOSD106によって再構成されるであろう。再構成されたデータは、プライマリHOSD106からクライアントサーバ/アプリケーションサーバ108へ送り返す。プライマリHOSD106は、また、代替HOSD112にデータを送信し、データが再構成されたことを示すためにプライマリHOSD106によって維持される再構成リストを更新する。
図2を参照すると、図200は、本実施形態に係る、複数のイレイジャーコード(消失符号)ハイブリッドオブジェクトストレージデバイス(HOSD)グループ(ECG)202を含むデータストレージデバイス102(図1)のアクティブドライブクラスタを示す。各ECG202は、複数の正常なHOSD204と、1つのプライマリHOSD206と、を含む。クライアントサーバ/アプリケーションサーバ108からの要求があるとき、当該要求は、プライマリHOSD206に向けられるであろう。プライマリHOSD206は、他のHOSD204から要求データを検索し、要求データをサーバ108へ戻す。HOSD故障があるとき、プライマリHOSD206は、再構成プロセスを開始するものであり、オブジェクトリストを保持し、再構成プロセスを追跡し、再構成データを演算し、再構成データを代替HOSDへ送信し、再構成リストを維持する。
図3を参照すると、図300は、本実施形態に係る、ECGのHOSDプライマリストレージデバイス206においてそれらのオブジェクトデータの表現を少なくとも記憶するHOSD204を示す。プライマリHOSD206を含む各HOSD204は、ローカルに記憶されたオブジェクトデータの表現を少なくとも記憶するためのローカルキャッシュ302を含む。プライマリHOSD206において不揮発性(Non−Volatile(NV))キャッシュは、データの2つの部分を有する。NVキャッシュの一方の部分は、プライマリHOSD206からオブジェクトデータを記憶するローカルキャッシュ302である。NVキャッシュの他方の部分は、同一のECG内の他のHOSD204のローカルキャッシュ302からのオブジェクトデータの表現を少なくともキャッシュするECGキャッシュ304である。ECGキャッシュ304及びローカルキャッシュ302の双方は、改良されたシステム性能を提供する。また、再構成プロセスは、ECGキャッシュ304のデータに基づいて最適化されうる。
第1の最適化された再構成プロセスによれば、ECGキャッシュ304のデータは、ECGのHOSD204のうちの1つが故障したときに再構成される。プライマリHOSD206は、高優先度のECGキャッシュ304において故障したHOSD204のデータを再構成する。データ再構成は、ECGキャッシュ304において利用可能なデータを代替HOSDに直接コピーすること、又はECGキャッシュ304において利用可能なデータに基づくデータを演算して、演算されたデータを代替HOSDに書き込むことによってなされうる。プライマリHOSD206は、再構成リストを更新しうる。
第2の最適化された再構成プロセスによれば、クライアントサーバ/アプリケーションサーバ108から要求されたデータは、ECGにおいて故障したHOSD204からのデータを含む。故障したHOSDからのデータにアクセスするために、クライアントサーバ/アプリケーションサーバ108から読み出し/書き込み要求が、再構成中に受け付けられた場合、アクセスされたデータは、他の利用可能なHOSD204から読み出されたデータを演算し、演算されたデータをクライアントサーバ/アプリケーションサーバ108へ送り返すことにより、高優先度のオンザフライで再構成されるであろう。その一方で、プライマリHOSD206は、また、データを代替HOSDにも送信し、オブジェクトデータが再構成されていることを示すためにプライマリHOSD206の再構成リストを更新するであろう。
通常の再構成プロセスによれば、プライマリHOSD206は、他の利用可能なHOSD204からデータを読み出し、データを復元するために、読み出したデータを再演算することによってデータを再構成する。完了すると、プライマリHOSD206は、再演算されたデータを代替HOSDに書き込み、再構成リストを更新するであろう。
図4を参照すると、ブロック図400は、本実施形態に係る、データストレージシステム102(図1)のECG202(図2)のHOSDプライマリストレージデバイス206を示す。プライマリHOSD206は、プライマリHOSD206からのオブジェクトデータを記憶するローカルキャッシュ302と、ECG202の他のHOSD204からオブジェクトデータを記憶するECGキャッシュ304と、を含む不揮発性(non−volatile(NV))キャッシュ402を含む。
再構成リスト404は、故障したHOSD再構成の状態を示す。再構成プロセッサ406は、NVキャッシュ402及び再構成リストに結合され、再構成リスト404において、故障したHOSD再構成の状態を更新すると共に故障したHOSDデータを再構成する。第1の通信インターフェース408は、通信のために、再構成プロセッサ406をクライアントサーバ/アプリケーションサーバ108へ結合し、第2の通信インターフェース408は、データをHOSD204に書き込む又はデータをHOSD204から読み出し、ECGキャッシュ304への記憶のためにHOSD204からローカルキャッシュデータを検索するために、再構成プロセッサ406を、ECG202において他のHOSD204に結合する。再構成プロセッサ406は、第2の通信インターフェースを介してHOSD204とも通信し、HOSD204のうちの1つが故障したときに検出し、利用可能なHOSD204を代替HOSD204として割り当てる。
図5を参照すると、フローチャート500は、本実施形態に係る、再構成プロセッサ406の最適化された再構成プロセス502を示す。再構成中に、クライアントサーバ/アプリケーションサーバ108から読み出し要求又は書き込み要求が受け付けられた場合504、再構成プロセッサ406は、読み出し/書き込み要求が故障したデータを要求しているかどうかを判定する。再構成プロセッサ406が、読み出し/書き込み要求が故障したデータを要求していないと判定した場合506、通常の再構成処理は、別の、読み出し/書き込み要求が受け付けられるまで継続する504。
再構成プロセッサ406が、読み出し/書き込み要求が故障したデータを要求していると判定した場合506、要求データの再構成は、要求データが直ぐに再構成されるように優先付けされ508、再構成されると508、クライアントサーバ/アプリケーションサーバ108へ送信される510。このように、クライアントサーバ/アプリケーションサーバ108による途切れのないデータサービスは、ECG202がディスク故障から復元しているときでもプライマリHOSD206によって行われうる。上述したように、要求データは、ECGキャッシュ304のオブジェクトデータから又はHOSD204のデータから再構成されうる。
要求データがクライアントサーバ/アプリケーションサーバ108へ送信された後510、代替ストレージデバイスへ送信され512、代替ストレージデバイスは、再構成プロセッサ406により代替ストレージデバイスとして割り当てられたHOSD204のうちの1つである。再構成プロセッサ406は、その後、HOSD204のうちの代替のものを示すために再構成リスト404を更新する514。通常再構成処理は、別の読み出し/書き込み要求が受け付けられる504又は処理が完了するまで継続する。全ての再構成が完了したとき、再構成プロセッサ406は、データ再構成の完了を示すために再構成リスト404を更新する。
よって、本実施形態は、ディスク故障からの復元中でも最適化された途切れのないデータサービスを提供することができることが理解されうる。また、ECG内のプライマリハイブリッドオブジェクトストレージデバイス(HOSD)のイレイジャーコードグループ(ECG)、又はECGの1以上の他のHOSDから故障したディスクの再構成のための有利な方法を提供する。例示的な実施形態が本発明の前述された詳細な説明で示されてきたが、膨大な数のバリエーションが存在することが理解されるべきである。
更に当然のことながら、これらの例示的な実施形態は、例であるに過ぎず、いかなる意味でも本発明の範囲、適用性、動作、又は構成を限定することは意図されない。もしろ、前述の詳細な記載は、本発明の例示的な実施形態を実装するための便利なロードマップを当業者に提供するであろう、理解すべきは、添付の特許請求の範囲に提示される本発明の範囲から逸脱することなく、例示的な実施形態に記載される要素の機能及び配置ならびに動作の方法における様々な変更がなされてもよいことである。

Claims (16)

  1. 複数のストレージデバイスを備えるデータストレージシステムにおけるデータ再構成のための方法であって、
    前記複数のストレージデバイスのうちの故障したものからデータにアクセスするためにサーバから読み出し要求及び書き込み要求の一方を受け付けるステップと、
    前記複数のストレージデバイスのうちの1以上の利用可能なものに記憶されたデータの一部から前記複数のストレージデバイスのうちの故障したものに記憶された要求データを再構成するステップと、
    前記再構成されたデータから前記要求データを前記サーバへ送り返すステップと、
    前記再構成されたデータを前記複数のストレージデバイスのうちの代替のものへ送信するステップと、
    前記複数のストレージデバイスの代替のもの及びデータ再構成の完了を示すために再構成リストを更新するステップと、
    を備える方法。
  2. 前記再構成するステップは、
    前記複数のストレージデバイスのうちの1以上の利用可能なものに記憶されたデータの一部から、前記複数のストレージデバイスのうちの故障したものに記憶されたデータを要求するステップと、
    前記複数のストレージデバイスのうちの1以上の利用可能なものに記憶されたデータの一部から、前記複数のストレージデバイスのうちの故障したものに記憶された前記要求データを再構成するステップと、
    を含む請求項1に記載の方法。
  3. 前記複数のストレージデバイスの1以上は、ハイブリッドオブジェクトストレージデバイス(HOSD)を含み、前記複数のストレージデバイスのHOSDは、HOSDプライマリストレージデバイスとして割り当てられ、前記受け付けるステップ、前記要求するステップ、前記再構成するステップ、第1及び第2の前記送信するステップ及び前記更新するステップは、前記HOSDプライマリストレージデバイス内で全て行われる、請求項2に記載の方法。
  4. 前記複数のストレージデバイスの1以上は、ハイブリッドオブジェクトストレージデバイス(HOSD)を含み、前記複数のストレージデバイスのHOSDは、HOSDプライマリストレージデバイスとして割り当てられ、前記受け付けるステップ、前記再構成するステップ、第1及び第2の前記送信するステップ及び前記更新するステップは、前記HOSDプライマリストレージデバイス内で全て行われる、請求項1に記載の方法。
  5. 前記HOSDプライマリストレージデバイスは、不揮発性メモリを含み、前記HOSDプライマリストレージデバイスは、
    前記HOSDプライマリストレージデバイスの前記不揮発性メモリで利用可能な故障したHOSDにおいてデータを認識するステップと、
    前記HOSDプライマリストレージデバイスの前記不揮発性メモリで利用可能な識別データを、HOSD代替ストレージデバイスとして割り当てられた前記複数のストレージデバイスのうちの1つにコピーするステップと、を更に行い、
    前記再構成リストを更新するステップは、前記HOSD代替ストレージデバイス及びデータ再構成の完了を示すために、前記HOSDプライマリストレージデバイスにおいて前記再構成リストを更新するステップを含む、
    請求項4に記載の方法。
  6. 前記受け付けるステップは、前記複数のストレージデバイスのうちの故障したものからデータにアクセスするために、クライアントサーバからの前記読み出し要求及び前記書き込み要求の一方を受け付けるステップを含む、請求項1に記載の方法。
  7. 前記受け付けるステップは、前記複数のストレージデバイスのうちの故障したものからデータにアクセスするために、アプリケーションサーバからの前記読み出し要求及び前記書き込み要求の一方を受け付けるステップを含む、請求項1に記載の方法。
  8. ハイブリッドオブジェクトストレージデバイス(HOSD)の1つが故障したときに、前記HOSDのクラスタにおけるデータ再構成のための方法であって、前記HOSDの前記クラスタは、プライマリHOSDを含み、前記方法は、
    前記プライマリHOSDの不揮発性メモリで利用可能な故障したHOSDのデータを識別するステップと、
    前記プライマリHOSDの不揮発性メモリで利用可能な識別データを代替HOSDにコピーするステップと、
    前記代替HOSD及びデータ再構成の完了を示すために、前記HOSDプライマリストレージデバイスにおいて再構成リストを更新するステップと、
    を備える方法。
  9. ハイブリッドオブジェクトストレージデバイス(HOSD)の1つが故障したときに、前記HOSDのクラスタにおけるデータ再構成のための方法であって、前記方法は、
    プライマリHOSDの不揮発性メモリにおいて利用可能なデータに基づいて、故障したHOSDにおけるデータを演算するステップと、
    演算されたデータを代替HOSDに書き込むステップと、
    前記代替HOSD及びデータ再構成の完了を示すために、再構成リストを更新するステップと、
    を備える方法。
  10. ハイブリッドオブジェクトストレージデバイス(HOSD)のイレイジャーコードグループ(ECG)クラスタを備えるデータストレージシステムであって、前記HOSDの前記ECGクラスタのうちの1つは、プライマリHOSDとして割り当てられ、前記プライマリHOSDは、
    前記プライマリHOSDからのオブジェクトデータを記憶するローカルキャッシュを含む不揮発性(NV)キャッシュと、
    故障したHOSD再構成の状態を示す再構成リストと、
    前記NVキャッシュ及び前記再構成リストに結合された再構成プロセッサであって、故障したHOSDデータを再構成し、前記再構成リストにおいて故障したHOSD再構成の状態を更新する、再構成プロセッサと、
    前記再構成プロセッサと結合され、クライアント/アプリケーションサーバと通信し、前記HOSDのクラスタにおいて他のHOSDと通信する1以上の通信インターフェースと、
    を備えるデータストレージシステム。
  11. 前記プライマリHOSDの前記再構成プロセッサは、他の利用可能なHOSDから故障したHOSDデータの1以上の部分を要求するための再構成プロセッサを備え、前記再構成プロセッサは、再構成プロセッサ要求に応じて、前記他の利用可能なHOSDから受け付けた故障したHOSDの1以上の部分から故障したHOSDデータの少なくとも一部を再構成する、請求項10に記載のデータストレージシステム。
  12. 前記プライマリHOSDの前記再構成プロセッサは、代替HOSDとして前記HOSDの前記ECGクラスタのうちの利用可能な1つを更に識別し、前記再構成プロセッサは、故障したHOSDの再構成部分を代替HOSDにコピーする、請求項11に記載のデータストレージシステム。
  13. 前記プライマリHOSDの前記再構成リストは、前記代替HOSDを更に示す、請求項12に記載のデータストレージシステム。
  14. 前記プライマリHOSDの前記NVキャッシュは、前記HOSDの前記ECGクラスタ内の他のHOSDからのオブジェクトデータをキャッシュするためのECGキャッシュを更に備え、前記プライマリHOSDの再構成プロセッサは、前記ECGキャッシュにキャッシュされたオブジェクトデータである故障したHOSDデータの1以上の部分を識別するための再構成プロセッサを備え、前記再構成プロセッサは、ECGデータにキャッシュされたオブジェクトデータに識別された故障したHOSDデータの1以上の部分から、故障したHOSDデータの少なくとも一部を再構成する、請求項10に記載のデータストレージシステム。
  15. 前記プライマリHOSDの前記再構成プロセッサは、代替HOSDとしてHOSDのECGクラスタのうちの利用可能なものを更に識別し、前記再構成プロセッサは、故障したHOSDデータの再構成部分を代替HOSDにコピーする、請求項14に記載のデータストレージシステム。
  16. 前記プライマリHOSDの前記再構成リストは、前記代替HOSDを更に示す、請求項15に記載のデータストレージシステム。

JP2017514530A 2014-10-03 2015-09-30 ハイブリッドオブジェクトストレージデバイスのためのデータの再構成を最適化する方法 Pending JP2017532666A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SG10201406331V 2014-10-03
SG10201406331V 2014-10-03
PCT/SG2015/050355 WO2016053189A1 (en) 2014-10-03 2015-09-30 Method for optimizing reconstruction of data for a hybrid object storage device

Publications (1)

Publication Number Publication Date
JP2017532666A true JP2017532666A (ja) 2017-11-02

Family

ID=55631066

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017514530A Pending JP2017532666A (ja) 2014-10-03 2015-09-30 ハイブリッドオブジェクトストレージデバイスのためのデータの再構成を最適化する方法

Country Status (6)

Country Link
US (1) US20180217906A1 (ja)
EP (1) EP3201778A4 (ja)
JP (1) JP2017532666A (ja)
CN (1) CN106796491A (ja)
SG (1) SG11201701454TA (ja)
WO (1) WO2016053189A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220080329A (ko) * 2020-12-07 2022-06-14 인하대학교 산학협력단 Put 오브젝트 처리속도 상향을 위한 하이브리드 오브젝트 스토리지 시스템 및 그 동작 방법

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10437691B1 (en) * 2017-03-29 2019-10-08 Veritas Technologies Llc Systems and methods for caching in an erasure-coded system
CN110515771A (zh) * 2019-08-23 2019-11-29 北京浪潮数据技术有限公司 一种对象存储设备设置方法、系统、设备及计算机介质

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0731582B2 (ja) * 1990-06-21 1995-04-10 インターナショナル・ビジネス・マシーンズ・コーポレイション パリティ保護データを回復するための方法および装置
US5208813A (en) * 1990-10-23 1993-05-04 Array Technology Corporation On-line reconstruction of a failed redundant array system
US5274799A (en) * 1991-01-04 1993-12-28 Array Technology Corporation Storage device array architecture with copyback cache
CN1281560A (zh) * 1997-10-08 2001-01-24 西加特技术有限责任公司 混合数据存储和重建系统以及用于数据存储装置的方法
US7308599B2 (en) * 2003-06-09 2007-12-11 Hewlett-Packard Development Company, L.P. Method and apparatus for data reconstruction after failure of a storage device in a storage array
JP2007087039A (ja) * 2005-09-21 2007-04-05 Hitachi Ltd ディスクアレイシステム及びその制御方法
US20080126839A1 (en) * 2006-09-19 2008-05-29 Satish Sangapu Optimized reconstruction and copyback methodology for a failed drive in the presence of a global hot spare disc
JP2010009442A (ja) * 2008-06-30 2010-01-14 Fujitsu Ltd ディスクアレイシステム、ディスク制御装置及びその再構築処理方法
JP5397148B2 (ja) * 2009-10-16 2014-01-22 富士通株式会社 記憶装置、制御装置および記憶装置の制御方法
US8132044B1 (en) * 2010-02-05 2012-03-06 Symantec Corporation Concurrent and incremental repair of a failed component in an object based storage system for high availability
US8726070B2 (en) * 2010-09-27 2014-05-13 Dell Products L.P. System and method for information handling system redundant storage rebuild
US8745329B2 (en) * 2011-01-20 2014-06-03 Google Inc. Storing data across a plurality of storage nodes
US9043530B1 (en) * 2012-04-09 2015-05-26 Netapp, Inc. Data storage within hybrid storage aggregate
US20150089328A1 (en) * 2013-09-23 2015-03-26 Futurewei Technologies, Inc. Flex Erasure Coding of Controllers of Primary Hard Disk Drives Controller
EP3180690A4 (en) * 2014-10-03 2018-10-03 Agency for Science, Technology and Research Distributed active hybrid storage system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220080329A (ko) * 2020-12-07 2022-06-14 인하대학교 산학협력단 Put 오브젝트 처리속도 상향을 위한 하이브리드 오브젝트 스토리지 시스템 및 그 동작 방법
KR102531765B1 (ko) 2020-12-07 2023-05-11 인하대학교 산학협력단 Put 오브젝트 처리속도 상향을 위한 하이브리드 오브젝트 스토리지 시스템 및 그 동작 방법

Also Published As

Publication number Publication date
EP3201778A4 (en) 2018-04-25
SG11201701454TA (en) 2017-04-27
CN106796491A (zh) 2017-05-31
WO2016053189A1 (en) 2016-04-07
EP3201778A1 (en) 2017-08-09
US20180217906A1 (en) 2018-08-02

Similar Documents

Publication Publication Date Title
US10795789B2 (en) Efficient recovery of erasure coded data
US11068350B2 (en) Reconciliation in sync replication
US9411685B2 (en) Parity chunk operating method and data server apparatus for supporting the same in distributed raid system
CN106776130B (zh) 一种日志恢复方法、存储装置和存储节点
JP5084551B2 (ja) 重複排除技術を用いたデータバックアップ方法、記憶制御通信装置及びプログラム
JP6264666B2 (ja) データ格納方法、データストレージ装置、及びストレージデバイス
US20200012442A1 (en) Method for accessing distributed storage system, related apparatus, and related system
JP6492123B2 (ja) 分散キャッシングおよびキャッシュ分析
US10289506B2 (en) Storage device health status synchronization
JP2017531250A (ja) 粒状同期/半同期アーキテクチャ
TWI510932B (zh) 塊儲存閘道模組、儲存中介系統、雲端儲存系統、提供對塊儲存的存取的方法、儲存中介方法與內容遞送裝置
US20140298078A1 (en) SYNCHRONOUS MIRRORING OF NVLog TO MULTIPLE DESTINATIONS (ARCHITECTURE LEVEL)
CN104461777B (zh) 一种存储阵列中数据镜像方法及存储阵列
EP3745269A1 (en) Hierarchical fault tolerance in system storage
CN105052111A (zh) 跨群集边界的服务迁移
CN105278882A (zh) 一种分布式文件系统的磁盘管理方法
JP2017532666A (ja) ハイブリッドオブジェクトストレージデバイスのためのデータの再構成を最適化する方法
US9891992B2 (en) Information processing apparatus, information processing method, storage system and non-transitory computer readable storage media
US20050015554A1 (en) Self healing memory
CN105893176B (zh) 一种网络存储系统的管理方法和装置
US10067841B2 (en) Facilitating n-way high availability storage services
US10423507B1 (en) Repairing a site cache in a distributed file system
CN103685359B (zh) 数据处理方法及装置
JP2017208113A (ja) データ格納方法、データストレージ装置、及びストレージデバイス
KR101793963B1 (ko) 대용량 메모리 기반 데이터 처리를 위한 원격 메모리 데이터 관리 방법 및 시스템