JP2011034546A - Erasureコード化されたデータストレージ容量及びパワーマネージメント方法及びシステム - Google Patents

Erasureコード化されたデータストレージ容量及びパワーマネージメント方法及びシステム Download PDF

Info

Publication number
JP2011034546A
JP2011034546A JP2009287351A JP2009287351A JP2011034546A JP 2011034546 A JP2011034546 A JP 2011034546A JP 2009287351 A JP2009287351 A JP 2009287351A JP 2009287351 A JP2009287351 A JP 2009287351A JP 2011034546 A JP2011034546 A JP 2011034546A
Authority
JP
Japan
Prior art keywords
storage device
data chunks
device set
storage
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009287351A
Other languages
English (en)
Inventor
Ross E Zwisler
ロス・イー.ズウィスラー
Brian Mckean
ブライアン・マッキーン
Kevin Kidney
ケビン・キドニー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LSI Corp
Original Assignee
LSI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LSI Corp filed Critical LSI Corp
Publication of JP2011034546A publication Critical patent/JP2011034546A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/0647Migration mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0608Saving storage space on storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0632Configuration or reconfiguration of storage systems by initialisation or re-initialisation of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/064Management of blocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1008Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0662Virtualisation aspects
    • G06F3/0665Virtualisation aspects at area level, e.g. provisioning of virtual or logical volumes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)
  • Power Sources (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】マスストレージシステムにおける、柔軟な容量管理と効率的なパワーマネジメント機能の提供。
【解決手段】データセットが、シン・プロビジョニングされるとともにErasureコード化された複数のデータチャンクに割り振られる。ストレージデバイスは、第1、第2のストレージデバイスセットに分けられ、第1のストレージデバイスセットはパワーアップ、第2のそれはパワーダウンされている。第1のストレージデバイスセットの各ストレージデバイスに等しくロードするようデータチャンクが分布している。第1のストレージデバイスセットに再割り当てするために、第2のストレージデバイスセットからのストレージデバイスがパワーアップされる場合に、複数のデータチャンクが第1のストレージデバイスセット及び再割り当てされたストレージデバイスに均等に分布されるまで、再割り当てされたストレージデバイスにデータチャンクが移行される。
【選択図】図1

Description

本発明は、総じて、コンピュータデータストレージの分野に関するものであり、特に、マスデータストレージシステムの容量及びパワー用法を管理するためのシステム及び方法に関するものである。
データセンタは、電子データの格納及び検索のためにディスクドライブを用いる。マスデータストレージシステムの容量を増大させるため及びデータストレージシステムによって必要とされるディスクドライブの数を管理するための、様々な方法がある。
方法は、データのセットを複数のデータチャンクに割り振ることであって、複数のデータチャンクはシン・プロビジョニングされるとともにErasureコード化(イレイジャコード化)されている、ことと、複数のストレージデバイスを第1のストレージデバイスセットと第2のストレージデバイスセットとに分けることであって、第1のストレージデバイスセットはパワーアップされており、第2のストレージデバイスセットはパワーダウンされている、ことと、第1のストレージデバイスセットの各ストレージデバイスに等しくロードするために、複数のデータチャンクを第1のストレージデバイスセットに分布させることと、第2のストレージデバイスセットからのストレージデバイスを第1のストレージデバイスセットに再割り当てするために、第2のストレージデバイスセットからのストレージデバイスをパワーアップさせることと、複数のデータチャンクが第1のストレージデバイスセット及び再割り当てされたストレージデバイスに均等に分布されるまで、再割り当てされたストレージデバイスに複数のデータチャンクのデータチャンクを移行させることと、を非限定的に含む。
システムは、データセットを複数のデータチャンクに割り振るための手段であって、複数のデータチャンクは、シン・プロビジョニングされるとともにErasureコード化されている、手段と、複数のストレージデバイスを第1のストレージデバイスセットと第2のストレージデバイスセットとに分けるための手段であって、第1のストレージデバイスセットはパワーアップされており、第2のストレージデバイスセットはパワーダウンされている、手段と、第1のストレージデバイスセットの各ストレージデバイスに等しくロードするために、複数のデータチャンクを第1のストレージデバイスセットに分布させるための手段と、第2のストレージデバイスセットからのストレージデバイスを第1のストレージデバイスセットに再割り当てするために、第2のストレージデバイスセットからのストレージデバイスをパワーアップさせるための手段と、複数のデータチャンクが第1のストレージデバイスセット及び再割り当てされたストレージデバイスに均等に分布されるまで、再割り当てされたストレージデバイスに複数のデータチャンクのデータチャンクを移行させるための手段と、を非限定的に含む。
マスストレージシステムは、データセットを複数のデータチャンクに割り振るためのプロセッサであって、複数のデータチャンクは、シン・プロビジョニングされるとともにErasureコード化されている、プロセッサと、複数のデータチャンクを格納するために通信可能な状態でプロセッサに接続された複数のストレージデバイスであって、第1のストレージデバイスセットと第2のストレージデバイスセットとに分けられ、第1のストレージデバイスセットはパワーアップされており、第2のストレージデバイスセットはパワーダウンされている、複数のストレージデバイスと、通信可能な状態で複数のストレージデバイスに接続され、複数のストレージデバイスの動作を制御するように構成されたコントローラと、を非限定的に含み、コントローラは、第1のストレージデバイスセットの各ストレージデバイスに等しくロードするために、複数のデータチャンクを第1のストレージデバイスセットに分布させ、第2のストレージデバイスセットからのストレージデバイスを第1のストレージデバイスセットに再割り当てするために、第2のストレージデバイスセットからのストレージデバイスをパワーアップさせ、複数のデータチャンクが第1のストレージデバイスセット及び再割り当てされたストレージデバイスに均等に分布されるまで、再割り当てされたストレージデバイスに複数のデータチャンクのデータチャンクを移行させる。
以上の概要及び以下の詳細な説明は、ともに、例示的で説明的なものにすぎず、必ずしも本開示に対して制約的ではない。明細書に組み込まれ、その一部を構成する添付の図面は、本開示の内容を示している。説明及び図面は、あわせて、本開示の原理を説明する働きをする。
当業者ならば、添付の図面を参照にして、本開示の数々の利点をより良く理解することができる。
本開示の実施形態にしたがったマスストレージデータ容量の拡大方法を示した流れ図である。 本発明の実施形態にしたがったマスストレージデータ容量のマネージメントを進める複数のストレージデバイスを示したブロック図である。 本発明の実施形態にしたがったマスストレージデータ容量のマネージメントを進める複数のストレージデバイスを示したブロック図である。 本発明の実施形態にしたがったマスストレージデータ容量のマネージメントを進める複数のストレージデバイスを示したブロック図である。 本発明の実施形態にしたがったマスストレージデータ容量の拡大を実施することができるマスストレージシステムを示したブロック図である。
次に、添付の図面に示された開示内容について詳細に言及する。
図1を参照すると、本開示の代表的実施形態にしたがった、マスデータストレージシステムにおいてデータを処理するための方法が示されている。
本開示のこの実施形態では、方法100は、データセットを複数のデータチャンクに割り振るステップ110であって、複数のデータチャンクは、シン・プロビジョニングされるとともにErasureコード化されている、ステップ110を含むことができる。データセットのエンコードには、例えばRAID(独立ディスク冗長アレイ)5又はRAID6のErasureコード化スキームを用いることができる。
代表的実施形態では、方法100は、更に、複数のストレージデバイスを第1のストレージデバイスセットと第2のストレージデバイスセットとに分けるステップ120であって、第1のストレージデバイスセットはパワーアップされており、第2のストレージデバイスセットはパワーダウンされている、ステップ120を含むことができる。例えば、ストレージデバイスは、ハードディスクドライブであってよい。第1のストレージデバイスセットは、データセットの格納に必要とされる最小数のストレージデバイスを含有することができる。第1のストレージデバイスセットは、アクティブセットとして知られてよい。ストレージデバイスの最小数は、アクティブセットのデータ容量、マスデータストレージシステムに格納されるデータの量、及びデータセットのエンコードに使用されるErasureコード化スキームに依存してよい。アクティブセットのストレージデバイスは、常にパワーアップされていてよい。アクティブセットのストレージデバイスに格納されるデータは、いかなるパワーアップ遅延も伴わずにアクセスすることが可能である。マスデータストレージシステムに格納されるデータは、全て、アクティブセットのストレージデバイスに格納されてよい。
更に、第2のストレージデバイスセットは、パッシブセットとして知られてよい。パッシブセットのストレージデバイスは、パワーダウンされていてよく、そうして、エネルギを節約することができる。パッシブセットのストレージデバイスは、いかなるデータも格納しなくてよい、又はアクティブセットのストレージデバイス上において入手不可能ないかなるデータも格納しなくてよい。
代表的実施形態では、方法100は、更に、第1のストレージデバイスセットの各ストレージデバイスに等しくロードするために、複数のデータチャンクを第1のストレージデバイスセットに分布させる、ステップ130を含むことができる。例えば、複数のデータチャンクは、引用によって組み込まれる"CRUSH: Controlled, Scalable, Decentralized Placement of Replicated Data," Sage Weil, Scott A. Brandt, Ethan L. Miller, Carlos Maltzahn, Proceedings of SC '06, November 2006に記載されるようなCRUSH(Controlled, Scalable, Decentralized Placement of Replicated Data, 拡張性ハッシング下における制御式の複製)アルゴリズムにしたがって分布されてよい。
代表的実施形態では、方法100は、更に、第2のストレージデバイスセットからのストレージデバイスを第1のストレージデバイスセットに再割り当てするために、第2のストレージデバイスセットからのストレージデバイスをパワーアップさせる、ステップ140を含むことができる。ストレージデバイスのパワーアップは、ストレージデバイスをパッシブセットからアクティブセットに再割り当てすることができる。第2のストレージデバイスセットからのストレージデバイスを第1のストレージデバイスセットに再割り当てするために、第2のストレージデバイスセットからのストレージデバイスをパワーアップさせる、ステップ140は、アクティブセットにおいて更なる容量が必要とされているかどうかを決定するために、アクティブセットのストレージデバイスの容量を監視することを必要とすることができる。パッシブセットからアクティブセットに再割り当てされるものとして、1つのストレージデバイスのみが開示されているが、複数のストレージデバイスが再割り当てされることも、更に考えられる。
代表的実施形態では、方法100は、更に、複数のデータチャンクが第1のストレージデバイスセット及び再割り当てされたストレージデバイスに均等に分布されるまで、再割り当てされたストレージデバイスに複数のデータチャンクのデータチャンクを移行させる、ステップ150を含むことができる。データチャンクの移行は、再割り当てされたストレージデバイスが完全にアクティブになって初めて生じることができる。
図2A〜2Cを参照すると、本開示の実施形態にしたがって複数のストレージデバイス230が方法100を実施する様子が示されている。図2A〜2Cでは、複数のデータストライプ(250、260、270、280)は、2+1RAID5のErasureコード化スキームを使用してエンコードされる。このエンコーディングスキームは、アクティブセット210において最低3つのストレージデバイス200〜202を必要とする。各2+1RAID5データストライプ(250、260、270、280)は、3つのデータチャンク(例えば250a、250b、及び250p)に割り振られている。図2Aを参照すると、各データストライプ250、260、270は、3つのデータチャンクに割り振られ、アクティブセット210の間で分布されている。パッシブセット220は、ハードディスクドライブ203〜205からなる。
図2Bを参照すると、アクティブセット210において更なるストレージ容量が必要とされることが決定されている。ハードディスクドライブ203がパワーアップされ、そうして、パッシブセット220からアクティブセット210に再割り当てされる。図2Cを参照すると、ハードディスクドライブ203は、完全にアクティブなアクティブセット210のハードディスクドライブになっている。ハードディスクドライブ200〜202から、様々なデータチャンクがハードディスクドライブ203に移行される。図2A〜2Cに示されるように、ハードディスクドライブ203は、パッシブセット220からアクティブセット210に再割り当てされてよい。複数のストレージデバイス230のErasureコード化スキームは、再割り当てプロセス全体を通して一貫性を維持することができる。パッシブセット220からアクティブセット210へのハードディスクドライブ203の再割り当ては、複数のストレージデバイス230に対してデータをストライピングしなおすことを必要としなくてすむ。
図3を参照すると、マスストレージシステム300は、本開示の実施形態にしたがって方法100を実施することができる。プロセッサ310は、データセットを複数のデータチャンクに割り振ることができる。複数のストレージデバイス320(例えば図2A〜2Cの複数のストレージデバイス230)は、通信可能な状態でプロセッサ310に接続することができる。複数のストレージデバイス320は、複数のデータチャンクを格納することができる。コントローラ330は、通信可能な状態で複数のストレージデバイス320に接続することができる。コントローラ330は、複数のストレージデバイス320の動作を制御するように構成することができる。
コントローラ330は、複数のデータチャンクを複数のストレージデバイス320にロードするように構成することができる。複数のデータチャンクは、アクティブなストレージデバイス320のセットに等しくロードすることができる。コントローラ330は、パッシブなストレージデバイス320のセットからのストレージデバイスをパワーアップさせることができる。コントローラ330は、パッシブセットからのストレージデバイスをアクティブなストレージデバイスセットに再割り当てすることができる。コントローラ330は、複数のデータチャンクがアクティブなストレージデバイスセット及び再割り当てされたストレージデバイスに均等に分布されるまで、複数のデータチャンクからのデータチャンクを移行させることができる。
更に、データは、アクティブセットのストレージデバイスから同アクティブセットの他のストレージデバイスに逆方向に移行することもできると考えられる。そして、アクティブセットの他のストレージデバイス内にデータを複製されていないデータを持たないようなアクティブセットのストレージデバイスを、パワーダウンさせることができる。パワーダウンされたストレージデバイスは、パッシブなストレージデバイスセットに再割り当てされてよい。再び図2A〜2Cを参照すると、これらの図は、上述された場合と逆の順序で見ることもできる。図2Cを参照すると、ハードディスクドライブ203の容量は、アクティブセット210においてもう必要とされていないことが決定されている。図2Bを参照すると、ハードディスクドライブ203内の全てのデータが、アクティブセット210のハードディスクドライブ200〜202に移行されている。図2Bに示されるように、ハードディスクドライブ203内のデータは、全て消去することができる。しかしながら、この消去は、必ずしも必要でなく、必ずしも好ましいとは限らない。ハードディスクドライブ203内の全てのデータが、アクティブセット210のハードディスクドライブ200〜202に移行されたら、ハードディスクドライブ203は、パワーダウンされてよい。図2Aを参照すると、ハードディスクドライブ203は、アクティブセット210からパッシブセット220に再割り当てされてよい。
本開示では、開示された方法は、デバイスによって読み取り可能な命令セット又はソフトウェアとして実装することができる。更に、開示された方法におけるステップ間の具体的順序又は序列は、代表的アプローチの例にすぎないことが理解される。方法における段階間の具体的順序又は序列は、開示された内容の範囲内において、設計上の好みに基づいて並べ替え可能であることが理解される。添付の方法クレームは、各ステップの要素を1つの順序例で提示したものであり、提示された具体的な順序又は序列に必ずしも限定されることを意図していない。
以上の詳細な説明は、ブロック図、流れ図、及び/又は実施例の使用を通じてデバイス及び/又はプロセスの様々な実施形態を示してきた。このようなブロック図、流れ図、及び/又は実施例が、1つ又は2つ以上の機能及び/又は動作を内含する限り、当業者ならば、このようなブロック図、流れ図、又は実施例における各機能及び/又は動作が、個別に及び/又は集合的に、広範囲のハードウェア、ソフトウェア、ファームウェア、又は仮想的なそれらのあらゆる組み合わせによって実装可能であることがわかる。1つの実施形態では、本明細書で説明された内容の幾つかの部分を、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、デジタルシグナルプロセッサ(DSP)、又はその他の集積形式で実装することができる。しかしながら、当業者ならば、本明細書で開示される実施形態の幾つかの態様が、その全部又は一部を、1つ又は2つ以上のコンピュータで実行される1つ又は2つ以上のコンピュータプログラムとして(例えば2つ又は2つ以上のコンピュータシステムで実行される1つ又は2つ以上のプログラムとして)、1つ又は2つ以上のプロセッサで実行される1つ又は2つ以上のプログラムとして(例えば1つ又は2つ以上のマイクロプロセッサで実行される1つ又は2つ以上のプログラムとして)、ファームウェアとして、又は仮想的なそれらのあらゆる組み合わせとして集積回路に等しく実装可能であること、そしてソフトウェア用及びファームウェア用に回路系を設計すること及び/又はコードを記述することが、この開示に照らせば十分に当業者の技能の範囲内であることがわかる。また、当業者ならば、本明細書で説明される内容のメカニズムが、様々な形態でプログラム製品として配布可能であること、そして本明細書で説明される内容の例示的実施形態が、配布を実際に行うために使用されるシグナルベアリング媒体の具体的な種類にかかわらず適用されることがわかる。シグナルベアリング媒体の例は、フロッピィディスク、ハードディスクドライブ、CD−ROM、デジタルテープ、及びコンピュータメモリなどの追記型の媒体、並びにTDM又はIPをベースにした通信リンク(例えばパケットリンク)を使用したデジタル通信リンク及びアナログ通信リンクなどの伝送タイプの媒体を非限定的に含む。
以上の説明により、本開示及びそれに付随する多くの利点が理解されると考えられ、形態、構成、及び配置に対し、開示された内容から逸脱することなく又はその重要な利点のいずれも犠牲にすることなくて様々な変更が可能であることが明らかである。説明された形態は、説明的なものにすぎず、以下のクレームの意図は、このような変更を包含して含むことにある。

Claims (20)

  1. データセットを、シン・プロビジョニングされているとともにErasureコード化されている複数のデータチャンクに割り振ることと、
    複数のストレージデバイスを、パワーアップされている第1のストレージデバイスセットとパワーダウンされている第2のストレージデバイスセットとに分けることと、
    前記第1のストレージデバイスセットの各ストレージデバイスに等しくロードするために、前記複数のデータチャンクを前記第1のストレージデバイスセットに分布させることと、
    前記第2のストレージデバイスセットからのストレージデバイスを前記第1のストレージデバイスセットに再割り当てするために、前記第2のストレージデバイスセットからの前記ストレージデバイスをパワーアップさせることと、
    前記複数のデータチャンクが前記第1のストレージデバイスセット及び再割り当てされたストレージデバイスに均等に分布されるまで、前記複数のデータチャンクのデータチャンクを前記再割り当てされたストレージデバイスに移行させることと、
    を備える方法。
  2. 請求項1に記載の方法であって、
    前記複数のデータチャンクは、RAID(独立ディスク冗長アレイ)5又はRAID6のエンコーディングを用いてエンコードされる、方法。
  3. 請求項1に記載の方法であって、
    前記第1のストレージデバイスセットの各ストレージデバイスに等しくロードするために、前記複数のデータチャンクを前記第1のストレージデバイスセットに分布させることは、更に、前記第1のストレージデバイスセットの各ストレージデバイスに等しくロードするために、CRUSH(拡張性ハッシング下における制御式の複製)アルゴリズムを用いて前記複数のデータチャンクを前記第1のストレージデバイスセットに分布させることを含む、方法。
  4. 請求項1に記載の方法であって、
    前記第1のストレージデバイスセットは、最小数のストレージデバイスを含む、方法。
  5. 請求項4に記載の方法であって、
    前記ストレージデバイスの最小数は、前記複数のデータチャンクをエンコードするために用いられるErasureコード化スキームの要件と、前記第1のストレージデバイスセットに格納されるデータの量とによって決定される、方法。
  6. 請求項1に記載の方法であって、
    前記第2のストレージデバイスセットからのストレージデバイスを前記第1のストレージデバイスセットに再割り当てするために、前記第2のストレージデバイスセットからの前記ストレージデバイスをパワーアップさせることは、更に、更なる容量が必要かどうかを決定するために、前記第1のストレージデバイスデバイスの容量を監視することを含む、方法。
  7. 請求項1に記載の方法であって、
    前記複数のデータチャンクのデータチャンクを移行させることは、前記第2のストレージデバイスセットからの前記ストレージデバイスが完全にアクティブになると生じる、方法。
  8. データセットを、シン・プロビジョニングされているとともにErasureコード化されている複数のデータチャンクに割り振るための手段と、
    複数のストレージデバイスを、パワーアップされている第1のストレージデバイスセットとパワーダウンされている第2のストレージデバイスセットとに分けるための手段と、
    前記第1のストレージデバイスセットの各ストレージデバイスに等しくロードするために、前記複数のデータチャンクを前記第1のストレージデバイスセットに分布させるための手段と、
    前記第2のストレージデバイスセットからのストレージデバイスを前記第1のストレージデバイスセットに再割り当てするために、前記第2のストレージデバイスセットからの前記ストレージデバイスをパワーアップさせるための手段と、
    前記複数のデータチャンクが前記第1のストレージデバイスセット及び再割り当てされたストレージデバイスに均等に分布されるまで、前記複数のデータチャンクのデータチャンクを前記再割り当てされたストレージデバイスに移行させるための手段と、
    を備えるシステム。
  9. 請求項8に記載のシステムであって、
    前記複数のデータチャンクは、RAID(独立ディスク冗長アレイ)5又はRAID6のエンコーディングを用いてエンコードされる、システム。
  10. 請求項8に記載のシステムであって、
    前記第1のストレージデバイスセットの各ストレージデバイスに等しくロードするために、前記複数のデータチャンクは、CRUSH(拡張性ハッシング下における制御式の複製)アルゴリズムを用いて前記第1のストレージデバイスセットに分布される、システム。
  11. 請求項8に記載のシステムであって、
    前記第1のストレージデバイスセットは、最小数のストレージデバイスを含む、システム。
  12. 請求項11に記載のシステムであって、
    前記ストレージデバイスの最小数は、前記複数のデータチャンクをエンコードするために用いられるErasureコード化スキームの要件と、前記第1のストレージデバイスセットに格納されるデータの量とによって決定される、システム。
  13. 請求項8に記載のシステムであって、
    前記第2のストレージデバイスセットからのストレージデバイスを前記第1のストレージデバイスセットに再割り当てするために、前記第2のストレージデバイスセットからの前記ストレージデバイスをパワーアップさせるための前記手段は、更に、更なる容量が必要かどうかを決定するために、前記第1のストレージデバイスデバイスの容量を監視するための手段を含む、システム。
  14. 請求項8に記載のシステムであって、
    前記複数のデータチャンクのデータチャンクを移行させるための手段は、前記第2のストレージデバイスセットからの前記ストレージデバイスが完全にアクティブになると前記移行を実施する、システム。
  15. データセットを、シン・プロビジョニングされているとともにErasureコード化されている複数のデータチャンクに割り振るためのプロセッサと、
    前記複数のデータチャンクを格納するために通信可能な状態で前記プロセッサに接続された複数のストレージデバイスであって、第1のストレージデバイスセットと第2のストレージデバイスセットとに分けられ、前記第1のストレージデバイスセットはパワーアップされており、前記第2のストレージデバイスセットはパワーダウンされている、複数のストレージデバイスと、
    通信可能な状態で前記複数のストレージデバイスに接続され、前記複数のストレージデバイスの動作を制御するように構成されたコントローラと、
    を備え、
    前記コントローラは、前記第1のストレージデバイスセットの各ストレージデバイスに等しくロードするために前記複数のデータチャンクを前記第1のストレージデバイスセットに分布させ、前記第2のストレージデバイスセットからのストレージデバイスを前記第1のストレージデバイスセットに再割り当てするために前記第2のストレージデバイスセットからの前記ストレージデバイスをパワーアップさせ、前記複数のデータチャンクが前記第1のストレージデバイスセット及び再割り当てされたストレージデバイスに均等に分布されるまで、前記複数のデータチャンクのデータチャンクを前記再割り当てされたストレージデバイスに移行させる、マスストレージシステム。
  16. 請求項15に記載のシステムであって、
    前記複数のデータチャンクは、CRUSH(拡張性ハッシング下における制御式の複製)アルゴリズムを用いて分布される、システム。
  17. 請求項15に記載のシステムであって、
    前記第1のストレージデバイスセットは、最小数のストレージデバイスを含む、システム。
  18. 請求項17に記載のシステムであって、
    前記コントローラは、前記複数のデータチャンクをエンコードするために用いられるErasureコード化スキームの要件と、前記第1のストレージデバイスセットに格納されるデータの量とに基づいて、前記ストレージデバイスの最小数を決定する、システム。
  19. 請求項15に記載のシステムであって、
    前記コントローラは、更に、更なる容量が必要かどうかを決定するために、前記第1のストレージデバイスデバイスの容量を監視する、システム。
  20. 請求項15に記載のシステムであって、
    前記コントローラは、前記再割り当てされたストレージデバイスが完全にアクティブになるとデータチャンクを移行させる、システム。
JP2009287351A 2009-07-30 2009-12-18 Erasureコード化されたデータストレージ容量及びパワーマネージメント方法及びシステム Pending JP2011034546A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US12/512,642 US20110029729A1 (en) 2009-07-30 2009-07-30 Erasure coded data storage capacity and power management

Publications (1)

Publication Number Publication Date
JP2011034546A true JP2011034546A (ja) 2011-02-17

Family

ID=43034342

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009287351A Pending JP2011034546A (ja) 2009-07-30 2009-12-18 Erasureコード化されたデータストレージ容量及びパワーマネージメント方法及びシステム

Country Status (6)

Country Link
US (1) US20110029729A1 (ja)
EP (1) EP2282260A3 (ja)
JP (1) JP2011034546A (ja)
KR (1) KR20110013146A (ja)
CN (1) CN101989231A (ja)
TW (1) TW201104558A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018185757A (ja) * 2017-04-27 2018-11-22 富士通株式会社 ストレージ制御装置、ストレージ制御方法、およびストレージ制御プログラム

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8201001B2 (en) * 2009-08-04 2012-06-12 Lsi Corporation Method for optimizing performance and power usage in an archival storage system by utilizing massive array of independent disks (MAID) techniques and controlled replication under scalable hashing (CRUSH)
US9720606B2 (en) 2010-10-26 2017-08-01 Avago Technologies General Ip (Singapore) Pte. Ltd. Methods and structure for online migration of data in storage systems comprising a plurality of storage devices
CN103036930B (zh) * 2011-09-30 2015-06-03 国际商业机器公司 用于管理存储设备的方法和设备
US8683296B2 (en) 2011-12-30 2014-03-25 Streamscale, Inc. Accelerated erasure coding system and method
US8914706B2 (en) 2011-12-30 2014-12-16 Streamscale, Inc. Using parity data for concurrent data authentication, correction, compression, and encryption
US9355060B1 (en) 2012-12-14 2016-05-31 Amazon Technologies, Inc. Storage service lifecycle policy transition management
US9658983B1 (en) 2012-12-14 2017-05-23 Amazon Technologies, Inc. Lifecycle support for storage objects having multiple durability levels specifying different numbers of versions
US9052942B1 (en) 2012-12-14 2015-06-09 Amazon Technologies, Inc. Storage object deletion job management
US9063946B1 (en) 2012-12-14 2015-06-23 Amazon Technologies, Inc. Backoff-based scheduling of storage object deletions
US9002805B1 (en) 2012-12-14 2015-04-07 Amazon Technologies, Inc. Conditional storage object deletion
US9417917B1 (en) 2012-12-14 2016-08-16 Amazon Technologies, Inc. Equitable resource allocation for storage object deletion
US9727522B1 (en) 2012-12-14 2017-08-08 Amazon Technologies, Inc. Multi-tenant storage service object lifecycle management using transition job objects
EP2863566B1 (en) 2013-10-18 2020-09-02 Université de Nantes Method and apparatus for reconstructing a data block
US9367562B2 (en) 2013-12-05 2016-06-14 Google Inc. Distributing data on distributed storage systems
KR102252187B1 (ko) 2017-11-22 2021-05-14 한국전자통신연구원 분산 파일 시스템에서 소거코딩 기반의 파일 입출력을 지원하는 장치 및 그 방법

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000010738A (ja) * 1998-06-17 2000-01-14 Toshiba Corp ディスクアレイシステム、同システムに適用される記憶容量拡張方法および記録媒体
JP2003077111A (ja) * 2001-09-05 2003-03-14 Alps Electric Co Ltd 浮上式磁気ヘッド装置
US20050063217A1 (en) * 2003-09-24 2005-03-24 Nec Corporation Disk array device, method of extending storage capacity and computer program
JP2007102607A (ja) * 2005-10-06 2007-04-19 Nec Corp ディスクアレイ装置、データスワップ方法、及びプログラム
JP2007293442A (ja) * 2006-04-21 2007-11-08 Hitachi Ltd ストレージシステム及びその制御方法
JP2009043016A (ja) * 2007-08-08 2009-02-26 Hitachi Ltd ストレージシステム及びストレージシステムのアクセス均等化方法
JP2009080603A (ja) * 2007-09-26 2009-04-16 Hitachi Ltd ストレージ装置及びその省電力方法
US20090307420A1 (en) * 2008-06-05 2009-12-10 Hitachi, Ltd. Storage apparatus and failure recovery method

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003077111A1 (fr) * 2002-03-13 2003-09-18 Fujitsu Limited Controleur pour dispositif raid
US7409522B1 (en) * 2005-10-26 2008-08-05 Network Appliance, Inc. Method and system for reallocating data in a file system
US9152349B2 (en) * 2007-03-23 2015-10-06 Emc Corporation Automated information life-cycle management with thin provisioning
US8046597B2 (en) * 2007-08-14 2011-10-25 Dell Products L.P. System and method for managing storage device capacity use
US20090089516A1 (en) * 2007-10-02 2009-04-02 Greg Pelts Reclaiming storage on a thin-provisioning storage device

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000010738A (ja) * 1998-06-17 2000-01-14 Toshiba Corp ディスクアレイシステム、同システムに適用される記憶容量拡張方法および記録媒体
JP2003077111A (ja) * 2001-09-05 2003-03-14 Alps Electric Co Ltd 浮上式磁気ヘッド装置
US20050063217A1 (en) * 2003-09-24 2005-03-24 Nec Corporation Disk array device, method of extending storage capacity and computer program
JP2005099998A (ja) * 2003-09-24 2005-04-14 Nec Corp ディスクアレイ装置および記憶容量拡張方法ならびにプログラム
JP2007102607A (ja) * 2005-10-06 2007-04-19 Nec Corp ディスクアレイ装置、データスワップ方法、及びプログラム
JP2007293442A (ja) * 2006-04-21 2007-11-08 Hitachi Ltd ストレージシステム及びその制御方法
JP2009043016A (ja) * 2007-08-08 2009-02-26 Hitachi Ltd ストレージシステム及びストレージシステムのアクセス均等化方法
JP2009080603A (ja) * 2007-09-26 2009-04-16 Hitachi Ltd ストレージ装置及びその省電力方法
US20090307420A1 (en) * 2008-06-05 2009-12-10 Hitachi, Ltd. Storage apparatus and failure recovery method
JP2009294901A (ja) * 2008-06-05 2009-12-17 Hitachi Ltd ストレージ装置及び障害復旧方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018185757A (ja) * 2017-04-27 2018-11-22 富士通株式会社 ストレージ制御装置、ストレージ制御方法、およびストレージ制御プログラム

Also Published As

Publication number Publication date
TW201104558A (en) 2011-02-01
KR20110013146A (ko) 2011-02-09
EP2282260A2 (en) 2011-02-09
CN101989231A (zh) 2011-03-23
EP2282260A3 (en) 2012-04-04
US20110029729A1 (en) 2011-02-03

Similar Documents

Publication Publication Date Title
JP2011034546A (ja) Erasureコード化されたデータストレージ容量及びパワーマネージメント方法及びシステム
US9459806B2 (en) Combining virtual mapping metadata and physical space mapping metadata
JP6913233B2 (ja) 地理的に分散したオブジェクトデータの高速呼び戻し
JP5881900B2 (ja) ストレージアレイを管理する方法及び装置
US20150363126A1 (en) Logical zone mapping
US7987318B2 (en) Data storage system and method
US10983707B2 (en) Asymmetric storage data distribution
EP2026185B1 (en) System and method for managing storage device capacity usage
US20210165605A1 (en) Storage device sharing attribute information with host device to use host memory buffer and electronic device including the same
US20160314043A1 (en) Resiliency fragment tiering
JP2012226770A (ja) Raid管理、再割振り、およびリストライピングのためのシステムおよび方法
US20150293719A1 (en) Storage Space Processing Method and Apparatus, and Non-Volatile Computer Readable Storage Medium
US11947795B2 (en) Power loss protection based on write requirements
US20140310493A1 (en) Migrating data across storages with dissimilar allocation sizes
TW202219735A (zh) 遷移資料的方法、非暫時性電腦可讀媒體以及儲存系統
GB2469207A (en) A data storage system
US20160239226A1 (en) Control device, storage system, and method of controlling a plurality of storage devices
US9916096B2 (en) Increasing data storage capacity
JP2014191784A (ja) ストレージシステム、情報処理装置、情報処理装置の制御プログラム、および情報処理装置の制御方法
US20140351208A1 (en) Storage system device management
US11163454B1 (en) Bottom-up IO load balancing storage system and method
US20190102092A1 (en) Distributed storage device
US11163471B1 (en) Storage system and method for movement between rotation subgroups
CN117234433B (zh) 数据迁移方法和装置、raid存储设备、存储介质及电子装置
US12008019B2 (en) Adjusting storage delivery in a storage system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120914

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130226

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130806

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140204