JP2011530746A - 現在データ及び再生データに関して異なるraidデータ・ストレージの形式の間でデータを伝送するシステム及び方法 - Google Patents
現在データ及び再生データに関して異なるraidデータ・ストレージの形式の間でデータを伝送するシステム及び方法 Download PDFInfo
- Publication number
- JP2011530746A JP2011530746A JP2011522260A JP2011522260A JP2011530746A JP 2011530746 A JP2011530746 A JP 2011530746A JP 2011522260 A JP2011522260 A JP 2011522260A JP 2011522260 A JP2011522260 A JP 2011522260A JP 2011530746 A JP2011530746 A JP 2011530746A
- Authority
- JP
- Japan
- Prior art keywords
- raid
- storage
- data
- type
- volume
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0646—Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
- G06F3/065—Replication mechanisms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0608—Saving storage space on storage systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0614—Improving the reliability of storage systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0629—Configuration or reconfiguration of storage systems
- G06F3/0632—Configuration or reconfiguration of storage systems by initialisation or re-initialisation of storage systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0683—Plurality of storage devices
- G06F3/0689—Disk arrays, e.g. RAID, JBOD
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1471—Saving, restoring, recovering or retrying involving logging of persistent data for recovery
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/84—Using snapshots, i.e. a logical point-in-time copy of the data
Abstract
本開示は第1型及び第2型のRAIDストレージを有するRAIDサブシステムを含むデータストレージシステムに関する。I/Oを受け入れる仮想ボリュームは第1型RAIDストレージに記憶され、仮想ボリュームのスナップショットは第2型RAIDストレージに記憶される。方法は、I/Oを受け入れるアクティブボリュームを提供するステップと、そのボリュームのリードオンリのスナップショットを生成するステップとを含む。実施形態では、アクティブボリュームはスナップショットに変換される。アクティブボリュームは第1型RAIDストレージを含み、スナップショットは第2型RAIDストレージを含む。第1型RAIDストレージは第2型RAIDストレージより書き込みのペナルティが少ない。実施形態では、第1型RAIDストレージはRAID10ストレージを含み、第2型RAIDストレージはRAID5/RAID6ストレージを含む。
Description
本開示は、データ・ストレージ・システムにおける異なるタイプのRAIDデータ・ストレージの間でデータを伝送するシステム及び方法に関する。より特定的には、本開示は、現在のデータと再生のデータとに関して、異なるタイプのRAIDデータ・ストレージの間でデータを伝送するシステム及び方法に関する。
RAIDストレージは、現在のデータ・ストレージ・システムやストレージ・エリア・ネットワーク(SAN)において一般的に使用されている。RAID0、RAID1、RAID3、RAID4、RAID5、RAID6、RAID10などを含む多くのレベルのRAIDが存在する。
例えば、RAID5は、ブロック・レベルのストライピングを用い、パリティ・データは全てのメンバ・ディスクにわたって分配される。一般に、データがRAID5ストライプのデータ・ブロックへ書き込まれると、パリティ・ブロック(P)は再計算され再書き込みされなければならない。これには、新たなパリティを計算してパリティ・ブロックへ書き込むこと、及び新たなデータをデータ・ブロックへ書き込むことが必要とされる。また、これは、古いデータをデータ・ブロックから読み出すことを必要とする。従って、RAID5の書き込みは、ディスクのオペレーションと、ディスクとRAIDコントローラとの間の通信とに関して、相対的に費用のかかるものとなる。
パリティ・ブロックは、データ・ブロックの読み出しがエラーとなったときに、読み出される。RAID5ストライプの残りのデータ・ブロック及びパリティ・ブロックのそれぞれは、読み出しエラーの発生したデータ・ブロックのデータを再構築するために使用される。ディスク・アレイのディスク全体が故障した場合、生きているディスクからの分配されたパリティ・ブロックが、生きているディスクからのデータ・ブロックと数学的に組み合わされ(例えば、排他的OR)、故障したドライブのデータを再構築する。
RAID6は、1つの見地では、更なるパリティ・ブロック(G)を追加することによりRAID5の構成を改善したものである。RAID6は、2つのパリティ・ブロック(P及びQ)を全てのメンバ・ディスクにわたって分配するブロック・レベルのストライピングを用いる。即ち、RAID6は、2つのディスクの故障、例えば、故障したディスクを再構築しているときの故障、に対する保護を提供する。1つのデータ・ブロックの読み出しがエラーとなったとき、データ・ブロックのデータを再構築するためにパリティ・ブロックの1つ(P)を使用することができる。2つのデータ・ブロックのそれぞれの読み出しがエラーとなった場合、データ・ブロックのデータを再構築するために両方のパリティ・ブロック(P及びQ)が使用される。
RAID5及びRAID6のレベルに対する部分的ストライプ書き込み要求は、データ・ブロック及びパリティ・ブロック(RAID5についてはP、RAID6についてはP及びQ)を更新するために、読み出し/変更/書き込みの動作を行う必要があるため、相対的に効率が悪い。従って、RAID5及びRAID6の構成は、一般に、多くの書き込みを含む作業負荷に面したときに性能が低くなる問題がある。
故障したディスクがない場合、RAID5及びRAID6の構成における読み出し動作の間、パリティ・ブロックは読み出されない。RAID5及びRAID6の読み出し性能は、一般に、他のRAIDレベル、例えば、RAID0と似たものである。
他方、RAID10は、RAID5及びRAID6のレベルで現れる書き込みに関する不利(ペナルティ)はない。RAID10は、高負荷のデータベースによく用いられる。なぜなら、パリティ・ブロックが無く、それによりRAID10の書き込み速度が速くなっているからである。RAID10は、2つの異なるRAIDレベル、RAID1及びRAID0、の特定的な組み合わせである。RAID1は高レベルの有用性を提供し、RAID0は最高の性能を提供するので、RAID10は魅力的である。しかしながら、RAID5及びRAID6は、RAID10よりも実質的に良いストレージ効率を有する。
従って、データ・ストレージ・システムにおける異なるタイプのRAIDデータ・ストレージの間でデータを伝送(転送)するシステム及び方法の技術において必要とされるものがある。更に、現在のデータ及び再生のデータに関しての、異なるタイプのRAIDデータ・ストレージの間でデータを伝送(転送)するシステム及び方法の技術において必要とされるものがある。同様に、それぞれのRAID構成の利点を最も望まれるときに使用できるようにし、RAID5レベル及び/又はRAID6レベルとRAID10レベルとの間でデータを伝送(転送)するシステム及び方法の技術において必要とされるものがある。
米国特許出願公報第2005/0055603号
本開示における1つの実施形態は、RAIDストレージ・システムのデータ・ストレージの幾つかのタイプのものの間でデータを転送する方法に関連する。方法は、読み出し及び書き込みの要求を受け入れるデータ・ストレージ空間のアクティブ・ボリュームを提供するステップと、アクティブ・ボリュームのリード・オンリ(読み出し専用)・スナップショットを生成するステップとを含む。或る実施形態では、アクティブ・ボリュームはリード・オンリ・スナップショットへと変換される。アクティブ・ボリュームは、第1タイプのRAIDストレージを含み、スナップショットは第2タイプのRAIDストレージを含む。第1タイプのRAIDストレージは、書き込みに関するペナルティ(不利益)が第2タイプのRAIDストレージよりも低い。典型的な実施形態では、第1タイプのRAIDストレージはRAID10ストレージを含み、第2タイプのRAIDストレージはRAID5ストレージ及び/又はRAID6ストレージを含む。
本開示の別の実施形態の方法は、リード・オンリ・スナップショット・データのビュー・ボリューム(view volume)を生成するステップを含む。ビュー・ボリュームは、読み出し及び書き込みの要求を受け入れることができる。従って、ビュー・ボリュームは、リード・オンリ・スナップショット・データに対して使用されるタイプのRAIDストレージよりも書き込みに関するペナルティが少ないタイプのRAIDストレージを含む。或る実施形態では、ビュー・ボリュームはRAID10ストレージを含む。
本開示の別の実施形態は、第1及び第2のタイプのRAIDストレージを有するRAIDサブシステムを含むデータ・ストレージ・システムと関連する。データ・ストレージ・システムは、更に、第1タイプのRAIDストレージに記憶され、I/Oを受け入れるように構成された仮想ボリュームと、第2タイプのRAIDストレージに記憶される、仮想ボリュームの1以上のスナップショットとを含む。第1タイプのRAIDストレージは、第2タイプのRAIDストレージよりも書き込みに関するペナルティが少ない。
複数の実施形態が示されるが、本発明のそれら以外の実施形態についても、本発明の例示的な実施形態を示し説明する以下の詳細な説明から、当業者には明らかとなる。理解されるように、本発明の精神及び範囲から離れることなく、本発明は、様々な明らかな点において変更することが可能である。従って、図面及び詳細な説明は、本質を例示するものであり、それに限定するものと見るべきではない。
明細書の最後において、本発明を形成すると考えられる主題を特定的に指定し明確に主張する特許請求の範囲で締めくくっているが、本発明は以下の説明及び添付の図面から、より良く理解できる。
本開示は、データ・ストレージ・システムにおける様々なタイプのRAIDデータ・ストレージの間でデータを転送(伝送)するシステム及び方法に関する。より特定的には、本開示は、現在のデータ及び再生のデータに対して様々なタイプのRAIDデータ・ストレージの間でデータを転送するシステム及び方法に関する。更に、本開示は、それぞれのRAID構成の利点を最も望まれるときに使用できるようにし、RAID5レベル及び/又はRAID6レベルとRAID10レベルとの間でデータを転送するシステム及び方法に関する。
本開示の実施形態は、任意の適当なデータ・ストレージ・システムやSANとともに使用できる。1つの実施形態では、本開示のシステム及び方法は、2004年8月13日に出願された「Virtual Disk Drive System and Method(仮想ディスク・ドライブのシステム及び方法)」と題する米国特許出願第10/918329号であって、米国特許出願公報第2005/0055603号として2005年3月15日に発行されたものおいて開示されているようなデータ・ストレージ・システムと共に使用できる。米国特許出願第10/918329号の内容は、ここで参照することにより本明細書に組み込まれるものとする。米国特許出願第10/918329号は、ダイナミック・データ・アロケーション(動的データ割り当て)及びディスク・ドライブ仮想化を可能にする改善されたディスク・ドライブ・システムを開示する。ディスク・ドライブ・システムは、RAIDサブシステムを含むことができ、RAIDのフリー・リスト又はディスク・ストレージ・ブロックのマトリックスを維持するストレージのページ・プールを有し、少なくとも1つのディスク・ストレージ・システム・コントローラを有するディスク・マネージャを有する。RAIDサブシステム及びディスク・マネージャは、RAID・ツー・ディスク・マッピング(RAID-to-disk mapping、RAIDとディスクのマッピング)に基づいて、ストレージのページ・プール又はディスク・ストレージ・ブロックのマトリックス、及び複数のディスク・ドライブにわたってデータを動的に割り当てる。米国特許出願第10/918329号に記載されているようなディスク・ドライブ・システムは、米国特許出願第10/918329号に詳細に記載されている仮想ボリューム・マトリックス又はディスク・ストレージ・ブロックのプール、データのバックアップやリカバリや試験その他のためのインスタント・データ・フュージョン(instant data fusion)及びデータ・インスタント・リプレイ(data instant replay)、リモート・データ・ストレージ、及びデータ・プログレッション(data progression)の、ポイント・イン・タイム・コピー(Point-In-Time Copy、PITC)の効率的なデータ・ストレージを可能にするための、動的データ割り当て及びスナップショットの機能を含み得る。
本明細書で開示される新しいシステム及び方法は、データ・ストレージ・システムにおいて以前は得られなかった特徴を提供する。例えば、データは、例えば現在のデータや再生/バックアップのデータなどのような様々なタイプのデータに対する様々なレベルのRAIDに記憶される。1つの実施形態において、RAID5レベル及び/又はRAID6レベルに記憶されるデータは、適当な時にRAID10レベルへ転送されることができ、その逆の転送も可能であり、それぞれのRAID構成の利点が最も効率的に使用される。特定的には、RAID5ストレージ及び/又はRAID6ストレージは、一般に、リード・オンリ・データに対して使用される。なぜなら、RAID5レベル及びRAID6レベルは、一般に、読み出し動作に関して効率的であるが、書き込み動作に関しては不利なことにペナルティを含むからである。RAID5及びRAID6はまた、有利なことに、相対的に良好なデータ保護を提供する。RAID10ストレージは、一般に、データの読み出し及び書き込みの双方に使用される。なぜなら、RAID10ストレージは、データの読み出し動作及び書き込み動作の双方に対して相対的に効率が良いからである。しかしながら、RAID5及び/又はRAID6は、RAID10よりも実質的に良いストレージ効率を有する。これについて以下に例を示す。
相対的に良い読み出し及び書き込み性能をサポートする。
・RAID10、シングル・ミラーは、50%空間効率(space efficient)であり、任意のシングル(1)・ドライブ故障をサポートする。
・RAID10、デュアル・ミラーは、33%空間効率であり、任意のデュアル(2)・ドライブ故障をサポートする。
・RAID10、シングル・ミラーは、50%空間効率(space efficient)であり、任意のシングル(1)・ドライブ故障をサポートする。
・RAID10、デュアル・ミラーは、33%空間効率であり、任意のデュアル(2)・ドライブ故障をサポートする。
相対的に良い読み出し性能をサポートする。
・RAID5、5ワイド(five wide)は、80%空間効率であり、任意の1ドライブ故障をサポートする。
・ ・RAID5、9ワイド(9 wide)は、89%空間効率であり、任意の1ドライブ故障をサポートする。
・RAID6、6ワイド(six wide)は、67%空間効率であり、任意の2ドライブ故障をサポートする。
・RAID6、10ワイド(ten wide)は、80%空間効率であり、任意の2ドライブ故障をサポートする。
・RAID5、5ワイド(five wide)は、80%空間効率であり、任意の1ドライブ故障をサポートする。
・ ・RAID5、9ワイド(9 wide)は、89%空間効率であり、任意の1ドライブ故障をサポートする。
・RAID6、6ワイド(six wide)は、67%空間効率であり、任意の2ドライブ故障をサポートする。
・RAID6、10ワイド(ten wide)は、80%空間効率であり、任意の2ドライブ故障をサポートする。
1つの実施形態において、データがリード・オンリとコミット(明言)されたとき、そのデータはRAID10ストレージからRAID5及び/又はRAID6ストレージへ転送又は移動される。幾つかの実施形態では、RAID10ストレージは現在データのために使用され、RAID5ストレージ及び/又はRAID6ストレージは再生(replay、リプレイ)データのために使用される。更なる実施形態では、ストレージ・システムのデータの大部分がRAID5ストレージ及び/又はRAID6ストレージへ記憶される。
1つの実施形態では、米国特許出願第10/918329号に記載されているデータ・インスタント・フュージョンの方法は、ユーザの定めた時間間隔でRAIDサブシステムのPITCを自動的に生成し、ユーザの構成したダイナミック・タイム・スタンプを、例えば、数分毎や数時間毎などや、ユーザにより指示される時間又は時間間隔に生成する。システムの故障やウィルスの攻撃の場合、これらのタイム・スタンプの付された仮想PITCは、米国特許出願第10/918329号に記載されているように、数分や数時間で、データ・インスタント・リプレイ(再生)及びデータ・インスタント・リカバリを可能とする。即ち、将来の動作のために、クラッシュ又は攻撃の少し前のデータは遅滞なく融合され、クラッシュ又は攻撃の前に記憶されたPITCは即座に使用でき、また、即座に再生できる。
図1に示すように、それぞれの所定の時間間隔、例えば、5分の時間間隔、T1(午後12時)、T2(午後12時5分)、T3(午後12時10分)、及びT4(午後12時15分)で、ストレージのページ・プールのPITC、ディスク・ストレージ・ブロックのマトリックス、又は任意の他の適当なディスク・ストレージ構造、例えば、以下で説明するアクティブPITCが、自動的に生成される。任意の適当なデータ・ストレージ・システム又はSANにおける、PITC又はストレージのページ・プールの詳細、ディスク・ストレージ・ブロックのマトリックス、又は他の適当なディスク・ストレージ構造のアドレス・インデックスは、ストレージのページ・プール、ディスク・ストレージ・ブロックのマトリックス、又は他の適当なディスク・ストレージ構造に記憶され、その記憶されたアドレス・インデックスを介して、PITC又はストレージのページ・プールの詳細、ディスク・ストレージ・ブロックのマトリックス、又は他の適当なディスク・ストレージ構造が即座に位置付けできる(位置を見つけられる)ようにする。PITCは、ローカルのRAIDサブシステム又はリモートのRAIDサブシステムに記憶することができ、例えば、建物の火災などにより主となるシステムがクラッシュしたときに、データのインテグリティに影響を及ぼさないようにし、データが即座にリカバリでき再生できるようにできる。フュージョン(融合)されたデータやPITCデータを記憶するために、任意の適当な又は望ましいRAIDレベルを使用することができる。1つの実施形態では、PITCはRAID5及び/又はRAID6のストレージ・レベルに記憶することができ、それにより、データは、RAID5及び/又はRAID6のレベルで提供されるデータ保護を受ける。
インスタント・データ・フュージョン及びデータ・インスタント・リプレイの別の特徴は、システムが動作中に、試験のためにPITCを使用できることである。言い換えると、実際のデータ(real data、リアル・データ)をリアルタイムの試験に使用できる。幾つかの実施形態では、以下で説明するように、PITCデータは試験のためにRAID10ストレージへ転送される(例えば、以下で説明するように、RAID5ストレージ及び/又はRAID6ストレージに記憶されたPITCデータを用いてRAID10ストレージにビュー・ボリュームが生成される)。別の実施形態では、PITCデータは、試験のためにRAID5ストレージ及び/又はRAID6ストレージに残る(例えば、以下で説明するように、RAID5ストレージ及び/又はRAID6ストレージにビュー・ボリュームが生成される)。
スナップショットを用いるボリュームの挙動は、スナップショットのないボリュームと実質的に同じである。1つの実施形態では、ボリュームに対するトップ(最上位)・レベルのPITCは、アクティブPITC(AP)と呼ばれる。APは、ボリュームに対する全ての読み出し及び書き込みの要求を満足させる。1つの実施形態では、APは、書き込み要求を受け入れるボリュームに対する唯一のPITCである。APはまた、ボリューム内の全てのデータの現在位置のサマリ(一覧)を含むことができる。1つの実施形態では、APは、以前のPITCと、現在のトップ・レベルPITC、即ち、APとの違い(差)のみを追跡する。例えば、APは、ボリュームへの書き込みのみを追跡する。
PITCのライフ・サイクルの1つの実施形態では、図2に示すように、トップ・レベルPITC、即ち、APは、リード・オンリとコミットされる前に以下の状態を経る。以前に述べたように、PITCは、1つのRAIDレベルに記憶され、次に、望ましい場合には、別のRAIDレベルへ転送される。1つの実施形態では、PITCは、ボリュームへの書き込みを受け入れできる間はRAID10ストレージへ記憶され、リード・オンリとコミットされた後はRAID5及び/又はRAID6へ記憶される。従って、PITCは、書き込み動作に関連するRAID10の利点を用いることができ、書き込み動作に関連するRAID5及び/又はRAID6の欠点を避けることができ、また、リード・オンリ・データに対してRAID5及び/又はRAID6が提供するデータ保護を受けることができる。トップ・レベルPITCの典型的なライフ・サイクルは、下記の状態のうちの1以上のものを含む。
1. ストレージ空間の割り当て: ストレージ空間は、PITCに対してディスク上で動的に生成される。この時点でのテーブルの書き込みは、PITCが取られる前にテーブル情報を記憶するための必要なスペース(空間)が割り当てられることを保証する。同時に、PITCオブジェクトもまたディスクに対してコミットされる。PITCを記憶するために任意の適当なRAIDレベルを使用することができるが、1つの実施形態では、RAID10ストレージを使用する。
2. I/Oの受け入れ: PITCはAPになり得る。それは、そうなった時に、ボリュームに対する読み出し及び書き込みの要求に対処することができる。1つの実施形態では、これは、テーブルに対する書き込み要求を受け入れる唯一の状態である。PITCは、イベントを生成することができ、今はAPである。以前に説明したように、RAID10ストレージは、PITCがAPのときに使用することができる。RAID10は魅力的である。なぜなら、RAID10は、高レベルの有用性と高性能とを提供するが、RAID5やRAID6のような他のRAIDレベルに関連する書き込みに関するペナルティの問題が無いからである。
3. ディスクに対するリード・オンリとしてのコミット: PITCは、もはやAPではなく、もはや更なるページを受け入れない。新たなAPが引き継いでおり、PITCは今はリード・オンリである。この時点の後、1つの実施形態では、テーブルは、合体動作の間に取り除かれないかぎり、変更されない。PITCは、更に、イベントを生成し、それはフリーズされコミットされる。何れのサービスもそのイベントに従う。1つの実施形態では、PITCがもはやAPではなくリード・オンリとなったとき、PITCと関連するデータは、RAID10ストレージからRAID5ストレージ及び/又はRAID6ストレージへ転送される。以前に説明したように、RAID5及びRAID6は、幾つかの場合において、データのより効率的な保護を提供し、読み出しエラーやディスク故障の後にデータがリカバリできるようにする。PITCはリード・オンリとなっているので、RAID5及び/又はRAID6の書き込みに関するペナルティは最小化されるか、又は除去される。
1つの実施形態では、インスタント・データ・フュージョン及びデータ・インスタント・リプレイは、更に、バックアップ動作やリカバリ動作以外のために、RAIDサブシステムのディスク・ストレージ・ブロックのPITCを使用するために用いられる。1つの実施形態では、PITCは、それがAPである間に、ボリュームへの書き込み動作を記録することができ、それにより、PITCから「ビュー(view)」を作り出して過去のボリュームの内容(コンテンツ)を見るようにできる。即ち、スナップショットは、ボリュームの以前のPITCに対するビューを作り出すことにより、データ・リカバリや他の機能をサポートする。ビュー・ボリュームは、以前のPITCのデータへのアクセスを提供し、また、読み出し動作及び書き込み動作を含む通常のボリュームI/O動作をサポートする。1つの実施形態において、ビュー・ボリューム機能は、ボリューム内の任意のPITCへ添付される。更なる実施形態では、ボリュームの現在の状態から取られるビューは、現在のボリュームのAPからコピーされる。PITCへの添付は比較的速い処理であり、幾つかの実施形態では、ビュー・ボリュームの生成は、ほぼ即座に行われ、データのコピーを必要としない。1つの実施形態では、ビュー・ボリュームは、親ボリュームからスペース(空間)を割り当てる。ビュー・ボリュームの削除は、そのスペースを空けて親ボリュームへ戻すことになる。幾つかの実施形態では、以下に説明するように、以前のPITCのビュー又はビュー・ボリュームは、RAID5ストレージ及び/又はRAID6ストレージを用いて実施される。代替例として、ビュー又はビュー・ボリュームは、RAID5ストレージ及び/又はRAID6ストレージに記憶されたPITCデータから、RAID10ストレージを用いて作られる。ビュー・ボリューム機能の使用の例には、試験、訓練、バックアップ、およびリカバリが含まれる。
1つの実施形態では、ビュー又はビュー・ボリュームはそれ自体のAPを含み、PITCへの書き込みを記録するようにする。APを用いて、ビュー・ボリュームは、基礎的なボリューム・データを変更することなく、ビュー・ボリュームに対する書き込み動作を可能とする。1つのボリュームが、複数の子(child)ビュー・ボリュームをサポートすることができる。
1つの実施形態では、PITCは、1以上のレベルのRAIDに記憶され、そのPITCのビュー・ボリュームは、同じレベルのRAIDのストレージにおいて作られる。例えば、PITCは、RAID5ストレージ及び/又はRAID6ストレージのレベルに記憶され、PITCのビュー・ボリュームもまた、RAID5ストレージ及び/又はRAID6ストレージを用いて作られる。更なる実施形態では、PITCは、1以上のレベルのRAIDに記憶され、PITCのビュー・ボリュームは、1以上の様々なRAIDレベルのストレージにおいて作られる。例えば、PITCは、RAID5ストレージ・レベル及び/又はRAID6ストレージ・レベルに記憶され、PITCのビュー・ボリュームは、RAID10ストレージを用いて作られる。従って、PITCは、RAID5及びRAID6の提供するデータ保護を維持し、書き込み動作を受け入れ得るビュー・ボリュームは、RAID5ストレージ及びRAID6ストレージと関連する書き込みにおけるペナルティを回避することができる。
好ましい実施形態を参照して本発明を説明したが、当業者であれば、本発明の精神及び範囲から離れることなく、形態および詳細に関する変更を行え得ることを認識するであろう。例えば、上記の実施形態ではRAID5ストレージ、RAID6ストレージ、及びRAID10ストレージに関して説明したが、データは、任意の適当なレベルのRAIDストレージの間で、それぞれのRAIDレベルの利点を適切に使用できるときに、転送することが可能である。更に、実施形態では、リード・オンリ・データをRAID5ストレージ及び/又はRAID6ストレージに記憶することを記載したが、データは、必ずしもリード・オンリでなくてもよい。幾つかの実施形態では、データは、読み出し動作及び書き込み動作の両方を受け入れる。幾つかの実施形態では、書き込み動作は、読み出し動作よりも実質的に動作の量が少ないが、RAID5及び/又はRAID6と関連する書き込みに関するペナルティは最小化される。
Claims (18)
- RAIDストレージ・システムの幾つかのタイプのデータ・ストレージの間でデータを転送する方法であって、
I/Oを受け入れるデータ・ストレージ空間のアクティブ・ボリュームを提供するステップと、
前記アクティブ・ボリュームのリード・オンリ・スナップショットを生成するステップと、
を備え、
前記アクティブ・ボリュームが第1タイプのRAIDストレージを備え、前記スナップショットが第2タイプのRAIDストレージを備える、
方法。 - 請求項1に記載の方法であって、前記第2タイプのRAIDストレージは、RAID5ストレージとRAID6ストレージとの少なくとも1つを備える、方法。
- 請求項1に記載の方法であって、前記第1タイプのRAIDストレージは、RAID10ストレージを備える、方法。
- 請求項3に記載の方法であって、前記第2タイプのRAIDストレージは、RAID5ストレージとRAID6ストレージとの少なくとも1つを備える、方法。
- 請求項1に記載の方法であって、I/Oを受け入れ得るリード・オンリのスナップショットのビュー・ボリュームを生成するステップを更に備える方法。
- 請求項5に記載の方法であって、前記ビュー・ボリュームは第3タイプのRAIDストレージを備える、方法。
- 請求項6に記載の方法であって、前記第3タイプのRAIDストレージは、前記第1タイプのRAIDストレージと同じである、方法。
- RAIDストレージ・システムの幾つかのタイプのデータ・ストレージの間でデータを転送する方法であって、
I/Oを受け入れるように構成され且つ第1タイプのRAIDストレージを含むアクティブ・ボリュームを提供するステップと、
前記アクティブ・ボリュームを、前記アクティブ・ボリュームのリード・オンリのポイント・イン・タイム・コピーに変換するステップと
を備え、
前記アクティブ・ボリュームを、リード・オンリのポイント・イン・タイム・コピーに変換する前記ステップは、前記データを前記第1タイプのRAIDストレージから前記第2タイプのRAIDストレージへ転送するステップを備える、
方法。 - 請求項8に記載の方法であって、前記第1タイプのRAIDストレージは、前記第2タイプのRAIDストレージよりも書き込みに関するペナルティが少ない、方法。
- 請求項9に記載の方法であって、前記第2タイプのRAIDストレージは、RAID5ストレージとRAID6ストレージとの少なくとも1つを備える、方法。
- 請求項9に記載の方法であって、前記第1タイプのRAIDストレージはRAID10ストレージを備える、方法。
- 請求項11に記載の方法であって、前記第2タイプのRAIDストレージは、RAID5ストレージとRAID6ストレージとの少なくとも1つを備える、方法。
- 請求項11に記載の方法であって、I/Oを受け入れ得るリード・オンリのスナップショットのビュー・ボリュームを生成するステップを更に備え、前記ビュー・ボリュームは前記第1タイプのRAIDストレージを備える、
方法。 - データ・ストレージ・システムであって、
第1タイプのRAIDストレージと第2タイプのRAIDストレージとを備えるRAIDサブシステムと、
I/Oを受け入れるように構成され、前記第1タイプのRAIDストレージに記憶される仮想ボリュームと、
前記第2タイプのRAIDストレージに記憶される前記仮想ボリュームの1以上のスナップショットと
を備えるデータ・ストレージ・システム。 - 請求項14に記載のデータ・ストレージ・システムであって、前記第1タイプのRAIDストレージは、前記第2タイプのRAIDストレージよりも書き込みに関するペナルティが少ない、データ・ストレージ・システム。
- 請求項15に記載のデータ・ストレージ・システムであって、前記第2タイプのRAIDストレージは、RAID5ストレージとRAID6ストレージとの少なくとも1つを備える、データ・ストレージ・システム。
- 請求項15に記載のデータ・ストレージ・システムであって、前記第1タイプのRAIDストレージはRAID10ストレージを備える、データ・ストレージ・システム。
- 請求項17に記載のデータ・ストレージ・システムであって、前記第2タイプのRAIDストレージは、RAID5ストレージとRAID6ストレージとの少なくとも1つを備える、データ・ストレージ・システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US8691708P | 2008-08-07 | 2008-08-07 | |
US61/086,917 | 2008-08-07 | ||
PCT/US2009/053084 WO2010017439A1 (en) | 2008-08-07 | 2009-08-07 | System and method for transferring data between different raid data storage types for current data and replay data |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011530746A true JP2011530746A (ja) | 2011-12-22 |
Family
ID=41112673
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011522260A Pending JP2011530746A (ja) | 2008-08-07 | 2009-08-07 | 現在データ及び再生データに関して異なるraidデータ・ストレージの形式の間でデータを伝送するシステム及び方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20100037023A1 (ja) |
EP (1) | EP2324414A1 (ja) |
JP (1) | JP2011530746A (ja) |
CN (1) | CN102177496A (ja) |
WO (1) | WO2010017439A1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9489150B2 (en) * | 2003-08-14 | 2016-11-08 | Dell International L.L.C. | System and method for transferring data between different raid data storage types for current data and replay data |
JP2007502470A (ja) | 2003-08-14 | 2007-02-08 | コンペレント・テクノロジーズ | 仮想ディスク・ドライブのシステムおよび方法 |
WO2007140259A2 (en) * | 2006-05-24 | 2007-12-06 | Compellent Technologies | Data progression disk locality optimization system and method |
US8468292B2 (en) * | 2009-07-13 | 2013-06-18 | Compellent Technologies | Solid state drive data storage system and method |
US9448730B2 (en) * | 2009-09-30 | 2016-09-20 | International Business Machines Corporation | Method and apparatus for dispersed storage data transfer |
US8782335B2 (en) * | 2010-11-08 | 2014-07-15 | Lsi Corporation | Latency reduction associated with a response to a request in a storage system |
US9146851B2 (en) | 2012-03-26 | 2015-09-29 | Compellent Technologies | Single-level cell and multi-level cell hybrid solid state drive |
US9519439B2 (en) * | 2013-08-28 | 2016-12-13 | Dell International L.L.C. | On-demand snapshot and prune in a data storage system |
CN103558998B (zh) | 2013-11-07 | 2016-03-30 | 华为技术有限公司 | 一种数据操作的方法和设备 |
CN107590285A (zh) * | 2017-09-30 | 2018-01-16 | 郑州云海信息技术有限公司 | 一种异构系统数据一致性的方法 |
CN110096216B (zh) * | 2018-01-30 | 2022-06-14 | 伊姆西Ip控股有限责任公司 | 用于管理数据存储系统中的数据存储的方法、装置以及计算机程序产品 |
CN115981574B (zh) * | 2023-03-10 | 2023-08-04 | 阿里巴巴(中国)有限公司 | 一种快照存储方法、系统、设备及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101566930B (zh) * | 2003-08-14 | 2013-10-16 | 克姆佩棱特科技公司 | 虚拟磁盘驱动系统和方法 |
JP2007502470A (ja) * | 2003-08-14 | 2007-02-08 | コンペレント・テクノロジーズ | 仮想ディスク・ドライブのシステムおよび方法 |
US8046534B2 (en) * | 2006-10-26 | 2011-10-25 | Hewlett-Packard Development Company, L.P. | Managing snapshots in storage systems |
-
2009
- 2009-08-07 WO PCT/US2009/053084 patent/WO2010017439A1/en active Application Filing
- 2009-08-07 JP JP2011522260A patent/JP2011530746A/ja active Pending
- 2009-08-07 US US12/537,408 patent/US20100037023A1/en not_active Abandoned
- 2009-08-07 EP EP09791265A patent/EP2324414A1/en not_active Ceased
- 2009-08-07 CN CN2009801396554A patent/CN102177496A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2010017439A1 (en) | 2010-02-11 |
CN102177496A (zh) | 2011-09-07 |
EP2324414A1 (en) | 2011-05-25 |
US20100037023A1 (en) | 2010-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2011530746A (ja) | 現在データ及び再生データに関して異なるraidデータ・ストレージの形式の間でデータを伝送するシステム及び方法 | |
US9448886B2 (en) | Flexible data storage system | |
US10067712B2 (en) | Virtual disk drive system and method | |
US9489150B2 (en) | System and method for transferring data between different raid data storage types for current data and replay data | |
JP5038897B2 (ja) | データ復旧のためのパリティ情報の記憶 | |
KR100392382B1 (ko) | 동적 크기 변경 및 메타 데이터 양의 최소화를 위한 논리볼륨 관리 방법 | |
US7047358B2 (en) | High-performance log-structured RAID | |
JP5971354B2 (ja) | ストレージシステム | |
US20180267856A1 (en) | Distributed storage system, data storage method, and software program | |
US20060085674A1 (en) | Method and system for storing data | |
US20120124285A1 (en) | Virtual disk drive system and method with cloud-based storage media | |
JP2004118837A (ja) | 耐故障性の記憶サブシステムにデータを格納するための方法、記憶サブシステムおよびそのシステムのためのデータ編成管理プログラム | |
US20100169575A1 (en) | Storage area managing apparatus and storage area managing method | |
US20080104150A1 (en) | Method and system for priority-based allocation in a storage pool | |
JP2000099282A (ja) | ファイル管理システム | |
JP2018508073A (ja) | データ除去、割り当て、及び再構築 | |
JP3096392B2 (ja) | Raidを使用する、フル・モーション・ビデオのネットワーク・サポートの方法および装置 | |
US10409682B1 (en) | Distributed RAID system | |
US7689877B2 (en) | Method and system using checksums to repair data | |
CN102164165A (zh) | 一种网络存储系统的管理方法及装置 | |
JP3736134B2 (ja) | 分散記憶方法及び分散記憶システム及び分散記憶プログラムを記録した記録媒体 | |
JP6494787B2 (ja) | 分散ストレージシステム | |
US11544005B2 (en) | Storage system and processing method | |
US20130080569A1 (en) | Information processing apparatus and computer-readable recording medium having program stored thereon | |
EP2385457A2 (en) | Virtual disk drive system and method |