JP2006120118A - グリッド・ベース・データ記憶システム用メタデータ - Google Patents

グリッド・ベース・データ記憶システム用メタデータ Download PDF

Info

Publication number
JP2006120118A
JP2006120118A JP2005137979A JP2005137979A JP2006120118A JP 2006120118 A JP2006120118 A JP 2006120118A JP 2005137979 A JP2005137979 A JP 2005137979A JP 2005137979 A JP2005137979 A JP 2005137979A JP 2006120118 A JP2006120118 A JP 2006120118A
Authority
JP
Japan
Prior art keywords
sheet
storage
metadata
data
allocation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005137979A
Other languages
English (en)
Inventor
Randy L Roberson
エル. ロバーソン ランディ
Clark Edward Lubbers
エドワード ルッベルス クラーク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seagate Technology LLC
Original Assignee
Seagate Technology LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seagate Technology LLC filed Critical Seagate Technology LLC
Publication of JP2006120118A publication Critical patent/JP2006120118A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2211/00Indexing scheme relating to details of data-processing equipment not covered by groups G06F3/00 - G06F13/00
    • G06F2211/10Indexing scheme relating to G06F11/10
    • G06F2211/1002Indexing scheme relating to G06F11/1076
    • G06F2211/1028Distributed, i.e. distributed RAID systems with parity

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】グリッド・ベース記憶容量を用いるデータ記憶システムのアーキテクチャと方法。
【解決手段】他の軸に沿った複数の記憶ストライプの行に対する軸に沿った複数の記憶領域を各グリッドが定義し、グリッドのグループであるシートが記憶容量を定義する。メタデータは記憶容量内のシートの割り当て状態を特徴とするメモリ・スペースに記憶された識別情報を含む。既存論理デバイスに割り当てが関連していれば割り当てテーブルにより、選択された記憶ユニットへメモリを割り当て、関連していなければ、シート割り当てデスクリプタとシート割り当てマップにより、選択された記憶ユニットへメモリを割り当てる。論理デバイス割り当てマップおよびドライブ組織テーブルにより選択された記憶ユニットへ(から)データを転送する。
【選択図】図6

Description

本発明の諸実施例は、一般にコンピュータ・システム記憶容量(storage capacity)に関し、特に、記憶容量若しくはストレージ・キャパシティ内に割り当てられるメモリの構成(configuration)を記述するメタデータ・アーキテクチャに関するが、これに限定されない。
コンピュータ・システムは入力装置、出力装置、1つまたはそれ以上の中央処理装置(CPU)および記憶容量若しくはストレージ・キャパシティを含む。この記憶容量は、半導体メモリ、ディスク・ドライブおよび光ドライブのような多くのデータ記憶装置の形を取る。オペレーティング・システムは、アプリケーション環境および諸ファイルが生成され修正されまたは削除される記憶容量を、割り当てまたは解除するファイル・システムを供給する。サーバなどのデータ記憶システムはまた、ネットワークまたは他の接続を通じてアクセスされる記憶容量を割り当てるためのファイル・システムを使用する。サーバおよび記憶アレイは、複数のデータ記憶装置を横切って記憶される情報を分配する独立ドライブの冗長アレイ若しくはレイド(redundant array of independent drive)(RAID)などのデータ記憶フォーマットを、サポートする。メモリへデータがマップされる方法を記述する情報を含むデータ構造は、メタデータ(metadata)と名付けられる。ファイルが生成され修正されまたは削除されるときメタデータが更新されて、記憶容量の割り当てまたは解除(時々集合的に「割り当て」と、呼ばれる)を反映する。
メタデータの構造は、記憶システムの性能に著しく影響する可能性がある。システムの記憶容量が増大するにつれて、このシステムを管理するために使用されるメタデータの量も増大する。メタデータを使用するデータ構造が大きくなるにつれて、この構造からの情報を解析し、これらの構造を更新するために必要な時間の量が著しいものになる。
本書に実施例を示し特許請求の範囲に後述するように、本発明の実施例は、一般にコンピュータ・システム構成情報を記述する装置と、関連の方法に向けられている。
本発明のいくつかの実施例は、グリッド・ベース(grid based)記憶容量を採用するデータ記憶システムのためのメタデータへ向けられており、他の軸に沿った複数の記憶ストライプの1つまたはそれ以上の行に対する1つの軸に沿った複数の記憶領域に関する記憶ユニットを各グリッドが定義し、また2つまたはそれ以上のグリッドのグリッド・グルーピングが、データ記憶容量の1シートを定義する。このメタデータは、記憶システム(storage system)内の諸シートの割り当て状態を特徴とするメモリ・スペース内に記憶された識別情報を含む。
本発明の他の諸実施例において、既存の論理デバイスに関連するかどうかを決定することを含むグリッド・ベース・データ記憶システムのためにメモリの割り当てる方法が供給される。この決定するステップが既存の論理デバイスに関連するならば、そのときは論理デバイス割り当てマップおよびシート割り当てテーブルがアクセスされて、選択された記憶ユニット(storage unit)が割り当てられる。さもなければ、シート割り当てデスクリプタおよびシート割り当てマップがアクセスされて、選択された記憶ユニットが割り当てられる。
本発明の他の諸実施例において、グリッド・ベース・データ記憶システムのためにデータを転送する方法が供給され、それは論理デバイス割り当てマップおよびドライブ組織テーブルにアクセスして、選択された記憶ユニットへデータを転送し、またはそこからデータを転送することを含む。
図1は、実施例の例示的なオペレーティング・システムを図示し、コンピュータ100A、または内部的または付加的なデータ記憶装置101を有するサーバ100B、またはインテリジェント記憶システム100Cにおいて、本発明を採用できる。インテリジェント記憶システム100Cは、インテリジェント・コントローラおよびインターフェイスを有し、また、1つまたはそれ以上のデータ記憶アレイを有し得る記憶システムを表現する。
オペレーティング・システム100は、それぞれ少なくとも1つの中央処理装置(CPU)、データ記憶容量を定義する複数のデータ記憶装置101およびデータ記憶容量の構成を記述するメタデータを含む。「構成(configuration)」の意味は、記憶容量の特定部分がデータを記憶するために使用されているかどうか、すなわちデータを記憶するのに利用可能な部分すなわち「割り当て可能な(allocatable)」スペースに対して、「割り当て済みの(allocated)」スペースであるかどうかの記述が供給されていることである。
本発明の種々な実施例と共に使用するのに適した他のオペレーティング・システムには、追加のデータ記憶装置101、追加のデータ記憶アレイ、追加のデータ記憶装置コントローラまたはネットワーク・インターフェイス・コントローラなど図1に図示されていないものが含まれる。たとえば本発明の諸実施例は、少なくとも2つのデータ記憶装置101および1つのコントローラを含むシステム100に使用できる。本発明の諸実施例は、故障許容冗長度(fault tolerance redundancy)が少ないかまたは全くない単純なシステムから、障害点が全くない高度に冗長なシステムに至るまで、採用できる。
本発明の好ましい実施例を有利に実行できる例示的な環境を図示するために、図2は大容量記憶装置を採用した広域通信ネットワーク(wide area network)(WAN)を特徴とするコンピュータ・ベースのシステム100Cを示す。
システム100Cは、それぞれホストA、B、およびCとして識別される複数のホストコンピュータ102を含む。ホスト・コンピュータ102は、生地、若しくはファブリック(fabric)106を介して、データ記憶アレイ104のペア(それぞれAおよびBと示されている)と互いに作用している。ファブリック106は、好ましくはファイバ・チャネル・ベースのスイッチング・ネットワークを特徴とするが、インターネットを含む他の構成も同様に使用できる。
各アレイ104は、一対のコントローラ108(A1、A2およびB1、B2で示す)および、好ましくはRAIDとして動作することを特徴とするディスクドライブであることを特徴とする一組のデータ記憶装置101を含む。コントローラ108およびデータ記憶装置101は好ましくはフォールト・トレラント配置を採用して、それにより種々のコントローラ108が並列の冗長リンクを採用するようになっており、また少なくともシステム100Cにより記憶されるユーザ・データのいくつかは、データ記憶装置101の少なくとも一組の中に、冗長フォーマットで記憶されている。
さらにAホスト・コンピュータ102およびAデータ記憶アレイ104が第1サイトに物理的に配置され、Bホスト・コンピュータ102およびB記憶アレイ104が第2サイトに物理的に配置され、Cホスト・コンピュータ102も第3サイトに配置されるように考えられるが、これらは単に例示的なものであって限定的なものではない。
図3は、コントローラ108の選択された1つを一層詳細に示す。コントローラ108を単一の集積回路に実施し、または希望により複数の離散回路の間に分散することができる。好ましくはプログラム可能で、コンピュータ・プロセッサであることを特徴とするメイン・プロセッサ112が、好ましくは非揮発性メモリ114(フラッシュ・メモリまたは類似のもの)およびダイナミック・ランダム・アクセス・メモリ(DRAM)116に記憶されたプログラミング・ステップおよび処理データに従って、制御を供給する。
ファブリック・インターフェイス(I/F)回路118が、ファブリック106を介して他のコントローラ108およびホスト・コンピュータと連絡し、またデバイスI/F回路120が記憶装置101と連絡する。I/F回路118、120およびパス・コントローラ122が、キャッシュ・メモリ124を使用するなどにより、記憶アレイ104とホスト102の間に命令とデータを通すために通信回路を形成する。通信経路122およびI/F回路118、120は離散的に図示されているが、単一に構築できることを理解すべきである。
所与のアレイ104内のデータ記憶装置101のエクステントにより定義されるアレイ104のデータ記憶容量は、アレイ104に書き込まれ読み出すことが可能な論理ユニット(logical unit)(「LUN」)へ組織される。システム構成情報が、それぞれの記憶位置により、関連のパリティおよびミラー・データを含むユーザ・データの間の関係を定義する。このシステム構成はさらに、ユーザ・データおよび論理ブロック・アドレス(logical block address)(LBA)などのメモリ記憶位置に対して割り当てられた記憶容量のブロックの間の関係を識別する。システム構成は、さらに論理ブロック・アドレスへマップされたバーチャル・ブロック・アドレスを定義することによる、仮想化を含むことができる。
新しいファイルを保存したり既存ファイルを拡張するときなど、または既存ファイルのサイズを削減するときなど記憶容量を解除した後に、システム構成情報が変更される。システム・メタデータは、ファイル割り当て情報および割り当て情報をサポートする他のデータ構造を定義する。
図4は、記憶マップ130に関する概略の図式的表現であって、データ記憶装置101(図1)に含まれる記憶容量の一部分を示す。以下の説明において「ストライプ(stripe)」は総称的な意味に使用され、RAID審議会(RAID Advisory Board)(RAB)により定義されたRAIDストライプにのみ関するものではない。記憶マップ130は、ストライプ132(時には本書では、「サブ・パーティション」132と呼ばれる)を図示し、ストライプ132は各々記憶容量の所定部分を含む。ストライプ132内の記憶容量の大きさは、システムの記憶アプリケーションのタイプを反映できる。各ストライプ132はLBAで開始する。説明のために、ストライプ1はLBA134で始まり、ストライプ2はLBA136で始まり、ストライプ3はLBA138で始まる。複数の他のストライプ132を、LBA140で始まるストライプNまで定義することができる。好ましくは1つのストライプ132の終了が次のストライプ132に直接に隣接して、これにより隣接するストライプ132の間に、使用されない記憶容量がないようにする。
図5は、システム100Cのためのグリッド150ベースの記憶容量アレンジメント若しくは配置を図示する。グリッド150内の各カラム(column)は、1つのデータ記憶装置101または記憶領域(storage domain)に対応し、またグリッド150の各行(ROW)は複数のストライプ132に対応し、各データ記憶装置ドライブ101内に1つのストライプ132がある。一行の中のストライプ132は、同一または異なったLBAで開始できる。
スペアの容量が、データ記憶装置101パーティションのサブ・パーティションを横切って配置される。従って、ストライプ132はデータを記憶するために割り当てられるし、またはスペアでもあり得る。データを含むストライプ132は、ユーザ情報、ミラー・データ、またはパリティ・データなどの事柄を記憶する。スペア・ストライプ132は、特定のデータ記憶装置101上にのみ存在するように構成でき、または所定の方法で一部または全てのデータ記憶装置101を横切って分配することができる。スペア・ストライプ132の指定は、1つのグリッドから次のグリッドへと変化し得る。一群の連続したグリッド150はシートと名付けられ、しばしばグリッド・グループと呼ばれる。サブ・パーティションはシートと並んでいて、「シート・セル」(「scell」)と名付けられる。グリッド150を形成するために採用されたデータ記憶装置101は、ブック(book)と名付けられる。
図6は、シート・バージョン162、164、166、168および170を有するシート組織(sheet organization)テーブル160を図示し、これらのシートが採用するグリッド150が、10個のデータ記憶装置101(連続的にA、C、E、G、I、B、D、F、HおよびJと示される)およびデータ記憶装置101全体にわたり配分された2つのデータ記憶装置101のスペア容量を有することを図示する。シート組織テーブル160はシート組織バージョン172を定義し、どのデータ記憶装置101がスペアである(文字「s」で示す)かを示し、また、どのデータ記憶装置101がデータを含む(文字「d」で示される)かを図示する。注意すべきは、好ましくはデータ・セルとスペア・セルの配置が、異なったシート・バージョンごとに変ることである。これにより、データ・ストライプ132およびスペア・ストライプ132がブック内の全てのデータ記憶装置101を横切って配分されることができ、それによりマルチスレッドの環境において全てのデータ記憶装置101に同時的にアクセスすることができる。そうしたスペアリング配置は、全てのスペア・ストライプ132が全てのデータ記憶装置101よりも少ないものの中に含まれるシステム100よりも、高い性能を提供する。
バージョン172の各々について、2つまたはそれ以上の記憶装置101がスペア容量を供給する例示的な実施例において、データ記憶装置101はグループおよびペアに構成される。たとえば表160において、ドライブA&B、C&D、E&F、G&HおよびH&Jはペアを構成し、ペア内に含まれるデータ・ストライプ132が、各シート・バージョン172についてスペアまたはデータの同一の宛て先を有するように、スペアリングを配分できる。データ記憶装置101もまたグループに組織できる。たとえば表160において、第1グループ174はドライブA、C、E、GおよびIを含み、第2グループ176はドライブB、D、F、HおよびJを含む。RAID1データ・フォーマットについてペアリングを採用することにより、ペアの1つのメンバがユーザ・データ(一次データ)を含み、ペアのもう1つのメンバがミラー・データ(二次データ)の形で同一データを含み、またはその逆にすることができる。RAID5データ・フォーマットについてもグルーピングを採用でき、それによりユーザ・データは1つのグループ174、176に含まれ、パリティ・データが他のグループ176、174に記憶されるようにできる。そのようにして、障害許容データ記憶フォーマットを構成するときに、データ記憶装置101内のペアリングとグルーピングが有利に採用される。図6のペアリングとグルーピングは例示的なものであって、どのデータ記憶装置101がペアまたはグループを形成するかについては何の制限もなく、所与のデータ記憶装置101(そこの全てのパーティション)が常に1つのみの特定の他のデータ記憶装置101とペアになって、最大フォールト・トレランスを形成する。
あるデータ記憶装置101が失敗すれば、作用中のデータ記憶装置101からのデータはコピーされまたは再構成されて、シート組織テーブル160により規定された通りに、スペア・ストライプ132へ書き込まれる。図6の例示的な実施例において、シート組織テーブル160は循環テーブルであって、一組のスペア・バージョン(ドライブ組織)172を通じて、繰り返し循環する。たとえば6番目のシート(図示なし)が第1シートとして同一シート・バージョン162により参照されるが、しかし異なったスペア・バージョン172(ドライブ組織)により参照されるかも知れない。異なった番号のバージョン172、データ記憶装置101およびスペア構成をサポートするために、シート組織テーブル160が修正され得る。
グリット150(図5)へシート組織テーブル160を適用すると、スペア・ストライプ132として設計された指定サブ・パーティション内のストライプ132の第1セット、およびユーザ・データ、ミラー・データまたはパリティ・データを記憶できるサブ・パーティション内のストライプ132の第2セットが供給される。シート組織テーブル160(SV1 162)およびグリッド150のこの組み合わせは、割り当て可能な記憶グリッドであって、ときには本書で「記憶ユニット」(SU)180と呼ぶものを、図7に図示するように定義する。各長方形はデータ・ストライプ132を表現し、各長方形内の文字は関連データ記憶装置101を指示する。SU180は、8個のデータ記憶装置101にまたがる8つの行を含む。たとえば128KBのサイズのストライプ132が規定されれば、SU180は8MBの記憶容量を供給する。あるブック内のそうしたSU180は一連番号を付けられるか、さもなければ各々1つの番号または独自の識別子を割り当てられる。
前記のように、複数のグリッド150を1つのシート内に組織できる。シートは典型的にただ1つの記憶フォーマットに構成されるが、RAIDレベル変換のようなあるオペレーションの最中には、1つよりも多い記憶フォーマットが1つのシート内に存在し得る。
図8はSU180に類似した記憶ユニット(storage unit)(SU)185を図示するが、しかし全てのストライプ132がユーザ・データを含んでおり、これらはData A−1、Data A−2、Data A−3、Data A−4、Data B−1などで、Data P−4までを示す。他のSU180内に記憶されたパリティ・データまたはミラー・データなどの冗長情報を通じて、SU185内に記憶されるデータにフォールト・トレランスが供給される。1つまたはそれ以上の他のSU180内に収納されたフォールト・トレランス情報に関連するSU185は、「高信頼記憶ユニット」(RSU)と名付けられる。本明細書と添付特許請求の範囲のために、用語「SU」は、関連のフォールト・トレランス情報付きまたはなしの、あらかじめ選択されたユーザ・データ記憶容量を意図している。すなわち用語「SU」は関連のフォールト・トレランス情報なしのユーザ・データを含むSU185を意味し、また用語「SU」は均等の代替実施例において1つのRSUを意味し得る。
図9は、図8のSU185の例示的なRAID1ミラー・データ・グリッド190を図示する。SU185の左側からのデータが、ミラー・データ・グリッド190の右側にミラーされRAID1のペアを生成する。つまりSU185内の各ストライプ132について、ミラー・データ・グリッド190内に対応する1つのストライプ132がある。たとえばミラー・データ・グリッド190内のストライプA−1は、SU185内にストライプA−1に関してミラーされる。注意すべきは、データ・フォールト・トレランスの要求に応じて、異なったデータ記憶装置101内にミラー・データが記憶されることである。
図10は、1つのSU185およびカラム(column)と行(row)のパリティ値204、206を計算し配置する方法を示す。SU185は、図8のそれと同様に、文字インデックスと数字インデックスによりラベルされたSU185内の各ストライプ132を有する。文字インデックスは、行パリティ・ストライプ206を発生するために使用されるRAID5のための、行パリティ・ストライプ・セットを規定する。たとえば、ユーザ・データ・ストライプA−1、A−2、A−3およびA−4はXORされて(論理的に排他的ORされて)、行パリティ値206内にストライプ「AP」を生成する。数字インデックスは、RAID6データ記憶フォーマットのために対角パリティ(diagonal parity)を発生するために使用される、カラム・パリティ・ストライプ・セットを規制する。たとえばユーザ・データ・ストライプA−1、B−1、C−1およびD−1はXORされて、カラム・パリティ値204内に「1P」を生成する。SU185の8個の行とカラムは、2行の行パリティ・データ206および2行のカラム・パリティ・データ204を発生するために、使用される。最適性能のために、フォールト・トレランス情報はSU185内に含まれず、むしろ1つまたはそれ以上の他のSU180内に含まれる。好ましくはRAIDフォーマット変形を容易にするために、パリティ値204、206が2つの異なったSU180内に含まれている。
図11はシート212、214、216、218および220のグリッドの利用チャートを図示し、各シートはSU185およびグリッド180からなる全部で30個のグリッドを採用し、それぞれRAID 0、RAID 1x2、RAID 1x3、RAID 5およびRAID 6により構成されている。RAID 0(212)について、シートは30個のSU185を含み、これらはData 1−30とラベルされている。RAID 1x2(214)について15個のSU185が、データ1−15とラベルされたユーザ・データを含み、15個のグリッド180が、MData 1−15とラベルされたミラー・データを含む。RAID 1x3(216)について、10個のSU185がData 1−10とラベルされたユーザ・データを含み、10個のグリッド180がMdata 1−10とラベルされたミラー・データを含み、10個のグリッド180がMdata 1’−10’とラベルされた代替ミラー・データを含む。代替ミラー・データは、ミラー・データと異なったグリッド利用チャート210内のストライプの順序付けを採用するが、一方ユーザ・データ、ミラー・データおよび代替ミラーデータを、異なったデータ記憶装置101内に記憶されている通りに維持する。RAID 5(218)について、24個のSU185がData 1−4とラベルされたユーザ・データを含み、6個のグリッド180がRP1−4ないしRP21−24とラベルされた行パリティを含む。RAID 6(220)について、20個のSU180がData1−20とラベルされたユーザ・データを含み、5個のグリッド180がRP1−4ないしRP17−20とラベルされた行パリティを含み、5個のグリッド180がCP1−4ないしCP17−20とラベルされたカラム・パリティを含む。
これらの構成は「パック・パリティ(packed parity)」フォーマットを例示し、そこでユーザ・データがシートの一部分に排他的に記憶され、またミラーまたは(あるとすれば)パリティ・チェックがそのシートの他の部分に排他的に記憶される。これは連続的な読取性能を増大させる。シートあたり30個のSU185またはグリッド180の組み合わせ全体配置(combined total arrangement)を有する図11の例示的な構成について、異なったRAIDレベルは異なった数のSU185の結果を生じる。
図12は、本発明の実施例により記憶容量をマップするために良く適合したグリッド・ベース・アーキテクチャの略図的なブロック図である。図12に示したのは、番号を付けられた複数のシートのマップ230、それらシート232の中の1つ、およびグリッド180である。前述のように、グリッド180はSU185として働き、すなわちミラー・データまたはパリティ・データを収納できる。
ふたたび用語「メタデータ」は、データの効率的な管理と操作のために記憶容量の現在の配置を記述するのに有用なシステム100の構成を記述するのに使用される。メタデータはディスク上および/またはディスクでないメモリ、たとえばキャッシュ・メモリに記憶できる。ディスク上に記憶されるメタデータの部分は、非ディスク・メモリ内にも記憶できる。メタデータは、さらに論理ディスクなどの論理デバイスと組み合わせることができる。
図13は、本発明の実施例によるメタデータを図示する。シート割り当てマップ(sheet allocation map)(SAM)240は、ブック内の各シートについて1ビットを有するビット・アレイである。SAM240内のビットは、対応するシートが割り当て済みであれば第1の値へセットされ、対応するシートが割り当て可能であれば第2の値へセットされる。従ってSAM240は、割り当て可能なシートを識別するために使用できる。SAM240は、ゾーンごとのシートのあらかじめ選択された数により、複数のゾーン242、244、246および248へ組織されて示されている。つまり図13の例示的な実施例において、シート212、214は、ゾーン1(242)内にあり、シート216はゾーン2(244)内にあり、シート218、220はゾーン3(246)内にある。
このメタデータは、さらにシート割り当てデスクリプタ(sheet allocation descriptor)(SAD)260を含み、これはSAM240の状態について要約情報を供給する。SAD260は、シート262の全数、番号割り当て可能シート264およびSAM240のゾーン内の割り当て可能シートの数を含むアレイを含む。たとえばSAD260のゾーン1割り当て可能シート266は、SAM240のゾーン1(242)内の割り当て可能シートの数を含む。本発明のいくつかの実施例は、各ブックについて1つのSAM240およびSAD260を採用する。本発明の代わりの実施例は、複数のブックについて単一のSAM240を採用し、または各SAM240が単数または複数のブックの一部分をカバーすることにより、複数のSAM240を含むことができる。SAD260は割り当て可能なシートを有し、または割り当て可能なシートのあらかじめ決定された数を有することにより、記憶領域の識別を単純化する。
前に議論したように、シートを論理デバイス(logical device)(LD)へ割り当てることができる。図14は、本発明のメタデータを論理デバイス割り当てマップ(logical device allocation map)(LDAM)280の形式でさらに図示し、これはポインタ・ペアのアレイ282を有する。第1ポインタがSUデスクリプタ・アレイ284を指定し、第2ポインタがRビット・アレイ(R−bit Array)(RBA)286を指定する。入力288は、SUデスクリプタ290、拡張SUデスクリプタ292およびXビット294を含む。Xビット294は、SU185の一部分が書き込み済みであるかどうかを指示するために使用できる。SUデスクリプタ290は、SU番号298を含むフィールド296、RAIDレベル300、ブックID 302、ドライブ組織304、Dビット306および予備ビット308を含む。
SU番号298およびブックID 302は、記憶容量内の特定のSU185を定義する。特定のSU185を含むシートのシート・バージョン172(図6)は、シート内のグリッドの数により(図11の例における30などにより)SU番号298を割り算して、それからその結果をシート組織バージョン(図6の例では、5)で割り算して、その剰余がシート・バージョンであることにより定義される。Dビット306が、メディアの有効性を指示するために使用される。大容量データ記憶装置101のために必要な場合は、拡張SUデスクリプタ292が追加SU185番号ビットを供給する。各RBA入力287は、SU185のサブ・セットのための状態情報を指示するために使用されるRビットを含む。これらのRビットは、たとえば、データ・カレンシー(data currency)を指示するために使用される。
シートおよびSU185をLDへ割り当てることを通じて、ストライプ132の論理ブロック・アドレス(logical block address)(LBA)は、各LD内に仮想ブロック・アドレス(virtual block address)(VBA)として仮想化される。言い換えれば、SUデスクリプタ290(および適用可能な所では拡張SUデスクリプタ292)は、所与のLDへ割り当てできる記憶域の最少ユニットをマップする。SU185内のブロックのLBAは、さらに後述するようにSU番号298を通じて一部決定される。図14に図示されたLDAM280構造は、好ましくはLDまたは他の階層構造によりインデックスされるが、これは特定LDについてSUデスクリプタ・アレイ284およびRBA286またはその一部分にアクセスするためである。これによりSU185の最少番号からSU185の大きな番号までにわたるLDを割り当てるときに、メモリ使用効率の柔軟性が提供される。代わりに本発明のある実施例では、「フラット」構造を採用しそこでは各LDについてのSUデスクリプタ284およびRBA286は、単一のアレイ内に連続的に記憶される。
図15は、リンク・データ320、322を含む例示的なリンク・リステッド(link listed)LDAM280’構造を図示し、リンク・データ320、322は、SUデスクリプタ・アレイ284’およびRBA286’のリンケージを供給する。
図16は、さらにLDにより索引付け(インデックス)可能なアレイ332を供給するSU割り当てデスクリプタ・アレイ330の形式における本実施例のメタデータを図示する。各SU割り当てデスクリプタ入力334は、LDへ割り当てられたシート336の総数、LDへ割り当てられたSU185の総数、オールド・シート・ポインタ340、ニュー・シート・ポインタ342および予備ビット344を含む。オールド・シート・ポインタ340およびニュー・シート・ポインタ342は、追加記憶容量が利用可能な時に追加ブックを横切って、LDを再マップするために使用できる。この割り当て処理は複数ブック割り当てを採用することができ、その場合あるLDへ割り当てられる第1シートは、第1ブックからであり、そのLDへ割り当てられる第2シートは第2ブックからであり、以下同様である。あるLDの第1割り当てシートのための開始ブックは、LD番号モジューロ・ブックの数(LD number modulo the number of books)により決定される。
図17は、さらに記憶容量内のほぼ全てのシートにデータの索引付け可能なアレイ362であるシート割り当てテーブル(sheet allocation table)(SHAT)360の形式における本発明の実施例のメタデータを図示する。SHAT入力(エントリ)364は、それぞれのシートが割り当てられるLD番号366、シートのRAIDレベル368、シート内のどちらのSU185が論理デバイスへ割り当てられるかを示し、またどちらのSU185が割り当て可能であるかを示すビットを有するSUマップ370を含んでなり、予備ビット372を含み得る。RAIDレベル368は、1つのRAIDレベルからもう1つのRAIDレベルへの変換が進行中であることを示す値を含み得る。SHAT360は、LDマップが具体化された時にメモリ内に設立される。SHAT360は、SU185が1つのLDへ割り当てられ(アロケート)、またはそこから解除(デ・アロケート)される時に更新される。SHAT360は、LDへの割り当て要求への応答において、特定のLD内に充分な幾つかの割り当て可能SU185が存在するかどうかを決定するのに有効な資源として役立つ。SHAT360は、さらに多重(マルチプライ)割り当て(割り当てミス)されたシートおよびマップ具体化の最中のSU185の可能性についてのメタデータのチェックとして役立ち、シート及びSU185の割り当ておよび解除中に特別なクロス・チェックを供給できる。SHAT360は、また、オペレーション類似のRAIDレベル変換およびまばらな(sparse)解除の結果として残された、LD内の部分的に割り当てられたシートの単純な(ストレートフォワード)がらくた状の(ガーベージ)コレクションのための計算を供給できる。
図18は、さらにカレント・アレイ・テーブル(current array table)(CAT)入力384のインデックス可能アレイ382を供給するドライブ組織テーブル(drive organization table)(DOT)380の形式における本発明の実施例のメタデータを図示する。DOT380内のCAT384の数は、ブックの数、ドライブ組織304(図14)の数およびシート・バージョン172(図6)の数を反映する。各CAT384は、シートへストライプ132を供給するデータ記憶デバイス101の順序付きセットを規定する。図10のSU185から連想できるように、図18の例示的な実施例において、CAT入力384により規定された8個のデータ記憶装置101がある。各入力384は、ドライブ・ステータス386、オフセット・インデックス388およびドライブID390を含む。
ドライブ・ステータス386はドライブ・コンデション情報を含み、これにはリポーティング技術(SMART)からの情報が含まれる。SMARTは、故障警告についての業界で採用された標準仕様である。SMARTは、ビット読み取りエラーおよびトラック・シーク・エラーなどの多過ぎる内部データ記憶装置101のエラーを監視することに基づいている。SMARTは、データ記憶装置101マイクロ・プロセッサ内で走る故障警告アルゴリズムを採用して、エラー率が閾値を越えるかどうかをチェックし、そうした状態が存在すればデータ記憶装置インターフェイス120上でホスト102へ警告を送る。
オフセット・インデックス388をLBAオフセット・テーブルに付加して、データ記憶装置101の領域をスキップしたり、アクセスされる領域をオフセットしたりできる。オフセット・インデックス388は、テーブルにアクセスして、特定のデータ記憶装置101上のパーティションの開始LBAを獲得する。そのパーティションは、所与のデータ記憶装置101からそれぞれのブックへのデータ・キャパシティのコントリビューション全体である。ブックは、連続するLBAのパーティションから形成される。前記のように、DOT382内のCAT384の数はブックの数、ドライブ組織304の数およびシート・バージョン172の数を反映する。データ記憶装置101が故障すれば除去され、さもなければ仕事から外され、スペア・ストライプ132を含むと指定されたスペアのデータ記憶装置101によって、機能的にとって変わられる。下記の表2は、図6のシート・バージョン5(SV5)に対応するCAT入力(エントリ)384を指示する。ドライブ・ステータス386は0の値として示され、問題がないことを示すが、ドライブ・ステータス386の他の値および表現を使用することができる。ドライブID390は、図6のデータ記憶装置101表記に対応する文字の値として示される。
下記の表3は、データ記憶装置「E」が故障した後に除去されたか、さもなければ作業をやめているシート・バージョン5についてのCAT384を示す。図6から認められることは、ドライブAおよびBがシート・バージョン5(SV5)のために、スペアとして働くことである。スペアは、ドライブAが選択されてドライブEに置き換わるように、グループ174、176に関して選択される。
CAT384は、1つの異なったドライブ組織であって、SU185が再配置済みになって、新組織に一致した後にSUデスクリプタ290から参照される。変更に先立って、SUデスクリプタ290は、失敗したドライブが失われたことを示すために修正されたCAT384を参照する。変更の後にSUデスクリプタが修正されて、この新しいCAT384を参照する。
表3に示すCAT384は、たとえばCAT10などDOT380内の他の索引付け可能な入力382として記憶され得る。ドライブEはまた、3つの他のシート・バージョン172に影響するので、SV1、SV2およびSV4内にスペアがあることを反映するために追加のCAT384が生成される。ドライブEを採用するSU185内のデータはコピーされ再構成されて、図4のシート・バージョン172に指定されるスペアのデータ記憶装置へ記憶され得る。データをコピーし再構成するのに先立って、ドライブ組織304はスペアがある以前のCAT385を規定することができる。コピーまたは再構成の後に、ドライブ組織304は、スペアがある後のCAT384を規定することができる。データ記憶装置101故障後のSU185の配置は、新しいドライブ組織304を採用する。ドライブ組織304は、故障または除去されたデータ記憶装置101の下記の置き換えを更新することができる。DOT380のためのCAT384値は、表4に示すように図4のシート組織表160について図示できる。
番号0−9は、各シート・バージョン172のためにストライプ132を供給するデータ記憶装置101の順序を表現し、第1グループ174を表現する4つの番号、第2グループ176を表現する4つの番号およびスペア・データ記憶装置101を指示する2つの番号としてリストされる。表4の中のドライブ組織2(Drive Org 2)は、データ記憶装置3が故障した場合に実施できるドライブ組織304を表現する。シート・バージョン1において、ドライブ組織2、データ記憶装置4は、グループ1内のデータ記憶装置3に取って代わり、データ記憶装置3は、故障(またはアクセス不可能)を指示するために打ち消し線で示されている。さらに、シート・バージョン1において、ドライブ組織3、データ記憶装置9は、故障したデータ記憶装置4に置き換わる。表4は、さらにSV2、SV3およびSV4のための種々のドライブ再組織方式を図示し、そこで同一のデータ記憶装置101が含まれる。
前記のように、図6および上記の諸表に図示した文字はブック内のデータ記憶装置101の分担を指示する。ブックID302およびCAT384からの関連のドライブ位置が組み合わされて、他の表にアクセスするために使用されるメンバ記憶域プール順序タグ(member storage pool ordinal tag)(MSPOT)を形成し、それは物理ドライブ・アドレスを得るためのファイバ・チャネル裁定若しくは調停ループ物理アドレス(arbitrated loop physical address)(ALPA)のようなものである。ある実施例においては、MSPOTはブック内のデータ記憶装置101の最大数に等しいかまたはそれ以上の数(たとえば10個のデータ記憶装置101システムにおいて16のように)によりブックID302を乗算して、それからシステム・テーブル内に1つのインデックスを生成するために、SU185へ記憶容量を供給するデータ記憶装置のメンバ・インデックスを規定するCAT384の値を加えることにより、生成される。使用されるデータ記憶装置101のタイプによって、テーブルはSCSI ID、ファイバ・チャネルID、または、データ記憶装置101を物理的にアドレスするための、いずれか他のアドレスまたはIDを含むように構成することができる。代わりに、前記のようにCAT384内のドライブ文字は、たとえばALPAまたはSCSI IDなどのドライブID390に対応することができ、それにより、MSPOTテーブルおよびMSPOT/物理ドライブ・アドレス・テーブルは、使用されないようにされる。
上記に例示したように、本発明の諸実施例はデータ記憶装置101の除去、故障または追加を容易に受け入れることができるメタデータ構造を提供する。その上、SUデスクリプタ入力290内に規定されたドライブ組織304は、SU185の管理を簡単にする。たとえば、たとえデータ記憶装置101が除去され、故障し、さもなければサービスを止めたとしても、第2のドライブ組織304を定義することができる。データ記憶装置101故障の後に新しいSU185があるLDへ割り当てられれば、次に続くドライブ組織304がSUデスクリプタ290内に規定される。前もって割り当てられたSU185についてデータが再構成でき、ドライブ組織304は第1の値から第2の値へ変更される。そういうわけで、ドライブ組織304はどちらの既存SU185が再構成済みであることの指示を供給し、また、後続のデータ記憶装置101の除去または故障を継続するための割り当てを可能にする。言い換えれば、本発明のドライブ組織304の実施例は、単一の高レベル構造を通じて種々の故障順列を可能にする。
図19は、本発明の実施例による記憶容量割り当て方法400を実行するステップを図示する。方法400は、記憶容量の割り当てについてシステム100Cからの割り当て要求402により開始する。好ましくは、割り当て要求402は、LD番号、RAIDレベルおよび記憶容量に関連する。記憶容量は、SU185の番号へ変換できる。割り当てるべきシートの数は、割り当て要求内のSU185の数を、規定されたRAIDレベルについてシートごとのSU185の数により、割り算することにより決定できる。
決定ブロック404は、割り当て要求402のLDが既存LDに関連するかどうかを決定する。ブロック404の決定がノーであれば、そのときはこのブックのためにSAD260がアクセスされたブロックへ制御が通過して、割り当て可能なシートを含む記憶容量が識別される。ブロック408において、SAM204がアクセスされて、1つまたはそれ以上の個別シートが選択される。
それから制御はブロック410へ通過して、そこでシートがLDへ割り当てられる。新しいLDへ割り当てられる最初のシートのためのブックは、LD番号から決定できる。たとえば、このブックは、LD番号モジューロ・ブック番号として計算される。複数のシートが割り当てられた場合は、ラウンド・ロビン(round−robin)または循環テーブル(circular table)法のように、種々のブックの間からシートを選択できる。新しく割り当てられたSU185のためのドライブ組織304は、その特定のブックのために最近に定義されたものである。ドライブ組織304、ブックID302、RAIDレベル300およびSU番号298は、SUデスクリプタ入力288として記憶される。ブック内のデータ記憶装置101が大容量であれば、追加SU185番号ビットは、拡張SUデスクリプタ入力292として記憶できる。SUデスクリプタ・アレイ入力284は、それからフラット・アレイ配列のためのLDに対応するオフセットにおいてか、またはインデック付きアレイ配列のためにLDAM280内にインデックスがそれから記憶されるもう1つの位置において、LDAM280内に記憶される。
ブロック412でSU185が、LDへ割り当てられ、ブロック414でSAD260およびSAM240が、更新されて割り当て要求402の完了を反映する。
決定ブロック404の決定がイエスであれば、そのときは制御がブロック418へ渡されそこで割り当て要求402に関連するLDに割り当てられた最後のSU185を問い合わせるためにSAD330がアクセスされると共に、SU185が常駐するそれぞれのシート番号も問い合わせられる。それから、制御はブロック420へ渡され、そこでSUアレイ・デスクリプタ330のニューシート342内のSUマップ370を問い合わせるためにシート番号が使用される。それから、制御は決定ブロック424へ渡され、そこで割り当て要求402を満足させるのに充分な数のSU185がLDへ割り当てられたシート内にあるかどうかが決定される。決定ブロック404の決定がノーであれば、そのときはあらゆる割り当て可能なSUがブロック426でLDへ割り当てられ、割り当て要求402は、ブロック428で調節されて、ブロック426でLDへ割り当てられた割り当て可能なSU185の数を反映し、それから制御はブロック406へ通過する。処理はそれから上記のように継続する。決定ブロック424の決定がイエスであれば、そのときはSU185はブロック412内のLDに割り当てられ、ブロック414でSHAT360が更新される。
割り当てられたSU185の数が1枚のシート内に割り当て可能なSU185の数を超える場合は、同一ブックまたは別のブックから追加のシートが割り当てられる。(既存LDへ、SU185が割り当てられて)LDが拡張された時は、SUアレイ・デスクリプタ330がアクセスされて、既に割り当てられたシート内に充分な割り当て可能なSU185が存在するかどうか、または新しいシートを割り当てなければならないかが決定される。追加の幾つかのシートを含むブックは、LD番号およびそのLDへ既に割り当てられたシートの数によって、SUアレイ・デスクリプタ330により指示される通りに決定される。SU185をLDへ割り当てることを通じて、各LD内のVBAと同様にストライプ132のLBAが仮想化される。LDおよびVBAを参照して、それからデータを記憶したり、または記憶されたデータを読み取ることができる。
図20は、本発明の実施例によりデータの転送方法450を実行するステップを示す。方法450は、記憶容量へデータを記憶しまたはそこからデータを読み取るために、メタデータ・アーキテクチャを使用する。方法450は、ブロック452の入出力(I/O)要求により開始し、これは1つのLD、少なくとも1つのVBAおよびデータ読み取りまたは書き込み動作などのI/O動作を規定する。
それから制御はブロック454へ行き、そこでデータ転送要求452に関連するLDへ割り当てられた入力288のために、SUデスクリプタ・アレイ284を索引付けするのに、LDAM280がアクセスされる。それからSUデスクリプタ290を決定するために、入力288がVBAに関して解析されるが、SUデスクリプタ290は、他の情報と共にドライブ組織304、ブックID302およびSU番号298を含むフィールド296を識別する。上記から想起されるのは、所望のSU185を含むシートのシート・バージョン172(図6)が、SU番号298をシート内のSU185の数で割り、(図11の例では30により)それからその結果をシート組織バージョンの数(図6の例では5)で割り、その剰余がシート・バージョンであることにより決定されることである。
それから制御は456へ行き、そこで所望のSU185に関連するCAT384を決定するために、ドライブ組織304、ブックID302およびシート・バージョン172により索引付け可能なアレイ382を解析するために、DOT380がアクセスされる。ブックID302と選択されたCAT384から得られる相対メンバ位置が組み合わされて、MSPOTを形成する。前述のように、個別のドライブ・アドレスを得るために、MSPOTをMSPOT/ALPAテーブルまたは類似の構造へ付加することができる。ドライブ・アドレスを指示するためにSU番号298を直接に使用できるし、または、それをスケールしマスクしオフセットおよび他のように調節して、データLBAを生成することができる。データLBAは、また、CAT384のオフセット・インデックス388により、規定されるオフセットにより修飾することができる。追加的に、オフセット・インデックス388をオフセット・テーブルへ付加して各データ記憶装置101のための特定のオフセット値を得ることができる。代わりに、DOT380、CAT384、MSPOTおよびMSPOT/ALPAアレイを組み合わせる単一のテーブルを採用することができる。最後に、ブロック458においてデータ転送コマンドが実行される。
本発明の実施例のディスク・ベースのメタデータは、ユーザ・データのそれに似た方法でシートおよびSU185を割り当てられる。ディスク・ベース、メタデータを記憶するために、たとえば、RAID−1x3のような高信頼データ記憶フォーマットを使用できる。
図13ないし図18の例示的な実施例は、グリッド・ベース記憶システム100Cを管理するためにデータ記憶装置101に記憶されるメタデータ構造を図示する。メタデータに基づく記憶装置101に加えて、メモリ好ましくは非揮発性メモリ内にメタデータ構造を実施して記憶システム100Cを管理することができる。
これまでの説明から注意すべきは、本発明の割り当て/アクセス・メタデータ構造は、ユーザ・データ・グリッド202のみを取り扱い、ミラーまたはパリティ・データ・グリッド204、206の処理に煩わされないことである。つまり、ユーザ・データ・グリッド202の割り当ては、関連するミラーまたはパリティ・データ・グリッド204、206の割り当てに対して暗示的に原因になる。これは、能率の増大と性能の向上を提供する。ミラーまたはパリティ・データの処理は、割り当ておよびアクセス処理に対してトランスペアレントな方法により遂行でき、コンピュータ・プログラム・コード、テーブルまたはデータおよびパリティ・マッピングを反映する他の構造を採用できる。
本書に記述した種々の構造は本発明の実施例内で組み合わせることができる。たとえばLDMA280のSUデスクリプタ・アレイ入力288およびRbit入力288は、別々のアレイとして実施でき、単一アレイとして実施でき、または、各SU185について組み合わせおよび索引付けし、またはリンクすることができる。さらなる例として、SU割り当てデスクリプタ入力334をLDAM280のポインタ・ペア282の一部分として実施でき、各LDへ索引付けすることができる。他のデータ構造を、本発明の実施例内で同様に組み合わせることができる。
本発明の実施例のこれまでの説明は、例示と説明のために提供されてきた。それは、網羅的であることや本発明の実施例を開示された通りの形式に限定することを意図するものではなく、上記の教示に照らして他の修正や変形が可能である。メタデータ・アーキテクチャの例示的な組み合わせと使用は、必要な機能性を提供し、これにより本発明の実施例の範囲を当業者が理解するために、全ての可能な配置のエミュレーションが必要でないようにしてある。選択され説明された実施例は本発明の諸原則を説明し、その実際的な応用により当業者が種々の実施例と考えられる特定の使用に適した種々の修正において、本発明を使用することを可能にする。添付の特許請求の範囲は、本発明の他の代わりの実施例を含むことを含むものと考えられる。
本発明の種々の実施例が採用できる例示的なオペレーティング・システムの略図である。 大容量記憶装置を使用した広域通信ネットワークを特徴とするコンピュータに基づくシステムの最上位レベルの機能ブロック図である。 図2のコントローラの選択された1つを例示する機能的なブロック図を供給する。 データ記憶装置メモリの略図である。 グリッド・ベース・データ記憶容量の略図である。 グリッド内に10個のドライブを使用するデータ記憶シートのシート組織テーブルの略図である。 データ容量グリッドの略図である。 ユーザ・データ・グリッドの略図である。 図8のユーザ・データ・グリッドのためのRAID1ミラー・データ・グリッドの略図である。 RAID5レベルおよびRAID6レベルに適合した、ユーザ/パリティ・グリッドの略図である。 種々のRAIDレベルのためのグリッド使用の略図である。 データ・シート容量階層の略図である。 シート割り当てマップおよびシート割り当て記述子若しくはデスクリプタの略図である。 論理デバイス割り当てマップの略図である。 リンク・リステッド論理デバイス割り当てマップの略図である。 高信頼記憶ユニット割り当てデスクリプタ・アレイの略図である。 シート割り当てテーブルの略図である。 ドライブ組織テーブルの略図である。 本発明の実施例による記憶容量割り当てのためのステップを図示する処理フローチャートである。 本発明の実施例によるデータ転送のためのステップを図示する処理フロー・チャートである。
符号の説明
100 オペレーティング・システム
101 データ記憶装置
102 ホスト・コンピュータ
104 データ記憶アレイ
106 ファブリック
108 コントローラ
112 メイン・プロセッサ
114 非揮発性メモリ
116 ダイナミック・ランダム・アクセス・メモリ
118 ファブリック・インターフェイス回路
120 インターフェイス回路
122 パス・コントローラ
124 キャッシュ・メモリ
130 記憶マップ
132 ストライプ
150 グリッド
160 シート組織テーブル
162,164,166,168 シート・バージョン
174,176 グループ
180 記憶ユニット
185 記憶ユニット
190 ミラー・データ・グリッド
204,206 パリティ値
212,214,216,218 シート
230 マップ
240 シート割り当てマップ
260 シート割り当てデスクリプタ
280 論理デバイス割り当てマップ
290 記憶ユニット・デスクリプタ
300 RAIDレベル
302 ブックID
304 ドライブ組織
320,322 リンク・データ
330 記憶ユニット割り当てデスクリプタ・アレイ
340 オールド・シート・ポインタ
342 ニュー・シート・ポインタ
360 シート割り当てテーブル
380 ドライブ組織テーブル
390 ドライブID
400 記憶容量割り当て方法
450 データの転送方法

Claims (23)

  1. 複数の記憶ストライプの1つまたはそれ以上の行に対する1つの軸に沿った複数の記憶領域で、前記複数の記憶ストライプは他の軸に沿っていて、該複数の記憶領域で定められた記憶ユニットを含むグリッド・ベース記憶容量を使用したデータ記憶システムのためのメタデータであって、2つまたはそれ以上の記憶ユニットをグループ化する1つの記憶ユニットが、データ記憶容量のシートを定めて、前記記憶システム内の前記シートの割り当てステータスを特徴づけるメモリ内記憶識別情報を含む前記メタデータ。
  2. 前記シートの各々の割り当て可能性を示すアレイを特徴とするシート割り当てマップを含む、請求項1記載のメタデータ。
  3. 前記記憶容量内の前記割り当て可能なシートの数を示すシート割り当てデスクリプタを含む、請求項2記載のメタデータ。
  4. 前記記憶容量が複数のゾーンへ配置され、また前記シート割り当てデスクリプタが1つのゾーン内の前記割り当て可能なシートの数を示す、請求項3記載のメタデータ。
  5. 選択された記憶ユニットについて、前記記憶容量の基準(リファレンス)論理ブロック・アドレスを識別する記憶ユニット・デスクリプタを含む、請求項1記載のメタデータ。
  6. 前記グリッドの記憶領域を識別するブック識別を前記記憶ユニット・デスクリプタが含む、請求項5記載のメタデータ。
  7. 前記ブック内の各記憶ユニットについて固有の記憶ユニット番号を前記記憶ユニット・デスクリプタが含む、請求項6記載のメタデータ。
  8. 前記選択された記憶ユニットの前記基準論理ブロック・アドレスを、前記記憶ユニット番号が定める、請求項7記載のメタデータ。
  9. 前記記憶ユニット・デスクリプタが、フォールト・トレランス情報を含む、請求項8記載のメタデータ。
  10. スペア記憶領域を実施する順序付き方式を定めるドライブ組織インジケータを、前記フォールト・トレランス情報が含む、請求項9記載のメタデータ。
  11. 前記記憶ユニット・デスクリプタが、独立のドライブの冗長アレイ(RAID)レベルを含む、請求項9記載のメタデータ。
  12. 前記アレイ内の各論理デバイスについての記憶ユニット・デスクリプタのアレイを特徴とする論理デバイス割り当てマップを含む、請求項8記載のメタデータ。
  13. 前記論理デバイスの各々へ割り当てられた前記シートの数を示す論理デバイス・インデックスのアレイを特徴とする記憶ユニット割り当てデスクリプタを含む、請求項12記載のメタデータ。
  14. 前記論理デバイスの各々へ割り当てられた前記記憶ユニットの数を前記記憶ユニット割り当てデスクリプタが示す、請求項13記載のメタデータ。
  15. 各シートが割り当てられる論理デバイスを示すシート番号により索引付け可能なアレイを特徴とするシート割り当てテーブルを含む、請求項12記載のメタデータ。
  16. 前記シート割り当てテーブルがフォールト・トレランス情報を含む、請求項15記載のメタデータ。
  17. どの記憶領域がスペアとして割り当てられるかをシート組織が定め、ブック識別、ドライブ組織およびシート・バージョンの全ての順列のアレイとして特徴付けられるドライブ組織テーブルを含む、請求項10記載の前記メタデータ。
  18. 前記データ記憶容量内の前記記憶ユニットのシステム構成を管理するステップにより、データ記憶システム・コマンドに応答して、1つまたはそれ以上のターゲット記憶ユニットを識別するように適合された、請求項15記載のメタデータ。
  19. 前記データ記憶システムからの割り当て要求に応答して、前記シート割り当てマップおよび前記シート割り当てデスクリプタにアクセスすることにより、前記1つまたはそれ以上のターゲット記憶ユニットを識別することを前記システム構成を管理する前記ステップが含む請求項18記載のメタデータ。
  20. 論理デバイスに関連する前記データ記憶システムからの割り当て要求に応答して、前記論理デバイス割り当てマップおよび前記シート割り当てテーブルへアクセスすることにより、前記論理デバイスに関連する前記1つまたはそれ以上のターゲット記憶ユニットを識別することを前記システム構成を管理する前記ステップが含む、請求項18記載のメタデータ。
  21. 前記論理デバイスへあらかじめ割り当てられた前記シート内に不十分な割り当て可能な記憶ユニットがあるならば、前記シート割り当てマップおよび前記シート割り当てデスクリプタへアクセスすることにより前記1つまたはそれ以上のターゲット記憶ユニットを識別することを、前記システム構成を管理する前記ステップが含む、請求項20記載のメタデータ。
  22. 1つの軸に沿った複数の記憶領域であって、他の軸に沿った複数の記憶ストライプの1つまたはそれ以上の行に対する前記1つの軸に沿った複数の記憶領域に関して定められる記憶ユニットを含み、2つまたはそれ以上の記憶ユニットのグループ化がデータ記憶容量のシートを定めるグリッド・ベース記憶容量を採用するデータ記憶システムのためのメモリ割り当て方法であって、
    前記メモリ割り当てが既存の論理デバイスに関連するかどうかを決定するステップと、
    前記決定するステップがイエスであれば、そのときは論理デバイス割り当てマップおよびシート割り当てテーブルにアクセスして、選択された記憶ユニットを割り当てるステップと、
    前記決定するステップがノーであれば、そのときはシート割り当てデスクリプタおよびシート割り当てマップにアクセスして、選択した記憶ユニットを割り当てるステップとを含む前記方法。
  23. 1つの軸に沿った複数の記憶領域であって、他の軸に沿った複数の記憶ストライプの1つまたはそれ以上の行に対する前記1つの軸に沿った複数の記憶領域に関して定められる記憶ユニットを含み、2つまたはそれ以上の記憶ユニットのグループ化がデータ記憶容量のシートを定めるグリッド・ベース記憶容量を採用するデータ記憶システムのためにデータを転送する方法であって、論理デバイス割り当てマップおよびドライブ組織テーブルにアクセスして、選択された記憶ユニットから又は記憶ユニットへデータを転送する前記方法。
JP2005137979A 2004-10-20 2005-05-11 グリッド・ベース・データ記憶システム用メタデータ Pending JP2006120118A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/969,580 US7594075B2 (en) 2004-10-20 2004-10-20 Metadata for a grid based data storage system

Publications (1)

Publication Number Publication Date
JP2006120118A true JP2006120118A (ja) 2006-05-11

Family

ID=36182150

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005137979A Pending JP2006120118A (ja) 2004-10-20 2005-05-11 グリッド・ベース・データ記憶システム用メタデータ

Country Status (2)

Country Link
US (1) US7594075B2 (ja)
JP (1) JP2006120118A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009015845A (ja) * 2007-06-29 2009-01-22 Seagate Technology Llc 好適なゾーン・スケジューリング
JP2010277573A (ja) * 2009-06-01 2010-12-09 Lsi Corp 複数の非ファイバ・チャネル装置をファイバ・チャネル調停ループに結合させるブリッジ装置および方法
JP2015503156A (ja) * 2011-11-22 2015-01-29 シンプリヴィティ・コーポレーション ディスク記憶に消去符号化データを割り当てるための方法および装置
JP2017111850A (ja) * 2006-06-02 2017-06-22 株式会社半導体エネルギー研究所 半導体装置

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7860865B2 (en) * 2005-12-19 2010-12-28 Yahoo! Inc. System of a hierarchy of servers for query processing of column chunks in a distributed column chunk data store
JP4755510B2 (ja) * 2006-03-10 2011-08-24 インターナショナル・ビジネス・マシーンズ・コーポレーション データ記録装置、及び、データ記録装置のホストデータ転送のパフォーマンスを評価する方法
US20080052284A1 (en) * 2006-08-05 2008-02-28 Terry Stokes System and Method for the Capture and Archival of Electronic Communications
WO2010020992A1 (en) * 2008-08-21 2010-02-25 Xsignnet Ltd. Storage system and method of operating thereof
US20100049919A1 (en) * 2008-08-21 2010-02-25 Xsignnet Ltd. Serial attached scsi (sas) grid storage system and method of operating thereof
US8443137B2 (en) * 2008-08-21 2013-05-14 Infinidat Ltd. Grid storage system and method of operating thereof
US8078906B2 (en) * 2008-08-21 2011-12-13 Infinidat, Ltd. Grid storage system and method of operating thereof
US8452922B2 (en) * 2008-08-21 2013-05-28 Infinidat Ltd. Grid storage system and method of operating thereof
US8495291B2 (en) 2008-08-21 2013-07-23 Infinidat Ltd. Grid storage system and method of operating thereof
US9047351B2 (en) 2010-04-12 2015-06-02 Sandisk Enterprise Ip Llc Cluster of processing nodes with distributed global flash memory using commodity server technology
US9164554B2 (en) 2010-04-12 2015-10-20 Sandisk Enterprise Ip Llc Non-volatile solid-state storage system supporting high bandwidth and random access
US8677055B2 (en) * 2010-04-12 2014-03-18 Sandisk Enterprises IP LLC Flexible way of specifying storage attributes in a flash memory-based object store
US8856593B2 (en) 2010-04-12 2014-10-07 Sandisk Enterprise Ip Llc Failure recovery using consensus replication in a distributed flash memory system
US8868487B2 (en) 2010-04-12 2014-10-21 Sandisk Enterprise Ip Llc Event processing in a flash memory-based object store
US20110314070A1 (en) * 2010-06-18 2011-12-22 Microsoft Corporation Optimization of storage and transmission of data
US8666939B2 (en) 2010-06-28 2014-03-04 Sandisk Enterprise Ip Llc Approaches for the replication of write sets
US9342405B2 (en) * 2011-02-25 2016-05-17 Seagate Technology Llc Hierarchical data compression testing
US8874515B2 (en) 2011-04-11 2014-10-28 Sandisk Enterprise Ip Llc Low level object version tracking using non-volatile memory write generations
US9135064B2 (en) 2012-03-07 2015-09-15 Sandisk Enterprise Ip Llc Fine grained adaptive throttling of background processes
US8341342B1 (en) 2012-03-23 2012-12-25 DSSD, Inc. Storage system with incremental multi-dimensional RAID
US8327185B1 (en) 2012-03-23 2012-12-04 DSSD, Inc. Method and system for multi-dimensional raid
US9251181B2 (en) * 2012-06-18 2016-02-02 International Business Machines Corporation Dynamic map template discovery and map creation
US8464095B1 (en) 2012-11-15 2013-06-11 DSSD, Inc. Method and system for multi-dimensional raid reconstruction and defect avoidance
US8554997B1 (en) 2013-01-18 2013-10-08 DSSD, Inc. Method and system for mirrored multi-dimensional raid
US9854035B2 (en) 2013-05-28 2017-12-26 International Business Machines Corporation Maintaining state synchronization of an application between computing devices as well as maintaining state synchronization of common information between different applications without requiring periodic synchronization
US10044799B2 (en) 2013-05-28 2018-08-07 International Business Machines Corporation Implementing synchronization of state information betweeen instances of an application as well as between different applications in an efficient, scalable manner
US9317520B2 (en) 2013-07-30 2016-04-19 International Business Machines Corporation State scope data file sharing
US8924776B1 (en) 2013-12-04 2014-12-30 DSSD, Inc. Method and system for calculating parity values for multi-dimensional raid
US8949692B1 (en) 2014-01-23 2015-02-03 DSSD, Inc. Method and system for service-aware parity placement in a storage system
US9325672B2 (en) * 2014-04-25 2016-04-26 Cellco Partnership Digital encryption shredder and document cube rebuilder
WO2016048314A1 (en) * 2014-09-24 2016-03-31 Hewlett Packard Enterprise Development Lp Block priority information
US10466913B2 (en) 2015-04-29 2019-11-05 EMC IP Holding Company LLC Method and system for replicating and using grid level metadata in a storage system
US9891994B1 (en) * 2015-12-30 2018-02-13 EMC IP Holding Company LLC Updated raid 6 implementation
US10735504B2 (en) * 2016-01-06 2020-08-04 Oracle International Corporation System and method for distributed workbook storage
US10127113B1 (en) 2016-03-31 2018-11-13 EMC IP Holding Company LLC Method and system for checkerboard RAID
US10020067B2 (en) * 2016-08-31 2018-07-10 Nxp Usa, Inc. Integrated circuits and methods for dynamic allocation of one-time programmable memory
US10339062B2 (en) 2017-04-28 2019-07-02 EMC IP Holding Company LLC Method and system for writing data to and read data from persistent storage
US10614019B2 (en) 2017-04-28 2020-04-07 EMC IP Holding Company LLC Method and system for fast ordered writes with target collaboration
US10466930B2 (en) 2017-04-28 2019-11-05 EMC IP Holding Company LLC Method and system for fast ordered writes with atomic multicast
US10289491B1 (en) 2017-04-28 2019-05-14 EMC IP Holding Company LLC Method and system for implementing multi-dimensional raid in an extensible storage array to optimize performance
US10768844B2 (en) 2018-05-15 2020-09-08 International Business Machines Corporation Internal striping inside a single device
US11556270B2 (en) * 2021-01-07 2023-01-17 EMC IP Holding Company LLC Leveraging garbage collection for raid transformation
CN116755636B (zh) * 2023-08-16 2023-10-27 中国空气动力研究与发展中心计算空气动力研究所 一种网格文件的并行读入方法、装置、设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003036699A2 (en) * 2001-10-23 2003-05-01 Cambridge Semiconductor Limited Lateral semiconductor-on-insulator structure and corresponding manufacturing methods
JP2006506741A (ja) * 2002-11-14 2006-02-23 アイシロン・システムズ・インコーポレーテッド 分散ファイルシステムにおけるファイルの再ストライピングのためのシステム及び方法

Family Cites Families (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4847807A (en) 1986-09-11 1989-07-11 Hughes Aircraft Company Multiple disk memory access arrangement for gridded type data
US5134619A (en) 1990-04-06 1992-07-28 Sf2 Corporation Failure-tolerant mass storage system
DE69131551T2 (de) 1990-11-09 2000-02-17 Emc Corp Logische Aufteilung eines Speichersystems mit redundanter Matrix
US5974544A (en) 1991-12-17 1999-10-26 Dell Usa, L.P. Method and controller for defect tracking in a redundant array
JP3160106B2 (ja) 1991-12-23 2001-04-23 ヒュンダイ エレクトロニクス アメリカ ディスクアレーの区分け方法
JP2777301B2 (ja) 1992-01-07 1998-07-16 三菱電機株式会社 記録装置
US5325363A (en) 1992-05-11 1994-06-28 Tandem Computers Incorporated Fault tolerant power supply for an array of storage devices
US5412661A (en) 1992-10-06 1995-05-02 International Business Machines Corporation Two-dimensional disk array
US5689678A (en) 1993-03-11 1997-11-18 Emc Corporation Distributed storage array system having a plurality of modular control units
WO1994029796A1 (en) 1993-06-03 1994-12-22 Network Appliance Corporation A method for allocating files in a file system integrated with a raid disk sub-system
EP0701715A4 (en) 1993-06-04 1999-11-17 Network Appliance Corp METHOD FOR PROVIDING PARITY IN A RAID SUBSYSTEM USING REMANENT MEMORY
US5537567A (en) 1994-03-14 1996-07-16 International Business Machines Corporation Parity block configuration in an array of storage devices
US5671377A (en) 1994-07-19 1997-09-23 David Sarnoff Research Center, Inc. System for supplying streams of data to multiple users by distributing a data stream to multiple processors and enabling each user to manipulate supplied data stream
US5671349A (en) 1994-12-06 1997-09-23 Hitachi Computer Products America, Inc. Apparatus and method for providing data redundancy and reconstruction for redundant arrays of disk drives
JP3371044B2 (ja) * 1994-12-28 2003-01-27 株式会社日立製作所 ディスクアレイのための領域割り当て方法およびディスクアレイアクセス方法
US5729763A (en) 1995-08-15 1998-03-17 Emc Corporation Data storage system
US5632027A (en) 1995-09-14 1997-05-20 International Business Machines Corporation Method and system for mass storage device configuration management
US6161192A (en) 1995-10-13 2000-12-12 Compaq Computer Corporation Raid array data storage system with storage device consistency bits and raidset consistency bits
US5774643A (en) 1995-10-13 1998-06-30 Digital Equipment Corporation Enhanced raid write hole protection and recovery
US5682509A (en) 1995-12-13 1997-10-28 Ast Research, Inc. Bus interface to a RAID architecture
JPH09167427A (ja) 1995-12-14 1997-06-24 Fujitsu Ltd ディスクアレイ装置
US5983283A (en) 1996-04-15 1999-11-09 Sun Microsystems, Inc. Storage manager independent configuration interface translator and method
US5812754A (en) 1996-09-18 1998-09-22 Silicon Graphics, Inc. Raid system with fibre channel arbitrated loop
US5897661A (en) 1997-02-25 1999-04-27 International Business Machines Corporation Logical volume manager and method having enhanced update capability with dynamic allocation of storage and minimal storage of metadata information
US5960169A (en) 1997-02-27 1999-09-28 International Business Machines Corporation Transformational raid for hierarchical storage management system
US6154853A (en) 1997-03-26 2000-11-28 Emc Corporation Method and apparatus for dynamic sparing in a RAID storage system
US6148369A (en) 1997-09-30 2000-11-14 Emc Corp Method and apparatus for providing logical devices spanning several physical volumes
US6134630A (en) 1997-11-14 2000-10-17 3Ware High-performance bus architecture for disk array system
AU1793999A (en) 1997-12-11 1999-06-28 Telefonaktiebolaget Lm Ericsson (Publ) Redundancy termination for dynamic fault isolation
US6078990A (en) 1998-02-06 2000-06-20 Ncr Corporation Volume set configuration using a single operational view
US6353895B1 (en) 1998-02-19 2002-03-05 Adaptec, Inc. RAID architecture with two-drive fault tolerance
US6317844B1 (en) 1998-03-10 2001-11-13 Network Appliance, Inc. File server storage arrangement
US6775674B1 (en) 1998-03-26 2004-08-10 Sap Aktiengesellschaft Auto completion of relationships between objects in a data model
US6101615A (en) 1998-04-08 2000-08-08 International Business Machines Corporation Method and apparatus for improving sequential writes to RAID-6 devices
US6247157B1 (en) 1998-05-13 2001-06-12 Intel Corporation Method of encoding data signals for storage
US6256705B1 (en) 1998-06-05 2001-07-03 International Business Machines Corporation System and method for organizing data stored in a log structured array
US6009432A (en) 1998-07-08 1999-12-28 Required Technologies, Inc. Value-instance-connectivity computer-implemented database
US6453428B1 (en) 1998-07-17 2002-09-17 Adaptec, Inc. Dual-drive fault tolerant method and system for assigning data chunks to column parity sets
JP3505093B2 (ja) 1998-09-18 2004-03-08 富士通株式会社 ファイル管理システム
US6195695B1 (en) 1998-10-27 2001-02-27 International Business Machines Corporation Data processing system and method for recovering from system crashes
JP2000137584A (ja) 1998-10-30 2000-05-16 Nec Software Ltd 外部記憶装置の制御装置及び不良ブロック代替方法並びに不良ブロック代替制御プログラムを格納した記憶媒体
US6327672B1 (en) 1998-12-31 2001-12-04 Lsi Logic Corporation Multiple drive failure tolerant raid system
US6401214B1 (en) 1999-03-04 2002-06-04 International Business Machines Corporation Preventive recovery action in hard disk drives
US6219753B1 (en) 1999-06-04 2001-04-17 International Business Machines Corporation Fiber channel topological structure and method including structure and method for raid devices and controllers
JP3224024B2 (ja) 1999-06-29 2001-10-29 インターナショナル・ビジネス・マシーンズ・コーポレーション 欠陥登録方法、ディフェクト・マップ記録媒体、およびディスク装置
US6557123B1 (en) 1999-08-02 2003-04-29 Inostor Corporation Data redundancy methods and apparatus
US6742137B1 (en) 1999-08-17 2004-05-25 Adaptec, Inc. Object oriented fault tolerance
US6425052B1 (en) * 1999-10-28 2002-07-23 Sun Microsystems, Inc. Load balancing configuration for storage arrays employing mirroring and striping
US6338126B1 (en) 1999-12-06 2002-01-08 Legato Systems, Inc. Crash recovery without complete remirror
EP1238335A1 (en) 1999-12-07 2002-09-11 Data Foundation, Inc. Scalable storage architecture
US6574687B1 (en) 1999-12-29 2003-06-03 Emc Corporation Fibre channel data storage system
US6502166B1 (en) 1999-12-29 2002-12-31 International Business Machines Corporation Method and apparatus for distributing data across multiple disk drives
US6574754B1 (en) 2000-02-14 2003-06-03 International Business Machines Corporation Self-monitoring storage device using neural networks
US6675318B1 (en) 2000-07-25 2004-01-06 Sun Microsystems, Inc. Two-dimensional storage array with prompt parity in one dimension and delayed parity in a second dimension
US6529997B1 (en) 2000-08-11 2003-03-04 Storage Technology Corporation Apparatus and method for writing and reading data to and from a virtual volume of redundant storage devices
US6931450B2 (en) 2000-12-18 2005-08-16 Sun Microsystems, Inc. Direct access from client to storage device
US7383288B2 (en) 2001-01-11 2008-06-03 Attune Systems, Inc. Metadata based file switch and switched file system
US20040133606A1 (en) 2003-01-02 2004-07-08 Z-Force Communications, Inc. Directory aggregation for files distributed over a plurality of servers in a switched file system
US7054927B2 (en) * 2001-01-29 2006-05-30 Adaptec, Inc. File system metadata describing server directory information
US20020191311A1 (en) 2001-01-29 2002-12-19 Ulrich Thomas R. Dynamically scalable disk array
US20020165942A1 (en) 2001-01-29 2002-11-07 Ulrich Thomas R. Data path accelerator with variable parity, variable length, and variable extent parity groups
US6721758B1 (en) 2001-03-30 2004-04-13 Novell, Inc. System and method for using schema attributes as meta-data in a directory service
US6728833B2 (en) 2002-02-28 2004-04-27 International Business Machines Corporation Upgrading firmware on disks of the raid storage system without deactivating the server
US7257584B2 (en) 2002-03-18 2007-08-14 Surgient, Inc. Server file management

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003036699A2 (en) * 2001-10-23 2003-05-01 Cambridge Semiconductor Limited Lateral semiconductor-on-insulator structure and corresponding manufacturing methods
JP2006506741A (ja) * 2002-11-14 2006-02-23 アイシロン・システムズ・インコーポレーテッド 分散ファイルシステムにおけるファイルの再ストライピングのためのシステム及び方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017111850A (ja) * 2006-06-02 2017-06-22 株式会社半導体エネルギー研究所 半導体装置
JP2009015845A (ja) * 2007-06-29 2009-01-22 Seagate Technology Llc 好適なゾーン・スケジューリング
JP2010277573A (ja) * 2009-06-01 2010-12-09 Lsi Corp 複数の非ファイバ・チャネル装置をファイバ・チャネル調停ループに結合させるブリッジ装置および方法
JP2015503156A (ja) * 2011-11-22 2015-01-29 シンプリヴィティ・コーポレーション ディスク記憶に消去符号化データを割り当てるための方法および装置

Also Published As

Publication number Publication date
US7594075B2 (en) 2009-09-22
US20060085594A1 (en) 2006-04-20

Similar Documents

Publication Publication Date Title
JP2006120118A (ja) グリッド・ベース・データ記憶システム用メタデータ
US11327661B2 (en) Storage system and data management method
US10140041B1 (en) Mapped RAID (redundant array of independent disks) in a data storage system with RAID extent sub-groups that are used to perform drive extent allocation and data striping for sequential data accesses to a storage object
US10089026B1 (en) Virtual drive based RAID groups
JP2006120120A (ja) 複数のデータ・フォーマットを割り振るための一般記憶コンテナ
US7237062B2 (en) Storage media data structure system and method
US10365983B1 (en) Repairing raid systems at per-stripe granularity
US10073621B1 (en) Managing storage device mappings in storage systems
JP5048760B2 (ja) Raid管理、再割振り、およびリストライピングのためのシステムおよび方法
US8131969B2 (en) Updating system configuration information
US10289336B1 (en) Relocating data from an end of life storage drive based on storage drive loads in a data storage system using mapped RAID (redundant array of independent disks) technology
KR102414500B1 (ko) 지능형 데이터 배치
US10229022B1 (en) Providing Raid-10 with a configurable Raid width using a mapped raid group
US9639268B2 (en) Distributed data storage system with key-based addressing
CN110096219B (zh) 从驱动器组生成的驱动器区段池的有效容量
US9122629B2 (en) Elastic cache with single parity
US9342405B2 (en) Hierarchical data compression testing
US10678470B2 (en) Computer system,control method for physical storage device,and recording medium
KR20100077156A (ko) 씬 프로비저닝 이송 및 스크러빙 방법
US10592111B1 (en) Assignment of newly added data storage drives to an original data storage drive partnership group and a new data storage drive partnership group in a mapped RAID (redundant array of independent disks) system
WO2013158817A1 (en) Lun management with distributed raid controllers
US10678643B1 (en) Splitting a group of physical data storage drives into partnership groups to limit the risk of data loss during drive rebuilds in a mapped RAID (redundant array of independent disks) data storage system
US10678641B2 (en) Techniques for optimizing metadata resiliency and performance
US7346733B2 (en) Storage apparatus, system and method using a plurality of object-based storage devices
JP2006178926A (ja) 複数のオブジェクトベースのストレージ装置を使用したストレージ装置、システム、および方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080512

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20100526

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110208

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110712