JP2006344218A - ストレージ中心のコンピュータ・システム - Google Patents

ストレージ中心のコンピュータ・システム Download PDF

Info

Publication number
JP2006344218A
JP2006344218A JP2006154610A JP2006154610A JP2006344218A JP 2006344218 A JP2006344218 A JP 2006344218A JP 2006154610 A JP2006154610 A JP 2006154610A JP 2006154610 A JP2006154610 A JP 2006154610A JP 2006344218 A JP2006344218 A JP 2006344218A
Authority
JP
Japan
Prior art keywords
subsystem
storage
data storage
data
virtual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006154610A
Other languages
English (en)
Inventor
Wayne Thomas Ricard
トマス リカード ウェイン
Stepen James Sicola
ジェームズ シコラ ステーブン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seagate Technology LLC
Original Assignee
Seagate Technology LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seagate Technology LLC filed Critical Seagate Technology LLC
Publication of JP2006344218A publication Critical patent/JP2006344218A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0662Virtualisation aspects
    • G06F3/0665Virtualisation aspects at area level, e.g. provisioning of virtual or logical volumes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • G06F3/0605Improving or facilitating administration, e.g. storage management by facilitating the interaction with a user or administrator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/0647Migration mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2089Redundant storage control functionality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】各データ・ストレージ容量を自己確定的に割り当て、管理、且つ保護し、仮想ストレージ領域としての容量をネットワークに提示して全体的なストレージ要求に対応するインテリジェント・データ・ストレージ・サブシステムを提供すること。
【解決手段】複数の回転型スピンドルを有する、分散型ストレージ・システム用の内蔵型データ・ストレージ・サブシステム。各スピンドルは、ストレージ媒体にデータを保存し、またはそこからデータを取り出すためにそれぞれが独自に可動のアクチュエータに隣接する記憶媒体を支持する。サブシステム・プロセッサは、複数のスピンドルと一体化され、分散型ストレージ・システムの遠隔装置が用いる複数の媒体に仮想ストレージ・ボリュームをマッピングする。複数のスピンドルの組み合わせによって、信頼性の高い、ストレージ容量が得られる。コストを抑え、全体的な信頼性、性能を高める方法を提供する。
【選択図】図1

Description

特許請求を行う発明は、一般に分散型データ・ストレージ・システムに関するものであり、さらに特定すれば、ストレージ・システムにおいてストレージを中心としてデータを自立的に制御する方法および装置に関するものである。
産業の標準仕様のアーキテクチャのデータ転送速度がインテル社製の80386プロセッサのアクセス速度について行けなくなったときに、コンピュータ・ネットワーキングは急激に広まり始めた。ネットワークにおいては、データ・ストレージ装置の容量を強化することによって、ローカル・エリア・ネットワーク(LAN)は、ストレージ・エリア・ネットワーク(SAN)に発展した。装置と、該装置がSANにおいて処理する関連データとを統合することによって、ユーザは相当の便益を得た。すなわち、記憶装置を直接取り付けることによって、そうでない場合に比して数桁多い記憶領域を処理でき、且つそれを手ごろなコストで処理できるといったことである。
さらに最近の傾向は、ネットワークを中心とした、データ・ストレージ・サブシステム制御方法を目指している。すなわち、ストレージを強化したのと同様に、ストレージの機能を制御するシステムをサーバから取り外してネットワークそのものに組み込む。例えば、ホスト・ベースのソフトウエアは、メンテナンスおよび管理タスクをインテリジェント・スイッチまたは専門のネットワーク・ストレージ・サービス・プラットフォームに委託することができる。装置ベースのソリューションは、ソフトウエアをホストで動作させる必要はなく、企業の中にノードとして配置されたコンピュータの中でソフトウエアを動作させる。いずれの場合も、インテリジェント・ネットワーク・ソリューションは、そうしたものをストレージ割り当てルーチン、バックアップ・ルーチン、および耐故障性方式としてホストとは無関係に集中化することができる。
ホストからネットワークにインテリジェンスを移動させることによって、こうした問題の一部は解決されるが、ホストに対する仮想ストレージ提示の変更の柔軟性の一般的な欠如に伴う固有の難題は解決されない。例えば、格納されたデータは、信頼性の懸念から移動させる必要があり、または増大するネットワークに対応するために更に多くのストレージ容量を付け加える必要がある場合もある。このような場合、ホストまたはネットワークを改良して、新たなまたは変更されたストレージ領域が存在することをホストまたはネットワークに知らせる必要である。必要とされているものは、そのそれぞれのデータ・ストレージ容量を自己確定的に割り当て、管理し、且つ保護し、仮想ストレージ領域としての当該容量をネットワークに提示して全体的なストレージ領域要求に対応するインテリジェント・データ・ストレージ・サブシステムである。この仮想ストレージ領域を多重ストレージ・ボリュームに供給することができる。分散型コンピューティング環境は、これらのインテリジェント・ストレージ装置を用いて、包括的な供給およびエラーの際には包括的節約を行う。本発明の実施形態が対象としているのはこのソリューションである。
本発明の実施形態は、一般に、分散型ストレージ・システムの中のストレージ中心のサブシステムであって、各サブシステムは自身のデータの保存および取り出し作業を自立的に制御するストレージ中心のサブシステムを対象としたものである。
一部の実施形態では、分散型ストレージ・システムのための内蔵型データ・ストレージ・サブシステムを提供する。該内蔵型データ・ストレージ・サブシステムは、複数のスピンドルを有し、各スピンドルは、ストレージ媒体にデータを保存し、ストレージ媒体からデータを取り出すように、それぞれ独自に移動可能なアクチュエータに隣接する記憶媒体を支持する。さらに内蔵型データ・ストレージ・サブシステムは、分散型ストレージ・システムの遠隔装置が用いる複数の媒体に仮想ストレージ・ボリュームをマッピングするようになされたサブシステム・プロセッサを有する。
一部の実施形態では、内蔵型の複数の離散的データ・ストレージ・システムと、該データ・ストレージ・システムと交信するサブシステム・プロセッサとを有し、遠隔装置から受信したコマンドを抽出し、それに応じて関連のメモリーを対応付けるようになされた分散型ストレージ・システムのためのデータ・ストレージ・サブシステムを提供する。
一部の実施形態では、ホストと、該ホストとネットワークを介して交信する後端ストレージ・システムとを有し、さらに内蔵型ストレージ容量をホストとは無関係に仮想化する手段を備えた分散型ストレージ・システムを提供する。特許請求を行う発明の特徴であるこれらのおよびその他の種々の構造は、以下の詳細な説明を読み、かつ関連図面を点検すれば明らかになろう。
図1は、本発明の実施形態が用いられているコンピュータ・システム100の一例である。1つ以上のホスト102が、ローカル・エリア・ネットワーク(LAN)および/またはワイド・エリア・ネットワーク(WAN)を介して1つ以上のネットワーク接続サーバ104に接続されている。LAN/WAN106は、インターネット・プロトコル(IP)・ネットワーク・インフラストラクチャーを用い、ワールド・ワイド・ウェブを介して通信を行うことが好ましい。ホスト102は多数のインテリジェント・データ・ストレージ・サブシステム108の内の1つ以上に保存されたデータをいつも必要とするサーバ104に常駐するアプリケーションにアクセスする。従って、SAN110はサーバ104をインテリジェント・データ・ストレージ・サブシステム108に接続して保存されたデータにアクセスする。インテリジェント・データ・サブシステム108は、シリアルATAやファイバ・チャネルのような種々の選択された通信プロトコルを介して、企業またはデスクトップ並みの記憶媒体でデータを内部に保存するデータ・ストレージ容量ブロック109を備える。
図2は、図1のコンピュータ・システム100の簡略図である。ホスト102は、ネットワークまたはファブリック110を介して互いに、さらに(それぞれAおよびBと表示されている)一対のインテリジェント・データ・ストレージ・サブシステム108と相互に作用する。各インテリジェント・データ・ストレージ・サブシステム108は、(A1、A2およびB1、B2と表示されている)二重化されているコントローラ112を含む。コントローラ112は、独立したドライブの冗長アレイ(RAID)として特徴付けられる一組のデータ・ストレージ装置であるデータ・ストレージ容量109上で動作することが好ましい。コントローラ112とデータ・ストレージ容量109は、耐故障性機構を利用し、それによって種々のコントローラ112は平行な冗長リンクを利用し、システム100によって格納されたユーザ・データの少なくとも一部は、少なくとも一組のデータ・ストレージ容量109の中に冗長フォーマットで格納されることが好ましい。
さらに、Aホスト・コンピュータ102とAインテリジェント・データ・ストレージ・サブシステム108とを第1の位置に物理的に配置し、Bホスト・コンピュータ102とBインテリジェント・データ・ストレージ・サブシステム108とを第2の位置に物理的に配置し、そしてCホスト・コンピュータ102をさらに第3の位置に配置することは可能であると考えられる。但し、それは単に一例であって、限定ではない。分散型コンピュータ・システム上の全ての実体は、ある種のコンピュータ・ネットワークを介して接続される。
図3は、本発明の実施形態に従って構成されたインテリジェント・データ・ストレージ・サブシステム108を示す。シェルフ114は中央平面116と電気的に接続されるコントローラ112と係合して受容するキャビティを規定する。また、シェルフは、キャビネット(図示せず)内で支持される。一対の多重ディスク・アセンブリ(MDA)118は、中央平面116の同一側においてシェルフ114と係合でき、これによりシェルフに受容される。中央平面116の反対側には、非常用電源供給用二重バッテリ122、二重交流電源124、および二重インターフェース・モジュール126が接続されている。これらの二重構成要素は、MDAのいずれか一方を、またはその両方を同時に動作させるようになされ、それによって構成要素のエラーの際の後備保護を備えることが好ましい。
図4は、本発明の一部の実施形態に従って構成されたMDA118の拡大組立分解等角図である。MDA118は、上部130および下部132を有し、各々は5個のデータ・ストレージ装置128を支持する。仕切り130、132は、データ・ストレージ装置128は整列させ、中央平面116(図3)と動作自在に係合するコネクタ136を有する共通回路基板134と接続させる。ラッパ(wrapper)138は電磁干渉遮蔽する。このMDA118の実施形態の一例は、Carrier Device and Method for a Multiple Disc Arrayと題し、本発明の譲受人に譲渡された特許出願第10/884,605号の主題である。その開示内容はこの言及によって本願に包含される。MDAの別の実施形態の一例は、同じ題名で、これも本発明の譲受人に譲渡された特許出願第10/817,378号の主題である。その開示内容はこの言及によって本願に包含される。別の同等の実施形態では、密閉筐体に収容されたMDA118を提供することができる。これについては以下で論ずる。
図5は、本発明の実施形態と一緒に用いるのに適した、回転媒体ディスク・ドライブ形状のデータ・ストレージ装置128の一例の等角図である。以下では説明上、可動データ・ストレージ媒体を備えた回転スピンドルが用いられているが、別の同等の実施形態では、固定状態のメモリー装置のような非回転媒体装置が用いられている。データ・ストレージ装置140はモータ142によって回転し、ディスク140のどの場所にデータが保存されているかを読み取り/書き込みヘッド(“head”)143に呈示する。ヘッド143は、ディスク140の内側トラックと外側トラックとの間でヘッド143を放射状に移動させることができる回転アクチュエータ144の先端で支持されている。ヘッド143は、フレックス回路146を介して回路基板145に電気的に接続される。回路基板145は、データ・ストレージ装置128の機能を制御する制御信号を送受するようになされている。コネクタ148は、回路基板145に電気的に接続され、データ・ストレージ装置128をMDA118の回路基板134(図4)に接続するようになされている。
図6は、本発明の実施形態に従って構成されたインテリジェント・データ・ストレージ・サブシステム108の図である。コントローラ112は、冗長インテリジェント・ストレージ・プロセッサ(ISP)150と一緒に動作し、データ保全を管理された信頼性のあるものとする。インテリジェント・ストレージ・プロセッサ150は、コントローラ112またはMDA118の中に、あるいはインテリジェント・データ・ストレージ・サブシステム108内の他の場所に常駐可能である。
管理された信頼性の態様には、RAID方法のような信頼性のあるデータ・ストレージ・フォーマットを起動させることが含まれる。例えば、複数の異なるRAIDフォーマットの内の選択された1つを選択的に用いるシステムを提供することによって、比較的より堅固なデータ・ストレージ・システムを作成し、ファームウエア・アルゴリズムの最適化を可能としてMAD118を管理するために用いられるソフトウエアの簡素化を図り、且つその結果、ストレージの故障状態から比較的速やかに復元する。この多重RAIDフォーマット・システムのこれらのおよびその他の態様は、Storage Media Data Structure and Methodと題し、本譲受人に譲受された特許出願第10/817,264号に記述されている。同特許出願の開示内容は、この言及によって本願に包含される。
また、管理された信頼性は、システムの常時監視使用に基づいた診断および補正手順のスケジューリングを含むことができる。データ復元動作を実行し、データをコピーおよび復元する。データ損失を伴うことなくデータ・ストレージ容量全体を自己回復しやすくするように、サブシステム・プロセッサをMDA118と統合する。ここで検討されたこれらのおよびその他の管理された信頼性の態様は、Managed Reliability Storage System and Methodと題し、本譲受人に譲受された特許出願第10/817,617号に開示されている。同特許出願の開示内容は、この言及によって本願に包含される。管理された信頼性のその他の態様には、所定のルールに関連した故障予告表示に対する応答性が含まれる。これについては、例えば、Deterministic Preventive Recovery From a Predicted Failure in a Distributed Storage Systemと題し、本譲受人に譲受された特許出願第11/040,410号に開示されている。なお同特許出願の開示内容は、この言及によって本願に包含される。
図7は、インテリジェント・ストレージ・プロセッサ回路基板152を表わす図である。その中には、対の冗長インテリジェント・ストレージ・プロセッサ150が常駐している。インテリジェント・ストレージ・プロセッサ150は、データ・ストレージ容量109をSANファブリック110とつなぐ。各インテリジェント・ストレージ・プロセッサ150は、ルーティング、ボリューム管理、およびデータの移行ならびに複製といった多彩な記憶作業を管理することができる。インテリジェント・ストレージ・プロセッサ150は、基板152を2つのISPサブシステム154、156に分割し、これらのサブシステムは、バス158によって結合される。ISPサブシステム154は、「B」と表示されるISP150を含む。ISP150は、リンク160と162とによって、ファブリック110と記憶容量109とにそれぞれ接続される。また、ISPサブシステム154は、リアルタイム・オペレーティング・システムを実行するポリシー・プロセッサ164を含む。ISP154とポリシー・プロセッサ164は、バス166を介して交信し、さらに両者ともメモリー168と交信する。
図8は、本発明の実施形態に従って構成されたISPサブシステム154の一例の図である。ISP150は、クロス・ポイント・スイッチ(cross point switch)(CPS)186メッセージ・クロスバーを介してリスト・マネージャー182、184と交信する多数の機能コントローラ(170‐180)を含む。従って、コントローラ(170‐180)は、各々、所定の条件に応答してCPSメッセージを生成し、CPSを介してリスト・マネージャー182、184にメッセージを送り、メモリー・モジュールにアクセスし、さらに/またはISP150のアクションを呼び起こすことができる。同様に、リスト・マネージャー182、184からの応答は、CPS186を介してコントローラ(170‐180)のいずれかに伝達することができる。図8の機構および関連の説明は、一例であって検討を行った本発明の実施形態を限定するものではない。
ポリシー・プロセッサ164は、ISP150を介して所望の動作を行うように設定することができる。例えば、ポリシー・プロセッサ164はリスト・マネージャー182、184と交信する、すなわちCPS186を介してメッセージを送受することができる。ポリシー・プロセッサ164に対する応答は、割り込みを行ってメモリー168の記載の読み取りを知らせることができる。
図9は、インテリジェント・コントローラ112を経由して、FC、iSCSI、またはSASのような予め選択した複数の通信プロトコルのいずれかにおいてホスト102と交信するインテリジェント・データ・ストレージ・サブシステム108の利点である柔軟性を示した図である。インテリジェント・データ・ストレージ・サブシステム108は、ホスト・コマンドの抽出レベルを確認し、さらにそれに応じてコマンドに関連する物理的ストレージ109に仮想ストレージ・ボリュームをマッピングするように設定することができる。
本目的に対して、「仮想ストレージ・ボリューム」は、物理的ストレージの論理的抽出に一般的に対応する論理的実体を意味している。例えば、「仮想ストレージ・ボリューム」は、固定ブロック・アーキテクチャにおいて連続指定されたブロック、またはカウント・キー・データ(count−key−data)・アーキテキチャにおける記録であるかのように(論理的に)処理される実体を含むことができる。仮想ストレージ・ボリュームは、2つ以上のストレージ・エレメント上で物理的に捜し出すことができる。
図10は、インテリジェント・データ・ストレージ・サブシステム108が、あらゆるホスト102とは無関係に行うことができるタイプのデータ管理サービスを示した図である。例えば、RAID管理は耐故障性データ保全目的のために局部的に制御することができ、所望数のデータ・ストレージ装置128、128、128....128においてデータを取り除くことができる。仮想化作業を局部的に制御することによって、メモリー容量を論理実体に割り当てるおよび/または割り当て解除することができる。先に論じた管理された信頼性方式のようなアプリケーション・ルーチンは、同様に局部的に制御可能である。
最後に、図11は図4と略同じ図である。ただし、図11では、複数のデータ・ストレージ装置138および回路基板134がベース190から作られた密閉筐体内に収容され、カバー192がこれを密封するように取り付けられている。MDA118Aを形成するデータ・ストレージ装置128を密閉することによって、ユーザには多数の利点が得られる。その利点には、データ・ストレージ装置128の構成は、予め選択された最適な構成から変更されることがないことを保証することなどがある。また、もしデータ・ストレージ装置128の数、大きさをおよび種類を明確に規定することができれば、かかる構成によってMDA118Aの製造業者は、最適性能となるようにシステムを調整することができる。
また、MDA118Aを密閉することによって、製造業者は内部のストレージ媒体群の信頼性および耐故障性を極大化することができる。これを行うには、多重スピンドル構成のドライブを最適化することである。内部で設計最適化が認められると、コストを削減し、性能や信頼性を高めることができ、これらは何れもMDA118A内のデータの長寿命化に資することになる。MDA118Aは、それ自体、抽象的保護ストレージ・コンテナーを更に改良するための基礎となるものである。さらに、MDA118Aの設計そのものによって回転振動は略ゼロとなり、高度な冷却効率環境が得られる。これによって内部のストレージ媒体は標準よりも低いコストで製造でき、MDA118の信頼性、性能または容量を損なうことはない。従って、MDA118Aには単一障害点はなく、回転振動は略完璧に回避され、さらに略完璧な冷却効率が得られる。これによって最適なディスク媒体特性のMDA118Aを設計することができ、さらに信頼性および性能を同時に高めながらコストを削減する。
以上をまとめると、(100のような)分散型ストレージ・システム用の(108のような)内蔵型データ・ストレージ・サブシステムを提供し、これには(142のような)複数の回転式スピンドルが含まれ、その各々は、ストレージ媒体との間で、データ保存およびデータ取り出しの関係においてそれぞれ独自に移動可能な(143のような)アクチュエータに隣接する(140のような)ストレージ媒体を支持する。データ・ストレージ・サブシステムは、さらに分散型ストレージ・システムの(102のような)遠隔装置が用いる複数の媒体に対し仮想ストレージ・ボリュームをマッピングするようになされた(150のような)サブシステム・プロセッサを含む。
一部の実施形態では、サブシステムは(190、192のような)一般的な密閉した筐体の中に収容される複数のスピンドルおよび媒体を有する。サブシステム・プロセッサは、RAID方法の場合のように、耐故障性手法でデータを保存するためのメモリーを仮想ストレージ・ボリュームに割り当てることが好ましい。プロセッサは更に、観測された予測記憶故障に応答してそのままで決定論的な保護復元ステップを開始するといったように、データ保存工程において管理された信頼性手法を行うことができる。データ・ストレージ・サブシステムは、(128のような)複数のデータ・ストレージ装置から作られ、その各々は2個以上のディスクのデータ・ストレージ媒体で作られたディスクの積層を有することが好ましい。
別の実施形態では、以下のような分散型ストレージ・システム用のデータ・ストレージ・サブシステムを検討した。すなわち、内蔵された複数の離散的データ・ストレージ装置と、該データ・ストレージ装置と交信を行うサブシステム・プロセッサとを備え、遠隔装置から受信した(図9におけるような)コマンドを抽出し、これに応じて関連のメモリーを対応付けるようになされたデータ・ストレージ・サブシステムである。該サブシステム・プロセッサは、分散型ストレージ・システムの1つ以上の遠隔装置によって用いられる複数のデータ・ストレージ装置に対して仮想ストレージ・ボリュームをマッピングするようになされることが好ましい。先に述べたように、複数のデータ・ストレージ装置および媒体は、一般的な密閉筐体の中に収容することができる。サブシステム・プロセッサは、RAID手法におけるように、耐故障性手法でデータを保存するためのメモリーを仮想ストレージ・ボリュームの中に割り当てることが好ましい。サブシステム・プロセッサは、更に、観測された予測ストレージ・エラーに応答してデータ・ストレージ装置においてそのままで決定論的な保護復元ステップを開始することができる。
別の実施形態では、ホスト、および該ホストとネットワークを介して交信する後端ストレージ・サブシステムを備え、さらにホストとは無関係に内蔵型ストレージ容量を仮想化する手段を備えた分散型ストレージ・システムを提供する。
仮想化手段は、個々にアクセス可能な複数の離散型データ・ストレージ装置を特徴とすることができる。仮想化手段は、複数のデータ・ストレージ装置に関連付けられたストレージ容量の仮想ブロックをマッピングすることを特徴とすることができる。仮想化手段は、複数のデータ・ストレージ装置および関連の制御装置を筐体に収容し密閉することを特徴とすることができる。仮想化手段は、RAID方法に限定することなく、耐故障性手法でデータを保存することを特徴とすることができる。仮想化手段は、観測された予測記憶エラーに応答してそのままで決定論的な保護復元ステップを開始することを特徴とすることができる。仮想化手段は、多重データ・ストレージ・アレイを特徴とすることができる。
本願の目的に対する「仮想化手段」という言葉は、それぞれのデータ・ストレージ・サブシステム内以外の別の場所にデータ・ストレージ領域をマッピングするためのシステム情報を含んだ、以前に試みられたソリューションは特に考慮に入れない。「仮想化手段」は、例えば、データ・ストレージ・サブシステムの機能を制御するためにストレージ・マネージャを用いることは考えないし、SANファブリック内またはホスト内にマネージャまたはスイッチを配置することも考えない。
これまでの説明の中では、本発明の種々の実施形態の構造および機能の詳細と共に、本発明の種々の実施形態の多数の特徴および利点を明示してきたが、この詳細な説明は単に例示であって、細部に亘って変更を加えることは可能である。特に要素の構造および構成事項においては、本発明の趣旨の範囲内において、且つ添付の特許請求の範囲を書き表わした用語の広義の全般的な意味によって示される限りにおいて、変更を加えることは可能であることは理解されてしかるべきである。例えば、個々の要素は本発明の趣旨および範囲から逸脱することなく個々の処理環境に応じて変更可能である。
さらに、本願に記述の実施形態はデータ・ストレージ・アレイを対象としているが、特許請求を行った主題はこれに限定されるものではなく、特許請求を行った発明の趣旨および範囲から逸脱することなくその他の種々の処理システムを利用することができることを当業者は認めるであろう。
図1は、本発明の実施形態が用いられているコンピュータ・システムを表わした図である。 図2は、図1のコンピュータ・システムを表わした簡略図である。 図3は、本発明の実施形態に従って構成されたインテリジェント・データ・ストレージ・サブシステムの組立分解等角図である。 図4は、図3のインテリジェント・データ・ストレージ・サブシステムの多重ディスク・アレイの組立分解等角図である。 図5は、図4の多重ディスク・アレイにおいて用いられるデータ・ストレージ装置の一例である。 図6は、図3のインテリジェント・データ・ストレージ・サブシステムの機能ブロック図である。 図7は、図3のインテリジェント・データ・ストレージ・サブシステムのインテリジェント・ストレージ・プロセッサ回路基板の機能ブロック図である。 図8は、図3のインテリジェント・データ・ストレージ・サブシステムのインテリジェント・ストレージ・プロセッサの機能ブロック図である。 図9は、図3のインテリジェント・データ・ストレージ・サブシステムが行うコマンド抽出および関連のメモリー・マッピング・サービスを表わした機能ブロック図である。 図10は、図3のインテリジェント・データ・ストレージ・サブシステムが行うデータ・サービスの別の一例の機能ブロック図である。 図11は、データ・ストレージ装置および回路基板が密閉筐体内に収められた図4と略同じ図である。

Claims (20)

  1. 分散型ストレージ・システムのための内蔵型データ・ストレージ・サブシステムであって、
    ストレージ媒体とのデータ保存およびデータ取り出しの関係においてそれぞれ独自に移動可能なアクチュエータに隣接するストレージ媒体をそれぞれが支持する複数の回転式スピンドルと、
    前記分散型ストレージ・システムの遠隔装置が用いる複数の媒体に仮想ストレージ・ボリュームをマッピングし且つこれを管理するようになされたサブシステム・プロセッサとを備えた前記データ・ストレージ・サブシステム。
  2. 請求項1記載のサブシステムにおいて、前記複数のスピンドルおよび媒体は一般的な密閉筐体に収容される前記サブシステム。
  3. 請求項1記載のサブシステムにおいて、前記サブシステム・プロセッサは、データを耐故障手法で保存するためのメモリーを仮想ストレージ・ボリュームの中に割り当てる前記サブシステム。
  4. 請求項3記載のサブシステムにおいて、前記サブシステム・プロセッサは、複数の異なる独立したドライブの冗長アレイ(RAID)方法の内の選択した1つでデータを保存する前記サブシステム。
  5. 請求項1記載のサブシステムにおいて、前記サブシステム・プロセッサは、そのままで、且つ観察されたストレージ・エラーに応答して決定論的予防的復元ステップを自ら開始するようになされた前記サブシステム。
  6. 請求項1記載のサブシステムにおいて、前記データ・ストレージ・サブシステムは複数の媒体を一個のスピンドル上に備える前記サブシステム。
  7. 分散型ストレージ・システムのためのデータ・ストレージ・サブシステムであって、内蔵型の複数の離散的データ・ストレージ装置と、該データ・ストレージ装置と交信するサブシステム・プロセッサとを備え、遠隔装置から受信したコマンドを抽出し、それに応じて関連のメモリー対応付けるようになされた前記データ・ストレージ・サブシステム。
  8. 請求項7記載のサブシステムにおいて、前記サブシステム・プロセッサは、前記分散型ストレージ・システムの1つ以上の遠隔装置が用いる複数のデータ・ストレージ装置に仮想ストレージ・ボリュームをマッピングするようになされた前記サブシステム。
  9. 請求項7記載のサブシステムにおいて、前記複数のデータ・ストレージ装置および媒体は、一般的な密閉筐体の中に収容され、単一障害点はなく、略完璧な回転振動回避および冷却効率を有する前記サブシステム。
  10. 請求項7記載のサブシステムにおいて、前記サブシステム・プロセッサは、耐故障手法でデータを保存するためのメモリーを仮想ストレージ・ボリューム内に割り当てる前記サブシステム。
  11. 請求項10記載のサブシステムにおいて、前記サブシステム・プロセッサは、独立したドライブの冗長アレイ(RAID)方法でデータを保存する前記サブシステム。
  12. 請求項7記載のサブシステムにおいて、前記サブシステム・プロセッサは、前記データ・ストレージ装置において決定論的な予防的復元ステップをそのままで、さらに観察された記憶装置エラーに応答して開始する前記サブシステム。
  13. 分散型ストレージ・システムであって、
    ホストと、
    該ホストとネットワークを介して交信を行い、前記ホストとは無関係に内蔵型ストレージ容量を仮想化する手段を備える後端ストレージ・サブシステムとを備える前記分散型ストレージ・システム。
  14. 請求項13記載のシステムにおいて、前記仮想手段は、それぞれにアクセス可能な複数の離散的データ・ストレージ装置を特徴とする前記システム。
  15. 請求項14記載のシステムにおいて、前記仮想手段は、前記複数のデータ・ストレージ装置に関連づけられたストレージ容量の仮想ブロックをマッピングすることを特徴とする前記システム。
  16. 請求項14記載のシステムにおいて、前記仮想手段は、前記複数のデータ・ストレージ装置および関連の制御装置を収容し密閉することを特徴とする前記システム。
  17. 請求項13記載のシステムにおいて、前記仮想手段は耐故障手法でデータを保存することを特徴とする前記システム。
  18. 請求項13記載のシステムにおいて、前記仮想手段は独立ドライブの冗長アレイ(RAID)手順でデータを保存することを特徴とする前記システム。
  19. 請求項13記載のシステムにおいて、前記仮想手段は、決定論的予防復元ステップをそのままで且つ観測された記憶装置のエラーに応答して開始することを特徴とする前記システム。
  20. 請求項13記載のシステムにおいて、前記仮想手段は、可動データ・ストレージ媒体と非可動データ・ストレージ媒体とのいずれか、またはその両方を備えたデータ・ストレージを特徴とする前記システム。
JP2006154610A 2005-06-03 2006-06-02 ストレージ中心のコンピュータ・システム Pending JP2006344218A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/145,403 US20060288155A1 (en) 2005-06-03 2005-06-03 Storage-centric computer system

Publications (1)

Publication Number Publication Date
JP2006344218A true JP2006344218A (ja) 2006-12-21

Family

ID=37495484

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006154610A Pending JP2006344218A (ja) 2005-06-03 2006-06-02 ストレージ中心のコンピュータ・システム

Country Status (2)

Country Link
US (1) US20060288155A1 (ja)
JP (1) JP2006344218A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009148769A3 (en) * 2008-05-29 2010-04-01 Microsoft Corporation Virtual media device
JP2021531557A (ja) * 2018-07-10 2021-11-18 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation データ・セットにとっておよびデータ・セットの移行にとって最適なストレージ環境の判定

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0651915A (ja) * 1992-08-03 1994-02-25 Hitachi Ltd ディスク装置およびディスクアレイ管理方式
JPH11282636A (ja) * 1997-11-03 1999-10-15 Aiwa Co Ltd 高集積度コントロ―ラを有する高密度raidサブシステム
JP2004164370A (ja) * 2002-11-14 2004-06-10 Hitachi Ltd 仮想ボリュームの記憶領域割当方法、その装置及びプログラム
JP2004348876A (ja) * 2003-05-22 2004-12-09 Hitachi Ltd ディスクアレイ装置及びディスクアレイ装置の制御方法

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3725883A (en) * 1969-10-03 1973-04-03 Burroughs Corp Modular disk file unit
US4454566A (en) * 1981-11-27 1984-06-12 Bell Telephone Laboratories, Incorporated Heat removal from cabinets housing electronic equipment
US5122914A (en) * 1984-01-17 1992-06-16 Norand Corporation Disk drive system with transportable carrier and mounting assembly
US4754397A (en) * 1985-02-15 1988-06-28 Tandem Computers Incorporated Fault tolerant modular subsystems for computers
GB8625648D0 (en) * 1986-10-27 1986-11-26 Gen Electric Co Plc Housing arrangements
US5124886A (en) * 1991-02-25 1992-06-23 Ncr Corporation Drive canister mounting module
US5325270A (en) * 1992-05-29 1994-06-28 Telco Systems, Inc. Modular backplane
US6640235B1 (en) * 1992-08-20 2003-10-28 Intel Corporation Expandable mass disk drive storage system
US5913926A (en) * 1992-08-20 1999-06-22 Farrington Investments Ltd. Expandable modular data storage system having parity storage capability
US5247427A (en) * 1992-08-26 1993-09-21 Data General Corporation Disk array subsystem having elongated T-shaped guides for use in a data processing system
US5822184A (en) * 1994-07-28 1998-10-13 Rabinovitz; Josef Modular disk drive assembly operatively mountable in industry standard expansion bays of personal desktop computers
US5752257A (en) * 1994-07-29 1998-05-12 Nomai Sa Redundant array of removable cartridge disk drives
SE510348C2 (sv) * 1995-04-20 1999-05-17 Ericsson Telefon Ab L M Stativarrangemang för mönster- eller kretskort
US5729763A (en) * 1995-08-15 1998-03-17 Emc Corporation Data storage system
US5875456A (en) * 1995-08-17 1999-02-23 Nstor Corporation Storage device array and methods for striping and unstriping data and for adding and removing disks online to/from a raid storage array
JPH09146711A (ja) * 1995-11-24 1997-06-06 Hitachi Ltd 集合ディスク装置
US6076142A (en) * 1996-03-15 2000-06-13 Ampex Corporation User configurable raid system with multiple data bus segments and removable electrical bridges
US5828547A (en) * 1996-06-10 1998-10-27 Seanix Technology Inc. Computer case having slidably insertable drive housing with U-shaped mounting bracket having inwardly projecting pins on two opposed legs
US5757617A (en) * 1996-08-19 1998-05-26 Sherry; Raymond C. Module with snap-fit cover
JPH10105345A (ja) * 1996-09-27 1998-04-24 Fujitsu Ltd アレイディスク装置
US6092169A (en) * 1997-04-02 2000-07-18 Compaq Computer Corporation Apparatus and method for storage subsystem drive movement and volume addition
US6631477B1 (en) * 1998-03-13 2003-10-07 Emc Corporation Host system for mass storage business continuance volumes
US6230240B1 (en) * 1998-06-23 2001-05-08 Hewlett-Packard Company Storage management system and auto-RAID transaction manager for coherent memory map across hot plug interface
US6230217B1 (en) * 1998-12-30 2001-05-08 Raytheon Company Data storage system having a host computer coupled to bank of disk drives through interface comprising plurality of directors, buses, and a PCB connectors
US6320744B1 (en) * 1999-02-19 2001-11-20 General Dynamics Information Systesm, Inc. Data storage housing
US6201692B1 (en) * 1999-03-31 2001-03-13 International Business Machines Corporation Disk drive enclosure optimized for mixed slim and half high drive size
US6574687B1 (en) * 1999-12-29 2003-06-03 Emc Corporation Fibre channel data storage system
US6651138B2 (en) * 2000-01-27 2003-11-18 Hewlett-Packard Development Company, L.P. Hot-plug memory catridge power control logic
US6442022B1 (en) * 2000-04-25 2002-08-27 Storcase Technology, Inc. Replaceable SCA drive adapter board for a removable disc drive carrier
JP4633886B2 (ja) * 2000-05-25 2011-02-16 株式会社日立製作所 ディスクアレイ装置
US6496376B1 (en) * 2000-06-02 2002-12-17 John Plunkett Modular backplane
US6708265B1 (en) * 2000-06-27 2004-03-16 Emc Corporation Method and apparatus for moving accesses to logical entities from one storage element to another storage element in a computer storage system
US6820171B1 (en) * 2000-06-30 2004-11-16 Lsi Logic Corporation Methods and structures for an extensible RAID storage architecture
US6594744B1 (en) * 2000-12-11 2003-07-15 Lsi Logic Corporation Managing a snapshot volume or one or more checkpoint volumes with multiple point-in-time images in a single repository
US6748502B2 (en) * 2001-01-12 2004-06-08 Hitachi, Ltd. Virtual volume storage
GB2407896B (en) * 2001-01-31 2005-06-22 Hewlett Packard Co Storage apparatus
US6795895B2 (en) * 2001-03-07 2004-09-21 Canopy Group Dual axis RAID systems for enhanced bandwidth and reliability
US20020131257A1 (en) * 2001-03-14 2002-09-19 Agard Kenneth K. Detachable partition extension
US6957291B2 (en) * 2001-03-29 2005-10-18 Quantum Corporation Removable disk storage array emulating tape library having backup and archive capability
US6464509B1 (en) * 2001-04-26 2002-10-15 International Business Machines Corporation System and method requiring zero insertion force and positive retention of removable storage media in a data storage subsystem
US6757753B1 (en) * 2001-06-06 2004-06-29 Lsi Logic Corporation Uniform routing of storage access requests through redundant array controllers
US6874100B2 (en) * 2001-07-12 2005-03-29 Digi-Data Corporation Raid system with multiple controllers and proof against any single point of failure
US6883066B2 (en) * 2001-09-14 2005-04-19 Seagate Technology Llc Method and system for cache management algorithm selection
US20030081378A1 (en) * 2001-10-31 2003-05-01 Atto Technology, Inc. Disk drive carrier for use in a disk storage system
US6856508B2 (en) * 2002-09-23 2005-02-15 Josef Rabinovitz Modular data storage device assembly
US7263593B2 (en) * 2002-11-25 2007-08-28 Hitachi, Ltd. Virtualization controller and data transfer control method
US6683793B1 (en) * 2002-12-13 2004-01-27 Storage Technology Corporation Distributed scalable backplane
US7028138B2 (en) * 2003-01-28 2006-04-11 Dell Products L.P. RAID configuration protocol for SCSI drives and RAID controllers
US7143235B1 (en) * 2003-03-21 2006-11-28 Network Appliance, Inc. Proposed configuration management behaviors in a raid subsystem
US20050071560A1 (en) * 2003-09-30 2005-03-31 International Business Machines Corp. Autonomic block-level hierarchical storage management for storage networks
JP2005222379A (ja) * 2004-02-06 2005-08-18 Hitachi Ltd ディスクアレイ装置およびその障害回避制御方法
JP2006195712A (ja) * 2005-01-13 2006-07-27 Hitachi Ltd ストレージ制御装置、論理ボリューム管理方法及びストレージ装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0651915A (ja) * 1992-08-03 1994-02-25 Hitachi Ltd ディスク装置およびディスクアレイ管理方式
JPH11282636A (ja) * 1997-11-03 1999-10-15 Aiwa Co Ltd 高集積度コントロ―ラを有する高密度raidサブシステム
JP2004164370A (ja) * 2002-11-14 2004-06-10 Hitachi Ltd 仮想ボリュームの記憶領域割当方法、その装置及びプログラム
JP2004348876A (ja) * 2003-05-22 2004-12-09 Hitachi Ltd ディスクアレイ装置及びディスクアレイ装置の制御方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009148769A3 (en) * 2008-05-29 2010-04-01 Microsoft Corporation Virtual media device
US8645579B2 (en) 2008-05-29 2014-02-04 Microsoft Corporation Virtual media device
JP2021531557A (ja) * 2018-07-10 2021-11-18 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation データ・セットにとっておよびデータ・セットの移行にとって最適なストレージ環境の判定

Also Published As

Publication number Publication date
US20060288155A1 (en) 2006-12-21

Similar Documents

Publication Publication Date Title
US7984258B2 (en) Distributed storage system with global sparing
US7966449B2 (en) Distributed storage system with global replication
JP5523468B2 (ja) 直接接続ストレージ・システムのためのアクティブ−アクティブ・フェイルオーバー
US8028193B2 (en) Failover of blade servers in a data center
JP4986045B2 (ja) 二重アクティブ・コントローラ内のライト・キャッシュ・データのフェイルオーバーおよびフェイルバック
US7913038B2 (en) Distributed storage system with accelerated striping
US6571354B1 (en) Method and apparatus for storage unit replacement according to array priority
JP3714613B2 (ja) 記憶装置、該記憶装置を含む情報処理装置および情報記憶システムのリカバリ方法
US6598174B1 (en) Method and apparatus for storage unit replacement in non-redundant array
JP5057741B2 (ja) ストレージ装置
US20060059308A1 (en) Storage device and device changeover control method for storage devices
US7945773B2 (en) Failover of blade servers in a data center
EP1324185A2 (en) System and method for partitioning a storage area network associated data library employing element addresses
US8745326B2 (en) Request priority seek manager
JP2006107080A (ja) ストレージ装置システム
US7707362B2 (en) Context-free data transactions between dual operating systems embedded within a data storage subsystem
US10572188B2 (en) Server-embedded distributed storage system
JP5594942B2 (ja) 好適なゾーン・スケジューリング
JP2006344218A (ja) ストレージ中心のコンピュータ・システム
JP2015158702A (ja) ストレージシステム、制御装置及び制御プログラム
JP5150947B2 (ja) 広域予備化した分散記憶システム
JP2007018539A (ja) ディスクアレイ制御装置およびディスクアレイ制御ユニット
JP2008016028A (ja) 広域複製を持つ分散記憶システム
JP2008033921A (ja) 加速ストライピングによる分散記憶システム
WO2010056239A1 (en) Active-active failover for a direct-attached storage system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090602

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20100526

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110822

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110906

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120214