JP5184552B2 - コンピュータストレージシステム - Google Patents

コンピュータストレージシステム Download PDF

Info

Publication number
JP5184552B2
JP5184552B2 JP2009544967A JP2009544967A JP5184552B2 JP 5184552 B2 JP5184552 B2 JP 5184552B2 JP 2009544967 A JP2009544967 A JP 2009544967A JP 2009544967 A JP2009544967 A JP 2009544967A JP 5184552 B2 JP5184552 B2 JP 5184552B2
Authority
JP
Japan
Prior art keywords
server
servers
redundant storage
cache
logical block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009544967A
Other languages
English (en)
Other versions
JP2010515196A (ja
Inventor
ディー バリュー,ジェームズ
ヴィー デイヴィッドソン,シャノン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Raytheon Co
Original Assignee
Raytheon Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Raytheon Co filed Critical Raytheon Co
Publication of JP2010515196A publication Critical patent/JP2010515196A/ja
Application granted granted Critical
Publication of JP5184552B2 publication Critical patent/JP5184552B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2089Redundant storage control functionality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2038Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2046Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share persistent storage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2097Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements maintaining the standby controller/processing unit updated
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • G06F12/0802Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
    • G06F12/0866Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches for peripheral storage systems, e.g. disk cache

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Hardware Redundancy (AREA)

Description

[関連出願]
本出願は、2007年1月3日に出願された米国特許出願第60/883,272号“LOW COST COMPUTER STORAGE SYSTEM”の35 U.S.C.§119(e)による利益を請求する。
[本開示の技術分野]
本開示は、コンピュータストレージシステムに関し、より詳細には、コンピュータストレージシステム及びその動作方法に関する。
[本開示の背景]
大規模な組織の複雑な計算要求を満たすように、ストレージエリアネットワークが開発されてきた。ストレージエリアネットワークは、1以上のディスクサーバに格納されているデータへの分散化されたアクセスを可能にする。ネットワークの分散化は、比較的大量のデータを格納し、利用性を向上させる冗長性の利用を可能にする。
一実施例によると、コンピュータストレージシステムは、1以上のキャッシュサーバに接続される1以上のリダンダントストレージサーバを有する。リダンダントストレージサーバは、各ディスクサーバに接続される。ディスクサーバは、データを格納するよう動作可能な少なくとも1つの大容量ストレージディスクを有する。データは、各論理ブロックが関連付けされた論理ブロック識別子に従ってセグメント化される論理ブロックに従ってセグメント化される。リダンダントストレージサーバは、ディスクサーバの少なくとも2つの各論理ブロックを複製するよう動作可能である。キャッシュサーバは、キャッシュメモリを有し、各リダンダントストレージサーバに接続される。各キャッシュサーバは、関連付けされた論理ブロック識別子に従って複製された論理ブロックにアクセスし、キャッシュメモリにキャッシュするよう動作可能である。
特定の実施例は、多数の技術的効果を提供するかもしれない。一実施例の技術的効果は、リダンダントディスクサーバ、ストレージサーバ及びキャッシュサーバが比較的高い利用性を有する耐故障性を有するコンピュータストレージシステムを提供するということであるかもしれない。
特定の効果が上述されたが、各種実施例は、上述された効果のすべて又は一部を有してもよく、又はその何れも有しないかもしれない。さらに、他の技術的効果は、以下の図面及び説明を参照した後、当業者に容易に明らかになるであろう。
[図面の簡単な説明]
本開示の実施例のより完全な理解は、添付した図面に関連した詳細な説明から明らかになるであろう。
図1は、本開示の教示によるコンピュータストレージシステムの一実施例を示すブロック図である。 図2は、図1のコンピュータストレージシステムのキャッシュサーバの一実施例を示す図である。 図3は、図1のコンピュータストレージシステムにより実行されるステップ系列の一実施例を示すフローチャートである。
[実施例の詳細な説明]
ストレージエリアネットワーク(SAN)は、ネットワークを介し大容量ストレージディスクとクライアントとを接続する。企業などの大規模なエンティティは、比較的大量のデータを格納するため、ストレージエリアネットワークを介し接続された大容量ストレージディスクのアレイを使用するかもしれない。サーバは、データへのアクセスを提供するため、ファイバチャネル(FC)などの高いパフォーマンスのプロトコルを使用するかもしれない。しかしながら、これらの高パフォーマンスネットワークを利用したストレージシステムは、実現及び維持するのに比較的高価であるかもしれない。
図1は、コンピュータストレージシステム10の一実施例を示す。コンピュータストレージシステム10は、1以上のディスクサーバ12と、1以上のリダンダントストレージサーバ14と、1以上のクライアント22によりアクセスされるデータを格納する1以上のキャッシュサーバ16とを有する。データは、各ディスクサーバ12に構成される1以上の大容量ストレージディスク18に格納されるかもしれない。各リダンダントストレージサーバ14は、各ディスクサーバ12に接続されてもよい。各キャッシュサーバ16は、各リダンダントストレージサーバ14に接続されてもよい。以下で詳述されるように、コンピュータストレージシステム10は、高いパフォーマンスと利用性を有するストレージアーキテクチャを提供するかもしれない。
ディスクサーバ12は、大容量ストレージディスク18にデータを格納する。大容量ストレージディスク18は、32テラバイトデータ以上などの何れか適切な容量を有してもよい。大容量ストレージディスク18のデータは、毎秒200ギガバイト以上など、何れか適切なアクセスレートによりアクセスされるようにしてもよい。
データは、論理ブロックに従って大容量ストレージディスク18にセグメント化されるかもしれない。論理ブロックは、一般に大容量ストレージディスク18の使用可能なメモリの一部を有する。各論理ブロックの容量は、一般に大容量ストレージディスク18のメモリ部分の物理構成に対応する。論理ブロック識別子は、各論理ブロックに関連付けされる。論理ブロックは、それらに関連付けされた論理ブロック識別子に従ってアクセスされるかもしれない。
リダンダントストレージサーバ14は、ディスクサーバ12にあるデータを冗長的に格納するよう動作可能である。各ディスクサーバ12は、7200RPM(Revolutions−Per−Minute)で動作するSATA(Serial Advanced Technology Attachment)による8つの500ギガバイト大容量ストレージディスク18を有してもよい。ディスクサーバ12が故障した場合、リダンダントストレージサーバ14がデータを提供することができる。一実施例では、リダンダントストレージサーバ14は、故障したリダンダントストレージサーバ14の代わりに機能するスペアのリダンダントストレージサーバ14’を有してもよい。リダンダントストレージサーバ14は、その他のリダンダントストレージサーバ14にハートビートメッセージを送信してもよい。有効なレスポンスが受信されない場合、リダンダントストレージサーバ14は、スペアなリダンダントストレージサーバ14’に応答のないリダンダントストレージサーバ14の処理を移す。
一実施例では、リダンダントストレージサーバ14は、RAID−5(Redundant Array of Inexpensive Disks level 5)プロトコルなどのRAIDプロトコルに従って実現される。しかしながら、何れか適切なデータ複製プロトコルが利用されてもよい。
各リダンダントストレージサーバ14は、何れかのストレージエリアネットワークプロトコルを利用して各ディスクサーバ12に接続されてもよい。ストレージエリアネットワークプロトコルの具体例として、iSCSI(Internet Small Computer System Interface)プロトコル、AoE(Advanced technology attachement over the Ethernet)プロトコル、Infinibandプロトコル、PCIe(Peripheral Component Interconnect express)プロトコル、又はeSATA(Ethernet over Serial Advanced Technology Attachment)プロトコルなどがあげられる。ストレージエリアネットワークプロトコルは、論理ブロック識別子に従って論理ブロックに格納されているデータへのアクセスをディスクサーバ12に提供する。
キャッシュサーバ16は、クライアント22とリダンダントストレージサーバ14との間に接続される。各キャッシュサーバ16は、各リダンダントストレージサーバ14に接続されてもよい。キャッシュサーバ16は、リダンダントストレージサーバ14にあるデータにアクセスし、当該データをキャッシュメモリ20に格納する。キャッシュメモリ20は、レベル1キャッシュとして実現されるかもしれない。キャッシュメモリ20は、96ギガバイトまでのストレージと、毎秒400ギガバイトまでのアクセスレートを提供するかもしれない。キャッシュサーバ16が、図2A及び2Bを参照してより詳細に説明される。
リダンダントストレージサーバ14が故障した場合、キャッシュサーバ16がデータを提供するようにしてもよい。一実施例では、キャッシュサーバ16は、故障したキャッシュサーバ16の代わりに動作するスペアのキャッシュサーバ16’を有してもよい。キャッシュサーバ16は、ハートビートメッセージを他のキャッシュサーバ16に送信してもよい。有効なレスポンスが受信されない場合、キャッシュサーバ16は、応答のないキャッシュサーバ16の処理をスペアのキャッシュサーバ16’に移す。
キャッシュサーバ16は、何れか適切なストレージエリアネットワークプロトコルを使用して、リダンダントストレージサーバ14とクライアント22に接続されてもよい。プロトコルの具体例として、リダンダントストレージシステム14を参照して説明されたものなどがあげられる。ストレージエリアネットワークプロトコルは、関連付けされた論理ブロック識別子に従って論理ブロックに格納されているデータへのアクセスをクライアント22に提供するようにしてもよい。
ディスクサーバ12、リダンダントストレージサーバ14及びキャッシュサーバ16は、何れか適切な構成を有してもよい。一例では、ディスクサーバ12、リダンダントストレージサーバ14及びキャッシュサーバ16は、シングルソケットデュアルコアプロセッサを有する民生用の計算システムを有してもよい。ディスクサーバ12及びリダンダントストレージサーバ14は少なくとも2ギガバイトのシステムメモリにより実現され、キャッシュサーバ16は少なくとも12ギガバイトのシステムメモリにより実現されてもよい。
本発明の範囲から逸脱することなく、コンピュータストレージシステム10に変更、追加又は省略が可能である。コンピュータストレージシステム10の各コンポーネントが統合又は分離されてもよい。例えば、キャッシュサーバ16の処理は、リダンダントストレージサーバ14に統合されてもよい。さらに、コンピュータストレージシステム10の処理は、より多く、より少なく又は他のコンポーネントにより実行されてもよい。例えば、ディスクサーバ12は、何れか適切な個数の大容量ストレージディスク18を有してもよい。さらに、コンピュータストレージシステム10の処理は、ソフトウェア、ハードウェア及び/又は他のロジックを有する何れか適切なロジックを用いて実行されてもよい。本明細書で使用される“各又はそれぞれ”とは、ある集合の各メンバー又はある集合のサブセットの各メンバーを表す。
図2は、図1のキャッシュサーバ16の実施例を示す。キャッシュサーバ16は、プロセッサ24と、キャッシュメモリ20と、1以上の入出力ポート26とを有する。プロセッサ24は、キャッシュメモリ20に格納されている命令を実行する。入出力ポート26は、プロセッサ24をリダンダントストレージサーバ14及びクライアント22に接続する。
キャッシュサーバ16は、パーソナルコンピュータ、ラップトップコンピュータ、メインフレームコンピュータなどの何れか適切な計算システムを有してもよい。一実施例では、キャッシュサーバ16は、他のブレードサーバの間でラック内に配置可能なブレードサーバである。他の実施例では、キャッシュサーバ16は、キャッシュメモリ20として動作可能なシステムメモリを有するCOTS(Commercial Off−The−Shelf)コンピュータを有してもよい。キャッシュメモリ20は、DRAM(Dynamic Random Access Memory)やSRAM(Static Random Access Memory)など、COTS又は民生用コンピュータと共に使用可能な何れか適切なタイプのメモリであってもよい。他の実施例では、キャッシュメモリ20はレベル1キャッシュとして実現されてもよい。
一実施例では、キャッシュサーバ16は、各キャッシュサーバ16にデータを分散させるかもしれない。このようにして、キャッシュメモリ20は、キャッシュサーバ16として実現される複数のCOTSマザーボードのシステムメモリにより提供されるかもしれない。
論理ブロックとして大容量ストレージディスク18に格納されているデータの一部は、論理ブロックとしてキャッシュメモリ20に複製されてもよい。クライアント22は、大容量ストレージディスク18より迅速にキャッシュメモリ20からデータにアクセスするかもしれない。一実施例では、論理ブロックは、LUN(Logical Unit Number)識別子と通常呼ばれるLinuxブロックデバイスに従ってフォーマット化されるかもしれない。
キャッシュサーバ16は、クライアント22からリクエストを受信し、当該リクエストをリダンダントストレージサーバ14に転送するか、又は利用可能である場合にはキャッシュメモリ20からデータにアクセスするかもしれない。データがキャッシュメモリ20から直接抽出される場合、データに対するクライアントのリクエストに対するレスポンスの遅延は、軽減されるかもしれない。
一実施例では、プロセッサ24は、LRU(Least Recently Used)プロセスに従ってキャッシュメモリ20に格納するため、論理ブロックの一部を選択するかもしれない。すなわち、プロセッサ24は、他の論理ブロックよりあまりアクセスされなかったデータの論理ブロックをキャッシュメモリ20から間引く。
複数のキャッシュサーバ16を有する特定の実施例では、論理ブロックは、論理ブロック識別子の最下位ブロックアドレスに従って各キャッシュサーバ16にストライプ化されるかもしれない。クライアント22は、データのアクセス前に各ブロックアドレス識別子を読み込むことによって、データのリクエストを適切なキャッシュサーバ16に指示するかもしれない。このようにして、クライアント22は、所望のデータを有するキャッシュサーバ16を正しく確認するかもしれない。
図3は、コンピュータストレージシステム10により実行されるステップ系列の一実施例を示す。ステップ100において、当該プロセスが開始される。
ステップ102において、キャッシュサーバ16は、クライアント22からデータのリクエストを受信する。このリクエストは、リクエストされたデータを含む論理ブロックに係る論理ブロック識別子を含むかもしれない。一実施例では、キャッシュサーバ16は、論理ブロックに係る論理ブロック識別子の最下位ブロックアドレスに従ってストライプ化された複数のキャッシュサーバ16の1つであってもよい。
ステップ104において、キャッシュサーバ16は、大容量ストレージディスク18からリクエストされた論理ブロックにアクセスする。一実施例では、キャッシュサーバ16は、リクエストされた論理ブロックがそれに関連付けされた論理ブロック識別子に従ってアクセスされるように、ストレージエリアネットワークを介し大容量ストレージディスク18に接続されてもよい。
ステップ106において、キャッシュサーバ16は、リクエストされた論理ブロックの一部をキャッシュメモリ20にキャッシュする。一実施例では、この論理ブロックの一部は、LRUプロセスに従ってキャッシュされる。このようにして、比較的頻繁にアクセスされる論理ブロックは、クライアント22からの以降のアクセスリクエストに対する比較的迅速なアクセスのため、キャッシュメモリ20に格納されてもよい。キャッシュメモリ20は、クライアント22によるデータのリクエストがキャッシュサーバ16からサービスを提供されるように、頻繁に使用されるデータを格納し、これにより、ディスクサーバ12を介したデータのアクセスのスループット遅延を軽減することができる。
ステップ108において、当該プロセスは終了する。
本開示の範囲から逸脱することなく、本方法に対する変更、追加又は省略が可能である。本方法は、より多く、より少なく又は他のステップを有してもよい。例えば、キャッシュサーバ16は、故障したリダンダントストレージサーバ14の代わりに動作するスペアのリダンダントストレージサーバ14からのデータにアクセスするかもしれない。
本開示は複数の実施例を記載するが、多数の変更、変形、代替、変換及び改良が当業者に示唆されるかもしれず、本開示はそのような変更、変形、代替、変換及び改良を添付した請求項の範囲内に属するものとして包括することが意図される。

Claims (21)

  1. 各リダンダントストレージサーバが各自の通信パスを介し複数のディスクサーバのそれぞれに接続される複数のリダンダントストレージサーバであって、各通信パスはリダンダントストレージサーバとさらなるリダンダントストレージサーバを含まないディスクサーバとの間のものであり、各ディスクサーバは、各論理ブロックが関連付けされた論理ブロック識別子を有する複数の論理ブロックに従ってセグメント化されたデータを格納するよう動作可能な少なくとも1つの大容量ストレージディスクを有し、前記複数のリダンダントストレージサーバは、前記複数のディスクサーバの少なくとも2つの各論理ブロックを複製するよう動作可能である、前記リダンダントストレージサーバと、
    各リダンダントストレージサーバに接続され、キャッシュメモリを有する少なくとも1つのキャッシュサーバであって、前記少なくとも1つのキャッシュサーバは、前記少なくとも1つのキャッシュサーバに接続されるクライアントから、前記複数のリダンダントストレージサーバに接続される複数のディスクサーバによって格納されているデータの複数の論理ブロック識別子を有するリクエストを受信し、前記複数の論理ブロック識別子に従って前記複製された論理ブロックにアクセスし、前記複数の論理ブロック識別子に従って前記複製された論理ブロックの一部を前記キャッシュメモリにキャッシュする、前記少なくとも1つのキャッシュサーバと、
    を有するコンピュータにより実現されるストレージシステム。
  2. 前記複数のリダンダントストレージサーバは、他のリダンダントストレージサーバが故障した場合、前記他のリダンダントストレージサーバの代わりに機能するよう動作可能なスペアのリダンダントストレージサーバを含む、請求項1記載のシステム。
  3. 前記複数のリダンダントストレージサーバは、スペアのリダンダントストレージサーバを含み、
    前記複数のリダンダントストレージサーバのそれぞれは、
    他のリダンダントストレージサーバにハートビートメッセージを送信し、
    前記ハートビートメッセージへの応答が受信されない場合、前記他のリダンダントストレージサーバの処理を前記スペアのリダンダントストレージサーバに移す、
    よう動作可能である、請求項1記載のシステム。
  4. 前記少なくとも1つのキャッシュサーバは、他のキャッシュサーバが故障した場合、前記他のキャッシュサーバの代わりに機能するよう動作可能なスペアのキャッシュサーバを含む複数のキャッシュサーバを有する、請求項1記載のシステム。
  5. 前記少なく1つのキャッシュサーバは、スペアのキャッシュサーバを含む複数のキャッシュサーバを有し、
    前記複数のキャッシュサーバのそれぞれは、
    他のキャッシュサーバにハートビートメッセージを送信し、
    前記ハートビートメッセージへの応答が受信されない場合、前記他のキャッシュサーバの処理を前記スペアのキャッシュサーバに移す、
    よう動作可能である、請求項1記載のシステム。
  6. 前記複数のリダンダントストレージサーバは、ストレージエリアネットワークプロトコルを使用して前記複数のディスクサーバのそれぞれに接続される、請求項1記載のシステム。
  7. 前記複数のリダンダントストレージサーバは、iSCSI(Internet Small Computer System Interface)、AoE(Advanced technology attachement over the Ethernet)、Infiniband、PCIe(Peripheral Component Interconnect express)及びeSATA(Ethernet over Serial Advanced Technology Attachment)からなる群から選ばれたストレージエリアネットワークプロトコルを使用して、前記複数のディスクサーバのそれぞれに接続される、請求項1記載のシステム。
  8. 前記少なくとも1つのキャッシュサーバは、ストレージエリアネットワークプロトコルを使用して前記複数のリダンダントストレージサーバのそれぞれに接続される、請求項1記載のシステム。
  9. 前記少なくとも1つのキャッシュサーバは、iSCSI(Internet Small Computer System Interface)、AoE(Advanced technology attachement over the Ethernet)、Infiniband、PCIe(Peripheral Component Interconnect express)及びeSATA(Ethernet over Serial Advanced Technology Attachment)からなる群から選ばれたストレージエリアネットワークプロトコルを使用して、前記複数のリダンダントストレージサーバのそれぞれに接続される、請求項1記載のシステム。
  10. 前記少なくとも1つのキャッシュサーバはさらに、LRU(Least−Recently−Used)プロセスに従って前記複製された論理ブロックの一部をキャッシュするよう動作可能である、請求項1記載のシステム。
  11. 前記複数のリダンダントストレージサーバは、RAID5(Redundant Array of Inexpensive Disks level 5)に従って共に構成される、請求項1記載のシステム。
  12. 複数のリダンダントストレージサーバが、複数のディスクサーバにアクセスするステップとであって、各リダンダントストレージサーバは各自の通信パスを介し各ディスクサーバに接続され、各通信パスはリダンダントストレージサーバとさらなるリダンダントストレージサーバを含まないディスクサーバとの間のものであり、各ディスクサーバは、各論理ブロックが関連付けされた論理ブロック識別子を有する複数の論理ブロックに従ってセグメント化されたデータを格納するよう動作可能な少なくとも1つの大容量ストレージディスクを有する、前記複数のディスクサーバにアクセスするステップと、
    前記複数のディスクサーバの少なくとも2つの各論理ブロックを複製するステップと、
    少なくとも1つのキャッシュサーバが、前記少なくとも1つのキャッシュサーバに接続されるクライアントから、前記複数のリダンダントストレージサーバに接続される複数のディスクサーバによって格納されているデータの複数の論理ブロック識別子を有するリクエストを受信するステップと、
    前記少なくとも1つのキャッシュサーバ、前記複数の論理ブロック識別子に従って前記複製された論理ブロックにアクセスするステップであって、前記少なくとも1つのキャッシュサーバはキャッシュメモリを有し、各リダンダントストレージサーバに接続される、前記複製された論理ブロックにアクセスするステップと、
    前記複数の論理ブロック識別子に従って前記複製された複数の論理ブロックの一部を前記キャッシュメモリにキャッシュするステップと、
    を有するコンピュータにより実現される方法。
  13. 前記関連付けされた複数の論理ブロック識別子に従って前記複製された論理ブロックにアクセスするステップはさらに、故障した他のリダンダントストレージサーバに代わって機能するスペアのリダンダントストレージサーバを介し前記複製された論理ブロックにアクセスする、請求項12記載の方法。
  14. 他のリダンダントストレージサーバにハートビートメッセージを送信するステップと、
    前記ハートビートメッセージへの応答が受信されない場合、前記他のリダンダントストレージサーバの処理をスペアのリダンダントストレージサーバに移すステップと、
    をさらに有する、請求項12記載の方法。
  15. 前記関連付けされた複数の論理ブロック識別子に従って前記複製された論理ブロックにアクセスするステップはさらに、故障した他のキャッシュサーバに代わって機能するスペアのキャッシュサーバを介し前記複製された論理ブロックにアクセスする、請求項12記載の方法。
  16. 他のキャッシュサーバにハートビートメッセージを送信するステップと、
    前記ハートビートメッセージへの応答が受信されない場合、前記他のキャッシュサーバの処理をスペアのキャッシュサーバに移すステップと、
    をさらに有する、請求項12記載の方法。
  17. 前記複数のリダンダントストレージサーバは、イーサネットプロトコルを使用して前記複数のディスクサーバのそれぞれに接続される、請求項12記載の方法。
  18. 前記複数のリダンダントストレージサーバは、iSCSI(Internet Small Computer System Interface)、AoE(Advanced technology attachement over the Ethernet)、Infiniband、PCIe(Peripheral Component Interconnect express)及びeSATA(Ethernet over Serial Advanced Technology Attachment)からなる群から選ばれたプロトコルを使用して、前記複数のディスクサーバのそれぞれに接続される、請求項12記載の方法。
  19. 前記複製された論理ブロックの一部は、LRU(Least−Recently−Used)プロセスに従ってキャッシュされる、請求項12記載の方法。
  20. 前記複数のリダンダントストレージサーバは、RAID5(Redundant Array of Inexpensive Disks level 5)に従って共に構成される、請求項12記載の方法。
  21. 各リダンダントストレージサーバが各自の通信パスを介しストレージエリアネットワークプロトコルを使用して複数のディスクサーバのそれぞれに接続される複数のリダンダントストレージサーバであって、各通信パスはリダンダントストレージサーバとさらなるリダンダントストレージサーバを含まないディスクサーバとの間のものであり、各ディスクサーバは、各論理ブロックが関連付けされた論理ブロック識別子を有する複数の論理ブロックに従ってセグメント化されたデータを格納するよう動作可能な少なくとも1つの大容量ストレージディスクを有し、前記複数のリダンダントストレージサーバは、スペアのリダンダントストレージサーバを有し、前記複数のディスクサーバの少なくとも2つの各論理ブロックを複製するよう動作可能な前記複数のリダンダントストレージサーバと、
    各キャッシュサーバがストレージエリアネットワークプロトコルを使用して各リダンダントストレージサーバに接続され、キャッシュメモリを有する複数のキャッシュサーバであって、前記複数のキャッシュサーバはスペアのキャッシュサーバを有し、各キャッシュサーバは、該キャッシュサーバに接続されたクライアントから、前記複数のリダンダントストレージサーバに接続される前記複数のディスクサーバによって格納されているデータの複数の論理ブロック識別子を有するリクエストを受信し、前記複数の論理ブロック識別子に従って前記複製された複数の論理ブロックにアクセスし、前記複数の論理ブロック識別子に従って前記複製された複数の論理ブロックの一部を前記各キャッシュサーバのキャッシュメモリにキャッシュするよう動作可能である、前記複数のキャッシュサーバと、
    を有するコンピュータにより実現されるストレージシステム。
JP2009544967A 2007-01-03 2008-01-03 コンピュータストレージシステム Active JP5184552B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US88327207P 2007-01-03 2007-01-03
US60/883,272 2007-01-03
PCT/US2008/050086 WO2008086077A1 (en) 2007-01-03 2008-01-03 Computer storage system

Publications (2)

Publication Number Publication Date
JP2010515196A JP2010515196A (ja) 2010-05-06
JP5184552B2 true JP5184552B2 (ja) 2013-04-17

Family

ID=39420629

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009544967A Active JP5184552B2 (ja) 2007-01-03 2008-01-03 コンピュータストレージシステム

Country Status (6)

Country Link
US (1) US8145837B2 (ja)
EP (1) EP2100224B1 (ja)
JP (1) JP5184552B2 (ja)
AT (1) ATE492846T1 (ja)
DE (1) DE602008004088D1 (ja)
WO (1) WO2008086077A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7468913B2 (ja) 2019-03-06 2024-04-16 アールト・ユニバーシティ・ファウンデイション・エスアール 磁場センサに関する磁気共鳴データの位置の決定

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9178784B2 (en) 2004-04-15 2015-11-03 Raytheon Company System and method for cluster management based on HPC architecture
US8336040B2 (en) 2004-04-15 2012-12-18 Raytheon Company System and method for topology-aware job scheduling and backfilling in an HPC environment
US8335909B2 (en) 2004-04-15 2012-12-18 Raytheon Company Coupling processors to each other for high performance computing (HPC)
US8626936B2 (en) * 2008-01-23 2014-01-07 International Business Machines Corporation Protocol independent server replacement and replication in a storage area network
US8615678B1 (en) * 2008-06-30 2013-12-24 Emc Corporation Auto-adapting multi-tier cache
US8825789B2 (en) * 2008-12-16 2014-09-02 Netapp, Inc. Method and apparatus to implement a hierarchical cache system with pNFS
CN105162856B (zh) * 2012-10-16 2019-03-01 北京奇虎科技有限公司 网络应用集成系统和方法
CN102868565B (zh) * 2012-10-16 2015-10-14 北京奇虎科技有限公司 网络应用系统和方法
US10244391B2 (en) * 2015-03-19 2019-03-26 Cloud-Clout, LLC Secure computer file storage system and method
US10592268B2 (en) * 2015-04-06 2020-03-17 Hitachi, Ltd. Management computer and resource management method configured to combine server resources and storage resources and allocate the combined resources to virtual machines
US10437747B2 (en) 2015-04-10 2019-10-08 Rambus Inc. Memory appliance couplings and operations
JP6409812B2 (ja) * 2016-04-01 2018-10-24 横河電機株式会社 冗長化装置、冗長化システム、及び冗長化方法
CN108769244B (zh) * 2018-06-14 2021-06-29 郑州云海信息技术有限公司 一种存储任务信息获取方法及相关装置

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5459857A (en) 1992-05-15 1995-10-17 Storage Technology Corporation Fault tolerant disk array data storage subsystem
US5504882A (en) * 1994-06-20 1996-04-02 International Business Machines Corporation Fault tolerant data storage subsystem employing hierarchically arranged controllers
JPH1063576A (ja) * 1996-08-27 1998-03-06 Hitachi Ltd 階層ディスク装置およびその制御方法
US6009481A (en) * 1996-09-30 1999-12-28 Emc Corporation Mass storage system using internal system-level mirroring
US5941972A (en) * 1997-12-31 1999-08-24 Crossroads Systems, Inc. Storage router and method for providing virtual local storage
US20020103889A1 (en) * 2000-02-11 2002-08-01 Thomas Markson Virtual storage layer approach for dynamically associating computer storage with processing hosts
US6820171B1 (en) * 2000-06-30 2004-11-16 Lsi Logic Corporation Methods and structures for an extensible RAID storage architecture
US6977927B1 (en) * 2000-09-18 2005-12-20 Hewlett-Packard Development Company, L.P. Method and system of allocating storage resources in a storage area network
US6792507B2 (en) * 2000-12-14 2004-09-14 Maxxan Systems, Inc. Caching system and method for a network storage system
EP1370950B1 (en) * 2001-02-13 2017-12-27 NetApp, Inc. System and method for policy based storage provisioning and management
US6728736B2 (en) * 2001-03-14 2004-04-27 Storage Technology Corporation System and method for synchronizing a data copy using an accumulation remote copy trio
US7231430B2 (en) * 2001-04-20 2007-06-12 Egenera, Inc. Reconfigurable, virtual processing system, cluster, network and method
US6587921B2 (en) * 2001-05-07 2003-07-01 International Business Machines Corporation Method and apparatus for cache synchronization in a clustered environment
US6675264B2 (en) * 2001-05-07 2004-01-06 International Business Machines Corporation Method and apparatus for improving write performance in a cluster-based file system
US6996674B2 (en) * 2001-05-07 2006-02-07 International Business Machines Corporation Method and apparatus for a global cache directory in a storage cluster
US6944785B2 (en) * 2001-07-23 2005-09-13 Network Appliance, Inc. High-availability cluster virtual server system
EP1563389A4 (en) * 2001-08-01 2008-06-25 Actona Technologies Ltd VIRTUAL DATA DISTRIBUTION NETWORK
US6976134B1 (en) * 2001-09-28 2005-12-13 Emc Corporation Pooling and provisioning storage resources in a storage network
US7340555B2 (en) * 2001-09-28 2008-03-04 Dot Hill Systems Corporation RAID system for performing efficient mirrored posted-write operations
US7185062B2 (en) * 2001-09-28 2007-02-27 Emc Corporation Switch-based storage services
US7127633B1 (en) * 2001-11-15 2006-10-24 Xiotech Corporation System and method to failover storage area network targets from one interface to another
US7055056B2 (en) * 2001-11-21 2006-05-30 Hewlett-Packard Development Company, L.P. System and method for ensuring the availability of a storage system
US20030233427A1 (en) * 2002-05-29 2003-12-18 Hitachi, Ltd. System and method for storage network management
US20040148376A1 (en) * 2002-06-28 2004-07-29 Brocade Communications Systems, Inc. Storage area network processing device
US7039765B1 (en) * 2002-12-19 2006-05-02 Hewlett-Packard Development Company, L.P. Techniques for cache memory management using read and write operations
US7117306B2 (en) * 2002-12-19 2006-10-03 Intel Corporation Mitigating access penalty of a semiconductor nonvolatile memory
US6941396B1 (en) * 2003-02-19 2005-09-06 Istor Networks, Inc. Storage controller redundancy using bi-directional reflective memory channel
US7287137B2 (en) * 2003-06-06 2007-10-23 Hewlett-Packard Development Company, L.P. Batched, asynchronous data redundancy technique
US7299334B2 (en) * 2003-07-15 2007-11-20 Xiv Ltd. Storage system configurations
US7487235B2 (en) * 2003-09-24 2009-02-03 Dell Products L.P. Dynamically varying a raid cache policy in order to optimize throughput
JP4147198B2 (ja) * 2004-03-23 2008-09-10 株式会社日立製作所 ストレージシステム
JP2006065697A (ja) * 2004-08-27 2006-03-09 Hitachi Ltd 記憶デバイス制御装置
JP4404754B2 (ja) * 2004-11-30 2010-01-27 富士通株式会社 データストレージ装置及び情報処理システム
JP4457019B2 (ja) * 2005-01-05 2010-04-28 富士通株式会社 情報処理システム及び一次ストレージ装置
US7386662B1 (en) * 2005-06-20 2008-06-10 Symantec Operating Corporation Coordination of caching and I/O management in a multi-layer virtualized storage environment
US20070038749A1 (en) * 2005-07-29 2007-02-15 Broadcom Corporation Combined local and network storage interface

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7468913B2 (ja) 2019-03-06 2024-04-16 アールト・ユニバーシティ・ファウンデイション・エスアール 磁場センサに関する磁気共鳴データの位置の決定

Also Published As

Publication number Publication date
WO2008086077A1 (en) 2008-07-17
US20080168221A1 (en) 2008-07-10
EP2100224A1 (en) 2009-09-16
JP2010515196A (ja) 2010-05-06
ATE492846T1 (de) 2011-01-15
DE602008004088D1 (de) 2011-02-03
EP2100224B1 (en) 2010-12-22
US8145837B2 (en) 2012-03-27

Similar Documents

Publication Publication Date Title
JP5184552B2 (ja) コンピュータストレージシステム
US20210176513A1 (en) Storage virtual machine relocation
US11262931B2 (en) Synchronous replication
US9990262B2 (en) Dynamic mirroring
US10523751B2 (en) Synchronous replication for storage area network protocol storage
US9304901B2 (en) System and method for handling I/O write requests
US20200371692A1 (en) Memory disaggregation for compute nodes
US20150312337A1 (en) Mirroring log data
US20150309892A1 (en) Interconnect path failover
US8812899B1 (en) Managing read caching
US20190187934A1 (en) Random access memory (ram)-based computer systems, devices, and methods
JP2009527062A (ja) 超高度データ可用性および地理的災害許容性を得るためのシステムおよび方法
US8140811B2 (en) Nonvolatile storage thresholding
US8924656B1 (en) Storage environment with symmetric frontend and asymmetric backend
US20210406280A1 (en) Non-disruptive transition to synchronous replication state
US11467774B2 (en) Metadata compaction
US12038817B2 (en) Methods for cache rewarming in a failover domain and devices thereof
US9798683B2 (en) Minimizing micro-interruptions in high-performance computing
US11347409B1 (en) Method and apparatus for selective compression of data during initial synchronization of mirrored storage resources
KR20230088215A (ko) 분산 스토리지 시스템
US20230185822A1 (en) Distributed storage system
Shu Storage Arrays
Zilber TPT-RAID: a High Performance Box-Fault Tolerant Storage System

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101201

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120523

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120529

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120829

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130116

R150 Certificate of patent or registration of utility model

Ref document number: 5184552

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160125

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250