JP2007524877A - データ記憶システム - Google Patents
データ記憶システム Download PDFInfo
- Publication number
- JP2007524877A JP2007524877A JP2006501049A JP2006501049A JP2007524877A JP 2007524877 A JP2007524877 A JP 2007524877A JP 2006501049 A JP2006501049 A JP 2006501049A JP 2006501049 A JP2006501049 A JP 2006501049A JP 2007524877 A JP2007524877 A JP 2007524877A
- Authority
- JP
- Japan
- Prior art keywords
- server
- data
- request
- storage
- servers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013500 data storage Methods 0.000 title claims abstract description 26
- 238000000034 method Methods 0.000 claims abstract description 226
- 230000008569 process Effects 0.000 claims abstract description 190
- 230000004044 response Effects 0.000 claims abstract description 47
- 238000004891 communication Methods 0.000 claims abstract description 37
- 238000013507 mapping Methods 0.000 claims abstract description 13
- 238000012545 processing Methods 0.000 claims description 23
- 238000012544 monitoring process Methods 0.000 claims description 18
- 238000012546 transfer Methods 0.000 claims description 17
- 238000005192 partition Methods 0.000 claims description 13
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 9
- 230000003044 adaptive effect Effects 0.000 claims description 8
- 238000000638 solvent extraction Methods 0.000 claims description 8
- 238000007726 management method Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 description 7
- 238000005259 measurement Methods 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000009118 appropriate response Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000012938 design process Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 235000014510 cooky Nutrition 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
- G06F3/064—Management of blocks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
- G06F16/1824—Distributed file systems implemented using Network-attached Storage [NAS] architecture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0604—Improving or facilitating administration, e.g. storage management
- G06F3/0605—Improving or facilitating administration, e.g. storage management by facilitating the interaction with a user or administrator
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0646—Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/067—Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0683—Plurality of storage devices
- G06F3/0689—Disk arrays, e.g. RAID, JBOD
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1004—Server selection for load balancing
- H04L67/1008—Server selection for load balancing based on parameters of servers, e.g. available memory or workload
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1029—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers using data related to the state of servers by a load balancer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1097—Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/30—Definitions, standards or architectural aspects of layered protocol stacks
- H04L69/32—Architecture of open systems interconnection [OSI] 7-layer type protocol stacks, e.g. the interfaces between the data link level and the physical level
- H04L69/322—Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions
- H04L69/329—Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions in the application layer [OSI layer 7]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1008—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1095—Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Computer Security & Cryptography (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
一実現例では、本明細書に記載したシステム及び方法は、ブロックレベル・データ記憶サービスを提供するシステムを含む。より具体的には、本発明のシステム及び方法は、ブロック記憶サービスを複数の等価サーバにわたって区分するサーバシステムと共に用いられるブロックレベル・データ記憶サービスを提供する。等価サーバからなるシステムは、これに限定するわけではないが、それぞれが類似のインターフェースをクライアントに提示し、そのクライアントからの同一の要求に同一の応答を提示する複数の等価サーバからなるシステムを包含する。本明細書に記載したシステム及び方法は様々な用途に適用可能で、特定の用途に限定されるわけではない。ただし、説明を明確にするため、本明細書に記載したシステム及び方法は、ブロックレベル・データ記憶適用例を参照して説明する。又、この適用例では、複数のデータブロックが、複数の記憶装置にまたがって区分されたブロックデータ・ボリュームに記憶され、このデータ・ボリュームの異なる部分が、システム上の異なる等価サーバに関連付けられている。
Microsystems, Inc.)が市販するサーバシステムの何れかなどの、従来のコンピュータ・ハードウェア・プラットフォームを含むことができる。各サーバは、1つ又は複数のソフトウェア・プロセスを実行して、このストレージ・エリア・ネットワークを実現する。サーバグループ30は、ファイバチャネル・ネットワークシステム、アービットレーテッド・ループ、又はストレージ・エリア・ネットワークを提供するのに適したそれ以外の任意種類のネットワーク・システムを含むことができる。
socket server)を含むことができる。図10で示したように、この分散形ソケットサーバを設けると、要求34がサーバ32Bのネットワーク・スタックを介して受信され経路指定されたかのように、サーバ32Bにこの接続及び状態情報へのアクセスを提供できる。図10の経路82で示したように、この分散形ソケットサーバは、要求34がサーバ32Aからサーバ32Bへ経路指定されたかような効果を奏する。結果的に、サーバ32Bは、クライアント12へ応答38を生成するのに必要な接続及び状態情報を得る。
compliment)であることは一般に理解されており、更に、論理ブロックは、ディスク10などのディスク上の最小アドレス可能空間であると理解されるはずである。典型的には、各論理ブロックは、ディスク先頭で始まって0から順番に割当てられる固有の論理ブロック・ネーム(又は番号)により識別できる。ISO9660の標準では、CD上の全データは、論理ブロック番号でアドレス指定される。従って、図13に示した装置は、例えばハードディスク装置のように記憶ディスクであると一般に理解される。しかし、本発明はそれに限定されるものではない。本明細書に記載されているシステム及び方法は、コンパクト・ディスク、フロッピー(登録商標)・ディスク、テープ駆動システム、及び他の類似種類のデータ記憶装置にも適用できる。
Kochan, Programming in C, Hayden Publishing (1983)」に記載されている。
Sparc)(商標)システムなどの市販のサーバプラットフォームを使用してもよい。
Claims (64)
- ブロックレベル・データ記憶のためのシステムであって、
複数の等価サーバであって、それぞれが記憶ブロックの一部を担当し、それぞれが前記サーバ間でブロックの移動を調整するために他のサーバ上のデータ移動プロセスと直接的に通信可能なデータ移動プロセスを備えた、複数の等価サーバと、
他のサーバ上の要求モニタ・プロセスと直接的に通信可能であって、ブロックへの要求の調整分析を生成可能な要求モニタ・プロセスと、
等価サーバとそれらに関連付けられたデータブロックとの調整リストを維持するため、経路指定テーブル・プロセッサと通信可能な経路指定テーブル・プロセスとを含む、システム。 - 前記データ移動プロセスが、前記複数サーバの動作特性に応答すると共に前記複数サーバにわたるブロックの再配分を識別するための適応移動アルゴリズムを含む、請求項1に記載のシステム。
- 前記要求モニタ・プロセスが、任意サーバが受信した要求数を特定して、当該サーバが負担する要求負荷を測定する、請求項1又は2に記載のシステム。
- 前記要求モニタ・プロセスが、データ・ボリュームにアクセスするクライアントの数、I/O要求の数、及び利用可能な記憶の容量からなるグループから選択されるパラメータを測定する、上記請求項の何れかに記載のシステム。
- 前記要求モニタ・プロセスが、任意のブロック・グループが高需要ブロック基準を上回る頻度で一緒にアクセスされているかを識別する、上記請求項の何れかに記載のシステム。
- 前記データ移動プロセスが、前記要求モニタ・プロセスにより生成されたデータを処理して、性能を向上させるため選択したサーバに移動すべきデータブロックを特定する、上記請求項の何れかに記載のシステム。
- 前記データ移動プロセスが、適応ブロック分散アルゴリズムを前記要求モニタ・プロセスにより生成されたデータに適用する、上記請求項の何れかに記載のシステム。
- 前記データ移動プロセスが、選択したデータブロックを複数サーバにわたってストライピングするデータ・ストライピング・アルゴリズムを含む、上記請求項の何れかに記載のシステム。
- 前記データ移動プロセスが、データブロックのサーバ間の移送を監視するトランザクション・プロセスを含む、上記請求項の何れかに記載のシステム。
- 前記トランザクション・プロセスが、データブロックの前記移送時に検出されたエラーをログ記録するエラーログ・プロセスを含む、請求項9に記載のシステム。
- 前記要求モニタが、2つ以上のデータ・ボリュームに対する要求を監視する、上記請求項の何れかに記載のシステム。
- 前記データ移動プロセスが、2つ以上のデータ・ボリュームに関連付けられたデータブロックを移動する、上記請求項の何れかに記載のシステム。
- ブロックレベル・データ記憶のための処理であって、
複数の等価サーバを提供する段階であって、各等価サーバが、記憶データブロックの一部を担当し、それぞれの等価サーバに受信されたクライアント要求を監視すると共に、別のサーバ上の要求モニタ・プロセスと直接的に通信してブロック要求の調整分析を生成する、提供する段階と、
前記サーバ間でデータブロックを移動する段階と、
等価サーバとそれらに関連付けられたデータブロックとの調整リストとなる経路指定テーブルを維持すると共に、当該システム上の異なるサーバにわたって記憶されているデータブロックを追跡するグローバル経路指定テーブル・プロセッサを生成するために他の経路指定テーブルと通信する段階とを含む、処理。 - データブロックを移動する前記段階が、前記複数サーバの動作特性に応答する応移動アルゴリズであって、前記複数サーバにわたるブロックの再配分を識別す適応移動アルゴリズムを適用する段階を含む、請求項13に記載の処理。
- 前記要求の監視が、任意サーバが受信した要求の数を特定して、当該サーバが負担する要求負荷を測定する、請求項13又は14に記載の処理。
- 前記要求の監視が、データ・ボリュームにアクセスするクライアントの数、I/O要求の数、及び利用可能な記憶の容量からなるグループから選択されるパラメータを測定する段階を含む、上記請求項の何れかに記載の処理。
- 前記要求の監視が、任意のブロック・グループが高需要ブロック基準を上回る頻度で一緒にアクセスされているかを識別する段階を含む、上記請求項の何れかに記載の処理。
- 前記データを移動する段階が、選択したデータブロックを複数サーバにわたってストライピングする段階を含む、上記請求項の何れかに記載の処理。
- 前記データを移動する段階が、複数サーバにわたるデータブロックの移送を監視する段階を含む、上記請求項の何れかに記載の処理。
- データブロックの前記移送時に検出されたエラーをログ記録するエラーログを生成する段階を更にを含む、請求項19に記載の処理。
- 前記要求の監視が、2つ以上のデータ・ボリュームに対する要求を監視する段階を含む、上記請求項の何れかに記載の処理。
- サービスをデータ・ネットワークを介して提供するための処理であって、
クライアントからのリソースに対するアクセスへの要求を検出し、当該クライアントとの通信のための接続を確立する段階と、
前記検出された要求に応じるサーバを識別する段階と、
状態情報が前記接続に関連付けられているかを特定する段階と、
前記識別したサーバに前記状態情報へのアクセスを許可し、前記識別したサーバに前記クライアントへの応答を作成且つ送信させる段階と、
前記識別したサーバに前記状態情報を更新させる段階とを含む、処理。 - 前記状態情報をメモリに記憶する段階を更に含む、請求項22に記載の処理。
- 前記識別したサーバに前記状態情報を更新させるためのファイル書き込みプロセスを提供する段階を更に含む、請求項22又は23に記載の処理。
- 前記状態情報を含むファイルへのアクセスを制御するためのインターロック・プロセスを提供する段階を更に含む、請求項22乃至24の何れかに記載の処理。
- 前記インターロック・プロセスが、クライアントからの要求を検出するためのリスニング・スレッドを含む、請求項25に記載の処理。
- 前記リスニング・スレッドが、クライアントからの分散サービスへのアクセス要求を検出する、請求項26に記載の処理。
- 前記通信接続が、HTTP、FTP、iSCSI、NFS、及びCIFSからなるグループから選択される通信プロトコルに従う、請求項22乃至27の何れかに記載の処理。
- 前記状態情報が、IPアドレス、TCPシーケンス番号、及びiSCSIシーケンス番号からなるグループから選択される情報を含む、請求項22乃至28の何れかに記載の処理。
- サービスをデータ・ネットワークを介して提供するためのシステムであって、
クライアントからのリソースへのアクセス要求を検出すると共に当該クライアントとの通信接続を確立するプロセスと、
前記要求されたリソースに関連付けられたサーバを識別するサーバ識別プロセスと、
前記検出した要求を識別したサーバに転送する要求ルータと、
前記通信接続に関連付けられた状態情報への分散アクセスを許容するソケットサーバとを含み、前記識別サーバが、前記クライアントに応答するため前記状態情報にアクセスできる、システム。 - 前記ソケットサーバが、前記識別したサーバに前記状態情報を更新させるためのファイル書き込みプロセスを含む、請求項30に記載のシステム。
- 前記ソケットサーバが、前記状態情報を含むファイルへのアクセスを制御するためのインターロック・プロセスを含む、請求項30又は31に記載のシステム。
- 前記インターロック・プロセスが、前記状態情報を含む前記ファイルへのアクセスを一度に1台のサーバに制限する、請求項32に記載のシステム。
- 前記インターロック・プロセスが、クライアントからの要求を検出するためのリスニング・スレッドを含む、請求項34に記載のシステム。
- 前記リスニング・スレッドが、クライアントからの分散サービスへのアクセス要求を検出する、請求項34に記載のシステム。
- 前記通信接続が、HTTP、FTP、iSCSI、NFS、及びCIFSからなるグループから選択される通信プロトコルに従う、請求項30乃至35の何れかに記載のシステム。
- 前記状態情報が、IPアドレス、TCPシーケンス番号、及びiSCSIシーケンス番号からなるグループから選択される情報を含む、請求項30乃至36の何れかに記載のシステム。
- データ・ネットワークを介して分散サービスにアクセスするためのサーバであって、
クライアントからのサービスへのアクセス要求を検出すると共に当該クライアントと通信接続を確立するリスニング・スレッドであって、当該通信接続が、それに関連付けられた状態情報を備える、リスニング・スレッドと、
前記検出した要求に応じる能力がある利用可能サーバのリストを維持するリソース管理プロセスと、
識別したサーバに前記検出した要求を転送する要求ルータと、
前記通信接続に関連付けられた状態情報への分散アクセスを許容する接続データ・サーバとを含み、前記識別したサーバが、前記クライアントに応答するため状態情報にアクセスできる、サーバ。 - 区分リソースをサポートする複数サーバに、クライアントからの検出した要求に応答させるソケットサーバであって、
前記クライアントと通信するために開かれた通信チャンネルに関連付けられたデータファイルを作成するための、前記検出した要求に応答するファイル・プロセスであって、状態情報を維持するためのファイル・プロセスと、
前記複数サーバからの前記データファイルへのアクセス要求を検出する制御プロセスであって、前記複数サーバの少なくとも一つに前記状態情報へのアクセスを許可するため、前記データファイルへのアクセスを制御する制御プロセスと、
前記複数サーバの一つに、前記作成したファイルに記憶された前記状態情報を更新させるファイル書き込みプロセスとを含む、ソケットサーバ。 - 前記制御プロセスが、前記作成されたファイルへのアクセスを制御するインターロック・プロセスを含む、請求項39に記載のソケットサーバ。
- 前記制御プロセスが、前記複数サーバからの前記作成されたファイルへのアクセス要求に応答するリスニング・プロセスを含む、請求項39又は40に記載のソケットサーバ。
- 前記ファイル・プロセスが、ネットワーク・スタック内の層に関連付けられた状態情報を識別するプロセスを含む、請求項39乃至41の何れかに記載のソケットサーバ。
- 請求項22乃至29の何れかの処理を実行するための命令を記憶したコンピュータ可読媒体。
- 分化記憶クラスを提供するシステムであって、
複数の記憶位置と、当該記憶位置を編成するための論理ブロック・ネーム空間とを備えた記憶装置と、
記憶位置を異なる性能レベルを提供する複数領域に区分する性能プロセスと、
前記記憶位置の前記区分した部分を、前記論理ブロック・ネーム空間の選択したセクションにマッピングするマッピング・プロセスとを含む、システム。 - 前記性能プロセスが、前記複数の記憶位置を、異なるサービスレベルに関連付けられた複数カテゴリに分離する、請求項44に記載のシステム。
- 前記性能プロセスが、前記複数の記憶位置を、異なるRAID性能レベルに関連付けられた複数カテゴリに分離する、請求項45に記載のシステム。
- 前記マッピング処理が、前記論理ブロック・ネーム空間の異なる部分を、RAIDの異なるレベルにそれぞれ関連付ける、請求項44に記載のシステム。
- 前記論理ブロック・ネーム空間の異なる部分間でデータを移動させる負荷バランシング移動プロセスを更に含む、請求項44に記載のシステム。
- 前記負荷バランシング移動プロセスが、データを記憶プール間で移動してシステム性能を向上させる適応データ配置プロセスを含む、請求項48に記載のシステム。
- 前記負荷バランシング移動プロセスが、管理者にデータを異なる記憶プール間で移動させる管理プロセスを含む、請求項48に記載のシステム。
- 前記記憶を用いてファイルシステム・サービスを提供するプロセスを更に含む、請求項44に記載のシステム。
- 記憶ボリューム・サービスを提供するプロセスを更に含む、請求項44に記載のシステム。
- 前記マッピングプロセスが、複数の記憶ボリュームを選択した性能レベルで形成する、請求項44に記載のシステム。
- 分化記憶クラスを提供する処理であって、
複数の記憶位置と、当該記憶位置を編成するための論理ブロック・ネーム空間とを備えた記憶装置を提供する段階と、
記憶位置を異なる性能レベルを提供する複数領域に区分する段階と、
前記記憶位置の前記区分した部分を、前記論理ブロック・ネーム空間の選択したセクションにマッピングする段階とを含む、処理。 - 前記複数の記憶位置を、異なるサービスレベルに関連付けられた複数カテゴリに分離する段階を更に含んだ、請求項54に記載の処理。
- 前記複数の記憶位置を、異なるRAID性能レベルに関連付けられた複数カテゴリに分離する段階を更に含んだ、請求項54に記載の処理。
- 前記マッピング処理が、前記論理ブロック・ネーム空間の異なる部分を、RAIDの異なるレベルにそれぞれ関連付ける、請求項54に記載の処理。
- 前記論理ブロック・ネーム空間の異なる部分間でデータを移動させることによって負荷バランシングを行う段階を更に含む、請求項54に記載の処理。
- 前記負荷バランシング・プロセスが、データを記憶プール間で移動してシステム性能を向上させることを含む、請求項58に記載の処理。
- 前記負荷バランシングを行う段階が、管理者にデータを異なる記憶プール間で移動させる段階を含む、請求項58に記載の処理。
- 前記マッピング段階が、複数の記憶ボリュームを選択した性能レベルで形成する、請求項54に記載の処理。
- 分化記憶クラスを提供するシステムであって、
複数の記憶位置と、当該記憶位置を編成するための論理ブロック・ネーム空間とを備えた記憶装置であって、当該装置内部で変動する前記記憶位置の性能パラメータを備えた記憶装置と、
前記記憶位置を、性能パラメータの変動の関数として複数領域に区分するための区分プロセスとを含む、システム。 - 前記区分プロセスが、システム要素の選択された構成の関数として固定セットの区分を選択する、請求項62に記載のシステム。
- 複数の区分を異なる性能レベルと関連付ける性能プロセスと、
前記記憶位置の前記識別した部分を、前記論理ブロック・ネーム空間の選択したセクションにマッピングするマッピング・プロセスとを含む、請求項62に記載のシステム。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/347,901 US7627650B2 (en) | 2003-01-20 | 2003-01-20 | Short-cut response for distributed services |
US10/347,898 US7461146B2 (en) | 2003-01-20 | 2003-01-20 | Adaptive storage block data distribution |
US44181003P | 2003-01-21 | 2003-01-21 | |
PCT/US2004/001432 WO2004066277A2 (en) | 2003-01-20 | 2004-01-20 | System and method for distributed block level storage |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007524877A true JP2007524877A (ja) | 2007-08-30 |
JP4640335B2 JP4640335B2 (ja) | 2011-03-02 |
Family
ID=32776950
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006501049A Expired - Lifetime JP4640335B2 (ja) | 2003-01-20 | 2004-01-20 | データ記憶システム |
Country Status (3)
Country | Link |
---|---|
EP (2) | EP1588360B1 (ja) |
JP (1) | JP4640335B2 (ja) |
WO (1) | WO2004066277A2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007233607A (ja) * | 2006-02-28 | 2007-09-13 | Toshiba Corp | 情報処理装置、raidコントローラおよび情報処理装置のディスク制御方法 |
JP2008016028A (ja) * | 2006-06-30 | 2008-01-24 | Seagate Technology Llc | 広域複製を持つ分散記憶システム |
JP2009169950A (ja) * | 2008-01-15 | 2009-07-30 | Internatl Business Mach Corp <Ibm> | 記憶インフラストラクチャを自動的に管理するための方法および適切な記憶インフラストラクチャ |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1328879C (zh) * | 2005-01-26 | 2007-07-25 | 北京大学 | 基于数据分块冗余和虚拟化存储的在线备份方法 |
US7870128B2 (en) | 2006-07-28 | 2011-01-11 | Diskeeper Corporation | Assigning data for storage based on speed with which data may be retrieved |
US9052826B2 (en) | 2006-07-28 | 2015-06-09 | Condusiv Technologies Corporation | Selecting storage locations for storing data based on storage location attributes and data usage statistics |
JP4696089B2 (ja) * | 2007-03-30 | 2011-06-08 | 三菱電機インフォメーションシステムズ株式会社 | 分散ストレージシステム |
JP5117120B2 (ja) * | 2007-06-18 | 2013-01-09 | 株式会社日立製作所 | ストレージ装置のボリュームを管理する計算機システム、方法及びプログラム |
US20130110767A1 (en) * | 2011-10-26 | 2013-05-02 | Nec Laboratories America, Inc. | Online Transaction Processing |
US11513741B2 (en) | 2020-02-13 | 2022-11-29 | International Business Machines Corporation | Automatic volume statistical and performance information tracking |
CN111967613B (zh) * | 2020-08-24 | 2023-06-16 | 浙江百应科技有限公司 | Nlp模型训练发布识别系统 |
CN114422436B (zh) * | 2021-12-14 | 2024-03-19 | 北京罗克维尔斯科技有限公司 | 网关、网关控制方法、装置、电子设备和存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11184641A (ja) * | 1997-12-24 | 1999-07-09 | Hitachi Ltd | サブシステムの移行方法 |
JP2000242434A (ja) * | 1998-12-22 | 2000-09-08 | Hitachi Ltd | 記憶装置システム |
JP2000339098A (ja) * | 1999-03-25 | 2000-12-08 | Dell Usa Lp | ストレージドメイン管理システム |
JP2002500393A (ja) * | 1997-12-24 | 2002-01-08 | アヴィッド・テクノロジー・インコーポレーテッド | コンピュータ・システムおよび多数の記憶装置および多数のアプリケーション間でスケーラブルにかつ信頼性高く多数の高帯域データ・ストリームを転送するプロセス |
JP2002312126A (ja) * | 2001-04-18 | 2002-10-25 | Hitachi Ltd | 磁気ディスク装置間結合装置 |
JP2002333956A (ja) * | 2001-05-09 | 2002-11-22 | Hitachi Ltd | ディスク制御装置を用いた計算機システムおよびその運用サービス |
WO2005010767A1 (ja) * | 2003-07-24 | 2005-02-03 | Fujitsu Limited | データ格納システム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5664187A (en) * | 1994-10-26 | 1997-09-02 | Hewlett-Packard Company | Method and system for selecting data for migration in a hierarchic data storage system using frequency distribution tables |
US5657468A (en) * | 1995-08-17 | 1997-08-12 | Ambex Technologies, Inc. | Method and apparatus for improving performance in a reduntant array of independent disks |
US6314503B1 (en) | 1998-12-30 | 2001-11-06 | Emc Corporation | Method and apparatus for managing the placement of data in a storage system to achieve increased system performance |
US6330621B1 (en) * | 1999-01-15 | 2001-12-11 | Storage Technology Corporation | Intelligent data storage manager |
-
2004
- 2004-01-20 EP EP04703657.9A patent/EP1588360B1/en not_active Expired - Lifetime
- 2004-01-20 WO PCT/US2004/001432 patent/WO2004066277A2/en active Application Filing
- 2004-01-20 JP JP2006501049A patent/JP4640335B2/ja not_active Expired - Lifetime
- 2004-01-20 EP EP10180781.6A patent/EP2302529B1/en not_active Expired - Lifetime
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11184641A (ja) * | 1997-12-24 | 1999-07-09 | Hitachi Ltd | サブシステムの移行方法 |
JP2002500393A (ja) * | 1997-12-24 | 2002-01-08 | アヴィッド・テクノロジー・インコーポレーテッド | コンピュータ・システムおよび多数の記憶装置および多数のアプリケーション間でスケーラブルにかつ信頼性高く多数の高帯域データ・ストリームを転送するプロセス |
JP2000242434A (ja) * | 1998-12-22 | 2000-09-08 | Hitachi Ltd | 記憶装置システム |
JP2000339098A (ja) * | 1999-03-25 | 2000-12-08 | Dell Usa Lp | ストレージドメイン管理システム |
JP2002312126A (ja) * | 2001-04-18 | 2002-10-25 | Hitachi Ltd | 磁気ディスク装置間結合装置 |
JP2002333956A (ja) * | 2001-05-09 | 2002-11-22 | Hitachi Ltd | ディスク制御装置を用いた計算機システムおよびその運用サービス |
WO2005010767A1 (ja) * | 2003-07-24 | 2005-02-03 | Fujitsu Limited | データ格納システム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007233607A (ja) * | 2006-02-28 | 2007-09-13 | Toshiba Corp | 情報処理装置、raidコントローラおよび情報処理装置のディスク制御方法 |
JP2008016028A (ja) * | 2006-06-30 | 2008-01-24 | Seagate Technology Llc | 広域複製を持つ分散記憶システム |
JP2009169950A (ja) * | 2008-01-15 | 2009-07-30 | Internatl Business Mach Corp <Ibm> | 記憶インフラストラクチャを自動的に管理するための方法および適切な記憶インフラストラクチャ |
Also Published As
Publication number | Publication date |
---|---|
EP2302529A1 (en) | 2011-03-30 |
WO2004066277A2 (en) | 2004-08-05 |
EP1588360A2 (en) | 2005-10-26 |
JP4640335B2 (ja) | 2011-03-02 |
EP1588360B1 (en) | 2018-09-05 |
EP2302529B1 (en) | 2019-12-11 |
WO2004066277A3 (en) | 2006-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7962609B2 (en) | Adaptive storage block data distribution | |
US10838620B2 (en) | Efficient scaling of distributed storage systems | |
US7433934B2 (en) | Network storage virtualization method and system | |
JP4581095B2 (ja) | データ記憶管理システム | |
US7386662B1 (en) | Coordination of caching and I/O management in a multi-layer virtualized storage environment | |
US7562110B2 (en) | File switch and switched file system | |
US7636801B1 (en) | Coordination of quality of service in a multi-layer virtualized storage environment | |
US7599941B2 (en) | Transparent redirection and load-balancing in a storage network | |
JP4815449B2 (ja) | 共有バックエンドストレージを備えた複数のストレージシステムにわたりユーザワークロードのバランスをリアルタイムにとるシステム、及び方法 | |
US9058119B1 (en) | Efficient data migration | |
US8589550B1 (en) | Asymmetric data storage system for high performance and grid computing | |
US7209967B2 (en) | Dynamic load balancing of a storage system | |
US7519769B1 (en) | Scalable storage network virtualization | |
US20040210724A1 (en) | Block data migration | |
US20040139167A1 (en) | Apparatus and method for a scalable network attach storage system | |
US20030023784A1 (en) | Storage system having a plurality of controllers | |
US20060041580A1 (en) | Method and system for managing distributed storage | |
JP4640335B2 (ja) | データ記憶システム | |
US10855556B2 (en) | Methods for facilitating adaptive quality of service in storage networks and devices thereof | |
US7499980B2 (en) | System and method for an on-demand peer-to-peer storage virtualization infrastructure | |
US7627650B2 (en) | Short-cut response for distributed services | |
Halabi | Hyperconverged Infrastructure Data Centers: Demystifying HCI | |
US7698424B1 (en) | Techniques for presenting multiple data storage arrays to iSCSI clients as a single aggregated network array | |
Petersen | Inside the Lustre file system | |
US11258877B2 (en) | Methods for managing workloads in a storage system and devices thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070112 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091124 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100222 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100301 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100323 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100330 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100422 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100430 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100521 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101019 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20101020 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101115 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4640335 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131210 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |