JP7332488B2 - ストレージシステム及びストレージシステムの制御方法 - Google Patents
ストレージシステム及びストレージシステムの制御方法 Download PDFInfo
- Publication number
- JP7332488B2 JP7332488B2 JP2020004910A JP2020004910A JP7332488B2 JP 7332488 B2 JP7332488 B2 JP 7332488B2 JP 2020004910 A JP2020004910 A JP 2020004910A JP 2020004910 A JP2020004910 A JP 2020004910A JP 7332488 B2 JP7332488 B2 JP 7332488B2
- Authority
- JP
- Japan
- Prior art keywords
- server
- distributed
- storage
- servers
- logical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0614—Improving the reliability of storage systems
- G06F3/0617—Improving the reliability of storage systems in relation to availability
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/067—Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2094—Redundant storage or storage space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0629—Configuration or reconfiguration of storage systems
- G06F3/0635—Configuration or reconfiguration of storage systems by changing the path, e.g. traffic rerouting, path reconfiguration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
- G06F3/0644—Management of space entities, e.g. partitions, extents, pools
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/865—Monitoring of software
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0646—Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
- G06F3/0647—Migration mechanisms
Description
前記複数のサーバが共用してデータを格納できる共有ストレージとを備えたストレージシステムにおいて、前記複数のサーバは、それぞれ、1または複数の論理ノードを備え、前記複数のサーバの複数の論理ノードは、ストレージプールを提供するとともに、前記ストレージプールに入出力されるユーザデータを、いずれかの論理ノードが処理して前記共有ストレージに入出力する分散ファイルシステムを形成し、前記論理ノードは、前記サーバ間で移動可能である。
図2において、分散ストレージシステム10Aは、管理サーバ5、N個の分散FSサーバ11A~11C、・・・および1つまたは複数の共有ストレージアレイ6A、6Bを備える。1つまたは複数のホストサーバ1A~1Cが分散ストレージシステム10Aに接続する。
図4において、ストレージアレイ6Aは、CPU21B、メモリ23B、FE I/F13、ストレージI/F25、HBA16および記憶装置27Bを有する。
図5において、管理サーバ5は、CPU21C、メモリ23C、管理ネットワークI/F7および記憶装置27Cを備える。管理プログラムP17は、入力装置29およびディスプレイ31に接続されている。
図8において、ストレージプール管理テーブルT2は、分散FS制御デーモンがストレージプールの構成を管理するための情報を格納する。分散ファイルシステムを構成するすべての分散FSサーバ11A~11Eは、互いに通信し、同一の内容を持つストレージプール管理テーブルT2を保持する。
図9において、RAID制御テーブルT3は、RAID制御プログラムP11がLUを冗長化するための情報を格納する。RAID制御プログラムP11は、起動時に管理サーバ5と通信し、LU管理テーブルT6の内容に基づき、RAID制御テーブルT3を作成する。RAID制御プログラムP11は、RAID制御テーブルT3の内容に従い、共有ストレージアレイ6Aが提供するLUからRAID Groupを構築し、分散FS制御デーモンに提供する。ここで言うRAID Groupとは、データの読み書きが可能な論理的な記憶領域を指す。
図10において、フェールオーバ制御テーブルT4は、フェールオーバ制御プログラムP9が論理ノードの稼働サーバを管理するための情報を格納する。HAクラスタを構築する全ノードのフェールオーバ制御プログラムP9は、お互いに通信することで、全てのノードで同一内容のフェールオーバ制御T4を保持する。
図11において、LU制御テーブルT5は、IO制御プログラムP13およびアレイ管理プログラムP15が、LUの構成を管理し、LUに対するIO要求処理のための情報を格納する。
図12において、LU管理テーブルT6は、管理プログラムP17が、分散ストレージシステム10A全体で共有するLUの構成を管理するための情報を格納する。管理プログラムP17は、アレイ管理プログラムP15およびRAID制御プログラムP11と連携し、LUの作成・削除および論理ノードへの割当てを行う。
図13において、サーバ管理テーブルT7は、管理プログラムP17が分散FSサーバ11A~11Eと通信したり、LUとRAID Groupの構成を決定したりするために必要な分散FSサーバ11A~11Eの構成情報を格納する。
図14において、アレイ管理テーブルT8は、管理プログラムP17がストレージアレイ6Aと通信したり、LUとRAID Group構成を決定したりするためのストレージアレイ6Aの構成情報を格納する。
図15において、図5の管理プログラムP17は、管理者からストレージプールの作成要求を受信すると、フェールオーバ時の負荷分散および信頼性要件に基づいて、ストレージプールを作成する。
図16において、分散FSサーバ11A、11B、11D間で定期的に通信(ハートビート)を行うことで相互に生死監視を行う(S210)。このとき、例えば、分散FSサーバ11Aでノード障害が発生したものとする(S220)。
図18において、管理者は、分散FSサーバの増設時またはストレージプールの容量不足時に、管理プログラムP17に対しストレージプール拡張を指示することでストレージプール容量を拡張することができる。ストレージプール拡張が要求された場合、管理プログラムP17は、新規の分散FSサーバまたは指定された既存の分散FSサーバに他のサーバと同容量のデータLUをアタッチし、ストレージプールに追加する。
図19において、管理者または各種制御プログラムは、管理プログラムP17にストレージ縮小指示を発行することで、分散FSサーバを減設することができる。
図22において、このストレージプール作成処理では、図15のS150の処理とS160の処理との間にS155の処理が追加されている。
Claims (4)
- 複数のサーバと、
前記複数のサーバが共用してデータを格納できる共有ストレージとを備えたストレージシステムにおいて、
前記複数のサーバは、それぞれ、1または複数の論理ノードを備え、
前記複数のサーバの複数の論理ノードは、ストレージプールを提供するとともに、前記ストレージプールに入出力されるユーザデータを、いずれかの論理ノードが処理して前記共有ストレージに入出力する分散ファイルシステムを形成し、
前記論理ノードは、前記サーバ間で移動可能であり、
前記共有ストレージは、論理ノードにかかるユーザデータと、前記ユーザデータにアクセスするために用いる制御情報を保持しており、
前記論理ノードのサーバ間移動では、ホストがサーバにアクセスするアクセスパスを移動元のサーバから移動先のサーバへ切り替えるとともに、前記移動先のサーバから前記移動にかかる論理サーバの共有ストレージ内の制御情報及びユーザデータを参照し、
それぞれ複数の論理ノードから形成される複数のストレージプールを提供しており、
前記移動先のサーバとして、移動にかかる論理ノードと同じストレージプールに属する論理ノードを持たないサーバを選択するストレージシステム。 - 複数のサーバと、
前記複数のサーバが共用してデータを格納できる共有ストレージとを備えたストレージシステムにおいて、
前記複数のサーバは、それぞれ、1または複数の論理ノードを備え、
前記複数のサーバの複数の論理ノードは、ストレージプールを提供するとともに、前記ストレージプールに入出力されるユーザデータを、いずれかの論理ノードが処理して前記共有ストレージに入出力する分散ファイルシステムを形成し、
前記論理ノードは、前記サーバ間で移動可能であり、
前記共有ストレージは、論理ノードにかかるユーザデータと、前記ユーザデータにアクセスするために用いる制御情報を保持しており、
前記論理ノードのサーバ間移動では、ホストがサーバにアクセスするアクセスパスを移動元のサーバから移動先のサーバへ切り替えるとともに、前記移動先のサーバから前記移動にかかる論理サーバの共有ストレージ内の制御情報及びユーザデータを参照し、
前記移動元のサーバと前記移動先のサーバは、異なるストレージプールに属するストレージシステム。 - 複数のサーバと、
前記複数のサーバが共用してデータを格納できる共有ストレージとを備えたストレージシステムの制御方法において、
複数の論理ノードは、前記複数のサーバに配置されるとともに、前記複数のサーバの複数の論理ノードは、ストレージプールを提供する分散ファイルシステムを形成し、
分散ファイルシステムを形成するいずれかの論理ノードは、前記ストレージプールに入出力されるユーザデータを処理して前記共有ストレージに入出力し、
前記論理ノードは、前記サーバ間で移動可能であり、
前記共有ストレージは、論理ノードにかかるユーザデータと、前記ユーザデータにアクセスするために用いる制御情報を保持しており、
前記論理ノードのサーバ間移動では、ホストがサーバにアクセスするアクセスパスを移動元のサーバから移動先のサーバへ切り替えるとともに、前記移動先のサーバから前記移動にかかる論理サーバの共有ストレージ内の制御情報及びユーザデータを参照し、
それぞれ複数の論理ノードから形成される複数のストレージプールを提供しており、
前記移動先のサーバとして、移動にかかる論理ノードと同じストレージプールに属する論理ノードを持たないサーバを選択するストレージシステムの制御方法。 - 複数のサーバと、
前記複数のサーバが共用してデータを格納できる共有ストレージとを備えたストレージシステムの制御方法において、
複数の論理ノードは、前記複数のサーバに配置されるとともに、前記複数のサーバの複数の論理ノードは、ストレージプールを提供する分散ファイルシステムを形成し、
分散ファイルシステムを形成するいずれかの論理ノードは、前記ストレージプールに入出力されるユーザデータを処理して前記共有ストレージに入出力し、
前記論理ノードは、前記サーバ間で移動可能であり、
前記共有ストレージは、論理ノードにかかるユーザデータと、前記ユーザデータにアクセスするために用いる制御情報を保持しており、
前記論理ノードのサーバ間移動では、ホストがサーバにアクセスするアクセスパスを移動元のサーバから移動先のサーバへ切り替えるとともに、前記移動先のサーバから前記移動にかかる論理サーバの共有ストレージ内の制御情報及びユーザデータを参照し、
前記移動元のサーバと前記移動先のサーバは、異なるストレージプールに属するストレージシステムの制御方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020004910A JP7332488B2 (ja) | 2020-01-16 | 2020-01-16 | ストレージシステム及びストレージシステムの制御方法 |
US17/008,954 US20210223966A1 (en) | 2020-01-16 | 2020-09-01 | Storage system and control method of storage system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020004910A JP7332488B2 (ja) | 2020-01-16 | 2020-01-16 | ストレージシステム及びストレージシステムの制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021114010A JP2021114010A (ja) | 2021-08-05 |
JP7332488B2 true JP7332488B2 (ja) | 2023-08-23 |
Family
ID=76857047
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020004910A Active JP7332488B2 (ja) | 2020-01-16 | 2020-01-16 | ストレージシステム及びストレージシステムの制御方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20210223966A1 (ja) |
JP (1) | JP7332488B2 (ja) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006079161A (ja) | 2004-09-07 | 2006-03-23 | Hitachi Ltd | フェイルオーバ方法及び計算機システム |
JP2009237763A (ja) | 2008-03-26 | 2009-10-15 | Hitachi Ltd | サーバシステム及びその制御方法 |
JP2009237826A (ja) | 2008-03-26 | 2009-10-15 | Hitachi Ltd | ストレージシステム及びそのボリューム管理方法 |
JP2010044635A (ja) | 2008-08-14 | 2010-02-25 | Hitachi Ltd | ファイルサーバシステム及びファイルサーバシステム起動方法 |
WO2011096014A1 (ja) | 2010-02-05 | 2011-08-11 | 株式会社日立製作所 | 仮想マシンと連携したThin-Provisioning容量管理を行う計算機システム、計算機、及び方法 |
JP2014215666A (ja) | 2013-04-23 | 2014-11-17 | 富士通株式会社 | 制御システム,制御装置及び制御プログラム |
JP2015215799A (ja) | 2014-05-12 | 2015-12-03 | 富士通株式会社 | 制御装置、通信装置、および、通信方法 |
JP2016038888A (ja) | 2014-08-12 | 2016-03-22 | 富士通株式会社 | 情報処理システム、情報処理方法及び情報処理プログラム |
WO2016103471A1 (ja) | 2014-12-26 | 2016-06-30 | 株式会社日立製作所 | 計算機システムおよび管理プログラム |
JP2016139237A (ja) | 2015-01-27 | 2016-08-04 | 株式会社日立製作所 | 計算機システム及び計算機システムの性能障害の対処方法 |
-
2020
- 2020-01-16 JP JP2020004910A patent/JP7332488B2/ja active Active
- 2020-09-01 US US17/008,954 patent/US20210223966A1/en not_active Abandoned
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006079161A (ja) | 2004-09-07 | 2006-03-23 | Hitachi Ltd | フェイルオーバ方法及び計算機システム |
JP2009237763A (ja) | 2008-03-26 | 2009-10-15 | Hitachi Ltd | サーバシステム及びその制御方法 |
JP2009237826A (ja) | 2008-03-26 | 2009-10-15 | Hitachi Ltd | ストレージシステム及びそのボリューム管理方法 |
JP2010044635A (ja) | 2008-08-14 | 2010-02-25 | Hitachi Ltd | ファイルサーバシステム及びファイルサーバシステム起動方法 |
WO2011096014A1 (ja) | 2010-02-05 | 2011-08-11 | 株式会社日立製作所 | 仮想マシンと連携したThin-Provisioning容量管理を行う計算機システム、計算機、及び方法 |
JP2014215666A (ja) | 2013-04-23 | 2014-11-17 | 富士通株式会社 | 制御システム,制御装置及び制御プログラム |
JP2015215799A (ja) | 2014-05-12 | 2015-12-03 | 富士通株式会社 | 制御装置、通信装置、および、通信方法 |
JP2016038888A (ja) | 2014-08-12 | 2016-03-22 | 富士通株式会社 | 情報処理システム、情報処理方法及び情報処理プログラム |
WO2016103471A1 (ja) | 2014-12-26 | 2016-06-30 | 株式会社日立製作所 | 計算機システムおよび管理プログラム |
JP2016139237A (ja) | 2015-01-27 | 2016-08-04 | 株式会社日立製作所 | 計算機システム及び計算機システムの性能障害の対処方法 |
Also Published As
Publication number | Publication date |
---|---|
US20210223966A1 (en) | 2021-07-22 |
JP2021114010A (ja) | 2021-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11789831B2 (en) | Directing operations to synchronously replicated storage systems | |
US11314543B2 (en) | Architecture for implementing a virtualization environment and appliance | |
US9639277B2 (en) | Storage system with virtual volume having data arranged astride storage devices, and volume management method | |
US9229645B2 (en) | Storage management method and storage system in virtual volume having data arranged astride storage devices | |
KR100644011B1 (ko) | 저장 도메인 관리 시스템 | |
US20190310925A1 (en) | Information processing system and path management method | |
US9229749B2 (en) | Compute and storage provisioning in a cloud environment | |
US8938604B2 (en) | Data backup using distributed hash tables | |
US20200026425A1 (en) | Efficient scaling of distributed storage systems | |
US10454810B1 (en) | Managing host definitions across a plurality of storage systems | |
US9098466B2 (en) | Switching between mirrored volumes | |
US20190235777A1 (en) | Redundant storage system | |
US9336093B2 (en) | Information processing system and access control method | |
JP2007207007A (ja) | ストレージシステム、ストレージコントローラ及び計算機システム | |
US20210303178A1 (en) | Distributed storage system and storage control method | |
US9875059B2 (en) | Storage system | |
JP2004355638A (ja) | 計算機システム及びそのデバイスの割り当て方法 | |
JP7332488B2 (ja) | ストレージシステム及びストレージシステムの制御方法 | |
US11201788B2 (en) | Distributed computing system and resource allocation method | |
WO2016174739A1 (ja) | 複合計算機システム、管理計算機、およびデータ連携管理方法 | |
US10768834B2 (en) | Methods for managing group objects with different service level objectives for an application and devices thereof | |
JP7337869B2 (ja) | 分散ストレージシステム、及び管理方法 | |
JP2023094302A (ja) | 情報処理システム及び構成管理方法 | |
Zhu et al. | High availability cluster with combining NAS and ISCSI |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220613 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230428 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230523 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230710 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230725 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230810 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7332488 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |