JP5699852B2 - 情報処理装置、ストレージ制御方法およびプログラム - Google Patents
情報処理装置、ストレージ制御方法およびプログラム Download PDFInfo
- Publication number
- JP5699852B2 JP5699852B2 JP2011176567A JP2011176567A JP5699852B2 JP 5699852 B2 JP5699852 B2 JP 5699852B2 JP 2011176567 A JP2011176567 A JP 2011176567A JP 2011176567 A JP2011176567 A JP 2011176567A JP 5699852 B2 JP5699852 B2 JP 5699852B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- node
- storage
- storage area
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2056—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
- G06F11/2071—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
- G06F11/2076—Synchronous techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2056—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
- G06F11/2082—Data synchronisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2056—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
- G06F11/2069—Management of state, configuration or failover
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
[第1の実施の形態]
図1は、第1の実施の形態のストレージシステムを示す図である。第1の実施の形態のストレージシステムは、情報処理装置10,20を有する。情報処理装置10と情報処理装置20とは、ネットワークで接続されている。情報処理装置10,20は、CPU(Central Processing Unit)やRAM(Random Access Memory)を備えるコンピュータであってもよい。情報処理装置10,20を、ストレージノードと呼んでもよい。
図2は、第2の実施の形態のストレージシステムを示す図である。第2の実施の形態のストレージシステムは、ストレージノード100,200、クライアントノード300および制御ノード400を含む。各ノードは、ネットワーク30に接続されている。ネットワーク30は、有線または無線のLAN(Local Area Network)を含んでもよい。
図3は、ストレージノードのハードウェア例を示すブロック図である。ストレージノード100は、CPU101、RAM102、HDD103、画像信号処理部104、入力信号処理部105、ディスクドライブ106および通信部107を有する。各ユニットがストレージノード100のバスに接続されている。ストレージノード200、クライアントノード300および制御ノード400も、図3に示したストレージノード100と同様
ハードウェア構造によって実現することができる。
ストレージノード100は、データ記憶部110、アクセス処理部120、ノード間転送部130、制御情報記憶部140およびノード情報変更部150を有する。ストレージノード200は、データ記憶部210、アクセス処理部220、ノード間転送部230、制御情報記憶部240およびノード情報変更部250を有する。
(ステップS14)アクセス処理部120は、自ノードがプライマリノードであるか判断する。プライマリノードであるか否かは、例えば、制御情報記憶部140に記憶されたノード情報141を参照することで判断できる。プライマリノードの場合、処理をステップS15に進める。セカンダリノードの場合、処理をステップS20に進める。
(ステップS20)アクセス処理部120は、ステップS11で受け付けたライト要求に含まれるデータを、ライト要求が指定するオフセットおよびサイズによって特定されるデータ記憶部110の記憶領域に書き込む。
(ステップS33)アクセス処理部120は、データ記憶部110から、ステップS32で確認したオフセットおよびサイズによって特定される記憶領域のデータを読み出す。ノード間転送部130は、セカンダリノードであるストレージノード200に、ライト要求を送信する。このライト要求は、アクセス処理部120が読み出したデータと、当該データの記憶領域を示すオフセットおよびサイズの情報とを含む。
(ステップS32a)アクセス処理部120は、ステップS31で受け付けたアクセスがライト要求であり、当該ライト要求が指定するオフセットおよびサイズと最終書込情報143が示すオフセットおよびサイズとが同一であるか判断する。条件を満たす場合、処理をステップS35に進める。条件を満たさない場合、処理をステップS33に進める。
(ステップS41)クライアントノード300は、ストレージノード100に、オフセットおよびサイズによって記憶領域を指定したリード要求を送信する。
(ステップS44)ストレージノード100は、ライト要求が指定する記憶領域を示す最終書込情報143を、制御情報記憶部140に書き込む。また、ストレージノード100は、ライト要求をストレージノード200に転送する。
(ステップS48)ストレージノード100は、ライト要求が指定する記憶領域を示す最終書込情報143を、制御情報記憶部140に書き込む。また、ストレージノード100は、ライト要求をストレージノード200に転送する。
図10は、データアクセスのシーケンス例(続き)を示す図である。
(ステップS52)ストレージノード100は、同期状態フラグ142が「非同期」に設定されていることを確認し、最終書込情報143が示す記憶領域のデータをデータ記憶部110から読み出す。そして、読み出したデータと最終書込情報143が示す記憶領域とを指定した他のライト要求を、ストレージノード200に送信する。しかし、ネットワーク30が復旧しておらず、他のライト要求はストレージノード200に到達しない。
(ステップS55)ストレージノード100は、同期状態フラグ142が「非同期」に設定されていることを確認し、最終書込情報143が示す記憶領域のデータをデータ記憶部110から読み出す。そして、読み出したデータと最終書込情報143が示す記憶領域とを指定した他のライト要求を、ストレージノード200に送信する。
(ステップS63)セカンダリノードに移行したストレージノード100は、同期状態フラグ142をリセット(制御情報記憶部140から削除)し、値なしとする。
(ステップS65)プライマリノードに移行したストレージノード200は、同期状態フラグ242を「非同期」に設定する。
次に、第3の実施の形態を説明する。第2の実施の形態との差異を中心に説明し、同様の事項については説明を省略する。第3の実施の形態のストレージシステムは、データのアクセスがなくても、データの整合性が失われていないかを定期的に確認する。
(ステップS71)制御ノード400aの同期要求部420は、ストレージノード100aに同期要求を送信する。同期要求は、所定周期で継続的に送信される。
(ステップS73)ストレージノード100aのノード間転送部130は、最終書込情報143が示す記憶領域のデータをデータ記憶部110から読み出す。
(ステップS77)ストレージノード100aの同期状態監視部160は、同期状態フラグ142を「同期」に設定し、同期完了を制御ノード400aに報告する。
次に、第4の実施の形態を説明する。第2および第3の実施の形態との差異を中心に説明し、同様の事項については説明を省略する。第4の実施の形態のストレージシステムでは、記憶領域が複数のセグメントに分割され、セグメント毎に複数のストレージノードの中からプライマリノードを選択することができる。
11,21 記憶手段
11a,21a 記憶領域
12 要求手段
13 書込手段
14 同期手段
Claims (6)
- 第1の記憶領域を含む記憶手段と、
前記第1の記憶領域に対するデータの書き込み要求が取得されると、他の情報処理装置に前記データの書き込みを要求する要求手段と、
前記他の情報処理装置が備える他の記憶手段の、前記第1の記憶領域に対応する第2の記憶領域に対して、前記データの書き込みが正常に行われたことを、前記他の情報処理装置からの応答に基づいて検出した場合、前記第1の記憶領域に対して前記データの書き込みを行い、前記他の情報処理装置から応答が受信されない場合、前記第1の記憶領域に対して前記データの書き込みを行わない書込手段と、
前記他の情報処理装置から応答が受信されない場合に、前記データの書き込みを行わなかった前記第1の記憶領域に記憶されているデータを、前記他の情報処理装置に送信して前記第2の記憶領域に書き込ませる同期手段と、
を有する情報処理装置。 - 前記同期手段は、前記データの書き込み要求の後に他のデータの書き込み要求が取得されたときに、前記第1の記憶領域に記憶されているデータを前記他の情報処理装置に送信する、請求項1記載の情報処理装置。
- 前記同期手段は、所定周期のタイミングになったときに、前記第1の記憶領域に記憶されているデータを前記他の情報処理装置に送信する、請求項1記載の情報処理装置。
- 前記同期手段は、前記第1の記憶領域に記憶されているデータが前記第2の記憶領域に正常に書き込まれたことを検出しない場合、継続的に、前記第1の記憶領域に記憶されているデータを前記他の情報処理装置に送信する、請求項1乃至3の何れか一項に記載の情報処理装置。
- データを記憶する記憶手段を備える複数のノードを含むストレージシステムの中の一のノードが実行するストレージ制御方法であって、
自ノードが備える記憶手段の第1の記憶領域に対するデータの書き込み要求が取得されると、他のノードに前記データの書き込みを要求し、
前記他のノードが備える記憶手段の、前記第1の記憶領域に対応する第2の記憶領域に対して、前記データの書き込みが正常に行われたことを、前記他のノードからの応答に基づいて検出した場合、前記第1の記憶領域に対して前記データの書き込みを行い、
前記他のノードから応答が受信されない場合、前記第1の記憶領域に対して前記データの書き込みを行わず、
前記データの書き込みを行わなかった前記第1の記憶領域に記憶されているデータを、前記他のノードに送信して前記第2の記憶領域に書き込ませる、
ストレージ制御方法。 - データを記憶する記憶手段を備える複数のノードを含むストレージシステムの中の一のノードを制御するプログラムであって、前記一のノードが備えるコンピュータに、
自ノードが備える記憶手段の第1の記憶領域に対するデータの書き込み要求が取得されると、他のノードに前記データの書き込みを要求し、
前記他のノードが備える記憶手段の、前記第1の記憶領域に対応する第2の記憶領域に対して、前記データの書き込みが正常に行われたことを、前記他のノードからの応答に基づいて検出した場合、前記第1の記憶領域に対して前記データの書き込みを行い、
前記他のノードから応答が受信されない場合、前記第1の記憶領域に対して前記データの書き込みを行わず、
前記データの書き込みを行わなかった前記第1の記憶領域に記憶されているデータを、前記他のノードに送信して前記第2の記憶領域に書き込ませる、
処理を実行させるプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011176567A JP5699852B2 (ja) | 2011-08-12 | 2011-08-12 | 情報処理装置、ストレージ制御方法およびプログラム |
US13/562,748 US8825968B2 (en) | 2011-08-12 | 2012-07-31 | Information processing apparatus and storage control method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011176567A JP5699852B2 (ja) | 2011-08-12 | 2011-08-12 | 情報処理装置、ストレージ制御方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013041353A JP2013041353A (ja) | 2013-02-28 |
JP5699852B2 true JP5699852B2 (ja) | 2015-04-15 |
Family
ID=47678275
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011176567A Active JP5699852B2 (ja) | 2011-08-12 | 2011-08-12 | 情報処理装置、ストレージ制御方法およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8825968B2 (ja) |
JP (1) | JP5699852B2 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103647804B (zh) * | 2013-11-22 | 2017-04-26 | 华为技术有限公司 | 一种存储单元的数据处理方法、设备及系统 |
WO2015198449A1 (ja) * | 2014-06-26 | 2015-12-30 | 株式会社日立製作所 | ストレージシステム |
US9715433B2 (en) * | 2014-08-29 | 2017-07-25 | Netapp, Inc. | Reconciliation in sync replication |
US9571575B2 (en) * | 2014-08-29 | 2017-02-14 | Netapp, Inc. | Granular sync/semi-sync architecture |
WO2016079804A1 (ja) * | 2014-11-18 | 2016-05-26 | 株式会社日立製作所 | ストレージシステム及びその制御方法 |
CN114385350A (zh) * | 2016-11-30 | 2022-04-22 | 华为技术有限公司 | 一种图数据处理的方法、装置及系统 |
US11197075B1 (en) | 2018-12-27 | 2021-12-07 | Equinix, Inc. | Clock synchronization in a heterogeneous system |
US11755226B2 (en) | 2020-09-18 | 2023-09-12 | Hewlett Packard Enterprise Development Lp | Tracking changes of storage volumes during data transfers |
US11720274B2 (en) | 2021-02-03 | 2023-08-08 | Hewlett Packard Enterprise Development Lp | Data migration using cache state change |
JPWO2022190681A1 (ja) * | 2021-03-09 | 2022-09-15 | ||
WO2022196112A1 (ja) * | 2021-03-16 | 2022-09-22 | 富士フイルム株式会社 | ストレージシステム、データ処理方法、及びデータ処理プログラム |
US11693565B2 (en) * | 2021-08-10 | 2023-07-04 | Hewlett Packard Enterprise Development Lp | Storage volume synchronizations responsive to communication link recoveries |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08110840A (ja) * | 1994-10-12 | 1996-04-30 | Nec Telecom Syst Ltd | 2重化冗長構成磁気ディスク装置の復旧方式 |
JP2000099277A (ja) * | 1998-09-18 | 2000-04-07 | Fujitsu Ltd | ファイルユニット間のリモート転送方法 |
US7139932B2 (en) | 2002-01-03 | 2006-11-21 | Hitachi, Ltd. | Data synchronization of multiple remote storage after remote copy suspension |
JP4452494B2 (ja) | 2003-03-11 | 2010-04-21 | 株式会社日立製作所 | 複数リモートストレージでのリモートコピー停止後のデータ同期化方式 |
US7308545B1 (en) * | 2003-05-12 | 2007-12-11 | Symantec Operating Corporation | Method and system of providing replication |
US7617369B1 (en) * | 2003-06-30 | 2009-11-10 | Symantec Operating Corporation | Fast failover with multiple secondary nodes |
US7266653B2 (en) * | 2003-09-29 | 2007-09-04 | International Business Machines Corporation | Remote data mirroring with acknowledgment upon writing copied data to volatile cache memory |
JP4389772B2 (ja) * | 2004-12-03 | 2009-12-24 | 日本電気株式会社 | 計算機システムおよびバックアップ方法 |
JP2007086972A (ja) | 2005-09-21 | 2007-04-05 | Hitachi Ltd | ストレージシステム、二重化制御方法、及びプログラム |
US8046548B1 (en) * | 2007-01-30 | 2011-10-25 | American Megatrends, Inc. | Maintaining data consistency in mirrored cluster storage systems using bitmap write-intent logging |
US7822892B2 (en) * | 2007-07-19 | 2010-10-26 | International Business Machines Corporation | Managing the copying of writes from primary storages to secondary storages across different networks |
JP5486793B2 (ja) | 2008-11-07 | 2014-05-07 | 株式会社日立製作所 | リモートコピー管理システム、方法及び装置 |
TWI414992B (zh) * | 2009-01-23 | 2013-11-11 | Infortrend Technology Inc | 遠端非同步資料卷複製的方法及其裝置 |
US8589732B2 (en) * | 2010-10-25 | 2013-11-19 | Microsoft Corporation | Consistent messaging with replication |
-
2011
- 2011-08-12 JP JP2011176567A patent/JP5699852B2/ja active Active
-
2012
- 2012-07-31 US US13/562,748 patent/US8825968B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20130042082A1 (en) | 2013-02-14 |
JP2013041353A (ja) | 2013-02-28 |
US8825968B2 (en) | 2014-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5699852B2 (ja) | 情報処理装置、ストレージ制御方法およびプログラム | |
US10936447B2 (en) | Resynchronizing to a first storage system after a failover to a second storage system mirroring the first storage system | |
JP6056453B2 (ja) | プログラム、データ管理方法および情報処理装置 | |
US10108367B2 (en) | Method for a source storage device sending data to a backup storage device for storage, and storage device | |
JP4371724B2 (ja) | 記憶システム及び記憶装置システム | |
US9678686B2 (en) | Managing sequentiality of tracks for asynchronous PPRC tracks on secondary | |
US8285824B2 (en) | Storage system and data replication method that refuses one or more requests for changing the first logical configuration information until the first storage apparatus and second storage apparatus are synchronized | |
US8191078B1 (en) | Fault-tolerant messaging system and methods | |
JP5396836B2 (ja) | データ分散制御プログラム、ストレージ管理プログラム、制御ノード、およびディスクノード | |
JP2008071209A (ja) | ストレージ管理プログラム、ストレージ管理装置、およびストレージ管理方法 | |
JP2006527875A (ja) | データ管理方法、システム、およびプログラム(リモート記憶位置にフェイルオーバを行うための方法、システム、およびプログラム) | |
JP2005196683A (ja) | 情報処理システム、情報処理装置、及び情報処理システムの制御方法 | |
US9081697B2 (en) | Storage control apparatus and storage control method | |
JP2011128917A (ja) | データ割当制御プログラム、データ割当制御方法、およびデータ割当制御装置 | |
JP2007058611A (ja) | ストレージシステム及びストレージシステムの管理方法 | |
JP2007249776A (ja) | データベース複製プログラム、データベース複製装置およびデータベース複製方法 | |
JP4911198B2 (ja) | ストレージ制御装置、ストレージシステムおよびストレージ制御方法 | |
JP2015007880A (ja) | ストレージ制御装置,ストレージシステム,および制御プログラム | |
JP2007018312A (ja) | ディスクアレイ装置及びその制御方法 | |
JP5691246B2 (ja) | データベース二重化システム、情報処理装置及びデータベース二重化方法 | |
CN113326251B (zh) | 数据管理方法、系统、设备和存储介质 | |
JP4563412B2 (ja) | ソフトウェア複製 | |
CN115955488B (zh) | 基于副本冗余的分布式存储副本跨机房放置方法与装置 | |
JP5640480B2 (ja) | データ管理プログラム、ストレージシステム、およびデータ管理方法 | |
JP2008276281A (ja) | データ同期システム、方法、及び、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140404 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141224 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150120 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150202 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5699852 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |