JP6782210B2 - 計算機システム、データ管理方法、及びデータ管理プログラム - Google Patents
計算機システム、データ管理方法、及びデータ管理プログラム Download PDFInfo
- Publication number
- JP6782210B2 JP6782210B2 JP2017168899A JP2017168899A JP6782210B2 JP 6782210 B2 JP6782210 B2 JP 6782210B2 JP 2017168899 A JP2017168899 A JP 2017168899A JP 2017168899 A JP2017168899 A JP 2017168899A JP 6782210 B2 JP6782210 B2 JP 6782210B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- volume
- data
- written
- pair
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 44
- 238000013523 data management Methods 0.000 title claims description 13
- 238000007726 management method Methods 0.000 claims description 72
- 238000011084 recovery Methods 0.000 description 128
- 238000012545 processing Methods 0.000 description 26
- 238000010586 diagram Methods 0.000 description 20
- 238000004891 communication Methods 0.000 description 5
- 230000000717 retained effect Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 238000013439 planning Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1095—Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2056—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
- G06F11/2069—Management of state, configuration or failover
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2056—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
- G06F11/2082—Data synchronisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0614—Improving the reliability of storage systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0646—Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
- G06F3/065—Replication mechanisms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/067—Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1097—Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/855—Details of asynchronous mirroring using a journal to transfer not-yet-mirrored changes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Retry When Errors Occur (AREA)
Description
条件1:ノードは、すぐに停止されるノードであってはいけない。
条件2:ノードは、計画停止対象のノードがオフラインの間、データ冗長度の維持が必要なボリュームに関するジャーナルログを格納できるだけの十分な空き容量を持つノードでなくてはならない。
処理1 計算機システム10における全てのオンラインであるノードと通信し、最大の空き容量を持つノードを選択する。
処理2 計算機システム10における全てのオンラインであるノードと通信し、十分な空き容量を持ち、かつ、IOワークロードが最も低いノードを選択する。
処理3 管理計算機410と通信し、管理計算機410による処理1又は処理2の実行により得られた結果に対応するノードを選択する。
Claims (11)
- データを記憶可能な複数のノードと、前記複数のノードを管理する管理計算機とを備える計算機システムであって、
第1ノードの第1ボリュームと、第2ノードの第2ボリュームとは、同一のデータを2重化して管理するHA(High Availability)ペアとして構成されており、
前記第1ノードを、オンラインに変更可能な状態でオフラインにし、
前記第2ノードのプロセッサ部は、前記第1ノードがオフラインとなった場合において、それ以降に前記第2ノードの前記第2ボリュームに対して書き込まれるライトデータを、前記第2ボリュームに書き込ませるとともに、前記第1ノード及び第2ノードとは異なる第3ノードの第3ボリュームに書き込ませ、
前記第2ノードに障害が発生した場合に、前記第1ノードをオンラインに変更し、前記オフライン前に前記第1ノードに書き込まれたライトデータと、前記オフライン後に前記第3ノードに書き込まれたライトデータとを用いて、前記第2ノードに書き込まれたデータと同じデータを復元することを特徴とする
計算機システム。 - 前記第2ノードのプロセッサ部は、前記第2ボリュームに対して書き込まれるライトデータをジャーナルログとして前記第3ボリュームに書き込ませる
請求項1に記載の計算機システム。 - 前記管理計算機のプロセッサ部は、前記第1ノードがオフラインとなった場合以降における、前記ライトデータを書き込ませた前記第2ボリュームの1以上の領域を識別可能なビットマップを前記第2ノードと、前記第3ノードとに管理する
請求項1に記載の計算機システム。 - 前記第2ノードのプロセッサ部は、前記第1ノードがオフラインとなった時点における、前記第2ボリュームの状態を示す第1スナップショットボリュームを前記第2ノードに生成するとともに、前記第3ノードに前記第1スナップショットボリュームに対応する第2スナップショットボリュームを前記第3ボリュームとして作成し、前記第2ボリュームに対するライトデータを、前記第2ボリュームにおける格納位置が特定可能なように前記第1スナップショットボリュームと、前記第2スナップショットボリュームとに書き込ませる
請求項1に記載の計算機システム。 - 前記複数のノード又は前記管理計算機のいずれかのプロセッサ部は、
前記第1ノードがオンラインとなった場合において、前記第3ノードの前記第3ボリュームに書き込まれたライトデータに基づいて、前記第1ノードの前記第1ボリュームが、前記第2ノードの前記第2ボリュームと同一のデータとなるようにデータの書き込みを制御する
請求項1から請求項4のいずれか一項に記載の計算機システム。 - 前記複数のノード又は前記管理計算機のいずれかのプロセッサ部は、
前記第1ノードがオフラインとなったことを検出した場合に、前記第1ノードの前記第1ボリュームと、前記第2ノードの前記第2ボリュームとのHAペアの状態を停止し、
前記第3ボリュームを作成する前記第3ノードを決定し、前記第3ノードに前記第3ボリュームを生成する
請求項1から請求項5のいずれか一項に記載の計算機システム。 - 前記管理計算機のいずれかのプロセッサ部は、
オフラインの対象とする前記第1ノードの指定を受け付け、前記第1ノードの1以上のボリュームのうちのHAペアを構成している1以上の前記第1ボリュームを特定し、
前記1以上の前記第1ボリュームとHAペアとなっている1以上の前記第2ボリュームを特定し、
前記第3ボリュームを生成させる前記第3ノードを決定し、
前記第3ノードに前記第3ボリュームを生成させ、
前記第3ボリュームを生成させた以降において、前記第1ノードを停止させる要求を出力する
請求項1から請求項5のいずれか一項に記載の計算機システム。 - データを記憶可能な複数のノードと、前記複数のノードを管理する管理計算機とを備える計算機システムによるデータ管理方法であって、
第1ノードの第1ボリュームと、第2ノードの第2ボリュームとは、同一のデータを2重化して管理するHA(High Availabirity)ペアとして構成されており、
前記第1ノードを、オンラインに変更可能な状態でオフラインにし、
前記第1ノードがオフラインとなった場合において、それ以降に前記第2ノードの前記第2ボリュームに対して書き込まれるライトデータを、前記第2ボリュームに書き込ませるとともに、前記第1ノード及び第2ノードとは異なる第3ノードの第3ボリュームに書き込ませ、
前記第2ノードに障害が発生した場合に、前記第1ノードをオンラインに変更し、前記オフライン前に前記第1ノードに書き込まれたライトデータと、前記オフライン後に前記第3ノードに書き込まれたライトデータとを用いて、前記第2ノードに書き込まれたデータと同じデータを復元することを特徴とする
データ管理方法。 - 前記第1ノードがオンラインとなった場合において、前記第3ノードの前記第3ボリュームに書き込まれたライトデータに基づいて、前記第1ノードの前記第1ボリュームが、前記第2ノードの前記第2ボリュームと同一のデータとなるようにデータを書き込ませる
請求項8に記載のデータ管理方法。 - 複数のノードに管理されているボリュームのデータを管理するためのコンピュータに実行させるためのデータ管理プログラムであって、
前記コンピュータを、
第1ノードの第1ボリュームと、第2ノードの第2ボリュームとが、同一のデータを2重化して管理するHA(High Availability)ペアとして構成されている場合に、
前記第1ノードを、オンラインに変更可能な状態でオフラインにさせ、
前記第1ノードがオフラインとなった場合において、それ以降に前記第2ノードの前記第2ボリュームに対して書き込まれるライトデータを、前記第2ボリュームに書き込ませるとともに、前記第1ノード及び第2ノードとは異なる第3ノードの第3ボリュームに書き込ませ、
前記第2ノードに障害が発生した場合に、前記第1ノードをオンラインに変更させ、前記オフライン前に前記第1ノードに書き込まれたライトデータと、前記オフライン後に前記第3ノードに書き込まれたライトデータとを用いて、前記第2ノードに書き込まれたデータと同じデータを復元させるように機能させる
データ管理プログラム。 - 前記コンピュータを、
さらに、前記第1ノードがオンラインとなった場合において、前記第3ノードの前記第3ボリュームに書き込まれたライトデータに基づいて、前記第1ノードの前記第1ボリュームが、前記第2ノードの前記第2ボリュームと同一のデータとなるようにデータを書き込ませるように機能させる
請求項10に記載のデータ管理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017168899A JP6782210B2 (ja) | 2017-09-01 | 2017-09-01 | 計算機システム、データ管理方法、及びデータ管理プログラム |
US15/904,473 US10656867B2 (en) | 2017-09-01 | 2018-02-26 | Computer system, data management method, and data management program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017168899A JP6782210B2 (ja) | 2017-09-01 | 2017-09-01 | 計算機システム、データ管理方法、及びデータ管理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019046180A JP2019046180A (ja) | 2019-03-22 |
JP6782210B2 true JP6782210B2 (ja) | 2020-11-11 |
Family
ID=65518617
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017168899A Active JP6782210B2 (ja) | 2017-09-01 | 2017-09-01 | 計算機システム、データ管理方法、及びデータ管理プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10656867B2 (ja) |
JP (1) | JP6782210B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7061635B2 (ja) * | 2020-03-10 | 2022-04-28 | 株式会社日立製作所 | 計算機システム、ファイルストレージ、及び、データ転送方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7143249B2 (en) * | 2000-10-04 | 2006-11-28 | Network Appliance, Inc. | Resynchronization of mirrored storage devices |
JP2003076592A (ja) | 2001-09-04 | 2003-03-14 | Hitachi Ltd | データ格納システム |
JP2005018510A (ja) * | 2003-06-27 | 2005-01-20 | Hitachi Ltd | データセンタシステム及びその制御方法 |
US8271447B1 (en) | 2010-06-18 | 2012-09-18 | Emc International Company | Mirroring metadata in a continuous data protection environment |
US8806161B1 (en) | 2011-09-29 | 2014-08-12 | Emc Corporation | Mirroring splitter meta data |
US9348713B2 (en) * | 2013-12-13 | 2016-05-24 | Netapp, Inc. | Techniques for importation of information to a storage system |
US10241712B1 (en) * | 2014-06-30 | 2019-03-26 | EMC IP Holding Company LLC | Method and apparatus for automated orchestration of long distance protection of virtualized storage |
WO2016024994A1 (en) * | 2014-08-15 | 2016-02-18 | Hitachi, Ltd. | Method and apparatus to virtualize remote copy pair in three data center configuration |
US10133643B2 (en) * | 2015-05-05 | 2018-11-20 | International Business Machines Corporation | Resynchronizing to a first storage system after a failover to a second storage system mirroring the first storage system |
US10409697B2 (en) * | 2017-02-23 | 2019-09-10 | Salesforce.Com, Inc. | Automated self-healing database system and method for implementing the same |
-
2017
- 2017-09-01 JP JP2017168899A patent/JP6782210B2/ja active Active
-
2018
- 2018-02-26 US US15/904,473 patent/US10656867B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019046180A (ja) | 2019-03-22 |
US10656867B2 (en) | 2020-05-19 |
US20190073128A1 (en) | 2019-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5620614B1 (ja) | ストレージシステム | |
JP4927408B2 (ja) | 記憶システム及びそのデータ復元方法 | |
US9830088B2 (en) | Optimized read access to shared data via monitoring of mirroring operations | |
JP4515132B2 (ja) | ストレージシステム、ストレージ装置及びリモートコピー方法 | |
US11301159B2 (en) | Storage system and data transfer method | |
US10223007B1 (en) | Predicting IO | |
US20160147855A1 (en) | Content-based replication of data in scale out system | |
US11157177B2 (en) | Hiccup-less failback and journal recovery in an active-active storage system | |
JP4902289B2 (ja) | バックアップシステム及びバックアップ方法 | |
US10831386B2 (en) | Remote direct memory access | |
JP2004252686A (ja) | 情報処理システム | |
WO2015010327A1 (zh) | 数据发送方法、数据接收方法和存储设备 | |
JP2005222110A (ja) | ストレージサブシステム | |
US10191685B2 (en) | Storage system, storage device, and data transfer method | |
JP6650483B2 (ja) | 記憶装置、データ管理方法、及びデータ管理プログラム | |
CN107533537B (zh) | 存储系统、用于存储的方法和非暂时性计算机可读介质 | |
JP2008225616A (ja) | ストレージシステム、リモートコピーシステム、及びデータ復元方法 | |
WO2018076633A1 (zh) | 一种远程数据复制方法、存储设备及存储系统 | |
US10761764B1 (en) | Storage system and data transfer method | |
JP2007310448A (ja) | 計算機システム、管理計算機、および、ストレージシステム管理方法 | |
JP2006508459A (ja) | nウェイ共用ストレージ・システムにおけるフラッシュ・コピーのためのハイパフォーマンス・ロック管理 | |
JP6782210B2 (ja) | 計算機システム、データ管理方法、及びデータ管理プログラム | |
WO2015141219A1 (ja) | ストレージシステム、制御装置、記憶装置、データアクセス方法及びプログラム記録媒体 | |
JP2006092535A (ja) | ストレージネットワークにおける内部ミラーオペレーション | |
US10210060B2 (en) | Online NVM format upgrade in a data storage system operating with active and standby memory controllers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190425 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200626 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200728 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200916 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201013 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201019 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6782210 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |