JP6511738B2 - 冗長システム、冗長化方法および冗長化プログラム - Google Patents
冗長システム、冗長化方法および冗長化プログラム Download PDFInfo
- Publication number
- JP6511738B2 JP6511738B2 JP2014127731A JP2014127731A JP6511738B2 JP 6511738 B2 JP6511738 B2 JP 6511738B2 JP 2014127731 A JP2014127731 A JP 2014127731A JP 2014127731 A JP2014127731 A JP 2014127731A JP 6511738 B2 JP6511738 B2 JP 6511738B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- update
- data
- information
- update information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2028—Failover techniques eliminating a faulty processor or activating a spare
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2041—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with more than one idle spare processing component
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2048—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share neither address space nor persistent storage
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2097—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements maintaining the standby controller/processing unit updated
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/80—Database-specific techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/82—Solving problems relating to consistency
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/84—Using snapshots, i.e. a logical point-in-time copy of the data
Description
を含む正系システムと、第3のノードと該第3のノードのバックアップを行う第4のノードとを含む副系システムとを備える。前記正系システムの前記第1のノードは、前記第1のノードにおけるデータ更新に応じて生成されるデータ更新情報を前記第2のノードと、前記第3のノードとに送信する送信手段を備える。前記副系システムの前記第4のノードは、前記第2のノードを介して取得したデータ更新情報に示されるトランザクションの進行度と、前記第3のノードを介して取得したデータ更新情報に示されるトランザクションの進行度とを判定し、より進行するトランザクションを示すデータ更新情報を特定して、前記第4のノードの記憶データに反映する反映手段を備える。
図1は、実施例1に係る冗長化システムの全体構成例を示す図である。図1に示すように、このシステムは、DB4重化機能を実行してデータセンタがミラーリングされた冗長化システムであり、データセンタである正センタ1および副センタ5を有する。
次に、図1に示した各ノードの機能構成について説明する。ここでは、一例として、図1の状態における機能構成について説明するが、これに限定されるものではなく、各ノードが同じ機能構成を有することもできる。
図2は、正センタの各ノードの機能構成を示す機能ブロック図である。ここでは、正センタ1が有する正マスタノード10と正ミラーノード20とについて説明する。
図2に示すように、正マスタノード10は、通信制御部11、DB12、制御部13を有する。
図2に示すように、正ミラーノード20は、通信制御部21、DB22、制御部23を有する。
図7は、副センタの各ノードの機能構成を示す機能ブロック図である。ここでは、副センタ5が有する副マスタノード50と副ミラーノード60とについて説明する。
図7に示すように、副マスタノード50は、通信制御部51、DB52、制御部53を有する。
図7に示すように、副ミラーノード60は、通信制御部61、DB62、バッファ63、制御部64を有する。
次に、各ノードが実行する処理について説明する。ここでは、各ノードが実行するDBの更新処理および更新情報の通知処理について説明する。なお、ここでは一例として、DB更新後にチェックポイント(リカバリポイントログ)を生成する例を説明するが、これに限定されるものではない。例えば、DB更新の処理とチェックポイントの生成処理とは、並行して実行することができ、別々のフローチャートで実行することもできる。
図9は、正マスタノードから正ミラーノードへの通知処理の流れを示すフローチャートである。
図10は、正マスタノードから副マスタノードへの通知処理の流れを示すフローチャートである。
図11は、正ミラーノードが実行する更新処理の流れを示すフローチャートである。図11に示すように、正ミラーノード20の受信部24は、正マスタノード10から情報を受信すると(S301:Yes)、受信した情報が更新ログであるか否かを判定する(S302)。
図12は、正ミラーノードが実行する通知処理の流れを示すフローチャートである。図12に示すように、正ミラーノード20のセンタ間通知部26は、通知タイミングに到達すると(S401:Yes)、蓄積した更新ログおよびリカバリポイントログを読出す(S402)。
図13は、副マスタノードが実行する更新および通知処理の流れを示すフローチャートである。図13に示すように、副マスタノード50のDB更新部55は、更新ファイルが受信されると(S501:Yes)、更新ファイルに含まれる各ログを抽出する(S502)。
図14は、副ミラーノードが実行する更新処理の流れを示すフローチャートである。図14に示すように、副ミラーノード60のセンタ内受信部65は、更新ログまたはリカバリポイントログを副マスタノード50から受信すると(S601:Yes)、受信した更新ログまたはリカバリポイントログを受信順でバッファ63に蓄積する(S602)。
図16は、実施例3に係る冗長化システムの障害発生例を説明する図である。図16に示すように、全体構成は、図1と同様なので、詳細な説明は省略する。
図18は、実施例3に係る副ミラーノードが実行する更新処理の流れを示すフローチャートである。なお、ここで説明する処理は、系切替前の更新処理である。
図19は、実施例3に係る副ミラーノードが実行する系切替処理の流れを示すフローチャートである。図19に示すように、副ミラーノード60のDB更新部68は、系切替が発生すると(S901:Yes)、副マスタノード50からの最新のリカバリポイントログと、正ミラーノード20からの最新のリカバリポイントログをバッファ63が抽出する(S902とS903)。
上記実施例では、チェックポイントとしてシステム内で一意な通番を含むリカバリポイントログを用いる例を説明したが、これに限定されるものではなく、例えば日時や時刻などを含むリカバリポイントログを用いることもできる。つまり、システム内で昇順あるいは降順などの一意な順番が指定できるものであれば、様々な情報を使用することができる。
また、本実施例において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともできる。あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
図20は、ハードウェア構成例を説明する図である。図1に示した各ノードは、同様のハードウェア構成を有するので、ここでは、一例として正マスタノード10を例にして説明する。
5 副センタ
10 正マスタノード
11 通信制御部
12 DB
13 制御部
14 DB更新部
15 センタ内通知部
16 挿入部
17 センタ間通知部
20 正ミラーノード
21 通信制御部
22 DB
23 制御部
24 受信部
25 DB更新部
26 センタ間通知部
50 副マスタノード
51 通信制御部
52 DB
53 制御部
54 受信部
55 DB更新部
56 センタ内通知部
60 副ミラーノード
61 通信制御部
62 DB
63 バッファ
64 制御部
65 センタ内受信部
66 センタ間受信部
67 特定部
68 DB更新部
Claims (6)
- 第1のノードと、
該第1のノードのバックアップを行う第2のノードと、
を含む正系システムと、
第3のノードと、
該第3のノードのバックアップを行う第4のノードと、
を含む副系システムと、
を備え、
前記正系システムの前記第1のノードは、
前記第1のノードにおけるデータ更新に応じて生成され、更新処理単位の境界を示す区切り情報が挿入された第1のデータ更新情報を、当該データの更新に同期して前記第2のノードに送信し、前記第1のノードにおけるデータの更新に応じて生成され、更新処理単位の境界を示す区切り情報が挿入された第2のデータ更新情報を、当該データの更新に非同期で前記第3のノードに送信する送信手段を備え、
前記副系システムの前記第4のノードは、
前記データの更新に同期して前記第2のノードに送信され、前記第2のノードへの送信と非同期で前記第4のノードに送信される前記第1のデータ更新情報のうち挿入された区切り情報より後のデータ更新情報の数と、前記データの更新に非同期で前記第3のノードに送信され、前記第3のノードへの送信と同期して前記第4のノードに送信される前記第2のデータ更新情報のうち挿入された区切り情報より後のデータ更新情報の数とを比較し、数が多い方のデータ更新情報を、より進行するトランザクションを示すデータ更新情報として特定して、前記第4のノードの記憶データに反映する反映手段を備えた、
ことを特徴とする冗長システム。 - 前記反映手段は、前記データの更新に同期して前記第2のノードに送信され、前記第2のノードへの送信と非同期で前記第4のノードに送信される前記第1のデータ更新情報のうち挿入された区切り情報より後のデータ更新情報の数と、前記データの更新に非同期で前記第3のノードに送信され、前記第3のノードへの送信と同期して前記第4のノードに送信される前記第2のデータ更新情報のうち挿入された区切り情報より後のデータ更新情報の数とを比較し、数が多い方のデータ更新情報を、より進行するトランザクションを示すデータ更新情報として特定して、前記第4のノードの記憶データに反映することを特徴とする請求項1記載の冗長システム。
- 前記区切り情報は、区切り情報の送信順を示す順序情報を含み、前記反映手段は、前記第2のノードから取得した更新情報に含まれる最後の区切り情報が示す順序情報と、前記第3のノードを介して取得した更新情報に含まれる最後の区切り情報が示す順序情報とが同じ順を示す場合に、前記トランザクションの進行度の判定を行い、順序情報が異なる場合は、前記第2のノードから取得した更新情報と、前記第3のノードを介して取得した更新情報のうち、より進んだ更新情報を含む側の更新情報を用いて前記記憶データに反映する、ことを特徴とする請求項2記載の冗長システム。
- 前記反映手段は、前記第1のノードの停止に応じて、前記より進行するトランザクションを示す更新情報を含む側の更新情報を特定して、前記第4のノードの記憶データに反映する処理を実行し、
前記第4のノードは、
前記反映手段による、前記より進行するトランザクションを示す更新情報の前記第4のノードの記憶データへの反映が完了すると、前記第4のノードを前記副系システムの正系ノードに切替える制御を行なう切替え手段をさらに備えた、
ことを特徴とする請求項1記載の冗長システム。 - 第1のノードと、
該第1のノードのバックアップを行う第2のノードと、
を含む正系システムと、
第3のノードと、
該第3のノードのバックアップを行う第4のノードと、
を含む副系システムと、
を備え、
前記正系システムの前記第1のノードが、
前記第1のノードにおけるデータ更新に応じて生成され、更新処理単位の境界を示す区切り情報が挿入された第1のデータ更新情報を、当該データの更新に同期して前記第2のノードに送信し、前記第1のノードにおけるデータの更新に応じて生成され、更新処理単位の境界を示す区切り情報が挿入された第2のデータ更新情報を、当該データの更新に非同期で前記第3のノードに送信する処理を含み、
前記副系システムの前記第4のノードが、
前記データの更新に同期して前記第2のノードに送信され、前記第2のノードへの送信と非同期で前記第4のノードに送信される前記第1のデータ更新情報のうち挿入された区切り情報より後のデータ更新情報の数と、前記データの更新に非同期で前記第3のノードに送信され、前記第3のノードへの送信と同期して前記第4のノードに送信される前記第2のデータ更新情報のうち挿入された区切り情報より後のデータ更新情報の数とを比較し、数が多い方のデータ更新情報を、より進行するトランザクションを示すデータ更新情報として特定して、前記第4のノードの記憶データに反映する処理を含む、
ことを特徴とする冗長方法。 - 第1のノードと該第1のノードのバックアップを行う第2のノードとを含む正系システムと、第3のノードと該第3のノードのバックアップを行う第4のノードとを含む副系システムとを有する冗長化システムにおける前記第4のノードに、
更新処理単位の境界を示す区切り情報が挿入され、前記データの更新に同期して前記第2のノードに送信され、前記第2のノードへの送信と非同期で前記第4のノードに送信される前記第1のデータ更新情報のうち挿入された区切り情報より後のデータ更新情報の数と、更新処理単位の境界を示す区切り情報が挿入され、前記データの更新に非同期で前記第3のノードに送信され、前記第3のノードへの送信と同期して前記第4のノードに送信される前記第2のデータ更新情報のうち挿入された区切り情報より後のデータ更新情報の数とを比較し、数が多い方のデータ更新情報を、より進行するトランザクションを示すデータ更新情報として特定して、前記第4のノードの記憶データに反映する処理を、
実行させることを特徴とする冗長化プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014127731A JP6511738B2 (ja) | 2014-06-20 | 2014-06-20 | 冗長システム、冗長化方法および冗長化プログラム |
US14/721,059 US9921927B2 (en) | 2014-06-20 | 2015-05-26 | Redundant system, redundancy method, and computer-readable recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014127731A JP6511738B2 (ja) | 2014-06-20 | 2014-06-20 | 冗長システム、冗長化方法および冗長化プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016009218A JP2016009218A (ja) | 2016-01-18 |
JP6511738B2 true JP6511738B2 (ja) | 2019-05-15 |
Family
ID=54869739
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014127731A Active JP6511738B2 (ja) | 2014-06-20 | 2014-06-20 | 冗長システム、冗長化方法および冗長化プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9921927B2 (ja) |
JP (1) | JP6511738B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11334455B2 (en) * | 2019-09-28 | 2022-05-17 | Atlassian Pty Ltd. | Systems and methods for repairing a data store of a mirror node |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3483901B2 (ja) * | 1992-09-11 | 2004-01-06 | 株式会社日立製作所 | システムの構成変更方法およびその実施計算機システム |
US7318133B2 (en) * | 2003-06-03 | 2008-01-08 | Hitachi, Ltd. | Method and apparatus for replicating volumes |
US7467168B2 (en) * | 2003-06-18 | 2008-12-16 | International Business Machines Corporation | Method for mirroring data at storage locations |
JP4422519B2 (ja) * | 2004-03-18 | 2010-02-24 | 株式会社日立製作所 | 情報処理システム |
JP4477950B2 (ja) | 2004-07-07 | 2010-06-09 | 株式会社日立製作所 | リモートコピーシステム及び記憶装置システム |
US7490205B2 (en) * | 2005-03-14 | 2009-02-10 | International Business Machines Corporation | Method for providing a triad copy of storage data |
JP4902403B2 (ja) * | 2006-10-30 | 2012-03-21 | 株式会社日立製作所 | 情報システム及びデータ転送方法 |
JP5244332B2 (ja) | 2006-10-30 | 2013-07-24 | 株式会社日立製作所 | 情報システム、データ転送方法及びデータ保護方法 |
JP2008242715A (ja) | 2007-03-27 | 2008-10-09 | Nomura Research Institute Ltd | データ復旧方法およびデータ復旧システム |
JP2010039986A (ja) * | 2008-08-08 | 2010-02-18 | Hitachi Ltd | データのバックアップを管理する計算機システム及び方法 |
JP4659872B2 (ja) | 2008-11-07 | 2011-03-30 | 富士通株式会社 | クラスタシステム制御プログラム、クラスタシステム、クラスタシステム制御方法 |
US8375004B2 (en) * | 2010-04-07 | 2013-02-12 | Hitachi, Ltd. | Asynchronous remote copy system and storage control method |
JP5900094B2 (ja) | 2012-03-28 | 2016-04-06 | 日本電気株式会社 | データ整合システム、データ整合方法およびデータ整合プログラム |
DE112013006658T5 (de) * | 2013-05-08 | 2015-12-03 | Hitachi, Ltd. | Speichersystem und Datenverwaltungsverfahren |
-
2014
- 2014-06-20 JP JP2014127731A patent/JP6511738B2/ja active Active
-
2015
- 2015-05-26 US US14/721,059 patent/US9921927B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US9921927B2 (en) | 2018-03-20 |
US20150370662A1 (en) | 2015-12-24 |
JP2016009218A (ja) | 2016-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019085875A1 (zh) | 存储集群的配置修改方法、存储集群及计算机系统 | |
US7603581B2 (en) | Remote copying of updates to primary and secondary storage locations subject to a copy relationship | |
US20100138687A1 (en) | Recording medium storing failure isolation processing program, failure node isolation method, and storage system | |
CN106062717A (zh) | 一种分布式存储复制系统和方法 | |
JP2008059583A (ja) | クラスタ・システムならびにクラスタ・システム内でレプリカをバックアップする方法およびプログラム製品 | |
JP2007164769A (ja) | ミラーリングされたシステム内の障害を管理するための方法、システム、およびプログラム(ミラーリングされたシステム内の障害の管理) | |
JP6511739B2 (ja) | 冗長システムおよび冗長化方法 | |
US9053073B1 (en) | Use of timestamp logic in synchronous replication | |
CN110121694B (zh) | 一种日志管理方法、服务器和数据库系统 | |
JP6511737B2 (ja) | 冗長システム、冗長化方法および冗長化プログラム | |
US11016863B2 (en) | Self-contained disaster detection for replicated multi-controller systems | |
JP6511738B2 (ja) | 冗長システム、冗長化方法および冗長化プログラム | |
JP6318902B2 (ja) | 冗長システムおよび冗長化方法 | |
CN108984346B (zh) | 一种生产数据容灾的方法、系统及存储介质 | |
JP6251965B2 (ja) | 情報システムおよびデータベース復旧方法 | |
JP6056408B2 (ja) | フォールトトレラントシステム | |
WO2019109257A1 (zh) | 一种日志管理方法、服务器和数据库系统 | |
JP5867902B2 (ja) | データベースの非同期レプリケーション方式 | |
US20210240351A1 (en) | Remote copy system and remote copy management method | |
CN106855869B (zh) | 一种实现数据库高可用的方法、装置和系统 | |
US10846012B2 (en) | Storage system for minimizing required storage capacity during remote volume replication pair duplication | |
CN115698955A (zh) | 事务镜像的容错 | |
JP5956940B2 (ja) | 冗長化システムおよび現用機決定方法 | |
US9497266B2 (en) | Disk mirroring for personal storage | |
US11269922B2 (en) | Database server, database management method, and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170309 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171003 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180320 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180521 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20181016 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190116 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20190124 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190325 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6511738 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |