JP5343436B2 - 情報管理システム - Google Patents

情報管理システム Download PDF

Info

Publication number
JP5343436B2
JP5343436B2 JP2008197068A JP2008197068A JP5343436B2 JP 5343436 B2 JP5343436 B2 JP 5343436B2 JP 2008197068 A JP2008197068 A JP 2008197068A JP 2008197068 A JP2008197068 A JP 2008197068A JP 5343436 B2 JP5343436 B2 JP 5343436B2
Authority
JP
Japan
Prior art keywords
record information
update record
data
information
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008197068A
Other languages
English (en)
Other versions
JP2010033467A (ja
Inventor
晃幸 後藤
朝昭 溝尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2008197068A priority Critical patent/JP5343436B2/ja
Priority to US12/489,675 priority patent/US8005799B2/en
Publication of JP2010033467A publication Critical patent/JP2010033467A/ja
Application granted granted Critical
Publication of JP5343436B2 publication Critical patent/JP5343436B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2097Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements maintaining the standby controller/processing unit updated
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1443Transmit or communication errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1658Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2046Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share persistent storage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2038Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本技術は、データベース等の情報管理に関する。
データベースは企業の情報システムにおいて最も重要なデータを管理している。そのため、データベースに含まれるハードウェアの一部が故障した場合でも、データベースには、高度の安定稼働が求められる。このようなクリティカルな要件が課されたデータベースシステムでは一般に、クラスタ構成によるサーバの冗長化が行なわれてきた。クラスタ構成とは、複数のコンピュータ(ノードという)を組み合わせて、ユーザにサービスを提供するシステムをいう。
しかし、近年、このようなシステムにおいて、以下の点が課題となってきている。
第1に、ストレージなど共用部分の部品の故障により業務停止となる場合が生じる。
第2に、クラスタを構成するノードの1つを他のノードに切り替える場合に、切り替え時間が規模に応じて長時間、例えば、数十秒から数分以上必要となる。
上記の課題に対しては、共有部分(従来のクラスタ構成における共用ディスクなど)を持たない完全二重化構成とすることが、最も有効な対策となる。その場合、待機ノードにデータベースの複製環境を常に起動状態でスタンバイしておくことで、高速にノードを切り替えて、迅速な業務再開を実現することになる。このような完全二重化システムをデュープレックスシステムという。
一般的なデュープレックスシステムでは、データベースが正系と副系とによって二重化されて管理される。正系と副系とは、データ搬送路を通じて情報を交換する。そして、二重化されたデータベースの一方を正系とし、アプリケーションからは正系のみ更新可能にする。このような構成によって、デュープレックスシステムでのデータベースの整合性が保証される。また、デュープレックスシステムでは、正系と副系とがアプリケーションを実行するサーバ(以下、アプリケーションサーバという)からは意識されない。したがって、デュープレックスシステムでは、アプリケーションサーバに対して正系のデータベースに自動接続する機能を提供している。
また、デュープレックスシステムは、データ搬送路の一時的な障害、あるいは、副系の保守に備えて、正系にログを蓄積する。そして、データ搬送路の障害からの復旧後、あるいは、副系の保守完了後、自動的に二重化を復活する機能を有する。
さらに、デュープレックスシステムのような完全二重化システムは、正系ノードで故障した場合でも、副系ノードへの切り替えを行い、業務を継続することが可能となり、可用性が向上する。しかし、完全二重化システムは、通常、ネットワークの異常など、データの搬送路が異常となった場合、二重化処理の実行が不可能として二重化処理から離脱する。さらに、二重化処理からの離脱となった場合には、再度二重化処理を復旧するためには、二重化処理離脱後のデータを正系から副系にコピーする必要がある。このため、復旧時のシステムの負荷が高くなる。
そこで、ネットワークの異常など、障害が容易に解消する可能性がある場合は、正系にログを蓄積し、障害解消後、自動的に再送することで二重化が復活するようなシステムが求められている。
特許第2904100号公報 特開2001−022627号公報
しかしながら、ネットワークの異常などにより正系でログ蓄積中に、さらに、正系に異常が発生する場合が想定される。このような場合、早急に、正系から副系に切り替えたいとの要請が生じる。しかし、副系にはログが搬送されていないため、完全同期の状態では切り替えできない。すなわち、正系から副系への切り替えには、データロストのリスクが伴う。
このためログ蓄積中・障害復旧時は、ユーザが以下の情報を認識し、運用・切り替えの判断を行う必要がある。一般的に、この判断は健全なサーバ(例えば、副系など)の情報に基づいてなされる。
正系でログ蓄積が行われているか。正系でログ蓄積が行われた場合、ネットワークおよび二重化処理が復旧したか。復旧した場合、どれくらいの時間でデータ完全同期状態となるか。すなわち、データロストのリスクが消滅するか。このように、二重化システムでは、可能なかぎり早期に正確な情報を副系へ提供することが求められている。
本開示技術は、二重化システムがネットワークの障害等によって、二重化処理から離脱した場合でも、可能なかぎり早期に正確な情報を正系から副系に提供することを目的とする。
本技術の一態様は、通信路を通じて接続される現用装置と予備装置とを含む情報管理システムとして例示できる。ここで、現用装置は、データを格納する第1の格納手段と、第1の格納手段にデータを格納したときに、データが格納されたことを記録する更新記録情報に通知順を示す順序番号を付して、通信路を通じて予備装置に通知する通知手段と、通知手段による通信路を通じた更新記録情報の通知の完了を確認できないときに、更新記録情報を蓄積する蓄積手段と、予備装置から、更新記録情報の再送依頼を受けたときに、蓄積手段に蓄積された更新記録情報を通知手段によって再度通知する手段と、を備えるようにすればよい。一方、予備装置は、現用装置から通知される更新記録情報を監視し、それぞれの更新記録情報に付された順序番号の規則性に基づいて更新記録情報の受信漏れを検知する手段と、データを格納する第2の格納手段と、現用装置から通知される更新記録情報にしたがって第2の格納手段のデータを更新する手段と、更新記録情報の受信漏れが検知されたときに、更新記録情報の再送を要求する手段と、受信漏れのあった更新記録情報に付されるべき順序番号を基に、現用装置の第1の格納手段と当該予備装置の第2の格納手段との間での格納されているデータの整合に係る情報を報知する手段と、を備えるようにすればよい。
本情報管理システムによれば、現用装置は、順序番号を付して更新記録情報を通知するともに、通知手段による通信路を通じた更新記録情報の通知の完了を確認できないときに、更新記録情報を蓄積する。このような手順を繰り返すことで、予備装置が、更新記録情報に付された順序番号の規則性に基づいて更新記録情報の受信漏れを検知することができる。したがって、現用装置の第1の格納手段と当該予備装置の第2の格納手段との間での格納されているデータの整合に係る情報を報知することが可能となる。
より具体的には、現用装置の通知手段は、蓄積手段に更新情報を蓄積した状態で、予備装置から再送依頼を受けていない場合には、蓄積手段に蓄積された更新記録情報に含まれ
る順序番号に後続する順序番号を新たに格納されたデータの更新記録情報に付して通知すればよい。このようにすることで、予備装置側で、順序番号の抜けが検出された場合には、その抜けた順序番号に相当する更新記録情報が現用装置の蓄積手段に蓄積されていることが分かる。
本情報管理システムによれば、二重化システムがネットワークの障害等によって、二重化処理から離脱した場合でも、可能なかぎり早期に正確な情報を正系から副系に提供することができる。
以下、図面を参照して本技術の最良の形態(以下、実施形態という)に係る情報管理システムについて説明する。以下の実施形態の構成は例示であり、本技術は実施形態の構成には限定されない。
<システムの概要>
図1に、本情報管理システムのデータフローを例示する。本情報管理システムは、運用ノードと、待機ノードとをネットワークで接続して構成される。運用ノードは、正系ノード、あるいは現用装置ともいい、データベース管理システム(DBMS)、データベース複製装置、二重化監視装置、データベースおよび差分ログファイルを含む。また、待機ノードは、副系ノード、予備装置あるいは、予備系ノードともいい、基本的には、運用ノードと同一の構成を含む。
データベース管理システムは、データベースにアクセスする他の装置(例えば、アプリケーションプログラムを実行するアプリケーションサーバ等)からの要求を受け付け、その要求にしたがって、データベースに対して処理を実行する。処理とは、例えば、データベースへのデータの格納、データベースからのデータの読み出し等である。
なお、本情報管理システムは、同期転送モードで稼働している。同期転送モードとは、アプリケーションサーバ等からデータベースに対するコミット操作に対して、運用ノードでデータベースが更新され、さらに、待機ノードにデータを転送した後に、アプリケーションサーバ等に完了を報告するモードである。なお、非同期のモードでは、運用ノードでのデータベースが更新されても、直ちに、待機ノードにログが送付されていることが保証されるとは限らない。すなわち、アプリケーションサーバ等への完了報告とは切り離されたタイミングで、待機ノードにログが転送される。
データベース複製装置は、データベースに格納されたデータ、あるいは、データベースにて更新されたデータにしたがって、差分ログファイルを作成し、ネットワークを通じて、待機ノードに引き渡す。これによって、待機ノード側で、運用ノードと同様に、データベースにデータが格納され、あるいは、データベースにてデータが更新される。すなわち、待機ノードのデータベース複製装置は、運用ノードから転送された差分ログにしたがって、データベースのデータを更新する。
二重化監視装置は、データベース複製装置によるネットワークを通じた複製処理が正常に実行されているか否かを監視する。ネットワークを通じた複製処理が正常に実行されなくなった場合、二重化監視装置は、データベース複製装置および本情報管理システムを蓄積モードに移行し、差分ログファイルを所定の蓄積先に蓄積させる。また、二重化監視装置は、ネットワークを通じた複製処理が復旧し、再度正常に実行されるようになったか否かを確認する。そして、ネットワークを通じた複製処理が復旧し、再度正常に実行されるようになると、二重化監視装置は、データベース複製装置および本情報管理システム(運
用ノードおよび待機ノード)を再び同期モードに移行する。
なお、運用ノードおよび待機ノードは、いずれも、CPU、メモリ、ハードディスク駆動装置、着脱可能記憶媒体の駆動装置、通信インターフェース等を備えたコンピュータで構成される。このようなコンピュータの構成そのものは周知であるので、その説明を省略する。
図2に、一般的な情報管理システムの処理概要を例示する。以下、本実施形態では、運用ノードを正システム1と呼び、待機ノードを副システム2と呼ぶことにする。
また、図2には、アプリケーションサーバ3が示されている。アプリケーションサーバ3は、通常、正システム1に対して、データベース11(第1の格納手段に相当)の更新を依頼する。正システム1は、アプリケーションサーバ3の依頼に応じてデータベース11を更新するとともに、ログ搬送路4を通じて、副システム2に、データベース11の更新を示すログデータを転送する。副システム2は、転送されたログデータを基に、データベース21(第2の格納手段に相当)を更新する。これによって、正システム1のデータベース11の更新結果が、副システム2のデータベース21において複製されることになる。
ログ搬送路4に、障害が発生し、正システム1から副システム2にログデータを転送できなくなると、正システム1は、同期転送モードでのログデータの副システム2への転送を休止し、ログデータを蓄積ログ5として格納する。蓄積ログ5のログデータは、正システム1でのデータベースの更新時とは異なるタイミングで、副システム2に転送される。このため、ログデータが蓄積ログ5として蓄積される運用モードを蓄積モードという。
図2の情報管理システムでは、正システム1においてログデータを蓄積した後、ログ搬送路4の障害が解消してログデータの再送を行う際は、先入れ先だしにしたがう。すなわち、正システム1は、その場合に、未送信データのうち、最も古いデータから送信していく。そのため、正システム1を監視し、切り替えを制御している副システム2からは、ログ搬送路4の障害によって正システム1が蓄積モードに移行し、本来副システム2に転送されるべきログが蓄積された状態にあるのか、あるいは、正システム1自体に更新がなくログが発生していないのか、不明である。また、ログが蓄積された状態で、正システム1から副システム2に運用ノードが切り替えられると、データロストの可能性がある。また、その場合に、完全同期状態にはいつ復帰するのかも不明である。
図2の情報管理システムでの蓄積ログ5のログデータの転送技術を以下に示す。以下の(1)から(9)の処理は、図2の矢印に付加した(1)から(9)に対応している。また、その処理に対応して作成されるログにも、(1)から(9)の番号を付して示す。
(正システムの動き)
(1)正システム1に更新ログが存在する場合、それをデータとして副システム2に搬送する。通常は、副システム2にて、正常に、更新ログが受信されたことの応答が正システム1に返される。これによって、正システム1は、同期転送がなされたことを認識し、例えば、コミット操作に対して、応答をアプリケーションサーバ3に返すことができる。
(2)ネットワーク障害が発生した場合、ポーリング等による状態監視、あるいはデータ転送の失敗によってその情報を得る。その結果、ログ搬送路4によるログデータの転送ができなくなり、データは蓄積ログ5に蓄積される。データ転送の失敗は、例えば、ログ搬送路4にて転送したデータに対する受信確認が所定時間経過しても戻らないことによって検出される。
(3)ネットワークの状態監視(正常動作可能か否かの監視)をポーリングによって試み
る。
(4)ネットワークの状態監視によって復旧が確認できた場合、先入れ先出しの原則より、蓄積ログ5のデータを搬送する。その結果、その後に発生する新規データは、依然として蓄積ログ5に蓄積される。
(副システムの動き)
(5)正常にデータを一時ファイル6に格納する。
(6)ポーリング等による状態監視結果により、正システム1の異常を認識する。
(7)その場合には、データベースが完全同期状態かどうか不明な状態となる。
(8)正システム1が先入れ先だしで、昇順の順序番号のデータを送信してくるため、受信したデータを一時ファイル6に蓄積する。
(9)データベースへの反映が可能となった場合(すなわち、コミットログ受信時)、所定の順に整合されたログデータの組み立てを行い、データベースに反映する。
この情報管理システムでは以下の問題が発生する。
(問題a)(4)において先入れ先だしで蓄積ログ5の先頭データを副システム2に搬送するため、(8)の時点で副システム2では、蓄積ログ5にログデータの蓄積が行われたかどうかの判断ができない。また、現在蓄積ログ5にどの程度ログデータが蓄積されているのか、判定できない。したがって、データ搬送路4に障害がある状態で、さらに、正システム1に障害が発生し、正システム1から副システム2に運用ノードを切り替える必要が生じた場合、その切り替えによってデータロストのリスクがどの程度あるのかの判断ができない。
(問題b)(8)時点で、副システム2はデータ搬送路が復旧したことは認識できるが、蓄積ログ5のデータ量が不明である。このため、データロストの可能性があるデータ量と完全同期状態までの時間を見積もることができない。ユーザは正システム1において、蓄積ログ5の内容を調査する必要がある。
そこで、本情報管理システムは、データベース11、21の二重化処理において、データ搬送路4に障害があった場合、正システム1に一時的に蓄積したログデータを管理する際、データベース11、21の管理・運用上必要な情報、例えば、データロストのリスク有無、完全同期状態への復帰時間等をできるだけ早期に、副システム2に認識可能とする機能を提供する。これによって、ユーザは、副システム2から得られる情報から、副システム2への運用ノードの切り替えの可否等の判断を早期に行うことを可能とする。
ただし、本実施形態では、データロストを回避するため、データベースのコミットに対して同期転送で運用することを前提に説明する。一般的に正システム1と副システム2との間の通信には以下がある。
(A)ネットワークの接続確認・相手サーバの状態確認として管理情報の送受信を行う。この通信は、一定時間隔でのポーリングとなる。
(B)発生したログデータを正システム1から副システム2に搬送し、その搬送結果を得る。この通信は、データの発生した時点で行うため不定期である。また、この通信は、(A)の通信によって通信が確立している場合のみ行われる。また、本実施形態では、(A)(B)通信は、以下の理由で、それぞれ別の通信手段によって構成する。
(A)と(B)とで、通信契機・通信量が異なる。さらに、情報管理システムの形態によっては、正システム1、副システム2以外に、第3者サーバ(監視サーバ)が設けられることがあり、(A)の通信については、第3者サーバが行うことがある。
図3に、本情報管理システムの処理概要を例示する。以下、正システム1および副システム2に分けて、その動作を説明する。
(正システムの動き)
(1)正システム1に更新ログが存在する場合、ログ搬送路4を通じて、更新ログを副システム2に転送する。
(2)更新ログが存在しない場合、ログ搬送路4を通じて、一定時間ごとにNULLデータの転送を継続する。この転送は、ある種の状態監視を目的としたものである。この転送によって、ログ搬送路4の健全性、あるいは、副システム2の状態確認を実行できる。
(3)(1)の転送に失敗するか、(2)の状態監視により、ネットワーク障害が発生した場合、正システム1側の蓄積ログ5にデータを蓄積する。これにより、蓄積状態、すなわち、蓄積モードに移行する。
(4)正システム1は、次回ポーリング時・更新ログ発生時に、最新ログデータにより副システム2に転送を試みる。すなわち、正システム1は、最新ログデータのログ搬送路4を通じたログデータの転送を試行することによって、ログ搬送路4の復旧、あるいは、副システム2の状態確認を実行できる。なお、更新ログが頻発する場合は、正システム1は、一定間隔でその更新ログを副システム2に送信する。一方、所定時間経過しても更新ログが発生しない場合は、正システム1は、NULLデータを副システム2に送信する。
(5)最新ログデータの転送が成功した場合、以降蓄積ログ5のログデータから順次データ搬送を行う。ただし、本実施形態の情報管理システムでは、蓄積モードに移行後、最新ログデータの転送が成功した場合には、受信確認として、副システム2側から、受信済の最新ログデータの順序番号が正システム1側に返信される。したがって、この返信によって、正システム1は、最優先すべき、蓄積ログ5のログデータを特定する。このとき、送信する優先度は以下とする。すなわち、第1優先:再送依頼のあったログ、第2優先:蓄積ログ5に存在するログ、第3優先:新規更新ログの順である。
また、本情報管理システムでは、このような蓄積モードに移行後、最新ログデータの転送が成功した場合には、副システム2は、受信確認とともに、蓄積ログ5のログデータの再送依頼を送信する。したがって、そのような再送依頼の中に、優先すべきログデータ(全部か、最新のログデータか、あるいは、特定の順序番号のログデータか)を指定できるようにしてもよい。
(副システムの動き)
(6)副システム2は、通常、ログ搬送路4から正常にログデータを受信し、一時ファイルに格納する。
(7)ポーリング等の状態監視結果により、正システム1の異常を認識する。
(8)状態監視が到達しないことより、正システム1またはネットワーク異常を認識する。
(9)順序番号に抜けのあるデータを受信したことより、抜けデータの存在が確認可能となる。そこで、副システム2は、抜けた順序番号に該当するデータの再送依頼を行う。図4に示すようにデータのサイズは決定しているため、順序番号から抜けた個数が把握できることよりデータ量の計算が可能となり、ユーザにインフォメーションメッセージによって報知する。報知にはデータ量、および、予測時間を含めることも可能である。
(10)抜けたログデータが再送され、データベース21への反映が可能となった場合(コミットログ受信時)、副システム2は、受信したログデータから、整合されたデータベースへの更新要求を再構築し、データベース12に反映する。
<データ構造>
図4から図7により、本情報システムが処理するデータのデータ構造を説明する。これらのデータを格納する格納媒体としては、本実施形態では、ハードディスク上のファイル等を例示できる。この場合、格納媒体は、不揮発性記憶媒体ということができる。
図4は、本情報管理システムが取り扱う更新ログの典型的な構成要素を例示している。
更新ログには、送信情報、順序番号、およびデータが含まれる。このうち、送信情報は、副システム2への送信が成功したか否かを示す情報である。送信情報には、送信完了を示す「済」または未送信を示す「未」が格納される。
順序番号は、更新データ発生時に採番される昇順で一意の番号である。データは、更新ログが存在する場合は、そのログデータそのものであり、更新ログが存在しない場合はNULLデータとなる。
図5に、正システム1に格納されるデータ構造を例示する。正システム1には、発生した更新ログのすべてが格納される。上述のように、送信情報は、副システム2への送信が成功したか否かの情報である。正システム1では、送信済更新ログも、不慮の事態に備えて保存するようにしてもよい。ただし、送信済更新ログは、消去可能である。
本情報管理システムでは、更新ログが副システム2に転送できず、副システム2で更新ログを受信できなかった場合、副システム2は、例えば、順序番号を指定して、あるいは最新の更新ログを転送するように指定して、さらには、蓄積した未送信のすべての更新ログを指定して、再送を依頼する。このため、正システム1では、順序番号によって、更新ログを検索可能な状態で格納している。
そこで、正システム1は、送信した更新ログおよび送信すべき更新ログと、その更新ログを管理する管理情報を有している。正システム1の管理情報は、最小未送信番号と、最大未送信番号を含む。図5の例では、順序番号1のデータを送信し、順序番号2のNULLデータを送信した後、順序番号3、4のデータの送信に失敗し、その後、順序番号5のデータが送信できたことを示している。この場合、正システム1の管理情報は、最小未送信番号=3、最大未送信番号=4となる。すなわち、管理情報は、副システム2から再送依頼が必ず来るはずの未送信番号をポイントしている。このような構成によって、再送の依頼があった場合の検索効率を向上させている。なお、正システム1の管理情報、例えば、最小未送信番号および最大未送信番号は、不揮発性の記憶媒体に格納される。また、本実施形態では、送信済の更新ログは、受信した副システム2において、不揮発性の記憶媒体に格納されるため、正システム1側では消去可能である。
図6に、副システム2が保持するデータ構造を例示する。副システム2は、受信した更新ログと、その更新ログを管理する管理情報を有している。副システム2の管理情報は、最小未反映番号を含む。すなわち、管理情報は、反映済情報の次番号をポイントすることになる。なお、副システム2の管理情報、すなわち、最小未反映番号は、不揮発性の記憶媒体に格納される。図6の例では、副システム2は、順序番号1のデータ、および順序番号2のNULLデータを受信した後、順序番号5のデータを受信している。この場合、最小未反映番号=3のときに、順序番号5のデータを受信することになる。
このようなデータ構造によって、副システム2がデータを受信した際は、順序番号によって、更新ログの抜けを判定可能となる。抜けがあった場合は、正システム1にその番号の再送を依頼する。また、何個のデータが抜けたのかが把握可能のため、データ量の見積もりが可能となる。なぜなら、本情報管理システムでは、図4に示すデータ構造よりデータのサイズが決定しているからである。なお、反映済の更新ログは、消去可能である。
図7に、非同期転送時に、蓄積ログ5に格納されるログデータのデータ構造を例示する。正システム1で蓄積ログ5に蓄積されるログデータは、副システム2に搬送に失敗したデータであり、副システム2の一時ファイル6にないことが保証されている。よって、搬送路復旧後は、優先的に搬送されるべきデータであり、一括転送を行うよう実装してもよい。ただし、副システム2の要求に応じて、蓄積ログ5中の特定のログデータを優先して
送信するようにしてもよい。
<ユーザに通知されるインフォメーションメッセージ例>
本情報管理システムは、例えば、以下のようなインフォメーションメッセージをユーザに通知する。まず、データ転送の結果判定で異常を検出し、蓄積状態に移行した場合に正システム1に出力するインフォメーションメッセージ例は、次の通りである。「データ転送に失敗したため、正システム1にデータを蓄積します。」また、副システム2にて、順序番号確認時、抜けを検出した場合に出力するインフォメーションメッセージ例は、次の通りである。「データを再送中です。データの同期までにxxバイトの転送、yy秒が必要です。」
なお、このような表示において、復旧に要する時間としては、これまでの統計情報から平均値等を算出し、推定値として表示してもよい。また、例えば、ログ搬送路4の復旧に要する平均時間と、蓄積されたログ情報転送に要する転送時間によって推定値を算出すればよい。
図8に、正システム1の処理フローを例示する。この処理フローは、正システム1を構成するコンピュータのCPUがコンピュータプログラムを実行することによって実現される。なお、図8の処理フローの前提として、本情報管理システムは、正システム1と副システム2とが、同期モードで動作しているものとする。
また、この処理は、複数のタスクに分かれて処理される。図8のように、正システム1のタスクには、再送依頼・蓄積ログ確認タスクTS1、ログデータ抽出タスクTS2、タイマタスクTS3およびログデータ送信タスクTS4が含まれる。
このうち、再送依頼・蓄積ログ確認タスクTS1は、副システム2からの再送依頼に応答して実行されるタスクである。このタスクでは、正システム1は、副システム2から、蓄積ログ5内のデータ確認および再送依頼の要求を受け付ける(S11)。この要求は、ログ搬送路4を通じて、副システム2から正システム1に送信されたものである。ただし、第3者サーバ(監視サーバ)が存在するシステムでは、第3者サーバ(監視サーバ)を通じて、蓄積ログ5内のデータ確認および再送依頼を正システム1に引き渡すようにしてもよい。
すると、正システム1は、蓄積ログ5内のデータから、送信依頼するログデータを組み立てる(S12)。すでに、図6で説明したように、正システム1は、最小未送信番号および最大未送信番号を管理情報として保持している。本実施形態では、副システム2は、順序番号を指定し、あるいは、全部の未送信ログデータを指定し、あるいは、最新ログデータを指定して、再送を依頼する。正システム1は、最小未送信番号と最大未送信番号とで指定される範囲をポイントしているので、副システム2からの再送依頼に対応して適切なログデータを再送すればよい。例えば、全ログをまとめて送信するようにすればよい。また、正システム1は、指定された順序番号のログデータを選択して送信してもよい。
そして、正システム1は、再送モードで、送信依頼を待ちキューに登録する(S13)。
ログデータ抽出タスクTS2は、正システム1でのデータベース11の更新等に伴って発生したログデータを副システム2に反映するためのタスクである。このタスクでは、正システム1は、ログデータの発生を示す情報を受信する(S21)。すると、正システム1は、副システム2に送付すべきログデータを組み立てる。具体的には、データベース管理システムが出力したログデータを読み出し、送信依頼時に、ログデータ送信タスク5に
引き渡す形式でログデータを組み立てる。そして、正システム1は、通常モードで待ちキューに送信依頼を登録する(S23)。通常のモードとは、再送モードではないという意味である。
タイマタスクTS3は、タイマ監視にしたがって、空き(NULL)のログデータを送信するタスクである。所定時間以上、ログが発生しないと、その間正システム1と副システム2との間でデータの交換がなされないことになる。そこで、所定時間ログが発生しない場合に、タイマ監視によって、空き(NULL)のログデータを送信し、正システム1と副システム2との間の通信を確認する。
このタスクでは、正システム1は、タイマ監視によってデータ送信のタイミングを調整する待ち合わせ処理を実行する(S31)。そして、正システム1は、空き(NULL)データを基に、副システム2に送信するログデータを組み立てる(S32)。そして、正システム1は、通常モードで待ちキューに送信依頼を登録する(S33)。
再送依頼・蓄積ログ確認タスクTS1、ログデータ抽出タスクTS2、タイマタスクTS3は、ログデータ送信タスク4への送信依頼を生成する。ただし、再送依頼・蓄積ログ確認タスクTS1による送信依頼は、最優先の優先順位でログデータ送信タスク4により処理される。一方、タイマタスクTS3の送信依頼は、優先順位が最も低く、待ちキューに、他のタスクからの送信依頼があると、タイマタスクTS3の送信依頼は、無効になる。その場合には、タイマタスクTS3の送信依頼は、待ちキューから削除される。
ログデータ送信タスクTS4は、待ちキューから優先順位にしたがって送信依頼を取り出し、送信する処理を繰り返し実行している。いま、制御の状態は、ループの開始位置(S40)にあるとする。ループの先頭では、正システム1は、待ちキューから送信依頼を取り出す。ただし、待ちキューが空きの場合には、正システム1(ログデータ送信タスクTS5)は、待ち状態となる。
待ちキューから1つの送信依頼を取り出すと、正システム1は、その送信依頼の依頼モードを判定する(S41)。送信依頼が通常モードの場合、正システム1は、副システム2へ、送信依頼されたログデータを送信する(S42)。この処理を実行する正システム1のCPUが、通知手段に相当する。そして、正システム1は、データ転送の結果を判定する(S43)。そして、データ転送が正常に終了した場合には、正システム1は、送信情報を更新する(S47)。すなわち、正システム1は、送信したログデータに対応する順序番号の送信情報を「済」に変更する。その後、正システム1は、制御をループ開始(S40)に戻す。
一方、S43の判定で、データ転送が正常に終了しなかったと判断した場合には、正システム1は、システムを蓄積モードへ移行する(S44)。蓄積モードでは、正システム1は、蓄積ログ5にログデータを格納する(S45)。この処理を実行する正システム1のCPUが、蓄積手段に相当する。その後、正システム1は、制御をループ開始(S40)に戻す。
また、S41の判定で依頼モードが再送依頼の場合、正システム1は、再送依頼に付与された順序番号から、蓄積ログ5を参照し、送信可能なデータを構築する(S48)。この場合に、副システム2からの再送依頼に対応して、指定順序番号のログデータ、蓄積ログ5の全ログデータ、あるいは、最新ログデータ等によって、送信すべきデータを構築する。そして、正システム1は、構築したデータを副システム2へ送信する(S49)。この処理を実行する正システム1のCPUが、再度通知する手段に相当する。その後、正システム1は、制御をループ開始(S40)に戻す。
図9に、副システム2で実行されるログデータ受信タスクTS5の処理フローを例示する。ログデータ送信タスクTS5は、通常、ログデータ受信待ちの状態でループの開始位置(S50)にある。ループの先頭では、副システム2は、受信されたログデータを取り出す。そして、副システム2は、受信したログデータの順序番号を確認する(S51)。
受信したログデータの順序番号が、すでに受信済の順序番号に対して抜けのない番号であるとき、副システム2は、OKであると判定する。そして、OKの場合には、副システム2は、一時ファイル6にデータを格納する(S52)。そして、副システム2は、受信したデータからログデータを基に、正システム1での更新結果としてトランザクションの組み立てを行う。そして、副システム2は、組み立てられたトランザクションをデータベース21に反映する(S53)。その後、副システム2は、制御をS50に戻す。
一方、S51の判定で、受信したログデータの順序番号が、すでに受信済の順序番号に対して抜けのある番号であるとき、副システム2は、NGであると判定する。この処理を実行する副システム2のCPUが、受信漏れを検知する手段に相当する。そして、NGの場合には、副システム2は、抜けた順序番号のログを再送するように、再送依頼を正システム1に送信する(S54)。この処理を実行する正システム1のCPUが、再送を要求する手段に相当する。この場合の再送依頼の仕方としては、順序番号を指定した再送依頼、最新の未送信ログを指定した再送依頼、全指定の再送依頼がある。これらの再送依頼のどれを実行するかは、事前に、システム設定で定めておけばよい。
次に、副システム2は、完全同期が回復するまでの時間等の回復に関連する情報をインフォメーションメッセージでユーザ(または、アプリケーションサーバ3)に通知する(S55)。この処理を実行する副システム2のCPUが、報知する手段に相当する。
なお、一旦、S54の処理が実行されると、副システム2は、情報管理システムが蓄積モードになったことを認識し、同期モードが回復するまで、S54およびS55の処理を所定の時間間隔で繰り返す。
本実施形態では、ログ搬送路4は、正システム4と副システム2との間を専用で接続すればよい。このため、正システム1と副システム2との間は、汎用業務ネットワークとは異なる、専用線、専用LAN、Fibre Channel等で接続する。また、正システム1と副シ
ステム2とが、近接した位置に設置されているようなシステムでは、正システム1と副システム2との間は、バス接続、コンピュータのクラスタを構成するハードウェア等によって、接続してもよい。なお、状態監視、例えば、正システム1と副システム2との間のポーリングの通信についても、以上のような専用の通信で構成すればよい。ただし、状態監視を汎用の通信で構成してもよい。
<効果>
本情報システムによれば、ログ搬送路4での障害が解消した時点で、ログデータに抜けがあるかどうかが判断可能となるので、切り替えた場合のデータロスト量分析が可能となる。障害が復旧した時点で、ログ抜けしたデータ量の見積もりが可能となるため、完全同期状態となるまでの時間が把握可能となり、ユーザのリスク判断が可能となる。
また、常に最新データによって状態確認を兼ねた更新ログの搬送を行う。すなわち、最新のログデータを副システム2に送信し続けることを可能にする。障害発生時にログデータが多い場合、管理情報の送受信の代わりになるためネットワーク負荷が軽減され、精度が高くなる。
送信に成功した場合、副システム2は直前に受信したデータの順序番号と、最後に受信したデータの順序番号を比較する。そして、本情報管理システムは、抜けたデータ量、および回復時間の見積もり処理を実行する。このため、利用者は早期に上記情報を判断可能となる。送信データに付加された順序番号により、抜けデータの個数が判明し、正確な再送データ量を把握可能である。この再送データ量を基に、再開までの予測を提示することが可能になり、利用者が二重化状態への回復時間による運用判断を行うための重要な情報となる。例えば、回復途中に、運用ノードを正システム1から副システム2に切り替えるかどうかの判断などである。
上記実施例1では、正システム1から副システム2にログデータが送信され、正システム1と副システム2とが同期する情報管理システムを説明した。そして、ログ搬送路4に異常があって、正システム1から副システム2にログデータが送信できないとき、正システム1と副システム2とが蓄積モードとなり、副システム2から正システム1にログデータの再送依頼を送信した。
本実施例では、さらに、蓄積モードでの動作時間が長期化し、蓄積ログ5に格納されたログデータが増加した場合に、ログ搬送路4に代えて、アプリケーションサーバ3経由で、ログデータを正システム1から副システム2に転送する情報管理システムについて説明する。他の構成および作用は実施例1と同様である。そこで、同一の構成要素については、実施例1と同一の符号を付して、その説明を省略する。
実施例2では、実施例1のタスクに加えて、さらに、AP(アプリケーション)サーバ通信タスクTS6が実行される。APサーバ通信タスクTS6は、蓄積モードの状態が所定期間経過した場合に、蓄積ログ5のログデータをアプリケーションサーバ3経由で、正システム1から副システム2に転送するタスクである。APサーバ通信タスクTS6はログデータ発生で常に動作する必要はないため、APサーバ通信タスクTS6はタイマタスクTS3内に内包してもよい。
アプリケーションサーバ3は、本情報管理システムと連携して動作し、各種業務アプリケーションを実行している。アプリケーションサーバ3と、正システム1あるいは副システム2との間は、例えば、基幹ネットワーク、あるいは、通常の業務ネットワーク(以下、業務ネットワークという)で接続されている。このアプリケーションサーバ3と、正システム1あるいは副システム2との間の業務ネットワークは、通常、ログ搬送路4を構成するネットワークとは、異なるネットワーク媒体で運用される。
本実施形態でも、実施例1と同様にログ搬送路4は、正システム1と副システム2との間を専用で接続すればよい。
一方、上述のように、本情報管理システム(正システム1および副システム2を含む)とアプリケーションサーバ3との間は、汎用の業務用LANで接続する。したがって、ログ搬送路4が通信不良の場合であっても、業務ネットワークは利用可能である可能性が高い。また、業務ネットワークが通信不能となった場合には、アプリケーションサーバ3を含む業務システム全体が機能不全となる。したがって、業務ネットワークが通信不能となることは通常ありない。
そのため、正システム1と副システム2とが、ログ搬送路4の通信不良によって蓄積モードに移行したとしても、業務ネットワークを経由した通信が機能している状態は、十分に生じえる。そのような状態では、アプリケーションサーバ3経由で、正システム1から副システム2に管理情報を転送することで、蓄積ログ5のログデータを早期に副システム
2側に反映できる。また、ログ搬送路4が通信不良であっても、正システム1が蓄積モードで正常動作中であることを副システム1側に通知することができる。
図10に、このようなAPサーバ通信タスクTS6を含む処理フローを例示する。この処理で、図8と同一の処理については、同一の符号を付して、その説明を省略する。この処理では、データ転送の結果、データ転送が正常に終了しなかったと判断した場合には(S43で異常の場合)、正システム1は、現在、すでに、正システム1が蓄積モード(すなわち、ログデータを蓄積ログ5に格納するモード、蓄積状態ともいう)にあって、APサーバ通信タスクTS6による転送実行モードであるか、否かを判定する(S43)。S43Aの判定で、肯定の判定の場合、正システム1は、アプリケーションサーバ3の二重化管理に対して、副システム2への蓄積ログ5のログデータの転送を依頼する(S43B)。アプリケーションサーバ3の二重化管理は、APサーバ通信タスクTS6が処理するキューに転送依頼を登録する。その後、正システム1は、制御をS40に戻す。なお、S43A否定判定の場合には、実施例1と同様、S44以下の処理を実行する。
一方、APサーバ通信タスクTS6では、正システム1は、蓄積モードにおいて、タイマ監視している(S61)。そして、タイマが計時した所定時間が経過すると、正システム1は、その送信依頼にしたがって、蓄積ログ5を基に、ログデータを送信する通信データ(パケットともいう)を組み立てる(S62)。そして、アプリケーションサーバ3経由の通信(APモードという)で、ログデータを副システム2に転送する(S63)。具体的には、正システム1から、アプリケーションサーバ3上の通信タスクに対して、副システム2への転送を指定して、ログデータが引き渡される。アプリケーションサーバ3上の通信タスクは、正システム1からの転送依頼を受け取ると、指定された転送先である副システム2に対して、引き渡されたログデータを転送する。
この場合のログデータの送信手順は、図10で説明したログ搬送路4を通じて送信する場合(ログデータ送信タスクTS4のS42)と同様である。すなわち、蓄積モードになった後は、副システム2へのログデータの送信が試行される。
そして、一旦、APサーバ通信タスクTS6によって、アプリケーションサーバ3を通じて最新ログデータの送信が成功すると、副システム2では、ユーザにデータ量、および、予測時間をインフォメーションメッセージによって報知可能となる。
以上述べたように、本実施例では、蓄積状態が所定以上長く継続すると、アプリケーションサーバ3経由での通信によって、蓄積ログ5のログデータが正システム1から副システム2に転送される。これによって、早期に、副システム2において、正システム1の動作状態の把握が容易となる。また、アプリケーションサーバ3を含む業務ネットワークが通信不良の場合には、業務アプリケーション自体が運用不能となるので、APサーバ通信タスクTS6による転送を行うことによって、システムが運用不能となる限界まで、正システム1から副システム2に、ログデータを転送することこが可能となる。
上記実施例1および2では、副システム2が受信したログデータは、一時ファイル6に格納された。この場合一時ファイル6としては、ハードディスクのファイル等の不揮発性の記憶装置を想定している。しかし、本発明の実施は、そのような構成に限定される訳ではない。
本実施例では、副システム2が受信したログデータを揮発性の一時ファイル6(例えば、メモリ)に保持するようにしてもよい。その場合には、正システム1側で、送信ログ4を再送用ログとして、保存する。再送用ログは、副システム2から、ログデータを受信し
、さらに、データベース21への更新が完了した旨の通知があったときに削除すればよい。
この場合、例えば、副システム2が一時ファイル6の内容をデータベース21に反映前に、副システム2がダウンしたような場合には、一時ファイル6のログデータはデータベース21に反映されることなく、消滅する。したがって、この場合には、副システム2が正常復帰後、正システム1に、再送用ログからログデータを再送するように要求すればよい。そのため、副システム2は、少なくとも、データベース21に反映済の順序番号を不揮発性メモリに、保存しておけばよい。
《コンピュータ読み取り可能な記録媒体》
コンピュータその他の機械、装置(以下、コンピュータ等)に上記いずれかの機能を実現させるプログラムをコンピュータ等が読み取り可能な記録媒体に記録することができる。そして、コンピュータ等に、この記録媒体のプログラムを読み込ませて実行させることにより、その機能を提供させることができる。
ここで、コンピュータ等が読み取り可能な記録媒体とは、データやプログラム等の情報を電気的、磁気的、光学的、機械的、または化学的作用によって蓄積し、コンピュータ等から読み取ることができる記録媒体をいう。このような記録媒体のうちコンピュータ等から取り外し可能なものとしては、例えばフレキシブルディスク、光磁気ディスク、CD-ROM、CD-R/W、DVD、DAT、8mmテープ、メモリカード等がある。
また、コンピュータ等に固定された記録媒体としてハードディスクやROM(リードオンリーメモリ)等がある。
情報管理システムのデータフローを例示する図である。 一般的な情報管理システムの処理概要を例示する図である。 情報管理システムの処理概要を例示する図である。 更新ログの典型的な構成要素を例示する図である。 正システムに格納されるデータ構造を例示する図である。 副システムが保持するデータ構造を例示する図である。 非同期転送時に、蓄積ログに格納されるデータのデータ構造を例示する図である。 正システムの処理フローを例示する図である。 副システムで実行されるログデータ受信タスクの処理フローを例示する図である。 APサーバ通信タスクを含む処理フローを例示する図である。
符号の説明
1 正システム
2 副システム
3 アプリケーションサーバ
4 送信ログ
5 蓄積ログ
6 一時ファイル

Claims (7)

  1. 用装置と予備装置とを含む情報管理システムであって、
    前記現用装置は、
    受信したデータを格納する第1の格納手段と、
    前記第1の格納手段にデータを格納したときに、データ格納順に対応した順序番号を含む更新記録情報を、前記予備装置に転送する転送手段と、
    記更新記録情報が前記予備装置に転送されなかったときは、転送されなかった前記更新記録情報を蓄積する蓄積手段と、を備え、
    前記予備装置は、
    受信したデータを格納する第2の格納手段と、
    前記現用装置から転送された前記更新記録情報にしたがって前記第2の格納手段のデータを更新する手段と、
    前記現用装置から転送される更新記録情報に含まれる順序番号を参照して、前記更新記録情報の受信漏れを検知する手段と、
    前記更新記録情報の受信漏れが検知されたときに、前記検知以前に受信した前記更新記録情報に含まれる前記順序番号に基づいて特定される、前記現用装置の第1の格納手段へのデータの格納処理を前記第2の格納手段に反映する時間に関する情報を出力する出力手段と、
    前記更新記録情報の受信漏れが検知されたときに、受信漏れとなった前記更新記録情報の再送を要求する手段と、を備え
    前記現用装置の前記転送手段は、前記更新記録情報の再送が要求されたときに、前記蓄積手段に蓄積された前記更新記録情報を、前記予備装置に転送する、
    ことを特徴とする情報管理システム。
  2. 前記現用装置は、当該情報管理システムにサービスの提供を要求する連携装置と通信する手段と、
    前記蓄積手段に蓄積された更新記録情報の前記予備装置への転送を前記連携装置に要求する手段と、をさらに備える請求項1に記載の情報管理システム。
  3. 前記現用装置の転送手段は、前記蓄積手段に更新記録情報が蓄積されており、かつ、前記予備装置から前記再送要求を受けていない場合には、前記蓄積手段に蓄積された更新記録情報に含まれる順序番号に後続する順序番号を前記第1の格納手段に新たに格納されたデータの更新記録情報に付して転送する請求項1または2に記載の情報管理システム。
  4. 現用装置と予備装置とを含む情報管理システムであって、
    前記現用装置は、
    データを格納する第1の格納手段と
    前記第1の格納手段にデータを格納したときに、データ格納順に対応した順序番号を含む更新記録情報を、前記予備装置に転送する転送手段と、
    前記記録情報が前記予備装置に転送されなかったときは、転送できなかった前記更新記録情報を蓄積する蓄積手段と、を備え、
    前記予備装置は、
    ータを格納する第2の格納手段と、
    前記現用装置から転送される更新記録情報に含まれる順序番号を参照して、前記更新記録情報の受信漏れを検知する検知手段と、
    前記更新記録情報の受信漏れが検知されたときに、前記検知以前に受信した前記更新記録情報に含まれる順序番号に基づいて特定される、前記現用装置の前記第1の格納手段へのデータの格納処理を前記第2の格納手段に反映する時間に関する情報を出力する出力手段と、
    を備えることを特徴とする情報管理システム
  5. 用装置と予備装置とを含む情報管理システムが実行する情報管理方法であって、
    前記現用装置
    受信したデータを格納する第1の格納ステップと、
    前記第1の格納ステップにデータを格納したときに、データ格納順に対応した順序番号を含む更新記録情報を、前記予備装置に転送する転送ステップと、
    前記更新記録情報が前記予備装置に転送されなかったときは、転送されなかった前記更新記録情報を蓄積する蓄積ステップと、を実行
    前記予備装置
    受信したデータを格納する第2の格納ステップと、
    前記現用装置から転送された前記更新記録情報にしたがって前記第2の格納ステップのデータを更新するステップと、
    前記現用装置から転送される更新記録情報に含まれる順序番号を参照して、前記更新記録情報の受信漏れを検知するステップと、
    記更新記録情報の受信漏れが検知されたときに、前記検知以前に受信した前記更新記録情報に含まれる前記順序番号に基づいて特定される、前記現用装置の第1の格納ステップへのデータの格納処理を前記第2の格納ステップに反映する時間に関する情報を出力する出力ステップと、
    前記更新記録情報の受信漏れが検知されたときに、受信漏れとなった前記更新記録情報の再送を要求するステップと、を実行し、
    前記現用装置の前記転送ステップは、前記更新記録情報の再送が要求されたときに、前記蓄積ステップに蓄積された前記更新記録情報を、前記予備装置に転送する、情報管理方法。
  6. 現用装置と予備装置とを含む情報管理システムが実行する情報管理方法であって、
    前記現用装置は、
    データを格納する第1の格納ステップと、
    前記第1の格納ステップにデータを格納したときに、データの格納順に対応した順序番号を含む更新記録情報を、前記予備装置に転送する転送ステップと、
    前記記録情報が前記予備装置に転送されなかったときは、転送できなかった前記更新記録情報を蓄積する蓄積ステップと、を実行し、
    前記予備装置は、
    データを格納する第2の格納ステップと、
    前記現用装置から転送される更新記録情報に含まれる順序番号を参照して、前記更新記録情報の受信漏れを検知する検知ステップと、
    前記更新記録情報の受信漏れが検知されたときに、前記検知以前に受信した前記更新記録情報に含まれる順序番号に基づいて特定される、前記現用装置の前記第1の格納ステップへのデータの格納処理を前記第2の格納ステップに反映する時間に関する情報を出力する出力ステップと、
    を実行する情報管理方法。
  7. 現用装置と予備装置とを含む、情報管理システムのコンピュータプログラムであって、
    前記現用装置のコンピュータに、
    受信したデータを格納する第1の格納ステップと、
    前記第1の格納ステップにデータを格納したときに、データの格納順に対応した順序番号を含む更新記録情報を、前記予備装置に転送する転送ステップと、
    前記更新記録情報が前記予備装置に転送されなかったときは、転送されなかった前記更新記録情報を蓄積する蓄積ステップと、を実行させるためのプログラムと、
    前記予備装置のコンピュータに、
    受信したデータを格納する第2の格納ステップと、
    前記現用装置から転送された前記更新記録情報にしたがって前記第2の格納ステップのデータを更新するステップと、
    前記現用装置から転送される更新記録情報に含まれる順序番号を参照して、前記更新記録情報の受信漏れを検知するステップと、
    前記更新記録情報の受信漏れが検知されたときに、前記検知以前に受信した前記更新記録情報に含まれる前記順序番号に基づいて特定される、前記現用装置の第1の格納ステップへのデータの格納処理を前記第2の格納ステップに反映する時間に関する情報を出力する出力ステップと、
    前記更新記録情報の受信漏れが検知されたときに、受信漏れとなった前記更新記録情報の再送を要求するステップと、を実行させるためのプログラムとを含み、
    前記現用装置の前記転送ステップは、前記更新記録情報の再送が要求されたときに、前記蓄積ステップに蓄積された前記更新記録情報を、前記予備装置に転送する、コンピュータプログラム。
JP2008197068A 2008-07-30 2008-07-30 情報管理システム Expired - Fee Related JP5343436B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008197068A JP5343436B2 (ja) 2008-07-30 2008-07-30 情報管理システム
US12/489,675 US8005799B2 (en) 2008-07-30 2009-06-23 Information management system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008197068A JP5343436B2 (ja) 2008-07-30 2008-07-30 情報管理システム

Publications (2)

Publication Number Publication Date
JP2010033467A JP2010033467A (ja) 2010-02-12
JP5343436B2 true JP5343436B2 (ja) 2013-11-13

Family

ID=41609382

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008197068A Expired - Fee Related JP5343436B2 (ja) 2008-07-30 2008-07-30 情報管理システム

Country Status (2)

Country Link
US (1) US8005799B2 (ja)
JP (1) JP5343436B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9032053B2 (en) * 2010-10-29 2015-05-12 Nokia Corporation Method and apparatus for upgrading components of a cluster
JP5673234B2 (ja) * 2011-03-10 2015-02-18 日本電気株式会社 データベースのレプリケーション方法
WO2012119388A1 (zh) * 2011-08-12 2012-09-13 华为技术有限公司 通信系统中节点设备上配置的服务故障的处理方法及装置
JP5965160B2 (ja) * 2012-02-28 2016-08-03 日本電信電話株式会社 データ同期システム、運用系コンピュータ、及び待機系コンピュータ
JP2013178685A (ja) * 2012-02-29 2013-09-09 Nec Corp 非同期バックアップ機能を有するデータ処理システム、フロントシステム、バックアップ方法、及びそのためのプログラム
JP2016057657A (ja) * 2014-09-05 2016-04-21 日本電気株式会社 情報処理装置、情報処理システム、要求信号処理方法および要求信号処理プログラム
US9832103B2 (en) * 2014-11-24 2017-11-28 Electronics And Telecommunications Research Institute Method and apparatus for secure communication via multiple communication paths
CN104484481B (zh) * 2014-12-26 2018-01-02 上海携程商务有限公司 票务订单的数据匹配方法、装置及系统
TWI587214B (zh) * 2016-04-21 2017-06-11 慧榮科技股份有限公司 資料儲存裝置、其控制單元及其任務排序方法
US11900137B2 (en) * 2022-02-15 2024-02-13 Sap Se Configurable in-application event logging service

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5307481A (en) * 1990-02-28 1994-04-26 Hitachi, Ltd. Highly reliable online system
US5740433A (en) * 1995-01-24 1998-04-14 Tandem Computers, Inc. Remote duplicate database facility with improved throughput and fault tolerance
JP3582169B2 (ja) * 1995-08-15 2004-10-27 Kddi株式会社 異種移動通信網間中継装置
JP2904100B2 (ja) 1996-01-26 1999-06-14 日本電気株式会社 複数のデータベース間の整合方式
JPH11215206A (ja) * 1998-01-28 1999-08-06 Mitsubishi Electric Corp データ転送システムおよびデータ転送方法
US6065018A (en) * 1998-03-04 2000-05-16 International Business Machines Corporation Synchronizing recovery log having time stamp to a remote site for disaster recovery of a primary database having related hierarchial and relational databases
US6493726B1 (en) * 1998-12-29 2002-12-10 Oracle Corporation Performing 2-phase commit with delayed forget
US6510421B1 (en) * 1998-12-29 2003-01-21 Oracle Corporation Performing 2-phase commit with presumed prepare
JP2001022627A (ja) 1999-07-06 2001-01-26 Nec Commun Syst Ltd 複数装置間でのデータベース同期方式および方法
JP2001236257A (ja) * 2000-02-24 2001-08-31 Fujitsu Ltd 情報記憶装置及び加入者データのデータ更新方法並びに移動通信システム
US20030093545A1 (en) * 2001-11-14 2003-05-15 Inventec Tomorrow Work Studio Corporation, Taiwan Method and system for downloading data to portable electronic device
JP2004013367A (ja) * 2002-06-05 2004-01-15 Hitachi Ltd データ記憶サブシステム
JP2006121394A (ja) * 2004-10-21 2006-05-11 Matsushita Electric Ind Co Ltd 無線通信装置及び無線通信システム
JP2008097164A (ja) * 2006-10-10 2008-04-24 Hitachi Ltd 複数の機能要素から構成されるシステムの故障監視方法
US8125907B2 (en) * 2008-06-12 2012-02-28 Talari Networks Incorporated Flow-based adaptive private network with multiple WAN-paths

Also Published As

Publication number Publication date
US8005799B2 (en) 2011-08-23
US20100030789A1 (en) 2010-02-04
JP2010033467A (ja) 2010-02-12

Similar Documents

Publication Publication Date Title
JP5343436B2 (ja) 情報管理システム
CN110297801B (zh) 基于容错fpga的事务系统的正好一次事务语义的系统和方法
US7676616B2 (en) Method, apparatus and program storage device for providing asynchronous status messaging in a data storage system
US10834186B2 (en) Disaster recovery switchover method and system, and node
US7793060B2 (en) System method and circuit for differential mirroring of data
US8423515B2 (en) Database system configured for automatic failover with user-limited data loss
US7694177B2 (en) Method and system for resynchronizing data between a primary and mirror data storage system
JP4301849B2 (ja) 情報処理方法及びその実施システム並びにその処理プログラム並びにディザスタリカバリ方法およびシステム並びにその処理を実施する記憶装置およびその制御処理方法
US20080288812A1 (en) Cluster system and an error recovery method thereof
US7797571B2 (en) System, method and circuit for mirroring data
KR20080018267A (ko) 논-스톱 멀티-노드 시스템 동기화를 위한 방법 및 장치
JP2010136330A (ja) マルチ・パス環境におけるデータ同期化装置、システム、及び記録媒体
US8880552B2 (en) Database system and database control method
JP6511739B2 (ja) 冗長システムおよび冗長化方法
KR101605455B1 (ko) 데이터 손실 없는 데이터베이스 리두 로그 이중화 방법 및 그를 위한 시스템
US6625753B1 (en) Recovery facility for an SNA communication network
JP5459389B2 (ja) コンピュータシステム及び現用系コンピュータ並びに予備系コンピュータ、プログラム
KR20030048503A (ko) 이중화 서버 구조의 데이터 동기화를 위한 통신 시스템 및방법
US9971661B2 (en) Redundant system, method for redundant system, method for controlling node of redundant system and computer readable storage medium
JP6511737B2 (ja) 冗長システム、冗長化方法および冗長化プログラム
CN106685697B (zh) 一种异常边际消息数据恢复处理的方法及系统
JP2007272328A (ja) コンピュータ・システム
JP2004272884A (ja) 複数リモートストレージでのリモートコピー停止後のデータ同期化方式
JP2004272884A5 (ja)
JP4459185B2 (ja) コンピュータ・システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110418

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130129

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130401

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130716

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130729

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees