JP2005293325A - データベースの即時レプリケーション性能監視システム - Google Patents
データベースの即時レプリケーション性能監視システム Download PDFInfo
- Publication number
- JP2005293325A JP2005293325A JP2004108518A JP2004108518A JP2005293325A JP 2005293325 A JP2005293325 A JP 2005293325A JP 2004108518 A JP2004108518 A JP 2004108518A JP 2004108518 A JP2004108518 A JP 2004108518A JP 2005293325 A JP2005293325 A JP 2005293325A
- Authority
- JP
- Japan
- Prior art keywords
- immediate replication
- immediate
- replication performance
- performance
- monitoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Debugging And Monitoring (AREA)
Abstract
【課題】ディザスタリカバリ実現のために、ローカルサイトのデータベース情報をリモートサイトに同期方式で即時レプリケーションを行っているシステムでは、レプリケーション遅延がローカルサイトでサービス提供中のトランザクション処理に影響を及ぼし、システム全体のスローダウンにつながる。そのため、レプリケーション遅延がローカルサイトのトランザクション処理に与える影響が最小限になる機能を提供する。
【解決手段】即時レプリケーション性能をリアルタイムに監視する機能11により採取された情報(状態管理ファイル13)から、状態監視機能14が即時レプリケーション性能許容値を超過したノードを特定し、同期停止機能151が即時レプリケーションを停止することで提供サービスに及ぼす影響を最小限にする。
【選択図】図1
【解決手段】即時レプリケーション性能をリアルタイムに監視する機能11により採取された情報(状態管理ファイル13)から、状態監視機能14が即時レプリケーション性能許容値を超過したノードを特定し、同期停止機能151が即時レプリケーションを停止することで提供サービスに及ぼす影響を最小限にする。
【選択図】図1
Description
本発明はデータベースの即時レプリケーション性能監視システムに関し、特に、リモートサイトへの即時レプリケーションを行っているデータベースにおいてシステムの性能監視を行うデータベースの即時レプリケーション性能監視システムに関するものである。
ディザスタリカバリの観点からデータベース情報をリモートサイトにコピーするシステムがある。このデータコピー(レプリケーション)を実現する方式として同期方式と非同期方式がある。同期方式ではコピー先であるリモートサイトとコピー元であるローカルサイトの間でリアルタイムにコピーが行われるため、ローカルサイトで書かれたデータがリモートサイトでも書かれていることが保証される。一方、非同期方式では、ある瞬間にはローカルサイト、リモートサイトで同一のデータが書かれていない。そのため、リモートサイトでの処理引継ぎ時にデータが失われる場合がある。
http://japan.emc.com/local/ja/JP/products/networking/srdf.jsp http://japan.emc.com/local/ja/JP/products/product_pdfs/srdf/srdf.pdf
http://japan.emc.com/local/ja/JP/products/networking/srdf.jsp http://japan.emc.com/local/ja/JP/products/product_pdfs/srdf/srdf.pdf
しかしながら、障害局所化の観点から、システムにおける部分的な障害が発生した際にシステム全体へ影響が波及して処理の遅延が起きることは問題となる。
即時レプリケーションを行っている場合には、レプリカデータベースへの書き込みが終了するまでローカルサイトでのトランザクションが終了とならないためレプリカデータベースへの書き込み遅延やネットワーク障害によるデータ伝送時間の伸びといった、ローカルサイト以外の要因によりサービス提供中のトランザクションが遅延することがある。即時レプリケーション中に発生した局所障害で、ローカルサイトにおける大量データ処理、並列処理のトランザクションが遅延すると、処理待ちでコンピュータ資源を保持したままとなり、次の処理要求を受け付けられなくなるため、タイムアウトによる再処理要求が要る。その結果、処理要求負荷も高まり、局所障害がシステム全体のスローダウンにつながってしまう。
本発明はこのような状況に鑑みてなされたものであり、リモートサイトにコピーとして存在するレプリカデータベースに、同期方式を用いた即時レプリケーションによりデータベース情報をコピーする機能を実装したシステムにおいて、レプリケーションの遅延がシステム全体のスローダウンにつながる点について解決することができるようにするものである。
即時レプリケーションを行っている場合には、レプリカデータベースへの書き込みが終了するまでローカルサイトでのトランザクションが終了とならないためレプリカデータベースへの書き込み遅延やネットワーク障害によるデータ伝送時間の伸びといった、ローカルサイト以外の要因によりサービス提供中のトランザクションが遅延することがある。即時レプリケーション中に発生した局所障害で、ローカルサイトにおける大量データ処理、並列処理のトランザクションが遅延すると、処理待ちでコンピュータ資源を保持したままとなり、次の処理要求を受け付けられなくなるため、タイムアウトによる再処理要求が要る。その結果、処理要求負荷も高まり、局所障害がシステム全体のスローダウンにつながってしまう。
本発明はこのような状況に鑑みてなされたものであり、リモートサイトにコピーとして存在するレプリカデータベースに、同期方式を用いた即時レプリケーションによりデータベース情報をコピーする機能を実装したシステムにおいて、レプリケーションの遅延がシステム全体のスローダウンにつながる点について解決することができるようにするものである。
請求項1に記載のデータベースの即時レプリケーション性能監視システムは、ディザスタリカバリを実現するために、大容量伝送路を用いた即時レプリケーションによりサービス提供中のデータベース情報をリモートサイトにコピーする機能を有するデータベースの即時レプリケーション性能を監視するデータベースの即時レプリケーション性能監視システムであって、即時レプリケーション性能をリアルタイムに監視する対象ノードを識別する識別手段と、即時レプリケーション性能を示す即時レプリケーション性能情報を採取する間隔および即時レプリケーション性能の許容値を決定する決定手段と、即時レプリケーション性能情報を各ノードについてリアルタイムに採取する採取手段と、採取した即時レプリケーション性能情報を状態管理ファイルに出力して保存する保存手段と、状態管理ファイルに出力された即時レプリケーション性能情報を即時レプリケーション性能の許容値と比較することにより即時レプリケーション性能の低下した監視対象ノードを特定する状態監視手段と、許容値を超過したノードに対する即時レプリケーションの機能を停止させることにより発生する即時レプリケーションの遅延という局所障害がローカルサイトでサービスを提供している大量データ処理および並列処理のトランザクション処理に与える影響を最小限にして、局所障害がシステム全体のスローダウンにつながることを事前に防止する防止手段とを備えることを特徴とする。
また、即時レプリケーション性能の許容値の超過による即時レプリケーションの機能停止後も、決定手段は、継続的に監視する間隔および即時レプリケーション性能の許容値を決定し、採取手段は、即時レプリケーション性能情報を対象ノードについてリアルタイムに採取し、保存手段は、継続的に採取した即時レプリケーション性能情報を状態管理ファイルに出力して保存し、状態管理ファイルに出力された即時レプリケーション性能情報を即時レプリケーション性能の許容値と比較することにより即時レプリケーション性能の回復した監視対象ノードを特定する状態監視手段をさらに備えるようにすることができる。
また、即時レプリケーション性能の許容値の超過が解消したノードに対して、即時レプリケーションの機能を再開させる再開手段をさらに備えるようにすることができる。
請求項4に記載のデータベースの即時レプリケーション性能監視方法は、ディザスタリカバリを実現するために、大容量伝送路を用いた即時レプリケーションによりサービス提供中のデータベース情報をリモートサイトにコピーする機能を有するデータベースの即時レプリケーション性能を監視するデータベースの即時レプリケーション性能監視方法であって、即時レプリケーション性能をリアルタイムに監視する対象ノードを識別する識別ステップと、即時レプリケーション性能を示す即時レプリケーション性能情報を採取する間隔および即時レプリケーション性能の許容値を決定する決定ステップと、即時レプリケーション性能情報を各ノードについてリアルタイムに採取する採取ステップと、採取した即時レプリケーション性能情報を状態管理ファイルに出力して保存する保存ステップと、状態管理ファイルに出力された即時レプリケーション性能情報を即時レプリケーション性能の許容値と比較することにより即時レプリケーション性能の低下した監視対象ノードを特定する状態監視ステップと、許容値を超過したノードに対する即時レプリケーションの機能を停止させることにより発生する即時レプリケーションの遅延という局所障害がローカルサイトでサービスを提供している大量データ処理および並列処理のトランザクション処理に与える影響を最小限にして、局所障害がシステム全体のスローダウンにつながるのを事前に防止する防止ステップとを備えることを特徴とする。
また、即時レプリケーション性能の許容値の超過による即時レプリケーションの機能停止後も、継続的に監視する間隔および即時レプリケーション性能の許容値が決定され、即時レプリケーション性能情報が対象ノードについてリアルタイムに採取され、継続的に採取した即時レプリケーション性能情報が状態管理ファイルに出力されて保存され、状態管理ファイルに出力された即時レプリケーション性能情報を即時レプリケーション性能の許容値と比較することにより即時レプリケーション性能の回復した監視対象ノードを特定する状態監視ステップをさらに備えるようにすることができる。
また、即時レプリケーション性能の許容値の超過が解消したノードに対して、即時レプリケーションの機能を再開させる再開手段をさらに備えるようにすることができる。
請求項7に記載のデータベースの即時レプリケーション性能監視プログラムは、ディザスタリカバリを実現するために、大容量伝送路を用いた即時レプリケーションによりサービス提供中のデータベース情報をリモートサイトにコピーする機能を有するデータベースの即時レプリケーション性能を監視するデータベースの即時レプリケーション性能監視システムを制御するデータベースの即時レプリケーション性能監視プログラムであって、即時レプリケーション性能をリアルタイムに監視する対象ノードを識別する識別ステップと、即時レプリケーション性能を示す即時レプリケーション性能情報を採取する間隔および即時レプリケーション性能の許容値を決定する決定ステップと、即時レプリケーション性能情報を各ノードについてリアルタイムに採取する採取ステップと、採取した即時レプリケーション性能情報を状態管理ファイルに出力して保存する保存ステップと、状態管理ファイルに出力された即時レプリケーション性能情報を即時レプリケーション性能の許容値と比較することにより即時レプリケーション性能の低下した監視対象ノードを特定する状態監視ステップと、許容値を超過したノードに対する即時レプリケーションの機能を停止させることにより発生する即時レプリケーションの遅延という局所障害がローカルサイトでサービスを提供している大量データ処理および並列処理のトランザクション処理に与える影響を最小限にして、局所障害がシステム全体のスローダウンにつながるのを事前に防止する防止ステップとをデータベースの即時レプリケーション性能監視システムに実行させることを特徴とする。
また、即時レプリケーション性能の許容値の超過による即時レプリケーションの機能停止後も、決定手段は、継続的に監視する間隔および即時レプリケーション性能の許容値を決定し、採取手段は、即時レプリケーション性能情報を対象ノードについてリアルタイムに採取し、保存手段は、継続的に採取した即時レプリケーション性能情報を状態管理ファイルに出力して保存し、状態管理ファイルに出力された即時レプリケーション性能情報を即時レプリケーション性能の許容値と比較することにより即時レプリケーション性能の回復した監視対象ノードを特定する状態監視手段をさらに備えるようにすることができる。
また、即時レプリケーション性能の許容値の超過が解消したノードに対して、即時レプリケーションの機能を再開させる再開手段をさらに備えるようにすることができる。
請求項4に記載のデータベースの即時レプリケーション性能監視方法は、ディザスタリカバリを実現するために、大容量伝送路を用いた即時レプリケーションによりサービス提供中のデータベース情報をリモートサイトにコピーする機能を有するデータベースの即時レプリケーション性能を監視するデータベースの即時レプリケーション性能監視方法であって、即時レプリケーション性能をリアルタイムに監視する対象ノードを識別する識別ステップと、即時レプリケーション性能を示す即時レプリケーション性能情報を採取する間隔および即時レプリケーション性能の許容値を決定する決定ステップと、即時レプリケーション性能情報を各ノードについてリアルタイムに採取する採取ステップと、採取した即時レプリケーション性能情報を状態管理ファイルに出力して保存する保存ステップと、状態管理ファイルに出力された即時レプリケーション性能情報を即時レプリケーション性能の許容値と比較することにより即時レプリケーション性能の低下した監視対象ノードを特定する状態監視ステップと、許容値を超過したノードに対する即時レプリケーションの機能を停止させることにより発生する即時レプリケーションの遅延という局所障害がローカルサイトでサービスを提供している大量データ処理および並列処理のトランザクション処理に与える影響を最小限にして、局所障害がシステム全体のスローダウンにつながるのを事前に防止する防止ステップとを備えることを特徴とする。
また、即時レプリケーション性能の許容値の超過による即時レプリケーションの機能停止後も、継続的に監視する間隔および即時レプリケーション性能の許容値が決定され、即時レプリケーション性能情報が対象ノードについてリアルタイムに採取され、継続的に採取した即時レプリケーション性能情報が状態管理ファイルに出力されて保存され、状態管理ファイルに出力された即時レプリケーション性能情報を即時レプリケーション性能の許容値と比較することにより即時レプリケーション性能の回復した監視対象ノードを特定する状態監視ステップをさらに備えるようにすることができる。
また、即時レプリケーション性能の許容値の超過が解消したノードに対して、即時レプリケーションの機能を再開させる再開手段をさらに備えるようにすることができる。
請求項7に記載のデータベースの即時レプリケーション性能監視プログラムは、ディザスタリカバリを実現するために、大容量伝送路を用いた即時レプリケーションによりサービス提供中のデータベース情報をリモートサイトにコピーする機能を有するデータベースの即時レプリケーション性能を監視するデータベースの即時レプリケーション性能監視システムを制御するデータベースの即時レプリケーション性能監視プログラムであって、即時レプリケーション性能をリアルタイムに監視する対象ノードを識別する識別ステップと、即時レプリケーション性能を示す即時レプリケーション性能情報を採取する間隔および即時レプリケーション性能の許容値を決定する決定ステップと、即時レプリケーション性能情報を各ノードについてリアルタイムに採取する採取ステップと、採取した即時レプリケーション性能情報を状態管理ファイルに出力して保存する保存ステップと、状態管理ファイルに出力された即時レプリケーション性能情報を即時レプリケーション性能の許容値と比較することにより即時レプリケーション性能の低下した監視対象ノードを特定する状態監視ステップと、許容値を超過したノードに対する即時レプリケーションの機能を停止させることにより発生する即時レプリケーションの遅延という局所障害がローカルサイトでサービスを提供している大量データ処理および並列処理のトランザクション処理に与える影響を最小限にして、局所障害がシステム全体のスローダウンにつながるのを事前に防止する防止ステップとをデータベースの即時レプリケーション性能監視システムに実行させることを特徴とする。
本発明のデータベースの即時レプリケーション性能監視システムによれば、即時レプリケーションの遅延による提供サービスのトランザクション処理への影響を最小限にして、局所障害が全体システムのスローダウンにつながることを防止できる。その理由は、即時レプリケーションの性能測定機能およびレプリケーション性能許容値を超過したノードを特定する状態監視機能とレプリケーションが遅延したノードに対して即時レプリケーションを停止する同期停止機能を実装しているためである。
図1は、本発明の一実施の形態の構成例を示すブロック図である。性能監視機構1において、性能測定機能11は性能監視定義ファイル12から設定情報を取得して、ローカルサイト2のマスタデータベース21からレプリケーション性能情報(レプリケーション領域への書き込み性能情報;書き込み時間、書き込み回数、書き込み待機時間)を採取する。このとき、採取した性能情報(レプリケーション性能情報)を状態管理ファイル13に保存する。状態監視機能14は、性能監視定義ファイル12から設定情報を取得して、状態管理ファイル13に出力されている性能情報を元にレプリケーションの遅延や遅延回復を判定する。遅延または遅延の回復時には、同期制御機能15に通知する。同期制御機能15は、リモートサイト3へのデータコピーを停止する同期停止機能151およびデータコピーを再開する同期再開機能152からなる。即時レプリケーション機能4は、マスタデータベース21とレプリカデータベース31、32、・・・、3nの間のデータコピーを同期方式で行う。
本実施の形態の性能監視機構1では、性能測定機能11がレプリケーション性能情報を採取して出力した状態管理ファイル13から、レプリケーション性能許容値を超過したノード(マスタデータベース21)を特定する状態監視機能14と、特定されたノードにおける即時レプリケーション機能4を停止する同期停止機能151とを備え、即時レプリケーションの遅延が提供サービスに影響を及ぼすと判断した場合にレプリカデータベース31、32、・・・、3nへの即時レプリケーション機能4を停止するよう動作する。これに加えて、同期再開機能152を備えることで、即時レプリケーション機能4停止後に性能測定機能11により継続的に採取されたレプリケーション性能値が、レプリケーション性能許容値を下回った場合に、レプリカデータベースへの即時レプリケーション機能4を再開するよう動作する。
以上により、ローカルサイトで提供しているサービスへの影響を最小限にした状態で、ディザスタリカバリ実現のための即時レプリケーション機能を実装することができる。
レプリケーション性能の測定を行う方法として、データベースで使用していないディスク領域に、性能測定のための書き込みを行うことで即時レプリケーションの遅延を検出する方法も考えられるが、この方法では、ローカルサイトとリモートサイト間に本来不要なデータ伝送が発生するため高性能が要求されるサービス提供中に実施することは好ましくない。
次に、本実施の形態について図面を参照して詳細に説明する。図1を参照すると、本発明の第1の実施の形態は、性能監視機構1、ローカルサイト2、リモートサイト3、即時レプリケーション機能4から構成されている。性能監視機構1は、性能測定機能11、性能監視定義ファイル12、状態管理ファイル13、状態監視機能14、同期制御機能15を含み、同期制御機能15は、同期停止機能151、同期再開機能152を含む。また、ローカルサイト2にはマスタデータベース21が存在し、リモートサイト3にはレプリカデータベース31、32、…3n(n≧1)が存在する。
性能測定機能11は、性能監視定義ファイル12(図2)からレプリケーション性能を監視する対象ノード(マスタデータベース21)、性能情報を採取する時間間隔(3秒間隔、即時レプリケーション停止後30秒間隔)を決定する。これをもとに、マスタデータベース21の即時レプリケーション性能(レプリケーション領域への書き込み性能情報;書き込み時間、書き込み回数、書き込み待機時間)を採取した結果を状態管理ファイル13(図3)に出力する。
状態監視機能14は、性能監視定義ファイル12から決定したレプリケーション性能許容値(書き込み時間/書き込み回数 < 1000[ミリ秒/回]、および、書き込み待機時間 < 1000[ミリ秒/回])と、状態管理ファイル13に出力されている値を比較することでレプリケーションの遅延を検出する(図4)。
遅延が連続して検出され、性能監視定義ファイル12により決定される回数(4回)に達したとき、レプリケーション機能の遅延と判断する。これにより同期制御機能15の同期停止機能151は、ローカルサイト2のマスタデータベース21から、リモートサイト3に存在するレプリカデータベース31、32、…3nへの即時レプリケーション機能4を停止する。
性能測定機能11は、性能監視定義ファイル12から決定される、レプリケーション停止後の性能情報採取のための時間間隔(30秒)に従って、マスタデータベース21の性能監視を継続する。測定結果は状態管理ファイル13に出力する。
状態監視機能14は、性能監視定義ファイル12から決定したレプリケーション性能許容値と状態管理ファイル13に出力されている値を比較することで、遅延からの回復を検出する。
遅延からの回復が連続して検出され、性能監視定義ファイル12により決定される回数(1回)となったとき、レプリケーション機能の回復と判断する。これにより同期制御機能15の、同期再開機能152は、ローカルサイト2のマスタデータベース21から、リモートサイト3に存在するレプリカデータベース31、32、…3nへの即時レプリケーション機能4を再開する。
次に、図4のフローチャートを参照して、状態監視機能14の処理手順について詳細に説明する。まず、ステップS1において、遅延回数に初期値0をセットする。次に、ステップS2において、変数Aに(書き込み時間/書き込み回数)をセットし、変数Bに(書き込み待機時間)をセットする。次に、ステップS3において、変数Aの値が1000以上であるか、または変数Bの値が1000以上であるか否かが判定される。その結果、変数Aの値が1000以上であるか、または変数Bの値が1000以上であると判定された場合、ステップS4に進む。一方、変数Aの値が1000以上ではなく、かつ変数Bの値が1000以上ではない場合、ステップS2に戻り、ステップS2以降の処理が繰り返し実行される。
ステップS4においては、遅延回数を1だけ増加させる。次に、ステップS5において、遅延回数が4回であるか否かが判定される。その結果、遅延回数が4回であると判定された場合、ステップS6に進む。一方、遅延回数が4回ではないと判定された場合、ステップS2に戻り、ステップS2以降の処理が繰り返し実行される。ステップS6においては、遅延回数が4回となったことを同期停止機能151に通知する。
次に、ステップS7において、遅延回復回数に初期値0をセットする。次に、ステップS8において、変数Aに(書き込み時間/書き込み回数)をセットし、変数Bに(書き込み待機時間)をセットする。次に、ステップS9において、変数Aの値が1000より小さく、かつ変数Bの値が1000より小さいか否かが判定される。その結果、変数Aの値が1000より小さく、かつ変数Bの値が1000より小さいと判定された場合、ステップS10に進む。一方、変数Aの値が1000以上であるか、または変数Bの値が1000以上である場合、ステップS8に戻り、ステップS8以降の処理が繰り返し実行される。
ステップS10においては、遅延回復回数を1だけ増加させる。次に、ステップS11において、遅延回復回数が1回であるか否かが判定される。その結果、遅延回数が1回であると判定された場合、ステップS12に進む。一方、遅延回復回数が1回ではないと判定された場合、ステップS8に戻り、ステップS8以降の処理が繰り返し実行される。ステップS12においては、遅延回復回数が1回となったことを同期再開機能152に通知する。その後、本処理を終了する。
次に、本実施の形態の効果について説明する。本実施の形態では、マスタデータベースの性能情報から即時レプリケーション性能の測定を行い、即時レプリケーションの遅延を検出した場合には提供中のサービスへの影響が最小限となるように即時レプリケーション機能を停止し、遅延が回復した場合にはディザスタリカバリの実現のために即時レプリケーション機能を再開する機構となっている。従って、ディザスタリカバリ実現のためにデータベース情報をリモートサイトに同期方式でコピーするシステムにおいて、レプリケーションが何らかの理由により遅延することによりローカルサイトでサービスを提供しているトランザクション処理が受ける影響を最小限にして、局所障害がシステム全体のスローダウンにつながるのを防ぐことができる。
なお、上記実施の形態の構成及び動作は例であって、本発明の趣旨を逸脱しない範囲で適宜変更することができることは言うまでもない。
1 性能監視機構
2 ローカルサイト
3 リモートサイト
4 即時レプリケーション機能
11 性能測定機能
12 性能監視定義ファイル
13 状態管理ファイル
14 状態監視機能
15 同期制御機能
21 マスタデータベース
31 レプリカデータベース
32 レプリカデータベース
3n レプリカデータベース
151 同期停止機能
152 同期再開機能
2 ローカルサイト
3 リモートサイト
4 即時レプリケーション機能
11 性能測定機能
12 性能監視定義ファイル
13 状態管理ファイル
14 状態監視機能
15 同期制御機能
21 マスタデータベース
31 レプリカデータベース
32 レプリカデータベース
3n レプリカデータベース
151 同期停止機能
152 同期再開機能
Claims (7)
- ディザスタリカバリを実現するために、大容量伝送路を用いた即時レプリケーションによりサービス提供中のデータベース情報をリモートサイトにコピーする機能を有するデータベースの即時レプリケーション性能を監視するデータベースの即時レプリケーション性能監視システムであって、
前記即時レプリケーション性能をリアルタイムに監視する対象ノードを識別する識別手段と、
前記即時レプリケーション性能を示す即時レプリケーション性能情報を採取する間隔および前記即時レプリケーション性能の許容値を決定する決定手段と、
前記即時レプリケーション性能情報を各ノードについてリアルタイムに採取する採取手段と、
採取した前記即時レプリケーション性能情報を状態管理ファイルに出力して保存する保存手段と、
前記状態管理ファイルに出力された前記即時レプリケーション性能情報を前記即時レプリケーション性能の前記許容値と比較することにより前記即時レプリケーション性能の低下した監視対象ノードを特定する状態監視手段と、
前記許容値を超過したノードに対する前記即時レプリケーションの機能を停止させることにより発生する前記即時レプリケーションの遅延という局所障害がローカルサイトでサービスを提供している大量データ処理および並列処理のトランザクション処理に与える影響を最小限にして、前記局所障害がシステム全体のスローダウンにつながることを事前に防止する防止手段と
を備えることを特徴とするデータベースの即時レプリケーション性能監視システム。 - 前記即時レプリケーション性能の前記許容値の超過による前記即時レプリケーションの機能停止後も、前記決定手段は、継続的に監視する間隔および前記即時レプリケーション性能の前記許容値を決定し、前記採取手段は、前記即時レプリケーション性能情報を対象ノードについてリアルタイムに採取し、前記保存手段は、継続的に採取した前記即時レプリケーション性能情報を前記状態管理ファイルに出力して保存し、
前記状態管理ファイルに出力された前記即時レプリケーション性能情報を前記即時レプリケーション性能の前記許容値と比較することにより前記即時レプリケーション性能の回復した監視対象ノードを特定する状態監視手段をさらに備える
ことを特徴とする請求項1に記載のデータベースの即時レプリケーション性能監視システム。 - 前記即時レプリケーション性能の前記許容値の超過が解消したノードに対して、前記即時レプリケーションの機能を再開させる再開手段をさらに備える
ことを特徴とする請求項2に記載のデータベースの即時レプリケーション性能監視システム。 - ディザスタリカバリを実現するために、大容量伝送路を用いた即時レプリケーションによりサービス提供中のデータベース情報をリモートサイトにコピーする機能を有するデータベースの即時レプリケーション性能を監視するデータベースの即時レプリケーション性能監視方法であって、
前記即時レプリケーション性能をリアルタイムに監視する対象ノードを識別する識別ステップと、
前記即時レプリケーション性能を示す即時レプリケーション性能情報を採取する間隔および前記即時レプリケーション性能の許容値を決定する決定ステップと、
前記即時レプリケーション性能情報を各ノードについてリアルタイムに採取する採取ステップと、
採取した前記即時レプリケーション性能情報を状態管理ファイルに出力して保存する保存ステップと、
前記状態管理ファイルに出力された前記即時レプリケーション性能情報を前記即時レプリケーション性能の前記許容値と比較することにより前記即時レプリケーション性能の低下した監視対象ノードを特定する状態監視ステップと、
前記許容値を超過したノードに対する前記即時レプリケーションの機能を停止させることにより発生する前記即時レプリケーションの遅延という局所障害がローカルサイトでサービスを提供している大量データ処理および並列処理のトランザクション処理に与える影響を最小限にして、前記局所障害がシステム全体のスローダウンにつながるのを事前に防止する防止ステップと
を備えることを特徴とするデータベースの即時レプリケーション性能監視方法。 - 前記即時レプリケーション性能の前記許容値の超過による前記即時レプリケーションの機能停止後も、継続的に監視する間隔および前記即時レプリケーション性能の前記許容値が決定され、前記即時レプリケーション性能情報が対象ノードについてリアルタイムに採取され、継続的に採取した前記即時レプリケーション性能情報が前記状態管理ファイルに出力されて保存され、
前記状態管理ファイルに出力された前記即時レプリケーション性能情報を前記即時レプリケーション性能の前記許容値と比較することにより前記即時レプリケーション性能の回復した監視対象ノードを特定する状態監視ステップをさらに備える
ことを特徴とする請求項4に記載のデータベースの即時レプリケーション性能監視方法。 - 前記即時レプリケーション性能の前記許容値の超過が解消したノードに対して、前記即時レプリケーションの機能を再開させる再開手段をさらに備える
ことを特徴とする請求項5に記載のデータベースの即時レプリケーション性能監視方法。 - ディザスタリカバリを実現するために、大容量伝送路を用いた即時レプリケーションによりサービス提供中のデータベース情報をリモートサイトにコピーする機能を有するデータベースの即時レプリケーション性能を監視するデータベースの即時レプリケーション性能監視システムを制御するデータベースの即時レプリケーション性能監視プログラムであって、
前記即時レプリケーション性能をリアルタイムに監視する対象ノードを識別する識別ステップと、
前記即時レプリケーション性能を示す即時レプリケーション性能情報を採取する間隔および前記即時レプリケーション性能の許容値を決定する決定ステップと、
前記即時レプリケーション性能情報を各ノードについてリアルタイムに採取する採取ステップと、
採取した前記即時レプリケーション性能情報を状態管理ファイルに出力して保存する保存ステップと、
前記状態管理ファイルに出力された前記即時レプリケーション性能情報を前記即時レプリケーション性能の前記許容値と比較することにより前記即時レプリケーション性能の低下した監視対象ノードを特定する状態監視ステップと、
前記許容値を超過したノードに対する前記即時レプリケーションの機能を停止させることにより発生する前記即時レプリケーションの遅延という局所障害がローカルサイトでサービスを提供している大量データ処理および並列処理のトランザクション処理に与える影響を最小限にして、前記局所障害がシステム全体のスローダウンにつながるのを事前に防止する防止ステップとを前記データベースの即時レプリケーション性能監視システムに実行させる
ことを特徴とするデータベースの即時レプリケーション性能監視プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004108518A JP2005293325A (ja) | 2004-03-31 | 2004-03-31 | データベースの即時レプリケーション性能監視システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004108518A JP2005293325A (ja) | 2004-03-31 | 2004-03-31 | データベースの即時レプリケーション性能監視システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005293325A true JP2005293325A (ja) | 2005-10-20 |
Family
ID=35326174
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004108518A Pending JP2005293325A (ja) | 2004-03-31 | 2004-03-31 | データベースの即時レプリケーション性能監視システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005293325A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008304963A (ja) * | 2007-06-05 | 2008-12-18 | Hitachi Ltd | 計算機システムまたは計算機システムの性能管理方法 |
US8479036B2 (en) | 2010-08-18 | 2013-07-02 | International Business Machines Corporation | Disaster recovery replication throttling in deduplication systems |
US9152645B2 (en) | 2009-03-27 | 2015-10-06 | Nec Corporation | Distributed object management system, distributed object management server, distributed object management method and computer program of the same |
JP2018181038A (ja) * | 2017-04-17 | 2018-11-15 | 富士通株式会社 | 管理プログラム、管理装置および管理方法 |
-
2004
- 2004-03-31 JP JP2004108518A patent/JP2005293325A/ja active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008304963A (ja) * | 2007-06-05 | 2008-12-18 | Hitachi Ltd | 計算機システムまたは計算機システムの性能管理方法 |
US9152645B2 (en) | 2009-03-27 | 2015-10-06 | Nec Corporation | Distributed object management system, distributed object management server, distributed object management method and computer program of the same |
US8479036B2 (en) | 2010-08-18 | 2013-07-02 | International Business Machines Corporation | Disaster recovery replication throttling in deduplication systems |
US8484503B2 (en) | 2010-08-18 | 2013-07-09 | International Business Machines Corporation | Disaster recovery replication throttling in deduplication systems |
JP2018181038A (ja) * | 2017-04-17 | 2018-11-15 | 富士通株式会社 | 管理プログラム、管理装置および管理方法 |
US10725847B2 (en) | 2017-04-17 | 2020-07-28 | Fujitsu Limited | Management apparatus and management method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3253883B2 (ja) | プロセスリスタート方法及びプロセス監視装置 | |
US6035415A (en) | Fault-tolerant processing method | |
CN107769943B (zh) | 一种主备集群切换的方法和设备 | |
US20080288812A1 (en) | Cluster system and an error recovery method thereof | |
US8060478B2 (en) | Storage system and method of changing monitoring condition thereof | |
CN110071821A (zh) | 备用节点的指定 | |
US9037905B2 (en) | Data processing failure recovery method, system and program | |
US7925922B2 (en) | Failover method and system for a computer system having clustering configuration | |
US7478273B2 (en) | Computer system including active system and redundant system and state acquisition method | |
EP1672501A2 (en) | Fault tolerant duplex computer system and its control method | |
JP2005293325A (ja) | データベースの即時レプリケーション性能監視システム | |
CN111694894A (zh) | 对数据同步进行监控的方法、服务器、设备和存储介质 | |
JP2001331330A (ja) | プロセス異常検知及び復旧システム | |
JPH0784807A (ja) | バッファ管理装置および方法 | |
US8478954B2 (en) | Prioritizing subgroups in a consistency group | |
CN110321261B (zh) | 一种监控系统及监控方法 | |
US20070113033A1 (en) | Apparatus and method for controlling data copy services | |
JP2008003646A (ja) | 不良モジュール検出方法および信号処理装置 | |
JP2007272328A (ja) | コンピュータ・システム | |
JP3335779B2 (ja) | プラント性能監視システム | |
JP2003036210A (ja) | エージェントプログラム監視方法及びエージェントプログラム監視システム並びにエージェント監視プログラム | |
JP3487440B2 (ja) | 共有メモリアクセス方式 | |
JPH08235009A (ja) | 自動システム縮退検出方法 | |
JP2853265B2 (ja) | クラッシュ処理方法 | |
JPH02310755A (ja) | ヘルスチェック方式 |