JP2013246611A - バックアップボリュームの回復処理システム、回復処理方法及び回復処理プログラム - Google Patents

バックアップボリュームの回復処理システム、回復処理方法及び回復処理プログラム Download PDF

Info

Publication number
JP2013246611A
JP2013246611A JP2012119475A JP2012119475A JP2013246611A JP 2013246611 A JP2013246611 A JP 2013246611A JP 2012119475 A JP2012119475 A JP 2012119475A JP 2012119475 A JP2012119475 A JP 2012119475A JP 2013246611 A JP2013246611 A JP 2013246611A
Authority
JP
Japan
Prior art keywords
error
error code
fatal
volume
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012119475A
Other languages
English (en)
Inventor
Takefumi Katayama
武文 片山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Systems Ltd
Original Assignee
Hitachi Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Systems Ltd filed Critical Hitachi Systems Ltd
Priority to JP2012119475A priority Critical patent/JP2013246611A/ja
Publication of JP2013246611A publication Critical patent/JP2013246611A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】短時間でエラー検知及びシステム復元を行うこと。
【解決手段】システムの致命的コードを含む自動復元実行条件を格納するエラーコード情報管理ファイル108と、エラー発生を通知するクライアント情報を格納する通知クライアント情報管理ファイル109と、一時的情報保持用のメモリ101と、エラーコード情報管理ファイル108から致命的コードを読込むエラーコード読込機能部103と、発生したエラーコードとエラー情報出力ファイル107の出力内容を比較判定するエラーコード判定機能部104と、バックアップボリューム112をマスタボリューム111に復元するボリューム復元機能部105とを設け、システムからのエラーログを順次読込み、復元が必要となる致命的エラーが発生したと判定したとき、システムを強制停止してデータ復元し、システムを再起動するバックアップボリュームの回復処理システム。
【選択図】図1

Description

本発明は、コンピュータシステムのデータをバックアップしたバックアップボリュームを容易に回復・復元することができるバックアップボリュームの回復処理システム、回復処理方法及び回復処理プログラムに係り、特に、ソフトウェアのバージョンアップにより致命的なエラーが発生した場合に人的判断を介さずに短時間でバックアップボリュームを容易に回復・復元することができるバックアップボリュームの回復処理システム、回復処理方法及び回復処理プログラムに関する。
近年のコンピュータシステムは、処理中のデータを外部記憶装置のマスタボリュームに格納すると共に、該マスタボリュームに格納したデータをバックアップ用のバックアップボリュームに格納することが行われており、マスタボリュームに格納したデータを処理中に何らかの障害が発生してエラーが発生した場合、前記バックアップボリュームに格納したデータをマスタボリュームにリストアする回復(復元)処理が行われるように構成されている。
なお、前述の回復処理に関する技術が記載された文献としては下記の特許文献1が挙げられ、この特許文献1には、ジョブの実行開始時・実行終了時・入出力情報取得処理時にイベント発生処理を呼出し、ジョブ開始イベント、ジョブ終了イベント、クローズイベントを発生させ、監視処理がこれらイベントに基づいて各ジョブにつき終了コード・開始時刻・終了時刻・実行時間・入出力履歴等からなる実行履歴を作成し、障害発生時に障害支援処理機能が、実行履歴と正常な実行に基づく標準履歴を比較し、入出力回数・実行時間・終了コードの異常を調べ、異常フラグを実行履歴に格納し、異常の発生したジョブを障害原因ジョブとし、ファイルルの回復や再割り当てを行った後、再実行指示を行うことによって、コンピュータシステムにおける障害の発生に対する障害回復時間を短縮する技術が記載されている。
特開平10−78894号公報
前述の特許文献1に記載の技術は、障害の発生に対して障害回復時間を短縮することができるものの、システムのバージョンアップ等によりプログラムを入れ替え、この入れ替えたプログラムの不具合によりバックアップから旧プログラムの復元が必要となる致命的なエラーが生じた場合、エラーコードの内容に対する復元要否の人的判断を行った後に復元処理が行なわれていたため、エラー発生から復元了までの間の回復時間が冗長になり、かつ、クライアントユーザに復元の連絡が伝わるまでの間に処理された業務処理を復元後に再度処理する必要があるという課題があった。
また、特許文献1に記載の技術は、ジョブ毎に診断制御処理を記述する必要があるため、新規ジョブ追加の都度に対応作業が発生し、計算機と監視コンピュータ間のネットワーク間に障害が発生している場合、診断機能が動かなくなるという課題があった。
本発明の目的は、前述の従来技術による課題を解決しようとするものであり、明らかにバックアップボリュームからの復元が必要となる致命的エラーが発生した場合、人的判断を介さず短時間でネットワークに依存せずに検知及び復元を行うことができるバックアップボリュームの回復処理システム、回復処理方法及び回復処理プログラムを提供することである。
さらに、本発明の目的は、前記目的に加え、ボリューム復元後に速やかにクライアントユーザコンピュータにプログラムの入れ替え発生によるエラーを通知することができるバックアップボリュームの回復処理システム、回復処理方法及び回復処理プログラムを提供することである。
前記目的を達成するため本発明は、データを格納するマスタボリューム及び該マスタボリュームデータのバックアップとリストアを行うバックアップボリュームを有する外部記憶装置並びにクライアントに接続され、前記マスタボリュームに格納したデータ処理を実行し、エラー発生時にエラーコードを含むエラーログを発生するコンピュータシステムのバックアップボリュームの回復処理システムであって、
前記コンピュータシステムの動作に致命的なエラーコードを示す致命的コードと該致命的コードが所定回数以上発生したときに自動復元を実行する条件である発生数を表す発生回数と前記致命的コードが所定時間間隔内に発生したときに自動復元を実行する条件である時間間隔を表す発生間隔とを含むエラーコード情報を格納するエラーコード情報管理ファイルと、前記エラー発生を通知するクライアント情報を格納する通知クライアント情報管理ファイルと、一時的な情報を保持するメモリと、前記エラーコード情報管理ファイルから致命的コードを読込むエラーコード読込機能部と、発生したエラーコードと前記エラー情報出力ファイルの出力内容を比較判定するエラーコード判定機能部と、前記外部記憶装置のバックアップボリュームデータをマスタボリュームに復元するボリューム復元機能部と備え、
前記エラーコード読込機能部が、前記エラーコード情報管理ファイルのエラーコード情報を読込み、メモリ上に展開する工程と、
前記エラーコード判定機能部が、前記エラーログファイルを順次読込み、復元が必要となる致命的エラーの発生有無を判定する工程と、
前記ボリューム復元機能部が、前記コンピュータシステムを強制停止してバックアップボリュームをマスタボリュームに復元し、前記コンピュータシステムを起動する工程とを実行することを第1の特徴とする。
また、本発明は、前記第1の特徴のバックアップボリュームの回復処理システムにおいて、前記エラーコード判定機能部が、復元が必要となる致命的エラーの発生有無を判定するとき、前記エラーコード情報管理ファイルに格納されたエラーコード情報と前記発生したエラーコードの回数及び時間間隔とを比較し、前記発生したエラーコードの回数又は時間間隔が前記エラーコード情報管理ファイルに格納された発生回数又は発生間隔を越えたとき、復元が必要となる致命的エラーと判定することを第2の特徴とし、前記何れかの特徴のバックアップボリュームの回復処理システムにおいて、前記コンピュータシステムが、前記クライアントに障害発生通知をエラー情報出力ファイルとして出力するクライアント通知機能部を備え、該クライアント通知機能部が、通知クライアント情報管理ファイルに定義されたクライアントに通知メッセージを送信する工程とを実行することを第3の特徴とする。
更に、本発明は、データを格納するマスタボリューム及び該マスタボリュームデータのバックアップとリストアを行うバックアップボリュームを有する外部記憶装置並びにクライアントに接続され、前記マスタボリュームに格納したデータ処理を実行し、エラー発生時にエラーコードを発生し、動作に致命的なエラーコードを示す致命的コードと該致命的コードが所定回数以上発生したときに自動復元を実行する条件である発生数を表す発生回数と前記致命的コードが所定時間間隔内に発生したときに自動復元を実行する条件である時間間隔を表す発生間隔とを含むエラーコード情報を格納するエラーコード情報管理ファイルと、前記エラー発生を通知するクライアント情報を格納する通知クライアント情報管理ファイルと、一時的な情報を保持するメモリと、前記エラーコード情報管理ファイルから致命的コードを読込むエラーコード読込機能部と、発生したエラーコードと前記エラー情報出力ファイルの出力内容を比較判定するエラーコード判定機能部と、前記外部記憶装置のバックアップボリュームデータをマスタボリュームに復元するボリューム復元機能部とを備えたコンピュータシステムのバックアップボリュームの回復処理方法であって、
前記エラーコード読込機能部に、前記エラーコード情報管理ファイルのエラーコード情報を読込み、メモリ上に展開する工程と、
前記エラーコード判定機能部に、前記エラーログファイルを順次読込み、復元が必要となる致命的エラーの発生有無を判定する工程と、
前記ボリューム復元機能部に、前記コンピュータシステムを強制停止してバックアップボリュームをマスタボリュームに復元し、前記コンピュータシステムを起動する工程とを実行させることを第4の特徴とする。
また、本発明は、前記第4の特徴のバックアップボリュームの回復処理方法において、前記エラーコード判定機能部に、復元が必要となる致命的エラーの発生有無を判定するとき、エラーコード情報管理ファイルに格納されたエラーコード情報と前記発生したエラーコードの回数及び時間間隔とを比較し、前記発生したエラーコードの回数又は時間間隔が前記エラーコード情報管理ファイルに格納された発生回数又は発生間隔を越えたとき、復元が必要となる致命的エラーと判定させることを第5の特徴とし、前記何れかの特徴のバックアップボリュームの回復処理方法において、前記コンピュータシステムに、前記クライアントに障害発生通知をエラー情報出力ファイルとして出力するクライアント通知機能部を設け、該クライアント通知機能部に、通知クライアント情報管理ファイルに定義されたクライアントに通知メッセージを送信する工程とを実行させることを第6の特徴とする。
また、本発明は、データを格納するマスタボリューム及び該マスタボリュームデータのバックアップとリストアを行うバックアップボリュームを有する外部記憶装置並びにクライアントに接続され、前記マスタボリュームに格納したデータ処理を実行し、エラー発生時にエラーコードを発生し、動作に致命的なエラーコードを示す致命的コードと該致命的コードが所定回数以上発生したときに自動復元を実行する条件である発生数を表す発生回数と前記致命的コードが所定時間間隔内に発生したときに自動復元を実行する条件である時間間隔を表す発生間隔とを含むエラーコード情報を格納するエラーコード情報管理ファイルと、前記エラー発生を通知するクライアント情報を格納する通知クライアント情報管理ファイルと、一時的な情報を保持するメモリとを備えたコンピュータシステムのバックアップボリュームの回復処理プログラムであって、
前記回復処理プログラムに、
前記エラーコード情報管理ファイルのエラーコード情報を読込み、メモリ上に展開するエラーコード読込工程と、
前記エラーログファイルを順次読込み、復元が必要となる致命的エラーの発生有無を判定するエラーコード判定工程と、
前記コンピュータシステムを強制停止してバックアップボリュームをマスタボリュームに復元し、前記コンピュータシステムを起動するボリューム復元工程とを実行させることを第7の特徴とする。
また、本発明は、前記第7の特徴のバックアップボリュームの回復処理方法において、前記回復処理プログラムに、前記復元が必要となる致命的エラーの発生有無を判定するエラーコード判定工程において、前記エラーコード情報管理ファイルに格納されたエラーコード情報と前記発生したエラーコードの回数及び時間間隔とを比較し、前記発生したエラーコードの回数又は時間間隔が前記エラーコード情報管理ファイルに格納された発生回数又は発生間隔を越えたとき、復元が必要となる致命的エラーと判定させることを第8の特徴とし、前記何れかの特徴のバックアップボリュームの回復処理プログラムにおいて、前記コンピュータシステムに、前記クライアントに障害発生通知をエラー情報出力ファイルとして出力するクライアント通知機能部を設け、前記回復処理プログラムに、通知クライアント情報管理ファイルに定義されたクライアントに通知メッセージを送信する工程を実行させることを第9の特徴とする。
本発明によるバックアップボリュームの回復処理システム、回復処理方法及び回復処理プログラムは、コンピュータシステムの動作に致命的なエラーコードを示す致命的コードと該致命的コードが所定回数以上発生したときに自動復元を実行する条件である発生数を表す発生回数と前記致命的コードが所定時間間隔内に発生したときに自動復元を実行する条件である時間間隔を表す発生間隔とを含むエラーコード情報を格納するエラーコード情報管理ファイルと、前記エラー発生を通知するクライアント情報を格納する通知クライアント情報管理ファイルと、一時的な情報を保持するメモリと、前記エラーコード情報管理ファイルから致命的コードを読込むエラーコード読込機能部と、発生したエラーコードと前記エラー情報出力ファイルの出力内容を比較判定するエラーコード判定機能部と、前記外部記憶装置のバックアップボリュームデータをマスタボリュームに復元するボリューム復元機能部とを設け、前記エラーコード読込機能部が、エラーコード情報管理ファイルを読込み、メモリ上に展開する工程と、前記エラーコード判定機能部が、エラーログファイルを順次読込み、復元が必要となる致命的エラーの発生有無を判定する工程と、前記ボリューム復元機能部が、前記コンピュータシステムを強制停止してバックアップボリュームをマスタボリュームに復元し、前記コンピュータシステムを起動する工程とを実行することによって、短時間でネットワークに依存せずに検知及び復元を行うことができる。
本発明の実施形態によるバックアップボリュームの回復処理システムの全体構成を示す図。 本実施形態による回復処理の全体処理を示すフロー図。 本実施形態によるボリューム復元処理を示すフロー図。 本実施形態によるクライアント通知機能を示すフロー図。 本実施形態によるエラーコード情報管理ファイルを示す図。 本実施形態による通知クライアント情報管理ファイルを示す図。 本実施形態によるエラー情報出力ファイルのサンプルを示す図。
以下、本発明によるバックアップボリュームの回復処理方法及び回復処理プログラムを実行する回復処理システムの一実施形態を図面を参照して詳細に説明する。
[構成]
本実施形態によるバックアップボリュームの回復処理システム102は、図1に示す如く、マスタボリューム111及びバックアップボリューム112を有する外部記憶装置114及びクライアント(コンピュータ)110に接続され、データ処理を実行するサーバ113内上に構成され、システム的に致命的なエラーコード他を含むエラーコード情報を格納するエラーコード情報管理ファイル108と、エラー報告を行うクライアントの情報を格納する通知クライアント情報管理ファイル109と、一時的な情報を保持するメモリ101と、前記エラーコード情報管理ファイル108からエラーコード情報を読込むエラーコード読込機能部103と、システムから報告されるエラーコードと前記エラーコード情報管理ファイル108のエラーコード情報とを比較してシステムにとって致命的エラーか否かを判定するエラーコード判定機能部104と、前記外部記憶装置114内にあるバックアップボリューム112をマスタボリューム111に復元するボリューム復元機能部105と、前記クライアント110に障害発生通知をエラー情報出力ファイル107として出力するクライアント通知機能部106とを備え、前記マスタボリューム111は、対象システムの稼動に必要なPP(Program Product:パッケージソフトウェア)とAPP(アプリケーションプログラム)と各種データを格納するDB(データベース)を格納するように構成されている。
前記エラーコード情報管理ファイル108は、図5(a)に示す如く、致命的なエラーが発生した際にエラーログに出力されるエラーコードである致命的コードと、該致命的コードがエラーログに指定数出力された場合に自動復旧を行う回数である発生回数と、前記致命的コードがエラーログに指定した間隔(秒)以内に再出力された場合に自動復旧を行う致命的コード発生間隔(2回以上が指定された場合以外は、本指定値は無視される)とを含むエラーコード情報の各項目情報とから構成され、例えば、図5(b)に示す如く、致命的コードが「IXWI−E」の致命的エラーの発生回数が「1」回且つ発生間隔が「−」(なし)であり、致命的コード「IXWD−E」の致命的エラーの発生回数が「1」回且つ発生間隔が「−」(なし)、致命的コード「IXWA−E」の致命的エラーの発生回数が「3」回且つ発生間隔が「60」(秒)であり、致命的コード「IXWP−E」の致命的エラーの発生回数が「10」回且つ発生間隔が「180」(秒)の如く格納される。
即ち、このエラーコード情報管理ファイル108は、コンピュータシステムの動作に致命的なエラーコードを示す致命的コードと、前記致命的コードが所定回数以上発生したときに自動復元を実行する条件である発生数を表す発生回数と、前記致命的コードが所定時間間隔内に発生したときに自動復元を実行する条件である時間間隔を表す発生間隔とのエラーコード情報を格納し、図示した例では、致命的コードが「IXWI−E」又は「IXWD−E」は1回発生のみで自動復元を行う条件や、致命的コード「IXWA−E」は60秒内に3回発生した際に自動復元を行う条件や、致命的コード「IXWP−E」は180秒内に10回発生した際に自動復元を行う条件が格納されている。
前記通知クライアント情報管理ファイル109は、図6(a)に示す如く、メッセージを送信する通知対象のIPアドレスと、前記IPアドレスにて指定した宛先への成功したメッセージ送信の最終時刻を示す送信時刻との各項目情報とから構成され、具体的には、図6(b)に示す如く、IPアドレス「172016128001」の送信時刻が「2010/7/28/10:30」、IPアドレス「172016128002」の送信時刻が「−」(未送信)、IPアドレス「172016128003」の送信時刻が「−」(未送信)の如く格納され、これら項目に加えてIPアドレスにて指定した宛先に通知メッセージを送信する回数を含めても良い。
前記エラー情報出力ファイル107の内容は、例えば、図7に示す如く、発生日時刻を表す発生時刻エリアと、発生したエラーのエラーコードと、該エラーメッセージ内容の各項目とからなり、図示の例では、例えば、発生時刻エリア「2011/1/5 01:03:48」に発生したエラーコードが「IXWI−I」であり、メッセージ内容が「Application information Normal Start Complete」の如く、APPの障害コードおよび発生時刻が発生時刻の昇順で出力される。
[動作]
さて、前述のように構成されたバックアップボリュームの回復処理システム102の全体動作は、図2に示す如く、前記エラーコード情報管理ファイル108に格納された致命的コードと発生回数と発生間隔とを含むエラーコード情報の1レコードを読込み、この読込みレコードをメモリ上の構造体配列に格納するステップS201と、処理開始時点のシステム時刻をメモリ上の最終読込み時刻エリア217に格納するステップS202と、メモリ上の最終読込み時刻エリア218の値を読込むステップS203と、エラー情報出力ファイル107から発生時刻が前記ステップS203で読込んだ時刻以降、且つ最も古い時刻である条件を満たすログを読込むステップS204と、該ステップ204にて条件(発生時刻がステップS203で読込んだ時刻以降、且つ最も古い時刻である条件)に合致するログが存在するか否かを判定し、該当するログが存在しないと判定したときに前記ステップS203に戻るステップS205と、該ステップ205において該当するログが存在すると判定したとき、前記ステップS205にて読込んだログのエラーコードがステップS201にて作成した構造体の致命的コード列部のいずれかのレコードに合致するか判定し、合致しないと判定したときに後述のステップS207に移行するステップS206とを実行する。
次いで、本システムは、前記ステップ206においてエラーコードがステップS201にて作成した構造体の致命的コード列部のいずれかのレコードに合致すると判定したとき、致命的コード列が一致したレコードの致命的コード発生間隔に値が設定されているか否かを判定するステップS208と、該ステップ208において発生間隔の指定があると判定したとき、メモリ上の前回発生時刻エリア220の値を読込むステップS209と、前記ステップS205にて読込んだログの発生時刻でメモリ上の前回発生時刻エリア221を更新するステップS210と、前記ステップS205にて読込んだログの発生時刻とステップS209の読込み結果との時刻差が前記ステップS208にて判定した発生間隔より大きいか否かを判定し、時刻差が発生間隔より大きくないと判定したときに前記ステップS207に移行するステップS211と、前記ステップS208において発生間隔の指定がないと判定したとき又は前記ステップS211において時刻差が発生間隔より大きいと判定したとき、メモリ上の累積回数エリア222の値に「1」を加算するステップS212と、前記ステップS212の加算結果が前記ステップS206にて致命的コード列が一致したレコードの発生回数列の設定値と同一か否かを判定し、同一でないときに前記ステップS207に移行するステップS213と、前記ステップS206又はステップS211又はステップS213の条件に一致しないと判定したときに最終読み込み時刻エリア218に読み込んだ出力時刻を更新して前記ステップS205に戻るステップS207とを実行することによって、予め指定した致命的エラーが所定回数以上発生したことを検出するまで、エラーコードの判定処理を継続するように動作する。
次いで本実施形態によるバックアップボリュームの回復処理システム102は、前記ステップS213において、前記ステップS212の加算結果が前記ステップS206にて致命的コード列が一致したレコードの発生回数列の設定値と同一と判定したとき、即ち、致命的エラーが所定時間内に所定回数だけ発生したと判定したとき、ボリューム復元処理を行うステップS214と、クライアント通知機能を行うステップS215を実行するものであって、これら処理を次に説明する。
前述したボリューム復元処理のステップS214は、図3に示す如く、APPの全サービスを強制停止するコマンドを順次発行し、APPを完全停止するステップS301と、全PPのサービスを強制停止するコマンドを順次発行し、PPを完全停止するステップS302と、バックアップボリューム112のマスタボリューム111への復元コマンドを発行し、マスタボリューム111を復元するステップS303と、全PPのサービスを起動するコマンドを順次発行し、PPを起動するステップS304と、APPの全サービスを起動するコマンドを順次発行し、APPを完全起動するステップS305とを実行することによって行われる。
前述したクライアント通知機能を行うステップS215は、図4に示す如く、クライアント通知機能部106が、通知クライアント情報管理ファイル109を読込み、読込みレコードをメモリ上の構造体配列に格納するステップS401と、変数iが構造体配列数より大きいときには処理を終了し、構造体配列数以下の場合は後述するステップS403からステップS408とを繰り返す処理を実行するステップS402と、構造体配列の変数i行目のIPアドレス列設定値に対して、OSのpingコマンドを発行するステップS403と、前記ステップS403にて実行したコマンドの応答が帰ってきたか否かを判定し、応答無しと判定したときに後述するステップS407に移行するステップS404と、該ステップS404において実行したコマンドの応答が帰ってきたと判定したとき、構造体配列の変数i行目のIPアドレス列設定値に対して、OSのnet sendコマンド(メッセージ送信コマンド)を発行するステップS405と、通知クライアント情報管理ファイル109のi行目の送信時刻列に、現在時刻を書込むステップS406と、変数iの値に1を加算するステップS407とを実行する。
このように本実施形態による回復処理方法及び回復処理プログラムを実行するバックアップボリュームの回復処理システム102は、エラーコード情報管理ファイル108に復元が必要となる致命的エラー対象を定義する工程と、通知クライアント情報管理ファイル109に通知が必要となるクライアント対象を定義する工程と、エラー読込機能部103が、エラーコード情報管理ファイルを読込み、メモリ上に展開する工程と、エラーコード判定機能部104が、APPの出力するエラーログファイルを順次読込み、復元が必要となる致命的エラーの発生有無を判定する工程と、致命的エラーが発生したと判定したとき、ボリューム復元機能部105が、業務APPおよびPPを強制停止してバックアップボリュームをマスタボリュームに復元し、業務APPおよびPPを起動する工程と、クライアント通知機能部106が、通知クライアント情報管理ファイル109に定義されたクライアントに通知メッセージを送信する工程とを実行することによって、高速な自動復元が可能となり、更に、復旧前のクライアントからの処理要求をエラー発生以降抑止することができる。
101 メモリ、102 回復処理システム、103 エラーコード読込機能部、
104 エラーコード判定機能部、105 ボリューム復元機能部、
106 クライアント通知機能部、107 エラー情報出力ファイル、
108 エラーコード情報管理ファイル、
109 通知クライアント情報管理ファイル、110 クライアント、
111 マスタボリューム、112 バックアップボリューム、113 サーバ、
114 外部記憶装置

Claims (9)

  1. データを格納するマスタボリューム及び該マスタボリュームデータのバックアップとリストアを行うバックアップボリュームを有する外部記憶装置並びにクライアントに接続され、前記マスタボリュームに格納したデータ処理を実行し、エラー発生時にエラーコードを含むエラーログを発生するコンピュータシステムのバックアップボリュームの回復処理システムであって、
    前記コンピュータシステムの動作に致命的なエラーコードを示す致命的コードと該致命的コードが所定回数以上発生したときに自動復元を実行する条件である発生数を表す発生回数と前記致命的コードが所定時間間隔内に発生したときに自動復元を実行する条件である時間間隔を表す発生間隔とを含むエラーコード情報を格納するエラーコード情報管理ファイルと、前記エラー発生を通知するクライアント情報を格納する通知クライアント情報管理ファイルと、一時的な情報を保持するメモリと、前記エラーコード情報管理ファイルから致命的コードを読込むエラーコード読込機能部と、発生したエラーコードと前記エラー情報出力ファイルの出力内容を比較判定するエラーコード判定機能部と、前記外部記憶装置のバックアップボリュームデータをマスタボリュームに復元するボリューム復元機能部と備え、
    前記エラーコード読込機能部が、前記エラーコード情報管理ファイルのエラーコード情報を読込み、メモリ上に展開する工程と、
    前記エラーコード判定機能部が、前記エラーログファイルを順次読込み、復元が必要となる致命的エラーの発生有無を判定する工程と、
    前記ボリューム復元機能部が、前記コンピュータシステムを強制停止してバックアップボリュームをマスタボリュームに復元し、前記コンピュータシステムを起動する工程とを実行することを特徴とするバックアップボリュームの回復処理システム。
  2. 前記エラーコード判定機能部が、復元が必要となる致命的エラーの発生有無を判定するとき、前記エラーコード情報管理ファイルに格納されたエラーコード情報と前記発生したエラーコードの回数及び時間間隔とを比較し、前記発生したエラーコードの回数又は時間間隔が前記エラーコード情報管理ファイルに格納された発生回数又は発生間隔を越えたとき、復元が必要となる致命的エラーと判定することを特徴とする請求項1記載のバックアップボリュームの回復処理システム。
  3. 前記コンピュータシステムが、前記クライアントに障害発生通知をエラー情報出力ファイルとして出力するクライアント通知機能部を備え、該クライアント通知機能部が、通知クライアント情報管理ファイルに定義されたクライアントに通知メッセージを送信する工程とを実行することを特徴とする請求項1又は2記載のバックアップボリュームの回復処理システム。
  4. データを格納するマスタボリューム及び該マスタボリュームデータのバックアップとリストアを行うバックアップボリュームを有する外部記憶装置並びにクライアントに接続され、前記マスタボリュームに格納したデータ処理を実行し、エラー発生時にエラーコードを発生し、動作に致命的なエラーコードを示す致命的コードと該致命的コードが所定回数以上発生したときに自動復元を実行する条件である発生数を表す発生回数と前記致命的コードが所定時間間隔内に発生したときに自動復元を実行する条件である時間間隔を表す発生間隔とを含むエラーコード情報を格納するエラーコード情報管理ファイルと、前記エラー発生を通知するクライアント情報を格納する通知クライアント情報管理ファイルと、一時的な情報を保持するメモリと、前記エラーコード情報管理ファイルから致命的コードを読込むエラーコード読込機能部と、発生したエラーコードと前記エラー情報出力ファイルの出力内容を比較判定するエラーコード判定機能部と、前記外部記憶装置のバックアップボリュームデータをマスタボリュームに復元するボリューム復元機能部とを備えたコンピュータシステムのバックアップボリュームの回復処理方法であって、
    前記エラーコード読込機能部に、前記エラーコード情報管理ファイルのエラーコード情報を読込み、メモリ上に展開する工程と、
    前記エラーコード判定機能部に、前記エラーログファイルを順次読込み、復元が必要となる致命的エラーの発生有無を判定する工程と、
    前記ボリューム復元機能部に、前記コンピュータシステムを強制停止してバックアップボリュームをマスタボリュームに復元し、前記コンピュータシステムを起動する工程とを実行させることを特徴とするバックアップボリュームの回復処理方法。
  5. 前記エラーコード判定機能部に、復元が必要となる致命的エラーの発生有無を判定するとき、エラーコード情報管理ファイルに格納されたエラーコード情報と前記発生したエラーコードの回数及び時間間隔とを比較し、前記発生したエラーコードの回数又は時間間隔が前記エラーコード情報管理ファイルに格納された発生回数又は発生間隔を越えたとき、復元が必要となる致命的エラーと判定させることを特徴とする請求項4記載のバックアップボリュームの回復処理方法。
  6. 前記コンピュータシステムに、前記クライアントに障害発生通知をエラー情報出力ファイルとして出力するクライアント通知機能部を設け、該クライアント通知機能部に、通知クライアント情報管理ファイルに定義されたクライアントに通知メッセージを送信する工程とを実行させることを特徴とする請求項4又は5記載のバックアップボリュームの回復処理方法。
  7. データを格納するマスタボリューム及び該マスタボリュームデータのバックアップとリストアを行うバックアップボリュームを有する外部記憶装置並びにクライアントに接続され、前記マスタボリュームに格納したデータ処理を実行し、エラー発生時にエラーコードを発生し、動作に致命的なエラーコードを示す致命的コードと該致命的コードが所定回数以上発生したときに自動復元を実行する条件である発生数を表す発生回数と前記致命的コードが所定時間間隔内に発生したときに自動復元を実行する条件である時間間隔を表す発生間隔とを含むエラーコード情報を格納するエラーコード情報管理ファイルと、前記エラー発生を通知するクライアント情報を格納する通知クライアント情報管理ファイルと、一時的な情報を保持するメモリとを備えたコンピュータシステムのバックアップボリュームの回復処理プログラムであって、
    前記回復処理プログラムに、
    前記エラーコード情報管理ファイルのエラーコード情報を読込み、メモリ上に展開するエラーコード読込工程と、
    前記エラーログファイルを順次読込み、復元が必要となる致命的エラーの発生有無を判定するエラーコード判定工程と、
    前記コンピュータシステムを強制停止してバックアップボリュームをマスタボリュームに復元し、前記コンピュータシステムを起動するボリューム復元工程とを実行させることを特徴とするバックアップボリュームの回復処理プログラム。
  8. 前記回復処理プログラムに、前記復元が必要となる致命的エラーの発生有無を判定するエラーコード判定工程において、前記エラーコード情報管理ファイルに格納されたエラーコード情報と前記発生したエラーコードの回数及び時間間隔とを比較し、前記発生したエラーコードの回数又は時間間隔が前記エラーコード情報管理ファイルに格納された発生回数又は発生間隔を越えたとき、復元が必要となる致命的エラーと判定させることを特徴とする請求項7記載のバックアップボリュームの回復処理プログラム。
  9. 前記コンピュータシステムに、前記クライアントに障害発生通知をエラー情報出力ファイルとして出力するクライアント通知機能部を設け、前記回復処理プログラムに、通知クライアント情報管理ファイルに定義されたクライアントに通知メッセージを送信する工程を実行させることを特徴とする請求項7又は8記載のバックアップボリュームの回復処理プログラム。
JP2012119475A 2012-05-25 2012-05-25 バックアップボリュームの回復処理システム、回復処理方法及び回復処理プログラム Pending JP2013246611A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012119475A JP2013246611A (ja) 2012-05-25 2012-05-25 バックアップボリュームの回復処理システム、回復処理方法及び回復処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012119475A JP2013246611A (ja) 2012-05-25 2012-05-25 バックアップボリュームの回復処理システム、回復処理方法及び回復処理プログラム

Publications (1)

Publication Number Publication Date
JP2013246611A true JP2013246611A (ja) 2013-12-09

Family

ID=49846330

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012119475A Pending JP2013246611A (ja) 2012-05-25 2012-05-25 バックアップボリュームの回復処理システム、回復処理方法及び回復処理プログラム

Country Status (1)

Country Link
JP (1) JP2013246611A (ja)

Similar Documents

Publication Publication Date Title
US10884837B2 (en) Predicting, diagnosing, and recovering from application failures based on resource access patterns
US20200007620A1 (en) Intelligent Backup and Recovery of Cloud Computing Environment
JP5075736B2 (ja) 仮想サーバのシステム障害回復方法及びそのシステム
CN107660289B (zh) 自动网络控制
US7870424B2 (en) Parallel computer system
US8589727B1 (en) Methods and apparatus for providing continuous availability of applications
JP5183542B2 (ja) 計算機システム及び設定管理方法
EP3147797B1 (en) Data management method, node and system for database cluster
CN109558260B (zh) Kubernetes故障排除系统、方法、设备及介质
US8468386B2 (en) Detecting and recovering from process failures
JP6558037B2 (ja) 運用管理プログラム、運用管理方法、および運用管理装置
EP3591530A1 (en) Intelligent backup and recovery of cloud computing environment
EP2940540B1 (en) Power system monitoring and control system
TW201510995A (zh) 維護電腦系統之檔案系統的方法
JP2013246611A (ja) バックアップボリュームの回復処理システム、回復処理方法及び回復処理プログラム
CN111090491B (zh) 虚拟机任务状态的恢复方法、装置及电子设备
JP7263206B2 (ja) 情報処理システム、情報処理システムの制御方法、情報処理装置、及びプログラム
JP5812512B2 (ja) データベースシステム、マスタースレーブ管理方法およびマスタースレーブ管理プログラム
CN105677515A (zh) 一种数据库联机备份方法及系统
CN112231063A (zh) 一种故障处理方法及装置
JP5533466B2 (ja) パラメタ管理装置、パラメタ管理方法およびパラメタ管理プログラム
JP7180319B2 (ja) 情報処理装置、及び情報処理装置のダンプ管理方法
CN111625420B (zh) 一种分布式训练任务处理方法、装置、设备及存储介质
CN110569120B (zh) 一种定时任务的处理方法和装置
CN114443370A (zh) 一种数据还原方法、装置、介质