JP2010002979A - 情報処理装置、情報処理方法、およびプログラム - Google Patents

情報処理装置、情報処理方法、およびプログラム Download PDF

Info

Publication number
JP2010002979A
JP2010002979A JP2008159139A JP2008159139A JP2010002979A JP 2010002979 A JP2010002979 A JP 2010002979A JP 2008159139 A JP2008159139 A JP 2008159139A JP 2008159139 A JP2008159139 A JP 2008159139A JP 2010002979 A JP2010002979 A JP 2010002979A
Authority
JP
Japan
Prior art keywords
normal state
quasi
information processing
determined
recovery
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008159139A
Other languages
English (en)
Other versions
JP5298657B2 (ja
Inventor
Masa Sato
雅 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008159139A priority Critical patent/JP5298657B2/ja
Publication of JP2010002979A publication Critical patent/JP2010002979A/ja
Application granted granted Critical
Publication of JP5298657B2 publication Critical patent/JP5298657B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Test And Diagnosis Of Digital Computers (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】情報処理装置において、障害の迅速な復旧または通知を低コストで可能にする技術を提供する。
【解決手段】情報処理装置は、所定の処理を実行する前に、自身が処理を障害なく実行できる状態である、正常状態にあるか否かを判断する正常状態判断手段と、正常状態にないと判断されたのであれば、自身が正常状態に復旧することができる状態である、準正常状態であるか否かを判断する準正常状態判断手段と、準正常状態にあると判断されたならば、自身を正常状態に復旧する復旧手段と、準正常状態にないと判断されたのであれば、自身に異常がある旨を出力する出力手段と、正常状態にあると判断された場合、又は正常状態に復旧された場合、処理を実行する実行手段と、を有する。
【選択図】図1

Description

本発明は、情報処理装置において障害による被害の拡大を防止する技術に関する。
トランザクション処理などの所定の処理を実行する情報処理装置において、予期せぬ障害によりシステムダウンが発生することがある。このシステムダウンを起した情報処理装置が自動復旧すればよいが、自動復旧しないこともある。システムダウンが生じたときに自動復旧しなくても情報処理装置が異常を通知すれば、オペレータが手動で復旧作業を行うことができる。
ところが、システムダウンにより強制的に実行中の処理が中断されるので、情報処理装置が異常を外部に通知することすらできない場合がある。異常の通知や自動復旧ができない場合は、障害が発生した装置に更に次の処理を実行させることによる多重障害が生じうる。
例えば、ある処理の結果に基づいて以降の処理を実行する場合、その処理の結果がシステムダウンにより破壊されていると、以降の処理にも連鎖的に障害が生じてしまう。
このような多重障害を防ぐため、特許文献1に記載の通信システムは、監視装置が中継局を監視し、中継局の障害を検知したとき、その監視装置が、障害が生じた中継局の復旧を行うことで、障害を早期に復旧させる。
そして、特許文献2に記載の通信システムは、基地局制御装置が基地局の障害を検知したとき、その基地局制御装置が、障害が生じた基地局の復旧を行う構成としている。
特開2001−86074号公報 特開2003−78938号公報
しかしながら、オペレータが手動で復旧作業を行う場合は、人件費などの運用コストが増大し、オペレータの人為的なミスも生じやすい。
また、特許文献1および特許文献2に記載の通信システムは、障害が発生した装置とは別途に、障害の監視および復旧のための装置を必要とするので、運用コストが増大する。
本発明の目的は、情報処理装置において、障害の迅速な復旧または通知を低コストで可能にする技術を提供することである。
上記目的を達成するために、本発明の情報処理装置は、所定の処理を実行する前に、自身が該処理を障害なく実行できる状態である、正常状態にあるか否かを判断する正常状態判断手段と、前記正常状態判断手段により前記正常状態にないと判断されたのであれば、自身が前記正常状態に復旧することができる状態である、準正常状態であるか否かを判断する準正常状態判断手段と、前記準正常状態判断手段により前記準正常状態にあると判断されたならば、自身を前記正常状態に復旧する復旧手段と、前記準正常状態判断手段により前記準正常状態にないと判断されたのであれば、自身に異常がある旨を出力する出力手段と、前記正常状態判断手段により前記正常状態にあると判断された場合、又は前記復旧手段により前記正常状態に復旧された場合、前記処理を実行する実行手段と、を有する。
本発明の情報処理方法は、所定の処理を実行する前に、自身が該処理を障害なく実行できる状態である、正常状態にあるか否かを判断し、前記正常状態にないと判断されたのであれば、自身が前記正常状態に復旧することができる状態である、準正常状態であるか否かを判断し、前記準正常状態にあると判断されたならば、自身を前記正常状態に復旧し、前記準正常状態にないと判断されたのであれば、自身に異常がある旨を出力し、前記正常状態にあると判断された場合、又は前記正常状態に復旧された場合、前記処理を実行する、情報処理方法である。
本発明のプログラムは、コンピュータに、所定の処理を実行する前に、自身が該処理を障害なく実行できる状態である、正常状態にあるか否かを判断する正常状態判断手順、前記正常状態判断手順により前記正常状態にないと判断されたのであれば、自身が前記正常状態に復旧することができる状態である、準正常状態であるか否かを判断する準正常状態判断手順、前記準正常状態判断手順により前記準正常状態にあると判断されたならば、自身を前記正常状態に復旧する復旧手順、前記準正常状態判断手順により前記準正常状態にないと判断されたのであれば、自身に異常がある旨を出力する出力手順、及び前記正常状態判断手段により前記正常状態にあると判断された場合、又は前記復旧手段により前記正常状態に復旧された場合、前記処理を実行する実行手順、を実行させるためのプログラムである。
本発明によれば、情報処理装置は、所定の処理を障害なく実行できる状態(正常状態)でなければ、正常状態に復旧できる状態(準正常状態)にあるか否かを判断し、準正常状態であれば、正常状態に復旧し、準正常状態でなければ、異常がある旨を出力し、正常状態にある場合又は復旧後に処理を実行する。このため、正常状態でなくとも、情報処理装置は外部の装置によらずに自ら正常状態に復旧するか、異常を通知するので、低コストで迅速な障害の復旧又は通知を行うことができる。
本発明を実施するための実施形態について図面を参照して詳細に説明する。
図1は、本実施形態の情報処理装置1の構成を示すブロック図である。図1を参照すると、情報処理装置1は、パーソナルコンピュータ、ATM(Automatic Teller Machine)などのコンピュータである。
情報処理装置1は、正常状態判断部11、準正常状態判断部13、リカバリ処理部15、オペレータ通知部17、およびトランザクション処理部19を有する。
正常状態判断部11は、スケジュール管理ファイル111、正常状態定義ファイル113、および異常検知プログラム115を有する。
図2は、スケジュール管理ファイル111の構成の一例を示す図である。スケジュール管理ファイル111は、情報処理装置1が行う情報処理のそれぞれについて、実行するタイミングを示す情報を含むファイルである。同図を参照すると、スケジュール管理ファイル111は、「実行タイミング」、「実行対象処理」、および「分類」を示す情報を含む。
「実行タイミング」は、「実行対象処理」を実行するタイミングであり、例えば、実行する時刻が設定される。「実行対象処理」は、「実行タイミング」で実行される処理である。「分類」は、「実行対象処理」の分類であり、例えば「前処理」、「主処理」、または「後処理」のいずれかが設定される。
「実行対象処理」の単位については、トランザクション処理やバッチ処理などに含まれるそれぞれの処理を1単位としてもよく、トランザクション処理等の複数の一連の処理を1つの単位としてもよい。また、独立して実行される個々の処理を一単位としてもよい。
例えば、「実行タイミング」が「10:00」(午前10時)のとき、「実行対象処理」として処理A1が実行され、その処理の「分類」は、「前処理」である。「実行タイミング」が「11:00」(午前11時)のときには、「実行対象処理」として処理A2が実行され、その処理の「分類」は、「主処理」である。
図3は、正常状態定義ファイル113の構成の一例を示す図である。正常状態定義ファイル113は、情報処理装置1の状態が正常状態であるか否かを判断するために使用するファイルである。「正常状態」とは、情報処理装置1が実行タイミングに対応する処理を障害なく実行できる状態である。
図3を参照すると、正常状態定義ファイル113は、「実行対象処理」と、「定義内容」を示す情報を含む。「定義内容」は、「実行対象処理」の実行タイミングにおける正常状態の定義である。例えば、正常状態定義ファイル113は、XML(eXtensible Markup Language)などで記述され、「実行対象処理」に対応するタグが定義され、このタグに「定義内容」を示す情報が埋め込まれる。
「定義内容」には、所定のファイルやテーブルの内容などの状態が記載される。また、ある処理の処理結果を、その処理以降の処理が使用する場合、それらの処理の「定義内容」には、正常状態と判断する条件の1つとして、使用するデータを更新する処理が正常に終了していることを記載する。
情報処理装置1は、各処理の実行タイミングで、その処理に対応するタグが定義する状態を、自身の状態と照合することにより、自身が正常状態であるか否かを判断する。
例えば、処理A1、A2、A3の順で実行し、A1がファイルF1を使用し、A2が、A1の処理結果を使用し、A3がA2の処理結果を使用する場合について考える。この場合、「実行対象処理」の処理A1には、「定義内容」として「ファイルF1が初期状態である」等が記載される。
処理A1実行中に障害が生じて、その処理結果のデータが破壊された場合、処理A2を実行すると、障害が連鎖的に生じうる。そこで、準正常状態判断部13は、処理A1が正常に終了するまでの間は、情報処理装置1の状態を、処理A2を実行できない状態、すなわち、正常状態でない状態と判断する。この場合、「実行対象処理」の処理A2には、「定義内容」として「処理A1が正常に終了した。」等が記載される。正常に終了したか否かは、処理結果のデータが破壊されたか否かなどにより判断する。「実行対象処理」の処理A3には、「定義内容」として「処理A2が正常に終了した。」等が記載される。
異常検知プログラム115は、異常検知処理を実行するためのプログラムである。正常状態判断部11は、異常検知処理において、現在時刻が、スケジュール管理ファイル111で「主処理」の「実行対象処理」に対応する「実行タイミング」であるか否かを判断する。
現在時刻が「主処理」の「実行タイミング」であれば、正常状態判断部11は、その「実行タイミング」における「実行対象処理」に対応するタグに含まれるデータを正常状態定義ファイル113から読み出す。正常状態判断部11は、読み出したデータを使用して、情報処理装置1が正常状態であるか否かを判断し、正常状態でなければ、後述する準正常状態判断処理を行う。
図1に戻り、準正常状態判断部13は、準正常状態定義ファイル131、準正常状態判断プログラム133、および異常通知用ファイル135を有する。
準正常状態定義ファイル131は、情報処理装置1の状態が準正常状態、異常状態のいずれであるかを判断するために使用するファイルである。準正常状態定義ファイル131は、XMLなどで記述し、タグにより各処理の状態を定義する。
「準正常状態」とは、情報処理装置1が正常状態に復旧することができる状態である。ただし、単に、情報処理装置1が復旧する処理を実行できるだけでは、準正常状態に該当しない場合もある。例えば、復旧用のプログラムは正常に実行できるものの、データが破壊されていて、復旧用のプログラムを実行しても処理を実行できる状態(正常状態)に復旧できない場合は、正常状態に復旧できないので準正常状態に該当しない。
具体的には、正常状態でなく、実行タイミングに対応する処理が、前回の処理で更新されたデータを使用するものである場合、又は、正常状態でなく、前回の処理が日時を指定した処理である場合、準正常状態判断部13は、準正常状態でないと判断する。これは、前回の処理が正常に終了していない(正常状態でない)場合、データが破壊されたり、日時が不正である可能性があり、データが破壊されたり、日時が不正なままで、実行対象の処理を実行すると障害が生じ得るためである。
但し、正常状態でなく、今回の処理が前回の処理結果に基づくものである場合であっても、前回の処理について復旧中であり、その復旧の完了後、今回の処理についても復旧できるのであれば、準正常状態判断部13は、準正常状態と判断してもよい。
「異常状態」とは、正常状態でも準正常状態でもない状態である。
または、前回以前の処理が終了日時を示すデータなど、日時に基づくデータを更新するものであり、その前回の処理が正常に終了していない場合、そのデータを復旧せずに、実行対象の処理を実行すると障害が生じるので、準正常状態判断部13は、準正常状態と判断する。
図4は、準正常状態定義ファイル131の構成の一例を示す図である。同図を参照すると、準正常状態定義ファイル131は、「実行対象処理」と、「定義内容」を示す情報を含む。「定義内容」は、「実行対象処理」の実行タイミングにおける準正常状態の定義である。例えば、正常状態定義ファイル113は、XMLなどで記述され、「実行対象処理」に対応するタグが定義され、このタグに。「定義内容」を示す情報が埋め込まれる。
「定義内容」には、所定のファイルやテーブルの内容などの状態が記載される。また、ある処理の処理結果を、その処理以降の処理が使用する場合、それらの処理の「定義内容」には、準正常状態と判断する条件の1つとして、使用するデータを更新する処理が正常に終了していないことを記載する。
情報処理装置1は、各処理の実行タイミングで、その処理に対応するタグが定義する状態を、自身の状態と照合することにより、自身が準正常状態であるか否かを判断する。
例えば、処理A1、A2、A3の順で実行し、A1がファイルF1を使用し、A2が、A1の処理結果を使用し、A3がA2の処理結果を使用する場合について考える。この場合、「実行対象処理」の処理A1には、「定義内容」として「ファイルF1が初期状態である」等が記載される。
処理A1が正常に終了すれば、その後にA1の処理結果をA2が使用できるようになるので、情報処理装置1は、処理A2を復旧後に実行できない状態(異常状態)ではない。そこで、準正常状態判断部13は、A1が正常に終了するまでは、A2を準正常状態と判断し、A1の終了後に正常状態と判断してA2を実行する。この場合、「実行対象処理」の処理A2には、「定義内容」として「処理A1が正常に終了していない。」等が記載される。「実行対象処理」の処理A3には、「定義内容」として「処理A2が正常に終了していない。」等が記載される。
準正常状態判断プログラム133は、準正常状態判断処理を実行するためのプログラムである。準正常状態判断部13は、正常状態判断部11により正常状態でないと判断されたとき、準正常状態判断処理を開始する。準正常状態判断部13は、準正常状態判断処理において、準正常状態定義ファイル131を使用して情報処理装置1が準正常状態であるか否かを判断する。準正常状態であれば、準定常状態判断部13は、後述するリカバリフラグをONにする。また、準定常状態判断部13は、準正常状態であるか否かの判断結果に基づいて異常通知用ファイル135を更新する。
図5は、異常通知用ファイル135の構成の一例を示す図である。異常通知用ファイル135は、情報処理装置1の状態(正常状態、準正常状態、または異常状態)を示す情報を格納するファイルである。同図を参照すると、異常通知用ファイル135は、「処理」、「想定内異常フラグ」、および「異常フラグ」を有する。
「処理」は、トランザクション処理部19により実行される処理である。
「異常フラグ」は、異常状態であるか否かを示す情報である。初期状態では「OFF」に設定され、準正常状態判断部13により、異常状態である場合は「ON」、そうでない場合は「OFF」に更新される。「想定内異常フラグ」は、準正常状態であるか否かを示す情報である。初期状態では「OFF」に設定され、準正常状態判断部13により、準正常状態である場合「ON」、そうでない場合「OFF」に更新される。正常状態である場合、「異常フラグ」および「想定内異常フラグ」は「OFF」である。
例えば、処理A2が実行される前に、準正常状態判断部13は、準正常状態であると判断したので、処理A2の「想定内異常フラグ」は「OFF」、「想定内異常フラグ」は「ON」に更新される。
図1に戻り、リカバリ処理部15は、リカバリフラグ記憶部151、バックアップ対象定義ファイル153、バックアップ・リカバリプログラム155、バックアップテーブル記憶部157、バックアップファイル記憶部159、およびリカバリファイル記憶部161を有する。
図6は、リカバリフラグ記憶部151の構成の一例を示す図である。リカバリフラグ記憶部151は、各処理のリカバリフラグを記憶する。同図を参照すると、リカバリフラグ記憶部151は、「実行対象処理」および「リカバリフラグ」を示す情報を記憶する。「リカバリフラグ」とは、「実行対象処理」に対応付けて情報処理装置1を正常状態に復旧するリカバリ処理を実行中であるか否かを示す情報である。初期状態では、リカバリフラグに「OFF」が設定され、復旧中である場合は、「ON」に更新される。
例えば、「実行対象処理」として処理A2の実行タイミングで情報処理装置1が準正常状態であったとき、リカバリ処理部15は、処理A2を実行できるようにするためのリカバリ処理を開始し、処理A1に対応する「リカバリフラグ」は「ON」に更新される。そして、リカバリ処理が終了したとき、「リカバリフラグ」は「OFF」に更新される。
図7は、バックアップ対象定義ファイル153の構成の一例を示す図である。バックアップ対象定義ファイル153は、正常状態判断部11により正常状態でないと判断されたときに退避すべき対象(ファイル、テーブルなど)を示す情報を格納するファイルである。同図を参照すると、バックアップ対象定義ファイル151は、「処理」、「退避対象テーブル」、および「退避対象ファイル」を示す情報を含む。
「処理」は、トランザクション処理部19により実行される処理である。「退避対象テーブル」は、退避すべきテーブルの格納場所である。「退避対象ファイル」は、退避すべきファイルの格納場所である。
例えば、処理B1の直前の処理が、テーブルTb1およびファイルF1を更新する場合、処理B1の実行タイミングで正常状態でないと判断されたとき、リカバリ処理部15は、テーブルTb1およびファイルF1を退避する。この場合、バックアップ対象定義ファイル153において、「処理B1」に対応付けて、「退避対象テーブル」には「テーブルTbA」の格納場所、「退避対象ファイル」には「ファイルF1」の格納場所が設定される。主処理でない「処理A1」の実行前には、正常状態判断部11により正常状態が判断されないので、対応する「退避対象テーブル」および「退避対象ファイル」は設定されない。
バックアップ・リカバリプログラム155は、リカバリ処理を実行するためのプログラムである。
リカバリ処理部15は、リカバリ処理において、バックアップ対象定義ファイル153から、正常状態であるか否かが判断された処理に対応するバックアップ対象を読み出し、そのバックアップ対象をバックアップテーブル記憶部157またはバックアップテーブル159に格納する。復旧が終了したとき、リカバリ処理部15は、その処理の主処理実行フラグをONに更新する。
図8は、バックアップテーブル記憶部157の構成の一例を示す図である。バックアップテーブル記憶部157は、バックアップ対象のテーブルを記憶する。同図を参照すると、バックアップテーブル記憶部157は、複数のテーブルを格納している。
図9は、バックアップファイル記憶部159の構成の一例を示す図である。バックアップファイル記憶部159は、バックアップ対象のファイルを格納するファイルである。同図を参照すると、バックアップファイル記憶部159は、複数のファイルを格納している。
図10は、リカバリファイル記憶部161の構成の一例を示す図である。リカバリファイル記憶部161は、正常状態でない情報処理装置1を正常状態に復旧するために使用するファイルを記憶する。同図を参照すると、リカバリファイル記憶部161は、複数のリカバリファイルを格納している。
例えば、リカバリファイル記憶部161は、「リカバリファイルA1」および「リカバリファイルA2」を含む複数のファイルを有する。「リカバリファイルA1」は、処理A1を障害なく実行できる状態(正常状態)にない情報処理装置1を正常状態に復旧するために必要なファイルであり、「リカバリファイルA2」は、処理A2について正常状態でない情報処理装置1を正常状態に復旧するために必要なファイルである。
リカバリ処理部15は、リカバリ処理において、バックアップテーブル記憶部157およびバックアップファイル記憶部159にファイル等の退避を行った後、リカバリファイルA2を使用して、情報処理装置1を正常状態に復旧する。
退避したファイル等は、後で解析して一部が破壊されていれば復元したり、システムダウンの状況を分析するために使用する。また、情報処理装置1は、退避したファイル等が破壊されていないのであれば、退避したファイル等を書き戻してバックアップ直前の状態に戻すこともできる。
図1に戻り、オペレータ通知部17は、異常通知用ファイル135の内容を出力し、情報処理装置の状態(正常状態、準正常状態、または異常状態)をオペレータに通知する。例えば、情報処理装置1の操作画面に、情報処理装置の状態を表示する。
なお、オペレータ通知部17は、異常通知用ファイル135の内容を印刷してもよいし、他の装置に送信してもよい。
トランザクション処理部19は、主処理実行フラグ記憶部191、トランザクション実行プログラム193、トランザクションテーブル記憶部195、およびトランザクションファイル記憶部197を有する。
図11は、主処理実行フラグ記憶部191の構成の一例を示す図である。同図を参照すると、主処理実行フラグ記憶部191は、「実行対象処理」および「主処理実行フラグ」を示す情報を記憶する。主処理実行フラグは、主処理を実行するか否かを決定するための情報であり、「ON」または「OFF」が設定される。主処理実行フラグは、初期状態では「OFF」が設定され、「ON」が設定されたときのみ、トランザクション処理部19が主処理を実行する。主処理でない「実行対象処理」については、主処理実行フラグは設定されない。
例えば、「実行対象処理」の処理A2をトランザクション処理部19が実行できる状態であるとき、準正常状態判断部13により、A1に対応する「主処理実行フラグ」に「ON」が設定される。前処理のA1には、主処理実行フラグは設定されない。処理A2の実行中に、同時に処理B1を実行できる場合、準正常状態判断部13により、B1に対応する「主処理実行フラグ」に「ON」が設定される。
トランザクション実行プログラム193は、所定のトランザクション処理を実行するためのプログラムである。
図12は、トランザクションテーブル記憶部195の構成の一例を示す図である。トランザクションテーブル記憶部195は、トランザクション処理において更新対象となるテーブルを格納する。同図を参照すると、トランザクションテーブル記憶部195は、複数のテーブルを格納している。
図13は、トランザクションファイル記憶部197の構成の一例を示す図である。トランザクションファイル記憶部197は、トランザクション処理において更新対象となるファイルを格納する。同図を参照すると、トランザクションファイル記憶部197は、複数のファイルを格納している。
トランザクション処理部19は、トランザクション処理において、スケジュール管理ファイル111における実行タイミングにおいて、主処理実行フラグがONである場合、すなわち、情報処理装置1が正常状態または復旧処理が行われた後である場合、対応する処理を実行する。そして、トランザクション処理部は、処理を実行した結果に基づいてトランザクションテーブル記憶部193およびトランザクションファイル記憶部195に記憶されたテーブルおよびファイルを更新する。
次に、図14〜図18を参照して、情報処理装置1の動作について説明する。
図14は、情報処理装置1の動作を示すフローチャートである。この動作は、情報処理装置1において所定のアプリケーションが実行されたときに開始する。同図を参照すると、正常状態判断部11は、異常検知処理を実行し(ステップS1)、続いてリカバリ処理部15は、リカバリ処理を実行する(ステップS3)。オペレータ通知部17は、異常通知用ファイル135に基づいて、オペレータに、情報処理装置1の状態(正常状態、準正常状態、または異常状態)を通知する(ステップS5)。そして、トランザクション処理部19は、トランザクション処理を実行する(ステップS7)。
図15は、異常検知処理を示すフローチャートである。同図を参照すると、正常状態判断部11は、スケジュール管理ファイル111を読み出す(ステップS11)。正常状態判断部11は、スケジュール管理ファイル111において、現在時刻が、「主処理」の実行タイミングであるか否かを判断する(ステップS13)。
実行タイミングであれば(ステップS13:YES)、正常状態判断部11は、正常状態定義ファイル記憶部113から、実行対象の処理に対応するタグに格納されたデータを読み出す(ステップS15)。正常状態判断部11は、読み出したデータを使用して、情報処理装置1が正常状態にあるか否かを判断する(ステップS17)。
なお、正常状態判断部11は、「主処理」のみならず、「前処理」、「後処理」の実行タイミングで、正常状態であるか否かを判断してもよい。
正常状態であれば(ステップS17:YES)、正常状態判断部11は、実行対象の処理に対応する主処理実行フラグをONにする(ステップS19)。
正常状態でなければ(ステップS17:NO)、準正常状態判断部13は、準正常状態判断処理を実行する(ステップS21)。
実行タイミングでない場合(ステップS13:NO)、またはステップS19の後、あるいはステップS21の後、異常状態判断部11は、異常検知処理を終了する。
図16は、準正常状態判断処理を示すフローチャートである。同図を参照すると、準正常状態判断部13は、準正常状態定義ファイル記憶部131から、実行対象の処理に対応するタグに格納されたデータを読み出す(ステップS211)。準正常状態判断部13は、読み出したデータを使用して、情報処理装置1が準正常状態にあるか否かを判断する(ステップS213)。
準正常状態であれば(ステップS213:YES)、準正常状態判断部13は、実行対象の処理に対応する主処理実行フラグをOFFにし、リカバリフラグをONにする(ステップS215)。準正常状態判断部13は、異常通知用ファイル135において、実行対象の処理に対応する「想定内異常フラグ」をONにする(ステップS217)。
準正常状態でなければ(ステップS213:NO)、準正常状態判断部13は、主処理実行フラグをOFFにし(ステップS219)、異常通知用ファイル135において、実行対象の処理に対応する「想定内異常フラグ」をONにする(ステップS221)。
ステップS217またはステップS221の後、準正常状態判断部13は、準正常状態判断処理を終了する。
図15は、リカバリ処理を示すフローチャートである。同図を参照すると、リカバリ処理部15は、リカバリフラグ記憶部151において実行対象の処理に対応するリカバリフラグがONであるか否かを判断する(ステップS31)。リカバリフラグがONであれば(ステップS31:YES)、リカバリ処理部15は、バックアップ対象定義ファイル151から、実行対象の処理に対応するテーブルおよびファイルの格納場所を読み出す(ステップS33)。リカバリ処理部15は、読み出した格納場所のテーブルおよびファイルをバックアップテーブル記憶部155およびバックアップファイル記憶部157に退避する(ステップS35)。
リカバリ処理部15は、リカバリファイル記憶部159から、実行対象の処理に対応するリカバリファイルを読み出す(ステップS37)。リカバリ処理部15は、読み出したリカバリファイルを使用して、情報処理装置1を正常状態に復旧する(ステップS39)。
リカバリ処理部15は、復旧が終了したか否かを判断する(ステップS41)。復旧が終了したのであれば(ステップS41:YES)、リカバリ処理部15は、実行対象の処理に対応する主処理実行フラグをONにし、リカバリフラグをOFFにする(ステップS43)。
リカバリフラグがONでない場合(ステップS31:NO)、復旧が終了していない場合(ステップS41:NO)、またはステップS2197の後、リカバリ処理部15は、リカバリ処理を終了する。
図16は、トランザクション処理を示すフローチャートである。同図を参照すると、トランザクション処理部19は、スケジュール管理テーブルにおいて、現在時刻が、「前処理」、「主処理」、または「後処理」の実行タイミングであるか否かを判断する(ステップS51)。
実行タイミングであれば(ステップS51:YES)、トランザクション処理部19は、「主処理」の実行タイミングであるか否かを判断する(ステップS53)。
「主処理」の実行タイミングであれば(ステップS53:YES)、トランザクション処理部19は、主処理実行フラグがONであるか否かを判断する(ステップS55)。
主処理実行フラグがONである場合(ステップS53:YES)、または「主処理」の実行タイミングでない場合(ステップS51:NO)、トランザクション処理部19は、実行タイミングにおいて実行対象の処理を行う。そして、トランザクション処理部19は、処理結果に基づいてトランザクションテーブル記憶部193およびトランザクションテーブル記憶部195に格納されたテーブルやファイルを更新する(ステップS57)。
主処理実行フラグがONでない場合(ステップS55:NO)、または「前処理」、「主処理」、または「後処理」のいずれの実行タイミングでもない場合(ステップS51:NO)、あるいはステップS57の後、トランザクション処理部19は、トランザクション処理を終了する。
以上説明したように、本実施形態によれば、準正常状態判断部13は、処理の実行タイミングで、処理を障害なく実行できる状態(正常状態)でなければ、正常状態に復旧できる状態(準正常状態)にあるか否かを判断し、準正常状態であれば、リカバリ処理部15が正常状態に復旧し、準正常状態でなければ、オペレータ通知部17が異常がある旨を出力し、トランザクション処理部19が正常状態にある場合又は復旧後に処理を実行する。このため、正常状態でなくとも、情報処理装置1は外部の装置によらずに自ら正常状態に復旧するか、異常を通知するので、低コストで迅速な障害の復旧又は通知を行うことができる。
正常状態判断部11および準正常状態判断部13は、それぞれ正常状態定義ファイル113および準正常状態定義ファイル131の示す定義に基づいて、正常状態であるか否かおよび準正常状態であるか否かを判断する。このため、情報処理装置1は、正常状態定義ファイル113および準正常状態定義ファイル131を予め記憶しておけば、他の装置によらずに、自己が正常状態であるか否かを判断でき、低コストで多重障害を防ぐことができる。
正常状態判断部11は、前回の処理が正常に終了していれば、正常状態であると判断するので、情報処理装置1は、処理を順に実行する構成において、多重障害を確実に防ぐことができる。
準正常状態判断部13は、実行対象の処理が前回の処理の結果に基づいて実行される処理であり、前回の処理が正常に終了していなければ、準正常状態と判断するので、破壊されたデータを使用する処理を実行することによって、多重障害が生じる事態を防ぐことができる。
準正常状態判断部13は、前回の処理が日時に基づく処理であり、前回の処理が正常に終了していなければ、準正常状態であると判断するので、日時の齟齬により生じる障害を防止することができる。
リカバリ処理部15は、復旧前に、バックアップ対象のテーブルやファイルを退避しておくので、システムダウンによりデータが失われることがなくなる。
オペレータ通知部17は、準正常状態である場合も、想定内異常フラグに基づいて異常を通知するので、復旧中であることをオペレータが認識できる結果、多重障害を防ぐことができる。
なお、図14〜図18で示した処理の一部又は全ては、コンピュータプログラムの実行により実現してもよいのは勿論である。
本実施形態の情報処理装置の構成を示すブロック図である。 本実施形態のスケジュール管理ファイルの構成の一例を示す図である。 本実施形態の正常状態定義ファイルの構成の一例を示す図である。 本実施形態の準正常状態定義ファイルの構成の一例を示す図である。 本実施形態の異常通知用ファイルの構成の一例を示す図である。 本実施形態のリカバリフラグ記憶部の構成の一例を示す図である。 本実施形態のバックアップ対象定義ファイルの構成の一例を示す図である。 本実施形態のバックアップテーブル記憶部の構成の一例を示す図である。 本実施形態のバックアップファイル記憶部の構成の一例を示す図である。 本実施形態のリカバリファイル記憶部の構成の一例を示す図である。 本実施形態の主処理フラグ記憶部の構成の一例を示す図である。 本実施形態のトランザクションテーブル記憶部の構成の一例を示す図である。 本実施形態のトランザクションファイル記憶部の構成の一例を示す図である。 本実施形態の情報処理装置の動作を示すフローチャートである。 本実施形態の異常検知処理を示すフローチャートである。 本実施形態の準正常状態判断処理を示すフローチャートである。 本実施形態のリカバリ処理を示すフローチャートである。 本実施形態のトランザクション処理を示すフローチャートである。
符号の説明
1 情報処理装置
11 正常状態判断部
13 準正常状態判断部
15 リカバリ処理部
17 オペレータ処理部
19 トランザクション処理部
111 スケジュール管理テーブル
113 正常状態定義ファイル
115 異常検知プログラム
131 準正常状態定義ファイル
133 準正常状態判断プログラム
135 異常通知用ファイル
151 リカバリフラグ記憶部
153 バックアップ対象定義ファイル
155 バックアップ・リカバリプログラム
157 バックアップテーブル記憶部
159 バックアップファイル記憶部
161 リカバリファイル記憶部
191 主処理フラグ記憶部
193 トランザクション実行プログラム
195 トランザクションテーブル記憶部
197 トランザクションファイル記憶部
S1〜S7、S11〜S21、S211〜S221、S31〜S43、S71〜S77 ステップ

Claims (11)

  1. 所定の処理を実行する前に、自身が該処理を障害なく実行できる状態である、正常状態にあるか否かを判断する正常状態判断手段と、
    前記正常状態判断手段により前記正常状態にないと判断されたのであれば、自身が前記正常状態に復旧することができる状態である、準正常状態であるか否かを判断する準正常状態判断手段と、
    前記準正常状態判断手段により前記準正常状態にあると判断されたならば、自身を前記正常状態に復旧する復旧手段と、
    前記準正常状態判断手段により前記準正常状態にないと判断されたのであれば、自身に異常がある旨を出力する出力手段と、
    前記正常状態判断手段により前記正常状態にあると判断された場合、又は前記復旧手段により前記正常状態に復旧された場合、前記処理を実行する実行手段と、
    を有する情報処理装置。
  2. 前記正常状態の定義を示す正常状態情報を記憶する正常状態記憶手段を更に有し、
    前記正常状態判断手段は、前記正常状態記憶手段から読み出した前記正常状態情報に基づいて、正常状態である否かを判断する、請求項1に記載の情報処理装置。
  3. 前記準正常状態の定義を示す準正常状態情報を記憶する準正常状態記憶手段を更に有し、
    前記準正常状態判断手段は、前記準正常状態記憶手段から読み出した前記準正常状態情報に基づいて、準正常状態である否かを判断する、請求項1又は2に記載の情報処理装置。
  4. 前記処理は、順に実行される複数の処理のうちの1つであり、
    前記正常状態判断手段は、前回の処理が正常に終了していれば、正常状態であると判断する、請求項1乃至3のいずれか1項に記載の情報処理装置。
  5. 前記準正常状態判断手段は、前記処理が前回の処理の結果に基づく処理であれば、準正常状態でないと判断する、請求項4に記載の情報処理装置。
  6. 前記準正常状態判断手段は、前記処理が前回の処理の結果に基づく処理であり、且つ前回の処理が正常に終了した後に前記正常状態に復旧できるのであれば、準正常状態であると判断する、請求項4に記載の情報処理装置。
  7. 前記処理は、順に実行される複数の処理のうちの1つであり、
    前記準正常状態判断手段は、前回の処理が日時を指定した処理であれば、準正常状態でないと判断する、請求項1乃至6のいずれか1項に記載の情報処理装置。
  8. 前記復旧手段は、前記正常状態に復旧する前に、所定のデータを記憶手段に退避する、請求項1乃至7のいずれか1項に記載の情報処理装置。
  9. 前記出力手段は、前記準正常状態判断手段により前記準正常状態にあると判断されたのであれば、該準正常状態にある旨を更に出力する、請求項1乃至8のいずれか1項に記載の情報処理装置。
  10. 所定の処理を実行する前に、自身が該処理を障害なく実行できる状態である、正常状態にあるか否かを判断し、
    前記正常状態にないと判断されたのであれば、自身が前記正常状態に復旧することができる状態である、準正常状態であるか否かを判断し、
    前記準正常状態にあると判断されたならば、自身を前記正常状態に復旧し、
    前記準正常状態にないと判断されたのであれば、自身に異常がある旨を出力し、
    前記正常状態にあると判断された場合、又は前記正常状態に復旧された場合、前記処理を実行する、情報処理方法。
  11. コンピュータに、
    所定の処理を実行する前に、自身が該処理を障害なく実行できる状態である、正常状態にあるか否かを判断する正常状態判断手順、
    前記正常状態判断手順により前記正常状態にないと判断されたのであれば、自身が前記正常状態に復旧することができる状態である、準正常状態であるか否かを判断する準正常状態判断手順、
    前記準正常状態判断手順により前記準正常状態にあると判断されたならば、自身を前記正常状態に復旧する復旧手順、
    前記準正常状態判断手順により前記準正常状態にないと判断されたのであれば、自身に異常がある旨を出力する出力手順、及び
    前記正常状態判断手段により前記正常状態にあると判断された場合、又は前記復旧手段により前記正常状態に復旧された場合、前記処理を実行する実行手順、
    を実行させるためのプログラム。
JP2008159139A 2008-06-18 2008-06-18 情報処理装置、情報処理方法、およびプログラム Expired - Fee Related JP5298657B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008159139A JP5298657B2 (ja) 2008-06-18 2008-06-18 情報処理装置、情報処理方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008159139A JP5298657B2 (ja) 2008-06-18 2008-06-18 情報処理装置、情報処理方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2010002979A true JP2010002979A (ja) 2010-01-07
JP5298657B2 JP5298657B2 (ja) 2013-09-25

Family

ID=41584688

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008159139A Expired - Fee Related JP5298657B2 (ja) 2008-06-18 2008-06-18 情報処理装置、情報処理方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP5298657B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08286778A (ja) * 1995-04-11 1996-11-01 Nec Corp ジョブ実行管理方法及び装置
JPH11143742A (ja) * 1997-11-07 1999-05-28 Hitachi Ltd 計算機運用管理システム
JP2002007218A (ja) * 2000-06-21 2002-01-11 Hitachi Eng Co Ltd メモリ照合方式

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08286778A (ja) * 1995-04-11 1996-11-01 Nec Corp ジョブ実行管理方法及び装置
JPH11143742A (ja) * 1997-11-07 1999-05-28 Hitachi Ltd 計算機運用管理システム
JP2002007218A (ja) * 2000-06-21 2002-01-11 Hitachi Eng Co Ltd メモリ照合方式

Also Published As

Publication number Publication date
JP5298657B2 (ja) 2013-09-25

Similar Documents

Publication Publication Date Title
CN101221508B (zh) 一种设备启动方法和装置
US8468389B2 (en) Firmware recovery system and method of baseboard management controller of computing device
CN101023411A (zh) 用于最小化计算机应用程序中的丢失的方法和系统
US20150089479A1 (en) Method for pre-testing software compatibility and system thereof
US20160132420A1 (en) Backup method, pre-testing method for environment updating and system thereof
US7882388B2 (en) Dual independent non volatile memory systems
US7305578B2 (en) Failover method in a clustered computer system
JP5183542B2 (ja) 計算機システム及び設定管理方法
US9164846B2 (en) Restarting a software system
CN101145983B (zh) 一种网管系统的自诊断和自恢复子系统及方法
CN107153559A (zh) 一种电子设备的应用程序升级方法
CN113127248A (zh) 面向机器人ros程序的自动崩溃恢复方法和系统
KR100899582B1 (ko) 정보 처리 장치, 그 제어 장치, 그 제어 방법 및 제어프로그램을 저장한 컴퓨터 판독 가능한 기록 매체
CN108762118B (zh) 一种通讯设备间的故障处理方法及装置
CN105224416A (zh) 修复方法及相关电子装置
JP3551079B2 (ja) 修正ロードモジュール置換後の復旧方法ならびに装置
JP5298657B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP5994246B2 (ja) 情報処理装置、情報処理方法及びプログラム
CN105760276B (zh) 提高reboot命令重启可靠性并增加复位日志的方法
KR101300806B1 (ko) 다중 프로세스 시스템에서 오동작 처리 장치 및 방법
CN105391575A (zh) 一种金库控制方法及系统
CN116628372B (zh) 资源文件的处理方法、装置、设备及介质
CN117555717B (zh) 一种应用异常处理方法、终端及计算机存储介质
JP2000293407A (ja) 監視制御装置及びcpu監視方法並びにプログラム記録媒体
CN1983206A (zh) 软件系统自动恢复的方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110516

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121003

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121009

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130521

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130603

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees