JP2008181298A - 作業状態復帰プログラム、作業状態復帰方法および作業状態復帰装置 - Google Patents

作業状態復帰プログラム、作業状態復帰方法および作業状態復帰装置 Download PDF

Info

Publication number
JP2008181298A
JP2008181298A JP2007013862A JP2007013862A JP2008181298A JP 2008181298 A JP2008181298 A JP 2008181298A JP 2007013862 A JP2007013862 A JP 2007013862A JP 2007013862 A JP2007013862 A JP 2007013862A JP 2008181298 A JP2008181298 A JP 2008181298A
Authority
JP
Japan
Prior art keywords
information
operation management
execution control
history information
work
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007013862A
Other languages
English (en)
Inventor
Hiroyuki Yamashima
弘之 山島
Koyo Watanabe
幸洋 渡辺
Kenji Morimoto
健司 森本
Tetsuya Okano
哲也 岡野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2007013862A priority Critical patent/JP2008181298A/ja
Priority to US11/987,394 priority patent/US20080178182A1/en
Publication of JP2008181298A publication Critical patent/JP2008181298A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2038Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1658Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/203Failover techniques using migration

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Hardware Redundancy (AREA)

Abstract

【課題】予期せぬ障害発生などを原因として停止してしまった作業状態を実行中であった作業状態に効率的に復帰させることを課題とする。
【解決手段】予期しないエラーなどを原因として発生したサーバダウンにより実行制御サーバAが停止すると、実行制御サーバBの設定モジュールは、実行制御サーバAから動作ログおよび運用管理手順を取得して、運用管理手順のどこまで作業が完了しているか特定するために動作ログの解析を行う。また、実行制御サーバBの設定モジュールは、実行制御サーバAの動作ログの解析結果と通信ログとの比較解析を行う。そして、実行制御サーバBの設定モジュールは、実行制御サーバAの実行制御モジュール停止時の作業状態にシステムを復帰させるための情報を比較解析結果から抽出して、実行制御サーバB内に新しく起動する実行制御モジュールに対して設定する。
【選択図】 図1

Description

この発明は、作業内容および作業順序が設定された運用管理情報に基づいて、連携作業させるように各運用管理機能を制御する実行制御機能と、当該実行制御機能からの指示に従って連携した作業を実行する各運用管理機能とを備えた情報システムにおいて、当該実行制御機能が停止した場合に、当該運用管理情報に基づいて各運用管理機能を制御していた実行制御機能の動作履歴情報に基づいて、当該実行制御機能停止時の作業状態に復帰させる方法をコンピュータに実行させる作業状態復帰プログラム等に関する。
従来より、IT(Information Technology)システムにおいて、サーバがダウンするなどの予期せぬエラーが発生することにより実行中の作業が停止してしまった場合、サーバの動作ログに基づいて実行中であった作業状態に復帰させる技術が存在する(図22参照)。
具体的には、図23に示すように、従来のITシステムは、機器やサービスの運用管理を行なう運用管理モジュール2をそれぞれ動作させる複数の運用管理サーバと、予めシステム管理者などにより設定された運用管理手順に基づいて、各運用管理モジュールを連携動作させるように制御する実行制御モジュール1を動作させる実行制御サーバと、実行制御サーバと運用管理サーバとの間の通信を管理する通信機能4とから構成される。
そして、例えば、運用管理手順に基づいてサーバの増設作業を実行中に実行制御サーバがダウンした場合、実行制御サーバ上で動作する設定モジュール3は、動作ログを解析して、サーバダウン時に実行中であった運用管理手順(2)の作業状態に復帰させる。
なお、特許文献1では、上位処理装置と通信制御装置からなる通信システムにおいて、上位処理装置に一時障害が発生した場合には、上位処理装置は、障害の発生前後で記憶している電文と通信制御装置に要求して受け付けた電文との比較結果に基づいて、通信制御装置に転送要求を行なう技術が開示されている。
特開平6−62077号公報
ところで、上記した従来の技術は、実行中であった作業状態に効率的に復帰させることができない場合があるという問題点があった。
例えば、サーバ増設作業におけるリソースの確保が運用管理手順(2)である場合を例に挙げて説明する。すなわち、サーバを増設するためのリソース確保要求が実行制御モジュール1から運用管理モジュール2に送信された直後に実行制御サーバがダウンした場合には、運用管理モジュール2からの応答を受信することができないので、運用管理モジュール2によりリソースが確保されているのか否か判断することができない。それゆえ、実行制御サーバの設定モジュール3は、運用管理モジュールにより既にリソースが確保されていたとしても、運用管理手順(2)の作業をリソースの確保要求からやり直すことになるため、やり直す作業手順が多くなるなど、実行中であった作業状態に効率的に復帰させることができない場合があるという問題点があった。
そこで、本発明は、上述した従来技術の課題を解決するためになされたものであり、予期せぬ障害発生などを原因として停止してしまった作業状態を実行中であった作業状態に効率的に復帰させることが可能な作業状態復帰プログラム、作業状態復帰方法および作業状態復帰装置を提供することを目的とする。
上述した課題を解決し、目的を達成するため、請求項1に係る発明は、作業内容および作業順序が設定された運用管理情報に基づいて、連携作業させるように各運用管理機能を制御する実行制御機能と、当該実行制御機能からの指示に従って連携した作業を実行する各運用管理機能とを備えた情報システムに対し、当該実行制御機能が停止した場合に、当該運用管理情報に基づいて各運用管理機能を制御していた実行制御機能の動作履歴情報に基づいて、当該実行制御機能停止時の作業状態への復帰処理をコンピュータに実行させる作業状態復帰プログラムであって、実行制御機能からの指示に従って各運用管理機能が連携した作業を実行している場合に、各運用管理機能と実行制御機能との間で行われる通信に関する通信履歴情報を取得する通信履歴情報取得手順と、前記通信履歴情報取得手順により取得された前記通信履歴情報を記憶部に記憶する通信履歴情報記憶手順と、各運用管理機能によって連携した作業が実行されている最中に前記実行制御機能が停止した場合には、前記通信履歴情報記憶手順により記憶部に記憶されている前記通信履歴情報と前記動作履歴情報とに基づいて、前記運用管理情報に設定された作業内容および作業順序における復帰箇所を特定する復帰箇所特定手順と、前記復帰箇所特定手順により特定された前記復帰箇所に応じて、前記実行制御機能停止時の作業状態に復帰させる作業状態復帰手順と、をコンピュータに実行させることを特徴とする。
また、請求項2に係る発明は、上記の発明において、前記動作履歴情報および前記通信履歴情報は、各運用管理情報を一意に識別するために付与されている識別情報を含むものであって、各運用管理機能によって連携した作業が実行されている最中に前記実行制御機能が停止した場合には、前記識別情報に基づいて、前記動作履歴情報および前記通信履歴情報を運用管理情報ごとに抽出する情報抽出手順と、前記情報抽出手順により運用管理情報ごとに抽出された前記動作履歴情報を解析して、前記実行制御機能の停止時に用いられていた運用管理情報を特定する運用管理情報特定手順とをさらにコンピュータに実行させ、前記復帰箇所特定手順は、前記運用管理情報特定手順により特定された運用管理情報について、前記情報抽出手順により抽出された前記動作履歴情報および前記通信履歴情報に基づいて、前記運用管理情報における復帰箇所を特定することを特徴とする。
また、請求項3に係る発明は、上記の発明において、前記運用管理情報に従って行われる作業に関する最新情報を当該運用管理情報ごとに管理する最新情報管理手順と、前記動作履歴情報および前記通信履歴情報を取得するたびに、当該動作履歴情報および通信履歴情報に基づいて、前記最新情報管理手順により管理されている前記最新情報を更新する情報更新手順とをさらにコンピュータに実行させ、前記作業状態復帰手順は、前記最新情報管理手順により管理されている前記最新情報に基づいて、前記実行制御機能停止時の作業状態に復帰させることを特徴とする。
また、請求項4に係る発明は、上記の発明において、前記情報更新手順は、前記動作履歴情報および前記通信履歴情報を所定時間ごとに取得して、前記最新情報管理手順により管理されている前記最新情報を更新することを特徴とする。
また、請求項5に係る発明は、作業内容および作業順序が設定された運用管理情報に基づいて、連携作業させるように各運用管理機能を制御する実行制御機能と、当該実行制御機能からの指示に従って連携した作業を実行する各運用管理機能とを備えた情報システムに対し、当該実行制御機能が停止した場合に、当該運用管理情報に基づいて各運用管理機能を制御していた実行制御機能の動作履歴情報に基づいて、当該実行制御機能停止時の作業状態への復帰処理をコンピュータに実行させる作業状態復帰方法であって、前記コンピュータが、実行制御機能からの指示に従って各運用管理機能が連携した作業を実行している場合に、各運用管理機能と実行制御機能との間で行われる通信に関する通信履歴情報を取得する通信履歴情報取得工程と、前記通信履歴情報取得工程により取得された前記通信履歴情報を記憶部に記憶する通信履歴情報記憶工程と、各運用管理機能によって連携した作業が実行されている最中に前記実行制御機能が停止した場合には、前記通信履歴情報記憶工程により記憶部に記憶されている前記通信履歴情報と前記動作履歴情報とに基づいて、前記運用管理情報に設定された作業内容および作業順序における復帰箇所を特定する復帰箇所特定工程と、前記復帰箇所特定工程により特定された前記復帰箇所に応じて、前記実行制御機能停止時の作業状態に復帰させる作業状態復帰工程と、を実行することを特徴とする。
また、請求項6に係る発明は、作業内容および作業順序が設定された運用管理情報に基づいて、連携作業させるように各運用管理機能を制御する実行制御機能と、当該実行制御機能からの指示に従って連携した作業を実行する各運用管理機能とを備えた情報システムに対し、当該実行制御機能が停止した場合に、当該運用管理情報に基づいて各運用管理機能を制御していた実行制御機能の動作履歴情報に基づいて、当該実行制御機能停止時の作業状態に復帰させる作業状態復帰装置であって、実行制御機能からの指示に従って各運用管理機能が連携した作業を実行している場合に、各運用管理機能と実行制御機能との間で行われる通信に関する通信履歴情報を取得する通信履歴情報取得手段と、前記通信履歴情報取得手段により取得された前記通信履歴情報を記憶する通信履歴情報記憶手段と、各運用管理機能によって連携した作業が実行されている最中に前記実行制御機能が停止した場合には、前記通信履歴情報記憶手段により記憶されている前記通信履歴情報と前記動作履歴情報とに基づいて、前記運用管理情報に設定された作業内容および作業順序における復帰箇所を特定する復帰箇所特定手段と、前記復帰箇所特定手段により特定された前記復帰箇所に応じて、前記実行制御機能停止時の作業状態に復帰させる作業状態復帰手段と、を備えたことを特徴とする。
本発明によれば、実行制御機能からの指示に従って各運用管理機能が連携した作業を実行している場合に、各運用管理機能と実行制御機能との間で行われる通信に関する通信履歴情報を取得して記憶部に記憶しておき、各運用管理機能によって連携した作業が実行されている最中に実行制御機能が停止した場合には、記憶部に記憶されている通信履歴情報と動作履歴情報とに基づいて運用管理情報に設定された作業内容および作業順序における復帰箇所を特定して、特定された復帰箇所に応じて実行制御機能停止時の作業状態に復帰させるので、予期せぬ障害発生などを原因として停止してしまった作業状態を実行中であった作業状態に効率的に復帰させることが可能である。例えば、サーバを増設するためのリソース確保要求が実行制御機能から運用管理機能に送信された直後に実行制御機能が停止した場合には、運用管理機能からの応答を受信することができないので、運用管理機能によりリソースが確保されているのか否か判断することができない。このように、通信履歴情報を取得しておくことにより、運用管理機能によって既にリソースが確保されていることが判断できるので、サーバを増設するためのリソース確保の作業をリソースの確保要求からやり直す必要がなく、実行中であった作業状態(例えば、リソースの確保後)に効率的に復帰させることが可能である。
また、本発明によれば、動作履歴情報および通信履歴情報は、各運用管理情報を一意に識別するために付与されている識別情報を含むものであって、各運用管理機能によって連携した作業が実行されている最中に実行制御機能が停止した場合には、動作履歴情報および通信履歴情報を識別情報ごとに抽出するとともに、抽出された動作履歴情報を解析して実行制御機能の停止時に用いられていた運用管理情報を特定し、特定された運用管理情報について抽出された動作履歴情報および通信履歴情報に基づいて、運用管理情報における復帰箇所を特定するので、複数の運用管理手順を同時に実行している場合や、それぞれが異なる運用管理手順を実行する複数の実行制御機能を動作させている場合にも対応することができ、予期せぬ障害発生などを原因として停止してしまった作業状態を実行中であった作業状態に効率的に復帰させることが可能である。
以下に添付図面を参照して、本発明に係る作業復帰プログラム、作業復帰方法および作業復帰装置の実施例を詳細に説明する。なお、以下では、本発明に係る作業復帰プログラムを適用した情報システムを実施例1として説明した後に、本発明に含まれる他の実施例を説明する。
以下の実施例1では、実施例1に係る情報システムの概要および特徴、情報システムの構成および処理を順に説明し、最後に実施例1による効果を説明する。
[情報システムの概要および特徴(実施例1)]
まず、図1を用いて、実施例1に係る情報システムの概要および特徴を説明する。図1は、実施例1に係る情報システムの概要および特徴を説明するための図である。
実施例1に係る情報システムは、以下に説明するように構成される。すなわち、作業内容および作業順序が設定された運用管理手順に基づいて、連携作業させるように各運用管理モジュールを制御するための実行制御モジュールを動作させる実行制御サーバと、実行制御モジュールからの指示に従って連携した作業を実行する各運用管理モジュールを動作させる運用管理サーバと、例えば、ESB(Enterprise Service Bus)を介して実行制御サーバと運用管理サーバと間で行われる通信内容に関するログ(通信ログ)を取得する通信管理サーバとから構成される。
また、実行制御サーバは、現用系の実行制御サーバAと、実行制御サーバAがダウンして実行制御モジュールが停止した場合に、新たな実行制御モジュールを立ち上げてリカバリするための予備系の実行制御サーバBとで2重化されている。なお、実行制御サーバを2重化する場合に限られるものではなく、ダウンしたサーバに替えて新たなサーバを設置するようにしてもよいし、リカバリ機能を備えたサーバを初めから設置するようにしてもよい。
このような構成のもと、実施例1に係る情報システムは、実行制御モジュールが停止した場合に、運用管理手順に基づいて各運用管理モジュールを制御していた実行制御モジュールの動作ログに基づいて、実行制御モジュール停止時の作業状態に復帰させることを概要とするが、予期せぬ障害発生などを原因として停止してしまった作業状態を実行中であった作業状態に効率的に復帰させることが可能である点に主たる特徴がある。
この主たる特徴について具体的に説明すると、図1に示すように、実施例1に係る情報システムにおいて、予期しないエラーなどを原因として実行制御サーバAがダウンすることにより、実行制御サーバA上で動作していた実行制御モジュールが停止すると、実行制御サーバAの予備系である実行制御サーバBは、実行制御サーバAの実行制御モジュールが停止した時点の作業状態にシステムを復帰させる。
具体的に説明すると、実行制御サーバBの設定モジュールは、実行制御サーバAから動作ログおよび運用管理手順を取得して、実行制御モジュールの停止時点で運用管理手順のどこまで作業が完了しているか特定するために動作ログの解析を行う。この動作ログの解析により、例えば、作業内容1および作業内容2で構成されている運用管理手順(2)の作業内容1まで完了していることが特定される。
また、実行制御サーバBの設定モジュールは、実行制御サーバと運用管理サーバと間で行われる通信に関する通信ログを通信管理サーバから取得しておいて、実行制御サーバAの動作ログの解析結果と通信ログとの比較解析を行う。
実行制御サーバBの設定モジュールが行う比較解析について、例えば、運用管理手順(2)の作業内容1が実行制御モジュールから運用管理モジュールへの機器の起動要求の送信であり、運用管理手順(2)の作業内容2が実行制御モジュールによる運用管理モジュールからの返答メッセージの確認であって、運用管理モジュールからの返答メッセージが通信ログに書き込まれている場合を例に挙げて説明する。
すなわち、実行制御サーバBの設定モジュールは、実行制御サーバAの実行制御モジュールが停止した時点で、運用管理手順(2)の作業内容1までが完了されているので、運用管理手順(2)の作業内容2において用いられる運用管理モジュールからの返答メッセージは、実行制御サーバAの実行制御モジュールに受信されていないことを比較解析により導き出す。
そして、実行制御サーバBの設定モジュールは、実行制御サーバAの実行制御モジュール停止時の作業状態にシステムを復帰させるための情報を比較解析結果から抽出して、実行制御サーバB内に新しく起動する実行制御モジュールに対して設定する。例えば、実行制御サーバAの実行制御モジュール停止時の作業状態に復帰させるための情報としては、運用管理モジュールからの返答メッセージの情報や運用管理手順の復帰箇所の情報などが該当する。
設定モジュールからの情報の設定を受け付けた後、実行制御サーバBにおいて新しく起動された実行制御モジュールは、停止してしまった実行制御サーバAの実行制御モジュールの代わりに、運用管理手順に基づいた作業を引き継いで実行する。このように、実施例1に係る情報システムは、実行制御サーバAの実行制御モジュールが停止した時点の作業状態に復帰する。
このようなことから、実施例1に係る情報システムは、予期せぬ障害発生などを原因として停止してしまった作業状態を実行中であった作業状態に効率的に復帰させることが可能である。
[情報システムの構成(実施例1)]
次に、図2を用いて、実施例1に係る情報システムの構成を説明する。図2は、実施例1に係る情報システムの構成図である。
同図に示すように、実施例1に係る情報システムは、サーバなどの装置上で動作する実行制御モジュール11および12と、運用管理モジュール21、22および23と、設定モジュール32と、通信機能41と、通信ログ取得機能42とから構成される。
このうち、実行制御モジュール11は、作業内容および作業順序が設定された運用管理手順(図3および図4参照)に基づいて、連携作業させるように各運用管理モジュールを制御する。例えば、運用管理手順に設定されている作業順序、運用管理モジュールからの戻り値およびシステム構成情報に基づいて次の作業手順の判断を行い、動作内容を動作ログとして書き込む。実行制御モジュール12は、実行制御モジュール11が停止した場合に、新たに起動されるモジュールである。
また、動作ログは、図5に例示するように、運用管理手順に設定された手順内容と、手順に応じた作業を実行する運用管理モジュールと、実行制御モジュールの状態と、引数と、戻り値とを対応付けて記録するように構成される。
運用管理モジュール21、22および23は、実行制御モジュールからの指示に従って連携した作業を実行する。例えば、情報システムで提供するサービスのリソースやアプリケーションソフトなどのソフトウェアの設定や状態の管理を行う。
通信機能41は、実行制御モジュールと運用管理モジュールとの間の通信を実現する。通信ログ取得機能42は、実行制御モジュールと運用管理モジュールとの間で行われる通信内容に関するログ(通信ログ)を取得する。
また、通信ログは、図6に例示するように、実行制御モジュールと運用管理モジュールとの間で行われる通信の宛て先と、送信元と、運用管理手順の手順内容を示す番号と、通信の内容と、引数または戻り値の情報とを対応付けて構成される。
なお、通信機能41および通信ログ取得機能42は、例えば、ESB(Enterprise Service Bus)を利用することにより実現される。ここで、「ESB」とは、サービスプロセスの構成単位に合わせてソフトウェア部門や機能を柔軟に連携させるためのシステムアーキテクチャであるSOA(Service−Oriented Architecture)に基づいた高機能な処理プログラムのことであり、仮想的なメッセージバスであるESBを経由させて、各システム(例えば、実行制御システムや運用管理システムなど)間でデータがやり取りされるようにシステムを構成することができる。
設定モジュール32は、サーバダウンなどで停止した実行制御モジュールから取得される動作ログと、通信ログ取得機能41から取得される通信ログとに基づいて、運用管理手順における復帰箇所の情報および復帰状態値を抽出し、停止した実行制御モジュールの代わりとして新しく起動する実行制御モジュールに設定する。
そして、設定モジュール32は、図7に示すように、情報管理部320と、情報部321と、動作ログ解析部322と、比較解析部323と、設定部324とから構成される。
情報管理部320は、サーバダウンにより停止して実行制御モジュールの動作ログおよび運用管理手順を取得するとともに、通信ログ取得機能42から通信ログを取得して、情報部321にそれぞれ登録する。また、情報管理部320は、動作ログ解析部322に動作ログ解析指示を送出して、動作ログ解析部322から動作ログ解析結果を受け付ける。
さらに、情報管理部320は、動作ログ解析部322から解析結果を受け付けると、比較解析部323に動作ログの解析結果と通信ログとの比較解析指示を送出して、比較解析部323から比較解析結果を受け付ける。そして、情報管理部320は、実行制御モジュール停止時の作業状態にシステムを復帰させるための情報(例えば、運用管理モジュールからの戻り値や運用管理手順の復帰箇所の情報など)を比較解析結果から抽出して、新しく起動する実行制御モジュールに対して抽出した情報を設定するように設定部324に依頼する。
情報部321は、情報管理部320からの情報(運用管理手順、動作ログおよび通信ログ)の登録を受け付ける。動作ログ解析部322は、情報管理部320からの指示を受け付けると、情報部321から運用管理手順および動作ログを取得して動作ログ解析を行う。例えば、運用管理手順の(2)が作業内容1および作業内容2で構成されている場合に、動作ログ解析部322の動作ログの解析により、運用管理手順の(2)の作業内容1まで完了していることが特定される(例えば、図5の11が作業内容1)。動作ログ解析部322は、動作ログ解析結果を情報管理部320へ送出する。
比較解析部323は、情報管理部320からの指示を受け付けると、情報部321から通信ログを取得して、動作ログ解析結果と通信ログとの比較解析を行う。比較解析部323による比較解析について、例えば、運用管理手順(2)の作業内容1が実行制御モジュールから運用管理モジュールへの機器の起動要求の送信であり、運用管理手順(2)の作業内容2が実行制御モジュールによる運用管理モジュールからの返答メッセージの確認であって、運用管理モジュールからの返答メッセージが通信ログに書き込まれている場合(例えば、図6の12)を例に挙げて説明する。すなわち、比較解析部323は、実行制御サーバAの実行制御モジュールが停止した時点で、運用管理手順(2)の作業内容1までが完了されているので、運用管理手順(2)の作業内容2において用いられる運用管理モジュールからの返答メッセージは、実行制御サーバAの実行制御モジュールに受信されていないことを比較解析により導き出す。比較解析部323は、比較解析結果を情報管理部320へ送出する。
設定部324は、情報管理部320からの依頼を受け付けて、新しく起動する実行制御モジュールに対して、実行制御モジュール停止時の作業状態にシステムを復帰させるための情報を設定する。
[情報システムの処理(実施例1)]
続いて、図8を用いて、実施例1に係る情報システムの処理を説明する。図8は、実施例1に係る情報システムの処理の流れを示すシーケンス図である。
例えば、サーバダウンにより実行制御モジュール11が停止すると、ダウンしたサーバの予備系サーバに搭載された設定モジュール32の情報管理部320は、実行制御モジュール11の動作ログデータおよび運用管理手順を取得して(ステップS801)、情報部321へ登録する(ステップS802)。また、情報管理部320は、動作ログ解析部322に動作ログ解析指示を送出する(ステップS803)。
動作ログ解析部322は、情報管理部320からの指示を受け付けると、情報部321から運用管理手順および動作ログデータを取得して(ステップS804)、動作ログ解析を行う(ステップS805)。例えば、運用管理手順の(2)が作業内容1および作業内容2で構成されている場合に、動作ログ解析部322の動作ログの解析により、運用管理手順の(2)の作業内容1まで完了していることが特定される。動作ログ解析部322は、動作ログ解析結果を情報管理部320へ送出する(ステップS806)。
また、情報管理部320は、通信ログ取得機能42から通信ログデータを取得して(ステップS807)、情報部321に登録する(ステップS808)。
動作ログ解析部322から動作ログ解析結果を受け付けると、情報管理部320は、比較解析部323に動作ログ解析結果と通信ログとの比較解析指示を送出する(ステップS809)。比較解析部323は、情報管理部320からの指示を受け付けると、情報部321から通信ログデータを取得して(ステップS810)、動作ログ解析結果と通信ログとの比較解析を行う(ステップS811)。
比較解析部323による比較解析について、例えば、運用管理手順(2)の作業内容1が実行制御モジュールから運用管理モジュールへの機器の起動要求の送信であり、運用管理手順(2)の作業内容2が実行制御モジュールによる運用管理モジュールからの返答メッセージの確認であって、運用管理モジュールからの返答メッセージが通信ログに書き込まれている場合を例に挙げて説明する。すなわち、比較解析部323は、実行制御サーバAの実行制御モジュールが停止した時点で、運用管理手順(2)の作業内容1までが完了されているので、運用管理手順(2)の作業内容2において用いられる運用管理モジュールからの返答メッセージは、実行制御サーバAの実行制御モジュールに受信されていないことを比較解析により導き出す。比較解析部323は、比較解析結果を情報管理部320へ送出する(ステップS812)。
比較解析部323から比較解析結果を受け付けると、情報管理部320は、実行制御モジュール停止時の作業状態にシステムを復帰させるための情報(例えば、運用管理モジュールからの戻り値や運用管理手順の復帰箇所の情報など)を比較解析結果から抽出して(ステップS813)、新しく起動する実行制御モジュールに対して抽出した情報を設定するように設定部324に依頼する(ステップS814)。
設定部324は、情報管理部320からの依頼を受け付けて、新しく起動する実行制御モジュール12に対して、実行制御モジュール停止時の作業状態にシステムを復帰させるための情報を設定する(ステップS815)。
[実施例1による効果]
上述してきたように、実施例1によれば、実行制御モジュールからの指示に従って各運用管理モジュールが連携した作業を実行している場合に、各運用管理モジュールと実行制御モジュールとの間で行われる通信ログデータを取得して登録しておき、各運用管理モジュールによって連携した作業が実行されている最中に実行制御モジュールが停止した場合には、登録しておいた通信ログデータと動作ログデータとに基づいて運用管理手順に設定された作業内容および作業順序における復帰箇所を特定して、特定された復帰箇所に応じて実行制御モジュール停止時の作業状態にシステムを復帰させるので、予期せぬ障害発生などを原因として停止してしまった作業状態を実行中であった作業状態に効率的に復帰させることが可能である。例えば、機器の起動要求が実行制御モジュールから運用管理モジュールに送信された直後に実行制御モジュールが停止した場合には、運用管理モジュールからの返答メッセージは実行制御モジュールに受信されていない。このような場合に、停止した実行制御モジュールの代わりに新たに起動する実行制御モジュールに対して、通信ログデータから取得した返答メッセージに関する情報を設定できるので、新たに起動する実行制御モジュールにおいて返答メッセージの確認をやり直す必要がなく、実行中であった作業状態(返答メッセージの確認後の作業)に効率的に復帰させることが可能である。
上記の実施例1において、複数の運用管理手順を情報システム内で実行するようにしてもよい。そこで、以下の実施例2では、実施例2に係る運用管理手順例、動作ログおよび通信ログの構成例、情報システム(設定モジュール)の構成、情報システムの処理を順に説明し、最後に実施例2による効果を説明する。
実施例2に係る情報システムは、実行制御モジュール11(図2参照)により、作業内容および作業順序が設定された複数の運用管理手順(例えば、図9および図10参照)に基づいて、連携作業させるように各運用管理モジュール21、22および23(図2参照)を制御する。
そして、実施例2に係る情報システムの実行制御モジュール11は、図12に例示するように、各運用管理モジュール21、22および23に実行させた作業に対応する手順内容がどの運用管理手順ものか分かるように、各運用管理手順(例えば、運用管理手順Aまたは運用管理手順B)を識別するための識別情報(例えば、「A」や「B」)を動作ログに合わせて書き出しておく。また、実施例2に係る情報システムの通信ログ取得機能42は、図13に例示するように、運用管理手順の手順内容を示す番号に加えて運用管理手順の識別情報を取得する。
[情報システム(設定モジュール)の構成(実施例2)]
実施例2に係る情報システムの設定モジュール32は、実施例1に係る情報システムの設定モジュール32と基本的には同様の構成(処理機能)であるが、図14に示すように、抽出部325を新たに備える。
実施例2に係る情報システムの設定モジュール32の動作について具体的に説明する。すなわち、動作ログ解析部322は、情報管理部320からの指示を受け付けると、抽出部325に対して、例えば、運用管理手順Bの動作ログデータの取得依頼を送出する。抽出部325は、運用管理手順Bと運用管理手順Bの動作ログデータを情報部321から取得して、動作ログ解析部322に送出する。
動作ログ解析部322は、運用管理手順Bと運用管理手順Bの動作ログデータについて動作ログ解析を行った結果、運用管理手順Bについての作業が途中で停止していないことが判明した場合には、次に、抽出部325に対して、例えば、運用管理手順Aの動作ログデータの取得依頼を送出する。抽出部325は、運用管理手順Aと運用管理手順Aの動作ログデータを情報部321から取得して、動作ログ解析部322に送出する。
そして、動作ログ解析部322は、運用管理手順Aと運用管理手順Aの動作ログデータについて動作ログ解析を行った結果、運用管理手順Aについての作業が途中で停止していることが判明した場合には、運用管理手順Aと運用管理手順Aの動作ログデータについて動作ログ解析を情報管理部320に送出する。
情報解析部320は、運用管理手順Aについて、比較解析部323に動作ログ解析結果と通信ログとの比較解析指示を送出する。
比較解析部323は、情報管理部320からの指示を受け付けると、抽出部325に対して、例えば、運用管理手順Aの通信ログデータの取得依頼を送出する。抽出部325は、運用管理手順Aの通信ログデータを情報部321から取得して、比較解析部323に送出する。
[情報システムの処理(実施例2)]
続いて、図15および図16を用いて、実施例2に係る情報システムの処理を説明する。図15および図16は、実施例2に係る情報システムの処理の流れを示すシーケンス図である。なお、実施例2に係る情報システムの処理は、実施例1に係る情報システムの処理と基本的には同様であるが、以下に説明する点が異なる。
すなわち、動作ログ解析部322は、情報管理部320からの指示を受け付けると、抽出部325に対して、例えば、運用管理手順Bの動作ログデータの取得依頼を送出する(ステップS1504)。抽出部325は、運用管理手順Bと運用管理手順Bの動作ログデータを情報部321から取得して(ステップS1505)、動作ログ解析部322に送出する(ステップS1506)。
動作ログ解析部322は、運用管理手順Bと運用管理手順Bの動作ログデータについて動作ログ解析を行った結果(ステップS1507)、運用管理手順Bについての作業が途中で停止していないことが判明した場合には、次に、抽出部325に対して、例えば、運用管理手順Aの動作ログデータの取得依頼を送出する(ステップS1508)。抽出部325は、運用管理手順Aと運用管理手順Aの動作ログデータを情報部321から取得して(ステップS1509)、動作ログ解析部322に送出する(ステップS1510)。
そして、動作ログ解析部322は、運用管理手順Aと運用管理手順Aの動作ログデータについて動作ログ解析を行った結果(ステップS1511)、運用管理手順Aについての作業が途中で停止していることが判明した場合には、運用管理手順Aと運用管理手順Aの動作ログデータについて動作ログ解析を情報管理部320に送出する(ステップS1512)。
情報解析部320は、運用管理手順Aについて、比較解析部323に動作ログ解析結果と通信ログとの比較解析指示を送出する(ステップS1515)。
比較解析部323は、情報管理部320からの指示を受け付けると、抽出部325に対して、例えば、運用管理手順Aの通信ログデータの取得依頼を送出する(ステップS1516)。抽出部325は、運用管理手順Aの通信ログデータを情報部321から取得して(ステップS1517)、比較解析部323に送出する(ステップS1518)。
[実施例2による効果]
上述してきたように、実施例2によれば、動作ログデータおよび通信ログデータは、各運用管理手順(例えば、運用管理手順Aまたは運用管理手順B)を一意に識別するために付与されている識別情報(例えば、「A」や「B」)を含んで構成され、各運用管理モジュールによって連携した作業が実行されている最中に実行制御モジュールが停止した場合には、動作ログデータおよび通信ログデータを識別情報ごとに抽出するとともに、抽出された動作ログデータを解析して実行制御モジュールの停止時に用いられていた運用管理手順を特定し、この運用管理手順について抽出された動作ログデータおよび通信ログデータに基づいて、運用管理手順における復帰箇所を特定するので、複数の運用管理手順を同時に実行している場合や、それぞれが異なる運用管理手順を実行する複数の実行制御機能を動作させている場合にも対応することができ、予期せぬ障害発生などを原因として停止してしまった作業状態を実行中であった作業状態に効率的に復帰させることが可能である。
上記の実施例において、動作ログデータおよび通信ログデータを最新の状態で管理するようにしてもよい。そこで、以下の実施例3では、実施例3に係る情報システムの構成および処理を説明する。
[情報システムの構成(実施例3)]
実施例3に係る情報システムは、図17に示すように、上記の実施例に係る情報システムと基本的には同様の構成であるが、以下に説明する点が異なる。
ログ取得機能43は、実行制御モジュール11において書き込まれる動作ログデータ、および実行制御モジュール11と各運用管理モジュール(21、22および23)との間で行われる通信内容に関する通信ログデータをそれぞれ取得する。
状態管理モジュール51は、図18に示すように、情報管理部510と、情報部511と、状態管理部512と、設定部513と、抽出部514とから構成される。
情報管理部510は、実行制御モジュールから各運用管理手順(例えば、運用管理手順Aまたは運用管理手順B)を取得して、情報部511にあらかじめ登録する。また、情報管理部510は、各運用管理手順の状態および情報を登録するための領域を状態管理部512に登録する。また、ログ取得機能43により新たな動作ログデータおよび通信ログデータが取得されるたびに、情報管理部510は、ログ取得機能43から動作ログデータおよび通信ログデータを取得して、状態管理部512において管理されている各運用管理手順の状態および情報を更新する。
さらに、情報管理部510は、サーバダウンなどにより停止した実行制御モジュール11の代わりに実行制御モジュール12を起動して、実行制御モジュール11の最新情報を実行制御モジュール12に対して設定するように要求されると、状態管理部512から実行制御モジュール11の最新の状態および情報を取得する。そして、情報管理部510は、設定部513に対して、状態管理部512から取得した実行制御モジュール11の最新の状態および情報を実行制御モジュール12に設定するように依頼する。
状態管理部512は、図19に例示するように、各運用管理手順(例えば、運用管理手順Aまたは運用管理手順B)の最新の状態および情報を管理する。また、設定部513は、情報管理部510からの依頼を受け付けて、実行制御モジュール11の最新の状態および情報を実行制御モジュール12に設定する。
[情報システムによる処理(実施例3)]
次に、図20を用いて、実施例3に係る情報システムの処理を説明する。図20は、実施例3に係る情報システムの処理の流れを示すシーケンス図である。
同図に示すように、情報管理部510は、実行制御モジュールから各運用管理手順(例えば、運用管理手順Aまたは運用管理手順B)を取得して(ステップS2001)、情報部511にあらかじめ登録する(ステップS2002)。
また、情報管理部510は、各運用管理手順の状態および情報を登録するための領域を状態管理部512に登録する(ステップS2003)。そして、情報管理部510は、ログ取得機能43により新たな動作ログデータおよび通信ログデータが取得されるたびに、情報管理部510は、ログ取得機能43から動作ログデータおよび通信ログデータを取得して(ステップS2004)、状態管理部512において管理されている各運用管理手順の状態および情報を更新する(ステップS2005)。
さらに、情報管理部510は、サーバダウンなどにより停止した実行制御モジュール11の代わりに実行制御モジュール12を起動して、実行制御モジュール11の最新情報を実行制御モジュール12に対して設定するように要求されると(ステップS2006)、状態管理部512から実行制御モジュール11の最新の状態および情報を取得する(ステップS2007)。そして、情報管理部510は、設定部513に対して、状態管理部512から取得した実行制御モジュール11の最新の状態および情報を実行制御モジュール12に設定するように依頼する(ステップS2008)。
設定部513は、情報管理部510からの依頼を受け付けて、実行制御モジュール11の最新の状態および情報を実行制御モジュール12に設定する(ステップS2009)。
上記に説明してきたように、情報管理部510は、ログ取得機能43により新たな動作ログデータおよび通信ログデータが取得されるたびに、状態管理部512において管理されている各運用管理手順の状態および情報を更新する場合に限られるものではなく、一定の間隔で(あるいは、任意の間隔で)、状態管理部512において管理されている各運用管理手順の状態および情報を更新するようにしてもよい。そこで、以下では、図21を用いて、一定の間隔で(あるいは、任意の間隔で)、各運用管理手順の状態および情報を更新する場合の処理を説明する。なお、一定の間隔で(あるいは、任意の間隔で)、各運用管理手順の状態および情報を更新する場合の処理は、上記に説明した処理と以下に説明する点が異なる。
情報管理部510は、一定の間隔で(あるいは、任意の間隔で)、ログ取得機能43から動作ログデータおよび通信ログデータを取得して(ステップS2104)、情報部511に登録する(ステップS2105)。そして、情報管理部510は、状態管理部512において管理されている各運用管理手順の状態および情報の更新を抽出部514に依頼する(ステップS2106)。
抽出部514は、情報管理部510から依頼を受け付けると、情報部511から新たに登録されたログデータを取得する(ステップS2107)。そして、抽出部514は、ログデータから運用管理手順ごとに状態および情報を抽出して(ステップS2108)、状態管理部512において管理されている各運用管理手順の状態および情報を更新する(ステップS2109)。
上述してきたように、実施例3によれば、各運用管理手順の状態および情報を更新することで管理する情報を最小限に抑えつつ、実行中であった作業状態に効率的に復帰させることが可能である。
さて、これまで本発明の実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。そこで、以下では、本発明に含まれる他の実施例を説明する。
[システム構成等]
図2や図17に示した上記の実施例に係る情報システムの各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、上記の実施例に係る情報システムを構成する各機能の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
すなわち、実行制御モジュール11および12、運用管理モジュール21、22および23、設定モジュール32、通信機能41および通信ログ取得機能42の各機能は、それらの全てを同一のパーソナルコンピュータやワークステーションに搭載してもよいし、それらを別々のパーソナルコンピュータやワークステーションに搭載してもよいし、それらを任意に組合せて複数のパーソナルコンピュータやワークステーションに搭載してもよい。
さらに、実行制御モジュール11および12、運用管理モジュール21、22および23、設定モジュール32、通信機能41および通信ログ取得機能42の各機能は、ハードウェアまたはソフトウェアで実装することができるとともに、ハードウェアとソフトウェアとの組合せで実装することもできる。
(付記1)作業内容および作業順序が設定された運用管理情報に基づいて、連携作業させるように各運用管理機能を制御する実行制御機能と、当該実行制御機能からの指示に従って連携した作業を実行する各運用管理機能とを備えた情報システムに対し、当該実行制御機能が停止した場合に、当該運用管理情報に基づいて各運用管理機能を制御していた実行制御機能の動作履歴情報に基づいて、当該実行制御機能停止時の作業状態への復帰処理をコンピュータに実行させる作業状態復帰プログラムであって、
実行制御機能からの指示に従って各運用管理機能が連携した作業を実行している場合に、各運用管理機能と実行制御機能との間で行われる通信に関する通信履歴情報を取得する通信履歴情報取得手順と、
前記通信履歴情報取得手順により取得された前記通信履歴情報を記憶部に記憶する通信履歴情報記憶手順と、
各運用管理機能によって連携した作業が実行されている最中に前記実行制御機能が停止した場合には、前記通信履歴情報記憶手順により記憶部に記憶されている前記通信履歴情報と前記動作履歴情報とに基づいて、前記運用管理情報に設定された作業内容および作業順序における復帰箇所を特定する復帰箇所特定手順と、
前記復帰箇所特定手順により特定された前記復帰箇所に応じて、前記実行制御機能停止時の作業状態に復帰させる作業状態復帰手順と、
をコンピュータに実行させることを特徴とする作業状態復帰プログラム。
(付記2)前記動作履歴情報および前記通信履歴情報は、各運用管理情報を一意に識別するために付与されている識別情報を含むものであって、
各運用管理機能によって連携した作業が実行されている最中に前記実行制御機能が停止した場合には、前記識別情報に基づいて、前記動作履歴情報および前記通信履歴情報を運用管理情報ごとに抽出する情報抽出手順と、
前記情報抽出手順により運用管理情報ごとに抽出された前記動作履歴情報を解析して、前記実行制御機能の停止時に用いられていた運用管理情報を特定する運用管理情報特定手順とをさらにコンピュータに実行させ、
前記復帰箇所特定手順は、前記運用管理情報特定手順により特定された運用管理情報について、前記情報抽出手順により抽出された前記動作履歴情報および前記通信履歴情報に基づいて、前記運用管理情報における復帰箇所を特定することを特徴とする付記1に記載の作業状態復帰プログラム。
(付記3)前記運用管理情報に従って行われる作業に関する最新情報を当該運用管理情報ごとに管理する最新情報管理手順と、
前記動作履歴情報および前記通信履歴情報を取得するたびに、当該動作履歴情報および通信履歴情報に基づいて、前記最新情報管理手順により管理されている前記最新情報を更新する情報更新手順とをさらにコンピュータに実行させ、
前記作業状態復帰手順は、前記最新情報管理手順により管理されている前記最新情報に基づいて、前記実行制御機能停止時の作業状態に復帰させることを特徴とする付記2に記載の作業状態復帰プログラム。
(付記4)前記情報更新手順は、前記動作履歴情報および前記通信履歴情報を所定時間ごとに取得して、前記最新情報管理手順により管理されている前記最新情報を更新することを特徴とする付記3に記載の作業状態復帰プログラム。
(付記5)作業内容および作業順序が設定された運用管理情報に基づいて、連携作業させるように各運用管理機能を制御する実行制御機能と、当該実行制御機能からの指示に従って連携した作業を実行する各運用管理機能とを備えた情報システムにおいて、当該実行制御機能が停止した場合に、当該運用管理情報に基づいて各運用管理機能を制御していた実行制御機能の動作履歴情報に基づいて、当該実行制御機能停止時の作業状態への復帰処理をコンピュータに実行させる作業状態復帰方法であって、
前記コンピュータが、
実行制御機能からの指示に従って各運用管理機が連携した作業を実行している場合に、各運用管理機能と実行制御機能との間で行われる通信に関する通信履歴情報を取得する通信履歴情報取得工程と、
前記通信履歴情報取得工程により取得された前記通信履歴情報を記憶部に記憶する通信履歴情報記憶工程と、
各運用管理機能によって連携した作業が実行されている最中に前記実行制御機能が停止した場合には、前記通信履歴情報記憶工程により記憶部に記憶されている前記通信履歴情報と前記動作履歴情報とに基づいて、前記運用管理情報に設定された作業内容および作業順序における復帰箇所を特定する復帰箇所特定工程と、
前記復帰箇所特定工程により特定された前記復帰箇所に応じて、前記実行制御機能停止時の作業状態に復帰させる作業状態復帰工程と、
を実行することを特徴とする作業状態復帰方法。
(付記6)前記動作履歴情報および前記通信履歴情報は、各運用管理情報を一意に識別するために付与されている識別情報を含むものであって、
各運用管理機能によって連携した作業が実行されている最中に前記実行制御機能が停止した場合には、前記識別情報に基づいて、前記動作履歴情報および前記通信履歴情報を運用管理情報ごとに抽出する情報抽出工程と、
前記情報抽出工程により運用管理情報ごとに抽出された前記動作履歴情報を解析して、前記実行制御機能の停止時に用いられていた運用管理情報を特定する運用管理情報特定工程とをコンピュータがさらに実行し、
前記復帰箇所特定工程は、前記運用管理情報特定工程により特定された運用管理情報について、前記情報抽出工程により抽出された前記動作履歴情報および前記通信履歴情報に基づいて、前記運用管理情報における復帰箇所を特定することを特徴とする付記5に記載の作業状態復帰方法。
(付記7)前記運用管理情報に従って行われる作業に関する最新情報を当該運用管理情報ごとに管理する最新情報管理工程と、
前記動作履歴情報および前記通信履歴情報を取得するたびに、当該動作履歴情報および通信履歴情報に基づいて、前記最新情報管理工程により管理されている前記最新情報を更新する情報更新工程とをコンピュータがさらに実行し、
前記作業状態復帰工程は、前記最新情報管理工程により管理されている前記最新情報に基づいて、前記実行制御機能停止時の作業状態に復帰させることを特徴とする付記6に記載の作業状態復帰方法。
(付記8)前記情報更新工程は、前記動作履歴情報および前記通信履歴情報を所定時間ごとに取得して、前記最新情報管理工程により管理されている前記最新情報を更新することを特徴とする付記7に記載の作業状態復帰方法。
(付記9)作業内容および作業順序が設定された運用管理情報に基づいて、連携作業させるように各運用管理機能を制御する実行制御機能と、当該実行制御機能からの指示に従って連携した作業を実行する各運用管理機能とを備えた情報システムに対し、当該実行制御機能が停止した場合に、当該運用管理情報に基づいて各運用管理機能を制御していた実行制御機能の動作履歴情報に基づいて、当該実行制御機能停止時の作業状態に復帰させる作業状態復帰装置であって、
実行制御機能からの指示に従って各運用管理機能が連携した作業を実行している場合に、各運用管理機能と実行制御機能との間で行われる通信に関する通信履歴情報を取得する通信履歴情報取得手段と、
前記通信履歴情報取得手段により取得された前記通信履歴情報を記憶する通信履歴情報記憶手段と、
各運用管理機能によって連携した作業が実行されている最中に前記実行制御機能が停止した場合には、前記通信履歴情報記憶手段により記憶されている前記通信履歴情報と前記動作履歴情報とに基づいて、前記運用管理情報に設定された作業内容および作業順序における復帰箇所を特定する復帰箇所特定手段と、
前記復帰箇所特定手段により特定された前記復帰箇所に応じて、前記実行制御機能停止時の作業状態に復帰させる作業状態復帰手段と、
を備えたことを特徴とする作業状態復帰装置。
(付記10)前記動作履歴情報および前記通信履歴情報は、各運用管理情報を一意に識別するために付与されている識別情報を含むものであって、
各運用管理機能によって連携した作業が実行されている最中に前記実行制御機能が停止した場合には、前記識別情報に基づいて、前記動作履歴情報および前記通信履歴情報を運用管理情報ごとに抽出する情報抽出手段と、
前記情報抽出手段により運用管理情報ごとに抽出された前記動作履歴情報を解析して、前記実行制御機能の停止時に用いられていた運用管理情報を特定する運用管理情報特定手段とをさらに備え、
前記復帰箇所特定手段は、前記運用管理情報特定手段により特定された運用管理情報について、前記情報抽出手段により抽出された前記動作履歴情報および前記通信履歴情報に基づいて、前記運用管理情報における復帰箇所を特定することを特徴とする付記9に記載の作業状態復帰装置。
(付記11)前記運用管理情報に従って行われる作業に関する最新情報を当該運用管理情報ごとに管理する最新情報管理手段と、
前記動作履歴情報および前記通信履歴情報を取得するたびに、当該動作履歴情報および通信履歴情報に基づいて、前記最新情報管理手段により管理されている前記最新情報を更新する情報更新手段とをさらに備え、
前記作業状態復帰手段は、前記最新情報管理手段により管理されている前記最新情報に基づいて、前記実行制御機能停止時の作業状態に復帰させることを特徴とする付記10に記載の作業状態復帰装置。
(付記12)前記情報更新手段は、前記動作履歴情報および前記通信履歴情報を所定時間ごとに取得して、前記最新情報管理手段により管理されている前記最新情報を更新することを特徴とする付記11に記載の作業状態復帰装置。
以上のように、本発明に係る作業状態復帰プログラム、作業状態復帰方法および作業状態復帰装置は、作業内容および作業順序が設定された運用管理情報に基づいて、連携作業させるように各運用管理機能を制御する実行制御機能と、当該実行制御機能からの指示に従って連携した作業を実行する各運用管理機能とを備えた情報システムに対し、当該実行制御機能が停止した場合に、当該運用管理情報に基づいて各運用管理機能を制御していた実行制御機能の動作履歴情報に基づいて、当該実行制御機能停止時の作業状態への復帰処理をコンピュータに実行させる場合等に有用であり、特に、実行中であった作業状態に効率的に復帰させることに適する。
実施例1に係る情報システムの概要および特徴を説明するための図である。 実施例1に係る情報システムの構成図である。 実施例1に係る運用管理手順例を示す図である。 実施例1に係る運用管理手順の記述例を示す図である。 実施例1に係る動作ログの構成例を示す図である。 実施例1に係る通信ログの構成例を示す図である。 実施例1に係る設定モジュールの構成を示す図である。 実施例1に係る情報システムの処理の流れを示すシーケンス図である。 実施例2に係る運用管理手順例を示す図である。 実施例2に係る運用管理手順の記述例を示す図である。 実施例2に係る運用管理手順の記述例を示す図である。 実施例2に係る動作ログの構成例を示す図である。 実施例2に係る通信ログの構成例を示す図である。 実施例2に係る設定モジュールの構成を示す図である。 実施例2に係る情報システムの処理の流れを示すシーケンス図である。 実施例2に係る情報システムの処理の流れを示すシーケンス図である。 実施例3に係る情報システムの構成図である。 実施例3に係る状態管理モジュールの構成を示す図である。 実施例3に係る状態管理モジュールが管理する情報の構成例を示す図である。 実施例3に係る情報システムの処理の流れを示すシーケンス図である。 実施例3に係る情報システムの処理の流れを示すシーケンス図である。 従来の情報システムの構成図である。 従来の情報システムを説明するための図である。
符号の説明
1、11、12 実行制御モジュール
2、21、22、23 運用管理モジュール
3、32 設定モジュール
320 情報管理部
321 情報部
322 動作ログ解析部
323 比較解析部
324 設定部
325 抽出部
4、41 通信機能
42 通信ログ取得機能
43 ログ取得機能
51 状態管理モジュール
510 情報管理部
511 情報部
512 状態管理部
513 設定部
514 抽出部

Claims (6)

  1. 作業内容および作業順序が設定された運用管理情報に基づいて、連携作業させるように各運用管理機能を制御する実行制御機能と、当該実行制御機能からの指示に従って連携した作業を実行する各運用管理機能とを備えた情報システムに対し、当該実行制御機能が停止した場合に、当該運用管理情報に基づいて各運用管理機能を制御していた実行制御機能の動作履歴情報に基づいて、当該実行制御機能停止時の作業状態への復帰処理をコンピュータに実行させる作業状態復帰プログラムであって、
    実行制御機能からの指示に従って各運用管理機能が連携した作業を実行している場合に、各運用管理機能と実行制御機能との間で行われる通信に関する通信履歴情報を取得する通信履歴情報取得手順と、
    前記通信履歴情報取得手順により取得された前記通信履歴情報を記憶部に記憶する通信履歴情報記憶手順と、
    各運用管理機能によって連携した作業が実行されている最中に前記実行制御機能が停止した場合には、前記通信履歴情報記憶手順により記憶部に記憶されている前記通信履歴情報と前記動作履歴情報とに基づいて、前記運用管理情報に設定された作業内容および作業順序における復帰箇所を特定する復帰箇所特定手順と、
    前記復帰箇所特定手順により特定された前記復帰箇所に応じて、前記実行制御機能停止時の作業状態に復帰させる作業状態復帰手順と、
    をコンピュータに実行させることを特徴とする作業状態復帰プログラム。
  2. 前記動作履歴情報および前記通信履歴情報は、各運用管理情報を一意に識別するために付与されている識別情報を含むものであって、
    各運用管理機能によって連携した作業が実行されている最中に前記実行制御機能が停止した場合には、前記識別情報に基づいて、前記動作履歴情報および前記通信履歴情報を運用管理情報ごとに抽出する情報抽出手順と、
    前記情報抽出手順により運用管理情報ごとに抽出された前記動作履歴情報を解析して、前記実行制御機能の停止時に用いられていた運用管理情報を特定する運用管理情報特定手順とをさらにコンピュータに実行させ、
    前記復帰箇所特定手順は、前記運用管理情報特定手順により特定された運用管理情報について、前記情報抽出手順により抽出された前記動作履歴情報および前記通信履歴情報に基づいて、前記運用管理情報における復帰箇所を特定することを特徴とする請求項1に記載の作業状態復帰プログラム。
  3. 前記運用管理情報に従って行われる作業に関する最新情報を当該運用管理情報ごとに管理する最新情報管理手順と、
    前記動作履歴情報および前記通信履歴情報を取得するたびに、当該動作履歴情報および通信履歴情報に基づいて、前記最新情報管理手順により管理されている前記最新情報を更新する情報更新手順とをさらにコンピュータに実行させ、
    前記作業状態復帰手順は、前記最新情報管理手順により管理されている前記最新情報に基づいて、前記実行制御機能停止時の作業状態に復帰させることを特徴とする請求項2に記載の作業状態復帰プログラム。
  4. 前記情報更新手順は、前記動作履歴情報および前記通信履歴情報を所定時間ごとに取得して、前記最新情報管理手順により管理されている前記最新情報を更新することを特徴とする請求項3に記載の作業状態復帰プログラム。
  5. 作業内容および作業順序が設定された運用管理情報に基づいて、連携作業させるように各運用管理機能を制御する実行制御機能と、当該実行制御機能からの指示に従って連携した作業を実行する各運用管理機能とを備えた情報システムに対し、当該実行制御機能が停止した場合に、当該運用管理情報に基づいて各運用管理機能を制御していた実行制御機能の動作履歴情報に基づいて、当該実行制御機能停止時の作業状態への復帰処理をコンピュータに実行させる作業状態復帰方法であって、
    前記コンピュータが、
    実行制御機能からの指示に従って各運用管理機能が連携した作業を実行している場合に、各運用管理機能と実行制御機能との間で行われる通信に関する通信履歴情報を取得する通信履歴情報取得工程と、
    前記通信履歴情報取得工程により取得された前記通信履歴情報を記憶部に記憶する通信履歴情報記憶工程と、
    各運用管理機能によって連携した作業が実行されている最中に前記実行制御機能が停止した場合には、前記通信履歴情報記憶工程により記憶部に記憶されている前記通信履歴情報と前記動作履歴情報とに基づいて、前記運用管理情報に設定された作業内容および作業順序における復帰箇所を特定する復帰箇所特定工程と、
    前記復帰箇所特定工程により特定された前記復帰箇所に応じて、前記実行制御機能停止時の作業状態に復帰させる作業状態復帰工程と、
    を実行することを特徴とする作業状態復帰方法。
  6. 作業内容および作業順序が設定された運用管理情報に基づいて、連携作業させるように各運用管理機能を制御する実行制御機能と、当該実行制御機能からの指示に従って連携した作業を実行する各運用管理機能とを備えた情報システムに対し、当該実行制御機能が停止した場合に、当該運用管理情報に基づいて各運用管理機能を制御していた実行制御機能の動作履歴情報に基づいて、当該実行制御機能停止時の作業状態に復帰させる作業状態復帰装置であって、
    実行制御機能からの指示に従って各運用管理機能が連携した作業を実行している場合に、各運用管理機能と実行制御機能との間で行われる通信に関する通信履歴情報を取得する通信履歴情報取得手段と、
    前記通信履歴情報取得手段により取得された前記通信履歴情報を記憶する通信履歴情報記憶手段と、
    各運用管理機能によって連携した作業が実行されている最中に前記実行制御機能が停止した場合には、前記通信履歴情報記憶手段により記憶されている前記通信履歴情報と前記動作履歴情報とに基づいて、前記運用管理情報に設定された作業内容および作業順序における復帰箇所を特定する復帰箇所特定手段と、
    前記復帰箇所特定手段により特定された前記復帰箇所に応じて、前記実行制御機能停止時の作業状態に復帰させる作業状態復帰手段と、
    を備えたことを特徴とする作業状態復帰装置。
JP2007013862A 2007-01-24 2007-01-24 作業状態復帰プログラム、作業状態復帰方法および作業状態復帰装置 Pending JP2008181298A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007013862A JP2008181298A (ja) 2007-01-24 2007-01-24 作業状態復帰プログラム、作業状態復帰方法および作業状態復帰装置
US11/987,394 US20080178182A1 (en) 2007-01-24 2007-11-29 Work state returning apparatus, work state returning method, and computer product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007013862A JP2008181298A (ja) 2007-01-24 2007-01-24 作業状態復帰プログラム、作業状態復帰方法および作業状態復帰装置

Publications (1)

Publication Number Publication Date
JP2008181298A true JP2008181298A (ja) 2008-08-07

Family

ID=39642508

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007013862A Pending JP2008181298A (ja) 2007-01-24 2007-01-24 作業状態復帰プログラム、作業状態復帰方法および作業状態復帰装置

Country Status (2)

Country Link
US (1) US20080178182A1 (ja)
JP (1) JP2008181298A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011048678A (ja) * 2009-08-27 2011-03-10 Fujitsu Ltd 業務操作支援方法及びコンピュータ装置

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102012019541A1 (de) 2011-10-24 2013-04-25 Mann+Hummel Gmbh Befeuchtungseinrichtung für eine Brennstoffzelle
US9690676B2 (en) * 2013-03-15 2017-06-27 Aerohive Networks, Inc. Assigning network device subnets to perform network activities using network device information
US9948626B2 (en) 2013-03-15 2018-04-17 Aerohive Networks, Inc. Split authentication network systems and methods
US9152782B2 (en) 2013-12-13 2015-10-06 Aerohive Networks, Inc. Systems and methods for user-based network onboarding

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH086910A (ja) * 1994-06-23 1996-01-12 Hitachi Ltd クラスタ型計算機システム
JPH11259326A (ja) * 1998-03-13 1999-09-24 Ntt Communication Ware Kk ホットスタンバイシステムおよびホットスタンバイシステムにおける自動再実行方法およびその記録媒体

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005301436A (ja) * 2004-04-07 2005-10-27 Hitachi Ltd クラスタシステムおよびクラスタシステムにおける障害回復方法
US7661015B2 (en) * 2006-05-16 2010-02-09 Bea Systems, Inc. Job scheduler

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH086910A (ja) * 1994-06-23 1996-01-12 Hitachi Ltd クラスタ型計算機システム
JPH11259326A (ja) * 1998-03-13 1999-09-24 Ntt Communication Ware Kk ホットスタンバイシステムおよびホットスタンバイシステムにおける自動再実行方法およびその記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011048678A (ja) * 2009-08-27 2011-03-10 Fujitsu Ltd 業務操作支援方法及びコンピュータ装置

Also Published As

Publication number Publication date
US20080178182A1 (en) 2008-07-24

Similar Documents

Publication Publication Date Title
KR101970839B1 (ko) 서비스의 2차 위치에서의 작업의 재생 기법
US7779298B2 (en) Distributed job manager recovery
US7698391B2 (en) Performing a provisioning operation associated with a software application on a subset of the nodes on which the software application is to operate
US11121906B2 (en) Data plane API in a distributed computing network
US20070244999A1 (en) Method, apparatus, and computer product for updating software
WO2012056596A1 (ja) 計算機システム及び処理制御方法
KR20160136489A (ko) 클라우드 서비스를 위한 가상화 기반 자원 관리 방법
JP2008210412A (ja) マルチノード分散データ処理システムにおいてリモート・アクセス可能なリソースを管理する方法
CN102346460A (zh) 一种基于事务的服务控制系统及其控制方法
CN103095845B (zh) 一种实现分布式通信的方法和系统
JP2008257675A (ja) マネージメントソフトウェアを履行する方法、予め構成されたソフトウェアを有するハードウェアおよびその履行方法
JP2013218687A (ja) サーバー監視システム及びその方法
CN102833310A (zh) 一种基于虚拟化技术的工作流引擎集群系统
KR20110083084A (ko) 가상화를 이용한 서버 운영 장치 및 방법
WO2014171130A1 (ja) 情報処理システム、配備方法、処理装置、及び、配備装置
JP2008181298A (ja) 作業状態復帰プログラム、作業状態復帰方法および作業状態復帰装置
CN113220416A (zh) 基于云平台的集群节点伸缩系统及实现方法和运行方法
JP5377231B2 (ja) ジョブネット制御プログラムおよびジョブネット制御装置
JP6326062B2 (ja) 異なる環境どうし間でのジョブ実行依頼のトランスペアレントなルーティング
JP4870794B2 (ja) 仮想マシンの監視管理装置、監視管理方法及びコンピュータプログラム
JP5632403B2 (ja) タスク管理システム、タスク管理サーバ、タスク管理方法、及びタスク管理プログラム
CN112579253B (zh) 一种管理容器的方法及系统
JP4700104B2 (ja) サーバ管理方法、プログラム及び装置
Tsaregorodtsev et al. DIRAC, the LHCb data production and distributed analysis system
Jankowski et al. Grid checkpointing architecture-a revised proposal

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090421

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090428

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091208