JP5024450B2 - 復旧方法管理プログラム、復旧方法管理装置及び復旧方法管理方法 - Google Patents

復旧方法管理プログラム、復旧方法管理装置及び復旧方法管理方法 Download PDF

Info

Publication number
JP5024450B2
JP5024450B2 JP2010514317A JP2010514317A JP5024450B2 JP 5024450 B2 JP5024450 B2 JP 5024450B2 JP 2010514317 A JP2010514317 A JP 2010514317A JP 2010514317 A JP2010514317 A JP 2010514317A JP 5024450 B2 JP5024450 B2 JP 5024450B2
Authority
JP
Japan
Prior art keywords
work
information
recovery
failure
recovery method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010514317A
Other languages
English (en)
Other versions
JPWO2009144825A1 (ja
Inventor
正純 松原
安英 松本
幸洋 渡辺
邦昭 嶋田
裕二 和田
健司 森本
浩 大塚
昭 勝野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2009144825A1 publication Critical patent/JPWO2009144825A1/ja
Application granted granted Critical
Publication of JP5024450B2 publication Critical patent/JP5024450B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/085Retrieval of network configuration; Tracking network configuration history
    • H04L41/0853Retrieval of network configuration; Tracking network configuration history by actively collecting configuration information or by backing up configuration information
    • H04L41/0856Retrieval of network configuration; Tracking network configuration history by actively collecting configuration information or by backing up configuration information by backing up or archiving configuration information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/085Retrieval of network configuration; Tracking network configuration history
    • H04L41/0859Retrieval of network configuration; Tracking network configuration history by keeping history of different configuration generations or by rolling back to previous configuration versions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/085Retrieval of network configuration; Tracking network configuration history
    • H04L41/0859Retrieval of network configuration; Tracking network configuration history by keeping history of different configuration generations or by rolling back to previous configuration versions
    • H04L41/0863Retrieval of network configuration; Tracking network configuration history by keeping history of different configuration generations or by rolling back to previous configuration versions by rolling back to previous configuration versions

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、例えば複数のサーバ等を含むITシステム内の障害を復旧するための復旧方法をオペレータ側に提示可能にする復旧方法管理プログラム、復旧方法管理装置及び復旧方法管理方法に関する。
従来、複数のサーバ等を含むITシステム内に障害が発生し、オペレータが、その障害を復旧する復旧方法を知らない場合、復旧方法手順書に基づき、オペレータ判断で復旧作業を行うようにしていた。
しかしながら、復旧方法手順書の膨大な情報から適切な復旧方法を選択する作業は、オペレータ自身のスキルに大きく依存し、オペレータ自身に大きな負担がかかることになる。
そこで、近年では、復旧方法を選択する際のオペレータの負担を軽減すべく、次のような復旧方法管理システムが知られている。
図8は、従来の復旧方法管理システム内部の概略構成を示すブロック図である。
図8に示す復旧方法管理システム100は、複数のサーバ等を含むITシステム101と、ITシステム101内の障害を監視するオペレータ端末102と、過去の障害に対する復旧方法を記憶管理する過去復旧方法データベース(以下、単にDBと称する)103と、過去復旧方法DB103を管理する過去復旧方法管理装置104とを有している。
オペレータ端末102は、様々なコマンド等の情報を入力する操作部111と、様々な情報を表示する表示部112と、操作部111のコマンド入力に応じて、例えばITシステム101内の障害に対する復旧作業を実行する作業実行部113と、オペレータ端末102全体を制御する端末制御部114とを有している。
過去復旧方法管理装置104は、オペレータ端末102からの障害状況を検出すると、過去復旧方法DB103から障害状況に対応する過去の復旧方法を検索する過去復旧方法検索部121と、この過去復旧方法検索部121にて検索した障害状況に対応する過去の復旧方法をオペレータ端末102に通知する復旧方法提示部122とを有している。
オペレータ端末102は、復旧方法提示部122を通じて障害状況に対応する過去の復旧方法を取得すると、過去の復旧方法を表示部112に表示するものである。
その結果、オペレータ端末102は、表示部112に表示中の障害状況に対応する過去の復旧方法に基づき、障害に対する復旧作業を実行することができる。
従って、従来の復旧方法管理システム100では、ITシステム101内に障害が発生したとしても、オペレータ端末102が障害状況を過去復旧方法管理装置104に通知すると共に、過去復旧方法管理装置104側では障害状況に応じて過去の復旧方法を検索し、検索した過去の復旧方法をオペレータ端末102に提示するようにしたので、オペレータ側では、障害に対する復旧方法を知らなくても、過去復旧方法DB103内に記憶中の過去の障害状況に対する復旧方法を簡単に取得できるため、オペレータ側の負担を大幅に軽減することができる。
特開平6−103047号公報 特開2008−90504号公報
しかしながら、上記従来の復旧方法管理システム100によれば、過去復旧方法DB103の記憶内容に大きく依存することになるため、過去復旧方法DB103に記憶されていない未知の障害状況に対する復旧方法についてはオペレータ判断に委ねられていることから、オペレータ側に負担がかかる。
本発明は上記点に鑑みてなされたものであり、その目的とするところは、障害が発生したとしても、オペレータに負担をかけることなく、障害に対する復旧方法を選択可能にした復旧方法管理プログラム、復旧方法管理装置及び復旧方法管理方法を提供することにある。
開示プログラムは、作業開始コマンドを検出すると、システム内部の作業対象に対する作業を実行すると共に、作業完了コマンドを検出すると、前記作業対象に対する実行中の作業を完了する作業実行手順と、前記作業実行手順にて実行した作業対象毎に作業方法を示す作業方法情報を作成する作業方法情報作成手順と、前記作業開始コマンドを検出すると、前記システム内部の作業開始前のシステム情報を取得すると共に、前記作業完了コマンドを検出すると、作業完了後のシステム情報を取得し、これら取得した作業開始前のシステム情報と作業完了後のシステム情報との差分情報に基づき、前記作業対象毎に作業前後のシステム変化に関わる作業前後変化情報を作成する作業前後変化情報作成手順と、前記作業方法情報作成手順にて作成した前記作業方法情報と前記作業前後変化情報作成手順にて作成した前記作業前後変化情報とを前記作業対象毎に作業情報管理記憶部に記憶管理する作業情報管理記憶手順と、前記作業情報管理記憶部に記憶中の前記作業方法情報に基づき、前記作業対象の内、類似する復旧作業対象毎に復旧方法を示す復旧方法情報を作成する復旧方法情報作成手順と、前記作業情報管理記憶部に記憶中の前記作業前後変化情報に基づき、前記復旧作業対象毎に復旧作業前後のシステム変化に関わる復旧前後変化情報を作成する復旧前後変化情報作成手順と、前記復旧方法情報作成手順にて作成した前記復旧方法情報及び前記復旧前後変化情報作成手順にて作成した前記復旧前後変化情報を前記復旧作業対象毎に復旧方法管理記憶部に記憶管理する復旧方法管理記憶手順と、をコンピュータ装置に実行させることを要件とする。
また、開示装置は、作業開始コマンドを検出すると、システム内部の作業対象に対する作業を実行すると共に、作業完了コマンドを検出すると、前記作業対象に対する実行中の作業を完了する作業実行部と、前記作業実行部にて実行した作業対象毎に作業方法を示す作業方法情報を作成する作業方法情報作成部と、前記作業開始コマンドを検出すると、前記システム内部の作業開始前のシステム情報を取得すると共に、前記作業完了コマンドを検出すると、作業完了後のシステム情報を取得し、これら取得した作業開始前のシステム情報と作業完了後のシステム情報との差分情報に基づき、前記作業対象毎に作業前後のシステム変化に関わる作業前後変化情報を作成する作業前後変化情報作成部と、前記作業方法情報作成部にて作成した前記作業方法情報と前記作業前後変化情報作成部にて作成した前記作業前後変化情報とを前記作業対象毎に記憶管理する作業情報管理記憶部と、前記作業情報管理記憶部に記憶中の前記作業方法情報に基づき、前記作業対象の内、類似する復旧作業対象毎に復旧方法を示す復旧方法情報を作成する復旧方法情報作成部と、前記作業情報管理記憶部に記憶中の前記作業前後変化情報に基づき、前記復旧作業対象毎に復旧作業前後のシステム変化に関わる復旧前後変化情報を作成する復旧前後変化情報作成部と、前記復旧方法情報作成部にて作成した前記復旧方法情報及び前記復旧前後変化情報作成部にて作成した前記復旧前後変化情報を前記復旧作業対象毎に記憶管理する復旧方法管理記憶部と、を有することを要件とする。
また、開示方法は、作業開始コマンドを検出すると、システム内部の作業対象に対する作業を実行すると共に、作業完了コマンドを検出すると、前記作業対象に対する実行中の作業を完了する作業実行ステップと、前記作業実行ステップにて実行した作業対象毎に作業方法を示す作業方法情報を作成する作業方法情報作成ステップと、前記作業開始コマンドを検出すると、前記システム内部の作業開始前のシステム情報を取得すると共に、前記作業完了コマンドを検出すると、作業完了後のシステム情報を取得し、これら取得した作業開始前のシステム情報と作業完了後のシステム情報との差分情報に基づき、前記作業対象毎に作業前後のシステム変化に関わる作業前後変化情報を作成する作業前後変化情報作成ステップと、前記作業方法情報作成ステップにて作成した前記作業方法情報と前記作業前後変化情報作成ステップにて作成した前記作業前後変化情報とを前記作業対象毎に作業情報管理記憶部に記憶管理する作業情報管理記憶ステップと、前記作業情報管理記憶部に記憶中の前記作業方法情報に基づき、前記作業対象の内、類似する復旧作業対象毎に復旧方法を示す復旧方法情報を作成する復旧方法情報作成ステップと、前記作業情報管理記憶部に記憶中の前記作業前後変化情報に基づき、前記復旧作業対象毎に復旧作業前後のシステム変化に関わる復旧前後変化情報を作成する復旧前後変化情報作成ステップと、前記復旧方法情報作成ステップにて作成した前記復旧方法情報及び前記復旧前後変化情報作成ステップにて作成した前記復旧前後変化情報を前記復旧作業対象毎に復旧方法管理記憶部に記憶管理する復旧方法管理記憶ステップと、を含むことを要件とする。
開示プログラム、開示装置及び開示方法によれば、作業開始前及び作業完了後のシステム情報との差分情報に基づく作業前後変化情報と作業方法を示す作業方法情報とを常時、作業対象毎に作業情報管理記憶部に記憶し、さらに、作業情報管理記憶部に記憶中の作業方法情報及び作業前後変化情報に基づき、作業対象の内、類似する復旧作業対象毎に、復旧作業前後のシステム変化に関わる復旧前後変化情報と復旧方法を示す復旧方法情報とを復旧方法管理記憶部に記憶するようにした。
つまり、常時、作業対象毎に作業方法情報及び作業前後変化情報を作業情報管理記憶部に記憶して、各作業がシステムに及ぼす影響を事前に把握し、これら作業方法情報及び作業前後変化情報に基づき、復旧作業対象毎の復旧方法情報及び復旧前後変化情報を復旧方法管理記憶部に記憶するようにしたので、未知の障害が発生したとしても、復旧方法管理記憶部の記憶内容を利用して、障害に該当する復旧作業対象及び復旧前後変化情報に基づき、未知の障害に対する復旧方法(復旧方法情報)を選択することが可能になるため、オペレータへの負担を軽減できるという効果を奏する。
図1は、本発明の復旧方法管理装置の実施例である復旧方法管理システム内部の概略構成を示すブロック図である。 図2は、本実施例の要部である作業/復旧方法管理装置及び復旧方法DB内部の概略構成を示すブロック図である。 図3は、復旧方法DB内部の作業情報管理記憶部及び復旧方法管理記憶部内部の記憶内容を端的に示す説明図である。 図4は、障害発生前のシステム情報と障害発生後のシステム情報との関係を端的に示す説明図である。 図5は、復旧方法管理処理に関わる復旧方法管理システム内部の処理動作を示すフローチャートである。 図6は、障害復旧方法提示処理に関わる復旧方法管理システム内部の処理動作を示すフローチャートである。 図7は、障害復旧方法決定処理に関わる作業/復旧方法管理装置内部の処理動作を示すフローチャートである。 図8は、従来技術の復旧方法管理システム内部の概略構成を示すブロック図である。
以下、図面に基づき本発明の復旧方法管理プログラム、復旧方法管理装置及び復旧方法管理方法に関わる実施例について詳細に説明する。
まず、最初に本実施例の概要を説明する。本実施例では、作業開始前及び作業完了後のシステム情報との差分情報に基づき、作業対象毎に作成した作業前後変化情報と作業対象毎に作成した作業方法を示す作業方法情報とを作業情報管理記憶部に記憶することで、常時、各作業がシステムに及ぼす影響を事前に把握できる。
さらに、本実施例では、作業情報管理記憶部に記憶中の作業方法情報及び作業前後変化情報に基づき、作業対象の内、類似する復旧作業対象毎に復旧作業前後のシステム変化に関わる復旧前後変化情報と復旧作業対象毎に復旧方法を示す復旧方法情報とを復旧方法管理記憶部に記憶する。
この結果、未知の障害が発生したとしても、復旧方法管理記憶部の記憶内容を利用して、障害に該当する復旧作業対象及び復旧前後変化情報に基づき、未知の障害に対する復旧方法(復旧方法情報)を選択することが可能になるため、オペレータへの負担を軽減できるというものである。
図1は、本実施例の復旧方法管理システム内部の概略構成を示すブロック図である。
図1に示す復旧方法管理システム1は、複数のサーバ等を含むITシステム2と、ITシステム2内の障害を監視するオペレータ端末3と、過去の障害に対する復旧方法を記憶管理する過去復旧方法DB4と、過去復旧方法DB4を管理する過去復旧方法管理装置5とを有している。
オペレータ端末3は、様々なコマンド等の情報を入力する操作部11と、様々な情報を表示する表示部12と、操作部11のコマンド入力に応じて、例えばITシステム2内の障害に対する復旧作業を実行する作業実行部13と、オペレータ端末3全体を制御する端末制御部14とを有している。
過去復旧方法管理装置5は、オペレータ端末3からの障害状況を検出すると、過去復旧方法DB4から障害状況に対応する過去の復旧方法を検索する過去復旧方法検索部21と、この過去復旧方法検索部21にて検索した障害状況に対応する過去の復旧方法をオペレータ端末3に通知する復旧方法提示部22とを有している。
オペレータ端末3は、復旧方法提示部22を通じて障害状況に対応する過去の復旧方法を取得すると、過去の復旧方法を表示部12に表示するものである。
その結果、オペレータ端末3は、表示部12に表示中の障害状況に対応する過去の復旧方法に基づき復旧作業を実行するものである。
また、オペレータ端末3の作業実行部13は、操作部11からの作業開始コマンドを検出すると、ITシステム2内部の作業対象に対する作業を実行すると共に、操作部11からの作業完了コマンドを検出すると、作業対象に対する実行中の作業を完了するものである。
さらに、復旧方法管理システム1は、未知の障害に対する復旧方法を記憶管理する復旧方法DB6と、復旧方法DB6を管理する作業/復旧方法管理装置7と、ITシステム2内部のシステム情報を所定タイミング毎に順次履歴記憶する履歴管理DB8とを有している。
尚、システム情報とは、ITシステム2内の構成情報・性能情報・ステータス情報等を含み、構成情報は、図4に示すように、例えばITシステム2内のサーバ、CPU、メモリやアプリケーション等の構成に関わる情報に相当し、性能情報は、例えばCPUのクロック周波数、メモリの容量、アプリケーションの平均レスポンス時間等の性能に関わる情報に相当するものである。
図2は、作業/復旧方法管理装置7及び復旧方法DB6内部の概略構成を示すブロック図である。
図2に示す作業/復旧方法管理装置7は、作業/復旧方法管理装置7全体及び復旧方法DB6を管理制御する管理制御部30を有している。
管理制御部30は、オペレータ端末3側の作業実行部13にて実行した作業対象毎に作業方法を示す作業方法情報を作成する作業方法情報作成部31と、オペレータ端末3側の作業開始コマンドを検出すると、ITシステム2内部の作業開始前のシステム情報を取得すると共に、オペレータ端末3側の作業完了コマンドを検出すると、作業完了後のシステム情報を取得する作業前後変化情報作成部32とを有している。
尚、作業対象とは、図3に示すように、例えば“サーバ1の状態”や“サーバ1のメモリの状態”等の作業の対象に相当するものである。
作業方法情報は、図3に示すように、例えば“サーバ1に対してshutdownコマンドを実行”や“サーバ1のメモリ交換”等のように作業対象に対する作業方法を示す情報に相当するものである。
作業方法情報作成部31は、例えばオペレータ端末3側の手入力や作業コマンド入力に応じて作業方法情報を作成するものである。
作業前後変化情報作成部32は、オペレータ端末3側の作業開始コマンドを検出すると、ITシステム2内部の作業開始前のシステム情報を履歴管理DB8又はITシステム2から取得すると共に、オペレータ端末3側の作業完了コマンドを検出すると、作業完了後のシステム情報を履歴管理DB8又はITシステム2から取得するものである。
また、作業前後変化情報作成部32は、作業開始前のシステム情報及び作業完了後のシステム情報を取得すると、これら取得した作業開始前のシステム情報と作業完了後のシステム情報との差分情報に基づき、作業対象毎に作業前後のシステム変化に関わる作業前後変化情報を作成するものである。
尚、作業前後変化情報は、図3に示すように、例えば作業対象を“サーバ1のメモリの状態”とした場合、“error→normal”や、作業対象を“アプリ1の平均レスポンス時間”とした場合、“3000msec→50msec”等のように作業対象毎の作業前後のシステム変化に相当するものである。
また、復旧方法DB6は、作業方法情報作成部31にて作成した作業方法情報と、作業前後変化情報作成部32にて作成した作業前後変化情報とを作業対象毎に記憶管理する作業情報管理記憶部41を有している。
また、管理制御部30は、作業情報管理記憶部41に記憶中の作業方法情報に基づき、作業対象の内、類似する復旧作業対象毎に復旧方法を示す復旧方法情報を作成する復旧方法情報作成部33を有している。
尚、類似する復旧作業対象とは、例えば図3に示す作業情報管理記憶部41に記憶中の“サーバ1の状態”や“サーバ2の状態”等の作業対象を集約した“サーバの状態”等の作業対象に相当するものである。
復旧方法情報は、例えば図3に示す作業情報管理記憶部41に記憶中の“サーバ1に対してshutdownコマンドを実行”や“サーバ2に対してshutdownコマンドを実行”等の作業方法情報を集約した“shutdownコマンドを実行”等の作業方法情報に相当するものである。
また、管理制御部30は、作業情報管理記憶部41に記憶中の作業前後変化情報に基づき、復旧作業対象毎に復旧作業前後のシステム変化に関わる復旧前後変化情報を作成する復旧前後変化情報作成部34を有している。
また、復旧方法DB6は、復旧方法情報作成部33にて作成した復旧方法情報及び復旧前後変化情報作成部34にて作成した復旧前後変化情報を、図3に示すように復旧作業対象毎に記憶管理する復旧方法管理記憶部42を有している。
また、管理制御部30は、障害発生コマンドを検出すると、障害発生前のシステム情報を履歴管理DB8から取得し、障害発生後のシステム情報を履歴管理DB8又はITシステム2から取得する障害情報作成部35を有している。
障害情報作成部35は、これら取得した障害発生前のシステム情報と障害発生後のシステム情報との差分情報に基づき、障害対象及び、障害発生前後のシステム変化に関わる障害前後変化情報を作成するものである。
尚、障害対象とは、例えば、障害が発生した“サーバ1の状態”や“サーバ1のメモリの状態”等の障害の対象に相当するものである。
障害前後変化情報は、例えば障害対象を“サーバ1のメモリの状態”とした場合、“normal→error”や、障害対象を“アプリ1の平均レスポンス時間”とした場合、“50msec→3000msec”等のように障害対象毎の障害発生前後のシステム変化に相当するものである。
また、管理制御部30は、障害情報作成部35にて作成した障害対象及び障害前後変化情報に該当する復旧作業対象及び復旧前後変化情報が復旧方法管理記憶部42内にある場合、この復旧前後変化情報に対応する復旧方法情報を復旧方法管理記憶部42から取得し、取得した復旧方法情報をオペレータ端末3に提示すべく、過去復旧方法管理装置5に通知する復旧方法検索部36を有している。
復旧方法検索部36は、障害情報作成部35にて作成した障害対象に該当する復旧作業対象が復旧方法管理記憶部42内にあるか否かを判定するものである。
復旧方法検索部36は、障害対象に該当する復旧作業対象が復旧方法管理記憶部42内にある場合、この障害対象の障害前後変化情報に該当する復旧作業対象の復旧前後変化情報が復旧方法管理記憶部42内にあるか否かを判定するものである。
復旧方法検索部36は、障害対象の障害前後変化情報に該当する復旧作業対象の復旧前後変化情報が復旧方法管理記憶部42内にある場合、復旧前後変化情報に対応する復旧方法情報を復旧方法管理記憶部42から取得するものである。
尚、障害前後変化情報に該当する復旧前後変化情報とは、例えば障害対象“サーバ1のメモリの状態”で障害前後変化情報が“normal→error”の場合、障害発生後の状態“error”から障害発生前の状態“normal”に戻すための復旧作業対象“サーバのメモリの状態”の復旧前後変化情報“error→normal”に相当するものである。この場合、復旧方法情報は、図3に示すように“メモリ部品交換”ということになる。
次に本実施例の復旧方法管理システム1の動作について説明する。図5は、復旧方法管理処理に関わる復旧方法管理システム1内部の処理動作を示すフローチャートである。
図5に示す復旧方法管理処理とは、常時、作業から、未知の障害に対する復旧方法を記憶管理する復旧方法DB6を更新するための処理である。
図5において作業/復旧方法管理装置7内部の管理制御部30は、オペレータ端末3側の作業開始コマンドを検出したか否かを判定する(ステップS11)。
管理制御部30内部の作業前後変化情報作成部32は、作業開始コマンドを検出した場合(ステップS11肯定)、ITシステム2内部の作業開始前のシステム情報を履歴管理DB8又はITシステム2から取得する(ステップS12)。
オペレータ端末3は、作業開始コマンドに対応するITシステム2内部の作業を実行する(ステップS13)。
さらに、作業前後変化情報作成部32は、オペレータ端末3側の作業完了コマンドを検出したか否かを判定する(ステップS14)。
作業前後変化情報作成部32は、オペレータ端末3側の作業完了コマンドを検出した場合(ステップS14肯定)、ITシステム2内部の作業完了後のシステム情報を取得する(ステップS15)。
作業前後変化情報作成部32は、作業開始前のシステム情報と作業完了後のシステム情報との差分情報を取得し(ステップS16)、差分情報に基づき、作業対象毎に作業前後のシステム変化に関わる作業前後変化情報を作成する(ステップS17)。尚、作業方法情報作成部31は、作業対象毎に作業方法を示す作業方法情報を作成する。
管理制御部30は、作業対象毎に、図3に示すように、作業方法情報作成部31にて作成した作業方法情報及び、作業前後変化情報作成部32にて作成した作業前後変化情報を作業情報管理記憶部41に記憶する(ステップS18)。
管理制御部30内の復旧方法情報作成部33は、作業情報管理記憶部41に記憶中の作業方法情報に基づき、類似する作業対象を集約した復旧作業対象毎に復旧方法情報を作成する(ステップS19)。尚、復旧作業対象は、例えば図3に示すように作業対象“サーバ1の状態”や“サーバ2の状態”を集約した“サーバの状態”に相当し、復旧方法情報は“shutdownコマンドを実行”に相当するものである。
管理制御部30内の復旧前後変化情報作成部34は、作業情報管理記憶部41に記憶中の作業前後変化情報に基づき、類似する作業対象を集約した復旧作業対象毎に復旧前後変化情報を作成する(ステップS20)。
管理制御部30は、図3に示すように、復旧方法情報作成部33にて作成した復旧方法情報及び、復旧前後変化情報作成部34にて作成した復旧前後変化情報を復旧作業対象毎に復旧方法管理記憶部42に記憶することで(ステップS21)、図5の処理動作を終了する。
管理制御部30は、ステップS11にて作業開始コマンドを検出しなかった場合(ステップS11否定)、図5の処理動作を終了する。
管理制御部30は、ステップS14にて作業完了コマンドを検出しなかった場合(ステップS14否定)、作業完了コマンドを検出したか否かを監視すべく、ステップS14の判定処理を継続する。
図5に示す復旧方法管理処理では、作業開始前及び作業完了後のシステム情報との差分情報に基づく作業前後変化情報と作業方法を示す作業方法情報とを常時、作業対象毎に作業情報管理記憶部41に記憶するようにしたので、各作業がシステムに及ぼす影響を事前に把握することができる。
さらに、復旧方法管理処理では、作業情報管理記憶部41に記憶中の作業方法情報及び作業前後変化情報に基づき、作業対象の内、類似する復旧作業対象毎に、復旧作業前後のシステム変化に関わる復旧前後変化情報と復旧方法を示す復旧方法情報とを復旧方法管理記憶部42に記憶するようにしたので、未知の障害が発生したとしても、復旧方法管理記憶部42の記憶内容を利用して、障害に該当する復旧作業対象及び復旧前後変化情報に基づき、未知の障害に対する復旧方法(復旧方法情報)を選択することが可能になる。
次に、障害発生時に障害に対する復旧方法をオペレータ端末3に提示する障害復旧方法提示処理について説明する。図6は、障害復旧方法提示処理に関わる復旧方法管理システム1内部の処理動作を示すフローチャートである。
図6に示す障害復旧方法管理処理とは、障害発生時に障害に対する復旧方法をオペレータ端末3に提示するための処理である。
図6において過去復旧方法管理装置5側の過去復旧方法検索部21は、障害発生時に、オペレータ端末3から障害に対応する障害状況を検出すると(ステップS31)、障害状況に対応する過去復旧方法を過去復旧方法DB4から検索する(ステップS32)。
過去復旧方法検索部21は、過去復旧方法DB4内に障害状況に対応した過去復旧方法があるか否かを判定する(ステップS33)。
過去復旧方法検索部21は、過去復旧方法DB4内に障害状況に対応した過去復旧方法がある場合(ステップS33肯定)、過去復旧方法DB4から障害状況に対応した過去復旧方法を取得する(ステップS34)。
復旧方法提示部22は、取得した障害状況に対応する復旧方法をオペレータ端末3に提示することで(ステップS35)、図6の処理動作を終了する。
また、過去復旧方法管理装置5は、過去復旧方法DB4内に障害状況に対応した過去復旧方法がない場合(ステップS33否定)、オペレータ端末3からの障害状況を作業/復旧方法管理装置7に通知する(ステップS36)。
作業/復旧方法管理装置7側の管理制御部30内部の障害情報作成部35は、障害発生前のシステム情報を履歴管理DB8から取得する(ステップS37)。
障害情報作成部35は、障害発生後のシステム情報を履歴管理DB8又はITシステム2から取得する(ステップS38)。
障害情報作成部35は、障害発生前のシステム情報と障害発生後のシステム情報との差分情報を取得し(ステップS39)、取得した差分情報に基づき、障害対象及び障害前後変化情報を作成する(ステップS40)。
管理制御部30は、障害対象及び障害前後変化情報を作成すると、障害対象及び障害前後変化情報に基づき障害に対する復旧方法を決定する障害復旧方法決定処理(図7参照)を実行した後(ステップS41)、決定した復旧方法を過去復旧方法管理装置5に通知することで(ステップS42)、復旧方法をオペレータ端末3に提示すべく、ステップS35に移行する。
図6に示す障害復旧方法提示処理では、障害が発生し、オペレータ端末3からの障害状況に対応する過去復旧方法DB4内にある場合、過去復旧方法DB4内の障害状況に対応する過去復旧方法を取得し、取得した過去復旧方法を障害の復旧方法としてオペレータ端末3に提示するようにしたので、オペレータは、障害が発生したとしても、障害に対する復旧方法を認識することができるため、その負担を大幅に軽減することができる。
障害復旧方法提示処理では、障害が発生し、オペレータ端末3からの障害状況に対応する過去復旧方法DB4内にない場合、障害状況に応じて障害発生前及び障害発生後のシステム情報に基づき障害対象及び障害前後変化情報を作成し、後述する障害復旧方法決定処理(図7参照)を経て、障害対象及び障害前後変化情報に該当する復旧作業対象及び復旧前後変化情報が復旧方法管理記憶部42内にある場合、この復旧前後変化情報に対応した復旧方法情報を復旧方法管理記憶部42から取得し、取得した復旧方法情報をオペレータ端末3に提示するようにしたので、オペレータは、過去にない未知の障害が発生したとしても、障害に対する復旧方法を認識することができるため、その負担を大幅に軽減することができる。
次に、図6に示すステップS41の障害復旧方法決定処理について説明する。図7は、障害復旧方法決定処理に関わる作業/復旧方法管理装置7内部の処理動作を示すフローチャートである。
図7に示す障害復旧方法決定処理とは、障害状況に対する復旧方法が過去復旧方法DB4内になく、未知の障害に対する復旧方法を決定するための処理である。
作業/復旧方法管理装置7側の管理制御部30内部の復旧方法検索部36は、図6のステップS40にて作成した障害対象の内、一の障害対象を指定する(ステップS51)。尚、ステップS40にて障害対象が“アプリ1の平均レスポンス時間”及び“CPUのステータス”の場合、ステップS51にて障害対象を指定するものである。
復旧方法検索部36は、障害対象に該当する復旧作業対象が復旧方法管理記憶部42内にあるか否かを判定する(ステップS52)。尚、例えば障害対象が“アプリ1の平均レスポンス時間”の場合、図3に示すように“アプリ1の平均レスポンス時間”に該当する“アプリの平均レスポンス時間”の復旧作業対象が復旧方法管理記憶部42内にあるか否かを判定するものである。
復旧方法検索部36は、復旧方法管理記憶部42内に障害対象に該当する復旧作業対象がある場合(ステップS52肯定)、障害対象の障害前後変化情報に基づき、障害対象を障害発生前の状態に戻すべく、障害対象の障害前後変化情報に該当する復旧作業対象の復旧前後変化情報が復旧方法管理記憶部42内にあるか否かを判定する(ステップS53)。
尚、例えば、図4に示すように障害対象“アプリ1の平均レスポンス時間”の障害前後変化情報が“50msec→3000msec”の場合、障害発生後の状態“3000msec”を障害発生前の状態“50msec”に戻すべく、図3に示すように障害対象の障害前後変化情報“50msec→3000msec”に該当する復旧作業対象の復旧前後変化情報“減少”が復旧方法管理記憶部42内にあるか否か判定するものである。
復旧方法検索部36は、障害対象の障害前後変化情報に該当する復旧作業対象の復旧前後変化情報が復旧方法管理記憶部42内にある場合(ステップS53肯定)、復旧前後変化情報に対応する復旧方法情報を復旧方法管理記憶部42から取得する(ステップS54)。
尚、障害対象の障害前後変化情報“50msec→3000msec”に該当する復旧作業対象の復旧前後変化情報“減少”が復旧方法管理記憶部42内にある場合、復旧作業対象の復旧前後変化情報“減少”に対応する復旧方法情報“パラメータMaxThreadsの値を増やす”を取得するものである。
復旧方法検索部36は、復旧前後変化情報に対応する復旧方法情報を取得すると、取得した復旧方法情報を障害対象に対する復旧方法として決定し(ステップS55)、次の障害対象があるか否かを判定する(ステップS56)。
復旧方法検索部36は、次の障害対象がない場合(ステップS56否定)、障害対象に対応する復旧方法情報を過去復旧方法管理装置5に通知することで(ステップS57)、図7の処理動作を終了する。
また、復旧方法検索部36は、復旧方法管理記憶部42内に障害対象に該当する復旧作業対象がない場合(ステップS52否定)、又は復旧方法管理記憶部42内に障害対象の障害前後変化情報に該当する復旧作業対象の復旧前後変化情報がない場合(ステップS53否定)、次の障害対象があるか否かを判定すべく、ステップS56に移行する。
復旧方法検索部36は、次の障害対象がある場合(ステップS56肯定)、障害対象を指定すべく、ステップS51に移行する。
尚、障害発生時に複数の障害対象を作成した場合、障害対象毎に復旧方法情報を順次取得し、その後、過去復旧方法管理装置5経由で、障害対象毎の復旧方法情報をオペレータ端末3に提示することになる。
また、障害対象毎に復旧方法情報を順次取得するようにしたが、障害対象に対する復旧方法情報は一個に限らず、例えば作業対象“CPUのステータス”の復旧方法情報の場合は、“CPU交換”や“サーバ再起動”等の複数の場合もある。
図7に示す障害復旧方法決定処理では、障害対象及び障害前後変化情報に該当する復旧作業対象及び復旧前後変化情報が復旧方法管理記憶部42内にある場合、障害発生後の状態から障害発生前の状態に戻すべく、復旧作業対象及び復旧前後変化情報に対応する復旧方法情報を復旧方法管理記憶部42から取得し、取得した復旧方法情報を障害に対する復旧方法として決定するようにしたので、過去にない未知の障害が発生したとしても、オペレータへの負担を要することなく、障害に対する復旧方法を決定することができる。
本実施例では、作業開始前及び作業完了後のシステム情報との差分情報に基づく作業前後変化情報と作業方法を示す作業方法情報とを常時、作業対象毎に作業情報管理記憶部41に記憶するようにしたので、各作業がシステムに及ぼす影響を事前に把握することができる。
また、本実施例では、作業情報管理記憶部41に記憶中の作業方法情報及び作業前後変化情報に基づき、作業対象の内、類似する復旧作業対象毎に、復旧作業前後のシステム変化に関わる復旧前後変化情報と復旧方法を示す復旧方法情報とを復旧方法管理記憶部42に記憶するようにしたので、未知の障害が発生したとしても、復旧方法管理記憶部42の記憶内容を利用して、障害に該当する復旧作業対象及び復旧前後変化情報に基づき、未知の障害に対する復旧方法(復旧方法情報)を選択することが可能になる。
また、本実施例では、障害が発生し、オペレータ端末3からの障害状況に対応する過去復旧方法DB4内にある場合、過去復旧方法DB4内の障害状況に対応する過去復旧方法を取得し、取得した過去復旧方法を障害の復旧方法としてオペレータ端末3に提示するようにしたので、オペレータは、障害が発生したとしても、障害に対する復旧方法を認識することができるため、その負担を大幅に軽減することができる。
また、本実施例では、障害が発生し、オペレータ端末3からの障害状況に対応する過去復旧方法DB4内にない場合、障害状況に応じて障害発生前及び障害発生後のシステム情報に基づき障害対象及び障害前後変化情報を作成し、障害復旧方法決定処理(図7参照)を経て、障害対象及び障害前後変化情報に該当する復旧作業対象及び復旧前後変化情報が復旧方法管理記憶部42内にある場合、この復旧前後変化情報に対応した復旧方法情報を復旧方法管理記憶部42から取得し、取得した復旧方法情報をオペレータ端末3に提示するようにしたので、オペレータは、過去にない未知の障害が発生したとしても、障害に対する復旧方法を認識することができるため、その負担を大幅に軽減することができる。
また、本実施例では、障害対象及び障害前後変化情報に該当する復旧作業対象及び復旧前後変化情報が復旧方法管理記憶部42内にある場合、障害発生後の状態から障害発生前の状態に戻すべく、復旧作業対象及び復旧前後変化情報に対応する復旧方法情報を復旧方法管理記憶部42から取得し、取得した復旧方法情報を障害に対する復旧方法として決定するようにしたので、過去にない未知の障害が発生したとしても、オペレータへの負担を要することなく、障害に対する復旧方法を決定することができる。
以上、本発明の実施例について説明したが、本実施例によって本発明の技術的思想の範囲が限定されるものではなく、特許請求の範囲に記載した技術的思想の範囲を逸脱しない限り、各種様々な実施例が実施可能であることは言うまでもない。また、本実施例に記載した効果は、これに限定されるものではない。
また、本実施例で説明した各種処理の内、自動的に行われるものとして説明した処理の全部又は一部を手動で行うことも可能であることは勿論のこと、その逆に、手動で行われるものとして説明した処理の全部又は一部を自動で行うことも可能であることは言うまでもない。また、本実施例で説明した処理手順、制御手順、具体的名称、各種データやパラメータを含む情報についても、特記した場合を除き、適宜変更可能であることは言うまでもない。
また、図示した各装置の各構成要素は機能概念的に記載したものであって、必ずしも物理的に図示のように構成されるものではなく、その各装置の具体的な態様は図示のものに限縮されるものでは到底ないことは言うまでもない。
さらに、各装置で行われる各種処理機能は、CPU(Central Processing Unit)(又はMPU(Micro Processing Unit)、MCU(Micro Controller Unit)等のマイクロ・コンピュータ)上、又は同CPU(又はMPU、MCU等のマイクロ・コンピュータ)で解析実行するプログラム上、又はワイヤードロジックによるハードウェア上で、その全部又は任意の一部を実行するようにしても良いことは言うまでもない。
1 復旧方法管理システム
2 ITシステム
3 オペレータ端末
6 復旧方法DB
7 作業/復旧方法管理装置
8 履歴管理DB
30 管理制御部
31 作業方法情報作成部
32 作業前後変化情報作成部
33 復旧方法情報作成部
34 復旧前後変化情報作成部
35 障害情報作成部
36 復旧方法検索部

Claims (8)

  1. 作業開始コマンドを検出すると、システム内部の作業対象に対する作業を実行すると共に、作業完了コマンドを検出すると、前記作業対象に対する実行中の作業を完了する作業実行手順と、
    前記作業実行手順にて実行した作業対象毎に作業方法を示す作業方法情報を作成する作業方法情報作成手順と、
    前記作業開始コマンドを検出すると、前記システム内部の作業開始前のシステム情報を取得すると共に、前記作業完了コマンドを検出すると、作業完了後のシステム情報を取得し、これら取得した作業開始前のシステム情報と作業完了後のシステム情報との差分情報に基づき、前記作業対象毎に作業前後のシステム変化に関わる作業前後変化情報を作成する作業前後変化情報作成手順と、
    前記作業方法情報作成手順にて作成した前記作業方法情報と、前記作業前後変化情報作成手順にて作成した前記作業前後変化情報とを前記作業対象毎に作業情報管理記憶部に記憶管理する作業情報管理記憶手順と、
    前記作業情報管理記憶部に記憶中の前記作業方法情報に基づき、前記作業対象の内、類似する復旧作業対象毎に復旧方法を示す復旧方法情報を作成する復旧方法情報作成手順と、
    前記作業情報管理記憶部に記憶中の前記作業前後変化情報に基づき、前記復旧作業対象毎に復旧作業前後のシステム変化に関わる復旧前後変化情報を作成する復旧前後変化情報作成手順と、
    前記復旧方法情報作成手順にて作成した前記復旧方法情報及び前記復旧前後変化情報作成手順にて作成した前記復旧前後変化情報を前記復旧作業対象毎に復旧方法管理記憶部に記憶管理する復旧方法管理記憶手順と、
    をコンピュータ装置に実行させることを特徴とする復旧方法管理プログラム。
  2. 前記システム内部のシステム情報を所定タイミング毎に履歴管理記憶部に順次記憶する履歴管理記憶手順と、
    障害発生コマンドを検出すると、障害発生前及び障害発生後のシステム情報を前記履歴管理記憶部から取得し、これら取得した障害発生前のシステム情報と障害発生後のシステム情報との差分情報に基づき、障害対象及び、障害発生前後のシステム変化に関わる障害前後変化情報を作成する障害情報作成手順と、
    前記障害情報作成手順にて作成した前記障害対象及び前記障害前後変化情報に該当する前記復旧作業対象及び前記復旧前後変化情報が前記復旧方法管理記憶部内にある場合、この復旧前後変化情報に対応する前記復旧方法情報を前記復旧方法管理記憶部から取得し、取得した前記復旧方法情報を提示する復旧方法提示手順と、
    を前記コンピュータ装置に実行させることを特徴とする請求項1記載の復旧方法管理プログラム。
  3. 前記システム内部のシステム情報を所定タイミング毎に履歴管理記憶部に順次記憶する履歴管理記憶手順と、
    障害発生コマンドを検出すると、前記障害発生前のシステム情報を前記履歴管理記憶部から取得すると共に、前記障害発生後のシステム情報を前記システムから取得し、これら取得した障害発生前のシステム情報と障害発生後のシステム情報との差分情報に基づき、障害対象及び、障害発生前後のシステム変化に関わる障害前後変化情報を作成する障害情報作成手順と、
    前記障害情報作成手順にて作成した前記障害対象及び前記障害前後変化情報に該当する前記復旧作業対象及び前記復旧前後変化情報が前記復旧方法管理記憶部内にある場合、この復旧前後変化情報に対応する前記復旧方法情報を前記復旧方法管理記憶部から取得し、取得した前記復旧方法情報を提示する復旧方法提示手順と、
    を前記コンピュータ装置に実行させることを特徴とする請求項1記載の復旧方法管理プログラム。
  4. 作業開始コマンドを検出すると、システム内部の作業対象に対する作業を実行すると共に、作業完了コマンドを検出すると、前記作業対象に対する実行中の作業を完了する作業実行部と、
    前記作業実行部にて実行した作業対象毎に作業方法を示す作業方法情報を作成する作業方法情報作成部と、
    前記作業開始コマンドを検出すると、前記システム内部の作業開始前のシステム情報を取得すると共に、前記作業完了コマンドを検出すると、作業完了後のシステム情報を取得し、これら取得した作業開始前のシステム情報と作業完了後のシステム情報との差分情報に基づき、前記作業対象毎に作業前後のシステム変化に関わる作業前後変化情報を作成する作業前後変化情報作成部と、
    前記作業方法情報作成部にて作成した前記作業方法情報と、前記作業前後変化情報作成部にて作成した前記作業前後変化情報とを前記作業対象毎に記憶管理する作業情報管理記憶部と、
    前記作業情報管理記憶部に記憶中の前記作業方法情報に基づき、前記作業対象の内、類似する復旧作業対象毎に復旧方法を示す復旧方法情報を作成する復旧方法情報作成部と、
    前記作業情報管理記憶部に記憶中の前記作業前後変化情報に基づき、前記復旧作業対象毎に復旧作業前後のシステム変化に関わる復旧前後変化情報を作成する復旧前後変化情報作成部と、
    前記復旧方法情報作成部にて作成した前記復旧方法情報及び前記復旧前後変化情報作成部にて作成した前記復旧前後変化情報を前記復旧作業対象毎に記憶管理する復旧方法管理記憶部と、
    を有することを特徴とする復旧方法管理装置。
  5. 前記システム内部のシステム情報を所定タイミング毎に順次記憶する履歴管理記憶部と、
    障害発生コマンドを検出すると、障害発生前及び障害発生後のシステム情報を前記履歴管理記憶部から取得し、これら取得した障害発生前のシステム情報と障害発生後のシステム情報との差分情報に基づき、障害対象及び、障害発生前後のシステム変化に関わる障害前後変化情報を作成する障害情報作成部と、
    前記障害情報作成部にて作成した前記障害対象及び前記障害前後変化情報に該当する前記復旧作業対象及び前記復旧前後変化情報が前記復旧方法管理記憶部内にある場合、この復旧前後変化情報に対応する前記復旧方法情報を前記復旧方法管理記憶部から取得し、取得した前記復旧方法情報を提示する復旧方法提示部と、
    を有することを特徴とする請求項4記載の復旧方法管理装置。
  6. 前記システム内部のシステム情報を所定タイミング毎に順次記憶する履歴管理記憶部と、
    障害発生コマンドを検出すると、前記障害発生前のシステム情報を前記履歴管理記憶部から取得すると共に、前記障害発生後のシステム情報を前記システムから取得し、これら取得した障害発生前のシステム情報と障害発生後のシステム情報との差分情報に基づき、障害対象及び、障害発生前後のシステム変化に関わる障害前後変化情報を作成する障害情報作成部と、
    前記障害情報作成部にて作成した前記障害対象及び前記障害前後変化情報に該当する前記復旧作業対象及び前記復旧前後変化情報が前記復旧方法管理記憶部内にある場合、この復旧前後変化情報に対応する前記復旧方法情報を前記復旧方法管理記憶部から取得し、取得した前記復旧方法情報を提示する復旧方法提示部と、
    を有することを特徴とする請求項4記載の復旧方法管理装置。
  7. 作業開始コマンドを検出すると、システム内部の作業対象に対する作業を実行すると共に、作業完了コマンドを検出すると、前記作業対象に対する実行中の作業を完了する作業実行ステップと、
    前記作業実行ステップにて実行した作業対象毎に作業方法を示す作業方法情報を作成する作業方法情報作成ステップと、
    前記作業開始コマンドを検出すると、前記システム内部の作業開始前のシステム情報を取得すると共に、前記作業完了コマンドを検出すると、作業完了後のシステム情報を取得し、これら取得した作業開始前のシステム情報と作業完了後のシステム情報との差分情報に基づき、前記作業対象毎に作業前後のシステム変化に関わる作業前後変化情報を作成する作業前後変化情報作成ステップと、
    前記作業方法情報作成ステップにて作成した前記作業方法情報と、前記作業前後変化情報作成ステップにて作成した前記作業前後変化情報とを前記作業対象毎に作業情報管理記憶部に記憶管理する作業情報管理記憶ステップと、
    前記作業情報管理記憶部に記憶中の前記作業方法情報に基づき、前記作業対象の内、類似する復旧作業対象毎に復旧方法を示す復旧方法情報を作成する復旧方法情報作成ステップと、
    前記作業情報管理記憶部に記憶中の前記作業前後変化情報に基づき、前記復旧作業対象毎に復旧作業前後のシステム変化に関わる復旧前後変化情報を作成する復旧前後変化情報作成ステップと、
    前記復旧方法情報作成ステップにて作成した前記復旧方法情報及び前記復旧前後変化情報作成ステップにて作成した前記復旧前後変化情報を前記復旧作業対象毎に復旧方法管理記憶部に記憶管理する復旧方法管理記憶ステップと、
    を含むことを特徴とする復旧方法管理方法。
  8. 前記システム内部のシステム情報を所定タイミング毎に履歴管理記憶部に順次記憶する履歴管理記憶ステップと、
    障害発生コマンドを検出すると、障害発生前及び障害発生後のシステム情報を前記履歴管理記憶部から取得し、これら取得した障害発生前のシステム情報と障害発生後のシステム情報との差分情報に基づき、障害対象及び、障害発生前後のシステム変化に関わる障害前後変化情報を作成する障害情報作成ステップと、
    前記障害情報作成ステップにて作成した前記障害対象及び前記障害前後変化情報に該当する前記復旧作業対象及び前記復旧前後変化情報が前記復旧方法管理記憶部内にある場合、この復旧前後変化情報に対応する前記復旧方法情報を前記復旧方法管理記憶部から取得し、取得した前記復旧方法情報を提示する復旧方法提示ステップと、
    を含むことを特徴とする請求項7記載の復旧方法管理方法。
JP2010514317A 2008-05-30 2008-05-30 復旧方法管理プログラム、復旧方法管理装置及び復旧方法管理方法 Expired - Fee Related JP5024450B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2008/060070 WO2009144825A1 (ja) 2008-05-30 2008-05-30 復旧方法管理プログラム、復旧方法管理装置及び復旧方法管理方法

Publications (2)

Publication Number Publication Date
JPWO2009144825A1 JPWO2009144825A1 (ja) 2011-09-29
JP5024450B2 true JP5024450B2 (ja) 2012-09-12

Family

ID=41376724

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010514317A Expired - Fee Related JP5024450B2 (ja) 2008-05-30 2008-05-30 復旧方法管理プログラム、復旧方法管理装置及び復旧方法管理方法

Country Status (4)

Country Link
US (1) US8099626B2 (ja)
JP (1) JP5024450B2 (ja)
GB (1) GB2472550B (ja)
WO (1) WO2009144825A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014096075A (ja) * 2012-11-12 2014-05-22 Hitachi Ltd システム作業履歴管理方法
WO2014171047A1 (ja) * 2013-04-17 2014-10-23 日本電気株式会社 障害復旧手順生成装置、障害復旧手順生成方法および障害復旧手順生成プログラム
JP6405851B2 (ja) 2014-09-30 2018-10-17 富士通株式会社 予兆検知支援プログラム、方法、装置、及び予兆検知プログラム、
CN112114993B (zh) * 2020-09-28 2024-07-23 中国建设银行股份有限公司 一种应用系统的配置信息处理方法及装置
JP7513921B2 (ja) 2021-02-05 2024-07-10 日本電信電話株式会社 情報処理装置、情報処理方法、及び、情報処理プログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08314751A (ja) * 1995-05-18 1996-11-29 Hitachi Ltd 障害対策支援方法
JPH1069400A (ja) * 1996-08-29 1998-03-10 Hitachi Ltd 計算機システムおよびその障害回復支援方法
JP2005018103A (ja) * 2003-06-23 2005-01-20 Nec Corp 性能向上サービス提供システムおよび性能向上サービス提供方法
JP2005122383A (ja) * 2003-10-15 2005-05-12 Omron Corp 復旧手順分析支援システム及び復旧手順分析支援方法
JP2005346331A (ja) * 2004-06-02 2005-12-15 Nec Corp 障害復旧装置および障害復旧方法、マネージャ装置並びにプログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06103047A (ja) 1991-12-12 1994-04-15 Fujitsu Ltd プログラム作成支援装置及びプログラム実行支援装置
US5832529A (en) * 1996-10-11 1998-11-03 Sun Microsystems, Inc. Methods, apparatus, and product for distributed garbage collection
US6151683A (en) * 1997-03-31 2000-11-21 Sun Microsystems, Inc. Rebuilding computer states remotely
US6385707B1 (en) * 1998-02-24 2002-05-07 Adaptec, Inc. Method and apparatus for backing up a disk drive upon a system failure
JP4728565B2 (ja) * 2003-07-16 2011-07-20 日本電気株式会社 障害復旧装置および障害復旧方法ならびにプログラム
US8191068B2 (en) * 2004-10-27 2012-05-29 Nec Corporation Resource management system, resource information providing method and program
US20070168720A1 (en) * 2005-11-30 2007-07-19 Oracle International Corporation Method and apparatus for providing fault tolerance in a collaboration environment
US7801699B1 (en) * 2006-04-10 2010-09-21 Cadence Design Systems, Inc. Regression test modules for detecting and reporting changes in process design kits
JP5127186B2 (ja) * 2006-08-31 2013-01-23 株式会社リコー ワークフロー管理システム、ワークフロー管理方法、ワークフロー管理プログラムおよび記録媒体
JP2008090504A (ja) 2006-09-29 2008-04-17 Oki Electric Ind Co Ltd コンピュータ保守支援システム及び解析サーバ
US9223629B2 (en) * 2007-01-31 2015-12-29 Hewlett-Packard Development Company, L.P. Data processing system and method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08314751A (ja) * 1995-05-18 1996-11-29 Hitachi Ltd 障害対策支援方法
JPH1069400A (ja) * 1996-08-29 1998-03-10 Hitachi Ltd 計算機システムおよびその障害回復支援方法
JP2005018103A (ja) * 2003-06-23 2005-01-20 Nec Corp 性能向上サービス提供システムおよび性能向上サービス提供方法
JP2005122383A (ja) * 2003-10-15 2005-05-12 Omron Corp 復旧手順分析支援システム及び復旧手順分析支援方法
JP2005346331A (ja) * 2004-06-02 2005-12-15 Nec Corp 障害復旧装置および障害復旧方法、マネージャ装置並びにプログラム

Also Published As

Publication number Publication date
GB2472550A (en) 2011-02-09
JPWO2009144825A1 (ja) 2011-09-29
GB2472550B (en) 2013-02-27
US20110072305A1 (en) 2011-03-24
WO2009144825A1 (ja) 2009-12-03
GB201020140D0 (en) 2011-01-12
US8099626B2 (en) 2012-01-17

Similar Documents

Publication Publication Date Title
JP4924514B2 (ja) 仮想マシン管理プログラム、管理サーバ装置及び仮想マシン管理方法
US9870295B2 (en) Automation of workflow creation and failure recovery
JP5365051B2 (ja) 管理プログラム、管理装置及び管理方法
JP5024450B2 (ja) 復旧方法管理プログラム、復旧方法管理装置及び復旧方法管理方法
WO2016039219A1 (ja) 異常検知手順開発装置および異常検知手順開発方法
JP6493506B1 (ja) 産業用制御システムとその支援装置、制御支援方法およびプログラム
CN104123219A (zh) 测试软件的方法和设备
US20170307480A1 (en) Data Display System
JP2019152485A (ja) 測定プログラムの管理方法及び管理装置、並びに測定システム
JP7240491B2 (ja) 洗浄装置の洗浄制御方法およびシステム
JP2009009300A (ja) バッチプロセス解析システムおよびバッチプロセス解析方法
JP2018088177A (ja) 情報処理装置、情報処理システム、情報処理方法、および情報処理プログラム
JP6909117B2 (ja) 稼働モニタリング装置、および、稼働モニタリング装置の制御プログラム
JP2008003985A (ja) 開発支援システム、開発支援方法および開発支援プログラム
JP6514276B2 (ja) 情報処理装置および情報処理システム
JP2009223743A (ja) 障害解析支援システム及び障害解析支援方法
CN108052381B (zh) 一种推荐显示控制方法及系统
JP6864227B2 (ja) 比較プログラム、比較装置及び比較方法
JP6574146B2 (ja) サービス監視装置及びサービス監視方法
JP5156775B2 (ja) プラント監視・制御装置およびその保守支援方法
CN109445877B (zh) 一种检测游戏服务器多线程使用同一虚拟机的方法
JP5591072B2 (ja) ソフトウェア自動試験装置及びソフトウェア自動試験方法
EP3709172A1 (en) Control-program-development supporting apparatus, control-program-development supporting system, control-program-development supporting method, and control-program-development supporting program
JP2008152542A (ja) バッチジョブ再実行制御システム
JP7453196B2 (ja) 作業システム及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100624

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100624

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120522

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120604

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150629

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees